CN109817201B - 一种语言学习方法、装置、电子设备及可读存储介质 - Google Patents
一种语言学习方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN109817201B CN109817201B CN201910251722.7A CN201910251722A CN109817201B CN 109817201 B CN109817201 B CN 109817201B CN 201910251722 A CN201910251722 A CN 201910251722A CN 109817201 B CN109817201 B CN 109817201B
- Authority
- CN
- China
- Prior art keywords
- voice
- target
- data
- voice data
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明实施例提供了一种语言学习方法、装置、电子设备及可读存储介质。该方法应用于电子设备,包括:获得语言学习者发出的语音数据作为目标语音数据;将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征作为目标语音特征;根据目标语音特征与目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。这样,使得语言学习者可以通过电子设备来得到语音评价结果,降低了语言学习者的语言学习成本。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种语言学习方法、装置、电子设备及可读存储介质。
背景技术
随着语言学习变得越来越重要,越来越多的语言学习者在学校或者语言培训班进行语言学习。例如,进行英语学习。其中,在该种语言学习方式中,语言学习者需要老师指出发音错误,即需要老师进行语音纠错,进而才能纠正发音错误。
发明人在实现本发明的过程中发现,该种学习方式需要在学校或者语言培训班进行,具有场地限制,语言学习成本较高。
发明内容
本发明实施例的目的在于提供一种语言学习方法、装置、电子设备及可读存储介质,以降低语言学习者的语言学习成本。具体技术方案如下:
第一方面,本发明实施例提供了一种语言学习方法,应用于电子设备,该方法可以包括:
获得语言学习者发出的语音数据作为目标语音数据;
将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征作为目标语音特征;
根据目标语音特征与目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评分结果。
可选地,在将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征作为目标语音特征的步骤之前,还可以包括:
获得预设数量的训练样本;其中,一个训练样本中包括:预设用户的一条预设语音数据和预设语音数据的语音特征;预设语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
通过预设的机器学习算法对训练样本进行训练,得到语音特征识别模型。
可选地,通过预设的机器学习算法对训练样本进行训练,得到语音特征识别模型的步骤,可以包括:
将每个训练样本中的预设语音数据转换为文本数据,作为目标文本数据;
基于预设语音数据的语音特征,确定预设语音数据的每个音节与目标文本数据中的字母或汉字的映射关系;
根据神经网络算法和映射关系,训练得到语音特征识别模型。
可选地,当预设用户为儿童用户时,根据目标语音特征与目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果的步骤,可以包括:
计算目标语音特征和目标语音数据对应的标准语音数据的语音特征的匹配度;其中,目标语音特征和标准语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
根据匹配度、语言学习者所处的学习模式、预设的评分表和儿童评分加权值,给语言学习者评分;其中,评分表中记录有:匹配度、学习模式和分数的对应关系。
可选地,在计算目标语音特征和目标语音数据对应的标准语音数据的语音特征的匹配度的步骤之后,还可以包括:
当匹配度小于预设阈值时,确定标准语音数据的文本数据中不同于目标语音数据的文本数据的差异文本数据;
生成针对差异文本数据的错误提示信息,作为语音纠错结果。
第二方面,本发明实施例还提供了一种语言学习装置,应用于电子设备,该装置可以包括:
第一获得模块,用于获得语言学习者发出的语音数据作为目标语音数据;
第二获得模块,用于将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征作为目标语音特征;
生成模块,用于根据目标语音特征与目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。
可选地,在本发明实施例中,还可以包括:
第三获得模块,用于在将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征作为目标语音特征之前,获得预设数量的训练样本;其中,一个训练样本中包括:预设用户的一条预设语音数据和预设语音数据的语音特征;预设语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
训练模块,用于通过预设的机器学习算法对训练样本进行训练,得到语音特征识别模型。
可选地,在本发明实施例中,训练模块可以包括:
转换单元,用于将每个训练样本中的预设语音数据转换为文本数据,作为目标文本数据;
第一确定单元,用于基于预设语音数据的语音特征,确定预设语音数据的每个音节与目标文本数据中的字母或汉字的映射关系;
训练单元,用于根据神经网络算法和映射关系,训练得到语音特征识别模型。
可选地,在本发明实施例中,生成模块可以包括:
计算单元,用于当所述预设用户为儿童用户时,计算目标语音特征和目标语音数据对应的标准语音数据的语音特征的匹配度;其中,目标语音特征和标准语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
评分单元,用于在计算目标语音特征和目标语音数据对应的标准语音数据的语音特征的匹配度之后,根据匹配度、语言学习者所处的学习模式、预设的评分表和儿童评分加权值,给语言学习者评分;其中,评分表中记录有:匹配度、学习模式和分数的对应关系。
可选地,在本发明实施例中,还可以包括:
第二确定单元,用于当匹配度小于预设阈值时,确定标准语音数据的文本数据中不同于目标语音数据的文本数据的差异文本数据;
生成单元,用于生成针对差异文本数据的错误提示信息,作为语音纠错结果。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一项语言学习方法的方法步骤。
第四方面,本发明实施例还提供了一种可读存储介质,可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一项语言学习方法的方法步骤。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行上述任一项语言学习方法的方法步骤。
在本发明实施例中,电子设备可以获得语言学习者发出的语音数据作为目标语音数据。然后,可以将目标语音数据输入至预先构建的语音特征识别模型,从而得到目标语音数据的语音特征作为目标语音特征。之后,可以根据目标语音特征与该目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。这样,使得语言学习者可以通过电子设备来得到语音评价结果,降低了语言学习者的语言学习成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语言学习方法的流程图;
图2为本发明实施例提供的一种语言学习装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中所存在的技术问题,本发明实施例提供了一种语言学习方法、装置、电子设备及可读存储介质。
下面首先对本发明实施例提供的语言学习方法进行说明。
本发明实施例提供的语言学习方法应用于电子设备,该电子设备包括但并不局限于智能手机、智能手表、语言学习机和平板电脑。参见图1,本发明实施例提供的语言学习方法可以包括如下步骤:
S101:获得语言学习者发出的语音数据作为目标语音数据;
举例而言,电子设备可以获得语言学习者发出的“I like cat(我喜欢猫)”所对应的语音数据作为目标语音数据。当然,电子设备也可以获得语言学习者发出“cat(猫)”所对应的语音数据作为目标语音数据,当然并不局限于此。
可以理解的是,在获得语言学习者发出的语音数据之前,电子设备还可以根据语言学习者的选择来确定语言学习模式。其中,该语言学习模式包括但并不局限于:跟读模式和翻译模式。
其中,对于跟读模式而言,电子设备会发出标准语音数据,语言学习者在听到该标准语音数据之后,可以对着电子设备发出跟读该标准语音数据的目标语音数据。
对于翻译模式而言,电子设备会发出该语言学习者的母语语音数据,例如中文语音数据。语言学习者在听到该母语语音数据之后,可以对着电子设备发出该母语语音数据对应的翻译语音数据作为目标语音数据。举例而言,该翻译语音数据可以为英语语音数据。
其中,标准语音数据和目标语音数据均为相对于语言学习者的外语语音数据,例如英语语音数据。
另外,在确定跟读模式或翻译模式等语言学习模式之后,电子设备还可以根据语言学习者的自定义信息,例如小学生和初级学者等自定义信息,来确定语言学习场景。其中,所确定的语言学习场景的难易程度受自定义信息影响。
S102:将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征作为目标语音特征;
可以理解的是,在将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征之前,电子设备可以构建该语音特征识别模型。其中,该语音特征识别模型可以识别出语音数据的语音特征。
其中,电子设备可以通过如下方式构建语音特征识别模型:首先,可以获得预设数量的训练样本。其中,一个训练样本中可以包括:预设用户的一条预设语音数据和预设语音数据的语音特征。并且,预设语音数据的语音特征可以包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项。在获得训练样本之后,可以通过预设的机器学习算法对训练样本进行训练,从而得到语音特征识别模型。
其中,通过预设的机器学习算法对训练样本进行训练,得到语音特征识别模型的操作具体可以为:将每个训练样本中的预设语音数据转换为文本数据,作为目标文本数据。例如,将“book(书)”对应的预设语音数据转换为文本数据:book。然后,基于预设语音数据的语音特征,确定预设语音数据的每个音节与目标文本数据中的字母或汉字的映射关系。例如,确定预设语音数据的音节b对应字母b,预设语音数据的音节对应oo,以及预设语音数据k对应字母k。之后,可以根据神经网络算法和映射关系,训练得到语音特征识别模型。
其中,神经网络算法可以为:循环神经网络算法(Recurrent neural networks,RNN)、深度神经网络算法(Deep Neural Networks,DNN)和卷积神经网络算法(Convolutional Neural Network,CNN)中的任意一项。当然并不局限于此。
另外,由于用于训练该语音特征识别模型的训练样本越多,则训练得到的语音特征识别模型的识别结果就越准确,因而可以采用尽量多的训练样本来训练该语音特征识别模型。
此外,为了提高语音特征识别模型输出的识别结果的准确性,在训练得到语音特征识别模型之后,还可以利用多个优化样本对该语音特征识别模型进行调优。其中,一个优化样本中包括:用于优化模型的语音数据和该语音数据的语音特征。这样,可以对语音特征识别模型中的参数进行优化,从而使得该模型输出的语音特征更准确。
其中,该语音特征识别模型可以存储在服务器中。那么,当电子设备获得目标语音数据后,可以通过语音特征识别模型接口,将该目标语音数据输入至服务器中的语音特征识别模型,并从语音特征识别模型接口获得该目标语音数据的语音特征。当然,该语音特征识别模型也可以存储在该电子设备本地,并通过该语音特征识别模型识别得到目标语音数据的音频特征,这也是合理的。
S103:根据目标语音特征与目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。
其中,可以在电子设备中比对目标语音特征与标准语音数据的语音特征,从而得到比对结果。当然,也可以在预设的服务器中比对目标语音特征与标准语音数据的语音特征,得到比对结果。然后,再将比对结果发给电子设备,这也是合理的。
另外,电子设备根据目标语音特征与目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果的操作具体可以为:
电子设备可以计算目标语音特征和标准语音数据的语音特征的匹配度。其中,目标语音特征和标准语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项。例如,计算目标语音数据的停顿信息与标准语音数据的停顿信息的第一匹配度,计算目标语音数据的重音信息与标准语音数据的重音信息的第二匹配度等等;然后,根据第一匹配度和第二匹配度等来计算目标语音特征和标准语音数据的语音特征的匹配度。
在计算目标语音特征和目标语音数据对应的标准语音数据的语音特征的匹配度之后,电子设备还可以根据匹配度、语言学习者所处的学习模式和预设的评分表,给语言学习者评分。例如,评分为90分。其中,评分表中记录有:匹配度、学习模式和分数的对应关系。
其中,当上述训练样本中的预设用户为儿童用户时,为了能够激发儿童学习语言的积极性,电子设备可以根据匹配度、语言学习者所处的学习模式、预设的评分表和儿童评分加权值,给语言学习者评分。其中,该儿童评分加权值≥1。其中,由于儿童在将来多次学习中可以逐步纠正发音中的错误,因而可以降低对儿童的评分标准,使儿童获得学习激励,从而获得较好的语言学习效果。
可以理解的是,电子设备还可以结合语音学习者的发音流畅度、感情丰富程度来给语言学习者进行评分,当然并不局限于此。
另外,在计算目标语音特征和目标语音数据对应的标准语音数据的语音特征的匹配度之后,电子设备可以将计算得到匹配度与预设阈值进行比较。当匹配度小于预设阈值时,则表明错误率较高,此时可以确定标准语音数据的文本数据中不同于目标语音数据的文本数据的差异文本数据。
例如,确定标准语音数据的文本数据“I like kite(我喜欢风筝)”中不同于目标语音数据的文本数据“I like cat”的差异文本数据“kite(风筝)”。然后,生成针对差异文本数据的错误提示信息,作为语音纠错结果。例如,生成错误提示信息:kite发音错误,作为语音纠错结果。然后,可以在电子设备上显示该错误提示信息。当然,也可以生成错误提示信息:kite发音错误且正确发音为[kaIt],作为语音纠错结果。然后,可以在电子设备上显示该错误提示信息并给出正确发音对应的语音数据。这样,可以使语言学习者了解发音错误并进行纠正。
当匹配度高于预设阈值时,则表明错误率较低,此时可以生成语音纠错结果:不存在发音错误,这是合理的。
在本发明实施例中,电子设备可以获得语言学习者发出的语音数据作为目标语音数据。然后,可以将目标语音数据输入至预先构建的语音特征识别模型,从而得到目标语音数据的语音特征作为目标语音特征。之后,可以根据目标语音特征与该目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。这样,使得语言学习者可以通过电子设备来得到语音评价结果,降低了语言学习者的语言学习成本。
综上,应用本发明实施例提供的语言学习方法,使得语言学习者可以通过电子设备来得到语音评价结果,不需要依赖老师进行纠错,也不存在场地限制,降低了语言学习者的语言学习成本。
相应于上述方法实施例,本发明实施例还提供了一种语言学习装置,应用于电子设备,参见图2,该装置可以包括:
第一获得模块201,用于获得语言学习者发出的语音数据作为目标语音数据;
第二获得模块202,用于将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征作为目标语音特征;
生成模块203,用于根据目标语音特征与目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。
应用本发明实施例提供的装置,电子设备可以获得语言学习者发出的语音数据作为目标语音数据。然后,可以将目标语音数据输入至预先构建的语音特征识别模型,从而得到目标语音数据的语音特征作为目标语音特征。之后,可以根据目标语音特征与该目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。这样,使得语言学习者可以通过电子设备来得到语音评价结果,降低了语言学习者的语言学习成本。
可选地,在本发明实施例中,还可以包括:
第三获得模块,用于在将目标语音数据输入至预先构建的语音特征识别模型,得到目标语音数据的语音特征作为目标语音特征之前,获得预设数量的训练样本;其中,一个训练样本中包括:预设用户的一条预设语音数据和预设语音数据的语音特征;预设语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
训练模块,用于通过预设的机器学习算法对训练样本进行训练,得到语音特征识别模型。
可选地,在本发明实施例中,训练模块可以包括:
转换单元,用于将每个训练样本中的预设语音数据转换为文本数据,作为目标文本数据;
第一确定单元,用于基于预设语音数据的语音特征,确定预设语音数据的每个音节与目标文本数据中的字母或汉字的映射关系;
训练单元,用于根据神经网络算法和映射关系,训练得到语音特征识别模型。
可选地,在本发明实施例中,生成模块203可以包括:
计算单元,用于当所述预设用户为儿童用户时,计算目标语音特征和目标语音数据对应的标准语音数据的语音特征的匹配度;其中,目标语音特征和标准语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
评分单元,用于根据匹配度、语言学习者所处的学习模式、预设的评分表和儿童评分加权值,给语言学习者评分;其中,评分表中记录有:匹配度、学习模式和分数的对应关系。
可选地,在本发明实施例中,还可以包括:
第二确定单元,用于当匹配度小于预设阈值时,确定标准语音数据的文本数据中不同于目标语音数据的文本数据的差异文本数据;
生成单元,用于生成针对差异文本数据的错误提示信息,作为语音纠错结果。
相应于上述方法实施例,本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现上述任一项语言学习方法的方法步骤。
在本发明实施例中,电子设备可以获得语言学习者发出的语音数据作为目标语音数据。然后,可以将目标语音数据输入至预先构建的语音特征识别模型,从而得到目标语音数据的语音特征作为目标语音特征。之后,可以根据目标语音特征与该目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。这样,使得语言学习者可以通过电子设备来得到语音评价结果,降低了语言学习者的语言学习成本。
相应于上述方法实施例,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在电子设备上运行时,使得电子设备执行上述任一项语言学习方法的方法步骤。
本发明实施例提供的计算机可读存储介质中存储的计算机程序被电子设备的处理器执行后,电子设备可以获得语言学习者发出的语音数据作为目标语音数据。然后,可以将目标语音数据输入至预先构建的语音特征识别模型,从而得到目标语音数据的语音特征作为目标语音特征。之后,可以根据目标语音特征与该目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。这样,使得语言学习者可以通过电子设备来得到语音评价结果,降低了语言学习者的语言学习成本。
相应于上述方法实施例,本发明实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行上述任一项语言学习方法的方法步骤。
本发明实施例提供的计算机程序被电子设备的处理器执行后,电子设备可以获得语言学习者发出的语音数据作为目标语音数据。然后,可以将目标语音数据输入至预先构建的语音特征识别模型,从而得到目标语音数据的语音特征作为目标语音特征。之后,可以根据目标语音特征与该目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对目标语音数据的语音评价结果。这样,使得语言学习者可以通过电子设备来得到语音纠错结果,降低了语言学习者的语言学习成本。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (12)
1.一种语言学习方法,其特征在于,应用于电子设备,所述方法包括:
获得语言学习者发出的语音数据作为目标语音数据;
将所述目标语音数据输入至预先构建的语音特征识别模型,得到所述目标语音数据的语音特征作为目标语音特征;所述语音特征识别模型为:根据神经网络算法和映射关系训练得到的模型,所述映射关系为:预设语音数据的每个音节与目标文本数据中的字母或汉字间的映射关系,所述预设语音数据为:训练所述语音特征识别模型的训练样本中的预设语音数据,所述目标文本数据为:所述预设语音数据转换得到的文本数据;
根据所述目标语音特征与所述目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对所述目标语音数据的语音评价结果。
2.根据权利要求1所述的方法,其特征在于,在所述将所述目标语音数据输入至预先构建的语音特征识别模型,得到所述目标语音数据的语音特征作为目标语音特征的步骤之前,还包括:
获得预设数量的训练样本;其中,一个训练样本中包括:预设用户的一条预设语音数据和所述预设语音数据的语音特征;所述预设语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
通过预设的机器学习算法对所述训练样本进行训练,得到所述语音特征识别模型。
3.根据权利要求2所述的方法,其特征在于,所述通过预设的机器学习算法对所述训练样本进行训练,得到所述语音特征识别模型的步骤,包括:
将每个所述训练样本中的预设语音数据转换为文本数据,作为目标文本数据;
基于所述预设语音数据的语音特征,确定所述预设语音数据的每个音节与所述目标文本数据中的字母或汉字的映射关系;
根据神经网络算法和所述映射关系,训练得到所述语音特征识别模型。
4.根据权利要求3所述的方法,其特征在于,当所述预设用户为儿童用户时,所述根据所述目标语音特征与所述目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对所述目标语音数据的语音评价结果的步骤,包括:
计算所述目标语音特征和所述目标语音数据对应的标准语音数据的语音特征的匹配度;其中,所述目标语音特征和所述标准语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
根据所述匹配度、所述语言学习者所处的学习模式、预设的评分表和儿童评分加权值,给所述语言学习者评分;其中,所述评分表中记录有:匹配度、学习模式和分数的对应关系。
5.根据权利要求4所述的方法,其特征在于,在所述计算所述目标语音特征和所述目标语音数据对应的标准语音数据的语音特征的匹配度的步骤之后,还包括:
当所述匹配度小于预设阈值时,确定所述标准语音数据的文本数据中不同于所述目标语音数据的文本数据的差异文本数据;
生成针对所述差异文本数据的错误提示信息,作为语音纠错结果。
6.一种语言学习装置,其特征在于,应用于电子设备,所述装置包括:
第一获得模块,用于获得语言学习者发出的语音数据作为目标语音数据;
第二获得模块,用于将所述目标语音数据输入至预先构建的语音特征识别模型,得到所述目标语音数据的语音特征作为目标语音特征;所述语音特征识别模型为:根据神经网络算法和映射关系训练得到的模型,所述映射关系为:预设语音数据的每个音节与目标文本数据中的字母或汉字间的映射关系,所述预设语音数据为:训练所述语音特征识别模型的训练样本中的预设语音数据,所述目标文本数据为:所述预设语音数据转换得到的文本数据;
生成模块,用于根据所述目标语音特征与所述目标语音数据对应的标准语音数据的语音特征的比对结果,生成针对所述目标语音数据的语音评分结果。
7.根据权利要求6所述的装置,其特征在于,还包括:
第三获得模块,用于在将所述目标语音数据输入至预先构建的语音特征识别模型,得到所述目标语音数据的语音特征作为目标语音特征之前,获得预设数量的训练样本;其中,一个训练样本中包括:预设用户的一条预设语音数据和所述预设语音数据的语音特征;所述预设语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
训练模块,用于通过预设的机器学习算法对所述训练样本进行训练,得到所述语音特征识别模型。
8.根据权利要求7所述的装置,其特征在于,所述训练模块包括:
转换单元,用于将每个所述训练样本中的预设语音数据转换为文本数据,作为目标文本数据;
第一确定单元,用于基于所述预设语音数据的语音特征,确定所述预设语音数据的每个音节与所述目标文本数据中的字母或汉字的映射关系;
训练单元,用于根据神经网络算法和所述映射关系,训练得到所述语音特征识别模型。
9.根据权利要求8所述的装置,其特征在于,所述生成模块包括:
计算单元,用于当所述预设用户为儿童用户时,计算所述目标语音特征和所述目标语音数据对应的标准语音数据的语音特征的匹配度;其中,所述目标语音特征和所述标准语音数据的语音特征包括:音频、停顿信息、音高信息、发音长短信息和重音信息中的一项或多项;
评分单元,用于根据所述匹配度、所述语言学习者所处的学习模式、预设的评分表和儿童评分加权值,给所述语言学习者评分;其中,所述评分表中记录有:匹配度、学习模式和分数的对应关系。
10.根据权利要求9所述的装置,其特征在于,还包括:
第二确定单元,用于当所述匹配度小于预设阈值时,确定所述标准语音数据的文本数据中不同于所述目标语音数据的文本数据的差异文本数据;
生成单元,用于生成针对所述差异文本数据的错误提示信息,作为语音纠错结果。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5中任一所述的方法步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5中任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910251722.7A CN109817201B (zh) | 2019-03-29 | 2019-03-29 | 一种语言学习方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910251722.7A CN109817201B (zh) | 2019-03-29 | 2019-03-29 | 一种语言学习方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109817201A CN109817201A (zh) | 2019-05-28 |
CN109817201B true CN109817201B (zh) | 2021-03-26 |
Family
ID=66610942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910251722.7A Active CN109817201B (zh) | 2019-03-29 | 2019-03-29 | 一种语言学习方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109817201B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110277104B (zh) * | 2019-06-21 | 2021-08-06 | 上海松鼠课堂人工智能科技有限公司 | 单词语音训练系统 |
CN110675292A (zh) * | 2019-09-23 | 2020-01-10 | 浙江优学智能科技有限公司 | 一种基于人工智能的儿童语言能力评测方法 |
CN111312220A (zh) * | 2019-12-02 | 2020-06-19 | 西安冉科信息技术有限公司 | 一种基于学习机对话交流的学习方法 |
CN111292773A (zh) * | 2020-01-13 | 2020-06-16 | 北京大米未来科技有限公司 | 音视频合成的方法、装置、电子设备及介质 |
CN111259125B (zh) * | 2020-01-14 | 2023-08-29 | 百度在线网络技术(北京)有限公司 | 语音播报的方法和装置、智能音箱、电子设备、存储介质 |
CN111370029A (zh) * | 2020-02-28 | 2020-07-03 | 北京一起教育信息咨询有限责任公司 | 一种语音数据的处理方法、装置、存储介质及电子设备 |
CN111462546A (zh) * | 2020-04-03 | 2020-07-28 | 北京儒博科技有限公司 | 一种语音教学的方法、装置、设备及存储介质 |
CN112542158A (zh) * | 2020-11-09 | 2021-03-23 | 深圳市神经科学研究院 | 语音分析方法、系统、电子设备及存储介质 |
CN112435512B (zh) * | 2020-11-12 | 2023-01-24 | 郑州大学 | 一种轨道交通运输仿真培训的语音行为考核评价方法 |
CN115662242B (zh) * | 2022-12-02 | 2023-07-04 | 首都医科大学附属北京儿童医院 | 塑造儿童语言流畅度训练装置、设备和存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101089952A (zh) * | 2006-06-15 | 2007-12-19 | 株式会社东芝 | 噪声抑制、平滑语音谱、提取语音特征、语音识别、及训练语音模型的方法和装置 |
CN102376182A (zh) * | 2010-08-26 | 2012-03-14 | 财团法人工业技术研究院 | 语言学习系统、语言学习方法及其程序产品 |
CN103413550A (zh) * | 2013-08-30 | 2013-11-27 | 苏州跨界软件科技有限公司 | 一种人机交互式语言学习系统和方法 |
CN103778915A (zh) * | 2012-10-17 | 2014-05-07 | 三星电子(中国)研发中心 | 语音识别方法和移动终端 |
CN105095919A (zh) * | 2015-09-08 | 2015-11-25 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
CN105118502A (zh) * | 2015-07-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别系统的端点检测方法及系统 |
CN107316635A (zh) * | 2017-05-19 | 2017-11-03 | 科大讯飞股份有限公司 | 语音识别方法及装置、存储介质、电子设备 |
CN207367596U (zh) * | 2016-12-28 | 2018-05-15 | 北京嘉和美康信息技术有限公司 | 一种医疗文书记录系统 |
CN108346427A (zh) * | 2018-02-05 | 2018-07-31 | 广东小天才科技有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN108446093A (zh) * | 2018-03-15 | 2018-08-24 | 广东小天才科技有限公司 | 一种基于麦克风设备的信息交互方法、系统及相关设备 |
CN109243428A (zh) * | 2018-10-15 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 一种建立语音识别模型的方法、语音识别方法及系统 |
CN109410664A (zh) * | 2018-12-12 | 2019-03-01 | 广东小天才科技有限公司 | 一种发音纠正方法及电子设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060122834A1 (en) * | 2004-12-03 | 2006-06-08 | Bennett Ian M | Emotion detection device & method for use in distributed systems |
US8041570B2 (en) * | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US9368104B2 (en) * | 2012-04-30 | 2016-06-14 | Src, Inc. | System and method for synthesizing human speech using multiple speakers and context |
US9672811B2 (en) * | 2012-11-29 | 2017-06-06 | Sony Interactive Entertainment Inc. | Combining auditory attention cues with phoneme posterior scores for phone/vowel/syllable boundary detection |
CN104505103B (zh) * | 2014-12-04 | 2018-07-03 | 上海流利说信息技术有限公司 | 语音质量评价设备、方法和系统 |
US9761220B2 (en) * | 2015-05-13 | 2017-09-12 | Microsoft Technology Licensing, Llc | Language modeling based on spoken and unspeakable corpuses |
CN107016994B (zh) * | 2016-01-27 | 2020-05-08 | 阿里巴巴集团控股有限公司 | 语音识别的方法及装置 |
US10204621B2 (en) * | 2016-09-07 | 2019-02-12 | International Business Machines Corporation | Adjusting a deep neural network acoustic model |
-
2019
- 2019-03-29 CN CN201910251722.7A patent/CN109817201B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101089952A (zh) * | 2006-06-15 | 2007-12-19 | 株式会社东芝 | 噪声抑制、平滑语音谱、提取语音特征、语音识别、及训练语音模型的方法和装置 |
CN102376182A (zh) * | 2010-08-26 | 2012-03-14 | 财团法人工业技术研究院 | 语言学习系统、语言学习方法及其程序产品 |
CN103778915A (zh) * | 2012-10-17 | 2014-05-07 | 三星电子(中国)研发中心 | 语音识别方法和移动终端 |
CN103413550A (zh) * | 2013-08-30 | 2013-11-27 | 苏州跨界软件科技有限公司 | 一种人机交互式语言学习系统和方法 |
CN105118502A (zh) * | 2015-07-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别系统的端点检测方法及系统 |
CN105095919A (zh) * | 2015-09-08 | 2015-11-25 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
CN207367596U (zh) * | 2016-12-28 | 2018-05-15 | 北京嘉和美康信息技术有限公司 | 一种医疗文书记录系统 |
CN107316635A (zh) * | 2017-05-19 | 2017-11-03 | 科大讯飞股份有限公司 | 语音识别方法及装置、存储介质、电子设备 |
CN108346427A (zh) * | 2018-02-05 | 2018-07-31 | 广东小天才科技有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN108446093A (zh) * | 2018-03-15 | 2018-08-24 | 广东小天才科技有限公司 | 一种基于麦克风设备的信息交互方法、系统及相关设备 |
CN109243428A (zh) * | 2018-10-15 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 一种建立语音识别模型的方法、语音识别方法及系统 |
CN109410664A (zh) * | 2018-12-12 | 2019-03-01 | 广东小天才科技有限公司 | 一种发音纠正方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109817201A (zh) | 2019-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109817201B (zh) | 一种语言学习方法、装置、电子设备及可读存储介质 | |
KR102256705B1 (ko) | 수정된 용어들을 사용하는 음향 모델 트레이닝 | |
US11043213B2 (en) | System and method for detection and correction of incorrectly pronounced words | |
CN110797010A (zh) | 基于人工智能的问答评分方法、装置、设备及存储介质 | |
CN110428813B (zh) | 一种语音理解的方法、装置、电子设备及介质 | |
CN103594087A (zh) | 提高口语评测性能的方法及系统 | |
CN108431883A (zh) | 语言学习系统以及语言学习程序 | |
CN116523031B (zh) | 语言生成模型的训练方法、语言生成方法及电子设备 | |
KR102225435B1 (ko) | Stt 기반 언어구사 학습-훈련 시스템 | |
CN109448717B (zh) | 一种语音单词拼写识别方法、设备及存储介质 | |
CN110148413B (zh) | 语音评测方法及相关装置 | |
CN105786204A (zh) | 信息处理方法和电子设备 | |
CN112786028B (zh) | 声学模型处理方法、装置、设备和可读存储介质 | |
WO2020074067A1 (en) | Automatic language proficiency level determination | |
JP7376071B2 (ja) | コンピュータプログラム、発音学習支援方法及び発音学習支援装置 | |
CN112818096A (zh) | 对话生成方法及其装置 | |
CN116597809A (zh) | 多音字消歧方法、装置、电子设备及可读存储介质 | |
CN116806338A (zh) | 确定和利用辅助语言熟练度量度 | |
CN113990351A (zh) | 纠音方法、纠音装置及非瞬时性存储介质 | |
CN110895924B (zh) | 一种文档内容朗读方法、装置、电子设备及可读存储介质 | |
Jo et al. | Effective computer‐assisted pronunciation training based on phone‐sensitive word recommendation | |
KR20220032973A (ko) | 외국어 학습자의 외국어 문장 평가에 기반한 외국어 교육 제공 장치 및 방법 | |
CN109859741A (zh) | 语音测评方法、装置、电子设备及存储介质 | |
JP7039637B2 (ja) | 情報処理装置、情報処理方法、情報処理システム、情報処理プログラム | |
TWI768412B (zh) | 發音教學方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |