CN106504755A - 一种错误发音的识别方法及装置、用户终端 - Google Patents

一种错误发音的识别方法及装置、用户终端 Download PDF

Info

Publication number
CN106504755A
CN106504755A CN201610983669.6A CN201610983669A CN106504755A CN 106504755 A CN106504755 A CN 106504755A CN 201610983669 A CN201610983669 A CN 201610983669A CN 106504755 A CN106504755 A CN 106504755A
Authority
CN
China
Prior art keywords
content
voice messaging
user terminal
read
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610983669.6A
Other languages
English (en)
Inventor
王会英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201610983669.6A priority Critical patent/CN106504755A/zh
Publication of CN106504755A publication Critical patent/CN106504755A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Abstract

本发明实施例涉及电子设备技术领域,公开了一种错误发音的识别方法及装置、用户终端,该方法包括:在检测到针对待阅读内容的显示指令时,根据该显示指令在用户终端的显示屏中显示该待阅读内容并同时启动用户终端的语音识别功能,通过该语音识别功能识别当前环境中的第一语音信息,对比第一语音信息与用户终端中预先存储的标准语音信息,得到针对第一语音信息的评分等级,当该评分等级小于等于预设评分等级时,将该待阅读内容中与第一语音信息对应的阅读内容确定为发音错误的阅读内容。实施本发明实施例能够提高对用户错误发音的识别效率。

Description

一种错误发音的识别方法及装置、用户终端
技术领域
本发明涉及电子设备技术领域,具体涉及一种错误发音的识别方法及装置、用户终端。
背景技术
学生教材电子化阅读已是时代发展的趋势,且学生用户阅读电子教材不仅仅是为了扩大知识面,更多的是为了知晓发音有误的地方并自我纠正以提到自身的口语能力,尤其是学生用户在阅读涉及文言文或者英语的电子教材时,识别出用户的错误发音显得尤为重要。
当前,无论学生用户阅读电子教材所使用的用户终端采用一键录音功能,还是采用定时录音功能,均需要学生用户进行“点击录音按钮—>点击播放按钮—>点击跟读按钮—>跟读—>查看评分”的一系列操作,操作繁琐,且如果学生用户忘记点击相关操作按钮就直接阅读发音,用户终端就无法对学生用户的错误发音进行识别,还需学生用户重新点击相关操作按钮并重新阅读发音,这大大降低了对学生用户错误发音的识别效率。
发明内容
本发明实施例公开了一种错误发音的识别方法及装置、用户终端,能够提高对错误发音的识别效率。
本发明实施例第一方面公开了一种错误发音的识别方法,所述方法包括:
在检测到针对待阅读内容的显示指令时,根据所述显示指令在用户终端的显示屏中显示所述待阅读内容并同时启动所述用户终端的语音识别功能;
通过所述语音识别功能识别当前环境中的第一语音信息;
对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级;
当所述评分等级小于等于预设评分等级时,将所述待阅读内容中与所述第一语音信息对应的阅读内容确定为发音错误的阅读内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述显示指令在用户终端的显示屏中显示所述待阅读内容并同时启动所述用户终端的语音识别功能,包括:
根据所述显示指令在用户终端的显示屏中显示所述待阅读内容,并检测所述用户终端的耳机是否插入到耳机插孔中;
当检测结果为是时,启动所述用户终端的语音识别功能。
作为一种可选的实施方式,在本发明实施例第一方面中,所述通过所述语音识别功能识别当前环境中的第一语音信息之后,以及所述对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级之前,所述方法还包括:
分析所述第一语音信息,得到所述第一语音信息对应的声纹信息,并判断所述声纹信息是否与预设声纹信息相匹配;
当所述声纹信息与所述预设声纹信息相匹配时,将所述第一语音信息转换成文本内容,并判断所述文本内容是否与所述待阅读内容的部分内容相匹配;
当所述文本内容与所述待阅读内容的部分内容相匹配时,触发执行所述对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级的操作。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
显示所述发音错误的阅读内容的正确发音参考信息,并播放所述发音错误的阅读内容的标准语音信息;
提示用户重新对所述发音错误的阅读内容进行发音,并通过所述语音识别功能识别针对所述发音错误的阅读内容的第二语音信息,直至针对所述第二语音信息的评分等级大于所述预设评分等级。
作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述待阅读内容中与所述第一语音信息对应的阅读内容确定为发音错误的阅读内容,包括:
确定与所述评分等级对应的预设颜色;
将所述待阅读内容中与所述第一语音信息对应的阅读内容显示为所述预设颜色,以标注所述第一语音信息对应的阅读内容为发音错误的阅读内容。
本发明实施例第二方面公开了一种错误发音的识别装置,所述装置包括控制单元、识别单元、对比单元以及确定单元,其中:
所述控制单元,用于在检测到针对待阅读内容的显示指令时,根据所述显示指令在用户终端的显示屏中显示所述待阅读内容并同时启动所述用户终端的语音识别功能;
所述识别单元,用于通过所述语音识别功能识别当前环境中的第一语音信息;
所述对比单元,用于对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级;
所述确定单元,用于当所述评分等级小于等于预设评分等级时,将所述待阅读内容中与所述第一语音信息对应的阅读内容确定为发音错误的阅读内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述控制单元包括第一显示子单元、检测子单元以及启动子单元,其中:
所述第一显示子单元,用于在检测到针对所述待阅读内容的显示指令时,根据所述显示指令在用户终端的显示屏中显示所述待阅读内容;
所述检测子单元,用于检测所述用户终端的耳机是否插入到耳机插孔中;
所述启动子单元,用于当所述检测子单元的检测结果为是时,启动所述用户终端的语音识别功能。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括分析单元、判断单元以及转换单元,其中:
所述分析单元,用于在所述识别单元执行所述通过所述语音识别功能识别当前环境中的第一语音信息的操作之后以及在所述对比单元执行所述对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级之前,分析所述第一语音信息,得到所述第一语音信息对应的声纹信息;
所述判断单元,用于判断所述声纹信息是否与预设声纹信息相匹配;
所述转换单元,用于当所述判断单元判断出所述声纹信息与所述预设声纹信息相匹配时,将所述第一语音信息转换成文本内容;
所述判断单元,还用于判断所述文本内容是否与所述待阅读内容的部分内容相匹配,且当所述文本内容与所述待阅读内容的部分内容相匹配时,触发所述对比单元执行所述对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级的操作。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括显示单元、播放单元以及提示单元,其中:
所述显示单元,用于显示所述发音错误的阅读内容的正确发音参考信息;
所述播放单元,用于播放所述发音错误的阅读内容的标准语音信息;
所述提示单元,用于提示用户重新对所述发音错误的阅读内容进行发音;
所述识别单元,还用于通过所述语音识别功能识别针对所述发音错误的阅读内容的第二语音信息,直至针对所述第二语音信息的评分等级大于所述预设评分等级。
作为一种可选的实施方式,在本发明实施例第二方面中,所述确定单元包括确定子单元以及第二显示子单元,其中:
所述确定子单元,用于确定与所述评分等级对应的预设颜色;
所述第二显示子单元,用于将所述待阅读内容中与所述第一语音信息对应的阅读内容显示为所述预设颜色,以标注所述第一语音信息对应的阅读内容为发音错误的阅读内容。
本发明实施例第三方面公开了一种用户终端,所述用户终端包括本发明实施例第二方面公开的错误发音的识别装置。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,在检测到针对待阅读内容的显示指令时,根据该显示指令在用户终端的显示屏中显示该待阅读内容并同时启动用户终端的语音识别功能,通过该语音识别功能识别当前环境中的语音信息,对比第一语音信息与用户终端中预先存储的标准语音信息,得到针对第一语音信息的评分等级,当该评分等级小于等于预设评分等级时,将该待阅读内容中与第一语音信息对应的阅读内容确定为发音错误的阅读内容。可见,实施本发明实施例能够在显示待阅读内容时自动识别语音信息,对识别出的语音信息进行评分,并将评分较低的语音信息对应的阅读内容确定为发音错误的阅读内容,减少了用户的手动操作,提高了对用户错误发音的识别效率,进而提高了用户的使用体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种错误发音的识别方法的流程示意图;
图2是本发明实施例公开的另一种错误发音的识别方法的流程示意图;
图3是本发明实施例公开的一种标注评分等级的用户界面示意图;
图4是本发明实施例公开的一种错误发音的识别装置的结构示意图;
图5是本发明实施例公开的另一种错误发音的识别装置的结构示意图;
图6是本发明实施例公开的又一种错误发音的识别装置的结构示意图;
图7是本发明实施例公开的又一种错误发音的识别装置的结构示意图;
图8是本发明实施例公开的一种用户终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种错误发音的识别方法及装置、用户终端,能够在显示待阅读内容时自动识别语音信息,对识别出的语音信息进行评分,并将评分较低的语音信息对应的阅读内容确定为发音错误的阅读内容,减少了用户的手动操作,提高了对用户错误发音的识别效率,进而提高了用户的使用体验。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种错误发音的识别方法的流程示意图。其中,图1所描述的错误发音的识别方法可以应用于智能手机(Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)等用户终端中,本发明实施例不做限定。如图1所示,该错误发音的识别方法可以包括以下操作:
101、用户终端在检测到针对待阅读内容的显示指令时,根据该显示指令在用户终端的显示屏中显示待阅读内容并同时启动用户终端的语音识别功能。
本发明实施例中,针对该待阅读内容的显示指令可以是用户触发的翻页指令,也可以是用户针对待阅读内容的打开指令,本发明实施例不做限定。且用户终端在显示待阅读内容的同时自动启动用户终端的语音识别功能。
可选的,用户终端在检测到针对待阅读内容的显示指令时,根据该显示指令在用户终端的显示屏中显示待阅读内容并同时启动用户终端的语音识别功能可以包括:
当检测到针对待阅读内容的显示指令时,用户终端根据该显示指令在用户终端的显示屏中显示待阅读内容,并检测用户终端的耳机是否插入到耳机插孔中;
当检测结果为是时,用户终端启动用户终端的语音识别功能;
当检测结果为否时,用户终端采集其所处环境的环境噪声值,并判断采集到的环境噪声值是否大于等于预设环境噪声值阈值,当采集到的环境噪声值大于等于预设环境噪声值阈值时,提示用户插入耳机,且在检测到有耳机插入时,启动用户终端的语音识别功能;当采集到的环境噪声值小于预设环境噪声值阈值时,用户终端直接启动用户终端的语音识别功能。
102、用户终端通过上述语音识别功能识别当前环境中的第一语音信息。
本发明实施例中,用户终端中可以预先存储有用户的声纹信息,且用户终端通过上述语音识别功能识别当前环境中的第一语音信息可以包括:
用户终端通过上述语音识别功能识别当前环境中的所有语音信息;
用户终端分析所有语音信息对应的所有声纹信息,并判断该所有声纹信息中是否存在其中一个声纹信息与预先存储的用户的声纹信息相匹配,如果存在,则将该其中一个声纹信息对应的语音信息确定为第一语音信息;或者,
用户终端确定所有语音信息的不同分贝值,并将最大分贝值对应的语音信息确定为第一语音信息。
103、用户终端对比上述第一语音信息与用户终端中预先存储的标准语音信息,得到针对上述第一语音信息的评分等级。
本发明实施例中,用户终端中预先存储有针对上述待阅读内容的标准语音信息(即标准真人发音),且得到的评分等级可以为具体的评分值,如4分、7分或9分等,也可以是根据具体的评分值确定出的优等级、良等级、中等级以及差等级中的其中一个,本发明实施例不做限定。
104、当上述评分等级小于等于预设评分等级时,用户终端将上述待阅读内容中与上述第一语音信息对应的阅读内容确定为发音错误的阅读内容。
本发明实施例中,用户终端中可以预先存储有预设评分等级,且得到的评分等级小于等于该预设评分等级的语音信息对应的阅读内容为用户发音较差的阅读内容,得到的评分等级大于该预设评分等级的语音信息对应的阅读内容为用户发音符合要求的阅读内容。
举例来说,当上述评分等级为具体的评分值且具体值5分时,若该预设评分等级为6分,则上述第一语音信息对应的阅读内容为发音错误的阅读内容;若上述预设评分等级为中等级,则当上述评分等级小于等于中等级(中等级或差等级)时,用户终端确定上述第一语音信息对应的阅读内容为发音错误的阅读内容。
在一个可选的实施例中,在执行步骤102之后以及在执行步骤103之前,该错误发音的识别方法还可以包括以下操作:
用户终端分析上述第一语音信息,得到上述第一语音信息对应的声纹信息,并判断该声纹信息是否与预设声纹信息相匹配;
当该声纹信息与预设声纹信息相匹配时,用户终端将上述第一语音信息转换成文本内容,并判断该文本内容是否与上述待阅读内容的部分内容相匹配;
当该文本内容与上述待阅读内容的部分内容相匹配时,触发执行上述对比上述第一语音信息与用户终端中预先存储的标准语音信息,得到针对上述第一语音信息的评分等级的操作。
该可选的实施例能够确保识别出的第一语音信息为特定用户针对上述待阅读内容的语音信息,保证了提取到的语音信息的正确性以及可靠性。
在另一个实施例中,用户终端将上述待阅读内容中与上述第一语音信息对应的阅读内容确定为发音错误的阅读内容可以包括:
用户终端确定与上述评分等级对应的预设显示效果;
用户终端将上述待阅读内容中与上述第一语音信息对应的阅读内容显示为该预设显示效果,即按照该预设显示效果显示上述待阅读内容中与上述第一语音信息对应的阅读内容。
可选的,该预设显示效果可以包括预设字体颜色、预设背景颜色以及预设字体大小中的至少一种,这样可以比较直观的将错误发音的阅读内容与其它阅读内容区分开来。
需要说明的是,不同评分等级可以对应不同的预设显示效果。举例来说,当预设显示效果包括预设字体颜色时,在确定出用户已经阅读过的阅读内容对应的评分等级后,用户终端在显示屏中以与评分等级对应的预设字体颜色标注对应的阅读内容,如用蓝色字体标注用户发音较为准确的阅读内容(如评分值大于等于8分或者评价等级为优等级的阅读内容),用黄色字体标注用户发音一般的阅读内容(如评分值大于等于6分且小于8分或者评价等级为良等级的阅读内容),用红色字体标注用户发音较差的阅读内容(如评分值小于6分或者评价等级为中等级或者差等级的阅读内容),用黑色字体标注上述待阅读内容中还未被阅读的部分。
需要说明的是,若上述待阅读内容为英文内容时,用户终端识别出的上述第一语音信息可以是针对一个单词的语音信息,也可以是针对一句短句的语音信息,相应的,用户终端可以标注针对每个单词发音的评分等级,也可以标注针对一句短句发音的评分等级,其中,针对一句短句发音的评分等级可以为该一句短句中针对所有单词发音的评分等级之和的平均值;若上述待阅读内容为中文内容时,用户终端识别出的上述第一语音信息可以是针对一个词语或一个字的语音信息,也可以是针对一句话的语音信息,相应的,用户终端可以标注针对每个词语或每个字发音的评分等级,也可以标注针对一句话发音的评分等级,其中,针对一句话的评分等级可以为该一句话中针对所有词语或所有字发音的评分等级之和的平均值。
可见,实施图1所描述的错误发音的识别方法能够在显示待阅读内容时自动识别语音信息,对识别出的语音信息进行评分,并将评分较低的语音信息对应的阅读内容确定为发音错误的阅读内容,减少了用户的手动操作,提高了对用户错误发音的识别效率,进而提高了用户的使用体验。
实施例二
请参阅图2,图2是本发明实施例公开的另一种错误发音的识别方法的流程示意图。其中,图2所描述的错误发音的识别方法可以应用于智能手机(Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)等用户终端中,本发明实施例不做限定。如图2所示,该错误发音的识别方法可以包括以下操作:
201、用户终端下载待阅读内容的标准语音信息并存储。
本发明实施例中,待阅读内容的标准语音信息可以理解为针对待阅读内容的标准真人发音。
202、用户终端在检测到针对上述待阅读内容的显示指令时,根据显示指令在用户终端的显示屏中显示上述待阅读内容。
203、用户终端检测用户终端的耳机是否插入到耳机插孔中。
本发明实施例中,当步骤203的判断结果为是时,触发执行步骤204;当步骤203的判断结果为否时,用户终端可以执行以下操作:
采集用户终端所处环境的环境噪声值;
判断采集到的环境噪声值是否大于等于预设环境噪声值阈值;
当采集到的环境噪声值大于等于预设环境噪声值阈值时,提示用户插入耳机,并在检测到耳机插入用户终端的耳机插孔中时,触发执行步骤204;
当采集到的环境噪声值不大于等于预设环境噪声值时,可以直接触发执行步骤204。
204、用户终端启动用户终端的语音识别功能。
205、用户终端通过语音识别功能识别当前环境中的第一语音信息并存储。
206、用户终端对比上述第一语音信息与用户终端中预先存储的标准语音信息,得到针对上述第一语音信息的评分等级。
207、用户终端判断上述评分等级是否小于等于预设评分等级。
本发明实施例中,当步骤207的判断结果为是时,触发执行步骤208;当步骤207的判断结果为否时,用户终端在显示屏的对应位置显示上述评分等级,以使用户直观的了解自身的口语水平,其中,该对应位置可以为上述待阅读内容中与上述第一语音信息对应的阅读内容的附近位置,如正下方位置等。
208、用户终端确定与上述评分等级对应的预设颜色,并在用户终端的显示屏中将上述第一语音信息对应的阅读内容显示为该预设颜色,以标注上述待阅读内容中与上述第一语音信息对应的阅读内容为用户发音错误的阅读内容。
可选的,在用户终端的显示屏中将与上述第一语音信息对应的阅读内容显示为该预设颜色的同时,用户终端也可以标注对应的评分等级,如评分值等。举例来说,用户终端标注评分等级的用户界面可以如图3所示,图3是本发明实施例公开的一种标注评分等级的用户界面示意图。其中,图3中A的表示对单个的单词进行评分,并将评分结果标注在单词的下方,图3中的B表示对整个句子进行评分,并将评分结果标注在对应句子的下方。
209、用户终端提示用户重新对上述发音错误的阅读内容进行发音,并重新通过语音识别功能识别针对上述发音错误的阅读内容的第二语音信息,直至针对该第二语音信息的评分等级大于上述预设评分等级。
在一个可选的实施例中,在执行步骤205之后以及在执行步骤206之前,该错误发音的识别方法还可以包括以下操作:
用户终端分析上述第一语音信息,得到上述第一语音信息对应的声纹信息,并判断该声纹信息是否与预设声纹信息相匹配;
当该声纹信息与预设声纹信息相匹配时,用户终端将上述第一语音信息转换成文本内容,并判断该文本内容是否与上述待阅读内容的部分内容相匹配;
当该文本内容与上述待阅读内容的部分内容相匹配时,触发执行上述对比上述第一语音信息与用户终端中预先存储的标准语音信息,得到针对上述第一语音信息的评分等级的操作。
该可选的实施例能够确保识别出的第一语音信息为用户针对上述待阅读内容的语音信息,保证了提取到的语音信息的正确性以及可靠性。
在另一个可选的实施例中,在执行步骤208之后且在执行步骤209之前,该错误发音的识别方法还可以包括以下操作:
用户终端显示上述发音错误的阅读内容的正确发音参考信息,并播放上述发音错误的阅读内容的标准语音信息,这样能够使用户更快的掌握针对上述发音错误的阅读内容的正确发音。
可见,实施图2所描述的错误发音的识别方法能够在显示待阅读内容时自动识别语音信息,对识别出的语音信息进行评分,将评分较低的语音信息对应的阅读内容确定为发音错误的阅读内容并用特殊颜色进行自动标注,减少了用户的手动操作,提高了用户的阅读效率以及对用户错误发音的识别效率,且将语音识别功能与耳机结合使用,能够避免因环境噪声对识别出的语音信息造成干扰进而影响评分结果的情况发生,提高了评分结果的准确性,且能够通过使用户对评分较低的阅读内容进行针对性的发音练习,节约了用户的时间,进一步提高了用户的使用体验。
实施例三
请参阅图4,图4是本发明实施例公开的一种错误发音的识别装置的结构示意图。其中,图4所描述的错误发音的识别装置400可以安装在智能手机(Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)等用户终端中,本发明实施例不做限定。如图4所示,该错误发音的识别装置400可以包括控制单元401、识别单元402、对比单元403以及确定单元404,其中:
控制单元401用于在检测到针对待阅读内容的显示指令时,根据该显示指令在用户终端的显示屏中显示该待阅读内容并同时启动用户终端的语音识别功能。
识别单元402用于通过上述语音识别功能识别当前环境中的第一语音信息。
对比单元403用于对比识别单元402识别出的第一语音信息与用户终端中预先存储的标准语音信息,得到针对上述第一语音信息的评分等级。
确定单元404用于当对比单元403对比得到的评分等级小于等于评分等级时,将上述待阅读内容中与上述第一语音信息对应的阅读内容确定为发音错误的阅读内容。
可见,实施图4所描述的错误发音的识别装置400能够在显示待阅读内容时自动识别语音信息,对识别出的语音信息进行评分,并将评分较低的语音信息对应的阅读内容确定为发音错误的阅读内容,减少了用户的手动操作,提高了对用户错误发音的识别效率,进而提高了用户的使用体验。
在一个可选的实施例中,控制单元401可以包括第一显示子单元4011、检测子单元4012以及启动子单元4013,此时,该错误发音的识别装置400的结构可以如图5所示,图5是本发明实施例公开的另一种错误发音的识别装置的结构示意图。其中:
第一显示子单元4011用于在检测到针对待阅读内容的显示指令时,根据该显示指令在用户终端的显示屏中显示该待阅读内容。
本发明实施例中,第一显示子单元4011在显示待阅读内容的同时向检测子单元4012发送触发指令,以触发检测子单元4012执行相应的操作。
检测子单元4012用于检测用户终端的耳机是否插入到耳机插孔中。
启动子单元4013用于当检测子单元4012的检测结果为是时,启动用户终端的语音识别功能。
可见,实施图5所描述的错误发音的识别装置400还能够将语音识别功能与耳机结合使用,避免了因环境噪声对识别出的语音信息造成干扰进而影响评分结果的情况发生,提高了评分结果的准确性。
在另一个可选的实施例中,该错误发音的识别装置400还可以包括分析单元405、判断单元406以及转换单元407,此时,该错误发音的识别装置400的结构可以如图6所示,图6是本发明实施例公开的又一种错误发音的识别装置的结构示意图。其中:
分析单元406用于在识别单元402执行上述通过语音识别功能识别当前环境中的第一语音信息的操作之后以及在对比单元403执行上述对比第一语音信息与用户终端中预先存储的标准语音信息,得到针对第一语音信息的评分等级之前,分析识别单元402识别到的上述第一语音信息,得到上述第一语音信息对应的声纹信息。
判断单元406用于判断分析单元405分析得到声纹信息是否与预设声纹信息相匹配。
转换单元407用于当判断单元406判断出上述声纹信息与预设声纹信息相匹配时,将识别单元402识别出的上述第一语音信息转换成文本内容。
判断单元406还用于判断转换单元407转换得到的文本内容是否与上述待阅读内容的部分内容相匹配,且当上述文本内容与上述待阅读内容的部分内容相匹配时,触发对比单元403执行上述对比第一语音信息与用户终端中预先存储的标准语音信息,得到针对第一语音信息的评分等级的操作。
可见,实施图6所描述的错误发音的识别装置400还能够通过识别出的语音信息的声纹信息以及识别出的语音信息的文本信息保证识别出的语音信息为特定用户针对待阅读内容发出的语音信息。
在又一个可选的实施例中,该错误语音的识别装置400还可以包括显示单元408、播放单元409以及提示单元410,可选的,确定单元404可以包括确定子单元4041以及第二显示子单元4042,此时,该错误语音的识别装置400的结构可以如图7所示,图7是本发明实施例公开的又一种错误语音的识别装置的结构示意图。其中:
确定子单元4041用于确定与对比单元403对比得到的评分等级对应的预设颜色。
第二显示子单元4042用于将上述待阅读内容中与上述第一语音信息对应的阅读内容显示为确定子单元4041确定出的预设颜色,以标注上述第一语音信息对应的阅读内容为发音错误的阅读内容。
显示单元408用于显示确定单元404确定出的上述发音错误的阅读内容的正确发音参考信息。
播放单元409用于播放确定单元404确定出的上述发音错误的阅读内容的标准语音信息。
提示单元410用于提示用户重新对上述发音错误的阅读内容进行发音。
本发明实施例中,提示单元410在提示用户重新对上述发音错误的阅读内容进行发音之后,向识别单元402发送触发指令,以触发识别单元402执行相应的操作。
识别单元402还可以用于通过语音识别功能识别针对上述发音错误的阅读内容的第二语音信息,直至针对第二语音信息的评分等级大于上述预设评分等级。
可见,实施图7所描述的错误发音的识别装置400还能够自动对评分较低的阅读内容进行标注,并通过使用户对评分较低的阅读内容进行针对性的发音练习,节约了用户的时间,进一步提高了用户的使用体验。
实施例四
请参阅图8,图8是本发明实施例公开的一种用户终端的结构示意图。其中,图8所描述的用户终端可以为智能手机(Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)等任意一种用户终端,本发明实施例不做限定。如图8所示,该用户终端可以包括错误发音的识别装置801、壳体802、电路板803以及电源804,其中,错误发音的识别装置801可以是图4至图7所描述的任意一个错误发音的识别装置,本发明实施例不再赘述,电路板803安置在壳体802围成的空间内部,错误发音的识别装置801设置在电路板803上,电源804用于为用户终端上的错误发音的识别装置801供电。可见,实施图8所描述的用户终端能够在显示待阅读内容时自动识别语音信息,对识别出的语音信息进行评分,并将评分较低的语音信息对应的阅读内容确定为发音错误的阅读内容,减少了用户的手动操作,提高了对用户错误发音的识别效率,进而提高了用户的使用体验。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种错误发音的识别方法及装置、用户终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种错误发音的识别方法,其特征在于,所述方法包括:
在检测到针对待阅读内容的显示指令时,根据所述显示指令在用户终端的显示屏中显示所述待阅读内容并同时启动所述用户终端的语音识别功能;
通过所述语音识别功能识别当前环境中的第一语音信息;
对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级;
当所述评分等级小于等于预设评分等级时,将所述待阅读内容中与所述第一语音信息对应的阅读内容确定为发音错误的阅读内容。
2.根据权利要求1所述的方法,其特征在于,所述根据所述显示指令在用户终端的显示屏中显示所述待阅读内容并同时启动所述用户终端的语音识别功能,包括:
根据所述显示指令在用户终端的显示屏中显示所述待阅读内容,并检测所述用户终端的耳机是否插入到耳机插孔中;
当检测结果为是时,启动所述用户终端的语音识别功能。
3.根据权利要求1所述的方法,其特征在于,所述通过所述语音识别功能识别当前环境中的第一语音信息之后,以及所述对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级之前,所述方法还包括:
分析所述第一语音信息,得到所述第一语音信息对应的声纹信息,并判断所述声纹信息是否与预设声纹信息相匹配;
当所述声纹信息与所述预设声纹信息相匹配时,将所述第一语音信息转换成文本内容,并判断所述文本内容是否与所述待阅读内容的部分内容相匹配;
当所述文本内容与所述待阅读内容的部分内容相匹配时,触发执行所述对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级的操作。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
显示所述发音错误的阅读内容的正确发音参考信息,并播放所述发音错误的阅读内容的标准语音信息;
提示用户重新对所述发音错误的阅读内容进行发音,并通过所述语音识别功能识别针对所述发音错误的阅读内容的第二语音信息,直至针对所述第二语音信息的评分等级大于所述预设评分等级。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述待阅读内容中与所述第一语音信息对应的阅读内容确定为发音错误的阅读内容,包括:
确定与所述评分等级对应的预设颜色;
将所述待阅读内容中与所述第一语音信息对应的阅读内容显示为所述预设颜色,以标注所述第一语音信息对应的阅读内容为发音错误的阅读内容。
6.一种错误发音的识别装置,其特征在于,所述装置包括控制单元、识别单元、对比单元以及确定单元,其中:
所述控制单元,用于在检测到针对待阅读内容的显示指令时,根据所述显示指令在用户终端的显示屏中显示所述待阅读内容并同时启动所述用户终端的语音识别功能;
所述识别单元,用于通过所述语音识别功能识别当前环境中的第一语音信息;
所述对比单元,用于对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级;
所述确定单元,用于当所述评分等级小于等于预设评分等级时,将所述待阅读内容中与所述第一语音信息对应的阅读内容确定为发音错误的阅读内容。
7.根据权利要求6所述的装置,其特征在于,所述控制单元包括第一显示子单元、检测子单元以及启动子单元,其中:
所述第一显示子单元,用于在检测到针对所述待阅读内容的显示指令时,根据所述显示指令在用户终端的显示屏中显示所述待阅读内容;
所述检测子单元,用于检测所述用户终端的耳机是否插入到耳机插孔中;
所述启动子单元,用于当所述检测子单元的检测结果为是时,启动所述用户终端的语音识别功能。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括分析单元、判断单元以及转换单元,其中:
所述分析单元,用于在所述识别单元执行所述通过所述语音识别功能识别当前环境中的第一语音信息的操作之后以及在所述对比单元执行所述对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级之前,分析所述第一语音信息,得到所述第一语音信息对应的声纹信息;
所述判断单元,用于判断所述声纹信息是否与预设声纹信息相匹配;
所述转换单元,用于当所述判断单元判断出所述声纹信息与所述预设声纹信息相匹配时,将所述第一语音信息转换成文本内容;
所述判断单元,还用于判断所述文本内容是否与所述待阅读内容的部分内容相匹配,且当所述文本内容与所述待阅读内容的部分内容相匹配时,触发所述对比单元执行所述对比所述第一语音信息与所述用户终端中预先存储的标准语音信息,得到针对所述第一语音信息的评分等级的操作。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述装置还包括显示单元、播放单元以及提示单元,其中:
所述显示单元,用于显示所述发音错误的阅读内容的正确发音参考信息;
所述播放单元,用于播放所述发音错误的阅读内容的标准语音信息;
所述提示单元,用于提示用户重新对所述发音错误的阅读内容进行发音;
所述识别单元,还用于通过所述语音识别功能识别针对所述发音错误的阅读内容的第二语音信息,直至针对所述第二语音信息的评分等级大于所述预设评分等级。
10.根据权利要求6-8任一项所述的装置,其特征在于,所述确定单元包括确定子单元以及第二显示子单元,其中:
所述确定子单元,用于确定与所述评分等级对应的预设颜色;
所述第二显示子单元,用于将所述待阅读内容中与所述第一语音信息对应的阅读内容显示为所述预设颜色,以标注所述第一语音信息对应的阅读内容为发音错误的阅读内容。
11.一种用户终端,其特征在于,所述用户终端包括如权利要求6-10任一项所述的错误发音的识别装置。
CN201610983669.6A 2016-11-08 2016-11-08 一种错误发音的识别方法及装置、用户终端 Pending CN106504755A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610983669.6A CN106504755A (zh) 2016-11-08 2016-11-08 一种错误发音的识别方法及装置、用户终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610983669.6A CN106504755A (zh) 2016-11-08 2016-11-08 一种错误发音的识别方法及装置、用户终端

Publications (1)

Publication Number Publication Date
CN106504755A true CN106504755A (zh) 2017-03-15

Family

ID=58323741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610983669.6A Pending CN106504755A (zh) 2016-11-08 2016-11-08 一种错误发音的识别方法及装置、用户终端

Country Status (1)

Country Link
CN (1) CN106504755A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230396A (zh) * 2017-07-21 2017-10-03 渭南师范学院 一种汉语在线教学终端及方法
CN107274739A (zh) * 2017-08-08 2017-10-20 渭南师范学院 远程教学方法
CN109255988A (zh) * 2018-07-11 2019-01-22 北京美高森教育科技有限公司 基于错误发音检测的语言学习方法
CN109448460A (zh) * 2018-12-17 2019-03-08 广东小天才科技有限公司 一种背诵检测方法及用户设备
CN109637543A (zh) * 2018-12-12 2019-04-16 平安科技(深圳)有限公司 语音卡的语音数据处理方法和装置
CN109686142A (zh) * 2018-12-29 2019-04-26 北京智能管家科技有限公司 一种内容跟读方法、装置、存储介质及电子设备
CN109712443A (zh) * 2019-01-02 2019-05-03 北京儒博科技有限公司 一种内容跟读方法、装置、存储介质及电子设备
CN110085260A (zh) * 2019-05-16 2019-08-02 上海流利说信息技术有限公司 一种单词音节重音识别校正方法、装置、设备以及介质
CN110895936A (zh) * 2018-09-13 2020-03-20 珠海格力电器股份有限公司 基于家用电器的语音处理方法和装置
CN111694622A (zh) * 2019-03-12 2020-09-22 上海流利说信息技术有限公司 一种跟读内容的展示方法、介质、装置和计算设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000181918A (ja) * 1998-12-14 2000-06-30 Poritekku:Kk 手書き入力した英単語に意味・発音を示すマルチメディア英和辞書
CN103514764A (zh) * 2013-10-28 2014-01-15 苏州市思玛特电力科技有限公司 语言教学评估系统
US20140278441A1 (en) * 2013-03-15 2014-09-18 Qualcomm Incorporated Systems and methods for switching processing modes using gestures
CN104123858A (zh) * 2014-07-30 2014-10-29 广东小天才科技有限公司 一种读背课文时检错纠错的方法及装置
CN104978957A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 基于声纹识别的语音控制方法和系统
CN105575197A (zh) * 2015-12-18 2016-05-11 江苏易乐网络科技有限公司 一种具有防沉迷功能的在线学习系统
CN105609103A (zh) * 2015-12-18 2016-05-25 合肥寰景信息技术有限公司 一种语音即时识别系统
CN105609098A (zh) * 2015-12-18 2016-05-25 江苏易乐网络科技有限公司 一种基于互联网的在线学习系统
CN105872619A (zh) * 2015-12-15 2016-08-17 乐视网信息技术(北京)股份有限公司 一种视频播放记录的匹配方法及匹配装置
CN105895101A (zh) * 2016-06-08 2016-08-24 国网上海市电力公司 用于电力智能辅助服务系统的语音处理设备及处理方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000181918A (ja) * 1998-12-14 2000-06-30 Poritekku:Kk 手書き入力した英単語に意味・発音を示すマルチメディア英和辞書
US20140278441A1 (en) * 2013-03-15 2014-09-18 Qualcomm Incorporated Systems and methods for switching processing modes using gestures
CN103514764A (zh) * 2013-10-28 2014-01-15 苏州市思玛特电力科技有限公司 语言教学评估系统
CN104978957A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 基于声纹识别的语音控制方法和系统
CN104123858A (zh) * 2014-07-30 2014-10-29 广东小天才科技有限公司 一种读背课文时检错纠错的方法及装置
CN105872619A (zh) * 2015-12-15 2016-08-17 乐视网信息技术(北京)股份有限公司 一种视频播放记录的匹配方法及匹配装置
CN105575197A (zh) * 2015-12-18 2016-05-11 江苏易乐网络科技有限公司 一种具有防沉迷功能的在线学习系统
CN105609103A (zh) * 2015-12-18 2016-05-25 合肥寰景信息技术有限公司 一种语音即时识别系统
CN105609098A (zh) * 2015-12-18 2016-05-25 江苏易乐网络科技有限公司 一种基于互联网的在线学习系统
CN105895101A (zh) * 2016-06-08 2016-08-24 国网上海市电力公司 用于电力智能辅助服务系统的语音处理设备及处理方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230396A (zh) * 2017-07-21 2017-10-03 渭南师范学院 一种汉语在线教学终端及方法
CN107274739A (zh) * 2017-08-08 2017-10-20 渭南师范学院 远程教学方法
CN109255988A (zh) * 2018-07-11 2019-01-22 北京美高森教育科技有限公司 基于错误发音检测的语言学习方法
CN110895936A (zh) * 2018-09-13 2020-03-20 珠海格力电器股份有限公司 基于家用电器的语音处理方法和装置
CN109637543A (zh) * 2018-12-12 2019-04-16 平安科技(深圳)有限公司 语音卡的语音数据处理方法和装置
CN109448460A (zh) * 2018-12-17 2019-03-08 广东小天才科技有限公司 一种背诵检测方法及用户设备
CN109686142A (zh) * 2018-12-29 2019-04-26 北京智能管家科技有限公司 一种内容跟读方法、装置、存储介质及电子设备
CN109712443A (zh) * 2019-01-02 2019-05-03 北京儒博科技有限公司 一种内容跟读方法、装置、存储介质及电子设备
CN111694622A (zh) * 2019-03-12 2020-09-22 上海流利说信息技术有限公司 一种跟读内容的展示方法、介质、装置和计算设备
CN110085260A (zh) * 2019-05-16 2019-08-02 上海流利说信息技术有限公司 一种单词音节重音识别校正方法、装置、设备以及介质

Similar Documents

Publication Publication Date Title
CN106504755A (zh) 一种错误发音的识别方法及装置、用户终端
CN107622054B (zh) 文本数据的纠错方法及装置
CN103400512B (zh) 一种学习辅助装置及其运行方法
CN109346059A (zh) 一种方言语音的识别方法及电子设备
US6931628B2 (en) Mangled strings for testing of internationalization
CN106056989A (zh) 一种语言学习方法及装置、终端设备
CN109635096A (zh) 一种听写提示方法及电子设备
CN109545184A (zh) 一种基于语音校准的背诵检测方法及电子设备
CN109634552A (zh) 一种应用于听写的报读控制方法及终端设备
RU2010152819A (ru) Визуализация обучающих анимаций на дисплее интерфейса пользователя
CN109410664A (zh) 一种发音纠正方法及电子设备
CN104658350A (zh) 一种英语教学系统
CN103680498A (zh) 一种语音识别方法和设备
CN104598122B (zh) 一种终端
CN107193914A (zh) 一种语音输入方法及移动终端
CN104123858A (zh) 一种读背课文时检错纠错的方法及装置
CN109165336A (zh) 一种信息输出控制方法及家教设备
CN108766431A (zh) 一种基于语音识别的自动唤醒方法及电子设备
CN109614623A (zh) 一种基于句法分析的作文处理方法及系统
CN101271636B (zh) 带有口语练习模块的点读机控制方法
CN110263334A (zh) 一种辅助外语学习的方法和可读存储介质
CN108804648A (zh) 一种基于语音搜索的生字词收录方法及电子设备
CN111079489B (zh) 一种内容识别方法及电子设备
EP1475776B1 (en) Dynamic pronunciation support for speech recognition training
CN114830230A (zh) 利用键盘宏功能的自动语音识别器及语音识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170315