CN109410984B - 一种朗读评分的方法及电子设备 - Google Patents
一种朗读评分的方法及电子设备 Download PDFInfo
- Publication number
- CN109410984B CN109410984B CN201811559398.7A CN201811559398A CN109410984B CN 109410984 B CN109410984 B CN 109410984B CN 201811559398 A CN201811559398 A CN 201811559398A CN 109410984 B CN109410984 B CN 109410984B
- Authority
- CN
- China
- Prior art keywords
- reading
- text information
- text
- information
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Abstract
本发明实施例涉及电子设备技术领域,公开一种朗读评分的方法及电子设备,该方法包括:获取文本图像并识别其上的文本信息,根据文本信息中的朗读要素生成对应的第一朗读规则,通过分析用户朗读该文本信息生成的语音信息,可生成语音信息对应的第二朗读规则,对比第一朗读规则与第二朗读规则中各朗读要素的匹配程度,可对该语音信息进行朗读评分。可见,通过本发明实施例,可对用户所提供的文本信息进行朗读评分。
Description
技术领域
本发明涉及电子设备技术领域,具体涉及一种朗读评分的方法及电子设备。
背景技术
如今已有部分家教机具备用于口语测试的朗读评分功能,用户可按照家教机中预设的文本信息进行朗读,从而家教机根据评分规则对用户朗读产生的语音数据进行评分。然而,上述朗读评分方法适用性不佳,用户只能按照家教机上预设的文本信息进行朗读检测,而用户需要朗读的文本通常为正在学习的课文,在没有与课文相匹配的文本信息的情况下,用户朗读预设文本信息的意义不大。可见,现有的朗读评分方法已不适用于用户的实际使用需求,亟需一种可对用户所提供的文本信息进行朗读评分的方法。
发明内容
针对上述缺陷,本发明实施例公开了一种朗读评分的方法及电子设备,用于解决现有技术中电子设备无法对用户所提供的文本信息进行朗读评分的缺陷,拓宽了电子设备的使用场景。
本发明实施例第一方面公开了一种朗读评分的方法,包括:
拍摄文本图像,并识别所述文本图像中的文本信息;
根据所述文本信息中包括的若干朗读要素,生成所述文本信息对应的第一朗读规则;
获取用户朗读所述文本信息生成的语音信息,生成所述语音信息对应的第二朗读规则;
根据所述第一朗读规则与所述第二朗读规则中各朗读要素的匹配程度,对所述语音信息进行朗读评分。
作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述文本信息中包括的若干朗读要素,生成所述文本信息对应的第一朗读规则,包括:
为所述文本信息中包括的若干朗读要素设定每一所述朗读要素对应的朗读停顿时长;
根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的朗读停顿时长进行排列生成所述文本信息对应的第一朗读规则,所述第一朗读规则包括每一所述朗读要素以及所述朗读要素对应的朗读停顿时长。
作为一种可选的实施方式,在本发明实施例第一方面中,所述获取用户朗读所述文本信息生成的语音信息,生成所述语音信息对应的第二朗读规则,包括:
分析所述语音信息中与所述文本信息的所述若干朗读要素对应的语音停顿时长;
根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的语音停顿时长进行排列生成所述语音信息对应的第二朗读规则,所述第二朗读规则包括每一所述朗读要素以及所述朗读要素对应的语音停顿时长。
作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述第一朗读规则与所述第二朗读规则中各朗读要素的匹配程度,对所述语音信息进行朗读评分,包括:
计算每一所述朗读要素对应的朗读停顿时长与语音停顿时长的时长差值;
统计所述若干朗读要素中所述时长差值大于预设时长差值的不合格要素的数量;
根据所述不合格要素的数量占所述若干朗读要素的数量的比例值,对所述语音信息进行朗读评分。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的朗读停顿时长进行排列生成所述文本信息对应的第一朗读规则之后,所述方法还包括:
根据所述文本信息对应的第一朗读规则生成教学语音信息,在接收到用户输入的针对所述文本信息的学习指令时,播放所述教学语音信息以供用户进行学习。
本发明实施例第二方面公开一种电子设备,包括:
获取单元,用于拍摄文本图像,并识别所述文本图像中的文本信息;
第一规则单元,用于根据所述文本信息中包括的若干朗读要素,生成所述文本信息对应的第一朗读规则;
第二规则单元,用于获取用户朗读所述文本信息生成的语音信息,生成所述语音信息对应的第二朗读规则;
朗读评分单元,用于根据所述第一朗读规则与所述第二朗读规则中各朗读要素的匹配程度,对所述语音信息进行朗读评分。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第一规则单元,具体用于为所述文本信息中包括的若干朗读要素设定每一所述朗读要素对应的朗读停顿时长;
以及根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的朗读停顿时长进行排列生成所述文本信息对应的第一朗读规则,所述第一朗读规则包括每一所述朗读要素以及所述朗读要素对应的朗读停顿时长。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第二规则单元,具体用于分析所述语音信息中与所述文本信息的所述若干朗读要素对应的语音停顿时长;
以及根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的语音停顿时长进行排列生成所述语音信息对应的第二朗读规则,所述第二朗读规则包括每一所述朗读要素以及所述朗读要素对应的语音停顿时长。
作为一种可选的实施方式,在本发明实施例第二方面中,所述朗读评分单元还包括:
差值子单元,用于计算每一所述朗读要素对应的朗读停顿时长与语音停顿时长的时长差值;
统计子单元,用于统计所述若干朗读要素中所述时长差值大于预设时长差值的不合格要素的数量;
评分子单元,用于根据所述不合格要素的数量占所述若干朗读要素的数量的比例值,对所述语音信息进行朗读评分。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
教学单元,用于在所述第一规则单元根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的朗读停顿时长进行排列生成所述文本信息对应的第一朗读规则之后,根据所述文本信息对应的第一朗读规则生成教学语音信息,在接收到用户输入的针对所述文本信息的学习指令时,播放所述教学语音信息以供用户进行学习。
本发明实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种朗读评分的方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种朗读评分的方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,电子设备拍摄并识别出文本图像上的文本信息,从而在数据库中查找文本信息包括的若干朗读要素,生成文本信息对应的第一朗读规则,再获取用户朗读文本信息生成的语音信息,生成语音信息对应的第二朗读规则,根据第一朗读规则与第二朗读规则中各朗读要素的匹配程度,对语音信息进行朗读评分。可见,实施本发明实施例,电子设备可获取用户所要进行朗读的文本,并在用户朗读文本后对用户的朗读语音进行评分。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种朗读评分的方法的流程示意图;
图2为本发明实施例提供的另一种朗读评分的方法的流程示意图;
图3为本发明实施例提供的一种电子设备的结构示意图;
图4是本发明实施例提供的另一种电子设备的结构示意图;
图5是本发明实施例提供的另一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种朗读评分的方法及电子设备,可以简化电子设备的操作流程,提升用户使用体验。以下从电子设备角度出发,结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种朗读评分的方法的流程示意图。如图1所示,该朗读评分的方法可以包括以下步骤。
101、拍摄文本图像,并识别文本图像中的文本信息。
本发明实施例中,电子设备可以包括但不仅限于家教机、智能手机以及平板电脑等电子设备,本发明实施例不作限定。
随着电子设备上学习辅助功能的发展,部分电子设备已具备朗读评分功能,用户在朗读评分功能中选取预先设定好的文本信息进行朗读,电子设备即可对用户朗读时产生的语音信息进行朗读评分,然而,由于预设文本信息的局限性,电子设备无法收录所有所需朗读的文本信息。
作为一种可选的实施方式,拍摄文本图像,并识别文本图像中的文本信息,可以通过以下方式实现:
为电子设备配备可连接于电子设备摄像头的反光镜,通过调整反光镜镜头的朝向,可方便地拍摄各种场景下的文本图像,如课本上、屏幕上或者黑板上的文本图像,并使用文字识别技术识别获取到的文本图像上的文本信息,从而可灵活地采集各种文本图像上的文本信息。
进一步地,考虑到文本图像上可能存在干扰信息,如课本上的页码及无关文字也会被识别到该文本图像对应的文本信息中,所以,电子设备在识别得到文本信息后,在显示屏上显示文本信息,以方便用户检查所识别到的文本信息是否准确,用户在发现无效文本或者错误文本时可进行删除或者编辑,从而得到准确的文本信息。可见,实施本发明实施例,可准确地得到文本图像上用户所需的文本信息。
102、根据文本信息中包括的若干朗读要素,生成文本信息对应的第一朗读规则。
本发明实施例中,文本信息的朗读要素是指:对于文本信息中的词汇应连贯朗读,朗读至文本信息中标点符号所在的位置时应根据标点符号停顿不同的时长,朗读至段落结束时应停顿等影响朗读停顿时长的要素信息。
作为一种可选的实施方式,电子设备为文本信息中包括的若干朗读要素设定每一朗读要素对应的朗读停顿时长;根据若干朗读要素在文本信息中的排列顺序,对若干朗读要素中每一朗读要素对应的朗读停顿时长进行排列生成文本信息对应的第一朗读规则,第一朗读规则包括每一朗读要素以及朗读要素对应的朗读停顿时长,可以通过以下方式实现:
检测文本信息中各文字所构成的朗读要素,如识别到的文本信息为“惊慌失措的老鼠,气势汹汹的猫”,根据数据库检测到“惊慌失措”、“气势汹汹”及标点符号“,”为该文本信息的朗读要素,为“惊慌失措”及“气势汹汹”设定0.1秒的朗读停顿时长,为标点符号“,”设定0.5秒的停顿时长,此时可根据朗读要素在文本信息中的排列顺序,从而得到该文本信息对应的第一朗读规则:惊慌失措(“惊慌失措”每个文字的停顿时长为0.1秒)的老鼠,(在“,”处停顿0.5秒)气势汹汹(“气势汹汹”每个文字的停顿时长为0.1秒)的猫。可见,实施本发明实施例,可针对文本信息准确地生成第一朗读规则。
103、获取用户朗读文本信息生成的语音信息,生成语音信息对应的第二朗读规则。
本发明实施例中,检测用户输入的与文本信息对应的语音信息,可得到文本信息中各朗读要素对应的语音信息,通过分析语音信息即可获取语音信息各部分所对应的停顿时长。
作为一种可选的实施方式,电子设备分析语音信息中与文本信息的若干朗读要素对应的语音停顿时长;根据若干朗读要素在文本信息中的排列顺序,对若干朗读要素中每一朗读要素对应的语音停顿时长进行排列生成语音信息对应的第二朗读规则,第二朗读规则包括每一朗读要素以及朗读要素对应的语音停顿时长,可以通过以下方式实现:
对于用户朗读文本信息“惊慌失措的老鼠,气势汹汹的猫”所产生的语音信息,使用语音识别技术可识别得到用户朗读上述文本信息时每个朗读要素对应的语音停顿时长,如识别到“惊慌失措”及“气势汹汹”的语音停顿时长为0.12秒,标点符号“,”的语音停顿时长为1秒,从而得到该语音信息对应的第二朗读规则:惊慌失措(“惊慌失措”每个文字的停顿时长为0.12秒)的老鼠,(在“,”处停顿了1秒)气势汹汹(“气势汹汹”每个文字的停顿时长为0.12秒)的猫。可见,通过对用户朗读所产生的语音信息的语音停顿时长进行量化,可准确得到用户语音信息对应的第二朗读规则。
104、根据第一朗读规则与第二朗读规则中各朗读要素的匹配程度,对语音信息进行朗读评分。
本发明实施例中,根据用户语音信息对应的第二朗读规则与第一朗读规则的匹配程度,即可对用户此次朗读进行量化评分。
作为一种可选的实施方式,计算每一朗读要素对应的朗读停顿时长与语音停顿时长的时长差值;统计若干朗读要素中时长差值大于预设时长差值的不合格要素的数量;根据不合格要素的数量占若干朗读要素的数量的比例值,对语音信息进行朗读评分,可以通过以下方式实现:
对于步骤102和步骤103中根据相同文本信息“惊慌失措的老鼠,气势汹汹的猫”所获得的第一朗读规则和第二朗读规则,计算得到“惊慌失措”及“气势汹汹”对应的朗读停顿时长与语音停顿时长的时长差值为0.12-0.1=0.02秒,标点符号“,”对应的朗读停顿时长与语音停顿时长的时长差值为1-0.5=0.5秒,此时朗读评分功能中的预设时长差值为0.3s,可见标点符号“,”对应的时长差值0.5秒大于预设时长差值的0.3秒,可认为用户对朗读过程中逗号的停顿时长掌握不足,此时将语音信息中的标点符号“,”设为不合格要素,该语音信息中包含有3个朗读要素,其中1个朗读要素为不合格要素,该语音信息中的不合格要素占朗读要素的比例值为1/3,按照百分制可为该语音信息设定67分的朗读评分。可见,通过对朗读要素进行量化,可衡量用户在朗读过程中对文本信息的掌握程度,从而较为准确地对用户进行朗读评分。
可见,本发明实施例中,通过获取文本图像并识别其上的文本信息,可根据文本信息中的朗读要素生成对应的第一朗读规则,通过分析用户朗读该文本信息生成的语音信息,可生成语音信息对应的第二朗读规则,对比第一朗读规则与第二朗读规则中各朗读要素的匹配程度,可对该语音信息进行朗读评分,从而通过上述方法对用户所提供的文本信息进行朗读评分。
实施例二
请参阅图2,图2为本发明另一实施例提供的朗读评分的方法的流程示意图。如图2所示,该朗读评分的方法可以包括以下步骤。
201、拍摄文本图像,并识别文本图像中的文本信息。
本发明实施例中,文本信息可为用户所拍摄的文本图像上用户所需的文字、标点符号及段落信息。
202、根据文本信息中包括的若干朗读要素,生成文本信息对应的第一朗读规则。
本发明实施例中,朗读要素是指文本信息中需连贯朗读的词汇以及朗读时需停顿的标点符号等影响朗读停顿时长的要素信息。
203、根据文本信息对应的第一朗读规则生成教学语音信息,在接收到用户输入的针对文本信息的学习指令时,播放教学语音信息以供用户进行学习。
本发明实施例中,考虑到用户在初次进行朗读时可能因文本信息中的存在陌生词汇等情况,而造成朗读评分偏低,所以,应在用户朗读文本信息之前,向用户提供该文本信息对应的朗读教学。
作为一种可选的实施方式,在步骤202根据若干朗读要素在文本信息中的排列顺序,对若干朗读要素中每一朗读要素对应的朗读停顿时长进行排列生成文本信息对应的第一朗读规则之后,根据文本信息对应的第一朗读规则生成教学语音信息,在接收到用户输入的针对文本信息的学习指令时,播放教学语音信息以供用户进行学习,可以通过以下方式实现:
电子设备生成文本信息对应的初始语音信息,初始语音信息中各文本的朗读停顿时长是一致的,根据第一朗读规则中对初始语音信息中各朗读要素对应的语音停顿时长进行调整,得到调整完成后的教学语言信息,从而用户可在朗读文本信息之前,在电子设备上输入学习指令,从而电子设备播放文本信息对应的教学语音信息供用户学习。可见,通过实施本发明实施例,电子设备还可帮助用户的进行朗读学习。
204、获取用户朗读文本信息生成的语音信息,生成语音信息对应的第二朗读规则。
本发明实施例中,检测用户输入的与文本信息对应的语音信息,可得到文本信息中各朗读要素对应的语音信息,通过分析语音信息即可获取语音信息各部分所对应的停顿时长。
205、根据第一朗读规则与第二朗读规则中各朗读要素的匹配程度,对语音信息进行朗读评分。
本发明实施例中,根据用户语音信息对应的第二朗读规则与第一朗读规则的匹配程度,即可对用户此次朗读进行量化评分。
可见,通过实施本发明实施例,电子设备除了为用户提供朗读评分,还可帮助用户学习如何正确地朗读文本信息。
实施例三
请参阅图3,图3为本发明实施例公开的一种电子设备的结构示意图。如图3所示,该电子设备可以包括:
获取单元301,用于拍摄文本图像,并识别文本图像中的文本信息;
第一规则单元302,用于根据文本信息中包括的若干朗读要素,生成文本信息对应的第一朗读规则;
第二规则单元303,用于获取用户朗读文本信息生成的语音信息,生成语音信息对应的第二朗读规则;
朗读评分单元304,用于根据第一朗读规则与第二朗读规则中各朗读要素的匹配程度,对语音信息进行朗读评分。
上述朗读评分单元304具体包括:
差值子单元305,用于计算每一朗读要素对应的朗读停顿时长与语音停顿时长的时长差值;
统计子单元306,用于统计若干朗读要素中时长差值大于预设时长差值的不合格要素的数量;
评分子单元307,用于根据不合格要素的数量占若干朗读要素的数量的比例值,对语音信息进行朗读评分。
本发明实施例中,获取单元301获取用户所需朗读的文本信息,第一规则单元302根据文本信息生成第一朗读规则,第二规则单元303根据用户朗读文本信息产生的语音信息生成第二朗读规则,从而朗读评分单元根据第一朗读规则和第二朗读规则对用户的语音信息进行朗读评分。
作为一种可选的实施方式,获取单元301拍摄文本图像,并识别文本图像中的文本信息,可以通过以下方式实现:
为电子设备配备可连接于电子设备摄像头的反光镜,通过调整反光镜镜头的朝向,获取单元301可方便地拍摄各种场景下的文本图像,如课本上、屏幕上或者黑板上的文本图像,并使用文字识别技术识别获取到的文本图像上的文本信息,从而可灵活地采集各种文本图像上的文本信息。
进一步地,考虑到文本图像上可能存在干扰信息,如课本上的页码及无关文字也会被识别到该文本图像对应的文本信息中,所以,获取单元301在识别得到文本信息后,在显示屏上显示文本信息,以方便用户检查所识别到的文本信息是否准确,用户在发现无效文本或者错误文本时可进行删除或者编辑,从而得到准确的文本信息。可见,实施本发明实施例,可准确地得到文本图像上用户所需的文本信息。
作为一种可选的实施方式,第一规则单元302为文本信息中包括的若干朗读要素设定每一朗读要素对应的朗读停顿时长;根据若干朗读要素在文本信息中的排列顺序,对若干朗读要素中每一朗读要素对应的朗读停顿时长进行排列生成文本信息对应的第一朗读规则,第一朗读规则包括每一朗读要素以及朗读要素对应的朗读停顿时长,可以通过以下方式实现:
第一规则单元302检测文本信息中各文字所构成的朗读要素,如识别到的文本信息为“惊慌失措的老鼠,气势汹汹的猫”,根据数据库检测到“惊慌失措”、“气势汹汹”及标点符号“,”为该文本信息的朗读要素,为“惊慌失措”及“气势汹汹”设定0.1秒的朗读停顿时长,为标点符号“,”设定0.5秒的停顿时长,此时可根据朗读要素在文本信息中的排列顺序,从而得到该文本信息对应的第一朗读规则:惊慌失措(“惊慌失措”每个文字的停顿时长为0.1秒)的老鼠,(在“,”处停顿0.5秒)气势汹汹(“气势汹汹”每个文字的停顿时长为0.1秒)的猫。可见,实施本发明实施例,可针对文本信息准确地生成第一朗读规则。
作为一种可选的实施方式,第二规则单元303分析语音信息中与文本信息的若干朗读要素对应的语音停顿时长;根据若干朗读要素在文本信息中的排列顺序,对若干朗读要素中每一朗读要素对应的语音停顿时长进行排列生成语音信息对应的第二朗读规则,第二朗读规则包括每一朗读要素以及朗读要素对应的语音停顿时长,可以通过以下方式实现:
第二规则单元303对于用户朗读文本信息“惊慌失措的老鼠,气势汹汹的猫”所产生的语音信息,使用语音识别技术可识别得到用户朗读上述文本信息时每个朗读要素对应的语音停顿时长,如识别到“惊慌失措”及“气势汹汹”的语音停顿时长为0.12秒,标点符号“,”的语音停顿时长为1秒,从而得到该语音信息对应的第二朗读规则:惊慌失措(“惊慌失措”每个文字的停顿时长为0.12秒)的老鼠,(在“,”处停顿了1秒)气势汹汹(“气势汹汹”每个文字的停顿时长为0.12秒)的猫。可见,通过对用户朗读所产生的语音信息的语音停顿时长进行量化,可准确得到用户语音信息对应的第二朗读规则。
作为一种可选的实施方式,差值子单元305计算每一朗读要素对应的朗读停顿时长与语音停顿时长的时长差值;统计子单元306统计若干朗读要素中时长差值大于预设时长差值的不合格要素的数量;评分子单元307根据不合格要素的数量占若干朗读要素的数量的比例值,对语音信息进行朗读评分,可以通过以下方式实现:
差值子单元305对于第一规则单元302和第二规则单元303中根据相同文本信息“惊慌失措的老鼠,气势汹汹的猫”所获得的第一朗读规则和第二朗读规则,计算得到“惊慌失措”及“气势汹汹”对应的朗读停顿时长与语音停顿时长的时长差值为0.12-0.1=0.02秒,标点符号“,”对应的朗读停顿时长与语音停顿时长的时长差值为1-0.5=0.5秒,此时朗读评分功能中的预设时长差值为0.3s,可见标点符号“,”对应的时长差值0.5秒大于预设时长差值的0.3秒,可认为用户对朗读过程中逗号的停顿时长掌握不足,此时将语音信息中的标点符号“,”设为不合格要素,该语音信息中包含有3个朗读要素,其中1个朗读要素为不合格要素,该语音信息中的不合格要素占朗读要素的比例值为1/3,按照百分制评分子单元307可为该语音信息设定67分的朗读评分。可见,通过对朗读要素进行量化,可衡量用户在朗读过程中对文本信息的掌握程度,从而较为准确地对用户进行朗读评分。
通过实施图3的电子设备,获取单元301获取文本图像并识别其上的文本信息,第一规则单元302可根据文本信息中的朗读要素生成对应的第一朗读规则,第二规则单元303通过分析用户朗读该文本信息生成的语音信息,可生成语音信息对应的第二朗读规则,朗读评分单元304对比第一朗读规则与第二朗读规则中各朗读要素的匹配程度,可对该语音信息进行朗读评分,从而通过上述方法对用户所提供的文本信息进行量化评分。
实施例四
请参阅图4,图4为本发明另一实施例提供的一种电子设备的结构示意图;图4所示的电子设备是在图3所示的电子设备的基础上进行优化得到的,图4所示的电子设备还可以包括:
教学单元401,用于在第一规则单元302根据若干朗读要素在文本信息中的排列顺序,对若干朗读要素中每一朗读要素对应的朗读停顿时长进行排列生成文本信息对应的第一朗读规则之后,根据文本信息对应的第一朗读规则生成教学语音信息,在接收到用户输入的针对文本信息的学习指令时,播放教学语音信息以供用户进行学习。
本发明实施例中,本发明实施例中,考虑到用户在初次进行朗读时可能因文本信息中的存在陌生词汇等情况,而造成朗读评分偏低,所以,应在用户朗读文本信息之前,向用户提供该文本信息对应的朗读教学。
作为一种可选的实施方式,在第一规则单元302根据若干朗读要素在文本信息中的排列顺序,对若干朗读要素中每一朗读要素对应的朗读停顿时长进行排列生成文本信息对应的第一朗读规则之后,教学单元401根据文本信息对应的第一朗读规则生成教学语音信息,在接收到用户输入的针对文本信息的学习指令时,播放教学语音信息以供用户进行学习,可以通过以下方式实现:
教学单元401生成文本信息对应的初始语音信息,初始语音信息中各文本的朗读停顿时长是一致的,根据第一朗读规则中对初始语音信息中各朗读要素对应的语音停顿时长进行调整,得到调整完成后的教学语言信息,从而用户可在朗读文本信息之前输入学习指令,从而教学单元401播放文本信息对应的教学语音信息供用户学习。可见,通过实施本发明实施例,教学单元401还可帮助用户的进行朗读学习。
可见,通过实施本发明实施例,除了朗读评分单元307可为用户提供朗读评分之外,教学单元401还可帮助用户学习如何正确地朗读文本信息。
实施例五
请参阅图5,图5是本发明另一实施例公开的另一种电子设备的结构示意图。如图5所示,该可电子设备可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行图1和图2任意一种朗读评分的方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1和图2任意一种朗读评分的方法。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种朗读评分的方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种朗读评分的方法,其特征在于,应用于电子设备中,所述电子设备配备有可连接于摄像头的反光镜,包括:
通过调整反光镜镜头的朝向拍摄文本图像,并识别所述文本图像中的文本信息,所述文本信息包括文字、标点符号和段落信息;
在显示屏上显示所述文本信息,以便用户检查所述文本信息是否准确、并在发现无效文本或错误文本时进行删除或编辑;
根据所述文本信息中包括的若干朗读要素,生成所述文本信息对应的第一朗读规则;获取用户朗读所述文本信息生成的语音信息,生成所述语音信息对应的第二朗读规则;
计算每一所述朗读要素对应的朗读停顿时长与语音停顿时长的时长差值;统计所述若干朗读要素中所述时长差值大于预设时长差值的不合格要素的数量;根据所述不合格要素的数量占所述若干朗读要素的数量的比例值,对所述语音信息进行朗读评分。
2.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息中包括的若干朗读要素,生成所述文本信息对应的第一朗读规则,包括:
为所述文本信息中包括的若干朗读要素设定每一所述朗读要素对应的朗读停顿时长;
根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的朗读停顿时长进行排列生成所述文本信息对应的第一朗读规则,所述第一朗读规则包括每一所述朗读要素以及所述朗读要素对应的朗读停顿时长。
3.根据权利要求1所述方法,其特征在于,所述获取用户朗读所述文本信息生成的语音信息,生成所述语音信息对应的第二朗读规则,包括:
分析所述语音信息中与所述文本信息的所述若干朗读要素对应的语音停顿时长;
根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的语音停顿时长进行排列生成所述语音信息对应的第二朗读规则,所述第二朗读规则包括每一所述朗读要素以及所述朗读要素对应的语音停顿时长。
4.根据权利要求1~3任一项所述的方法,其特征在于,在所述根据所述文本信息中包括的若干朗读要素,生成所述文本信息对应的第一朗读规则之后,所述方法还包括:
根据所述文本信息对应的第一朗读规则生成教学语音信息,在接收到用户输入的针对所述文本信息的学习指令时,播放所述教学语音信息以供用户进行学习。
5.一种电子设备,其特征在于,所述电子设备配置有可连接于摄像头的反光镜,包括:
获取单元,用于通过调整反光镜镜头的朝向拍摄文本图像,并识别所述文本图像中的文本信息,所述文本信息包括文字、标点符号和段落信息;
第一规则单元,用于根据所述文本信息中包括的若干朗读要素,生成所述文本信息对应的第一朗读规则;
第二规则单元,用于获取用户朗读所述文本信息生成的语音信息,生成所述语音信息对应的第二朗读规则;
朗读评分单元,用于根据所述第一朗读规则与所述第二朗读规则中各朗读要素的匹配程度,对所述语音信息进行朗读评分;
所述电子设备还包括用于在显示屏上显示所述文本信息,以便用户检查所述文本信息是否准确、并在发现无效文本或错误文本时进行删除或编辑的单元;
所述朗读评分单元还包括:
差值子单元,用于计算每一所述朗读要素对应的朗读停顿时长与语音停顿时长的时长差值;
统计子单元,用于统计所述若干朗读要素中所述时长差值大于预设时长差值的不合格要素的数量;
评分子单元,用于根据所述不合格要素的数量占所述若干朗读要素的数量的比例值,对所述语音信息进行朗读评分。
6.根据权利要求5所述的电子设备,其特征在于:
所述第一规则单元,具体用于为所述文本信息中包括的若干朗读要素设定每一所述朗读要素对应的朗读停顿时长;
以及根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的朗读停顿时长进行排列生成所述文本信息对应的第一朗读规则,所述第一朗读规则包括每一所述朗读要素以及所述朗读要素对应的朗读停顿时长。
7.根据权利要求5所述的电子设备,其特征在于:
所述第二规则单元,具体用于分析所述语音信息中与所述文本信息的所述若干朗读要素对应的语音停顿时长;
以及根据所述若干朗读要素在所述文本信息中的排列顺序,对所述若干朗读要素中每一所述朗读要素对应的语音停顿时长进行排列生成所述语音信息对应的第二朗读规则,所述第二朗读规则包括每一所述朗读要素以及所述朗读要素对应的语音停顿时长。
8.根据权利要求5~7任一项所述的电子设备,其特征在于,所述电子设备还包括:
教学单元,用于在所述第一规则单元根据所述文本信息包括的若干朗读要素,生成所述文本信息对应的第一朗读规则之后,根据所述文本信息对应的第一朗读规则生成教学语音信息,在接收到用户输入的针对所述文本信息的学习指令时,播放所述教学语音信息以供用户进行学习。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811559398.7A CN109410984B (zh) | 2018-12-20 | 2018-12-20 | 一种朗读评分的方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811559398.7A CN109410984B (zh) | 2018-12-20 | 2018-12-20 | 一种朗读评分的方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109410984A CN109410984A (zh) | 2019-03-01 |
CN109410984B true CN109410984B (zh) | 2022-12-27 |
Family
ID=65460965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811559398.7A Active CN109410984B (zh) | 2018-12-20 | 2018-12-20 | 一种朗读评分的方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109410984B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111031232B (zh) * | 2019-04-24 | 2022-01-28 | 广东小天才科技有限公司 | 一种听写实时检测的方法及电子设备 |
CN111026352A (zh) * | 2019-05-05 | 2020-04-17 | 广东小天才科技有限公司 | 一种学习内容获取方法及学习设备 |
CN112750423B (zh) * | 2019-10-29 | 2023-11-17 | 阿里巴巴集团控股有限公司 | 个性化语音合成模型构建方法、装置、系统及电子设备 |
CN111899576A (zh) * | 2020-07-23 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 发音测试应用的控制方法、装置、存储介质和电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080306738A1 (en) * | 2007-06-11 | 2008-12-11 | National Taiwan University | Voice processing methods and systems |
CN101739868A (zh) * | 2008-11-19 | 2010-06-16 | 中国科学院自动化研究所 | 一种用于口语测试的文本朗读水平自动评估诊断方法 |
CN103151042A (zh) * | 2013-01-23 | 2013-06-12 | 中国科学院深圳先进技术研究院 | 全自动口语评测管理与评分系统及其评分方法 |
CN104361895A (zh) * | 2014-12-04 | 2015-02-18 | 上海流利说信息技术有限公司 | 语音质量评价设备、方法和系统 |
CN106847260A (zh) * | 2016-12-20 | 2017-06-13 | 山东山大鸥玛软件股份有限公司 | 一种基于特征融合的英语口语自动评分方法 |
CN107578004A (zh) * | 2017-08-30 | 2018-01-12 | 苏州清睿教育科技股份有限公司 | 基于图像识别和语音交互的学习方法及系统 |
CN108428382A (zh) * | 2018-02-14 | 2018-08-21 | 广东外语外贸大学 | 一种口语复述评分方法及系统 |
-
2018
- 2018-12-20 CN CN201811559398.7A patent/CN109410984B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080306738A1 (en) * | 2007-06-11 | 2008-12-11 | National Taiwan University | Voice processing methods and systems |
CN101739868A (zh) * | 2008-11-19 | 2010-06-16 | 中国科学院自动化研究所 | 一种用于口语测试的文本朗读水平自动评估诊断方法 |
CN103151042A (zh) * | 2013-01-23 | 2013-06-12 | 中国科学院深圳先进技术研究院 | 全自动口语评测管理与评分系统及其评分方法 |
CN104361895A (zh) * | 2014-12-04 | 2015-02-18 | 上海流利说信息技术有限公司 | 语音质量评价设备、方法和系统 |
CN106847260A (zh) * | 2016-12-20 | 2017-06-13 | 山东山大鸥玛软件股份有限公司 | 一种基于特征融合的英语口语自动评分方法 |
CN107578004A (zh) * | 2017-08-30 | 2018-01-12 | 苏州清睿教育科技股份有限公司 | 基于图像识别和语音交互的学习方法及系统 |
CN108428382A (zh) * | 2018-02-14 | 2018-08-21 | 广东外语外贸大学 | 一种口语复述评分方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109410984A (zh) | 2019-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635772B (zh) | 一种听写内容的批改方法及电子设备 | |
CN109410984B (zh) | 一种朗读评分的方法及电子设备 | |
CN110085261B (zh) | 一种发音纠正方法、装置、设备以及计算机可读存储介质 | |
CN109817046B (zh) | 一种基于家教设备的学习辅助方法及家教设备 | |
CN109960809B (zh) | 一种听写内容的生成方法及电子设备 | |
CN110956138B (zh) | 一种基于家教设备的辅助学习方法及家教设备 | |
CN109597943B (zh) | 一种基于场景的学习内容推荐方法及学习设备 | |
CN109462603A (zh) | 基于盲检测的声纹认证方法、设备、存储介质及装置 | |
CN111026949A (zh) | 一种基于电子设备的搜题方法及系统 | |
CN111079483A (zh) | 一种书写规范判断方法及电子设备 | |
CN111739534B (zh) | 一种辅助语音识别的处理方法、装置、电子设备及存储介质 | |
CN109086431B (zh) | 一种知识点巩固学习方法及电子设备 | |
CN111077996A (zh) | 一种基于点读的信息推荐方法及学习设备 | |
CN111027537A (zh) | 一种搜题方法及电子设备 | |
CN112347997A (zh) | 一种试题检测识别方法、装置、电子设备及介质 | |
CN111079501B (zh) | 一种文字识别方法及电子设备 | |
KR101747712B1 (ko) | 스마트폰을 통한 면접 자동인식 실시간관리방법 | |
CN111026786A (zh) | 一种听写列表生成方法及家教设备 | |
CN111026924A (zh) | 一种待搜索内容的获取方法及电子设备 | |
CN113657509A (zh) | 教学训练提升方法、装置、终端和存储介质 | |
CN111079504A (zh) | 一种文字识别方法及电子设备 | |
CN111079489B (zh) | 一种内容识别方法及电子设备 | |
CN111027353A (zh) | 一种搜索内容的提取方法及电子设备 | |
CN111081227B (zh) | 一种听写内容的识别方法及电子设备 | |
CN109710735B (zh) | 基于多社交渠道的朗读内容推荐方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |