CN113486970A

CN113486970A - 阅读能力评测方法及装置

Info

Publication number: CN113486970A
Application number: CN202110803244.3A
Authority: CN
Inventors: 吴延年; 王东永; 钱程
Original assignee: Beijing Quanfutureeducation Technology Co ltd
Current assignee: Beijing Quanfutureeducation Technology Co ltd
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2021-10-08
Anticipated expiration: 2041-07-15
Also published as: CN113486970B

Abstract

本发明公开了一种阅读能力评测方法及装置。其中，该方法包括：获取阅读音频，其中，阅读音频为对阅读对象进行朗读得到的音频；对阅读音频进行处理，得到朗读测评结果；基于朗读测评结果，获得阅读能力测评结果。本发明解决了相关技术中进行阅读测评时，出现的测评过程复杂、测评效率较低的技术问题。

Description

阅读能力评测方法及装置

技术领域

本发明涉及计算机领域，具体而言，涉及一种阅读能力评测方法及装置。

背景技术

为了能给出学生能力级别，并能给出具体的阅读行为分析，用于针对性地指导教学，相关技术中采用了基于阅读行为分析的阅读能力测评方法,目前依赖老师和学生1对1完成。采用上述测评方法时，通过让学生朗读、复述特定难度读文章，然后通过记录分级朗读、复述过程中的行为来对学生的阅读能力进行测评。这种测评方法主要流程如下：老师选择特定难度的测评文章给学生，学生首先朗读文章，在朗读过程中老师详细记录学生的朗读行为，包括：语速、单词朗读错误及错误类型、自我纠正、不流利单词等。然后让学生复述文章内容，如果复述不完整，给予提示性问题让学生回答，并记录复述、问答结果的正确程度、语速等结果。老师根据记录的信息，综合判断学生能力符合、超出还是低于文章难度。通过调整文章难度多次测试可以确定与学生能力匹配的文章难度。但是采用上述测评方法时，会出现测评过程复杂，测评效率较低的问题。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种阅读能力评测方法及装置，以至少解决相关技术中进行阅读测评时，出现的测评过程复杂、测评效率较低的技术问题。

根据本发明实施例的一个方面，提供了一种阅读能力测评方法，包括：获取阅读音频，其中，所述阅读音频为对阅读对象进行朗读得到的音频；对所述阅读音频进行处理，得到朗读测评结果；基于所述朗读测评结果，获得阅读能力测评结果。

可选地，所述对所述阅读音频进行处理，得到朗读测评结果，包括：对所述阅读音频进行识别，得到单词级的识别结果；基于得到的单词级的识别结果，得到单词级的朗读测评结果。

可选地，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括以下至少之一：将得到的单词级的识别结果与所述阅读对象的单词进行比较，确定重复读单词；将得到的单词级的识别结果与所述阅读对象的单词进行比较，确定自我纠正单词；基于得到的单词级的识别结果，确定发音错误单词。

可选地，所述基于得到的单词级的识别结果，确定发音错误单词，包括：基于得到的单词级的识别结果，得到单词中音素的发音质量；基于单词中音素的发音质量确定所述单词的发音质量；在所述单词的发音质量低于第一预定阈值的情况下，确定所述单词为发音错误单词。

可选地，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，获取朗读所述阅读对象中朗读内容的单词数量，以及所述朗读内容所花费的时间；基于所述单词数量和所述时间，确定朗读的语速。

可选地，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，获得置信度高于预定阈值的有效单词；获得所述有效单词所包括的音素的平均发音质量参数；基于所述有效单词的平均发音质量参数，得到所述有效单词的归一化发音参数，并将所述归一化发音参数确定为发音水平。

可选地，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，得到单词从起始帧到结束帧的基音；基于单词从起始帧到结束帧的基音，获得所述单词的对数域基音均值；基于所述单词的对数域基音均值，采用支持向量机分类器，得到所述单词的升降调信息。

可选地，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果,确定单词的重音音节和轻音音节的对数域基音均值差值；在所述对数域基音均值差值大于第二预定阈值的情况下，确定重音位置正确。

可选地，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，得到朗读正确的单词数量；基于朗读正确的单词数量，以及所述阅读对象的总单词数量，确定朗读正确率。

可选地，所述基于所述朗读测评结果，获得阅读能力测评结果，包括：输出阅读理解选择题；接收针对所述阅读理解选择题所进行的作答，以及基于所述作答确定答题正确率；基于所述朗读测评结果，以及所述答题正确率，获得所述阅读能力测评结果。

可选地，所述基于所述朗读测评结果，以及所述答题正确率，获得所述阅读能力测评结果，包括：接收复述所述阅读对象的复述音频；对所述复述音频进行识别，得到复述识别结果；接收答题音频；对所述答题音频进行识别，得到答题识别结果；基于所述复述识别结果和所述答题识别结果，提取复述答题的测评特征；基于复述答题的测评特征，得到复述答题的测评结果；基于所述朗读测评结果，所述答题正确率，以及所述复述答题的测评结果，获得所述阅读能力测评结果。

可选地，所述基于所述朗读测评结果，所述答题正确率，以及所述复述答题的测评结果，获得所述阅读能力测评结果，包括：基于所述朗读测评结果，所述答题正确率，以及所述复述答题的测评结果，得到综合能力得分；基于所述综合能力得分，确定阅读能力与阅读对象的难易程度之间的匹配度。

可选地，在基于所述朗读测评结果，获得阅读能力测评结果之后，还包括：生成测评报告，并输出生成的所述测评报告。

根据本发明实施例的另一方面，还提供了一种阅读能力测评装置，包括：获取模块，用于获取阅读音频，其中，所述阅读音频为对阅读对象进行朗读得到的音频；处理模块，用于对所述阅读音频进行处理，得到朗读测评结果；获得模块，用于基于所述朗读测评结果，获得阅读能力测评结果。

在本发明实施例中，采用获得阅读对象朗读的阅读音频的方式，对该音频进行处理得到朗读测评结果，从而得到阅读能力测评结果，达到了直接依据阅读音频即可得到阅读能力评测结果的目的，进而解决了相关技术中进行阅读测评时，出现的测评过程复杂、测评效率较低技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的阅读能力测评方法；

图2是本发明可选实施方式提供的测评系统核心模块的流程图；

图3是本发明可选实施方式提供的交互测评模块的流程图；

图4是本发明可选实施方式提供的文章测试的流程图；

图5是根据本发明实施例的阅读能力测评装置的结构框图；

图6是根据一示例性实施例示出的一种终端的结构框图。

具体实施方式

根据本发明实施例，提供了一种阅读能力测评方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的阅读能力测评方法，如图1所示，该方法包括如下步骤：

步骤S102，获取阅读音频，其中，阅读音频为对阅读对象进行朗读得到的音频；

步骤S104，对阅读音频进行处理，得到朗读测评结果；

步骤S106，基于朗读测评结果，获得阅读能力测评结果。

通过上述步骤，采用获得阅读对象朗读的阅读音频的方式，对该音频进行处理得到朗读测评结果，从而得到阅读能力测评结果，达到了直接依据阅读音频即可得到阅读能力评测结果的目的，进而解决了相关技术中进行阅读测评时，出现的测评过程复杂、测评效率较低的技术问题。

作为一种可选的实施例，获得阅读音频，其中，阅读音频为阅读对象进行朗读得到的音频。其中，阅读对象进行朗读的音频可以是基于系统推送的测试文章进行朗读的，也可以用户自行选取一段文章进行朗读的。在基于系统推送的测试文章情景中，系统可以根据用户的个人信息和历史测评记录预估用户能力级别，然后根据预估的能力级别推送相应级别的测试文章让用户进行文章阅读。还需要说明的是，该阅读音频的阅读时间可以进行预先设定，在基于系统推送的测试文章情景中，可以针对系统推送的测试文章长度或难度进行时间设定，令用户在指定时间内完成朗读，超出指定时间提醒用户，不再记录用户的朗读音频。在基于用户自行选取的一段文章情景中，用户可以自行设定时间进行朗读，保证有效地接收用户的朗读音频。

需要说明的是，阅读对象可以是多种语言的文本，例如，英语，日语，韩语，阿拉伯语，等等。特殊地，也可以是基于各地方言的文本，例如，粤语，闽南语，等等。丰富了阅读能力测评方法的应用，扩大了应用场景，使得可以适用于各种各样语言的阅读能力的测评。

作为一种可选的实施例，对阅读音频进行处理，得到朗读测评结果。其中，朗读测评结果可以包括多种项目，例如：单词级朗读行为、语速、发音水平、音调、单词重音，等等。举例说明，单词级朗读行为即用户在朗读过程中出现的单词级错误、不流利、自我监督等行为现象。主要有：漏读错误、替代错误、插入错误、重复读、自我纠正、单词发音错误等，以得到关于单词级朗读行为的朗读测评结果。语速可以包括多种不同的语速类型，通常情况下，可以选定包括两种语速，即每分钟朗读的单词数量与每分钟正确朗读单词的数量，得到关于语速的朗读测评结果。发音水平指用户整体发音准确度和标准母语发音的接近程度，将语音识别结果中单词识别置信度低于特定阈值的单词去除，剩下的单词作为有效识别单词，将有效单词的音素归一化发音得分作为衡量用户发音水平的指数，以得到关于发音水平的朗读测评结果。音调测评结果给出朗读过程中单词音调高低，以及单词的升降调判别，得到关于音调的朗读测评结果。单词重音测评检测用户朗读多音节单词时重音位置是否正确，单词重音在声学上主要体现在基音音高的不同，即重读音节的语音基音频率高于轻读音节。因此可以通过比较多音节单词不同音节的基音频率高低来判断重音位置是否正确，以得到关于单词重音的朗读测评结果。等等。通过上述多种类型的朗读测评结果，进行总体运算，得到综合性地朗读测评结果，能够更加全面的对用户的朗读音频进行判断，更准确有效地判断出每个用户的特性，得到针对该用户的全面性的结果，使用户能够更加清晰地认知到自己的朗读水平。

作为一种可选的实施例，对阅读音频进行识别，得到单词级的识别结果时，将阅读音频中的一段文章在识别过程中细化为一个个单词，有利于更好、更清晰地进行识别。能够识别出更细节的错误，找到更细微的漏洞，更有利于识别出用户的不足，以提升用户的能力。

作为一种可选的实施例，基于得到的单词级的识别结果，得到单词级的朗读测评结果，在朗读的测评结果包括单词级朗读行为时，可以包括以下多种方式，将得到的单词级的识别结果与阅读对象的单词进行比较，确定重复读单词；其中，确定重复读单词判定方法有很多，例如，当插入单词语音识别置信度高于特定阈值，且该单词与前后正确朗读单词一致，则判定为重复读单词。将得到的单词级的识别结果与阅读对象的单词进行比较，确定自我纠正单词，其中，确定自我纠正单词的方法也有很多，例如，设定一种自我纠正判定方法，当正确朗读单词之前出现插入错误且未判定为重复读时，如果插入单词和当前单词一致则判为自我纠正，如果插入单词和当前单词不一致，匹配二者音素级发音，如果存在部分相同发音，则判为自我纠正。通过上述方式可以判断出对单词的朗读质量，通过得到单词级的识别结果。

作为一种可选的实施例，基于得到的单词级的识别结果，确定发音错误单词，可以采用多种方式，例如，可以基于得到的单词级的识别结果，得到单词中音素的发音质量；基于单词中音素的发音质量确定单词的发音质量；在单词的发音质量低于第一预定阈值的情况下，确定单词为发音错误单词。在对发音的判别过程中，可以根据文章，判定发音中连音、助词、语气词的发音是否正确，以获得更细致的识别结果，以便得到更纯正的朗读发音。

作为一种可选的实施例，基于得到的单词级的识别结果，得到单词级的朗读测评结果，在朗读的测评结果包括语速时，可以采用多种方式，例如，基于得到的单词级的识别结果，获取朗读阅读对象中朗读内容的单词数量，以及朗读内容所花费的时间；基于单词数量和时间，确定朗读的语速。通过确定朗读过程中的语速，能够保证在朗读或是与人沟通的场景中时，能够把握好适中的语速，听起来更加清晰、流畅。此外，还可以在计算每分钟朗读的单词数量的基础上，可以计算每分钟正确朗读单词的数量，即基于得到的单词级的识别结果，得到朗读正确的单词数量；基于朗读正确的单词数量，以及阅读对象的总单词数量，确定朗读正确率。用户可以更加显著地看出自己朗读行为中的语速数据，能够更加全面的认识到自己的朗读水平。

作为一种可选的实施例，基于得到的单词级的识别结果，得到单词级的朗读测评结果，在朗读的测评结果包括发音水平时，基于得到的单词级的识别结果，获得置信度高于预定阈值的有效单词；获得有效单词所包括的音素的平均发音质量参数；基于有效单词的平均发音质量参数，得到有效单词的归一化发音参数，并将归一化发音参数确定为发音水平。用户可以事先制定自己想要学习的标准母音类型，以根据该标准母音衡量用户发音水平的指标，不同的标准母音所进行衡量发音水平的标准不尽相同，例如，在英语语言的阅读能力测评过程中，英语的发音又包括英音与美音，甚至在母语为英语的各个区域，所叙述英语的发音也不尽相同。所以用户可以根据自己的需求与偏好设置标准母音，以进行更好地学习。

作为一种可选的实施例，基于得到的单词级的识别结果，得到单词级的朗读测评结果，在朗读的测评结果包括音调时，基于得到的单词级的识别结果，得到单词从起始帧到结束帧的基音；基于单词从起始帧到结束帧的基音，获得单词的对数域基音均值；基于单词的对数域基音均值，采用支持向量机分类器，得到单词的升降调信息。其中，可以根据阅读文章的场景或者是表达出的情感色彩的不同，使用不同的语调进行朗读，以便训练用户朗读出的音频更具感情色彩，使闻者更能感同身受或者沉浸其中，达到更好地朗读效果。

作为一种可选的实施例，基于得到的单词级的识别结果，得到单词级的朗读测评结果，在朗读的测评结果包括单词重音时，基于得到的单词级的识别结果,确定单词的重音音节和轻音音节的对数域基音均值差值；在对数域基音均值差值大于第二预定阈值的情况下，确定重音位置正确。通过确定重音位置，在句中可以通过重音感受出表达出的要点，在一段文章中，重音能够加强文章所表达出的情绪递进，感受文章所表达出的重点。

作为一种可选的实施例，基于朗读测评结果，获得阅读能力测评结果。在基于系统推送的测试文章情景中，可以直接完成文章配套的阅读理解选择题，得到答题正确率。在基于用户自行选取一段文章进行朗读的情境中，用户可以自行录入相应文章的阅读理解选择题，也可以直接输入阅读理解选择题的正确率结果。

作为一种可选的实施例，输出阅读理解选择题；接收针对阅读理解选择题所进行的作答，以及基于作答确定答题正确率；基于朗读测评结果，以及答题正确率，获得阅读能力测评结果。除了对用户的朗读能力进行测试，还对用户的阅读理解能力进行测试，考验用户的理解力，全面地、综合性地评测用户语言能力。

作为一种可选的实施例，基于朗读测评结果，以及答题正确率，获得阅读能力测评结果，包括：接收复述阅读对象的复述音频；对复述音频进行识别，得到复述识别结果；接收答题音频；对答题音频进行识别，得到答题识别结果；基于复述识别结果和答题识别结果，提取复述答题的测评特征；基于复述答题的测评特征，得到复述答题的测评结果；基于朗读测评结果，答题正确率，以及复述答题的测评结果，获得阅读能力测评结果。其中，复述文章内容也是语言测评过程中很看重的一项能力，可以考验用户的对文章理解力，对文章的记忆力，对文章重点部分的提取，等等。有效地对用户的综合能力进行测试。

作为一种可选的实施例，基于朗读测评结果，答题正确率，以及复述答题的测评结果，获得阅读能力测评结果，包括：基于朗读测评结果，答题正确率，以及复述答题的测评结果，得到综合能力得分；基于综合能力得分，确定阅读能力与阅读对象的难易程度之间的匹配度。即可以根据朗读得分、阅读理解正确率和复述/问答得分来判读用户能力级别和设定规则判断能力是否匹配。如果能力高于或低于文章难度，可以执行以下操作，即调整难度级别，再次推送测试文章测试，直到测出用户能力级别后测试结束。

作为一种可选的实施例，在基于朗读测评结果，获得阅读能力测评结果之后，为了使用户能够更直观地感受到自己的语言能力，得到自己的语言能力测试结果，此时可以生成测评报告，并输出生成的测评报告。

基于上述实施例及可选实施例，提供了一种可选实施方式，下面具体说明。

在相关技术中，基于阅读行为分析的阅读能力测评方法目前依赖老师和学生1对1完成。该测评方法通过让学生朗读、复述特定难度读文章，然后通过记录分级朗读、复述过程中的行为来对学生的阅读能力进行测评。这种测评方式不仅能给出学生能力级别，还能给出具体的阅读行为分析，用于针对性地指导教学。这种测评方法主要流程如下：老师选择特定难度的测评文章给学生，学生首先朗读文章，在朗读过程中老师详细记录学生的朗读行为，包括：语速、单词朗读错误及错误类型、自我纠正、不流利单词等。然后让学生复述文章内容，如果复述不完整，给予提示性问题让学生回答，并记录复述、问答结果的正确程度、语速等结果。老师根据记录的信息，综合判断学生能力符合、超出还是低于文章难度。通过调整文章难度多次测试可以确定与学生能力匹配的文章难度。但由于测评过程复杂，需要语音互动，因此要靠老师一对一完成。测评效率较低，主要在一些发达国家的中小学的阅读教学课中运用。目前尚未有自动测评方法或工具出现。

为解决上述问题，相关技术中阅读能力自动测评方法主要采用IRT(ItemResponse Theory)理论，通过自适应推送阅读理解选择题来测评学生能力。测评过程中根据学生当前答题正确与否，自动调整下一题难度，完成一定数量的题目后即可确定学生能力级别。这种测评方式题型单一，只关注答题结果正确与否，虽然能够给出能力级别，但缺乏对阅读行为的具体分析，测评的全面性和对教学的指导作用无法和和基于阅读行为分析的阅读能力测评方法相比。但由于能够由计算机自动完成，目前普遍用于在线测评。

鉴于此，本发明可选实施方式中提供了一种将智能语音技术和基于阅读行为分析的阅读能力测评方法相结合的阅读能力评测测评方案，其能够，实现测评自动化，使得该测评不再依赖于老师，大大提高了测评效率、降低了测评成本。使得这种测评方法具备了大范围普及的可能。

图2是本发明可选实施方式提供的测评系统核心模块的流程图，如图2所示，整个测评系统包括3个核心模块：

(一)内容库

用于测评的文章、题目、标注数据库。内容库包括一定数量的按难度分级的测评文章，以及每篇文章会配备3～5道阅读理解题目以及3～5道问答题。

(二)交互测评模块

交互测评模块主要是用户以人机互动方式完成测评过程。

图3是本发明可选实施方式提供的交互测评模块的流程图，如图3所示，测评开始时会先根据用户的个人信息和历史测评记录预估用户能力级别，然后根据预估的能力级别推送相应级别的测试文章让用户进行文章测试，文章测试完成后系统自动评估用户能力与文章难度是否匹配。如果能力匹配则测试结束，进入后续报告生成模块。如果能力高于或低于文章难度，则调整难度级别，再次推送测试文章测试，直到测出用户能力级别后测试结束。

图4是本发明可选实施方式提供的文章测试的流程图，如图4所示，测试流程主要包括4个部分，朗读测评；、阅读理解测评、复述/问答测评和综合评估。研究表明：朗读流利度和阅读能力直接相关，它们的相关系数高达0.91。此外，阅读能力与问答的相关系数为0.82，与复述的相关系数为0.70，均有明显的相关性。基于朗读行为评估的方法(例如：Running Records)也广泛的用于教学中阅读能力评估。因此，综合采用多种测试方法，重点基于行为评估来对用户能力测评。

(1)朗读测评；

朗读测评要求用户在规定时间内朗读测试文章全文。通过记录分析朗读行为评估用户对文章的理解程度。

朗读测评过程如下：

S1，用户朗读测试文章，系统记录用户朗读音频；

S2，用户朗读过程中，语音识别系统自动对用户朗读的音频进行识别；

S3，根据识别的结果和文章文本信息提取用于测评的各种特征和信息；

S4，计算朗读测评得分，记录朗读行为，得到朗读测评结果。

需要说明的是，朗读测评结果包括：

1)单词级朗读行为。

即用户在朗读过程中出现的单词级错误、不流利、自我监督等行为现象。主要有：漏读错误、替代错误、插入错误、重复读、自我纠正、单词发音错误等。

提取方式为：首先采用动态规划算法求解识别结果和文章内容的最小单词级编辑距离，并得到单词级的漏洞、替代和插入错误标注。针对插入错误进行二次判断，是否为重复读或自我纠正。

重复读单词判定方法：当插入单词语音识别置信度高于特定阈值，且该单词与前后正确朗读单词一致，则判定为重复读单词。

自我纠正判定方法：当正确朗读单词之前出现插入错误且未判定为重复读时，如果插入单词和当前单词一致则判为自我纠正，如果插入单词和当前单词不一致，匹配二者音素级发音，如果存在部分相同发音，则判为自我纠正。

发音错误判定方法：首先计算音素级发音质量GOP(p)

GOP(p)＝logP(p|O)

其中p是识别结果中的音素，O是该音素对应的声学特征向量，在基于深度学习的语音识别系统中，logP(phone|O)可通过神经网络输出的后验概率分数直接获得。

然后根据音素级GOP计算单词发音质量GOP(w)

其中w为单词，p是单词中的音素。当GOP(w)低于一定阈值时判定该单词存在发音错误。

2)语速。

包括两种语速：a)每分钟朗读的单词数量b)每分钟正确朗读单词的数量。

每分钟朗读的单词数量计算方式：识别结果的单词总数量/朗读分钟数

每分钟正确朗读单词数量计算方式：识别结果中正确朗读单词数量/朗读分钟数

3)发音水平

发音水平指用户整体发音准确度和标准母语发音的接近程度。将语音识别结果中单词识别置信度低于特定阈值的单词去除，剩下的单词作为有效识别单词，将有效单词的音素归一化发音得分作为衡量用户发音水平的指数。具体计算方法如下：

NPSC＝(PSC-μ)/σ

其中：GOP(p_i)是音素p_i的发音质量分数，PSC是有效单词的音素平均发音质量得分，μ和σ分别为母语说话人音素发音质量分数的均值和方差，NPSC为归一化发音得分。

4)音调

音调测评结果给出朗读过程中单词音调高低，以及单词的升降调判别。

音调高低是指单词音节的对数域音高，其计算方法为：

提取语音基音[f01,f02,…f0n]，其中f0i是第i帧音频的基音频率；

根据识别结果得到不同音节的切分位置，即音节对应语音的起始帧和结束帧；

计算每个音节的对数域基音均值：

其中，SF和NF分别为音节起始帧和结束帧，f0_i为第i帧语音的基音频率.

单词升降调判别是分类问题，即判断该句为升调或降调。

本发明可选实施方式采用以下方法：

提取单词语音的对数域基音值，采用二次曲线拟合得到系数[c₀，c₁，c₂]，将拟合系数以及单词长度(帧数)l,单词起始位置基音f0_s,结束位置基音值f0_e作为特征向量。

Feat＝[c₀，c₁，c₂，l，f0_s，f0_e]

采用SVM分类器进行分类，得到单词的升降调。

5)单词重音

单词重音测评检测用户朗读多音节单词时重音位置是否正确。单词重音在声学上主要体现在基音音高的不同，即重读音节的语音基音频率高于轻读音节。因此可以通过比较多音节单词不同音节的基音频率高低来判断重音位置是否正确。具体方法如下：

比较重音音节和轻音音节对数域基音均值差值：

DPIT＝LPIT_h-LPIT_l

其中LPIT_h是重读音节对数域基音频率均值，LPIT_l是轻读音节对数域基音频率均值。

当DPIT大于特定阈值时重音位置正确，阈值数值的设置可通过人工标注的数据统计分析得到。

6)朗读得分计算方法：

其中Total为文章单词总数，Error为单词错误总数(包括：插入、删除、替代、发音错误)。

(2)阅读理解测评

完成文章配套的阅读理解选择题，得到答题正确率。

(3)复述/问答测评

复述测评过程如下：

S1，复述文章，系统记录用户复述音频；

S2，用户朗读过程中，语音识别系统自动对用户复述的音频进行识别；

S3，复述结束后根据识别结果和文章内容以及问答题针对的文章内容来判断复述是否完整全面；

S4，如果复述内容未覆盖问答题所针对的内容，自动播放问答题的问题，让学生回答；

S5，系统识别学生回答的语音；

S6，根据复述和回答的识别结果提取测评特征；

其中，提取特征如下：

S7，根据测评特征给出测评结果。

将特征输入预先训练好的回归模型估计测评得分。

(4)综合测评

根据朗读、阅读理解和复述/问答测试结果综合评估用户语言能力，并给出用户能力与文章难度匹配结果。这里的能力匹配是个分类问题，即根据测评特征判断用户能力级别与文章难度级别相比是[低于，匹配，高于]这三种情况的其中之一。分类模型可采用基于专家决策的规则模式或基于数据驱动的机器学习分类器。

本发明可选实施方式采用规则模式，基于教学专家经验结合现有教学研究成果，主要根据朗读得分、阅读理解正确率和复述/问答得分来判读用户能力级别和设定规则判断能力是否匹配。具体规则如下：

S＝S₁+S₂+S₃

其中：x为朗读得分，y为阅读理解正确率，z为复述得分，M为用户能力级别与文章难度级别匹配程度。

(三)报告生成模块

用户完成测评过程后，由报告生成模块根据用户在测评过程中产生行为数据和答题结果来生成详细的测评报告。

需要说明的是，用户完成测评后生成详细评测报告。评测报告主要包括能力测评结果、行为数据记录以及阅读内容推荐等。

1.当前能力级别以及预测达到下一级别所需时间。

2.朗读测评结果，包括：朗读音频、测评文章以及单词级朗读行为标记、错误统计、语速、自我纠正率。

3.阅读理解答题解析。

4.复述测评结果，包括：复述完整度、复述语速、复述得分、问答得分。

5.推荐读物，根据用户当前能力级别推荐与之能力匹配的读物。

通过上述可选实施方式，可以达到至少以下的有益效果：

通过将智能语音技术和基于阅读行为分析的阅读能力测评方法相结合，实现测评自动化，使得该测评不再依赖于老师，大大提高了测评效率、降低了测评成本。使得这种测评方法具备了大范围普及的可能。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例的方法。

实施例2

根据本发明实施例，还提供了一种用于实施上述阅读能力测评方法的装置，图5是根据本发明实施例的阅读能力测评装置的结构框图，如图5所示，该装置包括：获取模块502，处理模块504和获得模块506，下面对该装置进行详细说明。

获取模块502，用于获取阅读音频，其中，阅读音频为对阅读对象进行朗读得到的音频；处理模块504，连接于上述获取模块502，用于对阅读音频进行处理，得到朗读测评结果；获得模块506，连接于上述处理模块504，用于基于朗读测评结果，获得阅读能力测评结果。

此处需要说明的是，上述获取模块502，处理模块504和获得模块506对应于实施阅读能力测评方法一中的步骤S102至步骤S106，多个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例1所公开的内容。

实施例3

本公开的实施例可以提供一种电子设备，该电子设备可以是一种终端。在本实施例中，该电子设备作为一种终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述终端也可以为移动终端等终端设备。

可选地，在本实施例中，上述终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地，图6是根据一示例性实施例示出的一种终端的结构框图。如图6所示，该终端可以包括：一个或多个(图中仅示出一个)处理器61、用于存储处理器可执行指令的存储器62；其中，处理器被配置为执行指令，以实现上述任一项的阅读能力测评方法。

其中，存储器可用于存储软件程序以及模块，如本公开实施例中的阅读能力测评方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的阅读能力测评方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：获取阅读音频，其中，阅读音频为对阅读对象进行朗读得到的音频；对阅读音频进行处理，得到朗读测评结果；基于朗读测评结果，获得阅读能力测评结果。

可选的，上述处理器还可以执行如下步骤的程序代码：对阅读音频进行处理，得到朗读测评结果，包括：对阅读音频进行识别，得到单词级的识别结果；基于得到的单词级的识别结果，得到单词级的朗读测评结果。

可选的，上述处理器还可以执行如下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括以下至少之一：将得到的单词级的识别结果与阅读对象的单词进行比较，确定重复读单词；将得到的单词级的识别结果与阅读对象的单词进行比较，确定自我纠正单词；基于得到的单词级的识别结果，确定发音错误单词。

可选的，上述处理器还可以执行如下步骤的程序代码：基于得到的单词级的识别结果，确定发音错误单词，包括：基于得到的单词级的识别结果，得到单词中音素的发音质量；基于单词中音素的发音质量确定单词的发音质量；在单词的发音质量低于第一预定阈值的情况下，确定单词为发音错误单词。

可选的，上述处理器还可以执行如下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，获取朗读阅读对象中朗读内容的单词数量，以及朗读内容所花费的时间；基于单词数量和时间，确定朗读的语速。

可选的，上述处理器还可以执行如下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，获得置信度高于预定阈值的有效单词；获得有效单词所包括的音素的平均发音质量参数；基于有效单词的平均发音质量参数，得到有效单词的归一化发音参数，并将归一化发音参数确定为发音水平。

可选的，上述处理器还可以执行如下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，得到单词从起始帧到结束帧的基音；基于单词从起始帧到结束帧的基音，获得单词的对数域基音均值；基于单词的对数域基音均值，采用支持向量机分类器，得到单词的升降调信息。

可选的，上述处理器还可以执行如下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果,确定单词的重音音节和轻音音节的对数域基音均值差值；在对数域基音均值差值大于第二预定阈值的情况下，确定重音位置正确。

可选的，上述处理器还可以执行如下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，得到朗读正确的单词数量；基于朗读正确的单词数量，以及阅读对象的总单词数量，确定朗读正确率。

可选的，上述处理器还可以执行如下步骤的程序代码：基于朗读测评结果，获得阅读能力测评结果，包括：输出阅读理解选择题；接收针对阅读理解选择题所进行的作答，以及基于作答确定答题正确率；基于朗读测评结果，以及答题正确率，获得阅读能力测评结果。

可选的，上述处理器还可以执行如下步骤的程序代码：基于朗读测评结果，以及答题正确率，获得阅读能力测评结果，包括：接收复述阅读对象的复述音频；对复述音频进行识别，得到复述识别结果；接收答题音频；对答题音频进行识别，得到答题识别结果；基于复述识别结果和答题识别结果，提取复述答题的测评特征；基于复述答题的测评特征，得到复述答题的测评结果；基于朗读测评结果，答题正确率，以及复述答题的测评结果，获得阅读能力测评结果。

可选的，上述处理器还可以执行如下步骤的程序代码：基于朗读测评结果，答题正确率，以及复述答题的测评结果，获得阅读能力测评结果，包括：基于朗读测评结果，答题正确率，以及复述答题的测评结果，得到综合能力得分；基于综合能力得分，确定阅读能力与阅读对象的难易程度之间的匹配度。

可选的，上述处理器还可以执行如下步骤的程序代码：在基于朗读测评结果，获得阅读能力测评结果之后，还包括：生成测评报告，并输出生成的测评报告。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(RandomAccess Memory，RAM)、磁盘或光盘等。

实施例4

在示例性实施例中，还提供了一种包括指令的计算机可读存储介质，当计算机可读存储介质中的指令由终端的处理器执行时，使得终端能够执行上述任一项的阅读能力测评方法。可选地，计算机可读存储介质可以是非临时性计算机可读存储介质，例如，非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

可选地，在本实施例中，上述计算机可读存储介质可以用于保存上述实施例所提供的阅读能力测评方法所执行的程序代码。

可选地，在本实施例中，上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：获取阅读音频，其中，阅读音频为对阅读对象进行朗读得到的音频；对阅读音频进行处理，得到朗读测评结果；基于朗读测评结果，获得阅读能力测评结果。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：对阅读音频进行处理，得到朗读测评结果，包括：对阅读音频进行识别，得到单词级的识别结果；基于得到的单词级的识别结果，得到单词级的朗读测评结果。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括以下至少之一：将得到的单词级的识别结果与阅读对象的单词进行比较，确定重复读单词；将得到的单词级的识别结果与阅读对象的单词进行比较，确定自我纠正单词；基于得到的单词级的识别结果，确定发音错误单词。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于得到的单词级的识别结果，确定发音错误单词，包括：基于得到的单词级的识别结果，得到单词中音素的发音质量；基于单词中音素的发音质量确定单词的发音质量；在单词的发音质量低于第一预定阈值的情况下，确定单词为发音错误单词。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，获取朗读阅读对象中朗读内容的单词数量，以及朗读内容所花费的时间；基于单词数量和时间，确定朗读的语速。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，获得置信度高于预定阈值的有效单词；获得有效单词所包括的音素的平均发音质量参数；基于有效单词的平均发音质量参数，得到有效单词的归一化发音参数，并将归一化发音参数确定为发音水平。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，得到单词从起始帧到结束帧的基音；基于单词从起始帧到结束帧的基音，获得单词的对数域基音均值；基于单词的对数域基音均值，采用支持向量机分类器，得到单词的升降调信息。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果,确定单词的重音音节和轻音音节的对数域基音均值差值；在对数域基音均值差值大于第二预定阈值的情况下，确定重音位置正确。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：基于得到的单词级的识别结果，得到朗读正确的单词数量；基于朗读正确的单词数量，以及阅读对象的总单词数量，确定朗读正确率。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于朗读测评结果，获得阅读能力测评结果，包括：输出阅读理解选择题；接收针对阅读理解选择题所进行的作答，以及基于作答确定答题正确率；基于朗读测评结果，以及答题正确率，获得阅读能力测评结果。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于朗读测评结果，以及答题正确率，获得阅读能力测评结果，包括：接收复述阅读对象的复述音频；对复述音频进行识别，得到复述识别结果；接收答题音频；对答题音频进行识别，得到答题识别结果；基于复述识别结果和答题识别结果，提取复述答题的测评特征；基于复述答题的测评特征，得到复述答题的测评结果；基于朗读测评结果，答题正确率，以及复述答题的测评结果，获得阅读能力测评结果。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：基于朗读测评结果，答题正确率，以及复述答题的测评结果，获得阅读能力测评结果，包括：基于朗读测评结果，答题正确率，以及复述答题的测评结果，得到综合能力得分；基于综合能力得分，确定阅读能力与阅读对象的难易程度之间的匹配度。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：在基于朗读测评结果，获得阅读能力测评结果之后，还包括：生成测评报告，并输出生成的测评报告。

在示例性实施例中，还提供了一种计算机程序产品，当计算机程序产品中的计算机程序由电子设备的处理器执行时，使得电子设备能够执行上述任一项的阅读能力测评方法。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种阅读能力测评方法，其特征在于，包括：

获取阅读音频，其中，所述阅读音频为对阅读对象进行朗读得到的音频；

对所述阅读音频进行处理，得到朗读测评结果；

基于所述朗读测评结果，获得阅读能力测评结果。

2.根据权利要求1所述的方法，其特征在于，所述对所述阅读音频进行处理，得到朗读测评结果，包括：

对所述阅读音频进行识别，得到单词级的识别结果；

基于得到的单词级的识别结果，得到单词级的朗读测评结果。

3.根据权利要求2所述的方法，其特征在于，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括以下至少之一：

将得到的单词级的识别结果与所述阅读对象的单词进行比较，确定重复读单词；

将得到的单词级的识别结果与所述阅读对象的单词进行比较，确定自我纠正单词；

基于得到的单词级的识别结果，确定发音错误单词。

4.根据权利要求3所述的方法，其特征在于，所述基于得到的单词级的识别结果，确定发音错误单词，包括：

基于得到的单词级的识别结果，得到单词中音素的发音质量；

基于单词中音素的发音质量确定所述单词的发音质量；

在所述单词的发音质量低于第一预定阈值的情况下，确定所述单词为发音错误单词。

5.根据权利要求2所述的方法，其特征在于，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：

基于得到的单词级的识别结果，获取朗读所述阅读对象中朗读内容的单词数量，以及所述朗读内容所花费的时间；

基于所述单词数量和所述时间，确定朗读的语速。

6.根据权利要求2所述的方法，其特征在于，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：

基于得到的单词级的识别结果，获得置信度高于预定阈值的有效单词；

获得所述有效单词所包括的音素的平均发音质量参数；

基于所述有效单词的平均发音质量参数，得到所述有效单词的归一化发音参数，并将所述归一化发音参数确定为发音水平。

7.根据权利要求2所述的方法，其特征在于，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：

基于得到的单词级的识别结果，得到单词从起始帧到结束帧的基音；

基于单词从起始帧到结束帧的基音，获得所述单词的对数域基音均值；

基于所述单词的对数域基音均值，采用支持向量机分类器，得到所述单词的升降调信息。

8.根据权利要求2所述的方法，其特征在于，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：

基于得到的单词级的识别结果,确定单词的重音音节和轻音音节的对数域基音均值差值；

在所述对数域基音均值差值大于第二预定阈值的情况下，确定重音位置正确。

9.根据权利要求2所述的方法，其特征在于，所述基于得到的单词级的识别结果，得到单词级的朗读测评结果，包括：

基于得到的单词级的识别结果，得到朗读正确的单词数量；

基于朗读正确的单词数量，以及所述阅读对象的总单词数量，确定朗读正确率。

10.根据权利要求1至9中任一项所述的方法，其特征在于，所述基于所述朗读测评结果，获得阅读能力测评结果，包括：

输出阅读理解选择题；

接收针对所述阅读理解选择题所进行的作答，以及基于所述作答确定答题正确率；

基于所述朗读测评结果，以及所述答题正确率，获得所述阅读能力测评结果。

11.根据权利要求10所述的方法，其特征在于，所述基于所述朗读测评结果，以及所述答题正确率，获得所述阅读能力测评结果，包括：

接收复述所述阅读对象的复述音频；

对所述复述音频进行识别，得到复述识别结果；

接收答题音频；

对所述答题音频进行识别，得到答题识别结果；

基于所述复述识别结果和所述答题识别结果，提取复述答题的测评特征；

基于复述答题的测评特征，得到复述答题的测评结果；

基于所述朗读测评结果，所述答题正确率，以及所述复述答题的测评结果，获得所述阅读能力测评结果。

12.根据权利要求11所述的方法，其特征在于，所述基于所述朗读测评结果，所述答题正确率，以及所述复述答题的测评结果，获得所述阅读能力测评结果，包括：

基于所述朗读测评结果，所述答题正确率，以及所述复述答题的测评结果，得到综合能力得分；

基于所述综合能力得分，确定阅读能力与阅读对象的难易程度之间的匹配度。

13.根据权利要求12所述的方法，其特征在于，在基于所述朗读测评结果，获得阅读能力测评结果之后，还包括：

生成测评报告，并输出生成的所述测评报告。

14.一种阅读能力测评装置，其特征在于，包括：

获取模块，用于获取阅读音频，其中，所述阅读音频为对阅读对象进行朗读得到的音频；

处理模块，用于对所述阅读音频进行处理，得到朗读测评结果；

获得模块，用于基于所述朗读测评结果，获得阅读能力测评结果。