CN112131889A

CN112131889A - 基于大数据的智能语文主观题评分方法和系统

Info

Publication number: CN112131889A
Application number: CN202011054095.7A
Authority: CN
Inventors: 许昭慧
Original assignee: Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Current assignee: Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority date: 2020-09-29
Filing date: 2020-09-29
Publication date: 2020-12-25

Abstract

本发明提供了基于大数据的智能语文主观题评分方法和系统，其通过获取任意两个学生的做题答案，并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分，其在语义层面上对语文主观题的做题答案进行识别比对，以此提高语文主观题作答评分的客观性和可靠性，从而提高学生的语文学习兴趣与质量。

Description

基于大数据的智能语文主观题评分方法和系统

技术领域

本发明涉及智能教育的技术领域，特别涉及基于大数据的智能语文主观题评分方法和系统。

背景技术

目前，在对学生进行语文科目考试中，通常会设置相应的语文主观题，而该语文主观题需要学生针对相应的主旨问题进行作答，并且这些语文主观题通常为发散性题目，其并不具备相应的标准答案，判卷人员也是根据学生的具体作答情况来进行评分。而在实际操作中，学生都只是获得自身对语文主观题的作答情况，这不利于学生对自身的实际作答情况进行客观的和全面的了解，从而大大地降低学生的语文学习兴趣和语文主观题考核可靠性。可见，现有技术需要能够帮助学生对自身的语文主观题作答情况进行全面的了解、提高学生语文学习兴趣与质量以及改善语文主观题考核可靠性的评分模式。

发明内容

针对现有技术存在的缺陷，本发明提供基于大数据的智能语文主观题评分方法和系统，其通过获取若干学生关于预设语文主观题对应的做题答案，并对该做题答案进行语义识别与转换处理，以此获得对应的语义向量，再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果，并根据该语义项比对结果，确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果，再根据该相似度评价结果，确定该目标学生的该预设语文主观题的作答分值；可见，该基于大数据的智能语文主观题评分方法和系统有别于现有技术的通过阅卷人员对语文主观题进行评分的方式，其通过获取任意两个学生的做题答案，并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分，其在语义层面上对语文主观题的做题答案进行识别比对，以此提高语文主观题作答评分的客观性和可靠性，从而提高学生的语文学习兴趣与质量。

本发明提供基于大数据的智能语文主观题评分方法，其特征在于，其包括如下步骤：

步骤S1，获取若干学生关于预设语文主观题对应的做题答案，并对所述做题答案进行语义识别与转换处理，以此获得对应的语义向量，再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果；

步骤S2，根据所述语义项比对结果，确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果；

步骤S3，根据所述相似度评价结果，确定所述目标学生的所述预设语文主观题的作答分值；

进一步，在所述步骤S1中，获取若干学生关于预设语文主观题对应的做题答案，并对所述做题答案进行语义识别与转换处理，以此获得对应的语义向量，再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果具体包括：

步骤S101，获取若干学生关于预设语文主观题对应的做题答案，并将所述做题答案，并对所述做题答案进行特征词的识别处理，从而确定所述做题答案中每一个语句包含的主语文本、谓语文本和宾语文本；

步骤S102，将同一语句包含的主语文本、谓语文本和宾语文本共同转换为语义向量；

步骤S103，根据下面公式(1)，将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果：

在上述公式(1)中，Y(A_i,A_j)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值，A_i表示第i个学生的语义向量，A_j表示第j个学生的语义向量，n表示学生的总数量，m表示除第i个学生之外的其他学生的总数、且m的取值为n-1，β表示预设比对系数、且其取值为0.4，Sim(A_i,A_j)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度；

进一步，在所述步骤S2中，根据所述语义项比对结果，确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括：

根据所述语义项比对结果与下面公式(2)，确定所所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价值：

在上述公式(2)中，Q(A_i,A_j)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值，Y(A_i,A_j)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值，α表示预设相似度评价系数、且其取值为0.6，β表示预设比对系数、且其取值为0.4，n表示学生的总数量，Sim(A_i,A_j)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度；

进一步，在所述步骤S3中，根据所述相似度评价结果，确定所述目标学生的所述预设语文主观题的作答分值具体包括：

根据所述相似度评价结果以及下面公式(3)，确定所述目标学生的所述预设语文主观题的作答分值：

在上述公式(3)中，F表示所述第i个学生的所述预设语文主观题的作答分值，Q(A_i,A_j)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值，n表示学生的总数量，M表示所述预设语文主观题的满分值，μ[]表示阶跃函数、且当[]内的数值大于或者等于0，阶跃函数的结果为1，当[]内的数值小于0，阶跃函数的结果为0。

本发明还提供基于大数据的智能语文主观题评分系统，其特征在于，其包括做题答案识别模块、语义向量生成模块、语义项比对结果生成模块、相似度评价结果生成模块和评分作答分值确定模块；其中，

所述做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案，并对所述做题答案进行语义识别处理；

所述语义向量生成模块用于对所述语义识别处理的结果进行转换处理，以此获得对应的语义向量；

所述语义项比对结果生成模块用于将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果；

所述相似度评价结果生成模块用于根据所述语义项比对结果，确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果；

所述评分作答分值确定模块用于根据所述相似度评价结果，确定所述目标学生的所述预设语文主观题的作答分值；

进一步，所述做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案，并对所述做题答案进行语义识别处理具体包括：

获取若干学生关于预设语文主观题对应的做题答案，并将所述做题答案，并对所述做题答案进行特征词的识别处理，从而确定所述做题答案中每一个语句包含的主语文本、谓语文本和宾语文本；

以及，

所述语义向量生成模块对所述语义识别处理的结果进行转换处理，以此获得对应的语义向量具体包括：

将同一语句包含的主语文本、谓语文本和宾语文本共同转换为语义向量；

以及，

所述语义项比对结果生成模块将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果具体包括：

根据下面公式(1)，将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果：

进一步，所述相似度评价结果生成模块根据所述语义项比对结果，确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括：

进一步，所述评分作答分值确定模块根据所述相似度评价结果，确定所述目标学生的所述预设语文主观题的作答分值具体包括：

相比于现有技术，针对现有技术存在的缺陷，本发明提供基于大数据的智能语文主观题评分方法和系统，其通过获取若干学生关于预设语文主观题对应的做题答案，并对该做题答案进行语义识别与转换处理，以此获得对应的语义向量，再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果，并根据该语义项比对结果，确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果，再根据该相似度评价结果，确定该目标学生的该预设语文主观题的作答分值；可见，该基于大数据的智能语文主观题评分方法和系统有别于现有技术的通过阅卷人员对语文主观题进行评分的方式，其通过获取任意两个学生的做题答案，并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分，其在语义层面上对语文主观题的做题答案进行识别比对，以此提高语文主观题作答评分的客观性和可靠性，从而提高学生的语文学习兴趣与质量。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的基于大数据的智能语文主观题评分方法的流程示意图。

图2为本发明提供的基于大数据的智能语文主观题评分系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，为本发明实施例提供的基于大数据的智能语文主观题评分方法的流程示意图。该基于大数据的智能语文主观题评分方法包括如下步骤：

步骤S1，获取若干学生关于预设语文主观题对应的做题答案，并对该做题答案进行语义识别与转换处理，以此获得对应的语义向量，再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果；

步骤S2，根据该语义项比对结果，确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果；

步骤S3，根据该相似度评价结果，确定该目标学生的该预设语文主观题的作答分值。

上述技术方案的有益效果为：该基于大数据的智能语文主观题评分方法有别于现有技术的通过阅卷人员对语文主观题进行评分的方式，其通过获取任意两个学生的做题答案，并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分，其在语义层面上对语文主观题的做题答案进行识别比对，以此提高语文主观题作答评分的客观性和可靠性，从而提高学生的语文学习兴趣与质量。

优选地，在该步骤S1中，获取若干学生关于预设语文主观题对应的做题答案，并对该做题答案进行语义识别与转换处理，以此获得对应的语义向量，再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果具体包括：

步骤S101，获取若干学生关于预设语文主观题对应的做题答案，并将该做题答案，并对该做题答案进行特征词的识别处理，从而确定该做题答案中每一个语句包含的主语文本、谓语文本和宾语文本；

在上述公式(1)中，Y(A_i,A_j)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值，A_i表示第i个学生的语义向量，A_j表示第j个学生的语义向量，n表示学生的总数量，m表示除第i个学生之外的其他学生的总数、且m的取值为n-1，β表示预设比对系数、且其取值为0.4，Sim(A_i,A_j)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。

上述技术方案的有益效果为：通过对做题答案中每一个语句包含的主语、谓语和宾语成分进行识别和转换，能够有效地对该做题答案进行最大限度的语义提炼与压缩，以此降低做题答案中噪声成分和提高后续转换得到语义向量的准确性；此外，通过上述公式(1)，能够全面地对任意两个学生对应的语义向量进行语义比对，从而确定两个不同语义向量之间的语义项差异比对结果，以便于快速地和精确地确定两个不同做题答案之间的语义差别结果。

优选地，在该步骤S2中，根据该语义项比对结果，确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括：

根据该语义项比对结果与下面公式(2)，确定所该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价值：

在上述公式(2)中，Q(A_i,A_j)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值，Y(A_i,A_j)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值，α表示预设相似度评价系数、且其取值为0.6，β表示预设比对系数、且其取值为0.4，n表示学生的总数量，Sim(A_i,A_j)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。

上述技术方案的有益效果为：通过上述公式(2)，能够从语义层面上最大限度地确定两个不同学生的做题答案之间的语义相似度，从而对两个不同学生的做题答案之前的语义相似程度进行量化评判和提高后续学生做题评分的有效性。

优选地，在该步骤S3中，根据该相似度评价结果，确定该目标学生的该预设语文主观题的作答分值具体包括：

根据该相似度评价结果以及下面公式(3)，确定该目标学生的该预设语文主观题的作答分值：

在上述公式(3)中，F表示该第i个学生的该预设语文主观题的作答分值，Q(A_i,A_j)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值，n表示学生的总数量，M表示该预设语文主观题的满分值，μ[]表示阶跃函数、且当[]内的数值大于或者等于0，阶跃函数的结果为1，当[]内的数值小于0，阶跃函数的结果为0。

上述技术方案的有益效果为：通过上述公式(3)，能够便于通过相应的评分规则进行关于任意两个不同学生的语文主观题做答评分，从而最大限度地提高语文主观题作答评分的客观性和可靠性。

参阅图2，为本发明实施例提供的基于大数据的智能语文主观题评分系统的结构示意图。该基于大数据的智能语文主观题评分系统包括做题答案识别模块、语义向量生成模块、语义项比对结果生成模块、相似度评价结果生成模块和评分作答分值确定模块；其中，

该做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案，并对该做题答案进行语义识别处理；

该语义向量生成模块用于对该语义识别处理的结果进行转换处理，以此获得对应的语义向量；

该语义项比对结果生成模块用于将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果；

该相似度评价结果生成模块用于根据该语义项比对结果，确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果；

该评分作答分值确定模块用于根据该相似度评价结果，确定该目标学生的该预设语文主观题的作答分值。

上述技术方案的有益效果为：该基于大数据的智能语文主观题评分系统有别于现有技术的通过阅卷人员对语文主观题进行评分的方式，其通过获取任意两个学生的做题答案，并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分，其在语义层面上对语文主观题的做题答案进行识别比对，以此提高语文主观题作答评分的客观性和可靠性，从而提高学生的语文学习兴趣与质量。

优选地，该做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案，并对该做题答案进行语义识别处理具体包括：

获取若干学生关于预设语文主观题对应的做题答案，并将该做题答案，并对该做题答案进行特征词的识别处理，从而确定该做题答案中每一个语句包含的主语文本、谓语文本和宾语文本；

以及，

该语义向量生成模块对该语义识别处理的结果进行转换处理，以此获得对应的语义向量具体包括：

以及，

该语义项比对结果生成模块将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果具体包括：

优选地，该相似度评价结果生成模块根据该语义项比对结果，确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括：

优选地，该评分作答分值确定模块根据该相似度评价结果，确定该目标学生的该预设语文主观题的作答分值具体包括：

从上述实施例的内容可知，该基于大数据的智能语文主观题评分方法和系统通过获取若干学生关于预设语文主观题对应的做题答案，并对该做题答案进行语义识别与转换处理，以此获得对应的语义向量，再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对，从而获得相应的语义项比对结果，并根据该语义项比对结果，确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果，再根据该相似度评价结果，确定该目标学生的该预设语文主观题的作答分值；可见，该基于大数据的智能语文主观题评分方法和系统有别于现有技术的通过阅卷人员对语文主观题进行评分的方式，其通过获取任意两个学生的做题答案，并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分，其在语义层面上对语文主观题的做题答案进行识别比对，以此提高语文主观题作答评分的客观性和可靠性，并且还能够便于不同学生之间针对语文主观题进行充分和全面的交流评分，从而提高学生的语文学习兴趣与质量。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。