CN112131889A - 基于大数据的智能语文主观题评分方法和系统 - Google Patents

基于大数据的智能语文主观题评分方法和系统 Download PDF

Info

Publication number
CN112131889A
CN112131889A CN202011054095.7A CN202011054095A CN112131889A CN 112131889 A CN112131889 A CN 112131889A CN 202011054095 A CN202011054095 A CN 202011054095A CN 112131889 A CN112131889 A CN 112131889A
Authority
CN
China
Prior art keywords
semantic
student
students
answer
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011054095.7A
Other languages
English (en)
Inventor
许昭慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Original Assignee
Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd filed Critical Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority to CN202011054095.7A priority Critical patent/CN112131889A/zh
Publication of CN112131889A publication Critical patent/CN112131889A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Abstract

本发明提供了基于大数据的智能语文主观题评分方法和系统,其通过获取任意两个学生的做题答案,并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分,其在语义层面上对语文主观题的做题答案进行识别比对,以此提高语文主观题作答评分的客观性和可靠性,从而提高学生的语文学习兴趣与质量。

Description

基于大数据的智能语文主观题评分方法和系统
技术领域
本发明涉及智能教育的技术领域,特别涉及基于大数据的智能语文主观题评分方法和系统。
背景技术
目前,在对学生进行语文科目考试中,通常会设置相应的语文主观题,而该语文主观题需要学生针对相应的主旨问题进行作答,并且这些语文主观题通常为发散性题目,其并不具备相应的标准答案,判卷人员也是根据学生的具体作答情况来进行评分。而在实际操作中,学生都只是获得自身对语文主观题的作答情况,这不利于学生对自身的实际作答情况进行客观的和全面的了解,从而大大地降低学生的语文学习兴趣和语文主观题考核可靠性。可见,现有技术需要能够帮助学生对自身的语文主观题作答情况进行全面的了解、提高学生语文学习兴趣与质量以及改善语文主观题考核可靠性的评分模式。
发明内容
针对现有技术存在的缺陷,本发明提供基于大数据的智能语文主观题评分方法和系统,其通过获取若干学生关于预设语文主观题对应的做题答案,并对该做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果,并根据该语义项比对结果,确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果,再根据该相似度评价结果,确定该目标学生的该预设语文主观题的作答分值;可见,该基于大数据的智能语文主观题评分方法和系统有别于现有技术的通过阅卷人员对语文主观题进行评分的方式,其通过获取任意两个学生的做题答案,并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分,其在语义层面上对语文主观题的做题答案进行识别比对,以此提高语文主观题作答评分的客观性和可靠性,从而提高学生的语文学习兴趣与质量。
本发明提供基于大数据的智能语文主观题评分方法,其特征在于,其包括如下步骤:
步骤S1,获取若干学生关于预设语文主观题对应的做题答案,并对所述做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果;
步骤S2,根据所述语义项比对结果,确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果;
步骤S3,根据所述相似度评价结果,确定所述目标学生的所述预设语文主观题的作答分值;
进一步,在所述步骤S1中,获取若干学生关于预设语文主观题对应的做题答案,并对所述做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果具体包括:
步骤S101,获取若干学生关于预设语文主观题对应的做题答案,并将所述做题答案,并对所述做题答案进行特征词的识别处理,从而确定所述做题答案中每一个语句包含的主语文本、谓语文本和宾语文本;
步骤S102,将同一语句包含的主语文本、谓语文本和宾语文本共同转换为语义向量;
步骤S103,根据下面公式(1),将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果:
Figure BDA0002710416560000031
在上述公式(1)中,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,Ai表示第i个学生的语义向量,Aj表示第j个学生的语义向量,n表示学生的总数量,m表示除第i个学生之外的其他学生的总数、且m的取值为n-1,β表示预设比对系数、且其取值为0.4,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度;
进一步,在所述步骤S2中,根据所述语义项比对结果,确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括:
根据所述语义项比对结果与下面公式(2),确定所所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价值:
Figure BDA0002710416560000032
在上述公式(2)中,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,α表示预设相似度评价系数、且其取值为0.6,β表示预设比对系数、且其取值为0.4,n表示学生的总数量,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度;
进一步,在所述步骤S3中,根据所述相似度评价结果,确定所述目标学生的所述预设语文主观题的作答分值具体包括:
根据所述相似度评价结果以及下面公式(3),确定所述目标学生的所述预设语文主观题的作答分值:
Figure BDA0002710416560000041
在上述公式(3)中,F表示所述第i个学生的所述预设语文主观题的作答分值,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,n表示学生的总数量,M表示所述预设语文主观题的满分值,μ[]表示阶跃函数、且当[]内的数值大于或者等于0,阶跃函数的结果为1,当[]内的数值小于0,阶跃函数的结果为0。
本发明还提供基于大数据的智能语文主观题评分系统,其特征在于,其包括做题答案识别模块、语义向量生成模块、语义项比对结果生成模块、相似度评价结果生成模块和评分作答分值确定模块;其中,
所述做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案,并对所述做题答案进行语义识别处理;
所述语义向量生成模块用于对所述语义识别处理的结果进行转换处理,以此获得对应的语义向量;
所述语义项比对结果生成模块用于将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果;
所述相似度评价结果生成模块用于根据所述语义项比对结果,确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果;
所述评分作答分值确定模块用于根据所述相似度评价结果,确定所述目标学生的所述预设语文主观题的作答分值;
进一步,所述做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案,并对所述做题答案进行语义识别处理具体包括:
获取若干学生关于预设语文主观题对应的做题答案,并将所述做题答案,并对所述做题答案进行特征词的识别处理,从而确定所述做题答案中每一个语句包含的主语文本、谓语文本和宾语文本;
以及,
所述语义向量生成模块对所述语义识别处理的结果进行转换处理,以此获得对应的语义向量具体包括:
将同一语句包含的主语文本、谓语文本和宾语文本共同转换为语义向量;
以及,
所述语义项比对结果生成模块将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果具体包括:
根据下面公式(1),将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果:
Figure BDA0002710416560000051
在上述公式(1)中,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,Ai表示第i个学生的语义向量,Aj表示第j个学生的语义向量,n表示学生的总数量,m表示除第i个学生之外的其他学生的总数、且m的取值为n-1,β表示预设比对系数、且其取值为0.4,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度;
进一步,所述相似度评价结果生成模块根据所述语义项比对结果,确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括:
根据所述语义项比对结果与下面公式(2),确定所所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价值:
Figure BDA0002710416560000052
在上述公式(2)中,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,α表示预设相似度评价系数、且其取值为0.6,β表示预设比对系数、且其取值为0.4,n表示学生的总数量,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度;
进一步,所述评分作答分值确定模块根据所述相似度评价结果,确定所述目标学生的所述预设语文主观题的作答分值具体包括:
根据所述相似度评价结果以及下面公式(3),确定所述目标学生的所述预设语文主观题的作答分值:
Figure BDA0002710416560000061
在上述公式(3)中,F表示所述第i个学生的所述预设语文主观题的作答分值,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,n表示学生的总数量,M表示所述预设语文主观题的满分值,μ[]表示阶跃函数、且当[]内的数值大于或者等于0,阶跃函数的结果为1,当[]内的数值小于0,阶跃函数的结果为0。
相比于现有技术,针对现有技术存在的缺陷,本发明提供基于大数据的智能语文主观题评分方法和系统,其通过获取若干学生关于预设语文主观题对应的做题答案,并对该做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果,并根据该语义项比对结果,确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果,再根据该相似度评价结果,确定该目标学生的该预设语文主观题的作答分值;可见,该基于大数据的智能语文主观题评分方法和系统有别于现有技术的通过阅卷人员对语文主观题进行评分的方式,其通过获取任意两个学生的做题答案,并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分,其在语义层面上对语文主观题的做题答案进行识别比对,以此提高语文主观题作答评分的客观性和可靠性,从而提高学生的语文学习兴趣与质量。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于大数据的智能语文主观题评分方法的流程示意图。
图2为本发明提供的基于大数据的智能语文主观题评分系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,为本发明实施例提供的基于大数据的智能语文主观题评分方法的流程示意图。该基于大数据的智能语文主观题评分方法包括如下步骤:
步骤S1,获取若干学生关于预设语文主观题对应的做题答案,并对该做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果;
步骤S2,根据该语义项比对结果,确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果;
步骤S3,根据该相似度评价结果,确定该目标学生的该预设语文主观题的作答分值。
上述技术方案的有益效果为:该基于大数据的智能语文主观题评分方法有别于现有技术的通过阅卷人员对语文主观题进行评分的方式,其通过获取任意两个学生的做题答案,并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分,其在语义层面上对语文主观题的做题答案进行识别比对,以此提高语文主观题作答评分的客观性和可靠性,从而提高学生的语文学习兴趣与质量。
优选地,在该步骤S1中,获取若干学生关于预设语文主观题对应的做题答案,并对该做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果具体包括:
步骤S101,获取若干学生关于预设语文主观题对应的做题答案,并将该做题答案,并对该做题答案进行特征词的识别处理,从而确定该做题答案中每一个语句包含的主语文本、谓语文本和宾语文本;
步骤S102,将同一语句包含的主语文本、谓语文本和宾语文本共同转换为语义向量;
步骤S103,根据下面公式(1),将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果:
Figure BDA0002710416560000081
在上述公式(1)中,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,Ai表示第i个学生的语义向量,Aj表示第j个学生的语义向量,n表示学生的总数量,m表示除第i个学生之外的其他学生的总数、且m的取值为n-1,β表示预设比对系数、且其取值为0.4,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。
上述技术方案的有益效果为:通过对做题答案中每一个语句包含的主语、谓语和宾语成分进行识别和转换,能够有效地对该做题答案进行最大限度的语义提炼与压缩,以此降低做题答案中噪声成分和提高后续转换得到语义向量的准确性;此外,通过上述公式(1),能够全面地对任意两个学生对应的语义向量进行语义比对,从而确定两个不同语义向量之间的语义项差异比对结果,以便于快速地和精确地确定两个不同做题答案之间的语义差别结果。
优选地,在该步骤S2中,根据该语义项比对结果,确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括:
根据该语义项比对结果与下面公式(2),确定所该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价值:
Figure BDA0002710416560000091
在上述公式(2)中,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,α表示预设相似度评价系数、且其取值为0.6,β表示预设比对系数、且其取值为0.4,n表示学生的总数量,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。
上述技术方案的有益效果为:通过上述公式(2),能够从语义层面上最大限度地确定两个不同学生的做题答案之间的语义相似度,从而对两个不同学生的做题答案之前的语义相似程度进行量化评判和提高后续学生做题评分的有效性。
优选地,在该步骤S3中,根据该相似度评价结果,确定该目标学生的该预设语文主观题的作答分值具体包括:
根据该相似度评价结果以及下面公式(3),确定该目标学生的该预设语文主观题的作答分值:
Figure BDA0002710416560000101
在上述公式(3)中,F表示该第i个学生的该预设语文主观题的作答分值,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,n表示学生的总数量,M表示该预设语文主观题的满分值,μ[]表示阶跃函数、且当[]内的数值大于或者等于0,阶跃函数的结果为1,当[]内的数值小于0,阶跃函数的结果为0。
上述技术方案的有益效果为:通过上述公式(3),能够便于通过相应的评分规则进行关于任意两个不同学生的语文主观题做答评分,从而最大限度地提高语文主观题作答评分的客观性和可靠性。
参阅图2,为本发明实施例提供的基于大数据的智能语文主观题评分系统的结构示意图。该基于大数据的智能语文主观题评分系统包括做题答案识别模块、语义向量生成模块、语义项比对结果生成模块、相似度评价结果生成模块和评分作答分值确定模块;其中,
该做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案,并对该做题答案进行语义识别处理;
该语义向量生成模块用于对该语义识别处理的结果进行转换处理,以此获得对应的语义向量;
该语义项比对结果生成模块用于将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果;
该相似度评价结果生成模块用于根据该语义项比对结果,确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果;
该评分作答分值确定模块用于根据该相似度评价结果,确定该目标学生的该预设语文主观题的作答分值。
上述技术方案的有益效果为:该基于大数据的智能语文主观题评分系统有别于现有技术的通过阅卷人员对语文主观题进行评分的方式,其通过获取任意两个学生的做题答案,并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分,其在语义层面上对语文主观题的做题答案进行识别比对,以此提高语文主观题作答评分的客观性和可靠性,从而提高学生的语文学习兴趣与质量。
优选地,该做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案,并对该做题答案进行语义识别处理具体包括:
获取若干学生关于预设语文主观题对应的做题答案,并将该做题答案,并对该做题答案进行特征词的识别处理,从而确定该做题答案中每一个语句包含的主语文本、谓语文本和宾语文本;
以及,
该语义向量生成模块对该语义识别处理的结果进行转换处理,以此获得对应的语义向量具体包括:
将同一语句包含的主语文本、谓语文本和宾语文本共同转换为语义向量;
以及,
该语义项比对结果生成模块将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果具体包括:
根据下面公式(1),将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果:
Figure BDA0002710416560000111
在上述公式(1)中,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,Ai表示第i个学生的语义向量,Aj表示第j个学生的语义向量,n表示学生的总数量,m表示除第i个学生之外的其他学生的总数、且m的取值为n-1,β表示预设比对系数、且其取值为0.4,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。
上述技术方案的有益效果为:通过对做题答案中每一个语句包含的主语、谓语和宾语成分进行识别和转换,能够有效地对该做题答案进行最大限度的语义提炼与压缩,以此降低做题答案中噪声成分和提高后续转换得到语义向量的准确性;此外,通过上述公式(1),能够全面地对任意两个学生对应的语义向量进行语义比对,从而确定两个不同语义向量之间的语义项差异比对结果,以便于快速地和精确地确定两个不同做题答案之间的语义差别结果。
优选地,该相似度评价结果生成模块根据该语义项比对结果,确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括:
根据该语义项比对结果与下面公式(2),确定所该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价值:
Figure BDA0002710416560000121
在上述公式(2)中,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,α表示预设相似度评价系数、且其取值为0.6,β表示预设比对系数、且其取值为0.4,n表示学生的总数量,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。
上述技术方案的有益效果为:通过上述公式(2),能够从语义层面上最大限度地确定两个不同学生的做题答案之间的语义相似度,从而对两个不同学生的做题答案之前的语义相似程度进行量化评判和提高后续学生做题评分的有效性。
优选地,该评分作答分值确定模块根据该相似度评价结果,确定该目标学生的该预设语文主观题的作答分值具体包括:
根据该相似度评价结果以及下面公式(3),确定该目标学生的该预设语文主观题的作答分值:
Figure BDA0002710416560000131
在上述公式(3)中,F表示该第i个学生的该预设语文主观题的作答分值,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,n表示学生的总数量,M表示该预设语文主观题的满分值,μ[]表示阶跃函数、且当[]内的数值大于或者等于0,阶跃函数的结果为1,当[]内的数值小于0,阶跃函数的结果为0。
上述技术方案的有益效果为:通过上述公式(3),能够便于通过相应的评分规则进行关于任意两个不同学生的语文主观题做答评分,从而最大限度地提高语文主观题作答评分的客观性和可靠性。
从上述实施例的内容可知,该基于大数据的智能语文主观题评分方法和系统通过获取若干学生关于预设语文主观题对应的做题答案,并对该做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果,并根据该语义项比对结果,确定该目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果,再根据该相似度评价结果,确定该目标学生的该预设语文主观题的作答分值;可见,该基于大数据的智能语文主观题评分方法和系统有别于现有技术的通过阅卷人员对语文主观题进行评分的方式,其通过获取任意两个学生的做题答案,并该做题答案以此进行语义识别与转换处理、语义项比对处理和评分作答分值计算来最终确定学生对语文主观题的评分得分,其在语义层面上对语文主观题的做题答案进行识别比对,以此提高语文主观题作答评分的客观性和可靠性,并且还能够便于不同学生之间针对语文主观题进行充分和全面的交流评分,从而提高学生的语文学习兴趣与质量。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.基于大数据的智能语文主观题评分方法,其特征在于,其包括如下步骤:
步骤S1,获取若干学生关于预设语文主观题对应的做题答案,并对所述做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果;
步骤S2,根据所述语义项比对结果,确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果;
步骤S3,根据所述相似度评价结果,确定所述目标学生的所述预设语文主观题的作答分值。
2.如权利要求1所述的基于大数据的智能语文主观题评分方法,其特征在于:
在所述步骤S1中,获取若干学生关于预设语文主观题对应的做题答案,并对所述做题答案进行语义识别与转换处理,以此获得对应的语义向量,再将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果具体包括:
步骤S101,获取若干学生关于预设语文主观题对应的做题答案,并将所述做题答案,并对所述做题答案进行特征词的识别处理,从而确定所述做题答案中每一个语句包含的主语文本、谓语文本和宾语文本;
步骤S102,将同一语句包含的主语文本、谓语文本和宾语文本共同转换为语义向量;
步骤S103,根据下面公式(1),将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果:
Figure FDA0002710416550000021
在上述公式(1)中,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,Ai表示第i个学生的语义向量,Aj表示第j个学生的语义向量,n表示学生的总数量,m表示除第i个学生之外的其他学生的总数、且m的取值为n-1,β表示预设比对系数、且其取值为0.4,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。
3.如权利要求2所述的基于大数据的智能语文主观题评分方法,其特征在于:
在所述步骤S2中,根据所述语义项比对结果,确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括:
根据所述语义项比对结果与下面公式(2),确定所所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价值:
Figure FDA0002710416550000022
在上述公式(2)中,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,α表示预设相似度评价系数、且其取值为0.6,β表示预设比对系数、且其取值为0.4,n表示学生的总数量,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。
4.如权利要求3所述的基于大数据的智能语文主观题评分方法,其特征在于:
在所述步骤S3中,根据所述相似度评价结果,确定所述目标学生的所述预设语文主观题的作答分值具体包括:
根据所述相似度评价结果以及下面公式(3),确定所述目标学生的所述预设语文主观题的作答分值:
Figure FDA0002710416550000031
在上述公式(3)中,F表示所述第i个学生的所述预设语文主观题的作答分值,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,n表示学生的总数量,M表示所述预设语文主观题的满分值,μ[]表示阶跃函数、且当[]内的数值大于或者等于0,阶跃函数的结果为1,当[]内的数值小于0,阶跃函数的结果为0。
5.基于大数据的智能语文主观题评分系统,其特征在于,其包括做题答案识别模块、语义向量生成模块、语义项比对结果生成模块、相似度评价结果生成模块和评分作答分值确定模块;其中,
所述做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案,并对所述做题答案进行语义识别处理;
所述语义向量生成模块用于对所述语义识别处理的结果进行转换处理,以此获得对应的语义向量;
所述语义项比对结果生成模块用于将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果;
所述相似度评价结果生成模块用于根据所述语义项比对结果,确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果;
所述评分作答分值确定模块用于根据所述相似度评价结果,确定所述目标学生的所述预设语文主观题的作答分值。
6.如权利要求5所述的基于大数据的智能语文主观题评分系统,其特征在于:
所述做题答案识别模块用于获取若干学生关于预设语文主观题对应的做题答案,并对所述做题答案进行语义识别处理具体包括:
获取若干学生关于预设语文主观题对应的做题答案,并将所述做题答案,并对所述做题答案进行特征词的识别处理,从而确定所述做题答案中每一个语句包含的主语文本、谓语文本和宾语文本;
以及,
所述语义向量生成模块对所述语义识别处理的结果进行转换处理,以此获得对应的语义向量具体包括:
将同一语句包含的主语文本、谓语文本和宾语文本共同转换为语义向量;以及,
所述语义项比对结果生成模块将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果具体包括:
根据下面公式(1),将目标学生对应的语义向量分别与其他每一个学生对应的语义向量进行比对,从而获得相应的语义项比对结果:
Figure FDA0002710416550000041
在上述公式(1)中,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,Ai表示第i个学生的语义向量,Aj表示第j个学生的语义向量,n表示学生的总数量,m表示除第i个学生之外的其他学生的总数、且m的取值为n-1,β表示预设比对系数、且其取值为0.4,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。
7.如权利要求6所述的基于大数据的智能语文主观题评分系统,其特征在于:
所述相似度评价结果生成模块根据所述语义项比对结果,确定所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价结果具体包括:
根据所述语义项比对结果与下面公式(2),确定所所述目标学生分别与其他每一个学生对应的做题答案之间的相似度评价值:
Figure FDA0002710416550000051
在上述公式(2)中,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,Y(Ai,Aj)表示第i个学生的语义向量与第j个学生的语义向量之间的语义项比对值,α表示预设相似度评价系数、且其取值为0.6,β表示预设比对系数、且其取值为0.4,n表示学生的总数量,Sim(Ai,Aj)表示第i个学生的做题答案包含的单词或词组与第j个学生的做题答案包含的单词或词组之间的词义相似度。
8.如权利要求7所述的基于大数据的智能语文主观题评分系统,其特征在于:
所述评分作答分值确定模块根据所述相似度评价结果,确定所述目标学生的所述预设语文主观题的作答分值具体包括:
根据所述相似度评价结果以及下面公式(3),确定所述目标学生的所述预设语文主观题的作答分值:
Figure FDA0002710416550000052
在上述公式(3)中,F表示所述第i个学生的所述预设语文主观题的作答分值,Q(Ai,Aj)表示第i个学生的做题答案与第j个学生的做题答案之间的相似度评价值,n表示学生的总数量,M表示所述预设语文主观题的满分值,μ[]表示阶跃函数、且当[]内的数值大于或者等于0,阶跃函数的结果为1,当[]内的数值小于0,阶跃函数的结果为0。
CN202011054095.7A 2020-09-29 2020-09-29 基于大数据的智能语文主观题评分方法和系统 Pending CN112131889A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011054095.7A CN112131889A (zh) 2020-09-29 2020-09-29 基于大数据的智能语文主观题评分方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011054095.7A CN112131889A (zh) 2020-09-29 2020-09-29 基于大数据的智能语文主观题评分方法和系统

Publications (1)

Publication Number Publication Date
CN112131889A true CN112131889A (zh) 2020-12-25

Family

ID=73844843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011054095.7A Pending CN112131889A (zh) 2020-09-29 2020-09-29 基于大数据的智能语文主观题评分方法和系统

Country Status (1)

Country Link
CN (1) CN112131889A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595129A (zh) * 2023-06-12 2023-08-15 广州市南方人力资源评价中心有限公司 一种基于知识点标注的主观题评分方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595129A (zh) * 2023-06-12 2023-08-15 广州市南方人力资源评价中心有限公司 一种基于知识点标注的主观题评分方法和装置
CN116595129B (zh) * 2023-06-12 2023-10-27 广州市南方人力资源评价中心有限公司 一种基于知识点标注的主观题评分方法和装置

Similar Documents

Publication Publication Date Title
CN110110585B (zh) 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN110196901B (zh) 对话系统的构建方法、装置、计算机设备和存储介质
CN110096698B (zh) 一种考虑主题的机器阅读理解模型生成方法与系统
US11409964B2 (en) Method, apparatus, device and storage medium for evaluating quality of answer
US20070033017A1 (en) Spoken language proficiency assessment by computer
CN110347787B (zh) 一种基于ai辅助面试场景的面试方法、装置及终端设备
CN112468659B (zh) 应用于电话客服的质量评价方法、装置、设备及存储介质
CN112487139A (zh) 基于文本的自动出题方法、装置及计算机设备
CN114416943B (zh) 对话模型的训练方法、装置、电子设备及存储介质
CN111414746A (zh) 一种匹配语句确定方法、装置、设备及存储介质
CN110717021A (zh) 人工智能面试中获取输入文本和相关装置
CN113111152A (zh) 一种基于知识蒸馏和情绪集成模型的抑郁症检测方法
CN110852071A (zh) 知识点检测方法、装置、设备及可读存储介质
CN112131889A (zh) 基于大数据的智能语文主观题评分方法和系统
CN115497455B (zh) 一种英语口语考试语音智能评测方法、系统及装置
Wang et al. Automatic Detection of Off-Topic Spoken Responses Using Very Deep Convolutional Neural Networks.
CN113627722B (zh) 基于关键字分词的简答题评分方法、终端及可读存储介质
CN110674871B (zh) 面向翻译译文的自动评分方法及自动评分系统
CN114186020A (zh) 一种语义联想方法
CN115017886A (zh) 文本匹配方法、文本匹配装置、电子设备及存储介质
CN109582971B (zh) 一种基于句法分析的批改方法及批改系统
CN112163975A (zh) 智能学习指引和提示方法与系统
CN112732908A (zh) 试题新颖度评估方法、装置、电子设备和存储介质
CN112163768A (zh) 语文阅读评分方法和系统
CN111243364A (zh) 一种基于HanLP的注册电气工程师考试主观题自动评分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination