CN112288145A - 基于多视角认知诊断的学生成绩预测方法 - Google Patents

基于多视角认知诊断的学生成绩预测方法 Download PDF

Info

Publication number
CN112288145A
CN112288145A CN202011103050.4A CN202011103050A CN112288145A CN 112288145 A CN112288145 A CN 112288145A CN 202011103050 A CN202011103050 A CN 202011103050A CN 112288145 A CN112288145 A CN 112288145A
Authority
CN
China
Prior art keywords
test question
student
parameters
model
word vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011103050.4A
Other languages
English (en)
Other versions
CN112288145B (zh
Inventor
刘凡
陈智斌
崔闰杰
许峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202011103050.4A priority Critical patent/CN112288145B/zh
Publication of CN112288145A publication Critical patent/CN112288145A/zh
Application granted granted Critical
Publication of CN112288145B publication Critical patent/CN112288145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Educational Technology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多视角认知诊断的学生成绩预测方法,对给定考试成绩进行分析确定学生‑试题反应函数,将第一词向量预训练模型作为一个视角对第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,以确定预测用模型,提取待考试试题文本的各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,确定目标试题参数,将目标试题参数代入学生‑试题反应函数,得到目标学生参数相对于待考试试题文本的考试成绩,以实现学生成绩预测,提升了预测得到的结果的准确性。

Description

基于多视角认知诊断的学生成绩预测方法
技术领域
本发明涉及认知诊断技术领域,尤其涉及一种基于多视角认知诊断的学生成绩预测方法。
背景技术
认知诊断与传统的大规模考试不同,传统的考试只能提供学生每道题的答题情况。然而由单一的分数,既不能获得学生的潜在知识状态与认知水平,也不能对学生近阶段的学习情况给予精确的分析,以调整学生下一阶段的学习。
学生是在线教育系统服务的主要对象,准确分析学生的认知水平,对帮助了解学生状态、构建适当的教学计划都具有极大的帮助。为此,教育心理学的研究者提出认知诊断评价(Cognitive Diagnosis Assessment,CDA),进行学生认知水平的全面分析。CDA是一个基于认知心理学、统计学和计算机科学的评价体系,通过对学生的答题数据进行建模分析,对学生的认知状态进行诊断,定量考察学生的个体差异和认知水平。
认知诊断模型在不同的场景下有不同的应用,根据模型设计的不同,可以分析学生的知识掌握状态,猜测率与失误率等。根据分析结果的维度,认知诊断模型可以分为单维人资诊断模型与多维认知诊断模型。单维即分析结果使用单个的标量表示,例如项目反应理论(ItemResponse Theory,IRT)。这样的模型对于复杂的学生隐藏属性较难分析。因此自然的就有多维的认知诊断模型,例如多维项目反应理论(Multidimensional ItemResponse Theory,MIRT)。MIRT中有多种模型,例如双参数逻辑模型的多维扩展(Multidimensional extension of Two-Parameter Logisticmodel,M2PL)(Reckase,M.:Multidimensional Item Response Theory,vol.150.Springer,New York(2009)),M2PL中包含了两组试题的相关参数:试题的区别参数与试题的难度参数。
普通的认知诊断模型难以对试题文本这种异构信息分析建模,而试题文本是考试成绩评估中的重要信息。仅仅通过离散的题目序号与答题记录丢失了大量信息。Zhu(ZhuT,Liu Q,Huang Z,et al.MT-MCD:A Multi-task Cognitive Diagnosis Framework forStudent Assessment[C]//International Conference on Database Systems forAdvanced Applications.Springer,Cham,2018:318-335.)提出对试题文本提取信息并使用映射矩阵获得其参数,矩阵用于多任务学习以使各个不同的任务之间具有更强的可比较性。Wang(Wang F,Liu Q,Chen E,et al.Neural Cognitive Diagnostic for IntelligentEducation Systems,The 34th AAAI Conference on Artificial Intelligence,NewYork,USA.)提出使用神经网络自动学习反应函数,并将试题文本和知识点-试题关联信息嵌入神经网络。
近年来,大量的从多视角的数据来学习的方法被提出。多视角的数据来源可以是不同的数据源或不同的特征子集。例如一个人可以通过指纹,面部,书写字迹来区别;一张图片可以通过像素信息或用语言描述。多视角分为三个方向:联合训练,多核学习与子空间学习。其中联合训练通过交替训练来达到不同视角的共识最大化。多核学习利用通常对应不同视角的核,通过线性或非线性的方法将其结合起来。子空间学习假设所有的视角都共享同一个隐藏子空间,子空间学习则试图找到这个共享空间。
传统的方法是将不同视角的数据源简单相加,但这样既没有实际意义,又容易导致过拟合。联合训练提出,在每一个迭代过程中,一个视角的模型对验证集进行标注并将其加入另一视角的模型的下一迭代过程的训练集中。通过交替训练最终达到两个数据源的融合。
近年来,虽然随着NLP的发展,利用试题文本信息来进一步挖掘学生与试题间的关系的难度一步步降低,但是现在的自然语言处理方法还是不能很好的获取与评估试题的参数。同时教育数据是隐私数据,大规模且具有丰富信息的教育数据往往难以获取,对于小样本的数据,由于试题文本量小,难以通过认知诊断模型结合自然语言处理方法,使模型学会很好的获得试题的信息,容易导致过拟合。可见传统挖掘学生与试题间的关系的方案往往容易出现过拟合等问题,导致所得到的结果准确性低。
发明内容
针对以上问题,本发明提出一种基于多视角认知诊断的学生成绩预测方法。
为实现本发明的目的,提供一种基于多视角认知诊断的学生成绩预测方法,包括如下步骤:
S10,使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,根据目标学生参数与给定试题参数得到学生-试题反应函数;
S20,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息;所述给定试题文本为目标学生获得给定考试成绩的试题文本;
S40,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型;
S50,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;
S60,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩。
在一个实施例中,根据目标学生参数与给定试题参数得到学生-试题反应函数包括:
选取认知诊断模型对目标学生参数与给定试题参数进行机器学习,得到学生-试题反应函数;所述学生-试题反应函数拗口:
P(Yuv=1|θuv)≡f(θuv),
其中,Yuv为学生u回答给定试题文本试题v的情况,θu为学生u的隐藏属性,ξv为试题的参数,P(Yuv=1|θuv)学生u答对试题v的概率,f(θuv)为认知诊断模型的学生-试题反应函数,符号≡表示概率P可以表示为函数f。。
在一个实施例中,所述第一词向量预训练模型为fasttext;所述第二词向量预训练模型为ernie。
具体地,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息包括:
将给定试题文本中的文本划分为词,将每个词对应得到fasttext的预训练词向量,以确定第一试题文本信息;使用ernie直接对给定试题文本提取文本信息,得到每个词的向量表示,以确定第二试题文本信息。
具体地,第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型包括:
S41,根据所述目标学生参数与给定试题参数确定训练集T和验证集Z;计算第一词向量预训练模型在验证集Z上的预测试题参数ZA
S42,计算第二词向量预训练模型在验证集Z上的预测试题参数ZB
S43,将ZA加入训练集T,得到新训练集TB=T∪ZA;将ZB加入训练集T,得到新训练集TA=T∪ZB,将TA,TB分别确定为第一词向量预训练模型和第二词向量预训练模型在下一迭代过程中的训练集;
S44,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,得到利用第一词向量预训练模型提取的文本信息预测试题参数的模型
Figure BDA0002726052060000041
利用第二试题文本信息提取的文本信息预测试题参数的模型
Figure BDA0002726052060000042
在模型
Figure BDA0002726052060000043
和模型
Figure BDA0002726052060000044
中选取一个模型作为预测用模型。
具体地,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;包括:
S51,对于待考试试题文本,采用预测用模型预测每一道试题的参数
Figure BDA0002726052060000045
S52,计算已有的试题文本中每道题的参数
Figure BDA0002726052060000046
S53,计算
Figure BDA0002726052060000047
Figure BDA0002726052060000048
中每道试题的参数
Figure BDA0002726052060000049
的余弦相似度aij
S54,选择余弦相似度aij最高的K个预测试题参数,将相似度作为权重对K个预测试题参数进行加权求和得到目标试题参数。
在一个实施例中,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩包括:
以目标试题参数为依据使用学生-试题反应函数估计目标学生答对待考试试题文本中各个考题的概率,若概率大于等于设定阈值,则判定目标学生能答对该题,若概率小于设定阈值,则判定目标学生不能答对该题;根据目标学生针对各个考题能否答对的结果确定目标学生参数相对于待考试试题文本的考试成绩。
上述基于多视角认知诊断的学生成绩预测方法,通过使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,确定学生-试题反应函数,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数,将目标试题参数代入所述学生-试题反应函数,得到目标学生参数相对于待考试试题文本的考试成绩,整个预测过程中准确性高,可以有效避免出现过拟合等问题,提升了预测得到的结果的准确性。
附图说明
图1是一个实施例的基于多视角认知诊断的学生成绩预测方法流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参考图1所示,图1为一个实施例的基于多视角认知诊断的学生成绩预测方法流程图,包括如下步骤:
S10,使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,根据目标学生参数与给定试题参数得到学生-试题反应函数。
上述给定试题参数包括给定试题文本中各个试题的参数。
S20,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息;所述给定试题文本为目标学生获得给定考试成绩的试题文本,即目标学生针对给定试题文本考试,获得给定考试成绩。
上述第一词向量预训练模型和第二词向量预训练模型可以为不同的向量预训练模型,比如第一词向量预训练模型可以为fasttext(facebook提出的词向量预训练模型),第二词向量预训练模型可以为ernie(百度提出的词向量预训练模型)。
S40,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型。
S50,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数分别与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数。
上述K为正整数,具体可以取预测试题参数的总数的80%等值。预测试题参数包括待考试试题文本中各个考题的试题参数。余弦相似度最高的K个预测试题参数包括待考试试题文本中与给定试题文本中试题最相似又能够充分表征待考试试题文本的各个考题的试题参数。
具体地,上述步骤可以对K个预测试题参数进行加权求和,以得到目标试题参数。
S60,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩。
上述学生-试题反应函数为记载试题参数和目标学生考试成绩之间对应关系的参数。
上述基于多视角认知诊断的学生成绩预测方法,通过使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,确定学生-试题反应函数,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数,将目标试题参数代入所述学生-试题反应函数,得到目标学生参数相对于待考试试题文本的考试成绩,整个预测过程中准确性高,可以有效避免出现过拟合等问题,提升了预测得到的结果的准确性。
在一个实施例中,根据目标学生参数与给定试题参数得到学生-试题反应函数包括:
选取认知诊断模型对目标学生参数与给定试题参数进行机器学习,得到学生-试题反应函数;所述学生-试题反应函数拗口:
P(Yuv=1|θuv)≡f(θuv),
其中,Yuv为学生u回答给定试题文本试题v的情况,θu为学生u的隐藏属性,ξv为试题的参数,P(Yuv=1|θuv)学生u答对试题v的概率,f(θuv)为认知诊断模型的学生-试题反应函数,符号≡表示概率P可以表示为函数f。
在一个示例中,还可以计算所有学生对给定试题文本中所有试题的极大似然函数,使用优化方法对极大似然函数迭代使其达到最大,上述极大似然函数为:
L=∏UV(Yuv)P(Yuv=1|θuv)+(1-Yuv)(1-P(Yuv=1|θuv))=∏UV(Yuv)f(θuv)+(1-(Yuv))(1-f(θuv)),
其中,Yuv为学生u回答试题v的情况,θu为学生的隐藏属性,ξv为试题的参数,P(Yuv=1|θuv)学生u答对试题v的概率,f(θuv)为认知诊断模型的学生-试题反应函数。
在一个实施例中,所述第一词向量预训练模型为fasttext;所述第二词向量预训练模型为ernie。
具体地,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息包括:
将给定试题文本中的文本划分为词,将每个词对应得到fasttext的预训练词向量,以确定第一试题文本信息;使用ernie直接对给定试题文本提取文本信息,得到每个词的向量表示,以确定第二试题文本信息。
进一步地,本实施例可以对试题文本,使用jieba分词工具将文本划分为词,每个词对应得到fasttext的预训练词向量;使用ernie直接提取相应文本信息,得到每个字的向量表示。
具体地,第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型包括:
S41,根据所述目标学生参数与给定试题参数确定训练集T和验证集Z;计算第一词向量预训练模型在验证集Z上的预测试题参数ZA;预测试题参数包括相应文本中各个试题的参数;
S42,计算第二词向量预训练模型在验证集Z上的预测试题参数ZB
S43,将ZA加入训练集T,得到新训练集TB=T∪ZA;将ZB加入训练集T,得到新训练集TA=T∪ZB,将TA,TB分别确定为第一词向量预训练模型和第二词向量预训练模型在下一迭代过程中的训练集;
S44,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,得到利用第一词向量预训练模型提取的文本信息预测试题参数的模型
Figure BDA0002726052060000081
利用第二试题文本信息提取的文本信息预测试题参数的模型
Figure BDA0002726052060000082
在模型
Figure BDA0002726052060000083
和模型
Figure BDA0002726052060000084
中选取一个模型作为预测用模型。
在一个示例中,以第一词向量预训练模型为fasttext,第二词向量预训练模型为ernie为例。记利用fasttext提取的文本信息预测试题参数的模型为A,利用ernie提取的文本信息预测试题参数的模型为B。在每一步的迭代过程中可以包括:
4.1计算A在验证集Z上的预测试题参数ZA
4.2计算B在验证集Z上的预测试题参数ZB
4.3将ZA加入训练集T,得到新训练集TB=T∪ZA;将ZB加入训练集T,得到新训练集TA=T∪ZB。TA,TB分别为A,B在下一迭代过程中的训练集。
4.4反复迭代,最终得到利用fasttext提取的文本信息预测试题参数的模型
Figure BDA0002726052060000085
利用ernie提取的文本信息预测试题参数的模型
Figure BDA0002726052060000086
具体地,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;包括:
S51,对于待考试试题文本,采用预测用模型预测每一道试题的参数
Figure BDA0002726052060000091
S52,计算已有的试题文本中每道题的参数
Figure BDA0002726052060000092
S53,计算
Figure BDA0002726052060000093
Figure BDA0002726052060000094
中每道试题的参数
Figure BDA0002726052060000095
的余弦相似度aij
S54,选择余弦相似度aij最高的K个预测试题参数,将相似度作为权重对K个预测试题参数进行加权求和得到目标试题参数(最终试题的预测参数)。
上述加权求和的过程可以包括:
Figure BDA0002726052060000096
ξi表示最终试题的预测参数。
在一个实施例中,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩包括:
以目标试题参数为依据使用学生-试题反应函数f(θuv)估计目标学生答对待考试试题文本中各个考题的概率P(Yuv=1|θuv),若概率大于等于设定阈值,则判定目标学生能答对该题,若概率小于设定阈值,则判定目标学生不能答对该题;根据目标学生针对各个考题能否答对的结果确定目标学生参数相对于待考试试题文本的考试成绩。
上述设定阈值可以设置为0.5等值。
在一个实施例中,上述步骤S40之前,还包括:
S30,构建预测试题参数的神经网络,用于拟合S10分析得到的试题参数(给定试题参数)。
具体地,步骤S30的具体过程包括:
定义Fv为步骤S30对试题v提取的信息(给定试题参数)。
接下来以ernie为例进行说明,fasttext类似。
3.1首先对所有Fv,Fv为n×D的矩阵,其中n为试题v的字或词向量数,D在fasettext中默认为300,在ernie中默认为768。F′v=Fv×W,W为
Figure BDA0002726052060000097
的矩阵。
3.2将3.1得到的F′v经过LSTM(长短期记忆,Long Short Term Memory)获得前向向量
Figure BDA0002726052060000098
与反向向量
Figure BDA0002726052060000099
并将两个拼接,记拼接得到的向量为εv
3.3将步骤1得到的学生隐藏属性θ求平均,得到
Figure BDA00027260520600000910
3.4拼接3.2中得到的εv经过两个全连接层获得的向量,与3.3中得到的
Figure BDA00027260520600000911
经过两个全连接层获得的向量,并将其记为Xv
3.5将3.4得到的Xv经过最后一个全连接层得到试题v的预测参数
Figure BDA0002726052060000101
3.6将3.5得到的
Figure BDA0002726052060000102
与真实的试题参数ξv比较,得到损失函数:
Figure BDA0002726052060000103
3.7根据步骤1得到的θu与3.5得到的
Figure BDA0002726052060000104
利用步骤1使用的反应函数
Figure BDA0002726052060000105
预测学生的答题情况Y′uv,从而得到全体学生的对所有试题的答题情况Y′。
3.8统计真实的答题情况Y,与预测的答题情况Y′,计算Y的正确率r,与Y′的正确率r′,在loss中引入正则项λ×|r-r′|×|Y′-thres|,则3.6中的loss变为:
Figure BDA0002726052060000106
从而目标函数为:
Figure BDA0002726052060000107
其中thres为预设的目标阈值。
本申请提供的基于多视角认知诊断的学生成绩预测方法具有如下技术效果:
本申请提供的学生成绩预测方法,由于对试题文本信息建模使得学生与试题间的相关信息被进一步挖掘。
对来自fasttext与ernie提取的不同文本信息采用多视角学习方法,融合多个来源的试题信息,能够充分的获取文本信息,使得在小样本的情况下,也能使模型较好的学习如何预测试题参数,从而对学生的成绩进行更精准的预测。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本申请实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (7)

1.一种基于多视角认知诊断的学生成绩预测方法,其特征在于,包括如下步骤:
S10,使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,根据目标学生参数与给定试题参数得到学生-试题反应函数;
S20,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息;所述给定试题文本为目标学生获得给定考试成绩的试题文本;
S40,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型;
S50,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;
S60,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩。
2.根据权利要求1所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,根据目标学生参数与给定试题参数得到学生-试题反应函数包括:
选取认知诊断模型对目标学生参数与给定试题参数进行机器学习,得到学生-试题反应函数;所述学生-试题反应函数拗口:
P(Yuv=1|θu,ξv)≡f(θu,ξv),
其中,Yuv为学生u回答给定试题文本试题v的情况,θu为学生u的隐藏属性,ξv为试题的参数,P(Yuv=1|θu,ξv)学生u答对试题v的概率,f(θu,ξv)为认知诊断模型的学生-试题反应函数,符号≡表示概率P表示为函数f。
3.根据权利要求1所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,所述第一词向量预训练模型为fasttext;所述第二词向量预训练模型为ernie。
4.根据权利要求3所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息包括:
将给定试题文本中的文本划分为词,将每个词对应得到fasttext的预训练词向量,以确定第一试题文本信息;使用ernie直接对给定试题文本提取文本信息,得到每个词的向量表示,以确定第二试题文本信息。
5.根据权利要求3所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型包括:
S41,根据所述目标学生参数与给定试题参数确定训练集T和验证集Z;计算第一词向量预训练模型在验证集Z上的预测试题参数ZA
S42,计算第二词向量预训练模型在验证集Z上的预测试题参数ZB
S43,将ZA加入训练集T,得到新训练集TB=T∪ZA;将ZB加入训练集T,得到新训练集TA=T∪ZB,将TA,TB分别确定为第一词向量预训练模型和第二词向量预训练模型在下一迭代过程中的训练集;
S44,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,得到利用第一词向量预训练模型提取的文本信息预测试题参数的模型
Figure FDA0002726052050000021
利用第二试题文本信息提取的文本信息预测试题参数的模型
Figure FDA0002726052050000022
在模型
Figure FDA0002726052050000023
和模型
Figure FDA0002726052050000024
中选取一个模型作为预测用模型。
6.根据权利要求5所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;包括:
S51,对于待考试试题文本,采用预测用模型预测每一道试题的参数
Figure FDA0002726052050000025
S52,计算已有的试题文本中每道题的参数
Figure FDA0002726052050000026
S53,计算
Figure FDA0002726052050000027
Figure FDA0002726052050000028
中每道试题的参数
Figure FDA0002726052050000029
的余弦相似度aij
S54,选择余弦相似度aij最高的K个预测试题参数,将相似度作为权重对K个预测试题参数进行加权求和得到目标试题参数。
7.根据权利要求5所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩包括:
以目标试题参数为依据使用学生-试题反应函数估计目标学生答对待考试试题文本中各个考题的概率,若概率大于等于设定阈值,则判定目标学生能答对该题,若概率小于设定阈值,则判定目标学生不能答对该题;根据目标学生针对各个考题能否答对的结果确定目标学生参数相对于待考试试题文本的考试成绩。
CN202011103050.4A 2020-10-15 2020-10-15 基于多视角认知诊断的学生成绩预测方法 Active CN112288145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011103050.4A CN112288145B (zh) 2020-10-15 2020-10-15 基于多视角认知诊断的学生成绩预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011103050.4A CN112288145B (zh) 2020-10-15 2020-10-15 基于多视角认知诊断的学生成绩预测方法

Publications (2)

Publication Number Publication Date
CN112288145A true CN112288145A (zh) 2021-01-29
CN112288145B CN112288145B (zh) 2022-08-05

Family

ID=74497111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011103050.4A Active CN112288145B (zh) 2020-10-15 2020-10-15 基于多视角认知诊断的学生成绩预测方法

Country Status (1)

Country Link
CN (1) CN112288145B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114282531A (zh) * 2021-08-24 2022-04-05 腾讯科技(深圳)有限公司 一种题目检测方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160358094A1 (en) * 2015-06-02 2016-12-08 International Business Machines Corporation Utilizing Word Embeddings for Term Matching in Question Answering Systems
CN108171358A (zh) * 2017-11-27 2018-06-15 科大讯飞股份有限公司 成绩预测方法及装置、存储介质、电子设备
CN110264091A (zh) * 2019-06-24 2019-09-20 中国科学技术大学 学生认知诊断方法
CN110651294A (zh) * 2017-05-19 2020-01-03 日益得有限公司 估计考试分数的方法、设备及计算机程序
CN111241243A (zh) * 2020-01-13 2020-06-05 华中师范大学 面向知识测量的试题、知识、能力张量构建与标注方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160358094A1 (en) * 2015-06-02 2016-12-08 International Business Machines Corporation Utilizing Word Embeddings for Term Matching in Question Answering Systems
CN110651294A (zh) * 2017-05-19 2020-01-03 日益得有限公司 估计考试分数的方法、设备及计算机程序
CN108171358A (zh) * 2017-11-27 2018-06-15 科大讯飞股份有限公司 成绩预测方法及装置、存储介质、电子设备
CN110264091A (zh) * 2019-06-24 2019-09-20 中国科学技术大学 学生认知诊断方法
CN111241243A (zh) * 2020-01-13 2020-06-05 华中师范大学 面向知识测量的试题、知识、能力张量构建与标注方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114282531A (zh) * 2021-08-24 2022-04-05 腾讯科技(深圳)有限公司 一种题目检测方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN112288145B (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN109919810B (zh) 在线学习系统中的学生建模与个性化课程推荐方法
CN110516116B (zh) 一种多步分层的学习者认知水平挖掘方法及系统
Whitehill et al. Whose vote should count more: Optimal integration of labels from labelers of unknown expertise
Morozov et al. On self-supervised image representations for GAN evaluation
CN111611486B (zh) 基于在线教育大数据的深度学习样本标注方法
KR101895959B1 (ko) 기계학습 프레임워크의 분석 결과를 해석하는 방법, 장치 및 컴퓨터 프로그램
CN113902129A (zh) 多模态的统一智能学习诊断建模方法、系统、介质、终端
CN114913729A (zh) 一种选题方法、装置、计算机设备和存储介质
Chu et al. Click-based student performance prediction: a clustering guided meta-learning approach
CN112686462A (zh) 基于学生画像的异常检测方法、装置、设备及存储介质
Casalino et al. Incremental and adaptive fuzzy clustering for virtual learning environments data analysis
CN110457523B (zh) 封面图片的选取方法、模型的训练方法、装置及介质
CN115310520A (zh) 融合多特征的深度知识追踪方法及习题推荐方法
CN112288145B (zh) 基于多视角认知诊断的学生成绩预测方法
Wang et al. Educational question mining at scale: Prediction, analysis and personalization
CN113283488B (zh) 一种基于学习行为的认知诊断方法及系统
Batra et al. DMCNet: Diversified model combination network for understanding engagement from video screengrabs
CN115757112A (zh) 基于变异分析的测试子集构建方法及相关设备
CN115935969A (zh) 基于多模态信息融合的异构数据特征提取方法
Jasim et al. Characteristics of data mining by classification educational dataset to improve student’s evaluation
Lin et al. Out-of-distribution detection with hilbert-schmidt independence optimization
Wang et al. Large-scale educational question analysis with partial variational auto-encoders
de Almeida Lima et al. Educational Data Mining: A Hybrid Approach to Predicting Academic Performance of Students.
Zhan et al. A diagnostic classification analysis of problem-solving competence using process data
CN114037571A (zh) 试题扩充方法及相关装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant