CN112288145A - 基于多视角认知诊断的学生成绩预测方法 - Google Patents
基于多视角认知诊断的学生成绩预测方法 Download PDFInfo
- Publication number
- CN112288145A CN112288145A CN202011103050.4A CN202011103050A CN112288145A CN 112288145 A CN112288145 A CN 112288145A CN 202011103050 A CN202011103050 A CN 202011103050A CN 112288145 A CN112288145 A CN 112288145A
- Authority
- CN
- China
- Prior art keywords
- test question
- student
- parameters
- model
- word vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000001149 cognitive effect Effects 0.000 title claims abstract description 46
- 238000003745 diagnosis Methods 0.000 title claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 154
- 239000013598 vector Substances 0.000 claims abstract description 116
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000012795 verification Methods 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims description 326
- 230000006870 function Effects 0.000 claims description 35
- 230000000007 visual effect Effects 0.000 claims description 12
- 238000005316 response function Methods 0.000 claims description 6
- 238000010200 validation analysis Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000007476 Maximum Likelihood Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 description 1
- 230000006998 cognitive state Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007435 diagnostic evaluation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- QVRVXSZKCXFBTE-UHFFFAOYSA-N n-[4-(6,7-dimethoxy-3,4-dihydro-1h-isoquinolin-2-yl)butyl]-2-(2-fluoroethoxy)-5-methylbenzamide Chemical compound C1C=2C=C(OC)C(OC)=CC=2CCN1CCCCNC(=O)C1=CC(C)=CC=C1OCCF QVRVXSZKCXFBTE-UHFFFAOYSA-N 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Educational Technology (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多视角认知诊断的学生成绩预测方法,对给定考试成绩进行分析确定学生‑试题反应函数,将第一词向量预训练模型作为一个视角对第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,以确定预测用模型,提取待考试试题文本的各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,确定目标试题参数,将目标试题参数代入学生‑试题反应函数,得到目标学生参数相对于待考试试题文本的考试成绩,以实现学生成绩预测,提升了预测得到的结果的准确性。
Description
技术领域
本发明涉及认知诊断技术领域,尤其涉及一种基于多视角认知诊断的学生成绩预测方法。
背景技术
认知诊断与传统的大规模考试不同,传统的考试只能提供学生每道题的答题情况。然而由单一的分数,既不能获得学生的潜在知识状态与认知水平,也不能对学生近阶段的学习情况给予精确的分析,以调整学生下一阶段的学习。
学生是在线教育系统服务的主要对象,准确分析学生的认知水平,对帮助了解学生状态、构建适当的教学计划都具有极大的帮助。为此,教育心理学的研究者提出认知诊断评价(Cognitive Diagnosis Assessment,CDA),进行学生认知水平的全面分析。CDA是一个基于认知心理学、统计学和计算机科学的评价体系,通过对学生的答题数据进行建模分析,对学生的认知状态进行诊断,定量考察学生的个体差异和认知水平。
认知诊断模型在不同的场景下有不同的应用,根据模型设计的不同,可以分析学生的知识掌握状态,猜测率与失误率等。根据分析结果的维度,认知诊断模型可以分为单维人资诊断模型与多维认知诊断模型。单维即分析结果使用单个的标量表示,例如项目反应理论(ItemResponse Theory,IRT)。这样的模型对于复杂的学生隐藏属性较难分析。因此自然的就有多维的认知诊断模型,例如多维项目反应理论(Multidimensional ItemResponse Theory,MIRT)。MIRT中有多种模型,例如双参数逻辑模型的多维扩展(Multidimensional extension of Two-Parameter Logisticmodel,M2PL)(Reckase,M.:Multidimensional Item Response Theory,vol.150.Springer,New York(2009)),M2PL中包含了两组试题的相关参数:试题的区别参数与试题的难度参数。
普通的认知诊断模型难以对试题文本这种异构信息分析建模,而试题文本是考试成绩评估中的重要信息。仅仅通过离散的题目序号与答题记录丢失了大量信息。Zhu(ZhuT,Liu Q,Huang Z,et al.MT-MCD:A Multi-task Cognitive Diagnosis Framework forStudent Assessment[C]//International Conference on Database Systems forAdvanced Applications.Springer,Cham,2018:318-335.)提出对试题文本提取信息并使用映射矩阵获得其参数,矩阵用于多任务学习以使各个不同的任务之间具有更强的可比较性。Wang(Wang F,Liu Q,Chen E,et al.Neural Cognitive Diagnostic for IntelligentEducation Systems,The 34th AAAI Conference on Artificial Intelligence,NewYork,USA.)提出使用神经网络自动学习反应函数,并将试题文本和知识点-试题关联信息嵌入神经网络。
近年来,大量的从多视角的数据来学习的方法被提出。多视角的数据来源可以是不同的数据源或不同的特征子集。例如一个人可以通过指纹,面部,书写字迹来区别;一张图片可以通过像素信息或用语言描述。多视角分为三个方向:联合训练,多核学习与子空间学习。其中联合训练通过交替训练来达到不同视角的共识最大化。多核学习利用通常对应不同视角的核,通过线性或非线性的方法将其结合起来。子空间学习假设所有的视角都共享同一个隐藏子空间,子空间学习则试图找到这个共享空间。
传统的方法是将不同视角的数据源简单相加,但这样既没有实际意义,又容易导致过拟合。联合训练提出,在每一个迭代过程中,一个视角的模型对验证集进行标注并将其加入另一视角的模型的下一迭代过程的训练集中。通过交替训练最终达到两个数据源的融合。
近年来,虽然随着NLP的发展,利用试题文本信息来进一步挖掘学生与试题间的关系的难度一步步降低,但是现在的自然语言处理方法还是不能很好的获取与评估试题的参数。同时教育数据是隐私数据,大规模且具有丰富信息的教育数据往往难以获取,对于小样本的数据,由于试题文本量小,难以通过认知诊断模型结合自然语言处理方法,使模型学会很好的获得试题的信息,容易导致过拟合。可见传统挖掘学生与试题间的关系的方案往往容易出现过拟合等问题,导致所得到的结果准确性低。
发明内容
针对以上问题,本发明提出一种基于多视角认知诊断的学生成绩预测方法。
为实现本发明的目的,提供一种基于多视角认知诊断的学生成绩预测方法,包括如下步骤:
S10,使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,根据目标学生参数与给定试题参数得到学生-试题反应函数;
S20,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息;所述给定试题文本为目标学生获得给定考试成绩的试题文本;
S40,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型;
S50,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;
S60,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩。
在一个实施例中,根据目标学生参数与给定试题参数得到学生-试题反应函数包括:
选取认知诊断模型对目标学生参数与给定试题参数进行机器学习,得到学生-试题反应函数;所述学生-试题反应函数拗口:
P(Yuv=1|θu,ξv)≡f(θu,ξv),
其中,Yuv为学生u回答给定试题文本试题v的情况,θu为学生u的隐藏属性,ξv为试题的参数,P(Yuv=1|θu,ξv)学生u答对试题v的概率,f(θu,ξv)为认知诊断模型的学生-试题反应函数,符号≡表示概率P可以表示为函数f。。
在一个实施例中,所述第一词向量预训练模型为fasttext;所述第二词向量预训练模型为ernie。
具体地,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息包括:
将给定试题文本中的文本划分为词,将每个词对应得到fasttext的预训练词向量,以确定第一试题文本信息;使用ernie直接对给定试题文本提取文本信息,得到每个词的向量表示,以确定第二试题文本信息。
具体地,第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型包括:
S41,根据所述目标学生参数与给定试题参数确定训练集T和验证集Z;计算第一词向量预训练模型在验证集Z上的预测试题参数ZA;
S42,计算第二词向量预训练模型在验证集Z上的预测试题参数ZB;
S43,将ZA加入训练集T,得到新训练集TB=T∪ZA;将ZB加入训练集T,得到新训练集TA=T∪ZB,将TA,TB分别确定为第一词向量预训练模型和第二词向量预训练模型在下一迭代过程中的训练集;
S44,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,得到利用第一词向量预训练模型提取的文本信息预测试题参数的模型利用第二试题文本信息提取的文本信息预测试题参数的模型在模型和模型中选取一个模型作为预测用模型。
具体地,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;包括:
S54,选择余弦相似度aij最高的K个预测试题参数,将相似度作为权重对K个预测试题参数进行加权求和得到目标试题参数。
在一个实施例中,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩包括:
以目标试题参数为依据使用学生-试题反应函数估计目标学生答对待考试试题文本中各个考题的概率,若概率大于等于设定阈值,则判定目标学生能答对该题,若概率小于设定阈值,则判定目标学生不能答对该题;根据目标学生针对各个考题能否答对的结果确定目标学生参数相对于待考试试题文本的考试成绩。
上述基于多视角认知诊断的学生成绩预测方法,通过使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,确定学生-试题反应函数,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数,将目标试题参数代入所述学生-试题反应函数,得到目标学生参数相对于待考试试题文本的考试成绩,整个预测过程中准确性高,可以有效避免出现过拟合等问题,提升了预测得到的结果的准确性。
附图说明
图1是一个实施例的基于多视角认知诊断的学生成绩预测方法流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参考图1所示,图1为一个实施例的基于多视角认知诊断的学生成绩预测方法流程图,包括如下步骤:
S10,使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,根据目标学生参数与给定试题参数得到学生-试题反应函数。
上述给定试题参数包括给定试题文本中各个试题的参数。
S20,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息;所述给定试题文本为目标学生获得给定考试成绩的试题文本,即目标学生针对给定试题文本考试,获得给定考试成绩。
上述第一词向量预训练模型和第二词向量预训练模型可以为不同的向量预训练模型,比如第一词向量预训练模型可以为fasttext(facebook提出的词向量预训练模型),第二词向量预训练模型可以为ernie(百度提出的词向量预训练模型)。
S40,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型。
S50,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数分别与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数。
上述K为正整数,具体可以取预测试题参数的总数的80%等值。预测试题参数包括待考试试题文本中各个考题的试题参数。余弦相似度最高的K个预测试题参数包括待考试试题文本中与给定试题文本中试题最相似又能够充分表征待考试试题文本的各个考题的试题参数。
具体地,上述步骤可以对K个预测试题参数进行加权求和,以得到目标试题参数。
S60,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩。
上述学生-试题反应函数为记载试题参数和目标学生考试成绩之间对应关系的参数。
上述基于多视角认知诊断的学生成绩预测方法,通过使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,确定学生-试题反应函数,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数,将目标试题参数代入所述学生-试题反应函数,得到目标学生参数相对于待考试试题文本的考试成绩,整个预测过程中准确性高,可以有效避免出现过拟合等问题,提升了预测得到的结果的准确性。
在一个实施例中,根据目标学生参数与给定试题参数得到学生-试题反应函数包括:
选取认知诊断模型对目标学生参数与给定试题参数进行机器学习,得到学生-试题反应函数;所述学生-试题反应函数拗口:
P(Yuv=1|θu,ξv)≡f(θu,ξv),
其中,Yuv为学生u回答给定试题文本试题v的情况,θu为学生u的隐藏属性,ξv为试题的参数,P(Yuv=1|θu,ξv)学生u答对试题v的概率,f(θu,ξv)为认知诊断模型的学生-试题反应函数,符号≡表示概率P可以表示为函数f。
在一个示例中,还可以计算所有学生对给定试题文本中所有试题的极大似然函数,使用优化方法对极大似然函数迭代使其达到最大,上述极大似然函数为:
L=∏U∏V(Yuv)P(Yuv=1|θu,ξv)+(1-Yuv)(1-P(Yuv=1|θu,ξv))=∏U∏V(Yuv)f(θu,ξv)+(1-(Yuv))(1-f(θu,ξv)),
其中,Yuv为学生u回答试题v的情况,θu为学生的隐藏属性,ξv为试题的参数,P(Yuv=1|θu,ξv)学生u答对试题v的概率,f(θu,ξv)为认知诊断模型的学生-试题反应函数。
在一个实施例中,所述第一词向量预训练模型为fasttext;所述第二词向量预训练模型为ernie。
具体地,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息包括:
将给定试题文本中的文本划分为词,将每个词对应得到fasttext的预训练词向量,以确定第一试题文本信息;使用ernie直接对给定试题文本提取文本信息,得到每个词的向量表示,以确定第二试题文本信息。
进一步地,本实施例可以对试题文本,使用jieba分词工具将文本划分为词,每个词对应得到fasttext的预训练词向量;使用ernie直接提取相应文本信息,得到每个字的向量表示。
具体地,第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型包括:
S41,根据所述目标学生参数与给定试题参数确定训练集T和验证集Z;计算第一词向量预训练模型在验证集Z上的预测试题参数ZA;预测试题参数包括相应文本中各个试题的参数;
S42,计算第二词向量预训练模型在验证集Z上的预测试题参数ZB;
S43,将ZA加入训练集T,得到新训练集TB=T∪ZA;将ZB加入训练集T,得到新训练集TA=T∪ZB,将TA,TB分别确定为第一词向量预训练模型和第二词向量预训练模型在下一迭代过程中的训练集;
S44,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,得到利用第一词向量预训练模型提取的文本信息预测试题参数的模型利用第二试题文本信息提取的文本信息预测试题参数的模型在模型和模型中选取一个模型作为预测用模型。
在一个示例中,以第一词向量预训练模型为fasttext,第二词向量预训练模型为ernie为例。记利用fasttext提取的文本信息预测试题参数的模型为A,利用ernie提取的文本信息预测试题参数的模型为B。在每一步的迭代过程中可以包括:
4.1计算A在验证集Z上的预测试题参数ZA。
4.2计算B在验证集Z上的预测试题参数ZB。
4.3将ZA加入训练集T,得到新训练集TB=T∪ZA;将ZB加入训练集T,得到新训练集TA=T∪ZB。TA,TB分别为A,B在下一迭代过程中的训练集。
具体地,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;包括:
S54,选择余弦相似度aij最高的K个预测试题参数,将相似度作为权重对K个预测试题参数进行加权求和得到目标试题参数(最终试题的预测参数)。
上述加权求和的过程可以包括:
ξi表示最终试题的预测参数。
在一个实施例中,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩包括:
以目标试题参数为依据使用学生-试题反应函数f(θu,ξv)估计目标学生答对待考试试题文本中各个考题的概率P(Yuv=1|θu,ξv),若概率大于等于设定阈值,则判定目标学生能答对该题,若概率小于设定阈值,则判定目标学生不能答对该题;根据目标学生针对各个考题能否答对的结果确定目标学生参数相对于待考试试题文本的考试成绩。
上述设定阈值可以设置为0.5等值。
在一个实施例中,上述步骤S40之前,还包括:
S30,构建预测试题参数的神经网络,用于拟合S10分析得到的试题参数(给定试题参数)。
具体地,步骤S30的具体过程包括:
定义Fv为步骤S30对试题v提取的信息(给定试题参数)。
接下来以ernie为例进行说明,fasttext类似。
3.8统计真实的答题情况Y,与预测的答题情况Y′,计算Y的正确率r,与Y′的正确率r′,在loss中引入正则项λ×|r-r′|×|Y′-thres|,则3.6中的loss变为:
从而目标函数为:
其中thres为预设的目标阈值。
本申请提供的基于多视角认知诊断的学生成绩预测方法具有如下技术效果:
本申请提供的学生成绩预测方法,由于对试题文本信息建模使得学生与试题间的相关信息被进一步挖掘。
对来自fasttext与ernie提取的不同文本信息采用多视角学习方法,融合多个来源的试题信息,能够充分的获取文本信息,使得在小样本的情况下,也能使模型较好的学习如何预测试题参数,从而对学生的成绩进行更精准的预测。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本申请实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (7)
1.一种基于多视角认知诊断的学生成绩预测方法,其特征在于,包括如下步骤:
S10,使用认知诊断模型对目标学生的给定考试成绩进行分析,得到目标学生参数与给定试题参数,根据目标学生参数与给定试题参数得到学生-试题反应函数;
S20,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息;所述给定试题文本为目标学生获得给定考试成绩的试题文本;
S40,将第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型;
S50,采用预测用模型提取待考试试题文本的多个试题文本信息,得到各个预测试题参数,将各个预测试题参数与给定试题参数进行对比,计算各个预测试题参数分别与给定试题参数余弦相似度,根据余弦相似度最高的K个预测试题参数确定目标试题参数;
S60,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩。
2.根据权利要求1所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,根据目标学生参数与给定试题参数得到学生-试题反应函数包括:
选取认知诊断模型对目标学生参数与给定试题参数进行机器学习,得到学生-试题反应函数;所述学生-试题反应函数拗口:
P(Yuv=1|θu,ξv)≡f(θu,ξv),
其中,Yuv为学生u回答给定试题文本试题v的情况,θu为学生u的隐藏属性,ξv为试题的参数,P(Yuv=1|θu,ξv)学生u答对试题v的概率,f(θu,ξv)为认知诊断模型的学生-试题反应函数,符号≡表示概率P表示为函数f。
3.根据权利要求1所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,所述第一词向量预训练模型为fasttext;所述第二词向量预训练模型为ernie。
4.根据权利要求3所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,对于给定试题文本,使用第一词向量预训练模型提取第一试题文本信息,使用第二词向量预训练模型提取第二试题文本信息包括:
将给定试题文本中的文本划分为词,将每个词对应得到fasttext的预训练词向量,以确定第一试题文本信息;使用ernie直接对给定试题文本提取文本信息,得到每个词的向量表示,以确定第二试题文本信息。
5.根据权利要求3所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,第一词向量预训练模型作为一个视角对所述第一试题文本信息进行训练,将第二词向量预训练模型作为另一视角对所述第二试题文本信息进行训练,在每一步迭代过程中,每一个视角验证集的试题文本数据进行标记,标记得到的预测参数加入另一视角下一迭代步骤的训练集中,反复迭代,直到第一词向量预训练模型和第二词向量预训练模型收敛,在收敛后的第一词向量预训练模型和第二词向量预训练模型中选取一个模型作为预测用模型包括:
S41,根据所述目标学生参数与给定试题参数确定训练集T和验证集Z;计算第一词向量预训练模型在验证集Z上的预测试题参数ZA;
S42,计算第二词向量预训练模型在验证集Z上的预测试题参数ZB;
S43,将ZA加入训练集T,得到新训练集TB=T∪ZA;将ZB加入训练集T,得到新训练集TA=T∪ZB,将TA,TB分别确定为第一词向量预训练模型和第二词向量预训练模型在下一迭代过程中的训练集;
7.根据权利要求5所述的基于多视角认知诊断的学生成绩预测方法,其特征在于,将所述目标试题参数代入所述学生-试题反应函数,得到所述目标学生参数相对于所述待考试试题文本的考试成绩包括:
以目标试题参数为依据使用学生-试题反应函数估计目标学生答对待考试试题文本中各个考题的概率,若概率大于等于设定阈值,则判定目标学生能答对该题,若概率小于设定阈值,则判定目标学生不能答对该题;根据目标学生针对各个考题能否答对的结果确定目标学生参数相对于待考试试题文本的考试成绩。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011103050.4A CN112288145B (zh) | 2020-10-15 | 2020-10-15 | 基于多视角认知诊断的学生成绩预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011103050.4A CN112288145B (zh) | 2020-10-15 | 2020-10-15 | 基于多视角认知诊断的学生成绩预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112288145A true CN112288145A (zh) | 2021-01-29 |
CN112288145B CN112288145B (zh) | 2022-08-05 |
Family
ID=74497111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011103050.4A Active CN112288145B (zh) | 2020-10-15 | 2020-10-15 | 基于多视角认知诊断的学生成绩预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112288145B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114282531A (zh) * | 2021-08-24 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 一种题目检测方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160358094A1 (en) * | 2015-06-02 | 2016-12-08 | International Business Machines Corporation | Utilizing Word Embeddings for Term Matching in Question Answering Systems |
CN108171358A (zh) * | 2017-11-27 | 2018-06-15 | 科大讯飞股份有限公司 | 成绩预测方法及装置、存储介质、电子设备 |
CN110264091A (zh) * | 2019-06-24 | 2019-09-20 | 中国科学技术大学 | 学生认知诊断方法 |
CN110651294A (zh) * | 2017-05-19 | 2020-01-03 | 日益得有限公司 | 估计考试分数的方法、设备及计算机程序 |
CN111241243A (zh) * | 2020-01-13 | 2020-06-05 | 华中师范大学 | 面向知识测量的试题、知识、能力张量构建与标注方法 |
-
2020
- 2020-10-15 CN CN202011103050.4A patent/CN112288145B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160358094A1 (en) * | 2015-06-02 | 2016-12-08 | International Business Machines Corporation | Utilizing Word Embeddings for Term Matching in Question Answering Systems |
CN110651294A (zh) * | 2017-05-19 | 2020-01-03 | 日益得有限公司 | 估计考试分数的方法、设备及计算机程序 |
CN108171358A (zh) * | 2017-11-27 | 2018-06-15 | 科大讯飞股份有限公司 | 成绩预测方法及装置、存储介质、电子设备 |
CN110264091A (zh) * | 2019-06-24 | 2019-09-20 | 中国科学技术大学 | 学生认知诊断方法 |
CN111241243A (zh) * | 2020-01-13 | 2020-06-05 | 华中师范大学 | 面向知识测量的试题、知识、能力张量构建与标注方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114282531A (zh) * | 2021-08-24 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 一种题目检测方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112288145B (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Karimi et al. | Online Academic Course Performance Prediction Using Relational Graph Convolutional Neural Network. | |
Morozov et al. | On self-supervised image representations for GAN evaluation | |
Cote et al. | Video summarization for remote invigilation of online exams | |
CN114913729B (zh) | 一种选题方法、装置、计算机设备和存储介质 | |
CN111611486B (zh) | 基于在线教育大数据的深度学习样本标注方法 | |
KR101895959B1 (ko) | 기계학습 프레임워크의 분석 결과를 해석하는 방법, 장치 및 컴퓨터 프로그램 | |
CN110457523B (zh) | 封面图片的选取方法、模型的训练方法、装置及介质 | |
CN113283488B (zh) | 一种基于学习行为的认知诊断方法及系统 | |
CN113902129A (zh) | 多模态的统一智能学习诊断建模方法、系统、介质、终端 | |
Chu et al. | Click-based student performance prediction: A clustering guided meta-learning approach | |
Casalino et al. | Incremental and adaptive fuzzy clustering for virtual learning environments data analysis | |
Batra et al. | DMCNet: Diversified model combination network for understanding engagement from video screengrabs | |
CN117540104A (zh) | 一种基于图神经网络的学习群体差异评价方法与系统 | |
CN115310520A (zh) | 融合多特征的深度知识追踪方法及习题推荐方法 | |
CN117668360A (zh) | 一种基于学习者在线学习行为分析的个性化习题推荐方法 | |
CN112288145B (zh) | 基于多视角认知诊断的学生成绩预测方法 | |
CN114037571A (zh) | 试题扩充方法及相关装置、电子设备和存储介质 | |
Jasim et al. | Characteristics of data mining by classification educational dataset to improve student’s evaluation | |
CN115757112A (zh) | 基于变异分析的测试子集构建方法及相关设备 | |
Lin et al. | Out-of-distribution detection with hilbert-schmidt independence optimization | |
CN112328768A (zh) | 一种智能问答系统中答案抽取方法 | |
Huang et al. | Pull together: Option-weighting-enhanced mixture-of-experts knowledge tracing | |
Zhan et al. | A diagnostic classification analysis of problem-solving competence using process data | |
Wang et al. | Large-scale educational question analysis with partial variational auto-encoders | |
CN118278512B (zh) | 一种基于深度学习模型可解释性的知识追踪可视分析系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |