CN111898803B - 一种习题预测方法、系统、设备及存储介质 - Google Patents
一种习题预测方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN111898803B CN111898803B CN202010656451.6A CN202010656451A CN111898803B CN 111898803 B CN111898803 B CN 111898803B CN 202010656451 A CN202010656451 A CN 202010656451A CN 111898803 B CN111898803 B CN 111898803B
- Authority
- CN
- China
- Prior art keywords
- model
- student
- knowledge point
- answer
- students
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000011159 matrix material Substances 0.000 claims abstract description 111
- 239000013598 vector Substances 0.000 claims abstract description 55
- 230000006870 function Effects 0.000 claims abstract description 27
- 230000001149 cognitive effect Effects 0.000 claims description 19
- 238000003745 diagnosis Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 7
- 230000001105 regulatory effect Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 4
- 101000701142 Homo sapiens Transcription factor ATOH1 Proteins 0.000 description 4
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 4
- 102100029373 Transcription factor ATOH1 Human genes 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000006998 cognitive state Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B7/00—Electrically-operated teaching apparatus or devices working with questions and answers
- G09B7/02—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
- G09B7/04—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student characterised by modifying the teaching programme in response to a wrong answer, e.g. repeating the question, supplying a further explanation
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种习题预测方法、系统、设备及存储介质,包括从答题记录模型中获取答题记录信息,构建答题记录三元组向量模型;从习题‑知识点关联模型中获取习题‑知识点关联信息,基于答题记录三元组向量模型R和习题‑知识点关联模型生成习题难度模型和学生能力模型;由答题记录三元组向量模型R、习题难度和学生能力模型得到损失函数,由损失函数迭代更新至迭代次数达到上限,得到学生‑因子矩阵元素和习题‑因子矩阵元素;将学生‑因子矩阵元素和习题‑因子矩阵元素进行元素乘积运算,得到习题预测模型,生成预测习题。本发明解决现有技术中存在的无法自适应学生学习进度,知识点掌握水平动态变化,而实现习题个性化预测的技术问题。
Description
技术领域
本发明属于智能教育领域,具体涉及一种习题预测方法、系统、设备及存储介质。
背景技术
传统课堂教育和在线学习平台,都收集并存储了大量的学生习题作答记录。如何根据这些作答记录来挖掘学生和习题信息,检验学生是否已经掌握课程的知识点,提高学生的学习效率,帮助学生选择合适的习题予以学习,受到了智能教育领域相关人员和社会各届的广泛关注。
习题预测算法通过学生的作答记录预测学生未做过习题的得分,之后再根据预测值为学生选择合适的习题,这种方式实现深度挖掘学习行为模式,揭示习题数据之间隐藏的关系和模式,了解学生掌握知识的过程,从而有助于掌握学生的学习规律,便于更全面地评价学生及个性化干预指导。通过优化学习过程,有利于学习能力的提高和学习兴趣的培养和思考能力的提升,提供个性化的服务,做到因材施教。
目前,已有多种算法应用于习题预测领域,其中最常用的三种模型有知识追踪模型、认知诊断模型和矩阵分解模型。知识追踪模型通过跟踪学生的习题记录,获取其知识点掌握程度以实现预测学生答题的正确性,但由于在一定程度上代表学生的平均水平,其缺陷在于:无法做到个性化习题预测;认知诊断模型源于教育心理学,是一种通过从答题记录中发现学生状态来预测学生表现的技术,其缺陷在于:存在着高额时间复杂度的问题,难以处理大规模习题记录;矩阵分解模型的缺陷在于:对观测数据与缺失数据权重设置均衡不切实际,更新模型仍需递归计算。
发明内容
针对上述现有技术的不足与缺陷,本发明的目的在于提供一种习题预测方法,以解决现有技术中存在的无法自适应学生学习进度,知识点掌握水平动态变化,而实现习题个性化预测的技术问题。
为了实现上述任务,本发明采用以下技术方案:
一种习题预测方法,该方法包括如下步骤:
步骤1,从答题记录模型中获取答题记录信息,从得到的答题记录模型中提取答题记录三元组向量,构建答题记录三元组向量模型R<u,i,rui>,其中u表示学生编号、i表示习题编号、rui表示学生u解答习题i的正确性;
步骤2,从习题-知识点关联模型中获取习题-知识点关联信息,基于答题记录三元组向量模型R和习题-知识点关联模型生成习题难度模型和学生能力模型;
步骤3,由答题记录三元组向量模型R、习题难度和学生能力模型得到损失函数,由损失函数迭代更新至迭代次数达到上限,得到学生-因子矩阵元素和习题-因子矩阵元素;
步骤4,将学生-因子矩阵元素和习题-因子矩阵元素进行元素乘积运算,得到习题预测模型,生成预测习题,并将预测得到的习题推送至学生答题界面。
进一步地,步骤2中所述的由习题-知识点关联模型生成习题难度模型和学生能力模型,包括:
步骤2.1、基于习题-知识点关联模型,由式(1)得出习题难度模型的元素:
dui=Qij*(failure(xuj)-success(xuj)) 式(1)
其中,dui为习题难度模型的元素,Qij为习题-知识点关联模型的元素,success(xuj)为学生u回答包含知识点j的习题的正确比率,failure(xuj)为学生u回答包含知识点j的习题的错误比率;/>
“xuji==1”和“xuji!=1”表示学生u回答包含知识点xuj的习题正确性,“Nuj”表示包含知识点xuj的习题总数;
步骤2.2,由答题记录三元组向量模型R和认知诊断模型获取学生对知识点的连续化掌握程度;将学生对知识点的连续化掌握程度通过习题-知识点关联模型相乘为学生对习题的掌握水平,应用几何平均计算学生对习题的平均掌握程度,形成学生能力模型。
进一步地,步骤2.2,包括如下内容:
步骤2.2.1,利用认知诊断模型获取学生对知识点的连续化掌握程度:
其中,表示学生u对知识点j的掌握程度,“ru”表示学生u的答题记录。
步骤2.2.2,通过习题-知识点关联模型将学生对知识点的连续化掌握程度转化为学生对习题的掌握水平,实际应用几何平均计算学生对习题的平均掌握程度,作为学生能力lui:
其中,“Inuij”表示
进一步地,步骤3所述的由答题记录三元组向量模型R、习题难度模型和学生能力模型得到损失函数,由损失函数迭代更新至迭代次数达到上限,得到学生-因子模型元素puf和习题-因子模型元素qif,具体过程包括:
步骤3.2,将答题记录三元组向步骤3.1,根据习题数量i,学生数量u随机分别生成初始学生-因子向量p0和初始习题-因子向量q0;
量模型中的元素rui、习题难度模型中的元素dui和学生能力模型中元素lui、随机生成的初始学生-因子向量p0和初始习题-因子向量q0代入如下损失函数:
其中,N为习题总数,M为学生总人数,rui为学生解答习题正确性,为学生正确解答未做习题的概率预测值,dui为习题难度模型元素,lui为学生能力模型元素,Ru为学生u的答题记录数据集,是答题记录三元组矩阵R的子集,pu为学生-因子矩阵中的第u个学生的向量值,1≤u≤M,qi表示习题-因子矩阵中的第i个习题的向量值,1≤i≤N,λ为正则化系数;c0是调节学生人数与习题个数的调节系数;
步骤3.3、由损失函数迭代更新至迭代次数达到上限,得到学生-因子矩阵元素puf和习题-因子矩阵元素qif,其中,puf和qif的迭代更新公式如下:
本发明还还涉及一种习题预测系统,它基于计算机系统至少包括收发模块和处理模块,收发模块用于获取答题记录,生成答题记录模型;获取习题-知识点关联信息,生成习题-知识点关联模块;
处理模块,将收发模块获取生成的答题记录模型,构建生成答题记录三元向量组模型;将收发模块生成的习题-知识点关联模型,结合答题记录三元组向量模型和习题-知识点关联模型生成习题难度模型和学生能力模型;
由答题记录三元组向量模型R、习题难度和学生能力模型得到损失函数,由损失函数迭代更新至迭代次数达到上限,得到学生-因子矩阵元素和习题-因子矩阵元素;最后将学生-因子矩阵元素和习题-因子矩阵元素进行元素乘积运算,得到习题预测模型,生成预测习题,并将预测得到的习题推送至学生答题界面。
处理模块执行所述习题预测的方法中的步骤。
本发明的技术方案还可以应用于计算机设备之中,包括收发器、存储器和处理器,所述的存储器中存储有计算机可读指令,所述计算机可读指令被处理器执行时,使得处理器执行所述习题预测的方法中的步骤。
本发明还可以应用制成任意一种计算机可读指令的存储介质所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行所述习题预测的方法中的步骤。
本发明与现有技术相比,具有如下技术效果:
(1)避免通过手动调整大量超参数,可应用于单个学生的个性化习题预测。
(2)避开了高额时间复杂度的更新迭代时间,可运行在大规模教育数据上。
(3)本发明定义了习题难度与学生能力,既解决了矩阵分解模型权重设置均衡的问题,从一方面解决了教育个性化的需求,也弥补了矩阵分解模型与知识追踪模型和认知诊断模型相比忽视学生知识状态的缺陷;避开矩阵分解模型更新时矩阵求逆的高额时间复杂度,以较小的因子数量达到快速更新的效果。
附图说明
图1是本发明的习题预测方法的流程图。
图2是本发明的习题预测系统的结构框架图。
图3是本发明的一个应用实施例产品框架图。
图4是本发明的方法与其他方法在FrcSub数据集以MAE为评价指标的实验结果对比图;
图5是本发明的方法与其他方法在FrcSub数据集以RMSE为评价指标的实验结果对比图;
图6是本发明的方法与其他方法在Math1数据集以MAE为评价指标的实验结果对比图;
图7是本发明的方法与其他方法在Math1数据集以RMSE为评价指标的实验结果图;
图8是本发明的方法与其他方法在Math2数据集以MAE为评价指标的实验结果对比图;
图9是本发明的方法与其他方法在Math2数据集以RMSE为评价指标的实验结果对比图。
具体实施方式
下面结合附图和实施例对本发明进行详细说明。以便本领域的技术人员更好的理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
以下对本发明涉及的定义或概念内涵做以说明:
认知诊断模型:认知诊断是对个体知识结构、加工技能或认知过程的诊断评估。认知诊断模型以学生的答题记录数据作为输入,通过对每个知识点的建模、诊断和概率化,由此挖掘出学生对各个知识点的掌握情况。它可以较好地从知识点层面对学生的认知状态进行建模,通过概率化学生的知识点掌握程度,使其可以对学生的知识点掌握程度进行概率化建模并将学生的知识点掌握程度模拟为0~1之间连续数值,即学生对知识点的连续化掌握程度。
本发明涉及通过一系列模型,例如:答题记录三元组向量模型、习题-知识点关联模型、习题难度模型、学生能力模型,调用对应模型内部的相关矩阵算法,实现整个流程的流转。
本发明涉及认知诊断模型是的以学生的答题记录数据作为输入,通过对每个知识点的建模、诊断和概率化,由此挖掘出学生对各个知识点的掌握情况。
实施例1
在本实施例中应用本发明公开的习题预测方法。
在本实施例中,选择的数据集为FrcSub,由中学生分数减法数学习题组成,共随机选取了536名学生(u)和20道客观题(i),包含8个知识点(j)。
遵循本发明公开的相关技术步骤:
步骤1,获取习题-知识点关联和答题记录信息,分别将其转化成为习题-知识点关联矩阵和答题记录矩阵,从得到的答题记录矩阵中提取答题记录三元组向量,构建答题记录三元组向量矩阵R,所述答题记录三元组向量包括学生编号u、习题编号i和学生解答习题正确性rui。
表1显示的是由部分学生编号和习题编号构成的答题记录矩阵,矩阵内的每个元素代表学生解答习题的正确性,其中,数字1表示学生解答该习题正确,数字0表示学生解答该习题错误。例如:答题记录矩阵第一行第一列元素为1表示学生_1解答习题_1正确;答题记录矩阵第三行第四列元素为0表示学生_3解答习题_4错误。
表2显示的是由部分知识点编号和习题编号构成的习题-知识点关联信息,形成习题-知识点关联矩阵。每一行元素代表对应习题所包含的知识点,其中,当习题-知识点关联矩阵元素为1时,表示该行对应的习题包含对应的知识点;当习题-知识点关联矩阵元素为0时,表示该行对应的习题不包含对应的知识点。例如:习题-知识点关联矩阵第一行元素为“10010”对应第一列和第四列元素为1,其他列为0,表示习题_1包含知识点_1和知识点_4。
从得到的答题记录矩阵中提取答题记录三元组向量:学生编号(共536个)、习题编号(共20个)、学生解答习题正确性,构建答题记录三元组向量矩阵R<u,i,rui>,如表3所示。
答题记录三元组向量矩阵R表示:学生u解答习题i的正确性为rui,其中rui是学生答题记录矩阵中的元素,1表示学生u正确解答习题i,0表示学生u错误解答习题i。例如:答题记录三元组向量矩阵R第一行元素为“110”表示学生_1解答习题_1错误。
表1答题记录矩阵
表2习题-知识点关联Q矩阵
表3答题记录三元组向量矩阵R
步骤2、基于答题记录三元组向量模型获得的答题记录三元组向量矩阵R和习题-知识点关联模型获得的习题-知识点关联矩阵,答题记录三元组向量矩阵R和习题-知识点关联矩阵,生成习题难度矩阵D和学生能力矩阵L,从而依次形成习题难度模型和学生能力模型;
步骤2.1、基于习题-知识点关联矩阵,由式(1)得出习题难度矩阵的元素:
dui=Qij*(failure(xuj)-success(xuj)) 式(1)
其中,dui为习题难度矩阵的元素;Qij为习题-知识点关联矩阵的元素,success(xuj)为学生u回答包含知识点j的习题的正确比率,failure(xuj)为学生u回答包含知识点j的习题的错误比率;
dui表示习题i对学生u的难度值,Qij表示习题i与知识点j的相关性,元素值为1表示习题i与知识点j相关,元素值为0表示习题i与知识点j不相关;在本实施例中,由20个习题对536个学生的难度值dui生成了习题难度矩阵D。
步骤2.2、由答题记录三元组向量矩阵R和认知诊断模型获取学生对知识点的连续化掌握程度;将学生对知识点的连续化掌握程度和习题-知识点关联矩阵相乘获得学生对习题的掌握水平,应用几何平均计算学生对习题的平均掌握程度,作为学生能力矩阵L。
即:答题记录三元组向量模型与习题-知识点关联Q模型应用认知诊断模型计算学生能力,具体过程包括:
依据答题记录三元组向量模型利用认知诊断模型获取学生对知识点的连续化掌握程度(范围0~1之间),
其中,表示学生u对知识点j的掌握程度,“ru”表示学生u的答题记录。
之后通过习题-知识点关联Q矩阵将学生对知识点的连续化掌握程度转化为学生对习题的掌握水平,应用几何平均计算学生对习题的平均掌握程度,作为学生能力L(学生能力矩阵):
其中,Inuij表示学生对习题的掌握程度,qij表示习题-知识点关联Q矩阵的元素,qij=0表示习题i不包含知识点j,qij=1表示习题i包含知识点j。
步骤3、由答题记录三元组向量矩阵R、习题难度矩阵D和学生能力矩阵L得到损失函数,由损失函数迭代更新至迭代次数达到上限,得到学生-因子矩阵Pn和习题-因子矩阵Qn;
步骤3.1,将答题记录三元组向量矩阵R、习题难度矩阵D、学生能力矩阵L及习题-因子向量qi和学生-因子向量pu代入式(5)得到损失函数:
首先,随机生成具有高斯分布的p0矩阵和q0矩阵,p0矩阵维度为536×2,q0矩阵维度为2×20,将其作为学生-因子矩阵与习题-因子矩阵的初始化。
其次,将答题记录三元组向量矩阵R的元素rui、习题难度矩阵D的元素dui和学生能力矩阵L的元素lui、随机生成的p0矩阵(代入pu,作为初始化)和q0矩阵(代入qi,作为初始化)代入矩阵分解模型的Loss函数中,Loss函数如下:
其中,N为习题数,M为学生人数,rui为学生解答习题正确性,为学生正确解答未做习题的概率预测值,dui为习题难度矩阵元素,lui为学生能力矩阵元素,Ru为学生u的答题记录数据集,是答题记录三元组矩阵R的子集。pu为学生-因子矩阵中的第u个学生的向量值,1≤u≤M,qi表示习题-因子矩阵中的第i个习题的向量值,1≤i≤N,λ为正则化系数,c0是调节学生人数与习题个数的调节系数;
本事实例中,N=20,M=536,λ=0.01;所得Loss函数的第一项是为观测数据设置均衡权重的误差,第二项是为未观测数据设置非均衡权重的误差,c0=0.1。
步骤3.2、由损失函数迭代更新至迭代次数达到上限,得到学生-因子矩阵Pn和习题-因子矩阵元素Qn;
最小化损失函数以优化迭代过程,设置迭代次数为1000次,待达到迭代次数后得到参数:学生-因子矩阵Pn的元素puf和习题-因子矩阵元素Qn的元素qif,其中,puf和qif的迭代更新公式如下:
其中,Ru表示学生u的答题记录,Ri为解答习题i的学生答题记录数据集,表示学生u未作答的习题i,i∈Ru表示学生u作答的习题i,/>表示习题i未被学生u作答,u∈Ri表示习题i被学生u作答;f表示因子的个数,f=2。在本实施例中,由536×2个puf生成学生-因子矩阵Pn和20×2个qif生成习题-因子矩阵Qn。
步骤4、将学生-因子矩阵Pn和习题-因子矩阵Qn进行乘积运算,得到答题预测模型
在本实施例中,由学生-因子矩阵Pn的元素puf和习题-因子矩阵元素Qn的元素qif内积得到答题预测矩阵元素由此生成答题预测模型/>
实施例2
本实施例中所选用的数据集为Math1和Math2,来自高中学生的两次期末数学考试,由斯坦福网站可获取,其中,Math1数据集包含4209名学生,15道客观题和5道主观题组成,包含11个知识点;
Math2数据集包含3911名学生,15道客观题和5道主观题,包含16个知识点。每个数据集由教育专家标注的习题-知识点关联矩阵和学生答题记录组成。
具体实施步骤与实施例1相同。
考虑到习题中包含主观题与客观题两类题型,由于客观题的正确性为0或1这样离散的值,而主观题的正确性是0到1这样连续的值。因此本发明使用平均绝对误差MAE(MeanAbsolute Error)和均方根误差RMSE(Root Mean Square Error)作为衡量主观题的评价指标:
平均绝对误差的定义为:
均方根误差的定义为:
其中ri是学生解答习题正确性r′i是学生正确解答未做习题正缺性的概率预测值,yi是测试集中习题实际正确性,i=1,2...,N。
使用查准率(Precision)、查全率(Recall)和F1值(F1-score)作为衡量客观题的评价指标:
查准率的定义为:
查全率的定义为:
F1值的定义为:
其中,“TP”表示将实际的正样本为正样本的个数;“FP”表示将实际的负样本预测为正样本的个数;“FN”表示将实际的正样本预测为负样本的个数;则“TP+FP”表示预测为正样本的个数;“TP+FN”表示实际正样本的个数。
如表4所示,与现有的认知诊断模型与矩阵分解模型相比,本发明得到的习题推荐模型(Wse-MF)取得了更好的效果。就MAE和RMSE评价指标而言,Wse-MF模型在MAE上优于认知诊断模型3%,RMSE降低2%;Wse-MF模型在MAE上优于矩阵分解模型11%,RMSE降低7%。
在以Precision,Recall和F1作为评价指标时,Wse-MF模型在Precision方面优于认知诊断模型3%,Recall方面提高23%,F1提高14%;Wse-MF模型在Precision上优于矩阵分解模型1%,Recall提高26%,F1提高16%。并且Wse-MF模型在时间复杂度上优于认知诊断模型的指数时间复杂度与矩阵分解模型的三次时间复杂度。
表4
综上所述,本发明的技术效果与现有相关算法实际效果对比,参见图4-图9所示,本方法在训练期间通过调整因子与超参数可达到快速收敛,并且在训练和测试期间表现稳定。
Claims (7)
1.一种习题预测方法,其特征在于,该方法包括如下步骤:
步骤1,从答题记录模型中获取答题记录信息,从得到的答题记录模型中提取答题记录三元组向量,构建答题记录三元组向量模型R<u,i,rui>,其中u表示学生编号、i表示习题编号、rui表示学生u解答习题i的正确性;
步骤2,从习题-知识点关联模型中获取习题-知识点关联信息,基于答题记录三元组向量模型R和习题-知识点关联模型生成习题难度模型和学生能力模型;
步骤2所述的由习题-知识点关联模型生成习题难度模型和学生能力模型,包括:
步骤2.1、基于习题-知识点关联模型,由式(1)得出习题难度模型的元素:
dui=Qij*(failure(xuj)-success(xuj)) 式(1)
其中,dui为习题难度模型的元素,Qij为习题-知识点关联模型的元素,success(xuj)为学生u回答包含知识点j的习题的正确比率,failure(xuj)为学生u回答包含知识点j的习题的错误比率;/>
“xuji==1”和“xuji!=1”表示学生u回答包含知识点xuj的习题正确性,“Nuj”表示包含知识点xuj的习题总数;
步骤2.2,由答题记录三元组向量模型R和认知诊断模型获取学生对知识点的连续化掌握程度;将学生对知识点的连续化掌握程度通过习题-知识点关联模型相乘为学生对习题的掌握水平,应用几何平均计算学生对习题的平均掌握程度,形成学生能力模型;
步骤3,由答题记录三元组向量模型R、习题难度模型和学生能力模型得到损失函数,由损失函数迭代更新至迭代次数达到上限,得到学生-因子矩阵元素和习题-因子矩阵元素;
步骤4,将学生-因子矩阵元素和习题-因子矩阵元素进行元素乘积运算,得到习题预测模型,生成预测习题,并将预测得到的习题推送至学生答题界面。
2.如权利要求书1所述的习题预测方法,其特征在于:步骤2.2,包括如下内容:
步骤2.2.1,利用认知诊断模型获取学生对知识点的连续化掌握程度:
其中,表示学生u对知识点j的掌握程度,“ru”表示学生u的答题记录;
步骤2.2.2,通过习题-知识点关联模型将学生对知识点的连续化掌握程度转化为学生对习题的掌握水平,实际应用几何平均计算学生对习题的平均掌握程度,作为学生能力lui:
其中,“Inuij”表示
3.如权利要求1所述的习题预测方法,其特征在于,步骤3所述的由答题记录三元组向量模型R、习题难度模型和学生能力模型得到损失函数,由损失函数迭代更新至迭代次数达到上限,得到学生-因子模型元素puf和习题-因子模型元素qif,具体过程包括:
步骤3.1,根据习题数量i,学生数量u随机分别生成初始学生-因子向量p0和初始习题-因子向量q0;
步骤3.2,将答题记录三元组向量模型中的元素rui、习题难度模型中的元素dui和学生能力模型中元素lui、随机生成的初始学生-因子向量p0和初始习题-因子向量q0代入如下损失函数:
其中,N为习题总数,M为学生总人数,rui为学生解答习题正确性,为学生正确解答未做习题的概率预测值,dui为习题难度模型元素,lui为学生能力模型元素,Ru为学生u的答题记录数据集,是答题记录三元组矩阵R的子集,pu为学生-因子矩阵中的第u个学生的向量值,1≤u≤M,qu表示习题-因子矩阵中的第i个习题的向量值,1≤i≤N,λ为正则化系数;c0是调节学生人数与习题个数的调节系数;
步骤3.3、由损失函数迭代更新至迭代次数达到上限,得到学生-因子矩阵元素puf和习题-因子矩阵元素qif,其中其中,puf和qif的迭代更新公式如下:
4.一种习题预测系统,其特征在于,基于计算机系统至少包括收发模块和处理模块,收发模块用于获取答题记录,生成答题记录模型;获取习题-知识点关联信息,生成习题-知识点关联模块;
处理模块,将收发模块获取生成的答题记录模型,构建生成答题记录三元向量组模型;将收发模块生成的习题-知识点关联模型,结合答题记录三元组向量模型和习题-知识点关联模型生成习题难度模型和学生能力模型;
其中,由习题-知识点关联模型生成习题难度模型和学生能力模型,包括:
步骤2.1、基于习题-知识点关联模型,由式(1)得出习题难度模型的元素:
dui=Qij*(failure(xuj)-success(xuj)) 式(1)
其中,dui为习题难度模型的元素,Qij为习题-知识点关联模型的元素,success(xuj)为学生u回答包含知识点j的习题的正确比率,failure(xuj)为学生u回答包含知识点j的习题的错误比率;/>
“xuji==1”和“xuji!=1”表示学生u回答包含知识点xuj的习题正确性,“Nuj”表示包含知识点xuj的习题总数;
步骤2.2,由答题记录三元组向量模型R和认知诊断模型获取学生对知识点的连续化掌握程度;将学生对知识点的连续化掌握程度通过习题-知识点关联模型相乘为学生对习题的掌握水平,应用几何平均计算学生对习题的平均掌握程度,形成学生能力模型;
由答题记录三元组向量模型R、习题难度模型和学生能力模型得到损失函数,由损失函数迭代更新至迭代次数达到上限,得到学生-因子矩阵元素和习题-因子矩阵元素;最后将学生-因子矩阵元素和习题-因子矩阵元素进行元素乘积运算,得到习题预测模型,生成预测习题,并将预测得到的习题推送至学生答题界面。
5.如权利要求4所述的习题预测系统,其特征在于:处理模块执行权利要求1-3任意一项所述习题预测的方法中的步骤。
6.一种计算机设备,其特征在于:包括收发器、存储器和处理器,所述的存储器中存储有计算机可读指令,所述计算机可读指令被处理器执行时,使得处理器执行如权利要求1-3任意一项所述习题预测的方法中的步骤。
7.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1-3任意一项所述习题预测的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010656451.6A CN111898803B (zh) | 2020-07-09 | 2020-07-09 | 一种习题预测方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010656451.6A CN111898803B (zh) | 2020-07-09 | 2020-07-09 | 一种习题预测方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111898803A CN111898803A (zh) | 2020-11-06 |
CN111898803B true CN111898803B (zh) | 2023-10-24 |
Family
ID=73192006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010656451.6A Active CN111898803B (zh) | 2020-07-09 | 2020-07-09 | 一种习题预测方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111898803B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257966B (zh) * | 2020-12-18 | 2021-04-09 | 北京世纪好未来教育科技有限公司 | 模型处理方法、装置、电子设备及存储介质 |
CN117291775B (zh) * | 2023-11-27 | 2024-03-01 | 山东多科科技有限公司 | 一种深度知识追踪的精准化教学方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10354544B1 (en) * | 2015-02-20 | 2019-07-16 | Snapwiz Inc. | Predicting student proficiencies in knowledge components |
CN110264091A (zh) * | 2019-06-24 | 2019-09-20 | 中国科学技术大学 | 学生认知诊断方法 |
CN110377707A (zh) * | 2019-07-25 | 2019-10-25 | 中国科学技术大学 | 基于深度项目反应理论的认知诊断方法 |
CN110378818A (zh) * | 2019-07-22 | 2019-10-25 | 广西大学 | 基于难度的个性化习题推荐方法、系统及介质 |
CN110377814A (zh) * | 2019-05-31 | 2019-10-25 | 平安国际智慧城市科技股份有限公司 | 题目推荐方法、装置及介质 |
CN110851723A (zh) * | 2019-11-14 | 2020-02-28 | 上海钦文信息科技有限公司 | 一种基于大规模知识点标注结果的英语习题推荐方法 |
-
2020
- 2020-07-09 CN CN202010656451.6A patent/CN111898803B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10354544B1 (en) * | 2015-02-20 | 2019-07-16 | Snapwiz Inc. | Predicting student proficiencies in knowledge components |
CN110377814A (zh) * | 2019-05-31 | 2019-10-25 | 平安国际智慧城市科技股份有限公司 | 题目推荐方法、装置及介质 |
CN110264091A (zh) * | 2019-06-24 | 2019-09-20 | 中国科学技术大学 | 学生认知诊断方法 |
CN110378818A (zh) * | 2019-07-22 | 2019-10-25 | 广西大学 | 基于难度的个性化习题推荐方法、系统及介质 |
CN110377707A (zh) * | 2019-07-25 | 2019-10-25 | 中国科学技术大学 | 基于深度项目反应理论的认知诊断方法 |
CN110851723A (zh) * | 2019-11-14 | 2020-02-28 | 上海钦文信息科技有限公司 | 一种基于大规模知识点标注结果的英语习题推荐方法 |
Non-Patent Citations (3)
Title |
---|
基于知识点层次图的个性化习题推荐算法;蒋昌猛;冯筠;孙霞;陈静;张蕾;冯宏伟;;计算机工程与应用(10);全文 * |
基于隐含知识点和加权矩阵分解的习题推荐算法研究;亢文英;中国优秀硕士学位论文全文数据库;第2019年卷(第1期);全文 * |
基于题目属性与文本的试题难度预测研究 —以数学试题为例;王青梅;中国优秀硕士学位论文全文数据库;第2019年卷(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111898803A (zh) | 2020-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110264091B (zh) | 学生认知诊断方法 | |
US10885803B2 (en) | System and method for real-time analysis and guidance of learning | |
CN112116092B (zh) | 可解释性知识水平追踪方法、系统和存储介质 | |
CN111159419B (zh) | 基于图卷积的知识追踪数据处理方法、系统和存储介质 | |
CN110941723A (zh) | 一种知识图谱的构建方法、系统及存储介质 | |
CN109509126A (zh) | 一种基于用户学习行为的个性化试题推荐方法 | |
CN111651677B (zh) | 课程内容推荐方法、装置、计算机设备和存储介质 | |
CN111898803B (zh) | 一种习题预测方法、系统、设备及存储介质 | |
CN113283488B (zh) | 一种基于学习行为的认知诊断方法及系统 | |
CN113239699B (zh) | 一种融合多特征的深度知识追踪方法及系统 | |
CN114429212A (zh) | 智能学习知识能力跟踪方法、电子设备及存储介质 | |
CN116383481B (zh) | 一种基于学生画像的个性化试题推荐方法及系统 | |
CN111680216A (zh) | 一种试题推荐方法、系统、介质及设备 | |
CN117252047A (zh) | 基于数字孪生的教学信息处理方法及系统 | |
CN118193920A (zh) | 一种基于概念驱动的个性化遗忘机制的知识追踪方法 | |
CN114971066A (zh) | 融合遗忘因素和学习能力的知识追踪方法及系统 | |
CN113052316B (zh) | 基于因果推理的知识追踪方法、系统、设备及存储介质 | |
CN113870634A (zh) | 一种结合虚拟教学的智能组卷方法与系统 | |
CN117743679A (zh) | 学习内容推荐方法、装置、电子设备及存储介质 | |
CN116402134A (zh) | 基于行为感知的知识追踪方法及系统 | |
Durand et al. | Review, computation and application of the additive factor model (AFM) | |
CN112907004B (zh) | 学习规划方法、装置及计算机存储介质 | |
Cabo | Use of Machine Learning to Identify Predictors of Student Performance in Writing Viable Computer Programs with Repetition Loops and Methods | |
CN114925218A (zh) | 一种基于自适应图的学习者知识认知结构动态挖掘方法 | |
Cheng et al. | Exercise recommendation method combining neuralcd and neumf models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |