CN116089710A - 自适应深度知识追踪个性化学习推荐方法 - Google Patents

自适应深度知识追踪个性化学习推荐方法 Download PDF

Info

Publication number
CN116089710A
CN116089710A CN202211668347.4A CN202211668347A CN116089710A CN 116089710 A CN116089710 A CN 116089710A CN 202211668347 A CN202211668347 A CN 202211668347A CN 116089710 A CN116089710 A CN 116089710A
Authority
CN
China
Prior art keywords
students
knowledge
model
learning
student
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211668347.4A
Other languages
English (en)
Inventor
向光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Shuwen Technology Co ltd
Original Assignee
Nanjing Shuwen Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Shuwen Technology Co ltd filed Critical Nanjing Shuwen Technology Co ltd
Priority to CN202211668347.4A priority Critical patent/CN116089710A/zh
Publication of CN116089710A publication Critical patent/CN116089710A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及教育数据挖掘领域,尤其涉及一种自适应深度知识追踪个性化学习推荐方法,收集学生的作业完成数据,建立学生行为序列;借助神经网络模型基于学生行为序列建立深度知识追踪模型;基于深度知识追踪模型预测学生对知识的掌握程度,结合学生对知识的掌握程度,给学生推荐个性化学习方法。本发明从数据挖掘的应用的角度,收集学生的作业完成数据,借助神经网络模型对学生对知识点掌握情况进行建模,基于学生学习路线的差异性,自适应推荐学生对应的学习方法,使得学生学习效率大大提高。

Description

自适应深度知识追踪个性化学习推荐方法
技术领域
本发明涉及教育数据挖掘领域,尤其涉及一种自适应深度知识追踪个性化学习推荐方法。
背景技术
在数字智慧经济新时代,终身学习已经成为了人类社会的趋势。而如何提高学习效率,自然是学习过程中的重中之重。较高的学习效率可以让学习者有更多的收获和成就,从而为国家和社会做出更大的贡献。
在学生不断进行知识获取阶段,每个学生或者每一类学生他们的学习路线存在很大的差异性,但是目前传统的上课方式对于所有学生都是同一个学习路线,而且同学对所有知识点的掌握并不具有统一性,比如a同学基础比较差,布置作业时需要进行一些基础题的推荐,而b同学基础比较好,布置作业时需要进行一些有难度的题的推荐,而且在一段时间后,为了避免学生忘记知识,必须给学生重复一些以前的一些知识点。对于不同水平、不同状态、不同班级的同学需要为其涉及一套属于自己的学习路线。使得学生学习效率大大提高。
发明内容
本发明提供了一种自适应深度知识追踪个性化学习推荐方法,借助对数据挖掘的应用的角度,收集学生的作业完成数据,借助神经网络模型对学生对知识点掌握情况进行建模,使得学生学习效率大大提高。
为了实现本发明的目的,所采用的技术方案是:自适应深度知识追踪个性化学习推荐方法,包括:
收集学生的作业完成数据,建立学生行为序列;
借助神经网络模型基于学生行为序列建立深度知识追踪模型;
基于深度知识追踪模型预测学生对知识的掌握程度,结合学生对知识的掌握程度,给学生推荐个性化学习方法。
作为本发明的优化方案,学生行为序列为x0,...,xtxt={at,qt},其中qt代表回答的问题成分,at代表回答是否正确。
作为本发明的优化方案,神经网络模型基于LSTM神经网络实现,将输入进行one-hot编码,模型输入数据涉及M个知识成分,每道题有两种结果0和1,则模型输入长度为2M,目标函数为观测序列的非负对数似然函数。
作为本发明的优化方案,在LSTM神经网络中构造损失函数,采用事件t时刻的输入值,在正则项里引入时间t的惩罚:
Figure BDA0004015278340000021
其中:r代表损失函数总体的值,n代表学习行为序列的个数,Ti代表第i个学习行为序列的长度;
Figure BDA0004015278340000022
代表第i个学习行为序列中的第t个元素;
Figure BDA0004015278340000023
代表
Figure BDA0004015278340000024
的独热编码;
Figure BDA0004015278340000025
代表模型对第i个学习行为序列中第t个元素的预测值;
Figure BDA0004015278340000026
代表第i个学习行为序列中第t个元素的真实值;
正则项:
Figure BDA0004015278340000031
Figure BDA0004015278340000032
其中:w1、w2分别是定义的两个正则化项;
Figure BDA0004015278340000033
代表模型对第i个学习行为序列中第t+1个元素的预测值;M代表知识点的数量。
作为本发明的优化方案,LSTM神经网络包括LSTM层和attention层,attention层提取从LSTM层中提取出的序列信息间的贡献程度,并引入用户的特征信息,特征信息包括卡顿时间、拖拽熟练度和地点。
作为本发明的优化方案,对于存在多个知识点的题目构造多个embedding,然后对应的对这多个embedding进行求平均,然后输入到深度知识追踪模型。
作为本发明的优化方案,自适应深度知识追踪个性化学习推荐方法还包括特征功能模块,特征功能模块包括学生兴趣维度单元、学生动手能力单元和学生掌握知识维度单元。
本发明具有积极的效果:1)本发明从数据挖掘的应用的角度,收集学生的作业完成数据,借助神经网络模型对学生对知识点掌握情况进行建模,基于学生学习路线的差异性,自适应推荐学生对应的学习方法,使得学生学习效率大大提高;
2)本发明创建的模型解决了输入序列存在重构问题和预测结果存在波动的问题,预测精度高;
3)本发明还能了解学生的各个维度信息,便于因材施教。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明的整体流程图;
图2是深度知识追踪模型示意图;
图3是深度知识追踪模型层次示意图。
具体实施方式
如图1所示,本发明公开了一种自适应深度知识追踪个性化学习推荐方法,包括:
收集学生的作业完成数据,建立学生行为序列;
借助神经网络模型基于学生行为序列建立深度知识追踪模型;
基于深度知识追踪模型预测学生对知识的掌握程度,结合学生对知识的掌握程度,给学生推荐个性化学习方法。
学生行为序列为x0,...,xtxt={at,qt},其中qt代表回答的问题成分(如对应的知识点),at代表回答是否正确。根据x0,...,xt预测下次表现xt+1。通常at=0,1。
神经网络模型基于LSTM神经网络实现,将输入进行one-hot编码,模型输入数据涉及M个知识成分,每道题有两种结果0和1,则模型输入长度为2M,目标函数为观测序列的非负对数似然函数。
利用深度知识追踪模型来处理知识追踪任务存在如下的问题:即输入序列存在重构问题和预测结果波动问题。针对输入序列存在重构问题,原始模型在构造损失函数时,为采用事件t时刻的输入值,只是考虑了t时刻的输出值和t+1时刻的输入值。因此为了解决该问题在正则项里引入时间t的惩罚。
在LSTM神经网络中构造损失函数,采用事件t时刻的输入值,在正则项里引入时间t的惩罚:
Figure BDA0004015278340000051
其中:r代表损失函数总体的值,n代表学习行为序列的个数,Ti代表第i个学习行为序列的长度;
Figure BDA0004015278340000052
代表第i个学习行为序列中的第t个元素;
Figure BDA0004015278340000053
代表
Figure BDA0004015278340000054
的独热编码;
Figure BDA0004015278340000055
代表模型对第i个学习行为序列中第t个元素的预测值;
Figure BDA0004015278340000056
代表第i个学习行为序列中第t个元素的真实值正则项:针对对输出结果波动的问题,引入正则约束(l1,l2),使得预测结果能够平滑输出。
Figure BDA0004015278340000057
Figure BDA0004015278340000058
其中:w1、w2分别是定义的两个正则化项;
Figure BDA0004015278340000059
代表模型对第i个学习行为序列中第t+1个元素的预测值;M代表知识点的数量如图2所示,LSTM神经网络包括LSTM层和attention层,attention层提取从LSTM层中提取出的序列信息间的贡献程度,并引入用户的特征信息,特征信息包括卡顿时间、拖拽熟练度和地点。在LSTM层输出后加入了一个multi-attention结构,其主要原理就是对答题序列和针对的答题结果,对其余答题序列和答题结果的贡献性。如图3所示,比如一个还在在回答函数求导知识点时回答正确,对函数梯度下降回答正确的贡献是0.4,对解析几何回答正确的贡献是0.1,对求最大值答对的贡献为0.5。
提取从LSTM中提取出的序列信息间的贡献程度,从而有效解决预测结果波动问题和解决无效记忆信息引入问题。最终预测精度较原来的模型精度提升了0.09个AUC(衡量模型优劣)。
模型中attention得到的特征图,比如导数回答正确对梯度回答正确的贡献为0.4,可以解释导数和梯度在知识点上可能存在联系。
上述模型是基于序列的预测,目的是通过学生答题的结果去预测未来学生在哪一个知识点上的掌握程度。采用的特征也仅仅是序列序号和对应的答案。因此在后续的模型设计中不仅引入序列信息,而且引入一些用户的一些特征信息,比如卡顿时间、拖拽熟练度、地域等一些列特征,然后对此进行建。此外,有一些题目的知识点不止一个,可能存在多个知识点,对于多知识点的建模也是需要解决的
如图3所示,对于存在多个知识点的题目构造多个embedding,然后对应的对这多个embedding进行求平均,然后输入到深度知识追踪模型。具体实现步骤为:
在输入阶段,只对答对的题进行序列输入,其中有的题会有多个知识点比如[1,3,7]会对其[1][3][7]构造三个embedding分别为e1、e2、e3,然后对应的对这三个embedding进行avg-pooling=avg(e1,e2,e3)即对应位置求平均,然后输入到模型。这就解决多个知识点共存的问题。另外引入学生的一些基本信息,如学校、地域、成绩等分数,还可以加入其它的特征。对于xt+1采取的不再是seq2seq的输出方式,在获得x1…xt用户历史答题结果,给一个题让其预测其回答是否正确,来对题进行打分。
在收集到用户学习行为的反馈后,可以对各个知识点基于类似word2vector的方式找到各个节点的向量化表示,其中可以用deepwalk算法进行深度随机游走建模。具体来说,计算出每个node在图中的向量表示,从而node与node之间的相似度就可以进行计算,图谱的构建可以通过学生答题的反馈进行修改,包括权值的更新。
在node上存在两种表示,第一是节点重要性表示,主要基于pagerank进行计算,第二是通过deepwalk或者word2vector计算出来的节点向量表示。两个节点的相似性,可以基于node的向量表示进行计算。
自适应深度知识追踪个性化学习推荐方法还包括特征功能模块,特征功能模块包括学生兴趣维度单元、学生动手能力单元和学生掌握知识维度单元。
1)学生兴趣维度
学生兴趣维度主要是针对学生对人工智能等科技学科的兴趣的衡量,通过收集的数据,以反映学生的兴趣特征。用户的学习行为包括一下方面:
(1)页面停留时间X11,页面停留时间有可能反映学生对人工智能的兴趣,停留时间越长越有可能对人工智能感兴趣。
(2)页面日点击次数X12,页面在这一天被点击的次数反映学生多次进入人工智能界面,可以某方面来衡量兴趣。
(3)每天平均访问时长X13,每天平均访问时长是页面总停留时间x11除以页面点击次数X12,
(4)达到人工智能拖拽平台预测要求后的页面平均访问时长X14,当学生完成了作业所布置的预测内容后,若是学生继续访问人工智能平台,那说明学生对人工智能学习不仅仅局限作业,而是感兴趣。
(5)用户点击总次数x15,用户点击总次数可以反映用户的兴趣强度。
(6)用户点击模块种类x16,用户点击模块种类反映用户渴望去尝试的、说明有兴趣每天访问时间早上、下午、晚上,x16。每天访问时间可部分发现学生对人工智能界面的兴趣情况。
2)学生动手能力维度
这个维度反映学生的实践操作能力,下面都是针对每天的信息统计:
(1)用户搭建模块次数X21,用户尝试链接模块与模块的总次数。
(2)用户调参次数X22,用户调节参数的次数,
(3)用户成功跑通整个流程所费时间X23。
(4)用户成功跑通整个流程所花费模块搭建次数X24。
(5)用户成功跑通整个流程所花费事件X25。
(6)用户日操作模块次数X26。
(7)用户操作模块种类x27。
(8)用户是否成功完成整个流程X28。
2)学生掌握知识维度
学生掌握知识维度主要是针对学生在实验环节体现出的对人工智能知识点的掌握情况,这个维度反映学生对理论知识的掌握程度,下面都是针对每天的信息统计:
(1)用户调节参数后,预测结果变好次数除以用户总的调节次数X31,用户较少次的调节参数使得预测结果变好,说明对知识掌握程度较好。
(2)用户从搭建到完成自己需求的所需要的时间X32。
(3)用户完成指定预测精度的调参次数X33,可以反应用户对参数的掌握水平。
(4)用户调节参数后的预测精度较上一次预测精度有所提高的次数X34。
(5)用户是否完成整个流程的搭建X35。
(6)用户成功搭建整个流程并完成预测任务占总的搭建、调节模型时间X36。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.自适应深度知识追踪个性化学习推荐方法,其特征在于:包括:
收集学生的作业完成数据,建立学生行为序列;
借助神经网络模型基于学生行为序列建立深度知识追踪模型;
基于深度知识追踪模型预测学生对知识的掌握程度,结合学生对知识的掌握程度,给学生推荐个性化学习方法。
2.根据权利要求1所述的自适应深度知识追踪个性化学习推荐方法,其特征在于:学生行为序列为x0,...x,txt={at,qt},其中qt代表回答的问题成分,at代表回答是否正确。
3.根据权利要求2所述的自适应深度知识追踪个性化学习推荐方法,其特征在于:神经网络模型基于LSTM神经网络实现,将输入进行one-hot编码,模型输入数据涉及M个知识成分,每道题有两种结果0和1,则模型输入长度为2M,目标函数为观测序列的非负对数似然函数。
4.根据权利要求3所述的自适应深度知识追踪个性化学习推荐方法,其特征在于:在LSTM神经网络中构造损失函数,采用事件t时刻的输入值,在正则项里引入时间t的惩罚:
Figure FDA0004015278330000011
其中:r代表损失函数总体的值,n代表学习行为序列的个数,Ti代表第i个学习行为序列的长度;
Figure FDA0004015278330000012
代表第i个学习行为序列中的第t个元素;
Figure FDA0004015278330000013
代表
Figure FDA0004015278330000014
的独热编码;
Figure FDA0004015278330000015
代表模型对第i个学习行为序列中第t个元素的预测值;
Figure FDA0004015278330000021
代表第i个学习行为序列中第t个元素的真实值;
正则项:
Figure FDA0004015278330000022
Figure FDA0004015278330000023
其中:w1、w2分别是定义的两个正则化项;
Figure FDA0004015278330000024
代表模型对第i个学习行为序列中第t+1个元素的预测值;M代表知识点的数量。
5.根据权利要求4所述的一自适应深度知识追踪个性化学习推荐方法,其特征在于:LSTM神经网络包括LSTM层和attention层,attention层提取从LSTM层中提取出的序列信息间的贡献程度,并引入用户的特征信息,特征信息包括卡顿时间、拖拽熟练度。
6.根据权利要求5所述的自适应深度知识追踪个性化学习推荐方法,其特征在于:对于存在多个知识点的题目构造多个embedding,然后对应的对这多个embedding进行求平均,然后输入到深度知识追踪模型。
7.根据权利要求1所述的自适应深度知识追踪个性化学习推荐方法,其特征在于:自适应深度知识追踪个性化学习推荐方法还包括特征功能模块,特征功能模块包括学生兴趣维度单元、学生动手能力单元和学生掌握知识维度单元。
CN202211668347.4A 2022-12-23 2022-12-23 自适应深度知识追踪个性化学习推荐方法 Pending CN116089710A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211668347.4A CN116089710A (zh) 2022-12-23 2022-12-23 自适应深度知识追踪个性化学习推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211668347.4A CN116089710A (zh) 2022-12-23 2022-12-23 自适应深度知识追踪个性化学习推荐方法

Publications (1)

Publication Number Publication Date
CN116089710A true CN116089710A (zh) 2023-05-09

Family

ID=86198396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211668347.4A Pending CN116089710A (zh) 2022-12-23 2022-12-23 自适应深度知识追踪个性化学习推荐方法

Country Status (1)

Country Link
CN (1) CN116089710A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116308935A (zh) * 2023-05-19 2023-06-23 湖南师范大学 基于多特征建模和多层次评价的学习预警方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116308935A (zh) * 2023-05-19 2023-06-23 湖南师范大学 基于多特征建模和多层次评价的学习预警方法及装置
CN116308935B (zh) * 2023-05-19 2023-08-08 湖南师范大学 基于多特征建模和多层次评价的学习预警方法及装置

Similar Documents

Publication Publication Date Title
US11874429B2 (en) High-temperature disaster forecast method based on directed graph neural network
CN108647233A (zh) 一种用于问答系统的答案排序方法
CN111309927B (zh) 一种基于知识图谱挖掘的个性化学习路径推荐方法及系统
CN109514553A (zh) 一种机器人移动控制的方法、系统及设备
CN111143539A (zh) 基于知识图谱的教学领域问答方法
CN116089710A (zh) 自适应深度知识追踪个性化学习推荐方法
CN108364066A (zh) 基于n-gram和wfst模型的人工神经网络芯片及其应用方法
CN114758180A (zh) 一种基于知识蒸馏的轻量化花卉识别方法
CN111445024B (zh) 一种医学影像识别训练方法
CN117473041A (zh) 一种基于认知策略的编程知识追踪方法
CN115827968A (zh) 一种基于知识图谱推荐的个性化知识追踪方法
CN109409642A (zh) 一种基于大数据的教学资源评级方法
CN112906293B (zh) 一种基于复习机制的机器教学方法及系统
Li et al. [Retracted] The Development and Management Work Innovation of University Students by Artificial Intelligence and Deep Learning in the Wireless Network Era
CN112529188A (zh) 基于知识蒸馏的工业过程优化决策模型迁移优化方法
CN112001536A (zh) 基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法
CN115952838B (zh) 一种基于自适应学习推荐系统生成方法及系统
Munoz et al. Finding the appropriate housing: A fuzzy-model-based recommender system
Wang et al. A Brain-inspired Computational Model for Human-like Concept Learning
CN117743699B (zh) 一种基于dkt与汤普森采样算法的习题推荐方法及系统
Li Data-driven adaptive learning systems
CN118170979A (zh) 一种基于多概念学习资源的学习路径推荐方法
Bravo-Hermsdorff Quantifying Human Priors over Abstract Relational Structures
Wu et al. Research on Intelligent Question-Answering Systems Based on Large Language Models and Knowledge Graphs
Zhang A Knowledge Recommendation Model in Teaching Chinese as a Foreign Language

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination