CN114201684A - 一种基于知识图谱的自适应学习资源推荐方法及系统 - Google Patents

一种基于知识图谱的自适应学习资源推荐方法及系统 Download PDF

Info

Publication number
CN114201684A
CN114201684A CN202111535666.3A CN202111535666A CN114201684A CN 114201684 A CN114201684 A CN 114201684A CN 202111535666 A CN202111535666 A CN 202111535666A CN 114201684 A CN114201684 A CN 114201684A
Authority
CN
China
Prior art keywords
user
knowledge
matrix
test question
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111535666.3A
Other languages
English (en)
Inventor
吴迪
汤国频
胡淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202111535666.3A priority Critical patent/CN114201684A/zh
Publication of CN114201684A publication Critical patent/CN114201684A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Pure & Applied Mathematics (AREA)
  • Molecular Biology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Animal Behavior & Ethology (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提出一种基于知识图谱的自适应学习资源推荐方法及系统,包括:建立用户认知诊断模型和试题得分预测模型,预测用户对知识点的掌握情况和对未完成试题的得分情况,然后选出第一候选学习资源;构建知识图谱,利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,选出第二候选学习资源;从候选学习资源中筛选出最佳的学习资源,并推荐给用户。本发明不仅考虑用户的认知水平和用户对未完成试题的得分的预测情况,且考虑了知识点之间的语义关系,构建了相应的知识图谱,结合用户的认知诊断结果在知识图谱中定位用户掌握较好和较差的知识点,选出了最适合用户的学习资源,并推荐给用户。

Description

一种基于知识图谱的自适应学习资源推荐方法及系统
技术领域
本发明涉及在线学习技术领域,更具体地,涉及一种基于知识图谱的自适应学习资源推荐方法及系统。
背景技术
随着科技的高速发展,线上学习已经成为人们重要的学习方式之一。网络教学资源作为线上学习的重要组成部分,在促进用户认知水平、提升用户实践能力和培养用户高级思维能力等方面的重要性日益显著。但爆发式增长的在线教育资源逐渐让学习者面临“信息过载”和“知识迷航”等问题。如何为学习者提供个性化的学习服务并推荐合适的教育资源,是目前需要解决的问题。
现有一种基于认知诊断的时序性习题推荐方法,该方法根据全体用户的做题行为数据,构建每个用户的做题得分矩阵,并结合试题-知识点的关联矩阵,获得各个用户的第一知识点掌握矩阵;根据第一知识点掌握矩阵、失误率和猜测率,获得第二知识点掌握矩阵,并结合循环神经网络系统,获得每个用户的认知诊断向量;根据相似度计算公式,从所有用户的认知诊断向量中筛选出与待推荐用户的认知诊断向量相似度最高的目标用户,并提取目标用户的做题行为数据,筛选出待推荐用户未测试过的试题试题,以便于将筛选出来的试验试题推荐给待推荐用户。
然而,上述方法根据用户的认知诊断结果对用户进行习题推荐,忽略了知识点之间的关系以及不同知识点在试题考察中的重要性,推荐给用户的试题并非最适合用户的试题。
发明内容
本发明为解决如何提高学习资源推荐的精准度的问题,提供一种基于知识图谱的自适应学习资源推荐方法及系统。
为解决上述技术问题,本发明的技术方案如下:
第一个方面,本发明提出一种基于知识图谱的自适应学习资源推荐方法,包括:
建立用户认知诊断模型,通过所述用户认知诊断模型对用户进行学习认知诊断,并根据诊断结果,预测用户对知识点的掌握情况。
建立试题得分预测模型,利用所述试题得分预测模型,预测用户对未完成试题的得分情况。
根据用户对知识点掌握情况和用户对未完成试题的得分情况,选出第一候选学习资源。
构建知识图谱,利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,选出第二候选学习资源。
从第一候选学习资源和第二候选学习资源中筛选出最佳的学习资源,并将最佳的学习资源推荐给用户。
优选地,通过所述用户认知诊断模型对用户进行学习认知诊断,并根据诊断结果,预测用户对知识点的掌握情况具体包括:
定义集合P={p1,p2,...,pU}为用户集合,集合T={t1,t2,...,tV}为题目集合,集合C={c1,c2,...,cK}为知识点集合;
将用户的潜在学习状态定义成一个多维知识点掌握向量αuk={αu1,αu2,...,αuK},αuk中每一维对应用户pu对知识点ck的掌握情况,当αuk=1时表示用户pu掌握知识点ck,当αuk=0时表示用户pu未掌握知识点ck;然后计算用户pu在试题tv上的潜在答题情况ηuv,其公式如下所示:
Figure BDA0003413068490000021
其中,当ηuv=1时;当ηuv=1时,表示用户pu能够正确作答试题tv且掌握了试题tv所涉及的知识点ck;当ηuv=0时,表示用户pu不能正确作答试题tv且未掌握试题tv所涉及的知识点ck
计算用户pu在未掌握试题tv所涉及的知识点ck的前提下,通过人为猜测的方式得到正确作答试题tv的猜测率gv,其公式如下表示:
gv=P(ruv=1|ηuv=0)
其中,ruv表示用户pu在试题tv上的得分情况,当ruv=1时,表示用户pu正确作答试题tv
计算用户pu在掌握试题tv所涉及的知识点ck的前提下,因失误而未能正确作答试题tv的失误率sv,其公式如下表示:
sv=P(ruv=0|ηuv=1)
其中,当ruv=0时,表示用户pu未能正确作答试题tv
根据猜测率gv、失误率sv和潜在答题情况ηuv,并考虑试题难度、遗忘曲线和答题次数,计算用户pu在试题tv上的正确作答概率,其公式如下所示:
Figure BDA0003413068490000031
其中,ω表示试题难度,
Figure BDA0003413068490000032
用于拟合遗忘曲线;ξ表示用户pu在试题tv上的答题情况,当用户pu正确作答试题tv,ξ取值为1,当用户pu错误作答试题tv,ξ取值为0;frequency表示答题次数。
根据用户pu在试题tv上的正确作答概率,确定用户的多维知识点掌握向量αu并计算向量αu估计值,利用向量αu估计值构建用户-知识点矩阵B。
根据用户-知识点矩阵B,预测用户pu对知识点ck的掌握情况。
优选地,利用向量αu估计值构建用户-知识点矩阵B具体包括:
采用EM算法最大化猜测率gv和失误率sv的边缘似然概率,分别得到猜测率gv和失误率sv的估计值
Figure BDA0003413068490000033
Figure BDA0003413068490000034
通过最大后验概率算法确定用户的多维知识点掌握向量αu的估计值
Figure BDA0003413068490000035
其公式如下所示:
Figure BDA0003413068490000036
其中,α表示,Ru表示用户u的得分矩阵。
根据用户的多维知识点掌握向量αu的估计值
Figure BDA0003413068490000037
构建用户-知识点矩阵B。
优选地,利用所述试题得分预测模型,预测用户对未完成试题的得分情况具体包括:
建立试题得分预测模型,将试题输入到所述试题得分预测模型,得到试题对应的隐式特征向量;
根据试题对应的隐式特征向量,使用概率矩阵对由用户pu在试题tv上的得分情况ruv构建的用户试题得分矩阵R进行分解,获得用户隐式特征矩阵和试题隐式特征矩阵;
根据获得用户隐式特征矩阵和试题隐式特征矩阵,使用KNN算法对进行概率矩阵分解后的用户试题得分矩阵R进行修正,得到最终的用户对未完成试题的得分情况。
优选地,所述试题得分预测模型利用卷积神经网络和注意力机制获得试题对应的隐式特征向量,所述卷积神经网络包括嵌入层、注意力层、卷积层、池化层和输出层,具体为:
将试题的相关文本输入嵌入层,嵌入层输出文本中每个词语的d维向量an,利用向量an构建密集数字矩阵S,其公式如下所示:
Figure BDA0003413068490000041
将密集数字矩阵S输入注意力层,突显文本中重点词的特征,获得重点词的特征表达
Figure BDA0003413068490000042
具体计算如下所示:
Figure BDA0003413068490000043
s(i)=f(Hi*Watt+batt)
其中,A表示通过注意力机制获得的词语特征表示;D表示一个中心词hi的上下文范围,s(i)表示上下文范围内每个词的特征值权重,Watt表示上下文范围对应的矩阵参数,batt表示偏置量,f(·)表示激活函数;
将上下文范围内每个词特征wi与词的特征值权重s(i)相乘输出新的特征表示
Figure BDA0003413068490000044
其表达公式如下:
Figure BDA0003413068490000045
将特征表示
Figure BDA0003413068490000046
输入卷积层,提取重点词的特征C(i),其公式如下所示:
Figure BDA0003413068490000047
其中,Wc表示共享权重,bc表示偏置,f(·)表示激活函数;
将特征C(i)输入池化层,池化层输出具有代表性的特征Cout(i):
Cout(i)=MAX(C(i))
将具有代表性的特征Cout(i)输入输出层,得到试题的相关文本对应的隐式特征向量Dj
Figure BDA0003413068490000048
其中,
Figure BDA0003413068490000049
Figure BDA00034130684900000410
为映射矩阵,
Figure BDA00034130684900000411
Figure BDA00034130684900000412
与偏置向量,f(·)表示激活函数;W表示所有权重和偏置,Hj表示试题的相关文本对应的词向量。
优选地,使用概率矩阵对由用户pu在试题tv上的得分情况ruv构建的用户试题得分矩阵R进行分解,获得用户隐式特征矩阵和试题隐式特征矩阵具体包括:
假设用户试题得分矩阵R通过概率矩阵分解为用户隐式特征矩阵U、知识点隐式特征矩阵K和试题隐式特征矩阵V;
用户隐式特征矩阵U和知识点隐式特征矩阵K的先验概率服从高斯分布且相互独立:
Figure BDA0003413068490000051
Figure BDA0003413068490000052
其中,m表示用户的数量,l表示知识点的数量,
Figure BDA0003413068490000053
Figure BDA0003413068490000054
表示方差,I表示单位向量;
试题隐式特征矩阵V的概率分布为:
Figure BDA0003413068490000055
Figure BDA0003413068490000056
其中,Wz表示卷积神经网络中神经元之间的权重,
Figure BDA0003413068490000057
表示方差,n表示试题的数量,
Figure BDA0003413068490000058
表示方差;
在给定用户和试题对应的隐式特征向量后,用户试题得分矩阵R的条件概率分布为:
Figure BDA0003413068490000059
其中,
Figure BDA00034130684900000510
表示方差,
Figure BDA00034130684900000511
表示概率矩阵分解得到的隐式特征,
Figure BDA00034130684900000512
表示指示函数,若学生i做过试题j,则
Figure BDA00034130684900000513
否则
Figure BDA00034130684900000514
用户知识点矩阵B的条件概率分布为:
Figure BDA00034130684900000515
其中,l表示知识点的数量,bic表示用户i对于知识点c的掌握情况,Kc表示知识点隐式特征向量,
Figure BDA00034130684900000516
表示方差,
Figure BDA00034130684900000517
表示指示函数;
结合用户隐式特征矩阵U、知识点隐式特征矩阵K、试题隐式特征矩阵V、用户试题得分矩阵R和用户知识点矩阵B的概率分布,同时利用贝叶斯准则以及最大化技巧,最终可得目标函数E(K,U,V,B,R)如下:
Figure BDA0003413068490000061
Figure BDA0003413068490000062
Figure BDA0003413068490000063
Figure BDA0003413068490000064
其中,bij表示用户i对知识点j的掌握情况,Wi表示卷积神经网络对应的权重;
目标函数E(K,U,V,B,R)的最优解可通过随机梯度下降方法进行求解,从而得到用户隐式特征矩阵和试题隐式特征矩阵的最优解。
优选地,根据获得用户隐式特征矩阵和试题隐式特征矩阵,使用KNN算法对进行概率矩阵分解后的用户试题得分矩阵R进行修正,得到最终的用户对未完成试题的得分情况,具体为:
假设在用户i已经完成的试题集合中使用KNN算法找到与试题j最相似的N个试题,弥补因概率矩阵分解丢失的隐式特征信息,对用户试题得分矩阵进行修正,得到最终的试题得分Rij
Figure BDA0003413068490000065
Figure BDA0003413068490000066
其中,Rij表示最终的预测的用户对未完成试题的得分情况,R′ij为修正因子,Rin表示用户在试题上的原始得分,Vn表示试题的特征向量。
优选地,选出第二候选学习资源具体包括:
构建知识图谱。
计算知识图谱中知识元节点的中心度,其公式如下所示:
Figure BDA0003413068490000067
其中,Gi表示知识元i的中心度,δ表示知识元的贡献度,λ表示知识元对应的权重;α与β均为权重系数,表示知识元自身以及知识元的各阶邻居知识元对总的中心度的贡献程度。
对知识元节点包含的学习资源进行分类。
利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,选出第二候选学习资源。
优选地,构建知识图谱具体包括:
收集文本数据集;
对文本数据集进行实体抽取,获得文本数据集中的实体;
对实体进行关系抽取,获得实体之间存在的关系;
将实体和实体之间的关系进行人工知识融合,利用融合后的结果构建知识图谱,并将知识图谱存储在数据库中。
第二个方面,本发明提出一种基于知识图谱的自适应学习资源推荐系统,包括:
用户认知诊断模块,用于对用户进行学习认知诊断,根据诊断结果,预测用户对知识点的掌握情况。
试题得分预测模块,用于预测用户对未完成试题的得分情况。
知识图谱构建模块,用于构建知识图谱,利用用户认知诊断模块的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点。
学习资源获取模块,用于根据用户认知诊断模块和试题得分预测模块的输出结果,获取第一候选学习资源。根据知识图谱构建模块的输出结果,第二候选学习资源。
推荐模块,用于第一候选学习资源和第二候选学习资源中筛选出最佳的学习资源,并将最佳的学习资源推荐给用户。
与现有技术相比,本发明技术方案的有益效果是:本发明不仅考虑用户的认知水平和用户对未完成试题的得分的预测情况,且考虑了知识点之间的语义关系,构建了相应的知识图谱,结合用户的认知诊断结果在知识图谱中定位用户掌握较好和较差的知识点,选出了最适合用户的学习资源,并推荐给用户,实现学习资源的精准推荐。
附图说明
图1为实施例1中基于知识图谱的自适应学习资源推荐方法的流程图。
图2为实施例2中基于知识图谱的自适应学习资源推荐方法的流程图。
图3为实施例3中基于知识图谱的自适应学习资源推荐系统的架构图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
请参阅图1,本实施例提出一种基于知识图谱的自适应学习资源推荐方法,包括:
建立用户认知诊断模型,通过所述用户认知诊断模型对用户进行学习认知诊断,并根据诊断结果,预测用户对知识点的掌握情况。
本实施例在现有的I-DINA(I-Deterministic Inputs,Noisy“And”gate model)模型的基础上,构建一种名为AMI-DINA(AMI-Deterministic Inputs,Noisy“And”gatemodel)认知诊断模型,所述构建AMI-DINA认知诊断模型包括计算用户在试题上的潜在答题情况;计算用户在未掌握试题所涉及的知识点的前提下,通过人为猜测的方式得到正确作答试题的猜测率;计算用户在掌握试题所涉及的知识点的前提下,因失误而未能正确作答试题的失误率;引入试题难度、遗忘曲线和答题次数参考因素,计算用户在试题上的正确作答概率;构建用户-知识点矩阵。
所述AMI-DINA认知诊断模型不仅考虑失误率和猜测率对认真诊断结果带来的影响,还考虑了试题难度、遗忘曲线和答题次数对试题正确作答带来的影响。
建立试题得分预测模型,利用所述试题得分预测模型,预测用户对未完成试题的得分情况。
本实施例提出一种名为KCAMF(KNN&CNN-Attention&Probabilistic MatrixFactorization)的试题得分预测模型,该模型通过通过利用融合注意力机制的卷积神经网络深度挖掘试题文本的隐式特征,融合认知诊断模型获取知识点和用户的隐式特征,结合PMF(Probabilistic Matrix Factorization,概率矩阵分解)以及KNN(K-NearestNeighbor)最近邻算法实现题目得分预测。
根据用户对知识点掌握情况和用户对未完成试题的得分情况,选出第一候选学习资源。
构建知识图谱,利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,选出第二候选学习资源。
本实施例中,考虑知识点之间存在的语义关系,针对用户掌握较好的知识点找出其后继知识点,例如,用户对知识点a掌握较好,用户可以直接学习知识点b,则知识点b为知识点a的后继知识点。针对用户掌握较弱的知识点找出其前驱知识点,例如,用户对知识点a掌握较弱,用户需要学习知识点b,则知识点b为知识点a的前驱知识点。
从第一候选学习资源和第二候选学习资源中筛选出最佳的学习资源,并将最佳的学习资源推荐给用户。
在用户的认知水平方面,通过构建AMI-DINA认知诊断模型,考虑试题难度、遗忘曲线和答题次数对试题正确作答带来的影响,对用户进行学习认知诊断,根据诊断结果,预测用户对知识点的掌握情况,然后构建KCAMF试题得分预测模型对用户对未完成试题的得分进行预测,用户对知识点掌握情况和用户对未完成试题的得分情况,选出第一候选学习资源;并且考虑了知识点之间的语义关系,构建了相应的知识图谱,结合用户的认知诊断结果在知识图谱中定位用户掌握较好和较差的知识点,针对用户掌握较好的知识点找出其后继知识点,针对用户掌握较弱的知识点找出其前驱知识点,选出第二候选学习资源;最后从第一候选学习资源和第二候选学习资源选出了最适合用户的学习资源,并推荐给用户。
实施例2
请参阅图2,本实施例提出一种基于知识图谱的自适应学习资源推荐方法,包括:
建立用户认知诊断模型,通过所述用户认知诊断模型对用户进行学习认知诊断,并根据诊断结果,预测用户对知识点的掌握情况。本实施例中的用户认知诊断模型使用AMI-DINA认知诊断模型。具体包括以下步骤:
定义集合P={p1,p2,...,pU}为用户集合,集合T={t1,t2,...,tV}为题目集合,集合C={c1,c2,...,cK}为知识点集合;矩阵Q为试题知识点关联矩阵,矩阵Q中的每一个元素qvk表示题目tv对知识点ck的考察情况;矩阵R为用户得分矩阵,矩阵R中每一个元素ruv表示用户pu在试题tv上的得分情况;矩阵η为用户潜在答题矩阵,矩阵η中每一个元素ηuv表示用户pu在试题tv上潜在答题情况。
将用户的潜在学习状态定义成一个多维知识点掌握向量αuk={αu1,αu2,...,αuK},αuk中每一维对应用户pu对知识点ck的掌握情况,当αuk=1时表示用户pu掌握知识点ck,当αuk=0时表示用户pu未掌握知识点ck;然后计算用户pu在试题tv上的潜在答题情况ηuv,其公式如下所示:
Figure BDA0003413068490000101
其中,当ηuv=1时;当ηuv=1时,表示用户pu能够正确作答试题tv且掌握了试题tv所涉及的知识点ck;当ηuv=0时,表示用户pu不能正确作答试题tv且未掌握试题tv所涉及的知识点ck
计算用户pu在未掌握试题tv所涉及的知识点ck的前提下,通过人为猜测的方式得到正确作答试题tv的猜测率gv,其公式如下表示:
gv=P(ruv=1|ηuv=0)
其中,ruv表示用户pu在试题tv上的得分情况,当ruv=1时,表示用户pu正确作答试题tv
计算用户pu在掌握试题tv所涉及的知识点ck的前提下,因失误而未能正确作答试题tv的失误率sv,其公式如下表示:
sv=P(ruv=0|ηuv=1)
其中,当ruv=0时,表示用户pu未能正确作答试题tv
根据猜测率gv、失误率sv和潜在答题情况ηuv,并考虑试题难度、遗忘曲线和答题次数,计算用户pu在试题tv上的正确作答概率,其公式如下所示:
Figure BDA0003413068490000102
其中,ω表示试题难度,
Figure BDA0003413068490000103
用于拟合遗忘曲线;ξ表示用户pu在试题tv上的答题情况,当用户pu正确作答试题tv,ξ取值为1,当用户pu错误作答试题tv,ξ取值为0;frequency表示答题次数。
根据用户pu在试题tv上的正确作答概率,确定用户的多维知识点掌握向量αu并计算向量αu估计值,利用向量αu估计值构建用户-知识点矩阵B。矩阵B的行表示用户,列表示知识点,即行向量为每个用户对知识点的掌握情况。
本实施例中,由于构建的公式存在无法直接观察的隐变量,即用户的知识点掌握程度,因此需要通过EM算法来最大化公式的边缘似然概率,从而得到每一道题目对应的两个试题参数的估计值
Figure BDA0003413068490000104
Figure BDA0003413068490000105
同时,通过最大后验概率算法确定用户的多维知识点掌握向量αu的估计值
Figure BDA0003413068490000106
其公式如下所示:
Figure BDA0003413068490000111
其中,α表示知识点掌握向量,Ru表示用户u的得分矩阵。
通过EM算法,可以解决不完全数据的参数估计问题。当缺失的信息量很大或者数据量非常大师,AMI-DINA认知诊断模型通过将用户数据划分为多个用户块,每次迭代访问其中一个用户块以及多线程训练技巧从而达到加速的效果。
根据用户-知识点矩阵B,预测用户pu对知识点ck的掌握情况。
当获得所有用户对应的多维知识点掌握向量αu之后,便可以得到最终的用户-知识点矩阵B,用户-知识点矩阵B主要有两个功能:第一,利用用户-知识点矩阵B结合试题知识点关联矩阵Q,对所有用户的答题情况进行预测。第二,利用用户-知识点矩阵B在知识图谱中定位用户掌握较弱与较好的知识点,而后根据知识图谱上知识点的前后序的关系为用户进行有针对性的、高精度的学习资源推荐。
AMI-DINA认知诊断模型引入了猜测率、失误率、试题难度参数、拟合遗忘曲线和答题次数的参数,更准确地在多维知识层面诊断用户的认知学习状态。
建立KCAMF试题得分预测模型,利用所述KCAMF试题得分预测模型,预测用户对未完成试题的得分情况,具体包括以下步骤:
建立KCAMF试题得分预测模型,将试题输入到所述KCAMF试题得分预测模型,得到试题对应的隐式特征向量。
本实施例中,将注意力机制融合至KCAMF试题得分预测模型中的卷积神经网络中,得到CNN-Attention模型,包括嵌入层、注意力层、卷积层、池化层和输出层,试题对应的隐式特征向量的获取过程具体为:
将试题的相关文本(包含题目、答案、解析和评论)输入嵌入层,嵌入层输出文本中每个词语的d维向量an,利用向量an构建密集数字矩阵S,其公式如下所示:
Figure BDA0003413068490000112
将密集数字矩阵S输入注意力层,突显文本中重点词的特征,获得重点词的特征表达
Figure BDA0003413068490000121
具体计算如下所示:
Figure BDA0003413068490000122
s(i)=f(Hi*Watt+batt)
其中,A表示通过注意力机制获得的词语特征表示;D表示一个中心词hi的上下文范围,s(i)表示上下文范围内每个词的特征值权重,Watt表示上下文范围对应的矩阵参数,batt表示偏置量,f(·)表示激活函数。
将上下文范围内每个词特征wi与词的特征值权重s(i)相乘输出新的特征表示
Figure BDA0003413068490000123
其表达公式如下:
Figure BDA0003413068490000124
将特征表示
Figure BDA0003413068490000125
输入卷积层,提取重点词的特征C(i),其公式如下所示:
Figure BDA0003413068490000126
其中,Wc表示共享权重,bc表示偏置,f(·)表示激活函数。
将特征C(i)输入池化层,池化层输出具有代表性的特征Cout(i):
Cout(i)=MAX(C(i))
将具有代表性的特征Cout(i)输入输出层,得到试题的相关文本对应的隐式特征向量Dj
Figure BDA0003413068490000127
其中,
Figure BDA0003413068490000128
Figure BDA0003413068490000129
为映射矩阵,
Figure BDA00034130684900001210
Figure BDA00034130684900001211
与偏置向量,f(·)表示激活函数;W表示所有权重和偏置,Hj表示试题的相关文本对应的词向量。
根据试题对应的隐式特征向量,使用概率矩阵对由用户pu在试题tv上的得分情况ruv构建的用户试题得分矩阵R进行分解,获得用户隐式特征矩阵和试题隐式特征矩阵,具体包括以下步骤:
假设用户试题得分矩阵R通过概率矩阵分解为用户隐式特征矩阵U、知识点隐式特征矩阵K和试题隐式特征矩阵V;
用户隐式特征矩阵U和知识点隐式特征矩阵K的先验概率服从高斯分布且相互独立:
Figure BDA00034130684900001212
Figure BDA00034130684900001213
其中,m表示用户的数量,l表示知识点的数量,
Figure BDA0003413068490000131
Figure BDA0003413068490000132
表示方差,I表示单位向量;
试题隐式特征矩阵V的概率分布为:
Figure BDA0003413068490000133
Figure BDA0003413068490000134
其中,Wz表示卷积神经网络中神经元之间的权重,
Figure BDA0003413068490000135
表示方差,n表示试题的数量,
Figure BDA0003413068490000136
表示方差;
在给定用户和试题对应的隐式特征向量后,用户试题得分矩阵R的条件概率分布为:
Figure BDA0003413068490000137
其中,
Figure BDA0003413068490000138
表示方差,
Figure BDA0003413068490000139
表示概率矩阵分解得到的隐式特征,
Figure BDA00034130684900001310
表示指示函数,若学生i做过试题j,则
Figure BDA00034130684900001311
否则
Figure BDA00034130684900001312
用户知识点矩阵B的条件概率分布为:
Figure BDA00034130684900001313
其中,l表示知识点的数量,bic表示用户i对于知识点c的掌握情况,Kc表示知识点隐式特征向量,
Figure BDA00034130684900001314
表示方差,
Figure BDA00034130684900001315
表示指示函数;
结合用户隐式特征矩阵U、知识点隐式特征矩阵K、试题隐式特征矩阵V、用户试题得分矩阵R和用户知识点矩阵B的概率分布,同时利用贝叶斯准则以及最大化技巧,最终可得目标函数E(K,U,V,B,R)如下:
Figure BDA00034130684900001316
Figure BDA0003413068490000141
其中,bij表示用户i对知识点j的掌握情况,Wi表示卷积神经网络对应的权重;
通过随机梯度下降方法对目标函数E(K,U,V,B,R)进行求解,从而得到用户隐式特征矩阵和试题隐式特征矩阵的最优解。
S2.3:根据获得用户隐式特征矩阵和试题隐式特征矩阵,使用KNN算法对进行概率矩阵分解后的用户试题得分矩阵R进行修正,得到最终的用户对未完成试题的得分情况。
虽然PMF可以克服试题得分矩阵R过于稀疏性的问题,但在矩阵分解的过程中,试题得分矩阵R容易丢失部分隐藏的特征信息,因此本实施例引入KNN算法对每一个试题评分进行修正,具体为:假设在用户i已经完成的试题集合中使用KNN算法找到与试题j最相似的N个试题,弥补因PMF丢失的隐式特征信息,对用户试题得分矩阵进行修正,得到最终的试题得分Rij
Figure BDA0003413068490000142
Figure BDA0003413068490000143
其中,Rij表示最终的预测的用户对未完成试题的得分情况,R′ij为修正因子,用于弥补由于矩阵分解导致的部分信息丢失而产生的精度问题;Rin表示用户在试题上的原始得分,Vn表示试题的特征向量。
根据用户对知识点掌握情况和用户对未完成试题的得分情况,选出第一候选学习资源。
本实施例中,对用户对知识点掌握情况和用户对未完成试题的得分情况好坏进行排序,并结合试题难度系数λ,在用户预期的难度区间选择候选学习资源,λ的计算公式如下所示:
Figure BDA0003413068490000144
即将用户的潜在答题情况ηuv归一化至[0,1]范围得到试题的难度系数,最终,从学习资源中选择难度系数符合预期(λ1,λ2)的学习资源作为候选学习资源。
构建知识图谱,利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,选出第二候选学习资源。
知识图谱能够快速描述物理世界中各个实体的概念以及实体间的相互关系,同时能够表达更加广泛的知识内容以及语义关系。当前知识图谱在学习资源推荐领域的应用还处于起步阶段,存在诸如构建过程过于依赖学科专家,自动化程度不高;知识粒度大小模糊,多用于表达概念未对知识元进行充分的表达等问题。
因此本发明在传统知识图谱的基础上提出了一个适用于学习资源推荐领域知识图谱的构建方法。该方法针对每个知识元节点都额外采用一个二元组(中心度、包含的学习资源)进行更深入与细致地描述,具体包括以下步骤:
构建知识图谱:
利用爬虫技术收集文本数据集;所述文本数据集包括结构化数据、半结构化数据和非结构化数据。
对文本数据集进行实体抽取,获得文本数据集中的实体。
实体抽取又称为命名实体识别,即从文本数据集中自动识别出命名实体。本实施例采用Bi-LSTM+CRF模型完成试题识别。Bi-LSTM+CRF模型由三层组成,第一层为输入层,用于把文本数据转为词向量与字向量;第二层为双层LSTM,用于将第一层得到的词向量与字向量输入Bi-LSTM,得到每个词所有标签的得分;第三层为序列标注层,用于将第二层的输出作为输入,获取标签序列的概率值。
对实体进行关系抽取,获得实体之间存在的关系。
关系抽取用于判断抽取的实体之间是否存在某种已定义的关系类型。目前常本发明采用双向GRU结合Attention模型,对步骤二抽取的实体进行关系抽取。
将实体和实体之间的关系进行人工知识融合,利用融合后的结果构建知识图谱,并将知识图谱存储在数据库中。
通过实体以及关系抽取的三元组中可能会存在大量重复信息或者错误信息,由于本实施例构建的知识图谱最终是作为个性化学习资源推荐的支撑数据,所以有必要对实体以及关系进行人工知识融合处理,以保证知识图谱内节点的专业用语和节点之间关系的准确性。
知识图谱主要有两种存储方式:RDF和图数据库。相比RDF,图数据库更注重高效的图查询和搜索,同时图数据库一般以属性图为基本的表示形式,所以实体和关系可以包含属性,这就意味着更容易表达现实的业务场景。因此,本实施例将知识点实体以及知识点实体之间的关系存入图数据库Neo4j内。
计算知识图谱中知识元节点的中心度。
目前对于中心度这一概念,学术界没有形成统一的定义,一般认为中心度是网络节点中某个属性的重要程度的度量。本实施例结合知识点的特性以及用户的学习规律,将知识元中心度定义为知识元节点在知识图谱中的影响力的大小。
知识元的中心度是知识图谱中所有知识点相互作用、贡献的结果,且两个知识元节点距离越近,彼此的依赖越强,知识点之间的依赖关系随距离的增加呈现出指数衰减趋势。同时需要考虑到学习资源推荐领域中对不同知识点的要求不同,根据教育大纲可以将知识点重要程度分为了解、理解、掌握与运用,并赋予0.1、0.2、0.3、0.4的权重,计算中心度的公式如下所示:
Figure BDA0003413068490000161
其中,Gi表示知识元i的中心度,δ表示知识元的贡献度,λ表示知识元对应的权重;α与β均为权重系数,表示知识元自身以及知识元的各阶邻居知识元对总的中心度的贡献程度。
对知识元节点包含的学习资源进行分类。
本实施例采用Bi-LSTM+Attention模型来对题目知识点标签的自动化标注,实现对知识元节点包含的学习资源的分类。
Bi-LSTM+Attention模型是在Bi-LSTM的基础中融入Attention层,Attention的功能是先计算每个时序的权重,然后将所有时序的向量进行加权和作为特征向量,最后进行Softmax分类。
利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,选出第二候选学习资源。
本实施例中,考虑知识点之间存在的语义关系,针对用户掌握较好的知识点找出其后继知识点,例如,用户对知识点a掌握较好,用户可以直接学习知识点b,则知识点b为知识点a的后继知识点。针对用户掌握较弱的知识点找出其前驱知识点,例如,用户对知识点a掌握较弱,用户需要学习知识点b,则知识点b为知识点a的前驱知识点。在找出后继知识点和前驱知识点后,根据中心度的高低对知识点进行排序,并结合难度系数λ,选出第二候选学习资源。
从第一候选学习资源和第二候选学习资源中筛选出最佳的学习资源,并将最佳的学习资源推荐给用户。
在用户的认知水平方面,通过构建AMI-DINA认知诊断模型,考虑试题难度、遗忘曲线和答题次数对试题正确作答带来的影响,对用户进行学习认知诊断,根据诊断结果,预测用户对知识点的掌握情况,然后构建KCAMF试题得分预测模型对用户对未完成试题的得分进行预测,用户对知识点掌握情况和用户对未完成试题的得分情况,选出第一候选学习资源;并且考虑了知识点之间的语义关系,构建了相应的知识图谱,结合用户的认知诊断结果在知识图谱中定位用户掌握较好和较差的知识点,针对用户掌握较好的知识点找出其后继知识点,针对用户掌握较弱的知识点找出其前驱知识点,选出第二候选学习资源;最后从第一候选学习资源和第二候选学习资源选出了最适合用户的学习资源,并推荐给用户。
本实施例的伪代码如下所示:
输入:
学习者集P、试题集T、学习者-试题得分矩阵R、试题-知识点关联矩阵Q、领域知识图谱KG
输出:
待推荐学习资源集Trec
1.for每个学习者pu
2.根据公式(2-5)并结合试题-知识点关联矩阵Q计算出学习者的知识点掌握向量αu
3.end for
4.根据公式(2-20)不断更新用户特征矩阵以及试题特征矩阵直到满足终止迭代条件
5.for每个试题Tv∈T:
6.根据公式(2-22)计算学习者pu在此题上的预测得分情况μv
7.根据公式(2-23)计算试题对应的难度系数λ
8.endfor
9.从试题集中选择难度系数λ位于难度范围(λ1,λ2)区间内的试题作为T1
10.根据学习者的知识点掌握向量αu,计算出学习者掌握牢固以及掌握薄弱的知识点C1与C2,并且C1与C2根据公式(2-6)计算结果降序排序。
11.for每个学习者pu
12.for每个知识点c∈C1
13.在KG中定位知识点c,找出所有与c为后继关系的目标知识点
14.从知识点对应的学习资源中选择难度系数位于难度范围(λ1,λ2)区间内的试题
15.作为T2
16.end for
17.endfor
18.for每个学习者pu
19.for每个知识点c∈C2
20.在KG中定位知识点c,找出所有与c为前驱关系的目标知识点
21.从知识点对应的学习资源中选择难度系数位于难度范围(λ1,λ2)区间内的试题
22.作为T3
23.end for
24.endfor
25.最终的试题推荐集合Trec←T1∪T2∪T3
实施例3
请参阅图3,本实施例提出一种基于知识图谱的自适应学习资源推荐系统,包括:用户认知诊断模块、试题得分预测模块、知识图谱构建模块、学习资源获取模块和推荐模块。
在具体实施过程中,用户认真诊断模块获取用户的做题数据、试题知识点关联矩阵、用户得分矩阵的信息,利用AMI-DINA认知诊断模型计算用户的猜测率、失误率和潜在答题情况,并考虑试题难度、遗忘曲线和答题次数,计算用户在试题上的正确作答概率,以获得用户对知识点的掌握情况,将用户对知识点的掌握情况输出到学习资源获取模块;
试题得分预测模块从试题中获得试题对应的隐式特征向量,并根据试题对应的隐式特征向量,使用概率矩阵对用户试题得分矩阵进行分解,使用KNN算法对进行概率矩阵分解后的用户试题得分矩阵R进行修正,得到最终的试题预测得分,将最终的试题预测得分情况输出到学习资源获取模块。
知识图谱构建模块构建基础知识图谱,计算知识图谱中知识元节点的中心度,对知识元节点包含的学习资源进行分类,利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,并输出后继知识点和前驱知识点。
学习资源获取模块根据用户认知诊断模块和试题得分预测模块的输出结果,结合用户的难度期望区间,选出第一候选学习资源;根据知识图谱构建模块的输出结果,结合用户的难度期望区间,选出第二候选学习资源,将第一候选学习资源和第二候选学习资源输出到推荐模块。
推荐模块从第一候选学习资源和第二候选学习资源中筛选出最佳的学习资源,并将最佳的学习资源推荐给用户。
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种基于知识图谱的自适应学习资源推荐方法,其特征在于,包括:
建立用户认知诊断模型,通过所述用户认知诊断模型对用户进行学习认知诊断,并根据诊断结果,预测用户对知识点的掌握情况;
建立试题得分预测模型,利用所述试题得分预测模型,预测用户对未完成试题的得分情况;
根据用户对知识点掌握情况和用户对未完成试题的得分情况,选出第一候选学习资源;
构建知识图谱,利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,选出第二候选学习资源;
从第一候选学习资源和第二候选学习资源中筛选出最佳的学习资源,并将最佳的学习资源推荐给用户。
2.根据权利要求1所述的基于知识图谱的自适应学习资源推荐方法,其特征在于,通过所述用户认知诊断模型对用户进行学习认知诊断,并根据诊断结果,预测用户对知识点的掌握情况具体包括:
定义集合P={p1,p2,...,pU}为用户集合,集合T={t1,t2,...,tV}为题目集合,集合C={c1,c2,...,cK}为知识点集合;
将用户的潜在学习状态定义成一个多维知识点掌握向量αuk={αu1,αu2,...,αuK},αuk中每一维对应用户pu对知识点ck的掌握情况,当αuk=1时表示用户pu掌握知识点ck,当αuk=0时表示用户pu未掌握知识点ck;然后计算用户pu在试题tv上的潜在答题情况ηuv,其公式如下所示:
Figure FDA0003413068480000011
其中,当ηuv=1时,表示用户pu能够正确作答试题tv且掌握了试题tv所涉及的知识点ck;当ηuv=0时,表示用户pu不能正确作答试题tv且未掌握试题tv所涉及的知识点ck
计算用户pu在未掌握试题tv所涉及的知识点ck的前提下,通过人为猜测的方式得到正确作答试题tv的猜测率gv,其公式如下表示:
gv=P(ruv=1|ηuv=0)
其中,ruv表示用户pu在试题tv上的得分情况,当ruv=1时,表示用户pu正确作答试题tv
计算用户pu在掌握试题tv所涉及的知识点ck的前提下,因失误而未能正确作答试题tv的失误率sv,其公式如下表示:
sv=P(ruv=0|ηuv=1)
其中,当ruv=0时,表示用户pu未能正确作答试题tv
根据猜测率gv、失误率sv和潜在答题情况ηuv,并考虑试题难度、遗忘曲线和答题次数,计算用户pu在试题tv上的正确作答概率,其公式如下所示:
Figure FDA0003413068480000021
其中,ω表示试题难度,
Figure FDA0003413068480000022
用于拟合遗忘曲线;ξ表示用户pu在试题tv上的答题情况,当用户pu正确作答试题tv,ξ取值为1,当用户pu错误作答试题tv,ξ取值为0;frequency表示答题次数;
根据用户pu在试题tv上的正确作答概率,确定用户的多维知识点掌握向量αu并计算向量αu估计值,利用向量αu估计值构建用户-知识点矩阵B;
根据用户-知识点矩阵B,预测用户pu对知识点ck的掌握情况。
3.根据权利要求2所述的基于知识图谱的自适应学习资源推荐方法,其特征在于,利用向量αu估计值构建用户-知识点矩阵B具体包括:
采用EM算法最大化猜测率gv和失误率sv的边缘似然概率,分别得到猜测率gv和失误率sv的估计值
Figure FDA0003413068480000023
Figure FDA0003413068480000024
通过最大后验概率算法确定用户的多维知识点掌握向量αu的估计值
Figure FDA0003413068480000025
其公式如下所示:
Figure FDA0003413068480000026
其中,α表示知识点掌握向量,Ru表示用户u的得分矩阵;
根据用户的多维知识点掌握向量αu的估计值
Figure FDA0003413068480000027
构建用户-知识点矩阵B。
4.根据权利要求2所述的基于知识图谱的自适应学习资源推荐方法,其特征在于,利用所述试题得分预测模型,预测用户对未完成试题的得分情况具体包括:
建立试题得分预测模型,将试题输入到所述试题得分预测模型,得到试题对应的隐式特征向量;
根据试题对应的隐式特征向量,使用概率矩阵对由用户pu在试题tv上的得分情况ruv构建的用户试题得分矩阵R进行分解,获得用户隐式特征矩阵和试题隐式特征矩阵;
根据获得用户隐式特征矩阵和试题隐式特征矩阵,使用KNN算法对进行概率矩阵分解后的用户试题得分矩阵R进行修正,得到最终的用户对未完成试题的得分情况。
5.根据权利要求4所述的基于知识图谱的自适应学习资源推荐方法,其特征在于,所述试题得分预测模型利用卷积神经网络和注意力机制获得试题对应的隐式特征向量,所述卷积神经网络包括嵌入层、注意力层、卷积层、池化层和输出层,具体为:
将试题的相关文本输入嵌入层,嵌入层输出文本中每个词语的d维向量an,利用向量an构建密集数字矩阵S,其公式如下所示:
Figure FDA0003413068480000031
将密集数字矩阵S输入注意力层,突显文本中重点词的特征,获得重点词的特征表达
Figure FDA0003413068480000032
具体计算如下所示:
Figure FDA0003413068480000033
s(i)=f(Hi*Watt+batt)
其中,A表示通过注意力机制获得的词语特征表示;D表示一个中心词hi的上下文范围,s(i)表示上下文范围内每个词的特征值权重,Watt表示上下文范围对应的矩阵参数,batt表示偏置量,f(·)表示激活函数;
将上下文范围内每个词特征wi与词的特征值权重s(i)相乘输出新的特征表示
Figure FDA0003413068480000034
其表达公式如下:
Figure FDA0003413068480000035
将特征表示
Figure FDA0003413068480000036
输入卷积层,提取重点词的特征C(i),其公式如下所示:
Figure FDA0003413068480000037
其中,Wc表示共享权重,bc表示偏置,f(·)表示激活函数;
将特征C(i)输入池化层,池化层输出具有代表性的特征Cout(i):
Cout(i)=MAX(C(i))
将具有代表性的特征Cout(i)输入输出层,得到试题的相关文本对应的隐式特征向量Dj
Figure FDA0003413068480000041
其中,
Figure FDA0003413068480000042
Figure FDA0003413068480000043
为映射矩阵,
Figure FDA0003413068480000044
Figure FDA0003413068480000045
与偏置向量,f(·)表示激活函数;W表示所有权重和偏置,Hj表示试题的相关文本对应的词向量。
6.根据权利要求5所述的基于知识图谱的自适应学习资源推荐方法,其特征在于,使用概率矩阵对由用户pu在试题tv上的得分情况ruv构建的用户试题得分矩阵R进行分解,获得用户隐式特征矩阵和试题隐式特征矩阵具体包括:
假设用户试题得分矩阵R通过概率矩阵分解为用户隐式特征矩阵U、知识点隐式特征矩阵K和试题隐式特征矩阵V;
用户隐式特征矩阵U和知识点隐式特征矩阵K的先验概率服从高斯分布且相互独立:
Figure FDA0003413068480000046
Figure FDA0003413068480000047
其中,m表示用户的数量,l表示知识点的数量,
Figure FDA0003413068480000048
Figure FDA0003413068480000049
表示方差,I表示单位向量;
试题隐式特征矩阵V的概率分布为:
Figure FDA00034130684800000410
Figure FDA00034130684800000411
其中,Wz表示卷积神经网络中神经元之间的权重,
Figure FDA00034130684800000412
表示方差,n表示试题的数量,
Figure FDA00034130684800000413
表示方差;
在给定用户和试题对应的隐式特征向量后,用户试题得分矩阵R的条件概率分布为:
Figure FDA00034130684800000414
其中,
Figure FDA0003413068480000051
表示方差,
Figure FDA0003413068480000052
表示概率矩阵分解得到的隐式特征,
Figure FDA0003413068480000053
表示指示函数,若学生i做过试题j,则
Figure FDA0003413068480000054
否则
Figure FDA0003413068480000055
用户知识点矩阵B的条件概率分布为:
Figure FDA0003413068480000056
其中,l表示知识点的数量,bic表示用户i对于知识点c的掌握情况,Kc表示知识点隐式特征向量,
Figure FDA0003413068480000057
表示方差,
Figure FDA0003413068480000058
表示指示函数;
结合用户隐式特征矩阵U、知识点隐式特征矩阵K、试题隐式特征矩阵V、用户试题得分矩阵R和用户知识点矩阵B的概率分布,同时利用贝叶斯准则以及最大化技巧,最终可得目标函数E(K,U,V,B,R)如下:
Figure FDA0003413068480000059
其中,bij表示用户i对知识点j的掌握情况,Wi表示卷积神经网络对应的权重;
通过随机梯度下降方法对目标函数E(K,U,V,B,R)进行求解,从而得到用户隐式特征矩阵和试题隐式特征矩阵的最优解。
7.根据权利要求6所述的基于知识图谱的自适应学习资源推荐方法,其特征在于,根据获得用户隐式特征矩阵和试题隐式特征矩阵,使用KNN算法对进行概率矩阵分解后的用户试题得分矩阵R进行修正,得到最终的预测的用户对未完成试题的得分情况,具体为:
假设在用户i已经完成的试题集合中使用KNN算法找到与试题j最相似的N个试题,弥补因概率矩阵分解丢失的隐式特征信息,对用户试题得分矩阵进行修正,得到最终的试题得分Rij
Figure FDA0003413068480000061
Figure FDA0003413068480000063
其中,Rij表示最终的预测的用户对未完成试题的得分情况,R′ij为修正因子,Rin表示用户在试题上的原始得分,Vn表示试题的特征向量。
8.根据权利要求1-7任一项所述的基于知识图谱的自适应学习资源推荐方法,其特征在于,选出第二候选学习资源具体包括:
构建知识图谱;
计算知识图谱中知识元节点的中心度,其公式如下所示:
Figure FDA0003413068480000062
其中,Gi表示知识元i的中心度,δ表示知识元的贡献度,λ表示知识元对应的权重;α与β均为权重系数,表示知识元自身以及知识元的各阶邻居知识元对总的中心度的贡献程度;
对知识元节点包含的学习资源进行分类;
利用用户认知诊断模型的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点,选出第二候选学习资源。
9.根据权利要求8所述的基于知识图谱的自适应学习资源推荐方法,其特征在于,构建知识图谱具体包括:
收集文本数据集;
对文本数据集进行实体抽取,获得文本数据集中的实体;
对实体进行关系抽取,获得实体之间存在的关系;
将实体和实体之间的关系进行人工知识融合,利用融合后的结果构建知识图谱,并将知识图谱存储在数据库中。
10.一种基于知识图谱的自适应学习资源推荐系统,其特征在于,包括:
用户认知诊断模块,用于对用户进行学习认知诊断,根据诊断结果,预测用户对知识点的掌握情况;
试题得分预测模块,用于预测用户对未完成试题的得分情况;
知识图谱构建模块,用于构建知识图谱,利用用户认知诊断模块的诊断结果,在知识图谱中分别定位用户掌握较好和较弱的知识点;
学习资源获取模块,用于根据用户认知诊断模块和试题得分预测模块的输出结果,获取第一候选学习资源;根据知识图谱构建模块的输出结果,第二候选学习资源;
推荐模块,用于第一候选学习资源和第二候选学习资源中筛选出最佳的学习资源,并将最佳的学习资源推荐给用户。
CN202111535666.3A 2021-12-15 2021-12-15 一种基于知识图谱的自适应学习资源推荐方法及系统 Pending CN114201684A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111535666.3A CN114201684A (zh) 2021-12-15 2021-12-15 一种基于知识图谱的自适应学习资源推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111535666.3A CN114201684A (zh) 2021-12-15 2021-12-15 一种基于知识图谱的自适应学习资源推荐方法及系统

Publications (1)

Publication Number Publication Date
CN114201684A true CN114201684A (zh) 2022-03-18

Family

ID=80654079

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111535666.3A Pending CN114201684A (zh) 2021-12-15 2021-12-15 一种基于知识图谱的自适应学习资源推荐方法及系统

Country Status (1)

Country Link
CN (1) CN114201684A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114998071A (zh) * 2022-08-04 2022-09-02 中国电子科技集团公司第十五研究所 一种航空管制模拟训练智能教学方法和系统
CN116383503A (zh) * 2023-04-07 2023-07-04 西南大学 基于对抗学习和序列推荐的知识追踪方法及系统
CN117056452A (zh) * 2023-10-11 2023-11-14 华南师范大学 知识点学习路径构建方法、装置、设备以及存储介质
CN117273130A (zh) * 2023-11-13 2023-12-22 南京信息工程大学 一种基于知识图谱与个体能力的认知诊断状态机实现方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114998071A (zh) * 2022-08-04 2022-09-02 中国电子科技集团公司第十五研究所 一种航空管制模拟训练智能教学方法和系统
CN116383503A (zh) * 2023-04-07 2023-07-04 西南大学 基于对抗学习和序列推荐的知识追踪方法及系统
CN116383503B (zh) * 2023-04-07 2024-01-16 西南大学 基于对抗学习和序列推荐的知识追踪方法及系统
CN117056452A (zh) * 2023-10-11 2023-11-14 华南师范大学 知识点学习路径构建方法、装置、设备以及存储介质
CN117056452B (zh) * 2023-10-11 2024-02-06 华南师范大学 知识点学习路径构建方法、装置、设备以及存储介质
CN117273130A (zh) * 2023-11-13 2023-12-22 南京信息工程大学 一种基于知识图谱与个体能力的认知诊断状态机实现方法
CN117273130B (zh) * 2023-11-13 2024-02-23 南京信息工程大学 一种基于知识图谱与个体能力的认知诊断状态机实现方法

Similar Documents

Publication Publication Date Title
CN111460249B (zh) 一种基于学习者偏好建模的个性化学习资源推荐方法
Wilson et al. Back to the basics: Bayesian extensions of IRT outperform neural networks for proficiency estimation
CN112508334B (zh) 融合认知特性及试题文本信息的个性化组卷方法及系统
CN114201684A (zh) 一种基于知识图谱的自适应学习资源推荐方法及系统
CN110991645A (zh) 一种基于知识模型的自适应学习方法、系统及存储介质
CN110941723A (zh) 一种知识图谱的构建方法、系统及存储介质
CN112784608B (zh) 试题推荐方法、装置、电子设备和存储介质
Balakrishnan Significance of classification techniques in prediction of learning disabilities
CN113344053B (zh) 一种基于试题异构图表征与学习者嵌入的知识追踪方法
CN113127731A (zh) 一种基于知识图谱的个性化试题推荐方法
CN107357763B (zh) 一种基于自步学习的众包分类数据质量控制方法
CN116263782A (zh) 一种基于题库的智能组卷方法、系统及存储介质
CN106960245A (zh) 一种基于认知过程链的个体知识评价方法及系统
Lu et al. CMKT: Concept map driven knowledge tracing
CN115455186A (zh) 一种基于多模型的学情分析方法
CN113239209A (zh) 基于RankNet-transformer的知识图谱个性化学习路径推荐方法
Huo et al. Towards personalized learning through class contextual factors-based exercise recommendation
CN114443846A (zh) 一种基于多层级文本异构图的分类方法、装置及电子设备
Chen et al. LogCF: Deep Collaborative Filtering with Process Data for Enhanced Learning Outcome Modeling.
CN113283488B (zh) 一种基于学习行为的认知诊断方法及系统
Mitchener et al. Computational models of learning the raising-control distinction
Hagedoorn et al. Massive open online courses temporal profiling for dropout prediction
CN115438152B (zh) 一种基于多神经网络与知识图谱的简答题评分方法及系统
CN112001536B (zh) 基于机器学习的中小学数学能力点缺陷极小样本高精度发现方法
CN114971066A (zh) 融合遗忘因素和学习能力的知识追踪方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination