发明内容
本发明的目的是提供一种基于知识图谱的自适应学习路径推荐方法,量化了学习者的学习能力,能结合学习者的认知水平给学习者推荐学习路径。
本发明所采用的技术方案是,基于知识图谱的自适应学习路径推荐方法,具体按照如下步骤实施:
步骤1,构建对应领域的知识图谱;
步骤2,建立学习者模型,学习者模型包括学习者的基本信息、认知水平、学习风格以及学习能力;
步骤3,对步骤1建立的知识图谱进行体系扩展,添加节点中心度和概率分布;
步骤4,根据学习者模型中学习者的认知水平在扩展的知识图谱内定位,给学习者推荐相应的知识点。
本发明的特征还在于,
步骤1具体为:
将对应知识领域的知识采用自顶向下的三层结构进行规整,具体为:顶层是对应知识领域所有的知识点的大纲,第二层是将上层的知识点大类分为若干为章节,第三层是将第二层每个小节分为若干基础的小节;每层均包括至少一个知识节点Knowledgek,Knowledgek={idk,namek,definitionk,levelk,containk,centralityk,resourcesk,parentsk,ancestork,pelparentsk,childrenk,offspringk,relchildrenk,brothersk},其中,idk是知识点的标识符,确定知识节点的唯一性;namek是知识节点的名称;definitionk是知识节点的定义,介绍知识点的相关信息;levelk是知识节点的层级数,当知识点为不可拆分的知识点时,其层级数为3,它的直接前驱知识点,为层级数减1,containk:是不同层级知识点之间的包含关系,第一层的某知识节点包含该知识节点下层的所有知识节节点,第二层的某个知识节点包含该知识节点下第三层的知识节点;centralityk为知识节点的中心度,代表节点在同一知识单元内的重要程度;resourcesk是知识节点所链接的教学资源;parentsk是知识节点的直接前驱节点集合,该节点集合可能为空也可能包含多个知识节点,当知识节点的层级为1时,该节点的parentsk为0,ancestork是从层级为1的节点到某一知识节点所经过分支上的所有节点,称为祖先节点集合;relparentsk是知识节点与直接前驱节点的关系条件概率分布,该集合内的值与parentsk内的值相对应,childrenk是知识节点的直接后继节点集合,该集合内的值可能为空也可能有多个知识节点;offspringk是以某知识节点为根的子树中任一节点都称为子孙知识节点;relchildrenk是知识节点与直接后继节点的关系条件概率分布,该集合内的值与childrenk内的值相对应;brothersk:是知识节点的兄弟节点,即为与知识节点有相同父亲节点的知识节点。
步骤2中学习风格的确认方法为:
若学习者未产生动态学习行为,则采用显性方式Felder-Silverman问卷调查表刻画学习者的学习风格,具体为:从信息加工、感知信息、输入信息、内容理解四个维度进行,每个维度分为两种分类类别,其中信息加工、感知信息、输入信息、内容理解四个维度分别分为:活跃型和沉思型、感悟型和直觉型、视觉型和言语型、序列型和综合型,每个维度设置11个道题目,每个题目有A和B两种类型选项答案,A和B分别代表活跃型和沉思型或感悟型和直觉型或视觉型和言语型或序列型和综合型,学习者在调查表每个维度的每道题选择A或者B,然后计算每个维度下A和B的数量,用最大的总数减去较小的总数,记下差值和较大数值对应的字母,其中字母代表学习风格的类型不同,数字代表该维度的程度值,若为11A、9A、7A、5A则代表活跃型或感悟型或视觉型或序列型,若为3A、A、B、3B则代表平衡型,若为5B、7B、9B、11B则代表沉思型或直觉型或言语型或综合型;
若学习者产生动态学习行为,则采用隐形方式Felder-Silverman问卷调查表刻画学习者的学习风格,具体为:将学习风格分为四个维度,分别为:活跃型或沉思型、感悟型或直觉型、视觉型或言语型、序列型或综合型,其中活跃型或沉思型按照四种行为模式进行评估,感悟型或直觉型按照三种行为模式进行评估,视觉型或言语型按照四种行为模式进行评估、序列型或综合型按照两种行为模式进行评估,根据每种行为模式设定低阈值和高阈值,计算每个学习风格中各个行为模式的阈值与对应的比较阈值进行比较,确定每个学习风格对应的具体类型。
步骤2中若学习者产生动态学习行为,具体按照如下方式进行:学习者u的动态学习风格量化表可通过(1)式进行量化:
其中,为每种行为模式下学习者u的动态学习风格量化值,L-M为每种行为模式的低阈值,M-H为每种行为模式的高阈值,Pi为根据学习者的实际动态学习计算的学习风格量化值;
然后将每一维度的量化值汇总,计算该维度的具体风格偏向值Vu(C):
其中,n为每一维度中行为模式的个数;
如果Vu(C)∈[-1,-1/3],则学习者偏向学习风格维度的左侧,即就是活跃型或感悟型或视觉型或序列型,如果Vu(C)∈[-1/3,1/3],则学习者属于平衡型型风格,如果Vu(c)∈[1/3,1],则学习者偏向学习风格维度的右侧,即就是沉思型或直觉型或言语型或综合型。
步骤2中学习者的认知水平的确认方式如下:学习者的认知水平是指学习者当前测试知识点的掌握程度,采用DINA模型对学习者的认知水平建模,将学习者描述成一个在多维知识点上的掌握程度,Q和R矩阵是0-1矩阵,Xut表示学习者对试题的作答情况,当Xut=1表示学习者答对试题,Xut=0表示答错试题,qtk是试题考察知识点的矩阵,qtk=1表示试题考察了某知识点,qtk=0表示未考察某知识点,auk代表学生对知识点的掌握情况,即auk={au1,au2,au3,…,auk}为学生u对知识点的掌握向量,当已知学习者的知识点掌握向量时,对于学生u未作答的试题t,得出潜在的作答情况:
其中,ηut是学习者对所做的试题所考察的知识点都是掌握程度,ηut=1表示学习者有能力答对该试题,相反,如果学习者对所做试题至少有一个知识点未能掌握,则答错该试题;
引入干扰参数猜测率和失误率来建模学生对试题的真实作答情况,则学生正确作答试题的概率:
其中,Pt(au)是学生在对知识点掌握情况下学生正确作答试题的概率,式中,au是学生对知识点的掌握向量,为0和1,0代表未掌握,1代表掌握,Rut是学生正确所答试题,st是学生作答试题的失误率,gt是学生作答试题的猜测率;
使用EM算法最大化上式的边缘似然获取失误率st和猜测率gt,获得st和gt的参数估计L(s,g|a):
上式中,N代表的是参与测试的人数,st、gt分别是失误率和猜测率,ηut是(3)式计算出来的潜在作答,Yut=(Q·K)T,其中,K是知识点的全排列矩阵,Q是知识点试题考察矩阵;
并且学生对知识点的二分掌握向量通过最大化式(5)的后验概率得到:
是学生对知识点的离散掌握程度,即0和1,式中Xu是学生对试题的作答矩阵,,a,分别是学生的二分掌握程度、试题的失误率、试题的猜测率,最大化在各参数的条件下,学生对试题的作答,获取离散的掌握程度;
将学习者对知识点的连续掌握程度,具体量化为
是学习者对知识点的连续掌握程度,代表学生作对试题的概率下,学生对试题考察的知识点的掌握程度,K是知识点的个数,代表学生在作对试题和做错试题的概率下,学生对试题考察的知识点的掌握程度,学生对知识点的连续掌握程度。
步骤2中学习者的学习能力的确认方式如下:
学习者的学习能力具体包括知识学习效率、交流协作能力、信息获取能力、自我管理能力,其中,知识学习效率是学习者在单位时间内(小时)将所授予的知识吸收、掌握的能力值,用公式(7)表示:
其中,aij表示学习者i对知识点j的掌握水平,t1-t0表示学习知识点j的时间长度,以小时计数,n表示以周为单位学习者一周所学习知识点的个数,即为学习者一周所学习的知识点的平均知识学习效率;
交流协作能力用公式(8)表示,具体为:
其中,中代表学习者i的交流协作能力,θ0为学习者的自身初始协作能力为0.2,friendsum是学生评论及点赞的历史好友数目,为学习者i的好友区分度,ci为学习者i发表论坛S、评论C和点赞L的量化值,ci=η1*C+η2*S+η3*L,其中,η1+η2+η3=1,η1=0.5,η2=0.3,η3=0.2,为所有学习者交流协作的均值;
信息获取能力由学习者自行进行评价给出,范围为[0,1],越接近1信息获取能力越大,反之则相反;
自我管控能力由公式(9)表示:
其中,代表学习者i的自我管控能力,其中knowledgesum是所学知识点的个数,gi为学习者资料下载数据D、观看视频时长V、试题练习量T的量化值,gi是每一天的学习量,其中η1+η2+η3=1,η1=0.5,η2=0.3,η3=0.2,为所有学生资料下载数据、观看视频时长和试题练习量的每一天的量化均值;
则学习者的学习能力Pi采用公式(10)计算:
步骤3具体为:对知识图谱第三层中的所有知识节点添加节点中心度和条件概率分布,第一层和第二层所有知识节点的中心度和条件概率分布均为空,具体按照如下步骤实施:
步骤3.1,添加知识节点中心度
按照公式(13)计算知识图谱第三层中的所有知识节点的知识节点中心度KG_PR(k):
其中,PR(m)为k知识节点的直接前驱知识节点,W(k)为k知识节点的知识节点权重,为k知识节点的权重占其兄弟知识节点权重之比,σ为阻尼系数,m∈parent(k)表示m知识节点是k知识节点的直接前驱,parent(k)是k知识节点的直接前驱,children(m)是m节点的直接后继,Ck为知识节点k的介数中心性,按照公式(12)计算:
其中,bij(k)是的i到j的最短路径经过k知识节点的条数,bij知识节点i到知识节点j的所有最短路径条数;
步骤3.2,添加知识节点条件概率
知识节点之间的条件概率分布是当前知识节点对其子级知识节点的影响概率,具体计算方法如下:将步骤2计算得到的学习者认知水平,即就是学习者们对知识点的连续掌握程度进行离散化处理,将知识点的连续掌握程度大于0.6的值赋予优秀,反之则赋予差,然后将已离散好学习者们的认知水平进行统计,即统计某知识点优秀和差的个数,使用算法语言是python,然后调用pgmpy库,使用pgmpy内封装好的BayesianEstimator,将统计的知识点优秀和差的个数作为贝叶斯参数进行输入,得到知识节点之间的条件概率分布。
步骤4具体为:若学习者对当前知识节点的掌握程度小于0.6,则使用联结树推理计算该知识节点父级知识节点未掌握概率最高的知识节点,具体为:步骤4.1,先将贝叶斯网络端正化:连接不同指向贝叶斯网络同一个子节点的所有父节点,同时去掉网络中所有边的方向,得到端正图;步骤4.2,三角化端正图:在端正图中添加一些无向边,将端正图中大于等于4个节点的环中的非相邻节点两两相连,完成三角化过程,得到三角化端正图;步骤4.3,确定团,构建联合树:将端正图三角化就是要找到联合树中的所有团,团是三角化端正图中的最大全连通子图,在得到的团内添加边和分隔节点就得到了联合树;步骤4.4,进行联合树初始化,得到全局不一致的联合树:将贝叶斯网络中的条件概率分配到联结树的各节点中进行存储,并且每个知识节点发生的条件概率只能存储在一个团中,不能重复进行存储;步骤4.5,对全局不一致的联合树进行消息的传递使之成为全局一致的联合树,然后向全局一致的联合树中加入证据节点,联结树的全局一致性被打破,需要重新进行消息的传递,待消息传递完成后,联结树再次达到全局一致性,然后计算在该证据节点发生的条件下非证据节点所发生的概率,然后将概率值最高的知识点推给学习者。
若学习者对当前知识节点的掌握程度大于等于0.6,则代表学习者已掌握该知识点,可继续学习下一个新的知识点,即学习该知识节点子节点集合中的知识节点,其中学习的顺序是以子节点中心度降序顺序学习。
在步骤1-4的基础上确定了学习者下一步的学习的知识节点后,根据学习者的学习风格确定学习资源的展示形式,根据学习者的学习能力确定对应知识节点对应的学习知识点的资源难度。
本发明的有益效果是:本发明量化了学习者的学习能力,可以在学习者的行为方面表现学习者的学习能力,对知识图谱进行了体系扩展,添加了节点中心度和条件概率分布等,然后结合学习者的认知水平在图谱内定位,利用体系扩展的图谱给学习者推荐学习路径。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明基于知识图谱的自适应学习路径推荐方法,具体按照如下步骤实施:
步骤1,构建对应领域的知识图谱;将对应知识领域的知识采用自顶向下的三层结构进行规整,如图1-2所示,具体为:顶层是对应知识领域所有的知识点的大纲,第二层是将上层的知识点大类分为若干为章节,第三层是将第二层每个小节分为若干基础的小节;每层均包括至少一个知识节点Knowledgek,Knowledgek={idk,namek,definitionk,levelk,containk,centralityk,resourcesk,parentsk,ancestork,pelparentsk,childrenk,offspringk,relchildrenk,brothersk},其中,idk是知识点的标识符,确定知识节点的唯一性;namek是知识节点的名称;definitionk是知识节点的定义,介绍知识点的相关信息;levelk是知识节点的层级数,当知识点为不可拆分的知识点时,其层级数为3,它的直接前驱知识点,为层级数减1,containk:是不同层级知识点之间的包含关系,第一层的某知识节点包含该知识节点下层的所有知识节节点,第二层的某个知识节点包含该知识节点下第三层的知识节点;centralityk为知识节点的中心度,代表节点在同一知识单元内的重要程度;resourcesk是知识节点所链接的教学资源;parentsk是知识节点的直接前驱节点集合,该节点集合可能为空也可能包含多个知识节点,当知识节点的层级为1时,该节点的parentsk为0,ancestork是从层级为1的节点到某一知识节点所经过分支上的所有节点,称为祖先节点集合;relparentsk是知识节点与直接前驱节点的关系条件概率分布,该集合内的值与parentsk内的值相对应,childrenk是知识节点的直接后继节点集合,该集合内的值可能为空也可能有多个知识节点,例如,当一知识节点的levelk为3时,该节点无直接后继节点,则childrenk为0;offspringk是以某知识节点为根的子树中任一节点都称为子孙知识节点;relchildrenk是知识节点与直接后继节点的关系条件概率分布,该集合内的值与childrenk内的值相对应;brothersk:是知识节点的兄弟节点,即为与知识节点有相同父亲节点的知识节点;
步骤2,建立学习者模型,学习者模型包括学习者的基本信息、认知水平、学习风格以及学习能力;基本信息包括:姓名、性别、年龄、出生日期、身份证号、联系方式、家庭住址、所在学校、年级、学科偏好、父母联系方式等;
自适应学习方法不仅是学习内容的自适应,也体现在学习风格的自适应,本专利提出一种使用显性和隐形相结合的方式全方面的刻画学习者的学习风格,显性方式是Felder-Silverman问卷调查表,Felder-Silverman量化表是从4个方面8种类型刻画学习者的学习风格,围绕信息加工、感知、输入信息、理解将学习者的学习风格分为四种互斥选项组合,学习风格的确认方法为:若学习者未产生动态学习行为,则采用显性方式Felder-Silverman问卷调查表刻画学习者的学习风格,具体为:从信息加工、感知信息、输入信息、内容理解四个维度进行,如表1所示:
表1
每个维度分为两种分类类别,其中信息加工、感知信息、输入信息、内容理解四个维度分别分为:活跃型和沉思型、感悟型和直觉型、视觉型和言语型、序列型和综合型,每个维度设置11个道题目,每个题目有A和B两种类型选项答案,A和B分别代表活跃型和沉思型或感悟型和直觉型或视觉型和言语型或序列型和综合型,学习者在调查表每个维度的每道题选择A或者B,然后计算每个维度下A和B的数量,用最大的总数减去较小的总数,记下差值和较大数值对应的字母,其中字母代表学习风格的类型不同,数字代表该维度的程度值,若为11A、9A、7A、5A则代表活跃型或感悟型或视觉型或序列型,若为3A、A、B、3B则代表平衡型,若为5B、7B、9B、11B则代表沉思型或直觉型或言语型或综合型;
若学习者产生动态学习行为,则采用隐形方式Felder-Silverman问卷调查表刻画学习者的学习风格,具体为:将学习风格分为四个维度,如表2所示,分别为:活跃型或沉思型、感悟型或直觉型、视觉型或言语型、序列型或综合型,其中活跃型或沉思型按照四种行为模式进行评估,感悟型或直觉型按照三种行为模式进行评估,视觉型或言语型按照四种行为模式进行评估、序列型或综合型按照两种行为模式进行评估,根据每种行为模式设定低阈值和高阈值,计算每个学习风格中各个行为模式的阈值与对应的比较阈值进行比较,确定每个学习风格对应的具体类型;
表2
表格中的“+”代表行为模式偏向左侧类型,“-”号代表行为模式偏向右侧类型;
若学习者产生动态学习行为,具体按照如下方式进行:学习者u的动态学习风格量化表可通过(1)式进行量化:
其中,为每种行为模式下学习者u的动态学习风格量化值,L-M为每种行为模式的低阈值,M-H为每种行为模式的高阈值,Pi为根据学习者的实际动态学习计算的学习风格量化值;
然后将每一维度的量化值汇总,计算该维度的具体风格偏向值Vu(C):
其中,n为每一维度中行为模式的个数;
如果Vu(C)∈[-1,-1/3],则学习者偏向学习风格维度的左侧,即就是活跃型或感悟型或视觉型或序列型,如果Vu(C)∈[-1/3,1/3],则学习者属于平衡型型风格,如果Vu(C)∈[1/3,1],则学习者偏向学习风格维度的右侧,即就是沉思型或直觉型或言语型或综合型;
学习者的认知水平的确认方式如下:学习者的认知水平是指学习者当前测试知识点的掌握程度,采用DINA模型对学习者的认知水平建模,将学习者描述成一个在多维知识点上的掌握程度,Q和R矩阵是0-1矩阵,Xut表示学习者对试题的作答情况,当Xut=1表示学习者答对试题,Xut=0表示答错试题,qtk是试题考察知识点的矩阵,qtk=1表示试题考察了某知识点,qtk=0表示未考察某知识点,auk代表学生对知识点的掌握情况,即auk={au1,au2,au3,…,auk}为学生u对知识点的掌握向量,当已知学习者的知识点掌握向量时,对于学生u未作答的试题t,得出潜在的作答情况:
其中,ηut是学习者对所做的试题所考察的知识点都是掌握程度,ηut=1表示学习者有能力答对该试题,相反,如果学习者对所做试题至少有一个知识点未能掌握,则答错该试题;
引入干扰参数猜测率和失误率来建模学生对试题的真实作答情况,则学生正确作答试题的概率:
其中,Pt(au)是学生在对知识点掌握情况下学生正确作答试题的概率,式中,au是学生对知识点的掌握向量,为0和1,0代表未掌握,1代表掌握,Rut是学生正确所答试题,st是学生作答试题的失误率,gt是学生作答试题的猜测率;使用EM算法最大化上式的边缘似然获取失误率st和猜测率gt,获得st和gt的参数估计L(s,g|a):
上式中,N代表的是参与测试的人数,st、gt分别是失误率和猜测率,ηut是(3)式计算出来的潜在作答,Yut=(Q·K)T,其中,K是知识点的全排列矩阵,Q是知识点试题考察矩阵;
并且学生对知识点的二分掌握向量通过最大化式(5)的后验概率得到:
是学生对知识点的离散掌握程度,即0和1,式中Xu是学生对试题的作答矩阵,,a,分别是学生的二分掌握程度、试题的失误率、试题的猜测率,最大化在各参数的条件下,学生对试题的作答,获取离散的掌握程度;
将学习者对知识点的连续掌握程度,具体量化为
是学习者对知识点的连续掌握程度,代表学生作对试题的概率下,学生对试题考察的知识点的掌握程度,K是知识点的个数,代表学生在作对试题和做错试题的概率下,学生对试题考察的知识点的掌握程度,学生对知识点的连续掌握程度;
学习者的学习能力的确认方式如下:
学习者的学习能力具体包括知识学习效率、交流协作能力、信息获取能力、自我管理能力,其中,知识学习效率是学习者在单位时间内(小时)将所授予的知识吸收、掌握的能力值,用公式(7)表示:
其中,aij表示学习者i对知识点j的掌握水平,t1-t0表示学习知识点j的时间长度,以小时计数,n表示以周为单位学习者一周所学习知识点的个数,即为学习者一周所学习的知识点的平均知识学习效率;
交流协作能力用公式(8)表示,具体为:
其中,中代表学习者i的交流协作能力,θ0为学习者的自身初始协作能力为0.2,friendsum是学生评论及点赞的历史好友数目,为学习者i的好友区分度,ci为学习者i发表论坛S、评论C和点赞L的量化值,ci=η1*C+η2*S+η3*L,其中,η1+η2+η3=1,η1=0.5,η2=0.3,η3=0.2,为所有学习者交流协作的均值;
为了保证学生发表论坛、发表评论、点赞的高质量,S、C和L在[0,μ+σ]内线性增长,在(μ+σ,+∞)内以下降,其中超过μ+σ的计算是其中n是超过μ+σ的个数;
信息获取能力由学习者自行进行评价给出,范围为[0,1],越接近1信息获取能力越大,反之则相反;
自我管控能力由公式(9)表示:
其中,代表学习者i的自我管控能力,其中knowledgesum是所学知识点的个数,gi为学习者资料下载数据D、观看视频时长V、试题练习量T的量化值,gi是每一天的学习量,其中η1+η2+η3=1,η1=0.5,η2=0.3,η3=0.2,为所有学生资料下载数据、观看视频时长和试题练习量的每一天的量化均值;
则学习者的学习能力Pi采用公式(10)计算:
步骤3,对步骤1建立的知识图谱进行体系扩展,添加节点中心度和概率分布;具体为:对知识图谱第三层中的所有知识节点添加节点中心度和条件概率分布,第一层和第二层所有知识节点的中心度和条件概率分布均为空,具体按照如下步骤实施:
步骤3.1,添加知识节点中心度
节点中心度是衡量三级基础知识点的重要性,其作用是当学习者学完当前知识点并且测试已掌握,选择进行该节点中心度较高的子知识点学习,本研究在基于PageRank算法的基础上进行改进,提出一种适用于教育领域计算节点中心度的KG_PageRank:
改进前的计算方式如下:
式中,PR(k)为知识节点k的PageRank值;PR(Yi)为链接到知识节点k的知识节点Yi的PageRank值;Cout(Yi)为知识节点Yi的出链数量;σ为阻尼系数,表示用户继续以的相同概率继续浏览其他知识节点;
改进后的本发明的如下:按照公式(13)计算知识图谱第三层中的所有知识节点的知识节点中心度KG_PR(k):
其中,PR(m)为k知识节点的直接前驱知识节点,W(k)为k知识节点的知识节点权重,为k知识节点的权重占其兄弟知识节点权重之比,σ为阻尼系数,m∈parent(k)表示m知识节点是k知识节点的直接前驱,parent(k)是k知识节点的直接前驱,children(m)是m节点的直接后继,Ck为知识节点k的介数中心性,按照公式(12)计算:
其中,bij(k)是的i到j的最短路径经过k知识节点的条数,bij知识节点i到知识节点j的所有最短路径条数
如图4所示,有理数小结图谱,实验对比:
表3有理数小节知识点中心度
表4有历史加减法小节知识点中心度
表5有理数乘除法小节知识点中心度
表6正数与负数小节知识点中心度
从上表可以看出,改进后的算法KG_PageRank计算的节点中心度要优于原算法PageRank,例如表3原算法相反数的中心度级别高于数轴,但是数轴的权重高于相反数,所以KG_PageRank计算的数轴的中心度高于相反数。
步骤3.2,添加知识节点条件概率
知识节点之间的条件概率分布是当前知识节点对其子级知识节点的影响概率,具体计算方法如下:将步骤2计算得到的学习者认知水平,即就是学习者们对知识点的连续掌握程度进行离散化处理,将知识点的连续掌握程度大于0.6的值赋予优秀,反之则赋予差,然后将已离散好学习者们的认知水平进行统计,即统计某知识点优秀和差的个数,使用算法语言是python,然后调用pgmpy库,使用pgmpy内封装好的BayesianEstimator,将统计的知识点优秀和差的个数作为贝叶斯参数进行输入,得到知识节点之间的条件概率分布,本专利以有理数小节的5个知识点为例,对198位学生的认知水平进行了离散化,然后通过代码得出的贝叶斯网络参数如图3所示;
步骤4,根据学习者模型中学习者的认知水平在扩展的知识图谱内定位,给学习者推荐相应的知识点;具体为:若学习者对当前知识节点的掌握程度大于等于0.6,则代表学习者已掌握该知识点,可继续学习下一个新的知识点,即学习该知识节点子节点集合中的知识节点,其中学习的顺序是以子节点中心度降序顺序学习。
若学习者对当前知识节点的掌握程度小于0.6,则使用联结树推理计算该知识节点父级知识节点未掌握概率最高的知识节点,具体为:步骤4.1,先将贝叶斯网络端正化:连接不同指向贝叶斯网络同一个子节点的所有父节点,同时去掉网络中所有边的方向,得到端正图,本实施例有理数小节端正化如图5所示;步骤4.2,三角化端正图:在端正图中添加一些无向边,将端正图中大于等于4个节点的环中的非相邻节点两两相连,完成三角化过程,得到三角化端正图,有理数小节三角化图如图6所示;步骤4.3,确定团,构建联合树:将端正图三角化就是要找到联合树中的所有团,团是三角化端正图中的最大全连通子图,在得到的团内添加边和分隔节点就得到了联合树,联合树需要满足变量连通性,有理数小节联结树如图7所示;步骤4.4,进行联合树初始化,得到全局不一致的联合树:将贝叶斯网络中的条件概率分配到联结树的各节点中进行存储,并且每个知识节点发生的条件概率只能存储在一个团中,不能重复进行存储,有理数小节联结树的概率分布如图8所示;步骤4.5,对全局不一致的联合树进行消息的传递使之成为全局一致的联合树,然后向全局一致的联合树中加入证据节点,联结树的全局一致性被打破,需要重新进行消息的传递,待消息传递完成后,联结树再次达到全局一致性,然后计算在该证据节点发生的条件下非证据节点所发生的概率,然后将概率值最高的知识点推给学习者;
消息的传递包括证据收集和证据发散
步骤4.5.1、证据收集,其中以图8作为图示进行说明,图中的M作为团与团之间传递的信息,φ为团的势函数。
①团Cr的子团Ci向其传递的信息Mir
φi是团Ci的势函数,Mir是团Ci对团Cr传递的信息,Ci\Sir的值是X1。
②更新团Cr的势函数
是团Cr更新后的势函数,φr是团Cr之前的势函数,Mir是式(14)计算的传递信息。
③同理可得,团Cr向其父节团Cj的信息收集过程
Mrj是团Cr对团Cj传递的信息值,团Cr更新后的势函数,Cr\Srj=X2
④更新团Cj的势函数
是团Cj更新后的势函数,φj是之前的势函数,Mrj是团Cr向团Cj传递的信息。
步骤4.5.2、证据扩散阶段,其中以图8作为图示进行说明,图中的M作为团与团之间传递的信息,φ为团的势函数:
①团Cj将证据传播给子节团Cr的信息Mjr
Mjr是团Cj向团Cr传递的信息,是团Cj的势函数。Cj\Sjr=X4,X5
②更新团Cr的势函数
是团Cr发散阶段更新后的势函数。是之前团Cr的势函数,是需要更新的数据值。
③同理可得,团Cr向其子节团Ci的信息发散过程
Mri是团Cr向团Ci传递的信息,是团Cr发散阶段更新后的势函数,Cr\Sri=X3
④更新团Ci的势函数
是团Ci更新后的势函数,需要更新的数据值;
本发明在获得贝叶斯网络各节点的参数后,对初始构建联结之前的结构进行优化,在保证推理计算的后验概率准确度不变的情况下,进行贝叶斯网络简化,目的是减少了实验运行的时间。
本发明在给定证据节点和所要查询的节点,然后根据贝叶斯网络中节点之间的独立性,找出关键节点,然后用关键节点代替原贝叶斯网络,关键节点指在贝叶斯网络N中,设P(x1|x4)是需要计算的后验概率,令N’为N中ancestor(x1∪x4)所包含的节点的贝叶斯网络,其中ancestor(x)代表包含x的最小祖先闭集,简化后的贝叶斯网络计算的后验概率基本不会受到影响。例如,分别计算了P(x1=True|x2=True)、P(x1=False|x2=True)、P(x1=True|x3=True)、P(x1=False|x3=True)、P(x1=True|x4=True)、P(x1=False|x4=True)的后验概率,并且为了保证实验的准确性,每次实验分别运行了10次,最终取实验计时的平均值,具体的数据如表7所示,实验改进前后的后验概率如图9所示,时间对比如图10所示,左侧的是原始,右侧的是修改后的。
表7改进后的联结树与原始联结树的运行时间对比
本发明在联结树加入新的证据节点时都要重新计算团的势函数和团与团之间的传递信息。假设联结树第一次加入的证据节点是Evi_Node1:X4=True,X5=False;然后第二次加入的证据节点是Evi_Node2:X4=False,X5=False,那对应图8只影响cj的势函数,ci和cr的势函数分别不变,因此在证据收集阶段Mir和Mrj分别不变,但是在证据发散阶段,因为cj的势函数已经改变,所以信息团与团之间信息发散的数据将改变。所以可以保存团的势函数和团之间的信息传递数据,当第二次的证据节点与第一次的证据节点相同且只是类型不同的情况下,可以使用第一次证据节点的数据以减少算法的运行时间。为了验证理论猜想的准确性对证据节点Evi_Node2:X4=False,X5=False改进前后的势函数、证据收集和证据发散分别进行了计时计算,为了保证实验的准确性,每个计算进行了10次,最终结构取10次的平均值,数据如下表8所示,实验图如图11所示,左侧的是原始,右侧的是修改后的。
表8改进后的联结树与原始联结树的运行时间对比
|
势函数 |
证据收集 |
证据发散 |
原始联合树运行时间 |
0.0108 |
0.011 |
0.070 |
简化后联结树运行时间 |
0.0052 |
0.048 |
0.071 |
在步骤1-4的基础上确定了学习者下一步的学习的知识节点后,根据学习者的学习风格确定学习资源的展示形式,根据学习者的学习能力确定对应知识节点对应的学习知识点的资源难度。
当学习者的学习风格属于活跃、感悟、序列和视觉型时,那么学习资源的展示形式结合表8给出,其中资源类型是视频和PPT类文档多于文字类文档,文字类文档也是以具体事例类给出;所学习知识点的资源难度依据学习者的学习能力划分,当学习者的学习能力大于等于0.6,那学习资源的难度排列是中等、难、简单,学习能力小于0.6,那学习资源的难度排列是简单、中等、难。
表9学习风格的资源展示策略
表10学习资源的难度划分
基础 |
[0,0.4) |
中等 |
[0.4,0.7) |
难 |
[0.7,1] |
本发明通过学习者的认知水平、学习风格和学习能力等方面对学习者建模,其中将学习者的学习能力进行划分、量化,从而更全面性的刻画学习者。对领域知识库的研究,研究者们多是基于知识图谱的建构以及图谱结构进行研究,但本文对知识图谱的体系进行了扩展,在图谱的基础上添加了节点中心度和条件概率分布,可以更好的对图谱的节点进行划分,以支撑本研究的自适应学习路径推荐模型。