CN114741591A - 一种向学习者推荐学习路径的方法及电子设备 - Google Patents

一种向学习者推荐学习路径的方法及电子设备 Download PDF

Info

Publication number
CN114741591A
CN114741591A CN202210343103.2A CN202210343103A CN114741591A CN 114741591 A CN114741591 A CN 114741591A CN 202210343103 A CN202210343103 A CN 202210343103A CN 114741591 A CN114741591 A CN 114741591A
Authority
CN
China
Prior art keywords
learner
knowledge
knowledge point
knowledge points
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210343103.2A
Other languages
English (en)
Other versions
CN114741591B (zh
Inventor
蔺一帅
李悦辰
王文野
牛振兴
褚华
张菊莉
王婧丽
夏若恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202210343103.2A priority Critical patent/CN114741591B/zh
Publication of CN114741591A publication Critical patent/CN114741591A/zh
Application granted granted Critical
Publication of CN114741591B publication Critical patent/CN114741591B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种向学习者推荐学习路径的方法,包括:获取学习者对各个教学视频进行观看的时长信息,并基于时长信息生成第一信息矩阵;第一信息矩阵用于表征学习者在学习时长方面对各个教学视频的观看程度;基于第一信息矩阵,利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度;该改进型DINA认知诊断模型中,预设有各个教学视频对各项知识点的包含关系,且该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0~1之间的概率值;根据学习者对各项知识点的掌握程度、各项知识点间的相似性以及各项知识点的先后继关系,向学习者推荐学习路径。本发明可避免使学习者陷入知识孤岛,帮助学习者的学识进步。

Description

一种向学习者推荐学习路径的方法及电子设备
技术领域
本发明属于在线教育技术领域,具体涉及一种向学习者推荐学习路径的方法及电子设备。
背景技术
随着在线教育技术的发展,在线的学习者在面对海量的教育资源时极易产生“学习迷航”、“认知过载”的情况,这一现状极大地降低了学习者的学习效率以及学习兴趣。
为了解决上述问题,现有技术中通常会获取学习者的历史学习记录作为学习者感兴趣的知识点;然后向学习者推荐相似的知识点以供学习者学习。然而,这种做法容易使学习者陷入知识孤岛,不利于学习者的学识进步。
发明内容
为了解决现有技术中所存在的上述问题,本发明提供了一种学习路径推荐方法及电子设备。
本发明要解决的技术问题通过以下技术方案实现:
一种向学习者推荐学习路径的方法,包括:
获取学习者对各个教学视频进行观看的时长信息,并基于所述时长信息生成第一信息矩阵;所述第一信息矩阵用于表征学习者在学习时长方面对所述各个教学视频的观看程度;
基于所述第一信息矩阵,利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度;所述改进型DINA认知诊断模型中,预设有所述各个教学视频对所述各项知识点的包含关系,且所述改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0~1之间的概率值;
根据学习者对所述各项知识点的掌握程度、所述各项知识点间的相似性以及所述各项知识点的先后继关系,向学习者推荐学习路径。
可选地,所述相似性是对知识点的语义相似性以及知识点被广大学习者学习的情况相似性进行融合处理得到的。
可选地,所述知识点语义相似性是使用TransR模型将知识点嵌入为一维向量后,通过计算一维向量间的相似度得到的。
可选地,使用TransR模型将知识点嵌入为一维向量的方式包括:
基于预设的知识图谱中定义的实体以及实体间的关系,使用d2rq工具将教学数据库转换为RDF数据;其中,所述知识图谱中定义的实体包括:知识点、课程、学校、教师以及领域;所述实体间的关系包括:领域与课程的关系、课程与知识点的关系、学校与课程的关系、领域与知识点的关系、教师与课程的关系,以及学校与教师的关系;
将所述RDF数据输入至TransR模型,以使所述TransR模型输出每个所述实体对应的一维向量以及每对实体间的关系对应的一维向量。
可选地,知识点被广大学习者学习的情况相似性是基于协同过滤算法计算得到的。
可选地,基于所述第一信息矩阵,利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度,包括:
使用EM算法最大化第一建模公式的边缘似然,得到广大学习者已掌握教学视频中的知识点、但未看完教学视频的第一概率,以及广大学习者已看完教学视频、但未掌握教学视频中的知识点的第二概率;
基于所述第一信息矩阵、所述第一概率以及所述第二概率,使用第二建模公式计算学习者对各项知识点的掌握程度;
其中,所述第一建模公式为:
Figure BDA0003580069010000031
其中,qv为表征所述包含关系的第二信息矩阵QV×K的第v∈[1,V]行元素构成的向量,V为所述各个教学视频的总数,K为所述各项知识点的总数,qv中为0的元素表示第v个教学视频包含该元素对应的知识点,为1的元素表示第v个教学视频不包含该元素对应的知识点;sv为U个学习者针对第v个教学视频的所述第一概率组成的向量,gv为U个学习者针对第v个教学视频的所述第二概率组成的向量,U为学习者的总数;ruv为所述第一信息矩阵RU×V中位于第u∈[1,U]行、第v∈[1,V]列的元素,ruv的数值等于第u个学习者观看第v个教学视频的时长与第v个视频的总时长的比值;αu={αu1u2,......,αuK}是表示第u个学习者对K个知识点是否掌握的二值化向量,αu中为1的元素表示第u个学习者已掌握该元素对应的知识点,为0的元素表示第u个学习者未掌握该元素对应的知识点;P(ruv=1|αu)表示第u个学习者在已知αu的条件下看过第v个视频的概率;上标T表示矩阵转置;ηuv表示第u个学习者对第v个视频的潜在观看进度;
所述第二建模公式为:
Figure BDA0003580069010000032
其中,
Figure BDA0003580069010000041
表示第u个学习者对第k个知识点的掌握程度,为一概率值;
Figure BDA0003580069010000042
为通过EM算法得到的上述sv的估计值,
Figure BDA0003580069010000043
为通过EM算法得到的上述gv的估计值;Ru为RU×V的第u行元素构成的向量;αx为αu的2K种取值中的第x种;所述2K种取值中,第x=[x1,x2,x3,…,xM]种取值的第k个元素等于1;P(αx)表示αu=αx的先验概率;P(αx|Ru)表示在已知Ru的条件下αu=αx的后验概率;
Figure BDA0003580069010000044
表示在已知
Figure BDA0003580069010000045
Figure BDA0003580069010000046
的条件下,当αu=αx时ruv的最大似然概率。
可选地,根据学习者对所述各项知识点的掌握程度、所述各项知识点间的相似性以及所述各项知识点的先后继关系,向学习者推荐学习路径,包括:
A、根据学习者对所述各项知识点的掌握程度,确定学习者的薄弱知识点集合,并从所述薄弱知识点集合中取出一薄弱知识点;
B、确定所述薄弱知识点的先继知识点集合;
C、计算所述先继知识点集合中的每个先继知识点与所述薄弱知识点的相似度;
D、根据学习者对每个所述先继知识点的掌握程度以及每个所述先继知识点与所述薄弱知识点的相似度,计算每个所述先继知识点的推荐分数;
E、将推荐分数最高的先继知识点作为目标知识点添加至学习路径节点集合中,并判断新添加的目标知识点是否仍有先继知识点;若仍有,将新添加的目标知识点作为新的薄弱知识点返回步骤B;若没有,继续执行步骤F;
F、根据已加入学习路径的目标知识点生成一条学习路径,以向学习者推荐该学习路径。
可选地,在执行步骤F之后,所述方法还包括:
G、返回步骤A,以从所述薄弱知识点集合中取出下一薄弱知识点,并继续执行后续步骤,直至所述薄弱知识点集合为空。
本发明还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一种向学习者推荐学习路径的方法所述的方法步骤。
本发明提供的向学习者推荐学习路径的方法中,考虑到了知识点之间的先后继关系、学习者对众多知识点的掌握程度以及知识点之间的相似性,向学习者准确、连贯、有针对性地推荐一条完整的个性化学习路径,从而帮助学习者查漏补缺、快速、全面地掌握薄弱的知识点,提升学习效率。
其中,本发明使用改进型DINA认知诊断模型来获取学习者对各项知识点的掌握程度,该改进型DINA认知诊断模型是基于学习者对教学视频的观看程度来获取学习者对各项知识点的掌握程度的,无需编制认知诊断测试卷并让学习者进行作答,使得学习者对知识点的掌握程度信息更容易获取,提高了方案的实际可行性。
并且,相较于现有的DINA认知诊断模型中将学习者对单项知识点的掌握程度处理为0或1的离散化数据,本发明中使用的该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0~1之间的概率值,能够更精确地对学习者的知识掌握程度进行刻画,从而提高所推荐学习路径的合理性。
以下将结合附图及对本发明做进一步详细说明。
附图说明
图1是本发明实施例提供的一种向学习者推荐学习路径的方法的流程示意图;
图2是本发明实施例中使用的知识图谱的局部结构示意图;
图3是TransR模型的示意图;
图4是本发明实施例中的学习路径的形成过程示意图;
图5是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
为了避免使学习者陷入知识孤岛,帮助学习者的学识进步,本发明实施例提供了一种向学习者推荐学习路径的方法及电子设备。其中,该电子设备上加载有线上教育平台软件,该软件中可以运行本发明实施例提供的向学习者推荐学习路径的方法。在实际应用中,上述电子设备可以是客户端设备、服务器、台式计算机、便携式计算机、平板设备等,在此不作限定;任何可以使用本发明实施例所提供的方法的电子设备,均属于本发明的保护范围。另外,上述线上教育平台软件软件可利用IntelliJ IDEA开发工具,搭建springboot+vue框架并使用Java语言进行开发,当然并不局限于此。
首先,对本发明实施例提供的一种向学习者推荐学习路径的方法进行详细说明。参见图1所示,该方法包括以下步骤:
S1:获取学习者对各个教学视频进行观看的时长信息,并基于该时长信息生成第一信息矩阵;该第一信息矩阵用于表征学习者在学习时长方面对各个教学视频的观看程度。
这里所说的各个教学视频可以是线上教育平台软件中所包含的全部教学视频,学习者则是该线上教育平台软件的用户。
其中,第一信息矩阵可以表示为RU×V,U为学习者的总数,V为教学视频的总数;该矩阵RU×V中任一元素ruv的数值,等于第u个学习者观看第v个教学视频的时长与第v个视频的总时长的比值;u∈[1,U],v∈[1,V]。
S2:基于第一信息矩阵,利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度;该改进型DINA认知诊断模型中,预设有各个教学视频对各项知识点的包含关系,且该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0~1之间的概率值。
本领域技术人员均知晓的是,传统的DINA认知诊断模型都是通过试题作答情况对学习者的知识点掌握程度进行建模,并以此来获取学生的初始认知水平。然而,这种传统方式需要编制认知诊断测试卷,并让每个学习者完成测试,在实际的应用中可行性不大。为了解决这一问题,本发明实施例中在现有DINA认知诊断模型的基础上,将基于试题作答情况获取知识点掌握程度的建模方式,改为了基于学习者的视频观看情况来获取知识点掌握程度。为了实现这一目的,本发明实施例在该改进型DINA认知诊断模型中预设了各教学视频对各项知识点的包含关系;这样,获取了学习者的视频观看情况,通过该包含关系便可以了解学习者是否掌握了相应的知识点。
并且,相较于现有的DINA认知诊断模型中将学习者对单项知识点的掌握程度处理为0或1的离散化数据,本发明实施例中使用的该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0~1之间的概率值,以此来对学习者的知识掌握程度进行精确的刻画,而非仅仅是学习者掌握知识点与否的二值化信息。
具体而言,该改进型DINA认知诊断模型中,使用第二信息矩阵QV×K来表示各个教学视频对各项知识点的包含关系,V为教学视频的总数,K为知识点的总数;其中,矩阵QV×K中的任一元素qvk=0表示第v个教学视频不包含第k∈[1,K]个知识点,qvk=1则表示第v个教学视频包含该第k个知识点。
并且,该改进型DINA认知诊断模型中还沿用了一个二值化向量αu={αu1u2,......,αuK},来表示第u个学习者对K个知识点是否掌握的信息,其中为1的元素表示第u个学习者已掌握该元素对应的知识点,为0的元素表示第u个学习者未掌握该元素对应的知识点;也就是说,当αuk=1时表示第u个学习者已掌握第k个知识点,当αuk=0时表示第u个学习者未掌握第k个知识点。
基于以上设定,本发明实施例构建了第一建模公式来模拟计算第u个学习者在知识点掌握程度向量为αu时看完第v个视频的概率;其中,该第一建模公式中引入了两个概念来模拟学习者在真实状态下观看视频的情况,一个概念是广大学习者已掌握教学视频中的知识点、但未看完教学视频的第一概率,另一个是广大学习者已掌握教学视频中的知识点、但未看完教学视频的第二概率。可以理解的是,这里说的广大学习者即包括上述的U个学习者。
该第一建模公式表示如下:
Figure BDA0003580069010000091
其中,qv为第二信息矩阵QV×K的第v∈[1,V]行元素构成的向量,qv中为0的元素表示第v个教学视频包含该元素对应的知识点,为1的元素表示第v个教学视频不包含该元素对应的知识点;ηuv表示第u个学习者对第v个视频的潜在观看进度,ηuv为0~1的浮点数;公式中的上标T表示矩阵转置;sv为U个学习者针对第v个教学视频的第一概率组成的向量,gv为U个学习者针对第v个教学视频的第二概率组成的向量;P(ruv=1|αu)表示第u个学习者在已知αu的条件下看过第v个视频的概率;其余参数的含义请参见上文。
基于该第一建模公式,使用EM算法最大化该第一建模公式的边缘似然,可以得到gv和sv的估计值,分别表示为
Figure BDA0003580069010000092
Figure BDA0003580069010000093
其中,EM算法是一种迭代优化策略,由于它的计算方法中每一次迭代都分两步,其中一个为期望步(E步),另一个为极大步(M步),所以被称为EM算法(Expectation-Maximization Algorithm)。EM算法的基本思想是:首先根据己经给出的观测数据,估计出模型参数的值;然后再依据上一步估计出的参数值估计缺失数据的值,再根据估计出的缺失数据加上之前己经观测到的数据重新再对参数值进行估计,然后反复迭代,直至最后收敛,迭代结束。关于EM算法的具体迭代方式,可参见相关现有技术,本发明实施例不再进行赘述。
然后,将估计出的
Figure BDA0003580069010000094
Figure BDA0003580069010000095
代入本发明实施例中构建的第二建模公式中,通过该第二建模公式最大化学习者观看视频时所可能出现的各种情况的后验概率,来计算学习者的知识点掌握程度。
该第二建模公式为:
Figure BDA0003580069010000101
其中,
Figure BDA0003580069010000102
表示第u个学习者对第k个知识点的掌握程度的概率值;Ru为RU×V的第u行元素构成的向量;P(αuk=1|Ru)表示在已知Ru的条件下αuk=1的概率;αx为αu的2K种取值中的第x种;这2K种取值中,第x=[x1,x2,x3,…,xM]种取值的第k个元素等于1;P(αx|Ru)表示在已知Ru的条件下αu=αx的概率;P(αx)表示αu=αx的先验概率;
Figure BDA0003580069010000103
表示在已知
Figure BDA0003580069010000104
以及
Figure BDA0003580069010000105
的条件下,当αu=αx时Ru的最大似然概率;
Figure BDA0003580069010000106
表示在已知
Figure BDA0003580069010000107
以及
Figure BDA0003580069010000108
的条件下,当αu=αx时ruv的最大似然概率。
由此,基于该第二建模公式,可以计算出学习者对各项知识点的掌握程度。
S3:根据学习者对各项知识点的掌握程度、各项知识点间的相似性以及各项知识点的先后继关系,向学习者推荐学习路径。
具体的,参见图2所示,根据学习者对各项知识点的掌握程度、各项知识点间的相似性以及各项知识点的先后继关系,向学习者推荐学习路径,可以包括:
步骤A:根据学习者对各项知识点的掌握程度,确定学习者的薄弱知识点集合,并从薄弱知识点集合中取出一薄弱知识点。
具体的,可以从从薄弱知识点集合中取出掌握程度最低的一个薄弱知识点或者任取一个薄弱知识点。
步骤B:确定该薄弱知识点的先继知识点集合。
这里,先继知识点指的是当前薄弱知识点的上一级知识点。
步骤C:计算先继知识点集合中的每个先继知识点与该薄弱知识点的相似度。
其中,该相似度可以是知识点语义相似度;优选地,该知识点语义相似性可以使用TransR模型将知识点嵌入为一维向量后,通过计算一维向量间的相似度得到。
或者,先继知识点与该薄弱知识点的相似度可以是知识点被广大学习者学习的情况相似度,这种相似度可以基于协同过滤算法计算得到。
为了使说明书的布局清楚,后续对使用TransR模型将知识点嵌入为一维向量的具体实现方式,以及基于协同过滤算法计算知识点被广大学习者学习的情况相似度的方式进行详细说明。
在一种优选实现方式中,可以将知识点的语义相似性以及知识点被广大学习者学习的情况相似性进行融合处理,得到先继知识点与薄弱知识点的相似度。其中,具体融合方式可以是对两种相似度分别进行归一化处理后再对应相加。
步骤D:根据学习者对每个先继知识点的掌握程度以及每个先继知识点与该薄弱知识点的相似度,计算每个先继知识点的推荐分数。
具体计算方式如下:
[P1,P2,P3,…,Pn]=[sim(S,S1)-αu1,sim(S,S2)-αu2,……,sim(S,Sn)-αun];
其中,[S1,S2,S3,…Sn]表示各个先继知识点,S表示该薄弱知识点,sim(·)表示计算先继知识点与薄弱知识点的相似度的函数,[αu1u2u3,…,αun]表示学习者对各个先继知识点的掌握程度,均为概率值;[P1,P2,P3,…,Pn]表示各个先继知识点的推荐分数。
步骤E:将推荐分数最高的先继知识点作为目标知识点添加至学习路径节点集合中,并判断新添加的目标知识点是否仍有先继知识点。
若仍有,将新添加的目标知识点(图2中标识为new)作为新的薄弱知识点(图2中标识为Weak)返回步骤B;若没有,继续执行步骤F。
步骤F:根据已加入学习路径的目标知识点生成并推荐学习路径。
具体的,根据已加入学习路径的各个目标知识点的先后继关系生成一条学习路径,并将该条学习路径推荐给学习者。
可选地,在一种实现方式中,执行步骤F生成了一条学习路径之后,还可以进一步返回步骤A,从而从薄弱知识点集合中取出下一薄弱知识点,并继续执行后续步骤,直至薄弱知识点集合为空。
这样,可以生成多条学习路径供学习者进行选择,或者由软件平台继续基于特定筛选规则对学习路径进行进一步的筛选,从而推荐最优的一条学习路径给学习者。这里提到的筛选规则可以存在多种,例如根据学习路径的长短、根据学习者对学习路径中的各个目标知识点的掌握程度进行筛选等等,这都是合理且可实现的。
下面,对使用TransR模型将知识点嵌入为一维向量的具体实现方式进行详细说明。
具体过程包括:
(1)基于预设的知识图谱中定义的实体以及实体间的关系,使用d2rq工具将教学数据库转换为RDF数据;其中,该知识图谱中定义的实体包括:知识点、课程、学校、教师以及领域;该实体间的关系包括:领域与课程的关系、课程与知识点的关系、学校与课程的关系、领域与知识点的关系、教师与课程的关系,以及学校与教师的关系。
(2)将得到的RDF数据输入至TransR模型,以使该TransR模型输出每个实体对应的一维向量以及每对实体间的关系对应的一维向量。
在步骤(1)中,知识图谱有自顶向下和自底向上两种构建方式。其中,所谓自顶向下构建是指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库中。所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模式,经人工审核之后,加入到知识库中。
以自顶向下的方式为例,构建知识图谱主要分为本体建模和数据获取两大部分。其中,本体(Ontology)是一种能在语义和知识层次上描述信息系统的概念模型的建模工具,属于知识图谱模式层的元素。本体主要是实现对现实世界事物的抽象化表示。在实际应用中,可以使用Protege本体构建工具,分别建立知识点(Concept)、课程(Course)、学校(School)、教师(Teacher)、以及领域(Field)五个概念类本体,并分别定义这些概念类本体的数据属性(Data property)。
其中知识点的数据属性可以包括知识点id、知识点名称以及知识点解释等;课程的数据属性可以包括课程id、课程名称、先修课程以及课程简介等;学校的数据属性可以包括学校id、学校名称等等;领域的数据属性可以包括领域id以及领域名称等。教师的数据属性可以包括教师id,教师名称以及教师简介等。
并且,还可以定义对象属性(Object property)来描述本体间的关系,如下表所示:
Figure BDA0003580069010000141
教学数据库的来源存在多种。例如,可以采用开源MOOCCube数据集,该数据集是面向大规模在线教育有关的自然语言处理、知识图谱、数据挖掘等研究者的开放数据仓库,包含706门真实在线课程、38,181个教学视频、114,563个概念、199,199名MOOC用户的数十万选课、视频观看记录,一个由概念间的先后修,上下位等关系的概念图谱以及包含数十万篇与课内概念有关的学术论文资源的补充资源库。
在实际应用中,若线上教育平台是某一具体领域的教育平台,则可以使用SQL语句,从整体的MOOCCube数据库中去除冗余数据,筛选出与具体领域相关的数据,来形成教学数据库。
鉴于MOOCCube数据集为json格式,因此为了便于后续的数据清洗工作,可以使用python脚本解析json格式的数据并存储至MySql数据库中。该MySql数据库中对数据结构的定义与知识图谱中定义的实体即实体间关系相对应。
有了MySql数据以及知识图谱之后,就可以使用d2rq工具作为转换工具,自动生成MySql数据库与知识图谱的映射文件,然后基于此映射文件将MySql数据库自动转换为RDF数据;RDF数据中的每项数据都使用三元组(h,r,t)来表示,其中,h和t表示实体,r表示该两个实体之前的关系,该关系实际中可用二叉树来表示。其中,d2rq工具是一个可以将传统数据库转化为三元组数据库(RDF图)的工具;RDF(Resource Description Framework,资源描述框架)是一个使用XML语法来表示的资料模型(Datamodel),用来描述资源的特性以及资源间的关系。
可选地,可以将RDF数据上传至neo4j的服务端口,使用neo4j图数据库对知识图谱进行可视化存储,得到知识图谱参见图3所示(图3仅展示了部分课程的知识图谱)。
该图3中,以数据结构、面向对象程序设计、软件体系结构三门课以及它们相关的实体为例,展示了知识图谱的一部分。其中,不同颜色和大小的圆圈分别代表课程、教师、知识点、领域以及学校。任意两个圆圈之间的连线表示这两个圆圈之间的关系,具体可以为课程知识点、任课教师、领域知识点、领域课程、学校的教师、知识点先继、知识点后继或者学校的课程。
得到RDF数据后,将RDF数据输入至TransR模型,该TransR模型即会输出每个实体对应的一维向量以及每对实体间的关系对应的一维向量。由此,便可以从TransR模型的输出中提取各知识点对应的一维向量。
知识图谱表示的经典模型包括神经张量网络模型、TransE模型、TransH模型。由于TransE和TransH模型都假设实体和关系是语义空间中的向量,因此相似的实体在同一实体空间中会非常接近,因此这两个模型均不善于处理“一对多”、“多对多”关系。然而在教育领域的知识图谱中,存在着大量的“一对多”、“多对多”关系,例如一门课程包含多门知识点、一位教师对应多门课程等等。因此,为了更好地处理这些关系,本发明实施例采用TransR模型进行知识图谱嵌入工作。
TransR模型的原理如图4所示,对于每个三元组(h,r,t),将实体空间中的实体通过一个投影矩阵Mr投影到r关系空间中,得到投影结果hr和tr,该Mr的大小为[实体总数,关系类别总数]。TransR模型的这种做法可以使实际持有这种关系的实体(图4中的圆圈)彼此靠近,同时那些不持有这个关系的实体相互远离(图4中的三角)。
上述投影操作可以用公式表示为:
Figure BDA0003580069010000161
其中,投影矩阵Mr需要通过对TransR模型进行多次的训练才能够使投影出的实体间关系与实际的实体间关系一致。
在训练过程中,每次均基于当前设置的投影矩阵Mr执行上述投影操作,然后,使用下述公式计算投影得分:
Figure BDA0003580069010000162
然后,利用损失函数计算损失值,该损失函数如下:
Figure BDA0003580069010000163
其中,C为实际的RDF数据中的三元组,属于正样本,C'为对正样本进行一定的修改得到的负样本,例如可以对作为正样本的三元组中的任一元替换为其他数据。γ为边缘参数,用于平衡正负样本对于损失值的贡献,即正负样本对于损失值的贡献之差最多到γ就足够了。
当损失值小于设置的阈值时,得到训练完成的TransR模型,此时该TransR模型中使用的投影矩阵Mr可以看做是最佳投影矩阵,能够将实体更准确地映射到关系空间中。
使用TransR模型嵌入后,知识图谱中的每一个实体和关系均可表示为一个一维向量:
Figure BDA0003580069010000171
其中,该一维向量的长度为d。
得到每个知识点的一维向量后,可以计算每两个知识点之间的欧几里德距离:
Figure BDA0003580069010000172
其中,Ekj是区别于知识点i的另一个知识点j的一维向量
Figure BDA0003580069010000173
里的元素。
Figure BDA0003580069010000174
表示这两个知识点之间的欧几里德距离。
优选地,可以对计算得到的欧几里德距离进行归一化处理,并将所有知识点间的归一化结果存储为K×K的矩阵,以便后续与另一种类型的相似度进行融合。归一化方式如下:
Figure BDA0003580069010000175
基于该式可以看到,这里将归一化结果simsg(Ii,Ij)作为两个知识点之间的相似度。
至此,知识点语义相似度矩阵计算完毕,下面对基于协同过滤算法计算知识点被广大学习者学习的情况相似度的方式进行详细说明。
协同过滤算法是又被叫作基于用户行为的推荐算法,是推荐领域中使用最广泛的算法,其算法核心思想是仅通过用户过往交互信息挖掘出用户潜在喜欢的信息或商品,不需要预先获得用户或物品的特征值。根据用户对知识点的学习情况可以刻画用户的画像,从而为用户推荐其可能需要学习的知识点。已知共有U个学习者和K个知识点,那么可以构建一个表征学习者是否掌握知识点的矩阵RU×K,如下所示:
Figure BDA0003580069010000181
该矩阵RU×K中,每一行代表一个学习者的学习行为,每一列代表一个知识点被学习的情况。
如果两个知识点是相似的,那么学习者对其的选择情况也应当是相似的。基于项目协同过滤的推荐算法就是利用这种思想实现推荐的。根据矩阵RU×K,可以将知识点i被所有学习者学习的情况可表示为如下向量:
Ii=(R1i,R2i,......,RUi)T,i∈[1,K];
由此,可计算每两个知识点之间的余弦相似度:
Figure BDA0003580069010000182
计算出每两个知识点之间的余弦相似度后,可以基于这些相似度的数据构建另一个大小同样为K×K的相似度矩阵。这样,就可以将知识点语义相似度矩阵与基于协同过滤算法计算的相似度矩阵进行融合处理了。
本发明实施例提供的向学习者推荐学习路径的方法中,考虑到了知识点之间的先后继关系、学习者对众多知识点的掌握程度以及知识点之间的相似性,向学习者准确、连贯、有针对性地推荐一条完整的个性化学习路径,从而帮助学习者查漏补缺、快速、全面地掌握薄弱的知识点,提升学习效率。
其中,本发明实施例使用改进型DINA认知诊断模型来获取学习者对各项知识点的掌握程度,该改进型DINA认知诊断模型是基于学习者对教学视频的观看程度来获取学习者对各项知识点的掌握程度的,无需编制认知诊断测试卷并让学习者进行作答,使得学习者对知识点的掌握程度信息更容易获取,提高了方案的实际可行性。
并且,相较于现有的DINA认知诊断模型中将学习者对单项知识点的掌握程度处理为0或1的离散化数据,本发明实施例中使用的该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0~1之间的概率值,能够更精确地对学习者的知识掌握程度进行刻画,从而提高所推荐学习路径的合理性。
基于同一发明构思,本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现上述任一种向学习者推荐学习路径的方法所述的方法步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表征,图中仅用一条粗线表征,但并不表征仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,对于电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。此外,本领域的技术人员可以将本说明书中描述的不同实施例或示例进行接合和组合。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (9)

1.一种向学习者推荐学习路径的方法,其特征在于,包括:
获取学习者对各个教学视频进行观看的时长信息,并基于所述时长信息生成第一信息矩阵;所述第一信息矩阵用于表征学习者在学习时长方面对所述各个教学视频的观看程度;
基于所述第一信息矩阵,利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度;所述改进型DINA认知诊断模型中,预设有所述各个教学视频对所述各项知识点的包含关系,且所述改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0~1之间的概率值;
根据学习者对所述各项知识点的掌握程度、所述各项知识点间的相似性以及所述各项知识点的先后继关系,向学习者推荐学习路径。
2.根据权利要求1所述的方法,其特征在于,所述相似性是对知识点的语义相似性以及知识点被广大学习者学习的情况相似性进行融合处理得到的。
3.根据权利要求2所述的方法,其特征在于,所述知识点语义相似性是使用TransR模型将知识点嵌入为一维向量后,通过计算一维向量间的相似度得到的。
4.根据权利要求3所述的方法,其特征在于,使用TransR模型将知识点嵌入为一维向量的方式包括:
基于预设的知识图谱中定义的实体以及实体间的关系,使用d2rq工具将教学数据库转换为RDF数据;其中,所述知识图谱中定义的实体包括:知识点、课程、学校、教师以及领域;所述实体间的关系包括:领域与课程的关系、课程与知识点的关系、学校与课程的关系、领域与知识点的关系、教师与课程的关系,以及学校与教师的关系;
将所述RDF数据输入至TransR模型,以使所述TransR模型输出每个所述实体对应的一维向量以及每对实体间的关系对应的一维向量。
5.根据权利要求2所述的方法,其特征在于,知识点被广大学习者学习的情况相似性是基于协同过滤算法计算得到的。
6.根据权利要求1所述的方法,其特征在于,基于所述第一信息矩阵,利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度,包括:
使用EM算法最大化第一建模公式的边缘似然,得到广大学习者已掌握教学视频中的知识点、但未看完教学视频的第一概率,以及广大学习者已看完教学视频、但未掌握教学视频中的知识点的第二概率;
基于所述第一信息矩阵、所述第一概率以及所述第二概率,使用第二建模公式计算学习者对各项知识点的掌握程度;
其中,所述第一建模公式为:
Figure FDA0003580068000000021
其中,qv为表征所述包含关系的第二信息矩阵QV×K的第v∈[1,V]行元素构成的向量,V为所述各个教学视频的总数,K为所述各项知识点的总数,qv中为0的元素表示第v个教学视频包含该元素对应的知识点,为1的元素表示第v个教学视频不包含该元素对应的知识点;sv为U个学习者针对第v个教学视频的所述第一概率组成的向量,gv为U个学习者针对第v个教学视频的所述第二概率组成的向量,U为学习者的总数;ruv为所述第一信息矩阵RU×V中位于第u∈[1,U]行、第v∈[1,V]列的元素,ruv的数值等于第u个学习者观看第v个教学视频的时长与第v个视频的总时长的比值;αu={αu1u2,......,αuK}是表示第u个学习者对K个知识点是否掌握的二值化向量,αu中为1的元素表示第u个学习者已掌握该元素对应的知识点,为0的元素表示第u个学习者未掌握该元素对应的知识点;P(ruv=1|αu)表示第u个学习者在已知αu的条件下看过第v个视频的概率;上标T表示矩阵转置;ηuv表示第u个学习者对第v个视频的潜在观看进度;
所述第二建模公式为:
Figure FDA0003580068000000031
其中,
Figure FDA0003580068000000032
表示第u个学习者对第k个知识点的掌握程度,为一概率值;
Figure FDA0003580068000000033
为通过EM算法得到的上述sv的估计值,
Figure FDA0003580068000000034
为通过EM算法得到的上述gv的估计值;Ru为RU×V的第u行元素构成的向量;αx为αu的2K种取值中的第x种;所述2K种取值中,第x=[x1,x2,x3,…,xM]种取值的第k个元素等于1;P(αx)表示αu=αx的先验概率;P(αx|Ru)表示在已知Ru的条件下αu=αx的后验概率;
Figure FDA0003580068000000035
表示在已知
Figure FDA0003580068000000036
Figure FDA0003580068000000037
的条件下,当αu=αx时ruv的最大似然概率。
7.根据权利要求1所述的方法,其特征在于,根据学习者对所述各项知识点的掌握程度、所述各项知识点间的相似性以及所述各项知识点的先后继关系,向学习者推荐学习路径,包括:
A、根据学习者对所述各项知识点的掌握程度,确定学习者的薄弱知识点集合,并从所述薄弱知识点集合中取出一薄弱知识点;
B、确定所述薄弱知识点的先继知识点集合;
C、计算所述先继知识点集合中的每个先继知识点与所述薄弱知识点的相似度;
D、根据学习者对每个所述先继知识点的掌握程度以及每个所述先继知识点与所述薄弱知识点的相似度,计算每个所述先继知识点的推荐分数;
E、将推荐分数最高的先继知识点作为目标知识点添加至学习路径节点集合中,并判断新添加的目标知识点是否仍有先继知识点;若仍有,将新添加的目标知识点作为新的薄弱知识点返回步骤B;若没有,继续执行步骤F;
F、根据已加入学习路径的目标知识点生成一条学习路径,以向学习者推荐该学习路径。
8.根据权利要求1所述的方法,其特征在于,在执行步骤F之后,所述方法还包括:
G、返回步骤A,以从所述薄弱知识点集合中取出下一薄弱知识点,并继续执行后续步骤,直至所述薄弱知识点集合为空。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-8任一所述的方法步骤。
CN202210343103.2A 2022-04-02 2022-04-02 一种向学习者推荐学习路径的方法及电子设备 Active CN114741591B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210343103.2A CN114741591B (zh) 2022-04-02 2022-04-02 一种向学习者推荐学习路径的方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210343103.2A CN114741591B (zh) 2022-04-02 2022-04-02 一种向学习者推荐学习路径的方法及电子设备

Publications (2)

Publication Number Publication Date
CN114741591A true CN114741591A (zh) 2022-07-12
CN114741591B CN114741591B (zh) 2024-06-25

Family

ID=82279044

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210343103.2A Active CN114741591B (zh) 2022-04-02 2022-04-02 一种向学习者推荐学习路径的方法及电子设备

Country Status (1)

Country Link
CN (1) CN114741591B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117437099A (zh) * 2023-12-20 2024-01-23 青岛理工大学 一种基于大语言模型的智慧教学系统及教学方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617259A (zh) * 2013-11-29 2014-03-05 华中科技大学 一种基于有社会关系和项目内容的贝叶斯概率矩阵分解推荐方法
CN109509126A (zh) * 2018-11-02 2019-03-22 中山大学 一种基于用户学习行为的个性化试题推荐方法
US20200303072A1 (en) * 2017-12-29 2020-09-24 Obshchestvo S Ogranichennoj Otvetstvennostyu "Intellodzhik" Method and system for supporting medical decision making
CN112102937A (zh) * 2020-11-13 2020-12-18 之江实验室 一种慢性病辅助决策的患者数据可视化方法及系统
CN112596731A (zh) * 2020-12-29 2021-04-02 中国科学技术大学 一种融合智能教育的编程教学系统及方法
CN114118375A (zh) * 2021-11-29 2022-03-01 吉林大学 一种基于时序图Transformer的连续动态网络表征学习方法
CN114201684A (zh) * 2021-12-15 2022-03-18 中山大学 一种基于知识图谱的自适应学习资源推荐方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617259A (zh) * 2013-11-29 2014-03-05 华中科技大学 一种基于有社会关系和项目内容的贝叶斯概率矩阵分解推荐方法
US20200303072A1 (en) * 2017-12-29 2020-09-24 Obshchestvo S Ogranichennoj Otvetstvennostyu "Intellodzhik" Method and system for supporting medical decision making
CN109509126A (zh) * 2018-11-02 2019-03-22 中山大学 一种基于用户学习行为的个性化试题推荐方法
CN112102937A (zh) * 2020-11-13 2020-12-18 之江实验室 一种慢性病辅助决策的患者数据可视化方法及系统
CN112596731A (zh) * 2020-12-29 2021-04-02 中国科学技术大学 一种融合智能教育的编程教学系统及方法
CN114118375A (zh) * 2021-11-29 2022-03-01 吉林大学 一种基于时序图Transformer的连续动态网络表征学习方法
CN114201684A (zh) * 2021-12-15 2022-03-18 中山大学 一种基于知识图谱的自适应学习资源推荐方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FEI ZHOU, 《JOURNAL OF HEALTHCARE ENGINEERING》, vol. 2022, 7 January 2022 (2022-01-07), pages 1 - 12 *
王丹, 《中国优秀硕士学位论文全文数据库 社会科学II辑》, 15 February 2022 (2022-02-15), pages 127 - 85 *
胡心颖: "基于认知诊断方法的计算机教育数据挖掘问题研究", 《中国优秀硕士学位论文全文数据库 社会科学II辑》, 15 August 2021 (2021-08-15), pages 131 - 66 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117437099A (zh) * 2023-12-20 2024-01-23 青岛理工大学 一种基于大语言模型的智慧教学系统及教学方法
CN117437099B (zh) * 2023-12-20 2024-05-10 青岛理工大学 一种基于大语言模型的智慧教学系统及教学方法

Also Published As

Publication number Publication date
CN114741591B (zh) 2024-06-25

Similar Documents

Publication Publication Date Title
Cribben et al. The benefits and limitations of ChatGPT in business education and research: A focus on management science, operations management and data analytics
Hardin et al. Data science in statistics curricula: Preparing students to “think with data”
US11631338B2 (en) Deep knowledge tracing with transformers
Lan et al. Mathematical language processing: Automatic grading and feedback for open response mathematical questions
Li et al. Autonomous GIS: the next-generation AI-powered GIS
CN111274411A (zh) 课程推荐方法、装置、电子设备及可读存储介质
CN107544960B (zh) 一种基于变量绑定和关系激活的自动问答方法
US10373512B2 (en) Mathematical language processing: automatic grading and feedback for open response mathematical questions
CN112506945B (zh) 基于知识图谱的自适应导学方法及系统
CN113283488B (zh) 一种基于学习行为的认知诊断方法及系统
CN114021722A (zh) 一种融合认知刻画的注意力知识追踪方法
CN112148890A (zh) 基于网络群体智能的教学知识点图谱系统
Swamy et al. Deep knowledge tracing for free-form student code progression
Baulé et al. Automatic code generation from sketches of mobile applications in end-user development using Deep Learning
CN114741591B (zh) 一种向学习者推荐学习路径的方法及电子设备
Jayanthi et al. Research contemplate on educational data mining
Tharmaseelan et al. Revisit of automated marking techniques for programming assignments
Rutskaya et al. Mastering software engineering with the help of the level model of competencies acquisition
Ogunkunle et al. A data mining based optimization of selecting learning material in an intelligent tutoring system for advancing STEM education
CN109726690B (zh) 基于DenseCap网络的学习者行为图像多区域描述方法
CN112785039A (zh) 一种试题作答得分率的预测方法及相关装置
Ivančević et al. Adaptive testing in programming courses based on educational data mining techniques
Pelánek et al. Towards design-loop adaptivity: identifying items for revision
Furtado et al. The effect on new knowledge and reviewed knowledge caused by the positioning task in closed concept maps
CN111090751A (zh) 基于知识图谱的教学推荐方法、系统、存储介质、及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant