CN114741591A

CN114741591A - 一种向学习者推荐学习路径的方法及电子设备

Info

Publication number: CN114741591A
Application number: CN202210343103.2A
Authority: CN
Inventors: 蔺一帅; 李悦辰; 王文野; 牛振兴; 褚华; 张菊莉; 王婧丽; 夏若恒
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2022-04-02
Filing date: 2022-04-02
Publication date: 2022-07-12
Anticipated expiration: 2042-04-02
Also published as: CN114741591B

Abstract

本发明公开了一种向学习者推荐学习路径的方法，包括：获取学习者对各个教学视频进行观看的时长信息，并基于时长信息生成第一信息矩阵；第一信息矩阵用于表征学习者在学习时长方面对各个教学视频的观看程度；基于第一信息矩阵，利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度；该改进型DINA认知诊断模型中，预设有各个教学视频对各项知识点的包含关系，且该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0～1之间的概率值；根据学习者对各项知识点的掌握程度、各项知识点间的相似性以及各项知识点的先后继关系，向学习者推荐学习路径。本发明可避免使学习者陷入知识孤岛，帮助学习者的学识进步。

Description

一种向学习者推荐学习路径的方法及电子设备

技术领域

本发明属于在线教育技术领域，具体涉及一种向学习者推荐学习路径的方法及电子设备。

背景技术

随着在线教育技术的发展，在线的学习者在面对海量的教育资源时极易产生“学习迷航”、“认知过载”的情况，这一现状极大地降低了学习者的学习效率以及学习兴趣。

为了解决上述问题，现有技术中通常会获取学习者的历史学习记录作为学习者感兴趣的知识点；然后向学习者推荐相似的知识点以供学习者学习。然而，这种做法容易使学习者陷入知识孤岛，不利于学习者的学识进步。

发明内容

为了解决现有技术中所存在的上述问题，本发明提供了一种学习路径推荐方法及电子设备。

本发明要解决的技术问题通过以下技术方案实现：

一种向学习者推荐学习路径的方法，包括：

获取学习者对各个教学视频进行观看的时长信息，并基于所述时长信息生成第一信息矩阵；所述第一信息矩阵用于表征学习者在学习时长方面对所述各个教学视频的观看程度；

基于所述第一信息矩阵，利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度；所述改进型DINA认知诊断模型中，预设有所述各个教学视频对所述各项知识点的包含关系，且所述改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0～1之间的概率值；

根据学习者对所述各项知识点的掌握程度、所述各项知识点间的相似性以及所述各项知识点的先后继关系，向学习者推荐学习路径。

可选地，所述相似性是对知识点的语义相似性以及知识点被广大学习者学习的情况相似性进行融合处理得到的。

可选地，所述知识点语义相似性是使用TransR模型将知识点嵌入为一维向量后，通过计算一维向量间的相似度得到的。

可选地，使用TransR模型将知识点嵌入为一维向量的方式包括：

基于预设的知识图谱中定义的实体以及实体间的关系，使用d2rq工具将教学数据库转换为RDF数据；其中，所述知识图谱中定义的实体包括：知识点、课程、学校、教师以及领域；所述实体间的关系包括：领域与课程的关系、课程与知识点的关系、学校与课程的关系、领域与知识点的关系、教师与课程的关系，以及学校与教师的关系；

将所述RDF数据输入至TransR模型，以使所述TransR模型输出每个所述实体对应的一维向量以及每对实体间的关系对应的一维向量。

可选地，知识点被广大学习者学习的情况相似性是基于协同过滤算法计算得到的。

可选地，基于所述第一信息矩阵，利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度，包括：

使用EM算法最大化第一建模公式的边缘似然，得到广大学习者已掌握教学视频中的知识点、但未看完教学视频的第一概率，以及广大学习者已看完教学视频、但未掌握教学视频中的知识点的第二概率；

基于所述第一信息矩阵、所述第一概率以及所述第二概率，使用第二建模公式计算学习者对各项知识点的掌握程度；

其中，所述第一建模公式为：

其中，q_v为表征所述包含关系的第二信息矩阵Q_V×K的第v∈[1,V]行元素构成的向量，V为所述各个教学视频的总数，K为所述各项知识点的总数，q_v中为0的元素表示第v个教学视频包含该元素对应的知识点，为1的元素表示第v个教学视频不包含该元素对应的知识点；s_v为U个学习者针对第v个教学视频的所述第一概率组成的向量，g_v为U个学习者针对第v个教学视频的所述第二概率组成的向量，U为学习者的总数；r_uv为所述第一信息矩阵R_U×V中位于第u∈[1,U]行、第v∈[1,V]列的元素，r_uv的数值等于第u个学习者观看第v个教学视频的时长与第v个视频的总时长的比值；α_u＝{α_u1,α_u2,......,α_uK}是表示第u个学习者对K个知识点是否掌握的二值化向量，α_u中为1的元素表示第u个学习者已掌握该元素对应的知识点，为0的元素表示第u个学习者未掌握该元素对应的知识点；P(r_uv＝1|α_u)表示第u个学习者在已知α_u的条件下看过第v个视频的概率；上标T表示矩阵转置；η_uv表示第u个学习者对第v个视频的潜在观看进度；

所述第二建模公式为：

其中，

表示第u个学习者对第k个知识点的掌握程度，为一概率值；

为通过EM算法得到的上述s_v的估计值，

为通过EM算法得到的上述g_v的估计值；R_u为R_U×V的第u行元素构成的向量；α_x为α_u的2^K种取值中的第x种；所述2^K种取值中，第x＝[x₁,x₂,x₃,…,x_M]种取值的第k个元素等于1；P(α_x)表示α_u＝α_x的先验概率；P(α_x|R_u)表示在已知R_u的条件下α_u＝α_x的后验概率；

表示在已知

和

的条件下，当α_u＝α_x时r_uv的最大似然概率。

可选地，根据学习者对所述各项知识点的掌握程度、所述各项知识点间的相似性以及所述各项知识点的先后继关系，向学习者推荐学习路径，包括：

A、根据学习者对所述各项知识点的掌握程度，确定学习者的薄弱知识点集合，并从所述薄弱知识点集合中取出一薄弱知识点；

B、确定所述薄弱知识点的先继知识点集合；

C、计算所述先继知识点集合中的每个先继知识点与所述薄弱知识点的相似度；

D、根据学习者对每个所述先继知识点的掌握程度以及每个所述先继知识点与所述薄弱知识点的相似度，计算每个所述先继知识点的推荐分数；

E、将推荐分数最高的先继知识点作为目标知识点添加至学习路径节点集合中，并判断新添加的目标知识点是否仍有先继知识点；若仍有，将新添加的目标知识点作为新的薄弱知识点返回步骤B；若没有，继续执行步骤F；

F、根据已加入学习路径的目标知识点生成一条学习路径，以向学习者推荐该学习路径。

可选地，在执行步骤F之后，所述方法还包括：

G、返回步骤A，以从所述薄弱知识点集合中取出下一薄弱知识点，并继续执行后续步骤，直至所述薄弱知识点集合为空。

本发明还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一种向学习者推荐学习路径的方法所述的方法步骤。

本发明提供的向学习者推荐学习路径的方法中，考虑到了知识点之间的先后继关系、学习者对众多知识点的掌握程度以及知识点之间的相似性，向学习者准确、连贯、有针对性地推荐一条完整的个性化学习路径，从而帮助学习者查漏补缺、快速、全面地掌握薄弱的知识点，提升学习效率。

其中，本发明使用改进型DINA认知诊断模型来获取学习者对各项知识点的掌握程度，该改进型DINA认知诊断模型是基于学习者对教学视频的观看程度来获取学习者对各项知识点的掌握程度的，无需编制认知诊断测试卷并让学习者进行作答，使得学习者对知识点的掌握程度信息更容易获取，提高了方案的实际可行性。

并且，相较于现有的DINA认知诊断模型中将学习者对单项知识点的掌握程度处理为0或1的离散化数据，本发明中使用的该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0～1之间的概率值，能够更精确地对学习者的知识掌握程度进行刻画，从而提高所推荐学习路径的合理性。

以下将结合附图及对本发明做进一步详细说明。

附图说明

图1是本发明实施例提供的一种向学习者推荐学习路径的方法的流程示意图；

图2是本发明实施例中使用的知识图谱的局部结构示意图；

图3是TransR模型的示意图；

图4是本发明实施例中的学习路径的形成过程示意图；

图5是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面结合具体实施例对本发明做进一步详细的描述，但本发明的实施方式不限于此。

为了避免使学习者陷入知识孤岛，帮助学习者的学识进步，本发明实施例提供了一种向学习者推荐学习路径的方法及电子设备。其中，该电子设备上加载有线上教育平台软件，该软件中可以运行本发明实施例提供的向学习者推荐学习路径的方法。在实际应用中，上述电子设备可以是客户端设备、服务器、台式计算机、便携式计算机、平板设备等，在此不作限定；任何可以使用本发明实施例所提供的方法的电子设备，均属于本发明的保护范围。另外，上述线上教育平台软件软件可利用IntelliJ IDEA开发工具，搭建springboot+vue框架并使用Java语言进行开发，当然并不局限于此。

首先，对本发明实施例提供的一种向学习者推荐学习路径的方法进行详细说明。参见图1所示，该方法包括以下步骤：

S1：获取学习者对各个教学视频进行观看的时长信息，并基于该时长信息生成第一信息矩阵；该第一信息矩阵用于表征学习者在学习时长方面对各个教学视频的观看程度。

这里所说的各个教学视频可以是线上教育平台软件中所包含的全部教学视频，学习者则是该线上教育平台软件的用户。

其中，第一信息矩阵可以表示为R_U×V，U为学习者的总数，V为教学视频的总数；该矩阵R_U×V中任一元素r_uv的数值，等于第u个学习者观看第v个教学视频的时长与第v个视频的总时长的比值；u∈[1,U]，v∈[1,V]。

S2：基于第一信息矩阵，利用一改进型DINA认知诊断模型获取学习者对各项知识点的掌握程度；该改进型DINA认知诊断模型中，预设有各个教学视频对各项知识点的包含关系，且该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0～1之间的概率值。

本领域技术人员均知晓的是，传统的DINA认知诊断模型都是通过试题作答情况对学习者的知识点掌握程度进行建模，并以此来获取学生的初始认知水平。然而，这种传统方式需要编制认知诊断测试卷，并让每个学习者完成测试，在实际的应用中可行性不大。为了解决这一问题，本发明实施例中在现有DINA认知诊断模型的基础上，将基于试题作答情况获取知识点掌握程度的建模方式，改为了基于学习者的视频观看情况来获取知识点掌握程度。为了实现这一目的，本发明实施例在该改进型DINA认知诊断模型中预设了各教学视频对各项知识点的包含关系；这样，获取了学习者的视频观看情况，通过该包含关系便可以了解学习者是否掌握了相应的知识点。

并且，相较于现有的DINA认知诊断模型中将学习者对单项知识点的掌握程度处理为0或1的离散化数据，本发明实施例中使用的该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0～1之间的概率值，以此来对学习者的知识掌握程度进行精确的刻画，而非仅仅是学习者掌握知识点与否的二值化信息。

具体而言，该改进型DINA认知诊断模型中，使用第二信息矩阵Q_V×K来表示各个教学视频对各项知识点的包含关系，V为教学视频的总数，K为知识点的总数；其中，矩阵Q_V×K中的任一元素q_vk＝0表示第v个教学视频不包含第k∈[1,K]个知识点，q_vk＝1则表示第v个教学视频包含该第k个知识点。

并且，该改进型DINA认知诊断模型中还沿用了一个二值化向量α_u＝{α_u1,α_u2,......,α_uK}，来表示第u个学习者对K个知识点是否掌握的信息，其中为1的元素表示第u个学习者已掌握该元素对应的知识点，为0的元素表示第u个学习者未掌握该元素对应的知识点；也就是说，当α_uk＝1时表示第u个学习者已掌握第k个知识点，当α_uk＝0时表示第u个学习者未掌握第k个知识点。

基于以上设定，本发明实施例构建了第一建模公式来模拟计算第u个学习者在知识点掌握程度向量为α_u时看完第v个视频的概率；其中，该第一建模公式中引入了两个概念来模拟学习者在真实状态下观看视频的情况，一个概念是广大学习者已掌握教学视频中的知识点、但未看完教学视频的第一概率，另一个是广大学习者已掌握教学视频中的知识点、但未看完教学视频的第二概率。可以理解的是，这里说的广大学习者即包括上述的U个学习者。

该第一建模公式表示如下：

其中，q_v为第二信息矩阵Q_V×K的第v∈[1,V]行元素构成的向量，q_v中为0的元素表示第v个教学视频包含该元素对应的知识点，为1的元素表示第v个教学视频不包含该元素对应的知识点；η_uv表示第u个学习者对第v个视频的潜在观看进度，η_uv为0～1的浮点数；公式中的上标T表示矩阵转置；s_v为U个学习者针对第v个教学视频的第一概率组成的向量，g_v为U个学习者针对第v个教学视频的第二概率组成的向量；P(r_uv＝1|α_u)表示第u个学习者在已知α_u的条件下看过第v个视频的概率；其余参数的含义请参见上文。

基于该第一建模公式，使用EM算法最大化该第一建模公式的边缘似然，可以得到g_v和s_v的估计值，分别表示为

和

其中，EM算法是一种迭代优化策略，由于它的计算方法中每一次迭代都分两步，其中一个为期望步(E步)，另一个为极大步(M步)，所以被称为EM算法(Expectation-Maximization Algorithm)。EM算法的基本思想是：首先根据己经给出的观测数据，估计出模型参数的值；然后再依据上一步估计出的参数值估计缺失数据的值，再根据估计出的缺失数据加上之前己经观测到的数据重新再对参数值进行估计，然后反复迭代，直至最后收敛，迭代结束。关于EM算法的具体迭代方式，可参见相关现有技术，本发明实施例不再进行赘述。

然后，将估计出的

和

代入本发明实施例中构建的第二建模公式中，通过该第二建模公式最大化学习者观看视频时所可能出现的各种情况的后验概率，来计算学习者的知识点掌握程度。

该第二建模公式为：

其中，

表示第u个学习者对第k个知识点的掌握程度的概率值；R_u为R_U×V的第u行元素构成的向量；P(α_uk＝1|R_u)表示在已知R_u的条件下α_uk＝1的概率；α_x为α_u的2^K种取值中的第x种；这2^K种取值中，第x＝[x₁,x₂,x₃,…,x_M]种取值的第k个元素等于1；P(α_x|R_u)表示在已知R_u的条件下α_u＝α_x的概率；P(α_x)表示α_u＝α_x的先验概率；

表示在已知

以及

的条件下，当α_u＝α_x时R_u的最大似然概率；

表示在已知

以及

的条件下，当α_u＝α_x时r_uv的最大似然概率。

由此，基于该第二建模公式，可以计算出学习者对各项知识点的掌握程度。

S3：根据学习者对各项知识点的掌握程度、各项知识点间的相似性以及各项知识点的先后继关系，向学习者推荐学习路径。

具体的，参见图2所示，根据学习者对各项知识点的掌握程度、各项知识点间的相似性以及各项知识点的先后继关系，向学习者推荐学习路径，可以包括：

步骤A：根据学习者对各项知识点的掌握程度，确定学习者的薄弱知识点集合，并从薄弱知识点集合中取出一薄弱知识点。

具体的，可以从从薄弱知识点集合中取出掌握程度最低的一个薄弱知识点或者任取一个薄弱知识点。

步骤B：确定该薄弱知识点的先继知识点集合。

这里，先继知识点指的是当前薄弱知识点的上一级知识点。

步骤C：计算先继知识点集合中的每个先继知识点与该薄弱知识点的相似度。

其中，该相似度可以是知识点语义相似度；优选地，该知识点语义相似性可以使用TransR模型将知识点嵌入为一维向量后，通过计算一维向量间的相似度得到。

或者，先继知识点与该薄弱知识点的相似度可以是知识点被广大学习者学习的情况相似度，这种相似度可以基于协同过滤算法计算得到。

为了使说明书的布局清楚，后续对使用TransR模型将知识点嵌入为一维向量的具体实现方式，以及基于协同过滤算法计算知识点被广大学习者学习的情况相似度的方式进行详细说明。

在一种优选实现方式中，可以将知识点的语义相似性以及知识点被广大学习者学习的情况相似性进行融合处理，得到先继知识点与薄弱知识点的相似度。其中，具体融合方式可以是对两种相似度分别进行归一化处理后再对应相加。

步骤D：根据学习者对每个先继知识点的掌握程度以及每个先继知识点与该薄弱知识点的相似度，计算每个先继知识点的推荐分数。

具体计算方式如下：

[P₁,P₂,P₃,…,P_n]＝[sim(S,S₁)-α_u1,sim(S,S₂)-α_u2,……,sim(S,S_n)-α_un]；

其中，[S₁,S₂,S₃,…S_n]表示各个先继知识点，S表示该薄弱知识点，sim(·)表示计算先继知识点与薄弱知识点的相似度的函数，[α_u1,α_u2,α_u3,…,α_un]表示学习者对各个先继知识点的掌握程度，均为概率值；[P₁,P₂,P₃,…,P_n]表示各个先继知识点的推荐分数。

步骤E：将推荐分数最高的先继知识点作为目标知识点添加至学习路径节点集合中，并判断新添加的目标知识点是否仍有先继知识点。

若仍有，将新添加的目标知识点(图2中标识为new)作为新的薄弱知识点(图2中标识为Weak)返回步骤B；若没有，继续执行步骤F。

步骤F：根据已加入学习路径的目标知识点生成并推荐学习路径。

具体的，根据已加入学习路径的各个目标知识点的先后继关系生成一条学习路径，并将该条学习路径推荐给学习者。

可选地，在一种实现方式中，执行步骤F生成了一条学习路径之后，还可以进一步返回步骤A，从而从薄弱知识点集合中取出下一薄弱知识点，并继续执行后续步骤，直至薄弱知识点集合为空。

这样，可以生成多条学习路径供学习者进行选择，或者由软件平台继续基于特定筛选规则对学习路径进行进一步的筛选，从而推荐最优的一条学习路径给学习者。这里提到的筛选规则可以存在多种，例如根据学习路径的长短、根据学习者对学习路径中的各个目标知识点的掌握程度进行筛选等等，这都是合理且可实现的。

下面，对使用TransR模型将知识点嵌入为一维向量的具体实现方式进行详细说明。

具体过程包括：

(1)基于预设的知识图谱中定义的实体以及实体间的关系，使用d2rq工具将教学数据库转换为RDF数据；其中，该知识图谱中定义的实体包括：知识点、课程、学校、教师以及领域；该实体间的关系包括：领域与课程的关系、课程与知识点的关系、学校与课程的关系、领域与知识点的关系、教师与课程的关系，以及学校与教师的关系。

(2)将得到的RDF数据输入至TransR模型，以使该TransR模型输出每个实体对应的一维向量以及每对实体间的关系对应的一维向量。

在步骤(1)中，知识图谱有自顶向下和自底向上两种构建方式。其中，所谓自顶向下构建是指借助百科类网站等结构化数据源，从高质量数据中提取本体和模式信息，加入到知识库中。所谓自底向上构建，则是借助一定的技术手段，从公开采集的数据中提取出资源模式，选择其中置信度较高的新模式，经人工审核之后，加入到知识库中。

以自顶向下的方式为例，构建知识图谱主要分为本体建模和数据获取两大部分。其中，本体(Ontology)是一种能在语义和知识层次上描述信息系统的概念模型的建模工具，属于知识图谱模式层的元素。本体主要是实现对现实世界事物的抽象化表示。在实际应用中，可以使用Protege本体构建工具，分别建立知识点(Concept)、课程(Course)、学校(School)、教师(Teacher)、以及领域(Field)五个概念类本体，并分别定义这些概念类本体的数据属性(Data property)。

其中知识点的数据属性可以包括知识点id、知识点名称以及知识点解释等；课程的数据属性可以包括课程id、课程名称、先修课程以及课程简介等；学校的数据属性可以包括学校id、学校名称等等；领域的数据属性可以包括领域id以及领域名称等。教师的数据属性可以包括教师id，教师名称以及教师简介等。

并且，还可以定义对象属性(Object property)来描述本体间的关系，如下表所示：

教学数据库的来源存在多种。例如，可以采用开源MOOCCube数据集，该数据集是面向大规模在线教育有关的自然语言处理、知识图谱、数据挖掘等研究者的开放数据仓库，包含706门真实在线课程、38,181个教学视频、114,563个概念、199,199名MOOC用户的数十万选课、视频观看记录，一个由概念间的先后修，上下位等关系的概念图谱以及包含数十万篇与课内概念有关的学术论文资源的补充资源库。

在实际应用中，若线上教育平台是某一具体领域的教育平台，则可以使用SQL语句，从整体的MOOCCube数据库中去除冗余数据，筛选出与具体领域相关的数据，来形成教学数据库。

鉴于MOOCCube数据集为json格式，因此为了便于后续的数据清洗工作，可以使用python脚本解析json格式的数据并存储至MySql数据库中。该MySql数据库中对数据结构的定义与知识图谱中定义的实体即实体间关系相对应。

有了MySql数据以及知识图谱之后，就可以使用d2rq工具作为转换工具，自动生成MySql数据库与知识图谱的映射文件，然后基于此映射文件将MySql数据库自动转换为RDF数据；RDF数据中的每项数据都使用三元组(h,r,t)来表示，其中，h和t表示实体，r表示该两个实体之前的关系，该关系实际中可用二叉树来表示。其中，d2rq工具是一个可以将传统数据库转化为三元组数据库(RDF图)的工具；RDF(Resource Description Framework，资源描述框架)是一个使用XML语法来表示的资料模型(Datamodel),用来描述资源的特性以及资源间的关系。

可选地，可以将RDF数据上传至neo4j的服务端口，使用neo4j图数据库对知识图谱进行可视化存储，得到知识图谱参见图3所示(图3仅展示了部分课程的知识图谱)。

该图3中，以数据结构、面向对象程序设计、软件体系结构三门课以及它们相关的实体为例，展示了知识图谱的一部分。其中，不同颜色和大小的圆圈分别代表课程、教师、知识点、领域以及学校。任意两个圆圈之间的连线表示这两个圆圈之间的关系，具体可以为课程知识点、任课教师、领域知识点、领域课程、学校的教师、知识点先继、知识点后继或者学校的课程。

得到RDF数据后，将RDF数据输入至TransR模型，该TransR模型即会输出每个实体对应的一维向量以及每对实体间的关系对应的一维向量。由此，便可以从TransR模型的输出中提取各知识点对应的一维向量。

知识图谱表示的经典模型包括神经张量网络模型、TransE模型、TransH模型。由于TransE和TransH模型都假设实体和关系是语义空间中的向量，因此相似的实体在同一实体空间中会非常接近，因此这两个模型均不善于处理“一对多”、“多对多”关系。然而在教育领域的知识图谱中，存在着大量的“一对多”、“多对多”关系，例如一门课程包含多门知识点、一位教师对应多门课程等等。因此，为了更好地处理这些关系，本发明实施例采用TransR模型进行知识图谱嵌入工作。

TransR模型的原理如图4所示，对于每个三元组(h,r,t)，将实体空间中的实体通过一个投影矩阵Mr投影到r关系空间中，得到投影结果h_r和t_r，该Mr的大小为[实体总数，关系类别总数]。TransR模型的这种做法可以使实际持有这种关系的实体(图4中的圆圈)彼此靠近，同时那些不持有这个关系的实体相互远离(图4中的三角)。

上述投影操作可以用公式表示为：

其中，投影矩阵Mr需要通过对TransR模型进行多次的训练才能够使投影出的实体间关系与实际的实体间关系一致。

在训练过程中，每次均基于当前设置的投影矩阵Mr执行上述投影操作，然后，使用下述公式计算投影得分：

然后，利用损失函数计算损失值，该损失函数如下：

其中，C为实际的RDF数据中的三元组，属于正样本，C'为对正样本进行一定的修改得到的负样本，例如可以对作为正样本的三元组中的任一元替换为其他数据。γ为边缘参数，用于平衡正负样本对于损失值的贡献，即正负样本对于损失值的贡献之差最多到γ就足够了。

当损失值小于设置的阈值时，得到训练完成的TransR模型，此时该TransR模型中使用的投影矩阵Mr可以看做是最佳投影矩阵，能够将实体更准确地映射到关系空间中。

使用TransR模型嵌入后，知识图谱中的每一个实体和关系均可表示为一个一维向量：

其中，该一维向量的长度为d。

得到每个知识点的一维向量后，可以计算每两个知识点之间的欧几里德距离：

其中，E_kj是区别于知识点i的另一个知识点j的一维向量

里的元素。

表示这两个知识点之间的欧几里德距离。

优选地，可以对计算得到的欧几里德距离进行归一化处理，并将所有知识点间的归一化结果存储为K×K的矩阵，以便后续与另一种类型的相似度进行融合。归一化方式如下：

基于该式可以看到，这里将归一化结果sim_sg(I_i,I_j)作为两个知识点之间的相似度。

至此，知识点语义相似度矩阵计算完毕，下面对基于协同过滤算法计算知识点被广大学习者学习的情况相似度的方式进行详细说明。

协同过滤算法是又被叫作基于用户行为的推荐算法，是推荐领域中使用最广泛的算法，其算法核心思想是仅通过用户过往交互信息挖掘出用户潜在喜欢的信息或商品，不需要预先获得用户或物品的特征值。根据用户对知识点的学习情况可以刻画用户的画像，从而为用户推荐其可能需要学习的知识点。已知共有U个学习者和K个知识点，那么可以构建一个表征学习者是否掌握知识点的矩阵R_U×K，如下所示：

该矩阵R_U×K中，每一行代表一个学习者的学习行为，每一列代表一个知识点被学习的情况。

如果两个知识点是相似的，那么学习者对其的选择情况也应当是相似的。基于项目协同过滤的推荐算法就是利用这种思想实现推荐的。根据矩阵R_U×K，可以将知识点i被所有学习者学习的情况可表示为如下向量：

I_i＝(R_1i,R_2i,......,R_Ui)^T,i∈[1,K]；

由此，可计算每两个知识点之间的余弦相似度：

计算出每两个知识点之间的余弦相似度后，可以基于这些相似度的数据构建另一个大小同样为K×K的相似度矩阵。这样，就可以将知识点语义相似度矩阵与基于协同过滤算法计算的相似度矩阵进行融合处理了。

本发明实施例提供的向学习者推荐学习路径的方法中，考虑到了知识点之间的先后继关系、学习者对众多知识点的掌握程度以及知识点之间的相似性，向学习者准确、连贯、有针对性地推荐一条完整的个性化学习路径，从而帮助学习者查漏补缺、快速、全面地掌握薄弱的知识点，提升学习效率。

其中，本发明实施例使用改进型DINA认知诊断模型来获取学习者对各项知识点的掌握程度，该改进型DINA认知诊断模型是基于学习者对教学视频的观看程度来获取学习者对各项知识点的掌握程度的，无需编制认知诊断测试卷并让学习者进行作答，使得学习者对知识点的掌握程度信息更容易获取，提高了方案的实际可行性。

并且，相较于现有的DINA认知诊断模型中将学习者对单项知识点的掌握程度处理为0或1的离散化数据，本发明实施例中使用的该改进型DINA认知诊断模型将学习者对单项知识点的掌握程度处理为0～1之间的概率值，能够更精确地对学习者的知识掌握程度进行刻画，从而提高所推荐学习路径的合理性。

基于同一发明构思，本发明实施例还提供了一种电子设备，如图5所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信，

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现上述任一种向学习者推荐学习路径的方法所述的方法步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表征，图中仅用一条粗线表征，但并不表征仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

需要说明的是，对于电子设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。此外，本领域的技术人员可以将本说明书中描述的不同实施例或示例进行接合和组合。

尽管在此结合各实施例对本申请进行了描述，然而，在实施所要求保护的本申请过程中，本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书，可理解并实现所述公开实施例的其他变化。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。