CN108875071B

CN108875071B - 一种基于多视角兴趣的学习资源推荐方法

Info

Publication number: CN108875071B
Application number: CN201810727619.0A
Authority: CN
Inventors: 刘忠宝; 李花; 张志剑; 王文杰
Original assignee: North University of China
Current assignee: North University of China
Priority date: 2018-07-05
Filing date: 2018-07-05
Publication date: 2021-03-19
Anticipated expiration: 2038-07-05
Also published as: CN108875071A

Abstract

本发明提供了一种基于多视角兴趣的学习资源推荐方法，首先浏览学习者的历史学习记录，构建特征词局部网络，然后计算学习者的四个视角兴趣，最后根据四个视角兴趣度进行学习资源推荐。本发明提供的一种基于多视角兴趣的学习资源推荐方法，从兴趣稳定性和兴趣特征两个角度分析学习者的兴趣偏好，建立基于多视角兴趣的兴趣模型，根据学习者的不同兴趣向学习者推荐其需要的资源，本发明在保证推荐准确性的同时，显著提高了推荐的多样性，能够满足学习者的真实需求。

Description

一种基于多视角兴趣的学习资源推荐方法

技术领域

本发明涉及一种基于多视角兴趣的学习资源推荐方法，属于计算机技术领域。

背景技术

面对在线学习的海量学习资源，学习者往往会陷入“资源过载”和“学习迷航”的尴尬境地。为了解决上述问题，研究人员将推荐技术引入到在线学习，试图为学习者提供个性化的学习资源。国内外学者对学习资源推荐的研究取得了一系列标志性成果，可概括为以下几类：

(1)基于内容的推荐方法。基于内容的推荐方法是学术界最早提出的一种推荐方法，它是通过学习者的特征向量同学习资源向量的匹配程度向学习者推荐学习资源。因此，该方法不受新的学习者对资源评分的限制，没有稀疏性的约束。

(2)基于协同过滤的推荐方法。协同过滤技术通过学习者-资源评分矩阵的形式表示，计算目标学习者具有相同或相似学习兴趣的学习者，然后将学习资源推荐给目标学习者。

(3)混合推荐方法。混合推荐方法是将上述两种推荐方法相结合。基于内容的推荐根据学习资源向量同学习者特征向量的匹配程度向学习者推荐相关的学习资源，因此只能推荐相似的学习资源，无法推荐优质的学习资源；基于协同过滤推荐技术存在冷启动和稀疏性问题。为了解决上述推荐方法面临的问题，研究人员提出混合推荐方法。

上述方法在实际应用中取得了较好的效果，在一定程度上满足了学习者个性化学习的需求。但这些方法往往忽略了学习者有多个兴趣点的需求。

发明内容

为了解决现有技术的不足，本发明提供了一种基于多视角兴趣的学习资源推荐方法，从兴趣稳定性和兴趣特征两个角度分析学习者的兴趣偏好，建立基于多视角兴趣的兴趣模型，根据学习者的不同兴趣向学习者推荐其需要的资源，本发明在保证推荐准确性的同时，提高了推荐的多样性，满足学习者的真实需求。

本发明为解决其技术问题所采用的技术方案是：提供了一种基于多视角兴趣的学习资源推荐方法，包括以下过程：

(1)对于学习者的历史学习记录R＝[T₁,T₂,...,T_SIZE]，SIZE为历史学习记录中学习资源的数目，设其中每一个学习资源中的一行代表一句，按照步骤(1-1)至步骤(1-3)依次浏览每个学习资源中的每一句：

(1-1)设当前浏览句为第k句，第k句的全局范围为当前浏览的学习资源T_t的第1句到第k句，第k句的局部范围为当前浏览的学习资源T_t的第k-d句到第k+d句，其中d为预设值，按照过程(1-2)至(1-3)计算特征词间的相关性；

(1-2)依次提取第k句学习资源的局部范围的特征词，计算局部范围每两个特征词w_i和w_j间的全局相关性GR_k(w_i,w_j)，全局相关性根据GR_k(w_i,w_j)＝NumS_1,k(w_i,w_j)计算得到，表示第1句到第k句中同时出现特征词w_i和w_j的句数，并根据以下公式计算每两个特征词w_i和w_j间的局部相关性LR_k,d(w_i,w_j)：

LR_k,d(w_i,w_j)＝Min(N_k,d,1)×GR_k(w_i,w_j) (1)

其中Min()表示返回较小值函数，N_k,d表示局部相关性和全局相关性的比率，根据以下公式计算：

其中NumS_x,y(w_i,w_j)表示从当前学习资源的第x句到第y句同时出现特征词w_i和w_j的句数，n表示当前学习资源的总句数；

(1-3)构建第k句的特征词局部网络LWN_k(V_k,E_k,LWI_k,LR_k,d)，其中V_k表示在局部范围内特征词的集合，每个特征词为一个节点；LWI_k表示局部范围内每个特征词的局部印象的集合，该集合中LWI_k(w_i)表示特征词w_i在局部范围内的权重W[w_i]，扫描至当前学习资源时权重W[w_i]初始值为0，扫描至第k句时，权重W[w_i]为局部范围内各句特征词w_i的数目的累加值，当权重W[w_i]大于预设值MIN时，判断特征词w_i与任意特征词的局部相关性，若特征词w_i与w_j的局部相关性LR_k,d(w_i,w_j)＞0，则特征词w_i与w_j间产生一条边，存在关联关系，特征词w_i与w_j互为邻居节点，将特征词w_j在局部范围内的权重W[w_j]利用累加公式W[w_j]＝W[w_j]+PW_Tt，k(w_i→w_j)进行赋值，特征词w_i在局部范围内的权重W[w_i]利用赋值公式W[w_i]＝W[w_i]*(1/ω)进行赋值，ω是预设的比率值，E_k表示在局部范围内边的集合；LR_k表示局部范围内每两个特征词w_i和w_j间的局部相关性的集合；所述

表示在当前学习资源T_t中扫描完第k句后，从节点w_i到邻居节点w_j的传播权重，j依次取w_i所有邻居节点序数，k的范围为当前学习资源T_t的所有句子数，采用以下公式计算：

其中W[w_i]和W[w_j]分别表示节点w_i和节点w_j的权重，ω是预设的比率值，特征词的保留比率为1/ω，特征词有1-1/ω的比率传播给它的邻居节点；

(2)计算学习者的四个视角兴趣：

(2-1)计算学习者的短期兴趣：

将每个特征词分别视为一个节点，根据以下公式计算各节点在各学习资源中的印象吞吐量：

其中

表示节点w_i在当前学习资源T_t中的印象吞吐量；根据以下公式计算各学习资源中每两个邻居特征词间的印象流量：

其中w_i和w_j是当前学习资源T_t中的任意两个节点，

表示节点w_i和节点w_j在当前学习资源T_t中的印象流量，

表示在学习资源T_t中扫描完第k句后从节点w_i到其邻居节点w_j的传播权重，用公式(3)计算得到；

根据以下公式计算每个节点的短期兴趣权重：

其中SWV(w_i)表示节点w_i的短期兴趣权重，t表示历史学习记录中的学习资源序数，Ω(t)表示兴趣衰减度，采用以下公式计算：

Ω(t)＝2/(1+λ^t-1) λ>1 (6)

其中λ表示兴趣衰减函数影响因子，为大于1的常数；

根据以下公式计算历史学习记录中每两个邻居节点的关联关系的短期兴趣权重：

其中SWV(w_i,w_j)表示节点w_i和节点w_j的关联关系的短期兴趣权重；

(2-2)计算学习者的长期兴趣：

设历史学习记录R＝[T₁,T₂,...,T_SIZE]，其中T₁为最接近当前时间的学习资源，

为节点w_i的印象吞吐量阵列，根据以下公式计算各节点的长期兴趣权重：

其中LWV(w_i)为节点w_i的长期兴趣权重，DC(Array_ITA(w_i))是Array_ITA(w_i)的分布系数；

设

为边的印象流量阵列，根据以下公式计算每两个邻居节点关联关系的长期兴趣权重：

其中LWV(w_i,w_j)表示节点w_i和节点w_j的关联关系的长期兴趣权重，DC(Array_IFA(w_i,w_j))是Array_IFA(w_i,w_j)的分布系数；

(3)根据四个视角兴趣度进行学习资源推荐：

(3-1)建立由兴趣图L表示的兴趣模型，兴趣图L包括各学习资源中每个句子的特征词局部网络中的节点和边，还包括由每个节点的短期兴趣权重组成的集合、由每两个邻居节点的关联关系的短期兴趣权重组成的集合、由各节点的长期兴趣权重组成的集合以及由每两个邻居节点的关联关系的长期兴趣权重组成的集合；对于候选学习资源池P＝[T′₁,T′₂,...,T′_size′]，SIZE′为候选学习资源池中候选学习资源的数目，计算每个候选学习资源与兴趣模型的匹配度：

Z表示兴趣图L中节点和候选学习资源T′中特征词的交集，则候选学习资源T′与兴趣模型的节点匹配度为：

其中w_i表示在Z中的第i个特征词，N是候选学习资源T′中句子的数目，T′(w_i)表示在候选学习资源T′中出现节点w_i的句子数，num表示Z中特征词的个数；若节点匹配度NMD_T′,L为短期节点匹配度，用于衡量节点短期兴趣的程度，则wv_L(w_i)表示节点w_i在兴趣图L的短期兴趣，赋值为SWV(w_i)；若节点匹配度NMD_T′,L为长期节点匹配度，用于衡量节点长期兴趣的程度，则wv_L(w_i)表示节点w_i在兴趣图L的长期兴趣，赋值为LWV(w_i)；

利用以下公式计算候选学习资源T′与兴趣模型的边匹配度：

其中w_i和w_j分别表示在Z中的第i个和第j个特征词，N是候选学习资源T′中句子的数目，T′(w_i,w_j)表示在候选学习资源T′中同时出现节点w_i和节点w_j的句子数，num表示Z中特征词的个数；若边匹配度EMD_T′,L为短期边匹配度，用于衡量边短期兴趣的程度，则we_L(w_i,w_j)表示(w_i,w_j)在兴趣图L的短期兴趣，赋值为SWE(w_i,w_j)；若边匹配度EMD_T′,L为长期边匹配度，用于衡量边长期兴趣的程度，则we_L(w_i,w_j)表示(w_i,w_j)在兴趣图L的长期兴趣，赋值为LWE(w_i,w_j)；

(3-2)学习资源推荐过程：

分别根据各候选学习资源与兴趣模型的四个基本视角兴趣度对候选学习资源池P＝[T′₁,T′₂,...,T′_size′]中的候选学习资源分别进行排序，所述四个基本视角兴趣度包括短期节点匹配度、长期节点匹配度、短期边匹配度、长期边匹配度，并从排序结果中取出其中q个组成兴趣度等级数组

1≤q≤4，通过以下公式计算候选学习资源池的综合排名Ir：

其中向量

为系数向量，满足c₁+...+c_q＝1，c₁,...,c_q∈[0,1]；

(3-3)按综合排名Ir的顺序将候选学习资源推荐给学习者。

在步骤(3)进行学习资源推荐之前，检测是否加入了新的已学习的学习资源，若是，则按照步骤(1-1)至步骤(1-3)浏览当前学习资源中的每一句，将该学习资源加入历史学习记录R，按照步骤(2)重新计算学习者的四个视角兴趣，最后按照步骤(3)进行学习资源推荐。

本发明基于其技术方案所具有的有益效果在于：

本发明一种基于多视角兴趣的学习资源推荐方法，对学习者建立了兴趣模型，包括兴趣特征和兴趣稳定性两个视角，其中兴趣特征是学习者在扫描学习资源过程中产生的，包括兴趣特征词和兴趣特征词之间的关联关系；根据学习者兴趣的稳定性，可分为短期兴趣和长期兴趣。短期兴趣和长期兴趣体现在学习者的历史学习记录中。此外，长期兴趣和短期兴趣还有两个特点：1、兴趣特征是学习者的短期兴趣同时，也是学习者的长期兴趣；2、学习者的短期兴趣和长期兴趣可以相互转化；基于学习者的兴趣特征和兴趣稳定性两个视角，从短期特征兴趣、短期关联兴趣、长期特征兴趣以及长期关联兴趣四个视角，建立基于多视角的学习者兴趣模型，根据学习者的不同兴趣向学习者推荐其需要的资源，在保证推荐准确性的同时，提高了推荐的多样性。

附图说明

图1是对比实验结果示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

本发明提供了一种基于多视角兴趣的学习资源推荐方法，包括以下过程：

(1)对于学习者的历史学习记录R＝[T₁,T₂,...,T_SIZE]，SIZE为历史学习记录中学习资源的数目，为设其中每一个学习资源中的一行代表一句，按照步骤(1-1)至步骤(1-3)依次浏览每个学习资源中的每一句：

(1-2)依次提取第k句学习资源的局部范围的特征词，计算局部范围每两个特征词w_i和w_j间的全局相关性(Global Relevancy，GR)GR_k(w_i,w_j)，GR_k(w_i,w_j)可根据现有的词频计算方法进行计算，采用GR_k(w_i,w_j)＝NumS_1,k(w_i,w_j)计算得到，表示第1句到第k句中同时出现特征词w_i和w_j的句数，并根据以下公式计算每两个特征词w_i和w_j间的局部相关性(LocalRelevancy，LR)LR_k,d(w_i,w_j)：

LR_k,d(w_i,w_j)＝Min(N_k,d,1)×GR_k(w_i,w_j) (1)

(1-3)构建第k句的特征词局部网络LWN_k(V_k,E_k,LWI_k,LR_k,d)，其中V_k表示在局部范围内特征词的集合，每个特征词为一个节点；LWI_k表示局部范围内每个特征词的局部印象的集合，该集合中LWI_k(w_i)表示特征词w_i在局部范围内的权重W[w_i]，扫描至当前学习资源时权重W[w_i]初始值为0，扫描至第k句时，权重W[w_i]为局部范围内各句特征词w_i的数目的累加值，当权重W[w_i]大于预设值MIN时，判断特征词w_i与任意特征词的局部相关性，若特征词w_i与w_j的局部相关性LR_k,d(w_i,w_j)＞0，则特征词w_i与w_j间产生一条边，存在关联关系，特征词w_i与w_j互为邻居节点，将特征词w_j在局部范围内的权重W[w_j]利用累加公式

进行赋值，特征词w_i在局部范围内的权重W[w_i]利用赋值公式W[w_i]＝W[w_i]*(1/ω)进行赋值，ω是预设的比率值，MIN可设置为2，E_k表示在局部范围内边的集合；LR_k表示局部范围内每两个特征词w_i和w_j间的局部相关性的集合；所述

其中W[w_i]和W[w_j]分别表示节点w_i和节点w_j的权重，MIN为预设的阈值，ω是预设的比率值，可设置为2，特征词的保留比率为1/ω，特征词有1-1/ω的比率传播给它的邻居节点；

兴趣特征词间的关联过程在构建特征词的局部网络中完成。特征词间的局部印象取决于特征词间的局部相关性，相关性越大，印象越大。两个节点的印象传播量由两个因素决定：(1)节点w_i传递的印象量；(2)节点w_i和w_j的局部相关性与节点w_i和其他邻居节点间的局部相关性之间的比率。

(2)计算学习者的四个视角兴趣：

(2-1)计算学习者的短期兴趣：

学习者的短期兴趣的权重考虑了累计假设和近邻分布假设。

累积假设需要特征词和关联关系的排名。如果通过特征词或关联传播的印象较大，则表明特征词或关联对于学习资源是重要的，具有高的等级。本发明提出两个概念来衡量特征词和关联的等级：一个是印象吞吐量(Impression Throughout Amount，ITA)，特征词的印象吞吐量则是通过特征词在扫描完该学习资源后印象传播量的总和。

其中

表示节点w_i在当前学习资源T_t中的印象吞吐量；

另一个是印象流量(Impression Flow Amount，IFA)，关联关系的印象流量是扫描完一个学习资源后，对应的两个特征词间的印象传播量的总和。

根据以下公式计算各学习资源中每两个邻居特征词间的印象流量：

其中w_i和w_j是当前学习资源T_t中的任意两个节点，

表示节点w_i和节点w_j在当前学习资源T_t中的印象流量，

根据以下公式计算每个节点的短期兴趣权重：

Ω(t)＝2/(1+λ^t-1) λ>1 (6)

其中λ表示兴趣衰减函数影响因子，为大于1的常数，可以设置为1.15；衰减函数用于实现近邻分布假设，出现在较近学习资源中的兴趣特征被赋予较高的权重。

其中SWV(w_i,w_j)表示节点w_i和节点w_j的关联关系的短期兴趣权重。

根据累积假设和近邻分布假设，节点w_i的短期兴趣SWV(w_i)的权重为节点的印象吞吐量和衰减函数Ω(t)的结合。权重越大，说明特征词的短期兴趣越高。

关联关系的短期兴趣的权重SWE(w₁,w₂)为关联关系的印象流量和衰减函数的结合。权重越大，说明关联关系的短期兴趣越高。

(2-2)计算学习者的长期兴趣：

学习者长期兴趣的权重考虑了累积假设和广泛分布假设。其中，累积假设的计算方式与短期兴趣的累积假设一样。

广泛分布假设通过一个分布系数(Distributing Coefficient，DC)来衡量兴趣特征在历史学习记录中均匀分布的程度。分布系数的计算采用ITA(或IFA)作为输入，对于由正值和0组成的数组，如果连续的零和非零序列的数量相对较大并且序列的长度相对较小，则正值是均匀分布的，兴趣特征均匀分布在学习者的历史学习资源中。本文给出两个概念来描述这两个序列：①间隙阵列(Gap Array，GA)，对于一个由正值和0组成的数组Q，数组Q的间隙阵列QA(g₁,g₂,…,g_m)，g_i表示间隙阵列QA中第i个连续的0的数量，QA(Q,i)表示间隙阵列中的第i个元素的值；②反间隙矩阵(Inverse Gap Array，～GA)，数组Q的反间隙阵列～QA(g₁,g₂,…,g_m)，g_i表示间隙阵列QA中第i个连续的非0的数量，～QA(Q,i)表示间隙阵列中的第i个元素的值。数组Q的分布系数计算公式如下：

其中，m＞n＞1，0＜a＜1，a为一个系数，N为数组Q中元素的数量。由于分布系数是为了描述正值的均匀分布程度，因此间隙阵列在计算中起着比反向间隙阵列更重要的作用，所以m＞n。如果序列数量增加或序列长度减少，则分布系数会增大。

根据分布系数与累积假设，节点和边的长期兴趣计算为：

其中LWV(w_i)为节点w_i的长期兴趣权重，DC(Array_ITA(w_i))是Array_ITA(w_i)的分布系数，

反映了累计假设；各节点w_i的长期兴趣权重为分配系数DC(Array_ITA(w_i))和累积假设

的结合，权重越大，兴趣度越高。

同理，边的长期兴趣为分配系数DC(Array_IFA(w_i,w_j))和累积假设

的结合，权重越大，兴趣度越高。

设

(3)根据四个视角兴趣度进行学习资源推荐：

(3-1)建立由兴趣图L表示的兴趣模型，兴趣图L包括各学习资源中每个句子的特征词局部网络中的节点和边，还包括由每个节点的短期兴趣权重组成的集合、由每两个邻居节点的关联关系的短期兴趣权重组成的集合、由各节点的长期兴趣权重组成的集合以及由每两个邻居节点的关联关系的长期兴趣权重组成的集合；对于候选学习资源池P＝[T′₁,T′₂,...,T′_size′]，计算每个候选学习资源与兴趣模型的匹配度：

其中w_i表示在Z中的第i个特征词，N是候选学习资源T′中句子的数目，T′(w_i)表示在候选学习资源T′中出现节点w_i的句子数，num表示Z中特征词的个数；若节点匹配度NMD_T′,L为短期节点匹配度，用于衡量节点短期兴趣的程度，则wv_L(w_i)表示节点w_i在兴趣图L的短期兴趣，赋值为SWV(w_i)；若节点匹配度NMD_T′,L为长期节点匹配度，用于衡量节点长期兴趣的程度，则wv_L(w_i)表示节点w_i在兴趣图L的长期兴趣，赋值为LWV(w_i)；N的出现是为了避免学习资源有较高的节点匹配度。

利用以下公式计算候选学习资源T′与兴趣模型的边匹配度：

(3-2)学习资源推荐过程：

分别根据各候选学习资源与兴趣模型的四个基本视角兴趣度对候选学习资源池P＝[T′₁,T′₂,...,T′_size′]中的候选学习资源分别进行排序，SIZE′为候选学习资源池中候选学习资源的数目，所述四个基本视角兴趣度包括短期节点匹配度、长期节点匹配度、短期边匹配度、长期边匹配度，并从排序结果中取出其中q个组成兴趣度等级数组

1≤q≤4，通过以下公式计算候选学习资源池的综合排名Ir：

其中向量

为系数向量，满足c₁+...+c_q＝1，c₁,...,c_q∈[0,1]；

(3-3)按综合排名Ir的顺序将候选学习资源推荐给学习者。

四个视角兴趣的更新：

如果兴趣特征在现有的兴趣图谱中没有出现过，则会从新的学习资源中提取特征词和关联关系并将其添加到兴趣图谱中。短期权重的计算考虑了累积假设和邻近分布假设。长期权重的计算考虑了累积假设和广泛分布假设。扫描完一个学习资源后，之前的权重将被更新。更新过程将传入的学习资源作为输入，并且不需要重新计算历史学习记录中以前的学习资源。在扫描传入学习资源之前，可以给定兴趣图谱中的特征词(或关联))，如果传入学习资源包含兴趣图谱中的特征词(或关联关系)，则将传入学习资源获得的特征词(或关联关系)的权重累积到前一个权重。每个节点或每条边的两个权重分别表示节点或边的短期兴趣和长期兴趣。较大的权重反映了较强的短期兴趣或长期兴趣。

通过上述方法建立学习者的兴趣模型，在该模型中随着学习资源越来越多，不断更新学习者的兴趣模型，最后形成一个比较稳定的兴趣图谱。接下来可以根据该模型建立推荐机制。

本发明采用中北大学软件学院300个学习者的数据，通过服务器获取每个学习者的学习资源日志，随机选取50个主题和500个学习资源，每个主题包含10个作为研究对象。将数据分为两类：一类是训练集，另一类是测试集。通过与基于内容的推荐算法和引入时间的基于内容的推荐算法比较，来验证所提出的基于多视角的学习资源推荐算法的有效性。

(1)实验基于每个视角的兴趣推荐

取推荐列表前20的学习资源，实验结果如图1所示。可以看出，与基于内容的推荐方法和引入时间的基于内容的推荐方法相比，本文提出的基于多视角的推荐方法匹配度显著提高。由于基于学习者兴趣特征词的推荐方法与基于内容的推荐方法类似，所以基于内容兴趣推荐方法优势不是很大。但是，基于特征词关联兴趣的推荐方法的匹配度明显高于基于内容的推荐方法，进一步表明，基于特征词关联兴趣的推荐方法能更好地向学习者推荐其最感兴趣的学习资源。

(2)实验采用中北大学软件学院的数据集作为实验数据集。从50个主题中随机选取12个主题。其中，

表示从第m个主题中选取n个学习资源。以下为学习者的4个部分历史学习记录：

假设学习资源出现在一个部分历史记录中，它就不会出现在另一个部分学习记录中。将部分历史记录合并成一个整体历史记录，为PRH₁→PRH₂→PRH₃→PRH₄。其中，PRH₄最接近当前时间，通过扫描整个历史学习记录来获得兴趣图，在T₇，T₈中的特征词是学习者近期最感兴趣的特征词，并且之前从未出现过。所以T₇，T₈中的学习资源是满足短期特征兴趣的新信息。

从T₇，T₈的每个主题中，随机选取其中的3个学习资源(共24个学习资源)。从T₉，T₁₂的每个主题中选取剩余的3个学习资源(共12个学习资源)。36(24+12)个学习资源组成测试集。根据满足短期特征兴趣的新学习资源的匹配度的组合，i(i＝6，12)个学习资源从测试集中被推荐。系数向量的设置如表1(a)-(c)所示。实验用三个不同的部分历史学习顺序进行三次，并计算三个不同顺序的推荐结果的平均值。根据短期兴趣的组合，其预期结果如下：

①如果在表1中系数向量为默认的(a)，那么期望推荐结果应属于T₇，T₈，因为在T₇，T₈的学习资源越接近当前时间。除T₇、T₈外，推荐结果应该大部分属于T₅、T₆和T₁₂，因为该三个主题的学习资源与该视角第二最密切。

②如果在表1中系数向量为(b)，那么期望推荐结果与PRH₄中的内容最相关。所以，与表1(a)相比，结果除T₇、T₈外，推荐结果应更多分布在T₉～T₁₂。其中，CV₁表示学习者对于短期关联兴趣，更喜欢短期内容兴趣的学习资源。

③如果在表1中系数向量为(c)，那么期望推荐结果应该与不是长期感兴趣的内容更相关。所以，与表1(a)相比，结果除T₇、T₈外，推荐结果应更多分布在T₁～T₆。其中，CV₂表示学习者对于短期内容兴趣，更喜欢内容关联兴趣的学习资源。

表1基于短期内容兴趣与短期关联兴趣推荐的实验结果

从表1可以看出，平均值Avg与期望结果相符。因此，基于多视角兴趣模型可以很好地处理涉及短期特征词兴趣和关联兴趣的学习资源。此外，改变系数向量为学习者推荐其感兴趣的学习资源。

(3)实验基于多个视角的推荐与常用的基于内容的推荐相结合进行推荐

实验结合方法有以下四种(CBM表示基于内容的推荐，SF表示短期特征兴趣，LF表示长期特征兴趣，SL表示短期关联兴趣，LL表示长期关联兴趣)，u＝5，实验结果如表2所示。其中，CBM-1为基本方法，(CBM+AIM)-2包含兴趣特征词的兴趣，(CBM+AIM)-3引入了特征词间关联关系的兴趣，(CBM+AIM)-4包含了这两个视角的兴趣。

CBM-1：所有的学习资源来自CBM。

(CBM+AIM)-2：1/u的学习资源来自SF+1/u的学习资源来自LF+剩下的学习资源来自CBM。

(CBM+AIM)-3：1/u的学习资源来自SL+1/u的学习资源来自LL+剩下的学习资源来自CBM。

(CBM+AIM)-4：1/2u的学习资源来自SF+1/2u的学习资源来自LF+1/2u的学习资源来自SL+1/2u的学习资源来自LL+剩下的学习资源来自CBM。

表2准确率和召回率

从表2可以看出，随着推荐列表数的增加，准确率降低，召回率增加。基于内容的推荐算法与基于兴趣特征词的推荐算法相似，其准确率几乎相等，没有任何优势。此外，(CBM+AIM)-3比(CBM+AIM)-2的准确率更高，说明对引入关联关系的兴趣比引入特征词的兴趣做出了更大的改进，同时推荐一些学习资源。随着推荐列表的增多，改进的效果变弱，究其原因是学习者对关联兴趣比兴趣特征词要少。

综合上述实验结果，本发明提供的一种基于多视角兴趣的学习资源推荐方法，从兴趣稳定性和兴趣特征两个角度分析学习者的兴趣偏好，建立基于多视角兴趣的兴趣模型，根据学习者的不同兴趣向学习者推荐其需要的资源，本发明在保证推荐准确性的同时，显著提高了推荐的多样性。

Claims

1.一种基于多视角兴趣的学习资源推荐方法，其特征在于包括以下过程：

LR_k,d(w_i,w_j)＝Min(N_k,d,1)×GR_k(w_i,w_j) (1)

进行赋值，特征词w_i在局部范围内的权重W[w_i]利用赋值公式W[w_i]＝W[w_i]*(1/ω)进行赋值，ω是预设的比率值，E_k表示在局部范围内边的集合；LR_k表示局部范围内每两个特征词w_i和w_j间的局部相关性的集合；所述

(2)计算学习者的四个视角兴趣：

(2-1)计算学习者的短期兴趣：

其中

表示节点w_i在当前学习资源T_t中的印象吞吐量；

其中w_i和w_j是当前学习资源T_t中的任意两个节点，

表示节点w_i和节点w_j在当前学习资源T_t中的印象流量，

根据以下公式计算每个节点的短期兴趣权重：

Ω(t)＝2/(1+λ^t-1) λ>1 (6)

其中λ表示兴趣衰减函数影响因子，为大于1的常数；

(2-2)计算学习者的长期兴趣：

设

(3)根据四个视角兴趣度进行学习资源推荐：

利用以下公式计算候选学习资源T′与兴趣模型的边匹配度：

(3-2)学习资源推荐过程：

通过以下公式计算候选学习资源池的综合排名Ir：

其中向量

为系数向量，满足c₁+...+c_q＝1，c₁,...,c_q∈[0,1]；

(3-3)按综合排名Ir的顺序将候选学习资源推荐给学习者。

2.根据权利要求1所述的基于多视角兴趣的学习资源推荐方法，其特征在于：在步骤(3)进行学习资源推荐之前，检测是否加入了新的已学习的学习资源，若是，则按照步骤(1-1)至步骤(1-3)浏览当前学习资源中的每一句，将该学习资源加入历史学习记录R，按照步骤(2)重新计算学习者的四个视角兴趣，最后按照步骤(3)进行学习资源推荐。