CN108875071B - 一种基于多视角兴趣的学习资源推荐方法 - Google Patents

一种基于多视角兴趣的学习资源推荐方法 Download PDF

Info

Publication number
CN108875071B
CN108875071B CN201810727619.0A CN201810727619A CN108875071B CN 108875071 B CN108875071 B CN 108875071B CN 201810727619 A CN201810727619 A CN 201810727619A CN 108875071 B CN108875071 B CN 108875071B
Authority
CN
China
Prior art keywords
interest
node
learning
term
learning resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810727619.0A
Other languages
English (en)
Other versions
CN108875071A (zh
Inventor
刘忠宝
李花
张志剑
王文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North University of China
Original Assignee
North University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North University of China filed Critical North University of China
Priority to CN201810727619.0A priority Critical patent/CN108875071B/zh
Publication of CN108875071A publication Critical patent/CN108875071A/zh
Application granted granted Critical
Publication of CN108875071B publication Critical patent/CN108875071B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于多视角兴趣的学习资源推荐方法,首先浏览学习者的历史学习记录,构建特征词局部网络,然后计算学习者的四个视角兴趣,最后根据四个视角兴趣度进行学习资源推荐。本发明提供的一种基于多视角兴趣的学习资源推荐方法,从兴趣稳定性和兴趣特征两个角度分析学习者的兴趣偏好,建立基于多视角兴趣的兴趣模型,根据学习者的不同兴趣向学习者推荐其需要的资源,本发明在保证推荐准确性的同时,显著提高了推荐的多样性,能够满足学习者的真实需求。

Description

一种基于多视角兴趣的学习资源推荐方法
技术领域
本发明涉及一种基于多视角兴趣的学习资源推荐方法,属于计算机技术领域。
背景技术
面对在线学习的海量学习资源,学习者往往会陷入“资源过载”和“学习迷航”的尴尬境地。为了解决上述问题,研究人员将推荐技术引入到在线学习,试图为学习者提供个性化的学习资源。国内外学者对学习资源推荐的研究取得了一系列标志性成果,可概括为以下几类:
(1)基于内容的推荐方法。基于内容的推荐方法是学术界最早提出的一种推荐方法,它是通过学习者的特征向量同学习资源向量的匹配程度向学习者推荐学习资源。因此,该方法不受新的学习者对资源评分的限制,没有稀疏性的约束。
(2)基于协同过滤的推荐方法。协同过滤技术通过学习者-资源评分矩阵的形式表示,计算目标学习者具有相同或相似学习兴趣的学习者,然后将学习资源推荐给目标学习者。
(3)混合推荐方法。混合推荐方法是将上述两种推荐方法相结合。基于内容的推荐根据学习资源向量同学习者特征向量的匹配程度向学习者推荐相关的学习资源,因此只能推荐相似的学习资源,无法推荐优质的学习资源;基于协同过滤推荐技术存在冷启动和稀疏性问题。为了解决上述推荐方法面临的问题,研究人员提出混合推荐方法。
上述方法在实际应用中取得了较好的效果,在一定程度上满足了学习者个性化学习的需求。但这些方法往往忽略了学习者有多个兴趣点的需求。
发明内容
为了解决现有技术的不足,本发明提供了一种基于多视角兴趣的学习资源推荐方法,从兴趣稳定性和兴趣特征两个角度分析学习者的兴趣偏好,建立基于多视角兴趣的兴趣模型,根据学习者的不同兴趣向学习者推荐其需要的资源,本发明在保证推荐准确性的同时,提高了推荐的多样性,满足学习者的真实需求。
本发明为解决其技术问题所采用的技术方案是:提供了一种基于多视角兴趣的学习资源推荐方法,包括以下过程:
(1)对于学习者的历史学习记录R=[T1,T2,...,TSIZE],SIZE为历史学习记录中学习资源的数目,设其中每一个学习资源中的一行代表一句,按照步骤(1-1)至步骤(1-3)依次浏览每个学习资源中的每一句:
(1-1)设当前浏览句为第k句,第k句的全局范围为当前浏览的学习资源Tt的第1句到第k句,第k句的局部范围为当前浏览的学习资源Tt的第k-d句到第k+d句,其中d为预设值,按照过程(1-2)至(1-3)计算特征词间的相关性;
(1-2)依次提取第k句学习资源的局部范围的特征词,计算局部范围每两个特征词wi和wj间的全局相关性GRk(wi,wj),全局相关性根据GRk(wi,wj)=NumS1,k(wi,wj)计算得到,表示第1句到第k句中同时出现特征词wi和wj的句数,并根据以下公式计算每两个特征词wi和wj间的局部相关性LRk,d(wi,wj):
LRk,d(wi,wj)=Min(Nk,d,1)×GRk(wi,wj) (1)
其中Min()表示返回较小值函数,Nk,d表示局部相关性和全局相关性的比率,根据以下公式计算:
Figure GDA0002922888110000021
其中NumSx,y(wi,wj)表示从当前学习资源的第x句到第y句同时出现特征词wi和wj的句数,n表示当前学习资源的总句数;
(1-3)构建第k句的特征词局部网络LWNk(Vk,Ek,LWIk,LRk,d),其中Vk表示在局部范围内特征词的集合,每个特征词为一个节点;LWIk表示局部范围内每个特征词的局部印象的集合,该集合中LWIk(wi)表示特征词wi在局部范围内的权重W[wi],扫描至当前学习资源时权重W[wi]初始值为0,扫描至第k句时,权重W[wi]为局部范围内各句特征词wi的数目的累加值,当权重W[wi]大于预设值MIN时,判断特征词wi与任意特征词的局部相关性,若特征词wi与wj的局部相关性LRk,d(wi,wj)>0,则特征词wi与wj间产生一条边,存在关联关系,特征词wi与wj互为邻居节点,将特征词wj在局部范围内的权重W[wj]利用累加公式W[wj]=W[wj]+PWTt,k(wi→wj)进行赋值,特征词wi在局部范围内的权重W[wi]利用赋值公式W[wi]=W[wi]*(1/ω)进行赋值,ω是预设的比率值,Ek表示在局部范围内边的集合;LRk表示局部范围内每两个特征词wi和wj间的局部相关性的集合;所述
Figure GDA0002922888110000031
表示在当前学习资源Tt中扫描完第k句后,从节点wi到邻居节点wj的传播权重,j依次取wi所有邻居节点序数,k的范围为当前学习资源Tt的所有句子数,采用以下公式计算:
Figure GDA0002922888110000032
其中W[wi]和W[wj]分别表示节点wi和节点wj的权重,ω是预设的比率值,特征词的保留比率为1/ω,特征词有1-1/ω的比率传播给它的邻居节点;
(2)计算学习者的四个视角兴趣:
(2-1)计算学习者的短期兴趣:
将每个特征词分别视为一个节点,根据以下公式计算各节点在各学习资源中的印象吞吐量:
Figure GDA0002922888110000033
其中
Figure GDA0002922888110000034
表示节点wi在当前学习资源Tt中的印象吞吐量;根据以下公式计算各学习资源中每两个邻居特征词间的印象流量:
Figure GDA0002922888110000035
其中wi和wj是当前学习资源Tt中的任意两个节点,
Figure GDA0002922888110000036
表示节点wi和节点wj在当前学习资源Tt中的印象流量,
Figure GDA0002922888110000037
表示在学习资源Tt中扫描完第k句后从节点wi到其邻居节点wj的传播权重,用公式(3)计算得到;
根据以下公式计算每个节点的短期兴趣权重:
Figure GDA0002922888110000038
其中SWV(wi)表示节点wi的短期兴趣权重,t表示历史学习记录中的学习资源序数,Ω(t)表示兴趣衰减度,采用以下公式计算:
Ω(t)=2/(1+λt-1) λ>1 (6)
其中λ表示兴趣衰减函数影响因子,为大于1的常数;
根据以下公式计算历史学习记录中每两个邻居节点的关联关系的短期兴趣权重:
Figure GDA0002922888110000041
其中SWV(wi,wj)表示节点wi和节点wj的关联关系的短期兴趣权重;
(2-2)计算学习者的长期兴趣:
设历史学习记录R=[T1,T2,...,TSIZE],其中T1为最接近当前时间的学习资源,
Figure GDA0002922888110000042
为节点wi的印象吞吐量阵列,根据以下公式计算各节点的长期兴趣权重:
Figure GDA0002922888110000043
其中LWV(wi)为节点wi的长期兴趣权重,DC(Array_ITA(wi))是Array_ITA(wi)的分布系数;
Figure GDA0002922888110000044
为边的印象流量阵列,根据以下公式计算每两个邻居节点关联关系的长期兴趣权重:
Figure GDA0002922888110000045
其中LWV(wi,wj)表示节点wi和节点wj的关联关系的长期兴趣权重,DC(Array_IFA(wi,wj))是Array_IFA(wi,wj)的分布系数;
(3)根据四个视角兴趣度进行学习资源推荐:
(3-1)建立由兴趣图L表示的兴趣模型,兴趣图L包括各学习资源中每个句子的特征词局部网络中的节点和边,还包括由每个节点的短期兴趣权重组成的集合、由每两个邻居节点的关联关系的短期兴趣权重组成的集合、由各节点的长期兴趣权重组成的集合以及由每两个邻居节点的关联关系的长期兴趣权重组成的集合;对于候选学习资源池P=[T′1,T′2,...,T′size′],SIZE′为候选学习资源池中候选学习资源的数目,计算每个候选学习资源与兴趣模型的匹配度:
Z表示兴趣图L中节点和候选学习资源T′中特征词的交集,则候选学习资源T′与兴趣模型的节点匹配度为:
Figure GDA0002922888110000051
其中wi表示在Z中的第i个特征词,N是候选学习资源T′中句子的数目,T′(wi)表示在候选学习资源T′中出现节点wi的句子数,num表示Z中特征词的个数;若节点匹配度NMDT′,L为短期节点匹配度,用于衡量节点短期兴趣的程度,则wvL(wi)表示节点wi在兴趣图L的短期兴趣,赋值为SWV(wi);若节点匹配度NMDT′,L为长期节点匹配度,用于衡量节点长期兴趣的程度,则wvL(wi)表示节点wi在兴趣图L的长期兴趣,赋值为LWV(wi);
利用以下公式计算候选学习资源T′与兴趣模型的边匹配度:
Figure GDA0002922888110000052
其中wi和wj分别表示在Z中的第i个和第j个特征词,N是候选学习资源T′中句子的数目,T′(wi,wj)表示在候选学习资源T′中同时出现节点wi和节点wj的句子数,num表示Z中特征词的个数;若边匹配度EMDT′,L为短期边匹配度,用于衡量边短期兴趣的程度,则weL(wi,wj)表示(wi,wj)在兴趣图L的短期兴趣,赋值为SWE(wi,wj);若边匹配度EMDT′,L为长期边匹配度,用于衡量边长期兴趣的程度,则weL(wi,wj)表示(wi,wj)在兴趣图L的长期兴趣,赋值为LWE(wi,wj);
(3-2)学习资源推荐过程:
分别根据各候选学习资源与兴趣模型的四个基本视角兴趣度对候选学习资源池P=[T′1,T′2,...,T′size′]中的候选学习资源分别进行排序,所述四个基本视角兴趣度包括短期节点匹配度、长期节点匹配度、短期边匹配度、长期边匹配度,并从排序结果中取出其中q个组成兴趣度等级数组
Figure GDA0002922888110000061
1≤q≤4,通过以下公式计算候选学习资源池的综合排名Ir:
Figure GDA0002922888110000062
其中向量
Figure GDA0002922888110000063
为系数向量,满足c1+...+cq=1,c1,...,cq∈[0,1];
(3-3)按综合排名Ir的顺序将候选学习资源推荐给学习者。
在步骤(3)进行学习资源推荐之前,检测是否加入了新的已学习的学习资源,若是,则按照步骤(1-1)至步骤(1-3)浏览当前学习资源中的每一句,将该学习资源加入历史学习记录R,按照步骤(2)重新计算学习者的四个视角兴趣,最后按照步骤(3)进行学习资源推荐。
本发明基于其技术方案所具有的有益效果在于:
本发明一种基于多视角兴趣的学习资源推荐方法,对学习者建立了兴趣模型,包括兴趣特征和兴趣稳定性两个视角,其中兴趣特征是学习者在扫描学习资源过程中产生的,包括兴趣特征词和兴趣特征词之间的关联关系;根据学习者兴趣的稳定性,可分为短期兴趣和长期兴趣。短期兴趣和长期兴趣体现在学习者的历史学习记录中。此外,长期兴趣和短期兴趣还有两个特点:1、兴趣特征是学习者的短期兴趣同时,也是学习者的长期兴趣;2、学习者的短期兴趣和长期兴趣可以相互转化;基于学习者的兴趣特征和兴趣稳定性两个视角,从短期特征兴趣、短期关联兴趣、长期特征兴趣以及长期关联兴趣四个视角,建立基于多视角的学习者兴趣模型,根据学习者的不同兴趣向学习者推荐其需要的资源,在保证推荐准确性的同时,提高了推荐的多样性。
附图说明
图1是对比实验结果示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
本发明提供了一种基于多视角兴趣的学习资源推荐方法,包括以下过程:
(1)对于学习者的历史学习记录R=[T1,T2,...,TSIZE],SIZE为历史学习记录中学习资源的数目,为设其中每一个学习资源中的一行代表一句,按照步骤(1-1)至步骤(1-3)依次浏览每个学习资源中的每一句:
(1-1)设当前浏览句为第k句,第k句的全局范围为当前浏览的学习资源Tt的第1句到第k句,第k句的局部范围为当前浏览的学习资源Tt的第k-d句到第k+d句,其中d为预设值,按照过程(1-2)至(1-3)计算特征词间的相关性;
(1-2)依次提取第k句学习资源的局部范围的特征词,计算局部范围每两个特征词wi和wj间的全局相关性(Global Relevancy,GR)GRk(wi,wj),GRk(wi,wj)可根据现有的词频计算方法进行计算,采用GRk(wi,wj)=NumS1,k(wi,wj)计算得到,表示第1句到第k句中同时出现特征词wi和wj的句数,并根据以下公式计算每两个特征词wi和wj间的局部相关性(LocalRelevancy,LR)LRk,d(wi,wj):
LRk,d(wi,wj)=Min(Nk,d,1)×GRk(wi,wj) (1)
其中Min()表示返回较小值函数,Nk,d表示局部相关性和全局相关性的比率,根据以下公式计算:
Figure GDA0002922888110000071
其中NumSx,y(wi,wj)表示从当前学习资源的第x句到第y句同时出现特征词wi和wj的句数,n表示当前学习资源的总句数;
(1-3)构建第k句的特征词局部网络LWNk(Vk,Ek,LWIk,LRk,d),其中Vk表示在局部范围内特征词的集合,每个特征词为一个节点;LWIk表示局部范围内每个特征词的局部印象的集合,该集合中LWIk(wi)表示特征词wi在局部范围内的权重W[wi],扫描至当前学习资源时权重W[wi]初始值为0,扫描至第k句时,权重W[wi]为局部范围内各句特征词wi的数目的累加值,当权重W[wi]大于预设值MIN时,判断特征词wi与任意特征词的局部相关性,若特征词wi与wj的局部相关性LRk,d(wi,wj)>0,则特征词wi与wj间产生一条边,存在关联关系,特征词wi与wj互为邻居节点,将特征词wj在局部范围内的权重W[wj]利用累加公式
Figure GDA0002922888110000081
进行赋值,特征词wi在局部范围内的权重W[wi]利用赋值公式W[wi]=W[wi]*(1/ω)进行赋值,ω是预设的比率值,MIN可设置为2,Ek表示在局部范围内边的集合;LRk表示局部范围内每两个特征词wi和wj间的局部相关性的集合;所述
Figure GDA0002922888110000082
表示在当前学习资源Tt中扫描完第k句后,从节点wi到邻居节点wj的传播权重,j依次取wi所有邻居节点序数,k的范围为当前学习资源Tt的所有句子数,采用以下公式计算:
Figure GDA0002922888110000083
其中W[wi]和W[wj]分别表示节点wi和节点wj的权重,MIN为预设的阈值,ω是预设的比率值,可设置为2,特征词的保留比率为1/ω,特征词有1-1/ω的比率传播给它的邻居节点;
兴趣特征词间的关联过程在构建特征词的局部网络中完成。特征词间的局部印象取决于特征词间的局部相关性,相关性越大,印象越大。两个节点的印象传播量由两个因素决定:(1)节点wi传递的印象量;(2)节点wi和wj的局部相关性与节点wi和其他邻居节点间的局部相关性之间的比率。
(2)计算学习者的四个视角兴趣:
(2-1)计算学习者的短期兴趣:
学习者的短期兴趣的权重考虑了累计假设和近邻分布假设。
累积假设需要特征词和关联关系的排名。如果通过特征词或关联传播的印象较大,则表明特征词或关联对于学习资源是重要的,具有高的等级。本发明提出两个概念来衡量特征词和关联的等级:一个是印象吞吐量(Impression Throughout Amount,ITA),特征词的印象吞吐量则是通过特征词在扫描完该学习资源后印象传播量的总和。
将每个特征词分别视为一个节点,根据以下公式计算各节点在各学习资源中的印象吞吐量:
Figure GDA0002922888110000084
其中
Figure GDA0002922888110000085
表示节点wi在当前学习资源Tt中的印象吞吐量;
另一个是印象流量(Impression Flow Amount,IFA),关联关系的印象流量是扫描完一个学习资源后,对应的两个特征词间的印象传播量的总和。
根据以下公式计算各学习资源中每两个邻居特征词间的印象流量:
Figure GDA0002922888110000091
其中wi和wj是当前学习资源Tt中的任意两个节点,
Figure GDA0002922888110000092
表示节点wi和节点wj在当前学习资源Tt中的印象流量,
Figure GDA0002922888110000093
表示在学习资源Tt中扫描完第k句后从节点wi到其邻居节点wj的传播权重,用公式(3)计算得到;
根据以下公式计算每个节点的短期兴趣权重:
Figure GDA0002922888110000094
其中SWV(wi)表示节点wi的短期兴趣权重,t表示历史学习记录中的学习资源序数,Ω(t)表示兴趣衰减度,采用以下公式计算:
Ω(t)=2/(1+λt-1) λ>1 (6)
其中λ表示兴趣衰减函数影响因子,为大于1的常数,可以设置为1.15;衰减函数用于实现近邻分布假设,出现在较近学习资源中的兴趣特征被赋予较高的权重。
根据以下公式计算历史学习记录中每两个邻居节点的关联关系的短期兴趣权重:
Figure GDA0002922888110000095
其中SWV(wi,wj)表示节点wi和节点wj的关联关系的短期兴趣权重。
根据累积假设和近邻分布假设,节点wi的短期兴趣SWV(wi)的权重为节点的印象吞吐量和衰减函数Ω(t)的结合。权重越大,说明特征词的短期兴趣越高。
关联关系的短期兴趣的权重SWE(w1,w2)为关联关系的印象流量和衰减函数的结合。权重越大,说明关联关系的短期兴趣越高。
(2-2)计算学习者的长期兴趣:
学习者长期兴趣的权重考虑了累积假设和广泛分布假设。其中,累积假设的计算方式与短期兴趣的累积假设一样。
广泛分布假设通过一个分布系数(Distributing Coefficient,DC)来衡量兴趣特征在历史学习记录中均匀分布的程度。分布系数的计算采用ITA(或IFA)作为输入,对于由正值和0组成的数组,如果连续的零和非零序列的数量相对较大并且序列的长度相对较小,则正值是均匀分布的,兴趣特征均匀分布在学习者的历史学习资源中。本文给出两个概念来描述这两个序列:①间隙阵列(Gap Array,GA),对于一个由正值和0组成的数组Q,数组Q的间隙阵列QA(g1,g2,…,gm),gi表示间隙阵列QA中第i个连续的0的数量,QA(Q,i)表示间隙阵列中的第i个元素的值;②反间隙矩阵(Inverse Gap Array,~GA),数组Q的反间隙阵列~QA(g1,g2,…,gm),gi表示间隙阵列QA中第i个连续的非0的数量,~QA(Q,i)表示间隙阵列中的第i个元素的值。数组Q的分布系数计算公式如下:
Figure GDA0002922888110000101
其中,m>n>1,0<a<1,a为一个系数,N为数组Q中元素的数量。由于分布系数是为了描述正值的均匀分布程度,因此间隙阵列在计算中起着比反向间隙阵列更重要的作用,所以m>n。如果序列数量增加或序列长度减少,则分布系数会增大。
根据分布系数与累积假设,节点和边的长期兴趣计算为:
设历史学习记录R=[T1,T2,...,TSIZE],其中T1为最接近当前时间的学习资源,
Figure GDA0002922888110000102
为节点wi的印象吞吐量阵列,根据以下公式计算各节点的长期兴趣权重:
Figure GDA0002922888110000103
其中LWV(wi)为节点wi的长期兴趣权重,DC(Array_ITA(wi))是Array_ITA(wi)的分布系数,
Figure GDA0002922888110000104
反映了累计假设;各节点wi的长期兴趣权重为分配系数DC(Array_ITA(wi))和累积假设
Figure GDA0002922888110000105
的结合,权重越大,兴趣度越高。
同理,边的长期兴趣为分配系数DC(Array_IFA(wi,wj))和累积假设
Figure GDA0002922888110000111
的结合,权重越大,兴趣度越高。
Figure GDA0002922888110000112
为边的印象流量阵列,根据以下公式计算每两个邻居节点关联关系的长期兴趣权重:
Figure GDA0002922888110000113
其中LWV(wi,wj)表示节点wi和节点wj的关联关系的长期兴趣权重,DC(Array_IFA(wi,wj))是Array_IFA(wi,wj)的分布系数;
(3)根据四个视角兴趣度进行学习资源推荐:
(3-1)建立由兴趣图L表示的兴趣模型,兴趣图L包括各学习资源中每个句子的特征词局部网络中的节点和边,还包括由每个节点的短期兴趣权重组成的集合、由每两个邻居节点的关联关系的短期兴趣权重组成的集合、由各节点的长期兴趣权重组成的集合以及由每两个邻居节点的关联关系的长期兴趣权重组成的集合;对于候选学习资源池P=[T′1,T′2,...,T′size′],计算每个候选学习资源与兴趣模型的匹配度:
Z表示兴趣图L中节点和候选学习资源T′中特征词的交集,则候选学习资源T′与兴趣模型的节点匹配度为:
Figure GDA0002922888110000114
其中wi表示在Z中的第i个特征词,N是候选学习资源T′中句子的数目,T′(wi)表示在候选学习资源T′中出现节点wi的句子数,num表示Z中特征词的个数;若节点匹配度NMDT′,L为短期节点匹配度,用于衡量节点短期兴趣的程度,则wvL(wi)表示节点wi在兴趣图L的短期兴趣,赋值为SWV(wi);若节点匹配度NMDT′,L为长期节点匹配度,用于衡量节点长期兴趣的程度,则wvL(wi)表示节点wi在兴趣图L的长期兴趣,赋值为LWV(wi);N的出现是为了避免学习资源有较高的节点匹配度。
利用以下公式计算候选学习资源T′与兴趣模型的边匹配度:
Figure GDA0002922888110000121
其中wi和wj分别表示在Z中的第i个和第j个特征词,N是候选学习资源T′中句子的数目,T′(wi,wj)表示在候选学习资源T′中同时出现节点wi和节点wj的句子数,num表示Z中特征词的个数;若边匹配度EMDT′,L为短期边匹配度,用于衡量边短期兴趣的程度,则weL(wi,wj)表示(wi,wj)在兴趣图L的短期兴趣,赋值为SWE(wi,wj);若边匹配度EMDT′,L为长期边匹配度,用于衡量边长期兴趣的程度,则weL(wi,wj)表示(wi,wj)在兴趣图L的长期兴趣,赋值为LWE(wi,wj);
(3-2)学习资源推荐过程:
分别根据各候选学习资源与兴趣模型的四个基本视角兴趣度对候选学习资源池P=[T′1,T′2,...,T′size′]中的候选学习资源分别进行排序,SIZE′为候选学习资源池中候选学习资源的数目,所述四个基本视角兴趣度包括短期节点匹配度、长期节点匹配度、短期边匹配度、长期边匹配度,并从排序结果中取出其中q个组成兴趣度等级数组
Figure GDA0002922888110000122
1≤q≤4,通过以下公式计算候选学习资源池的综合排名Ir:
Figure GDA0002922888110000123
其中向量
Figure GDA0002922888110000124
为系数向量,满足c1+...+cq=1,c1,...,cq∈[0,1];
(3-3)按综合排名Ir的顺序将候选学习资源推荐给学习者。
四个视角兴趣的更新:
在步骤(3)进行学习资源推荐之前,检测是否加入了新的已学习的学习资源,若是,则按照步骤(1-1)至步骤(1-3)浏览当前学习资源中的每一句,将该学习资源加入历史学习记录R,按照步骤(2)重新计算学习者的四个视角兴趣,最后按照步骤(3)进行学习资源推荐。
如果兴趣特征在现有的兴趣图谱中没有出现过,则会从新的学习资源中提取特征词和关联关系并将其添加到兴趣图谱中。短期权重的计算考虑了累积假设和邻近分布假设。长期权重的计算考虑了累积假设和广泛分布假设。扫描完一个学习资源后,之前的权重将被更新。更新过程将传入的学习资源作为输入,并且不需要重新计算历史学习记录中以前的学习资源。在扫描传入学习资源之前,可以给定兴趣图谱中的特征词(或关联)),如果传入学习资源包含兴趣图谱中的特征词(或关联关系),则将传入学习资源获得的特征词(或关联关系)的权重累积到前一个权重。每个节点或每条边的两个权重分别表示节点或边的短期兴趣和长期兴趣。较大的权重反映了较强的短期兴趣或长期兴趣。
通过上述方法建立学习者的兴趣模型,在该模型中随着学习资源越来越多,不断更新学习者的兴趣模型,最后形成一个比较稳定的兴趣图谱。接下来可以根据该模型建立推荐机制。
本发明采用中北大学软件学院300个学习者的数据,通过服务器获取每个学习者的学习资源日志,随机选取50个主题和500个学习资源,每个主题包含10个作为研究对象。将数据分为两类:一类是训练集,另一类是测试集。通过与基于内容的推荐算法和引入时间的基于内容的推荐算法比较,来验证所提出的基于多视角的学习资源推荐算法的有效性。
(1)实验基于每个视角的兴趣推荐
取推荐列表前20的学习资源,实验结果如图1所示。可以看出,与基于内容的推荐方法和引入时间的基于内容的推荐方法相比,本文提出的基于多视角的推荐方法匹配度显著提高。由于基于学习者兴趣特征词的推荐方法与基于内容的推荐方法类似,所以基于内容兴趣推荐方法优势不是很大。但是,基于特征词关联兴趣的推荐方法的匹配度明显高于基于内容的推荐方法,进一步表明,基于特征词关联兴趣的推荐方法能更好地向学习者推荐其最感兴趣的学习资源。
(2)实验采用中北大学软件学院的数据集作为实验数据集。从50个主题中随机选取12个主题。其中,
Figure GDA0002922888110000131
表示从第m个主题中选取n个学习资源。以下为学习者的4个部分历史学习记录:
Figure GDA0002922888110000132
Figure GDA0002922888110000133
Figure GDA0002922888110000134
Figure GDA0002922888110000135
假设学习资源出现在一个部分历史记录中,它就不会出现在另一个部分学习记录中。将部分历史记录合并成一个整体历史记录,为PRH1→PRH2→PRH3→PRH4。其中,PRH4最接近当前时间,通过扫描整个历史学习记录来获得兴趣图,在T7,T8中的特征词是学习者近期最感兴趣的特征词,并且之前从未出现过。所以T7,T8中的学习资源是满足短期特征兴趣的新信息。
从T7,T8的每个主题中,随机选取其中的3个学习资源(共24个学习资源)。从T9,T12的每个主题中选取剩余的3个学习资源(共12个学习资源)。36(24+12)个学习资源组成测试集。根据满足短期特征兴趣的新学习资源的匹配度的组合,i(i=6,12)个学习资源从测试集中被推荐。系数向量的设置如表1(a)-(c)所示。实验用三个不同的部分历史学习顺序进行三次,并计算三个不同顺序的推荐结果的平均值。根据短期兴趣的组合,其预期结果如下:
①如果在表1中系数向量为默认的(a),那么期望推荐结果应属于T7,T8,因为在T7,T8的学习资源越接近当前时间。除T7、T8外,推荐结果应该大部分属于T5、T6和T12,因为该三个主题的学习资源与该视角第二最密切。
②如果在表1中系数向量为(b),那么期望推荐结果与PRH4中的内容最相关。所以,与表1(a)相比,结果除T7、T8外,推荐结果应更多分布在T9~T12。其中,CV1表示学习者对于短期关联兴趣,更喜欢短期内容兴趣的学习资源。
③如果在表1中系数向量为(c),那么期望推荐结果应该与不是长期感兴趣的内容更相关。所以,与表1(a)相比,结果除T7、T8外,推荐结果应更多分布在T1~T6。其中,CV2表示学习者对于短期内容兴趣,更喜欢内容关联兴趣的学习资源。
Figure GDA0002922888110000141
Figure GDA0002922888110000151
表1基于短期内容兴趣与短期关联兴趣推荐的实验结果
从表1可以看出,平均值Avg与期望结果相符。因此,基于多视角兴趣模型可以很好地处理涉及短期特征词兴趣和关联兴趣的学习资源。此外,改变系数向量为学习者推荐其感兴趣的学习资源。
(3)实验基于多个视角的推荐与常用的基于内容的推荐相结合进行推荐
实验结合方法有以下四种(CBM表示基于内容的推荐,SF表示短期特征兴趣,LF表示长期特征兴趣,SL表示短期关联兴趣,LL表示长期关联兴趣),u=5,实验结果如表2所示。其中,CBM-1为基本方法,(CBM+AIM)-2包含兴趣特征词的兴趣,(CBM+AIM)-3引入了特征词间关联关系的兴趣,(CBM+AIM)-4包含了这两个视角的兴趣。
CBM-1:所有的学习资源来自CBM。
(CBM+AIM)-2:1/u的学习资源来自SF+1/u的学习资源来自LF+剩下的学习资源来自CBM。
(CBM+AIM)-3:1/u的学习资源来自SL+1/u的学习资源来自LL+剩下的学习资源来自CBM。
(CBM+AIM)-4:1/2u的学习资源来自SF+1/2u的学习资源来自LF+1/2u的学习资源来自SL+1/2u的学习资源来自LL+剩下的学习资源来自CBM。
Figure GDA0002922888110000152
表2准确率和召回率
从表2可以看出,随着推荐列表数的增加,准确率降低,召回率增加。基于内容的推荐算法与基于兴趣特征词的推荐算法相似,其准确率几乎相等,没有任何优势。此外,(CBM+AIM)-3比(CBM+AIM)-2的准确率更高,说明对引入关联关系的兴趣比引入特征词的兴趣做出了更大的改进,同时推荐一些学习资源。随着推荐列表的增多,改进的效果变弱,究其原因是学习者对关联兴趣比兴趣特征词要少。
综合上述实验结果,本发明提供的一种基于多视角兴趣的学习资源推荐方法,从兴趣稳定性和兴趣特征两个角度分析学习者的兴趣偏好,建立基于多视角兴趣的兴趣模型,根据学习者的不同兴趣向学习者推荐其需要的资源,本发明在保证推荐准确性的同时,显著提高了推荐的多样性。

Claims (2)

1.一种基于多视角兴趣的学习资源推荐方法,其特征在于包括以下过程:
(1)对于学习者的历史学习记录R=[T1,T2,...,TSIZE],SIZE为历史学习记录中学习资源的数目,设其中每一个学习资源中的一行代表一句,按照步骤(1-1)至步骤(1-3)依次浏览每个学习资源中的每一句:
(1-1)设当前浏览句为第k句,第k句的全局范围为当前浏览的学习资源Tt的第1句到第k句,第k句的局部范围为当前浏览的学习资源Tt的第k-d句到第k+d句,其中d为预设值,按照过程(1-2)至(1-3)计算特征词间的相关性;
(1-2)依次提取第k句学习资源的局部范围的特征词,计算局部范围每两个特征词wi和wj间的全局相关性GRk(wi,wj),全局相关性根据GRk(wi,wj)=NumS1,k(wi,wj)计算得到,表示第1句到第k句中同时出现特征词wi和wj的句数,并根据以下公式计算每两个特征词wi和wj间的局部相关性LRk,d(wi,wj):
LRk,d(wi,wj)=Min(Nk,d,1)×GRk(wi,wj) (1)
其中Min()表示返回较小值函数,Nk,d表示局部相关性和全局相关性的比率,根据以下公式计算:
Figure FDA0002922888100000011
其中NumSx,y(wi,wj)表示从当前学习资源的第x句到第y句同时出现特征词wi和wj的句数,n表示当前学习资源的总句数;
(1-3)构建第k句的特征词局部网络LWNk(Vk,Ek,LWIk,LRk,d),其中Vk表示在局部范围内特征词的集合,每个特征词为一个节点;LWIk表示局部范围内每个特征词的局部印象的集合,该集合中LWIk(wi)表示特征词wi在局部范围内的权重W[wi],扫描至当前学习资源时权重W[wi]初始值为0,扫描至第k句时,权重W[wi]为局部范围内各句特征词wi的数目的累加值,当权重W[wi]大于预设值MIN时,判断特征词wi与任意特征词的局部相关性,若特征词wi与wj的局部相关性LRk,d(wi,wj)>0,则特征词wi与wj间产生一条边,存在关联关系,特征词wi与wj互为邻居节点,将特征词wj在局部范围内的权重W[wj]利用累加公式
Figure FDA0002922888100000021
进行赋值,特征词wi在局部范围内的权重W[wi]利用赋值公式W[wi]=W[wi]*(1/ω)进行赋值,ω是预设的比率值,Ek表示在局部范围内边的集合;LRk表示局部范围内每两个特征词wi和wj间的局部相关性的集合;所述
Figure FDA0002922888100000022
表示在当前学习资源Tt中扫描完第k句后,从节点wi到邻居节点wj的传播权重,j依次取wi所有邻居节点序数,k的范围为当前学习资源Tt的所有句子数,采用以下公式计算:
Figure FDA0002922888100000023
其中W[wi]和W[wj]分别表示节点wi和节点wj的权重,ω是预设的比率值,特征词的保留比率为1/ω,特征词有1-1/ω的比率传播给它的邻居节点;
(2)计算学习者的四个视角兴趣:
(2-1)计算学习者的短期兴趣:
将每个特征词分别视为一个节点,根据以下公式计算各节点在各学习资源中的印象吞吐量:
Figure FDA0002922888100000024
其中
Figure FDA0002922888100000025
表示节点wi在当前学习资源Tt中的印象吞吐量;
根据以下公式计算各学习资源中每两个邻居特征词间的印象流量:
Figure FDA0002922888100000026
其中wi和wj是当前学习资源Tt中的任意两个节点,
Figure FDA0002922888100000028
表示节点wi和节点wj在当前学习资源Tt中的印象流量,
Figure FDA0002922888100000027
表示在学习资源Tt中扫描完第k句后从节点wi到其邻居节点wj的传播权重,用公式(3)计算得到;
根据以下公式计算每个节点的短期兴趣权重:
Figure FDA0002922888100000031
其中SWV(wi)表示节点wi的短期兴趣权重,t表示历史学习记录中的学习资源序数,Ω(t)表示兴趣衰减度,采用以下公式计算:
Ω(t)=2/(1+λt-1) λ>1 (6)
其中λ表示兴趣衰减函数影响因子,为大于1的常数;
根据以下公式计算历史学习记录中每两个邻居节点的关联关系的短期兴趣权重:
Figure FDA0002922888100000032
其中SWV(wi,wj)表示节点wi和节点wj的关联关系的短期兴趣权重;
(2-2)计算学习者的长期兴趣:
设历史学习记录R=[T1,T2,...,TSIZE],其中T1为最接近当前时间的学习资源,
Figure FDA0002922888100000033
为节点wi的印象吞吐量阵列,根据以下公式计算各节点的长期兴趣权重:
Figure FDA0002922888100000034
其中LWV(wi)为节点wi的长期兴趣权重,DC(Array_ITA(wi))是Array_ITA(wi)的分布系数;
Figure FDA0002922888100000035
为边的印象流量阵列,根据以下公式计算每两个邻居节点关联关系的长期兴趣权重:
Figure FDA0002922888100000036
其中LWV(wi,wj)表示节点wi和节点wj的关联关系的长期兴趣权重,DC(Array_IFA(wi,wj))是Array_IFA(wi,wj)的分布系数;
(3)根据四个视角兴趣度进行学习资源推荐:
(3-1)建立由兴趣图L表示的兴趣模型,兴趣图L包括各学习资源中每个句子的特征词局部网络中的节点和边,还包括由每个节点的短期兴趣权重组成的集合、由每两个邻居节点的关联关系的短期兴趣权重组成的集合、由各节点的长期兴趣权重组成的集合以及由每两个邻居节点的关联关系的长期兴趣权重组成的集合;对于候选学习资源池P=[T′1,T′2,...,T′size′],SIZE′为候选学习资源池中候选学习资源的数目,计算每个候选学习资源与兴趣模型的匹配度:
Z表示兴趣图L中节点和候选学习资源T′中特征词的交集,则候选学习资源T′与兴趣模型的节点匹配度为:
Figure FDA0002922888100000041
其中wi表示在Z中的第i个特征词,N是候选学习资源T′中句子的数目,T′(wi)表示在候选学习资源T′中出现节点wi的句子数,num表示Z中特征词的个数;若节点匹配度NMDT′,L为短期节点匹配度,用于衡量节点短期兴趣的程度,则wvL(wi)表示节点wi在兴趣图L的短期兴趣,赋值为SWV(wi);若节点匹配度NMDT′,L为长期节点匹配度,用于衡量节点长期兴趣的程度,则wvL(wi)表示节点wi在兴趣图L的长期兴趣,赋值为LWV(wi);
利用以下公式计算候选学习资源T′与兴趣模型的边匹配度:
Figure FDA0002922888100000042
其中wi和wj分别表示在Z中的第i个和第j个特征词,N是候选学习资源T′中句子的数目,T′(wi,wj)表示在候选学习资源T′中同时出现节点wi和节点wj的句子数,num表示Z中特征词的个数;若边匹配度EMDT′,L为短期边匹配度,用于衡量边短期兴趣的程度,则weL(wi,wj)表示(wi,wj)在兴趣图L的短期兴趣,赋值为SWE(wi,wj);若边匹配度EMDT′,L为长期边匹配度,用于衡量边长期兴趣的程度,则weL(wi,wj)表示(wi,wj)在兴趣图L的长期兴趣,赋值为LWE(wi,wj);
(3-2)学习资源推荐过程:
分别根据各候选学习资源与兴趣模型的四个基本视角兴趣度对候选学习资源池P=[T′1,T′2,...,T′size′]中的候选学习资源分别进行排序,所述四个基本视角兴趣度包括短期节点匹配度、长期节点匹配度、短期边匹配度、长期边匹配度,并从排序结果中取出其中q个组成兴趣度等级数组
Figure FDA0002922888100000051
通过以下公式计算候选学习资源池的综合排名Ir:
Figure FDA0002922888100000052
其中向量
Figure FDA0002922888100000053
为系数向量,满足c1+...+cq=1,c1,...,cq∈[0,1];
(3-3)按综合排名Ir的顺序将候选学习资源推荐给学习者。
2.根据权利要求1所述的基于多视角兴趣的学习资源推荐方法,其特征在于:在步骤(3)进行学习资源推荐之前,检测是否加入了新的已学习的学习资源,若是,则按照步骤(1-1)至步骤(1-3)浏览当前学习资源中的每一句,将该学习资源加入历史学习记录R,按照步骤(2)重新计算学习者的四个视角兴趣,最后按照步骤(3)进行学习资源推荐。
CN201810727619.0A 2018-07-05 2018-07-05 一种基于多视角兴趣的学习资源推荐方法 Expired - Fee Related CN108875071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810727619.0A CN108875071B (zh) 2018-07-05 2018-07-05 一种基于多视角兴趣的学习资源推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810727619.0A CN108875071B (zh) 2018-07-05 2018-07-05 一种基于多视角兴趣的学习资源推荐方法

Publications (2)

Publication Number Publication Date
CN108875071A CN108875071A (zh) 2018-11-23
CN108875071B true CN108875071B (zh) 2021-03-19

Family

ID=64299310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810727619.0A Expired - Fee Related CN108875071B (zh) 2018-07-05 2018-07-05 一种基于多视角兴趣的学习资源推荐方法

Country Status (1)

Country Link
CN (1) CN108875071B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110134875A (zh) * 2019-04-19 2019-08-16 南方科技大学 一种教育信息推荐方法、装置及系统
CN110489639B (zh) * 2019-07-15 2022-10-25 北京奇艺世纪科技有限公司 一种内容推荐方法及装置
CN112685470B (zh) * 2020-12-28 2021-07-20 阳江开放大学 基于学分银行和大数据分析的终身学习资源智能推送方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577579A (zh) * 2013-11-08 2014-02-12 南方电网科学研究院有限责任公司 基于用户潜在需求的资源推荐方法及系统
US9552555B1 (en) * 2012-12-31 2017-01-24 Google Inc. Methods, systems, and media for recommending content items based on topics
CN106528693A (zh) * 2016-10-25 2017-03-22 广东科海信息科技股份有限公司 面向个性化学习的教育资源推荐方法及系统
CN107944026A (zh) * 2017-12-12 2018-04-20 百度在线网络技术(北京)有限公司 一种图集个性化推荐的方法、装置、服务器和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9552555B1 (en) * 2012-12-31 2017-01-24 Google Inc. Methods, systems, and media for recommending content items based on topics
CN103577579A (zh) * 2013-11-08 2014-02-12 南方电网科学研究院有限责任公司 基于用户潜在需求的资源推荐方法及系统
CN106528693A (zh) * 2016-10-25 2017-03-22 广东科海信息科技股份有限公司 面向个性化学习的教育资源推荐方法及系统
CN107944026A (zh) * 2017-12-12 2018-04-20 百度在线网络技术(北京)有限公司 一种图集个性化推荐的方法、装置、服务器和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
电子书包中基于学习者模型的个性化学习资源推荐研究;牟智佳等;《电化教育研究》;20150131(第261期);第69-76页 *

Also Published As

Publication number Publication date
CN108875071A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
CN106802956B (zh) 一种基于加权异构信息网络的电影推荐方法
CN104166668B (zh) 基于folfm模型的新闻推荐系统及方法
CN105138653B (zh) 一种基于典型度和难度的题目推荐方法及其推荐装置
CN107679239B (zh) 一种基于用户行为的个性化社区推荐方法
CN108875071B (zh) 一种基于多视角兴趣的学习资源推荐方法
CN104268142B (zh) 基于可拒绝策略的元搜索结果排序方法
CN104063481A (zh) 一种基于用户实时兴趣向量的电影个性化推荐方法
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
CN102637170A (zh) 一种问题推送方法及系统
CN107391670A (zh) 一种融合协同过滤和用户属性过滤的混合推荐方法
Caron et al. Mixing bandits: A recipe for improved cold-start recommendations in a social network
CN103064903A (zh) 图片检索方法和装置
CN108415928B (zh) 一种基于加权混合k-最近邻算法的图书推荐方法与系统
CN103729424A (zh) 问答社区内回答评价方法和系统
CN110362755A (zh) 一种基于物品协同过滤与关联规则的混合算法的推荐方法
CN108874916A (zh) 一种层叠组合协同过滤推荐方法
CN106897398B (zh) 一种视频展示方法及装置
CN104778237A (zh) 一种基于关键用户的个性化推荐方法和系统
CN112364245B (zh) 基于异构信息网络嵌入的Top-K电影推荐方法
CN114461879B (zh) 基于文本特征整合的语义社交网络多视角社区发现方法
CN115481325A (zh) 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统
CN111078859B (zh) 一种基于引用次数的作者推荐方法
CN112862567A (zh) 一种在线展会的展品推荐方法与系统
CN104572915B (zh) 一种基于内容环境增强的用户事件相关度计算方法
CN109299368B (zh) 一种用于环境信息资源ai智能个性化推荐的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210319