CN102073720B - 一种对个性化推荐结果进行优化的fr方法 - Google Patents

一种对个性化推荐结果进行优化的fr方法 Download PDF

Info

Publication number
CN102073720B
CN102073720B CN201110003783.5A CN201110003783A CN102073720B CN 102073720 B CN102073720 B CN 102073720B CN 201110003783 A CN201110003783 A CN 201110003783A CN 102073720 B CN102073720 B CN 102073720B
Authority
CN
China
Prior art keywords
recommendation
user
deviation
project
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110003783.5A
Other languages
English (en)
Other versions
CN102073720A (zh
Inventor
罗辛
欧阳元新
谢舒翼
熊璋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianshi and culture communication limited liability company
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201110003783.5A priority Critical patent/CN102073720B/zh
Publication of CN102073720A publication Critical patent/CN102073720A/zh
Application granted granted Critical
Publication of CN102073720B publication Critical patent/CN102073720B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种对个性化推荐结果进行优化的FR方法,它是利用社会标签网络过滤和推荐偏差移除,提高个性化推荐质量和精度。社会标签网络过滤方法使用社会标签网络模型,建立项目社会网络K近邻,并以其为基础在推荐模型进行推荐时构造社会标签过滤集合,用以过滤掉面向项目的K近邻模型的推荐结果中,与用户已评分项目较低的社会标签相关度的推荐项目,从而将用户-项目评分数据和社会标签网络数据中的信息结合起来进行推荐。推荐偏差移除方法以面向项目的K近邻模型在已知用户-项目评分数据上的预测值和用户真实评分为基础,使用线性模型对推荐偏差进行估计;并在推荐模型进行推荐时,将相应的推荐偏差估计值从评分预测值中移除,从而对推荐结果进行优化。

Description

一种对个性化推荐结果进行优化的FR方法
技术领域
本发明涉及一种对个性化推荐结果进行优化的FR方法,它适用于电子商务个性化推荐,属于信息检索、数据挖掘技术领域。
背景技术
成熟的电子商务系统往往拥有庞大的用户数量;同时,频繁的用户注册和注销也使得用户数据非常不稳定。因此,在实际应用中,面向用户的K近邻模型很难提供高效、稳定的推荐服务。为了解决这一弊端,基于电子商务系统中项目数量往往远少于用户数量、且项目数据更为稳定的事实,Sarwar等提出了面向项目的K近邻模型。面向项目的K近邻模型使用对项目间的关系建模取代了对用户间的关系建模,同样也分为离线训练过程和线上推荐过程。
国内外研究者们针对利用社会标签数据进行个性化推荐做了大量的研究。Milicevic等指出,如何使用社会标签数据进行个性化推荐,已经成为了个性化推荐技术研究领域的一个研究热点,国内外的研究人员针对该问题进行了大量研究,相关的研究成果层出不穷,如Hotho等提出的使用社会标签数据对所有项目进行排序的FolkRank算法;Lin等提出的从社会标签数据中抽取用户群信息的MetaFac算法;Sen等提出的基于社会标签数据的推荐模型;Lamere等提出的基于社会标签相似度的推荐模型;Diederich等提出的根据个性化标签数据对项目进行用户兴趣建模的方法;Satoshi等提出的根据社会标签对项目进行聚类的方法,等等。然而,上述这些方法走向了另一个极端,即只使用个性化标签数据进行推荐,产生的推荐结果同样只是以单一数据源为基础。
发明内容
1、目的:本发明的目的是提供一种对个性化推荐结果进行优化的FR方法。该方法利用社会标签网络过滤和推荐偏差移除来提高个性化推荐质量和精度。
2、技术方案:本发明的技术解决方案:一种对个性化推荐结果进行优化的FR方法,其步骤为:
步骤一,当需要为用户u进行推荐时,推荐系统将首先使用基于评分相似度的K近邻模型产生初步推荐结果集;
步骤二,推荐系统将使用社会标签网络过滤方法对初步推荐结果集进行过滤;
步骤三,推荐系统对过滤后的推荐项目对应的系统评分预测值使用推荐偏差移除方法优化,得出最后的推荐结果并返回给用户。
在社会标签数据中,标注链接是由社会标签所描述的项目之间的关系。标注链接分为以下三类:
1)强标注链接(Strong Tagging Links):若两个项目被同一用户添加了相同或相似的标签,则称这两个项目间存在一条强标注链接,相应的标签对被称为硬标签对;
2)中标注链接(Moderate Tagging Links):若两个项目被不同用户添加了相同或相似的标签,则称这两个项目间存在一条中标注链接,相应的标签对被称为强标签对;
3)弱标注链接(Weak Tagging Links):若两个项目被同一用户添加了无关的标签,则称这两个项目间存在一条弱标注链接。
从标签相似度的角度考虑,在社会标签数据中,不同标签的格式相互差异很大,所以将每条标签简单地视作单词集合,然后使用单词集合间的Jaccard相似度作为标签间相似度的度量值,如下式所示:
simj t a , t b = | t a ∩ t b | / | t a ∪ t b |
其中ta和tb分别代表从标签a和标签b中抽取出的单词集合。
另外一个决定一条标注链接的权重的因素是该标注链接所属的类别:如果某类标注链接的出现概率较低,则这类标注链接应该被赋予更高的权重。令
Figure BDA0000043298950000031
Figure BDA0000043298950000032
分别代表在一个社会标签数据集中,弱标注链接、中标注链接和强标注链接出现的概率,令
Figure BDA0000043298950000034
分别代表弱标注链接、中标注链接和强标注链接上的权重,结合社会标签间的Jacaard相似度,则相应标注链接的上权重的计算方式为:
w t a , t b s = 1 p h · simj t a , t b
w t c , t d m = 1 p s · simj t c , t d
w w = 1 p w · β
由于弱标注链接的产生与标签是否相似无关,故而我们引入了参数β对弱标注链接的影响度进行限制。在实际应用中,我们一般将β的值取为社会标签相似度的平均值。同时,我们使用各类标注链接的出现比例对的值进行估计,如下式所示:
Figure BDA00000432989500000310
Figure BDA00000432989500000311
其中
Figure BDA00000432989500000313
分别代表社会标签数据中,强标注链接、中标注链接和弱标注链接的总数。以上述衡量标注链接权重的方法为基础,我们可以使用项目i、j间所有标注链接权重的总和表示项目i、j间的社会标签相关度,如下所示:
f i , j = Σ w i , j s + Σ w i , j m + n i , j w · w i , j w ,
其中表示项目i、j间弱标注链接的数量。
社会标签网络是一个无向带权图,其中每一个点表示一个项目,而每条边的权重则表示相应项目间的社会标签相关度。在实际应用中,社会标签网络可以用邻接矩阵的方式进行存贮。
当系统需要为用户u进行推荐时,首先根据用户u的用户ID取得其已知评分集R(u),然后根据R(u),以面向项目的K近邻模型为推荐模型,产生初步的推荐结果集;取出用户u的已知评分集中每个项目的社会标签K近邻集并将其合并,构成过滤项目集。得到社会标签过滤项目集和初步的推荐结果集后,系统对这两个集合求交集,从而过滤掉推荐结果集中与用户已评分项目具备较低的社会标签相关度的项目。由于过滤项目集是以社会标签数据为基础产生的,所以经社会标签网络过滤方法处理后的推荐结果与用户已评分项目同时具备较高的评分相关度和社会标签相关度,能够更好地反映用户的兴趣,推荐效果更好。
以给定的用户-项目评分数据为基础,使用构造好的推荐模型构造在已知评分数据上的评分预测值,再已知评分构造对系统推荐偏差的统计估计值;然后我们可以通过将构造出的推荐偏差的估计值从相应的评分预测中移除的方式,来提高推荐系统的预测精度;最后,随着用户反馈信息的不断增加,推荐偏差的估计值可以根据用户反馈信息进行动态更新,从而达到更好的优化效果。推荐偏差移除可以分为离线模型构造阶段、在线模型应用更新阶段和代入相似度权重的推荐偏差移除。
推荐偏差,是推荐系统对评分的预测值,和对应的用户真实评分间的差值。推荐偏差代表的是基于已知评分构造的推荐模型所做出的评分预测值偏离用户真实评分的程度。
根据已知评分和推荐系统对已知评分的预测值,构造推荐偏差估计值。我们使用斜率为1的线性模型对推荐偏差进行估计,即对用户u,以用户u的已知评分集合R(u)和系统对用户u的已知评分的预测评分集合
Figure BDA0000043298950000042
为基础,求解最优的线性模型:
r u , i = r ^ u , i + RB u
其中RBu表示系统对应于用户u的推荐偏差。该模型可以通过最小二乘法进行求解,即首先构造用户u在R(u)和
Figure BDA0000043298950000052
上关于RBu的累积方差:
SE RB u = Σ i ∈ R ( u ) ( r ^ u , i + RB u - r u , i ) 2 .
然后取
Figure BDA0000043298950000054
关于RBu的偏导数并使其为零,得到:
∂ SE RB u ∂ RB u = 0
⇒ 2 Σ i ∈ R ( u ) ( r ^ u , i + RB u - r u , i ) = 0
⇒ RB u = RB u = Σ i ∈ R ( u ) ( r u , i - r ^ u , i ) | R ( u ) |
为了避免过度拟合,需要根据推荐偏差的支持样本数,对相应的推荐偏差估计值进行紧缩。通过引入紧缩因数γ,我们使用如下的紧缩规则对推荐偏差估计值进行紧缩:
RB u = Σ i ∈ R ( u ) ( r u , i - r ^ u , i ) | R ( u ) | + γ
其中紧缩因数γ为事先约定的常量,其值由交叉验证确定。上式的紧缩规则将适度缩小基于少量支持样本的推荐偏差估计值;对于基于大量支持样本估计出的推荐偏差,上式将几乎不会产生影响。
当推荐系统对用户u在项目k上的评分进行预测时,加入推荐偏差修正后的评分预测值为:
r ^ u , k ′ = r ^ u , k + RB u
即为原始的系统评分预测值与相应的推荐偏差之和。实际上,修正后的系统评分预测值尽管可能比修正前具备更高的精确度,但仍然会与真实的用户评分存在出入。所以,当用户对系统推荐的项目做出真实评分反馈后,系统将会根据用户反馈评分对相应的推荐偏差估计值进行更新。例如,当用户u对系统推荐的项目j做出评分反馈时,相应的推荐偏差RBu将会按照下式进行更新:
RB u old = Σ i ∈ R ( u ) ( r u , i - r ^ u , i ) | R old ( u ) | + γ RB u new = Σ i ∈ R ( u ) ( r u , i - r ^ u , i ) + ( r u , j - r ^ u , j ) | R old ( u ) | + 1 + γ
⇒ RB u new = R B u old · ( | R ( u ) old | + γ ) + ( r u , j - r ^ u , j ) | R ( u ) old | + 1 + γ
将评分相似度作为权重因数引入推荐偏差的估计过程。具体做法是,分别为用户估计在每个项目上的推荐偏差,同时代入项目间的评分相似度进行加权平均。例如,在估计系统为用户u推荐项目k时的推荐偏差RBu,k时,其估计方式如下式所示:
RB u , k = Σ i ∈ R ( u ) si m i , k ( r u , i - r ^ u , i ) γ + Σ i ∈ R ( u ) sim i , k
上式估计的推荐偏差同样可以根据用户的反馈评分进行更新:当用户u对系统推荐的项目j做出评分反馈时,涉及到的推荐偏差RBu,k可按照下式进行更新:
RB u old = Σ i ∈ R ( u ) sim i , k ( r u , i - r ^ u , i ) γ + Σ i ∈ R ( u ) sim i , k RB u new = sim j , k ( r u , j - r ^ u , j ) + Σ i ∈ R ( u ) sim i , k ( r u , i - r ^ u , i ) γ + sim j , k + Σ i ∈ R ( u ) sim i , k
⇒ RB u new = sim j , k ( r u , j - r ^ u , j ) + RB u old · ( γ + Σ i ∈ R ( u ) sim i , k ) γ + sim j , k + Σ i ∈ R ( u ) sim i , k .
本发明的有益效果:本发明一种对个性化推荐结果进行优化的FR方法,其优点是:使用FR方法对推荐结果进行优化,会大幅提升系统的预测精度。使用社会标签网络过滤策略,会在一定程度上降低系统的推荐覆盖率,但其过滤掉的推荐结果大部分都不是用户喜好的推荐结果,因而可以提升系统的运行效率。
附图说明
图1为本发明的社会标签网络过滤方法的处理流程示意图;
图2为本发明的推荐偏差移除方法的处理流程示意图;
图3各推荐模型在ML12K/15K数据集上的MAE比较示意图;
图4对推荐结果使用FR策略优化前与优化后Coverage的比较示意图;
图5对推荐结果使用FR策略优化前与优化后UI_Coverage的比较示意图。
图中符号说明如下:
UI_Coverage:用户喜好推荐覆盖率;
CF:基准参照推荐模型;
FNBF_CF:使用FNBF方法优化后的面向项目的K近邻模型;
FR_CF:使用FR方法优化后的面向项目的K近邻模型;
MAE:平均绝对误差;
Coverage:推荐系统推荐的项目集对验证数据集中用户已评分项目集的覆盖率;
K值:近邻关系的数目。
具体实施方式
下面结合附图及实施例,对本发明的技术方案做进一步的说明。
一种对个性化推荐结果进行优化的FR方法,其中F代表社会标签网络过滤(FNBF),R代表推荐偏差移除(RBR)。社会标签网络过滤则是通过从推荐结果集中移除与用户具备较低社会标签相关度的推荐结果,对推荐结果集进行优化(见图1);推荐偏差移除通过估计推荐系统评分预测值与真实用户评分之间的系统误差,并将其从系统评分预测值中移除的方式来提高推荐精度(见图2)。结合这两种方法,就是本专利中提出的对面向项目的K近邻模型进行优化的FR方法。
该方法的步骤包括:
步骤一,当需要为用户u进行推荐时,推荐系统将首先使用基于评分相似度的K近邻模型产生初步推荐结果集;
步骤二,推荐系统将使用社会标签网络过滤方法对初步推荐结果集进行过滤;
步骤三,推荐系统对过滤后的推荐项目对应的系统评分预测值使用推荐偏差移除方法优化,得出最后的推荐结果并返回给用户。在MovieLens10M/10K数据集上进行(以下简称ML10M数据集),该数据集是明尼苏达大学GroupLens研究小组通过MovieLens网站收集的公共推荐系统性能评测数据集之一,包含了69878名用户对10677个项目超过1000万条的评分信息,以及4009名用户标注在7601个项目上的95580条社会标签。所有的用户评分都分布在区间[0,5]内,评分值越高,代表用户对相应项目的兴趣越强。由于该数据集中社会标签数据远远少于用户-项目评分数据,为了使两种数据的信息量相当,在进行实验时,我们从中抽取了一个子数据集,该数据集中包含了至少标注过5个项目的用户,以及至少被5名用户进行过标注的项目,所对应的用户-项目评分数据和社会标签数据。按照上述过程构造的实验数据集中包含了由1498名用户在190个项目上的12939条评分数据和15999条社会标签数据,以下简称为ML12K/15K数据集。
为了检验推荐偏差移除方法对面向项目的K模型的推荐精度的影响,故而使用MAE作为推荐模型主要的性能评价指标。同时,由于社会标签网络过滤会过滤掉部分初始推荐结果,将会对推荐系统的推荐覆盖率产生影响,故而实验中我们同样对推荐系统的Coverage进行了记录。同时,我们还记录了用户喜好推荐覆盖率(User Interested Coverage,UI_Coveragege,)。所谓用户喜好推荐,是先确定一个评分阈值,当用户对系统推荐项目的实际评分高于该阈值时,即判定该推荐项目符合用户喜好。UI_Coverage即是计算推荐系统产生的推荐结果集,对验证数据集中用户喜好项目集的覆盖率,如下所示:
UI _ Coverage = Σ u ∈ U | R ^ V ( u ) ∩ R V _ UI ( u ) | Σ u ∈ U | R V _ UI ( u ) |
其中RV_UI(u)表示验证数据集上用户u的喜好项目集。
实验在ML12K/15K数据集上按照80%-20%的比例构造训练-测试数据。实验的基准参照推荐模型是以面向项目的K近邻模型,其中项目间的相似度使用式2.6所示的Pearson相关相似度进行度量,未知评分使用式2.10所示的预测规则进行预测。
首先,为了验证社会标签网络过滤方法(以下简称FNBF方法)的有效性,我们使用该方法对面向项目的K近邻模型产生的推荐结果进行过滤。实现FNBF方法所需的社会标签网络以ML12K/15K数据集中的社会标签数据为基础进行构造。
然后,我们使用FR方法对面向项目的K近邻模型产生的推荐结果进行修正,以验证该方法的有效性。其中,在使用FNBF方法对推荐结果进行过滤时,所需的社会标签网络以ML12K/15K数据集中的社会标签数据为基础进行构造;在进行推荐偏差移除时,我们采用了RBR-SW方法。
图3给出了实验中各推荐模型在ML12K/15K数据集上的MAE比较情况。在进行推荐覆盖率的比较时,由于使用FNBF方法和FR方法修正后的推荐结果具备相同的推荐覆盖率,故而在图4和图5中,我们只列出了基准参展推荐模型和使用FR方法优化后的推荐模型,其推荐结果的Coverage和UI_Coverage的比较情况。在所有图例中,CF表示基准参照推荐模型,即面向项目的K近邻模型;FNBF_CF表示使用FNBF方法优化后的面向项目的K近邻模型;FR_CF则表示使用FR方法优化后的面向项目的K近邻模型。为直观起见,我们同时在中给出了实验中各推荐模型在ML12K/15K数据集上所能取得的最低的MAE、Coverage、UI_Coverage和对应的K值。
实验中各推荐系统在ML10M数据集上所能取得的最低MAE和K值
从图3中可以发现,使用FNBF方法优化后的面向项目的K近邻模型的推荐精度,明显高于基准参照推荐模型的推荐精度。从可见,两者均在K=60时取得最低MAE值,此时使用FNBF方法优化后的推荐模型的MAE值比基准参照推荐模型低0.043,即推荐精度比基准参照推荐模型提高了6.65%。进一步地,同时结合了FNBF方法和RBR-SW方法的FR方法,对推荐结果的优化效果更为明显。经过FR方法优化后的推荐模型在K=60时取得的最低MAE值比基准参照推荐系统降低了0.048,即将推荐精度提高了7.43%。
同时,由图3还可以发现,当K值持续上升时,经过FNBF方法和FR方法优化后的推荐模型与基准参照推荐模型在推荐精度上的差距会逐渐缩小。该现象的原因是FNBF方法和FR方法其对推荐结果的优化都与利用社会标签K近邻对推荐结果进行过滤有关;当K值上升时,由于社会标签K近邻的规模会相应扩大,从而导致社会标签过滤集与推荐结果集的交集比率上升,从而导致优化后的推荐结果与优化前的推荐结果更为接近。
但是,由图4可见,使用FNBF方法对推荐结果集进行过滤,会导致推荐系统的推荐覆盖率大幅下降。如所示,当K=60时,使用FNBF方法会使Coverage下降21.6%。但是,由图5可以发现,使用FNBF方法过滤后的推荐结果与未经过滤的推荐结果具备较为相近的用户喜好推荐覆盖率。如错误!未找到引用源。所示,当K=60时,使用FNBF方法过滤后的推荐结果的UI_Coverage只过滤前下降了8.6%。这也说明,被FNBF方法过滤掉的推荐结果大部分都不是用户喜好的推荐结果。
推荐偏差移除和社会标签网络过滤两种对面向项目的K近邻模型的推荐结果进行优化的方法。推荐偏差移除方法以面向项目的K近邻模型在已知用户-项目评分数据上的预测值和用户真实评分为基础,使用线性模型对推荐偏差进行估计;并在推荐模型进行推荐时,将相应的推荐偏差估计值从评分预测值中移除,从而对推荐结果进行优化。社会标签网络过滤方法使用社会标签网络模型,建立项目社会网络K近邻,并以其为基础在推荐模型进行推荐时构造社会标签过滤集合,用以过滤掉面向项目的K近邻模型的推荐结果中,与用户已评分项目具备较低的社会标签相关度的推荐项目,从而将用户-项目评分数据和社会标签网络数据中的信息结合起来进行推荐。由于推荐偏差移除方法和社会标签网络过滤方法可以相容,我们进一步提出将两种方法结合后的FR方法。分析和实验表明,推荐偏差移除方法和社会标签网络过滤方法都能提高面向项目的K近邻模型的推荐质量;而结合了两种方法的FR方法更能大幅提升面向项目的K近邻模型的推荐精度。

Claims (1)

1.一种对个性化推荐结果进行优化的FR方法,其特征在于:该方法按下列步骤进行:
步骤一,当需要为用户u进行推荐时,推荐系统将首先使用基于评分相似度的K近邻模型产生初步推荐结果集;
步骤二,推荐系统将使用社会标签网络过滤方法对初步推荐结果集进行过滤;
步骤三,推荐系统对过滤后的推荐项目对应的系统评分预测值使用推荐偏差移除方法优化,得出最后的推荐结果并返回给用户;
其中,F代表社会标签网络过滤FNBF,R代表推荐偏差移除RBR;社会标签网络过滤则是通过从推荐结果集中移除与用户具备较低社会标签相关度的推荐结果,对推荐结果集进行优化;推荐偏差移除通过估计推荐系统评分预测值与真实用户评分之间的系统误差,并将其从系统评分预测值中移除的方式来提高推荐精度;
其中,在步骤二中所述的社会标签网络过滤方法,是当系统需要为用户u进行推荐时,首先根据用户u的用户ID取得其已知评分集R(u),然后根据R(u),以面向项目的K近邻模型为推荐模型,产生初步的推荐结果集;取出用户u的已知评分集中每个项目的社会标签K近邻集并将其合并,构成过滤项目集;得到社会标签过滤项目集和初步的推荐结果集后,系统对这两个集合求交集,从而过滤掉推荐结果集中与用户已评分项目具备较低的社会标签相关度的项目;过滤项目集是以社会标签数据为基础产生的,经社会标签网络过滤方法处理后的推荐结果与用户已评分项目同时具备较高的评分相关度和社会标签相关度,更好地反映用户的兴趣和推荐效果;
其中,在步骤二中所述的社会标签网络,是通过社会标签数据中的标注链接的权重来构成,采取使用项目的社会标签K近邻集合对推荐结果进行过滤的策略,实现数据信息的融合;标注链接分为以下三类:
1)强标注链接即Strong Tagging Links:若两个项目被同一用户添加了相同或相似的标签,则称这两个项目间存在一条强标注链接,相应的标签对被称为硬标签对;
2)中标注链接即Moderate Tagging Links:若两个项目被不同用户添加了相同或相似的标签,则称这两个项目间存在一条中标注链接,相应的标签对被称为强标签对;
3)弱标注链接即Weak Tagging Links:若两个项目被同一用户添加了无关的标签,则称这两个项目间存在一条弱标注链接;
其中,该标注链接的权重从标签相似度的角度考虑,在社会标签数据中,不同标签的格式相互差异很大,所以将每条标签简单地视作单词集合,然后使用单词集合间的Jaccard相似度作为标签间相似度的度量值,如下式所示:
simj t a , t b = | t a ∩ t b | / | t a ∪ t b |
其中,ta和tb分别代表从标签a和标签b中抽取出的单词集合;
此外,决定一条标注链接的权重的因素是该标注链接所属的类别:如果某类标注链接的出现概率较低,则该类标注链接应该被赋予更高的权重;令pw、pm和ps分别代表在一个社会标签数据集中,弱标注链接、中标注链接和强标注链接出现的概率,令ww、wm和ws分别代表弱标注链接、中标注链接和强标注链接上的权重,结合社会标签间的Jacaard相似度,则相应标注链接的上权重的计算方式为:
w t a , t b s = 1 p h · simj t a , t b
w t c , t d m = 1 p s · simj t c , t d
w w = 1 p w · β
由于弱标注链接的产生与标签是否相似无关,故引入参数β对弱标注链接的影响度进行限制;实际应用中将β的值取为社会标签相似度的平均值;同时,使用各类标注链接的出现比例对pw、pm和ps的值进行估计,如下式所示:
p ^ s = n s n s + n m + n w
p ^ m = n m n s + n m + n w
p ^ w = n w n s + n m + n w
其中,ns、nm、nw分别代表社会标签数据中,强标注链接、中标注链接和弱标注链接的总数;以上述标注链接权重的方法为基础,使用项目i、j间所有标注链接权重的总和表示项目i、j间的社会标签相关度,如下所示:
f i , j = Σ w i , j s + Σ w i , j m + n i , j w · w i , j w ,
其中,
Figure FDA00003621038900038
表示项目i、j间弱标注链接的数量;
其中,该社会标签网络是一个无向带权图,其中每一个点表示一个项目,而每条边的权重则表示相应项目间的社会标签相关度;在实际应用中,社会标签网络用邻接矩阵的方式进行存贮;
其中,在步骤三中所述的推荐偏差移除方法,是以给定的用户-项目评分数据为基础,使用构造好的推荐模型构造在已知评分数据上的评分预测值,再已知评分构造对系统推荐偏差的统计估计值;然后通过将构造出的推荐偏差的估计值从相应的评分预测中移除,来提高推荐系统的预测精度;最后,随着用户反馈信息的不断增加,推荐偏差的估计值根据用户反馈信息进行动态更新,从而达到更好的优化效果;推荐偏差移除分为离线模型构造阶段、在线模型应用更新阶段和代入相似度权重的推荐偏差移除;
其中,推荐偏差,是推荐系统对评分的预测值,和对应的用户真实评分间的差值;推荐偏差代表的是基于已知评分构造的推荐模型所做出的评分预测值偏离用户真实评分的程度;
其中,该推荐偏差移除中的离线模型构造阶段是根据已知评分和推荐系统对已知评分的预测值,构造推荐偏差估计值;使用斜率为1的线性模型对推荐偏差进行估计,即对用户u,以用户u的已知评分集合R(u)和系统对用户u的已知评分的预测评分集合
Figure FDA00003621038900041
为基础,求解最优的线性模型:
r u , i = r ^ u , i + RB u
其中,RBu表示系统对应于用户u的推荐偏差;该模型通过最小二乘法进行求解,即首先构造用户u在R(u)和
Figure FDA00003621038900043
上关于RBu的累积方差:
SE RB u = Σ i ∈ R ( u ) ( r ^ u , i + RB u - r u , i ) 2 .
然后取关于RBu的偏导数并使其为零,得到:
∂ SE RB u ∂ RB u = 0
⇒ 2 Σ i ∈ R ( u ) ( r ^ u , i + RB u - r u , i ) = 0
⇒ R B u = R B u = Σ i ∈ R ( u ) ( r u , i - r ^ u , i ) | R ( u ) |
为了避免过度拟合,需要根据推荐偏差的支持样本数,对相应的推荐偏差估计值进行紧缩,通过引入紧缩因数γ,使用如下的紧缩规则对推荐偏差估计值进行紧缩:
RB u = Σ i ∈ R ( u ) ( r u , i - r ^ u , i ) | R ( u ) | + γ
其中,紧缩因数γ为事先约定的常量,其值由交叉验证确定;上式的紧缩规则将适度缩小基于少量支持样本的推荐偏差估计值;对于基于大量支持样本估计出的推荐偏差,上式不会产生影响;
其中,该推荐偏差移除中的在线模型构造阶段是当推荐系统对用户u在项目k上的评分进行预测时,加入推荐偏差修正后的评分预测值为:
r ^ u , k ′ = r ^ u , k + RB u
即为原始的系统评分预测值与相应的推荐偏差之和;修正后的系统评分预测值尽管比修正前具备更高的精确度,但仍会与真实的用户评分存在出入;所以,当用户对系统推荐的项目做出真实评分反馈后,系统将会根据用户反馈评分对相应的推荐偏差估计值进行更新;当用户u对系统推荐的项目j做出评分反馈时,相应的推荐偏差RBu将会按照下式进行更新:
RB u old = Σ i ∈ R ( u ) ( r u , i - r ^ u , i ) | R old ( u ) | + γ RB u new = Σ i ∈ R ( u ) ( r u , i - r ^ u , i ) + ( r u , j - r ^ u , j ) | R old ( u ) | + 1 + γ
⇒ RB u new = RB u old · ( | R ( u ) old | + γ ) + ( r u , j - r ^ u , j ) | R ( u ) old | + 1 + γ
其中,推荐偏差移除中的代入相似度权重的推荐偏差移除是将评分相似度作为权重因数引入推荐偏差的估计过程;具体做法是,分别为用户估计在每个项目上的推荐偏差,同时代入项目间的评分相似度进行加权平均;在估计系统为用户u推荐项目k时的推荐偏差RBu,k时,其估计方式如下式所示:
RB u , k = Σ i ∈ R ( u ) sim i , k ( r u , i - r ^ u , i ) γ + Σ i ∈ R ( u ) sim i , k
上式估计的推荐偏差同样根据用户的反馈评分进行更新:当用户u对系统推荐的项目j做出评分反馈时,涉及到的推荐偏差RBu,k按照下式进行更新:
RB u old = Σ i ∈ R ( u ) sim i , k ( r u , i - r ^ u , i ) γ + Σ i ∈ R ( u ) sim i , k RB u new = sim j , k ( r u , j - r ^ u , j ) + Σ i ∈ R ( u ) sim i , k ( r u , i - r ^ u , i ) γ + sim j , k + Σ i ∈ R ( u ) sim i , k
⇒ RB u new = sim j , k ( r u , j - r ^ u , j ) + RB u old · ( γ + Σ i ∈ R ( u ) sim i , k ) γ + sim j , k + Σ i ∈ R ( u ) sim i , k .
CN201110003783.5A 2011-01-10 2011-01-10 一种对个性化推荐结果进行优化的fr方法 Active CN102073720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110003783.5A CN102073720B (zh) 2011-01-10 2011-01-10 一种对个性化推荐结果进行优化的fr方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110003783.5A CN102073720B (zh) 2011-01-10 2011-01-10 一种对个性化推荐结果进行优化的fr方法

Publications (2)

Publication Number Publication Date
CN102073720A CN102073720A (zh) 2011-05-25
CN102073720B true CN102073720B (zh) 2014-01-22

Family

ID=44032259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110003783.5A Active CN102073720B (zh) 2011-01-10 2011-01-10 一种对个性化推荐结果进行优化的fr方法

Country Status (1)

Country Link
CN (1) CN102073720B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102508907B (zh) * 2011-11-11 2013-11-20 北京航空航天大学 一种基于训练集优化的推荐系统的动态推荐方法
CN102376063B (zh) * 2011-11-29 2013-09-25 北京航空航天大学 一种基于社会化标签的个性化推荐系统优化方法
CA2825498C (en) * 2012-08-31 2017-05-16 Accenture Global Services Limited Hybrid recommendation system
CN103312591A (zh) * 2013-05-27 2013-09-18 复旦大学 一种在sns网络中基于好友优先级自适应调优的推荐方法和系统
CN104216883A (zh) * 2013-05-29 2014-12-17 酷盛(天津)科技有限公司 视频推荐理由生成系统及方法
CN105574025B (zh) * 2014-10-15 2018-10-16 阿里巴巴集团控股有限公司 用于计算排序分及建立模型的方法、装置及商品推荐系统
CN105260471B (zh) * 2015-10-19 2019-03-26 广州品唯软件有限公司 商品个性化排序模型训练方法及系统
CN105760950B (zh) * 2016-02-05 2018-09-11 第四范式(北京)技术有限公司 提供或获取预测结果的方法、装置以及预测系统
CN106503096B (zh) * 2016-10-14 2020-02-04 上海斐讯数据通信技术有限公司 基于分布式防噪声干扰的社交网络推荐方法及系统
CN107330747B (zh) * 2017-05-16 2020-12-01 深圳和而泰智能家居科技有限公司 美容设备档位推荐方法、美容设备以及存储介质
CN107256251B (zh) * 2017-06-08 2020-08-25 阿里巴巴(中国)有限公司 一种应用软件搜索方法、装置及服务器
CN108053243A (zh) * 2017-12-12 2018-05-18 朱明君 一种基于社会网络的商品推荐系统
CN108764756B (zh) * 2018-06-14 2021-09-28 洛阳新奥能源发展有限公司 一种企业管理方法及装置
CN111240562B (zh) * 2018-11-28 2023-04-25 阿里巴巴集团控股有限公司 数据处理方法、装置、终端设备及计算机存储介质
CN111563783B (zh) * 2019-02-14 2021-03-16 上海游昆信息技术有限公司 一种物品推荐方法及装置
CN110059257B (zh) * 2019-04-28 2021-02-19 东北大学 基于评分修正的项目推荐方法
CN110347906A (zh) * 2019-05-20 2019-10-18 拉扎斯网络科技(上海)有限公司 一种用户行为展示方法及装置、电子设备及存储介质
CN110751188B (zh) * 2019-09-26 2020-10-09 华南师范大学 基于多标记学习的用户标签预测方法、系统及存储介质
CN112765458B (zh) * 2021-01-07 2022-10-14 同济大学 基于度量分解和标签自适应分配权重的混合推荐方法
CN114090854B (zh) * 2022-01-24 2022-04-19 佰聆数据股份有限公司 基于信息熵的标签权重智能更新方法、系统及计算机设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967533A (zh) * 2006-07-17 2007-05-23 北京航空航天大学 采用元推荐引擎的门户个性化推荐服务方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967533A (zh) * 2006-07-17 2007-05-23 北京航空航天大学 采用元推荐引擎的门户个性化推荐服务方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
罗辛 等.通过相似度支持度优化基于K近邻的协同过滤算法.《计算机学报》.2010,第33卷(第8期),1437-1445页.
通过相似度支持度优化基于K近邻的协同过滤算法;罗辛 等;《计算机学报》;20100831;第33卷(第8期);1437-1445页 *

Also Published As

Publication number Publication date
CN102073720A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
CN102073720B (zh) 一种对个性化推荐结果进行优化的fr方法
CN102750336B (zh) 一种基于用户关联性的资源个性化推荐方法
CN102376063B (zh) 一种基于社会化标签的个性化推荐系统优化方法
CN108205766A (zh) 信息推送方法、装置及系统
CN105741134A (zh) 跨数据源的营销人群在市场营销中应用的方法及装置
CN104935963A (zh) 一种基于时序数据挖掘的视频推荐方法
CN102799671B (zh) 基于PageRank算法的网络个性化推荐方法
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN103559197A (zh) 基于上下文预过滤的实时音乐推荐方法
CN105426486A (zh) 一种基于用户行为数据的手机app推送方法
CN102033883A (zh) 一种提高网站数据传输速度的方法、装置及系统
CN105786983A (zh) 一种基于学习地图与协同过滤的员工个性化学习推荐方法
CN108399564A (zh) 信用评分方法及装置
CN102682046A (zh) 社交网络的节点搜索和分析方法及搜索系统
CN102609533A (zh) 一种基于核方法的协同过滤推荐系统及方法
CN104834695A (zh) 基于用户兴趣度和地理位置的活动推荐方法
CN106611353B (zh) 一种获取受众的方法和服务器设备
CN104424247A (zh) 一种产品信息过滤推荐方法和装置
CN102306177B (zh) 一种多策略组合的本体或实例匹配方法
CN103500228A (zh) 一种协同过滤推荐算法中改进的相似性度量方法
CN105023178A (zh) 一种基于本体的电子商务推荐方法
CN104063429A (zh) 电子商务中用户行为的预测方法
CN103294812A (zh) 一种基于混合模型的商品推荐方法
CN110188268A (zh) 一种基于标签和时间信息的个性化推荐方法
CN102799656A (zh) 一种面向目标用户的个性化产品包的提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170929

Address after: 101407 Beijing city Huairou District Yanqi Park Economic Development Zone Street No. 6 Building 2 room 208

Patentee after: Beijing Tianshi and culture communication limited liability company

Address before: 100191 Beijing City, Haidian District Xueyuan Road No. 37 North College of computer

Patentee before: Beihang University

PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20210730

Granted publication date: 20140122