CN102376063B

CN102376063B - 一种基于社会化标签的个性化推荐系统优化方法

Info

Publication number: CN102376063B
Application number: CN 201110386982
Authority: CN
Inventors: 欧阳元新; 秦思思; 张秦; 熊璋
Original assignee: Beihang University
Current assignee: Beijing Tianshi and culture communication limited liability company
Priority date: 2011-11-29
Filing date: 2011-11-29
Publication date: 2013-09-25
Anticipated expiration: 2031-11-29
Also published as: CN102376063A

Abstract

本发明公开了一种基于社会化标签的个性化推荐系统优化方法，该方法采用社会标签相似度和评分相似度，应用于面向用户和项目的K近邻模型的计算，然后将K近邻的用户和项目同时用于计算用户对项目的预测评分。该方法由于同时采用了标签相似度和评分相似度，使得用户和项目的K近邻计算更加精确，其推荐精度明显高于单采用评分相似度的推荐精度，并且能避免基于标签相似度模型的冷启动问题。然后使用面向用户和项目的推荐模型计算预测评分，能避免数据稀疏性问题，且其推荐精度也明显高于现有的面向用户的推荐模型和面向项目的推荐模型。

Description

一种基于社会化标签的个性化推荐系统优化方法

技术领域

本发明涉及一种适用于电子商务信息的个性化推荐系统，更特别地说，是指一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法。

背景技术

在电子商务迅猛发展过程中，个性化推荐技术功不可没，个性化推荐是根据用户的喜好和兴趣，个性化推荐系统向用户推荐他可能感兴趣的项目，从而促进销售额的提高。在个性化推荐系统中多数使用协同过滤方法提供个性化推荐信息，用户在协同过滤推荐系统中，用户对项目的兴趣被量化为用户对项目的评分。在给定用户集U＝{u₁，u₂，…，u_c，…u_m}和项目集I＝{i₁，i₂，...，i_a，…i_n}的条件下，用户-项目的评分矩阵表示为R＝|U|×|I|。在R＝|U|×|I|中用户对项目的评分值区间为[0，5]，评分越高则代表用户对项目的喜爱程度越高。

基于邻居关系的协同过滤推荐模型，即K近邻推荐模型，是通过得到与用户最相似的前K个用户或与项目最相似的前K个项目进行建模的，它包括基于评分相似度的面向用户的K近邻模型和面向项目的K近邻模型，其建模过程是：根据已有评分矩阵计算用户间或项目间的评分相似度得到用户的K近邻用户集合或项目的K近邻项目集合；根据K近邻用户对项目的评分和K近邻用户与用户间的相似度，或用户对K近邻项目的评分和K近邻项目于项目间的相似度，计算面向用户或面向项目的预测评分。该K近邻模型具备简单直观，实现难度低，推荐结果易于解释等优点，但其也存在用户-项目评分数据的解释性差，冷启动问题，以及推荐精度不高等缺陷。因此，众多研究者们一直在努力尝试设计出具有更好推荐精度的协同过滤推荐系统。

在个性化推荐系统的研究领域中，K近邻模型是协同过滤推荐系统中使用最方便简单，且较为成熟的一种方法，但是单一的K近邻模型推荐性能有所缺陷，故而针对该K近邻模型进行优化的研究十分活跃，其中有代表性的包括Jun Wan等提出的通过相似度融合将面向项目和面向用户的推荐模型进行组合，Karen H.L.等提出的将社会标签与用户-项目矩阵进行矩阵扩展形成含有社会标签的面向项目和面向用户的模型矩阵，然后计算相似度进而进行推荐，等等。他们提出的方法较为新颖，但仍然存在信息损失的问题，比如冷启动问题和数据稀疏性问题，故而，本专利提出的方法是针对社会化标签相似度和评分相似度构造面向用户和项目的个性化推荐优化方法。社会化标签是用户根据自己的兴趣爱好向项目标注的单词或词组，该类信息可以体现用户的标注兴趣，从而体现用户之间或项目之间的相似性。

发明内容

本发明的目的是提出一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法，该方法同时采用社会化标签相似度和评分相似度，使用面向用户和项目的K近邻模型计算预测评分，使个性化推荐系统的推荐精度得到提高，并弥补数据稀疏性和冷启动问题。本发明采用社会化标签在个性化推荐系统中进行K近邻模型的建模，然后通过K近邻模型建模对未知评分进行预测，获得用户更加感兴趣更高的项目。

本发明是一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法，其特征在于包括有下列步骤：

第一步：在电子商务的项目集I＝{i₁，i₂，...，i_a，…i_n}和用户集U＝{u₁，u₂，...，u_c，...u_m}中采用矩阵形式表达出用户-项目评分矩阵R＝|U|×|I|和用户-项目社会化标签矩阵T＝|U|×|I|；

第二步：依据用户-项目评分矩阵R＝|U|×|I|、用户-项目社会化标签矩阵T＝|U|×|I|在K近邻推荐模型中获取目标项目i_n与任意一项目i_a之间的项目间相似度ISim(i_n→i_a)；

第三步：采用所述第二步的处理方法遍历目标项目i_n分别与项目集I＝{i₁，i₂，...，i_a，…i_n}中项目处理，目标项目i_n的项目集相似度ISim(i_n)；

第四步：依据用户-项目评分矩阵R＝|U|×|I|、用户-项目社会化标签矩阵T＝|U|×|I|在K近邻推荐模型中获取目标用户u_m与任意一用户u_c之间的用户间相似度USim(u_m→u_c)；

第五步：采用所述第四步的处理方法遍历目标项目i_n分别与用户集U＝{u₁，u₂，…，u_c，...u_m}中用户处理，目标项目i_n的用户集相似度UTSim(u_m)；

第六步：获取目标用户-近邻项目评分r(u_m，i′)；

根据项目集相似度ISim(i_n)来获取与目标项目i_n相似度最高的前面的项目，得到目标项目i_n的K近邻项目集合KNN(i_n)；所述K近邻项目集合KNN(i_n)中的任意一个元素记为i′，则有目标用户u_m对目标项目i_n的K近邻项目集合KNN(i_n)中任意一元素的评分记为r(u_m，i′)；

第七步：获取近邻用户-目标项目评分r(u′，i_n)；

根据用户集相似度USim(u_m)来获取与目标用户u_m相似度最高的前面的用户，得到目标用户u_m的K近邻用户集合KNN(u_m)。所述K近邻用户集合KNN(u_m)中的任意一个元素记为u′，则有目标用户u_m的K近邻用户集合KNN(u_m)对目标项目i_n的评分记为r(u′，i_n)；

第八步：从项目集相似度ISim(i_n)中选取与K近邻项目集合KNN(i_n)相关的相似度ISim(KNN(i_n))；

从用户集相似度USim(u_m)中选取与K近邻用户集合KNN(u_m)相关的相似度USim(KNN(u_m))；

第九步：计算预测评分

对目标用户-近邻项目评分r(u_m，i′)、近邻用户-目标项目评分r(u′，i_n)、目标项目-K近邻相似度ISim(KNN(i_n))和目标用户-K近邻相似度USim(KNN(u_m))进行加权平均，得到目标用户u_m对目标项目i_n的预测评分

\hat{r} (u_{m}, i_{n}) = \frac{\underset{v &Element; KNN (u_{m}) \cap R (i_{n})}{Σ} USim (u_{m}, v) \cdot r (v, i_{n}) + \underset{j &Element; KNN (i_{n}) \cap R (u_{m})}{Σ} ISim (i_{n}, j) \cdot r (u_{m}, j)}{\underset{v &Element; KNN (u_{m}) \cap R (i_{n})}{Σ} USim (u_{m}, v) + \underset{j &Element; KNN (i_{n}) \cap R (u_{m})}{Σ} ISim (i_{n}, j)}

，v表示目标项目i_n的求和对象，KNN(u_m)表示目标用户u_m的K近邻用户集合，R(i_n)表示目标项目i_n的被评分集，USim(u_m，v)表示目标用户u_m与求和对象v的用户相似度，r(v，i_n)表示目标项目i_n在R＝|U|×|I|中的元素，KNN(i_n)表示目标项目i_n的K近邻项目集合，R(u_m)表示目标用户u_m的被评分集，ISim(i_n，j)表示目标项目i_n与求和对象j的项目相似度，r(u_m，j)表示目标用户u_m在R＝|U|×|I|中的元素。

本发明个性化推荐系统优化的优点在于：

①在个性化推荐系统的研究领域中，K近邻推荐模型是一种简单直观且较为成熟的一种推荐方法，但目前该类方法的推荐精度偏低。而本专利中的K近邻模型，使用了面向用户和项目的K近邻模型，并且加入社会化标签的相似度，从而使得其推荐模型的推荐精度均有提高。

②本发明提出的同时使用标签相似度和评分相似度共同计算用户间或项目间的相似度，可以得到更精确的K近邻用户或K近邻项目，并弥补标签或评分的数据稀疏性问题，有效得提高个性化推荐精度。

③本发明采用面向用户和项目的K近邻模型计算用户对项目的预测评分，可以弥补数据冷启动问题，并且提高个性化推荐精度。

④本发明提出的基于社会化标签的面向用户和项目的个性化推荐方法，相比基于评分相似度的面向用户或面向项目的推荐方法，推荐性能有较大提高，其MAE值明显降低，Coverage和RightRec值明显提高。

附图说明

图1是基于社会化标签的面向用户和项目的个性化推荐模型结构图。

图2是随着s值上升面向用户的K近邻模型的MAE值。

图3是随着K值的上升面向用户的K近邻模型的MAE值。

图4是随着K值的上升各推荐模型的MAE值。

图5是随着K值的上升各推荐模型的Coverage值。

图6是随着K值的上升各推荐模型的RightRec值。

具体实施方式

下面将结合附图对本发明做进一步的详细说明。

本发明是一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法，首先选取出用户-项目社会化标签矩阵T＝|U|×|I|和用户-项目评分矩阵R＝|U|×|I|作为K近邻推荐模型的基础矩阵；然后通过K近邻推荐模型对所述基础矩阵进行处理，得到项目集相似度ISim(i_n)、用户集相似度UTSim(u_m)；然后从项目集相似度ISim(i_n)和用户集相似度UTSim(u_m)中选取出相似度最高的前面的项，通过K近邻用户集合的处理得到近邻用户-目标项目评分r(u′，i_n)、目标用户-近邻项目评分r(u_m，i′)；最后采用加权平均法得到目标用户u_m对目标项目i_n的预测评分。

在本发明中，项目是指电子商务中展现出的商品，如书籍、电影、服装、食品等商品。项目采用数学集合形式表达为I＝{i₁，i₂，...，i_a，…i_n}，i₁表示第1个项目，i₂表示第2个项目，i_a表示第a个项目，也称为任意一个项目，i_n表示第n个项目，为了叙述方便下文称为目标项目。

在本发明中，用户是指电子商务中注册的用户，或者是购买过商品的用户。用户采用数学集合形式表达为U＝{u₁，u₂，...，u_c，...u_m}，u₁表示第1个用户，u₂表示第2个用户，u_c表示第c个用户，也称为任意一个用户，u_m表示第m个用户，为了叙述方便下文也称为目标用户。

在个性化推荐系统中以使用协同过滤方法提供个性化推荐信息，用户在协同过滤推荐中，用户对项目的兴趣被量化为用户-项目评分矩阵R＝|U|×|I|，用户-项目评分矩阵中的任意一元素记为r(u_m，i_n)。实验数据的训练集中，目标用户u_m对项目集I＝{i₁，i₂，...，i_a，…i_n}的评分集记为r(u_m)，目标项目i_n被用户集U＝{u₁，u₂，…，u_c，...u_m}评分过的评分集记为r(i_n)，被目标用户u_m评分过的项目集记为R(u_m)，对目标项目i_n评分过的用户集记为R(i_n)。推荐系统向目标用户u_m推荐的项目集记为

，实验数据的测试集中目标用户u_m实际评分过的项目集记为R′(u_m)。

在个性化推荐系统中使用社会化标签提供个性化推荐信息，用户对项目的兴趣被量化为用户-项目社会化标签矩阵T＝|U|×|I|，用户-项目社会化标签矩阵中的任意一元素记为t(u_m，i_n)。

参见图1所示，本发明是一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法，该优化方法包括有下列步骤：

第一步：在电子商务的项目集I＝{i₁，i₂，...，i_a，…i_n}和用户集U＝{u₁，u₂，…，u_c，...u_m}中采用矩阵形式表达出用户-项目评分矩阵R＝|U|×|I|和用户-项目社会化标签矩阵T＝|U|×|I|所述的R＝|U|×|I|和T＝|U|×|I|为个性化推荐系统中的两个基础矩阵。

第二步：依据用户-项目评分矩阵R＝|U|×|I|用户-项目社会化标签矩阵T＝|U|×|I|在K近邻推荐模型中获取目标项目i_n与任意一项目i_a之间的项目间相似度ISim(i_n→i_a)；

第201步骤：采用K近邻推荐模型对用户-项目评分矩阵R＝|U|×|I|进行处理，获得目标项目i_n的被评分集R(i_n)及任意一项目i_a的被评分集R(i_a)；然后使用Pearson相关相似度计算i_n和i_a的项目间评分相似度

IRSim (i_{n} &RightArrow; i_{a}) = \frac{\underset{v &Element; R (i_{n}) \cap R (i_{a})}{Σ} (r (v, i_{n}) - \overset{&OverBar;}{r (i_{n})}) (r (v, i_{a}) - \overset{&OverBar;}{r (i_{a})})}{\sqrt{\underset{v &Element; R (i_{n}) \cap R (i_{a})}{Σ} {(r (v, i_{n}) - \overset{&OverBar;}{r (i_{n})})}^{2}} \sqrt{\underset{v &Element; R (i_{n}) \cap R (i_{a})}{Σ} {(r (v, i_{a}) - \overset{&OverBar;}{r (i_{a})})}^{2}}}, v

表示目标项目i_n的求和对象，r(v，i_n)表示目标项目i_n在R＝|U|×|I|中的元素，r(i_n)表示目标项目i_n被用户U＝{u₁，u₂，…，u_c，…u_m}评分过的评分集，r(v，i_a)表示任意一项目i_a在R＝|U|×|I|中的元素，r(i_a)表示任意一项目i_a被用户U＝{u₁，u₂，…，u_c，…u_m}评分过的评分集；

第202步骤：采用K近邻推荐模型对用户-项目社会化标签矩阵T＝|U|×|I|进行处理，获得目标项目i_n被所有用户标注过的所有标签集及任意一项目i_a被所有用户标注过的所有标签集

然后将

与

进行相同单词的比较，得到i_n和i_a的项目间标签相似度

第203步骤：对项目间评分相似度IRSim(i_n→i_a)和项目间标签相似度ITSim(i_n→i_a)进行加权平均计算得到，项目间相似度ISim(i_n→i_a)＝s·ITSim(i_n→i_a)+(1-s)·IRSim(i_n→i_a)，s表示相似度阈值，一般设置为[0，1]。

在本发明中，相似度阈值s经本专利的实验验证得知s取值为0.9时，效果最佳，可有效解决社会化标签信息缺失的冷启动问题。

第三步：采用所述第二步的处理方法遍历目标项目i_n分别与项目集I＝{i₁，i₂，…，i_a，…i_n}中项目处理，目标项目i_n的项目集相似度ISim(i_n)；

第401步骤：采用K近邻推荐模型对用户-项目评分矩阵R＝|U|×|I|进行处理，获得目标用户u_m的被评分集R(u_m)及任意一用户u_c的被评分集R(u_c)；然后使用Pearson相关相似度计算u_m和u_c的用户间评分相似度

URSim (u_{m} &RightArrow; u_{c}) = \frac{\underset{j &Element; R (u_{m}) \cap R (u_{c})}{Σ} (r (u_{m}, j) - \overset{&OverBar;}{r (u_{m})}) (r (u_{c}, j) - \overset{&OverBar;}{r (u_{c})})}{\sqrt{\underset{j &Element; R (u_{m}) \cap R (u_{c})}{Σ} {(r (u_{m}, j) - \overset{&OverBar;}{r (u_{m})})}^{2}} \sqrt{\underset{i &Element; R (u_{m}) \cap R (u_{c})}{Σ} {(r (u_{c}, j) - \overset{&OverBar;}{r (u_{c})})}^{2}}}

，j表示目标用户u_m的求和对象，r(u_m，j)表示目标用户u_m在R＝|U|×|I|中的元素，r(u_m)表示目标用户u_m被用户U＝{u₁，u₂，…，u_c，...u_m}评分过的评分集，r(u_c，j)表示任意一用户u_c在R＝|U|×|I|中的元素，r(i_a)表示任意一用户u_c被用户U＝{u₁，u₂，…，u_c，...u_m}评分过的评分集；

第402步骤：采用K近邻推荐模型对用户-项目社会化标签矩阵T＝|U|×|I|进行处理，获得目标用户u_m标注过的所有标签集及任意一用户u_c标注过的所有标签集

然后将

与

进行相同单词的比较，得到u_m和u_c的用户间标签相似度

UTSim (u_{m} &RightArrow; u_{c}) = \frac{T_{u_{m}} \cap T_{u_{c}}}{T_{u_{m}} \cup T_{u_{c}}};

第403步骤：对用户间评分相似度URSim(u_m→u_c)和用户间标签相似度UTSim(u_m→u_c)进行加权平均计算得到，用户间相似度USim(u_m→u_c)＝s·UTSim(u_m→u_c)+(1-s)·URSim(u_m→u_c)，s表示相似度阈值，一般为[0，1]。

第六步：获取目标用户-近邻项目评分r(u_m，i′)；

根据项目集相似度ISim(i_n)来获取与目标项目i_n相似度最高的前面的项目(位于目标项目i_n相似度最高的前面的项目的个数记为KI，KI为用户设定值，一般为10个项目、20个项目、30个项目、…、100个项目)，得到目标项目i_n的K近邻项目集合KNN(i_n)；所述K近邻项目集合KNN(i_n)中的任意一个元素记为i′，则有目标用户u_m对目标项目i_n的K近邻项目集合KNN(i_n)中任意一元素的评分记为r(u_m，i′)(简称为目标用户-近邻项目评分r(u_m，i′))。

第七步：获取近邻用户-目标项目评分r(u′，i_n)；

根据用户集相似度USim(u_m)来获取与目标用户u_m相似度最高的前面的用户(位于目标项目i_n相似度最高的前面的用户的个数记为KU，KU为用户设定值，一般为10个用户、20个用户、30个用户、…、100个用户)，得到目标用户u_m的K近邻用户集合KNN(u_m)。所述K近邻用户集合KNN(u_m)中的任意一个元素记为u′，则有目标用户u_m的K近邻用户集合KNN(u_m)对目标项目i_n的评分记为r(u′，i_n)(简称为近邻用户-目标项目评分r(u′，i_n))。

第九步：计算预测评分

\hat{r} (u_{m}, i_{n}) = \frac{\underset{v &Element; KNN (u_{m}) \cap R (i_{n})}{Σ} USim (u_{m}, v) \cdot r (v, i_{n}) + \underset{j &Element; KNN (i_{n}) \cap R (u_{m})}{Σ} ISim (i_{n}, j) \cdot r (u_{m}, j)}{\underset{v &Element; KNN (u_{m}) \cap R (i_{n})}{Σ} USim (u_{m}, v) + \underset{j &Element; KNN (i_{n}) \cap R (u_{m})}{Σ} ISim (i_{n}, j)}

本实验采用三种评价指标验证该推荐方法的性能，包括MAE(MAE Absolute Error，平均绝对误差)、Coverage(覆盖率)和RightRec(准确率)。

在本发明中，所述平均绝对误差

MAE = \frac{\underset{j &Element; \hat{R} (u_{m}) \cap R^{'} (u_{m})}{Σ} | r (u_{m}, j) - \hat{r} (u_{m}, j) |}{| \hat{R} (u_{m}) \cap R^{'} (u_{m}) |}

值越低推荐精度越高。

其中

表示推荐系统为目标用户u_m推荐的项目集，R′(u_m)表示测试数据集中目标用户u_m的已知评分项目集。

在本发明中，Coverage是推荐系统向目标用户u_m所推荐的项目数占测试集中目标用户已知评分项目数的比例，所述覆盖率

Coverage = \frac{Σ | \hat{R} (u_{m}) \cap R^{'} (u_{m}) |}{Σ R^{'} (u_{m})}

值越高推荐精度越高。

在本发明中，RightRec是推荐系统向目标用户u_m所推荐的项目中预测评分大于等于3分的项目数占测试集中目标用户已知评分大于等于3的项目数的比例，所述准确率

RightRec = \frac{{\hat{R} (u_{m}) | \hat{r} (u_{m}, j) > 2, j &Element; \hat{R} (u_{m}) \cap R^{'} (u_{m})}}{{R^{'} (u_{m}) | r (u_{m}, j) > 2, j &Element; R^{'} (u_{m})}}

值越高推荐精度越高。

在实验验证中，使用MovieLens 10M/10K数据集，该数据集包含了69878名用户对10677个项目超过1000万条的评分信息，以及4009名用户对7601个项目标注的95580条社会标签。所有的用户评分都分布在区间[0，5]内，评分值越高，代表用户对相应项目的兴趣越强。由于该数据集较为庞大，实验难度较大，因此在实验过程中，选取包含了1160名用户在2973个项目上的279618条评分数据和74275条社会标签数据，以下简称ML279K/74K数据集。

实验在ML279K/74K数据集上按照80％-20％的比例构造训练-测试数据集。使用MAE(MAE Absolute Error，平均绝对误差)、Coverage(覆盖率)和RightRec(准确率)作为推荐系统预测精度的评价指标，MAE越低推荐精度越高，Coverage和RightRec越高推荐精度越高。下表为六种推荐模型推荐精度的比较，K近邻模型的K取值为40(根据已有研究人员的实验表明K取值30到60时能得到最好推荐性能)。Fusion-WithTags是基于社会化标签的面向用户和项目的个性化推荐模型，ItemsBased-WithTags是面向项目的基于社会化标签的推荐模型，UsersBased-WithTags是面向用户的基于社会化标签的推荐模型，ItemsBased-WithoutTags是面向项目的推荐模型(不添加标签相似度)，UsersBased-WithoutTags是面向用户的推荐模型(不添加标签相似度)。由下表数据可知，当K取值40时，基于社会化标签的面向用户和项目的个性化推荐模型与其他五种推荐模型相比较，其MAE有明显下降，而Coverage和RightRec有明显的提高。

基于社会化标签的个性化推荐比基于评分相似度的个性化推荐有更高的性能，如图2，面向用户的推荐模型，当K取值为40时，s取值0说明没有添加社会标签相似度，s取值1说明没有添加评分相似度，由图可见，s越大MAE越小，当s为1时MAE增大，说明社会标签相似度比评分相似度有更好的性能，但完全使用社会标签时会存在信息缺失问题，所以添加系数为0.1的评分相似度可以解决社会标签的信息缺失问题。如图3所示，面向用户的推荐模型，当K取值从10到100时，s取值分别为0、0.9和1的MAE值，所以s取值为0.9时能最好得权衡社会标签相似度和评分相似度。通过实验得知，面向项目的推荐模型是类似效果。

如图4，图5和图6，基于社会化标签的面向用户和项目的个性化推荐系统的推荐精度相比面向用户和面向项目的个性化推荐精度均有明显提高。

Claims

1.一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法，其特征在于包括有下列步骤：

第一步：在电子商务的项目集I={i₁,i₂,…,i_a,…i_n}和用户集U={u₁,u₂,…,u_c,…u_m}中采用矩阵形式表达出用户－项目评分矩阵R=|U|×|I|和用户－项目社会化标签矩阵T=|U|×|I|；

第二步：依据用户－项目评分矩阵R=|U|×|I|、用户－项目社会化标签矩阵T=|U|×|I|在K近邻推荐模型中获取目标项目i_n与任意一项目i_a之间的项目间相似度ISim(i_n→i_a)；

第三步：采用所述第二步的处理方法遍历目标项目i_n分别与项目集I={i₁,i₂,…,i_a,…i_n}中项目处理，目标项目i_n的项目集相似度ISim(i_n)；

第四步：依据用户－项目评分矩阵R=|U|×|I|、用户－项目社会化标签矩阵T=|U|×|I|在K近邻推荐模型中获取目标用户u_m与任意一用户u_c之间的用户间相似度USim(u_m→u_c)；

第五步：采用所述第四步的处理方法遍历目标项目i_n分别与用户集U={u₁,u₂,…,u_c,…u_m}中用户处理，目标项目i_n的用户集相似度UTSim(u_m)；

第六步：获取目标用户－近邻项目评分r(u_m,i′)；

根据项目集相似度ISim(i_n)来获取与目标项目i_n相似度最高的前面的项目，得到目标项目i_n的K近邻项目集合KNN(i_n)；所述K近邻项目集合KNN(i_n)中的任意一个元素记为i′，则有目标用户u_m对目标项目i_n的K近邻项目集合KNN(i_n)中任意一元素的评分记为r(u_m,i′)；

第七步：获取近邻用户－目标项目评分r(u′,i_n)；

根据用户集相似度USim(u_m)来获取与目标用户u_m相似度最高的前面的用户，得到目标用户u_m的K近邻用户集合KNN(u_m)；所述K近邻用户集合KNN(u_m)中的任意一个元素记为u′，则有目标用户u_m的K近邻用户集合KNN(u_m)对目标项目i_n的评分记为r(u′,i_n)；

第九步：计算预测评分

对目标用户－近邻项目评分r(u_m,i′)、近邻用户－目标项目评分r(u′,i_n)、目标项目－K近邻相似度ISim(KNN(i_n))和目标用户－K近邻相似度USim(KNN(u_m))进行加权平均，得到目标用户u_m对目标项目i_n的预测评分

\hat{r} (u_{m}, i_{n}) = \frac{\underset{v &Element; KNN (u_{m}) \cap R (i_{n})}{Σ} USim (u_{m}, v) \cdot r (v, i_{n}) + \underset{j &Element; KNN (i_{n}) \cap R (u_{m})}{Σ} ISim (i_{n}, j) \cdot (u_{m}, j)}{\underset{v &Element; KNN (u_{m}) \cap R (i_{n})}{Σ} USim (u_{m}, v) + \underset{j &Element; KNN (i_{n}) \cap R (u_{m})}{Σ} ISim (i_{n}, j)},

v表示目标项目i_n的求和对象，KNN(u_m)表示目标用户u_m的K近邻用户集合，R(i_n)表示目标项目i_n的被评分集，USim(u_m,v)表示目标用户u_m与求和对象v的用户相似度，r(v,i_n)表示目标项目i_n在R=|U|×|I|中的元素，KNN(i_n)表示目标项目i_n的K近邻项目集合，R(u_m)表示目标用户u_m的被评分集，ISim(i_n,j)表示目标项目i_n与求和对象j的项目相似度，r(u_m,j)表示目标用户u_m在R=|U|×|I|中的元素；

所述的在第二步中项目间相似度ISim(i_n→i_a)的获取包括下列步骤：

第201步骤：采用K近邻推荐模型对用户－项目评分矩阵R=|U|×|I|进行处理，获得目标项目i_n的被评分集R(i_n)及任意一项目i_a的被评分集R(i_a)；然后使用Pearson相关相似度计算i_n和i_a的项目间评分相似度

v表示目标项目i_n的求和对象，r(v,i_n)表示目标项目i_n在R=|U|×|I|中的元素，r(i_n)表示目标项目i_n被用户U={u₁,u₂,…,u_c,…u_m}评分过的评分集，r(v,i_a)表示任意一项目i_a在R=|U|×|I|中的元素，r(i_a)表示任意一项目i_a被用户U={u₁,u₂,…,u_c,…u_m}评分过的评分集；

第202步骤：采用K近邻推荐模型对用户－项目社会化标签矩阵T=|U|×|I|进行处理，获得目标项目i_n被所有用户标注过的所有标签集Ti_n及任意一项目i_a被所有用户标注过的所有标签集

然后将

与

进行相同单词的比较，得到i_n和i_a的项目间标签相似度

第203步骤：对项目间评分相似度IRSim(i_n→i_a)和项目间标签相似度ITSim(i_n→i_a)进行加权平均计算得到，项目间相似度ISim(i_n→i_a)＝s·ITSim(i_n→i_a)+(1-s)·IRSim(i_n→i_a)，s表示相似度阈值，一般设置为[0,1]；

所述的在第四步中用户间相似度USim(u_m→u_c)的获取包括下列步骤：

第401步骤：采用K近邻推荐模型对用户－项目评分矩阵R=|U|×|I|进行处理，获得目标用户u_m的被评分集R(u_m)及任意一用户u_c的被评分集R(u_c)；然后使用Pearson相关相似度计算u_m和u_c的用户间评分相似度

URSim (u_{m} &RightArrow; u_{c}) = \frac{\underset{j &Element; R (u_{m}) \cap R (u_{c})}{Σ} (r (u_{m}, j) - \overset{&OverBar;}{r (u_{m})}) (r (u_{c}, j) - \overset{&OverBar;}{r (u_{c})})}{\sqrt{\underset{j &Element; R (u_{m}) \cap R (u_{c})}{Σ} {(r (u_{m}, j) - \overset{&OverBar;}{r (u_{m})})}^{2}} \sqrt{\underset{j &Element; R (u_{m}) \cap R (u_{c})}{Σ} {(r (u_{c}, j) - \overset{&OverBar;}{r (u_{c})})}^{2}}},

j表示目标用户u_m的求和对象，r(u_m,j)表示目标用户u_m在R=|U|×|I|中的元素，r(u_m)表示目标用户u_m被用户U={u₁,u₂,…,u_c,…u_m}评分过的评分集，r(u_c,j)表示任意一用户u_c在R=|U|×|I|中的元素，r(i_a)表示任意一用户u_c被用户U={u₁,u₂,…,u_c,…u_m}评分过的评分集；

第402步骤：采用K近邻推荐模型对用户－项目社会化标签矩阵T＝|U|×|I|进行处理，获得目标用户u_m标注过的所有标签集

及任意一用户u_c标注过的所有标签集

然后将

与

进行相同单词的比较，得到u_m和u_c的用户间标签相似度

UTSim (u_{m} &RightArrow; u_{c}) = \frac{T_{u_{m}} \cap T_{u_{c}}}{T_{u_{m}} \cup T_{u_{c}}};

第403步骤：对用户间评分相似度URSim(u_m→u_c)和用户间标签相似度UTSim(u_m→u_c)进行加权平均计算得到，用户间相似度USim(u_m→u_c)＝s·UTSim(u_m→u_c)+(1-s)·URSim(u_m→u_c)，s表示相似度阈值，一般为[0,1]。

2.根据权利要求1所述的基于社会化标签的面向用户和项目的个性化推荐系统优化方法，其特征在于：相似度阈值s取值为0.9时，效果最佳，可有效解决社会化标签信息缺失的冷启动问题。

3.根据权利要求1所述的基于社会化标签的面向用户和项目的个性化推荐系统优化方法，其特征在于：目标项目i_n相似度最高的前面的项目的个数可以为10个项目、20个项目、30个项目、…、100个项目。

4.根据权利要求1所述的基于社会化标签的面向用户和项目的个性化推荐系统优化方法，其特征在于：目标项目i_n相似度最高的前面的用户的个数可以为10个用户、20个用户、30个用户、…、100个用户。