CN104462597B

CN104462597B - 一种综合用户正负性评分和评分偏好因子的协同过滤方法

Info

Publication number: CN104462597B
Application number: CN201410850804.0A
Authority: CN
Inventors: 黄星辰; 秦拯
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2014-12-31
Filing date: 2014-12-31
Publication date: 2018-04-03
Anticipated expiration: 2034-12-31
Also published as: CN104462597A

Abstract

一种综合用户正负性评分和评分偏好因子的协同过滤算法，本发明公开了一种应用于个性化推荐系统中的协同过滤项目推荐方法，协同过滤的基本思想首先是通过个性化推荐系统提供的用户对项目的评分记录构造评分矩阵；然后根据评分矩阵寻找与目标用户兴趣相似的用户；最后根据找到的相似用户的喜好对目标用户进行项目推荐。本发明所述的推荐步骤基于基本协同过滤的思想，从相似用户的寻找和预测评分的计算两个方面出发实现创新突破，提高了计算目标用户对项目的预测评分的准确性，从而做出更准确的项目推荐。

Description

一种综合用户正负性评分和评分偏好因子的协同过滤方法

技术领域

本发明涉及个性化推荐领域，具体为一种综合用户正负性评分和评分偏好因子的协同过滤方法，它适用于电子商务网站的个性化推荐，属于信息检索、数据挖掘技术领域。

背景技术

在互联网的发展下，电子商务的发展日益壮大，随着商品信息的增加，达到了一个信息过载的时期，用户难以从巨大的商品数据库中选出自己需要的商品。推荐系统是当前解决上述问题的有效方法之一。

在已有的推荐系统所使用的推荐方法中，协同过滤推荐方法是在实际应用中使用非常广泛的一类推荐方法。协同过滤方法可分为基于用户(User-based)和基于项目(Item-based)的两种，User-based协同过滤的思想认为，相似用户在给项目评分时往往会给出相近的评分。所谓“相似用户”，即为“兴趣”相似的用户。当需要对某一用户进行商品推荐时，协同过滤方法通过综合待推荐用户的相似用户对某一商品的评分，预测待推荐用户对此商品的评分，进一步估计待推荐用户对商品的喜好程度，从而得出推荐结果——即将用户评分最高的N个商品推荐给用户。对于与待预测的用户相似的用户，其相似性越高，评分预测也就越准确，推荐的效果也就越好。

传统的User-based协同过滤方法普遍使用皮尔逊相关系数或余弦相似性公式来计算用户之间的相似性，但这两种方法在计算预测评分准确度方面还不太理想，因此推荐效果还有待提高。为了进一步提高User-based协同过滤方法的推荐效果，许多学者提出了一些新的方法来提高用户相似性计算的准确性。比如，M.Jamali认为，如果两个用户共同评过分的商品超过一定数量，则这两个用户的相似性应该比传统相似性计算公式算出的更高，于是他们利用sigmod函数来表征这种特性，并在传统的皮尔逊相关系数中引入此参数。HuiFeng Sun基于欧几里德距离，提出了适用于多维向量空间的相似性计算函数，平衡了不同维度向量间的相似性计算所引起的误差。Keunho Choi通过将项目相似性计算的结果作为权重系数加入到用户评分中，再进行用户相似性计算，提高了用户相似性计算的准确性。

无论是传统的User-based协同过滤方法，以及目前基于该方法的改进，都是直接采用评分矩阵中的分数值进行计算，这种计算方法实际上是假定了所有用户对评分系统中的每种分值都有相同的理解，也就是说，在[1,5]范围的评分系统中，无论哪个用户给某个项目评4分时，现有方法都认为用户对此项目比较满意。然而从实际经验可知，用户对评分系统中的各个分值是有自己的理解的；人们在对一个项目评分时，也有自己的打分习惯。另一方面，当今电商网站的评分系统已经在评分网页的页面提示中加入了评分引导语，使得用户下意识的把评分值分为正性打分(对项目表示喜欢的评分)和负性评分(对项目表示不喜欢的评分)，那么这两种情景下，用户的评分标准也可能不同。现有的计算方法都忽略了这两个方面的影响。

发明内容

本发明针对现有协同过滤技术在计算用户相似性和预测评分时，忽略用户评分偏好和评分正负性而导致的预测评分计算得不够准确的问题，提出一种综合用户正负性评分和评分偏好因子的协同过滤方法，即(Positive-Negative-Rating-PreferenceCollaborative Filtering,PNRP_CF)方法。本发明所提出的方法，一方面在计算用户相似性时，从正负评分两个方面来计算用户评分偏好因子，并将其加入基于距离的相似性计算公式中，以此来缓解评分偏好所带来的影响，从而能更准确的寻找相似用户；另一方面，在计算预测评分时，也通过区分评分正负性来计算预测分值，有效地提高预测评分的准确性。

为解决上述技术问题，本发明所采用的技术方案是一种综合用户正负性评分和评分偏好因子的协同过滤方法，该方法包括以下步骤为：

步骤1：根据推荐系统(电影网站、电商网站等)提供的用户-项目评分记录构造用户-项目评分矩阵R。

步骤2：当需要为用户u进行推荐时，利用步骤1得到的评分矩阵R的数据和评分正负性相似计算公式，计算用户u与其他用户v的相似性值sim(u,v)，公式包含式(1)、式(2)。

式(1)中，I_uv为用户u和用户v共同评分过的项目集合，|I_uv|为集合中的元素个数；r_u,i，r_v,i分别为用户u和用户v对项目i的评分；r_min为评分系统中相邻两个评分间的最小差值，比如1——5分的评分系统有1、2、3、4、5，5种分值，最小分差为1，则r_min为1；Rp(u,v,i)为评分偏好因子，计算方法如式(2)所示。式(2)中，分别表示用户u和用户v的正性评分平均值(定义：在一个推荐系统的评分分值范围中，高于中位数的分值称为“正性评分”；低于和等于中位数的分值称为“负性评分”)；分别表示用户u和用户v的负性评分平均值；r_mx为评分系统的最大分值，比如1——5分的评分系统，最大分值为5；r_med为评分系统的中位数分值，比如1——5分的评分系统，中位数分值为3。

步骤3：将步骤2中的相似性值从大到小排列，取前k(k的大小可根据实际需要调节)个用户，作为用户u的最近邻用户集合N_u，

步骤4：取步骤3中得到的最近邻用户集合N_u以及这些近邻用户与用户u的相似性值，当要计算用户u的某个未评分项目i的预测评分时，将N_u中对项目i的评分为正性评分的用户划分到集合对项目i的评分为负性评分的用户划分到集合利用正负性评分预测公式计算用户u对项目i的评分预测值，如公式(3)所示，

式(3)中σ_u+，σ_v+分别表示用户u和用户v的正性评分方差；σ_u-，σ_v-分别表示用户u和用户v的负性评分方差；表示用户u所有评分项目的评分平均值；分别表示集合的元素个数。

步骤5：重复步骤4，直至将用户u所有未评分项目的评分预测值全部计算出来，然后将这些的预测值从大到小排列，选择前N个项目作为推荐项目。

本发明提供的上述综合用户正负性评分和评分偏好因子的协同过滤方法，基于基本协同过滤的思想，从相似用户的寻找和预测评分的计算两个方面出发实现创新突破：一是在计算用户相似性时考虑传统User-based协同过滤方法没有考虑到的评分偏好因素，并从评分正负性两个方面来计算评分偏好因子；二是在计算预测评分时同样区分正性评分和负性评分两种情况来计算。通过这两方面的改进，本发明相比于基于皮尔逊相关性和基于余弦相似性的传统的User-based协同过滤方法，提高了计算目标用户对项目的预测评分的准确性，特别是在评分系统的分值范围较宽广的推荐系统中优势更明显。本发明适用于电子商务推荐系统，如电影网站、图书网站、购物网站等等。

附图说明：

图1为本发明所述方法的具体流程图；

图2为实例中所用数据集的用户-项目评分记录的一小部分示意图；

图3为实例中从所用数据集中构造出的用户-项目评分矩阵的一小部分示意图；

图4为实例中各种推荐方法在ML_1M数据集上MAE比较示意图；

图5为实例中各种推荐方法在BookCrossing数据集上MAE比较示意图；

图中符号说明如下：

MAE：平均绝对误差；

K-neighbors：近邻用户数；

PCC_CF：基于皮尔逊相关系数(Pearson,PCC)的协同过滤方法；

COS_CF：基于余弦相似性(Cosine,COS)的协同过滤方法；

PNRP_CF：综合用户正负性评分和评分偏好因子的协同过滤方法

具体实施方式

下面结合附图及实施例，对本发明的技术方案做进一步的说明。本实施例在分别在MovieLens_1M数据集(以下简称ML_1M数据集)和BookCrossing数据集上进行。ML_1M数据集是明尼苏达大学GroupLens研究小组通过MovieLens网站收集的公共推荐系统性能评测数据集之一，包含了6040名用户对3952个项目的1,000,209条的评分信息。所有的用户对项目的评分都分布在区间[1，5]内，有1、2、3、4、5，5种评分值，评分值越高，代表用户对相应项目的兴趣越强。BookCrossing数据集是网上的Book-Crossing图书社区的278,858个用户对271,379本书进行的评分，这些用户的年龄等人口统计学属性(demographic feature)都以匿名的形式保存并供分析。所有的用户对项目的评分都分布在区间[0，10]内，有0、1、2、3、4、5、6、7、8、9、10，11种评分值，评分值越高，代表用户对相应项目的兴趣越强。实验在两个数据集上都按照80％-20％的比例构造训练-测试数据集，测试数据集中的用户均为待预测，分别做10组实验，实验过程中最近邻用户集合中的用户数从10依次增加到100，每次增加10个。

一种综合用户正负性评分和评分偏好因子的协同过滤方法，处理流程如图1所示，包括以下具体步骤：

步骤1：读入训练-测试数据集的用户-项目评分记录，该记录的格式如图2所示；在计算机内存中构造如图2所示的用户-项目评分矩阵R，图3中“---”表示用户未对该项目评过分。

步骤2：当需要对测试数据集中的用户u进行推荐时，利用评分矩阵R中的数据和式(1)、式(2)计算用户u与在训练数据集中的其他用户v的相似性值sim(u,v)。此时，对于实验用的ML_1M数据集，式(1)中相邻两个评分间的最小差值r_min＝1，式(2)中评分系统的最大分值r_mx＝5，评分系统的中位数分值r_med＝3；对于实验用的BookCrossing数据集，r_min＝1，r_mx＝10，r_med＝5

步骤3：将步骤2中的相似性值从大到小排列，取前k(本实施例中k的大小从10开始每轮实验增加10，一直到100)个用户，作为用户u的最近邻用户集合N_u。

步骤4：设用户u的某个未评分项目为i，取步骤3中得到的最近邻用户集合N_u，将N_u中对项目i的评分为正性评分的用户划分到集合对项目i的评分为负性评分的用户划分到集合利用式(3)计算用户u对项目i的评分预测值。

本实施例将所提出的方法与两种常用的传统User-based协同过滤方法——基于皮尔逊相关性的协同过滤方法和基于余弦相似性的协同过滤方法做比较，两种传统的协同过滤方法步骤与本发明方法的步骤类似，只是在步骤2计算用户相似性和预测评分时所用的公式不同，式(4)为皮尔逊相关性公式；式(5)为余弦相似性公式；式(6)为两种传统方法计算预测评分所用的公式。

为了检验本发明方法对面向用户的K近邻模型的预测评分精度的影响，故而使用平均绝对误差——MAE作为推荐模型主要的性能评价指标，MAE值越低，说明预测评分精度越高。设N为使用测试方法(本实施例中为PCC_CF，COS_CF，PNRP_CF)在测试数据集中预测过的评分项目数目，p_i表示测试方法对项目i的预测评分，q_i表示测试集中用户对项目i的真实评分，则平均绝对误差MAE的定义如下，

由图4和图5所示，PNRP_CF方法在ML_1M和BookCrossing两种数据集中的MAE均低于PCC_CF和COS_CF两种方法，说明在预测评分的准确度上，PNRP_CF方法均优于PCC_CF和COS_CF两种方法。另一方面，在图4中，PNRP_CF方法与PCC_CF和COS_CF的最小值差距是0.04；在图5中最小值差距是0.045，说明BookCrossing数据集[0，10]的评分范围更利于PNRP_CF方法发挥其从正负两个方面细粒度计算预测评分的优势。

以上实验结果显示，PNRP_CF方法能提高预测评分的准确性，准确的预测评分是协同过滤推荐系统形成推荐项目最重要的依据。对于现在互联网上繁多的商品、电影等其他娱乐项目，用户难以浏览这些过载的项目信息而做出选择，那么推荐系统作为解决信息过载最有效的工具变得越来越重要，所以本发明所提出的方法是具有现实意义的。

Claims

1.一种综合用户正负性评分和评分偏好因子的协同过滤方法，其特征在于，包括以下步骤：

步骤1：通过推荐系统提供的用户-评分记录构造成评分矩阵R；

步骤2：当需要对用户u进行推荐时，利用评分矩阵R的数据和评分正负性相似计算公式，计算u与其他用户v的相似性值，评分正负性相似计算公式如下式(1)所示，

<mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>I</mi> <mrow> <mi>u</mi> <mi>v</mi> </mrow> </msub> <mo>|</mo> </mrow> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>I</mi> <mrow> <mi>u</mi> <mi>v</mi> </mrow> </msub> </mrow> </munder> <mi>R</mi> <mi>p</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>,</mo> <mi>i</mi> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>|</mo> <mo>+</mo> <mfrac> <msub> <mi>r</mi> <mi>min</mi> </msub> <mn>2</mn> </mfrac> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

式(1)中，sim(u,v)为用户u和用户v之间的相似性；I_uv为用户u和用户v共同评分过的项目集合，|I_uv|为集合中的元素个数；r_u,i，r_v,i分别为用户u和用户v对项目i的评分；r_min为评分系统中相邻两个评分间的最小差值；Rp(u,v,i)为评分偏好因子，其计算方法如下式(2)所示，

<mrow> <mi>R</mi> <mi>p</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>,</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>+</mo> <mfrac> <mrow> <mo>|</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>+</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>-</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>+</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>|</mo> </mrow> <msub> <mi>r</mi> <mrow> <mi>m</mi> <mi>x</mi> </mrow> </msub> </mfrac> <mo>,</mo> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>></mo> <msub> <mi>r</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>d</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>1</mn> <mo>+</mo> <mfrac> <mrow> <mo>|</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>-</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>-</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>-</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>|</mo> </mrow> <msub> <mi>r</mi> <mrow> <mi>m</mi> <mi>x</mi> </mrow> </msub> </mfrac> <mo>,</mo> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>&le;</mo> <msub> <mi>r</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>d</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>1</mn> <mo>+</mo> <mfrac> <mrow> <mo>|</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>+</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>-</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>+</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>+</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>-</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>-</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>-</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>|</mo> </mrow> <msub> <mi>r</mi> <mrow> <mi>m</mi> <mi>x</mi> </mrow> </msub> </mfrac> <mo>,</mo> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

式(2)中，分别表示用户u和用户v的正性评分平均值；分别表示用户u和用户v的负性评分平均值；r_mx为评分系统的最大分值；r_med为评分系统的中位数分值；

步骤3：将步骤2中的相似性值从大到小排列，取前k个用户，k的大小根据实际需要调节，作为用户u的最近邻用户集合N_u；

步骤4：取步骤3中得到的最近邻用户集合N_u以及这些近邻用户与用户u的相似性值，每计算用户u对某一个未评分项目i的预测评分时，将N_u中对项目i的评分为正性评分的用户划分到集合对项目i的评分为负性评分的用户划分到集合利用正负性评分预测公式计算用户u对未评分项目i的预测值，正负性评分预测公式如下式(3)所示；

<mrow> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mover> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>+</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>+</mo> <msub> <mi>&sigma;</mi> <mrow> <mi>u</mi> <mo>+</mo> </mrow> </msub> <mo>&CenterDot;</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>v</mi> <mo>&Element;</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>+</mo> </msubsup> </mrow> </munder> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mfrac> <mrow> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>+</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> </mrow> <msub> <mi>&sigma;</mi> <mrow> <mi>v</mi> <mo>+</mo> </mrow> </msub> </mfrac> <mo>)</mo> </mrow> </mrow> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>v</mi> <mo>&Element;</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>+</mo> </msubsup> </mrow> </munder> <mo>|</mo> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> </mfrac> <mo>,</mo> <mrow> <mo>(</mo> <mo>|</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>+</mo> </msubsup> <mo>|</mo> <mo>></mo> <mo>|</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>-</mo> </msubsup> <mo>|</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <msub> <mi>r</mi> <mi>u</mi> </msub> <mo>&OverBar;</mo> </mover> <mo>,</mo> <mrow> <mo>(</mo> <mo>|</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>+</mo> </msubsup> <mo>|</mo> <mo>=</mo> <mo>|</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>-</mo> </msubsup> <mo>|</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <msub> <mi>r</mi> <mrow> <mi>u</mi> <mo>-</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>+</mo> <msub> <mi>&sigma;</mi> <mrow> <mi>u</mi> <mo>-</mo> </mrow> </msub> <mo>&CenterDot;</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>v</mi> <mo>&Element;</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>-</mo> </msubsup> </mrow> </munder> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mfrac> <mrow> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <mover> <msub> <mi>r</mi> <mrow> <mi>v</mi> <mo>-</mo> </mrow> </msub> <mo>&OverBar;</mo> </mover> </mrow> <msub> <mi>&sigma;</mi> <mrow> <mi>v</mi> <mo>-</mo> </mrow> </msub> </mfrac> <mo>)</mo> </mrow> </mrow> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>v</mi> <mo>&Element;</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>-</mo> </msubsup> </mrow> </munder> <mo>|</mo> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> </mfrac> <mo>,</mo> <mrow> <mo>(</mo> <mo>|</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>+</mo> </msubsup> <mo>|</mo> <mo><</mo> <mo>|</mo> <msubsup> <mi>N</mi> <mi>u</mi> <mo>-</mo> </msubsup> <mo>|</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

式(3)中σ_u+，σ_v+分别表示用户u和用户v的正性评分方差；σ_u-，σ_v-分别表示用户u和用户v的负性评分方差；表示用户u所有评分项目的评分平均值；分别表示集合的元素个数；

步骤5：重复步骤4，直至用户u所有未评分项目的预测评分全部算出，然后将用户u的未评分项目的预测值从大到小排列，选择前N个项目作为推荐项目。

2.根据权利要求1所述的一种综合用户正负性评分和评分偏好因子的协同过滤方法，其特征在于，步骤2所述的评分正负性定义如下：在一个推荐系统的评分分值范围中，高于中位数的分值称为“正性评分”，低于和等于中位数的分值称为“负性评分”。