CN109871479A

CN109871479A - 一种基于用户项目类及评分可靠性的协同过滤方法

Info

Publication number: CN109871479A
Application number: CN201910015213.4A
Authority: CN
Inventors: 邓孟鑫; 史维峰
Original assignee: Northwest University
Current assignee: Northwest University
Priority date: 2019-01-08
Filing date: 2019-01-08
Publication date: 2019-06-11

Abstract

本发明公开了一种基于用户项目类及评分可靠性的协同过滤方法，该方法通过用户评分数据和项目信息构建用户评分矩阵和用户项目类特征矩阵，根据用户评分矩阵，加入共同评分惩罚因子计算用户评分相似度；根据用户项目特征类矩阵，通过访问项目特征类次数、项目特征类评分大于平均值数计算用户项目类偏好的相似度，在此基础上计算用户总相似度，然后通过建立最近邻居集合，在邻居评分可靠性的基础上，对未评分项目进行预测而产生推荐项目。本发明方法能够更加准确的获得用户的真实兴趣偏好，并针对指定用户个性化推荐，从而提高推荐系统的质量。

Description

一种基于用户项目类及评分可靠性的协同过滤方法

技术领域

本发明涉及大数据挖掘推荐技术领域，具体涉及一种基于用户项目类及评分可靠性的协同过滤方法。

背景技术

作为推荐系统的重要支撑方法，推荐方法是推荐系统的核心技术，因此就需要研究如何提高推荐方法的准确度、提高用户体验。推荐方法得到了广泛的研究及应用，如协同推荐、基于内容的推荐方法、基于关联规则的推荐算法、基于标签的推荐算法等。目前，协同推荐方法是推荐系统中准确性较高、研究应用最成功的推荐方法之一。协同过滤推荐方法是依据用户历史反馈行为数据，建立用户个人的兴趣预测模型，依据历史兴趣偏好，预测指定用户对其未产生行为项目的感兴趣程度，并依据兴趣度排序，为用户准确推荐其感兴趣的项目。协同过滤方法研究应用较为广泛，主要有以下几类：

第一类，基于用户的协同过滤推荐方法

该方法首先通过用户历史评分数据，建立用户评分矩阵，再通过用户评分矩阵建立用户兴趣模型，利用该模型计算用户之间兴趣相似度，然后依据相似度排序，在众多用户群中寻找与指定用户兴趣最相似的邻居用户，最后综合相似邻居对某一项目的评分信息，预测指定用户对其未产生行为项目的感兴趣程度，为用户准确推荐其感兴趣的项目。

第二类：基于项目的协同过滤推荐方法

该方法首先通过用户历史评分反馈数据，建立用户评分矩阵，再通过用户评分矩阵建立项目兴趣模型，利用该模型计算项目之间相似度，然后依据相似度排序，在众多项目群中寻找与指定用户感兴趣项目最相似的邻居项目，最后综合相似邻居的评分信息，预测指定用户对其未产生行为项目的感兴趣程度，为用户准确推荐其感兴趣的项目。

以上协同过滤方法均是通过用户历史行为反馈信息建立兴趣模型，然后依据相似度计算得到用户的兴趣，为指定用户推荐其感兴趣的项目。协同过滤虽然能够为用户推荐其感兴趣的信息，但由于模型仅依靠用户评分数据，导致推荐准确性不高。有学者提出基于用户项目类的协同过滤方法，但由于其仅从用户访问项目类的次数来计算用户真实的兴趣偏好，推荐准确性较低。

综上所述，以上协同过滤算法存在的缺陷有1.计算用户项目类兴趣偏好只考虑到其评分次数，未考虑到具体评分相对于评分标准的差值，用户项目类偏好分析不全面。2.未考虑到邻居用户评分可靠性对评分预测准确性的影响。

发明内容

推荐方法对于推荐系统的准确性、推荐系统的用户体验至关重要，针对现有推荐算法准确性不高、用户体验不佳以及用户兴趣计算模型考虑不全面等缺陷，本发明提出来一种基于用户项目类及评分可靠性的协同过滤方法，在构建用户兴趣模型时能考虑到用户项目类评分与评分标准的差值以及用户邻居评分可靠性。能够更加准确的获得用户的真实兴趣偏好，并针对指定用户个性化推荐，从而提高推荐系统的质量。

为了实现上述任务，本发明采用以下技术方案：

一种基于用户项目类及评分可靠性的协同过滤方法，包括以下步骤：

步骤1，挖掘并清洗用户行为数据，获取用户集合U、项目集合I以及所有项目的特征类集合，计算用户集合U中任意用户U_m和用户U_n的兴趣总相似度：

步骤1.1，构建所有用户与所有项目的评分矩阵X，矩阵X中的元素x_ij表示第i个用户u_i对第j个项目的评分；

提取I中所有项目以及C中所有特征类构建项目的特征类矩阵Y，矩阵Y 中的元素Y_ij表示第i个项目是否属于第j个特征类；

依次提取评分矩阵X中的每一行，在该行中寻找用户所有评过分的项目，综合项目特征类矩阵Y，将其合并映射为该用户评过分的所有项目，建立用户项目特征类评分矩阵S；

步骤1.2，计算用户U_m和用户U_n的评分相似度：

上式中，P表示项目集合I中用户U_m和用户U_n共同访问过的项目的集合， r_mj和r_nj分别表示矩阵X中用户U_m和用户U_n对项目集合P中第p个项目i_p的评分，表示用户U_m对P中所有项目的评分平均值，表示用户U_n对P中所有项目的评分平均值；

步骤1.3，统计用户U_m和用户U_n评分过的项目交集数I_m∩I_n、用户U_m和用户U_n评分的过的项目并集数I_m∪I_n，按照公式2计算用户U_m和用户U_n的共同评分权重因子W_mn：

步骤1.4，根据式3计算出用户U_m和用户U_n最终的评分相似度：

sSim(m,n)＝sim(m,n)×W_mn 式3

步骤1.5，计算用户对特征类集合C中第t个特征类访问次数偏好：

其中，F_mt为用户U_m对项目的特征类集合C中第t个特征类的访问次数，|I_m| 为矩阵X中用户U_m访问过的项目总数；

步骤1.6，计算出用户对特征类集合C中第t个特征类评分偏好程度：

其中，N_mt为用户U_m的项目特征类评分矩阵S中用户U_m在特征类i中评分大于评分标准的平均值的项目的个数；

步骤1.7，计算用户对特征类集合C中第t个特征类的兴趣偏好：

H_mt＝X_mt×Y_mt 式6

步骤1.8，分别计算用户U_m和用户U_n对共同访问过的所有项目特征类的兴趣偏好度，通过式7计算用户U_m和用户U_n之间的项目特征类兴趣偏好相似度：

上式中Q表示用户U_m和用户U_n共同访问过的特征类的集合，H_me和H_ne分别表示用户U_m和用户U_n对共同访问过的特征类集合Q中第e个特征类c_e的兴趣偏好，分别表示用户U_m、用户U_n对集合Q中所有特征类的兴趣偏好的平均值；

步骤1.9，通过式8计算用户U_m和用户U_n的兴趣总相似度：

Sim(m,n)＝α×hSim(m,n)+β×sSim(m,n) 式8

其中，α取值范围为0.1～0.9之间，α+β＝1；

步骤2，对于用户U_m，首先根据步骤1中的方法分别计算用户U_m与用户集合中任一用户的兴趣总相似度，选取与用户U_m兴趣总相似度最高的前k个用户组成用户U_m的最近邻居集合N(m)；

通过式9计算出用户U_m的最近邻居集合N(m)中的第b个邻居用户U_b的评分可靠性：

上式中O表示用户U_m和用户U_b共同评过分的项目集合，r_bl表示矩阵X中用户U_b对项目集合O中第l个项目i_l的评分，表示用户U_b对O中项目的评分平均值；

根据式10对用户U_m没有评过分的项目i_j计算预测评分R_j(m)：

上式中，sim(m,b)为用户U_m与用户U_b的兴趣总相似度，表示用户U_m对矩阵X中所有项目评分的平均值，N(m)表示用户U_m最近邻居集合，Re(b)为邻居用户U_b的评分可靠性，i_j表示矩阵X中第j个用户U_m没有评过分的项目，r_bj表示矩阵X中用户U_b对项目i_j的评分，表示矩阵X中用户U_b所有评过分的项目的评分的平均值；

步骤3，对于待推荐用户U_d，确定用户U_d感兴趣的项目：

计算待推荐用户U_d所有未评分的项目的评分预测值R_j(d)，并根据R_j(d)对项目进行排序，并将预测评分排序靠前的项目作为感兴趣的项目推荐给指定待推荐用户U_d。

进一步地，步骤1.9中参数α的最佳取值的确定方法为：

不断调节公式8中α的值，观察公式11中MAE的值，获得使评分预测误差MAE最小的α，该值为α最佳取值：

T表示在矩阵X中用户U_m所有未评分项目的集合，i_j为该集合中的一个项目，z为用户U_m所有未评分项目的数量，R_j(m)为对项目i_j的预测评分，r_j(m)为用户U_m对项目i_j的真实评分。

本发明具有以下技术特点：

1.提高用户相似度准确性

本发明在计算用户兴趣相似度的过程中不仅考虑到用户项目评分相似度，并且引入用户项目类兴趣偏好，然后在计算用户项目类兴趣偏好时不仅仅以用户项目类访问次数为标准，还综合了用户项目类的具体偏好，即用户评分大于评分标准代表其对该项目类感兴趣。

2.融合了评分可靠性

普通算法未考虑到邻居用户评分可靠性，而本方法引入可靠性因子，用户评分越离散，可靠度越高，常用的衡量数据离散程度的指标有平均差、方差、标准差、变异系数等。

本方法使用变异系数表示用户评分可靠性，由于前三个指标只考虑到数据的绝对量，是一个有量纲的指标，不能完全代表数据的分布离散程度。而变异系数采用标准差除以平均值的方法去除了不同数据之间量纲的影响，更方便各数据之间离散程度的比较。

3.提高推荐准确度

本方法综合提高用户相似度准确性，优化最近邻居选择准确性，引入评分可靠性因子，对指定待推荐用户的项目评分预测更加准确，准确推荐用户真正感兴趣的项目，从而提高推荐系统准确性，优化用户体验。

附图说明

图1是推荐方法的总体流程图；

图2是本发明的详细方法流程图；

图3是用户U_m的用户项目特征类矩阵映射过程；

图4是权重系数α与MAE的关系；

图5三种算法在不同邻居数目与MAE的关系。

具体实施方式

网站在电影推荐、新闻推荐等基于用于兴趣的推荐中，为了保证对用户历史中用户真实兴趣偏好的准确挖掘、对用户相似度的准确计算以及保证精确筛选并推荐给用户其真正感兴趣的项目，需要建立高准确度的用户兴趣相似度计算模型，优化推荐方法。而大多推荐方法计算用户项目类兴趣偏好只考虑到其评分次数，未考虑到具体评分相对于评分标准的差值，用户项目类偏好分析不全面；另外，未考虑到邻居用户评分可靠性对评分预测准确性的影响。

针对现有推荐方法存在的推荐准确度较低以及用户体验差的现状，本发明提出了一种基于用户项目类及评分可靠性的协同过滤方法，使得推荐系统能够准确挖掘用户真实兴趣偏好，准确计算用户相似度以及保证精确筛选并推荐给用户其真正感兴趣的项目。

一、方法的详细步骤

本发明方法产生推荐总体流程如图1所示，首先收集用户行为数据以及项目行为数据，并将数据清洗后用矩阵表示，然后进行用户相似度计算，筛选最近邻居后评分预测，最后产生推荐。

本发明提出了一种基于用户项目类及评分可靠性的协同过滤方法，该方法对准确挖掘用户兴趣度，优化了相似度计算方法，同时对最近邻居进行了评分可靠性惩罚，以此减小传统方法对用户真实兴趣的预测误差，从而为用户准确推荐其感兴趣的项目。如图2所示，该方法包括以下步骤：

步骤1，挖取并清洗用户行为数据，获取用户集合U＝{U₁,U₂,U₃,…U_a}，项目集合I＝{i₁,i₂,i₃...i_b}以及所有项目的特征类集合C＝{c₁,c₂,c₃...c_c}。首先计算得到用户集合U中任意用户U_m和用户U_n的兴趣总相似度。

步骤1.1，获取用户行为数据集合，其中用户集合为U，项目集合为I，所有项目的特征类集合为C；

首先提取所有用户集合U中所有用户和所有项目集合I中所有项目，如图3 所示，构建所有用户与所有项目的评分矩阵X，其中，a为用户数，b为项目数， c为特征类别数。在评分矩阵X中，x_ij(i＝1,2,...a；j＝1,2,...,b)为第i个用户u_i对第j个项目的评分，如第i个用户未对项目j评分，则X中对应的用户项目评分x_ij置为0。

以电影推荐为例，该步就是建立所有用户对所有电影的评分矩阵，如果用户对某电影未评分则置为0。一个电影(项目)可能属于多种电影类型(特征类)，如既属于科幻片也属于战争片。

接下来提取I中所有项目以及C中所有特征类构建项目的特征类矩阵Y，其中，b为项目数，c为项目的特征类别数，Y_ij(i＝1,2,...b；j＝1,2,...,c)表示第i个项目是否属于第j个特征类，是则置为1，否则置为0。以电影推荐为例，某电影既属于科幻片也属于战争片，该步就是建立所有电影对所有电影类别的矩阵，电影属于该类别则置为1，否则置为0。

最后，通过评分矩阵X和项目的特征类矩阵Y建立每一个用户的项目特征类评分矩阵S：

依次提取评分矩阵X中的每一行，在该行中寻找用户所有评过分的项目，综合项目特征类矩阵Y，将其合并映射为该用户评过分的所有项目，建立用户项目特征类评分矩阵S，映射规则如下：

X中第m(m＝1,2,...,a)行数据x_m1,x_m2...,x_mb即为用户U_m对项目集合I中所有项目的评分，也即用户的U_m项目评分矩阵；Y矩阵为项目集合I中所有项目对应的项目特征类矩阵。利用用户U_m对项目集合I中每一个项目的评分依次替换 Y中对应项目行中的数据(即对应项目行中Y_ij的值为1的数据)得到用户U_m项目特征类评分矩阵S，如图3中所示；然后删除S_m矩阵中用户U_m未评过分的项目所对应的行。以电影推荐为例，如用户U_m看过电影A对其评分4，电影A 既属于科幻片又属于战争片中，则将矩阵Y中A的科幻片和战争片置为1，然后用4替换电影矩阵Y中A行中所有的1，该步就是建立用户U_m对应的项目特征类评分矩阵。

按照上述方法，可建立用户集合中每一个用户对应的项目特征类评分矩阵S。

步骤1.2，对于用户集合U中任意用户U_m和用户U_n，按照下式1计算用户 U_m和用户U_n的评分相似度：

步骤1.3，如果两个用户之间共同评分的项目数很少，而根据Pearson相关系数计算得到的评分相似度会相对偏高。为了解决这个问题，本方案引入用户的共同评分权重因子：

统计用户U_m和用户U_n评分过的项目交集数I_m∩I_n、用户U_m和用户U_n评分的过的项目并集数I_m∪I_n，按照公式2计算用户U_m和用户U_n的共同评分权重因子W_mn：

步骤1.4，根据式3计算出用户U_m和用户U_n最终的评分相似度：

sSim(m,n)＝sim(m,n)×W_mn 式3

步骤1.5，计算用户对特征类集合C中第t(t＝1,2,...,c)个特征类c_t访问次数偏好：

以用户U_m为例，根据步骤1.1，根据用户U_m的项目特征类评分矩阵S，获得用户U_m对项目的特征类集合C中第t个特征类c_t的访问次数；即矩阵S的第 t列中不为0的评分个数F_mt，统计矩阵X中用户U_m访问过的项目总数|I_m|，并按式4计算用户U_m对特征类集合C中特征类t的访问次数偏好X_mt：

步骤1.6，计算出用户对特征类集合C中第t个特征类c_t评分偏好程度。

以用户U_m为例，计算评分标准的平均值，如评分标准为1～5分，则评分标准的平均值为(1+5)/2，然后统计用户U_m的项目特征类评分矩阵S中用户U_m在特征类i中评分大于评分标准的平均值的项目的个数，即S中第t列中评分大于评分标准的平均值的项目个数N_mt，然后通过式5计算出用户U_m在特征类C中第i个特征类的评分偏好程度Y_mt：

步骤1.7，计算用户对特征类集合C中第t个特征类c_t的兴趣偏好。

以用户U_m为例，综合步骤1.5访问次数偏好和1.6评分偏好程度，计算用户U_m对集合C中第t个特征类的兴趣偏好：

H_mt＝X_mt×Y_mt 式6

步骤1.8，循环以上步骤分别计算用户U_m和用户U_n对共同访问过的所有项目特征类的兴趣偏好度，通过式7计算用户U_m和用户U_n之间的项目特征类兴趣偏好相似度：

上式中Q表示用户U_m和用户U_n共同访问过的特征类的集合，以电影为例，表示用户共同看过的电影的类型。H_me和H_ne分别表示用户U_m和用户U_n对共同访问过的特征类集合Q中第e个特征类c_e的兴趣偏好(通过步骤1.7计算)，分别表示用户U_m、用户U_n对集合Q中所有特征类的兴趣偏好的平均值。

步骤1.9，通过式8计算用户U_m和用户U_n的兴趣总相似度，对于最终的评分相似度、项目特征类兴趣偏好相似度赋予不同的权重；其中α取值范围为 0.1～0.9之间，α+β＝1：

Sim(m,n)＝α×hSim(m,n)+β×sSim(m,n) 式8

步骤2.1，由于用户评分习惯差异，有的用户评分总体较低，有的用户则总体偏高，需要引入邻居用户评分可靠性，变异系数采用标准差除以平均值的方法去除了不同数据之间量纲的影响，更方便各数据之间离散程度的比较，通过式9 计算出用户U_m的最近邻居集合N(m)中的第b个邻居用户U_b的评分可靠性：

通过上面的公式分别计算用户U_m所有最近邻居的评分可靠性，通过所有邻居的评分可靠性来计算预测评分。

根据式10对用户U_m没有评过分的项目i_j计算预测评分R_j(m)：

上式中，表示用户U_m对矩阵X中所有项目评分的平均值，N(m)表示用户 U_m最近邻居集合，U_b为N(m)的中一个邻居，sim(m,b)为通过公式8计算的用户 U_m与用户U_b的兴趣总相似度，Re(b)为邻居用户U_b的评分可靠性，i_j表示矩阵X 中第j个用户U_m没有评过分的项目，r_bj表示矩阵X中用户U_b对项目i_j的评分，表示矩阵X中用户U_b所有评过分的项目的评分的平均值。

通过步骤2.1循环计算训练集中用户U_m所有未评分的项目的评分预测值，公式8中α其取值范围为0.1～0.9之间，不断调节公式8中α的值，观察公式11 中MAE的结果，获得使评分预测误差MAE最小的α，该值为α的最佳取值。

上式中，T表示在矩阵X中用户U_m所有未评分项目的集合，i_j为该集合中的一个项目，z为用户U_m所有未评分项目的数量，R_j(m)为对项目i_j的预测评分， r_j(m)为用户U_m对项目i_j的真实评分。通过选择一些用户U_m真实评分过的项目作为训练集，利用式10计算这些项目的预测评分，然后利用式11即可确定最优参数α。

步骤3，对于待推荐用户U_d∈U，确定用户U_d感兴趣的项目：

首先使用步骤2中调节确定的最优参数α，根据步骤1计算用户U_d和其他用户兴趣总相似度，然后按照步骤2筛选获得用户U_d的最近邻居集合N(d)，并计算用户U_d最近邻居的可靠性，最后通过公式10循环计算待推荐用户U_d所有未评分的项目的评分预测值R_j(d)，并根据R_j(d)对项目进行排序，并将预测评分排序靠前的N(N>1)个项目作为感兴趣的项目推荐给指定待推荐用户U_d。

二、本方法中相关参数的确定

实验一：精确控制步骤一中参数α，其取值范围为0.1～0.9之间，改变α参数的值，观察其对于预测评分准确性的影响，选取准确的α值，β的值使得评分预测误差最小。

步骤1，仿真实验场景初始化

申请人利用真实电影数据集进行训练，本实验使用的数据是常用的由美国GroupLens研究团队收集的MovieLens数据集。本文选取的数据集有100000条评分记录，其中涉及的用户有943个，电影有1682部。且每一位用户都参与交互评分过电影至少20部，具体评分是1～5，评分越高表示越喜欢。此数据集包括用户、电影的基本属性信息，电影的类型分为动作、冒险、动画等18种，每一部电影可能属于一种或多种类型。这个数据集的数据稀疏度为：

表1电影评分稀疏程度

在本实验中，训练集是数据集的80％，剩余20％作为测试集。

步骤2，本实验先根据表2找到权重系数α的最优值。在每种控制参数α下的取值下通过九次实验，每次实验记录在预测过程中公式11得到的MAE的值，观察每种α下对于MAE值的影响。

表2权重系数α和β

步骤3，分析与处理实验数据

如图4所示，表示了用户预测评分与测试集中用户真实评分的误差MAE随着权重系数α的改变而变化，如图4所示变化趋势，可以可知，当α＝0.6时MAE 的值为最优。

三、对比试验

下面我们通过一组对比试验来验证本发明方法的性能以及相对于其他方法的优势，实验主要对以下三种方法的性能进行比较：

(1)UBCF算法：传统的基于用户的协同过滤方法

(2)UPCF算法：该算法是基于用户项目属性偏好的协同过滤方法，该方法用皮尔逊相关系数计算出用户评分相似度，然后用项目类评分平均分和用户总评分平均分的比值表示用户项目属性偏好，最后综合计算用户总相似度。该方法只考虑用户评分，未考虑到用户评分与评分标准差值，也未考虑到邻居用户评分可靠性对评分预测准确性的影响。

(3)URCF算法：本发明的方法

实验主要从以下方面来证明本发明的优势：

1)评分预测算法的误差MAE

2)算法的准确率和召回率

仿真实验初始化：

申请人利用真实电影数据集进行训练，本实验使用的数据是常用的由美国GroupLens研究团队收集的MovieLens数据集。本文选取的数据集有100000条评分记录，其中涉及的用户有943个，电影有1682部。且每一位用户都参与交互评分过电影至少20部。数据分为训练集和测试集。

实验主要从评分预测准确度来进行评估算法准确度，它用于比较预测评分与实际评分的差异大小。一般情况下用的评测指标有MAE(Mean Absolute Error，平均绝对误差)，MAE采用预测评分与实际评分的绝对值差异预测算法的误差，如公式11所示，利用其中的MAE值来进行评估。

(1)评分预测算法的误差MAE

仿真实验过程：

在该实验中，通过在同一个数据集上做实验在不同的邻居数量下比较本发明方法和UPCF的算法以及传统UBCF算法。记录对比两个算法评分预测准确度，即预测评分与实际评分的绝对值差异预测算法的误差。

实验结果：

如图5，两个不同算法分别在不同邻居用户数量上实验的最终推荐效果。从上图的结果分析，明显可知本文提出的算法从邻居个数为40起，推荐质量趋于平缓；UPCF的算法是从邻居个数为30起，算法结果趋于平缓。但综合显示，本文的算法在每个数据点上MAE的值都低于相对比的算法，即每个数据点上本文提供的算法的推荐质量较高。因此，在计算用户偏好时引入特征评分并比较评分高低确实能够进一步真实反应用户偏好，提高推荐系统的质量。

(2)算法的准确率和召回率

仿真实验过程：

在该实验中，通过在同一个数据集上做实验在不同的邻居数量下比较本发明方法和UPCF的算法以及传统UBCF算法。随着目标用户邻居个数的增加，本章算法的推荐结果在准确率和召回率上的值都在提升，即推荐质量在不断提高。且当邻居个数为50左右时数值达到稳定。为了更好的与其余算法进行比较，突出本章算法的优势；本章在相同的实验环境下取k值为50对其余三个算法分别进行实验。

实验结果：

如表3所示实验得到的推荐结果的准确率及召回率。从表3中可知，本发明算法与传统协同过滤算法UBCF以及UPCF提出的算法相比，本发明算法在推荐结果的准确率和召回率明显高于其他两个个算法，证明了本章算法推荐结果准确性的优势。

表3几种算法准确率和召回率的比较

Claims

1.一种基于用户项目类及评分可靠性的协同过滤方法，其特征在于，包括以下步骤：

提取I中所有项目以及C中所有特征类构建项目的特征类矩阵Y，矩阵Y中的元素Y_ij表示第i个项目是否属于第j个特征类；

步骤1.2，计算用户U_m和用户U_n的评分相似度：

上式中，P表示项目集合I中用户U_m和用户U_n共同访问过的项目的集合，r_mj和r_nj分别表示矩阵X中用户U_m和用户U_n对项目集合P中第p个项目i_p的评分，表示用户U_m对P中所有项目的评分平均值，表示用户U_n对P中所有项目的评分平均值；

步骤1.4，根据式3计算出用户U_m和用户U_n最终的评分相似度：

sSim(m,n)＝sim(m,n)×W_mn 式3

其中，F_mt为用户U_m对项目的特征类集合C中第t个特征类的访问次数，|I_m|为矩阵X中用户U_m访问过的项目总数；

H_mt＝X_mt×Y_mt 式6

步骤1.9，通过式8计算用户U_m和用户U_n的兴趣总相似度：

Sim(m,n)＝α×hSim(m,n)+β×sSim(m,n) 式8

其中，α取值范围为0.1～0.9之间，α+β＝1；

根据式10对用户U_m没有评过分的项目i_j计算预测评分R_j(m)：

步骤3，对于待推荐用户U_d，确定用户U_d感兴趣的项目：

2.如权利要求1所述的基于用户项目类及评分可靠性的协同过滤方法，其特征在于，步骤1.9中参数α的最佳取值的确定方法为：