CN114048378A

CN114048378A - 一种基于btm模型的个性化推荐方法

Info

Publication number: CN114048378A
Application number: CN202111327741.7A
Authority: CN
Inventors: 范博全; 余刚; 马晓强
Original assignee: Sichuan Fanhua Aviation Instrument and Electrical Co Ltd
Current assignee: Sichuan Fanhua Aviation Instrument and Electrical Co Ltd
Priority date: 2021-11-10
Filing date: 2021-11-10
Publication date: 2022-02-15
Anticipated expiration: 2041-11-10
Also published as: CN114048378B

Abstract

一种基于BTM模型的个性化推荐方法，将每个用户对于各项目的特征项目及各特征项目的数据信息结合形成用户的偏好分布并训练得到BTM模型，然后使用用户的偏好分布通过JS散度计算各个用户之间的相似度、各个用户的评分可信度，接着将各个用户之间的相似度与用户的评分准确度结合得到推荐权重，通过和目标用户最相似的若干用户来预测目标用户对于目标项目的预测评分，并使用推荐权重对预测评分进行修正，最后采用TOP‑N原则实现项目的推荐，引入了用户的评分可信度，从评分时间和评分准确度两个层面对评分预测进行了修正，一定程度上缓解评分偏差带来的影响，提高了推荐的准确度，提升用户的体验。

Description

一种基于BTM模型的个性化推荐方法

技术领域

本发明涉及大数据分析领域，特别涉及一种基于BTM模型的个性化推荐方法。

背景技术

随着互联网的普及和蓬勃发展，人们开始接触各式各样的网络应用，在此期间，各种网络数据开始急速增长起来。人们也逐渐受到“信息过载”带来的影响，与此同时，越来越多的网络平台开始提供个性化推荐服务，该服务利用用户的历史行为信息对用户进行新的信息推荐，来提升用户的体验以及节省用户的时间。个性化推荐涉及的首要问题就是数据稀疏，数据的稀疏性会直接影响最终预测推荐结果的准确性。

现有的推荐方法中，基于协同过滤的推荐方法是当前应用最为广泛且成熟的个性化推荐方法，因为该方法具有自动化推荐、个性化程度高、避免内容过滤不足，以及能为用户发现新的兴趣等优点。该方法的流程首先根据用户-项目矩阵结合相似度计算公式得出用户之间的相似度，然后选取与目标用户相似度高的用户作为最近邻用户，接着将最近邻用户的历史评分项目作为推荐候选集，预测目标用户对该候选集中的项目评分，最后选取评分最高的几个项目推荐给目标用户。

对于现有的基于协同过滤的个性化推荐，存在以下缺点：

1、当前方法面临推荐准确度低问题，仅凭现有的用户评分信息为目标用户寻找近邻缺乏全面性；

2、当前方法存在冷启动问题，具体分为三类：可用用户信息较少的用户冷启动问题、可用项目信息较少的冷启动问题、新系统冷启动问题；

3、当前方法面临数据稀疏问题，用户查看的项目信息只是很少的一部分，这就导致了得到的用户和项目的关联信息较少。

发明内容

本发明的目的在于：提供了一种基于BTM模型的个性化推荐方法，引入了用户的评分可信度，从评分时间和评分准确度两个层面对评分预测进行了修正，一定程度上缓解评分偏差带来的影响，提高了推荐的准确度，提升用户的体验。

本发明采用的技术方案如下：

一种基于BTM模型的个性化推荐方法，将每个用户对于各项目的特征项目及各特征项目的数据信息结合形成用户的偏好分布并训练得到BTM模型，然后使用用户的偏好分布通过JS散度计算各个用户之间的相似度、各个用户的评分可信度，接着将各个用户之间的相似度与用户的评分准确度结合得到推荐权重，通过和目标用户最相似的若干用户来预测目标用户对于目标项目的预测评分，并使用推荐权重对预测评分进行修正，最后采用TOP-N原则实现项目的推荐。

具体包括以下步骤：

步骤S1数据预处理：获取用户u对项目的订购时间、评分时间、评分信息和评论内容这四个特征项目的数据信息得到用户的数据集，将数据集中的每个特征项目的数据信息进行切分，将每个特征项目中的数据信息分为训练集、验证集和测试集；

步骤S2获取项目特征分布：使用经过预处理后的训练集进行训练得到BTM主题模型，并选择BTM主题模型中参数的最佳值，使得到的BTM主题模型在验证集中达到最佳性能，最后再使用BTM主题模型对测试集进行模型性能测试，得到BTM主题模型在各个特征项目上的概率分布θ，项目i在n个特征项目上的概率分布θi表示为θi＝(θ_1,i，θ_2,i，…，θ_n,i)；

步骤S3获取用户的偏好分布：对用户u在项目的评分信息中的空白评分进行填充，再结合用户u对不同项目的评分信息的特征分布以及用户u对项目i的评分信息R_u,i，得到用户u的偏好分布Pu，偏好分布Pu表示为Pu＝θi·R_u,i；

步骤S4计算用户之间的相似度：用JS散度计算用户偏好分布之间的相似度，用户u和用户v之间的偏好相似度JS(Pu‖Pv)的计算方法为：

再利用JS散度改进得到用户u和用户v之间的相似度sim(u，v)为

步骤S5获取用户评分可信度：计算用户u的评分准确度ac(u)为

然后计算评分时间所占的权重time(u)为

最后计算得到用户u的评分可信度cret(u)为

其中，

是项目i的均值评分，RT_u,i是用户u对项目i的评分时间，BT_u,i是用户u对项目i的订购时间，参数n是项目的总个数，

是评分可信度平衡因子，

的取值范围为[0，1]；

步骤S6计算优化的推荐权重：将步骤S4得到的用户相似度和步骤S5得到的评分可信度结合得到推荐权重recd(u,v)为recd(u,v)＝cret(u)·sim(u,v)；

步骤S7得到修正的评分预测：通过步骤S4获取的用户之间的相似度找到与目标用户u相似度最大的前K个用户，并通过这K个用户来预测目标用户u对于项目i的评分

预测方法为：

再将从步骤S6中获取的推荐权重recd(u,v)用于修正预测的评分

得到修正后的预测评分

为

其中R_v,i是用户v对项目i的评分信息；

步骤S8采用Top-N原则推荐：在求得目标用户u对项目i的预测评分后，根据Top-N原从目标用户u对项目的预测评分中找出预测评分排名前N的项目，组成目标用户u的项目推荐集合，将项目推荐集合内的项目推荐给目标用户u。

为了更好地实现本方案，进一步地，所述步骤S1中将每个特征项目中60％的数据信息作为训练集、20％的数据信息作为验证集、20％的数据信息作为测试集。

为了更好地实现本方案，进一步地，所述步骤S3中使用均值法对用户u在项目的评分信息中的空白评分进行填充。

本方案区别于现有的基于协同过滤的推荐方法，能够为用户提供个性化的项目推荐。首先使用用户对项目的特征项目的数据信息训练BTM模型，这里结合了用户对项目的特征项目的评分信息，优化了用户的偏好分布。另外，在计算用户之间的相似度时，采用JS散度对偏好相似度JS(Pu‖Pv)进行改进，得到了改进后的相似度sim(u，v)，使得用户之间的相似程度计算的更加准确。而在获取用户评分可信度时，也是将用户原始的评分信息和评分信息的平均值的误差获取评分准确度，然后考虑到时间因素对评分准确度的影响，结合项目的评分时间进行改进。然后融入近邻用户的相似度，获取优化后的推荐权重，进而提高最终推荐结果的准确度。而在进行评分预测时，会使用到前面经过优化的推荐权重修正现有的评分预测公式，带来更准确的评分预测结果。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

1.本发明所述的一种基于BTM模型的个性化推荐方法，引入了用户的评分可信度，从评分时间和评分准确度两个层面对评分预测进行了修正，一定程度上缓解评分偏差带来的影响，提高了推荐的准确度，提升用户的体验；

2.本发明所述的一种基于BTM模型的个性化推荐方法，引入了用户的评分可信度，从评分时间和评分准确度两个层面对评分预测进行了修正，由于在某一领域内用户的评分可信度在一定时间范围内处于基本稳定的状态，因此本发明方法也适合离线运行；

3.本发明所述的一种基于BTM模型的个性化推荐方法，引入了用户的评分可信度，从评分时间和评分准确度两个层面对评分预测进行了修正，可以缓解用户的冷启动问题，通过均值法对空白的评分进行填充，为新用户赋予平均评分，便可为其推荐大众喜欢的项目，而且后期根据用户的一些操作，可以改进该用户的偏好分布，持续优化该用户的推荐结果；

4.本发明所述的一种基于BTM模型的个性化推荐方法，引入了用户的评分可信度，从评分时间和评分准确度两个层面对评分预测进行了修正，本方案使用了用户评论信息，利用该评论信息训练BTM模型获取项目特征分布，并结合用户的评分信息得到用户的偏好分布，因为评论信息可以更好的丰富用户的偏好信息，从而得到更准确的用户的偏好分布，不仅缓解了数据稀疏带来的问题，还能提升后期评分预测的准确度。

附图说明

为了更清楚地说明本技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图，其中：

图1是本发明的流程示意图；

图2是本发明的训练BTM模型的过程示意图。

具体实施方式

为了更清楚地说明本发明实施例的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，应当理解，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例，因此不应被看作是对保护范围的限定。基于本发明中的实施例，本领域普通技术工作人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“设置”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；也可以是直接相连，也可以是通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

下面结合图1至图2对本发明作详细说明。

实施例1：

一种基于BTM模型的个性化推荐方法，如图1，将每个用户对于各项目的特征项目及各特征项目的数据信息结合形成用户的偏好分布并训练得到BTM模型，然后使用用户的偏好分布通过JS散度计算各个用户之间的相似度、各个用户的评分可信度，接着将各个用户之间的相似度与用户的评分准确度结合得到推荐权重，通过和目标用户最相似的若干用户来预测目标用户对于目标项目的预测评分，并使用推荐权重对预测评分进行修正，最后采用TOP-N原则实现项目的推荐。

工作原理：本方案所述的一种基于BTM模型的个性化推荐方法，引入了用户的评分可信度，从评分时间和评分准确度两个层面对评分预测进行了修正，一定程度上缓解评分偏差带来的影响，提高了推荐的准确度，提升用户的体验。另外，由于在某一领域内用户的评分可信度在一定时间范围内处于基本稳定的状态，因此本方案也适合离线运行。本方案还对空白的评分进行填充，为新用户赋予平均评分，便可为新用户推荐大众喜欢的项目，而且后期根据用户的一些操作，可以改进该用户的偏好分布，持续优化该用户的推荐结果，可以缓解用户的冷启动问题；本方案使用了用户评论信息，利用该评论信息训练BTM模型获取项目特征分布，并结合用户的评分信息得到用户的偏好分布，因为评论信息可以更好的丰富用户的偏好信息，从而得到更准确的用户的偏好分布，不仅缓解了数据稀疏带来的问题，还能提升后期评分预测的准确度。

实施例2：

本方案在实施例1的基础上，具体包括以下步骤：

步骤S2获取项目特征分布：使用经过预处理后的训练集进行训练得到BTM主题模型，训练BTM模型的过程如图2，并选择BTM主题模型中参数的最佳值，使得到的BTM主题模型在验证集中达到最佳性能，最后再使用BTM主题模型对测试集进行模型性能测试，得到BTM主题模型在各个特征项目上的概率分布θ，项目i在n个特征项目上的概率分布θi表示为θi＝(θ_1,i，θ_2,i，…，θ_n,i)；

再利用JS散度改进得到用户u和用户v之间的相似度sim(u，v)为

步骤S5获取用户评分可信度：计算用户u的评分准确度ac(u)为

然后计算评分时间所占的权重time(u)为

最后计算得到用户u的评分可信度cret(u)为

其中，

是评分可信度平衡因子，

的取值范围为[0，1]；

预测方法为：

再将从步骤S6中获取的推荐权重recd(u,v)用于修正预测的评分

得到修正后的预测评分

为

其中R_v,i是用户v对项目i的评分信息；

工作原理：本方案区别于现有的基于协同过滤的推荐方法，能够为用户提供个性化的项目推荐。首先使用用户对项目的特征项目的数据信息训练BTM模型，这里结合了用户对项目的特征项目的评分信息，优化了用户的偏好分布。另外，在计算用户之间的相似度时，采用JS散度对偏好相似度JS(Pu‖Pv)进行改进，得到了改进后的相似度sim(u，v)，使得用户之间的相似程度计算的更加准确。而在获取用户评分可信度时，也是将用户原始的评分信息和评分信息的平均值的误差获取评分准确度，然后考虑到时间因素对评分准确度的影响，结合项目的订购时间和评分时间进行改进。然后融入近邻用户的相似度，获取优化后的推荐权重，进而提高最终推荐结果的准确度。而在进行评分预测时，会使用到前面经过优化的推荐权重修正现有的评分预测公式，带来更准确的评分预测结果。

本实施例的其他部分与上述实施例1相同，故不再赘述。

实施例3：

本实施例是实施例2的进一步补充说明，所述步骤S1中将每个特征项目中60％的数据信息作为训练集、20％的数据信息作为验证集、20％的数据信息作为测试集。

所述步骤S3中使用均值法对用户u在项目的评分信息中的空白评分进行填充。

本实施例的其他部分与上述实施例2相同，故不再赘述。

以上所述，仅是本发明的较佳实施例，并非对本发明做任何形式上的限制，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化，均落入本发明的保护范围之内。

Claims

1.一种基于BTM模型的个性化推荐方法，其特征在于：将每个用户对于各项目的特征项目及各特征项目的数据信息结合形成用户的偏好分布并训练得到BTM模型，然后使用用户的偏好分布通过JS散度计算各个用户之间的相似度、各个用户的评分可信度，接着将各个用户之间的相似度与用户的评分准确度结合得到推荐权重，通过和目标用户最相似的若干用户来预测目标用户对于目标项目的预测评分，并使用推荐权重对预测评分进行修正，最后采用TOP-N原则实现项目的推荐。

2.根据权利要求1所述的一种基于BTM模型的个性化推荐方法，其特征在于，具体包括以下步骤：