CN106326351A

CN106326351A - 一种基于用户反馈的推荐系统冷启动解决方法

Info

Publication number: CN106326351A
Application number: CN201610645567.3A
Authority: CN
Inventors: 成石; 王宝亮; 毛陆虹; 常鹏
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2016-08-05
Filing date: 2016-08-05
Publication date: 2017-01-11

Abstract

本发明提供一种基于用户反馈的推荐系统冷启动解决方法，包括：选取数据样本；构造时序样本矩阵，将用户‑商品真实评分矩阵按照时序分为多个子矩阵，模拟新用户的出现，将时间排名靠前的子矩阵作为训练子矩阵，其他为测试子矩阵；采用隐语义模型构建用户和商品的特征矩阵；对新用户引入置信区间上界UCB算法模型，并迭代更新用户特征和商品特征。本发明不需要额外信息，根据有限次数的用户反馈交互，快速筛选出用户感兴趣的商品的方法。

Description

一种基于用户反馈的推荐系统冷启动解决方法

技术领域

本发明涉及个性化推荐技术，具体涉及一种推荐系统冷启动方法。

背景技术

随着互联网的快速发展，新内容、新商品的快速产生，用户在选择自己想要的信息时花费越来越多的时间，导致信息使用效率降低。针对信息过载，目前有搜索和推荐两种解决方法。通过搜索关键词来寻找想要的信息，但搜索为所有用户提供的是相同的结果，没有考虑到不同用户之间的差异。为了更好的解决信息过载问题，个性化推荐系统应运而生，其是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。

个性化推荐系统是根据用户的历史行为和购买记录等信息，构建针对具体用户的个性化用户画像，将商品进行筛选，推荐给与用户特征相近的商品。目前，个性化推荐系统已经在互联网的各个领域得到了广泛的应用。如亚马逊，淘宝等电子商务领域，今日头条等新闻领域，网易云音乐等音乐领域，Netflix、豆瓣等电影领域都在使用推荐算法。目前个性化推荐系统方法主要有基于规则的推荐、协同过滤推荐、基于内容的推荐、基于社交的推荐和混合推荐系统等。

个性化推荐系统的整体流程主要包括：收集并整理用户的历史记录和行为反馈构建数据集；根据数据集运用相应的算法得到用户特征；根据用户特征选取相对应的商品，并将商品推荐给用户；记录用户对推荐商品的反馈，评价推荐效果并更新数据集。

发明内容

本发明的目的是，提供一种基于用户反馈的推荐系统冷启动解决方法。该方法针对个性化推荐系统中如何对新用户进行推荐的问题，提供一种不需要额外信息，根据有限次数的用户反馈交互，快速筛选出用户感兴趣的商品的方法。本发明的技术方案如下。

一种基于用户反馈的推荐系统冷启动解决方法，包括下列的步骤：

(1)选取数据样本

将历史数据进行整理划分，根据用户对商品的喜好的评分构建数据集；

(2)构造时序样本矩阵

先统计出用户数和商品数，构建用户-商品真实评分矩阵，评分矩阵的行数为用户数，评分矩阵的列数为商品数；如果某用户没有对某个商品评分，则默认该用户对此商品的评分为为此商品的评分均值；

将用户-商品真实评分矩阵按照时序分为多个子矩阵，模拟新用户的出现，将时间排名靠前的子矩阵作为训练子矩阵，其他为测试子矩阵，设共生成n个训练子矩阵，m个测试子矩阵；

(3)采用隐语义模型构建用户和商品的特征矩阵；

(4)对新用户引入置信区间上界UCB算法模型，并迭代更新用户特征和商品特征：

首先测试子矩阵中时间排在最前面的测试子矩阵test_matrix_1进行测试，如果test_matrix_1中的用户在训练子矩阵中已经出现过，则该用户为历史用户，直接使用用户特征向量与目标商品特征向量相乘得到该用户对目标商品的预测评分；

如果test_matrix_1中的用户在在训练子矩阵中没有出现过，则视为新用户，对于新用户，采用多臂赌博机问题中置信区间上界UCB(Upper Confidence Bound)算法模型进行用户、商品特征的迭代更新，筛选出用户感兴趣的商品。

上述的基于用户反馈的推荐系统冷启动解决方法，其中，对于新用户，采用多臂赌博机问题中置信区间上界UCB算法模型进行用户、商品特征的迭代更新，筛选出用户感兴趣的商品的方法可以如下：

计算新用户对目标商品的预测评分其中μ为该新用户对目标商品的统计平均值；t为该新用户对目标商品的评分次数；T为该新用户的总评分次数；α为一个人为调整的参数，计算预测评分并将预测评分与test_matrix_1里的实际评分值进行比较，若差距较小，则将test_matrix_1合并到训练子矩阵中，返回步骤(3)重新计算用户特征和商品特征，并更新用户和商品的特征矩阵；按照时间排序由前到后的顺序，依次选择下一个测试子矩阵，并更新相应用户μ，t，T三个参数值，再依次处理其他的测试子矩阵，得到最终的用户特征和商品特征，筛选出用户感兴趣的商品。

本发明针对于推荐系统新用户冷启动问题，引入多臂赌博机问题(multi-armedbandit problem)中的概率思想有效提高对新用户的推荐准确度。

具体实施方式

本发明的基本思想是：对于一个新的用户，引入多臂赌博机问题(multi-armedbandit problem)中的概率思想将每一次推荐分为探索和开发两种模式。根据用户的反馈结果，调整用户特征，在比较少的测试次数中获得最优推荐策略。探索是指随机推荐商品给用户，观察记录用户反馈，增加数据样本；开发是指根据当前的数据样本，选择用户最可能买的商品进行推荐，增加推荐成功率。将推荐分为探索和开发两部分是为了在较短的用户交互中，快速获取用户的真实需求。探索是提升个性化推荐系统性能必不可少的一个环节。下面对本发明做进一步说明。

(1)选取数据样本

在本发明中，我们首先要将历史数据进行整理划分，假设我们有某个电商评分网站4个月的历史数据，评分为1-5之内的整数，1分代表很不喜欢，5分代表非常喜欢。首先根据用户活跃度和商品的热门程度从大到小进行排序，选取前200名活跃用户和50个热门商品。对数据集进行预处理，剔除数据集中的噪声数据和错误数据。以这些用户对这些商品的评分作为本发明的数据集。

(2)构造时序样本矩阵

根据本发明的基本思想，先统计出全部用户数和全部商品数，构建用户-商品真实评分矩阵，评分矩阵的行数为全部用户数，评分矩阵的列数为全部商品数。则构建的用户-商品评分矩阵的规模是200×50。如果某名用户没有对某个商品评分则默认评分为该用户所有评分的均值。

构建的用户样本矩阵后，将矩阵按照时序分为多个子矩阵，模拟新用户的出现。本发明默认以星期为时间长度，采用时间排名在前75％的子矩阵作为训练子矩阵(train_matrix_1，train_matrix_2，…,train_matrix_n)，后25％的子矩阵作为测试子矩阵(text_matrix_1，text_matrix_2，…,text_matrix_m)。共生成n个训练子矩阵，m个测试子矩阵。

(3)提取用户、商品特征

在(2)中已经将数据划分为n个训练子矩阵和m个测试子矩阵。将n个训练子矩阵进行合并构成训练矩阵R。对训练矩阵本发明采用隐语义模型，提取用户和商品的潜在特征。用户和商品可以采用相同维度的特征表示，默认k＝10。则U为用户特征矩阵，维度为200(用户总数)×10(特征个数)。I为商品特征矩阵，维度为50(商品总数)×10(特征个数)。随机初始化用户特征矩阵和商品特征矩阵。则预测矩阵R*可表示为U×IT。计算预测矩阵R*和训练矩阵R中的均方根误差，采用梯度下降算法对特征矩阵进行迭代更新，从而使预测矩阵R*中的数值越来越接近训练矩阵R中的数值。当达到预设迭代次数或者均方根误差小于预设的误差值时，结束训练，得到用户特征矩阵U和商品特征矩阵I。

(4)对新用户引入概率模型，并迭代更新用户、商品特征

在进行系统测试时，在(2)中已经提到后25％的子矩阵作为测试子矩阵。首先采用测试子矩阵中时间排在最前面的子矩阵(test_matrix_1)进行测试。如果test_matrix_1中的用户在训练矩阵中已经出现过，则该用户为历史用户，直接使用用户特征向量与目标商品特征向量相乘得到该用户对目标商品的预测评分。

如果test_matrix_1中的用户在训练矩阵中没有出现过，则该用户为新用户。引入多臂赌博机问题(multi-armed bandit problem)中UCB(Upper Confidence Bound置信区间上界)算法模型，该用户对目标商品的评分为其中μ为该新用户对目标商品的统计平均值，初始为2.5；t为该新用户对目标商品的评分次数，初始值为0；T为该新用户的总评分次数，初始值为0；α为一个人为调整的参数，默认初始值为5。引入该概率模型之后，计算预测评分并跟实际值进行比较。

最后将test_matrix_1合并到训练矩阵中，回到(3)，重新计算用户特征和商品特征。选择test_matrix_2作为测试子矩阵，并更新相应用户μ，t，T三个参数值。再依次将test_matrix_2，…,test_matrix_m合并到为训练矩阵，重复上述步骤,得到最终的用户特征和商品特征。总体上一共进行m次测试，可以有效的得到概率预测中的统计规律，对于在测试矩阵中出现的新用户，根据有限次数的快速测试，能够有效的推荐结果。

(5)进行误差评估

对于推荐算法，一般会得到目标商品对潜在用户的预测评分。对于一个用户，根据得到的评分的从大到小对商品进行排名，根据实际业务需求，截取排名靠前的商品推荐给用户。通过(2)、(3)、(4)我们已经得到预测矩阵，在评价算法的时候,采用两种评价指标：1、均方根误差(RMSE)，用预测分数和真实分数的均方根误差(RMSE)来衡量推荐结果的好坏，RMSE越小推荐结果越好。2、根据预测分数，对于目标用户，根据预测分数从大到小对商品进行排序，如果目标用户喜欢的商品集中在排序的靠前部分，则证明算法有效，反之说明算法无效。

综上所示，一种利用用户反馈来有效处理推荐系统冷启动的方法，引入多臂赌博机问题中的概率思想。通过有限次数的用户反馈修正，快速的提取用户特征，提升推荐系统对新用户的推荐能力。

Claims

1.一种基于用户反馈的推荐系统冷启动解决方法，包括下列的步骤：

(1)选取数据样本

(2)构造时序样本矩阵

(3)采用隐语义模型构建用户和商品的特征矩阵；

如果test_matrix_1中的用户在在训练子矩阵中没有出现过，则视为新用户，对于新用户，采用多臂赌博机问题中置信区间上界UCB算法模型进行用户、商品特征的迭代更新，筛选出用户感兴趣的商品。

2.根据权利要求1所述的基于用户反馈的推荐系统冷启动解决方法，其中，对于新用户，采用多臂赌博机问题中置信区间上界UCB算法模型进行用户、商品特征的迭代更新，筛选出用户感兴趣的商品的方法如下：