CN106326351A - 一种基于用户反馈的推荐系统冷启动解决方法 - Google Patents

一种基于用户反馈的推荐系统冷启动解决方法 Download PDF

Info

Publication number
CN106326351A
CN106326351A CN201610645567.3A CN201610645567A CN106326351A CN 106326351 A CN106326351 A CN 106326351A CN 201610645567 A CN201610645567 A CN 201610645567A CN 106326351 A CN106326351 A CN 106326351A
Authority
CN
China
Prior art keywords
user
commodity
matrix
submatrix
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610645567.3A
Other languages
English (en)
Inventor
成石
王宝亮
毛陆虹
常鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201610645567.3A priority Critical patent/CN106326351A/zh
Publication of CN106326351A publication Critical patent/CN106326351A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于用户反馈的推荐系统冷启动解决方法,包括:选取数据样本;构造时序样本矩阵,将用户‑商品真实评分矩阵按照时序分为多个子矩阵,模拟新用户的出现,将时间排名靠前的子矩阵作为训练子矩阵,其他为测试子矩阵;采用隐语义模型构建用户和商品的特征矩阵;对新用户引入置信区间上界UCB算法模型,并迭代更新用户特征和商品特征。本发明不需要额外信息,根据有限次数的用户反馈交互,快速筛选出用户感兴趣的商品的方法。

Description

一种基于用户反馈的推荐系统冷启动解决方法
技术领域
本发明涉及个性化推荐技术,具体涉及一种推荐系统冷启动方法。
背景技术
随着互联网的快速发展,新内容、新商品的快速产生,用户在选择自己想要的信息时花费越来越多的时间,导致信息使用效率降低。针对信息过载,目前有搜索和推荐两种解决方法。通过搜索关键词来寻找想要的信息,但搜索为所有用户提供的是相同的结果,没有考虑到不同用户之间的差异。为了更好的解决信息过载问题,个性化推荐系统应运而生,其是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
个性化推荐系统是根据用户的历史行为和购买记录等信息,构建针对具体用户的个性化用户画像,将商品进行筛选,推荐给与用户特征相近的商品。目前,个性化推荐系统已经在互联网的各个领域得到了广泛的应用。如亚马逊,淘宝等电子商务领域,今日头条等新闻领域,网易云音乐等音乐领域,Netflix、豆瓣等电影领域都在使用推荐算法。目前个性化推荐系统方法主要有基于规则的推荐、协同过滤推荐、基于内容的推荐、基于社交的推荐和混合推荐系统等。
个性化推荐系统的整体流程主要包括:收集并整理用户的历史记录和行为反馈构建数据集;根据数据集运用相应的算法得到用户特征;根据用户特征选取相对应的商品,并将商品推荐给用户;记录用户对推荐商品的反馈,评价推荐效果并更新数据集。
发明内容
本发明的目的是,提供一种基于用户反馈的推荐系统冷启动解决方法。该方法针对个性化推荐系统中如何对新用户进行推荐的问题,提供一种不需要额外信息,根据有限次数的用户反馈交互,快速筛选出用户感兴趣的商品的方法。本发明的技术方案如下。
一种基于用户反馈的推荐系统冷启动解决方法,包括下列的步骤:
(1)选取数据样本
将历史数据进行整理划分,根据用户对商品的喜好的评分构建数据集;
(2)构造时序样本矩阵
先统计出用户数和商品数,构建用户-商品真实评分矩阵,评分矩阵的行数为用户数,评分矩阵的列数为商品数;如果某用户没有对某个商品评分,则默认该用户对此商品的评分为为此商品的评分均值;
将用户-商品真实评分矩阵按照时序分为多个子矩阵,模拟新用户的出现,将时间排名靠前的子矩阵作为训练子矩阵,其他为测试子矩阵,设共生成n个训练子矩阵,m个测试子矩阵;
(3)采用隐语义模型构建用户和商品的特征矩阵;
(4)对新用户引入置信区间上界UCB算法模型,并迭代更新用户特征和商品特征:
首先测试子矩阵中时间排在最前面的测试子矩阵test_matrix_1进行测试,如果test_matrix_1中的用户在训练子矩阵中已经出现过,则该用户为历史用户,直接使用用户特征向量与目标商品特征向量相乘得到该用户对目标商品的预测评分;
如果test_matrix_1中的用户在在训练子矩阵中没有出现过,则视为新用户,对于新用户,采用多臂赌博机问题中置信区间上界UCB(Upper Confidence Bound)算法模型进行用户、商品特征的迭代更新,筛选出用户感兴趣的商品。
上述的基于用户反馈的推荐系统冷启动解决方法,其中,对于新用户,采用多臂赌博机问题中置信区间上界UCB算法模型进行用户、商品特征的迭代更新,筛选出用户感兴趣的商品的方法可以如下:
计算新用户对目标商品的预测评分其中μ为该新用户对目标商品的统计平均值;t为该新用户对目标商品的评分次数;T为该新用户的总评分次数;α为一个人为调整的参数,计算预测评分并将预测评分与test_matrix_1里的实际评分值进行比较,若差距较小,则将test_matrix_1合并到训练子矩阵中,返回步骤(3)重新计算用户特征和商品特征,并更新用户和商品的特征矩阵;按照时间排序由前到后的顺序,依次选择下一个测试子矩阵,并更新相应用户μ,t,T三个参数值,再依次处理其他的测试子矩阵,得到最终的用户特征和商品特征,筛选出用户感兴趣的商品。
本发明针对于推荐系统新用户冷启动问题,引入多臂赌博机问题(multi-armedbandit problem)中的概率思想有效提高对新用户的推荐准确度。
具体实施方式
本发明的基本思想是:对于一个新的用户,引入多臂赌博机问题(multi-armedbandit problem)中的概率思想将每一次推荐分为探索和开发两种模式。根据用户的反馈结果,调整用户特征,在比较少的测试次数中获得最优推荐策略。探索是指随机推荐商品给用户,观察记录用户反馈,增加数据样本;开发是指根据当前的数据样本,选择用户最可能买的商品进行推荐,增加推荐成功率。将推荐分为探索和开发两部分是为了在较短的用户交互中,快速获取用户的真实需求。探索是提升个性化推荐系统性能必不可少的一个环节。下面对本发明做进一步说明。
(1)选取数据样本
在本发明中,我们首先要将历史数据进行整理划分,假设我们有某个电商评分网站4个月的历史数据,评分为1-5之内的整数,1分代表很不喜欢,5分代表非常喜欢。首先根据用户活跃度和商品的热门程度从大到小进行排序,选取前200名活跃用户和50个热门商品。对数据集进行预处理,剔除数据集中的噪声数据和错误数据。以这些用户对这些商品的评分作为本发明的数据集。
(2)构造时序样本矩阵
根据本发明的基本思想,先统计出全部用户数和全部商品数,构建用户-商品真实评分矩阵,评分矩阵的行数为全部用户数,评分矩阵的列数为全部商品数。则构建的用户-商品评分矩阵的规模是200×50。如果某名用户没有对某个商品评分则默认评分为该用户所有评分的均值。
构建的用户样本矩阵后,将矩阵按照时序分为多个子矩阵,模拟新用户的出现。本发明默认以星期为时间长度,采用时间排名在前75%的子矩阵作为训练子矩阵(train_matrix_1,train_matrix_2,…,train_matrix_n),后25%的子矩阵作为测试子矩阵(text_matrix_1,text_matrix_2,…,text_matrix_m)。共生成n个训练子矩阵,m个测试子矩阵。
(3)提取用户、商品特征
在(2)中已经将数据划分为n个训练子矩阵和m个测试子矩阵。将n个训练子矩阵进行合并构成训练矩阵R。对训练矩阵本发明采用隐语义模型,提取用户和商品的潜在特征。用户和商品可以采用相同维度的特征表示,默认k=10。则U为用户特征矩阵,维度为200(用户总数)×10(特征个数)。I为商品特征矩阵,维度为50(商品总数)×10(特征个数)。随机初始化用户特征矩阵和商品特征矩阵。则预测矩阵R*可表示为U×IT。计算预测矩阵R*和训练矩阵R中的均方根误差,采用梯度下降算法对特征矩阵进行迭代更新,从而使预测矩阵R*中的数值越来越接近训练矩阵R中的数值。当达到预设迭代次数或者均方根误差小于预设的误差值时,结束训练,得到用户特征矩阵U和商品特征矩阵I。
(4)对新用户引入概率模型,并迭代更新用户、商品特征
在进行系统测试时,在(2)中已经提到后25%的子矩阵作为测试子矩阵。首先采用测试子矩阵中时间排在最前面的子矩阵(test_matrix_1)进行测试。如果test_matrix_1中的用户在训练矩阵中已经出现过,则该用户为历史用户,直接使用用户特征向量与目标商品特征向量相乘得到该用户对目标商品的预测评分。
如果test_matrix_1中的用户在训练矩阵中没有出现过,则该用户为新用户。引入多臂赌博机问题(multi-armed bandit problem)中UCB(Upper Confidence Bound置信区间上界)算法模型,该用户对目标商品的评分为其中μ为该新用户对目标商品的统计平均值,初始为2.5;t为该新用户对目标商品的评分次数,初始值为0;T为该新用户的总评分次数,初始值为0;α为一个人为调整的参数,默认初始值为5。引入该概率模型之后,计算预测评分并跟实际值进行比较。
最后将test_matrix_1合并到训练矩阵中,回到(3),重新计算用户特征和商品特征。选择test_matrix_2作为测试子矩阵,并更新相应用户μ,t,T三个参数值。再依次将test_matrix_2,…,test_matrix_m合并到为训练矩阵,重复上述步骤,得到最终的用户特征和商品特征。总体上一共进行m次测试,可以有效的得到概率预测中的统计规律,对于在测试矩阵中出现的新用户,根据有限次数的快速测试,能够有效的推荐结果。
(5)进行误差评估
对于推荐算法,一般会得到目标商品对潜在用户的预测评分。对于一个用户,根据得到的评分的从大到小对商品进行排名,根据实际业务需求,截取排名靠前的商品推荐给用户。通过(2)、(3)、(4)我们已经得到预测矩阵,在评价算法的时候,采用两种评价指标:1、均方根误差(RMSE),用预测分数和真实分数的均方根误差(RMSE)来衡量推荐结果的好坏,RMSE越小推荐结果越好。2、根据预测分数,对于目标用户,根据预测分数从大到小对商品进行排序,如果目标用户喜欢的商品集中在排序的靠前部分,则证明算法有效,反之说明算法无效。
综上所示,一种利用用户反馈来有效处理推荐系统冷启动的方法,引入多臂赌博机问题中的概率思想。通过有限次数的用户反馈修正,快速的提取用户特征,提升推荐系统对新用户的推荐能力。

Claims (2)

1.一种基于用户反馈的推荐系统冷启动解决方法,包括下列的步骤:
(1)选取数据样本
将历史数据进行整理划分,根据用户对商品的喜好的评分构建数据集;
(2)构造时序样本矩阵
先统计出用户数和商品数,构建用户-商品真实评分矩阵,评分矩阵的行数为用户数,评分矩阵的列数为商品数;如果某用户没有对某个商品评分,则默认该用户对此商品的评分为为此商品的评分均值;
将用户-商品真实评分矩阵按照时序分为多个子矩阵,模拟新用户的出现,将时间排名靠前的子矩阵作为训练子矩阵,其他为测试子矩阵,设共生成n个训练子矩阵,m个测试子矩阵;
(3)采用隐语义模型构建用户和商品的特征矩阵;
(4)对新用户引入置信区间上界UCB算法模型,并迭代更新用户特征和商品特征:
首先测试子矩阵中时间排在最前面的测试子矩阵test_matrix_1进行测试,如果test_matrix_1中的用户在训练子矩阵中已经出现过,则该用户为历史用户,直接使用用户特征向量与目标商品特征向量相乘得到该用户对目标商品的预测评分;
如果test_matrix_1中的用户在在训练子矩阵中没有出现过,则视为新用户,对于新用户,采用多臂赌博机问题中置信区间上界UCB算法模型进行用户、商品特征的迭代更新,筛选出用户感兴趣的商品。
2.根据权利要求1所述的基于用户反馈的推荐系统冷启动解决方法,其中,对于新用户,采用多臂赌博机问题中置信区间上界UCB算法模型进行用户、商品特征的迭代更新,筛选出用户感兴趣的商品的方法如下:
计算新用户对目标商品的预测评分其中μ为该新用户对目标商品的统计平均值;t为该新用户对目标商品的评分次数;T为该新用户的总评分次数;α为一个人为调整的参数,计算预测评分并将预测评分与test_matrix_1里的实际评分值进行比较,若差距较小,则将test_matrix_1合并到训练子矩阵中,返回步骤(3)重新计算用户特征和商品特征,并更新用户和商品的特征矩阵;按照时间排序由前到后的顺序,依次选择下一个测试子矩阵,并更新相应用户μ,t,T三个参数值,再依次处理其他的测试子矩阵,得到最终的用户特征和商品特征,筛选出用户感兴趣的商品。
CN201610645567.3A 2016-08-05 2016-08-05 一种基于用户反馈的推荐系统冷启动解决方法 Pending CN106326351A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610645567.3A CN106326351A (zh) 2016-08-05 2016-08-05 一种基于用户反馈的推荐系统冷启动解决方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610645567.3A CN106326351A (zh) 2016-08-05 2016-08-05 一种基于用户反馈的推荐系统冷启动解决方法

Publications (1)

Publication Number Publication Date
CN106326351A true CN106326351A (zh) 2017-01-11

Family

ID=57740106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610645567.3A Pending CN106326351A (zh) 2016-08-05 2016-08-05 一种基于用户反馈的推荐系统冷启动解决方法

Country Status (1)

Country Link
CN (1) CN106326351A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897912A (zh) * 2017-01-18 2017-06-27 太仓中科信息技术研究院 基于epsilon反馈算法的推荐系统冷启动方法
CN107256508A (zh) * 2017-05-27 2017-10-17 上海交通大学 基于时间场景的商品推荐系统及其方法
CN107563867A (zh) * 2017-09-06 2018-01-09 天津大学 一种基于多臂赌博机置信上限的推荐系统冷启动方法
CN108334592A (zh) * 2018-01-30 2018-07-27 南京邮电大学 一种基于内容与协同过滤相结合的个性化推荐方法
CN108596428A (zh) * 2018-03-13 2018-09-28 新智数字科技有限公司 一种订单派发的方法、装置以及设备
CN108595526A (zh) * 2018-03-28 2018-09-28 北京奇艺世纪科技有限公司 资源推荐方法及装置
CN108595595A (zh) * 2018-04-19 2018-09-28 北京理工大学 一种基于交互式差分进化计算的用户知识需求获取方法
CN108684026A (zh) * 2018-04-26 2018-10-19 广西大学 一种基于Whittle index的RFID多阅读器信道资源分配方法
CN108717414A (zh) * 2018-03-28 2018-10-30 北京奇艺世纪科技有限公司 资源推荐方法及装置
CN108874998A (zh) * 2018-06-14 2018-11-23 华东师范大学 一种基于混合特征向量表示的对话式音乐推荐方法
CN109146626A (zh) * 2018-08-14 2019-01-04 中山大学 一种基于用户动态兴趣分析的时尚服装搭配推荐方法
CN109949099A (zh) * 2019-03-23 2019-06-28 西安电子科技大学 基于聚类及多臂赌博机的信息核构建方法
CN109978660A (zh) * 2019-03-13 2019-07-05 南京航空航天大学 一种基于强化学习框架的推荐系统离线训练方法
CN110598016A (zh) * 2019-09-11 2019-12-20 腾讯科技(深圳)有限公司 一种多媒体信息推荐的方法、装置、设备和介质
CN112765465A (zh) * 2021-01-15 2021-05-07 电子科技大学 一种基于用户图谱的推荐方法
CN113111251A (zh) * 2020-01-10 2021-07-13 阿里巴巴集团控股有限公司 项目推荐方法、装置及系统

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897912A (zh) * 2017-01-18 2017-06-27 太仓中科信息技术研究院 基于epsilon反馈算法的推荐系统冷启动方法
CN107256508A (zh) * 2017-05-27 2017-10-17 上海交通大学 基于时间场景的商品推荐系统及其方法
CN107563867A (zh) * 2017-09-06 2018-01-09 天津大学 一种基于多臂赌博机置信上限的推荐系统冷启动方法
CN108334592A (zh) * 2018-01-30 2018-07-27 南京邮电大学 一种基于内容与协同过滤相结合的个性化推荐方法
CN108334592B (zh) * 2018-01-30 2021-11-02 南京邮电大学 一种基于内容与协同过滤相结合的个性化推荐方法
CN108596428A (zh) * 2018-03-13 2018-09-28 新智数字科技有限公司 一种订单派发的方法、装置以及设备
CN108596428B (zh) * 2018-03-13 2021-08-03 新智数字科技有限公司 一种订单派发的方法、装置以及设备
CN108595526A (zh) * 2018-03-28 2018-09-28 北京奇艺世纪科技有限公司 资源推荐方法及装置
CN108595526B (zh) * 2018-03-28 2020-10-23 北京奇艺世纪科技有限公司 资源推荐方法及装置
CN108717414A (zh) * 2018-03-28 2018-10-30 北京奇艺世纪科技有限公司 资源推荐方法及装置
CN108595595A (zh) * 2018-04-19 2018-09-28 北京理工大学 一种基于交互式差分进化计算的用户知识需求获取方法
CN108684026A (zh) * 2018-04-26 2018-10-19 广西大学 一种基于Whittle index的RFID多阅读器信道资源分配方法
CN108874998A (zh) * 2018-06-14 2018-11-23 华东师范大学 一种基于混合特征向量表示的对话式音乐推荐方法
CN108874998B (zh) * 2018-06-14 2021-10-19 华东师范大学 一种基于混合特征向量表示的对话式音乐推荐方法
CN109146626A (zh) * 2018-08-14 2019-01-04 中山大学 一种基于用户动态兴趣分析的时尚服装搭配推荐方法
CN109146626B (zh) * 2018-08-14 2022-05-20 中山大学 一种基于用户动态兴趣分析的时尚服装搭配推荐方法
CN109978660A (zh) * 2019-03-13 2019-07-05 南京航空航天大学 一种基于强化学习框架的推荐系统离线训练方法
CN109949099A (zh) * 2019-03-23 2019-06-28 西安电子科技大学 基于聚类及多臂赌博机的信息核构建方法
CN109949099B (zh) * 2019-03-23 2022-04-08 西安电子科技大学 基于聚类及多臂赌博机的信息核构建方法
CN110598016A (zh) * 2019-09-11 2019-12-20 腾讯科技(深圳)有限公司 一种多媒体信息推荐的方法、装置、设备和介质
CN113111251A (zh) * 2020-01-10 2021-07-13 阿里巴巴集团控股有限公司 项目推荐方法、装置及系统
CN112765465A (zh) * 2021-01-15 2021-05-07 电子科技大学 一种基于用户图谱的推荐方法
CN112765465B (zh) * 2021-01-15 2023-04-14 电子科技大学 一种基于用户图谱的推荐方法

Similar Documents

Publication Publication Date Title
CN106326351A (zh) 一种基于用户反馈的推荐系统冷启动解决方法
CN109299994B (zh) 推荐方法、装置、设备及可读存储介质
Chen et al. A group recommendation system with consideration of interactions among group members
CN103377250B (zh) 基于邻域的top‑k推荐方法
CN104679771B (zh) 一种个性化数据搜索方法和装置
CN103617289B (zh) 基于用户特征及网络关系的微博推荐方法
Bauer et al. Recommender systems based on quantitative implicit customer feedback
CN104063481A (zh) 一种基于用户实时兴趣向量的电影个性化推荐方法
CN107958030A (zh) 视频封面推荐模型优化方法及装置
CN104866474A (zh) 个性化数据搜索方法及装置
CN106886518A (zh) 一种微博账号分类的方法
CN106503028A (zh) 推荐方法和系统
CN107563867A (zh) 一种基于多臂赌博机置信上限的推荐系统冷启动方法
CN108595493A (zh) 媒体内容的推送方法和装置、存储介质、电子装置
KR101567684B1 (ko) 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법
CN106384259A (zh) 一种融合社交信息的推荐系统解决方法
Lin et al. A consumer review-driven recommender service for web e-commerce
CN105894310A (zh) 一种个性化推荐方法
CN111915409B (zh) 基于物品的物品推荐方法、装置、设备及存储介质
CN111767458A (zh) 信息推送方法、装置、系统及存储介质
Vall et al. The Importance of Song Context in Music Playlists.
CN110942376A (zh) 一种音频类产品的实时多召回策略的融合方法
CN114254615A (zh) 组卷方法、装置、电子设备和存储介质
CN117217875A (zh) 商品推荐方法及装置、电子设备及存储介质
CN109977979A (zh) 定位种子用户的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170111