CN106022838A - 一种电子商务推荐系统中用户最近邻居集的优化选取方法 - Google Patents

一种电子商务推荐系统中用户最近邻居集的优化选取方法 Download PDF

Info

Publication number
CN106022838A
CN106022838A CN201610371000.1A CN201610371000A CN106022838A CN 106022838 A CN106022838 A CN 106022838A CN 201610371000 A CN201610371000 A CN 201610371000A CN 106022838 A CN106022838 A CN 106022838A
Authority
CN
China
Prior art keywords
user
users
nearest
collection
neighbors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610371000.1A
Other languages
English (en)
Inventor
金志刚
张子洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201610371000.1A priority Critical patent/CN106022838A/zh
Publication of CN106022838A publication Critical patent/CN106022838A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种电子商务推荐系统中用户最近邻居集的优化选取方法,包括:收集历史记录中的用户‑项目评分数据,建立用户‑项目评分矩阵;采用皮尔森相似度计算方法计算目标用户与其他用户之间的相似度;选择相似度较高的前N个用户生成最近邻居候选集;对于最近邻居候选集里的用户,根据目标用户与此集里用户共同评分项集的数据,计算目标用户与此集里用户之间评分的平均误差,进而计算可信度,平均误差越大,与目标用户之间的可信度越小;选取可信度较高的K个用户生成目标用户的最近邻居集,0<K<N。本发明可以提高推荐的准确度。

Description

一种电子商务推荐系统中用户最近邻居集的优化选取方法
技术领域
本发明涉及一种电子商务推荐系统中用户最近邻居集的优化选取方法。
背景技术
随着“互联网+”时代的到来以及电子商务的迅速发展,电子商务网站利用电子商务推荐系统向用户推荐商品信息,提供相关的建议,协助用户做出购物决策。作为传统的推荐技术的一种,协同过滤推荐算法简单且高效,得到了推荐系统的广泛且成功的应用。
协同过滤推荐方法主要分为基于邻居集和基于模型的推荐方法。其中,基于邻居集的推荐方法又分为基于用户和基于项目的方法。基于用户的推荐方法的核心思想是将与目标用户相似的最近邻居用户所喜欢的项目推荐给目标用户。其中,基于用户的协同过滤推荐方法在应用中遇到了一些挑战,主要是因为仅依靠传统的相似度计算得到的最近邻居集存在较大误差,数据稀疏问题更使得传统协同过滤推荐不够准确。
发明内容
本发明旨在克服现有技术上的不足,提出一种电子商务推荐系统中用户最近邻居集的优化选取方法,不但可以提高推荐准确度,而且能够解决数据稀疏带来的问题。为了达到上述目的,本发明采用如下的技术方案:
一种电子商务推荐系统中用户最近邻居集的优化选取方法,包括下列步骤:
(1)收集历史记录中的用户-项目评分数据,建立用户-项目评分矩阵;
(2)采用皮尔森相似度计算方法计算目标用户与其他用户之间的相似度;
(3)选择相似度较高的前N个用户生成最近邻居候选集;
(4)对于最近邻居候选集里的用户,根据目标用户与此集里用户共同评分项集的数据,计算目标用户与此集里用户之间评分的平均误差,进而计算可信度,平均误差越大,与目标用户之间的可信度越小;
(5)选取可信度较高的K个用户生成目标用户的最近邻居集,0<K<N。
本发明提供的电子商务推荐系统中用户最近邻居的优化选取方法,首先计算目标用户与其他用户的相似度,然后选取相似度较高的用户生成最近邻居候选集,然后计算目标用户与最近邻居候选集中用户之间的可信度,选取可信度较高的用户生成目标用户的最近邻居集。通过本方法可以提高最近邻居集的准确度。
附图说明
图1是用户最近邻居集的优化选取流程图。
具体实施方式
本发明的技术方案是:
(1)收集历史记录中的用户-项目评分数据,建立用户-项目评分矩阵:
(2)计算目标用户与其他用户之间的相似度。在计算其他用户与目标用户之间的相似度时,考虑二者间的共同评分项,采用经典的皮尔森相似度计算方法,具体方法如下所示:
s i m ( a , b ) = &Sigma; i &Element; I a b ( R a i - R a &OverBar; ) ( R b i - R b &OverBar; ) &Sigma; i &Element; I a b ( R a i - R a &OverBar; ) 2 &Sigma; i &Element; I a b ( R b i - R b &OverBar; ) 2
其中,a和b代表两个用户,sim(a,b)表示用户a和b之间的相似度,Rai表示用户a对项目i的评分,Iab表示两个用户的共同评分项集,表示用户a的评分均值,|Ia|表示用户a评价过的项目个数。
(3)设0<K′<K(K′和K的值需要依据具体推荐系统设定),根据(2)计算得到的其他用户对目标用户的相似度,选取相似度较高的K′个用户作为目标用户a的最近邻居候选集N′(a),以备最近邻居集N(a)的后续选取。
(4)用户a与其他用户的可信度计算方法如下。设用户b为目标用户a的最近邻居候选集N′(a)中的某个用户,项目i为共同评分项集Iab中的某个项目,基于用户b的评分可以利用下述公式对用户a在项目i上的评分进行预测。
P a i = R b i - R b &OverBar; + R a &OverBar;
其中Pai表示用户b对用户a在项目i上的预测评分,表示用户a的平均评分。通过计算用户b对用户a在共同评分项集Iab中的每一个项目上的预测评分与用户a的对相应项目的实际评分之间的差值,可以得到用户b对用户a的预测评分平均误差,计算公式如下:
H a b = &Sigma; i &Element; I a b | P a i - R a i | | I a b |
(5)预测评分平均误差Hab越大,用户a与用户b之间的可信度越小,这是一个反相关的关系,所以利用公式将预测评分平均误差Hab归一化到区间[0,1]内,得到用户a对用户b的可信度T(a,b),其中T(a,b)越大,说明用户a对用户b的可信度越高。
(6)基于对目标用户与最近邻居候选集N′(a)中所有用户之间的可信度的计算,选取可信度较高的前K个用户构成目标用户的最近邻居集N(a)。

Claims (1)

1.一种电子商务推荐系统中用户最近邻居集的优化选取方法,包括下列步骤:
(1)收集历史记录中的用户-项目评分数据,建立用户-项目评分矩阵;
(2)采用皮尔森相似度计算方法计算目标用户与其他用户之间的相似度;
(3)选择相似度较高的前N个用户生成最近邻居候选集;
(4)对于最近邻居候选集里的用户,根据目标用户与此集里用户共同评分项集的数据,计算目标用户与此集里用户之间评分的平均误差,进而计算可信度,平均误差越大,与目标用户之间的可信度越小;
(5)选取可信度较高的K个用户生成目标用户的最近邻居集,0<K<N。
CN201610371000.1A 2016-05-27 2016-05-27 一种电子商务推荐系统中用户最近邻居集的优化选取方法 Pending CN106022838A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610371000.1A CN106022838A (zh) 2016-05-27 2016-05-27 一种电子商务推荐系统中用户最近邻居集的优化选取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610371000.1A CN106022838A (zh) 2016-05-27 2016-05-27 一种电子商务推荐系统中用户最近邻居集的优化选取方法

Publications (1)

Publication Number Publication Date
CN106022838A true CN106022838A (zh) 2016-10-12

Family

ID=57091417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610371000.1A Pending CN106022838A (zh) 2016-05-27 2016-05-27 一种电子商务推荐系统中用户最近邻居集的优化选取方法

Country Status (1)

Country Link
CN (1) CN106022838A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108876536A (zh) * 2018-06-15 2018-11-23 天津大学 基于最近邻信息的协同过滤推荐方法
CN109345348A (zh) * 2018-09-30 2019-02-15 重庆誉存大数据科技有限公司 基于旅行社用户的多维信息画像的推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101287082A (zh) * 2008-05-16 2008-10-15 华东师范大学 一种引入节目热门度权重的协作过滤推荐方法
WO2010068840A1 (en) * 2008-12-12 2010-06-17 The Trustees Of Columbia University In The City Of New York Machine optimization devices, methods, and systems
CN102799656A (zh) * 2012-07-03 2012-11-28 复旦大学 一种面向目标用户的个性化产品包的提取方法
CN104933156A (zh) * 2015-06-25 2015-09-23 西安理工大学 一种基于共享近邻聚类的协同过滤方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101287082A (zh) * 2008-05-16 2008-10-15 华东师范大学 一种引入节目热门度权重的协作过滤推荐方法
WO2010068840A1 (en) * 2008-12-12 2010-06-17 The Trustees Of Columbia University In The City Of New York Machine optimization devices, methods, and systems
CN102799656A (zh) * 2012-07-03 2012-11-28 复旦大学 一种面向目标用户的个性化产品包的提取方法
CN104933156A (zh) * 2015-06-25 2015-09-23 西安理工大学 一种基于共享近邻聚类的协同过滤方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108876536A (zh) * 2018-06-15 2018-11-23 天津大学 基于最近邻信息的协同过滤推荐方法
CN109345348A (zh) * 2018-09-30 2019-02-15 重庆誉存大数据科技有限公司 基于旅行社用户的多维信息画像的推荐方法

Similar Documents

Publication Publication Date Title
CN103617540B (zh) 一种追踪用户兴趣变化的电子商务推荐方法
CN102508870B (zh) 一种结合评分数据与标签数据的个性化推荐方法
CN102609533B (zh) 一种基于核方法的协同过滤推荐系统及方法
CN103092911B (zh) 一种融合社会标签相似度基于k近邻的协同过滤推荐系统
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN103761237A (zh) 一种基于用户特征及其信任度的协同过滤推荐方法
CN106570090A (zh) 基于兴趣变化和信任关系的协同过滤推荐方法
CN104166732B (zh) 一种基于全局评分信息的项目协同过滤推荐方法
CN103793476A (zh) 基于网络社区的协同过滤推荐方法
CN103294812B (zh) 一种基于混合模型的商品推荐方法
CN103678431A (zh) 一种基于标准标签和项目评分的推荐方法
CN102750336A (zh) 一种基于用户关联性的资源个性化推荐方法
CN103559197A (zh) 基于上下文预过滤的实时音乐推荐方法
CN103745100A (zh) 一种基于项目的混合显性隐性反馈的协同过滤推荐算法
CN105373597A (zh) 基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法
CN102982107A (zh) 一种融合用户、项目和上下文属性信息的推荐系统优化方法
CN103309967A (zh) 基于相似性传递的协同过滤方法及系统
CN102779182A (zh) 融合偏好和信任关系的协同过滤推荐方法
CN102495864A (zh) 基于评分的协同过滤推荐方法及系统
CN104899246A (zh) 基于模糊机制用户评分邻域信息的协同过滤推荐方法
CN106021329A (zh) 基于用户相似度的稀疏数据协同过滤推荐方法
CN103500228A (zh) 一种协同过滤推荐算法中改进的相似性度量方法
CN102135999A (zh) 用户可信度和项目最近邻相结合的互联网推荐方法
CN106326483A (zh) 一种用户上下文信息聚合的协同推荐方法
CN102542489A (zh) 一种基于用户兴趣关联的推荐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012