CN103914783A - 一种基于用户相似度的电子商务网站推荐方法 - Google Patents

一种基于用户相似度的电子商务网站推荐方法 Download PDF

Info

Publication number
CN103914783A
CN103914783A CN201410147257.XA CN201410147257A CN103914783A CN 103914783 A CN103914783 A CN 103914783A CN 201410147257 A CN201410147257 A CN 201410147257A CN 103914783 A CN103914783 A CN 103914783A
Authority
CN
China
Prior art keywords
user
product
similarity
users
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410147257.XA
Other languages
English (en)
Inventor
何泾沙
杜江浩
潘力斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201410147257.XA priority Critical patent/CN103914783A/zh
Publication of CN103914783A publication Critical patent/CN103914783A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明一种基于用户相似度的电子商务网站推荐方法,涉及电子商务网站的数据库信息检索领域。随着各大电子商务网站所提供的服务对用户的差异也越来越小,人们通过搜索不能在第一时间找到最需要的信息,个性化的推荐技术在提高电子商务网站竞争优势上便有了广阔的应用前景。电子商务网站推荐系统的焦点,主要集中在信息获取方式和推荐技术上。本发明主要通过分析获取到的用户信息,通过用户的注册信息来对用户进行初步的相似度划分,从而对用户进行相似度的计算,相似的用户之间会得到关联产品的推荐。

Description

一种基于用户相似度的电子商务网站推荐方法
技术领域
本发明涉及电子商务网站的数据库信息检索领域,特别涉及对数据信息进行挖掘,形成基于用户相似度的产品推荐技术。
背景技术
随着互联网的发展,现在人们在信息爆炸的时代。相较于在此阶段的数据,在过去缺乏信息,在海量的信息面前,筛选和信息过滤已经成为衡量判断一个系统是否是好还是坏。系统具有良好的用户体验可以使大量的信息进行筛选和过滤,然后显示该信息到他们感兴趣的用户,大大提高了系统的工作效率,也节省了时间,为用户筛选信息。有些工具出现可能会解决问题,但实际上这些工具可能不是很有效。比如,现在的搜索引擎变得越来越可以接受的。搜索引擎的出现在一定程度上解决了信息过滤的问题,但还不够。搜索引擎需要用户过滤信息的质量不请自来的话。为了帮助人们找到最有价值的信息,推荐系统出现了。推荐系统可以与用户联系和信息。在一方面,它可以帮助用户发现有价值的信息,在另一方面,它可以使信息使用者感兴趣的显示,从而使信息提供者和使用者实现双赢的。
发明内容
目前推荐系统中存在很多常见问题,比如冷启动的问题,推荐精准度的问题等。本发明能够有效的对电子商务网站的用户进行产品推荐,包括如下步骤:
步骤1:记录用户注册信息作为原始信息。通过提取原始信息,根据注册信息权重制定坐标轴,用余弦公式对用户进行相似度计算,对用户进行分组,方法如下:
T ( x , y ) = x · y | | x | | 2 × | | y | | 2 - - - ( 1 )
x,y分别代表用户属性向量,0≤x≤200,0≤y≤200。
步骤2:确定用户行为权重,权重由大到小的顺序是,对产品做出的评分,是否购买产品,是否收藏产品,做出过比较的产品,浏览产品时间,是否删除已经收藏了的产品。
步骤3:记录已注册用户行为,分在同一组的用户,根据用户的行为分析权重建立坐标轴,再次进行相似度计算,这次的相似度计算主要通过欧几里德距离公式。相似度达到标准数值的用户分为一组。筛选用户喜好的产品,进行产品推荐,方法如下:
sim ( x , y ) = 1 1 + d ( x , y ) - - - ( 2 )
d ( x , y ) = ( Σ ( xi - yi ) 2 ) - - - ( 3 )
x,y分别代表用户属性向量,0≤x≤200,0≤y≤200。
本发明所描述的历史数据包括:
用户的行为包括:是否购买产品,浏览产品时间,对产品做出的评分,是否收藏产品,是否删除已经收藏了的产品,做出过比较的产品。
用户注册信息包括:用户年龄,性别,爱好,故乡,从给出的固定标签中选择符合自己个性的标签,评分习惯测试。
本发明与现有技术相比,具有以下明显的优势:
在用户行为中最为重要的是对产品做出的评分,这一部分不同的用户评分习惯可能会带来较大的误差,为了缩小这个误差,本发明在用户注册信息的时候记录他们的一些最原始的信息,通过余弦定理,进行一个用户的相似度的计算。
附图说明
图1基于用户相似度的推荐系统工作原理;
图2欧几里德距离计算公式;
图3余弦定理计算方法;
图4推荐系统方法的流程图。
具体实施方式
本发明一种电子商务网站的推荐系统,对用户的行为进行记录,从而形成历史数据。提取历史数据,利用欧几里得公式来计算用户的相似度,从而为相似的用户推荐产品。
步骤1:在用户注册信息的时候记录他们的一些最原始的信息,通过余弦定理,进行一个用户的初步的相似度的计算。
步骤2:确定用户行为权重,权重由大到小的顺序是,对产品做出的评分,是否购买产品,是否收藏产品,做出过比较的产品,浏览产品时间,是否删除已经收藏了的产品。
步骤3:使用余弦定理和欧几里德距离公式计算相似度,多维坐标轴的长度单位由不同行业网站的不同侧重点作为权重来确定。
用户a的注册信息为,24岁,男,篮球,湖南,热情标签,阳光标签,稳定评分习惯。用户b的注册信息为,43岁,女,瑜伽,上海,安静标签,稳定评分习惯。
不同用户对一个喜欢的东西都会评价为好评,对不喜欢的东西有些人会评价为一般,有些人会评价为差评。将以上信息记录到数据库作为原始数据。我们根据得到的5个因素制定5个方向的坐标系,评分习惯的权重设置为最高,它的单位乘以权重得到最终坐标轴单位,使用余弦定理进行一个初步的用户相似度的分组,计算方法如下:
T ( x , y ) = x · y | | x | | 2 × | | y | | 2
步骤4:分析在同一组的用户c和用户d的行为数据,用户c购买了产品A。并且对产品A进行了评分10分,10分是满分。浏览产品A时间长度为20分钟。没有收藏A产品。没有和其它产品进行比较。用户d没有购买A产品。对A产品评价3分。浏览产品A时间长度为5分钟。收藏了A产品。和B产品进行了比较。最后删除了收藏的A产品。将以上信息记录到数据库作为原始数据。我们根据得到的6个因素制定6个方向的坐标系,评分的权重设置为最高,它的单位乘以权重得到最终的坐标轴单位。这里我们的数据量达到要求,权重设置也可以较为准确,所以使用欧几里德距离计算公式,对用户相似度的进一步分组。
其中用到的欧几里德距离计算公式有距离公式进一步计算出相似度用到的相似度计算公式
步骤5:通过以上的过程,我们可以找到相似的用户e和用户f,当用户e购买了产品C并且对C的评价很高,则把C产品设置为e用户的喜好产品,同时将C产品推荐给用户e的相似用户f,从而完成了一个产品的推荐。
最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.一种基于用户相似度的电子商务网站推荐方法,其特征在于包括如下步骤:
步骤1:记录用户注册信息作为原始信息,通过提取原始信息,根据注册信息权重制定坐标轴,该向量通过建立的坐标轴定位用户位置,坐标轴根据用户注册信息建立,对用户进行初步相似度计算,在大于0.5时,分在同一组,他们是相似用户,其中相似度的方法如下:
T ( x , y ) = x · y | | x | | 2 × | | y | | 2
x,y分别代表用户属性向量,0≤x≤200,0≤y≤200
步骤2:确定用户行为权重,权重由大到小的顺序是,对产品做出的评分,是否购买产品,是否收藏产品,做出过比较的产品,浏览产品时间,是否删除已经收藏了的产品;
步骤3:记录已注册用户行为,分在同一组的用户,根据用户的行为分析权重建立坐标轴,再次进行相似度计算,这次的相似度计算主要通过欧几里德距离公式,相似度达到标准数值的用户分为一组,筛选用户喜好的产品,进行产品推荐,方法如下:
sim ( x , y ) = 1 1 + d ( x , y ) , d ( x , y ) = ( Σ ( xi - yi ) 2 )
x,y分别代表用户属性向量,0≤x≤200,0≤y≤200。
2.根据权利要求1所述的基于用户相似度的电子商务网站推荐方法,其历史用户行为数据包括:是否购买产品,浏览产品时间,对产品做出的评分,是否收藏产品,是否删除已经收藏了的产品,做出过比较的产品。
3.根据权利要求1所述的基于用户相似度的电子商务网站推荐方法,其历史用户注册信息数据包括:用户年龄,性别,爱好,故乡,从给出的固定标签中选择符合自己个性的标签,评分习惯测试。
CN201410147257.XA 2014-04-13 2014-04-13 一种基于用户相似度的电子商务网站推荐方法 Pending CN103914783A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410147257.XA CN103914783A (zh) 2014-04-13 2014-04-13 一种基于用户相似度的电子商务网站推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410147257.XA CN103914783A (zh) 2014-04-13 2014-04-13 一种基于用户相似度的电子商务网站推荐方法

Publications (1)

Publication Number Publication Date
CN103914783A true CN103914783A (zh) 2014-07-09

Family

ID=51040447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410147257.XA Pending CN103914783A (zh) 2014-04-13 2014-04-13 一种基于用户相似度的电子商务网站推荐方法

Country Status (1)

Country Link
CN (1) CN103914783A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138664A (zh) * 2015-09-02 2015-12-09 中国地质大学(武汉) 一种隐私保护的大数据推荐方法及系统
CN105208409A (zh) * 2015-08-28 2015-12-30 北京奇艺世纪科技有限公司 一种信息推荐方法及装置
CN105468598A (zh) * 2014-08-18 2016-04-06 大连民族学院 好友推荐方法及装置
CN105488194A (zh) * 2015-12-03 2016-04-13 山东金佳园科技股份有限公司 一种相似用户识别方法及装置
CN106611344A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 挖掘潜在客户的方法及装置
CN106649884A (zh) * 2017-01-11 2017-05-10 河南科技大学 一种基于用户情境分析的多媒体内容推荐方法
CN106708868A (zh) * 2015-11-16 2017-05-24 中国移动通信集团北京有限公司 一种互联网数据分析方法及系统
CN106815216A (zh) * 2015-11-30 2017-06-09 北京云莱坞文化传媒有限公司 一种故事筛选及精准展现的方法和装置
CN106970927A (zh) * 2016-01-14 2017-07-21 阿里巴巴集团控股有限公司 推广方法及装置
CN107665441A (zh) * 2016-07-27 2018-02-06 滴滴(中国)科技有限公司 基于坐标轴的精准产品推荐方法及装置
CN108090119A (zh) * 2017-11-08 2018-05-29 广东小天才科技有限公司 显示题目答案的方法、装置、移动终端及存储介质
CN109034853A (zh) * 2017-06-09 2018-12-18 北京京东尚科信息技术有限公司 基于种子用户寻找相似用户方法、装置、介质和电子设备
CN109214848A (zh) * 2017-07-06 2019-01-15 云义科技股份有限公司 运用虚拟商品于推荐系统影响相似度分析方法及其系统
CN109615162A (zh) * 2018-10-23 2019-04-12 深圳壹账通智能科技有限公司 用户分组处理方法及装置、电子设备以及存储介质
CN110580634A (zh) * 2018-06-08 2019-12-17 北京嘀嘀无限科技发展有限公司 基于互联网的业务推荐方法、装置及存储介质
CN111339741A (zh) * 2020-02-26 2020-06-26 腾讯科技(深圳)有限公司 账户申请方法、装置、计算机可读存储介质及电子设备
CN112465603A (zh) * 2020-12-10 2021-03-09 重庆众帮车信息科技有限公司 用于非高频消费行业的推荐系统及方法
CN112613936A (zh) * 2020-12-04 2021-04-06 光大科技有限公司 消息推送方法、装置、存储介质及电子装置
CN112765480A (zh) * 2021-04-12 2021-05-07 腾讯科技(深圳)有限公司 一种信息推送方法、装置及计算机可读存储介质
CN113722498A (zh) * 2021-06-17 2021-11-30 武汉理工数字传播工程有限公司 一种数字资源管理的方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049865A (zh) * 2012-12-17 2013-04-17 中国农业大学 主动推荐产品信息服务的方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049865A (zh) * 2012-12-17 2013-04-17 中国农业大学 主动推荐产品信息服务的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜定宇: "《基于特征向量的个性化推荐算法研究》", 《中国优秀硕士学位论文全文数据库》 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468598A (zh) * 2014-08-18 2016-04-06 大连民族学院 好友推荐方法及装置
CN105208409A (zh) * 2015-08-28 2015-12-30 北京奇艺世纪科技有限公司 一种信息推荐方法及装置
CN105208409B (zh) * 2015-08-28 2019-05-31 北京奇艺世纪科技有限公司 一种信息推荐方法及装置
CN105138664A (zh) * 2015-09-02 2015-12-09 中国地质大学(武汉) 一种隐私保护的大数据推荐方法及系统
CN105138664B (zh) * 2015-09-02 2019-03-22 中国地质大学(武汉) 一种隐私保护的大数据推荐方法及系统
CN106611344A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 挖掘潜在客户的方法及装置
CN106708868B (zh) * 2015-11-16 2020-02-21 中国移动通信集团北京有限公司 一种互联网数据分析方法及系统
CN106708868A (zh) * 2015-11-16 2017-05-24 中国移动通信集团北京有限公司 一种互联网数据分析方法及系统
CN106815216A (zh) * 2015-11-30 2017-06-09 北京云莱坞文化传媒有限公司 一种故事筛选及精准展现的方法和装置
CN105488194A (zh) * 2015-12-03 2016-04-13 山东金佳园科技股份有限公司 一种相似用户识别方法及装置
CN105488194B (zh) * 2015-12-03 2019-05-14 山东金佳园科技股份有限公司 一种相似用户识别方法及装置
CN106970927A (zh) * 2016-01-14 2017-07-21 阿里巴巴集团控股有限公司 推广方法及装置
CN107665441A (zh) * 2016-07-27 2018-02-06 滴滴(中国)科技有限公司 基于坐标轴的精准产品推荐方法及装置
CN107665441B (zh) * 2016-07-27 2021-06-29 北京嘀嘀无限科技发展有限公司 基于坐标轴的精准产品推荐方法及装置
CN106649884A (zh) * 2017-01-11 2017-05-10 河南科技大学 一种基于用户情境分析的多媒体内容推荐方法
CN109034853A (zh) * 2017-06-09 2018-12-18 北京京东尚科信息技术有限公司 基于种子用户寻找相似用户方法、装置、介质和电子设备
CN109034853B (zh) * 2017-06-09 2021-11-26 北京京东尚科信息技术有限公司 基于种子用户寻找相似用户方法、装置、介质和电子设备
CN109214848A (zh) * 2017-07-06 2019-01-15 云义科技股份有限公司 运用虚拟商品于推荐系统影响相似度分析方法及其系统
CN109214848B (zh) * 2017-07-06 2020-10-27 云义科技股份有限公司 运用虚拟商品于推荐系统影响相似度分析方法及其系统
CN108090119A (zh) * 2017-11-08 2018-05-29 广东小天才科技有限公司 显示题目答案的方法、装置、移动终端及存储介质
CN110580634A (zh) * 2018-06-08 2019-12-17 北京嘀嘀无限科技发展有限公司 基于互联网的业务推荐方法、装置及存储介质
CN109615162A (zh) * 2018-10-23 2019-04-12 深圳壹账通智能科技有限公司 用户分组处理方法及装置、电子设备以及存储介质
CN111339741B (zh) * 2020-02-26 2021-08-24 腾讯科技(深圳)有限公司 账户申请方法、装置、计算机可读存储介质及电子设备
CN111339741A (zh) * 2020-02-26 2020-06-26 腾讯科技(深圳)有限公司 账户申请方法、装置、计算机可读存储介质及电子设备
CN112613936A (zh) * 2020-12-04 2021-04-06 光大科技有限公司 消息推送方法、装置、存储介质及电子装置
CN112465603A (zh) * 2020-12-10 2021-03-09 重庆众帮车信息科技有限公司 用于非高频消费行业的推荐系统及方法
CN112765480A (zh) * 2021-04-12 2021-05-07 腾讯科技(深圳)有限公司 一种信息推送方法、装置及计算机可读存储介质
CN112765480B (zh) * 2021-04-12 2021-06-18 腾讯科技(深圳)有限公司 一种信息推送方法、装置及计算机可读存储介质
CN113722498A (zh) * 2021-06-17 2021-11-30 武汉理工数字传播工程有限公司 一种数字资源管理的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN103914783A (zh) 一种基于用户相似度的电子商务网站推荐方法
CN103617540B (zh) 一种追踪用户兴趣变化的电子商务推荐方法
CN104935963B (zh) 一种基于时序数据挖掘的视频推荐方法
CN107909433A (zh) 一种基于大数据移动电子商务的商品推荐方法
CN102629257B (zh) 一种基于关键字的电子商务网站商品推荐方法
CN102929928B (zh) 基于多维相似度的个性化新闻推荐方法
US20150205580A1 (en) Method and System for Sorting Online Videos of a Search
CN103729359B (zh) 一种推荐搜索词的方法及系统
CN101436186B (zh) 一种提供相关搜索的方法及系统
CN102253982B (zh) 一种基于查询语义和点击流数据的查询建议方法
CN103761237A (zh) 一种基于用户特征及其信任度的协同过滤推荐方法
CN105426514A (zh) 个性化的移动应用app推荐方法
US20170154116A1 (en) Method and system for recommending contents based on social network
CN101482884A (zh) 一种基于用户偏好评分分布的协作推荐系统
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN103995839A (zh) 基于协同过滤的商品推荐优化方法和系统
CN103136275A (zh) 个性化视频推荐系统及方法
CN102236646A (zh) 对象级垂直搜索引擎个性化排序算法iRank
CN106168980A (zh) 多媒体资源推荐排序方法及装置
CN102063433A (zh) 相关项推荐方法和装置
CN103810198A (zh) 一种商品信息的搜索方法及装置
CN103745100A (zh) 一种基于项目的混合显性隐性反馈的协同过滤推荐算法
CN102073717A (zh) 一种面向垂直电子商务网站的首页推荐方法
CN104615741B (zh) 一种基于云计算的冷启动项目推荐的方法及装置
CN105338408B (zh) 基于时间因子的视频推荐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140709