CN108694234A - 一种基于改进协同过滤算法的服务推荐模型 - Google Patents
一种基于改进协同过滤算法的服务推荐模型 Download PDFInfo
- Publication number
- CN108694234A CN108694234A CN201810431077.2A CN201810431077A CN108694234A CN 108694234 A CN108694234 A CN 108694234A CN 201810431077 A CN201810431077 A CN 201810431077A CN 108694234 A CN108694234 A CN 108694234A
- Authority
- CN
- China
- Prior art keywords
- user
- recommendation
- service
- collaborative filtering
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于改进协同过滤算法的服务推荐模型。主要包括基于用户的协同过滤进行服务推荐、引入巴氏系数(Bhattacharyya Coefficient)及Jaccard系数进而提高推荐服务准确率两部分。通过发现用户最近邻,根据用户的兴趣,挖掘数据,并通过数学函数对目标计算,再通过评分矩阵,依据矩阵产生分数罗列推荐列表,在此基础上,本技术基于传统协同过滤算法进行改进,并融合巴氏系数和Jaccard系数,从而进行精准服务推荐。本发明形成一种新的User‑Based Model,并提高传统协同过滤算法的精确度,属于数据挖掘与深度学习的交叉领域。个性化推荐的出现是为了解决信息过载的问题,通过研究不同用户的兴趣,主动为用户推荐最需要的资源,从而更好地解决互联网信息日益庞大与用户需求之间的矛盾。
Description
技术领域
本发明涉及一种基于改进协同过滤算法的服务推荐模型,主要通过发现用户最近邻,根据用户的兴趣,挖掘数据,并通过数学函数对目标计算,再通过评分矩阵,依据矩阵产生分数罗列推荐列表,对目标用户产生精确推荐,属于数据挖掘与深度学习的交叉领域。
背景技术
随着电子商务规模的扩大,商品种类和数量愈发庞大,用户在网上众多推荐服务中想获得最适合用户的服务,需消耗大量时间,根本原因是服务推荐算法与用户的真实需求不符。本发明则提供一种能更精确推荐服务的模型。
传统基于用户-项目数据集进行推荐的算法存在诸多问题。Ahn等人提出了 PIP(Proximity-Impact-Popularity)相似性度量,提出在余弦相似度在用户共同评分项目较少的情况下,容易影响推荐的准确性,相似度计算比实际偏差大。随后更多的缺陷不断地暴露,在用户数据少的时候,User-Based推荐难以产生说服力,并且具有地时效性不会轻易改变,用户数据多的时候,User-Based 计算矩阵的代价会非常大。而Item-Based推荐会随着用户的行为改变而立即改变,虽然具有了实时性,但在数据少的时候计算量反而相当庞大,且没有办法在不离线更新物品相似度表的情况下将新商品推荐给用户。同时最主要缺点是用户评分对系统的影响很大,不管用户之间评分差异如何,都具有很高相似性。且算法如果不考虑评分的绝对值,会直接导致用户区分困难。在User-Item矩阵评分数据稀疏时难以对用户的兴趣进行判断,使得精确性偏低。
发明内容
为克服上述现有技术中存在的缺陷,本发明提供一种基于改进协同过滤算法的服务推荐模型,用于进行精准的个性服务推荐。本技术首先对传统协同过滤算法进行改进,再融合巴氏系数和Jaccard系数,形成一种新的User-based Model,从而进行精准服务推荐,本发明提高了传统协同过滤算法的精确度。
为实现本发明的上述目的所提出的服务推荐模型,具体解决方案包括两个部分:
第一部分:基于用户关系的协同过滤(User-Based Collaborative Filtering)推荐模型。根据提取的用户-服务的关系表中的信息,用K-MEANS 聚类算法对数据处理,根据近邻的偏好向目标用户推送服务。
第二部分:引入巴氏系数(Bhattacharyya Coefficient)和Jaccard系数对模型进行改进。巴氏系数利用用户间所有的推荐评分信息,克服了仅用共同推荐评分的限制。Jaccard系数用于增加相似性度量中共同推荐项所占的比重,将推荐服务进行关联,计算共同推荐项的用户相似度,进而预测目标用户对目标服务的评分,为用户进行推荐,减少了传统User-Item矩阵评分数据稀疏时难以对用户兴趣特征进行特征判断的问题,提高推荐服务的准确度。
附图说明
图1是本发明的系统结构图;
图2是本发明的用户-服务信息处理流程图;
图3是本发明的服务推送流程图;
具体实施方式
下面结合附图对发明的具体实施作进一步的详细阐明。
一种基于改进协同过滤算法的服务推荐模型,用于进行精准的个性服务推荐。本技术首先对传统协同过滤算法进行改进,再融合Jaccard系数和巴氏系数,形成一种新的User-based Model,从而进行精准服务推荐,本发明提高了传统协同过滤算法的精确度。
第一部分:基于用户协同过滤提取用户-服务信息,而后用K-means聚类算法处理数据,基于近邻偏好向目标用户推送服务。步骤如下:(1)计算目标用户与其他用户相似度,找到与目标用户兴趣相似的用户;
用余弦相似度计算两用户之间的相似度,设N(u)为用户u喜欢的服务集合, N(v)为用户v喜欢的服务集合,则用户u与用户v之间的相似度为:
(2)选择最近邻;
a)初始化常数K,随机选取初始点为质心;
b)重复计算一下过程,直到质心不再改变;
c)计算样本与每个质心之间的相似度,将样本归类到最相似的类中;
d)重新计算质心;
e)输出最终的质心以及每个类。
(3)根据最近邻的评分加权值得到目标用户评分。
第二部分:引入巴氏系数和Jaccard系数。步骤如下:
(1)基于Patra提出的巴氏系数相似度测试相似度的方法定义;
设p1(x)和p2(x)为离散域X中的两种密度分布,则巴氏系数相似度定义如下:
p1(x)和p2(x)的密度可以由评分矩阵计算得出,假定pi和pj为评分数据中推荐服务Ii和Ij的估计离散密度。
(2)计算推荐服务间相似性公式如下:
其中,k表示评分数目;n(i)表示当前推荐服务的用户数目,n(v) 为当前推荐服务评分为v的用户数目。
(3)基于Jaccard推荐服务相似性度量公式为:
其中Iu和Iv分别为用户U和用户V在所有推荐服务上的评分集合。
为了增加共同评分项目在相似度计算上的比重,加入Jaccard相似度量进行改进限制共同评分项目少的用户,若用户各自评分项目多而共同评分项目较少,则两者相似性下降。
(4)改进的基于Jaccard推荐服务相似性度量公式如下:
其中,Iu表示用户U的评分集合;Iv表示用户V的评分集合。
(5)融合了改进的Jaccard和巴氏系数的推荐服务相似度公式如下:
当用户评分在完全不相似的项目上时,Sim/(U,V)由改进的Jaccard决定。而巴氏系数则提高了庞大数据上算法的利用率。该算法摆脱了传统协同过滤算法在计算用户相似性时共同评分限制,解决了评分数据不足时的商品推荐准确率。
Claims (3)
1.一种基于改进的协同过滤推荐算法的服务推荐模型。其特征在于:主要包括基于用户的协同过滤进行服务推荐、引入巴氏系数及Jaccard系数进而提高推荐服务准确率两部分。通过发现用户最近邻,根据用户的兴趣,挖掘数据,并通过数学函数对目标计算,再通过评分矩阵,依据矩阵产生分数罗列推荐列表,在此基础上,本技术基于传统协同过滤算法进行改进,并融合巴氏系数和Jaccard系数,从而进行精准服务推荐。本发明形成一种新的User-Based Mode l,并提高传统协同过滤算法的精确度。
2.根据权利要求1所述一种基于改进的协同过滤推荐算法的服务推荐模型,其特征在于:基于用户协同过滤与K-means聚类向目标用户推送服务如下:
S21:计算目标用户与其他用户相似度,找到与目标用户兴趣相似的用户。
S22:选择最近邻,为获得服务评分奠基。
S23:根据最近邻的评分加权值得到目标用户对推荐服务的评分。
3.根据权利要求1所述一种基于改进的协同过滤推荐算法的服务推荐模型,其特征在于:引入巴氏系数和Jaccard系数:
S31:基于Patra提出的巴氏系数相似度测试相似度的方法定义。
S32:计算推荐服务间相似性公式。
S33:基于Jaccard推荐服务相似性度量公式。
S34:改进的基于Jaccard推荐服务相似性度量公式。
S35:融合了改进的巴氏系数和Jaccard系数的推荐服务相似度公式。该融合公式摆脱了传统协同过滤算法在计算用户相似性时共同评分限制,解决了评分数据不足时的商品推荐准确率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810431077.2A CN108694234A (zh) | 2018-05-08 | 2018-05-08 | 一种基于改进协同过滤算法的服务推荐模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810431077.2A CN108694234A (zh) | 2018-05-08 | 2018-05-08 | 一种基于改进协同过滤算法的服务推荐模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108694234A true CN108694234A (zh) | 2018-10-23 |
Family
ID=63847263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810431077.2A Pending CN108694234A (zh) | 2018-05-08 | 2018-05-08 | 一种基于改进协同过滤算法的服务推荐模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108694234A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109684552A (zh) * | 2018-12-26 | 2019-04-26 | 云南宾飞科技有限公司 | 一种智能信息推荐系统 |
CN109948055A (zh) * | 2019-03-19 | 2019-06-28 | 中森云链(成都)科技有限责任公司 | 一种基于群体偏好的推荐方法 |
CN111768283A (zh) * | 2020-07-01 | 2020-10-13 | 厦门力含信息技术服务有限公司 | 一种改进型协同过滤算法模型的财务大数据分析方法 |
CN112819570A (zh) * | 2021-01-21 | 2021-05-18 | 东北大学 | 一种基于机器学习的商品智能搭配推荐方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593417A (zh) * | 2013-10-25 | 2014-02-19 | 安徽教育网络出版有限公司 | 基于关联规则预测的协同过滤推荐方法 |
CN105824942A (zh) * | 2016-03-21 | 2016-08-03 | 上海珍岛信息技术有限公司 | 一种基于协同过滤算法的项目推荐方法及系统 |
CN106021329A (zh) * | 2016-05-06 | 2016-10-12 | 西安电子科技大学 | 基于用户相似度的稀疏数据协同过滤推荐方法 |
-
2018
- 2018-05-08 CN CN201810431077.2A patent/CN108694234A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593417A (zh) * | 2013-10-25 | 2014-02-19 | 安徽教育网络出版有限公司 | 基于关联规则预测的协同过滤推荐方法 |
CN105824942A (zh) * | 2016-03-21 | 2016-08-03 | 上海珍岛信息技术有限公司 | 一种基于协同过滤算法的项目推荐方法及系统 |
CN106021329A (zh) * | 2016-05-06 | 2016-10-12 | 西安电子科技大学 | 基于用户相似度的稀疏数据协同过滤推荐方法 |
Non-Patent Citations (2)
Title |
---|
张保富: "《基于聚类分析和协同过滤技术的推荐算法研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
杨家慧: "《基于用户兴趣的协同过滤推荐算法研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109684552A (zh) * | 2018-12-26 | 2019-04-26 | 云南宾飞科技有限公司 | 一种智能信息推荐系统 |
CN109948055A (zh) * | 2019-03-19 | 2019-06-28 | 中森云链(成都)科技有限责任公司 | 一种基于群体偏好的推荐方法 |
CN111768283A (zh) * | 2020-07-01 | 2020-10-13 | 厦门力含信息技术服务有限公司 | 一种改进型协同过滤算法模型的财务大数据分析方法 |
CN112819570A (zh) * | 2021-01-21 | 2021-05-18 | 东北大学 | 一种基于机器学习的商品智能搭配推荐方法 |
CN112819570B (zh) * | 2021-01-21 | 2023-09-26 | 东北大学 | 一种基于机器学习的商品智能搭配推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108694234A (zh) | 一种基于改进协同过滤算法的服务推荐模型 | |
CN104077357B (zh) | 基于用户的协同过滤组合推荐方法 | |
CN102231166A (zh) | 基于社会上下文的协同推荐方法 | |
CN106952167B (zh) | 一种基于多元线性回归的餐饮业好友连边影响力预测方法 | |
CN107016122B (zh) | 基于时间迁移的知识推荐方法 | |
CN103886001A (zh) | 一种个性化商品推荐系统 | |
CN108550068A (zh) | 一种基于用户行为分析的个性化商品推荐方法及系统 | |
CN106021298B (zh) | 一种基于非对称加权相似度的协同过滤推荐方法及系统 | |
CN107256241B (zh) | 基于网格与差异替换改进多目标遗传算法的电影推荐方法 | |
CN108198045A (zh) | 基于电子商务网站数据挖掘的混合推荐系统的设计方法 | |
CN103399858A (zh) | 基于信任的社会化协同过滤推荐方法 | |
CN105678590B (zh) | 一种面向社交网络基于云模型的topN推荐方法 | |
CN107329994A (zh) | 一种基于用户特征的改进协同过滤推荐方法 | |
CN108132964B (zh) | 一种基于用户对项目类评分的协同过滤方法 | |
CN109460519B (zh) | 浏览对象推荐方法及装置、存储介质、服务器 | |
CN108694606B (zh) | 一种基于关联规则的客户画像及服务推送方法 | |
CN109508428A (zh) | 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法 | |
CN111681084B (zh) | 一种基于社交关系影响因素的电商平台推荐方法 | |
CN110083764A (zh) | 一种协同过滤算法冷启动问题的解决方法 | |
CN109635200B (zh) | 一种基于中介真值程度度量和用户的协同过滤推荐方法 | |
CN110197404A (zh) | 可降低流行度偏差的个性化长尾商品推荐方法和系统 | |
CN109977299A (zh) | 一种融合项目热度和专家系数的推荐算法 | |
CN109584016A (zh) | 一种商品推荐方法 | |
CN116541607A (zh) | 基于商品检索数据分析的智能推荐方法 | |
Devika et al. | Book recommendation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181023 |
|
WD01 | Invention patent application deemed withdrawn after publication |