CN115115435A - 基于多样性的电商推荐算法 - Google Patents
基于多样性的电商推荐算法 Download PDFInfo
- Publication number
- CN115115435A CN115115435A CN202210922516.6A CN202210922516A CN115115435A CN 115115435 A CN115115435 A CN 115115435A CN 202210922516 A CN202210922516 A CN 202210922516A CN 115115435 A CN115115435 A CN 115115435A
- Authority
- CN
- China
- Prior art keywords
- recommendation
- recommendation algorithm
- algorithm
- user
- commerce
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及电商技术领域,且公开了基于多样性的电商推荐算法,包括:①、为了解决在电商推荐场景下,优化推荐算法,提高推荐多样性,并且解决电商推荐算法推荐长尾现象,推荐算法模型的评价准则为:(1)、准确率和召回率:准确率是针对预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本;而召回率是针对原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。本发明针对冷门商品提出的推荐系统目的是引起消费者对冷门商品的关注,满足消费者的个性化需要并且发现其未意识到的兴趣爱好,提高消费者对该电子商品平台的惊喜度和新颖度。最终结果使得电商平台和消费者都能形成双赢的局面。
Description
技术领域
本发明涉及电商技术领域,具体为基于多样性的电商推荐算法。
背景技术
大数据和人工智能技术的发展催生出的智能推荐虽然一定程度给读者的阅读带来了便捷,但计算机信息处理的局限性会导致读者获取信息的范围习惯性受自己短时期内的兴趣引导。以至于获取信息不断收敛,就像蚕茧一般被困于“茧房”之中成为信息孤岛。对于电商系统来说,这会导致热门商品被大量堆砌在用户面前,整体推荐结果同质化严重。传统的基于内容的推荐方法会加剧茧房状态的形成。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了基于多样性的电商推荐算法,解决了上述背景技术中所存在的问题。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:基于多样性的电商推荐算法,包括:
①、为了解决在电商推荐场景下,优化推荐算法,提高推荐多样性,并且解决电商推荐算法推荐长尾现象,推荐算法模型的评价准则为:
(1)、准确率和召回率:准确率是针对预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本;而召回率是针对原来的样本而言的,它表示的是样本中的正例有多少被预测正确了;如下式:
式中,INu为用户u推荐的物品列表,Tu表示与用户u实际有过交互行为的物品列表;
(2)、覆盖率:指的是推荐系统中推荐的物品数占总物品集合的比例,如下式:
其中,|I|表示总物品数,覆盖率较高的推荐算法可以将物品空间中的大量物品推荐给系统的用户,这样的推荐算法才具有良好的长尾商品的挖掘能力,所以好的推荐算法需要在保持较高准确率和召回率的同时,提高其覆盖率;
(3)、平均流行度:为了更好的解决推荐算法推荐长尾物品的能力,使用平均流行度衡量推荐系统推荐长尾商品的能力;平均流行度越高,说明推荐算法倾向于推荐流行物品;所以为了提高推荐算法推荐长尾商品的能力,平均流行度需要尽可能的低,如下式:
②、上述基于长尾现象推荐算法的模型,传统的基于协同过滤的推荐算法均会受到不同程度的长尾效应的影响,为此,对传统的基于协同过滤的推荐算法进行改进,使长尾商品得到有效的推荐,具体为:
(1)、采用某网购平台100万条商品评分数据集进行实验,将商品转换成数据点的形式,采用K-Means聚类算法将商品进行分类,具体流程如下:
(11)、随机选取K个中心点,生成对应的k个簇;
(12)、遍历所有的数据点,依据“距离”将每一个数据点划分到最近的中心点所在的簇;
(13)、计算每个簇所有的数据点的平均值,并作为该簇新的中心;
(14)、重复2-3步,直到这k个簇的中心点不再变化,或者达到规定的迭代次数;
将K-Means算法的第(12)步中计算距离改成计算每一个数据点划分到最近的中心点所在的簇的相似度;相似度采用(2)中的修正的余弦相似度公式;
(2)、在基于用户的协同过滤算法计算相似度时采用修正的余弦相似度公式(在计算用户相似度时对用户u和用户v共同兴趣列表中的热门物品进行惩罚),公式如下:
其中,|H(i)|表示与物品i有过历史交互记录的用户集合,|H(i)|越大说明与物品i有过交互行为的用户数越多,也就是物品i越热门,热门物品在计算用户相似度时所占的比例就越小。
优选的,所述的采用某网购平台100万商品评述数据集进行实验,数据的格式为产品编号、产品ID、评分、用户ID。
(三)有益效果
本发明提供了基于多样性的电商推荐算法,具备以下有益效果:
本发明与传统的ItemCF和UserCF算法相比,在准确率和召回率上与其他两者相差无几,但是覆盖率却提升了不少。由于覆盖率说明推荐系统给出的商品的流行度,进而体现出本文的推荐系统具有比较好推荐冷门商品的能力。具体的原理是覆盖率对推荐结果进行分析评价,覆盖率高的推荐系统给出的推荐列表中,一般包括较多的商品种类和较少的推荐次数,故该推荐系统具有很强的冷门商品发掘的能力。准确率可以度量一个推荐系统或者推荐算法预测用户行为的能力。因此利用覆盖率、准确度作为评价推荐系统的指标。本发明针对冷门商品提出的推荐系统目的是引起消费者对冷门商品的关注,满足消费者的个性化需要并且发现其未意识到的兴趣爱好,提高消费者对该电子商品平台的惊喜度和新颖度。最终结果使得电商平台和消费者都能形成双赢的局面。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种技术方案:基于多样性的电商推荐算法,包括:
①、为了解决在电商推荐场景下,优化推荐算法,提高推荐多样性,并且解决电商推荐算法推荐长尾现象,推荐算法模型的评价准则为:
(1)、准确率和召回率:准确率是针对预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本;而召回率是针对原来的样本而言的,它表示的是样本中的正例有多少被预测正确了;如下式:
式中,INu为用户u推荐的物品列表,Tu表示与用户u实际有过交互行为的物品列表;
(2)、覆盖率:指的是推荐系统中推荐的物品数占总物品集合的比例,如下式:
其中,|I|表示总物品数,覆盖率较高的推荐算法可以将物品空间中的大量物品推荐给系统的用户,这样的推荐算法才具有良好的长尾商品的挖掘能力,所以好的推荐算法需要在保持较高准确率和召回率的同时,提高其覆盖率;
(3)、平均流行度:为了更好的解决推荐算法推荐长尾物品的能力,使用平均流行度衡量推荐系统推荐长尾商品的能力;平均流行度越高,说明推荐算法倾向于推荐流行物品;所以为了提高推荐算法推荐长尾商品的能力,平均流行度需要尽可能的低,如下式:
②、上述基于长尾现象推荐算法的模型,传统的基于协同过滤的推荐算法均会受到不同程度的长尾效应的影响,为此,对传统的基于协同过滤的推荐算法进行改进,使长尾商品得到有效的推荐,具体为:
(1)、采用某网购平台100万条商品评分数据集进行实验,数据的格式为产品编号、产品ID、评分、用户ID。
将商品转换成数据点的形式,采用K-Means聚类算法将商品进行分类,具体流程如下:
(11)、随机选取K个中心点,生成对应的k个簇;
(12)、遍历所有的数据点,依据“距离”将每一个数据点划分到最近的中心点所在的簇;
(13)、计算每个簇所有的数据点的平均值,并作为该簇新的中心;
(14)、重复2-3步,直到这k个簇的中心点不再变化,或者达到规定的迭代次数;
将K-Means算法的第(12)步中计算距离改成计算每一个数据点划分到最近的中心点所在的簇的相似度;相似度采用(2)中的修正的余弦相似度公式;
(2)、在基于用户的协同过滤算法计算相似度时采用修正的余弦相似度公式(在计算用户相似度时对用户u和用户v共同兴趣列表中的热门物品进行惩罚),公式如下:
其中,|H(i)|表示与物品i有过历史交互记录的用户集合,|H(i)|越大说明与物品i有过交互行为的用户数越多,也就是物品i越热门,热门物品在计算用户相似度时所占的比例就越小。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (2)
1.基于多样性的电商推荐算法,其特征在于,包括:
①、为了解决在电商推荐场景下,优化推荐算法,提高推荐多样性,并且解决电商推荐算法推荐长尾现象,推荐算法模型的评价准则为:
(1)、准确率和召回率:准确率是针对预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本;而召回率是针对原来的样本而言的,它表示的是样本中的正例有多少被预测正确了;如下式:
式中,INu为用户u推荐的物品列表,Tu表示与用户u实际有过交互行为的物品列表;
(2)、覆盖率:指的是推荐系统中推荐的物品数占总物品集合的比例,如下式:
其中,|I|表示总物品数,覆盖率较高的推荐算法可以将物品空间中的大量物品推荐给系统的用户,这样的推荐算法才具有良好的长尾商品的挖掘能力,所以好的推荐算法需要在保持较高准确率和召回率的同时,提高其覆盖率;
(3)、平均流行度:为了更好的解决推荐算法推荐长尾物品的能力,使用平均流行度衡量推荐系统推荐长尾商品的能力;平均流行度越高,说明推荐算法倾向于推荐流行物品;所以为了提高推荐算法推荐长尾商品的能力,平均流行度需要尽可能的低,如下式:
②、上述基于长尾现象推荐算法的模型,传统的基于协同过滤的推荐算法均会受到不同程度的长尾效应的影响,为此,对传统的基于协同过滤的推荐算法进行改进,使长尾商品得到有效的推荐,具体为:
(1)、采用某网购平台100万条商品评分数据集进行实验,将商品转换成数据点的形式,采用K-Means聚类算法将商品进行分类,具体流程如下:
(11)、随机选取K个中心点,生成对应的k个簇;
(12)、遍历所有的数据点,依据“距离”将每一个数据点划分到最近的中心点所在的簇;
(13)、计算每个簇所有的数据点的平均值,并作为该簇新的中心;
(14)、重复2-3步,直到这k个簇的中心点不再变化,或者达到规定的迭代次数;
将K-Means算法的第(12)步中计算距离改成计算每一个数据点划分到最近的中心点所在的簇的相似度;相似度采用(2)中的修正的余弦相似度公式;
(2)、在基于用户的协同过滤算法计算相似度时采用修正的余弦相似度公式(在计算用户相似度时对用户u和用户v共同兴趣列表中的热门物品进行惩罚),公式如下:
其中,|H(i)|表示与物品i有过历史交互记录的用户集合,|H(i)|越大说明与物品i有过交互行为的用户数越多,也就是物品i越热门,热门物品在计算用户相似度时所占的比例就越小。
2.根据权利要求1所述的基于多样性的电商推荐算法,其特征在于:所述的采用某网购平台100万商品评述数据集进行实验,数据的格式为产品编号、产品ID、评分、用户ID。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210922516.6A CN115115435A (zh) | 2022-08-02 | 2022-08-02 | 基于多样性的电商推荐算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210922516.6A CN115115435A (zh) | 2022-08-02 | 2022-08-02 | 基于多样性的电商推荐算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115115435A true CN115115435A (zh) | 2022-09-27 |
Family
ID=83335129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210922516.6A Pending CN115115435A (zh) | 2022-08-02 | 2022-08-02 | 基于多样性的电商推荐算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115115435A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116861323A (zh) * | 2023-07-24 | 2023-10-10 | 深圳丰享信息技术有限公司 | 一种在推荐中解决长尾效应的方法和装置 |
CN118035044A (zh) * | 2024-04-11 | 2024-05-14 | 福建省计量科学研究院(福建省眼镜质量检验站) | 一种大数据推荐算法推荐准确度评价方法 |
-
2022
- 2022-08-02 CN CN202210922516.6A patent/CN115115435A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116861323A (zh) * | 2023-07-24 | 2023-10-10 | 深圳丰享信息技术有限公司 | 一种在推荐中解决长尾效应的方法和装置 |
CN116861323B (zh) * | 2023-07-24 | 2024-02-23 | 深圳丰享信息技术有限公司 | 一种在推荐中解决长尾效应的方法和装置 |
CN118035044A (zh) * | 2024-04-11 | 2024-05-14 | 福建省计量科学研究院(福建省眼镜质量检验站) | 一种大数据推荐算法推荐准确度评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106651546B (zh) | 一种面向智慧社区的电子商务信息推荐方法 | |
CN110162706B (zh) | 一种基于交互数据聚类的个性化推荐方法及系统 | |
CN102609523B (zh) | 基于物品分类和用户分类的协同过滤推荐方法 | |
CN115115435A (zh) | 基于多样性的电商推荐算法 | |
CN107833117B (zh) | 一种考虑标签信息的贝叶斯个性化排序推荐方法 | |
CN109064285A (zh) | 一种获得商品推荐序列及商品推荐方法 | |
CN108563690B (zh) | 一种基于面向对象聚类的协同过滤推荐方法 | |
CN108665323A (zh) | 一种用于理财产品推荐系统的集成方法 | |
CN112102029B (zh) | 一种基于知识图谱的长尾推荐计算方法 | |
CN103559622A (zh) | 基于特征的协同过滤推荐方法 | |
CN108491431B (zh) | 一种基于自编码机和聚类的混合推荐方法 | |
CN108664564A (zh) | 一种基于物品内容特征的改进协同过滤推荐方法 | |
CN110197404A (zh) | 可降低流行度偏差的个性化长尾商品推荐方法和系统 | |
CN111681084B (zh) | 一种基于社交关系影响因素的电商平台推荐方法 | |
CN104616178A (zh) | 一种基于大数据多标记分类方法的电子商务商品推荐方法 | |
CN109977299A (zh) | 一种融合项目热度和专家系数的推荐算法 | |
CN114168761B (zh) | 多媒体数据的推送方法、装置、电子设备及存储介质 | |
CN108920709B (zh) | 基于随机森林修正的大数据下改进协同过滤推荐方法 | |
Huang et al. | A novel topic-based framework for recommending long tail products | |
CN111651678A (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN110020918B (zh) | 一种推荐信息生成方法和系统 | |
CN108399197A (zh) | 基于用户置信度和时间上下文的协同过滤推荐方法 | |
CN107766576A (zh) | 一种微博用户兴趣特征的提取方法 | |
CN110727863A (zh) | 一种基于复杂网络协同过滤的项目推荐方法 | |
CN108959506A (zh) | 一种基于群体兴趣的资源推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |