CN113204713A - 一种大规模商品销售中核心用户和核心物品的挖掘方法 - Google Patents
一种大规模商品销售中核心用户和核心物品的挖掘方法 Download PDFInfo
- Publication number
- CN113204713A CN113204713A CN202110755421.5A CN202110755421A CN113204713A CN 113204713 A CN113204713 A CN 113204713A CN 202110755421 A CN202110755421 A CN 202110755421A CN 113204713 A CN113204713 A CN 113204713A
- Authority
- CN
- China
- Prior art keywords
- user
- core
- article
- similarity
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种大规模商品销售中核心用户和核心物品的挖掘方法,包括初始化物品对用户重要性权重矩阵和物品的核心用户。依次循环迭代更新用户对物品的喜爱权重矩阵、每个用户的核心物品、物品对用户的重要性权重矩阵和每个物品的核心用户,当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品,以及两权重矩阵。本发明中通过依次循环迭代更新用户对物品的喜爱权重矩阵、每个用户的核心物品、物品对用户的重要性权重矩阵和每个物品的核心用户,能够在较少的迭代次数收敛,挖掘出两种权重矩阵的最优值、以及核心用户、核心物品,为后续推荐生成提供更多知识,提高推荐准确度。
Description
技术领域
本发明属于数据挖掘推荐技术领域,具体涉及一种大规模商品销售中核心用户和核心物品的挖掘方法。
背景技术
基于邻域的协同过滤,其核心思想是向用户推荐与他喜爱物品相似的物品,因此推荐的准确性由两方面决定:首先是对用户喜爱物品的度量,即判断出用户的喜爱物品是什么;其次是物品间的相似性度量。在日常生活中,人们经常观察到某个用户更喜欢某些物品,而有些用户对某项物品更加忠诚,即物品对这些用户更重要。由于偏好的存在,那每个用户也存在其最喜爱的物品、每个物品存在对其最重要的用户。将这两种偏好应用到常见的相似度度量中可提高相似度的准确度,进一步地可通过制定合适的策略求出用户的核心物品和物品的核心用户,提高推荐的准确度。但由于知识的缺乏,无法直接求出用户或物品的偏好程度。
发明内容
本发明提出一种大规模商品销售中核心用户和核心物品的挖掘方法,提高相似度度量准确度及后续推荐准确度。
本发明所采用的技术方案为:
一种大规模商品销售中核心用户和核心物品的挖掘方法,包括如下步骤:
步骤二、依次循环迭代更新用户对物品的喜爱权重矩阵、每个用户的核心物品、物品对用户的重要性权重矩阵和每个物品的核心用户,l表示第l轮迭代;当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品、权重矩阵和。
进一步地,步骤一包括:
对于每个用户u,以用户u为中心的总体加权相似度和为
当用户满足
进一步地,步骤二包括:
步骤202、更新核心物品
表示用户u的最大总体相似度和为
对于每个用户u,通过归一化的加权相似度来量化每个物品i的重要性;
步骤204、更新核心用户
进一步地,所述相似度度量包括欧氏距离取反、余弦相似度和皮尔逊相关系数。
本发明的有益效果在于:
本发明中通过依次循环迭代更新用户对物品的喜爱权重矩阵、每个用户的核心物品、物品对用户的重要性权重矩阵和每个物品的核心用户,能够在较少的迭代次数收敛,挖掘出两种权重矩阵的最优值、以及核心用户、核心物品,为后续推荐生成提供更多知识,提高推荐准确度。
附图说明
图1为本发明的方法流程图;
图2为本发明的方法模型原理图;
图3为本发明在两个数据集的运行效果图。
具体实施方式
本发明的挖掘方法通过顺序迭代更新用户对物品的喜爱权重矩阵、用户的核心物品、物品对用户的重要性权重矩阵和物品的核心用户,最后收敛到最优值,为后续推荐提供更多知识,提高相似准确度和推荐精度。并且,通过公开的数据集多次实验,本发明的方法能够在较少的迭代次数收敛,挖掘出两种权重矩阵的最优值,核心用户和核心物品。
下面结合附图和具体的实施例对本发明的大规模商品销售中核心用户和核心物品的挖掘方法作进一步地详细说明。
如图1所示,一种大规模商品销售中核心用户和核心物品的挖掘方法,在该挖掘方法前,需预先收集用户对物品的交互行为,将其量化为评分形式,对异常值进行删除,缺失值进行填充,并转换成用户-物品评分矩阵形式。
本发明的挖掘方法包括如下步骤:
对于每个用户u,以用户u为中心的总体加权相似度和为
当用户满足
步骤二、依次循环迭代更新用户对物品的喜爱权重矩阵、每个用户的核心物品、物品对用户的重要性权重矩阵和每个物品的核心用户,l表示第l轮迭代。当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品、权重矩阵和。
步骤二包括:
步骤202、更新核心物品
对于每个用户u和每对物品,表示用户u的喜爱物品集合。选择相似度度量(如欧氏距离取反、余弦相似度、皮尔逊相关系数),将权重系数与选择的相似度加权(即加权相似度)。计算两个物品间的加权相似度。以物品i为中心,计算总体加权相似度,即由物品i对用户u的贡献为
表示用户u的最大总体相似度和为
对于每个用户u,通过归一化的加权相似度来量化每个物品i的重要性。
步骤204、更新核心用户
图2为本发明的方法模型原理图,其中,M表示物品数,N表示用户数,其中矩阵中的元素1表示对应用户对物品感兴趣。表示用户u的喜爱物品集合,表示喜爱物品i的用户集合,不同物品对用户u的重要性程度不同,其总和为1。不同对物品i的喜爱程度也不同,总和为1。在计算相似度时,在评分前加上权重,即加权相似度,可提高相似度的准确性。
下面以一个例子作示例性说明。考虑一个四个物品(行)和四个用户(列)构成的系统,其评分矩阵为,循环迭代6次收敛,最终的权重矩阵和如表1所示。各用户的核心物品和各物品的核心用户,最大总体加权相似度如表2所示。
表2 核心物品、核心用户、最大总体加权相似度
首先,容易看出物品i 4只被用户u 3喜爱,用户u 4只喜爱一个物品i 1,那么i 4的核心用户必然是u 3,u 4的核心物品必然是i 1,可在表2中得到。其次,尽管物品i 1被u 1和u 4同时喜爱,用户u 4是更重要的,因为u 4是更忠实于它,所以u 4是i 1的核心用户。对于系统来说,研究用户的概况和了解他的独特需求是有用的,特别是对于i 1。同样地,尽管用户u 3喜爱三个物品i 2,i 3,i 4,u 3选择了i 4作为他的独特品味(其他用户都没有关注i 4),所以有理由相信i 4是对u 3更重要的,即是他的核心物品。
图3为本发明在两个数据集的运行收敛效果图,其中,图3(a)为数据集ML100k的运行收敛效果图,图3(b)为数据集ML1m的运行收敛效果图。实验中,使用两个真实电影评分数据集,MovieLens100k(缩写为ML100k)和MovieLens1m(缩写为ML1m),两个数据集的特征如下表3所示。
表3 数据集及其特征
在初始数据集中,每个用户至少对20部影片评分,评分为整数1-5。为了方便运行,将评分4和5映射为(即用户u喜爱影片i),将1,2和3映射为 (用户u不喜爱或者还没观察到影片i)。并且得到的评分矩阵R中全零行和全零列将被移除。
为了证明算法的收敛性,评估了每个用户相邻迭代的总加权相似和,计算了每个用户与的比值,其中,由公式(7)将l替换成第l-1轮获得,表示在所有用户中最大的,并按升序排序。在ML100k数据集的结果可看出,只经过四轮迭代对于绝大多数用户来说趋于稳定,类似地在ML1m数据集经过九轮迭代收敛。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术方法范围内,可轻易想到的替换或变换方法,都应该涵盖在本发明的保护范围之内。
Claims (5)
3.根据权利要求2所述的大规模商品销售中核心用户和核心物品的挖掘方法,其特征在于,步骤二包括:
步骤202、更新核心物品
表示用户u的最大总体相似度和为
对于每个用户u,通过归一化的加权相似度来量化每个物品i的重要性;
步骤204、更新核心用户
5.根据权利要求2或3所述的大规模商品销售中核心用户和核心物品的挖掘方法,其特征在于,所述相似度度量包括欧氏距离取反、余弦相似度和皮尔逊相关系数。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110755421.5A CN113204713B (zh) | 2021-07-05 | 2021-07-05 | 一种大规模商品销售中核心用户和核心物品的挖掘方法 |
PCT/CN2021/143476 WO2023279685A1 (zh) | 2021-07-05 | 2021-12-31 | 一种大规模商品销售中核心用户和核心物品的挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110755421.5A CN113204713B (zh) | 2021-07-05 | 2021-07-05 | 一种大规模商品销售中核心用户和核心物品的挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113204713A true CN113204713A (zh) | 2021-08-03 |
CN113204713B CN113204713B (zh) | 2021-10-08 |
Family
ID=77022573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110755421.5A Active CN113204713B (zh) | 2021-07-05 | 2021-07-05 | 一种大规模商品销售中核心用户和核心物品的挖掘方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113204713B (zh) |
WO (1) | WO2023279685A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023279685A1 (zh) * | 2021-07-05 | 2023-01-12 | 南京信息工程大学 | 一种大规模商品销售中核心用户和核心物品的挖掘方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281956A (zh) * | 2014-10-27 | 2015-01-14 | 南京信息工程大学 | 基于时间信息的适应用户兴趣变化的动态推荐方法 |
CN108520450A (zh) * | 2018-03-21 | 2018-09-11 | 电子科技大学 | 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统 |
CN109886779A (zh) * | 2019-01-30 | 2019-06-14 | 上海大学 | 一种智能商品推荐系统 |
CN112115359A (zh) * | 2020-09-16 | 2020-12-22 | 苏州大学 | 一种基于多阶近邻预测的推荐系统及方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10191949B2 (en) * | 2015-06-18 | 2019-01-29 | Nbcuniversal Media, Llc | Recommendation system using a transformed similarity matrix |
CN108776919B (zh) * | 2018-05-31 | 2021-07-20 | 西安电子科技大学 | 基于聚类及进化算法构建信息核的物品推荐方法 |
CN113204713B (zh) * | 2021-07-05 | 2021-10-08 | 南京信息工程大学 | 一种大规模商品销售中核心用户和核心物品的挖掘方法 |
-
2021
- 2021-07-05 CN CN202110755421.5A patent/CN113204713B/zh active Active
- 2021-12-31 WO PCT/CN2021/143476 patent/WO2023279685A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281956A (zh) * | 2014-10-27 | 2015-01-14 | 南京信息工程大学 | 基于时间信息的适应用户兴趣变化的动态推荐方法 |
CN108520450A (zh) * | 2018-03-21 | 2018-09-11 | 电子科技大学 | 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统 |
CN109886779A (zh) * | 2019-01-30 | 2019-06-14 | 上海大学 | 一种智能商品推荐系统 |
CN112115359A (zh) * | 2020-09-16 | 2020-12-22 | 苏州大学 | 一种基于多阶近邻预测的推荐系统及方法 |
Non-Patent Citations (6)
Title |
---|
HOSSEIN A. RAHMANI等: "Category-Aware Location Embedding for Point-of-Interest Recommendation", 《THE 2019 ACM SIGIR INTERNATIONAL CONFERENCE ON THE THEORY OF INFORMATION RETRIEVAL》 * |
JIAOLI ZHOU等: "Model and Implementation of E-commerce Recommendation System Based on User Clustering", 《2020 INTERNATIONAL CONFERENCE ON ADVANCE IN AMBIENT COMPUTING AND INTELLIGENCE》 * |
SHANYUN LIU等: "Matching Users’ Preference under Target Revenue Constraints in Data Recommendation Systems", 《ENTROPY 2019》 * |
夏景明: "一种基于用户和商品属性挖掘的协同过滤算法", 《现代电子技术》 * |
胡川等: "一种改进的偏好融合组推荐方法", 《软件学报》 * |
鲁辉等: "基于产品属性及用户偏好的个性化产品推荐方法", 《贵州师范大学学报( 自然科学版)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023279685A1 (zh) * | 2021-07-05 | 2023-01-12 | 南京信息工程大学 | 一种大规模商品销售中核心用户和核心物品的挖掘方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113204713B (zh) | 2021-10-08 |
WO2023279685A1 (zh) | 2023-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107563841B (zh) | 一种基于用户评分分解的推荐系统 | |
Ordonez | Clustering binary data streams with K-means | |
US10496678B1 (en) | Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis | |
CN103544216B (zh) | 一种结合图像内容和关键字的信息推荐方法及系统 | |
US8146120B2 (en) | Multi-criteria rating and searching system | |
CN112364976A (zh) | 基于会话推荐系统的用户偏好预测方法 | |
CN109299436B (zh) | 一种满足本地差分隐私的偏好排序数据收集方法 | |
CN106327240A (zh) | 一种基于gru神经网络的推荐方法和系统 | |
CN107220365A (zh) | 基于协同过滤与关联规则并行处理的精准推荐系统及方法 | |
JP6261547B2 (ja) | 判定装置、判定方法及び判定プログラム | |
US20210026873A1 (en) | Relevance estimation and actions based thereon | |
CN108399268B (zh) | 一种基于博弈论的增量式异构图聚类方法 | |
CN106789338B (zh) | 一种在动态大规模社交网络中发现关键人物的方法 | |
CN112950324A (zh) | 一种知识图谱辅助的成对排序个性化电商推荐方法及系统 | |
CN110348906B (zh) | 一种基于多类型隐式反馈的改进商品推荐方法 | |
CN116541607B (zh) | 基于商品检索数据分析的智能推荐方法 | |
CN112800207B (zh) | 一种商品信息推荐方法、装置及存储介质 | |
CN112380453A (zh) | 物品推荐方法、装置、存储介质及设备 | |
CN113204713B (zh) | 一种大规模商品销售中核心用户和核心物品的挖掘方法 | |
CN108399211B (zh) | 基于二值特征的大规模图像检索算法 | |
CN109584016A (zh) | 一种商品推荐方法 | |
CN113487117B (zh) | 一种基于多维度用户画像的电商用户行为数据模拟的方法及系统 | |
CN115186197A (zh) | 一种基于端到端双曲空间的用户推荐方法 | |
CN116910375B (zh) | 一种基于用户偏好多样性的跨域推荐方法及系统 | |
CN113342994A (zh) | 一种基于无采样协作知识图网络的推荐系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |