CN118096297A - 商品推荐方法、装置、设备、存储介质及产品 - Google Patents
商品推荐方法、装置、设备、存储介质及产品 Download PDFInfo
- Publication number
- CN118096297A CN118096297A CN202410183779.9A CN202410183779A CN118096297A CN 118096297 A CN118096297 A CN 118096297A CN 202410183779 A CN202410183779 A CN 202410183779A CN 118096297 A CN118096297 A CN 118096297A
- Authority
- CN
- China
- Prior art keywords
- user
- commodity
- similarity
- determining
- commodities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims description 52
- 230000003993 interaction Effects 0.000 claims description 38
- 230000004927 fusion Effects 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000010586 diagram Methods 0.000 claims description 18
- 238000003062 neural network model Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000007499 fusion processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 241000531116 Blitum bonus-henricus Species 0.000 description 1
- 235000008645 Chenopodium bonus henricus Nutrition 0.000 description 1
- 241000364483 Lipeurus epsilon Species 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Biophysics (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了商品推荐方法、装置、设备、存储介质及产品,该方法包括:根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数;获取所述第一用户和所述第二用户相同的用户属性;确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度;根据所述用户属性的相似度和所述相关系数进行加权计算,得到所述第一用户和所述第二用户之间的用户相似度;基于所述用户相似度进行商品推荐。考虑不同用户之间的差异性,根据不同用户的用户属性进行个性化商品推荐,满足不同用户的推荐需求。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种商品推荐方法、装置、设备、存储介质及产品。
背景技术
随着电子商务的快速发展,推荐系统已经被广泛研究和应用,推荐系统通过提取分析用户的资料、行为、评分等数据来获取用户的喜好,以帮助电商找到用户可能购买的产品。基于用户的协同过滤是一种非常成功并应用广泛的推荐技术。
相关技术中,将用户对商品的评分矩阵中未进行评分的项进行补全,得到不具有空值的虚拟评分矩阵,再根据补充评分后的虚拟评分矩阵寻找目标用户的相似用户集,最后根据相似用户集对商品的评分数据向用户推荐商品;利用补充评分后的虚拟评分矩阵寻找目标用户的相似用户集可提高相似用户的计算准确率,从而提高商品推荐的准确率。
但是,现有的推荐算法对于用户兴趣的挖掘较为单一,且未考虑不同用户之间的差异性,无法满足个性化推荐需求。
发明内容
本申请实施例通过提供一种商品推荐方法、装置、设备、存储介质及产品,旨在考虑不同用户之间的差异性,根据不同用户的用户属性进行个性化商品推荐,满足不同用户的推荐需求。
本申请实施例提供了一种商品推荐方法,所述商品推荐方法,包括:
根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数;
获取所述第一用户和所述第二用户相同的用户属性;
确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度;
根据所述用户属性的相似度和所述相关系数进行加权计算,得到所述第一用户和所述第二用户之间的用户相似度;
基于所述用户相似度进行商品推荐。
可选地,所述根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数的步骤包括:
获取所述第一用户和所述第二用户需要进行共同评分的所有商品;
获取所述第一用户对各个所述商品的第一评分,并根据所述第一用户对各个所述商品的第一评分确定所述第一用户对所有商品的第一平均评分;
获取所述第二用户对各个所述商品的第二评分,并根据所述第二用户对各个所述商品的第二评分确定所述第二用户对所有商品的第二平均评分;
根据所述第一用户对各个所述商品的第一评分、所述第一用户对所有商品的第一平均评分、所述第二用户对各个所述商品的第二评分,以及所述第二用户对所有商品的第二平均评分,确定所述第一用户和所述第二用户之间的相关系数。
可选地,所述根据所述用户属性的数据类型确定所述用户属性的相似度的步骤包括:
当所述用户属性的数据类型为数值类型时,根据所述第一用户的用户属性和所述第二用户的用户属性之间的差值,确定所述第一用户和所述第二用户的所述用户属性的相似度,其中,所述差值越大,所述相似度越低;
当所述用户属性的数据类型为非数值类型时,根据所述第一用户的用户属性和所述第二用户的用户属性是否存在交集,确定所述第一用户和所述第二用户的所述用户属性的相似度。
可选地,所述基于所述用户相似度进行商品推荐的步骤包括:
根据各个用户之间的用户相似度构建用户相似度矩阵;
从所述用户相似度矩阵中,获取与目标用户的用户相似度最高的用户作为近邻用户,并根据所述近邻用户对所述目标用户的各个未评分商品的历史评分,确定所述目标用户的所述各个未评分商品的预测评分;
根据所述目标用户的所述各个未评分商品的预测评分,进行商品推荐。
可选地,所述从所述用户相似度矩阵中,获取与目标用户的用户相似度最高的用户作为近邻用户,并根据所述近邻用户对所述目标用户的各个未评分商品的历史评分,确定所述目标用户的所述各个未评分商品的预测评分的步骤包括:
根据所述用户相似度矩阵构建用户商品交互图和协作邻居图,其中,所述用户商品交互图包括:用户节点、商品节点、以及所述用户节点和所述商品节点之间的连接关系,所述协作邻居图包括多个用户节点,以及各个用户节点之间的连接关系;
将所述用户商品交互图和所述协作邻居图输入图卷积神经网络模型,得到每个卷积层下所述用户商品交互图的第一特征向量和所述协作邻居图的第二特征向量;
对每个卷积层下的所述第一特征向量和所述第二特征向量分别进行融合处理,得到每一卷积层对应的第一融合特征向量和第二融合特征向量;
根据每一卷积层对应的所述第一融合特征向量和所述第二融合特征向量,确定所述目标用户对未评分商品的预测评分。
可选地,所述将所述用户商品交互图和所述协作邻居图输入图卷积神经网络模型,得到每一卷积层下所述用户商品交互图的第一特征向量和所述协作邻居图的第二特征向量的步骤包括:
将所述用户商品交互图和所述协作邻居图输入图卷积神经网络模型,通过所述图卷积神经网络模型中每层的不同卷积核分别对所述用户商品交互图和所述协作邻居图进行特征提取,得到每个卷积层下所述用户商品交互图的各个特征向量和所述协作邻居图的各个特征向量;
对每个卷积层下所述用户商品交互图的各个所述特征向量进行拼接,得到每一卷积层下所述用户商品交互图的第一特征向量;以及,
对每个卷积层下所述协作邻居图的各个所述特征向量进行拼接,得到每一卷积层下所述协作邻居图的第二特征向量。
此外,为实现上述目的,本申请还提供了一种商品推荐装置,包括:
相关系数确定模块,用于根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数;
获取模块,用于获取所述第一用户和所述第二用户相同的用户属性;
属性相似度确定模块,用于确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度;
用户相似度确定模块,用于根据所述用户属性的相似度和所述相关系数进行加权计算,得到所述第一用户和所述第二用户之间的用户相似度;
商品推荐模块,用于基于所述用户相似度进行商品推荐。
此外,为实现上述目的,本申请还提供了一种商品推荐设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的商品推荐程序,所述商品推荐程序被所述处理器执行时实现上述的商品推荐方法的步骤。
此外,为实现上述目的,本申请还提供了一种计算机可读存储介质,其上存储有商品推荐程序,所述商品推荐程序被处理器执行时实现上述的商品推荐方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机程序产品,所述计算机程序产品包括商品推荐程序,所述商品推荐程序被处理器执行时实现如上文所述的商品推荐方法的步骤。
本申请实施例中提供的一种商品推荐方法、装置、设备、存储介质及产品的技术方案,本申请根据不同用户相同的用户属性的数据类型确定用户属性的相似度,同时结合用户对商品的评分确定用户之间的相关系数,最后根据用户属性的相似度和用户之间的相关系数确定用户相似度,并基于用户相似度进行商品推荐。由于在进行商品推荐过程中,考虑不同用户的用户属性之间的差异性,确定用户属性的相似度,能够满足不同用户的个性化商品推荐需求。
附图说明
图1为本申请实施例方案涉及的硬件运行环境的结构示意图;
图2为本申请商品推荐方法一实施例的流程示意图;
图3为本申请卷积神经网络的一网络模型示意图;
图4为本申请商品推荐装置的功能模块图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明,上述附图只是一个实施例图,而不是发明的全部。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本申请实施例方案涉及的商品推荐设备的硬件运行环境的结构示意图。
如图1所示,该商品推荐设备可以包括:处理器1001,例如CPU,存储器1005,用户接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏、输入单元比如键盘,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器,例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的商品推荐设备结构并不构成对商品推荐设备限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及商品推荐程序。其中,操作系统是管理和控制商品推荐设备硬件和软件资源的程序,商品推荐程序以及其他软件或程序的运行。
在图1所示的商品推荐设备中,用户接口1003主要用于连接终端,与终端进行数据通信;网络接口1004主要用于后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的商品推荐程序。
在本实施例中,商品推荐设备包括:存储器1005、处理器1001及存储在所述存储器上并可在所述处理器上运行的商品推荐程序,其中:
处理器1001调用存储器1005中存储的商品推荐程序时,执行以下操作:
获取所述第一用户和所述第二用户相同的用户属性;
确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度;
根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数;
根据所述用户属性的相似度和所述相关系数进行加权计算,得到所述第一用户和所述第二用户之间的用户相似度;
基于所述用户相似度进行商品推荐。
本发明实施例提供了一种商品推荐方法,参照图2,图2为本发明商品推荐方法一实施例的流程示意图。在本实施例中,商品推荐方法包括:
步骤S110,根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数。
可选地,根据第一用户、第二用户对单个商品的评分和对所有商品的平均评分计算得到第一用户和第二用户之间的相关系数。
可选地,获取第一用户和第二用户需要进行共同评分的所有商品。获取第一用户对各个所述商品的第一评分,并根据第一用户对各个商品的第一评分确定所述第一用户对所有商品的第一平均评分。获取第二用户对各个商品的第二评分,并根据第二用户对各个商品的第二评分确定第二用户对所有商品的第二平均评分。根据第一用户对各个商品的第一评分、第一用户对所有商品的第一平均评分、第二用户对各个商品的第二评分,以及第二用户对所有商品的第二平均评分,确定第一用户和第二用户之间的相关系数。
例如,假设第一用户喜欢商品x、y、z,而第二用户喜欢商品x、y。经过分析,可以判断第一用户和第二用户的兴趣相似,因此,可以将商品z推荐给第二用户。同样地,如果发现大部分喜欢商品x的用户也喜欢商品y,就说明商品x和商品y有很大的相似性。因此,当用户购买商品x时,可以将商品y推荐给该用户。
根据以下公式确定第一用户和第二用户之间的相关系数:
。
其中,sim(m,n)表示用户m和用户n的相似度,i表示用户m和用户n需要共同评分的商品,表示用户m对商品 i的评分,/>表示用户m对所有商品的平均评分,/>表示用户n对商品i的评分,/>表示用户n对所有商品的平均评分。sim(m,n)用以表示用户m和用户n之间的相似性。sim(m,n)值越大,表示用户之间的相似性越高。其中,用户m是第一用户,用户n是第二用户,或者,用户m是第二用户,用户n可以是第一用户。
本实施例根据上述技术方案,根据第一用户对各个商品的第一评分、第一用户对所有商品的第一平均评分、所述第二用户对各个商品的第二评分,以及第二用户对所有商品的第二平均评分,确定第一用户和第二用户之间的相关系数,能够基于用户和商品之间的关系确定用户之间的相关系数,提高相关系数的准确性。
步骤S120,获取所述第一用户和所述第二用户相同的用户属性。
考虑到现有的相似度计算方式存在未考虑用户的差异性的问题,因此,本申请基于该问题,提出了用户属性与相关系数结合的相似度计算方法,以起到更加客观综合计算用户相似度系数的效果。
进一步由上述内容的出发,用户的差异性是导致购买商品差异的主要原因。例如,学生更倾向于购买与学习相关的商品,而工作的人更喜欢购买日常生活用品。老年人喜欢购买健康营养类商品,而年轻人则更喜欢购买娱乐性强的商品。因此,用户的属性也是计算用户相似度的一个重要方面。传统的根据用户对商品评分来计算用户相似度的皮尔逊相关系数可以进行改进,将用户属性和皮尔逊相关系数结合起来进行改进。用户属性中可以引入性别、年龄、职业等属性。假设U表示用户的集合,U={u1,u2,...,u},F表示用户属性的集合,用户u的属性可以表示为f={f_{u1},f_{u2},...,f_{un}}。
可选地,第一用户和第二用户的用户属性可存在多个。
示例性地,第一用户和第二用户的用户属性如下:
需要强调的是,后续在确定用户属性的相似度时,是确定用户相同的用户属性的相似度,即确定第一用户的年龄和第二用户的年龄的相似度,确定第一用户的性别和第二用户的性别的相似度,确定第一用户的工作和第二用户的工作的相似度,确定第一用户的收入和第二用户的收入的相似度。
步骤S130,确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度。
可选地,不同用户属性的数据类型可能相同,也可能不同,数据类型包括数值类型和非数值类型。
可选地,当所述用户属性的数据类型为数值类型时,根据所述第一用户的用户属性和所述第二用户的用户属性之间的差值,确定所述第一用户和所述第二用户的所述用户属性的相似度,其中,所述差值越大,所述相似度越低。
示例性地,以年龄属性为例,计算公式为:
。
从上述公式可知,当第一用户和第二用户的年龄差越大时,其相似度越低,当第一用户和第二用户的年龄差越小时,其相似度越高。
可选地,当所述用户属性的数据类型为非数值类型时,根据所述第一用户的用户属性和所述第二用户的用户属性是否存在交集,确定所述第一用户和所述第二用户的所述用户属性的相似度。
可选地,当所述第一用户的用户属性和所述第二用户的用户属性存在交集时,确定所述第一用户和所述第二用户的所述用户属性的相似度为第一相似度,当所述第二用户的用户属性和所述第二用户的用户属性不存在交集时,确定所述第一用户和所述第二用户的所述用户属性的相似度为第二相似度。
示例性地,以职业属性为例,计算公式为:
。
从上述公式可知,当第一用户的职业和第二用户的职业存在交集时,表示第一用户和第二用户的类别相同或类似,确定第一用户和第二用户的职业属性的相似度为第一相似度,即第一相似度设置为1;当第一用户的职业和第二用户的职业不存在交集时,表示第一用户和第二用户的类别不同,确定第一用户和第二用户的职业属性的相似度为第二相似度,即第二相似度设置为0。
本实施例根据上述技术方案,确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度,能够考虑不同用户的用户属性的差异,确定不同用户相同用户属性的相似度,满足后续不同用户的个性化商品推荐需求。
步骤S140,根据所述用户属性的相似度和所述相关系数进行加权计算,得到所述第一用户和所述第二用户之间的用户相似度。
可选地,在确定用户属性的相似度和相关系数之后,获取用户属性的相似度的权重值和相关系数的权重值,根据用户属性的相似度、用户属性的相似度的权重值、相关系数和相关系数的权重值进行加权计算,得到第一用户和第二用户之间的用户相似度。
示例性,假设用户属性包括年龄属性和职业属性,那么,可根据以下公式计算第一用户和第二用户之间的用户相似度,具体计算公式如下:
其中,表示第一用户和第二用户的年龄属性的相似度,/>表示第一用户和第二用户的职业属性的相似度,/>表示相关系数。w1和w2表示权重。
步骤S150,基于所述用户相似度进行商品推荐。
可选地,可确定目标用户与其他用户的相似度,确定与目标用户相似度最高,或者相似度大于预设相似度的其他用户,由于该其他用户的喜好商品是已知的,因此,可将该其他用户的喜好商品推荐给目标用户,以实现商品推荐的目的。
本实施例根据上述技术方案,根据不同用户相同的用户属性的数据类型确定用户属性的相似度,同时结合用户对商品的评分确定用户之间的相关系数,最后根据用户属性的相似度和用户之间的相关系数确定用户相似度,并基于用户相似度进行商品推荐。由于在进行商品推荐过程中,考虑不同用户的用户属性之间的差异性,确定用户属性的相似度,能够满足不同用户的个性化商品推荐需求。
进一步地,基于上述各实施例,在本实施例中,步骤S150:基于所述用户相似度进行商品推荐包括:
步骤S151,根据各个用户之间的用户相似度构建用户相似度矩阵。
步骤S152,从所述用户相似度矩阵中,获取与目标用户的用户相似度最高的用户作为近邻用户,并根据所述近邻用户对所述目标用户的各个未评分商品的历史评分,确定所述目标用户的所述各个未评分商品的预测评分。
步骤S153,根据所述目标用户的所述各个未评分商品的预测评分,进行商品推荐。
可选地,在根据上述方式得到用户相似度之后,构建用户相似度矩阵,用于衡量不同用户之间的相似度。从中选择与目标用户相似度最高的N个用户作为其近邻用户,并计算目标用户对未评分商品的预测评分,以进行商品推荐。
由于热门物品在共现矩阵中的特征向量相对较密集,它们往往被频繁推荐,而冷门物品的特征向量相对较稀疏,导致它们很少被推荐。对比学习被用来解决数据稀疏性的问题。然而,大多数基于对比学习的方法只利用原始的用户-商品交互图来构建任务,缺乏对高阶信息(即用户-用户和用户-商品关系)的明确利用。为了更准确地利用高阶信息,本申请提出了一种自适应融合GNN算法来融合从用户商品和用户学习的嵌入。算法考虑了当前GNN层、用户商品图中的用户活动程度,以及从用户商品图和用户-用户图中学习的两个嵌入之间的相似性。自适应融合算法的目的是消除无用的高阶信息,注意用户活动,减少冗余信息,所有GNN层中融合嵌入的均值池被视为最终的用户表征,视为最终用户表示,以构建协同过滤的主要任务。
可选地,根据所述用户相似度矩阵构建用户商品交互图和协作邻居图,其中,所述用户商品交互图包括:用户节点、商品节点、以及所述用户节点和所述商品节点之间的连接关系,所述协作邻居图包括多个用户节点,以及各个用户节点之间的连接关系。将所述用户商品交互图和所述协作邻居图输入图卷积神经网络模型,得到每个卷积层下所述用户商品交互图的第一特征向量和所述协作邻居图的第二特征向量。对每个卷积层下的所述第一特征向量和所述第二特征向量分别进行融合处理,得到每一卷积层对应的第一融合特征向量和第二融合特征向量。根据每一卷积层对应的所述第一融合特征向量和所述第二融合特征向量,确定所述目标用户对未评分商品的预测评分。
具体地,设G表示用户商品交互图,是包括协作社交图S(即用户-用户图)和协作知识图K(用户-商品图)的协作邻居图。
。
为了计算效率和过滤不相关的信息,过滤器阈值,定义/>如下:
。
在每个GNN层分别从用户商品交互图G和协作邻居图中学习嵌入,此外,采用自适应融合策略来融合两个图中的学习嵌入信息传播,对于节点i,允许/>和/>分别表示G和/>中的第l-th层。l-th个GNN层被馈送到下一个GNN层。
。
为了捕获G中的用户商品交互信息和中的高阶用户-用户(用户-商品)关系,采用自适应融合策略进一步融合/>和/>。
由于基于注意力的融合策略存在过早收敛的问题,存在性能差的问题,因此,在这项工作中,提出了一种自适应的非参数化融合策略,以更准确地确定辅助用户-用户关系的贡献。允许表示在每个GNN层中的融合嵌入。形式上,自适应融合策略如下:
其中,表示用户相似度,𝛾是用于控制/>,di表示标准化的用户活动,为了缓解用户活动的巨大差异,对商品取对数。
对于协作邻居图,随着层数的增加,高阶信息变得无用,甚至对性能产生负面影响。因此,为了消除无用的高阶信息/>应与层数成反比,减少信息冗余。当/>和/>高阶信息是冗余的,融合冗余信息可能会带来负面影响,相似性应该通过用户商品图中的用户活动来加权。
根据用户u交互过的商品及其对此类商品的评分学习商品空间用户潜在因素,其中C(i)是用户与之交互的商品集,/>与/>为交互权重,/>和b为神经网络的权值和偏差。聚合函数如下:
。
使用均值池来组合所有层的融合嵌入(即和/>,l ∈ [1,L]) 并且初始嵌入(即和/>) 以获得最终表示。
。
对于最终的表示,采用内积来预测用户的可能性u与商品交互i:
。
其中,是用户的预测得分u和商品i 。为了直接捕捉交互信息,将使用传统贝叶斯个性化排序算法 BPR 模型中的损失函数,它的思想是让正样本和负样本的得分之差尽可能达到最大。BPR 是一种用于隐式推荐的无偏成对损失函数,与逐点损失函数有所不同,它将用户对商品的评分生成一个三元组(u,i,j),其中,商品i表示被用户喜欢/点击/查看等交互过的,而商品 j则相反。在本模型中以 BPR作为基础目标函数,采用L2正则化项防止过拟合,则损失函数Loss 定义为式所示,其中,/>值是sigmoid函数。
。
本实施例根据上述技术方案,采用了一种自适应融合GNN算法来融合从用户商品和用户学习的嵌入,考虑了当前GNN层、用户商品图中的用户活动程度,以及从用户商品图和用户-用户图中学习的两个嵌入之间的相似性,能够解决现有商圈用户分群推荐算法往往只考虑用户个人行为数据,无法准确捕捉用户与商圈之间的关联关系,导致推荐结果的准确性有限的问题,提高推荐结果的准确性。
在一实施例中,当用户和物品同时具有多种类型的数据,如文本、图像、交互历史等,CNN可以用于处理其中的图像数据,提供跨模态的推荐效果。融合CNN的协同过滤适用于具有视觉或文本特征的推荐情况,可以处理多模态数据。
在传统神经网络的基础上进行改进,将卷积神经网络每层的单个卷积层改进为多个并行的卷积层。这些卷积层用于对用户属性和商品描述信息进行特征提取,采用不同尺寸大小的卷积核来进行特征提取,然后将提取出的不同特征矩阵进行拼接,从而形成一个更深、更具有代表性的特征矩阵。这进一步允许提取不同形式的卷积映射属性向量。
。
其中, wi为权重,b 为偏置,选用 ReLU 非线性函数作为激活函数。
可选地,将所述用户商品交互图和所述协作邻居图输入图卷积神经网络模型,通过所述图卷积神经网络模型中每层的不同卷积核分别对所述用户商品交互图和所述协作邻居图进行特征提取,得到每个卷积层下所述用户商品交互图的各个特征向量和所述协作邻居图的各个特征向量。对每个卷积层下所述用户商品交互图的各个所述特征向量进行拼接,得到每一卷积层下所述用户商品交互图的第一特征向量。对每个卷积层下所述协作邻居图的各个所述特征向量进行拼接,得到每一卷积层下所述协作邻居图的第二特征向量。
具体地,在对用户描述属性和商品描述属性进行嵌入层处理后,这些属性特征可以被表示为包含单词向量的矩阵。随后,这些矩阵将通过卷积操作,针对每一种卷积核类型进行处理。
。
在上述描述中,其中,n表示文本中包含的单词数量。由于卷积层中使用不同大小的卷积核进行卷积计算后,得到的特征图大小是不同的。因此,需要经过池化层的处理,将这些不同大小的特征图转换成相同大小的特征向量。这样做可以确保不同卷积核提取的特征能够被统一处理,从而形成一致的特征表示。为了让用户和商品特征向量 U、V通过内积运算得到的评分更加接近真实值,更能准确地反映用户的兴趣偏好,最终构造出的新的损失函数如式:
其中,表示损失函数,/>表示原始评价矩阵,/>表示用户偏置项,/>表示商品偏置项,/>表示用户和商品描述属性信息经改进的卷积神经网络构造出的评分值,/>表示正则化平衡系数。
本实施例根据上述技术方案,本申请对于多模态数据,在传统神经网络的基础上进行改进,将卷积神经网络每层的单个卷积层改进为多个并行的卷积层分别处理单模态数据,卷积层用于对用户属性和商品描述属性进行特征提取,采用不同尺寸大小的卷积核进行特征提取,将提取出的不同特征矩阵进行拼接后进行后续处理,能够处理大规模商圈和用户数据,提高数据处理效率。
在一实施例中,本申请确定用户之间的相关系数之前,获取用户数据,对用户数据进行处理,基于处理后的用户数据进行商场用户分群,基于分群后的商场用户数据便于后续的相关系数的计算,以及用户属性的相似度的计算,提高相关系数和用户属性的相似度的计算结果的准确性。具体包括以下步骤:
步骤一:采集用户访问商场的行为数据,即获取用户数据。
从运营商及商圈中收集用户数据,用户数据包括用户的年龄特征、消费行为、客群结构、购买行为等信息,制定用户推荐策略,主要字段如下所示:
分析区域 | 指标 | 分析维度 |
商场、周边 | 性别特征 | 男、女 |
商场、周边 | 年龄特征 | 16岁以下、16-18岁、18-25岁、25-35岁、35-45岁、45-65岁、65岁以上 |
商场 | 客群来源 | 区县、省内、国内、国际 |
商场 | 消费特征 | 高、中、低 |
商场 | 家庭结构 | 单身人群、情侣(新婚)人群、满巢人群、空巢人群、非空巢人群 |
商场 | 客群结构 | 周边居住人口、周边工作人口、三公里以外人口、周边常住人口 |
商场 | 所属行业 | 制造业、社会组织、批发和零售业、交通运输仓储和邮政业、卫生社会保障和社会福利业 |
商场 | 终端品牌 | 品牌A、品牌B、品牌C、品牌D、品牌E |
商场 | 兴趣偏好 | 餐饮、音乐、购物、美容、母婴、教育、通讯、视频、搜索、新闻 |
商场 | 消费偏好 | 购物网站A,网站B、网站C、网站D、网站E |
商场 | 逛街频率 | 每月1次、每月2次、每月3次、每月3次以上 |
商场 | 驻留时长 | 低于1小时、1-3小时、3-5小时、5-7小时、7-9小时、超过9小时 |
商场 | 固定资产 | 有房、有车、有房有车、无 |
商场 | 收入特征 | 高、中、低 |
商场 | 购买记录/评价 | 餐饮服务、购物服务、生活服务、住宿服务、体育休闲服务、医疗保健服务等领域 |
步骤二:数据清洗。
在商场营业时间到访过门店的用户,剔除过路用户和员工用户。
员工用户:当天在商场累计驻留时间大于5小时的用户。
过路用户:当天在商场累计驻留时间小于15分钟的用户。
步骤三:商场用户分群分析。
以商场A的用户为例,在休闲时间较少的工作日不如休闲时间充裕的周末和节假日。访客高峰时段在晚间7点,访客更集中在下午及晚间到访。相比休息日(周末和节假日),工作日的白天访客更少。
商场访客均以中等消费水平为主,商场刷卡消费2次以内的群体超一半,伴随移动支付的普及,微信、支付宝等支付方式抢占了银行卡的使用市场。商场访客网络偏好基本相似,视频、支付、银行类APP比阅读、金融、购物类APP更受访客欢迎,两大现代网络支付软件微信支付、支付宝使用人数位居支付类APP榜首;银行类 APP中招商银行最受商场访客欢迎;金融类APP使用访客数差距较小。
商场的访客来源较为集中,访客分布体现就近原则:约七成访客来自商场所处区,邻近区的访客约占一成。约六成访客到访次数在3次以内。到访次数越多,对应的访客人数越少, 商场应根据访客到访频率适当营销推广,拉新留存,访客驻留时长以1-2小时之间为主。
本申请基于上述方式对用户数据进行处理,在采用上述处理后的用户数据进行后续相关系数和用户属性的相似度计算时,提高相关系数和用户属性的相似度的计算结果的准确性。
本申请实施例提供了商品推荐方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
如图4所示,本申请提供的一种商品推荐装置,包括:
相关系数确定模块30,用于根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数;
获取模块10,用于获取所述第一用户和所述第二用户相同的用户属性;
属性相似度确定模块20,用于确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度;
用户相似度确定模块40,用于根据所述用户属性的相似度和所述相关系数进行加权计算,得到所述第一用户和所述第二用户之间的用户相似度;
商品推荐模块50,用于基于所述用户相似度进行商品推荐。
本申请商品推荐装置具体实施方式与上述商品推荐方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有商品推荐程序,所述商品推荐程序被处理器执行时实现如上文所述的商品推荐方法的步骤。
此外,本发明实施例还提出一种计算机程序产品,包括商品推荐程序,所述商品推荐程序被处理器执行时实现如上所述的商品推荐方法的步骤。
本发明计算机程序产品具体实施方式与上述商品推荐方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“ 包括”、“ 包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“ 包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,电视,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种商品推荐方法,其特征在于,所述商品推荐方法包括:
根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数;
获取所述第一用户和所述第二用户相同的用户属性;
确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度;
根据所述用户属性的相似度和所述相关系数进行加权计算,得到所述第一用户和所述第二用户之间的用户相似度;
基于所述用户相似度进行商品推荐。
2.如权利要求1所述的商品推荐方法,其特征在于,所述根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数的步骤包括:
获取所述第一用户和所述第二用户需要进行共同评分的所有商品;
获取所述第一用户对各个所述商品的第一评分,并根据所述第一用户对各个所述商品的第一评分确定所述第一用户对所有商品的第一平均评分;
获取所述第二用户对各个所述商品的第二评分,并根据所述第二用户对各个所述商品的第二评分确定所述第二用户对所有商品的第二平均评分;
根据所述第一用户对各个所述商品的第一评分、所述第一用户对所有商品的第一平均评分、所述第二用户对各个所述商品的第二评分,以及所述第二用户对所有商品的第二平均评分,确定所述第一用户和所述第二用户之间的相关系数。
3.如权利要求1所述的商品推荐方法,其特征在于,所述根据所述用户属性的数据类型确定所述用户属性的相似度的步骤包括:
当所述用户属性的数据类型为数值类型时,根据所述第一用户的用户属性和所述第二用户的用户属性之间的差值,确定所述第一用户和所述第二用户的所述用户属性的相似度,其中,所述差值越大,所述相似度越低;
当所述用户属性的数据类型为非数值类型时,根据所述第一用户的用户属性和所述第二用户的用户属性是否存在交集,确定所述第一用户和所述第二用户的所述用户属性的相似度。
4.如权利要求1所述的商品推荐方法,其特征在于,所述基于所述用户相似度进行商品推荐的步骤包括:
根据各个用户之间的用户相似度构建用户相似度矩阵;
从所述用户相似度矩阵中,获取与目标用户的用户相似度最高的用户作为近邻用户,并根据所述近邻用户对所述目标用户的各个未评分商品的历史评分,确定所述目标用户的所述各个未评分商品的预测评分;
根据所述目标用户的所述各个未评分商品的预测评分,进行商品推荐。
5.如权利要求4所述的商品推荐方法,其特征在于,所述从所述用户相似度矩阵中,获取与目标用户的用户相似度最高的用户作为近邻用户,并根据所述近邻用户对所述目标用户的各个未评分商品的历史评分,确定所述目标用户的所述各个未评分商品的预测评分的步骤包括:
根据所述用户相似度矩阵构建用户商品交互图和协作邻居图,其中,所述用户商品交互图包括:用户节点、商品节点、以及所述用户节点和所述商品节点之间的连接关系,所述协作邻居图包括多个用户节点,以及各个用户节点之间的连接关系;
将所述用户商品交互图和所述协作邻居图输入图卷积神经网络模型,得到每个卷积层下所述用户商品交互图的第一特征向量和所述协作邻居图的第二特征向量;
对每个卷积层下的所述第一特征向量和所述第二特征向量分别进行融合处理,得到每一卷积层对应的第一融合特征向量和第二融合特征向量;
根据每一卷积层对应的所述第一融合特征向量和所述第二融合特征向量,确定所述目标用户对未评分商品的预测评分。
6.如权利要求5所述的商品推荐方法,其特征在于,所述将所述用户商品交互图和所述协作邻居图输入图卷积神经网络模型,得到每一卷积层下所述用户商品交互图的第一特征向量和所述协作邻居图的第二特征向量的步骤包括:
将所述用户商品交互图和所述协作邻居图输入图卷积神经网络模型,通过所述图卷积神经网络模型中每层的不同卷积核分别对所述用户商品交互图和所述协作邻居图进行特征提取,得到每个卷积层下所述用户商品交互图的各个特征向量和所述协作邻居图的各个特征向量;
对每个卷积层下所述用户商品交互图的各个所述特征向量进行拼接,得到每一卷积层下所述用户商品交互图的第一特征向量;以及,
对每个卷积层下所述协作邻居图的各个所述特征向量进行拼接,得到每一卷积层下所述协作邻居图的第二特征向量。
7.一种商品推荐装置,其特征在于,所述商品推荐装置包括:
相关系数确定模块,用于根据第一用户和第二用户对商品的评分,确定所述第一用户和所述第二用户之间的相关系数;
获取模块,用于获取所述第一用户和所述第二用户相同的用户属性;
属性相似度确定模块,用于确定所述用户属性的数据类型,并根据所述用户属性的数据类型确定所述用户属性的相似度;
用户相似度确定模块,用于根据所述用户属性的相似度和所述相关系数进行加权计算,得到所述第一用户和所述第二用户之间的用户相似度;
商品推荐模块,用于基于所述用户相似度进行商品推荐。
8.一种商品推荐设备,其特征在于,所述商品推荐设备包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的商品推荐程序,所述商品推荐程序被所述处理器执行时实现如权利要求1-6中任一项所述的商品推荐方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有商品推荐程序,所述商品推荐程序被处理器执行时实现权利要求1-6中任一项所述的商品推荐方法的步骤。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括商品推荐程序,所述商品推荐程序被处理器执行时实现如权利要求1至6中任一项所述的商品推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410183779.9A CN118096297A (zh) | 2024-02-18 | 2024-02-18 | 商品推荐方法、装置、设备、存储介质及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410183779.9A CN118096297A (zh) | 2024-02-18 | 2024-02-18 | 商品推荐方法、装置、设备、存储介质及产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118096297A true CN118096297A (zh) | 2024-05-28 |
Family
ID=91144770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410183779.9A Pending CN118096297A (zh) | 2024-02-18 | 2024-02-18 | 商品推荐方法、装置、设备、存储介质及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118096297A (zh) |
-
2024
- 2024-02-18 CN CN202410183779.9A patent/CN118096297A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111784455B (zh) | 一种物品推荐方法及推荐设备 | |
CN110942337A (zh) | 一种基于互联网大数据的精准旅游营销方法 | |
US20090248434A1 (en) | Analyzing transactional data | |
US20090248496A1 (en) | System and method for automating market analysis from anonymous behavior profiles | |
CN103119620A (zh) | 基于推测的社会关系的行为建议 | |
CN113781139B (zh) | 物品推荐方法、物品推荐装置、设备和介质 | |
CN108805598A (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
CN118132856B (zh) | 一种基于大数据的智能分析方法及系统 | |
WO2020221022A1 (zh) | 业务对象推荐方法 | |
CN108665083A (zh) | 一种基于用户画像动态轨迹模型的广告推荐方法及系统 | |
CN111429161A (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
Kao et al. | Prediction of remaining time on site for e‐commerce users: A SOM and long short‐term memory study | |
Sengupta et al. | Simple surveys: Response retrieval inspired by recommendation systems | |
CN115730125A (zh) | 对象识别方法、装置、计算机设备和存储介质 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN116467525A (zh) | 业务产品的推荐方法、装置、设备和存储介质 | |
Lu et al. | Artificial immune network with feature selection for bank term deposit recommendation | |
Pandey et al. | Recommending e-commerce products on cold start and long tail using transaction data | |
Sennouni et al. | Adaptive user-product recommendation system using supervised and unsupervised classification models | |
CN118096297A (zh) | 商品推荐方法、装置、设备、存储介质及产品 | |
CN114022165A (zh) | 匹配方法、装置、计算机设备和存储介质 | |
CN113590901A (zh) | 一种基于用户分群的物料推荐方法、装置、设备及存储介质 | |
CN113254775A (zh) | 一种基于客户浏览行为序列的信用卡产品推荐方法 | |
de Almeida et al. | Personalizing the top-k spatial keyword preference query with textual classifiers | |
KR102689996B1 (ko) | 스마트 부동산 매칭 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |