CN113204713A - 一种大规模商品销售中核心用户和核心物品的挖掘方法 - Google Patents

一种大规模商品销售中核心用户和核心物品的挖掘方法 Download PDF

Info

Publication number
CN113204713A
CN113204713A CN202110755421.5A CN202110755421A CN113204713A CN 113204713 A CN113204713 A CN 113204713A CN 202110755421 A CN202110755421 A CN 202110755421A CN 113204713 A CN113204713 A CN 113204713A
Authority
CN
China
Prior art keywords
user
core
article
similarity
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110755421.5A
Other languages
English (en)
Other versions
CN113204713B (zh
Inventor
董云泉
张壮壮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202110755421.5A priority Critical patent/CN113204713B/zh
Publication of CN113204713A publication Critical patent/CN113204713A/zh
Application granted granted Critical
Publication of CN113204713B publication Critical patent/CN113204713B/zh
Priority to PCT/CN2021/143476 priority patent/WO2023279685A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种大规模商品销售中核心用户和核心物品的挖掘方法,包括初始化物品对用户重要性权重矩阵和物品的核心用户。依次循环迭代更新用户对物品的喜爱权重矩阵、每个用户的核心物品、物品对用户的重要性权重矩阵和每个物品的核心用户,当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品,以及两权重矩阵。本发明中通过依次循环迭代更新用户对物品的喜爱权重矩阵、每个用户的核心物品、物品对用户的重要性权重矩阵和每个物品的核心用户,能够在较少的迭代次数收敛,挖掘出两种权重矩阵的最优值、以及核心用户、核心物品,为后续推荐生成提供更多知识,提高推荐准确度。

Description

一种大规模商品销售中核心用户和核心物品的挖掘方法
技术领域
本发明属于数据挖掘推荐技术领域,具体涉及一种大规模商品销售中核心用户和核心物品的挖掘方法。
背景技术
基于邻域的协同过滤,其核心思想是向用户推荐与他喜爱物品相似的物品,因此推荐的准确性由两方面决定:首先是对用户喜爱物品的度量,即判断出用户的喜爱物品是什么;其次是物品间的相似性度量。在日常生活中,人们经常观察到某个用户更喜欢某些物品,而有些用户对某项物品更加忠诚,即物品对这些用户更重要。由于偏好的存在,那每个用户也存在其最喜爱的物品、每个物品存在对其最重要的用户。将这两种偏好应用到常见的相似度度量中可提高相似度的准确度,进一步地可通过制定合适的策略求出用户的核心物品和物品的核心用户,提高推荐的准确度。但由于知识的缺乏,无法直接求出用户或物品的偏好程度。
发明内容
本发明提出一种大规模商品销售中核心用户和核心物品的挖掘方法,提高相似度度量准确度及后续推荐准确度。
本发明所采用的技术方案为:
一种大规模商品销售中核心用户和核心物品的挖掘方法,包括如下步骤:
步骤一、初始化物品对用户重要性权重矩阵
Figure 202404DEST_PATH_IMAGE001
和物品i的核心用户
Figure 542381DEST_PATH_IMAGE002
步骤二、依次循环迭代更新用户对物品的喜爱权重矩阵
Figure 853277DEST_PATH_IMAGE003
、每个用户的核心物品、物品对用户的重要性权重矩阵
Figure 982907DEST_PATH_IMAGE004
和每个物品的核心用户,l表示第l轮迭代;当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品、权重矩阵
Figure 469383DEST_PATH_IMAGE005
Figure 823004DEST_PATH_IMAGE006
进一步地,步骤一包括:
以初始物品对用户重要性权重矩阵
Figure 824458DEST_PATH_IMAGE007
开始,元素
Figure 679150DEST_PATH_IMAGE008
定义为用户u对物品i的评分
Figure 144767DEST_PATH_IMAGE009
除以用户u
Figure 872551DEST_PATH_IMAGE010
中物品的评分之和,即满足
Figure 33405DEST_PATH_IMAGE011
(1)
其中,
Figure 567155DEST_PATH_IMAGE010
为用户u的喜爱物品集合,
Figure 824961DEST_PATH_IMAGE012
选择相似度度量,将权重矩阵
Figure 409132DEST_PATH_IMAGE013
与选择的相似度加权;计算物品i在喜爱物品i的用户集合
Figure 181916DEST_PATH_IMAGE014
中,每对用户uv的加权相似度
Figure 129144DEST_PATH_IMAGE015
对于每个用户u,以用户u为中心的总体加权相似度和为
Figure 507035DEST_PATH_IMAGE016
(2)
当用户满足
Figure 373360DEST_PATH_IMAGE017
(3)
时,被选作为物品i的核心用户,表示物品i的最大总体加权相似度和为
Figure 23653DEST_PATH_IMAGE018
,即以
Figure 633626DEST_PATH_IMAGE019
为中心的总体加权相似度。
进一步地,步骤二包括:
步骤201、更新用户对物品的喜爱权重矩阵
Figure 866024DEST_PATH_IMAGE020
对于每个物品i,权重系数
Figure 309775DEST_PATH_IMAGE021
,即用户
Figure 791572DEST_PATH_IMAGE022
对于物品i的重要性,是由该用户与物品i的核心用户
Figure 408498DEST_PATH_IMAGE023
的加权相似度决定的;即
Figure 183819DEST_PATH_IMAGE024
(4)
Figure 860788DEST_PATH_IMAGE025
可简化表示为
Figure 95460DEST_PATH_IMAGE026
,且
Figure 250498DEST_PATH_IMAGE027
步骤202、更新核心物品
对于每个用户u和每对物品
Figure 395171DEST_PATH_IMAGE028
Figure 39779DEST_PATH_IMAGE029
表示用户u的喜爱物品集合;选择相似度度量,将权重系数
Figure 699431DEST_PATH_IMAGE030
与选择的相似度加权;计算两个物品间的加权相似度
Figure 845110DEST_PATH_IMAGE031
;以物品i为中心,计算总体加权相似度
Figure 641028DEST_PATH_IMAGE032
,即由物品i对用户u的贡献为
Figure 722116DEST_PATH_IMAGE033
(5)
Figure 541168DEST_PATH_IMAGE034
越大,物品i对于用户u越重要且越有代表性;
用户u的核心物品
Figure 303587DEST_PATH_IMAGE035
满足
Figure 281907DEST_PATH_IMAGE036
(6)
表示用户u的最大总体相似度和为
Figure 206001DEST_PATH_IMAGE037
(7)
即以
Figure 543309DEST_PATH_IMAGE038
为中心的总体加权相似度;
步骤203、更新物品对用户的重要性权重矩阵
Figure 843840DEST_PATH_IMAGE039
对于每个用户u,通过归一化的加权相似度来量化每个物品i的重要性;
Figure 942246DEST_PATH_IMAGE040
(8)
Figure 709345DEST_PATH_IMAGE041
,且一个物品i
Figure 830885DEST_PATH_IMAGE042
越近,它对用户u越重要,且有等式
Figure 997424DEST_PATH_IMAGE043
成立;
步骤204、更新核心用户
基于已经更新的权重系数
Figure 622440DEST_PATH_IMAGE044
,重新评估对于每个物品i的集合
Figure 340866DEST_PATH_IMAGE045
内每对用户uv的加权相似度
Figure 684123DEST_PATH_IMAGE046
以用户u为中心,总体加权相似度和
Figure 654353DEST_PATH_IMAGE047
,即他作为核心对物品i的总贡献为
Figure 399455DEST_PATH_IMAGE048
(9)
Figure 773936DEST_PATH_IMAGE049
最大时的用户为物品i的核心用户,即
Figure 666806DEST_PATH_IMAGE050
(10)
表示物品i的第l轮最大总体加权相似度和
Figure 112830DEST_PATH_IMAGE051
,即以
Figure 400855DEST_PATH_IMAGE052
为中心的总体加权相似度;
步骤205、设置收敛条件,并重复步骤201至205,当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品、权重矩阵
Figure 274133DEST_PATH_IMAGE053
Figure 388719DEST_PATH_IMAGE054
进一步地,步骤205中,所述收敛条件为
Figure 310539DEST_PATH_IMAGE055
,其中,
Figure 30233DEST_PATH_IMAGE056
表示第l+1轮的
Figure 871150DEST_PATH_IMAGE057
矩阵,
Figure 863246DEST_PATH_IMAGE058
表示无穷范数或最大范数,
Figure 651073DEST_PATH_IMAGE059
为可接受的迭代误差。
进一步地,所述相似度度量包括欧氏距离取反、余弦相似度和皮尔逊相关系数。
本发明的有益效果在于:
本发明中通过依次循环迭代更新用户对物品的喜爱权重矩阵、每个用户的核心物品、物品对用户的重要性权重矩阵和每个物品的核心用户,能够在较少的迭代次数收敛,挖掘出两种权重矩阵的最优值、以及核心用户、核心物品,为后续推荐生成提供更多知识,提高推荐准确度。
附图说明
图1为本发明的方法流程图;
图2为本发明的方法模型原理图;
图3为本发明在两个数据集的运行效果图。
具体实施方式
本发明的挖掘方法通过顺序迭代更新用户对物品的喜爱权重矩阵
Figure 287591DEST_PATH_IMAGE003
、用户的核心物品、物品对用户的重要性权重矩阵
Figure 502672DEST_PATH_IMAGE004
和物品的核心用户,最后收敛到最优值,为后续推荐提供更多知识,提高相似准确度和推荐精度。并且,通过公开的数据集多次实验,本发明的方法能够在较少的迭代次数收敛,挖掘出两种权重矩阵的最优值,核心用户和核心物品。
下面结合附图和具体的实施例对本发明的大规模商品销售中核心用户和核心物品的挖掘方法作进一步地详细说明。
如图1所示,一种大规模商品销售中核心用户和核心物品的挖掘方法,在该挖掘方法前,需预先收集用户对物品的交互行为,将其量化为评分形式,对异常值进行删除,缺失值进行填充,并转换成用户-物品评分矩阵形式。
本发明的挖掘方法包括如下步骤:
步骤一、初始化物品对用户重要性权重矩阵
Figure 467217DEST_PATH_IMAGE001
和物品i的核心用户
Figure 58735DEST_PATH_IMAGE002
以初始物品对用户重要性权重矩阵
Figure 549759DEST_PATH_IMAGE007
开始,元素
Figure 935741DEST_PATH_IMAGE008
定义为用户u对物品i的评分
Figure 135385DEST_PATH_IMAGE009
除以用户u
Figure 327332DEST_PATH_IMAGE010
中物品的评分之和,即满足
Figure 282649DEST_PATH_IMAGE060
(1)
其中,
Figure 105112DEST_PATH_IMAGE010
为用户u的喜爱物品集合,
Figure 168883DEST_PATH_IMAGE012
选择相似度度量(如欧氏距离取反、余弦相似度、皮尔逊相关系数),将权重矩阵
Figure 102204DEST_PATH_IMAGE013
与选择的相似度加权(即加权相似度)。计算物品i在喜爱物品i的用户集合
Figure 426875DEST_PATH_IMAGE014
中,每对用户uv的加权相似度
Figure 420239DEST_PATH_IMAGE015
对于每个用户u,以用户u为中心的总体加权相似度和为
Figure 971306DEST_PATH_IMAGE016
(2)
当用户满足
Figure 442738DEST_PATH_IMAGE017
(3)
时,被选作为物品i的核心用户,表示物品i的最大总体加权相似度和为
Figure 372648DEST_PATH_IMAGE018
,即以
Figure 599230DEST_PATH_IMAGE019
为中心的总体加权相似度。
步骤二、依次循环迭代更新用户对物品的喜爱权重矩阵
Figure 309697DEST_PATH_IMAGE003
、每个用户的核心物品、物品对用户的重要性权重矩阵
Figure 273236DEST_PATH_IMAGE061
和每个物品的核心用户,l表示第l轮迭代。当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品、权重矩阵
Figure 651128DEST_PATH_IMAGE053
Figure 783032DEST_PATH_IMAGE054
步骤二包括:
步骤201、更新用户对物品的喜爱权重矩阵
Figure 246374DEST_PATH_IMAGE020
对于每个物品i,权重系数
Figure 731714DEST_PATH_IMAGE021
,即用户
Figure 26429DEST_PATH_IMAGE022
对于物品i的重要性,是由该用户与物品i的核心用户
Figure 188289DEST_PATH_IMAGE023
的加权相似度决定的。即
Figure 138927DEST_PATH_IMAGE062
(4)
Figure 818170DEST_PATH_IMAGE025
可简化表示为
Figure 905075DEST_PATH_IMAGE026
,且
Figure 519727DEST_PATH_IMAGE027
步骤202、更新核心物品
对于每个用户u和每对物品
Figure 692082DEST_PATH_IMAGE063
Figure 643858DEST_PATH_IMAGE029
表示用户u的喜爱物品集合。选择相似度度量(如欧氏距离取反、余弦相似度、皮尔逊相关系数),将权重系数
Figure 542193DEST_PATH_IMAGE030
与选择的相似度加权(即加权相似度)。计算两个物品间的加权相似度
Figure 124484DEST_PATH_IMAGE031
。以物品i为中心,计算总体加权相似度
Figure 580874DEST_PATH_IMAGE032
,即由物品i对用户u的贡献为
Figure 477285DEST_PATH_IMAGE033
(5)
Figure 538782DEST_PATH_IMAGE034
越大,物品i对于用户u越重要且越有代表性。
用户u的核心物品
Figure 619871DEST_PATH_IMAGE035
满足
Figure 766818DEST_PATH_IMAGE036
(6)
表示用户u的最大总体相似度和为
Figure 185030DEST_PATH_IMAGE037
(7)
即以
Figure 163351DEST_PATH_IMAGE038
为中心的总体加权相似度。
步骤203、更新物品对用户的重要性权重矩阵
Figure 353023DEST_PATH_IMAGE039
对于每个用户u,通过归一化的加权相似度来量化每个物品i的重要性。
Figure 659371DEST_PATH_IMAGE040
(8)
Figure 22219DEST_PATH_IMAGE041
,且一个物品i
Figure 792729DEST_PATH_IMAGE042
越近,它对用户u越重要,且有等式
Figure 841719DEST_PATH_IMAGE043
成立。
步骤204、更新核心用户
基于已经更新的权重系数
Figure 963259DEST_PATH_IMAGE044
,重新评估对于每个物品i的集合
Figure 864218DEST_PATH_IMAGE045
内每对用户uv的加权相似度
Figure 426918DEST_PATH_IMAGE046
以用户u为中心,总体加权相似度和
Figure 958393DEST_PATH_IMAGE047
,即他作为核心对物品i的总贡献为
Figure 363967DEST_PATH_IMAGE048
(9)
Figure 271880DEST_PATH_IMAGE049
最大时的用户为物品i的核心用户,即
Figure 203933DEST_PATH_IMAGE050
(10)
表示物品i的第l轮最大总体加权相似度和为
Figure 703047DEST_PATH_IMAGE051
,即以
Figure 533600DEST_PATH_IMAGE052
为中心的总体加权相似度。
步骤205、设置收敛条件,并重复步骤201至205,当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品、权重矩阵
Figure 651729DEST_PATH_IMAGE005
Figure 516917DEST_PATH_IMAGE006
步骤205中,收敛条件为
Figure 452512DEST_PATH_IMAGE064
,其中,
Figure 770361DEST_PATH_IMAGE065
表示第l+1轮的
Figure 439983DEST_PATH_IMAGE057
矩阵,
Figure 956415DEST_PATH_IMAGE058
表示无穷范数或最大范数,
Figure 594DEST_PATH_IMAGE066
为可接受的迭代误差。
图2为本发明的方法模型原理图,其中,M表示物品数,N表示用户数,其中矩阵中的元素1表示对应用户对物品感兴趣。
Figure 743422DEST_PATH_IMAGE029
表示用户u的喜爱物品集合,
Figure 531250DEST_PATH_IMAGE067
表示喜爱物品i的用户集合,不同物品对用户u的重要性程度不同,其总和为1。不同对物品i的喜爱程度也不同,总和为1。在计算相似度时,在评分前加上权重,即加权相似度,可提高相似度的准确性。
下面以一个例子作示例性说明。考虑一个四个物品(行)和四个用户(列)构成的系统,其评分矩阵为
Figure 167767DEST_PATH_IMAGE068
,循环迭代6次收敛,最终的权重矩阵
Figure 382848DEST_PATH_IMAGE005
Figure 331081DEST_PATH_IMAGE006
如表1所示。各用户的核心物品和各物品的核心用户,最大总体加权相似度如表2所示。
表1 权重矩阵
Figure 984917DEST_PATH_IMAGE005
Figure 413624DEST_PATH_IMAGE006
Figure 268448DEST_PATH_IMAGE069
表2 核心物品、核心用户、最大总体加权相似度
Figure 48185DEST_PATH_IMAGE070
首先,容易看出物品i 4只被用户u 3喜爱,用户u 4只喜爱一个物品i 1,那么i 4的核心用户必然是u 3u 4的核心物品必然是i 1,可在表2中得到。其次,尽管物品i 1u 1u 4同时喜爱,用户u 4是更重要的,因为u 4是更忠实于它,所以u 4i 1的核心用户。对于系统来说,研究用户的概况和了解他的独特需求是有用的,特别是对于i 1。同样地,尽管用户u 3喜爱三个物品i 2i 3i 4u 3选择了i 4作为他的独特品味(其他用户都没有关注i 4),所以有理由相信i 4是对u 3更重要的,即是他的核心物品。
图3为本发明在两个数据集的运行收敛效果图,其中,图3(a)为数据集ML100k的运行收敛效果图,图3(b)为数据集ML1m的运行收敛效果图。实验中,使用两个真实电影评分数据集,MovieLens100k(缩写为ML100k)和MovieLens1m(缩写为ML1m),两个数据集的特征如下表3所示。
表3 数据集及其特征
Figure 600651DEST_PATH_IMAGE071
在初始数据集中,每个用户至少对20部影片评分,评分为整数1-5。为了方便运行,将评分4和5映射为
Figure 946182DEST_PATH_IMAGE072
(即用户u喜爱影片i),将1,2和3映射为
Figure 768644DEST_PATH_IMAGE073
(用户u不喜爱或者还没观察到影片i)。并且得到的评分矩阵R中全零行和全零列将被移除。
为了证明算法的收敛性,评估了每个用户相邻迭代的总加权相似和
Figure 707781DEST_PATH_IMAGE074
,计算了每个用户
Figure 375523DEST_PATH_IMAGE075
Figure 575560DEST_PATH_IMAGE076
的比值,其中,
Figure 755875DEST_PATH_IMAGE077
由公式(7)将l替换成第l-1轮获得,
Figure 979046DEST_PATH_IMAGE078
表示在所有用户中最大的
Figure 778374DEST_PATH_IMAGE079
,并按升序排序。在ML100k数据集的结果可看出,只经过四轮迭代
Figure 708284DEST_PATH_IMAGE079
对于绝大多数用户来说趋于稳定,类似地在ML1m数据集经过九轮迭代收敛。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术方法范围内,可轻易想到的替换或变换方法,都应该涵盖在本发明的保护范围之内。

Claims (5)

1.一种大规模商品销售中核心用户和核心物品的挖掘方法,其特征在于,包括如下步骤:
步骤一、初始化物品对用户重要性权重矩阵
Figure 690850DEST_PATH_IMAGE001
和物品i的核心用户
Figure 965974DEST_PATH_IMAGE002
步骤二、依次循环迭代更新用户对物品的喜爱权重矩阵
Figure 78286DEST_PATH_IMAGE003
、每个用户的核心物品、物品对用户的重要性权重矩阵
Figure 413453DEST_PATH_IMAGE004
和每个物品的核心用户,l表示第l轮迭代;当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品、权重矩阵
Figure 611216DEST_PATH_IMAGE005
Figure 424451DEST_PATH_IMAGE006
2.根据权利要求1所述的大规模商品销售中核心用户和核心物品的挖掘方法,其特征在于,步骤一包括:
以初始物品对用户重要性权重矩阵
Figure 656849DEST_PATH_IMAGE007
开始,元素
Figure 897338DEST_PATH_IMAGE008
定义为用户u对物品i的评分
Figure 847976DEST_PATH_IMAGE009
除以用户u
Figure 464902DEST_PATH_IMAGE010
中物品的评分之和,即满足
Figure 551807DEST_PATH_IMAGE011
(1)
其中,
Figure 963197DEST_PATH_IMAGE010
为用户u的喜爱物品集合,
Figure 135552DEST_PATH_IMAGE012
选择相似度度量,将权重矩阵
Figure 556169DEST_PATH_IMAGE013
与选择的相似度加权;计算物品i在喜爱物品i的用户集合
Figure 730536DEST_PATH_IMAGE014
中,每对用户uv的加权相似度
Figure 578407DEST_PATH_IMAGE015
对于每个用户u,以用户u为中心的总体加权相似度和为
Figure 238058DEST_PATH_IMAGE016
(2)
当用户满足
Figure 196787DEST_PATH_IMAGE017
(3)
时,被选作为物品i的核心用户,表示物品i的最大总体加权相似度和为
Figure 258284DEST_PATH_IMAGE018
,即以
Figure 277055DEST_PATH_IMAGE019
为中心的总体加权相似度。
3.根据权利要求2所述的大规模商品销售中核心用户和核心物品的挖掘方法,其特征在于,步骤二包括:
步骤201、更新用户对物品的喜爱权重矩阵
Figure 158424DEST_PATH_IMAGE020
对于每个物品i,权重系数
Figure 655264DEST_PATH_IMAGE021
,即用户
Figure 571268DEST_PATH_IMAGE022
对于物品i的重要性,是由该用户与物品i的核心用户
Figure 760940DEST_PATH_IMAGE023
的加权相似度决定的;即
Figure 129605DEST_PATH_IMAGE024
(4)
Figure 430136DEST_PATH_IMAGE025
可简化表示为
Figure 200646DEST_PATH_IMAGE026
,且
Figure 59755DEST_PATH_IMAGE027
步骤202、更新核心物品
对于每个用户u和每对物品
Figure 915716DEST_PATH_IMAGE028
Figure 19938DEST_PATH_IMAGE029
表示用户u的喜爱物品集合;选择相似度度量,将权重系数
Figure 910534DEST_PATH_IMAGE030
与选择的相似度加权;计算两个物品间的加权相似度
Figure 442009DEST_PATH_IMAGE031
;以物品i为中心,计算总体加权相似度
Figure 519687DEST_PATH_IMAGE032
,即由物品i对用户u的贡献为
Figure 162021DEST_PATH_IMAGE033
(5)
Figure 907123DEST_PATH_IMAGE034
越大,物品i对于用户u越重要且越有代表性;
用户u的核心物品
Figure 609500DEST_PATH_IMAGE035
满足
Figure 440052DEST_PATH_IMAGE036
(6)
表示用户u的最大总体相似度和为
Figure 886077DEST_PATH_IMAGE037
(7)
即以
Figure 751265DEST_PATH_IMAGE038
为中心的总体加权相似度;
步骤203、更新物品对用户的重要性权重矩阵
Figure 624543DEST_PATH_IMAGE039
对于每个用户u,通过归一化的加权相似度来量化每个物品i的重要性;
Figure 676813DEST_PATH_IMAGE040
(8)
Figure 926528DEST_PATH_IMAGE041
,且一个物品i
Figure 879179DEST_PATH_IMAGE042
越近,它对用户u越重要,且有等式
Figure 923358DEST_PATH_IMAGE043
成立;
步骤204、更新核心用户
基于已经更新的权重系数
Figure 462924DEST_PATH_IMAGE044
,重新评估对于每个物品i的集合
Figure 250751DEST_PATH_IMAGE045
内每对用户uv的加权相似度
Figure 824952DEST_PATH_IMAGE046
以用户u为中心,总体加权相似度和
Figure 774454DEST_PATH_IMAGE047
,即他作为核心对物品i的总贡献为
Figure 66895DEST_PATH_IMAGE048
(9)
Figure 392834DEST_PATH_IMAGE049
最大时的用户为物品i的核心用户,即
Figure 87120DEST_PATH_IMAGE050
(10)
表示物品i的第l轮最大总体加权相似度和
Figure 473102DEST_PATH_IMAGE051
,即以
Figure 987260DEST_PATH_IMAGE052
为中心的总体加权相似度;
步骤205、设置收敛条件,并重复步骤201至205,当满足收敛条件时,停止迭代,输出最优的核心用户、核心物品、权重矩阵
Figure 851311DEST_PATH_IMAGE005
Figure 400104DEST_PATH_IMAGE053
4.根据权利要求3所述的大规模商品销售中核心用户和核心物品的挖掘方法,其特征在于,步骤205中,所述收敛条件为
Figure 455522DEST_PATH_IMAGE054
,其中,
Figure 456976DEST_PATH_IMAGE055
表示第l+1轮的
Figure 390297DEST_PATH_IMAGE056
矩阵,
Figure 793597DEST_PATH_IMAGE057
表示无穷范数或最大范数,
Figure 521381DEST_PATH_IMAGE058
为可接受的迭代误差。
5.根据权利要求2或3所述的大规模商品销售中核心用户和核心物品的挖掘方法,其特征在于,所述相似度度量包括欧氏距离取反、余弦相似度和皮尔逊相关系数。
CN202110755421.5A 2021-07-05 2021-07-05 一种大规模商品销售中核心用户和核心物品的挖掘方法 Active CN113204713B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110755421.5A CN113204713B (zh) 2021-07-05 2021-07-05 一种大规模商品销售中核心用户和核心物品的挖掘方法
PCT/CN2021/143476 WO2023279685A1 (zh) 2021-07-05 2021-12-31 一种大规模商品销售中核心用户和核心物品的挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110755421.5A CN113204713B (zh) 2021-07-05 2021-07-05 一种大规模商品销售中核心用户和核心物品的挖掘方法

Publications (2)

Publication Number Publication Date
CN113204713A true CN113204713A (zh) 2021-08-03
CN113204713B CN113204713B (zh) 2021-10-08

Family

ID=77022573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110755421.5A Active CN113204713B (zh) 2021-07-05 2021-07-05 一种大规模商品销售中核心用户和核心物品的挖掘方法

Country Status (2)

Country Link
CN (1) CN113204713B (zh)
WO (1) WO2023279685A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023279685A1 (zh) * 2021-07-05 2023-01-12 南京信息工程大学 一种大规模商品销售中核心用户和核心物品的挖掘方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281956A (zh) * 2014-10-27 2015-01-14 南京信息工程大学 基于时间信息的适应用户兴趣变化的动态推荐方法
CN108520450A (zh) * 2018-03-21 2018-09-11 电子科技大学 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统
CN109886779A (zh) * 2019-01-30 2019-06-14 上海大学 一种智能商品推荐系统
CN112115359A (zh) * 2020-09-16 2020-12-22 苏州大学 一种基于多阶近邻预测的推荐系统及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10191949B2 (en) * 2015-06-18 2019-01-29 Nbcuniversal Media, Llc Recommendation system using a transformed similarity matrix
CN108776919B (zh) * 2018-05-31 2021-07-20 西安电子科技大学 基于聚类及进化算法构建信息核的物品推荐方法
CN113204713B (zh) * 2021-07-05 2021-10-08 南京信息工程大学 一种大规模商品销售中核心用户和核心物品的挖掘方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281956A (zh) * 2014-10-27 2015-01-14 南京信息工程大学 基于时间信息的适应用户兴趣变化的动态推荐方法
CN108520450A (zh) * 2018-03-21 2018-09-11 电子科技大学 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统
CN109886779A (zh) * 2019-01-30 2019-06-14 上海大学 一种智能商品推荐系统
CN112115359A (zh) * 2020-09-16 2020-12-22 苏州大学 一种基于多阶近邻预测的推荐系统及方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
HOSSEIN A. RAHMANI等: "Category-Aware Location Embedding for Point-of-Interest Recommendation", 《THE 2019 ACM SIGIR INTERNATIONAL CONFERENCE ON THE THEORY OF INFORMATION RETRIEVAL》 *
JIAOLI ZHOU等: "Model and Implementation of E-commerce Recommendation System Based on User Clustering", 《2020 INTERNATIONAL CONFERENCE ON ADVANCE IN AMBIENT COMPUTING AND INTELLIGENCE》 *
SHANYUN LIU等: "Matching Users’ Preference under Target Revenue Constraints in Data Recommendation Systems", 《ENTROPY 2019》 *
夏景明: "一种基于用户和商品属性挖掘的协同过滤算法", 《现代电子技术》 *
胡川等: "一种改进的偏好融合组推荐方法", 《软件学报》 *
鲁辉等: "基于产品属性及用户偏好的个性化产品推荐方法", 《贵州师范大学学报( 自然科学版)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023279685A1 (zh) * 2021-07-05 2023-01-12 南京信息工程大学 一种大规模商品销售中核心用户和核心物品的挖掘方法

Also Published As

Publication number Publication date
CN113204713B (zh) 2021-10-08
WO2023279685A1 (zh) 2023-01-12

Similar Documents

Publication Publication Date Title
CN107563841B (zh) 一种基于用户评分分解的推荐系统
Ordonez Clustering binary data streams with K-means
US10496678B1 (en) Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis
CN103544216B (zh) 一种结合图像内容和关键字的信息推荐方法及系统
US8146120B2 (en) Multi-criteria rating and searching system
CN112364976A (zh) 基于会话推荐系统的用户偏好预测方法
CN109299436B (zh) 一种满足本地差分隐私的偏好排序数据收集方法
CN106327240A (zh) 一种基于gru神经网络的推荐方法和系统
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
JP6261547B2 (ja) 判定装置、判定方法及び判定プログラム
US20210026873A1 (en) Relevance estimation and actions based thereon
CN108399268B (zh) 一种基于博弈论的增量式异构图聚类方法
CN106789338B (zh) 一种在动态大规模社交网络中发现关键人物的方法
CN112950324A (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN110348906B (zh) 一种基于多类型隐式反馈的改进商品推荐方法
CN116541607B (zh) 基于商品检索数据分析的智能推荐方法
CN112800207B (zh) 一种商品信息推荐方法、装置及存储介质
CN112380453A (zh) 物品推荐方法、装置、存储介质及设备
CN113204713B (zh) 一种大规模商品销售中核心用户和核心物品的挖掘方法
CN108399211B (zh) 基于二值特征的大规模图像检索算法
CN109584016A (zh) 一种商品推荐方法
CN113487117B (zh) 一种基于多维度用户画像的电商用户行为数据模拟的方法及系统
CN115186197A (zh) 一种基于端到端双曲空间的用户推荐方法
CN116910375B (zh) 一种基于用户偏好多样性的跨域推荐方法及系统
CN113342994A (zh) 一种基于无采样协作知识图网络的推荐系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant