CN113256387A - 项目物品的个性化推荐方法、电子设备和存储介质 - Google Patents

项目物品的个性化推荐方法、电子设备和存储介质 Download PDF

Info

Publication number
CN113256387A
CN113256387A CN202110659479.XA CN202110659479A CN113256387A CN 113256387 A CN113256387 A CN 113256387A CN 202110659479 A CN202110659479 A CN 202110659479A CN 113256387 A CN113256387 A CN 113256387A
Authority
CN
China
Prior art keywords
user
similarity
item
items
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110659479.XA
Other languages
English (en)
Other versions
CN113256387B (zh
Inventor
王睿修
熊超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Moredian Technology Co ltd
Original Assignee
Hangzhou Moredian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Moredian Technology Co ltd filed Critical Hangzhou Moredian Technology Co ltd
Priority to CN202110659479.XA priority Critical patent/CN113256387B/zh
Publication of CN113256387A publication Critical patent/CN113256387A/zh
Application granted granted Critical
Publication of CN113256387B publication Critical patent/CN113256387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及项目物品的个性化推荐方法、电子设备和存储介质,属于数据挖掘技术领域,上述方法包括:根据用户的评价数量计算评价数量差异指标;根据评价数量差异指标修正用户间的余弦相似度,得到修正后的用户相似度;根据修正后的用户相似度为当前用户筛选邻居;根据邻居偏好的项目物品以及该当前用户与邻居的相似度,向该当前用户推荐项目物品。根据本申请实施例,能够提高用户间相似度的准确性,从而达到提升个性化推荐结果准确性的有益效果。

Description

项目物品的个性化推荐方法、电子设备和存储介质
技术领域
本申请涉及数据挖掘技术领域,特别是涉及项目物品的个性化推荐方法、电子设备和存储介质。
背景技术
个性化服务是目前最受关注的领域之一。在科技飞速发展的今天,越来越丰富的产品使市场呈现供大于求的现象,消费者需要从众多的同类产品中挑选心仪的产品。而现在人们消费时多注重产品的内在质量和价格,多注重物质产品形式的多样化,质量的内在化、大众化。随着人们收入的增加,消费流行期和产品生命周期的缩短,时髦的消费方式被模仿速度的加快,消费观念逐步向品质的外在化、个性化、自然化方向发展。个性化推荐的目的就是根据目标用户的历史行为信息,挖掘用户的兴趣偏好,给用户推荐其感兴趣的物品,帮助用户节约时间成本。
而相关技术中,无论是协同过滤推荐方法,还是一些混合推荐方法,对效率低或者时间不充裕的人,不能准确的捕捉其偏好,导致个性化推荐结果准确度较低。
发明内容
本申请实施例提供了项目物品的个性化推荐方法、电子设备和存储介质,以至少解决相关技术中个性化推荐结果准确度较低的问题。
第一方面,本申请实施例提供了一种项目物品的个性化推荐方法,包括:根据用户的评价数量计算评价数量差异指标;根据所述评价数量差异指标修正用户间的余弦相似度,得到修正后的用户相似度;根据所述修正后的用户相似度为当前用户筛选邻居;根据邻居偏好的项目物品以及该当前用户与邻居的相似度,向该当前用户推荐项目物品。
在其中一些实施例中,所述的根据用户的评价数量计算评价数量差异指标包括:根据用户的各自评价数量和共同评价数量计算评价数量差异指标。
在其中一些实施例中,所述的根据所述修正后的用户相似度为当前用户筛选邻居包括:将当前用户与其他用户之间的修正后的用户相似度按照从高到低排序,选取前预设数量的用户作为该当前用户的邻居;或者,选取在预设值以上的用户相似度所对应的用户作为该当前用户的邻居。
在其中一些实施例中,所述的根据邻居偏好的项目物品以及该当前用户与邻居的相似度,向该当前用户推荐项目物品包括:选取邻居偏好的项目物品中评分在预设分数以上的且不在该当前用户已评价项目物品中的项目物品;对选取的项目物品去重,得到推荐列表,其中,所述推荐列表中的项目物品根据该当前用户与邻居的相似度排序。
在其中一些实施例中,在所述的得到推荐列表之后,所述方法还包括:对项目物品计算被评价数量差异指标;根据所述被评价数量差异指标修正项目物品间的余弦相似度,得到修正后的项目物品相似度;根据所述修正后的项目物品相似度为所述推荐列表中的项目物品筛选相似的项目物品;将筛选的项目物品添加至所述推荐列表中。
在其中一些实施例中,在所述的向该当前用户推荐项目物品之后,所述方法还包括:根据当前用户与邻居的相似度对推荐的项目物品的评分进行加权平均,得到该当前用户对所述推荐的项目物品的预测评分。
在其中一些实施例中,所述的根据用户的评价数量计算评价数量差异指标包括: 根据以下公式计算差异值
Figure 784338DEST_PATH_IMAGE001
Figure 237316DEST_PATH_IMAGE002
其中,
Figure 3015DEST_PATH_IMAGE003
Figure 781615DEST_PATH_IMAGE004
分别为用户
Figure 55602DEST_PATH_IMAGE005
和用户
Figure 821258DEST_PATH_IMAGE006
的各自评价数量,
Figure 926618DEST_PATH_IMAGE007
为用户
Figure 876119DEST_PATH_IMAGE005
和用 户
Figure 371822DEST_PATH_IMAGE006
的共同评价数量,
Figure 697762DEST_PATH_IMAGE008
为项目物品的总数量;
对所述差异值
Figure 657627DEST_PATH_IMAGE001
做反归一化,将所述差异值
Figure 27298DEST_PATH_IMAGE001
映射到
Figure 275876DEST_PATH_IMAGE009
上,并按如下公式 计算评价数量差异指标
Figure 139927DEST_PATH_IMAGE010
Figure 157562DEST_PATH_IMAGE011
在其中一些实施例中,所述的根据所述评价数量差异指标修正用户间的余弦相似度,得到修正后的用户相似度包括:
根据如下公式计算修正后的用户相似度
Figure 963713DEST_PATH_IMAGE012
Figure 699587DEST_PATH_IMAGE013
其中,
Figure 898488DEST_PATH_IMAGE005
表示用户A,
Figure 36208DEST_PATH_IMAGE006
表示用户B,
Figure 763992DEST_PATH_IMAGE014
表示用户A和用户B共同评价的项目物品 的集合,
Figure 705272DEST_PATH_IMAGE015
Figure 176705DEST_PATH_IMAGE016
分别表示用户A和用户B各自评价的项目物品的集合,
Figure 965670DEST_PATH_IMAGE017
表示用户A评价 的第i个项目物品的评分,
Figure 598776DEST_PATH_IMAGE018
表示用户B评价的第j个项目物品的评分,
Figure 309243DEST_PATH_IMAGE019
表示用户A已 评价的项目物品的平均分值,
Figure 568055DEST_PATH_IMAGE020
表示用户B已评价的项目物品的平均分值,
Figure 414788DEST_PATH_IMAGE021
为用户A 的评价数量差异指标。
第二方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项所述的方法。
第三方面,本申请实施例提供一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项所述的方法。
根据以上内容,本申请实施例的项目物品的个性化推荐方法包括:根据用户的评价数量计算评价数量差异指标;根据评价数量差异指标修正用户间的余弦相似度,得到修正后的用户相似度;根据修正后的用户相似度为当前用户筛选邻居;根据邻居偏好的项目物品以及该当前用户与邻居的相似度,向该当前用户推荐项目物品。因此,根据本申请实施例,能够提高用户间相似度的准确性,从而达到提升个性化推荐结果的准确性的有益效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的项目物品的个性化推荐方法的流程图;
图2是根据本申请实施例的当前用户与其他用户之间的关系示意图;
图3是根据本申请实施例的考虑了评价数量差异指标的用户相似度结果示意图;
图4是根据本申请实施例的项目物品的个性化推荐方法实验结果示意图;
图5是根据本申请实施例的电子设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本申请的发明人发现,相关技术的推荐方法没有考虑到用户评价项目物品所花的时间问题,同时也没有考虑每个用户的评价效率问题。现实中,高效的用户或者时间充裕的人所浏览过和/或评价过的项目会比较多,则更容易被捕捉到其兴趣的偏好。相反,效率低或者时间不充裕的人所浏览过和/或评价过的项目会比较少,其兴趣偏好不容易捕捉。因此,用户的评价数量不一致,会造成用户间相似度的计算出现偏差,从而导致个性化推荐结果的准确性较低。
为了解决上述问题,本申请实施例提供一种项目物品的个性化推荐方法,图1是根据本申请实施例的项目物品的个性化推荐方法的流程图,如图1所示,该方法包括以下步骤:
S100:根据用户的评价数量计算评价数量差异指标;
S200:根据评价数量差异指标修正用户间的余弦相似度,得到修正后的用户相似度;
S300:根据修正后的用户相似度为当前用户筛选邻居;
S400:根据邻居偏好的项目物品以及该当前用户与邻居的相似度,向该当前用户推荐项目物品。
基于以上内容,本申请实施例有效的解决了因用户的评价数量不同,造成用户间相似度有偏差,从而导致推荐结果准确性较低的问题。
为了更清楚的说明本申请实施例,下文对以上步骤进行详细的描述。
步骤S100:根据用户的评价数量计算评价数量差异指标。
首先,采集用户对项目物品的评价数据,根据采集的评价数据计算用户间的余弦相似度(表示对项目物品偏好的相似度),并且,统计用户的各自评价数量和共同评价数量从而计算评价数量差异指标。
接着,作为一个示例,根据以下公式计算差异值
Figure 218796DEST_PATH_IMAGE001
Figure 150980DEST_PATH_IMAGE002
其中,
Figure 760953DEST_PATH_IMAGE003
Figure 977040DEST_PATH_IMAGE004
分别为用户
Figure 686370DEST_PATH_IMAGE005
和用户
Figure 371429DEST_PATH_IMAGE006
的各自评价数量,
Figure 722776DEST_PATH_IMAGE007
为用户
Figure 340839DEST_PATH_IMAGE005
和用 户
Figure 735917DEST_PATH_IMAGE006
的共同评价数量,
Figure 377114DEST_PATH_IMAGE008
为项目物品的总数量;
对差异值
Figure 125627DEST_PATH_IMAGE022
做反归一化,将差异值
Figure 56586DEST_PATH_IMAGE022
映射到
Figure 638877DEST_PATH_IMAGE023
上,并按如下公式计算评价 数量差异指标
Figure 829687DEST_PATH_IMAGE010
Figure 522837DEST_PATH_IMAGE024
步骤S200:根据评价数量差异指标修正用户间的余弦相似度,得到修正后的用户相似度。
例如,根据如下公式计算修正后的用户相似度
Figure 53175DEST_PATH_IMAGE025
Figure 55635DEST_PATH_IMAGE026
其中,
Figure 468162DEST_PATH_IMAGE005
表示用户A,
Figure 699423DEST_PATH_IMAGE006
表示用户B,
Figure 349847DEST_PATH_IMAGE014
表示用户A和用户B共同评价的项目物品 的集合,
Figure 913422DEST_PATH_IMAGE015
Figure 531354DEST_PATH_IMAGE027
分别表示用户A和用户B各自评价的项目物品的集合,
Figure 566306DEST_PATH_IMAGE017
表示用户A评价 的第i个项目物品的评分,
Figure 71236DEST_PATH_IMAGE028
表示用户B评价的第j个项目物品的评分,
Figure 166231DEST_PATH_IMAGE029
表示用户A已 评价的项目物品的平均分值,
Figure 740301DEST_PATH_IMAGE020
表示用户B已评价的项目物品的平均分值,
Figure 578944DEST_PATH_IMAGE021
为用户A 的评价数量差异指标。
S300:根据修正后的用户相似度为当前用户筛选邻居。
作为一个示例,将当前用户与其他用户之间的修正后的用户相似度按照从高到低排序,选取前预设数量的用户作为该当前用户的邻居。也可以是,选取在预设值以上的用户相似度所对应的用户作为该当前用户的邻居。
例如,图2是根据本申请实施例的当前用户与其他用户之间的关系示意图,如图2所示,假设1号用户为当前用户,其他用户与1号用户的相似度越高则距离1号用户越近。一种方式是,选取固定数量的k个邻居(即K-neighborhoods),按分数高低降序取k个用户作为1号用户的邻居。另一种方式是,选取基于相似度门槛的邻居(即Threshord-basedneighborhoods),选取相似度在分数K分以上的用户作为邻居。比如,请参见图2中的左图,若k=5,即选取前5个距离1号用户最近的用户作为邻居,则1号用户的邻居包括2号、3号、4号、5号和7号用户;再比如,请参见图2中的右图,选取相似度在k分值以上的用户作为邻居,所以1号用户的邻居包括2号、3号、4号和7号用户。
S400:根据邻居偏好的项目物品以及该当前用户与邻居的相似度,向该当前用户推荐项目物品。
作为一个示例,根据邻居的相似度以及他们对项目物品的偏好,预测当前用户偏好的项目物品。
例如,选取邻居偏好的项目物品中评分在预设分数以上的且不在该当前用户已评价项目物品中的项目物品;然后对选取的项目物品去重,得到推荐列表,其中,该推荐列表中的项目物品根据该当前用户与邻居的相似度排序。
可选的,本申请实施例还对项目物品计算被评价数量差异指标;根据被评价数量差异指标修正项目物品间的余弦相似度,得到修正后的项目物品相似度;根据修正后的项目物品相似度为推荐列表中的项目物品筛选相似的项目物品;将筛选的项目物品添加至推荐列表中。
作为一个示例,
Figure 698DEST_PATH_IMAGE030
Figure 1015DEST_PATH_IMAGE031
分别为项目物品
Figure 78692DEST_PATH_IMAGE032
和项目物品
Figure 704715DEST_PATH_IMAGE033
的被评价数量,
Figure 980975DEST_PATH_IMAGE034
为 项目物品
Figure 417773DEST_PATH_IMAGE032
和项目物品
Figure 717167DEST_PATH_IMAGE033
的共同被评价数量,
Figure 694350DEST_PATH_IMAGE035
为用户的总数量,根据以下公式计算差异 值
Figure 293959DEST_PATH_IMAGE036
Figure 168504DEST_PATH_IMAGE037
对差异值
Figure 689615DEST_PATH_IMAGE038
做反归一化,将其值映射到
Figure 673751DEST_PATH_IMAGE039
上,并按如下公式计算被评价数 量差异指标:
Figure 924604DEST_PATH_IMAGE040
其中,
Figure 686893DEST_PATH_IMAGE041
表示项目项目物品i的被评价数量差异指标。
然后,根据以下公式计算修正后的项目物品相似度
Figure 210147DEST_PATH_IMAGE042
Figure 732395DEST_PATH_IMAGE043
其中,
Figure 306596DEST_PATH_IMAGE044
表示项目物品A,
Figure 990518DEST_PATH_IMAGE045
表示项目物品B,
Figure 327007DEST_PATH_IMAGE047
表示项目物品A和项目物品B 共同被评价的数量,
Figure 755715DEST_PATH_IMAGE048
Figure 972435DEST_PATH_IMAGE049
分别表示项目物品A和项目物品B各自被评价的数量,
Figure 990070DEST_PATH_IMAGE050
为 项目物品A的被评价数量差异指标。
可选的,本申请实施例还根据当前用户与邻居的相似度对推荐的项目物品的评分进行平均计算或加权平均计算,得到该当前用户对推荐的项目物品的预测评分。
例如,设集合D为k个与当前用户最相似的邻居,并且都对项目物品做出了评分。
通过如下公式计算平均值:
Figure 530641DEST_PATH_IMAGE051
其中,k为集合的数量,
Figure 266516DEST_PATH_IMAGE052
是与当前用户相似的邻居对第i个项目物品的评分。
也可以通过如下公式计算加权平均的值:
Figure 730996DEST_PATH_IMAGE053
其中,k为集合的数量,
Figure 868716DEST_PATH_IMAGE054
是用户之间的相似度,也就是权重,
Figure 330921DEST_PATH_IMAGE052
是 与当前用户相似的邻居对第i个项目物品的评分。
因此,本申请实施例能够抹平不同用户间评价数量的差异,降低了用户间相似度的偏差,能够达到提高个性化推荐结果的准确度的目的。
进一步的,本申请实施例还计算准确率Precision和误差评价指标RMSE。
例如,通过如下公式计算准确率Precision:
Figure 537781DEST_PATH_IMAGE055
其中,
Figure 9213DEST_PATH_IMAGE056
是实际的推荐列表,
Figure 1440DEST_PATH_IMAGE057
是预测的推荐列表,
Figure 431284DEST_PATH_IMAGE058
表示用户集合。
通过如下公式计算误差评价指标RMSE:
Figure 141751DEST_PATH_IMAGE059
其中,
Figure 406423DEST_PATH_IMAGE060
是预测的评分,
Figure 987577DEST_PATH_IMAGE061
是实际的评分,m表示预测评分的总量。
因此,本申请实施例提供了评价数量差异指标这一新的参数,解决了因为评价数量不同引起的相似度偏差,从而导致个性化推荐结果准确性偏低的问题。通过本申请实施例实现的推荐方法,在性能上能够得到有效的提升。
为了使本申请实施例所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例的应用场景,对本申请实施例进行详细的说明。
例如,本实例采用的数据是MovieLens,由美国Minnesta大学计算机科学与工程学院的GroupLens项目组创办。此数据集描述了5星之内的电影不受限制的标记,用于给出用户推荐。数据集包含了671个用户对9066个电影的100004个评分。用户为随机选取,每个选取的用户至少评价20个电影。
(1)计算评价数量差异指标D
Figure 57164DEST_PATH_IMAGE003
Figure 989348DEST_PATH_IMAGE062
分别为用户
Figure 51851DEST_PATH_IMAGE005
和用户
Figure 753090DEST_PATH_IMAGE006
的各自评价数量,
Figure 993579DEST_PATH_IMAGE007
为用户
Figure 209796DEST_PATH_IMAGE005
和用户
Figure 561143DEST_PATH_IMAGE006
的共同评价数量,
Figure 631736DEST_PATH_IMAGE008
为电影的总数量即9066个,
Figure 43126DEST_PATH_IMAGE058
为用户集合即671个。
Figure 684323DEST_PATH_IMAGE063
由于相似度的值也在[0,1],所以这里再对差异值
Figure 557470DEST_PATH_IMAGE064
做反归一化,将其值映射到
Figure 30040DEST_PATH_IMAGE065
上,用户
Figure 612331DEST_PATH_IMAGE005
的评价数量差异指标
Figure 740824DEST_PATH_IMAGE066
的公式表达如下:
Figure 433973DEST_PATH_IMAGE067
可见,当两个用户的各自评价数量相等的时候,用户相似度就是余弦相似度;当用户的各自评价数量不一致,尤其是相差较大时,通过本申请实施例可以对相似度的偏差有更明显的修正,从而能够更明显的提高个性化推荐结果的准确度。
(2)计算加入评价数量差异指标后的用户相似度
Figure 26629DEST_PATH_IMAGE005
表示用户A,
Figure 888143DEST_PATH_IMAGE006
表示用户B,
Figure 503932DEST_PATH_IMAGE014
表示用户A和用户B共同评价的电影集合,
Figure 773DEST_PATH_IMAGE068
Figure 447935DEST_PATH_IMAGE016
分别表示用户A和用户B各自评价的电影的集合,
Figure 372028DEST_PATH_IMAGE017
表示用户A评价的第i个电影的 评分,
Figure 458802DEST_PATH_IMAGE018
表示用户B评价的第j个电影的评分,
Figure 493754DEST_PATH_IMAGE019
表示用户A已评价的电影的平均分值,
Figure 716794DEST_PATH_IMAGE069
表示用户B已评价的电影的平均分值,
Figure 811789DEST_PATH_IMAGE066
为用户A的评价数量差异指标,用户的相似 度
Figure 136591DEST_PATH_IMAGE070
表示为:
Figure 975234DEST_PATH_IMAGE071
(3)通过步骤(1)~(2),直到计算出所有用户之间的相似度。构建用户相似度矩阵,以减少储存空间。
(4)根据用户相似度选取10个相似邻居。
针对当前用户,用固定数量的K个邻居(K-neighborhoods),即按相似度的分数高低降序取前10个。
(5)根据邻居偏好的电影以及当前用户与邻居的相似度,预测当前用户偏好的电影,计算得到电影推荐列表。
(6)评分预测,设集合D中有10个与当前用户最相似的邻居,并且都对电影做出了评分,通过直接平均或者加权平均,可以得到当前用户对电影的预测评分。
图3是根据本申请实施例的考虑了评价数量差异指标的用户相似度结果示意图,如图3所示,①表示考虑了评价数量差异指标的用户相似度,②表示未考虑评价数量差异指标的用户相似度,可见,在不同时间段,用户对项目物品的评价数量不同会对计算的相似度有影响。
接着,为了对本申请实施例的有益效果进行客观的说明,将通过本申请的考虑了评价数量差异指标的推荐方法与传统推荐方法进行比较,图4是根据本申请实施例的项目物品的个性化推荐方法实验结果示意图,如图4所示,A表示通过传统的方式所计算的相似度的准确性,B表示通过本申请实施例的推荐方法所计算的相似度的准确性,可见,本申请的技术方案能够有效的提高用户相似度的准确性,从而有效的提高了推荐结果的准确性。
因此,本申请实施例提供了评价数量差异指标这一新的参数,解决了因为评价数量不同引起的相似度偏差,从而导致个性化推荐结果准确性偏低的问题。通过本申请实施例实现的推荐方法,在性能上能够得到有效的提高。
例如,请继续参阅图4所示,当A的纵坐标约为1.2时,B的纵坐标约为1.1,根据均方根误差计算(1.2/1.1)-1≈0.1,可见在该示例中,可以在性能(准确性)上可提升10%。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
另外,结合上述实施例中的项目物品的个性化推荐方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种项目物品的个性化推荐方法。
本申请的一个实施例中还提供了一种电子设备,该电子设备可以是终端。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种项目物品的个性化推荐方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,图5是根据本申请实施例的电子设备的结构框图,如图5所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图5所示。该电子设备包括通过内部总线连接的处理器、网络接口、内存储器和非易失性存储器,其中,该非易失性存储器存储有操作系统、计算机程序和数据库。处理器用于提供计算和控制能力,网络接口用于与外部的终端通过网络连接通信,内存储器用于为操作系统和计算机程序的运行提供环境,计算机程序被处理器执行时以实现一种项目物品的个性化推荐方法,数据库用于存储数据。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种项目物品的个性化推荐方法,其特征在于,包括:
根据用户的评价数量计算评价数量差异指标;
根据所述评价数量差异指标修正用户间的余弦相似度,得到修正后的用户相似度;
根据所述修正后的用户相似度为当前用户筛选邻居;
根据邻居偏好的项目物品以及该当前用户与邻居的相似度,向该当前用户推荐项目物品。
2.根据权利要求1所述的方法,其特征在于,所述的根据用户的评价数量计算评价数量差异指标包括:
根据用户的各自评价数量和共同评价数量计算评价数量差异指标。
3.根据权利要求1所述的方法,其特征在于,所述的根据所述修正后的用户相似度为当前用户筛选邻居包括:
将当前用户与其他用户之间的修正后的用户相似度按照从高到低排序,选取前预设数量的用户作为该当前用户的邻居;或者,
选取在预设值以上的用户相似度所对应的用户作为该当前用户的邻居。
4.根据权利要求1所述的方法,其特征在于,所述的根据邻居偏好的项目物品以及该当前用户与邻居的相似度,向该当前用户推荐项目物品包括:
选取邻居偏好的项目物品中评分在预设分数以上的且不在该当前用户已评价项目物品中的项目物品;
对选取的项目物品去重,得到推荐列表,其中,所述推荐列表中的项目物品根据该当前用户与邻居的相似度排序。
5.根据权利要求4所述的方法,其特征在于,在所述的得到推荐列表之后,所述方法还包括:
对项目物品计算被评价数量差异指标;
根据所述被评价数量差异指标修正项目物品间的余弦相似度,得到修正后的项目物品相似度;
根据所述修正后的项目物品相似度为所述推荐列表中的项目物品筛选相似的项目物品;
将筛选的项目物品添加至所述推荐列表中。
6.根据权利要求1所述的方法,其特征在于,在所述的向该当前用户推荐项目物品之后,所述方法还包括:
根据当前用户与邻居的相似度对推荐的项目物品的评分进行加权平均,得到该当前用户对所述推荐的项目物品的预测评分。
7.根据权利要求1所述的方法,其特征在于,所述的根据用户的评价数量计算评价数量差异指标包括:
根据以下公式计算差异值
Figure DEST_PATH_IMAGE001
Figure 187443DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
Figure 455613DEST_PATH_IMAGE004
分别为用户
Figure DEST_PATH_IMAGE005
和用户
Figure 244577DEST_PATH_IMAGE006
的各自评价数量,
Figure DEST_PATH_IMAGE007
为用户
Figure 205580DEST_PATH_IMAGE005
和用户
Figure 978364DEST_PATH_IMAGE006
的共同评价数量,
Figure 50225DEST_PATH_IMAGE008
为项目物品的总数量;
对所述差异值
Figure DEST_PATH_IMAGE009
做反归一化,将所述差异值
Figure 959275DEST_PATH_IMAGE009
映射到
Figure 324135DEST_PATH_IMAGE010
上,并按如下公式计算 评价数量差异指标
Figure DEST_PATH_IMAGE011
Figure 584215DEST_PATH_IMAGE012
8.根据权利要求1所述的方法,其特征在于,所述的根据所述评价数量差异指标修正用户间的余弦相似度,得到修正后的用户相似度包括:
根据如下公式计算修正后的用户相似度
Figure DEST_PATH_IMAGE013
Figure 990926DEST_PATH_IMAGE014
其中,
Figure 223324DEST_PATH_IMAGE005
表示用户A,
Figure 791709DEST_PATH_IMAGE006
表示用户B,
Figure DEST_PATH_IMAGE015
表示用户A和用户B共同评价的项目物品的集 合,
Figure 273506DEST_PATH_IMAGE016
Figure 687170DEST_PATH_IMAGE017
分别表示用户A和用户B各自评价的项目物品的集合,
Figure 774074DEST_PATH_IMAGE018
表示用户A评价的第 i个项目物品的评分,
Figure 513360DEST_PATH_IMAGE019
表示用户B评价的第j个项目物品的评分,
Figure 685715DEST_PATH_IMAGE020
表示用户A已评价 的项目物品的平均分值,
Figure 404535DEST_PATH_IMAGE021
表示用户B已评价的项目物品的平均分值,
Figure 408263DEST_PATH_IMAGE022
为用户A的评 价数量差异指标。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至8中任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至8中任一项所述的方法。
CN202110659479.XA 2021-06-15 2021-06-15 项目物品的个性化推荐方法、电子设备和存储介质 Active CN113256387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110659479.XA CN113256387B (zh) 2021-06-15 2021-06-15 项目物品的个性化推荐方法、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110659479.XA CN113256387B (zh) 2021-06-15 2021-06-15 项目物品的个性化推荐方法、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN113256387A true CN113256387A (zh) 2021-08-13
CN113256387B CN113256387B (zh) 2021-11-05

Family

ID=77187858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110659479.XA Active CN113256387B (zh) 2021-06-15 2021-06-15 项目物品的个性化推荐方法、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113256387B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106610970A (zh) * 2015-10-21 2017-05-03 上海文广互动电视有限公司 基于协同过滤的内容推荐系统与方法
CN108710648A (zh) * 2018-04-28 2018-10-26 东华大学 一种基于s型改进相似度的协同过滤推荐方法
CN108876536A (zh) * 2018-06-15 2018-11-23 天津大学 基于最近邻信息的协同过滤推荐方法
CN110347935A (zh) * 2019-07-18 2019-10-18 齐鲁工业大学 基于用户兴趣变化的个性化影视项目推荐方法及系统
CN110399549A (zh) * 2018-04-24 2019-11-01 河南理工大学 一种面向用户兴趣调和相似度的协同过滤方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106610970A (zh) * 2015-10-21 2017-05-03 上海文广互动电视有限公司 基于协同过滤的内容推荐系统与方法
CN110399549A (zh) * 2018-04-24 2019-11-01 河南理工大学 一种面向用户兴趣调和相似度的协同过滤方法
CN108710648A (zh) * 2018-04-28 2018-10-26 东华大学 一种基于s型改进相似度的协同过滤推荐方法
CN108876536A (zh) * 2018-06-15 2018-11-23 天津大学 基于最近邻信息的协同过滤推荐方法
CN110347935A (zh) * 2019-07-18 2019-10-18 齐鲁工业大学 基于用户兴趣变化的个性化影视项目推荐方法及系统

Also Published As

Publication number Publication date
CN113256387B (zh) 2021-11-05

Similar Documents

Publication Publication Date Title
CN106651542B (zh) 一种物品推荐的方法及装置
WO2020007164A1 (zh) 用户特征的生成方法、装置、设备及计算机可读存储介质
CN102073699B (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
CN108090208A (zh) 融合数据处理方法及装置
CN107690638B (zh) 提供推荐同时保持用户隐私的具有个性化馈源的阅读器应用程序和方法
CN109284417A (zh) 视频推送方法、装置、计算机设备和存储介质
Kant et al. LeaderRank based k-means clustering initialization method for collaborative filtering
CN109492180A (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN104685490A (zh) 结构化和非结构化数据自适应分组的系统和方法
US9088811B2 (en) Information providing system, information providing method, information providing device, program, and information storage medium
CN111461841A (zh) 物品推荐方法、装置、服务器及存储介质
CN112328909B (zh) 信息推荐方法、装置、计算机设备及介质
CN110489449A (zh) 一种图表推荐方法、装置和电子设备
KR20200088134A (ko) 상품 추천 방식 개선 방법 및 장치
CN110889076A (zh) 评论信息发布方法、装置、客户端、服务器和系统
CN110020152B (zh) 应用推荐方法及装置
CN112104505A (zh) 应用推荐方法、装置、服务器和计算机可读存储介质
CN106933905B (zh) 网页访问数据的监测方法和装置
CN113256387B (zh) 项目物品的个性化推荐方法、电子设备和存储介质
US20160267087A1 (en) Enhanced template curating
CN111919210A (zh) 用于并入到审查媒体语料库中的媒体源度量
US20150206220A1 (en) Recommendation Strategy Portfolios
CN112015718A (zh) HBase集群平衡方法、装置、电子设备和存储介质
CN110874432A (zh) 排序方法、信息推荐方法、系统及装置
US11237693B1 (en) Provisioning serendipitous content recommendations in a targeted content zone

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant