CN110825967A - 一种提高推荐系统多样性的推荐列表重排名方法 - Google Patents

一种提高推荐系统多样性的推荐列表重排名方法 Download PDF

Info

Publication number
CN110825967A
CN110825967A CN201911056270.3A CN201911056270A CN110825967A CN 110825967 A CN110825967 A CN 110825967A CN 201911056270 A CN201911056270 A CN 201911056270A CN 110825967 A CN110825967 A CN 110825967A
Authority
CN
China
Prior art keywords
ranking
user
entropy
item
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911056270.3A
Other languages
English (en)
Other versions
CN110825967B (zh
Inventor
戴斯铭
潘嵘
毛明志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Sun Yat Sen University
Original Assignee
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Sun Yat Sen University filed Critical National Sun Yat Sen University
Priority to CN201911056270.3A priority Critical patent/CN110825967B/zh
Publication of CN110825967A publication Critical patent/CN110825967A/zh
Application granted granted Critical
Publication of CN110825967B publication Critical patent/CN110825967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明涉及一种提高推荐系统多样性的推荐列表重排名方法,首先采用原有的推荐方法获得推荐列表,然后计算用户的熵值,利用该熵值获得推荐列表的排名阀值,排名阀值结合本方法的重排名核心公式,获得新的推荐列表。本发明与现有的参数化排名方法相比,能够考虑到用户对于推荐列表多样性的不同需求,因此其推荐的物品更加贴合人们的真实感受,也考虑了不同用户对于同一物品的评分偏差。并且在准确性与多样性的平衡上,适当地提高多样性,但对于准确性的影响很小。

Description

一种提高推荐系统多样性的推荐列表重排名方法
技术领域
本发明涉及推荐系统领域,更具体地,涉及一种提高推荐系统多样性的推荐列表重排名方法。
背景技术
在信息过剩的互联网时代,信息推荐技术对于互联网公司运营的重要性是不言而喻的,目前各种各样的网站都会在后台使用推荐系统。推荐根据用户的访问特点,计算出最适合推荐给该用户的候选产品,然后把这些产品展现给用户,供其选择。由于产品数量和用户数量非常庞大,推荐系统大量使用到基于云计算的数据挖掘,通过挖掘用户行为和商品信息,使用各种推荐算法来计算推荐列表,实现向不同用户展示不同内容的效果,提高页面的转化率。
现有的推荐系统集中在提高推荐的准确率上,而忽视了推荐列表多样性的重要性。而随着用户对个性化要求的不断提高,如今也出现了同时追求推荐多样性与准确性的方法。如对推荐列表进行重排序的方法,使用评分阈值对准确性和多样性进行平衡,以提高总体多样性,称为参数化排名方法;但参数化排名方法所使用的评分阈值对于所有的用户而言都是相同的,但却没有考虑到用户对于各自推荐列表的多样性的不同需求。比如,有的用户偏爱自己喜欢的东西,而不愿意去尝试新事物,如果我们贸然推荐新的物品给他,反而会引起用户的反感;相反,有些用户兴趣爱好广泛,喜欢尝试新事物,那么推荐新物品给这些用户则是再合适不过了。
发明内容
本发明为克服上述现有技术中参数化排名方法没有考虑到用户对于推荐列表多样性的不同需求这一缺陷,提供一种提高推荐系统多样性的推荐列表重排名方法,通过评分阀值来进行推荐列表排序,能够针对不同用户的不同需求。
为解决上述技术问题,本发明采用的技术方案是:提供一种提高推荐系统多样性的推荐列表重排名方法,包括以下步骤:
步骤一:输入用户-物品评分矩阵R,物品类型矩阵T,推荐列表长度N,通过推荐;采用推荐系统获得推荐列表,可以选用某一种现有的推荐方法获得推荐列表,并预测未知评分R*,未知评分指的就是矩阵R中的空白评分,需要用推荐系统使用算法进行预测;
步骤二:利用标准排名方法获得每个用户的推荐列表的标准排名,该方法对应排序公式为:
rankstandard(i)=R*(u,i)-1
其中,R*(u,i)指根据预测评分由低到高的排名,那么添加上-1的幂则表示按照预测评分由高到低进行排名;
步骤三:计算用户的熵值λ(u),包括物品流行度的熵值和物品类型的熵值,并通过将物品流行度的熵值和物品类型的熵值相加获得用户的熵值;
步骤四:根据用户的熵值计算用户的推荐列表的排名阀值Trank,使用该排名阀值对推荐列表进行重新排序,具体的核心公式如下:
Trank=M*N*λ(u)
Figure BDA0002256625320000021
其中,rankx(i)是非标准排名方法,rating则指某一个具体评分,TH是指加入推荐列表物品对应的最低评分或是该用户所有已评分物品的平均评分,N是指top-N推荐列表的长度,M是本方法中需要进行调节的超参数(超参数的选取需要进行搜索最优结果对应的值。
优选的,在所述步骤三中,物品流行度的熵值的计算公式为:
Figure BDA0002256625320000022
其中,k表示用户的度数,H(k)表示度数为k的用户对应的物品流行度的熵值,而pi表示特定度数的物品对应的概率;度数指在同一数据集中该物品被购买的总次数,n(k)则指不同的用户度数总的数量。
优选的,在所述步骤三中,物品类型的熵值的计算公式为:
Figure BDA0002256625320000031
其中,H2(u)指用户物品类型的熵值,u指单个的用户,n(type)指物品的类型总数,而pi指用户u已评分的物品中该物品属于类型i的概率。
优选的,物品流行度的熵值和物品类型的熵值的结果再相加前需要进行标准化,其标准化公式和用户的熵值的公式分别为:
λ1(k)=H1(k)/log2(n(k))
λ2(k)=H2(u)/log2(n(type))
λ(u)=λ1(u∈P(k))+λ2(u)
其中,λ1(k)为标准化后的物品流行度的熵值,λ2(k)为标准化后的物品类型的熵值,P(k)指度数为k(单个用户购买商品总数)的用户人群。
优选的,所述非标准排名方法包括逆序评分排名、流行度逆向排名、随机排名、平均评分升序排名和比例排名。
与现有技术相比,有益效果是:
本发明与现有的参数化排名方法相比,能够考虑到用户对于推荐列表多样性的不同需求,因此其推荐的物品更加贴合人们的真实感受,也考虑了不同用户对于同一物品的评分偏差。并且在准确性与多样性的平衡上,适当地提高多样性,但对于准确性的影响很小。
附图说明
图1是本发明的一种提高推荐系统多样性的推荐列表重排名方法的流程图;
图2为本发明的种提高推荐系统多样性的推荐列表重排名方法一个应用例。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本专利的限制。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”“长”“短”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
下面通过具体实施例,并结合附图,对本发明的技术方案作进一步的具体描述:
实施例
如图1所示为一种提高推荐系统多样性的推荐列表重排名方法的是实施例,包括以下步骤:
步骤一:输入用户-物品评分矩阵R,物品类型矩阵T,推荐列表长度N,通过推荐;采用推荐系统获得推荐列表,可以选用某一种现有的推荐方法获得推荐列表,并预测未知评分R*
步骤二:利用标准排名方法获得每个用户的推荐列表的标准排名,该方法对应排序公式为:
rankstandard(i)=R*(u,i)-1
其中,R*(u,i)指根据预测评分由低到高的排名,那么添加上-1的幂则表示按照预测评分由高到低进行排名;
步骤三:计算用户的熵值λ(u),包括物品流行度的熵值和物品类型的熵值,并通过将物品流行度的熵值和物品类型的熵值相加获得用户的熵值;
具体的,物品流行度的熵值的计算公式为:
Figure BDA0002256625320000041
其中,k表示用户的度数,H(k)表示度数为k的用户对应的物品流行度的熵值,而pi表示特定度数的物品对应的概率;度数指在同一数据集中该物品被购买的总次数,n(k)则指不同的用户度数总的数量。
具体的,物品类型的熵值的计算公式为:
Figure BDA0002256625320000051
其中,H2(u)指用户物品类型的熵值,u指单个的用户,n(type)指物品的类型总数,而pi指用户u已评分的物品中该物品属于类型i的概率。
具体的,物品流行度的熵值和物品类型的熵值的结果再相加前需要进行标准化,其标准化公式和用户的熵值的公式分别为:
λ1(k)=H1(k)/log2(n(k))
λ2(k)=H2(u)/log2(n(type))
λ(u)=λ1(u∈P(k))+λ2(u)
其中,λ1(k)为标准化后的物品流行度的熵值,λ2(k)为标准化后的物品类型的熵值,P(k)指度数为k(单个用户购买商品总数)的用户人群。
步骤四:根据用户的熵值计算用户的推荐列表的排名阀值Trank,使用该排名阀值对推荐列表进行重新排序,具体的核心公式如下:
Trank=M*N*λ(u)
Figure BDA0002256625320000052
其中,rankx(i)是非标准排名方法,rating则指某一个具体评分,TH是指加入推荐列表物品对应的最低评分或是该用户所有已评分物品的平均评分,N是指top-N推荐列表的长度,M是本方法中需要进行调节的超参数,M=2。
另外的,所述非标准排名方法包括逆序评分排名、流行度逆向排名、随机排名、平均评分升序排名和比例排名。
本发明的工作原理:如图2所示的应用例子,首先使用某一个推荐算法,如协同过滤方法中的一种来进行评分预测,从而得子图(a)的标准排名推荐列表;接下来,需要计算出该用户的用户信息熵,从而计算得到排名阈值Trank,确定推荐列表可重排名范围,如子图(b);最后,选定某种合适的非标准排名方法,如物品流行度逆向排名方法,重新确定Top-5推荐列表,如子图(c)。
本实施例的有益效果:本发明与现有的参数化排名方法相比,能够考虑到用户对于推荐列表多样性的不同需求,因此其推荐的物品更加贴合人们的真实感受,也考虑了不同用户对于同一物品的评分偏差。并且在准确性与多样性的平衡上,适当地提高多样性,但对于准确性的影响很小。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (6)

1.一种提高推荐系统多样性的推荐列表重排名方法,其特征在于,包括如下步骤:
步骤一:输入用户-物品评分矩阵R,物品类型矩阵T,推荐列表长度N,通过推荐;采用推荐系统获得推荐列表,并预测未知评分R*
步骤二:利用标准排名方法以及预测得到的评分来获得每个用户的推荐列表的标准排名,该方法对应排序公式为:
rankstandard(i)=R*(u,i)-1
其中,R*(u,i)指根据预测评分由低到高的排名,那么添加上-1的幂则表示按照预测评分由高到低进行排名;
步骤三:计算用户的熵值λ(u),包括物品流行度的熵值和物品类型的熵值,并通过将物品流行度的熵值和物品类型的熵值相加获得用户的熵值;
步骤四:根据用户的熵值计算用户的推荐列表的排名阀值Trank,使用该排名阀值对推荐列表进行重新排序,具体公式如下:
Trank=M*N*λ(u)
Figure FDA0002256625310000011
其中,rankx(i)是非标准排名方法,rating则指某一个具体评分,TH是指加入推荐列表物品对应的最低评分或是该用户所有已评分物品的平均评分,N是指top-N推荐列表的长度,M是本方法中需要进行调节的超参数。
2.根据权利要求2所述的一种提高推荐系统多样性的推荐列表重排名方法,
其特征在于,在所述步骤三中,物品流行度的熵值的计算公式为:
Figure FDA0002256625310000012
其中,k表示用户的度数,H(k)表示度数为k的用户对应的物品流行度的熵值,而pi表示特定度数的物品对应的概率;度数指在同一数据集中该物品被购买的总次数,n(k)则指不同的用户度数总的数量。
3.根据权利要求2所述的一种提高推荐系统多样性的推荐列表重排名方法,其特征在于,在所述步骤三中,物品类型的熵值的计算公式为:
其中,H2(u)指用户物品类型的熵值,u指单个的用户,n(type)指物品的类型总数,而pi指用户u已评分的物品中该物品属于类型i的概率。
4.根据权利要求3所述的一种提高推荐系统多样性的推荐列表重排名方法,其特征在于,物品流行度的熵值和物品类型的熵值的结果再相加前需要进行标准化,其标准化公式和用户的熵值的公式分别为:
λ1(k)=H1(k)/log2(n(k))
λ2(k)=H2(u)/log2(n(type))
λ(u)=λ1(u∈P(k))+λ2(u)
其中,λ1(k)为标准化后的物品流行度的熵值,λ2(k)为标准化后的物品类型的熵值,P(k)指度数为k的用户人群。
5.根据权利要求1所述的一种提高推荐系统多样性的推荐列表重排名方法,其特征在于,所述非标准排名方法包括逆序评分排名和流行度逆向排名。
6.根据权利要求5所述的一种提高推荐系统多样性的推荐列表重排名方法,其特征在于,随机排名、平均评分升序排名和比例排名。
CN201911056270.3A 2019-10-31 2019-10-31 一种提高推荐系统多样性的推荐列表重排名方法 Active CN110825967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911056270.3A CN110825967B (zh) 2019-10-31 2019-10-31 一种提高推荐系统多样性的推荐列表重排名方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911056270.3A CN110825967B (zh) 2019-10-31 2019-10-31 一种提高推荐系统多样性的推荐列表重排名方法

Publications (2)

Publication Number Publication Date
CN110825967A true CN110825967A (zh) 2020-02-21
CN110825967B CN110825967B (zh) 2023-04-07

Family

ID=69552065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911056270.3A Active CN110825967B (zh) 2019-10-31 2019-10-31 一种提高推荐系统多样性的推荐列表重排名方法

Country Status (1)

Country Link
CN (1) CN110825967B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113497831A (zh) * 2021-06-30 2021-10-12 西安交通大学 一种移动边缘网络下基于反馈流行度的内容放置方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202151A (zh) * 2016-06-23 2016-12-07 长沙学院 一种用于提高个性化推荐系统多样性的方法
CN106951459A (zh) * 2017-02-24 2017-07-14 西北大学 基于熵值法的改进协同过滤推荐算法
CN106980646A (zh) * 2017-02-27 2017-07-25 上海大学 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法
CN109919723A (zh) * 2019-03-01 2019-06-21 西安电子科技大学 一种基于用户和物品的个性化推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202151A (zh) * 2016-06-23 2016-12-07 长沙学院 一种用于提高个性化推荐系统多样性的方法
CN106951459A (zh) * 2017-02-24 2017-07-14 西北大学 基于熵值法的改进协同过滤推荐算法
CN106980646A (zh) * 2017-02-27 2017-07-25 上海大学 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法
CN109919723A (zh) * 2019-03-01 2019-06-21 西安电子科技大学 一种基于用户和物品的个性化推荐方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113497831A (zh) * 2021-06-30 2021-10-12 西安交通大学 一种移动边缘网络下基于反馈流行度的内容放置方法及系统

Also Published As

Publication number Publication date
CN110825967B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN103870973B (zh) 基于电子信息的关键词提取的信息推送、搜索方法及装置
Salehi et al. Hybrid attribute-based recommender system for learning material using genetic algorithm and a multidimensional information model
Gao et al. Personalized service system based on hybrid filtering for digital library
Guo et al. Personalized ranking with pairwise factorization machines
CN112991017A (zh) 基于用户评论解析的标签体系精准推荐方法
CN107330727A (zh) 一种基于隐语义模型的个性化推荐方法
CN106610970A (zh) 基于协同过滤的内容推荐系统与方法
US20190340176A1 (en) System and method for data mining and similarity estimation
CN111639258B (zh) 一种基于神经网络的新闻推荐方法
CN112100512A (zh) 一种基于用户聚类和项目关联分析的协同过滤推荐方法
Chung et al. Categorization for grouping associative items using data mining in item-based collaborative filtering
O'Banion et al. Social media-driven news personalization
CN111026868B (zh) 一种多维度舆情危机预测方法、终端设备及存储介质
CN108984551A (zh) 一种基于多类别联合软聚类的推荐方法及系统
Manimurugan et al. A user-based video recommendation approach using CAC filtering, PCA with LDOS-CoMoDa
CN110825967B (zh) 一种提高推荐系统多样性的推荐列表重排名方法
US9400789B2 (en) Associating resources with entities
CN108182264A (zh) 一种基于跨领域排名推荐模型的排名推荐方法
US20130332440A1 (en) Refinements in Document Analysis
CN110795640A (zh) 一种弥补群组成员差异的自适应组推荐方法
Peng et al. Improved collaborative filtering algorithm in the research and application of personalized movie recommendations
Sang et al. Design and implementation of collaborative filtering approach for movie recommendation system
CN114912031A (zh) 基于聚类和协同过滤的混合推荐方法和系统
Jiang et al. Personalized collaborative filtering based on improved slope one alogarithm
CN114756758B (zh) 一种混合推荐方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant