CN111259232A - 一种基于个性化召回的推荐系统优化方法 - Google Patents

一种基于个性化召回的推荐系统优化方法 Download PDF

Info

Publication number
CN111259232A
CN111259232A CN201911220707.2A CN201911220707A CN111259232A CN 111259232 A CN111259232 A CN 111259232A CN 201911220707 A CN201911220707 A CN 201911220707A CN 111259232 A CN111259232 A CN 111259232A
Authority
CN
China
Prior art keywords
recall
user
strategy
stage
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911220707.2A
Other languages
English (en)
Other versions
CN111259232B (zh
Inventor
陈旋
吕成云
蔡磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Aijia Household Products Co Ltd
Original Assignee
Jiangsu Aijia Household Products Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Aijia Household Products Co Ltd filed Critical Jiangsu Aijia Household Products Co Ltd
Priority to CN201911220707.2A priority Critical patent/CN111259232B/zh
Publication of CN111259232A publication Critical patent/CN111259232A/zh
Application granted granted Critical
Publication of CN111259232B publication Critical patent/CN111259232B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W90/00Enabling technologies or technologies with a potential or indirect contribution to greenhouse gas [GHG] emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于个性化召回的推荐系统优化方法,涉及推荐系统技术领域。采用的是针对推荐系统两阶段模式过程中召回阶段进行优化和改进,结合一种优化迭代的思想获取到不同用户在召回阶段多路召回策略下拥有不同的召回数量,以致于更加体现出不同用户的不同兴趣点。其中,为了更好的获取到用户在多路召回策略下拥有不同的召回数量以及用户感兴趣召回物品,通过对召回策略召回的物品与用户感兴趣的物品进行不断迭代计算用户偏好的召回策略权重,获取到针对不同用户的兴趣点分配不同的召回策略权重,从而达到不同用户在召回阶段多路召回策略下拥有不同的召回数量,实现召回阶段个性化。

Description

一种基于个性化召回的推荐系统优化方法
技术领域
本发明涉及推荐系统技术领域,具体涉及一种基于个性化召回的推荐系统优化方法。
背景技术
随着互联网技术的不断发展,数据时代的到来,数据信息越积越累,“信息过载”的现象就会导致人们在大量的信息中寻找自己可能感兴趣的信息变得非常艰难。然而,推荐系统的出现就是为了解决这种“信息过载”的问题,它会主动帮助用户在大量的信息中发现他们感兴趣的信息,也会主动的将信息推送给对它们感兴趣的用户。
不论是在工业界还是在科研界,推荐系统的发展已越来越成熟。目前,工业界中绝大多数的推荐系统都是分为两阶段模式:召回阶段和排序阶段。在召回阶段,大多数都是采用多路召回策略,每一路召回topK的数量对每个用户都是相同的。一般来说,不同的用户对每一路召回策略感兴趣程度是不一样的,因此这会导致每个用户召回得到的物品完全相同,不能突出其个性化,尤其是在时效性特别强的新闻推荐领域更突显。
如图1所示,以往两阶段推荐系统召回阶段中每个用户在每一路召回都是召回固定数量的物品,导致每个用户在召回阶段召回的物品完全相同,从而很难体现出不同用户的兴趣偏好,影响推荐系统的准确性及用户感知。
本发明提出了一种基于个性化召回的推荐系统优化方法,能够更加精确的获取用户兴趣偏好,从而提高整个推荐系统的个性化以及准确性。
发明内容
本发明所要解决的技术问题就是提供一种基于不断迭代的方式对推荐系统多路召回策略实现个性化的处理方法,通过一种优化迭代的思想,获取每个用户对不同召回策略的权重占比,然后按照每个用户的权重占比获取不同召回策略召回数,计算每个用户召回阶段的召回物品,接着进入排序阶段进行重排序预测。
本发明为解决上述技术问题采用以下技术方案
一种基于个性化召回的推荐系统优化方法,具体包括如下步骤:
步骤A:设定召回阶段召回物品的数量N,其中N>0,即推荐系统召回阶段候选集数量;
步骤B:设定召回阶段召回策略的数量n,其中n>0,即推荐系统召回阶段有多少路召回策略;
步骤C:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤D:设定召回阶段每个用户对每路召回的数量为K1,K2,...,Kn,初始化值为Ki=N/n,i=1,2...n;
步骤E:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
Figure BDA0002300764780000021
步骤F:根据召回阶段召回策略以及其召回数量Ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topKi,i=1,2,...,n物品;
步骤G:根据用户行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β12,...,βn,然后计算出每个用户对每路召回的数量K'i=N*βi,i=1,2,...,n;
步骤H:重复上述步骤E至步骤G,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
Figure BDA0002300764780000022
i=1,2,...,n;
步骤I:针对每个用户在每路召回策略下的召回数量获取其
Figure BDA0002300764780000023
i=1,2,...,n物品作为召回阶段的候选集结果,然后供排序阶段进行重排序,最终给出推荐结果。
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,所述步骤G,具体包含如下:
步骤G1:通过用户近一个月的行为数据获取每个用户点击的物品;
步骤G2:根据步骤G1获取的用户近一个月点击的物品,通过物品与物品相似度数据,匹配出用户近一个月点击的物品以及其相似度超过δ的相似物品,作为用户偏好的物品集;
步骤G3:根据步骤G2获取到的用户偏好物品与召回阶段每路召回策略召回的物品进行匹配,计算出每路召回策略中能够匹配到的物品数量为k1,k2,...,kn,占比情况
Figure BDA0002300764780000024
然后通过softmax函数进行归一化得到每个用户每路召回策略权重占比β12,...,βn
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,在步骤C中,相似度阈值δ的取值范围为[0,1],参考经验值为0.8。
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,在步骤E中,利用物品的词向量以及余弦相似度,计算物品与物品之间相似度。
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,在步骤F中,通过不同召回策略以及召回数量获取每个用户每个召回策略的召回物品。
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,在步骤H中,通过不断的重复迭代步骤E至步骤F,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
Figure BDA0002300764780000031
i=1,2,...,n。
有益效果
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明所涉及一种基于个性化召回的推荐系统优化方法,采用的是针对推荐系统两阶段模式过程中召回阶段进行优化和改进,结合一种优化迭代的思想获取到不同用户在召回阶段多路召回策略下拥有不同的召回数量,以致于更加体现出不同用户的不同兴趣点。
2、为了更好的获取到用户在多路召回策略下拥有不同的召回数量以及用户感兴趣召回物品,通过对召回策略召回的物品与用户感兴趣的物品进行不断迭代计算用户偏好的召回策略权重,获取到针对不同用户的兴趣点分配不同的召回策略权重,从而达到不同用户在召回阶段多路召回策略下拥有不同的召回数量,实现召回阶段个性化。
附图说明
图1是传统的推荐系统多路召回策略示意图;
图2是本发明改进后的推荐系统多路召回策略示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一种基于个性化召回的推荐系统优化方法。主要是针对传统的推荐系统两阶段模式中召回阶段进行优化和改进,从而实现召回阶段的个性化以及提高推荐系统的准确性。
如图2所示,具体步骤如下:
步骤A:设定召回阶段召回物品的数量N(N>0),即推荐系统召回阶段候选集数量;
步骤B:设定召回阶段召回策略的数量n(n>0),即推荐系统召回阶段有多少路召回策略;
步骤C:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤D:设定召回阶段每个用户对每路召回的数量为K1,K2,...,Kn,初始化值为Ki=N/n,i=1,2...n;
步骤E:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
Figure BDA0002300764780000041
步骤F:根据召回阶段召回策略以及其召回数量Ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topKi,i=1,2,...,n物品;
步骤G:根据用户近一个月行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β12,...,βn,然后计算出每个用户对每路召回的数量K'i=N*βi,i=1,2,...,n;
上述步骤G包括如下步骤G1至G3:
步骤G1:通过用户近一个月的行为数据(选取“近一个月”是为了获取用户最近的偏好作为指标)获取每个用户点击的物品;
步骤G2:根据步骤G1获取的用户近一个月点击的物品,通过物品与物品相似度数据,匹配出用户近一个月点击的物品以及其相似度超过δ的相似物品,作为用户偏好的物品集;
步骤G3:根据步骤G2获取到的用户偏好物品与召回阶段每路召回策略召回的物品进行匹配,计算出每路召回策略中能够匹配到的物品数量为k1,k2,...,kn,占比情况
Figure BDA0002300764780000042
然后通过softmax函数进行归一化得到每个用户每路召回策略权重占比β12,...,βn
步骤H:重复上述步骤E至步骤G,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
Figure BDA0002300764780000043
i=1,2,...,n;
步骤I:针对每个用户在每路召回策略下的召回数量获取其
Figure BDA0002300764780000051
i=1,2,...,n物品作为召回阶段的候选集结果,然后供排序阶段进行重排序,最终给出推荐结果。
上述技术方案所涉及的一种基于个性化召回的推荐系统及实现方法,采用的是针对推荐系统两阶段模式过程中召回阶段进行优化和改进,结合一种优化迭代的思想获取到不同用户在召回阶段多路召回策略下拥有不同的召回数量,以致于更加体现出不同用户的不同兴趣点。其中,为了更好的获取到用户在多路召回策略下拥有不同的召回数量以及用户感兴趣召回物品,通过对召回策略召回的物品与用户感兴趣的物品进行不断迭代计算用户偏好的召回策略权重,获取到针对不同用户的兴趣点分配不同的召回策略权重,从而达到不同用户在召回阶段多路召回策略下拥有不同的召回数量,实现召回阶段个性化。
本发明并不限于上述实施方式,在本发明领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。上面对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (6)

1.一种基于个性化召回的推荐系统优化方法,其特征在于,具体包括如下步骤:
步骤A:设定召回阶段召回物品的数量N,其中N>0,即推荐系统召回阶段候选集数量;
步骤B:设定召回阶段召回策略的数量n,其中n>0,即推荐系统召回阶段有多少路召回策略;
步骤C:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤D:设定召回阶段每个用户对每路召回的数量为K1,K2,...,Kn,初始化值为 Ki=N/n,i=1,2...n;
步骤E:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
Figure RE-FDA0002461208180000012
步骤F:根据召回阶段召回策略以及其召回数量Ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topKi,i=1,2,...,n物品;
步骤G:根据用户行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β12,...,βn,然后计算出每个用户对每路召回的数量K'i=N*βi,i=1,2,...,n;
步骤H:重复上述步骤E至步骤G,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
Figure RE-FDA0002461208180000013
步骤I:针对每个用户在每路召回策略下的召回数量获取其
Figure RE-FDA0002461208180000014
物品作为召回阶段的候选集结果,然后供排序阶段进行重排序,最终给出推荐结果。
2.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,所述步骤G,具体包含如下:
步骤G1:通过用户近一个月的行为数据获取每个用户点击的物品;
步骤G2:根据步骤G1获取的用户近一个月点击的物品,通过物品与物品相似度数据,匹配出用户近一个月点击的物品以及其相似度超过δ的相似物品,作为用户偏好的物品集;
步骤G3:根据步骤G2获取到的用户偏好物品与召回阶段每路召回策略召回的物品进行匹配,计算出每路召回策略中能够匹配到的物品数量为k1,k2,...,kn,占比情况
Figure RE-FDA0002461208180000015
然后通过softmax函数进行归一化得到每个用户每路召回策略权重占比β12,...,βn
3.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,在步骤C中,相似度阈值δ的取值范围为[0,1],参考经验值为0.8。
4.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,在步骤E中,利用物品的词向量以及余弦相似度,计算物品与物品之间相似度。
5.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,在步骤F中,通过不同召回策略以及召回数量获取每个用户每个召回策略的召回物品。
6.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,在步骤H中,通过不断的重复迭代步骤E至步骤F,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
Figure RE-FDA0002461208180000021
CN201911220707.2A 2019-12-03 2019-12-03 一种基于个性化召回的推荐系统优化方法 Active CN111259232B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911220707.2A CN111259232B (zh) 2019-12-03 2019-12-03 一种基于个性化召回的推荐系统优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911220707.2A CN111259232B (zh) 2019-12-03 2019-12-03 一种基于个性化召回的推荐系统优化方法

Publications (2)

Publication Number Publication Date
CN111259232A true CN111259232A (zh) 2020-06-09
CN111259232B CN111259232B (zh) 2022-08-12

Family

ID=70954166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911220707.2A Active CN111259232B (zh) 2019-12-03 2019-12-03 一种基于个性化召回的推荐系统优化方法

Country Status (1)

Country Link
CN (1) CN111259232B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360632A (zh) * 2021-06-09 2021-09-07 南京大学 一种用于众包软件测试的多路召回推荐方法
WO2022110789A1 (zh) * 2020-11-27 2022-06-02 北京搜狗科技发展有限公司 词条推荐方法、装置和用于推荐词条的装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829822A (zh) * 2018-06-12 2018-11-16 腾讯科技(深圳)有限公司 媒体内容的推荐方法和装置、存储介质、电子装置
CN109190043A (zh) * 2018-09-07 2019-01-11 北京三快在线科技有限公司 推荐方法及装置,存储介质,电子设备及推荐系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829822A (zh) * 2018-06-12 2018-11-16 腾讯科技(深圳)有限公司 媒体内容的推荐方法和装置、存储介质、电子装置
CN109190043A (zh) * 2018-09-07 2019-01-11 北京三快在线科技有限公司 推荐方法及装置,存储介质,电子设备及推荐系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022110789A1 (zh) * 2020-11-27 2022-06-02 北京搜狗科技发展有限公司 词条推荐方法、装置和用于推荐词条的装置
CN113360632A (zh) * 2021-06-09 2021-09-07 南京大学 一种用于众包软件测试的多路召回推荐方法
CN113360632B (zh) * 2021-06-09 2023-08-25 南京大学 一种用于众包软件测试的多路召回推荐方法

Also Published As

Publication number Publication date
CN111259232B (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
CN106651546B (zh) 一种面向智慧社区的电子商务信息推荐方法
CN104281956B (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN107944035B (zh) 一种融合视觉特征和用户评分的图像推荐方法
CN111259232B (zh) 一种基于个性化召回的推荐系统优化方法
CN110879864A (zh) 一种基于图神经网络和注意力机制的上下文推荐方法
CN103886001A (zh) 一种个性化商品推荐系统
CN109902235A (zh) 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法
CN103559622A (zh) 基于特征的协同过滤推荐方法
CN106791964B (zh) 广播电视节目推荐系统及方法
CN108334592A (zh) 一种基于内容与协同过滤相结合的个性化推荐方法
WO2007140084A1 (en) Aggregation of affinity lists
CN110598061A (zh) 一种多元图融合的异构信息网嵌入方法
CN105740480B (zh) 机票推荐方法及系统
CN106776859A (zh) 基于用户偏好的移动应用App推荐系统
CN106846029B (zh) 基于遗传算法和新型相似度计算策略的协同过滤推荐算法
CN109101563A (zh) 一种对象推荐方法、装置、介质以及设备
CN112102029A (zh) 一种基于知识图谱的长尾推荐计算方法
CN109508407A (zh) 融合时间与兴趣相似度的电视产品推荐方法
CN106919808B (zh) 基于变步长最小均方误差自适应滤波器的基因识别系统
CN106649733B (zh) 一种基于无线接入点情境分类与感知的在线视频推荐方法
CN108694234A (zh) 一种基于改进协同过滤算法的服务推荐模型
CN109615466A (zh) 面向移动订餐系统的内容推荐和协同过滤推荐的混合方法
CN116805023B (zh) 一种基于大语言模型的外卖推荐方法
CN113449200B (zh) 物品推荐方法、装置及计算机存储介质
CN106919647B (zh) 一种基于聚类的网络结构相似性推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 211100 floor 5, block a, China Merchants high speed rail Plaza project, No. 9, Jiangnan Road, Jiangning District, Nanjing, Jiangsu (South Station area)

Applicant after: JIANGSU AIJIA HOUSEHOLD PRODUCTS Co.,Ltd.

Address before: 211100 No. 18 Zhilan Road, Science Park, Jiangning District, Nanjing City, Jiangsu Province

Applicant before: JIANGSU AIJIA HOUSEHOLD PRODUCTS Co.,Ltd.

GR01 Patent grant
GR01 Patent grant