CN114492836A - 面向隐式反馈推荐系统的负样本采样及训练方法 - Google Patents
面向隐式反馈推荐系统的负样本采样及训练方法 Download PDFInfo
- Publication number
- CN114492836A CN114492836A CN202210056103.4A CN202210056103A CN114492836A CN 114492836 A CN114492836 A CN 114492836A CN 202210056103 A CN202210056103 A CN 202210056103A CN 114492836 A CN114492836 A CN 114492836A
- Authority
- CN
- China
- Prior art keywords
- sampling
- pool
- article
- model
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005070 sampling Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 title claims abstract description 14
- 238000009827 uniform distribution Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 238000012952 Resampling Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 12
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了面向隐式反馈推荐系统的负样本采样及训练方法,该方法从未交互的物品集合中采样作为负样本,并基于采样的中间结果,估计正样本在模型中的排序,设计全新的损失函数,加快模型的收敛,提升模型的效果。
Description
技术领域
本发明涉及机器学习及推荐系统技术领域,具体地,涉及一种面向隐式反馈推荐系统的负样本采样及训练方法。
背景技术
推荐系统在解决信息过载问题中起到了非常重要的作用,它能够帮助用户快速找到感兴趣的物品。其中,根据用户反馈形式的不同,推荐系统可以被分为显式反馈推荐系统和隐式反馈推荐系统。当用户的反馈是打分行为时,即为显式反馈;当用户的反馈是点击、购买等行为时,即为隐式反馈。在实际场景中,后者会更加普遍。
然而,在隐式反馈的推荐场景下,用户交互过的物品可以作为正样本,但是缺少负样本。针对此种情况,一种解决方式是从用户所有未交互过的物品中进行采样并将其作为负样本。在此过程中,不同的采样方法会极大地影响模型的训练效果和收敛速度。因此,如何设计一种高效的负样本采样方法是亟需解决的一个研究问题。
围绕这个研究问题,现有技术提供了多种方式。其中,一种有效的方法是基于两阶段的采样方法。首先,从均匀分布中采样一定数量的物品作为物品池;然后,从物品池中挑选出推荐模型打分最高的物品作为负样本。但是,这种方式无法显式给出每一个物品被作为负样本的概率是多少,缺乏理论支撑。
因此,需要设计一种更加具有可解释性的两阶段采样方法,并以此为基础来更有效地训练推荐模型。
发明内容
本发明的目的是提供一种面向隐式反馈推荐系统的负样本采样及训练方法,该方法不仅有重要的理论支撑,而且能够显式给出每个物品被作为负样本的概率,采样和训练更高效。
为了实现上述目的,本发明提供了一种面向隐式反馈推荐系统的负样本采样及训练方法,该方法包括:
其中,Q(i)和Q(j)分别表示物品i和物品j被采样的概率;
步骤2、在模型训练的过程中,设上一轮采样得到的物品池为当前轮采样得到的物品池为将它们合并,并从中根据均匀分布采样得到当前轮的物品池对于数据集中的正样本(,i),从中根据均匀分布采样最终得到负样本集合并设计如下损失函数:
步骤3、基于步骤1中采样得到的物品池当静态分布Q为均匀分布时,进一步估计正样本(c,i)在当前模型的打分中,物品i在所有物品集合中的排序;其中,排序越靠后,则该样本在损失函数中的权重越大;排序的估计公式如下:
优选地,推荐模型为推荐系统领域的任意一种模型。
根据上述技术方案,本发明通过基于重要性重采样的两阶段采样方法,从未交互的物品集合中采样作为负样本,并基于采样的中间结果,估计正样本在模型中的排序,设计全新的损失函数,加快模型的收敛,提升模型的效果。
本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。
具体实施方式
以下对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
本发明提供一种面向隐式反馈推荐系统的负样本采样及训练方法,该方法包括:
设用户集合物品集合用户与物品的交互数据集合用表示,数据集中每一条数据都是一条正样本,由一个二元组(c,i)组成,其中对于一个用户c和一个物品i,一个具有参数θ的推荐模型对他们的打分用rci表示,这里的推荐模型可以是推荐系统领域的任意一种模型;
其中,Q(i)和Q(j)分别表示物品i和物品j被采样的概率;
步骤2、在模型训练的过程中,由于模型的参数会发生变化,不同迭代轮次下模型对于用户c和物品i的打分rci都是不同的。因此,每一轮迭代中都会为用户c执行步骤1中的两阶段采样方法形成一个物品池为了充分利用历史采样得到的负样本,假设上一轮采样得到的物品池为当前轮采样得到的物品池为将它们合并,并从中根据均匀分布采样得到当前轮的物品池对于数据集中的正样本(c,i),从中根据均匀分布采样最终得到负样本集合并设计如下损失函数:
步骤3、基于步骤1中采样得到的物品池当静态分布Q为均匀分布时,进一步估计正样本(c,i)在当前模型的打分中,物品i在所有物品集合中的排序;通常来说,排序越靠后,那么该样本在损失函数中的权重就应该越大。具体来说,排序的估计公式如下:
由此可见,本发明提出了一种全新的基于重要性重采样的两阶段负采样方法,通过这种方法,每个物品被采样的概率存在一个显式的结果,即此外,通过采样的中间结果,还能估算正样本中物品在当前模型下的排序结果,基于此加大正样本在损失函数中的权重,加快模型的收敛。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
Claims (2)
1.一种面向隐式反馈推荐系统的负样本采样及训练方法,其特征在于,所述方法包括:
其中,Q(i)和Q(j)分别表示物品i和物品j被采样的概率;
步骤2、在模型训练的过程中,设上一轮采样得到的物品池为当前轮采样得到的物品池为将它们合并,并从中根据均匀分布采样得到当前轮的物品池对于数据集中的正样本(c,i),从中根据均匀分布采样最终得到负样本集合并设计如下损失函数:
步骤3、基于步骤1中采样得到的物品池当静态分布Q为均匀分布时,进一步估计正样本(c,i)在当前模型的打分中,物品i在所有物品集合中的排序;其中,排序越靠后,则该样本在损失函数中的权重越大;排序的估计公式如下:
2.根据权利要求1所述的面向隐式反馈推荐系统的负样本采样及训练方法,其特征在于,推荐模型为推荐系统领域的任意一种模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210056103.4A CN114492836B (zh) | 2022-01-18 | 2022-01-18 | 面向隐式反馈推荐系统的负样本采样及训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210056103.4A CN114492836B (zh) | 2022-01-18 | 2022-01-18 | 面向隐式反馈推荐系统的负样本采样及训练方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114492836A true CN114492836A (zh) | 2022-05-13 |
CN114492836B CN114492836B (zh) | 2024-04-19 |
Family
ID=81472192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210056103.4A Active CN114492836B (zh) | 2022-01-18 | 2022-01-18 | 面向隐式反馈推荐系统的负样本采样及训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114492836B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116151892A (zh) * | 2023-04-20 | 2023-05-23 | 中国科学技术大学 | 物品推荐方法、系统、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110442781A (zh) * | 2019-06-28 | 2019-11-12 | 武汉大学 | 一种基于生成对抗网络的对级排序项目推荐方法 |
CN110889747A (zh) * | 2019-12-02 | 2020-03-17 | 腾讯科技(深圳)有限公司 | 商品推荐方法、装置、系统、计算机设备及存储介质 |
CN112579883A (zh) * | 2020-11-24 | 2021-03-30 | 深圳大学 | 一种面向序列反馈的物品推荐方法、智能终端及存储介质 |
WO2021169367A1 (zh) * | 2020-02-27 | 2021-09-02 | 深圳大学 | 一种基于多层注意力的推荐方法 |
US20210326729A1 (en) * | 2018-12-29 | 2021-10-21 | Huawei Technologies Co., Ltd. | Recommendation Model Training Method and Related Apparatus |
-
2022
- 2022-01-18 CN CN202210056103.4A patent/CN114492836B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210326729A1 (en) * | 2018-12-29 | 2021-10-21 | Huawei Technologies Co., Ltd. | Recommendation Model Training Method and Related Apparatus |
CN110442781A (zh) * | 2019-06-28 | 2019-11-12 | 武汉大学 | 一种基于生成对抗网络的对级排序项目推荐方法 |
CN110889747A (zh) * | 2019-12-02 | 2020-03-17 | 腾讯科技(深圳)有限公司 | 商品推荐方法、装置、系统、计算机设备及存储介质 |
WO2021169367A1 (zh) * | 2020-02-27 | 2021-09-02 | 深圳大学 | 一种基于多层注意力的推荐方法 |
CN112579883A (zh) * | 2020-11-24 | 2021-03-30 | 深圳大学 | 一种面向序列反馈的物品推荐方法、智能终端及存储介质 |
Non-Patent Citations (1)
Title |
---|
陆艺;曹健;: "面向隐式反馈的推荐系统研究现状与趋势", 计算机科学, no. 04, 15 April 2016 (2016-04-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116151892A (zh) * | 2023-04-20 | 2023-05-23 | 中国科学技术大学 | 物品推荐方法、系统、设备及存储介质 |
CN116151892B (zh) * | 2023-04-20 | 2023-08-29 | 中国科学技术大学 | 物品推荐方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114492836B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106021364B (zh) | 图片搜索相关性预测模型的建立、图片搜索方法和装置 | |
CN106815252B (zh) | 一种搜索方法和设备 | |
CN108334575B (zh) | 一种推荐结果排序修正方法及装置,电子设备 | |
CN104077306B (zh) | 一种搜索引擎的结果排序方法及系统 | |
CN106598950B (zh) | 一种基于混合层叠模型的命名实体识别方法 | |
CN105653683B (zh) | 一种个性化推荐方法及装置 | |
CN107239497B (zh) | 热门内容搜索方法和系统 | |
CN110532351B (zh) | 推荐词展示方法、装置、设备及计算机可读存储介质 | |
CN110334580A (zh) | 基于集成增量的动态权重组合的设备故障分类方法 | |
EP3617909A1 (en) | Method and device for setting sample weight, and electronic apparatus | |
CN111768761B (zh) | 一种语音识别模型的训练方法和装置 | |
CN110795613B (zh) | 商品搜索方法、装置、系统及电子设备 | |
CN106844788B (zh) | 一种图书馆智能搜索排序方法及系统 | |
CN106294505B (zh) | 一种反馈答案的方法和装置 | |
CN109902235A (zh) | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 | |
CN110008404B (zh) | 基于nag动量优化的隐语义模型优化方法 | |
EP2988229A1 (en) | Information retrieval method and device | |
CN114492836A (zh) | 面向隐式反馈推荐系统的负样本采样及训练方法 | |
CN114625838B (zh) | 一种搜索系统的优化方法、装置、存储介质及计算机设备 | |
CN112612951A (zh) | 一种面向收益提升的无偏学习排序方法 | |
CN105608105A (zh) | 一种基于收听上下文的音乐推荐方法 | |
CN114297384A (zh) | 评论文本分析方法、模型训练方法、装置、设备及介质 | |
CN113032554A (zh) | 一种决策系统和计算机可读存储介质 | |
WO2018176937A1 (zh) | 一种用户隐式反馈的量化评分方法 | |
CN114819398A (zh) | 基于灰色马尔可夫链的北斗卫星钟差序列组合预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |