CN110941762B - 一种个性化推荐系统排序结果的改进方法 - Google Patents

一种个性化推荐系统排序结果的改进方法 Download PDF

Info

Publication number
CN110941762B
CN110941762B CN201911211990.2A CN201911211990A CN110941762B CN 110941762 B CN110941762 B CN 110941762B CN 201911211990 A CN201911211990 A CN 201911211990A CN 110941762 B CN110941762 B CN 110941762B
Authority
CN
China
Prior art keywords
user
recall
commodity
category
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911211990.2A
Other languages
English (en)
Other versions
CN110941762A (zh
Inventor
雷鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Microphone Culture Media Co ltd
Original Assignee
Shanghai Microphone Culture Media Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Microphone Culture Media Co ltd filed Critical Shanghai Microphone Culture Media Co ltd
Priority to CN201911211990.2A priority Critical patent/CN110941762B/zh
Publication of CN110941762A publication Critical patent/CN110941762A/zh
Application granted granted Critical
Publication of CN110941762B publication Critical patent/CN110941762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于系统排序技术领域,尤其是涉及一种个性化推荐系统排序结果的改进方法,包括以下步骤:首先是进行数据埋点,用户登录APP或者网站后,一般在首页或者登录跳转后,出现可以让用户选择感兴趣的商品类别弹窗等形式,用户可以单选或者多选感兴趣的商品类别;采集埋点数据,进行持久化存储,用户选择完商品类别弹窗后,需要以商品类别列表以json的格式存入Hbase数据库中,并标注好写入的时间戳,对应时间戳t1;召回部分,可以通过协同过滤策略、热度召回策略、关联规则策略等多个召回策略等。本发明提出一种结合用户显式行为,对经过排序后的商品进行重排序的方法,经过对比实验发现,该方法比一般的推荐系统的推荐结果精度得到很大提升。

Description

一种个性化推荐系统排序结果的改进方法
技术领域
本发明涉及系统排序技术领域,尤其涉及一种个性化推荐系统排序结果的改进方法。
背景技术
随着移动互联网的高速发展,推荐系统越来越成为各个互联网产品的标配,从电商网站到视音频产品,从O2O业务到新零售领域,推荐系统一方面帮助消费者从浩繁如海的商品库中找到感兴趣的商品,另一方面可以帮助互联网公司提高销售额等指标。
近年来推荐系统逐渐成为研究热点,好的推荐算法和好的策略层出不穷,当前排序部分所用的特征,特别用户的兴趣特征均是通过隐式行为进行计算得出,也就是通过点击,浏览、购买、收藏等行为通过一定的计算逻辑扩展得出一系列特征,但是一般并没有使用用户的显式行为,显式行为指的是用户对商品的明确的带有用户主观目的行为,例如评分、主动填写自己的兴趣爱好等,显式行为带有用户大量有用的信息,充分利用起来可以提高推荐系统的精度。
为此,我们提出一种个性化推荐系统排序结果的改进方法来解决上述问题。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种个性化推荐系统排序结果的改进方法。
为了实现上述目的,本发明采用了如下技术方案:一种个性化推荐系统排序结果的改进方法,包括以下步骤:
S1、首先是进行数据埋点,用户登录APP或者网站后,一般在首页或者登录跳转后,出现可以让用户选择感兴趣的商品类别弹窗等形式,用户可以单选或者多选感兴趣的商品类别;
S2、采集埋点数据,进行持久化存储,用户选择完商品类别弹窗后,需要以商品类别列表以json的格式存入Hbase数据库中,并标注好写入的时间戳,对应时间戳t1;
S3、召回部分,可以通过协同过滤策略、热度召回策略、关联规则策略等多个召回策略等;
S4、排序部分,通过XGboost,深度学习等预测机器学习模型,得到每个用户对自己的商品召回池中的各个商品的预测分值;
S5、重排序部分,基于现有的业务运营策略,对排序结果进行适当调整;
S6、排序结果改进部分,这里主要是采用的是结合用户之前主动选择的兴趣类别列表,将属于该类别列表的待推荐商品,在排序的分值的基础上乘以一定权重W得到最终的分值。
在上述的一种个性化推荐系统排序结果的改进方法中,所述步骤 S1中的商品类别例如新闻app,可以让用户主动选择军事、国际、科技类别的标签,音乐app,可以选择摇滚、古典等类别,选择后的商品类别对应列表[category1,category2,category3]。
在上述的一种个性化推荐系统排序结果的改进方法中,所述步骤 S3中的召回部分需要结合用户的隐式行为,从物料库中得到待推荐商品的召回池,一般是物料库的商品数量的千分之一或者万分之一。
在上述的一种个性化推荐系统排序结果的改进方法中,所述步骤 S4中的预测分值范围在0~1之间,基于召回池的商品的预测分值对商品进行排序。
在上述的一种个性化推荐系统排序结果的改进方法中,所述步骤 S6中的预测分值乘以权重值之后,最终这些商品的排名会比之前更靠前,最终达到提高商品点击率,转化率等指标。
在上述的一种个性化推荐系统排序结果的改进方法中,所述权重值的计算方法为其中W是要在排序分值后乘以的权重,范围在1.0~2.0,β是自定义的用户兴趣衰减时间周期,默认为 10,也就是从用户选择兴趣类别那天起,往后推10天后,用户兴趣完全衰减,w=1.0,这时权重作用失效,β偏大,则衰减缓慢,反之则偏快,α是用户选择兴趣类别与当前推荐日期的天数差。
与现有技术相比,本一种个性化推荐系统排序结果的改进方法的优点在于:
本发明提出一种结合用户显式行为,对经过排序后的商品进行重排序的方法,经过对比实验发现,该方法比一般的推荐系统的推荐结果精度得到很大提升。
附图说明
图1为本发明提出的一种个性化推荐系统排序结果的改进方法的方法步骤图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参照图1,一种个性化推荐系统排序结果的改进方法,包括以下步骤:
S1、首先是进行数据埋点,用户登录APP或者网站后,一般在首页或者登录跳转后,出现可以让用户选择感兴趣的商品类别弹窗等形式,用户可以单选或者多选感兴趣的商品类别;
S2、采集埋点数据,进行持久化存储,用户选择完商品类别弹窗后,需要以商品类别列表以json的格式存入Hbase数据库中,并标注好写入的时间戳,对应时间戳t1;
S3、召回部分,可以通过协同过滤策略、热度召回策略、关联规则策略等多个召回策略等;
S4、排序部分,通过XGboost,深度学习等预测机器学习模型,得到每个用户对自己的商品召回池中的各个商品的预测分值;
S5、重排序部分,基于现有的业务运营策略,对排序结果进行适当调整;
S6、排序结果改进部分,这里主要是采用的是结合用户之前主动选择的兴趣类别列表,将属于该类别列表的待推荐商品,在排序的分值的基础上乘以一定权重W得到最终的分值。
其中,步骤S1中的商品类别例如新闻app,可以让用户主动选择军事、国际、科技类别的标签,音乐app,可以选择摇滚、古典等类别,选择后的商品类别对应列表[category1,category2,category3]。
其中,步骤S3中的召回部分需要结合用户的隐式行为,从物料库中得到待推荐商品的召回池,一般是物料库的商品数量的千分之一或者万分之一。
其中,步骤S4中的预测分值范围在0~1之间,基于召回池的商品的预测分值对商品进行排序。
其中,步骤S6中的预测分值乘以权重值之后,最终这些商品的排名会比之前更靠前,最终达到提高商品点击率,转化率等指标。
其中,步骤S6中的权重值的计算方法为其中 W是要在排序分值后乘以的权重,范围在1.0~2.0,β是自定义的用户兴趣衰减时间周期,默认为10,也就是从用户选择兴趣类别那天起,往后推10天后,用户兴趣完全衰减,w=1.0,这时权重作用失效,β偏大,则衰减缓慢,反之则偏快,α是用户选择兴趣类别与当前推荐日期的天数差。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种个性化推荐系统排序结果的改进方法,其特征在于,包括以下步骤:
S1、首先是进行数据埋点,用户登录APP或者网站后,在首页或者登录跳转后,出现让用户选择感兴趣的商品类别弹窗等形式,用户能够单选或者多选感兴趣的商品类别;
S2、采集埋点数据,进行持久化存储,用户选择完商品类别弹窗后,需要以商品类别列表以json的格式存入Hbase数据库中,并标注好写入的时间戳,对应时间戳t1;
S3、召回部分,通过协同过滤策略、热度召回策略、关联规则策略多个召回策略;
S4、排序部分,通过XGboost,深度学习预测机器学习模型,得到每个用户对自己的商品召回池中的各个商品的预测分值;
S5、重排序部分,基于现有的业务运营策略,对排序结果进行适当调整;
S6、排序结果改进部分,采用的是结合用户之前主动选择的兴趣类别列表,将属于该类别列表的待推荐商品,在排序的分值的基础上乘以一定权重W得到最终的分值。
2.根据权利要求1所述的一种个性化推荐系统排序结果的改进方法,其特征在于,所述步骤S1中的商品类别中新闻app,能够让用户主动选择军事、国际、科技类别的标签,音乐app,能够选择摇滚、古典类别,选择后的商品类别对应列表[category1,category2,category3]。
3.根据权利要求1所述的一种个性化推荐系统排序结果的改进方法,其特征在于,所述步骤S3中的召回部分需要结合用户的隐式行为,从物料库中得到待推荐商品的召回池是物料库的商品数量的千分之一或者万分之一。
4.根据权利要求1所述的一种个性化推荐系统排序结果的改进方法,其特征在于,所述步骤S4中的预测分值范围在0~1之间,基于召回池的商品的预测分值对商品进行排序。
5.根据权利要求1所述的一种个性化推荐系统排序结果的改进方法,其特征在于,所述步骤S6中的预测分值乘以权重值之后,最终这些商品的排名会比之前更靠前,最终达到提高商品点击率,转化率指标。
6.根据权利要求1所述的一种个性化推荐系统排序结果的改进方法,其特征在于,所述权重值的计算方法为其中W是要在排序分值后乘以的权重,范围在1.0~2.0,β是自定义的用户兴趣衰减时间周期,默认为10,也就是从用户选择兴趣类别那天起,往后推10天后,用户兴趣完全衰减,w=1.0,这时权重作用失效,β偏大,则衰减缓慢,反之则偏快,α是用户选择兴趣类别与当前推荐日期的天数差。
CN201911211990.2A 2019-12-02 2019-12-02 一种个性化推荐系统排序结果的改进方法 Active CN110941762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911211990.2A CN110941762B (zh) 2019-12-02 2019-12-02 一种个性化推荐系统排序结果的改进方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911211990.2A CN110941762B (zh) 2019-12-02 2019-12-02 一种个性化推荐系统排序结果的改进方法

Publications (2)

Publication Number Publication Date
CN110941762A CN110941762A (zh) 2020-03-31
CN110941762B true CN110941762B (zh) 2024-01-30

Family

ID=69908869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911211990.2A Active CN110941762B (zh) 2019-12-02 2019-12-02 一种个性化推荐系统排序结果的改进方法

Country Status (1)

Country Link
CN (1) CN110941762B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652631B (zh) * 2020-06-09 2023-06-06 创新奇智(成都)科技有限公司 商品召回方法、装置、电子设备及计算机可读存储介质
CN112115370A (zh) * 2020-09-29 2020-12-22 贝壳技术有限公司 推荐方法、装置、计算机可读存储介质及电子设备
CN113744015A (zh) * 2020-10-20 2021-12-03 北京沃东天骏信息技术有限公司 一种排序方法、装置、设备及计算机存储介质
CN112579408A (zh) * 2020-10-29 2021-03-30 上海钱拓网络技术有限公司 一种埋点信息的分类方法
CN113139130A (zh) * 2021-05-12 2021-07-20 中国工商银行股份有限公司 推荐方法、推荐装置、电子设备以及存储介质
CN114971766A (zh) * 2022-04-14 2022-08-30 广州华多网络科技有限公司 商品推荐方法及其装置、设备、介质、产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617540A (zh) * 2013-10-17 2014-03-05 浙江大学 一种追踪用户兴趣变化的电子商务推荐方法
WO2016191959A1 (zh) * 2015-05-29 2016-12-08 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法
CN109189904A (zh) * 2018-08-10 2019-01-11 上海中彦信息科技股份有限公司 个性化搜索方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617540A (zh) * 2013-10-17 2014-03-05 浙江大学 一种追踪用户兴趣变化的电子商务推荐方法
WO2016191959A1 (zh) * 2015-05-29 2016-12-08 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法
CN109189904A (zh) * 2018-08-10 2019-01-11 上海中彦信息科技股份有限公司 个性化搜索方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
夏秀峰 ; 张姝 ; 李晓明 ; .一种个性化标签云中的标签排序算法.沈阳航空航天大学学报.2011,(01),全文. *

Also Published As

Publication number Publication date
CN110941762A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN110941762B (zh) 一种个性化推荐系统排序结果的改进方法
CN108629665B (zh) 一种个性化商品推荐方法和系统
CN102902691B (zh) 推荐方法及系统
CN110222272A (zh) 一种潜在客户挖掘与推荐方法
CN103246980B (zh) 信息输出方法及服务器
CN103473354A (zh) 基于电子商务平台的保险推荐系统框架及保险推荐方法
CN106202516A (zh) 一种根据时间节点的电子商务平台商品展示方法
CN103886487A (zh) 基于分布式的b2b平台的个性化推荐方法与系统
CN104239338A (zh) 信息推荐方法及装置
CN102866992A (zh) 一种在网页中显示产品信息的方法及装置
CN103886090A (zh) 基于用户喜好的内容推荐方法及装置
CN102163211A (zh) 信息处理设备、重要度计算方法和程序
CN102193936A (zh) 一种数据分类的方法及装置
CN101493832A (zh) 网站内容联合推荐系统与方法
JP2019125007A (ja) 情報分析装置、情報分析方法および情報分析プログラム
CN102542046A (zh) 一种基于图书内容的图书推荐方法
CN109711907B (zh) 一种基于顶端排序的在线广告排序方法
CN104899246A (zh) 基于模糊机制用户评分邻域信息的协同过滤推荐方法
CN104239335B (zh) 特定用户信息获取方法及装置
CN103294692A (zh) 一种信息推荐方法及系统
KR20180113111A (ko) 키워드 검색량 기반 예측 정보 생성 장치 및 방법
CN103843026B (zh) 信息处理装置、信息处理方法
CN115131101A (zh) 一种保险产品个性化智能推荐系统
CN110727859A (zh) 一种推荐信息推送方法及其装置
CN110825974B (zh) 推荐系统内容排序方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant