CN110533515A - 一种高吞吐低延迟的电商个性化推荐方法及装置 - Google Patents
一种高吞吐低延迟的电商个性化推荐方法及装置 Download PDFInfo
- Publication number
- CN110533515A CN110533515A CN201910829746.6A CN201910829746A CN110533515A CN 110533515 A CN110533515 A CN 110533515A CN 201910829746 A CN201910829746 A CN 201910829746A CN 110533515 A CN110533515 A CN 110533515A
- Authority
- CN
- China
- Prior art keywords
- user
- feature
- commodity
- line
- handling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种高吞吐低延迟的电商个性化推荐方法及装置,方法包括:线下离线计算出用户的特征或特征向量与商品的匹配程度,并存储在数据库中;线上获取用户画像特征;根据用户画像特征从数据库中获取匹配的商品数据集,得到若干个商品候选集结果;依据合并策略合并上述若干个商品候选集结果,得到推荐结果;装置包括线上部分和线下部分。本发明方法基本无计算的部分,有效降低了模型计算带来的延迟,解决了高吞吐量复杂模型的高延迟问题,利于电商的个性化推荐和发展。
Description
技术领域
本专利申请属于电商购物技术领域,更具体地说,是涉及一种高吞吐低延迟的电商个性化推荐方法及装置。
背景技术
现有的大数据下的电商用户个性化推荐流程大致如下:获取用户画像特征;根据用户画像和对应的个性化推荐模型,从海量商品中获取与所述用户画像特征匹配的商品数据集进行推荐。此种过程在大量用户同时访问的高并发场景下,使用复杂模型进行在线计算具有非常高的延时,带来用户体验的下降,不利于用户粘度的维系。
发明内容
本发明需要解决的技术问题是提供一种高吞吐低延迟的电商个性化推荐方法及装置,可以有效提升系统的吞吐量,并降低时延。
为了解决上述问题,本发明所采用的技术方案是:
一种高吞吐低延迟的电商个性化推荐方法,步骤为:
步骤1、线下离线计算出用户的特征或特征向量与商品的匹配程度,并存储在数据库中;
步骤2、线上获取用户画像特征;
步骤3、根据用户画像特征从数据库中获取匹配的商品数据集,得到若干个商品候选集结果;
步骤4、依据合并策略合并上述若干个商品候选集结果,得到推荐结果。
本发明技术方案的进一步改进在于:步骤1中线下离线计算过程为:
将用户的特征或特征向量全部抽象为数值a或b,a或b分别对应于用户是否匹配该特征或特征向量对应的商品集,对于a或b的取值通过下述方法实现:
(1)统计法,计算用户对某特征下商品购买的频率,通过设定的频率阀值进行判断,超过或等于设定的频率阀值,则判定为a,否则为b;比如一个用户经常购买美妆特征下的商品,则该用户对于美妆的特征为a。或者
(2)协同过滤法,计算各个特征之间的关联度,通过设定的关联度阀值来确定特征之间是否有关联,如果一个用户经确认其某一特征为a,则与该特征有关联的其他特征也为a;比如经常浏览/购买美妆商品的用户,也经常购买首饰特征的商品,那么如果一个用户多次购买美妆商品,那么该用户的首饰特征也为1;或者
(3)机器学习建模法,对用户特征、商品特征、环境特征进行联合建模,预测用户购买某特征下商品的概率,如果概率计算值大于设定的预测阀值,则对该特征取a,否则为b。
本发明技术方案的进一步改进在于:步骤1中按匹配程度从高到低的顺序将匹配程度存储在数据库中。
本发明技术方案的进一步改进在于:步骤1中,数值a和b分别取值为1和0,其中0表示不匹配,1表示匹配。
本发明技术方案的进一步改进在于:机器学习建模法采用基于CTR预估的模型,包括FM、FFM、GBDT+LR、Wide&Deep或DeepFM算法。这些算法的思路是将用户特征、商品特征和环境特征拼接成特征向量(X),从历史数据中获得每个样本的标签y(转化或非转化)。然后利用监督式模型去学习X和y之间的联系。
本发明技术方案的进一步改进在于:步骤4中,合并策略包括特征更新时间策略或指标反馈类型策略。特征更新时间策略指的是按照特征更新的时间来排召回商品集的展示顺序,比如A策略更新时间比B策略的更接近当前时间,则A策略的实时性比B策略高。指标反馈类型策略是按照推荐结果分析指标来排召回商品集的展示顺序,具体的指标可以包括:转化率,点击率,营收额度等。
一种高吞吐低延迟的电商个性化推荐装置,包括线上部分和线下部分,线上部分包括与用户日志连接的数据构造模块、与数据构造模块连接的用户画像特征向量数据库和模型训练预测模块、与模型训练预测模块连接的特征推荐结果数据库和产品推荐结果数据库,用户画像特征向量数据库和模型训练预测模块之间也连接;
线下部分包括与用户请求和用户画像特征向量数据库均连接的用户画像特征拼接模块、与用户画像特征拼接模块和特征推荐结果数据库以及产品推荐结果数据库均连接的数据库查询合并模块,数据库查询合并模块连接最终推荐结果。
本发明技术方案的进一步改进在于:在模型训练预测模块、用户画像特征拼接模块、数据库查询合并模块中,模型训练预测模块:采用深度学习和矩阵分解算法,将稀疏的用户行为特征和商品的特征向量映射成致密的低维空间向量,该低维空间向量可以用来作为用户和商品的特征表征,同时亦可以作乘积来获取关联的程度;
用户画像特征拼接模块:线上支持高效拼接用户特征信息、商品特征信息、环境特征信息来作为样本预测的特征输入;
数据库查询合并模块:离线计算用户-商品或商品-商品的关联分数并存储成用户对应的商品列表或商品对应的用户列表,避免线上计算关联耗费大量的时间。
由于采用了上述技术方案,本发明取得的有益效果是:涉及的线下部分离线即可计算好对应特征或特征向量与商品的匹配程度,并按匹配度从高到低的顺序存储在数据库中,线上流程优化为:
1)获取用户画像特征;
2)根据用户画像特征从数据库中获取匹配的商品数据集;
3)依据一定的策略合并上述多个商品候选集的结果。
经过上述优化后,有效降低了模型计算带来的延迟(基本无计算的部分),解决了高吞吐量复杂模型的高延迟问题,利于电商的个性化推荐和发展,具有较高的推广应用价值。
附图说明
图1为本发明方法的流程示意图;
图2为本发明装置的结构框图。
具体实施方式
下面结合实施例对本发明做进一步详细说明。
本发明公开了一种高吞吐低延迟的电商个性化推荐方法,步骤为:
步骤1、线下离线计算出用户的特征或特征向量与商品的匹配程度,并存储在数据库中;
步骤2、线上获取用户画像特征;
步骤3、根据用户画像特征从数据库中获取匹配的商品数据集,得到若干个商品候选集结果;
步骤4、依据合并策略合并上述若干个商品候选集结果,得到推荐结果。
步骤1中线下离线计算过程为:
将用户的特征或特征向量全部抽象为数值a或b,a或b分别对应于用户是否匹配该特征或特征向量对应的商品集,对于a或b的取值通过下述方法实现:
(1)统计法,计算用户对某特征下商品购买的频率,通过设定的频率阀值进行判断,超过或等于设定的频率阀值,则判定为a,否则为b。比如一个用户经常购买美妆特征下的商品,则该用户对于美妆的特征为a。或者
(2)协同过滤法,计算各个特征之间的关联度,通过设定的关联度阀值来确定特征之间是否有关联,如果一个用户经确认其某一特征为a,则与该特征有关联的其他特征也为a;比如经常浏览/购买美妆商品的用户,也经常购买首饰特征的商品,那么如果一个用户多次购买美妆商品,那么该用户的首饰特征也为1,特征之间关联度的确定通过统计实现。或者
(3)机器学习建模法,对用户特征、商品特征、环境特征进行联合建模,预测用户购买某特征下商品的概率,如果概率计算值大于设定的预测阀值,则对该特征取a,否则为b。
步骤1中按匹配程度从高到低的顺序将匹配程度存储在数据库中。
步骤1中,数值a和b分别取值为1和0,其中0表示不匹配,1表示匹配。
机器学习建模法采用基于CTR预估的模型,包括FM、FFM、GBDT+LR、Wide&Deep或DeepFM算法。这些算法的思路是将用户特征、商品特征和环境特征拼接成特征向量(X),从历史数据中获得每个样本的标签y(转化或非转化)。然后利用监督式模型去学习X和y之间的联系。
步骤4中,合并策略包括特征更新时间策略或指标反馈类型策略。所谓特征更新时间策略指的是按照特征更新的时间来排召回商品集的展示顺序,比如A策略更新时间比B策略的更接近当前时间,则A策略的实时性比B策略高。所谓指标反馈类型策略是按照推荐结果分析指标来排召回商品集的展示顺序,具体的指标可以包括:转化率,点击率,营收额度等。
一种高吞吐低延迟的电商个性化推荐装置,包括线上部分和线下部分,线上部分包括与用户日志连接的数据构造模块、与数据构造模块连接的用户画像特征向量数据库和模型训练预测模块、与模型训练预测模块连接的特征推荐结果数据库和产品推荐结果数据库,用户画像特征向量数据库和模型训练预测模块之间也连接;
线下部分包括与用户请求和用户画像特征向量数据库均连接的用户画像特征拼接模块、与用户画像特征拼接模块和特征推荐结果数据库以及产品推荐结果数据库均连接的数据库查询合并模块,数据库查询合并模块连接最终推荐结果。
在模型训练预测模块、用户画像特征拼接模块、数据库查询合并模块中,模型训练预测模块:采用深度学习和矩阵分解算法,将稀疏的用户行为特征和商品的特征向量映射成致密的低维空间向量,该低维空间向量可以用来作为用户和商品的特征表征,同时亦可以作乘积来获取关联的程度;
用户画像特征拼接模块:线上支持高效拼接用户特征信息、商品特征信息、环境特征信息来作为样本预测的特征输入;
数据库查询合并模块:离线计算用户-商品或商品-商品的关联分数并存储成用户对应的商品列表或商品对应的用户列表,避免线上计算关联耗费大量的时间。
如图1所示,将用户画像特征构建为0-1形式并依次进行建模预测,推荐结果以{feature_index_1:products}形式存于数据库中,分别形成特征推荐结果数据库和产品推荐结果数据库;
新来的用户请求从用户画像特征向量数据中获取用户/商品特征向量描述并从特征推荐结果数据库和产品推荐结果数据库中获取推荐结果,经过合并策略(如特征更新时间策略或指标反馈类型策略等)进行合并得到最终的推荐结果以显示。
Claims (8)
1.一种高吞吐低延迟的电商个性化推荐方法,其特征在于步骤为:
步骤1、线下离线计算出用户的特征或特征向量与商品的匹配程度,并存储在数据库中;
步骤2、线上获取用户画像特征;
步骤3、根据用户画像特征从数据库中获取匹配的商品数据集,得到若干个商品候选集结果;
步骤4、依据合并策略合并上述若干个商品候选集结果,得到推荐结果。
2.根据权利要求1所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:步骤1中线下离线计算过程为:
将用户的特征或特征向量全部抽象为数值a或b,a或b分别对应于用户是否匹配该特征或特征向量对应的商品集,对于a或b的取值通过下述方法实现:
(1)统计法,计算用户对某特征下商品购买的频率,通过设定的频率阀值进行判断,超过或等于设定的频率阀值,则判定为a,否则为b;或者
(2)协同过滤法,计算各个特征之间的关联度,通过设定的关联度阀值来确定特征之间是否有关联,如果一个用户经确认其某一特征为a,则与该特征有关联的其他特征也为a;或者
(3)机器学习建模法,对用户特征、商品特征、环境特征进行联合建模,预测用户购买某特征下商品的概率,如果概率计算值大于设定的预测阀值,则对该特征取a,否则为b。
3.根据权利要求2所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:步骤1中按匹配程度从高到低的顺序将匹配程度存储在数据库中。
4.根据权利要求3所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:步骤1中,数值a和b分别取值为1和0,其中0表示不匹配,1表示匹配。
5.根据权利要求4所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:机器学习建模法采用基于CTR预估的模型,包括FM、FFM、GBDT+LR、Wide&Deep或DeepFM算法。
6.根据权利要求5所述的一种高吞吐低延迟的电商个性化推荐方法,其特征在于:步骤4中,合并策略包括特征更新时间策略或指标反馈类型策略。
7.一种高吞吐低延迟的电商个性化推荐装置,其特征在于:包括线上部分和线下部分,线上部分包括与用户日志连接的数据构造模块、与数据构造模块连接的用户画像特征向量数据库和模型训练预测模块、与模型训练预测模块连接的特征推荐结果数据库和产品推荐结果数据库,用户画像特征向量数据库和模型训练预测模块之间也连接;
线下部分包括与用户请求和用户画像特征向量数据库均连接的用户画像特征拼接模块、与用户画像特征拼接模块和特征推荐结果数据库以及产品推荐结果数据库均连接的数据库查询合并模块,数据库查询合并模块连接最终推荐结果。
8.根据权利要求7所述的一种高吞吐低延迟的电商个性化推荐装置,其特征在于:在模型训练预测模块、用户画像特征拼接模块、数据库查询合并模块中,模型训练预测模块:采用深度学习和矩阵分解算法,将稀疏的用户行为特征和商品的特征向量映射成致密的低维空间向量,该低维空间向量可以用来作为用户和商品的特征表征,同时亦可以作乘积来获取关联的程度;
用户画像特征拼接模块:线上支持高效拼接用户特征信息、商品特征信息、环境特征信息来作为样本预测的特征输入;
数据库查询合并模块:离线计算用户-商品或商品-商品的关联分数并存储成用户对应的商品列表或商品对应的用户列表,避免线上计算关联耗费大量的时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910829746.6A CN110533515A (zh) | 2019-09-04 | 2019-09-04 | 一种高吞吐低延迟的电商个性化推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910829746.6A CN110533515A (zh) | 2019-09-04 | 2019-09-04 | 一种高吞吐低延迟的电商个性化推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110533515A true CN110533515A (zh) | 2019-12-03 |
Family
ID=68666695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910829746.6A Withdrawn CN110533515A (zh) | 2019-09-04 | 2019-09-04 | 一种高吞吐低延迟的电商个性化推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110533515A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080413A (zh) * | 2019-12-20 | 2020-04-28 | 深圳市华宇讯科技有限公司 | 电商平台商品的推荐方法、装置、服务器和存储介质 |
CN111191133A (zh) * | 2019-12-31 | 2020-05-22 | 口口相传(北京)网络技术有限公司 | 业务搜索处理方法、装置及设备 |
WO2023078226A1 (zh) * | 2021-11-04 | 2023-05-11 | 中兴通讯股份有限公司 | 推荐方法、装置、服务器和计算机可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106296242A (zh) * | 2015-05-22 | 2017-01-04 | 苏宁云商集团股份有限公司 | 一种用于电子商务中商品推荐列表的生成方法及生成系统 |
US20170236183A1 (en) * | 2016-02-11 | 2017-08-17 | Ebay Inc. | System and method for detecting visually similar items |
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备 |
CN107424043A (zh) * | 2017-06-15 | 2017-12-01 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置,电子设备 |
CN108021929A (zh) * | 2017-11-16 | 2018-05-11 | 华南理工大学 | 基于大数据的移动端电商用户画像建立与分析方法及系统 |
CN108960945A (zh) * | 2017-05-18 | 2018-12-07 | 北京京东尚科信息技术有限公司 | 商品推荐方法和装置 |
CN109062994A (zh) * | 2018-07-04 | 2018-12-21 | 平安科技(深圳)有限公司 | 推荐方法、装置、计算机设备和存储介质 |
CN109189904A (zh) * | 2018-08-10 | 2019-01-11 | 上海中彦信息科技股份有限公司 | 个性化搜索方法及系统 |
CN110110237A (zh) * | 2017-12-19 | 2019-08-09 | 福建天泉教育科技有限公司 | 用户兴趣信息推荐方法、存储介质 |
-
2019
- 2019-09-04 CN CN201910829746.6A patent/CN110533515A/zh not_active Withdrawn
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106296242A (zh) * | 2015-05-22 | 2017-01-04 | 苏宁云商集团股份有限公司 | 一种用于电子商务中商品推荐列表的生成方法及生成系统 |
US20170236183A1 (en) * | 2016-02-11 | 2017-08-17 | Ebay Inc. | System and method for detecting visually similar items |
CN108960945A (zh) * | 2017-05-18 | 2018-12-07 | 北京京东尚科信息技术有限公司 | 商品推荐方法和装置 |
CN107424043A (zh) * | 2017-06-15 | 2017-12-01 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置,电子设备 |
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备 |
CN108021929A (zh) * | 2017-11-16 | 2018-05-11 | 华南理工大学 | 基于大数据的移动端电商用户画像建立与分析方法及系统 |
CN110110237A (zh) * | 2017-12-19 | 2019-08-09 | 福建天泉教育科技有限公司 | 用户兴趣信息推荐方法、存储介质 |
CN109062994A (zh) * | 2018-07-04 | 2018-12-21 | 平安科技(深圳)有限公司 | 推荐方法、装置、计算机设备和存储介质 |
CN109189904A (zh) * | 2018-08-10 | 2019-01-11 | 上海中彦信息科技股份有限公司 | 个性化搜索方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080413A (zh) * | 2019-12-20 | 2020-04-28 | 深圳市华宇讯科技有限公司 | 电商平台商品的推荐方法、装置、服务器和存储介质 |
CN111191133A (zh) * | 2019-12-31 | 2020-05-22 | 口口相传(北京)网络技术有限公司 | 业务搜索处理方法、装置及设备 |
CN111191133B (zh) * | 2019-12-31 | 2023-12-01 | 口口相传(北京)网络技术有限公司 | 业务搜索处理方法、装置及设备 |
WO2023078226A1 (zh) * | 2021-11-04 | 2023-05-11 | 中兴通讯股份有限公司 | 推荐方法、装置、服务器和计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110533515A (zh) | 一种高吞吐低延迟的电商个性化推荐方法及装置 | |
CN108960992A (zh) | 一种信息推荐方法以及相关设备 | |
CN104699711B (zh) | 一种推荐方法及服务器 | |
CN110851699A (zh) | 基于深度强化学习的信息流推荐方法、装置、设备及介质 | |
CN111949887A (zh) | 物品推荐方法、装置及计算机可读存储介质 | |
CN109145193A (zh) | 一种信息推送方法及系统 | |
CN115062732B (zh) | 基于大数据用户标签信息的资源共享合作推荐方法及系统 | |
CN113643103A (zh) | 基于用户相似度的产品推荐方法、装置、设备及存储介质 | |
CN107944911A (zh) | 一种基于文本分析的推荐系统的推荐方法 | |
CN106202377A (zh) | 一种基于随机梯度下降的在线协同排序方法 | |
CN112801425B (zh) | 信息点击率的确定方法、装置、计算机设备和存储介质 | |
CN110110226A (zh) | 一种推荐算法、推荐系统及终端设备 | |
CN106294676B (zh) | 一种电子商务政务系统的数据检索方法 | |
CN102799656A (zh) | 一种面向目标用户的个性化产品包的提取方法 | |
CN110570279A (zh) | 一种基于用户实时行为的策略化推荐方法及装置 | |
CN113420212A (zh) | 基于深度特征学习的推荐方法、装置、设备及存储介质 | |
CN115481325A (zh) | 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统 | |
CN112084307A (zh) | 一种数据处理方法、装置、服务器及计算机可读存储介质 | |
CN114862506A (zh) | 一种基于深度强化学习的金融产品推荐方法 | |
CN114090880A (zh) | 用于商品推荐的方法及装置、电子设备、存储介质 | |
CN115270005B (zh) | 一种信息推荐方法、装置、设备以及存储介质 | |
CN116681463A (zh) | 销量预测方法、系统、设备及存储介质 | |
CN115982391A (zh) | 信息处理方法及装置 | |
CN116957128A (zh) | 业务指标预测方法、装置、设备和存储介质 | |
CN110390574A (zh) | 业务对象的确定方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20191203 |