CN114119050A - 一种商品召回方法、商品召回系统及相关装置 - Google Patents
一种商品召回方法、商品召回系统及相关装置 Download PDFInfo
- Publication number
- CN114119050A CN114119050A CN202111485421.4A CN202111485421A CN114119050A CN 114119050 A CN114119050 A CN 114119050A CN 202111485421 A CN202111485421 A CN 202111485421A CN 114119050 A CN114119050 A CN 114119050A
- Authority
- CN
- China
- Prior art keywords
- model
- characteristic
- commodity
- feature
- recall
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000013598 vector Substances 0.000 claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000005070 sampling Methods 0.000 claims abstract description 12
- 230000006399 behavior Effects 0.000 claims description 69
- 230000006870 function Effects 0.000 claims description 64
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000009471 action Effects 0.000 abstract description 8
- 230000008569 process Effects 0.000 description 11
- 239000000463 material Substances 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 238000007499 fusion processing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/014—Providing recall services for goods or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
- G06Q30/0629—Directed, with specific intent or strategy for generating comparisons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种商品召回方法,包括:基于FM模型和深度序列匹配模型的召回模型分别对样本进行训练,得到各自的用户侧特征和商品侧特征,并进行特征级联得到两个特征结果;根据特征结果之间的相似度确定样本的相似分序列;利用向量检索库召回相似分序列中前预设数量的商品。本申请通过对用户的近期行为和历史行为进行采集和分析,曝光商品池中进行随机负采样,增加了负样本中长尾商品出现的比例,增强了对包含长尾商品的样本的预测能力,有效提升了召回模型的泛化性。本申请还提供一种商品召回系统、计算机可读存储介质和电子设备,具有上述有益效果。
Description
技术领域
本申请涉及数据分析领域,特别涉及一种商品召回方法、商品召回系统及相关装置。
背景技术
当前,电商推荐系统的主要目的是通过平台来为用户提供内容或商品的相关信息和有效建议,而个性化推荐则是根据用户的历史行为和兴趣特点来向用户推荐其感兴趣的内容或商品。一个完整的个性化推荐系统一般会包含召回和排序两个阶段。对于召回来说,其主要目的是根据用户的历史行为等特征在海量的物料库中快速筛选出一小部分用户存在潜在兴趣的物料,并交给排序阶段。而排序阶段则是通过较为复杂的模型来对上述物料进行精准排序,以实现准确的个性化推荐。
目前召回算法往往使用经典的“双塔结构”来分别计算用户特征和待排物料特征,这样的结构虽然直观且简单,但无法利用到用户和待排物料之间的交叉特征,使得商品召回准确性较低。
发明内容
本申请的目的是提供一种商品召回方法、商品召回系统、计算机可读存储介质和电子设备,能够提高商品召回准确率。
为解决上述技术问题,本申请提供一种商品召回方法,具体技术方案如下:
获取FM模型和包含第一损失函数的深度序列匹配模型;
将样本的用户侧特征和商品侧特征输入所述FM模型,并配置所述FM模型的特征向量,得到输出结果;
根据所述输出结果和所述样本的标签构建所述FM模型的第二损失函数;
叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型;
利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征;
利用所述召回模型中的所述FM模型对所述样本进行训练,得到第二用户侧特征和第二商品侧特征;
对所述第一用户侧特征和所述第二用户侧特征级联得到第一特征结果,对所述第一商品侧特征和所述第二商品侧特征级联得到第二特征结果;其中,所述第一特征结果和所述第二特征结果均为一维向量;
根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列;所述相似分序列包含从大到小排列的相似分;
利用向量检索库召回相似分序列中前预设数量的商品。
可选的,利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征之前,还包括:
将用户当前查询条件下曝光且点击的商品作为正样本,从用户的曝光商品池中采用随机负采样构建包含负样本的负样本集合;
以所述正样本和所述负样本集合中的负样本作为样本。
可选的,利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征包括:
获取用户的近期行为和历史行为;
基于所述近期行为配置近期行为序,基于所述历史行为得到历史行为序;
根据所述近期行为序和所述历史行为序得到第一用户侧特征;
利用所述召回模型中所述深度序列匹配模型对应的由可学习参数构成的向量矩阵确定第一商品侧特征。
可选的,获取FM模型和包含第一损失函数的深度序列匹配模型之前,还包括:
利用余弦相似度计算所述深度序列匹配模型确定的用户特征和商品特征之间的相似度得分,并根据所述相似度得分构建所述第一损失函数。
可选的,根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列包括:
计算所述第一特征结果和所述第二特征结果之间的向量内积,并将各所述向量内积作为用户和商品之间的相似分;
对所述相似分排序得到相似分序列。
可选的,叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型之后,还包括:
利用第一预设优化器更新所述FM模型的模型参数;
利用第二预设优化器训练深度序列匹配模型。
可选的,利用向量检索库召回相似分序列中前预设数量的商品之前,还包括:
将所述第二特征结果保存在推荐引擎;所述推荐引擎用于根据所述第一特征结果和所述第二特征结果计算所述相似分序列。
本申请还提供一种商品召回系统,包括:
获取模块,用于获取FM模型和包含第一损失函数的深度序列匹配模型
特征输入模块,用于将样本的用户侧特征和商品侧特征输入所述FM模型,并配置所述FM模型的特征向量,得到输出结果;
损失函数构建模块,用于根据所述输出结果和所述样本的标签构建所述FM模型的第二损失函数;
损失计算模块,用于叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型;
第一商品特征确定模块,用于利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征;
第二商品特征确定模块,用于利用所述召回模型中的所述FM模型对所述样本进行训练,得到第二用户侧特征和第二商品侧特征;
特征级联模块,用于对所述第一用户侧特征和所述第二用户侧特征级联得到第一特征结果,对所述第一商品侧特征和所述第二商品侧特征级联得到第二特征结果;其中,所述第一特征结果和所述第二特征结果均为一维向量;
相似分计算模块,用于根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列;所述相似分序列包含从大到小排列的相似分;
召回模块,用于利用向量检索库召回相似分序列中前预设数量的商品。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
本申请还提供一种电子设备,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。
本申请提供一种商品召回方法,包括:获取FM模型和包含第一损失函数的深度序列匹配模型;将样本的用户侧特征和商品侧特征输入所述FM模型,并配置所述FM模型的特征向量,得到输出结果;根据所述输出结果和所述样本的标签构建所述FM模型的第二损失函数;叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型;利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征;利用所述召回模型中的所述FM模型对所述样本进行训练,得到第二用户侧特征和第二商品侧特征;对所述第一用户侧特征和所述第二用户侧特征级联得到第一特征结果,对所述第一商品侧特征和所述第二商品侧特征级联得到第二特征结果;其中,所述第一特征结果和所述第二特征结果均为一维向量;根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列;所述相似分序列包含从大到小排列的相似分;利用向量检索库召回相似分序列中前预设数量的商品。
本申请通过对用户的近期行为和历史行为进行采集和分析,曝光商品池中进行随机负采样,增加了负样本中长尾商品出现的比例,增强了对包含长尾商品的样本的预测能力,有效提升了召回模型的泛化性。同时对商品侧特征和用户侧特征分别级联实现了用户侧特征和商品侧特征的提前融合交叉,并在线上预测时兼顾了深度序列匹配模型和FM模型两者的相似度得分,共同来决定待排商品的排序结果,在保证了线上预测的时效性的同时,提升了召回模型的复杂度和算法的准确性。
本申请还提供一种商品召回系统、计算机可读存储介质和电子设备,具有上述有益效果,此处不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种商品召回方法的流程图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种商品召回方法的流程图,该方法包括:
S101:获取FM模型和包含第一损失函数的深度序列匹配模型;
S102:将样本的用户侧特征和商品侧特征输入所述FM模型,并配置所述FM模型的特征向量,得到输出结果;
S103:根据所述输出结果和所述样本的标签构建所述FM模型的第二损失函数;
S104:叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型;
S105:利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征;
S106:利用所述召回模型中的所述FM(Factorization Machine,因子分解机)模型对样本进行训练,得到第二用户侧特征和第二商品侧特征;
S107:对所述第一用户侧特征和所述第二用户侧特征级联得到第一特征结果,对所述第一商品侧特征和所述第二商品侧特征级联得到第二特征结果;其中,所述第一特征结果和所述第二特征结果均为一维向量;
S108:根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列;所述相似分序列包含从大到小排列的相似分;
S109:利用向量检索库召回相似分序列中前预设数量的商品。
在步骤S101中,该深度序列匹配模型通常为双塔结构。下文先对本实施例中步骤S101至步骤S104得到召回模型的过程进行描述。但需要注意的是,下文所描述的召回模型仅为本实施例在此提供的一种优选的模型构建方式。
深度序列匹配模型主要通过对用户的近期行为和历史行为进行分析训练。在此对于近期行为和历史行为不作具体限定,同样的,近期行为当前时间与过去第一时间内的用户行为,历史行为为第一时间至过去第二时间内的用户行为。同样的,近期行为也可以为过去三天的用户行为,而历史行为也可以为从过去第四天起到一个月的时间段内用户行为。所谓用户行为,在此不作具体限定,可以包括但不限于用户对于商品的浏览行为、购买行为等等。
近期行为序和历史行为序均为用户的行为序,由和用户发生过交互行为的商品组成,而每个商品至少应包含能够唯一识别的商品信息,例如商品名称等,还可以包含其他信息,例如商品类目信息,甚至推荐过商品的主播等。
换言之,需要将近期行为和历史行为进行动态结合的方式来获取用户的兴趣信息。对于用户的近期行为序,序列中的每一个商品都可以用向量ei来表示:
其中,F包含了商品的id、主播和类目信息。近期行为序中的商品向量先将上述信息融合在一起,然后再先后通过self-attention network(自注意力网络)、ResNet(残差网络)和Dense(全连接网络)三种网络结构学习用户的特征表示,得到用户的近期行为序特征映射结果ps。该融合过程指融合过程是向量的级联过程:对于同一个商品来说,就是将包含了id信息的id向量(向量维度为1×64)、包含了主播信息的主播向量(向量维度为1×32)、包含了类目信息的类目向量(向量维度为1×32)通过级联的方式融合在一起,得到最终的向量(向量维度为1×(64+32+32)即1×128)。而对于用户的历史行为序,序列中的每一个商品都用向量{gi}来表示,其中不同于近期行为序,历史行为序中的商品向量没有将商品的所有信息进行提前融合,而是针对商品的id信息、类目信息以及推广该商品的主播信息分别构建向量,并通过自注意力网络、残差网络和全连接网络等深度网络学习特征表示,然后再通过上文所述的级联的方式进行向量融合,得到用户的历史行为序特征映射结果pl。接着,构建一个“门结构”来对用户的“近期行为”和“历史行为”进行动态融合,并得到最终的用户行为序特征映射结果
G=sigmoid(Wsps+Wlpl+b) (2)
其中,G为门结构的输出结果,Ws、Wl、b是全连接层的参数矩阵,表示向量维度对应位置的点乘。由此,成功构建了“双塔结构”中“用户塔”的网络结构。而对于另一侧的“商品塔”,则是通过一个全连接网络层来进行特征表示,得到最终的商品特征映射结果而待召回商品和用户行为作为整体网络的输入,经过网络的一系列计算,可以得到商品特征和用户特征。最后,通过余弦相似度的计算方式,得到用户特征和商品特征之间的相似度得分,并利用该相似度得分构建第一损失函数:
其中,每一个tuplet(元组)中存在1个正样本和k-1个负样本,s为超参数,可以采用s=0.01,当然s也可以为其他值,cos(θp)和cos(θn)分别表示正样本和负样本中用户特征和商品特征之间的相似度得分,由此可以得到深度序列匹配模型。
对于FM模型,其不同于LR等简单的线性模型,FM模型可以将任意两个特征进行组合,实现了将二阶特征组合引入模型,其具体的形式为:
其中,x表示用户侧或者商品侧的任意特征,而v则是FM模型需要学习和维护的特征向量。在离线训练时,将用户特征和商品特征无差别的输入给FM模型,可以得到输出结果。然后根据FM模型的输出结果和样本label(标签)来构建第二损失函数:
最后,将深度序列匹配模型的第一损失函数和FM模型的第二损失函数线性融合在一起得到总损失函数,用于模型的整体训练,即可得到召回模型:
L=Ltuplet+Llogit (8)
需要注意的是,公式(8)中深度序列匹配模型和FM模型的参数均为1,因此省略表示,但在本申请的其他应用中,其参数可以为其他数值,在此不一一举例限定。
对于训练模型时使用到的样本,将用户当前查询条件下曝光且点击的商品作为正样本,从用户的曝光商品池中采用随机负采样构建包含负样本的负样本集合,以正样本和负样本集合中的负样本作为样本。
将用户在当前查询条件下曝光且点击的商品看作正样本,但是并没有使用曝光但未点击的商品作为负样本,因为对于整个推荐系统来说,最终曝光的商品实际上都是召回模型的topN排序结果,所以单纯的用户曝光但未点击商品是不能作为召回模型的负样本进行模型训练的。为此,对每个用户进行随机负采样来构建tuplet中的负样本集合。在做随机负采样时,业界的普遍做法是对每个用户从点击商品池中进行随机采样,但是这样往往采样到的都是“热点”商品,使得模型对包含长尾商品的样本的预测力不足。为了解决这个问题,本申请选择对每个用户从曝光商品池中进行随机负采样,该方法增加了负样本中长尾商品出现的比例,有效提升了召回模型的泛化性。
在离线训练的过程中,为了提升训练速度并更好的优化模型参数,使用了两种不同的优化器来训练模型。在更新FM模型的参数时,使用了常见的AdaDelta优化器,该优化器通过计算梯度的指数加权平均来缓解梯度衰减过快的问题,并可以自适应的调整学习率。而对于深度序列匹配模型来说,该模型需要学习的参数比FM模型更多,最终维护的商品特征映射的维度也更大,因此使用FTRL(Follow the Regularized Leader)优化器来更新模型参数。该优化器通过引入L1正则化,在保证模型精度的基础上提升了模型参数的稀疏性。
在进行实际商品召回过程中,对于步骤S105,其可以包括如下步骤:
S1051:获取用户的近期行为和历史行为;
S1052:基于所述近期行为配置近期行为序,基于所述历史行为得到历史行为序;
S1053:根据所述近期行为序和所述历史行为序得到第一用户侧特征;
S1054:利用所述召回模型中所述深度序列匹配模型对应的由可学习参数构成的向量矩阵确定第一商品侧特征。
需要注意的是,可以先针对商品的属性进行融合,通过self-attention network(自注意力网络)、ResNet(残差网络)和Dense(全连接网络)等网络结构来学习用户的特征表示,得到用户的近期行为序。而得到历史行为序的过程中,可以不针对商品的属性进行融合,可以针对每一类信息分别构建向量,并通过深度网络学习特征表示,然后再通过级联的方式进行向量融合,得到用户的历史行为序。步骤S1051至步骤S1054与深度序列匹配模型训练过程的步骤相类似,在此不作重复说明。
同理,步骤S106旨在利用FM模型对相同的样本进行训练,得到第二用户侧特征和第二商品侧特征。
可以将第一商品侧特征和第二商品侧特征级联在一起,得到上文的第二特征结果Xi,并将其提前保存在推荐引擎中,则此后只需于确定用户侧的第一特征结果,即可利用推荐引擎确定样本的相似分,提高了召回效率。其中,第二商品侧特征是通过对当前商品所包含的所有特征进行特征向量的求和计算得到的:
其中,v是FM模型学习到的特征向量。
在线上召回时,由于商品侧的第二特征结果已经确定,首先通过训练好的模型来实时预测用户的特征,即第一用户侧特征和第二用户侧特征并将两者级联在一起,得到Xu。其中,类似于商品侧,是通过对当前用户所包含的所有特征进行特征向量的求和计算得到的:
最后,召回相似分排名最高的前N个商品,以实现整个召回过程。可以通过基于KNN算法的向量检索库来进行召回。该相似分是通过计算Xi和Xu的向量内积<Xi,Xu>得到的。<Xi,Xu>的内积结果可以衡量用户和待排商品之间的相似度大小。由上文可知,其中,在深度序列匹配模型的训练过程中,模型的输出通过计算和之间的余弦相似度得到,因此在预测过程中只需要将和进行归一化,就可以通过向量内积衡量用户和各样本之间的相似度大小。而对于和来说,下列公式是成立的:
对比FM模型的原始公式(5)可知,线上实时预测的公式(11)只是少了用户侧和商品侧各自特征集合内部的二阶特征组合,但是对于用户和商品的交叉特征计算是等价的。而一般情况下,是不需要考虑用户侧和商品侧内部的特征组合结果的,因为这种形式的特征权重对用户和待排商品之间的相似度计算结果影响很小,因此公式(11)和公式(5)可以看作是近似等价的。由此,本申请所提出的根据<Xi,Xu>的内积结果来衡量用户和待排样本之间的相似度大小是合理且有效的。
对于训练模型时使用到的样本,将用户在当前查询条件下曝光且点击的商品看作正样本,但是并没有使用曝光但未点击的商品作为负样本,因为对于整个推荐系统来说,最终曝光的商品实际上都是召回模型的较优排序结果,所以单纯的用户曝光但未点击商品是不能作为召回模型的负样本进行模型训练的。为此,对每个用户查询进行随机负采样来构建元组中的负样本集合。在做随机负采样时,业界的普遍做法是对每个用户查询从点击商品池中进行随机采样,但是这样往往采样到的都是“热点”商品,使得模型对包含长尾商品的样本的预测力不足。为了解决这个问题,本申请实施例选择对每个用户查询从曝光商品池中进行随机负采样,该方法增加了负样本中长尾商品出现的比例,有效提升了召回模型的泛化性。
召回模型为包含深度序列匹配模型和FM模型的双塔模型。在执行本步骤时,可以利用AdaDelta优化器更新所述FM模型的模型参数,利用FTRL优化器引入L1正则化,更新所述模型参数,则本步骤使用了两种不同的优化器来训练模型中的不同结果。AdaDelta优化器通过计算梯度的指数加权平均来缓解梯度衰减过快的问题,并可以自适应的调整学习率。而FTRL优化器由于引入L1正则化,保证模型精度的基础上提升了模型参数的稀疏性。
在执行本步骤时,可以基于KNN算法的向量检索库召回相似分序列中前预设数量的商品。当然本领域技术人员还可宜采用其他算法的向量检索库进行商品召回。在此对于预设数量不作限定,可以由本领域技术人员根据实际召回需求进行相应的设定。
本申请实施例通过对用户的近期行为和历史行为进行采集和分析,曝光商品池中进行随机负采样,增加了负样本中长尾商品出现的比例,增强了对包含长尾商品的样本的预测能力,有效提升了召回模型的泛化性。同时对商品侧特征和用户侧特征分别级联实现了用户侧特征和商品侧特征的提前融合交叉,并在线上预测时兼顾了深度序列匹配模型和FM模型两者的相似度得分,共同来决定待排商品的排序结果,在保证了线上预测的时效性的同时,提升了召回模型的复杂度和算法的准确性。
下面对本申请实施例提供的商品召回系统进行介绍,下文描述的商品召回系统与上文描述的商品召回方法可相互对应参照。
本申请还提供一种商品召回系统,包括:
获取模块,用于获取FM模型和包含第一损失函数的深度序列匹配模型
特征输入模块,用于将样本的用户侧特征和商品侧特征输入所述FM模型,并配置所述FM模型的特征向量,得到输出结果;
损失函数构建模块,用于根据所述输出结果和所述样本的标签构建所述FM模型的第二损失函数;
损失计算模块,用于叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型;
第一商品特征确定模块,用于利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征;
第二商品特征确定模块,用于利用所述召回模型中的所述FM模型对所述样本进行训练,得到第二用户侧特征和第二商品侧特征;
特征级联模块,用于对所述第一用户侧特征和所述第二用户侧特征级联得到第一特征结果,对所述第一商品侧特征和所述第二商品侧特征级联得到第二特征结果;其中,所述第一特征结果和所述第二特征结果均为一维向量;
相似分计算模块,用于根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列;所述相似分序列包含从大到小排列的相似分;
召回模块,用于利用向量检索库召回相似分序列中前预设数量的商品。
基于上述实施例,作为优选的实施例,还包括:
样本确定模块,用于将用户当前查询条件下曝光且点击的商品作为正样本,从用户的曝光商品池中采用随机负采样构建包含负样本的负样本集合;以所述正样本和所述负样本集合中的负样本作为样本。
基于上述实施例,作为优选的实施例,第一商品特征确定模块包括:
行为获取单元,用于获取用户的近期行为和历史行为;
行为序配置单元,用于基于所述近期行为配置近期行为序,基于所述历史行为得到历史行为序;
第一用户侧特征确定单元,用于根据所述近期行为序和所述历史行为序得到第一用户侧特征;
第一商品侧特征确定单元,用于利用所述召回模型中所述深度序列匹配模型对应的由可学习参数构成的向量矩阵确定第一商品侧特征。
基于上述实施例,作为优选的实施例,还包括:
第一损失函数计算模块,用于利用余弦相似度计算所述深度序列匹配模型确定的用户特征和商品特征之间的相似度得分,并根据所述相似度得分构建所述第一损失函数。
基于上述实施例,作为优选的实施例,相似分计算模块为用于计计算所述第一特征结果和所述第二特征结果之间的向量内积,并将各所述向量内积作为用户和商品之间的相似分;对所述相似分排序得到相似分序列的模块。
基于上述实施例,作为优选的实施例,还包括:
优化模块,用于利用第一预设优化器更新所述FM模型的模型参数,以及利用第二预设优化器训练深度序列匹配模型。
基于上述实施例,作为优选的实施例,还包括:
引擎配置模块,用于将所述第二特征结果保存在推荐引擎;所述推荐引擎用于根据所述第一特征结果和所述第二特征结果计算所述相似分序列。
本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种商品召回方法,其特征在于,包括:
获取FM模型和包含第一损失函数的深度序列匹配模型;
将样本的用户侧特征和商品侧特征输入所述FM模型,并配置所述FM模型的特征向量,得到输出结果;
根据所述输出结果和所述样本的标签构建所述FM模型的第二损失函数;
叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型;
利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征;
利用所述召回模型中的所述FM模型对所述样本进行训练,得到第二用户侧特征和第二商品侧特征;
对所述第一用户侧特征和所述第二用户侧特征级联得到第一特征结果,对所述第一商品侧特征和所述第二商品侧特征级联得到第二特征结果;其中,所述第一特征结果和所述第二特征结果均为一维向量;
根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列;所述相似分序列包含从大到小排列的相似分;
利用向量检索库召回相似分序列中前预设数量的商品。
2.根据权利要求1所述的商品召回方法,其特征在于,利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征之前,还包括:
将用户当前查询条件下曝光且点击的商品作为正样本,从用户的曝光商品池中采用随机负采样构建包含负样本的负样本集合;
以所述正样本和所述负样本集合中的负样本作为样本。
3.根据权利要求1所述的商品召回方法,其特征在于,利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征包括:
获取用户的近期行为和历史行为;
基于所述近期行为配置近期行为序,基于所述历史行为得到历史行为序;
根据所述近期行为序和所述历史行为序得到第一用户侧特征;
利用所述召回模型中所述深度序列匹配模型对应的由可学习参数构成的向量矩阵确定第一商品侧特征。
4.根据权利要求1所述的商品召回方法,其特征在于,获取FM模型和包含第一损失函数的深度序列匹配模型之前,还包括:
利用余弦相似度计算所述深度序列匹配模型确定的用户特征和商品特征之间的相似度得分,并根据所述相似度得分构建所述第一损失函数。
5.根据权利要求1所述的商品召回方法,其特征在于,根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列包括:
计算所述第一特征结果和所述第二特征结果之间的向量内积,并将各所述向量内积作为用户和商品之间的相似分;
对所述相似分排序得到相似分序列。
6.根据权利要求1所述的商品召回方法,其特征在于,叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型之后,还包括:
利用第一预设优化器更新所述FM模型的模型参数;
利用第二预设优化器训练深度序列匹配模型。
7.根据权利要求1所述的商品召回方法,其特征在于,利用向量检索库召回相似分序列中前预设数量的商品之前,还包括:
将所述第二特征结果保存在推荐引擎;所述推荐引擎用于根据所述第一特征结果和所述第二特征结果计算所述相似分序列。
8.一种商品召回系统,其特征在于,包括:
获取模块,用于获取FM模型和包含第一损失函数的深度序列匹配模型特征输入模块,用于将样本的用户侧特征和商品侧特征输入所述FM模型,并配置所述FM模型的特征向量,得到输出结果;
损失函数构建模块,用于根据所述输出结果和所述样本的标签构建所述FM模型的第二损失函数;
损失计算模块,用于叠加所述第一损失函数和所述第二损失函数得到总损失函数,并确定所述总损失函数对应的召回模型;
第一商品特征确定模块,用于利用所述召回模型中的所述深度序列匹配模型对所述样本进行训练,得到第一用户侧特征和第一商品侧特征;
第二商品特征确定模块,用于利用所述召回模型中的所述FM模型对所述样本进行训练,得到第二用户侧特征和第二商品侧特征;
特征级联模块,用于对所述第一用户侧特征和所述第二用户侧特征级联得到第一特征结果,对所述第一商品侧特征和所述第二商品侧特征级联得到第二特征结果;其中,所述第一特征结果和所述第二特征结果均为一维向量;
相似分计算模块,用于根据所述第一特征结果和所述第二特征结果确定所述样本的相似分序列;所述相似分序列包含从大到小排列的相似分;
召回模块,用于利用向量检索库召回相似分序列中前预设数量的商品。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的商品召回方法的步骤。
10.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1-7任一项所述的商品召回方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111485421.4A CN114119050A (zh) | 2021-12-07 | 2021-12-07 | 一种商品召回方法、商品召回系统及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111485421.4A CN114119050A (zh) | 2021-12-07 | 2021-12-07 | 一种商品召回方法、商品召回系统及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114119050A true CN114119050A (zh) | 2022-03-01 |
Family
ID=80367373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111485421.4A Pending CN114119050A (zh) | 2021-12-07 | 2021-12-07 | 一种商品召回方法、商品召回系统及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114119050A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676851A (zh) * | 2022-04-08 | 2022-06-28 | 中国科学技术大学 | 召回和排序模型的联合训练方法、设备和存储介质 |
CN114723084A (zh) * | 2022-04-27 | 2022-07-08 | 北京沃东天骏信息技术有限公司 | 新颖性物品召回模型的生成方法、召回方法及装置和系统 |
-
2021
- 2021-12-07 CN CN202111485421.4A patent/CN114119050A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676851A (zh) * | 2022-04-08 | 2022-06-28 | 中国科学技术大学 | 召回和排序模型的联合训练方法、设备和存储介质 |
CN114676851B (zh) * | 2022-04-08 | 2024-03-29 | 中国科学技术大学 | 召回和排序模型的联合训练方法、设备和存储介质 |
CN114723084A (zh) * | 2022-04-27 | 2022-07-08 | 北京沃东天骏信息技术有限公司 | 新颖性物品召回模型的生成方法、召回方法及装置和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111460249B (zh) | 一种基于学习者偏好建模的个性化学习资源推荐方法 | |
Kotu et al. | Data science: concepts and practice | |
CN110717098B (zh) | 基于元路径的上下文感知用户建模方法、序列推荐方法 | |
CN109087178B (zh) | 商品推荐方法和装置 | |
Martino | A review of selected recent advances in technological forecasting | |
Kadoić et al. | Integrating the DEMATEL with the analytic network process for effective decision-making | |
CN111475637B (zh) | 用于推送知识点的数据处理、训练方法及装置 | |
Mimis et al. | Property valuation with artificial neural network: the case of Athens | |
EP2960849A1 (en) | Method and system for recommending an item to a user | |
CN110533974A (zh) | 一种智能组卷方法、系统和计算机可读存储介质 | |
CN112667877A (zh) | 一种基于旅游知识图谱的景点推荐方法及设备 | |
CN114119050A (zh) | 一种商品召回方法、商品召回系统及相关装置 | |
CN102737120A (zh) | 一种个性化网络学习资源推荐方法 | |
Louati et al. | Price forecasting for real estate using machine learning: A case study on Riyadh city | |
Zhong et al. | Design of a personalized recommendation system for learning resources based on collaborative filtering | |
CN114358657B (zh) | 一种基于模型融合的岗位推荐方法及装置 | |
CN114169869B (zh) | 一种基于注意力机制的岗位推荐方法及装置 | |
Garanayak et al. | An automated recommender system for educational institute in India | |
Rahmanita et al. | Model multi criteria decision making with fuzzy ANP method for performance measurement small medium enterprise (SME) | |
Yucel et al. | Sequential hierarchical regression imputation | |
Gasmi et al. | Context-aware based evolutionary collaborative filtering algorithm | |
Muzdybayeva et al. | A matrix factorization-based collaborative filtering framework for course recommendations in higher education | |
Baig et al. | Data Science for Marketing Analytics: A practical guide to forming a killer marketing strategy through data analysis with Python | |
CN110956528B (zh) | 一种电商平台的推荐方法及系统 | |
CN114429384A (zh) | 基于电商平台的产品智能推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |