CN112085058A - 一种对象组合召回方法、装置、电子设备及存储介质 - Google Patents
一种对象组合召回方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112085058A CN112085058A CN202010780347.8A CN202010780347A CN112085058A CN 112085058 A CN112085058 A CN 112085058A CN 202010780347 A CN202010780347 A CN 202010780347A CN 112085058 A CN112085058 A CN 112085058A
- Authority
- CN
- China
- Prior art keywords
- user
- feature vector
- combination
- recommended
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000013598 vector Substances 0.000 claims abstract description 511
- 238000012549 training Methods 0.000 claims description 153
- 238000012512 characterization method Methods 0.000 claims description 51
- 230000006399 behavior Effects 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 11
- 230000000875 corresponding effect Effects 0.000 description 122
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000019640 taste Nutrition 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种对象组合召回方法、装置、电子设备及存储介质,该方法包括:接收目标用户通过目标终端发送的用户搜索请求;确定目标用户标识对应的目标用户特征向量;基于目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量;计算目标用户特征向量与每个对象组合特征向量的相似度,并召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合。可见,用户特征向量能够表征用户的多个兴趣点,对象特征向量具有跨地点泛化能力,同时覆盖度也较高,从而所确定的对象组合特征向量的准确度较高,可以使得所召回的待推荐对象组合的准确度更高,更能满足用户需求。
Description
技术领域
本申请涉及信息推荐技术领域,特别是涉及一种对象组合召回方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的快速发展,越来越多的对象如菜品能够借由对象推荐系统被推送给用户。具体的,对象推荐系统为用户推荐对象的过程大致分为召回阶段和排序阶段。召回阶段利用召回算法选取用户可能感兴趣对象的对象候选集,排序阶段为从对象候选集中选取用户可能最感兴趣的对象,并作为推荐结果。
相关技术中,召回阶段通常是以单个对象为单位进行召回,而实际应用中,可能存在同时召回多个对象即对象组合的场景。例如,以菜品推荐为例,商家可以为用户推荐菜品套餐即菜品组合,此时,需要召回多个菜品作为菜品组合。
然而,由于对象组合相对于单个对象来说,是由多个对象组合而成的,因此,对象组合通常有很多种。采用传统的召回单个对象的方式,所召回的对象组合的准确性较低,从而导致为用户推荐的对象组合准确度较低。
发明内容
为解决背景技术记载的技术问题,本申请示出了一种对象组合召回方法、装置、电子设备及存储介质。
第一方面,本申请实施例提供了一种对象组合召回方法,应用于电子设备,所述方法包括:
接收目标用户通过目标终端发送的用户搜索请求,所述用户搜索请求携带所述目标用户的目标用户标识;
确定所述目标用户标识对应的目标用户特征向量,所述目标用户特征向量为对目标用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类所得到的,一个对象的对象特征向量是对该对象的预定对象名称和/或对象标识进行转化所得的;
基于所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量,一个待推荐对象的对象特征向量是对该推荐对象的预定对象名称和/或对象标识进行转化所得的;
计算所述目标用户特征向量与每个所述对象组合特征向量的相似度,并召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合。
可选的,所述基于所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量,包括:
计算所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量的相似度;
对于每一待推荐对象,将该待推荐对象对应的相似度确定为该待推荐对象对应的权重;
对于每一待推荐对象组合,将该待推荐对象组合中各个待推荐对象的对象特征向量与对应的权重进行加权求和,得到该待推荐对象组合对应的对象组合特征向量。
可选的,所述目标用户特征向量和所述各个待推荐对象的对象特征向量是在得到训练好的特征获取模型时所保存的,其中,所述特征获取模型包括:对象表征层,用户表征层,对象组合表征层和全连接层;
训练所述特征获取模型的过程,包括:
对于对象组合训练数据中的每一训练对象,将该训练对象的预定对象名称和/或对象标识输入所述对象表征层,得到该训练对象的对象特征向量;
将各个用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,得到所述各个用户的用户标识对应的用户特征向量;
将所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,得到所述对象组合训练数据对应的对象组合特征向量;
将所述各个用户的用户标识对应的用户特征向量与所述对象组合特征向量输入到所述全连接层中,对特征获取模型进行训练;
在所述特征获取模型对应的损失函数值小于预设阈值时,得到训练好的特征获取模型,并保存所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量。
可选的,所述将各个用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,得到所述各个用户的用户标识对应的用户特征向量,包括:
对于每一用户,将该用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,以使得所述用户表征层对所述各个训练对象的对象特征向量进行聚类,得到多个对象特征向量类簇,并将所述多个对象特征向量类簇的中心点确定为该用户的用户标识对应的用户特征向量。
可选的,所述将所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,得到所述对象组合训练数据对应的对象组合特征向量,包括:
将所述各个用户对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,以使得所述对象组合表征层执行如下步骤:
将各个训练对象的对象特征向量与所述对象组合表征层的权重向量相乘,得到各个训练对象的加权后的对象特征向量,其中,所述权重向量为所述特征获取模型的模型参数;
计算所述各个用户对应的用户特征向量与各个训练对象的加权后的对象特征向量的相似度,并将每个训练对象的加权后的对象特征向量对应的相似度确定为该加权后的对象特征向量对应的权重;
将所述各个训练对象的加权后的对象特征向量与对应的权重进行加权求和,得到所述对象组合训练数据对应的对象组合特征向量。
可选的,在得到所述训练好的特征获取模型时所保存的各个待推荐对象的对象特征向量为所述各个待推荐对象的加权后的对象特征向量。
第二方面,本申请实施例提供了一种对象组合召回装置,应用于电子设备,所述装置包括:
搜索请求接收模块,用于接收目标用户通过目标终端发送的用户搜索请求,所述用户搜索请求携带所述目标用户的目标用户标识;
第一用户特征向量确定模块,用于确定所述目标用户标识对应的目标用户特征向量,所述目标用户特征向量为对目标用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类所得到的,一个对象的对象特征向量是对该对象的预定对象名称和/或对象标识进行转化所得的;
第一对象组合特征向量确定模块,用于基于所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量,一个待推荐对象的对象特征向量是对该推荐对象的预定对象名称和/或对象标识进行转化所得的;
对象组合召回模块,用于计算所述目标用户特征向量与每个所述对象组合特征向量的相似度,并召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合。
可选的,所述对象组合特征向量确定模块,具体用于:
计算所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量的相似度;
对于每一待推荐对象,将该待推荐对象对应的相似度确定为该待推荐对象对应的权重;
对于每一待推荐对象组合,将该待推荐对象组合中各个待推荐对象的对象特征向量与对应的权重进行加权求和,得到该待推荐对象组合对应的对象组合特征向量。
可选的,所述目标用户特征向量和所述各个待推荐对象的对象特征向量是在得到训练好的特征获取模型时所保存的,其中,所述特征获取模型包括:对象表征层,用户表征层,对象组合表征层和全连接层;
所述装置还包括:
对象特征向量模块,用于对于对象组合训练数据中的每一训练对象,将该训练对象的预定对象名称和/或对象标识输入所述对象表征层,得到该训练对象的对象特征向量;
第二用户特征向量确定模块,用于将各个用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,得到所述各个用户的用户标识对应的用户特征向量;
第二对象组合特征向量确定模块,用于将所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,得到所述对象组合训练数据对应的对象组合特征向量;
特征向量输入模块,用于将所述各个用户的用户标识对应的用户特征向量与所述对象组合特征向量输入到所述全连接层中,对特征获取模型进行训练;
特征向量保存模块,用于在所述特征获取模型对应的损失函数值小于预设阈值时,得到训练好的特征获取模型,并保存所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量。
可选的,所述特征向量输入模块,具体用于:
对于每一用户,将该用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,以使得所述用户表征层对所述各个训练对象的对象特征向量进行聚类,得到多个对象特征向量类簇,并将所述多个对象特征向量类簇的中心点确定为该用户的用户标识对应的用户特征向量。
可选的,所述第二对象组合特征向量确定模块,具体用于:
将所述各个用户对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,以使得所述对象组合表征层执行如下步骤:
将各个训练对象的对象特征向量与所述对象组合表征层的权重向量相乘,得到各个训练对象的加权后的对象特征向量,其中,所述权重向量为所述特征获取模型的模型参数;
计算所述各个用户对应的用户特征向量与各个训练对象的加权后的对象特征向量的相似度,并将每个训练对象的加权后的对象特征向量对应的相似度确定为该加权后的对象特征向量对应的权重;
将所述各个训练对象的加权后的对象特征向量与对应的权重进行加权求和,得到所述对象组合训练数据对应的对象组合特征向量。
可选的,在得到所述训练好的特征获取模型时所保存的各个待推荐对象的对象特征向量为所述各个待推荐对象的加权后的对象特征向量。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的对象组合召回方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的对象组合召回方法的步骤。
通过本申请实施例提供的技术方案,电子设备在召回对象组合时,通过用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类,得到用户对应的用户特征向量,因此,所得到的用户特征向量能够表征用户的多个兴趣点。并且,对象特征向量是对预定对象名称和/或对象标识进行转化得到的,因此,转化所得的对象特征向量具有跨地点泛化能力,同时覆盖度也较高,从而所确定的对象组合特征向量的准确度较高。通过召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合,可以使得所召回的待推荐对象组合的准确度更高,更能满足用户需求。
附图说明
图1是本申请实施例提供的一种对象组合召回方法的步骤流程图;
图2是本申请实施例所提供的一种特征获取模型训练过程的步骤流程图;
图3为本申请实施例所提供的特征获取模型训练过程的示意图;
图4是本申请实施例提供的一种对象组合召回装置的结构框图;
图5是本申请实施例提供的一种电子设备的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
推荐技术是接收到用户请求到返回推荐结果的一整套技术。通常情况下,可以将推荐过程分为两个阶段,分别为召回阶段和排序阶段。
召回阶段是通过机器学习算法,得到用户可能喜欢的对象候选集,其中,对象候选集中的对象可能还是菜品、商品等,这都是合理的。排序阶段则是基于召回阶段所召回的对象候选集,计算并返回最终的推荐结果。
召回阶段存在的意义在于:在精排阶段的性能受限的情况下,尽可能把用户可能喜欢的对象加入对象候选集中。
相关技术中,召回阶段通常是以单个对象为单位进行召回。而实际应用中,可能存在同时召回多个对象即对象组合的场景。
下面以对象组合为菜品组合即套餐为例进行说明。
套餐召回是指从限定地域范围的可售套餐中,使用机器学习算法筛选出用户可能喜欢的套餐,从而降低套餐候选集的数量,提高后续排序阶段的效率。
然而,套餐召回方法与相关技术中单个对象的召回方法不同。套餐召回方法具有如下特点:
1.、套餐召回结果受配送范围影响。具体的,受配送距离、时长等限制,导致套餐候选集和用户所在地强相关。
2、套餐召回是以多种菜品作为一个组合来进行召回的。
由于套餐组合具有上述特征,因此,采用传统的召回单个对象的方式,无法召回用户喜欢的套餐,进而为用户推荐的套餐不能满足用户的需求。主要的问题包括:
1、套餐召回场景存在跨地域挑战。具体的,相关技术中使用的是全局的对象,例如全国的可售商品。而在和位置强相关的套餐召回场景,当用户出现位置转移,需要在召回阶段将用户在其他地方的行为泛化到当前位置。
2、套餐候选集巨大,从而导致用户行为稀疏。具体的,已有的召回技术只针对单个对象,例如以单个菜品为单位召回。而在套餐召回中,菜品组合的可选范围要远大于单个菜品,从而导致用户行为很稀疏。因此,将现有的召回技术套用到套餐召回场景中,达不到泛化的要求。
3、已有的召回技术不需要考虑单个菜品之间的搭配问题。套餐召回时,套餐的搭配需要满足一定的合理性和用户偏好,不能在召回菜品的基础上做简单的运算。
4、现有的召回技术,对用户做了统一的表征。例如,表征学习中只生成单个用户向量。但是,在实际应用中,用户行为可能存在多个兴趣点,因此,只生成单个用户向量可能会导致用户兴趣出现偏差。
由上述描述可知,采用传统的召回单个对象的方式,无法召回用户喜欢的对象组合,因此,本申请实施例提供了一种对象组合召回方法、装置、电子设备及存储介质。
第一方面,首先对本申请实施例提供的一种对象组合召回方法进行详细介绍。
需要说明的是,本申请实施例所提供的一种对象组合召回方法的执行主体可以为一种对象组合召回装置,该对象组合召回装置运行于电子设备中,该电子设备可以是服务器等,本申请实施例对电子设备不做具体限定。
如图1所示,本申请实施例所提供的一种对象组合召回方法,具体可以包括如下步骤:
S110,接收目标用户通过目标终端发送的用户搜索请求。
其中,用户搜索请求携带目标用户的目标用户标识。
具体的,当目标用户想要获取对象组合如套餐时,目标用户可以通过目标终端向服务器发送用户搜索请求,该用户搜索请求可以携带目标用户的目标用户标识,如目标用户的用户ID等。
S120,确定目标用户标识对应的目标用户特征向量。
其中,目标用户特征向量为对目标用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类所得到的,一个对象的对象特征向量是对该对象的预定对象名称和/或对象标识进行转化所得的。
本申请实施例所提到的对象可以是菜品等,本申请实施例对对象不做具体限定。在对象为菜品时,对象的预定对象名称可以为标准菜品名,该标准菜品名可以体现菜品的食材、口味以及做法等菜品信息。对于不同位置的两个菜品,具有相同的标准菜品名,从而消除了菜品位置不同带来的影响。但是,考虑到标准菜品名的覆盖度较低,即有些菜品的名称不是标准菜品名。因此,在确定对象的对象特征向量时,还可以利用到菜品的菜品标识,也就是说,还可以获取加入没有标准菜品名的菜品的菜品ID,其中,菜品ID可以为商家为菜品所设定的菜品编号等。
在确定目标用户特征向量时,可以通过word2vector模型对目标用户的用户历史行为数据所包括的多个对象的的预定对象名称和/或对象标识进行转化,得到每个对象的对象特征向量,可见,所得的对象特征向量具有跨地点泛化能力,同时覆盖度也较高。
在确定目标用户特征向量时,可以对所得的多个对象的对象特征向量进行聚类,得到多个对象特征向量类簇。每个对象特征向量类簇具有中心点,可以将这多个对象特征向量向量类簇的中心点确定为目标用户特征向量。可见,所得到的目标用户特征向量是一组向量,而不是一个向量,因此,目标用户特征向量可以准确地表征用户的多个兴趣点。
S130,基于目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量。
其中,一个待推荐对象的对象特征向量是对该推荐对象的预定对象名称和/或对象标识进行转化所得的。
具体的,为了准确地确定每个待推荐对象组合对应的对象组合特征向量,可以基于目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量。
在一种实施方式中,S130,基于目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量,可以包括如下步骤,分别为步骤a1~步骤a3:
步骤a1,计算目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量的相似度。
具体的,对于每一待推荐对象组合,可以计算目标用户特征向量与该待推荐对象组合中各个待推荐对象的对象特征向量之间的余弦相似度。
步骤a2,对于每一待推荐对象,将该待推荐对象对应的相似度确定为该待推荐对象对应的权重。
具体的,在计算目标用户特征向量与各个待推荐对象的对象特征向量之间的余弦相似度之后,对于每一待推荐对象,可以将该待推荐对象对应的相似度确定为该待推荐对象对应的权重。
步骤a3,对于每一待推荐对象组合,将该待推荐对象组合中各个待推荐对象的对象特征向量与对应的权重进行加权求和,得到该待推荐对象组合对应的对象组合特征向量。
具体的,通过将待推荐对象组合中各个待推荐对象的对象特征向量与对应的权重进行加权求和,得到待推荐对象组合对应的对象组合特征向量。可以实现通过用户特征向量和菜品特征向量的相似度权重来区分不同用户对同一套餐的不同喜好。
S140,计算目标用户特征向量与每个对象组合特征向量的相似度,并召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合。
具体的,在得到目标用户特征向量与每个对象组合特征向量之后,可以计算目标用户特征向量与每个对象组合特征向量的余弦相似度。可以理解的是,目标用户特征向量与一个对象组合的对象组合特征向量的相似度越大,说明目标用户对该对象组合感兴趣的概率越大;目标用户特征特征向量与一个对象组合的对象组合特征向量的相似度越小,说明目标用户对该对象组合感兴趣的概率越小。因此,可以召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合,这样,所召回的待推荐对象组合是用户感兴趣的对象组合的概率较高。
其中,预设相似度的大小可以根据实际情况进行确定,本申请实施例对预设相似度的大小不做具体限定。
通过本申请实施例提供的技术方案,电子设备在召回对象组合时,通过用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类,得到用户对应的用户特征向量,因此,所得到的用户特征向量能够表征用户的多个兴趣点。并且,对象特征向量是对预定对象名称和/或对象标识进行转化得到的,因此,转化所得的对象特征向量具有跨地点泛化能力,同时覆盖度也较高,从而所确定的对象组合特征向量的准确度较高。通过召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合,可以使得所召回的待推荐对象组合的准确度更高,更能满足用户需求。
在实际应用中,一种实施方式中,目标用户特征向量和各个待推荐对象的对象特征向量是在得到训练好的特征获取模型时所保存的。这样,在召回对象组合时,可以直接在数据库中查找目标用户特征向量和各个待推荐对象的对象特征向量,从而可以提高对象组合的召回效率。
其中,特征获取模型包括:对象表征层,用户表征层,对象组合表征层和全连接层;
训练特征获取模型的过程,如图2所示,可以包括如下步骤:
S210,对于对象组合训练数据中的每一训练对象,将该训练对象的预定对象名称和/或对象标识输入对象表征层,得到该训练对象的对象特征向量。
具体的,在训练特征获取模型时,需要采集大量的对象组合训练数据,每个对象组合训练数据中可以包括多个训练对象。并且,为了解决跨地域泛化问题,可以获取训练对象的预定对象名称,以对象为菜品为例,该预定对象名称可以为标准菜品名,该标准菜品名可以体现菜品的食材、口味以及做法等菜品信息。对于不同位置的两个菜品,具有相同的标准菜品名,那么,特征获取模型在学习的时候,就会把这两个菜品当一个菜品学习,从而消除了菜品位置不同带来的影响。
但是,考虑到标准菜品名的覆盖度较低,即有些菜品的名称不是标准菜品名。因此,还可以获取训练对象的对象标识,也就是说,还可以获取加入没有标准菜品名的菜品的菜品ID,其中,菜品ID可以为商家为菜品所设定的菜品编号等。
由上述描述可知,通过获取训练对象的预定对象名称以及对象标识,可以提高菜品表征的覆盖度,同时,能把跨地域泛化能力泛化到没有标准菜品名的菜品。
在获取到对象组合训练数据所包括的各个训练对象的预定对象名称和/或对象标识之后,可以将各个训练对象的预定对象名称和/或对象标识输入到对象表征层中,该对象表征层可以为word2vector模型,得到各个训练对象的对象特征向量,该对象特征向量具有跨地点泛化能力,同时覆盖度也较高。
S220,将各个用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入用户表征层,得到各个用户的用户标识对应的用户特征向量。
为了解决用户兴趣发散的问题,在得到各个训练对象的对象特征向量之后,可以将各个训练对象的对象特征向量输入用户表征层,用户表征层使用聚类算法将用户历史行为数据所包括的各个训练对象的对象特征向量聚合成类簇,抽取每个类簇的中心点作为各个用户的用户标识对应的用户特征向量。
作为本申请实施例的一种实现方式,S220,可以包括如下步骤:
对于每一用户,将该用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入用户表征层,以使得用户表征层对各个训练对象的对象特征向量进行聚类,得到多个对象特征向量类簇,并将多个对象特征向量类簇的中心点确定为该用户的用户标识对应的用户特征向量。
在该实施方式中,在确定一个用户对应的用户特征向量时,可以对该用户有历史行为的训练对象的对象特征向量进行聚类,得到多个对象特征向量类簇。每个对象特征向量类簇具有中心点,可以将这多个对象特征向量向量类簇的中心点确定为该用户的用户标识对应的用户特征向量。
由上述描述可知,通过本实施方式提供的技术方案,所得到的用户特征向量为多个,而不是一个,进而可以准确地表征用户的多个兴趣点。
S230,将各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量输入对象组合表征层,得到对象组合训练数据对应的对象组合特征向量。
具体的,在得到各个用户的用户标识对应的用户特征向量,以及对象组合训练数据中各个训练对象的对象特征向量后,可以将各个用户的用户标识对应的用户特征向量和各个训练对象的对象特征向量输入对象组合表征层,以得到用于表征对象组合训练数据的对象组合特征向量。
作为本申请实施例的一种实现方式,S230,可以包括如下步骤:
将各个用户对应的用户特征向量与各个训练对象的对象特征向量输入对象组合表征层,以使得对象组合表征层执行如下步骤,分别为步骤b1至步骤b3:
步骤b1,将各个训练对象的对象特征向量与对象组合表征层的权重向量相乘,得到各个训练对象的加权后的对象特征向量。
其中,权重向量为特征获取模型的模型参数。得到各个训练对象的对象特征向量后,对于每个训练对象的对象特征向量,可以将该训练对象的对象特征向量与权重向量进行相乘,得到该训练对象的加权后的对象特征向量。
举例而言,对象特征向量为菜品特征向量,权重向量为Wq,Wk及Wv。首先,对菜品特征向量分别乘以权重向量Wq,Wk以及Wv,得到三个向量,分别为Vq,Vk以及Vv;然后,将Vq和Vk相乘、列归一化得到相似度矩阵SimilarityMatrix;最后,将Vv和SimilarityMatrix相乘,得到带有全局信息的菜品特征向量,即得到加权后的对象特征向量。
步骤b2,计算各个用户对应的用户特征向量与各个训练对象的加权后的对象特征向量的相似度,并将每个训练对象的加权后的对象特征向量对应的相似度确定为该加权后的对象特征向量对应的权重。
具体的,可以计算用户特征向量和各个训练对象的加权后的对象特征向量的余弦相似度,得到各个训练对象的加权后的对象特征向量的权重。
步骤b3,将各个训练对象的加权后的对象特征向量与对应的权重进行加权求和,得到对象组合训练数据对应的对象组合特征向量。
具体的,在得到各个训练对象的加权后的对象特征向量与对应的权重之后,可以将各个训练对象的加权后的对象特征向量与对应的权重进行加权求和,得到对象组合训练数据对应的对象组合特征向量。以通过用户特征向量和对象特征向量的相似度权重,来区分不同用户对同一对象组合的不同喜好程度。
S240,将各个用户的用户标识对应的用户特征向量与对象组合特征向量输入到全连接层中,对特征获取模型进行训练。
具体的,在得到用户的用户标识对应的用户特征向量与对象组合特征向量之后,可以将用户的用户标识对应的用户特征向量与对象组合特征向量拼接后输入到全连接层网络中,对特征获取模型进行训练。可以理解的是,全连接层在特征获取模型中起到分类器的作用。
S250,在特征获取模型对应的损失函数值小于预设阈值时,得到训练好的特征获取模型,并保存各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量。
具体的,在特征获取模型对应的损失函数值小于预设阈值时,说明特征获取模型所提取的用户的用户标识对应的用户特征向量,以及各个训练对象的对象特征向量较为准确,此时,可以得到训练后的特征获取模型,并保存用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量。以在后续步骤中,在接收到目标用户通过目标终端发送的用户搜索请求时,可以根据用户搜索请求所携带的目标用户标识对应的目标用户特征向量,以及待推荐对象组合中各个待推荐对象的对象特征向量来为目标用户推荐对象组合。
可见,通过本申请实施例提供的技术方案,在训练特征获取模型时,获取对象组合训练所包括的各个训练对象的预定对象特征和/或对象标识,并将各个训练对象的预定对象特征和/或对象标识转化成对象特征向量,转化所得的对象特征向量具有跨地点泛化能力,同时覆盖度也较高。并且,通过用户的用户历史行为数据所包括的训练对象的对象特征向量,确定用户对应的用户特征向量,所得到的用户特征向量能够表征用户的多个兴趣点。从而后续基于用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量为用户推荐的对象组合更加准确,更能满足用户需求。
并且,由上述描述可知,在将对象特征向量与权重向量进行加权计算后,所得到的加权的对象特征向量带有全局信息,因此,在一种实施方式中,
在得到训练好的特征获取模型时所保存的各个待推荐对象的对象特征向量为各个待推荐对象的加权后的对象特征向量。
举例而言,对象特征向量为菜品特征向量,权重向量为Wq,Wk及Wv。首先,对菜品特征向量分别乘以权重向量Wq,Wk以及Wv,得到三个向量,分别为Vq,Vk以及Vv;然后,将Vq和Vk相乘、列归一化得到相似度矩阵SimilarityMatrix;最后,将Vv和SimilarityMatrix相乘,得到带有全局信息的菜品特征向量。在得到训练好的特征获取模型时,可以保存带有全局信息的菜品特征向量,从而后续基于用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量为用户推荐的对象组合更加准确,更能满足用户需求。
为了方案描述清楚,下面将结合具体实例对本申请实施例所提供的特征获取模型训练过程进行说明。该具体实例中对象组合为菜品组合。
图3为本申请实施例所提供的特征获取模型训练过程的示意图。
从图3可以看出,特征获取模型主要包括4个层。
具体的,最底层为菜品表征层。为了解决跨地域泛化问题,使用标准菜品名,如图3所示的标准菜品名X1,标准菜品名X2,……,标准菜品名Xn。但标准菜品名的覆盖度较低,即有些菜品没有标准菜品名。所以在标准菜品名数据中,加入没有标准菜品名的菜品ID。并将标准菜品名和菜品ID输入到Word2Vector,得到菜品的菜品特征向量。这样,就能提高菜品表征的覆盖度,同时能把跨地域泛化能力泛化到没有标准菜品名的菜品上。
中间左半边为用户表征层。具体的,为了解决用户兴趣发散的问题,使用聚类算法将用户有行为的菜品的菜品特征向量聚合成类簇,得到如图3所示的类簇1、类簇2、……、类簇N,并抽取每个类簇的中心点,作为用户的用户特征向量。
中间右半边为套餐表征层。具体的,为了解决套餐内部菜品之间的搭配合理性问题,首先对套餐内的菜品特征向量1、…、菜品特征向量N使用自适应注意力机制技术,通过生成自相似矩阵对菜品表征向量1、…、菜品特征向量N做变换,得到具有全局信息的加权后的菜品特征向量1、…、加权后的菜品特征向量N。即将菜品表征层输出的菜品特征向量与Wq,Wk及Wv相乘,得到三个向量,分别为Vq,Vk以及Vv;然后,将Vq和Vk相乘、列归一化得到相似度矩阵SimilarityMatrix;最后,将Vv和SimilarityMatrix相乘,得到带有全局信息的菜品特征向量。
并且,由于不同用户对套餐内的菜品喜好不同,使用自适应注意力机制融合变换得到的加权后的的菜品特征向量1、…、加权后的的菜品特征向量N,得到带有用户偏好的套餐向量。具体的,通过兴趣单元分别计算用户特征向量和加权后的菜品特征向量1、…、加权后的菜品特征向量N的余弦相似度,分别得到加权后的菜品特征向量1、…、加权后的菜品特征向量N对应的权重,再通过池化单元将加权后的菜品特征向量1、…、加权后的菜品特征向量N与对应的权重进行加权求和计算,得到套餐特征向量。从而通过用户特征向量和菜品特征向量的相似度权重,来区分不同用户对同一套餐的不同喜好。
最上层是全连接层网络。具体的,拼接用户特征向量和套餐特征向量,使用全连接层网络进行训练,并使用全连接层反向传播技术更新自适应注意力机制的权重向量,即更新Wq,Wk,Wv。
在训练好特征提取模型之后,保存用户的用户特征向量,以及加权后的菜品特征向量1、…、加权后的菜品特征向量N。从而后续基于用户对应的用户特征向量与加权后的菜品特征向量1…、加权后的菜品特征向量N所召回的待推荐对象组合更加准确,更能满足用户需求。
第二方面,本申请实施例提供了一种对象组合召回装置,应用于电子设备,如图4所示,所述装置包括:
搜索请求接收模块410,用于接收目标用户通过目标终端发送的用户搜索请求,所述用户搜索请求携带所述目标用户的目标用户标识;
第一用户特征向量确定模块420,用于确定所述目标用户标识对应的目标用户特征向量,所述目标用户特征向量为对目标用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类所得到的,一个对象的对象特征向量是对该对象的预定对象名称和/或对象标识进行转化所得的;
第一对象组合特征向量确定模块430,用于基于所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量,一个待推荐对象的对象特征向量是对该推荐对象的预定对象名称和/或对象标识进行转化所得的;
对象组合召回模块440,用于计算所述目标用户特征向量与每个所述对象组合特征向量的相似度,并召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合。
通过本申请实施例提供的技术方案,电子设备在召回对象组合时,通过用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类,得到用户对应的用户特征向量,因此,所得到的用户特征向量能够表征用户的多个兴趣点。并且,对象特征向量是对预定对象名称和/或对象标识进行转化得到的,因此,转化所得的对象特征向量具有跨地点泛化能力,同时覆盖度也较高,从而所确定的对象组合特征向量的准确度较高。通过召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合,可以使得所召回的待推荐对象组合的准确度更高,更能满足用户需求。
可选的,所述对象组合特征向量确定模块,具体用于:
计算所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量的相似度;
对于每一待推荐对象,将该待推荐对象对应的相似度确定为该待推荐对象对应的权重;
对于每一待推荐对象组合,将该待推荐对象组合中各个待推荐对象的对象特征向量与对应的权重进行加权求和,得到该待推荐对象组合对应的对象组合特征向量。
可选的,所述目标用户特征向量和所述各个待推荐对象的对象特征向量是在得到训练好的特征获取模型时所保存的,其中,所述特征获取模型包括:对象表征层,用户表征层,对象组合表征层和全连接层;
所述装置还包括:
对象特征向量模块,用于对于对象组合训练数据中的每一训练对象,将该训练对象的预定对象名称和/或对象标识输入所述对象表征层,得到该训练对象的对象特征向量;
第二用户特征向量确定模块,用于将各个用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,得到所述各个用户的用户标识对应的用户特征向量;
第二对象组合特征向量确定模块,用于将所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,得到所述对象组合训练数据对应的对象组合特征向量;
特征向量输入模块,用于将所述各个用户的用户标识对应的用户特征向量与所述对象组合特征向量输入到所述全连接层中,对特征获取模型进行训练;
特征向量保存模块,用于在所述特征获取模型对应的损失函数值小于预设阈值时,得到训练好的特征获取模型,并保存所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量。
可选的,所述特征向量输入模块,具体用于:
对于每一用户,将该用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,以使得所述用户表征层对所述各个训练对象的对象特征向量进行聚类,得到多个对象特征向量类簇,并将所述多个对象特征向量类簇的中心点确定为该用户的用户标识对应的用户特征向量。
可选的,所述第二对象组合特征向量确定模块,具体用于:
将所述各个用户对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,以使得所述对象组合表征层执行如下步骤:
将各个训练对象的对象特征向量与所述对象组合表征层的权重向量相乘,得到各个训练对象的加权后的对象特征向量,其中,所述权重向量为所述特征获取模型的模型参数;
计算所述各个用户对应的用户特征向量与各个训练对象的加权后的对象特征向量的相似度,并将每个训练对象的加权后的对象特征向量对应的相似度确定为该加权后的对象特征向量对应的权重;
将所述各个训练对象的加权后的对象特征向量与对应的权重进行加权求和,得到所述对象组合训练数据对应的对象组合特征向量。
可选的,在得到所述训练好的特征获取模型时所保存的各个待推荐对象的对象特征向量为所述各个待推荐对象的加权后的对象特征向量。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
第三方面,本申请实施例提供了一种电子设备,如图5所示,包括存储器510、处理器520及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的对象组合召回方法的步骤。
通过本申请实施例提供的技术方案,电子设备在召回对象组合时,通过用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类,得到用户对应的用户特征向量,因此,所得到的用户特征向量能够表征用户的多个兴趣点。并且,对象特征向量是对预定对象名称和/或对象标识进行转化得到的,因此,转化所得的对象特征向量具有跨地点泛化能力,同时覆盖度也较高,从而所确定的对象组合特征向量的准确度较高。通过召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合,可以使得所召回的待推荐对象组合的准确度更高,更能满足用户需求。
第六方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的对象组合召回方法的步骤。
通过本申请实施例提供的技术方案,电子设备在召回对象组合时,通过用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类,得到用户对应的用户特征向量,因此,所得到的用户特征向量能够表征用户的多个兴趣点。并且,对象特征向量是对预定对象名称和/或对象标识进行转化得到的,因此,转化所得的对象特征向量具有跨地点泛化能力,同时覆盖度也较高,从而所确定的对象组合特征向量的准确度较高。通过召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合,可以使得所召回的待推荐对象组合的准确度更高,更能满足用户需求。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作并不一定是本申请所必须的。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种对象组合召回方法、装置、电子设备及存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (14)
1.一种对象组合召回方法,其特征在于,应用于电子设备,所述方法包括:
接收目标用户通过目标终端发送的用户搜索请求,所述用户搜索请求携带所述目标用户的目标用户标识;
确定所述目标用户标识对应的目标用户特征向量,所述目标用户特征向量为对目标用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类所得到的,一个对象的对象特征向量是对该对象的预定对象名称和/或对象标识进行转化所得的;
基于所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量,一个待推荐对象的对象特征向量是对该推荐对象的预定对象名称和/或对象标识进行转化所得的;
计算所述目标用户特征向量与每个所述对象组合特征向量的相似度,并召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量,包括:
计算所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量的相似度;
对于每一待推荐对象,将该待推荐对象对应的相似度确定为该待推荐对象对应的权重;
对于每一待推荐对象组合,将该待推荐对象组合中各个待推荐对象的对象特征向量与对应的权重进行加权求和,得到该待推荐对象组合对应的对象组合特征向量。
3.根据权利要求1或2所述的方法,其特征在于,所述目标用户特征向量和所述各个待推荐对象的对象特征向量是在得到训练好的特征获取模型时所保存的,其中,所述特征获取模型包括:对象表征层,用户表征层,对象组合表征层和全连接层;
训练所述特征获取模型的过程,包括:
对于对象组合训练数据中的每一训练对象,将该训练对象的预定对象名称和/或对象标识输入所述对象表征层,得到该训练对象的对象特征向量;
将各个用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,得到所述各个用户的用户标识对应的用户特征向量;
将所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,得到所述对象组合训练数据对应的对象组合特征向量;
将所述各个用户的用户标识对应的用户特征向量与所述对象组合特征向量输入到所述全连接层中,对特征获取模型进行训练;
在所述特征获取模型对应的损失函数值小于预设阈值时,得到训练好的特征获取模型,并保存所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量。
4.根据权利要求3所述的方法,其特征在于,所述将各个用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,得到所述各个用户的用户标识对应的用户特征向量,包括:
对于每一用户,将该用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,以使得所述用户表征层对所述各个训练对象的对象特征向量进行聚类,得到多个对象特征向量类簇,并将所述多个对象特征向量类簇的中心点确定为该用户的用户标识对应的用户特征向量。
5.根据权利要求3的方法,其特征在于,所述将所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,得到所述对象组合训练数据对应的对象组合特征向量,包括:
将所述各个用户对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,以使得所述对象组合表征层执行如下步骤:
将各个训练对象的对象特征向量与所述对象组合表征层的权重向量相乘,得到各个训练对象的加权后的对象特征向量,其中,所述权重向量为所述特征获取模型的模型参数;
计算所述各个用户对应的用户特征向量与各个训练对象的加权后的对象特征向量的相似度,并将每个训练对象的加权后的对象特征向量对应的相似度确定为该加权后的对象特征向量对应的权重;
将所述各个训练对象的加权后的对象特征向量与对应的权重进行加权求和,得到所述对象组合训练数据对应的对象组合特征向量。
6.根据权利要求5所述的方法,其特征在于,在得到所述训练好的特征获取模型时所保存的各个待推荐对象的对象特征向量为所述各个待推荐对象的加权后的对象特征向量。
7.一种对象组合召回装置,其特征在于,应用于电子设备,所述装置包括:
搜索请求接收模块,用于接收目标用户通过目标终端发送的用户搜索请求,所述用户搜索请求携带所述目标用户的目标用户标识;
第一用户特征向量确定模块,用于确定所述目标用户标识对应的目标用户特征向量,所述目标用户特征向量为对目标用户的用户历史行为数据所包括的多个对象的对象特征向量进行聚类所得到的,一个对象的对象特征向量是对该对象的预定对象名称和/或对象标识进行转化所得的;
第一对象组合特征向量确定模块,用于基于所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量,确定每个待推荐对象组合对应的对象组合特征向量,一个待推荐对象的对象特征向量是对该推荐对象的预定对象名称和/或对象标识进行转化所得的;
对象组合召回模块,用于计算所述目标用户特征向量与每个所述对象组合特征向量的相似度,并召回相似度大于预设相似度的对象组合特征向量所对应的待推荐对象组合。
8.根据权利要求7所述的装置,其特征在于,所述对象组合特征向量确定模块,具体用于:
计算所述目标用户特征向量与每个待推荐对象组合中各个待推荐对象的对象特征向量的相似度;
对于每一待推荐对象,将该待推荐对象对应的相似度确定为该待推荐对象对应的权重;
对于每一待推荐对象组合,将该待推荐对象组合中各个待推荐对象的对象特征向量与对应的权重进行加权求和,得到该待推荐对象组合对应的对象组合特征向量。
9.根据权利要求7或8所述的装置,其特征在于,所述目标用户特征向量和所述各个待推荐对象的对象特征向量是在得到训练好的特征获取模型时所保存的,其中,所述特征获取模型包括:对象表征层,用户表征层,对象组合表征层和全连接层;
所述装置还包括:
对象特征向量模块,用于对于对象组合训练数据中的每一训练对象,将该训练对象的预定对象名称和/或对象标识输入所述对象表征层,得到该训练对象的对象特征向量;
第二用户特征向量确定模块,用于将各个用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,得到所述各个用户的用户标识对应的用户特征向量;
第二对象组合特征向量确定模块,用于将所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,得到所述对象组合训练数据对应的对象组合特征向量;
特征向量输入模块,用于将所述各个用户的用户标识对应的用户特征向量与所述对象组合特征向量输入到所述全连接层中,对特征获取模型进行训练;
特征向量保存模块,用于在所述特征获取模型对应的损失函数值小于预设阈值时,得到训练好的特征获取模型,并保存所述各个用户的用户标识对应的用户特征向量与各个训练对象的对象特征向量。
10.根据权利要求9所述的装置,其特征在于,所述特征向量输入模块,具体用于:
对于每一用户,将该用户的用户历史行为数据所包括的各个训练对象的对象特征向量输入所述用户表征层,以使得所述用户表征层对所述各个训练对象的对象特征向量进行聚类,得到多个对象特征向量类簇,并将所述多个对象特征向量类簇的中心点确定为该用户的用户标识对应的用户特征向量。
11.根据权利要求9的装置,其特征在于,所述第二对象组合特征向量确定模块,具体用于:
将所述各个用户对应的用户特征向量与各个训练对象的对象特征向量输入所述对象组合表征层,以使得所述对象组合表征层执行如下步骤:
将各个训练对象的对象特征向量与所述对象组合表征层的权重向量相乘,得到各个训练对象的加权后的对象特征向量,其中,所述权重向量为所述特征获取模型的模型参数;
计算所述各个用户对应的用户特征向量与各个训练对象的加权后的对象特征向量的相似度,并将每个训练对象的加权后的对象特征向量对应的相似度确定为该加权后的对象特征向量对应的权重;
将所述各个训练对象的加权后的对象特征向量与对应的权重进行加权求和,得到所述对象组合训练数据对应的对象组合特征向量。
12.根据权利要求11所述的装置,其特征在于,在得到所述训练好的特征获取模型时所保存的各个待推荐对象的对象特征向量为所述各个待推荐对象的加权后的对象特征向量。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一项所述的对象组合召回方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的对象组合召回方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010780347.8A CN112085058A (zh) | 2020-08-05 | 2020-08-05 | 一种对象组合召回方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010780347.8A CN112085058A (zh) | 2020-08-05 | 2020-08-05 | 一种对象组合召回方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112085058A true CN112085058A (zh) | 2020-12-15 |
Family
ID=73735405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010780347.8A Pending CN112085058A (zh) | 2020-08-05 | 2020-08-05 | 一种对象组合召回方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112085058A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113742580A (zh) * | 2021-08-20 | 2021-12-03 | 杭州网易云音乐科技有限公司 | 目标类型数据的召回方法、装置、电子设备及存储介质 |
CN113763114A (zh) * | 2021-03-04 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 物品信息搭配方法、装置及存储介质 |
CN113781087A (zh) * | 2021-01-29 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 推荐对象的召回方法及装置、存储介质、电子设备 |
CN114783567A (zh) * | 2022-03-23 | 2022-07-22 | 清华大学 | 菜单推送方法、装置、电子设备及存储介质 |
-
2020
- 2020-08-05 CN CN202010780347.8A patent/CN112085058A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113781087A (zh) * | 2021-01-29 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 推荐对象的召回方法及装置、存储介质、电子设备 |
CN113763114A (zh) * | 2021-03-04 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 物品信息搭配方法、装置及存储介质 |
CN113742580A (zh) * | 2021-08-20 | 2021-12-03 | 杭州网易云音乐科技有限公司 | 目标类型数据的召回方法、装置、电子设备及存储介质 |
CN114783567A (zh) * | 2022-03-23 | 2022-07-22 | 清华大学 | 菜单推送方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457589B (zh) | 一种车辆推荐方法、装置、设备及存储介质 | |
CN106651542B (zh) | 一种物品推荐的方法及装置 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN112085058A (zh) | 一种对象组合召回方法、装置、电子设备及存储介质 | |
CN110717099B (zh) | 一种推荐影片的方法及终端 | |
CN112434072B (zh) | 搜索方法、装置、电子设备及存储介质 | |
CN112100504B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN111209477A (zh) | 一种信息推荐的方法及装置、电子设备、存储介质 | |
CN113792212B (zh) | 多媒体资源推荐方法、装置、设备以及存储介质 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111241381A (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
CN112364184A (zh) | 多媒体数据的排序方法、装置、服务器及存储介质 | |
CN113704620B (zh) | 基于人工智能的用户标签更新方法、装置、设备及介质 | |
CN113220974B (zh) | 点击率预测模型训练、搜索召回方法、装置、设备及介质 | |
CN113742578A (zh) | 一种数据推荐方法、装置、电子设备及存储介质 | |
CN114221991A (zh) | 基于大数据的会话推荐反馈处理方法及深度学习服务系统 | |
CN112256957B (zh) | 一种信息排序方法、装置、电子设备及存储介质 | |
CN111198961A (zh) | 商品搜索方法、装置及服务器 | |
CN110827078A (zh) | 一种信息推荐方法、装置、设备及存储介质 | |
CN114092162B (zh) | 推荐质量确定方法、推荐质量确定模型的训练方法及装置 | |
CN108304453B (zh) | 一种视频相关搜索词的确定方法及装置 | |
CN114912031A (zh) | 基于聚类和协同过滤的混合推荐方法和系统 | |
El Alami et al. | Toward an effective hybrid collaborative filtering: a new approach based on matrix factorization and heuristic-based neighborhood | |
CN112417290A (zh) | 书籍排序推送模型的训练方法、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20201215 |