CN112883264A - 一种推荐方法及装置 - Google Patents
一种推荐方法及装置 Download PDFInfo
- Publication number
- CN112883264A CN112883264A CN202110180534.7A CN202110180534A CN112883264A CN 112883264 A CN112883264 A CN 112883264A CN 202110180534 A CN202110180534 A CN 202110180534A CN 112883264 A CN112883264 A CN 112883264A
- Authority
- CN
- China
- Prior art keywords
- vector
- information
- user
- user information
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000013598 vector Substances 0.000 claims abstract description 294
- 230000004913 activation Effects 0.000 claims abstract description 55
- 238000000605 extraction Methods 0.000 claims abstract description 51
- 238000013528 artificial neural network Methods 0.000 claims abstract description 27
- 230000009467 reduction Effects 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 20
- 230000004927 fusion Effects 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 54
- 238000000354 decomposition reaction Methods 0.000 claims description 30
- 230000008447 perception Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 13
- 230000015556 catabolic process Effects 0.000 abstract description 4
- 238000006731 degradation reaction Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种推荐方法及装置,对目标用户的用户信息和候选对象的对象信息进行低阶特征提取,得到第一特征矢量,对用户信息和对象信息进行高阶特征提取,得到连接向量,并对所述连接向量进行降维处理,得到激活向量,最终将连接向量和激活向量进行残差融合,得到第二特征矢量。由此,根据第一特征矢量和第二特征矢量,预测目标用户选择候选对象的概率,并在概率满足设定条件时,向目标用户推荐候选对象。如此,在对用户信息和对象信息进行高阶特征提取和降维处理过程中,利用残差融合的方法,保留底层信息丢失,成功解决了深度神经网络算法的退化问题,有效防止神经网络的梯度消失,显著提高推荐的精准度,保证推荐系统的稳定性。
Description
技术领域
本申请涉及推荐技术领域,尤其涉及一种推荐方法及装置。
背景技术
随着互联网行业的高速发展,网络购物和利用互联网进行信息传播的方式已经非常普遍,各种购物平台和信息传播平台,基于用户的行为记录等进行推荐的技术已经较为成熟。但是,目前的推荐方法中对用户的历史访问记录和购买记录等历史数据依赖程度非常高。由此,在冷启动和数据稀疏的情况下,其推荐质量下降严重。
申请内容
本申请公开了一种推荐方法及装置。
根据本申请第一方面,提供了一种推荐方法,该方法包括:获取目标用户的用户信息和候选对象的对象信息;对所述用户信息和所述对象信息进行低阶特征提取,得到第一特征矢量;对所述用户信息和所述对象信息进行高阶特征提取,得到连接向量;对所述连接向量进行降维处理,得到激活向量;将所述连接向量和所述激活向量进行残差融合,得到第二特征矢量;根据所述第一特征矢量和所述第二特征矢量,预测所述目标用户选择所述候选对象的概率;在所述概率满足设定条件时,向所述目标用户推荐所述候选对象。
根据本申请的另一实施例,所述对所述用户信息和所述对象信息进行低阶特征提取,得到第一特征矢量,包括:对所述用户信息和所述对象信息进行矩阵分解,得到所述第一特征矢量。
根据本申请的另一实施例,所述对所述用户信息和所述对象信息进行矩阵分解,得到所述第一特征矢量,包括:分别对所述用户信息和所述对象信息进行矩阵分解初始化,相应的分别得到用户初始矩阵向量和对象初始矩阵向量;对所述用户初始矩阵向量和对象初始矩阵向量进行全局矩阵分解,得到所述第一特征矢量。
根据本申请的另一实施例,所述对所述用户信息和所述对象信息进行高阶特征提取,得到连接向量,包括:利用神经网络算法,对所述用户信息和所述对象信息进行特征提取,得到所述连接向量。
根据本申请的另一实施例,所述利用神经网络算法,对所述用户信息和所述对象信息进行特征提取,得到所述连接向量,包括:分别对所述用户信息和所述对象信息进行特征提取初始化,相应的分别得到用户初始感知向量和对象初始感知向量;对所述用户初始感知向量和所述对象初始感知向量进行全局矩阵分解,得到共享特征向量;对所述用户初始感知向量、所述对象初始感知向量和所述共享特征向量进行全连接,得到所述连接向量。
根据本申请的另一实施例,所述对所述连接向量进行降维处理,得到激活向量,包括:对所述连接向量进行非线性转换,得到所述激活向量。
根据本申请的另一实施例,在对所述连接向量进行非线性转换,得到激活向量之前,所述对连接向量进行降维处理,得到激活向量,还包括以下至少之一:对所述连接向量进行批归一化;采用注意力机制对所述连接向量进行处理。
根据本申请的另一实施例,所述根据所述第一特征矢量和所述第二特征矢量,预测所述目标用户选择所述候选对象的概率,包括:对所述第一特征矢量和所述第二特征矢量进行全连接,得到输出向量;对所述输出向量进行非线性转换,得到所述概率。
根据本申请的另一实施例,所述用户信息为所述目标用户和的身份标识;和/或所述对象信息为所述候选对象的对象标识。
根据本申请的第二方面,公开了一种推荐装置,所述装置包括:获取模块,用于获取目标用户的用户信息和候选对象的对象信息;第一特征提取模块,用于对所述用户信息和所述对象信息进行低阶特征提取,得到第一特征矢量;第二特征提取模块,用于对所述用户信息和所述对象信息进行高阶特征提取,得到连接向量;激活模块,用于对所述连接向量进行降维处理,得到激活向量;残差模块,用于将所述连接向量和所述激活向量进行残差融合,得到第二特征矢量;预测模块,用于根据所述第一特征矢量和所述第二特征矢量,预测所述目标用户选择所述候选对象的概率;推荐模块,用于在所述概率满足设定条件时,向所述目标用户推荐所述候选对象。
以上推荐方法,对目标用户的用户信息和候选对象的对象信息进行低阶特征提取,得到第一特征矢量,对用户信息和对象信息进行高阶特征提取,得到连接向量,并对所述连接向量进行降维处理,得到激活向量,最终将连接向量和激活向量进行残差融合,得到第二特征矢量。由此,根据第一特征矢量和第二特征矢量,预测目标用户选择候选对象的概率,并在概率满足设定条件时,向目标用户推荐候选对象。如此,在对用户信息和对象信息进行高阶特征提取和降维处理过程中,利用残差融合的方法,保留底层信息丢失,成功解决了深度神经网络算法的退化问题,有效防止神经网络的梯度消失,显著提高推荐的精准度,保证推荐系统的稳定性。
需要理解的是,本申请的教导并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本申请的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本申请实施例推荐方法的实现流程示意图;
图2示出了本申请另一实施例推荐方法的实现流程示意图;
图3示出了本申请又一实施例推荐方法的算法结构示意图;
图4示出了本申请实施例推荐装置的组成结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为使本申请更加透彻和完整,并能够将本申请的范围完整地传达给本领域的技术人员。
下面结合附图和具体实施例对本申请的技术方案进一步详细阐述。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
图1示处理本申请公开的推荐方法的实现流程示意图。
参考图1,本申请实施例推荐方法,至少包括如下操作流程:操作101,获取目标用户的用户信息和候选对象的对象信息;操作102,对用户信息和对象信息进行低阶特征提取,得到第一特征矢量;操作103,对用户信息和对象信息进行高阶特征提取,得到连接向量;操作104,对连接向量进行降维处理,得到激活向量;操作105,将连接向量和激活向量进行残差融合,得到第二特征矢量;操作106,根据第一特征矢量和第二特征矢量,预测目标用户选择候选对象的概率;操作107,在概率满足设定条件时,向目标用户推荐候选对象。
在操作101,获取目标用户的用户信息和候选对象的对象信息;
在本申请的这一实施例中,用户信息至少包括目标用户的用户ID(Identity,身份标识),对象信息至少包括候选商品的商品ID。当然,用户信息还可以包括目标用户对候选商品的历史点击次数和查看时间等。对象信息还可以包括候选商品的商品属性信息,例如:商品颜色、商品类别和商品适用对象等。这里用户信息和对象信息均可以用一个一维向量来表示,例如:(0,0,1,0……),这里一维向量的长度可以为32。
在操作102,对用户信息和对象信息进行低阶特征提取,得到第一特征矢量;
在本申请的这一实施例中,对用户信息和对象信息进行低阶特征提取是指对用户信息和对象信息经过有限次线性-非线性组合操作之后形成的特征。例如:对用户信息和对象信息进行矩阵分解。
在操作103,对用户信息和对象信息进行高阶特征提取,得到连接向量;
在本申请的这一实施例中,对用户信息和对象信息进行高阶特征提取,是指对用户信息和对象信息经过多次线性-非线性组合操作之后形成的特征,得到的特征为高度抽象特征。例如,这里可以采用神经网络算法对用户信息和对象信息进行高阶特征提取。
在操作104,对连接向量进行降维处理,得到激活向量;
在本申请的这一实施例中,连接向量是将用户信息和对象信息进行多次线性-非线性组合操作之后形成的特征向量。连接向量是将多个向量进行简单的组合构成的向量组,如果对连接向量进行降维处理,每一层输出都是上层输入的线性函数,不具有使用价值,也无法最终得到目标用户选择候选商品的概率。因此,这里需要对连接向量进行降维操作。这里可以对连接向量进行非线性转换,例如:使用激活函数对连接向量进行非线性转换。常见的激活函数有:Sigmoid函数、双曲正切激活函数Tanh函数和修正线性单元ReLU函数等。
在操作105,将连接向量和激活向量进行残差融合,得到第二特征矢量。
在本申请的这一实施例中,利用深度神经网络算法将用户信息和对象信息的特征进行高阶特征提取,将数据特征逐层抽象,得到连接向量,并对连接向量进行降维处理得到激活向量。但是,更深的神经网络,在非线性激活函数的加持下,拥有更大的假设空间,此时,利用残差融合的方式,以跳层连接的形式将单元的输入直接与单元输出融合在一起,然后再激活。在特征进行前向传播时,输入信号可以从任意低层直接传播到高层,有效解决了深度神经网络的退化问题,防止网络梯度消失,避免底层信息丢失。
在操作106,根据第一特征矢量和第二特征矢量,预测目标用户选择候选对象的概率。
在本申请这一实施例中,将第一特征矢量和第二特征矢量进行连接,并经过最后一个激活函数为sigmoid的全连接层,输出预测目标用户选择候选对象的概率,概率为一个0到1之间的值。
在操作107,在概率满足设定条件时,向目标用户推荐候选对象。
在本申请这一实施例中,概率大于设定阈值时,向目标用户推荐候选对象。例如:将目标用户A的用户信息和候选对象1的对象信息经过上述操作101~107的处理后,得到目标用户A选择候选对象1的概率为0.76,设定阈值为0.65,则判定目标用户A选择候选对象1的概率满足设定条件,向目标用户A推荐候选对象1的概率。
图2示出了本申请另一实施例推荐方法的实现流程示意图,如图2所示,至少包括如下操作流程:
操作201,获取目标用户的用户信息和候选对象的对象信息。
操作202,对用户信息和对象信息进行矩阵分解,得到第一特征矢量。
在本申请这一实施例中,可以对用户信息和对象信息进行矩阵分解,以对用户信息和对象信息进行低阶特征提取,得到第一特征矢量。具体的,可以首先分别对用户信息和对象信息进行矩阵分解初始化,相应的分别得到用户初始矩阵向量和对象初始矩阵向量,然后对用户初始矩阵向量和对象初始矩阵向量进行全局矩阵分解,得到第一特征矢量。
在本申请这一实施例中,用户信息和对象信息分别是一个一维向量,这里对用户信息和对象信息进行矩阵分解初始化是一个将稀疏向量转化为稠密向量的过程。利用用户信息为用户ID(Identity,标识)和对象ID,经过一个嵌入层,将其转化成用户特征矢量和物品特征矢量,然后利用矩阵分解公式,将用户特征矢量和物品特征矢量对位相乘,即可得到第一特征矢量。
操作203,利用神经网络算法,对用户信息和对象信息进行特征提取,得到连接向量。
在本申请这一实施例中,利用神经网络算法,对用户信息和对象信息进行特征提取,得到连接向量。具体的,可以分别对用户信息和对象信息进行特征提取初始化,相应的分别得到用户初始感知向量和对象初始感知向量;对用户初始感知向量和对象初始感知向量进行全局矩阵分解,得到共享特征向量;对用户初始感知向量、对象初始感知向量和共享特征向量进行全连接,得到连接向量。
这里,分别对用户信息和对象信息进行特征提取初始化,与操作202中分别对用户信息和对象信息进行矩阵分解初始化所采用的初始化的数据处理方法一样,均采用随机函数的方法对用户信息和对象信息进行初始化。至于在操作202和操作203中利用同样的数据处理方法分别对用户信息进行两次初始化的原因在于,随机函数可以从不同的兴趣学习用户信息,为后续的数据处理提供更为全面准确的用户信息。同样的,至于分别对对象信息进行两次初始化的原因在于,随机函数可以从不同的兴趣学习对象信息,以为后续的数据处理提供更为全面准确的对象信息。
在本申请这一实施例中,神经网络算法中每经过一轮特征提取,就会对某些特征进行一次筛选过滤,由此即产生最终结果过分关注某一特征的后果。本申请中将共享特征向量与用户初始感知向量、对象初始感知向量同时作为神经网络算法中全连接层的输入,可以有效缓解过用户向量与商品向量的过拟合,增加模型的泛化能力。
操作204,采用注意力机制对连接向量进行处理。
在神经网络算法中引入注意力模型,在提升模型性能的同时,注意力机制增加了神经网络结构的可解释性。在为目标用户推荐候选对象的过程中,注意力机制能够为用户信息的不同特征分配注意力权重,以更有效地获取目标用户的长期和短期兴趣。很明显并不是目标用户与候选对象的所有互动都与目标用户对该候选对象的偏好有关,而是目标用户的兴趣也会随着时间不断变化。这里,利用注意力机制,根据目标用户的特征和候选对象的信息中,选择出对于当前任务目标更关键的信息,提高有效信息的权重,有效提高给目标用户推荐候选对象的精准度。
操作205,对连接向量进行批归一化。
批归一化是指神经网络中对每一批数据进行归一化,在本申请这一实施例中,批归一化的目标是对特征进行归一化处理,使每层网络的输出都经过激活,得到标准差为1的零均值状态。所以批归一化的相反现象是非零均值,可以被理解为非零均值是数据不围绕0值分布的现象,而是数据的大多数值大于0小于0,数据会变得非常大或非常小。这里,对连接向量进行批归一化,将越来越偏的分布强制拉回比较标准的分布,使得激活输入值落在非线性函数对输入比较敏感的区域,这样输入的小变化就会导致损失函数较大的变化,可以让梯度变大,避免梯度消失问题产生。如此,能够有效加快的模型的收敛速度,有效节省算力,提高对目标用户和候选对象的信息处理速度。
操作206,对连接向量进行非线性转换,得到激活向量。
在本申请这一实施例中,可以采用Relu函数对连接向量进行非线性转换,得到激活向量。如果没有激活函数,神经网络中的每层都相当于矩阵相乘,即使叠加了若干层,也只能是矩阵相乘,无法得到最终的具有参考价值的参数,例如目标用户选择候选商品的概率。这里,激活函数是为了对神经网路模型中的连接向量进行降维处理,增加神经网络模型的非线性。
当然,这里也可以采用Tanh激活函数和Sigmoid函数,对连接向量进行非线性转换,得到激活向量。
操作207,将连接向量和激活向量进行残差融合,得到第二特征矢量。
操作208,根据第一特征矢量和第二特征矢量,预测目标用户选择候选对象的概率。
操作209,在概率满足设定条件时,向目标用户推荐候选对象。
其中,操作201、207~209的具体实现过程与图1所示实施例中操作101、105~107的具体实现过程相类似,这里不再赘述。
图3示出了本申请又一实施例的推荐算法结构示意图。
如图3所示,结合使用传统矩阵分解和多层感知机,同时抽取目标用户的用户信息和候选对象的对象信息的低维和高维的特征。具体的,图3的左半部分是矩阵分解,右半部分是多层感知机。
通过输入层获取目标用户的用户信息和候选对象的对象信息,例如:目标用户为用户u,候选对象为商品i。对并对用户信息和对象信息进行编码得到User(u)和Item(i),User(u)和Item(i)分别为一个一维向量,例如User(u)为一个32位的一维向量,Item(i)也为一个32位的一维向量。这里可以采用one-hot编码方式。
然后,经过嵌入层对用户信息和对象信息进行初始化。具体的,将User(u)经过随机函数处理得到矩阵用户向量MF user vector,对Item(i)进行随机函数处理得到矩阵商品向量MF item vector,并将MF user vector和MF item vector作为模型层矩阵分解层GMF Layer的输入。通过矩阵分解层GMF Layer,利用矩阵分解公式,得到第一特征向量。
同样的,将User(u)经过随机函数处理得到多层感知机用户向量MLP uservector,对Item(i)进行随机函数处理得到多层感知机商品向量MLP item vector,将MLPuser vector和MLP item vector作为模型层神经网络算法的输入。并且,在这里同时对MLPuser vector和MLP item vector进行全局矩阵分解,得到共享全局矩阵分解层向量ShareGMF Layer,并同时作为模型层神经网络算法的输入。
由此,在模型层利用多层感知机对用户信息和对象信息进行特征提取的过程中,将Share GMF Layer、MLP user vector和MLP item vector进行全连接得到连接向量Concat。有效解决了利用多层感知机对用户信息和对象信息进行特征提取的过程中产生的过拟合问题。
进一步的,这里设置多层RAN(Residual Attention Neural Network,残差注意力神经网络)处理,包括:Attention(注意力机制)、BN(Batch Normalization,批归一化)和Relu(修正线形单元)激活函数。其中,Attention有效关注连接向量Concat中的有效特征,提高模型的精确度。BN能够有效加快模型收敛速度,提高算力,从而提高数据处理速度,显著提升用户体验。而这里的Relu激活函数只是一个简单的激活函数示例,这里还可以采用其他适用的激活函数。例如:双曲正切激活函数Tanh。
更进一步的,将利用多层感知机处理得到的连接向量Concat与经过激活函数Relu处理得到的向量进行残差融合,得到第二特征向量。
最后,将第一特征向量和第二特征向量进行Concatention,并在输出层利用最后一个激活函数为sigmoid的全连接层,输出一个0到1之间的推荐值y_pred。当推荐值y_pred大于设定阈值时,将候选对象i推荐给目标用户u。
以上模型验证方法,对目标用户的用户信息和候选对象的对象信息进行低阶特征提取,得到第一特征矢量,对用户信息和对象信息进行高阶特征提取,得到连接向量,并对连接向量进行降维处理,得到激活向量,最终将连接向量和激活向量进行残差融合,得到第二特征矢量。由此,根据第一特征矢量和第二特征矢量,预测目标用户选择候选对象的概率,并在概率满足设定条件时,向目标用户推荐候选对象。如此,在对用户信息和对象信息进行高阶特征提取和降维处理过程中,利用残差融合的方法,保留底层信息丢失,成功解决了深度神经网络算法的退化问题,有效防止神经网络的梯度消失,显著提高推荐的精准度,保证推荐系统的稳定性。
同理,基于上文推荐方法,本申请还提供一种计算机可读存储介质,计算机可读存储介质存储有程序,当程序被处理器执行时,使得处理器至少执行如下的操作步骤:操作101,获取目标用户的用户信息和候选对象的对象信息;操作102,对用户信息和对象信息进行低阶特征提取,得到第一特征矢量;操作103,对用户信息和对象信息进行高阶特征提取,得到连接向量;操作104,对连接向量进行降维处理,得到激活向量;操作105,将连接向量和激活向量进行残差融合,得到第二特征矢量;操作106,根据第一特征矢量和第二特征矢量,预测目标用户选择候选对象的概率;操作107,在概率满足设定条件时,向目标用户推荐候选对象。
进一步地,基于上文推荐方法,本申请还提供一种模型验证装置,如图4所示,装置40包括:获取模块401,用于获取目标用户的用户信息和候选对象的对象信息;第一特征提取模块402,用于对用户信息和对象信息进行低阶特征提取,得到第一特征矢量;第二特征提取模块403,用于对用户信息和对象信息进行高阶特征提取,得到连接向量;激活模块404,用于对连接向量进行降维处理,得到激活向量;残差模块405,用于将连接向量和激活向量进行残差融合,得到第二特征矢量;预测模块406,用于根据第一特征矢量和第二特征矢量,预测目标用户选择候选对象的概率;推荐模块407,用于在概率满足设定条件时,向目标用户推荐候选对象。
根据本申请的另一实施例,第一特征提取模块402包括矩阵子模块,用于对用户信息和对象信息进行矩阵分解,得到第一特征矢量。
根据本申请的另一实施例,矩阵子模块采用以下操作步骤对用户信息和对象信息进行矩阵分解,得到第一特征矢量:分别对用户信息和对象信息进行矩阵分解初始化,相应的分别得到用户初始矩阵向量和对象初始矩阵向量;对用户初始矩阵向量和对象初始矩阵向量进行全局矩阵分解,得到第一特征矢量。
根据本申请的另一实施例,第二特征提取模块403包括:提取子模块,用于利用神经网络算法,对用户信息和对象信息进行特征提取,得到连接向量。
根据本申请的另一实施例,提取子模块采用以下操作步骤利用神经网络算法,对用户信息和对象信息进行特征提取,得到连接向量:分别对用户信息和对象信息进行特征提取初始化,相应的分别得到用户初始感知向量和对象初始感知向量;对用户初始感知向量和对象初始感知向量进行全局矩阵分解,得到共享特征向量;对用户初始感知向量、对象初始感知向量和共享特征向量进行全连接,得到连接向量。
根据本申请的另一实施例,激活模块404包括转换子模块,用于对连接向量进行非线性转换,得到激活向量。
根据本申请的另一实施例,激活模块404还包括以下至少之一:批归一子模块,用于在转换子模块对连接向量进行非线性转换,得到激活向量之前,对连接向量进行批归一化;注意力子模块,用于在转换子模块对连接向量进行非线性转换,得到激活向量之前,采用注意力机制对连接向量进行处理。
根据本申请的另一实施例,预测模块406包括连接子模块,用于对第一特征矢量和第二特征矢量进行全连接,得到输出向量;概率子模块,用于对输出向量进行非线性转换,得到概率。
根据本申请的另一实施例,用户信息为目标用户和的身份标识;和/或对象信息为候选对象的对象标识。
这里需要指出的是:以上对针对推荐装置实施例的描述,与前述图1至3所示的方法实施例的描述是类似的,具有同前述图1至3所示的方法实施例相似的有益效果,因此不做赘述。对于本申请推荐装置实施例中未披露的技术细节,请参照本申请前述图1至3所示的方法实施例的描述而理解,为节约篇幅,因此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种推荐方法,所述方法包括:
获取目标用户的用户信息和候选对象的对象信息;
对所述用户信息和所述对象信息进行低阶特征提取,得到第一特征矢量;
对所述用户信息和所述对象信息进行高阶特征提取,得到连接向量;
对所述连接向量进行降维处理,得到激活向量;
将所述连接向量和所述激活向量进行残差融合,得到第二特征矢量;
根据所述第一特征矢量和所述第二特征矢量,预测所述目标用户选择所述候选对象的概率;
在所述概率满足设定条件时,向所述目标用户推荐所述候选对象。
2.根据权利要求1所述的方法,所述对所述用户信息和所述对象信息进行低阶特征提取,得到第一特征矢量,包括:
对所述用户信息和所述对象信息进行矩阵分解,得到所述第一特征矢量。
3.根据权利要求2所述的方法,所述对所述用户信息和所述对象信息进行矩阵分解,得到所述第一特征矢量,包括:
分别对所述用户信息和所述对象信息进行矩阵分解初始化,相应的分别得到用户初始矩阵向量和对象初始矩阵向量;
对所述用户初始矩阵向量和对象初始矩阵向量进行全局矩阵分解,得到所述第一特征矢量。
4.根据权利要求1所述的方法,所述对所述用户信息和所述对象信息进行高阶特征提取,得到连接向量,包括:
利用神经网络算法,对所述用户信息和所述对象信息进行特征提取,得到所述连接向量。
5.根据权利要求4所述的方法,所述利用神经网络算法,对所述用户信息和所述对象信息进行特征提取,得到所述连接向量,包括:
分别对所述用户信息和所述对象信息进行特征提取初始化,相应的分别得到用户初始感知向量和对象初始感知向量;
对所述用户初始感知向量和所述对象初始感知向量进行全局矩阵分解,得到共享特征向量;
对所述用户初始感知向量、所述对象初始感知向量和所述共享特征向量进行全连接,得到所述连接向量。
6.根据权利要求1所述的方法,所述对所述连接向量进行降维处理,得到激活向量,包括:对所述连接向量进行非线性转换,得到所述激活向量。
7.根据权利要求6所述的方法,在对所述连接向量进行非线性转换,得到激活向量之前,所述对连接向量进行降维处理,得到激活向量,还包括以下至少之一:对所述连接向量进行批归一化;
采用注意力机制对所述连接向量进行处理。
8.根据权利要求1所述的方法,所述根据所述第一特征矢量和所述第二特征矢量,预测所述目标用户选择所述候选对象的概率,包括:
对所述第一特征矢量和所述第二特征矢量进行全连接,得到输出向量;
对所述输出向量进行非线性转换,得到所述概率。
9.根据权利要求1-8中任一项所述的方法,
所述用户信息为所述目标用户和的身份标识;和/或
所述对象信息为所述候选对象的对象标识。
10.一种推荐装置,所述装置包括:
获取模块,用于获取目标用户的用户信息和候选对象的对象信息;
第一特征提取模块,用于对所述用户信息和所述对象信息进行低阶特征提取,得到第一特征矢量;
第二特征提取模块,用于对所述用户信息和所述对象信息进行高阶特征提取,得到连接向量;
激活模块,用于对所述连接向量进行降维处理,得到激活向量;
残差模块,用于将所述连接向量和所述激活向量进行残差融合,得到第二特征矢量;
预测模块,用于根据所述第一特征矢量和所述第二特征矢量,预测所述目标用户选择所述候选对象的概率;
推荐模块,用于在所述概率满足设定条件时,向所述目标用户推荐所述候选对象。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110180534.7A CN112883264A (zh) | 2021-02-09 | 2021-02-09 | 一种推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110180534.7A CN112883264A (zh) | 2021-02-09 | 2021-02-09 | 一种推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112883264A true CN112883264A (zh) | 2021-06-01 |
Family
ID=76057609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110180534.7A Pending CN112883264A (zh) | 2021-02-09 | 2021-02-09 | 一种推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112883264A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113934929A (zh) * | 2021-09-30 | 2022-01-14 | 联想(北京)有限公司 | 推荐方法及装置、电子设备 |
CN114840761A (zh) * | 2022-05-13 | 2022-08-02 | 北京达佳互联信息技术有限公司 | 推送模型的训练方法、装置、设备、存储介质及程序产品 |
CN115115093A (zh) * | 2022-05-19 | 2022-09-27 | 深圳市腾讯网络信息技术有限公司 | 对象数据的处理方法、装置、电子设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013105215A (ja) * | 2011-11-10 | 2013-05-30 | Ntt Docomo Inc | レコメンド情報生成装置、レコメンド情報生成方法及びレコメンド情報生成プログラム |
CN104580385A (zh) * | 2014-12-16 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 一种拓展用户关系链的方法及装置 |
CN105260390A (zh) * | 2015-09-11 | 2016-01-20 | 合肥工业大学 | 一种面向群组的基于联合概率矩阵分解的项目推荐方法 |
CN109785062A (zh) * | 2019-01-10 | 2019-05-21 | 电子科技大学 | 一种基于协同过滤模型的混合神经网络推荐系统 |
CN110162706A (zh) * | 2019-05-22 | 2019-08-23 | 南京邮电大学 | 一种基于交互数据聚类的个性化推荐方法及系统 |
CN110245310A (zh) * | 2019-03-06 | 2019-09-17 | 腾讯科技(深圳)有限公司 | 一种对象的行为分析方法、装置及存储介质 |
CN111177575A (zh) * | 2020-04-07 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法、装置、电子设备和存储介质 |
CN111368210A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置以及电子设备 |
CN111506811A (zh) * | 2020-03-19 | 2020-08-07 | 上海理工大学 | 一种基于深度残差网络的点击率预测方法 |
CN112116065A (zh) * | 2020-08-14 | 2020-12-22 | 西安电子科技大学 | 一种rgb图像光谱重建方法、系统、存储介质及应用 |
CN112149504A (zh) * | 2020-08-21 | 2020-12-29 | 浙江理工大学 | 混合卷积的残差网络与注意力结合的动作视频识别方法 |
-
2021
- 2021-02-09 CN CN202110180534.7A patent/CN112883264A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013105215A (ja) * | 2011-11-10 | 2013-05-30 | Ntt Docomo Inc | レコメンド情報生成装置、レコメンド情報生成方法及びレコメンド情報生成プログラム |
CN104580385A (zh) * | 2014-12-16 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 一种拓展用户关系链的方法及装置 |
CN105260390A (zh) * | 2015-09-11 | 2016-01-20 | 合肥工业大学 | 一种面向群组的基于联合概率矩阵分解的项目推荐方法 |
CN109785062A (zh) * | 2019-01-10 | 2019-05-21 | 电子科技大学 | 一种基于协同过滤模型的混合神经网络推荐系统 |
CN110245310A (zh) * | 2019-03-06 | 2019-09-17 | 腾讯科技(深圳)有限公司 | 一种对象的行为分析方法、装置及存储介质 |
CN110162706A (zh) * | 2019-05-22 | 2019-08-23 | 南京邮电大学 | 一种基于交互数据聚类的个性化推荐方法及系统 |
CN111506811A (zh) * | 2020-03-19 | 2020-08-07 | 上海理工大学 | 一种基于深度残差网络的点击率预测方法 |
CN111177575A (zh) * | 2020-04-07 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法、装置、电子设备和存储介质 |
CN111368210A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置以及电子设备 |
CN112116065A (zh) * | 2020-08-14 | 2020-12-22 | 西安电子科技大学 | 一种rgb图像光谱重建方法、系统、存储介质及应用 |
CN112149504A (zh) * | 2020-08-21 | 2020-12-29 | 浙江理工大学 | 混合卷积的残差网络与注意力结合的动作视频识别方法 |
Non-Patent Citations (1)
Title |
---|
徐涛 等: "基于深度学习的行人多目标跟踪方法", 《吉林大学学报(工学报)》, 31 January 2021 (2021-01-31), pages 27 - 38 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113934929A (zh) * | 2021-09-30 | 2022-01-14 | 联想(北京)有限公司 | 推荐方法及装置、电子设备 |
CN114840761A (zh) * | 2022-05-13 | 2022-08-02 | 北京达佳互联信息技术有限公司 | 推送模型的训练方法、装置、设备、存储介质及程序产品 |
CN114840761B (zh) * | 2022-05-13 | 2024-05-28 | 北京达佳互联信息技术有限公司 | 推送模型的训练方法、装置、设备、存储介质及程序产品 |
CN115115093A (zh) * | 2022-05-19 | 2022-09-27 | 深圳市腾讯网络信息技术有限公司 | 对象数据的处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112883264A (zh) | 一种推荐方法及装置 | |
CN110427560B (zh) | 一种应用于推荐系统的模型训练方法以及相关装置 | |
Sheil et al. | Predicting purchasing intent: automatic feature learning using recurrent neural networks | |
CN111626832B (zh) | 产品推荐方法、装置及计算机设备 | |
CN111292164B (zh) | 一种商品推荐方法、装置、电子设备及可读存储介质 | |
CN109145245A (zh) | 预测点击率的方法、装置、计算机设备及存储介质 | |
KR20190070625A (ko) | 메타데이터를 이용한 아이템 추천 방법 및 장치 | |
CN110046301B (zh) | 对象推荐方法和装置 | |
CN112800342A (zh) | 基于异质信息的推荐方法、系统、计算机设备和存储介质 | |
CN110826686B (zh) | 有属性序列的机器学习系统和方法 | |
Hu et al. | Examining collaborative filtering algorithms for clothing recommendation in e-commerce | |
Xia et al. | Modeling consumer buying decision for recommendation based on multi-task deep learning | |
KR102422408B1 (ko) | 협업 필터링 신경망을 이용하여 상품을 추천하는 방법 및 장치 | |
Abinaya et al. | Enhancing top-N recommendation using stacked autoencoder in context-aware recommender system | |
CN116739695A (zh) | 基于大数据的电子商务管理系统及其方法 | |
CN115511546A (zh) | 一种电商用户的行为分析方法、系统、设备及可读介质 | |
CN113779380B (zh) | 跨域推荐、内容推荐方法、装置及设备 | |
CN117252665B (zh) | 业务推荐方法、装置、电子设备及存储介质 | |
Sengupta et al. | Simple surveys: Response retrieval inspired by recommendation systems | |
CN113516539A (zh) | 商品推荐方法、装置及计算机可读存储介质 | |
CN115641179A (zh) | 信息推送方法、装置及电子设备 | |
CN115422453B (zh) | 项目推荐方法及项目推荐装置 | |
CN116562928A (zh) | 一种目标预估方法、装置、设备及存储介质 | |
CN114579854A (zh) | 商品推荐方法、模型训练方法、装置及电子设备 | |
Sudarsan et al. | E-commerce Website with Image Search and Price Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |