CN114677176A - 兴趣内容的推荐方法及装置、电子设备、存储介质 - Google Patents
兴趣内容的推荐方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN114677176A CN114677176A CN202210326515.5A CN202210326515A CN114677176A CN 114677176 A CN114677176 A CN 114677176A CN 202210326515 A CN202210326515 A CN 202210326515A CN 114677176 A CN114677176 A CN 114677176A
- Authority
- CN
- China
- Prior art keywords
- interest
- sequence
- basic information
- current
- sample data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种兴趣内容的推荐方法及装置、电子设备、存储介质,所述方法包括:获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的目标信息;分别对当前基础信息、当前第一预设时间段内的目标信息中的序列以及当前第二预设时间段内的目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征;将当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征输入预先训练好的推荐模型中,得到各个兴趣内容的打分结果。从而不再利用大数据的计算方式去计算用户所感兴趣内容的相似内容,而是根据用户的长短兴趣,有效地向用户推荐准确的兴趣内容。
Description
技术领域
本申请涉及内容推荐技术领域,尤其涉及一种兴趣内容的推荐方法及装置、电子设备、存储介质。
背景技术
伴随着网络信息的迅速发展,衍生了大量的信息。当用户想从大量的信息中寻找对自己有用的信息时,也逐渐地困难化。另一方面信息的生产者也是不断的想把每个用户感兴趣的内容推荐到每个用户面前,以实现为每个用户推荐感兴趣的内容。
在现有的兴趣内容推荐的方式中,采用的是协同过滤的方式进行内容的推荐,在推荐的过程中,通过大数据的计算方法,根据用户关注的兴趣内容,计算出跟该兴趣内容类型相似的目标内容,当用户点击该兴趣内容时,则向用户推荐该兴趣内容类型相似的目标内容。
但是,由于从用户的关注角度进行内容分析,而没有考虑到用户的兴趣方面,因此用户得到的推荐内容并不是用户本身感兴趣的内容,从而导致无法准确地向用户推荐兴趣内容。
发明内容
基于上述现有技术的不足,本申请提供了一种兴趣内容的推荐方法及装置、电子设备、存储介质,以解决现有技术推荐兴趣内容不准确的问题。
为了实现上述目的,本申请提供了以下技术方案:
本申请第一方面提供了一种兴趣内容的推荐方法,包括:
获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的所述目标信息;其中,所述目标信息包括在对应时间段内浏览的兴趣内容的序列以及各个所述兴趣内容的基础信息;所述第一预设时间段大于所述第二预设时间段;
分别对当前基础信息、所述当前第一预设时间段内的所述目标信息中的序列以及所述当前第二预设时间段内的所述目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征;其中,所述当前基础信息包括所述用户的基础信息以及所述目标信息中的所述兴趣内容的基础信息;
将所述当前综合特征、所述当前长兴趣序列特征以及所述当前短兴趣序列特征输入预先训练好的推荐模型中,得到各个所述兴趣内容的打分结果;其中,所述推荐模型预先利用所述用户的基础信息、多个正样本数据以及负样本数据训练得到;一个所述正样本数据包括历史第一预设时间段内和历史第二预设时间段内的正向数据;所述正向数据包括在对应时间段内浏览并点击的兴趣内容的序列以及所述兴趣内容的基础信息;一个所述负样本数据包括所述历史第一预设时间段内和所述历史第二预设时间段内的负向数据;所述负向数据包括在对应时间段内浏览并未点击的兴趣内容的序列以及所述兴趣内容的基础信息;
基于各个所述兴趣内容的打分结果,向所述用户推荐所述兴趣内容。
可选地,在上述的兴趣内容的推荐方法中,所述推荐模型的训练方法,包括:
获取所述用户的基础信息、多个所述正样本数据以及所述负样本数据;
针对每组样本数据,分别对所述样本数据中的历史基础信息以及两个序列进行特征处理,得到所述样本数据对应的特征向量;其中,每组所述样本数据包括所述用户的基础信息以及一个所述正样本数据或一个负样本数据;所述历史基础信息包括所述用户的基础信息、所述正数据样本中的所述兴趣内容的基础信息以及所述负数据样本中的所述兴趣内容的基础信息;所述样本数据对应的特征向量包括历史综合特征、历史长兴趣序列特征以及历史短兴趣序列特征;
将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果;
分别针对各个所述兴趣内容,判断所述兴趣内容的打分结果是否小于预设阈值;
若所述兴趣内容的打分结果小于所述预设阈值,则调整所述推荐模型的参数,返回执行所述将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果;
若所述兴趣内容的打分结果大于所述预设阈值,则将所述推荐模型确定为训练好的所述推荐模型。
可选地,在上述的兴趣内容的推荐方法中,所述分别对所述样本数据中的历史基础信息以及两个序列进行特征处理,得到所述样本数据对应的特征向量,包括:
对所述历史基础信息中的类别型信息采用类别编码的处理方式进行特征处理,得到综合类别特征;
对所述历史基础信息中的连续型信息采用归一化的处理方式进行特征处理,得到综合连续特征;
将所述综合类别特征以及所述综合连续特征进行拼接,得到所述历史综合特征;
对两个所述序列中的类别序列采用所述类别编码的处理方式进行特征处理,得到所述长兴趣序列特征以及所述短兴趣序列特征。
可选地,在上述的兴趣内容的推荐方法中,所述推荐模型包括输入层、兴趣提取层、兴趣融合层以及输出层,所述将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果,包括:
通过所述输入层获取所述样本数据对应的特征向量;
通过所述兴趣提取层中的长兴趣提取层对所述历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过所述兴趣提取层中的短兴趣提取层对所述历史短兴趣序列特征进行特征提取,得到短序列矩阵;
通过所述兴趣融合层将所述长序列矩阵、所述短序列矩阵与目标积拼接后的向量进行全连接处理,得到权重;其中,所述目标积指代所述长序列矩阵与所述短序列矩阵的内积;
通过所述兴趣融合层将所述权重与所述短序列矩阵相乘,得到所述目标值与所述短序列矩阵对应的乘积,并将所述乘积与所述长序列矩阵进行拼接,得到拼接特征向量;
通过所述输出层将所述历史综合特征与所述拼接特征向量拼接后的向量进行处理,得到各个所述兴趣内容的打分结果。
可选地,在上述的兴趣内容的推荐方法中,所述长兴趣提取层包括长短记忆循环神经网络以及多头自注意力机制,所述短兴趣提取层包括所述多头自注意力机制,所述通过所述兴趣提取层中的长兴趣提取层对所述历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过所述兴趣提取层中的短兴趣提取层对所述历史短兴趣序列特征进行特征提取,得到短序列矩阵,包括:
通过长短记忆循环神经网络以及多头自注意力机制对所述历史长兴趣序列特征进行特征提取,得到所述长序列矩阵,以及通过所述多头自注意力机制对历史短兴趣序列特征进行特征提取,得到所述短序列矩阵。
本申请第二方面提供了一种兴趣内容的推荐装置,包括:
第一获取单元,用于获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的所述目标信息;其中,所述目标信息包括在对应时间段内浏览的兴趣内容的序列以及各个所述兴趣内容的基础信息;所述第一预设时间段大于所述第二预设时间段;
第一处理单元,用于分别对当前基础信息、所述当前第一预设时间段内的所述目标信息中的序列以及所述当前第二预设时间段内的所述目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征;其中,所述当前基础信息包括所述用户的基础信息以及所述目标信息中的所述兴趣内容的基础信息;
第一输入单元,用于将所述当前综合特征、所述当前长兴趣序列特征以及所述当前短兴趣序列特征输入预先训练好的推荐模型中,得到各个所述兴趣内容的打分结果;其中,所述推荐模型预先利用所述用户的基础信息、多个正样本数据以及负样本数据训练得到;一个所述正样本数据包括历史第一预设时间段内和历史第二预设时间段内的正向数据;所述正向数据包括在对应时间段内浏览并点击的兴趣内容的序列以及所述兴趣内容的基础信息;一个所述负样本数据包括所述历史第一预设时间段内和所述历史第二预设时间段内的负向数据;所述负向数据包括在对应时间段内浏览并未点击的兴趣内容的序列以及所述兴趣内容的基础信息;
推荐单元,用于基于各个所述兴趣内容的打分结果,向所述用户推荐所述兴趣内容。
可选地,在上述的兴趣内容的推荐装置中,还包括:
第二获取单元,用于获取所述用户的基础信息、多个所述正样本数据以及所述负样本数据;
第二处理单元,用于针对每组样本数据,分别对所述样本数据中的历史基础信息以及两个序列进行特征处理,得到所述样本数据对应的特征向量;其中,每组所述样本数据包括所述用户的基础信息以及一个所述正样本数据或一个负样本数据;所述历史基础信息包括所述用户的基础信息、所述正数据样本中的所述兴趣内容的基础信息以及所述负数据样本中的所述兴趣内容的基础信息;所述样本数据对应的特征向量包括历史综合特征、历史长兴趣序列特征以及历史短兴趣序列特征;
第二输入单元,用于将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果;
判断单元,用于分别针对各个所述兴趣内容,判断所述兴趣内容的打分结果是否小于预设阈值;
调整单元,用于若所述兴趣内容的打分结果小于所述预设阈值,则调整所述推荐模型的参数,返回所述第二输入单元执行所述将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果;
确定单元,用于若所述兴趣内容的打分结果大于所述预设阈值,则将所述推荐模型确定为训练好的所述推荐模型。
可选地,在上述的兴趣内容的推荐装置中,所述第二处理单元,包括:
第三处理单元,用于对所述历史基础信息中的类别型信息采用类别编码的处理方式进行特征处理,得到综合类别特征;
第四处理单元,用于对所述历史基础信息中的连续型信息采用归一化的处理方式进行特征处理,得到综合连续特征;
第一拼接单元,用于将所述综合类别特征以及所述综合连续特征进行拼接,得到所述历史综合特征;
第五处理单元,用于对两个所述序列中的类别序列采用所述类别编码的处理方式进行特征处理,得到所述长兴趣序列特征以及所述短兴趣序列特征。
可选地,在上述的兴趣内容的推荐装置中,所述推荐模型包括输入层、兴趣提取层、兴趣融合层以及输出层,所述第二输入单元,包括:
第三获取单元,用于通过所述输入层获取所述样本数据对应的特征向量;
第一提取单元,用于通过所述兴趣提取层中的长兴趣提取层对所述历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过所述兴趣提取层中的短兴趣提取层对所述历史短兴趣序列特征进行特征提取,得到短序列矩阵;
第六处理单元,用于通过所述兴趣融合层将所述长序列矩阵、所述短序列矩阵与目标积拼接后的向量进行全连接处理,得到权重;其中,所述目标积指代所述长序列矩阵与所述短序列矩阵的内积;
第二拼接单元,用于通过所述兴趣融合层将所述权重与所述短序列矩阵相乘,得到所述目标值与所述短序列矩阵对应的乘积,并将所述乘积与所述长序列矩阵进行拼接,得到拼接特征向量;
第七处理单元,用于通过所述输出层将所述历史综合特征与所述拼接特征向量拼接后的向量进行处理,得到各个所述兴趣内容的打分结果。
可选地,在上述的兴趣内容的推荐装置中,所述长兴趣提取层包括长短记忆循环神经网络以及多头自注意力机制,所述短兴趣提取层包括所述多头自注意力机制,所述第一提取单元,包括:
第二提取单元,用于通过长短记忆循环神经网络以及多头自注意力机制对所述历史长兴趣序列特征进行特征提取,得到所述长序列矩阵,以及通过所述多头自注意力机制对历史短兴趣序列特征进行特征提取,得到所述短序列矩阵。
本申请第三方面提供了一种电子设备,包括:
存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如上述任意一项所述的兴趣内容的推荐方法。
本申请第四方面提供了一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,用于实现如上述任意一项所述的兴趣内容的推荐方法。
本申请提供的一种兴趣内容的推荐方法,通过获取用户的长时间的兴趣内容以及短时间的兴趣内容,以实现向用户推荐准确地兴趣内容。通过获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的目标信息。其次分别对当前基础信息、当前第一预设时间段内的目标信息中的序列以及当前第二预设时间段内的目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征,然后将当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征输入预先训练好的推荐模型中,最后得到各个兴趣内容的打分结果。由于推荐模型预先利用用户的基础信息、多个正样本数据以及负样本数据训练得到。因此基于各个兴趣内容的打分结果,向用户推荐兴趣内容。从而不再利用大数据的计算方式去计算用户所感兴趣内容的相似内容,而是根据用户的长短兴趣,有效地向用户推荐准确的兴趣内容。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种兴趣内容的推荐方法的流程图;
图2为本申请实施例提供的一种推荐模型的训练方法的流程图;
图3为本申请实施例提供的确定样本数据的特征处理方式的方法的流程图;
图4为本申请实施例提供的推荐模型的网络结构示意图;
图5为本申请实施例提供的获得兴趣内容的打分结果的方法的流程图;
图6为本申请另一实施例提供的一种兴趣内容的推荐装置的结构示意图;
图7为本申请另一实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请实施例提供了一种兴趣内容的推荐方法,如图1所示,具体包括以下步骤:
S101、获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的目标信息。
其中,第一预设时间段大于第二预设时间段。需要说明的是,第一预设时间段指代时间长度为第一预设阈值的时间段,第二预设时间段指代时间长度第二预设阈值的时间段。
还需要说明的是,当前第一预设时间段指代以当前时间为基准点,往回第一预设阈值的时间段,其中也可能存在某个历史时间点,但在历史时间段内是以以前的某个时间点为历史时间段的基准点。比如:若当前时间为2022年3月21号,则往回预设第一阈值的时间段为2022年3月14号,但可能存在以往获取用户的历史时间段内的某个历史时间点的信息,其中某个历史时间点可能为2022年3月16号。当前第二预设时间段指代以当前时间为基准点,往回第二预设阈值的时间段。
可选地,第一预设阈值可以为7天,第二预设阈值可以为1至2天,所以当前第一预设时间段可以为距离当前时间的7天时间,当前第二预设时间段可以为距离当前时间的1至2天时间,当然,也可以是其他阈值,具体可以根据需求设置。
目标信息包括在对应时间段内浏览的兴趣内容的序列以及各个兴趣内容的基础信息。还需要说明的是,在对应时间段内浏览的兴趣内容的序列主要指的是用户在预设时间段的范围内所浏览并且点击的兴趣内容以及浏览并且未点击的兴趣内容组合而成的序列。其中,兴趣内容的基础信息为用户所浏览并且点击的兴趣内容的信息,比如:用户浏览并且点击手机的商品页面,其中在点击的商品页面中显示该手机的型号、外形以及配置参数等等。以及用户所浏览并且未点击的兴趣内容的信息,比如:用户单单浏览并未点击手表的商品页面,其中在浏览的商品页面上显示关于该手表的价格、名称等等。
其中,用户的基础信息是指用户在注册身份信息时所填写的信息内容,比如:性别、年龄等等。
S102、分别对当前基础信息、当前第一预设时间段内的目标信息中的序列以及当前第二预设时间段内的目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征。
其中,当前基础信息可以包括用户的基础信息以及目标信息中的兴趣内容的基础信息。
需要说明的是,分别将当前基础信息、当前第一预设时间段内的目标信息中的序列以及当前第二预设时间段内的目标信息中的序列处理为向量的形式,便于后续模型的训练。
还需要说明的是,当前综合特征可以包括用户基础特征、交叉特征、Item基础特征、上下文特征。其中,交叉特征指代用户的偏好特征,比如:用户偏向什么价位的手机或者偏爱手机的哪种型号。Item基础特征指代用户浏览并且点击的所有兴趣内容之间存在的关联特征,比如:用户浏览并且点击了10个商品,这10个商品之间存在价格相似、图片相似等等。上下文特征指代空间特征,比如:用户在特定的时间段或者特定的地点购买商品。
S103、将当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征输入预先训练好的推荐模型中,得到各个兴趣内容的打分结果。
其中,推荐模型预先利用用户的基础信息、多个正样本数据以及负样本数据训练得到,一个正样本数据可以包括历史第一预设时间段内和历史第二预设时间段内的正向数据,正向数据可以包括在对应时间段内浏览并点击的兴趣内容的序列以及兴趣内容的基础信息,一个负样本数据可以包括历史第一预设时间段内和历史第二预设时间段内的负向数据,负向数据可以包括在对应时间段内浏览并未点击的兴趣内容的序列以及兴趣内容的基础信息。
需要说明的是,历史第一预设时间内主要指以之前的某个历史时间为基准点,所距离历史时间段的预设时间。历史第二预设时间内主要指以之前的某个历史时间为基准点,所距离历史时间段的预设时间。
可选地,历史第一预设时间可以为距离历史时间某个时间点的20天时间,历史第二预设时间为距离历史时间某个时间点的10天时间,当然,也可以是其他阈值时间,具体可以根据需求设置。
可选地,本申请实施例提供了一种推荐模型的训练方法,如图2所示,包括以下步骤:
S201、获取用户的基础信息、多个正样本数据以及负样本数据。
需要说明的是,在本申请实施例中,有很多个正样本数据以及负样本数据,为了从多个样本数据中提取用户同一时间段内的兴趣内容,所以获取以相同的时间点作为基准点的正样本数据以及负样本数据,避免获取到与该时间点不一致的时间点作为基准点的另一个正样本数据以及负样本数据中的相关数据,从而影响后续无法准确地向用户推荐兴趣内容。
还需要说明的是,步骤S201的具体实施方式可相应地参考步骤S101,此处不再赘述。
S202、针对每组样本数据,分别对样本数据中的历史基础信息以及两个序列进行特征处理,得到样本数据对应的特征向量。
其中,每组样本数据可以包括用户的基础信息以及一个正样本数据或一个负样本数据。历史基础信息可以包括用户的基础信息、正数据样本中的兴趣内容的基础信息以及负数据样本中的兴趣内容的基础信息。样本数据对应的特征向量可以包括历史综合特征、历史长兴趣序列特征以及历史短兴趣序列特征。
需要说明的是,对于同一组样本数据对应的特征向量中的历史第一预设时间的历史长兴趣序列特征以及历史第二预设时间的历史短兴趣序列特征,是基于同一历史的时间点作为基准点的两个序列特征。对于不同组样本数据对应的特征向量中的历史长兴趣序列特征以及历史短兴趣序列特征,是基于不同历史的时间点作为基准点的两个序列特征。
还需要说明的是,步骤S202的具体实施方式可相应地参考步骤S102,此处不再赘述。
可选地,在本申请另一实施例中,步骤S202的一种具体实施方式,如图3所示,包括以下步骤:
S301、对历史基础信息中的类别型信息采用类别编码的处理方式进行特征处理,得到综合类别特征。
需要说明的是,通过类别编码的处理方式对样本数据中的历史基础信息中的类别型信息进行特征处理。例如,可以构建一个M*S*预设维度向量的矩阵,M代表代表类别型信息的种类,S代表该种类有多少类,通过构建矩阵的方式,可以相应的得到类别型信息对应的类别编码,以便于后续利用该类别编码进行拼接。
可选地,预设维度向量可以为64,当然,也可以是其他维度向量,具体可以根据需求设置。
S302、对历史基础信息中的连续型信息采用归一化的处理方式进行特征处理,得到综合连续特征。
需要说明的是,对历史基础信息中的连续型信息进行归一化的特征处理是为了更好地辨别该连续型信息中是否存在连续型信息的表达方式为一致的历史基础信息,也有利于从连续型信息中了解到用户比较偏向于哪种兴趣类型的信息。
S303、将综合类别特征以及综合连续特征进行拼接,得到历史综合特征。
可选地,将综合类别特征以及综合连续特征进行拼接得到的向量输入到推荐模型中的DNN网络结构中进行处理,得到历史综合特征。
S304、对两个序列中的类别序列采用类别编码的处理方式进行特征处理,得到长兴趣序列特征以及短兴趣序列特征。
其中,两个序列中的类别序列主要指用户的id、cate、topic等信息内容所形成的序列。
可选地,对正样本数据中的类别序列采用类别编码的处理方式进行特征处理,得到正样本数据对应的长兴趣序列特征以及短兴趣序列特征,或者对负样本数据中的类别序列采用类别编码的处理方式进行特征处理,得到负样本数据对应的长兴趣序列特征以及短兴趣序列特征。
S203、将样本数据对应的特征向量输入预先训练好的推荐模型中,通过推荐模型得到各个兴趣内容对应的打分结果。
可选地,推荐模型基于多头注意力机制网络、长短记忆循环神经网络以及Activation机制等等神经网络机制进行构建。所以在本申请实施例中,基于神经网络机制对推荐模型进行训练,得到训练结果。
可选地,在本申请另一实施例中,如图4所示该推荐模型可以包括输入层、兴趣提取层、兴趣融合层以及输出层,相应地在本申请实施例中,步骤S203的一种具体实施方式,如图5所示,包括以下步骤:
S501、通过输入层获取样本数据对应的特征向量。
需要说明的是,需要将获取样本数据对应的特征向量输入到兴趣提取层进行处理,以便于后续从该样本数据中提取出用户的长兴趣内容以及短兴趣内容。
S502、通过兴趣提取层中的长兴趣提取层对历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过兴趣提取层中的短兴趣提取层对历史短兴趣序列特征进行特征提取,得到短序列矩阵。
需要说明的是,在本申请实施例中,步骤S502中的长兴趣提取层可以包括长短记忆循环神经网络以及多头自注意力机制,短兴趣提取层可以包括多头自注意力机制,所以步骤S502具体实施方式为:
通过长短记忆循环神经网络以及多头自注意力机制对历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过多头自注意力机制对历史短兴趣序列特征进行特征提取,得到短序列矩阵。
需要说明的是,通过长短记忆循环神经网络以及多头自注意力机制对历史长兴趣序列特征进行特征提取,首先需要将历史长兴趣序列特征输入到长短记忆循环神经网络中,通过该方式,可以从历史长兴趣序列特征中提取出Item序列内部关系,可以从该Item序列内部关系中了解历史长兴趣序列特征之间是否存在一定的关联关系,比如:商品类型是否相似或者商品名称是否相似等等,从而有效地了解用户感兴趣的内容。然后再将该历史长兴趣序列特征输入到多头自注意力机制,用于提取用户的多种兴趣内容,从而得到长序列矩阵。
还需要说明的是,将历史短兴趣序列特征输入到短兴趣提取层,通过短兴趣提取层中的多头自注意力机制对历史短兴趣序列特征进行特征提取,得到历史短兴趣序列特征对应的Item隐式关联表达的短序列矩阵,其中,一组样本数据中的序列通过该多头自注意力机制进行处理,可以得到相应的一个含有Item隐式关联表达的item表征的矩阵。
可选地,上述同时对历史长兴趣序列特征以及历史短兴趣序列特征进行特征处理,仅是其中一种可选的特征处理方式,当然,也可以是先对历史长兴趣序列特征进行特征处理,再对历史短兴趣序列特征进行特征处理。
S503、通过兴趣融合层将长序列矩阵、短序列矩阵与目标积拼接后的向量进行全连接处理,得到权重。
其中,目标积指代长序列矩阵与短序列矩阵的内积。
需要说明的是,兴趣融合层主要包含Activation的网络结构,用于动态的给长兴趣内容以及短兴趣内容调整兴趣内容的权重。
还需要说明的是,需要将长序列矩阵、短序列矩阵与目标积拼接后的向量输入到兴趣融合层中的多层深度神经网络进行处理,最后才得到调整兴趣内容的权重。
S504、通过兴趣融合层将权重与短序列矩阵相乘,得到目标值与短序列矩阵对应的乘积,并将乘积与长序列矩阵进行拼接,得到拼接特征向量。
S505、通过输出层将历史综合特征与拼接特征向量拼接后的向量进行处理,得到各个兴趣内容的打分结果。
需要说明的是,输出层主要由DNN网络结构组成及其他的网络结构组合而成,通过兴趣融合层向输出层传输的拼接特征向量,将该拼接特征向量输入到输出层中的DNN深度神经网络进行处理,得到各个兴趣内容的打分结果,再利用函数对打分结果进行处理,例如,可以利用sigmod函数,此时会将该打分结果处理在预设范围值之内,越接近预设范围值的打分结果表示该打分结果越高,因此该打分结果的兴趣内容会优先向用户推荐,但越远离预设范围值的打分结果表示该打分结果越低,可能该打分结果的兴趣内容会最后才向用户推荐。
可选的,预设范围的阈值长度为0~1,当然,也可以是其他阈值长度,具体可以根据需求设置。
S204、分别针对各个兴趣内容,判断兴趣内容的打分结果是否小于预设阈值。
可选地,步骤S203中的通过推荐模型得到各个兴趣内容对应的打分结果可能不满足后续将兴趣内容推荐给用户的要求,所以还需要对打分结果进一步的判断,所以再得到各个兴趣内容对应的打分结果之后,会判断兴趣内容的打分结果是否小于预设阈值,若该兴趣内容的打分结果小于预设阈值,说明需要对推荐模型进行迭代训练,则执行步骤S205。若该兴趣内容的打分结果大于预设阈值,说明该兴趣内容的打分结果满足向用户推荐兴趣内容的要求,则执行步骤S206。
S205、调整推荐模型的参数。
需要说明的是,当兴趣内容的打分结果小于预设阈值时,调整完推荐模型的参数之后,需要返回执行步骤S203,直至打分结果大于预设阈值。
S206、将推荐模型确定为训练好的推荐模型。
S104、基于各个兴趣内容的打分结果,向用户推荐兴趣内容。
可选地,可以将各个兴趣内容按照打分结果高至低的顺序进行排序,依次向用户推荐兴趣内容。也可以按照打分结果的高低顺序,仅将排名前N位的兴趣内容,依次推荐给用户。当然,也可以是基于打分结果采用其他的推荐策略。
本申请提供的一种兴趣内容的推荐方法,通过获取用户的长时间的兴趣内容以及短时间的兴趣内容,以实现向用户推荐准确地兴趣内容。通过获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的目标信息。其次分别对当前基础信息、当前第一预设时间段内的目标信息中的序列以及当前第二预设时间段内的目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征,然后将当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征输入预先训练好的推荐模型中,最后得到各个兴趣内容的打分结果。由于推荐模型预先利用用户的基础信息、多个正样本数据以及负样本数据训练得到。因此基于各个兴趣内容的打分结果,向用户推荐兴趣内容。从而不再利用大数据的计算方式去计算用户所感兴趣内容的相似内容,而是根据用户的长短兴趣,有效地向用户推荐准确的兴趣内容。
本申请另一实施例提供了一种兴趣内容的推荐装置,如图6所示,包括:
第一获取单元601,用于获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的目标信息。
其中,目标信息包括在对应时间段内浏览的兴趣内容的序列以及各个兴趣内容的基础信息,第一预设时间段大于第二预设时间段。
第一处理单元602,用于分别对当前基础信息、当前第一预设时间段内的目标信息中的序列以及当前第二预设时间段内的目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征。
其中,当前基础信息包括用户的基础信息以及目标信息中的兴趣内容的基础信息。
第一输入单元603,用于将当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征输入预先训练好的推荐模型中,得到各个兴趣内容的打分结果。
其中,推荐模型预先利用用户的基础信息、多个正样本数据以及负样本数据训练得到,一个正样本数据包括历史第一预设时间段内和历史第二预设时间段内的正向数据,正向数据包括在对应时间段内浏览并点击的兴趣内容的序列以及兴趣内容的基础信息,一个负样本数据包括历史第一预设时间段内和历史第二预设时间段内的负向数据,负向数据包括在对应时间段内浏览并未点击的兴趣内容的序列以及兴趣内容的基础信息。
推荐单元604,用于基于各个兴趣内容的打分结果,向用户推荐兴趣内容。
需要说明的是,本申请实施例中的上述单元的具体工作过程可相应地参考上述方法实施例中的步骤S101~步骤S104,此处不再赘述。
可选地,本申请另一实施例中,还包括以下单元:
第二获取单元,用于获取用户的基础信息、多个正样本数据以及负样本数据。
第二处理单元,用于针对每组样本数据,分别对样本数据中的历史基础信息以及两个序列进行特征处理,得到样本数据对应的特征向量。
其中,每组样本数据包括用户的基础信息以及一个正样本数据或一个负样本数据,历史基础信息包括用户的基础信息、正数据样本中的兴趣内容的基础信息以及负数据样本中的兴趣内容的基础信息,样本数据对应的特征向量包括历史综合特征、历史长兴趣序列特征以及历史短兴趣序列特征。
第二输入单元,用于将样本数据对应的特征向量输入预先训练好的推荐模型中,通过推荐模型得到各个兴趣内容对应的打分结果。
判断单元,用于分别针对各个兴趣内容,判断兴趣内容的打分结果是否小于预设阈值。
调整单元,用于若兴趣内容的打分结果小于预设阈值,则调整推荐模型的参数,返回第二输入单元执行将样本数据对应的特征向量输入预先训练好的推荐模型中,通过推荐模型得到各个兴趣内容对应的打分结果。
确定单元,用于若兴趣内容的打分结果大于预设阈值,则将推荐模型确定为训练好的推荐模型。
需要说明的是,本申请上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
可选地,本申请另一实施例中,第二处理单元,包括:
第三处理单元,用于对历史基础信息中的类别型信息采用类别编码的处理方式进行特征处理,得到综合类别特征。
第四处理单元,用于对历史基础信息中的连续型信息采用归一化的处理方式进行特征处理,得到综合连续特征。
第一拼接单元,用于将综合类别特征以及综合连续特征进行拼接,得到历史综合特征。
第五处理单元,用于对两个序列中的类别序列采用类别编码的处理方式进行特征处理,得到长兴趣序列特征以及短兴趣序列特征。
需要说明的是,本申请上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
可选地,本申请另一实施例中,推荐模型包括输入层、兴趣提取层、兴趣融合层以及输出层,第二输入单元,包括:
第三获取单元,用于通过输入层获取样本数据对应的特征向量。
第一提取单元,用于通过兴趣提取层中的长兴趣提取层对历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过兴趣提取层中的短兴趣提取层对历史短兴趣序列特征进行特征提取,得到短序列矩阵。
第六处理单元,用于通过兴趣融合层将长序列矩阵、短序列矩阵与目标积拼接后的向量进行全连接处理,得到权重。
其中,目标积指代长序列矩阵与短序列矩阵的内积。
第二拼接单元,用于通过兴趣融合层将权重与短序列矩阵相乘,得到目标值与短序列矩阵对应的乘积,并将乘积与长序列矩阵进行拼接,得到拼接特征向量。
第七处理单元,用于通过输出层将历史综合特征与拼接特征向量拼接后的向量进行处理,得到各个兴趣内容的打分结果。
需要说明的是,本申请上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
可选地,本申请另一实施例中,长兴趣提取层包括长短记忆循环神经网络以及多头自注意力机制,短兴趣提取层包括多头自注意力机制,第一提取单元,包括:
第二提取单元,用于通过长短记忆循环神经网络以及多头自注意力机制对历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过多头自注意力机制对历史短兴趣序列特征进行特征提取,得到短序列矩阵。
需要说明的是,本申请上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
本申请另一实施例提供了一种电子设备,如图7所示,包括:
存储器701和处理器702。
其中,存储器701用于存储程序。
处理器702用于执行程序,程序被执行时,具体用于实现如上述任意一个实施例提供的兴趣内容的推荐方法。
本申请另一实施例提供了一种计算机存储介质,用于存储计算机程序,计算机程序被执行时,用于实现如上述任意一个实施例提供的兴趣内容的推荐方法。
计算机存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种兴趣内容的推荐方法,其特征在于,包括:
获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的所述目标信息;其中,所述目标信息包括在对应时间段内浏览的兴趣内容的序列以及各个所述兴趣内容的基础信息;所述第一预设时间段大于所述第二预设时间段;
分别对当前基础信息、所述当前第一预设时间段内的所述目标信息中的序列以及所述当前第二预设时间段内的所述目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征;其中,所述当前基础信息包括所述用户的基础信息以及所述目标信息中的所述兴趣内容的基础信息;
将所述当前综合特征、所述当前长兴趣序列特征以及所述当前短兴趣序列特征输入预先训练好的推荐模型中,得到各个所述兴趣内容的打分结果;其中,所述推荐模型预先利用所述用户的基础信息、多个正样本数据以及负样本数据训练得到;一个所述正样本数据包括历史第一预设时间段内和历史第二预设时间段内的正向数据;所述正向数据包括在对应时间段内浏览并点击的兴趣内容的序列以及所述兴趣内容的基础信息;一个所述负样本数据包括所述历史第一预设时间段内和所述历史第二预设时间段内的负向数据;所述负向数据包括在对应时间段内浏览并未点击的兴趣内容的序列以及所述兴趣内容的基础信息;
基于各个所述兴趣内容的打分结果,向所述用户推荐所述兴趣内容。
2.根据权利要求1所述的方法,其特征在于,所述推荐模型的训练方法,包括:
获取所述用户的基础信息、多个所述正样本数据以及所述负样本数据;
针对每组样本数据,分别对所述样本数据中的历史基础信息以及两个序列进行特征处理,得到所述样本数据对应的特征向量;其中,每组所述样本数据包括所述用户的基础信息以及一个所述正样本数据或一个负样本数据;所述历史基础信息包括所述用户的基础信息、所述正数据样本中的所述兴趣内容的基础信息以及所述负数据样本中的所述兴趣内容的基础信息;所述样本数据对应的特征向量包括历史综合特征、历史长兴趣序列特征以及历史短兴趣序列特征;
将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果;
分别针对各个所述兴趣内容,判断所述兴趣内容的打分结果是否小于预设阈值;
若所述兴趣内容的打分结果小于所述预设阈值,则调整所述推荐模型的参数,返回执行所述将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果;
若所述兴趣内容的打分结果大于所述预设阈值,则将所述推荐模型确定为训练好的所述推荐模型。
3.根据权利要求2所述的方法,其特征在于,所述分别对所述样本数据中的历史基础信息以及两个序列进行特征处理,得到所述样本数据对应的特征向量,包括:
对所述历史基础信息中的类别型信息采用类别编码的处理方式进行特征处理,得到综合类别特征;
对所述历史基础信息中的连续型信息采用归一化的处理方式进行特征处理,得到综合连续特征;
将所述综合类别特征以及所述综合连续特征进行拼接,得到所述历史综合特征;
对两个所述序列中的类别序列采用所述类别编码的处理方式进行特征处理,得到所述长兴趣序列特征以及所述短兴趣序列特征。
4.根据权利要求2所述的方法,其特征在于,所述推荐模型包括输入层、兴趣提取层、兴趣融合层以及输出层,所述将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果,包括:
通过所述输入层获取所述样本数据对应的特征向量;
通过所述兴趣提取层中的长兴趣提取层对所述历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过所述兴趣提取层中的短兴趣提取层对所述历史短兴趣序列特征进行特征提取,得到短序列矩阵;
通过所述兴趣融合层将所述长序列矩阵、所述短序列矩阵与目标积拼接后的向量进行全连接处理,得到权重;其中,所述目标积指代所述长序列矩阵与所述短序列矩阵的内积;
通过所述兴趣融合层将所述权重与所述短序列矩阵相乘,得到所述目标值与所述短序列矩阵对应的乘积,并将所述乘积与所述长序列矩阵进行拼接,得到拼接特征向量;
通过所述输出层将所述历史综合特征与所述拼接特征向量拼接后的向量进行处理,得到各个所述兴趣内容的打分结果。
5.根据权利要求4所述的方法,其特征在于,所述长兴趣提取层包括长短记忆循环神经网络以及多头自注意力机制,所述短兴趣提取层包括所述多头自注意力机制,所述通过所述兴趣提取层中的长兴趣提取层对所述历史长兴趣序列特征进行特征提取,得到长序列矩阵,以及通过所述兴趣提取层中的短兴趣提取层对所述历史短兴趣序列特征进行特征提取,得到短序列矩阵,包括:
通过长短记忆循环神经网络以及多头自注意力机制对所述历史长兴趣序列特征进行特征提取,得到所述长序列矩阵,以及通过所述多头自注意力机制对历史短兴趣序列特征进行特征提取,得到所述短序列矩阵。
6.一种兴趣内容的推荐装置,其特征在于,包括:
第一获取单元,用于获取用户的基础信息、当前第一预设时间段内的目标信息以及当前第二预设时间段内的所述目标信息;其中,所述目标信息包括在对应时间段内浏览的兴趣内容的序列以及各个所述兴趣内容的基础信息;所述第一预设时间段大于所述第二预设时间段;
第一处理单元,用于分别对当前基础信息、所述当前第一预设时间段内的所述目标信息中的序列以及所述当前第二预设时间段内的所述目标信息中的序列进行特征处理,得到当前综合特征、当前长兴趣序列特征以及当前短兴趣序列特征;其中,所述当前基础信息包括所述用户的基础信息以及所述目标信息中的所述兴趣内容的基础信息;
第一输入单元,用于将所述当前综合特征、所述当前长兴趣序列特征以及所述当前短兴趣序列特征输入预先训练好的推荐模型中,得到各个所述兴趣内容的打分结果;其中,所述推荐模型预先利用所述用户的基础信息、多个正样本数据以及负样本数据训练得到;一个所述正样本数据包括历史第一预设时间段内和历史第二预设时间段内的正向数据;所述正向数据包括在对应时间段内浏览并点击的兴趣内容的序列以及所述兴趣内容的基础信息;一个所述负样本数据包括所述历史第一预设时间段内和所述历史第二预设时间段内的负向数据;所述负向数据包括在对应时间段内浏览并未点击的兴趣内容的序列以及所述兴趣内容的基础信息;
推荐单元,用于基于各个所述兴趣内容的打分结果,向所述用户推荐所述兴趣内容。
7.根据权利要求6所述的装置,其特征在于,还包括:
第二获取单元,用于获取所述用户的基础信息、多个所述正样本数据以及所述负样本数据;
第二处理单元,用于针对每组样本数据,分别对所述样本数据中的历史基础信息以及两个序列进行特征处理,得到所述样本数据对应的特征向量;其中,每组所述样本数据包括所述用户的基础信息以及一个所述正样本数据或一个负样本数据;所述历史基础信息包括所述用户的基础信息、所述正数据样本中的所述兴趣内容的基础信息以及所述负数据样本中的所述兴趣内容的基础信息;所述样本数据对应的特征向量包括历史综合特征、历史长兴趣序列特征以及历史短兴趣序列特征;
第二输入单元,用于将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果;
判断单元,用于分别针对各个所述兴趣内容,判断所述兴趣内容的打分结果是否小于预设阈值;
调整单元,用于若所述兴趣内容的打分结果小于所述预设阈值,则调整所述推荐模型的参数,返回执行所述将所述样本数据对应的特征向量输入预先训练好的所述推荐模型中,通过所述推荐模型得到各个所述兴趣内容对应的打分结果;
确定单元,用于若所述兴趣内容的打分结果大于所述预设阈值,则将所述推荐模型确定为训练好的所述推荐模型。
8.根据权利要求7所述的装置,其特征在于,所述第二处理单元,包括:
第三处理单元,用于对所述历史基础信息中的类别型信息采用类别编码的处理方式进行特征处理,得到综合类别特征;
第四处理单元,用于对所述历史基础信息中的连续型信息采用归一化的处理方式进行特征处理,得到综合连续特征;
第一拼接单元,用于将所述综合类别特征以及所述综合连续特征进行拼接,得到所述历史综合特征;
第五处理单元,用于对两个所述序列中的类别序列采用所述类别编码的处理方式进行特征处理,得到所述长兴趣序列特征以及所述短兴趣序列特征。
9.一种电子设备,其特征在于,包括:
存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如权利要求1至5任意一项所述的兴趣内容的推荐方法。
10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,用于实现如权利要求1至5任意一项所述的兴趣内容的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210326515.5A CN114677176A (zh) | 2022-03-30 | 2022-03-30 | 兴趣内容的推荐方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210326515.5A CN114677176A (zh) | 2022-03-30 | 2022-03-30 | 兴趣内容的推荐方法及装置、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114677176A true CN114677176A (zh) | 2022-06-28 |
Family
ID=82076194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210326515.5A Pending CN114677176A (zh) | 2022-03-30 | 2022-03-30 | 兴趣内容的推荐方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114677176A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115147679A (zh) * | 2022-06-30 | 2022-10-04 | 北京百度网讯科技有限公司 | 多模态图像识别方法和装置、模型训练方法和装置 |
-
2022
- 2022-03-30 CN CN202210326515.5A patent/CN114677176A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115147679A (zh) * | 2022-06-30 | 2022-10-04 | 北京百度网讯科技有限公司 | 多模态图像识别方法和装置、模型训练方法和装置 |
CN115147679B (zh) * | 2022-06-30 | 2023-11-14 | 北京百度网讯科技有限公司 | 多模态图像识别方法和装置、模型训练方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107451199B (zh) | 问题推荐方法及装置、设备 | |
CN108255857B (zh) | 一种语句检测方法及装置 | |
CN111523976A (zh) | 商品推荐方法、装置、电子设备及存储介质 | |
CN106557480B (zh) | 查询改写的实现方法及装置 | |
CN112800097A (zh) | 基于深度兴趣网络的专题推荐方法及装置 | |
CN110647683B (zh) | 一种信息推荐方法、装置 | |
CN108550046A (zh) | 一种资源和营销推荐方法、装置及电子设备 | |
US20220172083A1 (en) | Noise contrastive estimation for collaborative filtering | |
CN112163149B (zh) | 推荐消息的方法及装置 | |
CN111061954A (zh) | 搜索结果排序方法、装置及存储介质 | |
CN114168843A (zh) | 搜索词推荐方法、设备及存储介质 | |
CN111506733B (zh) | 对象画像的生成方法、装置、计算机设备和存储介质 | |
CN113343091A (zh) | 面向产业和企业的科技服务推荐计算方法、介质及程序 | |
TW201734909A (zh) | 一種目標用戶的識別方法和裝置 | |
CN105786936A (zh) | 用于对搜索数据进行处理的方法及设备 | |
CN114677176A (zh) | 兴趣内容的推荐方法及装置、电子设备、存储介质 | |
CN113220974B (zh) | 点击率预测模型训练、搜索召回方法、装置、设备及介质 | |
CN114417146A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN112464106B (zh) | 对象推荐方法及装置 | |
CN111680213A (zh) | 信息推荐方法、数据处理方法及装置 | |
CN112765342B (zh) | 一种基于时间与语义的文章推荐方法 | |
CN112445909A (zh) | 商品检索方法及装置 | |
CN114971760A (zh) | 一种基于大数据的车型推荐方法、装置、电子设备及介质 | |
CN113378071A (zh) | 广告推荐方法及装置、电子设备、存储介质 | |
US20190026374A1 (en) | Search method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |