CN117454016B - 基于改进点击预测模型的对象推荐方法及装置 - Google Patents
基于改进点击预测模型的对象推荐方法及装置 Download PDFInfo
- Publication number
- CN117454016B CN117454016B CN202311765866.7A CN202311765866A CN117454016B CN 117454016 B CN117454016 B CN 117454016B CN 202311765866 A CN202311765866 A CN 202311765866A CN 117454016 B CN117454016 B CN 117454016B
- Authority
- CN
- China
- Prior art keywords
- feature
- network
- layer
- screening
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012216 screening Methods 0.000 claims abstract description 180
- 230000004927 fusion Effects 0.000 claims abstract description 72
- 230000004913 activation Effects 0.000 claims abstract description 51
- 238000012545 processing Methods 0.000 claims description 66
- 230000003993 interaction Effects 0.000 claims description 53
- 230000006870 function Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种基于改进点击预测模型的对象推荐方法及装置。该方法包括:构建第一特征筛选网络和第二特征筛选网络;利用激活函数和多个权重参数构建特征融合网络;在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入第一特征筛选网络,在嵌入层和右塔网络之间插入第二特征筛选网络,在左塔网络和右塔网络与全连接层之间插入特征融合网络,得到改进的点击预测模型。采用上述技术手段,解决现有技术中,目前基于双塔结构的点击预测模型预测准确率低的问题。
Description
技术领域
本申请涉及机器学习技术领域,尤其涉及一种基于改进点击预测模型的对象推荐方法及装置。
背景技术
在网络购物、新闻阅读和视频观看等应用中,都存在为用户推荐适合的对象,提供更加智能的服务的需求。现有技术常利用点击预测模型为用户推荐适对象,点击预测模型(Click Through Rate,CTR),可以估计用户点击一个目标的概率。为了增强特征交互,现有技术常采用基于双塔结构的点击预测模型,但是因为双塔的输入是一样的,且对双塔的输出特征融合不充分,所以目前基于双塔结构的点击预测模型预测准确率低的问题。
发明内容
有鉴于此,本申请实施例提供了一种基于改进点击预测模型的对象推荐方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,目前基于双塔结构的点击预测模型预测准确率低的问题。
本申请实施例的第一方面,提供了一种基于改进点击预测模型的对象推荐方法,包括:构建第一特征筛选网络和第二特征筛选网络,其中,第一特征筛选网络和第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,第一特征筛选网络和第二特征筛选网络中的注意力层被初始化后的参数不同,交互层用于对输入该交互层的两个特征进行矩阵相乘;利用激活函数和多个权重参数构建特征融合网络,其中,特征融合网络用于按照多个权重参数进行特征融合;在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入第一特征筛选网络,在嵌入层和右塔网络之间插入第二特征筛选网络,在左塔网络和右塔网络与全连接层之间插入特征融合网络,得到改进的点击预测模型,其中,第一特征筛选网络和第二特征筛选网络中的交互层还与嵌入层存在连接,传统的基于双塔结构的点击预测模型是由嵌入层、左塔网络、右塔网络和全连接层依次连接组成的,左塔网络和右塔网络是并行连接;利用改进的点击预测模型向用户推荐对象。
本申请实施例的第二方面,提供了一种基于改进点击预测模型的对象推荐方法装置,包括:第一构建模块,被配置为构建第一特征筛选网络和第二特征筛选网络,其中,第一特征筛选网络和第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,第一特征筛选网络和第二特征筛选网络中的注意力层被初始化后的参数不同,交互层用于对输入该交互层的两个特征进行矩阵相乘;第二构建模块,被配置为利用激活函数和多个权重参数构建特征融合网络,其中,特征融合网络用于按照多个权重参数进行特征融合;第三构建模块,被配置为在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入第一特征筛选网络,在嵌入层和右塔网络之间插入第二特征筛选网络,在左塔网络和右塔网络与全连接层之间插入特征融合网络,得到改进的点击预测模型,其中,第一特征筛选网络和第二特征筛选网络中的交互层还与嵌入层存在连接,传统的基于双塔结构的点击预测模型是由嵌入层、左塔网络、右塔网络和全连接层依次连接组成的,左塔网络和右塔网络是并行连接;推荐模块,被配置为利用改进的点击预测模型向用户推荐对象。
本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:因为本申请实施例通过构建第一特征筛选网络和第二特征筛选网络,其中,第一特征筛选网络和第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,第一特征筛选网络和第二特征筛选网络中的注意力层被初始化后的参数不同,交互层用于对输入该交互层的两个特征进行矩阵相乘;利用激活函数和多个权重参数构建特征融合网络,其中,特征融合网络用于按照多个权重参数进行特征融合;在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入第一特征筛选网络,在嵌入层和右塔网络之间插入第二特征筛选网络,在左塔网络和右塔网络与全连接层之间插入特征融合网络,得到改进的点击预测模型,其中,第一特征筛选网络和第二特征筛选网络中的交互层还与嵌入层存在连接,传统的基于双塔结构的点击预测模型是由嵌入层、左塔网络、右塔网络和全连接层依次连接组成的,左塔网络和右塔网络是并行连接;利用改进的点击预测模型向用户推荐对象。采用上述技术手段,可以解决现有技术中,目前基于双塔结构的点击预测模型预测准确率低的问题,进而提高目前基于双塔结构的点击预测模型预测准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例提供的一种基于改进点击预测模型的对象推荐方法的流程示意图(一);
图2是本申请实施例提供的一种基于改进点击预测模型的对象推荐方法的流程示意图(二);
图3是本申请实施例提供的一种基于改进点击预测模型的对象推荐方法装置的结构示意图;
图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
图1是本申请实施例提供的一种基于改进点击预测模型的对象推荐方法的流程示意图(一)。图1的基于改进点击预测模型的对象推荐方法可以由计算机或服务器,或者计算机或服务器上的软件执行。如图1所示,该基于改进点击预测模型的对象推荐方法包括:
S101,构建第一特征筛选网络和第二特征筛选网络,其中,第一特征筛选网络和第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,第一特征筛选网络和第二特征筛选网络中的注意力层被初始化后的参数不同,交互层用于对输入该交互层的两个特征进行矩阵相乘;
S102,利用激活函数和多个权重参数构建特征融合网络,其中,特征融合网络用于按照多个权重参数进行特征融合;
S103,在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入第一特征筛选网络,在嵌入层和右塔网络之间插入第二特征筛选网络,在左塔网络和右塔网络与全连接层之间插入特征融合网络,得到改进的点击预测模型,其中,第一特征筛选网络和第二特征筛选网络中的交互层还与嵌入层存在连接,传统的基于双塔结构的点击预测模型是由嵌入层、左塔网络、右塔网络和全连接层依次连接组成的,左塔网络和右塔网络是并行连接;
S104,利用改进的点击预测模型向用户推荐对象。
传统的基于双塔结构的点击预测模型内部的连接关系是:嵌入层分别连接左塔网络和右塔网络,左塔网络和右塔网络均连接全连接层,左塔网络和右塔网络是并行连接,左塔网络和右塔网络常用多层感知机。改进的点击预测模型内部的连接关系是:嵌入层分别连接到第一特征筛选网络和第二特征筛选网络上,第一特征筛选网络连接到左塔网络上,第二特征筛选网络连接到右塔网络上,左塔网络和右塔网络均连接到特征融合网络上,特征融合网络连接到全连接层上。本申请实施例相对于现有技术,在基于双塔结构的点击预测模型中新增了第一特征筛选网络、第二特征筛选网络和特征融合网络。
需要说明的是,第一特征筛选网络和第二特征筛选网络的输入均是嵌入层的输出,嵌入层的输出是拼接特征。因为第一特征筛选网络和第二特征筛选网络中的注意力层被初始化后的参数不同,所以注意力层为拼接特征中不同元素分配的权重不同,进而第一特征筛选网络和第二特征筛选网络的输出是不同的,所以左塔网络和右塔网络的输入不同,实现双塔结构差异化的特征输入。第一特征筛选网络和第二特征筛选网络中的注意力层可以选用SENet网络,也即是Squeeze-and-Excitation Networks。新插入的特征融合网络也实现了左塔网络和右塔网络输出特征的更好融合。
本申请实施例中训练得到的点击预测模型可以用于网络购物、新闻阅读以及视频观看等场景中预测用户喜欢的目标,将预测的目标推荐给用户。如在网络购物场景中是预测推荐给用户的商品;如在新闻阅读场景中是预测推荐给用户的文本;如在视频观看场景中是预测推荐给用户的视频。
根据本申请实施例提供的技术方案,构建第一特征筛选网络和第二特征筛选网络,其中,第一特征筛选网络和第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,第一特征筛选网络和第二特征筛选网络中的注意力层被初始化后的参数不同,交互层用于对输入该交互层的两个特征进行矩阵相乘;利用激活函数和多个权重参数构建特征融合网络,其中,特征融合网络用于按照多个权重参数进行特征融合;在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入第一特征筛选网络,在嵌入层和右塔网络之间插入第二特征筛选网络,在左塔网络和右塔网络与全连接层之间插入特征融合网络,得到改进的点击预测模型,其中,第一特征筛选网络和第二特征筛选网络中的交互层还与嵌入层存在连接,传统的基于双塔结构的点击预测模型是由嵌入层、左塔网络、右塔网络和全连接层依次连接组成的,左塔网络和右塔网络是并行连接;利用改进的点击预测模型向用户推荐对象。采用上述技术手段,可以解决现有技术中,目前基于双塔结构的点击预测模型预测准确率低的问题,进而提高目前基于双塔结构的点击预测模型预测准确率。
图2是本申请实施例提供的一种基于改进点击预测模型的对象推荐方法的流程示意图(二)。如图2所示,包括:
S201,获取用户的用户信息、对象的对象信息以及对象对应的场景信息,其中,场景信息是用户和对象交互的相关信息;
S202,将用户信息、对象信息以及场景信息输入改进的点击预测模型:
S203,通过嵌入层对用户信息、对象信息以及场景信息进行处理,得到拼接特征;
S204,通过第一特征筛选网络对拼接特征进行处理,得到第一筛选特征;
S205,通过左塔网络对第一筛选特征进行处理,得到第一分支特征;
S206,通过第二特征筛选网络对拼接特征进行处理,得到第二筛选特征;
S207,通过右塔网络对第二筛选特征进行处理,得到第二分支特征;
S208,通过特征融合网络对第一分支特征和第二分支特征进行处理,得到融合特征;
S209,通过全连接层对融合特征进行处理,得到是否向用户推荐对象的判断结果。
以网络购物为例(对象为商品),用户信息,包括:用户的年龄、性别和收入等;对象信息,包括:商品的分类、品牌和价格等;场景信息,包括:用户点击查看商品的时间、位置以及用户对商品的操作等:用户点击查看商品的位置可以是商品首页、商品详情页、购物车等,用户对商品的操作包括收藏、关注、购买等。判断结果包括向用户推荐对象和不向用户推荐对象。
进一步地,通过嵌入层对用户信息、对象信息以及场景信息进行处理,得到拼接特征,包括:分别提取用户信息、对象信息以及场景信息的特征,得到用户特征、对象特征以及场景特征;拼接用户特征、对象特征以及场景特征得到拼接特征。
为了更清楚的理解用户信息、对象信息以及场景信息至拼接特征的过程,可以看作嵌入层后接拼接层,嵌入层用于将用户信息、对象信息以及场景信息的特征分别转换为用户特征、对象特征以及场景特征,拼接层用于拼接用户特征、对象特征以及场景特征得到拼接特征。
进一步地,通过特征融合网络对第一分支特征和第二分支特征进行处理,得到融合特征,包括:
;
其中,y为融合特征,σ为sigmoid函数,b、w1、w2和w3均为可学习的权重,o1为第一分支特征,o2为第二分支特征,o1T为第一分支特征的转置。
第一特征筛选网络和第二特征筛选网络中的激活层可以是sigmoid函数构成的。
进一步地,通过第一特征筛选网络对拼接特征进行处理,得到第一筛选特征,包括:通过第一特征筛选网络中的注意力层对拼接特征进行处理,得到第一注意力特征;通过激活层对拼接特征进行处理,得到第一激活特征,其中,激活层是sigmoid函数构成的;通过交互层对第一激活特征和拼接特征进行处理,得到第一筛选特征。
第一特征筛选网络中的交互层与第一特征筛选网络中的激活层和嵌入层均存在连接,第一特征筛选网络中的交互层对第一特征筛选网络中的激活层和嵌入层的输出进行矩阵相乘,也就是对第一激活特征和拼接特征进行矩阵相乘,得到第一筛选特征。
进一步地,通过第二特征筛选网络对拼接特征进行处理,得到第二筛选特征,包括:通过第二特征筛选网络中的注意力层对拼接特征进行处理,得到第二注意力特征;通过激活层对拼接特征进行处理,得到第二激活特征,其中,激活层是sigmoid函数构成的;通过交互层对第二激活特征和拼接特征进行处理,得到第二筛选特征。
第二特征筛选网络中的交互层与第二特征筛选网络中的激活层和嵌入层均存在连接,第二特征筛选网络中的交互层对第二特征筛选网络中的激活层和嵌入层的输出进行矩阵相乘,也就是对第二激活特征和拼接特征进行矩阵相乘,得到第二筛选特征。
进一步地,利用改进的点击预测模型向用户推荐对象之前,方法还包括:对改进的点击预测模型进行训练:获取训练数据,训练数据中的训练样本的样本信息包括用户的用户信息、对象的对象信息以及对象对应的场景信息,其中,场景信息是用户和对象交互的相关信息;将训练样本的样本信息输入改进的点击预测模型:通过嵌入层对用户信息、对象信息以及场景信息进行处理,得到拼接特征;通过第一特征筛选网络对拼接特征进行处理,得到第一筛选特征;通过左塔网络对第一筛选特征进行处理,得到第一分支特征;通过第二特征筛选网络对拼接特征进行处理,得到第二筛选特征;通过右塔网络对第二筛选特征进行处理,得到第二分支特征;通过特征融合网络对第一分支特征和第二分支特征进行处理,得到融合特征;通过全连接层对融合特征进行处理,得到是否向用户推荐对象的判断结果;通过交叉熵损失函数计算判断结果和训练样本的标签之间的损失值,利用损失值优化改进的点击预测模型的模型参数。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图3是本申请实施例提供的一种基于改进点击预测模型的对象推荐方法装置的示意图。如图3所示,该基于改进点击预测模型的对象推荐方法装置包括:
第一构建模块301,被配置为构建第一特征筛选网络和第二特征筛选网络,其中,第一特征筛选网络和第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,第一特征筛选网络和第二特征筛选网络中的注意力层被初始化后的参数不同,交互层用于对输入该交互层的两个特征进行矩阵相乘;
第二构建模块302,被配置为利用激活函数和多个权重参数构建特征融合网络,其中,特征融合网络用于按照多个权重参数进行特征融合;
第三构建模块303,被配置为在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入第一特征筛选网络,在嵌入层和右塔网络之间插入第二特征筛选网络,在左塔网络和右塔网络与全连接层之间插入特征融合网络,得到改进的点击预测模型,其中,第一特征筛选网络和第二特征筛选网络中的交互层还与嵌入层存在连接,传统的基于双塔结构的点击预测模型是由嵌入层、左塔网络、右塔网络和全连接层依次连接组成的,左塔网络和右塔网络是并行连接;
推荐模块304,被配置为利用改进的点击预测模型向用户推荐对象。
根据本申请实施例提供的技术方案,构建第一特征筛选网络和第二特征筛选网络,其中,第一特征筛选网络和第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,第一特征筛选网络和第二特征筛选网络中的注意力层被初始化后的参数不同,交互层用于对输入该交互层的两个特征进行矩阵相乘;利用激活函数和多个权重参数构建特征融合网络,其中,特征融合网络用于按照多个权重参数进行特征融合;在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入第一特征筛选网络,在嵌入层和右塔网络之间插入第二特征筛选网络,在左塔网络和右塔网络与全连接层之间插入特征融合网络,得到改进的点击预测模型,其中,第一特征筛选网络和第二特征筛选网络中的交互层还与嵌入层存在连接,传统的基于双塔结构的点击预测模型是由嵌入层、左塔网络、右塔网络和全连接层依次连接组成的,左塔网络和右塔网络是并行连接;利用改进的点击预测模型向用户推荐对象。采用上述技术手段,可以解决现有技术中,目前基于双塔结构的点击预测模型预测准确率低的问题,进而提高目前基于双塔结构的点击预测模型预测准确率。
在一些实施例中,推荐模块304还被配置为获取用户的用户信息、对象的对象信息以及对象对应的场景信息,其中,场景信息是用户和对象交互的相关信息;将用户信息、对象信息以及场景信息输入改进的点击预测模型:通过嵌入层对用户信息、对象信息以及场景信息进行处理,得到拼接特征;通过第一特征筛选网络对拼接特征进行处理,得到第一筛选特征;通过左塔网络对第一筛选特征进行处理,得到第一分支特征;通过第二特征筛选网络对拼接特征进行处理,得到第二筛选特征;通过右塔网络对第二筛选特征进行处理,得到第二分支特征;通过特征融合网络对第一分支特征和第二分支特征进行处理,得到融合特征;通过全连接层对融合特征进行处理,得到是否向用户推荐对象的判断结果。
在一些实施例中,推荐模块304还被配置为分别提取用户信息、对象信息以及场景信息的特征,得到用户特征、对象特征以及场景特征;拼接用户特征、对象特征以及场景特征得到拼接特征。
在一些实施例中,推荐模块304还被配置为通过特征融合网络对第一分支特征和第二分支特征进行处理,得到融合特征,包括:
;
其中,y为融合特征,σ为sigmoid函数,b、w1、w2和w3均为可学习的权重,o1为第一分支特征,o2为第二分支特征,o1T为第一分支特征的转置。
在一些实施例中,推荐模块304还被配置为通过第一特征筛选网络中的注意力层对拼接特征进行处理,得到第一注意力特征;通过激活层对拼接特征进行处理,得到第一激活特征,其中,激活层是sigmoid函数构成的;通过交互层对第一激活特征和拼接特征进行处理,得到第一筛选特征。
在一些实施例中,推荐模块304还被配置为通过第二特征筛选网络中的注意力层对拼接特征进行处理,得到第二注意力特征;通过激活层对拼接特征进行处理,得到第二激活特征,其中,激活层是sigmoid函数构成的;通过交互层对第二激活特征和拼接特征进行处理,得到第二筛选特征。
在一些实施例中,推荐模块304还被配置为对改进的点击预测模型进行训练:获取训练数据,训练数据中的训练样本的样本信息包括用户的用户信息、对象的对象信息以及对象对应的场景信息,其中,场景信息是用户和对象交互的相关信息;将训练样本的样本信息输入改进的点击预测模型:通过嵌入层对用户信息、对象信息以及场景信息进行处理,得到拼接特征;通过第一特征筛选网络对拼接特征进行处理,得到第一筛选特征;通过左塔网络对第一筛选特征进行处理,得到第一分支特征;通过第二特征筛选网络对拼接特征进行处理,得到第二筛选特征;通过右塔网络对第二筛选特征进行处理,得到第二分支特征;通过特征融合网络对第一分支特征和第二分支特征进行处理,得到融合特征;通过全连接层对融合特征进行处理,得到是否向用户推荐对象的判断结果;通过交叉熵损失函数计算判断结果和训练样本的标签之间的损失值,利用损失值优化改进的点击预测模型的模型参数。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图4是本申请实施例提供的电子设备4的示意图。如图4所示,该实施例的电子设备4包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。
电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备4的示例,并不构成对电子设备4的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器401可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器402可以是电子设备4的内部存储单元,例如,电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备,例如,电子设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (8)
1.一种基于改进点击预测模型的对象推荐方法,其特征在于,包括:
构建第一特征筛选网络和第二特征筛选网络,其中,所述第一特征筛选网络和所述第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,所述第一特征筛选网络和所述第二特征筛选网络中的注意力层被初始化后的参数不同,所述交互层用于对输入该交互层的两个特征进行矩阵相乘;
利用激活函数和多个权重参数构建特征融合网络,其中,所述特征融合网络用于按照多个权重参数进行特征融合;
在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入所述第一特征筛选网络,在所述嵌入层和右塔网络之间插入所述第二特征筛选网络,在所述左塔网络和所述右塔网络与全连接层之间插入所述特征融合网络,得到改进的点击预测模型,其中,所述第一特征筛选网络和所述第二特征筛选网络中的交互层还与所述嵌入层存在连接,传统的基于双塔结构的点击预测模型是由所述嵌入层、所述左塔网络、所述右塔网络和所述全连接层依次连接组成的,所述左塔网络和所述右塔网络是并行连接;
利用改进的点击预测模型向用户推荐对象;
其中,改进的点击预测模型用于网络购物、新闻阅读以及视频观看场景中预测用户喜欢的目标,将预测的目标推荐给用户;
其中,利用改进的点击预测模型向用户推荐对象,包括:获取所述用户的用户信息、所述对象的对象信息以及所述对象对应的场景信息,其中,所述场景信息是所述用户和所述对象交互的相关信息;将所述用户信息、所述对象信息以及所述场景信息输入改进的点击预测模型:通过所述嵌入层对所述用户信息、所述对象信息以及所述场景信息进行处理,得到拼接特征;通过所述第一特征筛选网络对所述拼接特征进行处理,得到第一筛选特征;通过所述左塔网络对所述第一筛选特征进行处理,得到第一分支特征;通过所述第二特征筛选网络对所述拼接特征进行处理,得到第二筛选特征;通过所述右塔网络对所述第二筛选特征进行处理,得到第二分支特征;通过所述特征融合网络对所述第一分支特征和所述第二分支特征进行处理,得到融合特征;通过所述全连接层对所述融合特征进行处理,得到是否向所述用户推荐所述对象的判断结果;
其中,通过所述嵌入层对所述用户信息、所述对象信息以及所述场景信息进行处理,得到拼接特征,包括:分别提取所述用户信息、所述对象信息以及所述场景信息的特征,得到用户特征、对象特征以及场景特征;拼接所述用户特征、所述对象特征以及所述场景特征得到所述拼接特征。
2.根据权利要求1所述的方法,其特征在于,通过所述特征融合网络对所述第一分支特征和所述第二分支特征进行处理,得到融合特征,包括:
其中,y为所述融合特征,σ为sigmoid函数,b、w1、w2和w3均为可学习的权重,o1为所述第一分支特征,o2为所述第二分支特征,o1T为所述第一分支特征的转置。
3.根据权利要求1所述的方法,其特征在于,通过所述第一特征筛选网络对所述拼接特征进行处理,得到第一筛选特征,包括:
通过所述第一特征筛选网络中的注意力层对所述拼接特征进行处理,得到第一注意力特征;
通过所述激活层对所述拼接特征进行处理,得到第一激活特征,其中,所述激活层是sigmoid函数构成的;
通过所述交互层对所述第一激活特征和所述拼接特征进行处理,得到所述第一筛选特征。
4.根据权利要求1所述的方法,其特征在于,通过所述第二特征筛选网络对所述拼接特征进行处理,得到第二筛选特征,包括:
通过所述第二特征筛选网络中的注意力层对所述拼接特征进行处理,得到第二注意力特征;
通过所述激活层对所述拼接特征进行处理,得到第二激活特征,其中,所述激活层是sigmoid函数构成的;
通过所述交互层对所述第二激活特征和所述拼接特征进行处理,得到所述第二筛选特征。
5.根据权利要求1所述的方法,其特征在于,利用激活函数和多个权重参数构建特征融合网络之后,所述方法还包括:
将所述嵌入层分别连接到所述第一特征筛选网络和所述第二特征筛选网络上,将所述第一特征筛选网络连接到所述左塔网络上,将所述第二特征筛选网络连接到所述右塔网络上,将所述左塔网络和所述右塔网络均连接到所述特征融合网络上,将所述特征融合网络连接到所述全连接层上,得到改进的点击预测模型。
6.一种基于改进点击预测模型的对象推荐方法装置,其特征在于,包括:
第一构建模块,被配置为构建第一特征筛选网络和第二特征筛选网络,其中,所述第一特征筛选网络和所述第二特征筛选网络均是由注意力层、激活层和交互层依次连接组成的,所述第一特征筛选网络和所述第二特征筛选网络中的注意力层被初始化后的参数不同,所述交互层用于对输入该交互层的两个特征进行矩阵相乘;
第二构建模块,被配置为利用激活函数和多个权重参数构建特征融合网络,其中,所述特征融合网络用于按照多个权重参数进行特征融合;
第三构建模块,被配置为在传统的基于双塔结构的点击预测模型中:在嵌入层和左塔网络之间插入所述第一特征筛选网络,在所述嵌入层和右塔网络之间插入所述第二特征筛选网络,在所述左塔网络和所述右塔网络与全连接层之间插入所述特征融合网络,得到改进的点击预测模型,其中,所述第一特征筛选网络和所述第二特征筛选网络中的交互层还与所述嵌入层存在连接,传统的基于双塔结构的点击预测模型是由所述嵌入层、所述左塔网络、所述右塔网络和所述全连接层依次连接组成的,所述左塔网络和所述右塔网络是并行连接;
推荐模块,被配置为利用改进的点击预测模型向用户推荐对象;
其中,改进的点击预测模型用于网络购物、新闻阅读以及视频观看场景中预测用户喜欢的目标,将预测的目标推荐给用户;
所述推荐模块还被配置为获取所述用户的用户信息、所述对象的对象信息以及所述对象对应的场景信息,其中,所述场景信息是所述用户和所述对象交互的相关信息;将所述用户信息、所述对象信息以及所述场景信息输入改进的点击预测模型:通过所述嵌入层对所述用户信息、所述对象信息以及所述场景信息进行处理,得到拼接特征;通过所述第一特征筛选网络对所述拼接特征进行处理,得到第一筛选特征;通过所述左塔网络对所述第一筛选特征进行处理,得到第一分支特征;通过所述第二特征筛选网络对所述拼接特征进行处理,得到第二筛选特征;通过所述右塔网络对所述第二筛选特征进行处理,得到第二分支特征;通过所述特征融合网络对所述第一分支特征和所述第二分支特征进行处理,得到融合特征;通过所述全连接层对所述融合特征进行处理,得到是否向所述用户推荐所述对象的判断结果;
所述推荐模块还被配置为分别提取所述用户信息、所述对象信息以及所述场景信息的特征,得到用户特征、对象特征以及场景特征;拼接所述用户特征、所述对象特征以及所述场景特征得到所述拼接特征。
7.一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现如权利要求1至5中任一项所述的方法的步骤。
8.一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其特征在于,计算机程序被处理器执行时实现如权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311765866.7A CN117454016B (zh) | 2023-12-21 | 2023-12-21 | 基于改进点击预测模型的对象推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311765866.7A CN117454016B (zh) | 2023-12-21 | 2023-12-21 | 基于改进点击预测模型的对象推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117454016A CN117454016A (zh) | 2024-01-26 |
CN117454016B true CN117454016B (zh) | 2024-03-15 |
Family
ID=89583963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311765866.7A Active CN117454016B (zh) | 2023-12-21 | 2023-12-21 | 基于改进点击预测模型的对象推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117454016B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115495654A (zh) * | 2022-09-26 | 2022-12-20 | 北京邮电大学 | 基于子空间投影神经网络的点击率预估方法和装置 |
CN116188118A (zh) * | 2023-04-26 | 2023-05-30 | 北京龙智数科科技服务有限公司 | 基于ctr预测模型的目标推荐方法及装置 |
CN116562357A (zh) * | 2023-07-10 | 2023-08-08 | 深圳须弥云图空间科技有限公司 | 点击预测模型训练方法及装置 |
CN116578875A (zh) * | 2023-07-12 | 2023-08-11 | 深圳须弥云图空间科技有限公司 | 基于多行为的点击预测模型训练方法及装置 |
CN116957035A (zh) * | 2022-12-09 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 模型训练方法、以及推荐媒体内容的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569892A (zh) * | 2021-01-29 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 图像描述信息生成方法、装置、计算机设备及存储介质 |
-
2023
- 2023-12-21 CN CN202311765866.7A patent/CN117454016B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115495654A (zh) * | 2022-09-26 | 2022-12-20 | 北京邮电大学 | 基于子空间投影神经网络的点击率预估方法和装置 |
CN116957035A (zh) * | 2022-12-09 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 模型训练方法、以及推荐媒体内容的方法 |
CN116188118A (zh) * | 2023-04-26 | 2023-05-30 | 北京龙智数科科技服务有限公司 | 基于ctr预测模型的目标推荐方法及装置 |
CN116562357A (zh) * | 2023-07-10 | 2023-08-08 | 深圳须弥云图空间科技有限公司 | 点击预测模型训练方法及装置 |
CN116578875A (zh) * | 2023-07-12 | 2023-08-11 | 深圳须弥云图空间科技有限公司 | 基于多行为的点击预测模型训练方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117454016A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109165573B (zh) | 用于提取视频特征向量的方法和装置 | |
WO2022041982A1 (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
CN116578875B (zh) | 基于多行为的点击预测模型训练方法及装置 | |
CN112149604A (zh) | 视频特征提取模型的训练方法、视频推荐方法及装置 | |
CN114896454B (zh) | 一种基于标签分析的短视频数据推荐方法及系统 | |
CN113515690A (zh) | 内容召回模型的训练方法、内容召回方法、装置及设备 | |
WO2023087914A1 (zh) | 推荐内容的选择方法、装置、设备、存储介质及程序产品 | |
CN113779380B (zh) | 跨域推荐、内容推荐方法、装置及设备 | |
CN116562357B (zh) | 点击预测模型训练方法及装置 | |
CN116911954B (zh) | 基于兴趣和流行度推荐物品的方法及装置 | |
CN116188118B (zh) | 基于ctr预测模型的目标推荐方法及装置 | |
CN116541608B (zh) | 房源推荐方法、装置、电子设备及存储介质 | |
CN117454016B (zh) | 基于改进点击预测模型的对象推荐方法及装置 | |
CN116127083A (zh) | 内容推荐方法、装置、设备及存储介质 | |
CN115761410A (zh) | 属性识别模型的训练方法、训练装置和电子设备 | |
CN114780847A (zh) | 一种对象信息处理、信息推送方法、装置和系统 | |
CN112925972B (zh) | 信息推送方法、装置、电子设备和存储介质 | |
CN112905786A (zh) | 一种标签推荐方法和装置 | |
CN116501993B (zh) | 房源数据推荐方法及装置 | |
CN116911955B (zh) | 目标推荐模型的训练方法及装置 | |
CN114860912B (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN118332196B (zh) | 基于用户兴趣标签的信息推送方法、设备与介质 | |
CN110019905B (zh) | 信息输出方法和装置 | |
CN117893279A (zh) | 一种对象推荐的方法和装置 | |
CN116128885A (zh) | 分割装置及分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |