CN112101380A - 基于图文匹配的产品点击率预测方法和系统、存储介质 - Google Patents
基于图文匹配的产品点击率预测方法和系统、存储介质 Download PDFInfo
- Publication number
- CN112101380A CN112101380A CN202010888949.5A CN202010888949A CN112101380A CN 112101380 A CN112101380 A CN 112101380A CN 202010888949 A CN202010888949 A CN 202010888949A CN 112101380 A CN112101380 A CN 112101380A
- Authority
- CN
- China
- Prior art keywords
- product
- picture
- features
- text
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Abstract
本发明提供一种基于图文匹配的产品点击率预测方法和系统、存储介质,涉及产品点击率预测技术领域。本发明提供的产品点击率预测方法通过将图片分为包含更多原始像素信息的小块,提取到的图片特征更加完整;同时依据图片特征、文本特征以及图文匹配融合特征得到联合特征用于预测产品的点击率,如此一方面考虑到图片特征和文本特征自身对点击率的影响,一方面将三者之间进行特征互补,极大的提高了预测点击率的准确度。
Description
技术领域
本发明涉及产品点击率预测技术领域,具体涉及一种基于图文匹配的产品点击率预测方法和系统、存储介质。
背景技术
随着电子商务的快速发展,网络购物已经成为人们购买产品的重要渠道。在网络购物过程中,由于无法真实触摸和体验所需产品,产品图片和标题成为消费者获取产品信息、虚拟体验产品的主要途径,有吸引力的产品展示图片和标题对消费者的点击和购买具有重要影响。如何利用产品图片和标题的吸引力来增加消费者的点击成为企业关心的重要问题。
目前,为了更好地提取电子商务领域产品的图片和标题即图片特征和文本特征的有用的信息,以预测消费者的点击率,本领域的技术人员已经采用了将图片特征和文本特征相融合以形成对相关产品的有效描述的做法。例如,申请号为201911087722.4的发明《一种基于深度多模态数据融合的商品点击率预测方法》,该发明很融合图片,文本以及品牌等多模态信息,形成有效的商品特征描述,可应用于商品点击率预测。
但是,上述做法存在着一个弊端。现有技术在融合图片特征和文本特征前,通过内部注意力机制得到加权的图片特征的处理过程,没有考虑电子商务领域图片的细粒度细这一特点,导致最终的点击率预测不准确。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于图文匹配的产品点击率预测方法和系统、存储介质,解决了现有技术没有考虑电子商务领域图片的细粒度细的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
一种基于图文匹配的产品点击率预测方法,包括:
获取产品的标题和图片,并对所述标题和图片进行预处理;
将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征;
将所述产品文本特征通过注意力机制得到加权的文本特征,将所述产品图片特征通过自注意力机制得到加权的图片特征;
将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征;
依据所述文本特征、图片特征和图文匹配特征,得到联合特征;
将所述联合特征输入预先训练好的产品点击率预测模型,得到所述产品的预测点击率。
优选的,所述将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征,包括:
将预处理后的标题输入Word2Vec模型,生成对应的词向量,最终得到所述产品文本特征;
切分预处理后的图片,得到具有相同像素的小块,将所述小块输入ResNext-101图片卷积网络,生成对应的图片小块特征向量,得到所述产品图片特征。
优选的,所述将所述产品文本特征通过注意力机制得到加权的文本特征,包括:
将产品文本特征中的每个词向量输入循环神经网络,得到所述每个词向量对应的权重,结合所述产品文本特征,得到所述加权的文本特征。
优选的,所述将所述产品图片特征通过自注意力机制得到加权的图片特征,包括:
将产品图片特征中的每个图片小块特征向量输入所述自注意力机制,得到对应的注意力值,采用softmax函数对所述注意力值进行归一化,得到所述每个图片小块对应的权重,结合所述产品图片特征,得到所述加权的图片特征。
优选的,所述将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征,包括:
依据产品文本特征中的每个词向量,得到所述产品文本的第一单词嵌入,第一位置嵌入和第一分段嵌入;
依据产品图片特征中的每个图片小块特征向量,得到所述产品图片的第二单词嵌入,第二位置嵌入和第二分段嵌入;
依据所述第一单词嵌入,第一位置嵌入、第一分段嵌入、第二单词嵌入,第二位置嵌入和第二分段嵌入,得到所述融合的图文匹配特征。
优选的,所述依据所述文本特征、图片特征和图文匹配特征,得到联合特征,包括:
依据所述文本特征、图片特征和图文匹配特征,得到中间联合特征;
赋予所述文本特征、图片特征和图文匹配特征初始权重;
依据所述中间联合特征和初始权重,得到所述联合特征,表示为:
Kc=K0*λ
=(Ktitle,Kpicture,Kt-p)*(λ1,λ2,λ3)
其中,Kc表示为联合特征,K0表示为中间联合特征,λ表示为初始权重,Ktitle表示为文本特征,Kpicture表示为图片特征,Kt-p表示为图文匹配特征,λ1表示为文本特征的初始权重,λ2表示为图片特征的初始权重,λ3表示为图文匹配特征的初始权重。
优选的,所述产品点击率预测模型的构建过程,包括:
获取多个产品的点击量、总的浏览数、标题和图片,依据所述点击量和总的浏览数得到点击率,对所述点击率、标题和图片进行预处理,
将所述多个产品中的每一件产品预处理后的标题和图片分别进行相应的特征提取,得到对应的产品文本特征、产品图片特征;
将所述对应的产品文本特征通过注意力机制得到对应加权的文本特征,将所述对应的产品图片特征通过自注意力机制得到对应加权的图片特征;
将所述对应加权的文本特征和加权的图片特征进行匹配,得到对应融合的图文匹配特征;
依据所述对应加权的文本特征、加权的图片特征和融合的图文匹配特征,得到对应的联合特征;
将所述多个产品中的每一产品对应的联合特征作为训练样本,将所述多个产品中的每一产品对应的预处理后的点击率作为输出标签,依据所述训练样本和输出标签,构建产品点击率预测训练数据库;
基于所述产品点击率预测训练数据库,采用随机梯度下降法进行模型参数学习,得到所述产品点击率预测模型。
一种基于图文匹配的产品点击率预测系统,其特征在于,包括:
预处理模块,用于获取产品的标题和图片,并对所述标题和图片进行预处理;
特征提取模块,用于将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征;
特征加权模块,用于将所述产品文本特征通过注意力机制得到加权的文本特征,将所述产品图片特征通过自注意力机制得到加权的图片特征;
图文匹配模块,用于将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征;
联合特征生成模块,用于依据所述文本特征、图片特征和图文匹配特征,得到联合特征;
预测模块,用于将所述联合特征输入预先训练好的产品点击率预测模型,得到所述产品的预测点击率。
一种计算机可读的存储介质,其上存储有计算机程序,其特征在于,在处理器执行所述计算机程序时,可实现上述任一项所述的方法。
(三)有益效果
本发明提供了一种基于图文匹配的产品点击率预测方法和系统、存储介质。与现有技术相比,具备以下有益效果:本发明提供的产品点击率预测方法通过将图片分为包含更多原始像素信息的小块,提取到的图片特征更加完整;同时依据图片特征、文本特征以及图文匹配融合特征得到联合特征用于预测产品的点击率,如此一方面考虑到图片特征和文本特征自身对点击率的影响,一方面将三者之间进行特征互补,极大的提高了预测点击率的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于图文匹配的产品点击率预测方法流程示意图;
图2为本发明实施例中文本表示的获取流程示意图;
图3为本发明实施例中图片表示的获取流程示意图;
图4为本发明实施例提供的一种基于图文匹配的产品点击率预测系统的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种基于图文匹配的产品点击率预测方法和系统、存储介质,解决了现有技术没有考虑电子商务领域图片的细粒度细的技术问题,实现了极大提高预测产品点击率的准确度的效果。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例提供的产品点击率预测方法通过将图片分为包含更多原始像素信息的小块,提取到的图片特征更加完整;同时依据图片特征、文本特征以及图文匹配融合特征得到联合特征用于预测产品的点击率,如此一方面考虑到图片特征和文本特征自身对点击率的影响,一方面将三者之间进行特征互补,极大的提高了预测点击率的准确度。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例:
第一方面,如图1所示,本发明实施例提供一种基于图文匹配的产品点击率预测方法,包括:
S1、获取产品的标题和图片,并对所述标题和图片进行预处理;
S2、将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征;
S3、将所述产品文本特征通过注意力机制得到加权的文本特征,将所述产品图片特征通过自注意力机制得到加权的图片特征;
S4、将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征;
S5、依据所述文本特征、图片特征和图文匹配特征,得到联合特征;
S6、将所述联合特征输入预先训练好的产品点击率预测模型,得到所述产品的预测点击率。
本发明实施例提供的产品点击率预测方法通过将图片分为包含更多原始像素信息的小块,提取到的图片特征更加完整,着重考虑了电子商务领域的图片的细粒度细这一特点,图片小块保留更多的原始信息,在后续的图片特征与文本特征相融合的步骤中,保证了得到的融合的图文匹配特征能够更精准的用于产品点击率的预测;本发明实施例还依据图片特征、文本特征以及图文匹配融合特征得到联合特征用于预测产品的点击率,如此一方面考虑到图片特征和文本特征自身对点击率的影响,一方面将三者之间进行特征互补,极大的提高了预测点击率的准确度。
具体包括:
S1、获取产品的标题和图片,并对所述标题和图片进行预处理。
获取待预测产品点击率的产品的标题和图片,并对所述标题和图片进行预处理。
对标题预处理包括:首先对所获取的标题文本数据分词,其次为文本清洗,即去掉文本中没有用的部分,例如标点符号、停用词等。
对图片进行预处理包括:将图片缩放即改变图片的大小,将图片缩放到固定大小。
S2、将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征。
将预处理后的标题输入Word2Vec模型,生成对应的词向量,最终得到所述产品文本特征。具体包括:
产品标题数据可以表示为:D={Wm},其中,wm表示第m个词的词向量,m表示词的个数。
则产品的标题数据的向量表示D=(w1,w2,...,wm),
其中wm=(xm1,xm2,...xmN)T,表示第m个词的词向量由一个N×1维的向量组成,xmN表示第m个词向量的第N行;
切分预处理后的图片,得到具有相同像素的小块,将所述小块输入ResNext-101图片卷积网络,生成对应的图片小块特征向量,得到所述产品图片特征。
对于产品图片特征提取具体如下:将图片切成具有相同像素的小块,在利用ResNext-101图片卷积网络提取每小块的特征。
将图片数据表示为:P={Sm},其中,Sm表示第m个图片小块特征向量,m表示图片小块数。
则产品的图片数据的向量表示:P=[s1,s2,...sm],
其中sm=(tm1,tm2,...tmk)T,表示图片第m个小块由一个k×1维向量组成,tmk表示第m块图片特征向量的第k列。
S3、将所述产品文本特征通过注意力机制得到加权的文本特征,将所述产品图片特征通过自注意力机制得到加权的图片特征。
产品文本特征的注意力计算如下:所述产品文本特征D,经过一个循环神经网络编码,可作为注意力的权重,并最终得到加权的文本特征。
titlevector=RNN(w1,w2,...,wn) (1)
hm=RNN(w1,w2,...,wm) (2)
queryvector=Wkey·(titlevector)T (3)
targetmvector=Wkey·hm T (4)
Ktitle=α×h=(α1,α2,...,αm)×(h1,h2,...,hm) (7)
其中,titlevector表示循环神经网络对标题文本的encode向量,维度设为k;
hm表示循环神经网络m时刻隐层单元的输出向量,维度设为k;queryvector表示标题文本编码向量的key向量,用以计算相似度得分,维度设为K;
Wkey表示query矩阵用来学习计算标题向量与每个时刻隐层输出的相似度得分的矩阵,维度为k×K;
α表示注意力权重得分;
softmax表示激活函数,将注意力权重得分映射到[0,1]之间的概率分布上;
h表示RNN每个时刻隐层的输出;
Ktitle表示加权的文本特征向量。
计算图片每小块的权重,将所述产品图片特征P输入自注意力机制(self-attention),可作为权重,利用softmax函数对注意力值进行归一化,得到产品图片特征的注意力概率分布,则有:
其中,βm表示图片每个小块的权重,P表示产品图片的特征向量表示,m表示图片小块数。
则产品加权的图片特征向量表示为:
Kpicture=β×S=(β1,β2,...βm)×(s1,s2,...,sm) (9)
S4、将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征;
依据产品文本特征中的每个词向量,得到所述产品文本的第一单词嵌入,第一位置嵌入和第一分段嵌入。
由上述步骤可知,产品的标题数据的向量表示D={Wm},将所述产品的标题数据的向量表示D作为第一单词嵌入。
第一位置嵌入表示如下:Dposition=(pos1,pos2,...,posm),其中,posm表示第m个词的位置。
第一分段嵌入表示如下:Dsegmentation=(T,T,...,T),其中,T表示文本。
则文本表示为:
Dc=D+Dposition+Dsegmentation (10)
如图2所示,首先从电子商务平台获得高梵羽绒服产品的图片.产品的描述,例如:高梵男装2020新款轻薄羽绒服男款立领秋冬特卖保暖潮流外套。
根据产品的描述获得产品的文本特征向量表示。将产品描述“高梵男装2020新款轻薄羽绒服男款立领秋冬特卖保暖潮流外套”切分为10个的单词:高梵(1)、2020新款(2)、轻薄(3)、羽绒服(4)、男款(5)、立领(6)、秋冬特卖(7)、保暖(8)、潮流(9)、外套(10)。
这10个单词的每一个单词词向量作为第一单词嵌入。
每一个词对应的位置作为第一位置嵌入,例如对应上边的文本描述:高梵(位置:1)、2020新款(位置:2)、轻薄(位置:3)、羽绒服(位置:4)、男款(位置:5)、立领(位置:6)、秋冬特卖(位置7)、保暖(位置:8)、潮流(位置:9)、外套(位置:10)。
为了将整段文本描述和整个图片区别开,整段文本描述中每一个词向量对应的第一分段嵌入都是相同的,用符号T来表示文本。例如对应上边的文本描述:高梵(分段嵌入:T)、2020新款(分段嵌入:T)、轻薄(分段嵌入:T)、羽绒服(分段嵌入:T)、男款(分段嵌入:T)、立领(分段嵌入:T)、秋冬特卖(分段嵌入:T)、保暖(分段嵌入:T)、潮流(分段嵌入:T)、外套(分段嵌入:T)。将单词的特征向量,位置嵌入和分段嵌入之和作为文本的表示。
依据将产品图片特征中的每个图片小块特征向量,得到所述产品图片的第二单词嵌入,第二位置嵌入和第二分段嵌入。
由上述步骤可知,则产品的图片数据的向量表示为P={Sm},将所述产品的图片数据的向量表示P作为第二单词嵌入。
第二位置嵌入表示如下:Pposition=(pos1,pos2,...,posm),其中posm_表示第m个小块的位置。
第二分段嵌入如下:Psegmentation=(I,I,...,I),其中,I表示图片。
则图片表示为:
Pc=P+Pposition+Psegmentation (II)
图3为“高梵男装2020新款轻薄羽绒服男款立领秋冬特卖保暖潮流外套”对应的图片。
产品的图片切分成9个小块,按从左到右边,从上到下的顺序给小块编号(1,2,3,4,5,6,7,8,9)。将每个小块输入ResNext-101图片卷积网络后得到对应的图片小块特征,得到第二单词特征。
第一小块对应的位置为1,第二小块对应的位置为2……,第9块对应的位置为9,代表第二位置嵌入。
第1小块到第9的都属于同一张图片,因此将第1小块到第9小块的分段嵌入都相同。为了将图片和文本区分开,用I表示第二分段嵌入。将每一小块的特征向量,位置嵌入和分段嵌入之和作为图片的表示。
依据所述第一单词嵌入,第一位置嵌入、第一分段嵌入、第二单词嵌入,第二位置嵌入和第二分段嵌入,得到所述融合的图文匹配特征。
将上面所获得的的图片表示Pc和文本表示Dc以并联方式连接。将并联的图片表示特征和文本表示特征输入卷积神经网络,得到图文匹配融合的特征向量,所述融合的图文匹配特征向量表示为:Kt-p。
S5、依据所述文本特征、图片特征和图文匹配特征,得到联合特征。
依据所述文本特征、图片特征和图文匹配特征,得到中间联合特征;
赋予所述文本特征、图片特征和图文匹配特征初始权重;
依据所述中间联合特征和初始权重,得到所述联合特征,表示为:
Kc=K0*λ
=(Ktitle,Kpicture,Kt-p)*(λ1,λ2,λ3) (12)
其中,Kc表示为联合特征,K0表示为中间联合特征,λ表示为初始权重,Ktitle表示为文本特征,Kpicture表示为图片特征,Kt-p表示为图文匹配特征,λ1表示为文本特征的初始权重,λ2表示为图片特征的初始权重,λ3表示为图文匹配特征的初始权重。
令联合特征为Kc=(v1,v2,...,vk)T,其中,vk表示第K维上的具体数值。
S6、将所述联合特征输入预先训练好的产品点击率预测模型,得到所述产品的预测点击率。
所述产品点击率预测模型的构建过程,包括:
S61、获取多个产品的点击量、总的浏览数、标题和图片,依据所述点击量和总的浏览数得到点击率,对所述点击率、标题和图片进行预处理。
从在线购物网站上获取多个产品的点击量、总的浏览数、标题和图片。依据所述点击量和总的浏览数得到点击率,具体为:点击率=点击量/总的浏览数。
对产品点击率进行预处理包括:对产品点击率进行标准化处理,对于初始的点击率数据z1,z2,...,zn,其平均值为标准差为其中zi表示第i个产品的点击率,n表示产品点击率数据的数量。经过标准化处理后的点击率为
对所述标题和图片进行预处理与上述步骤S1中的预处理过程相同,在此不再赘述。
S62、将所述多个产品中的每一件产品预处理后的标题和图片分别进行相应的特征提取,得到对应的产品文本特征、产品图片特征。
S63、将所述对应的产品文本特征通过注意力机制得到对应加权的文本特征,将所述对应的产品图片特征通过自注意力机制得到对应加权的图片特征。
S64、将所述对应加权的文本特征和加权的图片特征进行匹配,得到对应融合的图文匹配特征。
S65、依据所述对应加权的文本特征、加权的图片特征和融合的图文匹配特征,得到对应的联合特征。
步骤S62-65的处理过程可以参考上述步骤S2-5的处理过程,在此不再赘述。
S66、将所述多个产品中的每一产品对应的联合特征作为训练样本,将所述多个产品中的每一产品对应的预处理后的点击率作为输出标签,依据所述训练样本和输出标签,构建产品点击率预测训练数据库。
S67、基于所述产品点击率预测训练数据库,采用随机梯度下降法进行模型参数学习,得到所述产品点击率预测模型。
利用线性回归预测产品点击率,将均方误差作为损失函数:
根据所述产品点击率预测训练数据库,可以得到参数λ=(λ1,λ2,λ3)以及a=(a1,a2,...,ak)的具体数值,分别根据下面两个函数训练所得:
h1=f1(λ×K0 T+b1) (14)
h2=f2(a×kc+b2) (15)
其中,h1表示联合文本特征、图片特征、图文匹配融合特征K维特征向量的矩阵,
h2表示训练数据库的历史的预处理后的点击率,
λ=(λ1,λ2,λ3)表示文本特征向量、图片特征向量以及图文匹配融合的特征向量的初始权重,
a=(a1,a2,...,ak)表示由训练模型所学习到的文本特征、图片特征以及图文匹配融合特征K维特征向量的参数,
f1代表第一个线性回归的训练函数,b1表示第一个函数的偏置项,
K0=(Ktitle,Kpicture,Kt-p)表示文本特征向量、图片特征向量以及图文匹配融合的特征向量,
f2代表第一个线性回归的训练函数,b2表示第一个函数的偏置项,
Kc=(v1,v2,...,vk)T表示联合文本特征、图片特征以及图文匹配融合特征K维特征向量,即联合特征向量。
将所述联合特征Kc=(v1,v2,...,vk)T输入上述构建的模型中,最终得到产品的预测点击率为:
y=a1×v1+a2×v2+...+ak×v2 (16)
其中,a=(a1,a2,...,ak)表示由训练模型所学习到的文本特征、图片特征以及图文匹配融合特征K维特征向量的参数,vk表示所述联合特征第K维上的具体数值。
第二方面,如图4所示,本发明实施例提供一种基于图文匹配的产品点击率预测系统,包括:
预处理模块,用于获取产品的标题和图片,并对所述标题和图片进行预处理;
特征提取模块,用于将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征;
特征加权模块,用于将所述产品文本特征通过注意力机制得到加权的文本特征,将所述产品图片特征通过自注意力机制得到加权的图片特征;
图文匹配模块,用于将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征;
联合特征生成模块,用于依据所述文本特征、图片特征和图文匹配特征,得到联合特征;
预测模块,用于将所述联合特征输入预先训练好的产品点击率预测模型,得到所述产品的预测点击率。
可理解的是,本发明实施例提供的产品点击率预测系统与本发明实施例提供的产品点击率预测方法相对应,其有关内容的解释、举例和有益效果等部分可以参考产品点击率预测方法中的相应部分,此处不再赘述。
第三方面,本发明实施例提供一种计算机可读的存储介质,其上存储有计算机程序,其特征在于,在处理器执行所述计算机程序时,可实现任一项所述的方法。
综上所述,与现有技术相比,具备以下有益效果:
1、本发明实施例提供的产品点击率预测方法通过将图片分为包含更多原始像素信息的小块,提取到的图片特征更加完整,着重考虑了电子商务领域的图片的细粒度细这一特点,图片小块保留更多的原始信息,在后续的图片特征与文本特征相融合的步骤中,保证了得到的融合的图文匹配特征能够更精准的用于产品点击率的预测。
2、本发明实施例还依据图片特征、文本特征以及图文匹配融合特征得到联合特征用于预测产品的点击率,如此一方面考虑到图片特征和文本特征自身对点击率的影响,一方面将三者之间进行特征互补,极大的提高了预测点击率的准确度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种基于图文匹配的产品点击率预测方法,其特征在于,包括:
获取产品的标题和图片,并对所述标题和图片进行预处理;
将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征;
将所述产品文本特征通过注意力机制得到加权的文本特征,将所述产品图片特征通过自注意力机制得到加权的图片特征;
将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征;
依据所述文本特征、图片特征和图文匹配特征,得到联合特征;
将所述联合特征输入预先训练好的产品点击率预测模型,得到所述产品的预测点击率。
2.如权利要求1所述的产品点击率预测方法,其特征在于,所述将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征,包括:
将预处理后的标题输入Word2Vec模型,生成对应的词向量,最终得到所述产品文本特征;
切分预处理后的图片,得到具有相同像素的小块,将所述小块输入ResNext-101图片卷积网络,生成对应的图片小块特征向量,得到所述产品图片特征。
3.如权利要求2所述的产品点击率预测方法,其特征在于,所述将所述产品文本特征通过注意力机制得到加权的文本特征,包括:
将产品文本特征中的每个词向量输入循环神经网络,得到所述每个词向量对应的权重,结合所述产品文本特征,得到所述加权的文本特征。
4.如权利要求2所述的产品点击率预测方法,其特征在于,所述将所述产品图片特征通过自注意力机制得到加权的图片特征,包括:
将产品图片特征中的每个图片小块特征向量输入所述自注意力机制,得到对应的注意力值,采用softmax函数对所述注意力值进行归一化,得到所述每个图片小块对应的权重,结合所述产品图片特征,得到所述加权的图片特征。
5.如权利要求2所述的产品点击率预测方法,其特征在于,所述将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征,包括:
依据产品文本特征中的每个词向量,得到所述产品文本的第一单词嵌入,第一位置嵌入和第一分段嵌入;
依据产品图片特征中的每个图片小块特征向量,得到所述产品图片的第二单词嵌入,第二位置嵌入和第二分段嵌入;
依据所述第一单词嵌入,第一位置嵌入、第一分段嵌入、第二单词嵌入,第二位置嵌入和第二分段嵌入,得到所述融合的图文匹配特征。
6.如权利要求2所述的产品点击率预测方法,其特征在于,所述依据所述文本特征、图片特征和图文匹配特征,得到联合特征,包括:
依据所述文本特征、图片特征和图文匹配特征,得到中间联合特征;
赋予所述文本特征、图片特征和图文匹配特征初始权重;
依据所述中间联合特征和初始权重,得到所述联合特征,表示为:
Kc=K0*λ
=(Ktitle,Kpicture,Kt-p)*(λ1,λ2,λ3)
其中,Kc表示为联合特征,K0表示为中间联合特征,λ表示为初始权重,Ktitle表示为文本特征,Kpicture表示为图片特征,Kt-p表示为图文匹配特征,λ1表示为文本特征的初始权重,λ2表示为图片特征的初始权重,λ3表示为图文匹配特征的初始权重。
7.如权利要求1所述的产品点击率预测方法,其特征在于,所述产品点击率预测模型的构建过程,包括:
获取多个产品的点击量、总的浏览数、标题和图片,依据所述点击量和总的浏览数得到点击率,对所述点击率、标题和图片进行预处理,
将所述多个产品中的每一件产品预处理后的标题和图片分别进行相应的特征提取,得到对应的产品文本特征、产品图片特征;
将所述对应的产品文本特征通过注意力机制得到对应加权的文本特征,将所述对应的产品图片特征通过自注意力机制得到对应加权的图片特征;
将所述对应加权的文本特征和加权的图片特征进行匹配,得到对应融合的图文匹配特征;
依据所述对应加权的文本特征、加权的图片特征和融合的图文匹配特征,得到对应的联合特征;
将所述多个产品中的每一产品对应的联合特征作为训练样本,将所述多个产品中的每一产品对应的预处理后的点击率作为输出标签,依据所述训练样本和输出标签,构建产品点击率预测训练数据库;
基于所述产品点击率预测训练数据库,采用随机梯度下降法进行模型参数学习,得到所述产品点击率预测模型。
8.一种基于图文匹配的产品点击率预测系统,其特征在于,包括:
预处理模块,用于获取产品的标题和图片,并对所述标题和图片进行预处理;
特征提取模块,用于将预处理后的标题和图片分别进行相应的特征提取,得到产品文本特征、产品图片特征;
特征加权模块,用于将所述产品文本特征通过注意力机制得到加权的文本特征,将所述产品图片特征通过自注意力机制得到加权的图片特征;
图文匹配模块,用于将所述文本特征和图片特征进行匹配,得到融合的图文匹配特征;
联合特征生成模块,用于依据所述文本特征、图片特征和图文匹配特征,得到联合特征;
预测模块,用于将所述联合特征输入预先训练好的产品点击率预测模型,得到所述产品的预测点击率。
9.一种计算机可读的存储介质,其上存储有计算机程序,其特征在于,在处理器执行所述计算机程序时,可实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010888949.5A CN112101380B (zh) | 2020-08-28 | 2020-08-28 | 基于图文匹配的产品点击率预测方法和系统、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010888949.5A CN112101380B (zh) | 2020-08-28 | 2020-08-28 | 基于图文匹配的产品点击率预测方法和系统、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101380A true CN112101380A (zh) | 2020-12-18 |
CN112101380B CN112101380B (zh) | 2022-09-02 |
Family
ID=73758262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010888949.5A Active CN112101380B (zh) | 2020-08-28 | 2020-08-28 | 基于图文匹配的产品点击率预测方法和系统、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101380B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023037781A1 (ja) * | 2021-09-07 | 2023-03-16 | 株式会社Nttドコモ | 広告効果予測装置 |
WO2023037782A1 (ja) * | 2021-09-07 | 2023-03-16 | 株式会社Nttドコモ | 広告効果予測装置 |
WO2023037780A1 (ja) * | 2021-09-07 | 2023-03-16 | 株式会社Nttドコモ | 広告効果予測装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273517A (zh) * | 2017-06-21 | 2017-10-20 | 复旦大学 | 基于图嵌入学习的图文跨模态检索方法 |
US20170330054A1 (en) * | 2016-05-10 | 2017-11-16 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method And Apparatus Of Establishing Image Search Relevance Prediction Model, And Image Search Method And Apparatus |
CN109933802A (zh) * | 2019-03-25 | 2019-06-25 | 腾讯科技(深圳)有限公司 | 图文匹配方法、装置及存储介质 |
CN109992686A (zh) * | 2019-02-24 | 2019-07-09 | 复旦大学 | 基于多角度自注意力机制的图像-文本检索系统及方法 |
CN110852368A (zh) * | 2019-11-05 | 2020-02-28 | 南京邮电大学 | 全局与局部特征嵌入及图文融合的情感分析方法与系统 |
CN110991464A (zh) * | 2019-11-08 | 2020-04-10 | 华南理工大学 | 一种基于深度多模态数据融合的商品点击率预测方法 |
WO2020155418A1 (zh) * | 2019-01-31 | 2020-08-06 | 深圳市商汤科技有限公司 | 一种跨模态信息检索方法、装置和存储介质 |
CN111581510A (zh) * | 2020-05-07 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 分享内容处理方法、装置、计算机设备和存储介质 |
-
2020
- 2020-08-28 CN CN202010888949.5A patent/CN112101380B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170330054A1 (en) * | 2016-05-10 | 2017-11-16 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method And Apparatus Of Establishing Image Search Relevance Prediction Model, And Image Search Method And Apparatus |
CN107273517A (zh) * | 2017-06-21 | 2017-10-20 | 复旦大学 | 基于图嵌入学习的图文跨模态检索方法 |
WO2020155418A1 (zh) * | 2019-01-31 | 2020-08-06 | 深圳市商汤科技有限公司 | 一种跨模态信息检索方法、装置和存储介质 |
CN109992686A (zh) * | 2019-02-24 | 2019-07-09 | 复旦大学 | 基于多角度自注意力机制的图像-文本检索系统及方法 |
CN109933802A (zh) * | 2019-03-25 | 2019-06-25 | 腾讯科技(深圳)有限公司 | 图文匹配方法、装置及存储介质 |
CN110852368A (zh) * | 2019-11-05 | 2020-02-28 | 南京邮电大学 | 全局与局部特征嵌入及图文融合的情感分析方法与系统 |
CN110991464A (zh) * | 2019-11-08 | 2020-04-10 | 华南理工大学 | 一种基于深度多模态数据融合的商品点击率预测方法 |
CN111581510A (zh) * | 2020-05-07 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 分享内容处理方法、装置、计算机设备和存储介质 |
Non-Patent Citations (4)
Title |
---|
YILING WU ET AL: "Learning Fragment Self-Attention Embeddings for Image-Text Matching", 《MM "19: PROCEEDINGS OF THE 27TH ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA》 * |
ZHICHENG HUANG ET AL: "Pixel-BERT: Aligning Image Pixels with Text by Deep Multi-Modal Transformers", 《ARXIV》 * |
李俊等: "融合BERT语义加权与网络图的关键词抽取方法", 《计算机工程》 * |
陈文花: "基于深度学习的图片广告点击率预估研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023037781A1 (ja) * | 2021-09-07 | 2023-03-16 | 株式会社Nttドコモ | 広告効果予測装置 |
WO2023037782A1 (ja) * | 2021-09-07 | 2023-03-16 | 株式会社Nttドコモ | 広告効果予測装置 |
WO2023037780A1 (ja) * | 2021-09-07 | 2023-03-16 | 株式会社Nttドコモ | 広告効果予測装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112101380B (zh) | 2022-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101380B (zh) | 基于图文匹配的产品点击率预测方法和系统、存储介质 | |
CN106599226B (zh) | 一种内容推荐方法及内容推荐系统 | |
WO2018040944A1 (zh) | 恶意地址/恶意订单的识别系统、方法及装置 | |
CN111581510A (zh) | 分享内容处理方法、装置、计算机设备和存储介质 | |
CN111222332A (zh) | 一种结合注意力网络和用户情感的商品推荐方法 | |
CN110263257B (zh) | 基于深度学习处理多源异构数据的推荐方法 | |
CN110991464B (zh) | 一种基于深度多模态数据融合的商品点击率预测方法 | |
CN112288042B (zh) | 行为预测系统的更新方法及装置、存储介质和计算设备 | |
CN112612973B (zh) | 结合知识图谱的个性化智能服装搭配推荐方法 | |
CN109584006B (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
CN112884551A (zh) | 一种基于近邻用户和评论信息的商品推荐方法 | |
CN112800344B (zh) | 一种基于深度神经网络的电影推荐方法 | |
CN114936623A (zh) | 一种融合多模态数据的方面级情感分析方法 | |
TWI433042B (zh) | Multi - product recommendation method and system | |
CN111598596A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN116680363A (zh) | 一种基于多模态评论数据的情感分析方法 | |
CN115641179A (zh) | 信息推送方法、装置及电子设备 | |
CN112632377B (zh) | 一种基于用户评论情感分析与矩阵分解的推荐方法 | |
CN110555719B (zh) | 一种基于深度学习的商品点击率预测方法 | |
CN111723302A (zh) | 一种基于协同双模型深度表示学习的推荐方法 | |
CN117033804A (zh) | 一种主客观视角引导下的点击诱导检测方法 | |
CN108960954B (zh) | 一种基于用户群行为反馈的内容推荐方法及推荐系统 | |
CN109800424A (zh) | 一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法 | |
CN113254775A (zh) | 一种基于客户浏览行为序列的信用卡产品推荐方法 | |
CN113077313B (zh) | 融合用户生成场景图像与个性化偏好的互补品推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |