CN110555719A

CN110555719A - 一种基于深度学习的商品点击率预测方法

Info

Publication number: CN110555719A
Application number: CN201910698575.8A
Authority: CN
Inventors: 许勇; 李倩婷
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2019-07-31
Filing date: 2019-07-31
Publication date: 2019-12-10
Anticipated expiration: 2039-07-31
Also published as: CN110555719B

Abstract

本发明公开的一种基于深度学习的商品点击率预测方法，包括以下步骤：通过商品信息计算商品相似度，建立商品相似度函数；根据商品销售时间进行分类，对于缺失商品销售时间序列的商品，通过商品相似性函数进行近似值排序并选取排序最大的商品进行填充，得到多变量时间序列；将多变量时间序列输入时序模型，进行迭代得到特征时间序列；对商品用独热编码，得到商品词向量，将特征时间序列与商品词向量进行交互得到交互时间序列；分别计算特征时间序列损失值和交互时间序列损失值，得到商品的预测点击率，本发明通过填补得到完整销售时间序列并输入到时序网络，获得商品点击率预测；商品相似度函数计算得到近似商品，为用户提供优质的商品消费服务。

Description

一种基于深度学习的商品点击率预测方法

技术领域

本发明涉及时间序列预测的研究领域，特别涉及一种基于深度学习的商品点击率预测方法。

背景技术

随着网络技术的发展和个人电脑以及手机等上网设备的普及，在网络电商平台购物已经成为现代人生活必不可少的组成部分。从淘宝，京东的蓬勃发展到现在拼多多疯狂抢占空余市场，这些电商平台无时无刻不在产生大量数据，这些基于用户点击的商品数据由于超大的数量，在宏观上能够表达很多重要信息，例如某种商品是否流行，在同类商品中具有哪些特质的商品会特别受到消费者青睐。如果能够通过机器学习方法将这些重要特质挖掘出来，对未来商品的挑选、采购以及电商平台的广告投放以及精准推送有着极其重大的意义。

对于电商平台，其上线商品种类日益繁多，各种不同类型的商品数量日益激增，为了适应人们多变的时尚需求以及保证平台较好的盈利率，需要及时地从网络商店后台的品种繁多的海量商品数据中精确的检索出所适合上线的商品以及针对不同用户去挖掘其潜在会感兴趣的商品信息并进行相应的推荐，这不仅需要耗费大量时间进行前期数据分析和研究，也是一个亟待解决的技术难题。对于这些问题的深入研究不仅具有重要的学术理论意义，而且也具有重要的实际应用价值。

在电商平台所在的大数据环境中，需要为亿万用户提供多种商品服务，而在提供服务前，需要事先进行大量商品的采购服务。面对海量商品，需要通过商品点击率预测，来支撑采购业务应用体系，从而保证所采购的商品具有高的关注度，具体表现为点击率高。为用户提供更加优质的商品消费服务，并让用户体验到所见即所需，免于被海量无兴趣商品信息包围的困扰，并为商业决策提供科学的数据服务，提升商品消费电商行业的服务质量。

然而常见的商品销售模式是商品在电商平台根据自己的销售情况或者电商的营销策略时刻调整商品上架或者下架，造成商品销售数据的时间序列(包含商品的总体点击率、折扣、价格等)在时间维度大量缺失，需要在建模的时候就考虑对商品销售时间序列中的缺失值做什么处理，以及应该对模型进行针对缺失值的改进来处理这个问题，目前缺少具体的实施方案。

发明内容

本发明的目的在于克服现有技术的缺点与不足，提供一种基于深度学习的商品点击率预测方法，对有大量缺失值的商品销售时间序列进行建模，从而减少缺失值对真实值造成的影响以便准确预估商品在未来的总体点击率。

本发明的目的通过以下的技术方案实现：

一种基于深度学习的商品点击率预测方法，包括以下步骤：

S1、获取商品信息，并通过商品信息计算商品相似度，建立商品相似度函数；

S2、根据商品销售时间进行分类，对于缺失商品销售时间序列的商品，通过商品相似性函数进行近似值排序，选择近似值排序最大的商品进行填充，得到多变量时间序列；

S3、将多变量时间序列输入时序模型，进行深度网络学习迭代，得到特征时间序列；

S4、对商品用独热编码，得到商品词向量，经过排序，得到商品词向量序列，将特征时间序列与商品词向量进行交互，得到交互时间序列；

S5、分别计算得到特征时间序列的损失值和交互时间序列的损失值，通过全连接网络得到商品的预测点击率。

进一步地，所述商品信息包括商品图片、商品标题、商品价格、商品品牌。

进一步地，所述步骤S1具体为：

对于商品图片：通过位置敏感哈希获取每张商品图片的哈希编码，根据图片的哈希编码取得候选数据集，通过计算候选数据集中每个点与查询点的距离，得到符合查询条件的结果，即得到商品图片相似度D_figure：

D_figure＝minmax(|h_figureA-h_figureB|)，

其中，h_figureA为商品A的商品图片汉明码，h_figureB为商品B的商品图片汉明码，minmax为归一化函数；

对于商品标题：对商品标题进行分词，得到关键词，生成商品标题的关键词词库，筛选出高频词，作为商品标题近似度对比样本，把商品标题转化为01向量，根据01向量计算商品标题的汉明距离，得到商品标题相似度D_titel：

D_titel＝minmax(|h_titelA-h_titelB|)，

其中，h_titelA为商品A的商品标题汉明码，h_titelB为商品B的商品标题汉明码；

对于商品价格：商品价格包括三个特征：商品价格第一特征、商品价格第二特征、商品价格第三特征；通过皮尔森相关系数计算特征与点击率的相关性；具体如下，若皮尔森相关系数为负数则特征与点击率是负相关关系，若皮尔森相关系数为正数则特征与点击率呈正相关关系，若皮尔森相关系数为零则特征与点击率无关；根据相关系数计算结果，使用销售价格差值与折扣价格差值进行商品价格相关性刻画，得到商品价格相似度D_price：

D_price＝minmax(|price_A-price_B|)+|discount_A-discount_B|，

其中，price_A为商品A销售价格，price_B为商品B销售价格，discount_A为商品A折扣，discount_B为商品B折扣；

对于商品品牌：通过计算平均销售价格、平均折扣、平均销量、品牌定位进行测量，得到商品品牌相似度D_brand：

其中，price_brandA为品牌A平均销售价格，price_brandB为品牌B平均销售价格，discount_brandA为品牌A平均折扣，discount_brandB为品牌B平均折扣，sale_brandA为品牌A平均销量，sale_brandB为品牌B平均销量，level_brandA为品牌A品牌定位，level_brandB为品牌B品牌定位；

根据商品图片相似度D_figure、商品标题相似度D_titel、商品价格相似度D_price、商品品牌相似度D_brand，建立商品相似度函数：

L＝0.2*D_figure+0.2*D_title+0.4*D_price+0.2*D_brand。

进一步地，所述商品价格第一特征为销售价格，所述商品价格第二特征为市场价格，所述商品价格第三特征为折扣。

进一步地，所述步骤S2具体为：根据商品销售时间长短进行分类，分为主商品和填充商品，对于缺失商品销售时间序列主商品，通过商品相似性函数进行近似值排序，选择近似值排序最大的商品进行填充，即使用近似值排序最大的商品代替缺失商品销售时间序列主商品，近似值排序最大的商品点击率为缺失商品销售时间序列主商品点击率，加入时间窗特征，得到时间步数为T，即总时间步为T，特征数量为D，即维度为D的多变量时间序列：

其中，x_t,t∈{1,2,...,T}表示在时间s_t商品的销售记录。

进一步地，所述步骤S3具体为：对于多变量时间序列，

其中，x_t,t∈{1,2,...,T}表示在时间s_t商品的销售记录；

为了区分本商品真实观测值和近似商品填充值的差别，定义：

其中，m_t,t∈{1,2,...,T}表示在时间s_t，x_t是否为商品的真实销售记录，若有记录，则m_t取值为1；若没有记录，则m_t取值为0；

定义:

其中，δ_t表示商品A的真实销售记录距离上一个真实销售记录的时间间隔；

将多变量时间序列输入时序模型，进行迭代，得到特征时间序列，即按照真实销售记录的时间间隔对时序模型的隐藏状态进行衰减，区分主商品和填充商品在数据序列中的重要性；定义在时间步t时刻的衰减因子γ_t，用sigmoid函数对衰减因子控制在0到1之间，则有：

γ_t＝sigmoid{-max(0,W_γδ_t+b_γ)}，

其中，W_γ表示作用在时间间隔上权重矩阵，b_γ表示偏置，γ_t为时间步时刻的衰减因子；

隐藏状态从当前状态一直衰减至零，隐藏状态的每个特征都有同样的衰减因子，衰减因子与隐藏状态做哈达玛积之后得到衰减隐藏状态；在每一个时间步计算之前都把隐藏状态进行衰减，然后用GRU更新方程进行迭代，得到特征时间序列：

其中，N₁是GRU隐藏单元的数量，g_t,t∈{1,2,…,T}表示在时间步t时刻时序模型的隐藏状态；

把每个时间步的隐藏状态输出到一个全连接层，得到每个时间步的点击率预测值。

进一步地，所述时序模型为带有衰减机制的时序模型GRU。

进一步地，所述步骤S4具体为：对一条完整的商品销售时间序列中的所有商品用独热编码，给每一个独热编码随机初始化一个对应的词向量，再按照时间序列中的排序形成一条商品词向量序列；对商品词向量序列做维度调换，即把商品词向量序列：维度调换，得到调换后的商品词向量序列：

其中，N₂是商品词向量的维度，T是总时间步；

将特征时间序列和调换后的词向量序列进行矩阵乘法，其中N₁＝N₂，得到交互时间序列：

进一步地，所述步骤S5具体为：将特征时间序列和交互时间序列分别输入到全连接网络，分别计算得到特征时间序列的损失值和交互时间序列的损失值，得到每个时间步的预测点击率，即对预测点击率用均方损失进行监督，利用超参数平衡两个损失函数关系，损失函数为：

loss＝α*loss_g+(1-α)*loss_f，

其中，loss_g为特征时间序列的损失值，loss_f为交互时间序列的损失值，α为超参数，loss为总体损失值。

进一步地，所述监督针对主商品的点击率。

本发明与现有技术相比，具有如下优点和有益效果：

本发明所述的商品点击率预测，通过填补得到的完整销售时间序列输入到时序网络，能得到对商品未来的点击率预测；通过商品相似度函数计算得到的近似商品，给购买过近似商品的用户推荐；

附图说明

图1为本发明所述一种基于深度学习的商品点击率预测方法的方法流程图；

图2为本发明所述实施例中带有衰减机制的时序模型GRU的内部结构图；

图3为本发明所述实施例中特征时间序列和交互时间序列交互机制示意图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例:

如图1所示，一种基于深度学习的商品点击率预测方法，通过四个方面对商品相似度进行建模，把得到的商品相似度矩阵应用到填充商品缺失销售时间序列上，得到一条完整的时间序列。把该时间序列输入到一个带有衰减机制的GRU模型中，通过对填充商品有惩罚的学习得到时间序列中隐含的时序信息。另一方面对商品编号序列进行独热编码，对每个独热编码训练商品自身的词向量，学习商品与时间无关的信息。把词向量信息与时间信息通过矩阵乘法的方法进行融合，再将融合信息和时序信息输入到一个全连接层得到关于商品的预测点击率。

一种基于深度学习的商品点击率预测方法，具体包括如下主要技术要点：

1、建立商品相似度函数；

(1)图片近似。图片近似本发明采用哈希编码的方式，将图片的高维内容特征映射到汉明空间(二值空间)中,生成一个低维的哈希序列来表示一幅图片，然后再通过计算汉明距离得到图片的近似度，哈希编码的距离能够在一定程度上说明两张图片在视觉上的相似，这里并没有利用目标检测的方法把商品独立出来是因为商品图的模特、背景和空间结构等因素都影响着用户是否点击，本发明并没有从衣服的款式、是否流行、商品图拍摄角度等方面深入探讨商品图的近似算法。

本发明产生哈希编码的方法使用位置敏感哈希(Locality SensitiveHashingLSH)，LSH是最近比较流行的一种相似性搜索算法，它的基本思想是通过k个串联的具有位置敏感性的哈希函数将原始的数据空间映射到二维的数据空间，然后在查询时计算查询点的K维哈希值,根据该哈希值取得候选数据集,最后通过计算候选数据集中每个点与查询点的距离得到符合查询条件的结果。设商品A与商品B的商品图汉明码分别为h_figureA和h_figureB，minmax是归一化函数：

D_figure＝minmax(|h_figureA-h_figureB|)

(2)标题近似。用户搜索关键词得到商品列表，商品标题越是与用户输入的关键词类似，商品的排序就越靠近，如果两件商品的标题A和B中的关键词重复的次数很高，就可以认为这两件商品的款式近似。由于商品标题由商家提供的，需要对一个完整的标题进行分词，关于中文的分词工具很多，包括盘古分词、Yaha分词、Jieba分词、清华THULAC等。它们的基本用法都大同小异，本发明选择jieba分词对标题进行分词。

例如：日韩可爱小香风蝴蝶结小女孩磨毛T恤，可以分词为：日/韩/可爱/小/香风/蝴蝶结/小女孩/磨毛/T恤，因此它就有九个关键词，目前并没有针对电商商品标题做的词库，几乎所有的中文分词都是建立在一般的语料库上，句子里都有明确的主谓宾结构，因此分词工具在本发明的应用环境中分词结果相对较差，但是本发明只是把标题作为构建商品相似度的一个参考方向，并不要求精准分词。

生成商品标题的关键词词库，筛选出高频词，作为商品标题近似度需要对比的参考，把商品标题转化为01向量。如果把分出来的每一个词都作为关键词的话，这个向量的维度将会很大，难以计算，而且商家为了提高商品被搜索到的可能，电商商品标题其实很多词都是重复的。例如把“日”“韩”“可爱”“小女孩”作为关键词，那么之前提到的标题“日韩可爱小香风蝴蝶结小女孩磨毛T恤”就能转化为有四个1其他全零的向量。之后就能计算标题的汉明距离以此来代表商品标题的近似程度。设商品A与商品B的标题汉明码分别为h_titelA和h_titelB，minmax是归一化函数：

D_titel＝minmax(|h_titelA-h_titelB|)

(3)价格近似。商品的价格有三个特征可以刻画，销售价，市场价，折扣，跟之前的图像文字特征不一样，这三个特征与点击率的关系可以用皮尔森相关系数(PearsonCorrelation Coefficient)计算得到它们的相关性，皮尔森相关系数是一个介于-1和1之间的值，当两个变量的线性关系增强时，相关系数趋于1或-1；当一个变量增大，另一个变量也增大时，表明它们之间是正相关的，相关系数大于0；如果一个变量增大，另一个变量却减小，表明它们之间是负相关的，相关系数小于0；如果相关系数等于0，表明它们之间不存在线性相关关系。根据我们在数据集中的计算结果，商品的销售价格与点击率负相关，市场价格与点击率负相关，但是小于销售价格的相关系，相关系数折扣与点击率正相关，其中折扣在这三个特征中最影响点击率，而不是价格。

根据相关性计算结果，本发明利用销售价格的差值与折扣的差值作为价格相关性的刻画。设商品A与商品B的销售价格分别为price_A和price_B，折扣分别为discount_A和discount_B。下式中的minmax代表归一化函数。

D_price＝minmax(|price_A-price_B|)+|discount_A-discount_B|

(4)品牌近似。在品牌层面，品牌的销售均价与平均折扣跟点击率的相关性要比商品层面大，这是因为具体到商品层面，影响用户点击率的非价格因素占比大，而到了品牌层面，品牌自身的定位很大程度决定了品牌的平均点击率。我们计算了品牌的历史平均销售价格、历史平均折扣、平均销量以及利用了电商内部对品牌的定位将其化为一个0到1的数进行测量。设品牌A与品牌B的平均销售价格分别为price_brandA和price_brandB，折扣分别为discount_brandA和discount_brandB，销量分别为sale_brandA和sale_brandB，品牌定位分别为level_brandA和level_brandB。下式中的minmax代表归一化函数。

D_brand＝minmax(|price_brandA-price_brandB|)

+|discount_brandA-discount_brandB|

+minmax(|sale_brandA-sale_brandB|)

+minmax(|level_brandA-level_brandB|)

根据多次实验以及经验，商品的价格对商品的点击率比图片、标题以及品牌的影响都要大，因此商品总的距离计算如下：

L＝0.2*D_figure+0.2*D_title+0.4*D_price+0.2*D_brand

因为四个方面的特征量纲不一样需要归一化到01之间，再进行加权相加，就可以得到商品近似函数，函数值越小商品越相似。

2、填充缺失的销售时间序列：

本发明对所有商品按照销售时间长短分为主商品和填充商品，只对主商品的缺失销售时间序列进行填充，例如主商品A在所有的时间段中只有部分时间段有销售数据，在没有销售数据的周数，找出所有在该时间段销售的商品，按照商品近似函数可以得到近似值排序，选取近似值最大的商品B作为商品A的代替商品，因此商品B的点击率就是商品A在该周的点击率。此外还计算了时间窗特征加入到序列当中。

3、带有衰减机制的时序模型；

把商品A填充后的销售序列表示时间步数为T，即总时间步为T，特征数量为D，即维度为D的多变量时间序列，其中x_t,t∈{1,2,...,T}表示在时间s_t，商品A的销售记录，也有可能是商品A的近似商品在该时间步的销售记录。为了区分真实观测值和填充值的差别，定义m_t,t∈{1,2,...,T}表示在时间s_t，x_t是否商品A的真实销售记录，若有记录m_t取1，相反则取0。同时我们定义其中δ_t表示商品A的真正销售记录距离上一个真实销售的记录的时间间隔。

带有衰减机制的时序模型GRU的内部结构图如图2所示，在时序模型上选择GRU，它的门控机制能够很好的捕捉时间上的长期趋势和短期趋势以及该门控机制还能应用到带有缺失值的时间序列上，填充商品会在一定程度上给时间序列的建模带来不可控的因素，因为无法得知填充的是否正确，因此需要一个衰减机制区分主商品和填充商品在时间序列上的区别。定义在时间步t时刻的衰减因子γ_t，距离上一次真实销售记录越远则衰减因子越大，这符合客观规律，如果在销售时间序列中间存在大量的填充商品记录，即使在一开始的时间步有真实商品销售记录模型也应该更看重当前时间步的信息而不是过去时间步的信息。用sigmoid函数对衰减因子控制在0到1之间。

γ_t＝sigmoid{-max(0,W_γδ_t+b_γ)}

隐藏状态从当前状态一直衰减至零，隐藏状态的每个特征都有同样的衰减因子，衰减因子与隐藏状态做哈达玛积之后就得到衰减隐藏状态。我们在每一个时间步计算之前都把隐藏状态进行衰减，然后用标准的GRU更新方程进行迭代。

原始时间序列特征维度是D，经过GRU变换后，得到特征时间序列：

其中，N₁是GRU隐藏单元的数量，g_t,t∈{1,2,…,T}表示在时间步t时刻时序模型的隐藏状态。

4、时序信息与商品信息进行交互；

特征时间序列和交互时间序列交互机制示意图，如图3所示，除了时序模型以外，对一条完整的商品销售时间序列中的所有商品用独热编码，给每一个独热编码随机初始化一个对应的词向量，再按照时间序列中的排序形成一条商品词向量序列加入到模型的训练中。与时序模型不同的是，如果是同一个商品在时间序列中多次出现，那么在商品此词向量序列中同一个词向量也会多次出现，因此词向量包含的是商品自身与时间序列无关的信息。接下来把词向量序列输入到一个全连接矩阵，输出一个特征维度与上个模块用的GRU特征维度相同的序列，由上个模块可以知道该维度是N，总的时间步是T，因此把商品词向量序列：维度调换，得到调换后的商品词向量序列：

其中，N₂是商品词向量的维度，T是总时间步。

5、把与做矩阵乘法，得到交互时间序列这个交互时间序列也为时间序列，交互时间序列的特征维度跟它的时间步长度一致，即其N₁＝N₂。在时间步为t，特征维度为d的位置，有特征f_t ^d，它由该时间步的GRU隐藏状态和任意一个在该交互时间序列中的商品词向量做点积再相加得到：

因为在同一个时间序列中的填充商品都是由模块1的商品相似度函数计算得到的，因此它们的词向量应该比较接近，通过把每个时间步中的状态与该时间序列中的每个商品词向量相乘得到的f_t ^d可以得到一些交互属性，例如如果该时间步的特征与商品词向量特征有比较大的相似性，那么它们的乘积f_t ^d会比相似性较小得到的f_t ^d大。

之后把特征时间序列g和交互时间序列f分别输入到一个全连接层得到每个时间步的预测点击率,输出两个点击率，对两个点击率都用均方损失进行监督，利用超参数α平衡两个损失函数之间的关系。模型的损失函数为：

loss＝α*loss_g+(1-α)*loss_f，

其中，loss_g为特征时间序列的损失值，loss_f为交互时间序列的损失值，α为超参数，loss为总体损失值；在模型的训练上，为了尽量降低填充商品信息对时间序列带来的错误信息，只对主商品的点击率进行监督。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的商品点击率预测方法，其特征在于，包括以下步骤：

S3、将多变量时间序列输入时序模型，进行深度网络学习迭代，得到迭代后的特征时间序列；

S4、对商品用独热编码，得到商品词向量，经过排序，得到商品词向量序列，将特征时间序列与商品词向量序列进行交互，得到交互时间序列；

2.根据权利要求1所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述商品信息包括商品图片、商品标题、商品价格、商品品牌。

3.根据权利要求2所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述步骤S1具体为：

D_figure＝minmax(|h_figureA-h_figureB|)，

D_titel＝minmax(|h_titelA-h_titelB|)，

对于商品价格：商品价格包括三个特征：商品价格第一特征、商品价格第二特征、商品价格第三特征；通过皮尔森相关系数分别计算特征与点击率的相关性，具体如下：若皮尔森相关系数为负数，则特征与点击率是负相关关系；若皮尔森相关系数为正数，则特征与点击率是正相关关系；若皮尔森相关系数为零，则特征与点击率无关；根据相关系数计算结果，使用销售价格差值与折扣价格差值进行商品价格相关性刻画，得到商品价格相似度D_price：

D_price＝minmax(|price_A-price_B|)+|discount_A-discount_B|，

根据商品图片相似度、商品标题相似度、商品价格相似度、商品品牌相似度，建立商品相似性函数：

L＝0.2*D_figure+0.2*D_title+0.4*D_price+0.2*D_brand。

4.根据权利要求3所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述商品价格第一特征为销售价格，所述商品价格第二特征为市场价格，所述商品价格第三特征为折扣。

5.根据权利要求1所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述步骤S2具体为：根据商品销售时间长短进行分类，分为主商品和填充商品，对于缺失商品销售时间序列主商品，通过商品相似性函数进行近似值排序，选择近似值排序最大的商品进行填充，即使用近似值排序最大的商品代替缺失商品销售时间序列主商品，近似值排序最大的商品点击率为缺失商品销售时间序列主商品点击率，加入时间窗特征，得到时间步数为T，即总时间步为T，特征数量为D，即维度为D的多变量时间序列：

其中，x_t,t∈{1,2,...,T}表示在时间s_t商品的销售记录。

6.根据权利要求1所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述步骤S3具体为：对于多变量时间序列，

其中，x_t,t∈{1,2,...,T}表示在时间s_t商品的销售记录；

定义:

将多变量时间序列输入时序模型，进行深度网络学习迭代，得到特征时间序列，同时按照真实销售记录的时间间隔对时序模型的隐藏状态进行衰减，区分主商品和填充商品在数据序列中的重要性；定义在时间步t时刻的衰减因子γ_t，用sigmoid函数对衰减因子控制在0到1之间，则有：

γ_t＝sigmoid{-max(0,W_γδ_t+b_γ)}，

其中，W_γ表示作用在时间间隔上权重矩阵，b_γ表示偏置，γ_t为时间步t时刻的衰减因子；

7.根据权利要求6所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述时序模型为带有衰减机制的时序模型GRU。

8.根据权利要求6所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述步骤S4具体为：对一条完整的商品销售时间序列中的所有商品用独热编码，给每一个独热编码随机初始化一个对应的词向量，再按照时间序列中的排序形成一条商品词向量序列；对商品词向量序列做维度调换，即把商品词向量序列：维度调换，得到调换后的商品词向量序列：

其中，N₂是商品词向量的维度，T是总时间步；

将特征时间序列和调换后的词向量序列进行矩阵乘法，其中N₁＝N₂，则得到交互时间序列：

9.根据权利要求1所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述步骤S5具体为：将特征时间序列和交互时间序列分别输入到全连接网络，分别计算得到特征时间序列的损失值和交互时间序列的损失值，得到每个时间步的预测点击率，即对预测点击率用均方损失进行监督，利用超参数平衡两个损失函数关系，损失函数为：

loss＝α*loss_g+(1-α)*loss_f，

10.根据权利要求9所述的一种基于深度学习的商品点击率预测方法，其特征在于，所述监督针对主商品的点击率。