CN110838021A

CN110838021A - 转化率预估方法、装置、电子设备及存储介质

Info

Publication number: CN110838021A
Application number: CN201910979124.1A
Authority: CN
Inventors: 孙士元; 谢乾龙; 王兴星; 王栋
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2019-10-15
Filing date: 2019-10-15
Publication date: 2020-02-25

Abstract

本申请实施例公开了一种转化率预估方法、装置、电子设备及存储介质，该方法包括：针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段；根据每个用户对应的纯点击序列段、点击并下单序列段和纯下单序列段，确定训练样本集；根据训练样本集对词向量模型进行训练，得到词嵌入矩阵；根据词嵌入矩阵确定当前商家对应的词嵌入向量；确定当前用户的历史行为数据所针对的历史商家，并确定历史商家对应的词嵌入向量；根据当前商家对应的词嵌入向量和历史商家对应的词嵌入向量，预估当前用户对当前商家的转化率。本申请实施例较适用于高频使用的场景中，提高了转化率预估结果的精确度。

Description

转化率预估方法、装置、电子设备及存储介质

技术领域

本申请的实施例涉及互联网技术领域，特别是涉及一种转化率预估方法、装置、电子设备及存储介质。

背景技术

现有技术中，应用词嵌入向量预估转化率时，一般应用用户的点击序列，来训练词嵌入向量，并使用该词嵌入向量来预估转化率。由于只使用用户的点击序列作为训练语料，不适用于高频使用的场景中，在高频使用的场景中，转化率预估的结果精确度较低。

发明内容

本申请实施例提供一种转化率预估方法、装置、电子设备及存储介质，以提高转化率预估结果的精确度。

为了解决上述问题，第一方面，本申请实施例提供了一种转化率预估方法，包括：

针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段；

根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集；

根据所述训练样本集，对词向量模型进行训练，得到词嵌入矩阵；

根据所述词嵌入矩阵，确定当前商家对应的词嵌入向量；

确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵，确定所述历史商家对应的词嵌入向量；

根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率。

第二方面，本申请实施例提供了一种转化率预估装置，包括：

序列提取模块，用于针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段；

训练样本确定模块，用于根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集；

训练模块，用于根据所述训练样本集，对词向量模型进行训练，得到词嵌入矩阵；

当前向量确定模块，用于根据所述词嵌入矩阵，确定当前商家对应的词嵌入向量；

历史向量确定模块，用于确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵，确定所述历史商家对应的词嵌入向量；

转化率预估模块，用于根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率。

第三方面，本申请实施例还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本申请实施例所述的转化率预估方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本申请实施例公开的转化率预估方法的步骤。

本申请实施例公开的转化率预估方法、装置、电子设备及存储介质，通过针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段，根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集，根据所述训练样本集对词向量模型进行训练，得到词嵌入矩阵，根据词嵌入矩阵确定当前商家对应的词嵌入向量，并根据所述词嵌入向量，确定当前用户的历史行为数据所针对的历史商家，并确定历史商家对应的词嵌入向量，根据当前商家对应的词嵌入向量和历史商家对应的词嵌入向量预估当前用户对当前商家的转化率，由于在组织训练语料即训练样本集时，充分考虑了点击和下单行为之间的内在联系，语料包含有更丰富和合理的行为信息，从而使得训练出的词嵌入向量在空间中的距离表达更为精准，较适用于高频使用的场景中，从而提高了转化率预估结果的精确度。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例一的转化率预估方法的流程图；

图2是本申请实施例中的提取纯点击序列段、点击并下单序列段和纯下单序列段的流程图；

图3是本申请实施例二的转化率预估装置结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例一

本实施例公开的一种转化率预估方法，如图1所示，该方法包括：步骤110至步骤150。

步骤110，针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段。

其中，纯点击序列段是指用户针对商家的点击行为构成的序列；点击并下单序列段是指用户针对商家的点击行为和下单行为构成的序列，且序列段的最后一个行为是下单行为，其他行为均是点击行为；纯下单序列段是指用户针对商家的下单行为构成的序列。

获取每个用户的历史行为数据，对每个用户的历史行为数据分别进行处理，得到每个用户针对商家的纯点击序列段、点击并下单序列段和纯下单序列段。在提取一个用户对应的纯点击序列段、点击并下单序列段和纯下单序列段时，首先从该用户的历史行为数据中提取出针对商家的点击行为和下单行为，按照时间顺序将点击行为和下单行为组成行为序列，并按照时间顺序将下单行为组成下单序列，针对行为序列按照第一预设时间间隔和下单行为对行为序列进行分割，得到纯点击序列段和点击并下单序列段，针对下单序列按照第二预设时间间隔进行分割，得到纯下单序列段。

在本申请的一个实施例中，所述针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段，包括：步骤111至步骤117。

步骤111，确定当前处理用户。

针对一个购物平台或者综合服务平台，都会有很多用户，在确定所有商家对应的词嵌入矩阵时，可以针对一个平台上的所有用户的历史行为数据进行分析。针对每一个用户分别进行处理，可以从所有用户中抽取一个用户作为当前处理用户。

步骤112，获取所述当前处理用户的历史行为数据。

从数据库中获取当前处理用户的历史行为数据。

步骤113，按照时间顺序，从所述历史行为数据中提取出所述当前处理用户针对商家的行为序列。

按照时间顺序，从所述历史行为数据中提取出当前处理用户针对商家的点击行为和下单行为对应的行为序列，行为序列可以表示如下：

click₁、click₂、click₃、order₁、click₄、……、order_n、click_m、……其中，click_m表示当前处理用户针对某商家的点击行为，order_n表示当前处理用户针对某商家的下单行为，例如在外卖领域，click_m和order_n均可以用商家对应的POI(Point of Interest，兴趣点)表示。

步骤114，根据所述行为序列，确定下单行为对应的下单序列。

将行为序列命名为序列A，将行为序列中所有的order元素抽取出来，即将行为序列中下单行为对应的元素抽取出来，按时间顺序递增，得到下单序列，命名为序列B，序列A和序列B可以表示如下：

A：click₁、click₂、click₃、order₁、click₄、……、order_n、click_m、……

B：order₁、order₂、order₃……

步骤115，按照第一预设时间间隔和下单行为，分别对所述行为序列进行截断，以将所述行为序列分割为纯点击序列段和点击并下单序列段。

对于行为序列，即序列A，自起始遍历，相邻的两次点击行为之间时间间隔大于第一预设时间间隔或者遇到下单行为，截断生成一个序列段，然后自截断行为的下一位继续遍历直至最后，得到多个纯点击序列段和点击并下单序列段。得到的纯点击序列段和点击并下单序列段可以表示如下：

a.纯点击序列段，如：click₁、click₂、click₃、……、click_n

b.点击并下单序列段，如：click_i、click_i+1、click_i+2、……、order₁

步骤116，按照第二预设时间间隔，对所述下单序列进行截断，以将所述下单序列分割为纯下单序列段。

对于下单序列，即序列B，自起始遍历，相邻的两次下单行为之间时间间隔大于第二预设时间间隔，截断生成一个序列段，然后自截断下单的下一位继续遍历直至最后，得到多个纯下单序列段。得到的纯下单序列段可以表示如下：

c.纯下单序列段，如：order₁、order₂、order₃、……

其中，所述第一预设时间间隔小于所述第二预设时间间隔。所述第一预设时间间隔例如可以是30分钟，所述第二预设时间间隔例如可以是14天。

步骤117，判断是否得到所有用户对应的纯点击序列段、点击并下单序列段和纯下单序列段，如果否则执行步骤111，如果是则结束。

对于高频使用的场景，即使用较为频繁的场景，如外卖领域，通过根据行为序列生成纯点击序列段、点击并下单序列段和纯下单序列段，充分考虑了点击和下单行为之间的内在联系，使得训练语料包含有更丰富和合理的行为信息，可以训练得到适用于高频场景的更加有效的词嵌入向量。

步骤120，根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集。

针对每个序列段，按照词向量(word2vec)模型的样本确定方式，确定序列段对应的训练样本，所有序列段的训练样本组成训练词嵌入矩阵的训练样本集。

在本申请的一个实施例中，所述根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集，包括：根据所述纯点击序列段生成第一训练样本，根据所述点击并下单序列段生成第二训练样本，根据所述纯下单序列段生成第三训练样本；针对每个用户，分别混合所述第一训练样本、第二训练样本和第三训练样本，得到训练词嵌入矩阵的训练样本集。

对每个用户对应的纯点击序列段、点击并下单序列段和纯下单序列段分别进行处理，得到每个用户对应的第一训练样本、第二训练样本和第三训练样本。在生成上述第一训练样本、第二训练样本和第三训练样本时可以使用word2vec方式进行生成，例如通过CBOW(Continuous Bag-of-Words)或Skip-Gram模型生成。在生成第一训练样本、第二训练样本和第三训练样本后，将一个用户对应的第一训练样本、第二训练样本和第三训练样本中的各个训练样本的顺序随机打乱，从而将第一训练样本、第二训练样本集和第三训练样本混合在一起，得到一个用户对应的所有训练样本，再将所有用户对应的训练样本排列在一起，得到训练词嵌入矩阵的训练样本集，将三种训练样本混合后作为训练语料，充分考虑了点击和下单行为之间的内在联系，使得训练语料包含更丰富和合理的行为信息。

在本申请的一个实施例中，所述根据所述纯点击序列段生成第一训练样本，根据所述点击并下单序列段生成第二训练样本，根据所述纯下单序列段生成第三训练样本，包括：根据所述纯点击序列段，使用Skip-Gram模型和负采样生成第一训练样本；根据所述点击并下单序列段，使用Skip-Gram模型和负采样生成第二训练样本；根据所述纯下单序列段，使用Skip-Gram模型和负采样生成第三训练样本。

其中，Skip-Gram模型的输入是特定的一个词的词向量，而输出是特定词对应的上下文词向量。

例如，对于纯点击序列段“C1、C2、C3、C4、C5、C6、C7、C8”，在中心词为C5，Skip-Gram模型skip_window为2时，C3、C4、C5、C6、C7为窗口中的词，则窗口中的另外一个词为正样本(如C3)，再随机选取预设数量的其他的词即其他商家作为负采样词，例如得到的第一训练样本为“C5、C3、Ci、Cj、Ck、Cm”，Ci、Cj、Ck、Cm为负采样词。

对于点击并下单序列段“C1、C2、C3、C4、C5、C6、C7、C8、O1”，在中心词为C5，Skip-Gram模型skip_window为2时，C3、C4、C5、C6、C7为窗口中的词，而O1为固定正样本，窗口中的另外一个词为正样本(如C3)，再随机选取预设数量的其他的词即其他商家作为负采样词，例如得到的第二训练样本为“C5、C3、Ci、Cj、Ck、Cm、O1”，Ci、Cj、Ck、Cm为负采样词。

对于纯下单序列段“O1、O2、O3、O4、O5、O6、O7、O8”在中心词为O5，Skip-Gram模型skip_window为2时，O3、O4、O5、O6、O7为窗口中的词，窗口中的另外一个词为正样本(如O3)，再随机选取预设数量的其他的词即其他商家作为负采样词，例如得到的第三训练样本为“O5、O3、Oi、Oj、Ok、Om”，Oi、Oj、Ok、Om为负采样词。

本申请实施例通过使用Skip-Gram模型和负采样生成训练样本集，较适用于大型语料中，如外卖领域，可以得到较为合理的训练语料。在后续训练词嵌入矩阵时，词向量模型为Skip-Gram模型。

步骤130，根据所述训练样本集，对词向量模型进行训练，得到词嵌入矩阵。

其中，词向量模型(即word2vec模型)用于训练词嵌入矩阵，包括CBOW模型和Skip-Gram模型，本申请实施例中使用Skip-Gram模型。

将训练样本中的中心词输入词向量模型，训练样本中的其他词作为输出词，根据各个输出词对应的概率调整词向量模型中的权重，最后词向量模型训练完成后，提取词向量模型中的输入层到隐层的权重矩阵，该权重矩阵就是词嵌入矩阵。词嵌入矩阵包括各个商家对应的词嵌入向量。

在本申请的一个实施例中，采用所述第一训练样本训练所述词向量模型时使用第一损失函数表示如下：

其中，Loss₁为第一损失函数，D_p1为第一训练样本中中心词l1与正样本c1组成的样本对的集合，D_n1为第一训练样本中中心词l1与负采样词d1组成的样本对的集合，v_l1是中心词l1对应的词嵌入向量，v_c1是正样本c1对应的词嵌入向量，v′_c1是v_c1的转置向量，v_d1是负采样词d1对应的词嵌入向量，v′_d1是v_d1的转置向量，

是指后面括号中的表达式取最大值时变量θ₁的取值，θ₁为变量，即指v_l1、v_c1和v_d1；

采用所述第二训练样本训练所述词向量模型时使用的第二损失函数表示如下：

其中，Loss₂为第二损失函数，D_p2为第二训练样本中中心词l2与正样本c2组成的样本对的集合，D_n2为第二训练样本中中心词l2与负采样词d2组成的样本对的集合，v_l2是中心词l2对应的词嵌入向量，v_c2是正样本c2对应的词嵌入向量，v′_c2是v_c2的转置向量，v_d2是负采样词d2对应的词嵌入向量，v_lb是第二训练样本集中固定正样本lb对应的词嵌入向量，v′_lb是v_lb的转置向量，

是指后面括号中的表达式取最大值时变量θ₂的取值，θ₂为变量，即指v_l2、v_c2和v_d2；

采用所述第三训练样本训练所述词向量模型时使用的第三损失函数表示如下：

其中，Loss₃为第三损失函数，D_p3为第三训练样本中中心词l3与正样本c3组成的样本对的集合，D_n3为第三训练样本中中心词l3与负采样词d3组成的样本对的集合，v_l3是中心词l3对应的词嵌入向量，v_c3是正样本c3对应的词嵌入向量，v′_c3是v_c3的转置向量，v_d3是负采样词d3对应的词嵌入向量，v′_d3是v_d3的转置向量，

是指后面括号中的表达式取最大值时变量θ₃的取值，θ₃为变量，即指v_l3、v_c3和v_d3。

第一损失函数Loss₁(θ₁)的值由变量θ₁确定，而变量θ₁的值是表达式取最大值时变量v_l1、v_c1和v_d1的值，这时将变量θ₁的值代入第一损失函数Loss₁(θ₁)的公式中得到第一损失函数的值。第二损失函数Loss₂(θ₂)的值由变量θ₂确定，而变量θ₂的值是表达式

取最大值时变量v_l2、v_c2和v_d2的值，这时将变量θ₂的值代入第二损失函数Loss₂(θ₂)的公式中得到第二损失函数的值。第三损失函数Loss₃(θ₃)的值由变量θ₃确定，而变量θ₃的值是表达式取最大值时变量v_l3、v_c3和v_d3的值，这时将变量θ₃的值代入第三损失函数Loss₃(θ₃)的公式中得到第三损失函数的值。

需要说明的是，上述中心词对应的词嵌入向量是在中心词使用的词嵌入矩阵中取出的，正样本的词嵌入向量、负采样词的词嵌入向量以及固定正样本的词嵌入向量均是在非中心词使用的词嵌入矩阵中取出的。其中，中心词使用的词嵌入矩阵是词向量模型中输入层到隐层的网络权重，非中心词使用的词嵌入矩阵是词向量模型中隐层到输出层的网络权重。在词向量模型训练完成后，将中心词使用的词嵌入矩阵作为后续转化率预估的词嵌入矩阵。

以一个训练样本“O5、O3、Oi”为例，O5为中心词，O3为正样本，Oi为负采样词，为了描述方便，假设每个商家对应的词嵌入向量的维度为2，经过该条训练样本的训练，从中心词使用的词嵌入矩阵中取出O5对应的词嵌入向量，从非中心词使用的词嵌入矩阵中分别取出O3、Oi对应的词嵌入向量，假设O5对应的词嵌入向量为(0.3，0.5)，O3对应的词嵌入向量为(0.2，0.8)，Oi对应的词嵌入向量为(0.7，0.4)，则O5对应的词嵌入向量与O3对应的词嵌入向量的内积为0.3*0.2+0.5*0.8＝0.46，则第三损失函数中前半部分为log(1/(1+e^(-0.46)))，O5对应的词嵌入向量与Oi对应的词嵌入向量的内积为0.3*0.7+0.2*0.4＝0.29，则第三损失函数中后半部分为log(1/(1+e^(0.29)))，因此得到该条训练样本对应的第三损失函数为Loss₃＝log(1/(1+e^(-0.46)))+log(1/(1+e^(0.29)))。

从混合样本后得到的训练样本集中按照顺序取出一批训练样本，用这一批训练样本训练词向量模型，并调整模型的参数，这一批训练样本中包括第一训练样本、第二训练样本和第三训练样本，分别按照上述损失函数的公式计算这一批训练样本中每个训练样本对应的损失函数的值，将每个训练样本对应的损失函数的值之和除以训练样本的数量，得到本次训练后损失函数的值，根据该损失函数的值进行反向传播学习，调整词向量模型中的参数，即调整词向量模型中的输入层到隐层的权重以及隐层到输出层的权重，实现对词嵌入矩阵的调整。之后再选取下一批训练样本，并按照损失函数的值调整词嵌入矩阵，按此方式训练词向量模型，直至损失函数的值满足要求，即损失函数的值小于预设值，词向量模型训练完成，提取出词向量模型中输入层到隐层的权重矩阵，该权重矩阵即得到的词嵌入矩阵。

步骤140，根据所述词嵌入矩阵，确定当前商家对应的词嵌入向量。

当前商家为待预估转化率的商家。词嵌入矩阵由各个商家对应的词嵌入向量组成，从词嵌入矩阵中提取出当前商家对应的行向量，并对行向量进行转置得到当前商家对应的词嵌入向量。或者，将当前商家的独热编码与所述词嵌入矩阵相乘，得到当前商家对应的词嵌入向量。

步骤150，确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵，确定所述历史商家对应的词嵌入向量。

本申请实施例是预估用户对当前商家的转化率，所以当前用户的历史行为数据可以是下单行为，确定用户的下单行为所针对的历史商家，并从所述词嵌入矩阵中提取历史商家对应的词嵌入向量。

在本申请的一个实施例中，所述确定当前用户的历史行为数据所针对的历史商家，包括：根据所述当前用户的历史行为数据，确定所述当前用户最近下单的预设数量的商家，作为所述历史商家。可以将当前用户最近下单的预设数量的商家作为历史商家，体现了用户最近的兴趣，从而可以提高后续转化率预估的准确性。

步骤160，根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率。

在本申请的一个实施例中，所述根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率，包括：确定所述历史商家对应的词嵌入向量的均值向量；计算所述均值向量与所述当前商家对应的词嵌入向量的差值向量；将所述差值向量输入转化率预估模型，得到所述当前用户对所述当前商家的转化率。

其中，转化率预估模型可以是神经网络模型。

将当前用户最近下单的预设数量的商家作为历史商家，求取历史商家的词嵌入向量的均值向量，将均值向量与当前商家对应的词嵌入向量的差值向量作为转化率预估模型的输入特征并输入转化率预估模型，得到当前用户对当前商家的转化率，充分考虑了用户最近的兴趣，进一步提高转化率预估的准确性。

例如，对于当前商家，从词嵌入矩阵中取出当前商家对应的词嵌入向量，假设为A(如32维向量)，取到当前用户最近15次下单的15个商家对应的词嵌入向量的均值向量，假设为B(如32维向量)，B-A得到的32维向量即差值向量，该差值向量作为转化率预估模型的输入特征，并输入转化率预估模型，得到当前用户对当前商家的转化率。

本申请实施例公开的转化率预估方法，通过针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段，根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集，根据所述训练样本集对词向量模型进行训练，得到词嵌入矩阵，根据词嵌入矩阵确定当前商家对应的词嵌入向量，确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵确定所述历史商家对应的词嵌入向量，根据所述当前商家对应的词嵌入向量和历史商家对应的词嵌入向量，预估当前用户对当前商家的转化率，由于在组织训练语料即训练样本集时，充分考虑了点击和下单行为之间的内在联系，语料包含有更丰富和合理的行为信息，从而使得训练出的词嵌入向量在空间中的距离表达更为精准，较适用于高频使用的场景中，从而提高了转化率预估结果的精确度。

实施例二

本实施例公开的一种转化率预估装置，如图3所示，所述转化率预估装置300包括：

序列提取模块310，用于针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段；

训练样本确定模块320，用于根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集；

训练模块330，用于根据所述训练样本集，对词向量模型进行训练，得到词嵌入矩阵；

当前向量确定模块340，用于根据所述词嵌入矩阵，确定当前商家对应的词嵌入向量；

历史向量确定模块350，用于确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵，确定所述历史商家对应的词嵌入向量；

转化率预估模块360，用于根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率。

可选的，所述序列提取模块包括：

用户选取单元，用于确定当前处理用户；

数据获取单元，用于获取所述当前处理用户的历史行为数据；

行为序列提取单元，用于按照时间顺序，从所述历史行为数据中提取出所述当前处理用户针对商家的行为序列；

下单序列确定单元，用于根据所述行为序列，确定下单行为对应的下单序列；

第一序列段截断单元，用于按照第一预设时间间隔和下单行为，分别对所述行为序列进行截断，以将所述行为序列分割为纯点击序列段和点击并下单序列段；

第二序列段截断单元，用于按照第二预设时间间隔，对所述下单序列进行截断，以将所述下单序列分割为纯下单序列段；

循环控制单元，用于循环执行上述确定当前处理用户和分割行为序列及下单序列的操作，直至得到每个用户对应的纯点击序列段、点击并下单序列段和纯下单序列段。

可选的，所述训练样本确定模块包括：

训练样本生成单元，用于根据所述纯点击序列段生成第一训练样本，根据所述点击并下单序列段生成第二训练样本，根据所述纯下单序列段生成第三训练样本；

训练样本混合单元，用于针对每个用户，分别混合所述第一训练样本、第二训练样本和第三训练样本，得到训练词嵌入矩阵的训练样本集。

可选的，所述训练样本生成单元具体用于：

根据所述纯点击序列段，使用Skip-Gram模型和负采样生成第一训练样本；

根据所述点击并下单序列段，使用Skip-Gram模型和负采样生成第二训练样本；

根据所述纯下单序列段，使用Skip-Gram模型和负采样生成第三训练样本。

可选的，采用所述第一训练样本训练所述词向量模型时使用的第一损失函数表示如下：

其中，Loss₂为第二损失函数，D_p2为第二训练样本中中心词l2与正样本c2组成的样本对的集合，D_n2为第二训练样本中中心词l2与负采样词d2组成的样本对的集合，v_l2是中心词l2对应的词嵌入向量，v_c2是正样本c2对应的词嵌入向量，v′_c2是v_c2的转置向量，v_d2是负采样词d2对应的词嵌入向量，v′_d2是v_d2的转置向量，v_lb是第二训练样本集中固定正样本lb对应的词嵌入向量，v′_lb是v_lb的转置向量，

其中，Loss₃为第三损失函数，D_p3为第三训练样本中中心词l3与正样本c3组成的样本对的集合，D_n3为第三训练样本中中心词l3与负采样词d3组成的样本对的集合，v_l3是中心词l3对应的词嵌入向量，v_c3是正样本c3对应的词嵌入向量，v′_c3是v_c3的转置向量，v_d3是负采样词d3对应的词嵌入向量，v′_d3是v_d3的转置向量，是指后面括号中的表达式取最大值时变量θ₃的取值，θ₃为变量，即指v_l3、v_c3和v_d3。

可选的，所述历史向量确定模块包括：

历史商家确定单元，用于根据所述当前用户的历史行为数据，确定所述当前用户最近下单的预设数量的商家，作为所述历史商家。

可选的，所述转化率预估模块包括：

均值向量求取单元，用于确定所述历史商家对应的词嵌入向量的均值向量；

差值向量计算单元，用于计算所述均值向量与所述当前商家对应的词嵌入向量的差值向量；

转化率预估单元，用于将所述差值向量输入转化率预估模型，得到所述当前用户对所述当前商家的转化率。

本申请实施例提供的转化率预估装置，用于实现本申请实施例一中所述的转化率预估方法的各步骤，装置的各模块的具体实施方式参见相应步骤，此处不再赘述。

本申请实施例公开的转化率预估装置，通过序列提取模块针对每个用户，分别按照时间顺序，从当前用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段，训练样本确定模块根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集，训练模块根据所述训练样本集对词向量模型进行训练，得到词嵌入矩阵，当前向量确定模块根据词嵌入矩阵中确定当前商家对应的词嵌入向量，历史向量确定模块确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵，确定所述历史商家对应的词嵌入向量，转化率预估模块根据所述当前商家对应的词嵌入向量和历史商家对应的词嵌入向量，预估当前用户对当前商家的转化率，由于在组织训练语料即训练样本集时，充分考虑了点击和下单行为之间的内在联系，语料包含有更丰富和合理的行为信息，从而使得训练出的词嵌入向量在空间中的距离表达更为精准，较适用于高频使用的场景中，从而提高了转化率预估结果的精确度。

相应的，本申请实施例还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例一所述的转化率预估方法。所述电子设备可以为服务器、PC机、移动终端、个人数字助理、平板电脑等。

本申请实施例还公开了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请实施例一所述的转化率预估方法的步骤。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本申请实施例提供的一种转化率预估方法、装置、电子设备及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims

1.一种转化率预估方法，其特征在于，包括：

根据所述词嵌入矩阵，确定当前商家对应的词嵌入向量；

2.根据权利要求1所述的方法，其特征在于，所述针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段，包括：

确定当前处理用户；

获取所述当前处理用户的历史行为数据；

按照时间顺序，从所述历史行为数据中提取出所述当前处理用户针对商家的行为序列；

根据所述行为序列，确定下单行为对应的下单序列；

按照第一预设时间间隔和下单行为，分别对所述行为序列进行截断，以将所述行为序列分割为纯点击序列段和点击并下单序列段；

按照第二预设时间间隔，对所述下单序列进行截断，以将所述下单序列分割为纯下单序列段；

循环执行上述确定当前处理用户和分割行为序列及下单序列的操作，直至得到每个用户对应的纯点击序列段、点击并下单序列段和纯下单序列段。

3.根据权利要求1所述的方法，其特征在于，所述根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集，包括：

根据所述纯点击序列段生成第一训练样本，根据所述点击并下单序列段生成第二训练样本，根据所述纯下单序列段生成第三训练样本；

针对每个用户，分别混合所述第一训练样本、第二训练样本和第三训练样本，得到训练词嵌入矩阵的训练样本集。

4.根据权利要求3所述的方法，其特征在于，所述根据所述纯点击序列段生成第一训练样本，根据所述点击并下单序列段生成第二训练样本，根据所述纯下单序列段生成第三训练样本，包括：

5.根据权利要求4所述的方法，其特征在于，采用所述第一训练样本训练所述词向量模型时使用的第一损失函数表示如下：

其中，Loss₂为第二损失函数，D_p2为第二训练样本中中心词l2与正样本c2组成的样本对的集合，D_n2为第二训练样本中中心词l2与负采样词d2组成的样本对的集合，v_l2是中心词l2对应的词嵌入向量，v_c2是正样本c2对应的词嵌入向量，v′_c2是v_c2的转置向量，v_d2是负采样词d2对应的词嵌入向量，v′_d2是v_d2的转置向量，v_lb是第二训练样本中固定正样本lb对应的词嵌入向量，v′_lb是v_lb的转置向量，

6.根据权利要求1所述的方法，其特征在于，所述确定当前用户的历史行为数据所针对的历史商家，包括：

根据所述当前用户的历史行为数据，确定所述当前用户最近下单的预设数量的商家，作为所述历史商家。

7.根据权利要求1所述的方法，其特征在于，所述根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率，包括：

确定所述历史商家对应的词嵌入向量的均值向量；

计算所述均值向量与所述当前商家对应的词嵌入向量的差值向量；

将所述差值向量输入转化率预估模型，得到所述当前用户对所述当前商家的转化率。

8.一种转化率预估装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任意一项所述的转化率预估方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至7任意一项所述的转化率预估方法的步骤。