CN109191159B

CN109191159B - 数据定向方法、装置、计算机设备及计算机可读存储介质

Info

Publication number: CN109191159B
Application number: CN201810712519.0A
Authority: CN
Inventors: 雷文康
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2018-06-29
Filing date: 2018-06-29
Publication date: 2021-08-20
Anticipated expiration: 2038-06-29
Also published as: CN109191159A

Abstract

本发明实施例提供了一种数据定向方法、装置、计算机设备及计算机可读存储介质，其中，该方法包括：根据用户请求和待投放数据的投放业务指标，得到发起请求的用户与待投放数据的匹配度；根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，并将所述待投放数据投放给所述目标用户。该方案有利于提高数据定向的精准性，有利于实现待投放数据达成数据投放主设置的投放业务指标。

Description

数据定向方法、装置、计算机设备及计算机可读存储介质

技术领域

本发明涉及互联网技术领域，特别涉及一种数据定向方法、装置、计算机设备及计算机可读存储介质。

背景技术

在广告、新闻等数据的定向过程中：通过用户与数据之间的匹配技术确定目标用户，并将数据定向地投放给目标用户，该目标用户为对该数据关注或感兴趣的用户，以提高数据定向的精准性。

在现有技术中，针对广告、新闻等数据的定向，以广告为例，主要包括以下几种定向方式：人群定向、行为定向、地理位置定向以及相似用户定向。这几种定向方式的主要原理是：首先，广告主预先设定若干具体的有关目标用户的定向条件，例如，用户属性(年龄、性别、教育背景等)、地理位置定向中的定向区域范围、行为定向中用户的历史搜索行为等信息，然后，利用匹配技术根据广告主设定的定向条件来匹配出目标用户，最后，将广告投放给目标用户。

可见，现有的数据定向方案是根据广告主预先设定的有关目标用户的定向条件来匹配目标用户的，但是，定向条件存在以下缺陷：本身往往难以准确、全面描述目标用户群体，例如，美食类广告的目标群体十分广泛，定向条件并不能很好的描述每个用户的偏好，可能忽略掉对用户的特定偏好的属性描述；定向条件本身是静态的，并不符合用户的实时需求，使得定向条件缺乏实时性。因此，由于定向条件存在上述缺陷，使得降低了现有的数据定向方案的精准性。

发明内容

本发明实施例提供了一种数据定向方法，以解决现有技术中数据定向存在的精准性低的技术问题。该方法包括：

根据用户请求和待投放数据的投放业务指标，得到发起请求的用户与待投放数据的匹配度；

根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，并将所述待投放数据投放给所述目标用户。

本发明实施例还提供了一种数据定向装置，以解决现有技术中数据定向存在的精准性低的技术问题。该装置包括：

匹配度确定模块，用于根据用户请求和待投放数据的投放业务指标，得到发起请求的用户与待投放数据的匹配度；

投放模块，用于根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，并将所述待投放数据投放给所述目标用户。

本发明实施例还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任意的数据定向方法。以解决现有技术中数据定向存在的精准性低的技术问题。

本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有执行上述任意的数据定向方法的计算机程序。以解决现有技术中数据定向存在的精准性低的技术问题。

在本发明实施例中，根据用户请求和待投放数据的投放业务指标来得到发起请求的用户与待投放数据的匹配度，进而基于发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，最终，在确定发起请求的用户为目标用户时，将待投放数据投放给发起请求的用户，以完成数据定向。在确定目标用户的过程中，是基于用户请求和待投放数据的投放业务指标来得到匹配度的，由于用户请求是用户自主发起的，使得用户请求相对于现有技术中预先设定的定向条件更能准确地描述用户属性；同时，由于用户请求是动态的且是用户实时发起的，使得用户请求更能代表用户当下的需求或意图，具备实时性，因此，基于用户请求确定出的目标用户更可能是当前对待投放数据关注或感兴趣的用户，有利于提高数据定向的精准性。此外，由于待投放数据的投放业务指标是数据投放主设置的希望待投放数据能够达成的业务指标，基于待投放数据的投放业务指标来得到匹配度，使得目标用户的确定与待投放数据的投放业务指标具有直接对应关系，向目标用户投放待投放数据后，有利于实现待投放数据达成数据投放主设置的投放业务指标。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。在附图中：

图1是本发明实施例提供的一种数据定向方法的流程图；

图2是本发明实施例提供的一种数据定向装置的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施方式和附图，对本发明做进一步详细说明。在此，本发明的示意性实施方式及其说明用于解释本发明，但并不作为对本发明的限定。

在本发明实施例中，提供了一种数据定向方法，如图1所示，该方法包括：

步骤101：根据用户请求和待投放数据的投放业务指标，得到发起请求的用户与待投放数据的匹配度；

步骤102：根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，并将所述待投放数据投放给所述目标用户。

由图1所示的流程可知，在本发明实施例中，根据用户请求和待投放数据的投放业务指标来得到发起请求的用户与待投放数据的匹配度，进而基于发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，最终，在确定发起请求的用户为目标用户时，将待投放数据投放给发起请求的用户，完成数据定向。在确定目标用户的过程中，是基于用户请求和待投放数据的投放业务指标来得到匹配度的，由于用户请求是用户自主发起的，使得用户请求相对于现有技术中预先设定的定向条件更能准确地描述用户属性；同时，由于用户请求是动态的且是用户实时发起的，使得用户请求更能代表用户当下的需求或意图，具备实时性，因此，基于用户请求确定出的目标用户更可能是当前对待投放数据关注或感兴趣的用户，有利于提高数据定向的精准性。此外，由于待投放数据的投放业务指标是数据投放主设置的希望待投放数据能够达成的业务指标，基于待投放数据的投放业务指标来得到匹配度，使得目标用户的确定与待投放数据的投放业务指标具有直接对应关系，向目标用户投放待投放数据后，有利于实现待投放数据达成数据投放主设置的投放业务指标。

具体实施时，上述用户请求可以是用户发起的任意请求，例如，可以是用户发起的搜索请求，还可以是用户发起的打开某个网页、打开某品牌网站的请求。

具体实施时，上述待投放数据可以是任意需要投放给用户的数据，例如，可以是广告、新闻等数据，该数据可以是文字、图片、视频等形式的数据内容。

具体实施时，上述投放业务指标是数据投放主针对待投放数据设置的业务指标，该投放业务指标包括对待投放数据执行的操作业务，例如，待投放数据为广告时，对应的投放业务指标可以是点击、转化(即下单)以及交易额等操作业务；待投放数据为新闻时，对应的投放业务指标可以是点击、关注、阅读以及收藏等操作业务。

具体实施时，为了进一步提高匹配度的准确性，在本实施例中，可以通过以下步骤来得到发起请求的用户与待投放数据的匹配度：

针对每个投放业务指标，从待投放数据中获取每个投放业务指标的第一特征信息，从发起的用户请求中获取每个投放业务指标的第二特征信息，进而将每个投放业务指标的第一特征信息和第二特征信息，输入所述每个投放业务指标对应的预测模型，逐一获得发起请求的用户与每个投放业务指标的匹配度，其中，所述第一特征信息为待投放数据中与投放业务指标相关的信息，所述第二特征信息为用户请求中与投放业务指标相关的信息；

将所述每个投放业务指标的匹配度乘以投放业务指标的权重值，得到每个投放业务指标的加权匹配度；

将所述每个投放业务指标的加权匹配度相加，得到所述发起请求的用户与待投放数据的匹配度。

具体实施时，上述第一特征信息为待投放数据中与投放业务指标相关的信息；第二特征信息为用户请求中与投放业务指标相关的信息。例如，待投放数据以广告为例，投放业务指标以点击为例，第一特征信息可以包括待投放数据的数据投放主(即广告主)的信息、该待投放数据的历史点击率以及数据投放主的星级等信息；第二特征信息可以包括发起请求的用户的信息以及用户请求的具体内容等信息，其中，发起请求的用户的信息可以包括用户所在的当前位置、用户的历史点击率以及用户与广告商家之间的距离等内容，用户请求的具体内容可以包括用户请求的关键字、关键词的上下文、请求的品类以及用户的偏好等内容。

具体实施时，在预测过程中，将每个投放业务指标的第一特征信息和第二特征信息，输入所述每个投放业务指标对应的预测模型。以“点击”和“转化”两个投放业务指标为例，将“点击”这个投放业务指标的第一特征信息和第二特征信息输入“点击”对应的预测模型中，输出发起请求的用户与“点击”这个投放业务指标的匹配度；将“转化”这个投放业务指标的第一特征信息和第二特征信息输入“转化”对应的预测模型中，输出发起请求的用户与“转化”这个投放业务指标的匹配度。

具体实施时，通过预测模型来预测发起请求的用户与各投放业务指标的匹配度，具体的，预测模型可以直接输出表示发起请求的用户与投放业务指标的匹配度的数值，也可以输出其他含义的数据，该数据间接表示发起请求的用户与投放业务指标的匹配度，例如，通过预测模型预测用户请求达成投放业务指标的概率，该概率的大小代表了发起请求的用户与投放业务指标的匹配度大小。

具体实施时，每个投放业务指标对应一个预测模型，为了准确地预测发起请求的用户与各投放业务指标的匹配度，在本实施例中，可以通过以下步骤来训练各投放业务指标对应的预测模型：

获取已曝光数据且已达成投放业务指标的用户请求，作为正样本；例如，待投放数据以广告为例，投放业务指标以点击为例，根据广告的历史投放数据以及历史用户请求数据，将已经曝光数据且已达成点击的用户请求作为正样本。

获取已曝光数据且未达成投放业务指标的用户请求，作为负样本；例如，待投放数据以广告为例，投放业务指标以点击为例，根据广告的历史投放数据以及历史用户请求数据，将已经曝光数据且未达成点击的用户请求作为负样本。

从正样本和负样本中，获取所述第二特征信息；

根据与投放业务指标相关的第一特征信息、获取的所述第二特征信息、正样本以及负样本进行训练，得到投放业务指标对应的预测模型。

具体实施时，基于与投放业务指标相关的第一特征信息、获取的第二特征信息、正样本以及负样本进行训练的过程，可以采用现有技术中的训练算法实现，得到的预测模型可以是二分类模型。例如，可以采用决策树、深度神经网络等算法，本申请对此不做具体限定。具体的，可以定期训练、更新各投放业务指标对应的预测模型。

具体实施时，上述各投放业务指标的权重值可以由数据投放主直接设置，例如，数据投放主将每个权重值设置为固定值；也可以通过算法来计算各投放业务指标的权重值。考虑到数据投放主可能对各投放业务指标的重要性把握不准确，不能准确地设置各投放业务指标的权重值，进而导致影响数据定向方案的精准性，在本实施例中，本申请发明人提出了一种计算各投放业务指标的权重值的方法，以使得各投放业务指标的权重值更合理，进而使得匹配度最大化。

例如，所述各投放业务指标的权重值通过以下方法确定：

首先，对每个投放业务指标设置优先级；具体实施时，可以按照优先级降序的方式排列多个投放业务指标；

然后，按照优先级顺序利用梯度下降算法依次计算各投放业务指标的权重值。在计算各投放业务指标的权重值的过程中，将用户与已投放数据的匹配度表示为当前投放业务指标的当前权重的函数，根据用户与已投放数据的匹配度对当前权重的偏导数的变化，来确定当前投放业务指标的权重值，其中，在各投放业务指标的权重值的大小顺序与各投放业务指标的优先级顺序一致的情况下得到的用户与已投放数据的匹配度中，根据计算出的各投放业务指标的权重值得到的用户与已投放数据的匹配度为最大值，也就说是，在各投放业务指标的权重值的大小顺序与各投放业务指标的优先级顺序一致(即前一优先级的投放业务指标的权重值大于后一优先级的投放业务指标的权重值)的情况下，相对于其他任意权重组合得到的匹配度，基于计算出的各投放业务指标的权重值得到的用户与已投放数据的匹配度为最大值。

具体的，按照优先级降序的顺序利用梯度下降算法依次计算各投放业务指标的权重值的过程可以通过以下方法实现：

将第一排位的投放业务指标的权重值设置为

其中，k为投放业务指标的总数；

通过以下步骤按照优先级顺序依次计算各排位的投放业务指标的权重值：

排位数小于当前排位的各投放业务指标的权重值保持不变，将排位数大于当前排位的各投放业务指标的当前权重值设置为：

其中，i为当前排位，1≤i≤k；l是小于当前排位的排位数；w_l是排位数小于当前排位的各投放业务指标的当前权重值；w_i为当前排位的投放业务指标的当前权重值；

针对已经投放数据的多个用户请求，获取每个用户请求的用户与各投放业务指标的匹配度；

根据每个用户请求的用户与各投放业务指标的匹配度以及各投放业务指标的当前权重值，计算每个用户请求的用户与待投放数据的匹配度；

根据每个用户请求的用户与待投放数据的匹配度降序排列多个用户请求，将排位小于预设排位的用户请求的匹配度相加，得到总匹配度，总匹配度表示为w_i的函数；

循环以下步骤：

计算总匹配度对w_i的偏导数；

将当前排位的投放业务指标的当前权重值设置为

α为常数，

为偏导数，在i＝1的情况下，直至偏导数的绝对值小于第一预设收敛阈值，或当前排位的投放业务指标的当前权重值小于

时，停止循环，将

确定为当前排位的投放业务指标的权重值，设置i＝i+1；在i＞1的情况下，直至偏导数的绝对值小于第一预设收敛阈值，或当前排位的投放业务指标的权重值大于等于前一排位的投放业务指标的权重值时，停止循环，将

确定为当前排位的投放业务指标的权重值，设置i＝i+1。

具体的，待投放数据以广告为例，以下具体描述上述计算权重值的过程，该过程可以包括以下步骤：

(1)对于每次广告投放，系统会记录下投放日志，包括每个用户请求的匹配度p，以及预测的每个用户请求的用户与各投放业务指标的匹配度，该匹配度以每个用户请求的用户达成各投放业务指标的概率F_i为例，故可以利用过去一段时间内的广告投放数据，通过执行以下梯度下降算法，计算出各投放业务指标的权重值；

(2)为每个投放业务指标设置优先级，将k个投放业务指标按照优先级降序排列，例如，广告主确定所需优化投放业务指标的优优先级顺序，如设定顺序为点击、转化、交易额，则表示最需要优化的投放业务指标为点击、其次是转化、最后优化交易额。即T₁表示最优先的投放业务指标，初始化第一排位的投放业务指标目标T₁的权重值

其中，k为投放业务指标的总数；

(3)通过以下步骤按照优先级顺序依次计算各排位的投放业务指标的权重值。当前排位i的投放业务指标的权重值为w_i，l是小于当前排位的排位数，l＜i项的投放业务指标的权重值保持不变，在优先级约束w₁≥w₂≥w₃...≥w_k和归一化约束∑w＝1下，j是大于当前排位的排位数，可令j＞i项投放业务指标的当前权重值为

针对已经投放数据的多个用户请求，获取每个用户请求达成各投放业务指标的概率(即每个用户请求的用户与各投放业务指标的匹配度)，根据每个用户请求达成各投放业务指标的概率以及各投放业务指标的当前权重值，计算每个用户请求的用户与待投放数据的匹配度；按照匹配度降序排列多个用户请求，将排位小于预设排位(即TopN)的用户请求的匹配度相加，得到总匹配度P(w_i)，P(w_i)是关于w_i的函数，

其中，P_m是排位m的用户请求的匹配度，

计算总匹配度对w_i的偏导数的过程通过以下步骤(4)至(6)完成：

(4)将当前排位的投放业务指标的当前权重值w_i加上一个微小增量Δw，根据多个用户请求中每个用户请求达成各投放业务指标的概率(每个用户请求的用户与各投放业务指标的匹配度)以及各投放业务指标的当前权重值，计算每个用户请求的用户与待投放数据的匹配度P(w_i+Δw)，按照匹配度降序排列多个用户请求，将排位小于预设排位(即TopN)的用户请求的匹配度相加，得到总匹配度P(w_i+Δw)，增量匹配度为ΔP＝P(w_i+Δw)-P(w_i)；

(5)计算增量匹配度对w_i的偏导数

(6)更新

α为学习率，且0＜α＜1；

(7)重复步骤(4)到(6)，在i＝1的情况下，直到

或者当前排位的投放业务指标的当前权重值小于

时，执行步骤(8)；在i＞1的情况下，直到或者w_i≥w_i-1时，执行步骤(8)，

其中，ε(即上述第一预设收敛阈值)可以设为一个极小的正实数作为收敛的阈值；

(8)更新i＝i+1，返回(3)，直到i＝k，最终得到满足投放业务指标优先级顺序下，最大化匹配度的各投放业务指标的权重值。

具体实施时，为了保证待投放数据的曝光率，在本实施例中，所述根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，包括：

根据匹配度确定发起请求的用户为目标用户，包括：

按照匹配度对预设时长内的用户请求降序排列，当用户请求的排位在预设时长内所有用户请求的投放比例内时，将发起该用户请求的用户确定为目标用户。例如，投放比例为前60％，对预设时长内降序排列的所有用户请求取前60％，若用户请求的排位在前60％内，则发起该用户请求的用户为目标用户；否则，发起该用户请求的用户不是目标用户。

具体实施时，在日志中记录下定向投放以及没被投放的请求数据，获取这些请求下获得广告曝光的最大位次rank_max。对于已进行投放的请求，能直接获得广告的曝光情况，对于没投放的请求，以广告主当时的出价，离线计算出投放广告后的竞价排序位次rank，若rank≤rank_max，则广告可以近似认为在该次请求下能得到曝光。广告最终的目的是要触达用户，而触达的前提是在请求中得到曝光，投放比例增大，固然能获得的曝光量会增加，但是，曝光量的增速会随着投放比例增大而放缓，因为对于匹配度低的请求，一般情况下获得曝光的竞价条件相对更为苛刻，广告主需要使用更高的出价，才能使广告得到曝光，故一种合理的方式是将投放比例r应设为让曝光量增量达到最大时对应的值，即r＝argmaxV′(r)，以保证广告的曝光率。对此，在本实施例中，本申请发明人提出一种调整投放比例的方法，以保证广告的曝光率最大化。

可以循环以下步骤来调整投放比例：

计算当前的投放比例下的曝光量的二阶导数，将投放比例设置为r＝r+βV″，其中，r为投放比例，β为常数，V″为二阶导数，直至二阶导数的绝对值小于第二预设收敛阈值、设置后的投放比例大于投放比例上限或设置后的投放比例小于投放比例下限时，停止循环，将r＝r+βV″确定为投放比例。

具体实施时，待投放数据以广告为例，以下具体描述上述调整投放比例的过程，该过程可以包括以下步骤：

(1)设投放比例为r，随机初始化r为r_min到r_max之间的实数，r_min为系统投放比例的下界，r_max为系统投放比例的上界，则在该投放比例下，广告的曝光量V(r)可以通过该公式来计算：

其中，I为指示函数，

为真时，值取1，否则取0，rank_i表示第i个用户请求的竞价排序位次，

表示在第i个用户请求下最大的广告曝光位次；

计算当前的投放比例下的曝光量的二阶导数的过程通过以下步骤(2)至(3)完成：

(2)将投放比例r加上一个微小增量Δr，在增加增量后的投放比例下计算曝光量的二阶导数V″＝[V(r-Δr)+V(r+Δr)-2V(r)]/Δr²；

(3)更新r＝r+βV″，β为学习率，且0＜β＜1；

(4)重复步骤(2)至(3)直至|V″|＜θ或者r＞r_max或r＜r_min，停止循环，将r＝r+βV″确定为投放比例，其中，θ(即上述第二预设收敛阈值)为极小的正数作为预设收敛阈值，最终得到最大化增量曝光量V′的投放比例r。

具体的，待投放数据以餐饮广告为例，详细描述上述数据定向方法，该方法包括以下步骤：

步骤S1：一餐饮商户在平台上投放广告希望在吸引用户关注提高知名度的前提下，获得更多客流，于是选择投放业务指标为点击和转化，并根据当前业务需求设置点击的权重值w_ctr＝0.7，设置转化的权重值w_cvr＝0.3，以及投放比例为匹配度前60％的用户请求。

步骤S2：分别训练得到点击对应的预测模型F_ctr和转化对应的预测模型F_cvr，两个模型均为二分类模型，可以选择使用决策树、深度神经网络等算法模型进行建模。

具体的，在训练阶段，对于点击对应的预测模型，选取历史投放中获得点击的用户请求作为正样本，有曝光但是无点击的用户请求作为负样本，服务器获取待投放餐饮广告中与点击相关的第一特征信息，例如，商户的历史点击率、商户的星级等；从正样本和负样本中获取与点击相关的第二特征信息，例如，用户历史点击信息、用户的口味偏好、搜索的关键词与商家的匹配度、用户当前位置、用户与店家的距离、请求的品类等，根据与点击相关的第一特征信息、与点击相关的第二特征信息、正样本和负样本进行训练，得到点击对应的预测模型。对于转化对应的预测模型，选取历史投放中点击并下单的用户请求作为正样本，点击但无下单行为的用户请求作为负样本，服务器获取待投放餐饮广告中与转化相关的第一特征信息，例如，商户的历史平均订单量、商户的历史点击下单率、商家的人均消费金额等；从正样本和负样本中获取与转化相关的第二特征信息，例如，用户历史下单信息、用户的消费水平等，根据与转化相关的第一特征信息、与转化相关的第二特征信息、正样本和负样本进行训练，得到转化对应的预测模型。

训练得到点击和转化对应的预测模型后，在预估阶段，对于用户A发出的请求P_A，系统会从服务器中获取该餐饮广告中与点击相关的第一特征信息，从请求中获取与点击相关的第二特征信息

将该餐饮广告中与点击相关的第一特征信息和请求中与点击相关的第二特征信息

输入点击对应的预测模型，获的用户A达成点击的概率为

(即用户A与点击这个投放业务指标的匹配度)；系统会从服务器中获取该餐饮广告中与转化相关的第一特征信息，从请求中获取与转化相关的第二特征信息

将该餐饮广告中与转化相关的第一特征信息和请求中与转化相关的第二特征信息

输入转化对应的预测模型，获得用户A达成转化的概率为

(即用户A与转化这个投放业务指标的匹配度)，然后，进行加权求和得到用户A与该餐饮广告的匹配度为

S3：最后按照匹配度对预设时长内所有用户请求降序排列，若请求P_A的排位在预设时长内所有用户请求的前60％内，则发起请求P_A的用户A为目标用户，在该次请求下投放该餐饮商户的广告。

在本实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任意的数据定向方法。

在本实施例中，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有执行上述任意的数据定向方法的计算机程序。

基于同一发明构思，本发明实施例中还提供了一种数据定向装置，如下面的实施例所述。由于数据定向装置解决问题的原理与数据定向方法相似，因此数据定向装置的实施可以参见数据定向方法的实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图2是本发明实施例的数据定向装置的结构框图，如图2所示，该装置包括：

匹配度确定模块201，用于根据用户请求和待投放数据的投放业务指标，得到发起请求的用户与待投放数据的匹配度；

投放模块202，用于根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，并将所述待投放数据投放给所述目标用户。

在一个实施例中，匹配度确定模块201，包括：

预测单元，用于针对每个投放业务指标，将每个投放业务指标的第一特征信息和第二特征信息，输入所述每个投放业务指标对应的预测模型，逐一获得发起请求的用户与每个投放业务指标的匹配度，其中，所述第一特征信息为待投放数据中与投放业务指标相关的信息，所述第二特征信息为用户请求中与投放业务指标相关的信息；

第一匹配度计算单元，用于将所述每个投放业务指标的匹配度乘以投放业务指标的权重值，得到每个投放业务指标的加权匹配度；

第二匹配度计算单元，用于将所述每个投放业务指标的加权匹配度相加，得到所述发起请求的用户与待投放数据的匹配度。

在一个实施例中，上述装置还包括：

正样本获取模块，用于获取已曝光数据且已达成投放业务指标的用户请求，作为正样本；

负样本获取模块，用于获取已曝光数据且未达成投放业务指标的用户请求，作为负样本；

特征获取模块，用于从正样本和负样本中，获取所述第二特征信息；

训练模块，用于根据与投放业务指标相关的待投放数据的第一特征信息、获取的所述第二特征信息、正样本以及负样本进行训练，得到投放业务指标对应的预测模型。

在一个实施例中，上述装置还包括：

优先级设置模块，用于在待投放数据对应多个投放业务指标的情况下，对每个投放业务指标设置优先级；

权重确定模块，用于按照优先级顺序利用梯度下降算法依次计算各投放业务指标的权重值。

在一个实施例中，所述投放模块，包括：目标用户确定单元，用于按照匹配度对预设时长内的用户请求降序排列，当用户请求的排位在预设时长内所有用户请求的投放比例内时，将发起该用户请求的用户确定为目标用户。

在一个实施例中，上述装置还可以包括：

投放比例调整模块，用于循环以下步骤来调整投放比例：

本发明实施例实现了如下技术效果：根据用户请求和待投放数据的投放业务指标来得到发起请求的用户与待投放数据的匹配度，进而基于发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，最终，在确定发起请求的用户为目标用户时，将待投放数据投放给发起请求的用户，完成数据定向。在确定目标用户的过程中，是基于用户请求和待投放数据的投放业务指标来得到匹配度的，由于用户请求是用户自主发起的，使得用户请求相对于现有技术中预先设定的定向条件更能准确地描述用户属性；同时，由于用户请求是动态的且是用户实时发起的，使得用户请求更能代表用户当下的需求或意图，具备实时性，因此，基于用户请求确定出的目标用户更可能是当前对待投放数据关注或感兴趣的用户，有利于提高数据定向的精准性。此外，由于待投放数据的投放业务指标是数据投放主设置的希望待投放数据能够达成的业务指标，基于待投放数据的投放业务指标来得到匹配度，使得目标用户的确定与待投放数据的投放业务指标具有直接对应关系，向目标用户投放待投放数据后，有利于实现待投放数据达成数据投放主设置的投放业务指标。

显然，本领域的技术人员应该明白，上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明实施例不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种数据定向方法，其特征在于，包括：

根据用户请求和待投放数据的投放业务指标，得到发起请求的用户与待投放数据的匹配度，包括：通过预测模型预测用户请求达成投放业务指标的概率，该概率的大小代表了发起请求的用户与待投放数据的投放业务指标的匹配度大小；其中，投放业务指标是数据投放主针对待投放数据设置的业务指标；用户请求是用户实时发起的搜索请求或打开网页的请求，用于表征用户当下的需求或意图；

根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，并将所述待投放数据投放给所述目标用户，以达成数据投放主设置的投放业务指标。

2.如权利要求1所述的数据定向方法，其特征在于，根据用户请求和待投放数据的投放业务指标，得到发起请求的用户与待投放数据的匹配度，包括：

针对每个投放业务指标，将每个投放业务指标的第一特征信息和第二特征信息，输入所述每个投放业务指标对应的预测模型，逐一获得发起请求的用户与每个投放业务指标的匹配度，其中，所述第一特征信息为待投放数据中与投放业务指标相关的信息，所述第二特征信息为用户请求中与投放业务指标相关的信息；

3.如权利要求2所述的数据定向方法，其特征在于，还包括：

获取已曝光数据且已达成投放业务指标的用户请求，作为正样本；

获取已曝光数据且未达成投放业务指标的用户请求，作为负样本；

从正样本和负样本中，获取所述第二特征信息；

4.如权利要求2所述的数据定向方法，其特征在于，所述投放业务指标的权重值通过以下方法确定：

对每个投放业务指标设置优先级；

按照优先级顺序利用梯度下降算法依次计算各投放业务指标的权重值。

5.如权利要求1至4中任一项所述的数据定向方法，其特征在于，所述根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，包括：

根据匹配度确定发起请求的用户为目标用户，包括：

按照匹配度对预设时长内的用户请求降序排列，当用户请求的排位在预设时长内所有用户请求的投放比例内时，将发起该用户请求的用户确定为目标用户。

6.如权利要求5所述的数据定向方法，其特征在于，所述方法还包括：

循环以下步骤来调整投放比例：

7.一种数据定向装置，其特征在于，包括：

匹配度确定模块，用于根据用户请求和待投放数据的投放业务指标，得到发起请求的用户与待投放数据的匹配度，包括：通过预测模型预测用户请求达成投放业务指标的概率，该概率的大小代表了发起请求的用户与待投放数据的投放业务指标的匹配度大小；其中，投放业务指标是数据投放主针对待投放数据设置的业务指标；用户请求是用户实时发起的搜索请求或打开网页的请求，用于表征用户当下的需求或意图；

投放模块，用于根据所述发起请求的用户与待投放数据的匹配度确定发起请求的用户是否为目标用户，并将所述待投放数据投放给所述目标用户，以达成数据投放主设置的投放业务指标。

8.如权利要求7所述的数据定向装置，其特征在于，匹配度确定模块，包括：

9.如权利要求8所述的数据定向装置，其特征在于，还包括：

训练模块，用于根据与投放业务指标相关的第一特征信息、获取的所述第二特征信息、正样本以及负样本进行训练，得到投放业务指标对应的预测模型。

10.如权利要求8所述的数据定向装置，其特征在于，还包括：

优先级设置模块，用于对每个投放业务指标设置优先级；

11.如权利要求7至10中任一项所述的数据定向装置，其特征在于，所述投放模块，包括：

目标用户确定单元，用于按照匹配度对预设时长内的用户请求降序排列，当用户请求的排位在预设时长内所有用户请求的投放比例内时，将发起该用户请求的用户确定为目标用户。

12.如权利要求11所述的数据定向装置，其特征在于，还包括：

投放比例调整模块，用于循环以下步骤来调整投放比例：

13.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的数据定向方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有执行权利要求1至6中任一项所述的数据定向方法的计算机程序。