CN110414547A

CN110414547A - 一种行为检测方法、装置、计算机设备和存储介质

Info

Publication number: CN110414547A
Application number: CN201910376343.0A
Authority: CN
Inventors: 周忠
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-05-07
Filing date: 2019-05-07
Publication date: 2019-11-05

Abstract

本发明实施例公开了一种行为检测方法、装置、计算机设备和存储介质；本发明实施例可以从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；根据所述历史行为特征信息获取历史参考行为特征信息；将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性。该方案可以提升行为检测的准确性。

Description

一种行为检测方法、装置、计算机设备和存储介质

技术领域

本发明涉及互联网技术领域，具体涉及一种行为检测方法、装置、计算机设备和存储介质。

背景技术

随着互联网技术的发展，目前内容如广告投放、推广的方式、渠道越来越多。比如，可以通过流量主即提供用户流量的载体(如小程序、自媒体账号)等方式投放、推广广告。

目前流量主为了获取更多收益，通常会将推广内容如广告放置在用户容易误点的位置，用户在关闭推广内容如广告或者在进行其他业务过程中容易触碰到推广内容如广告边沿从而造成误点。

例如，如图1所示，以广告为例，页面上方为游戏页面，下方为对应的广告区域，在“跳过”及“方向”按钮附近都存在明显的广告误点，这部分无效点击并不能给广告主带来有效的转化，由于该点击并非用户主动点击广告，也即点击行为并非是用户真实意愿。误点打开的广告链接会给用户造成较差的体验，同时广告转化效果极差，给广告主带来了严重损失，损害广告平台的口碑和长远发展。

针对上述情况，目前提出了一些针对内容的行为检测或识别方式，然而，这些方式仅仅基于某个具体的行为特征如按压屏幕的压力来检测用户针对推广内容的行为真实性，因此，行为检测的准确性较低。

发明内容

本发明实施例提供一种行为检测方法、装置、计算机设备和存储介质，可以提升行为检测的准确性。

本发明实施例提供一种行为检测方法，包括：

从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；

根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；

根据所述历史行为特征信息获取历史参考行为特征信息；

将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；

基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性，其中，所述行为检测模型由训练样本训练而成。

相应的，本发明实施例还提供一种行为检测装置，包括：

信息获取单元，用于从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；

第一特征获取单元，用于根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；

第二特征获取单元，用于根据所述历史行为特征信息获取历史参考行为特征信息；

融合单元，用于将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；

预测单元，用于基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性，其中，所述行为检测模型由训练样本训练而成。

在一实施例中，所述第一特征获取单元，用于根据所述用户标识获取在多个历史时间段内所述用户针对历史推广内容的历史行为特征信息；

其中，所述第二特征获取单元，可以包括：

融合子单元，用于将在多个历史时间段内所述用户针对历史推广内容的历史行为特征信息进行特征融合，得到融合后历史行为特征信息；

参考特征获取子单元，用于将所述融合后历史行为特征信息作为历史参考行为特征信息。

在一实施例中，所述行为特征信息包括多个行为特征；所述融合单元，可以具体用于：

将当前行为特征信息与所述历史参考行为特征信息中相同的行为特征进行特征拼接。

在一实施例中，所述预测单元，可以包括：

划分子单元，用于将融合后行为特征信息的数据流划分成目标批次数据；

处理子单元，用于加载行为检测模型，并基于行为检测模型对应的数据处理逻辑对所述目标批次数据进行数据处理，以预测用户针对所述推广内容的行为真实性。

在一实施例中，所述预测单元，可以包括：

选择子单元，用于根据所述用户标识从多个候选行为检测模型中选择所述用户对应的行为检测模型，所述行为检测模型由所述用户对应的训练样本训练而成；

预测子单元，用于根据所述用户对应的行为检测模型和所述融合后行为特征信息预测用户针对所述推广内容的行为真实性。

在一实施例中，行为检测装置还可以包括：

历史特征获取单元，用于获取历史真实行为特征信息，所述历史真实行为特征信息为在历史时间段内所述用户针对历史推广内容的行为为真实行为时的历史行为特征信息；

正样本构建单元，用于根据所述历史真实行为特征信息构建正训练样本；

训练单元，用于根据所述正训练样本对预设的行为检测模型进行训练。

在一实施例中，所述正样本构建单元，可以具体用于：从多个历史真实行为特征信息中选择若干样本行为特征信息；将所述样本行为特征信息进行特征融合，得到融合后样本行为特征信息；将融合后样本行为特征信息作为正训练样本。

在一实施例中，行为检测装置还可以包括：负样本获取单元；

所述负样本获取单元，可以用于获取负训练样本，所述负训练样本包括：在历史时间段内所述用户针对历史推广内容的行为为非真实行为时的历史行为特征信息；

所述训练单元，用于根据所述正训练样本和所述负训练样本对预设的行为检测模型进行训练。

本发明实施例还提供了一种计算机设备，包括存储器和处理器；所述存储器存储有多条指令，所述处理器加载所述存储器内的指令，以执行本发明实施例提供的任一种行为检测方法中的步骤。

此外，本发明实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明实施例提供的任一种行为检测方法中的步骤。

本发明实施例可以从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；根据所述历史行为特征信息获取历史参考行为特征信息；将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性。由于该方案基于用户针对推广内容的行为特征信息以及机器学习模型来检测用户针对推广内容的行为真实性，可以提升行为检测的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是目前游戏页面示意图；

图2a是本发明实施例提供的行为检测方法的场景示意图；

图2b是本发明实施例提供的行为检测方法的流程图；

图3a是本发明实施例提供的行为检测方法的另一流程示意图；

图3b是本发明实施例提供的广告误点的流程示意图；

图4是本发明实施例提供的广告关注转化率随触屏x轴坐标分布情况示意图；

图5是本发明实施例提供的广告关注转化率随触屏y轴坐标分布情况示意图；

图6是本发明实施例提供的广告关注转化率随触屏按压时间分布情况示意图；

图7是本发明实施例提供的用户在落地页停留时间随触屏x轴坐标分布情况示意图；

图8是本发明实施例提供的用户在落地页停留时间随触屏y轴坐标分布情况示意图

图9是本发明实施例提供的用户在落地页停留时间随触屏按压时间分布情况示意图；

图10a是本发明实施例提供的行为检测装置的结构示意图；

图10b是本发明实施例提供的行为检测装置的另一结构示意图；

图10c是本发明实施例提供的行为检测装置的另一结构示意图；

图10d是本发明实施例提供的行为检测装置的另一结构示意图；

图10e是本发明实施例提供的行为检测装置的另一结构示意图；

图10f是本发明实施例提供的行为检测装置的另一结构示意图；

图11是本发明实施例提供的计算设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种行为检测方法、装置、计算机设备和存储介质。其中，该行为检测装置可以集成在计算机设备中，该计算机设备可以是服务器，也可以是终端等设备。

下面将介绍将对本发明实施的相关词语进行说明解释：

CPC(以每点击一次计费)广告

CPC是“Cost Per Click”的英文缩写，在这种模式下广告主仅为用户点击广告的行为付费，而不再为广告的曝光付费，对广告主来说，CPC广告避免了只曝光不点击的风险，是目前主流的广告收费方式之一。

广告主

广告主是指付费投放广告的用户或服务商，广告主希望自己每次付费的广告点击都是真实用户的有效点击，而非作弊点击。

流量主

流量主即提供用户流量的载体，通常指媒体、网站或软件。在微信广告平台，流量主即指有一定粉丝量的公众号。流量主可以参与广告的利润分成，相同广告曝光量下，点击率越高，分到的利润也越高，因而流量主有较强的作弊动机来提升点击率。

广告误点：

广告误点是指非用户主动意图的广告点击行为。广告误点主要是由于流量主不合理地放置广告位置导致用户容易误点广告，由于并非用户主动点击广告，广告转化率通常极差，给广告主带来大量损失，误点打开广告也给用户造成了较差的使用体验，损害广告平台的口碑和长远发展。

广告转化率：

广告转化率是指在投放广告过程中，广告带来的转化量与广告的点击量的比率。对于不同的推广目标，对应的转化目标不一样。例如，对于电商类广告，转化目标是指广告带来的下单；对于Android/IOS下载类广告，转化是指广告带来的安装和激活。当发生广告误点时，由于并非用户主动打开广告，广告转化率通常都很低。

广告落地页：

广告落地页是指用户点击广告后打开的页面，当发生广告误点时，用户通常在加载广告落地页过程中即关闭落地页，因此广告误点对应的用户落地页停留时间都很短。

所谓行为检测，可以指的是检测用户针对内容如推广内容的行为真实性或者非真实性，其中，真实性的行为为符合用户真实意愿的行为，非真实性的行为为不符合真实意愿的行为，比如，误操作等行为。

下面将详细介绍本发明实施例的方法：

参考图2a，本发明实施例提供了行为检测系统包括服务器和终端等；服务器与终端连接，比如，通过有线或无线网络连接等。

其中，终端，可以用于显示推广内容如广告，采集用户针对推广内容如广告的行为信息，上传给服务器。比如，当用户对推广内容进行操作时，终端可以采集用户针对推广内容的当前行为信息，并上传至服务器。其中，当前行为信息包括用户针对推广内容如广告的当前行为特征信息、和用户标识。

服务器，用于根据用户标识获取在历史时间段内用户针对历史推广内容的历史行为特征信息；根据历史行为特征信息获取历史参考行为特征信息；将当前行为特征信息与历史参考行为特征信息进行特征融合，得到融合后行为特征信息；基于行为检测模型和融合后行为特征信息，预测用户针对推广内容的行为真实性，其中，行为检测模块由训练样本训练而成。

实际应用中，服务器还可以将预测结果发送给反作弊逻辑服务模块，以对用户的行为进行拦截等操作。

以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从行为检测装置的角度进行描述，该行为检测装置具体可以集成在计算机设备中，该计算机设备可以包括服务器，也可以是终端等设备；其中，该终端可以包括手机、平板电脑、笔记本电脑、以及个人计算(PC，Personal Computer)、微型处理终端等设备。

本发明实施例提供的一种行为检测方法，该方法可以由计算机设备的处理器执行，如图2b所示，该行为检测方法的具体流程可以如下：

201、从终端获取用户针对推广内容的当前行为信息，该当前行为信息包括用户的用户标识、以及用户针对推广内容的当前行为特征信息。

其中，行为信息可以为用户针对推广内容的操作行为信息，比如，可以针对广告的操作行为信息。该行为信息可以包括用户标识、以及行为特征信息。

其中，行为特征信息可以包括用户针对推广内容的操作行为特征，比如，对推广内容的操作位置信息(如内容的操作坐标等)、对推广内容的操作时间信息(如点击、按压等操作的时长)。

例如以推广内容为广告为例，行为特征可以包括：用户点击广告时点击位置坐标，如点击广告时触碰屏幕的坐标即触屏坐标(x，y)等，用户点击广告时点击时长或按压时长，如触碰屏幕的触屏按压时长t等。

在一实施例中，行为特征信息还可以包括推广内容的特征，比如，推广内容在页面的特征即页面特征，例如推广内容在页面的显示尺寸信息(宽高等)。譬如，以广告为例，行为特征信息还包括广告的页面特征，如广告宽高(adw，adh)。

在一实施例中，行为特征信息还可以包括承载推广内容的载体特征，比如，流量主特征，例如，流量主标识等。

例如，以广告为例，用户针对广告的行为特征信息可以包括流量主特征、页面特征、点击特征，其中，流量主特征可以包括流量主标识(id)等，页面特征可以包括广告在页面显示的宽高(adw，adh)等，点击特征可以包括点击坐标即触屏坐标(x，y)、点击时长如触碰按压或点击时长t等。

其中，用户标识(id)可以为用户在推广内容的推广应用中的身份标识，比如，在社交应用中推广内容时，用户标识可以为用户在社交应用中的身份标识如社交账号等。

本发明实施例，从终端获取行为信息的方式可以有多种，比如，可以由终端主动上报，也可以从终端主动拉取等等。

例如，以广告为例，当检测到用户点击广告时，终端可以向服务器上传当次广告行为数据如终端可以通过推广内容所在推广客户端或应用上传当次广告行为数据，该数据包括但不限于{用户id，流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}等数据。

102、根据用户标识获取在历史时间段内用户针对历史推广内容的历史行为特征信息。

其中，历史时间段内的历史行为特征信息可以为用户在历史时间段内针对历史推广内容的行为特征信息，该历史推广内容可以与当前推广内容为相同内容，也可以为不相同内容。该历史时间段为当前时间之前的某个时间段，可以有当前时间之前两个历史时间之间的时间段。例如，可以为昨天8点到9点之间用户针对某个推广内容的行为特征信息。

其中，历史行为特征信息与当前行为特征信息包含的特征种类或维度可以相同，比如，历史行为特征信息可以包括历史时间段内的载体特征、页面特征、操作行为特征等。譬如，历史时间段内的{用户id，流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}。

在一实施例中，历史时间段内的历史行为特征信息可以通过对历史时间段内历史时间的历史行为特征信息进行统计得到。比如，可以基于预设的历史段从历史时间的历史行为特征信息中选择目标历史行为特征性信息，对目标历史行为特征信息进行统计，得到历史时间段内的历史行为特征信息。譬如，对各目标历史行为特征信息进行特征拼接如将各目标历史行为特征信息中相同类型的特征值或者同一维度的特征值进行拼接，得到历史时间段内的历史行为特征信息。

其中，历史时间的历史行为特征信息为用户在该历史时刻针对历史推广内容的行为特征信息，该历史推广内容可以与当前推广内容为相同内容，也可以为不相同内容。该历史时刻为当前时间之前的某个时间时刻，比如，昨天九点对应的历史行为特征信息。譬如，昨天九点时上传的{用户id，流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}。

通过上述步骤，计算机设备如服务器可以根据用户标识获取用户在一个或者多个历史时间段内针对历史推广内容的历史行为特征信息。

103、根据历史行为特征信息获取历史参考行为特征信息。

具体地，可以根据在历史时间段内用户针对历史推广内容的历史行为特征信息，获取历史参考行为特征信息。

其中，历史参考行为特征信息可以用户在过去针对历史推广内容的行为特征，用于衡量或表征用户在过去针对历史推广内容的行为的参考特征。

其中，历史参考行为特征信息、与历史行为特征、当前行为特征信息包含的特征种类或维度可以相同，比如，历史参考行为特征信息可以包括载体特征、页面特征、操作行为特征等。譬如，{流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}。

本发明实施例中，历史参考行为特征信息可以基于历史时间段内的历史行为特征信息得到。比如，在一实施例中，在历史时间段为一个的情况下，即获取某一历史时间段内用户针对历史推广内容的历史行为特征信息时，可以直接将历史行为特征信息作为历史参考行为特征信息。

又比如，在一实施例中，当存在多个历史时间段时，可以对多个历史时间段内的行为特征信息进行融合，从而得到历史参考行为特征信息。具体地，步骤“根据用户标识获取在历史时间段内用户针对历史推广内容的历史行为特征信息”，可以包括：根据用户标识获取在多个历史时间段内用户针对历史推广内容的历史行为特征信息；

此时，步骤“根据历史行为特征信息获取历史参考行为特征信息”，可以包括：

将在多个历史时间段内用户针对历史推广内容的历史行为特征信息进行特征融合，得到融合后历史行为特征信息；

将融合后历史行为特征信息作为历史参考行为特征信息。

例如，假设可以获取历史时段T1、T2、T3的历史行为特征信息，然后，对历史时段T1、T2、T3的历史行为特征信息进行融合，将融合后特征信息作为历史参考行为特征信息。

其中，特征信息的特征融合方式可以有多种，比如可以将多个历史行为特征信息中相同或者同一维度的特征进行拼接，如特征的特征值进行相加等。

比如，当历史行为特征信息包括：载体特征、页面特征、操作行为特征时，将各历史行为特征信息中载体特征进行融合如特征拼接、将各历史行为特征信息中页面特征进行融合如特征拼接，将各历史行为特征信息中操作行为特征进行融合如特征拼接，从而得到历史参考行为特征信息。

例如，获取历史时间段T1的历史行为特征向量R1{r11、r12、……r1n}、历史时间段T2的历史行为特征向量R2{r21、r22、……r1n}；可以将R1中r11与R2中r21的特征值相加、将R1中r12与R2中r22的特征值相加，……将R1中r1n与R2中r2n的特征值相加，从而实现特征拼接。

通过上述步骤，计算机设备如服务器可以基于历史行为特征信息获取历史参考行为特征信息。

104、将当前行为特征信息与历史参考行为特征信息进行融合，得到融合后行为特征信息。

其中，特征信息的融合方式可以有多种，比如可以将多个历史行为特征信息中相同或者同一维度的特征进行拼接，如特征的特征值进行相加等。

比如，在一实施例中，当行为特征信息包括多个行为特征信息时，步骤“将当前行为特征信息与历史参考行为特征信息进行特征融合”，可以包括：将当前行为特征信息与历史参考行为特征信息中相同的行为特征进行拼接。

其中，相同的行为特征指的是相同类型的行为特征，或者处于相同维度的行为特征。

比如，当行为特征信息包括：载体特征、页面特征、操作行为特征时，可以将当前行为特征信息和历史参考行为特征信息中载体特征进行融合如特征拼接、当前行为特征信息和历史参考行为特征信息中页面特征进行融合如特征拼接，将当前行为特征信息和历史参考行为特征信息中操作行为特征进行融合如特征拼接，从而得到历史参考行为特征信息。

例如，行为特征信息包括{流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}时，可以将当前行为特征信息、与历史参考行为特征信息中的流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t进行特征拼接

105、基于行为检测模型和融合后行为特征信息，预测用户针对推广内容的行为真实性，其中，行为检测模块由训练样本训练而成。

其中，行为真实性的预测，可以指的是预测用户针对内容如推广内容的行为真实性或者非真实性，其中，真实性的行为为符合用户真实意愿的行为，非真实性的行为为不符合真实意愿的行为，比如，误操作等行为。

其中，行为检测模型可以为机器学习模型，比如，用于实现分类的机器学习模型，例如，可以包括GBDT(Gradient Boosting Decision Tree，迭代的决策树)，LR(逻辑回归)，RandomForest(随机森林)等分类模型，又比如，还可以包括神经网络模型等。

在一实施例中，为了提升行为检测的准确性，还可以利用用户对应的训练样本训练而成的行为预测模型来预测行为真实性。比如，步骤“基于行为检测模型和融合后行为特征信息预测用户针对推广内容的行为真实性”，可以包括：

根据用户标识从多个候选行为检测模型中选择用户对应的行为检测模型，行为检测模型由用户对应的训练样本训练而成；

根据用户对应的行为检测模型和融合后行为特征信息预测用户针对推广内容的行为真实性。

比如，服务器侧可以存储多个候选行为检测模型，每个候选行为检测模型由相应用户的训练样本训练而成，在对当前用户的行为预测时，可以根据用户标识从候选行为检测模型中选择当前用户对应的训练样本训练而成的行为检测模型进行行为预测。

在一实施例中，为了提升行为检测的效率，可以采用实时计算框架来实现行为检测，比如，可以步骤“基于行为检测模型和融合后行为特征信息预测用户针对推广内容的行为真实性”，可以包括：

将融合后行为特征信息的数据流划分成目标批次数据；

加载行为检测模型，并基于行为检测模型对应的数据处理逻辑对目标批次数据进行数据处理，以预测用户针对推广内容的行为真实性。

其中，实时计算框架可以有多种，比如，Spark Streaming、storm、flink等实时计算框架。

其中，Spark Streaming是一种流式计算框架，可以实现高吞吐量、具备容错机制的实时流数据处理，Spark Streaming接收实时的数据流，并根据一定的时间间隔拆分成一批批的数据，然后通过Spark Engine(引擎)处理这些批数据，最终得到处理后的结果数据。

例如，可以服务器可以将融合后行为特征信息作为数据流输入至微批次处理模块如Spark Streaming处理模块；通过微批次处理模块如Spark Streaming处理模块将数据流划分成批次数据；通过微批次处理模块加载行为检测模型，并基于行为检测模型对应的数据处理逻辑对批次数据进行数据处理，以预测用户针对推广内容的行为真实性。

在一实施例中，本发明实施例可以预测用户针对推广内容的行为真实性的预测结果可以包括用于指示行为是否为真实行为的指示信息，或者，行为为真实、非真实行为的概率等。

本发明实施例中，行为检测模型可以由训练样本来训练而成，下面将具体介绍行为检测模型的训练过程：

a、获取历史真实行为特征信息。

其中，历史真实行为特征信息为在历史时间段内用户针对历史推广内容的行为为真实行为时的历史行为特征信息；比如，在历史时间段内用户点击广告行为为用户真实意图的历史行为特征信息。

在一实施例中，可以获取多个历史真实行为特征信息，也即获取在多个历史时间段内用户针对历史推广内容的行为为真实行为时的历史行为特征信息。

其中，历史真实行为特征信息可以通过对历史时间段若干历史时间的历史真实行为特征信息统计如融合、拼接等，得到。具体可以参考上述历史时间段的历史特征信息的获取方式介绍。

其中，历史时间的历史真实行为特征信息可以为历史时刻用户针对历史推广内容的行为为真实行为时的历史行为特征信息。

其中，历史真实行为特征信息、与历史行为特征、当前行为特征信息包含的特征种类或维度可以相同，比如，历史真实行为特征信息可以包括载体特征、页面特征、操作行为特征等。譬如，{流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}。

b、根据历史真实行为特征信息构建正训练样本。

其中，正训练样本可以包括历史真实行为特征信息，譬如，{流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}。

基于历史真实行为特征信息构建正训练样本的方式可以有多种，比如，可以将某个历史时间段内用户针对历史推广内容的历史真实行为特征信息作为正训练样本。

又比如，在一实施例中，步骤“根据历史真实行为特征信息构建正训练样本”，可以包括：

从多个历史真实行为特征信息中选择若干样本行为特征信息；

将样本行为特征信息进行特征融合，得到融合后样本行为特征信息；

将融合后样本行为特征信息作为正训练样本。

其中，样本行为特征信息的特征融合方式可以参考上述特征融合方式的介绍。

c、根据正训练样本对预设的行为检测模型进行训练。

比如，以梯度提升决策树模型(Gradient Boosting Decision Tree，GBDT)为例，来介绍训练过程。

其中，梯度提升决策树模型(Gradient Boosting Decision Tree，GBDT)是一种迭代的决策树算法，该算法由多棵决策树组成。该梯度提升决策树模型是机器学习算法的一种。本申请应用梯度提升决策树模型来实现对应用程序的清理预测。具体地，采用训练样本对梯度提升决策树模型进行训练，得到应用的样本类别的最终估值模型函数，基于最终估值模型函数来实现对应用清理的预测。

具体地，模型训练可以包括：

根据估值模型函数获取训练样本属于样本类别的初始概率，样本类别包括行为真实或非真实；

对初始概率进行逻辑变换，得到变换后概率；

根据变换后概率和初始概率获取样本类别的梯度残差；

根据梯度残差构建相应的决策树；

根据决策树中叶子节点的信息增益，对估计值模型函数进行更新，并返回执行根据估值模型函数获取训练样本分别属于样本类别的初始概率的步骤，直到决策树数量等于预设数量为止。

其中，预设数量即是迭代的次数，可以根据时间需求设定，如可以为M，M为大于1的正整数。

本发明实施例可以通过重复或者迭代执行上述步骤，便可以得到每个用户的最终估值模型函数以及M个决策树。

其中，初始阶段的估值模型函数可以为零，比如可以初始化估值模型函数为F_k0(x)＝0。

本发明实施例中，逻辑(logistic)变换是一个平滑且将数据规范化(使得向量的长度为1)的过程，可以便于模型训练。比如，可以通过如下公式进行逻辑变换：

其中，k为样本类别，F_k(x)为样本类别k的估值模型函数，p_k(x)为样本x属于样本类别k的概率。

其中，残差其实就是真实值和预测值之间的差值，在学习的过程中，首先学习一颗决策树，然后将“真实值-预测值”得到残差，再把残差作为一个学习目标，学习下一棵决策树，依次类推，直到残差小于某个接近0的阀值或决策树数目达到某一阀值。其核心思想是每轮通过拟合残差来降低损失函数。

本发明实施例中，梯度残差可以基于变换后概率和变换前概率获得，如可以通过如下公式求得：

为梯度残差，yik为变换前的概率，pk(x)为变换后样本x属于样本类别k的概率；也即通过变换前概率减去变换后概率可以得到梯度残差。

例如，训练样本x可能属于行为真实、行为非真实两种类别，训练样本x属于行为的概率为y＝(0,0,1,0,0)，假设估值模型函数估计得到的F(x)＝(0,0.3,0.6,0,0)，则经过Logistic变换后的概率p(x)＝(0.16,0.21,0.29,0.16,0.16)，y-p得到梯度g：(-0.16,-0.21,0.71,-0.16,-0.16)。

假设gk为样本当某一维(某一个分类)上的梯度:

gk>0时，越大表示其在这一维上的概率p(x)越应该提高，比如说上面的第三维的概率为0.29，就应该提高，属于应该往“正确的方向”前进越小表示这个估计越“准确”。

gk<0时，越小，负得越多表示在这一维上的概率应该降低，比如说第二维0.21就应该得到降低。属于应该朝着“错误的反方向”前进越大，负得越少表示这个估计越“不错误”。

总的来说，对于一个样本，最理想的梯度是越接近0的梯度。所以，要能够让函数的估计值能够使得梯度往反方向移动(>0的维度上，往负方向移动，<0的维度上，往正方向移动)最终使得梯度尽量＝0)，并且该算法在会严重关注那些梯度比较大的样本。

本发明实施例中，在得到梯度之后，就是如何让梯度减少了。这里是用的一个迭代+决策树的方法，当初始化的时候，随便给出一个估计函数F(x)(可以让F(x)是一个随机的值，也可以让F(x)＝0)，然后之后每迭代一步就根据当前每一个样本的梯度的情况，建立一棵决策树。就让函数往梯度的反方向前进，最终使得迭代N步后，梯度越小。

本发明实施例中建立的决策树和普通的决策树不太一样，首先，这个决策树是一个叶子节点数J固定的，当生成了J个节点后，就不再生成新的节点了。

因此，本发明实施例中，在得到梯度残差后，可以基于梯度残差构建相应的决策树，其中，决策树的叶子节点数量可以根据实际需求设定，如可以为J，该J可以为大于1的正整数，如2、3、4等等。

比如，在一实施例中，根据梯度残差减少的梯度方向以及预设叶子节点数量，构建相应的决策树。

本发明实施例中，在构建出决策树之后，为了减少梯度，可以计算出决策树中叶子节点的信息增益，然后，基于叶子节点的信息增益对估计值模型函数进行更新。比如，可以通过如下公式计算出决策树叶子节点的信息增益：

中，j表示叶子节点的数量，取值范围为1-J，γ_jkm为k类别下决策树叶子节点j的信息增益，为梯度残差，K为样本类别数量。

然后，基于如下公式获得新的估计值模型函数：

其中，F_k,m-1(x)更新前的估值模型函数，F_k,m(x)为更新后新的估值模型函数，γ_jkm为k类别下决策树叶子节点j的信息增益。

其中，信息增益是针对一个一个特征而言的，就是看一个特征t，系统有它和没有它时的信息量各是多少，两者的差值就是这个特征给系统带来的信息量，即信息增益。

在一实施例中，为了提升模型预测的准确性，还可以采用正负训练样本对行为检测模型进行训练。比如，本发明实施例可以获取负训练样本，负训练样本包括：在历史时间段内用户针对历史推广内容的行为为非真实行为时的历史行为特征信息；然后，根据正训练样本和负训练样本对预设的行为检测模型进行训练。具体地训练过程可以参考上述正样本介绍的训练过程。

本发明实施例提供的检测方法可以适用于任何推广内容的行为预测，比如，广告、视频、图像、游戏等推广内容的行为预测。

由上可知，本发明实施例可以从终端获取用户针对推广内容的当前行为信息，当前行为信息包括用户的用户标识、以及用户针对推广内容的当前行为特征信息；根据用户标识获取在历史时间段内用户针对历史推广内容的历史行为特征信息；根据历史行为特征信息获取历史参考行为特征信息；将当前行为特征信息与历史参考行为特征信息进行特征融合，得到融合后行为特征信息；基于行为检测模型和融合后行为特征信息，预测用户针对推广内容的行为真实性，其中，行为检测模型由训练样本训练而成。由于该方案基于用户针对推广内容的行为特征信息以及机器学习模型来检测用户针对推广内容的行为真实性，可以提升行为检测的准确性。

此外，本发明实施例还可以采用实时计算框架来实现预测计算，可以提升行为检测效率。

根据上面实施例所描述的方法，以下将举例作进一步详细说明。

在本实施例中，将以该行为检测装置具体集成在服务器为例进行说明。

(一)行为检测模型进行训练，具体可以如下：

(1)、服务器获取正训练样本和负训练样本。

其中，正训练样本可以包括历史真实行为特征信息；在历史时间段内用户针对历史推广内容的行为为真实行为时的历史行为特征信息。在一实施例中，正训练样本可以包括存在历史数据库中的历史行为特征信息。

以广告为例，正训练样本可以为非误点样本，也即用户历史时间点击广告时，非误点行为对应的行为特征，如流量主特征、页面特征、点击坐标特征等。

具体地，正训练样本的构建可以参考上述实施例的介绍。

例如，参考图3b，以推广内容为广告为例，服务器可以从离线日志存储模块(hdfs)中提取离线特征信息，离线特征信息可以包括在历史时间段内用户针对历史广告的行为特征信息如页面特征、点击行为坐标特征、流量主特征。服务器可以选择多个历史时间段内的历史行为特征信息进行特征融合，将融合后特征信息作为正训练样本。具体的特征融合方式可以参考上述实施例的介绍。例如，将各历史时间段的页面特征、点击行为坐标特征、流量主特征进行拼接。

其中，负训练样本可以包括：在历史时间段内用户针对历史推广内容的行为为非真实行为时的历史行为特征信息。比如，以推广内容广告为例，该负训练样本可以包括误点样本，也即用户历史时间点击广告时，误点行为对应的行为特征，如流量主特征、页面特征、点击坐标特征等。

参考图3b，服务器可以从离线日志存储模块中提取离线特征，构建误点样本、非误点样本，采用误点样本和非误点样本对行为检测模型如GBDT训练。

(2)服务器根据正负训练样本对预设的行为检测模型进行训练。

具体地，行为检测模型可以参考上述实施例的介绍。

上述模型训练可以由服务器自己执行，也可以由其他设备训练完成后，服务器获取应用。应当理解的是本发明实施例应用的模型训练不仅限于上述方式来训练，还可以通过其他方式来训练。

(二)通过该训练好的行为检测模型，便可以进行行为真实性预测，具体可参见图3a和图3b。

如图3a所示，一种行为检测方法，具体流程可以如下：

301、终端向服务器上传用户针对推广内容的当前行为信息，当前行为信息包括用户的用户标识、以及用户针对推广内容的当前行为特征信息。

比如，终端检测到用户针对推广内容如广告的触发操作时，可以将当前行为信息上报给服务器。

譬如，以广告为例，参考图3b，当用户点击客户端内显示的广告时，户端会将当次广告行为数据包括但不限于用户标识、页面特征、点击坐标特征等数据上报到服务器，如{用户id，流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}，服务器将当次广告行为数据存储在离线日志存储模块中。其中，终端上报的当次广告行为数据即实时广告行为数据可以还可以存在实时消息队列中，以供后续使用。

302、服务器根据用户标识获取在多个历史时间段内用户针对历史推广内容的历史行为特征信息。

比如，参考图3b，服务器可以从离线日志存储模块中个提取多个历史时间段内的离线行为特征信息(包括用户标识、页面特征、点击坐标特征等)，即历史行为特征信息。

303、服务器对多个历史时间段内的历史行为特征信息进行特征融合，得到历史参考行为特征信息。

比如，参考图3b，服务器可以根据用户id从离线日志存储模块中个提取用户在多个历史时间段内的离线行为特征信息(包括用户标识、页面特征、点击坐标特征等)，即历史行为特征信息；然后，对离线行为特征信息进行特征拼接，如离线行为特征信息之间的用户标识、页面特征、点击坐标特征进行特征拼接，得到离线参考行为特征。

304、服务器将当前行为特征信息与历史参考行为特征信息进行融合，得到融合后行为特征信息。

其中，融合的方式可以参考上述实施例的描述。

比如，参考图3b在经过特征拼接得到离线参考行为特征如{流量主id，广告宽高(adw，adh),触屏坐标(x,y)，触屏按压时长t}之后，服务器可以从实时消息队列中提取当前行为特征(实时行为特征)、以及从分布式数据库(Hbase)提取离线参考行为特征，将二者进行实时特征拼接，得到拼接后行为特征。

305、服务器基于融合后特征行为信息和训练后的行为检测模型预测用户针对推广内容的行为真实性。

其中，服务器可以采用实时计算框架来实现行为检测。例如，参考图3b，在实时特征拼接后，可以将拼接后特征和训练模型GBDT数据输入至Spark Streaming(火花流)模块，由Spark Streaming模块基于拼接后特征和训练模型GBDT数据预测用户针对推广内容的行为真实性。

具体地，Spark Streaming将拼接行为特征和模型数据划分目标批次数据，然后，通过Spark Engine(引擎)处理这些批数据，实现行为预测。

在一实施例中，还可以将预测结果通过反作弊验证插(httpsvr匿名代理验证插件)发送给反作弊逻辑服务模块，反作弊逻辑服务模块如反作弊逻辑插件(logicsvr)可以根据预测结果进行实时拦截，如实时拦截误点广告带来的无效点击等。

在一实施例中，在需要将计算推广内容的费用时，可以基于预测结果或者拦截记录来计算有效推广的费用。例如，参考图3b，可以通过扣费查询模块查询预测结果或者拦截记录，基于预测结果或者拦截记录来计算有效广告推广的费用。

本发明实施例提供方法可以应用于了检测广告误点，其主要依据的原理是：用户点击广告时，误点和非误点行为对应的广告点击坐标、触屏时长、广告转化率、广告落地页打开率、落地页停留时长等特征是不同的。误点用户的广告点击坐标一般集中在广告位边缘位置，触屏时长较短，广告转化效果极差，落地页打开率较低，落地页打开后停留时长极短。下面分析了不同点击坐标、触屏按压时长、广告转化率之间的关系；

(1)点击广告时，不同点击坐标及触屏按压时长对应的广告转化率不同：越靠近广告位边沿位置，对应的广告转化效果越差，误点概率越高；点击触屏时间越短，对应的广告转化效果越差，误点概率越高。

图4～图5分别是在触屏坐标x轴和y轴方向上广告转化率的变化情况，从图中可以看到，点击位置越靠近边沿，关注转化率越低，越靠近中间(左右两边各有一个峰值)，关注转化率越高；图6是广告关注转化率随触屏按压时间分布情况，触屏时间越短，对应的广告转化效果越差。

(2)点击广告时，不同触屏坐标及触屏按压时长对应的广告落地页停留时间也不同：越靠近广告边沿位置，对应的用户在广告落地页停留时间越短，误点概率越高；点击触屏时间越短,对应的用户在广告落地页停留时间越短，，误点概率越高。如图7～图9所示。

用户误点打开广告后，通常会在广告加载过程中就关闭广告界面，因此在广告界面的停留时间极短。

因此，本发明实施例可以根据上述特征训练机器学习模型预测当次点击是否属于广告误点，从而实时拦截用户误点带来的无效点击，提高了广告的转化效果，保护了广告主的利益，同时提升了广告平台的口碑。

为了更好地实施以上方法，相应的，本发明实施例还提供一种行为检测装置，该行为检测装置具体可以集成在计算机设备中，该计算机设备可以是服务器，也可以是终端等。

例如，如图10a所示，该行为检测装置可以包括信息获取单元401、第一特征获取单元402、第二特征获取单元403、融合单元404和预测单元405，如下：

信息获取单元401，用于从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；

第一特征获取单元402，用于根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；

第二特征获取单元403，用于根据所述历史行为特征信息获取历史参考行为特征信息；

融合单元404，用于将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；

预测单元405，用于基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性，其中，所述行为检测模型由训练样本训练而成。

在一实施例中，参考图10b，所述第一特征获取单元402，用于根据所述用户标识获取在多个历史时间段内所述用户针对历史推广内容的历史行为特征信息；

其中，所述第二特征获取单元403，可以包括：

融合子单元4031，用于将在多个历史时间段内所述用户针对历史推广内容的历史行为特征信息进行特征融合，得到融合后历史行为特征信息；

参考特征获取子单元4032，用于将所述融合后历史行为特征信息作为历史参考行为特征信息。

在一实施例中，所述行为特征信息包括多个行为特征；所述融合单元404，可以具体用于：将当前行为特征信息与所述历史参考行为特征信息中相同的行为特征进行特征拼接。

在一实施例中，参考图10c，所述预测单元405，可以包括：

划分子单元4051，用于将融合后行为特征信息的数据流划分成目标批次数据；

处理子单元4052，用于加载行为检测模型，并基于行为检测模型对应的数据处理逻辑对所述目标批次数据进行数据处理，以预测用户针对所述推广内容的行为真实性。

在一实施例中，参考图10d，所述预测单元，可以包括：

选择子单元4053，用于根据所述用户标识从多个候选行为检测模型中选择所述用户对应的行为检测模型，所述行为检测模型由所述用户对应的训练样本训练而成；

预测子单元4054，用于根据所述用户对应的行为检测模型和所述融合后行为特征信息预测用户针对所述推广内容的行为真实性。

在一实施例中，参考图10e，行为检测装置还可以包括：

历史特征获取单元406，用于获取历史真实行为特征信息，所述历史真实行为特征信息为在历史时间段内所述用户针对历史推广内容的行为为真实行为时的历史行为特征信息；

正样本构建单元407，用于根据所述历史真实行为特征信息构建正训练样本；

训练单元408，用于根据所述正训练样本对预设的行为检测模型进行训练。

在一实施例中，所述正样本构建单元407，可以具体用于：从多个历史真实行为特征信息中选择若干样本行为特征信息；将所述样本行为特征信息进行特征融合，得到融合后样本行为特征信息；将融合后样本行为特征信息作为正训练样本。

在一实施例中，参考图10f，行为检测装置还可以包括：负样本获取单元409；

所述负样本获取单元409，可以用于获取负训练样本，所述负训练样本包括：在历史时间段内所述用户针对历史推广内容的行为为非真实行为时的历史行为特征信息；

所述训练单元408，用于根据所述正训练样本和所述负训练样本对预设的行为检测模型进行训练。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由上可知，本实施例的行为检测装置可以通过信息获取单元401从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；由第一特征获取单元402根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；由第二特征获取单元403根据所述历史行为特征信息获取历史参考行为特征信息；由融合单元404将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；由预测单元405基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性。由于该方案基于用户针对推广内容的行为特征信息以及机器学习模型来检测用户针对推广内容的行为真实性，可以提升行为检测的准确性。

此外，本发明实施例还提供一种计算机设备，如图11所示，其示出了本发明实施例所涉及的计算机设备的结构示意图，具体来讲：

该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解，图11中示出的计算机设备结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器501是该计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分，通过运行或执行存储在存储器502内的软件程序和/或模块，以及调用存储在存储器502内的数据，执行计算机设备的各种功能和处理数据，从而对计算机设备进行整体监控。可选的，处理器501可包括一个或多个处理核心；优选的，处理器501可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器501中。

存储器502可用于存储软件程序以及模块，处理器501通过运行存储在存储器502的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器502可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器502还可以包括存储器控制器，以提供处理器501对存储器502的访问。

计算机设备还包括给各个部件供电的电源503，优选的，电源503可以通过电源管理系统与处理器501逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该计算机设备还可包括输入单元504，该输入单元504可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，计算机设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，计算机设备中的处理器501会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中，并由处理器501来运行存储在存储器502中的应用程序，从而实现各种功能，如下：

从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；根据所述历史行为特征信息获取历史参考行为特征信息；将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

由上可知，本实施例的计算机设备可以从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；根据所述历史行为特征信息获取历史参考行为特征信息；将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性。由于该方案基于用户针对推广内容的行为特征信息以及机器学习模型来检测用户针对推广内容的行为真实性，可以提升行为检测的准确性。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本发明实施例还提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的任一种行为检测方法中的步骤。例如，该指令可以执行如下步骤：

从终端获取用户针对推广内容的当前行为信息，所述当前行为信息包括所述用户的用户标识、以及所述用户针对推广内容的当前行为特征信息；根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息；根据所述历史行为特征信息获取历史参考行为特征信息；将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，得到融合后行为特征信息；基于行为检测模型和所述融合后行为特征信息，预测用户针对所述推广内容的行为真实性

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本发明实施例所提供的任一种行为检测方法中的步骤，因此，可以实现本发明实施例所提供的任一种行为检测方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本发明实施例所提供的一种行为检测方法、装置、计算机设备和存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种行为检测方法，其特征在于，包括：

根据所述历史行为特征信息获取历史参考行为特征信息；

2.如权利要求1所述的行为检测方法，其特征在于，根据所述用户标识获取在历史时间段内所述用户针对历史推广内容的历史行为特征信息，包括：

根据所述用户标识获取在多个历史时间段内所述用户针对历史推广内容的历史行为特征信息；

根据所述历史行为特征信息获取历史参考行为特征信息，包括：

将在多个历史时间段内所述用户针对历史推广内容的历史行为特征信息进行特征融合，得到融合后历史行为特征信息；

将所述融合后历史行为特征信息作为历史参考行为特征信息。

3.如权利要求1所述的行为检测方法，其特征在于，其中，行为特征信息包括多个行为特征；

将所述当前行为特征信息与所述历史参考行为特征信息进行特征融合，包括：

4.如权利要求1所述的行为检测方法，其特征在于，基于行为检测模型和所述融合后行为特征信息预测用户针对所述推广内容的行为真实性，包括：

将融合后行为特征信息的数据流划分成目标批次数据；

加载行为检测模型，并基于行为检测模型对应的数据处理逻辑对所述目标批次数据进行数据处理，以预测用户针对所述推广内容的行为真实性。

5.如权利要求1所述的行为检测方法，其特征在于，基于行为检测模型和所述融合后行为特征信息预测用户针对所述推广内容的行为真实性，包括：

根据所述用户标识从多个候选行为检测模型中选择所述用户对应的行为检测模型，所述行为检测模型由所述用户对应的训练样本训练而成；

根据所述用户对应的行为检测模型和所述融合后行为特征信息预测用户针对所述推广内容的行为真实性。

6.如权利要求1所述的行为检测方法，其特征在于，还包括：

获取历史真实行为特征信息，所述历史真实行为特征信息为在历史时间段内所述用户针对历史推广内容的行为为真实行为时的历史行为特征信息；

根据所述历史真实行为特征信息构建正训练样本；

根据所述正训练样本对预设的行为检测模型进行训练。

7.如权利要求5所述的行为检测方法，其特征在于，根据所述历史真实行为特征信息构建正训练样本，包括：

将所述样本行为特征信息进行特征融合，得到融合后样本行为特征信息；

将融合后样本行为特征信息作为正训练样本。

8.如权利要求1所述的行为检测方法，其特征在于，还包括：

获取负训练样本，所述负训练样本包括：在历史时间段内所述用户针对历史推广内容的行为为非真实行为时的历史行为特征信息；

根据所述正训练样本对预设的行为检测模型进行训练，包括：

根据所述正训练样本和所述负训练样本对预设的行为检测模型进行训练。

9.一种行为检测装置，其特征在于，包括：

10.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至8任一项所述的行为检测方法中的步骤。

11.一种计算机设备，其特征在于，包括存储器和处理器；所述存储器存储有多条指令，所述处理器加载所述存储器内的指令，以执行权利要求1至8任一项所述的行为检测方法中的步骤。