CN120069964A

CN120069964A - 用于聚合广告平台的监测方法、装置、设备及介质

Info

Publication number: CN120069964A
Application number: CN202510551504.0A
Authority: CN
Inventors: 陈星月
Original assignee: Chengdu Chuxin Interactive Technology Co ltd
Current assignee: Chengdu Chuxin Interactive Technology Co ltd
Priority date: 2025-04-29
Filing date: 2025-04-29
Publication date: 2025-05-30

Abstract

本发明公开了用于聚合广告平台的监测方法、装置、设备及介质，涉及互联网技术领域，监测方法包括：收集n种广告在个广告平台的历史综合数据，n和皆为大于等于1的整数；基于历史综合数据构建识别虚假数据的虚假识别模型和预测跳转平台概率的用户行为预测模型；获取n种广告在个广告平台的实时综合数据，将实时综合数据输入虚假识别模型，输出虚假数据，并将虚假数据从实时综合数据中去除获得真实综合数据，基于真实综合数据计算获得投放评价数据；通过虚假识别模型识别从聚合广告平台监测的实时综合数据的真实度，并过滤虚假数据得到真实综合数据，基于真实综合数据获取投放评价数据，提升聚合广告平台监测的数据的真实性。

Description

用于聚合广告平台的监测方法、装置、设备及介质

技术领域

本发明涉及互联网技术领域，特别涉及用于聚合广告平台的监测方法、装置、设备及介质。

背景技术

随着数字广告产业的快速发展，在多个广告平台投放广告时，为了优化广告投放效果，通常依赖广告平台提供的分析工具和报告对投放效果进行监测；这些平台通过监测广告的点击量、曝光量、转化率等基础数据，进行广告效果评估。

例如，公开号为CN107341682A的专利申请公开了一种广告信息监测与评估方法及其装置，从多个平台获取用户行为信息，并将用户行为信息通过用户标识数据进行聚合；其虽然从多个平台获取用户行为信息，但无法监测用户在多个广告平台之间的行为信息的关联性，即无法预测多个平台之间追踪同一用户的行为路径；并且在聚合广告平台投放过程中，无法及时识别和过滤干扰数据，导致广告效果报告不准确。

为此，本发明提出用于聚合广告平台的监测方法、装置、设备及介质。

发明内容

本发明的目的在于提供用于聚合广告平台的监测方法、装置、设备及介质，以实现预测多个平台之间追踪同一用户的行为路径，并对异常行为进行过滤，提升聚合广告平台监测准确性。

本发明的目的采用以下技术方案来实现。用于聚合广告平台的监测方法，监测方法包括：

收集n种广告在个广告平台的历史综合数据，n和皆为大于等于1的整数；

基于历史综合数据构建识别虚假数据的虚假识别模型和预测跳转平台概率的用户行为预测模型；

获取n种广告在个广告平台的实时综合数据，将实时综合数据输入虚假识别模型，输出虚假数据，并将虚假数据从实时综合数据中去除获得真实综合数据，基于真实综合数据计算获得投放评价数据；

将真实综合数据输入用户行为预测模型输出跳转平台概率；

基于投放评价数据和跳转平台概率将个广告平台分类。

优选地，基于投放评价数据和跳转平台概率将个广告平台分类的方法包括：

步骤一，预先将个广告平台划分为k个广告展示类别，k为大于1的整数；

步骤二，将个广告平台的真实综合数据和跳转平台概率转换为个特征向量，随机选择h个广告平台的特征向量作为初始质心，；

步骤三，计算每个广告平台到各质心的欧几里得距离，并将每个广告平台分配到与其距离最近的广告展示类别；

步骤四，每分配完成一次，重复步骤二和步骤三，重新计算每个广告展示类别的质心；

步骤五，重复步骤三和步骤四，直到每个广告展示类别的质心小于预设质心阈值，完成个广告平台的聚类划分。

优选地，所述虚假识别模型的构建方法包括：

收集多组历史综合数据，将收集历史综合数据时历史综合数据的真实性进行标记，若历史综合数据真实性为虚假，则标记为0，若历史综合数据真实性为真实，则标记为1；

将历史综合数据以及历史综合数据对应的标记作为数据集，数据集按照预设比例划分为训练集和测试集，通过最小化损失函数来找到最佳的模型参数训练模型，输出预测标签数据，直至预测标签数据与实际标签数据的准确度达到预设准确度之后停止训练，并将训练获得的模型作为虚假识别模型，虚假识别模型为随机森林、支持向量机和逻辑回归中的一种。

优选地，将虚假数据从实时综合数据中去除获得真实综合数据具体方法包括：

根据虚假识别模型的输出结果，筛选出预测标签为0的数据条目。

优选地，所述用户行为预测模型的训练方法包括：

设定滑动步长，基于滑动步长收集多组历史综合数据，构建用户动作序列，用户动作序列包括持续停留当前平台或跳转下一平台，将用户动作序列作为第二数据集；

第二数据集按照预设比例划分为训练集和测试集，通过最小化损失函数来找到最佳的模型参数训练模型，输出预测跳转平台概率，直至预测跳转平台概率与实际跳转平台概率的准确度达到预设准确度之后停止训练，并将训练获得的模型作为用户行为预测模型，用户行为预测模型为隐马尔可夫模型或长短期记忆网络。

优选地，所述历史综合数据和实时综合数据包括投放数据及投放数据对应的用户行为数据；

投放数据包括广告平台内容、展示次数、广告类型以及单价；

广告平台内容包括展示内容和用户浏览的内容；

广告类型包括广告类型ID、广告展示次数、广告点击次数、广告转化次数以及广告类型特征。

优选地，所述用户行为数据包括用户点击次数、用户页面停留时长、浏览内容以及下一时序动作；

下一时序动作为持续停留当前平台或跳转下一平台。

优选地，所述投放评价数据基于投放数据及投放数据对应的用户行为数据计算获得；

所述投放评价数据包括点击率、转化率、点击成本和转化成本。

用于聚合广告平台的监测装置，所述装置包括：

虚假识别模块，用于训练虚假识别模型；

用户行为预测模块，用于训练用户行为预测模型；

采集模块，用于采集聚合平台的实时综合数据；

数据处理模块，用于将实时综合数据分别输入虚假识别模型和用户行为预测模型分别输出虚假数据和跳转平台概率，并将虚假数据从实时综合数据中去除获得真实综合数据；

聚类模块，基于真实综合数据计算获得投放评价数据，基于投放评价数据和跳转平台概率将广告平台分类。

一种监控设备，包括：存储器，用于存储非暂时性计算机可读指令；以及处理器，用于运行所述计算机可读指令，使得所述计算机可读指令被所述处理器执行时实现上述的用于聚合广告平台的监测方法。

一种计算机存储介质，包括计算机指令，当所述计算机指令在设备上运行时，使得所述设备执行如上述的用于聚合广告平台的监测方法。

从以上技术方案可以看出，本申请具有以下有益效果：

1：通过虚假识别模型识别从聚合广告平台监测的实时综合数据的真实度，并过滤虚假数据得到真实综合数据，基于真实综合数据获取投放评价数据，提升聚合广告平台监测的数据的真实性。

2：通过分析用户行为，预测多个广告平台之间关联性，并且通过投放评价数据和跳转平台概率将多个广告平台聚类，利于聚合平台的分类展示。

上述说明仅是本发明技术方案的概述，为了能更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为让本发明的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图，详细说明如下。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本发明一个实施例用于聚合广告平台的监测方法的流程示意图；

图2是本发明一个实施例将广告平台分类的流程示意图；

图3是本发明一个实施例用于聚合广告平台的监测装置的结构示意图。

具体实施方式

为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的第三方系统监控系统、方法、装置、设备及存储介质的具体实施方式、结构、特征及其功效，详细说明如后。

需要说明的是，在本文中，诸如“第一”、“第二”等关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。另外，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

实施例1

参见图1，用于聚合广告平台的监测方法，监测方法包括：

收集n种广告在个广告平台的历史综合数据，n和皆为大于等于1的整数；历史综合数据包括投放数据及投放数据对应的用户行为数据，投放数据及投放数据对应的用户行为数据从所投放的广告平台获取，通过广告平台的API、广告SDK、用户行为追踪工具等收集；

具体的，投放数据包括广告平台内容、展示次数、广告类型以及单价；在一些实施例中，投放数据还包括广告展示位置，即广告在页面、应用中的具体展示位置，广告形式，广告形式包括横幅广告、视频广告、原生广告等；广告平台内容包括展示内容和用户浏览的内容，在一些实施例中，展示内容包括平台的综合内容，如新闻、娱乐、人文等，用户浏览的内容如该用户在该平台常浏览的内容；广告类型包括广告类型ID、广告展示次数、广告点击次数、广告转化次数以及广告类型特征；

用户行为数据包括用户点击次数，即用户点击了哪些广告，点击的时间、频率等、用户页面停留时长、浏览内容以及下一时序动作，在一些实施例中，用户行为数据还包括用户转化数据，即用户是否进行购买、注册、下载等操作；用户属性数据，例如年龄、性别、地理位置、设备类型等；下一时序动作为持续停留当前平台或跳转下一平台，即用户在浏览广告后是否跳转到其他平台；

值得一提的是，为了保证n种广告在个广告平台的历史综合数据的对比可靠性，采集的历史综合数据需要经过清洗与标准化，将各个平台的广告数据（不同格式、时区、单位等）进行统一清洗和标准化，比如，将广告展示次数、广告点击次数、广告转化次数等指标转化为统一的格式和标准，确保能够跨平台对比，具体转化方法能够使用加权平均、归一化等方法将各平台的广告数据进行统一处理，从而生成一个综合性的效果评分，并且要分析数据的时效性，确定不同平台广告数据的更新时间，是否存在延迟或者缺失数据，确保监测结果的准确性。

具体的，虚假识别模型的构建方法包括：

收集多组历史综合数据，将收集历史综合数据时历史综合数据的真实性进行标记，真实性由本领域技术人员标记，真实性判定方法包括用户频繁点击相同广告但在广告页面上停留时间过短；极短时间内点击多个广告，或者在非常短的时间内点击多个不同的广告；用户的设备信息、IP地址或浏览器信息在短时间内发生了频繁变化；用户点击广告时其地理位置表现出异常分布等，在此不做具体限定；

若历史综合数据真实性为虚假，则标记为0，若历史综合数据真实性为真实，则标记为1；将历史综合数据以及历史综合数据对应的标记作为数据集，数据集按照预设比例划分为训练集和测试集，如将70%的数据集作为训练集，30%的数据集作为测试集进行模型训练，输出预测标签数据，直至预测标签数据与实际标签数据的准确度达到预设准确度之后停止训练，并将训练获得的模型作为虚假识别模型；虚假识别模型为随机森林、支持向量机和逻辑回归中的一种；

以随机森林为例，训练过程包括：随机选择训练数据集中的子集，并用这个子集训练一棵决策树，重复以上过程N次，训练N棵树，每棵树的输出为一个标签（0或1），最终通过多数投票决定模型的输出；

训练停止的条件是模型在测试集上的准确度达到预设的目标准确度，例如95%，或经过预定的训练轮数，如1000次迭代，若在某个迭代中模型的性能停滞不前，则停止训练。

用户行为预测模型的训练方法包括：

设定滑动步长，即每次选取一段时间窗口内的用户行为数据来作为训练样本。滑动步长决定了在时间序列中每次采集的数据段长度，基于滑动步长收集多组历史综合数据，构建用户动作序列，用户动作序列包括持续停留当前平台或跳转下一平台，例如，用户在多个时间步的行为数据，其中，为时间步编号，对于每个时间步，用户的行为可以是以下几种：

停留当前平台：表示用户在当前平台上停留；

跳转到下一个平台：表示用户从当前平台跳转到其他平台；

用户动作序列S可以表示为：，其中，表示在时刻的用户行为，是时间步数；

将用户动作序列作为第二数据集，第二数据集按照预设比例划分为训练集和测试集，例如70%训练集，30%测试集，划分方式可以采用随机划分或时间序列划分，通过最小化损失函数来找到最佳的模型参数训练模型，输出预测跳转平台概率，直至预测跳转平台概率与实际跳转平台概率的准确度达到预设准确度之后停止训练，并将训练获得的模型作为用户行为预测模型；

用户行为预测模型为隐马尔可夫模型或长短期记忆网络，例如，基于隐马尔可夫模型训练方法：用户的行为被建模为在多个隐状态，如停留和跳转之间的转移；定义状态空间，即用户行为的可能状态，例如，状态表示“停留平台”，状态表示“跳转平台”；定义观测空间，即用户的可观测行为，如在特定时间点的平台类型；获取模型的关键参数，包括转移概率矩阵A：表示从一个状态转移到另一个状态的概率：

，其中，表示从状态转移到状态的概率，发射概率矩阵，表示在每个状态下观测到特定行为的概率；初始状态概率，表示系统初始化时各个状态的概率；

训练过程中，通过Baum-Welch算法来估计转移概率矩阵和发射概率矩阵，使得模型能够最小化对数似然函数：

；

其中表示模型的参数集合，是观测数据，表示参数集合在t时刻观察到观测数据的条件概率表示模型的对数似然函数。

基于长短期记忆网络LSTM训练方法：输入用户的行为序列，通常是由一系列平台停留和跳转的标记（0或1）组成；LSTM内部通过记忆单元和隐藏状态来存储时间步之间的依赖关系；输出预测值，表示用户跳转到下一个平台的概率；通过最小化损失函数，如交叉熵损失函数来训练LSTM模型：

；

其中，为真实标签，为模型预测的跳转平台概率，通过反向传播算法来更新模型的参数，训练停止的条件是模型在测试集上的准确度达到预设的目标准确度，例如95%，或经过预定的训练轮数，如1000次迭代，若在某个迭代中模型的性能停滞不前，则停止训练。

获取n种广告在个广告平台的实时综合数据，将实时综合数据输入虚假识别模型，输出虚假数据，并将虚假数据从实时综合数据中去除获得真实综合数据，具体为，根据虚假识别模型的输出结果，筛选出预测标签为0的数据条目，基于真实综合数据计算获得投放评价数据；

值得一提的是，实时综合数据所包括的种类与历史综合数据相同，皆为投放数据及投放数据对应的用户行为数据。

具体的，投放评价数据基于投放数据及投放数据对应的用户行为数据计算获得；投放评价数据包括点击率、转化率、点击成本、转化成本和回报率，分别标记为、、、、，转化成本即广告主为每次转化所支付的费用。

可选的，的计算表达式为：

；

其中，为第类平台投放第种广告获得的点击率，为第类平台投放第种广告获得的点击次数，为第类平台投放第种广告获得的展示次数，展示次数为在第x平台的曝光量总和，从广告平台API获取，x代表不同的广告平台，曝光量为整数，广告每展示一次为1次曝光，点击率衡量的是广告的点击次数与广告展示次数的比例，用于评估广告的吸引力。

可选的，的计算表达式为：

；

其中，为第类平台投放第种广告获得的转化率，为第类平台投放第种广告获得的转化次数，转化率衡量的是广告的转化次数与点击次数的比例，用于评估广告的实际效果。

可选的，的计算表达式为：

；

其中，为第类平台投放第种广告的点击成本，点击成本指的是广告主为每次点击广告所支付的费用，为第类平台投放第种广告的成本。

可选的，的计算表达式为：

；

其中，为第类平台投放第种广告的转化成本，转化成本指的是广告主为每次转化所支付的费用，用于衡量广告投放的效益。

可选的，的计算表达式为：

；

其中，为第类平台投放第种广告的回报率，为第类平台投放第种广告的净回报，投资回报率是评估广告投放效果的关键指标，表示广告投放的回报与成本的比值。

可选的，在一些实施例中，基于、、、和计算第类平台投放第种广告的综合评分，标记为,计算表达式为：

；

其中，，，，和是预设加权系数，且，，，和之和等于一，加权系数根据广告主的优先级调整，这些权重反映了广告主对不同指标的关注程度，例如，广告主可能对转化率和回报率更关注，因此会赋予更高的权重，综合评分用于评估广告投放效果，能够综合反映广告效果，并帮助广告主做出决策。

将真实综合数据输入用户行为预测模型输出跳转平台概率；目的在于，广告平台上的跳转行为通常与用户的兴趣、需求和广告的相关性密切相关，通过预测跳转平台的概率，广告主可以识别潜在的用户流失风险，及时调整广告内容或投放方式，以防止用户跳转到竞争平台；通过对用户行为的精确预测来优化广告投放策略、预算分配、广告内容个性化以及平台选择，同时，预测结果也能帮助广告主识别潜在的风险，提升广告效果和用户体验，从而实现更高的广告投资回报率。

基于投放评价数据和跳转平台概率将个广告平台分类。

参见图2，具体的，基于投放评价数据和跳转平台概率将个广告平台分类的方法包括：

步骤一，预先将个广告平台划分为k个广告展示类别，k为大于1的整数，k的数量表示将个广告平台分为几个聚类，k是预先定义的广告展示类别数，例如分为高质量、标准质量及低质量三个广告展示类别，具体通过本领域技术人员经验或实际需求来确定最佳的k值，在此不做具体限定；

步骤二，将个广告平台的真实综合数据和跳转平台概率转换为个特征向量，，其中，为第i个广告平台的特征向量，是第个广告平台在第个特征维度上的值，特征维度包括展示次数、点击率、转化率、跳转概率等；随机选择h个广告平台的特征向量作为初始质心，，其中，为第h个初始质心，为第个广告展示类别质心；

步骤三，计算每个广告平台到各质心的欧几里得距离，并将每个广告平台分配到与其距离最近的广告展示类别，欧几里得距离的计算表达式为：

；

其中，为第个广告平台到第个广告展示类别质心的欧几里得距离，为第个广告平台在第个特征维度的值，如展示次数、点击率或转化率等，为第个广告展示类别质心在第个特征维度的值，为特征向量的总维度数。

步骤四，每分配完成一次，重复步骤二和步骤三，重新计算每个广告展示类别的质心，新的质心为该广告展示类别中所有广告平台特征向量的均值，对于每个广告展示类别新的质心，的计算表达式为：

；

其中，为第个广告展示类别中分配的广告平台集合，为集合中广告平台的数量。

步骤五，重复步骤三和步骤四，直到每个广告展示类别的质心小于预设质心阈值，预设质心阈值由本领域技术人员根据实际需求而定，在此不做具体限定，完成个广告平台的聚类划分。

本实施例目的在于，通过对聚合广告进行聚合监测，即将不同广告投放在不同广告平台的效果集中分析后，分析得到的回馈效果并分类展示，让广告主能直观的看到不同广告在所有广告平台的投放效果，而非仅是分析单一数据。

实施例2

参阅图3所示，用于聚合广告平台的监测装置，装置包括虚假识别模块、用户行为预测模块、采集模块、数据处理模块和聚类模块，其中各个模块之间通过有线和/或无线网络连接；

虚假识别模块，用于训练虚假识别模型，本实施例虚假识别模型训练所用数据通过各个广告平台的历史监测数据或监测日志获得，在此不做过多阐述；

用户行为预测模块，用于训练用户行为预测模型；

采集模块，用于采集聚合平台的实时综合数据，采集模块与多个广告平台的API接口进行对接，实时收集数据并进行初步的预处理，例如格式转换、缺失值填充等；

聚类模块，基于真实综合数据计算获得投放评价数据，基于投放评价数据和跳转平台概率将广告平台分类，以实现广告效果的优化。

本发明的实施例还提供一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行上述相关步骤，以实现上述实施例中的用于聚合广告平台的监测方法。

其中，本发明提供的装置、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法，因此，其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果，此处不再赘述。

以上所述，仅是本发明的较佳实施例而已，并非对本发明做任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.用于聚合广告平台的监测方法，其特征在于，监测方法包括：

将真实综合数据输入用户行为预测模型输出跳转平台概率；

基于投放评价数据和跳转平台概率将个广告平台分类。

2.根据权利要求1所述的用于聚合广告平台的监测方法，其特征在于，基于投放评价数据和跳转平台概率将个广告平台分类的方法包括：

3.根据权利要求1所述的用于聚合广告平台的监测方法，其特征在于，所述虚假识别模型的构建方法包括：

4.根据权利要求3所述的用于聚合广告平台的监测方法，其特征在于，将虚假数据从实时综合数据中去除获得真实综合数据具体方法包括：

5.根据权利要求1所述的用于聚合广告平台的监测方法，其特征在于，所述用户行为预测模型的训练方法包括：

6.根据权利要求1所述的用于聚合广告平台的监测方法，其特征在于，所述历史综合数据和实时综合数据包括投放数据及投放数据对应的用户行为数据；

广告平台内容包括展示内容和用户浏览的内容；

7.根据权利要求6所述的用于聚合广告平台的监测方法，其特征在于，所述用户行为数据包括用户点击次数、用户页面停留时长、浏览内容以及下一时序动作；

下一时序动作为持续停留当前平台或跳转下一平台。

8.根据权利要求6所述的用于聚合广告平台的监测方法，其特征在于，所述投放评价数据基于投放数据及投放数据对应的用户行为数据计算获得；

9.用于聚合广告平台的监测装置，其用于实现权利要求1-8任一项所述的用于聚合广告平台的监测方法，其特征在于，装置包括：

虚假识别模块，用于训练虚假识别模型；

用户行为预测模块，用于训练用户行为预测模型；

采集模块，用于采集聚合平台的实时综合数据；

10.一种监控设备，其特征在于，包括：存储器，用于存储非暂时性计算机可读指令；以及处理器，用于运行所述计算机可读指令，使得所述计算机可读指令被所述处理器执行时实现权利要求1至8中任一项所述的用于聚合广告平台的监测方法。

11.一种计算机存储介质，其特征在于，包括计算机指令，当所述计算机指令在设备上运行时，使得所述设备执行如权利要求1至8中任一项所述的用于聚合广告平台的监测方法。