CN115760218B - 信息投放数据的校验与预测方法及应用 - Google Patents
信息投放数据的校验与预测方法及应用 Download PDFInfo
- Publication number
- CN115760218B CN115760218B CN202211573811.1A CN202211573811A CN115760218B CN 115760218 B CN115760218 B CN 115760218B CN 202211573811 A CN202211573811 A CN 202211573811A CN 115760218 B CN115760218 B CN 115760218B
- Authority
- CN
- China
- Prior art keywords
- data
- operator
- plan
- planning
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012384 transportation and delivery Methods 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012795 verification Methods 0.000 title claims description 20
- 230000006399 behavior Effects 0.000 claims abstract description 98
- 238000013439 planning Methods 0.000 claims abstract description 98
- 230000006870 function Effects 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims 2
- 238000013524 data verification Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 11
- 239000008186 active pharmaceutical agent Substances 0.000 description 9
- 239000000843 powder Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 239000012089 stop solution Substances 0.000 description 1
Abstract
本发明公开了一种信息投放数据的校验与预测方法及应用,所述方法包括:获取计划行为数据,计划行为数据包括用户的行为数据以及每个投放账号下的计划数据;基于计划数据的投放信息维度,匹配该投放维度下的计划指标策略,并基于计划指标策略遍历计划数据,以对计划数据进行校验;基于行为数据的影响因子构建行为预测模型,并利用行为预测模型对计划行为数据进行预测。该方法通过拉取每个投放账号下的计划数据并对其进行数据校验,提高计划数据的准确性;同时通过对用户的未来行为进行预测,可以比较准确地看到行业风向标,及时调整投放战略方案。
Description
技术领域
本发明是关于互联网技术领域,特别是关于一种信息投放数据的校验与预测方法及应用。
背景技术
随着信息投放手段的多样性,信息投放方在进行信息投放时,可选择的投放渠道也越来越多,如可通过展示渠道、搜索渠道、社交渠道等多种投放渠道向用户投放信息。
为了达到与市场需求的同步,一般可以根据业务人员的需求拉取各投放账号下的计划数据,整合数据价值,更加智能地实现数据洞察和信息投放效果的实时展示,转化数据价值为商业价值。
然而,现有技术中,由于缺乏对各账号下的计划数据的校验,导致计划数据中所存在的异常数据将影响用户对于投放信息的行为反应的判断,对投放计划造成极大的干扰。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种信息投放数据的校验与预测方法及应用,其用以解决现有技术中由于缺乏对各账号下的计划数据的校验导致影响用户对于投放信息的行为反应的判断,对投放计划造成极大的干扰的问题。
为实现上述目的,本发明的实施例提供了一种信息投放数据的校验与预测方法,所述方法包括:获取计划行为数据,所述计划行为数据包括用户的行为数据以及每个投放账号下的计划数据;
基于所述计划数据的投放信息维度,匹配该投放维度下的计划指标策略,并基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验;
基于所述行为数据的影响因子构建行为预测模型,并利用所述行为预测模型对所述计划行为数据进行预测。
在本发明的一个或多个实施方式中,获取所述计划数据具体包括:基于约定的API接口拉取所有投放平台中每个投放账号下的计划数据;
和/或,基于约定的API接口拉取所有投放平台中每个投放账号下的原始数据,并基于归因指标对所述原始数据进行归一化处理,以得到计划数据;其中,部分原始数据通过爬虫从网页端进行爬取。
在本发明的一个或多个实施方式中,所述基于约定的API接口拉取所有投放平台中每个投放账号下的原始数据,具体包括:设置定时调度任务,每x分钟拉取一次原始数据,并在当日对前一日的原始数据进行汇总;在日志表中加入每个调度任务的调度记录,并设定定时轮询,当调度任务失败时,进行失败任务重试。
在本发明的一个或多个实施方式中,基于所述计划数据的投放信息维度,匹配该投放信息维度下的计划指标策略,具体包括:根据业务需求设定计划指标策略,所述计划指标策略包含多个算子策略,每个算子策略均包括同层并集算子和至少一个级联交集算子,每个算子均包括归因指标、运算符以及阈值;
根据所述计划数据的投放位置、投放形式以及投放类型匹配相应的算子策略;其中,当所述计划数据匹配到多个算子策略时,选择优先级最高的算子策略进行匹配。
在本发明的一个或多个实施方式中,基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验,具体包括:基于所述计划数据匹配的计划指标策略中相应的算子策略,采用级联父id的递归方式对所有所述计划数据进行遍历;遍历过程中,将所述计划数据的归因指标与所述算子策略中的算子进行运算,当所述计划数据的归因指标触发所述算子策略中最后一层算子的阈值时,判断该计划数据为异常数据。
在本发明的一个或多个实施方式中,将所述计划数据的归因指标与所述算子策略中的算子进行运算,具体包括:从所述算子策略的0层算子开始与所述计划数据的归因指标进行运算,运算结果返回布尔值;当到达i层算子时,若所述i层算子与所述计划数据的归因指标的运算结果为真,则递归到下级i+1层算子与所述计划数据的归因指标进行运算;若运算结果为假,则循环同层i层算子与所述计划数据的归因指标进行运算。
在本发明的一个或多个实施方式中,基于所述行为数据的影响因子构建行为预测模型,具体包括:对所述行为数据的影响因子进行叉乘组合得到历史行为数据,对所述历史行为数据进行函数拟合,以构建行为预测模型。
在本发明的另一个方面当中,提供了一种信息投放数据的校验与预测装置,所述装置包括:
获取模块,用于获取计划数据,所述计划数据包括每个投放账号下的订单数据、粉丝用户数据以及投放账号消耗数据;
校验模块,用于基于所述计划数据的投放信息维度,匹配该投放维度下的计划指标策略,并基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验;
预测模块,用于基于所述计划数据构建行为预测模型,并利用所述行为预测模型对未来数据进行预测。
一实施方式中,获取模块具体用于:基于约定的API接口拉取所有投放平台中每个投放账号下的计划数据;
和/或,基于约定的API接口拉取所有投放平台中每个投放账号下的原始数据,并基于归因指标对所述原始数据进行归一化处理,以得到计划数据;其中,部分原始数据通过爬虫从网页端进行爬取。
一实施方式中,获取模块具体还用于:设置定时调度任务,每x分钟拉取一次原始数据,并在当日对前一日的原始数据进行汇总;在日志表中加入每个调度任务的调度记录,并设定定时轮询,当调度任务失败时,进行失败任务重试。
一实施方式中,校验模块具体用于:根据业务需求设定计划指标策略,所述计划指标策略包含多个算子策略,每个算子策略均包括同层并集算子和至少一个级联交集算子,每个算子均包括归因指标、运算符以及阈值;根据所述计划数据的投放位置、投放形式以及投放类型匹配相应的算子策略;其中,当所述计划数据匹配到多个算子策略时,选择优先级最高的算子策略进行匹配。
一实施方式中,校验模块具体还用于:基于所述计划数据匹配的计划指标策略中相应的算子策略,采用级联父id的递归方式对所有所述计划数据进行遍历;遍历过程中,将所述计划数据的归因指标与所述算子策略中的算子进行运算,当所述计划数据的归因指标触发所述算子策略中最后一层算子的阈值时,判断该计划数据为异常数据。
一实施方式中,校验模块具体还用于:从所述算子策略的0层算子开始与所述计划数据的归因指标进行运算,运算结果返回布尔值;当到达i层算子时,若所述i层算子与所述计划数据的归因指标的运算结果为真,则递归到下级i+1层算子与所述计划数据的归因指标进行运算;若运算结果为假,则循环同层i层算子与所述计划数据的归因指标进行运算。
一实施方式中,预测模块具体用于:对所述行为数据的影响因子进行叉乘组合得到历史行为数据,对所述历史行为数据进行函数拟合,以构建行为预测模型。
在本发明的另一个方面当中,提供了一种电子设备,所述电子设备包括:至少一个处理器;以及存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的信息投放数据的校验与预测方法。
在本发明的另一个方面当中,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的信息投放数据的校验与预测方法。
与现有技术相比,根据本发明实施方式的信息投放数据的校验与预测方法及应用,其通过拉取每个投放账号下的计划数据并对其进行数据校验,提高计划数据的准确性,从而可以更加准确的体现出用户对于投放信息的行为反应,为投放计划提供更高的参考价值;同时,通过对用户的未来行为进行预测,可以比较准确地看到行业风向标,及时调整投放战略方案。
附图说明
图1是根据本发明一实施方式的信息投放数据的校验与预测方法的流程图;
图2是根据本发明一实施方式的信息投放数据的校验与预测方法中所采用的系统框架示意图;
图3是根据本发明一实施方式的信息投放数据的校验与预测方法中基于原始数据获取计划数据的流程图;
图4是根据本发明一实施方式的信息投放数据的校验与预测方法中数据校验的流程图;
图5是根据本发明一实施方式的信息投放数据的校验与预测方法中计划指标策略的结构示意图;
图6是根据本发明一实施方式的信息投放数据的校验与预测装置的结构示意图;
图7是根据本发明一实施方式的信息投放数据的校验与预测的电子设备的硬件结构图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
参图2,本发明应用于VUE看板系统,采用基于SpringBoot的微服务开发的一站式解决方案Spring Cloud Alibaba,使用了注册中心Nacos、网关GateWay、负载均衡Ribbon、远程调用Open Feign等分布式应用组件。针对多线程的配置方案,采用了Thread Pool线程池和Hakari连接池。系统编程语言采用JAVA、JDK1.8。
本系统是致力于广告投放、数字营销的一站式数据管理平台。通过对拉取的计划数据进行实时校验以及对未来数据的预测,可实时地、精确地、跨多平台地向业务人员展示归因指标和数据预测,实现统一评定投放人员的绩效和回本。
参图1,介绍本发明信息投放数据的校验与预测方法的一实施方式。本实施方式中,该方法包括如下步骤。
S101,获取计划行为数据,所述计划行为数据包括用户的行为数据以及每个投放账号下的计划数据。
其中,计划数据是指投放账号下广告计划的归因数据,包括激活成本、转化成本、关注率等;用户的行为数据是指用户的订单行为、关注行为等产生的数据。计划数据是在一个统计维度下的用户行为的一种体现。
一实施方式中,计划数据可以通过约定好的API接口直接从投放平台中的每个投放账号内拉取获得。
具体地,每个投放账号下包含有多条计划数据,涉及到实际的现金消耗等。可设定定时调度机制,每隔一定时间拉取一次每个投放账号下的所有计划数据。
一实施方式中,计划数据还可以从投放平台中每个投放账号下的原始数据中进行获取。
具体参图3,可基于约定好的API接口,通过HTTP协议请求拉取并接收所有投放平台中每个投放账号下的原始数据,部分原始数据还可通过爬虫从网页端进行爬取;然后基于归因指标对原始数据进行归一化处理,从而得到计划数据。
本实施方式中,归因指标包括消耗时速、支付粉价、粉价、新增ROI(回本率)、余量ROI、增关比、点击率等。
进一步地,可设置定时调度任务,设定好每x分钟拉取一次原始数据,并在当日对前一日的原始数据进行汇总,包括账号、消耗、订单、新增粉丝用户人数等数据。在日志表中加入每个调度任务的调度记录,同时可设定每n小时的定时轮询,当调度任务失败时,可进行失败任务重试。
S102,基于所述计划数据的投放信息维度,匹配该投放维度下的计划指标策略,并基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验。
参图4,计划数据的投放信息维度包括投放位置、投放形式以及类型。一实施方式中,可以根据所拉取的所有计划数据的投放信息维度匹配相应的计划指标策略,并利用所匹配的计划指标策略对该计划数据进行校验。
参图5,计划指标策略可以根据业务需求进行设定,整个计划指标策略的数据结构为散列表结构。计划指标策略包含多个算子策略,每个算子策略均包括同层并集算子和至少一个级联交集算子,每个算子均包括归因指标、运算符以及阈值,以实现高扩展性、高灵活性的配置方案。
其中,计划指标策略中至少包括一个空指标策略,该空指标策略作为缺省可以匹配任意一条计划数据。当一条计划数据匹配到多个算子策略时,则选择优先级最高的算子策略进行匹配。
匹配到相应的算子策略之后,利用该算子策略中的算子对所有计划数据进行遍历。算子策略中的算子包括运算符以及阈值,运算符以及阈值均可以根据业务需求进行设定。其中运算符一般包括大于、小于、大于或等于、小于或等于等。
具体可采用级联父id的递归方式对所有计划数据进行遍历。遍历过程中,将计划数据的所有归因指标与算子策略中的算子进行运算,当计划数据的归因指标触发算子策略中最后一层算子的阈值时,判断该计划数据为异常数据。
当其中一条或多条计划数据触发阈值条件时,系统将调用邮件通知或OA软件接口进行报警通知,同时记录该异常数据。异步地使用selenium自动化工具,定时读取这些异常数据,完成全套的关停流程,实现自动化关停。
一实施方式中,可以从算子策略的0层算子开始与计划数据的所有归因指标进行运算,即将计划数据的所有归因指标通过算子中的运算符与算子中的阈值进行比较运算,运算结果返回布尔值。
当到达i层算子时,若i层算子与计划数据的归因指标的运算结果为真,则递归到下级i+1层算子与计划数据的归因指标继续进行运算,直到运算结果为假时跳出递归。若i层算子与计划数据的归因指标的运算结果为假,则跳出递归,循环同层i层算子与计划数据的归因指标进行运算。
一种情况下,选择一条计划数据的一个归因指标与算子策略中的算子进行递归运算,当递归到最后一层算子的运算结果返回布尔值为真时,表明该条计划数据属于异常数据,反之则属于正常数据。
示范性地,选择一条计划数据中的账号消耗这一归因指标与算子策略中的算子进行运算。
设定该条计划数据的账号消耗值为600;所匹配到的算子策略中的i层算子为针对该条计划数据的账号消耗上限,i层算子的运算符为小于或者小于或等于,设定上限阈值为1000;i+1层算子为针对该条计划数据的账号消耗下限,i+1层算子的运算符为大于或者大于或等于,设定下限阈值为100。
首先将该条计划数据的账号消耗与i层算子进行运算,返回布尔值为真;然后递归到下级i+1层算子继续进行运算,返回布尔值也为真。假设i+1层算子为该条算子策略中的最后一层算子,此时该条计划数据的账号消耗这一归因指标触发该算子策略中最后一层算子的阈值,该条计划数据属于异常数据。
当该条计划数据的账号消耗与i层算子进行运算返回布尔值为真,且递归到i+1层算子进行运算返回布尔值为假时,直接跳出递归,该条计划数据属于正常数据。当该条计划数据的账号消耗与i层算子进行运算返回布尔值为假时,直接结束递归,该条计划数据属于正常数据。
还有一种情况是,一条计划数据的多个归因指标分别与算子策略中的算子进行运算。示范性地,一条计划数据(账号消耗600,有下单,点击率3%,关注率14%,粉价100)下来,循环算子策略中所有0级算子,首先找第一个0级算子判断账号消耗值,返回布尔值为真,递归找1级算子判断有无下单,返回布尔值为假;循环找第二个0级算子判断点击率,返回布尔值为假;循环找第三个0级算子判断关注率,返回布尔值为真,递归找1级算子判断粉价,返回布尔值为真;假设1级算子为该条算子策略的最后一层算子,说明该条计划数据属于异常数据,跳出循环。该情况下的运算过程与第一种情况相同,此处不再赘述。
S103,基于所述行为数据的影响因子构建行为预测模型,并利用所述行为预测模型对所述计划行为数据进行预测。
一实施方式中,可采用数据评估算法对未来数据进行预测。具体可根据影响行为的主要影响因子,包括位置、形式、性别、书籍,对这四类行为数据的影响因子进行叉乘组合得到历史行为数据,然后调用Excel等工具中的函数对上述历史行为数据进行函数拟合,最后根据方差或标准差等指标确定最佳拟合方程,从而构建行为预测模型。利用所构建的行为预测模型对行为未来数据进行预测。
为了保证行为预测模型预测数据的准确度,系统可以根据用户行为后续产生的数据对行为预测模型进行更新。
示范性地,假设2022/1/1~2022/6/30期间的行为数据:朋友圈(位置)-男(性别)-OCPX(形式)-最强战婿(书籍)的行为预测模型为:
后续2022/7/1~2022/8/31将产生新的行为数据,将新增的行为数据与前期2022/1/1~2022/6/30期间的行为数据放在一起重新拟合,可得到更新后的行为预测模型为:
一实施方式中,为了进一步判断实际投放情况的好坏,可设置动态达标线作为实际数据的参考值。具体可以根据近n天的实际数据,采用动态达标线算法自动生成动态达标线,为每天的行为提供更加准确及时的参考。
设账号投放天数D1、D2、D3、...DN;对应天数消耗为CD1,CD2,...CDN,余量D1R1、D1R2、...D1RN...D(N-2)R1、D(N-2)R2,该账号对应天数模型要求是MD1、MD2、...MDN,则第N天的达标roi为:
示范性地,假设账号A的朋友圈内关于最强战婿在近日内的最强达标线如下表所示:
根据上表可知账号A的朋友圈内关于最强战婿在近日内的实际走势数据为:
通过设置动态达标线,可以对市场变化和单号的质量进行瞬间反应(1天)。同时,通过上表可知,账号余量好的比原有标准更低,余量差的也会高于原有达标线,对于市场变化也是同样的逻辑。
参图6,介绍本发明信息投放数据的校验与预测装置的一实施方式,所述装置包括获取模块201、校验模块202和预测模块203。
获取模块201,用于获取计划行为数据,所述计划行为数据包括用户的行为数据以及每个投放账号下的计划数据;
校验模块202,用于基于所述计划数据的投放信息维度,匹配该投放维度下的计划指标策略,并基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验;
预测模块203,用于基于所述行为数据的影响因子构建行为预测模型,并利用所述行为预测模型对所述计划行为数据进行预测。
一实施方式中,获取模块201具体用于:基于约定的API接口拉取所有投放平台中每个投放账号下的计划数据;
和/或,基于约定的API接口拉取所有投放平台中每个投放账号下的原始数据,并基于归因指标对所述原始数据进行归一化处理,以得到计划数据;其中,部分原始数据通过爬虫从网页端进行爬取。
一实施方式中,获取模块201具体还用于:设置定时调度任务,每x分钟拉取一次原始数据,并在当日对前一日的原始数据进行汇总;在日志表中加入每个调度任务的调度记录,并设定定时轮询,当调度任务失败时,进行失败任务重试。
一实施方式中,校验模块202具体用于:根据业务需求设定多个计划指标策略,所述多个计划指标策略包含结构相同或结构不同的算子策略,所述算子策略包括同层并集算子和级联交集算子,每个算子均包括归因指标、运算符以及阈值;根据所述计划数据的投放位置、投放形式以及投放类型匹配相应的计划指标策略;其中,当所述计划数据匹配到多个计划指标策略时,选择优先级最高的计划指标策略进行匹配。
一实施方式中,校验模块202具体还用于:基于所述计划数据匹配的计划指标策略中相应的算子策略,采用级联父id的递归方式对所有所述计划数据进行遍历;遍历过程中,将所述计划数据的归因指标与所述算子策略中的算子进行运算,当所述计划数据的归因指标触发所述算子策略中算子的阈值时,判断该计划数据为异常数据。
一实施方式中,校验模块202具体还用于:从所述算子策略的0层算子开始与所述计划数据的归因指标进行运算,运算结果返回布尔值;当到达i层算子时,若所述i层算子与所述计划数据的归因指标的运算结果为真,则递归到下级i+1层算子与所述计划数据的归因指标进行运算;若运算结果为假,则循环同层i层算子与所述计划数据的归因指标进行运算。
一实施方式中,预测模块203具体用于:对所述行为数据的影响因子进行叉乘组合得到历史行为数据,对所述历史行为数据进行函数拟合,以构建行为预测模型。
图7示出了根据本说明书的实施例的信息投放数据的校验与预测的电子设备30的硬件结构图。如图7所示,电子设备30可以包括至少一个处理器301、存储器302(例如非易失性存储器)、内存303和通信接口304,并且至少一个处理器301、存储器302、内存303和通信接口304经由总线305连接在一起。至少一个处理器301执行在存储器302中存储或编码的至少一个计算机可读指令。
应该理解,在存储器302中存储的计算机可执行指令当执行时使得至少一个处理器301进行本说明书的各个实施例中以上结合图1-5描述的各种操作和功能。
在本说明书的实施例中,电子设备30可以包括但不限于:个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。
根据一个实施例,提供了一种比如计算机可读存储介质的程序产品。计算机可读存储介质可以具有指令(即,上述以软件形式实现的元素),该指令当被计算机执行时,使得计算机执行本说明书的各个实施例中以上结合图1-5描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
根据本发明实施方式的信息投放数据的校验与预测方法及应用,其通过拉取每个投放账号下的计划数据并对其进行数据校验,提高计划数据的准确性,从而可以更加准确的体现出用户对于投放信息的行为反应,为投放计划提供更高的参考价值;同时,通过对用户的未来行为进行预测,可以比较准确地看到行业风向标,及时调整投放战略方案。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。
Claims (8)
1.一种信息投放数据的校验与预测方法,其特征在于,所述方法包括:
获取计划行为数据,所述计划行为数据包括用户的行为数据以及每个投放账号下的计划数据;其中,计划数据是指投放账号下广告计划的归因数据,包括激活成本、转化成本、关注率;用户的行为数据是指用户的订单行为、关注行为产生的数据;
基于所述计划数据的投放信息维度,匹配该投放维度下的计划指标策略,并基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验;
基于所述计划数据的投放信息维度,匹配该投放维度下的计划指标策略,具体包括:根据业务需求设定计划指标策略,所述计划指标策略包含多个算子策略,每个算子策略均包括同层并集算子和至少一个级联交集算子,每个算子均包括归因指标、运算符以及阈值;根据所述计划数据的投放位置、投放形式以及投放类型匹配相应的算子策略;其中,当所述计划数据匹配到多个算子策略时,选择优先级最高的算子策略进行匹配;
基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验,具体包括:基于所述计划数据匹配的计划指标策略中相应的算子策略,采用级联父id的递归方式对所有所述计划数据进行遍历;遍历过程中,将所述计划数据的归因指标与所述算子策略中的算子进行运算,当所述计划数据的归因指标触发所述算子策略中最后一层算子的阈值时,判断该计划数据为异常数据;
基于所述行为数据的影响因子构建行为预测模型,并利用所述行为预测模型对所述计划行为数据进行预测,具体包括:
设置动态达标线作为参考值,根据近n天的实际数据,采用动态达标线算法自动生成动态达标线,设账号投放天数D1、D2、D3、...DN;对应天数消耗为CD1,CD2,...CDN,余量D1R1、D1R2、...D1RN...D(N-2)R1、D(N-2)R2,该账号对应天数模型要求是MD1、MD2、...MDN,则第N天的达标roi为:
。
2.如权利要求1所述的信息投放数据的校验与预测方法,其特征在于,获取所述计划数据具体包括:
基于约定的API接口拉取所有投放平台中每个投放账号下的计划数据;
和/或,基于约定的API接口拉取所有投放平台中每个投放账号下的原始数据,并基于归因指标对所述原始数据进行归一化处理,以得到计划数据;
其中,部分原始数据通过爬虫从网页端进行爬取。
3.如权利要求2所述的信息投放数据的校验与预测方法,其特征在于,所述基于约定的API接口拉取所有投放平台中每个投放账号下的原始数据,具体包括:
设置定时调度任务,每x分钟拉取一次原始数据,并在当日对前一日的原始数据进行汇总;
在日志表中加入每个调度任务的调度记录,并设定定时轮询,当调度任务失败时,进行失败任务重试。
4.如权利要求1所述的信息投放数据的校验与预测方法,其特征在于,将所述计划数据的归因指标与所述算子策略中的算子进行运算,具体包括:
从所述算子策略的0层算子开始与所述计划数据的归因指标进行运算,运算结果返回布尔值;
当到达i层算子时,若所述i层算子与所述计划数据的归因指标的运算结果为真,则递归到下级i+1层算子与所述计划数据的归因指标进行运算;若运算结果为假,则循环同层i层算子与所述计划数据的归因指标进行运算。
5.如权利要求1所述的信息投放数据的校验与预测方法,其特征在于,基于所述行为数据的影响因子构建行为预测模型,具体包括:
对所述行为数据的影响因子进行叉乘组合得到历史行为数据,对所述历史行为数据进行函数拟合,以构建行为预测模型。
6.一种信息投放数据的校验与预测装置,其特征在于,所述装置包括:
获取模块,用于获取计划行为数据,所述计划行为数据包括用户的行为数据以及每个投放账号下的计划数据;其中,计划数据是指投放账号下广告计划的归因数据,包括激活成本、转化成本、关注率;用户的行为数据是指用户的订单行为、关注行为产生的数据;
校验模块,用于基于所述计划数据的投放信息维度,匹配该投放维度下的计划指标策略,并基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验;
预测模块,用于基于所述计划数据的投放信息维度,匹配该投放维度下的计划指标策略,具体包括:根据业务需求设定计划指标策略,所述计划指标策略包含多个算子策略,每个算子策略均包括同层并集算子和至少一个级联交集算子,每个算子均包括归因指标、运算符以及阈值;根据所述计划数据的投放位置、投放形式以及投放类型匹配相应的算子策略;其中,当所述计划数据匹配到多个算子策略时,选择优先级最高的算子策略进行匹配;
基于所述计划指标策略遍历所述计划数据,以对所述计划数据进行校验,具体包括:基于所述计划数据匹配的计划指标策略中相应的算子策略,采用级联父id的递归方式对所有所述计划数据进行遍历;遍历过程中,将所述计划数据的归因指标与所述算子策略中的算子进行运算,当所述计划数据的归因指标触发所述算子策略中最后一层算子的阈值时,判断该计划数据为异常数据;
基于所述行为数据的影响因子构建行为预测模型,并利用所述行为预测模型对所述计划行为数据进行预测,具体包括:
设置动态达标线作为参考值,根据近n天的实际数据,采用动态达标线算法自动生成动态达标线,设账号投放天数D1、D2、D3、...DN;对应天数消耗为CD1,CD2,...CDN,余量D1R1、D1R2、...D1RN...D(N-2)R1、D(N-2)R2,该账号对应天数模型要求是MD1、MD2、...MDN,则第N天的达标roi为:
。
7. 一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1至5中任一项所述的信息投放数据的校验与预测方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的信息投放数据的校验与预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211573811.1A CN115760218B (zh) | 2022-12-08 | 2022-12-08 | 信息投放数据的校验与预测方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211573811.1A CN115760218B (zh) | 2022-12-08 | 2022-12-08 | 信息投放数据的校验与预测方法及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115760218A CN115760218A (zh) | 2023-03-07 |
CN115760218B true CN115760218B (zh) | 2024-03-19 |
Family
ID=85344602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211573811.1A Active CN115760218B (zh) | 2022-12-08 | 2022-12-08 | 信息投放数据的校验与预测方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115760218B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110248246A (zh) * | 2019-05-14 | 2019-09-17 | 平安科技(深圳)有限公司 | 数据分析方法、装置、计算机设备及计算机可读存储介质 |
JP2020071815A (ja) * | 2018-11-02 | 2020-05-07 | 大日本印刷株式会社 | 広告管理装置、プログラム、広告配信システム及び広告管理方法 |
CN113626686A (zh) * | 2021-07-19 | 2021-11-09 | 上海泛宥信息科技有限公司 | 基于用户数据分析的自动推送方法、装置和计算机设备 |
WO2022127543A1 (zh) * | 2020-12-17 | 2022-06-23 | 百果园技术(新加坡)有限公司 | 广告信息处理方法、装置、设备和存储介质 |
CN115113528A (zh) * | 2022-07-06 | 2022-09-27 | 昆仑芯(北京)科技有限公司 | 神经网络模型的运行控制方法、装置、设备及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11640282B2 (en) * | 2019-10-24 | 2023-05-02 | Here Global B.V. | Method, apparatus, and system for providing a broker for data modeling and code generation |
-
2022
- 2022-12-08 CN CN202211573811.1A patent/CN115760218B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020071815A (ja) * | 2018-11-02 | 2020-05-07 | 大日本印刷株式会社 | 広告管理装置、プログラム、広告配信システム及び広告管理方法 |
CN110248246A (zh) * | 2019-05-14 | 2019-09-17 | 平安科技(深圳)有限公司 | 数据分析方法、装置、计算机设备及计算机可读存储介质 |
WO2022127543A1 (zh) * | 2020-12-17 | 2022-06-23 | 百果园技术(新加坡)有限公司 | 广告信息处理方法、装置、设备和存储介质 |
CN113626686A (zh) * | 2021-07-19 | 2021-11-09 | 上海泛宥信息科技有限公司 | 基于用户数据分析的自动推送方法、装置和计算机设备 |
CN115113528A (zh) * | 2022-07-06 | 2022-09-27 | 昆仑芯(北京)科技有限公司 | 神经网络模型的运行控制方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115760218A (zh) | 2023-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7191837B2 (ja) | 電力不正使用検出のための新しい非パラメトリック統計的挙動識別エコシステム | |
CN110826071B (zh) | 软件漏洞风险预测方法、装置、设备及存储介质 | |
US20160055079A1 (en) | Software application lifecycle management | |
US11513853B2 (en) | Shared resources control in a multi-tenant system | |
US11915248B2 (en) | Customer management system | |
EP2851857A1 (en) | Mobile application daily user engagement scores and user profiles | |
WO2014193399A1 (en) | Influence score of a brand | |
US11474818B2 (en) | Methods and systems for managing agile development | |
US11308964B2 (en) | Systems and methods for cooperatively-overlapped and artificial intelligence managed interfaces | |
US8331250B2 (en) | System and method for strategic network planning | |
US20140214632A1 (en) | Smart Crowd Sourcing On Product Classification | |
EP3815342B1 (en) | Adaptive user-interface assembling and rendering | |
US20230281678A1 (en) | Impact-based strength and weakness determination | |
US9588760B1 (en) | Software application development feature and defect selection | |
US10942980B2 (en) | Real-time matching of users and applications | |
US20200364646A1 (en) | Automated Assignment of Tasks Based on User Profile Data for Improved Efficiency | |
CN104408640A (zh) | 应用软件推荐方法及装置 | |
Pascual et al. | Channel coordination on fixed-term maintenance outsourcing contracts | |
KR102084389B1 (ko) | 기업평가방법 및 시스템 | |
WO2023154538A1 (en) | System and method for reducing system performance degradation due to excess traffic | |
US20090094328A1 (en) | System and Methods for Technology Evaluation and Adoption | |
US11188846B1 (en) | Determining a sequential order of types of events based on user actions associated with a third party system | |
US10621622B1 (en) | Adaptive sequencing of notifications in a client server architecture | |
CN115760218B (zh) | 信息投放数据的校验与预测方法及应用 | |
CN108139900B (zh) | 传送关于应用的更新的信息 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |