CN112529634A - 基于大数据的转化链路分析方法、系统和计算机设备 - Google Patents

基于大数据的转化链路分析方法、系统和计算机设备 Download PDF

Info

Publication number
CN112529634A
CN112529634A CN202011509255.2A CN202011509255A CN112529634A CN 112529634 A CN112529634 A CN 112529634A CN 202011509255 A CN202011509255 A CN 202011509255A CN 112529634 A CN112529634 A CN 112529634A
Authority
CN
China
Prior art keywords
contribution
link
conversion
data
attributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011509255.2A
Other languages
English (en)
Other versions
CN112529634B (zh
Inventor
顾佳璐
李扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enyike Beijing Data Technology Co ltd
Original Assignee
Enyike Beijing Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enyike Beijing Data Technology Co ltd filed Critical Enyike Beijing Data Technology Co ltd
Priority to CN202011509255.2A priority Critical patent/CN112529634B/zh
Publication of CN112529634A publication Critical patent/CN112529634A/zh
Application granted granted Critical
Publication of CN112529634B publication Critical patent/CN112529634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种基于大数据的转化链路分析方法、系统和计算机设备。其中,该方法包括:链路形成步骤,基于广告平台收集广告监测日志数据,并根据预设的待归因维度和待归因目标参数将所述广告监测日志数据转换为转化链路;贡献计算步骤,利用归因模型获取所述转化链路的各触点相应的权重,得到各触点在所有所述转化链路中的贡献次数和贡献度。通过构成转化链路,并对其进行分析,解决了转化效果不好的问题,实现了营销活动的后验效果分析,并为之后的营销活动计划提供决策依据。

Description

基于大数据的转化链路分析方法、系统和计算机设备
技术领域
本申请涉及大数据分析技术领域,特别是涉及基于大数据的转化链路分析方法、系统和计算机设备。
背景技术
在业界,不论广告客户大小,常常会听到品牌方抱怨,花费了大量预算,覆盖到用户的各个触点,但转化效果却迟迟不见显著提升。这个问题的产生并非品牌覆盖的面不够广,也不是触点的价值不足,而是由于用户时间的碎片化,触媒节点的离散化,使得在一个触点无序化的环境中,如果不能在无序中寻得有序的联动,只是分散的触达,而不是有节奏和周期的贯穿,就很难实现对营销目标群体的触动。
因此,品牌在营销过程中,不只是要考虑覆盖到多少目标用户,也需要思考,如何将纷杂的媒介触点形成串联,构建引导用户关注、参与、互动、转化的有序矩阵。品牌方在拥有一整套的营销产品的情况下,并不是应该多在几个资源位做投放,而是应该针对消费者浏览和决策链路的无序性特征,在不同的媒体触点上构建相应的一个不一样的营销系统,为品牌构建完整联动矩阵。
现有的链路分析数方案主要是呈现转化过程中的链路,但无法分析各个链路在转化中发挥的作用。现有技术包括如下:
Step1:后端提取一定时间范围内的营销活动监测日志;
Step2:后端提取日志中与某个触点关联的日志。计算日志数量(即曝光量),并将结果返回给前端;
Step3:前端展示各个触点曝光量。
但是上述技术方案具有以下缺点:
(1)分析维度单一:
(2)现有方案仅以单个广告活动为单位进行展示,无法支持交叉维度和多维度的分析,如某项目,对应转化链路为媒体1曝光,媒体二点击,……;而未引入媒体、广告形式、创意等维度的交叉,如某项目的媒体1的对应转化链路为媒体1曝光;
(3)未引入分析模型,分析支持不足:
(4)无法支持大数据分析:
现有方案仅单纯展示转化人群的广告监测日志数量,未引入任何分析模型,无法从中总结出更有价值的业务意义以指导后续的广告投放;在支持上万级的计算时便开始出现计算任务失败的情况,而现在普遍每天的广告监测日志数量为亿级,因此现有方案无法满足计算量需求。
针对现有技术中的无法进行有效分析的问题,尚未提出有效的技术方案。
发明内容
本申请实施例提供了一种基于大数据的转化链路分析方法、系统和计算机设备,通过将触点形成串联,并构成有序转化链路矩阵,通过对转化链路进行分析,以解决现有技术中分析不足的问题。
第一方面,本申请实施例提供了一种基于大数据的转化链路分析方法,包括以下步骤:
链路形成步骤,基于一广告平台收集广告监测日志数据,并根据预设的一待归因维度和一待归因目标参数将所述广告监测日志数据转换为转化链路;
贡献计算步骤,利用归因模型获取所述转化链路中各触点对应的权重,得到各触点在所有所述转化链路中的贡献次数和贡献度。
在其中一些实施例中,所述链路形成步骤具体包括:
异常数据处理步骤,根据一异常设备对所述广告监测日志数据进行过滤,去除其中的异常数据;
数据筛选步骤,根据预设的所述待归因维度、项目和待归因事件对过滤后的所述广告监测日志数据进行筛选,并将筛选后的所述广告监测日志数据与指定的一转化人群包做连接,获得对应的数据结构;
转化链路获取步骤,将所述数据结构根据所述转化人群的id和所述项目聚合,输出转化链路。
在其中一些实施例中,所述转化链路获取步骤具体包括:
将所述数据结构根据所述id和所述项目聚合,并根据所述待归因事件的时间排序,将所述数据结构中的所述待归因维度、所述待归因事件的类型和所述待归因事件合并,构成数据转化链路。
在其中一些实施例中,所述贡献计算步骤具体包括:
权重计算步骤,根据归因模型获取所述转化链路中各所述触点对应的所述权重,所述权重设置为所述触点在对应所述链路的单链路贡献度;
贡献次数和贡献度计算步骤,合并所述触点的各所述触点单链路贡献度,计算每个所述触点的贡献次数和触点总贡献值,并据此得到所述触点的贡献度。
在其中一些实施例中,所述贡献度的表达式为:
D=S/N
其中,S表示所述触点总贡献值,N表示整体贡献值,所述触点总贡献值为所述触点在各个所述转化链路中的所述触点单链路贡献度之和,所述整体贡献值为所述转化链路的个数。
第二方面,本申请实施例提供了一种基于大数据的营销转换链路分析系统,应用第一方面所述的基于大数据的转化链路分析方法,包括:
链路形成模块,基于一广告平台收集广告监测日志数据,并根据预设的一待归因维度和一待归因目标参数将所述广告监测日志数据转换为转化链路;
贡献计算模块,利用归因模型获取所述转化链路中各触点对应的权重,得到各触点在所有所述转化链路中的贡献次数和贡献度。
在其中一些实施例中,所述链路形成模块具体包括:
异常数据处理单元,根据一异常设备对所述广告监测日志数据进行过滤,去除其中的异常数据;
数据筛选单元,根据预设的所述待归因维度、项目和待归因事件,对过滤后的所述广告监测日志数据进行筛选,并将筛选后的所述广告监测日志数据与指定的转化人群包做连接,获得对应的数据结构;
转化链路获取单元,将所述数据结构根据所述转化人群的id和所述项目聚合,根据所述待归因事件的时间排序,将所述待归因维度、所述待归因事件的类型和所述待归因事件合并,输出转化链路。
在其中一些实施例中,所述贡献计算模块具体包括:
权重计算单元,根据归因模型获取各个所述转化链路中各所述触点对应的所述权重,所述权重设置为所述触点在对应所述链路的单链路贡献度;
贡献次数和贡献度计算单元,合并所述触点的各所述触点单链路贡献度,计算每个所述触点的贡献次数和触点总贡献值,并据此得到所述触点的贡献度。
在其中一些实施例中,所述贡献度的表达式为:
D=S/N
其中,S表示所述触点总贡献值,N表示整体贡献值,所述触点总贡献值为所述触点在各个所述转化链路中的所述触点单链路贡献度之和,所述整体贡献值为所述转化链路的个数。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的基于大数据的转化链路分析方法。
相比于相关技术,本申请实施例提供的基于大数据的转化链路分析方法方法。通过构成转化链路,并对其进行分析,解决了转化效果不好的问题,实现了营销活动的后验效果分析,并为之后的营销活动计划提供决策依据。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的基于大数据的转化链路分析方法的流程图;
图2是根据本申请实施例的链路形成步骤的流程图;
图3是根据本申请实施例的贡献计算步骤的流程图;
图4是根据本申请优选实施例的转化链路分析方法的流程图;
图5是根据本申请实施例的基于大数据的转化链路分析系统的结构框图;
图6为根据本申请实施例的计算机设备的硬件结构示意图。
附图说明:
1、链路形成模块;11、异常数据处理单元;
12、数据筛选单元;13、转化链路获取单元;
21、权重计算单元;22、贡献次数和贡献度计算单元;
81、处理器;82、存储器;83、通信接口;80、总线。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
以下为对本实施例中的相关名称进行解释:
广告监测日志,即各类广告监测工具从各个触点上收集到的广告曝光行为,主要信息包括项目ID、项目名称、广告点位ID、广告点位名称。
后验,指的是在广告活动结束之后进行的营销效果评估。
触点,即品牌、产品、服务等在各个方面各个环节与用户的接触点,本实施例中提到的触点皆为广告曝光的媒体触点。
转化,在本实施例中的转化不特指消费者的购买行为,用户仅需将符合业务需求的转化数据(通常是转化人群包)上传至系统进行计算即可,系统本身未添加任何判断逻辑。
本实施例提供了一种基于大数据的转化链路分析方法。转化链路分析就是针对消费者决策和转化链路的一种后验分析工具。图1是根据本申请实施例的基于大数据的转化链路分析方法的流程图,如图1所示,该流程包括如下步骤:
链路形成步骤S1,基于一广告平台收集广告监测日志数据,并根据预设的一待归因维度和一待归因目标参数将广告监测日志数据转换为转化链路;
贡献计算步骤S2,利用归因模型获取转化链路中各触点对应的权重,得到各触点在所有转化链路中的贡献次数和贡献度。
通过上述步骤,构成转化链路,并对其进行分析,解决了转化效果不好的问题,实现了营销活动的后验效果分析,并为之后的营销活动计划提供决策依据。
在实际的应用中,上述广告平台包括pc端和app端,广告监测日志数据包括手机设备号、行为发生时间戳、浏览器信息和设备信息等。在待归因维度包括媒体、广告形式、创意,即在结果中可呈现媒体链路、广告形式链路、创意链路。
图2是根据本申请实施例的链路形成步骤的流程图,如图2所示,在其中一些实施例中,链路形成步骤S1具体包括:
异常数据处理步骤S11,根据异常设备对广告监测日志数据进行过滤,去除其中的异常数据;
数据筛选步骤S12,根据预设的待归因维度、项目和待归因事件,对过滤后的广告监测日志数据进行筛选,并将筛选后的广告监测日志数据与指定的转化人群包做连接,获得对应的数据结构;
转化链路获取步骤S13,将数据结构根据转化人群的id和项目聚合,输出转化链路。
在实际的应用中,异常数据处理步骤中,首先获取异常的设备号,当数据对应的设备号存在异常或不合法时,对已有的广告监测日志数据进行过滤,避免影响归因结果的准确性,同时减少不必要的数据运算,增大数据的运算量。数据筛选步骤中,将筛选后的广告监测日志数据与指定的转化人群包做连接,过滤不存在的ID。
通过上述步骤,对所收集的广告监测日志数据进行异常数据处理和筛选,大大增加可以支持的数据计算量,因而可以支持现有方案不能实现的计算逻辑,提升分析的准确性和有效性;还加快了计算速度,提升后验分析的时效性。
需要说明的是,本实施例中的待归因参数设置为项目和待归因事件,但本发明并不以此为限。
在其中一些实施例中,转化链路获取步骤S13具体包括:
将数据结构根据id和项目聚合,并根据待归因事件的时间排序,将数据结构中的待归因维度、待归因事件及其待归因事件的时间合并,构成数据转化链路。
在实际的应用中,根据转化人群包的ID与项目聚合,并根据待归因事件的时间正序排序,将预设的待归因维度、待归因事件及其待归因事件的时间合并,获得单条转化链路,其他转化链路的数据处理方式同理。
图3是根据本申请实施例的贡献计算步骤的流程图,如图3所示,在其中一些实施例中,贡献计算步骤S2具体包括:
权重计算步骤S21,根据归因模型获取各个转化链路中各触点对应的权重,权重设置为触点在对应链路的单链路贡献度;
贡献次数和贡献度计算步骤S22,合并触点的各触点单链路贡献度,计算每个触点的贡献次数和触点总贡献值,并据此得到触点的贡献度。
在实际的应用中,利用归因模型计算各个触电相应的计算权重,归因模型可以采用线性归因、时间衰减、first click和last click。
在其中一些实施例中,贡献度的表达式为:
D=S/N
其中,S表示触点总贡献值,N表示整体贡献值,触点总贡献值为触点在各个转化链路中的触点单链路贡献度之和,整体贡献值为转化链路的个数。
下面通过优选实施例对本申请实施例进行描述和说明。
图4是根据本申请优选实施例的转化链路分析方法的流程图。
S401,设定以下待归因维度和待归因目标参数:
项目:AAA
待归因维度:媒体
待归因事件:曝光(imp),点击(clk)
媒体:优酷、今日头条、爱奇艺、腾讯
S402,数据载入
基于广告投放的PC、APP等应用收集广告监测日志数据,包括手机设备号,行为发生时间戳,浏览器信息,设备信息等数据,完成数据载入。
S403,数据清洗
利用异常设备号进行过滤,例如,当某一设备号的1日内曝光量大于200或1日内点击量大于50时,根据预设的规则判定该设备号不合法或异常,需要将其对应的数据进行过滤。
这样做的目的是将广告监测日志中的异常数据经行过滤,避免影响归因结果准确性。
S404,数据筛选
(1)根据指定的项目、媒体和待归因事件,对已经清洗好的广告监测日志数据进行筛选,
id 项目 媒体 事件 事件时间
1003 AAA 今日头条 曝光 1575640800
1003 AAA 爱奇艺 曝光 1575788100
1003 AAA 爱奇艺 点击 1575788340
1003 AAA 腾讯 曝光 1575885300
1003 AAA 腾讯 点击 1575885540
1004 ... ... ...
1005 ... ... ...
(2)将1)中筛选的结果和指定的转化人群包做join,过滤掉不存在的id
转化人群包数据结构:
ID 转化时间
1003 1575886545
过滤完数据结构:
id 项目 媒体 事件 事件时间 转化时间
1003 AAA 今日头条 曝光 1575640800 1575886545
1003 AAA 爱奇艺 曝光 1575788100 1575886545
1003 AAA 爱奇艺 点击 1575788340 1575886545
S405,数据预处理
将S404的筛选结果根据转化人群包的id和项目聚合,并根据事件时间正序排序,将媒体、事件类型和事件时间合并,处理成如下结构:
Figure BDA0002845872420000091
以上单条转化链路的数据预处理就完成了,其它转化链路的数据处理方式同理。
S406,基于归因模型计算各触点贡献次数和贡献度
引入归因模型用于在计算各个触点的贡献度时给予各个触点相应的计算权重。支持模型包括:线性归因模型、时间衰减模型、first click、last click,其中:
线性归因模型:对路径上的所有触点,分配相等的权重,即假设路径上触点数量为n,则每个触点获得(1/n)%的贡献。
时间衰减模型:这种模型基于指数衰减概念,触点距离转化的时间越近,对转化的影响越大,做出的贡献越多。公式如下:
Figure BDA0002845872420000092
first click:100%的贡献都属于产生第一次互动的触点。
last click:100%的贡献都属于最后一次互动的触点。
下面以线性归因模型为例,计算单条转化链路中各个触点的贡献度:
项目 贡献度
AAA 今日头条曝光:0.33,爱奇艺曝光:0.33,爱奇艺点击:0.33
假设最终一共有以下四条转化链路,每条转化链路各触点的贡献度计算结果如下:
Figure BDA0002845872420000101
合并上述同类项,计算每个触点的贡献次数和总贡献值,并将触点总贡献值除以整体贡献值计算贡献百分比。触点总贡献值为触点在各个链路中的权重之和,整体贡献值为链路个数。
计算结果如下:
项目 媒体 贡献次数 贡献百分比=触点总贡献值/整体贡献值
AAA 今日头条曝光 3 (0.33+0.25+0.5)/4=27.1%
AAA 今日头条点击 2 (0.25+0.5)/4=18.8%
AAA 爱奇艺曝光 2 (0.33+0.25)/4=14.6%
AAA 爱奇艺点击 1 (0.33)/4=8.3%
AAA 腾讯曝光 2 (0.5+0.25)/4=18.8%
AAA 腾讯点击 1 (0.5)/4=12.5%
至此各触点的贡献次数和贡献度计算完成。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种基于大数据的营销转换链路分析系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图5是根据本申请实施例的基于大数据的营销转换链路分析系统的结构框图,如图5所示,该装置包括:
链路形成模块1,基于广告平台收集广告监测日志数据,并根据预设的待归因维度和待归因目标参数将广告监测日志数据转换为转化链路;
贡献计算模块2,利用归因模型获取转化链路中各触点对应的权重,得到各触点在所有转化链路中的贡献次数和贡献度。
在实际应用中,广告平台包括pc端和app端,广告监测日志数据包括手机设备号、行为发生时间戳、浏览器信息和设备信息等。
在其中一些实施例中,链路形成模块1具体包括:
异常数据处理单元11,根据异常设备对广告监测日志数据进行过滤,去除其中的异常数据;
数据筛选单元12,根据预设的待归因维度、项目和待归因事件,对过滤后的广告监测日志数据进行筛选,并将筛选后的广告监测日志数据与指定的转化人群包做连接,获得对应的数据结构;
转化链路获取单元13,将数据结构根据转化人群的id和项目聚合,根据待归因事件的时间排序,将预设的待归因维度、待归因事件及其待归因事件的时间合并,输出转化链路。
在实际的应用中,首先获取异常的设备号,当数据对应的设备号存在异常或不合法时,对已有的数据进行过滤,避免影响归因结果的准确性,同时减少不必要的数据运算,增大数据的运算量,通过连接,过滤不存在的ID。
在其中一些实施例中,贡献计算模块2具体包括:
权重计算单元21,根据归因模型获取各个转化链路中各触点对应的权重,权重设置为触点在对应链路的单链路贡献度;
贡献次数和贡献度计算单元22,合并触点的各触点单链路贡献度,计算每个触点的贡献次数和触点总贡献值,并据此得到触点的贡献度。
上述归因模型包括线性归因模型、时间衰减模型、first click和lask click。
在其中一些实施例中,贡献度的表达式为:
D=S/N
其中,S表示触点总贡献值,N表示整体贡献值,触点总贡献值为触点在各个转化链路中的触点单链路贡献度之和,整体贡献值为转化链路的个数。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
另外,结合图1描述的本申请实施例转化链路分析方法可以由计算机设备来实现。图6为根据本申请实施例的计算机设备的硬件结构示意图。
计算机设备可以包括处理器81以及存储有计算机程序指令的存储器82。
具体地,上述处理器81可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器82可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器82可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器82可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器82可在数据处理装置的内部或外部。在特定实施例中,存储器82是非易失性(Non-Volatile)存储器。在特定实施例中,存储器82包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器82可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器81所执行的可能的计算机程序指令。
处理器81通过读取并执行存储器82中存储的计算机程序指令,以实现上述实施例中的任意一种转化链路分析方法。
在其中一些实施例中,计算机设备还可包括通信接口83和总线80。其中,如图6所示,处理器81、存储器82、通信接口83通过总线80连接并完成相互间的通信。
通信接口83用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信端口83还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理转化链路分析工作站等之间进行数据通信。
总线80包括硬件、软件或两者,将计算机设备的部件彼此耦接在一起。总线80包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(Control Bus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线80可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(Front Side Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线80可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该计算机设备可以基于获取到广告监测日志数据,执行本申请实施例中的链路形成步骤,从而实现结合图1描述的转化链路分析方法。
另外,结合上述实施例中的转化链路分析方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种转化链路分析方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于大数据的转化链路分析方法,其特征在于,包括以下步骤:
链路形成步骤,基于一广告平台收集广告监测日志数据,并根据预设的一待归因维度和一待归因目标参数将所述广告监测日志数据转换为转化链路;
贡献计算步骤,利用归因模型获取所述转化链路中各触点对应的权重,得到各所述触点在所有所述转化链路中的贡献次数和贡献度。
2.根据权利要求1所述的基于大数据的转化链路分析方法,其特征在于,所述链路形成步骤具体包括:
异常数据处理步骤,根据一异常设备对所述广告监测日志数据进行过滤,去除其中的异常数据;
数据筛选步骤,根据预设的所述待归因维度、项目和待归因事件对过滤后的所述广告监测日志数据进行筛选,并将筛选后的所述广告监测日志数据与指定的一转化人群包做连接,获得对应的数据结构;
转化链路获取步骤,将所述数据结构根据所述转化人群的id和所述项目聚合,输出转化链路。
3.根据权利要求2所述的基于大数据的转化链路分析方法,其特征在于,所述转化链路获取步骤具体包括:
将所述数据结构根据所述id和所述项目聚合,并根据所述待归因事件的时间排序,将所述数据结构中的所述待归因维度、所述待归因事件及其所述待归因事件的时间合并,构成数据转化链路。
4.根据权利要求1所述的基于大数据的转化链路分析方法,其特征在于,所述贡献计算步骤具体包括:
权重计算步骤,根据归因模型获取所述转化链路中各所述触点对应的所述权重,所述权重设置为所述触点在对应所述链路的单链路贡献度;
贡献次数和贡献度计算步骤,合并所述触点的各所述触点单链路贡献度,计算每个所述触点的贡献次数和触点总贡献值,并据此得到所述触点的贡献度。
5.根据权利要求4所述的基于大数据的转化链路分析方法,其特征在于,所述贡献度的表达式为:
D=S/N
其中,S表示所述触点总贡献值,N表示整体贡献值,所述触点总贡献值为所述触点在各个所述转化链路中的所述触点单链路贡献度之和,所述整体贡献值为所述转化链路的个数。
6.一种基于大数据的营销转换链路分析系统,应用上述权利要求1-5任意一项所述的基于大数据的转化链路分析方法,其特征在于,包括:
链路形成模块,基于一广告平台收集广告监测日志数据,并根据预设的一待归因维度和一待归因目标参数将所述广告监测日志数据转换为转化链路;
贡献计算模块,利用归因模型获取所述转化链路中各触点对应的权重,得到各触点在所有所述转化链路中的贡献次数和贡献度。
7.根据权利要求5所述的基于大数据的转化链路分析系统,其特征在于,所述链路形成模块具体包括:
异常数据处理单元,根据一异常设备对所述广告监测日志数据进行过滤,去除其中的异常数据;
数据筛选单元,根据预设的所述待归因维度、项目和待归因事件,对过滤后的所述广告监测日志数据进行筛选,并将筛选后的所述广告监测日志数据与指定的转化人群包做连接,获得对应的数据结构;
转化链路获取单元,将所述数据结构根据所述转化人群的id和所述项目聚合,根据所述待归因事件的时间排序,将所述待归因维度、所述待归因事件及其所述待归因事件的事件合并,输出转化链路。
8.根据权利要求5所述的基于大数据的转化链路分析系统,其特征在于,所述贡献计算模块具体包括:
权重计算单元,根据归因模型获取各个所述转化链路中各所述触点对应的所述权重,所述权重设置为所述触点在对应所述链路的单链路贡献度;
贡献次数和贡献度计算单元,合并所述触点的各所述触点单链路贡献度,计算每个所述触点的贡献次数和触点总贡献值,并据此得到所述触点的贡献度。
9.根据权利要求7所述的基于大数据的转化链路分析系统,其特征在于,所述贡献度的表达式为:
D=S/N
其中,S表示所述触点总贡献值,N表示整体贡献值,所述触点总贡献值为所述触点在各个所述转化链路中的所述触点单链路贡献度之和,所述整体贡献值为所述转化链路的个数。
10.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的基于大数据的转化链路分析方法。
CN202011509255.2A 2020-12-18 2020-12-18 基于大数据的转化链路分析方法、系统和计算机设备 Active CN112529634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011509255.2A CN112529634B (zh) 2020-12-18 2020-12-18 基于大数据的转化链路分析方法、系统和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011509255.2A CN112529634B (zh) 2020-12-18 2020-12-18 基于大数据的转化链路分析方法、系统和计算机设备

Publications (2)

Publication Number Publication Date
CN112529634A true CN112529634A (zh) 2021-03-19
CN112529634B CN112529634B (zh) 2024-08-13

Family

ID=75001553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011509255.2A Active CN112529634B (zh) 2020-12-18 2020-12-18 基于大数据的转化链路分析方法、系统和计算机设备

Country Status (1)

Country Link
CN (1) CN112529634B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113393270A (zh) * 2021-06-11 2021-09-14 上海明略人工智能(集团)有限公司 广告点位贡献值的确定方法和装置、电子设备和存储介质
CN113450146A (zh) * 2021-06-25 2021-09-28 上海明略人工智能(集团)有限公司 多触点广告归因方法、系统、计算机设备和可读存储介质
CN113570409A (zh) * 2021-07-19 2021-10-29 上海明略人工智能(集团)有限公司 转换事件权重值的确定方法、装置、存储介质和电子装置
WO2022245279A1 (zh) * 2021-05-21 2022-11-24 脸萌有限公司 特征构建方法、内容显示方法及相关装置

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663616A (zh) * 2012-03-19 2012-09-12 北京国双科技有限公司 一种基于多触点归因模型的网络广告效果衡量方法和系统
US20170091810A1 (en) * 2015-09-29 2017-03-30 Michael McGovern Brand engagement touchpoint attribution using brand engagement event weighting
CN107330725A (zh) * 2017-06-29 2017-11-07 北京酷云互动科技有限公司 广告价值评估方法、预算分配方法、投入评估方法及系统
CN107563781A (zh) * 2016-06-30 2018-01-09 阿里巴巴集团控股有限公司 一种信息投放效果归因方法及装置
CN107871249A (zh) * 2017-12-21 2018-04-03 四川坤翔科技有限公司 营销数据采集分发结算方法
US20180260715A1 (en) * 2017-03-09 2018-09-13 Adobe Systems Incorporated Determining algorithmic multi-channel media attribution based on discrete-time survival modeling
CN110020893A (zh) * 2019-04-03 2019-07-16 阿里巴巴集团控股有限公司 一种广告贡献度确定方法、装置及设备
CN110189153A (zh) * 2018-02-23 2019-08-30 北京国双科技有限公司 归因方法和装置
CN110189152A (zh) * 2018-02-23 2019-08-30 北京国双科技有限公司 渠道的归因方法和装置
CN110209919A (zh) * 2018-02-23 2019-09-06 北京国双科技有限公司 归因的多维度剖析方法和装置
CN110704751A (zh) * 2019-10-22 2020-01-17 北京字节跳动网络技术有限公司 数据处理方法、装置、电子设备及存储介质
CN110781605A (zh) * 2019-11-05 2020-02-11 恩亿科(北京)数据科技有限公司 广告投放模型测试方法、装置、计算机设备及存储介质
CN110807655A (zh) * 2019-10-15 2020-02-18 微梦创科网络科技(中国)有限公司 一种广告竞价方法、装置及设备
CN110827086A (zh) * 2019-11-07 2020-02-21 恩亿科(北京)数据科技有限公司 产品营销预测方法、装置、计算机设备及可读存储介质
CN111127051A (zh) * 2018-10-30 2020-05-08 百度在线网络技术(北京)有限公司 多渠道动态归因方法、装置、服务器及存储介质
CN111310061A (zh) * 2018-11-27 2020-06-19 百度在线网络技术(北京)有限公司 全链路多渠道归因方法、装置、服务器及存储介质
CN111612518A (zh) * 2020-04-11 2020-09-01 上海淇玥信息技术有限公司 基于用户同步的广告投放数据管理方法、平台及电子设备

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663616A (zh) * 2012-03-19 2012-09-12 北京国双科技有限公司 一种基于多触点归因模型的网络广告效果衡量方法和系统
US20150046249A1 (en) * 2012-03-19 2015-02-12 Beijing Gridsum Technology Co., Ltd. Method and system for measuring web advertising effect based on multiple-contact attribution model
US20170091810A1 (en) * 2015-09-29 2017-03-30 Michael McGovern Brand engagement touchpoint attribution using brand engagement event weighting
CN107563781A (zh) * 2016-06-30 2018-01-09 阿里巴巴集团控股有限公司 一种信息投放效果归因方法及装置
US20180260715A1 (en) * 2017-03-09 2018-09-13 Adobe Systems Incorporated Determining algorithmic multi-channel media attribution based on discrete-time survival modeling
CN107330725A (zh) * 2017-06-29 2017-11-07 北京酷云互动科技有限公司 广告价值评估方法、预算分配方法、投入评估方法及系统
CN107871249A (zh) * 2017-12-21 2018-04-03 四川坤翔科技有限公司 营销数据采集分发结算方法
CN110189153A (zh) * 2018-02-23 2019-08-30 北京国双科技有限公司 归因方法和装置
CN110189152A (zh) * 2018-02-23 2019-08-30 北京国双科技有限公司 渠道的归因方法和装置
CN110209919A (zh) * 2018-02-23 2019-09-06 北京国双科技有限公司 归因的多维度剖析方法和装置
CN111127051A (zh) * 2018-10-30 2020-05-08 百度在线网络技术(北京)有限公司 多渠道动态归因方法、装置、服务器及存储介质
CN111310061A (zh) * 2018-11-27 2020-06-19 百度在线网络技术(北京)有限公司 全链路多渠道归因方法、装置、服务器及存储介质
CN110020893A (zh) * 2019-04-03 2019-07-16 阿里巴巴集团控股有限公司 一种广告贡献度确定方法、装置及设备
CN110807655A (zh) * 2019-10-15 2020-02-18 微梦创科网络科技(中国)有限公司 一种广告竞价方法、装置及设备
CN110704751A (zh) * 2019-10-22 2020-01-17 北京字节跳动网络技术有限公司 数据处理方法、装置、电子设备及存储介质
CN110781605A (zh) * 2019-11-05 2020-02-11 恩亿科(北京)数据科技有限公司 广告投放模型测试方法、装置、计算机设备及存储介质
CN110827086A (zh) * 2019-11-07 2020-02-21 恩亿科(北京)数据科技有限公司 产品营销预测方法、装置、计算机设备及可读存储介质
CN111612518A (zh) * 2020-04-11 2020-09-01 上海淇玥信息技术有限公司 基于用户同步的广告投放数据管理方法、平台及电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NISAR TM等: "attribution modeling in digital advertising an empirical investigation of the impact of digital sales channels", JOURNAL OF ADVERTISING RESEARCH, vol. 58, no. 04, 21 December 2018 (2018-12-21), pages 399 - 413 *
欧阳辰: "互联网广告的归因分析", Retrieved from the Internet <URL:www.51cto.com/article/525142.html> *
潘瑞平: "基于多点归因模型的广告营销数据的分析", 中国优秀硕士学位论文全文数据库 经济与管理科学辑, no. 03, 15 March 2017 (2017-03-15), pages 157 - 85 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022245279A1 (zh) * 2021-05-21 2022-11-24 脸萌有限公司 特征构建方法、内容显示方法及相关装置
CN113393270A (zh) * 2021-06-11 2021-09-14 上海明略人工智能(集团)有限公司 广告点位贡献值的确定方法和装置、电子设备和存储介质
CN113393270B (zh) * 2021-06-11 2024-04-09 上海明略人工智能(集团)有限公司 广告点位贡献值的确定方法和装置、电子设备和存储介质
CN113450146A (zh) * 2021-06-25 2021-09-28 上海明略人工智能(集团)有限公司 多触点广告归因方法、系统、计算机设备和可读存储介质
CN113450146B (zh) * 2021-06-25 2024-02-02 上海明略人工智能(集团)有限公司 多触点广告归因方法、系统、计算机设备和可读存储介质
CN113570409A (zh) * 2021-07-19 2021-10-29 上海明略人工智能(集团)有限公司 转换事件权重值的确定方法、装置、存储介质和电子装置
CN113570409B (zh) * 2021-07-19 2024-03-26 上海明略人工智能(集团)有限公司 转换事件权重值的确定方法、装置、存储介质和电子装置

Also Published As

Publication number Publication date
CN112529634B (zh) 2024-08-13

Similar Documents

Publication Publication Date Title
CN112529634A (zh) 基于大数据的转化链路分析方法、系统和计算机设备
US10796316B2 (en) Method and system for identifying fraudulent publisher networks
CN108733706B (zh) 热度信息的生成方法和装置
CN101192227B (zh) 一种基于分布式计算网络的日志文件分析方法和系统
CN105427129B (zh) 一种信息的投放方法及系统
CN103886068B (zh) 用于互联网用户行为分析的数据处理方法和装置
Pal et al. Centrality measures, upper bound, and influence maximization in large scale directed social networks
CN109241427A (zh) 信息推送方法、装置、计算机设备和存储介质
US20150149383A1 (en) Method and device for acquiring product information, and computer storage medium
CN108334641B (zh) 采集用户行为数据的方法、系统、电子设备、存储介质
CN105160027B (zh) 广告数据处理方法及装置
US10558706B2 (en) Method and system for determining user interests based on a correspondence graph
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
CN111340062A (zh) 一种映射关系确定方法及装置
CN106201890A (zh) 一种应用的性能优化方法及服务器
CN106802904A (zh) 日志处理方法、装置及系统
CN107222410B (zh) 链接预测的方法、装置、终端及计算机可读存储介质
CN111324725B (zh) 一种话题获取方法、终端、计算机可读存储介质
CN111104384A (zh) 数据预处理方法、装置、设备和存储介质
CN110020166A (zh) 一种数据分析方法及相关设备
CN113869920A (zh) 一种商机阶段划分方法、系统、计算机设备和存储介质
CN106126538A (zh) 页面的转化处理方法及装置
CN110020364B (zh) 确定页面访问的流量来源的方法和装置
CN111882360A (zh) 一种用户群拓展方法和装置
CN111125536A (zh) 信息推送方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant