CN110209919B - 归因的多维度剖析方法和装置 - Google Patents

归因的多维度剖析方法和装置 Download PDF

Info

Publication number
CN110209919B
CN110209919B CN201810155686.XA CN201810155686A CN110209919B CN 110209919 B CN110209919 B CN 110209919B CN 201810155686 A CN201810155686 A CN 201810155686A CN 110209919 B CN110209919 B CN 110209919B
Authority
CN
China
Prior art keywords
target session
target
conversion
session
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810155686.XA
Other languages
English (en)
Other versions
CN110209919A (zh
Inventor
洪超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201810155686.XA priority Critical patent/CN110209919B/zh
Publication of CN110209919A publication Critical patent/CN110209919A/zh
Application granted granted Critical
Publication of CN110209919B publication Critical patent/CN110209919B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种归因的多维度剖析方法和装置。该方法包括:采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。通过本申请,解决了相关技术中在归因过程中无法多维度剖析的问题。

Description

归因的多维度剖析方法和装置
技术领域
本申请涉及互联网数据分析领域,具体而言,涉及一种归因的多维度剖析方法和装置。
背景技术
目前市面上的归因大致分两类,一是传统归因,基于打分制,对用户访问链上的各节点渠道进行打分的归因方法,一是数据归因,以图归因等为代表,这两类归因方法均是预先计算好,并把结果存储起来,查询时再调用存储结果,不支持实时现算查询,且归因维度较单一,也无法在查询的过程中动态调整回溯时长、转化时间段、转化选择、归因维度、归因过滤条件等归因参数,反馈机制不够灵活,反馈出来的归因结果较为单一,指导价值有所欠缺。
针对相关技术中在归因过程中无法多维度剖析的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种归因的多维度剖析方法和装置,以解决相关技术中在归因过程中无法多维度剖析的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种归因的多维度剖析方法。该方法包括:采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。
进一步地,过滤条件包括:第一条件和第二条件,在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合包括:在历史数据集合中筛选符合第一条件的目标会话数据,其中,第一条件至少包括转化属性;在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合,其中,第二条件至少包括回溯时长。
进一步地,在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合包括:按照每个用户ID在不同渠道之间的目标会话时间的顺序生成会话序列号;在回溯时长内,基于会话序列号生成每个用户ID下的目标会话链,其中,在每个用户ID下,将目标会话时间排在首位的目标会话作为初始会话,将目标会话时间排在末尾的目标会话作为结尾会话,在初始会话和结尾会话之间按会话序列号对应的目标会话生成目标会话链;将所有用户ID下的目标会话链构成目标数据集合。
进一步地,对目标会话数据集合执行归因维度剖析包括:基于目标会话数据集合计算各个归因维度下的转化总价值,其中,转化总价值由各个归因维度下的转化数量和转化价值构成;获取渠道归因规则;按照渠道归因规则将各个归因维度下的转化总价值归因至各个渠道。
进一步地,基于目标会话数据集合计算各个归因维度下的转化总价值包括:统计各个归因维度下每种转化类型对应的转化数量;获取各个归因维度下每种转化类型对应的转化价值;基于每种转化类型对应的转化数量和每种转化类型对应的转化价值,计算各个归因维度下的转化总价值。
为了实现上述目的,根据本申请的另一方面,提供了一种归因的多维度剖析装置。该装置包括:采集单元,用于采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;过滤单元,用于在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;剖析单元,用于对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。
进一步地,过滤条件包括:第一条件和第二条件,过滤单元包括:第一筛选模块,用于在历史数据集合中筛选符合第一条件的目标会话数据,其中,第一条件至少包括转化属性;第二筛选模块,用于在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合,其中,第二条件至少包括回溯时长。
进一步地,第二筛选模块包括:会话序列号生成子模块,用于按照每个用户ID在不同渠道之间的目标会话时间的顺序生成会话序列号;目标会话链生成子模块,用于在回溯时长内,基于会话序列号生成每个用户ID下的目标会话链,其中,在每个用户ID下,将目标会话时间排在首位的目标会话作为初始会话,将目标会话时间排在末尾的目标会话作为结尾会话,在初始会话和结尾会话之间按会话序列号对应的目标会话生成目标会话链;目标数据集合生成子模块,用于将所有用户ID下的目标会话链构成目标数据集合。
为了实现上述目的,根据本申请的另一方面,提供了一种存储介质,存储介质包括存储的程序,其中,程序执行上述任意一项一种归因的多维度剖析方法。
为了实现上述目的,根据本申请的另一方面,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述任意一项一种归因的多维度剖析方法。
通过本申请,采用以下步骤:采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。解决了相关技术中在归因过程中无法多维度剖析的问题。通过对历史数据集合的过滤,并对过滤后的目标会话数据集合执行归因维度剖析,进而达到了在归因过程中实时进行多维度剖析的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的归因的多维度剖析方法的流程图;以及
图2是根据本申请实施例提供的归因的多维度剖析装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
SQL:是指结构化查询语言(Structured Query Language),它是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统;结构化查询语言允许用户在高层数据结构上工作,它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,可以使用相同的结构化查询语言作为数据输入与管理的接口。
下面结合优选的实施步骤对本发明进行说明,图1是根据本发明实施例的归因的多维度剖析方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;
应用中,目标会话可以为用户浏览某个目标推广信息的行为产生的会话;用户属性可以包括用户ID、用户的性别、用户的年龄段等信息;转化属性可以包括转化类型、转化时间、转化价值等。预设指标可以根据用户的分析需求实际设定,例如,商家在多个浏览器均投放了A品牌服装的广告,想要对用户浏览A品牌服装的广告后下订单购买该品牌服装的行为这个指标进行评估,该品牌服装包括衬衫、西装、风衣、羊毛衫等,则此时目标会话指的是用户浏览A品牌服装的广告的行为产生的会话;预设指标为用户浏览A品牌服装的广告后下订单购买该品牌服装的行为,转化类型包括看了A品牌广告后购买的A品牌服装旗下的衬衫、西装、风衣、羊毛衫等类型,转化价值则为A品牌服装旗下的衬衫、西装、风衣、羊毛衫等的价格;若预设时间段为12个月,则采集12个月内用户通过多个浏览器访问A品牌服装广告的行为构成的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据包括用户ID,用户通过各个浏览器浏览A品牌服装的广告的时间,即目标会话时间,用户浏览A品牌服装的广告后下订单购买该品牌服装的行为,即预设指标,用户浏览A品牌服装的广告后下订单购买该品牌服装的行为的产生时间,即转化时间,用户浏览A品牌服装的广告后下订单购买了该品牌下的不同类型的服装,即转化类型,A品牌下不同类型的服装的价格,即转化价值。
步骤S102,在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;
例如,设定过滤条件转化类型,转化类型为用户访问A品牌服装广告后购买了A品牌的衬衫,在历史数据集合中筛选出用户浏览A品牌服装的广告后购买了A品牌的衬衫的行为构成的目标会话数据。
步骤S103,对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。
剖析条件可以根据用户需求来具体设定,例如,根据用户的属性来定,用户属性包括用户的性别、用户的年龄段等信息,若目标会话数据集合为用户浏览A品牌服装的广告后购买了A品牌的衬衫的行为构成的目标会话数据,归因维度为用户年龄段,针对用户浏览A品牌服装的广告后购买了A品牌的衬衫的行为构成的目标会话数据,剖析A品牌的衬衫的受众群体,从而调整投广告放渠道,调整A品牌的衬衫的生产量。
可选地,在本申请实施例提供的归因的多维度剖析方法中,过滤条件包括:第一条件和第二条件,在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合包括:在历史数据集合中筛选符合第一条件的目标会话数据,其中,第一条件至少包括转化属性;在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合,其中,第二条件至少包括回溯时长。
例如,第一条件为转化类型,转化类型为用户浏览A品牌服装的广告后购买了A品牌的衬衫,根据12个月内各个用户通过各个浏览器访问A品牌服装的广告的历史数据集合,筛选出用户浏览A品牌服装的广告后购买了A品牌的衬衫的行为构成的目标会话数据;第二条件为回溯时长,回溯时长为过去一个季度,筛选出过去一个季度内用户浏览A品牌服装的广告后购买了A品牌的衬衫的行为构成的目标会话数据,构成目标会话数据集合。
可选地,在本申请实施例提供的归因的多维度剖析方法中,在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合包括:按照每个用户ID在不同渠道之间的目标会话时间的顺序生成会话序列号;在回溯时长内,基于会话序列号生成每个用户ID下的目标会话链,其中,在每个用户ID下,将目标会话时间排在首位的目标会话作为初始会话,将目标会话时间排在末尾的目标会话作为结尾会话,在初始会话和结尾会话之间按会话序列号对应的目标会话生成目标会话链;将所有用户ID下的目标会话链构成目标数据集合。
例如,由于每个用户可能通过一个渠道访问A品牌服装的广告后,又跳转其他渠道访问该品牌服装广告,经过多次跳转,最后下订单购买了该品牌服装,用户按时间顺序在不同渠道之间跳转浏览A品牌服装广告的行为构成访问序列号。
假设商家在第一浏览器,第二浏览器和第三浏览器均投放了A品牌服装的广告,用户ID为00的用户通过第一浏览器访问A品牌服装的广告后,又跳转第二浏览器访问该品牌服装的广告,又跳转第一浏览器访问该品牌服装的广告,最后跳转到第三浏览器浏览广告并下订单购买了该品牌的衬衫,例如,按从小到大的时间顺序,为用户首次通过第一浏览器访问A品牌服装的广告的行为设定会话序列号为“00-01”,为用户随后通过第二浏览器访问A品牌服装的广告的行为设定会话序列号为“00-02”,为用户再次通过第一浏览器访问A品牌服装的广告的行为设定会话序列号为“00-03”,为用户通过第三浏览器访问A品牌服装的广告的行为设定会话序列号为“00-04”;若在3个月的回溯时长内,按用户ID为00的用户筛选出的会话序列号为“00-02”,“00-03”,“00-04”,将会话序列号为“00-02”的目标会话设定为初始会话,将会话序列号为“00-04”的目标会话设定为结尾会话,即在回溯时长内用户ID为00的用户按照序列号对应的目标会话生成的目标会话链为:先通过第二浏览器访问该品牌服装的广告,又跳转到第一浏览器访问该品牌服装的广告,最后跳转到第三浏览器浏览广告并下订单购买了该品牌衬衫的行为。将所有用户ID下的目标会话链构成目标数据集合。
可选地,在本申请实施例提供的归因的多维度剖析方法中,对目标会话数据集合执行归因维度剖析包括:基于目标会话数据集合计算各个归因维度下的转化总价值,其中,转化总价值由各个归因维度下的转化数量和转化价值构成;获取渠道归因规则;按照渠道归因规则将各个归因维度下的转化总价值归因至各个渠道。
应用中,转化数量可以为用户访问某个目标推广信息后转化为预设操作行为的数量,例如,归因维度为年龄段在25到35岁的男性用户,用户通过各个浏览器浏览A品牌服装广告后购买了A品牌衬衫的,基于目标会话数据集合计算年龄段在25到35岁的男性用户通过各个浏览器浏览A品牌服装广告后购买了A品牌衬衫产生的销售量,即为转化数量,不同款型的A品牌衬衫的价格为转化价值,年龄段在25到35岁的男性用户通过各个浏览器浏览A品牌服装广告后购买了A品牌衬衫产生的销售额的总和,即为在“年龄段在25到35岁的男性用户”这一归因维度下的转化总价值;若渠道归因规则为平均分配,则将总销售额均分到各个浏览器,作为每个浏览器的转化贡献度;若渠道归因规则为归功为首次访问的浏览器,则将总销售额均分到回溯时长内的最小序列号对应的浏览器,作为该浏览器的转化贡献度;若渠道归因规则为归功为产生转化的浏览器,则将总销售额均分到回溯时长内的最大序列号对应的浏览器,作为该浏览器的转化贡献度。在相同的渠道归因规则下,分析不同归因维度下各个渠道对转化总价值的贡献。
可选地,在本申请实施例提供的归因的多维度剖析方法中,基于目标会话数据集合计算各个归因维度下的转化总价值包括:统计各个归因维度下每种转化类型对应的转化数量;获取各个归因维度下每种转化类型对应的转化价值;基于每种转化类型对应的转化数量和每种转化类型对应的转化价值,计算各个归因维度下的转化总价值。
例如,归因维度为年龄段在25到35岁的男性用户,目标会话数据集合为通过各个浏览器浏览A品牌服装广告后购买了A品牌衬衫的行为,A品牌衬衫有A1、A2、A3三种款式,每种款式的价格不同,统计年龄段在25到35岁的男性用户购买A1、A2、A3三种款式的衬衫的数量分别为a件、b件、c件,A1、A2、A3三种款式的衬衫的价格分别为100元、150元、200元,即A1、A2、A3三种款式的衬衫的转化价值分别为100元、150元、200元,则100a、150b和200c的总和即为年龄段在25到35岁的男性用户通过第一浏览器、第二浏览器和第三浏览器浏览A品牌服装广告后购买了A品牌衬衫后产生的转化总价值。
本申请实施例提供的归因的多维度剖析方法,通过采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。解决了相关技术中在归因过程中无法多维度剖析的问题。通过对历史数据集合的过滤,并对过滤后的目标会话数据集合执行归因维度剖析,进而达到了在归因过程中实时进行多维度剖析的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种归因的多维度剖析装置,需要说明的是,本申请实施例的归因的多维度剖析装置可以用于执行本申请实施例所提供的用于归因的多维度剖析方法。以下对本申请实施例提供的归因的多维度剖析装置进行介绍。
图2是根据本申请实施例的归因的多维度剖析装置的示意图。如图2所示,该装置包括:采集单元10,过滤单元20,剖析单元30:
采集单元10,用于采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;
过滤单元20,用于在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;
剖析单元30,用于对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。
可选地,在本申请实施例提供的归因的多维度剖析装置中,过滤条件包括:第一条件和第二条件,过滤单元20包括:第一筛选模块,用于在历史数据集合中筛选符合第一条件的目标会话数据,其中,第一条件至少包括转化属性;第二筛选模块,用于在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合,其中,第二条件至少包括回溯时长。
可选地,在本申请实施例提供的归因的多维度剖析装置中,第二筛选模块包括:会话序列号生成子模块,用于按照每个用户ID在不同渠道之间的目标会话时间的顺序生成会话序列号;目标会话链生成子模块,用于在回溯时长内,基于会话序列号生成每个用户ID下的目标会话链,其中,在每个用户ID下,将目标会话时间排在首位的目标会话作为初始会话,将目标会话时间排在末尾的目标会话作为结尾会话,在初始会话和结尾会话之间按会话序列号对应的目标会话生成目标会话链;目标数据集合生成子模块,用于将所有用户ID下的目标会话链构成目标数据集合。
可选地,在本申请实施例提供的归因的多维度剖析装置中,剖析单元30包括:计算模块,用于基于目标会话数据集合计算各个归因维度下的转化总价值,其中,转化总价值由各个归因维度下的转化数量和转化价值构成;获取模块,用于获取渠道归因规则;归因模块,用于按照渠道归因规则将各个归因维度下的转化总价值归因至各个渠道。
可选地,在本申请实施例提供的归因的多维度剖析装置中,计算模块包括:统计子模块,用于统计各个归因维度下每种转化类型对应的转化数量;获取子模块,用于获取各个归因维度下每种转化类型对应的转化价值;计算子模块,用于基于每种转化类型对应的转化数量和每种转化类型对应的转化价值,计算各个归因维度下的转化总价值。
本申请实施例提供的归因的多维度剖析装置,通过采集单元10,采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;过滤单元20,在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;剖析单元30,对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件,解决了相关技术中在归因过程中无法多维度剖析的问题,通过对历史数据集合的过滤,并对过滤后的目标会话数据集合执行归因维度剖析,进而达到了在归因过程中实时进行多维度剖析的效果。
所述归因的多维度剖析装置包括处理器和存储器,上述采集单元10,过滤单元20,剖析单元30等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来在归因过程中无法多维度剖析。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述归因的多维度剖析方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述归因的多维度剖析方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。
过滤条件包括:第一条件和第二条件,在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合包括:在历史数据集合中筛选符合第一条件的目标会话数据,其中,第一条件至少包括所述转化属性;在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合,其中,第二条件至少包括回溯时长。
在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合包括:按照每个用户ID在不同渠道之间的目标会话时间的顺序生成会话序列号;在回溯时长内,基于会话序列号生成每个用户ID下的目标会话链,其中,在每个用户ID下,将目标会话时间排在首位的目标会话作为初始会话,将目标会话时间排在末尾的目标会话作为结尾会话,在初始会话和结尾会话之间按会话序列号对应的目标会话生成目标会话链;将所有用户ID下的目标会话链构成目标数据集合。
对目标会话数据集合执行归因维度剖析包括:基于目标会话数据集合计算各个归因维度下的转化总价值,其中,转化总价值由各个归因维度下的转化数量和转化价值构成;获取渠道归因规则;按照渠道归因规则将各个归因维度下的转化总价值归因至各个渠道。
基于目标会话数据集合计算各个归因维度下的转化总价值包括:统计各个归因维度下每种转化类型对应的转化数量;获取各个归因维度下每种转化类型对应的转化价值;基于每种转化类型对应的转化数量和每种转化类型对应的转化价值,计算各个归因维度下的转化总价值。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,历史数据集合中包括至少一条目标会话数据,每条目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,转化属性是指目标会话转化为预设指标的属性;在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;对目标会话数据集合执行归因维度剖析,其中,归因维度为目标会话数据的剖析条件。
过滤条件包括:第一条件和第二条件,在历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合包括:在历史数据集合中筛选符合第一条件的目标会话数据,其中,第一条件至少包括转化属性;在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合,其中,第二条件至少包括回溯时长。
在符合第一条件的目标会话数据中筛选符合第二条件的目标会话数据,得到目标会话数据集合包括:按照每个用户ID在不同渠道之间的目标会话时间的顺序生成会话序列号;在回溯时长内,基于会话序列号生成每个用户ID下的目标会话链,其中,在每个用户ID下,将目标会话时间排在首位的目标会话作为初始会话,将目标会话时间排在末尾的目标会话作为结尾会话,在初始会话和结尾会话之间按会话序列号对应的目标会话生成目标会话链;将所有用户ID下的目标会话链构成目标数据集合。
对目标会话数据集合执行归因维度剖析包括:基于目标会话数据集合计算各个归因维度下的转化总价值,其中,转化总价值由各个归因维度下的转化数量和转化价值构成;获取渠道归因规则;按照渠道归因规则将各个归因维度下的转化总价值归因至各个渠道。
基于目标会话数据集合计算各个归因维度下的转化总价值包括:统计各个归因维度下每种转化类型对应的转化数量;获取各个归因维度下每种转化类型对应的转化价值;基于每种转化类型对应的转化数量和每种转化类型对应的转化价值,计算各个归因维度下的转化总价值。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (4)

1.一种归因的多维度剖析方法,其特征在于,包括:
采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,所述历史数据集合中包括至少一条目标会话数据,每条所述目标会话数据中至少包括用户属性,目标会话时间和转化属性,其中,所述转化属性是指所述目标会话转化为预设指标的属性;
在所述历史数据集合中筛选符合过滤条件的会话数据,得到目标会话数据集合;
对所述目标会话数据集合执行归因维度剖析,其中,所述归因维度为所述目标会话数据的剖析条件;
其中,所述转化属性至少包括转化时间,转化类型和转化价值,其中,所述转化时间是指所述目标会话转化为预设指标的时间,所述转化类型为所述预设指标的类型,所述转化价值为不同类型的所述预设指标的预设价值,对所述目标会话数据集合执行归因维度剖析包括:
基于所述目标会话数据集合计算各个归因维度下的转化总价值,其中,所述转化总价值由各个归因维度下的转化数量和所述转化价值构成;
获取渠道归因规则;
按照所述渠道归因规则将各个归因维度下的所述转化总价值归因至各个渠道;
其中,基于所述目标会话数据集合计算各个归因维度下的转化总价值包括:
统计各个归因维度下每种转化类型对应的转化数量;
获取各个归因维度下每种转化类型对应的转化价值;
基于每种转化类型对应的转化数量和每种转化类型对应的转化价值,计算各个归因维度下的转化总价值;
其中,所述过滤条件包括:第一条件和第二条件,在所述历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合包括:
在所述历史数据集合中筛选符合所述第一条件的目标会话数据,其中,所述第一条件至少包括所述转化属性;
在符合所述第一条件的所述目标会话数据中筛选符合所述第二条件的目标会话数据,得到所述目标会话数据集合,其中,所述第二条件至少包括回溯时长;
其中,所述用户属性包括用户ID,在符合所述第一条件的所述目标会话数据中筛选符合所述第二条件的目标会话数据,得到所述目标会话数据集合包括:
按照每个所述用户ID在不同渠道之间的所述目标会话时间的顺序生成会话序列号;
在所述回溯时长内,基于所述目标会话序列号生成每个所述用户ID下的目标会话链,其中,在每个所述用户ID下,将目标会话时间排在首位的目标会话作为初始会话,将目标会话时间排在末尾的目标会话作为结尾会话,在所述初始会话和所述结尾会话之间按所述会话序列号对应的目标会话生成所述目标会话链;
将所有所述用户ID下的目标会话链构成目标数据集合。
2.一种归因的多维度剖析装置,其特征在于,包括:
采集单元,用于采集预设时间段内通过多个渠道进行目标会话的历史数据集合,其中,所述历史数据集合中包括至少一条目标会话数据,每条所述目标会话数据中至少包括用户属性,目标会话时间,转化属性,其中,所述转化属性是指所述目标会话转化为预设指标的属性;
过滤单元,用于在所述历史数据集合中筛选符合过滤条件的目标会话数据,得到目标会话数据集合;
剖析单元,用于对所述目标会话数据集合执行归因维度剖析,其中,所述归因维度为所述目标会话数据的剖析条件;
其中,剖析单元包括:计算模块,用于基于目标会话数据集合计算各个归因维度下的转化总价值,其中,转化总价值由各个归因维度下的转化数量和转化价值构成;获取模块,用于获取渠道归因规则;归因模块,用于按照渠道归因规则将各个归因维度下的转化总价值归因至各个渠道;
其中,所述计算模块包括:统计子模块,用于统计各个归因维度下每种转化类型对应的转化数量;获取子模块,用于获取各个归因维度下每种转化类型对应的转化价值;计算子模块,用于基于每种转化类型对应的转化数量和每种转化类型对应的转化价值,计算各个归因维度下的转化总价值;
其中,所述过滤条件包括:第一条件和第二条件,所述过滤单元包括:
第一筛选模块,用于在所述历史数据集合中筛选符合所述第一条件的目标会话数据,其中,所述第一条件至少包括所述转化属性;
第二筛选模块,用于在符合所述第一条件的所述目标会话数据中筛选符合所述第二条件的目标会话数据,得到所述目标会话数据集合,其中,所述第二条件至少包括回溯时长;
其中,所述用户属性包括用户ID,所述第二筛选模块包括:
会话序列号生成子模块,用于按照每个所述用户ID在不同渠道之间的所述目标会话时间的顺序生成会话序列号;
目标会话链生成子模块,用于在所述回溯时长内,基于所述会话序列号生成每个所述用户ID下的目标会话链,其中,在每个所述用户ID下,将目标会话时间排在首位的目标会话作为初始会话,将目标会话时间排在末尾的目标会话作为结尾会话,在所述初始会话和所述结尾会话之间按所述会话序列号对应的目标会话生成所述目标会话链;
目标数据集合生成子模块,用于将所有所述用户ID下的目标会话链构成目标数据集合。
3.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1中所述的一种归因的多维度剖析方法。
4.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1中所述的一种归因的多维度剖析方法。
CN201810155686.XA 2018-02-23 2018-02-23 归因的多维度剖析方法和装置 Active CN110209919B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810155686.XA CN110209919B (zh) 2018-02-23 2018-02-23 归因的多维度剖析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810155686.XA CN110209919B (zh) 2018-02-23 2018-02-23 归因的多维度剖析方法和装置

Publications (2)

Publication Number Publication Date
CN110209919A CN110209919A (zh) 2019-09-06
CN110209919B true CN110209919B (zh) 2022-05-27

Family

ID=67778961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810155686.XA Active CN110209919B (zh) 2018-02-23 2018-02-23 归因的多维度剖析方法和装置

Country Status (1)

Country Link
CN (1) CN110209919B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579880A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 数据分析方法、装置、存储介质及电子设备
CN113177174B (zh) * 2021-05-21 2024-02-06 脸萌有限公司 特征构建方法、内容显示方法及相关装置
CN113434153B (zh) * 2021-06-04 2023-03-21 郑州阿帕斯数云信息科技有限公司 一种应用安装的归因方法和装置
CN115392799B (zh) * 2022-10-27 2023-04-11 平安科技(深圳)有限公司 归因分析方法、装置、计算机设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663616A (zh) * 2012-03-19 2012-09-12 北京国双科技有限公司 一种基于多触点归因模型的网络广告效果衡量方法和系统
CN104574005B (zh) * 2015-02-15 2018-03-16 蔡耿新 集增强现实、体感、抠绿技术的广告展示管理系统和方法
CN106327227A (zh) * 2015-06-19 2017-01-11 北京航天在线网络科技有限公司 一种信息推荐系统及信息推荐方法
CN107563781B (zh) * 2016-06-30 2020-12-04 阿里巴巴集团控股有限公司 一种信息投放效果归因方法及装置
CN106844178B (zh) * 2017-01-22 2019-11-15 腾云天宇科技(北京)有限公司 预测呈现信息转化率的方法、计算设备、服务器及系统

Also Published As

Publication number Publication date
CN110209919A (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN110209919B (zh) 归因的多维度剖析方法和装置
US20190026816A1 (en) Time-division Recommendation Method and Apparatus for Service Objects
CN109118296A (zh) 活动推送方法、装置及电子设备
US9690846B2 (en) Intelligent navigation of a category system
US9286391B1 (en) Clustering and recommending items based upon keyword analysis
US8484099B1 (en) Method, medium, and system for behavior-based recommendations of product upgrades
CN104239324B (zh) 一种基于用户行为的特征提取、个性化推荐的方法和系统
CN102279851A (zh) 一种智能导航方法、装置和系统
CN108153791B (zh) 一种资源推荐方法和相关装置
CN109447713A (zh) 一种基于知识图谱的推荐方法及装置
CN103345695A (zh) 一种商品推荐的方法和装置
EP3076359A1 (en) Implementing retail customer analytics data model in a distributed computing environment
US10607176B2 (en) Building business objects based on Sankey diagram
US20180276006A1 (en) Triggering User Aid Based On User Actions At Independent Locations
US20160196579A1 (en) Dynamic deep links based on user activity of a particular user
CN107562613A (zh) 程序测试方法、装置及系统
JP5824602B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
CN109978580A (zh) 对象推荐方法、装置以及计算机可读存储介质
CN106570031A (zh) 一种业务对象的推荐方法和装置
US10325274B2 (en) Trend data counter
CN110209687B (zh) 多维度归因的查询方法和装置
US20210312259A1 (en) Systems and methods for automatic product usage model training and prediction
CN107798558A (zh) 用户行为数据分析方法及服务器
CN107967637B (zh) 一种商品对象型号的推荐方法、装置及电子设备
CN111768213B (zh) 一种用户标签权重评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant