CN110189153B - 归因方法和装置 - Google Patents
归因方法和装置 Download PDFInfo
- Publication number
- CN110189153B CN110189153B CN201810155690.6A CN201810155690A CN110189153B CN 110189153 B CN110189153 B CN 110189153B CN 201810155690 A CN201810155690 A CN 201810155690A CN 110189153 B CN110189153 B CN 110189153B
- Authority
- CN
- China
- Prior art keywords
- target
- probability
- channel
- matrix
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种归因方法和装置。该方法包括:采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合;根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵;根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率;根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例。通过本申请,解决了相关技术中难以快速计算出每个渠道的归因比例的问题。
Description
技术领域
本申请涉及互联网数据分析领域,具体而言,涉及一种归因方法和装置。
背景技术
目前,在互联网时代的推广信息投放中,例如在线广告、推广软文等的投放,一个客户往往会通过多个媒体渠道进行投放,并且在各个媒体渠道的投放形式会有不同,例如在有的媒体投放的是搜索广告,付费方式是CPC,在有的媒体投放的推广信息是某广告位的展现广告,付费方式是CPM,还有DSP等投放方式,甚至并不能确定具体投放到了哪个具体的网站的具体广告位。面对这么多的推广信息投放媒体渠道,有些媒体投放的推广信息转化效果非常好,有些媒体投放的推广信息却几乎没有转化,但是,没有对推广信息进行直接转化的媒体并不一定对转化没有任何作用,例如,用户可能通过A媒体的广告,对广告涉及的产品有了初步了解,然后在看到了B媒体的该产品的广告时,点击并进行了深入的了解,最后在媒体C进行了产品搜索,根据搜索结果进入了官网,并产生了购买该产品的行为。这种情况下如何评价各个媒体渠道在这次推广信息转化中起到的作用,如果停止某个媒体的推广信息投放,会对最终的转化产生多大的影响,怎么明确各个渠道关联作用、合理利用历史数据有效评价每个媒体的推广信息投放对整体转化产生了多大的贡献,出现了图归因的相关方法,即将所有的数据打通,连成一张图,存储在neo4j这样的图数据库里,再分别针对每个节点,计算其对推广信息整体转化的影响值。但是,图数据库的递归计算耗时高,对于唯一值比较多的时候,比如超过100个或是1000个,便会出现性能问题,而且由于该性能问题,难以实时地根据数据源来计算其归因比例,计算前需要一连串复杂的调度:数据清洗,数据入库,图关系设置,图归因计算等。
针对相关技术中难以快速计算出每个渠道的归因比例的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种归因方法和装置,以解决相关技术中难以快速计算出每个渠道的归因比例的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种归因方法。该方法包括:采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,其中,转化总概率为通过多个渠道将目标推广信息转化为预设指标的概率;根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例。
进一步地,根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率包括:
其中,X表示转化总概率,S表示源头矩阵,C表示转化矩阵,Mj表示从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
进一步地,根据所述转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例包括:将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率;根据转化总概率和去除目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对目标推广信息转化为预设指标的贡献比例。
进一步地,将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率包括;
其中,Y表示去除目标渠道后的转化总概率,Sir表示去除目标渠道后的源头矩阵,Cir表示去除目标渠道后的转化矩阵,Mirj表示去除目标渠道后从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
进一步地,根据转化总概率和去除所述目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对目标推广信息转化为预设指标的贡献比例包括:
A=X-Y
其中,A为去掉目标渠道后目标推广信息转化为预设指标的概率。
为了实现上述目的,根据本申请的另一方面,提供了一种归因装置。该装置包括:采集单元,用于采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;确定单元,用于根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;获取单元,用于根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,其中,转化总概率为通过多个渠道将目标推广信息转化为预设指标的概率;计算单元,用于根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例。
进一步地,获取单元包括:
其中,X表示转化总概率,S表示源头矩阵,C表示转化矩阵,Mj表示从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
进一步地,计算单元包括:第一计算子模块,用于将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率;第二计算子模块,用于根据转化总概率和去除所述目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对所述目标推广信息转化为预设指标的贡献比例。
为了实现上述目的,根据本申请的另一方面,提供了一种存储介质,该存储介质包括存储的程序,其中,程序执行上述任意一种归因方法。
为了实现上述目的,根据本申请的另一方面,提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述任意一种归因方法。
通过本申请,采用以下步骤:采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,其中,转化总概率为通过多个渠道将目标推广信息转化为预设指标的概率;根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例,解决了相关技术中难以快速计算出每个渠道的归因比例的问题。通过将首次访问概率、跳转概率以及转化概率矩阵化,通过矩阵之间的运算,得到个渠道对目标推广信息转化为预设指标的贡献比例,进而达到了快速计算出每个渠道的归因比例的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的归因方法的流程图;以及
图2是根据本申请实施例提供的归因装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
下面结合优选的实施步骤对本发明进行说明,图1是根据本发明实施例的归因方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;
例如,预设时间段为3个月,目标推广信息为A品牌的手机广告,商家在b浏览器,和g浏览器均投放了A品牌的手机广告;
采集3个月内各个用户通过b浏览器和g浏览器访问A品牌的手机广告的访问数据,得到访问数据集合,其中,访问数据集合中包括多条数据,每条数据中至少包括b浏览器和g浏览器的ID以及通过b浏览器和g浏览器访问A品牌的手机广告的访问时间等。
步骤S102,根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;
例如,源头矩阵用于表示在访问数据集合中首次通过b浏览器和g浏览器访问A品牌的手机广告的概率,该情况下,源头矩阵记为(sb sg),为1*2的矩阵,只有一行代表的是起始点s,2列代表的是两个渠道,源头矩阵里对应的值sb表示的是起始点s到b浏览器的概率,即为首次通过b浏览器访问A品牌的手机广告的概率,sg表示的是起始点s到g浏览器的概率,即为首次通过g浏览器访问A品牌的手机广告的概率;
转化矩阵用于表示在访问数据集合中通过b浏览器和g浏览器查看A品牌的手机广告后直接转化为预设指标的概率,转化矩阵记为为2*1的矩阵,2行代表的是两个渠道,只有一列代表的是转化点c,转化矩阵里对应的值bc表示的是b浏览器到转化点c的概率,即为通过b浏览器查看A品牌的手机广告后直接转化为预设指标的概率,例如预设指标可以为查看A品牌的手机广告后产生的下订单购买该品牌手机的行为,gc表示的是g浏览器到转化点c的概率,即为通过g浏览器查看A品牌的手机广告后直接下订单购买该品牌手机的概率;
跳转矩阵集合用于表示在访问数据集合中访问目标广告时在多个渠道之间进行跳转的概率,从起始点s直接到转化点c,或从始点s到转化点c只由经一个渠道,这两种情况均未发生渠道之间的跳转,未生成跳转矩阵;即跳转矩阵包含从起始点s到转化点c,经过一次渠道跳转的概率构成的跳转矩阵,为其中,bb表示查看A品牌的手机广告时从b浏览器跳转到b浏览器自身的概率,计算规则为找出所有用户会话路径链上,由路径数除以总跳转路径数,如a->b->b->c->b->g->b->b->c,抽取b->b的路径出现次数作为分子,所有用户路径的总路径跳转次数作为分母,bb表示查看A品牌的手机广告时从b浏览器跳转到b浏览器自身的概率,具体地,通过b浏览器访问A品牌的手机广告的用户数量为m,离开b浏览器后,在这m个用户中,有m1个用户随后又再次通过b浏览器访问了A品牌的手机广告,即为查看A品牌的手机广告时从b浏览器跳转到b浏览器自身的概率;bg表示查看A品牌的手机广告时从b浏览器跳转到g浏览器的概率,具体地,通过b浏览器访问A品牌的手机广告的用户数量为m,离开b浏览器后,在这m个用户中,有m2个用户随后通过g浏览器访问了A品牌的手机广告,即为查看A品牌的手机广告时从b浏览器跳转到g浏览器的概率;gb表示查看A品牌的手机广告时从g浏览器跳转到b浏览器的概率,具体地,通过g浏览器访问A品牌的手机广告的用户数量为n,离开g浏览器后,在这n个用户中,有n1个用户随后通过b浏览器访问了A品牌的手机广告,即为查看A品牌的手机广告时从g浏览器跳转到b浏览器的概率;gg表示查看A品牌的手机广告时从g浏览器跳转到g浏览器自身的概率,具体地,通过g浏览器访问A品牌的手机广告的用户数量为n,离开g浏览器后,在这n个用户中,有n2个用户随后又再次通过g浏览器访问了A品牌的手机广告,即为查看A品牌的手机广告时从g浏览器跳转到g浏览器自身的概率;相对于图归因方法,本申请的归因方法允许从b浏览器跳转到b浏览器或从g浏览器跳转到g浏览器的自回路,计算复杂程度未因此增加;包含从起始点s到转化点c,途中经过两次渠道跳转的概率构成的跳转矩阵,为包含从起始点s到转化点c,途中经过三次渠道跳转的概率构成的跳转矩阵,为以此类推,直到从起始点s到转化点c,途中经过n次渠道跳转的概率构成的跳转矩阵,为上述矩阵构成跳转矩阵集合。
步骤S103,根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,上述情况下,转化总概率即为通过b浏览器和g浏览器将A品牌的手机推广信息转化为预设指标的概率;
例如,设定推广信息转化为的预设指标为用户查看A品牌的手机广告后登录官网下订单购买了该品牌手机的行为,根据源头矩阵(sb sg)、跳转矩阵集合和转化矩阵获取转化总概率,即为通过b浏览器和g浏览器访问A品牌的手机广告后登录官网下订单购买了该品牌手机的概率。
步骤S104,根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例;
例如,根据转化总概率,分别计算在b浏览器和g浏览器投放A品牌的手机广告对用户访问该广告后登录官网下订单购买了该品牌手机的概率。
可选地,在本申请实施例提供的归因方法中,根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率包括:
其中,X表示转化总概率,S表示源头矩阵,C表示转化矩阵,Mj表示从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
具体地,转化总概率为从起始点s到转化点c经过不同次渠道跳转的概率构成的跳转矩阵与源头矩阵和转化矩阵相乘后累加求和得到的结果:设P0为未经渠道跳转从起始点s到转化点c的概率;P1为经过一次渠道跳转从起始点s到转化点c,的概率,P2为经过两次渠道跳转从起始点s到转化点c的概率,Pn为经过n次渠道跳转从起始点s到转化点c的概率;
……
Pn=s〈b|g>{n}c,其中,<·|·>表示或的关系,<b|g>表示b渠道或g渠道,{n}是正则的写法,表示出现n次;
将P0到Pn累加求和,得到转化总概率X,即为通过b浏览器和g浏览器访问A品牌的手机广告后登录官网下订单购买了该品牌手机的概率。
可选地,在本申请实施例提供的归因方法中,根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例包括:将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率;根据转化总概率和去除目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对目标推广信息转化为预设指标的贡献比例。
例如,将b浏览器设定为目标渠道,计算去除b浏览器后用户访问A品牌的手机广告后登录官网下订单购买了该品牌手机的概率;根据转化总概率和去除b浏览器后用户购买该品牌手机的概率,得到b浏览器对用户访问A品牌的手机广告后登录官网下订单购买了该品牌手机的贡献比例。
可选地,在本申请实施例提供的归因方法中,将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率包括;
其中,Y表示去除目标渠道后的转化总概率,Sir表示去除目标渠道后的源头矩阵,Cir表示去除目标渠道后的转化矩阵,Mirj表示去除目标渠道后从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数;
例如,将b浏览器设定为目标渠道,只剩g浏览器这一渠道,去除b浏览器后的源头矩阵Sir=(sg),去除b浏览器后的转化矩阵Cir=(gc),去除b浏览器后的经过一次渠道跳转的概率构成的跳转矩阵Mir1=(gg),根据Sir、Cir和Mirj计算去除b浏览器后的转化总概率Y。
可选地,在本申请实施例提供的归因方法中,根据转化总概率和去除所述目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对目标推广信息转化为预设指标的贡献比例包括:
A=X-Y
其中,A为去掉目标渠道后目标推广信息转化为预设指标的概率。
例如,商家在b浏览器,和g浏览器均投放了A品牌的手机广告,计算b浏览器对用户访问A品牌的手机广告后登录官网下订单购买了该品牌手机的贡献比例为用户通过b浏览器和g浏览器访问A品牌的手机广告后登录官网下订单购买了该品牌手机的概率与去除b浏览器后用户通过g浏览器访问A品牌的手机广告后登录官网下订单购买了该品牌手机的概率的差值。
需要说明的是,本申请的归因方法,去除掉了图数据库的依赖,全部数据在内存里通过数学矩阵方式参与运算,快速出具归因结果,归因性能大幅提升。
本申请实施例提供的归因方法,通过采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,其中,转化总概率为通过多个渠道将目标推广信息转化为预设指标的概率;根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例,解决了相关技术中难以快速计算出每个渠道的归因比例的问题。通过将首次访问概率、跳转概率以及转化概率矩阵化,通过矩阵之间的运算,得到个渠道对目标推广信息转化为预设指标的贡献比例,进而达到了快速计算出每个渠道的归因比例的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种归因装置,需要说明的是,本申请实施例的归因装置可以用于执行本申请实施例所提供的用于归因方法。以下对本申请实施例提供的归因装置进行介绍。
图2是根据本申请实施例的归因装置的示意图。如图2所示,该装置包括:采集单元10、确定单元20、获取单元30和计算单元40。
具体地,采集单元10,用于采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;
确定单元20,用于根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;
获取单元30,用于根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,其中,转化总概率为通过多个渠道将目标推广信息转化为预设指标的概率;
计算单元40,用于根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例。
可选地,在本申请实施例提供的归因装置中,获取单元30包括:
其中,X表示转化总概率,S表示源头矩阵,C表示转化矩阵,Mj表示从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
可选地,在本申请实施例提供的归因装置中,计算单元40包括:第一计算子模块,用于将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率;第二计算子模块,用于根据转化总概率和去除所述目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对所述目标推广信息转化为预设指标的贡献比例。
可选地,在本申请实施例提供的归因装置中,第一计算子模块包括;
其中,Y表示去除目标渠道后的转化总概率,Sir表示去除目标渠道后的源头矩阵,Cir表示去除目标渠道后的转化矩阵,Mirj表示去除目标渠道后从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
可选地,在本申请实施例提供的归因装置中,第二计算子模块包括:
A=X-Y
其中,A为去掉目标渠道后目标推广信息转化为预设指标的概率。
本申请实施例提供的归因装置,通过采集单元10,采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;确定单元20,根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;获取单元30,根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,其中,转化总概率为通过多个渠道将目标推广信息转化为预设指标的概率;计算单元40,根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例,解决了相关技术中难以快速计算出每个渠道的归因比例的问题。通过将首次访问概率、跳转概率以及转化概率矩阵化,通过矩阵之间的运算,得到个渠道对目标推广信息转化为预设指标的贡献比例,进而达到了快速计算出每个渠道的归因比例的效果。
所述归因装置包括处理器和存储器,上述采集单元10、确定单元20、获取单元30和计算单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来快速计算出每个渠道的归因比例。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述归因方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述归因方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,其中,转化总概率为通过多个渠道将目标推广信息转化为预设指标的概率;根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例。
进一步地,根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率包括:
其中,X表示转化总概率,S表示源头矩阵,C表示转化矩阵,Mj表示从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
进一步地,根据所述转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例包括:将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率;根据转化总概率和去除目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对目标推广信息转化为预设指标的贡献比例。
进一步地,将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率包括;
其中,Y表示去除目标渠道后的转化总概率,Sir表示去除目标渠道后的源头矩阵,Cir表示去除目标渠道后的转化矩阵,Mirj表示去除目标渠道后从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
进一步地,根据转化总概率和去除所述目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对目标推广信息转化为预设指标的贡献比例包括:
A=X-Y
其中,A为去掉目标渠道后目标推广信息转化为预设指标的概率。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,多个渠道为所述目标推广信息投放的渠道,访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问目标推广信息的访问时间;根据访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,源头矩阵用于表示在访问数据集合中首次通过各个渠道访问目标推广信息的概率;跳转矩阵集合用于表示在访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;转化矩阵用于表示在访问数据集合中通过各个渠道直接将目标推广信息转化为预设指标的概率;根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率,其中,转化总概率为通过多个渠道将目标推广信息转化为预设指标的概率;根据转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例。
进一步地,根据源头矩阵、跳转矩阵集合和转化矩阵,获取转化总概率包括:
其中,X表示转化总概率,S表示源头矩阵,C表示转化矩阵,Mj表示从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
进一步地,根据所述转化总概率,计算各个渠道对目标推广信息转化为预设指标的贡献比例包括:将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率;根据转化总概率和去除目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对目标推广信息转化为预设指标的贡献比例。
进一步地,将一个渠道设定为目标渠道,计算去除目标渠道后目标推广信息转化为预设指标的概率包括;
其中,Y表示去除目标渠道后的转化总概率,Sir表示去除目标渠道后的源头矩阵,Cir表示去除目标渠道后的转化矩阵,Mirj表示去除目标渠道后从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数,。
进一步地,根据转化总概率和去除所述目标渠道后目标推广信息转化为预设指标的概率,得到目标渠道对目标推广信息转化为预设指标的贡献比例包括:
A=X-Y
其中,A为去掉目标渠道后目标推广信息转化为预设指标的概率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (8)
1.一种归因方法,其特征在于,包括:
采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,所述多个渠道为所述目标推广信息投放的渠道,所述访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问所述目标推广信息的访问时间;
根据所述访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,所述源头矩阵用于表示在所述访问数据集合中首次通过各个渠道访问目标推广信息的概率;所述跳转矩阵集合用于表示在所述访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;所述转化矩阵用于表示在所述访问数据集合中通过各个渠道直接将所述目标推广信息转化为预设指标的概率;
根据所述源头矩阵、所述跳转矩阵集合和所述转化矩阵,获取转化总概率,其中,所述转化总概率为通过所述多个渠道将所述目标推广信息转化为预设指标的概率;
根据所述转化总概率,计算各个渠道对所述目标推广信息转化为预设指标的贡献比例;
其中,根据所述源头矩阵、所述跳转矩阵集合和所述转化矩阵,获取转化总概率包括:
其中,X表示所述转化总概率,S表示所述源头矩阵,C表示所述转化矩阵,Mj表示从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
2.根据权利要求1所述的方法,其特征在于,根据所述转化总概率,计算各个渠道对所述目标推广信息转化为预设指标的贡献比例包括:
将一个渠道设定为目标渠道,计算去除所述目标渠道后所述目标推广信息转化为预设指标的概率;
根据所述转化总概率和去除所述目标渠道后所述目标推广信息转化为预设指标的概率,得到所述目标渠道对所述目标推广信息转化为预设指标的贡献比例。
4.根据权利要求3所述的方法,其特征在于,根据所述转化总概率和去除所述目标 渠道后所述目标推广信息转化为预设指标的概率,得到所述目标渠道对所述目标推广信息转化为预设指标的贡献比例包括:
A=X-Y
其中,A为去掉目标渠道后目标推广信息转化为预设指标的概率。
5.一种归因装置,其特征在于,包括:
采集单元,用于采集预设时间段内通过多个渠道访问目标推广信息的访问数据,得到访问数据集合,其中,所述多个渠道为所述目标推广信息投放的渠道,所述访问数据集合中包括多条数据,每条数据中至少包括渠道ID,通过每个渠道访问所述目标推广信息的访问时间;
确定单元,用于根据所述访问数据集合中的数据确定源头矩阵、跳转矩阵集合和转化矩阵,其中,所述源头矩阵用于表示在所述访问数据集合中首次通过各个渠道访问目标推广信息的概率;所述跳转矩阵集合用于表示在所述访问数据集合中访问目标推广信息时在多个渠道之间进行跳转的概率;所述转化矩阵用于表示在所述访问数据集合中通过各个渠道直接将所述目标推广信息转化为预设指标的概率;
获取单元,用于根据所述源头矩阵、所述跳转矩阵集合和所述转化矩阵,获取转化总概率,其中,所述转化总概率为通过所述多个渠道将所述目标推广信息转化为预设指标的概率;
计算单元,用于根据所述转化总概率,计算各个渠道对所述目标推广信息转化为预设指标的贡献比例;
其中,所述获取单元包括:
其中,X表示所述转化总概率,S表示所述源头矩阵,C表示所述转化矩阵,Mj表示从访问目标推广信息到转化为预设指标在渠道之间经过j次跳转的概率形成的矩阵,n表示最高跳转次数。
6.根据权利要求5所述的装置,其特征在于,所述计算单元包括:
第一计算子模块,用于将一个渠道设定为目标渠道,计算去除所述目标渠道后所述目标推广信息转化为预设指标的概率;
第二计算子模块,用于根据所述转化总概率和去除所述目标渠道后所述目标推广信息转化为预设指标的概率,得到所述目标渠道对所述目标推广信息转化为预设指标的贡献比例。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至4中任意一项所述的归因方法。
8.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至4中任意一项所述的归因方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810155690.6A CN110189153B (zh) | 2018-02-23 | 2018-02-23 | 归因方法和装置 |
PCT/CN2019/072098 WO2019161718A1 (zh) | 2018-02-23 | 2019-01-17 | 归因方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810155690.6A CN110189153B (zh) | 2018-02-23 | 2018-02-23 | 归因方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110189153A CN110189153A (zh) | 2019-08-30 |
CN110189153B true CN110189153B (zh) | 2021-09-07 |
Family
ID=67687489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810155690.6A Active CN110189153B (zh) | 2018-02-23 | 2018-02-23 | 归因方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110189153B (zh) |
WO (1) | WO2019161718A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111324842B (zh) * | 2020-02-13 | 2022-06-07 | 贝壳技术有限公司 | 用于实现页面优化的方法、装置、介质和电子设备 |
CN112529634A (zh) * | 2020-12-18 | 2021-03-19 | 恩亿科(北京)数据科技有限公司 | 基于大数据的转化链路分析方法、系统和计算机设备 |
CN113420261B (zh) * | 2021-08-23 | 2021-11-09 | 平安科技(深圳)有限公司 | 基于归因分析的课程推荐方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103562946A (zh) * | 2011-05-27 | 2014-02-05 | 谷歌公司 | 对于广告开支回报的多个归因模型 |
CN105960656A (zh) * | 2013-12-05 | 2016-09-21 | 谷歌公司 | 用于创建用于向多个事件分配归因得分的数据驱动归因模型的方法和系统 |
US9687187B2 (en) * | 2013-10-22 | 2017-06-27 | Mindstrong, LLC | Method and system for assessment of cognitive function based on mobile device usage |
CN107402944A (zh) * | 2016-05-18 | 2017-11-28 | 谷歌公司 | 用于内容项转化的归因模型 |
CN107563781A (zh) * | 2016-06-30 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 一种信息投放效果归因方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130246167A1 (en) * | 2012-03-15 | 2013-09-19 | Microsoft Corporation | Cost-Per-Action Model Based on Advertiser-Reported Actions |
CN102663616A (zh) * | 2012-03-19 | 2012-09-12 | 北京国双科技有限公司 | 一种基于多触点归因模型的网络广告效果衡量方法和系统 |
CN104834675B (zh) * | 2015-04-02 | 2018-02-23 | 浪潮集团有限公司 | 一种基于用户行为分析的查询性能优化方法 |
CN106447396A (zh) * | 2016-09-22 | 2017-02-22 | 晶赞广告(上海)有限公司 | 一种广告在线预算的分配方法 |
-
2018
- 2018-02-23 CN CN201810155690.6A patent/CN110189153B/zh active Active
-
2019
- 2019-01-17 WO PCT/CN2019/072098 patent/WO2019161718A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103562946A (zh) * | 2011-05-27 | 2014-02-05 | 谷歌公司 | 对于广告开支回报的多个归因模型 |
US9687187B2 (en) * | 2013-10-22 | 2017-06-27 | Mindstrong, LLC | Method and system for assessment of cognitive function based on mobile device usage |
CN105960656A (zh) * | 2013-12-05 | 2016-09-21 | 谷歌公司 | 用于创建用于向多个事件分配归因得分的数据驱动归因模型的方法和系统 |
CN107402944A (zh) * | 2016-05-18 | 2017-11-28 | 谷歌公司 | 用于内容项转化的归因模型 |
CN107563781A (zh) * | 2016-06-30 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 一种信息投放效果归因方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110189153A (zh) | 2019-08-30 |
WO2019161718A1 (zh) | 2019-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108521439B (zh) | 一种消息推送的方法和装置 | |
CN110033314B (zh) | 广告数据处理方法及装置 | |
CN109040844B (zh) | 一种获取视频热度的方法、装置及电子设备 | |
CN108510311B (zh) | 一种确定营销方案的方法、装置及电子设备 | |
WO2019161731A1 (zh) | 渠道的归因方法和装置 | |
CA2932686C (en) | Methods and systems for creating a data-driven attribution model for assigning attribution credit to a plurality of events | |
CN110189153B (zh) | 归因方法和装置 | |
CA2952154A1 (en) | Method and system for generating a split questionnaire | |
TW201816627A (zh) | 資源調度的方法、裝置和系統 | |
CN106909567B (zh) | 数据处理方法及装置 | |
CN112561293A (zh) | 采购商对供应商进行评价的系统以及电子设备 | |
CN105022807A (zh) | 信息推荐方法及装置 | |
CN110743169B (zh) | 基于区块链的防作弊方法及系统 | |
CN110209687B (zh) | 多维度归因的查询方法和装置 | |
CN108810089B (zh) | 一种信息推送方法、装置及存储介质 | |
CN108881968B (zh) | 一种网络视频广告投放方法和系统 | |
CN112650921A (zh) | 一种对象推荐方法、装置、设备及存储介质 | |
CN107016028B (zh) | 数据处理方法及其设备 | |
CN109710410B (zh) | 一种互联网信息资源分配方法及装置 | |
CN108171559B (zh) | 一种用户等级处理、目标对象推送方法和设备 | |
CN108241643B (zh) | 关键词的指标数据分析方法及装置 | |
CN109214874B (zh) | Ip产品运营数据处理方法、装置、设备及可读存储介质 | |
CN111127101A (zh) | 广告定向投放方法、装置及存储介质 | |
CN109615465B (zh) | 业务订单的处理方法、装置和电子设备 | |
CN112579880A (zh) | 数据分析方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |