CN111310061A - 全链路多渠道归因方法、装置、服务器及存储介质 - Google Patents

全链路多渠道归因方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN111310061A
CN111310061A CN201811438157.7A CN201811438157A CN111310061A CN 111310061 A CN111310061 A CN 111310061A CN 201811438157 A CN201811438157 A CN 201811438157A CN 111310061 A CN111310061 A CN 111310061A
Authority
CN
China
Prior art keywords
user
access behavior
access
channel
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811438157.7A
Other languages
English (en)
Other versions
CN111310061B (zh
Inventor
王晓元
叶峻
沈璠
周振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811438157.7A priority Critical patent/CN111310061B/zh
Publication of CN111310061A publication Critical patent/CN111310061A/zh
Application granted granted Critical
Publication of CN111310061B publication Critical patent/CN111310061B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种全链路多渠道归因方法、装置、服务器及存储介质。其中,该方法包括:根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;根据所述用户的访问行为序列,确定所述用户触达目标行为的渠道序列;根据所述用户触达目标行为的渠道序列,确定渠道的归因得分。能够完整的捕捉同一用户在各渠道下的归因效果,提高了多渠道归因的准确性。

Description

全链路多渠道归因方法、装置、服务器及存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种全链路多渠道归因方法、装置、服务器及存储介质。
背景技术
随着互联网的普及和发展,商家或企业的信息推广渠道也在不断的扩展,包括企业网站、搜索引擎、微博、微信、短信和电视广告等。只有确定各种推广渠道对销售流量的影响,才能便于商家或企业确定在不同推广渠道上的投资力度和推广手段。因此,需要对各推广渠道进行多触点归因分析。
但是,目前常用的多渠道归因技术在进行渠道归因分析时,所做的归因分析在用户行为层面都是局部的,无法完整的捕捉同一个用户在各个渠道下的归因效果,在实际归因分析过程中,存在各种用户断层的问题。例如,用户A使用不同的设备触达渠道1、用户A在设备上删除了关于其触达渠道1的缓存数据或用户A未登录渠道1,通过游客的身份触达渠道1等等,这些情况下,都会严重影响多渠道归因分析的准确性。
发明内容
本发明实施例提供了一种全链路多渠道归因方法、装置、服务器及存储介质,可以提高多渠道归因的准确性。
第一方面,本发明实施例提供了一种全链路多渠道归因方法,该方法包括:
根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;
根据所述用户的访问行为序列,确定所述用户触达目标行为的渠道序列;
根据所述用户触达目标行为的渠道序列,确定渠道的归因得分。
第二方面,本发明实施例还提供了一种全链路多渠道归因装置,该装置包括:
数据聚合模块,用于根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;
渠道序列确定模块,用于根据所述用户的访问行为序列,确定所述用户触达目标行为的渠道序列;
归因得分确定模块,用于根据所述用户触达目标行为的渠道序列,确定渠道的归因得分。
第三方面,本发明实施例还提供了一种服务器,该服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中任意所述的全链路多渠道归因方法。
第四方面,本发明实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意所述的全链路多渠道归因方法。
本发明实施例的技术方案,通过基于访问行为数据的各类标识信息对访问行为数据进行聚合,根据聚合得到的目标行为的用户的访问行为序列确定该用户触达目标行为的渠道序列,进而确定各渠道的归因得分。能够完整的捕捉同一用户在各渠道下的归因效果,提高了多渠道归因的准确性。
附图说明
图1是本发明实施例一提供的一种全链路多渠道归因方法的流程图;
图2是本发明实施例提供的购物网站中各访问行为数据的各类标识组成示意图;
图3是本发明实施例二提供的一种全链路多渠道归因方法的流程图;
图4是本发明实施例三提供的一种全链路多渠道归因方法的流程图;
图5是本发明实施例四提供的一种全链路多渠道归因装置的结构示意图;
图6是本发明实施例五提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种全链路多渠道归因方法的流程图。本实施例可适用于在对渠道的信息推送、渠道推广效果进行评估的过程中,对各渠道进行归因分析的情况,该方法可以由本法明实施例提供的全链路多渠道归因装置或服务器来执行,该装置可采用硬件和/或软件的方式实现。如图1所示,具体包括如下步骤:
S101,根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列。
其中,目标行为可以是商家或企业进行渠道推广的最终目的对应的用户行为,例如,若商家推广的是某购物网站,则目标行为可以是用户在该网站的下单行为。目标行为的用户可以是成功执行目标行为或间接执行目标行为的用户。具体的,可以包括目标行为的已转化用户和未转化用户。其中,已转化用户可以是指成功执行了目标行为的用户,例如,对于电商产品来说,已转化用户可以是最终成功下单的付费者。与目标行为的已转化用户相比,未转化用户可以是指未执行目标行为的用户,例如,若推广信息是某购物网站,用户进入该网站,并产生了相关访问行为,但是未执行目标行为(即未成功下单),则该用户为目标行为的未转化用户。访问行为可以是用户对触发目标行为有一定关联的其他操作行为,可以是一个,也可以是多个。例如,目标行为是下单行为,则访问行为可以包括浏览行为、收藏行为、加购物车行为、咨询行为、访问量查询或评价查询行为等等中的至少一个。可选的,各访问行为可以是预先根据用户操作行为对目标行为的潜在促进效果从若干用户操作行为中确定的。目标行为不同,其对应的用户的访问行为也不同。访问行为数据可以是执行访问行为产生的相关数据信息,例如,可以包括执行访问行为的时间、数据源、各类标识信息等。
可选的,访问行为数据的各类标识信息可以包括:访问行为数据的宿主方注册标识,第三方登录载体标识和埋点方标识。其中,宿主方是指可嵌入到网页或第三方应用中的小程序或网址链接。宿主方注册标识可以是用户在注册宿主方时的实体标识,如可以是用户名、用户序号等。第三方可以是指能够直接调入进入宿主方的第三方平台或应用程序。第三方登录载体标识可以是用户登录第三方时的登录标识,如可以是用户名、手机号、邮箱号等。埋点方可以是在目标行为对应的站点植入埋点的一方,如可以是归因分析方的服务器。埋点方标识可以是植入每一个埋点时,该埋点对应的标识。示例性的,如图2所示,以访问某购物网站为例,该网站的访问行为数据的各类标识(unifiedid)20中,宿主方注册标识21包括:用户在该购物网站的用户名标识(userid)211和用户在该购物网站的维护标识(user-cookieid)212;第三方登录载体标识22包括:第三方登陆平台的标识(Openid)221,即打开该购物网站的第三方载体记录的标识,如,可以是微信后台记录的该微信账号。埋点方标识23包括:植入到该购物网站用于采集网站访客的埋点的网站访客标识(visitorid)231,该标识可以是根据访客设备信息生成,例如,可以根据IP、浏览器或操作系统生成。还包括植入到购物网站用于采集用户浏览日志的埋点的浏览日志标识(cookieid)232。
可选的,在本发明实施例中,根据访问行为数据的各类标识信息对访问行为数据进行聚合,可以是若任意一组访问行为数据的任意一类标识信息相同,则确定该组访问行为数据属于同一用户,并为该组访问行为数据生成统一标识信息。具体的,获取所有访问行为数据的各类标识信息,若存在任意至少两个访问行为数据的某一类标识信息相同,则将这至少两个访问行为数据归为同一个用户,为相同用户的访问行为数据设置同一的标识信息,进而完成对获取的多个访问行为数据的聚合。
示例性的,获取访问行为1到访问行为8的访问行为数据的各类标识信,其中各类标识信息为图2所示的标识信息。表1记录了访问行为数据1到访问行为数据8对应的各类标识信息。其中,访问行为1和访问行为7具有相同的cookidid;访问行为2和访问行为6具有相同的cookidid;访问行为4和访问行为5具有相同的openid;访问行为3、访问行为7和访问行为8具有相同的userid。则可以将具有相同cookidid的访问行为1和访问行为7聚合为一类,为其设置统一的标识信息A;将具有相同cookidid访问行为2和访问行为6聚合为一类,为其设置统一的标识信息B;将具有相同openid的访问行为4和访问行为5聚合为一类,为其设置统一的标识信息C;将具有相同userid的访问行为3、访问行为7和访问行为8聚合为一类,为其设置统一的标识信息D。得到目标行为的用户A的访问行为序列为:访问行为1和访问行为7;目标行为的用户B的访问行为序列为:访问行为2和访问行为6;目标行为的用户C的访问行为序列为:访问行为4和访问行为5;目标行为的用户D的访问行为序列为:访问行为3、访问行为7和访问行为8。
可选的,在对访问行为数据进行聚合的过程中,若一组访问行为数据的第一类标识信息相同,第二组访问行为数据的第二类标识信息相同,且第一组访问行为数据和第二组访问行为数据存在交集,则可以确定第一组访问行为数据和第二组访问行为数据属于同一用户,并为这两组访问行为数据生成统一标识信息。其中,第一组访问行为数据和第二组访问行为数据并不完全相同,且第一类标识信息和第二类标识信息为访问行为数据的两种不同类型标识信息。例如,如表1所示,统一标识信息为A的访问行为序列中包括访问行为1和访问行为7;统一标识信息为D的访问行为序列中包括访问行为3、访问行为7和访问行为8;其中,访问行为7是两个访问行为序列共有的访问行为,则可以将这两个访问行为序列进行再次聚合,并为聚合后的访问行为序列(即访问行为1、访问行为3、访问行为7和访问行为8)生成统一标识信息A。
表1、访问行为1至访问行为8的各访问行为数据的各类标识信
visitorid cookieid openid userid user-coolieid
访问行为1 1111111 ABCDE - - qqqqqqqq
访问行为2 2222222 FGHIJ - - ssssssss
访问行为3 3333333 ERQSP - 676767 eeeeeeee
访问行为4 4444444 ERQSO xxxxxx 676768 tttttttt
访问行为5 5555555 CEAEF xxxxxx 676769 cccccccc
访问行为6 6666666 FGHIJ yyyyyy 676770 bbbbbbbb
访问行为7 7777777 ABCDE zzzzzz 676767 oooooooo
访问行为8 8888888 HGFRS ssssss 676767 hhhhhhhh
可选的,若某一访问行为数据找不到与其任意一类标识信息相同的访问行为数据,则可以是为该访问行为数据单独生成一标识信息。
需要说明的是,本发明实施例中,在对访问行为数据进行聚合的过程中为访问行为数据生成的统一标识信息可以是目标行为的用户标识信息,用来表示这些访问行为属于同一用户,其原有的访问行为数据的各类标识信息可保持不变。
示例性的,根据访问行为数据的各类标识信息对访问行为数据进行聚合后,可以将同一目标行为的用户的各访问行为构成该目标用户的访问行为序列。具体的,可以是将具有同一标识信息的各访问行为构成该标识信息对应的目标行为的用户的访问行为序列。可选的,本发明实施例中,对访问行为数据进行聚合后,可以得到多个目标行为用户各自对应的访问行为序列。
S102,根据用户的访问行为序列,确定用户触达目标行为的渠道序列。
示例性的,商家或企业通常会通过不同的渠道进行信息的推广,用户的各访问行为可能就是通过商家或企业设置的不同渠道来触发的。例如,商家要推广某购物网站,其可以通过微博渠道、微信渠道、搜索引擎渠道或企业网站渠道等多种渠道组合进行信息的推广。用户在使用微信时点击推广信息(如可以是广告链接,也可以是推送消息等),进入该购物网站浏览商品的访问行为对应的渠道为微信渠道。除用户直接通过该购物网站的应用程序或网页搜索该购物网站触达访问行为外,各访问行为都有其对应的所属渠道。
可选的,本发明实施例中的用户为目标行为的用户,因此,用户的访问行为序列,可以包括目标行为的已转化用户的访问行为序列和目标行为的未转化用户的访问行为序列。因此,根据用户的访问行为序列,确定用户触达目标行为的渠道序列时,可以是采用静态归因分析技术,根据各目标行为的已转化用户的访问行为序列,确定该用户触达目标行为的渠道序列,也可以是采用动态归因分析技术,根据各目标行为的已转化用户和未转化用户的访问行为序列,确定该用户触达目标行为的渠道序列。对此本发明实施例不进行限定。
具体的,无论是采用哪种归因技术,根据用户的访问行为序列确定用户触达目标行为的渠道序列的方法可以是:根据用户的访问行为序列中的各访问行为的访问行为数据,分别确定用户的各访问行为所属的渠道,可以是根据访问行为的时间数据,将其与最近一次渠道触发的时间进行比较,若访问行为的时间与渠道触发的时间差小于预设时间阈值,则可以将最近一次触发的渠道作为当前访问行为对应的所属渠道;例如,预设时间阈值为5分钟,用户A的浏览行为对应的时间为8:10,在此之前最近一次渠道触发的时间是8:06,且触发的是微信渠道,由于8:10的浏览行为时间和8:06的渠道触发时间的时间差为4分钟,小于预设时间阈值5分钟,则可以确定用户A的8:10的浏览行为所属渠道为微信渠道。还可以是获取访问行为的数据源(所述数据源中包括访问行为对应的渠道标识),通过数据源中的渠道标识确定该访问行为的所属渠道。例如,用户A的浏览行为对应的数据源中包含的触发渠道的标识为01,而01对应的渠道为微信渠道,则可以确定用户A的浏览行为所属渠道为微信渠道。
S103,根据用户触达目标行为的渠道序列,确定渠道的归因得分。
其中,渠道的归因得分可以是为各渠道对本次信息推广所做的贡献进行分析评分。
可选的,若本发明实施例采用静态归因技术确定渠道的归因得分时,可以是静态的按照线性点击(Linear click)、首次点击(First click)或最后点击(Last click)等方式对各渠道效果进行归因。例如,可以是将首次点击的访问行为对应的渠道作为目标行为的主要转化渠道,通过统计各通道作为目标行为的用户的主要转化渠道的次数来确定各渠道的归因得分;也可以是将最后点击的访问行为对应的渠道作为目标行为的主要转化渠道,通过统计各通道作为目标行为的用户的主要转化渠道的次数来确定各渠道的归因得分;还可以是按照线性点击顺序以及相应规则,依次为各渠道4设置不同的转换重要程度,进而计算各渠道的归因得分等等。对此本发明实施例不进行限定。
若本发明实施例采用动态归因技术确定渠道归因得分时,可以是先根据目标行为的已转化用户的各访问行为,确定各访问行为的推广权重,根据各渠道关联的各用户(包括目标行为的已转化用户和目标行为的未转化用户)的访问行为以及各访问行为的推广权重,确定所述各渠道的归因得分。具体的,可以是先提取出目标行为的已转化用户的各访问行为,确定各访问行为的访问频次;依据各访问行为的访问频次,确定各访问行为的推广权重;然后再针对每一渠道,根据该渠道内各用户的访问行为以及各访问行为的推广权重,确定该渠道的各用户的推广权重;例如,可以是将该渠道内每一个用户的各访问行为的推广权重进行累加,得到该用户的推广权重;还可以是结合用户执行各访问行为的顺序以及各访问行为的推广权重,确定该用户的推广权重等。再对该渠道的各用户的推广权重进行累加,得到该渠道的归因得分。
本实施例提供了一种全链路多渠道归因方法,通过基于访问行为数据的各类标识信息对访问行为数据进行聚合,根据聚合得到的目标行为的用户的访问行为序列确定该用户触达目标行为的渠道序列,进而确定各渠道的归因得分。能够完整的捕捉同一用户在各渠道下的归因效果,提高了多渠道归因的准确性。
实施例二
图3为本发明实施例二提供的一种全链路多渠道归因方法的流程图。本实施例在上述实施例的基础上,进一步的对根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列这一步骤进行优化。参见图3,该方法具体包括:
S301,根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列。
S302,判断任一目标行为的用户的访问行为序列中的访问行为数量是否大于访问行为阈值,若是,执行S303,若否,执行S304。
示例性的,通常情况下,一个目标行为用户的访问行为数据不会特别多,当一个目标行为的用户的访问行为序列中的访问行为的数量较多(如超过1000条)时,说明可能其中有不准确的数据。例如,归因分析服务器在某一电子设备(如笔记本电脑)上注入某购物网站的网站访客标识(visitorid),不同用户通过该设备访问该购物网站都会被聚合为同一个目标行为的用户,因此导致聚合得到的目标行为的用户访问行为序列不准确。因此,在S301确定了各目标行为的用户的访问行为序列之后,要判断是否存在目标行为用户的访问行为序列中的访问行为数据大于访问行为阈值的目标行为的用户,若存在,则说明该目标行为的用户的访问行为序列可能不准确,需要执行S303,对该访问行为序列中的各访问行为进行筛选;若不存在,则说明各目标行为的用户的访问行为序列正常,直接执行S304确定各目标行为的用户触达目标行为的渠道序列。
其中,访问行为阈值可以是用来判断目标行为的用户对应的访问行为数量是否正常的标准,可以是预先通过统计大量目标行为的用户的访问行为数量,将目标行为的用户的平均访问行为数量作为访问行为阈值。可选的,访问行为阈值可以是一个固定的数值(如1000);也可以是根据不同的目标行为设置该目标行为对应的访问行为阈值等。
S303,根据各访问行为的标识类型,对该用户的各访问行为进行筛选。
可选的,根据各访问行为的标识类型,对该用户的各访问行为进行筛选时,可以是从该用户的访问行为序列中筛选出每一种标识类型或某几种标识类型的访问行为作为该用户最终的访问行为序列。示例性的,可以是从该用户的各访问行为中选择标识类型是第三方登录载体标识或宿主方注册标识的访问行为,组成该用户的访问行为序列。具体的,由于第三方登录载体标识和宿主方注册标识都有一个共同的特征都是用户实体标识(如第三方用户实体登录的标识、宿主方用户实体注册的标识),其能够体更准确的表明访问行为对应的用户是否为同一用户。因此,在筛选用户的访问行为序列时,可以选择第三方登录载体标识或宿主方注册标识的访问行为作为该用户的访问行为序列;可选的,也可以是选择第三方登录载体标识和宿主方注册标识的访问行为一并作为该用户的访问行为序列。
S304,根据用户的访问行为序列,确定用户触达目标行为的渠道序列。
示例性的,若存在目标行为的用户的访问行为序列中的访问行为数量大于访问行为阈值,则对大于访问行为阈值的目标行为的用户执行S303后,根据所有的目标行为的用户(包括筛选访问行为后的目标行为的用户和无需进行筛选的目标行为的用户)的访问行为序列,确定各目标行为的用户触达目标行为的渠道序列;若不存在目标行为的用户的访问行为序列中的访问行为数量大于访问行为阈值,则直接根据S301得到的目标行为的用户的访问行为序列,确定各目标行为的用户触达目标行为的渠道序列。
S305,根据用户触达目标行为的渠道序列,确定渠道的归因得分。
本发明实施例提供了一种全链路多渠道归因方法,通过基于访问行为数据的各类标识信息对访问行为数据进行聚合,当聚合后的存在某一用户的访问行为序列中访问行为数量大于行为阈值,则需要对该用户的访问行为序列进行筛选后,再确定各用户触达目标行为的渠道序列,进而确定各渠道的归因得分。避免了公共电子设备上的埋点方标识聚合访问行为数据导致不同用户的访问行为数据聚合到一起出现错误的情况,提高了聚合确定用户的访问行为序列的准确性,进而提高了全链路多渠道归因分析的准确性。
实施例三
图4为本发明实施例三提供的一种全链路多渠道归因方法的流程图。本实施例在上述实施例的基础上,进一步的对根据用户的访问行为序列,确定用户触达目标行为的渠道序列这一步骤进行优化。参见图4,该方法具体包括:
S401,根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列。
S402,判断任一目标行为的用户的访问行为序列中的访问行为数量是否大于访问行为阈值,若是,执行S403,若否,执行S404。
S403,根据各访问行为的标识类型,对该用户的各访问行为进行筛选。
S404,若根据用户的访问行为数据,确定用户通过任一渠道触达任一访问行为,则将该渠道作为该用户的该访问行为所属的渠道。
示例性的,由于商家或企业通过多种渠道进行信息的推广,用户可以通过任一渠道触达访问行为,也可通过搜索推广信息,直接触达任一访问行为。因此,在确定各访问行为所属渠道时,要先根据用户的访问行为数据确定用户是否是通过任一渠道触达任一访问行为。可选的,具体的确定方法本发明实施例不进行限定。可以是根据用户的访问行为的时间数据,判断在该时间之前预设时间段内是否使用过推广渠道,若使用过,则说明用户是通过任一渠道触达该访问行为的;还可以是根据用户的访问行为的数据源,判断该数据源中是否存在渠道标识,若存在,说明用户是通过任一渠道触达访问行为的等。
可选的,若根据用户的访问行为数据,确定用户通过任一渠道触达任一访问行为,则直接将触达该访问行为的渠道作为该用户的访问行为所属的渠道。例如,用户是通过微信渠道触达某购物网站的浏览行为,则该浏览行为所属渠道为微信渠道。
可选的,若根据用户的访问行为数据,确定用户的访问行为是直接触达的并没通过任一渠道,则此时可以将该用户上一次触达该推广的访问行为所属的渠道,作为当前直接触达的访问行为所述的渠道。例如,用户A本次直接搜索某购物网站浏览商品,本次的浏览行为没有通过任一渠道触达,则可以是获取用户A上次触达该购物网站产生的访问行为所属的渠道,并将该渠道作为用户A本次浏览行为所属的渠道。对于用户来说通过推广渠道了解推广产品后,下一次可以不通过推广渠道,直接触达推广产品产生相应的访问行为,但是,本次用户触达推广产品还是要归因于上一次通过推广渠道了解到该产品,因此将直接触达的访问行为的所属渠道确定为该用户的上一渠道。
需要说明的是,本发明实施例可以是按照上述方法,对所有目标行为的用户的访问行为序列都确定各访问行为所属的渠道,然后再执行S405。
S405,根据用户触达目标行为的渠道序列,确定渠道的归因得分。
本发明实施例提供了一种全链路多渠道归因方法,基于访问行为数据的各类标识信息对访问行为数据进行聚合,在确定用户触达目标行为的所属渠道序列时,将用户通过渠道触达的访问行为和用户通过直接访问、搜索自然流量等直接触达的访问行为分开考虑确定所属渠道序列,进一步提高了全链路多渠道归因的分析的准确性。
实施例四
图5为本发明实施例四提供的一种全链路多渠道归因装置的结构框图,该装置可执行本发明任意实施例所提供的全链路多渠道归因方法,具备执行方法相应的功能模块和有益效果。如图5所示,该装置可以包括:
数据聚合模块501,用于根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;
渠道序列确定模块502,用于根据所述用户的访问行为序列,确定所述用户触达目标行为的渠道序列;
归因得分确定模块503,用于根据所述用户触达目标行为的渠道序列,确定渠道的归因得分。
本实施例提供了一种全链路多渠道归因装置,通过基于访问行为数据的各类标识信息对访问行为数据进行聚合,根据聚合得到的目标行为的用户访问行为序列确定该用户触达目标行为的渠道序列,进而确定各渠道的归因得分。能够完整的捕捉同一用户在各渠道下的归因效果,提高了多渠道归因的准确性。
进一步的,所述访问行为数据的各类标识信息包括访问行为数据的宿主方注册标识,第三方登录载体标识和埋点方标识。
进一步的,上述数据聚合模块501具体用于:
若任意一组访问行为数据的任意一类标识信息相同,则确定该组访问行为数据属于同一用户,并为该组访问行为数据生成统一标识信息。
进一步的,上述数据聚合模块501,包括:
聚合单元,用于根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;
筛选单元,用于若任一目标行为的用户的访问行为序列中的访问行为数量大于访问行为阈值,则根据各访问行为的标识类型,对该用户的各访问行为进行筛选。
进一步的,上述筛选单元具体用于:
从该用户的各访问行为中选择标识类型是第三方登录载体标识或宿主方注册标识的访问行为,组成该用户的访问行为序列。
进一步的,上述渠道序列确定模块502具体用于:
若根据所述用户的访问行为数据,确定所述用户通过任一渠道触达任一访问行为,则将该渠道作为所述用户的该访问行为所属的渠道。
实施例五
图6为本发明实施例五提供的一种服务器的结构示意图。图6示出了适于用来实现本发明实施方式的示例性服务器60的框图。图6显示的服务器60仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图6所示,该服务器60以通用计算设备的形式表现。该服务器60的组件可以包括但不限于:一个或者多个处理器或者处理单元601,系统存储器602,连接不同系统组件(包括系统存储器602和处理单元601)的总线603。
总线603表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器60典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器60访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器602可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)604和/或高速缓存存储器605。服务器60可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统606可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线603相连。系统存储器602可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块607的程序/实用工具608,可以存储在例如系统存储器602中,这样的程序模块607包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块607通常执行本发明所描述的实施例中的功能和/或方法。
服务器60也可以与一个或多个外部设备609(例如键盘、指向设备、显示器610等)通信,还可与一个或者多个使得用户能与该设备交互的设备通信,和/或与使得该服务器60能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口611进行。并且,服务器60还可以通过网络适配器612与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图6所示,网络适配器612通过总线603与服务器60的其它模块通信。应当明白,尽管图中未示出,可以结合服务器60使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元601通过运行存储在系统存储器602中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的全链路多渠道归因方法。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可实现上述实施例所述的全链路多渠道归因方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
上述实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员应该明白,上述的本发明实施例的各模块或各操作可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或操作制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间的相同或相似的部分互相参见即可。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种全链路多渠道归因方法,其特征在于,包括:
根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;
根据所述用户的访问行为序列,确定所述用户触达目标行为的渠道序列;
根据所述用户触达目标行为的渠道序列,确定渠道的归因得分。
2.根据权利要求1所述的方法,其特征在于,所述访问行为数据的各类标识信息包括访问行为数据的宿主方注册标识,第三方登录载体标识和埋点方标识。
3.根据权利要求1所述的方法,其特征在于,根据访问行为数据的各类标识信息对访问行为数据进行聚合,包括:
若任意一组访问行为数据的任意一类标识信息相同,则确定该组访问行为数据属于同一用户,并为该组访问行为数据生成统一标识信息。
4.根据权利要求1所述的方法,其特征在于,根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列,包括:
根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;
若任一目标行为的用户的访问行为序列中的访问行为数量大于访问行为阈值,则根据各访问行为的标识类型,对该用户的各访问行为进行筛选。
5.根据权利要求4所述的方法,其特征在于,根据各访问行为的标识类型,对该用户的各访问行为进行筛选,包括:
从该用户的各访问行为中选择标识类型是第三方登录载体标识或宿主方注册标识的访问行为,组成该用户的访问行为序列。
6.根据权利要求1所述的方法,其特征在于,根据所述用户的访问行为序列,确定所述用户触达目标行为的渠道序列,包括:
若根据所述用户的访问行为数据,确定所述用户通过任一渠道触达任一访问行为,则将该渠道作为所述用户的该访问行为所属的渠道。
7.一种全链路多渠道归因装置,其特征在于,包括:
数据聚合模块,用于根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;
渠道序列确定模块,用于根据所述用户的访问行为序列,确定所述用户触达目标行为的渠道序列;
归因得分确定模块,用于根据所述用户触达目标行为的渠道序列,确定渠道的归因得分。
8.根据权利要求7所述的装置,其特征在于,所述访问行为数据的各类标识信息包括访问行为数据的宿主方注册标识,第三方登录载体标识和埋点方标识。
9.根据权利要求7所述的装置,其特征在于,所述数据聚合模块具体用于:
若任意一组访问行为数据的任意一类标识信息相同,则确定该组访问行为数据属于同一用户,并为该组访问行为数据生成统一标识信息。
10.根据权利要求7所述的装置,其特征在于,所述数据聚合模块,包括:
聚合单元,用于根据访问行为数据的各类标识信息对访问行为数据进行聚合,得到目标行为的用户的访问行为序列;
筛选单元,用于若任一目标行为的用户的访问行为序列中的访问行为数量大于访问行为阈值,则根据各访问行为的标识类型,对该用户的各访问行为进行筛选。
11.根据权利要求10所述的装置,其特征在于,所述筛选单元具体用于:
从该用户的各访问行为中选择标识类型是第三方登录载体标识或宿主方注册标识的访问行为,组成该用户的访问行为序列。
12.根据权利要求7所述的装置,其特征在于,所述渠道序列确定模块具体用于:
若根据所述用户的访问行为数据,确定所述用户通过任一渠道触达任一访问行为,则将该渠道作为所述用户的该访问行为所属的渠道。
13.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6任一项所述的全链路多渠道归因方法。
14.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6任一项所述的全链路多渠道归因方法。
CN201811438157.7A 2018-11-27 2018-11-27 全链路多渠道归因方法、装置、服务器及存储介质 Active CN111310061B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811438157.7A CN111310061B (zh) 2018-11-27 2018-11-27 全链路多渠道归因方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811438157.7A CN111310061B (zh) 2018-11-27 2018-11-27 全链路多渠道归因方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN111310061A true CN111310061A (zh) 2020-06-19
CN111310061B CN111310061B (zh) 2023-12-15

Family

ID=71159563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811438157.7A Active CN111310061B (zh) 2018-11-27 2018-11-27 全链路多渠道归因方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN111310061B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200618A (zh) * 2020-10-29 2021-01-08 上海优扬新媒信息技术有限公司 消息渠道归因方法、装置及系统
CN112529634A (zh) * 2020-12-18 2021-03-19 恩亿科(北京)数据科技有限公司 基于大数据的转化链路分析方法、系统和计算机设备
CN113095892A (zh) * 2021-04-30 2021-07-09 北京大米科技有限公司 一种数据处理方法及装置
CN113641366A (zh) * 2021-07-27 2021-11-12 北京达佳互联信息技术有限公司 应用安装转化的归因方法、装置、设备以及存储介质
CN114140031A (zh) * 2022-01-28 2022-03-04 支付宝(杭州)信息技术有限公司 对用户行为进行归因分析的方法和装置
CN114374595A (zh) * 2022-01-13 2022-04-19 平安普惠企业管理有限公司 事件节点归因分析方法、装置、电子设备及存储介质
CN114880554A (zh) * 2022-04-19 2022-08-09 北京达佳互联信息技术有限公司 数据展示方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105743988A (zh) * 2016-03-30 2016-07-06 新浪网技术(中国)有限公司 网络用户追踪实现方法、装置及系统
CN106407254A (zh) * 2016-08-23 2017-02-15 百度在线网络技术(北京)有限公司 用户点击行为链的处理方法及装置
CN106446228A (zh) * 2016-10-08 2017-02-22 中国工商银行股份有限公司 一种web页面数据的采集分析方法及装置
CN106708841A (zh) * 2015-11-12 2017-05-24 北京国双科技有限公司 网站访问路径的聚合方法和装置
CN107343047A (zh) * 2017-07-06 2017-11-10 北京奇虎科技有限公司 应用推广系统及方法
CN107563781A (zh) * 2016-06-30 2018-01-09 阿里巴巴集团控股有限公司 一种信息投放效果归因方法及装置
CN107710263A (zh) * 2015-12-14 2018-02-16 谷歌有限责任公司 商店访问数据创建和管理
US20180308123A1 (en) * 2011-08-01 2018-10-25 Google Inc. System and method for fractional attribution utilizing aggregated advertising information
CN108876479A (zh) * 2018-07-18 2018-11-23 口口相传(北京)网络技术有限公司 对象实体的渠道归因方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180308123A1 (en) * 2011-08-01 2018-10-25 Google Inc. System and method for fractional attribution utilizing aggregated advertising information
CN106708841A (zh) * 2015-11-12 2017-05-24 北京国双科技有限公司 网站访问路径的聚合方法和装置
CN107710263A (zh) * 2015-12-14 2018-02-16 谷歌有限责任公司 商店访问数据创建和管理
CN105743988A (zh) * 2016-03-30 2016-07-06 新浪网技术(中国)有限公司 网络用户追踪实现方法、装置及系统
CN107563781A (zh) * 2016-06-30 2018-01-09 阿里巴巴集团控股有限公司 一种信息投放效果归因方法及装置
CN106407254A (zh) * 2016-08-23 2017-02-15 百度在线网络技术(北京)有限公司 用户点击行为链的处理方法及装置
CN106446228A (zh) * 2016-10-08 2017-02-22 中国工商银行股份有限公司 一种web页面数据的采集分析方法及装置
CN107343047A (zh) * 2017-07-06 2017-11-10 北京奇虎科技有限公司 应用推广系统及方法
CN108876479A (zh) * 2018-07-18 2018-11-23 口口相传(北京)网络技术有限公司 对象实体的渠道归因方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
业宁,李威,梁作鹏,董逸生: "一种web用户行为聚类算法", 《小型微型计算机系统》, pages 1364 - 1367 *
肖宗花: "基于用户访问行为与内容的用户聚类算法的研究与实现", 《中国优秀硕士学位论文全文数据库》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200618A (zh) * 2020-10-29 2021-01-08 上海优扬新媒信息技术有限公司 消息渠道归因方法、装置及系统
CN112529634A (zh) * 2020-12-18 2021-03-19 恩亿科(北京)数据科技有限公司 基于大数据的转化链路分析方法、系统和计算机设备
CN113095892A (zh) * 2021-04-30 2021-07-09 北京大米科技有限公司 一种数据处理方法及装置
CN113095892B (zh) * 2021-04-30 2024-05-31 北京大米科技有限公司 一种数据处理方法及装置
CN113641366A (zh) * 2021-07-27 2021-11-12 北京达佳互联信息技术有限公司 应用安装转化的归因方法、装置、设备以及存储介质
CN114374595A (zh) * 2022-01-13 2022-04-19 平安普惠企业管理有限公司 事件节点归因分析方法、装置、电子设备及存储介质
CN114374595B (zh) * 2022-01-13 2024-03-15 平安普惠企业管理有限公司 事件节点归因分析方法、装置、电子设备及存储介质
CN114140031A (zh) * 2022-01-28 2022-03-04 支付宝(杭州)信息技术有限公司 对用户行为进行归因分析的方法和装置
CN114880554A (zh) * 2022-04-19 2022-08-09 北京达佳互联信息技术有限公司 数据展示方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111310061B (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
CN111310061B (zh) 全链路多渠道归因方法、装置、服务器及存储介质
US20220014552A1 (en) Detecting malicious behavior using an accomplice model
CN111127051B (zh) 多渠道动态归因方法、装置、服务器及存储介质
US20210314354A1 (en) Techniques for determining threat intelligence for network infrastructure analysis
CA2896819C (en) Identifying business type using public information
US11275748B2 (en) Influence score of a social media domain
KR102504075B1 (ko) 사용자 디바이스 이벤트의 매칭 및 속성
JP7105356B2 (ja) エンティティのアカウントへのマッピング
JP6557357B2 (ja) モバイル・アプリケーションに関連付けられたコンテンツ・アイテムのデバイスベースのフィルタリング
WO2011123118A1 (en) Multi-factor promotional offer suggestion
US10628510B2 (en) Web link quality analysis and prediction in social networks
US20170357987A1 (en) Online platform for predicting consumer interest level
CN108512822B (zh) 一种数据处理事件的风险识别方法和装置
CN109284450B (zh) 订单成单路径的确定方法及装置、存储介质、电子设备
US20150302088A1 (en) Method and System for Providing Personalized Content
US20120330928A1 (en) Method and Apparatus for Generating a Fused View of One or More People
CN110674404A (zh) 链接信息生成方法、装置、系统、存储介质及电子设备
US20160027025A1 (en) Systems and methods of counting unique interactions between users of a software application
KR101607919B1 (ko) 메신저에 검색 기능을 제공하고 검색 결과를 정렬하는 방법과 시스템 및 기록 매체
CN110633405A (zh) 用于推送信息的方法和装置
Fletcher et al. Practical web traffic analysis: standards, privacy, techniques, and results
CN113327146A (zh) 一种信息追踪方法和装置
CN110674426A (zh) 网页行为上报方法和装置
CN110716911A (zh) 数据处理方法及装置、电子设备、存储介质
CN111353864B (zh) 一种产品推荐方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant