CN103605736B - 转化数据的处理方法及装置 - Google Patents

转化数据的处理方法及装置 Download PDF

Info

Publication number
CN103605736B
CN103605736B CN201310585781.0A CN201310585781A CN103605736B CN 103605736 B CN103605736 B CN 103605736B CN 201310585781 A CN201310585781 A CN 201310585781A CN 103605736 B CN103605736 B CN 103605736B
Authority
CN
China
Prior art keywords
aggregation process
information
source
conversion data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310585781.0A
Other languages
English (en)
Other versions
CN103605736A (zh
Inventor
陈改静
杨基彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201310585781.0A priority Critical patent/CN103605736B/zh
Publication of CN103605736A publication Critical patent/CN103605736A/zh
Application granted granted Critical
Publication of CN103605736B publication Critical patent/CN103605736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种转化数据的处理方法和装置。其中,该方法包括:获取转化数据和转化数据的来源信息;分别对转化数据进行汇总处理,对转化数据的来源信息进行汇总处理,对转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果,其中,汇总处理结果包括:转化数据汇总结果、来源信息汇总结果和筛选后来源信息汇总结果;对汇总处理结果进行归因处理或非归因处理,生成最终数据。通过本发明,能够实现避免了大量数据的重复导入,减少了系统处理时间。

Description

转化数据的处理方法及装置
技术领域
本发明涉及计算机数据处理领域,具体而言,涉及一种转化数据的处理方法和装置。
背景技术
在计算机互联网的应用中,在用户访问目标网站之后,一般会产生一系列的操作,例如用户访问新浪网页之后,可以在新浪网上进行注册操作、点击浏览操作、购买付款操作等,上述在访问网页之后,用户进行的各种操作所生成的数据为转化数据。下面以访问者利用访问网页产品来进行购物的过程进行详细说明。
访问者在购买产品之前,往往会多次访问目标网站反复确认比较后才会购买,也就是说,访问者曾多次访问过目标网站,在其中的一次访问时发生了购买行为,通常情况下会转化归功于发生购买的那一次访问的来源渠道,但是购买之前的那些访问也对购买行为起到了一定的作用,因此我们将购买产生的转化按照一定的算法模型归功给不同的渠道来源。这些算法模型即归因模型,包含就近模型,首次模型,均摊模型,前4次以及最近次均摊模型等。
就近模型:将每一次转化的价值分配该转化回溯时间窗口内最近1次有效渠道;首次模型:将每一次转化的价值分配该转化回溯时间窗口内第1次有效渠道;均摊模型:将每一次转化的价值平均分配该转化回溯时间窗口内所有有效渠道;前4次以及最近次均摊模型:将每一次转化的价值平均分配该转化回溯时间窗口内前4次以及最近1次有效渠道;
如图1所示,在应用了归因模型后,转化数据从物料收集系统导入到物料管理系统时,会先将数据进行初步处理后再导入,然后在物料管理系统里进行归因处理。物料管理系统中,展示给用户的是经过归因处理后的转化数据,而一些用户会想要看未进行归因处理过的数据,如图2所示,也就是转化值直接分配给产生转化的那个有效渠道,使用最接近的模型就近模型产生的数据还是会细微差距。因此如果给用户同时展示经过归因处理和未经过归因处理的数据时,一份源数据需要导入两次,经过两次处理(归因和非归因处理)。具体的,图1中获取entrance的汇总处理过程主要是将访问者和来源渠道进行对接的过程,而获取conversion的汇总会有数据的统计过程。图2中获取entrance的汇总处理是将会话和来源渠道进行对接的过程,实际上就是多个数据表通过会话和时间进行关联的过程。
目前针对相关技术的在对转化数据进行汇总处理过程中,会产生大量数据的重复处理和导入的问题,目前尚未提出有效的解决方案。会产生大量数据的重复导入,花费大量时间。
发明内容
针对相关技术的在对转化数据进行汇总处理过程中,会产生大量数据的重复处理和导入的问题,目前尚未提出有效的解决方案,为此,本发明的主要目的在于提供一种转化数据的处理方法和装置,以解决上述问题。
为了实现上述目的,根据本发明的一个方面,提供了一种转化数据的处理方法,该方法包括:获取转化数据和转化数据的来源信息;分别对转化数据进行汇总处理,对转化数据的来源信息进行汇总处理,对转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果,其中,汇总处理结果包括:转化数据汇总结果、来源信息汇总结果和筛选后来源信息汇总结果;对汇总处理结果进行归因处理或非归因处理,生成最终数据。
获取转化数据和转化数据的来源信息;对筛选后的转化来源信息汇总处理、转化来源信息汇总处理和转化数据汇总处理,获取汇总处理结果,汇总处理结果包括对转化数据的筛选后的来源信息汇总处理结果、来源信息汇总处理结果和转化数据信息汇总处理结果;对汇总处理结果进行归因处理或非归因处理,生成最终数据。
为了实现上述目的,根据本发明的另一方面,提供了一种转化数据的处理装置,该装置包括:获取模块,用于获取转化数据和转化数据的来源信息;汇总处理模块,用于分别对转化数据进行汇总处理,对转化数据的来源信息进行汇总处理,对转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果,其中,汇总处理结果包括:转化数据汇总结果、来源信息汇总结果和筛选后来源信息汇总结果;归因或非归因处理模块,用于对汇总处理结果进行归因处理或非归因处理,生成最终数据。
通过本发明,采用获取转化数据和转化数据的来源信息;分别对转化数据进行汇总处理,对转化数据的来源信息进行汇总处理,对转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果,其中,汇总处理结果包括:转化数据汇总结果、来源信息汇总结果和筛选后来源信息汇总结果;对汇总处理结果进行归因处理或非归因处理,生成最终数据,解决了相关技术的在对转化数据进行汇总处理过程中,会产生大量数据的重复处理和导入的问题,进而实现避免了大量数据的重复导入,减少了系统处理时间的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据相关现有技术的归因模型的数据处理流程示意图;
图2是根据相关现有技术的非归因模型的数据处理流程示意图;
图3是根据本发明实施例的转化数据的处理方法的流程示意图;
图4是根据本发明实施例的转化数据的处理方法的详细流程示意图;以及
图5是根据本发明实施例的转化数据的处理装置的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本申请涉及到的会话(session)是指一个终端用户与交互系统进行通信的时间间隔,例如从注册进入系统到注销退出系统之间所经过的时间。具体到Web中的Session指的就是用户在浏览某个网站时,从进入网站到浏览器关闭所经过的这段时间,也就是用户浏览这个网站所花费的时间。需要注意的是,一个Session的概念需要包括特定的客户端,特定的服务器端以及不中断的操作时间。引用Session则可以让一个用户访问多个页面之间的切换也会保留该用户的信息。
其中,Session信息对客户来说,不同的用户用不同的Session信息来记录,各个用户的Session对象互不干扰。A用户和C服务器建立连接时所处的Session同B用户和C服务器建立连接时所处的Session是两个不同的Session。
Session与Cookie是紧密相关的。Session的使用要求用户浏览器必须支持Cookie,如果浏览器不支持使用Cookie,或者设置为禁用Cookie,那么将不能使用Session。
本申请实施例中,可以采用会话或者访问者来统计用户的行为数据,一个访问者可能先后发生过若干会话,归因模型汇总的最小单位是访问者和时间,非归因模型汇总的最小数据是会话和时间。
实施例一:
在其最基本的配置中,图3是根据本发明实施例的转化数据的处理方法的流程示意图;图4是根据本发明实施例的转化数据的处理方法的详细流程示意图。
如图3所示,该转化数据的处理方法包括如下步骤:
步骤S10,获取转化数据和转化数据的来源信息。
步骤S30,分别对转化数据进行汇总处理,对转化数据的来源信息进行汇总处理,对转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果,其中,汇总处理结果包括:转化数据汇总结果、来源信息汇总结果和筛选后来源信息汇总结果。
步骤S50,对汇总处理结果进行归因处理或非归因处理,生成最终数据。
需要说明的是,本申请上述实施例中的转化数据的来源信息Entrance用于记录转化的来源信息,主要是指用户访问目标对象时的访问渠道的相关信息,例如,用户可以通过搜索引擎这个渠道的输入框输入关键字来搜索得到目标对象、用户可以通过一些网站推送的广告来进入目标网站,或者直接输入目标网站的链接地址,其中,搜索引擎、来源类型、来源网站、关键字,是否付费广告等都是来源信息。而转化数据conversion即用户访问目标网站之后,产生一系列的操作时记录的转化数据的部分,转化数据可以包括多种类型(例如,点击数、跳出率等),而来源信息只需要一份。
具体的,上述方案实现了对转化数据进行汇总处理,对转化来源信息进行汇总,对转化来源信息筛选后汇总。其中,转化数据的汇总指的是转化值得汇总,比如点击数据的汇总,可能会涉及到数据计算比如求和的汇总;转化来源信息的汇总指的是转化来源广告类型等信息的汇总,比如会话、关键词等信息的汇总,主要是广告数据的关联,数据的对接,一般不涉及数据的计算;对筛选后的转化来源信息汇总处理结果,应该是针对每种转化,将其数据按照某种粒度进行汇总,是对转化数据的汇总。
本申请上述实施例所提供的方案,由于一份源数据只需要导入一次,然后分别进行对应的各种汇总处理,在得到汇总处理结果之后,统一进行归因处理或非归因处理,生成最终数据,即实现了将归因模型和非归因模型数据处理过程中一致的地方合并,不同的地方分别处理,从而减少了数据量、节省了处理时间从而在将数据分成转化数据和转化数据的来源信息的两个部分导入,使得处理更方便快捷,且可以节省资源的同时,避免了在对转化数据进行汇总处理过程中,会产生大量数据的重复处理和导入的问题,从而避免了大量数据的重复导入,减少了系统处理时间。
由此可知,本方案的核心思想是将归因模型和非归因模型数据处理过程中一致的地方合并,不同的地方分开处理。通过对比本方案和以前解决方案,可以发现本发明有如下的优点:可以同时支持归因和非归因的数据处理,不需要同时导入两份数据、做两次数据处理,减少了传递的数据量和处理时间。
具体的,本申请上述实施例涉及到的归因处理是指将按访问者和时间汇总后的conversion数据和entrance数据按照归因模型的原理进行对接,然后导入相应的数据库表中。而非归因处理是指:将汇总后的转化数据和entrance数据按照sessionkey和时间进行对接,然后导入相应的数据库表中。
如图4所示,本申请上述实施例中,步骤S30分别对转化数据进行汇总处理,对转化数据的来源信息进行汇总处理,对转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果的步骤可以包括如下处理方式:
本实施例提供的一种处理方式如下:
首先,对转化数据的来源信息进行初始筛选处理,获取通过预定渠道收集的转化数据的来源信息。具体的,如图4所示,该步骤实现的初始筛选处理主要是对来源的渠道信息的初始选择。
具体的,本申请上述步骤中的初始筛选处理是为后面的汇总也就是数据关联进行初步过滤的过程,根据来源渠道的相关信息在重复的数据中选择期望的数据,使得后续在关联的时候,数据是唯一的。例如,当以访问者为单位统计的时候,如果访问者某个时间产生的一个会话包含了若干个来源渠道,那么系统会根据来源渠道的信息给这次访问选择一个来源渠道作为此会话的有效来源渠道。比如会话信息中可能记录了:是否含有可以识别的参数(比如在百度投放的广告url中添加了某些特定的参数,通过识别这些参数可以了解到,访问者通过点击百度的付费广告来,此广告是百度的哪种广告,其关键词、推广计划、推广单元等),是否记录了搜索引擎,是否记录了来源渠道等。根据会话中的信息,来选择有效的来源渠道;
如果包含了可以识别的参数,那么我们可以更多的了解到用户的行为,这些数据是我们最希望得到的,因此我们把这个渠道作为最优先的选择;其次是我们希望分析的是搜索引擎的广告数据,因此如果有搜索引擎记录也是我们希望的;再次如果有来源渠道记录,也方便我们分析数据,也是我们希望得到的信息;那么如果会话没有相关信息的记录,就不太方便分析这些数据,是我们最不希望的,因此排在最后;根据上面的优先级,我们将会话和来源渠道进行关联,做最初的过滤。
上述整个数据处理过程中,将数据分成两部分处理,一部分主要是来源渠道相关数据,一部分是转化数据,两部分数据通过访问者id或者会话id关联。
一般情况下,本申请上述实施例中,归因模型是以人为中心的,所有的数据最后都汇总到人这个单位上,会将此人产生的会话进行综合分析,根据模型将转化归功于合理的那个。不使用归因模型则以会话为单位,不会管会话之间是否有关联,是否是同一个人产生的,转化是在哪个会话中发生的就会归功于哪个会话。如果不使用归因模型,那么会话的来源渠道默认为是着陆页面的渠道,也就是会话生成时,访问网站的来源渠道,不会管这个来源渠道是什么,有没有相关信息。
会话的数据表中最小的单位是会话和时间,也就是一次会话就是一条数据,但是会话相关的信息可能有若干条,比如若干来源渠道信息,比如访问了若干页面等,本申请中会话的原始数据如下表1所示:
表1:
然后,按照第一粒度汇总方式对通过预定渠道收集的转化数据的来源信息进行汇总处理,生成筛选后的来源信息汇总处理结果。具体的,此处的第一粒度汇总方式为以(访问者+时间)为粒度的汇总处理,得到Entrance(E1)。
具体的,原始数据表中是访问(会话)的信息表,包含访问者信息如visitorid,访问信息如sessionid和访问时间等,一个访问者可能先后发生过若干次会话,上述步骤中的汇总处理实际上是通过visitor和时间进行数据关联的过程,通过前面的筛选后进行唯一的关联,详细如下表2所示:
表2
本实施例提供的另外一种处理方式如下:按照第二粒度汇总方式对转化数据的来源信息进行汇总处理,生成来源信息汇总处理结果。具体的,此处的第二粒度会总方式为以(会话+时间)为粒度汇总处理,得到Entrance(E2)
具体的,本申请上述处理方式中采用会话和时间为粒度汇总,实际上是根据会话和时间信息进行数据关联的过程。其中关联的来源渠道为产生会话的首个渠道。详细如下表3所示:
表3:
本实施例提供的又一种处理方式如下:按照第二粒度汇总方式对转化数据进行汇总处理,生成转化类型信息汇总处理结果。具体的,此处的第二粒度会总方式为以(会话+时间)为粒度汇总处理,得到Conversion(C)。
具体的,以访问次数数据为例,访问次数即会话表中的会话数量,也就是说一个会话就有一条数据,详细如下表4所示:
表4
由上可知,本申请上述实施例提供的方案实现了对原始转化数据的汇总处理。其中,将转化数据部分以会话和时间为粒度进行汇总(C),而将转化数据的来源信息分别处理两次,一次作初始处理后以访问者和时间为粒度进行汇总处理,得到汇总处理结果(E1),一份以会话和时间为粒度汇总处理,得到汇总处理结果(E2),最后,将汇总后的数据导入物料管理系统。
优选地,如图4所示,本申请上述实施例中,步骤S50对汇总处理结果进行归因处理或非归因处理,生成最终数据的步骤可以包括如下步骤:
首先,读取来源信息汇总处理结果和转化数据信息汇总处理结果。
然后,对来源信息汇总处理结果和转化数据信息汇总处理结果进行非归因处理,生成第一最终数据。
具体的,上述实施例中涉及到的非归因处理即通过sessionkey和时间将entrance数据和conversion数据进行关联的过程。例如会生成如下表5:
表5
优选地,如图4所示,本申请上述实施例中,在对来源信息汇总处理结果和转化类型信息汇总处理结果进行非归因处理,生成第一最终数据之后,方法还可以包括如下步骤:
首先,读取转化类型信息汇总处理结果。
然后,按照第一粒度汇总方式对转化数据信息汇总处理结果进行汇总处理,得到转化数据中间结果。该第一粒度汇总方式为以访问者加时间为粒度进行汇总处理。
接着,获取筛选后的来源信息汇总处理结果和转化数据中间结果。
最后,对筛选后的来源信息汇总处理结果和转化数据中间结果进行归因处理,生成最终数据。
具体的,本申请上述实施例中涉及到的归因模型可以有若干个,包含就近模型,首次模型,均摊模型,前4次以及最近次均摊模型等。
其中,就近模型:将每一次转化的价值分配该转化回溯时间窗口内最近1次有效渠道;
首次模型:将每一次转化的价值分配该转化回溯时间窗口内第1次有效渠道;
均摊模型:将每一次转化的价值平均分配该转化回溯时间窗口内所有有效渠道;
前4次以及最近次均摊模型:将每一次转化的价值平均分配该转化回溯时间窗口内前4次以及最近1次有效渠道;
时间回溯范围在我们的系统中定义的是90天,也就是说,我们要将访问者的转化数据分配给这次转化发生的时间往前90天范围的同一访问者某个来源渠道,通俗的讲,如就近模型就是将转化分配给产生转化的时间点之前最接近的访问者来源渠道,首次模型即分配给此访问者90天内最早的那一次访问的来源渠道,均摊模型,就是将转化平均分配给90天内访问者产生访问的所有渠道,前4次以及最近次均摊模型,就是平均分配给最早的四次访问渠道和最近的一次访问渠道。根据模型的不同生成不同的数据表。例如上述实例数据按照首次模型生成的数据如下表6:
表6:
由上可知,本申请上述实施例提供的方案中,在将汇总后的数据导入物料管理系统之后,可以将以会话和时间为粒度汇总的转化结果(C)和来源信息汇总处理结果(E2)的数据进行非归因处理后进行存储,然后将以会话和时间为粒度汇总的转化数据(C)按照访问者和时间为粒度再次进行汇总处理,将处理结果再和以访问者和时间为粒度进行汇总处理得到的来源信息汇总处理结(E1)一起进行归因处理后进行存储。从而实现将归因和非归因处理后的数据进行后续处理,生成最终数据。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例二:
在描述本申请的各实施例的进一步细节之前,将参考图5来描述可用于实现本申请的原理的一个合适的计算体系结构。在以下描述中,除非另外指明,否则将参考由一个或多个计算机执行的动作和操作的符号表示来描述本申请的各实施例。由此,可以理解,有时被称为计算机执行的这类动作和操作包括计算机的处理单元对以结构化形式表示数据的电信号的操纵。这一操纵转换了数据或在计算机的存储器系统中的位置上维护它,这以本领域的技术人员都理解的方式重配置或改变了计算机的操作。维护数据的数据结构是具有数据的格式所定义的特定属性的存储器的物理位置。然而,尽管在上述上下文中描述本申请,但它并不意味着限制性的,如本领域的技术人员所理解的,后文所描述的动作和操作的各方面也可用硬件来实现。
转向附图,其中相同的参考标号指代相同的元素,本申请的原理被示为在一个合适的计算环境中实现。以下描述基于所述的本申请的实施例,并且不应认为是关于此处未明确描述的替换实施例而限制本申请。
图5是根据本发明实施例的转化数据的处理装置的结构示意图,示出了可用于这些设备的一个示例计算机体系装置结构的示意图。出于描述的目的,所绘的体系结构仅为合适环境的一个示例,并非对本申请的使用范围或功能提出任何局限。也不应将该计算系统解释为对图5所示的任一组件或其组合具有任何依赖或需求。
如图5所示,该转化数据的处理装置可以包括:一获取模块、一汇总处理模块、一归因或非归因处理模块。
其中,获取模块,用于获取转化数据和转化数据的来源信息;汇总处理模块,用于对转化数据的来源信息进行汇总处理,对转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果,其中,汇总处理结果包括:转化数据汇总结果、来源信息汇总结果和筛选后来源信息汇总结果;归因或非归因处理模块,用于对汇总处理结果进行归因处理或非归因处理,生成最终数据。
需要说明的是,本申请上述实施例中的转化数据的来源信息Entrance用于记录转化的来源信息,即用户访问目标对象时的访问渠道的信息,例如,用户可以通过搜索引擎这个渠道的输入框输入关键字来搜索得到目标对象、用户可以通过一些网站推送的广告来进入目标网站,或者直接输入目标网站的链接地址。而转化数据conversion即用户访问目标网站之后,产生一系列的操作时记录的转化数据的部分,转化数据可以包括多种类型(例如,点击数、跳出率等),而来源信息只需要一份。
本申请上述实施例所提供的方案,由于一份源数据只需要导入一次,然后分别进行对应的各种汇总处理,在得到汇总处理结果之后,统一进行归因处理或非归因处理,生成最终数据,即实现了将归因模型和非归因模型数据处理过程中一致的地方合并,不同的地方分别处理,从而减少了数据量、节省了处理时间从而在将数据分成转化数据和转化数据的来源信息的两个部分导入,使得处理更方便快捷,且可以节省资源的同时,避免了在对转化数据进行汇总处理过程中,会产生大量数据的重复处理和导入的问题,从而避免了大量数据的重复导入,减少了系统处理时间
由此可知,本方案的核心思想是将归因模型和非归因模型数据处理过程中一致的地方合并,不同的地方分开处理。通过对比本方案和以前解决方案,可以发现本发明有如下的优点:可以同时支持归因和非归因的数据处理,不需要同时导入两份数据、做两次数据处理,减少了传递的数据量和处理时间。
优选地,一种实施例中,本申请上述实施例中的汇总处理模块可以包括:初始处理模块,用于对转化数据的来源信息进行初始筛选处理,获取通过预定渠道收集的转化数据的来源信息;第一子生成模块,用于按照第一粒度汇总方式对通过预定渠道收集的转化数据的来源信息进行汇总处理,生成筛选后的来源信息汇总处理结果。
优选地,另一种实施例中,本申请上述实施例中的汇总处理模块可以包括:第二子生成模块,用于按照第二粒度汇总方式对转化数据的来源信息进行汇总处理,生成来源信息汇总处理结果。
优选地,又一种实施例中,本申请上述实施例中的汇总处理模块可以包括:第三子生成模块,用于按照第二粒度汇总方式对转化数据进行汇总处理,生成转化数据信息汇总处理结果。
优选地,本申请上述实施例中的归因或非归因处理模块可以包括:第一读取模块,用于读取来源信息汇总处理结果和转化类型信息汇总处理结果;非归因处理模块,用于对来源信息汇总处理结果和转化类型信息汇总处理结果进行非归因处理,生成第一最终数据。
优选地,本申请上述实施例中的装置还可以包括:第二读取模块,用于读取转化类型信息汇总处理结果;汇总模块,用于按照第一粒度汇总方式对转化类型信息汇总处理结果进行汇总处理,得到转化类型中间结果;子获取模块,用于获取筛选后的来源信息汇总处理结果和转化类型中间结果;归因处理模块,用于对筛选后的来源信息汇总处理结果和转化类型中间结果进行归因处理,生成最终数据。
从以上的描述中,可以看出,本发明实现了如下技术效果:本申请上述实施例所提供的方案,由于一份源数据只需要导入一次,然后分别进行对应的各种汇总处理,在得到汇总处理结果之后,统一进行归因处理或非归因处理,生成最终数据,即实现了将归因模型和非归因模型数据处理过程中一致的地方合并,不同的地方分别处理,从而减少了数据量、节省了处理时间从而在将数据分成转化数据和转化数据的来源信息的两个部分导入,使得处理更方便快捷,且可以节省资源的同时,避免了在对转化数据进行汇总处理过程中,会产生大量数据的重复处理和导入的问题。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种转化数据的处理方法,其特征在于,包括:
获取转化数据和所述转化数据的来源信息;
分别对所述转化数据进行汇总处理,对所述转化数据的来源信息进行汇总处理,对所述转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果,其中,所述汇总处理结果包括:转化数据汇总结果、来源信息汇总结果和筛选后来源信息汇总结果;
对所述汇总处理结果进行归因处理或非归因处理,生成最终数据;
其中,分别对所述转化数据进行汇总处理,对所述转化数据的来源信息进行汇总处理,对所述转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果的步骤包括:对所述转化数据的来源信息进行初始筛选处理,获取通过预定渠道收集的转化数据的来源信息;按照第一粒度汇总方式对所述通过预定渠道收集的转化数据的来源信息进行汇总处理,生成筛选后的来源信息汇总处理结果,其中,所述第一粒度为所述来源信息中的访问者和时间。
2.根据权利要求1所述的方法,其特征在于,分别对所述转化数据进行汇总处理,对所述转化数据的来源信息进行汇总处理,对所述转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果的步骤包括:
按照第二粒度汇总方式对所述转化数据的来源信息进行汇总处理,生成来源信息汇总处理结果,其中,所述第二粒度为所述来源信息中的会话和时间。
3.根据权利要求1所述的方法,其特征在于,分别对所述转化数据进行汇总处理,对所述转化数据的来源信息进行汇总处理,对所述转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果的步骤包括:
按照第二粒度汇总方式对所述转化数据进行汇总处理,生成转化类型信息汇总处理结果,其中,所述第二粒度为所述转化数据中的会话和时间。
4.根据权利要求3所述的方法,其特征在于,对所述汇总处理结果进行归因处理或非归因处理,生成最终数据的步骤包括:
读取所述来源信息汇总处理结果和所述转化类型信息汇总处理结果;
对所述来源信息汇总处理结果和所述转化类型信息汇总处理结果进行非归因处理,生成第一最终数据。
5.根据权利要求4所述的方法,其特征在于,在对所述来源信息汇总处理结果和所述转化类型信息汇总处理结果进行非归因处理,生成第一最终数据之后,所述方法还包括:
读取所述转化类型信息汇总处理结果;
按照第一粒度汇总方式对所述转化类型信息汇总处理结果进行汇总处理,得到转化类型中间结果;
获取所述筛选后的来源信息汇总处理结果和所述转化类型中间结果;
对所述筛选后的来源信息汇总处理结果和所述转化类型中间结果进行归因处理,生成最终数据。
6.一种转化数据的处理装置,其特征在于,包括:
获取模块,用于获取转化数据和所述转化数据的来源信息;
汇总处理模块,用于分别对所述转化数据进行汇总处理,对所述转化数据的来源信息进行汇总处理,对所述转化数据的来源信息筛选之后进行汇总处理,生成汇总处理结果,其中,所述汇总处理结果包括:转化数据汇总结果、来源信息汇总结果和筛选后来源信息汇总结果;
归因或非归因处理模块,用于对所述汇总处理结果进行归因处理或非归因处理,生成最终数据;
其中,所述汇总处理模块包括:初始处理模块,用于对所述转化数据的来源信息进行初始筛选处理,获取通过预定渠道收集的转化数据的来源信息;第一子生成模块,用于按照第一粒度汇总方式对所述通过预定渠道收集的转化数据的来源信息进行汇总处理,生成筛选后的来源信息汇总处理结果,其中,所述第一粒度为所述来源信息中的访问者和时间。
7.根据权利要求6所述的装置,其特征在于,所述汇总处理模块包括:第二子生成模块,用于按照第二粒度汇总方式对所述转化数据的来源信息进行汇总处理,生成来源信息汇总处理结果,其中,所述第二粒度为所述来源信息中的会话和时间。
8.根据权利要求6所述装置,其特征在于,所述汇总处理模块包括:第三子生成模块,用于按照第二粒度汇总方式对所述转化数据进行汇总处理,生成转化类型信息汇总处理结果,其中,所述第二粒度为所述转化数据中的会话和时间。
9.根据权利要求8所述的装置,其特征在于,所述归因或非归因处理模块包括:
第一读取模块,用于读取所述来源信息汇总处理结果和所述转化类型信息汇总处理结果;
非归因处理模块,用于对所述来源信息汇总处理结果和所述转化类型信息汇总处理结果进行非归因处理,生成第一最终数据。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二读取模块,用于读取所述转化类型信息汇总处理结果;
汇总模块,用于按照第一粒度汇总方式对所述转化类型信息汇总处理结果进行汇总处理,得到转化类型中间结果;
子获取模块,用于获取所述筛选后的来源信息汇总处理结果和所述转化类型中间结果;
归因处理模块,用于对所述筛选后的来源信息汇总处理结果和所述转化类型中间结果进行归因处理,生成最终数据。
CN201310585781.0A 2013-11-19 2013-11-19 转化数据的处理方法及装置 Active CN103605736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310585781.0A CN103605736B (zh) 2013-11-19 2013-11-19 转化数据的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310585781.0A CN103605736B (zh) 2013-11-19 2013-11-19 转化数据的处理方法及装置

Publications (2)

Publication Number Publication Date
CN103605736A CN103605736A (zh) 2014-02-26
CN103605736B true CN103605736B (zh) 2017-06-30

Family

ID=50123958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310585781.0A Active CN103605736B (zh) 2013-11-19 2013-11-19 转化数据的处理方法及装置

Country Status (1)

Country Link
CN (1) CN103605736B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104104717B (zh) * 2014-06-30 2017-11-03 广州唯品会网络技术有限公司 投放渠道数据统计方法及装置
CN105468749A (zh) * 2015-11-26 2016-04-06 上海晶赞科技发展有限公司 一种数据处理方法及装置
CN108229993B (zh) * 2016-12-15 2022-03-01 北京国双科技有限公司 一种数据处理的方法及装置
CN107239542A (zh) * 2017-06-02 2017-10-10 福建中金在线信息科技有限公司 一种数据统计方法、装置、服务器及存储介质
CN113177174B (zh) * 2021-05-21 2024-02-06 脸萌有限公司 特征构建方法、内容显示方法及相关装置
CN117291669A (zh) * 2022-06-15 2023-12-26 脸萌有限公司 多任务模型训练方法、数据处理方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777080A (zh) * 2010-03-19 2010-07-14 北京国双科技有限公司 基于用户点击数据的网页分析方法
CN102663616A (zh) * 2012-03-19 2012-09-12 北京国双科技有限公司 一种基于多触点归因模型的网络广告效果衡量方法和系统
CN102684925A (zh) * 2012-05-24 2012-09-19 北京国双科技有限公司 互联网访问来源信息的获取方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777080A (zh) * 2010-03-19 2010-07-14 北京国双科技有限公司 基于用户点击数据的网页分析方法
CN102663616A (zh) * 2012-03-19 2012-09-12 北京国双科技有限公司 一种基于多触点归因模型的网络广告效果衡量方法和系统
CN102684925A (zh) * 2012-05-24 2012-09-19 北京国双科技有限公司 互联网访问来源信息的获取方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Xuhui Shao等.Data-driven multi-touch attribution models.《AcmSigkdd International Conference on Knowledge Discovery & Data Mining》.2011,258-264. *

Also Published As

Publication number Publication date
CN103605736A (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
CN103605736B (zh) 转化数据的处理方法及装置
US7085682B1 (en) System and method for analyzing website activity
CN105956161B (zh) 一种信息推荐方法和装置
CN104035926B (zh) 一种互联网信息的投放和系统
CN104598557B (zh) 数据栅格化、用户行为分析的方法和装置
CN108288179B (zh) 一种用户偏好房源计算方法和系统
CN102523274B (zh) 基于核心网侧的无线个性化精准信息主动推送系统及方法
JP2014512612A (ja) コンバージョン経路利用セグメンテーション
CN107480277A (zh) 用于网站日志采集的方法及装置
CN107103062A (zh) 一种网页推荐方法及系统
CN107633347A (zh) 一种数据指标统计方法及装置
CN103440199A (zh) 测试引导方法和装置
CN112184302A (zh) 一种产品推荐方法、装置、规则引擎及存储介质
CN108122153A (zh) 电子商务环境下基于云计算处理模式的个性化推荐方法
CN102982112A (zh) 排行榜生成方法、日志生成方法和服务器
CN108320168A (zh) 一种数据分析方法及装置
US20200175088A1 (en) Systems and methods for automatically generating and optimizing web pages
CN108932640A (zh) 用于处理订单的方法和装置
US20110225287A1 (en) Method and system for distributed processing of web traffic analytics data
CN106484701B (zh) 一种基于业务对象的信息展示方法和装置
CN104967643A (zh) 一种获取转移数据的方法及装置
JP2010186283A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
CN113742600B (zh) 资源推荐方法、装置、计算机设备及介质
JP2017167829A (ja) 検出装置、検出方法及び検出プログラム
CN108229993A (zh) 一种数据处理的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for processing conversion data

Effective date of registration: 20190531

Granted publication date: 20170630

Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd.

Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20240604

Granted publication date: 20170630