CN113761436A - 一种数据统计方法和装置 - Google Patents

一种数据统计方法和装置 Download PDF

Info

Publication number
CN113761436A
CN113761436A CN202110137472.1A CN202110137472A CN113761436A CN 113761436 A CN113761436 A CN 113761436A CN 202110137472 A CN202110137472 A CN 202110137472A CN 113761436 A CN113761436 A CN 113761436A
Authority
CN
China
Prior art keywords
click
path
click event
current
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110137472.1A
Other languages
English (en)
Inventor
刘博文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110137472.1A priority Critical patent/CN113761436A/zh
Publication of CN113761436A publication Critical patent/CN113761436A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • G06Q30/0637Approvals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据统计方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取触发相应用户行为的点击事件,将点击事件按照点击时间进行排序,得到用户行为对应的初始点击路径;重复执行以下步骤,直至当前点击路径中不存在闭环路径,得到实际触发用户行为的点击路径:确定当前点击路径中存在闭环路径,且闭环路径中的当前点击事件与目标对象具有相关性;以及保留当前点击事件以及当前点击事件的前置点击事件,对当前点击事件和前置点击事件进行标记,更新当前点击路径。该实施方式通过在当前点击路径中找出闭环路径,并保留闭环路径中与目标对象具有相关性的点击事件,进而完整的获得了真正触发用户行为的点击路径。

Description

一种数据统计方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据统计方法和装置。
背景技术
为了更好的为用户提供服务,企业网站平台希望可以统计出真正对成单有贡献的坑位。现有的统计逻辑为:同个用户访次下,相同页面相互覆盖,只记录每个页面的最后一次点击事件,多次加购的情况下只记录用户第一次加购的点击路径。若用户24小时内没有加购行为,则不将对应的点击路径计入数据仓库底表。基于数据仓库底表记录的数据,统计出对成单有贡献的点击事件,进而得到有贡献的坑位。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有技术的统计逻辑,由于只记录每个页面的最后一次点击事件,可能会遗漏真正引导用户下单的点击事件(并非页面的最后一次点击事件),导致统计出的点击事件与真正触发用户下单的点击事件不符,进而无法准确地找出对成单有贡献的坑位,无法准确地进行用户行为数据分析。
发明内容
有鉴于此,本发明实施例提供一种数据统计方法和装置,通过在当前点击路径中找出闭环路径,并保留闭环路径中与目标对象具有相关性的点击事件,进而完整的获得了真正触发用户行为的点击路径。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据统计方法。
本发明实施例的一种数据统计方法,包括:根据任务信息中的目标对象,获取触发相应用户行为的点击事件,将所述点击事件按照点击时间进行排序,得到所述用户行为对应的初始点击路径;重复执行以下步骤,直至当前点击路径中不存在闭环路径,得到实际触发所述用户行为的点击路径:确定所述当前点击路径中存在所述闭环路径,且所述闭环路径中的当前点击事件与所述目标对象具有相关性;以及保留所述当前点击事件以及所述当前点击事件的前置点击事件,对所述当前点击事件和所述前置点击事件进行标记,更新所述当前点击路径;其中,所述当前点击路径的初始值为所述初始点击路径,所述闭环路径的首尾点击事件为跳转至同一页面的点击事件。
可选地,确定所述当前点击路径中存在所述闭环路径,包括:根据触发所述点击事件时所跳转页面的页面标识,确定所述当前点击路径对应的页面标识集合中存在相同的页面标识;所述相同的页面标识对应的点击事件,以及所述相同的页面标识之间的页面标识对应的点击事件形成闭环路径。
可选地,确定所述闭环路径中的当前点击事件与所述目标对象具有相关性,包括:确定所述闭环路径中当前点击事件对应的操作对象与所述目标对象满足设定的相关性判定规则,则判定所述当前点击事件与所述目标对象具有相关性。
可选地,所述相关性判定规则包括:所述操作对象对应的品类、店铺和SPU,与所述目标对象对应的品类、店铺和SPU存在任意一个或者多个相同。
可选地,所述前置点击事件为点击时间早于所述当前点击事件、且归属于所述闭环路径的点击事件;对所述当前点击事件和所述前置点击事件进行标记,包括:将触发所述当前点击事件时所跳转页面的页面标识进行标记,以及将触发所述前置点击事件时所跳转页面的页面标识进行标记。
可选地,将触发所述当前点击事件时所跳转页面的页面标识进行标记,以及将触发所述前置点击事件时所跳转页面的页面标识进行标记,包括:将触发所述当前点击事件时所跳转页面的页面标识与所述当前点击事件对应的时间戳进行拼接,得到所述当前点击事件对应的新的页面标识;以及将触发所述前置点击事件时所跳转页面的页面标识与所述前置点击事件对应的时间戳进行拼接,得到所述前置点击事件对应的新的页面标识。
可选地,所述任务信息包括任务发生时间;获取触发相应用户行为的点击事件,包括:根据所述任务信息对应的用户标识以及所述任务发生时间,回溯设定时间段内与相应用户行为对应的用户相同、访次相同的点击事件。
为实现上述目的,根据本发明实施例的另一方面,提供了一种数据统计装置。
本发明实施例的一种数据统计装置,包括:获取排序模块,用于根据任务信息中的目标对象,获取触发相应用户行为的点击事件,将所述点击事件按照点击时间进行排序,得到所述用户行为对应的初始点击路径;路径确定模块,用于重复执行以下步骤,直至当前点击路径中不存在闭环路径,得到实际触发所述用户行为的点击路径:确定所述当前点击路径中存在所述闭环路径,且所述闭环路径中的当前点击事件与所述目标对象具有相关性;以及保留所述当前点击事件以及所述当前点击事件的前置点击事件,对所述当前点击事件和所述前置点击事件进行标记,更新所述当前点击路径;其中,所述当前点击路径的初始值为所述初始点击路径,所述闭环路径的首尾点击事件为跳转至同一页面的点击事件。
可选地,所述路径确定模块,还用于根据触发所述点击事件时所跳转页面的页面标识,确定所述当前点击路径对应的页面标识集合中存在相同的页面标识;以及所述相同的页面标识对应的点击事件,以及所述相同的页面标识之间的页面标识对应的点击事件形成闭环路径。
可选地,所述路径确定模块,还用于确定所述闭环路径中当前点击事件对应的操作对象与所述目标对象满足设定的相关性判定规则,则判定所述当前点击事件与所述目标对象具有相关性。
可选地,所述相关性判定规则包括:所述操作对象对应的品类、店铺和SPU,与所述目标对象对应的品类、店铺和SPU存在任意一个或者多个相同。
可选地,所述前置点击事件为点击时间早于所述当前点击事件、且归属于所述闭环路径的点击事件;所述路径确定模块,还用于将触发所述当前点击事件时所跳转页面的页面标识进行标记,以及将触发所述前置点击事件时所跳转页面的页面标识进行标记。
可选地,所述路径确定模块,还用于将触发所述当前点击事件时所跳转页面的页面标识与所述当前点击事件对应的时间戳进行拼接,得到所述当前点击事件对应的新的页面标识;以及将触发所述前置点击事件时所跳转页面的页面标识与所述前置点击事件对应的时间戳进行拼接,得到所述前置点击事件对应的新的页面标识。
可选地,所述任务信息包括任务发生时间;所述获取排序模块,还用于根据所述任务信息对应的用户标识以及所述任务发生时间,回溯设定时间段内与相应用户行为对应的用户相同、访次相同的点击事件。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。
本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种数据统计方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种数据统计方法。
上述发明中的一个实施例具有如下优点或有益效果:通过在当前点击路径中找出闭环路径,并保留闭环路径中与目标对象具有相关性的点击事件,进而完整的获得了真正触发用户行为的点击路径。根据触发点击事件时所跳转页面的页面标识,即可判断用户是否存在返回操作,进而基于上述判断结果找出当前点击路径中的闭环路径,便于后续分辨出真正与成单相关的点击路径。
基于设定的相关性判断规则,判定闭环路径中的点击事件与目标对象的相关性,在不遗漏真正对成单有贡献的点击事件的前提下,滤除了不相关的点击事件,而且通过设置相关性判断规则来判定相关性,灵活性好。对具有相关性的点击事件对应的页面标识进行打标处理,使得后续查找新的闭环路径时,已打标的点击事件不会再次被判定为闭环路径的元素。
将页面标识与点击事件对应的时间戳拼接来标记与目标对象相关的点击事件,使得该点击事件对应的页面标识具有唯一性,不会与初始的页面标识混淆,进一步保证找到的闭环路径的准确性。通过获取同用户、同访次、且早于任务发生时间的设定时间段内的点击事件,使得获取的点击事件是触发用户行为的点击事件,保证后续处理的准确性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的数据统计方法的主要步骤的示意图;
图2是根据本发明实施例的数据统计方法的主要流程示意图;
图3是根据本发明实施例的数据统计装置的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适用于来实现本发明实施例的电子设备的计算机装置的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面对本发明实施例涉及的技术术语进行解释。
SPU:Standard Product Unit,标准产品单位,是物品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合,描述了一个产品的特性。比如XX品牌手机,不同的颜色属于不同SKU(Stock Keeping Unit,库存量单位),但是属于相同SPU。
坑位:APP(或网站)页面的可点击位置,比如搜索框、图标、按钮等。其中,APP即应用程序,Application。
访次:即用户访问APP(或网站)的次数。以访问APP为例,当日第一次访问APP,访次为1,关闭APP后再次打开,访次加1,由此递推。次日重新计数。
如背景技术所述,现有的统计逻辑只记录每次跳转页面的最后一次点击事件,相同页面相互覆盖,该统计逻辑可能会遗漏真正引导用户下单的点击事件,将统计出的点击事件对应的坑位作为对成单有贡献的坑位,就会与实际引导用户下单的坑位不相符。比如,用户在首页搜索框搜索芒果,之后在物品推荐功能上点击纸巾,最后购买纸巾。
上述统计逻辑中,纸巾这笔订单会被包含在搜索框的订单相关数据指标,即纸巾这笔订单被计算为搜索框功能贡献的订单,但实际情况是物品推荐功能带来的引单。基于上述问题,本发明实施例提供了一种数据统计方法,该方法能够计算出完整的、真正引导用户下单的点击路径,进而可以正确地找出对成单有贡献的坑位,具体实现如下。
图1是根据本发明实施例的数据统计方法的主要步骤的示意图。如图1所示,本发明实施例的数据统计方法,主要包括如下步骤:
步骤S101:根据任务信息中的目标对象,获取触发相应用户行为的点击事件,将点击事件按照点击时间进行排序,得到用户行为对应的初始点击路径。任务信息为用户在APP或者网站购买目标对象(即下单)后生成的信息,包括任务标识和目标对象标识,目标对象可以是物品、服务等。
实施例中任务信息为订单信息,相应地,任务标识为订单标识,目标对象标识为物品标识或者服务标识。用户行为是用户购买目标对象过程中发生的行为,比如下单行为、加购(即加入购物车)行为等。优选地用户行为为下单行为。该步骤获取的点击事件是可能触发用户行为的点击事件。比如目标对象为物品,此处获取的是可能触发用户下单该物品的点击事件。
获取到点击事件后,可以按照点击时间的早晚,对点击事件进行排序,点击时间早的点击事件在前,点击时间晚的点击事件在后,得到初始点击路径。
步骤S102:判断当前点击路径中是否存在闭环路径,如果存在闭环路径,则执行步骤S103;如果不存在闭环路径,则执行步骤S105。如果用户在浏览过程中存在返回操作,则在当前点击路径中会存在跳转至同一页面的点击事件,此时会形成一条闭环路径。因此可知,闭环路径的首尾点击事件为跳转至同一页面的点击事件,即第一个点击事件和最后一个点击事件会跳转至同一页面。其中,当前点击路径的初始值为初始点击路径。
在判断当前点击路径中是否存在闭环路径时,可以根据触发点击事件时所跳转页面的页面标识,判断当前点击路径对应的页面标识集合中是否存在相同的页面标识,如果存在相同的页面标识,则说明存在闭环路径;如果不存在相同的页面标识,则说明不存在闭环路径。一条闭环路径中包括相同的页面标识对应的点击事件,以及相同的页面标识之间的页面标识对应的点击事件。
步骤S103:确定闭环路径中的当前点击事件与目标对象具有相关性。判断闭环路径中当前点击事件对应的操作对象与目标对象是否满足设定的相关性判定规则,如果两者满足相关性判定规则,则认为当前点击事件与目标对象具有相关性;如果两者不满足相关性判定规则,则认为当前点击事件与目标对象不具有相关性。
其中,相关性判定规则可以为:操作对象与目标对象各自所对应的品类、店铺和SPU中存在任意一个或者多个相同。
步骤S104:保留当前点击事件以及当前点击事件的前置点击事件,对当前点击事件和前置点击事件进行标记,更新当前点击路径,跳转至步骤S102。前置点击事件为点击时间早于当前点击事件、且归属于该闭环路径的点击事件。在对当前点击事件和前置点击事件标记时,可以将触发当前点击事件时所跳转页面的页面标识,以及触发前置点击事件时所跳转页面的页面标识分别进行标记。添加标记后,更新当前点击路径。
步骤S105:将当前点击路径作为实际触发用户行为的点击路径。通过上述循环处理,最终会得到不存在闭环路径的当前点击路径,该当前点击路径即为实际触发用户下单行为的点击路径。
图2是根据本发明实施例的数据统计方法的主要流程示意图。如图2所示,本发明实施例的数据统计方法,以订单信息为例进行说明,主要包括如下步骤:
步骤S201:根据订单信息中的目标对象,获取触发相应用户行为的点击事件。实施例中,订单信息为订单表的一条记录,包括用户下单的订单标识、目标对象标识和下单时间。根据下单时间回溯用户在点击表中的最早加购点。其中,点击表中记录用户相关点击行为的信息,包括点击位置、用户PIN码(Personal Identification Number,个人识别密码)、点击时间等。加购点是用户的加购行为触发的埋点。用户的每次点击行为均会触发一次点击埋点。
根据加购点的时间戳,回溯设定时间段内与该加购事件对应的用户相同、访次相同的点击事件,回溯得到的点击事件可以作为可能触发用户下单的点击事件。点击事件通过在APP或者网站埋点记录,用户每次点击操作会生成一行数据记录,记录用户点击位置、点击时间、对应物品等信息。此处的时间戳为用户点击加购位置时,基于埋点而上报的加购时间戳。该时间段可以自定义设置,比如设置为24小时。
可以理解的是,该步骤将回溯得到的加购事件对应的点击事件作为可能触发用户下单的点击事件。实际应用中用户还可以不经过加购这一过程,直接下单,故也可以直接根据下单时间,回溯设定时间段内与该下单事件对应的用户相同、访次相同的点击事件,将回溯得到的点击事件作为可能触发用户下单的点击事件。
在一可选的实施例中,可以将获取的点击事件记录到数据表中,即通过数据表记录用户下单操作的点击流程。该数据表每行记录为用户账号、点击的坑位及坑位信息、点击的时间戳、物品标识、订单标识等。
步骤S202:按照点击时间,将获取的点击事件进行排序,得到用户行为对应的初始点击路径。获取到点击事件后,可以按照点击时间(比如点击时间戳)的早晚对点击事件进行排序,得到初始点击路径。
步骤S203:判断当前点击路径中是否存在闭环路径,如果存在闭环路径,则执行步骤S204;如果不存在闭环路径,则执行步骤S209。当前点击路径的初始值即初始点击路径。
实施例中,根据点击路径中点击事件对应的页面标识(即触发点击事件时所跳转页面的页面标识)来判断用户是否存在返回操作,如果存在返回操作(即存在相同的页面标识),则形成一条闭环路径。比如将首页的页面标识定义为1,搜索页的页面标识定义为2,物品详情页的页面标识定义为3,那么用户从首页-搜索页-物品详情页-返回首页这条点击路径所对应的页面标识集合即{1 2 3 1},该页面标识集合中存在两个1,构成一条闭环路径。
步骤S204:依次判断闭环路径中的点击事件与目标对象是否具有相关性,如果当前点击事件与目标对象具有相关性,则执行步骤S205;否则,执行步骤S207。如果当前点击路径中存在闭环路径,则依次判断该闭环路径中的点击事件与订单信息中的目标对象,比如物品,是否存在相关性。
实施例中,将下单物品(即目标对象)与点击事件对应的操作对象进行对比,来判断点击事件与目标对象是否相关。相关性判定规则为:如果点击事件对应的操作对象与目标对象的品类(为了更准确地判断相关性,实施例为三级品类)、店铺和SPU存在任意一个或者多个相同,则认为存在相关性。
比如,下单物品为球鞋1,下单过程中点击了球鞋2,两者均是鞋子品类,则点击物品与下单物品具有相关性;下单物品为店铺1的电饭煲,下单过程点击了店铺1的其他物品,两者店铺相同,则其他物品与下单物品具有相关性;下单物品为X品牌手机(黑色),下单过程中点击了该品牌手机(红色),两者SPU相同,则红色手机与下单物品具有相关性。
在后续计算时,具有相关性的点击事件均可认为对最终成单具有引导作用,对于成单具有贡献。在一优选的实施例中,在判断闭环路径中的点击事件与目标对象是否具有相关性时,如果存在多个点击事件与目标对象具有相关性,则保留闭环路径中点击时间最晚的具有相关性的点击事件。
步骤S205:保留当前点击事件以及当前点击事件的前置点击事件。由于点击事件按照点击时间由早到晚排序,故此处的前置点击事件即闭环路径中当前点击事件前面的所有点击事件。比如,当前点击路径为:1 2 3 4 5 6 3 7 8,其中数字简化代表用户的每步点击操作。该点击路径中,从3到3为一个闭环路径,假设闭环路径中5为具有相关性的点击事件,那么在此闭环路径中3、4、5均被保留,其中3、4为前置点击事件,作为5的引流路径被保留。
步骤S206:对当前点击事件和前置点击事件进行标记,执行步骤S208。仍旧以步骤S203中的闭环路径为例,若该闭环路径中浏览物品详情页为具有相关性的点击,即页面标识3对应的点击事件为相关性点击事件,则需要对其进行标记。标记逻辑为:将原始的页面标识与点击该页面的点击时间进行拼接。比如将原始页面标识下划线拼接点击该页面的时间戳。下面进行举例说明。
假设用户浏览物品详情页的时间戳为111,则标记后,物品详情页的页面标识变为3_111。由于前置点击事件同样需要按照上述标记逻辑进行标记,则当前点击路径由1 2 31变更为1_109 2_110 3_111。通过上述过程实现了点击路径的重新编码。
步骤S207:舍弃闭环路径,执行步骤S208。
步骤S208:更新当前点击路径,执行步骤S203。如前所述,此处的更新包括舍弃闭环路径中不具有相关性的点击事件、舍弃全部点击事件均不具有相关性的闭环路径,以及更新点击事件对应的页面标识。
步骤S209:将当前点击路径作为实际触发用户行为的点击路径。
本发明实施例的数据统计方法,通过判断点击路径中点击事件所对应的页面标识是否相同,来判断用户浏览是否形成了闭环路径,之后再判断每个点击事件对应的物品与订单物品是否存在相关性,来判断该闭环路径是无效的分支路径,还是引流(对成单有贡献)的分支路径,并对对成单有贡献的分支路径进行打标处理。通过上述方式找到了真正引导用户下单的点击路径,该点击路径中各点击事件对应的坑位即为对成单有贡献的坑位,保证了用户行为数据分析的准确性。
下面结合具体业务场景,对本发明的数据统计方法进行进一步说明。假设用户下单的点击流程为:
首页-搜索芒果-进入芒果详情页-返回首页-搜索鞋子1-进入搜索列表页-点击鞋子1-进入鞋子1详情页-返回首页-搜索鞋子2-进入鞋子2列表-点击鞋子2-在鞋子2详情页加购下单。
在上述点击流程中,首页-搜索芒果-进入芒果详情页-返回首页,以及首页-搜索鞋子1-进入搜索列表页-点击鞋子1-进入鞋子1详情页-返回首页是两个闭环路径,分别称为闭环路径1和闭环路径2。搜索鞋子2-进入鞋子2列表-点击鞋子2-在鞋子2详情页加购下单是用户下单的必经之路,可称为主干路径。
闭环路径1与最后成单的鞋子2不具有相关性,而闭环路径2与最后成单的鞋子2具有相关性。因此,经步骤S204至步骤S208去环保留后,最终得到的点击路径为:首页-搜索鞋子1-进入搜索列表页-点击鞋子1-进入鞋子1详情页-返回首页-搜索鞋子2-进入鞋子2列表-点击鞋子2-在鞋子2详情页加购下单。该点击路径即为实际触发用户行为的点击路径。
通过本发明实施例的数据统计方法,在记录主干路径的同时,保留了具有相关性的点击事件,优化了现有统计逻辑中存在不相关分支路径、相关性点击事件被覆盖的缺陷,能够给业务方提供准确的坑位引单分析,对于后续进行个性化推荐、验证营销活动好坏等业务场景,有重要作用。
图3是根据本发明实施例的数据统计装置的主要模块的示意图。如图3所示,本发明实施例的数据统计装置300,主要包括:
获取排序模块301,用于根据任务信息中的目标对象,获取触发相应用户行为的点击事件,将所述点击事件按照点击时间进行排序,得到所述用户行为对应的初始点击路径。任务信息为用户在网站或者APP购买目标对象(即下单)后生成的信息,包括任务标识和目标对象标识,目标对象可以是物品、服务等。
实施例中任务信息为订单信息,相应地,任务标识为订单标识,目标对象标识为物品标识或者服务标识。用户行为是用户购买目标对象过程中发生的行为,比如下单行为、加购行为等。该模块获取的点击事件是可能触发用户行为的点击事件。比如目标对象为物品,此处获取的是可能触发用户下单该物品的点击事件。
获取到点击事件后,可以按照点击时间的早晚对点击事件进行排序,点击时间早的点击事件在前,点击时间晚的点击事件在后,得到初始点击路径。
路径确定模块302,用于重复执行以下步骤,直至当前点击路径中不存在闭环路径,得到实际触发所述用户行为的点击路径:
确定所述当前点击路径中存在所述闭环路径,且所述闭环路径中的当前点击事件与所述目标对象具有相关性;以及保留所述当前点击事件以及所述当前点击事件的前置点击事件,对所述当前点击事件和所述前置点击事件进行标记,更新所述当前点击路径。
如果用户在浏览过程中存在返回操作,则在当前点击路径中会存在跳转至同一页面的点击事件,此时会形成一条闭环路径。因此可知,闭环路径的首尾点击事件为跳转至同一页面的点击事件,即第一个点击事件和最后一个点击事件会跳转至同一页面。
判断闭环路径中当前点击事件对应的操作对象与目标对象是否满足设定的相关性判定规则,如果两者满足相关性判定规则,则认为当前点击事件与目标对象具有相关性;如果两者不满足相关性判定规则,则认为当前点击事件与目标对象不具有相关性。
在对当前点击事件和前置点击事件标记时,可以将触发当前点击事件时所跳转页面的页面标识,以及触发前置点击事件时所跳转页面的页面标识分别进行标记。添加标记后,更新当前点击路径。通过上述处理,最终会得到不存在闭环路径的当前点击路径,该当前点击路径即为实际触发用户下单行为的点击路径。
从以上描述可以看出,通过在当前点击路径中找出闭环路径,并保留闭环路径中与目标对象具有相关性的点击事件,进而完整的获得了真正触发用户行为的点击路径。
图4示出了可以应用本发明实施例的数据统计方法或数据统计装置的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403访问APP后生成的订单信息进行处理的后台管理服务器。后台管理服务器可以获取在APP埋点得到的点击事件,并对点击事件进行去环和保留具有相关性的点击事件等处理,得到处理结果,例如得到实际触发所述用户行为的点击路径。
需要说明的是,本申请实施例所提供的数据统计方法一般由服务器405执行,相应地,数据统计装置一般设置于服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种计算机可读介质。
本发明的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种数据统计方法。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种数据统计方法。
下面参考图5,其示出了适用于来实现本发明实施例的电子设备的计算机系统500的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有计算机系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文主要步骤图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取排序模块和路径确定模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取排序模块还可以被描述为“根据任务信息中的目标对象,获取触发相应用户行为的点击事件,将所述点击事件按照点击时间进行排序,得到所述用户行为对应的初始点击路径的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:根据任务信息中的目标对象,获取触发相应用户行为的点击事件,将所述点击事件按照点击时间进行排序,得到所述用户行为对应的初始点击路径;重复执行以下步骤,直至当前点击路径中不存在闭环路径,得到实际触发所述用户行为的点击路径:确定所述当前点击路径中存在所述闭环路径,且所述闭环路径中的当前点击事件与所述目标对象具有相关性;以及保留所述当前点击事件以及所述当前点击事件的前置点击事件,对所述当前点击事件和所述前置点击事件进行标记,更新所述当前点击路径;其中,所述当前点击路径的初始值为所述初始点击路径,所述闭环路径的首尾点击事件为跳转至同一页面的点击事件。
根据本发明实施例的技术方案,通过在当前点击路径中找出闭环路径,并保留闭环路径中与目标对象具有相关性的点击事件,进而完整的获得了真正触发用户行为的点击路径。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (11)

1.一种数据统计方法,其特征在于,包括:
根据任务信息中的目标对象,获取触发相应用户行为的点击事件,将所述点击事件按照点击时间进行排序,得到所述用户行为对应的初始点击路径;
重复执行以下步骤,直至当前点击路径中不存在闭环路径,得到实际触发所述用户行为的点击路径:
确定所述当前点击路径中存在所述闭环路径,且所述闭环路径中的当前点击事件与所述目标对象具有相关性;以及
保留所述当前点击事件以及所述当前点击事件的前置点击事件,对所述当前点击事件和所述前置点击事件进行标记,更新所述当前点击路径;
其中,所述当前点击路径的初始值为所述初始点击路径,所述闭环路径的首尾点击事件为跳转至同一页面的点击事件。
2.根据权利要求1所述的方法,其特征在于,确定所述当前点击路径中存在所述闭环路径,包括:
根据触发所述点击事件时所跳转页面的页面标识,确定所述当前点击路径对应的页面标识集合中存在相同的页面标识;
所述相同的页面标识对应的点击事件,以及所述相同的页面标识之间的页面标识对应的点击事件形成闭环路径。
3.根据权利要求1所述的方法,其特征在于,确定所述闭环路径中的当前点击事件与所述目标对象具有相关性,包括:
确定所述闭环路径中当前点击事件对应的操作对象与所述目标对象满足设定的相关性判定规则,则判定所述当前点击事件与所述目标对象具有相关性。
4.根据权利要求3所述的方法,其特征在于,所述相关性判定规则包括:所述操作对象对应的品类、店铺和SPU,与所述目标对象对应的品类、店铺和SPU存在任意一个或者多个相同。
5.根据权利要求2所述的方法,其特征在于,所述前置点击事件为点击时间早于所述当前点击事件、且归属于所述闭环路径的点击事件;
对所述当前点击事件和所述前置点击事件进行标记,包括:
将触发所述当前点击事件时所跳转页面的页面标识进行标记,以及将触发所述前置点击事件时所跳转页面的页面标识进行标记。
6.根据权利要求5所述的方法,其特征在于,将触发所述当前点击事件时所跳转页面的页面标识进行标记,以及将触发所述前置点击事件时所跳转页面的页面标识进行标记,包括:
将触发所述当前点击事件时所跳转页面的页面标识与所述当前点击事件对应的时间戳进行拼接,得到所述当前点击事件对应的新的页面标识;以及
将触发所述前置点击事件时所跳转页面的页面标识与所述前置点击事件对应的时间戳进行拼接,得到所述前置点击事件对应的新的页面标识。
7.根据权利要求1至6的任一项所述的方法,其特征在于,所述任务信息包括任务发生时间;获取触发相应用户行为的点击事件,包括:
根据所述任务信息对应的用户标识以及所述任务发生时间,回溯设定时间段内与相应用户行为对应的用户相同、访次相同的点击事件。
8.一种数据统计装置,其特征在于,包括:
获取排序模块,用于根据任务信息中的目标对象,获取触发相应用户行为的点击事件,将所述点击事件按照点击时间进行排序,得到所述用户行为对应的初始点击路径;
路径确定模块,用于重复执行以下步骤,直至当前点击路径中不存在闭环路径,得到实际触发所述用户行为的点击路径:
确定所述当前点击路径中存在所述闭环路径,且所述闭环路径中的当前点击事件与所述目标对象具有相关性;以及
保留所述当前点击事件以及所述当前点击事件的前置点击事件,对所述当前点击事件和所述前置点击事件进行标记,更新所述当前点击路径;
其中,所述当前点击路径的初始值为所述初始点击路径,所述闭环路径的首尾点击事件为跳转至同一页面的点击事件。
9.根据权利要求8所述的装置,其特征在于,所述路径确定模块,还用于:
根据触发所述点击事件时所跳转页面的页面标识,确定所述当前点击路径对应的页面标识集合中存在相同的页面标识;以及
所述相同的页面标识对应的点击事件,以及所述相同的页面标识之间的页面标识对应的点击事件形成闭环路径。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202110137472.1A 2021-02-01 2021-02-01 一种数据统计方法和装置 Pending CN113761436A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110137472.1A CN113761436A (zh) 2021-02-01 2021-02-01 一种数据统计方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110137472.1A CN113761436A (zh) 2021-02-01 2021-02-01 一种数据统计方法和装置

Publications (1)

Publication Number Publication Date
CN113761436A true CN113761436A (zh) 2021-12-07

Family

ID=78786564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110137472.1A Pending CN113761436A (zh) 2021-02-01 2021-02-01 一种数据统计方法和装置

Country Status (1)

Country Link
CN (1) CN113761436A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024159994A1 (zh) * 2023-01-31 2024-08-08 华为技术有限公司 一种搜索事件脉络显示方法、生成方法及电子设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050138641A1 (en) * 2003-12-17 2005-06-23 International Business Machines Corporation Method and system for presenting event flows using sequence diagrams
CN108446305A (zh) * 2018-01-30 2018-08-24 上海天旦网络科技发展有限公司 多维度统计业务数据的系统和方法
CN108985777A (zh) * 2018-05-17 2018-12-11 镇江国中亿家科技有限公司 一种在线支付信息处理方法
CN109284450A (zh) * 2018-08-22 2019-01-29 中国平安人寿保险股份有限公司 订单成单路径的确定方法及装置、存储介质、电子设备
WO2019024661A1 (zh) * 2017-08-03 2019-02-07 北京京东尚科信息技术有限公司 一种订单跟踪的方法和装置
US20190124167A1 (en) * 2017-10-19 2019-04-25 Clicktale Ltd. System and method analyzing actual behavior of website visitors
CN109684583A (zh) * 2018-11-12 2019-04-26 深圳壹账通智能科技有限公司 页面用户行为的分析方法、装置、终端及可读存储介质
CN110751539A (zh) * 2019-10-25 2020-02-04 北京达佳互联信息技术有限公司 物品信息处理方法、装置、终端、服务器及存储介质
CN110807646A (zh) * 2018-08-06 2020-02-18 北京京东尚科信息技术有限公司 数据分析方法、装置和计算机可读存储介质
CN111340520A (zh) * 2018-12-19 2020-06-26 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN111475539A (zh) * 2020-03-06 2020-07-31 许昌学院 数据统计方法及数据统计装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050138641A1 (en) * 2003-12-17 2005-06-23 International Business Machines Corporation Method and system for presenting event flows using sequence diagrams
WO2019024661A1 (zh) * 2017-08-03 2019-02-07 北京京东尚科信息技术有限公司 一种订单跟踪的方法和装置
US20190124167A1 (en) * 2017-10-19 2019-04-25 Clicktale Ltd. System and method analyzing actual behavior of website visitors
CN108446305A (zh) * 2018-01-30 2018-08-24 上海天旦网络科技发展有限公司 多维度统计业务数据的系统和方法
CN108985777A (zh) * 2018-05-17 2018-12-11 镇江国中亿家科技有限公司 一种在线支付信息处理方法
CN110807646A (zh) * 2018-08-06 2020-02-18 北京京东尚科信息技术有限公司 数据分析方法、装置和计算机可读存储介质
CN109284450A (zh) * 2018-08-22 2019-01-29 中国平安人寿保险股份有限公司 订单成单路径的确定方法及装置、存储介质、电子设备
CN109684583A (zh) * 2018-11-12 2019-04-26 深圳壹账通智能科技有限公司 页面用户行为的分析方法、装置、终端及可读存储介质
CN111340520A (zh) * 2018-12-19 2020-06-26 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN110751539A (zh) * 2019-10-25 2020-02-04 北京达佳互联信息技术有限公司 物品信息处理方法、装置、终端、服务器及存储介质
CN111475539A (zh) * 2020-03-06 2020-07-31 许昌学院 数据统计方法及数据统计装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭伟刚: "电子商务网站用户访问模式挖掘中的预处理技术", 计算机应用, no. 03, 28 March 2005 (2005-03-28) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024159994A1 (zh) * 2023-01-31 2024-08-08 华为技术有限公司 一种搜索事件脉络显示方法、生成方法及电子设备

Similar Documents

Publication Publication Date Title
CN110378732B (zh) 信息显示方法、信息关联方法、装置、设备及存储介质
CN104850546B (zh) 移动媒介信息的展示方法和系统
CN110674408A (zh) 业务平台、训练样本的实时生成方法及装置
CN107911448A (zh) 一种内容推送方法及装置
CN107644100A (zh) 信息处理方法、装置以及系统和计算机可读存储介质
CN113010795B (zh) 用户动态画像生成方法、系统、存储介质及电子设备
CN109191158A (zh) 用户画像标签数据的处理方法及处理设备
WO2021189766A1 (zh) 数据可视化方法及相关设备
CN110019980A (zh) 索引处理方法、装置、存储介质和计算机设备
CN111782850A (zh) 一种基于手绘图的物品搜索方法和装置
CN113761436A (zh) 一种数据统计方法和装置
CN103069418B (zh) 信息提供装置、信息提供方法、程序以及信息记录介质
CN111062736A (zh) 模型训练、线索排序方法、装置及设备
CN112667502A (zh) 页面测试方法、装置及介质
CN116186119A (zh) 用户行为分析方法、装置、设备及存储介质
CN111339438A (zh) 好友关系数据处理方法、服务器、终端设备及存储介质
CN111723134A (zh) 信息处理方法、装置、电子设备及存储介质
CN108268545B (zh) 一种分级的用户标签库的创建的方法和装置
CN110569459A (zh) 一种网页信息的统计方法和装置
CN110020166A (zh) 一种数据分析方法及相关设备
CN110223108B (zh) 点击通过率的预测方法、装置及设备
CN113204704A (zh) 内容信息的显示方法、装置、电子设备及可读介质
CN113569132A (zh) 一种信息检索展示方法及系统
CN113327146B (zh) 一种信息追踪方法和装置
CN112540820A (zh) 一种用户界面的更新方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination