CN107943679A - 路径漏斗的生成方法、装置和服务器 - Google Patents

路径漏斗的生成方法、装置和服务器 Download PDF

Info

Publication number
CN107943679A
CN107943679A CN201711189374.2A CN201711189374A CN107943679A CN 107943679 A CN107943679 A CN 107943679A CN 201711189374 A CN201711189374 A CN 201711189374A CN 107943679 A CN107943679 A CN 107943679A
Authority
CN
China
Prior art keywords
path
log
page
access
session
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711189374.2A
Other languages
English (en)
Other versions
CN107943679B (zh
Inventor
陈建逢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Youshi Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Youshi Network Technology Co Ltd filed Critical Guangzhou Youshi Network Technology Co Ltd
Priority to CN201711189374.2A priority Critical patent/CN107943679B/zh
Publication of CN107943679A publication Critical patent/CN107943679A/zh
Application granted granted Critical
Publication of CN107943679B publication Critical patent/CN107943679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种路径漏斗的生成方法,包括步骤:获取用户的访问数据;根据所述访问数据生成访问日志列表;对所述访问日志列表进行会话拆分,获得会话;将所述会话展开,获得会话路径;对所述会话路径进行聚合,形成路径树。本发明通过对访问数据进行聚合、分析、统计形成路径树,将访问数据中所有页面展示和操作行为数据都直观地呈现出来,利于业务人员对访问数据进行直观的数据分析。本发明还提供了一种路径漏斗的生成装置和服务器。

Description

路径漏斗的生成方法、装置和服务器
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及一种路径漏斗的生成方法、装置和服务器。
背景技术
随着互联网技术的发展,越来越多的用户通过网络去获取信息。在用户浏览信息的过程中页面的转换很大程度地影响着用户的体验。其中,用户使用移动端和PC端在页面转换的过程中有着本质的区别。由于移动端的屏幕较小,而且用户在同一时间内只能打开一个页面,在页面上所能呈现的内容就很有限;而PC端的屏幕大,用户在用一时间可以打开多个页面,且一个页面上可以同时浏览到很多应用。因此分析出用户在网站或应用不同页面之间的转换路径,以了解流量在网站或应用内部是如何分配以及用户使用产品的习惯和变化对于页面结构的布局显得尤为重要。
发明内容
本发明的旨在提供一种路径漏斗的生成方法,以便于进行对页面转换路径的分析,便于业务人员对不同页面转换过程进行了解。
第一方面,本发明提供一种路径漏斗的生成方法,包括步骤:
获取用户的访问数据;
根据所述访问数据生成访问日志列表;
对所述访问日志列表进行会话拆分,获得会话;
将所述会话展开,获得会话路径;
对所述会话路径进行聚合,形成路径树。
具体地,所述根据所述访问数据生成访问日志列表,包括步骤:
将访问数据中的业务维度与用户信息聚合,生成聚合列表;
根据访问数据中的时间戳,对所述聚合列表中的访问数据进行升序排序,获得排序后的访问日志列表。
具体地,所述对所述访问日志列表进行会话拆分,获得会话,包括步骤:
获取所述访问日志列表中的一条日志记录作为当前日志记录;
判断当前日志记录是否为启动日志记录;
若是,将当前日志记录所处位置标识为拆分节点,将所述拆分节点之前未拆分的日志记录归为一个会话;
若否,确认所述访问日志列表中存在下一条日志记录,把所述访问日志列表中的下一条日志记录作为当前日志记录,继续所述判断当前日志记录是否为启动日志记录的步骤。
进一步地,所述获取所述访问日志列表中的一条日志记录作为当前日志记录之前,还包括步骤:
判断所述访问日志列表中首条日志记录的日志类型,所述日志类型包括页面展示、启动入口、操作行为;
若判定为页面展示或启动入口,继续所述获取所述访问日志列表中的一条日志记录作为当前日志记录的步骤;
若判定为操作行为,将所述首条日志记录过滤处理,同时将下一条日志记录作为首条日志记录,继续所述判断所述访问日志列表中首条日志记录的日志类型的步骤。
具体地,所述将所述会话展开,获得会话路径,包括步骤:
逐一按序判断所述会话中日志记录的日志类型,所述日志类型包括页面展示和操作行为;
当判定为页面展示时,将对应的日志记录合成一条新路径,并作为路径起点,放入路径池中;
当判定为操作行为,且确认所述路径池中包含至少一条新路径时,将对应的日志记录追加至前一条判定为页面展示的日志记录中,并合成行为临时路径,放入所述路径池中。
进一步地,所述当判定为页面展示时,将对应的日志记录合成一条新路径,并作为路径起点,放入路径池中,还包括步骤:
当判定为页面展示的次数少于5次,且确认所述路径池中包含至少一条新路径时,将对应的日志记录同时追加至前一条判定为页面展示的日志记录中,并合成页面临时路径,放入所述路径池中。
进一步地,所述形成路径树之后,还包括步骤:
根据所述路径树统计页面转换路径占比;
根据所述页面转换路径占比进行优先级排序;
根据优先级排序结果,调整页面结构。
优选地,所述根据优先级排序结果,调整页面结构,包括步骤:
根据所述优先级排序结果,以排序在预设序列前的页面转换路径为准,调整排序在预设序列后的页面转换路径,以均衡各页面转换路径的效率;
和/或,根据所述优先级排序结果,调整各页面转换路径启动入口在页面上的显示位置。
第二方面,本发明提供一种路径漏斗的生成装置,包括模块:
获取模块,用于获取用户的访问数据;
生成模块,用于根据所述访问数据生成访问日志列表;
拆分模块,用于对所述访问日志列表进行会话拆分,获得会话;
展开模块,用于将所述会话展开,获得会话路径;
聚合模块,用于对所述会话路径进行聚合,形成路径树。
具体地,所述生成模块包括单元:
聚合单元,用于将访问数据中的业务维度与用户信息聚合,生成聚合列表;
排序单元,用于根据访问数据中的时间戳,对所述聚合列表中的访问数据进行升序排序,获得排序后的访问日志列表。
具体地,所述拆分模块包括单元:
获取单元,用于获取所述访问日志列表中的一条日志记录作为当前日志记录;
第一判断单元,用于判断当前日志记录是否为启动日志记录;
若是,将当前日志记录所处位置标识为拆分节点,将所述拆分节点之前未拆分的日志记录归为一个会话;
若否,确认所述访问日志列表中存在下一条日志记录,把所述访问日志列表中的下一条日志记录作为当前日志记录,继续所述判断当前日志记录是否为启动日志记录的步骤。
进一步地,所述拆分模块还包括单元:
第二判断单元,用于判断所述访问日志列表中首条日志记录的日志类型,所述日志类型包括页面展示、启动入口、操作行为;
若判定为页面展示或启动入口,继续所述获取所述访问日志列表中的一条日志记录作为当前日志记录的步骤;
若判定为操作行为,将所述首条日志记录滤掉处理,同时将下一条日志记录作为首条日志记录,继续所述判断所述访问日志列表中首条日志记录的日志类型的步骤。
具体地,所述展开模块包括单元:
第三判断单元,用于逐一按序判断所述会话中日志记录的日志类型,所述日志类型包括页面展示和操作行为;
第一合成单元,用于当判定为页面展示时,将对应的日志记录合成一条新路径,并作为路径起点,放入路径池中;
第二合成单元,用于当判定为操作行为,且确认所述路径池中包含至少一条新路径时,将对应的日志记录追加至前一条判定为页面展示的日志记录中,并合成行为临时路径,放入所述路径池中。
进一步地,所述展开模块还包括单元:
第三合成单元,用于当判定为页面展示的次数少于5次,且确认所述路径池中包含至少一条新路径时,将对应的日志记录同时追加至前一条判定为页面展示的日志记录中,并合成页面临时路径,放入所述路径池中。
优选地,还包括以下模块:
统计模块,用于根据所述路径树统计页面转换路径占比;
排序模块,用于根据所述页面转换路径占比进行优先级排序;
调整模块,用于根据优先级排序结果,调整页面结构。
进一步地,所述调整模块包括单元:
均衡单元,用于根据所述优先级排序结果,以排序在预设序列前的页面转换路径为准,调整排序在预设序列后的页面转换路径,以均衡各页面转换路径的效率;
调整单元,用于根据所述优先级排序结果,调整各页面转换路径启动入口在页面上的显示位置。
第三方面,本发明还提供一种服务器,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行第一方面所述的路径漏斗的生成方法。
区别于现有技术,本发明具有以下优势:
本发明通过对访问数据进行聚合、分析、统计形成路径树,其主要基于用户浏览行为对应的日志文件进行路径分析。其中,通过服务器将页面转换路径进行分析形成路径树,其一次性可将用户浏览行为所发生的页面展示和操作行为数据直观呈现出来,而不需要用户自己对页面转换过程进行统计转化漏斗,提高了路径分析的效率。进一步地,在最终形成路径树所展示的页面转换路径中,业务人员能够对各类数据进行直观的数据分析,发现出某些页面转换路径效率低下的问题,便于对页面结构进行调整。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为实施例一路径漏斗的生成方法的第一种方法流程图;
图2为实施例一路径漏斗的生成方法的第二种方法流程图;
图3为实施例一路径漏斗的生成方法的第三种方法流程图;
图4为实施例一路径漏斗的生成方法的第四种方法流程图;
图5为实施例一路径漏斗的生成方法的第五种方法流程图;
图6为实施例二路径漏斗的生成方法的方法流程图;
图7为实施例三路径漏斗的生成装置的第一种模块框图;
图8为实施例三路径漏斗的生成装置中生成模块的模块框图;
图9为实施例三路径漏斗的生成装置中拆分模块的模块框图;
图10为实施例三路径漏斗的生成装置中展开模块的模块框图;
图11为实施例三路径漏斗的生成装置的第二种模块框图;
图12为实施例三路径漏斗的生成装置中调整模块的模块框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的远端网络设备,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本发明的实施例中,远端网络设备、终端设备与WNS服务器之间可通过任何通讯方式实现通讯,包括但不限于,基于3GPP、LTE、WIMAX的移动通讯、基于TCP/IP、UDP协议的计算机网络通讯以及基于蓝牙、红外传输标准的近距无线传输方式。
路径分析是常用的数据挖据方法之一,是一种找寻频繁访问路径的方法,它通过对Web服务器的日志文件中客户访问站点访问次数的分析,挖掘出频繁访问路径。
实施例一
结合图1,本发明实施例提供一种路径漏斗的生成方法,包括步骤:
S11获取用户的访问数据;
当用户访问客户端时会上报各种访问数据,服务器可通过获取该日志文件对应的用户的访问数据进行分析。日志的具体字段主要包括渠道、版本、用户标识、上报时间、日志类型、模块-页面、操作行为等。其中日志类型为pageview的表示页面展示,即用户能看到一个页面整体,此种日志类型即为路径节点;日志类型为click的表示用户主动触发的点击操作,该操作可能是用户触发播放视频,或者是下载应用等操作,此种日志类型即为用户操作行为。
S12根据所述访问数据生成访问日志列表;
具体地,结合图2,步骤S12包括步骤:
S121将访问数据中的业务维度与用户信息聚合,生成聚合列表;
在本实施例中,为进一步了解用户的使用习惯和各网站或应用不同页面之间的转换过程,优选对访问数据中的业务维度与用户信息进行聚合(group by)操作,将每个用户的访问数据变成一个聚合列表。其中,业务维度是渠道和版本。
S122根据访问数据中的时间戳,对所述聚合列表中的访问数据进行升序排序,获得排序后的访问日志列表。
具体地,为进一步对生成的聚合列表中每个用户的访问数据进行分析,按照聚合列表中的时间戳对每个用户的访问数据进行升序排序。其中时间戳具体指代访问数据中的上报时间,如当用户触发一个操作行为,该操作行为被记录在日志文件中的同时包括上报时间。
S13对所述访问日志列表进行会话拆分,获得会话;
具体地,结合图3,步骤S13包括步骤:
S131获取所述访问日志列表中的一条日志记录作为当前日志记录;
S132判断当前日志记录是否为启动日志记录;
具体地,所述访问日志列表为聚合列表根据时间戳进行升序排序后的结果,在本步骤中,将逐一按序判断所述访问日志列表中所包括的每一条日志记录。其中判断的条件为是否为启动日志记录,所述启动日志记录为用户触发使用浏览器或应用的记录。
S133若是,将当前日志记录所处位置标识为拆分节点,将所述拆分节点之前未拆分的日志记录归为一个会话;
具体地,当判断所述日志记录为启动日志记录时,将对应的日志记录所处位置标识为拆分节点,并将拆分节点之前(不包括对应的日志记录)尚未进行拆分的日志记录归为一个会话。
S134若否,确认所述访问日志列表中存在下一条日志记录,把所述访问日志列表中的下一条日志记录作为当前日志记录,继续所述判断当前日志记录是否为启动日志记录的步骤(步骤S132)。
具体为,当对当前日志记录进行判断,判断出其结果为非启动日志记录时,将不对当前日志记录作出任何操作,并直接执行对下一条日志记录进行判断。
进一步地,结合图4,在步骤S131之前,还包括步骤:
S135判断所述访问日志列表中首条日志记录的日志类型,所述日志类型包括页面展示、启动入口、操作行为;
S136若判定为页面展示或启动入口,继续所述获取所述访问日志列表中的一条日志记录作为当前日志记录的步骤(步骤S131);
S137若判定为操作行为,将所述首条日志记录过滤处理,同时将下一条日志记录作为首条日志记录,继续所述判断所述访问日志列表中首条日志记录的日志类型的步骤(步骤S135)。
具体为,设置形成第一个会话的前提条件为判断出首条日志记录的日志类型为页面展示或启动入口,否则将对应的日志记录过滤处理。其中,由于设置有对首条日志记录的判断过程(前提条件),其形成的第一个会话将至少包括一条判定为页面展示或启动入口的日志记录。亦即,当形成第一个会话时,除当前日志记录被判断为启动日志记录外,还确保前序没过滤处理的日志记录中的首条日志记录的日志类型为页面展示或启动入口。
在本实施例中,步骤S135、S136、S137优化路径分析中会话拆分的过程,对所述访问日志列表中按序之下第一次判定为页面展示或启动入口对应的日志记录之前的日志记录过滤处理,亦即将用户在浏览信息过程中对页面转换过程路径分析无效的数据过滤处理,减少了后续分析过程中的无效性工作以及提高了路径分析的精确度。上述步骤S135、S136、S137为本实施例优选的步骤,在另一种可行的方案中,所述步骤S133还包括步骤:
判断第一个会话中的首条日志记录的日志类型是否为页面展示或启动入口;
若是,继续步骤S14;
若否,将所述第一个会话中的首条日志记录过滤处理,若所述第一个会话中存在下一条日志记录,将所述第一个会话中的下一条日志记录作为首条日志记录,继续所述判断第一个会话中的首条日志记录的日志类型是否为页面展示或启动入口的步骤;若所述第一个会话中不存在下一条日志记录则将所述第一个会话过滤处理,并将下一个会话作为第一会话,继续所述判断第一个会话中的首条日志记录的日志类型是否为页面展示或启动入口的步骤。
该可行的方案中,通过判断步骤S133中拆分的会话是否有效,实现了在拆分后的会话中过滤无效数据,同样减少了后续分析过程中的无效性工作以及提高了路径分析的精确度。
S14将所述会话展开,获得会话路径;
具体地,结合图5,步骤S14包括步骤:
S141逐一按序判断所述会话中日志记录的日志类型,所述日志类型包括页面展示和操作行为;在本步骤中,将对同一会话中的日志记录进行判断处理,以对会话进行展开形成多条路径。
S142当判定为页面展示时,将对应的日志记录合成一条新路径,并作为路径起点,放入路径池中;
S143当判定为操作行为,且确认所述路径池中包含至少一条新路径时,将对应的日志记录追加至前一条判定为页面展示的日志记录中,并合成行为临时路径,放入所述路径池中。
进一步地,步骤S142,还包括步骤:
S144当判定为页面展示的次数少于5次,且确认所述路径池中包含至少一条新路径时,将对应日志记录同时追加至前一条判定为页面展示的日志记录中,并合成页面临时路径,放入所述路径池中。
具体地,当判定为页面展示的次数等于大于5次时,将不作任何追加处理,仅合成一条新路径,并放入所述路径池中。步骤S144为紧接于步骤S142执行处理的步骤,当通过步骤S142合成至少一条新路径后,执行步骤S144可将判定为页面展示的次数少于5次的对应的日志记录追加至前一条判定为页面展示的日志记录中。例如,所述访问日志列表中排序第一、第二、第三条的日志记录的日志类型均被判定为页面展示时,执行步骤S142将对应合成三条分别由第一、第二、第三条日志记录构成的独立的新路径;对应步骤S144,第二条日志记录将追加至第一条日志记录中,形成由第一、第二条日志记录合成的页面临时路径;第三条日志记录将追加至第二条日志记录中,合成由第一、第二、第三条日志记录合成的页面临时路径,以及由第二、第三条日志记录合成的页面临时路径。
其中,在步骤S141~S144中,完成了对每一个拆分形成的会话进行展开处理,其最终获得至少一条从当前页面转换至其他页面的路径过程。步骤S14通过以下举例进行分析:
假设步骤S13拆分后形成的其中一个会话为:
Click1->Pv1->Pv2->Click2->Click3->Pv3->Click4
由于第一条日志记录Click1的日志类型为操作行为,将不对第一条日志记录进行任何处理,并继续进行对第二条日志记录Pv1的判断,此时,将对Pv1对应的日志记录进行合成,形成新路径并放入路径池中。紧接着将对第三条日志记录Pv2进行判断,Pv2对应为页面展示,结合步骤S142与步骤S144,Pv2所对应的日志记录将被合成形成新路径的同时,追加至Pv1中形成由Pv1->Pv2构成的临时路径。紧接着对第四条日志记录Click2进行判断,Click2对应为操作行为,结合步骤S143,其将追加至临时路径Pv1->Pv2和新路径Pv2中,形成临时路径Pv1->Pv2->Click2和Pv2->Click2。以此类推,当完成对上述会话中所有日志记录的判断时,将包括以下路径:
Pv1 Pv1->Pv2 Pv1->Pv2->Click2 Pv1->Pv2->Click3 Pv1->Pv2->Pv3Pv1->Pv2->Pv3->Click4
Pv2 Pv2->Click2 Pv2->Click3 Pv2->Pv3 Pv2->Pv3->Click4
Pv3 Pv3->Click4
从上述例子明显可见,形成的新路径包括三条分别由Pv1、Pv2、Pv3构成,其他的将形成临时路径。
S15对所述会话路径进行聚合,形成路径树。
针对步骤S14形成的会话路径,进行聚合统计。该聚合统计过程将统计出服务器获取的用户的访问数据中,有多少用户具有相同的会话路径。例如以上述例子中形成的临时路径Pv1->Pv2->Click3为例,表示用户从页面Pv1转换至页面Pv2后,触发了操作行为Click3,在步骤S15中将对服务器获取到的访问数据中所有用户均具有该会话路径的用户进行统计。最终根据聚合统计的结果形成路径树。
实施例二
结合图6,区别于上述实施例,本发明实施例在步骤S15之后,还包括步骤:
S21根据所述路径树统计页面转换路径占比;
S22根据所述页面转换路径占比进行优先级排序;
具体地,由步骤S15中形成的所述路径树以直观地形式展示出各个页面转换之间的路径结构,同时可以显示出每一条页面转换路径所对应的用户数,借此以同一条页面转换路径所对应的用户数作为一个占比,进行各页面转换路径的优先级排序。优先级的排序结果进一步地表明了用户使用的习惯与各页面转换路径的使用效率。
S23根据优先级排序结果,调整页面结构。
具体地,步骤S23包括步骤:
根据所述优先级排序结果,以排序在预设序列前的页面转换路径为准,调整排序在预设序列后的页面转换路径,以均衡各页面转换路径的效率;在对页面转换路径占比进行优先级排序后,可发现某些页面转换路径效率低下的特点。其中,所述预设序列为预设的优先级排名,如现在步骤S15聚合统计形成的路径树中对应具有5条页面转换路径,则可假设预设序列为3,此时,可以优先级排序在排名在第3之前的页面转换路径为基准,对优先级排序在排名在第3之后的页面转换路径进行调整;该调整包括对转换前后页面的页面结构的调整、页面转换方式的调整、页面转换启动入口的调整等。
和/或,根据所述优先级排序结果,调整各页面转换路径启动入口在页面上的显示位置。
本步骤中,根据优先级的排序结果对各页面转换路径启动入口进行调整,具体地,如当从精选首页转换至搜索首页的优先级排序高于从精选首页转换至精选推荐的页面转换路径时,调整启动搜索首页的入口与精选推荐两者所处页面的位置,以使启动搜索首页的入口更容易为用户所使用和提高使用的便捷性,进而通过对页面结构的调整提高用户体验。
实施例三
结合图7,本发明实施例提供一种路径漏斗的生成装置,包括模块:
获取模块31,用于获取用户的访问数据;
生成模块32,用于根据所述访问数据生成访问日志列表;
具体地,结合图8,所述生成模块32包括单元:
聚合单元321,用于将访问数据中的业务维度与用户信息聚合生成聚合列表;
排序单元322,用于根据访问数据中的时间戳,对所述聚合列表中的访问数据进行升序排序,获得排序后的访问日志列表。
拆分模块33,用于对所述访问日志列表进行会话拆分,获得会话;
具体地,结合图9,所述拆分模块33包括单元:
获取单元331,用于获取所述访问日志列表中的一条日志记录作为当前日志记录;
第一判断单元332,用于判断当前日志记录是否为启动日志记录;
若是,将当前日志记录所处位置标识为拆分节点,将所述拆分节点之前未拆分的日志记录归为一个会话;
若否,确认所述访问日志列表中存在下一条日志记录,把所述访问日志列表中的下一条日志记录作为当前日志记录,继续所述判断当前日志记录是否为启动日志记录的步骤。
进一步地,所述拆分模块33还包括单元:
第二判断单元333,用于判断所述访问日志列表中首条日志记录的日志类型,所述日志类型包括页面展示、启动入口、操作行为;
若判定为页面展示或启动入口,继续所述获取所述访问日志列表中的一条日志记录作为当前日志记录的步骤;
若判定为操作行为,将所述首条日志记录过滤处理,同时将下一条日志记录作为首条日志记录,继续所述判断所述访问日志列表中首条日志记录的日志类型的步骤。
展开模块34,用于将所述会话展开,获得会话路径;
具体地,结合图10,所述展开模块34包括单元:
第三判断单元341,用于逐一按序判断所述会话中日志记录的日志类型,所述日志类型包括页面展示和操作行为;
第一合成单元342,用于当判定为页面展示时,将对应的日志记录合成一条新路径,并作为路径起点,放入路径池中;
第二合成单元343,用于当判定为操作行为时,且确认所述路径池中包含至少一条新路径,将对应的日志记录追加至前序判定为页面展示的日志记录中,并合成行为临时路径,放入所述路径池中。
进一步地,所述展开模块34还包括单元:
第三合成单元,用于当判定为页面展示的次数少于4次时,将对应日志记录同时追加至前序判定为页面展示的日志记录中,并合成页面临时路径,放入所述路径池中。
聚合模块35,用于对所述会话路径进行聚合,形成路径树。
优选地,结合图11,本发明实施例还包括以下模块:
统计模块36,用于根据所述路径树统计页面转换路径占比;
排序模块37,用于根据所述页面转换路径占比进行优先级排序;
调整模块38,用于根据优先级排序结果,调整页面结构。
具体地,结合图12,所述调整模块38包括单元:
均衡单元381,用于根据所述优先级排序结果,以排序在预设序列前的页面转换路径为准,调整排序在预设序列后的页面转换路径,以均衡各页面转换路径的效率;
调整单元382,用于根据所述优先级排序结果,调整各页面转换路径启动入口在页面上的显示位置。
优选地,本实施例还提供一种服务器,其包括处理器及存储器,其中处理器用于执行存储于存储器的以下程序模块:
获取模块,用于获取用户的访问数据;
生成模块,用于根据所述访问数据生成访问日志列表;
拆分模块,用于对所述访问日志列表进行会话拆分,获得会话;
展开模块,用于将所述会话展开,获得会话路径;
聚合模块,用于对所述会话路径进行聚合,形成路径树。
进一步地,所述存储器还用于执行存储于存储器中各程序模块包括的单元。
实施例四
本发明实施例提供一种服务器,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行如上实施例一、二所述的路径漏斗的生成方法。
在本发明实施例中,该服务器所包括的处理器具备执行上述的实施例一、二所述的路径漏斗的生成方法的功能,在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种路径漏斗的生成方法,其特征在于,包括步骤:
获取用户的访问数据;
根据所述访问数据生成访问日志列表;
对所述访问日志列表进行会话拆分,获得会话;
将所述会话展开,获得会话路径;
对所述会话路径进行聚合,形成路径树。
2.根据权利要求1所述的路径漏斗的生成方法,其特征在于,所述根据所述访问数据生成访问日志列表,包括步骤:
将访问数据中的业务维度与用户信息聚合,生成聚合列表;
根据访问数据中的时间戳,对所述聚合列表中的访问数据进行升序排序,获得排序后的访问日志列表。
3.根据权利要求2所述的路径漏斗的生成方法,其特征在于,所述对所述访问日志列表进行会话拆分,获得会话,包括步骤:
获取所述访问日志列表中的一条日志记录作为当前日志记录;
判断当前日志记录是否为启动日志记录;
若是,将当前日志记录所处位置标识为拆分节点,将所述拆分节点之前未拆分的日志记录归为一个会话;
若否,确认所述访问日志列表中存在下一条日志记录,把所述访问日志列表中的下一条日志记录作为当前日志记录,继续所述判断当前日志记录是否为启动日志记录的步骤。
4.根据权利要求3所述的路径漏斗的生成方法,其特征在于,所述获取所述访问日志列表中的一条日志记录作为当前日志记录之前,还包括步骤:
判断所述访问日志列表中首条日志记录的日志类型,所述日志类型包括页面展示、启动入口、操作行为;
若判定为页面展示或启动入口,继续所述获取所述访问日志列表中的一条日志记录作为当前日志记录的步骤;
若判定为操作行为,将所述首条日志记录过滤处理,同时将下一条日志记录作为首条日志记录,继续所述判断所述访问日志列表中首条日志记录的日志类型的步骤。
5.根据权利要求4所述的路径漏斗的生成方法,其特征在于,所述将所述会话展开,获得会话路径,包括步骤:
逐一按序判断所述会话中日志记录的日志类型,所述日志类型包括页面展示和操作行为;
当判定为页面展示时,将对应的日志记录合成一条新路径,并作为路径起点,放入路径池中;
当判定为操作行为,且确认所述路径池中包含至少一条新路径时,将对应的日志记录追加至前一条判定为页面展示的日志记录中,并合成行为临时路径,放入所述路径池中。
6.根据权利要求5所述的路径漏斗的生成方法,其特征在于,所述当判定为页面展示时,将对应的日志记录合成一条新路径,并作为路径起点,放入路径池中,还包括步骤:
当判定为页面展示的次数少于5次,且确认所述路径池中包含至少一条新路径时,将对应的日志记录追加至前一条判定为页面展示的日志记录中,并合成页面临时路径,放入所述路径池中。
7.根据权利要求1所述的路径漏斗的生成方法,其特征在于,所述形成路径树之后,还包括步骤:
根据所述路径树统计页面转换路径占比;
根据所述页面转换路径占比进行优先级排序;
根据优先级排序结果,调整页面结构。
8.根据权利要求7所述的路径漏斗的生成方法,其特征在于,所述根据优先级排序结果,调整页面结构,包括步骤:
根据所述优先级排序结果,以排序在预设序列前的页面转换路径为准,调整排序在预设序列后的页面转换路径,以均衡各页面转换路径的效率;
和/或,根据所述优先级排序结果,调整各页面转换路径启动入口在页面上的显示位置。
9.一种路径漏斗的生成装置,其特征在于,包括模块:
获取模块,用于获取用户的访问数据;
生成模块,用于根据所述访问数据生成访问日志列表;
拆分模块,用于对所述访问日志列表进行会话拆分,获得会话;
展开模块,用于将所述会话展开,获得会话路径;
聚合模块,用于对所述会话路径进行聚合,形成路径树。
10.一种服务器,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1~8任一项所述的路径漏斗的生成方法。
CN201711189374.2A 2017-11-24 2017-11-24 路径漏斗的生成方法、装置和服务器 Active CN107943679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711189374.2A CN107943679B (zh) 2017-11-24 2017-11-24 路径漏斗的生成方法、装置和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711189374.2A CN107943679B (zh) 2017-11-24 2017-11-24 路径漏斗的生成方法、装置和服务器

Publications (2)

Publication Number Publication Date
CN107943679A true CN107943679A (zh) 2018-04-20
CN107943679B CN107943679B (zh) 2021-02-26

Family

ID=61949630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711189374.2A Active CN107943679B (zh) 2017-11-24 2017-11-24 路径漏斗的生成方法、装置和服务器

Country Status (1)

Country Link
CN (1) CN107943679B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960908A (zh) * 2018-06-22 2018-12-07 福建南威软件有限公司 一种基于大数据用户行为序列的分析方法
CN109242164A (zh) * 2018-08-22 2019-01-18 中国平安人寿保险股份有限公司 优化产品路径的方法及装置、计算机存储介质、电子设备
CN111552905A (zh) * 2020-04-22 2020-08-18 苏宁云计算有限公司 一种用户访问关键路径的获取方法及系统
CN112632446A (zh) * 2020-12-30 2021-04-09 江苏苏宁云计算有限公司 页面访问路径的构建方法及系统
CN113176980A (zh) * 2021-05-25 2021-07-27 医声医事(北京)科技有限公司 一种流量漏斗的动态构建方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103597508A (zh) * 2011-04-11 2014-02-19 谷歌公司 基于转化路径的分段
CN103631828A (zh) * 2012-08-28 2014-03-12 阿里巴巴集团控股有限公司 确定访问路径的方法和装置、确定页面流失率的方法和系统
CN104462156A (zh) * 2013-09-25 2015-03-25 阿里巴巴集团控股有限公司 一种基于用户行为的特征提取、个性化推荐方法和系统
US20150135018A1 (en) * 2013-11-12 2015-05-14 Fujitsu Limited Analysis method, analysis apparatus, computer-readable storage medium storing analysis program
US20160026510A1 (en) * 2014-07-24 2016-01-28 Home Box Office, Inc. Structured logging system
CN105959372A (zh) * 2016-05-06 2016-09-21 华南理工大学 一种基于移动应用的互联网用户数据分析方法
CN106294559A (zh) * 2016-07-26 2017-01-04 北京三快在线科技有限公司 一种应用流量分析方法及装置
CN106708841A (zh) * 2015-11-12 2017-05-24 北京国双科技有限公司 网站访问路径的聚合方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103597508A (zh) * 2011-04-11 2014-02-19 谷歌公司 基于转化路径的分段
CN103631828A (zh) * 2012-08-28 2014-03-12 阿里巴巴集团控股有限公司 确定访问路径的方法和装置、确定页面流失率的方法和系统
CN104462156A (zh) * 2013-09-25 2015-03-25 阿里巴巴集团控股有限公司 一种基于用户行为的特征提取、个性化推荐方法和系统
US20150135018A1 (en) * 2013-11-12 2015-05-14 Fujitsu Limited Analysis method, analysis apparatus, computer-readable storage medium storing analysis program
US20160026510A1 (en) * 2014-07-24 2016-01-28 Home Box Office, Inc. Structured logging system
CN106708841A (zh) * 2015-11-12 2017-05-24 北京国双科技有限公司 网站访问路径的聚合方法和装置
CN105959372A (zh) * 2016-05-06 2016-09-21 华南理工大学 一种基于移动应用的互联网用户数据分析方法
CN106294559A (zh) * 2016-07-26 2017-01-04 北京三快在线科技有限公司 一种应用流量分析方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960908A (zh) * 2018-06-22 2018-12-07 福建南威软件有限公司 一种基于大数据用户行为序列的分析方法
CN109242164A (zh) * 2018-08-22 2019-01-18 中国平安人寿保险股份有限公司 优化产品路径的方法及装置、计算机存储介质、电子设备
CN109242164B (zh) * 2018-08-22 2022-04-26 中国平安人寿保险股份有限公司 优化产品路径的方法及装置、计算机存储介质、电子设备
CN111552905A (zh) * 2020-04-22 2020-08-18 苏宁云计算有限公司 一种用户访问关键路径的获取方法及系统
CN111552905B (zh) * 2020-04-22 2024-08-06 苏宁云计算有限公司 一种用户访问关键路径的获取方法及系统
CN112632446A (zh) * 2020-12-30 2021-04-09 江苏苏宁云计算有限公司 页面访问路径的构建方法及系统
CN113176980A (zh) * 2021-05-25 2021-07-27 医声医事(北京)科技有限公司 一种流量漏斗的动态构建方法及系统
CN113176980B (zh) * 2021-05-25 2023-09-12 医声医事(北京)科技有限公司 一种流量漏斗的动态构建方法及系统

Also Published As

Publication number Publication date
CN107943679B (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
CN107943679A (zh) 路径漏斗的生成方法、装置和服务器
KR20160137935A (ko) 소셜 네트워크 정보흐름 표시방법, 장치, 서버, 프로그램 및 컴퓨터가 판독가능한 기록매체
CN101996196B (zh) 一种动态网页的采集方法及装置
US20110289088A1 (en) System and method for ranking content interest
CN103502930A (zh) 对复杂事件处理(cep)中的新插入流(istream)操作的支持
CN106603296A (zh) 日志的处理方法及装置
CN105956161A (zh) 一种信息推荐方法和装置
US20160147780A1 (en) Identifying Related Entities
DE112011102698T5 (de) Operationalisieren einer Suchmaschinenoptimierung
CN103761330A (zh) 基于模版配置实现互联网信息自动提取的系统及方法
CN106656741A (zh) 一种信息推送方法和系统
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
US11144555B2 (en) Keyword reporting for mobile applications
CN105938493A (zh) 一种资源搜索方法和装置
CN110020152B (zh) 应用推荐方法及装置
CN102866945B (zh) 用于提供用户所对应的第一应用测试信息的方法和设备
CN111371605A (zh) 网络服务评分方法及装置
KR102197152B1 (ko) 투자정보 제공 시스템
CN101464883A (zh) 内容检索设备和方法
JP2006053616A (ja) サーバ装置、webサイト推奨方法およびプログラム
CN102541946A (zh) 基于超链接的推荐属性确定超链推荐度的方法与设备
CN103530392B (zh) 确定抓取流量的方法及设备
CN106227661B (zh) 数据处理方法及装置
US20130212101A1 (en) Portlet processing apparatus, portal server, portal system, portlet processing method and recording medium
CN103227791A (zh) 一种无线数据采集的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200420

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510640 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 15 layer self unit 02

Applicant before: GUANGZHOU UC NETWORK TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant