CN106570013A - 页面访问数据的处理方法和装置 - Google Patents

页面访问数据的处理方法和装置 Download PDF

Info

Publication number
CN106570013A
CN106570013A CN201510649582.0A CN201510649582A CN106570013A CN 106570013 A CN106570013 A CN 106570013A CN 201510649582 A CN201510649582 A CN 201510649582A CN 106570013 A CN106570013 A CN 106570013A
Authority
CN
China
Prior art keywords
event
access
user
information
event log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510649582.0A
Other languages
English (en)
Other versions
CN106570013B (zh
Inventor
郭秦龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201510649582.0A priority Critical patent/CN106570013B/zh
Publication of CN106570013A publication Critical patent/CN106570013A/zh
Application granted granted Critical
Publication of CN106570013B publication Critical patent/CN106570013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种页面访问数据的处理方法和装置。其中,该方法包括:从页面访问日志中提取事件日志,其中,事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;对事件日志中所包含的多个事件的信息进行流程挖掘,生成事件日志对应的流程模型,其中,流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;根据事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。本发明解决了现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的技术问题。

Description

页面访问数据的处理方法和装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种页面访问数据的处理方法和装置。
背景技术
用户行为分析是互联网中一个十分常见的问题。目前,互联网上绝大多数网站均会通过日志的形式对访问网站的信息进行记录,通过对访问网站的日志进行分析,可以分析出用户的行为。
现有的用户行为分析方法采用统计的手段,通过访问的会话信息,区分用户。通过统计访问网站的用户的浏览器、来源的地理位置、登录的时间、访问的页面和时间长度等信息描述用户行为,并进行统计,达到用户行为分析的目的。但是现有技术中用于分析用户行为的方法仅仅采用统计方法,只能对单个访问的页面信息进行统计,无法对多个访问的页面之间的关系进行分析,导致用户行为的分析结果不准确、不完整。
针对现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种页面访问数据的处理方法和装置,以至少解决现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的技术问题。
根据本发明实施例的一个方面,提供了一种页面访问数据的处理方法,包括:从页面访问日志中提取事件日志,其中,事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;对事件日志中所包含的多个事件的信息进行流程挖掘,生成事件日志对应的流程模型,其中,流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;根据事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。
根据本发明实施例的另一方面,还提供了一种页面访问数据的处理装置,包括提取模块,用于从页面访问日志中提取事件日志,其中,所述事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;生成模块,用于对所述事件日志中所包含的所述多个事件的信息进行流程挖掘,生成所述事件日志对应的流程模型,其中,所述流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;输出模块,用根据所述事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。
在本发明实施例中,在从数据库的页面访问日志中提取事件日志之后,对上述事件日志中的多个事件的信息进行流程挖掘,生成与上述事件日志对应流程模型,并且根据上述流程模型输出用户访问页面所产生的行为数据。因此,上述方案可以实现从流程角度对用户行为进行分析,输出用户行为数据。容易注意到,由于上述事件日志中的多个事件的信息进行流程挖掘,生成与上述事件日志对应流程模型,通过对用户访问页面的访问流程进行建模,得到用户行为数据,这样不仅实现了从流程角度对用户行为进行分析,进一步还可以从流程模型中得到用户访问页面的主要浏览顺序,从而解决现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的问题。由此可知,本申请上述实施例,通过对事件日志中包含的事件的信息进行流程挖掘,生成流程模型,得到用户行为数据,实现准确、完整分析用户行为的目的,提升用户的好感度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种页面访问数据的处理方法的流程图;
图2是根据本发明实施例的一种可选的流程模型的示意图;
图3是根据本发明实施例的一种页面访问数据的处理装置的示意图;
图4是根据本发明实施例的一种可选的页面访问数据的处理装置的示意图;
图5是根据本发明实施例的另一种可选的页面访问数据的处理装置的示意图;以及
图6是根据本发明实施例的第三种可选的页面访问数据的处理装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面对本发明实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
用户行为分析:在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站的规律。
流程挖掘:流程挖掘是一个流程管理的技术,允许基于时间日志对业务流程进行分析。
会话:用户从开始页面访问到结束页面访问所进行的一系列操作。
事件:用户访问页面对控件进行的操作,例如点击按钮,加载网页等。
XML格式:是可扩展标记语言(Extensible Markup Language)的缩写,是一种标记语言,用来传输和存储数据。
SQL语句:是结构化查询语言(Structured Query Language)的缩写,是一种数据库查询和程序设计语言,用于数据库中的标准数据查询语言。
csv格式:是逗号分隔值(Comma Separated Values)的缩写,通常是文本文件,用WORDPAD或记事本,EXCEL打开。
实施例1
根据本发明实施例,提供了一种页面访问数据的处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种页面访问数据的处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,从页面访问日志中提取事件日志,其中,事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息。
具体的,用户访问网站的页面访问日志可以存储在数据库中,页面访问日志可以是一种XML格式的文件,用于保存会话信息,访问网站的用户的浏览器,来源的地理位置,登录的时间,访问的页面和时间长度等数据。事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息,可以通过查询方式从存储在数据库中的页面访问日志中查找得到相应的数据信息。会话编号可以用来判断访问页面的访问用户,不同用户分配不同的会话编号,因此可以使用会话编号区分不同的用户。会话可以包含用户访问多个网站产生的多个事件,并且由于访问时间的不同,产生的多个事件具有一定的产生顺序。
步骤S104,对事件日志中所包含的多个事件的信息进行流程挖掘,生成事件日志对应的流程模型,其中,流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息。
具体的,在事件日志中对应的选取访问时间、事件的标题信息以及会话编号的数据信息作为流程挖掘的输入数据,根据访问时间以及会话编号的不同,确定事件的标题信息之间的跳转关系,进一步生成事件日志所对应的流程模型。流程模型由节点和边两部分构成,其中节点用于表征事件本身,可以记录用户访问页面产生的事件的标题信息,边表示用户访问页面之后产生的任意两个事件之间的跳转关系。由于发生时间的不同,事件之间的发生顺序也不同,因此,任意两个事件之间的跳转关系表示任意两个事件之间的发生顺序。进一步地,由于每个事件的发生具有先后顺序,任意两个事件之间的发生顺序有一定的方向性,由此可知流程模型可以通过有向图结构表示。
步骤S106,根据事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。
具体的,流程模型包含事件的标题信息和任意两个事件之间的跳转关系,可以通过统计事件的标题信息的会话数量,确定每一个事件的下一个关联事件,从而得到一条多个事件的标题信息构成的最优访问路径,根据最优访问路径可以进一步确定用户访问页面所产生的行为数据,用户访问页面所产生的行为数据可以表征多数用户访问多个页面时的访问顺序。通过输出的该用户访问页面所产生的行为数据,可以根据多数用户的访问顺序更改页面的跳转顺序,实现用户对页面的快速访问,提升用户的好感度。
本申请上述实施例提供了一种方案,在从数据库的页面访问日志中提取事件日志之后,对上述事件日志中的多个事件的信息进行流程挖掘,生成与上述事件日志对应的流程模型,并且根据上述流程模型输出用户访问页面所产生的行为数据。因此,上述方案可以实现从流程角度对用户行为进行分析,输出用户行为数据。容易注意到,由于上述事件日志中的多个事件的信息进行流程挖掘,生成与上述事件日志对应流程模型,通过对用户访问页面的访问流程进行建模,得到用户行为数据,这样不仅实现了从流程角度对用户行为进行分析,进一步还可以从流程模型中得到用户访问页面的主要浏览顺序,从而解决现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的问题。由此可知,本申请上述实施例提供的页面访问数据的处理方法,通过对事件日志中包含的事件的信息进行流程挖掘,生成流程模型,得到用户行为数据,实现准确、完整分析用户行为的目的,提升用户的好感度。
可选地,本申请上述实施例中,事件的信息包括:用户访问页面之后所产生事件的标题信息和对应的访问时间。
具体的,用户访问页面之后产生相应的事件,数据库中页面访问日志中可以记录事件的标题信息,通过事件的标题信息可以了解用户访问页面的主要内容或者用户访问页面时的主要操作,例如用户访问页面的主要内容为填写注册表单,或者用户访问页面时的主要操作为点击注册按钮,并且页面访问日志中可以记录用户访问页面的访问时间,上述访问时间可以是产生相应事件的发生时间。因此,从数据库保存的页面访问日志中提取事件日志,事件日志中每一个事件的信息都可以记录用户访问页面之后产生的事件的标题信息和对应的访问时间。
一种可选地场景如下:2015年7月2日,用户打开页面进行注册,用户点击注册按钮的时间为18点整,点击注册按钮之后,页面跳转到填写注册信息表网页,那么数据库的页面访问日志中会增加一条事件,事件的标题信息为点击注册按钮,访问时间为2015/7/2 18:00,因此从页面访问日志中提取的事件信息为点击注册按钮和2015/7/2 18:00。
可选地,本申请上述实施例中,步骤S102从页面访问日志中提取事件日志包括如下步骤:
步骤S1022,获取预设的查询条件,其中,查询条件至少包括如下字段:会话编号、时间戳和用户访问的页面的标题信息。
具体的,可以通过获取预设好的查询条件,并且在数据库中查询得到事件日志包含的数据信息,从而实现从数据库中提取事件日志。事件日志可以包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息,因此查询条件可以为会话编号,事件的标题信息和时间戳。会话编号可以用来区分不同的用户,时间戳可以是用户访问页面产生事件的访问时间,用户访问的页面的标题信息可以是用户访问页面产生的事件的标题信息。
步骤S1024,根据查询条件从数据库中保存的页面访问日志,查询得到满足查询条件的数据信息。
具体的,页面访问日志可以存储在数据库当中,因此可以构建不同的SQL语句,查询得到满足查询条件的数据信息。
一种可选地场景如下:会话编号、时间戳和用户访问的页面的标题信息都可以在数据库中一个名为pageview的表中找到,那么可以通过如下的SQL语句查询得到满足查询条件的数据信息:
Select sessionid,’timestamp’,pagetitle
from pageview
在上述SQL语句中,sessionid表示会话编号,timestamp表示时间戳,pagetitle表示用户访问的页面的标题信息。
步骤S1026,将数据信息保存为指定格式的文件,得到事件日志。
具体的,可以通过excel表格将通过步骤S1024查询得到的数据信息进行保存,保存格式可以是csv,xls或者xlsx格式,上述步骤中的指定格式可以是csv格式。表1是一个可选的事件日志的示例。
表1
会话编号 页面的标题信息 时间戳
1 点击注册按钮 2015/7/2 18:01
1 填写注册表单1 2015/7/2 18:02
1 出错 2015/7/2 18:03
2 点击注册按钮 2015/7/2 18:04
2 填写注册表单1 2015/7/2 18:05
2 填写注册表单2 2015/7/2 18:06
2 出错 2015/7/2 18:07
3 点击注册按钮 2015/7/2 18:08
3 填写注册表单1 2015/7/2 18:09
3 填写注册表单2 2015/7/2 18:10
3 注册成功 2015/7/2 18:11
4 填写注册表单1 2015/7/2 18:09
4 填写注册表单2 2015/7/2 18:10
4 出错 2015/7/2 18:11
如表1所示,上述事件日志的示例中第一列表示会话编号,表1中有4个会话编号,每一个会话编号代表一个会话,第二列表示事件的标题信息,第三列表示事件对应的访问时间,第二列和第三列是事件的信息,表1中共有14个事件的信息。
通过上述步骤S1022至步骤S1024,可以根据预设的查询条件从数据库中保存的页面访问日志中查询到相应的数据信息,并将数据信息保存为制定格式的文件,从而得到事件日志。在得到事件日志之后,可以通过将事件日志作为输入数据进行流程挖掘,得到用户行为的数据。
可选地,本申请上述实施例中,步骤S104对事件日志中所包含的多个事件的信息进行流程挖掘,得到事件日志所对应的流程模型包括:
步骤S1042,结合事件日志中的会话编号和访问时间,对事件日志中包含的多个事件进行排序,确定事件日志中每个事件的发生顺序。
具体的,结合表1所示,当会话编号不同时,按照会话编号的大小对每个会话进行排序,当会话编号相同时,按照访问时间的顺序对每个事件信息进行排序。结合表1可知,从会话1中选择用户访问的页面的标题信息为点击注册按钮和页面的标题信息为出错的两个事件的信息,两个事件的访问时间分别为2015/7/218:01和2015/7/218:03,因此用户访问的页面的标题信息为点击注册按钮的事件的信息发生在页面的标题信息为出错的事件的信息之前。
步骤S1044,结合事件日志中每个事件的会话编号和发生顺序,获取任意两个事件之间的跳转信息。
具体的,根据事件的会话编号和发生顺序,可以获取任意两个事件之间的跳转信息。结合表1可知:会话编号1中填写注册表单1发生在出错之前,因此填写注册表单1可以跳转至出错,会话编号2中填写注册表单1发生在填写注册表单2之前,因此填写注册表单1可以跳转至填写注册表单2,结合上述两个跳转信息可知,填写注册表单1可以跳转至出错,也可以跳转至填写注册表单2,即填写注册表单1可以跳转至出错或者填写注册表单2中的任意一项。会话编号2中填写注册表单2可以跳转至出错,会话编号3中填写注册表单2可以跳转至注册成功,因此可知填写注册表单2可以跳转至出错或者注册成功中的任意一项。
步骤S1046,按照每个事件的标题信息和任意两个事件之间的跳转信息,获取按照有向图结构表征的流程模型。
具体的,有向图结构表征的流程模型可以用矩形框表示每个事件的标题信息,可以用有向箭头表示任意两个事件之间的跳转信息,可以清楚地显示事件日志中所有事件之间的流程关系。流程模型可以将事件日志中相同的事件的标题信息显示为一个矩形框,不同的跳转信息用不同的箭头表示,显示出事件日志中所有不重复的事件之间的跳转关系。
图2是根据本发明实施例的一种可选的流程模型的示意图,结合表1可知,用户开始访问页面之后,可以跳转至点击注册按钮或者填写注册表单1,点击注册按钮可以跳转至填写注册表单1,填写注册表单1可以跳转至出错或者填写注册表单2,填写注册表单2可以跳转至出错或者注册成功,出错或者注册事件发生后用户结束访问。表1所示的事件日志的流程模型如图2所示,表1所示的事件日志对应的流程模型中有5个不相同的事件的标题信息,对应的有5种不同的跳转信息。
通过上述步骤S1042至步骤S1046,结合事件日志中的会话编号和访问时间,可以确定事件日志中每个事件的发生顺序,再结合事件日志中每个事件的会话编号可以获取任意两个事件之间的跳转信息,按照任意两个事件之间的跳转信息和事件的标题信息,可以得到有向图结构表征的流程模型。通过对事件日志建立流程模型达到对用户行为的流程分析。
可选地,本申请上述实施例中,根据事件日志所对应的流程模型,输出用户访问页面所产生的行为数据的步骤包括:
步骤A,获取有向图结构表征的流程模型中,每一个事件所对应的会话数量。
具体的,图2中每个节点和每个边的数字可以表示事件或者事件间的跳转所对应的会话数量,结合表1可知,事件的标题信息为点击注册按钮的会话编号有1,2和3,因此从用户开始访问跳转至点击注册按钮对应的会话数量为3,同样可知,点击注册按钮对应的会话数量为3,点击注册按钮跳转至填写注册表单1对应的会话数量为3,每一个事件的标题信息以及任意两个事件之间的跳转信息对应的会话数量如图2所示。
步骤B,从流程模型中确定初始触发的事件的节点,并将初始触发的事件作为当前事件。
具体的,结合图2可知,初始触发的事件的节点可以为用户开始访问页面,确定初始触发的事件的节点可以方便后续遍历整个流程模型。
步骤C,获取与当前事件具有跳转关系的至少一个事件。
具体的,结合图2可知,与用户开始访问页面有跳转关系的事件可以是点击注册按钮或者填写注册表单1。
步骤D,从与当前事件具有跳转关系的至少一个事件中选择会话数量最大的事件,作为与当前事件关联的下一个事件。
具体的,结合图2可知,用户开始访问页面跳转至点击注册按钮对应的会话数量为3,但是用户开始访问页面跳转至填写注册表单1对应的会话数量为1,因此与用户开始访问页面关联的下一个事件为点击注册按钮。
步骤E,将与当前事件关联的下一个事件作为当前事件,并按照步骤C和步骤D遍历流程模型中的所有事件,直至获取到由多个事件的节点所构成的最优访问路径。
具体的,结合图2可知,与点击注册按钮关联的下一个事件为填写注册表单1,与填写注册表单1关联的下一个事件为填写注册表单2,与填写注册表单2关联的下一个事件为注册成功,与注册成功关联的下一个事件为用户结束访问页面。根据所有关联的事件可以得到最优访问路径,图2所示的流程模型的最优访问路径为点击注册按钮->填写注册表单1->填写注册表单2->注册成功。
步骤F,根据最优访问路径,确定用户访问页面所产生的行为数据。
具体的,根据最优访问路径可以确定用户访问页面所产生的行为数据,进一步还可以知道用户访问页面的主要浏览顺序。从上述步骤E获取的最优访问路径可以知道用户访问页面所产生的行为数据为首先点击注册按钮,其次填写注册表单1,再次填写注册表单2,最后注册成功。
通过上述步骤A至步骤F,根据事件日志的流程模型,可以通过比较事件的标题信息以及任意两个事件之间的跳转关系对应的会话数量,确定每一个事件下一个关联事件,得到最优访问路径,从而确定用户访问页面所产生的行为数据,进一步获得用户访问页面的主要浏览顺序,达到从流程角度对用户行为分析的目的。
可选地,本申请上述实施例中,用户访问页面所产生的行为数据包括最优访问路径中所包含的每个事件的节点信息及事之间的路径信息,其中,通过显示的方式来输出用户访问页面所产生的行为数据。
通过上述步骤,可以利用显示的方式来输出用户访问页面所产生的行为数据,从而更加直观地确定用户访问页面的主要浏览顺序,也可以方便根据用户访问页面的主要浏览顺序更改当前页面的跳转顺序,提升用户的好感度。
实施例2
图3是根据本发明实施例的一种页面访问数据的处理装置的示意图,如图3所示,该处理装置包括:
提取模块31,用于从页面访问日志中提取事件日志,其中,事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息。
具体的,用户访问网站的页面访问日志可以存储在数据库中,页面访问日志可以是一种XML格式的文件,用于保存会话信息,访问网站的用户的浏览器,来源的地理位置,登录的时间,访问的页面和时间长度等数据。事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息,提取模块31可以通过查询方式从存储在数据库中的页面访问日志中查找得到相应的数据信息。会话编号可以用来判断访问页面的访问用户,不同用户分配不同的会话编号,因此可以使用会话编号区分不同的用户。会话可以包含用户访问多个网站产生的多个事件,并且由于访问时间的不同,产生的多个事件具有一定的产生顺序。
生成模块33,用于对事件日志中所包含的多个事件的信息进行流程挖掘,生成事件日志对应的流程模型,其中,流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息。
具体的,生成模块33在事件日志中对应的选取访问时间、事件的标题信息以及会话编号的数据信息作为流程挖掘的输入数据,根据访问时间以及会话编号的不同,确定事件的标题信息之间的跳转关系,进一步生成事件日志所对应的流程模型。流程模型由节点和边两部分构成,其中节点用于表征事件本身,可以记录用户访问页面产生的事件的标题信息,边表示用户访问页面之后产生的任意两个事件之间的跳转关系。由于发生时间的不同,事件之间的发生顺序也不同,因此,任意两个事件之间的跳转关系表示任意两个事件之间的发生顺序。进一步地,由于每个事件的发生具有先后顺序,任意两个事件之间的发生顺序有一定的方向性,由此可知流程模型可以通过有向图结构表示。
输出模块35,用根据事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。
具体的,流程模型包含事件的标题信息和任意两个事件之间的跳转关系,输出模块35可以通过统计事件的标题信息的会话数量,确定每一个事件的下一个关联事件,从而得到一条多个事件的标题信息构成的最优访问路径,并根据最优访问路径可以进一步确定用户访问页面所产生的行为数据,用户访问页面所产生的行为数据可以表征多数用户访问多个页面时的访问顺序。通过输出模块25输出的该用户访问页面所产生的行为数据,可以根据多数用户的访问顺序更改页面的跳转顺序,实现用户对页面的快速访问,提升用户的好感度。
本申请上述实施例提供了一种方案,在提取模块31从数据库的页面访问日志中提取事件日志之后,提取模块31对上述事件日志中的多个事件的信息进行流程挖掘,生成与上述事件日志对应的流程模型,并且输出模块35根据上述流程模型输出用户访问页面所产生的行为数据。因此,上述方案可以实现从流程角度对用户行为进行分析,输出用户行为数据。容易注意到,由于上述事件日志中的多个事件的信息进行流程挖掘,生成与上述事件日志对应流程模型,通过对用户访问页面的访问流程进行建模,得到用户行为数据,这样不仅实现了从流程角度对用户行为进行分析,进一步还可以从流程模型中得到用户访问页面的主要浏览顺序,从而解决现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的问题。由此可知,本申请上述实施例提供的页面访问数据的处理装置,通过对事件日志中包含的事件的信息进行流程挖掘,生成流程模型,得到用户行为数据,实现准确、完整分析用户行为的目的,提升用户的好感度。
可选地,本申请上述实施例中,事件的信息包括:用户访问页面之后所产生事件的标题信息和对应的访问时间。
具体的,用户访问页面之后会产生相应的事件,数据库中页面访问日志中可以记录事件的标题信息,通过事件的标题信息可以了解用户访问页面的主要内容或者用户访问页面时的主要操作,例如用户访问页面的主要内容为填写注册表单,或者用户访问页面时的主要操作为点击注册按钮,并且页面访问日志中可以记录用户访问页面的访问时间,上述访问时间可以是产生相应事件的发生时间。因此,从数据库保存的页面访问日志中提取事件日志,事件日志中每一个事件的信息都可以记录用户访问页面之后产生的事件的标题信息和对应的访问时间。
一种可选地场景如下:2015年7月2日,用户打开页面进行注册,用户点击注册按钮的时间为18点整,点击注册按钮之后,页面跳转到填写注册信息表网页,那么数据库的页面访问日志中会增加一条事件,事件的标题信息为点击注册按钮,访问时间为2015/7/2 18:00,因此从页面访问日志中提取的事件信息为点击注册按钮和2015/7/2 18:00。
可选地,如图4所示的实施例中,提取模块31包括:
获取模块311,用于获取预设的查询条件,其中,查询条件至少包括如下字段:会话编号、时间戳和用户访问的页面的标题信息。
具体的,可以通过获取模块311获取预设好的查询条件,并且在数据库中查询得到事件日志包含的数据信息,从而实现从数据库中提取事件日志。事件日志可以包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息,因此查询条件为会话编号,事件的标题信息和时间戳。会话编号可以用来区分不同的用户,时间戳可以是用户访问页面产生事件的访问时间,用户访问的页面的标题信息可以是用户访问页面产生的事件的标题信息。
查询模块313,用于根据查询条件从数据库中保存的页面访问日志,查询得到满足查询条件的数据信息。
具体的,页面访问日志可以存储在数据库当中,因此查询模块313可以构建不同的SQL语句,查询得到满足查询条件的数据信息。
一种可选地场景如下:会话编号、时间戳和用户访问的页面的标题信息都可以在数据库中一个名为pageview的表中找到,那么可以通过如下的SQL语句查询得到满足查询条件的数据信息:Select sessionid,’timestamp’,pagetitle from pageview。在上述SQL语句中,sessionid表示会话编号,timestamp表示时间戳,pagetitle表示用户访问的页面的标题信息。
保存模块315,用于将数据信息保存为指定格式的文件,得到事件日志。
具体的,保存模块315可以通过excel表格将通过查询模块313查询得到的数据信息进行保存,保存格式可以是csv,xls或者xlsx格式,指定格式可以是csv格式。如表1所示,上述事件日志的示例中第一列表示会话编号,表1中有4个会话编号,每一个会话编号代表一个会话,第二列表示事件的标题信息,第三列表示事件对应的访问时间,第二列和第三列是事件的信息,表1中共有14个事件的信息。
在上述可选方案中,查询模块313可以根据获取模块311获取的预设的查询条件从数据库中保存的页面访问日志中查询到相应的数据信息,由保存模块315将数据信息保存为制定格式的文件,从而得到事件日志。在得到事件日志之后,可以通过生成模块33将事件日志作为输入数据进行流程挖掘,得到用户行为的数据。
可选地,如图5所示的实施例中,生成模块33包括:
确定模块331,用于结合事件日志中的会话编号和访问时间,对事件日志中包含的多个事件进行排序,确定事件日志中每个事件的发生顺序。
具体的,结合表1所示,当会话编号不同时,第一获取模块333按照会话编号的大小对每个会话进行排序,当会话编号相同时,第一获取模块333按照访问时间的顺序对每个事件信息进行排序。结合表1可知,从会话1中选择用户访问的页面的标题信息为点击注册按钮和页面的标题信息为出错的两个事件的信息,两个事件的访问时间分别为2015/7/2 18:01和2015/7/2 18:03,因此用户访问的页面的标题信息为点击注册按钮的事件的信息发生在页面的标题信息为出错的事件的信息之前。
第一获取模块333,用于结合事件日志中每个事件的会话编号和发生顺序,获取任意两个事件之间的跳转信息。
具体的,第一获取模块333可以根据事件的会话编号和发生顺序,获取任意两个事件之间的跳转信息。结合表1可知:会话编号1中填写注册表单1发生在出错之前,因此填写注册表单1可以跳转至出错,会话编号2中填写注册表单1发生在填写注册表单2之前,因此填写注册表单1可以跳转至填写注册表单2,结合上述两个跳转信息可知,填写注册表单1可以跳转至出错,也可以跳转至填写注册表单2,即填写注册表单1可以跳转至出错或者填写注册表单2中的任意一项。会话编号2中填写注册表单2可以跳转至出错,会话编号3中填写注册表单2可以跳转至注册成功,因此可知填写注册表单2可以跳转至出错或者注册成功中的任意一项。
第二获取模块335,用于按照每个事件的标题信息和任意两个事件之间的跳转信息,获取按照有向图结构表征的流程模型。
具体的,有向图结构表征的流程模型可以用矩形框表示每个事件的标题信息,可以用有向箭头表示任意两个事件之间的跳转信息,可以清楚地显示事件日志中所有事件之间的流程关系。流程模型可以将事件日志中相同的事件的标题信息显示为一个矩形框,不同的跳转信息用不同的箭头表示,显示出事件日志中所有不重复的事件之间的跳转关系。
结合表1可知,用户开始访问页面之后,可以跳转至点击注册按钮或者填写注册表单1,点击注册按钮可以跳转至填写注册表单1,填写注册表单1可以跳转至出错或者填写注册表单2,填写注册表单2可以跳转至出错或者注册成功,出错或者注册事件发生后用户结束访问。表1所示的事件日志的流程模型如图2所示,表1所示的事件日志对应的流程模型中有5个不相同的事件的标题信息,对应的有5种不同的跳转信息。
通过上述可选方案中,确定模块331结合事件日志中的会话编号和访问时间,可以确定事件日志中每个事件的发生顺序,确定模块331再结合事件日志中每个事件的会话编号可以获取任意两个事件之间的跳转信息,第二获取模块335按照任意两个事件之间的跳转信息和事件的标题信息,可以得到有向图结构表征的流程模型。通过生成模块33对事件日志建立流程模型达到对用户行为的流程分析。
可选地,如图6所示的实施例中,输出模块35包括:
第一获取子模块351,用于获取有向图结构表征的流程模型中,每一个事件所对应的会话数量。
具体的,图2中每个节点和每个边的数字可以表示事件或者事件间的跳转所对应的会话数量,结合表1可知,事件的标题信息为点击注册按钮的会话编号有1,2和3,因此从用户开始访问跳转至点击注册按钮对应的会话数量为3,同样可知,点击注册按钮对应的会话数量为3,点击注册按钮跳转至填写注册表单1对应的会话数量为3,每一个事件的标题信息以及任意两个事件之间的跳转信息对应的会话数量如图2所示。
第一确定子模块352,用于从流程模型中确定初始触发的事件的节点,并将初始触发的事件作为当前事件。
具体的,结合图2可知,初始触发的事件的节点可以为用户开始访问页面,确定初始触发的事件的节点可以方便后续遍历整个流程模型。
第二获取子模块353,用于获取与当前事件具有跳转关系的至少一个事件。
具体的,结合图2可知,与用户开始访问页面有跳转关系的事件可以是点击注册按钮或者填写注册表单1。
选择子模块354,用于从与当前事件具有跳转关系的至少一个事件中选择会话数量最大的事件,作为与当前事件关联的下一个事件。
具体的,结合图2可知,用户开始访问页面跳转至点击注册按钮对应的会话数量为3,但是用户开始访问页面跳转至填写注册表单1对应的会话数量为1,因此与用户开始访问页面关联的下一个事件为点击注册按钮。
第三获取子模块355,用于将选择子模块的与当前事件关联的下一个事件作为第二获取子模块的当前事件,并按照第二获取子模块353和选择子模块354执行的功能遍历流程模型中的所有事件,直至获取到由多个事件的节点所构成的最优访问路径。
具体的,结合图2可知,与点击注册按钮关联的下一个事件为填写注册表单1,与填写注册表单1关联的下一个事件为填写注册表单2,与填写注册表单2关联的下一个事件为注册成功,与注册成功关联的下一个事件为用户结束访问页面。第三获取子模块355根据所有关联的事件可以得到最优访问路径,图2所示的流程模型的最优访问路径为点击注册按钮->填写注册表单1->填写注册表单2->注册成功。
第二确定子模块356,用于根据最优访问路径,确定用户访问页面所产生的行为数据。
具体的,第二确定子模块356根据最优访问路径可以确定用户访问页面所产生的行为数据,进一步还可以知道用户访问页面的主要浏览顺序。从第三获取子模块355获取的最优访问路径可以知道用户访问页面所产生的行为数据为首先点击注册按钮,其次填写注册表单1,再次填写注册表单2,最后注册成功。
通过上述可选方案中,根据生成模块33生成的事件日志的流程模型,选择子模块354可以通过比较事件的标题信息以及任意两个事件之间的跳转关系对应的会话数量,确定每一个事件下一个关联事件,进一步由第三获取子模块355得到最优访问路径,从而第二确定子模块356确定用户访问页面所产生的行为数据,进一步获得用户访问页面的主要浏览顺序,达到从流程角度对用户行为分析的目的。
可选地,本申请上述实施例中,用户访问页面所产生的行为数据包括最优访问路径中所包含的每个事件的节点信息及事件之间的路径信息,其中,输出模块35通过显示的方式来输出用户访问页面所产生的行为数据。
通过上述可选方案中,输出模块35可以利用显示的方式来输出用户访问页面所产生的行为数据,从而更加直观地确定用户访问页面的主要浏览顺序,也可以方便根据用户访问页面的主要浏览顺序更改当前页面的跳转顺序,提升用户的好感度。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种页面访问数据的处理方法,其特征在于,包括:
从页面访问日志中提取事件日志,其中,所述事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;
对所述事件日志中所包含的所述多个事件的信息进行流程挖掘,生成所述事件日志对应的流程模型,其中,所述流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;以及
根据所述事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。
2.根据权利要求1所述的方法,其特征在于,所述事件的信息包括:所述用户访问页面之后所产生事件的标题信息和对应的访问时间。
3.根据权利要求2所述的方法,其特征在于,从页面访问日志中提取事件日志的步骤包括:
获取预设的查询条件,其中,所述查询条件至少包括如下字段:会话编号、时间戳和用户访问的页面的标题信息;
根据所述查询条件从数据库中保存的所述页面访问日志,查询得到满足所述查询条件的数据信息;以及
将所述数据信息保存为指定格式的文件,得到所述事件日志。
4.根据权利要求2所述的方法,其特征在于,对所述事件日志中所包含的所述多个事件的信息进行流程挖掘,得到所述事件日志所对应的流程模型包括:
结合所述事件日志中的所述会话编号和所述访问时间,对所述事件日志中包含的所述多个事件进行排序,确定所述事件日志中所述每个事件的发生顺序;
结合所述事件日志中所述每个事件的所述会话编号和所述发生顺序,获取所述任意两个事件之间的跳转信息;以及
按照所述每个事件的标题信息和所述任意两个事件之间的跳转信息,获取按照有向图结构表征的流程模型。
5.根据权利要求4所述的方法,其特征在于,根据所述事件日志所对应的流程模型,输出用户访问页面所产生的行为数据的步骤包括:
步骤A,获取所述有向图结构表征的流程模型中,每一个事件所对应的会话数量;
步骤B,从所述流程模型中确定初始触发的事件的节点,并将初始触发的事件作为当前事件;
步骤C,获取与当前事件具有跳转关系的至少一个事件;
步骤D,从所述与当前事件具有跳转关系的至少一个事件中选择会话数量最大的事件,作为与当前事件关联的下一个事件;
步骤E,将所述与当前事件关联的下一个事件作为所述当前事件,并按照所述步骤C和所述步骤D遍历所述流程模型中的所有事件,直至获取到由多个事件的节点所构成的最优访问路径;以及
步骤F,根据所述最优访问路径,确定所述用户访问页面所产生的行为数据。
6.根据权利要求5所述的方法,其特征在于,所述用户访问页面所产生的行为数据包括所述最优访问路径中所包含的每个事件的节点信息及事件之间的路径信息,其中,通过显示的方式来输出所述用户访问页面所产生的行为数据。
7.一种页面访问数据的处理装置,其特征在于,包括:
提取模块,用于从页面访问日志中提取事件日志,其中,所述事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;
生成模块,用于对所述事件日志中所包含的所述多个事件的信息进行流程挖掘,生成所述事件日志对应的流程模型,其中,所述流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;以及
输出模块,用根据所述事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。
8.根据权利要求7所述的装置,其特征在于,所述事件的信息包括:所述用户访问页面之后所产生事件的标题信息和对应的访问时间。
9.根据权利要求8所述的装置,其特征在于,所述提取模块包括:
获取模块,用于获取预设的查询条件,其中,所述查询条件至少包括如下字段:会话编号、时间戳和用户访问的页面的标题信息;
查询模块,用于根据所述查询条件从数据库中保存的所述页面访问日志,查询得到满足所述查询条件的数据信息;以及
保存模块,用于将所述数据信息保存为指定格式的文件,得到所述事件日志。
10.根据权利要求8所述的装置,其特征在于,所述生成模块包括:
确定模块,用于结合所述事件日志中的所述会话编号和所述访问时间,对所述事件日志中包含的所述多个事件进行排序,确定所述事件日志中所述每个事件的发生顺序;
第一获取模块,用于结合所述事件日志中所述每个事件的所述会话编号和所述发生顺序,获取所述任意两个事件之间的跳转信息;以及
第二获取模块,用于按照所述每个事件的标题信息和所述任意两个事件之间的跳转信息,获取按照有向图结构表征的流程模型。
CN201510649582.0A 2015-10-09 2015-10-09 页面访问数据的处理方法和装置 Active CN106570013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510649582.0A CN106570013B (zh) 2015-10-09 2015-10-09 页面访问数据的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510649582.0A CN106570013B (zh) 2015-10-09 2015-10-09 页面访问数据的处理方法和装置

Publications (2)

Publication Number Publication Date
CN106570013A true CN106570013A (zh) 2017-04-19
CN106570013B CN106570013B (zh) 2020-07-03

Family

ID=58506661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510649582.0A Active CN106570013B (zh) 2015-10-09 2015-10-09 页面访问数据的处理方法和装置

Country Status (1)

Country Link
CN (1) CN106570013B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423070A (zh) * 2017-08-03 2017-12-01 北京奇艺世纪科技有限公司 一种页面生成方法及装置
CN109165152A (zh) * 2018-07-31 2019-01-08 上海哔哩哔哩科技有限公司 Web系统的性能监控方法、系统和存储介质
CN109857623A (zh) * 2018-12-13 2019-06-07 深圳壹账通智能科技有限公司 基于日志文件的服务性能分析方法、装置及电子设备
CN109976710A (zh) * 2017-12-27 2019-07-05 航天信息股份有限公司 一种数据处理方法及设备
CN110516188A (zh) * 2019-08-28 2019-11-29 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110633390A (zh) * 2018-05-31 2019-12-31 北京嘀嘀无限科技发展有限公司 获取用户行为路径的方法和装置
CN112258295A (zh) * 2020-11-04 2021-01-22 支付宝(杭州)信息技术有限公司 记录处理方法、装置及设备
CN112508518A (zh) * 2019-12-31 2021-03-16 北京来也网络科技有限公司 结合rpa和ai的rpa流程的生成方法以及相应的设备、可读存储介质
CN113515568A (zh) * 2021-07-13 2021-10-19 北京百度网讯科技有限公司 图关系网络构建方法、图神经网络模型训练方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751248A (zh) * 2008-11-28 2010-06-23 国际商业机器公司 为Web应用设计时间敏感的性能测试用例的方法和系统
CN103678321A (zh) * 2012-09-03 2014-03-26 阿里巴巴集团控股有限公司 页面元素确定方法及设备、用户行为路径确定方法及装置
CN103744957A (zh) * 2014-01-06 2014-04-23 同济大学 基于Web用户时间属性的序列模式挖掘方法
CN104731807A (zh) * 2013-12-20 2015-06-24 北京风行在线技术有限公司 一种统计和分析页面跳转数据的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751248A (zh) * 2008-11-28 2010-06-23 国际商业机器公司 为Web应用设计时间敏感的性能测试用例的方法和系统
CN103678321A (zh) * 2012-09-03 2014-03-26 阿里巴巴集团控股有限公司 页面元素确定方法及设备、用户行为路径确定方法及装置
CN104731807A (zh) * 2013-12-20 2015-06-24 北京风行在线技术有限公司 一种统计和分析页面跳转数据的方法及装置
CN103744957A (zh) * 2014-01-06 2014-04-23 同济大学 基于Web用户时间属性的序列模式挖掘方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423070A (zh) * 2017-08-03 2017-12-01 北京奇艺世纪科技有限公司 一种页面生成方法及装置
CN107423070B (zh) * 2017-08-03 2021-02-23 北京奇艺世纪科技有限公司 一种页面生成方法及装置
CN109976710A (zh) * 2017-12-27 2019-07-05 航天信息股份有限公司 一种数据处理方法及设备
CN110633390A (zh) * 2018-05-31 2019-12-31 北京嘀嘀无限科技发展有限公司 获取用户行为路径的方法和装置
CN109165152A (zh) * 2018-07-31 2019-01-08 上海哔哩哔哩科技有限公司 Web系统的性能监控方法、系统和存储介质
CN109165152B (zh) * 2018-07-31 2022-11-15 上海幻电信息科技有限公司 Web系统的性能监控方法、系统和存储介质
CN109857623A (zh) * 2018-12-13 2019-06-07 深圳壹账通智能科技有限公司 基于日志文件的服务性能分析方法、装置及电子设备
CN110516188A (zh) * 2019-08-28 2019-11-29 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN112508518A (zh) * 2019-12-31 2021-03-16 北京来也网络科技有限公司 结合rpa和ai的rpa流程的生成方法以及相应的设备、可读存储介质
CN112258295A (zh) * 2020-11-04 2021-01-22 支付宝(杭州)信息技术有限公司 记录处理方法、装置及设备
CN112258295B (zh) * 2020-11-04 2024-05-14 蚂蚁胜信(上海)信息技术有限公司 记录处理方法、装置及设备
CN113515568A (zh) * 2021-07-13 2021-10-19 北京百度网讯科技有限公司 图关系网络构建方法、图神经网络模型训练方法及装置

Also Published As

Publication number Publication date
CN106570013B (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
CN106570013A (zh) 页面访问数据的处理方法和装置
US11102094B2 (en) Systems and methods for configuring a resource for network traffic analysis
CN104685490B (zh) 结构化和非结构化数据自适应分组的系统和方法
CN104537115B (zh) 用户兴趣的探索方法和装置
CN104217031B (zh) 一种根据服务器搜索日志数据进行用户分类的方法和装置
US8572233B2 (en) Method and system for site path evaluation using web session clustering
CN109118296A (zh) 活动推送方法、装置及电子设备
CN106708841B (zh) 网站访问路径的聚合方法和装置
CN106649316A (zh) 一种视频推送方法及装置
CN108304410A (zh) 一种异常访问页面的检测方法、装置及数据分析方法
CN106776989A (zh) 一种网页信息展示方法以及装置
CN110134845A (zh) 项目舆情监控方法、装置、计算机设备及存储介质
US20170212921A1 (en) Annotation system for extracting attributes from electronic data structures
CN107578263A (zh) 一种广告异常访问的检测方法、装置和电子设备
US20150142828A1 (en) Ontology based categorization of users
CN105868311A (zh) 一种数据解析的方法和装置
CN107562613A (zh) 程序测试方法、装置及系统
CN104268289B (zh) 链接url的失效检测方法和装置
CN105260365B (zh) 终端信息的处理方法和装置
CN111782317A (zh) 页面的测试方法和装置、存储介质和电子装置
CN109558531A (zh) 新闻信息推送方法、装置以及计算机设备
CN106610994A (zh) 点击路径的统计方法和装置
CN106909567A (zh) 数据处理方法及装置
CN106933903A (zh) 应用于分布式存储的存储方法及装置
US9842112B1 (en) System and method for identifying fields in a file using examples in the file received from a user

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant