CN104579754A - 一种统计Web应用用户访问时间特性的方法 - Google Patents

一种统计Web应用用户访问时间特性的方法 Download PDF

Info

Publication number
CN104579754A
CN104579754A CN201410795548.XA CN201410795548A CN104579754A CN 104579754 A CN104579754 A CN 104579754A CN 201410795548 A CN201410795548 A CN 201410795548A CN 104579754 A CN104579754 A CN 104579754A
Authority
CN
China
Prior art keywords
cookie
time
request
user
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410795548.XA
Other languages
English (en)
Other versions
CN104579754B (zh
Inventor
刘勇彬
杨松
莫展鹏
季统凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Cloud Technology Co Ltd
Original Assignee
G Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Cloud Technology Co Ltd filed Critical G Cloud Technology Co Ltd
Priority to CN201410795548.XA priority Critical patent/CN104579754B/zh
Publication of CN104579754A publication Critical patent/CN104579754A/zh
Application granted granted Critical
Publication of CN104579754B publication Critical patent/CN104579754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及应用访问量统计技术领域,特别是指一种统计Web应用用户访问时间特性的方法。本发明首先在Web应用程序中增加一个过滤器,拦截所有的请求;然后在每个请求开始时标记开始时间,处理完后标记一个结束时间;其次维护一个请求的Cookie列表,并把Cookie的过期时间设置为当天过期,然后把Cookie加入到响应中返回给Web客户端,接着获取本次请求响应的状态码,并以Cookie为标识,生成本次请求的一条记录;最后计算获得用户单次访问Web应用的时间,通过统计得到用户访问Web应用的频度、总时长。本发明的方法能够对用户行为的时间特性作出更加准确的分析;可用于统计Web应用用户访问时间特性。

Description

一种统计Web应用用户访问时间特性的方法
技术领域
本发明涉及应用访问量统计技术领域,特别是指一种统计Web应用用户访问时间特性的方法。
背景技术
在面向公众的Web应用中,由于用户的来源比较多,组成又比较复杂,因此,一般需要通过事后审计来分析用户的行为,其中,统计一个用户当天访问Web应用的时间特性可以用于分析用户使用应用系统的频度、总时长,从而判定用户的行为,是很重要的一个统计数据。譬如,某用户当天访问Web应用的系统的次数如果明显高于其他用户,并且每次访问的时长较短,那么此用户账户有可能被窃取用于对Web应用系统进行连接型攻击,需要对此用户账户的历史行为进行进一步的分析,并对此用户账户的下一步行为加以防护,防止影响整个系统。又譬如,某用户当天访问某个电商Web应用系统在一天中多次访问,且总的访问时间较长,此用户可能对电商的某产品感兴趣,电商的用户行为分析系统可对用户的行为进行深入分析并向其投放可能感兴趣的商品的信息,成交的成功率可大大提高。
目前,统计Web应用用户访问时间特性的方法一般都是通过分析登录用户的日志来实现的,这种方法存在如下的弊端:
1、统计不全面,匿名用户和访客的行为无法统计,对于某些类型的网站来说,可能并不需要进行注册,这类型的应用传统的方法无法覆盖;
2、统计不准确,部分用户可能因为网络的原因,比如卡顿,导致重试访问的次数较多并且每次访问等待的时间较长,传统的方法无法区分出这部分用户的行为。
尽管中国专利申请号为“201310197368”的文件中提到一种社交网络平台系统及互动方法与中国专利申请号为“201410080027”的文件中提到一种网站用户访问路径的分析方法及系统,通过Cookie实现对用户的区分、记录,以对用户的访问特性进行统计。上述两项专利申请侧重于对Cookie本身的特性进行运用,直接把Cookie的记录作为用户的行为进行分析,但并没有提供对Cookie的过期时间等特性进行设计进而用于时间特性方面的统计。因此,目前急需一种使用Cookie进行Web应用用户访问时间特性进行统计的方法。
发明内容
本发明解决的技术问题在于提供一种统计Web应用用户访问时间特性的方法,解决传统方法存在的不足,覆盖所有类型用户,排除无效请求,提供一种全面的准确的统计方法。
本发明解决上述问题,包括以下步骤:
步骤1:在Web应用程序中增加一个过滤器,拦截所有的请求;
步骤2:在每个请求开始时标记开始时间;
步骤3:在请求处理完以后,标记一个结束时间;
步骤4:维护一个请求的Cookie列表,如果请求中不包含Cookie的信息,那么执行步骤5;否则,执行步骤7;
步骤5:在Cookie列表中增加一个Cookie;
步骤6:把Cookie的过期时间设置为当天24点到当前的时间间隔,也就是当天过期,然后把Cookie加入到响应中返回给Web客户端;转到步骤8;
步骤7:在Cookie列表中查询对应的Cookie是否已经过期,如果已经过期,跳转到步骤6;如果未过期,则进入下一步;
步骤8:获取本次请求响应的状态码,并以Cookie为标识,生成本次请求的一条记录,包括请求的Cookie、请求的开始时间、结束时间、请求的响应状态码;
步骤9:通过计算开始时间到结束时间的时间间隔得到用户单次访问Web应用的时间,通过统计某Cookie的所有响应状态码为成功访问记录的数量得到用户访问Web应用的频度,通过统计某Cookie的所有记录的总访问时间得到某用户某天访问Web应用的总时长。
所述的Web应用程序是一种可以通过Web访问的应用程序;所述的过滤器对Web请求和响应进行拦截。
所述的Cookie,有时也用其复数形式Cookies,指某些网站为了辨别用户身份、进行Session跟踪而储存在用户本地终端上的数据;
所述的Session是指一个终端用户与交互系统进行通信的时间间隔,通常指从注册进入系统到注销退出系统之间所经过的时间。
所述的开始时间,是客户端发送一个请求的开始时间;所述的结束时间,是客户端连接到从服务器返回响应结果的时间。
本发明提供了一种全面的准确的统计方法,通过为用户设置适当的Cookie能覆盖所有类型的用户;能够识别不同状态的请求并加以区分,排除无效的请求,能够对用户行为的时间特性作出更加准确的分析。
附图说明
下面结合附图对本发明进一步说明:
图1为本发明的流程图;
图2为本发明的过滤器架构图;
具体实施方式
本发明的实施方式有多种,这里将统计J2EE应用用户访问时间的方式为例说明其中一种实现方法,请参考图1、2所示,具体实施过程如下:
1、在Web应用程序中增加一个过滤器,拦截所有的请求;
定义一个PageFilter过滤器,过滤器必须在链头,只需要过滤.jspx和.do则可。在web.xml中过滤器配置
<filter-mapping>
<filter-name>Page Filter</filter-name>
<url-pattern>*.jspx</url-pattern>
<url-pattern>*.do</url-pattern>
<dispatcher>FORWARD</dispatcher>
<dispatcher>REQUEST</dispatcher>
</filter-mapping>
2、在每个请求开始时标记开始时间;
当获取请求时,获取当前标记开始时间
Begin=System.currentTimeMillis();
crateTime=new Date();
3、在请求处理完以后,标记一个结束时间;
end=System.currentTimeMillis();
crateTime=new Date();
4、维护一个请求的Cookie列表,如果请求中不包含Cookie的信息,那么执行步骤6;否则,执行步骤7;
5、在Cookie列表中增加一个Cookie,并把Cookie的过期时间设置为当天24点到当前的时间间隔,也就是当天过期,然后把Cookie加入到响应中返回给Web客户端;转到步骤8;
注:若用户浏览器禁用了cookie,那就每一次访问就当一个新的用户。
6、在Cookie列表中查询对应的Cookie是否已经过期,如果已经过期,跳转到步骤6;
7、获取本次请求响应的状态码,并以Cookie为标识,生成本次请求的一条记录,包括请求的Cookie、请求的开始时间、结束时间、请求的响应状态码;
response状态status=reponse.getStatus();//获取状态码
将createTime,spend,ip,uv,page,postfix,status插入数据库page_stat
8、通过计算开始时间到结束时间的时间间隔可以得到用户单次访问Web应用的时间,通过统计某Cookie的所有响应状态码为成功访问记录的数量可以得到用户访问Web应用的频度,通过统计某Cookie的所有记录的总访问时间可以得到某用户某天访问Web应用的总时长。
统计单次访问Web应用的时间:
Spend=Sytem.currentTimeMillis()-begin
统计用户访问Web应用的频度:
page=request.getRequestURI()注:需要去掉问题后面参数
postfix=page的后缀。

Claims (5)

1.一种统计Web应用用户访问时间特性的方法,其特征在于:所述的方法包括如下步骤:
步骤1:在Web应用程序中增加一个过滤器,拦截所有的请求;
步骤2:在每个请求开始时标记开始时间;
步骤3:在请求处理完以后,标记一个结束时间;
步骤4:维护一个请求的Cookie列表,如果请求中不包含Cookie的信息,那么执行步骤5;否则,执行步骤7;
步骤5:在Cookie列表中增加一个Cookie;
步骤6:把Cookie的过期时间设置为当天24点到当前的时间间隔,也就是当天过期,然后把Cookie加入到响应中返回给Web客户端;转到步骤8;
步骤7:在Cookie列表中查询对应的Cookie是否已经过期,如果已经过期,跳转到步骤6;如果未过期,则进入下一步;
步骤8:获取本次请求响应的状态码,并以Cookie为标识,生成本次请求的一条记录,包括请求的Cookie、请求的开始时间、结束时间、请求的响应状态码;
步骤9:通过计算开始时间到结束时间的时间间隔得到用户单次访问Web应用的时间,通过统计某Cookie的所有响应状态码为成功访问记录的数量得到用户访问Web应用的频度,通过统计某Cookie的所有记录的总访问时间得到某用户某天访问Web应用的总时长。
2.根据权利要求1所述的统计Web应用用户访问时间特性的方法,其特征在于:所述的Web应用程序是一种可以通过Web访问的应用程序;所述的过滤器对Web请求和响应进行拦截。
3.根据权利要求1所述的统计Web应用用户访问时间特性的方法,其特征在于:所述的Cookie,有时也用其复数形式Cookies,指某些网站为了辨别用户身份、进行Session跟踪而储存在用户本地终端上的数据;
所述的Session是指一个终端用户与交互系统进行通信的时间间隔,通常指从注册进入系统到注销退出系统之间所经过的时间。
4.根据权利要求2所述的统计Web应用用户访问时间特性的方法,其特征在于:所述的Cookie,有时也用其复数形式Cookies,指某些网站为了辨别用户身份、进行Session跟踪而储存在用户本地终端上的数据;
所述的Session是指一个终端用户与交互系统进行通信的时间间隔,通常指从注册进入系统到注销退出系统之间所经过的时间。
5.根据权利要求1至4任一项所述的统计Web应用用户访问时间特性的方法,其特征在于:所述的开始时间,是客户端发送一个请求的开始时间;所述的结束时间,是客户端连接到从服务器返回响应结果的时间。
CN201410795548.XA 2014-12-18 2014-12-18 一种统计Web应用用户访问时间特性的方法 Active CN104579754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410795548.XA CN104579754B (zh) 2014-12-18 2014-12-18 一种统计Web应用用户访问时间特性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410795548.XA CN104579754B (zh) 2014-12-18 2014-12-18 一种统计Web应用用户访问时间特性的方法

Publications (2)

Publication Number Publication Date
CN104579754A true CN104579754A (zh) 2015-04-29
CN104579754B CN104579754B (zh) 2018-01-26

Family

ID=53095019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410795548.XA Active CN104579754B (zh) 2014-12-18 2014-12-18 一种统计Web应用用户访问时间特性的方法

Country Status (1)

Country Link
CN (1) CN104579754B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045620A (zh) * 2015-07-07 2015-11-11 深信服网络科技(深圳)有限公司 测量网页首屏加载时间的方法及检测设备
CN106874293A (zh) * 2015-12-11 2017-06-20 北京国双科技有限公司 一种数据处理方法及装置
CN112685662A (zh) * 2020-12-09 2021-04-20 广东各有所爱信息科技有限公司 一种跨平台自定义跳转的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010776A1 (en) * 2000-02-01 2002-01-24 Lerner Jack Lawrence Method and apparatus for integrating distributed shared services system
US20050050045A1 (en) * 2002-08-23 2005-03-03 Hiroshi Taira Program, system and method for analyzing retrieval keyword
US20060085537A1 (en) * 2004-10-14 2006-04-20 International Business Machines Corporation Method and system for programmatically generating synthetic transactions to monitor performance and availability of a web application
CN101188521A (zh) * 2007-12-05 2008-05-28 北京金山软件有限公司 一种挖掘用户行为数据的方法和网站服务器
CN101266610A (zh) * 2008-04-25 2008-09-17 浙江大学 一种Web活跃用户网站访问模式的在线挖掘方法
CN102158493A (zh) * 2011-04-15 2011-08-17 奇智软件(北京)有限公司 一种Cookie解析方法、装置及一种客户端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010776A1 (en) * 2000-02-01 2002-01-24 Lerner Jack Lawrence Method and apparatus for integrating distributed shared services system
US20050050045A1 (en) * 2002-08-23 2005-03-03 Hiroshi Taira Program, system and method for analyzing retrieval keyword
US20060085537A1 (en) * 2004-10-14 2006-04-20 International Business Machines Corporation Method and system for programmatically generating synthetic transactions to monitor performance and availability of a web application
CN101188521A (zh) * 2007-12-05 2008-05-28 北京金山软件有限公司 一种挖掘用户行为数据的方法和网站服务器
CN101266610A (zh) * 2008-04-25 2008-09-17 浙江大学 一种Web活跃用户网站访问模式的在线挖掘方法
CN102158493A (zh) * 2011-04-15 2011-08-17 奇智软件(北京)有限公司 一种Cookie解析方法、装置及一种客户端

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045620A (zh) * 2015-07-07 2015-11-11 深信服网络科技(深圳)有限公司 测量网页首屏加载时间的方法及检测设备
CN105045620B (zh) * 2015-07-07 2019-01-11 深信服网络科技(深圳)有限公司 测量网页首屏加载时间的方法及检测设备
CN106874293A (zh) * 2015-12-11 2017-06-20 北京国双科技有限公司 一种数据处理方法及装置
CN106874293B (zh) * 2015-12-11 2020-12-29 北京国双科技有限公司 一种数据处理方法及装置
CN112685662A (zh) * 2020-12-09 2021-04-20 广东各有所爱信息科技有限公司 一种跨平台自定义跳转的方法

Also Published As

Publication number Publication date
CN104579754B (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
AU2020210157B2 (en) Methods and apparatus to determine media impressions using distributed demographic information
EP2891074B1 (en) Methods and apparatus to collect distributed user information for media impressions and search terms
US20110288940A1 (en) Method and Apparatus for Correlating Multiple Cookies as Having Originated from the Same Device Using Device Fingerprinting
EP3693914A1 (en) Methods and apparatus to determine media impressions
CN107357903B (zh) 用户行为数据整合方法、装置及电子设备
US11727423B2 (en) Methods and apparatus to collect impressions associated with over-the-top media devices
CN104584564A (zh) 利用分布式人口统计信息来确定印象的方法和装置
AU2013204865A1 (en) Methods and apparatus to share online media impressions data
CN103729380B (zh) 一种数据处理方法、系统及装置
US20190289085A1 (en) System and method for tracking online user behavior across browsers or devices
KR101402518B1 (ko) 교육을 위한 단말 감시 장치 및 방법
CN104579754A (zh) 一种统计Web应用用户访问时间特性的方法
CN107465718B (zh) 跨应用的id识别方法及装置、存储介质、终端
WO2017054041A1 (en) Method, system and computer program for recording online browsing behaviour
US20210217040A1 (en) Systems and methods of tracking entity program participant activity on social media through entity account on social media
NL2016943B1 (nl) Verzamelwerkwijze voor een gebruikersgerichte publieksmeting, van hits overgedragen naar een node voor sitegerichte publieksmeting, met gebruikmaking van hitregistraties gecreëerd door de node.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 523808 19th Floor, Cloud Computing Center, Chinese Academy of Sciences, No. 1 Kehui Road, Songshan Lake Hi-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee after: G-Cloud Technology Co., Ltd.

Address before: 523808 No. 14 Building, Songke Garden, Songshan Lake Science and Technology Industrial Park, Dongguan City, Guangdong Province

Patentee before: G-Cloud Technology Co., Ltd.