CN104539452B - 一种统计Web应用访问地域特性的方法 - Google Patents
一种统计Web应用访问地域特性的方法 Download PDFInfo
- Publication number
- CN104539452B CN104539452B CN201410795168.6A CN201410795168A CN104539452B CN 104539452 B CN104539452 B CN 104539452B CN 201410795168 A CN201410795168 A CN 201410795168A CN 104539452 B CN104539452 B CN 104539452B
- Authority
- CN
- China
- Prior art keywords
- request
- access
- web
- statistics
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明涉及应用访问量统计技术领域,特别是指一种统计Web应用访问地域特性的方法。本发明首先在Web应用程序中增加一个过滤器,拦截所有的请求;然后在每个请求开始时标记开始时间;把请求的URL中的参数后缀去掉;获取HTTP请求头中的X‑FORWARDED‑FOR信息,如果能获取,那么把X‑FORWARDED‑FOR中的第一个IP作为用户所在地域的IP;否则,直接获取请求中的IP作为用户所在地域的IP;最后通过统计、查询所有请求的IP地址可以得到用户的地域分布情况、某页面的地域访问热度、地域访问时间分布等。本发明解决了Web访问地域特性的精确统计问题;可以用于统计Web应用访问地域特性。
Description
技术领域
本发明涉及应用访问量统计技术领域,特别是指一种统计Web应用访问地域特性的方法。
背景技术
在面向公众的Web应用中,由于用户的来源比较多,组成又比较复杂。因此,一般需要通过事后审计来分析用户的行为;其中,统计用户访问Web应用的地域特性可以用于分析用户使用应用系统的地域分布情况、地域访问热度和地域访问时间分布,从而判定用户的行为,是很重要的一个统计数据。譬如,某天应用系统受到攻击,在阻断攻击源以后,可以针对攻击时间段内的地域特性进行统计,圈定攻击源的范围,配合国家有关安全部门进行调查。又譬如,电商应用可以针对商品页面的地域分布情况进行统计,得到各地域用户对商品访问的热度分布,对商品访问热度较低的地域进行市场调查并采取有针对性的营销策略,可以得到较好的效果。
目前,统计Web应用访问地域特性的方法一般都是通过分析登录用户的日志来实现的,这种方法存在如下的弊端:
1、地域定位不准确,由于用户访问Web应用不一定是直接访问,可能通过一些反向代理工具,如Ngnix,进行重定向从而访问Web应用,因此直接记录用户日志中的访问IP对地域的定位是不准确的;
2、对页面访问量的统计不准确,由于Web应用的页面访问URL一般都带有参数,参数不同可页面都是同一个,因此,直接统计URL有可能把相同的页面访问量分成多份统计,造成统计不准确。
尽管中国专利申请号为“201310197368”的文件中提到一种社交网络平台系统及互动方法与中国专利申请号为“201410080027”的文件中提到一种网站用户访问路径的分析方法及系统,以及文献《图书馆WEB资源访问量统计分析系统技术实现》,通过获取Web请求中IP信息的收集实现对地域特性的统计。上述文献侧重于对Web请求信息的获取,直接把Web请求的信息作为Web访问的地域特性,但并没有提供对Web请求信息的过滤和分析进而获得更加精确的Web访问地域特性的方法。因此,目前急需一种准确获取Web访问源IP的对Web应用访问地域特性进行统计的方法。
发明内容
本发明解决的技术问题在于提供一种统计Web应用访问地域特性的方法,解决传统方法存在的不足,准确定位地域,取到用户真正访问Web应用的IP地址,提供一种全面的准确的统计方法。
本发明解决上述技术问题的技术方案是:
所述的方法包括如下步骤:
步骤1,在Web应用程序中增加一个过滤器,拦截所有的请求;
步骤2,在每个请求开始时标记开始时间;
步骤3,把请求的URL中的参数后缀去掉,将剩下的前缀记录下来;
步骤4,获取HTTP请求头中的X-FORWARDED-FOR信息,如果能获取,则将X-FORWARDED-FOR中的第一个IP作为用户所在地域的IP;否则,直接获取请求中的IP作为用户所在地域的IP;
步骤5,通过统计所有请求的IP地址得到用户的地域分布情况,通过查询某请求的URL的所有请求的IP地址并统计得到某页面的地域访问热度,通过查询某时间段的所有请求的IP地址得到地域访问时间分布。
所述的Web应用程序,是一种可以通过Web访问的应用程序;
所述的过滤器对Web请求和响应进行拦截。
所述的开始时间是指客户端发送一个请求的开始时间。
所述的X-FORWARDED-FOR简称XFF头,它代表客户端,是HTTP的请求端真实的IP;只有在通过了HTTP代理或者负载均衡服务器时才会添加该项。
本发明的方法是准确定位地域的统计方法,能获取到用户真正访问Web应用的IP地址;本发明的方法较准确,可以对访问地址进行过滤,避免相同页面的访问量被分开统计。
附图说明
下面结合附图对本发明进一步说明:
图1为本发明的流程图;
图2为本发明的过滤器架构图。
具体实施方式
本发明的实施方式有多种,这里将统计J2EE应用用户访问时间的方式为例说明其中一种实现方法,请参考图1、2所示,具体实施过程如下:
1、在Web应用程序中增加一个过滤器,拦截所有的请求;
定义一个PageFilter过滤器,过滤器必须在链头,只需要过滤.jspx和.do则可。在web.xml中过滤器配置
<filter-mapping>
<filter-name>Page Filter</filter-name>
<url-pattern>*.jspx</url-pattern>
<url-pattern>*.do</url-pattern>
<dispatcher>FORWARD</dispatcher>
<dispatcher>REQUEST</dispatcher>
</filter-mapping>
2、在每个请求开始时标记开始时间;
当获取请求时,获取当前标记开始时间
Begin=System.currentTimeMillis();
crateTime=new Date();
3、把请求的URL中的参数后缀去掉,把剩下的前缀记录下来;
page=request.getRequestURI()注:需要去掉问题后面参数
postfix=page的后缀
4、获取HTTP请求头中的X-FORWARDED-FOR信息,如果能获取,那么把X-FORWARDED-FOR中的第一个IP作为用户所在地域的IP;否则,直接获取请求中的IP作为用户所在地域的IP;
通过上一步获取的page参数,过滤出真实IP地址;
5、通过统计所有请求的IP地址可以得到用户的地域分布情况。
IP=SystemUtil.getIpAddr(request)
//为什么要用SystemUtil.getIpAddr方法,是由于用户到达站点不一定是直接访问,可能通过一些反向代理工具(如Nginx)。
通过以上获取的某请求的URL的所有请求的IP地址并统计可以得到某页面的地域访问热度。通过以上获取某时间段的所有请求的IP地址可以得到地域访问时间分布。
Claims (5)
1.一种统计Web应用访问地域特性的方法,其特征在于:所述的方法包括如下步骤:
步骤1,在Web应用程序中增加一个过滤器,拦截所有的请求;
步骤2,在每个请求开始时标记开始时间;
步骤3,把请求的URL中的作为后缀的参数去掉,将剩下的参数前的前缀记录下来;
步骤4,获取HTTP请求头中的X-FORWARDED-FOR信息,如果能获取,则将X-FORWARDED-FOR中的第一个IP作为用户所在地域的IP;否则,直接获取请求中的IP作为用户所在地域的IP;
步骤5,通过统计所有请求的IP地址得到用户的地域分布情况,通过查询某请求的URL的所有请求的IP地址并统计得到某页面的地域访问热度,通过查询某时间段的所有请求的IP地址得到地域访问时间分布。
2.根据权利要求1所述的统计Web应用访问地域特性的方法,其特征在于:所述的Web应用程序,是一种可以通过Web访问的应用程序;
所述的过滤器对Web请求和响应进行拦截。
3.根据权利要求1所述的统计Web应用访问地域特性的方法,其特征在于:所述的开始时间是指客户端发送一个请求的开始时间。
4.根据权利要求2所述的统计Web应用访问地域特性的方法,其特征在于:所述的开始时间是指客户端发送一个请求的开始时间。
5.根据权利要求1至4任一项所述的统计Web应用访问地域特性的方法,其特征在于:所述的X-FORWARDED-FOR简称XFF头,它代表客户端,是HTTP的请求端真实的IP;只有在通过了HTTP代理或者负载均衡服务器时才会添加该项。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410795168.6A CN104539452B (zh) | 2014-12-18 | 2014-12-18 | 一种统计Web应用访问地域特性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410795168.6A CN104539452B (zh) | 2014-12-18 | 2014-12-18 | 一种统计Web应用访问地域特性的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104539452A CN104539452A (zh) | 2015-04-22 |
CN104539452B true CN104539452B (zh) | 2017-12-01 |
Family
ID=52854921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410795168.6A Active CN104539452B (zh) | 2014-12-18 | 2014-12-18 | 一种统计Web应用访问地域特性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104539452B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106027692B (zh) * | 2016-05-16 | 2019-07-16 | 北京小米移动软件有限公司 | 信息获取方法、装置及服务器 |
CN109271555B (zh) * | 2018-09-19 | 2021-04-06 | 上海哔哩哔哩科技有限公司 | 信息聚类方法、系统、服务器及计算机可读存储介质 |
CN110290221B (zh) * | 2019-07-09 | 2021-07-30 | 中星科源(北京)信息技术有限公司 | 一种原始地址传输方法、系统、存储介质和处理器 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102118320A (zh) * | 2011-04-18 | 2011-07-06 | 北京神州数码思特奇信息技术股份有限公司 | 一种协议识别和流量控制方法 |
CN102446170A (zh) * | 2010-10-04 | 2012-05-09 | 王子影 | 一种基于审计功能的oracle数据库点击率技术 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7660740B2 (en) * | 2000-10-16 | 2010-02-09 | Ebay Inc. | Method and system for listing items globally and regionally, and customized listing according to currency or shipping area |
US20140282916A1 (en) * | 2013-03-15 | 2014-09-18 | Aerohive Networks, Inc. | Access authorization through certificate validation |
-
2014
- 2014-12-18 CN CN201410795168.6A patent/CN104539452B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446170A (zh) * | 2010-10-04 | 2012-05-09 | 王子影 | 一种基于审计功能的oracle数据库点击率技术 |
CN102118320A (zh) * | 2011-04-18 | 2011-07-06 | 北京神州数码思特奇信息技术股份有限公司 | 一种协议识别和流量控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104539452A (zh) | 2015-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12015681B2 (en) | Methods and apparatus to determine media impressions using distributed demographic information | |
JP6436445B2 (ja) | メディアインプレッションを特定する方法及び装置 | |
CN105357054B (zh) | 网站流量分析方法、装置和电子设备 | |
CN104539452B (zh) | 一种统计Web应用访问地域特性的方法 | |
CN105162822A (zh) | 一种网站日志数据处理方法及装置 | |
CN102938769A (zh) | 一种Domain flux僵尸网络域名检测方法 | |
CN104579754B (zh) | 一种统计Web应用用户访问时间特性的方法 | |
CN109729054A (zh) | 访问数据监测方法及相关设备 | |
US9787786B1 (en) | Determining device counts | |
Purra | Swedes Online: You Are More Tracked Than You Think | |
Pujol Gil | Web content delivery, monetization, and search | |
Pujol Gil | Web content delivery, monetization, and search: back-office and advertisement traffic on the Internet | |
Gil | Web content delivery, monetization, and search: Back-office and advertisement traffic on the Internet |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder |
Address after: 523808 19th Floor, Cloud Computing Center, Chinese Academy of Sciences, No. 1 Kehui Road, Songshan Lake Hi-tech Industrial Development Zone, Dongguan City, Guangdong Province Patentee after: G-Cloud Technology Co., Ltd. Address before: 523808 No. 14 Building, Songke Garden, Songshan Lake Science and Technology Industrial Park, Dongguan City, Guangdong Province Patentee before: G-Cloud Technology Co., Ltd. |
|
CP02 | Change in the address of a patent holder |