CN105260447A - 一种网页数据分析方法及系统 - Google Patents

一种网页数据分析方法及系统 Download PDF

Info

Publication number
CN105260447A
CN105260447A CN201510650352.6A CN201510650352A CN105260447A CN 105260447 A CN105260447 A CN 105260447A CN 201510650352 A CN201510650352 A CN 201510650352A CN 105260447 A CN105260447 A CN 105260447A
Authority
CN
China
Prior art keywords
access
service end
web page
information
indicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510650352.6A
Other languages
English (en)
Inventor
王城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hanzhiyou Information Technology Service Co Ltd
Original Assignee
Shanghai Hanzhiyou Information Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hanzhiyou Information Technology Service Co Ltd filed Critical Shanghai Hanzhiyou Information Technology Service Co Ltd
Priority to CN201510650352.6A priority Critical patent/CN105260447A/zh
Publication of CN105260447A publication Critical patent/CN105260447A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种网页数据分析方法及系统,属于数据处理技术领域;方法包括:输出关联于一次网页访问的网页数据请求;根据网页数据请求,记录包括本次网页访问的访问属性的访问日志;根据网页数据请求,记录包括本次网页访问的用户操作信息的操作日志;分别将访问日志和操作日志同步至一存储服务端中;根据网页数据请求,累计得到关联于本次网页访问的不同的用户操作信息的操作数目;根据操作数目,和/或访问日志,和/或操作日志,分析得到对应于本次网页访问的数据统计结果。系统包括:多个客户端、第一服务端、第二服务端、存储服务端以及分析服务端;上述技术方案的有益效果是:提升数据查询和分析的速度和灵活性。

Description

一种网页数据分析方法及系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种网页数据分析方法及系统。
背景技术
现有的综合交易系统,例如电商网站系统等,在运营一段时期后,都需要对自有的用户资源进行采集、统计和分析。由于技术以及成本等方面的考量,在电商等网站系统上无法搭建或者使用大数据量的分析系统,只能采用一些简单易用的存数据系统实现数据统计和分析。这种实现方法虽然能够降低搭建和使用成本,但是实际的使用效果并不理想,并且随着网站系统运营时间的增长以及数据量的增加,查询、统计和分析操作的速度将不断下降,并最终影响到用户体验,甚至影响整个网站系统的正常运行。
发明内容
根据现有技术中存在的问题,现提供一种网页数据分析方法及系统的技术方案,旨在应用简单的配置就能对交易平台上种类复杂的交易数据进行数据查询和分析,提升数据查询和分析的速度和灵活性。
上述技术方案具体包括:
一种网页数据分析方法,其中,包括:
步骤S1,采用一客户端输出关联于一次网页访问的网页数据请求;
步骤S2,根据所述网页数据请求,于连接所述客户端的第一服务端内记录包括本次网页访问的访问属性的访问日志;
步骤S3,根据所述网页数据请求,于连接所述第一服务端的第二服务端内记录包括本次网页访问的用户操作信息的操作日志;
步骤S4,分别将所述访问日志和所述操作日志同步至一存储服务端中;
步骤S5,根据所述网页数据请求,于所述第二服务端内累计得到关联于本次网页访问的不同的所述用户操作信息的操作数目;
步骤S6,根据所述操作数目,和/或所述访问日志,和/或所述操作日志,分析得到对应于本次网页访问的数据统计结果。
优选的,该网页数据分析方法,其中,所述步骤S2中,所述第一服务端为nginx服务器。
优选的,该网页数据分析方法,其中,所述步骤S2中,所述访问属性包括:
用于指示关联于本次网页访问的时间的访问时间信息;以及
用于标识本次网页访问的访问标示信息。
优选的,该网页数据分析方法,其中,所述步骤S2中,所述访问属性还包括:
用于指示关联于本次网页访问的所述客户端的访问来源信息;和/或
用于指示关联于本次网页访问的网页地址的访问地址信息;和/或
用于指示关联于本次网页访问的网页标题的访问标题信息。
优选的,该网页数据分析方法,其中,所述步骤S3中,所述第二服务端为通过所述第一服务端连接所述客户端的应用服务器。
优选的,该网页数据分析方法,其中,所述步骤S3中,所述用户操作信息包括:
用于表示用户登录状况的用户登录信息;和/或
用于表示用户交易状况的用户交易信息。
优选的,该网页数据分析方法,其中,分别于所述第一服务端和所述第二服务端内设置一同步单元,并采用所述同步单元分别将所述访问日志和所述操作日志同步至所述存储服务端。
优选的,该网页数据分析方法,其中,所述步骤S4中,所述存储服务端中包括一搜索单元,所述搜索单元向所述客户端提供访问接口;
所述客户端通过所述访问接口向所述搜索单元发送搜索指令,所述搜索单元根据所述搜索指令于所述存储服务端中调取相应的所述访问日志和/或所述操作日志,并反馈至所述客户端。
优选的,该网页数据分析方法,其中,所述步骤S5中,所述操作数目包括:
用于指示当前已登录用户总数的登录数量信息;和/或
用于指示用户的登录操作的成功次数的成功记录信息;和/或
用于指示用户的登录操作的失败次数的失败记录信息;和/或
用于指示用户的当日的交易订单总数的交易数量信息;和/或
用于指示用户的当日的交易金额总数的交易数额信息。
优选的,该网页数据分析方法,其中,所述步骤S6中,所述数据统计结果包括:
根据所述操作数目以及所述访问日志分析得到的用于指示用户登录跳失状况的登录跳失信息;和/或
根据所述操作数目以及所述操作日志分析得到的用于指示网页访问数量的访问数信息;和/或
根据所述操作数目以及所述操作日志分析得到的用于指示网页访问跳失状况的访问跳失信息。
一种网页数据分析系统,其中,包括:
多个客户端,每个所述客户端供使用者访问网页,并输出关联于一次网页访问的网页数据请求;
第一服务端,分别连接每个所述客户端,用于根据所述网页数据请求记录包括本次网页访问的访问属性的访问日志;
第二服务端,连接所述第一服务端,用于根据所述网页数据请求记录包括本次网页访问的用户操作信息的操作日志;
存储服务端,分别连接所述第一服务端和所述第二服务端;
分别于所述第一服务端和所述第二服务端内设置同步单元,所述存储服务端用于保存所述同步单元进行同步操作而发送的所述访问日志和所述操作日志;
所述第二服务端内还包括一计数单元,用于累计得到关联于本次网页访问的不同的所述用户操作信息的操作数目;
分析服务端,分别连接所述第二服务端和所述存储服务端,用于根据所述操作数目,和/或所述访问日志,和/或所述操作日志,分析得到对应于本次网页访问的数据统计结果。
优选的,该网页数据分析系统,其中,所述第一服务端为nginx服务器。
优选的,该网页数据分析系统,其中,所述访问属性包括:
用于指示关联于本次网页访问的时间的访问时间信息;以及
用于标识本次网页访问的访问标示信息。
优选的,该网页数据分析系统,其中,所述访问属性还包括:
用于指示关联于本次网页访问的所述客户端的访问来源信息;和/或
用于指示关联于本次网页访问的网页地址的访问地址信息;和/或
用于指示关联于本次网页访问的网页标题的访问标题信息。
优选的,该网页数据分析系统,其中,所述存储服务端中包括:
搜索单元,所述搜索单元向所述客户端提供访问接口;
所述客户端通过所述访问接口向所述搜索单元发送搜索指令,所述搜索单元根据所述搜索指令于所述存储服务端中调取相应的所述访问日志和/或所述操作日志,并反馈至所述客户端。
优选的,该网页数据分析系统,其中,所述操作数目包括:
用于指示当前已登录用户总数的登录数量信息;和/或
用于指示用户的登录操作的成功次数的成功记录信息;和/或
用于指示用户的登录操作的失败次数的失败记录信息;和/或
用于指示用户的当日的交易订单总数的交易数量信息;和/或
用于指示用户的当日的交易金额总数的交易数额信息。
优选的,该网页数据分析系统,其中,所述数据统计结果包括:
根据所述操作数目以及所述访问日志分析得到的用于指示用户登录跳失状况的登录跳失信息;和/或
根据所述操作数目以及所述操作日志分析得到的用于指示网页访问数量的访问数信息;和/或
根据所述操作数目以及所述操作日志分析得到的用于指示网页访问跳失状况的访问跳失信息。
上述技术方案的有益效果是:
1)提供一种网页数据分析方法,能够应用简单的配置就能对交易平台上种类复杂的交易数据进行数据查询和分析,提升数据查询和分析的速度和灵活性;
2)提供一种网页数据分析系统,能够支持实现上述网页数据分析方法。
附图说明
图1是本发明的较佳的实施例中,一种网页数据分析方法的总体流程示意图;
图2是本发明的较佳的实施例中,一种网页数据分析系统的总体结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
本发明的较佳的实施例中,基于现有技术中存在的问题,现提供一种网页数据分析方法,其具体步骤如图1所示,包括:
步骤S1,采用一客户端输出关联于一次网页访问的网页数据请求;
步骤S2,根据网页数据请求,于连接客户端的第一服务端内记录包括本次网页访问的访问属性的访问日志;
步骤S3,根据网页数据请求,于连接第一服务端的第二服务端内记录包括本次网页访问的用户操作信息的操作日志;
步骤S4,分别将访问日志和操作日志同步至一存储服务端中;
步骤S5,根据网页数据请求,于第二服务端内累计得到关联于本次网页访问的不同的用户操作信息的操作数目;
步骤S6,根据操作数目,和/或访问日志,和/或操作日志,分析得到对应于本次网页访问的数据统计结果。
在一个具体实施例中,上述网页数据分析方法中,首先包括客户端。客户端可以为多个,每个客户端均可以供用户进行网页访问,并输出关联于当次网页访问的网页数据请求。
该实施例中,所谓网页数据请求,其中可以包括用户本次网页访问对应的所有数据,例如其中可以包括本次网页访问提出的登录数据、用户信息数据、交易数据以及其他操作数据。
该实施例中,还包括一个第一服务端,分别连接上述客户端。则上述步骤S2中,根据网页数据请求,于上述第一服务端内记录包括本次网页访问的访问属性的访问日志。所谓访问属性,实际为对应于本次网页访问所访问的页面的属性(下文中会详述)。
该实施例中,还包括一个第二服务端,连接上述第一服务端。因此,上述步骤S3中,根据网页数据请求,于第二服务端内记录包括本次网页访问的用户操作信息的操作日志。所谓用户操作信息,实际为对应于本次网页访问的用户进行登录操作、交易操作以及其他操作所对应的信息(下文中会详述)。
因此,该实施例中,可以分别将上述访问日志和操作日志同时同步到一个存储服务端,即同步到一个同步数据库中。
同时,该实施例中,还可以在上述第二服务端内累计得到关联于本次网页访问的不同的用户操作信息的操作数目。所谓操作数目,实际为对应于不同的用户操作信息(即不同类型的用户操作)的操作计数,或者金额计数,或者其他数量计数(在下文中会详述)。
最终,该实施例中,上述步骤S6中,可以根据上述操作数目、访问日志以及操作日志中的一种或几种,直接分析得到相应的数据统计结果。
本发明的较佳的实施例中,上述第一服务端为nginx服务器。换言之,上述第一服务端可以为一反向代理服务器。
本发明的较佳的实施例中,上述第二服务端为一应用服务器。因此,结合上文中所述,客户端供用户访问网页,并发送网页数据请求,该请求经过上述第一服务端被转送至上述第二服务端进行处理。相应地,第二服务端将处理结果通过第一服务端发送至客户端。
本发明的较佳的实施例中,上述步骤S1中,客户端提供用户访问网页,并通过下述脚本将网页数据请求发送至上述第一服务端:
根据上述网页数据请求发送脚本的配置,需要在每个被访问的页面配置如下脚本:
本发明的较佳的实施例中,上述访问属性可以包括下文中所述的几种:
用于指示关联于本次网页访问的时间的访问时间信息;
用于指示关联于本次网页访问的所述客户端的访问来源信息;
用于标识本次网页访问的访问标示信息;
用于指示关联于本次网页访问的网页地址的访问地址信息;
用于指示关联于本次网页访问的网页标题的访问标题信息。
本发明的一个较佳的实施例中,关联于上述访问属性的配置内容可以为:
log_formattick
$msec|$remote_addr|$params_domain|$params_url|"$params_title"|$params_referrer|"$http_user_agen
t"|$params_utrace';
则上述配置内容中,$msec为访问时间信息,$params_utrace为访问标示信息,$params_url为访问地址信息,$params_title为访问标题信息,以及存在其他信息。
则该实施例中,上述访问时间信息和访问标示信息是必须存在的,其他信息则可以自行选择加入。
本发明的较佳的实施例中,如上文中所述,由于第一服务端可以为nginx服务器,则对于nginx服务器的脚本配置可以配合被访问的网页以及相应的访问日志的格式,采用下文中所述的方式配置完成:
本发明的较佳的实施例中,如上文中所述,由于第二服务端可以为应用服务器,则可以采用如下文中所述的配置脚本完成上述应用服务器中对于用户登录信息的日志配置:
则在登录代码中加入日志记录:
logger.info(logBean.getUserID()+"|"+loginStatus+"|"+
(StringUtils.isBlank(logBean.getOther())?"none":logBean.getOther().substring(8))+"|"+logBean.getOperateTime()+"|"+logBean,getActionName()+"|"+logBean.getClientType()+"|"+logBean.getClientIP()+"|"+(StringUtils.isBlank(logBean.getErrorMessage())?"-":logBeanmgetErrorMesage()));
则最终生成的登录日志信息为:
2015-08-2714:05:45:32160002761|true|1048193261440049806|20150827140544|/wap/myaccount/loginAjax.do|iabc|10.48.193.23|-
因此,本发明的较佳的实施例中,上述用户操作信息包括:
用于表示用户登录状况的用户登录信息;和/或
用于表示用户交易状况的用户交易信息。
如上文中所述为对登录信息进行日志记录的配置方式,则对交易信息进行配置的方式类似上文中所述。
本发明的较佳的实施例中,分别于第一服务端和第二服务端内设置一同步单元。则上述步骤S4种,可以采用同步单元分别将访问日志和操作日志同步至存储服务端。
本发明的较佳的实施例中,上述存储服务端中包括一搜索单元,搜索单元向客户端提供访问接口;
客户端通过访问接口向搜索单元发送搜索指令,搜索单元根据搜索指令于存储服务端中调取相应的访问日志和/或操作日志,并反馈至客户端。
因此,本发明的较佳的实施例中,上述存储服务端实际为一个挂载有数据库的搜索引擎,向客户端开放。
则本发明的一个较佳的实施例中,上述同步单元将日志同步到搜索引擎中的配置脚本代码如下所述:
本发明的较佳的实施例中,上述操作数目可以包括下文中所述的一种或几种:
用于指示当前已登录用户总数的登录数量信息;
用于指示用户的登录操作的成功次数的成功记录信息;
用于指示用户的登录操作的失败次数的失败记录信息;
用于指示用户的当日的交易订单总数的交易数量信息;
用于指示用户的当日的交易金额总数的交易数额信息。
具体地,本发明的较佳的实施例中,所谓登录数量信息,可以为当前已经登录的用户之前的登录总数(可以在预定时段内的登录总数)。例如当前已登录用户A,在之前的一日内(24小时内)总共登录5次,则5次即为该登录数量信息。上述登录数量信息可以采用累计的方式获取,即用户每登录一次,则累加一次(下文中的累计方式类似,不再赘述)。
所谓成功记录信息,实际用于累计每个用户登录操作成功的次数。
所谓失败记录信息,实际用于累计每个用户登录操作失败的次数。
所谓交易数量信息,实际用于累计每个用户登录并下发订单的订单总数,即发起交易的总次数。
所谓交易数额信息,实际用于累计每个用户发起交易的总金额。
本发明的较佳的实施例中,上述操作数目还包括可以累计计算的关联于其他用户操作信息的数量信息,在此不再赘述。
因此,本发明的较佳的实施例中,上述步骤S6中,上述数据统计结果可以包括下文中所述的一种或几种:
根据操作数目以及访问日志分析得到的用于指示用户登录跳失状况的登录跳失信息;
根据操作数目以及操作日志分析得到的用于指示网页访问数量的访问数信息;
根据操作数目以及操作日志分析得到的用于指示网页访问跳失状况的访问跳失信息。
具体地,本发明的较佳的实施例中,上述登录跳失信息可以根据上述操作数目(登录成功/失败次数)以及访问日志分析得到,用于分析存在多少个登录后随即退出的用户。
上述访问数信息同样可以根据上述操作数目(登录次数/访问特定网页次数)以及访问日志分析得到。
上述访问跳失信息同样可以根据上述操作数目(访问特定网页次数)以及访问日志分析得到,用于分析存在多少个用户访问特定网页随即退出。
综上所述,本发明技术方案中,首先分别通过代理服务器和应用服务器记录用户的登录访问日志以及操作日志,随后将所有日志同步到一同步数据库中,并在应用服务器内记录用户操作的数目,最终根据被同步的日志以及操作数目分析得到用户的一系列操作的统计结果。
本发明的较佳的实施例中,基于上文中所述的网页数据分析方法,现提供一种网页数据分析系统,其结构如图2所示,包括:
多个客户端A,每个客户端A供使用者访问网页,并输出关联于一次网页访问的网页数据请求;
第一服务端B,分别连接每个客户端A,用于根据网页数据请求记录包括本次网页访问的访问属性的访问日志;
第二服务端C,连接第一服务端B,用于根据网页数据请求记录包括本次网页访问的用户操作信息的操作日志;
存储服务端D,分别连接第一服务端B和第二服务端C;
则本发明的较佳的实施例中,分别于第一服务端B和第二服务端C内设置同步单元(B1和C1),存储服务端D用于保存同步单元B1和C1进行同步操作而发送的访问日志和操作日志。
则本发明的较佳的实施例中,上述第二服务端C内还包括一计数单元C2。计数单元C2用于累计得到关联于本次网页访问的不同的用户操作信息的操作数目。
本发明的较佳的实施例中,仍然如图2所示,上述网页数据分析系统中还包括:
分析服务端E,分别连接第二服务端C和存储服务端D,用于根据操作数目,和/或访问日志,和/或操作日志,分析得到对应于本次网页访问的数据统计结果。
本发明的较佳的实施例中,上述第一服务端B可以为nginx服务器,即反向代理服务器。
本发明的较佳的实施例中,上述第二服务端C可以为应用服务器。
本发明的较佳的实施例中,上述存储服务端D内还包括:
搜索单元D1。本发明的较佳的实施例中,搜索单元D1向客户端A提供访问接口,则:
客户端A通过访问接口向搜索单元D1发送搜索指令,搜索单元D1根据搜索指令于存储服务端中调取相应的访问日志和/或操作日志,并反馈至客户端A。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (17)

1.一种网页数据分析方法,其特征在于,包括:
步骤S1,采用一客户端输出关联于一次网页访问的网页数据请求;
步骤S2,根据所述网页数据请求,于连接所述客户端的第一服务端内记录包括本次网页访问的访问属性的访问日志;
步骤S3,根据所述网页数据请求,于连接所述第一服务端的第二服务端内记录包括本次网页访问的用户操作信息的操作日志;
步骤S4,分别将所述访问日志和所述操作日志同步至一存储服务端中;
步骤S5,根据所述网页数据请求,于所述第二服务端内累计得到关联于本次网页访问的不同的所述用户操作信息的操作数目;
步骤S6,根据所述操作数目,和/或所述访问日志,和/或所述操作日志,分析得到对应于本次网页访问的数据统计结果。
2.如权利要求1所述的网页数据分析方法,其特征在于,所述步骤S2中,所述第一服务端为nginx服务器。
3.如权利要求1所述的网页数据分析方法,其特征在于,所述步骤S2中,所述访问属性包括:
用于指示关联于本次网页访问的时间的访问时间信息;以及
用于标识本次网页访问的访问标示信息。
4.如权利要求1所述的网页数据分析方法,其特征在于,所述步骤S2中,所述访问属性还包括:
用于指示关联于本次网页访问的所述客户端的访问来源信息;和/或
用于指示关联于本次网页访问的网页地址的访问地址信息;和/或
用于指示关联于本次网页访问的网页标题的访问标题信息。
5.如权利要求1所述的网页数据分析方法,其特征在于,所述步骤S3中,所述第二服务端为通过所述第一服务端连接所述客户端的应用服务器。
6.如权利要求1所述的网页数据分析方法,其特征在于,所述步骤S3中,所述用户操作信息包括:
用于表示用户登录状况的用户登录信息;和/或
用于表示用户交易状况的用户交易信息。
7.如权利要求1所述的网页数据分析方法,其特征在于,分别于所述第一服务端和所述第二服务端内设置一同步单元,并采用所述同步单元分别将所述访问日志和所述操作日志同步至所述存储服务端。
8.如权利要求1所述的网页数据分析方法,其特征在于,所述步骤S4中,所述存储服务端中包括一搜索单元,所述搜索单元向所述客户端提供访问接口;
所述客户端通过所述访问接口向所述搜索单元发送搜索指令,所述搜索单元根据所述搜索指令于所述存储服务端中调取相应的所述访问日志和/或所述操作日志,并反馈至所述客户端。
9.如权利要求1所述的网页数据分析方法,其特征在于,所述步骤S5中,所述操作数目包括:
用于指示当前已登录用户总数的登录数量信息;和/或
用于指示用户的登录操作的成功次数的成功记录信息;和/或
用于指示用户的登录操作的失败次数的失败记录信息;和/或
用于指示用户的当日的交易订单总数的交易数量信息;和/或
用于指示用户的当日的交易金额总数的交易数额信息。
10.如权利要求1所述的网页数据分析方法,其特征在于,所述步骤S6中,所述数据统计结果包括:
根据所述操作数目以及所述访问日志分析得到的用于指示用户登录跳失状况的登录跳失信息;和/或
根据所述操作数目以及所述操作日志分析得到的用于指示网页访问数量的访问数信息;和/或
根据所述操作数目以及所述操作日志分析得到的用于指示网页访问跳失状况的访问跳失信息。
11.一种网页数据分析系统,其特征在于,包括:
多个客户端,每个所述客户端供使用者访问网页,并输出关联于一次网页访问的网页数据请求;
第一服务端,分别连接每个所述客户端,用于根据所述网页数据请求记录包括本次网页访问的访问属性的访问日志;
第二服务端,连接所述第一服务端,用于根据所述网页数据请求记录包括本次网页访问的用户操作信息的操作日志;
存储服务端,分别连接所述第一服务端和所述第二服务端;
分别于所述第一服务端和所述第二服务端内设置同步单元,所述存储服务端用于保存所述同步单元进行同步操作而发送的所述访问日志和所述操作日志;
所述第二服务端内还包括一计数单元,用于累计得到关联于本次网页访问的不同的所述用户操作信息的操作数目;
分析服务端,分别连接所述第二服务端和所述存储服务端,用于根据所述操作数目,和/或所述访问日志,和/或所述操作日志,分析得到对应于本次网页访问的数据统计结果。
12.如权利要求11所述的网页数据分析系统,其特征在于,所述第一服务端为nginx服务器。
13.如权利要求11所述的网页数据分析系统,其特征在于,所述访问属性包括:
用于指示关联于本次网页访问的时间的访问时间信息;以及
用于标识本次网页访问的访问标示信息。
14.如权利要求11所述的网页数据分析系统,其特征在于,所述访问属性还包括:
用于指示关联于本次网页访问的所述客户端的访问来源信息;和/或
用于指示关联于本次网页访问的网页地址的访问地址信息;和/或
用于指示关联于本次网页访问的网页标题的访问标题信息。
15.如权利要求11所述的网页数据分析系统,其特征在于,所述存储服务端中包括:
搜索单元,所述搜索单元向所述客户端提供访问接口;
所述客户端通过所述访问接口向所述搜索单元发送搜索指令,所述搜索单元根据所述搜索指令于所述存储服务端中调取相应的所述访问日志和/或所述操作日志,并反馈至所述客户端。
16.如权利要求11所述的网页数据分析系统,其特征在于,所述操作数目包括:
用于指示当前已登录用户总数的登录数量信息;和/或
用于指示用户的登录操作的成功次数的成功记录信息;和/或
用于指示用户的登录操作的失败次数的失败记录信息;和/或
用于指示用户的当日的交易订单总数的交易数量信息;和/或
用于指示用户的当日的交易金额总数的交易数额信息。
17.如权利要求11所述的网页数据分析系统,其特征在于,所述数据统计结果包括:
根据所述操作数目以及所述访问日志分析得到的用于指示用户登录跳失状况的登录跳失信息;和/或
根据所述操作数目以及所述操作日志分析得到的用于指示网页访问数量的访问数信息;和/或
根据所述操作数目以及所述操作日志分析得到的用于指示网页访问跳失状况的访问跳失信息。
CN201510650352.6A 2015-10-09 2015-10-09 一种网页数据分析方法及系统 Pending CN105260447A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510650352.6A CN105260447A (zh) 2015-10-09 2015-10-09 一种网页数据分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510650352.6A CN105260447A (zh) 2015-10-09 2015-10-09 一种网页数据分析方法及系统

Publications (1)

Publication Number Publication Date
CN105260447A true CN105260447A (zh) 2016-01-20

Family

ID=55100137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510650352.6A Pending CN105260447A (zh) 2015-10-09 2015-10-09 一种网页数据分析方法及系统

Country Status (1)

Country Link
CN (1) CN105260447A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103470A (zh) * 2017-03-03 2017-08-29 九次方大数据信息集团有限公司 一种提高现货交易过程中信息安全的方法和系统
CN107944901A (zh) * 2017-10-27 2018-04-20 深圳市天下房仓科技有限公司 应用于同业交易平台的用户行为记录方法及系统
CN108446287A (zh) * 2017-02-16 2018-08-24 北京国双科技有限公司 网页爬取方法及装置
CN110377854A (zh) * 2019-05-31 2019-10-25 平安科技(深圳)有限公司 用户访问行为信息监控方法及装置、计算机设备
CN111107145A (zh) * 2019-12-17 2020-05-05 青岛希望鸟科技有限公司 基于html5网页的在线同步交流系统
CN111241449A (zh) * 2020-01-14 2020-06-05 上海风秩科技有限公司 一种日志数据发送方法及装置
CN115242717A (zh) * 2022-09-15 2022-10-25 四川汉唐云分布式存储技术有限公司 一种基于端侧计算的中心化存储系统及控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242307A (zh) * 2008-02-01 2008-08-13 刘峰 用嵌入代码代理日志实现网站访问分析系统与方法
CN103150363A (zh) * 2013-03-04 2013-06-12 北京小米科技有限责任公司 访问网页的方法及装置
CN104778010A (zh) * 2014-01-13 2015-07-15 内蒙古近远信息技术有限责任公司 基于云存储平台的媒体数据高效访问预取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242307A (zh) * 2008-02-01 2008-08-13 刘峰 用嵌入代码代理日志实现网站访问分析系统与方法
CN103150363A (zh) * 2013-03-04 2013-06-12 北京小米科技有限责任公司 访问网页的方法及装置
CN104778010A (zh) * 2014-01-13 2015-07-15 内蒙古近远信息技术有限责任公司 基于云存储平台的媒体数据高效访问预取方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446287A (zh) * 2017-02-16 2018-08-24 北京国双科技有限公司 网页爬取方法及装置
CN107103470A (zh) * 2017-03-03 2017-08-29 九次方大数据信息集团有限公司 一种提高现货交易过程中信息安全的方法和系统
CN107103470B (zh) * 2017-03-03 2021-08-13 九次方大数据信息集团有限公司 一种提高现货交易过程中信息安全的方法和系统
CN107944901A (zh) * 2017-10-27 2018-04-20 深圳市天下房仓科技有限公司 应用于同业交易平台的用户行为记录方法及系统
CN110377854A (zh) * 2019-05-31 2019-10-25 平安科技(深圳)有限公司 用户访问行为信息监控方法及装置、计算机设备
CN111107145A (zh) * 2019-12-17 2020-05-05 青岛希望鸟科技有限公司 基于html5网页的在线同步交流系统
CN111241449A (zh) * 2020-01-14 2020-06-05 上海风秩科技有限公司 一种日志数据发送方法及装置
CN115242717A (zh) * 2022-09-15 2022-10-25 四川汉唐云分布式存储技术有限公司 一种基于端侧计算的中心化存储系统及控制方法
CN115242717B (zh) * 2022-09-15 2022-12-09 四川汉唐云分布式存储技术有限公司 一种基于端侧计算的中心化存储系统及控制方法

Similar Documents

Publication Publication Date Title
CN105260447A (zh) 一种网页数据分析方法及系统
US20190332979A1 (en) Mapping portal applications in multi-tenant environment
CN101370024B (zh) 信息的分布式采集方法及系统
CN103684874A (zh) 一种自动分配网上客服进行客户服务的方法和装置
CN103685590B (zh) 获取ip地址的方法及系统
CN103338260B (zh) 网络审计中url日志的分布式分析系统及分析方法
CN103200262A (zh) 一种基于移动网络的广告调度方法、装置及系统
CN102799636A (zh) 移动终端显示网页的方法及系统
CN107480277A (zh) 用于网站日志采集的方法及装置
CN102790772B (zh) Cookie数据的处理方法、服务器和客户端
US10255371B2 (en) Methods and systems for identifying multiple devices belonging to a single user by merging deterministic and probabilistic data to generate a cross device data structure
US20160012074A1 (en) System and method for providing contextual analytics data
WO2016039783A1 (en) Auditing of web-based video
US20130042186A1 (en) Real-time web-based debate platform
CN102523106A (zh) 基于FlexRIA技术的视频网站用户行为分析系统
Kleppe et al. Analysing and understanding news consumption patterns by tracking online user behaviour with a multimodal research design
CN104991831A (zh) 基于服务端的sso系统集成方法
CN104765823A (zh) 一种网站数据采集的方法及装置
JP6185488B2 (ja) 公開カレンダーからの可用性情報の引き出し
CN110737645B (zh) 一种不同系统间数据迁移方法、数据迁移系统及相关设备
CN104301148A (zh) 一种基于网站访问的用户行为记录方法
CN109255587A (zh) 一种工作数据的协同处理方法及装置
CN105009115A (zh) 获取网络资源的方法和装置
CN110417869A (zh) 一种活动推送方法、装置及计算机设备
CN110557351B (zh) 用于生成信息的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160120