CN102377583A - 统计网站流量的方法及系统 - Google Patents

统计网站流量的方法及系统 Download PDF

Info

Publication number
CN102377583A
CN102377583A CN2010102487112A CN201010248711A CN102377583A CN 102377583 A CN102377583 A CN 102377583A CN 2010102487112 A CN2010102487112 A CN 2010102487112A CN 201010248711 A CN201010248711 A CN 201010248711A CN 102377583 A CN102377583 A CN 102377583A
Authority
CN
China
Prior art keywords
page
visitor
subdirectory
monitored
visit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102487112A
Other languages
English (en)
Other versions
CN102377583B (zh
Inventor
喻友平
李化东
赵珅
陈婷
周瑾
马利
吴丽军
赵伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201010248711.2A priority Critical patent/CN102377583B/zh
Priority claimed from CN201010248711.2A external-priority patent/CN102377583B/zh
Publication of CN102377583A publication Critical patent/CN102377583A/zh
Application granted granted Critical
Publication of CN102377583B publication Critical patent/CN102377583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种统计网站流量的方法和系统。所述网站包含多个网页,所述统计网站流量的方法包括步骤:生成一段监测代码;将所生成的一段监测代码嵌入到待监控页面中;设置至少一个页面子目录,其中每个页面子目录涉及至少一个待统计流量的页面集合;统计每个页面子目录下的流量,以获得每个页面子目录所涉及的页面集合的总流量。采用本发明的方法和系统既可以查看到任何一个子频道本身的流量,又可以查看到任两个或两个以上子频道的整体流量;此外由于本发明中采用的监测代码少,因而易于管理而且不容易出错。

Description

统计网站流量的方法及系统
技术领域
本发明涉及网络通信领域,尤其是,本发明涉及一种统计网站流量的方法及系统。
背景技术
网站流量泛指网站的访问量,其可用一个网站一段时间内访问者的数量、访问者所浏览的网页的点击率和平均停留时间等指标来加以描述。随着互联网技术的飞速发展,网站流量和客户群体以及他们的需求被越来越多的人重视。网站的开发者和管理者需要确切地知道有多少人访问自己的网站、他们来自哪里、对网站的哪些栏目和服务感兴趣、一般都浏览哪些信息、他们的需求是什么等访问者相关访问信息。因此,为了对网站的开发者和管理者提供有意义的访问者访问信息,以便对网站的逻辑结构、网站运行状况、服务器负载等具体情况进行更加有效的跟踪和改进,需要对网站流量和访问者行为进行科学的统计和分析。
最传统的网站是在网页上使用计数器来进行简单的访问者数量的统计,然而,随着网站运营规模的快速扩大,依靠这种简单的数量统计并不能真正对网站运营状况进行全面、准确的评估,从而难以为网站运营者提供有意义的参考。
此外,随着网络技术的不断发展,各大站点(例如www.baidu.com)越来越趋向于包括多个子频道(例如mp3.baidu.com,news.baidu.com等),而对于网络运营者而言,其不仅想知道总网站的流量,还想知道该总网站的各个子频道的流量。目前的一种流量统计方法是分别针对多个子频道建立与其对应的多个网站,然后针对不同的网站获得相应的不同JS代码(例如JS1,JS2,...JSn),之后分别给每个网站嵌入所获得的特定于该网站的JS代码以捕捉该网站的访问者信息。
然而,该方法存在下述缺陷:1、网络运营者无法看到两个或两个以上子频道的整体流量,因为其分属于两个不同的网站;2、当一个总网站下有很多子域名(即子频道)的情况下,由于要给每个子域名下的网站嵌入与其相对应的特定JS代码,所以导致JS代码繁多,因而对JS代码的后台管理变得非常复杂,并且经常容易出错。
因此,迫切需要一种可以准确并便捷地为网站运营者提供总网站及各子频道流量的方法和系统。
发明内容
针对现有技术中所存在的上述缺陷中的至少一个,本发明提供了一种改进的统计网站流量的方法和系统。
根据本发明的第一方面,提供了一种统计包含多个页面的网站的流量的方法,其包括如下步骤:
(1)生成一段监测代码;
(2)将所生成的一段监测代码嵌入到待监控页面中;
(3)设置至少一个页面子目录,其中每个页面子目录涉及至少一个待统计流量的页面集合;
(4)利用所述监测代码统计预定页面子目录下的流量,以获得该预定页面子目录所涉及的页面集合的总流量;
其中,所述步骤(3)在步骤(2)之后执行或在步骤(1)之前执行。
优选地,在所述页面子目录中采用正则表达式来设置所述页面集合。
优选地,使用通配符来设置所述页面集合。所述通配符优选地包括“*”字符和在正则表达式中表示“或”的字符。
优选地,所述页面集合为预定网站的预定子频道下的所有待监控页面的集合。
优选地,所述步骤(4)包括如下子步骤:
(4.1)当访问者点击待监控页面时,利用所述监测代码来采集访问者点击信息;
(4.2)将所述监测代码采集的访问者点击信息发送至监测流量统计服务器;
(4.3)将所述访问者点击信息记录到涉及该访问者所点击的当前页面的页面子目录中;
(4.4)统计预定页面子目录下的访问者点击流量。
优选地,所述访问者点击信息包含访问者所点击的当前页面的URL地址。
优选地,所述访问者点击信息还包括与访问者所处地域相关的访问者IP地址、和/或客户端浏览器信息、和/或客户端操作系统信息、和/或本次访问所来源于的搜索引擎有关的信息、和/或本次访问所来源于的其他网站的URL地址。其中,所述本次访问所来源于的其他网站优选为本次访问最初来源于的网站。
优选地,所述子步骤(4.4)包括针对不同的访问来源地域和/或不同的访问来源搜索引擎和/或不同的访问来源网站来分别进行预定页面子目录下的各统计维度的流量统计。其中,所述访问来源网站优选为访问者所进行的本次访问最初来源于的网站。
优选地,所述子步骤(4.4)包括针对待监控页面上的预定待监测元素分别进行点击流量统计。
优选地,所述待监测元素包括所述页面上的任何按钮、链接、文本、图片和图标。
优选地,所述监测代码为JavaScript代码。
优选地,所述步骤(4.3)包括将所述访问者点击信息记录到访问者所点击的待监控页面的URL地址所匹配的目标页面子目录中。
优选地,所述访问者所点击的待监控页面的URL地址符合所述目标页面子目录采用的正则多项式所限定的条件。
优选地,通过给每个页面子目录设置计数器来统计页面子目录下的访问者点击流量。
优选地,所述步骤(4.4)实时进行或定期进行。
根据本发明的另一方面,提供了一种统计包含多个页面网站的网站流量的系统,该系统包括:
用于生成一段监测代码的监测代码生成装置;
用于将所生成的一段监测代码嵌入到待监控页面中的监测代码嵌入装置;
用于设置至少一个页面子目录的子目录设置装置,其中每个页面子目录涉及至少一个待统计流量的页面集合;
用于利用所述监测代码统计预定页面子目录下的流量、以获得该预定页面子目录所涉及的页面集合的总流量的流量统计装置。
优选地,所述流量统计装置包括:
用于在访问者点击待监控页面时利用所述监测代码来采集访问者点击信息的点击信息采集装置;
用于将所述监测代码采集的访问者点击信息发送至监测流量统计服务器的点击信息发送装置;
用于将所述访问者点击信息记录到涉及该访问者所点击的当前页面的页面子目录中的点击信息记录装置;
用于统计预定页面子目录下的访问者点击流量的子目录流量统计装置。
优选地,所述子目录流量统计装置包括用于针对不同的访问来源地域和/或不同的访问来源搜索引擎和/或不同的访问来源网站来分别进行预定页面子目录下的各统计维度的流量统计的访问来源流量统计装置。其中,所述访问来源网站优选为访问者所进行的本次访问最初来源于的网站。
优选地,所述子目录流量统计装置包括用于针对待监控页面上的预定待监测元素分别进行待监测元素点击流量统计的待监测元素流量统计装置。
优选地,所述点击信息记录装置将所述访问者点击信息记录到访问者所点击的待监控页面的URL地址所匹配的目标页面子目录中。优选地,所述访问者所点击的待监控页面的URL地址符合所述目标页面子目录采用的正则多项式所限定的条件。
优选地,所述子目录流量统计装置通过给每个页面子目录设置计数器来统计页面子目录下的访问者点击流量。
优选地,所述子目录流量统计装置实时或定期统计页面子目录下的访问者点击流量。
本发明具有下面一个或多个优点:由于本发明是针对一个总网站设置多个子目录,所以网络运营者可以根据实际需要查看任何一个子频道本身的流量,或者任两个或两个以上子频道的整体流量;此外,本发明由于只需要在该总网站下属的所有待监控页面中嵌入同一段监测代码,所以对监测代码的管理变得很容易,而且不容易出错。另外,由于本发明中由监测代码采集到的访问者点击信息包括本次访问所最初来源于的其他网站的URL地址,所以使得本发明的流量统计方法在针对不同的访问来源网站这一维度进行统计时,能够取得比现有技术更为准确的统计结果(目前所存在的现有技术只会统计到本次访问的上一步来源网页,而并不能统计到本次访问的最初来源网站,因而并不能真实准确地反映本次访问的来源情况),从而更能为网络运营者提供有价值、准确的分析数据。
附图说明
图1示出了根据本发明的统计网站流量的方法的流程框图。
图2示出了根据本发明的统计网站流量的系统的示意图。
图3示出了根据本发明的子目录示意图。
具体实施方式
下面结合优选实施例和说明书附图对本发明作进一步详细的描述。
如图1所示,其描述了根据本发明优选实施例的方法。
在步骤101中,生成一段监测代码,该监测代码优选地为javascript代码(简称JS代码),该代码的作用是获取访问者的信息。
在步骤102中,将所生成的一段监测代码嵌入到某总网站下属的待监控页面中;
在步骤103中,设置至少一个页面子目录,所述页面子目录优选地被存储在后台的监测流量统计服务器的数据库中。所述每个页面子目录涉及至少一个待统计流量的页面集合。优选地,单个页面集合由预定总网站的其中一个子频道下的所有待监控页面构成。下面将参考图3来详细说明页面子目录的设置方式。
如图3所示,需要知晓流量统计结果的用户可以例如在后台的监测流量统计服务器中设置多个页面子目录,其中每个页面子目录对应于至少一个待统计流量的页面集合。
在每个子目录中,优选地采用正则表达式来设置页面集合。所谓正则表达式,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串,其可以用来检索那些符合某个模式的文本内容。许多程序设计语言包括Perl、PHP、Python、JavaScript和JScript都支持利用正则表达式进行字符串操作。本发明通过采用正则表达式来设置子目录从而使得用户可以自定义子目录中的页面集合的组织规则,这样增强了本发明的灵活性和实用性。例如,本发明优选地可以采用通配符匹配方式,即使用一串字符(进行匹配)即可获得符合一定条件的结果(例如符合一定条件的URL),然而,该示例仅为本发明的一种优选实施方式,本发明并不局限于此。
例如,在图3所示示例中,每个子目录优选地对应于某总网站的其中之一子频道。采用正则表达式将子目录“百度新闻”设置为“http://news.baidu.com/*”,此处的符号“*”为通配符,其表示该子目录涉及百度新闻子频道下的所有页面,也就是说,该子目录涉及其URL地址的前缀包含“http://news.baidu.com”的所有页面,如“http://news.baidu.com/n?cmd=1&class=housenews&pn=1&from=tab”“http://news.baidu.com/n?cmd=1&class=internews&pn=1&from=tab”等;而子目录“百度专利搜索”被设置为“http://zhuanli.baidu.com/*”,依此类推。
当然,图3仅仅示出了本发明的一个实施例。除此之外,还可以根据实际需要采用正则表达式将一个子目录设定为涉及两个或两个以上的待统计流量子频道。例如,当网站运营者想知晓两个子频道“百度新闻”和“百度贴吧”的总流量,那么就可以设定一个新的子目录,其中既涉及子频道“百度新闻”又涉及子频道“百度贴吧”,该子目录的设置方法例如为“http://(news|tieba).baidu.com/*”,此处的符号“|”为在正则表达式中表示“或”的符号,通过这样的设置方式使得该子目录能够涵盖“百度新闻”和“百度贴吧”这两个子频道下的所有页面。
依此类推,一个子目录可以涉及两个以上的子频道,其设置方式与上述两个子频道的设置方式同理,在此不再赘述。
需要说明的是,虽然本实施例采用了先执行步骤101和102然后再执行步骤103的方式进行了描述,但是本发明并不限于此,也就是说,所述步骤103还可以在步骤101之前执行。
接下来,在步骤104中,利用所述监测代码统计每个页面子目录下的点击流量,以获得每个页面子目录所涉及的页面集合的流量。如果某页面子目录仅涉及一个页面集合(优选为一个子频道),则该流量即为该页面集合(优选为子频道)的单独流量(即为该子频道下所有受监控页面的总流量);如果该页面子目录涉及两个或两个以上的页面集合(优选为两个或两个以上的子频道),则该页面子目录下的点击流量为该两个或两个以上的页面集合(优选为两个或两个以上的子频道)的总流量。
步骤104的具体实现方式为:
当访问者点击某受监控页面(例如http://news.baidu.com/n?cmd=1&class=housenews&pn=1&from=tab)时,利用嵌入该页面的所述监测代码(优选为JS代码)来采集访问者点击信息。由于本发明对总网站(例如http://www.baidu.com)的所有待监控页面均嵌入了完全相同的JS代码,所以将来该完全相同的JS代码会将收集到的各访问者点击信息存储到监测流量统计服务器中的与该总网站(例如www.baidu.com)对应的存储位置。
此外,所述访问者点击信息优选地包含访问者所点击的当前页面的URL、与访问者所处地域相关的访问者IP地址、访问者客户端浏览器信息、访问者客户端操作系统信息、本次访问所来源于的搜索引擎(例如本次访问是来源于google、搜狐还是其他搜索引擎)有关的信息(例如搜索引擎的URL地址或标识等)、和/或本次访问所来源于的其他网站的URL地址。
优选地,此处所述的本次访问所来源于的其他网站是指本次访问所最初来源于的网站。例如,当一访问者在sina看见某网站(例如sohu)的链接图标后,点击该链接图标从而来到该sohu网站的首页,然后访问者又由该sohu首页进入到某受监控注册页面。此时,本发明所采用的JS代码将采集到本次对该受监控注册页面的访问所最初来源于的网站的URL地址(在本例中即为:www.sina.com),而不是上一步来源于的sohu首页的URL地址,这样就可以保证针对访问来源网站的统计数据的准确性与真实性,从而可以真实、准确地反映访问者的来源情况。
接下来,优选(但不限于)采用Ajax技术中的XML HttpRequest请求方法把JS代码所采集到的详细访问者点击信息发送至监测流量统计服务器,并且将访问者点击信息记录到涉及该访问者本次点击的当前页面的页面子目录(即:与该被点击的当前页面的URL地址匹配的页面子目录,换言之,当前页面的URL符合该页面子目录采用的正则表达式所限定的条件)中,例如图3的第一个子目录“百度新闻”中并保存。
之后,实时或定期或者依照网络运营者等客户的具体需求来统计各页面子目录下的访问者点击流量。例如,在对每个子目录进行点击流量统计时,可以采用计数器的方式,为每个子目录分配一个计数器。当要进行实时流量统计时,每次用户点击该子目录所涉及页面的事件都会使得该子目录所对应的计数器进行计数,这样可以获取实时信息,有助于网站运营者能更加及时准确地获取用于决策的信息。
此外,也可以对各子频道的点击流量进行分时段定期统计,此时可以预设置一个统计时段,例如5秒。在这5秒内,当不同的访问者点击各子频道下包含的页面时,先仅仅在与所点击页面相关的页面子目录下记录每次点击的页面的URL,而涉及该被点击页面的子目录所对应的计数器不发生变化,当到了预设的进行统计的时刻时(例如5秒钟届满时),各子目录所对应的计数器才对该时间段内对该子目录所涉及的页面进行点击的数量进行统计和累加。这种分时段定期统计方式可以减轻流量统计服务器的负担,对于对实时性要求不太高的客户而言是比较理想的统计方式。
此外,本发明还优选地包括在每个子目录下针对不同的访问来源地域和/或不同的访问来源搜索引擎和/或不同的访问来源网站来分别进行流量统计,该流量统计是根据JS代码所采集到的详细访问者点击信息(如前所述,其中包括与访问者所处地域相关的访问者IP地址、本次访问所来源于的搜索引擎的相关信息和/或本次访问所来源于的其他网站(优选为最初来源于的网站)的URL地址)来进行的。
另外,本发明还优选地包括针对页面上的各待监测元素来分别进行点击流量统计。所述待监测元素可以是所述页面上的任何按钮、链接、文本、图片和图标。
下面将结合附图2来具体描述根据本发明实施例的统计包含多个页面的网站的网站流量的系统。
如图2所示,所述系统包括:监测代码生成装置201、监测代码嵌入装置202、子目录设置装置203以及流量统计装置204。
其中所述流量统计装置204优选地包括点击信息采集装置2041、点击信息发送装置2042、点击信息记录装置2043以及子目录流量统计装置2044。
所述子目录流量统计装置2044优选地包括访问来源流量统计装置20441和待监测元素点击流量统计装置20442。
下面将详细介绍所述系统的上述每个组成装置的具体功能及相互作用关系。
所述监测代码生成装置201用于生成一段监测代码,优选为JS代码。
所述监测代码嵌入装置202用于将所生成的该段监测代码嵌入到某网站的各待监控页面中。
所述子目录设置装置203用于设置至少一个页面子目录(例如但不限于图3所示的页面子目录),所述每个页面子目录的设置方式如前所述。此外,所述页面子目录优选地被存储在监测流量统计服务器的数据库中。
所述点击信息采集装置2041用于在访问者点击受监控页面时利用所述JS代码来采集访问者点击信息。所述访问者点击信息优选地包含访问者所点击的当前页面的URL地址、与访问者所处地域相关的访问者IP地址、访问者客户端浏览器信息、访问者客户端操作系统信息、本次访问所来源于的搜索引擎有关的信息(例如搜索引擎的URL地址或标识等)和/或本次访问所来源于的其他网站(优选为本次访问最初来源于的其他网站)的URL地址。
所述点击信息发送装置2042用于优选(但不限于)采用Ajax技术中的XML HttpRequest请求方法将JS代码采集的访问者点击信息发送至监测流量统计服务器。由于本发明对总网站下的所有子频道的各待监控页面均嵌入了完全相同的JS代码,所以将来该完全相同的JS代码会将收集到的各访问者点击信息存储到监测流量统计服务器中的与该总网站(例如http://www.baidu.com)对应的存储位置。
所述点击信息记录装置2043用于将所述访问者点击信息记录到涉及该访问者所点击的当前页面的页面子目录(即:与该被点击的当前页面的URL地址匹配的页面子目录,换言之,该当前页面的URL符合该页面子目录采用的正则表达式所限定的条件)中,例如,如果访问者点击了页面“http://news.baidu.com/n?cmd=1&class=housenews&pn=1&from=tab”,则点击信息记录装置2043将会将访问者点击信息记录到与该被点击页面的URL地址的前缀http://news.baidu.com匹配的那个页面子目录下,例如图3所示的第一个名为“百度新闻”的子目录中。
所述子目录流量统计装置2044用于实时或定期或者依照网络运营者等客户的具体需求来统计各页面子目录所涉及页面集合(优选为子频道)的访问者点击流量。例如,在对每个子目录进行点击流量统计时,可以采用计数器的方式,为每个子目录分配一个计数器。当要进行实时流量统计时,每次用户点击该子目录所涉及页面的事件都会使得该子目录所对应的计数器进行计数,这样可以获取实时信息,有助于网站运营者能更加及时准确地获取用于决策的信息。
此外,也可以对各页面子目录所涉及的子频道的点击流量进行分时段定期统计,此时可以预设置一个统计时段,例如5秒。在这5秒内,当不同的访问者点击各待统计流量的页面集合(优选为待统计流量的子频道)下的受监控页面时,先仅仅在与所点击页面相关的页面子目录下记录每次点击的页面的URL,而涉及该页面的子目录所对应的计数器不发生变化,当到了预设的进行统计的时刻时(例如5秒钟届满时),各子目录所对应的计数器才对该时间段内对该子目录所涉及的页面进行点击的数量进行统计和累加。
此外,如前所述,所述子目录流量统计装置2044还优选地包括访问来源流量统计装置20441和待监测元素点击流量统计装置20442。
所述访问来源流量统计装置20441优选地在预定子目录下针对不同的访问来源地域和/或不同的访问来源搜索引擎和/或不同的访问来源网站来分别进行流量统计,该流量统计是根据JS代码所采集到的详细访问者点击信息(如前所述,其中包括与访问者所处地域相关的访问者IP地址、本次访问所来源于的搜索引擎的相关信息和/或本次访问所来源于的其他网站(优选为最初来源于的网站)的URL地址)而进行的。
所述待监测元素点击流量统计装置20442优选地针对页面上的各待监测元素来分别进行点击流量统计。所述待监测元素可以是所述子网站网页上的任何按钮、链接、文本、图片和图标。
通过上文所述的流量统计方法和流量统计系统,可以使得网络运营者能够根据实际需要查看任何一个子频道本身的流量,或者任两个或两个以上子频道的整体流量;此外还使得对监测代码的管理变得很容易,而且不容易出错。
以上描述的仅仅是本发明的优选实施例,以便本领域技术人员能够实现或者使用本发明公开的内容。但是以上这些实施例并不是穷举的,对于本领域技术人员来说,对这些公开内容的各种修改都是显而易见的,并且本领域技术人员在本发明的精神和范围之内所得到的任何修改、变换、替换的技术方案均落入本发明的保护范围之内。此外,前述实施例中包含的各步骤、各部件之间的先后顺序只是优选的,而本发明并不仅限于此,本领域技术人员可以在不背离本发明精神的情况下对上述顺序进行调整,并且调整之后所得到的技术方案仍落入本发明的保护范围之内。

Claims (36)

1.一种统计网站流量的方法,所述网站包含多个页面,其特征在于所述方法包括如下步骤:
(1)生成一段监测代码;
(2)将所生成的一段监测代码嵌入到待监控页面中;
(3)设置至少一个页面子目录,其中每个页面子目录涉及至少一个待统计流量的页面集合;
(4)利用所述监测代码统计预定页面子目录下的流量,以获得该预定页面子目录所涉及的页面集合的总流量;
其中,所述步骤(3)在步骤(2)之后执行或在步骤(1)之前执行。
2.如权利要求1所述的方法,其特征在于,在所述页面子目录中采用正则表达式来设置所述页面集合。
3.如权利要求2所述的方法,其特征在于,使用通配符来设置所述页面集合。
4.如权利要求3所述的方法,其特征在于,所述通配符包括“*”字符和在正则表达式中表示“或”的字符。
5.如权利要求1-4之一所述的方法,其特征在于,所述页面集合为预定网站的预定子频道下的所有待监控页面的集合。
6.如权利要求1-4中任一项所述的方法,其特征在于,所述步骤(4)包括如下子步骤:
(4.1)当访问者点击待监控页面时,利用所述监测代码来采集访问者点击信息;
(4.2)将所述监测代码采集的访问者点击信息发送至监测流量统计服务器;
(4.3)将所述访问者点击信息记录到涉及该访问者所点击的当前页面的页面子目录中;
(4.4)统计预定页面子目录下的访问者点击流量。
7.如权利要求6所述的方法,其特征在于,所述访问者点击信息包含访问者所点击的当前页面的URL地址。
8.如权利要求7所述的方法,其特征在于,所述访问者点击信息还包括与访问者所处地域相关的访问者IP地址、和/或客户端浏览器信息、和/或客户端操作系统信息、和/或本次访问所来源于的搜索引擎有关的信息、和/或本次访问所来源于的其他网站的URL地址。
9.如权利要求8所述的方法,其特征在于,所述子步骤(4.4)包括针对不同的访问来源地域和/或不同的访问来源搜索引擎和/或不同的访问来源网站来分别进行预定页面子目录下的各统计维度的流量统计。
10.如权利要求6-9之一所述的方法,其特征在于,所述子步骤(4.4)包括针对待监控页面上的预定待监测元素分别进行点击流量统计。
11.如权利要求10所述的方法,其特征在于,所述待监测元素包括所述页面上的任何按钮、链接、文本、图片和图标。
12.如权利要求1-4之一所述的方法,其特征在于,所述监测代码为JavaScript代码。
13.如权利要求8所述的方法,其特征在于,所述本次访问所来源于的其他网站为本次访问最初来源于的网站。
14.如权利要求9所述的方法,其特征在于,所述访问来源网站为访问者所进行的本次访问最初来源于的网站。
15.如权利要求6所述的方法,其特征在于,所述步骤(4.3)包括将所述访问者点击信息记录到访问者所点击的待监控页面的URL地址所匹配的目标页面子目录中。
16.如权利要求15所述的方法,其特征在于,所述访问者所点击的待监控页面的URL地址符合所述目标页面子目录采用的正则多项式所限定的条件。
17.如权利要求6所述的方法,其特征在于,通过给每个页面子目录设置计数器来统计页面子目录下的访问者点击流量。
18.如权利要求17所述的方法,其特征在于,所述步骤(4.4)实时进行或定期进行。
19.一种统计网站流量的系统,所述网站包含多个页面,其特征在于所述系统包括:
用于生成一段监测代码的监测代码生成装置;
用于将所生成的一段监测代码嵌入到待监控页面中的监测代码嵌入装置;
用于设置至少一个页面子目录的子目录设置装置,其中每个页面子目录涉及至少一个待统计流量的页面集合;
用于利用所述监测代码统计预定页面子目录下的流量、以获得该预定页面子目录所涉及的页面集合的总流量的流量统计装置。
20.如权利要求19所述的系统,其特征在于,所述子目录设置装置在所述页面子目录中采用正则表达式来设置所述页面集合。
21.如权利要求20所述的系统,其特征在于,所述子目录设置装置使用通配符来设置所述页面集合。
22.如权利要求21所述的系统,其特征在于,所述通配符包括“*”字符和在正则表达式中表示“或”的字符。
23.如权利要求19-22之一所述的系统,其特征在于,所述页面集合为预定网站的预定子频道下的所有待监控页面的集合。
24.如权利要求19-22之一所述的系统,其特征在于,所述流量统计装置包括:
用于在访问者点击待监控页面时利用所述监测代码来采集访问者点击信息的点击信息采集装置;
用于将所述监测代码采集的访问者点击信息发送至监测流量统计服务器的点击信息发送装置;
用于将所述访问者点击信息记录到涉及该访问者所点击的当前页面的页面子目录中的点击信息记录装置;
用于统计预定页面子目录下的访问者点击流量的子目录流量统计装置。
25.如权利要求24所述的系统,其特征在于,所述访问者点击信息包含访问者所点击的当前页面的URL地址。
26.如权利要求25所述的系统,其特征在于,所述访问者点击信息还包括与访问者所处地域相关的访问者IP地址、和/或客户端浏览器信息、和/或客户端操作系统信息、和/或本次访问所来源于的搜索引擎有关的信息、和/或本次访问所来源于的其他网站的URL地址。
27.如权利要求26所述的系统,其特征在于,所述子目录流量统计装置包括用于针对不同的访问来源地域和/或不同的访问来源搜索引擎和/或不同的访问来源网站来分别进行预定页面子目录下的各统计维度的流量统计的访问来源流量统计装置。
28.如权利要求24所述的系统,其特征在于,所述子目录流量统计装置包括用于针对待监控页面上的预定待监测元素分别进行待监测元素点击流量统计的待监测元素点击流量统计装置。
29.如权利要求28所述的系统,其特征在于,所述待监测元素包括所述页面上的任何按钮、链接、文本、图片和图标。
30.如权利要求19-22之一所述的系统,其特征在于,所述监测代码为JavaScript代码。
31.如权利要求26所述的系统,其特征在于,所述本次访问所来源于的其他网站为本次访问最初来源于的网站。
32.如权利要求27所述的系统,其特征在于,所述访问来源网站为访问者所进行的本次访问最初来源于的网站。
33.如权利要求24所述的系统,其特征在于,所述点击信息记录装置将所述访问者点击信息记录到访问者所点击的待监控页面的URL地址所匹配的目标页面子目录中。
34.如权利要求33所述的系统,其特征在于,所述访问者所点击的待监控页面的URL地址符合所述目标页面子目录采用的正则多项式所限定的条件。
35.如权利要求24所述的系统,其特征在于,所述子目录流量统计装置通过给每个页面子目录设置计数器来统计页面子目录下的访问者点击流量。
36.如权利要求35所述的系统,其特征在于,所述子目录流量统计装置实时或定期统计页面子目录下的访问者点击流量。
CN201010248711.2A 2010-08-09 统计网站流量的方法及系统 Active CN102377583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010248711.2A CN102377583B (zh) 2010-08-09 统计网站流量的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010248711.2A CN102377583B (zh) 2010-08-09 统计网站流量的方法及系统

Publications (2)

Publication Number Publication Date
CN102377583A true CN102377583A (zh) 2012-03-14
CN102377583B CN102377583B (zh) 2016-12-14

Family

ID=

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663049A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种更新搜索引擎网址库方法及装置
CN102663054A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种确定网站权重的方法及装置
CN103593446A (zh) * 2013-11-18 2014-02-19 北京国双科技有限公司 流量质量分析方法及装置
CN104123311A (zh) * 2013-04-28 2014-10-29 腾讯科技(深圳)有限公司 一种数据流量提示方法及装置
CN104301148A (zh) * 2014-10-27 2015-01-21 北京金和软件股份有限公司 一种基于网站访问的用户行为记录方法
CN104639565A (zh) * 2015-03-06 2015-05-20 成都维远艾珏信息技术有限公司 一种从服务器访问资源的方法
CN105187451A (zh) * 2015-10-09 2015-12-23 携程计算机技术(上海)有限公司 网站流量异常检测方法及系统
CN105607987A (zh) * 2015-12-17 2016-05-25 无锡天脉聚源传媒科技有限公司 一种访问量统计方法及装置
CN103530393B (zh) * 2013-10-22 2016-10-19 北京奇虎科技有限公司 确定网站子频道抓取流量配额的方法及设备
CN106341395A (zh) * 2016-08-12 2017-01-18 商客通尚景科技(上海)股份有限公司 一种网站来源分析系统
CN106817271A (zh) * 2015-11-30 2017-06-09 阿里巴巴集团控股有限公司 流量图谱的形成方法和装置
CN106874300A (zh) * 2015-12-14 2017-06-20 北京国双科技有限公司 网页识别方法及装置和设置率确定方法和装置
CN106911636A (zh) * 2015-12-22 2017-06-30 北京奇虎科技有限公司 一种检测网站是否存在后门程序的方法及装置
CN106911635A (zh) * 2015-12-22 2017-06-30 北京奇虎科技有限公司 一种检测网站是否存在后门程序的方法及装置
CN108121729A (zh) * 2016-11-29 2018-06-05 北京京东尚科信息技术有限公司 一种基于页面标题的网页流量数据的统计方法及装置
CN108491315A (zh) * 2018-03-16 2018-09-04 五八有限公司 页面驻留时长的统计方法、装置及计算机可读存储介质
CN109597743A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 页面圈选方法、点击量统计方法及相关设备
CN110020238A (zh) * 2017-09-18 2019-07-16 北京国双科技有限公司 点击事件数据采集方法、装置及系统
CN112929237A (zh) * 2021-02-26 2021-06-08 携程旅游网络技术(上海)有限公司 网站细分流量的分析方法、系统、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159592A (zh) * 2007-08-10 2008-04-09 北大方正集团有限公司 互联网数据信息点击量的统计方法和装置
CN101291337A (zh) * 2008-05-30 2008-10-22 同济大学 一种网格资源管理系统及管理方法
US20100039957A1 (en) * 2008-08-14 2010-02-18 Verizon Corporate Services Group Inc. System and method for monitoring and analyzing network traffic

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159592A (zh) * 2007-08-10 2008-04-09 北大方正集团有限公司 互联网数据信息点击量的统计方法和装置
CN101291337A (zh) * 2008-05-30 2008-10-22 同济大学 一种网格资源管理系统及管理方法
US20100039957A1 (en) * 2008-08-14 2010-02-18 Verizon Corporate Services Group Inc. System and method for monitoring and analyzing network traffic

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663049B (zh) * 2012-03-29 2015-11-25 天津奇思科技有限公司 一种更新搜索引擎网址库方法及装置
CN102663054A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种确定网站权重的方法及装置
CN102663049A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种更新搜索引擎网址库方法及装置
CN104123311B (zh) * 2013-04-28 2019-01-29 腾讯科技(深圳)有限公司 一种数据流量提示方法及装置
CN104123311A (zh) * 2013-04-28 2014-10-29 腾讯科技(深圳)有限公司 一种数据流量提示方法及装置
CN103530393B (zh) * 2013-10-22 2016-10-19 北京奇虎科技有限公司 确定网站子频道抓取流量配额的方法及设备
CN103593446A (zh) * 2013-11-18 2014-02-19 北京国双科技有限公司 流量质量分析方法及装置
WO2015070735A1 (zh) * 2013-11-18 2015-05-21 北京国双科技有限公司 流量质量分析方法及装置
CN104301148A (zh) * 2014-10-27 2015-01-21 北京金和软件股份有限公司 一种基于网站访问的用户行为记录方法
CN104639565B (zh) * 2015-03-06 2017-11-10 成都维远艾珏信息技术有限公司 一种从服务器访问资源的方法
CN104639565A (zh) * 2015-03-06 2015-05-20 成都维远艾珏信息技术有限公司 一种从服务器访问资源的方法
CN105187451A (zh) * 2015-10-09 2015-12-23 携程计算机技术(上海)有限公司 网站流量异常检测方法及系统
CN105187451B (zh) * 2015-10-09 2018-10-09 携程计算机技术(上海)有限公司 网站流量异常检测方法及系统
CN106817271B (zh) * 2015-11-30 2020-05-22 阿里巴巴集团控股有限公司 流量图谱的形成方法和装置
CN106817271A (zh) * 2015-11-30 2017-06-09 阿里巴巴集团控股有限公司 流量图谱的形成方法和装置
CN106874300B (zh) * 2015-12-14 2020-05-22 北京国双科技有限公司 网页识别方法及装置和设置率确定方法和装置
CN106874300A (zh) * 2015-12-14 2017-06-20 北京国双科技有限公司 网页识别方法及装置和设置率确定方法和装置
CN105607987B (zh) * 2015-12-17 2018-07-20 无锡天脉聚源传媒科技有限公司 一种访问量统计方法及装置
CN105607987A (zh) * 2015-12-17 2016-05-25 无锡天脉聚源传媒科技有限公司 一种访问量统计方法及装置
CN106911635B (zh) * 2015-12-22 2020-07-28 北京奇虎科技有限公司 一种检测网站是否存在后门程序的方法及装置
CN106911636B (zh) * 2015-12-22 2020-09-04 北京奇虎科技有限公司 一种检测网站是否存在后门程序的方法及装置
CN106911636A (zh) * 2015-12-22 2017-06-30 北京奇虎科技有限公司 一种检测网站是否存在后门程序的方法及装置
CN106911635A (zh) * 2015-12-22 2017-06-30 北京奇虎科技有限公司 一种检测网站是否存在后门程序的方法及装置
CN106341395B (zh) * 2016-08-12 2019-12-13 商客通尚景科技(上海)股份有限公司 一种网站来源分析系统
CN106341395A (zh) * 2016-08-12 2017-01-18 商客通尚景科技(上海)股份有限公司 一种网站来源分析系统
CN108121729A (zh) * 2016-11-29 2018-06-05 北京京东尚科信息技术有限公司 一种基于页面标题的网页流量数据的统计方法及装置
CN110020238A (zh) * 2017-09-18 2019-07-16 北京国双科技有限公司 点击事件数据采集方法、装置及系统
CN109597743A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 页面圈选方法、点击量统计方法及相关设备
CN108491315A (zh) * 2018-03-16 2018-09-04 五八有限公司 页面驻留时长的统计方法、装置及计算机可读存储介质
CN108491315B (zh) * 2018-03-16 2021-11-23 五八有限公司 页面驻留时长的统计方法、装置及计算机可读存储介质
CN112929237A (zh) * 2021-02-26 2021-06-08 携程旅游网络技术(上海)有限公司 网站细分流量的分析方法、系统、设备和介质

Similar Documents

Publication Publication Date Title
US10382573B2 (en) Method for click-stream analysis using web directory reverse categorization
CN101079768B (zh) 一种统计网页链接点击数据的方法
US8386561B2 (en) Method and system for identifying website visitors
KR100377515B1 (ko) 인터넷광고 관리방법 및 이를 위한 시스템
US8326986B2 (en) System and method for analyzing web paths
US20020147570A1 (en) System and method for monitoring the interaction of randomly selected users with a web domain
CN102314455A (zh) 计算网页点击流量的方法及系统
CN102663062A (zh) 一种处理搜索结果中无效链接的方法及装置
CN103984762A (zh) 内容呈现控制系统和方法
CN102571404A (zh) 网站访问统计方法和网站访问统计系统
US20050021731A1 (en) Traffic flow analysis method
KR20120000638A (ko) 만년력 형태의 웹문서 트랩 검출 및 이를 이용한 검색 데이터베이스 구축 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
CN112486708B (zh) 页面操作数据的处理方法和处理系统
Zhu et al. A random digit search (RDS) method for sampling of blogs and other user-generated content
CN101382947A (zh) 在页面中确定点击分布信息的方法和装置
CN101046806B (zh) 搜索引擎系统和方法
US20120166961A1 (en) Method and system for presenting a navigation path for enabling retrieval of content
CN102663049B (zh) 一种更新搜索引擎网址库方法及装置
Lakshmi et al. An overview of preprocessing on web log data for web usage analysis
CN104391953B (zh) 检测网页更新的方法及装置
Kleppe et al. Analysing and understanding news consumption patterns by tracking online user behaviour with a multimodal research design
Reddy et al. Preprocessing the web server logs: an illustrative approach for effective usage mining
CN106557584A (zh) 一种网址收藏方法及装置
CN107526748B (zh) 一种识别用户点击行为的方法和设备
CN108416057A (zh) 一种网站行为分析系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant