CN103312785A - 一种访问关系的确定方法及装置 - Google Patents

一种访问关系的确定方法及装置 Download PDF

Info

Publication number
CN103312785A
CN103312785A CN2013101823247A CN201310182324A CN103312785A CN 103312785 A CN103312785 A CN 103312785A CN 2013101823247 A CN2013101823247 A CN 2013101823247A CN 201310182324 A CN201310182324 A CN 201310182324A CN 103312785 A CN103312785 A CN 103312785A
Authority
CN
China
Prior art keywords
page
user
visit
undetermined
journal file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101823247A
Other languages
English (en)
Other versions
CN103312785B (zh
Inventor
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sina Technology China Co Ltd
Original Assignee
Sina Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sina Technology China Co Ltd filed Critical Sina Technology China Co Ltd
Priority to CN201310182324.7A priority Critical patent/CN103312785B/zh
Publication of CN103312785A publication Critical patent/CN103312785A/zh
Application granted granted Critical
Publication of CN103312785B publication Critical patent/CN103312785B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本申请公开了一种访问关系的确定方法及装置,用以解决现有技术中在确定页面访问关系过程中所导致的页面的加载速度较低的问题。该方法网站服务器提取自身保存的日志文件,并根据日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系。通过上述方法,网站服务器可基于保存的日志文件在后台确定页面的访问关系,而无需通过在前台展示的页面中添加第三方代码来确定访问关系,因此可解决现有技术中在确定页面访问关系过程中所导致的页面的加载速度较低的问题,有效提高页面的加载速度。

Description

一种访问关系的确定方法及装置
技术领域
本申请涉及通信技术领域,特别涉及一种访问关系的确定方法及装置。
背景技术
目前,对于一个页面来说,为了更好的规划该网页,需要获知该页面的访问关系,即:各用户访问该页面时,是从哪个页面跳转到该页面的,访问该页面后,又从该页面跳转到了哪个页面。
在现有技术中,确定一个页面的访问关系的方法为:在该页面中添加第三方代码,通过添加的第三方代码监控各用户对该页面的访问情况,以确定该页面的访问关系。
但是,由于现有技术中在确定一个页面的访问关系时需要在页面中添加额外的第三方代码,因此会降低页面的加载速度。
发明内容
本发明实施例提供一种访问关系的确定方法及装置,用以解决现有技术中在确定页面访问关系过程中所导致的页面的加载速度较低的问题。
本发明实施例提供的一种访问关系的确定方法,包括:
网站服务器提取自身保存的日志文件;并
根据提取的所述日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系,其中,所述待定页面为所述日志文件记录的各页面中的任意页面。
本发明实施例提供的一种访问关系的确定装置,包括:
第一存储模块,用于保存日志文件;
提取模块,用于提取所述第一存储模块保存的日志文件;
确定模块,用于根据所述提取模块提取的所述日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系,其中,所述待定页面为所述日志文件记录的各页面中的任意页面。
本发明实施例提供一种访问关系的确定方法及装置,该方法网站服务器提取自身保存的日志文件,并根据日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系。通过上述方法,网站服务器可基于保存的日志文件在后台确定页面的访问关系,而无需通过在前台展示的页面中添加第三方代码来确定访问关系,因此可解决现有技术中在确定页面访问关系过程中所导致的页面的加载速度较低的问题,有效提高页面的加载速度。
附图说明
图1为本发明实施例提供的访问关系的确定过程;
图2为本发明实施例提供的访问关系的确定装置结构示意图。
具体实施方式
为了在不影响页面加载速度的同时,确定出页面的访问关系,本发明实施例通过网站服务器在后台确定访问关系,无需在前台展示的页面中添加第三方代码,即可确定出页面的访问关系,又可有效提高页面的加载速度。
下面结合附图对本申请优选的实施方式进行详细说明。
图1为本发明实施例提供的访问关系的确定过程,具体包括以下步骤:
S101:网站服务器提取自身保存的日志文件。
在本发明实施例中,网站服务器在确定一个页面(以下将待确定访问关系的页面称为待定页面)的日志文件时,先提取自身保存的日志文件。其中,网站服务器的日志文件中记录了每个访问该网站服务器的用户所访问的各页面,以及每个用户访问各页面的顺序。
例如,假设该网站服务器共提供了页面A、页面B、页面C这三个页面,用户要访问这三个页面中的任何一个时,都需要访问该网站服务器,则网站服务器对于访问自身的每个用户,记录该用户访问的各页面,以及访问各页面的顺序,并将该用户的标识信息,以及记录的该用户访问的各页面、访问各页面的顺序保存在日志文件中。
具体的,记录在日志文件中的用户的标识信息包括但不限于该用户的识别码(IDentity,ID)、该用户访问页面时所采用的互联网协议(Internet Protocol,IP)地址、该用户访问页面时所采用的终端的媒体接入控制层(Media AccessControl,MAC)地址等。记录用户所访问的页面具体可以是:记录用户所访问的页面的统一资源定位符(Uniform Resource Locator,URL)。记录用户访问各页面的顺序可以是:按照用户访问各页面的时间先后顺序,依次记录用户访问的各页面。具体的日志文件可以如表1所示。
用户ID 第1个访问的页面 第2个访问的页面 第3个访问的页面
U1 页面B 页面A 页面C
U2 页面A 页面C 页面C
U3 页面C 页面B 页面A
U4 页面B 页面A 页面C
表1
在表1所示的日志文件中,每一行是针对一个用户记录的该用户访问的各页面,表1的各列按从左到右的顺序就是用户访问各页面的顺序。
S102:根据提取的日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系。
其中,该待定页面为日志文件中记录的各页面中的任意一个或几个页面。
在本发明实施例中,由于网站服务器自身保存的日志文件中记录了每个用户访问的各页面,以及每个用户访问各页面的顺序,因此,网站服务器针对待定页面,可根据提取的自身保存的日志文件,确定每个用户在访问该待定页面时,是从哪个页面跳转到该待定页面的,访问该待定页面后,又从该待定页面跳转到了哪个页面。
具体的,在确定待定页面的访问关系时,网站服务器可针对每个用户,根据提取的日志文件中记录的该用户访问的各页面,以及该用户访问各页面的顺序,确定该用户访问待定页面之前访问的最后一个页面(即,该用户在访问待定页面时,是从确定的该最后一个页面跳转到待定页面的),以及该用户访问待定页面之后访问的第一个页面(即,该用户在访问待定页面后,从该待定页面又跳转到了确定的该第一个页面),作为该用户访问该待定页面的访问路径,并根据确定的每个用户访问该待定页面的访问路径,确定该待定页面的访问关系。
另外,如果网站服务器针对一个用户,确定该用户访问待定页面之前并未访问任何页面,则将该用户访问待定页面之前访问的最后一个页面记录为“用户进入”。相应的,如果网站服务器针对一个用户,确定该用户访问待定页面之后并未访问任何页面,则将该用户访问待定页面之后访问的第一个页面记录为“用户离开”。
以表1为例,假设待定页面为页面A,则网站服务器针对用户U1,根据表1所示的日志文件可确定用户U1访问页面A之前访问的最后一个页面为页面B,用户U1访问页面A之后访问的第一个页面为页面C,因此,可确定用户U1的访问路径为页面B→页面C(实际上是:页面B→页面A→页面C)。
针对用户U2,网站服务器可确定用户U2访问页面A之前未访问任何页面,用户U2访问页面A之后访问的第一个页面为页面C,因此,可确定用户U2的访问路径为“用户进入”→页面C(实际上是:“用户进入”→页面A→页面C)。
针对用户U3,网站服务器可确定用户U3访问页面A之前访问的最后一个页面为页面B,用户U3访问页面A之后未访问任何页面为,因此,可确定用户U3的访问路径为页面B→“用户离开”(实际上是:页面B→页面A→“用户离开”)。
针对用户U4,由表1可见,用户U4与用户U1访问的各页面以及访问顺序均相同,因此网站服务器确定用户U4的访问路径也与用户U1的访问路径相同,即为页面B→页面C。
网站服务器确定的上述各用户的访问路径如表2所示。
Figure BDA00003202678100051
表2
由于根据上述表2中记录的每个用户访问页面A(待定页面)的访问路径,已经可以确定该页面A的访问关系,因此,网站服务器可直接将确定的每个用户访问待定页面的访问路径作为确定的该待定页面的访问关系,并存储在本地。
通过上述方法,网站服务器可根据保存的日志文件,在后台确定待定页面的访问关系,而无需通过在前台展示的页面中添加的第三方代码确定访问关系,因此可以在确定出页面访问关系的同时,有效提高页面的加载速度。
而且,由于现有技术中通过在页面中添加的第三方代码确定页面的访问关系时,第三方代码还要将确定出的访问关系通过网络发送到专门的存储服务器进行存储,而网络很有可能会出现波动,因此会导致确定出的访问关系在发送过程中出现数据丢失。而通过本发明实施例提供的上述方法,网站服务器可在后台确定访问关系,并直接存储在本地,无需通过网络发送给专门的存储服务器,因此节省了网络资源,也不会因网络的波动而出现数据丢失,也无需专门的存储服务器,节省了设备资源。
较佳的,由于确定出的如表2所示的各用户的访问路径是基于用户的,每个用户至少会有一条访问路径,因此,如果网站服务器直接将如表2所示的用户访问待定页面的访问路径作为待定页面的访问关系存储,会耗费较多的存储资源。本发明实施例中为了节省网站服务器存储访问关系所耗费的存储资源,在确定出每个用户访问待定页面的访问路径后,可根据确定的每个用户访问待定页面的访问路径,统计相同的访问路径的数量,并将确定的各访问路径以及统计的相同的访问路径的数量,确定为该待定页面的访问关系。
以表2为例,在确定出如表2所示的用户U1~U4访问页面A(待定页面)的访问路径后,网站服务器可统计相同的访问路径的数量。具体的,用户U1和U4的访问路径均为“页面B→页面C”,因此访问路径“页面B→页面C”的数量为2,其他的访问路径的数量均为1,从而可得到如表3所示的页面A的访问关系。
Figure BDA00003202678100061
表3
由表3可见,相对于表2而言,表3的数据量要小于表2的数据量,因此,网络服务器存储将如表3所示的访问关系,可有效减小耗费的存储资源。
进一步的,还可预先在网站服务器中预先针对各待定页面设定相应的存储空间,网站服务器采用上述方法确定了一个待定页面的访问关系后,则可将确定的该待定页面的访问关系保存在预先针对该待定页面设定的存储空间中。
另外,在本发明实施例中,在图1所示的步骤S101中,网站服务器可按照设定的周期,提取自身保存的当前周期内生成的日志文件,并执行后续的步骤S102,也即,网站服务器可按照设定的周期,周期性的确定各待定页面的访问关系。
以上为本发明实施例提供的访问关系的确定方法,基于同样的发明思路,本发明实施例还提供一种访问关系的确定装置,如图2所示。
图2为本发明实施例提供的访问关系的确定装置结构示意图,具体包括:
第一存储模块201,用于保存日志文件;
提取模块202,用于提取所述第一存储模块201保存的日志文件;
确定模块203,用于根据所述提取模块提取的所述日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系,其中,所述待定页面为所述日志文件记录的各页面中的任意页面。
所述确定模块203具体用于,针对每个用户,根据所述提取模块202提取的所述日志文件中记录的该用户访问的各页面,以及该用户访问各页面的访问顺序,确定该用户访问所述待定页面之前访问的最后一个页面,以及该用户访问所述待定页面之后访问的第一个页面,作为该用户访问所述待定页面的访问路径;根据确定的每个用户访问所述待定页面的访问路径,确定所述待定页面的访问关系。
所述确定模块203具体用于,根据确定的每个用户访问所述待定页面的访问路径,统计相同的访问路径的数量,并将确定的各访问路径以及统计的相同的访问路径的数量,确定为所述待定页面的访问关系。
所述装置还包括:
第二存储模块204,用于将所述确定模块203确定的所述待定页面的访问关系保存在预先针对所述待定页面设定的存储空间中。
所述提取模块202具体用于,按照设定的周期,提取所述第一存储模块201保存的当前周期内生成的日志文件。
具体的上述访问关系的确定装置可以位于网站服务器中。
本发明实施例提供一种访问关系的确定方法及装置,该方法网站服务器提取自身保存的日志文件,并根据日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系。通过上述方法,网站服务器可基于保存的日志文件在后台确定页面的访问关系,而无需通过在前台展示的页面中添加第三方代码来确定访问关系,因此可解决现有技术中在确定页面访问关系过程中所导致的页面的加载速度较低的问题,有效提高页面的加载速度。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种访问关系的确定方法,其特征在于,包括:
网站服务器提取自身保存的日志文件;并
根据提取的所述日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系,其中,所述待定页面为所述日志文件记录的各页面中的任意页面。
2.如权利要求1所述的方法,其特征在于,根据提取的所述日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系,具体包括:
所述网站服务器针对每个用户,根据提取的所述日志文件中记录的该用户访问的各页面,以及该用户访问各页面的顺序,确定该用户访问所述待定页面之前访问的最后一个页面,以及该用户访问所述待定页面之后访问的第一个页面,作为该用户访问所述待定页面的访问路径;并
根据确定的每个用户访问所述待定页面的访问路径,确定所述待定页面的访问关系。
3.如权利要求2所述的方法,其特征在于,根据确定的每个用户访问所述待定页面的访问路径,确定所述待定页面的访问关系,具体包括:
所述网站服务器根据确定的每个用户访问所述待定页面的访问路径,统计相同的访问路径的数量;并
将确定的各访问路径以及统计的相同的访问路径的数量,确定为所述待定页面的访问关系。
4.如权利要求1~3任一所述的方法,其特征在于,所述方法还包括:
所述网站服务器将确定的所述待定页面的访问关系保存在预先针对所述待定页面设定的存储空间中。
5.如权利要求1所述的方法,其特征在于,网站服务器提取自身保存的日志文件,具体包括:
所述网站服务器按照设定的周期,提取自身保存的当前周期内生成的日志文件。
6.一种访问关系的确定装置,其特征在于,包括:
第一存储模块,用于保存日志文件;
提取模块,用于提取所述第一存储模块保存的日志文件;
确定模块,用于根据所述提取模块提取的所述日志文件中记录的每个用户访问的各页面,以及每个用户访问各页面的顺序,确定待定页面的访问关系,其中,所述待定页面为所述日志文件记录的各页面中的任意页面。
7.如权利要求6所述的装置,其特征在于,所述确定模块具体用于,针对每个用户,根据所述提取模块提取的所述日志文件中记录的该用户访问的各页面,以及该用户访问各页面的访问顺序,确定该用户访问所述待定页面之前访问的最后一个页面,以及该用户访问所述待定页面之后访问的第一个页面,作为该用户访问所述待定页面的访问路径;根据确定的每个用户访问所述待定页面的访问路径,确定所述待定页面的访问关系。
8.如权利要求7所述的装置,其特征在于,所述确定模块具体用于,根据确定的每个用户访问所述待定页面的访问路径,统计相同的访问路径的数量,并将确定的各访问路径以及统计的相同的访问路径的数量,确定为所述待定页面的访问关系。
9.如权利要求6~8任一所述的装置,其特征在于,所述装置还包括:
第二存储模块,用于将所述确定模块确定的所述待定页面的访问关系保存在预先针对所述待定页面设定的存储空间中。
10.如权利要求6所述的装置,其特征在于,所述提取模块具体用于,按照设定的周期,提取所述第一存储模块保存的当前周期内生成的日志文件。
CN201310182324.7A 2013-05-16 2013-05-16 一种访问关系的确定方法及装置 Active CN103312785B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310182324.7A CN103312785B (zh) 2013-05-16 2013-05-16 一种访问关系的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310182324.7A CN103312785B (zh) 2013-05-16 2013-05-16 一种访问关系的确定方法及装置

Publications (2)

Publication Number Publication Date
CN103312785A true CN103312785A (zh) 2013-09-18
CN103312785B CN103312785B (zh) 2016-10-26

Family

ID=49137563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310182324.7A Active CN103312785B (zh) 2013-05-16 2013-05-16 一种访问关系的确定方法及装置

Country Status (1)

Country Link
CN (1) CN103312785B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426363A (zh) * 2014-05-26 2016-03-23 阿里巴巴集团控股有限公司 一种确定分享转化信息的方法与设备
CN106657047A (zh) * 2016-12-14 2017-05-10 北京启明星辰信息安全技术有限公司 一种网络访问关系的生成方法及装置
CN106897297A (zh) * 2015-12-17 2017-06-27 北京国双科技有限公司 网站栏目间访问路径的确定方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030074400A1 (en) * 2001-03-30 2003-04-17 David Brooks Web user profiling system and method
CN102054004A (zh) * 2009-11-04 2011-05-11 清华大学 一种网页推荐方法和装置
CN102446222A (zh) * 2011-12-22 2012-05-09 华为技术有限公司 一种网页内容预加载方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030074400A1 (en) * 2001-03-30 2003-04-17 David Brooks Web user profiling system and method
CN102054004A (zh) * 2009-11-04 2011-05-11 清华大学 一种网页推荐方法和装置
CN102446222A (zh) * 2011-12-22 2012-05-09 华为技术有限公司 一种网页内容预加载方法、装置及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426363A (zh) * 2014-05-26 2016-03-23 阿里巴巴集团控股有限公司 一种确定分享转化信息的方法与设备
CN106897297A (zh) * 2015-12-17 2017-06-27 北京国双科技有限公司 网站栏目间访问路径的确定方法及装置
CN106657047A (zh) * 2016-12-14 2017-05-10 北京启明星辰信息安全技术有限公司 一种网络访问关系的生成方法及装置

Also Published As

Publication number Publication date
CN103312785B (zh) 2016-10-26

Similar Documents

Publication Publication Date Title
CN104426713B (zh) 网络站点访问效果数据的监测方法和装置
CN105446750B (zh) WebApp启动运行、生成镜像文件的方法和装置
CN104104717A (zh) 投放渠道数据统计方法及装置
CN103488732A (zh) 一种静态页面生成方法及装置
CN103368986A (zh) 一种信息推荐方法及信息推荐装置
CN109359263B (zh) 一种用户行为特征提取方法及系统
CN104113576A (zh) 一种客户端的更新方法及装置
CN104809116A (zh) 一种收藏内容的方法、装置及终端
CN111258978A (zh) 一种数据存储的方法
CN107707404A (zh) 网站在线人数统计方法、装置和网站服务器
CN107463422A (zh) 代码部署方法及装置、电子设备
CN103235811A (zh) 一种数据存储方法及装置
CN103312785A (zh) 一种访问关系的确定方法及装置
CN104778252A (zh) 索引的存储方法和装置
CN103034655A (zh) 一种用户行为信息的收集方法、系统及相关设备
CN103927355A (zh) 广告拦截方法、装置及系统
CN104750824A (zh) 应用功能数据的处理方法及装置
CN102708195B (zh) 一种表单数据共享方法及装置
CN110851758B (zh) 一种网页访客数量统计方法及装置
CN104915376A (zh) 一种云存储中文件的归档压缩方法
CN106464974A (zh) 经由多个网络连接请求媒体内容片段
CN104219271A (zh) 基于多线程异步下载页面的多服务器同步方法
CN102685716A (zh) 时间信息获取方法及移动终端
CN104750717A (zh) 一种点击量记录方法、服务器及客户端
CN109597743A (zh) 页面圈选方法、点击量统计方法及相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230418

Address after: Room 501-502, 5/F, Sina Headquarters Scientific Research Building, Block N-1 and N-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193

Patentee after: Sina Technology (China) Co.,Ltd.

Address before: 100080, International Building, No. 58 West Fourth Ring Road, Haidian District, Beijing, 20 floor

Patentee before: Sina.com Technology (China) Co.,Ltd.