CN103078910B - 一种网页分割的方法及装置 - Google Patents

一种网页分割的方法及装置 Download PDF

Info

Publication number
CN103078910B
CN103078910B CN201210579176.8A CN201210579176A CN103078910B CN 103078910 B CN103078910 B CN 103078910B CN 201210579176 A CN201210579176 A CN 201210579176A CN 103078910 B CN103078910 B CN 103078910B
Authority
CN
China
Prior art keywords
http message
message
address
source
http
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210579176.8A
Other languages
English (en)
Other versions
CN103078910A (zh
Inventor
郑国东
黄龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210579176.8A priority Critical patent/CN103078910B/zh
Publication of CN103078910A publication Critical patent/CN103078910A/zh
Application granted granted Critical
Publication of CN103078910B publication Critical patent/CN103078910B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明适用于互联网技术领域,提供了一种网页分割的方法及装置,所述方法包括:获取客户端发送的超文本传输协议HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作;判断所述HTTP报文中源网际协议IP地址相同的HTTP报文所携带的操作标识是否相同;若所述源IP地址相同的HTTP报文携带的操作标识相同,则确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文。通过本发明可有效提高网页分割的效率和准确率。

Description

一种网页分割的方法及装置
技术领域
本发明属于互联网技术领域,尤其涉及一种网页分割的方法及装置。
背景技术
网页分割技术是指将一次网页点击操作产生的多个HTTP(HypertextTransportProtocol,超文本传送协议)报文(GET报文或POST报文)关联起来的技术,通过这种技术,可以区分对不同网页所进行的点击操作或者对同一网页所进行的不同的点击操作。
现有技术一般通过时间戳对网页进行分割。具体地,监控中心通过采集探针获取客户端发送的HTTP报文后,把所述HTTP报文中源IP地址相同的HTTP报文按照时间戳(例如,获取HTTP报文时的时间戳)进行排序,若两个相邻的HTTP报文之间的时间差(即两个HTTP报文的时间戳之间的时间间隔)小于第一预设阈值(例如,2秒),则确定这两个相邻的HTTP报文是同一次点击操作生成的报文;若这两个相邻的HTTP报文之间的时间差大于第二预设阈值(例如,5秒),则确定这两个相邻的HTTP报文不是同一次点击操作所生成的报文;若这两个相邻的HTTP报文之间的时间差在第一预设阈值与第二预设阈值之间,则需要进一步判断这两个相邻的HTTP报文的参考(Reference)地址、主机(Host)地址以及通用资源标识符(UniformResourceIdentifier,URI)地址是否相同,如果相同,则确定这两个相邻的HTTP报文是同一次点击操作所生成的报文。
然而,现有技术存在以下问题:1)采用时间差的方式判断HTTP报文是否是同一次点击操作所生产的报文是不准确的,现在很多的智能终端(例如四核智能手机等)都可以并行打开多个浏览器窗口,用户有可能在相距很短的时间进行多次点击操作,根据时间差来判断是否为同一次点击操作生成的网页不够准确;2)现有技术中,同一网页中的各个关系对象(例如图片、音视频等)的Reference地址、Host地址或URI地址有可能是不同的,因此通过Reference地址、Host地址以及URI地址来判断HTTP报文是否是同一次点击操作所生成的报文也不够准确。
发明内容
本发明实施例的目的在于提供一种网页分割的方法,以便监控中心能够准确地对网页进行分割。
第一方面,一种网页分割的方法,所述方法包括:
获取客户端发送的超文本传输协议HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作;
判断所述HTTP报文中源网际协议IP地址相同的HTTP报文所携带的操作标识是否相同;
若所述源IP地址相同的HTTP报文携带的操作标识相同,则确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文。
在第一方面的第一种可能的实现方式中,所述方法还包括:
若所述源IP地址相同的HTTP报文携带的操作标识不同,则确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。
结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,在所述判断所述HTTP报文中源IP地址相同的HTTP报文所携带的操作标识是否相同之前,所述方法还包括:
根据源IP地址,对所述客户端发送的HTTP报文进行分类。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,在所述根据源IP地址,对所述客户端发送的HTTP报文进行分类之后,所述方法还包括:
按照时间戳的大小,对分类后的HTTP报文进行排序,其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳。
结合第一方面或第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式或第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述HTTP报文包括GET报文或POST报文。
第二方面,一种网页分割的装置,所述装置包括:
报文获取单元,用于获取客户端发送的超文本传输协议HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作;
判断单元,用于判断所述报文获取单元获取的HTTP报文中源网际协议IP地址相同的HTTP报文所携带的操作标识是否相同;
确定单元,用于在所述判断单元判断结果为是时,确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文。
在第二方面的第一种可能的实现方式中,所述确定单元还用于在所述判断单元判断结果为否时,确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。
结合第二方面或第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述装置还包括:
分类单元,用于在所述判断单元进行判断之前,根据源IP地址,对所述客户端发送的HTTP报文进行分类。
结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述装置还包括:
排序单元,用于按照时间戳的大小,对所述分类单元分类后的HTTP报文进行排序,其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳。
结合第二方面或第二方面的第一种可能的实现方式或第二方面的第二种可能的实现方式或第二方面的第三种可能的实现方式,在第四种可能的实现方式中,所述HTTP报文包括GET报文或POST报文。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例根据HTTP报文携带的操作标识,即可判断源IP地址相同的HTTP报文是否为同一次点击操作所生成的报文。本发明实施例无需分析相邻两个HTTP报文的时间差,不用根据时间差来判断是否为同一次点击操作生成的页面;也不用根据Reference地址、Host地址、URI地址是否相同来判断是否为同一次点击操作生成的页面;减少了判断的步骤,提高了网页分割的效率。而且,由于每次不同的点击操作,所产生的操作标识都不同,通过比较操作标识可以准确确定当前网页是否为同一次点击操作生成的网页,从而可以有效保证网页分割的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的网页分割的系统架构图;
图2是本发明一实施例提供的网页分割方法的实现流程图;
图3是本发明一实施例提供的网页分割方法的具体流程图;
图4是本发明一实施例提供的网页分割装置的组成结构图;
图5是本发明一实施例提供的网页分割装置的组成结构图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透切理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
本发明实施例中术语“系统”和“网络”在本文中常可被互换使用。
图1为本发明实施例提供的一种网页分割的系统架构图。其中,所述系统包括客户端1、探针2以及监控中心3;
所述客户端1、探针2以及监控中心3通过有线或者无线的方式连接通信。
其中,所述客户端1可以是任意具有网络接入功能的终端设备,包括但不限于手机、平板电脑、台式机、笔记本电脑等。
所述探针2为具有数据采集和数据处理能力的接口探针,例如SGSN(ServingGeneralPacketRadioSystemSupportNode,通用分组无线系统业务支撑节点)与GGSN(GatewayGeneralPacketRadioSystemSupportNode,网关通用分组无线系统支持节点)之间的接口探针。
所述监控中心3可以包括至少一个服务器。
在本实施例中,所述客户端1在超文本传输协议(Hypertexttransferprotocol,HTTP)报文的头域增加一个操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作。其中,该操作标识可以命名为UA-BWID。所述操作标识通过客户端的浏览器分配,客户端1在检测到用户在网页上的点击操作时,会通过浏览器为相应的HTTP报文分配一个新的操作标识,点击操作不同,产生的操作标识也不相同。
所述探针2获取客户端1发送的HTTP报文,提取所述HTTP报文中的操作标识,根据所述操作标识,判断源IP地址相同的HTTP报文是否为同一次点击操作所生成的报文,并将判断结果发送给所述监控中心3,所述监控中心3接收到所述判断结果后,进行分析处理,统计汇总,获得评估网页(web)浏览业务的用户体验指标,包括网页打开时延、网页显示成功率、网页下载速率、网页显示完成时延等指标。
需要说明的是,本实施例中,判断源IP地址相同的HTTP报文是否为同一次点击操作所生成的HTTP报文的操作也可以由监控中心3来执行,在此不再赘述。
本实施例提供的系统场景只用于解释本发明,并不限定本发明的保护范围。
基于图1所示的系统架构图,本发明实施例提供了一种网页分割的方法,如图2所示,本实施例的流程执行主体可以是图1所示系统中的探针2或监控中心3,该方法过程详述如下:
在步骤S201中,获取客户端发送的HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作。
在本实施例中,所述HTTP报文包括但不限于GET报文或POST报文。所述操作标识为客户端在HTTP报文的头域增加的标识,该操作标识可以命名为UA-BWID。所述操作标识通过客户端的浏览器分配,客户端在检测到用户在网页上的点击操作时,会通过浏览器为相应的HTTP报文分配一个新的操作标识。所述探针2或监控中心3在获取所述HTTP报文后,可以提取到所述HTTP报文中的操作标识。
在步骤S202中,判断客户端发送的HTTP报文中源IP地址相同的HTTP报文所携带的操作标识是否相同,若判断结果为“是”,则执行步骤S203,否则执行步骤S204。
优选的是,为了更好的进行分析比较以及提高判断的效率,本实施例在判断客户端发送的HTTP报文中源IP地址相同的HTTP报文携带的操作标识是否相同之前,还可以根据源IP地址,对所述客户端发送的HTTP报文进行分类。
在本实施例中,由于不同源IP地址的HTTP报文肯定不是同一次点击操作所生成的报文。因此本实施例根据源IP地址对获取的HTTP报文进行分类,即将同一源IP地址的HTTP报文归于一类,主要比较源IP地址相同的HTTP报文。
进一步的,为了方便分析比较以及提高比较的效率,本实施例在所述根据源IP地址,对获取的HTTP报文进行分类之后,还可以按照时间戳的大小,对分类后的HTTP报文进行排序。其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳,以便于顺序提取所述HTTP报文中的操作标识,避免未进行排序时,容易出现混乱,例如对同一HTTP报文重复提取的问题。
在本实施例中,所述客户端发送HTTP报文时的时间戳可以携带在HTTP报文中;所述获取HTTP报文时的时间戳为探针或监控中心获取到HTTP报文时的时间戳。
更进一步的,为了方便查找到或者快速的定位到每个源IP地址的第一个HTTP报文,本实施例还可以在HTTP报文按照时间戳进行排序后,为每个源IP地址的第一个HTTP报文标记开始标签。
本实施例在顺序提取所述HTTP报文中的操作标识后,根据所述操作标识,判断源IP地址相同的HTTP报文是否为同一次点击操作所生成的报文。
在步骤S203中,确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文,即确定源IP地址相同的网页是同一次点击操作生成的网页。
在步骤S204中,确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文,即确定源IP地址相同的网页不是同一次点击操作生成的网页。
本发明实施例根据HTTP报文携带的操作标识,可以快速、准确的判断源网际协议IP地址相同的HTTP报文是否为同一次点击操作所生成的报文,即同一次点击操作生成的网页。
图3示出了本发明另一实施例提供的网页分割方法的具体流程,该方法过程详述如下:
在步骤S301中,客户端在HTTP报文的头域增加一个用于标识点击操作的操作标识,该操作标识可以是一个表示浏览器窗口的句柄。当客户端发送HTTP报文(包括GET报文或POST报文)时,携带所述操作标识。
需要说明的是,对于每一次点击操作,客户端中的浏览器都会为点击操作所产生的HTTP报文分配一个新的操作标识;
其中,对于每次不同的点击操作,所述操作标识都保证不同。
在步骤S302中,客户端将所述HTTP报文发送给探针或者监控中心,探针或监控中心根据源IP地址,对获取的所述HTTP报文进行分类;
可选地,探针或监控中心可以对分类后的HTTP报文进行排序;具体地,可以按照时间戳的大小,对分类后的HTTP报文进行排序,其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳;
其中,所述HTTP报文包括但不限于HTTPGET报文和HTTPPOST报文。
在步骤S303中,按照源IP地址由大到小的顺序,读取第一个源IP地址所属分类中的第一个HTTP报文;
其中,需要说明的是,由于之前已根据源IP地址对HTTP报文进行了分类,因此,每一个源IP地址对应于一类HTTP报文,“源IP地址所属分类”具体是指“源IP地址相同的一类HTTP报文”。
在步骤S304中,判断该源IP地址所属分类中是否还有HTTP报文,若判断结果为“是”,则执行步骤S305,否则执行步骤S306;
在步骤S305中,读取该源IP地址所属分类中的下一个HTTP报文;
在步骤S306中,读取下一个源IP地址所属分类中的第一个HTTP报文,并转到步骤S304;
可选的,在本实施例中,可以为每一个IP地址所属分类中的第一个HTTP报文标记开始标签。
在步骤S307中,判断当前读取的HTTP报文携带的操作标识与上一个读取的HTTP报文携带的操作标识是否相同,若判断结果为“是”,则执行步骤S308,否则执行步骤S309。
在步骤S308中,判定当前读取的HTTP报文与上一个读取的HTTP报文是同一次点击操作所生成的报文,转到步骤S304,直到获取的HTTP报文全部处理完。
在步骤S309中,判定当前读取的HTTP报文与上一个读取的HTTP报文不是同一次点击操作生成的报文,转到步骤S304,直到获取的HTTP报文全部处理完。
在本实施例中,探针或者监控中心在分析用户流量报文时,针对同一源IP地址的多个HTTP报文(例如GET、POST或HEAD等报文),如果都携带有相同的操作标识,则判定为同一次点击操作生成的报文,从而可以准确地对页面进行分割。
图4示出了本发明另一实施例提供的网页分割装置的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
该网页分割装置4可以应用于图1所示的探针2或者监控中心3中。
该网页分割装置4具体包括报文获取单元41、判断单元42以及确定单元43。其中,各单元的具体功能如下:
报文获取单元41,用于获取客户端发送的HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作;
判断单元42,用于判断所述报文获取单元41获取的HTTP报文中源IP地址相同的HTTP报文所携带的操作标识是否相同;
确定单元43,用于在所述判断单元42判断结果为是时,确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文。
进一步的,所述确定单元43还用于,在所述判断单元42判断结果为否时,确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。
进一步的,所述装置4还包括:
分类单元44,用于在所述判断单元42进行判断之前,根据源IP地址,对所述客户端发送的HTTP报文进行分类。
进一步是,所述装置4还包括:
排序单元45,用于按照时间戳的大小,对所述分类单元44分类后的HTTP报文进行排序,其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳。
在本实施例中,所述HTTP报文包括但不限于GET报文或POST报文。
本实施例提供的网页分割装置4可以使用在前述对应的网页分割方法,详情参见上述网页分割方法图2和图3对应实施例的相关描述,在此不再赘述。
图5示出了本发明另一实施例提供的网页分割装置的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
该网页分割装置5包括处理器101以及采集器102,其中:
所述采集器102用于获取客户端发送的HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作;
所述处理器101用于判断所述HTTP报文中源IP地址相同的HTTP报文所携带的操作标识是否相同,若相同,则确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文;若不相同,则确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。
进一步的,所述处理器101在判断所述HTTP报文中源IP地址相同的HTTP报文携带的操作标识是否相同之前,还可以根据源IP地址,对所述客户端发送的HTTP报文进行分类。
更进一步的,所述处理器101在根据源IP地址,对所述客户端发送的HTTP报文进行分类之后,还可以按照时间戳的大小,对分类后的HTTP报文进行排序,其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳。
在本实施例中,所述HTTP报文包括但不限于GET报文或POST报文。
在本实施例中,处理器101是网页分割装置5的控制中心,利用各种接口和线路连接整个网页分割装置5中的各个部分,处理器101对所述采集器102获取到的HTTP报文进行分析,通过提取并比较所述HTTP报文中的操作标识来确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。可选的,处理器101可以包括一个或多个处理单元,还可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器101中。
需要说明的是,本领域技术人员可以理解,该网页分割装置5还可以包括显示器103以及存储器104,所述显示器103可以用于显示判定结果以及数据的处理过程中需要与用户进行交互的界面。所述处理器101通过运行存储在存储器104的软件程序以及模块,实现网页分割装置5的各种功能。所述处理器101分别与采集器102、显示器103以及存储器104相连接。
本领域技术人员可以理解,图5中示出的组成结构并不构成对网页分割装置5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本实施例提供的网页分割装置5可以使用在前述对应的网页分割方法,详情参见上述网页分割方法图2和图3对应实施例的相关描述,在此不再赘述。
综上所述,本发明实施例通过扩展HTTP协议,在HTTP的头域增加一个用于标识发送所述HTTP报文时的点击操作的操作标识,使得用户在进行每一次页面点击操作时浏览器都会分配一个新的操作标识给相应的HTTP报文,通过比较所述HTTP报文中的操作标识即可确定源IP地址相同的HTTP报文是同一次点击操作所生成的报文。本发明实施例无需分析相邻两个HTTP报文的时间差,不用根据时间差来判断是否为同一次点击操作生成的页面;也不用根据Reference地址、Host地址、URI地址是否相同来判断是否为同一次点击操作生成的页面;减少了判断的步骤,提高了网页分割的效率。而且,由于每次不同的点击操作,所产生的操作标识都不同,通过比较操作标识可以准确确定当前网页是否为同一次点击操作生成的网页,从而可以有效保证网页分割的准确性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将装置的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。上述描述的系统,处理器和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明实施例各个实施例中的各功能单元可以集成在一个控制器中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。

Claims (10)

1.一种网页分割的方法,其特征在于,所述方法包括:
获取客户端发送的超文本传输协议HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作,所述操作标识为客户端在HTTP报文的头域增加的标识;
判断所述HTTP报文中源网际协议IP地址相同的HTTP报文所携带的操作标识是否相同;
若所述源IP地址相同的HTTP报文携带的操作标识相同,则确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
若所述源IP地址相同的HTTP报文携带的操作标识不同,则确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。
3.如权利要求1或2所述的方法,其特征在于,在所述判断所述HTTP报文中源IP地址相同的HTTP报文所携带的操作标识是否相同之前,所述方法还包括:
根据源IP地址,对所述客户端发送的HTTP报文进行分类。
4.如权利要求3所述的方法,其特征在于,在所述根据源IP地址,对所述客户端发送的HTTP报文进行分类之后,所述方法还包括:
按照时间戳的大小,对分类后的HTTP报文进行排序,其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳。
5.如权利要求1所述的方法,其特征在于,所述客户端发送的HTTP报文包括GET报文或POST报文。
6.一种网页分割的装置,其特征在于,所述装置包括:
报文获取单元,用于获取客户端发送的超文本传输协议HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作,所述操作标识为客户端在HTTP报文的头域增加的标识;
判断单元,用于判断所述报文获取单元获取的HTTP报文中源网际协议IP地址相同的HTTP报文所携带的操作标识是否相同;
确定单元,用于在所述判断单元判断结果为是时,确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文。
7.如权利要求6所述的装置,其特征在于,所述确定单元还用于在所述判断单元判断结果为否时,确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。
8.如权利要求6或7所述的装置,其特征在于,所述装置还包括:
分类单元,用于在所述判断单元进行判断之前,根据源IP地址,对所述客户端发送的HTTP报文进行分类。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
排序单元,用于按照时间戳的大小,对所述分类单元分类后的HTTP报文进行排序,其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳。
10.如权利要求6所述的装置,其特征在于,所述客户端发送的HTTP报文包括GET报文或POST报文。
CN201210579176.8A 2012-12-27 2012-12-27 一种网页分割的方法及装置 Active CN103078910B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210579176.8A CN103078910B (zh) 2012-12-27 2012-12-27 一种网页分割的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210579176.8A CN103078910B (zh) 2012-12-27 2012-12-27 一种网页分割的方法及装置

Publications (2)

Publication Number Publication Date
CN103078910A CN103078910A (zh) 2013-05-01
CN103078910B true CN103078910B (zh) 2016-03-30

Family

ID=48155312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210579176.8A Active CN103078910B (zh) 2012-12-27 2012-12-27 一种网页分割的方法及装置

Country Status (1)

Country Link
CN (1) CN103078910B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106330616A (zh) * 2016-09-13 2017-01-11 通号工程局集团有限公司 一种实现铁路数据业务分类监控的方法
CN111327687B (zh) * 2020-01-21 2023-02-21 卓米私人有限公司 一种数据传输方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045327A (zh) * 2009-10-09 2011-05-04 杭州华三通信技术有限公司 防范cc攻击的方法和设备
CN102594796A (zh) * 2011-12-27 2012-07-18 中兴通讯股份有限公司 一种终端设备及用户信息同步方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6374300B2 (en) * 1999-07-15 2002-04-16 F5 Networks, Inc. Method and system for storing load balancing information with an HTTP cookie

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045327A (zh) * 2009-10-09 2011-05-04 杭州华三通信技术有限公司 防范cc攻击的方法和设备
CN102594796A (zh) * 2011-12-27 2012-07-18 中兴通讯股份有限公司 一种终端设备及用户信息同步方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cookie在互联网中的应用;曾娜 等;《计算机应用》;19980930;第18卷(第9期);全文 *
有态分布式HTTP的实现;徐瑞斌;《计算机科学》;19990331;第26卷(第3期);正文第70页右栏第4段-第71页右栏第3段 *

Also Published As

Publication number Publication date
CN103078910A (zh) 2013-05-01

Similar Documents

Publication Publication Date Title
CN104537115A (zh) 用户兴趣的探索方法和装置
CN104835066A (zh) 一种投放渠道的选择方法及系统
CN105120223A (zh) 一种获取景点视图的方法及系统
CN105447147A (zh) 一种数据处理方法及装置
CN104699704A (zh) 内容推送及接收方法、装置和系统
CN105426759A (zh) Url的合法性识别方法及装置
CN105991722B (zh) 一种下载器推荐方法、应用服务器、终端及系统
CN104504086A (zh) 网页页面的聚类方法和装置
CN103838754A (zh) 信息搜索装置及方法
CN102567494A (zh) 网站分类方法及装置
CN103152353A (zh) 交互信息的统一管理方法和装置
CN104732425A (zh) 基于大数据的电商平台客户行为分析方法
CN104901981A (zh) 一种用户行为的分析方法、装置和系统
CN105469381A (zh) 一种信息处理方法及终端
CN111428131A (zh) 信息推送方法、装置及系统
CN105095465A (zh) 一种信息推荐方法、系统及装置
CN103078910B (zh) 一种网页分割的方法及装置
CN107947973A (zh) 应用崩溃通知方法、系统、移动终端及服务器
CN109919805A (zh) 信息推送方法、用户设备、存储介质及装置
CN114268839A (zh) 视频发布账户筛选方法、装置、电子设备及存储介质
CN104363261A (zh) 信息推送方法、装置及服务器
CN110162361B (zh) 基于用户行为的智能提示方法、装置、终端及存储介质
CN107402999A (zh) 景点数据库建立方法及装置
CN110110197B (zh) 信息获取方法和装置
CN105491136A (zh) 消息发送方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant