WO2013091345A1

WO2013091345A1 - 无线网页浏览资源优化方法、装置及系统

Info

Publication number: WO2013091345A1
Application number: PCT/CN2012/075778
Authority: WO
Inventors: 周韡; 张洪丁
Original assignee: 华为技术有限公司
Priority date: 2011-12-21
Filing date: 2012-05-19
Publication date: 2013-06-27
Also published as: CN102523296A; CN102523296B

Abstract

本发明实施例公开一种无线网页浏览资源优化方法，包括：从接收到的网络数据包中识别出HTTP网页请求包；根据识别出的HTTP网页请求包，获取用户请求浏览的网页的网页ID；将该网页ID和预先建立的网页信息表匹配；若匹配成功，从网页信息表中得到该网页ID对应的网页信息，根据网页信息计算出与该网页信息匹配的GBR，并将该GBR发送给基站，以基站根据该GBR为用户分配无线网页会话的带宽资源。相应地，本发明实施例还公开了一种建立网页信息表的方法、无线网页浏览资源优化装置以及无线网络资源优化系统，通过以上技术方案，能根据每个网页的具体信息来计算并分配GBR，实现无线网页浏览时的资源的优化。

Description

无线网页浏览资源优化方法、装置及系统

技术领域

本发明涉及无线领域，尤其涉及无线网页浏览的资源优化技术 _c

背景技术

在移动互联网的发展浪潮中，随着智能手机、平板电脑等便携终端产业链的爆发和成熟，网页浏览、移动即时通讯、移动社区、移动支付等各类基于移动终端的应用也层出不穷，在这其中，无线网页浏览由于能够为人们即时提供新鲜、海量的资讯，是目前用户使用最普遍的移动互联网应用。

目前无线网页浏览业务的基本流程为：移动终端开机后建立 PDP(Package Data Protocol , 分组数据协议)连接 PDP以及 PDP附着，当移动终端需要发送数据时激活 PDP并获取 IP地址， RNC ( Radio Network Controller, 无线网络控制器）根据无线静态策略（该静态策略一般由运营商来设置）配置 GBR ( guarantee bit rate, 保证比特速率），并切换到 DCH ( Dedicated Channel , 专用信道）状态，向移动终端发送网页分组数据。

现有方案中，用户进行无线网页浏览时， RNC根据无线静态策略来配置 GBR; 当 GBR过低时，网页显示时间较长，造成网页浏览的 QOS低，影响用户体验；当 GBR过高时，尽管保证了网页浏览的 QOS, 但会造成无线资源的浪费。发明内容

为了在用户进行无线网页浏览时，提高用户体验以及减少无线资源的浪费，本发明实施例提供一种无线网页浏览资源优化方法，包括：

从接收到的网络数据包中识别出超文本传输协议 HTTP网页请求包，所述 HTTP网页请求包是用户请求浏览网页时发送的；

根据识别出的 HTTP 网页请求包，获取所述用户请求浏览的网页的网页

ID;

将获取的网页 ID和预先建立的网页信息表匹配；如果匹配成功，从所述网页信息表中得到所述网页 ID对应的网页信息，根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR, 并将所述 GBR发送给基站，以使所述基站按照所述 GBR为所述用户分配无线网页会话的带宽资源。

本发明实施例还提供一种无线网页浏览资源优化装置，包括：

识别模块，用于从接收到的网络数据包中识别出 HTTP网页请求包，所述 HTTP网页请求包是用户请求浏览网页时发送的；

获耳莫块，用于从所述识别模块识别出的 HTTP网页请求包中获取所述用户请求浏览的网页的网页 ID;

匹配模块，用于将所述获莫块获取的网页 ID和预先建立的网页信息表匹配；

策略模块，用于在所述匹配模块匹配成功时，从所述网页信息表中得到所述网页 ID对应的网页信息，根据所述网页信息计算出与所述网页信息匹配的 GBR, 并将所述 GBR发送给基站，以使所述基站按照所述 GBR为所述用户分配无线网页会话的带宽资源。

本发明实施例提供一种无线网络资源优化系统，包括：无线网络控制器和基站，其特征在于，

所述无线网络控制器用于，从接收到的网络数据包中识别出 HTTP网页请求包；根据识别出的 HTTP网页请求包，获取用户请求浏览的网页的网页 ID;

将获取的网页 ID和预先建立的网页信息表匹配；如果匹配成功，从所述网页信息表中得到所述网页 ID对应的网页信息，根据所述网页信息计算出与所述网页信息匹配的 GBR, 并将所述 GBR发送给基站；

所述基站用于，接收所述 GBR, 并根据所述 GBR为所述用户分配无线网页会话的带宽资源。

本发明实施例提供一种建立网页信息表的方法，包括：

从接收到的网络数据包中识别出 HTTP网页请求包及所述 HTTP网页请求包对应的 HTTP响应包，所述 HTTP网页请求包是用户请求浏览网页时发送的；根据所述 HTTP网页请求包，获取用户请求浏览的网页的网页 ID;

通过解析所述 HTTP网页请求包对应的 HTTP响应包，统计得出网页信息；建立所述网页 ID和所述网页信息的关联关系。本发明实施例还提供一种建立网页信息表的装置，包括：

网页数据识别模块，用于从接收到的网络数据包中识别出 HTTP网页请求包及所述 HTTP网页请求包对应的 HTTP响应包；

网页 ID获耳莫块，用于根据所述 HTTP网页请求包，获取用户请求浏览的网页的网页 ID;

网页信息统计模块，用于通过解析所述 HTTP网页请求包对应的 HTTP响应包，统计得出网页信息；

关联模块，用于将所述网页信息和网页 ID关联并添加到网页信息表。本发明实施例通过以上技术方案，基于网页数据的识别，通过查询网页信息表获取用户访问的网页的网页信息，并根据每个网页的具体信息来计算并分 GBR, 实现 GBR的动态调整，与现有技术方案相比，动态调整的 GBR能更好地跟不同的网页浏览业务相匹配，较大地减少了现有技术中 GBR过高或过低的情况的发生，提高了用户的体验并在保证网页浏览 QOS的同时实现无线资源的最大化利用。附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明实施例提供的一种无线网页浏览资源优化方法的流程图；图 2为本发明实施例提供的一种网页信息表的示意图；

图 3为本发明实施例提供的一种无线网页浏览资源优化方法的流程图；图 4为本发明实施例提供的一种网页信息记录添加方法流程图；图 5为本发明实施例提供的一种建立网页信息表的方法流程图；图 6为本发明实施例提供的一种建立网页信息表的装置结构图；图 7为本发明实施例提供的一种无线网络控制器的结构图；

图 8为本发明实施例提供的无线网络控制器的记录添加模块结构图；图 9为本发明实施例提供的一种无线网页浏览资源优化系统结构图。具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本领域一般技术人员更好的了解本发明实施例提供的技术方案，对网页会话 ( session )的 HTTP(Hyper Text Transfer Protocol, 超文本传输协议)通信机制和无线网络 GBR做一些简单的介绍：

HTTP互联网上应用最为广泛的一种网络协议，所有的 WWW文件都必须遵守这个标准。 HTTP协议定义了网页会话过程中 Web客户端如何从 Web服务器请求 Web页面，以及服务器如何把 Web页面传送给客户端， HTTP协议采用了请求 /响应模型。在一次完整的网页会话过程中， Web浏览器与 Web服务器之间将遵循 HTTP协议完成下列 4个步骤：

( 1 )建立网页会话连接；

在进行网页会话之前， Web浏览器首先要通过网络与 Web服务器建立连接，该连接是通过 TCP来完成的，该协议与 IP协议共同构建 Internet, 即著名的 TCP/IP协议族，因此 Internet又被称作是 TCP/IP网络。 HTTP是比 TCP更高层次的应用层协议，根据规则，只有低层协议建立之后才能，才能进行更层协议的连接，因此，首先要建立 TCP连接，一般 TCP连接的端口号是 80;

( 2 ) Web浏览器向 Web服务器发送 HTTP网页请求包；

一旦建立了 TCP连接， Web浏览器根据用户请求访问的网址，就会向 Web 服务器发送 HTTP网页请求包， HTTP网页请求包包含：请求的方法、 URL、协议版本、请求头部和请求数据。其中， HTTP协议的请求方法有 GET、 POST, HEAD, PUT, DELETE、 OPTIONS、 TRACE、 CONNECT, 而网页浏览时一般只用 GET方法； URL ( Uniform Resource Locator, 统一资源定位符）是因特网上标准的资源的地址， URL由协议、域名、请求地址三部分组成，完整地 URL唯一确定了一个请求的资源，可以是页面、内容模块、文件或多媒体资源等，比如浏览网易首页 =>体育频道 =>意曱，它们的 U L依次为 http://www.163.com/=> http://sports.163.com/=> http：〃 sports.163.com/yj/。请求头部由关键字 /值对组成，每行一对，关键字和值用英文冒号 "：" 分隔。请求头部通知服务器有关于客户端请求的信息，典型的请求头有：

User-Agent: 产生请求的浏览器类型；

Accept: 客户端可识别的内容类型列表；

Host: 请求的主机名，允许多个域名同处一个 IP地址，即虚拟主机。

请求数据不在 GET方法中使用，而是在 POST方法中使用。

( 3 ) WeM良务器接受请求并返回 HTTP响应包；

Web服务器解析请求，定位请求资源。服务器将资源复本写到 TCP套接字，由客户端读取。一个 HTTP响应包由状态行、响应头部、空行和响应数据 4部分组成。

( 4 )释放连接 TCP连接。

GBR是保证比特率 ( Guarantee Bit Rate )的缩写，具体指 RNC为分组数据业务分配的最小带宽，用以满足分组数据业务的最低带宽需求。目前，无线网络的 GBR都是由基站根据 RNC中的无线静态策略配置的，对于无线网页浏览业务，一般为 64Kbps。如图 1所示，本发明实施例提供一种无线网页浏览资源优化方法，包括：

S 101 ,从接收到的网络数据包中识别出 HTTP网页请求包，所述 HTTP网页请求包是用户请求浏览网页时发送的；

根据之前介绍的网页会话的 HTTP通信机制，网页会话 TCP连接建立后，浏览器根据用户输入的网址，发出 HTTP网页请求包， Web服务器在收到 HTTP 网页请求包后，将用户请求的网页的网页内容以 HTTP响应包的形式发送给浏览器。需要说明的是，由于网页具有分层结构，一个网页包含的内容可能有多种，例： ¾。html ( Hypertext Markup Language , 文本标己语言）、廣 p本、 CSS ( Cascading Style Sheet, 级联样式表）以及图片，相应地，上述每一种内容对应为 Web服务器上的一个资源，因此，一次网页会话过程中可能有多个 HTTP 网页请求包用于向 Web服务器请求不同的资源，以获取整个网页的完整信息。例如：第一个 HTTP网页请求包用于 Web从服务器获取 HTML文件，然后依次通发送 HTTP网页请求包用于从 Web服务器获取图片、脚本等其他内容。

需要说明的是，由于 HTTP是应用层协议，而为了从网络数据包中识别出 HTTP网页请求包，本发明实施例采用了 DPI技术。 DPI是深度包检测（ Deep Packet Inspection ) 的缩写，所谓 "深度" 是和 SPI ( Simple Packet Inspection, 简单报文识别）的层次相比较而言的， SPI仅分析数据包的传输层（层 4 ) 以下的内容，包括源地址、目的地址、源端口、目的端口以及协议类型，而 DPI 除了对前面的层次分析外，还增加了应用层分析（7层分析），通过对应用流中的数据报文内容进行探测，从而确定数据报文的真正应用，因为非法应用可以伪装端口号，但目前难以隐藏应用层的协议特征。

具体地，在一个实施例中，可以采用 DPI特征字识别的方法，对接收到的数据包头部以及数据部分进行解析，并将解析出的字段与 HTTP网页请求包的对应特征字段进行匹配。具体地，若解析出数据包头部中 TCP端口号为 80, 数据包的数据部分包含有请求方法 GET, 同时协议类型为 HTTP、且 URL后缀名为. jsp、 .asp, .php、 .htm, .html、 .shtml中的任何一种，就可以判定该数据包为 HTTP网页请求包；当然可以理解的是，解析和匹配的字段越多，判定的结果会越准确。

当然可以理解的是，从接受到的数据包中识别出 HTTP网页请求包，还可以采用其他的识别技术，比如说应用层协议识别技术、关键字匹配或行为特征分析技术。

S102, 根据识别出的 HTTP网页请求包，获取用户请求浏览的网页的网页

ID;

需要说明的是，网页 ID是用来区分不同网页的标识，且该标识是唯一的。在本发明的一个实施例中，将网页会话 TCP连接建立后，接收到的首个 HTTP网页请求包中的 URL作为网页 ID。具体地，将 S101识别出的首个 HTTP 网页请求包中的特定字段进行解析，即可得到该网页的主 URL, 然后以此 U L 作为网页 ID; 在另一个实施例中，网页 ID也可以采用计算的方法获取：将 S101 识别出的首个 HTTP网页请求包中的特定字段进行解析，并提取该 HTTP网页请求包中的 URL和 host字段，再将提取出的 URL字段和 host字段通过字符串连接函数连接成一个字段，最后用散列算法对连接出的字段进行散列，得出一个特定长度的序列号，并以此序列号来作为网页 ID。具体地，可以采用 MD5算法 (消息摘要算法第五版）来作为计算网页 ID的散列算法，即 MD5 ( U L+host ) 即可得出网页 ID; 当然可以理解的是，还可以采用其他的散列算法，如 SHA-1 , 本发明实施例不做特别限定。 5103 ,将获取的网页 ID和预先建立的网页信息表匹配，所述网页信息表包在一个实施例中，在进行匹配时，可以将获取的网页 ID作为键（key )值，采用 hash (哈希）索引的方法与网页信息表进行匹配。 Hash索引的方法作为一个具体的查找方式具有迅速查找的优势，能提高匹配速度。可以理解的是 hash 索引的方法并不是匹配的唯一实现方式，故 hash索引的方式作为一个举例不应理解为对本发明实施例的限定，可以理解的是，在另一个实施例中，还可以采用 b-tree二叉树索弓 I、 r-tree索弓 I或 foil-text索弓 I。

图 2所示为本发明实施例提供的一种网页信息表的示意图。根据图 2, 网页的具体信息包括但不限于：网页大小、网页层次、网页类型。其中，网页大小为整个网页包含的数据量；网页层次具体与网页的目录结构对应，第一级目录为主页，层数为 1 , 二级目录中的子网页层数为 2, 以此类推；网页类型用于表示网页的内容主题，比如新闻、体育或财经等。需要说明的是，图 2仅仅是本发明实施例的一个网页信息数据表的举例，图 2所示的网页信息表只是提供了网页信息表实现的一种典型方式，不是唯一的，可以在此表的基础上进行优化和完善。例如，在一个实施例中，如果需要考虑网页的字符集、作者、版本、网页关键字等因素，就可以在网页信息表中添加这些相应信息。

需要说明的是，网页信息表可以是固定不变的，也可以根据用户的访问情况进行更新。

5104,如果匹配成功，从所述网页信息表中得到所述网页 ID对应的网页信息，根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR,并将所述 GBR发送给基站，以使所述基站按照所述 GBR为所述用户分配无线网页会话的带宽资源。

具体地，在一个实施例中，根据网页信息计算与之匹配的 GBR的方法包括：

( 1 )从所述网页信息中获取网页大小和网页层次；

( 2 )用网页大小除以标准时间，得到与所述网页信息匹配的 GBR; 或者网页大小除以网页层次，再除以标准时间，得到与所述网页信息匹配的 GBR; 或者用网页大小除以网页层次，再除以用户等级系数，得到与所述网页信息匹配的 GBR。

其中，标准时间是由运营商静态配置的，比如 Is, 它代表用户获得一个完整的网页信息所需的平均时间；用户等级系数是根据用户类型来设置的，例如金牌用户 = 1 , 银牌用户 = 2, 铜牌用户 = 3。具体地，上述计算方法可以用公式表示为： GBR = 网页大小 /标准时间；在另一个实施例中， GBR的计算方法可以为： GBR = 网页大小 /标准时间 * 网页层次；在另一个实施例中， GBR的计算方法还可以 GBR = 网页大小 /标准时间 * 网页层次 /用户等级系数。

GBR计算完成后， RNC将该 GBR以 GBR配置文件的形式下发给基站，基站按照 GBR配置文件分配网页会话的带宽资源，从而实现 GBR根据网页信息进行动态调整。

本发明实施例通过以上技术方案，基于网页数据的识别，通过查询网页信息表获取用户访问的网页的网页信息，并根据每个网页的具体信息来计算并分配 GBR, 实现 GBR的动态调整，与现有技术方案相比，动态调整的 GBR能更好地跟不同的网页浏览业务相匹配，较大地减少了现有技术中 GBR过高或过低的情况，提高了用户的体验并在保证网页浏览 QOS的同时实现无线资源的最大化利用。

如图 3所示，本发明实施例提供一种无线网页浏览资源优化方法，包括：

5301 ,从接收到的网络数据包中识别出 HTTP网页请求包，所述 HTTP网页请求包是用户请求浏览网页时发送的；

在一个实施例中，可以采用 DPI特征字识别的方法，对接收到的数据包头部以及数据部分进行解析，并将解析出的字段与 HTTP网页请求包的对应特征字段进行匹配。具体地，若解析出数据包头部中 TCP端口号为 80, 数据包的数据部分包含有请求方法 GET , 同时协议类型为 HTTP、且 URL后缀名为. jsp、 .asp, .php、 .htm, .htmK .shtml中的任何一种，就可以判定该数据包为 HTTP网页请求包；当然可以理解的是，解析和匹配的字段越多，判定的结果会越准确。

5302, 根据识别出的 HTTP网页请求包，获取用户请求浏览的网页的网页

ID;

需要说明的是，网页 ID是用来区分不同网页的标识，且该标识是唯一的。在本发明的一个实施例中，将网页会话 TCP连接建立后，接收到的首个 HTTP网页请求包中的 URL作为网页 ID。具体地，将 S101识别出的首个 HTTP 网页请求包中的特定字段进行解析，即可得到该网页的主 URL, 然后以此 U L 作为网页 ID; 在另一个实施例中，网页 ID也可以采用计算的方法获取：将 S101 识别出的首个 HTTP网页请求包中的特定字段进行解析，并提取该 HTTP网页请求包中的 URL和 host字段，再将提取出的 URL字段和 host字段通过字符串连接函数连接成一个字段，最后用散列算法对连接出的字段进行散列，得出一个特定长度的序列号，并以此序列号来作为网页 ID。具体地，可以采用 MD5算法 (消息摘要算法第五版）来作为计算网页 ID的散列算法，即 MD5 ( U L+host ) 即可得出网页 ID; 当然可以理解的是，还可以采用其他的散列算法，如 SHA-1 , 本发明实施例不做特别限定。

5303 ,将获取的网页 ID和预先建立的网页信息表匹配，所述网页信息表包在一个实施例中，在进行匹配时，可以将获取的网页 ID作为键（key )值，采用 hash (哈希）索引的方法与网页信息表进行匹配。 hash索引的方法作为一个具体的查找方式具有迅速查找的优势，能提高匹配速度。可以理解的是 hash 索引的方法并不是匹配的唯一实现方式，故 hash索引的方式作为一个举例不应理解为对本发明实施例的限定，可以理解的是，在另一个实施例中，还可以采用 b-tree二叉树索弓 I、 r-tree索弓 I或 foil-text索弓 I。

图 2所示为本发明实施例提供的一种网页信息表的示意图。根据图 2, 网页的具体信息包括但不限于：网页大小、网页层次、网页类型。其中，网页大小指整个网页包含的数据量；网页层次具体与网页的目录结构对应，第一级目录为主页，层数为 1 , 二级目录中的子网页层数为 2, 以此类推；网页类型用于表示网页的内容主题，比如新闻、体育或财经等。需要说明的是，图 2仅仅是本发明实施例的一个网页信息数据表的举例，图 2所示的网页信息表只是提供了网页信息表实现的一种典型方式，不是唯一的，可以在此表的基础上进行优化和完善。例如，在一个实施例中，如果需要考虑网页的字符集、作者、版本、网页关键字等因素，就可以在网页信息表中添加这些相应信息。

5304,如果匹配成功，从所述网页信息表中得到所述网页 ID对应的网页信息，根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR,并将所述 GBR发送给基站，以使所述基站按照所述 GBR为所述用户分配无线网页会话的带宽资源；

具体地，在一个实施例中，根据网页信息计算匹配的 GBR的方法包括： ( 1 )从所述网页信息中获取网页大小和网页层次；

其中，标准时间是由运营商静态配置的，比如 Is, 它代表用户获得一个完整的网页信息所需的平均时间，用户等级系数是根据用户类型来设置的，例如金牌用户 = 1 , 银牌用户 = 2, 铜牌用户 = 3。具体地，上述计算方法可以用公式表示为： GBR = 网页大小 /标准时间；在另一个实施例中， GBR的计算方法可以为： GBR = 网页大小 /标准时间 * 网页层次；在另一个实施例中， GBR的计算方法还可以 GBR = 网页大小 /标准时间 * 网页层次 /用户等级系数。

GBR计算完成后，将该 GBR以 GBR配置文件的形式下发给基站，基站按照 GBR配置文件分配网页会话的带宽资源，从而实现 GBR根据网页信息进行动态调整。

5305, 如果匹配不成功，将预先配置的 GBR发送给基站，以使所述基站根据所述预先配置的 GBR为所述用户分配无线网页会话的带宽资源；

在一个实施例中，如果匹配不成功，说明当前访问的网页信息并没有记录在网页信息表中，这时就将预先配置的 GBR (由用户配置，例如 64kbps ) 以 GBR配置文件的形式下发给基站，基站按照该 GBR配置文件分配网页会话的带宽。

在另一个实施例中，如图 3的虚线框所示，本发明实施例提供的无线网页浏览资源优化方法还包括：

5306,将匹配不成功的网页 ID及对应的网页信息作为新的记录添加到网页信息表中。

在一个实施例中，如果匹配不成功，说明当前访问的网页在网页信息表中并没有记录，属于一个新的网页，为了使后续用户访问该网页时能进行资源的优化，需要添加此新的网页的网页信息到网页信息表中，为计算 GBR提供依据。

在一个实施例中，如图 4所示， S306具体包括：

S3601 , 从接收到的网络数据包中识别出与所述 HTTP网页请求包对应的 HTTP响应包；需要说明的是，根据网页浏览的 HTTP通信机制， Web服务器收到 Web浏览器发出 HTTP网页请求包后，会将 Web浏览器请求的资源以 HTTP响应包形式发送给浏览器，即一个 HTTP网页请求包对应一个 HTTP响应包，因此，在一个实施例中，可以按照以下规则来简单识别出 HTTP响应包：浏览器发出 HTTP 网页请求包之后收到的下一个数据包即为该 HTTP网页请求包对应的 HTTP响应包。因此，根据步骤 S301中描述的方法识别出 HTTP网页请求包之后，即可识别出其对应的 HTTP响应包。在另一个实施例中，也可以采用 DPI特征字识别的方法，对网络数据包的内容进行解析和匹配 , 从而识别出 HTTP响应包。

S3602 , 解析识别出的 HTTP网页请求包对应的 HTTP响应包，统计出用户请求浏览的网页的网页信息；

为了便于描述，本发明实施例将 HTTP网页请求包和 HTTP响应包统称为网页浏览数据包，需要说明的是，在进行网页浏览的时候，一个 session (会话）至少包含一条数据流，而一条数据流包含多个网页浏览数据包，因此对识别出的网页浏览数据包进行解析主要分为两个层次：（ 1 )解析出哪些网页浏览数据包属于同一条数据流；（2 )从多条数据流中解析出哪些数据流属于同一 session; 实现上述两个个层次的解析方法同样可以采用 S301中的 DPI特征字识别的方法。

具体地，在一个实施例中，解析网页浏览数据包中的五元组（源 IP地址，源端口，目的 IP地址，目的端口，和传输层协议号），如果两个网页浏览数据包的五元组满足以下两个条件中的任何一种，就可以判定这两个数据包属于同一条数据流；

( 1 ) 两个数据包的五元组完全相同；

( 2 ) 一个数据包五元组中的源 IP地址为另一个数据包五元组中目的 IP地址，且目的 IP地址为另一个数据包的源 IP地址，其余三个参数完全相同。

进一步地，对不同数据流的 HTTP网页请求包进行解析，得到 Src和 URL字段的值， Src和 URL完全相同的的数据流就判定为属于同一个 session。

在一个实施例中，统计网页大小的方法为：先建立 session表和数据流表，然后在上述解析数据包的过程中将每个网页浏览数据包的大小和归属信息记录到 session表和流表中（具体地，数据包的大小以及数据包属于哪条数据流这两个信息记载到数据流表，数据包所在流属于哪个 session这一信息记载到 session表），最后结合上述两个表中记载的信息统计出网页大小；同时，可以通过解析主 URL来统计网页层次和网页类型，所述主 URL为 session中第一个 HTTP网页请求包的 URL。具体地，根据主 URL中斜杠的数量来判断网页层次，根据 URL 中的关键字来判断网页的类型，例如 URL 为 /news/lady/default.j sp?user=abc&refer=htt ://www.163.com/lady , 才艮据斜杠的数量来判断网页层次 (从 URL开头到问号结束，没有问号则到空格结束)，此处共有 3个斜杠，则说明此网页为第三层网页；解析斜杠之间的内容，可以获得关键字，比如 news、 lady, 则说明此网页时女性、新闻类型。如果没有关键字则表示是网站主页，类型字段给空。

S3603 , 将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网页 ID关联并添加到所述网页信息表。

本发明实施例通过以上技术方案，基于网页数据的识别，通过查询网页信息表获取用户访问的网页的网页信息，并根据每个网页的具体信息来计算并分配 GBR, 实现 GBR的动态调整，与现有技术方案相比，动态调整的 GBR能更好地跟不同的网页浏览业务相匹配，较大地减少了现有技术中 GBR过高或过低的情况，提高了用户的体验，并在保证网页浏览 QOS的同时实现无线资源的最大化利用；进一步地，当匹配不成功的时候，通过将之前网页信息表没有记录的网页信息在访问的时候添加到网页信息表，后续其他用户访问时，就可以对其合理分配 GBR, 实现无线资源的优化。

如图 5所示，本发明实施例提供一种建立网页信息表的方法，包括：

S501 ,从接收到的网络数据包中识别出 HTTP网页请求包及所述 HTTP网页请求包对应的 HTTP响应包 ,所述 HTTP网页请求包是用户请求浏览网页时发送的；

具体地，在一个实施例中，可以预先设置一块信息緩存，当网络数据包到达时，将数据包复制到信息緩存中，然后对数据包进行特征字的识别和解析，若解析出数据包头部中 TCP端口号为 80 , 数据包的数据部分包含有请求方法 GET,同时协议类型为 HTTP、且 URL后缀名为. jsp、 .asp, .php、 .htm, .html、 .shtml 中的任何一种，就可以判定该数据包为 HTTP网页请求包，当然可以理解的是，根据之前所述的网页浏览 HTTP通信机制，浏览器发送一个 HTTP网页请求包之后收到的下一个网络数据包必然为与该 HTTP网页请求包对应的 HTTP响应包； S502, 根据所述 HTTP网页请求包，获取用户请求浏览的网页的网页 ID, 并通过解析所述 HTTP响应包，统计得出网页信息；

在本发明的一个实施例中，将识别出的首个 HTTP网页请求包中的 URL作为网页 ID。具体地，将 S501识别出的首个 HTTP网页请求包中的特定字段进行解析，即可得到该网页的主 URL, 然后以此 URL作为网页 ID; 在另一个实施例中，网页 ID也可以采用计算的方法获取：将 S101识别出的首个 HTTP网页请求包中的特定字段进行解析，并提取该 HTTP网页请求包中的 URL和 host字段，再将提取出的 URL字段和 host字段通过字符串连接函数连接成一个字段，最后用散列算法对连接出的字段进行散列，得出一个特定长度的序列号，并以此序列号来作为网页 ID。具体地，可以采用 MD5算法（消息摘要算法第五版）来作为计算网页 ID的散列算法，即 MD5 ( U L+host ) 即可得出网页 ID; 当然可以理解的是，还可以采用其他的散列算法，如 SHA-1 , 本发明实施例不做特别限定。

对识别出的 HTTP响应包进行解析主要分为两个层次：（ 1 )解析出哪些 HTTP响应包属于同一条数据流；（2 )从多条数据流中解析出哪些数据流属于同一 session; 实现上述两个个层次的解析方法同样可以采用 S101中的 DPI特征字解析的方法。

具体地，在一个实施例中，解析 HTTP响应包中的五元组（源 IP地址，源端口，目的 IP地址，目的端口，和传输层协议号），如果两个 HTTP响应包的五元组完全相同，就可以判定这两个数据包属于同一条数据流；

在一个实施例中，获取网页大小的方法为：先建立 session表和数据流表，然后在 S501识别数据包和判断的过程中将每个网页浏览数据包的大小和归属信息记录到 session表和流表中（具体地，数据包的大小以及数据包属于哪条数据流这两个信息记载到数据流表，数据包所在流属于哪个 session这一信息记载到 session表），最后结合上述两个表中记载的信息统计出网页大小；同时，可以通过解析主 URL来获取网页层次和网页类型，所述主 U L为 session中第一个 HTTP网页请求包的 URL。具体地，根据主 URL中斜杠的数量来判断网页层次，根据 URL 中的关键字来判断网页的类型，例如 URL 为 /news/lady/default.j sp?user=abc&refer=http://www.163.com/lady , 才艮据斜杠的数量来判断网页层次 (从 URL开头到问号结束，没有问号则到空格结束)，此处共有 3个斜杠，则说明此网页为第三层网页；解析斜杠之间的内容，可以获得关键字，比如 news、 lady, 则说明此网页时女性、新闻类型，如果没有关键字则表示是网站主页，类型字段给空。

S503 , 建立所述网页 ID和所述网页信息的关联关系。

本发明实施例通过以上技术方案，基于 DPI识别的方法，对网络数据包做深入解析，保证了解析的准确性，同时，根据解析的结果来统计网页信息，将解析到的结果作为网页信息记录添加到网页信息表中，方便后续访问该网页时直接获取网页的具体信息。

如图 6所示，本发明实施例提供一种建立网页信息表的装置，包括：网页信息识别模块 610,用于从接收到的网络数据包中识别出 HTTP网页请求包及所述 HTTP网页请求包对应的 HTTP响应包；

网页 ID获耳莫块 620,用于根据所述 HTTP网页请求包，获取用户请求浏览的网页的网页 ID,

网页信息统计模块 630, 用于通过解析所述 HTTP网页请求包对应的 HTTP 响应包，统计得出网页信息；

关联模块 640, 用于将所述网页信息和网页 ID关联并添加到网页信息表。进一步地，在一个实施例中，获取模块 620具体包括：

特征字单元 6201 , 用于将所述 HTTP网页请求包中的 URL和 host字段，通过字符串连接函数连接成一个特征字段；

序列号单元 6202 ,用于用散列算法对所述特征字段进行散列得到一个特定长度的序列号；

网页 ID单元 6203 , 用于将所述一个特定长度的序列号作为所述网页 ID。本发明实施例通过以上技术方案，基于 DPI识别的方法，对网络数据包做深入解析，保证了解析的准确性，同时，根据解析的结果来统计网页信息，将解析到的结果作为网页信息记录添加到网页信息表中，方便后续访问该网页时直接获取网页的具体信息。

如图 7所示，本发明的实施例提供一种无线网页浏览资源优化装置，包括：识别模块 710, 用于从接收到的网络数据包中识别出 HTTP网页请求包；在一个实施例中，识别模块可以采用特征字识别的方法，对接收到的数据包头部以及数据部分进行解析，并将解析出的字段与 HTTP网页请求包的对应特征字段进行匹配。具体地，若解析出数据包头部中 TCP端口号为 80, 数据包的数据部分包含有请求方法 GET , 同时协议类型为 HTTP、且 URL后缀名为. jsp、 .asp, .php、 .htm, .htmK .shtml中的任何一种，就可以判定该数据包为 HTTP网页请求包；当然可以理解的是，解析和匹配的字段越多，判定的结果会越准确。

获耳莫块 720, 用于根据识别模块 610识别出的 HTTP网页请求包，获取用户请求浏览的网页的网页 ID;

在本发明的一个实施例中，获取模块 720将网页会话 TCP连接建立后，接收到的首个 HTTP网页请求包中的 URL作为网页 ID。具体地，将识别模块 710 识别出的首个 HTTP网页请求包中的特定字段进行解析，即可得到该网页的主 URL, 然后以此 URL作为网页 ID; 在另一个实施例中，网页 ID也可以采用计算的方法获取：将识别模块 710识别出的首个 HTTP网页请求包中的特定字段进行解析，并提取该 HTTP网页请求包中的 URL和 host字段，再将提取出的 URL字段和 host字段通过字符串连接函数连接成一个字段，最后用散列算法对连接出的字段进行散列，得出一个特定长度的序列号，并以此序列号来作为网页 ID。具体地，可以采用 MD5算法（消息摘要算法第五版）来作为计算网页 ID的散列算法，即 MD5 ( URL+host ) 即可得出网页 ID; 当然可以理解的是，还可以采用其他的散列算法，如 SHA-1 , 本发明实施例不做特别限定。

匹配模块 730,用于将获耳莫块 720获取的网页 ID和预先建立的网页信息表信息；

在一个实施例中，匹配模块 730可以将获取模块 720获取的网页 ID作为键 ( key )值, 采用 hash (哈希）索引的方法与网页信息表进行匹配。 hash索引的方法作为一个具体的查找方式具有迅速查找的优势，能提高匹配速度。可以理解的是 hash索引的方法并不是匹配的唯一实现方式，故 hash索引的方法作为一个举例不应理解为对本发明实施例的限定。

策略模块 740, 用于在匹配模块 730匹配成功时，根据网页信息表中的网页信息计算与所述网页信息匹配的 GBR,并将该 GBR发送给基站，以使基站按照该 GBR分配无线网页会话的带宽资源。

进一步地，策略模块 740还用于在匹配模块 730匹配不成功时，将预先配置的 GBR下发给基站，以使基站按照该 GBR分配无线网页会话的带宽资源。

在一个实施例中，如果匹配模块 730匹配成功，则说明该网页 ID对应的网页信息在网页信息表中表中已有记录，所以策略模块 740可以根据网页信息表中与该网页 ID匹配的网页信息来计算 GBR , 并将计算出的 GBR以 GBR配置文件的形式发送给基站进行无线网页会话带宽资源的分配。

具体地，在一个实施例中，根据网页信息计算匹配的 GBR的方法包括：

( 1 )从所述网页信息中获取网页大小和网页层次；

GBR计算完成后，策略模块 740将该 GBR以 GBR配置文件的形式下发给基站，基站按照 GBR配置文件分配网页会话的带宽资源，从而实现 GBR根据网页信息进行动态调整。

如图 7中的虚线框所示，在一个实施例中，该无线网页浏览资源优化装置还包括：

记录添加模块 750, 用于将匹配不成功的网页 ID及对应的网页信息作为新的记录添加到网页信息表中；

进一步地，如图 8所示，在一个实施例中，记录添加模块 750具体包括：第一识别单元 7501 , 用于从接收到的网络数据包中识别出与所述 HTTP网页请求包对应的 HTTP响应包；

在一个实施例中，识别单元 7501可以按照以下规则来简单识别出 HTTP响应包：浏览器发出 HTTP网页请求包之后收到的下一个数据包即为该 HTTP网页请求包对应的 HTTP响应包。

在另一个实施例中，识别单元 7501也可以采用 DPI特征字识别的方法，对网络数据包的内容进行解析和匹配 , 从而识别出 HTTP响应包。

解析统计单元 7502, 用于解析识别单元 7501识别出的 HTTP网页请求包对应的 HTTP响应包，并统计出网页信息；

存储单元 7503 ,用于将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网页 ID关联并添加到所述网页信息表。

本发明实施例通过以上技术方案，基于网页数据的识别，通过查询网页信息表获取用户访问的网页的网页信息，并根据每个网页的具体信息来计算并分配 GBR, 实现 GBR的动态调整，与现有技术方案相比，动态调整的 GBR能更好地跟不同的网页浏览业务相匹配，较大地减少了现有技术中 GBR过高或过低的情况，提高了用户的体验，并在保证网页浏览 QOS的同时实现无线资源的最大化利用；进一步地，通过记录添加模块将之前网页信息表没有记录的网页信息在访问的时候添加到网页信息表，实现网页信息表的更新，这样当后续其他用户访问再访问该网页时，就可以计算出匹配的 GBR, 实现资源的优化。

如图 9所示，本发明实施例提供一种无线网络资源优化系统，包括：无线网络控制器 80,所述无线网络控制器 80为本发明实施例所述的无线网络控制器；

基站 90,所述基站用于接收无线网络控制器 80发出的 GBR,并根据该 GBR 为用户分配网页会话的带宽。

本发明实施例通过以上技术方案，无线网络控制器基于网页数据的识别，通过查询网页信息表获取用户访问的网页的网页信息，并根据每个网页的具体信息来计算并分配 GBR, 实现 GBR的动态调整，与现有技术方案相比，动态调整的 GBR能更好地跟不同的网页浏览业务相匹配，较大地减少了现有技术中 GBR过高或过低的情况，提高了用户的体验，并在保证网页浏览 QOS的同时实现无线资源的最大化利用；进一步地，无线网络控制器通过记录添加模块将之前网页信息表没有记录的网页信息在访问的时候添加到网页信息表，实现网页信息表的更新，这样当后续其他用户访问再访问该网页时，无线网络控制器就可以根据更新后的网页信息表，计算出匹配的 GBR, 并下发给基站进行无线资源的配置，实现资源的优化。

以上所述仅为本发明的几个实施例，本领域的技术人员依据申请文件公开的可以对本发明进行各种改动或变型而不脱离本发明的精神和范围。

Claims

权利要求

1、一种无线网页浏览资源优化方法，其特征在于，包括：

根据识别出的 HTTP网页请求包，获取所述用户请求浏览的网页的网页标识 ID;

将获取的网页 ID和预先建立的网页信息表匹配；

如果匹配成功，从所述网页信息表中得到所述网页 ID对应的网页信息，根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR, 并将所述带宽资源。

2、如权利要求 1所述的方法，其特征在于，所述根据识别出的 HTTP网页请求包，获取用户请求浏览的网页的网页 ID, 包括：

将所述 HTTP网页请求包中的统一资源定位符 URL和 hos t字段，通过字符串连接函数连接成一个特征字段；

用散列算法对所述特征字段进行散列得到一个特定长度的序列号；将所述一个特定长度的序列号作为所述用户请求浏览的网页的网页 ID。

3、如权利要求 2所述的方法，其特征在于，所述散列算法为消息摘要算法第五版 MD5或者安全散列算法 SHA-L

4、如权利要求 1所述的方法，其特征在于，所述根据识别出的 HTTP网页请求包，获取用户请求浏览的网页的网页 ID, 包括：

将所述 HTTP网页请求包中的统一资源定位符 URL字段作为所述用户请求浏览的网页的网页 ID。

5、如权利要求 1-4任一项所述的方法，其特征在于，所述网页信息表中的网页信息包括：网页大小、网页层次和 /或网页类型。

6、如权利要求 5所述的方法，其特征在于，所述根据所述网页信息计算出与所述网页信息匹配的 GBR, 包括：

从所述网页信息中获取网页大小和网页层次；

用网页大小除以标准时间，得到与所述网页信息匹配的 GBR , 所述标准时间为用户获得一个完整的网页信息所需的平均时间；或者网页大小除以网页层次，再除以标准时间，得到与所述网页信息匹配的 GBR; 或者用网页大小除以网页层次，再除以用户等级系数，得到与所述网页信息匹配的 GBR。

7、如权利要求 1-6任一项所述的方法，其特征在于，还包括：

如果匹配不成功，将预先配置的 GBR发送给基站，以使所述基站根据所述预先配置的 GBR为所述用户分配无线网页会话的带宽资源。

8、如权利要求 7所述的方法，其特征在于，如果匹配不成功，将预先配置的 GBR下发给基站之后，还包括：

将匹配不成功的网页 ID及对应的网页信息作为新的记录添加到网页信息表中。

9、如权利要求 8所述的方法，其特征在于，所述将匹配不成功的网页 ID 及对应的网页信息作为新的记录添加到网页信息表中，具体包括：

从接收到的网络数据包中识别出与所述 HTTP网页请求包对应的 HTTP响应包；

通过解析所述 HTTP网页请求包对应的 HTTP响应包，统计得出所述用户请求浏览的网页的网页信息；

将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网页 ID关联并添加到所述网页信息表。

10、如权利要求 1所述的方法，其特征在于，所述从接收到的网络数据包中识别出 HTTP网页请求包，包括：

通过对所述接收到的网路数据包进行深度包检测 DPI , 从接收到的网络数据包中识别出 HTTP网页请求包。

11、一种无线网页浏览资源优化装置，包括：

识别模块，用于从接收到的网络数据包中识别出超文本传输协议 HTTP网页请求包，所述 HTTP网页请求包是用户请求浏览网页时发送的；

获耳莫块，用于从所述识别模块识别出的 HTTP网页请求包中获取所述用户请求浏览的网页的网页标识 ID;

匹配模块，用于将所述获耳莫块获取的网页 ID和预先建立的网页信息表匹配；

策略模块，用于在所述匹配模块匹配成功时，从所述网页信息表中得到所述网页 ID对应的网页信息，根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR, 并将所述 GBR发送给基站，以使所述基站按照所述 GBR为所述用户分配无线网页会话的带宽资源。

12、如权利要求 11所述的装置，其特征在于，还包括：

记录添加模块，用于在所述匹配模块匹配不成功时，将匹配不成功的网页 ID及对应的网页信息作为新的记录添加到所述网页信息表中；

13、如权利要求 12所述的装置，其特征在于，所述记录添加模块具体包括：

识别单元，从接收到的网络数据包中识别出与所述 HTTP网页请求包对应的 HTTP响应包；

解析统计单元，用于通过解析所述 HTTP网页请求包对应的 HTTP响应包，统计得出所述用户请求浏览的网页的网页信息；

存储单元，用于将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网页 ID关联并添加到所述网页信息表。

14、如权利要求 13所述的装置，其特征在于，所述识别单元具体用于，通过对所述接收到的网路数据包进行深度包检测 DP I，从接收到的网络数据包中识别出 HTTP网页请求包。

15、一种无线网络资源优化系统，包括：无线网络控制器和基站，其特征在于，

所述无线网络控制器用于，从接收到的网络数据包中识别出超文本传输协议 HTTP网页请求包，所述 HTTP网页请求包是用户请求浏览网页时发送的；根据识别出的 HTTP网页请求包，获取用户请求浏览的网页的网页标识 ID;

将获取的网页 ID和预先建立的网页信息表匹配；如果匹配成功，从所述网页信息表中得到所述网页 ID对应的网页信息，根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR, 并将所述 GBR发送给基站；

16、如权利要求 15所述的系统，其特征在于，所述无线网络控制器还用于，当获取的网页 ID和预先建立的网页信息表匹配不成功时，将预先配置的 GBR下发给基站进行无线资源配置。

17、如权利要求 15所述的系统，其特征在于，所述无线网络控制器还用于，当获取的网页 ID和预先建立的网页信息表匹配不成功时，将预先配置的 GBR下发给基站进行无线资源配置，并将匹配不成功的网页 ID及对应的网页信息作为新的记录添加到网页信息表中。

18、一种建立网页信息表的方法，其特征在于，包括：

从接收到的网络数据包中识别出超文本传输协议 HTTP网页请求包及所述 HTTP网页请求包对应的 HTTP响应包，所述 HTTP网页请求包是用户请求浏览网页时发送的；

根据所述 HTTP网页请求包，获取用户请求浏览的网页的网页标识 ID; 通过解析所述 HTTP网页请求包对应的 HTTP响应包，统计得出网页信息；建立所述网页 ID和所述网页信息的关联关系。

19、如权利要求 18 所述的方法，其特征在于，所述根据识别出的 HTTP 网页请求包，获取用户请求浏览的网页的网页 ID, 包括：

将所述 HTTP网页请求包中的统一资源定位符 URL和 hos t字段，通过字符串连接函数连

接成一个特征字段；

用散列算法对所述特征字段进行散列得到一个特定长度的序列号；将所述一个特定长度的序列号作为所述网页 ID。

20、如权利要求 18或 19所述的方法，其特征在于，所述网页信息包括：网页大小、网页层次和 /或网页类型。

21、一种建立网页信息表的装置，其特征在于，包括：网页数据识别模块，用于从接收到的网络数据包中识别出超文本传输协议

HTTP网页请求包及所述 HTTP网页请求包对应的 HTTP响应包；

网页 ID获耳莫块，用于根据所述 HTTP网页请求包，获取用户请求浏览的网页的网页标识 ID;

关联模块，用于将所述网页信息和网页 ID关联并添加到网页信息表。

22、如权利要求 21所述的装置，其特征在于，所述获取模块包括：特征字单元，用于将所述 HTTP 网页请求包中的统一资源定位符 URL 和 hos t字段，通过字符串连接函数连

接成一个特征字段；

序列号单元，用于用散列算法对所述特征字段进行散列得到一个特定长度的序列号；

网页 ID单元，用于将所述一个特定长度的序列号作为所述网页 ID。