WO2013091345A1 - 无线网页浏览资源优化方法、装置及系统 - Google Patents

无线网页浏览资源优化方法、装置及系统 Download PDF

Info

Publication number
WO2013091345A1
WO2013091345A1 PCT/CN2012/075778 CN2012075778W WO2013091345A1 WO 2013091345 A1 WO2013091345 A1 WO 2013091345A1 CN 2012075778 W CN2012075778 W CN 2012075778W WO 2013091345 A1 WO2013091345 A1 WO 2013091345A1
Authority
WO
WIPO (PCT)
Prior art keywords
webpage
http
information
packet
gbr
Prior art date
Application number
PCT/CN2012/075778
Other languages
English (en)
French (fr)
Inventor
周韡
张洪丁
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2013091345A1 publication Critical patent/WO2013091345A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • H04W28/18Negotiating wireless communication parameters
    • H04W28/20Negotiating bandwidth

Definitions

  • the present invention relates to wireless, and in particular resource optimization techniques c relates to wireless web browsing
  • the basic process of the wireless web browsing service is as follows: After the mobile terminal is powered on, a PDP (Package Data Protocol) is connected to the PDP and the PDP is attached. When the mobile terminal needs to send data, the PDP is activated and the IP address is obtained.
  • RNC Radio Network Controller
  • the radio network controller configures a GBR (guaranteed bit rate) according to the wireless static policy (which is generally set by the operator), and switches to the DCH (Dedicated Channel) state to send to the mobile terminal Web page grouping data.
  • the RNC configures the GBR according to the wireless static policy; when the GBR is too low, the webpage display time is long, causing the QOS of the webpage browsing to be low, affecting the user experience; when the GBR is too high, Although QOS for web browsing is guaranteed, it will cause waste of wireless resources.
  • the embodiment of the present invention provides a wireless web browsing resource optimization method, including:
  • the matching is successful, the webpage information corresponding to the webpage ID is obtained from the webpage information table, the guaranteed bit rate GBR matching the webpage information is calculated according to the webpage information, and the GBR is sent to the base station to And causing the base station to allocate a bandwidth resource of the wireless webpage session to the user according to the GBR.
  • the embodiment of the invention further provides a wireless web browsing resource optimization device, including:
  • An identification module configured to identify an HTTP webpage request packet from the received network data packet, where the HTTP webpage request packet is sent when the user requests to browse the webpage;
  • a policy module configured to: when the matching module is successfully matched, obtain webpage information corresponding to the webpage ID from the webpage information table, and calculate a GBR that matches the webpage information according to the webpage information, and The GBR is sent to the base station, so that the base station allocates bandwidth resources of the wireless webpage session to the user according to the GBR.
  • An embodiment of the present invention provides a wireless network resource optimization system, including: a wireless network controller and a base station, where
  • the wireless network controller is configured to: identify an HTTP webpage request packet from the received network data packet; and obtain a webpage ID of the webpage requested by the user according to the identified HTTP webpage request packet;
  • the base station is configured to receive the GBR, and allocate a bandwidth resource of a wireless webpage session to the user according to the GBR.
  • An embodiment of the present invention provides a method for establishing a webpage information table, including:
  • a webpage data identification module configured to identify an HTTP webpage request packet and an HTTP response packet corresponding to the HTTP webpage request packet from the received network data packet;
  • the webpage ID is obtained by the webpage ID, and is used to obtain a webpage ID of the webpage requested by the user according to the HTTP webpage request packet;
  • the association module is configured to associate and add the webpage information and the webpage ID to the webpage information table.
  • the embodiment of the present invention obtains the webpage information of the webpage accessed by the user by querying the webpage information table by using the above technical solution, and calculates and divides the GBR according to the specific information of each webpage, thereby realizing dynamic adjustment of the GBR, and Compared with the prior art solution, the dynamically adjusted GBR can better match different web browsing services, greatly reducing the occurrence of excessive or low GBR in the prior art, improving the user experience and Ensure that the webpage browses QOS while maximizing the utilization of wireless resources.
  • FIG. 3 is a flowchart of a method for optimizing a wireless webpage browsing resource according to an embodiment of the present invention
  • FIG. 4 is a flowchart of a webpage information recording adding method according to an embodiment of the present invention
  • FIG. 6 is a structural diagram of a device for establishing a webpage information table according to an embodiment of the present invention
  • FIG. 7 is a structural diagram of a radio network controller according to an embodiment of the present invention
  • FIG. 8 is a structural diagram of a record adding module of a radio network controller according to an embodiment of the present invention
  • FIG. 9 is a structural diagram of a wireless web browsing resource optimization system according to an embodiment of the present invention.
  • the HTTP protocol defines how a Web client requests a Web page from a Web server during a web session and how the server passes the Web page to the client.
  • the HTTP protocol uses a request/response model. During a complete web session, the following four steps are followed between the web browser and the web server following the HTTP protocol:
  • the web browser Before the web session, the web browser first establishes a connection with the web server through the network.
  • the connection is completed through TCP.
  • the protocol and the IP protocol jointly build the Internet, that is, the famous TCP/IP protocol family, so the Internet is It is called a TCP/IP network.
  • HTTP is a higher-level application layer protocol than TCP. According to the rules, only the lower layer protocol can be established before the connection of the layer protocol can be established. Therefore, the TCP connection must be established first.
  • the port number of the general TCP connection is 80.
  • the request header consists of a keyword/value pair, one pair per line, and the keyword and value are separated by the English colon ":”.
  • Request header The notification server has information about client requests. Typical request headers are:
  • User-Agent The type of browser that generated the request
  • Host The host name of the request, allowing multiple domain names to be in the same IP address, that is, the virtual host.
  • the WeM server accepts the request and returns an HTTP response packet
  • the web server parses the request and locates the request resource.
  • the server writes a copy of the resource to the TCP socket, which is read by the client.
  • An HTTP response packet consists of a status line, a response header, a blank line, and a response data.
  • a web page may contain a variety of content, for example: 3 ⁇ 4.
  • HTTP web request packets for requesting different resources from the web server to obtain complete information of the entire web page.
  • the first HTTP web request packet is used by the web to obtain an HTML file from the server, and then the HTTP web page request packet is sent to obtain images, scripts, and the like from the web server.
  • DPI deep packet inspection
  • SPI Simple Packet Inspection
  • the SPI only analyzes the content of the transport layer (layer 4) of the packet, including the source address. , destination address, source port, destination port, and protocol type.
  • DPI also adds application layer analysis (7-layer analysis) to detect the content of the data packet in the application stream.
  • the real application of data packets because illegal applications can masquerade port numbers, but it is currently difficult to hide the protocol features of the application layer.
  • the DPI feature word recognition method may be used to parse the received packet header and the data portion, and the parsed field is matched with the corresponding feature field of the HTTP webpage request packet.
  • the TCP port number in the header of the data packet is 80
  • the data part of the data packet includes the request method GET
  • the protocol type is HTTP
  • the URL suffix is named .jsp, .asp, .php, .htm, Any of .html and .shtml can determine that the packet is an HTTP web request packet; of course, it can be understood that the more fields are parsed and matched, the more accurate the result will be.
  • HTTP webpage request packet is identified from the received data packet, and other identification technologies such as application layer protocol identification technology, keyword matching or behavioral feature analysis technology can be used.
  • the webpage ID is an identifier used to distinguish different webpages, and the identifier is unique.
  • the URL in the first HTTP webpage request packet received is used as the webpage ID.
  • the specific field in the first HTTP webpage request packet identified by S101 is parsed, and the main URL of the webpage is obtained, and then the UL is used as the webpage ID.
  • the webpage ID may also be adopted.
  • the calculation method obtains: parsing a specific field in the first HTTP webpage request packet identified by S101, extracting a URL and a host field in the HTTP webpage request packet, and then passing the extracted URL field and host field through the string
  • the connection function is connected into a field, and finally the hashed algorithm is used to hash the connected field to obtain a serial number of a specific length, and the serial number is used as the webpage ID.
  • the MD5 algorithm (the fifth version of the message digest algorithm) can be used as the hash algorithm for calculating the webpage ID, that is, MD5 (U L+host ) can obtain the webpage ID; of course, it can be understood that other
  • the hashing algorithm such as SHA-1, is not specifically limited in the embodiment of the present invention. 5103.
  • FIG. 2 is a schematic diagram of a webpage information table according to an embodiment of the present invention.
  • the specific information of the webpage includes but is not limited to: webpage size, webpage level, webpage type.
  • the size of the webpage is the amount of data contained in the entire webpage; the hierarchical level of the webpage corresponds to the directory structure of the webpage, the first level of the directory is the homepage, the number of layers is 1, the number of subpages in the secondary directory is 2, and so on;
  • the page type is used to represent the content topic of a web page, such as news, sports, or finance.
  • FIG. 2 is only an example of a webpage information data table according to an embodiment of the present invention.
  • the table 2 only provides a typical manner for implementing the webpage information table, and is not unique.
  • the table is optimized and improved on the basis of the table. For example, in one embodiment, if the character set, author, version, webpage keyword, and the like of the webpage need to be considered, the corresponding information may be added to the webpage information table.
  • webpage information table may be fixed or updated according to the user's access situation.
  • the matching If the matching is successful, obtain the webpage information corresponding to the webpage ID from the webpage information table, calculate a guaranteed bit rate GBR that matches the webpage information according to the webpage information, and send the GBR to the base station. So that the base station allocates a bandwidth resource of the wireless webpage session to the user according to the GBR.
  • the GBR matching the webpage information is obtained by dividing the webpage level by the user rank factor.
  • the standard time is statically configured by the operator, such as Is, which is obtained on behalf of the user.
  • the RBR sends the GBR to the base station in the form of a GBR configuration file.
  • the base station allocates the bandwidth resources of the web session according to the GBR configuration file, so that the GBR dynamically adjusts according to the webpage information.
  • the webpage information of the webpage accessed by the user is obtained by querying the webpage information table according to the above technical solution, and the GBR is calculated and allocated according to the specific information of each webpage, thereby realizing the dynamic adjustment of the GBR, and
  • the dynamically adjusted GBR can better match different web browsing services, greatly reducing the situation that the GBR is too high or too low in the prior art, improving the user experience and ensuring the webpage. Maximize the use of wireless resources while browsing QOS.
  • an embodiment of the present invention provides a method for optimizing a wireless web browsing resource, including:
  • the received packet header and data portion may be parsed using a DPI feature word identification method, and the parsed field is matched with a corresponding feature field of the HTTP web page request packet.
  • the TCP port number in the header of the data packet is 80
  • the data part of the data packet includes the request method GET
  • the protocol type is HTTP
  • the URL suffix is named .jsp, .asp, .php, .htm, Any one of .htmK .shtml can determine that the packet is an HTTP web page request packet; of course, it can be understood that the more fields are parsed and matched, the more accurate the result will be.
  • the webpage ID is an identifier used to distinguish different webpages, and the identifier is unique.
  • the URL in the first HTTP webpage request packet received is used as the webpage ID.
  • the specific field in the first HTTP webpage request packet identified by S101 is parsed, and the main URL of the webpage is obtained, and then the UL is obtained.
  • the webpage ID may also be obtained by using a calculation method: parsing a specific field in the first HTTP webpage request packet identified by S101, and extracting the URL and the URL in the HTTP webpage request packet.
  • the host field, and then the extracted URL field and the host field are connected into a field by a string concatenation function, and finally the hashed algorithm is used to hash the connected field to obtain a serial number of a specific length, and the sequence is obtained.
  • the number comes as the web page ID.
  • the MD5 algorithm (the fifth version of the message digest algorithm) can be used as the hash algorithm for calculating the webpage ID, that is, MD5 (U L+host ) can obtain the webpage ID; of course, it can be understood that other The hashing algorithm, such as SHA-1, is not specifically limited in the embodiment of the present invention.
  • the obtained webpage ID may be used as a key value, and hash is used. Greek)
  • the index method matches the web page information table.
  • the hash index method has the advantage of quick lookup as a specific search method, which can improve the matching speed. It is to be understood that the method of the hash index is not the only implementation of the matching. Therefore, the manner of the hash index is not limited to the limitation of the embodiment of the present invention. It can be understood that, in another embodiment, B-tree binary tree cable bow I, r-tree cable bow I or foil-text cable bow I.
  • FIG. 2 is a schematic diagram of a webpage information table according to an embodiment of the present invention.
  • the specific information of the webpage includes but is not limited to: webpage size, webpage level, webpage type.
  • the size of the webpage refers to the amount of data contained in the entire webpage; the hierarchical level of the webpage corresponds specifically to the directory structure of the webpage, the first level of the directory is the homepage, the number of layers is 1, the number of subpages in the secondary directory is 2, and so on;
  • the page type is used to represent the content topic of a web page, such as news, sports, or finance.
  • FIG. 2 is only an example of a webpage information data table according to an embodiment of the present invention.
  • the table 2 only provides a typical manner for implementing the webpage information table, and is not unique.
  • the table is optimized and improved on the basis of the table. For example, in one embodiment, if the character set, author, version, webpage keyword, and the like of the webpage need to be considered, the corresponding information may be added to the webpage information table.
  • the method for calculating a matched GBR according to the webpage information includes: (1) obtaining a webpage size and a webpage level from the webpage information;
  • the GBR matching the webpage information is obtained by dividing the webpage level by the user rank factor.
  • the GBR is sent to the base station in the form of a GBR configuration file, and the base station allocates the bandwidth resource of the webpage session according to the GBR configuration file, so that the GBR dynamically adjusts according to the webpage information.
  • the base station allocates the bandwidth of the webpage session according to the GBR configuration file.
  • the currently visited webpage is not recorded in the webpage information table, and belongs to a new webpage.
  • the new webpage needs to be added.
  • the webpage information of the webpage is included in the webpage information table to provide a basis for calculating the GBR.
  • S3601 Identify, from the received network data packet, an HTTP response packet corresponding to the HTTP webpage request packet;
  • the web server sends the resource requested by the web browser to the browser as an HTTP response packet, that is, an HTTP webpage request.
  • the packet corresponds to an HTTP response packet. Therefore, in one embodiment, the HTTP response packet can be simply identified according to the following rules: The next data packet received after the browser sends the HTTP webpage request packet corresponds to the HTTP webpage request packet. HTTP response package. Therefore, after the HTTP webpage request packet is identified according to the method described in step S301, the corresponding HTTP response packet can be identified.
  • the DPI feature word recognition method may also be used to parse and match the content of the network data packet to identify the HTTP response packet.
  • the HTTP webpage request packet and the HTTP response packet are collectively referred to as a webpage browsing data packet, and it should be noted that, when performing webpage browsing, a session (session) includes at least one data stream, and one piece of data.
  • the stream contains multiple web browsing data packets, so the parsing of the identified web browsing data packets is mainly divided into two levels: (1) parsing which web browsing data packets belong to the same data stream; (2) from multiple data Which data streams are parsed in the stream belongs to the same session; the method for realizing the above two levels of parsing can also use the DPI feature word recognition method in S301.
  • parsing the five-tuple (source IP address, source port, destination IP address, destination port, and transport layer protocol number) in the web browsing data packet if the two web browsing packets are five The tuple satisfies any of the following two conditions, and it can be determined that the two data packets belong to the same data stream;
  • the source IP address in one packet quintuple is the destination IP address in the other packet quintuple, and the destination IP address is the source IP address of the other packet.
  • the other three parameters are identical.
  • the HTTP webpage request packet of different data streams is parsed to obtain the value of the Src and the URL field, and the data stream with the same Src and the URL is determined to belong to the same session.
  • the method for counting the size of the webpage is: first establishing a session table and a data flow table, and then recording the size and attribution information of each web browsing data packet to the session table and the flow table in the process of parsing the data packet. (Specifically, the size of the data packet and which data stream the data packet belongs to are recorded in the data flow table, and the information about which session the data packet belongs to is recorded. The session table), finally, the page size is calculated by combining the information recorded in the above two tables; meanwhile, the page level and the page type can be counted by parsing the main URL, which is the URL of the first HTTP webpage request packet in the session. .
  • S3603 Associate the webpage information of the webpage requested by the user with the webpage ID of the webpage requested by the user to be added to the webpage information table.
  • the webpage information of the webpage accessed by the user is obtained by querying the webpage information table according to the above technical solution, and the GBR is calculated and allocated according to the specific information of each webpage, thereby realizing the dynamic adjustment of the GBR, and
  • the dynamically adjusted GBR can better match different web browsing services, greatly reducing the situation that the GBR is too high or too low in the prior art, improving the user experience, and ensuring
  • the webpage browses the QOS while maximizing the utilization of the wireless resources; further, when the matching is unsuccessful, the webpage information that is not recorded in the previous webpage information table is added to the webpage information table at the time of access, and subsequent users access, It is possible to allocate GBR reasonably to optimize wireless resources.
  • an embodiment of the present invention provides a method for establishing a webpage information table, including:
  • S501 Identify, from the received network data packet, an HTTP webpage request packet and an HTTP response packet corresponding to the HTTP webpage request packet, where the HTTP webpage request packet is sent when the user requests to browse the webpage;
  • a piece of information cache may be preset, and when the network data packet arrives, the data packet is copied into the information cache, and then the feature word is identified and parsed, and if the data packet header is parsed
  • the TCP port number is 80.
  • the data part of the packet contains the request method GET, and the protocol type is HTTP, and the URL suffix is any one of .jsp, .asp, .php, .htm, .html, .shtml.
  • it can be determined that the data packet is an HTTP webpage request packet.
  • the next network data packet received by the browser after sending an HTTP webpage request packet is necessarily An HTTP response packet corresponding to the HTTP webpage request packet; S502.
  • the URL in the first HTTP web request packet identified is used as the web page ID.
  • the specific field in the first HTTP webpage request packet identified by S501 is parsed, and the main URL of the webpage is obtained, and then the URL is used as the webpage ID; in another embodiment, the webpage ID may also be adopted.
  • the calculation method obtains: parsing a specific field in the first HTTP webpage request packet identified by S101, extracting a URL and a host field in the HTTP webpage request packet, and then passing the extracted URL field and host field through the string
  • the connection function is connected into a field, and finally the hashed algorithm is used to hash the connected field to obtain a serial number of a specific length, and the serial number is used as the webpage ID.
  • the MD5 algorithm (the fifth version of the message digest algorithm) can be used as the hash algorithm for calculating the webpage ID, that is, MD5 (U L+host ), and the webpage ID can be obtained; of course, it can be understood that other The hash algorithm, such as SHA-1, is not specifically limited in the embodiment of the present invention.
  • the analysis of the identified HTTP response packet is mainly divided into two levels: (1) parsing which HTTP response packets belong to the same data stream; (2) parsing which data streams belong to the same session from multiple data streams;
  • the above two levels of analysis methods can also use the DPI feature word parsing method in S101.
  • the quintuple (source IP address, source port, destination IP address, destination port, and transport layer protocol number) in the HTTP response packet is parsed, if the quintuple of two HTTP response packets Exactly the same, it can be determined that the two data packets belong to the same data stream;
  • the method for obtaining the size of the webpage is: first establishing a session table and a data flow table, and then recording the size and attribution information of each web browsing data packet to the session table in the process of identifying the data packet and determining in S501.
  • the flow table specifically, the size of the data packet and which data stream the data packet belongs to are recorded in the data flow table, and the session in which the data packet belongs belongs to the session table
  • the information recorded in the table counts the size of the webpage; at the same time, the webpage level and the webpage type can be obtained by parsing the main URL, which is the URL of the first HTTP webpage requesting package in the session.
  • the webpage hierarchy is determined according to the number of slashes in the main URL
  • the type of the webpage is determined according to the keyword in the URL
  • 3 slashes here, indicating that this page is a third-level webpage; parsing the content between slashes, you can get keywords, such as news, lady, then this page is female, news type, if If there is no keyword, it means that it is the homepage of the website, and the type field is empty.
  • the DPI identification method is used to deeply analyze the network data packet, and the accuracy of the analysis is ensured.
  • the webpage information is counted according to the parsed result, and the parsed result is recorded as the webpage information.
  • Add to the web page information table to facilitate the specific information of the web page directly when accessing the web page.
  • an embodiment of the present invention provides an apparatus for establishing a webpage information table, including: a webpage information identification module 610, configured to identify an HTTP webpage request packet and the HTTP webpage request from the received network data packet.
  • the webpage ID is obtained by the MME, and is configured to obtain a webpage ID of the webpage requested by the user according to the HTTP webpage request packet.
  • the webpage information statistic module 630 is configured to calculate webpage information by parsing an HTTP response packet corresponding to the HTTP webpage request packet;
  • the association module 640 is configured to associate and add the webpage information and the webpage ID to the webpage information table. Further, in an embodiment, the obtaining module 620 specifically includes:
  • a feature word unit 6201 configured to connect the URL and the host field in the HTTP webpage request packet to a feature field by using a string concatenation function
  • a sequence number unit 6202 configured to hash the feature field by a hash algorithm to obtain a serial number of a specific length
  • the webpage ID unit 6203 is configured to use the serial number of the specific length as the webpage ID. According to the above technical solution, the DPI identification method is used to deeply analyze the network data packet, and the accuracy of the analysis is ensured. At the same time, the webpage information is counted according to the parsed result, and the parsed result is recorded as the webpage information. Add to the web page information table to facilitate the specific information of the web page directly when accessing the web page.
  • an embodiment of the present invention provides a wireless webpage browsing resource optimization apparatus, including: an identification module 710, configured to identify an HTTP webpage request packet from a received network data packet;
  • the identification module may parse the received packet header and the data portion by using a feature word recognition method, and match the parsed field with a corresponding feature field of the HTTP webpage request packet.
  • the data part of the data packet includes the request method GET, and the protocol type is HTTP, and the URL suffix is named .jsp, .asp, .php, .htm, Any one of .htmK .shtml can determine that the packet is an HTTP web page request packet; of course, it can be understood that the more fields are parsed and matched, the more accurate the result will be.
  • the obtaining module 720 receives the URL in the first HTTP webpage request packet as the webpage ID.
  • the specific field in the first HTTP webpage request packet identified by the identification module 710 is parsed to obtain the main URL of the webpage, and then the URL is used as the webpage ID; in another embodiment, the webpage ID is also
  • the method may be obtained by using a calculation method: parsing a specific field in the first HTTP webpage request packet identified by the identification module 710, extracting a URL and a host field in the HTTP webpage request packet, and then extracting the extracted URL field and the host
  • the fields are concatenated into a field by a string concatenation function, and finally the hashed algorithm is used to hash the connected fields to obtain a serial number of a specific length, and the serial number is used as the webpage ID.
  • the MD5 algorithm (the fifth version of the message digest algorithm) can be used as the hash algorithm for calculating the webpage ID, that is, MD5 (URL+host) can obtain the webpage ID; of course, it can be understood that other The hash algorithm, such as SHA-1, is not specifically limited in the embodiment of the present invention.
  • a matching module 730 configured to acquire the webpage ID obtained by the mob block 720 and the pre-established webpage information table information
  • the matching module 730 may use the webpage ID obtained by the obtaining module 720 as a key value to match the webpage information table by using a hash index method.
  • the hash index method has the advantage of quick lookup as a specific search method, which can improve the matching speed. It is to be understood that the method of the hash index is not the only implementation of the matching. Therefore, the method of the hash index should not be construed as limiting the embodiment of the present invention as an example.
  • the policy module 740 is configured to: when the matching module 730 matches successfully, calculate a GBR that matches the webpage information according to the webpage information in the webpage information table, and send the GBR to the base station, so that the base station follows the The GBR allocates bandwidth resources for a wireless web session.
  • the policy module 740 is further configured to send the pre-configured GBR to the base station when the matching module 730 fails to match, so that the base station allocates the bandwidth resource of the wireless webpage session according to the GBR.
  • the matching module 730 if the matching module 730 is successfully matched, it indicates that the webpage information corresponding to the webpage ID is already recorded in the table in the webpage information table, so the policy module 740 can be based on the webpage matching the webpage ID in the webpage information table.
  • the information is used to calculate the GBR, and the calculated GBR is sent to the base station in the form of a GBR configuration file for allocation of bandwidth resources of the wireless webpage session.
  • the GBR matching the webpage information is obtained by dividing the webpage level by the user rank factor.
  • the policy module 740 sends the GBR to the base station in the form of a GBR configuration file, and the base station allocates the bandwidth resources of the webpage session according to the GBR configuration file, so that the GBR dynamically adjusts according to the webpage information.
  • the wireless web browsing resource optimization apparatus further includes:
  • a record adding module 750 configured to add the unsuccessful webpage ID and the corresponding webpage information as a new record to the webpage information table
  • the record adding module 750 specifically includes: a first identifying unit 7501, configured to identify, from the received network data packet, an HTTP corresponding to the HTTP webpage request packet.
  • Response package configured to identify, from the received network data packet, an HTTP corresponding to the HTTP webpage request packet.
  • the identification unit 7501 can also use the DPI feature word identification method to parse and match the content of the network data packet to identify the HTTP response packet.
  • the parsing statistics unit 7502 is configured to parse the HTTP response packet corresponding to the HTTP webpage request packet identified by the identification unit 7501, and count the webpage information;
  • the storage unit 7503 is configured to associate and add the webpage information of the webpage requested by the user to the webpage ID of the webpage requested by the user to the webpage information table.
  • the webpage information of the webpage accessed by the user is obtained by querying the webpage information table according to the above technical solution, and the GBR is calculated and allocated according to the specific information of each webpage, thereby realizing the dynamic adjustment of the GBR, and
  • the dynamically adjusted GBR can better match different web browsing services, greatly reducing the situation that the GBR is too high or too low in the prior art, improving the user experience, and ensuring
  • the webpage browses the QOS while maximizing the utilization of the wireless resources; further, the webpage information not recorded by the previous webpage information table is added to the webpage information table by the record adding module, and the webpage information table is updated, so that when When other users visit and access the web page, they can calculate the matching GBR and optimize the resources.
  • an embodiment of the present invention provides a wireless network resource optimization system, including: a wireless network controller 80, where the wireless network controller 80 is a wireless network controller according to an embodiment of the present invention;
  • the base station 90 is configured to receive the GBR sent by the radio network controller 80, and allocate a bandwidth of the webpage session to the user according to the GBR.
  • the wireless network controller obtains the webpage information of the webpage accessed by the user by querying the webpage information table based on the identification of the webpage data, and calculates and allocates the GBR according to the specific information of each webpage, thereby realizing the GBR.
  • Dynamic adjustment compared with the prior art solution, the dynamically adjusted GBR can better match different web browsing services, greatly reducing the situation that the GBR is too high or too low in the prior art, and improving the user experience.
  • the wireless network controller adds the webpage information not recorded in the previous webpage information table to the webpage information table through the record adding module, and realizes the webpage The update of the information table, so that when the subsequent users access and access the webpage, the radio network controller can calculate the matching GBR according to the updated webpage information table, and send it to the base station for wireless resources.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开一种无线网页浏览资源优化方法,包括:从接收到的网络数据包中识别出HTTP网页请求包;根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID;将该网页ID和预先建立的网页信息表匹配;若匹配成功,从网页信息表中得到该网页ID对应的网页信息,根据网页信息计算出与该网页信息匹配的GBR,并将该GBR发送给基站,以基站根据该GBR为用户分配无线网页会话的带宽资源。相应地,本发明实施例还公开了一种建立网页信息表的方法、无线网页浏览资源优化装置以及无线网络资源优化系统,通过以上技术方案,能根据每个网页的具体信息来计算并分配GBR,实现无线网页浏览时的资源的优化。

Description

无线网页浏览资源优化方法、 装置及系统
技术领域
本发明涉及无线领域, 尤其涉及无线网页浏览的资源优化技术 c
背景技术
在移动互联网的发展浪潮中, 随着智能手机、平板电脑等便携终端产业链 的爆发和成熟, 网页浏览、 移动即时通讯、 移动社区、 移动支付等各类基于移 动终端的应用也层出不穷,在这其中,无线网页浏览由于能够为人们即时提供 新鲜、 海量的资讯, 是目前用户使用最普遍的移动互联网应用。
目前无线网页浏览业务的基本流程为: 移动终端开机后建立 PDP(Package Data Protocol , 分组数据协议)连接 PDP以及 PDP附着, 当移动终端需要发送 数据时激活 PDP并获取 IP地址, RNC ( Radio Network Controller, 无线网络 控制器)根据无线静态策略(该静态策略一般由运营商来设置) 配置 GBR ( guarantee bit rate, 保证比特速率), 并切换到 DCH ( Dedicated Channel , 专 用信道)状态, 向移动终端发送网页分组数据。
现有方案中, 用户进行无线网页浏览时, RNC根据无线静态策略来配置 GBR; 当 GBR过低时, 网页显示时间较长, 造成网页浏览的 QOS低, 影响用 户体验; 当 GBR过高时, 尽管保证了网页浏览的 QOS, 但会造成无线资源的 浪费。 发明内容
为了在用户进行无线网页浏览时, 提高用户体验以及减少无线资源的浪 费, 本发明实施例提供一种无线网页浏览资源优化方法, 包括:
从接收到的网络数据包中识别出超文本传输协议 HTTP网页请求包,所述 HTTP网页请求包是用户请求浏览网页时发送的;
根据识别出的 HTTP 网页请求包, 获取所述用户请求浏览的网页的网页
ID;
将获取的网页 ID和预先建立的网页信息表匹配; 如果匹配成功, 从所述网页信息表中得到所述网页 ID对应的网页信息, 根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR, 并将所 述 GBR发送给基站,以使所述基站按照所述 GBR为所述用户分配无线网页会 话的带宽资源。
本发明实施例还提供一种无线网页浏览资源优化装置, 包括:
识别模块, 用于从接收到的网络数据包中识别出 HTTP网页请求包, 所述 HTTP网页请求包是用户请求浏览网页时发送的;
获耳 莫块,用于从所述识别模块识别出的 HTTP网页请求包中获取所述用 户请求浏览的网页的网页 ID;
匹配模块, 用于将所述获 莫块获取的网页 ID和预先建立的网页信息表 匹配;
策略模块, 用于在所述匹配模块匹配成功时,从所述网页信息表中得到所 述网页 ID对应的网页信息, 根据所述网页信息计算出与所述网页信息匹配的 GBR, 并将所述 GBR发送给基站, 以使所述基站按照所述 GBR为所述用户 分配无线网页会话的带宽资源。
本发明实施例提供一种无线网络资源优化系统, 包括: 无线网络控制器和 基站, 其特征在于,
所述无线网络控制器用于,从接收到的网络数据包中识别出 HTTP网页请 求包; 根据识别出的 HTTP网页请求包, 获取用户请求浏览的网页的网页 ID;
将获取的网页 ID和预先建立的网页信息表匹配; 如果匹配成功, 从所述 网页信息表中得到所述网页 ID对应的网页信息, 根据所述网页信息计算出与 所述网页信息匹配的 GBR, 并将所述 GBR发送给基站;
所述基站用于, 接收所述 GBR, 并根据所述 GBR为所述用户分配无线网 页会话的带宽资源。
本发明实施例提供一种建立网页信息表的方法, 包括:
从接收到的网络数据包中识别出 HTTP网页请求包及所述 HTTP网页请求 包对应的 HTTP响应包,所述 HTTP网页请求包是用户请求浏览网页时发送的; 根据所述 HTTP网页请求包, 获取用户请求浏览的网页的网页 ID;
通过解析所述 HTTP网页请求包对应的 HTTP响应包,统计得出网页信息; 建立所述网页 ID和所述网页信息的关联关系。 本发明实施例还提供一种建立网页信息表的装置, 包括:
网页数据识别模块,用于从接收到的网络数据包中识别出 HTTP网页请求 包及所述 HTTP网页请求包对应的 HTTP响应包;
网页 ID获耳 莫块, 用于根据所述 HTTP网页请求包, 获取用户请求浏览 的网页的网页 ID;
网页信息统计模块,用于通过解析所述 HTTP网页请求包对应的 HTTP响 应包, 统计得出网页信息;
关联模块, 用于将所述网页信息和网页 ID关联并添加到网页信息表。 本发明实施例通过以上技术方案,基于网页数据的识别,通过查询网页信 息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分 GBR, 实现 GBR的动态调整, 与现有技术方案相比, 动态调整的 GBR能 更好地跟不同的网页浏览业务相匹配, 较大地减少了现有技术中 GBR过高或 过低的情况的发生, 提高了用户的体验并在保证网页浏览 QOS的同时实现无 线资源的最大化利用。 附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地, 下面描述 中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1为本发明实施例提供的一种无线网页浏览资源优化方法的流程图; 图 2为本发明实施例提供的一种网页信息表的示意图;
图 3为本发明实施例提供的一种无线网页浏览资源优化方法的流程图; 图 4为本发明实施例提供的一种网页信息记录添加方法流程图; 图 5为本发明实施例提供的一种建立网页信息表的方法流程图; 图 6为本发明实施例提供的一种建立网页信息表的装置结构图; 图 7为本发明实施例提供的一种无线网络控制器的结构图;
图 8为本发明实施例提供的无线网络控制器的记录添加模块结构图; 图 9为本发明实施例提供的一种无线网页浏览资源优化系统结构图。 具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造 性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。
为使本领域一般技术人员更好的了解本发明实施例提供的技术方案,对网 页会话 ( session )的 HTTP(Hyper Text Transfer Protocol, 超文本传输协议)通信 机制和无线网络 GBR做一些简单的介绍:
HTTP互联网上应用最为广泛的一种网络协议, 所有的 WWW文件都必须 遵守这个标准。 HTTP协议定义了网页会话过程中 Web客户端如何从 Web服务 器请求 Web页面, 以及服务器如何把 Web页面传送给客户端, HTTP协议采用 了请求 /响应模型。在一次完整的网页会话过程中, Web浏览器与 Web服务器之 间将遵循 HTTP协议完成下列 4个步骤:
( 1 )建立网页会话连接;
在进行网页会话之前, Web浏览器首先要通过网络与 Web服务器建立连 接, 该连接是通过 TCP来完成的, 该协议与 IP协议共同构建 Internet, 即著名的 TCP/IP协议族, 因此 Internet又被称作是 TCP/IP网络。 HTTP是比 TCP更高层次 的应用层协议, 根据规则, 只有低层协议建立之后才能, 才能进行更层协议的 连接, 因此, 首先要建立 TCP连接, 一般 TCP连接的端口号是 80;
( 2 ) Web浏览器向 Web服务器发送 HTTP网页请求包;
一旦建立了 TCP连接, Web浏览器根据用户请求访问的网址, 就会向 Web 服务器发送 HTTP网页请求包, HTTP网页请求包包含: 请求的方法、 URL、 协 议版本、 请求头部和请求数据。 其中, HTTP协议的请求方法有 GET、 POST, HEAD, PUT, DELETE、 OPTIONS、 TRACE、 CONNECT, 而网页浏览时一 般只用 GET方法; URL ( Uniform Resource Locator, 统一资源定位符)是因特 网上标准的资源的地址, URL由协议、 域名、 请求地址三部分组成, 完整地 URL唯一确定了一个请求的资源, 可以是页面、 内容模块、 文件或多媒体资源 等, 比如浏览网 易首页 =>体育频道 =>意曱, 它们的 U L依次为 http://www.163.com/=> http://sports.163.com/=> http:〃 sports.163.com/yj/。请求头 部由关键字 /值对组成, 每行一对, 关键字和值用英文冒号 ":" 分隔。 请求头 部通知服务器有关于客户端请求的信息, 典型的请求头有:
User-Agent: 产生请求的浏览器类型;
Accept: 客户端可识别的内容类型列表;
Host: 请求的主机名, 允许多个域名同处一个 IP地址, 即虚拟主机。
请求数据不在 GET方法中使用, 而是在 POST方法中使用。
( 3 ) WeM良务器接受请求并返回 HTTP响应包;
Web服务器解析请求,定位请求资源。服务器将资源复本写到 TCP套接字, 由客户端读取。 一个 HTTP响应包由状态行、 响应头部、 空行和响应数据 4部分 组成。
( 4 )释放连接 TCP连接。
GBR是保证比特率 ( Guarantee Bit Rate )的缩写, 具体指 RNC为分组数据 业务分配的最小带宽, 用以满足分组数据业务的最低带宽需求。 目前, 无线网 络的 GBR都是由基站根据 RNC中的无线静态策略配置的,对于无线网页浏览业 务, 一般为 64Kbps。 如图 1所示, 本发明实施例提供一种无线网页浏览资源优化方法, 包括:
S 101 ,从接收到的网络数据包中识别出 HTTP网页请求包, 所述 HTTP网页 请求包是用户请求浏览网页时发送的;
根据之前介绍的网页会话的 HTTP通信机制, 网页会话 TCP连接建立后, 浏览器根据用户输入的网址, 发出 HTTP网页请求包, Web服务器在收到 HTTP 网页请求包后, 将用户请求的网页的网页内容以 HTTP响应包的形式发送给浏 览器。 需要说明的是, 由于网页具有分层结构, 一个网页包含的内容可能有多 种, 例: ¾。html ( Hypertext Markup Language , 文本标己语言) 、 廣 p本、 CSS ( Cascading Style Sheet, 级联样式表)以及图片, 相应地, 上述每一种内容对 应为 Web服务器上的一个资源, 因此, 一次网页会话过程中可能有多个 HTTP 网页请求包用于向 Web服务器请求不同的资源, 以获取整个网页的完整信息。 例如: 第一个 HTTP网页请求包用于 Web从服务器获取 HTML文件, 然后依次 通发送 HTTP网页请求包用于从 Web服务器获取图片、 脚本等其他内容。
需要说明的是, 由于 HTTP是应用层协议, 而为了从网络数据包中识别出 HTTP网页请求包, 本发明实施例采用了 DPI技术。 DPI是深度包检测 ( Deep Packet Inspection ) 的缩写, 所谓 "深度" 是和 SPI ( Simple Packet Inspection, 简单报文识别) 的层次相比较而言的, SPI仅分析数据包的传输层(层 4 ) 以 下的内容, 包括源地址、 目的地址、源端口、 目的端口以及协议类型,而 DPI 除 了对前面的层次分析外, 还增加了应用层分析(7层分析) , 通过对应用流中 的数据报文内容进行探测,从而确定数据报文的真正应用, 因为非法应用可以 伪装端口号, 但目前难以隐藏应用层的协议特征。
具体地, 在一个实施例中, 可以采用 DPI特征字识别的方法, 对接收到的 数据包头部以及数据部分进行解析, 并将解析出的字段与 HTTP网页请求包的 对应特征字段进行匹配。 具体地, 若解析出数据包头部中 TCP端口号为 80, 数 据包的数据部分包含有请求方法 GET, 同时协议类型为 HTTP、 且 URL后缀名 为. jsp、 .asp, .php、 .htm, .html、 .shtml中的任何一种, 就可以判定该数据包为 HTTP网页请求包; 当然可以理解的是, 解析和匹配的字段越多, 判定的结果 会越准确。
当然可以理解的是, 从接受到的数据包中识别出 HTTP网页请求包, 还可 以采用其他的识别技术, 比如说应用层协议识别技术、 关键字匹配或行为特征 分析技术。
S102, 根据识别出的 HTTP网页请求包, 获取用户请求浏览的网页的网页
ID;
需要说明的是, 网页 ID是用来区分不同网页的标识, 且该标识是唯一的。 在本发明的一个实施例中, 将网页会话 TCP连接建立后, 接收到的首个 HTTP网页请求包中的 URL作为网页 ID。 具体地, 将 S101识别出的首个 HTTP 网页请求包中的特定字段进行解析, 即可得到该网页的主 URL, 然后以此 U L 作为网页 ID; 在另一个实施例中, 网页 ID也可以采用计算的方法获取: 将 S101 识别出的首个 HTTP网页请求包中的特定字段进行解析,并提取该 HTTP网页请 求包中的 URL和 host字段, 再将提取出的 URL字段和 host字段通过字符串连接 函数连接成一个字段, 最后用散列算法对连接出的字段进行散列,得出一个特 定长度的序列号, 并以此序列号来作为网页 ID。 具体地, 可以采用 MD5算法 (消息摘要算法第五版)来作为计算网页 ID的散列算法, 即 MD5 ( U L+host ) 即可得出网页 ID; 当然可以理解的是,还可以采用其他的散列算法,如 SHA-1 , 本发明实施例不做特别限定。 5103 ,将获取的网页 ID和预先建立的网页信息表匹配,所述网页信息表包 在一个实施例中, 在进行匹配时, 可以将获取的网页 ID作为键(key )值, 采用 hash (哈希)索引的方法与网页信息表进行匹配。 Hash索引的方法作为一 个具体的查找方式具有迅速查找的优势, 能提高匹配速度。 可以理解的是 hash 索引的方法并不是匹配的唯一实现方式,故 hash索引的方式作为一个举例不应 理解为对本发明实施例的限定, 可以理解的是, 在另一个实施例中, 还可以采 用 b-tree二叉树索弓 I、 r-tree索弓 I或 foil-text索弓 I。
图 2所示为本发明实施例提供的一种网页信息表的示意图。根据图 2, 网页 的具体信息包括但不限于: 网页大小、 网页层次、 网页类型。 其中, 网页大小 为整个网页包含的数据量; 网页层次具体与网页的目录结构对应, 第一级目录 为主页, 层数为 1 , 二级目录中的子网页层数为 2, 以此类推; 网页类型用于表 示网页的内容主题, 比如新闻、 体育或财经等。 需要说明的是, 图 2仅仅是本 发明实施例的一个网页信息数据表的举例, 图 2所示的网页信息表只是提供了 网页信息表实现的一种典型方式, 不是唯一的, 可以在此表的基础上进行优化 和完善。 例如, 在一个实施例中, 如果需要考虑网页的字符集、 作者、 版本、 网页关键字等因素, 就可以在网页信息表中添加这些相应信息。
需要说明的是, 网页信息表可以是固定不变的,也可以根据用户的访问情 况进行更新。
5104,如果匹配成功,从所述网页信息表中得到所述网页 ID对应的网页信 息,根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR,并将 所述 GBR发送给基站,以使所述基站按照所述 GBR为所述用户分配无线网页会 话的带宽资源。
具体地,在一个实施例中,根据网页信息计算与之匹配的 GBR的方法包括:
( 1 )从所述网页信息中获取网页大小和网页层次;
( 2 )用网页大小除以标准时间, 得到与所述网页信息匹配的 GBR; 或者 网页大小除以网页层次, 再除以标准时间, 得到与所述网页信息匹配的 GBR; 或者用网页大小除以网页层次,再除以用户等级系数,得到与所述网页信息匹 配的 GBR。
其中, 标准时间是由运营商静态配置的, 比如 Is, 它代表用户获得一个完 整的网页信息所需的平均时间; 用户等级系数是根据用户类型来设置的,例如 金牌用户 = 1 , 银牌用户 = 2, 铜牌用户 = 3。 具体地, 上述计算方法可以用公 式表示为: GBR = 网页大小 /标准时间; 在另一个实施例中, GBR的计算方法 可以为: GBR = 网页大小 /标准时间 * 网页层次; 在另一个实施例中, GBR的 计算方法还可以 GBR = 网页大小 /标准时间 * 网页层次 /用户等级系数。
GBR计算完成后, RNC将该 GBR以 GBR配置文件的形式下发给基站, 基 站按照 GBR配置文件分配网页会话的带宽资源,从而实现 GBR根据网页信息进 行动态调整。
本发明实施例通过以上技术方案,基于网页数据的识别,通过查询网页信 息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分 配 GBR, 实现 GBR的动态调整, 与现有技术方案相比, 动态调整的 GBR能更 好地跟不同的网页浏览业务相匹配,较大地减少了现有技术中 GBR过高或过低 的情况,提高了用户的体验并在保证网页浏览 QOS的同时实现无线资源的最大 化利用。
如图 3所示, 本发明实施例提供一种无线网页浏览资源优化方法, 包括:
5301 ,从接收到的网络数据包中识别出 HTTP网页请求包, 所述 HTTP网页 请求包是用户请求浏览网页时发送的;
在一个实施例中, 可以采用 DPI特征字识别的方法, 对接收到的数据包头 部以及数据部分进行解析, 并将解析出的字段与 HTTP网页请求包的对应特征 字段进行匹配。 具体地, 若解析出数据包头部中 TCP端口号为 80, 数据包的数 据部分包含有请求方法 GET , 同时协议类型为 HTTP、 且 URL后缀名 为. jsp、 .asp, .php、 .htm, .htmK .shtml中的任何一种, 就可以判定该数据包为 HTTP网页请求包; 当然可以理解的是, 解析和匹配的字段越多, 判定的结果 会越准确。
5302, 根据识别出的 HTTP网页请求包, 获取用户请求浏览的网页的网页
ID;
需要说明的是, 网页 ID是用来区分不同网页的标识, 且该标识是唯一的。 在本发明的一个实施例中, 将网页会话 TCP连接建立后, 接收到的首个 HTTP网页请求包中的 URL作为网页 ID。 具体地, 将 S101识别出的首个 HTTP 网页请求包中的特定字段进行解析, 即可得到该网页的主 URL, 然后以此 U L 作为网页 ID; 在另一个实施例中, 网页 ID也可以采用计算的方法获取: 将 S101 识别出的首个 HTTP网页请求包中的特定字段进行解析,并提取该 HTTP网页请 求包中的 URL和 host字段, 再将提取出的 URL字段和 host字段通过字符串连接 函数连接成一个字段, 最后用散列算法对连接出的字段进行散列,得出一个特 定长度的序列号, 并以此序列号来作为网页 ID。 具体地, 可以采用 MD5算法 (消息摘要算法第五版)来作为计算网页 ID的散列算法, 即 MD5 ( U L+host ) 即可得出网页 ID; 当然可以理解的是,还可以采用其他的散列算法,如 SHA-1 , 本发明实施例不做特别限定。
5303 ,将获取的网页 ID和预先建立的网页信息表匹配,所述网页信息表包 在一个实施例中, 在进行匹配时, 可以将获取的网页 ID作为键(key )值, 采用 hash (哈希) 索引的方法与网页信息表进行匹配。 hash索引的方法作为一 个具体的查找方式具有迅速查找的优势, 能提高匹配速度。 可以理解的是 hash 索引的方法并不是匹配的唯一实现方式,故 hash索引的方式作为一个举例不应 理解为对本发明实施例的限定, 可以理解的是, 在另一个实施例中, 还可以采 用 b-tree二叉树索弓 I、 r-tree索弓 I或 foil-text索弓 I。
图 2所示为本发明实施例提供的一种网页信息表的示意图。根据图 2, 网页 的具体信息包括但不限于: 网页大小、 网页层次、 网页类型。 其中, 网页大小 指整个网页包含的数据量; 网页层次具体与网页的目录结构对应, 第一级目录 为主页, 层数为 1 , 二级目录中的子网页层数为 2, 以此类推; 网页类型用于表 示网页的内容主题, 比如新闻、 体育或财经等。 需要说明的是, 图 2仅仅是本 发明实施例的一个网页信息数据表的举例, 图 2所示的网页信息表只是提供了 网页信息表实现的一种典型方式, 不是唯一的, 可以在此表的基础上进行优化 和完善。 例如, 在一个实施例中, 如果需要考虑网页的字符集、 作者、 版本、 网页关键字等因素, 就可以在网页信息表中添加这些相应信息。
5304,如果匹配成功,从所述网页信息表中得到所述网页 ID对应的网页信 息,根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR,并将 所述 GBR发送给基站,以使所述基站按照所述 GBR为所述用户分配无线网页会 话的带宽资源;
具体地, 在一个实施例中, 根据网页信息计算匹配的 GBR的方法包括: ( 1 )从所述网页信息中获取网页大小和网页层次;
( 2 )用网页大小除以标准时间, 得到与所述网页信息匹配的 GBR; 或者 网页大小除以网页层次, 再除以标准时间, 得到与所述网页信息匹配的 GBR; 或者用网页大小除以网页层次,再除以用户等级系数,得到与所述网页信息匹 配的 GBR。
其中, 标准时间是由运营商静态配置的, 比如 Is, 它代表用户获得一个完 整的网页信息所需的平均时间, 用户等级系数是根据用户类型来设置的,例如 金牌用户 = 1 , 银牌用户 = 2, 铜牌用户 = 3。 具体地, 上述计算方法可以用公 式表示为: GBR = 网页大小 /标准时间; 在另一个实施例中, GBR的计算方法 可以为: GBR = 网页大小 /标准时间 * 网页层次; 在另一个实施例中, GBR的 计算方法还可以 GBR = 网页大小 /标准时间 * 网页层次 /用户等级系数。
GBR计算完成后, 将该 GBR以 GBR配置文件的形式下发给基站, 基站按 照 GBR配置文件分配网页会话的带宽资源,从而实现 GBR根据网页信息进行动 态调整。
5305, 如果匹配不成功, 将预先配置的 GBR发送给基站, 以使所述基站根 据所述预先配置的 GBR为所述用户分配无线网页会话的带宽资源;
在一个实施例中,如果匹配不成功,说明当前访问的网页信息并没有记录 在网页信息表中, 这时就将预先配置的 GBR (由用户配置, 例如 64kbps ) 以 GBR配置文件的形式下发给基站,基站按照该 GBR配置文件分配网页会话的带 宽。
在另一个实施例中, 如图 3的虚线框所示, 本发明实施例提供的无线网页 浏览资源优化方法还包括:
5306,将匹配不成功的网页 ID及对应的网页信息作为新的记录添加到网页 信息表中。
在一个实施例中,如果匹配不成功,说明当前访问的网页在网页信息表中 并没有记录,属于一个新的网页, 为了使后续用户访问该网页时能进行资源的 优化,需要添加此新的网页的网页信息到网页信息表中,为计算 GBR提供依据。
在一个实施例中, 如图 4所示, S306具体包括:
S3601 , 从接收到的网络数据包中识别出与所述 HTTP网页请求包对应的 HTTP响应包; 需要说明的是, 根据网页浏览的 HTTP通信机制, Web服务器收到 Web浏 览器发出 HTTP网页请求包后,会将 Web浏览器请求的资源以 HTTP响应包形式 发送给浏览器, 即一个 HTTP网页请求包对应一个 HTTP响应包, 因此, 在一个 实施例中, 可以按照以下规则来简单识别出 HTTP响应包: 浏览器发出 HTTP 网页请求包之后收到的下一个数据包即为该 HTTP网页请求包对应的 HTTP响 应包。 因此, 根据步骤 S301中描述的方法识别出 HTTP网页请求包之后, 即可 识别出其对应的 HTTP响应包。在另一个实施例中,也可以采用 DPI特征字识别 的方法, 对网络数据包的内容进行解析和匹配 , 从而识别出 HTTP响应包。
S3602 , 解析识别出的 HTTP网页请求包对应的 HTTP响应包, 统计出用户 请求浏览的网页的网页信息;
为了便于描述,本发明实施例将 HTTP网页请求包和 HTTP响应包统称为网 页浏览数据包, 需要说明的是, 在进行网页浏览的时候, 一个 session (会话) 至少包含一条数据流, 而一条数据流包含多个网页浏览数据包, 因此对识别出 的网页浏览数据包进行解析主要分为两个层次: ( 1 )解析出哪些网页浏览数 据包属于同一条数据流; (2 )从多条数据流中解析出哪些数据流属于同一 session; 实现上述两个个层次的解析方法同样可以采用 S301中的 DPI特征字识 别的方法。
具体地, 在一个实施例中, 解析网页浏览数据包中的五元组(源 IP地址, 源端口, 目的 IP地址, 目的端口, 和传输层协议号) , 如果两个网页浏览数据 包的五元组满足以下两个条件中的任何一种,就可以判定这两个数据包属于同 一条数据流;
( 1 ) 两个数据包的五元组完全相同;
( 2 ) 一个数据包五元组中的源 IP地址为另一个数据包五元组中目的 IP地址, 且目的 IP地址为另一个数据包的源 IP地址, 其余三个参数完全相同。
进一步地, 对不同数据流的 HTTP网页请求包进行解析, 得到 Src和 URL字 段的值, Src和 URL完全相同的的数据流就判定为属于同一个 session。
在一个实施例中, 统计网页大小的方法为: 先建立 session表和数据流表, 然后在上述解析数据包的过程中将每个网页浏览数据包的大小和归属信息记 录到 session表和流表中(具体地, 数据包的大小以及数据包属于哪条数据流这 两个信息记载到数据流表, 数据包所在流属于哪个 session这一信息记载到 session表), 最后结合上述两个表中记载的信息统计出网页大小; 同时, 可以 通过解析主 URL来统计网页层次和网页类型, 所述主 URL为 session中第一个 HTTP网页请求包的 URL。具体地,根据主 URL中斜杠的数量来判断网页层次, 根据 URL 中 的 关 键 字 来 判 断 网 页 的 类 型 , 例 如 URL 为 /news/lady/default.j sp?user=abc&refer=htt ://www.163.com/lady , 才艮据斜杠的数 量来判断网页层次 (从 URL开头到问号结束, 没有问号则到空格结束), 此处共 有 3个斜杠, 则说明此网页为第三层网页; 解析斜杠之间的内容, 可以获得关 键字, 比如 news、 lady, 则说明此网页时女性、 新闻类型。 如果没有关键字则 表示是网站主页, 类型字段给空。
S3603 , 将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网 页的网页 ID关联并添加到所述网页信息表。
本发明实施例通过以上技术方案,基于网页数据的识别,通过查询网页信 息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分 配 GBR, 实现 GBR的动态调整, 与现有技术方案相比, 动态调整的 GBR能更 好地跟不同的网页浏览业务相匹配,较大地减少了现有技术中 GBR过高或过低 的情况,提高了用户的体验, 并在保证网页浏览 QOS的同时实现无线资源的最 大化利用; 进一步地, 当匹配不成功的时候, 通过将之前网页信息表没有记录 的网页信息在访问的时候添加到网页信息表,后续其他用户访问时, 就可以对 其合理分配 GBR, 实现无线资源的优化。
如图 5所示, 本发明实施例提供一种建立网页信息表的方法, 包括:
S501 ,从接收到的网络数据包中识别出 HTTP网页请求包及所述 HTTP网页 请求包对应的 HTTP响应包 ,所述 HTTP网页请求包是用户请求浏览网页时发送 的;
具体地, 在一个实施例中, 可以预先设置一块信息緩存, 当网络数据包到 达时, 将数据包复制到信息緩存中, 然后对数据包进行特征字的识别和解析, 若解析出数据包头部中 TCP端口号为 80 , 数据包的数据部分包含有请求方法 GET,同时协议类型为 HTTP、且 URL后缀名为. jsp、 .asp, .php、 .htm, .html、 .shtml 中的任何一种, 就可以判定该数据包为 HTTP网页请求包, 当然可以理解的是, 根据之前所述的网页浏览 HTTP通信机制,浏览器发送一个 HTTP网页请求包之 后收到的下一个网络数据包必然为与该 HTTP网页请求包对应的 HTTP响应包; S502, 根据所述 HTTP网页请求包, 获取用户请求浏览的网页的网页 ID, 并通过解析所述 HTTP响应包, 统计得出网页信息;
在本发明的一个实施例中, 将识别出的首个 HTTP网页请求包中的 URL作 为网页 ID。 具体地, 将 S501识别出的首个 HTTP网页请求包中的特定字段进行 解析, 即可得到该网页的主 URL, 然后以此 URL作为网页 ID; 在另一个实施例 中, 网页 ID也可以采用计算的方法获取: 将 S101识别出的首个 HTTP网页请求 包中的特定字段进行解析, 并提取该 HTTP网页请求包中的 URL和 host字段, 再将提取出的 URL字段和 host字段通过字符串连接函数连接成一个字段, 最后 用散列算法对连接出的字段进行散列,得出一个特定长度的序列号, 并以此序 列号来作为网页 ID。 具体地, 可以采用 MD5算法(消息摘要算法第五版) 来 作为计算网页 ID的散列算法, 即 MD5 ( U L+host ) 即可得出网页 ID; 当然可 以理解的是, 还可以采用其他的散列算法, 如 SHA-1 , 本发明实施例不做特别 限定。
对识别出的 HTTP响应包进行解析主要分为两个层次: ( 1 )解析出哪些 HTTP响应包属于同一条数据流; (2 )从多条数据流中解析出哪些数据流属于 同一 session; 实现上述两个个层次的解析方法同样可以采用 S101中的 DPI特征 字解析的方法。
具体地, 在一个实施例中, 解析 HTTP响应包中的五元组(源 IP地址, 源 端口, 目的 IP地址, 目的端口, 和传输层协议号) , 如果两个 HTTP响应包的 五元组完全相同, 就可以判定这两个数据包属于同一条数据流;
进一步地, 对不同数据流的 HTTP网页请求包进行解析, 得到 Src和 URL字 段的值, Src和 URL完全相同的的数据流就判定为属于同一个 session。
在一个实施例中, 获取网页大小的方法为: 先建立 session表和数据流表, 然后在 S501识别数据包和判断的过程中将每个网页浏览数据包的大小和归属 信息记录到 session表和流表中(具体地, 数据包的大小以及数据包属于哪条数 据流这两个信息记载到数据流表,数据包所在流属于哪个 session这一信息记载 到 session表) , 最后结合上述两个表中记载的信息统计出网页大小; 同时, 可 以通过解析主 URL来获取网页层次和网页类型,所述主 U L为 session中第一个 HTTP网页请求包的 URL。具体地,根据主 URL中斜杠的数量来判断网页层次, 根据 URL 中 的 关 键 字 来 判 断 网 页 的 类 型 , 例 如 URL 为 /news/lady/default.j sp?user=abc&refer=http://www.163.com/lady , 才艮据斜杠的数 量来判断网页层次 (从 URL开头到问号结束, 没有问号则到空格结束), 此处共 有 3个斜杠, 则说明此网页为第三层网页; 解析斜杠之间的内容, 可以获得关 键字, 比如 news、 lady, 则说明此网页时女性、 新闻类型, 如果没有关键字则 表示是网站主页, 类型字段给空。
S503 , 建立所述网页 ID和所述网页信息的关联关系。
本发明实施例通过以上技术方案, 基于 DPI识别的方法, 对网络数据包做 深入解析, 保证了解析的准确性, 同时, 根据解析的结果来统计网页信息, 将 解析到的结果作为网页信息记录添加到网页信息表中,方便后续访问该网页时 直接获取网页的具体信息。
如图 6所示, 本发明实施例提供一种建立网页信息表的装置, 包括: 网页信息识别模块 610,用于从接收到的网络数据包中识别出 HTTP网页请 求包及所述 HTTP网页请求包对应的 HTTP响应包;
网页 ID获耳 莫块 620,用于根据所述 HTTP网页请求包,获取用户请求浏览 的网页的网页 ID,
网页信息统计模块 630, 用于通过解析所述 HTTP网页请求包对应的 HTTP 响应包, 统计得出网页信息;
关联模块 640, 用于将所述网页信息和网页 ID关联并添加到网页信息表。 进一步地, 在一个实施例中, 获取模块 620具体包括:
特征字单元 6201 , 用于将所述 HTTP网页请求包中的 URL和 host字段, 通 过字符串连接函数连接成一个特征字段;
序列号单元 6202 ,用于用散列算法对所述特征字段进行散列得到一个特定 长度的序列号;
网页 ID单元 6203 , 用于将所述一个特定长度的序列号作为所述网页 ID。 本发明实施例通过以上技术方案, 基于 DPI识别的方法, 对网络数据包做 深入解析, 保证了解析的准确性, 同时, 根据解析的结果来统计网页信息, 将 解析到的结果作为网页信息记录添加到网页信息表中,方便后续访问该网页时 直接获取网页的具体信息。
如图 7所示, 本发明的实施例提供一种无线网页浏览资源优化装置, 包括: 识别模块 710, 用于从接收到的网络数据包中识别出 HTTP网页请求包; 在一个实施例中,识别模块可以采用特征字识别的方法,对接收到的数据 包头部以及数据部分进行解析, 并将解析出的字段与 HTTP网页请求包的对应 特征字段进行匹配。 具体地, 若解析出数据包头部中 TCP端口号为 80, 数据包 的数据部分包含有请求方法 GET , 同时协议类型为 HTTP、 且 URL后缀名 为. jsp、 .asp, .php、 .htm, .htmK .shtml中的任何一种, 就可以判定该数据包为 HTTP网页请求包; 当然可以理解的是, 解析和匹配的字段越多, 判定的结果 会越准确。
获耳 莫块 720, 用于根据识别模块 610识别出的 HTTP网页请求包, 获取用 户请求浏览的网页的网页 ID;
在本发明的一个实施例中, 获取模块 720将网页会话 TCP连接建立后, 接 收到的首个 HTTP网页请求包中的 URL作为网页 ID。 具体地, 将识别模块 710 识别出的首个 HTTP网页请求包中的特定字段进行解析, 即可得到该网页的主 URL, 然后以此 URL作为网页 ID; 在另一个实施例中, 网页 ID也可以采用计算 的方法获取:将识别模块 710识别出的首个 HTTP网页请求包中的特定字段进行 解析, 并提取该 HTTP网页请求包中的 URL和 host字段, 再将提取出的 URL字 段和 host字段通过字符串连接函数连接成一个字段, 最后用散列算法对连接出 的字段进行散列, 得出一个特定长度的序列号, 并以此序列号来作为网页 ID。 具体地, 可以采用 MD5算法(消息摘要算法第五版) 来作为计算网页 ID的散 列算法, 即 MD5 ( URL+host ) 即可得出网页 ID; 当然可以理解的是, 还可以 采用其他的散列算法, 如 SHA-1 , 本发明实施例不做特别限定。
匹配模块 730,用于将获耳 莫块 720获取的网页 ID和预先建立的网页信息表 信息;
在一个实施例中, 匹配模块 730可以将获取模块 720获取的网页 ID作为键 ( key )值, 采用 hash (哈希)索引的方法与网页信息表进行匹配。 hash索引的 方法作为一个具体的查找方式具有迅速查找的优势, 能提高匹配速度。可以理 解的是 hash索引的方法并不是匹配的唯一实现方式, 故 hash索引的方法作为一 个举例不应理解为对本发明实施例的限定。
策略模块 740, 用于在匹配模块 730匹配成功时,根据网页信息表中的网页 信息计算与所述网页信息匹配的 GBR,并将该 GBR发送给基站,以使基站按照 该 GBR分配无线网页会话的带宽资源。
进一步地, 策略模块 740还用于在匹配模块 730匹配不成功时,将预先配置 的 GBR下发给基站, 以使基站按照该 GBR分配无线网页会话的带宽资源。
在一个实施例中, 如果匹配模块 730匹配成功, 则说明该网页 ID对应的网 页信息在网页信息表中表中已有记录, 所以策略模块 740可以根据网页信息表 中与该网页 ID匹配的网页信息来计算 GBR , 并将计算出的 GBR以 GBR配置文 件的形式发送给基站进行无线网页会话带宽资源的分配。
具体地, 在一个实施例中, 根据网页信息计算匹配的 GBR的方法包括:
( 1 )从所述网页信息中获取网页大小和网页层次;
( 2 )用网页大小除以标准时间, 得到与所述网页信息匹配的 GBR; 或者 网页大小除以网页层次, 再除以标准时间, 得到与所述网页信息匹配的 GBR; 或者用网页大小除以网页层次,再除以用户等级系数,得到与所述网页信息匹 配的 GBR。
其中, 标准时间是由运营商静态配置的, 比如 Is, 它代表用户获得一个完 整的网页信息所需的平均时间; 用户等级系数是根据用户类型来设置的,例如 金牌用户 = 1 , 银牌用户 = 2, 铜牌用户 = 3。 具体地, 上述计算方法可以用公 式表示为: GBR = 网页大小 /标准时间; 在另一个实施例中, GBR的计算方法 可以为: GBR = 网页大小 /标准时间 * 网页层次; 在另一个实施例中, GBR的 计算方法还可以 GBR = 网页大小 /标准时间 * 网页层次 /用户等级系数。
GBR计算完成后, 策略模块 740将该 GBR以 GBR配置文件的形式下发给基 站,基站按照 GBR配置文件分配网页会话的带宽资源,从而实现 GBR根据网页 信息进行动态调整。
如图 7中的虚线框所示, 在一个实施例中, 该无线网页浏览资源优化装置 还包括:
记录添加模块 750, 用于将匹配不成功的网页 ID及对应的网页信息作为新 的记录添加到网页信息表中;
进一步地, 如图 8所示, 在一个实施例中, 记录添加模块 750具体包括: 第一识别单元 7501 , 用于从接收到的网络数据包中识别出与所述 HTTP网 页请求包对应的 HTTP响应包;
在一个实施例中, 识别单元 7501可以按照以下规则来简单识别出 HTTP响 应包:浏览器发出 HTTP网页请求包之后收到的下一个数据包即为该 HTTP网页 请求包对应的 HTTP响应包。
在另一个实施例中, 识别单元 7501也可以采用 DPI特征字识别的方法, 对 网络数据包的内容进行解析和匹配 , 从而识别出 HTTP响应包。
解析统计单元 7502, 用于解析识别单元 7501识别出的 HTTP网页请求包对 应的 HTTP响应包, 并统计出网页信息;
存储单元 7503 ,用于将所述用户请求浏览的网页的网页信息和所述用户请 求浏览的网页的网页 ID关联并添加到所述网页信息表。
本发明实施例通过以上技术方案,基于网页数据的识别,通过查询网页信 息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分 配 GBR, 实现 GBR的动态调整, 与现有技术方案相比, 动态调整的 GBR能更 好地跟不同的网页浏览业务相匹配,较大地减少了现有技术中 GBR过高或过低 的情况,提高了用户的体验, 并在保证网页浏览 QOS的同时实现无线资源的最 大化利用; 进一步地,通过记录添加模块将之前网页信息表没有记录的网页信 息在访问的时候添加到网页信息表, 实现网页信息表的更新, 这样当后续其他 用户访问再访问该网页时, 就可以计算出匹配的 GBR, 实现资源的优化。
如图 9所示, 本发明实施例提供一种无线网络资源优化系统, 包括: 无线网络控制器 80,所述无线网络控制器 80为本发明实施例所述的无线网 络控制器;
基站 90,所述基站用于接收无线网络控制器 80发出的 GBR,并根据该 GBR 为用户分配网页会话的带宽。
本发明实施例通过以上技术方案, 无线网络控制器基于网页数据的识别, 通过查询网页信息表获取用户访问的网页的网页信息,并根据每个网页的具体 信息来计算并分配 GBR, 实现 GBR的动态调整, 与现有技术方案相比, 动态调 整的 GBR能更好地跟不同的网页浏览业务相匹配, 较大地减少了现有技术中 GBR过高或过低的情况,提高了用户的体验,并在保证网页浏览 QOS的同时实 现无线资源的最大化利用; 进一步地,无线网络控制器通过记录添加模块将之 前网页信息表没有记录的网页信息在访问的时候添加到网页信息表,实现网页 信息表的更新, 这样当后续其他用户访问再访问该网页时, 无线网络控制器就 可以根据更新后的网页信息表,计算出匹配的 GBR, 并下发给基站进行无线资 源的配置, 实现资源的优化。
以上所述仅为本发明的几个实施例,本领域的技术人员依据申请文件公开 的可以对本发明进行各种改动或变型而不脱离本发明的精神和范围。

Claims

权 利 要 求
1、 一种无线网页浏览资源优化方法, 其特征在于, 包括:
从接收到的网络数据包中识别出超文本传输协议 HTTP网页请求包, 所述 HTTP网页请求包是用户请求浏览网页时发送的;
根据识别出的 HTTP网页请求包, 获取所述用户请求浏览的网页的网页标 识 ID;
将获取的网页 ID和预先建立的网页信息表匹配;
如果匹配成功, 从所述网页信息表中得到所述网页 ID对应的网页信息, 根据所述网页信息计算出与所述网页信息匹配的保证比特速率 GBR, 并将所述 带宽资源。
2、 如权利要求 1所述的方法, 其特征在于, 所述根据识别出的 HTTP网页 请求包, 获取用户请求浏览的网页的网页 ID, 包括:
将所述 HTTP网页请求包中的统一资源定位符 URL和 hos t字段,通过字符 串连接函数连接成一个特征字段;
用散列算法对所述特征字段进行散列得到一个特定长度的序列号; 将所述一个特定长度的序列号作为所述用户请求浏览的网页的网页 ID。
3、 如权利要求 2所述的方法, 其特征在于, 所述散列算法为消息摘要算 法第五版 MD5或者安全散列算法 SHA-L
4、 如权利要求 1所述的方法, 其特征在于, 所述根据识别出的 HTTP网页 请求包, 获取用户请求浏览的网页的网页 ID, 包括:
将所述 HTTP网页请求包中的统一资源定位符 URL字段作为所述用户请求 浏览的网页的网页 ID。
5、 如权利要求 1-4任一项所述的方法, 其特征在于, 所述网页信息表中 的网页信息包括: 网页大小、 网页层次和 /或网页类型。
6、 如权利要求 5所述的方法, 其特征在于, 所述根据所述网页信息计算 出与所述网页信息匹配的 GBR, 包括:
从所述网页信息中获取网页大小和网页层次;
用网页大小除以标准时间, 得到与所述网页信息匹配的 GBR , 所述标准时 间为用户获得一个完整的网页信息所需的平均时间;或者网页大小除以网页层 次, 再除以标准时间, 得到与所述网页信息匹配的 GBR; 或者用网页大小除以 网页层次, 再除以用户等级系数, 得到与所述网页信息匹配的 GBR。
7、 如权利要求 1-6任一项所述的方法, 其特征在于, 还包括:
如果匹配不成功,将预先配置的 GBR发送给基站, 以使所述基站根据所述 预先配置的 GBR为所述用户分配无线网页会话的带宽资源。
8、 如权利要求 7所述的方法, 其特征在于, 如果匹配不成功, 将预先配 置的 GBR下发给基站之后, 还包括:
将匹配不成功的网页 ID及对应的网页信息作为新的记录添加到网页信息 表中。
9、 如权利要求 8所述的方法, 其特征在于, 所述将匹配不成功的网页 ID 及对应的网页信息作为新的记录添加到网页信息表中, 具体包括:
从接收到的网络数据包中识别出与所述 HTTP网页请求包对应的 HTTP响应 包;
通过解析所述 HTTP网页请求包对应的 HTTP响应包,统计得出所述用户请 求浏览的网页的网页信息;
将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网 页 ID关联并添加到所述网页信息表。
10、 如权利要求 1所述的方法, 其特征在于, 所述从接收到的网络数据包 中识别出 HTTP网页请求包, 包括:
通过对所述接收到的网路数据包进行深度包检测 DPI , 从接收到的网络数 据包中识别出 HTTP网页请求包。
11、 一种无线网页浏览资源优化装置, 包括:
识别模块, 用于从接收到的网络数据包中识别出超文本传输协议 HTTP网 页请求包, 所述 HTTP网页请求包是用户请求浏览网页时发送的;
获耳 莫块, 用于从所述识别模块识别出的 HTTP网页请求包中获取所述用 户请求浏览的网页的网页标识 ID;
匹配模块, 用于将所述获耳 莫块获取的网页 ID和预先建立的网页信息表 匹配;
策略模块, 用于在所述匹配模块匹配成功时,从所述网页信息表中得到所 述网页 ID对应的网页信息, 根据所述网页信息计算出与所述网页信息匹配的 保证比特速率 GBR, 并将所述 GBR发送给基站, 以使所述基站按照所述 GBR为 所述用户分配无线网页会话的带宽资源。
12、 如权利要求 11所述的装置, 其特征在于, 还包括:
记录添加模块, 用于在所述匹配模块匹配不成功时,将匹配不成功的网页 ID及对应的网页信息作为新的记录添加到所述网页信息表中;
13、 如权利要求 12所述的装置, 其特征在于, 所述记录添加模块具体包 括:
识别单元, 从接收到的网络数据包中识别出与所述 HTTP网页请求包对应 的 HTTP响应包;
解析统计单元, 用于通过解析所述 HTTP网页请求包对应的 HTTP响应包, 统计得出所述用户请求浏览的网页的网页信息;
存储单元,用于将所述用户请求浏览的网页的网页信息和所述用户请求浏 览的网页的网页 ID关联并添加到所述网页信息表。
14、 如权利要求 13所述的装置, 其特征在于, 所述识别单元具体用于, 通过对所述接收到的网路数据包进行深度包检测 DP I, 从接收到的网络数据包 中识别出 HTTP网页请求包。
15、 一种无线网络资源优化系统, 包括: 无线网络控制器和基站, 其特征 在于,
所述无线网络控制器用于,从接收到的网络数据包中识别出超文本传输协 议 HTTP网页请求包, 所述 HTTP网页请求包是用户请求浏览网页时发送的;根 据识别出的 HTTP网页请求包, 获取用户请求浏览的网页的网页标识 ID;
将获取的网页 ID和预先建立的网页信息表匹配; 如果匹配成功, 从所述 网页信息表中得到所述网页 ID对应的网页信息, 根据所述网页信息计算出与 所述网页信息匹配的保证比特速率 GBR, 并将所述 GBR发送给基站;
所述基站用于, 接收所述 GBR, 并根据所述 GBR为所述用户分配无线网页 会话的带宽资源。
16、 如权利要求 15所述的系统, 其特征在于, 所述无线网络控制器还用 于, 当获取的网页 ID和预先建立的网页信息表匹配不成功时, 将预先配置的 GBR下发给基站进行无线资源配置。
17、 如权利要求 15所述的系统, 其特征在于, 所述无线网络控制器还用 于, 当获取的网页 ID和预先建立的网页信息表匹配不成功时, 将预先配置的 GBR下发给基站进行无线资源配置, 并将匹配不成功的网页 ID及对应的网页 信息作为新的记录添加到网页信息表中。
18、 一种建立网页信息表的方法, 其特征在于, 包括:
从接收到的网络数据包中识别出超文本传输协议 HTTP网页请求包及所述 HTTP网页请求包对应的 HTTP响应包, 所述 HTTP网页请求包是用户请求浏览 网页时发送的;
根据所述 HTTP网页请求包, 获取用户请求浏览的网页的网页标识 ID; 通过解析所述 HTTP网页请求包对应的 HTTP响应包, 统计得出网页信息; 建立所述网页 ID和所述网页信息的关联关系。
19、 如权利要求 18 所述的方法, 其特征在于, 所述根据识别出的 HTTP 网页请求包, 获取用户请求浏览的网页的网页 ID, 包括:
将所述 HTTP网页请求包中的统一资源定位符 URL和 hos t字段,通过字符 串连接函数连
接成一个特征字段;
用散列算法对所述特征字段进行散列得到一个特定长度的序列号; 将所述一个特定长度的序列号作为所述网页 ID。
20、 如权利要求 18或 19所述的方法, 其特征在于, 所述网页信息包括: 网页大小、 网页层次和 /或网页类型。
21、 一种建立网页信息表的装置, 其特征在于, 包括: 网页数据识别模块,用于从接收到的网络数据包中识别出超文本传输协议
HTTP网页请求包及所述 HTTP网页请求包对应的 HTTP响应包;
网页 ID获耳 莫块, 用于根据所述 HTTP网页请求包, 获取用户请求浏览的 网页的网页标识 ID;
网页信息统计模块,用于通过解析所述 HTTP网页请求包对应的 HTTP响应 包, 统计得出网页信息;
关联模块, 用于将所述网页信息和网页 ID关联并添加到网页信息表。
22、 如权利要求 21所述的装置, 其特征在于, 所述获取模块包括: 特征字单元, 用于将所述 HTTP 网页请求包中的统一资源定位符 URL 和 hos t字段, 通过字符串连接函数连
接成一个特征字段;
序列号单元,用于用散列算法对所述特征字段进行散列得到一个特定长度 的序列号;
网页 ID单元, 用于将所述一个特定长度的序列号作为所述网页 ID。
PCT/CN2012/075778 2011-12-21 2012-05-19 无线网页浏览资源优化方法、装置及系统 WO2013091345A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110433000.7 2011-12-21
CN201110433000.7A CN102523296B (zh) 2011-12-21 2011-12-21 无线网页浏览资源优化方法、装置及系统

Publications (1)

Publication Number Publication Date
WO2013091345A1 true WO2013091345A1 (zh) 2013-06-27

Family

ID=46294083

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/075778 WO2013091345A1 (zh) 2011-12-21 2012-05-19 无线网页浏览资源优化方法、装置及系统

Country Status (2)

Country Link
CN (1) CN102523296B (zh)
WO (1) WO2013091345A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113760557A (zh) * 2020-05-29 2021-12-07 北京沃东天骏信息技术有限公司 页面数据的发送方法、装置、电子设备和存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104703292A (zh) * 2013-12-09 2015-06-10 中国移动通信集团四川有限公司 一种保证比特速率承载建立方法及系统
CN105812481A (zh) * 2016-04-20 2016-07-27 上海斐讯数据通信技术有限公司 一种超文本传输协议请求识别系统及方法
CN107608980A (zh) * 2016-07-11 2018-01-19 中国电信股份有限公司 基于dpi大数据分析的信息推送方法和系统
CN106790082B (zh) * 2016-12-22 2019-10-01 北京启明星辰信息安全技术有限公司 一种云应用访问控制方法及系统
CN109413114B (zh) * 2018-12-28 2021-08-10 安徽长泰信息安全服务有限公司 一种网络入侵防御系统
CN112187935B (zh) * 2020-09-30 2023-02-07 杭州迪普科技股份有限公司 信息识别方法与只读内存

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159762A (zh) * 2007-11-19 2008-04-09 腾讯科技(深圳)有限公司 加速网页内容下载的方法及装置
CN101287035A (zh) * 2008-05-23 2008-10-15 德信无线通讯科技(北京)有限公司 控制移动通信终端网页传输流量的方法及移动通信终端
WO2010114603A1 (en) * 2009-03-31 2010-10-07 Bytemobile, Inc. Adaptive bitrate management for streaming media over packet networks
CN101867621A (zh) * 2010-07-02 2010-10-20 苏州阔地网络科技有限公司 一种网页上实现的p2p通讯的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10017062B4 (de) * 1999-11-22 2015-03-05 Ipcom Gmbh & Co. Kg Verfahren zum Betreiben eines Mobilfunknetzes
CN100566295C (zh) * 2006-04-20 2009-12-02 大唐移动通信设备有限公司 一种基于服务质量保障的分组业务无线资源调度方法
CN100461766C (zh) * 2006-08-02 2009-02-11 华为技术有限公司 一种为实时流媒体业务分配资源的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159762A (zh) * 2007-11-19 2008-04-09 腾讯科技(深圳)有限公司 加速网页内容下载的方法及装置
CN101287035A (zh) * 2008-05-23 2008-10-15 德信无线通讯科技(北京)有限公司 控制移动通信终端网页传输流量的方法及移动通信终端
WO2010114603A1 (en) * 2009-03-31 2010-10-07 Bytemobile, Inc. Adaptive bitrate management for streaming media over packet networks
CN101867621A (zh) * 2010-07-02 2010-10-20 苏州阔地网络科技有限公司 一种网页上实现的p2p通讯的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113760557A (zh) * 2020-05-29 2021-12-07 北京沃东天骏信息技术有限公司 页面数据的发送方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN102523296A (zh) 2012-06-27
CN102523296B (zh) 2014-11-05

Similar Documents

Publication Publication Date Title
WO2013091345A1 (zh) 无线网页浏览资源优化方法、装置及系统
US10587544B2 (en) Message processing method, processing server, terminal, and storage medium
US10491657B2 (en) Network acceleration method, apparatus and device based on router device
US10630758B2 (en) Method and system for fulfilling server push directives on an edge proxy
Grigorik Making the web faster with HTTP 2.0
EP2773080A1 (en) Sharing control system and method for network resources download information
CN106534243B (zh) 基于http协议的缓存、请求、响应方法及相应装置
WO2017096830A1 (zh) 用于cdn平台的内容分发方法及调度代理服务器
US8954492B1 (en) Methods for inlining content externally referenced in a web page prior to providing the web page to a requestor and devices thereof
US20060271642A1 (en) Method for multipart encoding
WO2013091346A1 (zh) 一种网页内容预加载方法、装置及系统
WO2015014145A1 (zh) 加快子资源加载速度的方法和装置
WO2017080459A1 (zh) 服务内容的缓存及提供方法、装置、系统和存储介质
CN104506493A (zh) 一种实现hls内容回源和缓存的方法
WO2012034518A1 (zh) 一种提供包含网页地址的消息的方法和系统
WO2012113262A1 (zh) 用于移动终端的下载方法、系统和设备
WO2020133608A1 (zh) 一种拖拉视频数据的处理方法及代理服务器
US9473592B2 (en) Methods for optimizing a web content proxy server and devices thereof
US10049089B2 (en) Methods for compressing web page menus and devices thereof
CN103001964A (zh) 一种局域网环境下的缓存加速方法
WO2016070822A1 (zh) 媒体资源反馈方法及装置
WO2012062107A1 (zh) 基于手机用户上网行为的数据处理方法及装置
WO2022007008A1 (zh) 一种资源请求响应方法、重定向服务器及决策分发服务器
WO2013097812A1 (zh) 一种下载字库文件的方法和系统
EP3389240B1 (en) Method and system for processing cache cluster service

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12859316

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12859316

Country of ref document: EP

Kind code of ref document: A1