WO2012100701A1 - 一种获取图文信息的装置、系统及方法 - Google Patents

一种获取图文信息的装置、系统及方法 Download PDF

Info

Publication number
WO2012100701A1
WO2012100701A1 PCT/CN2012/070525 CN2012070525W WO2012100701A1 WO 2012100701 A1 WO2012100701 A1 WO 2012100701A1 CN 2012070525 W CN2012070525 W CN 2012070525W WO 2012100701 A1 WO2012100701 A1 WO 2012100701A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
http request
picture
mobile terminal
image
Prior art date
Application number
PCT/CN2012/070525
Other languages
English (en)
French (fr)
Inventor
阮曙东
张开翔
徐羽
向伟
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Publication of WO2012100701A1 publication Critical patent/WO2012100701A1/zh
Priority to US13/941,498 priority Critical patent/US20130305140A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • H04L67/5651Reducing the amount or size of exchanged application data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/04Protocols specially adapted for terminals or networks with limited capabilities; specially adapted for terminal portability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/567Integrating service provisioning from a plurality of service providers

Abstract

本发明公开了一种获取图文信息的装置、系统及方法。根据接收的移动终端发送的超文本传输协议HTTP请求中携带的Web服务器的统一资源定位器URL信息,向该Web服务器发送HTTP请求;解析接收的HTTP请求应答中包含的超文本标记语言HTML页面信息,获取图片链接信息,向图片链接信息对应图片服务器发送图片HTTP请求;接收图片服务器返回的图片信息,与预先获取的HTML页面信息封装为图文信息,输出至发送所述HTTP请求的移动终端。应用本发明,可以减少移动终端浏览器与相应服务器之间交互的次数、提高用户体验。

Description

一种获取图文信息的装置、 系统及方法
本申请要求于 2011 年 01 月 27 日提交中国专利局、 申请号为 201110032565.4、 发明名称为 "一种获取图文信息的装置、 系统及方法" 的中国专利申请的优先权, 其全部内容通过引用结合在本申请中。 技术领域
本发明涉及图文传输技术, 特别涉及一种获取图文信息的装置、 系 统及方法。 发明背景
随着无线互联网的发展, 通过无线网络获取信息越来越成为人们生 活以及工作中不可或缺的一部分, 用户使用移动终端通过无线网络与网 站服务器, 例如, 网页 (Web )服务器以及图片服务器连接, 利用移动 终端内置的无线浏览器, 通过统一资源定位器(URL, Uniform Resource Locators )向网站服务器发送超文本传输协议( HTTP, Hypertext Transfer Protocol )请求,获取网站服务器提供的包含网页文本和图片的图文信息。
图 1为现有技术用户请求获取图文信息的方法流程示意图。 参见图 1 , 以用户浏览 http:〃 www.foo.com/index.html网页为例, 4 i殳网页页面, 也就是超文本标记语言(HTML, Hyper Text Mark-up Language )页面信 息包含网页文本和图片, 具体内容为:
<html>
<body>
This is my foo Page
<img src="http:〃 image.foo.com/foo.jpg" /> < body>
</html>
该流程包括:
步骤 101 , 移动终端浏览器向目的 URL的 Web服务器发起 HTTP 请求;
本步骤中, 目的 URL为 http:〃 www.foo.com/index.html, Web服务器 域名为 www.foo.com。
步骤 102, Web服务器向移动终端浏览器返回 HTTP请求应答, 携 带 HTML页面信息;
本步骤中, HTML页面信息包括:
<html>
<body>
This is my foo Page
<img src="http://image.foo.com/foo.jpg"/>
< body>
</html>
步骤 103 , 移动终端浏览器解析接收的 HTML页面信息, 获取图片 链接信息, 并展示网页页面;
本步骤中,移动终端浏览器根据接收的 HTML页面信息展示相应的 网页文本, 同时, 解析获取 HTML页面信息中包含的图片链接信息, 即 http:〃 image.foo.com/foo.jpg。
实际应用中, 由于网页文本信息包含在 HTML页面信息, 因而, 根 据获取的 HTML页面信息可以直接获取并展示网页文本, 而对于图片, 一般以图片链接信息包含在 HTML页面信息中, 因而, 在获取 HTML 页面信息后,需要根据 HTML页面信息中包含的图片链接信息去获取相 应的图片进行展示。 步骤 104, 移动终端浏览器向图片服务器发起图片 HTTP请求; 本步骤中, 移动终端浏览器根据解析获取的图片链接信息, 生成图 片 HTTP请求, 向图片链接信息中包含的图片服务器发送, 该图片服务 器的域名为图片链接信息中的 image.foo.com, 请求获取 URL 地址为 http:〃 image.foo.com/foo.jpg的图片。
步骤 105, 图片服务器向移动终端浏览器返回图片 HTTP请求应答; 本步骤中,图片 HTTP请求应答中携带二进制图片数据,图片 foo.jpg 以二进制数据表示, 并返回移动终端浏览器。
步骤 106, 移动终端浏览器根据自身的浏览器信息调整图片, 并将 调整的图片进行展示。
本步骤中, 图片服务器以统一的格式存储图片, 并以存储的统一格 式的图片信息下发图片, 而对于移动终端浏览器, 由于不同的移动终端 浏览器屏幕尺寸不同, 因而, 需要根据自身的浏览器信息调整图片, 例 如, 下发的图片高宽为 800*600, 移动终端浏览器屏幕尺寸为 600*450, 则该移动终端浏览器需要将接收的图片调整为 600*450并进行展示。
由上述可见, 现有的用户请求获取图文信息的方法, 对于网页中包 含的图片, 需要移动终端浏览器发送两次 HTTP请求才能获取, 使得移 较慢, 因而, 获取图文信息所需的时间较长, 影响了用户体验; 同时, 移动终端浏览器屏幕较小, 而图片服务器传输的图片尺寸一般较大, 在 移动终端浏览器接收到图片后, 需要对图片进行缩小处理, 这样, 导致 了图片传输过程中的资源浪费, 也增加了传输图文信息所需的时间。 发明内容
有鉴于此, 本发明的主要目的在于提出一种获取图文信息的装置, 本发明的另一目的在于提出一种获取图文信息的系统, 减少移动终 端浏览器与相应服务器之间交互的次数、 提高用户体验。
本发明的再一目的在于提出一种获取图文信息的方法, 减少移动终 端浏览器与相应服务器之间交互的次数、 提高用户体验。
为达到上述目的, 本发明提供了一种代理服务器, 该代理服务器包 括: 超文本传输协议 HTTP请求处理模块、 HTTP抓取模块、 超文本标 记语言 HTML解析模块以及打包处理模块, 其中,
HTTP请求处理模块, 用于接收来自移动终端发送的 HTTP请求, 获取携带的网页服务器的统一资源定位器 URL信息, 输出至 HTTP抓 取模块;
HTTP抓取模块,用于根据接收的网页服务器的 URL信息, 向 URL 信息对应的网页服务器抓取 HTML页面信息,输出至 HTML解析模块; 接收 HTML解析模块输出的图片链接信息,向图片链接信息对应的图片 服务器抓取图片信息,将抓取的 HTML页面信息以及图片信息输出至打 包处理模块;
HTML解析模块, 用于接收 HTML页面信息, 解析获取包含的图片 链接信息, 输出至 HTTP抓取模块;
打包处理模块, 用于接收 HTML页面信息以及图片信息, 进行打包 处理后输出至发送所述 HTTP请求的移动终端。
进一步包括: 图片转化模块,
所述 HTTP请求处理模块, 进一步用于将解析获取的 HTTP请求中 携带的移动终端浏览器信息输出至图片转化模块;
所述图片转化模块, 用于从 HTTP抓取模块读取图片信息, 根据接 收的移动终端浏览器信息进行图片转化处理, 输出至打包处理模块。 进一步包括:
图文压缩模块, 用于将打包处理模块打包处理的图文信息进行压缩 处理, 输出至发送所述 HTTP请求的移动终端。
一种获取图文信息的系统, 该系统包括: 移动终端、 代理服务器、 网页服务器以及图片服务器, 其中,
移动终端, 用于向代理服务器发送超文本传输协议 HTTP请求, 接 收代理服务器返回的图文信息, 解析并进行展示;
代理服务器, 用于根据接收的 HTTP请求中携带的网页服务器的统 一资源定位器 URL信息, 向该网页服务器发送 HTTP请求; 接收网页 服务器发送的携带超文本标记语言 HTML页面信息的 HTTP请求应答并 进行解析, 获取图片链接信息, 向图片链接信息对应的图片服务器发送 图片 HTTP请求;接收图片服务器返回的图片信息, 与 HTML页面信息 封装为图文信息后输出至发送所述 HTTP请求的移动终端;
网页服务器, 用于根据接收的 HTTP请求中携带的 URL信息,获取 对应的 HTML页面信息,携带在 HTTP请求应答中,向代理服务器发送; 图片服务器, 用于根据接收的图片 HTTP请求中携带的图片链接信 息, 获取对应的图片信息, 携带在图片 HTTP请求应答中, 向代理服务 器发送。
所述代理服务器包括: HTTP请求处理模块、 HTTP抓取模块、 HTML 解析模块以及打包处理模块, 其中,
HTTP请求处理模块, 用于接收外部移动终端发送的 HTTP请求, 获取携带的网络服务器的统一资源定位器 URL信息, 输出至 HTTP抓 取模块;
HTTP抓取模块,用于根据接收的网页服务器的 URL信息, 向 URL 信息对应的网页服务器抓取 HTML页面信息,输出至 HTML解析模块; 接收 HTML解析模块输出的图片链接信息,向图片链接信息对应的图片 服务器抓取图片信息,将抓取的 HTML页面信息以及图片信息输出至打 包处理模块;
HTML解析模块, 用于接收 HTML页面信息, 解析获取包含的图片 链接信息, 输出至 HTTP抓取模块;
打包处理模块, 用于接收 HTML页面信息以及图片信息, 进行打包 处理后输出至发送所述 HTTP请求的移动终端。
所述代理服务器进一步包括: 图片转化模块,
所述 HTTP请求处理模块, 进一步用于将解析获取的 HTTP请求中 携带的移动终端浏览器信息输出至图片转化模块;
所述图片转化模块, 用于从 HTTP抓取模块读取图片信息, 根据接 收的移动终端浏览器信息进行图片转化处理, 输出至打包处理模块。
所述代理服务器进一步包括:
图文压缩模块, 用于将打包处理模块打包处理的图文信息进行压缩 处理, 输出至发送所述 HTTP请求的移动终端。
一种获取图文信息的方法, 该方法包括:
根据接收的移动终端发送的超文本传输协议 HTTP请求中携带的网 页服务器的统一资源定位器 URL信息, 向该网页服务器发送 HTTP请 求;
解析接收的 HTTP请求应答中包含的超文本标记语言 HTML页面信 息,获取图片链接信息,向图片链接信息对应图片服务器发送图片 HTTP 请求;
接收图片服务器返回的图片信息,与预先获取的 HTML页面信息封 装为图文信息, 输出至发送所述 HTTP请求的移动终端。
所述 HTTP请求中进一步携带有移动终端浏览器信息, 所述接收图片服务器返回的图片信息,与预先获取的 HTML页面信 息封装为图文信息具体包括:
接收图片服务器返回的图片信息, 按照所述移动终端浏览器信息对 图片进行处理;
将处理的图片与预先获取的 HTML页面信息封装为图文信息。
在封装为图文信息后, 输出至发送所述 HTTP请求的移动终端前, 进一步包括:
对封装的图文信息进行压缩处理。
由上述的技术方案可见, 本发明提供的一种获取图文信息的装置、 系统及方法, 系统包括: 移动终端、 代理服务器、 网页服务器以及图片 服务器,其中,移动终端向代理服务器发送超文本传输协议 HTTP请求, 接收代理服务器返回的图文信息, 解析并进行展示; 代理服务器根据接 收的 HTTP请求中携带的网页服务器的统一资源定位器 URL信息, 向 该网页服务器发送 HTTP请求; 接收网页服务器发送的携带超文本标记 语言 HTML页面信息的 HTTP请求应答并进行解析,获取图片链接信息, 向图片链接信息对应的图片服务器发送图片 HTTP请求; 接收图片服务 器返回的图片信息,与 HTML页面信息封装为图文信息后输出至发送所 述 HTTP请求的移动终端; 网页服务器根据接收的 HTTP请求中携带的 URL信息, 获取对应的 HTML页面信息, 携带在 HTTP请求应答中, 向代理服务器发送; 图片服务器根据接收的图片 HTTP请求中携带的图 片链接信息, 获取对应的图片信息, 携带在图片 HTTP请求应答中, 向 代理服务器发送。 这样, 移动终端浏览器只需提交一次 HTTP请求, 就 能够获取页面展示的所有资源, 减少了移动终端浏览器与相应服务器之 间交互的次数、 加快了移动终端浏览器展示页面的速度、 提高了用户体 验。 附图简要说明
图 1为现有技术用户请求获取图文信息的方法流程示意图。
图 2为本发明实施例获取图文信息的系统结构示意图。
图 3为本发明实施例代理服务器结构示意图。
图 4为本发明实施例获取图文信息的方法流程示意图。 实施本发明的方式
为使本发明的目的、 技术方案和优点更加清楚, 下面将结合附图及 具体实施例对本发明作进一步地详细描述。
现有技术中, 在获取图文信息时, 移动终端浏览器需要先向 Web服 务器发送 HTTP请求, 获取 HTML页面信息, 再对获取的 HTML页面 信息进行解析, 获取包含的图片链接信息, 再根据图片链接信息向图片 服务器发送图片 HTTP请求, 获取相应的图片进行展示。 这样, 移动终 端浏览器需要两次 HTTP请求才能获取网页中的图文信息, 使得获取图 文所需的时间较长。 本发明实施例中, 考虑在网络侧设置代理服务器, 用于模拟移动终端浏览器与 Web服务器以及图片服务器进行交互,获取 图文信息后再将图文信息封装输出至移动终端浏览器, 这样, 可以有效 减少移动终端浏览器向图片服务器发送图片 HTTP请求时的空口传输时 延。
图 2为本发明实施例获取图文信息的系统结构示意图。 参见图 2, 该系统包括: 移动终端、代理服务器、 Web服务器及图片服务器, 其中, 移动终端, 用于向代理服务器发送 HTTP请求, 接收代理服务器返 回的图文信息, 解析并进行展示;
本发明实施例中, HTTP请求中携带有 Web服务器的 URL信息。例 如, 如果用户需要浏览 http:〃 www.foo.com/index.html网页, 则 Web服务 器的 URL信息为 http://www.foo.com/index.html, Web服务器域名包含在 URL信息中 , 为 www.foo.com。
较佳地, 移动终端向代理服务器发送的 HTTP请求中进一步携带有 息, 具体可参见相关技术文献, 在此不再赘述。 对于多个移动终端向代 理服务器发送 HTTP请求的情形, 每个 HTTP请求中可以携带相应移动 终端标识以便于区别。
代理服务器, 用于根据接收的 HTTP请求中携带的 Web服务器的 URL信息, 向该 Web服务器发送 HTTP请求; 接收 Web服务器发送的 携带 HTML页面信息的 HTTP请求应答并进行解析,获取图片链接信息, 向图片链接信息对应的图片服务器发送图片 HTTP请求; 接收图片服务 器返回的图片信息, 与 HTML 页面信息封装为图文信息后输出至发送 HTTP请求的移动终端;
本发明实施例中, 代理服务器通过与 Web服务器交互获取 HTML 页面信息,再通过与图片服务器交互获取图片信息,对获取的 HTML页 面信息以及图片信息进行封装, 然后发送至移动终端, 这样, 就可以节 约一次移动终端与图片服务器的空口传输时间, 从而提高了用户体验。
如前所述, 如果移动终端向代理服务器发送的 HTTP请求中携带有 移动终端浏览器信息, 则代理服务器进一步将获取的图片信息按照移动 终端浏览器信息进行处理后与 HTML页面信息进行封装, 例如, 获取的 图片高宽为 800*600, 移动终端浏览器屏幕尺寸为 600*450, 则该代理 服务器将该接收的图片调整为 600*450, 封装的处理流程为现有技术, 在此不再赘述。
当然, 实际应用中,也可以将封装的图文信息进一步进行压缩处理。 这样, 可以有效地减少传输的资源开销, 同时也降低了传输图文信息所 需的时间。
Web服务器,用于根据接收的 HTTP请求中携带的 URL信息,获取 对应的 HTML页面信息,携带在 HTTP请求应答中,向代理服务器发送; 图片服务器, 用于根据接收的图片 HTTP请求中携带的图片链接信 息, 获取对应的图片信息, 携带在图片 HTTP请求应答中, 向代理服务 器发送。
所应说明的是, 代理服务器可以是独立的设备, 也可以与 Web服务 器等集成在一起。
图 3为本发明实施例代理服务器结构示意图。 参见图 3, 该代理服 务器包括: HTTP请求处理模块、 HTTP抓取模块、 HTML解析模块以 及打包处理模块, 其中,
HTTP请求处理模块, 用于接收来自移动终端发送的 HTTP请求, 获取携带的 Web服务器的统一资源定位器 URL信息, 输出至 HTTP抓 取模块;
HTTP抓取模块,用于根据接收的 Web服务器的 URL信息,向 URL 信息对应的 Web服务器抓取 HTML页面信息,输出至 HTML解析模块; 接收 HTML解析模块输出的图片链接信息,向图片链接信息对应的图片 服务器抓取图片信息,将抓取的 HTML页面信息以及图片信息输出至打 包处理模块;
HTML解析模块, 用于接收 HTML页面信息, 解析获取包含的图片 链接信息, 输出至 HTTP抓取模块;
打包处理模块, 用于接收 HTML页面信息以及图片信息, 进行打包 处理后输出至发送 HTTP请求的移动终端。
较佳地, HTTP请求处理模块进一步用于解析接收的 HTTP请求, 将 HTTP请求中携带的移动终端浏览器信息输出至图片转化模块; 该代理服务器进一步包括: 图片转化模块, 用于从 HTTP抓取模块 读取图片信息, 根据接收的移动终端浏览器信息进行图片转化处理, 输 出至打包处理模块。
实际应用中, 还可以包括: 图文压缩模块, 用于将打包处理模块打 包处理的图文信息进行压缩处理, 输出至移动终端。
由上述可见, 本发明实施例获取图文的系统,通过设置代理服务器, 接收移动终端发送的 HTTP请求,根据请求中携带的 Web服务器的 URL 信息,向 Web服务器发送 HTTP请求;接收 Web服务器发送的携带 HTML 页面信息的 HTTP请求应答并进行解析, 获取图片链接信息, 向图片服 务器发送图片 HTTP请求; 接收图片服务器返回的图片信息, 与 HTML 页面信息封装为图文信息后输出至移动终端。 这样, 移动终端浏览器只 需提交一次 HTTP请求,就能够获取页面展示的所有资源,例如, HTML 页面信息与图片信息, 节省了一次 HTTP请求, 减少了移动终端浏览器 与相应服务器之间交互的次数, 由于移动网络速度一般较慢, 节省一次 HTTP请求可以很大限度上节省时间, 从而提高了用户体验。 进一步地, 代理服务器可以根据移动终端浏览器信息对图片进行缩小处理, 大大减 小了移动终端拉取的图文数据包大小,节约了传输过程中的资源。而且, 代理服务器还可以对图文信息进行压缩处理,即将 HTML数据和图片数 据一起打包, 并进行 gzip压缩, 进一步减小了图文数据包的大小。
图 4为本发明实施例获取图文信息的方法流程示意图。 参见图 4, 以用户浏览包含网页文本和图片的 http://www.foo.com/index.html网页为 例, 该流程包括:
步骤 401 , 接收移动终端发送的 HTTP请求;
步骤 402,根据接收的 HTTP请求中携带的 Web服务器的 URL信息, 向 Web服务器发送 HTTP请求; 本步骤中, 代理服务器向目的 URL ( http://www.foo.com/index.html ) 的 Web服务器(域名为 www.foo.com )发起 HTTP请求
步骤 403 , 接收 HTTP请求应答, 获取 HTML页面信息;
本步骤中, Web服务器向代理服务器返回 HTTP请求应答, 代理服 务器获取 HTML页面信息:
<html>
<body>
This is my foo Page
<img src="http:〃 image.foo.com/foo.jpg" width="800" height="600" />
< body>
</html>
步骤 404, 解析 HTML页面信息, 获取图片链接信息;
本步骤中, 代理服务器解析 HTML页面信息, 得到 img元素中的图 片 URL , 即图片链接信息: http:〃 image.foo.com/foo.jpg。
HTML 页面信息包括: 无线标记语言 (WML , Wireless Markup Language ) 页面信息以及可扩展超文本标记语言 (XHTML, extensible Hyper Text Markup Language ) 页面信息。
步骤 405 , 向图片服务器发送图片 HTTP请求;
本步骤中, 代理服务器向图片服务器(域名为 image.foo.com )发起 图片 HTTP请求 http:〃 image.foo.com/foo.jpg。
实际应用中, 如果需要获取多个图片链接信息, 则可以通过多次向 图片服务器发送图片 HTTP请求或在一次请求中携带多个图片链接信 息, 这样, 可以更加有效减少移动终端与代理服务器的交互次数。
步骤 406, 接收图片服务器返回的图片信息;
本步骤中, 返回的图片信息为 foo.jpg的二进制图片数据。 步骤 407, 按照预先获取的移动终端浏览器信息对图片进行处理; 本步骤为可选, 如果移动终端在向代理服务器发送的 HTTP请求中 携带有移动终端浏览器信息, 则进行该步骤的处理。
本步骤中, H殳图片的原始高宽为 800*600, 移动终端浏览器高宽 (移动终端浏览器信息) 为 180*240, 则该原始图片在移动终端上无法 显示,代理服务器按照移动终端浏览器高宽,将图片压缩转化为 180*240 的图片, 并将 img元素的高宽设置为 180及 240, 程序代码如下:
<html>
<body>
This is my foo Page
<img src="http://image.foo.com/foo.jpg" width="240" height="180" />
< body>
</html>
步骤 408, 将图片信息与 HTML页面信息封装为图文信息; 本步骤中, 代理服务器将 HTML页面信息(HTML数据)和图文信 息(图片数据)打包在一起, 并进一步可进行 gzip压缩, 返回给移动终 端。 压缩可以采用现有的压缩算法, 在此不再赘述。
步骤 409, 向移动终端返回图文并下的数据包;
本步骤中, 图文并下的数据包即为封装的图文信息。
步骤 410, 移动终端接收图文信息, 解析并进行展示。
本步骤中, 移动终端浏览器解析图文并下包, 得到 HTML数据和图 片数据, 并按照顺序进行展示。
以上所述仅为本发明的较佳实施例而已, 并非用于限定本发明的保 护范围。 凡在本发明的精神和原则之内, 所作的任何修改、 等同替换以 及改进等, 均应包含在本发明的保护范围之内。

Claims

权利要求书
1、 一种代理服务器, 其特征在于, 该代理服务器包括: 超文本传输 协议 HTTP请求处理模块、 HTTP抓取模块、 超文本标记语言 HTML解 析模块以及打包处理模块, 其中,
HTTP请求处理模块, 用于接收外部移动终端发送的 HTTP请求, 获取携带的网页服务器的统一资源定位器 URL信息, 输出至 HTTP抓 取模块;
HTTP抓取模块,用于根据接收的网页服务器的 URL信息, 向 URL 信息对应的网页服务器抓取 HTML页面信息,输出至 HTML解析模块; 接收 HTML解析模块输出的图片链接信息,向图片链接信息对应的图片 服务器抓取图片信息,将抓取的 HTML页面信息以及图片信息输出至打 包处理模块;
HTML解析模块, 用于接收 HTML页面信息, 解析获取包含的图片 链接信息, 输出至 HTTP抓取模块;
打包处理模块, 用于接收 HTML页面信息以及图片信息, 进行打包 处理后输出至发送所述 HTTP请求的移动终端。
2、 如权利要求 1所述的代理服务器, 其特征在于, 进一步包括: 图 片转化模块,
所述 HTTP请求处理模块, 进一步用于将解析获取的 HTTP请求中 携带的移动终端浏览器信息输出至图片转化模块;
所述图片转化模块, 用于从 HTTP抓取模块读取图片信息, 根据接 收的移动终端浏览器信息进行图片转化处理, 输出至打包处理模块。
3、如权利要求 1或 2所述的代理服务器,其特征在于,进一步包括: 图文压缩模块, 用于将打包处理模块打包处理的图文信息进行压缩 处理, 输出至发送所述 HTTP请求的移动终端。
4、一种获取图文信息的系统,其特征在于,该系统包括: 移动终端、 代理服务器、 网页服务器以及图片服务器, 其中,
移动终端, 用于向代理服务器发送超文本传输协议 HTTP请求, 接 收代理服务器返回的图文信息, 解析并进行展示;
代理服务器, 用于根据接收的 HTTP请求中携带的网页服务器的统 一资源定位器 URL信息, 向该网页服务器发送 HTTP请求; 接收网页 服务器发送的携带超文本标记语言 HTML页面信息的 HTTP请求应答并 进行解析, 获取图片链接信息, 向图片链接信息对应的图片服务器发送 图片 HTTP请求;接收图片服务器返回的图片信息, 与 HTML页面信息 封装为图文信息后输出至发送所述 HTTP请求的移动终端;
网页服务器, 用于根据接收的 HTTP请求中携带的 URL信息,获取 对应的 HTML页面信息,携带在 HTTP请求应答中,向代理服务器发送; 图片服务器, 用于根据接收的图片 HTTP请求中携带的图片链接信 息, 获取对应的图片信息, 携带在图片 HTTP请求应答中, 向代理服务 器发送。
5、 如权利要求 4所述的系统, 其特征在于, 所述代理服务器包括: HTTP请求处理模块、 HTTP抓取模块、 HTML解析模块以及打包处理 模块, 其中,
HTTP请求处理模块, 用于接收外部移动终端发送的 HTTP请求, 获取携带的网页服务器的统一资源定位器 URL信息, 输出至 HTTP抓 取模块;
HTTP抓取模块,用于根据接收的网页服务器的 URL信息, 向 URL 信息对应的网页服务器抓取 HTML页面信息,输出至 HTML解析模块; 接收 HTML解析模块输出的图片链接信息,向图片链接信息对应的图片 服务器抓取图片信息,将抓取的 HTML页面信息以及图片信息输出至打 包处理模块;
HTML解析模块, 用于接收 HTML页面信息, 解析获取包含的图片 链接信息, 输出至 HTTP抓取模块;
打包处理模块, 用于接收 HTML页面信息以及图片信息, 进行打包 处理后输出至发送所述 HTTP请求的移动终端。
6、 如权利要求 5所述的系统, 其特征在于, 所述代理服务器进一步 包括: 图片转化模块,
所述 HTTP请求处理模块, 进一步用于将解析获取的 HTTP请求中 携带的移动终端浏览器信息输出至图片转化模块;
所述图片转化模块, 用于从 HTTP抓取模块读取图片信息, 根据接 收的移动终端浏览器信息进行图片转化处理, 输出至打包处理模块。
7、 如权利要求 5或 6所述的系统, 其特征在于, 所述代理服务器进 一步包括:
图文压缩模块, 用于将打包处理模块打包处理的图文信息进行压缩 处理, 输出至发送所述 HTTP请求的移动终端。
8、 一种获取图文信息的方法, 其特征在于, 该方法包括: 根据接收的移动终端发送的超文本传输协议 HTTP请求中携带的网 页服务器的统一资源定位器 URL信息, 向该网页服务器发送 HTTP请 求;
解析接收的 HTTP请求应答中包含的超文本标记语言 HTML页面信 息,获取图片链接信息,向图片链接信息对应图片服务器发送图片 HTTP 请求;
接收图片服务器返回的图片信息,与预先获取的 HTML页面信息封 装为图文信息, 输出至发送所述 HTTP请求的移动终端。
9、 如权利要求 8所述的方法, 其特征在于, 所述 HTTP请求中进一 步携带有移动终端浏览器信息,
所述接收图片服务器返回的图片信息,与预先获取的 HTML页面信 息封装为图文信息具体包括:
接收图片服务器返回的图片信息, 按照所述移动终端浏览器信息对 图片进行处理;
将处理的图片与预先获取的 HTML页面信息封装为图文信息。
10、 如权利要求 8或 9所述的方法, 其特征在于, 在封装为图文信 息后, 输出至发送所述 HTTP请求的移动终端前, 进一步包括:
对封装的图文信息进行压缩处理。
PCT/CN2012/070525 2011-01-27 2012-01-18 一种获取图文信息的装置、系统及方法 WO2012100701A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US13/941,498 US20130305140A1 (en) 2011-01-27 2013-07-14 Apparatus, system, and method for obtaining image and text information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2011100325654A CN102624761A (zh) 2011-01-27 2011-01-27 一种获取图文信息的装置、系统及方法
CN201110032565.4 2011-01-27

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US13/941,498 Continuation US20130305140A1 (en) 2011-01-27 2013-07-14 Apparatus, system, and method for obtaining image and text information

Publications (1)

Publication Number Publication Date
WO2012100701A1 true WO2012100701A1 (zh) 2012-08-02

Family

ID=46564445

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/070525 WO2012100701A1 (zh) 2011-01-27 2012-01-18 一种获取图文信息的装置、系统及方法

Country Status (3)

Country Link
US (1) US20130305140A1 (zh)
CN (1) CN102624761A (zh)
WO (1) WO2012100701A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9569554B2 (en) * 2011-07-29 2017-02-14 Xink System and computer-implemented method for incorporating an image into a page of content for transmission over a telecommunications network
CN102902803B (zh) * 2012-10-12 2016-01-13 北京奇虎科技有限公司 网页转码系统
CN102902802B (zh) * 2012-10-12 2016-06-01 北京奇虎科技有限公司 一种网页转码方法和装置
CN103902631B (zh) * 2012-12-28 2019-03-29 联想(北京)有限公司 电子设备和数据获取方法
CN103139292B (zh) * 2013-01-22 2017-02-08 深圳市深信服电子科技有限公司 在http代理中处理图片的方法、代理服务器及系统
CN103248709B (zh) * 2013-05-23 2016-03-16 网宿科技股份有限公司 无线信号自动化仿真方法及系统
US10121263B2 (en) * 2013-10-31 2018-11-06 Uc Mobile Co., Ltd. Methods and devices for image loading and methods and devices for video playback
CN103631935B (zh) * 2013-12-05 2017-04-05 用友优普信息技术有限公司 移动端图文混排展示装置和移动端图文混排展示方法
EP3029911A1 (en) * 2014-12-04 2016-06-08 Alcatel Lucent Method, system and device for delivering a web application to a client
CN106161521B (zh) * 2015-04-01 2019-09-10 阿里巴巴集团控股有限公司 超文本传输协议请求的处理方法及装置
CN104766014B (zh) * 2015-04-30 2017-12-01 安一恒通(北京)科技有限公司 用于检测恶意网址的方法和系统
CN107528813B (zh) * 2016-06-22 2020-03-10 北京金山云网络技术有限公司 访问私有集群的系统、方法、控制服务器和代理服务器
CN108616552B (zh) * 2016-12-13 2021-06-11 腾讯科技(深圳)有限公司 网页访问方法、装置和系统
CN106874515A (zh) * 2017-03-14 2017-06-20 深圳市博信诺达经贸咨询有限公司 网上信息抓取方法及系统
US11113259B2 (en) * 2017-08-02 2021-09-07 Tata Consultancy Services Limited Method and system for analyzing unstructured data for compliance enforcement
CN107423446B (zh) * 2017-08-11 2021-09-24 义乌工商职业技术学院 基于云存储的新媒体自动化可信部署系统和方法
CN109241470A (zh) * 2018-09-27 2019-01-18 北京小米移动软件有限公司 页面显示方法、装置及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101052957A (zh) * 2004-08-25 2007-10-10 丘里奥控股公司 图片共享对等网络中用于改进访客图像查看性能的代理高速缓存技术
CN101079895A (zh) * 2006-12-21 2007-11-28 腾讯科技(深圳)有限公司 一种快速访问Web网页的方法、系统及代理服务设备
CN101202755A (zh) * 2007-12-20 2008-06-18 腾讯科技(深圳)有限公司 一种移动终端的图片显示系统、方法和装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5892908A (en) * 1996-09-10 1999-04-06 Marketscape Method of extracting network information
US5764889A (en) * 1996-09-26 1998-06-09 International Business Machines Corporation Method and apparatus for creating a security environment for a user task in a client/server system
US8010702B2 (en) * 2001-06-14 2011-08-30 Nokia Corporation Feature-based device description and content annotation
WO2005003998A1 (en) * 2003-06-30 2005-01-13 International Business Machines Corporation Ibm A method and system for improving presentation of html pages in web devices
US7290006B2 (en) * 2003-09-30 2007-10-30 Microsoft Corporation Document representation for scalable structure
JP2006178912A (ja) * 2004-12-24 2006-07-06 Fujitsu Ltd 情報処理方法及びプログラム
US7873710B2 (en) * 2007-02-06 2011-01-18 5O9, Inc. Contextual data communication platform
US8331288B2 (en) * 2008-04-01 2012-12-11 Infosys Technologies Limited Intelligent access point for delivering location based information
US8156418B2 (en) * 2008-06-05 2012-04-10 Microsoft Corporation Image acquisition from dynamic content for delivery to network-enabled static display devices
US20100050089A1 (en) * 2008-08-20 2010-02-25 Company 100, Inc. Web browser system of mobile communication terminal, using proxy server
US7962547B2 (en) * 2009-01-08 2011-06-14 International Business Machines Corporation Method for server-side logging of client browser state through markup language

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101052957A (zh) * 2004-08-25 2007-10-10 丘里奥控股公司 图片共享对等网络中用于改进访客图像查看性能的代理高速缓存技术
CN101079895A (zh) * 2006-12-21 2007-11-28 腾讯科技(深圳)有限公司 一种快速访问Web网页的方法、系统及代理服务设备
CN101202755A (zh) * 2007-12-20 2008-06-18 腾讯科技(深圳)有限公司 一种移动终端的图片显示系统、方法和装置

Also Published As

Publication number Publication date
CN102624761A (zh) 2012-08-01
US20130305140A1 (en) 2013-11-14

Similar Documents

Publication Publication Date Title
WO2012100701A1 (zh) 一种获取图文信息的装置、系统及方法
CN103392179B (zh) 获取页面资源的方法及装置、浏览器及移动终端
US20150189036A1 (en) Offline caching method and apparatus
WO2011088640A1 (zh) 一种移动终端浏览多媒体资源的方法、相应系统及通信系统
US9571556B2 (en) Browser kernel adaptation method and browser therefor
WO2012142892A1 (zh) 一种浏览器的脚本处理方法和系统
EP1829284B1 (en) System and method for enhancing network-browsing speed by setting a proxy server on a handheld device
WO2018001124A1 (zh) 网页文件发送方法、网页渲染方法及装置、网页渲染系统
WO2012155849A1 (zh) 网页浏览方法、代理服务器及网页浏览系统
WO2012113176A1 (zh) 终端网页显示方法及系统
WO2012163122A1 (zh) 一种页面浏览方法、服务器和终端
CN102638580A (zh) 一种网页信息处理方法和装置
WO2012155477A1 (zh) 数字电视节目共享装置及方法、机顶盒
WO2012116542A1 (zh) 移动终端浏览器调用本地应用的方法及装置
WO2013078830A1 (zh) 一种处理移动终端的页面访问请求的方法、设备与系统
CN103685381B (zh) 一种网页资源下载方法、系统和装置
TW201244432A (en) Graphics sharing method, system and terminal
WO2015154666A1 (zh) 桌面展示网页片段的方法及截取网页片段至桌面展示系统
CN103582012B (zh) 一种数据分发方法及装置
WO2015000361A1 (zh) 报文压缩的方法和装置
CN110769009B (zh) 用户身份认证方法及系统
WO2017114190A1 (zh) 一种文件上传处理方法及装置
CN102970356A (zh) 云端服务器和客户端的通信方法、系统和装置
WO2016000176A1 (zh) 一种页面插入方法和设备
KR100851746B1 (ko) 이동통신 단말기를 포함하는 마크업 페이지 송수신 시스템 및 그 제어방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12739876

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205N DATED 04/10/2013)

122 Ep: pct application non-entry in european phase

Ref document number: 12739876

Country of ref document: EP

Kind code of ref document: A1