CN102624761A - 一种获取图文信息的装置、系统及方法 - Google Patents

一种获取图文信息的装置、系统及方法 Download PDF

Info

Publication number
CN102624761A
CN102624761A CN2011100325654A CN201110032565A CN102624761A CN 102624761 A CN102624761 A CN 102624761A CN 2011100325654 A CN2011100325654 A CN 2011100325654A CN 201110032565 A CN201110032565 A CN 201110032565A CN 102624761 A CN102624761 A CN 102624761A
Authority
CN
China
Prior art keywords
information
picture
http request
module
http
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100325654A
Other languages
English (en)
Inventor
阮曙东
张开翔
徐羽
向伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN2011100325654A priority Critical patent/CN102624761A/zh
Priority to PCT/CN2012/070525 priority patent/WO2012100701A1/zh
Publication of CN102624761A publication Critical patent/CN102624761A/zh
Priority to US13/941,498 priority patent/US20130305140A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • H04L67/5651Reducing the amount or size of exchanged application data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/04Protocols specially adapted for terminals or networks with limited capabilities; specially adapted for terminal portability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/567Integrating service provisioning from a plurality of service providers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种获取图文信息的装置、系统及方法。根据接收的移动终端发送的超文本传输协议HTTP请求中携带的Web服务器的统一资源定位器URL信息,向Web服务器发送HTTP请求;解析接收的HTTP请求应答中包含的超文本标记语言HTML页面信息,获取图片链接信息,向图片服务器发送图片HTTP请求;接收图片服务器返回的图片信息,与预先获取的HTML页面信息封装为图文信息,输出至移动终端。应用本发明,可以减少移动终端浏览器与相应服务器之间交互的次数、提高用户体验。

Description

一种获取图文信息的装置、系统及方法
技术领域
本发明涉及图文传输技术,特别涉及一种获取图文信息的装置、系统及方法。
背景技术
随着无线互联网的发展,通过无线网络获取信息越来越成为人们生活以及工作中不可或缺的一部分,用户使用移动终端通过无线网络与网站服务器,例如,Web服务器以及图片服务器连接,利用移动终端内置的无线浏览器,通过统一资源定位器(URL,Uniform Resource Locators)向网站服务器发送超文本传输协议(HTTP,Hypertext Transfer Protocol)请求,获取网站服务器提供的包含网页文本和图片的图文信息。
图1为现有技术用户请求获取图文信息的方法流程示意图。参见图1,以用户浏览http://www.foo.com/index.html网页为例,假设网页页面,也就是超文本标记语言(HTML,Hyper Text Mark-up Language)页面信息包含网页文本和图片,具体内容为:
Figure BSA00000430180100011
该流程包括:
步骤101,移动终端浏览器向目的URL的Web服务器发起HTTP请求;
本步骤中,目的URL为http://www.foo.com/index.html,Web服务器域名为www.foo.com。
步骤102,Web服务器向移动终端浏览器返回HTTP请求应答,携带HTML页面信息;
本步骤中,HTML页面信息包括:
Figure BSA00000430180100021
步骤103,移动终端浏览器解析接收的HTML页面信息,获取图片链接信息,并展示网页页面;
本步骤中,移动终端浏览器根据接收的HTML页面信息展示相应的网页文本,同时,解析获取HTML页面信息中包含的图片链接信息,即http://image.foo.com/foo.jpg。
实际应用中,由于网页文本信息包含在HTML页面信息,因而,根据获取的HTML页面信息可以直接获取并展示网页文本,而对于图片,一般以图片链接信息包含在HTML页面信息中,因而,在获取HTML页面信息后,需要根据HTML页面信息中包含的图片链接信息去获取相应的图片进行展示。
步骤104,移动终端浏览器向图片服务器发起图片HTTP请求;
本步骤中,移动终端浏览器根据解析获取的图片链接信息,生成图片HTTP请求,向图片链接信息中包含的图片服务器发送,该图片服务器的域名为图片链接信息中的image.foo.com,请求获取URL地址为http://image.foo.com/foo.jpg的图片。
步骤105,图片服务器向移动终端浏览器返回图片HTTP请求应答;
本步骤中,图片HTTP请求应答中携带二进制图片数据,图片foo.jpg以二进制数据表示,并返回移动终端浏览器。
步骤106,移动终端浏览器根据自身的浏览器信息调整图片,并将调整的图片进行展示。
本步骤中,图片服务器以统一的格式存储图片,并以存储的统一格式的图片信息下发图片,而对于移动终端浏览器,由于不同的移动终端浏览器屏幕尺寸不同,因而,需要根据自身的浏览器信息调整图片,例如,下发的图片高宽为800*600,移动终端浏览器屏幕尺寸为600*450,则该移动终端浏览器需要将接收的图片调整为600*450并进行展示。
由上述可见,现有的用户请求获取图文信息的方法,对于网页中包含的图片,需要移动终端浏览器发送两次HTTP请求才能获取,使得移动终端浏览器与相应服务器之间交互的次数较多,而由于移动网络速度较慢,因而,获取图文信息所需的时间较长,影响了用户体验;同时,移动终端浏览器屏幕较小,而图片服务器传输的图片尺寸一般较大,在移动终端浏览器接收到图片后,需要对图片进行缩小处理,这样,导致了图片传输过程中的资源浪费。
发明内容
有鉴于此,本发明的主要目的在于提出一种获取图文信息的装置,减少移动终端浏览器与相应服务器之间交互的次数、提高用户体验。
本发明的另一目的在于提出一种获取图文信息的系统,减少移动终端浏览器与相应服务器之间交互的次数、提高用户体验。
本发明的再一目的在于提出一种获取图文信息的方法,减少移动终端浏览器与相应服务器之间交互的次数、提高用户体验。
为达到上述目的,本发明提供了一种代理服务器,该代理服务器包括:超文本传输协议HTTP请求处理模块、HTTP抓取模块、超文本标记语言HTML解析模块以及打包处理模块,其中,
HTTP请求处理模块,用于接收外部移动终端发送的HTTP请求,获取携带的Web服务器的统一资源定位器URL信息,输出至HTTP抓取模块;
HTTP抓取模块,用于根据接收的Web服务器的URL信息,向外部的Web服务器抓取HTML页面信息,输出至HTML解析模块;接收HTML解析模块输出的图片链接信息,向外部的图片服务器抓取图片信息,将抓取的HTML页面信息以及图片信息输出至打包处理模块;
HTML解析模块,用于接收HTML页面信息,解析获取包含的图片链接信息,输出至HTTP抓取模块;
打包处理模块,用于接收HTML页面信息以及图片信息,进行打包处理后输出至外部的移动终端。
进一步包括:图片转化模块,
所述HTTP请求处理模块,进一步用于解析接收的HTTP请求,将HTTP请求中携带的移动终端浏览器信息输出至图片转化模块;
所述图片转化模块,用于从HTTP抓取模块读取图片信息,根据接收的移动终端浏览器信息进行图片转化处理,输出至打包处理模块。
进一步包括:
图文压缩模块,用于将打包处理模块打包处理的图文信息进行压缩处理,输出至移动终端。
一种获取图文信息的系统,该系统包括:移动终端、代理服务器、Web服务器以及图片服务器,其中,
移动终端,用于向代理服务器发送超文本传输协议HTTP请求,接收代理服务器返回的图文信息,解析并进行展示;
代理服务器,用于根据接收的HTTP请求中携带的Web服务器的统一资源定位器URL信息,向Web服务器发送HTTP请求;接收Web服务器发送的携带超文本标记语言HTML页面信息的HTTP请求应答并进行解析,获取图片链接信息,向图片服务器发送图片HTTP请求;接收图片服务器返回的图片信息,与HTML页面信息封装为图文信息后输出至移动终端;
Web服务器,用于根据接收的HTTP请求中携带的URL信息,获取对应的HTML页面信息,携带在HTTP请求应答中,向代理服务器发送;
图片服务器,用于根据接收的图片HTTP请求中携带的图片链接信息,获取对应的图片信息,携带在图片HTTP请求应答中,向代理服务器发送。
所述代理服务器包括:HTTP请求处理模块、HTTP抓取模块、HTML解析模块以及打包处理模块,其中,
HTTP请求处理模块,用于接收外部移动终端发送的HTTP请求,获取携带的Web服务器的统一资源定位器URL信息,输出至HTTP抓取模块;
HTTP抓取模块,用于根据接收的Web服务器的URL信息,向外部的Web服务器抓取HTML页面信息,输出至HTML解析模块;接收HTML解析模块输出的图片链接信息,向外部的图片服务器抓取图片信息,将抓取的HTML页面信息以及图片信息输出至打包处理模块;
HTML解析模块,用于接收HTML页面信息,解析获取包含的图片链接信息,输出至HTTP抓取模块;
打包处理模块,用于接收HTML页面信息以及图片信息,进行打包处理后输出至外部的移动终端。
所述代理服务器进一步包括:图片转化模块,
所述HTTP请求处理模块,进一步用于解析接收的HTTP请求,将HTTP请求中携带的移动终端浏览器信息输出至图片转化模块;
所述图片转化模块,用于从HTTP抓取模块读取图片信息,根据接收的移动终端浏览器信息进行图片转化处理,输出至打包处理模块。
所述代理服务器进一步包括:
图文压缩模块,用于将打包处理模块打包处理的图文信息进行压缩处理,输出至移动终端。
一种获取图文信息的方法,该方法包括:
根据接收的移动终端发送的超文本传输协议HTTP请求中携带的Web服务器的统一资源定位器URL信息,向Web服务器发送HTTP请求;
解析接收的HTTP请求应答中包含的超文本标记语言HTML页面信息,获取图片链接信息,向图片服务器发送图片HTTP请求;
接收图片服务器返回的图片信息,与预先获取的HTML页面信息封装为图文信息,输出至移动终端。
所述HTTP请求中进一步携带有移动终端浏览器信息,
所述接收图片服务器返回的图片信息,与预先获取的HTML页面信息封装为图文信息具体包括:
接收图片服务器返回的图片信息,按照所述移动终端浏览器信息对图片进行处理;
将处理的图片与预先获取的HTML页面信息封装为图文信息。
在封装为图文信息后,进一步包括:
对封装的图文信息进行压缩处理。
由上述的技术方案可见,本发明提供的一种获取图文信息的装置、系统及方法,系统包括:移动终端、代理服务器、Web服务器以及图片服务器,其中,移动终端向代理服务器发送超文本传输协议HTTP请求,接收代理服务器返回的图文信息,解析并进行展示;代理服务器根据接收的HTTP请求中携带的Web服务器的统一资源定位器URL信息,向Web服务器发送HTTP请求;接收Web服务器发送的携带超文本标记语言HTML页面信息的HTTP请求应答并进行解析,获取图片链接信息,向图片服务器发送图片HTTP请求;接收图片服务器返回的图片信息,与HTML页面信息封装为图文信息后输出至移动终端;Web服务器根据接收的HTTP请求中携带的URL信息,获取对应的HTML页面信息,携带在HTTP请求应答中,向代理服务器发送;图片服务器根据接收的图片HTTP请求中携带的图片链接信息,获取对应的图片信息,携带在图片HTTP请求应答中,向代理服务器发送。这样,移动终端浏览器只需提交一次HTTP请求,就能够获取页面展示的所有资源,减少了移动终端浏览器与相应服务器之间交互的次数、加快了移动终端浏览器展示页面的速度、提高了用户体验。
附图说明
图1为现有技术用户请求获取图文信息的方法流程示意图。
图2为本发明实施例获取图文信息的系统结构示意图。
图3为本发明实施例代理服务器结构示意图。
图4为本发明实施例获取图文信息的方法流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步地详细描述。
现有技术中,移动终端浏览器先向Web服务器发送HTTP请求,获取HTML页面信息,再对获取的HTML页面信息进行解析,获取包含的图片链接信息,再根据图片链接信息向图片服务器发送图片HTTP请求,获取相应的图片进行展示。这样,移动终端浏览器需要两次HTTP请求才能获取网页中的图文信息,使得获取图文所需的时间较长。本发明实施例中,考虑在网络侧设置代理服务器,用于模拟移动终端浏览器与Web服务器以及图片服务器进行交互,获取图文信息后再将图文信息封装输出至移动终端浏览器,这样,可以有效减少移动终端浏览器向图片服务器发送图片HTTP请求时的空口传输时延。
图2为本发明实施例获取图文信息的系统结构示意图。参见图2,该系统包括:移动终端、代理服务器、Web服务器以及图片服务器,其中,
移动终端,用于向代理服务器发送HTTP请求,接收代理服务器返回的图文信息,解析并进行展示;
本发明实施例中,HTTP请求中携带有Web服务器的URL信息。例如,如果用户需要浏览http://www.foo.com/index.html网页,则Web服务器的URL信息为http://www.foo.com/index.html,Web服务器域名包含在URL信息中,为www.foo.com。
较佳地,移动终端向代理服务器发送的HTTP请求中进一步携带有移动终端浏览器信息,移动终端可通过相关函数调用获取自身浏览器信息,具体可参见相关技术文献,在此不再赘述。对于多个移动终端向代理服务器发送HTTP请求的情形,每个HTTP请求中可以携带相应移动终端标识以便于区别。
代理服务器,用于根据接收的HTTP请求中携带的Web服务器的URL信息,向Web服务器发送HTTP请求;接收Web服务器发送的携带HTML页面信息的HTTP请求应答并进行解析,获取图片链接信息,向图片服务器发送图片HTTP请求;接收图片服务器返回的图片信息,与HTML页面信息封装为图文信息后输出至移动终端;
本发明实施例中,代理服务器通过与Web服务器交互获取HTML页面信息,再通过与图片服务器交互获取图片信息,对获取的HTML页面信息以及图片信息进行封装,然后发送至移动终端,这样,就可以节约一次移动终端与图片服务器的空口传输时间,从而提高了用户体验。
如前所述,如果移动终端向代理服务器发送的HTTP请求中携带有移动终端浏览器信息,则代理服务器进一步将获取的图片信息按照移动终端浏览器信息进行处理后与HTML页面信息进行封装,例如,获取的图片高宽为800*600,移动终端浏览器屏幕尺寸为600*450,则该代理服务器将该接收的图片调整为600*450,封装的处理流程为现有技术,在此不再赘述。
当然,实际应用中,也可以将封装的图文信息进一步进行压缩处理。这样,可以有效地减少传输的资源开销,同时也降低了传输图文信息所需的时间。
Web服务器,用于根据接收的HTTP请求中携带的URL信息,获取对应的HTML页面信息,携带在HTTP请求应答中,向代理服务器发送;
图片服务器,用于根据接收的图片HTTP请求中携带的图片链接信息,获取对应的图片信息,携带在图片HTTP请求应答中,向代理服务器发送。
所应说明的是,代理服务器可以是独立的设备,也可以与Web服务器等集成在一起。
图3为本发明实施例代理服务器结构示意图。参见图3,该代理服务器包括:HTTP请求处理模块、HTTP抓取模块、HTML解析模块以及打包处理模块,其中,
HTTP请求处理模块,用于接收外部移动终端发送的HTTP请求,获取携带的Web服务器的统一资源定位器URL信息,输出至HTTP抓取模块;
HTTP抓取模块,用于根据接收的Web服务器的URL信息,向外部的Web服务器抓取HTML页面信息,输出至HTML解析模块;接收HTML解析模块输出的图片链接信息,向外部的图片服务器抓取图片信息,将抓取的HTML页面信息以及图片信息输出至打包处理模块;
HTML解析模块,用于接收HTML页面信息,解析获取包含的图片链接信息,输出至HTTP抓取模块;
打包处理模块,用于接收HTML页面信息以及图片信息,进行打包处理后输出至外部的移动终端。
较佳地,HTTP请求处理模块进一步用于解析接收的HTTP请求,将HTTP请求中携带的移动终端浏览器信息输出至图片转化模块;
该代理服务器进一步包括:图片转化模块,用于从HTTP抓取模块读取图片信息,根据接收的移动终端浏览器信息进行图片转化处理,输出至打包处理模块。
实际应用中,还可以包括:图文压缩模块,用于将打包处理模块打包处理的图文信息进行压缩处理,输出至移动终端。
由上述可见,本发明实施例获取图文的系统,通过设置代理服务器,接收移动终端发送的HTTP请求,根据请求中携带的Web服务器的URL信息,向Web服务器发送HTTP请求;接收Web服务器发送的携带HTML页面信息的HTTP请求应答并进行解析,获取图片链接信息,向图片服务器发送图片HTTP请求;接收图片服务器返回的图片信息,与HTML页面信息封装为图文信息后输出至移动终端。这样,移动终端浏览器只需提交一次HTTP请求,就能够获取页面展示的所有资源,例如,HTML页面信息与图片信息,节省了一次HTTP请求,减少了移动终端浏览器与相应服务器之间交互的次数,由于移动网络速度一般较慢,节省一次HTTP请求可以很大限度上节省时间,从而提高了用户体验。进一步地,代理服务器可以根据移动终端浏览器信息对图片进行缩小处理,大大减小了移动终端拉取的图文数据包大小,节约了传输过程中的资源。而且,代理服务器还可以对图文信息进行压缩处理,即将HTML数据和图片数据一起打包,并进行gzip压缩,进一步减小了图文数据包的大小。
图4为本发明实施例获取图文信息的方法流程示意图。参见图4,以用户浏览包含网页文本和图片的http://www.foo.com/index.html网页为例,该流程包括:
步骤401,接收移动终端发送的HTTP请求;
步骤402,根据接收的HTTP请求中携带的Web服务器的URL信息,向Web服务器发送HTTP请求;
本步骤中,代理服务器向目的URL(http://www.foo.com/index.html)的Web服务器(域名为www.foo.com)发起HTTP请求
步骤403,接收HTTP请求应答,获取HTML页面信息;
本步骤中,Web服务器向代理服务器返回HTTP请求应答,代理服务器获取HTML页面信息:
Figure BSA00000430180100101
步骤404,解析HTML页面信息,获取图片链接信息;
本步骤中,代理服务器解析HTML页面信息,得到img元素中的图片URL,即图片链接信息:http://image.foo.com/foo.jpg。
HTML页面信息包括:无线标记语言(WML,Wireless Markup Language)页面信息以及可扩展超文本标记语言(XHTML,eXtensible Hyper TextMarkup Language)页面信息。
步骤405,向图片服务器发送图片HTTP请求;
本步骤中,代理服务器向图片服务器(域名为image.foo.com)发起图片HTTP请求http://image.foo.com/foo.jpg。
实际应用中,如果需要获取多个图片链接信息,则可以通过多次向图片服务器发送图片HTTP请求或在一次请求中携带多个图片链接信息,这样,可以更加有效减少移动终端与代理服务器的交互次数。
步骤406,接收图片服务器返回的图片信息;
本步骤中,图片服务器返回的图片信息为foo.jpg的二进制图片数据。
步骤407,按照预先获取的移动终端浏览器信息对图片进行处理;
本步骤为可选,如果移动终端在向代理服务器发送的HTTP请求中携带有移动终端浏览器信息,则进行该步骤的处理。
本步骤中,假设图片的原始高宽为800*600,移动终端浏览器高宽(移动终端浏览器信息)为180*240,则该原始图片在移动终端上无法显示,代理服务器按照移动终端浏览器高宽,将图片压缩转化为180*240的图片,并将img元素的高宽设置为180及240,程序代码如下:
Figure BSA00000430180100111
步骤408,将图片信息与HTML页面信息封装为图文信息;
本步骤中,代理服务器将HTML页面信息(HTML数据)和图文信息(图片数据)打包在一起,并进一步可进行gzip压缩,返回给移动终端。压缩可以采用现有的压缩算法,在此不再赘述。
步骤409,向移动终端返回图文并下的数据包;
本步骤中,图文并下的数据包即为封装的图文信息。
步骤410,移动终端接收图文信息,解析并进行展示。
本步骤中,移动终端浏览器解析图文并下包,得到HTML数据和图片数据,并按照顺序进行展示。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换以及改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种代理服务器,其特征在于,该代理服务器包括:超文本传输协议HTTP请求处理模块、HTTP抓取模块、超文本标记语言HTML解析模块以及打包处理模块,其中,
HTTP请求处理模块,用于接收外部移动终端发送的HTTP请求,获取携带的Web服务器的统一资源定位器URL信息,输出至HTTP抓取模块;
HTTP抓取模块,用于根据接收的Web服务器的URL信息,向外部的Web服务器抓取HTML页面信息,输出至HTML解析模块;接收HTML解析模块输出的图片链接信息,向外部的图片服务器抓取图片信息,将抓取的HTML页面信息以及图片信息输出至打包处理模块;
HTML解析模块,用于接收HTML页面信息,解析获取包含的图片链接信息,输出至HTTP抓取模块;
打包处理模块,用于接收HTML页面信息以及图片信息,进行打包处理后输出至外部的移动终端。
2.如权利要求1所述的代理服务器,其特征在于,进一步包括:图片转化模块,
所述HTTP请求处理模块,进一步用于解析接收的HTTP请求,将HTTP请求中携带的移动终端浏览器信息输出至图片转化模块;
所述图片转化模块,用于从HTTP抓取模块读取图片信息,根据接收的移动终端浏览器信息进行图片转化处理,输出至打包处理模块。
3.如权利要求1或2所述的代理服务器,其特征在于,进一步包括:
图文压缩模块,用于将打包处理模块打包处理的图文信息进行压缩处理,输出至移动终端。
4.一种获取图文信息的系统,其特征在于,该系统包括:移动终端、代理服务器、Web服务器以及图片服务器,其中,
移动终端,用于向代理服务器发送超文本传输协议HTTP请求,接收代理服务器返回的图文信息,解析并进行展示;
代理服务器,用于根据接收的HTTP请求中携带的Web服务器的统一资源定位器URL信息,向Web服务器发送HTTP请求;接收Web服务器发送的携带超文本标记语言HTML页面信息的HTTP请求应答并进行解析,获取图片链接信息,向图片服务器发送图片HTTP请求;接收图片服务器返回的图片信息,与HTML页面信息封装为图文信息后输出至移动终端;
Web服务器,用于根据接收的HTTP请求中携带的URL信息,获取对应的HTML页面信息,携带在HTTP请求应答中,向代理服务器发送;
图片服务器,用于根据接收的图片HTTP请求中携带的图片链接信息,获取对应的图片信息,携带在图片HTTP请求应答中,向代理服务器发送。
5.如权利要求4所述的系统,其特征在于,所述代理服务器包括:HTTP请求处理模块、HTTP抓取模块、HTML解析模块以及打包处理模块,其中,
HTTP请求处理模块,用于接收外部移动终端发送的HTTP请求,获取携带的Web服务器的统一资源定位器URL信息,输出至HTTP抓取模块;
HTTP抓取模块,用于根据接收的Web服务器的URL信息,向外部的Web服务器抓取HTML页面信息,输出至HTML解析模块;接收HTML解析模块输出的图片链接信息,向外部的图片服务器抓取图片信息,将抓取的HTML页面信息以及图片信息输出至打包处理模块;
HTML解析模块,用于接收HTML页面信息,解析获取包含的图片链接信息,输出至HTTP抓取模块;
打包处理模块,用于接收HTML页面信息以及图片信息,进行打包处理后输出至外部的移动终端。
6.如权利要求5所述的系统,其特征在于,所述代理服务器进一步包括:图片转化模块,
所述HTTP请求处理模块,进一步用于解析接收的HTTP请求,将HTTP请求中携带的移动终端浏览器信息输出至图片转化模块;
所述图片转化模块,用于从HTTP抓取模块读取图片信息,根据接收的移动终端浏览器信息进行图片转化处理,输出至打包处理模块。
7.如权利要求5或6所述的系统,其特征在于,所述代理服务器进一步包括:
图文压缩模块,用于将打包处理模块打包处理的图文信息进行压缩处理,输出至移动终端。
8.一种获取图文信息的方法,其特征在于,该方法包括:
根据接收的移动终端发送的超文本传输协议HTTP请求中携带的Web服务器的统一资源定位器URL信息,向Web服务器发送HTTP请求;
解析接收的HTTP请求应答中包含的超文本标记语言HTML页面信息,获取图片链接信息,向图片服务器发送图片HTTP请求;
接收图片服务器返回的图片信息,与预先获取的HTML页面信息封装为图文信息,输出至移动终端。
9.如权利要求8所述的方法,其特征在于,所述HTTP请求中进一步携带有移动终端浏览器信息,
所述接收图片服务器返回的图片信息,与预先获取的HTML页面信息封装为图文信息具体包括:
接收图片服务器返回的图片信息,按照所述移动终端浏览器信息对图片进行处理;
将处理的图片与预先获取的HTML页面信息封装为图文信息。
10.如权利要求8或9所述的方法,其特征在于,在封装为图文信息后,进一步包括:
对封装的图文信息进行压缩处理。
CN2011100325654A 2011-01-27 2011-01-27 一种获取图文信息的装置、系统及方法 Pending CN102624761A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2011100325654A CN102624761A (zh) 2011-01-27 2011-01-27 一种获取图文信息的装置、系统及方法
PCT/CN2012/070525 WO2012100701A1 (zh) 2011-01-27 2012-01-18 一种获取图文信息的装置、系统及方法
US13/941,498 US20130305140A1 (en) 2011-01-27 2013-07-14 Apparatus, system, and method for obtaining image and text information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100325654A CN102624761A (zh) 2011-01-27 2011-01-27 一种获取图文信息的装置、系统及方法

Publications (1)

Publication Number Publication Date
CN102624761A true CN102624761A (zh) 2012-08-01

Family

ID=46564445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100325654A Pending CN102624761A (zh) 2011-01-27 2011-01-27 一种获取图文信息的装置、系统及方法

Country Status (3)

Country Link
US (1) US20130305140A1 (zh)
CN (1) CN102624761A (zh)
WO (1) WO2012100701A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902802A (zh) * 2012-10-12 2013-01-30 北京奇虎科技有限公司 一种网页转码方法和装置
CN102902803A (zh) * 2012-10-12 2013-01-30 北京奇虎科技有限公司 网页转码系统
CN103139292A (zh) * 2013-01-22 2013-06-05 深圳市深信服电子科技有限公司 在http代理中处理图片的方法、代理服务器及系统
CN103248709A (zh) * 2013-05-23 2013-08-14 网宿科技股份有限公司 无线信号自动化仿真方法及系统
CN103631935A (zh) * 2013-12-05 2014-03-12 用友软件股份有限公司 移动端图文混排展示装置和移动端图文混排展示方法
CN103902631A (zh) * 2012-12-28 2014-07-02 联想(北京)有限公司 电子设备和数据获取方法
WO2016155491A1 (zh) * 2015-04-01 2016-10-06 阿里巴巴集团控股有限公司 超文本传输协议请求的处理方法及装置
CN106874515A (zh) * 2017-03-14 2017-06-20 深圳市博信诺达经贸咨询有限公司 网上信息抓取方法及系统
CN107423446A (zh) * 2017-08-11 2017-12-01 义乌工商职业技术学院 基于云存储的新媒体自动化可信部署系统和方法
CN107528813A (zh) * 2016-06-22 2017-12-29 北京金山云网络技术有限公司 访问私有集群的系统、方法、控制服务器和代理服务器
CN108616552A (zh) * 2016-12-13 2018-10-02 腾讯科技(深圳)有限公司 网页访问方法、装置和系统
CN109241470A (zh) * 2018-09-27 2019-01-18 北京小米移动软件有限公司 页面显示方法、装置及系统

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9569554B2 (en) * 2011-07-29 2017-02-14 Xink System and computer-implemented method for incorporating an image into a page of content for transmission over a telecommunications network
US10121263B2 (en) * 2013-10-31 2018-11-06 Uc Mobile Co., Ltd. Methods and devices for image loading and methods and devices for video playback
EP3029911A1 (en) * 2014-12-04 2016-06-08 Alcatel Lucent Method, system and device for delivering a web application to a client
CN104766014B (zh) * 2015-04-30 2017-12-01 安一恒通(北京)科技有限公司 用于检测恶意网址的方法和系统
US11113259B2 (en) * 2017-08-02 2021-09-07 Tata Consultancy Services Limited Method and system for analyzing unstructured data for compliance enforcement

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101052957A (zh) * 2004-08-25 2007-10-10 丘里奥控股公司 图片共享对等网络中用于改进访客图像查看性能的代理高速缓存技术
CN101079895A (zh) * 2006-12-21 2007-11-28 腾讯科技(深圳)有限公司 一种快速访问Web网页的方法、系统及代理服务设备
CN101202755A (zh) * 2007-12-20 2008-06-18 腾讯科技(深圳)有限公司 一种移动终端的图片显示系统、方法和装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5892908A (en) * 1996-09-10 1999-04-06 Marketscape Method of extracting network information
US5764889A (en) * 1996-09-26 1998-06-09 International Business Machines Corporation Method and apparatus for creating a security environment for a user task in a client/server system
US8010702B2 (en) * 2001-06-14 2011-08-30 Nokia Corporation Feature-based device description and content annotation
ATE386985T1 (de) * 2003-06-30 2008-03-15 Ibm Verfahren und system zum verbessern der präsentation von html-seiten in einem internetzugriffsgerät
US7290006B2 (en) * 2003-09-30 2007-10-30 Microsoft Corporation Document representation for scalable structure
JP2006178912A (ja) * 2004-12-24 2006-07-06 Fujitsu Ltd 情報処理方法及びプログラム
US7873710B2 (en) * 2007-02-06 2011-01-18 5O9, Inc. Contextual data communication platform
US8331288B2 (en) * 2008-04-01 2012-12-11 Infosys Technologies Limited Intelligent access point for delivering location based information
US8156418B2 (en) * 2008-06-05 2012-04-10 Microsoft Corporation Image acquisition from dynamic content for delivery to network-enabled static display devices
US20100050089A1 (en) * 2008-08-20 2010-02-25 Company 100, Inc. Web browser system of mobile communication terminal, using proxy server
US7962547B2 (en) * 2009-01-08 2011-06-14 International Business Machines Corporation Method for server-side logging of client browser state through markup language

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101052957A (zh) * 2004-08-25 2007-10-10 丘里奥控股公司 图片共享对等网络中用于改进访客图像查看性能的代理高速缓存技术
CN101079895A (zh) * 2006-12-21 2007-11-28 腾讯科技(深圳)有限公司 一种快速访问Web网页的方法、系统及代理服务设备
CN101202755A (zh) * 2007-12-20 2008-06-18 腾讯科技(深圳)有限公司 一种移动终端的图片显示系统、方法和装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902803B (zh) * 2012-10-12 2016-01-13 北京奇虎科技有限公司 网页转码系统
CN102902803A (zh) * 2012-10-12 2013-01-30 北京奇虎科技有限公司 网页转码系统
CN102902802A (zh) * 2012-10-12 2013-01-30 北京奇虎科技有限公司 一种网页转码方法和装置
CN102902802B (zh) * 2012-10-12 2016-06-01 北京奇虎科技有限公司 一种网页转码方法和装置
CN103902631B (zh) * 2012-12-28 2019-03-29 联想(北京)有限公司 电子设备和数据获取方法
CN103902631A (zh) * 2012-12-28 2014-07-02 联想(北京)有限公司 电子设备和数据获取方法
CN103139292B (zh) * 2013-01-22 2017-02-08 深圳市深信服电子科技有限公司 在http代理中处理图片的方法、代理服务器及系统
CN103139292A (zh) * 2013-01-22 2013-06-05 深圳市深信服电子科技有限公司 在http代理中处理图片的方法、代理服务器及系统
CN103248709A (zh) * 2013-05-23 2013-08-14 网宿科技股份有限公司 无线信号自动化仿真方法及系统
CN103248709B (zh) * 2013-05-23 2016-03-16 网宿科技股份有限公司 无线信号自动化仿真方法及系统
CN103631935A (zh) * 2013-12-05 2014-03-12 用友软件股份有限公司 移动端图文混排展示装置和移动端图文混排展示方法
CN103631935B (zh) * 2013-12-05 2017-04-05 用友优普信息技术有限公司 移动端图文混排展示装置和移动端图文混排展示方法
WO2016155491A1 (zh) * 2015-04-01 2016-10-06 阿里巴巴集团控股有限公司 超文本传输协议请求的处理方法及装置
CN107528813A (zh) * 2016-06-22 2017-12-29 北京金山云网络技术有限公司 访问私有集群的系统、方法、控制服务器和代理服务器
CN107528813B (zh) * 2016-06-22 2020-03-10 北京金山云网络技术有限公司 访问私有集群的系统、方法、控制服务器和代理服务器
CN108616552A (zh) * 2016-12-13 2018-10-02 腾讯科技(深圳)有限公司 网页访问方法、装置和系统
CN106874515A (zh) * 2017-03-14 2017-06-20 深圳市博信诺达经贸咨询有限公司 网上信息抓取方法及系统
CN107423446A (zh) * 2017-08-11 2017-12-01 义乌工商职业技术学院 基于云存储的新媒体自动化可信部署系统和方法
CN107423446B (zh) * 2017-08-11 2021-09-24 义乌工商职业技术学院 基于云存储的新媒体自动化可信部署系统和方法
CN109241470A (zh) * 2018-09-27 2019-01-18 北京小米移动软件有限公司 页面显示方法、装置及系统

Also Published As

Publication number Publication date
WO2012100701A1 (zh) 2012-08-02
US20130305140A1 (en) 2013-11-14

Similar Documents

Publication Publication Date Title
CN102624761A (zh) 一种获取图文信息的装置、系统及方法
CN103392179B (zh) 获取页面资源的方法及装置、浏览器及移动终端
KR101362384B1 (ko) 웹 플랫폼을 이용한 아이피 기반 IoT 사물 브라우징 방법 및 시스템
CN102761456B (zh) 一种获得移动终端浏览器性能参数的方法、装置及系统
CN103220371B (zh) 内容适配方法及系统
CN103685381B (zh) 一种网页资源下载方法、系统和装置
CN101794298A (zh) 一种实现页面适配的方法、页面适配系统及通信系统
US9571556B2 (en) Browser kernel adaptation method and browser therefor
CN101178717A (zh) 一种对网页进行适配处理的方法及网页适配装置
CN103582012B (zh) 一种数据分发方法及装置
CN104217024A (zh) 网页数据处理方法和装置
CN102650990A (zh) 终端网页显示方法及系统
CN102447726A (zh) 页面访问方法及系统
CN103116645A (zh) 移动设备浏览网页的方法及装置
CN102970356A (zh) 云端服务器和客户端的通信方法、系统和装置
CN106933853A (zh) 一种文件上传处理方法及装置
RU2015119609A (ru) Способ восстановления контента, соответствующего url-адресу, клиентским устройством
CN103581232A (zh) web页面传输方法、web页面显示装置及包含该装置的系统
CN101771928B (zh) 一种网页发送方法和系统以及代理服务器
CN104361130B (zh) 一种在网页中搜索局域网或指定网段内设备的方法
CN102810093A (zh) 基于用户信息的云架构paat页面自适应系统及方法
CN101257501B (zh) 数据导入方法、系统及Web服务器
US8185607B1 (en) Querying wireless network offerings
WO2016058401A1 (zh) 一种超文本传输协议数据还原方法及装置
CN102355504A (zh) Flv在线视频缓存方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120801