CN101526953A - Www转换技术 - Google Patents

Www转换技术 Download PDF

Info

Publication number
CN101526953A
CN101526953A CN200910076764A CN200910076764A CN101526953A CN 101526953 A CN101526953 A CN 101526953A CN 200910076764 A CN200910076764 A CN 200910076764A CN 200910076764 A CN200910076764 A CN 200910076764A CN 101526953 A CN101526953 A CN 101526953A
Authority
CN
China
Prior art keywords
page
www
wap
web page
webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910076764A
Other languages
English (en)
Inventor
杨金钰
谢茂培
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
BEIJING TIAO DIGITAL Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING TIAO DIGITAL Co Ltd filed Critical BEIJING TIAO DIGITAL Co Ltd
Priority to CN200910076764A priority Critical patent/CN101526953A/zh
Publication of CN101526953A publication Critical patent/CN101526953A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种将WWW网页转换为WAP网页的方法,其特征在于包括下列步骤:步骤A,接收客户端访问某一URL的请求,根据URL进行对网页是否是WWW网页进行初步判断;步骤B,获取页面内容;步骤C,对可能不是WWW网页的网页做进一步的判断,确定其是否是WWW网页;步骤D,对WWW网页进行页面转换,首先确定显示宽度,然后将页面的各区块从上到下重新排序,将页面内容的格式转换为适于手机浏览的格式,并缩小超过设定大小的图片;步骤D,将转换后的页面返回给客户端。转换时,还可以通过建立超链接方式将无用和/或次要信息在页面中的折叠隐藏。本发明不仅可以进行WWW网页内容的转换,而且可以识别哪些网页是需要转换的WWW网页,并在转换过程中将人们较少关注的信息隐藏起来。

Description

WWW转换技术
技术领域
本发明涉及一种无线互联网的页面处理、分析、计算和显示技术,主要用于通过转换引擎将适宜于微机访问的WWW页面转换为适宜于手机访问的WAP页面。
背景技术
目前,大部分手机等小屏幕移动终端只能访问WAP网站,而无法访问WWW网站。但是,可供手机等直接访问的WAP网站数量较少,大部分的企业、个人、政府等建立的网站基本上都是WWW网站,这些网站只能使用PC正常浏览和访问。为充分利用现有的WWW网站资源供手机等访问,通常可以采用作为中间桥梁的转换引擎(转换代理服务器)将适宜于PC访问的WWW页面转换为适宜于手机访问的WAP页面,例如中国CN1613105A号发明专利公开说明书公开了一种用于在小屏幕客户终端的显示屏上显示超文本标记语言文档的方法,该方法通过应用至少一种客户端页面样式来将所述HTML文档重新格式化,从而调整所述重新格式化文档的宽度以适应所述显示屏的宽度,并在所述显示屏显示所述重新格式化文档。所述HTML文档重新格式化的步骤包括将所述HTML文档中的表格单元转换为块级元素;忽略宽度超过第一预定尺寸的图像;忽略宽度小于第二预定尺寸的图像;忽略宽度和高度等于预定的一组宽度和高度其中之一项的图像;按比例缩小尺寸超出第三预定尺寸的图像;所述图像的所述尺寸的参数没有在所述HTML文档中作为属性出现,则确定所述尺寸为伪属性;将所述HTML文档中的定位元素转换为块级元素;忽略后续换行符,从而缩小所述重新格式化文档的纵向尺寸;将不可分空格字符转换为常规空格字符,从而缩小所述重新格式化文档的水平尺寸;还可以根据需要将页面放大和缩小。经过该方法的转换,人们可以通过手机等小屏幕移动终端方便地访问和浏览WWW网站页面的主要内容。但是,由于这种转换方法不能判断手机访问的网页是否是需要进行转换的WWW网页,难以在实际中推广使用;另外,对文字部分没有进行必要的甄别,使用户不关注的大量信息显示在屏幕上,影响对有用信息的浏览和查看。
发明内容
为克服现有技术的上述缺陷,本发明提供了一种将WWW网页转换为WAP网页的方法,该方法不仅可以进行WWW网页内容的转换,而且可以识别哪些网页是需要转换的WWW网页,并在转换过程中将人们较少关注的信息隐藏起来。
本发明实现上述目的的技术方案是:一种将WWW网页转换为WAP网页的方法,包括下列步骤:
步骤A,接收客户端访问某一URL的请求,根据URL进行对网页是否是WWW网页进行初步判断;
步骤B,获取页面内容;
步骤C,对可能不是WWW网页的网页做进一步的判断,确定其是否是WWW网页;
步骤D,对WWW网页进行页面转换,首先确定显示宽度,然后将页面的各区块从上到下重新排序,将页面内容的格式转换为适于手机浏览的格式,并缩小超过设定大小的图片;
步骤D,将转换后的页面返回给客户端。
由于本发明在接到客户端请求后,首先根据URL对用户请求访问的网页是否是WWW网页进行初步判断,并对可能不是WWW网页的网页在获得页面内容后进行进一步的判断,由此可以准确地判断出该网页是否是WWW网页,由此克服了现有技术不能对网页性质做出准确判断的缺陷;由于可以将转换后的页面宽度设定为适应于客户端的宽度,并且不同区块依据自上到下的方式进行排列,由此不需要进行纵向滚动,方便了人们浏览;由于将超过一定限度的大图片进行了缩小,使这些大图片得以在手机上显示,由此克服了将大图片一律删除的缺陷。
具体实施方式
本发明的主要内容包括两方面:一是判断客户端请求访问的网页是WAP网页还是WWW页面,二是对页面进行格式转换和页面重排,在抓取WWW网页的内容后,对页面、文字、表单、图片进行分析,对分割出来的各区块依据自上到下的顺序重新排列,将html的格式转换为wml或xhtml等适于手机浏览的格式,将图片进行格式转换、过滤和缩小,以适应手机的显示能力。
可以通过预设显示宽度的方式确定显示宽度,也可以通过解析客户端UA的方式获得客户端的显示器参数,依据客户端显示器的实际情况设定适宜的显示宽度。然后根据显示宽度的要求将段落折行,将页面各区块以及同一区块的各段落依据从上到下的方式进行排列。
本发明的总体步骤在前面的发明内容中已经介绍,不再赘述。这里,仅对几个重要的具体实施方式做进一步的说明:
(1)识别客户端请求访问的网页是WAP网页还是WWW页面的方式:包括两步:
第一步是步骤A中的初步判断:如果HTTP请求中的域名以wap.***、m.***、3g.***关键字开头,则判定是WAP网页,不是WWW网页;
第二步是步骤C中的进一步判断:分析页面的HTTP HEAD中的Content-Type值,这个值描述了当前页面的格式,如果是″text/vnd.wap.wml″或者是″application/vnd.wap.wmlc″,则分析其中是否包含关键字″wap″或″wml″,若包含这两个关键字中的任意一个,则认为是WAP页面,否则需要进一步对页面文本内容的格式分析,wap格式网页会以″<?xml″标签开头,并且XML根节点为″<wml>″,满足这两个条件的就认为是wap网页,否则就是WWW网页。
(2)从Html到WML\XHTML格式的转换:
目前,手机WAP的格式是WML和XHTML,格式的转换是转换引擎的重要工作,可依据现有技术。
(3)对页面布局的重新排列:将整个页面分割为多个区块,然后按照选定的显示宽度进行折行,并对各区块的分布方式进行重排,重排页面要达到的一个重要目标是保证用户不再需要进行左右滚动,因此应采用自上到下排列方式,将页面区块从上到下排列,各区块的排列次序可以依据满足用户需要和便于处理的原则确定,通常有两种排列方式:一是以原来页面区块从左到右的顺序确定重新排列的顺序;二是根据区块的内容或属性依据预设的优先次序顺序排列,区块内容内容性质可以根据区块的属性分析确定。
(4)对图片格式和尺寸的转换:对页面中的图片进行的相应转换主要有三个方面:一是格式转换,可以依据现有技术,使之能够被手机等客户终端显示;二是缩放,主要是缩小,使图片的大小适合于客户移动终端的屏幕显示;三是过滤,自动判断图片的重要性,对于不重要的图片不予显示,或者留白由用户自己决定是否显示。图片的重要性可以根据图片的url、alt、以及尺寸等进行判定。比如,在黑名单中的图片不予显示,长宽比失调的图片也不显示等。
(5)无用和/或次要信息在页面中的折叠隐藏:在互联网网站页面中,有些区块在手机上很占用屏幕空间,但又没有多少用处,在转换过程中可以将这些无用和/或次要信息的区块进行折叠隐藏,并通过超链接标识建立以折叠隐藏的区块为目标的超链接,所述超链接的标识可以采用原区块缩略文,并可以在原区块缩略文的两端加上“+++”、“++”或“+”等适宜形式的折叠符号,因此,折叠隐藏后在原区块的位置就出现一个“+++原区块缩略文+++”或其它适宜形式的超链接,所述区块缩略文可以根据实际需要和便利的方式进行确定,例如采用该区块正文的前两个文字和第一个名词等等。用户点击此超链,则相应区块被展开而不再被折叠,用户可以见到被折叠的内容。而未折叠的内容对于用户来说是一目了然,由此也达到了主要内容直达的效果。
应注意下列几个事项:
(1)HTTP头信息中包含页面格式信息,但会有错误的情况出现,在此情况下可根据页面内容进行智能判定,一般可以由转换引擎自动判定出各种超文本格式、纯文本和图片等。
(2)对于文本和超文本,字符编码类型在HTTP头中也有声明,但也会有错误情况出现,在此情况下可根据页面内容智能判定编码类型,常见的编码有UTF8和GB2312等。
(3)在现有技术下,转换引擎可以自动将原HTML格式的页面转换为适于手机浏览的WML和XHTML格式的小页面,在此过程中应进行分页处理、超链接变换以及图片变换等。
(4)图片转换是一个必要的方面,应将大图片转换为适应手机屏幕大小的小图片,并且在转换过程中还应将图片格式变换为手机可识别的格式。
(5)还可在页面中设置或插入音频和视频等的多媒体转换功能。

Claims (10)

1.一种将WWW网页转换为WAP网页的方法,其特征在于包括下列步骤:
步骤A,接收客户端访问某一URL的请求,根据URL进行对网页是否是WWW网页进行初步判断;
步骤B,获取页面内容;
步骤C,对可能不是WWW网页的网页做进一步的判断,确定其是否是WWW网页;
步骤D,对WWW网页进行页面转换,首先确定显示宽度,然后将页面的各区块从上到下重新排序,将页面内容的格式转换为适于手机浏览的格式,并缩小超过设定大小的图片;
步骤D,将转换后的页面返回给客户端。
2.如权利要求1所述的将WWW网页转换为WAP网页的方法,其特征在于所述步骤D中对显示宽度的确定方式为:通过预设显示宽度的方式确定显示宽度,或者通过解析客户端UA的方式获得客户端的显示器参数,依据客户端显示器的实际情况设定适宜的显示宽度。
3.如权利要求2所述的将WWW网页转换为WAP网页的方法,其特征在于根据显示宽度的要求将段落折行。
4.如权利要求1所述的将WWW网页转换为WAP网页的方法,其特征在于所述步骤A中的初步判断方式是:如果HTTP请求中的域名以wap.***、m.***、3g.***关键字开头,则判定是WAP网页,不是WWW网页。
5.如权利要求4所述的将WWW网页转换为WAP网页的方法,其特征在于所述步骤C中的进一步判断:分析页面的HTTP HEAD中的Content-Type值,这个值描述了当前页面的格式,如果是″text/vnd.wap.wml″或者是″application/vnd.wap.wmlc″,则分析其中是否包含关键字″wap″或″wml″,若包含这两个关键字中的任意一个,则认为是WAP页面,否则需要进一步对页面文本内容的格式分析,wap格式网页会以″<?xml″标签开头,并且XML根节点为″<wml>″,满足这两个条件的就认为是wap网页,否则就是WWW网页。
6.如权利要求1所述的将WWW网页转换为WAP网页的方法,其特征在于所述区块重排的方式是以原来页面区块从左到右的顺序确定重新排列的顺序。
7.如权利要求1所述的将WWW网页转换为WAP网页的方法,其特征在于所述区块重排的方式是根据区块的内容或属性依据预设的优先次序顺序排列定。
8.如权利要求1所述的将WWW网页转换为WAP网页的方法,其特征在于在图片转换中,自动判断图片的重要性,对于不重要的图片不予显示,或者留自由用户自己决定是否显示。
9.如权利要求1、2、3、4、5、6、7或8所述的将WWW网页转换为WAP网页的方法,其特征在于将无用和/或次要信息在页面中的折叠隐藏。
10.如权利要求9所述的将WWW网页转换为WAP网页的方法,其特征在于将无用和/或次要信息的区块进行折叠隐藏,并通过超链接标识建立以折叠隐藏的区块为目标的超链接,所述超链接的标识采用原区块缩略文,并在原区块缩略文的两端加上折叠符号,用户点击此超链,则相应区块被展开而不再被折叠。
CN200910076764A 2009-01-19 2009-01-19 Www转换技术 Pending CN101526953A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910076764A CN101526953A (zh) 2009-01-19 2009-01-19 Www转换技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910076764A CN101526953A (zh) 2009-01-19 2009-01-19 Www转换技术

Publications (1)

Publication Number Publication Date
CN101526953A true CN101526953A (zh) 2009-09-09

Family

ID=41094819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910076764A Pending CN101526953A (zh) 2009-01-19 2009-01-19 Www转换技术

Country Status (1)

Country Link
CN (1) CN101526953A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184265A (zh) * 2011-06-17 2011-09-14 上海高清数字科技产业有限公司 电子报纸数据转换方法
CN102184249A (zh) * 2011-05-23 2011-09-14 广州市动景计算机科技有限公司 基于移动终端的网页排版方法和装置
CN102306185A (zh) * 2011-08-30 2012-01-04 百度在线网络技术(北京)有限公司 一种用于识别wap网页的方法、装置和设备
CN102368263A (zh) * 2011-10-17 2012-03-07 苏州阔地网络科技有限公司 一种文件格式转换的方法及装置
WO2012122932A1 (zh) * 2011-03-14 2012-09-20 北京小米科技有限责任公司 一种网页重排版的方法和系统
CN103136259A (zh) * 2011-11-30 2013-06-05 百度在线网络技术(北京)有限公司 一种基于内容块标识处理网页内容的方法与设备
CN103207877A (zh) * 2012-01-17 2013-07-17 阿里巴巴集团控股有限公司 解码方法及装置
CN103383695A (zh) * 2013-06-24 2013-11-06 百度在线网络技术(北京)有限公司 一种用于识别wap页面的方法与设备
CN103543919A (zh) * 2012-07-09 2014-01-29 腾讯科技(深圳)有限公司 一种网页内容展示切换方法及装置
CN103678347A (zh) * 2012-09-07 2014-03-26 百度在线网络技术(北京)有限公司 用于将web站点转换为目标web app站点的方法和装置
CN104020935A (zh) * 2013-02-28 2014-09-03 国际商业机器公司 用于控制显示屏上的显示对象的方法和装置
CN104111950A (zh) * 2013-04-19 2014-10-22 腾讯科技(深圳)有限公司 网页图片加载方法及加载装置
CN104182398A (zh) * 2013-05-21 2014-12-03 北大方正集团有限公司 服务器和信息浏览方法
CN104182424A (zh) * 2013-05-28 2014-12-03 中国电信股份有限公司 适用于移动终端的网页处理方法和服务器
CN104899212A (zh) * 2014-03-05 2015-09-09 腾讯科技(深圳)有限公司 网页展示方法、服务器及系统
CN103761315B (zh) * 2014-01-27 2018-07-27 乐视网信息技术(北京)股份有限公司 一种显示网页内容的方法及系统
CN110263279A (zh) * 2019-05-08 2019-09-20 北京字节跳动网络技术有限公司 页面生成方法、装置、电子设备和计算机可读存储介质
CN111221992A (zh) * 2019-12-31 2020-06-02 五八有限公司 一种无用图片的确定方法、装置、电子设备及存储介质

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101485949B1 (ko) 2011-03-14 2015-01-23 베이징 샤오미 테크놀로지 컴퍼니 리미티드 웹페이지 재배치 방법과 시스템
WO2012122932A1 (zh) * 2011-03-14 2012-09-20 北京小米科技有限责任公司 一种网页重排版的方法和系统
CN102184249A (zh) * 2011-05-23 2011-09-14 广州市动景计算机科技有限公司 基于移动终端的网页排版方法和装置
CN102184249B (zh) * 2011-05-23 2016-01-06 广州市动景计算机科技有限公司 基于移动终端的网页排版方法和装置
CN102184265A (zh) * 2011-06-17 2011-09-14 上海高清数字科技产业有限公司 电子报纸数据转换方法
CN102306185A (zh) * 2011-08-30 2012-01-04 百度在线网络技术(北京)有限公司 一种用于识别wap网页的方法、装置和设备
CN102368263A (zh) * 2011-10-17 2012-03-07 苏州阔地网络科技有限公司 一种文件格式转换的方法及装置
CN102368263B (zh) * 2011-10-17 2013-03-06 苏州阔地网络科技有限公司 一种文件格式转换的方法及装置
CN103136259A (zh) * 2011-11-30 2013-06-05 百度在线网络技术(北京)有限公司 一种基于内容块标识处理网页内容的方法与设备
CN103136259B (zh) * 2011-11-30 2018-03-23 百度在线网络技术(北京)有限公司 一种基于内容块标识处理网页内容的方法与设备
CN103207877A (zh) * 2012-01-17 2013-07-17 阿里巴巴集团控股有限公司 解码方法及装置
CN103543919A (zh) * 2012-07-09 2014-01-29 腾讯科技(深圳)有限公司 一种网页内容展示切换方法及装置
CN103543919B (zh) * 2012-07-09 2016-01-06 腾讯科技(深圳)有限公司 一种网页内容展示切换方法及装置
CN103678347B (zh) * 2012-09-07 2018-05-04 百度在线网络技术(北京)有限公司 用于将web站点转换为目标web app站点的方法和装置
CN103678347A (zh) * 2012-09-07 2014-03-26 百度在线网络技术(北京)有限公司 用于将web站点转换为目标web app站点的方法和装置
US10585581B2 (en) 2013-02-28 2020-03-10 International Business Machines Corporation Controlling display object on display screen
US10346032B2 (en) 2013-02-28 2019-07-09 International Business Machines Corporation Controlling display object on display screen
CN104020935A (zh) * 2013-02-28 2014-09-03 国际商业机器公司 用于控制显示屏上的显示对象的方法和装置
US9823835B2 (en) 2013-02-28 2017-11-21 International Business Machines Corporation Controlling display object on display screen
CN104111950A (zh) * 2013-04-19 2014-10-22 腾讯科技(深圳)有限公司 网页图片加载方法及加载装置
CN104182398A (zh) * 2013-05-21 2014-12-03 北大方正集团有限公司 服务器和信息浏览方法
CN104182424B (zh) * 2013-05-28 2017-09-29 中国电信股份有限公司 适用于移动终端的网页处理方法和服务器
CN104182424A (zh) * 2013-05-28 2014-12-03 中国电信股份有限公司 适用于移动终端的网页处理方法和服务器
CN103383695A (zh) * 2013-06-24 2013-11-06 百度在线网络技术(北京)有限公司 一种用于识别wap页面的方法与设备
CN103761315B (zh) * 2014-01-27 2018-07-27 乐视网信息技术(北京)股份有限公司 一种显示网页内容的方法及系统
CN104899212A (zh) * 2014-03-05 2015-09-09 腾讯科技(深圳)有限公司 网页展示方法、服务器及系统
CN110263279A (zh) * 2019-05-08 2019-09-20 北京字节跳动网络技术有限公司 页面生成方法、装置、电子设备和计算机可读存储介质
CN110263279B (zh) * 2019-05-08 2021-08-10 北京字节跳动网络技术有限公司 页面生成方法、装置、电子设备和计算机可读存储介质
CN111221992A (zh) * 2019-12-31 2020-06-02 五八有限公司 一种无用图片的确定方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN101526953A (zh) Www转换技术
US7810049B2 (en) System and method for web navigation using images
RU2522103C2 (ru) Способ и браузер для уведомления об обновлении
CN101539934B (zh) 在wap网页中插入广告的方法
EP2687997A1 (en) Method for rearranging web page
CN102647462B (zh) 应用获取、发送方法及装置
US20030046290A1 (en) Bookmark managing system and bookmark managing method
GB2347329A (en) Converting electronic documents into a format suitable for a wireless device
CN103166981B (zh) 一种无线网页转码方法及装置
CN101146128A (zh) 允许小屏幕移动终端访问和浏览www网站的方法
WO2011140784A1 (zh) 屏蔽移动终端访问无线网络信息的方法、移动终端和系统
CN106649787A (zh) 移动终端客户端中广告过滤方法及装置
CN103389972A (zh) 一种基于简易信息聚合获取正文的方法及装置
CN101539933B (zh) 智能型内容直达技术
CN108021662A (zh) 一种移动终端的网页图片显示方法
WO2008132706A1 (en) A web browsing method and system
JP2007128367A (ja) 情報検索ノウハウ管理システム
CN105468753A (zh) 多编码格式数据显示系统及方法
JP4503464B2 (ja) コンテンツ中継サーバ、コンテンツ配信システム及びコンテンツ中継方法
CN101526954B (zh) 页面转换中的手工页面优化方法
KR100577084B1 (ko) 단말기의 웹 페이지 표시 방법 및 장치
CN107958063A (zh) 一种网页图片的显示方法
US20090150759A1 (en) Method and apparatus for browsing content-based documents
CN102663137B (zh) 一种应用于移动终端中显示网页的方法及系统
KR101054830B1 (ko) 다양한 방식의 피드 사용을 지원하는 피드 사용 서비스 제공자와의 연계를 위한 피드 검색 서비스 방법 및 그 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: HUAWEI TECHNOLOGY CO LTD

Free format text: FORMER OWNER: BEIJING TIAO DIGITAL CO., LTD.

Effective date: 20110128

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100085 ROOM 503, BUILDING 1, NO.1, XINXI ROAD, SHANGDI, HAIDIAN DISTRICT, BEIJING TO: 518129 HUAWEI HEADQUARTERS OFFICE BUILDING, BANTIAN, LONGGANG DISTRICT, SHENZHEN CITY, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20110128

Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Applicant after: Huawei Technologies Co., Ltd.

Address before: 100085, room 1, building 1, No. 503 information road, Beijing, Haidian District

Applicant before: Beijing Tiao Digital Co., Ltd.

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20090909