CN102314499A - 一种用于处理网页内容的方法与设备 - Google Patents

一种用于处理网页内容的方法与设备 Download PDF

Info

Publication number
CN102314499A
CN102314499A CN201110249379A CN201110249379A CN102314499A CN 102314499 A CN102314499 A CN 102314499A CN 201110249379 A CN201110249379 A CN 201110249379A CN 201110249379 A CN201110249379 A CN 201110249379A CN 102314499 A CN102314499 A CN 102314499A
Authority
CN
China
Prior art keywords
content blocks
language document
information
content
markup information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110249379A
Other languages
English (en)
Inventor
李伟刚
薛晶晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201110249379A priority Critical patent/CN102314499A/zh
Publication of CN102314499A publication Critical patent/CN102314499A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明的目的是提供一种用于处理网页内容的方法与设备,其中,本发明通过获取网页的页面访问请求,并根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件中各内容块相对应的标注信息,进而根据所述标注信息,对所述各内容块进行相应的处理。与现有技术相比,本发明实现快速地对页面内容进行处理;由于所述标注信息在标记语言文件中的标注方式不会对原页面的功能和展示内容有任何影响,因而在进行快速页面处理的同时,保证页面处理的准确性,提升用户使用体验。

Description

一种用于处理网页内容的方法与设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于处理网页内容的技术。
背景技术
现有技术在进行网页内容处理时,例如,将在计算机上显示的网页转换为适于在移动终端上显示的网页时,通常利用正则表达式在该网页的超文本标记语言(HTML)文件中进行匹配查询以获得特定网页内容,并根据约定的规则对该特定网页内容保留或删除,但所述方法的页面处理效率较低,处理的时间成本高,从而影响来自移动终端用户的页面访问请求的响应速度,降低用户体验。
因此,如何有效地实现快速地对页面内容进行处理,成为目前亟待解决的问题之一。
发明内容
本发明的目的是提供一种用于处理网页内容的方法与设备。
根据本发明的一个方面,提供了一种计算机实现的用于处理网页内容的方法,该方法包括以下步骤:
a获取网页的页面访问请求;
b根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件中各内容块相对应的标注信息;
c根据所述标注信息,对所述各内容块进行相应的处理。
根据本发明的另一方面,还提供了一种用于处理网页内容的设备,该设备包括:
请求获取装置,用于获取网页的页面访问请求;
文件获取装置,用于根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息;
内容块处理装置,用于根据所述标注信息,对所述各内容块进行相应的处理。
与现有技术相比,本发明根据所获取网页的标记语言文件,如HTML文件,的各内容块相对应的标注信息,对各内容块进行相应的折叠、删除、格式化等处理,从而实现快速地对页面内容进行处理;由于所述标注信息在标记语言文件中的标注方式不会对原页面的功能和展示内容有任何影响,因而在进行快速页面处理的同时,保证页面处理的准确性,提升用户使用体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面用于处理网页内容的设备示意图;
图2示出根据本发明的获取标记语言文本的示例图;
图3示出根据本发明一个优选实施例的用于处理网页内容的设备示意图;
图4示出根据本发明另一个方面用于处理网页内容的方法流程图;
图5示出根据本发明一个优选实施例的用于处理网页内容的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面用于处理网页内容的设备示意图。处理设备1包括请求获取装置11、文件获取装置12和内容块处理装置13。在此,处理设备1可为网络设备,包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云,在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;处理设备1也可为用户设备,包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。
具体地,请求获取装置11获取网页的页面访问请求。更具体地,请求获取装置11获取网页的页面访问请求,其中,所述获取方式包括但不限于以下方式:
1)从移动终端获取页面访问请求,例如,获取用户通过移动终端输入的页面访问请求;
2)从第三方设备获取页面访问请求。
在一示例中,处理设备1为移动终端,首先,用户借助移动终端的交互装置,包括但不限于键盘、鼠标、遥控器、触摸板、或手写设备,与移动终端中的浏览器软件或客户端软件进行交互,以键盘为例,用户在浏览器软件的地址栏输入框中进行输入时,移动终端的请求获取装置11实时地获取用户输入的按键序列,例如用户输入的一条统一资源定位符(URL),并记录为与该用户输入操作相对应的页面访问请求,其中,该页面访问请求中包括该URL,在此,所述移动终端意指可以在移动中使用的计算机设备,包括但不限于手机、笔记本、POS机、车载电脑等,其显示屏尺寸通常远远小于台式电脑的显示器尺寸。
在另一示例中,请求获取装置11根据第三方设备提供的应用编程接口(API),受预定条件或事件触发地、或定期地向该第三方设备发送接收页面访问请求的请求消息,并接收该第三方设备响应于该请求消息返回的一个或多个页面访问请求;或第三方设备主动向处理设备1推送页面访问请求,请求获取装置11接收该页面访问请求。
本领域技术人员应能理解上述获取页面访问请求的方式仅为举例,其他现有的或今后可能出现的获取页面访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,文件获取装置12根据所述页面访问请求,获取与所述页面访问请求中的URL所指向的网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息。具体地,文件获取装置12根据请求获取装置11获取的页面访问请求,获取与所述页面访问请求中的URL所指向的网页相对应的标记语言文件;在此,所述标记语言文件包括但不限于:
1)HTML(超文本标记语言)文件,其是用于描述网页文档的一种标准通用标记语言;
2)XML(可扩展标记语言)文件,其是一种简单的用于数据存储的标准通用标记语言;
3)XHTML(可扩展超文本标记语言)文件,其是一种基于XML的具有严格语法的标记语言;
4)XAML(可扩展应用程序标记语言)文件,其是用于构建应用程序用户界面的一种描述性标记语言。
本领域技术人员应能理解上述标记语言文件仅为举例,其他现有的或今后可能出现的标记语言文件如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
其中,所述获取标记语言文件的方式包括但不限于以下方式:
1)经由网络获取,例如,经由网络从页面访问请求中URL所指向的网页所在的网络服务器处获取;
2)在处理设备1中获取,例如,在处理设备1的本地存储器中进行查询来获取。
其中,所述标记语言文件包括与标记语言文件的各内容块相对应的标注信息;其中,所述标记语言文件的内容块意为标记语言文件中的由一个或多个标签组成的内容区域,其与网页中显示的特定内容相对应,如,标题内容块、正文内容块、导航内容块等;
在此,所述标注信息包括但不限于以下至少任一项:
1)所述标注信息所对应的内容块类型信息;其中,所述内容块类型信息包括但不限于:
a标题内容块;
b正文内容块;
c导航内容块;
d搜索框内容块;
2)所述标注信息所对应的内容块的参考处理信息;其中,所述参考处理信息包括但不限于:
a将内容块进行展示,也即,将该参考处理信息所对应的内容块中的内容全部保留并展示;
b将所述内容块进行删除,也即,将该参考处理信息所对应的内容块中的内容全部删除;
c将所述内容块进行折叠,也即,将该参考处理信息所对应的内容块中的内容保留,但并不直接展示,而是通过Javascript、CSS等页面技术,以折叠隐藏内容块中的内容,当用户点击内容展开标记如“+”时,折叠隐藏内容块中的内容可进行展示,当用户点击内容折叠标记如“-”时,折叠隐藏内容块中的内容可进行折叠隐藏。
本领域技术人员应能理解上述内容块类型信息仅为举例,其他现有的或今后可能出现的内容块类型信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述参考处理信息仅为举例,其他现有的或今后可能出现的参考处理信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述标注信息仅为举例,其他现有的或今后可能出现的标注信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,所述标注信息在所述标记语言文件中的存储方式包括但不限于以下至少任一项方式:
1)所述标记语言文件中的注释;例如,利用JSON格式,标识信息可存储于HTML文件注释中,如<!--tc block_begin:{type:″CONTENT″,action:″SOW″}-->,其中,JSON格式是一种轻量级的数据交换格式,其一般采用“名称/值”对的方式表示数据,名称和值之间使用“:”隔开;
2)所述标记语言文件中的定制标签;例如,在HTML文件中,定制标签可为<tc></tc>,标识信息可存储于该定制标签中;
3)所述标记语言文件中的标签属性;例如,在HTML文件中,标识信息可存储于段落标签的属性中,如<p tc_type=“TEXT”,tc_action=“fold”>。
本领域技术人员应能理解上述存储方式仅为举例,其他现有的或今后可能出现的存储方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一示例中,首先,文件获取装置12从页面访问请求中提取该页面访问请求包含的页面URL,并向该URL所指向页面所在的网络服务器发送获取该页面的标记语言文件的请求,例如,可将其封装为一请求消息,如http请求消息,并通过相应的通信协议,如http、https通信协议,发送至该网络服务器,该网络服务器通过实时监控的方式接收并解析该请求消息,获取来自文件获取装置12的获取该标记语言文件的请求,并进行相应的处理,将处理获得的标记语言文件按照约定的通信方式发送至处理设备1,接着,处理设备1的文件获取装置12接收来自该网络服务器的标记语言文件,其中,所述标记语言文件包括与标记语言文件的各内容块相对应的标注信息。
在另一示例中,当处理设备1为移动终端时,文件获取装置12通过该移动终端的查询装置(未示出)所提供的API(应用编程接口),基于预定条件或事件,或定期地向该查询装置发送获取页面访问请求中URL所指向的页面网页的所对应的标记语言文件的请求消息,该查询装置根据该请求消息从移动终端的网页存储库中查询获取与该请求相对应的的标记语言文件,并将该标记语言文件返回至文件获取装置12;其中,所述网页存储库中包括URL及其所指向的网页,所述网页所对应的标记语言文件中包含用于处理网页内容的标注信息。
优选地,如图2所示,上述获取标记语言文件还可包括两种方式的结合,即文件获取装置12首先在移动终端中根据页面访问请求所包含的URL,通过该移动终端的查询装置提供的API(应用编程接口)在该移动终端的网页存储库中进行查询,当未查询到与该URL相对应的标记语言文件时,再向该URL所指向网页所在的网络服务器发送请求消息,以获取该网络服务器基于该请求消息反馈的与该页面URL相对应的标记语言文件。本领域技术人员应能理解上述获取标记语言文件的方式仅为举例,其他现有的或今后可能出现的获取标记语言文件的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
随后,内容块处理装置13根据所述标注信息,对所述各内容块进行相应的处理。具体地,内容块处理装置13根据文件获取装置12获取的标记语言文件中的标注信息,对该标记语言文件中对该(些)标注信息所对应的内容块进行相应的处理;其中,所述相应的处理包括但不限于:
1)对标注信息所对应的内容块中的内容进行格式化,其中,所述格式化包括但不限于:
i改变所述内容块中的文字属性,如大小、颜色,加粗等;
ii对所述内容块中包含的图片按预定比例进行缩小等;
2)对标注信息所对应的内容块进行展示;
3)对标注信息所对应的内容块进行删除;
4)对标注信息所对应的内容块进行折叠。
在此,内容块处理装置13可根据标注信息中的内容块类型信息确定对内容块的处理方式,例如:
1)当内容块类型信息标注其所对应的内容块为标题内容块时,内容块处理装置13在类型处理数据库中进行查询,以获取标题内容块的预置处理方式为将内容块中的内容进行展示;
2)当内容块类型信息标注其所对应的内容块为正文内容块时;内容块处理装置13在类型处理数据库中进行查询,以获取正文内容块的预置处理方式为将该正文内容块中的内容进行折叠隐藏;
3)当内容块类型信息标注其所对应的内容块为导航内容块时,内容块处理装置13在类型处理数据库中进行查询,以获取导航内容块的预置处理方式为将该导航内容块中的文字字体颜色设置为蓝色;
4)当内容块类型信息标注其所对应的内容块为搜索框内容块,内容块处理装置13在类型处理数据库中进行查询,以获取搜索框内容块的预置处理方式为将该搜索框内容块中的内容删除。
本领域技术人员应能理解上述相应的处理仅为举例,其他现有的或今后可能出现的相应的处理如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一示例中,当标识语言文件为HTML文件时,标注信息以注释的形式在该HTML文件中进行标记,如:
<html>
<body>
<!--tc block_begin:{type:″CONTENT″,action:″SHOW″}-->
<p>
目前主要业务包括移动搜索、移动客户端,以及相关的无线框计算、页面转码、终端适配和数据统计服务。
</p>
<!--tc block_end-->
</body>
</html>
内容块处理装置13通过对该HTML文件进行解析,在该HTML文件的注释中获得关键字“tc block_begin”,并根据该关键字获得相应的标注信息为<!--tc block_begin:{type:″CONTENT″,action:″SHOW″}-->,并对HTML文件继续进行解析直至检测到关键字“tc block_end”,确定<!--tc block_begin:{type:″CONTENT″,action:″SHOW″}-->与<!--tc block_end-->之间的内容为该标注信息所对应的内容块;
然后,内容块处理装置13解析并获取该标注信息中的内容包括:
1)该标注信息所对应的内容块类型信息为“CONTENT”,即目录内容块;
2)该标注信息所对应的内容块的参考处理信息为“SHOW”,即展示处理;
内容块处理装置13根据该内容块类型信息,在类型处理数据库中进行查询,以获取目录内容块的预置处理方式为将内容块中的文字字体设置为宋体,并结合该参考处理信息“SHOW”,将该标注信息所对应的内容块进行展示并将其中的文字字体设置为宋体,在此,所述类型处理数据库中存储各个内容块类型信息及其相应的处理方式,包括但不限于对内容块进行展示、删除或折叠等处理方式。
在另一示例中,当HTML文件中的一条标注信息为对某正文段落的标注信息,并作为该正文段落的属性存储,如<p tc_type=“TEXT”,tc_action=“fold”>,内容块处理装置13解析并获取该标注信息的内容包括为:
1)该标注信息所对应的内容块类型信息为“TEXT”,即正文内容块;
2)该标注信息所对应的内容块的参考处理信息为“fold”,即折叠处理;
内容块处理装置13根据该内容块类型信息,获取正文内容块的预置处理方式为将内容块中的正文内容折叠不予展示,并结合该参考处理信息为折叠处理,通过Javascript、CSS等页面技术,以折叠隐藏内容块中的内容。
在又一个示例中,当HTML文件中的一条标注信息为<!--tcblock_begin:{type:″PICTURE″,action:″SHOW″}-->时,内容块处理装置13解析并获取该标注信息的内容包括为:
1)该标注信息所对应的内容块类型信息为“PICTURE”,即图片内容块;
2)该标注信息所对应的内容块的参考处理信息为“SHOW”,即展示处理;
内容块处理装置13根据该内容块类型信息,获取图片内容块的预置处理方式为将内容块中的图片按预定比例进行缩小,并结合该参考处理信息“SHOW”,将该标注信息所对应的内容块中的图片按预定比例缩小并展示。
优选地,所述参考处理信息是对页面进行处理的参考依据,当标注信息中的参考处理信息与该标注信息中内容块类型信息所对应预置处理方式一致时,或该标注信息中的内容块类型信息没有对应的预置处理方式时,内容块处理装置13根据该参考处理方式执行处理;当标注信息中的参考处理信息与该标注信息中内容块类型信息所对应预置处理方式不一致时,内容块处理装置13根据该类型信息所对应预置处理方式执行处理。
在一示例中,当标识语言文件为HTML文件时,标注信息以标签属性的形式在该HTML文件中进行标记,如一个段落标签为<ptc_type=“TEXT”,tc_action=“delete”>,内容块处理装置13解析并获取该标注信息的内容包括:
1)该段落标签中的标注信息所对应的内容块类型信息为“TEXT”,即正文内容块;
2)该标注信息所对应的内容块的参考处理信息为“delete”,即删除处理;
内容块处理装置13根据该内容块类型信息,获取正文内容块的预置处理方式为将内容块中的内容折叠,则忽略参考处理信息中的删除处理,将该标注信息所对应的内容块中的内容进行折叠。
本领域技术人员应能理解上述对各内容块进行相应处理的方式仅为举例,其他现有的或今后可能出现的对各内容块进行相应处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,请求获取装置11、文件获取装置12和内容块处理装置13之间是持续不断地工作。具体地,请求获取装置11持续地获取网页的页面访问请求;接着,文件获取装置12也持续地根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息;随后,内容块处理装置13也持续地根据所述标注信息,对所述各内容块进行相应的处理。在此,本领域技术人员应理解“持续”是指各装置不断进行上述页面访问请求的获取、标记语言文件的获取及内容块的处理,直至满足预定停止条件,例如请求获取装置11在较长时间内停止对页面访问请求的获取。
图3为图1或图2所示的处理设备1中的文件获取装置12的示意图,其中,文件获取装置12包括请求发送单元121和文件接收单元122,其中,请求发送单元121将所述页面访问请求发送至相应的网络设备,文件接收单元122接收所述相应的网络设备响应于该页面访问请求反馈的所述标记语言文件。
以下参照图3来对该文件获取装置12进行详细描述。在图3所示实施例中,请求获取装置11及内容块处理装置13的功能与图1或图2所示实施例中的相同,故仅以引用方式包含于此,而不做赘述。
具体地,请求发送单元121从页面访问请求中提取该页面访问请求包含的页面URL,并向该URL所指向页面所在的网络设备,如网络服务器,发送获取该页面的标记语言文件的请求消息,例如,可将其封装为一请求消息,如http请求消息,并通过相应的通信协议,如http、https通信协议,发送至该网络服务器,该网络设备通过实时监控的方式接收并解析该请求消息,获取来自请求发送单元121的获取该标记语言文件的请求,并进行相应的处理,将处理获得的标记语言文件按照约定的通信方式发送至处理设备1,接着,处理设备1的文件接收单元122接收来自该网络服务器的该标记语言文件。在此,处理设备1与网络服务器之间可通过任何通信方式实现通信,包括但不限于,基于3GPP、LTE、WIMAX的移动通信、基于TCP/IP、UDP协议的计算机网络通信以及基于蓝牙、红外传输标准的近距无线传输方式。
本领域技术人员应能理解上述发送页面访问请求或接收标记语言文件的方式仅为举例,其他现有的或今后可能出现的发送页面访问请求和接收标记语言文件方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在另一个优选实施例中(参照图1),所述请求获取装置11获取用户通过移动终端输入的所述页面访问请求;处理设备1还包括提供装置(未示出),提供装置将经所述处理的网页提供给所述用户。
以下参照图1对该另一优选实施例进行详细描述,其中,文件获取装置12根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息;接着,内容块处理装置13根据所述标注信息,对所述各内容块进行相应的处理;其具体过程与前述参照图1所描述的实施例中文件获取装置12和内容块处理装置13所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,例如处理设备1为网络设备,用户通过移动终端中的浏览器软件或客户端软件与处理设备1进行交互,在该浏览器或客户端的地址栏输入窗口中输入时,处理设备1的请求获取装置11通过页面技术,如JSP、ASP、PHP技术,实时地获取用户输入的按键序列,即用户输入的一条URL,并记录为与该用户输入操作相对应的页面访问请求。
提供装置将经内容块处理装置13进行相应的处理后的网页,采用任何已知的移动终端提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将该网页通过移动终端提供给该用户。在一示例中,以屏幕显示为例,提供装置将内容块处理装置13获取的处理后的网页,利用约定的通信方式,按一定顺序和格式提供给所述用户设备,例如以链接、页面显示等方式提供给该移动终端,供用户进行浏览。本领域技术人员应能理解上述提供处理后的网页的方式仅为举例,其他现有的或今后可能出现的提供处理后的网页的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在又一个优选实施例中(参照图1),处理设备1还包括参数获取装置(未示出),参数获取装置获取所述移动终端的显示参数信息;所述内容块处理装置13根据所述标注信息,结合所述显示参数信息,对所述各内容块进行相应的处理。
以下参照图1对该又一优选实施例进行详细描述,其中,请求获取装置11获取网页的页面访问请求;文件获取装置12根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息;其具体过程与前述参照图1所描述的实施例中请求获取装置11和文件获取装置12所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,参数获取装置按照约定的方式通过调用移动终端提供的API(应用编程接口),获取该移动终端的显示参数信息,在此,所述显示参数信息包括但不限于:
1)移动终端支持的图片格式,如JPEG、PNG、GIF格式等;
2)移动终端的分辨率;
3)移动终端支持的浏览器插件,如FLASH插件等。
在一示例中,当文件获取装置12获取的标记语言文件中的标注信息中内容块类型信息为FLASH动画内容块,且该动画内容块没有预置处理方式,同时参考处理信息示出的处理方式为将内容块中的动画删除,但参数获取装置获取的显示参数信息示出该移动终端支持FLASH插件运行,则内容块处理装置13对该内容块进行相应处理时保留该FLASH动画。
本领域技术人员应能理解上述显示参数信息、对各内容块进行相应的处理的方式仅为举例,其他现有的或今后可能出现的显示参数信息、对各内容块进行相应的处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图4示出根据本发明一个方面用于处理网页内容的方法流程图。处理设备1可为网络设备,包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云,在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;处理设备1也可为用户设备,包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。
具体地,在步骤S1中,处理设备1获取网页的页面访问请求。更具体地,在步骤S1中,处理设备1获取网页的页面访问请求,其中,所述获取方式包括但不限于以下方式:
1)从移动终端获取页面访问请求,例如,获取用户通过移动终端输入的页面访问请求;
2)从第三方设备获取页面访问请求。
在一示例中,处理设备1为移动终端,首先,用户借助与移动终端的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板、或手写设备,与移动终端中的浏览器软件或客户端软件进行交互,以键盘为例,用户在浏览器软件的地址栏输入框中进行输入时,在步骤S1中,移动终端实时地获取用户输入的按键序列,例如用户输入的一条统一资源定位符(URL),并记录为与该用户输入操作相对应的页面访问请求,其中,该页面访问请求中包括该URL,在此,所述移动终端意指可以在移动中使用的计算机设备,包括但不限于手机、笔记本、POS机、车载电脑等,其显示屏尺寸通常远远小于台式电脑的显示器尺寸。
在另一示例中,在步骤S1中,处理设备1根据第三方设备提供的应用编程接口(API),受预定条件或事件触发地、或定期地向该第三方设备发送接收页面访问请求的请求消息,并接收该第三方设备响应于该请求消息返回的一个或多个页面访问请求;或第三方设备主动向处理设备1推送页面访问请求,处理设备1接收该页面访问请求。
本领域技术人员应能理解上述获取页面访问请求的方式仅为举例,其他现有的或今后可能出现的获取页面访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S2中,处理设备1根据所述页面访问请求,获取与所述页面访问请求中的URL所指向的网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息。具体地,在步骤S2中,处理设备1根据其在步骤S1中获取的页面访问请求,获取与所述页面访问请中的URL所指向的网页相对应的标记语言文件;在此,所述标记语言文件包括但不限于:
1)HTML(超文本标记语言)文件,其是用于描述网页文档的一种标准通用标记语言;
2)XML(可扩展标记语言)文件,其是一种简单的用于数据存储的标准通用标记语言;
3)XHTML(可扩展超文本标记语言)文件,其是一种基于XML的具有严格语法的标记语言;
4)XAML(可扩展应用程序标记语言)文件,其是用于构建应用程序用户界面的一种描述性标记语言。
本领域技术人员应能理解上述标记语言文件仅为举例,其他现有的或今后可能出现的标记语言文件如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
其中,所述获取标记语言文件的方式包括但不限于以下方式:
1)经由网络获取,例如,经由网络从页面访问请求中URL所指向的网页所在的网络服务器处获取;
2)在处理设备1中获取,例如,在处理设备1的本地存储器中进行查询来获取。
其中,所述标记语言文件包括与标记语言文件的各内容块相对应的标注信息;其中,所述标记语言文件的内容块意为标记语言文件中的由一个或多个标签组成的内容区域,其与网页中显示的特定内容相对应,如,标题内容块、正文内容块、导航内容块等;
在此,所述标注信息包括但不限于以下至少任一项:
1)所述标注信息所对应的内容块类型信息;其中,所述内容块类型信息包括但不限于:
a标题内容块;
b正文内容块;
c导航内容块;
d搜索框内容块;
2)所述标注信息所对应的内容块的参考处理信息;其中,所述参考处理信息包括但不限于:
a将内容块进行展示,也即,将该参考处理信息所对应的内容块中的内容全部保留并展示;
b将所述内容块进行删除,也即,将该参考处理信息所对应的内容块中的内容全部删除;
c将所述内容块进行折叠,也即,将该参考处理信息所对应的内容块中的内容保留,但并不直接展示,而是通过Javascript、CSS等页面技术,以折叠隐藏内容块中的内容,当用户点击内容展开标记如“+”时,折叠隐藏内容块中的内容可进行展示,当用户点击内容折叠标记如“-”时,折叠隐藏内容块中的内容可进行折叠隐藏。
本领域技术人员应能理解上述内容块类型信息仅为举例,其他现有的或今后可能出现的内容块类型信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述参考处理信息仅为举例,其他现有的或今后可能出现的参考处理信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述标注信息仅为举例,其他现有的或今后可能出现的标注信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,所述标注信息在所述标记语言文件中的存储方式包括但不限于以下至少任一项方式:
1)所述标记语言文件中的注释;例如,利用JSON格式,标识信息可存储于HTML文件注释中,如<!--tc block_begin:{type:″CONTENT″,action:″SHOW″}-->,其中,JSON格式是一种轻量级的数据交换格式,其一般采用“名称/值”对的方式表示数据,名称和值之间使用“:”隔开;
2)所述标记语言文件中的定制标签;例如,在HTML文件中,定制标签可为<tc></tc>,标识信息可存储于该定制标签中;
3)所述标记语言文件中的标签属性;例如,在HTML文件中,标识信息可存储于段落标签的属性中,如<p tc_type=“TEXT”,tc_action=“fold”>。
本领域技术人员应能理解上述存储方式仅为举例,其他现有的或今后可能出现的存储方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一示例中,首先,在步骤S2中,处理设备1从页面访问请求中提取该页面访问请求包含的页面URL,并向该URL所指向页面所在的网络服务器发送获取该页面的标记语言文件的请求,例如,可将其封装为一请求消息,如http请求消息,并通过相应的通信协议,如http、https通信协议,发送至该网络服务器,该网络服务器通过实时监控的方式接收并解析该请求消息,获取来自处理设备1的获取该标记语言文件的请求,并进行相应的处理,将处理获得的标记语言文件按照约定的通信方式发送至处理设备1,接着,处理设备1接收来自该网络服务器的标记语言文件,其中,所述标记语言文件包括与标记语言文件的各内容块相对应的标注信息。
在另一示例中,当处理设备1为移动终端时,在步骤S2中,移动终端通过该移动终端所提供的API(应用编程接口),基于预定条件或事件,或定期地向该移动终端发送获取页面访问请求中URL所指向的页面网页的所对应的标记语言文件的请求消息,该移动终端根据该请求消息从移动终端的网页存储库中查询获取与该请求相对应的的标记语言文件,并将该标记语言文件返回至移动终端;其中,所述网页存储库中包括URL及其所指向的网页,所述网页所对应的标记语言文件中包含用于处理网页内容的标注信息。
优选地,上述获取标记语言文件还可包括两种方式的结合,即在步骤S2中,移动终端首先根据页面访问请求所包含的URL,通过该移动终端提供的API(应用编程接口)在该移动终端的网页存储库中进行查询,当未查询到与该URL相对应的标记语言文件时,再向该URL所指向网页所在的网络服务器发送请求消息,以获取该网络服务器基于该请求消息反馈的与该页面URL相对应的标记语言文件。本领域技术人员应能理解上述获取标记语言文件的方式仅为举例,其他现有的或今后可能出现的获取标记语言文件的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
随后,在步骤S3中,处理设备1根据所述标注信息,对所述各内容块进行相应的处理。具体地,在步骤S3中,处理设备1根据其在步骤S2中获取的标记语言文件中的标注信息,对该标记语言文件中对该(些)标注信息所对应的内容块进行相应的处理;其中,所述相应的处理包括但不限于:
1)对标注信息所对应的内容块中的内容进行格式化,其中,所述格式化包括但不限于:
i改变所述内容块中的文字属性,如大小、颜色,加粗等;
ii对所述内容块中包含的图片按预定比例进行缩小等;
2)对标注信息所对应的内容块进行展示;
3)对标注信息所对应的内容块进行删除;
4)对标注信息所对应的内容块进行折叠。
在此,在步骤S3中,处理设备1可根据标注信息中的内容块类型信息确定对内容块的处理方式,例如:
1)当内容块类型信息标注其所对应的内容块为标题内容块时,在步骤S3中,处理设备1在类型处理数据库中进行查询,以获取标题内容块的预置处理方式为将内容块中的内容进行展示;
2)当内容块类型信息标注其所对应的内容块为正文内容块时;在步骤S3中,处理设备1在类型处理数据库中进行查询,以获取正文内容块的预置处理方式为将该正文内容块中的内容进行折叠隐藏;
3)当内容块类型信息标注其所对应的内容块为导航内容块时,在步骤S3中,处理设备1在类型处理数据库中进行查询,以获取导航内容块的预置处理方式为将该导航内容块中的文字字体颜色设置为蓝色;
4)当内容块类型信息标注其所对应的内容块为搜索框内容块,在步骤S3中,处理设备1在类型处理数据库中进行查询,以获取搜索框内容块的预置处理方式为将该搜索框内容块中的内容删除。
本领域技术人员应能理解上述相应的处理仅为举例,其他现有的或今后可能出现的相应的处理如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一示例中,当标识语言文件为HTML文件时,标注信息以注释的形式在该HTML文件中进行标记,如:
<html>
<body>
<!--tc block_begin:{type:″CONTENT″,action:″SHOW″}-->
<p>
目前主要业务包括移动搜索、移动客户端,以及相关的无线框计算、页面转码、终端适配和数据统计服务。
</p>
<!--tc block_end-->
</body>
</html>
在步骤S3中,处理设备1通过对该HTML文件进行解析,在该HTML文件的注释中获得关键字“tc block_begin”,并根据该关键字获得相应的标注信息为<!--tc block_begin:{type:″CONTENT″,action:″SHOW″}-->,并对HTML文件继续进行解析直至检测到关键字“tcblock_end”,确定<!--tc block_begin:{type:″CONTENT″,action:″SHOW″}-->与<!--tc block_end-->之间的内容为该标注信息所对应的内容块;
然后,处理设备1解析并获取该标注信息中的内容包括:
1)该标注信息所对应的内容块类型信息为“CONTENT”,即目录内容块;
2)该标注信息所对应的内容块的参考处理信息为“SHOW”,即展示处理;
处理设备1根据该内容块类型信息,在类型处理数据库中进行查询,以获取目录内容块的预置处理方式为将内容块中的文字字体设置为宋体,并结合该参考处理信息“SHOW”,将该标注信息所对应的内容块进行展示并将其中的文字字体设置为宋体,在此,所述类型处理数据库中存储各个内容块类型信息及其相应的处理方式,包括但不限于对内容块进行展示、删除或折叠等处理方式。
在另一示例中,当HTML文件中的一条标注信息为对某正文段落的标注信息,并作为该正文段落的属性存储,如<p tc_type=“TEXT”,tc_action=“fold”>,在步骤S3中,处理设备1解析并获取该标注信息的内容包括为:
1)该标注信息所对应的内容块类型信息为“TEXT”,即正文内容块;
2)该标注信息所对应的内容块的参考处理信息为“fold”,即折叠处理;
处理设备1根据该内容块类型信息,获取正文内容块的预置处理方式为将内容块中的正文内容折叠不予展示,并结合该参考处理信息为折叠处理,通过Javascript、CSS等页面技术,以折叠隐藏内容块中的内容。
在又一个示例中,当HTML文件中的一条标注信息为<!--tcblock_begin:{type:″PICTURE″,action:″SHOW″}-->时,在步骤S3中,处理设备1解析并获取该标注信息的内容包括为:
1)该标注信息所对应的内容块类型信息为“PICTURE”,即图片内容块;
2)该标注信息所对应的内容块的参考处理信息为“SHOW”,即展示处理;
处理设备1根据该内容块类型信息,获取图片内容块的预置处理方式为将内容块中的图片按预定比例进行缩小,并结合该参考处理信息“SHOW”,将该标注信息所对应的内容块中的图片按预定比例缩小并展示。
优选地,所述参考处理信息是对页面进行处理的参考依据,当标注信息中的参考处理信息与该标注信息中内容块类型信息所对应预置处理方式一致时,或该标注信息中的内容块类型信息没有对应的预置处理方式时,在步骤S3中,处理设备1根据该参考处理方式执行处理;当标注信息中的参考处理信息与该标注信息中内容块类型信息所对应预置处理方式不一致时,在步骤S3中,处理设备1根据该类型信息所对应预置处理方式执行处理。
在一示例中,当标识语言文件为HTML文件时,标注信息以标签属性的形式在该HTML文件中进行标记,如一个段落标签为<ptc_type=“TEXT”,tc_action=“delete”>,在步骤S3中,处理设备1解析并获取该标注信息的内容包括:
1)该段落标签中的标注信息所对应的内容块类型信息为“TEXT”,即正文内容块;
2)该标注信息所对应的内容块的参考处理信息为“delete”,即删除处理;
处理设备1根据该内容块类型信息,获取正文内容块的预置处理方式为将内容块中的内容折叠,则忽略参考处理信息中的删除处理,将该标注信息所对应的内容块中的内容进行折叠。
本领域技术人员应能理解上述对各内容块进行相应处理的方式仅为举例,其他现有的或今后可能出现的对各内容块进行相应处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,处理设备1在步骤S1、步骤S2和步骤S3中是持续不断地工作。具体地,在步骤S1中,处理设备1持续地获取网页的页面访问请求;接着,在步骤S2中,处理设备1也持续地根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息;随后,在步骤S3中,处理设备1也持续地根据所述标注信息,对所述各内容块进行相应的处理。在此,本领域技术人员应理解“持续”是指处理设备1在各步骤中不断进行上述页面访问请求的获取、标记语言文件的获取及内容块的处理,直至满足预定停止条件,例如处理设备1在较长时间内停止对页面访问请求的获取。
图5示出根据本发明一个优选实施例的用于处理网页内容的方法流程图,在步骤S21中,处理设备1将所述页面访问请求发送至相应的网络设备,在步骤S22中,处理设备1接收所述相应的网络设备响应于该页面访问请求反馈的所述标记语言文件。
以下参照图5来对该过程进行详细描述。在图5所示实施例中,处理设备1在步骤S1和步骤S3中的执行过程与图4所示实施例中的相同,故仅以引用方式包含于此,而不做赘述。
具体地,在步骤S21中,处理设备1从页面访问请求中提取该页面访问请求包含的页面URL,并向该URL所指向页面所在的网络设备,如网络服务器,发送获取该页面的标记语言文件的请求消息,例如,可将其封装为一请求消息,如http请求消息,并通过相应的通信协议,如http、https通信协议,发送至该网络服务器,该网络设备通过实时监控的方式接收并解析该请求消息,获取来自处理设备1的获取该标记语言文件的请求,并进行相应的处理,将处理获得的标记语言文件按照约定的通信方式发送至处理设备1,接着,在步骤S22中,处理设备1接收来自该网络服务器的该标记语言文件。在此,处理设备1与网络服务器之间可通过任何通信方式实现通信,包括但不限于,基于3GPP、LTE、WIMAX的移动通信、基于TCP/IP、UDP协议的计算机网络通信以及基于蓝牙、红外传输标准的近距无线传输方式。
本领域技术人员应能理解上述发送页面访问请求或接收标记语言文件的方式仅为举例,其他现有的或今后可能出现的发送页面访问请求和接收标记语言文件方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在另一个优选实施例中(参照图4),该执行过程还包括步骤S4(未示出),其中,在步骤S1中,处理设备1获取用户通过移动终端输入的所述页面访问请求;在步骤S4中,处理设备1将经所述处理的网页提供给所述用户。
以下参照图4对该另一优选实施例进行详细描述,其中,在步骤S2中,处理设备1根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息;接着,在步骤S3中,处理设备1根据所述标注信息,对所述各内容块进行相应的处理;其具体过程与前述参照图4所描述的实施例中处理设备1在步骤S2中和步骤S3中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,例如处理设备1为网络设备,用户通过移动终端中的浏览器软件或客户端软件与处理设备1进行交互,在该浏览器或客户端的地址栏输入窗口中输入时,在步骤S 1中,处理设备1通过页面技术,如JSP、ASP、PHP技术,实时地获取用户输入的按键序列,即用户输入的一条URL,并记录为与该用户输入操作相对应的页面访问请求。
在步骤S4中,处理设备1将经其在步骤S3中进行相应的处理后的网页,采用任何已知的移动终端提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将该网页通过移动终端提供给该用户。在一示例中,以屏幕显示为例,在步骤S4中,处理设备1将其在步骤S3中获取的处理后的网页,利用约定的通信方式,按一定顺序和格式提供给所述用户设备,例如以链接、页面显示等方式提供给该移动终端,供用户进行浏览。本领域技术人员应能理解上述提供处理后的网页的方式仅为举例,其他现有的或今后可能出现的提供处理后的网页的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在又一个优选实施例中(参照图4),该过程还包括步骤S5(未示出),其中,在步骤S5中,处理设备1获取所述移动终端的显示参数信息;在步骤S3中,处理设备1根据所述标注信息,结合所述显示参数信息,对所述各内容块进行相应的处理。
以下参照图4对该又一优选实施例进行详细描述,其中,在步骤S1中,处理设备1获取网页的页面访问请求;在步骤S2中,处理设备1根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息;其具体过程与前述参照图4所描述的实施例中处理设备1在步骤S1和步骤S2中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,在步骤S5中,处理设备1按照约定的方式通过调用移动终端提供的API(应用编程接口),获取该移动终端的显示参数信息,在此,所述显示参数信息包括但不限于:
1)移动终端支持的图片格式,如JPEG、PNG、GIF格式等;
2)移动终端的分辨率;
3)移动终端支持的浏览器插件,如FLASH插件等。
在一示例中,当处理设备1在步骤S2中获取的标记语言文件中的标注信息中内容块类型信息为FLASH动画内容块,且该动画内容块没有预置处理方式,同时参考处理信息示出的处理方式为将内容块中的动画删除,但在步骤S5中,处理设备1获得的显示参数信息示出该移动终端支持FLASH插件运行,则在步骤S3中,处理设备1对该内容块进行相应处理时保留该FLASH动画。
本领域技术人员应能理解上述显示参数信息、对各内容块进行相应的处理的方式仅为举例,其他现有的或今后可能出现的显示参数信息、对各内容块进行相应的处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (20)

1.一种计算机实现的用于处理网页内容的方法,该方法包括以下步骤:
a获取网页的页面访问请求;
b根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件中各内容块相对应的标注信息;
c根据所述标注信息,对所述各内容块进行相应的处理。
2.根据权利要求1所述的方法,其中,所述步骤b包括:
-将所述页面访问请求发送至相应的网络设备;
-接收所述相应的网络设备响应于该页面访问请求反馈的所述标记语言文件。
3.根据权利要求1或2所述的方法,其中,所述步骤c中的所述处理包括以下至少任一项:
-对所述标注信息所对应的内容块中的内容进行格式化;
-对所述标注信息所对应的内容块进行展示;
-对所述标注信息所对应的内容块进行删除;
-对所述标注信息所对应的内容块进行折叠。
4.根据权利要求1至3中任一项所述的方法,其中,所述标注信息包括以下至少任一项:
-所述标注信息所对应的内容块的类型信息;
-所述标注信息所对应的内容块的参考处理信息。
5.根据权利要求4所述的方法,其中,所述类型信息包括以下至少任一项:
-标题内容块;
-正文内容块;
-导航内容块;
-搜索框内容块。
6.根据权利要求4或5所述的方法,其中,所述参考处理信息包括以下至少任一项:
-将所述内容块进行展示;
-将所述内容块进行删除;
-将所述内容块进行折叠。
7.根据权利要求1至6中任一项所述的方法,其中,所述标注信息在所述标记语言文件中的存储方式包括以下至少任一项方式:
-所述标记语言文件中的注释;
-所述标记语言文件中的定制标签;
-所述标记语言文件中的标签属性。
8.根据权利要求1至7中任一项所述的方法,其中,所述步骤a包括:
-获取用户通过移动终端输入的所述页面访问请求;
其中,该方法还包括:
-将经所述处理的网页提供给所述用户。
9.根据权利要求8所述的方法,其中,该方法还包括:
-获取所述移动终端的显示参数信息;
其中,所述步骤c包括:
-根据所述标注信息,结合所述显示参数信息,对所述各内容块进行相应的处理。
10.根据权利要求1至9中任一项所述的方法,其中,所述标记语言文件包括以下至少任一项:
-HTML文件;
-XML文件
-XHTML文件;
-XAML文件。
11.一种用于处理网页内容的设备,该设备包括:
请求获取装置,用于获取网页的页面访问请求;
文件获取装置,用于根据所述页面访问请求,获取与所述网页相对应的标记语言文件,其中,所述标记语言文件包括与所述标记语言文件的各内容块相对应的标注信息;
内容块处理装置,用于根据所述标注信息,对所述各内容块进行相应的处理。
12.根据权利要求11所述的设备,其中,所述文件获取装置包括:
请求发送单元,用于将所述页面访问请求发送至相应的网络设备;
文件接收单元,用于接收所述相应的网络设备响应于该页面访问请求反馈的所述标记语言文件。
13.根据权利要求11或12所述的设备,其中,所述处理装置执行的所述处理包括以下至少任一项:
-对所述标注信息所对应的内容块中的内容进行格式化;
-对所述标注信息所对应的内容块进行展示;
-对所述标注信息所对应的内容块进行删除;
-对所述标注信息所对应的内容块进行折叠。
14.根据权利要求11至13中任一项所述的设备,其中,所述标注信息包括以下至少任一项:
-所述标注信息所对应的内容块的类型信息;
-所述标注信息所对应的内容块的参考处理信息。
15.根据权利要求14所述的设备,其中,所述类型信息包括以下至少任一项:
-标题内容块;
-正文内容块;
-导航内容块;
-搜索框内容块。
16.根据权利要求14或15所述的设备,其中,所述参考处理信息包括以下至少任一项:
-将所述内容块进行展示;
-将所述内容块进行删除;
-将所述内容块进行折叠。
17.根据权利要求11至16中任一项所述的设备,其中,所述标注信息在所述标记语言文件中的存储方式包括以下至少任一项方式:
-所述标记语言文件中的注释;
-所述标记语言文件中的定制标签;
-所述标记语言文件中的标签属性。
18.根据权利要求11至17中任一项所述的设备,其中,所述请求获取装置用于获取用户通过移动终端输入的所述页面访问请求;
其中,该设备还包括:
提供装置,用于将经所述处理的网页提供给所述用户。
19.根据权利要求18所述的设备,其中,该设备还包括:
参数获取装置,用于获取所述移动终端的显示参数信息;其中,所述处理装置用于根据所述标注信息,结合所述显示参数信息,对所述各内容块进行相应的处理。
20.根据权利要求11至19中任一项所述的设备,其中,所述标记语言文件包括以下至少任一项:
-HTML文件;
-XML文件
-XHTML文件;
-XAML文件。
CN201110249379A 2011-08-26 2011-08-26 一种用于处理网页内容的方法与设备 Pending CN102314499A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110249379A CN102314499A (zh) 2011-08-26 2011-08-26 一种用于处理网页内容的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110249379A CN102314499A (zh) 2011-08-26 2011-08-26 一种用于处理网页内容的方法与设备

Publications (1)

Publication Number Publication Date
CN102314499A true CN102314499A (zh) 2012-01-11

Family

ID=45427664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110249379A Pending CN102314499A (zh) 2011-08-26 2011-08-26 一种用于处理网页内容的方法与设备

Country Status (1)

Country Link
CN (1) CN102314499A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880460A (zh) * 2012-08-15 2013-01-16 北京小米科技有限责任公司 一种便签内容的解析方法和装置
CN103294788A (zh) * 2013-05-20 2013-09-11 广州迅睿网络科技有限公司 一种通用网站的后台处理方法及系统
CN103546505A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 将页面分块按优先级顺序显示的方法、系统及装置
CN103631795A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种在网络设备中对网页进行转换的方法、装置和设备
CN103870101A (zh) * 2012-12-14 2014-06-18 深圳市金蝶中间件有限公司 网页内容删除方法及装置
CN104424232A (zh) * 2013-08-26 2015-03-18 阿里巴巴集团控股有限公司 一种网页标注方法和装置
CN105653669A (zh) * 2015-12-29 2016-06-08 网易(杭州)网络有限公司 超文本标记语言生成方法及装置
CN106202579A (zh) * 2016-08-26 2016-12-07 乐视控股(北京)有限公司 网页正文提取处理方法及装置、服务器、终端
CN112507664A (zh) * 2020-12-29 2021-03-16 医渡云(北京)技术有限公司 网页元素标注方法与装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1398377A (zh) * 2000-02-04 2003-02-19 美国联机股份有限公司 提供和呈现可定标web页面的系统和处理
CN1519722A (zh) * 2003-01-20 2004-08-11 鼎新电脑股份有限公司 Java网页事件处理系统及其方法
CN101197849A (zh) * 2007-12-21 2008-06-11 腾讯科技(深圳)有限公司 将互联网页面转换为无线应用协议页面的转换方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1398377A (zh) * 2000-02-04 2003-02-19 美国联机股份有限公司 提供和呈现可定标web页面的系统和处理
CN1519722A (zh) * 2003-01-20 2004-08-11 鼎新电脑股份有限公司 Java网页事件处理系统及其方法
CN101197849A (zh) * 2007-12-21 2008-06-11 腾讯科技(深圳)有限公司 将互联网页面转换为无线应用协议页面的转换方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546505A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 将页面分块按优先级顺序显示的方法、系统及装置
CN102880460A (zh) * 2012-08-15 2013-01-16 北京小米科技有限责任公司 一种便签内容的解析方法和装置
CN102880460B (zh) * 2012-08-15 2016-08-17 小米科技有限责任公司 一种便签内容的解析方法和装置
CN103631795A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种在网络设备中对网页进行转换的方法、装置和设备
CN103870101A (zh) * 2012-12-14 2014-06-18 深圳市金蝶中间件有限公司 网页内容删除方法及装置
CN103294788A (zh) * 2013-05-20 2013-09-11 广州迅睿网络科技有限公司 一种通用网站的后台处理方法及系统
CN104424232A (zh) * 2013-08-26 2015-03-18 阿里巴巴集团控股有限公司 一种网页标注方法和装置
CN104424232B (zh) * 2013-08-26 2018-10-12 阿里巴巴集团控股有限公司 一种网页标注方法和装置
CN105653669A (zh) * 2015-12-29 2016-06-08 网易(杭州)网络有限公司 超文本标记语言生成方法及装置
CN105653669B (zh) * 2015-12-29 2019-08-13 网易(杭州)网络有限公司 超文本标记语言生成方法及装置
CN106202579A (zh) * 2016-08-26 2016-12-07 乐视控股(北京)有限公司 网页正文提取处理方法及装置、服务器、终端
CN112507664A (zh) * 2020-12-29 2021-03-16 医渡云(北京)技术有限公司 网页元素标注方法与装置

Similar Documents

Publication Publication Date Title
CN102314499A (zh) 一种用于处理网页内容的方法与设备
US8403222B2 (en) Method of enabling the downloading of content
CA2687530C (en) Method and system for transcoding web pages by limiting selection through direction
US9471714B2 (en) Method for increasing the security level of a user device that is searching and browsing web pages on the internet
US10853319B2 (en) System and method for display of document comparisons on a remote device
KR20120079416A (ko) 웹 페이지의 콘텐츠 서비스 공유 방법, 장치 및 이를 제공하는 시스템
CN103139258A (zh) 一种处理移动终端的页面访问请求的方法、设备与系统
CN102123195A (zh) 在通信终端中提供书签服务的设备和方法
CN102314502A (zh) 一种用于在移动终端上显示网页主体内容的方法和设备
CN101621862A (zh) 手机浏览器快速定位有效信息的方法与装置
US8825756B2 (en) Server apparatus, information processing method, information processing program, and recording medium
JP5309121B2 (ja) 情報処理方法、プログラム、情報処理システム
CN103136259B (zh) 一种基于内容块标识处理网页内容的方法与设备
CN102314494A (zh) 一种用于处理网页内容的方法和设备
CN102760157B (zh) 一种用于生成与移动终端相对应的发布信息的方法、装置与设备
CN103577447A (zh) 一种用于确定目标页面的页面类型信息的方法和设备
CN104394121A (zh) 终端标记方法和装置
CN104268611B (zh) 网页同步方法及装置
JP2016009236A (ja) 入力支援サーバ、入力支援方法及び入力支援プログラム
CN102541836A (zh) 一种调整版式文件版面的方法及装置
CN102222095A (zh) 一种用于对待显示的页面进行转换处理的设备及其方法
CN114297544A (zh) 一种远程浏览方法、装置、设备及存储介质
CN107463536A (zh) 一种实现安卓设备上在线预览服务器上文档的方法及系统
CN105824951A (zh) 检索方法和装置
CN104714958A (zh) 一种网页转换方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120111