CN101944104A - 一种网页分块的重要度评估方法和设备 - Google Patents

一种网页分块的重要度评估方法和设备 Download PDF

Info

Publication number
CN101944104A
CN101944104A CN 201010256704 CN201010256704A CN101944104A CN 101944104 A CN101944104 A CN 101944104A CN 201010256704 CN201010256704 CN 201010256704 CN 201010256704 A CN201010256704 A CN 201010256704A CN 101944104 A CN101944104 A CN 101944104A
Authority
CN
China
Prior art keywords
piecemeal
webpage
described webpage
block
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010256704
Other languages
English (en)
Inventor
秦玄铮
刘德超
张建荣
李伟刚
薛晶晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN 201010256704 priority Critical patent/CN101944104A/zh
Publication of CN101944104A publication Critical patent/CN101944104A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种网页分块的重要度评估方法和设备。其中该方法包括以下步骤:识别网页分块所在网页的类型以及所述网页分块的类型;根据所述网页的类型、所述网页分块的类型以及所述网页分块的属性,确定所述网页分块的权重值;对所述网页内的所述网页分块的权重值进行排序。本发明的优点是,根据网页的类型、网页分块的类型以及网页分块的属性,更为准确地确定网页分块的权重值,然后根据权重值对网页分块进行展开或者折叠,使网页适合于移动终端显示,便于用户浏览。

Description

一种网页分块的重要度评估方法和设备 
技术领域
本发明涉及互联网网页技术,尤其涉及一种网页分块的重要度评估方法和设备。 
背景技术
随着科学技术的高速发展,移动终端不仅可以实现通话、收发短消息、播放多媒体等功能,还可以通过WAP(Wireless Application Protocol)协议,与互联网连接,随时随地获取网络信息,逐渐成为现代生活中重要的上网方式之一。但是,由于移动终端的处理能力通常有限,如果直接显示互联网的网页,不但无法显示完全,而且响应速度还很慢,用户体验不好。为了便于用户通过移动终端访问互联网网页,人们提出了网页分块技术,将网页分成多个网页分块,通过展开或者折叠网页分块,缩小网页,使之适合于移动终端显示。然而,现有技术仍存在如下一些缺陷: 
(1)网页分块需手动完成,费时费力,成本高昂; 
(2)网页分块不精确导致网页分块无法准确地展开或折叠,例如,一段新闻,其标题和第一段文本被折叠,而其他部分被展开; 
(3)网页分块重要度的评估不够精确导致网页分块无法准确地展开或折叠,例如,同一网页分块在不同类型的网页内都被展开,但实际上该网页分块在某些类型的网页中展开是没有意义的,所以应该对该网页分块在不同类型的网页内的重要度分别进行评估。 
为了解决上述问题,需要提供一种更为有效的网页分块的重要度评估方法。 
发明内容
本发明的目的是提供一种解决上述问题的网页分块的重要度评估方法和设备。 
根据本发明的一个方面,提供一种网页分块的重要度评估方法,该方法包括以下步骤: 
识别网页分块所在网页的类型以及所述网页分块的类型; 
根据所述网页的类型、所述网页分块的类型以及所述网页分块的属性,确定所述网页分块的权重值; 
对所述网页内的所述网页分块的权重值进行排序。 
根据本发明的另一个方面,还提供了一种网页分块的重要度评估设备,包括: 
用于识别网页分块所在网页的类型的装置; 
用于识别所述网页分块的类型的装置; 
用于根据所述网页的类型、所述网页分块的类型以及所述网页分块的属性,确定所述网页分块的权重值的装置; 
用于对所述网页内的所述网页分块的权重值进行排序的装置。 
与现有技术相比,本发明具有以下优点:根据网页的类型、网页分块的类型以及网页分块的属性,更为准确地确定网页分块的权重值,然后根据权重值对网页分块进行展开或者折叠,使网页适合于移动终端显示,便于用户浏览。 
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显: 
图1为根据本发明一个实施例的网页分块的重要度评估方法的流程图; 
图2A为根据本发明一个实施例的文本页分块后的示意图; 
图2B为根据本发明一个实施例的文本页分块后进行合并的示意图; 
图2C为图2A和图2B中的各网页分块在文本页中的预置分块权 重值信息表。 
图3为根据本发明一个实施例的减少URL数据传输的方法的流程图;以及 
图4为根据本发明一个实施例的网页分块的重要度评估设备的方框图。 
具体实施方式
下面结合附图对本发明作进一步详细描述。 
图1为根据本发明一个实施例的网页分块的重要度评估方法的流程图。如图所示,在步骤S101中,识别网页分块所在网页的类型以及所述网页分块的类型;其中,网页分块可以通过基于DOM(Document Object Model)的网页分块算法得到;所述网页的类型包括但不限于文本页、图片列表页、大图页、链接页、首页、论坛列表页、论坛帖子页、小说文本页、小说目录页;所述网页分块的类型包括但不限于交互块、链接块、索引块、文本块、版权块、导航块、栏目块、图片列表块、图片视图块、帖子块、广告块、正文块、目录块、BBS列表块、低质量块。 
在步骤S102中,根据所述网页的类型、所述网页分块的类型以及所述网页分块的属性,确定所述网页分块的权重值。其中,所述网页分块的属性包括但不限于所述网页分块在所述网页内的位置和所述网页分块的内容;所述网页内的位置通常包括五部分:页头、页脚、页左、页右以及页中;所述网页分块的内容包括但不限于纯文本字数、链接文本字数、纯图片个数、链接图片个数、文本链接个数、图片面积、表单以及外部块。根据所述网页分块所在网页的类型、所述网页分块的类型以及所述网页分块在所述网页内的位置,可以从预置的分块权重值信息表中获取到所述网页分块的分块权重值。预置的分块权重值信息表用于预先记录在某一类型的网页中,当一网页分块在网页的不同区域时,此网页分块的权重值,便于网页分块后直接获取到所述网页分块的分块权重值。比如,当一文本框在一文本页中,分别处 于页头、页脚、页左、页右、页中时的分块权重值。然后根据所述网页分块的内容确定所述网页分块的基本信息权重值。所述网页分块的权重值等于其分块权重值与基本信息权重值之和。 
在步骤S103中,对所述网页内的所述网页分块的权重值进行排序,排序的结果表明了所述网页分块在其所在网页中的重要度,并依据此重要度对所述网页分块进行展开或者折叠。 
在另一个实施例中,当网页分块粒度过细时,如果根据所述分块结果确定网页分块的展开或者折叠,有可能会导致最终网页显示出现问题,比如文本页中文本被展开而标题被折叠,所以需要对所述网页分块进行合并,使合并后的网页分块可以更为准确地展开或者折叠。首先,判断相邻的所述网页分块是否位于网页的同一区域,只有在同一区域的内的网页分块才可以进行合并,比如,相邻的所述网页分块都处于页中区域;然后判断相邻的所述网页分块的类型,将网页分块类型相同或者相似的网页分块进行合并,比如相邻的两个文本块,等等。 
在又一个实施例中,当网页分块为链接块的时候,除了其基本信息权重值和分块权重值外,所述网页分块内部的超链接的点击率也可以用来作为决定所述权重值的一个方面,使所述网页分块权重值的计算更为准确。如果所述超链接的点击率高,则对所述网页分块进行加权,反之则降权。 
在又一个实施例中,当移动终端访问网页时,检测所述移动终端的属性,如屏幕的分辨率、浏览器的类型等,然后根据移动终端的属性,提供不同的网页展现方案。比如,当检测到移动终端的屏宽在(240,320)像素之间时,会选择中屏方案,如果在此移动终端上显示大图,数目最多为7个;当检测到移动终端使用UCweb浏览器时,则会采用相应的UCweb方案。移动终端的不同属性对应不同的方案,最终的展现方案由所有属性所对应的方案共同决定。确定了网页展现方案后,根据网页分块重要度的排序,依次确定所述网页分块的展开或者折叠。对所述网页中的网页分块进行展开或者折叠后,发送所述 网页至移动终端进行显示,其中,折叠的所述网页分块可以采用一定的标识进行表示,比如,可以用“+”表示折叠的网页分块,当用户想浏览一个折叠的网页分块的内容时,可以通过操作移动终端的键盘或者利用外部设备,如触摸笔,将光标移动至代表所述折叠的网页分块的标识上,点击所述标识即可展开折叠的网页分块。当点击所述标识时,移动终端会发送访问所述折叠的网页分块的请求至用于网页分块的服务器端,获取所述折叠的网页分块的内容。优选地,当发送所述网页至移动终端进行显示时,所述折叠的网页分块的内容相应被保存至移动终端,当用户对所述折叠的网页分块进行访问时,所述折叠的网页分块的内容可以直接显示,用户无需等待。 
在又一个实施例中,当采用网页模板生成网页时,由于网页模板的结构、类型是确定的,所以在使用网页模板生成网页前就可以根据网页模板的结构特征进行分块,并计算网页分块的权重值,确定网页分块的展开或者折叠。当检测到一网页是采用所述网页模板生成时,可直接根据预先对网页模板进行分块的结果展开或者折叠所述网页上的网页分块。 
图2A为根据本发明一个实施例的文本页分块后的示意图,如图所示,所述文本页被分成了15个网页分块,分别为导航块201、链接块202、广告块203、标题块204、文章来源块205、文本块206、文本块207、图片块208、图片块209、文本块210、交互块211、链接块212、广告块213、链接块214以版权块215。其中,导航块201位于页头,链接块202和广告块203位于页左,标题块204、文章来源块205、文本块206、文本块207、图片块208、图片块209文本块210和交互块211位于页中,链接块212、广告块213和链接块214位于页右,版权块215位于页脚。 
接着,根据相关度分别对页头、页脚、页左、页右和页中的相邻的网页分块进行合并,合并结果请参考图2B,图2B为根据本发明一个实施例的文本页分块后进行合并的示意图,如图所示,页中的文本块206、文本块207、图片块208、图片块209、文本块210因为相关 度高被合并,构成正文块,表示此网页的正文部分。其他网页分块因为相关度低,所以不进行合并。 
图2C为图2A和图2B中的各网页分块在文本页中的预置分块权重值信息表,其中,表中的数字表示每种网页分块在网页内不同区域的权重值。通过表1中的预置分块权重值信息表可以查到这个文本页中每个分块的权重值,如下: 
导航块201的权重值为0、链接块202的权重值为0、广告块203的权重值为0、标题块204的权重值为20、文章来源块205的权重值为0、文本块206的权重值为20、文本块207的权重值为20、图片块208的权重值为0、图片块209的权重值为0、文本块210的权重值为20、交互块211的权重值为0、链接块212的权重值为0、广告块213的权重值为0、链接块214的权重值为0以版权块215的权重值为0。进行网页分块合并后,正文块的权重值为合并前所有网页分块的权重值之和,即正文块的权重值为文本块206、文本块207、图片块208、图片块209、文本块210在页中的权重值相加,等于60。 
图3为根据本发明一个优选实施例的减少URL(Universal Resource Locator)数据传输的方法的流程图。当用户通过移动终端对网页进行访问时,将所述网页进行分块并确定网页分块展开或折叠后,为了进一步缩小页面的大小,可以对网页内动态URL进行处理。由于同一网页内的动态URL中的大部分参数往往是相同的,所以可以将动态URL中的公共部分提取出来放入网页的公共标签内,以此减小页面的大小,但是通常情况下,网页标签内采用的URL都是静态的,所以需要对动态URL进行转化。如图所示,在步骤S301中,首先将网页内动态URL的参数以目录的形式进行静态化;接着,执行步骤S302,提取静态URL中公共的部分,放入所述网页的公共标签(例如,<base>标签)中。 
以移动终端所访问的页面内的两个超链接为例,其中: 
超链接1的动态URL为 
http://g9.baidu.com/tc?pn=9&bd_page_type=1&pu=pd%402%2Csz %40176%5F208%2Cusm%400&uid=frontui_1279025145_5670&t=1&w=0_5_www%2Esohu%2Ecom&ssid=0&from=0&&m=0&src=http://news.sohu.com/20101015/n273513572.shtml; 
超链接2的动态URL为 
http://g9.baidu.com/tc?pn=9&bd_page_type=1&pu=pd%402%2Csz%40176%5F208%2Cusm%400&uid=frontui_1279025145_5670&t=1&w=0_5_www%2Esohu%2Ecom&ssid=0&from=0&&m=0&src=http://news.sohu.com/20101014/n273489579.shtml; 
首先,将动态URL的参数以目录的形式进行静态化,其中: 
超链接1的动态URL静态化后为 
Figure BSA00000234235900071
超链接2的动态URL静态化后为 
Figure BSA00000234235900072
在静态URL中,通常大部分被静态化的参数是相同的,只有少数参数是不同的,从上述两个静态URL可以看出,其中斜体加粗部分,即 
Figure BSA00000234235900073
为两个静态URL相同的部分。 
然后,将相同的部分放入所述网页的公共标签中,例如称为<base>标签,而其他部分采用相对链接,就可以达到进一步缩小页面传输数据量的目的。当页面中的超链接数目较多时,效果将更为明显。 
图4为根据本发明一个实施例的网页分块的重要度评估设备的方框图。如图所示,网页分块的重要度评分设备40包括网页类型识别装置401、网页分块类型识别装置402、权重值计算装置403以及排序装置404。 
网页类型识别装置401用于识别网页的类型,其中所述网页的类型包括但不限于文本页、图片列表页、大图页、链接页、首页、论坛列表页、论坛帖子页、小说文本页以及小说目录页。 
网页分块类型识别装置402用于识别网页分块的类型,其中所述网页分块的类型包括但不限于交互块、链接块、索引块、文本块、版权块、导航块、栏目块、图片列表块、图片视图块、帖子块、广告块、正文块、目录块、BBS列表块、低质量块。 
权重值计算装置403用于根据所述网页的类型、所述网页分块的类型以及所述网页分块的属性,确定所述网页分块的权重值。其中,所述网页分块的属性包括但不限于所述网页分块在所述网页内的位置和所述网页分块的内容;所述网页内的位置通常包括五部分:页头、页脚、页左、页右以及页中;所述网页分块的内容包括但不限于纯文本字数、链接文本字数、纯图片个数、链接图片个数、文本链接个数、图片面积、表单以及外部块。根据所述网页分块所在网页的类型、所述网页分块的类型以及所述网页分块在所述网页内的位置,可以从预置的分块权重值信息表中获取到所述网页分块的分块权重值。预置的分块权重值信息表用于预先记录在某一类型的网页中,当一网页分块在网页的不同区域时,此网页分块的权重值,便于网页分块后直接获取到所述网页分块的分块权重值。比如,当一文本框在一文本页中,分别处于页头、页脚、页左、页右、页中时的分块权重值。然后根据所述网页分块的内容确定所述网页分块的基本信息权重值。所述网页分块的权重值等于其分块权重值与基本信息权重值之和。 
排序装置404用于根据所述网页分块的权重值的大小进行排序,排序的结果表明了所述网页分块在其所在网页中的重要度,并依据此重要度对所述网页分块进行展开或者折叠。 
在另一实施例中,当网页分块粒度过细时,可以采用合并装置(未示出)对网页分块进行合并,使合并后的网页分块可以更为准确地展开或者折叠。首先,合并装置判断相邻的所述网页分块是否位于网页的同一区域,只有在同一区域的内的网页分块才可以进行合并;然后判断相邻的所述网页分块的类型,将网页分块类型相同或者相似的网页分块进行合并。 
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在所附权利要求的范围内做出各种变形或修改。 

Claims (28)

1.一种网页分块重要度评估方法,该方法包括以下步骤:
识别网页分块所在网页的类型以及所述网页分块的类型;
根据所述网页的类型、所述网页分块的类型和/或所述网页分块的属性,确定所述网页分块的权重值;
对所述网页内的所述网页分块的权重值进行排序。
2.根据权利要求1所述的方法,其中:
所述网页的类型至少包括文本页、图片列表页、大图页、链接页、首页、论坛列表页、论坛帖子页、小说文本页、小说目录页之一。
3.根据权利要求1所述的方法,其中:
所述网页分块的类型至少包括交互块、链接块、索引块、文本块、版权块、导航块、栏目块、图片列表块、图片视图块、帖子块、广告块、正文块、目录块、BBS列表块、低质量块之一。
4.根据权利要求1所述的方法,其中:
所述网页分块的属性包括所述网页分块在所述网页内的位置和/或所述网页分块的内容。
5.根据权利要求4所述的方法,其中所述网页内的位置至少包括页头、页脚、页左、页右、页中之一。
6.根据权利要求4所述的方法,其中:
所述网页分块的内容至少包括纯文本字数、链接文本字数、纯图片个数、链接图片个数、文本链接个数、图片面积、表单以及外部块之一。
7.根据权利要求1所述的方法,其中:
根据所述网页分块的类型的相关程度,对相邻的所述网页分块进行合并。
8.根据权利要求1或3所述的方法,其中:
当所述网页分块为链接块时,根据其内部超链接点击率的高低对所述网页分块增加或降低权重值。
9.根据权利要求1至7中的任何一项所述的方法,其中:
当移动终端访问所述网页时,根据所述移动终端的属性和所述网页分块的权重值,确定所述网页分块的展开或者折叠。
10.根据权利要求9所述的方法,其中:
所述移动终端的属性至少包括屏幕的分辨率、浏览器的类型之一。
11.根据权利要求9所述的方法,其中:
点击折叠的所述网页分块,从服务器获取所述网页分块的内容。
12.根据权利要求9所述的方法,其中:
点击折叠的所述网页分块,显示已存在于所述移动终端上的所述网页分块的内容。
13.根据权利要求9所述的方法,其中:
将所述网页内动态URL的参数以目录的形式转化为静态URL,并提取所述静态URL中的公共部分。
14.根据权利要求1所述的方法,其中:
对网页模板确定网页分块的权重值;
基于所述网页模板中的网页分块确定的权重值确定基于该网页模板生成的网页的网页分块的权重值。
15.一种网页分块重要度评估设备,包括:
用于识别网页分块所在网页的类型的装置;
用于识别所述网页分块的类型的装置;
用于根据所述网页的类型、所述网页分块的类型和/或所述网页分块的属性,确定所述网页分块的权重值的装置;
用于对所述网页内的所述网页分块的权重值进行排序的装置。
16.根据权利要求15所述的设备,其中:
所述用于识别网页分块所在网页的类型的装置,识别所述网页的类型至少包括文本页、图片列表页、大图页、链接页、首页、论坛列表页、论坛帖子页、小说文本页、小说目录页之一。
17.根据权利要求15所述的设备,其中:
所述用于识别所述网页分块的类型的装置,识别所述网页分块的类型至少包括交互块、链接块、索引块、文本块、版权块、导航块、栏目块、图片列表块、图片视图块、帖子块、广告块、正文块、目录块、BBS列表块、低质量块之一。
18.根据权利要求15所述的设备,其中:
所述网页分块的属性包括所述网页分块在所述网页内的位置和/或所述网页分块的内容。
19.根据权利要求18所述的设备,其中所述网页内的位置至少包括页头、页脚、页左、页右、页中之一。
20.根据权利要求18所述的设备,其中:
所述网页分块的内容至少包括纯文本字数、链接文本字数、纯图片个数、链接图片个数、文本链接个数、图片面积、表单以及外部块之一。
21.根据权利要求15所述的设备,其中:
根据所述网页分块的类型的相关程度,可以对相邻的所述网页分块进行合并。
22.根据权利要求15或17所述的设备,其中:
当所述网页分块为链接块时,根据其内部超链接点击率的高低对所述网页分块进行加权或者降权。
23.根据权利要求15至21中的任何一项所述的设备,其中:
当移动终端访问所述网页时,根据所述移动终端的属性和所述网页分块的权重值,确定所述网页分块的展开或者折叠。
24.根据权利要求23所述的设备,其中:
所述移动终端的属性至少包括屏幕的分辨率、浏览器的类型之一。
25.根据权利要求23所述的设备,其中:
点击折叠的所述网页分块,从服务器获取所述网页分块的内容。
26.根据权利要求23所述的设备,其中:
点击折叠的所述网页分块,显示已存在于所述移动终端上的所述网页分块的内容。
27.根据权利要求23所述的设备,其中:(21)
将所述网页内动态URL的参数以目录的形式转化为静态URL,并提取所述静态URL中的公共部分。
28.根据权利要求15所述的设备,其中包括:(22)
对网页模板确定网页分块的权重值的装置;以及
基于所述网页模板的网页分块确定的权重值确定基于该网页模板生成的网页的网页分块的权重值的装置。
CN 201010256704 2010-08-19 2010-08-19 一种网页分块的重要度评估方法和设备 Pending CN101944104A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010256704 CN101944104A (zh) 2010-08-19 2010-08-19 一种网页分块的重要度评估方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010256704 CN101944104A (zh) 2010-08-19 2010-08-19 一种网页分块的重要度评估方法和设备

Publications (1)

Publication Number Publication Date
CN101944104A true CN101944104A (zh) 2011-01-12

Family

ID=43436095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010256704 Pending CN101944104A (zh) 2010-08-19 2010-08-19 一种网页分块的重要度评估方法和设备

Country Status (1)

Country Link
CN (1) CN101944104A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314486A (zh) * 2011-08-04 2012-01-11 百度在线网络技术(北京)有限公司 一种用于页面浏览的方法与设备
CN102368193A (zh) * 2011-08-26 2012-03-07 百度在线网络技术(北京)有限公司 一种用于提供浏览页面的方法与设备
CN102637172A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 网页分块标注方法与系统
CN102654875A (zh) * 2011-03-04 2012-09-05 北京百度网讯科技有限公司 一种自动处理网页文本的内链的方法及装置
CN103166981A (zh) * 2011-12-08 2013-06-19 腾讯科技(深圳)有限公司 一种无线网页转码方法及装置
CN103279563A (zh) * 2013-06-13 2013-09-04 百度在线网络技术(北京)有限公司 web页面内的公共块元素的结构化识别方法和装置
CN103365879A (zh) * 2012-03-29 2013-10-23 北京百度网讯科技有限公司 一种用于获取页面相似度的方法与设备
CN103473282A (zh) * 2013-08-29 2013-12-25 北京奇虎科技有限公司 一种生成热点内容页面的装置和方法
CN103488619A (zh) * 2013-07-05 2014-01-01 百度在线网络技术(北京)有限公司 一种用于进行文档文件处理的方法及装置
CN103546505A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 将页面分块按优先级顺序显示的方法、系统及装置
CN103544155A (zh) * 2012-07-09 2014-01-29 百度在线网络技术(北京)有限公司 用于移动终端的网页显示方法及装置
CN103577447A (zh) * 2012-07-30 2014-02-12 百度在线网络技术(北京)有限公司 一种用于确定目标页面的页面类型信息的方法和设备
US20140059092A1 (en) * 2012-08-24 2014-02-27 Samsung Electronics Co., Ltd. Electronic device and method for automatically storing url by calculating content stay value
CN103729370A (zh) * 2012-10-15 2014-04-16 腾讯科技(深圳)有限公司 网络小说介绍页的提取方法及装置
CN103942211A (zh) * 2013-01-21 2014-07-23 腾讯科技(深圳)有限公司 一种正文页的识别方法及装置
CN103970749A (zh) * 2013-01-25 2014-08-06 北京百度网讯科技有限公司 一种网页中的块重要性计算方法及系统
CN103970755A (zh) * 2013-01-28 2014-08-06 腾讯科技(深圳)有限公司 一种小说目录项的识别方法、装置和系统
CN104376114A (zh) * 2014-12-01 2015-02-25 百度在线网络技术(北京)有限公司 一种搜索结果展示方法及装置
CN104794118A (zh) * 2014-01-17 2015-07-22 腾讯科技(深圳)有限公司 一种网页信息处理方法、装置和系统
CN105354203A (zh) * 2014-08-21 2016-02-24 阿里巴巴集团控股有限公司 一种信息展示方法及装置
CN106326445A (zh) * 2016-08-26 2017-01-11 武汉大学 一种基于传感信息量的网页内容评价方法
CN106469036A (zh) * 2015-08-14 2017-03-01 腾讯科技(深圳)有限公司 信息显示方法及客户端
CN107577512A (zh) * 2017-08-25 2018-01-12 维沃移动通信有限公司 一种消息显示方法、移动终端及计算机可读存储介质
CN112508462A (zh) * 2021-02-05 2021-03-16 北京芯盾时代科技有限公司 数据筛选方法、装置及存储介质
CN112559943A (zh) * 2020-12-25 2021-03-26 北京百度网讯科技有限公司 网页元素的显示方法、装置、电子设备、存储介质及产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070061415A1 (en) * 2001-02-16 2007-03-15 David Emmett Automatic display of web content to smaller display devices: improved summarization and navigation
CN101187947A (zh) * 2007-12-20 2008-05-28 浙江大学 支持语义耦合的设备自适应网页布局方法
US20090265611A1 (en) * 2008-04-18 2009-10-22 Yahoo ! Inc. Web page layout optimization using section importance

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070061415A1 (en) * 2001-02-16 2007-03-15 David Emmett Automatic display of web content to smaller display devices: improved summarization and navigation
CN101187947A (zh) * 2007-12-20 2008-05-28 浙江大学 支持语义耦合的设备自适应网页布局方法
US20090265611A1 (en) * 2008-04-18 2009-10-22 Yahoo ! Inc. Web page layout optimization using section importance

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637172A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 网页分块标注方法与系统
CN102637172B (zh) * 2011-02-10 2013-11-27 北京百度网讯科技有限公司 网页分块标注方法与系统
CN102654875B (zh) * 2011-03-04 2014-05-21 北京百度网讯科技有限公司 一种自动处理网页文本的内链的方法及装置
CN102654875A (zh) * 2011-03-04 2012-09-05 北京百度网讯科技有限公司 一种自动处理网页文本的内链的方法及装置
CN102314486A (zh) * 2011-08-04 2012-01-11 百度在线网络技术(北京)有限公司 一种用于页面浏览的方法与设备
CN102368193A (zh) * 2011-08-26 2012-03-07 百度在线网络技术(北京)有限公司 一种用于提供浏览页面的方法与设备
WO2013029429A1 (zh) * 2011-08-26 2013-03-07 百度在线网络技术(北京)有限公司 一种用于提供浏览页面的方法与设备
CN102368193B (zh) * 2011-08-26 2017-10-10 百度在线网络技术(北京)有限公司 一种用于提供浏览页面的方法与设备
CN103166981A (zh) * 2011-12-08 2013-06-19 腾讯科技(深圳)有限公司 一种无线网页转码方法及装置
CN103166981B (zh) * 2011-12-08 2017-12-12 腾讯科技(深圳)有限公司 一种无线网页转码方法及装置
CN103365879A (zh) * 2012-03-29 2013-10-23 北京百度网讯科技有限公司 一种用于获取页面相似度的方法与设备
US9767081B2 (en) 2012-07-09 2017-09-19 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for displaying a webpage in a mobile terminal
CN103544155A (zh) * 2012-07-09 2014-01-29 百度在线网络技术(北京)有限公司 用于移动终端的网页显示方法及装置
CN103544155B (zh) * 2012-07-09 2018-01-09 百度在线网络技术(北京)有限公司 用于移动终端的网页显示方法及装置
CN103546505A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 将页面分块按优先级顺序显示的方法、系统及装置
CN103546505B (zh) * 2012-07-12 2018-03-06 百度在线网络技术(北京)有限公司 将页面分块按优先级顺序显示的方法、系统及装置
CN103577447A (zh) * 2012-07-30 2014-02-12 百度在线网络技术(北京)有限公司 一种用于确定目标页面的页面类型信息的方法和设备
US20140059092A1 (en) * 2012-08-24 2014-02-27 Samsung Electronics Co., Ltd. Electronic device and method for automatically storing url by calculating content stay value
CN103631850A (zh) * 2012-08-24 2014-03-12 三星电子株式会社 通过计算内容停留值来自动存储url的电子装置和方法
US9990384B2 (en) * 2012-08-24 2018-06-05 Samsung Electronics Co., Ltd. Electronic device and method for automatically storing URL by calculating content stay value
CN103729370A (zh) * 2012-10-15 2014-04-16 腾讯科技(深圳)有限公司 网络小说介绍页的提取方法及装置
CN103942211B (zh) * 2013-01-21 2019-04-26 腾讯科技(深圳)有限公司 一种正文页的识别方法及装置
CN103942211A (zh) * 2013-01-21 2014-07-23 腾讯科技(深圳)有限公司 一种正文页的识别方法及装置
CN103970749A (zh) * 2013-01-25 2014-08-06 北京百度网讯科技有限公司 一种网页中的块重要性计算方法及系统
CN103970749B (zh) * 2013-01-25 2017-08-25 北京百度网讯科技有限公司 一种网页中的块重要性计算方法及系统
CN103970755A (zh) * 2013-01-28 2014-08-06 腾讯科技(深圳)有限公司 一种小说目录项的识别方法、装置和系统
CN103970755B (zh) * 2013-01-28 2018-12-11 腾讯科技(深圳)有限公司 一种小说目录项的识别方法、装置和系统
CN103279563B (zh) * 2013-06-13 2017-02-08 百度在线网络技术(北京)有限公司 web页面内的公共块元素的结构化识别方法和装置
CN103279563A (zh) * 2013-06-13 2013-09-04 百度在线网络技术(北京)有限公司 web页面内的公共块元素的结构化识别方法和装置
CN103488619A (zh) * 2013-07-05 2014-01-01 百度在线网络技术(北京)有限公司 一种用于进行文档文件处理的方法及装置
CN103473282B (zh) * 2013-08-29 2016-10-05 北京奇虎科技有限公司 一种生成热点内容页面的装置和方法
CN103473282A (zh) * 2013-08-29 2013-12-25 北京奇虎科技有限公司 一种生成热点内容页面的装置和方法
CN104794118A (zh) * 2014-01-17 2015-07-22 腾讯科技(深圳)有限公司 一种网页信息处理方法、装置和系统
CN104794118B (zh) * 2014-01-17 2019-03-26 腾讯科技(深圳)有限公司 一种网页信息处理方法、装置和系统
CN105354203A (zh) * 2014-08-21 2016-02-24 阿里巴巴集团控股有限公司 一种信息展示方法及装置
CN104376114B (zh) * 2014-12-01 2018-01-30 百度在线网络技术(北京)有限公司 一种搜索结果展示方法及装置
CN104376114A (zh) * 2014-12-01 2015-02-25 百度在线网络技术(北京)有限公司 一种搜索结果展示方法及装置
CN106469036A (zh) * 2015-08-14 2017-03-01 腾讯科技(深圳)有限公司 信息显示方法及客户端
CN106326445A (zh) * 2016-08-26 2017-01-11 武汉大学 一种基于传感信息量的网页内容评价方法
CN106326445B (zh) * 2016-08-26 2019-09-17 武汉大学 一种基于传感信息量的网页内容评价方法
CN107577512A (zh) * 2017-08-25 2018-01-12 维沃移动通信有限公司 一种消息显示方法、移动终端及计算机可读存储介质
CN112559943A (zh) * 2020-12-25 2021-03-26 北京百度网讯科技有限公司 网页元素的显示方法、装置、电子设备、存储介质及产品
CN112559943B (zh) * 2020-12-25 2024-02-27 北京百度网讯科技有限公司 网页元素的显示方法、装置、电子设备、存储介质及产品
CN112508462A (zh) * 2021-02-05 2021-03-16 北京芯盾时代科技有限公司 数据筛选方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN101944104A (zh) 一种网页分块的重要度评估方法和设备
CN100440127C (zh) 打印网页的方法及其装置
CN101192231B (zh) 基于上下文的书签
CN104281827B (zh) 识别二维码的方法及装置
CN102663135B (zh) 用于嵌入式浏览器的图形化书签实现方法、装置及终端
EP1145147A2 (en) Display text modification for link data items
Xie et al. Efficient browsing of web search results on mobile devices based on block importance model
CN102123195A (zh) 在通信终端中提供书签服务的设备和方法
CN103020156B (zh) 一种针对网页的处理方法、装置和设备
CN101146128A (zh) 允许小屏幕移动终端访问和浏览www网站的方法
CN102841911A (zh) 手持式电子装置及其多媒体片段记录方法
CN103399885B (zh) 兴趣点代表图片的挖掘方法、装置和服务器
CN104852889A (zh) 图片验证码生成方法和系统、验证方法和客户端及服务器
CN101515272A (zh) 提取网页内容的方法和装置
CN102063456A (zh) 自动定位至网页的视觉中心的方法及设备
CN111310750B (zh) 一种信息处理方法、装置、计算设备及介质
CN102664925A (zh) 一种展现搜索结果的方法及装置
CN103577447A (zh) 一种用于确定目标页面的页面类型信息的方法和设备
CN102314494A (zh) 一种用于处理网页内容的方法和设备
CN104239326B (zh) 一种对网页字体进行缩放的方法、装置和系统
CN103365876A (zh) 基于关系图谱生成网络操作辅助信息的方法与设备
CN101894109A (zh) 一种数据库建立方法和装置
US9916287B2 (en) Method, device and system for zooming font in web page file, and storage medium
CN101777067B (zh) 一种用于移动通讯设备终端的网页内容识别管理系统
CN103729354B (zh) 网页信息处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110112