CN103365877B - 对网页进行转码后建立目录的方法以及服务器 - Google Patents

对网页进行转码后建立目录的方法以及服务器 Download PDF

Info

Publication number
CN103365877B
CN103365877B CN201210089036.2A CN201210089036A CN103365877B CN 103365877 B CN103365877 B CN 103365877B CN 201210089036 A CN201210089036 A CN 201210089036A CN 103365877 B CN103365877 B CN 103365877B
Authority
CN
China
Prior art keywords
webpage
piecemeal
paging
page
summary info
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210089036.2A
Other languages
English (en)
Other versions
CN103365877A (zh
Inventor
张建荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210089036.2A priority Critical patent/CN103365877B/zh
Publication of CN103365877A publication Critical patent/CN103365877A/zh
Application granted granted Critical
Publication of CN103365877B publication Critical patent/CN103365877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供了一种对网页进行转码后建立目录的方法,该方法包括:a.获取待转码的网页;b.对该网页进行分块处理,将该网页分成多个分块;c.对所述网页进行页面转码,以获得与该网页对应的至少一个分页,并分别记录每一所述分块的摘要信息;d.记录每一所述分块与所述分页的对应关系,并根据该对应关系建立页面目录,该页面目录内包含所述多个分块的摘要信息,所述摘要信息指向与所述多个分块对应的所述分页。相应地,本发明还提供了一种对网页进行转码后建立目录的服务器。实施本发明,可以提升用户的浏览效率、降低操作难度以及提升用户体验。

Description

对网页进行转码后建立目录的方法以及服务器
技术领域
本发明涉及互联网技术领域,尤其涉及一种对网页进行转码后建立目录的方法以及服务器。
背景技术
互联网上融合了WEB和WAP两类网页资源,WEB网页资源占比远多于WAP网页,但目前绝大多数移动终端的浏览器都不能直接浏览WEB网页。因此,为确保WAP可用性,必须对WAP搜索结果中的WEB网页进行格式转换,转换为WAP网页,使其能在移动终端浏览器被浏览。转码技术即是为实现此目的、服务于WAP搜索的附属产品。为了最大程度解决WEB页面在手机上的可用性,转码须去除WEB页面中不能在手机浏览器上浏览的内容,和无法用WAP描述语言描述的部分内容,并将网页布局由2维布局适配为1维布局。
转码服务在处理大型索引页的时候,大型索引页页面结构复杂,转码处理后生成的分页较多,使得用户无法对页面有一个整体的把握,不方便用户浏览感兴趣的栏目所在分页,也无法快速跳转到自己感兴趣的栏目所在的分页。因此造成了用户的浏览效率下降、重复操作增多以及用户体验下降。
发明内容
本发明的目的在于提供一种对网页进行转码后建立目录的方法以及服务器,可以实现对多个分页的快捷浏览。
为达到上述目的,一方面,本发明提供了一种对网页进行转码后建立目录的方法,该方法包括:
a.获取待转码的网页;
b.将该网页分成多个分块;
c.对所述网页进行页面转码以获得与该网页对应的至少一个分页,并遍历所述网页的源码以分别记录每一所述分块的摘要信息;
d.根据所述摘要信息在所述源码中的布局确定每一所述分块与所述分页的对应关系,并根据该对应关系建立页面目录,该页面目录内包含所述多个分块的摘要信息,所述摘要信息指向与所述多个分块对应的所述分页。
另一方面,本发明提供了一种对网页进行转码后建立目录的服务器,该服务器包括:
获取模块,用于获取待转码的网页;
分块模块,用于将所述网页分成多个分块;
转码模块,用于对所述网页进行页面转码以获得与该网页对应的至少一个分页,并遍历所述网页的源码以分别记录每一所述分块的摘要信息;
目录模块,用于根据所述摘要信息在所述源码中的布局确定每一所述分块与所述分页的对应关系,并根据该对应关系建立页面目录,该页面目录内包含所述多个分块的摘要信息,所述摘要信息指向与所述多个分块对应的所述分页。
本发明提供的对网页进行转码后建立目录方法以及服务器,首先对待转码的网页进行分块,然后对该待转码的网页进行转码分页处理,最后根据所述分块与所述分页的对应关系建立页面目录。通过对页面中的分块增加目录索引功能,方便用户了解页面全貌,同时,用户点击目录中的索引,可以快速跳转到感兴趣的内容所在的分页。由此,可以提升用户的浏览效率、降低操作难度以及提升用户体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是根据本发明的对网页进行转码后建立目录的方法的一种具体实施方式的流程图;
图2至图5是图1示出的具体实施方式的几个具体实施场景的示意图;
图6是根据本发明的对网页进行转码后建立目录的服务器的一种具体实施方式的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施例作详细描述。
首先请参考图1,图1是根据本发明的对网页进行转码后建立目录的方法的一种具体实施方式的流程图,该方法包括:
步骤S100,获取待转码的网页;
步骤S200,将该网页分成多个分块;
步骤S300,对所述网页进行页面转码以获得与该网页对应的至少一个分页,并遍历所述网页的源码以分别记录每一所述分块的摘要信息;
步骤S400,根据所述摘要信息在所述源码中的布局确定每一所述分块与所述分页的对应关系,并根据该对应关系建立页面目录,该页面目录内包含所述多个分块的摘要信息,所述摘要信息指向与所述多个分块对应的所述分页。
具体地,步骤S100中术语“转码”指的是对WEB网页处理使其变为适合在移动设备上显示的WAP网页。典型地,提供所述WEB网页的服务器通常提供HTML格式的页面,常见的个人电脑、平板电脑等终端由于具有较强的数据处理能力和较大的网络接入带宽,能够在短时间内对其进行解析并显示;而手机、PDA等移动终端由于其自身数据处理能力较弱且网络接入带宽有限,更适合于解析并显示WAP页面,例如WML格式或XHTML格式的页面。在步骤S100中获取的待转码网页通常是HTML格式的页面,本发明提供的方法旨在对该HTML格式的页面进行转码的过程中对处理结果(转码所得的WAP页面)进行优化,使其更为方便易用,以提升用户体验。
接下来进行步骤S200,对所述HTML格式网页进行分块处理,将其分成多个分块。具体地,对该HTML格式网页进行分块处理的方法包括:获取该HTML格式网页的DOM树,并根据该DOM树对该HTML格式的网页进行分块。其中,DOM指的是文档对象模型(Document ObjectModel),是一种处理可扩展置标语言的标准编程接口,由于HTML文档是一种规范化的文档,DOM技术采取一种非常直观且一致的方式将HTML文档进行模型化处理,并借此提供访问、导航和操作页面的简易编程接口,以及识别该HTML文档的功能内容。DOM树是指通过DOM将HTML页面进行解析,并生成的HTML树树状结构和对应访问方法,使编程者可以方便地沿着所述HTML文档的树型结构在上、下以及一侧方向做节点导航。综上所述,对所述HTML格式的网页进行解析后获得该网页的DOM树,并可根据该DOM树获得其DOM节点,每一所述DOM节点具有文本特征、结构特征和功能特征中的至少一个特征,根据上述特征可识别并分析出该HTML网页的多个分块。
当然,步骤S200的实施者可以根据所述HTML的实际功能确定每一所述分块具有的逻辑含义。例如在一些实施例中,所述HTML格式的网页是门户网站的主页,其包括多个不同类型的导航链接的导航块,用于引导访问者进入不同的分栏目中,因此在逻辑上针对该类型的HTML格式的网页的分块可以是包括多个导航链接的导航块;一些HTML格式的网页中包括由至少一篇文章组成的栏目块,因此在逻辑上针对该类型的HTML格式的网页的分块可以是所述栏目块。
步骤S200完成后,执行步骤S300,对所述HTML格式的网页进行页面转码,以获得与该HTML格式的网页对应的至少一个分页,并分别记录每一所述分块的摘要信息。具体地,存在一部分无法支持WEB页面的移动终端,因此需要页面转码技术将WEB页面转化为WAP页面便于上述移动终端浏览和访问。使用上述移动终端浏览该WEB页面时会出现部分内容丢失和页面排列发生变化的现象,这种现象的发生主要是因为上述移动终端的功能和配置与个人电脑之间的差距造成的。例如上述移动终端普遍不能安装FLASH播放软件,那么在WEB页面上以FLASH形式存在的内容就无法在上述移动终端上展现;又例如上述移动终端的浏览器仅能支持一维的页面,该页面中信息只能从上到下排列,而WEB页面普遍都是二维的,为了能够在上述移动终端上浏览这些信息,网络服务提供商须通过WAP技术转码将WEB页面包括的二维信息转换成WAP页面包括的一维信息,这必然导致被浏览的WEB页面的内容在手机页面上有所变化。由于页面转码技术是本领域用于解决上述问题的常用技术,在此不再赘述。通常对一个WEB页面进行页面转码后,获得与该WEB页面对应的至少一个WAP分页,而更典型地,对某些大型WEB索引页面进行页面转码后能获得多个WAP分页。在进行所述页面转码的同时,基于对所述WEB页面的内容进行分析,可获得并记录步骤S200中生成的每一所述分块对应的摘要信息,例如,所述分块是上述包括多个导航链接的导航块,则所述摘要信息可以是从所述多个导航链接抽取的一个或多个导航链接的文字;又例如,所述分块是包括至少一篇文章的栏目块,则所述摘要信息是从所述至少一篇文章中抽取的文章标题。当然根据所述分块的具体内容可以确定其对应的摘要信息,用于直观示出该分块包括的内容。
步骤S300执行后或同时,执行步骤S400,记录每一所述分块与所述WAP分页的对应关系,并根据该对应关系建立页面目录,该页面目录内包含所述多个分块的摘要信息,所述摘要信息指向与所述多个分块对应的所述分页。具体地,步骤S300中进行所述页面转码时,已经限定每一所述WAP分页的尺寸,可能出现的情况是,每一所述WAP分页中包括一个或多个所述分块,因此步骤S300中记录每一所述分块与所述WAP分页的对应关系实质上是记录所述WAP分页中包括的一个或多个所述分块。某些情况中,所述分块的含有的内容较多,可能需要多个所述WAP分页才能显示完全,但本领域技术人员应当理解,所述分块与所述WAP之间的映射关系彼此之间满足逻辑上“一对多”或者“多对一”的关系,而不存在“多对多”的关系。根据上述对应关系建立页面目录,而该页面目录的具体实现形式是包括所述多个分块的摘要信息,每一所述摘要信息实施为链接的形式,分别指向与其对应的多个分块所对应的WAP分页。典型地,一种情况中,一个所述WAP分页中包括一个或多个所述分块,例如分页1中包括“新闻”分块和“汽车”分块,并且“新闻”分块的摘要信息是“新闻”,“汽车”分块的摘要信息是“汽车”,点击生成的页面目录中包括摘要信息“新闻”和“汽车”都使页面跳转至分页1;在另一种情况中,一个分块需要多个WAP分页才能显示完全,例如“新闻”分块包括的内容较多,分页2和分页3两个分页才能完全显示,则点击生成的页面目录中包括的摘要信息“新闻”时使页面跳转至分页2或分页3,优选地,跳转至分页2(即按照WAP分页对应所述分块的内容的逻辑连续性,优选跳转至显示所述分块内容的第一个分页上)。
在具体实施过程中,可以生成多种类型的所述页面目录,以适应不同类型的移动终端的网页浏览环境。例如一些移动终端支持HTML5,所述页面目录可以设计为基于HTML5实现的目录窗口;或一些移动终端支持复杂的CSS样式,或一些移动终端支持Javascript,则所述页面目录可以设计为悬浮在WAP分页上的目录窗口;或一些早期的移动设备并不能支持上述网页浏览技术,则可以将所述页面目录设计为独立的目录WAP页面。在移动终端请求对WEB页面进行页面转码时,首先检测所述移动终端的型号,再根据所述移动终端的具体型号选择合适的页面目录形式进行推送。
为了更好说明图1示出的方法的具体应用,请参考图2至图5,图2至图5是图1示出的具体实施方式的几个具体实施场景的示意图。首先参考图2,图2示出了对待转码的网页100进行分块识别的过程,其中,网页100是大型的索引网页,对其进行转码将产生多个WAP分页,因此首先对其进行分块处理。通过在后台对网页100的DOM树进行分析,可以识别出该网页100中包括的多个分块,例如图2中较暗部分示出的多个分块,包括分块110等。以分块110为例说明,该分块110是一个包括多个导航链接的“新闻”导航块,包括栏目标题部分111和栏目链接部分112,其中栏目标题部分111该导航块的标题“新闻”,栏目链接部分112包括若干指向二级新闻页面的链接。当然对分块110进行说明只是为了示出页面100的典型分块,该页面100中的其他分块的具体形式并未在图2中示出,这并不意味着页面100中只存在分块110。实质上在本实施例中,页面100还包括其他的分块,例如“视频”导航块、“大片”导航块、“娱乐”导航块、“体育”导航块和“汽车”导航块等多个分块。
请参考图3,对页面100进行页面转码生成多个分页,例如分页200。当用户使用移动终端请求浏览页面100,获得响应结果将是所述多个分页中的一个。继续参考图4,图4示出了移动终端400上显示分页200的一种典型界面,相应地,如图4所示,该移动终端400上显示的分页200中包括分块110的内容,例如分块110中包括的各种新闻标题链接。继续参考图5,已知根据页面100可以生成多个分页,则相应地在移动终端400上显示页面目录300,以便于用户对页面100的概要进行快捷掌握,以及针对所述多个分页进行基于内容的跳转。该页面目录300中包括从上述多个分块中抽取的摘要信息,例如从上述多个导航块的栏目标题部分抽取的“视频”、“大片”、“娱乐”、“体育”和“汽车”等关键字作为摘要信息,上述关键字被处理为链接,并指向该关键字对应的导航块所在的分页。
另一方面,本发明提供了一种对网页进行转码后建立目录的服务器,请参考图6,图6是根据本发明的对网页进行转码后建立目录的服务器500的一种具体实施方式的结构示意图,该服务器500包括:
获取模块510,用于获取待转码的网页;
分块模块520,用于将所述网页分成多个分块;
转码模块530,用于对所述网页进行页面转码以获得与该网页对应的至少一个分页,并遍历所述网页的源码以分别记录每一所述分块的摘要信息;
目录模块540,用于根据所述摘要信息在所述源码中的布局确定每一所述分块与所述分页的对应关系,并根据该对应关系建立页面目录,该页面目录内包含所述多个分块的摘要信息,所述摘要信息指向与所述多个分块对应的所述分页。。
需要说明的是,在本部分出现的术语可以参考前文中对于方法的说明中相关部分的描述,在此不再赘述。
具体地,获取模块510通过互联网与提供所述待转码的网页的网页服务器600进行数据通信,以获取所述待转码的网页,而该待转码的网页通常是移动终端通过服务器500向网页服务器600请求的。
一个优选的实施例中,分块模块520包括解析单元521和分块单元522,其中:解析单元521,用于对所述网页进行解析,以获取该网页的DOM树;分块单元522,用于根据所述DOM树对所述网页进行分块。其中,分块单元522根据所述DOM树对所述网页进行分块的具体方法包括:分块单元522根据所述DOM树获得所述网页的DOM节点,并根据所述DOM节点的文本特征、结构特征和功能特征中的至少一个特征对所述网页进行分块。典型地,所述分块是包括多个导航链接的导航块和/或包括至少一篇文章的栏目块.。
转码模块530包括分页单元531和摘要单元532,其中:分页单元531,用于对所述网页进行页面转码后生成与该网页对应的一个或多个所述分页;摘要单元532,用于从所述导航块内抽取所述摘要信息,该摘要信息是从所述多个导航链接抽取的一个或多个导航链接的文字,和/或从所述栏目块内抽取所述摘要信息,该摘要信息是从所述至少一篇文章中抽取的文章标题。
优选地,所述页面目录包括:独立的目录页面、悬浮在所述分页上的目录窗口和基于Html 5的目录窗口中的一种或多种。典型地,服务器500的目录模块540记录每一所述分块与所述分页的对应关系的具体方法包括:记录所述分页中包括的一个或多个所述分块。
优选地,该服务器500还包括发送模块550,用于将所述多个分页和所述页面目录发送给移动终端的浏览器。例如发送模块550通过互联网,根据终端400的请求将所述多个分页分别发送给终端400,并发送所述页面目录。
需要说明的是,上述待转码的网页通常是HTML格式的页面,所述分页通常是WAP分页,例如WML格式或XHTML格式的页面。
在一个实施例中,服务器500可以实施在一台物理服务器设备中,在另一些实施例中,服务器500可以实施为服务器集群或服务器矩阵结构,其包括的多个服务器设备协同工作以实现服务器500中各个模块的逻辑关系和功能。在另一些实施例中,服务器500实施为一种计算机程序产品,上述计算机程序产品的实施例可以通过使用用于计算机可读信息的任何记录介质来实现,所述记录介质包括磁介质、光介质或其他适合的介质。
本发明提供的对网页进行转码后建立目录的方法可以使用可编程逻辑器件结合来实现,也可以实施为计算机程序软件,例如根据本发明的实施例可以是一种计算机程序产品,运行该程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现上述方法的各个步骤。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可从计算机主体拆卸的可移动介质(例如热拔插技术存储设备)。所述内置介质包括但不限于可重写的非易失性存储器,例如RAM、ROM、快闪存储器和硬盘。所述可移动介质包括但不限于:光存储媒体(例如CD-ROM和DVD)、磁光存储媒体(例如MO)、磁存储媒体(例如盒带或移动硬盘)、具有内置的可重写的非易失性存储器的媒体(例如存储卡)和具有内置ROM的媒体(例如ROM盒)。
本领域技术人员应当理解,任何具有适当编程装置的计算机系统都将能够执行包含在程序产品中的本发明的方法的诸步骤。尽管本说明书中描述的多数具体实施方式都侧重于软件程序,但是作为固件和硬件实现本发明提供的方法的替代实施例同样在本发明要求保护的范围之内。
本发明提供的对网页进行转码后建立目录方法以及服务器,首先对待转码的网页进行分块,然后对该待转码的网页进行转码分页处理,最后根据所述分块与所述分页的对应关系建立页面目录。获取所述分页的用户可以通过该页面目录快速定位其感兴趣的分页、快捷地在多个分页中切换以及整体了解所述页面的全貌,因此可以提升用户的浏览效率、降低操作难度以及提升用户体验。
以上所揭露的仅为本发明的一些较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (14)

1.一种对网页进行转码后建立目录的方法,该方法包括:
a.获取待转码的网页;
b.将该网页分成多个分块;
c.对所述网页进行页面转码以获得与该网页对应的至少一个分页,并遍历所述网页的源码以分别记录每一所述分块的摘要信息;
d.根据所述摘要信息在所述源码中的布局确定每一所述分块与所述分页的对应关系,并根据该对应关系建立页面目录,该页面目录内包含所述多个分块的摘要信息,所述摘要信息指向与所述多个分块对应的所述分页;
其中,根据所述摘要信息在所述源码中的布局确定的每一所述分块与所述分页的对应关系包括:
一个所述分页中包括一个或多个所述分块;
一个所述分块的内容显示于一个或多个所述分页。
2.根据权利要求1所述的方法,其中,步骤b中的所述分块处理包括:
对所述网页进行解析,以获取该网页的DOM树;
根据所述DOM树对所述网页进行分块。
3.根据权利要求2所述的方法,其中,根据所述DOM树对所述网页进行分块包括:
根据所述DOM树获得所述网页的DOM节点,并根据所述DOM节点的文本特征、结构特征和功能特征中的至少一个特征对所述网页进行分块。
4.根据权利要求1所述的方法,其中:
所述分块是包括多个导航链接的导航块;
所述摘要信息是从所述多个导航链接抽取的一个或多个导航链接的文字。
5.根据权利要求1所述的方法,其中:
所述分块是包括至少一篇文章的栏目块;
所述摘要信息是从所述至少一篇文章中抽取的文章标题。
6.根据权利要求1所述的方法,其中,所述页面目录包括:
独立的目录页面、悬浮在所述分页上的目录窗口和基于Html 5的目录窗口中的一种或多种。
7.根据权利要求1至6任一项所述的方法,其中:
所述网页是HTML格式的页面;
所述分页是WML格式或XHTML格式的页面。
8.一种对网页进行转码后建立目录的服务器,该服务器包括:
获取模块,用于获取待转码的网页;
分块模块,用于将所述网页分成多个分块;
转码模块,用于对所述网页进行页面转码以获得与该网页对应的至少一个分页,并遍历所述网页的源码以分别记录每一所述分块的摘要信息;
目录模块,用于根据所述摘要信息在所述源码中的布局确定每一所述分块与所述分页的对应关系,并根据该对应关系建立页面目录,该页面目录内包含所述多个分块的摘要信息,所述摘要信息指向与所述多个分块对应的所述分页;
其中,根据所述摘要信息在所述源码中的布局确定的每一所述分块与所述分页的对应关系包括:
一个所述分页中包括一个或多个所述分块;
一个所述分块的内容显示于一个或多个所述分页。
9.根据权利要求8所述的服务器,其中,所述分块模块包括:
解析单元,用于对所述网页进行解析,以获取该网页的DOM树;
分块单元,用于根据所述DOM树对所述网页进行分块。
10.根据权利要求9所述的服务器,其中,所述分块单元根据所述DOM树对所述网页进行分块包括:
所述分块单元根据所述DOM树获得所述网页的DOM节点,并根据所述DOM节点的文本特征、结构特征和功能特征中的至少一个特征对所述网页进行分块。
11.根据权利要求8所述的服务器,其中:
所述分块是包括多个导航链接的导航块和/或包括至少一篇文章的栏目块;
所述转码模块包括分页单元和摘要单元;
所述分页单元,用于对所述网页进行页面转码后生成与该网页对应的一个或多个所述分页;
所述摘要单元,用于从所述导航块内抽取所述摘要信息,该摘要信息是从所述多个导航链接抽取的一个或多个导航链接的文字,和/或从所述栏目块内抽取所述摘要信息,该摘要信息是从所述至少一篇文章中抽取的文章标题。
12.根据权利要求8所述的服务器,其中,所述页面目录包括:
独立的目录页面、悬浮在所述分页上的目录窗口和基于Html 5的目录窗口中的一种或多种。
13.根据权利要求8所述的服务器,该服务器还包括:
发送模块,用于将所述多个分页和所述页面目录发送给移动终端的浏览器。
14.根据权利要求8至13任一项所述的服务器,其中:
所述网页是HTML格式的页面;
所述分页是WML格式或XHTML格式的页面。
CN201210089036.2A 2012-03-29 2012-03-29 对网页进行转码后建立目录的方法以及服务器 Active CN103365877B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210089036.2A CN103365877B (zh) 2012-03-29 2012-03-29 对网页进行转码后建立目录的方法以及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210089036.2A CN103365877B (zh) 2012-03-29 2012-03-29 对网页进行转码后建立目录的方法以及服务器

Publications (2)

Publication Number Publication Date
CN103365877A CN103365877A (zh) 2013-10-23
CN103365877B true CN103365877B (zh) 2017-12-26

Family

ID=49367247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210089036.2A Active CN103365877B (zh) 2012-03-29 2012-03-29 对网页进行转码后建立目录的方法以及服务器

Country Status (1)

Country Link
CN (1) CN103365877B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317903B (zh) * 2014-10-24 2017-10-13 北京奇虎科技有限公司 章节式文本的章节完整性的识别方法和装置
CN105635236B (zh) * 2014-12-01 2018-11-27 阿里巴巴集团控股有限公司 一种页面呈现方法、装置及系统
CN106294475A (zh) * 2015-06-04 2017-01-04 阿里巴巴集团控股有限公司 页面的生成方法和装置
CN108073646B (zh) * 2016-11-18 2021-12-24 北大方正集团有限公司 目录提取方法及装置
CN106650504B (zh) * 2016-12-28 2019-04-02 中国科学院计算技术研究所 一种针对Web页面数据的摘要提取方法及检测方法
CN107016631B (zh) * 2017-03-31 2021-02-12 弘成科技发展有限公司 跨平台课件智能合成方法
CN107368546B (zh) * 2017-06-28 2020-05-12 武汉斗鱼网络科技有限公司 一种生成文章大纲的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0949571A2 (en) * 1998-04-07 1999-10-13 Xerox Corporation Document re-authoring systems and methods for providing device-independent access to the world wide web
CN1732459A (zh) * 2002-11-01 2006-02-08 Lg电子株式会社 用于较小显示装置的网页内容译码系统和方法
US7725604B1 (en) * 2001-04-26 2010-05-25 Palmsource Inc. Image run encoding
CN102262627A (zh) * 2010-05-24 2011-11-30 卓望数码技术(深圳)有限公司 一种网页分割方法和网页分割系统
CN102262628A (zh) * 2010-05-24 2011-11-30 卓望数码技术(深圳)有限公司 一种网页分割方法和分页服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030004984A1 (en) * 2001-07-02 2003-01-02 Iscreen Corporation Methods for transcoding webpage and creating personal profile

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0949571A2 (en) * 1998-04-07 1999-10-13 Xerox Corporation Document re-authoring systems and methods for providing device-independent access to the world wide web
US7725604B1 (en) * 2001-04-26 2010-05-25 Palmsource Inc. Image run encoding
CN1732459A (zh) * 2002-11-01 2006-02-08 Lg电子株式会社 用于较小显示装置的网页内容译码系统和方法
CN102262627A (zh) * 2010-05-24 2011-11-30 卓望数码技术(深圳)有限公司 一种网页分割方法和网页分割系统
CN102262628A (zh) * 2010-05-24 2011-11-30 卓望数码技术(深圳)有限公司 一种网页分割方法和分页服务器

Also Published As

Publication number Publication date
CN103365877A (zh) 2013-10-23

Similar Documents

Publication Publication Date Title
CN103365877B (zh) 对网页进行转码后建立目录的方法以及服务器
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
CN105117474B (zh) 在网页的阅读模式中进行推荐信息加载的方法和装置
US9946695B2 (en) Systems and methods for automatically generating content layout based on selected highest scored image and selected text snippet
US7607082B2 (en) Categorizing page block functionality to improve document layout for browsing
US20130326333A1 (en) Mobile Content Management System
CN103166981B (zh) 一种无线网页转码方法及装置
EP3226159A1 (en) System and method for managing browsing histories of web browser
US20080033996A1 (en) Techniques for approximating the visual layout of a web page and determining the portion of the page containing the significant content
Xie et al. Efficient browsing of web search results on mobile devices based on block importance model
CN111428177A (zh) 用于web内容生成的方法和系统
US9311303B2 (en) Interpreted language translation system and method
CN101765979A (zh) 用于移动设备的文档处理
CN102065114A (zh) 一种移动终端访问网页的方法及装置
CN102682082B (zh) 基于内容结构特征的网络Flash搜索系统及搜索方法
CN102411614A (zh) 图像搜索结果的显示
CN110263266A (zh) 一种基于微信小程序和爬虫的数据展示方法
US10755091B2 (en) Method and apparatus for retrieving image-text block from web page
US20190310976A1 (en) Search Results Modulator
CN105447198A (zh) 页面脚本便捷导入的方法及装置
CN102955852A (zh) 一种网页资源处理方法、装置及设备
CN102486792A (zh) 一种将通用论坛页面重新组织和显示的方法及系统
US10198408B1 (en) System and method for converting and importing web site content
JP2005275488A (ja) 入力支援方法およびプログラム
Sabri et al. Improving performance of DOM in semi-structured data extraction using WEIDJ model

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant