CN103617164A - 网页预取方法、装置及终端设备 - Google Patents
网页预取方法、装置及终端设备 Download PDFInfo
- Publication number
- CN103617164A CN103617164A CN201310499825.8A CN201310499825A CN103617164A CN 103617164 A CN103617164 A CN 103617164A CN 201310499825 A CN201310499825 A CN 201310499825A CN 103617164 A CN103617164 A CN 103617164A
- Authority
- CN
- China
- Prior art keywords
- node
- streptostyly
- type
- fraternal
- literal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9574—Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
Abstract
本发明是关于一种网页预取方法、装置及终端设备,属于终端设备技术领域。所述方法包括:检测当前网页的文档对象模型树中节点的类型及节点内容;根据所述节点的类型以及节点内容,获取指定文字节点,所述指定文字节点的节点内容包括指定关键字,且所述指定文字节点不是链接型节点;获取所述指定文字节点的多个兄弟链接型节点;根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点;将指定链接型节点对应的网页内容加载至预设缓存区域。本发明通过对节点内容标识下一页含义、但链接类型不是链接型节点的文字节点的识别,进而对链接型节点对应的网页内容进行后台预取,以便提高网页的打开速度,减少用户等待时间。
Description
技术领域
本公开涉及终端设备技术领域,特别涉及一种网页预取方法、装置及终端设备。
背景技术
在浏览器中进行网页显示时,一般是在当前页面中显示链接型节点,当用户点击链接型节点后,浏览器会下载该链接型节点对应的网页到本地,然后对网页进行渲染和显示。这种处理方法的缺点在于,如果当前的网络环境受限,下载速度慢,该从点击到显示网页所需要的时间就会较长,从而影响网页的显示速度,造成用户等待时间过长。
发明内容
为了克服相关技术中存在的问题,本公开提供了一种网页预取方法、装置及终端设备。所述技术方案如下:
第一方面,本公开提供了一种网页预取方法,所述方法包括:
检测当前网页的文档对象模型树中节点的类型及节点内容;
根据所述节点的类型以及节点内容,获取指定文字节点,所述指定文字节点的节点内容包括指定关键字,且所述指定文字节点不是链接型节点;
获取所述指定文字节点的多个兄弟链接型节点;
根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,所述指定链接型节点为所述多个兄弟链接型节点中显示位置坐标与所述指定文字节点之间满足预设规则的节点;
将指定链接型节点对应的网页内容加载至预设缓存区域。
可选地,所述方法还包括:
当根据所述节点的类型以及节点内容确定所述文档对象模型树中不具有用于标识下一页链接的链接型节点时,执行所述获取指定文字节点的步骤。
可选地,根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点包括:
遍历所述多个兄弟链接型节点;
当所述多个兄弟链接型节点中包括第一链接型节点时,将所述第一链接型节点确定为指定链接型节点,所述第一链接型节点的纵坐标与所述指定文件节点的纵坐标相同、所述第一链接型节点的横坐标与所述指定文件节点的横坐标的差值小于第一预设阈值且所述第一链接型节点与所述指定文字节点之间不包括其他链接型节点。
可选地,根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点包括:
遍历所述多个兄弟链接型节点;
当所述多个兄弟链接型节点中包括第二链接型节点时,将所述第二链接型节点确定为指定链接型节点,所述第二链接型节点的纵坐标与所述指定文件节点的纵坐标差值小于第二预设阈值、所述第二链接型节点的纵坐标大于所述指定文件节点的纵坐标、所述第二链接型节点的横坐标与所述指定文件节点的横坐标至少有部分重叠且所述第二链接型节点与所述指定文字节点之间不包括其他链接型节点。
可选地,将指定链接型节点对应的网页内容加载至预设缓存区域之后,所述方法还包括:
当检测到对所述指定链接型节点的点击事件时,将所述预设缓存区域中所加载的所述指定链接型节点对应的网页内容加载在当前网页中进行显示。
可选地,将指定链接型节点对应的网页内容加载至预设缓存区域之后,所述方法还包括:
检测是否接收到运行结束消息,如果未接收到所述运行结束消息时,继续加载网页内容,直到接收到所述运行结束消息。
第二方面,本公开提供了一种网页预取装置,所述装置包括:
检测模块,用于检测当前网页的文档对象模型树中节点的类型及节点内容;
指定文字节点获取模块,用于根据所述节点的类型以及节点内容,获取指定文字节点,所述指定文字节点的节点内容包括指定关键字,且所述指定文字节点不是链接型节点;
兄弟链接型节点获取模块,用于获取所述指定文字节点的多个兄弟链接型节点;
指定链接型节点确定模块,用于根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,所述指定链接型节点为所述多个兄弟链接型节点中显示位置坐标与所述指定文字节点之间满足预设规则的节点;
预取模块,用于将指定链接型节点对应的网页内容加载至预设缓存区域。
可选地,所述指定文字节点获取模块用于当根据所述节点的类型以及节点内容确定所述文档对象模型树中不具有用于标识下一页链接的链接型节点时,执行所述获取指定文字节点的步骤。
可选地,所述指定链接型节点确定模块包括:
第一遍历单元,用于遍历所述多个兄弟链接型节点;
第一指定链接型节点确定单元,用于当所述多个兄弟链接型节点中包括第一链接型节点时,将所述第一链接型节点确定为指定链接型节点,所述第一链接型节点的纵坐标与所述指定文件节点的纵坐标相同、所述第一链接型节点的横坐标与所述指定文件节点的横坐标的差值小于第一预设阈值且所述第一链接型节点与所述指定文字节点之间不包括其他链接型节点。
可选地,所述指定链接型节点确定模块包括:
第二遍历单元,用于遍历所述多个兄弟链接型节点;
第二指定链接型节点确定单元,用于当所述多个兄弟链接型节点中包括第二链接型节点时,将所述第二链接型节点确定为指定链接型节点,所述第二链接型节点的纵坐标与所述指定文件节点的纵坐标差值小于第二预设阈值、所述第二链接型节点的纵坐标大于所述指定文件节点的纵坐标、所述第二链接型节点的横坐标与所述指定文件节点的横坐标至少有部分重叠且所述第二链接型节点与所述指定文字节点之间不包括其他链接型节点。
可选地,所述装置还包括:
显示模块,用于当检测到对所述指定链接型节点的点击事件时,将所述预设缓存区域中所加载的所述指定链接型节点对应的网页内容加载在当前网页中进行显示。
可选地,所述装置还包括:
加载模块,用于检测是否接收到运行结束消息,如果未接收到所述运行结束消息时,继续加载网页内容,直到接收到所述运行结束消息。
第三方面,本公开提供了一种终端设备,所述终端设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
检测当前网页的文档对象模型树中节点的类型及节点内容;
根据所述节点的类型以及节点内容,获取指定文字节点,所述指定文字节点的节点内容包括指定关键字,且所述指定文字节点不是链接型节点;
获取所述指定文字节点的多个兄弟链接型节点;
根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,所述指定链接型节点为所述多个兄弟链接型节点中显示位置坐标与所述指定文字节点之间满足预设规则的节点;
将指定链接型节点对应的网页内容加载至预设缓存区域。
本公开提供的技术方案带来的一些有益效果可以包括:
通过对节点内容标识下一页含义、但链接类型不是链接型节点的文字节点的识别,获取与该文字节点对应的链接型节点,进而对链接型节点对应的网页内容进行后台预取,以便提高网页的打开速度,减少用户等待时间。
应该理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
为了更清楚地说明本公开中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图:
图1是本公开的实施例提供的一种网页预取方法示例性流程图;
图2是本公开的实施例提供的一种网页预取方法示例性流程图;
图3是本公开的实施例提供的一种网页预取装置示例性结构示意图;
图4是本公开的实施例提供的一种终端设备示例性结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本公开做进一步详细说明。在此,本公开的示意性实施方式及其说明用于解释本公开,但并不作为对本公开的限定。
本公开的实施例提供一种网页预取方法、装置及终端设备,以下结合附图对本公开进行详细说明。
图1是本公开的实施例提供的一种网页预取方法示例性流程图。本实施例中网页预取方法的执行主体为客户端,该客户端可以为一运行在终端设备上的浏览器,参见图1,该实施例包括:
在步骤101中,检测当前网页的文档对象模型树中节点的类型及节点内容;
在步骤102中,根据该节点的类型以及节点内容,获取指定文字节点,该指定文字节点的节点内容包括指定关键字,且该指定文字节点不是链接型节点;
在步骤103中,获取该指定文字节点的多个兄弟链接型节点;
在步骤104中,根据指定文字节点和该多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,该指定链接型节点为该多个兄弟链接型节点中显示位置坐标与该指定文字节点之间满足预设规则的节点;
在步骤105中,将指定链接型节点对应的网页内容加载至预设缓存区域。
本公开实施例提供的方法,通过对节点内容标识下一页含义、但链接类型不是链接型节点的文字节点的识别,获取与该文字节点对应的链接型节点,进而对链接型节点对应的网页内容进行后台预取,以便提高网页的打开速度,减少用户等待时间。
该方法还包括:
当根据该节点的类型以及节点内容确定该文档对象模型树中不具有用于标识下一页链接的链接型节点时,执行该获取指定文字节点的步骤。
根据指定文字节点和该多个兄弟链接型节点的显示位置坐标,确定指定链接型节点包括:
遍历该多个兄弟链接型节点;
当该多个兄弟链接型节点中包括第一链接型节点时,将该第一链接型节点确定为指定链接型节点,该第一链接型节点的纵坐标与该指定文件节点的纵坐标相同、该第一链接型节点的横坐标与该指定文件节点的横坐标的差值小于第一预设阈值且该第一链接型节点与该指定文字节点之间不包括其他链接型节点。
根据指定文字节点和该多个兄弟链接型节点的显示位置坐标,确定指定链接型节点包括:
遍历该多个兄弟链接型节点;
当该多个兄弟链接型节点中包括第二链接型节点时,将该第二链接型节点确定为指定链接型节点,该第二链接型节点的纵坐标与该指定文件节点的纵坐标差值小于第二预设阈值、该第二链接型节点的纵坐标大于该指定文件节点的纵坐标、该第二链接型节点的横坐标与该指定文件节点的横坐标至少有部分重叠且该第二链接型节点与该指定文字节点之间不包括其他链接型节点。
将指定链接型节点对应的网页内容加载至预设缓存区域之后,该方法还包括:
当检测到对该指定链接型节点的点击事件时,将该预设缓存区域中所加载的该指定链接型节点对应的网页内容加载在当前网页中进行显示。
将指定链接型节点对应的网页内容加载至预设缓存区域之后,该方法还包括:
检测是否接收到运行结束消息,如果未接收到该运行结束消息时,继续加载网页内容,直到接收到该运行结束消息。
图2是本公开的实施例提供的一种网页预取方法示例性流程图。本实施例中网页预取方法的执行主体为客户端,该客户端可以为一运行在终端设备上的浏览器,参见图2,该实施例包括:
在步骤201中,客户端检测当前网页的DOM(Document Object Model,文档对象模型)树中节点的类型及节点内容;
其中,该当前网页可以是由一个较长的内容拆分成的多个网页中的一页,也可以是不存在页码顺序的网页,如新闻网页、博客、社区空间中的页面等,本实施例不作具体限定。
其中,本实施例中,该节点的类型至少包括链接型节点和文字节点。该链接型节点的判定方法可以为当用户通过人机交互界面点击该节点显示的文本内容时,界面会响应用户的点击事件,比如进入任何其它链接网页,弹出任何提示消息或者对话框,则认为该节点为链接型节点,否则认为该节点不是链接型节点。
其中,节点内容是指当前节点的文本内容。
在本发明实施例中,客户端加载当前页面后,根据当前网页的源代码生成对应的DOM树,该DOM树中包括至少一个根节点和该根节点的多个后代节点,各个节点包括当前网页的源代码中元素、超链接引用属性和节点内容,通过检测各个节点以获取节点的类型及节点内容。
在步骤202中,根据该节点的类型以及节点内容,客户端判断该DOM树中是否具有用于标识下一页链接的链接型节点;
如果是,结束;
如果否,执行步骤203。
在本发明实施例中,客户端根据该节点的类型以及节点内容,判断该DOM树中是否具有用于标识下一页链接的链接型节点。当该节点的类型为链接型节点,且节点内容为“余下全文”、“查看剩余内容”、“next page”等标识下一页含义的文本内容时,确定该DOM树中具有用于标识下一页链接的链接型节点;当该节点的类型不是链接型节点或者节点内容不是“余下全文”、“查看剩余内容”、“next page”等标识下一页含义的文本内容时,确定该DOM树中不具有用于标识下一页链接的链接型节点。
在步骤203中,当该DOM树中不具有用于标识下一页链接的链接型节点时,客户端根据该节点的类型以及节点内容,获取指定文字节点;
其中,该指定文字节点的节点类型不是链接型节点,且该指定文字节点的节点内容包括指定关键字,该指定关键字为“余下全文”、“查看剩余内容”、“next page”等标识下一页含义的文本内容。
在步骤204中,客户端获取该指定文字节点的多个兄弟链接型节点;
其中,该兄弟链接型节点的链接类型为链接型节点,且该兄弟链接型节点为指定文字节点的兄弟节点。本领域技术人员可以获知,兄弟节点为具有相同父节点的节点,对于本发明实施例来说,该指定文字节点的多个兄弟链接型节点为与该指定文字节点具有相同父节点的链接型节点。
在本发明实施例中,客户端可以是通过调用相关函数获取该指定文字节点的多个兄弟链接型节点,如jQuery.siblings()函数等,本实施例不作具体限定。
在步骤205中,客户端根据指定文字节点和该多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,该指定链接型节点为该多个兄弟链接型节点中显示位置坐标与该指定文字节点之间满足预设规则的节点;
本领域技术人员可以获知,每个HTML(Hypertext Marked Language,超文本标记语言)页面对应于一颗DOM树和Render树,DOM用于描述HTML页面的信息,而Render树则用于布局,具体负责HTML页面如何显示。
在本发明实施例中,客户端可以通过读取Render树,获取该指定文字节点和该多个兄弟节点的显示位置坐标,该显示位置坐标包括横坐标和纵坐标。
在本发明实施例中,步骤205包括以下实施方式:客户端遍历该多个兄弟链接型节点,当该多个兄弟链接型节点中包括第一链接型节点时,将该第一链接型节点确定为指定链接型节点。
其中,该第一链接型节点的纵坐标与该指定文件节点的纵坐标相同、该第一链接型节点的横坐标与该指定文件节点的横坐标的差值小于第一预设阈值且该第一链接型节点与该指定文字节点之间不包括其他链接型节点。该第一预设阈值可由技术人员设置,本实施例不作具体限定,在本发明实施例中,该第一预设阈值可以为4-6个字节(2~3个字)的宽度。
在本发明实施例中,客户端可以通过读取Render树获取该指定文字节点和该多个兄弟链接型节点的显示位置坐标,根据该指定文字节点和该多个兄弟链接型节点的显示位置坐标,确定指定链接型节点。当该多个兄弟链接型节点中的第一链接型节点的纵坐标与该指定文件节点的纵坐标相同,该第一链接型节点的横坐标与该指定文件节点的横坐标的差值小于第一预设阈值且该第一链接型节点与该指定文字节点之间不包括其他链接型节点,即在显示屏幕中,在纵坐标方向上该第一链接型节点与该指定文字节点的位于同一行,在横坐标方向上该第一链接型节点位于该指定文字节点第一预设阈值范围内且该第一链接型节点与该指定文字节点之间不包括其他链接型节点,则将该第一链接型节点确定为指定链接型节点。
在一个实施例中,步骤205还可以包括以下实施方式:当客户端遍历该多个兄弟链接型节点,未查找到该第一链接型节点时,判断该多个兄弟链接型节点中是否包括第二链接型节点,当该多个兄弟链接型节点中包括第二链接型节点时,将该第二链接型节点确定为指定链接型节点。
其中,该第二链接型节点的纵坐标与该指定文件节点的纵坐标差值小于第二预设阈值、该第二链接型节点的纵坐标大于该指定文件节点的纵坐标、该第二链接型节点的横坐标与该指定文件节点的横坐标至少有部分重叠且该第二链接型节点与该指定文字节点之间不包括其他链接型节点。其中,该第二预设阈值可由技术人员设置,本实施例不作具体限定,在一个实施例中,该第二预设阈值可以为当前行间距。该第二链接型节点的横坐标与指定文件节点的横坐标至少有部分重叠,则保证该第二链接型节点在指定文件节点的正下方。
在本发明实施例中,当客户端根据该指定文字节点和该多个兄弟链接型节点的显示位置坐标,遍历该多个兄弟链接型节点,未查找到该第一链接型节点时,客户端可以再次遍历该多个兄弟链接型节点,当该多个兄弟链接型节点中的第二链接型节点的纵坐标与该指定文件节点的纵坐标差值小于第二预设阈值,该第二链接型节点的纵坐标大于该指定文件节点的纵坐标、第二链接型节点的横坐标与该指定文件节点的横坐标至少有部分重叠且该第二链接型节点与该指定文字节点之间不包括其他链接型节点时,即在显示屏幕中,在纵坐标方向上该第二链接型节点位于该指定文字节下方第二预设阈值范围内,在横坐标方向该第二链接型节点位于该指定文字节点第三阈值范围内且该第一链接型节点与该指定文字节点之间不包括其他链接型节点将该第二链接型节点确定为指定链接型节点,则将该第一链接型节点确定为指定链接型节点。
在步骤206中,客户端将指定链接型节点对应的网页内容加载至预设缓存区域;
在本发明实施例中,当识别出DOM树中某一节点为指定链接型节点时,客户端可以运行该指定链接型节点的onClick()函数,相当于用户通过操作界面点击该指定链接型节点,从而运行javascript脚本,将该指定链接型节点对应的网页内容加载至预设缓存区域;客户端也可以调用对应的内容预读程序,将该指定链接型节点对应的网页内容加载至预设缓存区域。
在步骤207中,客户端检测是否接收到运行结束消息,如果未接收到该运行结束消息时,继续加载网页内容,直到接收到该运行结束消息;
在本发明实施例中,本实施例中结束消息可以为didFinishLoading()消息。当接收到该didFinishLoading()消息时,认为该链接型节点对应的网页内容加载完毕,结束加载网页内容;当未接收;到该didFinishLoading()消息时,认为该链接型节点对应的网页内容加载未完成,继续加载网页内容。
在步骤208中,当检测到对该指定链接型节点的点击事件时,客户端将该预设缓存区域中所加载的该指定链接型节点对应的网页内容加载在当前网页中进行显示。
在本发明实施例中,当加载完指定链接型节点对应的网页内容后,检测到对该指定链接型节点的点击事件时,客户端可以将缓存区域所预取的内容加载到当前网页中,显示新的网页,也可以打开该指定链接型节点对应的URL(Uniform Resource Locator,统一资源定位符)链接网页,并将缓存区域所预取的内容加载在该打开的URL链接网页中,本实施例不做具体限定。
本公开实施例提供的方法,通过对节点内容标识下一页含义、但链接类型不是链接型节点的文字节点的识别,获取与该文字节点对应的链接型节点,进而对链接型节点对应的网页内容进行后台预取,以便提高网页的打开速度,减少用户等待时间。
图3是本公开的实施例提供的一种网页预取装置示例性结构示意图。参见图3,该装置包括:检测模块301、指定文字节点获取模块302、兄弟链接型节点获取模块303、指定链接型节点确定模块304、预取模块305。
检测模块301用于检测当前网页的文档对象模型树中节点的类型及节点内容;检测模块301与指定文字节点获取模块302连接,指定文字节点获取模块302用于根据该节点的类型以及节点内容,获取指定文字节点,该指定文字节点的节点内容包括指定关键字,且该指定文字节点不是链接型节点;指定文字节点获取模块302与兄弟链接型节点获取模块303连接,兄弟链接型节点获取模块303用于获取该指定文字节点的多个兄弟链接型节点;兄弟链接型节点获取模块303与指定链接型节点确定模块304连接,指定链接型节点确定模块304用于根据指定文字节点和该多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,该指定链接型节点为该多个兄弟链接型节点中显示位置坐标与该指定文字节点之间满足预设规则的节点;指定链接型节点确定模块304与预取模块305连接,预取模块305用于将指定链接型节点对应的网页内容加载至预设缓存区域。
该指定文字节点获取模块303用于当根据该节点的类型以及节点内容确定该文档对象模型树中不具有用于标识下一页链接的链接型节点时,执行该获取指定文字节点的步骤。
该指定链接型节点确定模块304包括:第一遍历单元,用于遍历该多个兄弟链接型节点;第一指定链接型节点确定单元,用于当该多个兄弟链接型节点中包括第一链接型节点时,将该第一链接型节点确定为指定链接型节点,该第一链接型节点的纵坐标与该指定文件节点的纵坐标相同、该第一链接型节点的横坐标与该指定文件节点的横坐标的差值小于第一预设阈值且该第一链接型节点与该指定文字节点之间不包括其他链接型节点。
该指定链接型节点确定模块304包括:第二遍历单元,用于遍历该多个兄弟链接型节点;第二指定链接型节点确定单元,用于当该多个兄弟链接型节点中包括第二链接型节点时,将该第二链接型节点确定为指定链接型节点,该第二链接型节点的纵坐标与该指定文件节点的纵坐标差值小于第二预设阈值、该第二链接型节点的纵坐标大于该指定文件节点的纵坐标、该第二链接型节点的横坐标与该指定文件节点的横坐标至少有部分重叠且该第二链接型节点与该指定文字节点之间不包括其他链接型节点。
该装置还包括:显示模块,用于当检测到对该指定链接型节点的点击事件时,将该预设缓存区域中所加载的该指定链接型节点对应的网页内容加载在当前网页中进行显示。
该装置还包括:加载模块,用于检测是否接收到运行结束消息,如果未接收到该运行结束消息时,继续加载网页内容,直到接收到该运行结束消息。
本公开实施例提供的装置,通过对节点内容标识下一页含义、但链接类型不是链接型节点的文字节点的识别,获取与该文字节点对应的链接型节点,进而对链接型节点对应的网页内容进行后台预取,以便提高网页的打开速度,减少用户等待时间。
图4是本公开的实施例提供的一种终端设备示例性结构示意图。参见图4,该终端可以用于实施上述实施例中提供的方法。
终端设备400可以包括通信单元110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、WIFI(Wireless Fidelity,无线保真)模块170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解,图中示出的终端设备结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
通信单元110可用于收发信息或通话过程中,信号的接收和发送,该通信单元110可以为RF(Radio Frequency,射频)电路、路由器、调制解调器、等网络通信设备。特别地,当通信单元110为RF电路时,将基站的下行信息接收后,交由一个或者一个以上处理器180处理;另外,将涉及上行的数据发送给基站。通常,作为通信单元的RF电路包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,通信单元110还可以通过无线通信与网络和其他设备通信。该无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端设备400的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。在一个实施例中,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。在一个实施例中,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端设备400的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-EmittingDiode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图4中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
终端设备400还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在终端设备400移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端设备400还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器161,传声器162可提供用户与终端设备400之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一终端设备,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与终端设备400的通信。
为了实现无线通信,该终端设备上可以配置有无线通信单元170,该无线通信单元170可以为WIFI模块。WIFI属于短距离无线传输技术,终端设备400通过无线通信单元170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图中示出了无线通信单元170,但是可以理解的是,其并不属于终端设备400的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是终端设备400的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端设备400的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
终端设备400还包括给各个部件供电的电源190(比如电池)。在一个实施例中,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端设备400还可以包括摄像头、蓝牙模块等,在此不再赘述。在本实施例中,终端设备还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
检测当前网页的文档对象模型树中节点的类型及节点内容;
根据该节点的类型以及节点内容,获取指定文字节点,该指定文字节点的节点内容包括指定关键字,且该指定文字节点不是链接型节点;
获取该指定文字节点的多个兄弟链接型节点;
根据指定文字节点和该多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,该指定链接型节点为该多个兄弟链接型节点中显示位置坐标与该指定文字节点之间满足预设规则的节点;
将指定链接型节点对应的网页内容加载至预设缓存区域。
存储器还包括进行以下操作的指令:
当根据该节点的类型以及节点内容确定该文档对象模型树中不具有用于标识下一页链接的链接型节点时,执行该获取指定文字节点的步骤。
存储器还包括进行以下操作的指令:
遍历该多个兄弟链接型节点;
当该多个兄弟链接型节点中包括第一链接型节点时,将该第一链接型节点确定为指定链接型节点,该第一链接型节点的纵坐标与该指定文件节点的纵坐标相同、该第一链接型节点的横坐标与该指定文件节点的横坐标的差值小于第一预设阈值且该第一链接型节点与该指定文字节点之间不包括其他链接型节点。
存储器还包括进行以下操作的指令:
遍历该多个兄弟链接型节点;
当该多个兄弟链接型节点中包括第二链接型节点时,将该第二链接型节点确定为指定链接型节点,该第二链接型节点的纵坐标与该指定文件节点的纵坐标差值小于第二预设阈值、该第二链接型节点的纵坐标大于该指定文件节点的纵坐标、该第二链接型节点的横坐标与该指定文件节点的横坐标至少有部分重叠且该第二链接型节点与该指定文字节点之间不包括其他链接型节点。
存储器还包括进行以下操作的指令:
当检测到对该指定链接型节点的点击事件时,将该预设缓存区域中所加载的该指定链接型节点对应的网页内容加载在当前网页中进行显示。
存储器还包括进行以下操作的指令:
检测是否接收到运行结束消息,如果未接收到该运行结束消息时,继续加载网页内容,直到接收到该运行结束消息。
此外,典型地,本公开所述的终端设备可为各种手持终端设备,例如手机、个人数字助理(PDA)等,因此本公开的保护范围不应限定为某种特定类型的移动终端。
此外,根据本公开的方法还可以被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本公开的方法中限定的上述功能。
此外,上述方法步骤以及系统单元也可以利用控制器、以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储设备实现。
此外,应该明白的是,本文所述的计算机可读存储设备(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)或快闪存储器。易失性存储器可以包括随机存取存储器(RAM),该RAM可以充当外部高速缓存存储器。作为例子而非限制性的,RAM可以以多种形式获得,比如同步RAM(DRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)以及直接RambusRAM(DRRAM)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现所述的功能,但是这种实现决定不应被解释为导致脱离本公开的范围。
结合这里的公开所描述的各种示例性逻辑块、模块可以利用被设计成用于执行这里所述功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或任何其它这种配置。
结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,所述存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
在一个或多个示例性设计中,所述功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将所述功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DSL或诸如红外先、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
尽管前面公开的内容示出了本公开的示例性实施例,但是应当注意,在不背离权利要求限定的本公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本公开的元素可以以个体形式描述或要求,但是也可以设想多个,除非明确限制为单数。
以上所述的具体实施方式,对本公开的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本公开的具体实施方式而已,并不用于限定本公开的保护范围,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (13)
1.一种网页预取方法,其特征在于,所述方法包括:
检测当前网页的文档对象模型树中节点的类型及节点内容;
根据所述节点的类型以及节点内容,获取指定文字节点,所述指定文字节点的节点内容包括指定关键字,且所述指定文字节点不是链接型节点;
获取所述指定文字节点的多个兄弟链接型节点;
根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,所述指定链接型节点为所述多个兄弟链接型节点中显示位置坐标与所述指定文字节点之间满足预设规则的节点;
将指定链接型节点对应的网页内容加载至预设缓存区域。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当根据所述节点的类型以及节点内容确定所述文档对象模型树中不具有用于标识下一页链接的链接型节点时,执行所述获取指定文字节点的步骤。
3.根据权利要求1所述的方法,其特征在于,根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点包括:
遍历所述多个兄弟链接型节点;
当所述多个兄弟链接型节点中包括第一链接型节点时,将所述第一链接型节点确定为指定链接型节点,所述第一链接型节点的纵坐标与所述指定文件节点的纵坐标相同、所述第一链接型节点的横坐标与所述指定文件节点的横坐标的差值小于第一预设阈值且所述第一链接型节点与所述指定文字节点之间不包括其他链接型节点。
4.根据权利要求1所述的方法,其特征在于,根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点包括:
遍历所述多个兄弟链接型节点;
当所述多个兄弟链接型节点中包括第二链接型节点时,将所述第二链接型节点确定为指定链接型节点,所述第二链接型节点的纵坐标与所述指定文件节点的纵坐标差值小于第二预设阈值、所述第二链接型节点的纵坐标大于所述指定文件节点的纵坐标、所述第二链接型节点的横坐标与所述指定文件节点的横坐标至少有部分重叠且所述第二链接型节点与所述指定文字节点之间不包括其他链接型节点。
5.根据权利要求1所述的方法,其特征在于,将指定链接型节点对应的网页内容加载至预设缓存区域之后,所述方法还包括:
当检测到对所述指定链接型节点的点击事件时,将所述预设缓存区域中所加载的所述指定链接型节点对应的网页内容加载在当前网页中进行显示。
6.根据权利要求1所述的方法,其特征在于,将指定链接型节点对应的网页内容加载至预设缓存区域之后,所述方法还包括:
检测是否接收到运行结束消息,如果未接收到所述运行结束消息时,继续加载网页内容,直到接收到所述运行结束消息。
7.一种网页预取装置,其特征在于,所述装置包括:
检测模块,用于检测当前网页的文档对象模型树中节点的类型及节点内容;
指定文字节点获取模块,用于根据所述节点的类型以及节点内容,获取指定文字节点,所述指定文字节点的节点内容包括指定关键字,且所述指定文字节点不是链接型节点;
兄弟链接型节点获取模块,用于获取所述指定文字节点的多个兄弟链接型节点;
指定链接型节点确定模块,用于根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,所述指定链接型节点为所述多个兄弟链接型节点中显示位置坐标与所述指定文字节点之间满足预设规则的节点;
预取模块,用于将指定链接型节点对应的网页内容加载至预设缓存区域。
8.根据权利要求7所述的装置,其特征在于,所述指定文字节点获取模块用于当根据所述节点的类型以及节点内容确定所述文档对象模型树中不具有用于标识下一页链接的链接型节点时,执行所述获取指定文字节点的步骤。
9.根据权利要求7所述的装置,其特征在于,所述指定链接型节点确定模块包括:
第一遍历单元,用于遍历所述多个兄弟链接型节点;
第一指定链接型节点确定单元,用于当所述多个兄弟链接型节点中包括第一链接型节点时,将所述第一链接型节点确定为指定链接型节点,所述第一链接型节点的纵坐标与所述指定文件节点的纵坐标相同、所述第一链接型节点的横坐标与所述指定文件节点的横坐标的差值小于第一预设阈值且所述第一链接型节点与所述指定文字节点之间不包括其他链接型节点。
10.根据权利要求7所述的装置,其特征在于,所述指定链接型节点确定模块包括:
第二遍历单元,用于遍历所述多个兄弟链接型节点;
第二指定链接型节点确定单元,用于当所述多个兄弟链接型节点中包括第二链接型节点时,将所述第二链接型节点确定为指定链接型节点,所述第二链接型节点的纵坐标与所述指定文件节点的纵坐标差值小于第二预设阈值、所述第二链接型节点的纵坐标大于所述指定文件节点的纵坐标、所述第二链接型节点的横坐标与所述指定文件节点的横坐标至少有部分重叠且所述第二链接型节点与所述指定文字节点之间不包括其他链接型节点。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
显示模块,用于当检测到对所述指定链接型节点的点击事件时,将所述预设缓存区域中所加载的所述指定链接型节点对应的网页内容加载在当前网页中进行显示。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
加载模块,用于检测是否接收到运行结束消息,如果未接收到所述运行结束消息时,继续加载网页内容,直到接收到所述运行结束消息。
13.一种终端设备,其特征在于,所述终端设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
检测当前网页的文档对象模型树中节点的类型及节点内容;
根据所述节点的类型以及节点内容,获取指定文字节点,所述指定文字节点的节点内容包括指定关键字,且所述指定文字节点不是链接型节点;
获取所述指定文字节点的多个兄弟链接型节点;
根据指定文字节点和所述多个兄弟链接型节点的显示位置坐标,确定指定链接型节点,所述指定链接型节点为所述多个兄弟链接型节点中显示位置坐标与所述指定文字节点之间满足预设规则的节点;
将指定链接型节点对应的网页内容加载至预设缓存区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310499825.8A CN103617164B (zh) | 2013-10-22 | 2013-10-22 | 网页预取方法、装置及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310499825.8A CN103617164B (zh) | 2013-10-22 | 2013-10-22 | 网页预取方法、装置及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103617164A true CN103617164A (zh) | 2014-03-05 |
CN103617164B CN103617164B (zh) | 2017-02-01 |
Family
ID=50167867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310499825.8A Active CN103617164B (zh) | 2013-10-22 | 2013-10-22 | 网页预取方法、装置及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103617164B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104111980A (zh) * | 2014-06-26 | 2014-10-22 | 小米科技有限责任公司 | 网页内容的提取方法、装置和终端 |
CN104156458A (zh) * | 2014-08-20 | 2014-11-19 | 百度在线网络技术(北京)有限公司 | 一种信息的提取方法及装置 |
CN105095356A (zh) * | 2015-06-24 | 2015-11-25 | 安一恒通(北京)科技有限公司 | 一种浏览器中视图的切换方法及装置 |
CN107451160A (zh) * | 2016-06-01 | 2017-12-08 | 广州市动景计算机科技有限公司 | 一种页面预读方法及装置 |
CN108446285A (zh) * | 2017-02-16 | 2018-08-24 | 北京国双科技有限公司 | 网站正文提取的方法和装置 |
WO2019205365A1 (zh) * | 2018-04-27 | 2019-10-31 | 平安科技(深圳)有限公司 | 加载dom节点数据的方法、装置、计算机设备及存储介质 |
CN114968513A (zh) * | 2016-12-13 | 2022-08-30 | 谷歌有限责任公司 | 用于预取内容项的系统和方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050198191A1 (en) * | 2004-01-13 | 2005-09-08 | International Business Machines Corporation | System and method for prefetching web resources based on proxy triggers |
CN101937438A (zh) * | 2009-06-30 | 2011-01-05 | 富士通株式会社 | 网页内容提取方法和装置 |
CN102222086A (zh) * | 2011-05-18 | 2011-10-19 | 广州市动景计算机科技有限公司 | 基于移动终端的网页阅读方法、网页阅读装置及移动终端 |
CN102236658A (zh) * | 2010-04-26 | 2011-11-09 | 富士通株式会社 | 网页内容提取方法和装置 |
US8326923B1 (en) * | 2008-07-08 | 2012-12-04 | F5 Networks, Inc. | Smart prefetching of data over a network |
CN102915361A (zh) * | 2012-10-18 | 2013-02-06 | 北京理工大学 | 一种基于文字分布特征的网页正文提取方法 |
-
2013
- 2013-10-22 CN CN201310499825.8A patent/CN103617164B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050198191A1 (en) * | 2004-01-13 | 2005-09-08 | International Business Machines Corporation | System and method for prefetching web resources based on proxy triggers |
US8326923B1 (en) * | 2008-07-08 | 2012-12-04 | F5 Networks, Inc. | Smart prefetching of data over a network |
CN101937438A (zh) * | 2009-06-30 | 2011-01-05 | 富士通株式会社 | 网页内容提取方法和装置 |
CN102236658A (zh) * | 2010-04-26 | 2011-11-09 | 富士通株式会社 | 网页内容提取方法和装置 |
CN102222086A (zh) * | 2011-05-18 | 2011-10-19 | 广州市动景计算机科技有限公司 | 基于移动终端的网页阅读方法、网页阅读装置及移动终端 |
CN102915361A (zh) * | 2012-10-18 | 2013-02-06 | 北京理工大学 | 一种基于文字分布特征的网页正文提取方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104111980A (zh) * | 2014-06-26 | 2014-10-22 | 小米科技有限责任公司 | 网页内容的提取方法、装置和终端 |
CN104111980B (zh) * | 2014-06-26 | 2017-07-28 | 小米科技有限责任公司 | 网页内容的提取方法、装置和终端 |
CN104156458A (zh) * | 2014-08-20 | 2014-11-19 | 百度在线网络技术(北京)有限公司 | 一种信息的提取方法及装置 |
CN104156458B (zh) * | 2014-08-20 | 2017-09-22 | 北京小度互娱科技有限公司 | 一种信息的提取方法及装置 |
CN105095356A (zh) * | 2015-06-24 | 2015-11-25 | 安一恒通(北京)科技有限公司 | 一种浏览器中视图的切换方法及装置 |
CN107451160A (zh) * | 2016-06-01 | 2017-12-08 | 广州市动景计算机科技有限公司 | 一种页面预读方法及装置 |
CN114968513A (zh) * | 2016-12-13 | 2022-08-30 | 谷歌有限责任公司 | 用于预取内容项的系统和方法 |
CN108446285A (zh) * | 2017-02-16 | 2018-08-24 | 北京国双科技有限公司 | 网站正文提取的方法和装置 |
CN108446285B (zh) * | 2017-02-16 | 2020-10-27 | 北京国双科技有限公司 | 网站正文提取的方法和装置 |
WO2019205365A1 (zh) * | 2018-04-27 | 2019-10-31 | 平安科技(深圳)有限公司 | 加载dom节点数据的方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103617164B (zh) | 2017-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106970790B (zh) | 一种应用程序创建的方法、相关设备及系统 | |
CN103617164A (zh) | 网页预取方法、装置及终端设备 | |
CN103543913A (zh) | 一种终端设备操作方法、装置和终端设备 | |
CN105320687A (zh) | 网页显示方法及装置 | |
CN105095432A (zh) | 网页批注显示方法及装置 | |
US9792019B2 (en) | Method and terminal device for selecting character | |
CN103399866A (zh) | 一种网络页面的渲染方法、装置及设备 | |
CN103678502B (zh) | 信息收藏方法和装置 | |
CN103702297A (zh) | 短信增强方法、装置及系统 | |
CN103605668A (zh) | 网页书签的存储方法、装置及移动终端 | |
CN104572430A (zh) | 一种终端应用界面的测试方法、装置和系统 | |
CN103699292A (zh) | 一种进入文本选择模式的方法和装置 | |
CN103593333A (zh) | 一种电子书文档的处理方法、终端及电子设备 | |
CN103677564B (zh) | 滑动操作响应方法、装置及终端设备 | |
CN103513987A (zh) | 一种浏览器网页的渲染处理方法、装置及终端设备 | |
CN104281600A (zh) | 智能选词的方法和装置 | |
CN104104711A (zh) | 阅读历史处理方法和装置 | |
CN103747130A (zh) | 一种终端设备的控制方法、装置及终端设备 | |
CN103607431B (zh) | 移动终端资源处理方法、装置和设备 | |
CN103605454A (zh) | 一种错误提示的方法、装置及终端设备 | |
CN103631625A (zh) | 一种数据获取的方法、用户端、服务器及系统 | |
CN104751092A (zh) | 图形码处理方法及装置 | |
CN103823851B (zh) | 网页显示方法和装置 | |
CN104750730A (zh) | 一种浏览器显示方法,及装置 | |
CN103699577A (zh) | 一种页面显示加速方法、装置及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |