CN100476829C - 一种截取网页内容的方法 - Google Patents

一种截取网页内容的方法 Download PDF

Info

Publication number
CN100476829C
CN100476829C CNB2007100728610A CN200710072861A CN100476829C CN 100476829 C CN100476829 C CN 100476829C CN B2007100728610 A CNB2007100728610 A CN B2007100728610A CN 200710072861 A CN200710072861 A CN 200710072861A CN 100476829 C CN100476829 C CN 100476829C
Authority
CN
China
Prior art keywords
intercepting
target
web page
page contents
following process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2007100728610A
Other languages
English (en)
Other versions
CN101021872A (zh
Inventor
林峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jin Guangzhe
Original Assignee
Shenzhen City Guangmang Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen City Guangmang Science & Technology Co Ltd filed Critical Shenzhen City Guangmang Science & Technology Co Ltd
Priority to CNB2007100728610A priority Critical patent/CN100476829C/zh
Publication of CN101021872A publication Critical patent/CN101021872A/zh
Application granted granted Critical
Publication of CN100476829C publication Critical patent/CN100476829C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种截取网页内容的方法,包括如下步骤:A.用户选择截取目标;B.根据截取目标获取网页内容;C.将获取的网页内容保存到磁盘;所述步骤B包含如下过程:B1.判断步骤A中的所述截取目标是否包含屏幕不可见部分,如不是则转入步骤C,否则继续下一步;B2.计算并获取所述截取目标所包含区域的网页内容后转入步骤C。本发明的截取网页内容的方法,可以根据用户的选择而截取到屏幕不可见部分的网页内容,从而避免了需要一屏一屏的截取网页内容,方便了用户。

Description

一种截取网页内容的方法
技术领域
本发明涉及网络技术领域,具体地说涉及一种截取网页内容的方法。
背景技术
网络上的资源非常丰富,当用户浏览网页时经常会遇到一些感兴趣的内容,如何将这些内容有选择性地保存下来,非常实用。现在一般的截取方式为包括使用屏幕打印键(print screen)进行全屏拷贝;或者利用一些工具软件比如即时聊天工具QQ,它带有截取网页内容的工具,提供对当前全屏区域内的任意区域进行选择性的截取,但是它们都不能截取滚动页面中没有显示出来的内容,即对于滚动页面中由于屏幕尺寸限制而暂时不可见的部分无法进行截取。为了得到滚屏中的内容,往往是采用多次截取,然后拼凑在一起的方法,这样操作比较麻烦。
发明内容
本发明就是为了克服以上的不足,提出了一种截取网页内容的方法,该方法可以根据用户选择而截取到屏幕中不可见部分的网页内容。
为实现上述目的,本发明的截取网页内容的方法包括如下步骤:A、用户选择截取目标;B、根据截取目标获取网页内容;C、将获取的网页内容保存到磁盘;所述步骤B包含如下过程:B1、判断步骤A中的所述截取目标是否包含屏幕不可见部分,如不是则转入步骤C,否则继续下一步;B2、计算并获取所述截取目标所包含区域的网页内容后转入步骤C;其中,所述步骤B2包含如下过程:B21、计算获取截取目标屏幕可见部分图像并保存到内存;B22、计算截取目标可滚动的下一步位置并将截取目标进行滚动从而得到截取目标的屏幕不可见部分;B23、判断截取目标是否可继续滚动,如是则保存图像到内存后转入B22,否则转入步骤C;所述步骤B21包含如下过程:B211、获取截取目标的区域数据;B212、定义一位置和大小与目标区域相同的临时区域;B213、将截取目标的屏幕可见部分与临时区域取交集并根据结果更新临时区域;B214、获取更新后的临时区域相对于截取目标区域的位置;B215、将更新后的临时区域中对应的图像按上步得到的位置存入内存。
当所述步骤A为单元截图方式时,所述步骤B1还包含如下过程:B11、保存截取目标元素及其位置信息至一数组;B12、获取截取目标父元素及其位置信息并保存至所述数组;B13、将前述两步保存的元素滚动到正好可显示截取目标元素的位置。
所述步骤B213和B22是通过遍历所述数组来实现的。
当所述步骤A为滚动窗口截图方式时,其包含如下过程:A1、用户选择滚动截图方式;A2、向对应页面边界方向自动滚动页面;A3、确定截图区域;A4、获取当前网页的html或body。
当所述步骤A为滚动窗口截图方式时,所述步骤B1还包含如下过程:首先保存截取目标元素及其当前滚动位置信息;其次将目标元素滚动到正好可显示目标元素的位置。
本发明的截取网页内容的方法,可以根据用户的选择而截取到屏幕不可见部分的网页内容,从而避免了需要一屏一屏的截取网页内容,方便了用户。
本发明的特征及优点将通过实施例结合附图进行详细说明。
附图说明
图1是本发明实施例一的单元截图方式的流程图;
图2是本发明实施例一流程中步骤S的流程图;
图3是本发明实施例一中目标元素与当前元素区域关系示意图;
图4是本发明实施例二的滚动窗口截图方式的流程图。
具体实施方式
本发明的截取网页内容的方法的实施例一如图1所示,其为单元截图方式。首先,用户选择进入单元截图状态,确定截图单元目标。这里的单元指的是网页上的一块特定区域,其大小并不限定。一般网页都是由图片和文字等多种元素综合构成,例如在网页的某一区域为一新闻栏,而在该新闻栏中又包含多条新闻标题,当我们选择某一新闻标题时,该新闻标题的区域称为一个单元,而当我们选定的为新闻栏时,则该新闻栏的区域称为一个单元。根据鼠标所处的位置获取相应的网页元素后判断元素是否可滚动,也即判断是否截取目标包含不可见的区域,例如以上述新闻栏为例,用户现时所处的网页位置只包含该新闻栏的一部分,这时用户选择了该新闻栏作为截取目标,则首先保存该新闻栏的元素及其显示部分相对于整个新闻栏的位置信息到数组A中,此时新闻栏被称为目标元素。之后获取父元素,这是因为在网页编程中采用的是一种层次化的编程方式,可以这样理解这种编程方式,例如上述新闻栏相对于下层的新闻条来说是新闻条的父元素,而整个网页相对于新闻栏来说是新闻栏的父元素,当然实际的网页编程并非一定如此对应,可能某条新闻标题的实际上层指向并非是上述的新闻栏,这里只是更清楚的说明父元素的含义是指选定的目标元素在网页编程源程序中的上层元素。同时实际上也并非只是上述这样新闻标题-新闻栏-网页这样的三层结构,因此需要循环判断直到得到目标元素的顶层元素。在循环中每次获取的父元素同样也要进行判断是否可滚动并记录其元素和滚动位置的上述步骤。然后遍历数组A,将其中的元素滚动到初始位置,即正好可以显示目标元素的位置,其过程如图2所示,通过计算显示区域的位置与其初始位置的偏移量不断滚动元素直至元素滚动到初始位置。此后开始计算截取区域并保存图像到内存,这其中包括如下过程:首先获取目标元素的区域数据,接着定义一个等于目标区域的临时区域B,它记录了目标元素区域的左上角坐标和整个区域的宽度和高度。然后遍历数组A中的元素,每遍历到的一个将对其进行操作的元素称为当前元素。其与目标元素的位置关系如图3所示,从前述可知,这些元素包括显示部分和不可见部分。首先取当前元素的显示区域,将此区域与区域B取交集并将结果更新到区域B,对每次遍历到的元素进行同样的更新操作直到遍历结束。此时获取区域B相对于目标元素区域的位置(对区域B左上进行坐标转换即可得到)并将区域B中的图像保存到内存中。
下一步类似区域B,定义一个临时区域E,遍历数组A,判断遍历到的元素是否可滚动,如是则进行滚动,此后类似区域B的操作一样不断更新区域E直到找不到至少一个可进行下一步滚动的元素为止,由于受到区域E和每次操作的当前元素的区域大小的限制,对于一个可滚动的元素来说,可能不能在一次滚动中完成整个元素的获取,因此对于一个元素可能要通过滚动程序中设定的元素指针F在每次操作后指向该元素的下一个位置,计算此次滚动得到的区域并保存图像到内存,再循环进行前述不断更新区域E的操作。当遍历数组A再也找不到至少一个可进行下一步滚动的元素之后,将内存中的图像保存到磁盘然后遍历数组A将每个元素恢复到原来的滚动位置。
本发明的实施例如图2所示,其为滚动窗口截图方式。当用户选择进入这种模式时,首先判断鼠标是否处于网页页面边界区域的位置,之后向对应的页面边界方向自动滚动页面。然后确定截图区域,获取当前的网页的html或body作为目标元素。Html或body为网页编程当中的命令,用于界定网页当中的元素,其用法为网页编程人员所熟知。此后的步骤基本与单元截图方式相似,即首先判断元素是否可滚动,然后保存目标元素及其当前滚动目标位置信息,将元素滚动到起始位置,接着同单元截图方式类似,通过建立临时区域并不断更新的方法获取目标元素的屏幕可见部分及其相对目标元素的位置保存到内存中;然后计算元素可以进行下一步可以滚动的水平和或垂直滚动偏移量,取最小值(目标元素的宽/高,通过目标元素当前显示区域右/下-目标元素总区域右/下这一计算式来获取)。此后判断目标元素是否可继续下一步滚动,如是重复上述滚动获取过程,否则则说明已经完全得到用户选择的截取目标,这时将内存中的位图保存到磁盘上,最后将目标元素恢复到原始的滚动位置。
本发明的截取网页内容的方法,在单元截图方式时可自动获取用户选择单元中包含的屏幕不可见部分的内容,在滚动窗口截图方式时,可根据用户鼠标滚动不断滚屏获取网页内容,从而获取到一屏无法完全显示的网页内容。方便了用户对网页内容的截取。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (6)

1.一种截取网页内容的方法,包括如下步骤:A、用户选择截取目标;B、根据截取目标获取网页内容;C、将获取的网页内容保存到磁盘;其特征在于,所述步骤B包含如下过程:B1、判断步骤A中的所述截取目标是否包含屏幕不可见部分,如不是则转入步骤C,否则继续下一步;B2、计算并获取所述截取目标所包含区域的网页内容后转入步骤C;所述步骤B2包含如下过程:B21、计算获取截取目标屏幕可见部分图像并保存到内存;B22、计算截取目标可滚动的下一步位置并将截取目标进行滚动从而得到截取目标的屏幕不可见部分;B23、判断截取目标是否可继续滚动,如是则保存图像到内存后转入B22,否则转入步骤C;所述步骤B21包含如下过程:B211、获取截取目标的区域数据;B212、定义一位置和大小与目标区域相同的临时区域;B213、将截取目标的屏幕可见部分与临时区域取交集并根据结果更新临时区域;B214、获取更新后的临时区域相对于截取目标区域的位置;B215、将更新后的临时区域中对应的图像按上步得到的位置存入内存。
2.如权利要求1所述的截取网页内容的方法,其特征在于,所述步骤A为单元截图方式时,所述步骤B1还包含如下过程:B11、保存截取目标元素及其位置信息至一数组;B12、获取截取目标父元素及其位置信息并保存至所述数组;B13、将前述两步保存的元素滚动到正好可显示截取目标元素的位置。
3.如权利要求2所述的截取网页内容的方法,其特征在于,所述步骤B213是通过遍历所述数组来实现的。
4.如权利要求2所述的截取网页内容的方法,其特征在于,所述步骤B22是通过遍历所述数组来实现的。
5.如权利要求1所述的截取网页内容的方法,其特征在于,所述步骤A为滚动窗口截图方式时,其包含如下过程:A1、用户选择滚动截图方式;A2、向对应页面边界方向自动滚动页面;A3、确定截图区域;A4、获取当前网页的html或body。
6.如权利要求5所述的截取网页内容的方法,其特征在于,所述步骤B1还包含如下过程:首先保存截取目标元素及其当前滚动位置信息;其次将目标元素滚动到正好可显示目标元素的位置。
CNB2007100728610A 2007-01-17 2007-01-17 一种截取网页内容的方法 Expired - Fee Related CN100476829C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2007100728610A CN100476829C (zh) 2007-01-17 2007-01-17 一种截取网页内容的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2007100728610A CN100476829C (zh) 2007-01-17 2007-01-17 一种截取网页内容的方法

Publications (2)

Publication Number Publication Date
CN101021872A CN101021872A (zh) 2007-08-22
CN100476829C true CN100476829C (zh) 2009-04-08

Family

ID=38709635

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007100728610A Expired - Fee Related CN100476829C (zh) 2007-01-17 2007-01-17 一种截取网页内容的方法

Country Status (1)

Country Link
CN (1) CN100476829C (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102681829B (zh) * 2011-03-16 2016-03-30 阿里巴巴集团控股有限公司 一种屏幕截图方法、装置及通讯客户端
CN102509256B (zh) * 2011-11-17 2014-07-16 厦门游家网络有限公司 一种Flash小游戏批量添加截图的方法及装置
CN103246438A (zh) * 2012-02-03 2013-08-14 宏碁股份有限公司 图形化界面的选取方法与系统
CN103365860A (zh) * 2012-03-28 2013-10-23 腾讯科技(深圳)有限公司 网页处理的方法、装置和终端
CN103425384B (zh) * 2012-05-22 2016-08-03 北京神州泰岳软件股份有限公司 一种截取屏幕中窗口的方法和装置
CN103345506A (zh) * 2013-07-03 2013-10-09 云南电网公司 基于桌面端的快捷企业级知识收集工具
CN104615343A (zh) * 2013-11-04 2015-05-13 中兴通讯股份有限公司 一种终端截图的方法及装置
CN103793932A (zh) * 2014-02-18 2014-05-14 优视科技有限公司 在移动终端浏览器中存储图文的方法及装置
CN103927178A (zh) * 2014-04-18 2014-07-16 长沙裕邦软件开发有限公司 一种截图方法及截图装置
CN104133683A (zh) * 2014-07-31 2014-11-05 上海二三四五网络科技股份有限公司 一种截取屏幕图片的方法及装置
CN105278824B (zh) * 2014-07-31 2018-06-26 维沃移动通信有限公司 一种终端设备的截屏方法及其终端设备
CN104461283A (zh) * 2014-11-18 2015-03-25 小米科技有限责任公司 网络视图的截图方法及装置、电子设备
CN104536658B (zh) * 2014-12-12 2017-12-29 天津三星通信技术研究有限公司 在终端中生成截屏图像的设备和方法
CN105786359A (zh) * 2014-12-17 2016-07-20 中兴通讯股份有限公司 一种移动终端屏幕截图方法及装置
CN105373305A (zh) * 2015-10-08 2016-03-02 广东欧珀移动通信有限公司 图像截取方法及装置
CN106610831B (zh) * 2015-10-26 2020-02-07 北京国双科技有限公司 网页截图方法和装置
CN106385550A (zh) * 2016-09-06 2017-02-08 青岛海信移动通信技术股份有限公司 一种截取屏幕图像的方法和终端
CN107562345B (zh) * 2017-08-31 2020-01-10 维沃移动通信有限公司 一种信息存储方法及移动终端
CN108681428B (zh) * 2018-04-04 2021-01-29 四川巧夺天工信息安全智能设备有限公司 一种windows系统下的滚动截屏方法
CN110244896A (zh) * 2019-06-24 2019-09-17 北京向上一心科技有限公司 网页内截图方法、装置、控制器及存储介质
CN112579947A (zh) * 2019-09-29 2021-03-30 北京国双科技有限公司 网页元素图的截取方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Office也截图. 精灵.电脑迷,第9期. 2005
Office也截图. 精灵.电脑迷,第9期. 2005 *

Also Published As

Publication number Publication date
CN101021872A (zh) 2007-08-22

Similar Documents

Publication Publication Date Title
CN100476829C (zh) 一种截取网页内容的方法
US11899703B2 (en) Arrangements of documents in a document feed
CN100561415C (zh) 一种调整网页中栏框的方法及装置
US10146419B2 (en) Method and system for section-based editing of a website page
CN102662566B (zh) 屏幕内容放大显示方法及终端
US9760543B2 (en) Graphical tile-based layout
US10126912B2 (en) Method, apparatus, and devices for displaying browser navigation page
US20080168388A1 (en) Selecting and manipulating web content
CN103488411B (zh) 切换页面的方法和装置
US20090300506A1 (en) Mark-up extensions for semantically more relevant thumbnails of content
CN103853417A (zh) 网络动态图片的滚动分页显示方法和装置
AU2019457052B2 (en) Table processing method and apparatus, and intelligent interactive tablet and storage medium
CN104317474A (zh) 窗口切换方法及装置
CN110244896A (zh) 网页内截图方法、装置、控制器及存储介质
CN104238887B (zh) 常用应用程序的图标查找方法和装置
CN103019557B (zh) 页面切换方法和装置
CN105528217A (zh) 一种基于显示列表的局部刷新方法及装置
CN106293427A (zh) 用户界面调整方法及电子装置
CN106547454A (zh) 显示方法及装置
CN104049854A (zh) 显示处理方法和电子设备
CN113204401B (zh) 浏览器渲染方法,终端及存储介质
CN103176709B (zh) 一种桌面镜像屏幕的图标文件拖拽方法和系统
CN103150089B (zh) 大幅面图形图像缩略图浏览和快速定位目标区域的方法
JP2017515241A (ja) タッチパネルに基づく要素削除方法及び装置
CN103902212A (zh) 一种应用于触摸屏智能终端设备的输入方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: JIN GUANGZHE

Free format text: FORMER OWNER: SHENZHEN GUANGMANG TECHNOLOGY SCIENCE CO., LTD.

Effective date: 20090515

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090515

Address after: Guangdong city of Shenzhen province Futian District Che Kung Temple Tairan Industrial Zone 202 East Room 515

Patentee after: Jin Guangzhe

Address before: Guangdong city of Shenzhen province Futian District Che Kung Temple Tairan Industrial Zone 202 East Room 515

Patentee before: Shenzhen City Guangmang Science & Technology Co., Ltd.

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090408

Termination date: 20100219