CN105786357B - 抓取网页内容的方法及装置 - Google Patents

抓取网页内容的方法及装置 Download PDF

Info

Publication number
CN105786357B
CN105786357B CN201410817178.5A CN201410817178A CN105786357B CN 105786357 B CN105786357 B CN 105786357B CN 201410817178 A CN201410817178 A CN 201410817178A CN 105786357 B CN105786357 B CN 105786357B
Authority
CN
China
Prior art keywords
web page
page contents
webpage
chosen
mouse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410817178.5A
Other languages
English (en)
Other versions
CN105786357A (zh
Inventor
刘东阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Kingdee tianyanyun computing Co., Ltd.
Original Assignee
Shenzhen Kingdee Middleware Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Kingdee Middleware Ltd By Share Ltd filed Critical Shenzhen Kingdee Middleware Ltd By Share Ltd
Priority to CN201410817178.5A priority Critical patent/CN105786357B/zh
Publication of CN105786357A publication Critical patent/CN105786357A/zh
Application granted granted Critical
Publication of CN105786357B publication Critical patent/CN105786357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种抓取网页内容的方法,包括以下步骤:监听鼠标在网页中的拖动动作;当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。本发明还公开了一种抓取网页内容的装置。本发明仅通过对鼠标的简单拖拽操作就能完成网页内容的抓取,十分简单、方便;且存储的网页内容是用户根据自身需要通过鼠标在网页中选中的,因此,不会抓取到对用户无用的网页内容,更加准确、实用。

Description

抓取网页内容的方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种抓取网页内容的方法及装置。
背景技术
用户在浏览网页时,往往需要提取并保存有价值的网页内容,现有对网页内容进行抓取的方法主要包括以下两种:
1、通过用户对需要抓取的网页内容进行复制、粘贴操作,来将抓取的内容进行保存,不仅操作繁琐,而且当用户在浏览网页中进行深度阅读时,这种不断进行复制、粘贴的繁琐操作会极大地影响用户阅读的注意力及浏览体验,不够方便。
2、通过浏览器的收藏夹功能或网页抓取工具来对网页内容进行抓取,但由于收藏夹功能只能将整个网页的内容进行抓取,网页抓取工具也只能将默认的网页上所有能抓取的指定内容全部进行抓取,使得通过收藏夹功能或网页抓取工具抓取的网页内容冗余,抓取的网页内容包含了很多用户不需要的内容,不够准确,需要用户进行二次加工,给用户的使用造成不便。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种抓取网页内容的方法及装置,旨在简单、准确的抓取网页内容。
为实现上述目的,本发明提供的一种抓取网页内容的方法,所述方法包括以下步骤:
监听鼠标在网页中的拖动动作;
当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。
优选地,所述当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址的步骤包括:
当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;
若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;
若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储。
优选地,所述网页内容包括:文本和/或图片。
优选地,所述预设的保存地址包括:本地的保存地址或服务器上的保存地址。
优选地,所述监听鼠标在网页中的拖动动作的步骤之前还包括:
开启抓取网页内容功能。
此外,为实现上述目的,本发明还提供一种抓取网页内容的装置,所述装置包括:
监听模块,用于监听鼠标在网页中的拖动动作;
抓取模块,用于当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。
优选地,所述抓取模块还用于:
当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;
若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;
若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储。
优选地,所述网页内容包括:文本和/或图片。
优选地,所述预设的保存地址包括:本地的保存地址或服务器上的保存地址。
优选地,所述装置还包括:
开启模块,用于开启抓取网页内容功能。
本发明提出的一种抓取网页内容的方法及装置,当用户通过鼠标将在网页中选中的网页内容进行拖动时,即可马上将选中的网页内容存储至预设的保存地址,无需用户进行繁琐的操作,仅通过对鼠标的简单拖拽操作就能完成网页内容的抓取,十分简单、方便;且存储的网页内容是用户根据自身需要通过鼠标在网页中选中的,因此,不会抓取到对用户无用的网页内容,更加准确、实用。
附图说明
图1为本发明抓取网页内容的方法第一实施例的流程示意图;
图2为图1中步骤S20的细化流程示意图;
图3为本发明抓取网页内容的方法第二实施例的流程示意图;
图4为本发明抓取网页内容的装置第一实施例的功能模块示意图;
图5为本发明抓取网页内容的装置第二实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种抓取网页内容的方法。
参照图1,图1为本发明抓取网页内容的方法第一实施例的流程示意图。
在第一实施例中,该抓取网页内容的方法包括:
步骤S10,监听鼠标在网页中的拖动动作;
当用户对网页进行浏览时,用户可通过鼠标进行翻页等操作,也可以通过鼠标将网页中的相关网页内容选中,并通过鼠标将选中的网页内容进行拖动或通过在选中的网页内容中进行点击来放弃选中的网页内容,其中,选中的网页内容可以是网页中的文本和/或图片等内容,在此,不作限定。本实施例中,对鼠标在网页中的拖动动作事件进行监听,以时刻监听用户通过鼠标对选中的网页内容的处理操作。
步骤S20,当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。
当监听到用户通过鼠标在网页中选中相关网页内容,并对选中的网页内容进行拖动操作时,则判断用户需要将通过鼠标选中的网页内容进行抓取,即可立刻将选中的网页内容存储至预设的保存地址,完成网页内容的抓取。其中,预设的保存地址既可以是本地的保存地址,将抓取的网页内容存储在本地指定的相关目录,也可以是服务器上的保存地址,将抓取的网页内容通过网络存储在云端的服务器上,在此不作限定。
本实施例中当用户通过鼠标将在网页中选中的网页内容进行拖动时,即可马上将选中的网页内容存储至预设的保存地址,无需用户进行繁琐的操作,仅通过对鼠标的简单拖拽操作就能完成网页内容的抓取,十分简单、方便;且存储的网页内容是用户根据自身需要通过鼠标在网页中选中的,因此,不会抓取到对用户无用的网页内容,更加准确、实用。
进一步地,如图2所示,上述步骤S20可以包括:
步骤S201,当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;
步骤S202,若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;
步骤S203,若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储。
当监听到鼠标将在网页中选中的网页内容进行拖动时,进一步判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中,其中,该预设的悬浮框可以是在鼠标将选中的网页内容进行拖动时自动生成的,也可以是一直在网页中显示的,悬浮框的大小、在网页中的位置等均可预先进行设定,在此不作限定。
用户通过鼠标在网页中选中相关网页内容后,若需要将选中的网页内容进行抓取、存储,则可通过鼠标将选中的网页内容拖动至预设的悬浮框中,即可立刻将选中的网页内容存储至预设的保存地址,完成网页内容的抓取。若用户没有通过鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则说明用户在通过鼠标将选中的网页内容进行拖动的过程中放弃抓取该选中的网页内容,则不对选中的网页内容进行存储。这样,在抓取网页内容时,用户可以在将选中的网页内容拖动至预设的悬浮框的过程中,选择是否对选中的网页内容进行抓取,只对拖动至预设的悬浮框中的网页内容进行抓取,更加灵活,避免了用户通过鼠标对无用的网页内容进行拖动时抓取该无用的网页内容,进一步提升了抓取网页内容的精确度。
如图3所示,本发明第二实施例提出一种抓取网页内容的方法,在上述第一实施例的基础上,在上述步骤S10之前还包括:
步骤S40,开启抓取网页内容功能。
本实施例与上述第一实施例的区别在于,本实施例还包括开启抓取网页内容功能的操作。
本实施例在实际使用中,该抓取网页内容功能需要在终端上开启,如可通过设置在终端上的物理按钮或虚拟按钮接收用户的开启指令,从而开启抓取网页内容功能。这样,只有在开启抓取网页内容功能之后,才会监听鼠标在网页中的拖动动作,并将选中的网页内容存储至预设的保存地址,而在用户不需要使用抓取网页内容功能时,则不会对鼠标在网页中的拖动动作进行监听,用户可按鼠标在网页中的拖动动作来进行正常的搜索、复制等操作,在方便用户使用抓取网页内容功能的同时,还可以根据用户需要在终端上开启或关闭抓取网页内容功能,以避免造成终端的额外资源消耗及存储空间的浪费,更加灵活,进一步为用户提供了方便。
本发明进一步提供一种抓取网页内容的装置。
参照图4,图4为本发明抓取网页内容的装置第一实施例的功能模块示意图。
在第一实施例中,该抓取网页内容的装置包括:
监听模块01,用于监听鼠标在网页中的拖动动作;
当用户对网页进行浏览时,用户可通过鼠标进行翻页等操作,也可以通过鼠标将网页中的相关网页内容选中,并通过鼠标将选中的网页内容进行拖动或通过在选中的网页内容中进行点击来放弃选中的网页内容,其中,选中的网页内容可以是网页中的文本和/或图片等内容,在此,不作限定。本实施例中,对鼠标在网页中的拖动动作事件进行监听,以时刻监听用户通过鼠标对选中的网页内容的处理操作。
抓取模块02,用于当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。
当监听到用户通过鼠标在网页中选中相关网页内容,并对选中的网页内容进行拖动操作时,则判断用户需要将通过鼠标选中的网页内容进行抓取,即可立刻将选中的网页内容存储至预设的保存地址,完成网页内容的抓取。其中,预设的保存地址既可以是本地的保存地址,将抓取的网页内容存储在本地指定的相关目录,也可以是服务器上的保存地址,将抓取的网页内容通过网络存储在云端的服务器上,在此不作限定。
本实施例中当用户通过鼠标将在网页中选中的网页内容进行拖动时,即可马上将选中的网页内容存储至预设的保存地址,无需用户进行繁琐的操作,仅通过对鼠标的简单拖拽操作就能完成网页内容的抓取,十分简单、方便;且存储的网页内容是用户根据自身需要通过鼠标在网页中选中的,因此,不会抓取到对用户无用的网页内容,更加准确、实用。
进一步地,在其他实施例中,上述抓取模块02还可以用于:
当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储。
当监听到鼠标将在网页中选中的网页内容进行拖动时,进一步判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中,其中,该预设的悬浮框可以是在鼠标将选中的网页内容进行拖动时自动生成的,也可以是一直在网页中显示的,悬浮框的大小、在网页中的位置等均可预先进行设定,在此不作限定。
用户通过鼠标在网页中选中相关网页内容后,若需要将选中的网页内容进行抓取、存储,则可通过鼠标将选中的网页内容拖动至预设的悬浮框中,即可立刻将选中的网页内容存储至预设的保存地址,完成网页内容的抓取。若用户没有通过鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则说明用户在通过鼠标将选中的网页内容进行拖动的过程中放弃抓取该选中的网页内容,则不对选中的网页内容进行存储。这样,在抓取网页内容时,用户可以在将选中的网页内容拖动至预设的悬浮框的过程中,选择是否对选中的网页内容进行抓取,只对拖动至预设的悬浮框中的网页内容进行抓取,更加灵活,避免了用户通过鼠标对无用的网页内容进行拖动时抓取该无用的网页内容,进一步提升了抓取网页内容的精确度。
如图5所示,本发明第二实施例提出一种抓取网页内容的装置,在上述第一实施例的基础上,该抓取网页内容的装置还包括:
开启模块04,用于开启抓取网页内容功能。
本实施例与上述第一实施例的区别在于,本实施例还包括开启抓取网页内容功能的操作。
本实施例在实际使用中,该抓取网页内容功能需要在终端上开启,如可通过设置在终端上的物理按钮或虚拟按钮接收用户的开启指令,从而开启抓取网页内容功能。这样,只有在开启抓取网页内容功能之后,才会监听鼠标在网页中的拖动动作,并将选中的网页内容存储至预设的保存地址,而在用户不需要使用抓取网页内容功能时,则不会对鼠标在网页中的拖动动作进行监听,用户可按鼠标在网页中的拖动动作来进行正常的搜索、复制等操作,在方便用户使用抓取网页内容功能的同时,还可以根据用户需要在终端上开启或关闭抓取网页内容功能,以避免造成终端的额外资源消耗及存储空间的浪费,更加灵活,进一步为用户提供了方便。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (6)

1.一种抓取网页内容的方法,其特征在于,所述方法包括以下步骤:
监听鼠标在网页中的拖动动作;
当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址;
其中,所述当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址的步骤包括:
当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;
若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;
若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储;
所述监听鼠标在网页中的拖动动作的步骤之前还包括:
通过物理按钮或虚拟按钮接收用户的开启指令;
通过所述开启指令开启抓取网页内容功能。
2.如权利要求1所述的抓取网页内容的方法,其特征在于,所述网页内容包括:文本和/或图片。
3.如权利要求1所述的抓取网页内容的方法,其特征在于,所述预设的保存地址包括:本地的保存地址或服务器上的保存地址。
4.一种抓取网页内容的装置,其特征在于,所述装置包括:
监听模块,用于监听鼠标在网页中的拖动动作;
抓取模块,用于当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址;
其中,所述抓取模块还用于:
当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;
若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;
若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储;
所述装置还包括:
开启模块,用于通过物理按钮或虚拟按钮接收用户的开启指令,并通过所述开启指令开启抓取网页内容功能。
5.如权利要求4所述的抓取网页内容的装置,其特征在于,所述网页内容包括:文本和/或图片。
6.如权利要求4所述的抓取网页内容的装置,其特征在于,所述预设的保存地址包括:本地的保存地址或服务器上的保存地址。
CN201410817178.5A 2014-12-24 2014-12-24 抓取网页内容的方法及装置 Active CN105786357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410817178.5A CN105786357B (zh) 2014-12-24 2014-12-24 抓取网页内容的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410817178.5A CN105786357B (zh) 2014-12-24 2014-12-24 抓取网页内容的方法及装置

Publications (2)

Publication Number Publication Date
CN105786357A CN105786357A (zh) 2016-07-20
CN105786357B true CN105786357B (zh) 2019-09-06

Family

ID=56378356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410817178.5A Active CN105786357B (zh) 2014-12-24 2014-12-24 抓取网页内容的方法及装置

Country Status (1)

Country Link
CN (1) CN105786357B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678600A (zh) * 2013-12-13 2014-03-26 北京奇虎科技有限公司 网页数据的处理方法及设备
CN103793932A (zh) * 2014-02-18 2014-05-14 优视科技有限公司 在移动终端浏览器中存储图文的方法及装置
CN104346465A (zh) * 2014-11-07 2015-02-11 北京奇虎科技有限公司 保存网页元素的方法、装置和浏览器客户端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8024316B2 (en) * 2008-01-30 2011-09-20 Google Inc. Providing content using stored query information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678600A (zh) * 2013-12-13 2014-03-26 北京奇虎科技有限公司 网页数据的处理方法及设备
CN103793932A (zh) * 2014-02-18 2014-05-14 优视科技有限公司 在移动终端浏览器中存储图文的方法及装置
CN104346465A (zh) * 2014-11-07 2015-02-11 北京奇虎科技有限公司 保存网页元素的方法、装置和浏览器客户端

Also Published As

Publication number Publication date
CN105786357A (zh) 2016-07-20

Similar Documents

Publication Publication Date Title
US20220206672A1 (en) Method and Apparatus for Managing Notification Bar Message
CN103135969B (zh) 应用程序的操作、生成、启动的方法及其装置
CN103369048B (zh) 基于拖拽操作的内容分享方法及系统
US20160085404A1 (en) Mobile Application Configuration
CN105242817B (zh) 页面元素实时突出显示的方法及装置
US20140344707A1 (en) Information Distribution Method and Device
CN104021218B (zh) 一种信息显示方法及装置
CN104050166B (zh) 一种数据处理方法和装置
CN104462516B (zh) 一种信息提示方法及移动终端
CN106021561A (zh) 一种页面表单处理方法和装置
CN107783996A (zh) 一种用于文件分享的方法与设备
CN102799688A (zh) 网页历史记录的显示方法及装置
KR20160125401A (ko) 인라인 및 콘텍스트 인식 쿼리 박스 제공 기법
CN102591916A (zh) 一种网页开启方法及一种网站系统
CN104252308A (zh) 一种保存网页内容的方法和装置
CN103970839A (zh) 语音控制网页浏览的方法
CN109308337A (zh) 页面分享方法和装置
CN106358062A (zh) 一种浏览器中视频文件的播放处理方法及装置
CN106383752A (zh) 一种浏览器页面异常恢复处理方法及装置
CN104808891B (zh) 一种页面信息的处理方法及装置
CN105892792A (zh) 终端设备的操作方法和终端设备
CN102663070B (zh) 浏览器应用提供方法及系统
CN105786357B (zh) 抓取网页内容的方法及装置
CN105956101A (zh) 网页内容处理方法及装置
WO2017080198A1 (zh) 便签更新方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: South South technology twelve road 518000 in Guangdong province Shenzhen City Guangdong streets Nanshan District high tech Industrial Park, No. 2, Kingdee Software Park building A floor 2 South Block

Applicant after: Shenzhen Kingdee middleware Limited by Share Ltd.

Address before: 518000 Guangdong city of Shenzhen province science and technology science and Technology Park of Nanshan District twelve South Road No. 2, Kingdee Software Park A block, floor 2

Applicant before: Shenzhen Kingdee Middleware Co., Ltd.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: South South technology twelve road 518000 in Guangdong province Shenzhen City Guangdong streets Nanshan District high tech Industrial Park, No. 2, Kingdee Software Park building A floor 2 South Block

Patentee after: Shenzhen Kingdee tianyanyun computing Co., Ltd.

Address before: South South technology twelve road 518000 in Guangdong province Shenzhen City Guangdong streets Nanshan District high tech Industrial Park, No. 2, Kingdee Software Park building A floor 2 South Block

Patentee before: Shenzhen Kingdee middleware Limited by Share Ltd.

CP01 Change in the name or title of a patent holder