抓取网页内容的方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种抓取网页内容的方法及装置。
背景技术
用户在浏览网页时,往往需要提取并保存有价值的网页内容,现有对网页内容进行抓取的方法主要包括以下两种:
1、通过用户对需要抓取的网页内容进行复制、粘贴操作,来将抓取的内容进行保存,不仅操作繁琐,而且当用户在浏览网页中进行深度阅读时,这种不断进行复制、粘贴的繁琐操作会极大地影响用户阅读的注意力及浏览体验,不够方便。
2、通过浏览器的收藏夹功能或网页抓取工具来对网页内容进行抓取,但由于收藏夹功能只能将整个网页的内容进行抓取,网页抓取工具也只能将默认的网页上所有能抓取的指定内容全部进行抓取,使得通过收藏夹功能或网页抓取工具抓取的网页内容冗余,抓取的网页内容包含了很多用户不需要的内容,不够准确,需要用户进行二次加工,给用户的使用造成不便。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种抓取网页内容的方法及装置,旨在简单、准确的抓取网页内容。
为实现上述目的,本发明提供的一种抓取网页内容的方法,所述方法包括以下步骤:
监听鼠标在网页中的拖动动作;
当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。
优选地,所述当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址的步骤包括:
当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;
若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;
若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储。
优选地,所述网页内容包括:文本和/或图片。
优选地,所述预设的保存地址包括:本地的保存地址或服务器上的保存地址。
优选地,所述监听鼠标在网页中的拖动动作的步骤之前还包括:
开启抓取网页内容功能。
此外,为实现上述目的,本发明还提供一种抓取网页内容的装置,所述装置包括:
监听模块,用于监听鼠标在网页中的拖动动作;
抓取模块,用于当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。
优选地,所述抓取模块还用于:
当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;
若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;
若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储。
优选地,所述网页内容包括:文本和/或图片。
优选地,所述预设的保存地址包括:本地的保存地址或服务器上的保存地址。
优选地,所述装置还包括:
开启模块,用于开启抓取网页内容功能。
本发明提出的一种抓取网页内容的方法及装置,当用户通过鼠标将在网页中选中的网页内容进行拖动时,即可马上将选中的网页内容存储至预设的保存地址,无需用户进行繁琐的操作,仅通过对鼠标的简单拖拽操作就能完成网页内容的抓取,十分简单、方便;且存储的网页内容是用户根据自身需要通过鼠标在网页中选中的,因此,不会抓取到对用户无用的网页内容,更加准确、实用。
附图说明
图1为本发明抓取网页内容的方法第一实施例的流程示意图;
图2为图1中步骤S20的细化流程示意图;
图3为本发明抓取网页内容的方法第二实施例的流程示意图;
图4为本发明抓取网页内容的装置第一实施例的功能模块示意图;
图5为本发明抓取网页内容的装置第二实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种抓取网页内容的方法。
参照图1,图1为本发明抓取网页内容的方法第一实施例的流程示意图。
在第一实施例中,该抓取网页内容的方法包括:
步骤S10,监听鼠标在网页中的拖动动作;
当用户对网页进行浏览时,用户可通过鼠标进行翻页等操作,也可以通过鼠标将网页中的相关网页内容选中,并通过鼠标将选中的网页内容进行拖动或通过在选中的网页内容中进行点击来放弃选中的网页内容,其中,选中的网页内容可以是网页中的文本和/或图片等内容,在此,不作限定。本实施例中,对鼠标在网页中的拖动动作事件进行监听,以时刻监听用户通过鼠标对选中的网页内容的处理操作。
步骤S20,当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。
当监听到用户通过鼠标在网页中选中相关网页内容,并对选中的网页内容进行拖动操作时,则判断用户需要将通过鼠标选中的网页内容进行抓取,即可立刻将选中的网页内容存储至预设的保存地址,完成网页内容的抓取。其中,预设的保存地址既可以是本地的保存地址,将抓取的网页内容存储在本地指定的相关目录,也可以是服务器上的保存地址,将抓取的网页内容通过网络存储在云端的服务器上,在此不作限定。
本实施例中当用户通过鼠标将在网页中选中的网页内容进行拖动时,即可马上将选中的网页内容存储至预设的保存地址,无需用户进行繁琐的操作,仅通过对鼠标的简单拖拽操作就能完成网页内容的抓取,十分简单、方便;且存储的网页内容是用户根据自身需要通过鼠标在网页中选中的,因此,不会抓取到对用户无用的网页内容,更加准确、实用。
进一步地,如图2所示,上述步骤S20可以包括:
步骤S201,当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;
步骤S202,若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;
步骤S203,若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储。
当监听到鼠标将在网页中选中的网页内容进行拖动时,进一步判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中,其中,该预设的悬浮框可以是在鼠标将选中的网页内容进行拖动时自动生成的,也可以是一直在网页中显示的,悬浮框的大小、在网页中的位置等均可预先进行设定,在此不作限定。
用户通过鼠标在网页中选中相关网页内容后,若需要将选中的网页内容进行抓取、存储,则可通过鼠标将选中的网页内容拖动至预设的悬浮框中,即可立刻将选中的网页内容存储至预设的保存地址,完成网页内容的抓取。若用户没有通过鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则说明用户在通过鼠标将选中的网页内容进行拖动的过程中放弃抓取该选中的网页内容,则不对选中的网页内容进行存储。这样,在抓取网页内容时,用户可以在将选中的网页内容拖动至预设的悬浮框的过程中,选择是否对选中的网页内容进行抓取,只对拖动至预设的悬浮框中的网页内容进行抓取,更加灵活,避免了用户通过鼠标对无用的网页内容进行拖动时抓取该无用的网页内容,进一步提升了抓取网页内容的精确度。
如图3所示,本发明第二实施例提出一种抓取网页内容的方法,在上述第一实施例的基础上,在上述步骤S10之前还包括:
步骤S40,开启抓取网页内容功能。
本实施例与上述第一实施例的区别在于,本实施例还包括开启抓取网页内容功能的操作。
本实施例在实际使用中,该抓取网页内容功能需要在终端上开启,如可通过设置在终端上的物理按钮或虚拟按钮接收用户的开启指令,从而开启抓取网页内容功能。这样,只有在开启抓取网页内容功能之后,才会监听鼠标在网页中的拖动动作,并将选中的网页内容存储至预设的保存地址,而在用户不需要使用抓取网页内容功能时,则不会对鼠标在网页中的拖动动作进行监听,用户可按鼠标在网页中的拖动动作来进行正常的搜索、复制等操作,在方便用户使用抓取网页内容功能的同时,还可以根据用户需要在终端上开启或关闭抓取网页内容功能,以避免造成终端的额外资源消耗及存储空间的浪费,更加灵活,进一步为用户提供了方便。
本发明进一步提供一种抓取网页内容的装置。
参照图4,图4为本发明抓取网页内容的装置第一实施例的功能模块示意图。
在第一实施例中,该抓取网页内容的装置包括:
监听模块01,用于监听鼠标在网页中的拖动动作;
当用户对网页进行浏览时,用户可通过鼠标进行翻页等操作,也可以通过鼠标将网页中的相关网页内容选中,并通过鼠标将选中的网页内容进行拖动或通过在选中的网页内容中进行点击来放弃选中的网页内容,其中,选中的网页内容可以是网页中的文本和/或图片等内容,在此,不作限定。本实施例中,对鼠标在网页中的拖动动作事件进行监听,以时刻监听用户通过鼠标对选中的网页内容的处理操作。
抓取模块02,用于当监听到鼠标将在网页中选中的网页内容进行拖动时,将选中的网页内容存储至预设的保存地址。
当监听到用户通过鼠标在网页中选中相关网页内容,并对选中的网页内容进行拖动操作时,则判断用户需要将通过鼠标选中的网页内容进行抓取,即可立刻将选中的网页内容存储至预设的保存地址,完成网页内容的抓取。其中,预设的保存地址既可以是本地的保存地址,将抓取的网页内容存储在本地指定的相关目录,也可以是服务器上的保存地址,将抓取的网页内容通过网络存储在云端的服务器上,在此不作限定。
本实施例中当用户通过鼠标将在网页中选中的网页内容进行拖动时,即可马上将选中的网页内容存储至预设的保存地址,无需用户进行繁琐的操作,仅通过对鼠标的简单拖拽操作就能完成网页内容的抓取,十分简单、方便;且存储的网页内容是用户根据自身需要通过鼠标在网页中选中的,因此,不会抓取到对用户无用的网页内容,更加准确、实用。
进一步地,在其他实施例中,上述抓取模块02还可以用于:
当监听到鼠标将在网页中选中的网页内容进行拖动时,判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中;若鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则将选中的网页内容存储至预设的保存地址;若鼠标没有将在网页中选中的网页内容拖动至预设的悬浮框中,则不对选中的网页内容进行存储。
当监听到鼠标将在网页中选中的网页内容进行拖动时,进一步判断鼠标是否将在网页中选中的网页内容拖动至预设的悬浮框中,其中,该预设的悬浮框可以是在鼠标将选中的网页内容进行拖动时自动生成的,也可以是一直在网页中显示的,悬浮框的大小、在网页中的位置等均可预先进行设定,在此不作限定。
用户通过鼠标在网页中选中相关网页内容后,若需要将选中的网页内容进行抓取、存储,则可通过鼠标将选中的网页内容拖动至预设的悬浮框中,即可立刻将选中的网页内容存储至预设的保存地址,完成网页内容的抓取。若用户没有通过鼠标将在网页中选中的网页内容拖动至预设的悬浮框中,则说明用户在通过鼠标将选中的网页内容进行拖动的过程中放弃抓取该选中的网页内容,则不对选中的网页内容进行存储。这样,在抓取网页内容时,用户可以在将选中的网页内容拖动至预设的悬浮框的过程中,选择是否对选中的网页内容进行抓取,只对拖动至预设的悬浮框中的网页内容进行抓取,更加灵活,避免了用户通过鼠标对无用的网页内容进行拖动时抓取该无用的网页内容,进一步提升了抓取网页内容的精确度。
如图5所示,本发明第二实施例提出一种抓取网页内容的装置,在上述第一实施例的基础上,该抓取网页内容的装置还包括:
开启模块04,用于开启抓取网页内容功能。
本实施例与上述第一实施例的区别在于,本实施例还包括开启抓取网页内容功能的操作。
本实施例在实际使用中,该抓取网页内容功能需要在终端上开启,如可通过设置在终端上的物理按钮或虚拟按钮接收用户的开启指令,从而开启抓取网页内容功能。这样,只有在开启抓取网页内容功能之后,才会监听鼠标在网页中的拖动动作,并将选中的网页内容存储至预设的保存地址,而在用户不需要使用抓取网页内容功能时,则不会对鼠标在网页中的拖动动作进行监听,用户可按鼠标在网页中的拖动动作来进行正常的搜索、复制等操作,在方便用户使用抓取网页内容功能的同时,还可以根据用户需要在终端上开启或关闭抓取网页内容功能,以避免造成终端的额外资源消耗及存储空间的浪费,更加灵活,进一步为用户提供了方便。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。