CN110020240A - 一种网页截图方法、装置、存储介质和处理器 - Google Patents

一种网页截图方法、装置、存储介质和处理器 Download PDF

Info

Publication number
CN110020240A
CN110020240A CN201710894941.8A CN201710894941A CN110020240A CN 110020240 A CN110020240 A CN 110020240A CN 201710894941 A CN201710894941 A CN 201710894941A CN 110020240 A CN110020240 A CN 110020240A
Authority
CN
China
Prior art keywords
retrieval
information
uniform resource
resource locator
screenshot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710894941.8A
Other languages
English (en)
Inventor
张剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710894941.8A priority Critical patent/CN110020240A/zh
Publication of CN110020240A publication Critical patent/CN110020240A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种网页截图方法及装置。一种网页截图方法,包括:获取需要检索的关键词信息,以及检索媒体信息;根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;访问所述统一资源定位符,得到检索结果页面;对所述检索结果页面进行截图处理,得到截图结果。采用上述方法,能够实现自动化的关键词检索及检索结果截图处理,提高了网页截图效率。

Description

一种网页截图方法、装置、存储介质和处理器
技术领域
本发明涉及网络技术领域,尤其涉及一种网页截图方法、装置、存储介质和处理器。
背景技术
搜索引擎营销(Search Engine Marketing,SEM)工作人员在服务客户的时候,经常会有对投放关键词的检索结果网页进行截图保存,以便于展示的需求。目前的处理方式为由人工手动打开检索网页检索关键词,得到检索结果网页后,利用截图工具对检索结果网页进行截图,最后保存截图。
实际上,用户投放的检索关键词可能会很多,或者用户会投放多个媒体进行关键词检索。在这种情况下,完全依靠人工分别对各个检索关键词和媒体进行检索并对检索结果网页进行截图,无疑需要耗费大量人力,并且截图效率低下。因此,业内亟需一种关键词检索结果的自动化截图方案,来降低对人工的依赖,提高截图效率。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网页截图方法及装置,采用该方法或装置可以实现自动化的网页截图。
本发明第一方面提出一种网页截图方法,包括:获取需要检索的关键词信息,以及检索媒体信息;根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;访问所述统一资源定位符,得到检索结果页面;对所述检索结果页面进行截图处理,得到截图结果。可以理解,本发明提出的上述技术方案是基于程序的自动化处理方案,在获取需要检索的关键词信息及检索媒体信息后,自动根据获取的信息进行预设的处理,最终得到检索结果的页面截图。上述方法实现了自动化的网页截图处理,降低了关键词检索及截图对人工的依赖,提高了截图效率。
本发明第二方面提出一种网页截图装置,包括:信息获取单元,用于获取需要检索的关键词信息,以及检索媒体信息;拼接处理单元,用于根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;检索处理单元,用于访问所述统一资源定位符,得到检索结果页面;截图处理单元,用于对所述检索结果页面进行截图处理,得到截图结果。本发明提出的网页截图装置用于执行第一方面提出的网页截图方法,实现自动化的关键字检索及截图处理,提高了截图效率。
在一种实现方式中,当所述检索媒体为支持分地域检索的检索媒体时,在拼接得到需要访问的统一资源定位符后,该方法还包括:获取检索地域信息;将所述检索地域信息,以及所述统一资源定位符发送给所述支持分地域检索的检索媒体;接收所述支持分地域检索的检索媒体返回的超文本标记语言代码;将所述超文本标记语言代码架设到预设的网站上,得到待访问的统一资源定位符;访问所述待访问的统一资源定位符,得到检索结果页面;对所述检索结果页面进行截图处理,得到截图结果。在这一实现方式中,允许用户选择检索地域,可以进一步缩小检索范围,利于更快地检索到用户需要的内容。
在一种实现方式中,所述根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符,包括:按照预先设定的拼接规则,对所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息进行拼接处理,得到需要访问的统一资源定位符。
在一种实现方式中,所述访问所述统一资源定位符,得到检索结果页面,包括:模拟访问所述统一资源定位符,得到模拟的检索结果页面。
在一种实现方式中,该方法还包括:将所述截图结果存储到预设的文件夹中。
本发明第三方面提出一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时控制所述存储介质所在设备执行上述的网页截图方法。
本发明第四方面提出一种处理器所述处理器用于运行程序,其中,所述程序运行时执行上述的网页截图方法。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种网页截图方法的流程示意图;
图2示出了本发明实施例提供的另一种网页截图方法的流程示意图;
图3示出了本发明实施例提供的一种网页截图装置的结构示意图;
图4示出了本发明实施例提供的另一种网页截图装置的结构示意图。
具体实施方式
本发明实施例技术方案适用于根据用户提供的检索关键词,检索网页并对检索结果网页进行截图处理的应用场景。
采用本发明实施例技术方案,能够自动化地根据用户提供的检索关键词检索网页,并对检索网页结果进行截图保存处理。
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例公开了网页截图方法,参见图1所示,该方法包括:
S101、获取需要检索的关键词信息,以及检索媒体信息;
具体的,上述需要检索的关键词信息及检索媒体信息,是指由用户输入的,想要检索的关键词的信息,以及用户选择的用于检索关键词的媒体网站的信息。本发明实施例为用户提供输入框,使用户输入想要检索的关键词,以及输出可选的检索媒体选项,使用户选择用于检索关键词的检索媒体。
S102、根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;
具体的,上述检索参数信息,是指预先设定的执行检索关键词动作的参数信息。
本发明实施例按照预先设定的拼接规则,对上述检索参数、检索关键词和检索媒体进行拼接处理,得到一条统一资源定位符(Uniform Resource Locator,URL)。URL是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址,互联网上的每个文件都有一个唯一的URL。
S103、访问所述统一资源定位符,得到检索结果页面;
具体的,步骤S102中拼接得到的统一资源定位符URL指示了用户输入的关键词在互联网上的位置和访问方法等信息。本发明实施例通过访问上述统一资源定位符,可以访问到用户想要检索的关键词所在的页面,即得到检索结果页面。
S104、对所述检索结果页面进行截图处理,得到截图结果。
具体的,本发明实施例采用常用的任意的截图方法,对检索结果页面进行截图处理,得到截图结果后,进一步地将截图结果进行保存或输出给用户。
通过上述介绍可见,本发明实施例技术方案在基于用户输入检索关键词和选择检索媒体的基础上,能够自动根据获取的检索关键词信息和检索媒体信息,结合检索参数信息,拼接得到统一资源定位符,然后自动访问该统一资源定位符得到检索结果页面,最后对检索结果页面截图得到截图结果。上述过程实现了自动化的关键词检索及截图处理,降低了检索关键词及截图过程对人工的依赖,提高了截图效率。
本发明实施例提出的网页截图方法,可以由专门设计的代码程序来实现。该代码程序可以集成在检索网站,也可以单独设立为网站程序执行,该网站程序与检索网站相关联。
更进一步的,上述代码程序,可以在任意的硬件装置上被执行,例如在电脑、手机、平板等硬件装置上执行上述代码程序实现网页截图功能。需要说明的是,当上述代码程序被植入不同类型操作系统的终端时,需要根据操作系统的不同,对代码进行形式修改,但不进行功能修改,用以通过不同类型的终端,实现本发明实施例所提出的网页截图功能,例如在PC端、IOS端、安卓端等终端实现本发明实施例所述的网页截图功能。
图2示出了上述图1所示的网页截图方法的更具体的执行过程。参见图2所示,本发明实施例公开的上述网页截图方法,具体包括:
S201、获取需要检索的关键词信息;
具体的,上述关键词信息,是指由用户输入的,想要检索的关键词的信息。例如用户输入想要检索的“手机”、“电视”、“电脑”等关键词后,本发明实施例,或执行本发明实施例技术方案的主体装置就可以获取到用户需要检索的关键词信息,具体为“手机”、“电视”、“电脑”等关键词。
需要说明的是,本发明实施例允许用户同时输入多个检索关键词,即本发明实施例可以执行批量检索。此时,本发明实施例获取的需要检索的关键词信息,是指多个不同的关键词的信息。例如,假设用户同时输入了“手机”、“电视”、“电脑”等作为检索关键词,则本发明实施例,或执行本发明实施例技术方案的主体装置同时获取到“手机”、“电视”、“电脑”等关键词信息。
S202、获取检索媒体信息;
具体的,上述检索媒体信息,是指用户选择的用于检索关键词的媒体网站的信息,例如“百度搜索”、“搜狗搜索”等。本发明实施例调用获取的,用户输入的媒体网站检索获取的关键词,得到检索结果,并对该媒体网站的检索结果进行截图。
需要说明的是,本发明实施例允许用户同时选择多个检索媒体,即本发明实施例可以从多个媒体网站检索获取的检索关键词。例如,假设用户同时选择了“百度搜索”和“搜狗搜索”,则本发明实施例获取的检索媒体信息为“百度搜索”和“搜狗搜索”,在后期检索关键词时,分别通过百度搜索和搜狗搜索检索关键词。
本发明实施例提供的可选的检索媒体包括“百度搜索”、“百度知道”、“360搜索”和“搜狗搜索”。本发明实施例通过页面展示的方式,输出上述四个选项,由用户选择检索媒体,用户可以单选,也可以多选。可以理解的是,基于本发明实施例,添加其它检索媒体供用户选择,也可以实现本发明实施例技术方案。理论上,可以获取的任意的检索媒体,都在本发明实施例技术方案保护范围内。
另外需要说明的是,步骤S201和步骤S202可以先后执行,也可以同步执行。当步骤S201和步骤S202先后执行时,可以按照上述先S201,后S202的顺序执行,也可以按照先S202,后S201的顺序执行。步骤S201和步骤S202的先后处理顺序,不会影响本发明实施例的技术效果。
S203、根据检索参数信息、获取的关键词信息和获取的检索媒体信息,拼接得到需要访问的统一资源定位符;
具体的,统一资源定位符(Uniform Resource Locator,URL)是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址,互联网上的每个文件都有一个唯一的URL。
上述检索参数信息,是指预先设定的执行检索关键词动作的参数信息。
本发明实施例按照预先设定的拼接规则,对上述检索参数、检索关键词和检索媒体进行拼接处理,得到一条URL,该URL即为检索关键词并进行截图处理的URL。上述预先设定的拼接规则,主要是预先设定的拼接先后顺序规则。在进行拼接之前,需要将上述检索参数、检索关键词和检索媒体的信息,转换成符合URL的信息形式,然后再按照预先设定的拼接先后顺序进行拼接,必要时,还可以对拼接的信息进行加密处理。
例如,假设用户输入的检索关键词为“手机”,用户输入的检索媒体为“百度搜索”,则结合预先设定的检索参数,将检索参数和检索关键词、检索媒体进行形式转换以及拼接处理后,得到的URL为:https://www.baidu.com/s?wd=%E6%89%8B%E6%9C%BA&rsv_spt=1&rsv_iq id=0xa4d057620014c309&issp=1&f=8&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=m online_3_dg&rsv_enter=1&rsv_sug3=6&rsv_sug1=5&rsv_sug7=100。其中,“wd=%E6%89%8B%E6%9C%BA”表示密文形式的检索关键词“手机”;https://www.baidu.com/s表示检索媒体为“百度搜索”;其余的,“?”之后以“&”分割的各个部分,表示各项检索参数,各项检索参数分别代表不同的含义,并且各项检索参数代表的含义,根据检索媒体的不同而不同。
当用户输入多个检索关键词,或选择多个检索媒体时,针对各个检索关键词后检索媒体,分别按照上述方法拼接得到需要访问的统一资源定位符。
S204、获取检索地域信息;
具体的,上述检索地域信息,是指用户选择的,需要执行检索的地域的信息,即用户规定的,在哪个或哪些地域范围内执行对检索关键词的检索。本发明实施例以输出地域信息的方法,供用户选择地域信息。
S205、将获取的检索地域信息,和拼接得到的统一资源定位符发送给支持分地域检索的检索媒体;
具体的,上述支持分地域检索的检索媒体,是指可以分地域检索需要检索的关键词的检索媒体。信息的投放是可以分地域投放的,比如,投放地域选择在上海的广告,仅仅在上海搜索该广告的相应关键词时能看到,在北京搜索该广告的相应关键词,就看不到该广告。分地域检索的功能支持用户选择检索关键词的地域,此时检索媒体只输出与用户选择的地域相关的检索结果,利于用户更快地获取到想要的信息。
本发明实施例提供的支持分地域检索的检索媒体具体为百度搜索。可以理解的是,其它可实现分地域检索的检索媒体,都可以被本发明实施例所采用。
要想借用检索媒体的分地域检索功能,需要调用支持分地域检索的检索媒体的地域实况接口。在本发明实施例中,将获取的检索地域信息和拼接得到的统一资源定位符发送给百度搜索的地域实况接口。
S206、接收支持分地域检索的检索媒体返回的超文本标记语言代码;
具体的,超文本标记语言(HyperText Markup Language,HTML)是标准通用标记语言下的一个应用,也是一种规范,一种标准,它通过标记符号来标记要显示的网页中的各个部分。
支持分地域检索的检索媒体在接收到检索地域信息和统一资源定位符后,对统一资源定位符所指示的资源信息,进行地域上的区分,从中确定符合用户选择的检索地域要求的资源信息,然后根据符合用户选择的检索地域要求的资源信息生成一段超文本标记语言代码,并输出该超文本标记语言代码。所述超文本标记语言代码用于标识符合用户选择的地域需求的检索关键词页面信息。
S207、将接收的超文本标记语言代码架设到预设的网站上,得到待访问的统一资源定位符;
具体的,上述预设的网站,是配合执行本发明实施例而预先架设的网站,当把HTML页面架设到该网站时,就会得到一个统一资源定位符。如果访问该统一资源定位符,就可以看到上述HTML页面的内容。本发明实施例所接收的超文本标记语言以代码形式存在,因此,在步骤S207中,直接将接收的超文本标记语言代码架设到预设的网站上。
需要说明的是,上述步骤S204~S207表述的是当用户对检索地域进行限定的情况下的相应处理过程。当用户限定检索地域时,需要执行上述步骤S204~S207;如果用户不限定检索地域,则在执行本发明实施例技术方案时,直接跳过步骤S204~S207即可。另外,本发明实施例仅支持当用户选择百度搜索时,可以允许用户限定检索地域。因此,只有当用户选择的检索媒体包括百度搜索时,可以通过执行步骤S204~S207限定检索地域,否则,不允许用户限定检索地域,即在执行本发明实施例技术方案时,自动跳过步骤S204~S207。
S208、模拟访问待访问的统一资源定位符,得到模拟的检索结果页面;
具体的,上述待访问的统一资源定位符,是指步骤S207中得到的待访问的统一资源定位符。当用户不限定检索地域时,由于不执行上述步骤S204~S207,因此,此时上述待访问的统一资源定位符,为步骤S203中得到的需要访问的统一资源定位符。
上述模拟访问待访问的统一资源定位符,可以理解为模拟访问上述统一资源定位符的过程,也即模拟人工访问检索媒体,检索关键词的过程。该过程采用PhantomJS技术实现,PhantomJS是一个基于webkit内核的无头浏览器,即没有UI界面,它就是一个浏览器,只是其点击、翻页等人为相关操作都需要程序设计实现。PhantomJS常用于爬虫、自然语言处理等方面,可以方便地应用于模拟登陆,即模拟无UI界面的网站登陆。
采用PhantomJS技术可以实现模拟访问,也就是模拟登陆上述待访问的统一资源定位符,得到上述统一资源定位符所指向的网页信息,即检索结果页面。需要说明的是,由于本发明实施例是模拟的访问上述统一资源定位符的过程,因此,得到的检索结果也是模拟的检索结果页面。上述模拟访问统一资源定位符,以及得到的检索结果页面,都是在本发明实施例内部执行的处理过程和结果,并不进行展示。
可以理解的是,在有展示需求的情况下,也可以真实访问上述待访问的统一资源定位符,得到检索结果页面后,对检索结果页面进行输出展示。
S209、对得到的模拟的检索结果页面进行截图处理,得到截图结果;
具体的,由于本发明实施例得到的检索结果页面是模拟的检索结果页面,并不是展示出来的真实的检索结果页面,因此,对模拟检索结果页面的截图处理,也是模拟进行的。但是,本发明实施例截图得到的截图结果,是以实际图片的形式存在的,具体为jpg形式的图片。
当用户输入多个检索关键词,或者选择多个检索媒体时,针对各个检索关键词和检索媒体,执行上述处理过程,即可得到在各个检索媒体,检索各个检索关键词的结果的截图结果。
S210、将得到的截图结果存储到预设的文件夹中。
具体的,本发明实施例将截图结果按照设定的命名规则进行命名,然后,将命名好的截图结果存储到预设的文件夹中。并且,本发明实施例支持修改保存截图结果的文件夹路径。
图3是本发明实施例公开的一种网页截图装置的结构示意图。参见图3所示,本发明实施例公开的网页截图装置,包括:信息获取单元301,用于获取需要检索的关键词信息,以及检索媒体信息;拼接处理单元302,用于根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;检索处理单元303,用于访问所述统一资源定位符,得到检索结果页面;截图处理单元304,用于对所述检索结果页面进行截图处理,得到截图结果。
具体的,本实施例中各个单元的具体工作内容,请参见上述方法实施例的内容,此处不再赘述。
图4是本发明实施例公开的另一种网页截图装置的结构示意图。在图3所示的网页截图装置的基础上,图4所示的另一种网页截图装置还包括:地域信息获取单元305,用于获取检索地域信息;信息发送单元306,用于将所述检索地域信息,以及所述统一资源定位符发送给所述支持分地域检索的检索媒体;信息接收单元307,用于接收所述支持分地域检索的检索媒体返回的超文本标记语言代码;信息处理单元308,用于将所述超文本标记语言代码架设到预设的网站上,得到待访问的统一资源定位符;相应的,图4所示的网页截图装置的检索处理单元303访问所述待访问的统一资源定位符,得到检索结果页面;截图处理单元304对所述检索结果页面进行截图处理,得到截图结果。
具体的,本实施例中各个单元的具体工作内容,请参见上述方法实施例的内容,此处不再赘述。
可选的,在本发明的另一个实施例中,拼接处理单元302根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符时,具体用于:
按照预先设定的拼接规则,对所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息进行拼接处理,得到需要访问的统一资源定位符。
具体的,本实施例中的拼接处理单元302的具体工作内容,请参见上述方法实施例的内容,此处不再赘述。
可选的,在本发明的另一个实施例中,检索处理单元303访问所述统一资源定位符,得到检索结果页面时,具体用于:模拟访问所述统一资源定位符,得到模拟的检索结果页面。
具体的,本实施例中的检索处理单元303的具体工作内容,请参见上述方法实施例的内容,此处不再赘述。
可选的,在本发明的另一个实施例中,该装置还包括:截图存储单元,用于将所述截图结果存储到预设的文件夹中。
具体的,本实施例中的截图存储单元的具体工作内容,请参见上述方法实施例的内容,此处不再赘述。
所述网页截图装置包括处理器和存储器,上述信息获取单元、拼接处理单元、检索处理单元、截图处理单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现自动化的网页截图。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述网页截图方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述网页截图方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取需要检索的关键词信息,以及检索媒体信息;根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;访问所述统一资源定位符,得到检索结果页面;对所述检索结果页面进行截图处理,得到截图结果。
在一种实现方式中,当所述检索媒体为支持分地域检索的检索媒体时,在拼接得到需要访问的统一资源定位符后,该方法还包括:获取检索地域信息;将所述检索地域信息,以及所述统一资源定位符发送给所述支持分地域检索的检索媒体;接收所述支持分地域检索的检索媒体返回的超文本标记语言代码;将所述超文本标记语言代码架设到预设的网站上,得到待访问的统一资源定位符;访问所述待访问的统一资源定位符,得到检索结果页面;对所述检索结果页面进行截图处理,得到截图结果。在这一实现方式中,允许用户选择检索地域,可以进一步缩小检索范围,利于更快地检索到用户需要的内容。
在一种实现方式中,所述根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符,包括:按照预先设定的拼接规则,对所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息进行拼接处理,得到需要访问的统一资源定位符。
在一种实现方式中,所述访问所述统一资源定位符,得到检索结果页面,包括:模拟访问所述统一资源定位符,得到模拟的检索结果页面。
在一种实现方式中,该方法还包括:将所述截图结果存储到预设的文件夹中。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取需要检索的关键词信息,以及检索媒体信息;根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;访问所述统一资源定位符,得到检索结果页面;对所述检索结果页面进行截图处理,得到截图结果。
在一种实现方式中,当所述检索媒体为支持分地域检索的检索媒体时,在拼接得到需要访问的统一资源定位符后,该方法还包括:获取检索地域信息;将所述检索地域信息,以及所述统一资源定位符发送给所述支持分地域检索的检索媒体;接收所述支持分地域检索的检索媒体返回的超文本标记语言代码;将所述超文本标记语言代码架设到预设的网站上,得到待访问的统一资源定位符;访问所述待访问的统一资源定位符,得到检索结果页面;对所述检索结果页面进行截图处理,得到截图结果。在这一实现方式中,允许用户选择检索地域,可以进一步缩小检索范围,利于更快地检索到用户需要的内容。
在一种实现方式中,所述根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符,包括:按照预先设定的拼接规则,对所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息进行拼接处理,得到需要访问的统一资源定位符。
在一种实现方式中,所述访问所述统一资源定位符,得到检索结果页面,包括:模拟访问所述统一资源定位符,得到模拟的检索结果页面。
在一种实现方式中,该方法还包括:将所述截图结果存储到预设的文件夹中。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种网页截图方法,其特征在于,包括:
获取需要检索的关键词信息,以及检索媒体信息;
根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;
访问所述统一资源定位符,得到检索结果页面;
对所述检索结果页面进行截图处理,得到截图结果。
2.根据权利要求1所述的方法,其特征在于,当所述检索媒体为支持分地域检索的检索媒体时,在拼接得到需要访问的统一资源定位符后,该方法还包括:
获取检索地域信息;
将所述检索地域信息,以及所述统一资源定位符发送给所述支持分地域检索的检索媒体;
接收所述支持分地域检索的检索媒体返回的超文本标记语言代码;
将所述超文本标记语言代码架设到预设的网站上,得到待访问的统一资源定位符;
访问所述待访问的统一资源定位符,得到检索结果页面;
对所述检索结果页面进行截图处理,得到截图结果。
3.根据权利要求1所述的方法,其特征在于,所述根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符,包括:
按照预先设定的拼接规则,对所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息进行拼接处理,得到需要访问的统一资源定位符。
4.根据权利要求1所述的方法,其特征在于,所述访问所述统一资源定位符,得到检索结果页面,包括:
模拟访问所述统一资源定位符,得到模拟的检索结果页面。
5.根据权利要求1至4中任一权利要求所述的方法,其特征在于,该方法还包括:
将所述截图结果存储到预设的文件夹中。
6.一种网页截图装置,其特征在于,包括:
信息获取单元,用于获取需要检索的关键词信息,以及检索媒体信息;
拼接处理单元,用于根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符;
检索处理单元,用于访问所述统一资源定位符,得到检索结果页面;
截图处理单元,用于对所述检索结果页面进行截图处理,得到截图结果。
7.根据权利要求6所述的装置,其特征在于,该装置还包括:
地域信息获取单元,用于获取检索地域信息;
信息发送单元,用于将所述检索地域信息,以及所述统一资源定位符发送给所述支持分地域检索的检索媒体;
信息接收单元,用于接收所述支持分地域检索的检索媒体返回的超文本标记语言代码;
信息处理单元,用于将所述超文本标记语言代码架设到预设的网站上,得到待访问的统一资源定位符;
相应的,所述检索处理单元访问所述待访问的统一资源定位符,得到检索结果页面;所述截图处理单元对所述检索结果页面进行截图处理,得到截图结果。
8.根据权利要求6所述的装置,其特征在于,所述拼接处理单元根据所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息,拼接得到需要访问的统一资源定位符时,具体用于:
按照预先设定的拼接规则,对所述关键词信息、所述检索媒体信息以及预先设定的检索参数信息进行拼接处理,得到需要访问的统一资源定位符。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时控制所述存储介质所在的设备执行如权利要求1-5中任一权利要求所述的网页截图方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1-5中任一权利要求所述的网页截图方法。
CN201710894941.8A 2017-09-28 2017-09-28 一种网页截图方法、装置、存储介质和处理器 Pending CN110020240A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710894941.8A CN110020240A (zh) 2017-09-28 2017-09-28 一种网页截图方法、装置、存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710894941.8A CN110020240A (zh) 2017-09-28 2017-09-28 一种网页截图方法、装置、存储介质和处理器

Publications (1)

Publication Number Publication Date
CN110020240A true CN110020240A (zh) 2019-07-16

Family

ID=67186356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710894941.8A Pending CN110020240A (zh) 2017-09-28 2017-09-28 一种网页截图方法、装置、存储介质和处理器

Country Status (1)

Country Link
CN (1) CN110020240A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021184896A1 (zh) * 2020-03-20 2021-09-23 支付宝(杭州)信息技术有限公司 一种页面截图方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077708A (zh) * 2013-03-28 2014-10-01 北京齐尔布莱特科技有限公司 广告投放截屏方法
CN106227780A (zh) * 2016-07-18 2016-12-14 中国科学院信息工程研究所 一种海量网页的自动化截图取证方法和系统
CN106406851A (zh) * 2016-08-24 2017-02-15 北京松鼠山科技有限公司 一种网页截图方法、系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077708A (zh) * 2013-03-28 2014-10-01 北京齐尔布莱特科技有限公司 广告投放截屏方法
CN106227780A (zh) * 2016-07-18 2016-12-14 中国科学院信息工程研究所 一种海量网页的自动化截图取证方法和系统
CN106406851A (zh) * 2016-08-24 2017-02-15 北京松鼠山科技有限公司 一种网页截图方法、系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
武马群,等: "《Java程序设计》", 30 June 2005 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021184896A1 (zh) * 2020-03-20 2021-09-23 支付宝(杭州)信息技术有限公司 一种页面截图方法及装置

Similar Documents

Publication Publication Date Title
CN108279932B (zh) 一种移动终端动态配置用户界面方法和装置
CN103617191A (zh) 使用硬件加速实现浏览器渲染的方法和浏览器
CN107276842B (zh) 接口测试方法、装置及电子设备
CN109242934B (zh) 一种动画代码的生成方法及设备
US11095957B2 (en) Method and apparatus for publishing information, and method and apparatus for processing information
CN108255999A (zh) 内容推荐方法及装置
CN107305528B (zh) 应用测试方法和装置
JP2007264967A (ja) シナリオ作成プログラム
CN110119401A (zh) 用户画像的处理方法、装置、服务器及存储介质
GB2508875A (en) Defining elements of web pages for variation
CN107391528A (zh) 前端组件依赖信息搜索方法及设备
CN109284115A (zh) 一种生成追踪器脚本的方法及装置
JP7217181B2 (ja) ウェアラブルデバイス、情報処理方法、装置及びシステム
CN107766307A (zh) 一种表单元素联动的方法和设备
CN112860978B (zh) 全局搜索方法和装置
CN114329281A (zh) 渲染服务器、网页渲染方法及装置
CN106020789A (zh) 应用程序包的渠道信息添加方法、系统及打渠道包服务器
CN110020240A (zh) 一种网页截图方法、装置、存储介质和处理器
CN106294700A (zh) 一种日志的存储与读取方法及装置
CN109639559A (zh) 一种微信h5传播监测分析方法及相关设备
CN108011936A (zh) 用于推送信息的方法和装置
CN109471639A (zh) 一种应用下载来源的监测方法及装置
CN105912573A (zh) 数据更新方法及装置
CN109522327A (zh) 信息生成方法、装置和系统
CN115563942A (zh) 一种合同生成方法、装置、电子设备及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190716