CN107784054B - 一种页面发布方法和装置 - Google Patents

一种页面发布方法和装置 Download PDF

Info

Publication number
CN107784054B
CN107784054B CN201710083439.9A CN201710083439A CN107784054B CN 107784054 B CN107784054 B CN 107784054B CN 201710083439 A CN201710083439 A CN 201710083439A CN 107784054 B CN107784054 B CN 107784054B
Authority
CN
China
Prior art keywords
page
information
tkd
published
resource locator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710083439.9A
Other languages
English (en)
Other versions
CN107784054A (zh
Inventor
邹晓晨
于昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201710083439.9A priority Critical patent/CN107784054B/zh
Priority to PCT/CN2018/076666 priority patent/WO2018149400A1/zh
Publication of CN107784054A publication Critical patent/CN107784054A/zh
Application granted granted Critical
Publication of CN107784054B publication Critical patent/CN107784054B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种页面发布方法,用于解决现有页面的TKD信息需要手动生成和加入,导致页面发布效率低下的问题。本发明实施例方法包括:获取待发布页面;获取所述待发布页面的资源定位符;按照预设规则从所述资源定位符中抓取TKD信息;将抓取到的所述TKD信息加入至所述待发布页面;对加入所述TKD信息后的所述待发布页面进行页面发布。本发明实施例还提供一种页面发布装置。

Description

一种页面发布方法和装置
技术领域
本发明涉及网页设计领域,尤其涉及一种页面发布方法和装置。
背景技术
在网站开发和维护过程中,开发人员需要根据业务需求在网站上进行页面的发布。在发布页面之前,为了便于SEO引擎的搜索,提高发布页面的搜索效果,需要在发布页面中加入TKD(title,keywords,description)信息。
目前,页面上的TKD信息均需要开发人员手动进行生成和加入,当一个网站上待发布的页面数量较多时,开发人员的工作量大,容易导致页面发布的效率降低。
发明内容
本发明实施例提供了一种页面发布方法和装置,能够提高页面发布的效率,减少开发人员的工作量。
本发明实施例提供的一种页面发布方法,包括:
获取待发布页面;
获取所述待发布页面的资源定位符;
按照预设规则从所述资源定位符中抓取TKD信息;
将抓取到的所述TKD信息加入至所述待发布页面;
对加入所述TKD信息后的所述待发布页面进行页面发布。
可选地,在按照预设规则从所述资源定位符中抓取TKD信息之前,还包括:
判断所述资源定位符是否符合所述预设规则;
若所述资源定位符不符合所述预设规则,则过滤所述资源定位符;
若所述资源定位符符合所述预设规则,则执行所述按照预设规则从所述资源定位符中抓取TKD信息的步骤。
可选地,在获取所述待发布页面的资源定位符之前,还包括:
获取所述待发布页面的资源所在位置的位置信息;
根据所述位置信息和所述预设规则生成所述待发布页面的资源定位符。
可选地,在将抓取到的所述TKD信息加入至所述待发布页面之前,还包括:
判断在预设时间内是否抓取到所述TKD信息;
若在预设时间内未抓取到所述TKD信息,则发出输入TKD信息的请求信息;
获取输入的TKD信息作为抓取到的TKD信息。
可选地,在获取待发布页面之前,还包括:
获取待发布的页面内容;
根据所述页面内容从预设的页面模板集合中选取对应的页面模板;
将所述页面内容导入选取的所述页面模板中,生成所述待发布页面。
本发明实施例提供的一种页面发布装置,包括:
待发布页面获取模块,用于获取待发布页面;
资源定位符获取模块,用于获取所述待发布页面的资源定位符;
TKD信息抓取模块,用于按照预设规则从所述资源定位符中抓取TKD信息;
TKD信息加入模块,用于将抓取到的所述TKD信息加入至所述待发布页面;
页面发布模块,用于对加入所述TKD信息后的所述待发布页面进行页面发布。
可选地,所述页面发布装置还包括:
定位符判断模块,用于判断所述资源定位符是否符合所述预设规则;
过滤模块,用于若所述定位符判断模块的判断结果为否,则过滤所述资源定位符;
触发模块,用于若所述定位符判断模块的判断结果为是,则触发所述TKD信息抓取模块。
可选地,所述页面发布装置还包括:
位置信息获取模块,用于获取所述待发布页面的资源所在位置的位置信息;
定位符生成模块,用于根据所述位置信息和所述预设规则生成所述待发布页面的资源定位符。
可选地,所述页面发布装置还包括:
TKD信息判断模块,用于判断在预设时间内是否抓取到所述TKD信息;
请求发出模块,用于若所述TKD信息判断模块的判断结果为否,则发出输入TKD信息的请求信息;
TKD信息获取模块,用于获取输入的TKD信息作为抓取到的TKD信息。
可选地,所述页面发布装置还包括:
页面内容获取模块,用于获取待发布的页面内容;
页面模板选取模块,用于根据所述页面内容从预设的页面模板集合中选取对应的页面模板;
待发布页面生成模块,用于将所述页面内容导入选取的所述页面模板中,生成所述待发布页面。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,首先,获取待发布页面以及所述待发布页面的资源定位符;然后,按照预设规则从所述资源定位符中抓取TKD信息;接着,将抓取到的所述TKD信息加入至所述待发布页面;对加入所述TKD信息后的所述待发布页面进行页面发布。在本发明实施例中,通过从待发布页面中抓取TKD信息,然后将抓取得到的TKD信息自动加入待发布页面中,并发布所述待发布页面,实现了TKD信息的自动抓取和加入页面,大大提高了页面发布的效率,减少了开发人员的工作量。
附图说明
图1为本发明实施例中一种页面发布方法第一个实施例流程图;
图2为本发明实施例中一种页面发布方法第二个实施例流程图;
图3为本发明实施例中一种页面发布方法第三个实施例流程图;
图4为本发明实施例中一种页面发布装置第一个实施例结构图;
图5为本发明实施例中一种页面发布装置第二个实施例结构图;
图6为本发明实施例中一种页面发布装置第三个实施例结构图。
具体实施方式
本发明实施例提供了一种页面发布方法和装置,用于解决现有页面的TKD信息需要手动生成和加入,导致页面发布效率低下的问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种页面发布方法第一个实施例包括:
101、获取待发布页面;
本实施例中,首先,可以获取待发布页面。上述的待发布页面指的是在已生成但未进行发布的页面。该待发布页面可以通过CMS(Content Management System)系统进行生成和管理。
102、获取所述待发布页面的资源定位符;
在获取待发布页面之后,可以获取所述待发布页面的资源定位符。可以理解的是,该资源定位符可以为URL定位符,其用于标记出该待发布页面的资源位置,以便当浏览器对该待发布页面进行访问时,可以正确地找到资源位置,并正确地处理它。
进一步地,在获取所述待发布页面的资源定位符之前,可以先生成该待发布页面的资源定位符。其生成资源定位符的步骤具体可以包括:获取所述待发布页面的资源所在位置的位置信息,然后,根据所述位置信息和预设规则生成所述待发布页面的资源定位符。
在一个应用场景下,可以对页面的URL进行如下方式的设计。如http://域名/产品 名称-slogn-平台名.html
其中,对于不同的页面类型,其预设规则也可以不相同。例如,若该待发布页面属于常规的获客页面,则其URL的组成为“产品名称-slogn-平台名”;若该待发布页面属于产品流程页面,则其URL的组成为“功能名-产品名称-slogn-平台名”;若该待发布页面属于平台常规页面,则其URL的组成为“文章名-频道名(若无可减一层)-平台名”;若该待发布页面属于活动页面,则首页的URL的组成为“活动名-slogn-平台名”,内页的URL的组成为“功能名-活动名-slogn-平台名”;若该待发布页面属于其他页面,则其URL的组成为“页面名称-平台名”;等等。
103、按照预设规则从所述资源定位符中抓取TKD信息;
在获取所述待发布页面的资源定位符之后,可以按照预设规则从所述资源定位符中抓取TKD信息。上述的TKD信息指的是title信息、keywords信息和description信息,即主题信息、关键词信息和描述信息,其在搜索引擎优化中,可以便于SEO引擎的搜索,提高发布页面的搜索效果。从所述资源定位符中,可以通过识别资源定位符中的符号来得到主题信息、关键词信息和描述信息,从而抓取出对应的TKD信息。
举例说明,如在上述的应用场景下,由于页面的URL均按照预设规则进行设计,因此,当需要抓取URL的TKD信息时,可以按照该预设规则进行反向抓取即可。例如,对URL中关键字的抓取可以如下所示:
Title:功能名称\文章名称-产品名&slogn\频道名-平台名
Keywords:产品名、产品类型(其中,流程页的keyword可空)
Discraption:产品描述\平台简述\文章概要\活动概述;(流程页的Discraption可空)
通过如上所示的抓取规则,可以轻易地从预先设计好的URL中抓取出TKD信息。
104、将抓取到的所述TKD信息加入至所述待发布页面;
在抓取TKD信息之后,可以将抓取到的所述TKD信息加入至所述待发布页面。在加入所述待发布页面时,可以重新加载该待发布页面,以更新该待发布页面。
进一步地,在将抓取到的所述TKD信息加入至所述待发布页面之前,可以判断在预设时间内是否抓取到所述TKD信息,若否,则发出输入TKD信息的请求信息,然后,获取输入的TKD信息作为抓取到的TKD信息。
可以理解的是,若在预设时间内未抓取到所述TKD信息,则可以认为当前的待发布页面的TKD信息抓取失败,此时,为了保证待发布页面的正常发布,可以发出输入TKD信息的请求信息,要求开发人员手动输入该待发布页面的TKD信息,然后,获取输入的TKD信息作为抓取到的TKD信息,继续后续步骤。
105、对加入所述TKD信息后的所述待发布页面进行页面发布。
在将抓取到的所述TKD信息加入至所述待发布页面,可以对加入所述TKD信息后的所述待发布页面进行页面发布。
可以理解的是,在待发布页面发布后,由于发布的页面中加入有TKD信息,因此,当SEO引擎扫描到该页面时,可以检测到该页面中包含有TKD信息,然后将该TKD信息加入至SEO引擎中,方便以后对该页面的搜索。
本实施例中,首先,获取待发布页面以及所述待发布页面的资源定位符;然后,按照预设规则从所述资源定位符中抓取TKD信息;接着,将抓取到的所述TKD信息加入至所述待发布页面;对加入所述TKD信息后的所述待发布页面进行页面发布。在本实施例中,通过从待发布页面中抓取TKD信息,然后将抓取得到的TKD信息自动加入待发布页面中,并发布所述待发布页面,实现了TKD信息的自动抓取和加入页面,大大提高了页面发布的效率,减少了开发人员的工作量。
为便于理解,下面将对本发明中一种页面发布方法进行更加详细的描述,请参阅图2,本发明实施例中一种页面发布方法第二个实施例包括:
201、获取待发布页面;
本实施例中,首先,可以获取待发布页面。上述的待发布页面指的是在已生成但未进行发布的页面。该待发布页面可以通过CMS(Content Management System)系统进行生成和管理。
202、获取所述待发布页面的资源定位符;
在获取待发布页面之后,可以获取所述待发布页面的资源定位符。可以理解的是,该资源定位符可以为URL定位符,其用于标记出该待发布页面的资源位置,以便当浏览器对该待发布页面进行访问时,可以正确地找到资源位置,并正确地处理它。
进一步地,在获取所述待发布页面的资源定位符之前,可以先生成该待发布页面的资源定位符。其生成资源定位符的步骤具体可以包括:获取所述待发布页面的资源所在位置的位置信息,然后,根据所述位置信息和预设规则生成所述待发布页面的资源定位符。
在一个应用场景下,可以对页面的URL进行如下方式的设计。如http://域名/产品 名称-slogn-平台名.html
其中,对于不同的页面类型,其预设规则也可以不相同。例如,若该待发布页面属于常规的获客页面,则其URL的组成为“产品名称-slogn-平台名”;若该待发布页面属于产品流程页面,则其URL的组成为“功能名-产品名称-slogn-平台名”;若该待发布页面属于平台常规页面,则其URL的组成为“文章名-频道名(若无可减一层)-平台名”;若该待发布页面属于活动页面,则首页的URL的组成为“活动名-slogn-平台名”,内页的URL的组成为“功能名-活动名-slogn-平台名”;若该待发布页面属于其他页面,则其URL的组成为“页面名称-平台名”;等等。
203、判断所述资源定位符是否符合所述预设规则,若否,则执行步骤204,若是,则执行步骤205;
在获取所述待发布页面的资源定位符之后,可以判断所述资源定位符是否符合所述预设规则,若否,则执行步骤204,若是,则执行步骤205。可以理解的是,由于并非所有的资源定位符均符合预设规则,部分资源定位符可能不符合预设规则,此时,为提高批量处理待发布页面的发布,可以执行步骤204,将不符合预设规则的资源定位符过滤掉。
204、过滤所述资源定位符;
若所述资源定位符不符合所述预设规则,则过滤所述资源定位符。可以理解的是,本实施例中的一种页面发布方法在应用于对大量的待发布页面进行发布处理时,假设一个待发布页面对应有一个资源定位符,则N个待发布页面对应有N个资源定位符,此时,若这些资源定位符中存在不符合预设规则的定位符,则容易对后续TKD信息抓取的效率造成影响,因此可以将这些不符合预设规则的资源定位符过滤掉。
205、按照预设规则从所述资源定位符中抓取TKD信息;
在获取所述待发布页面的资源定位符之后并且所述资源定位符符合预设规则时,可以按照预设规则从所述资源定位符中抓取TKD信息。上述的TKD信息指的是title信息、keywords信息和description信息,即主题信息、关键词信息和描述信息,其在搜索引擎优化中,可以便于SEO引擎的搜索,提高发布页面的搜索效果。从所述资源定位符中,可以通过识别资源定位符中的符号来得到主题信息、关键词信息和描述信息,从而抓取出对应的TKD信息。
举例说明,如在上述的应用场景下,由于页面的URL均按照预设规则进行设计,因此,当需要抓取URL的TKD信息时,可以按照该预设规则进行反向抓取即可。例如,对URL中关键字的抓取可以如下所示:
Title:功能名称\文章名称-产品名&slogn\频道名-平台名
Keywords:产品名、产品类型(其中,流程页的keyword可空)
Discraption:产品描述\平台简述\文章概要\活动概述;(流程页的Discraption可空)
通过如上所示的抓取规则,可以轻易地从预先设计好的URL中抓取出TKD信息。
206、将抓取到的所述TKD信息加入至所述待发布页面;
在抓取TKD信息之后,可以将抓取到的所述TKD信息加入至所述待发布页面。在加入所述待发布页面时,可以重新加载该待发布页面,以更新该待发布页面。
进一步地,在将抓取到的所述TKD信息加入至所述待发布页面之前,可以判断在预设时间内是否抓取到所述TKD信息,若否,则发出输入TKD信息的请求信息,然后,获取输入的TKD信息作为抓取到的TKD信息。
可以理解的是,若在预设时间内未抓取到所述TKD信息,则可以认为当前的待发布页面的TKD信息抓取失败,此时,为了保证待发布页面的正常发布,可以发出输入TKD信息的请求信息,要求开发人员手动输入该待发布页面的TKD信息,然后,获取输入的TKD信息作为抓取到的TKD信息,继续后续步骤。
207、对加入所述TKD信息后的所述待发布页面进行页面发布。
在将抓取到的所述TKD信息加入至所述待发布页面,可以对加入所述TKD信息后的所述待发布页面进行页面发布。
可以理解的是,在待发布页面发布后,由于发布的页面中加入有TKD信息,因此,当SEO引擎扫描到该页面时,可以检测到该页面中包含有TKD信息,然后将该TKD信息加入至SEO引擎中,方便以后对该页面的搜索。
上面主要从资源定位符的过滤方面进行描述,下面将从另一方面对本发明中一种页面发布方法进行更加详细的描述,请参阅图3,本发明实施例中一种页面发布方法第三个实施例包括:
301、获取待发布的页面内容;
本实施例中,为便于业务人员对网站的页面进行开发,可以先获取待发布的页面内容。
302、根据所述页面内容从预设的页面模板集合中选取对应的页面模板;
在获取待发布的页面内容之后,可以根据所述页面内容从预设的页面模板集合中选取对应的页面模板。可以理解的是,可以针对不同类型的页面内容设置一个、两个或多个不同的页面模板,这些页面模板具有预先设置的页面样式,将页面内容导入至合适的页面模板中,既可以完成页面的快速生成,无需业务人员学习或理解页面的生成机制或复杂的页面处理操作,大大简化了页面的发布要求。
303、将所述页面内容导入选取的所述页面模板中,生成所述待发布页面;
在选取到对应的页面模板之后,可以将所述页面内容导入选取的所述页面模板中,生成所述待发布页面。
304、获取待发布页面;
在生成所述待发布页面之后,可以获取待发布页面。上述的待发布页面指的是在已生成但未进行发布的页面。该待发布页面可以通过CMS(Content Management System)系统进行生成和管理。
305、获取所述待发布页面的资源定位符;
在获取待发布页面之后,可以获取所述待发布页面的资源定位符。可以理解的是,该资源定位符可以为URL定位符,其用于标记出该待发布页面的资源位置,以便当浏览器对该待发布页面进行访问时,可以正确地找到资源位置,并正确地处理它。
进一步地,在获取所述待发布页面的资源定位符之前,可以先生成该待发布页面的资源定位符。其生成资源定位符的步骤具体可以包括:获取所述待发布页面的资源所在位置的位置信息,然后,根据所述位置信息和预设规则生成所述待发布页面的资源定位符。
在一个应用场景下,可以对页面的URL进行如下方式的设计。如http://域名/产品 名称-slogn-平台名.html
其中,对于不同的页面类型,其预设规则也可以不相同。例如,若该待发布页面属于常规的获客页面,则其URL的组成为“产品名称-slogn-平台名”;若该待发布页面属于产品流程页面,则其URL的组成为“功能名-产品名称-slogn-平台名”;若该待发布页面属于平台常规页面,则其URL的组成为“文章名-频道名(若无可减一层)-平台名”;若该待发布页面属于活动页面,则首页的URL的组成为“活动名-slogn-平台名”,内页的URL的组成为“功能名-活动名-slogn-平台名”;若该待发布页面属于其他页面,则其URL的组成为“页面名称-平台名”;等等。
306、判断所述资源定位符是否符合所述预设规则,若否,则执行步骤307,若是,则执行步骤308;
在获取所述待发布页面的资源定位符之后,可以判断所述资源定位符是否符合所述预设规则,若否,则执行步骤307,若是,则执行步骤308。可以理解的是,由于并非所有的资源定位符均符合预设规则,部分资源定位符可能不符合预设规则,此时,为提高批量处理待发布页面的发布,可以执行步骤307,将不符合预设规则的资源定位符过滤掉。
307、过滤所述资源定位符;
若所述资源定位符不符合所述预设规则,则过滤所述资源定位符。可以理解的是,本实施例中的一种页面发布方法在应用于对大量的待发布页面进行发布处理时,假设一个待发布页面对应有一个资源定位符,则N个待发布页面对应有N个资源定位符,此时,若这些资源定位符中存在不符合预设规则的定位符,则容易对后续TKD信息抓取的效率造成影响,因此可以将这些不符合预设规则的资源定位符过滤掉。
308、按照预设规则从所述资源定位符中抓取TKD信息;
在获取所述待发布页面的资源定位符之后并且所述资源定位符符合预设规则时,可以按照预设规则从所述资源定位符中抓取TKD信息。上述的TKD信息指的是title信息、keywords信息和description信息,即主题信息、关键词信息和描述信息,其在搜索引擎优化中,可以便于SEO引擎的搜索,提高发布页面的搜索效果。从所述资源定位符中,可以通过识别资源定位符中的符号来得到主题信息、关键词信息和描述信息,从而抓取出对应的TKD信息。
举例说明,如在上述的应用场景下,由于页面的URL均按照预设规则进行设计,因此,当需要抓取URL的TKD信息时,可以按照该预设规则进行反向抓取即可。例如,对URL中关键字的抓取可以如下所示:
Title:功能名称\文章名称-产品名&slogn\频道名-平台名
Keywords:产品名、产品类型(其中,流程页的keyword可空)
Discraption:产品描述\平台简述\文章概要\活动概述;(流程页的Discraption可空)
通过如上所示的抓取规则,可以轻易地从预先设计好的URL中抓取出TKD信息。
309、将抓取到的所述TKD信息加入至所述待发布页面;
在抓取TKD信息之后,可以将抓取到的所述TKD信息加入至所述待发布页面。在加入所述待发布页面时,可以重新加载该待发布页面,以更新该待发布页面。
进一步地,在将抓取到的所述TKD信息加入至所述待发布页面之前,可以判断在预设时间内是否抓取到所述TKD信息,若否,则发出输入TKD信息的请求信息,然后,获取输入的TKD信息作为抓取到的TKD信息。
可以理解的是,若在预设时间内未抓取到所述TKD信息,则可以认为当前的待发布页面的TKD信息抓取失败,此时,为了保证待发布页面的正常发布,可以发出输入TKD信息的请求信息,要求开发人员手动输入该待发布页面的TKD信息,然后,获取输入的TKD信息作为抓取到的TKD信息,继续后续步骤。
310、对加入所述TKD信息后的所述待发布页面进行页面发布。
在将抓取到的所述TKD信息加入至所述待发布页面,可以对加入所述TKD信息后的所述待发布页面进行页面发布。
可以理解的是,在待发布页面发布后,由于发布的页面中加入有TKD信息,因此,当SEO引擎扫描到该页面时,可以检测到该页面中包含有TKD信息,然后将该TKD信息加入至SEO引擎中,方便以后对该页面的搜索。当用户再次访问时,则可以发现SEO引擎中已包含有该TKD信息,可以从SEO搜索页中检查到对应的关键字,从而便于再次访问到该页面。
上面主要描述了一种页面发布方法,下面将对一种页面发布装置进行详细描述。
图4示出了本发明实施例中一种页面发布装置第一个实施例结构图。
本实施例中,一种页面发布装置包括:
待发布页面获取模块401,用于获取待发布页面;
资源定位符获取模块402,用于获取所述待发布页面的资源定位符;
TKD信息抓取模块403,用于按照预设规则从所述资源定位符中抓取TKD信息;
TKD信息加入模块404,用于将抓取到的所述TKD信息加入至所述待发布页面;
页面发布模块405,用于对加入所述TKD信息后的所述待发布页面进行页面发布。
图5示出了本发明实施例中一种页面发布装置第二个实施例结构图。
如图5所示,进一步地,所述页面发布装置还包括:
定位符判断模块406,用于判断所述资源定位符是否符合所述预设规则;
过滤模块407,用于若所述定位符判断模块406的判断结果为否,则过滤所述资源定位符;
触发模块408,用于若所述定位符判断模块406的判断结果为是,则触发所述TKD信息抓取模块。
进一步地,所述页面发布装置还包括:
位置信息获取模块409,用于获取所述待发布页面的资源所在位置的位置信息;
定位符生成模块410,用于根据所述位置信息和所述预设规则生成所述待发布页面的资源定位符。
图6示出了本发明实施例中一种页面发布装置第三个实施例结构图。
如图6所示,进一步地,所述页面发布装置还包括:
TKD信息判断模块411,用于判断在预设时间内是否抓取到所述TKD信息;
请求发出模块412,用于若所述TKD信息判断模块411的判断结果为否,则发出输入TKD信息的请求信息;
TKD信息获取模块413,用于获取输入的TKD信息作为抓取到的TKD信息。
进一步地,所述页面发布装置还包括:
页面内容获取模块414,用于获取待发布的页面内容;
页面模板选取模块415,用于根据所述页面内容从预设的页面模板集合中选取对应的页面模板;
待发布页面生成模块416,用于将所述页面内容导入选取的所述页面模板中,生成所述待发布页面。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种页面发布方法,其特征在于,包括:
获取待发布页面,所述待发布页面指的是已生成但未进行发布的页面;
获取所述待发布页面的资源定位符;
按照预设规则通过识别所述资源定位符中的符号从所述资源定位符中抓取TKD信息;
判断在预设时间内是否抓取到所述TKD信息;
若在预设时间内未抓取到所述TKD信息,则发出输入TKD信息的请求信息;
获取输入的TKD信息作为抓取到的TKD信息;
将抓取到的所述TKD信息加入至所述待发布页面,在加入至所述待发布页面时,重新加载所述待发布页面以更新所述待发布页面;
对加入所述TKD信息后的所述待发布页面进行页面发布;
所述在按照预设规则从所述资源定位符中抓取TKD信息之前,还包括:
判断所述资源定位符是否符合所述预设规则;
若所述资源定位符不符合所述预设规则,则过滤所述资源定位符;
若所述资源定位符符合所述预设规则,则执行所述按照预设规则从所述资源定位符中抓取TKD信息的步骤。
2.根据权利要求1所述的页面发布方法,其特征在于,在获取所述待发布页面的资源定位符之前,还包括:
获取所述待发布页面的资源所在位置的位置信息;
根据所述位置信息和所述预设规则生成所述待发布页面的资源定位符。
3.根据权利要求1或2所述的页面发布方法,其特征在于,在获取待发布页面之前,还包括:
获取待发布的页面内容;
根据所述页面内容从预设的页面模板集合中选取对应的页面模板;
将所述页面内容导入选取的所述页面模板中,生成所述待发布页面。
4.一种页面发布装置,其特征在于,包括:
待发布页面获取模块,用于获取待发布页面,所述待发布页面指的是已生成但未进行发布的页面;
资源定位符获取模块,用于获取所述待发布页面的资源定位符;
TKD信息抓取模块,用于按照预设规则通过识别所述资源定位符中的符号从所述资源定位符中抓取TKD信息;
TKD信息判断模块,用于判断在预设时间内是否抓取到所述TKD信息;
请求发出模块,用于若所述TKD信息判断模块的判断结果为否,则发出输入TKD信息的请求信息;
TKD信息获取模块,用于获取输入的TKD信息作为抓取到的TKD信息;
TKD信息加入模块,用于将抓取到的所述TKD信息加入至所述待发布页面,在加入至所述待发布页面时,重新加载所述待发布页面以更新所述待发布页面;
页面发布模块,用于对加入所述TKD信息后的所述待发布页面进行页面发布;
所述页面发布装置还包括:
定位符判断模块,用于判断所述资源定位符是否符合所述预设规则;
过滤模块,用于若所述定位符判断模块的判断结果为否,则过滤所述资源定位符;
触发模块,用于若所述定位符判断模块的判断结果为是,则触发所述TKD信息抓取模块。
5.根据权利要求4所述的页面发布装置,其特征在于,所述页面发布装置还包括:
位置信息获取模块,用于获取所述待发布页面的资源所在位置的位置信息;
定位符生成模块,用于根据所述位置信息和所述预设规则生成所述待发布页面的资源定位符。
6.根据权利要求4或5所述的页面发布装置,其特征在于,所述页面发布装置还包括:
页面内容获取模块,用于获取待发布的页面内容;
页面模板选取模块,用于根据所述页面内容从预设的页面模板集合中选取对应的页面模板;
待发布页面生成模块,用于将所述页面内容导入选取的所述页面模板中,生成所述待发布页面。
CN201710083439.9A 2017-02-16 2017-02-16 一种页面发布方法和装置 Active CN107784054B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710083439.9A CN107784054B (zh) 2017-02-16 2017-02-16 一种页面发布方法和装置
PCT/CN2018/076666 WO2018149400A1 (zh) 2017-02-16 2018-02-13 一种页面发布方法、可读存储介质、终端设备及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710083439.9A CN107784054B (zh) 2017-02-16 2017-02-16 一种页面发布方法和装置

Publications (2)

Publication Number Publication Date
CN107784054A CN107784054A (zh) 2018-03-09
CN107784054B true CN107784054B (zh) 2021-01-29

Family

ID=61437719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710083439.9A Active CN107784054B (zh) 2017-02-16 2017-02-16 一种页面发布方法和装置

Country Status (2)

Country Link
CN (1) CN107784054B (zh)
WO (1) WO2018149400A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143645A (zh) * 2018-11-02 2020-05-12 千寻位置网络有限公司 利用网络爬虫进行seo自动优化的方法及装置
CN109635211B (zh) * 2018-11-26 2021-03-05 网宿科技股份有限公司 推广页面的实现方法及服务器

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1932817A (zh) * 2006-09-15 2007-03-21 陈远 通用互联网内容关键词交互系统
CN101262494A (zh) * 2008-01-23 2008-09-10 华为技术有限公司 对发布信息进行处理的方法、客户端、服务器和系统
CN102314463A (zh) * 2010-07-07 2012-01-11 北京瑞信在线系统技术有限公司 分布式爬虫系统及其提取网页数据的方法
CN102567532A (zh) * 2011-12-30 2012-07-11 奇智软件(北京)有限公司 一种信息发布方法及装置
CN104462131A (zh) * 2013-09-23 2015-03-25 阿里巴巴集团控股有限公司 信息发布页面的处理方法及装置
CN104516917B (zh) * 2013-09-30 2019-10-11 腾讯科技(北京)有限公司 一种获取社区信息的方法及装置
US20160070791A1 (en) * 2014-09-05 2016-03-10 Chegg, Inc. Generating Search Engine-Optimized Media Question and Answer Web Pages
CN105183888A (zh) * 2015-09-28 2015-12-23 北京奇虎科技有限公司 基于浏览器的数据处理方法和浏览器
CN106407344B (zh) * 2016-09-06 2019-11-15 努比亚技术有限公司 一种生成搜索引擎优化标签的方法和系统

Also Published As

Publication number Publication date
CN107784054A (zh) 2018-03-09
WO2018149400A1 (zh) 2018-08-23

Similar Documents

Publication Publication Date Title
WO2017071189A1 (zh) 网页的访问方法、装置、设备及非易失性计算机存储介质
US8903800B2 (en) System and method for indexing food providers and use of the index in search engines
US20150295942A1 (en) Method and server for performing cloud detection for malicious information
CN107908694A (zh) 互联网新闻的舆情聚类分析方法、应用服务器及计算机可读存储介质
US7860971B2 (en) Anti-spam tool for browser
CN109376291B (zh) 一种基于网络爬虫的网站指纹信息扫描的方法及装置
US8739024B2 (en) Method and apparatus for processing world wide web page
WO2012154348A1 (en) Generation of topic-based language models for an app search engine
US8793120B1 (en) Behavior-driven multilingual stemming
CN107085549B (zh) 故障信息生成的方法和装置
TWI524302B (zh) 用以對至少一社交網路上之複數動態消息執行合併控制的方法、相對應裝置、以及相對應的電腦程式產品
CN108228875B (zh) 基于完美哈希的日志解析方法及装置
CN109101607B (zh) 用于搜索区块链数据的方法、装置及存储介质
CN110929145A (zh) 舆情分析方法、装置、计算机装置及存储介质
CN106599270B (zh) 网络数据抓取方法和爬虫
CN104391978A (zh) 用于浏览器的网页收藏处理方法及装置
CN106302849A (zh) 一种通过运营商数据进行移固融合的方法
CN112818200A (zh) 基于静态网站的数据爬取及事件分析方法及系统
CN107784054B (zh) 一种页面发布方法和装置
CN108153741A (zh) 基于多语言高效数据采集方法、计算机程序
CN106933903B (zh) 应用于分布式存储的存储方法及装置
CN108108381B (zh) 页面的监测方法及装置
US9749352B2 (en) Apparatus and method for collecting harmful website information
CN103914479A (zh) 资源请求的匹配方法和装置
CN112232075A (zh) 基于时间格式和网页元素特征的文章发布时间识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant