CN103793428B - 网页摘要信息的生成方法和装置 - Google Patents

网页摘要信息的生成方法和装置 Download PDF

Info

Publication number
CN103793428B
CN103793428B CN201210430025.6A CN201210430025A CN103793428B CN 103793428 B CN103793428 B CN 103793428B CN 201210430025 A CN201210430025 A CN 201210430025A CN 103793428 B CN103793428 B CN 103793428B
Authority
CN
China
Prior art keywords
web page
digest information
page digest
information
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210430025.6A
Other languages
English (en)
Other versions
CN103793428A (zh
Inventor
陈伟列
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Singapore Holdings Pte Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210430025.6A priority Critical patent/CN103793428B/zh
Publication of CN103793428A publication Critical patent/CN103793428A/zh
Application granted granted Critical
Publication of CN103793428B publication Critical patent/CN103793428B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种网页摘要信息的生成方法和装置,其中,该方法包括:网页摘要信息服务器接收来自网站应用服务器的请求信息,其中,请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数;网页摘要信息服务器将网页摘要信息样式发送给网站应用服务器,以使网站应用服务器根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成最终网页对应的网页摘要信息。本申请解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,从而造成的网页摘要信息容易被篡改,对摘要信息的修改较为复杂的技术问题,达到了提高维护摘要信息的灵活性和保证摘要信息的准确性的技术效果。

Description

网页摘要信息的生成方法和装置
技术领域
本申请涉及互联网领域,具体而言,涉及一种网页摘要信息的生成方法和装置。
背景技术
Meta标签是一个网站的html代码中很重要的组成部分,Meta标签虽然不作为网页设计的一部分展示出来,然而它们会被搜索引擎所读取,通常它们包含对网页内容的简洁描述,一般包含一些关键词或者是关键信息,就相当于这个网页的一个摘要信息。Meta信息是否能真实地反映网页内容的主要信息从一定程度上会影响网站的用户体验。
目前,Meta标签一般都包含在网页html代码的<head>和</head>之间,主要包括以下几个标签内容:title、description、keywords以及robot tag等。举例而言对于如下的一段代码:
在<head>和</head>之间的就是Meta标签,即该网页对应的网页摘要信息。
相关技术中,最常见的技术就是将Meta标签以硬编码或者半硬编码的方式嵌入到html代码中。下面对硬编码和半硬编码进行详细的描述。
硬编码的方式,就是直接将Meta标签内容固定地写死在html代码中,所有网站用户访问该页面看到的结果都是一样的。很多网站的首页的Meta标签信息都是采用硬编码的方式进行编辑的。
半硬编码的方式,就是提取出Meta信息相同的内容,然后按照用户的查询条件的不同展示不同的Meta标签信息。例如,当用户在某个网站上搜索mp3时,看到的结果html代码中Meta标签部分的内容为:
当用户在该网站上搜索apple时,看到的html代码中的Meta标签部分的内容为:
即,半硬编码的方式也被写在了html代码中,在展示的时候,仅是里面对应着搜索词的部分的信息改变了,其它部分的内容是完全相同的。
然而,对于上述两种方式,主要存在以下两个问题:
1)Meta标签的文本信息都是直接分散在各个代码模块中的,即,每个代码模块中都存储有自身所对应的Meta信息,以及其它的代码信息,并没有将Meta信息和其他的网页代码有效地区分开。这样在对其它代码进行更改时,就有可能导致相应的Meta信息被篡改。同样的,在对Meta信息进行修改时,也可能会产生误操作,修改了其它的网页代码,因此,在对Meta信息进行维护时维护的难度比较大,降低了对Meta信息进行修改时的修改效率和准确性。
2)对于上述的两种方式,Meta信息与应用是耦合在一起的,对于Meta信息的修改必须要等到应用发布到生产环境之后才能使得修改的Meta信息生效,即,只有该修改后的Meta信息对应的代码在应用中被执行,该Meta信息对应的修改内容才能生效,修改的实时性较低。
针对上述问题,尚未提出有效的解决方法。
发明内容
本申请提供了一种网页摘要信息的生成方法和装置,以至少解决现有技术中网页摘要信息被硬编码在网站应用服务器的代码中而造成的网页摘要信息容易被篡改、对网页摘要信息的修改较为复杂的技术问题。
根据本申请的一个方面,提供了一种网页摘要信息的生成方法,包括:网页摘要信息服务器接收来自网站应用服务器的请求信息,其中,上述请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,上述请求信息包括:用于唯一标识网页的标识信息;上述网页摘要信息服务器查找与上述标识信息对应的网页摘要信息样式,其中,上述网页摘要信息样式中包括一个或多个用于表示与上述网页对应的网页摘要信息的变量;上述网页摘要信息服务器根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息,并将上述生成的上述网页摘要信息发送给上述网站应用服务器,或者,上述网页摘要信息服务器将上述网页摘要信息样式发送给上述网站应用服务器,以使上述网站应用服务器根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息。
优选地,在上述网页摘要信息服务器接收来自网站应用服务器的请求信息之前,上述方法还包括:上述网页摘要信息服务器根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。
优选地,上述网页摘要信息服务器查找与上述标识信息对应的网页摘要信息样式的步骤包括:上述网页摘要信息服务器查找在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式。
优选地,上述网页摘要信息服务器查找在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式的步骤包括:上述网页摘要信息服务器判断查找到的与上述标识信息对应的网页摘要信息样式是否包括生效时间段;若包括上述生效时间段,则判断上述请求信息的接收时间是否位于上述生效时间段内,若位于上述生效时间段内,则将查找到的上述网页摘要信息样式作为在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式;若不包括上述生效时间段,则将查找到的上述网页摘要信息样式作为在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式。
优选地,在上述网页摘要信息服务器将上述网页摘要信息样式发送给上述网站应用服务器之后,上述方法还包括:上述网站应用服务器从缓存中读取上述用于生成网页摘要信息的参数,并根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息。
优选地,上述网页摘要信息样式包括:用于唯一标识网页的第一变量,用于表示网页标题的第二变量,用于表示网页关键词的第三变量,用于表示网页内容的第四变量,用于表示生效时间段的第五变量;上述网页摘要信息包括:Meta信息,其中,上述Meta信息包括:与上述第二变量对应的用于表示网页标题的参数,与上述第三变量对应的用于表示网页关键词的参数,与上述第四变量对应的用于表示网页内容的参数。
根据本申请的另一方面,提供了一种网页摘要信息的生成装置,包括:接收单元,用于接收来自网站应用服务器的请求信息,其中,上述请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,上述请求信息包括:用于唯一标识网页的标识信息;查找单元,用于查找与上述标识信息对应的网页摘要信息样式,其中,上述网页摘要信息样式中包括一个或多个用于表示与上述网页对应的网页摘要信息的变量;生成单元,用于根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息,并将上述生成的上述网页摘要信息发送给上述网站应用服务器;或者,发送单元,用于将上述网页摘要信息样式发送给上述网站应用服务器,以使上述网站应用服务器根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息。
优选地,上述装置还包括:设置单元,用于在上述网页摘要信息服务器接收来自网站应用服务器的请求信息之前,根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。
优选地,上述查找单元包括:查找模块,用于查找在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式。
优选地,上述查找模块包括:第一判断子模块,用于判断查找到的与上述标识信息对应的网页摘要信息样式是否包括生效时间段;第二判断子模块,用于在判断出包括上述生效时间段的情况下,判断上述请求信息的接收时间是否位于上述生效时间段内,若位于上述生效时间段内,则将查找到的上述网页摘要信息样式作为在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式;生成子模块,用于在判断出不包括上述生效时间段的情况下,将查找到的上述网页摘要信息样式作为在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式。
在本申请中,将网页摘要信息样式存储在了网页摘要信息服务器中,网站应用服务器只需要向网页摘要信息服务器发送一个携带有样式标识的请求消息,就可以获取到相应的摘要信息样式或者是一个完整的摘要信息,从而解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,在对其它代码进行更改时容易造成网页摘要信息被篡改,以及对摘要信息的修改较为复杂的技术问题,达到了提高摘要信息的维护效率和保证摘要信息的准确性的技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的摘要信息的生成系统的一种优选结构框图;
图2是根据本申请实施例的摘要信息的生成装置的一种优选结构框图;
图3是根据本申请实施例的摘要信息的生成装置的另一种优选结构框图;
图4是根据本申请实施例的摘要信息的生成装置的又一种优选结构框图;
图5是根据本申请实施例的摘要信息的生成装置的又一种优选结构框图;
图6是根据本申请实施例的摘要信息的生成方法的一种优选流程图;
图7是根据本申请实施例的摘要信息的生成方法的另一种优选流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在描述本申请的各实施例的进一步细节之前,将参考图1来描述可用于实现本申请的原理的一个合适的计算体系结构。在以下描述中,除非另外指明,否则将参考由一个或多个计算机执行的动作和操作的符号表示来描述本申请的各实施例。由此,可以理解,有时被称为计算机执行的这类动作和操作包括计算机的处理单元对以结构化形式表示数据的电信号的操纵。这一操纵转换了数据或在计算机的存储器系统中的位置上维护它,这以本领域的技术人员都理解的方式重配置或改变了计算机的操作。维护数据的数据结构是具有数据的格式所定义的特定属性的存储器的物理位置。然而,尽管在上述上下文中描述本申请,但它并不意味着限制性的,如本领域的技术人员所理解的,后文所描述的动作和操作的各方面也可用硬件来实现。
转向附图,其中相同的参考标号指代相同的元素,本申请的原理被示为在一个合适的计算环境中实现。以下描述基于所述的本申请的实施例,并且不应认为是关于此处未明确描述的替换实施例而限制本申请。
图1示出了可用于这些设备的一个示例计算机体系结构的示意图。出于描述的目的,所绘的体系结构仅为合适环境的一个示例,并非对本申请的使用范围或功能提出任何局限。也不应将该计算系统解释为对图1所示的任一组件或其组合具有任何依赖或需求。
本申请的原理可以使用其它通用或专用计算或通信环境或配置来操作。适用于本申请的众所周知的计算系统、环境和配置的示例包括但不限于,个人计算机、服务器,多处理器系统、基于微处理的系统、小型机、大型计算机、以及包括任一上述系统或设备的分布式计算环境。
在其最基本的配置中,图1中的网页摘要信息的生成系统100至少包括:一个网页摘要信息服务器102以及一个或多个网站应用服务器104。网页摘要信息服务器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置、用于存储数据的存储装置以及与客户端通信的传输装置;网站应用服务器104可以包括:微处理器MCU、与服务器通信的传输装置、与用户交互的显示装置。在本说明书和权利要求书中,“系统”也可以被定义为能够执行软件、固件或微码来实现功能的任何硬件组件或硬件组件的组合网页摘要信息的生成系统100甚至可以是分布式的,以实现分布式功能。
如本申请所使用的,术语“模块”、“组件”或“单元”可以指在网页摘要信息的生成系统100上执行的软件对象或例程。此处所描述的不同组件、模块、单元、引擎和服务可被实现为在网页摘要信息的生成系统100上执行(例如,作为单独的线程)的对象或进程。尽管此处所描述的系统和方法较佳地以软件来实现,但是硬件或软件和硬件的组合的实现也是可能并被构想的。
实施例1
图2是根据本申请实施例网页摘要信息的生成装置的一种优选的结构示意图,优选的,本实施例中的装置位于网页摘要信息服务器102上。
优选的,如图2所示的网页摘要信息的生成装置200可以包括:接收单元202、查找单元204、生成单元206、以及发送单元208,下面对这几个结构进行具体的描述。
1)接收单元202,用于接收来自网站应用服务器的请求信息,其中,请求信息包括但不仅限于用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,请求信息中也可以仅携带有用于唯一标识网页的标识信息,而不携带用于生成网页摘要信息的参数;
即,在本实施例中新增了一个专门用于对网页摘要信息(即上文的Mate标签)进行集中管理的服务器:网页摘要信息服务器。当网站应用服务器需要获取摘要信息时,仅需要向网页摘要服务器发送相应的请求消息,在里面携带一定的标识信息即可,这样网页摘要信息服务器就会进行相应的处理,返回对应的网页摘要信息样式或者是返回完整的网页摘要信息。其中,所述网页摘要信息服务器和网站应用服务器可以是物理上相互独立的两台或多台服务器,也可以是一台服务器中的具有各自功能的应用程序或模块。本申请对此并不做限定。
2)查找单元204,与接收单元202耦合,用于查找与标识信息对应的网页摘要信息样式,其中,网页摘要信息样式中包括一个或多个用于表示与网页对应的网页摘要信息的变量;
在网页摘要服务器中存储了很多网页摘要信息的样式,所谓的样式就是一些框架,其中包含很多未被赋值的变量。只需要为这些样式中的变量赋予不同的值也就可以得到不同的摘要信息。同时,将摘要信息的样式都放在了网页摘要信息服务器侧,实现了网页摘要信息的统一管理,同时也就将网页摘要信息和其它的网页代码分离开了,对摘要信息的样式的改变或者是对其中变量的参数的改变也都不会影响网页代码中的非摘要信息代码。
例如,在网页摘要信息样式中可以但不限于包括以下至少之一:用于唯一标识网页的第一变量(pageid),用于表示网页标题的第二变量(title pattern),用于表示网页关键词的第三变量(keyword pattern),用于表示网页内容的第四变量(descriptionpattern),用于表示生效时间段的第五变量(Effective Time);相应的网页摘要信息就包括:Meta信息(即,最终生成的网页摘要信息中的参数信息),其中,Meta信息包括:与第二变量对应的用于表示网页标题的参数,与第三变量对应的用于表示网页关键词的参数,与第四变量对应的用于表示网页内容的参数。
举例而言,对于每一个网页摘要信息样式(Meta pattern)可以是网页摘要信息服务器(也可以称之为Meta仓库)中最小可用单位,可以采用以下的结构来标识一个网页摘要信息的样式的相关内容:(pageid,title pattern,keyword pattern,descriptionpattern)
其中,pageid用于标识该网页摘要信息样式,一个样式唯一对应一个pageid,该字段的类型可以为一串字符。优选的,可以为每种网页页面类型定义一个或多个样式。例如以某个购物网站为例,其对应的网页页面类型可以有:网站首页、网站的搜索列表页面、产品的详细描述页面。这样就可以分别为网站首页、网站的搜索列表页面、产品的详细描述页面定义一些样式以供选择。
对于上述的Title pattern、keyword pattern以及description pattern所对应的字段中就有预先设定好的变量,这些变量所对应的具体的值在网站应用服务器请求网页摘要信息时通过网站应用服务器传递的参数进行替换。
例如,对于下面的网页摘要信息:
{Keyword}Manufacturers &{keyword}Suppliers Directory-Find a{keyword}Manufacturer and Supplier in{category}.Choose Quality{country}Manufacturers,Suppliers,Exporters at Alibaba.com.
其中,keyword为用户参数中的关键词,category为用户参数中的类目,country为用户参数中的国家。对于这些内容都是可以替换的变量,网页摘要信息服务器或者是网站应用服务器就可以利用参数对其进行替换以生成所希望的网页最终摘要信息。
3)生成单元206,与查找单元204耦合,用于根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息,并将生成的网页摘要信息发送给网站应用服务器;或者,
4)发送单元208,与查找单元204耦合,用于将网页摘要信息样式发送给网站应用服务器,以使网站应用服务器根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
即,在上述实施例中提供了两种生成网页摘要信息的方式:
1)网页摘要信息在网页摘要信息服务器侧生成:网站应用服务器需要在请求消息中携带相应的摘要信息的变量所对应的参数,摘要信息服务器根据这些参数生成网页摘要信息之后,就可以将完整的网页摘要信息返回给网站应用服务器;
2)网页摘要信息在网站应用服务器侧生成:网站应用服务器仅需要在请求消息中携带用于指示网页摘要信息样式的指示信息即可,而无需携带相应的参数,网页摘要信息服务器在获取到请求消息时向网站应用服务器返回相应的网页摘要信息样式即可,网站应用服务器在根据返回的网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
优选地,上述生成的网页摘要信息,可以是该网页最终的摘要信息,即,最终用于展示的网页摘要信息。
在上述优选实施方式中,将网页摘要信息样式存储在了网页摘要信息服务器中,网站应用服务器只需要向网页摘要信息服务器发送一个携带有样式标识的请求消息,就可以获取到相应的摘要信息样式或者是一个完整的摘要信息,从而解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,在对其它代码进行更改时容易造成网页摘要信息被篡改,以及对摘要信息的修改较为复杂的技术问题,达到了提高摘要信息的维护效率和保证摘要信息的准确性的技术效果。
对于网页摘要信息服务器中的存储的网页摘要信息样式需要是预先录入的或者是根据获取的配置信息配置生成的。在一个优选实施方式,如图3所示,上述网页摘要信息的生成装置还包括:设置单元302,与网站应用服务器104耦合,用于在网页摘要信息服务器接收来自网站应用服务器的请求信息之前,根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。优选地,可以以SEO友好的方式设置不同网页对应的网页摘要信息样式。例如,先确定一个网页摘要信息样式标识,用于标识该网页摘要信息样式所对应的页面ID(pageid),然后在定义该样式中title、keyword以及description元素所对应的字段内容,从而生成一个网页摘要信息样式。
优选地,可以为每个网页摘要信息样式定义一个生效时间,即,在该网页摘要信息样式对应的生效时间内进行的请求才会显示该网页摘要信息样式。例如,快到圣诞节了,可以定义一个在圣诞节前后使用的网页摘要信息样式,即,只有在设定的圣诞节的那几天进行请求时才会返回该圣诞节样式。在一个优选实施方式中,如图4所示,查找单元包括:查找模块402,用于查找在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式。
考虑到有时候仅需要对一些特定的网页摘要信息样式定义生效时间,对于生效时间这个信息也就不需要对每个网页摘要信息样式都设定,因此,对于一些没有生效时间的样式可以不考虑生效时间直接进行返回。在一个优选实施方式中,如图5所示,上述查找模块包括:第一判断子模块502,用于判断查找到的与标识信息对应的网页摘要信息样式是否包括生效时间段;第二判断子模块504,用于在判断出包括生效时间段的情况下,判断请求信息的接收时间是否位于生效时间段内,若位于生效时间段内,则将查找到的网页摘要信息样式作为在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式;生成子模块506,用于在判断出不包括生效时间段的情况下,将查找到的网页摘要信息样式作为在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式。即,先判断被请求的摘要信息样式中是否有用于标识生效时间的字段,如果有,就按照生效时间进行返回,如果没有,直接返回即可。
在上述各个优选实施方式中,网站应用服务器可以将网页摘要信息与网页一起进行展示。优选地,为了可以快速展示,网站应用服务器可以先将生成的或者是获取的网页摘要信息样式或者是网页摘要信息保存在本地的缓存中,在需要展示的时候可以快速获取并进行展示,从而提高了展示的效率。因在上述介绍时已经提及,可以由网站应用服务器自己生成最终的网页摘要信息,网页摘要信息服务器只需要向网站应用服务器返回请求的网页摘要信息样式即可。在一个优选实施方式中,网站应用服务器从缓存中读取用于生成网页摘要信息的参数,并根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
实施例2
在图1-图5所示的网页摘要信息的生成系统和装置的基础上,本申请提供了一种优选的网页摘要信息的生成方法。如图6所示,该方法可以包括如下步骤:
步骤S602:网页摘要信息服务器接收来自网站应用服务器的请求信息,其中,请求信息包括但不仅限于用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,请求信息中也可以仅携带有用于唯一标识网页的标识信息,而不携带用于生成网页摘要信息的参数;
即,在本实施例中新增了一个专门用于对网页摘要信息(即上文的Mate标签)进行集中管理的服务器:网页摘要信息服务器。当网站应用服务器需要获取摘要信息时,仅需要向网页摘要服务器发送相应的请求消息,在里面携带一定的标识信息即可,这样网页摘要信息服务器就会进行相应的处理,返回对应的网页摘要信息样式或者是返回完整的网页摘要信息。
步骤S604:网页摘要信息服务器查找与标识信息对应的网页摘要信息样式,其中,网页摘要信息样式中包括一个或多个用于表示与网页对应的网页摘要信息的变量;
在网页摘要服务器中存储了很多网页摘要信息的样式,所谓的样式就是一些框架,其中包含很多未被赋值的变量。只需要为这些样式中的变量赋予不同的值也就可以得到不同的摘要信息。同时,将摘要信息的样式都放在了网页摘要信息服务器侧,实现了网页摘要信息的统一管理,同时也就将网页摘要信息和其它的网页代码分离开了,对摘要信息的样式的改变或者是对其中变量的参数的改变也都不会影响网页代码中的非摘要信息代码。
例如,在网页摘要信息样式中可以但不限于包括以下至少之一:用于唯一标识网页的第一变量(pageid),用于表示网页标题的第二变量(title pattern),用于表示网页关键词的第三变量(keyword pattern),用于表示网页内容的第四变量(descriptionpattern),用于表示生效时间段的第五变量(Effective Time);相应的网页摘要信息就包括:Meta信息(即,最终生成的网页摘要信息中的参数信息),其中,Meta信息包括:与第二变量对应的用于表示网页标题的参数,与第三变量对应的用于表示网页关键词的参数,与第四变量对应的用于表示网页内容的参数。
举例而言,对于每一个网页摘要信息样式(Meta pattern)可以是网页摘要信息服务器(也可以称之为Meta仓库)中最小可用单位,可以采用以下的结构来标识一个网页摘要信息的样式的相关内容:(pageid,title pattern,keyword pattern,descriptionpattern)
其中,pageid用于标识该网页摘要信息样式,一个样式唯一对应一个pageid,该字段的类型可以为一串字符。优选的,可以为每种网页页面类型定义一个或多个样式。例如以某个购物网站为例,其对应的网页页面类型可以有:网站首页、网站的搜索列表页面、产品的详细描述页面。这样就可以分别为网站首页、网站的搜索列表页面、产品的详细描述页面定义一些样式以供选择。
对于上述的Title pattern、keyword pattern以及description pattern所对应的字段中就有预先设定好的变量,这些变量所对应的具体的值在网站应用服务器请求网页摘要信息时通过网站应用服务器传递的参数进行替换。
例如,对于下面的网页摘要信息:
{Keyword}Manufacturers &{keyword}Suppliers Directory-Find a{keyword}Manufacturer and Supplier in{category}.Choose Quality{country}Manufacturers,Suppliers,Exporters at Alibaba.com.
其中,keyword为用户参数中的关键词,category为用户参数中的类目,country为用户参数中的国家。对于这些内容都是可以替换的变量,网页摘要信息服务器或者是网站应用服务器就可以利用参数对其进行替换以生成所希望的网页摘要信息。
步骤S606:网页摘要信息服务器根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息,并将生成的网页摘要信息发送给网站应用服务器,或者,网页摘要信息服务器将网页摘要信息样式发送给网站应用服务器,以使网站应用服务器根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
即,在上述实施例中提供了两种生成网页摘要信息的方式:
1)网页摘要信息在网页摘要信息服务器侧生成:网站应用服务器需要在请求消息中携带相应的摘要信息的变量所对应的参数,摘要信息服务器根据这些参数生成网页摘要信息之后,就可以将完整的网页摘要信息返回给网站应用服务器;
2)网页摘要信息在网站应用服务器侧生成:网站应用服务器仅需要在请求消息中携带用于指示网页摘要信息样式的指示信息即可,而无需携带相应的参数,网页摘要信息服务器在获取到请求消息时向网站应用服务器返回相应的网页摘要信息样式即可,网站应用服务器在根据返回的网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
优选地,上述生成的网页摘要信息,可以是该网页最终的摘要信息,即,最终用于展示的网页摘要信息。
在上述优选实施方式中,将网页摘要信息样式存储在了网页摘要信息服务器中,网站应用服务器只需要向网页摘要信息服务器发送一个携带有样式标识的请求消息,就可以获取到相应的摘要信息样式或者是一个完整的摘要信息,从而解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,在对其它代码进行更改时容易造成网页摘要信息被篡改,以及对摘要信息的修改较为复杂的技术问题,达到了提高摘要信息的维护效率和保证摘要信息的准确性的技术效果。
对于网页摘要信息服务器中的存储的网页摘要信息样式需要是预先录入的或者是根据获取的配置信息配置生成的,可以按照以下方式生成:网页摘要信息服务器根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。优选地,可以以SEO友好的方式设置不同网页对应的网页摘要信息样式。例如,先确定一个网页摘要信息样式标识,用于标识该网页摘要信息样式所对应的页面ID(pageid),然后在定义该样式中title、keyword以及description元素所对应的字段内容,从而生成一个网页摘要信息样式。
优选地,可以为每个网页摘要信息样式定义一个生效时间,即,在该网页摘要信息样式对应的生效时间内进行的请求才会显示该网页摘要信息样式。例如,快到圣诞节了,可以定义一个在圣诞节前后使用的网页摘要信息样式,即,只有在设定的圣诞节的那几天进行请求时才会返回该圣诞节样式。在一个优选实施方式中,网页摘要信息服务器查找与标识信息对应的网页摘要信息样式的步骤包括:网页摘要信息服务器查找在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式。
考虑到有时候仅需要对一些特定的网页摘要信息样式定义生效时间,对于生效时间这个信息也就不需要对每个网页摘要信息样式都设定,因此,对于一些没有生效时间的样式可以不考虑生效时间直接进行返回。在一个优选实施方式中,网页摘要信息服务器查找在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式的步骤包括:网页摘要信息服务器判断查找到的与标识信息对应的网页摘要信息样式是否包括生效时间段;若包括生效时间段,则判断请求信息的接收时间是否位于生效时间段内,若位于生效时间段内,则将查找到的网页摘要信息样式作为在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式;若不包括生效时间段,则将查找到的网页摘要信息样式作为在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式。即,先判断被请求的摘要信息样式中是否有用于标识生效时间的字段,如果有,就按照生效时间进行返回,如果没有,直接返回即可。
在上述各个优选实施方式中,网站应用服务器可以将网页摘要信息与网页一起进行展示。优选地,为了可以快速展示,网站应用服务器可以先将生成的或者是获取的网页摘要信息样式或者是网页摘要信息保存在本地的缓存中,在需要展示的时候可以快速获取并进行展示,从而提高了展示的效率。因在上述介绍时已经提及,可以由网站应用服务器自己生成最终的网页摘要信息,网页摘要信息服务器只需要向网站应用服务器返回请求的网页摘要信息样式即可。在一个优选实施方式中,网站应用服务器从缓存中读取用于生成网页摘要信息的参数,并根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
实施例3
本申请提供了一种优选的实施例来进一步对本申请进行解释,但是值得注意的是,该优选实施例只是为了更好的描述本申请,并不构成对本申请不当的限定。
如图7所示,本申请实施例给出了客户端请求Meta仓库获取Meta信息的一种优选流程图,如图7所示,包括以下步骤:
步骤S702:网站应用服务器收集完整的摘要请求,其中,摘要请求中携带有请求参数对象和页面的唯一标识。优选地,该摘要请求可以是用户输入的,也可以是网站应用服务器根据需要自己生成的。其中,上述的页面唯一标识是预先确定的,用于标识所请求的网页摘要信息所对应的页面区域。一个页面唯一标识可以对应于多个网页摘要信息样式,然而在同时时间内仅会对应一个可用的网页摘要信息样式。上述的请求参数对象中应包含一些常用的参数,例如:当前请求的关键词,类目名称,国家,省份,城市,地区,会员类型,价格区间以及每页展示的条数等等。
步骤S704:根据页面的唯一标识从本地缓存中读取网页摘要信息的样式,如果网站应用服务器在本地已经存储了相应的网页摘要信息的样式,则执行步骤S706,否则,转而执行步骤S708。
步骤S706:如果网站应用服务器在本地已经存储了相应的网页摘要信息的样式,则网站应用服务器根据请求参数对该网页摘要信息的样式进行渲染,即根据请求参数对该网页摘要信息的样式中的变量进行替换以生成最终可以展示的网页摘要信息,执行步骤S712。
步骤S708:网站应用服务器根据摘要请求中携带的页面唯一标识向网页摘要信息服务器(Meta仓库)获取所请求的网页摘要信息的样式,并将其存储在自身的本地缓存中。
步骤S710:网站应用服务器根据请求参数对该网页摘要信息的样式中的变量进行替换以生成最终可以展示的网页摘要信息。
步骤S712:网站应用服务器对最终生成的网页摘要信息随网页一起进行显示。
通过以上的描述可知,本申请具有以下优势:将网页摘要信息样式存储在了网页摘要信息服务器中,网站应用服务器只需要向网页摘要信息服务器发送一个携带有样式标识的请求消息,就可以获取到相应的摘要信息样式或者是一个完整的摘要信息,从而解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,在对其它代码进行更改时容易造成网页摘要信息被篡改,以及对摘要信息的修改较为复杂的技术问题,达到了提高摘要信息的维护效率和保证摘要信息的准确性的技术效果。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种网页摘要信息的生成方法,其特征在于,包括:
网页摘要信息服务器接收来自网站应用服务器的请求信息,其中,所述请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,所述请求信息包括:用于唯一标识网页的标识信息;
所述网页摘要信息服务器查找与所述标识信息对应的网页摘要信息样式,其中,所述网页摘要信息样式中包括一个或多个用于表示与所述网页对应的网页摘要信息的变量;
所述网页摘要信息服务器根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息,并将所述生成的所述网页摘要信息发送给所述网站应用服务器,或者,所述网页摘要信息服务器将所述网页摘要信息样式发送给所述网站应用服务器,以使所述网站应用服务器根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息。
2.根据权利要求1所述的方法,其特征在于,在所述网页摘要信息服务器接收来自网站应用服务器的请求信息之前,还包括:
所述网页摘要信息服务器根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。
3.根据权利要求1所述的方法,其特征在于,所述网页摘要信息服务器查找与所述标识信息对应的网页摘要信息样式的步骤包括:
所述网页摘要信息服务器查找在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式。
4.根据权利要求3所述的方法,其特征在于,所述网页摘要信息服务器查找在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式的步骤包括:
所述网页摘要信息服务器判断查找到的与所述标识信息对应的网页摘要信息样式是否包括生效时间段;
若包括所述生效时间段,则判断所述请求信息的接收时间是否位于所述生效时间段内,若位于所述生效时间段内,则将查找到的所述网页摘要信息样式作为在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式;
若不包括所述生效时间段,则将查找到的所述网页摘要信息样式作为在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式。
5.根据权利要求1所述的方法,其特征在于,在所述网页摘要信息服务器将所述网页摘要信息样式发送给所述网站应用服务器之后,还包括:
所述网站应用服务器从缓存中读取所述用于生成网页摘要信息的参数,并根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息。
6.根据权利要求1所述的方法,其特征在于,所述网页摘要信息样式包括:用于唯一标识网页的第一变量,用于表示网页标题的第二变量,用于表示网页关键词的第三变量,用于表示网页内容的第四变量,用于表示生效时间段的第五变量;所述网页摘要信息包括:Meta信息,其中,所述Meta信息包括:与所述第二变量对应的用于表示网页标题的参数,与所述第三变量对应的用于表示网页关键词的参数,与所述第四变量对应的用于表示网页内容的参数。
7.一种网页摘要信息的生成装置,其特征在于,包括:
接收单元,用于接收来自网站应用服务器的请求信息,其中,所述请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,所述请求信息包括:用于唯一标识网页的标识信息;
查找单元,用于查找与所述标识信息对应的网页摘要信息样式,其中,所述网页摘要信息样式中包括一个或多个用于表示与所述网页对应的网页摘要信息的变量;
生成单元,用于根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息,并将所述生成的所述网页摘要信息发送给所述网站应用服务器;或者,
发送单元,用于将所述网页摘要信息样式发送给所述网站应用服务器,以使所述网站应用服务器根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息。
8.根据权利要求7所述的装置,其特征在于,还包括:
设置单元,用于在所述网页摘要信息服务器接收来自网站应用服务器的请求信息之前,根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。
9.根据权利要求7所述的装置,其特征在于,所述查找单元包括:
查找模块,用于查找在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式。
10.根据权利要求9所述的装置,其特征在于,所述查找模块包括:
第一判断子模块,用于判断查找到的与所述标识信息对应的网页摘要信息样式是否包括生效时间段;
第二判断子模块,用于在判断出包括所述生效时间段的情况下,判断所述请求信息的接收时间是否位于所述生效时间段内,若位于所述生效时间段内,则将查找到的所述网页摘要信息样式作为在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式;
生成子模块,用于在判断出不包括所述生效时间段的情况下,将查找到的所述网页摘要信息样式作为在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式。
CN201210430025.6A 2012-10-31 2012-10-31 网页摘要信息的生成方法和装置 Active CN103793428B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210430025.6A CN103793428B (zh) 2012-10-31 2012-10-31 网页摘要信息的生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210430025.6A CN103793428B (zh) 2012-10-31 2012-10-31 网页摘要信息的生成方法和装置

Publications (2)

Publication Number Publication Date
CN103793428A CN103793428A (zh) 2014-05-14
CN103793428B true CN103793428B (zh) 2017-05-31

Family

ID=50669107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210430025.6A Active CN103793428B (zh) 2012-10-31 2012-10-31 网页摘要信息的生成方法和装置

Country Status (1)

Country Link
CN (1) CN103793428B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224571A (zh) * 2014-06-30 2016-01-06 北京金山安全软件有限公司 终端上传数据的处理及数据上传处理方法、装置
CN105786836A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种对影视网页的结构化摘要生成方法与系统
CN105786849A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种文档类网页自定义摘要的生成方法和系统
CN105786853A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种论坛帖子智能摘要的显示方法和系统
CN105786837A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种小说网页智能摘要的生成方法与系统
CN105786854A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种搜索结果中视频播放网页摘要的生成方法与系统
CN105653606A (zh) * 2015-12-23 2016-06-08 北京奇虎科技有限公司 基于结构统一化处理的官网摘要展示方法及装置
CN108520014A (zh) * 2018-03-21 2018-09-11 广东欧珀移动通信有限公司 信息分享方法、装置、移动终端和计算机可读介质
CN109543128B (zh) * 2018-10-19 2021-01-12 深圳点猫科技有限公司 一种基于编程语言的前端框架项目实现方法及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446191A (zh) * 2010-10-13 2012-05-09 北京创新方舟科技有限公司 一种用于生成网页内容摘要的方法、设备及系统
CN102737016A (zh) * 2011-03-30 2012-10-17 中国银联股份有限公司 基于并行处理的信息文件生成系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8930376B2 (en) * 2008-02-15 2015-01-06 Yahoo! Inc. Search result abstract quality using community metadata
US8977599B2 (en) * 2010-11-11 2015-03-10 Verizon Patent And Licensing Inc. Method and system for testing client-server applications

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446191A (zh) * 2010-10-13 2012-05-09 北京创新方舟科技有限公司 一种用于生成网页内容摘要的方法、设备及系统
CN102737016A (zh) * 2011-03-30 2012-10-17 中国银联股份有限公司 基于并行处理的信息文件生成系统及方法

Also Published As

Publication number Publication date
CN103793428A (zh) 2014-05-14

Similar Documents

Publication Publication Date Title
CN103793428B (zh) 网页摘要信息的生成方法和装置
US8688534B2 (en) System and method for gathering ecommerce data
CN104462455B (zh) 网络数据的展示处理方法和装置
CN106233279B (zh) 基于数字杂志中包括的内容向数字杂志服务器用户推荐内容
US9292545B2 (en) Entity fingerprints
CN106126630B (zh) 一种业务对象的收藏、搜索方法和装置
US8010544B2 (en) Inverted indices in information extraction to improve records extracted per annotation
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US9384289B2 (en) Method and system to identify geographical locations associated with queries received at a search engine
JP5271686B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5357432B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20120124050A1 (en) System and method for hs code recommendation
US20070294149A1 (en) Catalog based price search
CN103150352A (zh) 用于生成相关搜索查询的系统
US20100205052A1 (en) Self-uploaded indexing and data clustering method and apparatus
CN108021598A (zh) 页面抽取模板匹配方法、装置及服务器
CN106600082A (zh) 业务系统中任务的处理方法、装置及业务体系构建系统
CN115659008B (zh) 大数据信息反馈的信息推送系统、方法、电子设备及介质
CN104050243A (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
CN100489861C (zh) 数据查找方法、系统及设备
CN108280102A (zh) 上网行为记录方法、装置及用户终端
Glasser Broken links and failed access
WO2001027712A2 (en) A method and system for automatically structuring content from universal marked-up documents
US20070276720A1 (en) Indexing of a focused data set through a comparison technique method and apparatus
US20130191304A1 (en) Tools and Methods for Creating Dynamic Feedback Forms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240219

Address after: # 01-21, Lai Zan Da Building 1, 51 Belarusian Road, Singapore

Patentee after: Alibaba Singapore Holdings Ltd.

Country or region after: Singapore

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.

Country or region before: Cayman Islands

TR01 Transfer of patent right