CN104699841A - 提供搜索结果的列表摘要信息的方法和装置 - Google Patents

提供搜索结果的列表摘要信息的方法和装置 Download PDF

Info

Publication number
CN104699841A
CN104699841A CN201510149878.6A CN201510149878A CN104699841A CN 104699841 A CN104699841 A CN 104699841A CN 201510149878 A CN201510149878 A CN 201510149878A CN 104699841 A CN104699841 A CN 104699841A
Authority
CN
China
Prior art keywords
list
search result
result items
page
summary info
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510149878.6A
Other languages
English (en)
Inventor
郑思晴
吴凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510149878.6A priority Critical patent/CN104699841A/zh
Publication of CN104699841A publication Critical patent/CN104699841A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种提供搜索结果的列表摘要信息的方法,包括:根据接收到的用户在搜索框中输入的查询词,获取与查询词相匹配的排序后的一个或多个搜索结果项;检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。本方案中,用户在输入查询词后,在搜索结果页面中查看搜索结果项相应的列表摘要信息,就可以找到搜索结果项对应落地页中的具体精准信息,用户从开始执行搜索行为到最终查找到想要的具体内容仅需一个步骤就可以完成,实现了缩短了查询路径的目的。

Description

提供搜索结果的列表摘要信息的方法和装置
技术领域
本发明涉及互联网技术领域,具体而言,本发明涉及一种提供搜索结果的列表摘要信息的方法和装置。
背景技术
随着互联网技术的不断发展以及信息的不断膨胀,人们对于网络信息的使用需求越来越高,搜索引擎成为人们获取网络信息的重要工具。当用户输入查询词后,搜索引擎通常会将与该查询词相关联的搜索结果项包含在搜索结果页面中返回给用户。
现有技术中,搜索结果项一般包括标题信息、指向页面的URL以及摘要信息,摘要信息为对搜索结果项对应的页面的概括性描述。当用户在使用搜索引擎进行搜索时,如果输入的查询词属于泛词类型,即有多个网页内容对应于查询词,现有技术通常会返回包含多个网页内容的概括性的搜索结果项,该搜索结果项的普通摘要信息包括对搜索结果项指向落地页的概括性文字说明或缩略图。如图1a所示,用户输入的查询词为“EXO小游戏”,搜索引擎会搜索到多个EXO小游戏都对应该查询词的查询需求,但是在反馈至用户的搜索结果页面中,排序第一的搜索结果项显示的是概括性的搜索结果项,其普通摘要信息为概括性的搜索结果项对应落地页的简要说明,用户需要点击该搜索结果项的链接进入相应的落地页,如图1b所示,再从落地页中寻找其所需的EXO小游戏。
现有技术的缺点在于:1)用户需要点击搜索结果项并进入相应落地页,随后从落地页中再去寻找其所需的具体内容,即用户从开始执行搜索行为到最终查找到想要的具体内容至少需要执行两个步骤,查询路径偏长;2)普通搜索结果项的摘要信息内容通常为文字性内容概括,一般无法向用户提供对搜索结果项对应页面具体内容的决策性意见。
发明内容
本发明的目的旨在至少解决上述技术缺陷之一,特别是用户在实际搜索过程中查询路径偏长的问题。
本方案的实施例提供了一种提供搜索结果的列表摘要信息的方法,包括:
根据接收到的用户在搜索框中输入的查询词,获取与查询词相匹配的排序后的一个或多个搜索结果项;
检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;
对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
本方案的实施例还提供了一种提供搜索结果的列表摘要信息的装置,包括:
结果获取模块,用于根据接收到用户在搜索框输入的查询词,获取与查询词相匹配的排序后的一个或多个搜索结果项;
第一检测模块,用于检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;
第一生成模块,用于对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
本方案的实施例中,通过提取搜索结果项对应落地页中包括的平级图文列表字段,基于列表摘要模板进行结构化处理,来重新生成包含列表摘要信息的搜索结果项,将落地页中与用户搜索需求相匹配的精准子页面信息展现在列表摘要信息中,使得用户在输入查询词后,在搜索结果页面中查看搜索结果项相应的列表摘要信息,就可以找到搜索结果项对应落地页中的具体精准信息,列表摘要信息提前将用户进入落地页后会点击的具体精准信息提出,用户从开始执行搜索行为到最终查找到想要的具体内容仅需一个步骤就可以完成,实现了缩短了查询路径的目的。另外,由于列表摘要信息中包括了落地页中的多个精确信息,用户通过查找列表摘要信息就可以判断落地页中是否包括其所需的内容,可更好地帮助用户对搜索结果项的准确性进行判断。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1a为现有技术中搜索结果项及其普通摘要信息的示意图;
图1b为与搜索结果项对应的落地页的示意图;
图2为本发明中提供搜索结果的列表摘要信息的方法一个实施例的流程示意图;
图3为本发明中提供搜索结果的列表摘要信息的方法实施例的结构示意图;
图4为本发明中的包括列表摘要信息的搜索结果项的示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
图2为本发明中提供搜索结果的列表摘要信息的方法一个实施例的流程示意图。
根据本发明的方法包括由网络设备执行的步骤S110、步骤S120和步骤S130。
其中,网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在步骤S110中,根据接收到的用户在搜索框中输入的查询词,获取与查询词相匹配的排序后的一个或多个搜索结果项;在步骤S120中,检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;在步骤S130中,对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
本方案的实施例中,通过提取搜索结果项对应落地页中包括的平级图文列表字段,基于列表摘要模板进行结构化处理,来重新生成包含列表摘要信息的搜索结果项,将落地页中与用户搜索需求相匹配的精准子页面信息展现在列表摘要信息中,使得用户在输入查询词后,在搜索结果页面中查看搜索结果项相应的列表摘要信息,就可以找到搜索结果项对应落地页中的具体精准信息,列表摘要信息提前将用户进入落地页后会点击的具体精准信息提出,用户从开始执行搜索行为到最终查找到想要的具体内容仅需一个步骤就可以完成,实现了缩短了查询路径的目的。另外,由于列表摘要信息中包括了落地页中的多个精确信息,用户通过查找列表摘要信息就可以判断落地页中是否包括其所需的内容,可更好地帮助用户对搜索结果项的准确性进行判断。
具体地,用户通过用户终端设备在搜索引擎的输入框中输入查询词,并通过用户终端设备发送至网络设备;网络设备接收到该查询词,对该查询词进行切词处理,来确定一个或多个查询关键词;随后,基于一个或多个查询关键词在网页索引库中进行匹配来获取相应的搜索结果项,随后对搜索结果项进行排序,获取与查询词相匹配的排序后的一个或多个搜索结果项。
步骤S120:检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段。
本发明中,落地页是指搜索结果项对应URL链接指向的页面。进一步地,落地页中可包括满足用户查询需求的多个子页面信息。
其中,平级图文列表字段包括以下一种或多种的组合:
列表类型标记语言字段;例如,在网页的HTML文件中,列表类型标记语言字段可包括type定值中的datalist字段,指示HTML文件中包括多个data数组,在网页中可展现为列表形式;
统一资源定位符、标题信息相关联记录的多个标记语言字段;例如,网页的HTML文件中包括多个data数组,每一data数组均包括url/title两个字段,分别对应于URL和标题,多个data数组在网页中可展现为列表形式;
统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段;例如,网页的HTML文件中包括多个data数组,每一data数组均包括url/title/img三个字段,分别对应于URL、标题和图片,多个data数组在网页中可展现为列表形式。可选地,网页的HTML文件中还可包括imgsize字段,该imgsize字段表示每个data数组中的图片大小;例如,imgsize字段取值为:big:大图;或small:小图;或noimg:无图。
具体地,检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段的方式可为:读取排序后的一个或多个搜索结果项对应链接的落地页的HTML文件,并检测HTML文件中是否包括预定的平级图文列表字段。
步骤S130:对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
具体地,步骤S130具体包括步骤S131(图中未示出)和步骤S132(图中未示出)。
步骤S131:提取搜索结果项对应链接的落地页中平级图文列表字段的数据信息;
步骤S132:基于平级图文列表字段的数据信息,填充列表摘要模板,重新生成包含列表摘要信息的搜索结果项。
当检测到搜索结果项的链接对应落地页的HTML文件中包括预定的平级图文列表字段,则将已提取到落地页中平级图文列表字段的数据信息,填充至预生成的列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。例如,列表摘要模板包括标题、图片及URL相应的填充位置,落地页的HTML文件中每组data数组包括url/title/img三个字段数据,提取每组data数组包括的url/title/img字段的数据;接着,在列表摘要模板的每个填充位置处相应写入url/title/img字段的数据,可生成列表摘要信息;接着再与排序后的一个或多个搜索结果的标题和URL相结合,重新生成包含列表摘要信息的搜索结果项。
例如,用户输入的查询词为“EXO小游戏”,搜索引擎接收到该查询词后可获取排序后的多个搜索结果项,其中一个搜索结果项的标题为:EXO小游戏_EXO小游戏大全_EXO小游戏下载_17173小游戏频道,URL为:http://flash.17173.com/2013/heji/exo.shtml;读取该搜索结果项的链接对应落地页的HTML文件,检测到HTML文件中是否包括多组data数组,每组数组包括url/title/img三个字段数据时,则提取多组数组包括url/title/img三个字段数据,并在预生成的列表摘要模板的每个填充位置处相应写入url/title/img字段的数据,生成列表摘要信息,如图4所示,第一个列表摘要信息的标题为“瘾藏”,URL为http://flash.17173.com/flashfile/2014-07-16/20140716110902440.shtml,其直接指向名为“瘾藏”的EXO小游戏页面,图片为“瘾藏”小游戏的游戏图标;接着,将列表摘要信息与搜索结果的标题和URL相结合,重新生成如图4所示的包含列表摘要信息的搜索结果项。
其中,列表摘要信息包括搜索结果项的链接对应落地页中以列表形式展现的多个子页面信息;其中,子页面信息包括但不限于:子页面对应的统一资源定位符;子页面的标题信息;子页面的图片信息。
如图1b所示,该落地页中以列表形式展现了多个EXO小游戏的子页面信息,这些EXO小游戏的子页面信息以三行九列的列表形式在落地页中进行展现,每个EXO小游戏的子页面信息包括:EXO小游戏的子页面信对应的URL;:EXO小游戏的标题信息;:EXO小游戏的图片信息。
优选地(参照图2),该方法还包括步骤S190(图中未示出)。
步骤S190:基于重新生成的包含列表摘要信息的搜索结果项绘制搜索结果页面。
具体地,基于重新生成的包含列表摘要信息的搜索结果项以及其他已获取的搜索结果项,来绘制搜索结果页面。
优选地(参照图2),在通过列表摘要模板进行结构化处理之前,该方法还包括步骤S140(图中未示出)。
步骤S140:确定与搜索结果项相匹配的列表摘要模板;
例如,根据搜索结果项的URL,在列表摘要模板库中查找到与该URL相匹配的列表摘要模板,其中,列表摘要模板库中存储多个预生成的列表摘要模板,且存储有列表摘要模板与相应URL或域名之间的关联信息。
步骤S130:对包含平级图文列表字段的落地页对应的搜索结果项,通过相匹配的列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
优选地(参照图2),该方法还包括步骤S150(图中未示出)。
步骤S150:根据从一个或多个落地页中提取到的平级图文列表字段,生成与一个或多个落地页相匹配的列表摘要模板。
例如,预先从互联网中爬取到可作为落地页的一个或多个网页,对一个或多个落地页的HTML文件进行解析,基于预定义的平级图文列表字段在HTML文件进行查找并提取一个或多个落地页的HTML文件中的平级图文列表字段,根据所提取的平级图文列表字段,生成与一个或多个落地页相匹配的列表摘要模板,其中,列表摘要模板中包括待填充位置,用于填充相应的字段数据。
优选地(参照图2),该方法还包括步骤S160(图中未示出)、步骤S170(图中未示出)和步骤S180(图中未示出)。
步骤S160:提取一个或多个落地页的链接对应的域名;
步骤S170:检测域名的下层目录对应的页面是否包含平级图文列表字段;
步骤S180:对包含平级图文列表字段的域名的下层目录对应的页面,将与落地页相匹配的列表摘要模板确定为与同一域名下的下层目录对应的页面相匹配的列表摘要模板。
例如,对查询词“益智小游戏”进行搜索,获取到一个搜索结果项指向落地页的链接URL为:http://xiaoyouxi.2366.com/yizhi,并基于该落地页生成列表摘要模板;提取该落地页的URL对应的域名为:http://xiaoyouxi.2366.com,爬取该域名下的全部下层目录对应的页面,如http://xiaoyouxi.2366.com/xiuxian、http://xiaoyouxi.2366.com/dongzuo、http://xiaoyouxi.2366.com/tiyu等对应的页面,并检测这些页面是否包含平级图文列表字段,当检测到这些URL对应的页面包含平级图文列表字段时,则确定URL为http://xiaoyouxi.2366.com/yizhi的列表摘要模板,是域名为“http://xiaoyouxi.2366.com”的下层目录对应的页面相匹配的列表摘要模板。之后,当用户输入查询词“体育小游戏”进行搜索获取的一个搜索结果项指向落地页的链接URL为:http://xiaoyouxi.2366.com/tiyu时,可直接使用域名http://xiaoyouxi.2366.com相对应的列表摘要模板来生成查询词“体育小游戏”的搜索结果项对应的列表摘要信息。
本优选实施例中,根据相同域名的下层目录对应网页的页面结构相似性特点,确定在同一域名下的网页可使用同一列表摘要模板,大大提高了大量落地页的列表摘要信息的生成效率,降低服务器端生成并存储不同落地页的列表摘要信息的压力和负担。
优选地(参照图2),该方法还包括:根据对多个查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门查询词;根据热门查询词来确定相应的经排序的搜索结果项,并选取与每一热门查询词相应的排序前预定数量的搜索结果项作为热门搜索结果项;提取热门搜索结果项对应链接的热门落地页;步骤S150具体包括:根据从热门落地页中提取到的平级图文列表字段,生成与热门搜索结果项相匹配的列表摘要模板。
例如,热度信息可通过在一定时间内用户的搜索次数、对搜索结果的浏览时长等维度来确定,对用户输入的多个查询词基于热度信息来排序后,选择排序前预定数量,如排序前五位,的查询词作为热门查询词;对热门查询词进行搜索、排序等处理后,获取每一查询词相应的经排序的搜索结果项,选取与每一热门查询词相应的排序前预定数量的搜索结果项,如排序前两位的搜索结果项,作为热门搜索结果项;提取热门搜索结果项对应URL指向的热门落地页;根据从热门落地页中提取到的平级图文列表字段,生成与热门搜索结果项相匹配的列表摘要模板。
本优选实施例中,由于列表摘要信息可为搜索引擎用户提供快捷高效的搜索模式,对热门搜索结果项生成列表摘要信息能够向尽可能多的用户提供该搜索模式。因此,通过选择热门查询词来确定相应的热门搜索结果项,并对热门搜索结果项相应的热门落地页来生成列表摘要模板,为被用户高频率搜索到的搜索结果项生成列表摘要信息奠定了前提基础,进而为向尽可能多的用户提供快捷高效的搜索模式提供可靠保证。
图3为本发明中提供搜索结果的列表摘要信息的方法实施例的结构示意图。
本发明中提供搜索结果的列表摘要信息的装置,包括:结果获取模块210、第一检测模块220和第一生成模块230。
结果获取模块210根据接收到的用户在搜索框中输入的查询词,获取与查询词相匹配的排序后的一个或多个搜索结果项;第一检测模块220检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;第一生成模块230对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
本方案的实施例中,通过提取搜索结果项对应落地页中包括的平级图文列表字段,基于列表摘要模板进行结构化处理,来重新生成包含列表摘要信息的搜索结果项,将落地页中与用户搜索需求相匹配的精准子页面信息展现在列表摘要信息中,使得用户在输入查询词后,在搜索结果页面中查看搜索结果项相应的列表摘要信息,就可以找到搜索结果项对应落地页中的具体精准信息,列表摘要信息提前将用户进入落地页后会点击的具体精准信息提出,用户从开始执行搜索行为到最终查找到想要的具体内容仅需一个步骤就可以完成,实现了缩短了查询路径的目的。另外,由于列表摘要信息中包括了落地页中的多个精确信息,用户通过查找列表摘要信息就可以判断落地页中是否包括其所需的内容,可更好地帮助用户对搜索结果项的准确性进行判断。
结果获取模块210:根据接收到的用户在搜索框中输入的查询词,获取与查询词相匹配的排序后的一个或多个搜索结果项。
具体地,用户通过用户终端设备在搜索引擎的输入框中输入查询词,并通过用户终端设备发送至网络设备;网络设备接收到该查询词,对该查询词进行切词处理,来确定一个或多个查询关键词;随后,基于一个或多个查询关键词在网页索引库中进行匹配来获取相应的搜索结果项,随后对搜索结果项进行排序,获取与查询词相匹配的排序后的一个或多个搜索结果项。
第一检测模块220:检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段。
本方发明中,落地页是指搜索结果项对应URL链接指向的页面。进一步地,落地页中可包括满足用户查询需求的多个子页面信息。
其中,平级图文列表字段包括以下一种或多种的组合:
列表类型标记语言字段;例如,在网页的HTML文件中,列表类型标记语言字段可包括type定值中的datalist字段,指示HTML文件中包括多个data数组,在网页中可展现为列表形式;
统一资源定位符、标题信息相关联记录的多个标记语言字段;例如,网页的HTML文件中包括多个data数组,每一data数组均包括url/title两个字段,分别对应于URL和标题,多个data数组在网页中可展现为列表形式;
统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段;例如,网页的HTML文件中包括多个data数组,每一data数组均包括url/title/img三个字段,分别对应于URL、标题和图片,多个data数组在网页中可展现为列表形式。可选地,网页的HTML文件中还可包括imgsize字段,该imgsize字段表示每个data数组中的图片大小;例如,imgsize字段取值为:big:大图;或small:小图;或noimg:无图。
具体地,检测排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段的方式可为:读取排序后的一个或多个搜索结果项对应链接的落地页的HTML文件,并检测HTML文件中是否包括预定的平级图文列表字段。
第一生成模块230:对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
具体地,第一生成模块230具体包括提取单元(图中未示出)和重新生成单元(图中未示出)。
提取单元提取搜索结果项对应链接的落地页中平级图文列表字段的数据信息;重新生成单元基于平级图文列表字段的数据信息,填充列表摘要模板,重新生成包含列表摘要信息的搜索结果项。
当检测到搜索结果项的链接对应落地页的HTML文件中包括预定的平级图文列表字段,则将已提取到落地页中平级图文列表字段的数据信息,填充至预生成的列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。例如,列表摘要模板包括标题、图片及URL相应的填充位置,落地页的HTML文件中每组data数组包括url/title/img三个字段数据,提取每组data数组包括的url/title/img字段的数据;接着,在列表摘要模板的每个填充位置处相应写入url/title/img字段的数据,可生成列表摘要信息;接着再与排序后的一个或多个搜索结果的标题和URL相结合,重新生成包含列表摘要信息的搜索结果项。
例如,用户输入的查询词为“EXO小游戏”,搜索引擎接收到该查询词后可获取排序后的多个搜索结果项,其中一个搜索结果项的标题为:EXO小游戏_EXO小游戏大全_EXO小游戏下载_17173小游戏频道,URL为:http://flash.17173.com/2013/heji/exo.shtml;读取该搜索结果项的链接对应落地页的HTML文件,检测到HTML文件中是否包括多组data数组,每组数组包括url/title/img三个字段数据时,则提取多组数组包括url/title/img三个字段数据,并在预生成的列表摘要模板的每个填充位置处相应写入url/title/img字段的数据,生成列表摘要信息,如图4所示,第一个列表摘要信息的标题为“瘾藏”,URL为http://flash.17173.com/flashfile/2014-07-16/20140716110902440.shtml,其直接指向名为“瘾藏”的EXO小游戏页面,图片为“瘾藏”小游戏的游戏图标;接着,将列表摘要信息与搜索结果的标题和URL相结合,重新生成如图4所示的包含列表摘要信息的搜索结果项。
其中,列表摘要信息包括搜索结果项的链接对应落地页中以列表形式展现的多个子页面信息;其中,子页面信息包括但不限于:子页面对应的统一资源定位符;子页面的标题信息;子页面的图片信息。
如图1b所示,该落地页中以列表形式展现了多个EXO小游戏的子页面信息,这些EXO小游戏的子页面信息以三行九列的列表形式在落地页中进行展现,每个EXO小游戏的子页面信息包括:EXO小游戏的子页面信对应的URL;:EXO小游戏的标题信息;:EXO小游戏的图片信息。
优选地(参照图3),该装置还包括绘制模块(图中未示出)。
绘制模块:基于重新生成的包含列表摘要信息的搜索结果项绘制搜索结果页面。
具体地,基于重新生成的包含列表摘要信息的搜索结果项以及其他已获取的搜索结果项,来绘制搜索结果页面。
优选地(参照图3),该装置还包括模板确定模块(图中未示出)。
模板确定模块:在通过列表摘要模板进行结构化处理之前,确定与搜索结果项相匹配的列表摘要模板;
例如,根据搜索结果项的URL,在列表摘要模板库中查找到与该URL相匹配的列表摘要模板,其中,列表摘要模板库中存储多个预生成的列表摘要模板,且存储有列表摘要模板与相应URL或域名之间的关联信息。
第一生成模块230:对包含平级图文列表字段的落地页对应的搜索结果项,通过相匹配的列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
优选地(参照图3),该装置还包括模板预生成模块(图中未示出)。
模板预生成模块:根据从一个或多个落地页中提取到的平级图文列表字段,生成与一个或多个落地页相匹配的列表摘要模板。
例如,预先从互联网中爬取到可作为落地页的一个或多个网页,对一个或多个落地页的HTML文件进行解析,基于预定义的平级图文列表字段在HTML文件进行查找并提取一个或多个落地页的HTML文件中的平级图文列表字段,根据所提取的平级图文列表字段,生成与一个或多个落地页相匹配的列表摘要模板,其中,列表摘要模板中包括待填充位置,用于填充相应的字段数据。
优选地(参照图3),该装置还包括域名提取模块(图中未示出)、第二检测模块(图中未示出)和模板确定模块(图中未示出)。
域名提取模块:提取一个或多个落地页的链接对应的域名;
第二检测模块:检测域名的下层目录对应的页面是否包含平级图文列表字段;
模板确定模块:对包含平级图文列表字段的域名的下层目录对应的页面,将与落地页相匹配的列表摘要模板确定为与同一域名下的下层目录对应的页面相匹配的列表摘要模板。
例如,对查询词“益智小游戏”进行搜索,获取到一个搜索结果项指向落地页的链接URL为:http://xiaoyouxi.2366.com/yizhi,并基于该落地页生成列表摘要模板;提取该落地页的URL对应的域名为:http://xiaoyouxi.2366.com,爬取该域名下的全部下层目录对应的页面,如http://xiaoyouxi.2366.com/xiuxian、http://xiaoyouxi.2366.com/dongzuo、http://xiaoyouxi.2366.com/tiyu等对应的页面,并检测这些页面是否包含平级图文列表字段,当检测到这些URL对应的页面包含平级图文列表字段时,则确定URL为http://xiaoyouxi.2366.com/yizhi的列表摘要模板,是域名为“http://xiaoyouxi.2366.com”的下层目录对应的页面相匹配的列表摘要模板。之后,当用户输入查询词“体育小游戏”进行搜索获取的一个搜索结果项指向落地页的链接URL为:http://xiaoyouxi.2366.com/tiyu时,可直接使用域名http://xiaoyouxi.2366.com相对应的列表摘要模板来生成查询词“体育小游戏”的搜索结果项对应的列表摘要信息。
本优选实施例中,根据相同域名的下层目录对应网页的页面结构相似性特点,确定在同一域名下的网页可使用同一列表摘要模板,大大提高了大量落地页的列表摘要信息的生成效率,降低服务器端生成并存储不同落地页的列表摘要信息的压力和负担。
优选地(参照图3),该装置包括热门词选取模块(图中未示出)、热门结果选取模块(图中未示出)和页面提取模块(图中未示出):热门词选取模块根据对多个查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门查询词;热门结果选取模块根据热门查询词来确定相应的经排序的搜索结果项,并选取与每一热门查询词相应的排序前预定数量的搜索结果项作为热门搜索结果项;页面提取模块提取热门搜索结果项对应链接的热门落地页;模板预生成模块根据从热门落地页中提取到的平级图文列表字段,生成与热门搜索结果项相匹配的列表摘要模板。
例如,热度信息可通过在一定时间内用户的搜索次数、对搜索结果的浏览时长等维度来确定,对用户输入的多个查询词基于热度信息来排序后,选择排序前预定数量,如排序前五位,的查询词作为热门查询词;对热门查询词进行搜索、排序等处理后,获取每一查询词相应的经排序的搜索结果项,选取与每一热门查询词相应的排序前预定数量的搜索结果项,如排序前两位的搜索结果项,作为热门搜索结果项;提取热门搜索结果项对应URL指向的热门落地页;根据从热门落地页中提取到的平级图文列表字段,生成与热门搜索结果项相匹配的列表摘要模板。
本优选实施例中,由于列表摘要信息可为搜索引擎用户提供快捷高效的搜索模式,对热门搜索结果项生成列表摘要信息能够向尽可能多的用户提供该搜索模式。因此,通过选择热门查询词来确定相应的热门搜索结果项,并对热门搜索结果项相应的热门落地页来生成列表摘要模板,为被用户高频率搜索到的搜索结果项生成列表摘要信息奠定了前提基础,进而为向尽可能多的用户提供快捷高效的搜索模式提供可靠保证。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
本发明提供了A1.一种提供搜索结果的列表摘要信息的方法,包括:
根据接收到的用户在搜索框中输入的查询词,获取与所述查询词相匹配的排序后的一个或多个搜索结果项;
检测所述排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;
对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
A2.根据权利要求A1所述的提供搜索结果的列表摘要信息的方法,其特征在于,所述平级图文列表字段包括以下一种或多种的组合:
列表类型标记语言字段;
统一资源定位符、标题信息相关联记录的多个标记语言字段;
统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段。
A3.根据权利要求A1或A2所述的提供搜索结果的列表摘要信息的方法,其特征在于,对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项,包括:
提取所述搜索结果项对应链接的落地页中平级图文列表字段的数据信息;
基于所述平级图文列表字段的数据信息,填充所述列表摘要模板,重新生成包含列表摘要信息的搜索结果项。
A4.根据权利要求A1-A3中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,通过列表摘要模板进行结构化处理之前,该方法还包括:
确定与所述搜索结果项相匹配的列表摘要模板;
其中,对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项,包括:
对包含平级图文列表字段的落地页对应的搜索结果项,通过所述相匹配的列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
A5.根据权利要求A1-A4中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,该方法还包括:
根据从一个或多个落地页中提取到的平级图文列表字段,生成与所述一个或多个落地页相匹配的列表摘要模板。
A6.根据权利要求A1-A5中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,该方法还包括:
根据对多个查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门查询词;
根据所述热门查询词来确定相应的经排序的搜索结果项,并选取与每一热门查询词相应的排序前预定数量的搜索结果项作为热门搜索结果项;
提取所述热门搜索结果项对应链接的热门落地页;
其中,根据从一个或多个落地页中提取到的平级图文列表字段,生成与所述一个或多个落地页相匹配的列表摘要模板,具体包括:
根据从所述热门落地页中提取到的平级图文列表字段,生成与所述热门搜索结果项相匹配的列表摘要模板。
A7.根据权利要求A1-A6中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,该方法还包括:
提取一个或多个落地页的链接对应的域名;
检测所述域名的下层目录对应的页面是否包含平级图文列表字段;
对包含平级图文列表字段的所述域名的下层目录对应的页面,将与所述落地页相匹配的列表摘要模板确定为与同一域名下的下层目录对应的页面相匹配的列表摘要模板。
A8.根据权利要求A1-A7中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,所述列表摘要信息包括搜索结果项对应链接的落地页中以列表形式展现的多个子页面信息;
其中,所述子页面信息包括以下一种或多种的组合:
子页面对应的统一资源定位符;子页面的标题信息;子页面的图片信息。
A9.根据权利要求A1-A8中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,该方法还包括:
基于所述重新生成的包含列表摘要信息的搜索结果项绘制搜索结果页面。
本发明提供了A10.一种提供搜索结果的列表摘要信息的装置,包括:
结果获取模块,用于根据接收到用户在搜索框输入的查询词,获取与所述查询词相匹配的排序后的一个或多个搜索结果项;
第一检测模块,用于检测所述排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;
第一生成模块,用于对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
A11.根据权利要求A10所述的提供搜索结果的列表摘要信息的装置,其特征在于,所述平级图文列表字段包括以下一种或多种的组合:
列表类型标记语言字段;
统一资源定位符、标题信息相关联记录的多个标记语言字段;
统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段。
A12.根据权利要求A10或A11所述的提供搜索结果的列表摘要信息的装置,其特征在于,所述第一生成模块包括:
提取单元,用于提取所述搜索结果项对应链接的落地页中平级图文列表字段的数据信息;
重新生成单元,用于基于所述平级图文列表字段的数据信息,填充所述列表摘要模板,重新生成包含列表摘要信息的搜索结果项。
A13.根据权利要求A10-A12中任一项所述的提供搜索结果的列表摘要信息的装置,其特征在于,该装置还包括:
模板确定模块,用于确定与所述搜索结果项相匹配的列表摘要模板;
其中,所述第一生成模块用于对包含平级图文列表字段的落地页对应的搜索结果项,通过所述相匹配的列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
A14.根据权利要求A10-A13中任一项所述的提供搜索结果的列表摘要信息的装置,其特征在于,该装置还包括:
模板预生成模块,用于根据从一个或多个落地页中提取到的平级图文列表字段,生成与所述一个或多个落地页相匹配的列表摘要模板。
A15.根据权利要求A10-A14中任一项所述的提供搜索结果的列表摘要信息的装置,其特征在于,该装置还包括:
热门词选取模块,用于根据对多个查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门查询词;
热门结果选取模块,用于根据所述热门查询词来确定相应的经排序的搜索结果项,并选取与每一热门查询词相应的排序前预定数量的搜索结果项作为热门搜索结果项;
页面提取模块,用于提取所述热门搜索结果项对应链接的热门落地页;
其中,所述模板预生成模块具体用于根据从所述热门落地页中提取到的平级图文列表字段,生成与所述热门搜索结果项相匹配的列表摘要模板。
A16.根据权利要求A10-A15中任一项所述的提供搜索结果的列表摘要信息的装置,其特征在于,该装置还包括:
域名提取模块,用于提取一个或多个落地页的链接对应的域名;
第二检测模块,用于检测所述域名的下层目录对应的页面是否包含平级图文列表字段;
模板确定模块,用于对包含平级图文列表字段的所述域名的下层目录对应的页面,将与所述落地页相匹配的列表摘要模板确定为与同一域名下的下层目录对应的页面相匹配的列表摘要模板。
A17.根据权利要求A10-A16中任一项所述的提供搜索结果的列表摘要信息的装置,其特征在于,所述列表摘要信息包括搜索结果项对应链接的落地页中以列表形式展现的多个子页面信息;
其中,所述子页面信息包括以下一种或多种的组合:
子页面对应的统一资源定位符;子页面的标题信息;子页面的图片信息。
A18.根据权利要求A10-A17中任一项所述的提供搜索结果的列表摘要信息的装置,其特征在于,该装置还包括:
绘制模块,用于基于所述重新生成的包含列表摘要信息的搜索结果项绘制搜索结果页面。

Claims (10)

1.一种提供搜索结果的列表摘要信息的方法,其特征在于,包括:
根据接收到的用户在搜索框中输入的查询词,获取与所述查询词相匹配的排序后的一个或多个搜索结果项;
检测所述排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;
对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
2.根据权利要求1所述的提供搜索结果的列表摘要信息的方法,其特征在于,所述平级图文列表字段包括以下一种或多种的组合:
列表类型标记语言字段;
统一资源定位符、标题信息相关联记录的多个标记语言字段;
统一资源定位符、标题信息及图片信息相关联记录的多个标记语言字段。
3.根据权利要求1或2所述的提供搜索结果的列表摘要信息的方法,其特征在于,对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项,包括:
提取所述搜索结果项对应链接的落地页中平级图文列表字段的数据信息;
基于所述平级图文列表字段的数据信息,填充所述列表摘要模板,重新生成包含列表摘要信息的搜索结果项。
4.根据权利要求1-3中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,通过列表摘要模板进行结构化处理之前,该方法还包括:
确定与所述搜索结果项相匹配的列表摘要模板;
其中,对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项,包括:
对包含平级图文列表字段的落地页对应的搜索结果项,通过所述相匹配的列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
5.根据权利要求1-4中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,该方法还包括:
根据从一个或多个落地页中提取到的平级图文列表字段,生成与所述一个或多个落地页相匹配的列表摘要模板。
6.根据权利要求1-5中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,该方法还包括:
根据对多个查询词基于热度信息进行排序的排序结果,选取排序前预定数量的查询词作为热门查询词;
根据所述热门查询词来确定相应的经排序的搜索结果项,并选取与每一热门查询词相应的排序前预定数量的搜索结果项作为热门搜索结果项;
提取所述热门搜索结果项对应链接的热门落地页;
其中,根据从一个或多个落地页中提取到的平级图文列表字段,生成与所述一个或多个落地页相匹配的列表摘要模板,具体包括:
根据从所述热门落地页中提取到的平级图文列表字段,生成与所述热门搜索结果项相匹配的列表摘要模板。
7.根据权利要求1-6中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,该方法还包括:
提取一个或多个落地页的链接对应的域名;
检测所述域名的下层目录对应的页面是否包含平级图文列表字段;
对包含平级图文列表字段的所述域名的下层目录对应的页面,将与所述落地页相匹配的列表摘要模板确定为与同一域名下的下层目录对应的页面相匹配的列表摘要模板。
8.根据权利要求1-7中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,所述列表摘要信息包括搜索结果项对应链接的落地页中以列表形式展现的多个子页面信息;
其中,所述子页面信息包括以下一种或多种的组合:
子页面对应的统一资源定位符;子页面的标题信息;子页面的图片信息。
9.根据权利要求1-8中任一项所述的提供搜索结果的列表摘要信息的方法,其特征在于,该方法还包括:
基于所述重新生成的包含列表摘要信息的搜索结果项绘制搜索结果页面。
10.一种提供搜索结果的列表摘要信息的装置,其特征在于,包括:
结果获取模块,用于根据接收到用户在搜索框输入的查询词,获取与所述查询词相匹配的排序后的一个或多个搜索结果项;
第一检测模块,用于检测所述排序后的一个或多个搜索结果项对应链接的落地页是否包含平级图文列表字段;
第一生成模块,用于对包含平级图文列表字段的落地页对应的搜索结果项,通过列表摘要模板进行结构化处理,重新生成包含列表摘要信息的搜索结果项。
CN201510149878.6A 2015-03-31 2015-03-31 提供搜索结果的列表摘要信息的方法和装置 Pending CN104699841A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510149878.6A CN104699841A (zh) 2015-03-31 2015-03-31 提供搜索结果的列表摘要信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510149878.6A CN104699841A (zh) 2015-03-31 2015-03-31 提供搜索结果的列表摘要信息的方法和装置

Publications (1)

Publication Number Publication Date
CN104699841A true CN104699841A (zh) 2015-06-10

Family

ID=53346961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510149878.6A Pending CN104699841A (zh) 2015-03-31 2015-03-31 提供搜索结果的列表摘要信息的方法和装置

Country Status (1)

Country Link
CN (1) CN104699841A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528446A (zh) * 2015-12-23 2016-04-27 北京奇虎科技有限公司 满足延伸产品需求的摘要生成方法及装置
CN105574185A (zh) * 2015-12-22 2016-05-11 北京奇虎科技有限公司 一种提供聚合类型的智能摘要的方法和装置
CN105608183A (zh) * 2015-12-22 2016-05-25 北京奇虎科技有限公司 一种提供聚合类型回答的方法和装置
CN105630909A (zh) * 2015-12-21 2016-06-01 北京奇虎科技有限公司 规范化的标题信息展示方法及装置
CN105653600A (zh) * 2015-12-22 2016-06-08 北京奇虎科技有限公司 一种试题摘要信息的生成方法以及装置
CN105653606A (zh) * 2015-12-23 2016-06-08 北京奇虎科技有限公司 基于结构统一化处理的官网摘要展示方法及装置
WO2017101818A1 (zh) * 2015-12-16 2017-06-22 广州神马移动信息科技有限公司 搜索结果显示方法、装置及搜索系统
CN108205532A (zh) * 2016-12-16 2018-06-26 百度在线网络技术(北京)有限公司 生成网页的方法和装置
CN108256888A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 落地页的获取方法、网站服务器以及网络广告监测系统
CN110704607A (zh) * 2019-08-26 2020-01-17 北京三快在线科技有限公司 摘要生成方法、装置、电子设备及计算机可读存储介质
CN114706882A (zh) * 2016-10-26 2022-07-05 谷歌有限责任公司 结构化信息卡的搜索和检索
CN114926223A (zh) * 2022-06-07 2022-08-19 北京百度网讯科技有限公司 落地页特征生成方法、落地页搜索方法及相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591971A (zh) * 2011-12-31 2012-07-18 北京百度网讯科技有限公司 一种网页信息提取的方法和设备
CN104317929A (zh) * 2014-10-31 2015-01-28 北京奇虎科技有限公司 搜索结果呈现优化方法和装置
CN104376114A (zh) * 2014-12-01 2015-02-25 百度在线网络技术(北京)有限公司 一种搜索结果展示方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591971A (zh) * 2011-12-31 2012-07-18 北京百度网讯科技有限公司 一种网页信息提取的方法和设备
CN104317929A (zh) * 2014-10-31 2015-01-28 北京奇虎科技有限公司 搜索结果呈现优化方法和装置
CN104376114A (zh) * 2014-12-01 2015-02-25 百度在线网络技术(北京)有限公司 一种搜索结果展示方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017101818A1 (zh) * 2015-12-16 2017-06-22 广州神马移动信息科技有限公司 搜索结果显示方法、装置及搜索系统
CN105630909A (zh) * 2015-12-21 2016-06-01 北京奇虎科技有限公司 规范化的标题信息展示方法及装置
CN105608183A (zh) * 2015-12-22 2016-05-25 北京奇虎科技有限公司 一种提供聚合类型回答的方法和装置
CN105653600A (zh) * 2015-12-22 2016-06-08 北京奇虎科技有限公司 一种试题摘要信息的生成方法以及装置
CN105574185A (zh) * 2015-12-22 2016-05-11 北京奇虎科技有限公司 一种提供聚合类型的智能摘要的方法和装置
CN105608183B (zh) * 2015-12-22 2018-11-02 北京奇虎科技有限公司 一种提供聚合类型回答的方法和装置
CN105528446A (zh) * 2015-12-23 2016-04-27 北京奇虎科技有限公司 满足延伸产品需求的摘要生成方法及装置
CN105653606A (zh) * 2015-12-23 2016-06-08 北京奇虎科技有限公司 基于结构统一化处理的官网摘要展示方法及装置
CN114706882A (zh) * 2016-10-26 2022-07-05 谷歌有限责任公司 结构化信息卡的搜索和检索
CN108205532A (zh) * 2016-12-16 2018-06-26 百度在线网络技术(北京)有限公司 生成网页的方法和装置
CN108256888A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 落地页的获取方法、网站服务器以及网络广告监测系统
CN110704607A (zh) * 2019-08-26 2020-01-17 北京三快在线科技有限公司 摘要生成方法、装置、电子设备及计算机可读存储介质
CN114926223A (zh) * 2022-06-07 2022-08-19 北京百度网讯科技有限公司 落地页特征生成方法、落地页搜索方法及相关装置

Similar Documents

Publication Publication Date Title
CN104699841A (zh) 提供搜索结果的列表摘要信息的方法和装置
Madhavan et al. Harnessing the deep web: Present and future
CN101918945B (zh) 用于执行自动扩展的语言搜索的方法和系统
CN103023714B (zh) 基于网络话题的活跃度与集群结构分析系统及方法
WO2016150083A1 (zh) 一种信息输入方法和装置
CN102073726B (zh) 搜索引擎系统的结构化数据的引入方法和装置
US8271495B1 (en) System and method for automating categorization and aggregation of content from network sites
CN106682012B (zh) 商品对象信息搜索方法及装置
KR100930455B1 (ko) 쿼리별 검색 컬렉션 생성 방법 및 시스템
JP2013531289A (ja) 検索におけるモデル情報群の使用
CN103838785A (zh) 一种专利领域的垂直搜索引擎
CN104715064A (zh) 一种实现在网页上标注关键词的方法和服务器
CN103699700A (zh) 一种搜索引导的生成方法、系统及相关服务器
CN105183884A (zh) 一种基于大数据技术的搜索引擎系统及搜索引擎方法
CN104090976A (zh) 搜索引擎爬虫抓取网页的方法及装置
CN105095175A (zh) 获取截短的网页标题的方法及装置
US8700624B1 (en) Collaborative search apps platform for web search
CN103984757A (zh) 在搜索结果页上插入新闻信息条目的方法和系统
US11055335B2 (en) Contextual based image search results
CN103838862A (zh) 一种视频搜索的方法、装置及终端
CN101957860B (zh) 一种发布、搜索信息的方法及装置
US20100082594A1 (en) Building a topic based webpage based on algorithmic and community interactions
CN105653600A (zh) 一种试题摘要信息的生成方法以及装置
CN105069175A (zh) 一种基于版本控制系统的信息检索方法及服务器
CN106372123B (zh) 一种基于标签的相关内容推荐方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150610

RJ01 Rejection of invention patent application after publication