CN103927380A - 搜索结果的提供方法和装置 - Google Patents

搜索结果的提供方法和装置 Download PDF

Info

Publication number
CN103927380A
CN103927380A CN201410175750.2A CN201410175750A CN103927380A CN 103927380 A CN103927380 A CN 103927380A CN 201410175750 A CN201410175750 A CN 201410175750A CN 103927380 A CN103927380 A CN 103927380A
Authority
CN
China
Prior art keywords
picture
webpage
search results
representative picture
station
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410175750.2A
Other languages
English (en)
Other versions
CN103927380B (zh
Inventor
陶涛
牛正雨
郭瑞
张梦涵
张岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410175750.2A priority Critical patent/CN103927380B/zh
Publication of CN103927380A publication Critical patent/CN103927380A/zh
Application granted granted Critical
Publication of CN103927380B publication Critical patent/CN103927380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提出一种搜索结果的提供方法和装置。该方法包括:接收用户输入的搜索词,并根据搜索词获得搜索结果;对搜索词进行分析以确定搜索词对应的图片展现需求信息;根据图片展现需求信息在预先建立的图片数据库中查询搜索结果对应的网页是否存在代表图片,代表图片是根据对应网页的站长发布的数据所提取的;向用户展现搜索结果,其中,当搜索结果对应的网页存在代表图片时,向用户展现所述代表图片。本发明实施例的方法,向用户展现的代表图片最新、更有权威性;另外,由于站长发布的数据的规范性,在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。

Description

搜索结果的提供方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种搜索结果的提供方法和装置。
背景技术
目前,用户通常使用搜索引擎获取信息。具体地,搜索引擎抓取网页,并根据用户输入的搜索词匹配网页中包含该搜索词的搜索结果,将搜索结果排序后提供给用户。提供搜索结果给用户时,为了使用户能够直观地从搜索结果中了解对应的网页,最有效的方法是在搜索结果中提供网页代表图片。
相关技术中,主要通过两种方式获取网页代表图片:(1)分析网页的源代码以获取网页代表图片。例如,对网页的HTML(Hyper Text Markup language,超文本标记语言)源代码进行渲染,计算出网页中每个节点的坐标和面积,得到主体图片,再根据每个主体图片语意、内容信息和网页主题的相关性,得到网页代表图片;(2)配置网页结构模板,根据网页结构模板配置网页代表图片所在的XPath,并根据XPath抽取网页代表图片。
相关技术存在的问题是,第一种方式从源代码角度无法准确地识别出网页的区域大小,不能很好地判断出网页的主体区域,进而不能很好判断出主体图片;另外如果对页面做完整的渲染,速度太慢。第二种方式灵活度不高,只能处理规整的网站,并且网页结构模板的生成和维护代价很大,在页面改版时就会失效。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种搜索结果的提供方法。该方法在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。
本发明的第二个目的在于提出一种搜索结果的提供装置。
为了实现上述目的,本发明第一方面实施例的搜索结果的提供方法,包括:接收用户输入的搜索词,并根据所述搜索词获得搜索结果;对所述搜索词进行分析以确定所述搜索词对应的图片展现需求信息;根据所述图片展现需求信息在预先建立的图片数据库中查询所述搜索结果对应的网页是否存在代表图片,所述代表图片是根据对应网页的站长发布的数据所提取的;向所述用户展现所述搜索结果,其中,当所述搜索结果对应的网页存在代表图片时,向所述用户展现所述代表图片。
本发明实施例的搜索结果的提供方法,当搜索结果对应的网页存在代表图片时,向用户展现代表图片,该代表图片是根据对应网页的站长发布的数据所提取的,因此向用户展现的代表图片最新、更有权威性;另外,由于站长发布的数据的规范性,在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。
为了实现上述目的,本发明第二方面实施例的搜索结果的提供装置,包括:接收模块,用于接收用户输入的搜索词;获得模块,用于根据所述搜索词获得搜索结果;确定模块,用于对所述搜索词进行分析以确定所述搜索词对应的图片展现需求信息;查询模块,用于根据所述图片展现需求信息在预先建立的图片数据库中查询所述搜索结果对应的网页是否存在代表图片,所述代表图片是根据对应网页的站长发布的数据所提取的;展现模块,用于向所述用户展现所述搜索结果,其中,当所述搜索结果对应的网页存在代表图片时,向所述用户展现所述代表图片。
本发明实施例的搜索结果的提供装置,当搜索结果对应的网页存在代表图片时,向用户展现代表图片,该代表图片是根据对应网页的站长发布的数据所提取的,因此向用户展现的代表图片最新、更有权威性;另外,由于站长发布的数据的规范性,在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
图1是根据本发明一个实施例的搜索结果的提供方法的流程图;
图2是根据本发明另一个实施例的搜索结果的提供方法的流程图;
图3是根据本发明一个实施例的搜索结果的提供装置的结构框图;
图4是根据本发明另一个实施例的搜索结果的提供装置的结构框图;以及
图5是根据本发明又一个实施例的搜索结果的提供装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
下面参考附图描述根据本发明实施例的搜索结果的提供方法和装置。
图1是根据本发明一个实施例的搜索结果的提供方法的流程图。
如图1所示,该搜索结果的提供方法包括:
S101,接收用户输入的搜索词,并根据搜索词获得搜索结果。
具体地,在本发明的实施例中,用户可在搜索引擎提供的输入框中输入搜索词,用户还可在各种快捷搜索输入框中输入搜索词,对此,本方法的实施例不进行限定。另外,搜索引擎获取用户输入的搜索词后,可以根据现有技术或今后可能出现的任何技术根据搜索词获得搜索结果,对此,本方法的实施例不进行限定。
S102,对搜索词进行分析以确定搜索词对应的图片展现需求信息。
具体地,搜索引擎接收到用户输入的搜索词后,需要判断有多大的可能性是想在搜索结果中看到与搜索词关联的图片。例如,用户输入搜索词为iphone5s时,用户可能想看到关于iphone5s的外观、参数等的图片,此时对应的需求大,又例如,用户输入搜索词为龙抓槐时,用户可能想看到关于龙抓槐这种植物对应的图片,此时对应的需求也较大。
在本发明的一个实施例中,S102具体包括:判断搜索词是否包含预设关键词,如果包含预设关键词,根据对应的预设关键词获取需求信息,其中预设关键词以及对应的需求信息可预存储在数据库中。例如,如果搜索词包含人物、物体或地点等类型关键词,对应的需求强度比较强烈,可以根据人物、物体或地点等类型关键词具体确定。
需要理解的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对搜索词进行分析以确定搜索词对应的图片展现需求信息的实现方式,均应包含在本发明的范围内。
S103,根据图片展现需求信息在预先建立的图片数据库中查询搜索结果对应的网页是否存在代表图片,代表图片是根据对应网页的站长发布的数据所提取的。
具体地,如果代表图片是根据对应网页的站长发布的数据所提取的,则对应的代表图片更新、更有权威性,而且相对于相关技术更加容易提取。站长发布的数据可以有多种表现形式,以下将具体列举几个实施例进行详细描述,但同样需要说明的是以下的实施例仅是示意性的,并非仅能通过以下实施例来实现,本领域技术人员可根据以下实施例进行相应的扩展或变化,这些均应包含在本发明的保护范围之内。
在本发明的一个实施例中,站长发布的数据嵌入在网页源代码的元信息标签中,或,站长发布的数据嵌入在网页源代码的图片标签中。具体地,首先站长获取网页的代表图片,然后按照约定规则生成数据进行发布。例如,站长可以以下面的方式发布网页的代表图片:<meta name=“bd_representative_img”content=“x.jpg”>,其中,meta表示元信息标签,bd_representative_img表示meta的名称或属性为代表图片,content包括代表图片的具体内容;又如,站长可以以下面的方式发布自己的代表图片:<img src=“x.jpg”bd_representative_img=1>,其中,img表示图片标签,在图片标签增加代表图片属性representative_img,表示该图片标签中的图片为代表图片,src包括代表图片的具体内容。需要理解的是,bd_representative_img等仅为了更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,可以以任何方便的形式表示代表图片属性,这些形式均应包含在本发明的范围内。
在本发明的另一个实施例中,站长发布的数据是网页的站长定向发送的二元组数据。具体地,二元组数据主要包括网页的统一资源定位符URL(Uniform Resource Locator)和代表图片的链接信息,二元组数据可以包括多种表现形式,例如可扩展标记语言XML(eXtensible Markup Language)文件等。
另外,需要理解的是,站长发布的数据嵌入在网页源代码的元信息标签中,或,站长发布的数据嵌入在网页源代码的图片标签中,这两种发布方式是公开的,即任何机构都可以获取到,具有普遍性。站长发布的数据是网页的站长定向发送的二元组数据,这种发布方式是保密的,只有特定的机构能够获取的,具有针对性。
S104,向用户展现搜索结果,其中,当搜索结果对应的网页存在代表图片时,向用户展现代表图片。
本发明实施例的搜索结果的提供方法,当搜索结果对应的网页存在代表图片时,向用户展现代表图片,该代表图片是根据对应网页的站长发布的数据所提取的,因此向用户展现的代表图片最新、更有权威性;另外,由于站长发布的数据的规范性,在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。
图2是根据本发明另一个实施例的搜索结果的提供方法的流程图。
如图2所示,该搜索结果的提供方法包括:
S201,接收用户输入的搜索词,并根据搜索词获得搜索结果。
具体地,在本发明的实施例中,用户可在搜索引擎提供的输入框中输入搜索词,用户还可在各种快捷搜索输入框中输入搜索词,对此,本方法的实施例不进行限定。另外,搜索引擎获取用户输入的搜索词后,可以根据现有技术或今后可能出现的任何技术根据搜索词获得搜索结果,对此,本方法的实施例不进行限定。
S202,对搜索词进行分析以确定搜索词对应的图片展现需求信息。
在本发明的一个实施例中,S102具体包括:判断搜索词是否包含预设关键词,如果包含预设关键词,根据对应的预设关键词获取需求信息,其中预设关键词以及对应的需求信息可预存储在数据库中。例如,如果搜索词包含人物、物体或地点等类型关键词,对应的需求强度比较强烈,可以根据人物、物体或地点等类型关键词具体确定。
需要理解的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对搜索词进行分析以确定搜索词对应的图片展现需求信息的实现方式,均应包含在本发明的范围内。
在本发明的一个实施例中,需求信息包括需求强度。
S203,根据需求强度确定是否需要展现代表图片。
例如,设置阈值,如0.1等,如果需求强度超过阈值,则确定需要展现代表图片,否则不需要展现代表图片。
S204,在确定需要展现代表图片时,在预先建立的图片数据库中查询搜索结果对应的网页是否存在代表图片。
其中,代表图片是根据对应网页的站长发布的数据所提取的。具体地,如果代表图片是根据对应网页的站长发布的数据所提取的,则对应的代表图片更新、更有权威性,而且相对于相关技术更加容易提取。站长发布的数据可以有多种表现形式,以下将具体列举几个实施例进行详细描述,但同样需要说明的是以下的实施例仅是示意性的,并非仅能通过以下实施例来实现,本领域技术人员可根据以下实施例进行相应的扩展或变化,这些均应包含在本发明的保护范围之内。在本发明的一个实施例中,站长发布的数据嵌入在网页源代码的元信息标签中,或,站长发布的数据嵌入在网页源代码的图片标签中。在本发明的另一个实施例中,站长发布的数据是网页的站长定向发送的二元组数据。
S205,向用户展现搜索结果,其中,当搜索结果对应的网页存在代表图片时,向用户展现代表图片。
在本发明的一个实施例中,在S205之前,还包括(图中未示出):根据图片展现需求强度对搜索结果的排序进行调整。例如,如果图片展现需求强度比较强,则将搜索结果中对应图片较多的网页可以提前排序显示。由此更加满足用户的需求,提升用户体验。
在本发明的一个实施例中,在S205之前,还包括(图中未示出):获取代表图片,获取代表图片具体包括:获取搜索结果对应的网页的统一资源定位符URL;从图片数据库中获取与URL对应的图片,图片是站长得到的原始图片的缩略图;将获取的图片确定为代表图片。
本发明实施例的搜索结果的提供方法,根据需求强度确定是否需要展现代表图片,并在确定需要展现代表图片时向用户展现代表图片,更加满足用户的需求,提升用户体验。
在本发明的一个实施例中,在S101或S102之前还包括:建立图片数据库,建立图片数据库具体包括:根据站长发布的数据获取搜索结果对应的网页的统一资源定位符URL、代表图片的链接信息;根据代表图片的链接信息抓取代表图片的原始图片,并对抓取的所述原始图片进行压缩处理以生成所述缩略图;建立网页的URL和缩略图之间的对应关系。
为了实现上述实施例,本发明的实施例还提出一种搜索结果的提供装置。
图3是根据本发明一个实施例的搜索结果的提供装置的结构框图。
如图3所示,该搜索结果的提供装置100包括:接收模块110、获得模块120、确定模块130、查询模块140和展现模块150。
具体地,接收模块110用于接收用户输入的搜索词。获得模块120用于根据搜索词获得搜索结果。在本发明的实施例中,用户可在搜索引擎提供的输入框中输入搜索词,用户还可在各种快捷搜索输入框中输入搜索词,对此,本方法的实施例不进行限定。另外,获取用户输入的搜索词后,获得模块120可以根据现有技术或今后可能出现的任何技术根据搜索词获得搜索结果,对此,本方法的实施例不进行限定。
确定模块130用于对搜索词进行分析以确定搜索词对应的图片展现需求信息。其中,接收到用户输入的搜索词后,需要判断有多大的可能性是想在搜索结果中看到与搜索词关联的图片。例如,用户输入搜索词为iphone5s时,用户可能想看到关于iphone5s的外观、参数等的图片,此时对应的需求大,又例如,用户输入搜索词为龙抓槐时,用户可能想看到关于龙抓槐这种植物对应的图片,此时对应的需求也较大。
在本发明的一个实施例中,确定模块130具体用于:判断搜索词是否包含预设关键词,如果包含预设关键词,根据对应的预设关键词获取需求信息,其中预设关键词以及对应的需求信息可预存储在数据库中。例如,如果搜索词包含人物、物体或地点等类型关键词,对应的需求强度比较强烈,可以根据人物、物体或地点等类型关键词具体确定。
需要理解的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对搜索词进行分析以确定搜索词对应的图片展现需求信息的实现方式,均应包含在本发明的范围内。
查询模块140用于根据图片展现需求信息在预先建立的图片数据库中查询搜索结果对应的网页是否存在代表图片,代表图片是根据对应网页的站长发布的数据所提取的。
更具体地,如果代表图片是根据对应网页的站长发布的数据所提取的,则对应的代表图片更新、更有权威性,而且相对于相关技术更加容易提取。站长发布的数据可以有多种表现形式,以下将具体列举几个实施例进行详细描述,但同样需要说明的是以下的实施例仅是示意性的,并非仅能通过以下实施例来实现,本领域技术人员可根据以下实施例进行相应的扩展或变化,这些均应包含在本发明的保护范围之内。
在本发明的一个实施例中,站长发布的数据嵌入在网页源代码的元信息标签中,或,站长发布的数据嵌入在网页源代码的图片标签中。具体地,首先站长获取网页的代表图片,然后按照约定规则生成数据进行发布。例如,站长可以以下面的方式发布网页的代表图片:<meta name=“bd_representative_img”content=“x.jpg”>,其中,meta表示元信息标签,bd_representative_img表示meta的名称或属性为代表图片,content包括代表图片的具体内容;又如,站长可以以下面的方式发布自己的代表图片:<img src=“x.jpg”bd_representative_img=1>,其中,img表示图片标签,在图片标签增加代表图片属性representative_img,表示该图片标签中的图片为代表图片,src包括代表图片的具体内容。需要理解的是,bd_representative_img等仅为了更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,可以以任何方便的形式表示代表图片属性,这些形式均应包含在本发明的范围内。
在本发明的另一个实施例中,站长发布的数据是网页的站长定向发送的二元组数据。具体地,二元组数据主要包括网页的统一资源定位符URL(Uniform Resource Locator)和代表图片的链接信息,二元组数据可以包括多种表现形式,例如可扩展标记语言XML(eXtensible Markup Language)文件等。
另外,需要理解的是,站长发布的数据嵌入在网页源代码的元信息标签中,或,站长发布的数据嵌入在网页源代码的图片标签中,这两种发布方式是公开的,即任何机构都可以获取到,具有普遍性。站长发布的数据是网页的站长定向发送的二元组数据,这种发布方式是保密的,只有特定的机构能够获取的,具有针对性。
展现模块150用于向用户展现搜索结果,其中,当搜索结果对应的网页存在代表图片时,向用户展现代表图片。
本发明实施例的搜索结果的提供装置,当搜索结果对应的网页存在代表图片时,向用户展现代表图片,该代表图片是根据对应网页的站长发布的数据所提取的,因此向用户展现的代表图片最新、更有权威性;另外,由于站长发布的数据的规范性,在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。
在本发明的一个实施例中,需求信息包括需求强度。
在本发明的一个实施例中,查询模块140具体用于:根据需求强度确定是否需要展现代表图片,例如,设置阈值,如0.1等,如果需求强度超过阈值,则确定需要展现代表图片,否则不需要展现代表图片,并在确定需要展现代表图片时,在预先建立的图片数据库中查询搜索结果对应的网页是否存在代表图片。
图4是根据本发明另一个实施例的搜索结果的提供装置的结构框图。
如图4所示,该搜索结果的提供装置100包括:接收模块110、获得模块120、确定模块130、查询模块140、展现模块150和调整模块160。
具体地,调整模块160用于在向用户展现搜索结果之前,根据图片展现需求强度对搜索结果的排序进行调整。例如,如果图片展现需求强度比较强,则将搜索结果中对应图片较多的网页可以提前排序显示。由此更加满足用户的需求,提升用户体验。
图5是根据本发明又一个实施例的搜索结果的提供装置的结构框图。
如图5所示,该搜索结果的提供装置100包括:接收模块110、获得模块120、确定模块130、查询模块140、展现模块150、调整模块160、获取模块170和建立模块180。
具体地,获取模块170用于获取代表图片,其中,获取模块170具体用于:获取搜索结果对应的网页的统一资源定位符URL,并从图片数据库中获取与URL对应的图片,图片是站长得到的原始图片的缩略图,以及将获取的图片确定为代表图片。
在本发明的一个实施例中,建立模块180用于建立图片数据库,建立模块180具体用于:根据站长发布的数据获取搜索结果对应的网页的统一资源定位符URL、代表图片的链接信息,并根据代表图片的链接信息抓取代表图片的原始图片,并对抓取的原始图片进行压缩处理以生成缩略图,以及建立网页的URL和缩略图之间的对应关系。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (16)

1.一种搜索结果的提供方法,其特征在于,包括:
接收用户输入的搜索词,并根据所述搜索词获得搜索结果;
对所述搜索词进行分析以确定所述搜索词对应的图片展现需求信息;
根据所述图片展现需求信息在预先建立的图片数据库中查询所述搜索结果对应的网页是否存在代表图片,所述代表图片是根据对应网页的站长发布的数据所提取的;
向所述用户展现所述搜索结果,其中,当所述搜索结果对应的网页存在代表图片时,向所述用户展现所述代表图片。
2.根据权利要求1所述的方法,其特征在于,所述站长发布的数据嵌入在网页源代码的元信息标签中,或,所述站长发布的数据嵌入在网页源代码的图片标签中。
3.根据权利要求1所述的方法,其特征在于,所述站长发布的数据是所述网页的站长定向发送的二元组数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述需求信息包括需求强度。
5.根据权利要求4所述的方法,其特征在于,所述根据所述图片展现需求信息在预先建立的图片数据库中查询所述搜索结果对应的网页是否存在代表图片,包括:
根据所述需求强度确定是否需要展现所述代表图片;
在确定需要展现所述代表图片时,在预先建立的所述图片数据库中查询所述搜索结果对应的网页是否存在所述代表图片。
6.根据权利要求4所述的方法,其特征在于,在所述向所述用户展现所述搜索结果之前,还包括:
根据所述图片展现需求强度对所述搜索结果的排序进行调整。
7.根据权利要求1-3任一项所述的方法,其特征在于,还包括:获取所述代表图片,所述获取所述代表图片,包括:
获取所述搜索结果对应的网页的统一资源定位符URL;
从所述图片数据库中获取与所述URL对应的图片,所述图片是站长得到的原始图片的缩略图;
将获取的所述图片确定为所述代表图片。
8.根据权利要求7所述的方法,其特征在于,还包括:建立所述图片数据库,所述建立所述图片数据库,包括:
根据所述站长发布的数据获取所述搜索结果对应的网页的统一资源定位符URL、所述代表图片的链接信息;
根据所述代表图片的链接信息抓取所述代表图片的原始图片,并对抓取的所述原始图片进行压缩处理以生成所述缩略图;
建立所述网页的URL和所述缩略图之间的对应关系。
9.一种搜索结果的提供装置,其特征在于,包括:
接收模块,用于接收用户输入的搜索词;
获得模块,用于根据所述搜索词获得搜索结果;
确定模块,用于对所述搜索词进行分析以确定所述搜索词对应的图片展现需求信息;
查询模块,用于根据所述图片展现需求信息在预先建立的图片数据库中查询所述搜索结果对应的网页是否存在代表图片,所述代表图片是根据对应网页的站长发布的数据所提取的;
展现模块,用于向所述用户展现所述搜索结果,其中,当所述搜索结果对应的网页存在代表图片时,向所述用户展现所述代表图片。
10.根据权利要求9所述的装置,其特征在于,所述站长发布的数据嵌入在网页源代码的元信息标签中,或,所述站长发布的数据嵌入在网页源代码的图片标签中。
11.根据权利要求9所述的装置,其特征在于,所述站长发布的数据是所述网页的站长定向发送的二元组数据。
12.根据权利要求9-11任一项所述的装置,其特征在于,所述需求信息包括需求强度。
13.根据权利要求12所述的装置,其特征在于,所述查询模块具体用于:根据所述需求强度确定是否需要展现所述代表图片,并在确定需要展现所述代表图片时,在预先建立的所述图片数据库中查询所述搜索结果对应的网页是否存在所述代表图片。
14.根据权利要求12所述的装置,其特征在于,还包括:
调整模块,用于在所述向所述用户展现所述搜索结果之前,根据所述图片展现需求强度对所述搜索结果的排序进行调整。
15.根据权利要求9-11任一项所述的装置,其特征在于,还包括:
获取模块,用于获取所述代表图片,其中,所述获取模块具体用于:获取所述搜索结果对应的网页的统一资源定位符URL,并从所述图片数据库中获取与所述URL对应的图片,所述图片是站长得到的原始图片的缩略图,以及将获取的所述图片确定为所述代表图片。
16.根据权利要求15所述的装置,其特征在于,还包括:
建立模块,用于建立所述图片数据库,所述建立模块具体用于:根据所述站长发布的数据获取所述搜索结果对应的网页的统一资源定位符URL、所述代表图片的链接信息,并根据所述代表图片的链接信息抓取所述代表图片的原始图片,并对抓取的所述原始图片进行压缩处理以生成所述缩略图,以及建立所述网页的URL和所述缩略图之间的对应关系。
CN201410175750.2A 2014-04-28 2014-04-28 搜索结果的提供方法和装置 Active CN103927380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410175750.2A CN103927380B (zh) 2014-04-28 2014-04-28 搜索结果的提供方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410175750.2A CN103927380B (zh) 2014-04-28 2014-04-28 搜索结果的提供方法和装置

Publications (2)

Publication Number Publication Date
CN103927380A true CN103927380A (zh) 2014-07-16
CN103927380B CN103927380B (zh) 2018-11-20

Family

ID=51145600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410175750.2A Active CN103927380B (zh) 2014-04-28 2014-04-28 搜索结果的提供方法和装置

Country Status (1)

Country Link
CN (1) CN103927380B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391871A (zh) * 2014-10-27 2015-03-04 北京百度网讯科技有限公司 多媒体内容的提供方法和装置
CN104537072A (zh) * 2014-12-30 2015-04-22 百度在线网络技术(北京)有限公司 搜索方法和装置
CN104850589A (zh) * 2015-04-24 2015-08-19 百度在线网络技术(北京)有限公司 一种检索结果的显示方法及装置
CN105786849A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种文档类网页自定义摘要的生成方法和系统
CN105786847A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种电商网站中商品网页的结构化摘要的显示方法和系统
CN106919571A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 获取与搜索关键词相匹配的图片的方法及装置
CN107515869A (zh) * 2016-06-15 2017-12-26 北京搜狗科技发展有限公司 一种搜索方法和装置、一种用于搜索的装置
CN108399174A (zh) * 2017-02-07 2018-08-14 阿里巴巴集团控股有限公司 对象搜索方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070136680A1 (en) * 2005-12-11 2007-06-14 Topix Llc System and method for selecting pictures for presentation with text content
CN101976252A (zh) * 2010-10-26 2011-02-16 百度在线网络技术(北京)有限公司 图片展示系统及其展示方法
CN102419776A (zh) * 2011-12-31 2012-04-18 北京百度网讯科技有限公司 一种满足用户多维度搜索需求的方法和设备
CN103077217A (zh) * 2012-12-28 2013-05-01 北京百度网讯科技有限公司 用于提供与查询序列相匹配的结果附加信息的方法、装置与设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070136680A1 (en) * 2005-12-11 2007-06-14 Topix Llc System and method for selecting pictures for presentation with text content
CN101976252A (zh) * 2010-10-26 2011-02-16 百度在线网络技术(北京)有限公司 图片展示系统及其展示方法
CN102419776A (zh) * 2011-12-31 2012-04-18 北京百度网讯科技有限公司 一种满足用户多维度搜索需求的方法和设备
CN103077217A (zh) * 2012-12-28 2013-05-01 北京百度网讯科技有限公司 用于提供与查询序列相匹配的结果附加信息的方法、装置与设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391871A (zh) * 2014-10-27 2015-03-04 北京百度网讯科技有限公司 多媒体内容的提供方法和装置
CN105786849A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种文档类网页自定义摘要的生成方法和系统
CN105786847A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种电商网站中商品网页的结构化摘要的显示方法和系统
CN104537072A (zh) * 2014-12-30 2015-04-22 百度在线网络技术(北京)有限公司 搜索方法和装置
CN104850589A (zh) * 2015-04-24 2015-08-19 百度在线网络技术(北京)有限公司 一种检索结果的显示方法及装置
CN104850589B (zh) * 2015-04-24 2018-03-23 百度在线网络技术(北京)有限公司 一种检索结果的显示方法及装置
CN106919571A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 获取与搜索关键词相匹配的图片的方法及装置
CN107515869A (zh) * 2016-06-15 2017-12-26 北京搜狗科技发展有限公司 一种搜索方法和装置、一种用于搜索的装置
CN107515869B (zh) * 2016-06-15 2023-03-14 北京搜狗科技发展有限公司 一种搜索方法和装置、一种用于搜索的装置
CN108399174A (zh) * 2017-02-07 2018-08-14 阿里巴巴集团控股有限公司 对象搜索方法及装置

Also Published As

Publication number Publication date
CN103927380B (zh) 2018-11-20

Similar Documents

Publication Publication Date Title
CN103927380A (zh) 搜索结果的提供方法和装置
US9639631B2 (en) Converting XML to JSON with configurable output
US8682879B2 (en) Marker search system for augmented reality service
CN104504109A (zh) 图片搜索方法和装置
US20150154232A1 (en) System and method for associating images with semantic entities
US20080306941A1 (en) System for automatically extracting by-line information
CN104063489A (zh) 一种确定网页图片相关度及显示检索结果的方法及装置
CN103714054A (zh) 翻译方法和翻译装置
KR102233867B1 (ko) 유사 그룹 요소 추출
US20210042466A1 (en) Detecting compatible layouts for content-based native ads
CN102254027A (zh) 批量获取网页内容的方法
US10769216B2 (en) Data acquisition method, data acquisition apparatus, and recording medium
CN104331438B (zh) 对小说网页内容选择性抽取方法和装置
CN103942272A (zh) 图片搜索方法和装置
CN103235821A (zh) 原创内容的搜索方法和搜索服务器
CN104504110A (zh) 搜索方法和装置
JP2008158589A (ja) 更新情報通知装置及び更新情報通知プログラム
CN109783728B (zh) 页面爬虫规则更新方法及系统
Eyal-Salman et al. Feature-to-code traceability in legacy software variants
CN102609538B (zh) 一种用于展现搜索结果的方法、装置、设备和系统
JP5370532B2 (ja) ブログ収集サーバ
CN104331472A (zh) 分词训练数据的构造方法和装置
CN105589863B (zh) 一种搜索方法及数据处理方法、装置及系统
US10726076B2 (en) Information acquisition method, and information acquisition device
CN106294755B (zh) 用于url分类的网页推荐系统及网页推荐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant