CN104102733A - 搜索内容提供方法和搜索引擎 - Google Patents

搜索内容提供方法和搜索引擎 Download PDF

Info

Publication number
CN104102733A
CN104102733A CN201410356253.2A CN201410356253A CN104102733A CN 104102733 A CN104102733 A CN 104102733A CN 201410356253 A CN201410356253 A CN 201410356253A CN 104102733 A CN104102733 A CN 104102733A
Authority
CN
China
Prior art keywords
search
user
resource data
search engine
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410356253.2A
Other languages
English (en)
Other versions
CN104102733B (zh
Inventor
吴倩君
夏春阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410356253.2A priority Critical patent/CN104102733B/zh
Publication of CN104102733A publication Critical patent/CN104102733A/zh
Application granted granted Critical
Publication of CN104102733B publication Critical patent/CN104102733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种搜索内容提供方法和搜索引擎,其中搜索内容提供方法,包括:搜索引擎获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息;搜索引擎根据历史操作信息预测用户需求维度;搜索引擎根据用户需求维度获取每个用户需求维度对应的资源数据;以及搜索引擎接收与目标内容相关的搜索词,并按照用户需求维度展示每个用户需求维度对应的资源数据。本发明的搜索内容提供方法,能够保证为用户提供准确、优质的搜索内容,便于用户从搜索引擎提供的搜索内容中选择需要的资源,降低了用户的搜索成本,提升了用户的搜索体验。

Description

搜索内容提供方法和搜索引擎
技术领域
本发明涉及搜索技术领域,特别涉及一种搜索内容提供方法和搜索引擎。
背景技术
目前搜索引擎提供给用户的内容,是通过spider爬虫按照相关性等规则获取的,而对于搜索引擎提供给用户的内容来说,用户并不需要全部资源,而仅需要其中一个或几个资源,因此,搜索引擎会将获取到的结果按照一定的规则进行排序显示,以便用户进行选择。举例来说,对应搜索关键词“郑多燕健身操”,可搜索视频题目中符合这个关键词的视频,再通过权威性、时效性和用户点击量等策略进行排序后提供给用户。对于一些定期发布的资源,可根据资源发布时间作为索引,将资源内容排序后提供给用户。
但是,通过资源题目与搜索关键词的相关性提供搜索内容的方式中,提供的搜索内容是否符合用户需求完全取决于资源的题目的写法,而这个写法是各个网站自己进行的描述,其质量完全不可控。特别是对于UGC(User Generated Content,用户生成内容)资源来说,由于发布用户的水平以及用户性质的不同,这类资源可能存在大量的作弊、广告、盗链等现象,因此,此类资源存在资源标题与资源内容不一致的情况,会导致最终提供的搜索内容的质量(如清晰度、精彩程度等)差,难以满足用户的搜索需求。
而通过发布时间作为索引提供搜索内容的方式中,仅限于定期发布的资源,使用范围较窄,并且仅以发布时间为维度,并未考虑用户的其他需求(如资源质量等),同样难以满足用户的多样化需求。
此外,目前的搜索内容提供方式中,搜索内容大多包含从全网资源中筛选出的大量资源,搜索内容缺乏资源排序、分类等结构化关系,用户难以对搜索结果进行全局了解,因而需要在筛选出的大量内容中逐一点击查看,操作非常繁琐,耗时耗力,大大增加了用户筛选内容的成本。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种搜索内容提供方法,能够保证为用户提供准确、优质的搜索内容,降低用户的搜索成本。
本发明的第二个目的在于提出一种搜索引擎。
为达上述目的,根据本发明第一方面实施例提出了一种搜索内容提供方法,包括:搜索引擎获取用户针对目标内容的历史搜索词和针对所述历史搜索词产生的搜索结果的历史操作信息;所述搜索引擎根据所述历史操作信息预测用户需求维度;所述搜索引擎根据所述用户需求维度获取每个所述用户需求维度对应的资源数据;以及所述搜索引擎接收与所述目标内容相关的搜索词,并按照所述用户需求维度展示每个所述用户需求维度对应的资源数据。
本发明实施例的搜索内容提供方法,通过获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息,并据此预测用户需求维度、获取需求维度对应的资源数据,以在用户输入与目标内容相关的搜索词时,按照用户需求维度提供对应的资源数据,从而能够保证为用户提供准确、优质的搜索内容,便于用户从搜索引擎提供的搜索内容中选择需要的资源,降低了用户的搜索成本,提升了用户的搜索体验。
本发明第二方面实施例提供了一种搜索引擎,包括:第一获取模块,用于获取用户针对目标内容的历史搜索词和针对所述历史搜索词产生的搜索结果的历史操作信息;预测模块,用于根据所述历史操作信息预测用户需求维度;第二获取模块,用于根据所述用户需求维度获取每个所述用户需求维度对应的资源数据;以及提供模块,用于接收与所述目标内容相关的搜索词,并按照所述用户需求维度展示每个所述用户需求维度对应的资源数据。
本发明实施例的搜索引擎,通过获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息,并据此预测用户需求维度、获取需求维度对应的资源数据,以在用户输入与目标内容相关的搜索词时,按照用户需求维度提供对应的资源数据,从而能够保证为用户提供准确、优质的搜索内容,便于用户从搜索引擎提供的搜索内容中选择需要的资源,降低了用户的搜索成本,提升了用户的搜索体验。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的搜索内容提供方法的流程图;
图2a为根据本发明一个实施例的搜索引擎展示搜索结果的示意图;
图2b为根据本发明另一个实施例的搜索引擎展示搜索结果的示意图;
图3为根据本发明另一个实施例的搜索内容提供方法的流程图;
图4为根据本发明一个实施例的搜索引擎的结构示意图;
图5为根据本发明另一个实施例的搜索引擎的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的搜索内容提供方法和搜索引擎。
为了解决现有搜索内容提供方法中提供的搜索内容缺乏结构化体系,搜索成本高的问题,本发明提出了一种搜索内容提供方法,包括:搜索引擎获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息;搜索引擎根据历史操作信息预测用户需求维度;搜索引擎根据用户需求维度获取每个用户需求维度对应的资源数据;以及搜索引擎接收与目标内容相关的搜索词,并按照用户需求维度展示每个用户需求维度对应的资源数据。
图1为根据本发明一个实施例的搜索内容提供方法的流程图。如图1所示,根据本发明实施例的搜索内容提供方法,包括:
S101,搜索引擎获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息。
其中,目标内容为用户执行搜索时的搜索目标,目标内容可为视频资源、文本资源、音频资源、压缩文件等。本发明的实施例中,搜索引擎可根据不同用户的搜索数据确定用户每次执行搜索时的搜索目标,从而可根据搜索目标确定目标内容。历史搜索词为用户对搜索目标进行搜索时所输入的搜索词。针对历史搜索词产生的搜索结果的历史操作信息为用户针对历史搜索词产生的搜索结果的点击查看浏览、下载、分享等。
举例来说,如果目标内容为“郑多燕健身操”,用户针对该目标内容的历史搜索词可为“郑多燕减肥操”、“郑多燕健身舞”、“郑多燕”等。历史操作信息可为针对上述搜索词对应的搜索结果进行的查看浏览、下载等操作。
S102,搜索引擎根据历史操作信息预测用户需求维度。
在本发明的实施例中,用户的历史操作信息可反映用户的不同需求。具体地,可根据用户所浏览、查看、下载、分享等操作所对应的搜索结果的类型预测用户需求维度。举例来说,经过对用户针对“郑多燕健身操”这一目标内容的历史操作信息的分析,发现用户主要需求按强度排序为:个别热门单集视频需求;对单集视频内容、效果的需求;对套系结构的需求;对套系最新内容的需求。因此用户需求维度可预测为:精选教程、系列教程、最新教程三个维度。对于用户针对目标内容“化妆”,其对应的用户需求维度可预测为精选教程、系列教程、最新妆容三个维度。
S103,搜索引擎根据用户需求维度获取每个用户需求维度对应的资源数据。
在本发明的一个实施例中,资源数据由资源提供方提供。具体地,搜索引擎可预先对资源提供给进行评定,确定优质的资源提供方,例如,一些权威资源网站、通过安全认证且能够提供高质量(完整、高清等)资源的资源网站等。从而搜索引擎可根据不同的用户需求维度向已评定的优质资源提供方请求相应的资源数据。
举例来说,对于目标内容“郑多燕健身操”,“精选教程”这个用户需求维度对应的资源数据,可由搜索引擎从资源提供方获取搜索点击率高、高清、内容完整的视频资源得到。对于“系列教程”这个用户需求维度来说,搜索引擎可根据资源提供方提供的资源数据的套系数据对获取到的资源数据进行整理,从而得到按照每个套系中的视频数据的顺序进行排列的资源数据。对于“最新教程”这个用户需求维度来说,搜索引擎可根据资源数据的制作时间从资源提供方提供的资源中筛选。
S104,搜索引擎接收与目标内容相关的搜索词,并按照用户需求维度展示每个用户需求维度对应的资源数据。
当用户需要进行搜索时,可输入搜索词,搜索引擎则获取与该搜索词相关的目标内容,并按照用户需求维度展示与该搜索词相关的目标内容的每个用户需求维度对应的资源数据。
进一步地,在本发明的一个实施例中,在搜索引擎接收与目标内容相关的搜索词之后,可进一步包括搜索引擎在搜索结果页面中显示用户需求维度的步骤。具体地,可在搜索结果页面中以标签的形式展示用户需求维度,用户可通过点击用户需求维度对应的标签查看对应的资源数据。
在本发明的实施例中,在展示资源数据的同时,还可展示资源数据的一些属性,举例来说,对于视频资源,可展示视频名称、截图、时长、提供方等属性;对于电子书,可展示文件名称、文件大小、内容简介、提供方等属性。
举例来说,对于目标内容“郑多燕健身操”,当搜索引擎接收到用户输入的搜索词“郑多燕”时,搜索引擎展示的搜索结果可如图2a所示,在第一条搜索结果中显示了根据用户需求维度整理的相关视频资源,其中,三个用户需求维度以3个tab标签(如图2a中A所示)的形式进行展示。当前显示的为精选教程对应的视频资源。在每个tab标签中展示该标签代表的用户需求维度对应的视频资源的截图、名称、时长等。
如图2b所示,对于目标内容“化妆步骤”,可显示“精选教程”、“系列教程”、“最新妆容”三个用户需求维度标签,并显示精选教程对应的多个视频资源,同时可提供视频资源的名称、时长、截图、提供方等。
在本发明的一个实施例中,搜索引擎还可建立每个资源数据的内容介绍,其中,资源数据的内容介绍可由资源提供方或发布者预先编辑并提供给搜索引擎,也可由搜索引擎根据用户评论、搜索等历史操作信息进行分析得到。当用户在展示资源数据的界面上将鼠标悬停在资源上时,可显示对应的资源的内容介绍。
本发明实施例的搜索内容提供方法,通过获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息,并据此预测用户需求维度、获取需求维度对应的资源数据,以在用户输入与目标内容相关的搜索词时,按照用户需求维度提供对应的资源数据,从而能够保证为用户提供准确、优质的搜索内容,便于用户从搜索引擎提供的搜索内容中选择需要的资源,降低了用户的搜索成本,提升了用户的搜索体验。
图3为根据本发明另一个实施例的搜索内容提供方法的流程图。如图3所示,该搜索内容提供方法,包括:
S301,搜索引擎获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息。
其中,目标内容为用户执行搜索时的搜索目标,目标内容可为视频资源、文本资源、音频资源、压缩文件等。本发明的实施例中,搜索引擎可根据不同用户的搜索数据确定用户每次执行搜索时的搜索目标,从而可根据搜索目标确定目标内容。历史搜索词为用户对搜索目标进行搜索时所输入的搜索词。针对历史搜索词产生的搜索结果的历史操作信息为用户针对历史搜索词产生的搜索结果的点击查看浏览、下载、分享等。
举例来说,如果目标内容为“郑多燕健身操”,用户针对该目标内容的历史搜索词可为“郑多燕减肥操”、“郑多燕健身舞”、“郑多燕”等。历史操作信息可为针对上述搜索词对应的搜索结果进行的查看浏览、下载等操作。
S302,搜索引擎根据历史操作信息预测用户需求维度。
在本发明的实施例中,用户的历史操作信息可反映用户的不同需求。具体地,可根据用户所浏览、查看、下载、分享等操作所对应的搜索结果的类型预测用户需求维度。举例来说,经过对用户针对“郑多燕健身操”这一目标内容的历史操作信息的分析,发现用户主要需求按强度排序为:个别热门单集视频需求;对单集视频内容、效果的需求;对套系结构的需求;对套系最新内容的需求。因此用户需求维度可预测为:精选教程、系列教程、最新教程三个维度。对于用户针对目标内容“化妆”,其对应的用户需求维度可预测为精选教程、系列教程、最新妆容三个维度。
S303,搜索引擎根据历史搜索词生成搜索属性信息。
其中,搜索属性信息包括:资源名称、大小、提供方、内容介绍以及其他对资源进行描述的属性等。举例来说,对于视频类资源数据,其属性信息可包括视频套系名称、集数、每集名称、时长、截图、难度、内容介绍等。其他类型的资源也具有相关的属性信息,在此不一一进行举例说明。属性信息可作为模板,以是资源数据的提供方根据这个模板提供资源的属性值。
具体地,搜索引擎可对历史搜索词进行分词、统计、挖掘等分析,并获取用户关注度高的资源属性,以生成属性信息。
S304,搜索引擎根据用户的历史操作信息获取点击量大的资源数据。
具体地,可通过对历史操作信息获取用户对每个资源数据的点击量,从而筛选出点击量超过预设阈值的资源数据。
S305,搜索引擎向点击量大的资源数据的提供方发送请求和搜索属性信息,以使提供方根据搜索属性信息对资源数据的格式进行修改。
在本发明的实施例中,当资源数据的提供方接收到搜索引擎发送的请求和搜索属性信息后,可根据该请求对资源数据进行编辑整理,并该请求对应的资源数据返回给搜索引擎。
当然,搜索引擎还可向资源数据的提供方发送具有提到属性值的搜索属性信息,从而使资源数据的提供方将符合搜索引擎发送的属性值的资源数据返回至搜索引擎。如果资源提供方没有符合搜索引擎发送的属性值的资源数据,则资源数据的提供方可根据搜索引擎发送的搜索属性值对已有资源数据的格式进行修改,以生成符合该属性值的资源数据。
S306,提供方将修改之后的资源数据发送至搜索引擎。
S307,搜索引擎根据用户需求维度对修改后的资源数据进行整理。
具体地,在本发明的一个实施例中,对修改后的资源数据进行整理可包括将资源数据按照一定的规则、顺序进行排序、组合等,以是搜索引擎分别获取每个用户需求维度对应的资源数据。
举例来说,对于目标内容“郑多燕健身操”,搜索引擎可根据用户历史操作信息获取目标内容对应的资源数据中每个视频的点击量,并将点击量排在前N个的视频作为用户需求维度“精选教程”对应的视频资源,其中,N为预先设定,可根据该目标内容对应的资源数据的总量进行设定,也可根据用户需要进行设定;另外,搜索引擎可根据资源提供方提供的搜索属性信息中的套系名称、集数等属性的属性值对提供方发送的视频资源按照套系以及套系中每集的顺序进行整理,得到“系列教程”对应的视频资源;对于“最新教程”,搜索引擎可根据资源数据的提供方提供的资源制作时间对视频资源进行排序。
S308,搜索引擎根据搜索属性信息对资源数据进行命名。
由于搜索属性信息为资源数据的提供方提供的,能够准确反映资源数据的真实内容,因而,通过搜索属性信息对资源数据进行命名,能够使资源数据的名称内容高度统一,从而便于用户找到真正需要的资源。
S309,搜索引擎接收与目标内容相关的搜索词,并按照用户需求维度展示每个用户需求维度对应的资源数据。
当用户需要进行搜索时,可输入搜索词,搜索引擎则获取与该搜索词相关的目标内容,并按照用户需求维度展示与该搜索词相关的目标内容的每个用户需求维度对应的已整理并命名的资源数据。
进一步地,在本发明的一个实施例中,在搜索引擎接收与目标内容相关的搜索词之后,可进一步包括搜索引擎在搜索结果页面中显示用户需求维度的步骤。具体地,可在搜索结果页面中以标签的形式展示用户需求维度,用户可通过点击用户需求维度对应的标签在不同的用户需求维度之间进行切换,并查看每个用户需求维度对应的资源数据。另外,在展示每个用户需求维度对应的资源数据时,可显示预设数量的资源数据,并可提供翻页按钮,从而用户可通过点击该翻页按钮查看其余未被显示的资源数据。
在本发明的实施例中,在展示资源数据的同时,还可展示资源数据的一些属性,举例来说,对于视频资源,可展示视频名称、截图、时长、提供方等属性;对于电子书,可展示文件名称、文件大小、内容简介、提供方等属性。
举例来说,对于目标内容“郑多燕健身操”,当搜索引擎接收到用户输入的搜索词“郑多燕”时,搜索引擎展示的搜索结果可如图2a所示,在第一条搜索结果中显示了根据用户需求维度整理的相关视频资源,其中,三个用户需求维度以3个tab标签(如图2a中A所示)的形式进行展示。当前显示的为精选教程对应的视频资源。在每个tab标签中展示该标签代表的用户需求维度对应的视频资源的截图、名称、时长等。
如图2b所示,对于目标内容“化妆步骤”,可显示“精选教程”、“系列教程”、“最新妆容”三个用户需求维度标签,并显示精选教程对应的多个视频资源,同时可提供视频资源的名称、时长、截图、提供方等。
在本发明的一个实施例中,搜索引擎还可建立每个资源数据的内容介绍,其中,资源数据的内容介绍可由资源提供方或发布者预先编辑并提供给搜索引擎,也可由搜索引擎根据用户评论、搜索等历史操作信息进行分析得到。当用户在展示资源数据的界面上将鼠标悬停在资源上时,可显示对应的资源的内容介绍。如图2a所示,当鼠标悬停至第一个资源“小红帽有氧操”的截图上时,即可显示图2a中B所示的视频资源的内容介绍。
本发明实施例的搜索内容提供方法,可根据历史搜索词生成搜索属性信息,并获取点击量大的资源数据,然后从点击量大的资源数据的提供方获取根据搜索属性信息进行格式修改的资源数据,并根据搜索属性信息进一步进行整理和命名,以按照用户需求维度提供给用户,保证了提供给用户的资源数据的名称与内容高度一致,避免了第三方站点用虚假命名迷惑用户,进一步提升了用户体验。
为了实现上述实施例,本发明还提出一种搜索引擎。
一种搜索引擎,包括:第一获取模块,用于获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息;预测模块,用于根据历史操作信息预测用户需求维度;第二获取模块,用于根据用户需求维度获取每个用户需求维度对应的资源数据;以及提供模块,用于接收与目标内容相关的搜索词,并按照用户需求维度展示每个用户需求维度对应的资源数据。
图4为根据本发明一个实施例的搜索引擎的结构示意图。
如图4所示,根据本发明实施例的搜索引擎,包括:第一获取模块10、预测模块20、第二获取模块30和提供模块40。
具体地,第一获取模块10用于获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息。其中,目标内容为用户执行搜索时的搜索目标,目标内容可为视频资源、文本资源、音频资源、压缩文件等。本发明的实施例中,第一获取模块10可根据不同用户的搜索数据确定用户每次执行搜索时的搜索目标,从而可根据搜索目标确定目标内容。历史搜索词为用户对搜索目标进行搜索时所输入的搜索词。针对历史搜索词产生的搜索结果的历史操作信息为用户针对历史搜索词产生的搜索结果的点击查看浏览、下载、分享等。
举例来说,如果目标内容为“郑多燕健身操”,用户针对该目标内容的历史搜索词可为“郑多燕减肥操”、“郑多燕健身舞”、“郑多燕”等。历史操作信息可为针对上述搜索词对应的搜索结果进行的查看浏览、下载等操作。
预测模块20用于根据历史操作信息预测用户需求维度。在本发明的实施例中,用户的历史操作信息可反映用户的不同需求。具体地,预测模块20可根据用户所浏览、查看、下载、分享等操作所对应的搜索结果的类型预测用户需求维度。举例来说,经过对用户针对“郑多燕健身操”这一目标内容的历史操作信息的分析,发现用户主要需求按强度排序为:个别热门单集视频需求;对单集视频内容、效果的需求;对套系结构的需求;对套系最新内容的需求。因此用户需求维度可预测为:精选教程、系列教程、最新教程三个维度。对于用户针对目标内容“化妆”,其对应的用户需求维度可预测为精选教程、系列教程、最新妆容三个维度。
第二获取模块30用于根据用户需求维度获取每个用户需求维度对应的资源数据。在本发明的一个实施例中,资源数据由资源提供方提供。具体地,可预先对资源提供给进行评定,确定优质的资源提供方,例如,一些权威资源网站、通过安全认证且能够提供高质量(完整、高清等)资源的资源网站等。从而第二获取模块30可根据不同的用户需求维度向已评定的优质资源提供方请求相应的资源数据。
举例来说,对于目标内容“郑多燕健身操”,“精选教程”这个用户需求维度对应的资源数据,第二获取模块30可从资源提供方获取搜索点击率高、高清、内容完整的视频资源得到。对于“系列教程”这个用户需求维度来说,第二获取模块30可根据资源提供方提供的资源数据的套系数据对获取到的资源数据进行整理,从而得到按照每个套系中的视频数据的顺序进行排列的资源数据。对于“最新教程”这个用户需求维度来说,第二获取模块30可根据资源数据的制作时间从资源提供方提供的资源中筛选。
提供模块40用于接收与目标内容相关的搜索词,并按照用户需求维度展示每个用户需求维度对应的资源数据。当用户需要进行搜索时,可输入搜索词,提供模块40则获取与该搜索词相关的目标内容,并按照用户需求维度展示与该搜索词相关的目标内容的每个用户需求维度对应的资源数据。
在本发明的实施例中,提供模块40在展示资源数据的同时,还可展示资源数据的一些属性,举例来说,对于视频资源,可展示视频名称、截图、时长、提供方等属性;对于电子书,可展示文件名称、文件大小、内容简介、提供方等属性。
本发明实施例的搜索引擎,通过获取用户针对目标内容的历史搜索词和针对历史搜索词产生的搜索结果的历史操作信息,并据此预测用户需求维度、获取需求维度对应的资源数据,以在用户输入与目标内容相关的搜索词时,按照用户需求维度提供对应的资源数据,从而能够保证为用户提供准确、优质的搜索内容,便于用户从搜索引擎提供的搜索内容中选择需要的资源,降低了用户的搜索成本,提升了用户的搜索体验。
图5为根据本发明另一个实施例的搜索引擎的结构示意图。
如图5所示,根据本发明实施例的搜索引擎,包括:第一获取模块10、预测模块20、第二获取模块30、提供模块40、生成模块50、命名模块60和显示模块70,其中,第二获取模块30具体包括获取单元31和发送单元32。
具体地,生成模块50用于根据历史搜索词生成搜索属性信息。其中,搜索属性信息包括:资源名称、大小、提供方、内容介绍以及其他对资源进行描述的属性等。举例来说,对于视频类资源数据,其属性信息可包括视频套系名称、集数、每集名称、时长、截图、难度、内容介绍等。其他类型的资源也具有相关的属性信息,在此不一一进行举例说明。属性信息可作为模板,以是资源数据的提供方根据这个模板提供资源的属性值。更具体地,生成模块50可对历史搜索词进行分词、统计、挖掘等分析,并获取用户关注度高的资源属性,以生成属性信息。
第二获取模块30中的获取单元31用于根据用户的历史操作信息获取点击量大的资源数据。发送单元32用于向点击量大的资源数据的提供方发送请求和搜索属性信息,以使提供方根据搜索属性信息对资源数据的格式进行修改。更具体地,获取单元31可通过对历史操作信息获取用户对每个资源数据的点击量,从而筛选出点击量超过预设阈值的资源数据。当资源数据的提供方接收到搜索引擎发送的请求和搜索属性信息后,可根据该请求对资源数据进行编辑整理,并该请求对应的资源数据返回给接收单元32。
当然,搜索引擎还可向资源数据的提供方发送具有提到属性值的搜索属性信息,从而使资源数据的提供方将符合搜索引擎发送的属性值的资源数据返回至接收单元32。如果资源提供方没有符合搜索引擎发送的属性值的资源数据,则资源数据的提供方可根据搜索引擎发送的搜索属性值对已有资源数据的格式进行修改,以生成符合该属性值的资源数据。
在本发明的一个实施例中,第二获取模块30可进一步包括:接收单元33和整理单元34,其中,
接收单元33用于接收提供方将修改之后的资源数据;
整理单元43用于根据用户需求维度对修改后的资源数据进行整理。更具体地,在本发明的一个实施例中,整理单元43对修改后的资源数据进行整理可包括将资源数据按照一定的规则、顺序进行排序、组合等,以是搜索引擎分别获取每个用户需求维度对应的资源数据。
举例来说,对于目标内容“郑多燕健身操”,整理单元43可根据用户历史操作信息获取目标内容对应的资源数据中每个视频的点击量,并将点击量排在前N个的视频作为用户需求维度“精选教程”对应的视频资源,其中,N为预先设定,可根据该目标内容对应的资源数据的总量进行设定,也可根据用户需要进行设定;另外,整理单元43可根据资源提供方提供的搜索属性信息中的套系名称、集数等属性的属性值对提供方发送的视频资源按照套系以及套系中每集的顺序进行整理,得到“系列教程”对应的视频资源;对于“最新教程”,整理单元43可根据资源数据的提供方提供的资源制作时间对视频资源进行排序。
命名模块60用于根据搜索属性信息对资源数据进行命名。由于搜索属性信息为资源数据的提供方提供的,能够准确反映资源数据的真实内容,因而,通过搜索属性信息对资源数据进行命名,能够使资源数据的名称内容高度统一,从而便于用户找到真正需要的资源。
显示模块70用于在所述搜索引擎接收与所述目标内容相关的搜索词之后,在搜索结果页面中显示所述用户需求维度。更具体地,显示模块70可在搜索结果页面中以标签的形式展示用户需求维度,用户可通过点击用户需求维度对应的标签查看对应的资源数据。举例来说,对于目标内容“郑多燕健身操”,当搜索引擎接收到用户输入的搜索词“郑多燕”时,搜索引擎展示的搜索结果可如图2a所示,在第一条搜索结果中显示了根据用户需求维度整理的相关视频资源,其中,三个用户需求维度以3个tab标签(如图2a中A所示)的形式进行展示。当前显示的为精选教程对应的视频资源。在每个tab标签中展示该标签代表的用户需求维度对应的视频资源的截图、名称、时长等。如图2b所示,对于目标内容“化妆步骤”,可显示“精选教程”、“系列教程”、“最新妆容”三个用户需求维度标签,并显示精选教程对应的多个视频资源,同时可提供视频资源的名称、时长、截图、提供方等。
在本发明的一个实施例中,搜索引擎还可建立每个资源数据的内容介绍,其中,资源数据的内容介绍可由资源提供方或发布者预先编辑并提供给搜索引擎,也可由搜索引擎根据用户评论、搜索等历史操作信息进行分析得到。当用户在展示资源数据的界面上将鼠标悬停在资源上时,可显示对应的资源的内容介绍。如图2a所示,当鼠标悬停至第一个资源“小红帽有氧操”的截图上时,即可显示图2a中B所示的视频资源的内容介绍。
本发明实施例的搜索引擎,可根据历史搜索词生成搜索属性信息,并获取点击量大的资源数据,然后从点击量大的资源数据的提供方获取根据搜索属性信息进行格式修改的资源数据,并根据搜索属性信息进一步进行整理和命名,以按照用户需求维度提供给用户,保证了提供给用户的资源数据的名称与内容高度一致,避免了第三方站点用虚假命名迷惑用户,进一步提升了用户体验。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

Claims (10)

1.一种搜索内容提供方法,其特征在于,包括:
搜索引擎获取用户针对目标内容的历史搜索词和针对所述历史搜索词产生的搜索结果的历史操作信息;
所述搜索引擎根据所述历史操作信息预测用户需求维度;
所述搜索引擎根据所述用户需求维度获取每个所述用户需求维度对应的资源数据;以及
所述搜索引擎接收与所述目标内容相关的搜索词,并按照所述用户需求维度展示每个所述用户需求维度对应的资源数据。
2.如权利要求1所述的方法,其特征在于,还包括:
所述搜索引擎根据所述历史搜索词生成搜索属性信息;以及
所述搜索引擎根据所述搜索属性信息对所述资源数据进行命名。
3.如权利要求2所述的方法,其特征在于,所述搜索引擎根据所述用户需求维度获取每个所述用户需求维度对应的资源数据具体包括:
所述搜索引擎根据用户的所述历史操作信息获取点击量大的资源数据;
所述搜索引擎向所述点击量大的资源数据的提供方发送请求和所述搜索属性信息,以使所述提供方根据所述搜索属性信息对所述资源数据的格式进行修改。
4.如权利要求3所述的方法,其特征在于,还包括:
所述提供方将修改之后的资源数据发送至所述搜索引擎;
所述搜索引擎根据所述用户需求维度对所述修改后的资源数据进行整理。
5.如权利要求1所述的方法,其特征在于,在所述搜索引擎接收与所述目标内容相关的搜索词之后,还包括:
所述搜索引擎在搜索结果页面中显示所述用户需求维度。
6.一种搜索引擎,其特征在于,包括:
第一获取模块,用于获取用户针对目标内容的历史搜索词和针对所述历史搜索词产生的搜索结果的历史操作信息;
预测模块,用于根据所述历史操作信息预测用户需求维度;
第二获取模块,用于根据所述用户需求维度获取每个所述用户需求维度对应的资源数据;以及
提供模块,用于接收与所述目标内容相关的搜索词,并按照所述用户需求维度展示每个所述用户需求维度对应的资源数据。
7.如权利要求6所述的搜索引擎,其特征在于,还包括:
生成模块,用于根据所述历史搜索词生成搜索属性信息;以及
命名模块,用于根据所述搜索属性信息对所述资源数据进行命名。
8.如权利要求7所述的搜索引擎,其特征在于,所述第二获取模块,具体包括:
获取单元,用于根据用户的所述历史操作信息获取点击量大的资源数据;
发送单元,用于向所述点击量大的资源数据的提供方发送请求和所述搜索属性信息,以使所述提供方根据所述搜索属性信息对所述资源数据的格式进行修改。
9.如权利要求8所述的搜索引擎,其特征在于,所述第二获取模块还包括:
接收单元,用于接收所述提供方将修改之后的资源数据;
整理单元,用于根据所述用户需求维度对所述修改后的资源数据进行整理。
10.如权利要求6所述的搜索引擎,其特征在于,还包括:
显示模块,用于在所述搜索引擎接收与所述目标内容相关的搜索词之后,在搜索结果页面中显示所述用户需求维度。
CN201410356253.2A 2014-07-24 2014-07-24 搜索内容提供方法和搜索引擎 Active CN104102733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410356253.2A CN104102733B (zh) 2014-07-24 2014-07-24 搜索内容提供方法和搜索引擎

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410356253.2A CN104102733B (zh) 2014-07-24 2014-07-24 搜索内容提供方法和搜索引擎

Publications (2)

Publication Number Publication Date
CN104102733A true CN104102733A (zh) 2014-10-15
CN104102733B CN104102733B (zh) 2019-02-22

Family

ID=51670886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410356253.2A Active CN104102733B (zh) 2014-07-24 2014-07-24 搜索内容提供方法和搜索引擎

Country Status (1)

Country Link
CN (1) CN104102733B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183840A (zh) * 2015-09-02 2015-12-23 百度在线网络技术(北京)有限公司 信息处理方法及装置
CN106776957A (zh) * 2016-12-05 2017-05-31 乐视控股(北京)有限公司 内容搜索方法、装置及电子设备
CN109471886A (zh) * 2018-10-12 2019-03-15 平安科技(深圳)有限公司 计算机资源的费用搜索方法、装置、计算机装置及存储介质
CN111488506A (zh) * 2019-01-25 2020-08-04 北京猎户星空科技有限公司 资源信息的处理方法、装置、设备及存储介质
CN111581485A (zh) * 2020-05-11 2020-08-25 北京字节跳动网络技术有限公司 一种信息分配方法及装置
CN112100529A (zh) * 2020-11-17 2020-12-18 北京三快在线科技有限公司 搜索内容排序方法、装置、存储介质和电子设备
WO2022227847A1 (zh) * 2021-04-29 2022-11-03 北京字节跳动网络技术有限公司 数据搜索处理方法、装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2063475U (zh) * 1990-03-14 1990-10-10 李本茂 混凝土切割具
CN102436495A (zh) * 2011-11-14 2012-05-02 百度在线网络技术(北京)有限公司 一种提供动态搜索页面的方法及其装置
CN103207904A (zh) * 2013-03-28 2013-07-17 百度在线网络技术(北京)有限公司 搜索结果的提供方法及搜索引擎
US20140025668A1 (en) * 2012-07-20 2014-01-23 Alibaba Group Holding Limited Method and System of Ranking Search Results, and Method and System of Optimizing Search Result Ranking
CN103646089A (zh) * 2013-12-13 2014-03-19 百度在线网络技术(北京)有限公司 自动搜索方法及装置
CN103870554A (zh) * 2009-12-11 2014-06-18 北京奇虎科技有限公司 一种实现浏览器地址栏铭牌的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2063475U (zh) * 1990-03-14 1990-10-10 李本茂 混凝土切割具
CN103870554A (zh) * 2009-12-11 2014-06-18 北京奇虎科技有限公司 一种实现浏览器地址栏铭牌的方法
CN102436495A (zh) * 2011-11-14 2012-05-02 百度在线网络技术(北京)有限公司 一种提供动态搜索页面的方法及其装置
US20140025668A1 (en) * 2012-07-20 2014-01-23 Alibaba Group Holding Limited Method and System of Ranking Search Results, and Method and System of Optimizing Search Result Ranking
CN103207904A (zh) * 2013-03-28 2013-07-17 百度在线网络技术(北京)有限公司 搜索结果的提供方法及搜索引擎
CN103646089A (zh) * 2013-12-13 2014-03-19 百度在线网络技术(北京)有限公司 自动搜索方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183840A (zh) * 2015-09-02 2015-12-23 百度在线网络技术(北京)有限公司 信息处理方法及装置
CN105183840B (zh) * 2015-09-02 2019-05-28 百度在线网络技术(北京)有限公司 信息处理方法及装置
CN106776957A (zh) * 2016-12-05 2017-05-31 乐视控股(北京)有限公司 内容搜索方法、装置及电子设备
CN109471886A (zh) * 2018-10-12 2019-03-15 平安科技(深圳)有限公司 计算机资源的费用搜索方法、装置、计算机装置及存储介质
CN111488506A (zh) * 2019-01-25 2020-08-04 北京猎户星空科技有限公司 资源信息的处理方法、装置、设备及存储介质
CN111488506B (zh) * 2019-01-25 2024-03-08 北京猎户星空科技有限公司 资源信息的处理方法、装置、设备及存储介质
CN111581485A (zh) * 2020-05-11 2020-08-25 北京字节跳动网络技术有限公司 一种信息分配方法及装置
CN111581485B (zh) * 2020-05-11 2024-05-14 抖音视界有限公司 一种信息分配方法及装置
CN112100529A (zh) * 2020-11-17 2020-12-18 北京三快在线科技有限公司 搜索内容排序方法、装置、存储介质和电子设备
CN112100529B (zh) * 2020-11-17 2021-03-19 北京三快在线科技有限公司 搜索内容排序方法、装置、存储介质和电子设备
WO2022227847A1 (zh) * 2021-04-29 2022-11-03 北京字节跳动网络技术有限公司 数据搜索处理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN104102733B (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN104102733A (zh) 搜索内容提供方法和搜索引擎
US10324591B2 (en) System for creating and retrieving contextual links between user interface objects
Macnamara The 21st century media (r) evolution: Emergent communication practices
Harper et al. The movielens datasets: History and context
CN103927354A (zh) 交互式搜索及推荐方法和装置
CN113486252A (zh) 搜索结果展示方法、装置、设备和介质
CN103902674A (zh) 特定主题的评论数据的采集方法和装置
CN103778548A (zh) 商品信息与关键词匹配方法、商品信息投放方法及装置
CN104615783A (zh) 信息搜索方法和装置
CN105574176A (zh) 结合多数据源的热词推荐方法和装置
CN104216965A (zh) 信息推荐方法和装置
CN103902697A (zh) 组合搜索方法、客户端和服务器
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
CN105518661A (zh) 经由挖掘的超链接文本的片段来浏览图像
CN104035958A (zh) 搜索方法和搜索引擎
Burri Contemplating a'Public service navigator': in search of new (and better) functioning public service media
CN103927299A (zh) 输入法中候选语句的提供方法、输入内容推荐方法和装置
CN103514282A (zh) 一种视频搜索结果展示方法及装置
CN104503975A (zh) 推荐卡片的定制方法及装置
CN103870553A (zh) 一种输入资源推送方法及系统
CN112219200A (zh) 基于多个查询解释的基于方面的查询改进
CN104182481A (zh) 资源推荐方法及装置
CN105027123A (zh) 以基于代理的偏好指示为基础来推荐内容
KR101873339B1 (ko) 관심사 및 콘텐츠를 제공하는 방법 및 시스템
CN103235821A (zh) 原创内容的搜索方法和搜索服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant