CN102880609A - 一种用于提供与查询序列相对应的搜索结果的设备和方法 - Google Patents

一种用于提供与查询序列相对应的搜索结果的设备和方法 Download PDF

Info

Publication number
CN102880609A
CN102880609A CN 201110196130 CN201110196130A CN102880609A CN 102880609 A CN102880609 A CN 102880609A CN 201110196130 CN201110196130 CN 201110196130 CN 201110196130 A CN201110196130 A CN 201110196130A CN 102880609 A CN102880609 A CN 102880609A
Authority
CN
China
Prior art keywords
demand
search results
sequence
classification
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110196130
Other languages
English (en)
Inventor
兰强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN 201110196130 priority Critical patent/CN102880609A/zh
Publication of CN102880609A publication Critical patent/CN102880609A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示了一种用于提供与查询序列相对应的搜索结果的设备和方法,包括:获取与用户的查询序列相对应的搜索结果;根据所述查询序列,获取与所述查询序列相对应的候选需求类别;根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;根据所述类别需求度,将所述搜索结果提供给所述用户。与现有技术相比,本发明根据用户查询序列来获取相应的候选需求类别和类别需求度,并根据所述类别需求度将所述用户查询序列对应的搜索结果提供给所述用户,从而使不同用户输入查询序列进行搜索时,其搜索结果不仅能够体现与查询序列间既有的相关性,还可识别用户通过查询序列进行搜索时对期望的搜索结果的需求类别。

Description

一种用于提供与查询序列相对应的搜索结果的设备和方法
技术领域
本发明涉及互联网搜索领域,尤其涉及互联网搜索中用于提供与查询序列相对应的搜索结果的技术。
背景技术
随着互联网的发展,网络资源变得越来越丰富,搜索引擎也得到了越来越广泛的应用。例如,当用户通过用户设备输入查询序列时,搜索引擎可以根据该查询序列,在搜索索引库中进行匹配查询,以获得所述查询序列相对应的搜索结果,从而将搜索结果中呈现的资源信息提供给用户。
然而,互联网中包含多种类型的网络资源,例如新闻、视频、图片、音乐等,现有的搜索引擎一般仅根据查询序列与相应搜索结果之间的相关性来顺序提供所述搜索结果,并不会兼顾用户期望看到的特定需求类别的搜索结果。例如,当用户输入“土豆”时,搜索结果中可能既呈现出有关土豆网的相关信息,也呈现有关蔬菜中的土豆的相关信息,现有的搜索引擎此时通常会将土豆网和土豆的所有相关信息均顺序提供给用户,而忽略了对用户所输入的“土豆”进行需求类别的进一步分析和筛选。因此,用户在应用搜索引擎进行搜索时,搜索结果列表中位置靠前的搜索结果并不一定能够满足用户的真正需求,甚至需要用户不断地翻页,以逐页查找真正期望看到的或真正感兴趣的搜索结果,这样会极大地降低用户的搜索效率,影响用户与搜索引擎之间的智能交互体验。
有鉴于此,如何在提供查询序列所对应的搜索结果时,不仅体现查询序列与搜索结果之间既有的相关性,而且还可以识别或挖掘出用户通过查询序列所体现的搜索结果的需求类别,是相关技术人员亟待解决的一项课题。
发明内容
本发明的目的是揭示一种用于提供与查询序列相对应的搜索结果的设备和方法。
根据本发明的一个方面,揭示了一种用于提供与查询序列相对应的搜索结果的方法,其中,该方法包括以下步骤:
a获取与用户的查询序列相对应的搜索结果;
b根据所述查询序列,获取与所述查询序列相对应的候选需求类别;
c根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;
d根据所述类别需求度,将所述搜索结果提供给所述用户。
根据本发明的另一个方面,还揭示了一种用于提供与查询序列相对应的搜索结果的设备,其中,所述设备包括:
结果获取装置,用于获取与用户的查询序列相对应的搜索结果;
类别获取装置,用于根据所述查询序列,获取与所述查询序列相对应的候选需求类别;
确定装置,用于根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;
提供装置,用于根据所述类别需求度,将所述搜索结果提供给所述用户。
根据本发明的又一个方面,还揭示了一种搜索引擎,其中,该搜索引擎包括如上述本发明一个方面所述的用于提供与查询序列相对应的搜索结果的设备。
与现有技术相比,本发明根据用户查询序列,获取相应的候选需求类别和类别需求度,并根据所述类别需求度,将所述用户查询序列对应的搜索结果提供给所述用户,从而使不同用户输入查询序列进行搜索时,其搜索结果不仅能够体现与查询序列间既有的相关性,还可识别用户通过查询序列进行搜索时对期望的搜索结果的需求类别。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于提供与查询序列相对应的搜索结果的设备示意图;
图2示出根据本发明一个优选实施例的用于提供与查询序列相对应的搜索结果的设备示意图;
图3示出根据本发明另一个方面的用于提供与查询序列相对应的搜索结果的方法流程图;
图4示出根据本发明一个优选实施例的用于提供与查询序列相对应的搜索结果的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于提供与查询序列相对应的搜索结果的设备示意图。其中,提供设备1包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
参照图1,所述提供设备1包括结果获取装置11、类别获取装置12、确定装置13和提供装置14。具体地,所述提供设备1的结果获取装置11获取与用户的查询序列相对应的搜索结果;然后,类别获取装置12根据所述查询序列,获取与所述查询序列相对应的候选需求类别;接着,确定装置13根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;最后,提供装置14根据所述类别需求度,将所述搜索结果提供给所述用户。
其中,结果获取装置11获取与用户的查询序列相对应的搜索结果。具体地,所述结果获取装置11例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与用户的查询序列相对应的搜索结果;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备输入的查询序列,并将所述查询序列在搜索索引库中进行匹配查询,获取与该查询序列相对应的搜索结果;或者,通过页面技术,如ASP、JSP、PHP等,从用户设备获取用户通过该用户设备输入的查询序列,并将所述查询序列在搜索索引库中进行匹配查询,获取与该查询序列相对应的搜索结果。在此,所述通信方式包括但不限于基于3GPP、LTE、WIMAX的移动通信;基于TCP/IP、UDP协议的计算机网络通信;以及基于蓝牙、红外传输标准的近距离无线通信方式等。本领域技术人员应能理解上述获取与用户的查询序列相对应的搜索结果的方式仅为举例,其他现有的或今后可能出现的获取与用户的查询序列相对应的搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
然后,类别获取装置12根据所述查询序列,获取与所述查询序列相对应的候选需求类别。具体地,当所述结果获取装置11获取与所述用户的查询序列相对应的搜索结果后,所述类别获取装置12根据所述查询序列,通过诸如对所述查询序列进行语义分析或根据所述查询序列在需求特征词库中进行匹配查询等方式,来获得所述候选需求类别。例如,当所述用户的查询序列为“土豆上的热门影视剧”时,通过对其进行切词处理,得到“土豆/热门/影视剧”,由于影视剧一词具有明显的需求类别,诸如视频、下载、图片、演员介绍,所述类别获取装置12对该查询序列进行语义分析或在需求特征词库中进行匹配查询,来获得所述候选需求类别,例如根据“影视剧”可知该查询序列对应的候选需求类别包括视频、下载、图片、演员介绍。优选地,当所述结果获取装置11获取与所述用户的查询序列相对应的搜索结果后,所述类别获取装置12首先对所述查询序列进行切词处理获得切分后的词条,再通过诸如对所述词条进行语义分析或根据所述词条在需求特征词库中进行匹配查询等方式,来获得所述候选需求类别。本领域技术人员应能理解上述获取与所述查询序列相对应的候选需求类别的方式仅为举例,其他现有的或今后可能出现的获取与所述查询序列相对应的候选需求类别的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
接着,确定装置13根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度。具体地,在所述类别获取装置12获取所述候选需求类别后,所述确定装置13根据所述查询序列和所述候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定所述查询序列对于每一候选需求类别的类别需求度。接上例,当所述用户的查询序列为“土豆上的热门影视剧”时,所述类别获取装置12根据所述查询序列,得到所述候选需求类别包括视频、下载、图片、演员介绍,并且所述确定装置13根据所述查询序列和所述候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定与所述查询序列相对应的上述候选需求类别的类别需求度,诸如,所述查询序列相对于视频类的类别需求度为0.6;所述查询序列相对于下载类的类别需求度为0.05;所述查询序列相对于图片类的类别需求度为0.15;所述查询序列相对于演员介绍类的类别需求度为0.2。又如,当所述用户的查询序列为“××影视明星”时,所述类别获取装置12根据所述查询序列,得到所述候选需求类别包括视频、新闻、背景介绍、音乐、图片,所述确定装置13根据所述查询序列和所述候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定与所述查询序列相对应的类别需求度,如,所述查询序列在视频类的类别需求度为0.3;所述查询序列在新闻类的类别需求度为0.3;所述查询序列在背景介绍类的类别需求度为0.1;所述查询序列在音乐类的类别需求度为0.2;以及所述查询序列在图片类的类别需求度为0.1。优选地,所述确定装置13根据所述查询序列和所述候选需求类别,通过需求强度数据库等第三方设备所提供的应用程序接口(API),从该第三方设备直接获取与所述查询序列相对应的类别需求度。本领域技术人员应能理解上述确定与所述查询序列相对应的类别需求度的方式仅为举例,其他现有的或今后可能出现的确定与所述查询序列相对应的类别需求度的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
提供装置14根据所述类别需求度,将所述搜索结果提供给所述用户。具体地,在所述确定装置13获得与所述查询序列相对应的类别需求度后,所述提供装置14根据所述类别需求度,通过页面技术,如JSP、ASP、PHP等页面技术,将所述查询序列对应的搜索结果提供给所述用户,例如以链接、摘要或缩略图等形式提供给所述用户对应的用户设备,以供所述用户浏览。接上例,当用户的查询序列为“××影视明星”时,所述查询序列在视频类的类别需求度为0.3,在新闻类的类别需求度为0.3,在背景介绍类的类别需求度为0.1,在音乐类的类别需求度为0.2,在图片类的类别需求度为0.1时,若所述查询序列的搜索结果列表中的第一页显示10条搜索结果,所述提供装置14根据所述类别需求度,通过JSP、ASP、PHP等页面技术,将3条视频类的搜索结果、3条新闻类的搜索结果、1条背景介绍类的搜索结果、2条音乐类的搜索结果提供给所述用户,并且将剩余的所有搜索结果中与所述查询序列相关度最高的1条搜索结果在第一页提供给所述用户对应的用户设备,以供其浏览。本领域技术人员应能理解上述将所述搜索结果提供给所述用户的方式仅为举例,其他现有的或今后可能出现的将所述搜索结果提供给所述用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,结果获取装置11、类别获取装置12、确定装置13和提供装置14是持续不断工作的。具体地,所述提供设备1的结果获取装置11获取与用户的查询序列相对应的搜索结果;然后,类别获取装置12根据所述查询序列,获取与所述查询序列相对应的候选需求类别;接着,确定装置13根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;最后,提供装置14根据所述类别需求度,将所述搜索结果提供给所述用户。在此,本领域技术人员应理解“持续”是指结果获取装置11、类别获取装置12、确定装置13和提供装置14分别按照设定的或实时调整的工作模式要求进行查询序列所对应的搜索结果的获取、查询序列所对应的候选需求类别的获取、查询序列所对应的类别需求度的确定,以及所述搜索结果的提供,直至提供设备1在较长时间内停止获取用户的查询序列所对应的搜索结果。
优选地,所述提供装置14还根据所述类别需求度,将所述类别需求度与所述搜索结果提供给所述用户。具体地,所述确定装置13根据所述查询序列与所述候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定了与所述查询序列相对应的类别需求度后,所述提供装置14通过页面技术,如JSP、ASP、PHP等页面技术,以诸如特别字体、浮动窗口等方式,将所述搜索结果相对应的类别需求度与所述搜索结果提供给所述用户。例如,所述提供装置14在根据所述类别需求度来提供相应的搜索结果时,在这些搜索结果的页面说明中添加相应的类别需求度;进一步地,这些搜索结果的类别需求度还可以特别字体或者浮动窗口等方式显示,如在用户的鼠标停留在搜索结果的页面链接或者页面说明时,以悬浮窗口显示该停留搜索结果相应的类别需求度。将本发明的提供设备1应用于搜索引擎,当用户通过用户设备输入查询序列后,所述搜索引擎不仅可以根据所述查询序列对应的类别需求度来提供所述搜索结果,而且还针对每一搜索结果提供相应的类别需求度,提升了用户的搜索效率,也增强了用户与搜索引擎之间的交互体验。本领域技术人员应能理解上述将所述类别需求度与所述搜索结果提供给所述用户的方式仅为举例,其他现有的或今后可能出现的将所述类别需求度与所述搜索结果提供给所述用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述确定装置13根据所述查询序列与所述候选需求类别,结合与所述查询序列相对应的用户点击操作记录,确定所述类别需求度。具体地,所述确定装置13根据所述查询序列与所述候选需求类别,结合与所述查询序列相对应的大量用户的点击统计分析或者该用户的历史点击记录,确定所述类别需求度。例如,当用户的查询序列为“××影视明星”,所述类别获取装置12根据所述查询序列得到对应的候选需求类别包括视频、新闻、背景介绍、音乐和图片后,所述确定装置13结合该查询序列相应的大量用户的点击统计分析,如,统计分析结果中表明视频类搜索结果、新闻类搜索结果、背景介绍类搜索结果、音乐类搜索结果与图片类搜索结果的用户点击频次分别为60000次、10000次、10000次、10000次和10000次,则所述查询序列对于视频类搜索结果的类别需求度为0.6,而对于图片类搜索结果的类别需求度为0.1。接上例,当用户的查询序列为“××影视明星”,所述类别获取装置12根据所述查询序列得到对应的候选需求类别包括视频、新闻、背景介绍、音乐和图片后,所述确定装置13结合该查询序列相应的该用户的历史点击记录,如,历史点击记录中表明该用户在输入查询序列“××影视明星”后,点击该查询序列所对应的视频类搜索结果、新闻类搜索结果、背景介绍类搜索结果、音乐类搜索结果与图片类搜索结果的频次分别为600次、100次、100次、100次和100次,则所述查询序列对于视频类搜索结果的类别需求度为0.6;而对于图片类搜索结果的类别需求度为0.1。本领域技术人员应能理解上述结合用户点击操作记录确定所述类别需求度的方式仅为举例,其他现有的或今后可能出现的结合用户点击操作记录确定所述类别需求度的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述提供装置14还根据所述类别需求度,对所述搜索结果进行预处理操作,以获得预处理后的所述搜索结果,然后将所述预处理后的搜索结果提供给所述用户。更优选地,所述预处理操作包括以下至少任一项:
1)根据所述类别需求度,对所述搜索结果进行排序处理,以获得排序后的所述搜索结果;
2)根据所述类别需求度,并结合预置的类别需求阈值,对所述搜索结果进行筛选处理,以获得筛选后的所述搜索结果。
以所述预处理操作包括上述第1项为例,当所述确定装置13根据所述查询序列和所述候选需求类别,确定所述查询序列相对应的类别需求度后,所述提供装置14根据所述类别需求度,对所述查询序列对应的搜索结果进行排序处理,以获得排序后的所述搜索结果,如,所述提供装置14将类别需求度较高的搜索结果排在搜索结果列表中靠前的位置,而将类别需求度较低的搜索结果排在搜索结果列表中靠后的位置,然后将排序后的搜索结果提供给所述用户。以所述预处理操作包括上述第2项为例,当所述确定装置13根据所述查询序列和所述候选需求类别,确定所述查询序列相对应的类别需求度后,所述提供装置14根据所述类别需求度,并结合预置的类别需求阈值,对所述搜索结果进行筛选处理,以获得筛选后的所述搜索结果,如,所述提供装置14根据所述类别需求阈值,将类别需求度大于或等于所述类别需求阈值的搜索结果保留在拟提供给所述用户的搜索结果列表中,将类别需求度小于所述类别需求阈值的搜索结果从所述拟提供给用户的搜索结果列表中筛除,然后将筛选后的搜索结果提供给所述用户。本领域技术人员应能理解上述对所述搜索结果所进行的预处理操仅为举例,其他现有的或今后可能出现的对所述搜索结果所进行的预处理操作如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述提供装置14还根据所述类别需求度,并结合所述搜索结果的查询相关属性,将所述搜索结果提供给所述用户。具体地,当所述确定装置13根据所述查询序列和所述候选需求类别,确定所述查询序列相对应的类别需求度后,所述提供装置14将所述类别需求度与所述搜索结果的查询相关属性相结合,将所述搜索结果提供给所述用户。更优选地,所述查询相关属性包括以下至少任一项:
-所述搜索结果与所述查询序列的相关度;
-所述搜索结果的权威度;
-所述搜索结果的时效性。
以所述查询相关属性包括所述搜索结果与所述查询序列的相关度为例,通过所述确定装置13确定所述查询序列的类别需求度后,所述提供装置14不仅根据所述搜索结果所对应的类别需求度,而且还结合所述搜索结果与所述查询序列之间的相关度,将所述搜索结果提供给所述用户对应的用户设备。例如,当所述搜索结果所对应的新闻类搜索结果的类别需求度和音乐类搜索结果的类别需求度相同时,所述提供装置14将所述搜索结果对应的类别需求度与所述搜索结果和所述查询序列之间的相关度结合,将所述搜索结果提供给所述用户对应的用户设备。以所述查询相关属性包括所述搜索结果的权威度为例,通过所述确定装置13确定所述查询序列的类别需求度后,所述提供装置14不仅根据所述搜索结果所对应的类别需求度,而且还结合所述搜索结果与所述查询序列之间的相关度,将所述搜索结果提供给所述用户对应的用户设备。例如,当所述搜索结果所对应的新闻类搜索结果的类别需求度和音乐类搜索结果的类别需求度相同时,所述提供装置14将所述搜索结果对应的类别需求度与所述搜索结果的权威度结合,将所述搜索结果提供给所述用户对应的用户设备。如,所述查询序列对应的新闻类搜索结果的权威度较高而所述查询序列对应的音乐类搜索结果的权威度较低时,所述提供装置14将所述查询序列对应的所述新闻类搜索结果和所述音乐类搜索结果依次提供给所述用户对应的用户设备。以所述查询相关属性包括所述搜索结果的时效性为例,通过所述确定装置13确定所述查询序列的类别需求度后,所述提供装置14不仅根据所述搜索结果所对应的类别需求度,而且还结合所述搜索结果的时效性,将所述搜索结果提供给所述用户对应的用户设备。例如,当所述搜索结果所对应的新闻类搜索结果的类别需求度和音乐类搜索结果的类别需求度相同时,所述提供装置14将所述搜索结果对应的类别需求度与所述搜索结果的时效性结合,将所述搜索结果提供给所述用户对应的用户设备。如,所述查询序列对应的新闻类搜索结果的时效性较强而所述查询序列对应的音乐类搜索结果的时效性较弱时,所述提供装置14将所述查询序列对应的所述新闻类搜索结果和所述音乐类搜索结果依次提供给所述用户对应的用户设备。所述提供装置14采用上述提供方式,将所述类别需求度和所述搜索结果的查询相关属性相结合,将所述搜索结果提供给所述用户时,不仅能够满足用户查询序列对于搜索结果的类别需求,还能兼顾所述搜索结果的质量,极大地提升了用户在使用搜索引擎时的搜索体验。
图2示出根据本发明一个优选实施例的用于提供与查询序列相对应的搜索结果的设备示意图。其中,提供设备1’包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
参照图2,所述提供设备1’包括结果获取装置11’、类别获取装置12’、确定装置13’和提供装置14’。具体地,所述提供设备1’的结果获取装置11’获取与用户的查询序列相对应的搜索结果;类别获取装置12’根据所述查询序列,在需求特征词库16’中进行匹配查询,以获得与所述查询序列相对应的候选需求类别;接着,确定装置13’根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;最后,提供装置14’根据所述类别需求度,将所述搜索结果提供给所述用户。
在图2所示的提供设备1’中,结果获取装置11’、确定装置13’、提供装置14’分别与图1所示的结果获取装置11、确定装置13、提供装置14相同,为描述简便起见,故此处不再赘述,并通过引用的方式包含于此。
其中,类别获取装置12’还根据所述查询序列,在需求特征词库16’中进行匹配查询,以获得所述候选需求类别。具体地,所述类别获取装置12’根据所述查询序列,通过在所述需求特征词库16’中匹配查询诸如所述查询序列本身或所述查询序列中的关键词与需求类别之间的匹配关系,以获得所述候选需求类别。在此,所述需求特征词库16’既可包含于提供设备1’中,也可包含于与所述提供设备1’通过网络相连接的第三方设备中。接上例,若用户的查询序列为“××影视明星”,所述类别获取装置12’将所述查询序列在需求特征词库16’中进行匹配查询,当在所述需求特征词库16’中匹配查询到××影视明星属于明星列表并且该明星列表对应的需求类别包括视频、新闻、背景介绍、音乐和图片时,得到与所述查询序列相对应的候选需求类别包括视频、新闻、背景介绍、音乐和图片。本领域技术人员应能理解上述根据所述查询序列在需求特征词库中进行匹配查询以获得所述候选需求类别的方式仅为举例,其他现有的或今后可能出现的根据所述查询序列在需求特征词库中进行匹配查询以获得所述候选需求类别的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述提供设备1’还包括更新装置15’,所述更新装置15’根据预置的需求特征提取规则,从待挖掘序列中提取特征词与需求类别的映射关系,然后根据所述映射关系,建立或更新所述需求特征词库16’。更优选地,所述需求特征提取规则包括基于以下至少任一项来提取所述映射关系:
1)当所述待挖掘序列包含类别关键词时,结合所述类别关键词所对应的需求类别,来提取所述待挖掘序列与所述需求类别的所述映射关系;
2)当所述待挖掘序列包含与所述需求特征词库中特征词的共现频次超过预设共现阈值的查询关键词时,结合所述需求特征词库中特征词所对应的需求类别,来提取所述查询关键词与所述需求类别的所述映射关系;
3)当所述待挖掘序列相对应的分类结果的用户累计点击次数超过预设点击阈值时,结合所述分类结果所对应的需求类别,来提取所述待挖掘序列与所述需求类别的所述映射关系。
以所述需求特征提取规则包括上述第1项为例,当所述待挖掘序列包含类别关键词时,所述更新装置15’根据所述类别关键词所对应的需求类别,提取所述待挖掘序列与所述需求类别的所述映射关系,并根据所述映射关系来建立或更新所述需求特征词库16’。例如,当所述待挖掘序列为“哪里有关于中国世博会烟花表演的视频”时,由于该待挖掘序列包括“视频”这一类别关键词,所述更新装置15’基于该类别关键词所对应的需求类别,提取该待挖掘序列与视频需求类别间的所述映射关系,并根据所述映射关系来建立或更新所述需求特征词库16’。以所述需求特征提取规则包括上述第2项为例,当所述待挖掘序列包含与所述需求特征词库16’中特征词的共现频次超过预设共现阈值的查询关键词时,所述更新装置15’根据所述需求特征词库16’中特征词的共现频次超过预设共现阈值的查询关键词时,提取所述查询关键词与所述需求类别的所述映射关系。例如,当所述待挖掘序列为“天龙八部在线观看”、“射雕英雄传在线观看”、“鹿鼎记在线观看”、“电视剧在线观看”时,由于这些待挖掘序列中的“天龙八部”、“射雕英雄传”、“鹿鼎记”、“电视剧”在所述需求特征词库16’中属于视频类需求的特征词,并且“在线观看”这一关键词与上述视频类需求的特征词的共现频次达到一定阈值(即所述共现阈值)时,所述更新装置15’根据关键词“在线观看”,提取所述关键词“在线观看”与视频需求类别的映射关系,并根据所述映射关系来建立或更新所述需求特征词库16’。以所述需求特征提取规则包括上述第3项为例,当所述待挖掘序列相对应的分类结果的用户累计点击次数超过预设点击阈值时,所述更新装置15’基于所述分类结果所对应的需求类别,提取所述待挖掘序列与所述需求类别的所述映射关系,并根据所述映射关系来建立或更新所述需求特征词库16’。例如,当所述待挖掘序列为“日本地震”时,根据该待挖掘序列对应的分类结果,如视频类搜索结果、新闻类搜索结果、图片类搜索结果,若所述视频类搜索结果对应的用户累计点击次数为300,新闻类搜索结果对应的用户累计点击次数为25000,图片类搜索结果对应的用户累计点击次数为700,所述预设点击阈值为10000时,所述更新装置15’将所述待挖掘序列对应的分类结果的用户累计点击次数与预设点击阈值进行比较,并根据高于所述预设点击阈值的分类结果所对应的需求类别,即新闻需求类别,提取该待挖掘序列与新闻需求类别间的所述映射关系,并根据所述映射关系来建立或更新所述需求特征词库16’。
此外,上述用于提供与查询序列相对应的搜索结果的提供设备可以与现有的搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎可以采用已知的如百度、Google、Yahoo等搜索引擎。
图3示出根据本发明另一方面的用于提供与查询序列对应的搜索结果的方法流程图。其中,用于提供与查询序列对应的搜索结果的提供设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(CloudComputing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的超级虚拟计算机。
参照图3,所述提供设备在步骤S1中获取与用户的查询序列相对应的搜索结果;然后,在步骤S2中根据所述查询序列,获取与所述查询序列相对应的候选需求类别;接着,在步骤S3中根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;最后,在步骤S4中根据所述类别需求度,将所述搜索结果提供给所述用户。
具体地,在步骤S1中,所述提供设备获取与用户的查询序列相对应的搜索结果。具体地,所述提供设备例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与用户的查询序列相对应的搜索结果;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备输入的查询序列,并将所述查询序列在搜索索引库中进行匹配查询,获取与该查询序列相对应的搜索结果;或者,通过页面技术,如ASP、JSP、PHP等,从用户设备获取用户通过该用户设备输入的查询序列,并将所述查询序列在搜索索引库中进行匹配查询,获取与该查询序列对应的搜索结果。在此,所述通信方式包括但不限于基于3GPP、LTE、WIMAX的移动通信;基于TCP/IP、UDP协议的计算机网络通信;以及基于蓝牙、红外传输标准的近距离无线通信方式等。本领域技术人员应能理解上述获取与用户的查询序列相对应的搜索结果的方式仅为举例,其他现有的或今后可能出现的获取与用户的查询序列相对应的搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S2中,所述提供设备根据所述查询序列,获取与所述查询序列相对应的候选需求类别。具体地,当利用所述步骤S1获取与所述用户的查询序列相对应的搜索结果后,所述提供设备根据所述查询序列,通过诸如对所述查询序列进行语义分析或根据所述查询序列在需求特征词库中进行匹配查询等方式,来获得所述候选需求类别。例如,当所述用户的查询序列为“土豆上的热门影视剧”时,通过对其进行切词处理,得到“土豆/热门/影视剧”,由于影视剧一词具有明显的需求类别,诸如视频、下载、图片、演员介绍,所述提供设备对该查询序列进行语义分析或在需求特征词库中进行匹配查询,来获得所述候选需求类别,例如根据“影视剧”可知该查询序列对应的候选需求类别包括视频、下载、图片、演员介绍。优选地,当利用所述步骤S1获取与所述用户的查询序列相对应的搜索结果后,所述提供设备首先对所述查询序列进行切词处理获得切分后的词条,再通过诸如对所述词条进行语义分析或根据所述词条在需求特征词库中进行匹配查询等方式,来获得所述候选需求类别。本领域技术人员应能理解上述获取与所述查询序列相对应的候选需求类别的方式仅为举例,其他现有的或今后可能出现的获取与所述查询序列相对应的候选需求类别的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S3中,所述提供设备根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度。具体地,在利用所述步骤S2获取所述候选需求类别后,所述提供设备根据所述查询序列和所述候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定所述查询序列对于每一候选需求类别的类别需求度。接上例,当所述用户的查询序列为“土豆上的热门影视剧”时,所述提供设备根据所述查询序列,得到所述候选需求类别包括视频、下载、图片、演员介绍,然后根据所述查询序列和所述候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定与所述查询序列相对应的上述候选需求类别的类别需求度,诸如,所述查询序列相对于视频类的类别需求度为0.6;所述查询序列相对于下载类的类别需求度为0.05;所述查询序列相对于图片类的类别需求度为0.15;所述查询序列相对于演员介绍类的类别需求度为0.2。又如,当所述用户的查询序列为“××影视明星”时,所述提供设备根据所述查询序列,得到所述候选需求类别包括视频、新闻、背景介绍、音乐、图片,然后根据所述查询序列和所述候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定与所述查询序列相对应的类别需求度,如,所述查询序列在视频类的类别需求度为0.3;所述查询序列在新闻类的类别需求度为0.3;所述查询序列在背景介绍类的类别需求度为0.1;所述查询序列在音乐类的类别需求度为0.2;以及所述查询序列在图片类的类别需求度为0.1。优选地,该方法还包括步骤S5(未示出),在所述步骤S5中,所述提供设备根据所述查询序列和所述候选需求类别,通过需求强度数据库等第三方设备所提供的应用程序接口(API),从该第三方设备直接获取与所述查询序列相对应的类别需求度。本领域技术人员应能理解上述确定与所述查询序列相对应的类别需求度的方式仅为举例,其他现有的或今后可能出现的确定与所述查询序列相对应的类别需求度的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S4中,所述提供设备根据所述类别需求度,将所述搜索结果提供给所述用户。具体地,在利用所述步骤S3获得与所述查询序列相对应的类别需求度后,所述提供设备根据所述类别需求度,通过页面技术,如JSP、ASP、PHP等页面技术,将所述查询序列对应的搜索结果提供给所述用户,例如以链接、摘要或缩略图等形式提供给所述用户对应的用户设备,以供所述用户浏览。接上例,当用户的查询序列为“××影视明星”时,所述查询序列在视频类的类别需求度为0.3,在新闻类的类别需求度为0.3,在背景介绍类的类别需求度为0.1,在音乐类的类别需求度为0.2,在图片类的类别需求度为0.1时,若所述查询序列的搜索结果列表中的第一页显示10条搜索结果,所述提供设备根据所述类别需求度,通过JSP、ASP、PHP等页面技术,将3条视频类的搜索结果、3条新闻类的搜索结果、1条背景介绍类的搜索结果、2条音乐类的搜索结果提供给所述用户,并且将剩余的所有搜索结果中与所述查询序列相关度最高的1条搜索结果在第一页提供给所述用户对应的用户设备,以供其浏览。本领域技术人员应能理解上述将所述搜索结果提供给所述用户的方式仅为举例,其他现有的或今后可能出现的将所述搜索结果提供给所述用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在所述步骤S4中,所述提供设备还根据所述类别需求度,将所述类别需求度与所述搜索结果提供给所述用户。具体地,所述提供设备根据所述查询序列与所述候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定了与所述查询序列相对应的类别需求度后,通过页面技术,如JSP、ASP、PHP等页面技术,以诸如特别字体、浮动窗口等方式,将所述搜索结果相对应的类别需求度与所述搜索结果提供给所述用户。例如,所述提供设备在根据所述类别需求度来提供相应的搜索结果时,在这些搜索结果的页面说明中添加相应的类别需求度;进一步地,这些搜索结果的类别需求度还可以特别字体或者浮动窗口等方式显示,如在用户的鼠标停留在搜索结果的页面链接或者页面说明时,以悬浮窗口显示该停留搜索结果相应的类别需求度。将本发明的提供设备应用于搜索引擎,当用户通过用户设备输入查询序列后,所述搜索引擎不仅可以根据所述查询序列对应的类别需求度来提供所述搜索结果,而且还针对每一搜索结果提供相应的类别需求度,提升了用户的搜索效率,也增强了用户与搜索引擎之间的交互体验。本领域技术人员应能理解上述将所述类别需求度与所述搜索结果提供给所述用户的方式仅为举例,其他现有的或今后可能出现的将所述类别需求度与所述搜索结果提供给所述用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在所述步骤S3中,所述提供设备根据所述查询序列与所述候选需求类别,结合与所述查询序列相对应的用户点击操作记录,确定所述类别需求度。具体地,所述提供设备根据所述查询序列与所述候选需求类别,结合与所述查询序列相对应的大量用户的点击统计分析或者该用户的历史点击记录,确定所述类别需求度。例如,当用户的查询序列为“××影视明星”,所述提供设备根据所述查询序列得到对应的候选需求类别包括视频、新闻、背景介绍、音乐和图片后,结合该查询序列相应的大量用户的点击统计分析,如,统计分析结果中表明视频类搜索结果、新闻类搜索结果、背景介绍类搜索结果、音乐类搜索结果与图片类搜索结果的用户点击频次分别为60000次、10000次、10000次、10000次和10000次,则所述查询序列对于视频类搜索结果的类别需求度为0.6,而对于图片类搜索结果的类别需求度为0.1。接上例,当用户的查询序列为“××影视明星”,所述提供设备根据所述查询序列得到对应的候选需求类别包括视频、新闻、背景介绍、音乐和图片后,结合该查询序列相应的该用户的历史点击记录,如,历史点击记录中表明该用户在输入查询序列“××影视明星”后,点击该查询序列所对应的视频类搜索结果、新闻类搜索结果、背景介绍类搜索结果、音乐类搜索结果与图片类搜索结果的频次分别为600次、100次、100次、100次和100次,则所述查询序列对于视频类搜索结果的类别需求度为0.6;而对于图片类搜索结果的类别需求度为0.1。本领域技术人员应能理解上述结合用户点击操作记录确定所述类别需求度的方式仅为举例,其他现有的或今后可能出现的结合用户点击操作记录确定所述类别需求度的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在所述步骤S4中,所述提供设备还根据所述类别需求度,对所述搜索结果进行预处理操作,以获得预处理后的所述搜索结果,然后将所述预处理后的搜索结果提供给所述用户。更优选地,所述预处理操作包括以下至少任一项:
1)根据所述类别需求度,对所述搜索结果进行排序处理,以获得排序后的所述搜索结果;
2)根据所述类别需求度,并结合预置的类别需求阈值,对所述搜索结果进行筛选处理,以获得筛选后的所述搜索结果。
以所述预处理操作包括上述第1项为例,在所述步骤S3中根据所述查询序列和所述候选需求类别,确定所述查询序列相对应的类别需求度后,所述提供设备根据所述类别需求度,对所述查询序列对应的搜索结果进行排序处理,以获得排序后的所述搜索结果,如,所述提供设备将类别需求度较高的搜索结果排在搜索结果列表中靠前的位置,而将类别需求度较低的搜索结果排在搜索结果列表中靠后的位置,然后将排序后的搜索结果提供给所述用户。以所述预处理操作包括上述第2项为例,在所述步骤S3中根据所述查询序列和所述候选需求类别,确定所述查询序列相对应的类别需求度后,所述提供设备根据所述类别需求度,并结合预置的类别需求阈值,对所述搜索结果进行筛选处理,以获得筛选后的所述搜索结果,如,所述提供设备根据所述类别需求阈值,将类别需求度大于或等于所述类别需求阈值的搜索结果保留在拟提供给所述用户的搜索结果列表中,将类别需求度小于所述类别需求阈值的搜索结果从所述拟提供给用户的搜索结果列表中筛除,然后将筛选后的搜索结果提供给所述用户。本领域技术人员应能理解上述对所述搜索结果所进行的预处理操仅为举例,其他现有的或今后可能出现的对所述搜索结果所进行的预处理操作如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在所述步骤S4中,所述提供设备还根据所述类别需求度,并结合所述搜索结果的查询相关属性,将所述搜索结果提供给所述用户。具体地,在所述步骤S3中根据所述查询序列和所述候选需求类别,确定所述查询序列相对应的类别需求度后,所述提供设备将所述类别需求度与所述搜索结果的查询相关属性相结合,将所述搜索结果提供给所述用户。更优选地,所述查询相关属性包括以下至少任一项:
-所述搜索结果与所述查询序列的相关度;
-所述搜索结果的权威度;
-所述搜索结果的时效性。
以所述查询相关属性包括所述搜索结果与所述查询序列的相关度为例,通过步骤S3确定所述查询序列的类别需求度后,所述提供设备不仅根据所述搜索结果所对应的类别需求度,而且还结合所述搜索结果与所述查询序列之间的相关度,将所述搜索结果提供给所述用户对应的用户设备。例如,当所述搜索结果所对应的新闻类搜索结果的类别需求度和音乐类搜索结果的类别需求度相同时,所述提供设备将所述搜索结果对应的类别需求度与所述搜索结果和所述查询序列之间的相关度结合,将所述搜索结果提供给所述用户对应的用户设备。以所述查询相关属性包括所述搜索结果的权威度为例,通过步骤S3确定所述查询序列的类别需求度后,所述提供设备不仅根据所述搜索结果所对应的类别需求度,而且还结合所述搜索结果与所述查询序列之间的相关度,将所述搜索结果提供给所述用户对应的用户设备。例如,当所述搜索结果所对应的新闻类搜索结果的类别需求度和音乐类搜索结果的类别需求度相同时,所述提供设备将所述搜索结果对应的类别需求度与所述搜索结果的权威度结合,将所述搜索结果提供给所述用户对应的用户设备。如,所述查询序列对应的新闻类搜索结果的权威度较高而所述查询序列对应的音乐类搜索结果的权威度较低时,所述提供设备将所述查询序列对应的所述新闻类搜索结果和所述音乐类搜索结果依次提供给所述用户对应的用户设备。以所述查询相关属性包括所述搜索结果的时效性为例,通过步骤S3确定所述查询序列的类别需求度后,所述提供设备不仅根据所述搜索结果所对应的类别需求度,而且还结合所述搜索结果的时效性,将所述搜索结果提供给所述用户对应的用户设备。例如,当所述搜索结果所对应的新闻类搜索结果的类别需求度和音乐类搜索结果的类别需求度相同时,所述提供设备将所述搜索结果对应的类别需求度与所述搜索结果的时效性结合,将所述搜索结果提供给所述用户对应的用户设备。如,所述查询序列对应的新闻类搜索结果的时效性较强而所述查询序列对应的音乐类搜索结果的时效性较弱时,所述提供设备将所述查询序列对应的所述新闻类搜索结果和所述音乐类搜索结果依次提供给所述用户对应的用户设备。所述提供设备采用上述提供方式,将所述类别需求度和所述搜索结果的查询相关属性相结合,将所述搜索结果提供给所述用户时,不仅能够满足用户查询序列对于搜索结果的类别需求,还能兼顾所述搜索结果的质量,极大地提升了用户在使用搜索引擎时的搜索体验。
图4示出根据本发明一个优选实施例的用于提供与查询序列相对应的搜索结果的方法流程图。其中,用于提供与查询序列相对应的搜索结果的提供设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
参照图4,步骤S11’、步骤S13’和步骤S14’分别与图3所示的步骤S11、步骤S13和步骤S14相同或相似,为描述简便起见,故此处不再赘述,并通过引用的方式包含于此。
在步骤S12’中,所述提供设备还根据所述查询序列,在需求特征词库中进行匹配查询,以获得所述候选需求类别。具体地,所述提供设备根据所述查询序列,通过在所述需求特征词库中匹配查询诸如所述查询序列本身或所述查询序列中的关键词与需求类别之间的匹配关系,以获得所述候选需求类别。在此,所述需求特征词库既可包含于所述提供设备中,也可包含于与所述提供设备通过网络相连接的第三方设备中。接上例,若用户的查询序列为“××影视明星”,所述提供设备将所述查询序列在需求特征词库中进行匹配查询,当在所述需求特征词库中匹配查询到××影视明星属于明星列表并且该明星列表对应的需求类别包括视频、新闻、背景介绍、音乐和图片时,得到与所述查询序列相对应的候选需求类别包括视频、新闻、背景介绍、音乐和图片。本领域技术人员应能理解上述根据所述查询序列在需求特征词库中进行匹配查询以获得所述候选需求类别的方式仅为举例,其他现有的或今后可能出现的根据所述查询序列在需求特征词库中进行匹配查询以获得所述候选需求类别的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,该方法还包括步骤S5’,在所述步骤S5’中,所述提供设备根据预置的需求特征提取规则,从待挖掘序列中提取特征词与需求类别的映射关系,然后根据所述映射关系,建立或更新所述需求特征词库。更优选地,所述需求特征提取规则包括基于以下至少任一项来提取所述映射关系:
1)当所述待挖掘序列包含类别关键词时,结合所述类别关键词所对应的需求类别,来提取所述待挖掘序列与所述需求类别的所述映射关系;
2)当所述待挖掘序列包含与所述需求特征词库中特征词的共现频次超过预设共现阈值的查询关键词时,结合所述需求特征词库中特征词所对应的需求类别,来提取所述查询关键词与所述需求类别的所述映射关系;
3)当所述待挖掘序列相对应的分类结果的用户累计点击次数超过预设点击阈值时,结合所述分类结果所对应的需求类别,来提取所述待挖掘序列与所述需求类别的所述映射关系。
以所述需求特征提取规则包括上述第1项为例,当所述待挖掘序列包含类别关键词时,在步骤S5’中,所述提供设备根据所述类别关键词所对应的需求类别,提取所述待挖掘序列与所述需求类别的所述映射关系,并根据所述映射关系来建立或更新所述需求特征词库。例如,当所述待挖掘序列为“哪里有关于中国世博会烟花表演的视频”时,由于该待挖掘序列包括“视频”这一类别关键词,所述提供设备基于该类别关键词所对应的需求类别,提取该待挖掘序列与视频需求类别间的所述映射关系,并根据所述映射关系来建立或更新所述需求特征词库。以所述需求特征提取规则包括上述第2项为例,当所述待挖掘序列包含与所述需求特征词库中特征词的共现频次超过预设共现阈值的查询关键词时,在步骤S5’中,所述提供设备根据所述需求特征词库中特征词的共现频次超过预设共现阈值的查询关键词时,提取所述查询关键词与所述需求类别的所述映射关系。例如,当所述待挖掘序列为“天龙八部在线观看”、“射雕英雄传在线观看”、“鹿鼎记在线观看”、“电视剧在线观看”时,由于这些待挖掘序列中的“天龙八部”、“射雕英雄传”、“鹿鼎记”、“电视剧”在所述需求特征词库中属于视频类需求的特征词,并且“在线观看”这一关键词与上述视频类需求的特征词的共现频次达到一定阈值(即所述共现阈值)时,所述提供设备根据关键词“在线观看”,提取所述关键词“在线观看”与视频需求类别的映射关系,并根据所述映射关系来建立或更新所述需求特征词库。以所述需求特征提取规则包括上述第3项为例,当所述待挖掘序列相对应的分类结果的用户累计点击次数超过预设点击阈值时,在步骤S5’中,所述提供设备基于所述分类结果所对应的需求类别,提取所述待挖掘序列与所述需求类别的所述映射关系,并根据所述映射关系来建立或更新所述需求特征词库。例如,当所述待挖掘序列为“日本地震”时,根据该待挖掘序列对应的分类结果,如视频类搜索结果、新闻类搜索结果、图片类搜索结果,若所述视频类搜索结果对应的用户累计点击次数为300,新闻类搜索结果对应的用户累计点击次数为25000,图片类搜索结果对应的用户累计点击次数为700,所述预设点击阈值为10000时,所述提供设备将所述待挖掘序列对应的分类结果的用户累计点击次数与预设点击阈值进行比较,并根据高于所述预设点击阈值的分类结果所对应的需求类别,即新闻需求类别,提取该待挖掘序列与新闻需求类别间的所述映射关系,并根据所述映射关系来建立或更新所述需求特征词库。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (25)

1.一种用于提供与查询序列相对应的搜索结果的方法,其中,该方法包括以下步骤:
a获取与用户的查询序列相对应的搜索结果;
b根据所述查询序列,获取与所述查询序列相对应的候选需求类别;
c根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;
d根据所述类别需求度,将所述搜索结果提供给所述用户。
2.根据权利要求1所述的方法,其中,所述步骤a还包括:
-获取所述查询序列;
-根据所述查询序列,在搜索索引库中进行匹配查询,以获得所述搜索结果。
3.根据权利要求1或2所述的方法,其中,所述步骤d还包括:
-根据所述类别需求度,将所述类别需求度与所述搜索结果提供给所述用户。
4.根据权利要求1至3中任一项所述的方法,其中,所述步骤b还包括:
-对所述查询序列进行语义分析处理,以获得所述候选需求类别。
5.根据权利要求1至4中任一项所述的方法,其中,所述步骤b还包括:
-根据所述查询序列,在需求特征词库中进行匹配查询,以获得所述候选需求类别。
6.根据权利要求5所述的方法,其中,该方法还包括:
-根据预置的需求特征提取规则,从待挖掘序列中提取特征词与需求类别的映射关系;
-根据所述映射关系,建立或更新所述需求特征词库。
7.根据权利要求6所述的方法,其中,所述需求特征提取规则包括基于以下至少任一项来提取所述映射关系:
-当所述待挖掘序列包含类别关键词时,结合所述类别关键词所对应的需求类别,来提取所述待挖掘序列与所述需求类别的所述映射关系;
-当所述待挖掘序列包含与所述需求特征词库中特征词的共现频次超过预设共现阈值的查询关键词时,结合所述需求特征词库中特征词所对应的需求类别,来提取所述查询关键词与所述需求类别的所述映射关系;
-当所述待挖掘序列相对应的分类结果的用户累计点击次数超过预设点击阈值时,结合所述分类结果所对应的需求类别,来提取所述待挖掘序列与所述需求类别的所述映射关系。
8.根据权利要求1至7中任一项所述的方法,其中,所述步骤c还包括:
-根据所述查询序列与所述候选需求类别,结合与所述查询序列相对应的用户点击操作记录,确定所述类别需求度。
9.根据权利要求1至8中任一项所述的方法,其中,所述步骤d还包括:
-根据所述类别需求度,对所述搜索结果进行预处理操作,以获得预处理后的所述搜索结果;
-将所述预处理后的搜索结果提供给所述用户。
10.根据权利要求9所述的方法,其中,所述预处理操作包括以下至少任一项:
-根据所述类别需求度,对所述搜索结果进行排序处理,以获得排序后的所述搜索结果;
-根据所述类别需求度,并结合预置的类别需求阈值,对所述搜索结果进行筛选处理,以获得筛选后的所述搜索结果。
11.根据权利要求1至10中任一项所述的方法,其中,所述步骤d还包括:
-根据所述类别需求度,并结合所述搜索结果的查询相关属性,将所述搜索结果提供给所述用户。
12.根据权利要求11所述的方法,其中,所述查询相关属性包括以下至少任一项:
-所述搜索结果与所述查询序列的相关度;
-所述搜索结果的权威度;
-所述搜索结果的时效性。
13.一种用于提供与查询序列相对应的搜索结果的设备,其中,所述设备包括:
结果获取装置,用于获取与用户的查询序列相对应的搜索结果;
类别获取装置,用于根据所述查询序列,获取与所述查询序列相对应的候选需求类别;
确定装置,用于根据所述查询序列与所述候选需求类别,确定与所述查询序列相对应的类别需求度;
提供装置,用于根据所述类别需求度,将所述搜索结果提供给所述用户。
14.根据权利要求13所述的设备,其中,所述结果获取装置还用于:
-获取所述查询序列;
-根据所述查询序列,在搜索索引库中进行匹配查询,以获得所述搜索结果。
15.根据权利要求13或14所述的设备,其中,所述提供装置还用于:
-根据所述类别需求度,将所述类别需求度与所述搜索结果提供给所述用户。
16.根据权利要求13至15中任一项所述的设备,其中,所述类别获取装置还用于:
-对所述查询序列进行语义分析处理,以获得所述候选需求类别。
17.根据权利要求13至16中任一项所述的设备,其中,所述类别获取装置还用于:
-根据所述查询序列,在需求特征词库中进行匹配查询,以获得所述候选需求类别。
18.根据权利要求17所述的设备,其中,所述设备还包括更新装置,用于:
-根据预置的需求特征提取规则,从待挖掘序列中提取特征词与需求类别的映射关系;
-根据所述映射关系,建立或更新所述需求特征词库。
19.根据权利要求18所述的设备,其中,所述需求特征提取规则包括基于以下至少任一项来提取所述映射关系:
-当所述待挖掘序列包含类别关键词时,结合所述类别关键词所对应的需求类别,来提取所述待挖掘序列与所述需求类别的所述映射关系;
-当所述待挖掘序列包含与所述需求特征词库中特征词的共现频次超过预设共现阈值的查询关键词时,结合所述需求特征词库中特征词所对应的需求类别,来提取所述查询关键词与所述需求类别的所述映射关系;
-当所述待挖掘序列相对应的分类结果的用户累计点击次数超过预设点击阈值时,结合所述分类结果所对应的需求类别,来提取所述待挖掘序列与所述需求类别的所述映射关系。
20.根据权利要求13至19中任一项所述的设备,其中,所述确定装置还用于:
-根据所述查询序列与所述候选需求类别,结合与所述查询序列相对应的用户点击操作记录,确定所述类别需求度。
21.根据权利要求13至20中任一项所述的设备,其中,所述提供装置还用于:
-根据所述类别需求度,对所述搜索结果进行预处理操作,以获得预处理后的所述搜索结果;
-将所述预处理后的搜索结果提供给所述用户。
22.根据权利要求21所述的设备,其中,所述预处理操作包括以下至少任一项:
-根据所述类别需求度,对所述搜索结果进行排序处理,以获得排序后的所述搜索结果;
-根据所述类别需求度,并结合预置的类别需求阈值,对所述搜索结果进行筛选处理,以获得筛选后的所述搜索结果。
23.根据权利要求13至22中任一项所述的设备,其中,所述提供装置还用于:
-根据所述类别需求度,并结合所述搜索结果的查询相关属性,将所述搜索结果提供给所述用户。
24.根据权利要求23所述的设备,其中,所述查询相关属性包括以下至少任一项:
-所述搜索结果与所述查询序列的相关度;
-所述搜索结果的权威度;
-所述搜索结果的时效性。
25.一种搜索引擎,其中,该搜索引擎包括如权利要求13至24中任一项所述的用于提供与查询序列相对应的搜索结果的设备。
CN 201110196130 2011-07-13 2011-07-13 一种用于提供与查询序列相对应的搜索结果的设备和方法 Pending CN102880609A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110196130 CN102880609A (zh) 2011-07-13 2011-07-13 一种用于提供与查询序列相对应的搜索结果的设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110196130 CN102880609A (zh) 2011-07-13 2011-07-13 一种用于提供与查询序列相对应的搜索结果的设备和方法

Publications (1)

Publication Number Publication Date
CN102880609A true CN102880609A (zh) 2013-01-16

Family

ID=47481937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110196130 Pending CN102880609A (zh) 2011-07-13 2011-07-13 一种用于提供与查询序列相对应的搜索结果的设备和方法

Country Status (1)

Country Link
CN (1) CN102880609A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103646034A (zh) * 2013-11-14 2014-03-19 东华理工大学 一种基于内容可信的Web搜索引擎系统及搜索方法
CN103955480A (zh) * 2014-04-02 2014-07-30 百度在线网络技术(北京)有限公司 一种用于确定用户所对应的目标对象信息的方法与设备
CN104572717A (zh) * 2013-10-18 2015-04-29 腾讯科技(深圳)有限公司 信息搜索方法和装置
CN105792144A (zh) * 2014-12-24 2016-07-20 小米科技有限责任公司 信息提示方法及装置
CN105874458A (zh) * 2016-03-30 2016-08-17 马岩 网络信息的分析方法及系统
CN106250530A (zh) * 2016-08-06 2016-12-21 马岩 大数据中关键字分类搜索方法及系统
CN106462645A (zh) * 2016-01-07 2017-02-22 马岩 网络信息的搜索方法及系统
CN106815262A (zh) * 2015-12-01 2017-06-09 北京国双科技有限公司 裁判文书的搜索方法及装置
WO2018027341A1 (zh) * 2016-08-06 2018-02-15 马岩 大数据中关键字分类搜索方法及系统
CN108170784A (zh) * 2017-12-26 2018-06-15 佛山市道静科技有限公司 一种提取互联网上内容信息的方法及系统
WO2018214493A1 (zh) * 2017-05-24 2018-11-29 优酷网络技术(北京)有限公司 视频搜索方法及装置
CN109189984A (zh) * 2018-08-15 2019-01-11 百度在线网络技术(北京)有限公司 用于显示信息的方法及装置
CN109753556A (zh) * 2018-12-24 2019-05-14 出门问问信息科技有限公司 一种查询类别推测方法、装置、设备及存储介质

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572717A (zh) * 2013-10-18 2015-04-29 腾讯科技(深圳)有限公司 信息搜索方法和装置
CN104572717B (zh) * 2013-10-18 2020-01-31 腾讯科技(深圳)有限公司 信息搜索方法和装置
CN103646034A (zh) * 2013-11-14 2014-03-19 东华理工大学 一种基于内容可信的Web搜索引擎系统及搜索方法
CN103646034B (zh) * 2013-11-14 2017-03-08 东华理工大学 一种基于内容可信的Web搜索引擎系统及搜索方法
CN103955480A (zh) * 2014-04-02 2014-07-30 百度在线网络技术(北京)有限公司 一种用于确定用户所对应的目标对象信息的方法与设备
CN105792144A (zh) * 2014-12-24 2016-07-20 小米科技有限责任公司 信息提示方法及装置
CN106815262A (zh) * 2015-12-01 2017-06-09 北京国双科技有限公司 裁判文书的搜索方法及装置
WO2017117783A1 (zh) * 2016-01-07 2017-07-13 马岩 网络信息的搜索方法及系统
CN106462645A (zh) * 2016-01-07 2017-02-22 马岩 网络信息的搜索方法及系统
CN105874458A (zh) * 2016-03-30 2016-08-17 马岩 网络信息的分析方法及系统
WO2017166134A1 (zh) * 2016-03-30 2017-10-05 马岩 网络信息的分析方法及系统
WO2018027341A1 (zh) * 2016-08-06 2018-02-15 马岩 大数据中关键字分类搜索方法及系统
CN106250530A (zh) * 2016-08-06 2016-12-21 马岩 大数据中关键字分类搜索方法及系统
WO2018214493A1 (zh) * 2017-05-24 2018-11-29 优酷网络技术(北京)有限公司 视频搜索方法及装置
TWI676391B (zh) * 2017-05-24 2019-11-01 大陸商優酷網絡技術(北京)有限公司 視頻搜索方法及裝置
CN108170784A (zh) * 2017-12-26 2018-06-15 佛山市道静科技有限公司 一种提取互联网上内容信息的方法及系统
CN109189984A (zh) * 2018-08-15 2019-01-11 百度在线网络技术(北京)有限公司 用于显示信息的方法及装置
CN109189984B (zh) * 2018-08-15 2022-04-19 百度在线网络技术(北京)有限公司 用于显示信息的方法及装置
CN109753556A (zh) * 2018-12-24 2019-05-14 出门问问信息科技有限公司 一种查询类别推测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN102880609A (zh) 一种用于提供与查询序列相对应的搜索结果的设备和方法
JP7222022B2 (ja) 情報検索方法、装置、設備、記憶媒体、及びプログラム
CN104462573B (zh) 一种视频搜索结果展示方法及装置
CN102043833B (zh) 一种基于查询词进行搜索的方法和搜索装置
CN102184185A (zh) 一种用于多媒体资源搜索的方法与设备
US8935197B2 (en) Systems and methods for facilitating open source intelligence gathering
CN102402619B (zh) 一种搜索方法和装置
US10210179B2 (en) Dynamic feature weighting
EP2955686A1 (en) Automatic article enrichment by social media trends
CN102420813B (zh) 一种根据用户设备的终端属性提供目标信息的方法与设备
CN104699704B (zh) 内容推送及接收方法、装置和系统
CN104063454A (zh) 一种挖掘用户需求的搜索推送方法和装置
CN104462293A (zh) 搜索处理方法、生成搜索结果排序模型的方法和装置
US20100070526A1 (en) Method and system for producing a web snapshot
WO2007078380A2 (en) System and method for monitoring evolution over time of temporal content
CN1784653A (zh) 用于从搜索查询中产生概念单元的系统和方法
CN103076892A (zh) 一种用于提供输入字符串所对应的输入候选项的方法与设备
CN102968413A (zh) 一种用于提供搜索结果的方法与设备
CN103780677A (zh) 信息分类推送的方法及系统
CN105653701B (zh) 模型生成方法及装置、词语赋权方法及装置
CN104216931A (zh) 实时推荐系统及方法
US11423096B2 (en) Method and apparatus for outputting information
CN102855261A (zh) 一种用于确定视频权威值的方法与设备
CN102541853A (zh) 一种利用浏览器地址栏获取应用信息的方法和装置
WO2016209402A1 (en) Utilizing user co-search behavior to identify search queries seeking inappropriate content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130116