CN103744856B - 联动性扩展搜索方法及装置、系统 - Google Patents
联动性扩展搜索方法及装置、系统 Download PDFInfo
- Publication number
- CN103744856B CN103744856B CN201310642395.0A CN201310642395A CN103744856B CN 103744856 B CN103744856 B CN 103744856B CN 201310642395 A CN201310642395 A CN 201310642395A CN 103744856 B CN103744856 B CN 103744856B
- Authority
- CN
- China
- Prior art keywords
- key word
- document data
- search
- ranking results
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000012552 review Methods 0.000 description 13
- 241001269238 Data Species 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 241000239290 Araneae Species 0.000 description 2
- 101150071434 BAR1 gene Proteins 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种联动性扩展搜索方法及装置、系统,其中,所述方法包括服务器接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;根据所述第一关键词,确定与所述第一关键词关联的第二关键词;根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果。较现有技术,采用本发明实施例提供的所述方法得出的搜索结果的有效性更高。
Description
技术领域
本发明涉及数据处理技术,尤其涉及一种联动性扩展搜索方法及装置、系统。
背景技术
随着网络技术的不断发展,用户越来越依靠搜索引擎来获取网络数据,通常,用户可以通过终端向网络侧的服务器发送搜索请求,服务器中的搜索引擎根据搜索请求中携带的关键词,搜索出包含有所述关键词的文档数据。
然而,互联网上的数据质量参差不齐,现有技术仅考虑关键词与文档数据字面上的相关程度,并未考虑文档数据所包含的具体内容,排在最前面的字面相关程度高的文档数据信息可能只是包含有用户欲搜索的关键词,并未考虑文档数据所包含的具体内容,从用户的角度来看,并不具有参考价值。
由此可知,现有的搜索数据处理方法得出的搜索结果的有效性较低。
发明内容
本发明提供一种联动性扩展搜索方法及装置、系统,以提高搜索结果的有效性。
第一方面,本发明提供一种联动性扩展搜索方法,包括:
服务器接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;
根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;
根据所述第一关键词,确定与所述第一关键词关联的第二关键词;
根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果。
其中,根据所述第一关键词,搜索得到与所述第一关键词对应的第一文档数据的排序结果,包括:
所述服务器根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据;
根据预设的排序参数对所述第一文档数据进行排序,得到所述第一文档数据的排序结果;
所述预设的排序参数包括所述第一文档数据的生成时间或浏览所述第一文档数据的次数。
其中,根据所述第一关键词,确定与所述第一关键词关联的第二关键词,包括:
所述服务器根据预设的规则将所述第一关键词进行扩展,获取第二关键词集合,其中,所述第二关键词集合中至少包括一个第二关键词;
其中,所述预设的规则包括:
字段匹配规则,即按照相关性取所述第一关键词中的字段作为推荐词,根据所述推荐词确定第二关键词集合;或者
基于统计的关联匹配规则,即根据所述用户终端的历史搜索记录查找相似类别的关键词作为推荐词,根据所述推荐词确定第二关键词集合。
其中,所述根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果,包括:
所述服务器根据所述第二关键词,搜索得到与所述第二关键词关联的第二文档数据;
根据所述第一文档数据的排序结果,获取与所述第一文档数据的排序结果对应的排序参数;
根据所述排序参数,对搜索得到的所述第二文档数据进行排序。
其中,所述的方法还包括:
所述服务器将所述第一文档数据的排序结果和所述第二文档数据的排序结果一起发送给所述用户终端进行显示。
第二方面,提供一种联动性扩展搜索装置,位于服务器侧,其包括:
接收模块,用于接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;
第一获取模块,用于根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;
确定模块,用于根据所述第一关键词,确定与所述第一关键词关联的第二关键词;
第二获取模块,用于根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果。
其中,所述第一获取模块具体用于:根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据;根据预设的排序参数对所述第一文档数据进行排序,得到所述第一文档数据的排序结果;
所述预设的排序参数包括所述第一文档数据的生成时间或浏览所述第一文档数据的次数。
其中,所述确定模块具体用于:根据预设的规则将所述第一关键词进行扩展,获取第二关键词集合,其中,所述第二关键词集合中至少包括一个第二关键词;
其中,所述预设的规则包括:
字段匹配规则,即按照相关性取所述第一关键词中的字段作为推荐词,根据所述推荐词确定第二关键词集合;或者
基于统计的关联匹配规则,即根据所述用户终端的历史搜索记录查找相似类别的关键词作为推荐词,根据所述推荐词确定第二关键词集合。
其中,所述第二获取模块具体用于:
根据所述第二关键词,搜索得到与所述第二关键词关联的第二文档数据;根据所述第一文档数据的排序结果,获取与所述第一文档数据的排序结果对应的排序参数;根据所述排序参数,对搜索得到的所述第二文档数据进行排序。
其中,所述的装置还包括:
发送模块,用于将所述第一文档数据的排序结果和所述第二文档数据的排序结果一起发送给所述用户终端进行显示。
第三方面,提供一种联动性扩展搜索系统,其包括:服务器和用户终端;
所述服务器包括如第二方面所述联动性扩展搜索装置;
所述用户终端,用于向服务器发送搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;以使所述服务器根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;根据所述第一关键词,确定与所述第一关键词关联的第二关键词;根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果;
所述用户终端,还用于展示服务器发送的第一文档数据的排序结果和第二文档数据的排序结果。
本发明的技术效果是:本实施例的服务器接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;根据所述第一关键词,确定与所述第一关键词关联的第二关键词;根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果。不仅考虑了用户欲搜索第一关键词与第一文档数据相关程度,还同时考虑了与该用户欲搜索第一关键词相关联的第二关键词,依此推测该用户可能会关注的第二关键词,并得到与该用户可能会关注的第二关键词相关联的第二文档数据,进一步地,本发明实施例可以根据用户欲搜索第一关键词得到与用户欲搜索第一关键词相关联的第一文档数据的排序结果,还可以根据与用户欲搜索第一关键词关联的第一文档数据的排序结果相同的排序参数,得到与用户可能会关注的第二关键词相关联的第二文档数据的排序结果。较现有技术,采用本发明实施例提供的所述方法得出的搜索结果的有效性更高,体现了用户联动性的扩展搜索需求。
附图说明
图1为本发明实施例一提供的联动性扩展搜索方法的流程示意图;
图2为“碟中谍4”和“碟中谍3”对应的各视频网站的URL的排序结果的展示图;
图3为“碟中谍4”和“碟中谍3”对应的各影评网站的URL的排序结果的展示图;
图4为本发明实施例二提供的联动性扩展搜索装置的结构示意图;
图5为本发明实施例三提供的服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例所述的服务器为提供搜索引擎功能的服务器,例如包括360搜索引擎服务器;用户终端例如包括台式电脑或笔记本电脑等计算设备,或者包括用户手机等移动设备。
如图1所示,本发明实施例一提供的搜索数据的处理方法的流程示意图。如图所示,依据本实施例一的方法包括:
步骤101、服务器接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;
在实际应用中,用户通过用户终端在服务器提供的搜索功能的界面中输入第一关键词,并点击相应的触发检索的按钮,以生成搜索请求发送到服务器,该搜索请求中携带有用户欲搜索的第一关键词。
步骤102、服务器根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;
在本发明的一个可选实施方式中,步骤102包括:服务器根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据;根据预设的排序参数对所述第一文档数据进行排序,得到所述第一文档数据的排序结果。
例如,服务器可以释放大量的抓取程序,获取网络上的网页,并按照网页相关性原理,在每个关键词和与其相关的网页的统一资源定位符(Uniform/Universal ResourceLocator,URL)之间建立一个对应关系,将该对应关系存储在服务器的数据库中。这样当用户在搜索引擎中输入第一关键词(如碟中谍4)时,就可以在搜索引擎服务器中搜索到与第一关键词“碟中谍4”关联的第一文档数据(如与“碟中谍4”相匹配的所有网页的URL);
在获取第一文档数据之后,服务器可以根据预设的排序参数对搜索到的第一文档数据进行排序。例如,服务器中预先设置有第一文档数据的排序参数。所述服务器可直接提取已设置的第一文档数据的排序参数即可。其中,所述排序参数可以依据实际应用情况具体设定,例如包括浏览第一文档数据的次数(如点击率),或者第一文档数据的生成时间(如影评的生成时间)等。
步骤103、服务器根据所述第一关键词,确定与所述第一关键词关联的第二关键词;
服务器可以根据预设的规则将第一关键词进行扩展,获取第二关键词集合,其中,第二关键词集合中至少包括一个第二关键词;
其中,预设的规则例如包括:
字段匹配规则,即按照相关性取第一关键词的字段作为推荐词,根据推荐词确定第二关键词集合,比如第一关键词为“碟中谍4”,将字段“碟中谍”作为推荐词,可以扩展出的第二关键词集合包括“碟中谍1”、“碟中谍2”、“碟中谍3”;
基于统计的关联匹配规则,即根据用户终端的历史搜索记录查找相似类别的关键词作为推荐词,根据推荐词确定第二关键词集合,比如第一关键词为“碟中谍4”,根据网络的搜索日志或根据用户历史搜索记录查找到相似类别的推荐词,可以扩展出的第二关键词集合包括“谍影重重”、“壮志凌云”、“危情谍战”。
需要说明的是,第二关键词是基于第一关键词的基础上,可以体现用户可能感兴趣的关键词。
步骤104、服务器根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果。
在本发明的一个可选实施方式中,步骤104包括:
服务器根据所述第二关键词,搜索得到与所述第二关键词关联的第二文档数据;根据所述第一文档数据的排序结果,获取与所述第一文档数据的排序结果对应的排序参数;根据所述排序参数,对搜索得到的所述第二文档数据进行排序。
例如,服务器根据已经建立的每个关键词和与其相关的网页的URL之间的对应关系,这样在确定第一关键词关联的第二关键词(如“碟中谍3”)之后,就可以在搜索引擎服务器中搜索到与第二关键词“碟中谍3”关联的第二文档数据(如与“碟中谍3”相匹配的所有网页的URL);之后,服务器可以根据与“碟中谍4”相关的第一文档数据的排序参数,对搜索到的与“碟中谍3”相关的第二文档数据进行排序。
本实施例的服务器接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;根据所述第一关键词,确定与所述第一关键词关联的第二关键词;根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果。不仅考虑了用户欲搜索第一关键词与第一文档数据相关程度,还同时考虑了与该用户欲搜索第一关键词相关联的第二关键词,依此推测该用户可能会关注的第二关键词,并得到与该用户可能会关注的第二关键词相关联的第二文档数据;
进一步地,本发明实施例可以根据用户欲搜索第一关键词得到与用户欲搜索第一关键词相关联的第一文档数据的排序结果,还可以根据与用户欲搜索第一关键词关联的第一文档数据的排序结果相同的排序参数,得到与用户可能会关注的第二关键词相关联的第二文档数据的排序结果。较现有技术,采用本发明实施例提供的方法得出的搜索结果的有效性更高,体现了用户的联动性的搜索需求。
下面结合附图和具体实施方式对本发明的技术方案做进一步的详细说明:
举例来说,具有搜索引擎功能的服务器可以释放出网络爬虫又名网络蜘蛛(Webspider),获取因特网上的网页,服务器对获取到的网页进行分词,形成以关键词为索引的索引表;其中,索引表用于根据关键词索引查找网页,可以实现快速高效的网页搜索,索引表中存储有关键词与关键词对应的网页的URL。
需要说明的是,网络爬虫是现有技术中的一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成,本发明对此不作详细介绍。
上述索引表的结构如表1所示:
当用户通过用户终端在服务器提供的搜索功能的界面中输入第一关键词“碟中谍4”之后,点击相应的触发检索的按钮,以生成搜索请求发送到服务器,该搜索请求中携带有用户欲搜索的第一关键词“碟中谍4”。
服务器根据用户终端发送的搜索请求中包括的第一关键词“碟中谍4”,查询上述索引表,得到与该第一关键词“碟中谍4”对应的网页URL的集合(包括与“碟中谍4”对应的各视频网站的URL);
之后,服务器根据预设的排序参数(如“碟中谍4”在各视频网站的浏览次数),对上述搜索得到的与“碟中谍4”对应的各视频网站的URL进行排序;
进一步地,服务器根据预设的规则(字段匹配规则或基于统计的关联匹配规则)将第一关键词进行扩展,获取第二关键词集合,其中,第二关键词集合中至少包括一个第二关键词;
其中,字段匹配规则是指按照相关性取第一关键词的字段作为推荐词,根据推荐词确定第二关键词集合,比如第一关键词为“碟中谍4”,将字段“碟中谍”作为推荐词,可以扩展出的第二关键词集合包括“碟中谍1”、“碟中谍2”、“碟中谍3”;
基于统计的关联匹配规则是指根据用户终端的历史搜索记录查找相似类别的关键词作为推荐词,根据推荐词确定第二关键词集合;需要说明的是,服务器可以根据用户终端发送的搜索请求,获取该搜索请求中携带的该用户终端的标识(如IP地址),生成与该用户终端的标识对应的历史搜索请求记录,将用户每一次通过该用户终端发送的搜索请求中的关键词保存到与该用户终端的标识对应的历史搜索请求记录中。
其中,历史搜索请求记录如表2所示:
用户终端的标识 | 历史搜索请求记录 |
标识1 | key1,key2,…… |
标识2 | key1,key2,…… |
…… | …… |
比如第一关键词为“碟中谍4”,“碟中谍4”属于谍战类的电影名称,根据该用户终端的历史搜索记录判断用户是否搜索过谍战类的其他电影的名称,若存在谍战类的其他电影的名称,将谍战类的其他电影的名称作为推荐词,可以扩展出的第二关键词集合,例如包括“谍影重重”、“壮志凌云”、“危情谍战”。
假设服务器将“碟中谍3”作为“碟中谍4”的关联的第二关键词,服务器根据“碟中谍3”,查询上述索引表,得到与该第二关键词“碟中谍3”对应的网页URL的集合(包括与“碟中谍3”对应的各视频网站的URL);
之后,服务器根据上述“碟中谍4”对应的各视频网站的URL的排序结果,获取相应的排序参数(如“碟中谍4”在各视频网站的浏览次数),根据与“碟中谍4”相同的排序参数,对“碟中谍3”对应的各视频网站的URL进行排序;
之后,服务器将搜索到的“碟中谍4”对应的各视频网站的URL的排序结果(第一文档数据的排序结果)和“碟中谍3”对应的各视频网站的URL的排序结果(第二文档数据的排序结果)一起发送给用户终端,具体地,可以通过超文本传输协议(HTTP-Hypertexttransfer protocol,HTTP)应答将“碟中谍4”和“碟中谍3”对应的各视频网站的URL的排序结果一起展现在用户终端侧;
图2为“碟中谍4”和“碟中谍3”对应的各视频网站的URL的排序结果的展示图,如图2所示,通过用户终端侧的界面一起展示“碟中谍4”和“碟中谍3”对应的各视频网站的URL的排序结果;其中,“碟中谍4”在各视频网站的浏览次数的前三名为PPTV视频网站、搜狐视频网站和优酷视频网站,是用户欲搜索的结果;而“碟中谍3”在各视频网站的浏览次数的前三名为PPTV视频网站、搜狐视频网站和优酷视频网站;是基于用户欲搜索的结果,分析得到用户可能会感兴趣获取的搜索结果。
本实施例中,根据用户通过用户终端在服务器提供的搜索功能的界面中输入的关键词,一次性搜索得到用户欲搜索的结果和用户可能会感兴趣获取的搜索结果,并一起展现在用户终端侧,以便用户可以点击这些网页URL(网页链接)去访问欲搜索的网页和用户可能会感兴趣的网页;提高了搜索的有效性,用户体验度也较高。
需要说明的是,当第一文档数据的排序参数发生变更之后,相应的,第二文档数据的排序结果也发生变更;
仍然以第一关键词“碟中谍4”为例进行说明,当查询上述索引表,得到与“碟中谍4”有关的各影评网站的URL之后,若排序参数为“碟中谍4”在各影评网站的影评生成时间,则根据影评生成时间对上述搜索得到的与“碟中谍4”有关的各影评网站的URL进行排序;
对应地,与第二关键词“碟中谍3”有关的各影评网站的URL,也根据影评生成时间进行排序;
之后,服务器通过HTTP协议应答将搜索到的“碟中谍4”有关的各影评网站的URL的排序结果和“碟中谍3”有关的各影评网站的URL的排序结果一起展现在用户终端侧;图3为“碟中谍4”和“碟中谍3”对应的各影评网站的URL的排序结果的展示图,如图3所示,通过用户终端侧的界面一起展示“碟中谍4”和“碟中谍3”各影评网站的URL的排序结果。
本实施例中,第二文档数据的排序结果会根据第一文档数据的排序参数的变化进行相应的变化,体现了用户联动性的扩展搜索需求,提高了用户体验度。
图4为本发明实施例二提供的联动性扩展搜索装置的结构示意图;如图4所示,可以包括:
接收模块21,用于接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;
第一获取模块22,用于根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;
确定模块23,用于根据所述第一关键词,确定与所述第一关键词关联的第二关键词;
第二获取模块24,用于根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果。
其中,所述第一获取模块22具体用于:根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据;根据预设的排序参数对所述第一文档数据进行排序,得到所述第一文档数据的排序结果;
所述预设的排序参数包括所述第一文档数据的生成时间或浏览所述第一文档数据的次数。
其中,所述确定模块23具体用于:根据预设的规则将所述第一关键词进行扩展,获取第二关键词集合,其中,所述第二关键词集合中至少包括一个第二关键词;
其中,所述预设的规则包括:
字段匹配规则,即按照相关性取所述第一关键词中的字段作为推荐词,根据所述推荐词确定第二关键词集合;或者
基于统计的关联匹配规则,即根据所述用户终端的历史搜索记录查找相似类别的关键词作为推荐词,根据所述推荐词确定第二关键词集合。
其中,所述第二获取模块24具体用于:
根据所述第二关键词,搜索得到与所述第二关键词关联的第二文档数据;根据所述第一文档数据的排序结果,获取与所述第一文档数据的排序结果对应的排序参数;根据所述排序参数,对搜索得到的所述第二文档数据进行排序。
其中,所述的装置还包括:
发送模块25,用于将所述第一文档数据的排序结果和所述第二文档数据的排序结果一起发送给所述用户终端进行显示。
本发明实施例不仅考虑了用户欲搜索第一关键词与第一文档数据相关程度,还同时考虑了与该用户欲搜索第一关键词相关联的第二关键词,依此推测该用户可能会关注的第二关键词,并得到与该用户可能会关注的第二关键词相关联的第二文档数据,进一步地,本发明实施例可以根据用户欲搜索第一关键词得到与用户欲搜索第一关键词相关联的第一文档数据的排序结果,还可以根据与用户欲搜索第一关键词关联的第一文档数据的排序结果相同的排序参数,得到与用户可能会关注的第二关键词相关联的第二文档数据的排序结果。较现有技术,采用本发明实施例提供的所述方法得出的搜索结果的有效性更高。
图5为本发明实施例三提供的服务器的结构示意图,如图5所示,本实施例所述的服务器包括处理器31、存储器32和通信总线33,其中,处理器31通过通信总线33和存储器32连接,存储器32中保存有实现上述搜索数据处理方法的指令,当处理器31调用存储器32中的指令时,可以执行如下步骤:
接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;
根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;
根据所述第一关键词,确定与所述第一关键词关联的第二关键词;
根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果。
其中,根据所述第一关键词,搜索得到与所述第一关键词对应的第一文档数据的排序结果,包括:
根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据;
根据预设的排序参数对所述第一文档数据进行排序,得到所述第一文档数据的排序结果;
所述预设的排序参数包括所述第一文档数据的生成时间或浏览所述第一文档数据的次数。
其中,根据所述第一关键词,确定与所述第一关键词关联的第二关键词,包括:
根据预设的规则将所述第一关键词进行扩展,获取第二关键词集合,其中,所述第二关键词集合中至少包括一个第二关键词;
其中,所述预设的规则包括:
字段匹配规则,即按照相关性取所述第一关键词中的字段作为推荐词,根据所述推荐词确定第二关键词集合;或者
基于统计的关联匹配规则,即根据所述用户终端的历史搜索记录查找相似类别的关键词作为推荐词,根据所述推荐词确定第二关键词集合。
其中,所述根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果,包括:
根据所述第二关键词,搜索得到与所述第二关键词关联的第二文档数据;
根据所述第一文档数据的排序结果,获取与所述第一文档数据的排序结果对应的排序参数;
根据所述排序参数,对搜索得到的所述第二文档数据进行排序。
其中,还包括:
将所述第一文档数据的排序结果和所述第二文档数据的排序结果一起发送给所述用户终端进行显示。
本发明实施例不仅考虑了用户欲搜索第一关键词与第一文档数据相关程度,还同时考虑了与该用户欲搜索第一关键词相关联的第二关键词,依此推测该用户可能会关注的第二关键词,并得到与该用户可能会关注的第二关键词相关联的第二文档数据,进一步地,本发明实施例可以根据用户欲搜索第一关键词得到与用户欲搜索第一关键词相关联的第一文档数据的排序结果,还可以根据与用户欲搜索第一关键词关联的第一文档数据的排序结果相同的排序参数,得到与用户可能会关注的第二关键词相关联的第二文档数据的排序结果。较现有技术,采用本发明实施例提供的所述方法得出的搜索结果的有效性更高。
本发明实施例还提供一种联动性扩展搜索系统,包括:服务器和用户终端;
所述服务器为图5所示实施例提供的服务器,具体包括图4所示实施例提供的联动性扩展搜索装置;详细内容不再赘述。
所述用户终端,用于向服务器发送搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;以使所述服务器根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;根据所述第一关键词,确定与所述第一关键词关联的第二关键词;根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果;
所述用户终端,还用于展示服务器发送的第一文档数据的排序结果和第二文档数据的排序结果。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种联动性扩展搜索方法,其包括:
服务器接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;
根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;
根据所述第一关键词,确定与所述第一关键词关联的第二关键词;
根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果;
所述确定与所述第一关键词关联的第二关键词,包括:
所述服务器根据预设的规则将所述第一关键词进行扩展,获取第二关键词集合,其中,所述第二关键词集合中至少包括一个第二关键词;
其中,所述预设的规则包括:
字段匹配规则,即按照相关性取所述第一关键词中的字段作为推荐词,根据所述推荐词确定第二关键词集合;或者
基于统计的关联匹配规则,即根据所述用户终端的历史搜索记录查找相似类别的关键词作为推荐词,根据所述推荐词确定第二关键词集合。
2.根据权利要求1所述的方法,其中,根据所述第一关键词,搜索得到与所述第一关键词对应的第一文档数据的排序结果,包括:
所述服务器根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据;
根据预设的排序参数对所述第一文档数据进行排序,得到所述第一文档数据的排序结果;
所述预设的排序参数包括所述第一文档数据的生成时间或浏览所述第一文档数据的次数。
3.根据权利要求1所述的方法,其中,所述根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果,包括:
所述服务器根据所述第二关键词,搜索得到与所述第二关键词关联的第二文档数据;
根据所述第一文档数据的排序结果,获取与所述第一文档数据的排序结果对应的排序参数;
根据所述排序参数,对搜索得到的所述第二文档数据进行排序。
4.根据权利要求1-3任一项所述的方法,其中,还包括:
所述服务器将所述第一文档数据的排序结果和所述第二文档数据的排序结果一起发送给所述用户终端进行显示。
5.一种联动性扩展搜索装置,位于服务器侧,其中,包括:
接收模块,用于接收用户终端发送的搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;
第一获取模块,用于根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;
确定模块,用于根据所述第一关键词,确定与所述第一关键词关联的第二关键词;
第二获取模块,用于根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果;
所述确定模块具体用于:根据预设的规则将所述第一关键词进行扩展,获取第二关键词集合,其中,所述第二关键词集合中至少包括一个第二关键词;
其中,所述预设的规则包括:
字段匹配规则,即按照相关性取所述第一关键词中的字段作为推荐词,根据所述推荐词确定第二关键词集合;或者
基于统计的关联匹配规则,即根据所述用户终端的历史搜索记录查找相似类别的关键词作为推荐词,根据所述推荐词确定第二关键词集合。
6.根据权利要求5所述的装置,其中,所述第一获取模块具体用于:根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据;根据预设的排序参数对所述第一文档数据进行排序,得到所述第一文档数据的排序结果;
所述预设的排序参数包括所述第一文档数据的生成时间或浏览所述第一文档数据的次数。
7.根据权利要求5所述的装置,其中,所述第二获取模块具体用于:
根据所述第二关键词,搜索得到与所述第二关键词关联的第二文档数据;根据所述第一文档数据的排序结果,获取与所述第一文档数据的排序结果对应的排序参数;根据所述排序参数,对搜索得到的所述第二文档数据进行排序。
8.根据权利要求5-7任一项所述的装置,其中,还包括:
发送模块,用于将所述第一文档数据的排序结果和所述第二文档数据的排序结果一起发送给所述用户终端进行显示。
9.一种联动性扩展搜索系统,其中,包括:服务器和用户终端;
所述服务器包括如权利要求5-8任一项所述联动性扩展搜索装置;
所述用户终端,用于向服务器发送搜索请求,所述搜索请求携带有用户欲搜索的第一关键词;以使所述服务器根据所述第一关键词,搜索得到与所述第一关键词关联的第一文档数据的排序结果;根据所述第一关键词,确定与所述第一关键词关联的第二关键词;根据所述第二关键词,以及与所述第一文档数据的排序结果对应的排序参数,搜索得到第二文档数据的排序结果;
所述用户终端,还用于展示服务器发送的第一文档数据的排序结果和第二文档数据的排序结果。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310642395.0A CN103744856B (zh) | 2013-12-03 | 2013-12-03 | 联动性扩展搜索方法及装置、系统 |
PCT/CN2014/092134 WO2015081792A1 (zh) | 2013-12-03 | 2014-11-25 | 联动性和个性化扩展搜索方法及装置、系统 |
US15/101,693 US20160306887A1 (en) | 2013-12-03 | 2014-11-25 | Methods, apparatuses and systems for linked and personalized extended search |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310642395.0A CN103744856B (zh) | 2013-12-03 | 2013-12-03 | 联动性扩展搜索方法及装置、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103744856A CN103744856A (zh) | 2014-04-23 |
CN103744856B true CN103744856B (zh) | 2016-09-21 |
Family
ID=50501874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310642395.0A Expired - Fee Related CN103744856B (zh) | 2013-12-03 | 2013-12-03 | 联动性扩展搜索方法及装置、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103744856B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015081792A1 (zh) * | 2013-12-03 | 2015-06-11 | 北京奇虎科技有限公司 | 联动性和个性化扩展搜索方法及装置、系统 |
CN106096003B (zh) * | 2014-12-26 | 2019-12-20 | 奇飞翔艺(北京)软件有限公司 | 数据搜索方法及客户端 |
CN106156109B (zh) * | 2015-04-03 | 2020-09-04 | 阿里巴巴集团控股有限公司 | 一种搜索方法及装置 |
CN106708834A (zh) * | 2015-08-07 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 一种对象搜索方法、装置及服务器 |
CN105808685B (zh) * | 2016-03-02 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 推广信息的推送方法及装置 |
CN107153516B (zh) * | 2016-03-04 | 2020-07-14 | 富士施乐实业发展(中国)有限公司 | 智能打印方法及系统 |
CN107544995A (zh) * | 2016-06-27 | 2018-01-05 | 百度在线网络技术(北京)有限公司 | 一种用于提供搜索结果推荐信息的方法与设备 |
CN107396147A (zh) * | 2017-07-17 | 2017-11-24 | 环球智达科技(北京)有限公司 | 人物相关信息的推送方法 |
CN107426587A (zh) * | 2017-07-17 | 2017-12-01 | 环球智达科技(北京)有限公司 | 专题信息的推送方法 |
CN107277574A (zh) * | 2017-07-17 | 2017-10-20 | 环球智达科技(北京)有限公司 | 影片相关信息的推送方法 |
CN109145213B (zh) * | 2018-08-22 | 2020-07-28 | 清华大学 | 基于历史信息的查询推荐方法及装置 |
CN110889050A (zh) * | 2018-09-07 | 2020-03-17 | 北京搜狗科技发展有限公司 | 一种泛品牌词的挖掘方法及装置 |
CN109299328A (zh) * | 2018-12-03 | 2019-02-01 | 广州华多网络科技有限公司 | 一种视频搜索方法、服务器、客户端及存储介质 |
CN109726272A (zh) * | 2018-12-20 | 2019-05-07 | 杭州数梦工场科技有限公司 | 审计规则推荐方法及装置 |
CN111291265B (zh) * | 2020-02-10 | 2023-10-03 | 青岛聚看云科技有限公司 | 一种推荐信息生成方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101061478A (zh) * | 2004-09-30 | 2007-10-24 | Google公司 | 提供与文档相关的信息 |
CN102033955A (zh) * | 2010-12-24 | 2011-04-27 | 常华 | 扩展用户搜索结果的方法及服务器 |
CN102915380A (zh) * | 2012-11-19 | 2013-02-06 | 北京奇虎科技有限公司 | 用于对数据进行搜索的方法和系统 |
CN103221950A (zh) * | 2010-05-28 | 2013-07-24 | 崔镇根 | 扩展搜索词选择系统和用于选择扩展搜索词的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007328714A (ja) * | 2006-06-09 | 2007-12-20 | Hitachi Ltd | 文書検索装置及び文書検索プログラム |
-
2013
- 2013-12-03 CN CN201310642395.0A patent/CN103744856B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101061478A (zh) * | 2004-09-30 | 2007-10-24 | Google公司 | 提供与文档相关的信息 |
CN103221950A (zh) * | 2010-05-28 | 2013-07-24 | 崔镇根 | 扩展搜索词选择系统和用于选择扩展搜索词的方法 |
CN102033955A (zh) * | 2010-12-24 | 2011-04-27 | 常华 | 扩展用户搜索结果的方法及服务器 |
CN102915380A (zh) * | 2012-11-19 | 2013-02-06 | 北京奇虎科技有限公司 | 用于对数据进行搜索的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103744856A (zh) | 2014-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103744856B (zh) | 联动性扩展搜索方法及装置、系统 | |
US9229989B1 (en) | Using resource load times in ranking search results | |
US8484343B2 (en) | Online ranking metric | |
CN102693271B (zh) | 一种网络信息推荐方法及系统 | |
KR101527259B1 (ko) | 검색 질의에 응답하여 디스커션 스레드에 대한 포스트를 제공하는 방법 및 시스템 | |
CN102708174B (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
US11836167B2 (en) | Search suggestions based on native application history | |
US10185750B2 (en) | Synthesizing directories, domains, and subdomains | |
CN101025740B (zh) | 图片搜索结果自动播放方法 | |
CN103870461B (zh) | 主题推荐方法、装置和服务器 | |
US20100125781A1 (en) | Page generation by keyword | |
CN103617267B (zh) | 社交化扩展搜索方法及装置、系统 | |
CN106294648A (zh) | 一种针对页面访问路径的处理方法及装置 | |
CN105488205B (zh) | 页面生成方法和装置 | |
US9582590B2 (en) | Method and system for presenting a navigation path for enabling retrieval of content | |
CN104252348B (zh) | 一种基于浏览器的网页访问统计方法及装置 | |
CN104503988B (zh) | 搜索方法及装置 | |
TW200928815A (en) | System and method for history clustering | |
JP2008186452A (ja) | 検索システム及び検索方法 | |
CN104090757A (zh) | 针对浏览器的富媒体信息展示方法 | |
CN104090923A (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
WO2013013203A1 (en) | Redirecting information | |
US20160286420A1 (en) | Technique for data traffic analysis | |
US20150169700A1 (en) | Presenting secondary music search result links | |
CN106156024A (zh) | 一种信息处理方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160921 Termination date: 20211203 |