CN108345601B - 搜索结果排序方法及装置 - Google Patents

搜索结果排序方法及装置 Download PDF

Info

Publication number
CN108345601B
CN108345601B CN201710050714.7A CN201710050714A CN108345601B CN 108345601 B CN108345601 B CN 108345601B CN 201710050714 A CN201710050714 A CN 201710050714A CN 108345601 B CN108345601 B CN 108345601B
Authority
CN
China
Prior art keywords
search
search result
target
historical
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710050714.7A
Other languages
English (en)
Other versions
CN108345601A (zh
Inventor
吴云佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710050714.7A priority Critical patent/CN108345601B/zh
Priority to PCT/CN2018/071653 priority patent/WO2018133681A1/zh
Publication of CN108345601A publication Critical patent/CN108345601A/zh
Application granted granted Critical
Publication of CN108345601B publication Critical patent/CN108345601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索结果排序方法及装置,属于信息搜索技术领域。所述方法包括:获取搜索词所对应的搜索结果列表;获取搜索结果列表中的M个目标搜索结果的评分,M个目标搜索结果为搜索词的历史搜索结果,每个历史搜索结果的评分为根据历史搜索结果的阅读时长确定的评分,每个历史搜索结果的评分与历史搜索结果的阅读时长呈正相关关系;M为大于等于1的整数;根据M个目标搜索结果的评分调整M个目标搜索结果在搜索结果列表中的排序;评分越高的目标搜索结果在搜索结果列表中的排序越前;解决了现有技术中搜索客户端展示的搜索结果列表中排名靠前的搜索结果的点击率较低的问题;达到了可以提高搜索结果列表中靠前的搜索结果的点击率的效果。

Description

搜索结果排序方法及装置
技术领域
本发明实施例涉及信息搜索技术领域,特别涉及一种搜索结果排序方法及装置。
背景技术
在日常生活中,用户经常需要使用搜索客户端进行信息搜索。
现有技术中,服务器在接收到搜索客户端发送的搜索词之后,获取搜索词所对应的搜索结果列表;之后根据DBN(Dynamic Bayesian Network,动态贝叶斯网络)点击模型中的用户满意的历史搜索结果,调整搜索结果列表中的搜索结果的顺序;返回调整后的搜索结果列表至搜索客户端。
然而,由于DBN点击模型是假设用户在搜索结果列表中最后点击的搜索结果是用户满意的搜索结果,但是实际实现时,搜索结果列表中可能包括多个用户满意的结果或者并不包括用户满意的结果,因此上述DBN点击模型中确定的用户满意的历史搜索结果并不准确,服务器在根据该DBN点击模型调整搜索结果列表之后,搜索结果列表中靠前的搜索结果并不一定是用户满意的结果,也即上述方案中搜索结果列表中靠前的搜索结果的点击率较低。
发明内容
为了解决现有技术中存在的问题,本发明实施例提供了一种搜索结果排序方法及装置。技术方案如下:
根据本发明实施例的第一方面,提供一种搜索结果排序方法,该方法包括:
获取搜索词所对应的搜索结果列表;
获取所述搜索结果列表中的M个目标搜索结果的评分,所述M个目标搜索结果为所述搜索词的历史搜索结果,每个历史搜索结果的评分为根据所述历史搜索结果的阅读时长确定的,每个历史搜索结果的评分与所述历史搜索结果的阅读时长呈正相关关系;M为大于等于1的整数;
根据所述M个目标搜索结果的评分调整所述M个目标搜索结果在所述搜索结果列表中的排序;评分越高的目标搜索结果在所述搜索结果列表中的排序越前。
根据本发明实施例的第二方面,提供一种搜索结果排序装置,该装置包括:
第一获取模块,用于获取搜索词所对应的搜索结果列表;
第二获取模块,用于获取所述搜索结果列表中的M个目标搜索结果的评分,所述M个目标搜索结果为所述搜索词的历史搜索结果,每个历史搜索结果的评分为根据所述历史搜索结果的阅读时长确定的评分,每个历史搜索结果的评分与所述历史搜索结果的阅读时长呈正相关关系;M为大于等于1的整数;
调整模块,用于根据所述M个目标搜索结果的评分调整所述M个目标搜索结果在所述搜索结果列表中的排序;评分越高的目标搜索结果在所述搜索结果列表中的排序越前。
本发明实施例提供的技术方案带来的有益效果是:
通过在获取到搜索结果列表之后,获取搜索结果列表中的M个目标搜索结果,然后根据M个目标搜索结果的评分调整M个目标搜索结果在搜索结果列表中的排序,其中,评分越高的目标搜索结果在搜索结果列表中的排序越前,这样搜索客户端在展示搜索结果列表时,可以将评分较高的目标搜索结果也即用户可能满意的搜索结果排在靠前的位置;解决了现有技术中搜索客户端展示的搜索结果列表中排名靠前的搜索结果的点击率较低的问题;达到了可以提高搜索结果列表中靠前的搜索结果的点击率的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明各个实施例所涉及的实施环境的示意图;
图2是本发明一个实施例提供的搜索结果排序方法的流程图;
图3是本发明另一个实施例提供的搜索结果排序方法的流程图;
图4是本发明另一实施例中提供的调整搜索结果列表中的搜索结果的顺序的示意图;
图5是本发明另一实施例中提供的生成结果模型的示意图;
图6是本发明一个实施例提供的搜索结果排序装置的示意图;
图7是本发明一个实施例提供的服务器的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
请参考图1,其示出了本发明各个实施例所涉及的实施环境的示意图,如图1所示,该实施环境包括搜索客户端110和服务器120。
搜索客户端110可以为浏览器、购物客户端以及社交应用客户端之类的可以信息搜索的搜索客户端。实际实现时,该搜索客户端110可以运行在终端中,终端通过有线或者无线网络与服务器120连接。
服务器120是指用于为搜索客户端110提供后台服务的服务器,该服务器120可以为一台服务器,也可以为由多台服务器组成的服务器集群,对此并不做限定。
下述各个实施例提供的搜索结果排序方法可以用于图1所示的搜索客户端110中,也可以用于服务器120中。并且,当用于搜索客户端110中时,搜索客户端110获取搜索词所对应的搜索结果列表,是指搜索客户端110接收服务器120返回的该搜索结果列表;而当用于服务器120中时,服务器120获取搜索词所对应的搜索结果列表是指服务器120根据搜索词搜索各个相关的搜索结果,并根据各个搜索结果生成搜索结果列表,本实施例对此并不做限定,并且下述各个实施例除特殊说明外,均以该搜索结果排序方法用于服务器120中来举例说明。
请参考图2,其示出了本发明一个实施例提供的搜索结果排序方法的方法流程图,如图2所示,该搜索结果排序方法可以包括:
步骤201,获取搜索词所对应的搜索结果列表。
搜索结果列表中可以包括该搜索词所对应的各个搜索结果。实际实现时,搜索结果列表中的各个搜索结果可以按照与搜索词的相关性进行排序,比如,按照与搜索词相关性由高到低的顺序排序,在此不再赘述。
步骤202,获取搜索结果列表中的M个目标搜索结果。
M个目标搜索结果为历史搜索该搜索词时的历史搜索结果,每个历史搜索结果的评分为根据历史搜索结果的阅读时长确定的评分,每个历史搜索结果的评分与历史搜索结果的阅读时长呈正相关关系;M为大于等于1的整数。
步骤203,根据M个目标搜索结果的评分调整M个目标搜索结果在搜索结果列表中的排序。
评分越高的目标搜索结果在搜索结果列表中的排序越前。
综上所述,本实施例提供的搜索结果排序方法,通过在获取到搜索结果列表之后,获取搜索结果列表中的M个目标搜索结果,然后根据M个目标搜索结果的评分调整M个目标搜索结果在搜索结果列表中的排序,其中,评分越高的目标搜索结果在搜索结果列表中的排序越前,这样搜索客户端在展示搜索结果列表时,可以将评分较高的目标搜索结果也即用户可能满意的搜索结果排在靠前的位置;解决了现有技术中搜索客户端展示的搜索结果列表中排名靠前的搜索结果的点击率较低的问题;达到了可以提高搜索结果列表中靠前的搜索结果的点击率的效果。
同时,由于调整后的搜索结果列表中靠前的搜索结果的评分较高,也即靠前的搜索结果通常是用户比较满意的搜索结果,因此,这就使得用户在搜索客户端展示的搜索结果列表中查找自己需要的搜索结果时,用户可以很容易的查找得到,提高了用户的信息查询效率。
请参考图3,其示出了本发明一个实施例提供的搜索结果排序方法的方法流程图,如图3所示,该搜索结果排序方法可以包括:
步骤301,获取搜索词所对应的搜索结果列表。
服务器接收到搜索客户端发送的搜索词之后,可以搜索该搜索词所对应的搜索结果列表。其中,搜索结果列表中可以包括该搜索词所对应的各个搜索结果。实际实现时,搜索结果列表中的各个搜索结果可以按照与搜索词的相关性进行排序,比如,按照与搜索词相关性由高到低的顺序排序,在此不再赘述。
步骤302,获取搜索结果列表中历史被搜索到的各个搜索结果。
服务器中可以保存有历史搜索该搜索词时的各个历史搜索结果以及每个历史搜索结果列表的评分,对于本次搜索结果列表中的每个搜索结果,服务器可以检测该搜索结果是否是历史搜索该搜索词时搜索到的搜索结果,若是,则提取该搜索结果,反之,则不提取,对此并不做限定。
比如,搜索结果列表中包括doc1、doc2、…docn,其中,doc3、doc7、doc8、…、docj是历史搜索到的搜索结果,则服务器获取到的各个搜索结果分别为doc3、doc7、doc8、…、docj。其中,n为正整数,j为小于等于n的正整数。
实际实现时,服务器中可以保存有结果模型,该结果模型中包括历史搜索该搜索词时的各个搜索结果以及每个搜索结果的评分,此时,对于本次获取到的搜索结果列表中的每个搜索结果,服务器可以检测该搜索结果是否属于结果模型,若属于,则提取该搜索结果,反之,则不提取,本实施例对此并不做限定。
需要说明的是,本实施例所说的历史搜索的搜索词是指与步骤301中的搜索词相似度高于目标阈值的搜索词,也即两者可以相似也可以完全相同,本实施例对此并不做限定。其中,目标阈值可以为系统默认的数值,对此也不做限定。
步骤303,选择获取到的搜索结果中满足预设条件的搜索结果,并得到M个目标搜索结果。
其中,预设条件包括:评分高于预设分数,或者,按照评分由高到低的顺序排序时排名在前M位。
预设分数可以为系统默认的分数,对此并不做限定。
以预设条件包括评分高于预设分数为例,服务器可以根据预先存储的各个搜索结果的评分获取步骤302中获取到的各个搜索结果的评分,然后选择其中评分高于预设分数的搜索结果。
需要说明的是,本实施例只是以选择获取到的搜索结果中满足预设条件的搜索结果为例,实际实现时,服务器还可以将获取到的各个搜索结果直接作为M个目标搜索结果,本实施例对此并不做限定。
步骤304,根据M个目标搜索结果的评分将M个目标搜索结果按照评分由高到低的顺序排序。
步骤305,按照排序后的顺序依次遍历每个目标搜索结果,将搜索结果列表中的目标搜索结果与搜索结果列表中的候选搜索结果交换位置,候选搜索结果为非目标搜索结果且在搜索结果列表中排序在目标搜索结果之前。
在遍历每个目标搜索结果时,服务器可以检测搜索结果列表中在该目标搜索结果之前是否存在未被交换过位置的候选搜索结果,若包含,则交换两者的位置,而若检测结果为不包含,则继续遍历下一个目标搜索结果。
可选地,候选搜索结果可以为搜索结果列表中在目标搜索结果之前且不是M个目标搜索结果中的一个的第一个搜索结果。比如,请参考图4,服务器可以将doc3与doc1交换位置、doc7与doc2交换位置、doc8与doc4交换位置等等。
实际实现时,在遍历各个目标搜索结果的过程中,服务器可以统计已交换位置的目标搜索结果的条数;当已交换位置的目标搜索结果的条数达到预设阈值时,结束遍历。而若已交换位置的目标搜索结果的条数未达到预设阈值,则继续遍历,在此不再赘述。其中,预设阈值为系统默认的数值,比如,为3-8之间的数值,对此并不做限定。
通过在交换位置的目标搜索结果的条数达到预设阈值时,结束遍历,达到了最新的搜索结果仍然可以排在搜索结果列表中比较靠前的位置,提高了用户获取最新搜索结果的获取效率。
在将目标搜索结果和候选搜索结果交换位置之后,可以为交换后的目标搜索结果所在的位置也即交换前的候选搜索结果所在的位置设置标记信息,该标记信息用于表示该位置的搜索结果为交换位置后的目标搜索结果。这样,服务器即可通过判断用户点击的搜索结果的位置是否设置有标记信息来判断用户选择的搜索结果是否通过结果模型调前的搜索结果,进而判断是否需要优化结果模型。
在调整搜索结果列表中的M个目标搜索结果的排序之后,服务器可以返回调整后的搜索结果列表至搜索客户端,相应的,搜索客户端可以接收调整后的搜索结果列表,并显示调整后的搜索结果列表。
实验证明,通过上述方式返回调整后的搜索结果列表至搜索客户端之后,搜索结果列表中前5位搜索结果被用户选择的概率提高了6.04%,而前10位搜索结果被用户选择的概率提高了3.92%。
综上所述,本实施例提供的搜索结果排序方法,通过在获取到搜索结果列表之后,获取搜索结果列表中的M个目标搜索结果,然后根据M个目标搜索结果的评分调整M个目标搜索结果在搜索结果列表中的排序,其中,评分越高的目标搜索结果在搜索结果列表中的排序越前,这样搜索客户端在展示搜索结果列表时,可以将评分较高的目标搜索结果也即用户可能满意的搜索结果排在靠前的位置;解决了现有技术中搜索客户端展示的搜索结果列表中排名靠前的搜索结果的点击率较低的问题;达到了可以提高搜索结果列表中靠前的搜索结果的点击率的效果。
同时,由于调整后的搜索结果列表中靠前的搜索结果的评分较高,也即靠前的搜索结果通常是用户比较满意的搜索结果,因此,这就使得用户在搜索客户端展示的搜索结果列表中查找自己需要的搜索结果时,用户可以很容易的查找得到,提高了用户的信息查询效率。
需要说明的是,在步骤302之前,该搜索结果排序方法还可以包括如下步骤:
第一,对于历史搜索各个搜索词时的每个历史搜索结果,获取历史搜索结果每次被阅读的阅读时长;根据阅读时长计算历史搜索结果的评分。
服务器每次搜索时,可以生成并保存搜索日志和点击日志。其中,搜索日志中包括用于唯一标识本次搜索的标识信息如search_id以及本次搜索的搜索结果列表中的各个搜索结果的标识信息如docid。点击日志中包括用于唯一标识本次搜索的标识信息以及用户在搜索客户端中执行的各种操作的操作记录;其中,操作记录可以包括session集合,该session集合包括用户一次搜索过程中,所有的搜索和点击行为的集合。比如,session集合中包括用户输入搜索词的输入记录;接收到服务器返回的搜索结果列表之后,点击搜索结果列表中的某一搜索结果的点击记录;退出已点击的搜索结果的退出记录等等。
服务器可以根据保存的搜索日志以及点击日志获取历史搜索结果每次被阅读的阅读时长。可选地,服务器可以根据每次搜索的搜索日志确定search_id以及对应的各个docid;然后根据相同search_id的点击日志中的session集合,确定每个docid的退出记录的时间与点击记录的时间的时间差,将确定的时间差作为该docid的搜索结果在此次搜索时的阅读时长。
实际实现时,若服务器多次搜索该搜索词时,多次搜索到某一搜索结果,则服务器可以通过上述方法计算得到该搜索结果在每次搜索时的阅读时长。
在服务器获取到搜索结果的阅读时长之后,服务器可以根据该阅读时长计算该搜索结果的评分。其中,搜索结果的评分与阅读时长呈正相关关系。其计算方式如下:评分为log(1+readtime/600),又比如,评分为k*readtime。其中,readtime为计算得到的阅读时长,k为正数。当然实际实现时,服务器还可以通过其他计算方式来计算评分,对此并不做限定。
在实际计算过程中,若某一搜索结果在多次搜索时均包含,则服务器可以先计算该搜索结果在每次搜索时被阅读的阅读时长,计算各个阅读时长的平均值,然后根据该平均值计算该搜索结果的评分。当然,对于获取到的每个阅读时长,服务器还可以根据每个阅读时长分别计算评分,然后再根据各个评分最终计算得到该搜索结果的评分。比如,将计算得到的各个评分的平均值作为该搜索结果的评分,或者,将计算得到的各个评分的中间值作为该搜索结果的评分,本实施例对此并不做限定。
上述只是以服务器根据阅读时长来计算搜索结果的评分为例,实际实现时,服务器还可以根据阅读时长和位置排名同时计算评分,也即服务器根据阅读时长计算评分的步骤可以包括:
(1)、对于历史搜索各个搜索词时的每个历史搜索结果,获取历史搜索结果在搜索结果列表中的位置排名。
服务器在每次搜索时,可以生成并保存展现日志,展现日志中包括用于唯一标识本次搜索的标识信息以及按照各个搜索结果与搜索词的相关性排序后的搜索结果列表。
服务器可以查询相同search_id的展现日志,获取docid在该展现日志的搜索结果列表中的排序,将排序作为该搜索结果的位置排名。比如,某一搜索结果在搜索结果列表中排在第一位,则该搜索结果的位置排名为“1”;而若某一搜索结果在搜索结果列表中排在第四位,则该搜索结果的位置排名为“4”。
可选地,与阅读时长类似,若某一搜索结果在多次搜索时均搜索到,则服务器可以获取得到该搜索结果的多个位置排名。
(2)、根据阅读时长以及位置排名计算历史搜索结果的评分。
评分与阅读时长呈正相关关系而与位置排名呈负相关关系,这也就是说,搜索结果的阅读时长越长,该搜索结果的评分越高;搜索结果的排名越靠前,该搜索结果的评分越低。比如,评分为log(1+log(1+pos))*(1+readtime/600)。其中,pos为位置排名,readtime为阅读时长。
可选地,若该搜索结果在多次搜索时均搜索得到,则服务器还可以计算获取到的各个阅读时长的平均值以及各个位置排名的平均位置排名,然后根据平均阅读时长和平均位置排名计算该搜索结果的评分。可选地,服务器还可以根据每次搜索得到的搜索结果的阅读时长和位置排名分别计算评分;然后计算各个评分的平均值,将计算得到的平均值作为该搜索结果的评分;或者,选择各个评分中的中间值,将选择得到的中间值作为该搜索结果的评分。
需要补充说明的第一点是,服务器可以每隔预定时间段根据之前的预定时间段内的各个历史搜索结果来计算各个历史搜索结果的评分,对此并不做限定。
需要补充说明的第二点是,上述只是以通过上述计算方式计算各个搜索结果的评分为例,可选地,服务器还可以通过其他计算方式计算评分,本实施例对此并不做限定。
需要补充说明的第三点是,在计算某一历史搜索结果的评分之前,服务器还可以检测该历史搜索结果中是否包含敏感词,若包含敏感词,则服务器可以过滤掉该历史搜索结果。其中,敏感词可以为色情词语、反动词语等等,对此并不做限定。比如,请参考图5,在获取到搜索词的点击日志中的session集合之后,可以通过session filter过滤包含敏感词的历史搜索结果所对应的session,然后根据过滤后的session计算每个历史搜索结果的评分。
第二,保存计算得到的各个历史搜索结果的评分。
在计算得到各个历史搜索结果的评分之后,可以将各个历史搜索结果的评分进行合并,进而得到搜索某一搜索词时的各个历史搜索结果的评分。可选地,服务器还可以生成包括各个历史搜索结果以及每个历史搜索结果的评分的结果模型。比如,结合图5,服务器可以得到历史搜索该搜索词时的各个历史搜索结果的评分模型。
实际实现时,当该搜索结果排序方法用于搜索客户端时,搜索客户端可以从服务器中获取各个历史搜索结果的评分,可选地,搜索客户端可以采用类似的方法计算各个历史搜索结果的评分(搜索客户端可以从服务器中获取计算过程中需要的搜索日志、点击日志和展现日志,对此并不做限定)。并且,相对于搜索客户端计算的各个历史搜索结果的评分,由于服务器可以根据全网中所有用户搜索各个搜索词时的历史搜索结果进行计算,因此,其计算得到的各个历史搜索结果的准确度较高。
请参考图6,其示出了本发明一个实施例提供的搜索结果排序装置的结果示意图,如图6所示,该搜索结果排序装置可以包括:第一获取模块610、第二获取模块620和调整模块630。
第一获取模块610,用于获取搜索词所对应的搜索结果列表;
第二获取模块620,用于获取所述搜索结果列表中的M个目标搜索结果的评分,所述M个目标搜索结果为所述搜索词的历史搜索结果,每个历史搜索结果的评分为根据所述历史搜索结果的阅读时长确定的评分,每个历史搜索结果的评分与所述历史搜索结果的阅读时长呈正相关关系;M为大于等于1的整数;
调整模块630,用于根据所述M个目标搜索结果的评分调整所述M个目标搜索结果在所述搜索结果列表中的排序;评分越高的目标搜索结果在所述搜索结果列表中的排序越前。
综上所述,本实施例提供的搜索结果排序装置,通过在获取到搜索结果列表之后,获取搜索结果列表中的M个目标搜索结果,然后根据M个目标搜索结果的评分调整M个目标搜索结果在搜索结果列表中的排序,其中,评分越高的目标搜索结果在搜索结果列表中的排序越前,这样搜索客户端在展示搜索结果列表时,可以将评分较高的目标搜索结果也即用户可能满意的搜索结果排在靠前的位置;解决了现有技术中搜索客户端展示的搜索结果列表中排名靠前的搜索结果的点击率较低的问题;达到了可以提高搜索结果列表中靠前的搜索结果的点击率的效果。
基于上述实施例提供的搜索结果排序装置,可选的,所述调整模块630,包括:
排序单元,用于根据所述M个目标搜索结果的评分将所述M个目标搜索结果按照评分由高到低的顺序排序;
调整单元,用于按照排序后的顺序依次遍历每个目标搜索结果,将所述搜索结果列表中的所述目标搜索结果与所述搜索结果列表中的候选搜索结果交换位置,所述候选搜索结果为非目标搜索结果且在所述搜索结果列表中排序在所述目标搜索结果之前。
可选的,所述装置还包括:
统计模块,用于在遍历各个目标搜索结果的过程中,统计已交换位置的目标搜索结果的条数;
结束模块,用于在所述统计模块统计得到的已交换位置的目标搜索结果的条数达到预设阈值时,结束遍历。
可选的,所述第二获取模块620,还用于:
获取所述搜索结果列表中历史被搜索到的各个搜索结果;
选择获取到的所述搜索结果中满足预设条件的搜索结果,并得到所述M个目标搜索结果;所述预设条件包括:评分高于预设分数,或者,按照评分由高到低的顺序排序时排名在前M位。
可选的,所述装置还包括:
第三获取模块,用于对于历史搜索所述搜索词时的每个历史搜索结果,获取所述历史搜索结果每次被阅读的阅读时长;计算模块,用于根据所述阅读时长计算所述历史搜索结果的评分;
保存模块,用于保存计算得到的各个历史搜索结果的评分。
可选的,所述计算模块,还用于:
对于历史搜索所述搜索词时的每个历史搜索结果,获取所述历史搜索结果在搜索结果列表中的位置排名;
根据所述阅读时长以及所述位置排名计算所述历史搜索结果的评分。
需要说明的是:上述实施例提供的搜索结果排序装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器的内部结果划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的搜索结果排序装置和搜索结果排序方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。该计算机可读存储介质存储有一个或者一个以上程序,该一个或者一个以上程序被一个或者一个以上的处理器用来执行上述搜索结果排序方法。
请参考图7,其示出了本发明一个实施例提供的服务器的结果示意图。该服务器用于实施上述实施例中提供的关于服务器侧的搜索结果排序方法。具体来讲:
所述服务器700包括中央处理单元(CPU)701、包括随机存取存储器(RAM)702和只读存储器(ROM)703的系统存储器704,以及连接系统存储器704和中央处理单元701的系统总线705。所述服务器700还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)706,和用于存储操作系统713、应用程序714和其他程序模块715的大容量存储设备707。
所述基本输入/输出系统706包括有用于显示信息的显示器708和用于用户输入信息的诸如鼠标、键盘之类的输入设备709。其中所述显示器708和输入设备709都通过连接到系统总线705的输入输出控制器710连接到中央处理单元701。所述基本输入/输出系统706还可以包括输入输出控制器710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器710还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备707通过连接到系统总线705的大容量存储控制器(未示出)连接到中央处理单元701。所述大容量存储设备707及其相关联的计算机可读介质为服务器700提供非易失性存储。也就是说,所述大容量存储设备707可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结果、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器704和大容量存储设备707可以统称为存储器。
根据本发明的各种实施例,所述服务器700还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器700可以通过连接在所述系统总线705上的网络接口单元711连接到网络712,或者说,也可以使用网络接口单元711来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于执行上述搜索结果排序方法的指令。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”(“a”、“an”、“the”)旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种搜索结果排序方法,其特征在于,所述方法包括:
获取搜索词所对应的搜索结果列表;
根据结果模型,获取所述搜索结果列表中历史被搜索到的各个搜索结果,所述结果模型包括历史搜索所述搜索词时的各个搜索结果以及每个搜索结果的评分;
获取所述搜索结果列表中的M个目标搜索结果的评分,所述M个目标搜索结果为与所述搜索词相似度高于目标阈值的历史搜索词的历史搜索结果,每个历史搜索结果的评分为根据所述历史搜索结果的阅读时长确定的,每个历史搜索结果的评分与所述历史搜索结果的阅读时长呈正相关关系;M为大于等于1的整数;
根据所述M个目标搜索结果的评分将所述M个目标搜索结果按照评分由高到低的顺序排序;
按照排序后的顺序依次遍历每个目标搜索结果,在遍历每个目标搜索结果时,检测所述搜索结果列表中在所述目标搜索结果之前是否存在未被交换过位置的候选搜索结果,若包含,则交换两者的位置,而若检测结果为不包含,则继续遍历下一个目标搜索结果,所述候选搜索结果为非目标搜索结果且在所述搜索结果列表中排序在所述目标搜索结果之前;评分越高的目标搜索结果在所述搜索结果列表中的排序越前;
其中,在遍历各个目标搜索结果的过程中,统计已交换位置的目标搜索结果的条数;
当已交换位置的目标搜索结果的条数达到预设阈值时,结束遍历。
2.根据权利要求1所述的方法,其特征在于,所述获取所述搜索结果列表中的M个目标搜索结果的评分,包括:
选择获取到的所述搜索结果中满足预设条件的搜索结果,并得到所述M个目标搜索结果;所述预设条件包括:评分高于预设分数,或者,按照评分由高到低的顺序排序时排名在前M位。
3.根据权利要求1至2任一所述的方法,其特征在于,所述方法还包括:
对于历史搜索所述搜索词时的每个历史搜索结果,获取所述历史搜索结果每次被阅读的阅读时长;根据所述阅读时长计算所述历史搜索结果的评分;
保存计算得到的各个历史搜索结果的评分。
4.根据权利要求3所述的方法,其特征在于,所述对于历史搜索所述搜索词时的每个历史搜索结果,获取所述历史搜索结果每次被阅读的阅读时长,包括:
对于历史搜索所述搜索词时的每个历史搜索结果,获取每次搜索时生成并保存的搜索日志和点击日志,所述搜索日志包括每次搜索的搜索标识和搜索到的各搜索结果的结果标识,所述点击日志包括每次搜索的搜索标识和过程中的操作记录;
根据所述搜索日志和所述点击日志,获取所述历史搜索结果每次被阅读的阅读时长。
5.根据权利要求3所述的方法,其特在于,所述根据所述阅读时长计算所述历史搜索结果的评分,包括:
对于历史搜索所述搜索词时的每个历史搜索结果,获取所述历史搜索结果在搜索结果列表中的位置排名;
根据所述阅读时长以及所述位置排名计算所述历史搜索结果的评分。
6.一种搜索结果排序装置,其特征在于,所述装置包括:
第一获取模块,用于获取搜索词所对应的搜索结果列表;
第二获取模块,用于根据结果模型,获取所述搜索结果列表中历史被搜索到的各个搜索结果,所述结果模型包括历史搜索所述搜索词时的各个搜索结果以及每个搜索结果的评分;获取所述搜索结果列表中的M个目标搜索结果的评分,所述M个目标搜索结果为与所述搜索词相似度高于目标阈值的历史搜索词的历史搜索结果,每个历史搜索结果的评分为根据所述历史搜索结果的阅读时长确定的,每个历史搜索结果的评分与所述历史搜索结果的阅读时长呈正相关关系;M为大于等于1的整数;
排序单元,用于根据所述M个目标搜索结果的评分将所述M个目标搜索结果按照评分由高到低的顺序排序;
调整单元,用于按照排序后的顺序依次遍历每个目标搜索结果,将所述搜索结果列表中的所述目标搜索结果与所述搜索结果列表中的候选搜索结果交换位置,所述候选搜索结果为非目标搜索结果且在所述搜索结果列表中排序在所述目标搜索结果之前;评分越高的目标搜索结果在所述搜索结果列表中的排序越前;
装置还包括:统计模块,用于在遍历各个目标搜索结果的过程中,统计已交换位置的目标搜索结果的条数;
结束模块,用于在所述统计模块统计得到的已交换位置的目标搜索结果的条数达到预设阈值时,结束遍历。
7.根据权利要求6所述的装置,其特征在于,所述第二获取模块,还用于:
选择获取到的所述搜索结果中满足预设条件的搜索结果,并得到所述M个目标搜索结果;所述预设条件包括:评分高于预设分数,或者,按照评分由高到低的顺序排序时排名在前M位。
8.根据权利要求6至7任一所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于对于历史搜索所述搜索词时的每个历史搜索结果,获取所述历史搜索结果每次被阅读的阅读时长;计算模块,用于根据所述阅读时长计算所述历史搜索结果的评分;
保存模块,用于保存计算得到的各个历史搜索结果的评分。
9.根据权利要求8所述的装置,其特征在于,所述第三获取模块,还用于对于历史搜索所述搜索词时的每个历史搜索结果,获取每次搜索时生成并保存的搜索日志和点击日志,所述搜索日志包括每次搜索的搜索标识和搜索到的各搜索结果的结果标识,所述点击日志包括每次搜索的搜索标识和过程中的操作记录;根据所述搜索日志和所述点击日志,获取所述历史搜索结果每次被阅读的阅读时长。
10.根据权利要求8所述的装置,其特征在于,所述计算模块,还用于:
对于历史搜索所述搜索词时的每个历史搜索结果,获取所述历史搜索结果在搜索结果列表中的位置排名;
根据所述阅读时长以及所述位置排名计算所述历史搜索结果的评分。
11.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至5任一项权利要求所述的搜索结果排序方法。
12.一种存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至5任一权利要求所述的搜索结果排序方法。
CN201710050714.7A 2017-01-23 2017-01-23 搜索结果排序方法及装置 Active CN108345601B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710050714.7A CN108345601B (zh) 2017-01-23 2017-01-23 搜索结果排序方法及装置
PCT/CN2018/071653 WO2018133681A1 (zh) 2017-01-23 2018-01-05 搜索结果排序方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710050714.7A CN108345601B (zh) 2017-01-23 2017-01-23 搜索结果排序方法及装置

Publications (2)

Publication Number Publication Date
CN108345601A CN108345601A (zh) 2018-07-31
CN108345601B true CN108345601B (zh) 2020-11-20

Family

ID=62909088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710050714.7A Active CN108345601B (zh) 2017-01-23 2017-01-23 搜索结果排序方法及装置

Country Status (2)

Country Link
CN (1) CN108345601B (zh)
WO (1) WO2018133681A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110874777A (zh) * 2018-08-30 2020-03-10 北京嘀嘀无限科技发展有限公司 一种订单处理方法及装置
CN110674400B (zh) * 2019-09-18 2022-05-10 北京字节跳动网络技术有限公司 排序方法、装置、电子设备及计算机可读存储介质
CN111061954B (zh) * 2019-12-19 2022-03-15 腾讯音乐娱乐科技(深圳)有限公司 搜索结果排序方法、装置及存储介质
CN111274502A (zh) * 2020-01-19 2020-06-12 珠海格力电器股份有限公司 搜索排序方法、装置、计算机设备和存储介质
CN111475678B (zh) * 2020-03-17 2023-10-27 聚好看科技股份有限公司 推送搜索结果的方法、服务器及终端
CN112000871A (zh) * 2020-08-21 2020-11-27 北京三快在线科技有限公司 确定搜索结果列表的方法、装置、设备及存储介质
CN112100528B (zh) * 2020-09-09 2024-06-28 北京三快在线科技有限公司 对搜索结果评分模型进行训练的方法、装置、设备、介质
CN112231545B (zh) * 2020-09-30 2023-12-22 北京三快在线科技有限公司 聚块集合的排序方法、装置、设备及存储介质
CN113434661A (zh) * 2021-06-29 2021-09-24 平安科技(深圳)有限公司 公文拟稿提示方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04311263A (ja) * 1991-04-09 1992-11-04 Fuji Xerox Co Ltd 電子辞書検索装置
CN101183364A (zh) * 2006-11-24 2008-05-21 腾讯科技(深圳)有限公司 一种信息搜索方法、搜索引擎客户端/服务器及系统
CN103106234A (zh) * 2012-11-07 2013-05-15 无锡成电科大科技发展有限公司 一种网页内容搜索方法和装置
CN105930376A (zh) * 2016-04-12 2016-09-07 广东欧珀移动通信有限公司 一种搜索方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法
CN105373570B (zh) * 2014-09-02 2020-09-15 中兴通讯股份有限公司 一种浏览器历史记录的管理方法及终端
CN104462573B (zh) * 2014-12-29 2019-04-12 北京奇艺世纪科技有限公司 一种视频搜索结果展示方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04311263A (ja) * 1991-04-09 1992-11-04 Fuji Xerox Co Ltd 電子辞書検索装置
CN101183364A (zh) * 2006-11-24 2008-05-21 腾讯科技(深圳)有限公司 一种信息搜索方法、搜索引擎客户端/服务器及系统
CN103106234A (zh) * 2012-11-07 2013-05-15 无锡成电科大科技发展有限公司 一种网页内容搜索方法和装置
CN105930376A (zh) * 2016-04-12 2016-09-07 广东欧珀移动通信有限公司 一种搜索方法和装置

Also Published As

Publication number Publication date
CN108345601A (zh) 2018-07-31
WO2018133681A1 (zh) 2018-07-26

Similar Documents

Publication Publication Date Title
CN108345601B (zh) 搜索结果排序方法及装置
US20190026268A1 (en) Associating still images and videos
TW202007178A (zh) 用戶特徵的生成方法、裝置、設備及儲存介質
US8566303B2 (en) Determining word information entropies
US20130110829A1 (en) Method and Apparatus of Ranking Search Results, and Search Method and Apparatus
EP2407897A1 (en) Device for determining internet activity
CN111126495B (zh) 模型训练方法、信息预测方法、装置、存储介质及设备
US20190354638A1 (en) Action indicators for search operation output elements
CN111061954B (zh) 搜索结果排序方法、装置及存储介质
US20150234883A1 (en) Method and system for retrieving real-time information
CN116823409B (zh) 一种基于目标搜索数据的智能筛选方法及系统
EP3485394B1 (en) Contextual based image search results
CN111177568B (zh) 基于多源数据的对象推送方法、电子装置及存储介质
CN113407773A (zh) 一种短视频智能推荐方法、系统、电子设备及存储介质
CN113568940B (zh) 数据查询的方法、装置、设备以及存储介质
WO2013110357A1 (en) Social network analysis
CN112487283A (zh) 训练模型的方法、装置、电子设备及可读存储介质
CN113592036A (zh) 流量作弊行为识别方法、装置及存储介质和电子设备
CN110827101A (zh) 一种店铺推荐的方法和装置
US20090240643A1 (en) System and method for detecting human judgment drift and variation control
CN112328752B (zh) 基于搜索内容的课程推荐方法、装置、计算机设备及介质
CN111382342B (zh) 一种热搜词的获取方法、装置、设备及存储介质
CN114722313A (zh) 搜索结果排序方法、装置、设备及存储介质
CN114547116A (zh) 一种数据推送方法、装置、设备和介质
CN113204705A (zh) 文章推荐方法、装置、电子设备和计算机介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant