搜索结果优化方法、装置及服务器
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种搜索结果优化方法、装置及服务器。
背景技术
随着互联网技术的发展,用户对网页浏览的需求越来越大,使用搜索引擎搜索信息是用户在浏览网页时常见的方式。
传统的搜索引擎根据用户在用户终端输入的关键词,在服务器查找与关键词相应的信息组成检索结果,并将检索结果返回给对应的用户终端。但由于存在误触发的可能,例如对用户查询意图理解有误,或与关键词对应的信息不准确,会返回与关键词相关性较弱的检索结果。
特别是搜索引擎可以根据关键词返回强样式类的产品(例如关键词为音乐名称或视频名称时,直接将音频文件或视频文件作为检索结果返回),若返回的检索结果相关性较弱,则使得误触发的发生显得更加明显。
发明内容
有鉴于此,本发明实施例提供了一种搜索结果优化方法、装置及服务器,能够改善返回的检索结果与关键词的相关性,减小误触发发生的概率。
为实现上述目的,本发明实施例提供了一种搜索结果优化方法,所述方法包括:接收用户终端发送的搜索请求;根据所述搜索请求获取多个搜索结果信息;查询每个搜索结果信息对应的效果指标;将效果指标超过第一预设阈值的搜索结果信息,作为新的搜索结果信息返回给所述用户终端。
本发明实施例还提供了一种搜索结果优化装置,所述装置包括:搜索请求接收模块、搜索结果信息获取模块、效果指标查询模块以及搜索结果信息返回模块。其中,搜索请求接收模块用于接收用户终端发送的搜索请求。搜索结果信息获取模块用于根据所述搜索请求获取多个搜索结果信息。效果指标查询模块用于查询每个搜索结果信息对应的效果指标。搜索结果信息返回模块用于将效果指标超过第一预设阈值的搜索结果信息,作为新的搜索结果信息返回给所述用户终端。
本发明实施例还提供了一种服务器,所述服务器包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令。当所述指令由所述处理器执行时,使所述处理器执行以下操作:接收用户终端发送的搜索请求;根据所述搜索请求获取多个搜索结果信息;查询每个搜索结果信息对应的效果指标;将效果指标超过第一预设阈值的搜索结果信息,作为新的搜索结果信息返回给所述用户终端。
本发明实施例提供的搜索结果优化方法、装置及服务器的有益效果为:
本发明实施例提供的搜索结果优化方法、装置及服务器接收用户终端发送的搜索请求,根据搜索请求获取多个搜索结果信息,并且查询每个搜索结果信息对应的效果指标。将效果指标超过第一预设阈值的搜索结果信息作为新的搜索结果信息返回给用户终端。本发明实施例提供的搜索结果优化方法能够多次累计通过不同的用户终端接收到的搜索请求,根据不同的用户终端反馈回来的搜索结果信息积累效果指标,并且将积累获得的效果指标与第一预设阈值进行比较,若效果指标超过第一预设阈值,则将该效果指标对应的搜索结果信息返回给用户终端,从而不断对搜索结果信息进行优化,使用户获得与搜索关键词相关性强的搜索结果信息。
附图说明
为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的应用环境示意图;
图2示出了本发明实施例提供的服务器的结构框图;
图3示出了本发明第一实施例提供的一种搜索结果优化方法的流程图;
图4示出了本发明第二实施例提供的一种搜索结果优化方法的流程图;
图5示出了本发明第三实施例提供的一种搜索结果优化装置的结构框图;
图6示出了本发明第三实施例的一种具体实施方式提供的搜索结果优化装置的结构框图。
具体实施方式
本发明下述各实施例均可应用于如图1所示的环境中。如图1所示,服务器10通过网络30与一个或多个用户终端20进行通信连接,以进行数据通信或交互。在本发明实施例中,用户终端20中安装有客户端,该客户端可以是应用程序,与服务器10相对应,从而为用户提供服务(例如接收用户输入的搜索需求描述信息,向用户展示搜索结果信息等)。所述服务器10可以是数据库服务器、即时通信服务器、网络服务器、验证服务器等多个服务器,也可以是一个服务器。所述用户终端20可以是个人电脑(personal computer,PC)、平板电脑、智能手机、电子书阅读器、膝上型便携计算机、车载电脑、智能穿戴设备等。所述网络30可以是无线网络或有线网络,例如无线网络可以是,但不限于Wi-Fi(无线保真)网络、2G/3G/4G网络等。
图2示出了一种可应用于本发明实施例中的服务器10的结构框图。如图2所示,服务器10包括存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110等。这些组件通过一条或多条通讯总线/信号线116相互通讯。
存储器102可用于存储软件程序以及模块,如本发明实施例中的搜索结果优化方法及装置对应的程序指令/模块,处理器106通过运行存储在存储器102内的软件程序以及模块,从而执行各种功能应用以及数据处理,如搜索结果优化方法。
存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。
外设接口108将各种输入/输入装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108,处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。
可以理解,图2所示的结构仅为示意,服务器10还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。
第一实施例
图3示出了本发明第一实施例提供的一种搜索结果优化方法的流程图,请参阅图3,本实施例描述的是服务器的处理流程,所述方法包括:
步骤S110,接收用户终端发送的搜索请求。
于本发明实施例中,搜索请求指的是用户需要进行搜索时,在用户终端输入搜索需求描述信息并确认后,用户终端向服务器发送的包含有搜索需求描述信息的请求。搜索需求描述信息是指描述用户搜索需求的信息。在本实施例中,搜索需求描述信息可以是图像、关键字或图像与关键字的组合。
步骤S120,根据所述搜索请求获取多个搜索结果信息。
服务器获取与搜索需求描述信息相关的搜索结果信息,每个搜索需求描述信息均可以对应有多个搜索结果信息,且不同搜索结果信息对应的含义不同。
例如,假设用户的搜索需求描述信息为一关键字,例如“苹果”,该“苹果”可以理解为手机品牌,也可以理解为水果,还可以理解为歌曲名等,因此服务器可以根据搜索需求描述信息“苹果”获取到分别是苹果手机、水果苹果、以及歌曲《小苹果》的搜索结果信息。
步骤S130,查询每个搜索结果信息对应的效果指标。
效果指标指的是每个搜索结果信息与搜索需求描述信息的相关程度。效果指标可以由不同用户通过不同的用户终端对搜索结果信息进行操作来获得。
具体地,可以根据单位时间内,搜索需求描述信息对应的搜索结果信息的点击量、点击通过率以及点击模型的拟合分数确定。点击量指的是相应的搜索结果信息被点击的次数。点击通过率(Click-Through-Rate)是指搜索结果信息的点击到达率,即该搜索结果信息的实际点击次数除以该搜索结果信息的展现量。
点击模型是对用户的点击行为的建模,根据用户的历史点击信息,对用户的行为进行建模,以对用户未来的点击行为进行预测,提高相关性。服务器在搜索过程中可以收集搜索日志和点击日志,搜索日志中包括搜索需求描述信息以及与搜索需求描述信息对应的搜索结果信息的列表,点击日志包括搜索需求描述信息与上述列表中被点击的搜索结果信息。
服务器具体可以调用分布式文件系统的命令行接口,向分布式文件系统推送包含该搜索日志和该点击日志的日志信息,由分布式文件系统根据上述的日志信息获取点击模型,调用该命令行接口,将获取到的点击模型发送给该服务器,由服务器应用该点击模型进行搜索。
由于使用互联网的用户存在地域差异,点击模型可以按照地理区域的划分来建立,具体地,服务器可以获取预先划分的多个地理区域的用户的历史点击信息,得到对应于多个地理区域的多个历史点击信息集合。若多个历史点击信息集合中的至少两个历史点击信息集合对同一搜索需求描述信息对应的多个搜索结果信息中的一个搜索结果信息的点击量较高,则可以将该至少两个历史点击信息集合对应的地理区域作为区域类,并生成该区域类的点击模型。该区域类的点击模型不断积累该区域类内的搜索需求描述信息以及与搜索需求描述信息对应的点击量较高的搜索结果信息,并在再一次接收到同样搜索需求描述信息时,对点击量高的搜索结果信息给出相应的拟合分数。
具体地,可以将四川和重庆划分到一个区域类中,该区域类,当用户的搜索需求描述信息为“粽子”时,“肉粽子”的点击量较高,则在该区域类对应的点击模型中,当接收到搜索请求为“粽子”时,“肉粽子”处于搜索结果信息中靠前的位置,相应的,“肉粽子”的拟合分数较高。
在本发明的一种具体实施方式中,点击量、点击通过率以及点击模型的拟合分数还可以有各自的匹配权重,将一个搜索结果信息的点击量、点击通过率以及点击模型的拟合分数与各自的匹配权重相乘所得的积相加,即可得到该搜索结果信息的效果指标。例如,点击量的匹配权重为x%,点击通过率的匹配权重为y%,点击模型的拟合分数的匹配权重为z%,则效果指标=点击量*x%+点击通过率*y%+拟合分数*z%。
步骤S140,将效果指标超过第一预设阈值的搜索结果信息,作为新的搜索结果信息返回给所述用户终端。
若效果指标超过了第一预设阈值,则该效果指标对应的搜索结果信息可以被服务器返回给用户终端,若效果指标低于第一预设阈值,则可以对该效果指标对应的搜索结果信息再进行判断,也可以不再将该搜索结果信息返回给用户终端。
本发明第一实施例提供的搜索结果优化方法接收用户终端发送的搜索请求,根据搜索请求中包含的搜索需求描述信息,获得与搜索需求描述信息对应的多个搜索结果信息。每个搜索结果信息均对应有其效果指标,效果指标用来反映搜索结果信息与搜索需求描述信息的相关程度。若效果指标超过第一预设阈值,则服务器将与该效果指标对应的搜索结果信息返回给用户终端,本发明第一实施例在每次执行搜索操作时,都需要将获得的搜索结果信息的效果指标与第一预设阈值对比,并且将效果指标高于第一预设阈值的搜索结果信息才返回给用户终端,能够较好的提高搜索结果信息与搜索需求描述信息的相关程度。
第二实施例
图4示出了本发明第二实施例提供的一种搜索结果优化方法的流程图,请参阅图4,本实施例描述的是服务器的处理流程,所述方法包括:
步骤S210,获取每个搜索结果信息对应的效果指标,所述效果指标预先根据用户针对每个搜索结果信息的操作信息确定。
具体地,用户查询搜索需求描述信息query,与搜索需求描述信息query对应的每个搜索结果信息均有其唯一标识sc_name。sc_name可以被记录在点击列表中。用户对搜索结果信息每次的点击以及点击后的浏览时长均可以被服务器记录。
步骤S220,接收用户终端发送的搜索请求。
步骤S230,根据所述搜索请求获取多个搜索结果信息。
步骤S240,查询每个搜索结果信息对应的效果指标。
步骤S220至步骤S240与第一实施例中的步骤S110至步骤S130对应相同,在此便不做赘述。
步骤S250,搜索结果信息的效果指标是否超过第一预设阈值,若是,执行步骤S260;若否,执行步骤S270。
每个搜索结果信息对应的效果指标均可以与第一预设阈值进行对比。由于效果指标反映搜索结果信息与搜索需求描述信息的相关性,若效果指标超过第一预设阈值,则说明该效果指标对应的搜索结果信息与搜索需求描述信息的相关性较高,则执行步骤S260;若效果指标未超过第一预设阈值,则执行步骤S270。
步骤S260,将搜索结果信息作为新的搜索结果信息返回给所述用户终端。
对于与搜索需求描述信息相关性较高的搜索结果信息,服务器将其作为搜索结果信息返回给用户终端,以使用户获得较好的搜索体验。
步骤S270,搜索结果信息的效果指标是否超过第二预设阈值,若是,执行步骤S280。
第二预设阈值小于第一预设阈值。效果指标低于第一预设阈值,可能低于第一预设阈值较多,也可能与第一预设阈值相差不大。因此,为了避免搜索结果信息的遗漏,将低于第一预设阈值的效果指标与第二预设阈值进行比较,以判断低于第一预设阈值的效果指标对应的搜索结果信息是否因第一预设阈值设置得不合适而被遗漏。
步骤S280,将该搜索结果信息记为待定结果信息,将效果指标超过第一预设阈值的搜索结果信息以及所述待定结果信息,共同作为新的搜索结果信息返回给所述用户终端。
效果指标超过第二预设阈值但低于第一预设阈值,表明该效果指标对应的搜索结果信息可能因第一预设阈值设置得过高而被遗漏。因此,将该搜索结果信息记为待定结果信息,待定结果信息与效果指标超过第一预设阈值的搜索结果信息可以共同被服务器返回给用户终端,通过用户在用户终端对待定结果信息的操作信息来对待定结果信息进行测试。
步骤S290,接收用户终端发送的针对待定结果信息的操作信息,判断预设时间段操作信息是否满足预设条件,若是,执行步骤S300。
预设时间段为一个固定的时间段,可以为一周,也可以为一个月,预设时间段的具体时长不应该理解为是对本发明的限制。
用户对待定结果信息的操作信息包括用户对待定结果信息的点击数据以及关于每个待定结果信息的浏览时长。点击数据包括点击量、点击通过率以及点击模型的拟合分数。
预设条件可以对点击量、点击通过率、点击模型的拟合分数以及浏览时长分别设置相应的预设值,例如,点击量的预设值为a,点击通过率的预设值为b,点击模型的拟合分数的预设值为c,浏览时长的预设值为d,当待定结果信息的点击量低于a,或点击通过率低于b,或点击模型的拟合分数低于c,或浏览时长低于d时,则可以判定预设时间段操作信息满足预设条件。
预设条件也可以对点击量、点击通过率、点击模型的拟合分数以及浏览时长中的一个设置预设值。若待定结果信息低于设置的预设值时,判定预设时间段操作信息满足预设条件。
由于搜索操作几乎随时都在进行,故待定结果信息的点击数据和浏览时长的数值也在不断变化。因此,预设时间段操作信息是否满足预设条件,可以判断在预设时间段过后,关于待定结果信息的操作信息是否满足预设条件。
步骤S300,降低所述待定结果信息的效果指标至第二预设阈值以下。
若待定结果信息的操作信息满足预设条件,则说明待定结果信息与搜索需求描述信息的相关性较低,因此将其对应的效果指标降低至第二预设阈值以下。
步骤S310,效果指标低于第二预设阈值的待定结果信息不再返回给所述用户终端。
效果指标低于第二预设阈值的待定结果信息可以被判定为与搜索需求描述信息的相关程度较低,因此服务器不再把效果指标低于第二预设阈值的待定结果信息返回给用户终端。
本发明第二实施例提供的搜索结果优化方法能够对效果指标低于第一预设阈值的搜索结果信息再一次进行判断,判断效果指标是否依然低于第二预设阈值,若否,则将其作为待定结果信息,判断针对待定结果信息的操作信息是否满足预设条件,当满足时,再将效果指标降至第二预设阈值之下。效果指标低于第二预设阈值的待定结果信息不再返回给所述用户终端。从而避免了由于第一预设阈值设置的过高导致部分搜索结果信息被遗漏的情况的发生。
第三实施例
本发明实施例还提供了一种搜索结果优化装置,详情请参见图5,该装置300包括:
搜索请求接收模块310,用于接收用户终端发送的搜索请求。搜索结果信息获取模块320,用于根据所述搜索请求获取多个搜索结果信息。效果指标查询模块330,用于查询每个搜索结果信息对应的效果指标。搜索结果信息返回模块340,用于将效果指标超过第一预设阈值的搜索结果信息,作为新的搜索结果信息返回给所述用户终端。
详情请参见图6,图6示出了本发明第三实施例的一种具体实施方式,搜索结果优化装置还包括待定结果获取模块350、操作信息接收模块360、预设条件判断模块370、效果指标获取模块380以及匹配度获取模块390。
其中,对于效果指标低于第一预设阈值的搜索结果信息,还可以判断其是否超过第二预设阈值,若超过,则待定结果获取模块350将效果指标低于第一预设阈值且高于第二预设阈值的搜索结果信息记为待定结果信息。搜索结果信息返回模块具体可以包括返回子模块(图未示),返回子模块将效果指标超过第一预设阈值的搜索结果信息以及待定结果信息共同作为新的搜索结果信息返回给用户终端。
操作信息接收模块360接收用户终端发送的针对待定结果信息的操作信息,用户对待定结果信息的操作信息包括用户对待定结果信息的点击数据以及关于每个待定结果信息的浏览时长。点击数据包括点击量、点击通过率以及点击模型的拟合分数。
预设条件判断模块370判断预设时间段内,用户对待定结果信息的操作信息是否满足预设条件,若满足,则将待定结果信息的效果指标降低至第二预设阈值以下。效果指标低于第二预设阈值的待定结果信息不再返回给用户终端。
效果指标查询模块330查询到的每个搜索结果信息对应的效果指标具体由效果指标获取模块380获取。其中,效果指标预先根据用户针对每个搜索结果信息的操作信息确定。具体地,由匹配度获取模块390根据点击量、点击通过率、点击模型的拟合分数以及点击量、点击通过率、点击模型的拟合分数分别对应的匹配权重获得并存储每个搜索结果信息与搜索请求对应的匹配度,该匹配度可作为效果指标。
本发明实施例提供的搜索结果优化方法、装置及服务器能够多次累计通过不同的用户终端接收到的搜索请求,根据不同的用户终端反馈回来的搜索结果信息积累效果指标,并且将积累获得的效果指标与第一预设阈值进行比较,若效果指标超过第一预设阈值,则将该效果指标对应的搜索结果信息返回给用户终端,从而不断对搜索结果信息进行优化,使用户获得与搜索关键词相关性强的搜索结果信息。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。