CN102486781A - 一种搜索排序方法和装置 - Google Patents

一种搜索排序方法和装置 Download PDF

Info

Publication number
CN102486781A
CN102486781A CN2010105719465A CN201010571946A CN102486781A CN 102486781 A CN102486781 A CN 102486781A CN 2010105719465 A CN2010105719465 A CN 2010105719465A CN 201010571946 A CN201010571946 A CN 201010571946A CN 102486781 A CN102486781 A CN 102486781A
Authority
CN
China
Prior art keywords
information
product information
relevant
product
search server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105719465A
Other languages
English (en)
Inventor
韩小梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2010105719465A priority Critical patent/CN102486781A/zh
Publication of CN102486781A publication Critical patent/CN102486781A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种搜索排序方法和装置,所述方法包括:搜索服务器接收用户的查询信息和搜索频道信息,所述的查询信息为查询关键词或点击的类目信息;所述搜索服务器在所述搜索频道内查询与所述查询信息相关的相关产品信息;所述搜索服务器分别计算所述相关产品信息的相关性得分和产品信息特征得分,所述的相关性得分表示所述查询信息和所述产品信息的匹配程度;所述搜索服务器按照所述相关性得分和产品信息特征得分对所述相关产品信息进行排序。利用本申请,实现了不同搜索频道信息的共享,节约了信息资源和硬件资源,从而解决了搜索服务器处理性能下降的问题。

Description

一种搜索排序方法和装置
技术领域
本申请涉及计算机应用技术领域,特别涉及一种搜索排序方法和装置。
背景技术
网上交易平台为网上交易提供了一个安全保障的平台,网上交易即是买卖双方通过交易平台进行的商品或服务交易。网上交易平台提供各种各样的产品,用户根据需要进行搜索,从搜索结果中找到自己需要的商品。网上交易平台可以根据不同的应用市场,为用户提供不同的搜索频道,例如:主搜索频道、零批搜索频道、类目搜索频道、求购搜索频道以及热销搜索频道等,各个搜索频道内都有各自产品信息和排序的需求。
现有技术中,不同的搜索频道对应不同的搜索服务器,每个搜索服务器都为对应的搜索频道提供相应的产品信息,当买方用户需要进行某类搜索频道内的产品搜索时,与该搜索频道对应的搜索服务器接收用户提交的查询信息和点击进入该搜索频道的页面信息,再由与该搜索频道对应的搜索服务器从存储有产品信息的存储服务器中搜索与用户输入的关键词相关的所有产品信息,然后对相关的产品信息进行排序,在排序过程中,不同的搜索频道下需要分别抽取所述产品信息的产品特征,计算产品特征得分,根据得分情况进行排序。
由上述过程可以看出,每个搜索频道对应各自的搜索服务器,由各自的搜索服务器在相应的搜索频道内搜索卖方用户的产品信息并对搜索到的产品信息进行特征提取,而实际上各个搜索频道内很多产品信息是重复的,例如,零批搜索频道是提供服装、小商品等消费市场的搜索频道,而主搜索频道是提供所有产品信息的搜索频道,其必然包括零批搜索频道下的产品信息,但是按照现有技术的搜索排序方法,这些重复的产品信息就需要在对应不同搜索频道的不同的搜索服务器中重复复制,这就造成了信息资源和硬件资源的浪费,而且,因为很多产品信息在不同搜索频道下是重复的,在进行产品排序时,不同搜索频道对应的搜索服务器就需要重复抽取产品特征并分别进行计算,这也造成了信息资源和硬件资源的浪费,从而影响了服务器的处理性能。另外,现有技术在排序过程中,针对不同的搜索频道采用相同的排序算法,就无法充分利用不同搜索频道中独特的特征信息有针对性地进行排序,使得各个搜索频道内的排序结果信息不能很好的符合本频道的产品特点,也不能满足用户的搜索需求。
总之,目前需要本领域技术人员迫切解决的一个技术问题就是:如何能够创新的提出一种搜索排序方法,以解决现有技术中信息资源和硬件资源浪费导致的服务器处理性能下降的问题。
发明内容
本申请所要解决的技术问题是提供一种搜索排序方法,解决了信息资源和硬件资源浪费导致的服务器处理性能下降的问题,进一步的,还能使得各个搜索频道内的排序方法都能基于本频道内的特征信息进行,所以能够反映本频道内的产品特征,进而可以使排序结果信息满足用户的搜索需求。
本申请还提供了一种搜索排序装置,用以保证上述方法在实际中的实现关于应用。
为了解决上述问题,本申请公开了一种搜索排序方法,包括:
搜索服务器接收用户的查询信息和搜索频道信息,所述的查询信息为查询关键词或点击的类目信息;
所述搜索服务器在所述搜索频道内查询与所述查询信息相关的相关产品信息;
所述搜索服务器分别计算所述相关产品信息的相关性得分和产品信息特征得分,所述的相关性得分表示所述查询信息和所述产品信息的匹配程度;
所述搜索服务器按照所述相关性得分和产品信息特征得分对所述相关产品信息进行排序。
优选的,所述搜索服务器在所述搜索频道内查询与所述查询信息相关的相关产品信息包括:
所述搜索服务器根据所述搜索频道信息获取所述搜索频道的所有产品信息;
所述搜索服务器根据所述查询信息在所述所有产品信息中查询与所述查询信息相关的相关产品信息。
优选的,所述的查询信息为查询关键词时,所述搜索服务器根据查询信息在所述所有产品信息中查询与所述查询信息相关的相关产品信息,包括:
所述搜索服务器根据查询关键词得到至少一个关键字段;
在所述所有产品信息中查询与所述至少一个关键字段相匹配的相关产品信息。
优选的,所述搜索服务器计算所述相关产品信息的相关性得分,具体为:
所述搜索服务器将所述相关产品信息根据所述搜索频道对应的预先训练的相关性排序模型计算相关性得分。
优选的,所述的查询信息为点击的类目信息时,所述搜索服务器根据查询信息在所述产品信息中查询与所述查询信息相关的相关产品信息,具体为:所述服务器根据点击的类目信息在所述所有产品信息中查询与所述类目信息相匹配的相关产品信息。
优选的,所述搜索服务器计算所述相关产品信息的相关性得分,具体为:
所述搜索服务器根据所述产品信息与所述类目的可靠性程度计算相关性得分,所述的可靠性程度表示产品信息描述与所述类目的接近程度。
优选的,所述搜索服务器计算所述相关产品信息的产品信息特征得分包括:
所述搜索服务器查询是否已经保存所述相关产品信息的产品信息特征,如果是,根据搜索频道对应的预先训练的产品特征排序模型直接计算产品信息特征得分,如果否,则抽取每条相关产品信息的产品信息特征,并根据搜索频道对应的预先训练的产品特征排序模型计算抽取得到的产品信息特征得分。
优选的,所述抽取每条相关产品信息的产品特征之后,还包括:
所述搜索服务器保存所述抽取得到的每条相关产品信息的产品信息特征。
本申请公开了一种搜索排序装置,所述装置应用于网上交易平台的搜索服务器上,该装置包括:
接收模块,用于接收用户的查询信息和搜索频道信息,所述的查询信息为查询关键词或点击的类目信息;
查询模块,用于在所述搜索频道内查询与所述查询信息相关的相关产品信息;
计算模块,用于分别计算所述相关产品信息的相关性得分和产品信息特征得分;所述的相关性得分表示所述查询信息和所述产品信息的匹配程度;
排序模块,用于将所述相关产品信息按照相关性得分和产品信息特征得分进行排序。
优选的,所述查询模块包括:
信息获取模块,用于根据所述搜索频道信息获取所述搜索频道的所有产品信息;
信息查询模块,用于根据所述查询信息在所述所有产品信息中查询与所述查询信息相关的相关产品信息。
优选的,所述查询信息为查询关键词时,所述信息查询模块包括:
字段获取模块,用于根据查询关键词得到至少一个关键字段;
产品查询模块,用于在所述所有产品信息中查询与所述至少一个关键字段相匹配的相关产品信息。
优选的,所述计算模块具体用于将所述相关产品信息根据搜索频道对应的预先训练的排序模型计算相关性得分;以及,
用于将所述相关产品信息根据搜索频道对应的预先训练的产品特征排序模型计算产品特征得分。
优选的,所述查询信息为点击的类目信息时,所述信息查询模块具体用于根据用户的点击的类目信息在所述所有产品信息中查询与所述类目信息相关的相关产品信息。
优选的,所述计算模块具体用于根据所述产品信息与所述类目的可靠性程度计算相关性得分,所述的可靠性程度表示产品信息描述与所述类目的接近程度;以及,
用于将所述相关产品信息根据搜索频道对应的预先训练的产品特征排序模型计算产品特征得分。
优选的,所述的计算模块包括:
查询判断模块,用于查询是否保存了所述相关产品信息的产品特征;
特征抽取模块,用于当所述查询判断模块的结果为否时,抽取每条相关产品信息的产品特征;
特征计算模块,用于当所述查询判断模块的结果为是时,根据搜索频道对应的预先训练的产品特征排序模型直接计算产品信息特征得分;或者,当所述查询判断模块的结果为否时,根据搜索频道对应的预先训练的产品特征排序模型,计算所述特征抽取模块抽取的产品信息特征得分。
优选的,所述装置还包括:
特征保存模块,用于保存所述特征抽取模块抽取得到的每条相关产品信息的产品信息特征。
与现有技术相比,本申请包括以下优点:
在本申请中,针对不同的搜索频道设置统一的搜索服务器,由该搜索服务器统一接收用户的查询信息,然后从存储有产品信息的存储服务器中查询获得相应的产品信息,避免了产品信息的重复复制,且由同一个搜索服务器进行排序的操作并对产品特征进行保存,避免了产品信息特征的重复抽取,因此实现了不同搜索频道信息的共享,节约了信息资源和硬件资源,从而解决了服务器处理性能下降的问题。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的一种搜索排序方法实施例1的流程图;
图2是本申请的一种搜索排序方法实施例2的流程图;
图3是本申请的一种搜索排序方法实施例3的流程图;
图4是本申请的一种搜索排序装置实施例1的结构框图;
图5是本申请的一种搜索排序装置实施例2的结构框图;
图6是本申请中信息查询模块的结构框图;
图7是本申请中计算模块的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请的主要思想之一可以包括,搜索服务器根据用户的查询信息,判断出搜索频道,并在该搜索频道对应的产品信息中匹配与用户查询相关的相关产品信息,然后对相关产品进行排序。本申请中,针对不同的搜索频道设置统一的搜索服务器,由该搜索服务器统一接收用户的查询信息,然后从存储有产品信息的存储服务器中查询获得相应的产品信息,并在该搜索服务器内对所述产品信息进行排序的操作,实现了不同搜索频道信息的共享,节约了信息资源和硬件资源,从而解决了服务器处理性能下降的问题。
参考图1,示出了本申请一种搜索排序方法实施例1的流程图,可以包括以下步骤:
步骤101:搜索服务器接收用户的查询信息和搜索频道信息,所述的查询信息为查询关键词或点击的类目信息。
用户进行搜索时,在主页面点击为各个搜索频道设置的链接进入某个搜索频道的页面,用户可以输入查询关键词或是点击该搜索频道页面提供的类目链接进行查询。例如用户需要搜索“手机”,可以在该搜索频道页面的搜索框中输入“手机”,或是在该搜索频道页面提供的类目链接中找到“手机”类目,直接点击。
本申请实施例中,针对不同的搜索频道设置统一的搜索服务器,由该搜索服务器统一接收用户的查询信息和搜索频道信息,搜索服务器根据搜索频道页面信息与搜索频道的对应关系,用户在点击该搜索频道页面时,搜索服务器即可判断出用户的该项查询来自哪个频道。
步骤102:所述搜索服务器在所述搜索频道内查询与所述查询信息相关的相关产品信息。
搜索服务器根据用户的点击页面信息,判断出用户查询对应的搜索频道,从存储有产品信息的存储服务器中搜索获取该搜索频道对应的所有产品信息,例如零批搜索频道是为卖家产品信息中有关衣服、小商品等消费品专门交易开辟的搜索频道,用户点击进入该搜索频道,所述的服务器会从卖家的产品信息中获取所有消费品的信息,再从所有消费品中查询得到与用户的查询信息相匹配的相关产品信息。在具体实施中,本申请并不局限于应用在网上交易平台搜索产品信息,也可以应用在各种门户网站、搜索引擎网站等进行各类信息的搜索。
步骤103:所述搜索服务器分别计算所述相关产品信息的相关性得分和产品信息特征得分。
相关性得分是指用户查询信息与相关产品信息的匹配程度。以用户输入的查询关键词信息为例,例如,用户搜索“诺基亚手机”时,如表1给出了其中的一条匹配信息。
参见表1,相关性得分计算过程可以示例如下:
用户输入的关键词和该条产品信息都得到了匹配,但是关键词之间还间隔有“5230”,由此得到匹配特征a=0.95;根据历史点击数据统计,类目手机下的点击得分b=1,关键词在属性诺基亚匹配了品牌,属性匹配特征得分c=1,信息属性描述和详细描述字段都是关于手机的内容,整体匹配特征得分d=1,将a、b、c和d数值代入相关性排序模型,得到最终相关性得分。
需要说明的是,根据用户查询关键词,搜索服务器在该搜索频道下的产品信息中查询所有与查询关键词相关的相关产品,表1只是给出了其中一条产品信息,关于其计算过程只是进行了简单的描述,本领域技术人员应该了解产品信息的匹配特征并不局限于a、b、c、d。对于其他产品信息相关性的计算在此不一一列举。
Figure BDA0000035941750000091
表1
产品信息特征表征该产品的质量状况,例如,一条产品信息可以包括三个维度的特征:信息维度特征,卖家维度特征和市场维度特征。
如表2所示,信息维度特征可以包括信息的属性填写特征、信息的发布时间特征以及信息的描述特征等方面,服务器根据该信息维度特征下的各个方面情况,以一些数值表征这些特征,比如此条信息描述详细,图文并茂,就以0.8表征该条特征,再比如信息发布时间为3天之内,就以数值1表征该特征。卖家维度特征可以包括活跃度特征、信用保障特征以及对网站的贡献情况特征等方面;市场维度特征可以包括买家反馈优化以及市场交易最大化等方面。
同样,搜索服务器会根据这些维度下的特征各方面情况,以数值方式表征这些特征。具体可参见表2,在此不一一赘述,需要说明的是,表2只是描述了其中一部分的特征。
表2
产品信息特征得分即将各个维度特征的得分数值代入产品特征排序模型计算得出。
本申请中,产品各维度特征信息可根据产品信息发布时所填写的信息中提取,比如信息的发布时间特征,或/和记录的卖家的历史行为数据中获取,比如,卖家的信用保障特征。
步骤104:所述搜索服务器将所述相关产品信息按照相关性得分和产品信息特征得分进行排序。
服务器先根据相关性得分进行排序,在相关性排序结果中再根据产品信息特征得分进行排序,最终在搜索页面显示排序结果。需要说明的是,本申请实施例中,获取的产品信息特征会保存在搜索服务器中,计算产品信息特征得分时,直接使用这些产品信息特征即可。并且,本实施例中的执行主体与现有技术中只能与一个搜索频道对应的搜索服务器是不一样的,本实施例中的搜索服务器为同时对应五个搜索频道的硬件与软件的集合,是新增的一个在硬件性能和软件性能方面都有了较大提升的一个计算机系统。也可以理解为,本实施例中的搜索服务器经过扩容或改进等提升性能的操作之后,其硬件和软件系统都有了较大的提高,在硬件方面能够同时提供五个搜索频道中的所有产品信息,同时在软件方面也拥有更优的处理性能。
在本实施例中,针对不同的搜索频道设置统一的搜索服务器,由该搜索服务器统一接收用户的查询信息,然后从存储有产品信息的存储服务器中查询获得相应的产品信息,所有产品信息均由同一个搜索服务器查询获得,避免了产品信息的重复复制,并由同一个搜索服务器进行排序的操作,且搜索服务器可以保存产品特征,避免了产品特征的重复抽取,因此实现了不同搜索频道信息的共享,节约了信息资源和硬件资源,从而解决了服务器处理性能下降的问题。
参考图2,示出了本申请一种搜索排序方法实施例2的流程图,实施例2为当用户的查询信息为查询关键词时的具体流程图,可以包括以下步骤:
步骤201:搜索服务器接收用户的查询关键词信息和搜索频道信息。
本实施例中的执行主体为与本申请实施例1相同的搜索服务器。在本步骤中,搜索服务器根据用户点击的搜索频道页面信息判断用户的该项查询来自哪个搜索频道。
步骤202:所述搜索服务器根据所述搜索频道信息获取所述搜索频道的相应产品信息。
步骤203:所述搜索服务器根据所述查询关键词在所述产品信息中查询与所述查询关键词相关的相关产品信息。
搜索服务器根据查询关键词得到至少一个关键字段,在所述所有产品信息中查询与所述至少一个关键字段相匹配的相关产品信息。例如,用户输入的关键词为“诺基亚手机”,其关键字段至少包括“诺基亚”和“手机”这两个关键字段,搜索服务器就会从该搜索频道对应的所有产品信息中查询至少与其中一个关键字段相匹配的信息。
步骤204:所述搜索服务器将所述相关产品信息根据搜索频道对应的预先训练的相关性排序模型计算相关性得分。
相关性得分是指用户查询关键词与相关产品信息的匹配程度。搜索服务器针对不同搜索频道会预先训练出与该搜索频道对应的相关性排序模型。所述的相关性排序模型是基于线性的回归模型,优选地,所述的相关性排序模型可以为MLR(Machine Learning Ranking基于机器学习的排序模型),MLR相关性排序模型进一步可以是支持向量机模型。
计算与查询关键词相关的相关产品信息的相关性得分过程可参见实施例1,在此不再赘述。
步骤205:所述搜索服务器查询是否已经保存了所述相关产品信息的产品信息特征,如果是,则进行步骤207,如果否,则进行步骤206。
产品信息特征会保存在搜索服务器中的特定存储模块特征池中,计算产品信息特征得分时,搜索服务器会先查询是否保存了相关产品信息的产品信息特征,即查询特征池中是否保存有该产品信息特征。
需要说明的是,特征池是搜索服务器中用于存储产品信息特征的存储模块,并不限定于特征池这一名称。
步骤206:所述搜索服务器抽取每条相关产品信息的产品信息特征。
产品信息特征可根据产品信息发布时所填写的信息中提取或/和记录的卖家的历史行为数据中获取。
抽取每条产品信息的产品信息特征实际上就是根据产品各个维度特征的情况,以数值形式表示这些特征。数值计算过程具体可参见实施例1中所述。
步骤207:根据搜索频道对应的预先训练的产品特征排序模型计算产品信息特征得分。
如果搜索服务器已经保存了所述相关产品信息的产品信息特征,则,根据搜索频道对应的预先训练的产品特征排序模型直接计算产品信息特征得分,如果搜索服务器没有保存所述相关产品信息的产品信息特征,则,根据搜索频道对应的预先训练的产品特征排序模型计算抽取得到的产品信息特征得分。
产品信息特征表征产品信息的质量状况,搜索服务器以数值大小来表征某条信息的各个特征情况,计算产品特征得分时,根据预先训练好的产品特征模型,代入表征各个维度特征的数值计算得出产品信息特征得分。产品特征模型是一种基于线性的回归模型,例如可以是线性表达式,服务器会根据产品信息特征预先为每个搜索频道训练学习得到对应的特征排序模型。
步骤208:所述搜索服务器根据相关性得分和产品信息特征得分对产品信息进行排序。
搜索服务器根据产品信息相关性得分的高低进行排序,得到一个相关性排序结果,在相关性排序结果中再根据产品信息特征得分进行排序。
步骤209:所述搜索服务器保存所述抽取得到的每条相关产品信息的产品信息特征。
以数值表示的产品信息特征会保存在搜索服务器的特征池中,特征池是搜索服务器中的存储模块,用于存储产品信息特征。搜索服务器在进行产品信息特征得分计算时,直接从特征池中选择这些特征代入产品特征排序模型即可,无需重复抽取计算的过程。
需要说明的是,步骤209的操作并不局限于实施例2的顺序,其还可以在步骤206~步骤208任一步骤之后或同时进行。
搜索服务器进行排序后还可以在搜索页面显示最终的排序结果。
本实施例中,针对不同的搜索频道设置统一的搜索服务器,由该搜索服务器统一接收用户的查询信息,然后从存储有产品信息的存储服务器中查询获得相应的产品信息,所有产品信息均由同一个搜索服务器提供,避免了产品信息的重复复制,并由同一个搜索服务器进行排序的操作,并且在排序过程中,搜索服务器抽取产品信息特征时会保存产品信息特征,在下一次进行同样的产品信息特征得分计算时,无需进行重复抽取产品信息特征的操作,可以直接获取到已经保存过的产品信息特征计算产品信息特征的得分即可。因此本实施例实现了不同搜索频道信息的共享,节约了信息资源和硬件资源,从而解决了搜索服务器处理性能下降的问题。进一步的,本实施例中,因为对于各个搜索频道内独特的特征信息,还是会先进行产品信息特征的抽取并进行产品信息特征的得分计算过程,因此,对于不同的搜索频道来讲,即可以避免相同产品信息特征的重复抽取过程,又可以体现出独特的产品信息特征的特点,使得各个搜索频道内的排序结果可以很好的符合本频道的产品特点,满足用户的搜索需求。
参见图3,示出了本发明一种搜索排序方法实施例3的流程图,实施例3为当用户的查询信息为用户点击的类目信息时的具体流程图,可以包括:
步骤301:搜索服务器接收用户点击的类目信息和搜索频道信息。
本实施例中的搜索服务器也与实施例1中的搜索服务器相同。用户点击进入某个搜索频道的页面,在该搜索频道页面提供的类目链接中查找用户需要的搜索,直接点击。搜索服务器会根据用户的点击信息进行产品信息匹配和产品信息排序的操作。
步骤302:所述搜索服务器根据所述搜索频道信息获取所述搜索频道的所有产品信息。
步骤303:所述搜索服务器根据用户点击的类目信息在所述所有产品信息中查询与所述类目信息相关的相关产品信息。
搜索服务器根据用户点击的类目信息,例如,用户点击“手机”类目,从该搜索频道对应的产品信息中查询所属类目为“手机”的相关产品信息。
步骤304:所述搜索服务器计算所述相关产品信息的相关性得分。
搜索服务器会根据所有卖家产品信息所属的类目计算其在每个类目下的可靠性得分,即卖家产品信息与其所属类目的匹配程度。
例如,用户点击“手机”类目,所得相关产品信息中也有如表1所示的信息,表1的产品信息描述的产品为“手机”,则其在手机类目下的可靠性得分为1,该条信息的相关性得分即为1。
步骤305:所述搜索服务器查询是否保存了所述相关产品信息的产品特征,如果是,则进行步骤307,如果否,则进行步骤306。
产品信息特征会保存在搜索服务器中的特定存储模块特征池中,计算产品信息特征得分时,搜索服务器会先查询是否保存了相关产品信息的产品信息特征,即查询特征池中是否保存有该产品信息特征。
步骤306:抽取每条相关产品信息的产品特征并保存。
其中,抽取的产品信息特征会保存在搜索服务器中的特征池中,特征池是搜索服务器中特定的存储模块。
步骤307:根据搜索频道对应的预先训练的产品特征排序模型计算产品特征得分。
步骤308:所述搜索服务器根据相关性得分和产品信息特征得分对产品信息进行排序。
搜索服务器根据产品信息相关性得分的高低进行排序,得到一个相关性排序结果,在相关性排序结果中再根据产品信息特征得分进行排序。
步骤309:搜索服务器进行排序后在搜索页面显示最终的排序结果。
需要说明的是,本申请实施例3和实施例2不同之处仅在于查询相关产品信息和计算相关性得分过程不一样,其它步骤可互相参照。
本实施例中,针对不同的搜索频道设置统一的搜索服务器,由该搜索服务器统一接收用户的查询信息,然后从存储有产品信息的存储服务器中查询获得相应的产品信息,所有产品信息均由同一个搜索服务器提供,避免了产品信息的重复复制,并由同一个搜索服务器进行排序的操作,并且在排序过程中,搜索服务器抽取产品信息特征时会保存产品信息特征,在再次进行产品信息特征得分计算时,无需在进行重复抽取的操作,直接计算产品信息特征得分即可。因此实现了不同搜索频道信息的共享,节约了信息资源和硬件资源,从而解决了搜索服务器处理性能下降的问题。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
与上述本申请一种搜索排序方法实施例1所提供的方法相对应,参见图4,本申请还提供了一种搜索排序装置实施例1,在本实施例中,该装置可以包括:
接收模块401,用于接收用户的查询信息和搜索频道信息,所述的查询信息为查询关键词或点击的类目信息。
查询模块402,用于在所述搜索频道内查询与所述查询信息相关的相关产品信息。
计算模块403,用于分别计算所述相关产品信息的相关性得分和产品信息特征得分;所述的相关性得分表示所述查询信息和所述产品信息的匹配程度。
排序模块404,用于将所述相关产品信息按照相关性得分和产品信息特征得分进行排序。
本实施例所述的装置可以集成到搜索引擎的服务器上,也可以单独作为一个实体与搜索引擎服务器相连,另外,需要说明的是,当本申请所述的方法采用软件实现时,可以作为搜索引擎的服务器新增的一个功能,也可以单独编写相应的程序,本申请不限定所述方法或装置的实现方式。
本实施例中,针对不同的搜索频道设置统一的搜索服务器,由该搜索服务器统一接收用户的查询信息,然后从存储有产品信息的存储服务器中查询获得相应的产品信息,所有产品信息均由同一个搜索服务器提供,避免了产品信息的重复复制,并由同一个搜索服务器进行排序的操作,且搜索服务器可以保存产品特征,避免了产品特征的重复抽取,因此实现了不同搜索频道信息的共享,节约了信息资源和硬件资源,从而解决了搜索服务器处理性能下降的问题。
与上述本申请一种搜索排序方法实施例2所提供的方法相对应,参见图5,本申请还提供了一种搜索排序装置的具体实施例2,在本实施例中,该装置具体可以包括:
接收模块501:用于接收用户的查询信息和搜索频道信息,所述的
信息获取模块502:用于根据所述搜索频道信息获取所述搜索频道的所有产品信息。
信息查询模块503:用于根据所述查询关键词在所述所有产品信息中查询与所述查询关键词相关的相关产品信息。
如图6所示,所述的信息查询模块503包括:
字段获取模块601:用于根据查询关键词得到至少一个关键字段。
产品查询模块602:用于在所述所有产品信息中查询与所述至少一个关键字段相匹配的相关产品信息。
计算模块504:具体用于将所述相关产品信息根据搜索频道对应的预先训练的排序模型计算相关性得分;以及,
用于将所述相关产品信息根据搜索频道对应的预先训练的产品特征排序模型计算产品特征得分。
如图7所示,计算模块504具体可以包括:
查询判断模块701:用于查询是否保存了所述相关产品信息的产品特征。
特征抽取模块702:用于当所述查询判断模块的结果为否时,抽取每条相关产品信息的产品特征。
特征计算模块703:用于当所述查询判断模块的结果为是时,根据搜索频道对应的预先训练的产品特征排序模型直接计算产品信息特征得分;或者,当所述查询判断模块的结果为否时,根据搜索频道对应的预先训练的产品特征排序模型,计算所述特征抽取模块抽取的产品特征得分。
排序模块505:用于将所述相关产品信息按照所述相关性得分和产品信息特征得分进行排序。
进行排序后会在搜索页面显示最终的排序结果。
特征保存模块506:用于保存所述特征抽取模块抽取得到的每条相关产品信息的产品信息特征。
在实际应用中,所述的特征保存模块506可以具体为搜索服务器中的特征池。
与上述本申请一种搜索排序方法实施例3所提供的方法相对应,本申请还提供了一种搜索排序装置,其与上述搜索排序装置实施例2的不同之处仅在于,该装置中:
接收模块:用于接收用户点击的查询信息和搜索频道信息。所述查询信息为用户点击的类目信息。
信息查询模块:用于根据用户点击的类目信息在所述所有产品信息中查询与所述类目信息相关的相关产品信息。
计算模块:具体用于根据所述产品信息与所述类目的可靠性程度计算相关性得分,所述的可靠性程度表示产品信息描述与所述类目的接近程度;以及,
用于将所述相关产品信息根据搜索频道对应的预先训练的产品特征排序模型计算产品特征得分。
其中,计算模块具体可包括:
查询判断模块:用于查询是否保存了所述相关产品信息的产品特征。
特征抽取模块:用于当所述查询判断模块的结果为否时,抽取每条相关产品信息的产品特征。
特征计算模块:用于当所述查询判断模块的结果为是时,根据搜索频道对应的预先训练的产品特征排序模型直接计算产品信息特征得分;或者,当所述查询判断模块的结果为否时,根据搜索频道对应的预先训练的产品特征排序模型,计算所述特征抽取模块抽取的产品特征得分。
其它功能模块可互相参照,在此不再赘述。
本申请还提供了一种搜索服务器,所述的搜索服务器包括了上文所述的搜索排序装置,值得一提的是,本领域技术人员可以理解,所述的搜索服务器不只包括上述搜索排序装置。该搜索服务器与现有技术中的搜索服务器相比,可以同时对应五个搜索频道的硬件与软件的集合,是新增的一个在硬件性能和软件性能方面都有了较大提升的一个计算机系统。也可以理解为,该搜索服务器经过扩容或改进等提升性能的操作之后,其硬件和软件系统都有了较大的提高,在硬件方面能够同时提供五个搜索频道中的所有产品信息,同时在软件方面也拥有更优的处理性能;且在集成了搜索排序装置之后,能够实现前述的搜索排序方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
以上对本申请所提供的一种搜索排序方法和装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (16)

1.一种搜索排序方法,其特征在于,该方法包括:
搜索服务器接收用户的查询信息和搜索频道信息,所述的查询信息为查询关键词或点击的类目信息;
所述搜索服务器在所述搜索频道内查询与所述查询信息相关的相关产品信息;
所述搜索服务器分别计算所述相关产品信息的相关性得分和产品信息特征得分,所述的相关性得分表示所述查询信息和所述产品信息的匹配程度;
所述搜索服务器按照所述相关性得分和产品信息特征得分对所述相关产品信息进行排序。
2.根据权利要求1所述的方法,其特征在于,所述搜索服务器在所述搜索频道内查询与所述查询信息相关的相关产品信息包括:
所述搜索服务器根据所述搜索频道信息获取所述搜索频道的相应产品信息;
所述搜索服务器根据所述查询信息在所述产品信息中查询与所述查询信息相关的相关产品信息。
3.根据权利要求2所述的方法,其特征在于,所述的查询信息为查询关键词时,所述搜索服务器根据查询信息在所述所有产品信息中查询与所述查询信息相关的相关产品信息,包括:
所述搜索服务器根据查询关键词得到至少一个关键字段;
在所述产品信息中查询与所述至少一个关键字段相匹配的相关产品信息。
4.根据权利要求3所述的方法,其特征在于,所述搜索服务器计算所述相关产品信息的相关性得分,具体为:
所述搜索服务器将所述相关产品信息根据所述搜索频道对应的预先训练的相关性排序模型计算相关性得分。
5.根据权利要求2所述的方法,其特征在于,所述的查询信息为点击的类目信息时,所述搜索服务器根据查询信息在所述产品信息中查询与所述查询信息相关的相关产品信息,具体为:所述搜索服务器根据点击的类目信息在所述所有产品信息中查询与所述类目信息相匹配的相关产品信息。
6.根据权利要求5所述的方法,其特征在于,所述搜索服务器计算所述相关产品信息的相关性得分,具体为:
所述搜索服务器根据所述产品信息与所述类目的可靠性程度计算相关性得分,所述的可靠性程度表示产品信息描述与所述类目的接近程度。
7.根据权利要求1所述的方法,其特征在于,所述搜索服务器计算所述相关产品信息的产品信息特征得分包括:
所述搜索服务器查询是否已经保存所述相关产品信息的产品信息特征,如果是,根据搜索频道对应的预先训练的产品特征排序模型直接计算产品信息特征得分,如果否,则抽取每条相关产品信息的产品信息特征,并根据搜索频道对应的预先训练的产品特征排序模型计算抽取得到的产品信息特征得分。
8.根据权利要求7所述的方法,其特征在于,所述抽取每条相关产品信息的产品特征之后,还包括:
所述搜索服务器保存所述抽取得到的每条相关产品信息的产品信息特征。
9.一种搜索排序装置,其特征在于,所述装置应用于网上交易平台的搜索服务器上,该装置包括:
接收模块,用于接收用户的查询信息和搜索频道信息,所述的查询信息为查询关键词或点击的类目信息;
查询模块,用于在所述搜索频道内查询与所述查询信息相关的相关产品信息;
计算模块,用于分别计算所述相关产品信息的相关性得分和产品信息特征得分;所述的相关性得分表示所述查询信息和所述产品信息的匹配程度;
排序模块,用于将所述相关产品信息按照相关性得分和产品信息特征得分进行排序。
10.根据权利要求9所述的装置,其特征在于,所述查询模块包括:
信息获取模块,用于根据所述搜索频道信息获取所述搜索频道的所有产品信息;
信息查询模块,用于根据所述查询信息在所述所有产品信息中查询与所述查询信息相关的相关产品信息。
11.根据权利要求10所述的装置,其特征在于,所述查询信息为查询关键词时,所述信息查询模块包括:
字段获取模块,用于根据查询关键词得到至少一个关键字段;
产品查询模块,用于在所述所有产品信息中查询与所述至少一个关键字段相匹配的相关产品信息。
12.根据权利要求11所述的装置,其特征在于,所述计算模块具体用于将所述相关产品信息根据搜索频道对应的预先训练的排序模型计算相关性得分;以及,
用于将所述相关产品信息根据搜索频道对应的预先训练的产品特征排序模型计算产品特征得分。
13.根据权利要求10所述的装置,其特征在于,所述查询信息为点击的类目信息时,所述信息查询模块具体用于根据用户的点击的类目信息在所述所有产品信息中查询与所述类目信息相关的相关产品信息。
14.根据权利要求13所述的装置,其特征在于,所述计算模块具体用于根据所述产品信息与所述类目的可靠性程度计算相关性得分,所述的可靠性程度表示产品信息描述与所述类目的接近程度;以及,
用于将所述相关产品信息根据搜索频道对应的预先训练的产品特征排序模型计算产品特征得分。
15.根据权利要求12或14所述的装置,其特征在于,所述的计算模块包括:
查询判断模块,用于查询是否保存了所述相关产品信息的产品特征;
特征抽取模块,用于当所述查询判断模块的结果为否时,抽取所述相关产品信息的产品特征;
特征计算模块,用于当所述查询判断模块的结果为是时,根据搜索频道对应的预先训练的产品特征排序模型直接计算产品信息特征得分;或者,当所述查询判断模块的结果为否时,根据搜索频道对应的预先训练的产品特征排序模型,计算所述特征抽取模块抽取的产品信息特征得分。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
特征保存模块,用于保存所述特征抽取模块抽取得到的每条相关产品信息的产品信息特征。
CN2010105719465A 2010-12-03 2010-12-03 一种搜索排序方法和装置 Pending CN102486781A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105719465A CN102486781A (zh) 2010-12-03 2010-12-03 一种搜索排序方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105719465A CN102486781A (zh) 2010-12-03 2010-12-03 一种搜索排序方法和装置

Publications (1)

Publication Number Publication Date
CN102486781A true CN102486781A (zh) 2012-06-06

Family

ID=46152274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105719465A Pending CN102486781A (zh) 2010-12-03 2010-12-03 一种搜索排序方法和装置

Country Status (1)

Country Link
CN (1) CN102486781A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914492A (zh) * 2013-01-09 2014-07-09 阿里巴巴集团控股有限公司 查询词融合方法、商品信息发布方法和搜索方法及系统
CN104933172A (zh) * 2015-06-30 2015-09-23 百度在线网络技术(北京)有限公司 一种基于用户搜索行为的信息推送方法和装置
CN106202390A (zh) * 2016-07-08 2016-12-07 荆伟 一种数据库完善系统及方法
CN106649302A (zh) * 2015-10-28 2017-05-10 腾讯科技(深圳)有限公司 一种搜索排序方法以及装置
CN106844436A (zh) * 2016-12-15 2017-06-13 北京小度信息科技有限公司 查询结果的排序方法及装置
CN107292690A (zh) * 2016-03-31 2017-10-24 杨舜凯 一种基于神经网络的跨界易物平台实现方法及平台
CN107526846A (zh) * 2017-09-27 2017-12-29 百度在线网络技术(北京)有限公司 频道排序模型的生成、排序方法、装置、服务器和介质
CN109784495A (zh) * 2018-12-14 2019-05-21 东软集团股份有限公司 特征处理流程的建立方法、装置、存储介质及电子设备
CN109961329A (zh) * 2017-12-14 2019-07-02 北京京东尚科信息技术有限公司 物品处理方法及装置、存储介质和电子设备
CN112765492A (zh) * 2020-12-31 2021-05-07 浙江省方大标准信息有限公司 一种检验检测机构排序方法
CN113344201A (zh) * 2021-06-22 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法及装置
CN116340395A (zh) * 2023-05-29 2023-06-27 深圳市玩物科技有限公司 一种基于优化检索条件的设备信息检索方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101137985A (zh) * 2005-03-10 2008-03-05 雅虎公司 重排序和提高搜索结果的相关性
CN101179701A (zh) * 2006-12-28 2008-05-14 腾讯科技(深圳)有限公司 一种节目搜索系统及节目搜索结果排序方法
US20080294620A1 (en) * 2007-05-23 2008-11-27 Microsoft Corporation User-defined relevance ranking for search
CN101437039A (zh) * 2007-11-15 2009-05-20 华为技术有限公司 一种移动搜索的方法、系统和设备
CN101661474A (zh) * 2008-08-26 2010-03-03 华为技术有限公司 一种搜索方法和系统
CN101025740B (zh) * 2006-02-21 2010-08-25 腾讯科技(深圳)有限公司 图片搜索结果自动播放方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101137985A (zh) * 2005-03-10 2008-03-05 雅虎公司 重排序和提高搜索结果的相关性
CN101025740B (zh) * 2006-02-21 2010-08-25 腾讯科技(深圳)有限公司 图片搜索结果自动播放方法
CN101179701A (zh) * 2006-12-28 2008-05-14 腾讯科技(深圳)有限公司 一种节目搜索系统及节目搜索结果排序方法
US20080294620A1 (en) * 2007-05-23 2008-11-27 Microsoft Corporation User-defined relevance ranking for search
CN101437039A (zh) * 2007-11-15 2009-05-20 华为技术有限公司 一种移动搜索的方法、系统和设备
CN101661474A (zh) * 2008-08-26 2010-03-03 华为技术有限公司 一种搜索方法和系统

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914492B (zh) * 2013-01-09 2018-02-27 阿里巴巴集团控股有限公司 查询词融合方法、商品信息发布方法和搜索方法及系统
CN103914492A (zh) * 2013-01-09 2014-07-09 阿里巴巴集团控股有限公司 查询词融合方法、商品信息发布方法和搜索方法及系统
CN104933172A (zh) * 2015-06-30 2015-09-23 百度在线网络技术(北京)有限公司 一种基于用户搜索行为的信息推送方法和装置
CN106649302A (zh) * 2015-10-28 2017-05-10 腾讯科技(深圳)有限公司 一种搜索排序方法以及装置
CN107292690A (zh) * 2016-03-31 2017-10-24 杨舜凯 一种基于神经网络的跨界易物平台实现方法及平台
CN106202390B (zh) * 2016-07-08 2020-09-15 荆伟 一种数据库完善系统及方法
CN106202390A (zh) * 2016-07-08 2016-12-07 荆伟 一种数据库完善系统及方法
CN106844436A (zh) * 2016-12-15 2017-06-13 北京小度信息科技有限公司 查询结果的排序方法及装置
CN106844436B (zh) * 2016-12-15 2020-07-31 北京星选科技有限公司 查询结果的排序方法及装置
CN107526846A (zh) * 2017-09-27 2017-12-29 百度在线网络技术(北京)有限公司 频道排序模型的生成、排序方法、装置、服务器和介质
CN109961329A (zh) * 2017-12-14 2019-07-02 北京京东尚科信息技术有限公司 物品处理方法及装置、存储介质和电子设备
CN109784495A (zh) * 2018-12-14 2019-05-21 东软集团股份有限公司 特征处理流程的建立方法、装置、存储介质及电子设备
CN112765492A (zh) * 2020-12-31 2021-05-07 浙江省方大标准信息有限公司 一种检验检测机构排序方法
CN112765492B (zh) * 2020-12-31 2021-08-10 浙江省方大标准信息有限公司 一种检验检测机构排序方法
CN113344201A (zh) * 2021-06-22 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法及装置
CN116340395A (zh) * 2023-05-29 2023-06-27 深圳市玩物科技有限公司 一种基于优化检索条件的设备信息检索方法和系统
CN116340395B (zh) * 2023-05-29 2023-07-28 深圳市玩物科技有限公司 一种基于优化检索条件的设备信息检索方法和系统

Similar Documents

Publication Publication Date Title
CN102486781A (zh) 一种搜索排序方法和装置
CN102236663B (zh) 一种基于垂直搜索的查询方法、系统和装置
CN102446180B (zh) 一种商品搜索方法及其装置
CN102722481B (zh) 一种用户收藏夹数据的处理方法及搜索方法
KR101419504B1 (ko) 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법
CN102129431B (zh) 应用于网上交易平台的检索方法和系统
CN103530299A (zh) 一种搜索结果的生成方法及装置
CN103577432A (zh) 一种商品信息搜索方法和系统
CN106062743A (zh) 用于关键字建议的系统和方法
Prihastomo et al. The key success factors in e-marketplace implementation: A systematic literature review
CN106959971B (zh) 用户行为数据的处理方法及装置
CN103034680B (zh) 针对终端设备的数据交互方法及装置
CN101520784A (zh) 信息发布系统和信息发布方法
CN102339433A (zh) 一种应用于网上交易平台的数据处理方法、装置和服务器
CN103377190A (zh) 一种基于交易平台的供应商信息搜索方法和装置
CN101930438A (zh) 一种搜索结果生成方法及信息搜索系统
CN101206674A (zh) 以商品为媒介的增强型相关搜索系统及其方法
CN104077286A (zh) 商品信息的搜索方法及系统
CN102760144A (zh) 信息搜索方法及系统
CN102385585A (zh) 网页数据库的建立方法、网页搜索方法以及相关装置
CN201111143Y (zh) 一种商品成交价格信息采集和查询系统
CN103020128B (zh) 与终端设备交互数据的方法与装置
CN105468649B (zh) 一种待展示对象匹配的判断方法及其装置
CN102456057A (zh) 基于网上交易平台的检索方法、装置和服务器
CN111654714B (zh) 信息处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1166393

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120606

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1166393

Country of ref document: HK