CN105630836B - 搜索结果的排序方法和装置 - Google Patents
搜索结果的排序方法和装置 Download PDFInfo
- Publication number
- CN105630836B CN105630836B CN201410635331.2A CN201410635331A CN105630836B CN 105630836 B CN105630836 B CN 105630836B CN 201410635331 A CN201410635331 A CN 201410635331A CN 105630836 B CN105630836 B CN 105630836B
- Authority
- CN
- China
- Prior art keywords
- information
- price
- user
- search result
- clicking rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提出一种搜索结果的排序方法和装置,该搜索结果的排序方法包括获取价格词典,所述价格词典中保存第一信息与第二信息的对应关系,所述价格词典是根据用户的历史操作行为确定的;获取当前的第一信息;根据所述价格词典中保存的所述第一信息与所述第二信息的对应关系,获取所述当前的第一信息对应的当前的第二信息;根据所述搜索词获取搜索结果,确定所述搜索结果的价格信息,并根据所述当前的第二信息和所述搜索结果的价格信息获取所述搜索结果对应的点击率;根据所述点击率,确定所述搜索结果的排序因子,并根据所述排序因子,对所述搜索结果进行排序。该方法能够满足用户需求并实现反作弊。
Description
技术领域
本申请涉及信息技术领域,尤其涉及一种搜索结果的排序方法和装置。
背景技术
在搜索引擎中,对搜索对象的排序是非常重要的一个环节。搜索对象的排序直接影响用户对搜索服务的评价。搜索结果的排序一般除了考虑搜索词和搜索对象的文本匹配度外,还会考虑搜索对象本身的一些特征,比如搜索对象的展现频次、搜索对象发布的时间等等。
在电子商务场景中,用户在需要购买商品时,可以通过购物网站搜索得到商品,并进行购买。示例性的,商品的价格一般是电子商务场景下搜索引擎对搜索对象的排序时参照的一项重要指标。因此,商品的发布者为了提升商品信息的曝光率,可能会有意为商品信息设定较低的价格诱导用户点击、浏览。因此,目前的一些购物网站中,当用户输入商品的搜索词后,搜索结果中会存在很多的低价商品。但是,对于一些用户来讲并不希望充斥大量低价商品,并且一些低价商品是卖家为了吸引点击制造的作弊商品,需要解决反作弊的问题。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种搜索结果的排序方法,该方法可以满足用户需求并实现反作弊。
本申请的另一个目的在于提出一种搜索结果的排序装置。
为达到上述目的,本申请第一方面实施例提出的搜索结果的排序方法,包括:获取价格词典,所述价格词典中保存第一信息与第二信息的对应关系,所述第一信息包括:搜索词,用户的特征信息和搜索词所属的类目,所述第二信息是关系曲线,所述关系曲线是搜索结果的价格信息与点击率之间的关系曲线,所述价格词典是根据用户的历史操作行为确定的;获取当前的第一信息,所述当前的第一信息包括:当前用户输入的当前搜索词,所述当前用户的当前特征信息和所述当前搜索词所属的当前类目;根据所述价格词典中保存的所述第一信息与所述第二信息的对应关系,获取所述当前的第一信息对应的当前的第二信息;根据所述搜索词获取搜索结果,确定所述搜索结果的价格信息,并根据所述当前的第二信息和所述搜索结果的价格信息获取所述搜索结果对应的点击率;根据所述点击率,确定所述搜索结果的排序因子,并根据所述排序因子,对所述搜索结果进行排序。
本申请第一方面实施例提出的搜索结果的排序方法,通过获取价格词典,根据该价格词典确定当前的第一信息对应的当前的第二信息,当前的第二信息是价格与点击率的关系曲线,并根据该关系曲线确定搜索结果对应的点击率,以及根据该点击率确定排序因子并进行排序,可以实现基于点击率的搜索结果的排序,由于点击率可以反映用户偏好,因此可以将用户偏好的搜索结果排序在前,满足用户需求,并且根据用户偏好进行排序,还可以实现反作弊。
为达到上述目的,本申请第二方面实施例提出的搜索结果的排序装置,包括:第一获取模块,用于获取价格词典,所述价格词典中保存第一信息与第二信息的对应关系,所述第一信息包括:搜索词,用户的特征信息和搜索词所属的类目,所述第二信息是关系曲线,所述关系曲线是搜索结果的价格信息与点击率之间的关系曲线,所述价格词典是根据用户的历史操作行为确定的;第二获取模块,用于获取当前的第一信息,所述当前的第一信息包括:当前用户输入的当前搜索词,所述当前用户的当前特征信息和所述当前搜索词所属的当前类目;第三获取模块,用于根据所述价格词典中保存的所述第一信息与所述第二信息的对应关系,获取所述当前的第一信息对应的当前的第二信息;第四获取模块,用于根据所述搜索词获取搜索结果,确定所述搜索结果的价格信息,并根据所述当前的第二信息和所述搜索结果的价格信息获取所述搜索结果对应的点击率;排序模块,用于根据所述点击率,确定所述搜索结果的排序因子,并根据所述排序因子,对所述搜索结果进行排序。
本申请第二方面实施例提出的搜索结果的排序装置,通过获取价格词典,根据该价格词典确定当前的第一信息对应的当前的第二信息,当前的第二信息是价格与点击率的关系曲线,并根据该关系曲线确定搜索结果对应的点击率,以及根据该点击率确定排序因子并进行排序,可以实现基于点击率的搜索结果的排序,由于点击率可以反映用户偏好,因此可以将用户偏好的搜索结果排序在前,满足用户需求,并且根据用户偏好进行排序,还可以实现反作弊。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一实施例提出的搜索结果的展示方法的流程示意图;
图2是本申请另一实施例提出的搜索结果的展示方法的流程示意图;
图3是图2对应的系统结构示意图;
图4是本申请另一实施例提出的搜索结果的排序装置的结构示意图;
图5是本申请另一实施例提出的搜索结果的排序装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本申请一实施例提出的搜索结果的展示方法的流程示意图,该方法包括:
S11:获取价格词典,所述价格词典中保存第一信息与第二信息的对应关系,所述第一信息包括:搜索词,用户的特征信息和搜索词所属的类目,所述第二信息是关系曲线,所述关系曲线是搜索结果的价格信息与点击率之间的关系曲线,所述价格词典是根据用户的历史操作行为确定的。
其中,价格词典可以在离线时建立。
具体的,以用户的特征信息是用户购买力信息为例,可以统计用户的历史行为,例如,统计用户点击和/或购买的商品的价格确定用户的购买力信息,例如,用户大部分购买的商品的价位在预先设置的高档价位中,则可以确定用户是高端用户,反之,用户属于低端用户。
在每个档位中,可以获取该档位中用户的历史搜索词,根据搜索词的属性可以确定该历史搜索词的类目,例如,属于衣服或者鞋等;
另外,通过搜索还可以获取与历史搜索词对应的历史搜索结果,历史搜索结果例如为历史搜索词对应的历史商品,根据商品属性可以确定该历史商品的价格,再根据用户的点击日志,可以确定不同价位的历史商品对应的点击率,因此,根据历史商品的价格和点击率可以建立价格与点击率之间的关系曲线。
并且,基于得到该关系曲线时的输入信息的不同,输入信息包括:用户的特征信息,历史搜索词和类目,可以建立输入信息与关系曲线的对应关系,也就得到上述的第一信息与第二信息的对应关系。例如,对应不同购买力的用户,关系曲线是不同的,例如,对于高端用户,同样在搜索毛衣时,价格500对应的点击率可能是50%,则对于低端用户,价格500对应的点击率可能只有10%。因此,对于不同购买力的用户,价格与点击率之间的关系曲线是不同的。
类似的,对于同一档位的用户,当搜索词不同时,得到的关系曲线也可能不同,例如,对于高端用户,当搜索毛衣时,价格500对应的点击率可能是50%,而搜索手机时,价格500对应的点击率可能只有5%。
因此,搜索词,用户的特征信息和类目中的任一项不同时,得到的关系曲线也可能是不同的。
可以根据历史操作行为,建立上述的第一信息与第二信息的对应关系。
需要说明的是,关于价格词典的建立过程具体可以参见后续图2所示实施例中的S21-S23以及图3中的离线部分。
S12:获取当前的第一信息,所述当前的第一信息包括:当前用户输入的当前搜索词,所述当前用户的当前特征信息和所述当前搜索词所属的当前类目。
用户在搜索商品时,可以在客户端的搜索栏中输入搜索词(query),例如“Nike”,搜索词也可以称为查询词。之后,服务端可以接收客户端发送的该搜索词。
用户的特征信息可以是用户购买力信息,可以根据预先建立的用户与用户的特征信息之间的对应关系确定该用户的特征信息,例如,预先建立第一用户与第一特征信息对应,则当输入搜索词的用户是第一用户时,可以确定用户的特征信息是第一特征信息。用户可以用账号,邮箱,手机号,身份证号等中的一项或者多项进行标识。
用户与用户的特征信息之间的对应关系可以用户的历史数据建立。例如,所述用户的特征信息是用户购买力信息,所述获取用户与用户的特征信息之间的对应关系,包括:
获取用户的商品交易数据和点击日志;
根据所述商品交易数据中交易的商品的价格,以及所述点击日志中点击的商品的价格,获取用户与用户的特征信息之间的对应关系。
例如,预先对商品价格进行分档,具体如,商品价格大于或等于预设阈值时属于高档商品,商品价格小于预设阈值时属于低廉商品;再根据用户历史交易和/或点击的商品确定用户购买力信息,例如,用户历史交易和/或点击的商品属于高档商品的比例大于预设比例,则确定用户购买力信息是用户购买力属于高档,反之属于低廉。
可以预先建立搜索词与类目之间的对应关系,根据该对应关系确定搜索词所属的类目。例如,以商品为例,可以确定每个商品属于的类目,具体如,属于衣服,鞋子,包,饰品等。可以理解的是,一个搜索词可以对应多个类目,例如,“Nike”所属的类目可以包括:衣服,鞋,包等。或者,用户也可以在搜索栏直接输入类目,例如,用户输入“Nike”+“衣服”。
当用户进行在线搜索时,可以将当前输入的搜索词确定为当前搜索词,当前进行输入的用户的特征信息确定为当前特征信息,当前搜索词属于的类目确定为当前类目。
S13:根据所述价格词典中保存的所述第一信息与所述第二信息的对应关系,获取所述当前的第一信息对应的当前的第二信息。
当前的第二信息是价格信息与点击率之间的关系曲线。
如上所示,价格词典中保存第一信息与第二信息的对应关系,第一信息不同时第二信息也可以不同,因此,根据该对应关系以及当前的第一信息,可以确定与当前的第一信息对应的当前的第二信息。
以第一信息用搜索词+类目+购买力表示为例,例如,价格词典中预先保存的信息包括:第一搜索词+第一类目+第一购买力对应的关系曲线是第一关系曲线,以及,第二搜索词+第二类目+第二购买力对应的关系曲线是第二关系曲线等。
例如,预先保存的信息中包括:“Nike”+“高档”+“衣服”对应的关系曲线是第一关系曲线时,如果用户输入的当前搜索词是“Nike”,并获取用户的当前特征信息是购买力属于高档,Nike属于的类目是衣服时,则可以确定对应的关系曲线是第一关系曲线。
S14:根据所述搜索词获取搜索结果,确定所述搜索结果的价格信息,并根据所述当前的第二信息和所述搜索结果的价格信息获取所述搜索结果对应的点击率。
服务端获取搜索词后,可以在预先保存的数据中找到与该搜索词对应的搜索结果,例如,搜索词是“Nike”时,可以找到对应的衣服,鞋等。
在找到对应的搜索结果后,可以根据预先记录的信息确定搜索结果的价格信息,例如,商品搜索时,服务端会保存每个商品的价格信息,根据保存的价格信息可以确定每个搜索结果的价格信息。
在获取当前的第二信息并确定每个搜索结果的价格信息之后,由于第二信息是关系曲线,关系曲线表征价格信息与点击率的对应关系,因此可以根据该关系曲线确定每个搜索结果的点击率,例如,当前的第二信息是第一关系曲线,第一关系曲线表明第一价格对应第一点击率,第二价格对应第二点击率,则当第一搜索结果的价格是第一价格时,第二商品的价格是第二价格时,可以确定第一搜索结果的点击率是第一点击率,第二搜索结果的点击率是第二点击率。
S15:根据所述点击率,确定所述搜索结果的排序因子,并根据所述排序因子,对所述搜索结果进行排序。
可选的,所述根据所述点击率,确定所述搜索结果的排序因子包括:将所述点击率,确定为所述搜索结果的排序因子。
例如,第一搜索结果的点击率是0.5,第二搜索结果的点击率是0.3,则可以确定第一搜索结果的排序因子是0.5,第二搜索结果的排序因子是0.3。
可选的,所述根据所述点击率,确定所述搜索结果的排序因子包括:对所述搜索结果的价格信息进行预设函数运算,得到运算后的函数值;将所述点击率与所述运算后的函数值进行相乘,将相乘后的数值确定为所述搜索结果的排序因子。
可选的,所述预设函数是严格递增函数。例如,预设函数是sigmod函数。
例如,根据每个搜索结果的价格和sigmod函数,得到每个搜索结果的sigmod因子,之后再将sigmod因子乘以点击率得到排序因子。例如,根据第一搜索结果的价格得到第一sigmod因子,第一搜索结果对应的点击率是第一点击率,则第一搜索结果的排序因子是第一sigmod因子*第一点击率,类似的,第二搜索结果的排序因子是第二sigmod因子*第二点击率。
通过对所述搜索结果的价格信息进行预设函数运算,得到运算后的函数值,并在点击率基础上乘以运算后的函数值作为排序因子,由于预设函数是严格递增函数,可以使得价格越高的商品对应的函数值越大,相应的排序因子越大,从而在排序时可以排序在前。
在获取排序因子后,可以根据排序因子的大小进行降序排列。例如,第一搜索结果的排序因子比第二搜索结果的排序因子大,则第一搜索结果排序在第二搜索结果的前面。
进一步的,服务端在获取排序后的搜索结果后,可以将排序后的搜索结果发送给客户端,客户端根据排序结果进行展示,例如,第一搜索结果排序在第二搜索结果的前面,则展示时第一搜索结果展示在第二搜索结果的前面。
另外,可以理解的是,服务端得到排序后的搜索结果后,还可以按序选择预设个数的搜索结果,之后将预设个数的搜索结果发送给客户端进行展示。
本实施例通过获取价格词典,根据该价格词典确定当前的第一信息对应的当前的第二信息,当前的第二信息是价格与点击率的关系曲线,并根据该关系曲线确定搜索结果对应的点击率,以及根据该点击率确定排序因子并进行排序,可以实现基于点击率的搜索结果的排序,由于点击率可以反映用户偏好,因此可以将用户偏好的搜索结果排序在前,满足用户需求,并且根据用户偏好进行排序,还可以实现反作弊。
图2是本申请另一实施例提出的搜索结果的展示方法的流程示意图,本实施例以商品搜索为例,图3是图2对应的系统结构示意图。
参见图3,本实施例对应的系统可以包括离线部分31和在线部分32。预先保存的以搜索词和类目以及特征信息为粒度的信息可以保存在价格词典中,离线部分31用于构建价格词典,在线部分32用于根据用户输入的搜索词实时计算搜索结果的排序因子并进行搜索结果的排序。
离线部分31可以包括用户购买力的计算模块311,搜索词+类目+购买力粒度下浏览点击数据收集模块312,搜索词+类目+购买力粒度下价格偏好区间的计算模块313,还可以包括人工干预模块314。
可以理解的是,本实施例中,搜索词,类目和购买力对应的信息,可以称为搜索词+类目+购买力粒度下的信息。
在线部分32可以包括商品排序模块321。
参见图2,本实施例的方法包括:
S21:用户购买力的计算模块确定每种购买力信息对应的用户。
其中,用户购买力的计算模块可以获取商品交易数据和点击日志,根据所述商品交易数据中交易的商品的价格,以及所述点击日志中点击的商品的价格,确定每种购买力信息对应的用户。
用户的购买力信息用于判断用户喜欢购买高档的商品,还是喜欢低廉的商品。
例如,可以按照类目统计不同商品的价格分布情况,根据该分布情况划分预设档位,预设档位例如为5档。然后再统计用户在每个档位上的交易和/或点击的商品情况,将用户交易和/或点击的商品的价格占用比例最大的档位确定为用户的购买力信息。例如,第一用户大部分点击的商品的价格属于第一档位,则第一用户的购买力信息是第一档,类似的,可以得到每个档位的用户。
S22:搜索词+类目+购买力粒度下浏览点击数据收集模块获取每个购买力信息对应的用户的浏览日志和点击日志,并根据所述浏览日志和点击日志确定以搜索词和类目以及购买力信息为粒度的价格区间与点击率的关系曲线。
价格区间与点击率的关系曲线可以采用如下方式确定:
根据所述浏览日志,以搜索词和类目以及购买力信息为粒度,将历史搜索结果按照价格划分到预设个数的价格区间,并确定每个价格区间内的浏览数;
根据所述点击日志,以搜索词和类目以及购买力信息为粒度,确定在每个价格区间内对所述历史搜索结果的点击数;
根据所述每个价格区间内的点击数和所述每个价格区间内的浏览数,确定每个价格区间内的点击率,得到价格区间与点击率之间的关系曲线。
可选的,所述将历史搜索结果按照价格划分到预设个数的价格区间,包括:
获取所述历史搜索结果的原始价格;
对所述原始价格进行取对数运算,得到运算后的价格;
根据运算后的价格,将所述历史搜索结果划分到不同的价格区间。
可选的,每个价格区间的点击率是该价格区间的点击数与浏览数的比值。
例如,对应每档购买力信息,根据用户购买力计算模块可以确定该档购买力对应的用户,例如,对应第一档购买力,对应的用户包括第一用户,第二用户和第三用户等。
之后,可以先获取该档用户的浏览日志,例如获取第一用户的浏览日志,第二用户的浏览日志和第三用户的浏览日志等;再根据浏览日志中的每个搜索词,确定该搜索词的类目,以及获取与该搜索词对应的商品的总浏览数和每个商品的价格。
然后将价格从低到高排列,再按照预先设定的价格区间数将浏览数离散到每个价格区间中,例如,总的浏览数是N,预先设定的价格区间数是M,则每个价格区间内包括N/M的浏览数,则按照价格从低到高的顺序依次选择N/M个浏览的商品作为第一个价格区间的商品,之后再选择N/M个浏览的商品作为第二个价格区间的商品,依此类推,得到每个价格区间内的商品。可以理解的是,当N/M不是整数时,可以采用预设算法处理,例如,优先排满前面的价格区间,剩余的不足的个数放在最后一个价格区间内。
在得到每个价格区间内包括的商品后,可以根据该档用户的点击日志统计每个价格区间内用户点击的商品数。
之后再将每个价格区间内点击数/浏览数的比值确定为该价格区间的点击率。
需要说明的是,为了减少低价和高价相差太大的问题,可以对原始价格取对数(log)函数后作为价格区间的划分价格。
例如,在某一搜索词+类目+购买力的粒度下,总的浏览数是10000,假设要分为10个价格区间,则每个价格区间包括1000个浏览数,则可以对10000个商品的原始价格取对数,得到取对数后的价格,之后按照价格从小到大的顺序对10000个商品进行排序,之后,选择价格最低的1000个商品作为第一个价格区间的商品,且第一个价格区间的两端的价格是最低价的商品的取对数后的价格以及价格从小到大的顺序第1000个商品的取对数后的价格,类似的,第二个价格区间的商品是按价格从小到大的顺序第1001个商品到第2000个商品。在划分得到每个价格区间后,可以统计每个价格区间内的点击数,例如,第一个价格区间内点击了100次,第二个价格区间内点击了200次,则第一个价格区间的点击率是100/1000=0.1,第二个价格区间的点击率是200/1000=0.2。
S23:搜索词+类目+购买力粒度下价格偏好区间的计算模块根据所述价格区间与点击率的关系曲线,确定价格与点击率的关系曲线,得到以搜索词和类目以及购买力信息为粒度的价格与点击率的关系曲线。
可选的,价格与点击率的关系曲线可以采用如下方式确定:
对每个价格区间内点击数与浏览数的比值进行归一化处理,得到归一化处理后的点击率;
根据每个价格区间以及所述价格区间内所述归一化处理后的点击率,进行曲线拟合,得到价格与点击率的关系曲线。
例如,获取不同价格区间的点击率后,可以对点击率进行归一化处理,该价格区间的归一化后的点击率=该价格区间的点击率/所有价格区间点击率之和。
由于点击率是一个反应用户偏好度的指标,所有基于点击率来计算用户偏好的价格区间段,是非常有意义的。
在得到不同价格区间的归一化处理后的点击率后,可以采用曲线拟合的方式,得到不同价格对应的点击率,曲线拟合例如为多项式拟合,从而得到以搜索词+类目+购买力为粒度的价格与点击率的关系曲线。
另外,人工干预模块用于调整部分拟合效果不好,或者根据业务需求,对该query下重新设定拟合函数的参数。
离线部分最终获得一份价格词典,每行是query+类目+购买力维度下的曲线拟合参数信息,曲线是指价格与点击率的关系曲线。
S24:商品排序模块获取用户输入的搜索词,并获取与搜索词对应的作为搜索结果的商品,并对商品进行排序。
例如,客户端接收用户输入的搜索词后,客户端将搜索词以及用户的标识信息发送给服务端,服务端中的商品排序模块可以获取该搜索词,并且可以从用户搜索词分析平台获取用户的购买力信息。
用户搜索词分析平台根据预先保存的用户(具体可以是指用户的标识信息)与用户的购买力信息的对应关系,确定该用户的购买力信息。用户的标识信息例如用户的账号,邮箱或者手机号等。
商品排序模块从用户搜索词分析平台获取用户的购买力信息,以及,商品排序模块还可以从商品索引中确定该搜索词对应的每个商品的类目和价格等。
在商品排序模块获取搜索词,用户购买力信息,商品的类目和价格后,可以从离线部分中获取以搜索词+类目+用户购买力信息为粒度的价格与点击率的关系曲线,根据该离线部分保存的信息,可以查询到与在线的搜索词+用户购买力信息+类目对应的价格与点击率的关系曲线,再根据该关系曲线以及每个商品的价格,得到每个商品的点击率。之后可以根据该点击率进行排序。
可选的,所述根据所述点击率,确定所述搜索结果的排序因子包括:将所述点击率,确定为所述搜索结果的排序因子。
例如,第一搜索结果的点击率是0.5,第二搜索结果的点击率是0.3,则可以确定第一搜索结果的排序因子是0.5,第二搜索结果的排序因子是0.3。
可选的,所述根据所述点击率,确定所述搜索结果的排序因子包括:对所述搜索结果的价格信息进行预设函数运算,得到运算后的函数值;将所述点击率与所述运算后的函数值进行相乘,将相乘后的数值确定为所述搜索结果的排序因子。
可选的,所述搜索结果的价格信息是价格信息,所述预设函数是严格递增函数。例如,预设函数是sigmod函数。
例如,根据每个搜索结果的价格和sigmod函数,得到每个搜索结果的sigmod因子,之后再将sigmod因子乘以点击率得到排序因子。例如,根据第一搜索结果的价格得到第一sigmod因子,第一搜索结果对应的点击率是第一点击率,则第一搜索结果的排序因子是第一sigmod因子*第一点击率,类似的,第二搜索结果的排序因子是第二sigmod因子*第二点击率。
通过对所述搜索结果的价格信息进行预设函数运算,得到运算后的函数值,并在点击率基础上乘以运算后的函数值作为排序因子,由于预设函数是严格递增函数,可以使得价格越高的商品对应的函数值越大,相应的排序因子越大,从而在排序时可以排序在前。
在获取排序因子后,可以根据排序因子的大小进行降序排列。例如,第一搜索结果的排序因子比第二搜索结果的排序因子大,则第一搜索结果排序在第二搜索结果的前面。
进一步的,服务端在获取排序后的搜索结果后,可以将排序后的搜索结果发送给客户端,客户端根据排序结果进行展示,例如,第一搜索结果排序在第二搜索结果的前面,则展示时第一搜索结果展示在第二搜索结果的前面。
另外,可以理解的是,服务端得到排序后的搜索结果后,还可以按序选择预设个数的搜索结果,之后将预设个数的搜索结果发送给客户端进行展示。
本实施例通过确定用户输入的搜索词和搜索词所属的类目以及用户的特征信息对应的关系曲线,并根据该关系曲线确定搜索结果对应的点击率,以及根据该点击率确定排序因子并进行排序,可以实现基于点击率的搜索结果的排序,由于点击率可以反映用户偏好,因此可以将用户偏好的搜索结果排序在前,满足用户需求,并且根据用户偏好进行排序,还可以实现反作弊。另外,本实施例通过曲线拟合,可以根据价格区间与点击率的关系曲线得到价格与点击率的关系曲线;另外,本实施例在排序时根据点击率和商品价格得到排序因子,可以将价格高的商品排在前面,降低低价商品的展示。
图4是本申请另一实施例提出的搜索结果的排序装置的结构示意图,该装置40包括第一获取模块41、第二获取模块42、第三获取模块43、第四获取模块44和排序模块45。
第一获取模块41用于获取价格词典,所述价格词典中保存第一信息与第二信息的对应关系,所述第一信息包括:搜索词,用户的特征信息和搜索词所属的类目,所述第二信息是关系曲线,所述关系曲线是搜索结果的价格信息与点击率之间的关系曲线,所述价格词典是根据用户的历史操作行为确定的;
其中,价格词典可以在离线时建立。
具体的,以用户的特征信息是用户购买力信息为例,可以统计用户的历史行为,例如,统计用户点击和/或购买的商品的价格确定用户的购买力信息,例如,用户大部分购买的商品的价位在预先设置的高档价位中,则可以确定用户是高端用户,反之,用户属于低端用户。
在每个档位中,可以获取该档位中用户的历史搜索词,根据搜索词的属性可以确定该历史搜索词的类目,例如,属于衣服或者鞋等;
另外,通过搜索还可以获取与历史搜索词对应的历史搜索结果,历史搜索结果例如为历史搜索词对应的历史商品,根据商品属性可以确定该历史商品的价格,再根据用户的点击日志,可以确定不同价位的历史商品对应的点击率,因此,根据历史商品的价格和点击率可以建立价格与点击率之间的关系曲线。
并且,基于得到该关系曲线时的输入信息的不同,输入信息包括:用户的特征信息,历史搜索词和类目,可以建立输入信息与关系曲线的对应关系,也就得到上述的第一信息与第二信息的对应关系。例如,对应不同购买力的用户,关系曲线是不同的,例如,对于高端用户,同样在搜索毛衣时,价格500对应的点击率可能是50%,则对于低端用户,价格500对应的点击率可能只有10%。因此,对于不同购买力的用户,价格与点击率之间的关系曲线是不同的。
类似的,对于同一档位的用户,当搜索词不同时,得到的关系曲线也可能不同,例如,对于高端用户,当搜索毛衣时,价格500对应的点击率可能是50%,而搜索手机时,价格500对应的点击率可能只有5%。
因此,搜索词,用户的特征信息和类目中的任一项不同时,得到的关系曲线也可能是不同的。
可以根据历史操作行为,建立上述的第一信息与第二信息的对应关系。
需要说明的是,关于价格词典的建立过程具体可以参见图2所示实施例中的S21-S23以及图3中的离线部分。
第二获取模块42用于获取当前的第一信息,所述当前的第一信息包括:当前用户输入的当前搜索词,所述当前用户的当前特征信息和所述当前搜索词所属的当前类目;
用户在搜索商品时,可以在客户端的搜索栏中输入搜索词(query),例如“Nike”,搜索词也可以称为查询词。之后,服务端可以接收客户端发送的该搜索词。
用户的特征信息可以是用户购买力信息,可以根据预先建立的用户与用户的特征信息之间的对应关系确定该用户的特征信息,例如,预先建立第一用户与第一特征信息对应,则当输入搜索词的用户是第一用户时,可以确定用户的特征信息是第一特征信息。用户可以用账号,邮箱,手机号,身份证号等中的一项或者多项进行标识。
用户与用户的特征信息之间的对应关系可以用户的历史数据建立。例如,所述用户的特征信息是用户购买力信息,所述获取用户与用户的特征信息之间的对应关系,包括:
获取用户的商品交易数据和点击日志;
根据所述商品交易数据中交易的商品的价格,以及所述点击日志中点击的商品的价格,获取用户与用户的特征信息之间的对应关系。
例如,预先对商品价格进行分档,具体如,商品价格大于或等于预设阈值时属于高档商品,商品价格小于预设阈值时属于低廉商品;再根据用户历史交易和/或点击的商品确定用户购买力信息,例如,用户历史交易和/或点击的商品属于高档商品的比例大于预设比例,则确定用户购买力信息是用户购买力属于高档,反之属于低廉。
可以预先建立搜索词与类目之间的对应关系,根据该对应关系确定搜索词所属的类目。例如,以商品为例,可以确定每个商品属于的类目,具体如,属于衣服,鞋子,包,饰品等。可以理解的是,一个搜索词可以对应多个类目,例如,“Nike”所属的类目可以包括:衣服,鞋,包等。或者,用户也可以在搜索栏直接输入类目,例如,用户输入“Nike”+“衣服”。
当用户进行在线搜索时,可以将当前输入的搜索词确定为当前搜索词,当前进行输入的用户的特征信息确定为当前特征信息,当前搜索词属于的类目确定为当前类目。
第三获取模块43用于根据所述价格词典中保存的所述第一信息与所述第二信息的对应关系,获取所述当前的第一信息对应的当前的第二信息;
当前的第二信息是价格信息与点击率之间的关系曲线。
如上所示,价格词典中保存第一信息与第二信息的对应关系,第一信息不同时第二信息也可以不同,因此,根据该对应关系以及当前的第一信息,可以确定与当前的第一信息对应的当前的第二信息。
以第一信息用搜索词+类目+购买力表示为例,例如,价格词典中预先保存的信息包括:第一搜索词+第一类目+第一购买力对应的关系曲线是第一关系曲线,以及,第二搜索词+第二类目+第二购买力对应的关系曲线是第二关系曲线等。
例如,预先保存的信息中包括:“Nike”+“高档”+“衣服”对应的关系曲线是第一关系曲线时,如果用户输入的当前搜索词是“Nike”,并获取用户的当前特征信息是购买力属于高档,Nike属于的类目是衣服时,则可以确定对应的关系曲线是第一关系曲线。
第四获取模块44用于根据所述搜索词获取搜索结果,确定所述搜索结果的价格信息,并根据所述当前的第二信息和所述搜索结果的价格信息获取所述搜索结果对应的点击率;
服务端获取搜索词后,可以在预先保存的数据中找到与该搜索词对应的搜索结果,例如,搜索词是“Nike”时,可以找到对应的衣服,鞋等。
在找到对应的搜索结果后,可以根据预先记录的信息确定搜索结果的价格信息,例如,商品搜索时,服务端会保存每个商品的价格信息,根据保存的价格信息可以确定每个搜索结果的价格信息。
在获取当前的第二信息并确定每个搜索结果的价格信息之后,由于第二信息是关系曲线,关系曲线表征价格信息与点击率的对应关系,因此可以根据该关系曲线确定每个搜索结果的点击率,例如,当前的第二信息是第一关系曲线,第一关系曲线表明第一价格对应第一点击率,第二价格对应第二点击率,则当第一搜索结果的价格是第一价格时,第二商品的价格是第二价格时,可以确定第一搜索结果的点击率是第一点击率,第二搜索结果的点击率是第二点击率。
排序模块45用于根据所述点击率,确定所述搜索结果的排序因子,并根据所述排序因子,对所述搜索结果进行排序。
可选的,所述排序模块45具体用于:
将所述点击率,确定为所述搜索结果的排序因子。
例如,第一搜索结果的点击率是0.5,第二搜索结果的点击率是0.3,则可以确定第一搜索结果的排序因子是0.5,第二搜索结果的排序因子是0.3。
可选的,所述排序模块45具体用于:
对所述搜索结果的价格信息进行预设函数运算,得到运算后的函数值;
将所述点击率与所述运算后的函数值进行相乘,将相乘后的数值确定为所述搜索结果的排序因子。
可选的,所述搜索结果的价格信息是价格信息,所述预设函数是严格递增函数。例如,预设函数是sigmod函数。
例如,根据每个搜索结果的价格和sigmod函数,得到每个搜索结果的sigmod因子,之后再将sigmod因子乘以点击率得到排序因子。例如,根据第一搜索结果的价格得到第一sigmod因子,第一搜索结果对应的点击率是第一点击率,则第一搜索结果的排序因子是第一sigmod因子*第一点击率,类似的,第二搜索结果的排序因子是第二sigmod因子*第二点击率。
通过对所述搜索结果的价格信息进行预设函数运算,得到运算后的函数值,并在点击率基础上乘以运算后的函数值作为排序因子,由于预设函数是严格递增函数,可以使得价格越高的商品对应的函数值越大,相应的排序因子越大,从而在排序时可以排序在前。
在获取排序因子后,可以根据排序因子的大小进行降序排列。例如,第一搜索结果的排序因子比第二搜索结果的排序因子大,则第一搜索结果排序在第二搜索结果的前面。
进一步的,服务端在获取排序后的搜索结果后,可以将排序后的搜索结果发送给客户端,客户端根据排序结果进行展示,例如,第一搜索结果排序在第二搜索结果的前面,则展示时第一搜索结果展示在第二搜索结果的前面。
另外,可以理解的是,服务端得到排序后的搜索结果后,还可以按序选择预设个数的搜索结果,之后将预设个数的搜索结果发送给客户端进行展示。
用户与用户的特征信息之间的对应关系可以用户的历史数据建立。例如,参见图5,该装置40还包括:保存模块45,用于获取用户与用户的特征信息之间的对应关系,并保存所述对应关系,以便在接收当前用户输入的当前搜索词后,根据所述对应关系获取所述当前用户的当前特征信息。
可选的,所述保存模块45具体用于:
获取用户的商品交易数据和点击日志;
根据所述商品交易数据中交易的商品的价格,以及所述点击日志中点击的商品的价格,获取用户与用户的特征信息之间的对应关系。
例如,预先对商品价格进行分档,具体如,商品价格大于或等于预设阈值时属于高档商品,商品价格小于预设阈值时属于低廉商品;再根据用户历史交易和/或点击的商品确定用户购买力信息,例如,用户历史交易和/或点击的商品属于高档商品的比例大于预设比例,则确定用户购买力信息是用户购买力属于高档,反之属于低廉。
可以预先建立搜索词与类目之间的对应关系,根据该对应关系确定搜索词所属的类目。例如,以商品为例,可以确定每个商品属于的类目,具体如,属于衣服,鞋子,包,饰品等。可以理解的是,一个搜索词可以对应多个类目,例如,“Nike”所属的类目可以包括:衣服,鞋,包等。或者,用户也可以在搜索栏直接输入类目,例如,用户输入“Nike”+“衣服”。
可以理解的是,搜索词,类目,特征信息对应的信息可以称为以搜索词+类目+特征信息为粒度的信息。
可选的,参见图5,该装置40还可以包括离线部分,具体可以包括:
特征信息计算模块46,用于根据用户的历史操作行为确定每个特征信息对应的用户;
以特征信息是用户购买力信息为例,该特征信息计算模块可以类似上述方法实施例中的用户购买力的计算模块,可以获取商品交易数据和点击日志,根据所述商品交易数据中交易的商品的价格,以及所述点击日志中点击的商品的价格,确定每种购买力信息对应的用户。
用户的购买力信息用于判断用户喜欢购买高档的商品,还是喜欢低廉的商品。
例如,可以按照类目统计不同商品的价格分布情况,根据该分布情况划分预设档位,预设档位例如为5档。然后再统计用户在每个档位上的交易和/或点击的商品情况,将用户交易和/或点击的商品的价格占用比例最大的档位确定为用户的购买力信息。例如,第一用户大部分点击的商品的价格属于第一档位,则第一用户的购买力信息是第一档,类似的,可以得到每个档位的用户。
第一统计模块47,用于获取所述每个特征信息对应的用户的浏览日志和点击日志,并根据所述浏览日志和点击日志确定所述第一信息与第三信息的对应关系,所述第三信息是价格区间与点击率之间的关系曲线;
第一统计模块可以类似上述方法实施例中的搜索词+类目+购买力粒度下浏览点击数据收集模块。
可选的,所述第一统计模块47具体用于:
根据所述浏览日志,以历史的第一信息为输入获取历史搜索结果,将历史搜索结果按照价格划分到预设个数的价格区间内,并确定每个价格区间内的浏览数;
根据所述点击日志,确定在所述每个价格区间内对所述历史搜索结果的点击数;
根据所述每个价格区间内的点击数和所述每个价格区间内的浏览数,确定每个价格区间内的点击率,得到价格区间与点击率之间的关系曲线;
根据所述历史的第一信息与所述得到的价格区间与点击率之间的关系区间,建立所述第一信息与所述第三信息的对应关系。
可选的,所述第一统计模块47进一步具体用于:
获取所述历史搜索结果的原始价格;
对所述原始价格进行取对数运算,得到运算后的价格;
根据运算后的价格,将所述历史搜索结果划分到不同的价格区间。
例如,对应每档购买力信息,根据用户购买力计算模块可以确定该档购买力对应的用户,例如,对应第一档购买力,对应的用户包括第一用户,第二用户和第三用户等。
之后,可以先获取该档用户的浏览日志,例如获取第一用户的浏览日志,第二用户的浏览日志和第三用户的浏览日志等;再根据浏览日志中的每个搜索词,确定该搜索词的类目,以及获取与该搜索词对应的商品的总浏览数和每个商品的价格。
然后将价格从低到高排列,再按照预先设定的价格区间数将浏览数离散到每个价格区间中,例如,总的浏览数是N,预先设定的价格区间数是M,则每个价格区间内包括N/M的浏览数,则按照价格从低到高的顺序依次选择N/M个浏览的商品作为第一个价格区间的商品,之后再选择N/M个浏览的商品作为第二个价格区间的商品,依此类推,得到每个价格区间内的商品。可以理解的是,当N/M不是整数时,可以采用预设算法处理,例如,优先排满前面的价格区间,剩余的不足的个数放在最后一个价格区间内。
在得到每个价格区间内包括的商品后,可以根据该档用户的点击日志统计每个价格区间内用户点击的商品数。
之后再将每个价格区间内点击数/浏览数的比值确定为该价格区间的点击率。
需要说明的是,为了减少低价和高价相差太大的问题,可以对原始价格取对数(log)函数后作为价格区间的划分价格。
例如,在某一搜索词+类目+购买力的粒度下,总的浏览数是10000,假设要分为10个价格区间,则每个价格区间包括1000个浏览数,则可以对10000个商品的原始价格取对数,得到取对数后的价格,之后按照价格从小到大的顺序对10000个商品进行排序,之后,选择价格最低的1000个商品作为第一个价格区间的商品,且第一个价格区间的两端的价格是最低价的商品的取对数后的价格以及价格从小到大的顺序第1000个商品的取对数后的价格,类似的,第二个价格区间的商品是按价格从小到大的顺序第1001个商品到第2000个商品。在划分得到每个价格区间后,可以统计每个价格区间内的点击数,例如,第一个价格区间内点击了100次,第二个价格区间内点击了200次,则第一个价格区间的点击率是100/1000=0.1,第二个价格区间的点击率是200/1000=0.2。
第二统计模块48,用于根据所述价格区间与点击率之间的关系曲线,确定价格与点击率之间的关系曲线;。
第二统计模块类似上述方法实施例中的搜索词+类目+购买力粒度下价格偏好区间的计算模块。
可选的,所述每个价格区间内的点击率是每个价格区间内点击数与浏览数的比值,所述第二统计模块48具体用于:
对每个价格区间内点击数与浏览数的比值进行归一化处理,得到归一化处理后的点击率;
根据每个价格区间以及所述价格区间内所述归一化处理后的点击率,进行曲线拟合,得到价格与点击率之间的关系曲线。
例如,获取不同价格区间的点击率后,可以对点击率进行归一化处理,该价格区间的归一化后的点击率=该价格区间的点击率/所有价格区间点击率之和。
由于点击率是一个反应用户偏好度的指标,所有基于点击率来计算用户偏好的价格区间段,是非常有意义的。
在得到不同价格区间的归一化处理后的点击率后,可以采用曲线拟合的方式,得到不同价格对应的点击率,曲线拟合例如为多项式拟合,从而得到以搜索词+类目+购买力为粒度的价格与点击率的关系曲线。
另外,人工干预模块用于调整部分拟合效果不好,或者根据业务需求,对该query下重新设定拟合函数的参数。
离线部分最终获得一份价格词典,每行是query+类目+购买力维度下的曲线拟合参数信息,曲线是指价格与点击率的关系曲线。
建立模块49,用于根据所述第一信息以及所述确定的价格与点击率之间的关系曲线,得到所述第一信息与所述第二信息的对应关系。
例如,通过第一统计模块可以得到第一信息与第三信息的对应关系,通过第二统计模块可以得到第三信息与第二信息的对应关系,再根据第一信息与第三信息的对应关系,以及,第三信息与第二信息的对应关系,可以得到第一信息与第二信息的对应关系。
排序模块44用于根据所述点击率,确定所述搜索结果的排序因子,并根据所述排序因子,对所述搜索结果进行排序。
本实施例通过获取价格词典,根据该价格词典确定当前的第一信息对应的当前的第二信息,当前的第二信息是价格与点击率的关系曲线,并根据该关系曲线确定搜索结果对应的点击率,以及根据该点击率确定排序因子并进行排序,可以实现基于点击率的搜索结果的排序,由于点击率可以反映用户偏好,因此可以将用户偏好的搜索结果排序在前,满足用户需求,并且根据用户偏好进行排序,还可以实现反作弊。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (20)
1.一种搜索结果的排序方法,其特征在于,包括:
获取价格词典,所述价格词典中保存第一信息与第二信息的对应关系,所述第一信息包括:搜索词,用户的特征信息和搜索词所属的类目,所述第二信息是关系曲线,所述关系曲线是搜索结果的价格信息与点击率之间的关系曲线,所述价格词典是根据用户的历史操作行为确定的;
获取当前的第一信息,所述当前的第一信息包括:当前用户输入的当前搜索词,所述当前用户的当前特征信息和所述当前搜索词所属的当前类目;
根据所述价格词典中保存的所述第一信息与所述第二信息的对应关系,获取所述当前的第一信息对应的当前的第二信息;
根据所述搜索词获取搜索结果,确定所述搜索结果的价格信息,并根据所述当前的第二信息和所述搜索结果的价格信息获取所述搜索结果对应的点击率;
根据所述点击率,确定所述搜索结果的排序因子,并根据所述排序因子,对所述搜索结果进行排序。
2.根据权利要求1所述的方法,其特征在于,所述根据所述点击率,确定所述搜索结果的排序因子,包括:
将所述点击率,确定为所述搜索结果的排序因子。
3.根据权利要求1所述的方法,其特征在于,所述根据所述点击率,确定所述搜索结果的排序因子,包括:
对所述搜索结果的价格信息进行预设函数运算,得到运算后的函数值;
将所述点击率与所述运算后的函数值进行相乘,将相乘后的数值确定为所述搜索结果的排序因子。
4.根据权利要求3所述的方法,其特征在于,所述预设函数是严格递增函数。
5.根据权利要求1所述的方法,其特征在于,所述获取当前的第一信息之前,所述方法还包括:
获取用户与用户的特征信息之间的对应关系,并保存所述对应关系,以便在接收当前用户输入的当前搜索词后,根据所述对应关系获取所述当前用户的当前特征信息。
6.根据权利要求5所述的方法,其特征在于,所述用户的特征信息是用户购买力信息,所述获取用户与用户的特征信息之间的对应关系,包括:
获取用户的商品交易数据和点击日志;
根据所述商品交易数据中交易的商品的价格,以及所述点击日志中点击的商品的价格,获取用户与用户的特征信息之间的对应关系。
7.根据权利要求1所述的方法,其特征在于,所述获取价格词典之前,所述方法还包括:建立所述价格词典,所述建立所述价格词典包括:
根据用户的历史操作行为确定每个特征信息对应的用户;
获取所述每个特征信息对应的用户的浏览日志和点击日志,并根据所述浏览日志和点击日志确定所述第一信息与第三信息的对应关系,所述第三信息是价格区间与点击率之间的关系曲线;
根据所述价格区间与点击率之间的关系曲线,确定价格与点击率之间的关系曲线;
根据所述第一信息以及所述确定的价格与点击率之间的关系曲线,得到所述第一信息与所述第二信息的对应关系。
8.根据权利要求7所述的方法,其特征在于,所述根据所述浏览日志和点击日志确定所述第一信息与第三信息的对应关系,包括:
根据所述浏览日志,以历史的第一信息为输入获取历史搜索结果,将历史搜索结果按照价格划分到预设个数的价格区间内,并确定每个价格区间内的浏览数;
根据所述点击日志,确定在所述每个价格区间内对所述历史搜索结果的点击数;
根据所述每个价格区间内的点击数和所述每个价格区间内的浏览数,确定每个价格区间内的点击率,得到价格区间与点击率之间的关系曲线;
根据所述历史的第一信息与所述得到价格区间与点击率之间的关系曲线,建立所述第一信息与所述第三信息的对应关系。
9.根据权利要求8所述的方法,其特征在于,所述将历史搜索结果按照价格划分到预设个数的价格区间内,包括:
获取所述历史搜索结果的原始价格;
对所述原始价格进行取对数运算,得到运算后的价格;
根据运算后的价格,将所述历史搜索结果划分到不同的价格区间。
10.根据权利要求7所述的方法,其特征在于,每个价格区间内的点击率是每个价格区间内点击数与浏览数的比值,所述根据所述价格区间与点击率之间的关系曲线,确定价格与点击率之间的关系曲线,包括:
对每个价格区间内点击数与浏览数的比值进行归一化处理,得到归一化处理后的点击率;
根据每个价格区间以及所述价格区间内所述归一化处理后的点击率,进行曲线拟合,得到价格与点击率之间的关系曲线。
11.一种搜索结果的排序装置,其特征在于,包括:
第一获取模块,用于获取价格词典,所述价格词典中保存第一信息与第二信息的对应关系,所述第一信息包括:搜索词,用户的特征信息和搜索词所属的类目,所述第二信息是关系曲线,所述关系曲线是搜索结果的价格信息与点击率之间的关系曲线,所述价格词典是根据用户的历史操作行为确定的;
第二获取模块,用于获取当前的第一信息,所述当前的第一信息包括:当前用户输入的当前搜索词,所述当前用户的当前特征信息和所述当前搜索词所属的当前类目;
第三获取模块,用于根据所述价格词典中保存的所述第一信息与所述第二信息的对应关系,获取所述当前的第一信息对应的当前的第二信息;
第四获取模块,用于根据所述搜索词获取搜索结果,确定所述搜索结果的价格信息,并根据所述当前的第二信息和所述搜索结果的价格信息获取所述搜索结果对应的点击率;
排序模块,用于根据所述点击率,确定所述搜索结果的排序因子,并根据所述排序因子,对所述搜索结果进行排序。
12.根据权利要求11所述的装置,其特征在于,所述排序模块具体用于:
将所述点击率,确定为所述搜索结果的排序因子。
13.根据权利要求11所述的装置,其特征在于,所述排序模块具体用于:
对所述搜索结果的价格信息进行预设函数运算,得到运算后的函数值;
将所述点击率与所述运算后的函数值进行相乘,将相乘后的数值确定为所述搜索结果的排序因子。
14.根据权利要求13所述的装置,其特征在于,所述预设函数是严格递增函数。
15.根据权利要求11所述的装置,其特征在于,还包括:
保存模块,用于获取用户与用户的特征信息之间的对应关系,并保存所述对应关系,以便在接收当前用户输入的当前搜索词后,根据所述对应关系获取所述当前用户的当前特征信息。
16.根据权利要求15所述的装置,其特征在于,所述保存模块具体用于:
获取用户的商品交易数据和点击日志;
根据所述商品交易数据中交易的商品的价格,以及所述点击日志中点击的商品的价格,获取用户与用户的特征信息之间的对应关系。
17.根据权利要求11所述的装置,其特征在于,还包括:
特征信息计算模块,用于根据用户的历史操作行为确定每个特征信息对应的用户;
第一统计模块,用于获取所述每个特征信息对应的用户的浏览日志和点击日志,并根据所述浏览日志和点击日志确定所述第一信息与第三信息的对应关系,所述第三信息是价格区间与点击率之间的关系曲线;
第二统计模块,用于根据所述价格区间与点击率之间的关系曲线,确定价格与点击率之间的关系曲线;
建立模块,用于根据所述第一信息以及所述确定的价格与点击率之间的关系曲线,得到所述第一信息与所述第二信息的对应关系。
18.根据权利要求17所述的装置,其特征在于,所述第一统计模块具体用于:
根据所述浏览日志,以历史的第一信息为输入获取历史搜索结果,将历史搜索结果按照价格划分到预设个数的价格区间内,并确定每个价格区间内的浏览数;
根据所述点击日志,确定在所述每个价格区间内对所述历史搜索结果的点击数;
根据所述每个价格区间内的点击数和所述每个价格区间内的浏览数,确定每个价格区间内的点击率,得到价格区间与点击率之间的关系曲线;
根据所述历史的第一信息与所述得到价格区间与点击率之间的关系曲线,建立所述第一信息与所述第三信息的对应关系。
19.根据权利要求18所述的装置,其特征在于,所述第一统计模块进一步具体用于:
获取所述历史搜索结果的原始价格;
对所述原始价格进行取对数运算,得到运算后的价格;
根据运算后的价格,将所述历史搜索结果划分到不同的价格区间。
20.根据权利要求17所述的装置,其特征在于,每个价格区间内的点击率是每个价格区间内点击数与浏览数的比值,所述第二统计模块具体用于:
对每个价格区间内点击数与浏览数的比值进行归一化处理,得到归一化处理后的点击率;
根据每个价格区间以及所述价格区间内所述归一化处理后的点击率,进行曲线拟合,得到价格与点击率之间的关系曲线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410635331.2A CN105630836B (zh) | 2014-11-05 | 2014-11-05 | 搜索结果的排序方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410635331.2A CN105630836B (zh) | 2014-11-05 | 2014-11-05 | 搜索结果的排序方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105630836A CN105630836A (zh) | 2016-06-01 |
CN105630836B true CN105630836B (zh) | 2018-11-16 |
Family
ID=56045779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410635331.2A Active CN105630836B (zh) | 2014-11-05 | 2014-11-05 | 搜索结果的排序方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105630836B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126698B (zh) * | 2016-06-29 | 2020-01-03 | 武汉斗鱼网络科技有限公司 | 一种基于Lucence的检索推送方法及系统 |
CN107632989B (zh) * | 2016-07-19 | 2021-04-13 | 阿里巴巴集团控股有限公司 | 一种商品对象选取、模型确定及使用热度确定方法与装置 |
CN106484766B (zh) * | 2016-09-07 | 2019-10-22 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法和装置 |
CN107844496B (zh) * | 2016-09-19 | 2021-12-17 | 创新先进技术有限公司 | 统计信息输出方法及装置 |
CN107862004A (zh) * | 2017-10-24 | 2018-03-30 | 科大讯飞股份有限公司 | 智能排序方法及装置、存储介质、电子设备 |
CN109919651A (zh) * | 2019-01-17 | 2019-06-21 | 阿里巴巴集团控股有限公司 | 对象的推送方法及装置 |
CN111598638B (zh) * | 2019-02-21 | 2023-11-07 | 北京沃东天骏信息技术有限公司 | 点击率确定方法、装置及设备 |
CN111611289B (zh) * | 2019-02-22 | 2024-06-18 | 北京京东尚科信息技术有限公司 | 物品信息的搜索排序方法、装置、存储介质和电子设备 |
CN109962983B (zh) * | 2019-03-29 | 2021-11-23 | 北京搜狗科技发展有限公司 | 一种点击率统计方法及装置 |
CN112434183B (zh) * | 2020-11-30 | 2024-05-17 | 北京达佳互联信息技术有限公司 | 一种搜索结果的排序方法、装置、设备和存储介质 |
CN112687403B (zh) * | 2021-01-08 | 2022-12-02 | 拉扎斯网络科技(上海)有限公司 | 药品词典的生成及药品搜索方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102591876A (zh) * | 2011-01-14 | 2012-07-18 | 阿里巴巴集团控股有限公司 | 搜索结果排序方法及装置 |
CN103136311A (zh) * | 2011-12-05 | 2013-06-05 | 微软公司 | 付费搜索中的投标和预算分配的联合优化 |
CN103514187A (zh) * | 2012-06-20 | 2014-01-15 | 阿里巴巴集团控股有限公司 | 一种提供搜索结果的方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080269942A1 (en) * | 2007-04-26 | 2008-10-30 | David Mitchell Free | Computer system and method for providing real-world market-based information corresponding with a theoretical cad model and/or rfq/rfp data |
US9405835B2 (en) * | 2010-09-02 | 2016-08-02 | Paypal, Inc. | Generating a search result ranking function |
-
2014
- 2014-11-05 CN CN201410635331.2A patent/CN105630836B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102591876A (zh) * | 2011-01-14 | 2012-07-18 | 阿里巴巴集团控股有限公司 | 搜索结果排序方法及装置 |
CN103136311A (zh) * | 2011-12-05 | 2013-06-05 | 微软公司 | 付费搜索中的投标和预算分配的联合优化 |
CN103514187A (zh) * | 2012-06-20 | 2014-01-15 | 阿里巴巴集团控股有限公司 | 一种提供搜索结果的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105630836A (zh) | 2016-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105630836B (zh) | 搜索结果的排序方法和装置 | |
CN104462333B (zh) | 购物搜索推荐与告警方法和系统 | |
CN107590675B (zh) | 一种基于大数据的用户购物行为识别方法、储存设备及移动终端 | |
CN110473040B (zh) | 一种产品推荐方法及装置,电子设备 | |
CN103246980B (zh) | 信息输出方法及服务器 | |
CN112837118B (zh) | 企业用户的商品推荐方法和装置 | |
CN111127155A (zh) | 商品推荐方法、装置、服务器和存储介质 | |
TW201501059A (zh) | 訊息推薦方法及裝置 | |
CN107562818A (zh) | 信息推荐系统及方法 | |
CN107169806B (zh) | 用于确定商品属性对于购买决策的影响度的方法及装置 | |
CN108664564B (zh) | 一种基于物品内容特征的改进协同过滤推荐方法 | |
WO2017092602A1 (zh) | 一种信息投放用户的筛选方法和服务器 | |
CN110264291B (zh) | 信息推荐方法和装置 | |
CN102591876A (zh) | 搜索结果排序方法及装置 | |
CN103729383A (zh) | 商品信息的推送方法和装置 | |
KR101646312B1 (ko) | 개인행동기반 관심 대상 및 선호 분야 분석시스템 및 그 방법 | |
CN106651418A (zh) | 针对电商满减活动的凑单商品推荐的方法 | |
CN106469392A (zh) | 选择及推荐展示对象的方法及装置 | |
CN110490683B (zh) | 一种线下线上协同多模型混合推荐的方法及系统 | |
CN107274242A (zh) | 一种基于关联分析算法的商品推荐方法 | |
CN103136683A (zh) | 计算产品参考价格的方法、装置及产品搜索方法、系统 | |
CN111951051B (zh) | 一种为客户推荐产品的方法、装置和系统 | |
CN116757794B (zh) | 基于大数据的售酒小程序内产品推荐方法 | |
CN113763089A (zh) | 物品推荐方法及装置、计算机可存储介质 | |
CN109118243B (zh) | 一种产品分享、有用评价识别、推送方法和服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |