CN110827106A - 构建搜索模型的方法及装置以及商品搜索方法及装置 - Google Patents

构建搜索模型的方法及装置以及商品搜索方法及装置 Download PDF

Info

Publication number
CN110827106A
CN110827106A CN201810894185.3A CN201810894185A CN110827106A CN 110827106 A CN110827106 A CN 110827106A CN 201810894185 A CN201810894185 A CN 201810894185A CN 110827106 A CN110827106 A CN 110827106A
Authority
CN
China
Prior art keywords
ranking
scoring function
commodity
function
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810894185.3A
Other languages
English (en)
Other versions
CN110827106B (zh
Inventor
刘克松
任恺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810894185.3A priority Critical patent/CN110827106B/zh
Priority claimed from CN201810894185.3A external-priority patent/CN110827106B/zh
Publication of CN110827106A publication Critical patent/CN110827106A/zh
Application granted granted Critical
Publication of CN110827106B publication Critical patent/CN110827106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种构建搜索模型的方法,包括:采用第一打分函数的商品搜索结果集构建基础数据集;基于所述第一打分函数和排序因子构建第二打分函数;以及分类目根据所述基础数据集优化所述排序因子的权重值。本发明实施例同时对应的装置和商品检索方法及装置。

Description

构建搜索模型的方法及装置以及商品搜索方法及装置
技术领域
本发明涉及计算机技术领域,具体涉及一种构建搜索模型的方法及装置以及商品搜索方法及装置。
背景技术
在商品搜索排序业务中,一般会根据用户提交的查询词、用户购买偏好以及商品属性,对每个商品进行匹配度打分,然后按分数降序排列商品,最后将有序的商品列表展示给用户。以上过程中,打分函数是影响商品排名的关键因素。
由于市场千变万化,商品搜索经常需要根据业务需求,快速调整排序结果。例如业务需要新增某些商品的特定属性(如品牌)在排序中的影响作用,而原有的打分函数往往并不包含这些商品属性。我们称这些为实现业务需求而引入到打分函数中的商品属性为排序因子。在原有打分函数基础上添加修正项,是一种快速调整排序结果的可行方案。
但是发明人发现,由于不同查询词类目不同,类目下的商品价格、用户浏览、购买习惯各不相同,通常需要为不同类目配置不同的修正项参数。通常查询词类目庞大,根据经验手工地为不同类目配置修正项参数效率极低,而且针对不同查询词类目,采用直接AB实验优化打分函数的待定参数,在多类目情况下,待定参数较多时,需要较多的流量、机器等资源、较长的AB实验时间;而且由于资源限制,实验选择的参数组合通常也有限,不容易找到最优参数。
发明内容
有鉴于此,本发明实施例提供一种构建搜索模型的方法,能够基于原打分函数和排序因子快速构建搜索模型,从而解决了上述问题。
根据本发明实施例的第一方面,提供一种构建搜索模型的方法,包括:
采用第一打分函数的商品搜索结果集构建基础数据集;
基于所述第一打分函数和排序因子构建第二打分函数;以及
分类目根据所述基础数据集优化所述排序因子的权重值。
优选地,所述排序因子的权重值具有类目特异性。
优选地,所述排序因子为表征一个或多个商品属性的参数。
优选地,还包括:采用相同的权重值构建多个排序因子各自的第二打分函数。
优选地,所述排序因子的权重值包括所述排序因子的线性权重值以及所述排序因子与所述第一打分函数的交叉非线性权重值。
优选地,所述第一打分函数和所述第二打分函数之间的关系采用以下方程式表示:
Figure BDA0001757688530000021
其中,s(w)为商品w的排序因子的强度,
cw表示商品w的类目,r(q,w|u)为第一打分函数,表示某用户u,查询词q和商品w之间的相关度,r′(q,w|u)为第二打分函数,
Figure BDA0001757688530000023
分别是线性项的权重值和交叉非线性项的权重值。
优选地,所述根据所述基础数据集优化所述排序因子的权重值:
设定所述基础数据集的查询词上的目标函数,所述目标函数采用所述排序因子的权重值作为参数;
初始化所述目标函数的超参数;
通过最小化目标函数的值求解所述目标函数的参数。
优选地,还包括:根据AB实验结果修正所述目标函数中的超参数,并基于修正后的超参数求解所述目标函数的参数。
优选地,所述目标函数为:
Figure BDA0001757688530000024
其中,LOSS定义在基础数据集的查询词集合Q上,Q为查询词集合,||Q||为查询词Q集合的大小,lq为单个查询词q对应的损失,λ,μ是用于控制模型复杂程度的超参数,
Figure BDA0001757688530000031
Figure BDA0001757688530000032
分别是线性项的权重值和交叉非线性项的权重值,cw表示商品w的类目;
其中,lq通过以下方程式求解:
Figure BDA0001757688530000034
mc=LS({(k,mk,c)})
mk,c=Eq,i(rq,i-rq,i+k)
i,j表示商品在新的打分函数排序后的位置,nq表示查询词q搜索到的商品个数,ri,sii分别是新的打分函数排序后位置i商品的原有打分、排序因子取值、位置权重,τc衡量在第一打分函数中,两个排序接近的商品在分数上的接近程度,
∈一般取值0.1,mc为商品分数对名次的平均变化率,mk,c定义为类目c的排名k阶分数差,LS函数为最小二乘法,拟合样本点集{(k,mk,c)}的斜率,Eq,i中的q,i分别表示对类目c下所有查询词和每个查询词搜索结果的所有排序位置求平均,rq,i和rq,i为第一打分函数下第i名商品和第i+k名的商品的商品分数。
根据本发明实施例的第二方面,提供一种商品搜索方法,其特征在于,包括:
接收查询词;
判断所述查询词的类目;
根据所述查询词的类目确定打分函数;以及
根据所述打分函数进行商品检索,其中,所述打分函数根据上述构建搜索模型的方法构建而成。
根据本发明实施例的第三方面,提供一种搜索模型构建装置,包括:
数据集构建模块,用于基于第一打分函数的商品搜索结果构建基础数据集;
排序函数构建模块,用于基于所述第一打分函数和排序因子构建第二打分函数;
权重值优化模块,用于分类目根据所述基础数据集优化所述第二打分函数中的所述排序因子的权重值。
优选地,所述排序因子为表征一个或多个商品属性的参数。
优选地,所述排序因子的权重值具有类目特异性。
根据本发明实施例的第四方面,提供一种商品搜索装置,包括:
查询词接收模块,用于接收查询词;
判断确定模块,用于判断查询词的类目,并根据所述查询词的类目确定打分函数;
商品检索模块,根据所述打分函数进行商品检索,其中,所述打分函数根据上述构建搜索模型的方法构建而成。
根据本发明实施例的第五方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现上述构建搜索模型的方法。
根据本发明实施例的第六方面,提供一种商品搜索装置,包括:
存储器,用于存储计算机指令;
处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的计算机指令执行实现上述构建搜索模型的方法。
本发明实施例具有以下优点或有益效果:基于原打分函数和排序因子构建第二打分函数,根据基础数据集优化权重值,无需手工地为不同类目配置不同的修正项参数,从而提高了搜索模型的构建效率。进一步地,分类目优化权重值,提高优化效率。
本发明的优选实施例具有以下优点或有益效果:由于权重值具有类目特异性,多个排序因子可以采用相同权重值,针对新的排序因子,复用已有的权重值,从而无需重新优化和调整权重值,节省了系统资源。
本发明的优选实施例具有以下优点或有益效果:在第二打分函数中,设置线性项的权重值和交叉非线性项的权重值,从而较好地平衡排序因子对于原检索结果的影响。
附图说明
通过参照以下附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是本发明实施例的构建搜索模型的方法的流程图;
图2是图1所述的步骤S103的一个可选实施例;
图3是根据本发明实施例的商品搜索方法的流程图;
图4是根据本发明实施例的构建搜索模型的装置的结构图;
图5是根据本发明实施例的商品搜索装置的结构图;
图6是根据本发明实施例构建搜索模型的装置的结构图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程没有详细叙述。另外附图不一定是按比例绘制的。
图1是本发明实施例的构建搜索模型的方法的流程图。具体包括以下步骤。
在步骤S101中,采用第一打分函数的商品搜索结果集构建基础数据集。
在步骤S102中,基于第一打分函数和排序因子构建第二打分函数。
在步骤S103中,分类目根据基础数据集优化排序因子的权重值。
在本实施例中,第一打分函数为原打分函数。根据原打分函数的商品搜索结果集构建基础数据集,该基础数据集包括诸多信息,例如查询词、查询词所属类目、基于查询词得到的商品列表以及基于打分函数得到的商品分数值。当业务变化,需要增加某个排序因子或增强某个排序因子的影响作用时,则根据原打分函数和该排序因子构建新的打分函数(第二打分函数)。排序因子例如可以是品牌、品类、厂商、是否转基金产品、是否存在负面新闻等一系列的商品属性。在第二打分函数中,该排序因子的权重值非常关键。如果该权重值过小,可能导致该排序对搜索结果的排序影响过小,如果该权重值过大,又可能导致该排序因子破坏了搜索结果和查询词的相关性。在本实施例中,分类目通过基础数据集不断地优化和调整权重值。例如,在第二打分函数中,先设定该排序因子的权重值的初始值,然后分类目将基础数据集代入到第二打分函数中进行搜索测试,分析得到的商品列表并据此调整权重值,再根据当前的权重值进行搜索测试并根据测试结果继续调整权重值的数值,重复若干次这样的操作,直至检索得到的商品列表能够满足业务需求,则停止优化排序因子的权重值。由于查询词的类目不同,根据不同类目的查询词得到的基础数据集具有类目特性,因此,分类目根据基础数据集优化权重值,获得的权重值也具有类目特异性。
本发明实施例基于排序因子迅速构建第二打分函数,根据基础数据集优化权重值,无需为手工地不同类目配置不同的修正项参数,从而提高了搜索模型的构建效率。
在一个优选实施例中,多个排序因子可以采用相同权重值,针对新的排序因子,复用已有的权重值,无需重新优化和调整权重值,从而能够快速完成搜索模型的构建。例如,根据排序因子A例如品牌获得权重值Weight,当需要添加排序因子B例如品类时,可以采用Weight完成搜索模型即打分函数的构建。
下面将结合基础数据集以及为第一打分函数和第二打分函数设置的相应的方程式对本发明实施例进行详细描述。
对于给定一批查询词Q={q},在原打分函数下的查询词q搜索出来的商品列表{wq,i}及其对应的分数值{rq,i},i=1,2,..,nq,构成的基础数据集。其中wq,i为查询词q搜索结果中排名在i处的商品,相应打分为rqi,nq为查询词q搜索结果中商品的数目。准备基础数据集的意义在于:为打分函数添加修正项的模型参数优化提供数据,避免了手动地给每个类目配置参数的繁琐过程。
假设排序因子的取值为s(w),s(w)反映了不同商品排序因子的强度,例如商品品牌的排序因子可定义为品牌知名度越大,相应的排序因子取值越大;假设原打分函数r(q,w|u)(即第一打分函数),反映了对于某用户u,查询词q和商品w之间的相关度。一般地可认为原有打分函数基本描述了给定用户下查询词和商品的相关性,因此修正后的新打分函数(即第二打分函数)可以定义为:
Figure BDA0001757688530000071
公式(1)中r′(q,w|u)为修正后的打分函数,cw表示商品w的类目,
Figure BDA0001757688530000072
分别是线性项的权重和交叉非线性项的权重。如果
Figure BDA0001757688530000074
的取值过小,修正后的排序对原有排序结果影响太小,可能无法体现排序因子的影响作用;反之如果过大,可能对原有排序结果的商品和查询词之间的相关性产生破坏作用。考虑到查询词和商品的类目差异性,权重
Figure BDA0001757688530000076
Figure BDA0001757688530000077
具有类目特异性,如果能够对为所有类目都找到合适的参数,那么公式(1)实现了把排序因子融合到已有的打分函数模型的作用。考虑到商品搜索场景,商品一般有几千到几万个类目,如果仅仅依赖AB实验为每个类目配置不同权重值,工作量非常大,效率也不高。因此需要利用已经收集的基础数据集,定义目标函数;通过最小化目标函数,自动求解参数。
为了确定修正后新打分函数中的参数而定义的目标函数,如下所示:
Figure BDA0001757688530000078
Figure BDA0001757688530000079
公式(2)是目标函数,也称损失函数,定义在基础数据集的查询词集合Q上。||Q||为查询词Q集合的大小,lq为单个查询词q对应的损失,cw表示商品w的类目,λ,μ是用于控制模型复杂程度的超参数,对模型起正则化作用,平衡排序因子和对原有打分函数之间相互作用。当超参数λ,μ较大,参数
Figure BDA0001757688530000081
在LOSS总体所占比例较高,最小化LOSS倾向让参数变小,减少新打分函数的修正强度;反之,增加打分函数的修正强度。另一方面打分函数的修正项和排序因子呈正相关关系。目标函数LOSS中λ,μ参数取值不同,对应的LOSS不同。在对λ,μ优化的过程中,会产生新的打分排序结果。公式(3)中i,j表示商品在新的排序打分结果排序后的位置,nq表示查询词q搜索到的商品个数,ri,sii分别是新的排序打分结果集的排序位置i商品的原有打分、排序因子取值、位置权重,i为自变量,当i=j,得到rj,sjj,分别是当前排序位置j商品的原有打分、排序因子取值、位置权重。公式(4)说明了位置权重随排名靠后而递减。公式(3)反映了在原有打分函数中得分接近的情况,排序因子取值与新的排序结果相反时,损失函数较大。换言之,目标函数倾向把在在原有打分函数中打分接近的商品对,按照排序因子取值降序排列。公式(3)中τc衡量在原打分函数中,两个排序接近的商品在分数上的接近程度,定义为:
Figure BDA0001757688530000083
公式(5)中∈一般取值0.1,mc为商品分数对名次的平均变化率。基于基础数据集分析基础数据集中商品打分和排名名次之间的统计关联关系得到平均变化率的计算公式。从业务角度上看,修正打分函数的目的是要提升某些商品的搜索排名名次。因此需要对所有商品/查询词类目,定量地计算得分和名次之间的统计关联。对于基础数据集中属于类目c的所有查询词q,(cq=c),定义类目c的排名k阶分数差:
mk,c=Eq,i(rq,i-rq,i+k) (6)
公式(6)中取。求某个类目c在原打分函数(第一打分函数)下的k阶差的平均。对属于类目c的所有查询词q,及每个查询词的在原打分函数下的得分序列k阶差进行平均。原打分函数的搜索结果的得分k阶差,指第1名和第1+k名的得分差,第2名和第2+k名的得分差,第3名和第3+k名的得分差,依次类推。对这些k阶差,求平均。
使用最小二乘法,可定义类目c的商品分数对名次的平均变化率:
mc=LS({(k,mk,c)}) (7)
公式(7)中LS函数为最小二乘法,k为横坐标,mk,c为纵坐标,采用最小二乘法得到拟合直线,该直线的斜率为mc。一般k取值为1到5。平均而言,mc反映了类目c在使用原打分函数(第一打分函数)时,搜索结果中平均一个名次差异对应的分数差异。
目标函数公式(2)在给定超参数λ,μ的情况下,每个类目下只有2个待定参数
Figure BDA0001757688530000091
Figure BDA0001757688530000092
假设有N个查询词类目,那么共计有2N个参数。最小化目标函数LOSS可求出所有2N个参数。因为每个类目的目标函数相对独立,能够独立优化求解。按照查询词的类目对基础数据集进行划分,分别最小化对应目标函数,采用基网格搜索或随机搜索方法,可求解所有类目的权重值。
对于目标函数公式(4)中的超参数λ,μ,如果超参数取值过大,使得权重值
Figure BDA0001757688530000093
偏小,无法有效融合排序因子;反之,如果取值较小时,优化目标函数时容易使得权重值
Figure BDA0001757688530000095
Figure BDA0001757688530000096
偏大,使得对打分函数的修改较大,破坏原有打分排序结果的相关性的风险也就变大。由于此处只有2个待定超参数,可通过AB实验的业务指标来选择。具体流程如图2所示。
图2是图1所述的步骤S103的一个可选实施例。具体包括以下步骤。
在步骤S1031中,目标函数的超参数设置。
在步骤S1032中,基于基础数据集求解和优化目标函数的参数。
在步骤S1033中,AB实验。
在步骤S1034中,判断是否满足业务需求。如果满足业务需求,将停止权重值的优化,流程结束,如果不能满足业务需求,则跳转到步骤S1031继续执行。
具体地,首先设置目标函数中的超参数,然后基于基础数据集的目标函数参数求解和优化,再然后上线AB实验,观察是否满足业务需求,如果不满足,则修改目标函数的超参数再次迭代,否则结束。
可以理解,虽然在上述实施例中设计了相应的方程式,但本发明不局限于此。上述方程式在实践中也会不断地加以改进和优化。
图3是根据本发明实施例的商品搜索方法的流程图。具体包括以下步骤。
在步骤S301中,接收查询词
在步骤S302中,判断查询词的类目
在步骤S303中,当查询词的类目为a时,采用打分函数A返回检索结果。
在步骤S304中,当查询词的类目为b时,采用打分函数B返回检索结果。其中,a和b用于标识不同的查询词,A和B用于标识不同的打分函数。
在本实施例中,区分检索词的类目,根据检索词的类目,利用上述实施例获得的第二打分函数返回商品列表。
图4是根据本发明实施例的构建搜索模型的装置的结构图。所述构建搜索模型的装置包括数据集构建模块401、排序函数构建模块402和权重值优化模块403。
数据集构建模块401基于第一打分函数的商品搜索结果构建基础数据集。该基础数据集包括诸多信息,例如查询词、查询词类目、基于查询词检索得到的商品列表、以及基于打分函数得到的商品分数值。
排序函数构建模块402用于基于第一打分函数和排序因子构建第二打分函数。当业务变化,需要增加某个排序因子的强度时,则根据原打分函数和该新增的排序因子构建新的打分函数(第二打分函数)。排序因子例如品牌、品类、厂商、是否转基金产品、是否存在负面新闻等一系列的商品属性,并在新的打分函数中对于新增的排序因子采用合适的权重值以使得该排序因子对于检索得到的商品列表具有适当的影响。
权重值优化模块403用于分类目根据基础数据集优化第二打分函数中的排序因子的权重值。不同查询词的类目不同,根据不同类目的查询词得到的基础数据集具有类目特异性,因此,分类目根据基础数据集优化权重值,从而使得获得的权重值也具有类目特异性。
本实施例提供的构建搜索模型的装置,基于排序因子迅速构建第二打分函数,根据基础数据集优化权重值,无需为不同类目配置不同的修正项参数,从而提高了搜索模型的构建效率。
在进一步的实施例中,由于权重值具有类目特异性,多个排序因子可以采用相同权重值,针对新的排序因子,无需重新优化和调整权重值,从而能够快速完成搜索模型的构建,节省了系统资源。
图5是根据本发明实施例的商品搜索装置的结构图。所述商品搜索装置包括:查询词接收模块501、判断确定模块502和商品检索模块503。
查询词接收模块501用于接收查询词。判断确定模块502用于判断查询词的类目,并根据所述查询词的类目确定打分函数。商品检索模块503根据打分函数进行商品检索,其中,商品搜索模块503所采用的打分函数根据上述的方法构建而成。
图6是根据本发明实施例构建搜索模型的装置的结构图。图6示出的设备仅仅是一个示例,不应对本发明实施例的功能和使用范围构成任何限制。
参考图5,该装置包括通过总线连接的处理器501、存储器502和输入输出设备503。存储器502包括只读存储器(ROM)和随机访问存储器(RAM),存储器502内存储有执行系统功能所需的各种计算机指令和数据,处理器501从存储器502中读取各种计算机指令以执行各种适当的动作和处理。输入输出设备包括键盘、鼠标等的输入部分;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。存储器502还存储有以下的计算机指令以完成本发明实施例的装置规定的操作:采用第一打分函数的商品搜索结果集构建基础数据集;基于第一打分函数和排序因子构建第二打分函数;以及分类目根据基础数据集优化排序因子的权重值。
相应地,本发明实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现上述方法所规定的操作。
附图中的流程图、框图图示了本发明实施例的系统、方法、装置的可能的体系框架、功能和操作,流程图和框图上的方框可以代表一个模块、程序段或仅仅是一段代码,所述模块、程序段和代码都是用来实现规定逻辑功能的可执行指令。也应当注意,所述实现规定逻辑功能的可执行指令可以重新组合,从而生成新的模块和程序段。因此附图的方框以及方框顺序只是用来更好的图示实施例的过程和步骤,而不应以此作为对发明本身的限制。
系统的各个模块或单元可以通过硬件、固件或软件实现。软件例如包括采用JAVA、C/C++/C#、SQL等各种编程语言形成的编码程序。虽然在方法以及方法图例中给出本发明实施例的步骤以及步骤的顺序,但是所述步骤实现规定的逻辑功能的可执行指令可以重新组合,从而生成新的步骤。所述步骤的顺序也不应该仅仅局限于所述方法以及方法图例中的步骤顺序,可以根据功能的需要随时进行调整。例如将其中的某些步骤并行或按照相反顺序执行。
根据本发明的系统和方法可以部署在单个或多个服务器上。例如,可以将不同的模块分别部署在不同的服务器上,形成专用服务器。或者,可以在多个服务器上分布式部署相同的功能单元、模块或系统,以减轻负载压力。所述服务器包括但不限于在同一个局域网以及通过Internet连接的多个PC机、PC服务器、刀片机、超级计算机等。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种构建搜索模型的方法,其特征在于,包括:
采用第一打分函数的商品搜索结果集构建基础数据集;
基于所述第一打分函数和排序因子构建第二打分函数;以及
分类目根据所述基础数据集优化所述排序因子的权重值。
2.根据权利要求1所述的方法,其特征在于,所述排序因子的权重值具有类目特异性。
3.根据权利要求1所述的方法,其特征在于,所述排序因子为表征一个或多个商品属性的参数。
4.根据权利要求1所述的方法,其特征在于,还包括:采用相同的权重值构建多个排序因子各自的第二打分函数。
5.根据权利要求1所述的方法,其特征在于,所述排序因子的权重值包括所述排序因子的线性权重值以及所述排序因子与所述第一打分函数的交叉非线性权重值。
6.根据权利要求5所述的方法,其特征在于,所述第一打分函数和所述第二打分函数之间的关系采用以下方程式表示:
Figure FDA0001757688520000011
其中,s(w)为商品w的排序因子的强度,
cw表示商品w的类目,r(q,w|u)为第一打分函数,表示某用户u,查询词q和商品w之间的相关度,r′(q,w|u)为第二打分函数,
Figure FDA0001757688520000012
Figure FDA0001757688520000013
分别是线性项的权重值和交叉非线性项的权重值。
7.根据权利要求1所述的方法,其特征在于,所述根据所述基础数据集优化所述排序因子的权重值:
设定所述基础数据集的查询词上的目标函数,所述目标函数采用所述排序因子的权重值作为参数;
初始化所述目标函数的超参数;
通过最小化目标函数的值求解所述目标函数的参数。
8.根据权利要求7所述的方法,其特征在于,还包括:根据AB实验结果修正所述目标函数中的超参数,并基于修正后的超参数求解所述目标函数的参数。
9.根据权利要求7所述的方法,其特征在于,所述目标函数为:
Figure FDA0001757688520000021
其中,LOSS定义在基础数据集的查询词集合Q上,Q为查询词集合,||Q||为查询词Q集合的大小,lq为单个查询词q对应的损失,λ,μ是用于控制模型复杂程度的超参数,
Figure FDA0001757688520000022
分别是线性项的权重值和交叉非线性项的权重值,cw表示商品w的类目;
其中,lq通过以下方程式求解:
Figure FDA0001757688520000025
mc=LS({(k,mk,c)})
mk,c=Eq,i(rq,i-rq,i+k)
i,j表示商品在新的打分函数排序后的位置,nq表示查询词q搜索到的商品个数,ri,sii分别是新的打分函数排序后位置i商品的原有打分、排序因子取值、位置权重,τc衡量在第一打分函数中,两个排序接近的商品在分数上的接近程度,
∈一般取值0.1,mc为商品分数对名次的平均变化率,mk,c定义为类目c的排名k阶分数差,LS函数为最小二乘法,拟合样本点集{(k,mk,c)}的斜率,Eq,i中的q,i分别表示对类目c下所有查询词和每个查询词搜索结果的所有排序位置求平均,rq,i和rq,i为第一打分函数下第i名商品和第i+k名的商品的商品分数。
10.一种商品搜索方法,其特征在于,包括:
接收查询词;
判断所述查询词的类目;
根据所述查询词的类目确定打分函数;以及
根据所述打分函数进行商品检索,其中,所述打分函数为权利要求1至9任一项所述的第二打分函数。
11.一种搜索模型构建装置,其特征在于,包括:
数据集构建模块,用于基于第一打分函数的商品搜索结果构建基础数据集;
排序函数构建模块,用于基于所述第一打分函数和排序因子构建第二打分函数;
权重值优化模块,用于分类目根据所述基础数据集优化所述第二打分函数中的所述排序因子的权重值。
12.根据权利要求9所述的搜索模型构建装置,其特征在于,所述排序因子为表征一个或多个商品属性的参数。
13.根据权利要求11所述的商品搜索排序系统,其特征在于,所述排序因子的权重值具有类目特异性。
14.一种商品搜索装置,其特征在于,包括:
查询词接收模块,用于接收查询词;
判断确定模块,用于判断查询词的类目,并根据所述查询词的类目确定打分函数;
商品检索模块,根据所述打分函数进行商品检索,其中,所述打分函数根据权利要求1至9任一项所述的方法构建而成。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现如权利要求1至9任一项所述的方法。
16.一种商品搜索装置,其特征在于,包括:
存储器,用于存储计算机指令;
处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的计算机指令执行实现如权利要求1至9中任一项所述的方法。
CN201810894185.3A 2018-08-08 构建搜索模型的方法及装置以及商品搜索方法及装置 Active CN110827106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810894185.3A CN110827106B (zh) 2018-08-08 构建搜索模型的方法及装置以及商品搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810894185.3A CN110827106B (zh) 2018-08-08 构建搜索模型的方法及装置以及商品搜索方法及装置

Publications (2)

Publication Number Publication Date
CN110827106A true CN110827106A (zh) 2020-02-21
CN110827106B CN110827106B (zh) 2024-10-22

Family

ID=

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193999A (zh) * 2011-05-09 2011-09-21 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法及设备
US20110314005A1 (en) * 2010-06-18 2011-12-22 Alibaba Group Holding Limited Determining and using search term weightings
CN103577413A (zh) * 2012-07-20 2014-02-12 阿里巴巴集团控股有限公司 搜索结果排序方法及系统、搜索结果排序优化方法及系统
CN104077306A (zh) * 2013-03-28 2014-10-01 阿里巴巴集团控股有限公司 一种搜索引擎的结果排序方法及系统
CN106874352A (zh) * 2016-12-28 2017-06-20 河北中废通网络技术有限公司 一种搜索因子调整的方法
CN106971000A (zh) * 2017-04-12 2017-07-21 北京焦点新干线信息技术有限公司 一种搜索方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110314005A1 (en) * 2010-06-18 2011-12-22 Alibaba Group Holding Limited Determining and using search term weightings
CN102193999A (zh) * 2011-05-09 2011-09-21 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法及设备
CN103577413A (zh) * 2012-07-20 2014-02-12 阿里巴巴集团控股有限公司 搜索结果排序方法及系统、搜索结果排序优化方法及系统
CN104077306A (zh) * 2013-03-28 2014-10-01 阿里巴巴集团控股有限公司 一种搜索引擎的结果排序方法及系统
CN106874352A (zh) * 2016-12-28 2017-06-20 河北中废通网络技术有限公司 一种搜索因子调整的方法
CN106971000A (zh) * 2017-04-12 2017-07-21 北京焦点新干线信息技术有限公司 一种搜索方法及装置

Similar Documents

Publication Publication Date Title
JP6152173B2 (ja) 商品検索結果の順位付け
US9424317B2 (en) Ranking algorithm for search queries
CN110969516A (zh) 一种商品推荐方法及装置
CN105159910A (zh) 信息推荐方法和装置
CN113627846A (zh) 一种库存调整方法、装置、电子设备及计算机可读介质
US11599548B2 (en) Utilize high performing trained machine learning models for information retrieval in a web store
CN110490683B (zh) 一种线下线上协同多模型混合推荐的方法及系统
CN110852818A (zh) 商品排序方法、装置和计算机可读存储介质
CN108288208A (zh) 基于图像内容的展示对象确定方法、装置、介质及设备
CN110322318B (zh) 一种客户分群方法、装置及计算机存储介质
CN111126442B (zh) 一种物品关键属性生成方法、物品分类方法和装置
CN103902549B (zh) 搜索数据排序的方法和装置,数据搜索的方法和装置
CN113763072B (zh) 用于分析信息的方法和装置
Nivitha et al. C-drm: Coalesced p-topsis entropy technique addressing uncertainty in cloud service selection
CN106447397A (zh) 基于决策树算法的烟草零售户定价方法
CN114036388A (zh) 数据处理方法和装置、电子设备、及存储介质
CN110555747A (zh) 确定目标用户的方法和装置
CN110941771B (zh) 一种电商平台中的商品并行动态推送方法
CN103995831A (zh) 基于物品间相似度的物品处理方法、系统和装置
CN110827106B (zh) 构建搜索模型的方法及装置以及商品搜索方法及装置
CN110827106A (zh) 构建搜索模型的方法及装置以及商品搜索方法及装置
CN111353793A (zh) Crm业务推荐方法及装置
CN110162704B (zh) 基于多因子遗传算法的多规模关键用户提取方法
CN113722593A (zh) 事件数据处理方法、装置、电子设备和介质
CN113762535A (zh) 一种物品召回方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant