CN109446402B - 一种搜索方法及装置 - Google Patents

一种搜索方法及装置 Download PDF

Info

Publication number
CN109446402B
CN109446402B CN201710757313.5A CN201710757313A CN109446402B CN 109446402 B CN109446402 B CN 109446402B CN 201710757313 A CN201710757313 A CN 201710757313A CN 109446402 B CN109446402 B CN 109446402B
Authority
CN
China
Prior art keywords
user
objects
class
behavior
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710757313.5A
Other languages
English (en)
Other versions
CN109446402A (zh
Inventor
欧丹
刘士琛
欧文武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710757313.5A priority Critical patent/CN109446402B/zh
Priority to TW107119974A priority patent/TW201913415A/zh
Priority to PCT/US2018/048387 priority patent/WO2019046329A1/en
Priority to US16/115,324 priority patent/US20190065611A1/en
Publication of CN109446402A publication Critical patent/CN109446402A/zh
Application granted granted Critical
Publication of CN109446402B publication Critical patent/CN109446402B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Abstract

本申请提供了一种搜索方法及装置,在依据搜索关键词确定搜索结果的过程中,从与用户发生历史行为的对象的具有关联关系的扩展对象中,确定与搜索关键词相关的对象,作为搜索结果的一部分,因此,搜索结果能够更贴近用户的行为习惯,对于用户而言,更为准确。

Description

一种搜索方法及装置
技术领域
本申请涉及电子信息领域,尤其涉及一种搜索方法及装置。
背景技术
搜索引擎是网站最常见的功能。用户在搜索引擎中输入关键词后,搜索引擎依据关键词查询到相关的搜索结果,并对搜索结果进行排序显示。例如,电子商务网站的搜索引擎接收到用户输入的关键词后,查询到与关键词相关的商品信息,并对商品信息进行排序,再按照排序结果向用户展示各个商品信息。
然而现有的搜索方法,仅依据关键词输出搜索结果,而没有考虑到其它因素,所以,无法得到面向用户而言更加准确的搜索结果。
发明内容
本申请提供了一种搜索方法及装置,目的在于解决如何得到面向用户更加准确的搜索结果的问题。
为了实现上述目的,本申请提供了以下技术方案:
一种搜索方法,包括:
依据用户的搜索关键词确定第一类对象,所述第一类对象为与所述搜索关键词相关的对象;
基于所述用户的历史行为,确定所述用户的历史行为对象;
确定与所述历史行为对象具有关联关系的扩展对象;
确定所述扩展对象中与所述关键词相关的第二类对象;
对搜索结果进行综合排序,所述搜索结果包括所述第一类对象和所述第二类对象。
可选的,所述基于所述用户的历史行为,确定所述用户的历史行为对象包括:
从所述用户的历史行为数据中获取所述用户的历史行为对象;
所述确定与所述历史行为对象具有关联关系的扩展对象包括:
计算任意一个对象i与任意一个用户的种子对象j之间的行为相似性sim(i,j)和/或sim(i,j;s,t,p),其中,sim(i,j)表示该用户同时对i和j有行为的次数之和,sim(i,j;s,t,p)表示该用户在s场景下t时间范围内同时对i和j有行为p的次数之和;
依据各个对象与各个用户的历史行为对象之间的相似性得到所述扩展对象,所述相似性至少包括所述行为相似性。
可选的,在所述对搜索结果进行综合排序之前,还包括:
如果所述第二类对象的数量小于预设值,则增大所述第一类对象在所述搜索结果中的占比。
可选的,所述对搜索结果进行综合排序包括:
计算所述搜索结果的排序分数,所述第二类对象具有相似排序分数和常规排序分数,所述与所述第一类对象具有所述常规排序分数,所述相似排序分数和常规排序分数不同。
可选的,所述相似排序分数基于所述第二类对象与所述用户的历史行为对象的相似度以及种子权重确定,所述种子权重依据所述第二类对象所属的类目、用户对所述第二类对象的行为类型和行为发生的时间确定。
可选的,所述相似排序分数为所述相似度与所述种子权重的乘积。
可选的,所述相似排序分数进一步基于所述用户的历史行为对象和所述第二类对象的价格差。
可选的,在所述对搜索结果进行综合排序之后,还包括:
按照所述排序分数展示所述搜索结果。
一种搜索装置,包括:
第一确定模块,用于依据用户的搜索关键词确定第一类对象,所述第一类对象为与所述搜索关键词相关的对象;
第二确定模块,用于基于所述用户的历史行为,确定所述用户的历史行为对象;
第三确定模块,用于确定与所述历史行为对象具有关联关系的扩展对象;
第四确定模块,用于确定所述扩展对象中与所述关键词相关的第二类对象;
排序模块,用于对搜索结果进行综合排序,所述搜索结果包括所述第一类对象和所述第二类对象。
可选的,所述第二确定模块具体用于:
从所述用户的历史行为数据中获取所述用户的历史行为对象;
所述第三确定模块具体用于:
计算任意一个对象i与任意一个用户的种子对象j之间的行为相似性sim(i,j)和/或sim(i,j;s,t,p),其中,sim(i,j)表示该用户同时对i和j有行为的次数之和,sim(i,j;s,t,p)表示该用户在s场景下t时间范围内同时对i和j有行为p的次数之和;
依据各个对象与各个用户的历史行为对象之间的相似性得到所述扩展对象,所述相似性至少包括所述行为相似性。
可选的,还包括:
控制模块,用于在所述排序模块对搜索结果进行综合排序之前,如果所述第二类对象的数量小于预设值,则增大所述第一类对象在所述搜索结果中的占比。
可选的,所述排序模块具体用于:
计算所述搜索结果的排序分数,所述第二类对象具有相似排序分数和常规排序分数,所述与所述第一类对象具有所述常规排序分数,所述相似排序分数和常规排序分数不同。
可选的,所述相似排序分数基于所述第二类对象与所述用户的历史行为对象的相似度以及种子权重确定,所述种子权重依据所述第二类对象所属的类目、用户对所述第二类对象的行为类型和行为发生的时间确定。
可选的,所述相似排序分数所述相似度与所述种子权重的乘积。
可选的,所述相似排序分数进一步基于所述用户的历史行为对象和所述第二类对象的价格差。
可选的,还包括:
展示模块,用于按照所述排序分数展示所述搜索结果。
一种搜索方法,包括:
基于用户的历史行为,确定所述用户的历史行为对象;
确定与所述历史行为对象具有关联关系的扩展对象;
确定所述扩展对象中与搜索关键词相关的结果对象;
对所述结果对象进行排序。
本申请所述的搜索方法及装置,在依据搜索关键词确定搜索结果的过程中,从与用户发生历史行为的对象的具有关联关系的扩展对象中,确定与搜索关键词相关的对象,作为搜索结果的一部分,因此,搜索结果能够更贴近用户的行为习惯,对于用户而言,更为准确。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种搜索方法的流程图;
图2(a)-2(c)为本申请实施例公开的搜索方法与现有技术的页面显示效果对比图;
图3为本申请实施例公开的建立相似对象模型的方法的流程图;
图4为本申请实施例公开的又一种搜索方法的流程图;
图5为本申请实施例公开的搜索装置的结构示意图。
具体实施方式
本申请实施例公开的搜索方法,可以应用在网站(例如电子商务网站)的服务器上。所述服务器用于运行网站,在网站的搜索引擎接收到搜索关键词后,服务器不仅依据关键词给出搜索结果,还依据输入关键词的用户的历史行为信息给出搜索结果,从而提高搜索结果面向该用户的准确性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例公开的一种搜索方法,包括以下步骤:
S101:接收用户输入的搜索关键词,并搜索与搜索关键词相关的对象,简称为第一类对象。
以电子商务网站为例,用户在网站的搜索引擎中输入搜索关键词“运动鞋”,则服务器依据搜索关键词给出相关的商品“运动鞋”的信息。依据搜索关键词得到相关的对象的方式可以参见现有技术,这里不再赘述。
S102:基于所述用户的历史行为,确定所述用户的历史行为对象。
其中,用户的历史行为对象为用户发生过历史行为的对象。
以电子商务网站为例,通常,电子商务网站可以依据用户的注册信息识别用户的身份信息,即识别出输入关键词的用户是用户A。
用户A发生历史行为(行为包括但不限于收藏、点击、购买)的商品为用户A的历史行为商品(对象)。
S103:确定与用户的历史行为对象具有关联关系的扩展对象。
扩展对象与用户的历史行为对象具有关联关系,关联关系可以为相似关系、或者具有相同属性、或者具有相同的用户历史行为等。接上例,与用户A的历史行为商品属于相同品牌的商品为关联商品。
S104:确定扩展对象中与搜索关键词相关的第二类对象。
S105:对搜索结果进行综合排序,搜索结果包括第一类对象和第二类对象。
具体的,可以分别从第一类对象和第二类对象中选择对象作为搜索结果,其中,搜索结果中,第一类对象和第二类对象的数量满足一定占比。
本实施例中,占比可以为预先设定的固定值,也可以依据第一类对象和第二类对象的数量调整。具体的,如果第二类对象的数量小于预设值,则增加第一类对象的占比。例如,对于一种新商品,可能不存在用户的历史行为商品,也就不存在第二类对象,在这种情况下,第二类对象的数量为零,则要将第一类对象的占比调整为1。反之,在另一种极端情况下,可以仅将第二类对象作为待展示的对象,在此情况下,可以跳过S101。
综合排序是指,将第一类对象和第二类对象作为整体进行排序,而不是将第一类对象排序再将第二类对象排序。也就是说,将第一类对象和第二类对象一起进行排序。
下面以图2(a)-图2(c)为例,对图1所示的搜索方法以及使用该搜索方法后的效果,进行举例说明:
用户在图2(a)所示的商品列表中点击图2(a)列表顶端所示的眼霜,所以,服务器后台记录图2(a)所示的眼霜为用户的历史行为商品,并在网站中所有的商品中,查询与图2(a)所示的眼霜的相似商品,查询完成后在后台记录。
图2(b)为用户在搜索引擎中输入“眼霜”后,服务器依据“眼霜”搜索得到的商品。图2(b)也是现有的搜索方法展示给用户的搜索结果。
图2(c)为图1所示的搜索方法得到的搜索结果,搜索结果的呈现过程为:服务器基于关键词“眼霜”,从网站的全部商品中搜索得到图2(b)所示的商品,并且,基于关键词“眼霜”,从后台记录的与图2(a)所示的眼霜的相似商品中搜索,得到搜索结果。再从两次得到的搜索结果中各自选择一部分商品,形成最终的搜索结果向用户展示。
如图2(c)所示,最终的搜索结果中包括从图2(a)所示的眼霜的相似商品中选择出的一部分商品(第二类对象,图2(a)所示的眼霜的箭头指向的商品),以及从图2(b)搜索得到的商品中选择出的一部分商品(第一类对象,图2(b)所示的眼霜的箭头指向的商品),第一类对象和第二类对象的数量成一定的占比。
从图1所示的过程可以看出,搜索结果中除了依据搜索关键词搜索出的对象外,还包括与用户发生历史行为的对象相似的扩展对象,因此,搜索结果能够更贴近用户的行为习惯,对于用户而言,更为准确。
具体的,以关联关系为相似关系为例,S102的具体实现过程如图3所示,包括以下步骤:
S301:获取各个用户的历史行为对象。
如前所述,一个用户的种子对象是指该用户发生历史行为的对象。服务器可以先从网站的历史运行数据中获得各个用户的历史行为数据,可选的,可以对各个用户的历史行为数据进行过滤,再从过滤后的数据中筛选出各个用户的历史行为对象。
用户的历史行为数据表示用户对对象产生的历史行为。例如用户收藏、点击或购买商品。也就是说,一份历史行为数据包括用户、对象以及行为信息。
从用户、对象以及行为信息三方面考虑,以电子商务网站为例,具体的过滤方式包括但不限于以下任意一种:
1、过滤掉属于黑名单的用户的历史行为数据,以防止黑客通过作弊行为获得种子商品。
2、同一个用户在预设时间段内(如一天内)用户对同一个对象的多次行为。
3、过滤掉行为时间小于第一预设时间值(例如1秒)和\或大于第二时间值(例如360秒)的用户历史行为数据。
例如,用户浏览某商品的详情页面的时间不足1秒,则视为无效点击或者用户点击后完全不感兴趣,因此,这样的历史行为数据可以看作噪声。或者,对用户点击后停留时间大于360秒,可能是用户离开没有关闭页面导致的无效浏览时间,因此,这样的历史行为数据也可以看作噪声。
4、过滤掉用户对自家对象产生的历史行为数据,例如,用户点击的商品是自家的商品,则需要过滤掉这种用户历史行为数据。
5、过滤掉行为次数超过预设数值的数据。例如,要过滤掉点击数超过10000的商品的用户历史行为数据。原因在于,这种商品与大部分商品的相似度都很高,因此会影响其它商品进入相似对象库。
S302:计算网站上当前包括的各个对象与各个用户的历史行为对象之间的综合相似度。
行为相似度如式(1)所示:
Figure BDA0001392469190000081
if au,i!=0&&au,j!=0,co_action=1else=0
其中,sim(i,j)表示对象i和j的行为相似度,对所有用户是否对对象(i,j)同时有行为的次数求和。au,i表示用户u是否对对象i有行为,是为1,反之为0;co_action(au,i,au,j)表示用户u是否对商品i和商品j同时有行为,是为1,反之为0。
进一步的,实际中,不同行为如点击和购买,用户付出的成本不同,因此数据的可信度和重要性也不一样。不同场景如推荐和搜索下的行为数据,也具有差异。共同行为发生在多长的时间范围内,对于相似度的认定也有不同的影响,例如,当天和一个月前共同点击过的商品有关联性的可能性比较小。综合考虑到上述因素,本实施例中,区分行为类型,行为时间,行为场景进行相似度计算,如式(2):
Figure BDA0001392469190000091
if uu,i;s,t,p!=0&&uu,j;s,t,p!=0,co_action=1else=0
uu,i;s,t,p表示用户u对对象i在s场景下t时间范围是否有p行为;co_action(uu,i;s,t,p,uu,j;s,t,p)表示用户u对对象i和j在s场景下t时间范围内是否同时有p行为类型,是为1,反之为0。sim(i,j;s,t,p)表示对象i和j在s场景下t时间范围内p种行为类型下的次数之和。
以电子商务网站上的常见的两种行为类型:点击和购买为例(将收藏商品归并为点击,加购归并为购买),可以得到点击-点击,点击-购买,购买-购买3种行为组合。再以全网数据和搜索场景数据以及1天和3天两种时间范围为例,按照式(2),对象i和j总计可以得到3x2x2种相似度。
本实施例中,将式(1)和式(2)所示的相似度统称为对象的行为相似度。在实际应用中,可以使用式(1)和/或式(2)得到对象的行为相似度。
除了对象的行为相似度外,还可以计算对象的内容相似度。对象的内容相似度主要包括对象间的图像和/或文本的相似度。对象的内容相似度的计算方式可以参见现有技术,这里不再赘述。
可以基于行为相似度和内容相似度,得到综合相似度,作为网站上当前包括的各个对象与各个用户的历史行为对象之间的相似度。
S303:依据上述得到的综合相似度,确定扩展对象。
具体的,可以将相似度满足阈值的对象确定为扩展对象。
从图3的步骤可以看出,每次搜索均需执行S301-S303,为了减轻搜索过程中的线上计算压力,可选的,可以按照S301-S303的原理训练模型,使用训练好的模型离线预测出每个历史行为对象的扩展对象,具体的:
将上述获得的综合相似度作为逻辑回归模型的输入,在不同场景下训练逻辑回归模型,得到相似对象模型。
具体的,以电子商务网站为例,将上述获得的相似度输入逻辑回归模型作为特征,加入商品人气分等代表商品质量的特征一起训练。为获取跟场景需求一致的相似数据,用搜索下的样本进行训练,即在搜索时,给用户展现根据用户的历史行为商品推出的相似商品,用户若点击或购买为正样本,反之为负样本。使用正样本和负样本训练逻辑回归模型。可选的,可以使用现有的工具评估模型的好坏。
需要说明的是,训练过程可以在搜索之前进行,模型训练好后,可以离线预测出每个历史行为对象的相似对象,以减轻搜索过程中的线上计算压力。
图4为本申请实施例公开的又一种搜索方法,与图1所示的方法相比,图4中,分别对第一类对象和第二类对象进行打分,以得到更为准确的搜索排序。
图4中包括以下步骤:
S401:接收用户输入的搜索关键词。
S402:搜索与搜索关键词相关的对象,简称为第一类对象。
S403:获取与用户的历史行为对象具有关联关系的扩展对象中,与搜索关键词相关的相似对象,简称为第二类对象。
具体的,可以依据预先设置的相似对象模型,获取扩展对象。
S404:分别从第一类对象和第二类对象中选择待展示的对象,其中,待展示的对象中,第一类对象和第二类对象的数量满足一定占比。
S405:计算待展示的对象中的第二类对象的相似排序分数。
本实施例中,按照式(3)计算第二类对象的相似排序分数:
Score=sseed(cate,type,time)*ssim (3)
其中,Score表示排序分数,Sseed是对象类目cate、行为类型type和行为时间time对应的种子权重(可以预先为不同对象类目、不同行为类型和行为时间设置对应的种子权重,例如,女装、一个月内的购买行为的种子权重为1,女装、一个月内的收藏行为的种子权重为0.5),Ssim是离线计算好的相似度,即S302中得到的综合相似度。
具体的,Sseed的计算方式为:用不同的对象类目、用户对对象的行为类型和用户对对象的行为时间作为特征,训练逻辑回归模型,学习出不同类目下不同行为类型不同行为时间的重要性,即这里的Sseed
本实施例中,考虑了种子权重和对象间的相似度。不同行为类型,行为时间的对象具有不同的重要性。种子权重会根据用户对该对象的行为类型(例如点击、购买),行为发生的时间来确定,同时因为不同类目受到时间的影响不同,例如家电等长时间才需要购买一次,服饰等受到季节影响,变化会比较快,所以,对象所属的类目也是确定种子权重的因素之一。
除了式(3)之外,在电子商务网站中,还可以加入价格作为打分的依据,如式(4):
Score=sseed*ssim+α*gapprice (4)
其中,gapprice是种子对象和相似对象的价格差,α表示调控价格的参数,当α为正时表示将比种子对象价格高的相似对象上提,为负则反之,Score表示最终相似排序分。α可以根据需求和人工经验预先设定,也可以通过Q-Learning模型学习确定。
在实际应用中,可以酌情使用式(3)或式(4)。
S406:计算待展示的对象中的第一类对象和第二类对象的常规排序分数。
计算常规排序分数的具体方式可以参见现有技术,例如,按照商品的在一个月之内的销量打分,销量越高分数越高。这里不再赘述。
S407:按照相似排序分数和常规排序分数对待展示的对象进行排序展示。
需要说明的是,对于具有两类排序分数的第二类对象,可以综合两类分数得到一个最终的分数,例如,将两类分数取平局值,或者,先权重相乘求和后再取平均值。
本申请实施例还公开了一种搜索方法,包括以下步骤:
1、基于用户的历史行为,确定所述用户的历史行为对象。
2、确定与所述历史行为对象具有关联关系的扩展对象。
3、确定所述扩展对象中与搜索关键词相关的结果对象。
前三步的具体实现方式可以参见上述实施例,这里不再赘述。
4、对所述结果对象进行排序。
排序的方式可以为:使用相似性排序分进行排序,或者,使用常规排序分进行排序。
本实施例所述的搜索方法,仅执行图4所示的搜索方法中的S403和S405,即仅将历史相似对象作为关键词的搜索库。
图5为本申请实施例公开的一种搜索装置,包括:第一确定模块、第二确定模块、第三确定模块、第四确定模块和排序模块。
其中,第一确定模块用于依据用户的搜索关键词确定第一类对象,所述第一类对象为与所述搜索关键词相关的对象。第二确定模块用于基于所述用户的历史行为,确定所述用户的历史行为对象。第三确定模块用于确定与所述历史行为对象具有关联关系的扩展对象。第四确定模块用于确定所述扩展对象中与所述关键词相关的第二类对象。排序模块用于对搜索结果进行综合排序,所述搜索结果包括所述第一类对象和所述第二类对象。
可选的,图5所示的装置还可以包括:控制模块,用于如果所述第二类对象的数量小于预设值,则增大所述第一类对象在所述搜索结果中的占比。以及,展示模块,用于按照排序分数展示搜索结果。
以上各个模块实现各自功能的具体方式,可以参见上述方法实施例,这里不再赘述。
图5所示的搜索装置,可以设置在网站(例如电子商务网站)的服务器上。在网站的搜索引擎接收到搜索关键词后,所述装置不仅依据搜索关键词给出搜索结果,还依据输入搜索关键词的用户的历史行为信息给出搜索结果,从而提高搜索结果面向该用户的准确性。
本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基
于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (15)

1.一种搜索方法,其特征在于,包括:
依据用户的搜索关键词确定第一类对象,所述第一类对象为与所述搜索关键词相关的对象;
基于所述用户的历史行为,确定所述用户的历史行为对象;
确定与所述历史行为对象具有关联关系的扩展对象;
确定所述扩展对象中与所述关键词相关的第二类对象;
对搜索结果进行综合排序,所述搜索结果包括所述第一类对象和所述第二类对象,
其中,所述基于所述用户的历史行为,确定所述用户的历史行为对象包括:
从所述用户的历史行为数据中获取所述用户的历史行为对象;
所述确定与所述历史行为对象具有关联关系的扩展对象包括:
计算任意一个对象i与任意一个用户的种子对象j之间的行为相似性sim(i,j)和/或sim(i,j;s,t,p),其中,sim(i,j)表示该用户同时对i和j有行为的次数之和,sim(i,j;s,t,p)表示该用户在s场景下t时间范围内同时对i和j有行为p的次数之和;
依据各个对象与各个用户的历史行为对象之间的相似性得到所述扩展对象,所述相似性至少包括所述行为相似性。
2.根据权利要求1所述的方法,其特征在于,在所述对搜索结果进行综合排序之前,还包括:
如果所述第二类对象的数量小于预设值,则增大所述第一类对象在所述搜索结果中的占比。
3.根据权利要求1所述的方法,其特征在于,所述对搜索结果进行综合排序包括:
计算所述搜索结果的排序分数,所述第二类对象具有相似排序分数和常规排序分数,所述第一类对象具有所述常规排序分数,所述相似排序分数和所述常规排序分数不同。
4.根据权利要求3所述的方法,其特征在于,所述相似排序分数基于所述第二类对象与所述用户的历史行为对象的相似度以及种子权重来确定,所述种子权重依据所述第二类对象所属的类目、用户对所述第二类对象的行为类型和行为发生的时间确定。
5.根据权利要求4所述的方法,其特征在于,所述相似排序分数为所述相似度与所述种子权重的乘积。
6.根据权利要求5所述的方法,其特征在于,所述相似排序分数进一步基于所述用户的历史行为对象和所述第二类对象的价格差。
7.根据权利要求3所述的方法,其特征在于,在所述对搜索结果进行综合排序之后,还包括:
按照所述排序分数展示所述搜索结果。
8.一种搜索装置,其特征在于,包括:
第一确定模块,用于依据用户的搜索关键词确定第一类对象,所述第一类对象为与所述搜索关键词相关的对象;
第二确定模块,用于基于所述用户的历史行为,确定所述用户的历史行为对象;
第三确定模块,用于确定与所述历史行为对象具有关联关系的扩展对象;
第四确定模块,用于确定所述扩展对象中与所述关键词相关的第二类对象;
排序模块,用于对搜索结果进行综合排序,所述搜索结果包括所述第一类对象和所述第二类对象,
其中,所述第二确定模块具体用于:
从所述用户的历史行为数据中获取所述用户的历史行为对象;
所述第三确定模块具体用于:
计算任意一个对象i与任意一个用户的种子对象j之间的行为相似性sim(i,j)和/或sim(i,j;s,t,p),其中,sim(i,j)表示该用户同时对i和j有行为的次数之和,sim(i,j;s,t,p)表示该用户在s场景下t时间范围内同时对i和j有行为p的次数之和;
依据各个对象与各个用户的历史行为对象之间的相似性得到所述扩展对象,所述相似性至少包括所述行为相似性。
9.根据权利要求8所述的装置,其特征在于,还包括:
控制模块,用于在所述排序模块对搜索结果进行综合排序之前,如果所述第二类对象的数量小于预设值,则增大所述第一类对象在所述搜索结果中的占比。
10.根据权利要求8所述的装置,其特征在于,所述排序模块具体用于:
计算所述搜索结果的排序分数,所述第二类对象具有相似排序分数和常规排序分数,所述第一类对象具有所述常规排序分数,所述相似排序分数和常规排序分数不同。
11.根据权利要求10所述的装置,其特征在于,所述相似排序分数基于所述第二类对象与所述用户的历史行为对象的相似度以及种子权重确定,所述种子权重依据所述第二类对象所属的类目、用户对所述第二类对象的行为类型和行为发生的时间确定。
12.根据权利要求11所述的装置,其特征在于,所述相似排序分数为所述相似度与所述种子权重的乘积。
13.根据权利要求12所述的装置,其特征在于,所述相似排序分数进一步基于所述用户的历史行为对象和所述第二类对象的价格差。
14.根据权利要求10所述的装置,其特征在于,还包括:
展示模块,用于按照所述排序分数展示所述搜索结果。
15.一种搜索方法,其特征在于,包括:
基于用户的历史行为,确定所述用户的历史行为对象;
确定与所述历史行为对象具有关联关系的扩展对象;
确定所述扩展对象中与搜索关键词相关的结果对象;
对所述结果对象进行排序,
其中,所述基于所述用户的历史行为,确定所述用户的历史行为对象包括:
从所述用户的历史行为数据中获取所述用户的历史行为对象;
所述确定与所述历史行为对象具有关联关系的扩展对象包括:
计算任意一个对象i与任意一个用户的种子对象j之间的行为相似性sim(i,j)和/或sim(i,j;s,t,p),其中,sim(i,j)表示该用户同时对i和j有行为的次数之和,sim(i,j;s,t,p)表示该用户在s场景下t时间范围内同时对i和j有行为p的次数之和;
依据各个对象与各个用户的历史行为对象之间的相似性得到所述扩展对象,所述相似性至少包括所述行为相似性。
CN201710757313.5A 2017-08-29 2017-08-29 一种搜索方法及装置 Active CN109446402B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201710757313.5A CN109446402B (zh) 2017-08-29 2017-08-29 一种搜索方法及装置
TW107119974A TW201913415A (zh) 2017-08-29 2018-06-11 搜尋方法及裝置
PCT/US2018/048387 WO2019046329A1 (en) 2017-08-29 2018-08-28 SEARCH METHOD AND APPARATUS
US16/115,324 US20190065611A1 (en) 2017-08-29 2018-08-28 Search method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710757313.5A CN109446402B (zh) 2017-08-29 2017-08-29 一种搜索方法及装置

Publications (2)

Publication Number Publication Date
CN109446402A CN109446402A (zh) 2019-03-08
CN109446402B true CN109446402B (zh) 2022-04-01

Family

ID=65437406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710757313.5A Active CN109446402B (zh) 2017-08-29 2017-08-29 一种搜索方法及装置

Country Status (4)

Country Link
US (1) US20190065611A1 (zh)
CN (1) CN109446402B (zh)
TW (1) TW201913415A (zh)
WO (1) WO2019046329A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580278B (zh) * 2019-07-30 2023-05-26 平安科技(深圳)有限公司 根据用户画像的个性化搜索方法、系统、设备及存储介质
CN111475725B (zh) * 2020-04-01 2023-11-07 百度在线网络技术(北京)有限公司 用于搜索内容的方法、装置、设备和计算机可读存储介质
CN112040250A (zh) * 2020-07-21 2020-12-04 拉扎斯网络科技(上海)有限公司 一种信息处理方法、信息处理装置、存储介质和电子设备
CN113763005A (zh) * 2020-09-23 2021-12-07 北京沃东天骏信息技术有限公司 图片广告推送方法、电子设备及计算机可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751422A (zh) * 2008-12-08 2010-06-23 北京摩软科技有限公司 一种移动终端智能搜索的方法、移动终端和服务器
CN101908184A (zh) * 2009-06-04 2010-12-08 维鹏信息技术(上海)有限公司 一种通过多个具有关联的终端发布信息的控制方法及系统
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
CN102479366A (zh) * 2010-11-25 2012-05-30 阿里巴巴集团控股有限公司 一种商品推荐方法及系统
CN103793388A (zh) * 2012-10-29 2014-05-14 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN104102328A (zh) * 2013-04-01 2014-10-15 联想(北京)有限公司 信息处理方法和信息处理设备
CN104731830A (zh) * 2013-12-24 2015-06-24 腾讯科技(深圳)有限公司 一种推荐方法、装置及服务器
CN104794135A (zh) * 2014-01-21 2015-07-22 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法和装置
CN106446210A (zh) * 2016-09-30 2017-02-22 四川九洲电器集团有限责任公司 一种多媒体文件搜索方法、服务器及客户端

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US9020835B2 (en) * 2012-07-13 2015-04-28 Facebook, Inc. Search-powered connection targeting
US9292515B1 (en) * 2013-03-15 2016-03-22 Google Inc. Using follow-on search behavior to measure the effectiveness of online video ads
US20140280174A1 (en) * 2013-03-16 2014-09-18 Elan Bitan Interactive user-controlled search direction for retrieved information in an information search system
CN104636402B (zh) * 2013-11-13 2018-05-01 阿里巴巴集团控股有限公司 一种业务对象的分类、搜索、推送方法和系统
GB2545548A (en) * 2014-03-29 2017-06-21 Camelot Uk Bidco Ltd Improved method, system and software for searching, identifying, retrieving and presenting electronic documents
KR101670412B1 (ko) * 2015-04-03 2016-10-31 경북대학교 산학협력단 작업현장의 아차사고 모니터링 시스템 및 이를 이용한 모니터링 방법
CN104933172A (zh) * 2015-06-30 2015-09-23 百度在线网络技术(北京)有限公司 一种基于用户搜索行为的信息推送方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751422A (zh) * 2008-12-08 2010-06-23 北京摩软科技有限公司 一种移动终端智能搜索的方法、移动终端和服务器
CN101908184A (zh) * 2009-06-04 2010-12-08 维鹏信息技术(上海)有限公司 一种通过多个具有关联的终端发布信息的控制方法及系统
CN102479366A (zh) * 2010-11-25 2012-05-30 阿里巴巴集团控股有限公司 一种商品推荐方法及系统
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
CN103793388A (zh) * 2012-10-29 2014-05-14 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN104102328A (zh) * 2013-04-01 2014-10-15 联想(北京)有限公司 信息处理方法和信息处理设备
CN104731830A (zh) * 2013-12-24 2015-06-24 腾讯科技(深圳)有限公司 一种推荐方法、装置及服务器
CN104794135A (zh) * 2014-01-21 2015-07-22 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法和装置
CN106446210A (zh) * 2016-09-30 2017-02-22 四川九洲电器集团有限责任公司 一种多媒体文件搜索方法、服务器及客户端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
电子商务环境下个性化信息推荐服务效果调查研究;刘欢;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;20151215;J157-119 *

Also Published As

Publication number Publication date
US20190065611A1 (en) 2019-02-28
WO2019046329A1 (en) 2019-03-07
CN109446402A (zh) 2019-03-08
TW201913415A (zh) 2019-04-01

Similar Documents

Publication Publication Date Title
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
JP6356744B2 (ja) ウェブサイト横断情報を表示する方法およびシステム
US11100178B2 (en) Method and device for pushing information
US20180047071A1 (en) System and methods for aggregating past and predicting future product ratings
US9489688B2 (en) Method and system for recommending search phrases
CN110020128B (zh) 一种搜索结果排序方法及装置
TWI512653B (zh) Information providing method and apparatus, method and apparatus for determining the degree of comprehensive relevance
US9576251B2 (en) Method and system for processing web activity data
CN107341268B (zh) 一种热搜榜排序方法及系统
WO2017028687A1 (zh) 闲置商品对象信息处理方法及装置
CN109446402B (zh) 一种搜索方法及装置
US11727014B2 (en) Dynamic filter recommendations
EP2862105A1 (en) Ranking search results based on click through rates
TW201501059A (zh) 訊息推薦方法及裝置
KR101646312B1 (ko) 개인행동기반 관심 대상 및 선호 분야 분석시스템 및 그 방법
US11682060B2 (en) Methods and apparatuses for providing search results using embedding-based retrieval
WO2019218654A1 (zh) 产品排序
KR101707660B1 (ko) 연관 검색어를 이용한 관심사 카테고리 기반 이커머스 시스템
US20210118020A1 (en) Price-Based User Feedback System
CN112149003B (zh) 商品社群推荐方法、装置和计算机设备
CN114820123A (zh) 团购商品推荐方法、装置、设备及存储介质
CN107133811A (zh) 一种目标用户的识别方法和装置
CN110427545B (zh) 一种信息推送方法及系统
Jianjun Research on collaborative filtering recommendation algorithm based on user behavior characteristics
CN113763089A (zh) 物品推荐方法及装置、计算机可存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant