CN104866474A - 个性化数据搜索方法及装置 - Google Patents

个性化数据搜索方法及装置 Download PDF

Info

Publication number
CN104866474A
CN104866474A CN201410058488.3A CN201410058488A CN104866474A CN 104866474 A CN104866474 A CN 104866474A CN 201410058488 A CN201410058488 A CN 201410058488A CN 104866474 A CN104866474 A CN 104866474A
Authority
CN
China
Prior art keywords
user
data object
feature
group
query word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410058488.3A
Other languages
English (en)
Other versions
CN104866474B (zh
Inventor
陈曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410058488.3A priority Critical patent/CN104866474B/zh
Publication of CN104866474A publication Critical patent/CN104866474A/zh
Priority to HK15111747.6A priority patent/HK1211096A1/zh
Application granted granted Critical
Publication of CN104866474B publication Critical patent/CN104866474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种个性化数据搜索方法及装置,包括:根据当前用户的搜索请求中的查询词搜索数据对象;依据历史行为日志,分别确定历史用户在利用查询词的搜索访问过程中的第一行为特征,并生成查询词的意图向量;根据用户属性,统计每一个用户群体对数据对象的第二行为特征,并生成用户群体的偏好向量;计算查询词的意图向量与每一用户群体的偏好向量的相似度;将相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体;利用参照群体的历史行为特征调整当前用户使用所述查询词搜索到的数据对象的排序。从而改进和提升了搜索平台的性能,提高输出给用户的搜索结果的准确性,为用户输出最合理最符合其搜索意图的结果。

Description

个性化数据搜索方法及装置
技术领域
本申请涉及数据搜索领域,更具体地涉及一种个性化数据搜索方法及装置。
背景技术
随着互联网业务迅速发展,网络中的数据量日益增加。数据搜索引擎已经成为帮助用户在海量数据对象中找到自己满意的数据对象的重要工具。尽管数据搜索引擎可以在海量数据对象中筛选出用户所需要的搜索结果(数据对象),但是,无论如何使用数据搜索引擎来搜索数据对象,其关键技术都包含对搜索出的搜索结果中所有的数据对象进行排序的输出处理。也即是说,用户输入一个查询词后,通过搜索找到对应的数据对象作为搜索结果,并以一定的排序方式展示输出这些搜索结果。通常,数据搜索技术与用户本身的差异或者用户的特点无关,仅与查询词有关。也就是说对不同用户使用同一个查询词,搜索到的全部数据对象一致即搜索结果完全一致,并且,对搜索结果的输出展示的排序方式相同。因而不同用户采用同一查询词搜索,最后看到的以一定顺序展示的搜索结果相同。由此,个性化搜索技术逐渐兴起。所谓个性化搜索,是指不同用户能获得不同的输出展示排序的搜索结果,并且这个结果输出更贴近用户搜索需求。具体地,不同用户采用同一查询词做搜索,所得到的搜索结果,由于对应不同用户,其会按照不同的排序方式输出展示。此处,搜索结果的排序方式考虑了用户在一个或多个维度上的特征,而用户在各维度上的特征可以体现出用户的个性。其中,个性化搜索需要准确识别用户的个性化信息。其中,不同用户可以根据其在各维度上的特征分为不同的群体。例如:性别维度,可以有男性、女性;年龄维度,可以有儿童、青年、中年、老年;网络访问维度,可以有高、中、低;……;等等。用户可以在网站注册过程中填写这些维度上的特征以确定所属群体,或根据用户行为使用算法识别出所属群体。另外,搜索到的每个数据对象,在不同维度也有不同特点。例如:数据对象的类目维度,可以有体育类目、人文类目,等等;数据对象的标志维度、数值范围维度、交互量维度,等等。由于不同用户在某一维度上的特征可能不同,相应地,用户所偏爱/关注的搜索结果中的数据对象的特征也不同。用户对其关注的数据对象可以通过用户行为数据分析而得到,用户行为数据可以包括与用户对数据对象进行操作所产生的用户行为有关的各种数据。例如:用户对数据对象的点击、浏览、交互等行为。个性化搜索以用户为出发点,根据用户行为数据,结合用户的特征和数据对象的特征对搜索结果中的数据对象进行个性化排序,以满足不同用户对不同数据对象的需求。
现有的个性化搜索,比如:主要以用户对数据对象的交互为目标,对用户行为、用户在一个或多个维度上的特征、数据对象在一个或多个维度上的特征,训练概率预测模型,由所述模型预测用户可能会对每个数据对象做交互的概率。所述概率可以影响数据对象在输出排序时的排序分值。当根据用户输入的查询词进行搜索时,对搜索出的搜索结果(一个或多个数据对象),按照用户可能会对每个数据对象做交互(或其他操作)的概率,计算每个数据对象的排序分值,以分值从大到小的顺序,为用户展示搜索结果。但是,利用现有的预测模型实施的个性化搜索技术,没有考虑查询词Query的信息,在不同的查询词下用户行为有不同的特点,比如,不同的查询词对应的用户有不同的意图。例如:在海量的商品搜索中,男性用户搜“T恤”时倾向于购买男性T恤,而男性用户搜“连衣裙”时则仍然是购连衣裙,此时由该查询词的信息,应该认为当前用户是属于“女性”群体,这时就不能仅仅根据用户各维度的特征、数据对象各维度的特征、用户历史偏好(即对用户行为数据分析的历史信息)来预测用户搜索意图。因为,根据男性用户的历史信息、或根据当前搜索关键词“连衣裙”本身、或结合二者,都难以给出最符合当前用户真正需求(意图)的搜索结果排序,即导致了搜索结果的输出排序不准确的缺陷。由此,需要改进搜索平台的个性化搜索处理性能,以提高搜索的输出结果准确度,为用户输出最合理最符合其搜索意图的结果。
发明内容
基于上述现有技术中个性化搜索的缺陷,本申请的主要目的在于提供一种个性化数据搜索方法和装置,以改进个性化搜索处理性能,从而最大限度为用户提供符合其搜索意图的搜索结果、提高搜索平台的输出搜索结果的准确度。
为了解决上述技术问题,本申请是通过以下技术方案来实现。
根据本申请一个方面的实施例,提出一种个性化数据搜索方法,包括:根据当前用户的搜索请求中的查询词搜索数据对象;依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量;根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述第二行为特征生成所述用户群体的偏好向量;计算查询词的意图向量与每一用户群体的偏好向量的相似度;将所述相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体;利用所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序。
根据本申请的另一方面的实施例,提出一种个性化数据搜索装置,包括:搜索模块,用于根据当前用户的搜索请求中的查询词搜索数据对象;第一获取模块,用于依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量;第二获取模块,用于根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述第二行为特征生成所述用户群体的偏好向量;计算模块,用于计算查询词的意图向量与每一用户群体的偏好向量的相似度;确定模块,用于将所述相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体;排序模块,用于利用所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序。
与现有技术相比,根据本申请的技术方案具有以下有益效果:
本申请结合以往的用户行为数据及其记录的用户、数据对象、该用户对该数据对象的一种或多种用户行为特征,结合查询词本身的维度或者说属性特征,即综合查询词的意图和用户的历史信息来构建个性化模型,更准确的预测用户在数据对象上的交互概率。由此,在用户进行数据搜索时,分析出当前查询词的意图所属用户群,在确定当前查询词意图下所对应的用户群体之后,针对该用户群体所对应的数据对象,利用个性化模型对搜索出的每个数据对象进行个性化分数计算,按照每个数据对象的个性化分数,对所有的数据对象进行排序处理,进而可以通过该排序处理得到的顺序,展示这些作为搜索结果的数据对象给用户。从而改进和提升了搜索平台的性能,提高输出给用户的搜索结果的准确性,为用户输出最合理最符合其搜索意图的结果。进一步,还可以避免仅直接使用原始的查询词作为个性化模型特征带来的数据稀疏问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请一实施例的个性化数据搜索方法的流程图;
图2是根据本申请一实施例的个性化数据搜索方法中获取查询词的意图向量的方法流程图;
图3是根据本申请一实施例的个性化数据对象排序方法的流程图,以及
图4是根据本申请一实施例的个性化数据搜索装置的结构图。
具体实施方式
本申请的主要思想在于,通过获取到的当前用户的搜索请求中的查询词的意图向量与每一用户群体的偏好向量的相似度的计算,来确定查询词意图与每一用户群体的相似度;将相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体;利用参照群体的历史行为特征调整当前用户使用查询词搜索到的数据对象的排序。可以有效地提高输出给用户的搜索结果的准确性,为用户输出最合理最符合其搜索意图、个性的结果。
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供了一种个性化数据搜索方法。如图1所示,图1是根据本申请一实施例的个性化数据搜索方法的流程图。
在步骤S110处,根据当前用户的搜索请求中的查询词搜索数据对象。
其中,当前用户使用所述查询词可以从数据库中搜索到一个或多个数据对象。
在步骤S120处,依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量。
具体地,服务器系统可以搜集大量用户在使用所述查询词进行搜索的相关行为记录。所述相关行为记录包括用户对所述查询词对应的搜索结果列表中的数据对象的点击行为、浏览行为、收藏行为及针对该数据对象的交易行为等中的一种或多种。通过对所述相关行为记录的统计分析可以得到所述的第一行为特征。
如图2所示的步骤S120可以包括子步骤S1201-S1203,主要说明如何根据第一行为特征生成查询词的意图向量。
在子步骤S1201处,根据数据对象在某一设定维度上的特征,将搜索到的数据对象划分为一个或多个类别。
具体地,每个数据对象可以从一个或多个维度进行评价。本实施中,可以选择某一个设定的维度对数据对象进行评价。对数据对象在某一维度上的评价,可以表示数据对象的一项属性(个性化标签)。数据对象在该项属性上的属性值作为数据对象在该维度上的特征。不同数据对象在同一维度上的特征可以相同或不同,基于该同一维度的特征,可以将数据对象划分到一个或多个不同的类别中。例如,当数据对象为商品时,商品一共有n个维度的属性即{A1,A2,…,An},如{类目,品牌,风格,销量,价格}。且不同的商品在每个维度的属性可以取不同的值(属性值)即{V1,V2,…,Vn},如数据对象在类目维度上的属性值可以为“男装”或“女装”、在价格维度上的属性值可以为“50RMB”、“100RMB”、“450RMB”或“1100RMB”。其中,商品在价格维度的属性值还可以以价格数值的范围划分,如形成为多个价格区间,比如[1-100]、[100-500]及[500-1200]等价格区间、或形成低档、中档及高档等多个类别。
因此,商品在类目这一维度下可以分为“男装”类别和“女装”类别,在价格这一维度下可以分为进行低档、中档及高档等类别。
其中,数据对象可以预先存储在服务器侧,可以通过对服务器侧的数据对象进行预先分析,获得数据对象的特征。进一步,还可以基于数据对象的特征,在数据对象的每个维度下,划分出相应的类别。
以商品搜索为例,服务器接收到含有查询词为“真丝连衣裙”的搜索请求,对服务器侧的“真丝连衣裙”的商品进行预先分析,选择用于评价商品的维度,比如,价格维度、性别维度、年龄维度等。其中,商品的性别维度为购买或浏览该商品的用户的性别。商品的年龄维度为购买或浏览该商品的用户的年龄。
通过所述预先分析可以取得商品在选择的维度对应的特征,如:真丝连衣裙A1在价格维度上的特征为“200元”、真丝连衣裙A2在价格维度上的特征“1000元”。进而可以将数据对象A1、A2在价格维度上划分成高价和低价两个类别。
在子步骤S1202处,依据历史行为日志,分别确定历史用户基于所述查询词搜索到所述数据对象并对每一个类别下的所述数据对象上发生了指定行为的次数,以所述指定行为的次数作为所述第一行为特征。
其中,根据行为日志记录,获取历史用户在每个数据对象发生的指定行为的次数、以及每个数据对象在该选择的维度下所属的类别,统计该选择的维度下的每个类别中的所有数据对象上发生了指定行为的数量。以所述指定行为的次数作为所述第一行为特征。
其中,指定行为是用户对数据对象进行的行为(操作、动作),包括一种或多种用户行为,例如:点击、浏览、收藏数据对象以及基于数据对象进行数据交互等。进一步的,所述数据交互行为包括下载所述数据对象、为所述数据对象付款等行为。用户通过搜索引擎获得与搜索请求中的查询词相匹配的一个或多个数据对象。所述一个或多个数据对象可以作为搜索结果输出给请求搜索的用户。
用户行为数据,用于记录用户针对数据对象的一种或多种不同类型的用户行为(即一种或多种用户行为)。进一步地,在用户行为数据中,可以记录有:用户、用户对数据对象的一种或多种用户行为、数据对象、以及数据对象对应的查询词等。服务器采集的日志文件中包括一条或多条日志数据,该一条或多条日志数据即可以为一个或多个用户行为数据。一个用户行为数据可以包括用户从开始搜索数据对象,到搜索出数据对象后,用户针对该数据对象的进行的一系列的用户行为。而用户行为的数量,则是对用户行为数据的统计,比如,对商品(数据对象)点击、收藏、成交的次数等。
可以通过每个数据对象的各种用户行为的数量以及每个数据对象在同一个维度下划分到的类别,分别统计在每个类别下的数据对象上发生指定行为的数量。
在子步骤S1203处,根据所述第一行为特征生成所述查询词的意图向量。
具体地,历史用户在根据查询词搜到数据对象后,在不同的类别下会有不同的表现。历史用户可能在有些类别下的数据对象上发生指定行为的次数较多,而在另一些类别下的数据对象上发生指定行为的次数则较少。历史用户使用查询词获取搜索结果后在不同类别上的行为表现或行为分布特征即为所述的第一行为特征。量化后的第一行为特征可以用于表征用户使用所述查询词的搜索意图(或者说倾向性、偏好的目的),在本申请实施例中称为查询词的意图向量。
根据当前搜索请求中的查询词Query(Q),可以计算该查询词在设定维度(属性)Ak(k为自然数)下的意图。对维度Ak的不同取值(属性值)即维度的特征分别记作:V1,V2,…,Vt,t为自然数。即将该查询词对应的数据对象分为V1、V2、…,Vt等类别。
进一步地,计算搜索查询词Query(Q)在一个维度Ak下的意图向量{QV1,QV2,…,QVt}。例如,搜索查询词Q对应的商品,搜索到的商品在价格维度的特征值分别为“80”,“300”,“1000”。历史用户在价格为“80”这个类别的商品上的指定行为数(比如点击数)是100,在价格为“300”这个类别的商品上的指定行为数是500,价格为“1000”这个类别的商品上的指定行为数是80,则所述查询词在价格维度下的意图向量记为{100,500,80}。当然,也可以采用展示数、成交数、与Q匹配的商品数等来计算指定行为数QVj
进一步举例说明,以网络购物这类需要海量数据搜索的技术为例:当用户进行网购时,用户输入一个查询词(query)后,可以看到商品列表,并对商品列表中的数据对象进行操作。该商品列表即是搜索出的一个或多个数据对象(商品)所组成的。用户行为类型包括点击商品列表中的某一商品、购买商品/成交(指定的数据交互行为)等行为。这一系列的用户行为都将被记录在日志文件中。用于记录用户行为数据的日志文件,例如表1所示,但日志文件不限于表1中的内容。
表1:
序号 数据对象 用户 查询词 展示数 点击数 成交数
Query
1 商品A1 用户U1 Q1 100 10 3
2 商品A1 用户U2 Q1 200 15 5
3 商品A1 用户U1 Q2 150 8 4
4 商品A2 用户U1 Q2 300 12 8
5 商品A2 用户U2 Q1 400 20 15
该日志文件中包含4个用户行为数据。用户行为数据中记录了序号、搜索出的数据对象(商品A1、商品A2),输入查询词的用户(用户U1、用户U2),查询词(Q1、Q2),以及在一次搜索访问过程中,用户针对数据对象产生的用户行为的次数。其中,该日志文件中记录了展示、点击、成交4种用户行为,和每个用户行为数据中的每种用户行为的次数(数量),如,展示数100次、点击数10次、成交数即交易达成次数为3次,等。用户行为数据中的用户行为的种类可以根据需要增加或减少。
针对表1中日志数据,可以分别统计出在使用某个查询词的搜索访问过程中对每个数据对象发生的指定用户行为数量。进而,可以统计出在使用某个查询词的搜索访问过程中对某个类别下的所有数据对象的指定用户行为数量。用户在使用该查询词的搜索访问过程中对某一类别下的所有数据对象进行的指定用户行为数量即为所述第一行为特征的量化值,也可以记作该查询词在该类别下的意图特征数。因此,通过所述的统计可以得到查询词与该查询词在每一类别下的意图特征数的对应关系。
例如,用户使用查询词Q1时搜索到的商品在价格维度上分为高档类别和低档类别。低档类别有商品A1,基于查询词Q1的搜索访问中,历史用户U1及U2在商品A1上的点击数量为10+15=25次、成交数量为3+5=8次。高档类别有商品A2,基于查询词Q1的搜索访问中,历史用户U1及U2在商品A2上的点击数量为20次、成交数量为15次。
如果以点击行为作为指定的行为,则查询词Q1在价格维度上对应低档类别的意图特征数为2,对应高档类别的意图特征数为3。查询词Q1在价格维度上的意图向量则为{2,3}。
如果以成交行为作为指定的用户行为,则查询词Q1在价格维度上对应低档类别的意图特征数为25,对应高档类别的意图特征数为5。查询词Q1在价格维度上的意图向量则为{25,5}。
在步骤S130处,根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述第二行为特征生成每一用户群体的意图向量。
具体地,根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体在每一个所述类别的数据对象上发生的指定行为的次数。进一步地,依据每个数据对象在设定维度下所属于类别,统计在该设定维度下的每个类别中的所有数据对象上由某一用户群体的用户进行指定行为的次数;以该用户群体的用户对每一个类别的数据对象进行了指定行为的次数为所述第二行为特征;根据所述第二行为特征生成所述用户群体的偏好向量即用户群体的意图向量。
其中,用户行为数据中记录了用户、数据对象、用户对数据对象的用户行为及相应的用户行为数量。因而,可以获取每个用户对当前搜索请求中查询词对应的数据对象的一种或多种用户行为的数量。而每个数据对象在设定维度下又可以分别属于不同的类别。则可以统计在该设定维度下的每个类别中的所有数据对象上由某一用户群体的用户进行指定行为的次数。每一用户群体的所述第二行为特征包括该用户群体的用户对每一个类别的数据对象进行了指定行为的次数。该特征的表现了该用户群体的倾向性或者说偏好(即意图),量化的该特征本实施例中用用户群体的偏好向量或者说意图向量来表示。
例如:商品搜索中,使用查询词Q1搜索到三个商品(数据对象)D1、D2、D3。用户U1对D1点击数为150次,对D2点击数为50次,对D3点击为10次。用户U2对D1点击数为100次,对D2点击数为150次,对D3点击数为90次。在价格维度上,D1的价格为100元,D2的价格为300元、D3的价格为1000元。在价格维度上,查询词Q1搜索到的商品可以分为低档和高档两个类别。根据用户历史消费记录,可以将用户分为低购买力群体及高购买力群体两个类别。若低购买力群体包括用户U1及U3。高购买力群体包括用户U2,则将该低购买力群体的用户U1、U3对该低档类商品D1、D2的点击数统计起来。比如,用户U3对商品D1的点击数为10次、对商品D2的点击数为0次、对商品D3的点击数为1次。统计低购买力群体中的用户对低档商品D1、D2的点击数总共为150+50+10+0=210次,低购买力群体中的用户对高档商品D3的点击数总共为10+1=11次。
若将高购买力群体的用户U2对低档商品D1、D2的点击数为100+150=250次,对高档商品D3的点击数为90次。则低购买力群体在价格维度下对商品的偏好向量为{210,11},高购买力群体在价格维度下对商品的偏好向量为{250,90}。
其中,用户也具有维度即用户维度,维度可以表示用户的属性(个性化标签),用户的属性值作为用户在其维度上的特征即用户的特征(用户特征)。例如,用户的维度可以包括性别维度、年龄维度、职业维度、所处的地域维度等等,用户的性别维度的特征可以是男性、女性,用户的年龄维度的特征{青年,中年,老年},用户的购买力{低购买力,中购买力,高购买力},等等。
用户具有用户特征,可以预先存储在服务器侧,可以通过对服务器侧的用户进行预先分析,获得用户的特征。比如,如果用户曾经访问过服务器或用户在服务器侧已经预先注册,这些用户的访问记录或注册记录(信息)等,将会在服务器有所保留,在服务器侧,可以通过分析用户的访问记录或注册记录而获得用户的各维度的特征。根据预先存储的用户的特征,可以得到相应的用户行为数据中记录的用户的特征。
从而,根据每个用户的用户特征,能预测或者说确定相应的用户所属的一个或多个用户群体。
在一个实施方式中,可以通过用户的访问、注册信息(记录)、在线填写的信息等来预测用户所偏好的用户群体。比如用户的年龄可以通过用户注册时提供的身份证号码计算得到,或者,通过身份证号码中的生日可以计算出用户的年龄,即获得用户在年龄维度上的特征。从而根据年龄来推算出用户所属的用户群体,如20岁属于{青年}群体;比如用户的性别可以通过身份证号码倒数第二位是奇数,来确定该用户是男性,即性别维度的特征是男性,属于{男性}群体,若身份证号码倒数第二位是偶数,则用户属于{女性}群体,等等。由用户特征,可以确定用户可以属于多个用户群体,如该身份证的信息中隐含的用户特征能确定用户为属于{男性,青年}群体。
在另一个实施方式中,还可以根据用户行为数据的记录中,获取用户在当前查询词的数据对象的同一维度的每个类别下的一种或多种用户行为的数量,以确定该用户所偏好的用户群体。承上例:U1在商品价格维度上的{低档,高档}的点击数{200=(150+50),10},由用户购买力维度与购买商品的价格维度相关,可以确定U1属于{低购买力}群体。进而,对数据对象的多个维度各自的类别下的一种或多种用户行为的数量进行统计,还可以确定该用户所偏好的多个用户群体,即组合起来的用户群体{高购买力,男性,青年}等。
在步骤S140处,计算所述查询词的意图向量与每一用户群体的偏好向量的相似度
由此可以得到查询词的意图与每一用户群体的意图的相似度。具体地,将所获取的当前搜索请求中的查询词Q在一个维度下的意图向量与获取的每个用户群体在该同一维度下的意图向量进行比较运算,确定查询词的意图与每一用户群体的意图的相似度。可以使用Cosine相似度,如公式(1)所示:
ru(query,user)=cos({QV1,QV2,…QVt},{UV1,UV2,…,UVt})(1),
公式(1)的结果的取值范围为0~1。query即当前查询词在数据对象的一个维度下的意图向量{QV1,QV2,…QVt},user即表示统计的用户所属用户群体意图在当前查询词query对应的数据对象的同样的维度下的意图向量{UV1,UV2,…,UVt}。
进一步地设:对当前搜索请求中的查询词Q(query)的数据对象具有用户行为的所有用户组成的用户群体中的所有用户,在数据对象的各个维度Ak下的意图向量为user_all{∑iUV1i,∑iUV2i,…,∑iUVti}。而查询词Q(query)意图与所有用户组成的用户群体中所有用户user_all在各个数据对象的维度Ak={A1,A2,A3,…,An}下的意图的相似度为ra(query,user_all),如公式(2)所示,其中,
ra = r ( query , user _ all ) = cos ( { QV 1 , QV 2 , · · · QV n } , { Σ i UV 1 i , Σ i UV 2 i , · · · , Σ i UV ti } ) - - - ( 2 )
其中,UVti为第i个用户在第t个维度的用户行为次数,可以从用户行为数据中直接获取。进一步地,确定查询词query与user所属用户群体的相关性,如公式(3)所示:
S = ru - ra 1 - ra × c + ru - ra ru × ( 1 - c ) - - - ( 3 )
其中,c为常数表示前述设定的阈值,相关性的值S的取值范围为0~1,如选c=0.5,此时S大于阈值(如0.5)则称query与user相关,换言之,S的取值越趋近于1,就说明query的搜索意图与user的用户群体的意图就越相似。
进一步,基于根据公式(1)-(3)可以对数据对象的n个维度下的查询词的所对应的搜索意图和用户群体的意图的相似度做计算,进而确定查询词与用户偏好的用户群体的相关性。
在步骤S150处,将所述相似度大于设定阈值时对应的用户群体作为当前用户的意图偏好的参照群体。
具体地,如:当计算的相似度所确定的相关性的值S大于等于预设阈值c时,可以确定当前搜索请求中的查询词的意图,换言之,可以确定出查询词属于该确定的数据对象的同一维度的每个类别下的用户所属的用户群体。
承上述步骤S140所计算出的相似度,其中,搜索请求中的查询词Query可以根据与每个维度下用户相关性的值S比较后综合确定出Query的意图,换言之,Query属于哪个用户群体。例如,数据对象的价格维度下,当user为{高购买力}用户群体的意图时,S1的值为0.6,当user为{低购买力}用户群体时,S2的值为0.4;数据对象的性别维度下,当user为{女性}用户群体时,S3的值为0.7;user为{男性}用户群体的意图时,S4的值为0.3。通过以每个同一维度下的相关性的值S与阈值c的比较,即S1和S3都大于预设阈值c,就说明Query与{高购买力}用户群体、{女性}用户群体都相关,而S2和S5均小于阈值c,则与{低购买力}用户群体、{男性}用户群体不相关,可以确定查询词Query与{高购买力,女性}用户群体的组合即两个群体相关。
在一个实施方式中,以商品搜索为例。当前搜索请求中的查询词(Query)“真丝连衣裙”,在商品价格维度上的类别即价格档(商品的价格分为P1、P2、P3、P4、P5五档),每个价格档的点击数为{10,20,30,100,80},即,统计出当前查询词所对应的用户行为的次数。
用户群体(user)对某查询词对应的商品在价格维度上(即,每个价格档价(设商品的价格分为P1、P2、P3、P4、P5五档))的点击数为{20,10,20,50,30}。可以由历史统计的对商品进行过点击的用户的注册信息等记录,来确定用户的意图,即用户所属哪一类或多类用户群体(user),或者根据该用户该点击数量预估用户所属一类或多类的用户群体(user),如:可以根据预先获取的用户点击行为的次数设定用户所属的历史用户群体(user),设用户点击行为高于价格档P4的预设点击数量时,认为该用户的群体为{高购买力}群体user1,同样的,也可以预设低于P2预设价格档点击数量,认为该用户属于{低购买力}群体user2等。
接下来,计算当前查询词(query)“真丝连衣裙”和用户所属的用户群体如{高购买力}群体user1,在商品价格维度上的意图的相似度。相似度计算方法优选为公式(1)
ru=r(query,user1)=cos(query,user1)  (1)
由公式(1)可以得到相似度为:
ru=cos({10,20,30,100,80},{20,10,20,50,30})=0.96
针对当前查询词(query)所对应的商品,所有对商品产生过动作的用户(user_all)在商品价格维度上的用户的点击数为{150,160,130,120,100}(即所有用户的意图)。则该所有用户(user_all)和当前查询词(query)“真丝连衣裙”,在商品价格维度上相似度计算优选为公式(2)
ra=r(query,user_all)=cos(query,user_all)  (2)
得到ra=cos({10,20,30,100,80},{150,160,130,120,100})=0.72。
由此,确定在某一维度的每个类别下,查询词Query的意图与用户群体之间的相关性。以公式(3)计算Query与user1的相关性S1,
S 1 = 0.96 - 0.72 1 - 0.72 × 0.5 + 0 . 96 - 0.72 0.96 × ( 1 - 0.5 )
其中,取阈值常数c=0.5时,相关性的值S1=0.55。由于S1=0.55>c,则该“真丝连衣裙”和{高购买力}用户群体相关,即“真丝连衣裙”(Query)属于{高购买力}用户群体。
类似的,计算当前查询词(Query)“真丝连衣裙”和user2在商品价格维度上的用户行为的意图向量的相似度ru=0.78。此处设user2为{低购买力}用户群体(该群体的意图)。由于计算该所有用户(user_all)的意图向量的相似度ra=0.72,则得到Query和{低购买力}用户群体user2的相关性S2的值为S2=0.22。因S2=0.22<c,则该“真丝连衣裙”和{低购买力}用户群体不相关,即Query不属于{低购买力}用户群体。
由此,针对商品的每一用户群体的意图向量,可以计算与查询词“真丝连衣裙”的意图向量的相似度,并确定与查询词的意图相关的用户群体。
在步骤S160处,根据所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序。
其中,根据参照群体的历史行为特征调整当前用户使用该查询词搜索到的数据对象,可以根据当前搜索请求中的查询词的所对应的搜索意图,从每个用户行为数据中的属于该用户群体的用户的特征、以及用户的一种或多种用户行为所对应的数据对象的特征中,选择一项或多项特征形成的特征组合,进行机器学习(训练个性化模型),确定个性化模型。由该个性化模型,得到数据对象特征针对用户特征的个性化权重。进而根据特征或特征组合的个性化权重,对当前搜索请求中的查询词所搜索到的一个或多个数据对象进行排序,以按照排序展示一个或多个数据对象。
第一,可以在确定当前查询词的意图向量之后,进行个性化模型训练之前,对当前搜索请求中的用户的用户群体进行相应的修正。比如,若该确定的该当前查询词(Query)的意图与当前搜索用户的用户群体的意图存在矛盾,则可以使用(Query)的意图最相近的用户群体来修正当前搜索用户所属的历史偏好群体。由此,后续用来预估数据对象排序的用户群体也均为修正后的用户的偏好群体。
一个实施方式,根据当前搜索用户的历史搜索信息或注册信息,确定当前搜索用户的意图;并且,由前述过程已经确定出当前搜索请求中查询词的搜索意图。由于当前查询词(Query)可以有效反映当前搜索意图,因此用当前查询词(Query)的搜索电图来预测用户偏好比用户所属用户群体预测用户偏好的准确率要更精确。从而,如果当前搜索用户所属用户群体和该用户所输入的查询词所属的用户群体不同,可以利用当前查询词所属用户群来预测当前用户的意图。修正的方式可以有一种或多种,比如,用当前查询词(Query)所属的用户群体取代当前用户所属的用户群体中出现矛盾的群体部分,或者,直接去除用户群体出现矛盾的群体部分,或者,去掉当前搜索用户所属用户群体,直接设与当前查询词(Query)的意图最相近的用户群体为当前用户的用户群体,等等。进而能够在后续更有效的影响数据对象排序展示。
例如:当前Query为“真丝连衣裙”,当前用户为{男性,低购买力,中年}。由于“真丝连衣裙”所对应的用户群体已经被确定为{女性,高购买力},因此,Query和当前用户之间产生矛盾,而Query所反映的是当前用户所需要购买的商品,则此时不能够以当前用户的所属用户群体为训练个性化模型以及最终预测数据对象排序的用户群体。为了提高搜索结果的准确率,可以用与当前Query的搜索意图最接近的用户群体去修正的当前用户群体(即历史用户群体),修正后的用户偏好群体为{女性,高购买力,中年},或者{女性,高购买力},或者{中年},等等。
第二,从用户行为数据中的用户,得到该用户的特征(即用户特征),以及得到用户的一种或多种用户行为所对应的数据对象的特征,并从用户的特征和相应的数据对象的特征中选择一项特征或多项特征形成的特征组合。该用户即确定的当前查询词所属用户群体中的用户。
具体地,可以根据数据对象在一个或多个维度上的特征和用户在一个或多个维度上的特征,形成特征组合。选择的特征也可以是单一特征。在电子商务网站中,所述数据对象为商品信息。所述单一特征可以包括:商品的属性值(如:具体的商品的价格、销量、风格、品牌、类目等属性的值)、用户的属性值(如:用户的性别、年龄、职业、地域、购买力等属性的值)及查询词的属性值(如:查询词涉及的类目、品牌、风格等属性的值)。可以将数据对象的特征和用户的特征进行组合,以得到特征组合。例如:数据对象为足球,足球的特征可以是体育、男性等,用户的特征可以是男性。那么足球的特征和用户特征进行组合,可以得到体育(足球的特征)与男性(用户特征)的组合即(体育+男性),可以得到男性(足球的特征)和男性(用户特征)的组合(男性+男性)。
进一步地,由于预存有数据对象的每个维度及其特征、以及用户的每个维度及其特征,因而,还可以为每一个用户分配唯一的用户ID,为每一个数据对象分配唯一的数据对象ID。预先存储的数据对象的特征与数据对象的数据对象ID对应,预先存储的用户的特征与用户的用户ID对应。并且,用户行为数据中记录的用户以用户ID来代替,记录的数据对象以数据对象ID来代替。将用户行为数据中记录的数据对象ID与预先存储的所有数据对象ID进行匹配,进而获得该数据对象ID对应的数据对象的特征。将用户行为数据中记录的用户ID与预先存储的所有用户的用户ID进行匹配,进而获得该用户ID对应的用户特征。从而,可以获得每个用户行为数据记录的数据对象的维度和用户的维度。在一个实施例中,用户输入的查询词也可以具有特征,查询词特征可以用于表示查询词的属性值。例如:查询词为足球,那么足球的维度可以是体育,足球的特征可以是男性等。
进一步地,可以将数据对象的特征、用户的特征、查询词的特征进行组合,组合的形式可以包括将数据对象的特征与用户的特征进行组合,将用户的特征与查询词的特征进行组合,将数据对象的特征与查询词的特征进行组合,以及将数据对象的特征、用户特征与查询词的特征三者进行组合。进而得到组合特征。
第三,利用上述特征或特征组合对应的用户行为数据作为样本,进行机器学习,即训练个性化模型,以便确定个性化模型,得到数据对象特征针对用户特征的个性化权重。
个性化权重,可以用于反映每个特征或特征组合在提高用户对数据对象实现某用户行为的重要性。如模型训练时,为实现某目标行为(如发生成交行为)过程中,考察每种特征或特征组合使得用户对数据对象能产生该目标行为的比例,如发生成交行为的比例等。个性化权重体现了最终训练确定的个性化模型。根据用户当前查询词可以搜索出一个或多个数据对象,通过该个性化模型可以预估/预测出每一个数据对象的个性化分数即对搜索出的数据对象进行个性化分数计算,并根据分数对数据对象进行个性化排序,实现个性化排序,即将用户关注度最高的数据对象排列在搜索结果的队首,将用户不关注的数据对象排列在搜索结果的队尾。其中,该个性化分数可以表示用户对该数据对象的期望值。数据对象的期望值越高,表示用户对该数据对象的关注度越高,数据对象的期望值越低,表示用户对该数据对象的关注度越低。
比如,以日志文件中的用户行为数据的一种用户行为为目标,以用户行为数据中的属于当前查询词的用户群体的用户的特征和数据对象的特征(或者特征组合)为训练集中的特征,进行个性化模型训练。训练集中的用户行为数据(即样本)所记录的数据对象的个性化分数已知(即可以预先标注),基于训练集中的特征对预想的个性化模型(如逻辑回归模型等)进行训练,调整该模型中的参数,若通过该模型计算出的个性化分数与已知的个性化分数相匹配(如相等或误差在预设范围内),则该能够能够得出正确的个性化分数的模型即为训练得到的个性化模型。
下面将以特征组合作为一种优选的方式,来说明个性化模型训练过程。
其中个性化模型中的包括个性化权重wg这一参数。例如:在日志文件中,包含的4条用户行为数据作为训练集中的样本。其中,分别包括根据用户U1输入的查询词Q3搜索出的商品A1、商品A2、商品A3、商品A4。获取用户U1预存的用户特征,以及获取根据查询词Q3搜索出的商品A1、商品A2、商品A3、商品A4预存的特征。如表2所示。用户U1的用户特征为(男、高购买力),表示该用户U1为男性用户、购买高档商品,根据查询词Q3搜索出的数据对象即商品A1、商品A2、商品A3、商品A4中,商品A1的数据对象特征为(男性用品、高档商品);商品A2的数据对象特征为(女性用品、高档商品);商品A3的数据对象特征为(女性用品、低档商品);商品A4的数据对象特征为(男性用品、低档商品)。将用户的特征与数据对象的特征进行组合,得到特征组合。由此,训练个性化模型,获得数据对象的特征针对用户特征的个性化权重wg,如:利用逻辑回归算法、决策树训练个性化模型,以获得个性化权重wg。得到男+男组合=1,男+女组合=-1,高购买力+高档(高+高)=0.5,高+低=-0.5,进一步得到个性化权重wg:男+男、高+高=1+0.5=1.5;男+女、高+高=-1+0.5=-0.5;男+女、高+低=-1-0.5=1.5;男+男、低+低=1-0.5=0.5。
将最终获得的每个数据对象的特征针对每个用户特征的个性化权重(如表2所示)进行存储,以在数据搜索中,排序搜索出的数据对象时使用。
表2:
进一步而言,当服务器接收到包含有查询词的用户的搜索请求时,服务器可以在海量数据对象中搜索出与该查询词相匹配的多个数据对象。根据预先训练个性化模型得到的特征组合的个性化权重,可以对该多个数据对象进行个性化排序,以体现出用户与用户之间对数据对象不同的需求。进一步地,可以基于预先训练个性化模型得到的特征组合的个性化权重对用户所输入的查询词可以搜索出一个或多个数据对象,预估/预测数据对象的个性化分数。进而根据所预估/预测出每一个数据对象的个性化分数进行排序。
其中,该个性化分数可以表示用户对该数据对象的期望值。数据对象的期望值越高,表示用户对该数据对象的关注度越高,数据对象的期望值越低,表示用户对该数据对象的关注度越低。
针对当前搜索请求中的查询词搜索到的一个或多个数据对象进行排序展示,请参照下面图3中详细描述。
参照图3所示,如图3所示,对当前搜索请求中的查询词搜索到的一个或多个数据对象进行排序展示的流程图。
在步骤S310处,根据预先存储的用户特征和数据对象的特征,从每个用户行为数据中提取已经确定的当前搜索请求中的查询词的意图下的用户的用户特征、以及相应的数据对象的特征。
当用户发送查询词的时,其携带用户数据,该用户数据可以包括:用户ID。由此,服务器侧可以根据分析出的用户ID在预先存储的、对应用户ID的用户特征中,查询出用户的用户特征。服务器侧可以根据与该查询词的数据对象的数据对象ID在预先存储的、对应数据对象ID的数据对象特征中,查询出数据对象的特征。
其中,如果出现当前用户的历史的用户属群体与当前用户的意图偏好的参照群体不同,尤其是存在矛盾的情形,可以用当前用户的意图偏好的参照群体修正当前用户的历史所属群体,并提取修正后的用户群体对应的用户的在相应维度上的用户的特征,如:当前用户的性别维度的特征为“男性”即属于{男性}群体,但输入查询词“真丝连衣裙”,即搜索的是属于{女性}群体的商品,则可以修正当前用户的群体为{女性}群体,并提取该{女性}群体中的用户(新的当前用户)的性别维度的特征,如“女性”。群体修正具体方式参见前述步骤S150的描述,修正后的意图偏好的参照群体成为了当前用户群体。若当前用户的意图偏好的参照群体与当前用户的历史所属群体相同,则无需修正。提取“当前用户历史所属群体”的用户在相应维度上的用户特征。进一步,在修正后的当前用户群体下或者无需修正的当前用户群体下,提取与当前查询词相匹配的一个或多个数据对象的数据对象ID,从预存的、对应该ID的数据对象的特征中,获取与当前用户群体的维度相匹配的数据对象的维度上的数据对象的特征。
在步骤S320处,利用查询出的属于当前搜索请求中的查询词的意图的用户群体下的用户的用户特征和相应的、与查询词匹配的每个数据对象的特征,与预先训练的个性化模型中数据对象的特征针对用户特征的个性化权重wg进行匹配,以得到相匹配的数据对象的特征针对用户的用户特征的个性化权重wg。即查询与用户的特征和搜索出的数据对象的特征相对应的特征组合的个性化权重。
具体而言,将查询出的用户特征,与查询出的每个相匹配的数据对象的特征进行组合,以得到查询特征组合。在已经存储的数据对象的特征针对用户的特征的个性化权重wg(存储项,如表2)中,匹配出与查询特征组合具有相同特征组合形式的存储项,即存储项中的数据对象的特征和用户特征,和查询出的用户特征和相匹配的数据对象的特征相同。将该存储项的个性化权重作为相匹配的数据对象的特征针对用户特征的个性化权重wg。例:当前用户为男性、高购买力,则得到其输入当前Q3的商品中的A1~A4的特征组合及相应的个性化权重wg为表2所示。
在步骤S330处,根据得到的个性化权重wg预测搜索出的每个数据对象的个性化分数(个性化排序分),以根据所述个性化分数,对一个或多个数据对象(即搜索结果)进行排序。
其中,根据相匹配的数据对象的特征针对用户的用户特征的个性化权重,以及用户的用户特征和相匹配的数据对象的特征,计算相匹配的数据对象的个性化分数S’。数据对象的个性化分数可以用于表示用户对该数据对象的期望值,即,在搜索出的多个数据对象中,用户对该数据对象的偏爱程度。
具体地,计算每个相匹配的数据对象的个性化分数(S),可以通过公式(3)来实现。
s &prime; = 1 1 + e - ( fg 1 * wg 1 + fg 2 * wg 2 + &CenterDot; &CenterDot; &CenterDot; + fgm * wgm ) - - - ( 3 )
其中,fg(fg1、fg2、……、fgm)用于表示在用户行为数据中相同的数据对象的特征与用户特征的组合(特征组合)的数量;wg(wg1、wg2、……、wgm)用于表示数据对象的特征针对用户特征的个性化权重。
该公式(3)可以作为个性化模型,个性化权重可以作为个性化模型中的参数。
根据个性化模型预测每个数据对象的个性化分数,以表2为例,
根据用户U1输入的查询词Q3,搜索出4个数据对象,商品A1、商品A2、商品A3、商品A4。序号5中的“男+男性用品”、“高档+高档”的组合的数量为1,个性化权重为1.5。序号6中“男+女性用品”、“高档+高档”的组合的数量为1,个性化权重为-0.5。序号7中“男+女性用品”、“高档+低档”组合的数量为1,个性化权重为-1.5。序号8中的“男+男性用品”、“高档+低档”组合的数量为1,个性化权重为0.5。
根据公式(4)可以分别得到商品A1、商品A2、商品A3、商品A4的个性化分数。
商品A1的个性化分数: S &prime; 5 = 1 1 + e - ( 1 * 1.5 ) = 0.82
商品A2的个性化分数: S &prime; 6 = 1 1 + e - ( 1 * ( - 0.5 ) ) = 0.38
商品A3的个性化分数: S &prime; 7 = 1 1 + e - ( 1 * ( - 1.5 ) ) = 0.18
商品A4的个性化分数: S &prime; 8 = 1 1 + e - ( 1 * 0.5 ) = 0.62
在一个实施例中,对于每个数据对象的个性化分数可以进行平滑处理,该平滑处理,可以表示为将每个数据对象的个性化分数控制在限定的范围之内。例如,将数据对象的个性化分数限定在0.5至0.8之间,则商品A4的个性化分数(0.62)处于限定的范围之内,符合要求。而商品A1、A2和商品A3的个性化分数分别为0.82、0.38、0.18处于限定的范围之外,则可以将该个性化分数0.82平滑为限定范围的之内,可以将该个性化分数0.82进行变更,变更为接近于该个性化分数0.82并且处于限定范围内的个性化分数0.8。
基于上述所获得的每个相匹配的数据对象的个性化分数,对多个相匹配的数据对象进行排序。例如:商品A1、商品A2、商品A3、商品A4的个性化分数为商品A1:0.82、商品A2:0.38、商品A3:0.18、商品A4:0.62。按照分数从高到低排序:商品A1、商品A4、商品A2、商品A3,并向用户展示搜索到的多个数据对象即商品A1、A4、A2、A3。
本申请还提供了一种个性化数据搜索装置。如图4所示,图4是根据本申请一实施例的个性化数据搜索装置400的结构图。
在该装置400中,包括:搜索模块410,第一获取模块420,第二获取模块430,计算模块440,确定模块450,排序模块460。
搜索模块410,可以用于根据当前用户的搜索请求中的查询词搜索数据对象。
第一获取模块420,可以用于依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量。
其中,第一获取模块420,还可以包括划分子模块,用于根据数据对象在某一设定维度上的特征,将搜索到的数据对象划分为一个或多个类别;
第一行为特征提取子模块(未在图中示出),可以用于依据历史行为日志,分别确定历史用户基于所述查询词搜索到所述数据对象并对每一个类别下的所述数据对象上发生了指定行为的次数,以所述指定行为的次数作为所述第一行为特征;第一生成子模块(未在图中示出),可以用于根据所述第一行为特征生成所述查询词的意图向量。
第二获取模块430,可以用于根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述第二行为特征生成所述用户群体的偏好向量。
其中,第二获取模块430,还可以包括:第一统计子模块(未在图中示出),可以用于根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体在每一个所述类别的数据对象上发生的指定行为的次数;第二统计子模块(未在图中示出),可以用于依据每个数据对象在设定维度下所属于类别,统计在该设定维度下的每个类别中的所有数据对象上由某一用户群体的用户进行指定行为的次数;以该用户群体的用户对每一个类别的数据对象进行了指定行为的次数为所述第二行为特征;第二生成子模块(未在图中示出),可以用于根据所述第二行为特征生成所述用户群体的偏好向量。
计算模块440,可以用于计算查询词的意图向量与每一用户群体的偏好向量的相似度。
其中,计算模块440,还可以包括获取子模块(未在图中示出),可以用于将计算得到的所述相似度,进行相关性计算以获得相关性的值;判断子模块(未在图中示出),可以用于将相关性的值与预先设置的阈值进行比较,当所述相关性的值大于等于所述阈值时,确定当前搜索请求中的查询词所属的用户群体对应进行相似度计算的用户群体。
确定模块450,可以用于将相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体。
排序模块460,可以用于利用所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序。
其中,排序模块460,还可以包括:训练子模块(未在图中示出),可以用于根据确定当前用户的意图偏好的参照群体,从该参照群体中获取用户的特征、以及用户的一种或多种用户行为所对应的数据对象的特征中,选择一项或多项特征形成的特征组合,训练个性化模型(未在图中示出),可以用于确定数据对象的特征针对用户特征的个性化权重;查询排序子模块(未在图中示出),可以用于根据所述个性化权重,对当前搜索请求中的查询词所搜索到的一个或多个数据对象进行排序。
进一步地,查询排序子模块(未在图中示出),还可以用于根据预先存储的用户特征和数据对象的特征,从每个用户行为数据中提取所述当前用户的意图偏好的参照群体的用户的用户特征、以及相应的数据对象的特征;利用所述当前用户的意图偏好的参照群体的用户的用户特征和相应的、与所述查询词匹配的每个数据对象的特征,与所述确定的数据对象的特征针对用户特征的个性化权重进行匹配,得到相匹配的数据对象的特征针对用户特征的个性化权重;根据相匹配的所述个性化权重,预测搜索到的一个或多个数据对象的个性化分数,以根据所述个性化分数,对一个或多个数据对象进行排序。
进一步地,查询排序子模块(未在图中示出)还可以包括:如果当前搜索请求中的用户所属的历史用户群体与所述当前用户的意图偏好的参照群体存在矛盾,由当前用户的意图偏好的参照群体修正所述当前搜索请求中的用户所属的历史用户群体,并将修正后的用户的意图偏好的参照群体作为当前用户群体;从每个用户行为数据中提取所述当前用户群体的用户特征,以及提取搜索到的一个或多个数据对象相应于当前用户群体的数据对象的特征。
由于图4所描述的本申请的装置所包括的各个模块的具体实施方式与本申请的方法中的步骤的具体实施方式是相对应的,由于已经对图1-图3进行了详细的描述,所以为了不模糊本申请,在此不再对各个模块的具体细节进行描述。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (14)

1.一种个性化数据搜索方法,其特征在于,包括:
根据当前用户的搜索请求中的查询词搜索数据对象;
依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量;
根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述第二行为特征生成所述用户群体的偏好向量;
计算所述查询词的意图向量与每一用户群体的偏好向量的相似度;
将所述相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体;
利用所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序。
2.根据权利要求1所述的方法,其特征在于,依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量的步骤,进一步包括:
根据数据对象在某一设定维度上的特征,将搜索到的数据对象划分为一个或多个类别;
依据历史行为日志,分别确定历史用户基于所述查询词搜索到所述数据对象并对每一个类别下的所述数据对象上发生了指定行为的次数,以所述指定行为的次数作为所述第一行为特征;
根据所述第一行为特征生成所述查询词的意图向量。
3.根据权利要求1或2所述的方法,其特征在于,根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述第二行为特征生成所述用户群体的偏好向量的步骤,包括:
根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体在每一个所述类别的数据对象上发生的指定行为的次数;
依据每个数据对象在设定维度下所属于类别,统计在该设定维度下的每个类别中的所有数据对象上由某一用户群体的用户进行指定行为的次数;以该用户群体的用户对每一个类别的数据对象进行了指定行为的次数为所述第二行为特征;
根据所述第二行为特征生成所述用户群体的偏好向量。
4.根据权利要求1-3之一所述的方法,其特征在于,将所述相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体的步骤,包括:
将计算得到的所述相似度,进行相关性计算以获得相关性的值;
将相关性的值与预先设置的阈值进行比较,当所述相关性的值大于等于所述阈值时,确定当前搜索请求中的查询词所属的用户群体对应进行相似度计算的用户群体。
5.根据权利要求1-4之一所述的方法,其特征在于,利用所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序的步骤,包括:
根据确定当前用户的意图偏好的参照群体,从该参照群体中获取用户的特征、以及用户的一种或多种用户行为所对应的数据对象的特征中,选择一项或多项特征形成的特征组合,训练个性化模型,确定数据对象的特征针对用户特征的个性化权重;
根据所述个性化权重,对当前搜索请求中的查询词所搜索到的一个或多个数据对象进行排序。
6.根据权利要求5所述的方法,其特征在于,根据所述个性化权重,对当前搜索请求中的查询词所搜索到的一个或多个数据对象进行排序,包括:
根据预先存储的用户特征和数据对象的特征,从每个用户行为数据中提取所述当前用户的意图偏好的参照群体的用户的用户特征、以及相应的数据对象的特征;
利用所述当前用户的意图偏好的参照群体的用户的用户特征和相应的、与所述查询词匹配的每个数据对象的特征,与所述确定的数据对象的特征针对用户特征的个性化权重进行匹配,得到相匹配的数据对象的特征针对用户特征的个性化权重;
根据相匹配的所述个性化权重,预测搜索到的一个或多个数据对象的个性化分数,以根据所述个性化分数,对一个或多个数据对象进行排序。
7.根据权利要求6所述的方法,其特征在于,根据预先存储的用户特征和数据对象的特征,从每个用户行为数据中提取所述当前用户的意图偏好的参照群体的用户的用户特征、以及相应的数据对象的特征,包括:
如果当前搜索请求中的用户所属的历史用户群体与所述当前用户的意图偏好的参照群体存在矛盾,由当前用户的意图偏好的参照群体修正所述当前搜索请求中的用户所属的历史用户群体,并将修正后的用户的意图偏好的参照群体作为当前用户群体;
从每个用户行为数据中提取所述当前用户群体的用户特征,以及提取搜索到的一个或多个数据对象相应于当前用户群体的数据对象的特征。
8.一种个性化数据搜索装置,其特征在于,包括:
搜索模块,用于根据当前用户的搜索请求中的查询词搜索数据对象;
第一获取模块,用于依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量;
第二获取模块,用于根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述第二行为特征生成所述用户群体的偏好向量;
计算模块,用于计算所述查询词的意图向量与每一用户群体的偏好向量的相似度;
确定模块,用于将所述相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体;
排序模块,用于利用所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序。
9.根据权利要求8所述的装置,其特征在于,所述第一获取模块,还包括:
划分子模块,用于根据数据对象在某一设定维度上的特征,将搜索到的数据对象划分为一个或多个类别;
第一行为特征提取子模块,用于依据历史行为日志,分别确定历史用户基于所述查询词搜索到所述数据对象并对每一个类别下的所述数据对象上发生了指定行为的次数,以所述指定行为的次数作为所述第一行为特征;
第一生成子模块,用于根据所述第一行为特征生成所述查询词的意图向量。
10.根据权利要求8或9所述的装置,其特征在于,所述第二获取模块,还包括:
第一统计子模块,用于根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体在每一个所述类别的数据对象上发生的指定行为的次数;
第二统计子模块,用于依据每个数据对象在设定维度下所属于类别,统计在该设定维度下的每个类别中的所有数据对象上由某一用户群体的用户进行指定行为的次数;以该用户群体的用户对每一个类别的数据对象进行了指定行为的次数为所述第二行为特征;
第二生成子模块,用于根据所述第二行为特征生成所述用户群体的偏好向量。
11.根据权利要求8-10之一所述的装置,其特征在于,所述计算模块,还包括:
获取子模块,用于将计算得到的所述相似度,进行相关性计算以获得相关性的值;
判断子模块,用于将相关性的值与预先设置的阈值进行比较,当所述相关性的值大于等于所述阈值时,确定当前搜索请求中的查询词所属的用户群体对应进行相似度计算的用户群体。
12.根据权利要求8-11之一所述的装置,其特征在于,所述排序模块,还包括:
训练子模块,用于根据确定当前用户的意图偏好的参照群体,从该参照群体中获取用户的特征、以及用户的一种或多种用户行为所对应的数据对象的特征中,选择一项或多项特征形成的特征组合,训练个性化模型,确定数据对象的特征针对用户特征的个性化权重;
查询排序子模块,用于根据所述个性化权重,对当前搜索请求中的查询词所搜索到的一个或多个数据对象进行排序。
13.根据权利要求12所述的装置,其特征在于,所述查询排序子模块,还用于根据预先存储的用户特征和数据对象的特征,从每个用户行为数据中提取所述当前用户的意图偏好的参照群体的用户的用户特征、以及相应的数据对象的特征;利用所述当前用户的意图偏好的参照群体的用户的用户特征和相应的、与所述查询词匹配的每个数据对象的特征,与所述确定的数据对象的特征针对用户特征的个性化权重进行匹配,得到相匹配的数据对象的特征针对用户特征的个性化权重;根据相匹配的所述个性化权重,预测搜索到的一个或多个数据对象的个性化分数,以根据所述个性化分数,对一个或多个数据对象进行排序。
14.根据权利要求13所述的装置,其特征在于,所述查询排序子模块还包括:
如果当前搜索请求中的用户所属的历史用户群体与所述当前用户的意图偏好的参照群体存在矛盾,由当前用户的意图偏好的参照群体修正所述当前搜索请求中的用户所属的历史用户群体,并将修正后的用户的意图偏好的参照群体作为当前用户群体;
从每个用户行为数据中提取所述当前用户群体的用户特征,以及提取搜索到的一个或多个数据对象相应于当前用户群体的数据对象的特征。
CN201410058488.3A 2014-02-20 2014-02-20 个性化数据搜索方法及装置 Active CN104866474B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410058488.3A CN104866474B (zh) 2014-02-20 2014-02-20 个性化数据搜索方法及装置
HK15111747.6A HK1211096A1 (zh) 2014-02-20 2015-11-30 個性化數據搜索方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410058488.3A CN104866474B (zh) 2014-02-20 2014-02-20 个性化数据搜索方法及装置

Publications (2)

Publication Number Publication Date
CN104866474A true CN104866474A (zh) 2015-08-26
CN104866474B CN104866474B (zh) 2018-10-09

Family

ID=53912313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410058488.3A Active CN104866474B (zh) 2014-02-20 2014-02-20 个性化数据搜索方法及装置

Country Status (2)

Country Link
CN (1) CN104866474B (zh)
HK (1) HK1211096A1 (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016122A1 (zh) * 2015-07-29 2017-02-02 百度在线网络技术(北京)有限公司 一种信息推送方法及装置
CN106776981A (zh) * 2016-12-06 2017-05-31 广州市科恩电脑有限公司 一种基于经验知识的智能检索方法
WO2017101083A1 (zh) * 2015-12-17 2017-06-22 华为技术有限公司 比较数据的设备和方法
CN107169837A (zh) * 2017-05-19 2017-09-15 北京京东尚科信息技术有限公司 用于辅助搜索的方法、装置、电子设备及计算机可读介质
CN107169571A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 一种特征筛选方法及装置
CN107492008A (zh) * 2017-08-09 2017-12-19 阿里巴巴集团控股有限公司 信息推荐方法、装置、服务器及计算机存储介质
CN107644036A (zh) * 2016-07-21 2018-01-30 阿里巴巴集团控股有限公司 一种数据对象推送的方法、装置及系统
CN107862027A (zh) * 2017-10-31 2018-03-30 北京小度信息科技有限公司 检索意图识别方法、装置、电子设备及可读存储介质
CN108108380A (zh) * 2016-11-25 2018-06-01 阿里巴巴集团控股有限公司 搜索排序方法、搜索排序装置、搜索方法和搜索装置
CN108280200A (zh) * 2018-01-29 2018-07-13 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN108334575A (zh) * 2018-01-23 2018-07-27 北京三快在线科技有限公司 一种推荐结果排序修正方法及装置,电子设备
CN108664483A (zh) * 2017-03-28 2018-10-16 北大方正集团有限公司 特定用户群体的管理方法及管理系统
CN108701140A (zh) * 2015-12-31 2018-10-23 电子湾有限公司 从图像生成结构化查询
CN108701014A (zh) * 2016-03-09 2018-10-23 电子湾有限公司 用于尾部查询的查询数据库
CN108733685A (zh) * 2017-04-17 2018-11-02 阿里巴巴集团控股有限公司 对象交互、浏览、搜索和配置方法及装置
TWI645350B (zh) * 2017-11-24 2018-12-21 財團法人工業技術研究院 決策因素分析裝置與決策因素分析方法
CN109685537A (zh) * 2017-10-18 2019-04-26 北京京东尚科信息技术有限公司 用户行为的分析方法、装置、介质和电子设备
CN110069717A (zh) * 2017-07-19 2019-07-30 阿里巴巴集团控股有限公司 一种搜索方法及装置
CN110377830A (zh) * 2019-07-25 2019-10-25 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110457343A (zh) * 2018-05-04 2019-11-15 拉萨经济技术开发区凯航科技开发有限公司 一种个性化优化方法
CN110851727A (zh) * 2019-11-19 2020-02-28 青岛聚看云科技有限公司 搜索结果的排序方法及服务器
CN111310008A (zh) * 2020-03-20 2020-06-19 北京三快在线科技有限公司 搜索意图识别方法、装置、电子设备和存储介质
CN112396484A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 商品的验证方法及装置、存储介质和处理器
CN112559856A (zh) * 2020-12-04 2021-03-26 中国联合网络通信集团有限公司 应用排序方法和装置
CN112700296A (zh) * 2019-10-23 2021-04-23 阿里巴巴集团控股有限公司 业务对象搜索/属性确定方法、装置、系统及设备
CN112966177A (zh) * 2021-03-05 2021-06-15 北京百度网讯科技有限公司 咨询意图的识别方法、装置、设备以及存储介质
CN113779354A (zh) * 2015-10-01 2021-12-10 电子湾有限公司 用于生成目标页面的系统和方法
US11593855B2 (en) 2015-12-30 2023-02-28 Ebay Inc. System and method for computing features that apply to infrequent queries
US11640408B2 (en) 2013-09-20 2023-05-02 Ebay Inc. Search guidance
CN116823409A (zh) * 2023-08-29 2023-09-29 南京大数据集团有限公司 一种基于目标搜索数据的智能筛选方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006007575A2 (en) * 2004-07-01 2006-01-19 Aol Llc Analyzing a query log for use in managing category-specific electronic content
US20090150362A1 (en) * 2006-08-02 2009-06-11 Epas Double Blinded Privacy-Safe Distributed Data Mining Protocol
CN101661487A (zh) * 2008-08-27 2010-03-03 国际商业机器公司 对信息项进行搜索的方法和系统
CN101685458A (zh) * 2008-09-27 2010-03-31 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN102065145A (zh) * 2010-12-31 2011-05-18 华为技术有限公司 一种信息投放方法、装置和系统
CN102143224A (zh) * 2011-01-25 2011-08-03 张金海 基于手机上网用户行为的分析方法和装置
CN102346899A (zh) * 2011-10-08 2012-02-08 亿赞普(北京)科技有限公司 一种基于用户行为的广告点击率预测方法和装置
CN102591966A (zh) * 2011-12-31 2012-07-18 华中科技大学 一种移动场景下的搜索结果过滤方法
US20130006952A1 (en) * 2011-06-29 2013-01-03 Microsoft Corporation Organizing search history into collections
CN102956009A (zh) * 2011-08-16 2013-03-06 阿里巴巴集团控股有限公司 一种基于用户行为的电子商务信息推荐方法与装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006007575A2 (en) * 2004-07-01 2006-01-19 Aol Llc Analyzing a query log for use in managing category-specific electronic content
US20090150362A1 (en) * 2006-08-02 2009-06-11 Epas Double Blinded Privacy-Safe Distributed Data Mining Protocol
CN101661487A (zh) * 2008-08-27 2010-03-03 国际商业机器公司 对信息项进行搜索的方法和系统
CN101685458A (zh) * 2008-09-27 2010-03-31 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN102065145A (zh) * 2010-12-31 2011-05-18 华为技术有限公司 一种信息投放方法、装置和系统
CN102143224A (zh) * 2011-01-25 2011-08-03 张金海 基于手机上网用户行为的分析方法和装置
US20130006952A1 (en) * 2011-06-29 2013-01-03 Microsoft Corporation Organizing search history into collections
CN102956009A (zh) * 2011-08-16 2013-03-06 阿里巴巴集团控股有限公司 一种基于用户行为的电子商务信息推荐方法与装置
CN102346899A (zh) * 2011-10-08 2012-02-08 亿赞普(北京)科技有限公司 一种基于用户行为的广告点击率预测方法和装置
CN102591966A (zh) * 2011-12-31 2012-07-18 华中科技大学 一种移动场景下的搜索结果过滤方法

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11640408B2 (en) 2013-09-20 2023-05-02 Ebay Inc. Search guidance
WO2017016122A1 (zh) * 2015-07-29 2017-02-02 百度在线网络技术(北京)有限公司 一种信息推送方法及装置
CN113779354A (zh) * 2015-10-01 2021-12-10 电子湾有限公司 用于生成目标页面的系统和方法
WO2017101083A1 (zh) * 2015-12-17 2017-06-22 华为技术有限公司 比较数据的设备和方法
US11593855B2 (en) 2015-12-30 2023-02-28 Ebay Inc. System and method for computing features that apply to infrequent queries
CN108701140A (zh) * 2015-12-31 2018-10-23 电子湾有限公司 从图像生成结构化查询
US11222064B2 (en) 2015-12-31 2022-01-11 Ebay Inc. Generating structured queries from images
CN107169571A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 一种特征筛选方法及装置
CN108701014A (zh) * 2016-03-09 2018-10-23 电子湾有限公司 用于尾部查询的查询数据库
CN107644036A (zh) * 2016-07-21 2018-01-30 阿里巴巴集团控股有限公司 一种数据对象推送的方法、装置及系统
CN108108380A (zh) * 2016-11-25 2018-06-01 阿里巴巴集团控股有限公司 搜索排序方法、搜索排序装置、搜索方法和搜索装置
CN106776981A (zh) * 2016-12-06 2017-05-31 广州市科恩电脑有限公司 一种基于经验知识的智能检索方法
CN106776981B (zh) * 2016-12-06 2020-12-15 广州同构科技有限公司 一种基于经验知识的智能检索方法
CN108664483A (zh) * 2017-03-28 2018-10-16 北大方正集团有限公司 特定用户群体的管理方法及管理系统
CN108733685A (zh) * 2017-04-17 2018-11-02 阿里巴巴集团控股有限公司 对象交互、浏览、搜索和配置方法及装置
CN108733685B (zh) * 2017-04-17 2023-12-26 阿里巴巴集团控股有限公司 对象交互、浏览、搜索和配置方法及装置
CN107169837A (zh) * 2017-05-19 2017-09-15 北京京东尚科信息技术有限公司 用于辅助搜索的方法、装置、电子设备及计算机可读介质
CN107169837B (zh) * 2017-05-19 2021-10-01 北京京东尚科信息技术有限公司 用于辅助搜索的方法、装置、电子设备及计算机可读介质
CN110069717B (zh) * 2017-07-19 2023-11-10 阿里巴巴集团控股有限公司 一种搜索方法及装置
CN110069717A (zh) * 2017-07-19 2019-07-30 阿里巴巴集团控股有限公司 一种搜索方法及装置
CN107492008A (zh) * 2017-08-09 2017-12-19 阿里巴巴集团控股有限公司 信息推荐方法、装置、服务器及计算机存储介质
CN109685537A (zh) * 2017-10-18 2019-04-26 北京京东尚科信息技术有限公司 用户行为的分析方法、装置、介质和电子设备
CN109685537B (zh) * 2017-10-18 2021-02-26 北京京东尚科信息技术有限公司 用户行为的分析方法、装置、介质和电子设备
CN107862027B (zh) * 2017-10-31 2019-03-12 北京小度信息科技有限公司 检索意图识别方法、装置、电子设备及可读存储介质
CN107862027A (zh) * 2017-10-31 2018-03-30 北京小度信息科技有限公司 检索意图识别方法、装置、电子设备及可读存储介质
US10572929B2 (en) 2017-11-24 2020-02-25 Industrial Technology Research Institute Decision factors analyzing device and decision factors analyzing method
TWI645350B (zh) * 2017-11-24 2018-12-21 財團法人工業技術研究院 決策因素分析裝置與決策因素分析方法
CN109840796A (zh) * 2017-11-24 2019-06-04 财团法人工业技术研究院 决策因素分析装置与决策因素分析方法
CN109840796B (zh) * 2017-11-24 2021-08-24 财团法人工业技术研究院 决策因素分析装置与决策因素分析方法
CN108334575A (zh) * 2018-01-23 2018-07-27 北京三快在线科技有限公司 一种推荐结果排序修正方法及装置,电子设备
CN108280200B (zh) * 2018-01-29 2021-11-09 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN108280200A (zh) * 2018-01-29 2018-07-13 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN110457343A (zh) * 2018-05-04 2019-11-15 拉萨经济技术开发区凯航科技开发有限公司 一种个性化优化方法
CN110377830B (zh) * 2019-07-25 2022-03-29 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110377830A (zh) * 2019-07-25 2019-10-25 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN112396484A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 商品的验证方法及装置、存储介质和处理器
CN112700296B (zh) * 2019-10-23 2022-05-27 阿里巴巴集团控股有限公司 业务对象搜索/属性确定方法、装置、系统及设备
CN112700296A (zh) * 2019-10-23 2021-04-23 阿里巴巴集团控股有限公司 业务对象搜索/属性确定方法、装置、系统及设备
CN110851727A (zh) * 2019-11-19 2020-02-28 青岛聚看云科技有限公司 搜索结果的排序方法及服务器
CN111310008A (zh) * 2020-03-20 2020-06-19 北京三快在线科技有限公司 搜索意图识别方法、装置、电子设备和存储介质
CN112559856B (zh) * 2020-12-04 2023-06-02 中国联合网络通信集团有限公司 应用排序方法和装置
CN112559856A (zh) * 2020-12-04 2021-03-26 中国联合网络通信集团有限公司 应用排序方法和装置
CN112966177B (zh) * 2021-03-05 2022-07-26 北京百度网讯科技有限公司 咨询意图的识别方法、装置、设备以及存储介质
CN112966177A (zh) * 2021-03-05 2021-06-15 北京百度网讯科技有限公司 咨询意图的识别方法、装置、设备以及存储介质
CN116823409A (zh) * 2023-08-29 2023-09-29 南京大数据集团有限公司 一种基于目标搜索数据的智能筛选方法及系统
CN116823409B (zh) * 2023-08-29 2023-12-01 南京大数据集团有限公司 一种基于目标搜索数据的智能筛选方法及系统

Also Published As

Publication number Publication date
HK1211096A1 (zh) 2016-05-13
CN104866474B (zh) 2018-10-09

Similar Documents

Publication Publication Date Title
CN104866474A (zh) 个性化数据搜索方法及装置
Sivapalan et al. Recommender systems in e-commerce
CN104679771A (zh) 一种个性化数据搜索方法和装置
US8756095B2 (en) E-commerce consumer-based behavioral target marketing reports
Yoseph et al. The impact of big data market segmentation using data mining and clustering techniques
US20170017900A1 (en) System and method for feature generation over arbitrary objects
CN106844787A (zh) 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
CN105469263A (zh) 一种商品推荐方法及装置
CN104679743A (zh) 一种确定用户的偏好模式的方法及装置
CN102236663A (zh) 一种基于垂直搜索的查询方法、系统和装置
CN108108380A (zh) 搜索排序方法、搜索排序装置、搜索方法和搜索装置
CN105183733A (zh) 一种文本信息的匹配、业务对象的推送方法和装置
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
CN108073667B (zh) 产生用户浏览属性的方法、以及非暂存计算机可读介质
CN111737418B (zh) 搜索词和商品的相关性预测方法、设备和存储介质
CN113837842A (zh) 一种基于用户行为数据的商品推荐方法及设备
Lin et al. A consumer review-driven recommender service for web e-commerce
Zhang et al. Discovering consumers’ purchase intentions based on mobile search behaviors
Pirani et al. Analysis and optimization of online sales of products
Zaware Identification Cold Start Problem Start in Matrix Factorization Method for Online Web Recommendation Systems
Mohammadnezhad et al. An effective model for improving the quality of recommender systems in mobile e-tourism
CN110490682A (zh) 分析商品属性的方法和装置
CN114861079A (zh) 一种融合商品特征的协同过滤推荐方法和系统
CN111651456B (zh) 潜在用户确定方法、业务推送方法及装置
Johannes et al. Sales Prediction Model Using Classification Decision Tree Approach For Small Medium Enterprise Based on Indonesian E-Commerce Data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1211096

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant