CN107092616B - 一种对象排序方法及装置 - Google Patents
一种对象排序方法及装置 Download PDFInfo
- Publication number
- CN107092616B CN107092616B CN201610945126.5A CN201610945126A CN107092616B CN 107092616 B CN107092616 B CN 107092616B CN 201610945126 A CN201610945126 A CN 201610945126A CN 107092616 B CN107092616 B CN 107092616B
- Authority
- CN
- China
- Prior art keywords
- factor
- user
- period
- current user
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012216 screening Methods 0.000 claims abstract description 9
- 238000012163 sequencing technique Methods 0.000 claims abstract description 4
- 238000001914 filtration Methods 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 abstract description 4
- 230000014759 maintenance of location Effects 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 18
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 11
- 240000003768 Solanum lycopersicum Species 0.000 description 11
- 244000061456 Solanum tuberosum Species 0.000 description 7
- 235000002595 Solanum tuberosum Nutrition 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000007774 longterm Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000005065 mining Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 101100421536 Danio rerio sim1a gene Proteins 0.000 description 1
- 101100495431 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cnp1 gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种对象排序方法及装置,其中方法包括:获取特征集合,其中所述特征集合包括根据当前用户的行为数据获取的当前用户的多个特征,以及根据每个待排序对象的行为数据获取的每个所述对象的多个特征;从所述特征集合中筛选出指定特征,其中所述指定特征为与当前时间相匹配的特征;根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分,以及,根据所述评分对待排序对象进行排序。本发明实施例在为待排序对象排序时,不但考虑了待排序对象的特性,也考虑了用户自身的特性,这就使得检索结果的排序更准确、更合理,更好的符合用户当前的需求,进而可以提高用户的留存率,也可以提高从检索到某种操作(例如下单)的转化率。
Description
技术领域
本发明涉及信息检索技术领域,尤其涉及一种对象排序方法及装置。
背景技术
随着信息技术的不断发展,互联网已深入到各个领域,涌现出大量的购物平台、外卖平台、打车平台等网络信息平台。用户在使用这些网络信息平台时,往往有对某类对象(例如商户)进行检索的需求。平台检索到结果后,将检索结果按何种顺序进行显示则是一个非常重要的问题。
在现有技术中,可以根据对象自身的某些特点(例如好评度、订单量等)对检索结果中的每个对象(也即待排序对象)进行自动排序,然后展示给用户,供用户对比、挑选。然而发明人在实现本发明的过程中发现,用户的需求可能在不断变化,例如在一天中消费者对晚饭的需求可能不同于对午饭的需求,所以现有技术中这种仅根据对象自身的某些特点的排序算法准确度不高,无法有效满足用户的需求。
发明内容
本发明提供一种对象排序方法及装置,以提高排序结果的准确性。
根据本发明实施例的第一方面,提供一种对象排序方法,所述方法包括:
获取特征集合,其中所述特征集合包括根据当前用户的行为数据获取的当前用户的多个特征,以及根据每个待排序对象的行为数据获取的每个所述对象的多个特征;
从所述特征集合中筛选出指定特征,其中所述指定特征为与当前时间相匹配的特征;
根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分,以及,根据所述评分对待排序对象进行排序。
可选的:
每个所述特征带有第一时间属性和第二时间属性,所述第一时间属性用于指示所述特征所属的时期,所述时期分为第一时期和第二时期,所述第二时间属性用于指示所述特征所属的一天内的时间段;所述指定特征为与当前时间同属同一时间段的特征;
所述根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分,包括:
根据所述第一特征及第一预设算法获取第一因子和第二因子,其中所述第一因子为在所述第一时期内当前用户与所述对象的匹配度,所述第二因子为在所述第二时期内当前用户与所述对象的匹配度;
根据每个参量乘以相应权值之后的和,得到每个所述对象的评分,其中所述第一因子和所述第二因子分别为一个所述参量。
可选的,所述根据所述第一特征及第一预设算法获取第一因子和第二因子,包括:
根据当前用户在所述第一时期内的特征构建第一用户特征向量,根据所述对象在所述第一时期内的特征构建第一对象特征向量;
根据余弦法计算所述第一用户特征向量和所述第一对象特征向量的相似度以作为所述第一因子;
根据当前用户在所述第二时期内的特征构建第二用户特征向量,根据所述对象在所述第二时期内的特征构建第二对象特征向量;
根据余弦法计算所述第二用户特征向量和所述第二对象特征向量的相似度以作为所述第二因子。
可选的,所述参量还包括第三因子;
所述方法还包括:
获取第一平均值和第二平均值,其中所述第一平均值为所述对象的预设指标历史数据的平均值,所述第二平均值为当前用户的预设指标历史数据的平均值;
根据预设公式及所述第一平均值和所述第二平均值,获取所述第三因子。
可选的,所述预设公式包括:
或者,所述预设公式包括:
其中,X3为所述第三因子,shop_price为所述第一平均值,user_price为所述第二平均值。
可选的,所述参量还包括第四因子;
所述方法还包括:
根据协同过滤算法,获取当前用户的相似用户;
获取第一对象集合,所述第一对象集合是所述相似用户所关联的对象的集合;
获取第二对象集合,所述第二对象集合是在所述第一对象集合中滤掉当前用户所关联的对象而得到的集合;
获取第三对象集合,所述第三对象集合是所述第二对象集合与待排序对象的交集;
当待排序对象属于第三对象集合时,则根据第二预设算法获取所述第四因子的值;
当待排序对象不属于第三对象集合时,则将所述第四因子的值置为零。
可选的,所述根据第二预设算法获取所述第四因子的值,包括:
根据
获取所述第四因子X4,其中,ai代表当前用户的第i个相似用户与所述对象的关联度,Ai代表第i个相似用户与当前用户的相似度,m为当前用户的相似用户数量。
根据本发明实施例的第二方面,提供一种对象排序装置,所述装置包括:
特征获取模块,用于获取特征集合,其中所述特征集合包括根据当前用户的行为数据获取的当前用户的多个特征,以及根据每个待排序对象的行为数据获取的每个所述对象的多个特征;
特征筛选模块,用于从所述特征集合中筛选出指定特征,其中所述指定特征为与当前时间相匹配的特征;
评分模块,用于根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分;
排序模块,用于根据所述评分对待排序对象进行排序。
可选的:
每个所述特征带有第一时间属性和第二时间属性,所述第一时间属性用于指示所述特征所属的时期,所述时期分为第一时期和第二时期,所述第二时间属性用于指示所述特征所属的一天内的时间段;所述指定特征为与当前时间同属同一时间段的特征;
所述评分模块包括:
因子获取子模块,用于根据所述第一特征及第一预设算法获取第一因子和第二因子,其中所述第一因子为在所述第一时期内当前用户与所述对象的匹配度,所述第二因子为在所述第二时期内当前用户与所述对象的匹配度;
评分计算子模块,用于根据每个参量乘以相应权值之后的和,得到每个所述对象的评分,其中所述第一因子和所述第二因子分别为一个所述参量。
可选的,所述因子获取子模块用于:
根据当前用户在所述第一时期内的特征构建第一用户特征向量,根据所述对象在所述第一时期内的特征构建第一对象特征向量;
根据余弦法计算所述第一用户特征向量和所述第一对象特征向量的相似度以作为所述第一因子;
根据当前用户在所述第二时期内的特征构建第二用户特征向量,根据所述对象在所述第二时期内的特征构建第二对象特征向量;
根据余弦法计算所述第二用户特征向量和所述第二对象特征向量的相似度以作为所述第二因子。
可选的,所述参量还包括第三因子;
所述因子获取子模块还用于:
获取第一平均值和第二平均值,其中所述第一平均值为所述对象的预设指标历史数据的平均值,所述第二平均值为当前用户的预设指标历史数据的平均值;
根据预设公式及所述第一平均值和所述第二平均值,获取所述第三因子。
可选的,所述预设公式包括:
或者,所述预设公式包括:
其中,X3为所述第三因子,shop_price为所述第一平均值,user_price为所述第二平均值。
可选的,所述参量还包括第四因子;
所述因子获取子模块还用于:
根据协同过滤算法,获取当前用户的相似用户;
获取第一对象集合,所述第一对象集合是所述相似用户所关联的对象的集合;
获取第二对象集合,所述第二对象集合是在所述第一对象集合中滤掉当前用户所关联的对象而得到的集合;
获取第三对象集合,所述第三对象集合是所述第二对象集合与待排序对象的交集;
当待排序对象属于第三对象集合时,则根据第二预设算法获取所述第四因子的值;
当待排序对象不属于第三对象集合时,则将所述第四因子的值置为零。
可选的,所述因子获取子模块在根据第二预设算法获取所述第四因子的值时,用于:
根据
获取所述第四因子X4,其中,ai代表当前用户的第i个相似用户与所述对象的关联度,Ai代表第i个相似用户与当前用户的相似度,m为当前用户的相似用户数量。
本发明的实施例提供的技术方案可以包括以下有益效果:
在本发明实施例中,虽然要排序的是检索到的对象(例如商家),但是对当前用户也进行了特征挖掘,然后根据筛选出的特征判断用户与对象的匹配程度,最后根据匹配程度对检索到的对象进行排序。例如可以引入了时间因子,即,鉴于用户的特征可能会随着时间的增长而发生一定的变化,甚至在一天的不同时间段用户的特征也可能会有所区别,将这些特征在横向上分为不同时期、纵向上分为不同时间段,然后根据当前时间在一天中所处的时间段,筛选出与当前时间同属同一时间段的特征,再根据筛选出的特征进行用户与对象之间的匹配度计算,从而可以找到与用户匹配度更高的对象。这样,在排序时便可将这些匹配度更高的对象排在前列,从而使得向用户展示的检索结果更准确、更合理,更好的符合用户当前的需求,进而可以提高用户的留存率,也可以提高从检索到某种操作(例如下单)的转化率。
另外,本发明实施例还进一步引入了第三因子(例如商户档次和用户消费水平匹配因子),根据对象的预设指标(例如订单价格)历史数据的平均值,和用户的预设指标历史数据的平均值,得到该第三因子的值,通过第三因子的加入可以优化评分结果,进而可以进一步优化检索排序的结果。
此外,本发明实施例还进一步根据协同过滤算法,获取当前用户的相似用户,进而找到当前用户潜在关联(例如潜在喜欢)的对象,并在排序时通过引入第四因子提高这些潜在关联的对象的评分值,使得这些对象可以排的更加靠前,便于用户发现,从而进一步优化了排序结果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。此外,这些介绍并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明一示例性实施例示出的一种对象排序方法的流程图;
图2是根据本发明一示例性实施例示出的一种对象排序方法的流程图;
图3是根据本发明一示例性实施例示出的一种对象排序方法的流程图;
图4是根据本发明一示例性实施例示出的一种对象排序方法的流程图;
图5是根据本发明一示例性实施例示出的一种对象排序装置的示意图;
图6是根据本发明一示例性实施例示出的一种对象排序装置的示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
实施例一
图1是根据本发明一示例性实施例示出的一种对象排序方法的流程图。该方法可以用于服务器等设备。
参见图1所示,该方法可以包括以下步骤:
步骤S101,获取特征集合,其中所述特征集合包括根据当前用户的行为数据获取的当前用户的多个特征,以及根据每个待排序对象的行为数据获取的每个所述对象的多个特征。
作为示例,对象具体可以为商家、产品、菜品等。在本发明中“特征”又可称为“标签”(tag)或“标签特征”,用于指示用户或商家的特点。
以餐饮为例,一个重要维度就是食材,例如某商家一个菜品叫做“西红柿牛腩”,那么从食材维度来说就可以拆分出“西红柿”、“牛腩”这两个标签,另外一个菜品叫“西红柿炒土豆”,那么可以拆出来“西红柿”、“土豆”这两个标签,故该商家具有“西红柿”、“牛腩”、“土豆”这三个标签。进一步的,如果该商家卖出了100份“西红柿牛腩”、20份“西红柿炒土豆”,该商家的标签就可以进一步表述为:[“西红柿”:120;“牛腩”:100;“土豆”:20],其中120等便是标签的值(或者可以说是权重)。类似的,如果某用户点了80单“西红柿牛腩”、20单“西红柿土豆”,那么这个用户的标签就可以表述为:[“西红柿”:100;“牛腩”:80;“土豆”:20]。当然容易理解的是,标签还有其他的维度或者说是刻画角度,比如口味(酸、甜、苦、微辣等),本实施例不再赘述。
作为示例,每个所述特征可以带有第一时间属性和第二时间属性,所述第一时间属性用于指示所述特征所属的时期,所述时期分为第一时期(例如最近一个月)和第二时期(例如一个月之前),所述第二时间属性用于指示所述特征所属的一天内的时间段(例如一天可分为五个时间段)。
步骤S102,从所述特征集合中筛选出指定特征,其中所述指定特征为与当前时间相匹配的特征。
例如,所述指定特征可以为与当前时间同属同一时间段的特征。
考虑到用户的需求可能在不断变化,因此本实施例可以采用时间窗口的方式,对用户的行为数据进行了切割,从第一时期(例如最近一个月)的用户行为数据中挖掘出用户的近期标签特征,从第二时期(例如一个月之前)所有历史行为中挖掘出该用户的长期标签特征。类似的,可以从最近一个月的商户行为中挖掘出商户的近期标签特征,从一个月之前的商户所有历史行为中挖掘出该商户的长期标签特征。同时,作为示例,可以把一天再进一步划分为5个时间段,例如:
TR1(9:00-11:00),TR2(11:00-14:00),TR3(14:00-16:00),TR4(16:00-22:00),TR5(22:00-9:00))
这样,当确定出当前时间所处的时间段后,就可以从用户的众多近期标签特征中根据当前时间段筛选出一部分标签特征,从用户的众多长期标签特征中根据当前时间段筛选出一部分标签特征,并且,从商户的众多近期标签特征中根据当前时间段筛选出一部分标签特征,从商户的众多长期标签特征中根据当前时间段筛选出一部分标签特征,从而得到四部分标签特征。作为示例可参见表1所示,在表1中,当前所处的时间段是11:00-14:00,表1中“标签xxx”可代表各种各样的标签,不再一一赘述:
表1
步骤S103,根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分,以及,根据所述评分对待排序对象进行排序。
作为示例,所述根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分,可以包括:
根据所述第一特征及第一预设算法获取第一因子和第二因子,其中所述第一因子为在所述第一时期内当前用户与所述对象的匹配度,所述第二因子为在所述第二时期内当前用户与所述对象的匹配度;
根据每个参量乘以相应权值之后的和,得到每个所述对象的评分,其中所述第一因子和所述第二因子分别为一个所述参量。
例如承接表1,对于得到的四部分标签特征,用户的长期标签特征与商户的长期标签特征相对应,可以用于计算用户与商户在长期方面的匹配度(第二因子),用户的近期标签特征与商户的近期标签特征相对应,可以用于计算用户与商户在近期方面的匹配度(第一因子)。
作为示例,待排序对象的评分公式可以为:
shop_score=W1×X1+W2×X2+...+Wn×Xn
其中shop_score便是一个待排序对象的评分,X1等是一个因子,W1等是因子对应的权值,n是因子的数量。在本实施例中,因子的数量是2个,即第一因子X1和第二因子X2,所以评分公式为:
shop_score=W1×X1+W2×X2
而当参量中还包括第三因子或第四因子时,评分公式相应可变为:
shop_score=W1×X1+W2×X2+W3×X3
或
shop_score=W1×X1+W2×X2+W3×X3+W4×X4
至于各因子的权值如何设置本实施例并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行设计,可以在此处使用的这些设计都没有背离本发明的精神和保护范围。
此外,对于根据所述第一特征及第一预设算法获取第一因子和第二因子的具体方式本实施例并不进行限制,作为示例可参见图2所示,根据所述第一特征及第一预设算法获取第一因子和第二因子,可以包括:
步骤S201,根据当前用户在所述第一时期内的特征构建第一用户特征向量,根据所述对象在所述第一时期内的特征构建第一对象特征向量。
步骤S202,根据余弦法计算所述第一用户特征向量和所述第一对象特征向量的相似度以作为所述第一因子。
步骤S203,根据当前用户在所述第二时期内的特征构建第二用户特征向量,根据所述对象在所述第二时期内的特征构建第二对象特征向量。
步骤S204,根据余弦法计算所述第二用户特征向量和所述第二对象特征向量的相似度以作为所述第二因子。
例如可参见以下余弦法计算公式:
其中,shopv为第一对象特征向量,shopv=[sw1 sw2 sw3...],sw1等是第一对象特征向量所含标签的权重;userv为第一用户特征向量,userv=[uw1 uw2 uw3...],uw1等是第一用户特征向量所含标签的的权重。对于余弦法本实施例不再赘述。
在本实施例中,虽然要排序的是检索到的对象(例如商家),但是对当前用户也进行了特征挖掘,然后根据筛选出的特征判断用户与对象的匹配程度,最后根据匹配程度对检索到的对象进行排序。例如可以引入了时间因子,即,鉴于用户的特征可能会随着时间的增长而发生一定的变化,甚至在一天的不同时间段用户的特征也可能会有所区别,将这些特征在横向上分为不同时期、纵向上分为不同时间段,然后根据当前时间在一天中所处的时间段,筛选出与当前时间同属同一时间段的特征,再根据筛选出的特征进行用户与对象之间的匹配度计算,从而可以找到与用户匹配度更高的对象。这样,在排序时便可将这些匹配度更高的对象排在前列,从而使得向用户展示的检索结果更准确、更合理,更好的符合用户当前的需求,进而可以提高用户的留存率,也可以提高从检索到某种操作(例如下单)的转化率。
实施例二
图3是根据本发明一示例性实施例示出的一种对象排序方法的流程图。本实施例基于实施例一,是在实施例一基础上所作的进一步深化或优化。
在本实施例中,评分公式中的所述参量还可以包括第三因子X3;
参见图3所示,所述方法还可以包括:
步骤S301,获取第一平均值和第二平均值,其中所述第一平均值为所述对象的预设指标历史数据的平均值,所述第二平均值为当前用户的预设指标历史数据的平均值。
作为示例,预设指标可以是订单价格等。
作为示例,本实施例可以引入商户档次和用户消费水平匹配因子作为第三因子。具体的,可以统计商户所有历史订单的平均价格,作为第一平均值即商户档次量化值shop_price,并统计用户所有历史订单价格均值,作为第二平均值即用户消费水平量化值user_price,然后计算商户档次和用户消费水平匹配因子price_match_ratio,也即X3。
步骤S302,根据预设公式及所述第一平均值和所述第二平均值,获取所述第三因子。
对于预设公式的具体内容本实施例并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行设计,可以在此处使用的这些设计都没有背离本发明的精神和保护范围。
作为示例,所述预设公式可以包括:
或者,所述预设公式可以包括:
其中,X3为所述第三因子,shop_price为所述第一平均值,user_price为所述第二平均值。
本实施例中进一步引入了第三因子,例如商户档次和用户消费水平匹配因子,根据对象的预设指标(例如订单价格)历史数据的平均值,和用户的预设指标历史数据的平均值,得到该第三因子的值,通过第三因子的加入可以优化评分结果,进而可以进一步优化检索排序的结果。
实施例三
图4是根据本发明一示例性实施例示出的一种对象排序方法的流程图。本实施例基于实施例一或实施例二,是在实施例一或实施例二基础上所作的进一步深化或优化。
在本实施例中,评分公式中的所述参量还可以包括第四因子X4;
参见图4所示,所述方法还可以包括:
步骤S401,根据协同过滤算法,获取当前用户的相似用户。
协同过滤是指通过当前用户的行为寻找其相似用户集,并基于相似用户集合内用户的行为给当前用户进行某种推荐等,不再赘述。
步骤S402,获取第一对象集合,所述第一对象集合是所述相似用户所关联的对象的集合。
例如,“关联”可以具体为“喜欢”,相似用户所关联的对象可以是该相似用户所喜欢的对象。
步骤S403,获取第二对象集合,所述第二对象集合是在所述第一对象集合中滤掉当前用户所关联的对象而得到的集合。
这样便可以得到用户潜在喜欢的商户的集合。
举例来讲,通过用户的下单行为,可以统计到一个用户对一个商家的喜欢程度(此处喜欢程度即关联度,例如可以与下单次数成正比),然后根据协同过滤算法,可以发现那些具有类似下单行为的用户(比如用户A和用户B都经常吃水煮鱼,同时又都不经常吃汉堡,那么这两个用户就有类似下单行为,彼此属于相似用户),以及这些用户之间的相似度(例如相似度可以与两用户之间重合的订单的数量成正比)。这样对于当前用户userA,便可以得到其相似用户集合[user1,user2,…,userN],以及userA和相似用户集合中每一个user的相似度sim1,sim2,…,simN。
然后,user1等相似用户所喜欢的商家便可组成第一对象集合。再从第一对象集合中过滤掉userA已经喜欢的商家(即已经下过单的商家),剩下的就是userA潜在喜欢(即没下过单,但是有可能喜欢)的商家集合,即第二对象集合。
步骤S404,获取第三对象集合,所述第三对象集合是所述第二对象集合与待排序对象的交集。
因为第二对象集合中的一些对象可能未出现在本次检索结果中,所以需要取第二对象集合与待排序对象的交集作为第三对象集合。
步骤S405,当待排序对象属于第三对象集合时,则根据第二预设算法获取所述第四因子的值。
步骤S406,当待排序对象不属于第三对象集合时,则将所述第四因子的值置为零。
对于待排序的对象,其中有一些不是第三集合中的对象,所以这些不是第三集合中的对象便没有用户潜在喜欢这方面的加分(加分值即W4X4),即第四因子的值可置为零。反之,对于属于第三集合中的待排序对象,便有用户潜在喜欢这方面的加分,这样排序时就可以更靠前。
对于第四因子即X4的具体计算方式本发明并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行设计,可以在此处使用的这些设计都没有背离本发明的精神和保护范围。
作为示例,所述根据第二预设算法获取所述第四因子的值,可以包括:
根据
获取所述第四因子X4,其中,ai代表当前用户的第i个相似用户与所述对象的关联度,Ai代表第i个相似用户与当前用户的相似度,m为当前用户的相似用户数量。
本实施例进一步根据协同过滤算法,获取当前用户的相似用户,进而找到当前用户潜在关联(例如潜在喜欢)的对象,并在排序时通过引入第四因子提高这些潜在关联的对象的评分值,使得这些对象可以排的更加靠前,便于用户发现,从而进一步优化了排序结果。
实施例四
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图5是根据本发明一示例性实施例示出的一种对象排序装置的示意图。该装置例如可以用于服务器等设备。
参见图5所示,该装置可以包括:
特征获取模块501,用于获取特征集合,其中所述特征集合包括根据当前用户的行为数据获取的当前用户的多个特征,以及根据每个待排序对象的行为数据获取的每个所述对象的多个特征。
作为示例,对象具体可以为商家、产品、菜品等。在本发明中“特征”又可称为“标签”(tag)或“标签特征”,用于指示用户或商家的特点。
特征筛选模块502,用于从所述特征集合中筛选出指定特征,其中所述指定特征为与当前时间相匹配的特征。
评分模块503,用于根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分。
排序模块504,用于根据所述评分对待排序对象进行排序。
在本实施例或本发明其他某些实施例中:
每个所述特征带有第一时间属性和第二时间属性,所述第一时间属性用于指示所述特征所属的时期,所述时期分为第一时期和第二时期,所述第二时间属性用于指示所述特征所属的一天内的时间段;所述指定特征为与当前时间同属同一时间段的特征;
相应的参见图6所示,所述评分模块503可以包括:
因子获取子模块601,用于根据所述第一特征及第一预设算法获取第一因子和第二因子,其中所述第一因子为在所述第一时期内当前用户与所述对象的匹配度,所述第二因子为在所述第二时期内当前用户与所述对象的匹配度;
评分计算子模块602,用于根据每个参量乘以相应权值之后的和,得到每个所述对象的评分,其中所述第一因子和所述第二因子分别为一个所述参量。
在本实施例或本发明其他某些实施例中,所述因子获取子模块601可以用于:
根据当前用户在所述第一时期内的特征构建第一用户特征向量,根据所述对象在所述第一时期内的特征构建第一对象特征向量;
根据余弦法计算所述第一用户特征向量和所述第一对象特征向量的相似度以作为所述第一因子;
根据当前用户在所述第二时期内的特征构建第二用户特征向量,根据所述对象在所述第二时期内的特征构建第二对象特征向量;
根据余弦法计算所述第二用户特征向量和所述第二对象特征向量的相似度以作为所述第二因子。
在本实施例或本发明其他某些实施例中,所述参量还可以包括第三因子;
所述因子获取子模块601还可以用于:
获取第一平均值和第二平均值,其中所述第一平均值为所述对象的预设指标历史数据的平均值,所述第二平均值为当前用户的预设指标历史数据的平均值;
根据预设公式及所述第一平均值和所述第二平均值,获取所述第三因子。
在本实施例或本发明其他某些实施例中,所述预设公式包括:
或者,所述预设公式包括:
其中,X3为所述第三因子,shop_price为所述第一平均值,user_price为所述第二平均值。
在本实施例或本发明其他某些实施例中,所述参量还可以包括第四因子;
所述因子获取子模块601还可以用于:
根据协同过滤算法,获取当前用户的相似用户;
获取第一对象集合,所述第一对象集合是所述相似用户所关联的对象的集合;
获取第二对象集合,所述第二对象集合是在所述第一对象集合中滤掉当前用户所关联的对象而得到的集合;
获取第三对象集合,所述第三对象集合是所述第二对象集合与待排序对象的交集;
当待排序对象属于第三对象集合时,则根据第二预设算法获取所述第四因子的值;
当待排序对象不属于第三对象集合时,则将所述第四因子的值置为零。
在本实施例或本发明其他某些实施例中,所述因子获取子模块601在根据第二预设算法获取所述第四因子的值时,用于:
根据
获取所述第四因子X4,其中,ai代表当前用户的第i个相似用户与所述对象的关联度,Ai代表第i个相似用户与当前用户的相似度,m为当前用户的相似用户数量。
在本实施例中,虽然要排序的是检索到的对象(例如商家),但是对当前用户也进行了特征挖掘,然后根据筛选出的特征判断用户与对象的匹配程度,最后根据匹配程度对检索到的对象进行排序。例如可以引入了时间因子,即,鉴于用户的特征可能会随着时间的增长而发生一定的变化,甚至在一天的不同时间段用户的特征也可能会有所区别,将这些特征在横向上分为不同时期、纵向上分为不同时间段,然后根据当前时间在一天中所处的时间段,筛选出与当前时间同属同一时间段的特征,再根据筛选出的特征进行用户与对象之间的匹配度计算,从而可以找到与用户匹配度更高的对象。这样,在排序时便可将这些匹配度更高的对象排在前列,从而使得向用户展示的检索结果更准确、更合理,更好的符合用户当前的需求,进而可以提高用户的留存率,也可以提高从检索到某种操作(例如下单)的转化率。
另外,本实施例中进一步引入了第三因子,例如商户档次和用户消费水平匹配因子,根据对象的预设指标(例如订单价格)历史数据的平均值,和用户的预设指标历史数据的平均值,得到该第三因子的值,通过第三因子的加入可以优化评分结果,进而可以进一步优化检索排序的结果。
此外,本实施例进一步根据协同过滤算法,获取当前用户的相似用户,进而找到当前用户潜在关联(例如潜在喜欢)的对象,并在排序时通过引入第四因子提高这些潜在关联的对象的评分值,使得这些对象可以排的更加靠前,便于用户发现,从而进一步优化了排序结果。
关于上述实施例中的装置,其中各个单元\模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (14)
1.一种对象排序方法,其特征在于,所述方法包括:
获取特征集合,其中所述特征集合包括根据当前用户的行为数据获取的当前用户的多个特征,以及根据每个待排序对象的行为数据获取的每个所述对象的多个特征;每个所述特征带有第一时间属性和第二时间属性,所述第一时间属性用于指示所述特征所属的时期,所述第二时间属性用于指示所述特征所属的一天内的时间段;
从所述特征集合中筛选出指定特征,其中所述指定特征为与当前时间相匹配的特征;
根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分,以及,根据所述评分对待排序对象进行排序。
2.根据权利要求1所述的方法,其特征在于:
每个所述特征带有第一时间属性和第二时间属性,所述第一时间属性用于指示所述特征所属的时期,所述时期分为第一时期和第二时期,所述第二时间属性用于指示所述特征所属的一天内的时间段;所述指定特征为与当前时间同属同一时间段的特征;
所述根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分,包括:
根据第一特征及第一预设算法获取第一因子和第二因子,其中所述第一因子为在所述第一时期内当前用户与所述对象的匹配度,所述第二因子为在所述第二时期内当前用户与所述对象的匹配度;
根据每个参量乘以相应权值之后的和,得到每个所述对象的评分,其中所述第一因子和所述第二因子分别为一个所述参量。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一特征及第一预设算法获取第一因子和第二因子,包括:
根据当前用户在所述第一时期内的特征构建第一用户特征向量,根据所述对象在所述第一时期内的特征构建第一对象特征向量;
根据余弦法计算所述第一用户特征向量和所述第一对象特征向量的相似度以作为所述第一因子;
根据当前用户在所述第二时期内的特征构建第二用户特征向量,根据所述对象在所述第二时期内的特征构建第二对象特征向量;
根据余弦法计算所述第二用户特征向量和所述第二对象特征向量的相似度以作为所述第二因子。
4.根据权利要求2所述的方法,其特征在于,所述参量还包括第三因子;
所述方法还包括:
获取第一平均值和第二平均值,其中所述第一平均值为所述对象的预设指标历史数据的平均值,所述第二平均值为当前用户的预设指标历史数据的平均值;
根据预设公式及所述第一平均值和所述第二平均值,获取所述第三因子。
6.根据权利要求2所述的方法,其特征在于,所述参量还包括第四因子;
所述方法还包括:
根据协同过滤算法,获取当前用户的相似用户;
获取第一对象集合,所述第一对象集合是所述相似用户所关联的对象的集合;
获取第二对象集合,所述第二对象集合是在所述第一对象集合中滤掉当前用户所关联的对象而得到的集合;
获取第三对象集合,所述第三对象集合是所述第二对象集合与待排序对象的交集;
当待排序对象属于第三对象集合时,则根据第二预设算法获取所述第四因子的值;
当待排序对象不属于第三对象集合时,则将所述第四因子的值置为零。
8.一种对象排序装置,其特征在于,所述装置包括:
特征获取模块,用于获取特征集合,其中所述特征集合包括根据当前用户的行为数据获取的当前用户的多个特征,以及根据每个待排序对象的行为数据获取的每个所述对象的多个特征;每个所述特征带有第一时间属性和第二时间属性,所述第一时间属性用于指示所述特征所属的时期,所述第二时间属性用于指示所述特征所属的一天内的时间段;
特征筛选模块,用于从所述特征集合中筛选出指定特征,其中所述指定特征为与当前时间相匹配的特征;
评分模块,用于根据所述指定特征获取当前用户与每个所述对象在匹配程度上的评分;
排序模块,用于根据所述评分对待排序对象进行排序。
9.根据权利要求8所述的装置,其特征在于:
每个所述特征带有第一时间属性和第二时间属性,所述第一时间属性用于指示所述特征所属的时期,所述时期分为第一时期和第二时期,所述第二时间属性用于指示所述特征所属的一天内的时间段;所述指定特征为与当前时间同属同一时间段的特征;
所述评分模块包括:
因子获取子模块,用于根据第一特征及第一预设算法获取第一因子和第二因子,其中所述第一因子为在所述第一时期内当前用户与所述对象的匹配度,所述第二因子为在所述第二时期内当前用户与所述对象的匹配度;
评分计算子模块,用于根据每个参量乘以相应权值之后的和,得到每个所述对象的评分,其中所述第一因子和所述第二因子分别为一个所述参量。
10.根据权利要求9所述的装置,其特征在于,所述因子获取子模块用于:
根据当前用户在所述第一时期内的特征构建第一用户特征向量,根据所述对象在所述第一时期内的特征构建第一对象特征向量;
根据余弦法计算所述第一用户特征向量和所述第一对象特征向量的相似度以作为所述第一因子;
根据当前用户在所述第二时期内的特征构建第二用户特征向量,根据所述对象在所述第二时期内的特征构建第二对象特征向量;
根据余弦法计算所述第二用户特征向量和所述第二对象特征向量的相似度以作为所述第二因子。
11.根据权利要求9所述的装置,其特征在于,所述参量还包括第三因子;
所述因子获取子模块还用于:
获取第一平均值和第二平均值,其中所述第一平均值为所述对象的预设指标历史数据的平均值,所述第二平均值为当前用户的预设指标历史数据的平均值;
根据预设公式及所述第一平均值和所述第二平均值,获取所述第三因子。
13.根据权利要求9所述的装置,其特征在于,所述参量还包括第四因子;
所述因子获取子模块还用于:
根据协同过滤算法,获取当前用户的相似用户;
获取第一对象集合,所述第一对象集合是所述相似用户所关联的对象的集合;
获取第二对象集合,所述第二对象集合是在所述第一对象集合中滤掉当前用户所关联的对象而得到的集合;
获取第三对象集合,所述第三对象集合是所述第二对象集合与待排序对象的交集;
当待排序对象属于第三对象集合时,则根据第二预设算法获取所述第四因子的值;
当待排序对象不属于第三对象集合时,则将所述第四因子的值置为零。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610945126.5A CN107092616B (zh) | 2016-11-02 | 2016-11-02 | 一种对象排序方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610945126.5A CN107092616B (zh) | 2016-11-02 | 2016-11-02 | 一种对象排序方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107092616A CN107092616A (zh) | 2017-08-25 |
CN107092616B true CN107092616B (zh) | 2020-08-28 |
Family
ID=59646432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610945126.5A Expired - Fee Related CN107092616B (zh) | 2016-11-02 | 2016-11-02 | 一种对象排序方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107092616B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020175B (zh) * | 2017-12-29 | 2023-08-11 | 阿里巴巴集团控股有限公司 | 一种搜索处理方法、处理设备和系统 |
CN108734548B (zh) * | 2018-04-27 | 2021-12-17 | 达而观信息科技(上海)有限公司 | 物品推荐方法和装置 |
CN108960958B (zh) * | 2018-04-27 | 2022-03-22 | 达而观信息科技(上海)有限公司 | 物品推荐方法和装置 |
CN108734549B (zh) * | 2018-04-27 | 2021-12-21 | 达而观信息科技(上海)有限公司 | 物品推荐方法和装置 |
CN109191159B (zh) * | 2018-06-29 | 2021-08-20 | 北京三快在线科技有限公司 | 数据定向方法、装置、计算机设备及计算机可读存储介质 |
CN109299123B (zh) * | 2018-09-29 | 2020-11-03 | 口碑(上海)信息技术有限公司 | 菜品特征库同步方法以及装置 |
CN110569446B (zh) * | 2019-09-04 | 2022-05-17 | 第四范式(北京)技术有限公司 | 一种构建推荐对象候选集的方法和系统 |
CN112527427A (zh) * | 2020-11-19 | 2021-03-19 | 贝壳技术有限公司 | 页面展示方法、装置、计算机可读存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346894A (zh) * | 2010-08-03 | 2012-02-08 | 阿里巴巴集团控股有限公司 | 推荐信息的输出方法、系统及服务器 |
CN104239331A (zh) * | 2013-06-19 | 2014-12-24 | 阿里巴巴集团控股有限公司 | 一种用于实现评论搜索引擎排序的方法和装置 |
CN104750807A (zh) * | 2015-03-25 | 2015-07-01 | 百度在线网络技术(北京)有限公司 | 一种应用推荐方法及装置 |
CN105159932A (zh) * | 2015-08-07 | 2015-12-16 | 南车青岛四方机车车辆股份有限公司 | 一种数据检索和排序系统和方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4398992B2 (ja) * | 2007-03-29 | 2010-01-13 | 株式会社東芝 | 情報検索装置、情報検索方法及び情報検索プログラム |
CN103164463B (zh) * | 2011-12-16 | 2017-03-22 | 国际商业机器公司 | 推荐标签的方法和装置 |
CN104133821A (zh) * | 2013-05-01 | 2014-11-05 | 谢志宏 | 利用稳定匹配理论和算法的用户匹配方法和网络系统 |
CN103279513B (zh) * | 2013-05-22 | 2017-03-01 | 百度在线网络技术(北京)有限公司 | 产生内容标签的方法、提供多媒体内容信息的方法及装置 |
-
2016
- 2016-11-02 CN CN201610945126.5A patent/CN107092616B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346894A (zh) * | 2010-08-03 | 2012-02-08 | 阿里巴巴集团控股有限公司 | 推荐信息的输出方法、系统及服务器 |
CN104239331A (zh) * | 2013-06-19 | 2014-12-24 | 阿里巴巴集团控股有限公司 | 一种用于实现评论搜索引擎排序的方法和装置 |
CN104750807A (zh) * | 2015-03-25 | 2015-07-01 | 百度在线网络技术(北京)有限公司 | 一种应用推荐方法及装置 |
CN105159932A (zh) * | 2015-08-07 | 2015-12-16 | 南车青岛四方机车车辆股份有限公司 | 一种数据检索和排序系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107092616A (zh) | 2017-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107092616B (zh) | 一种对象排序方法及装置 | |
CN105677831B (zh) | 一种确定推荐商户的方法及装置 | |
CN106372249B (zh) | 一种点击率预估方法、装置及电子设备 | |
US7805431B2 (en) | System and method for generating a display of tags | |
CN103246980B (zh) | 信息输出方法及服务器 | |
CN110175895B (zh) | 一种物品推荐方法及装置 | |
CN108648058B (zh) | 产品排序方法及装置,电子设备、存储介质 | |
CN104881807A (zh) | 一种推荐商品信息的方法及装置 | |
CN107092647B (zh) | 一种提供资源组合的方法及装置 | |
CN110569432A (zh) | 商品序列计算方法、装置、计算机设备及存储介质 | |
CN103858142A (zh) | 店铺信息提供系统 | |
CN108153792B (zh) | 一种数据处理方法和相关装置 | |
CN110727859B (zh) | 一种推荐信息推送方法及其装置 | |
CN107247728B (zh) | 文本处理方法、装置及计算机存储介质 | |
CN110750697B (zh) | 商户分类方法、装置、设备及存储介质 | |
CN104239335B (zh) | 特定用户信息获取方法及装置 | |
KR20170118297A (ko) | 기상 정보에 기반한 상품 추천 방법 | |
CN116308684B (zh) | 一种网购平台店铺信息推送方法及系统 | |
CN109741125A (zh) | 推荐菜品的方法及装置、存储介质、电子装置 | |
CN110874785A (zh) | 餐品套餐信息的确定方法、装置及设备 | |
CN111639266A (zh) | 推荐信息生成方法、装置、电子设备及可读存储介质 | |
CN113689258A (zh) | 一种商品推荐热度生成方法及系统 | |
CN107133811A (zh) | 一种目标用户的识别方法和装置 | |
CN106886921A (zh) | 基于用户兴趣的个性化推荐方法 | |
CN105574015A (zh) | 搜索推荐方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202 Applicant after: Beijing Xingxuan Technology Co.,Ltd. Address before: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202 Applicant before: Beijing Xiaodu Information Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200828 |
|
CF01 | Termination of patent right due to non-payment of annual fee |