CN108073578B - 一种进行对象推荐的方法和系统 - Google Patents
一种进行对象推荐的方法和系统 Download PDFInfo
- Publication number
- CN108073578B CN108073578B CN201610977434.6A CN201610977434A CN108073578B CN 108073578 B CN108073578 B CN 108073578B CN 201610977434 A CN201610977434 A CN 201610977434A CN 108073578 B CN108073578 B CN 108073578B
- Authority
- CN
- China
- Prior art keywords
- index
- matrix
- interval
- iteration
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及计算机技术领域,特别涉及一种进行对象推荐的方法和系统,用以解决现有技术中存在的划分的价格区间容易将接近的价格划分到不同子区间,以及划分的结果容易受数据平滑方法的影响,从而会影响为用户推荐的对象的问题。本申请实施例根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定目标指标区间,并确定与用户关联的对象的同一类别的目标指标区间,从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间推荐给用户。本申请实施例能够降低将接近的价格划分到不同子区间的情况出现的次数,并且降低受数据平滑方法的影响,减小对为用户推荐对象的影响。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种进行对象推荐的方法和系统。
背景技术
网络发布平台是发布者通过网络发布自己的产品,用户通过网络浏览产品,并通过网络进行交互的平台。
发布者在网络发布平台发布产品时都会为该产品配置产品信息。用户根据产品信息可以与网站发布平台针对一个产品发生交互行为。
目前的网站发布平台会向用户推荐产品。具体推荐哪些产品是通过推荐系统确定的。
一般推荐系统会先确定与用户有关联的对象,并为用户推荐同一类的其他对象,但是由于同一类的其他对象的数量很多,所以系统还会根据价格区间为用户选择推荐对象。
价格区间划分是基于价格的对象推荐和对象选品等电商领域相关应用里的一个基础且重要的数据处理步骤。该步骤通常是将整个类目对象价格跨度范围(即类目对象价格轴),按照一定规则划分为若干个价格区间,计算不同价格区间上的对象/类目指标数据,对处于不同价格区间上的对象进行不同处理,将有限的用户流量资源引到高品质或高商业价值到对象上。
目前进行价格区间划分的方式主要有基于规则的划分方法和基于曲线的划分方法。
基于规则的划分方法是将整个对象类目按照一定的约束条件进行划分。比如,按照对象量,对对象类目价格轴进行均分,提取均分点所在价格作为价格区间划分的边界点。但是这种方式严重依赖人工先验知识和应用目的,区间的划分方式比较简单,容易将商业指标表现接近的价格点划分到不同子区间上去。
基于曲线的划分方法是将对象类目价格点上的指标数据首先采用某种算法转化成一个综合指标,接着对价格-综合指标这一曲线进行分析,寻找曲线的极值点、斜率最大值点、波峰与波谷等这类曲线上的特殊位置点,然后将特殊位置点进行适当的调整,从而得到价格区间划分的分割点。这种方法在对象指标波动较小时,能够在一定程度上保留对象类目下对象指标变化的趋势,将对象指标表现接近的价格点划分到同一个子区间,然而在对象指标波动较大时,曲线上会出现比较多的波峰波谷,需要加入数据平滑处理过程,减少波峰波谷数,因此导致算法的结果容易受所采用的数据平滑方法的影响。
综上所述,目前划分价格区间的方法容易将接近的价格划分到不同子区间,以及划分的结果容易受数据平滑方法的影响,从而会影响为用户推荐的对象。
发明内容
本申请提供一种进行对象推荐的方法和系统,用以解决现有技术中存在的划分价格区间的方法容易将接近的价格划分到不同子区间,以及划分的结果容易受数据平滑方法影响,从而会影响为用户推荐的对象的问题。
本申请实施例提供的一种进行对象推荐的方法,该方法包括:
确定与用户关联的对象的同一类别的目标指标区间,其中所述目标指标区间是根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定的;
从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间;
将确定的区间对应的部分或全部对象推荐给所述用户。
本申请实施例提供的一种进行对象推荐的系统,该系统包括:
区间确定模块,用于确定与用户关联的对象的同一类别的目标指标区间,其中所述目标指标区间是根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定的;
选择模块,用于从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间;
推荐模块,用于将确定的区间对应的部分或全部对象推荐给所述用户。
本申请实施例根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定目标指标区间,并确定与用户关联的对象的同一类别的目标指标区间,从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间推荐给所述用户。由于本申请实施例在委员会推荐对象所使用的目标指标区间是根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定的,降低了将接近的价格划分到不同子区间的情况出现的次数,并且降低了受数据平滑方法的影响,从而减小对为用户推荐对象的影响。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例进行对象推荐的方法流程示意图;
图2为本申请实施例划分指标区间的方法流程示意图;
图3为本申请实施例进行对象推荐的系统结构示意图。
具体实施方式
本申请实施例的方案可以应用于任何需要为用户推荐对象的网站,比如淘宝,aliexpress(全球速卖通),拍拍,京东,苏宁,亚马逊,ebay、1688等网站。
本申请实施例的对象可以是任何能够进行交易的对象都可以作为本申请实施例的对象,比如商品、服务等。
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
如图1所示,本申请实施例进行对象推荐的方法包括:
步骤100、确定与用户关联的对象的同一类别的目标指标区间,其中所述目标指标区间是根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定的;
步骤101、从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间;
步骤102、将确定的区间对应的部分或全部对象推荐给所述用户。
本申请实施例根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定目标指标区间,并确定与用户关联的对象的同一类别的目标指标区间,从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间推荐给所述用户。由于本申请实施例在委员会推荐对象所使用的目标指标区间是根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定的,降低了将接近的价格划分到不同子区间的情况出现的次数,并且降低了受数据平滑方法的影响,从而减小对为用户推荐对象的影响。
其中,本申请实施例先确定与用户关联的对象;之后确定关联的对象同一类别的目标指标区间;最后确定具体的区间并进行推荐。
针对不同的应用场景以及设置条件,关联的标准也不相同。
以应用在电商场景为例,假设设置的条件为最近1个月购买过的商品,则与用户关联的对象为用户在电商平台上最近1个月购买的部分或全部商品。
例如目标指标为价格,与用户关联的对象为洗发水,价格是34元,预先会为每种类别的商品价格划分区间。假设洗发水所属的类别为洗护用品,洗护用品的目标指标区间为0~15,16~35,36~70,70以上这几个区间,则价格是34元的洗发水属于16~35这个目标指标区间。
之后确定洗护用品中价格是16~35的所有商品,并将确定的部分或全部商品推荐给所述用户。
具体推荐多少可以根据经验、场景等进行设置,也可以由用户进行设置。如果应用于电商场景,还可以根据商品的销量、好评率等为每个商品计算一个综合得分,并按照分数从高到低的顺序为用户进行商品推荐。
可选的,本申请实施例的所述目标指标区间是根据下列方式确定的:
针对任意一个对象集合,对所述对象集合中的对象对应的指标集合进行合并处理得到指标特征数据矩阵,其中同一个对象集合中的对象属于同一类别;
根据所述指标特征数据矩阵,对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代,直到满足停止迭代条件;
根据所述指标特征数据矩阵,以及根据停止迭代后最后一次得到的聚类中心矩阵和/或聚类系数矩阵,确定所述对象集合中对象的目标指标区间。
由于本申请实施例对所述对象集合中的对象对应的指标集合进行合并处理,使得对该指标区间划分模型优化求解后将非常临近的指标划分到同一个子区间,进一步降低了将接近的价格划分到不同子区间的情况出现的次数,以及进一步降低了受数据平滑方法的影响。
其中,本申请实施例的方案分为三步:1、数据预处理;2、利用模型确定是否迭代结束;3、区间划分。下面分别进行介绍。
1、数据预处理。
第1步中,预先按照类别将对象划分为多个集合,每个集合中都包括该集合对应的类别下的对象。
比如应用于商品交易场景,则按照商品类目划分集合,每个集合包括对应类目下的部分或全部商品。例如商品类目为:服装、电子用品等。服装对应的集合中包括属于服装的商品;电子用品对应的集合中包括属于电子用品的商品。
在划分了集合后,确定一段时间内(比如最近一个月)每个对象的指标集合。
不同的应用场景,指标集合中包括的指标也不相同。
以应用于商品交易场景为例,指标集合包括两类商品指标数据:一类是商品销售指标,包括商品的成交金额和订单量等;另外一类是买家反馈的商品评价指标,包括商品的好评率、商品描述分和商品的纠纷率等。
为了更好地理解本申请实施例的方案,下面的介绍中以应用于商品交易场景为例进行说明,但是并不带代表申请实施例的方案只适用于商品交易场景,任何需要对指标进行区间划分的场景都适用本申请实施例。
以应用于商品交易场景为例:pi表示该商品的价格,依次表示该商品的成交金额、订单量、好评率、商品描述分和商品的纠纷率,这五个不同的商品指标数据。假设某一个商品类目下包含有n个商品,那么该类目商品集合所对应的特征数据集合可以表示为:
由于商品在定价的时候容易选择一些特殊的价格点,比如59和199这类特殊的价格值,因此为了加速后续的计算,可选的一种方式是将同类目下商品价格差异小于给定阈值的商品(即:||pi-pj||≤ε1),进行合并处理。
具体的,根据所述指标集合中的目标指标,将所述对象集合中的对象对应的指标集合进行排序;
按顺序判断相邻两个指标集合是否需要进行合并处理;
在确定相邻两个指标集合需要进行合并处理后,对相邻两个指标集合进行合并处理;
将合并处理后得到的指标集合替换相邻的所述两个指标集合,并返回按顺序判断相邻两个指标集合是否需要进行合并处理的步骤,直到所有指标集合都不需要进行合并处理。
可选的,根据下列方式判断是否需要进行合并处理:
按顺序在确定有相邻两个指标集合中的目标指标的差值大于第一阈值后,确定相邻两个指标集合需要进行合并处理。
如果相邻两个指标集合中的目标指标的差值不大于第一阈值,则确定相邻两个指标集合不需要进行合并,按顺序判断下一个相邻两个指标集合。
比如有A、B、C和D四个集合,按顺序先判断A和B是否需要合并,如果不需要,继续判断B和C是否需要合并,如果需要,则B和C合并后得到B1,将B1替换B和C,则集合变为A、B1和D,重新判断A和B1是否需要合并,如果不需要,在判断B1和D是否需要合并,如果也不需要,则合并处理结束。
采用下列方式对指标集合S1进行处理:
输入:有序的初始价格特征数据集合S1和价格临近阈值ε1(即第一阈值);
输出:合并相近价格数据后的价格特征数据列表S2。
具体过程:
重复如下步骤,直到相邻价格点的最小价格差大于阈值ε1;
从左至右,依次计算S1中,任意相邻的两个价格点pi和pi+1的价格差:
(ri)′=ri+ri+1………公式(7)。
假设pi表示该商品的价格,依次表示该商品的成交金额、订单量、好评率、商品描述分和商品的纠纷率,则pi′表示合并后的价格,pi和pi+1表示相邻的价格;表示合并后的成交金额,和表示相邻的成交金额;表示合并后的订单量,和表示相邻的订单量;表示合并后的好评率,和表示相邻的好评率;表示合并后的商品描述分,和表示相邻的商品描述分;表示合并后的纠纷率,和表示相邻的纠纷率;(ri)'表示合并后价格点的累计出现次数,ri表示pi出现的次数,ri+1表示pi+1出现的次数。
因为依据公式(1)计算得到的新的价格点满足pi≤pi′≤pi+1,所以每次相邻价格点数据指标合并后,S1依旧保持是一个有序的列表。循环迭代结束,令S2=S1,输出最终的价格特征数据列表S2。
例如,目标指标为价格,同一个类目下按照价格从小到大对指标集合进行排序,排序后每个指标集合中的价格组成的序列为{10,11,12,15,20,…,100},假设阈值为2,那么从左向右扫描,第一次合并(10,11),得到新的序列{10.5,11,12,15,20,…,100};接着扫描,(10.5,11)满足合并要求,继续合并,得到序列{10.75,12,15,20,....,100},依次类推,直至相邻价格点差值均大于阈值(在合并时,其他指标也需要合并,具体可以参照上面的公式,这里采用价格作为是否合并的判断依据)。这里可以采用浮点数作为价格点取值,若采用整数取值,还可以进一步加速计算。
最终根据价格特征数据列表S2就可以得到指标特征数据矩阵。
比如商品类目下的商品价格特征列表可以表示为:
可选的,指标特征数据矩阵可以不包括目标指标;也可以包括指标特征数据矩阵。
这里列举的例子中指标特征数据矩阵不包括目标指标。
2、利用模型确定是否迭代结束。
在第2步中,预先会随机初始化聚类中心矩阵和聚类系数矩阵,并根据第1步中得到的指标特征数据矩阵对这两个矩阵进行迭代;每次迭代后得到新的聚类中心矩阵和聚类系数矩阵,并将第1步中得到的指标特征数据矩阵、新的聚类中心矩阵和聚类系数矩阵输入到指标区间模型中,根据指标区间模型输出的目标参数值判断满足停止迭代条件,如果满足,则停止迭代,否则继续迭代。
可选的,根据下列公式对聚类中心矩阵和聚类系数矩阵进行迭代:
其中,Gt ij为迭代后得到的聚类系数矩阵;为迭代后的得到的聚类中心矩阵;为上一次迭代得到的聚类系数矩阵,初始迭代时是预先设置的聚类系数矩阵;Zt-1为上一次迭代得到的聚类中心矩阵,初始迭代时是预先设置的聚类中心矩阵;λ1为指标区间模型的正则化参数;X为指标特征数据矩阵;T为迭代次数;Ik为k乘以k的单位矩阵;γ为正则化参数(这里的γ可以设置为一个非常大的正则化参数,例如10^5或10^6);i为矩阵的行数;j为矩阵的列数;M为正交约束系数,例如M可以为2。
比如随机初始化Z0和G0。Zt和Gt表示Z和G在第t轮迭代时的值。
首先,固定Zt-1,更新Gt:
然后,固定Gt,更新Zt:
最后,将本次更新得到的Gt和Zt带入指标区间模型。
可选的,本申请实施例的指标区间模型为:
其中,J(Z,G)为目标参数值;X为指标特征数据矩阵;Z为聚类中心矩阵,比如Z∈R5 ×k;G为聚类系数矩阵,G=[g1,g2,...,gm],比如G=[g1,g2,...,gm]∈R5×k;Z≥0,G≥0,GGT=Ik;Ik是k×k的单位矩阵;k为聚类个数;L为拉普拉斯图,L=D-W;D为对角矩阵 ε2是连续约束参数;ε3是指标特征数据相似性约束参数,xi和xj表示X矩阵的第i列和第j列,表示矩阵X的F-范数(即F-norm范数)。
λ1和λ2是指标区间模型的正则化参数。在电商领域中,商品的价格特征数据为非负数据矩阵,因此在上面公式(10)中引入Z≥0和G≥0的约束条件,wij的设置方式保证价格相近且价格特征数据相似的价格点数据被聚类到同一个聚类中心,因而使得不同价格点的价格区间划分结果平滑。
可选的,停止迭代条件有很多种,只要能够确定两次输出的差异较小即可。
基于此,本申请实施例的所述停止迭代条件包括但不限于下列中的部分或全部:
条件1、将所述指标特征数据矩阵以及每次迭代得到的聚类中心矩阵和聚类系数矩阵输入到指标区间划分模型中,且所述指标区间划分模型相邻两次输出的目标函数值之差的绝对值小于第二阈值;
条件2、迭代次数达到设置的迭代次数最大值。
对于条件1,本申请实施例在指标区间划分模型中引入聚类中心矩阵和聚类系数矩阵,从而可以进一步降低将接近的价格划分到不同子区间的情况出现的次数。
条件1具体可以表示为|Jt-Jt-1|≤θmin,即第二阈值,则表明目标函数前后两次输出的差异较小,则跳出循环迭代求解过程;否则继续下一轮循环迭代求解。若迭代次数达到最大迭代次数Tmax则迭代求解停止。
对于条件2,由于在实际应用中影响指标区间划分模型输出的目标函数值的因素有很多,有可能会出现经过多次迭代后,相邻两次得到的目标函数值之差的绝对值不小于第二阈值,所以这里的可以设置一个迭代允许的最大次数,如果达到最大次数则停止迭代。即For i=1:Tmax:(这里表示从i等于1到T_max循环迭代,其中T_max为预先设置的最大迭代次数)。
3、区间划分。
在第2步迭代结束后,根据指标特征数据矩阵和最后一次得到的聚类系数矩阵,确定所述对象集合中对象的目标指标区间。
具体的,确定所述指标特征数据矩阵中每个目标指标对应的所述停止迭代后最后一次得到的聚类中心矩阵和/或聚类系数矩阵中的系数;
根据确定的所述系数的聚类类别,确定所述对象集合中对象的目标指标区间。
在经过第2步的处理后,可以最优化求解得到Z和G矩阵,其中Z=[z1,z2,...,zk]中的每一列代表的是一个价格区间段的平均价格特征指标值,G=[g1,g2,...,gn]中的每一列代表的是商品类目价格轴上的一个对应于X对应列的价格特征指标的价格点的聚类结果。
下面以根据所述指标特征数据矩阵以及停止迭代后最后一次得到的聚类系数矩阵,确定所述对象集合中对象的目标指标区间为例进行说明,采用聚类中心矩阵确定目标指标区间的方式与采用聚类系数矩阵确定目标指标区间的方式类似,在此不再赘述。
由于在指标区间模型中引入了GGT=Ik的约束条件,因此对于任意一个gi,可以直接选择依据该向量中的最大值确定该向量的聚类类别ck,形式化表达如下:
其中,该聚类类别对应到G中的gi列向量里面第j个元素为该列向量最大值。
基于上面公式(11),可以得到X中每一列所代表的商品类目价格点的聚类类别。依据每个价格点所在的聚类类别信息,可以将整个商品类目价格轴划分为指定的k个相互不重叠的、连续的子价格区间段。
例如:假设G=[g_1,g_2,g_3,g_4,g_5,g_6],按照公式(11),价格点连续性约束得到G中每列对应聚类类别为[c_1,c_1,c_2,c_2,c_3,c_3]。由于[c_1,c_1,c_2,c_2,c_3,c_3]中每个位置都对应[x_1,x_2,x_3,x_4,x_5,x_6]中的对应位置,比如[c_1,c_1,c_2,c_2,c_3,c_3]中的第一个对应[x_1,x_2,x_3,x_4,x_5,x_6]中的第一个,[c_1,c_1,c_2,c_2,c_3,c_3]中的第二个对应[x_1,x_2,x_3,x_4,x_5,x_6]中的第二个,以此类推。从[c_1,c_1,c_2,c_2,c_3,c_3]中可以知道第一个和第二个是一组聚类,第三个和第四个是一组聚类,第五个和第六个是一组聚类,所以将X=[x_1,x_2,x_3,x_4,x_5,x_6],划分为(x_1,x_2),(x_3,x_4),(x_5,x_6)这三组聚类。
因为之前对X进行过数据预处理,使得x_i所对应的价格点p_i,与x_j所对应的价格点p_j具有:若i<=j则p_i<=p_j成立,故X聚类结果(x_1,x_2),(x_3,x_4),(x_5,x_6)自动将商品类目划分为相互不重叠的3个价格子区间。
在实施中,自动划分得到的结果中可能会包含价格跨度较大的区间,实际应用中针对不同的需求,比如需要每个价格子区间的价格跨度尽量比较接近,那么可以对聚类结果中价格跨度较大的商品类目子价格段做适当的后处理,比如将其两端的部分价格点划分到相邻子价格区间。
比如若价格点数据经过合并处理后,包含的价格点数少于需要划分的价格子区间数,可以采用预先设置的价格区间划分规则,对价格轴进行特殊处理。例如按照价格轴跨度,进行均匀等分,生成中间价格切割点数据。
还比如若指标特征数据包含有噪声或者数据突变,导致出现部分价格点划分到其他类别,从而出现价格区间的不连续性。例如价格点的类别为(c1,c2,c1,c1,c2,c2,c2,c3,c3),那么这时候需要使用合适的滤波器对中间突变的c2数据结果进行过滤处理,将其纠正为c1。
在实施中,本申请实施例为用户推荐对象的实体和划分目标指标区间的实体可以是同一个实体,也可以是不同实体。
下面以只使用条件1为例对本申请实施例的方案进行说明。
如图2所示,本申请实施例划分指标区间的完整方法包括:
步骤200、针对任意一个对象集合,根据所述指标集合中的目标指标,将所述对象集合中的对象对应的指标集合进行排序。
步骤201、按顺序判断相邻两个指标集合中的目标指标的差值是否大于第一阈值,如果是,则执行步骤202;否则,执行步骤204。
步骤202、在确定相邻两个指标集合需要进行合并处理后,对相邻两个指标集合进行合并处理。
步骤203、将合并处理后得到的指标集合替换相邻的所述两个指标集合,并返回步骤201。
步骤204、判断是否所有指标集合是否都不需要进行合并处理,如果是,则执行步骤205;否则,返回步骤201。
步骤205、随机初始化得到聚类中心矩阵和聚类系数矩阵。
步骤206、根据指标特征数据矩阵,对最新得到的聚类中心矩阵和聚类系数矩阵进行迭代。
步骤207、将指标特征数据矩、迭代处理后得到的聚类中心矩阵和聚类系数矩阵输入指标区间模型得到目标参数值。
步骤208、判断相邻两次得到的目标参数值之差的绝对值是否小于第二阈值,如果是,则执行步骤209;否则,返回步骤206。
步骤209、确定所述指标特征数据矩阵中每个目标指标对应的所述停止迭代后最后一次得到的聚类中心矩阵和/或聚类系数矩阵中的系数。
步骤210、根据确定的所述系数的聚类类别,确定所述对象集合中对象的目标指标区间。
基于同一发明构思,本申请实施例中还提供了一种进行对象推荐的系统,由于该系统解决问题的原理与本申请实施例进行对象推荐的方法相似,因此该系统的实施可以参见方法的实施,重复之处不再赘述。
如图3所示,本申请实施例进行对象推荐的系统包括:
区间确定模块300,用于确定与用户关联的对象的同一类别的目标指标区间,其中所述目标指标区间是根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定的;
选择模块301,用于从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间;
推荐模块302,用于将确定的区间对应的部分或全部对象推荐给所述用户。
其中,本申请实施例区间确定模块300先确定与用户关联的对象;之后确定关联的对象同一类别的目标指标区间;最后选择模块301确定具体的区间并由推荐模块302进行推荐。
针对不同的应用场景以及设置条件,关联的标准也不相同。
以应用在电商场景为例,假设设置的条件为最近1个月购买过的商品,则与用户关联的对象为用户在电商平台上最近1个月购买的部分或全部商品。
例如目标指标为价格,与用户关联的对象为洗发水,价格是34元,预先会为每种类别的商品价格划分区间。假设洗发水所属的类别为洗护用品,洗护用品的目标指标区间为0~15,16~35,36~70,70以上这几个区间,则价格是34元的洗发水属于16~35这个目标指标区间。
之后确定洗护用品中价格是16~35的所有商品,并将确定的部分或全部商品推荐给所述用户。
具体推荐多少可以根据经验、场景等进行设置,也可以由用户进行设置。如果应用于电商场景,还可以根据商品的销量、好评率等为每个商品计算一个综合得分,并按照分数从高到低的顺序为用户进行商品推荐。
其中,所述系统还包括:
合并处理模块303,用于针对任意一个对象集合,对所述对象集合中的对象对应的指标集合进行合并处理得到指标特征数据矩阵,其中同一个对象集合中的对象属于同一类别;
迭代模块304,用于根据所述指标特征数据矩阵,对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代,直到满足停止迭代条件;
划分模块305,用于根据所述指标特征数据矩阵,以及根据停止迭代后最后一次得到的聚类中心矩阵和/或聚类系数矩阵,确定所述对象集合中对象的目标指标区间。
其中,本申请实施例的方案分为三步:1、数据预处理;2、利用模型确定是否迭代结束;3、区间划分。下面分别进行介绍。
1、数据预处理。
第1步中,合并处理模块303预先按照类别将对象划分为多个集合,每个集合中都包括该集合对应的类别下的对象。
比如应用于商品交易场景,则按照商品类目划分集合,每个集合包括对应类目下的部分或全部商品。例如商品类目为:服装、电子用品等。服装对应的集合中包括属于服装的商品;电子用品对应的集合中包括属于电子用品的商品。
在划分了集合后,合并处理模块303确定一段时间内(比如最近一个月)每个对象的指标集合。
不同的应用场景,指标集合中包括的指标也不相同。
以应用于商品交易场景为例,指标集合包括两类商品指标数据:一类是商品销售指标,包括商品的成交金额和订单量等;另外一类是买家反馈的商品评价指标,包括商品的好评率、商品描述分和商品的纠纷率等。
为了更好地理解本申请实施例的方案,下面的介绍中以应用于商品交易场景为例进行说明,但是并不带代表申请实施例的方案只适用于商品交易场景,任何需要对指标进行区间划分的场景都适用本申请实施例。
以应用于商品交易场景为例:pi表示该商品的价格,依次表示该商品的成交金额、订单量、好评率、商品描述分和商品的纠纷率,这五个不同的商品指标数据。假设某一个商品类目下包含有n个商品,那么该类目商品集合所对应的特征数据集合可以表示为:
由于商品在定价的时候容易选择一些特殊的价格点,比如59和199这类特殊的价格值,因此为了加速后续的计算,可选的一种方式是将同类目下商品价格差异小于给定阈值的商品(即:||pi-pj||≤ε1),进行合并处理。
具体的,所述合并处理模块303根据所述指标集合中的目标指标,将所述对象集合中的对象对应的指标集合进行排序;按顺序判断相邻两个指标集合是否需要进行合并处理;在确定相邻两个指标集合需要进行合并处理后,对相邻两个指标集合进行合并处理;将合并处理后得到的指标集合替换相邻的所述两个指标集合,并返回按顺序判断相邻两个指标集合是否需要进行合并处理的步骤,直到所有指标集合都不需要进行合并处理。
可选的,所述合并处理模块303根据下列方式判断是否需要进行合并处理:
按顺序在确定有相邻两个指标集合中的目标指标的差值大于第一阈值后,确定相邻两个指标集合需要进行合并处理。
2、利用模型确定是否迭代结束。
在第2步中,所述迭代模块304预先会随机初始化聚类中心矩阵和聚类系数矩阵,并根据第1步中得到的指标特征数据矩阵对这两个矩阵进行迭代;每次迭代后得到新的聚类中心矩阵和聚类系数矩阵,并将第1步中得到的指标特征数据矩阵、新的聚类中心矩阵和聚类系数矩阵输入到指标区间模型中,根据指标区间模型输出的目标参数值判断满足停止迭代条件,如果满足,则停止迭代,否则继续迭代。
可选的,所述迭代模块304具体用于,根据下列公式进行迭代:
其中,Gt ij为迭代后得到的聚类系数矩阵;为迭代后的得到的聚类中心矩阵;为上一次迭代得到的聚类系数矩阵,初始迭代时是预先设置的聚类系数矩阵;Zt-1为上一次迭代得到的聚类中心矩阵,初始迭代时是预先设置的聚类中心矩阵;λ1为指标区间模型的正则化参数;X为指标特征数据矩阵;T为迭代次数;Ik为k乘以k的单位矩阵;γ为正则化参数i为矩阵的行数;j为矩阵的列数;M为正交约束系数。
可选的,所述指标区间模型为:
其中,J(Z,G)为目标参数值;X为指标特征数据矩阵;Z为聚类中心矩阵;G为聚类系数矩阵,G=[g1,g2,...,gm];Z≥0,G≥0,GGT=Ik;Ik是k×k的单位矩阵;k为聚类个数;L为拉普拉斯图,L=D-W;D为对角矩阵 ε2是连续约束参数;ε3是指标特征数据相似性约束参数,xi和xj表示X矩阵的第i列和第j列,表示矩阵X的F-范数(即F-norm范数)。
可选的,停止迭代条件有很多种,只要能够确定两次输出的差异较小即可,或者若迭代次数达到最大迭代次数Tmax则迭代求解停止。
基于此,本申请实施例的所述停止迭代条件包括但不限于下列中的部分或全部:
条件1、将所述指标特征数据矩阵以及每次迭代得到的聚类中心矩阵和聚类系数矩阵输入到指标区间划分模型中,且所述指标区间划分模型相邻两次输出的目标函数值之差的绝对值小于第二阈值;
条件2、迭代次数达到设置的迭代次数最大值。
3、区间划分。
在第2步迭代结束后,所述划分模块305根据指标特征数据矩阵和最后一次得到的聚类系数矩阵,确定所述对象集合中对象的目标指标区间。
可选的,所述划分模块305确定所述指标特征数据矩阵中每个目标指标对应的所述停止迭代后最后一次得到的聚类中心矩阵和/或聚类系数矩阵中的系数;根据确定的所述系数的聚类类别,确定所述对象集合中对象的目标指标区间。
在实施中,上述模块可以集成在一个实体中,也可以分布在多个实体中形成一个系统。
可选的,区间确定模块300、选择模块301和推荐模块302可以在一个或多个实体中;合并处理模块303、迭代模块304和划分模块305可以在一个或多个实体中。
以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。
相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或系统使用,或结合指令执行系统、装置或系统使用。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种进行对象推荐的方法,其特征在于,该方法包括:
确定与用户关联的对象的同一类别的目标指标区间,其中所述目标指标区间是根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定的;
从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间;
将确定的区间对应的部分或全部对象推荐给所述用户;
其中,所述指标特征数据矩阵是根据下列方式确定的:
针对任意一个对象集合,对所述对象集合中的对象对应的指标集合进行合并处理得到指标特征数据矩阵,其中同一个对象集合中的对象属于同一类别;
所述对所述对象集合中的对象对应的指标集合进行合并处理得到指标特征数据矩阵,包括:
根据所述指标集合中的目标指标,将所述对象集合中的对象对应的指标集合进行排序;
按顺序判断相邻两个指标集合是否需要进行合并处理;
在确定相邻两个指标集合需要进行合并处理后,对相邻两个指标集合进行合并处理;
将合并处理后得到的指标集合替换相邻的所述两个指标集合,并返回按顺序判断相邻两个指标集合是否需要进行合并处理的步骤,直到所有指标集合都不需要进行合并处理。
2.如权利要求1所述的方法,其特征在于,所述目标指标区间是根据下列方式确定的:
根据所述指标特征数据矩阵,对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代,直到满足停止迭代条件;
根据所述指标特征数据矩阵,以及根据停止迭代后最后一次得到的聚类中心矩阵和聚类系数矩阵,确定所述对象集合中对象的目标指标区间。
3.如权利要求1所述的方法,其特征在于,根据下列方式判断是否需要进行合并处理:
按顺序在确定有相邻两个指标集合中的目标指标的差值大于第一阈值后,确定相邻两个指标集合需要进行合并处理。
4.如权利要求2所述的方法,其特征在于,所述停止迭代条件为下列中的部分或全部:
将所述指标特征数据矩阵以及每次迭代得到的聚类中心矩阵和聚类系数矩阵输入到指标区间划分模型中,且所述指标区间划分模型相邻两次输出的目标函数值之差的绝对值小于第二阈值;
迭代次数达到设置的迭代次数最大值。
5.如权利要求2所述的方法,其特征在于,所述根据所述指标特征数据矩阵,以及根据停止迭代后最后一次得到的聚类中心矩阵和聚类系数矩阵,确定所述对象集合中对象的目标指标区间,包括:
确定所述指标特征数据矩阵中每个目标指标对应的所述停止迭代后最后一次得到的聚类中心矩阵和聚类系数矩阵中的系数;
根据确定的所述系数的聚类类别,确定所述对象集合中对象的目标指标区间。
6.一种进行对象推荐的系统,其特征在于,该系统包括:
区间确定模块,用于确定与用户关联的对象的同一类别的目标指标区间,其中所述目标指标区间是根据指标特征数据矩阵对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代后确定的;
选择模块,用于从确定的目标指标区间中确定与用户关联的对象的目标指标所属的区间;
推荐模块,用于将确定的区间对应的部分或全部对象推荐给所述用户;
其中,所述系统还包括:
合并处理模块,用于针对任意一个对象集合,对所述对象集合中的对象对应的指标集合进行合并处理得到指标特征数据矩阵,其中同一个对象集合中的对象属于同一类别;
所述合并处理模块具体用于:
根据所述指标集合中的目标指标,将所述对象集合中的对象对应的指标集合进行排序;
按顺序判断相邻两个指标集合是否需要进行合并处理;
在确定相邻两个指标集合需要进行合并处理后,对相邻两个指标集合进行合并处理;
将合并处理后得到的指标集合替换相邻的所述两个指标集合,并返回按顺序判断相邻两个指标集合是否需要进行合并处理的步骤,直到所有指标集合都不需要进行合并处理。
7.如权利要求6所述的系统,其特征在于,所述系统还包括:
迭代模块,用于根据所述指标特征数据矩阵,对预先设置的聚类中心矩阵和聚类系数矩阵进行迭代,直到满足停止迭代条件;
划分模块,用于根据所述指标特征数据矩阵,以及根据停止迭代后最后一次得到的聚类中心矩阵聚类系数矩阵,确定所述对象集合中对象的目标指标区间。
8.如权利要求6所述的系统,其特征在于,所述合并处理模块还用于,根据下列方式判断是否需要进行合并处理:
按顺序在确定有相邻两个指标集合中的目标指标的差值大于第一阈值后,确定相邻两个指标集合需要进行合并处理。
9.如权利要求7所述的系统,其特征在于,所述停止迭代条件为下列中的部分或全部:
将所述指标特征数据矩阵以及每次迭代得到的聚类中心矩阵和聚类系数矩阵输入到指标区间划分模型中,且所述指标区间划分模型相邻两次输出的目标函数值之差的绝对值小于第二阈值;
迭代次数达到设置的迭代次数最大值。
10.如权利要求7所述的系统,其特征在于,所述划分模块具体用于:
确定所述指标特征数据矩阵中每个目标指标对应的所述停止迭代后最后一次得到的聚类中心矩阵和聚类系数矩阵中的系数;
根据确定的所述系数的聚类类别,确定所述对象集合中对象的目标指标区间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610977434.6A CN108073578B (zh) | 2016-11-07 | 2016-11-07 | 一种进行对象推荐的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610977434.6A CN108073578B (zh) | 2016-11-07 | 2016-11-07 | 一种进行对象推荐的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108073578A CN108073578A (zh) | 2018-05-25 |
CN108073578B true CN108073578B (zh) | 2021-08-17 |
Family
ID=62153252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610977434.6A Active CN108073578B (zh) | 2016-11-07 | 2016-11-07 | 一种进行对象推荐的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108073578B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110874775A (zh) * | 2018-08-30 | 2020-03-10 | 中兴通讯股份有限公司 | 一种商品推送的方法及装置、设备、存储介质 |
CN111260103A (zh) * | 2018-11-30 | 2020-06-09 | 北京嘀嘀无限科技发展有限公司 | 一种订单信息动态调整方法和装置 |
CN111915115A (zh) * | 2019-05-10 | 2020-11-10 | 北京沃东天骏信息技术有限公司 | 执行策略设置方法和装置 |
CN111695926B (zh) * | 2020-04-20 | 2023-04-07 | 时时同云科技(成都)有限责任公司 | 一种菜品定价方法及装置 |
CN112085328B (zh) * | 2020-08-03 | 2024-05-24 | 北京贝壳时代网络科技有限公司 | 风险评估方法、系统、电子设备及存储介质 |
CN112988845B (zh) * | 2021-04-01 | 2021-11-16 | 湖南机械之家信息科技有限公司 | 在大数据业务场景下的数据信息处理方法及信息服务平台 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276451A (zh) * | 2007-03-28 | 2008-10-01 | 富士通株式会社 | 信息处理装置、信息处理方法和信息处理程序 |
CN101685458A (zh) * | 2008-09-27 | 2010-03-31 | 华为技术有限公司 | 一种基于协同过滤的推荐方法和系统 |
CN103136683A (zh) * | 2011-11-24 | 2013-06-05 | 阿里巴巴集团控股有限公司 | 计算产品参考价格的方法、装置及产品搜索方法、系统 |
CN103729383A (zh) * | 2012-10-16 | 2014-04-16 | 阿里巴巴集团控股有限公司 | 商品信息的推送方法和装置 |
CN104951563A (zh) * | 2015-07-08 | 2015-09-30 | 北京理工大学 | 一种待推荐对象的确定方法及装置 |
CN105574005A (zh) * | 2014-10-10 | 2016-05-11 | 富士通株式会社 | 对包含多个文档的源数据进行聚类的装置和方法 |
CN106022869A (zh) * | 2016-05-12 | 2016-10-12 | 北京邮电大学 | 一种消费对象的推荐方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762227B1 (en) * | 2011-07-01 | 2014-06-24 | Amazon Technologies, Inc. | Automatic product groupings for merchandising |
US20140279208A1 (en) * | 2013-03-14 | 2014-09-18 | Rosie | Electronic shopping system and service |
US20140372197A1 (en) * | 2013-06-14 | 2014-12-18 | Tigerapps | Systems, apparatuses and methods for providing a price point to a consumer for products in an electronic shopping cart of the consumer |
-
2016
- 2016-11-07 CN CN201610977434.6A patent/CN108073578B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276451A (zh) * | 2007-03-28 | 2008-10-01 | 富士通株式会社 | 信息处理装置、信息处理方法和信息处理程序 |
CN101685458A (zh) * | 2008-09-27 | 2010-03-31 | 华为技术有限公司 | 一种基于协同过滤的推荐方法和系统 |
CN103136683A (zh) * | 2011-11-24 | 2013-06-05 | 阿里巴巴集团控股有限公司 | 计算产品参考价格的方法、装置及产品搜索方法、系统 |
CN103729383A (zh) * | 2012-10-16 | 2014-04-16 | 阿里巴巴集团控股有限公司 | 商品信息的推送方法和装置 |
CN105574005A (zh) * | 2014-10-10 | 2016-05-11 | 富士通株式会社 | 对包含多个文档的源数据进行聚类的装置和方法 |
CN104951563A (zh) * | 2015-07-08 | 2015-09-30 | 北京理工大学 | 一种待推荐对象的确定方法及装置 |
CN106022869A (zh) * | 2016-05-12 | 2016-10-12 | 北京邮电大学 | 一种消费对象的推荐方法及装置 |
Non-Patent Citations (2)
Title |
---|
个性化购买力分析及在搜索排序上应用;元涵;《http://www.voidcn.com/article/p-pnppnirj-bgk.html》;20131014;第2-3页 * |
商品个性融会贯通搜索系统的设计与实现;荀智德;《中国优秀硕士学位论文全文数据库 信息科技辑》;20121015(第10期);第2,4-5章 * |
Also Published As
Publication number | Publication date |
---|---|
CN108073578A (zh) | 2018-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108073578B (zh) | 一种进行对象推荐的方法和系统 | |
CN106651542B (zh) | 一种物品推荐的方法及装置 | |
CN107451894B (zh) | 数据处理方法、装置和计算机可读存储介质 | |
CN109087177B (zh) | 向目标用户推荐商品的方法、装置及计算机可读存储介质 | |
JP5976943B2 (ja) | 製品情報の推薦 | |
CN105991397B (zh) | 信息传播方法和装置 | |
CN108446297B (zh) | 一种推荐方法及装置,电子设备 | |
CN111798280B (zh) | 多媒体信息推荐方法、装置和设备及存储介质 | |
KR101567684B1 (ko) | 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법 | |
CN107423430B (zh) | 数据处理方法、装置和计算机可读存储介质 | |
US20200410557A1 (en) | Pricing method and device, and non-transient computer-readable storage medium | |
CN109840796A (zh) | 决策因素分析装置与决策因素分析方法 | |
JP7154411B2 (ja) | 電子処理プラットフォームで行うユーザ個別の品物に関連する値の演算 | |
CN113283671B (zh) | 一种预测补货量的方法、装置、计算机设备及存储介质 | |
CN110782259A (zh) | 一种会员等级管理方法和装置 | |
CN113538101A (zh) | 一种基于人工智能的家装定制方法、系统及存储介质 | |
CN111260449A (zh) | 一种模型训练的方法、商品推荐的方法、装置及存储介质 | |
CN111340522B (zh) | 资源推荐方法、装置、服务器及存储介质 | |
CN110210944A (zh) | 联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统 | |
WO2020104806A1 (en) | Real-time bidding | |
US10049375B1 (en) | Automated graph-based identification of early adopter users | |
US10579752B2 (en) | Generating a model based on input | |
CN107527128B (zh) | 一种广告平台的资源参数确定方法和设备 | |
CN108304407B (zh) | 一种进行对象排序的方法和系统 | |
CN110490682B (zh) | 分析商品属性的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20211102 Address after: Room J01, mezzanine, building 5, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province Patentee after: Zhejiang Feizhu Network Technology Co.,Ltd. Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox Patentee before: ALIBABA GROUP HOLDING Ltd. |
|
TR01 | Transfer of patent right |