CN110866805A - 一种推荐对象的方法和系统 - Google Patents
一种推荐对象的方法和系统 Download PDFInfo
- Publication number
- CN110866805A CN110866805A CN201911106511.0A CN201911106511A CN110866805A CN 110866805 A CN110866805 A CN 110866805A CN 201911106511 A CN201911106511 A CN 201911106511A CN 110866805 A CN110866805 A CN 110866805A
- Authority
- CN
- China
- Prior art keywords
- user
- objects
- users
- label
- target user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Abstract
提供了一种推荐对象的方法和系统,所述方法包括:对多个用户中的每个用户构建用户画像,基于用户画像的每个标签获得对象‑标签数据,其中,对象‑标签数据是指基于标签统计的所述多个用户中具有所述标签的用户与对象之间的关联信息;针对所述多个用户中的目标用户构建候选集,其中,构建候选集的步骤包括:针对目标用户的用户画像中的每个标签在对应的对象‑标签数据中选取排名最高的第一数量个对象,对基于用户画像选择的对象进行合并和去重来构建与目标用户对应的候选集;对候选集进行筛选以构建推荐集;以及向目标用户展示推荐集中的对象。
Description
技术领域
本发明涉及数据挖掘领域,提供了一种推荐对象的方法和系统。
背景技术
在大数据时代,每天都会产生大量的数据。例如,这些数据包含了不同用户的特征、不同对象(例如,商品、服务、虚拟商品等)的特征以及用户与对象之间的关联信息(例如,购买/点击/收藏)。用合适的方法对大量的数据进行分析,构建推荐系统,从而为不同的用户推荐不同的对象,进而为用户提供更好的服务。
当前的推荐系统分为“召回”和“排序”两个模块。“召回”指的是:为了减少“排序”模块的计算量,从大量对象(例如,数量级为千万级别的商品)中选出一部分对象(例如,数量级为百级别的商品)。“排序”则是按照用户与对象的匹配程度进行打分,然后再按照分数来排序,将分数高的对象推荐给对应的用户。
召回模块通常采用“协同过滤”方法,但是“协同过滤”仅仅只能从数据角度来考虑用户之间的相似度,最终得到的相似用户是所有特征维度的综合影响结果,并因此忽略了用户单个维度之间的关系。进一步地说,传统的“协同过滤”通常只能从对象所有特征综合维度来召回一部分对象,这不利于推荐对象的多样性。
此外,传统的推荐系统计算完用户与对象的匹配程度后便进行“排序”操作,“排序”完成后便按照排序后的结果将对象按照匹配度从高往低进行推荐。这种方法在一定时间之内,对同一个用户很有可能推荐相同的对象,同样不利于推荐的多样性。
发明内容
本发明的目的在于提供一种推荐对象的方法和系统,以便在用户量和商品量较大的情况下,在保证推荐准确率的前提下,提供推荐商品的多样性。
本发明提供了一种推荐对象的方法,所述方法包括:对多个用户中的每个用户构建用户画像,基于用户画像的每个标签获得对象-标签数据,其中,对象-标签数据是指基于标签统计的所述多个用户中具有所述标签的用户与对象之间的关联信息;针对所述多个用户中的目标用户构建候选集;对候选集进行筛选以构建推荐集;以及向目标用户展示推荐集中的对象。其中,构建候选集的步骤包括:针对目标用户的用户画像中的每个标签在对应的对象-标签数据中选取排名最高的第一数量个对象,对基于目标用户的用户画像选择的对象进行合并和去重来构建与目标用户对应的候选集。
在根据发明构思的实施例中,对多个用户中的每个用户构建用户画像的步骤采用聚类的方式来实现。
在根据发明构思的实施例中,聚类的方式采用K平均算法来实现。
在根据发明构思的另一实施例中,对多个用户中的每个用户构建用户画像的步骤采用专家规则的方式来实现。
在根据发明构思的另一实施例中,针对所述多个用户中的目标用户构建候选集的步骤还包括:从全局数据中选取排名最高的第二数量个对象,其中,所述全局数据是指所述多个用户与对象之间的关联信息;从用户历史数据中选取排名最高的第三数量个对象,其中,所述用户历史数据是指目标用户与对象之间的关联信息;并且将第二数量个对象和第三数量个对象以及基于目标用户的用户画像选择的对象进行合并和去重来构建与目标用户对应的候选集。
在根据发明构思的实施例中,所述方法还包括:对全部对象进行聚类以构建对象类别。
在根据发明构思的实施例中,对全部对象进行聚类以构建对象类别的方法采用K平均算法来实现。
在根据发明构思的实施例中,对候选集进行筛选以构建推荐集的步骤包括:按照对象类别对候选集中的对象进行分类和排序,在每个类中选取排名最高的第四数量个对象并将所选的对象合并以构建推荐集。
在根据发明构思的实施例中,向目标用户展示推荐集中的对象的步骤包括:基于目标用户与推荐集中的对象之间的匹配程度来计算对象的展示概率,并以展示概率向目标用户展示所述对象。
在根据发明构思的实施例中,所述展示概率满足下式:
其中,pi表示第i对象的展示概率,A表示任意正数,N表示所述推荐集中的对象总数,scorei、scorej分别表示所述目标用户与第i对象、第j对象之间的匹配程度。
本发明的另一方面提供了一种推荐对象的系统,所述系统包括:用户画像构建单元,用于对多个用户中的每个用户构建用户画像,基于用户画像的每个标签获得对象-标签数据,其中,对象-标签数据是指基于标签统计的所述多个用户中具有所述标签的用户与对象之间的关联信息;候选集构建单元,针对所述多个用户中的目标用户构建候选集,其中,候选集构建单元包括第一选取单元和合并单元,所述第一选取单元针对目标用户的用户画像中的每个标签在对应的对象-标签数据中选取排名最高的第一数量个对象,所述合并单元对第一选取单元选取的对象进行合并和去重来构建与目标用户对应的候选集;推荐集构建单元,对候选集进行筛选以构建推荐集;以及展示单元,向目标用户展示推荐集中的对象。
在根据发明构思的实施例中,用户画像构建单元采用聚类的方式来对多个用户中的每个用户构建用户画像。
在根据发明构思的实施例中,所述聚类的方式采用K平均算法来实现。
在根据发明构思的另一实施例中,用户画像构建单元采用专家规则的方式来对多个用户中的每个用户构建用户画像。
在根据发明构思的另一实施例中,候选集构建单元还包括:第二选取单元,从全局数据中选取排名最高的第二数量个对象,其中,所述全局数据是指所述多个用户与对象之间的关联信息;以及第三选取单元,从用户历史数据中选取排名最高的第三数量个对象,其中,所述用户历史数据是指目标用户与对象之间的关联信息;并且其中,合并单元将第一选取单元、第二选取单元第三选取单元选取对象进行合并和去重来构建与目标用户对应的候选集。
在根据发明构思的实施例中,所述系统还包括:对象分类单元,所述对象分类单元对全部对象进行聚类以构建对象类别。
在根据发明构思的实施例中,对象分类单元采用K平均算法来对全部对象进行聚类。
在根据发明构思的实施例中,所述推荐集构建单元按照对象类别对候选集中的对象进行分类和排序,并且在每个类中选取排名最高的第四数量个对象并将所选的对象合并以构建推荐集。
在根据发明构思的实施例中,所述展示单元基于目标用户与推荐集中的对象之间的匹配程度来计算所述对象的展示概率,并以所述展示概率向目标用户展示所述对象。
在根据发明构思的实施例中,所述展示概率满足下式:
其中,pi表示第i对象的展示概率,A表示任意正数,N表示所述推荐集中的对象总数,scorei、scorej分别表示所述目标用户与第i对象、第j对象之间的匹配程度。
本发明的另一方面提供了一种计算机可读存储介质,其中,当所述计算机指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的推荐对象的方法。
本发明的另一方面提供了一种包括至少一个计算装置和至少一个存储指令的存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的推荐对象的方法。
根据本发明的一个或多个方面,推荐对象的方法和系统基于用户画像召回对象,丰富了召回对象的候选集,并且进一步提高了召回对象的多样性。
根据本发明的一个或多个方面,推荐对象的方法和系统基于多种途径(例如,基于全局数据、用户历史数据和用户画像)召回对象,进一步组合得到召回对象的候选集,从而提高了召回对象的多样性。
根据本发明的一个或多个方面,对候选集中的对象进行聚类,然后从不同类中选出对象,使得只保留同类对象中的一部分以构建推荐集,以使推荐集保持一定的多样性。
根据本发明的一个或多个方面,以概率显示推荐集中的对象,使得对目标用户来说每次展示的对象都不完全一样,从而可以在保证推荐准确率的同时,保证推荐对象的多样性。
附图说明
从下面结合附图对本公开实施例的详细描述中,本公开的这些和/或其他方面和优点将变得更加清楚并更容易理解,其中:
图1是示出根据本公开的示例性实施例的推荐对象的方法的流程图;
图2是根据实施例示出图1中的针对目标用户构建候选集的流程图;
图3是根据另一实施例示出图1中的针对目标用户构建候选集的流程图;
图4是示出根据本公开的示例性实施例的推荐对象的系统的框图;
图5是示出根据本公开的另一示例性实施例的推荐对象的系统的框图;以及
图6是示出应用根据本公开的示例性实施例的利用图4中的系统进行推荐的环境的示意图。
具体实施方式
下面参照附图详细描述本发明的实施例。所述实施例的示例在附图中示出,其中,相同的标号始终指的是相同的部件。以下将通过参照附图来说明所述实施例,以便解释本发明。
图1是示出根据本公开的示例性实施例的推荐对象的方法的流程图,图2是根据实施例示出图1中的针对目标用户构建候选集的步骤S20的流程图。
参照图1,在步骤S10中,对多个用户中的每个用户构建用户画像,基于所述用户画像的每个标签获得对象-标签数据,其中,所述对象-标签数据是指基于标签统计的所述多个用户中具有所述标签的用户与对象之间的关联信息。其中,用户画像是用于对用户的属性进行描绘的特征,每个用户的用户画像包括多个标签,标签可以对特定用户的某项特征进行抽象分类和概括,标签值可以具有分类性。例如,标签的类别可以是“性别”、“年龄”、“收入”、“地区”、“爱好”、“访问终端”等。在这样的分类下,用户的用户画像可以包括如下标签:“男”、“低年龄”、“高收入”、“北京”、“足球”、“iPhone”等。其中,“高收入”标签可以指年收入超过特定数值(例如,年收入超过50万元)的用户,“低年龄”标签可以指其年龄小于特定年龄(例如,小于20岁)的用户。在本公开的实施例中,“对象”可以是商品、服务或虚拟商品。关联信息可以指用户对对象产生的行为。例如,用户行为数据集可以包括“用户对对象的购买数据”、“用户对对象的浏览记录”、“用户对对象的收藏记录”等。
构建用户画像可以采用聚类的方式来实现,例如,可以采用K平均算法来实现。Kmeans算法是目前工业界最常用的聚类算法之一,并且具有实现简单,容易并行,计算速度快等优点。在另一实施例中,聚类的方式也可以通过专家规则的方式来实现。
为了便于理解,下面将举例以进行更详细地说明。例如,表1为用户与对象的关联信息:
表1用户与对象之间的关联信息
用户 | 对象 | 点击次数 |
u1 | p1 | 10 |
u1 | p2 | 8 |
u1 | p3 | 1 |
u1 | p4 | 1 |
u1 | p5 | 0 |
u2 | p1 | 1 |
u2 | p2 | 1 |
u2 | p3 | 10 |
u2 | p4 | 8 |
u2 | p5 | 1 |
u3 | p1 | 1 |
u3 | p2 | 10 |
u3 | p3 | 1 |
u3 | p4 | 8 |
u3 | p5 | 1 |
u4 | p1 | 10 |
u4 | p2 | 0 |
u4 | p3 | 1 |
u4 | p4 | 1 |
u4 | p5 | 10 |
其中,用户与对象之间的关联信息可以是点击次数、购买次数、浏览次数、搜索次数、关注次数中的至少一种或它们的组合。在本实施例中,为了便于说明,表1中仅列出了点击次数。
在本实施例中,在步骤S10中,对多个用户中的每个用户构建用户画像,构建的用户画像如表2所示:
表2用户画像
用户 | 用户画像 |
u1 | 高收入 |
u2 | 高收入 |
u3 | 低年龄 |
u4 | 低年龄 |
为了便于说明,表1中仅选取“高收入”和“低年龄”这两个标签,每个用户仅选取一个标签。然而,发明构思的实施例不限于此。例如,每个用户可以包括诸如“性别”、“地区”、“爱好”、“访问终端”等的标签类别,并且可以包括多个标签。
由表2可知,用户u1、u2属于“高收入”标签,用户u3、u4属于“低年龄”标签。
接下来,基于所述用户画像的每个标签获得对象-标签数据,统计各个标签下不同对象的点击情况,如表3所示:
表3对象-标签数据
标签 | 点击情况 |
高收入 | p1(11次)、p2(9次)、p3(11次)、p4(9次)、p5(1次) |
低年龄 | p1(11次)、p2(10次)、p3(2次)、p4(9次)、p5(11次) |
在步骤S20中,针对所述多个用户中的目标用户构建候选集。
参照图2,在步骤S21中,针对目标用户的用户画像中的每个标签在对应的对象-标签数据中选取排名最高的第一数量个对象。在步骤S24中,对基于目标用户的用户画像选择的对象进行合并和去重来构建与目标用户对应的候选集。
下面基于步骤S10中构建的用户画像以及基于所述用户画像的每个标签获得对象-标签数据对步骤S20进行详细描述。
在步骤S21中,针对每个标签选取排名最高的2个(即,第一数量为2)对象,也就是说,通过步骤S21获得基于用户画像召回(选取)的对象。如表4所示:
表4基于目标用户的用户画像选取对象
标签 | 点击情况 | 基于用户画像召回的对象 |
高收入 | p1(11次)、p2(9次)、p3(11次)、p4(9次)、p5(1次) | p1、p3 |
低年龄 | p1(11次)、p2(10次)、p3(2次)、p4(9次)、p5(11次) | p1、p5 |
在步骤S24中,对基于目标用户的用户画像召回的对象进行合并和去重来构建与目标用户对应的候选集。如表5所示:
表5候选集
用户 | 候选集 |
u1 | p1、p3 |
u2 | p1、p3 |
u3 | p1、p5 |
u4 | p1、p5 |
由于在步骤S20中,基于目标用户的用户画像来召回对象,从而丰富了召回对象的候选集,并且进一步提高了召回对象的多样性。
然后,在步骤S30中,对候选集进行筛选以构建推荐集。例如,在本实施例中,候选集中的全部对象均被选为推荐集中的对象。
接着,在步骤S40中,向目标用户展示推荐集中的对象。例如,在本实施例中,可以向用户u1展示对象p1、p3,可以向用户u3展示对象p1、p5。
图3是根据另一实施例示出图1中的针对目标用户构建候选集的流程图。
在参照图3描述的推荐对象的方法中,除了用图3中示出的步骤S20’替代图1中示出的步骤S20之外,其余步骤与参照图1描述的步骤基本相同或相似,在这里将省略其重复的描述。
参照图3中示出的步骤S20’,图3中示出的步骤S21与参照图2描述的步骤S21基本相同或相似,在这里将省略其重复的描述。
在步骤S22中,以对象维度,对多个用户(例如,全部用户)与对象之间的关联信息进行统计,用户与对象之间的关联信息可以是点击次数/购买/浏览/搜索/关注等一系列指标。为了举例方便,在本实施例中仅对点击次数进行统计。通过对表1进行统计,可以得到全部用户对每个对象的全局点击次数,如表6所示:
表6全局点击次数统计
对象 | 全局点击次数 |
p1 | 22 |
p2 | 19 |
p3 | 13 |
p4 | 18 |
p5 | 12 |
可以从全局数据中选取排名最高的2个(即,第二数量为2)对象p1、p2作为全局最热对象。也就是说,通过步骤S22获得基于全局数据召回(选取)的对象。
在步骤S23中,针对每个目标用户,从该目标用户的历史数据中选取排名最高的2个(即,第三数量为2)对象,其中,所述用户历史数据是指该目标用户与对象之间的关联信息。也就是说,通过步骤S23获得基于用户历史数据召回(选取)的对象,结果如表7所示:
表7基于用户历史
用户 | 用户历史最热数据召回的对象 |
u1 | p1、p2 |
u2 | p3、p4 |
u3 | p2、p4 |
u4 | p1、p5 |
在步骤S24’中,对基于目标用户的用户画像召回的对象进行合并和去重来构建与目标用户对应的候选集,结果如表8所示:
表8候选集
需要说明的是,为了描述方便,这里第一数量、第二数量和第三数量均设定为2,然而,发明构思的实施例不限于此,根据实际需求,第一数量、第二数量和第三数量可被设定为任意正整数,此外,第一数量、第二数量和第三数量可以彼此相同或不同。
在本实施例中,由于在步骤S20’中基于多种途径(例如,基于用户画像、全局数据和用户历史数据)召回对象,进一步组合得到召回对象的候选集,从而提高了召回对象的多样性。
在根据发明构思的另一实施例中,推荐对象的方法还包括:对全部对象进行聚类以构建对象类别(未示出)。例如,对全部对象进行聚类以构建对象类别的方法采用K平均算法来实现。
聚类的方法可以使用对象的特征进行。对象的特征可以指仅与对象相关特征,例如,“对象的价格”、“对象的类别”、“对象的折扣”、“对象的品牌”等。例如,对象在特征维度上的数据情况如表9所示:
表9对象的特征
对象 | 价格 | 折扣 |
p1 | 20 | 0.9 |
p2 | 19 | 0.8 |
p3 | 10 | 0.5 |
p4 | 1 | 0.1 |
p5 | 2 | 0.2 |
对p1、p2、p3、p4、p5这五个对象进行聚类后得到的结果可以如表10所示:
表10对象的类别
对象 | 价格 | 折扣 | 类别 |
p1 | 20 | 0.9 | 1 |
p2 | 19 | 0.8 | 1 |
p3 | 10 | 0.5 | 2 |
p4 | 1 | 0.1 | 3 |
p5 | 2 | 0.2 | 3 |
参照表10,p1、p2属于类别1,p3属于类别2,p4、p5属于类别3。
在根据发明构思的另一实施例中,参照图1,对候选集进行筛选以构建推荐集的步骤S30可以包括按照所述对象类别对所述候选集中的对象进行分类和排序,在每个类中选取排名最高的第四数量个对象并将所选的对象合并以构建所述推荐集。具体来说,在本实施例中,按照对象的类别对候选集进行筛选以得到推荐集,从而确保推荐集中的对象尽量属于不同的类别,进而保证对象的多样性。
为了说明以上步骤,可以按照上面表10示出的对象的类别对步骤S20’的获得的候选集进行筛选。在本实施例中,在同类对象中只取排名最高(例如,按照表6中的全局点击次数最高)的一个(即,第四数量为1)对象。对表8中示出的候选集进行筛选后的获得的推荐集如表11所示:
表11推荐集
用户 | 候选集 | 推荐集 |
u1 | p1、p2、p3 | p1、p3 |
u2 | p1、p2、p3、p4 | p1、p3、p4 |
u3 | p1、p2、p3、p4 | p1、p4 |
u4 | p1、p2、p5 | p1、p5 |
需要说明的是,第四数量不限于上述实施例,在其他实施例中,第四数量可被设定为任意正整数。
在根据发明构思的另一实施例中,参照图1,向目标用户展示推荐集中的对象的步骤(步骤S40)包括:基于目标用户与推荐集中的对象之间的匹配程度来计算所述对象的展示概率,并以展示概率向目标用户展示所述对象。
例如,目标用户与对象之间的匹配程度可以采用机器学习方法训练得到的模型来预测目标用户接受所述对象的程度进行评分。
在示例实施例中,所述展示概率满足下式:
其中,pi表示第i对象的展示概率,A表示任意正数,N表示所述推荐集中的对象总数,scorei、scorej分别表示所述目标用户与第i对象、第j对象之间的匹配程度。在示例实施例中,A可以是自然常数e。在另一实施例中,A可以是2或10。
在传统的推荐系统中,通常向用户推荐评分最高的特定数量个对象,当用户和对象特征变化较小时,对用户展示的对象往往相同,这不利于对象的多样性。在根据本公开的示例性实施例中,可以通过设定展示概率的方式每次向用户推荐匹配度较高且有一定概率(例如,设定的展示概率)不同的对象。如此,不仅可以保证匹配程度大的对象有更大的概率向用户展示,满足用户的兴趣点,而且非活跃的对象也有一定的概率进行展示,非活跃的对象也有机会变为活跃对象,从而提高展示的对象的多样性,另外每次给同一个用户展示的对象有可能不同,某种程度上可以满足用户的猎奇心,从而提高用户粘性。
图4是示出根据本公开的示例性实施例的推荐对象的系统10的框图。
作为示例,可由图4所示的系统10来执行图1和图2所示的方法。
如图4所示,系统10可以是用来推荐对象的系统。系统10可以包括:用户画像构建单元110、候选集构建单元130和推荐集构建单元140和展示单元150。
用户画像构建单元110用于对多个用户中的每个用户构建用户画像,基于所述用户画像的每个标签获得对象-标签数据,其中,所述对象-标签数据是指基于标签统计的所述多个用户中具有所述标签的用户与对象之间的关联信息。用户画像构建单元110可以被配置为用来执行参照图1中的步骤S10描述的方法,因此在此省略冗余的描述。
候选集构建单元130针对所述多个用户中的目标用户构建候选集,其中,候选集构建单元130包括第一选取单元210和合并单元240,第一选取单元210针对目标用户的用户画像中的每个标签在对应的对象-标签数据中选取排名最高的第一数量个对象,合并单元240对第一选取单元210选取的对象进行合并和去重来构建与所述目标用户对应的候选集。候选集构建单元130可以被配置为用来执行参照图1中的步骤S20描述的方法,第一选取单元210和合并单元240可以分别被配置为用来执行参照图2中的步骤S21和步骤S24,因此在此省略冗余的描述。
推荐集构建单元140对候选集进行筛选以构建推荐集,推荐集构建单元140可以被配置为用来执行参照图1中的步骤S30描述的方法,因此在此省略冗余的描述。
展示单元150向所述目标用户展示所述推荐集中的对象,展示单元150可以被配置为用来执行参照图1中的步骤S40描述的方法,因此在此省略冗余的描述。
在另一示例实施例中,系统10还可以包括对象分类单元120。对象分类单元120可以对全部对象进行聚类以构建对象类别。例如,对象分类单元120采用K平均算法来对全部对象进行聚类。聚类的方法可以使用对象的特征进行。对象的特征可以指仅与对象相关特征,例如,“对象的价格”、“对象的类别”、“对象的折扣”、“对象的品牌”等。
图5是示出根据本公开的另一示例性实施例的推荐对象的系统10’的框图。
作为示例,除了图5中示出的候选集构建单元130’替代图4中示出的候选集构建单元130之外,其余构件与参照图4描述的构件基本相同或相似,在这里将省略其重复的描述。
候选集构建单元130’包括第一选取单元210、第二选取单元220、第三选取单元230和合并单元240’。
图5中示出的第一选取单元210与参照图4描述的第一选取单元210基本相同或相似,在这里将省略其重复的描述。
第二选取单元220从全局数据中选取排名最高的第二数量个对象,其中,全局数据是指所述多个用户与对象之间的关联信息。第二选取单元220被配置为用来执行参照图3中的步骤S22,因此在此省略冗余的描述。
第三选取单元230从用户历史数据中选取排名最高的第三数量个对象,其中,用户历史数据是指目标用户与对象之间的关联信息。第三选取单元230被配置为用来执行参照图3中的步骤S23,因此在此省略冗余的描述。
合并单元240’将第一选取单元、第二选取单元第三选取单元选取对象进行合并和去重来构建与目标用户对应的所述候选集。合并单元240’被配置为用来执行参照图3中的步骤S24’,因此在此省略冗余的描述。
图6是示出应用根据本公开的示例性实施例的利用图4中的系统进行推荐的环境的示意图。
图6所示的环境可以包括推荐对象的系统10、网络20以及用户终端30和40。这里,应注意,用户终端30和用户终端40分别可指代多个终端。
其中,系统10可以是上面参照图4和图5描述的系统10和系统10’,该系统10可以部署在实体的IT设施上,也可部署在专门提供推荐服务的实体的IT设施上。网络20可以包括路由、交换机、服务器、云服务器等。用户终端30和40可以包括可以访问网络20的任何类型的电子产品,诸如蜂窝电话、智能电话、平板计算机、可穿戴装置、个人数字助理(PDA)、便携式多媒体播放器(PMP)、数字相机、音乐播放器、便携式游戏控制台、导航系统、数字电视、3D电视、个人计算机(PC)、家用电器、膝上型计算机等。用户终端30和40还可以是台式计算机、工作站计算机或服务器。用户终端30和40通过以太网协议、基于互联网协议(IP)的协议、基于传输控制协议(TCP)的协议、基于用户数据报协议(UDP)的协议、基于远程直接内存访问(RDMA)协议的协议以及基于NVMe-oF协议的协议或它们的组合来访问网络20和/或网络20中的服务器。
进一步地讲,用户终端30可以是对象提供方,并将对象上传至网络20和/或网络20中的服务器以形成对象数据。用户终端40可以向网络20和/或网络20中的服务器发出推荐请求,随后网络20和/或网络20中的服务器向系统10转发推荐请求,以及/或者用户终端40可以直接向系统10发出推荐请求。
在系统10收到推荐请求后,可以基于存储于自身内部、网络20和/或网络20中的服务器中的对象和与用户终端40对应的用户来生成推荐集,并按照展示概率向客户展示推荐集中的对象。系统10可直接或经由第三方,通过网络20向用户终端40展示推荐集中的对象。生成推荐集以及展示对象的方法可以与上面参照图1、图2和图3描述的方法相同,在此不再赘述。
根据本发明示例性实施例的推荐对象的系统10所包括的各单元可被分别配置为执行特定功能的软件、硬件、固件或上述项的任意组合。例如,这些装置可对应于专用的集成电路,也可对应于纯粹的软件代码,还可对应于软件与硬件相结合的模块。此外,这些装置所实现的一个或多个功能也可由物理实体设备(例如,处理器、客户端或服务器等)中的组件来统一执行。
在本发明示例性实施例中还提出一种推荐对象的计算装置。所述计算装置可以部署在服务器或客户端中,也可以部署在分布式网络环境中的节点装置上。此外,所述计算装置可以是PC计算机、平板装置、个人数字助理、智能手机、web应用或其他能够执行上述指令集合的装置。
这里,所述计算装置并非必须是单个的计算装置,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。计算装置还可以是集成控制系统或系统管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子装置。
在所述计算装置中,处理器可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制,处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
根据本发明示例性实施例的推荐对象的方法中所描述的某些操作可通过软件方式来实现,某些操作可通过硬件方式来实现,此外,还可通过软硬件结合的方式来实现这些操作。
处理器可运行存储在存储部件之一中的指令或代码,其中,所述存储部件还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,所述网络接口装置可采用任何已知的传输协议。
存储部件可与处理器集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储部件可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储部件和处理器可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得处理器能够读取存储在存储部件中的文件。
此外,所述计算装置还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。计算装置的所有组件可经由总线和/或网络而彼此连接。
根据本发明示例性实施例的推荐对象的方法所涉及的操作可被描述为各种互联或耦合的功能块或功能示图。然而,这些功能块或功能示图可被均等地集成为单个的逻辑装置或按照非确切的边界进行操作。
例如,如上所述,提供一种包括至少一个计算装置和至少一个存储指令的存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如参照图1、图2和图3描述的步骤。
也就是说,可由上述的计算装置来执行图1、图2和图3所示的推荐对象的方法。由于上述在图1、图2和图3中已经对推荐对象的方法进行了详细介绍,本发明对此部分的内容不再赘述。
可选地,上述推荐对象的系统和计算装置可被集成在平台方(例如,电商网站)的服务器中,例如,可被集成在提供对象(例如,商品或服务)的应用程序的服务器中。除此之外,也可以可被集成在第三方服务器中以向用户提供推荐集和展示概率,再由平台方来根据推荐集和展示概率向用户进行展示(例如,由第三方服务器提供的API接口)。
应理解,根据本发明示例性实施例的推荐对象的方法可通过记录在计算可读介质上的程序来实现,例如,根据本发明的示例性实施例,可提供一种存储指令的计算机可读介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如参照图1、图2和图3描述的步骤。
上述计算机可读介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,应注意,所述计算机程序还可用于执行除了上述步骤以外的附加步骤或者在执行上述步骤时执行更为具体的处理,这些附加步骤和进一步处理的内容已经参照图1、图2和图3进行了描述,这里为了避免重复将不再进行赘述。
应注意,根据本发明示例性实施例的推荐对象的系统可完全依赖计算机程序的运行来实现相应的功能,即,各个装置与计算机程序的功能架构中与各步骤相应,使得整个系统通过专门的软件包(例如,lib库)而被调用,以实现相应的功能。
另一方面,根据本发明示例性实施例的推荐对象的系统所包括的各个单元也可以通过硬件、软件、固件、中间件、微代码或其任意组合来实现。当以软件、固件、中间件或微代码实现时,用于执行相应操作的程序代码或者代码段可以存储在诸如存储介质的计算机可读介质中,使得处理器可通过读取并运行相应的程序代码或者代码段来执行相应的操作。
以上描述了本发明的各示例性实施例,应理解,上述描述仅是示例性的,并非穷尽性的,本发明不限于所披露的各示例性实施例。在不偏离本发明的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。因此,本发明的保护范围应该以权利要求的范围为准。
Claims (10)
1.一种推荐对象的方法,所述方法包括:
对多个用户中的每个用户构建用户画像,基于所述用户画像的每个标签获得对象-标签数据,其中,所述对象-标签数据是指基于标签统计的所述多个用户中具有所述标签的用户与对象之间的关联信息;
针对所述多个用户中的目标用户构建候选集,其中,构建所述候选集的步骤包括:针对所述目标用户的用户画像中的每个标签在对应的对象-标签数据中选取排名最高的第一数量个对象,对基于所述目标用户的所述用户画像选择的对象进行合并和去重来构建与所述目标用户对应的所述候选集;
对所述候选集进行筛选以构建推荐集;以及
向所述目标用户展示所述推荐集中的对象。
2.根据权利要求1所述的方法,其中,所述对多个用户中的每个用户构建用户画像的步骤采用聚类的方式来实现。
3.根据权利要求2所述的方法,其中,所述聚类的方式采用K平均算法来实现。
4.根据权利要求1所述的方法,其中,所述对多个用户中的每个用户构建用户画像的步骤采用专家规则的方式来实现。
5.根据权利要求1所述的方法,其中,所述针对所述多个用户中的目标用户构建候选集的步骤还包括:
从全局数据中选取排名最高的第二数量个对象,其中,所述全局数据是指所述多个用户与对象之间的关联信息;
从用户历史数据中选取排名最高的第三数量个对象,其中,所述用户历史数据是指所述目标用户与对象之间的关联信息;并且
将所述第二数量个对象和所述第三数量个对象以及基于所述目标用户的所述用户画像选择的所述对象进行合并和去重来构建与所述目标用户对应的所述候选集。
6.根据权利要求1所述的方法,所述方法还包括:对全部对象进行聚类以构建对象类别。
7.根据权利要求6所述的方法,其中,所述对全部对象进行聚类以构建对象类别的方法采用K平均算法来实现。
8.一种推荐对象的系统,所述系统包括:
用户画像构建单元,用于对多个用户中的每个用户构建用户画像,基于所述用户画像的每个标签获得对象-标签数据,其中,所述对象-标签数据是指基于标签统计的所述多个用户中具有所述标签的用户与对象之间的关联信息;
候选集构建单元,针对所述多个用户中的目标用户构建候选集,其中,候选集构建单元包括第一选取单元和合并单元,所述第一选取单元针对所述目标用户的用户画像中的每个标签在对应的对象-标签数据中选取排名最高的第一数量个对象,所述合并单元对第一选取单元选取的对象进行合并和去重来构建与所述目标用户对应的所述候选集;
推荐集构建单元,对所述候选集进行筛选以构建推荐集;以及
展示单元,向所述目标用户展示所述推荐集中的对象。
9.一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1至7中的任一权利要求所述的方法。
10.一种包括至少一个计算装置和至少一个存储指令的存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1至7中的任一权利要求所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911106511.0A CN110866805A (zh) | 2019-11-13 | 2019-11-13 | 一种推荐对象的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911106511.0A CN110866805A (zh) | 2019-11-13 | 2019-11-13 | 一种推荐对象的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110866805A true CN110866805A (zh) | 2020-03-06 |
Family
ID=69654269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911106511.0A Pending CN110866805A (zh) | 2019-11-13 | 2019-11-13 | 一种推荐对象的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110866805A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112231555A (zh) * | 2020-10-12 | 2021-01-15 | 中国平安人寿保险股份有限公司 | 基于用户画像标签的召回方法、装置、设备及存储介质 |
CN112507153A (zh) * | 2021-01-29 | 2021-03-16 | 上海众旦信息科技有限公司 | 用于图像检索的方法、计算设备和计算机存储介质 |
CN113344613A (zh) * | 2021-05-26 | 2021-09-03 | 北京奇艺世纪科技有限公司 | 一种数据匹配的方法、装置、电子设备及存储介质 |
CN113407816A (zh) * | 2020-03-17 | 2021-09-17 | 北京达佳互联信息技术有限公司 | 对象推荐方法、装置、电子设备及存储介质 |
CN116226539A (zh) * | 2023-05-04 | 2023-06-06 | 浙江保融科技股份有限公司 | 一种自动化内容推荐方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199872A (zh) * | 2014-08-19 | 2014-12-10 | 北京搜狗科技发展有限公司 | 一种信息推荐的方法以及装置 |
US9535996B1 (en) * | 2012-08-30 | 2017-01-03 | deviantArt, Inc. | Selecting content objects for recommendation based on content object collections |
CN108073659A (zh) * | 2016-11-18 | 2018-05-25 | 腾讯科技(深圳)有限公司 | 一种婚恋对象推荐方法及装置 |
CN109769128A (zh) * | 2018-12-25 | 2019-05-17 | 北京达佳互联信息技术有限公司 | 视频推荐方法、视频推荐装置和计算机可读存储介质 |
-
2019
- 2019-11-13 CN CN201911106511.0A patent/CN110866805A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9535996B1 (en) * | 2012-08-30 | 2017-01-03 | deviantArt, Inc. | Selecting content objects for recommendation based on content object collections |
CN104199872A (zh) * | 2014-08-19 | 2014-12-10 | 北京搜狗科技发展有限公司 | 一种信息推荐的方法以及装置 |
CN108073659A (zh) * | 2016-11-18 | 2018-05-25 | 腾讯科技(深圳)有限公司 | 一种婚恋对象推荐方法及装置 |
CN109769128A (zh) * | 2018-12-25 | 2019-05-17 | 北京达佳互联信息技术有限公司 | 视频推荐方法、视频推荐装置和计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
吴斌: "《网络科学与计算》", 31 August 2019 * |
王正友等: "大数据时代基于用户画像的视频精准推荐", 《电子商务》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113407816A (zh) * | 2020-03-17 | 2021-09-17 | 北京达佳互联信息技术有限公司 | 对象推荐方法、装置、电子设备及存储介质 |
CN112231555A (zh) * | 2020-10-12 | 2021-01-15 | 中国平安人寿保险股份有限公司 | 基于用户画像标签的召回方法、装置、设备及存储介质 |
CN112231555B (zh) * | 2020-10-12 | 2023-09-15 | 中国平安人寿保险股份有限公司 | 基于用户画像标签的召回方法、装置、设备及存储介质 |
CN112507153A (zh) * | 2021-01-29 | 2021-03-16 | 上海众旦信息科技有限公司 | 用于图像检索的方法、计算设备和计算机存储介质 |
CN113344613A (zh) * | 2021-05-26 | 2021-09-03 | 北京奇艺世纪科技有限公司 | 一种数据匹配的方法、装置、电子设备及存储介质 |
CN113344613B (zh) * | 2021-05-26 | 2023-09-01 | 北京奇艺世纪科技有限公司 | 一种数据匹配的方法、装置、电子设备及存储介质 |
CN116226539A (zh) * | 2023-05-04 | 2023-06-06 | 浙江保融科技股份有限公司 | 一种自动化内容推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110941740B (zh) | 视频推荐方法及计算机可读存储介质 | |
CN110866805A (zh) | 一种推荐对象的方法和系统 | |
CN109697629B (zh) | 产品数据推送方法及装置、存储介质、计算机设备 | |
US20180288177A1 (en) | Methods and systems for activity-based recommendations | |
US20220114199A1 (en) | System and method for information recommendation | |
JP5717858B2 (ja) | テキストセットの照合 | |
CN111461841B (zh) | 物品推荐方法、装置、服务器及存储介质 | |
WO2020238502A1 (zh) | 物品推荐方法及装置、电子设备及存储介质 | |
US9043351B1 (en) | Determining search query specificity | |
US20080288491A1 (en) | User segment suggestion for online advertising | |
US20150254714A1 (en) | Systems and methods for keyword suggestion | |
US9088811B2 (en) | Information providing system, information providing method, information providing device, program, and information storage medium | |
CN111159578B (zh) | 一种推荐对象的方法和系统 | |
US20200118033A1 (en) | Method for approximate k-nearest-neighbor search on parallel hardware accelerators | |
CN110569446B (zh) | 一种构建推荐对象候选集的方法和系统 | |
CN111967914A (zh) | 基于用户画像的推荐方法、装置、计算机设备和存储介质 | |
CN113268645A (zh) | 信息召回方法、模型训练方法、装置、设备及存储介质 | |
CN113032668A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
Salmani et al. | Hybrid movie recommendation system using machine learning | |
US8903817B1 (en) | Determining search relevance from user feedback | |
US11256703B1 (en) | Systems and methods for determining long term relevance with query chains | |
CN111445302A (zh) | 商品排序方法、系统及装置 | |
US11373210B2 (en) | Content interest from interaction information | |
CN113515701A (zh) | 信息推荐方法及装置 | |
CN112579896A (zh) | 一种信息推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |