CN103886047A - 面向流式数据的分布式在线推荐方法 - Google Patents

面向流式数据的分布式在线推荐方法 Download PDF

Info

Publication number
CN103886047A
CN103886047A CN201410089697.4A CN201410089697A CN103886047A CN 103886047 A CN103886047 A CN 103886047A CN 201410089697 A CN201410089697 A CN 201410089697A CN 103886047 A CN103886047 A CN 103886047A
Authority
CN
China
Prior art keywords
user
article
data
behavior
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410089697.4A
Other languages
English (en)
Other versions
CN103886047B (zh
Inventor
张寅�
边科
王东辉
魏宝刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201410089697.4A priority Critical patent/CN103886047B/zh
Publication of CN103886047A publication Critical patent/CN103886047A/zh
Application granted granted Critical
Publication of CN103886047B publication Critical patent/CN103886047B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种面向流式数据的分布式在线推荐方法。它是采用分布式计算环境,对用户行为产生的流式数据直接进行处理,把用户对物品点击行为数据按用户编号和物品编号进行分组,把对应分组中的数据发送到相应的工作单元中,并根据用户的推荐反馈生成负样本,再用随机梯度下降算法进行统一的矩阵分解训练,采用协同过滤方法计算与用户最近感兴趣的品相似的物品集合,结合原推荐列表作为候选推荐集合,根据训练结果对候选集中的物品排序得到推荐结果。本发明可以面向流式数据进行分布式在线推荐,实时性强,计算性能高。

Description

面向流式数据的分布式在线推荐方法
技术领域
本发明涉及计算机推荐系统,尤其涉及一种面向流式数据的分布式在线推荐方法。
背景技术
随着互联网的飞速发展,各种信息正在爆炸性增长,从而导致“信息过载”的出现,针对这一问题,个性化推荐系统应运而生。个性化推荐系统能够为用户提供很好的决策支持和个性化服务。
协同过滤算法通过数据挖掘和机器学习等方法,根据拥有相似兴趣或行为用户群的喜好为某一用户推荐他感兴趣的东西。ACM在1994年(ACM,1994:175–186)公布了基于用户的协同过滤算法,它找到那些具有相似兴趣的用户,综合这些相似用户对其他物品的行为记录,计算某一用户对物品的喜好程度。World Wide Web在2001年(the10th international conference on WorldWide Web.ACM,2001:285–295)公布了一种基于物品的协同过滤推荐算法,它通过建立用户物品倒排表找到所有被相同用户点击过的物品,计算这些物品之间的相似度,根据物品之间的相似度和用户的行为记录就能得到推荐列表。WebKDD在2000年(the ACM WebKDD2000Web Mining for E-Commerce Workshop,Boston,MA,2000)公布了一种通过奇异值分解的方法进行矩阵分解,对用户物品得分矩阵降维处理,增加数据稠密度,预测用户对物品的感兴趣程度。NIPS在2012年(NIPS,2012:1232-1243)公布了一种分布式随即梯度下降算法,它把训练数据被分成多份,每份训练数据由一个模型训练集群复本来处理,模型的参数统一存储在一系列参数服务器上,每台模型训练服务器只需要访问少量的参数服务器来存取它所负责的模型分区所需的部分参数。
发明内容
本发明的目的是为克服上述现有方法推荐延时性强,计算性能较低等缺点,提供一种实时性强、计算性能高的面向流式数据的分布式在线推荐方法。
面向流式数据的分布式在线推荐方法包括以下步骤:
1)构建分布式计算框架,分布式计算框架包括矩阵分解模块和推荐结果处理模块,矩阵分解模块由若干工作单元组成,其中每个工作单元对应用户行为数据矩阵中的一组数据块;
2)接收用户行为数据并将用户行为数据发送到对应的工作单元,根据该用户的推荐反馈,生成负样本,即用户可能不感兴趣的物品,被推荐的物品中用户没用对其产生行为的有较大概率被选中为负样本;
3)采用分布式随机梯度下降算法,对用户行为数据以及负样本数据进行矩阵分解训练,并保存新的训练结果;
4)采用协同过滤的方法,利用用户行为数据离线计算物品相似度,并定时更新物品相似度数据;
5)对于某个用户,利用物品相似度计算该用户最近感兴趣物品的相似物品集合,把该集合与该用户的原推荐列表集合的并集作为用户的候选推荐集合,并根据步骤3)中的矩阵分解训练结果计算该用户对候选推荐集合中所有物品的预测得分,对得分排序,得到该用户的推荐列表;
6)返回推荐列表,把推荐列表中的物品推荐给用户。
所述的步骤1)为:构建分布式计算框架,分布式计算框架包括矩阵分解模块和推荐结果处理模块,矩阵分解模块接收用户行为数据,根据用户行为数据得到分解矩阵,矩阵分解模块包含一个数据源节点负责获取用户行为数据,一个主节点负责数据分发与任务管理,若干个工作节点负责随机梯度下降运算进行矩阵分解,若干数据节点负责存储分解矩阵数据,推荐结果处理模块包含一个请求节点负责接收推荐请求获取候选集合,一个排序计算节点负责对候选集合进行排序并得到最终的推荐列表。
所述的步骤2)为:接收用户行为数据并将用户行为数据发送到对应的工作单元,根据该用户的推荐反馈,生成负样本,即用户可能不感兴趣的物品,被推荐的物品中用户没用对其产生行为的有较大概率被选中为负样本,假设所有物品的数量为n,推荐反馈中未被该用户接受的物品有m个,它们被选中的概率是普通物品的a倍,a为大于1的整数,选取负样本时在1到n+(a-1)m之间产生随机数x,从小到大扫描推荐反馈中未被该用户接受的物品,每有一个未被该用户接受的物品,则x减去a-1,直到物品编号大于x,此时编号为x的物品被选为负样本。
所述的步骤3)为:工作节点接收任务请求后,向数据节点请求对应的用户分解向量数据和物品分解向量数据,并根据这些数据按递推公式对用户分解向量和物品分解向量进行更新,递推公示如下所示:
u i , k = u i , k + α ( ( R i , j - Σ k = 1 K u i , k v j , k ) v j , k - λu i , k )
v j , k = v j , k + α ( ( R i , j - Σ k = 1 K u i , k v j , k ) u i , k - λ v j , k )
其中,α是学习速率,λ是正则项权重,它们都可以通过反复实验获得,Rij是用户i对物品j的评分,如果是根据用户点击行为进行训练,则当用户i点击物品j时,Rij值为1,uik是用户i的分解向量中第k维的值,vjk是物品j的分解向量中第k维的值,数据更新后再发送到数据节点保存。
所述的步骤5)为:对于某个用户u,利用物品相似度得到该用户最近感兴趣物品的相似物品集合,物品i和物品j之间的相似度wij定义如下:
w ij = | N ( i ) ∩ N ( j ) | | N ( i ) | | N ( j ) |
其中,|N(i)|表示对物品i有过行为的用户集的数量,|N(j)|表示对物品j有过行为的用户集的数量,|N(i)∩N(j)|表同时对物品i和物品j都有过行为的用户集的数量,把相似物品集合定义为集合B,而用户的原推荐结果集合定义为集合S,把B∩S作为候选推荐集合,用矩阵分解得到的结果计算用户对物品的预测兴趣度得分,用户对物品的预测兴趣度得分pu,b计算表达式如下:
pu,b=α(ui1bj1+···+uikbjk)
其中,(ui1,ui2,…,uik)是用户u的分解向量,(bj1,bj2,…,bjk)是物品b的分解向量,α是得分系数,当b∈S时,α>1,当b∈B时,α=1,对得分排序,得到该用户的推荐列表。
本发明与现有技术相比具有的有益效果:
1.该方法能够对流式数据进行实时处理,增量式计算分解矩阵,并同时为用户进行推荐;
2.该方法能够对用户进行在线推荐,能够快速捕捉并响应用户兴趣变化;
3.该方法采用分布式计算,数据处理能力强,计算性能有明显提高。
附图说明
图1是矩阵分解模块的拓扑结构;
图2是矩阵分解模块中工作节点的工作流程。
具体实施方式
面向流式数据的分布式在线推荐方法包括以下步骤:
1)构建分布式计算框架,分布式计算框架包括矩阵分解模块和推荐结果处理模块,矩阵分解模块由若干工作单元组成,其中每个工作单元对应用户行为数据矩阵中的一组数据块;
2)接收用户行为数据并将用户行为数据发送到对应的工作单元,根据该用户的推荐反馈,生成负样本,即用户可能不感兴趣的物品,被推荐的物品中用户没用对其产生行为的有较大概率被选中为负样本;
3)采用分布式随机梯度下降算法,对用户行为数据以及负样本数据进行矩阵分解训练,并保存新的训练结果;
4)采用协同过滤的方法,利用用户行为数据离线计算物品相似度,并定时更新物品相似度数据;
5)对于某个用户,利用物品相似度计算该用户最近感兴趣物品的相似物品集合,把该集合与该用户的原推荐列表集合的并集作为用户的候选推荐集合,并根据步骤3)中的矩阵分解训练结果计算该用户对候选推荐集合中所有物品的预测得分,对得分排序,得到该用户的推荐列表;
6)返回推荐列表,把推荐列表中的物品推荐给用户。
所述的步骤1)为:构建分布式计算框架,分布式计算框架包括矩阵分解模块和推荐结果处理模块,矩阵分解模块接收用户行为数据,根据用户行为数据得到分解矩阵,矩阵分解模块包含一个数据源节点负责获取用户行为数据,一个主节点负责数据分发与任务管理,若干个工作节点负责随机梯度下降运算进行矩阵分解,若干数据节点负责存储分解矩阵数据,推荐结果处理模块包含一个请求节点负责接收推荐请求获取候选集合,一个排序计算节点负责对候选集合进行排序并得到最终的推荐列表。
所述的步骤2)为:接收用户行为数据并将用户行为数据发送到对应的工作单元,根据该用户的推荐反馈,生成负样本,即用户可能不感兴趣的物品,被推荐的物品中用户没用对其产生行为的有较大概率被选中为负样本,假设所有物品的数量为n,推荐反馈中未被该用户接受的物品有m个,它们被选中的概率是普通物品的a倍,a为大于1的整数,选取负样本时在1到n+(a-1)m之间产生随机数x,从小到大扫描推荐反馈中未被该用户接受的物品,每有一个未被该用户接受的物品,则x减去a-1,直到物品编号大于x,此时编号为x的物品被选为负样本。
所述的步骤3)为:工作节点接收任务请求后,向数据节点请求对应的用户分解向量数据和物品分解向量数据,并根据这些数据按递推公式对用户分解向量和物品分解向量进行更新,递推公示如下所示:
u i , k = u i , k + α ( ( R i , j - Σ k = 1 K u i , k v j , k ) v j , k - λu i , k )
v j , k = v j , k + α ( ( R i , j - Σ k = 1 K u i , k v j , k ) u i , k - λ v j , k )
其中,α是学习速率,λ是正则项权重,它们都可以通过反复实验获得,Rij是用户i对物品j的评分,如果是根据用户点击行为进行训练,则当用户i点击物品j时,Rij值为1,uik是用户i的分解向量中第k维的值,vjk是物品j的分解向量中第k维的值,数据更新后再发送到数据节点保存。
所述的步骤5)为:对于某个用户u,利用物品相似度得到该用户最近感兴趣物品的相似物品集合,物品i和物品j之间的相似度wij定义如下:
w ij = | N ( i ) ∩ N ( j ) | | N ( i ) | | N ( j ) |
其中,|N(i)|表示对物品i有过行为的用户集的数量,|N(j)|表示对物品j有过行为的用户集的数量,|N(i)∩N(j)|表同时对物品i和物品j都有过行为的用户集的数量,把相似物品集合定义为集合B,而用户的原推荐结果集合定义为集合S,把B∩S作为候选推荐集合,用矩阵分解得到的结果计算用户对物品的预测兴趣度得分,用户对物品的预测兴趣度得分pu,b计算表达式如下:
pu,b=α(ui1bj1+···+uikbjk)
其中,(ui1,ui2,…,uik)是用户u的分解向量,(bj1,bj2,…,bjk)是物品b的分解向量,α是得分系数,当b∈S时,α>1,当b∈B时,α=1,对得分排序,得到该用户的推荐列表。
实施例
(1)构建Storm分布式计算框架,包括矩阵分解模块和推荐结果处理模块,矩阵分解模块由若干工作单元组成,其中每个单元对应用户物品点击行为数据矩阵中的一组数据块,矩阵分解模块的拓扑结构如图1所示;
(2)当一个用户点击某一物品时,该条记录被发送到对应的工作单元,并根据该用户之前的推荐反馈,生成负样本(即用户可能不感兴趣的物品),其中被推荐而用户没用对其产生行为的物品有较大概率被选中;
(3)工作节点接收到主节点对摸个数据块的训练请求时,首先从数据节点获取与该数据块对应的当前分解矩阵数据块,并根据递推公式对其更新,再把更新后的结果发送回数据节点保存,工作节点的工作流程如图2所示;
(4)采用协同过滤的方法,利用用户行为离线计算物品相似度,并定时更新物品相似度数据;
(5)对于某个用户,利用物品相似度计算得到该用户最近感兴趣物品的相似物品集合,把该集合与该用户原推荐列表集合的并集作为用户的候选推荐集合,并根据步骤3)中的矩阵分解训练结果计算该用户对候选集合中所有物品的预测得分,对得分排序,得到该用户的推荐列表;
(6)返回推荐列表,把推荐列表中的物品推荐给用户。

Claims (5)

1.一种面向流式数据的分布式在线推荐方法,其特征在于包括以下步骤:
1)构建分布式计算框架,分布式计算框架包括矩阵分解模块和推荐结果处理模块,矩阵分解模块由若干工作单元组成,其中每个工作单元对应用户行为数据矩阵中的一组数据块;
2)接收用户行为数据并将用户行为数据发送到对应的工作单元,根据该用户的推荐反馈,生成负样本,即用户可能不感兴趣的物品,被推荐的物品中用户没用对其产生行为的有较大概率被选中为负样本;
3)采用分布式随机梯度下降算法,对用户行为数据以及负样本数据进行矩阵分解训练,并保存新的训练结果;
4)采用协同过滤的方法,利用用户行为数据离线计算物品相似度,并定时更新物品相似度数据;
5)对于某个用户,利用物品相似度计算该用户最近感兴趣物品的相似物品集合,把该集合与该用户的原推荐列表集合的并集作为用户的候选推荐集合,并根据步骤3)中的矩阵分解训练结果计算该用户对候选推荐集合中所有物品的预测得分,对得分排序,得到该用户的推荐列表;
6)返回推荐列表,把推荐列表中的物品推荐给用户。
2.根据权利要求1所述的面向流式数据的分布式在线推荐方法,其特征在于:所述的步骤1)为:构建分布式计算框架,分布式计算框架包括矩阵分解模块和推荐结果处理模块,矩阵分解模块接收用户行为数据,根据用户行为数据得到分解矩阵,矩阵分解模块包含一个数据源节点负责获取用户行为数据,一个主节点负责数据分发与任务管理,若干个工作节点负责随机梯度下降运算进行矩阵分解,若干数据节点负责存储分解矩阵数据,推荐结果处理模块包含一个请求节点负责接收推荐请求获取候选集合,一个排序计算节点负责对候选集合进行排序并得到最终的推荐列表。
3.根据权利要求1所述的面向流式数据的分布式在线推荐方法,其特征在于:所述的步骤2)为:接收用户行为数据并将用户行为数据发送到对应的工作单元,根据该用户的推荐反馈,生成负样本,即用户可能不感兴趣的物品,被推荐的物品中用户没用对其产生行为的有较大概率被选中为负样本,假设所有物品的数量为n,推荐反馈中未被该用户接受的物品有m个,它们被选中的概率是普通物品的a倍,a为大于1的整数,选取负样本时在1到n+(a-1)m之间产生随机数x,从小到大扫描推荐反馈中未被该用户接受的物品,每有一个未被该用户接受的物品,则x减去a-1,直到物品编号大于x,此时编号为x的物品被选为负样本。
4.根据权利要求1所述的面向流式数据的分布式在线推荐方法,其特征在于所述的步骤3)为:工作节点接收任务请求后,向数据节点请求对应的用户分解向量数据和物品分解向量数据,并根据这些数据按递推公式对用户分解向量和物品分解向量进行更新,递推公示如下所示:
u i , k = u i , k + α ( ( R i , j - Σ k = 1 K u i , k v j , k ) v j , k - λu i , k )
v j , k = v j , k + α ( ( R i , j - Σ k = 1 K u i , k v j , k ) u i , k - λ v j , k )
其中,α是学习速率,λ是正则项权重,它们都可以通过反复实验获得,Rij是用户i对物品j的评分,如果是根据用户点击行为进行训练,则当用户i点击物品j时,Rij值为1,uik是用户i的分解向量中第k维的值,vjk是物品j的分解向量中第k维的值,数据更新后再发送到数据节点保存。
5.根据权利要求1所述的面向流式数据的分布式在线推荐方法,其特征在于:所述的步骤5)为:对于某个用户u,利用物品相似度得到该用户最近感兴趣物品的相似物品集合,物品i和物品j之间的相似度wij定义如下:
w ij = | N ( i ) ∩ N ( j ) | | N ( i ) | | N ( j ) |
其中,|N(i)|表示对物品i有过行为的用户集的数量,|N(j)|表示对物品j有过行为的用户集的数量,|N(i)∩N(j)|表同时对物品i和物品j都有过行为的用户集的数量,把相似物品集合定义为集合B,而用户的原推荐结果集合定义为集合S,把B∩S作为候选推荐集合,用矩阵分解得到的结果计算用户对物品的预测兴趣度得分,用户对物品的预测兴趣度得分pu,b计算表达式如下:
pu,b=α(ui1bj1+···+uikbik)
其中,(ui1,ui2,…,uik)是用户u的分解向量,(bj1,bj2,…,bjk)是物品b的分解向量,α是得分系数,当b∈S时,α>1,当b∈B时,α=1,对得分排序,得到该用户的推荐列表。
CN201410089697.4A 2014-03-12 2014-03-12 面向流式数据的分布式在线推荐方法 Active CN103886047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410089697.4A CN103886047B (zh) 2014-03-12 2014-03-12 面向流式数据的分布式在线推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410089697.4A CN103886047B (zh) 2014-03-12 2014-03-12 面向流式数据的分布式在线推荐方法

Publications (2)

Publication Number Publication Date
CN103886047A true CN103886047A (zh) 2014-06-25
CN103886047B CN103886047B (zh) 2017-07-07

Family

ID=50954939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410089697.4A Active CN103886047B (zh) 2014-03-12 2014-03-12 面向流式数据的分布式在线推荐方法

Country Status (1)

Country Link
CN (1) CN103886047B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021483A (zh) * 2014-06-26 2014-09-03 陈思恩 旅客需求推荐方法
WO2016000562A1 (en) * 2014-06-30 2016-01-07 Tencent Technology (Shenzhen) Company Limited Method and apparatus for grouping network service users
CN105608219A (zh) * 2016-01-07 2016-05-25 上海通创信息技术有限公司 一种基于聚类的流式推荐引擎、推荐系统以及推荐方法
CN105843928A (zh) * 2016-03-28 2016-08-10 西安电子科技大学 基于双层矩阵分解的推荐方法
CN106294288A (zh) * 2016-07-27 2017-01-04 中南大学 一种分布式非负矩阵分解方法
CN106326470A (zh) * 2016-08-31 2017-01-11 无锡雅座在线科技发展有限公司 流式大数据的处理方法和装置
CN106851349A (zh) * 2017-03-21 2017-06-13 上海星红桉数据科技有限公司 基于海量跨屏收视行为数据的直播推荐方法
CN106980662A (zh) * 2017-03-21 2017-07-25 上海星红桉数据科技有限公司 基于海量跨屏收视行为数据的用户标签分类方法
CN109241422A (zh) * 2018-08-29 2019-01-18 广东工业大学 一种改进的基于协同过滤算法的用户兴趣度预测方法
CN109614549A (zh) * 2018-12-10 2019-04-12 北京字节跳动网络技术有限公司 用于推送信息的方法和装置
CN110427545A (zh) * 2018-04-26 2019-11-08 中移(苏州)软件技术有限公司 一种信息推送方法及系统
CN110717116A (zh) * 2018-06-27 2020-01-21 北京京东尚科信息技术有限公司 关系网络的链接预测方法及系统、设备、存储介质
CN111047009A (zh) * 2019-11-21 2020-04-21 腾讯科技(深圳)有限公司 事件触发概率预估模型训练方法及事件触发概率预估方法
CN111159578A (zh) * 2019-12-31 2020-05-15 第四范式(北京)技术有限公司 一种推荐对象的方法和系统
CN111695005A (zh) * 2020-06-02 2020-09-22 武汉大势智慧科技有限公司 一种互联网用户访问轨迹行为大数据分析算法的应用方法
WO2021135192A1 (zh) * 2019-12-31 2021-07-08 华南理工大学 一种基于用户好奇心的贝叶斯个性化排序推荐方法
CN114065044A (zh) * 2021-11-23 2022-02-18 聚好看科技股份有限公司 一种内容推荐优化方法及服务器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101931638A (zh) * 2009-06-25 2010-12-29 李冰 一种建立向互联网用户推荐数据内容服务的方法
CN102231166A (zh) * 2011-07-12 2011-11-02 浙江大学 基于社会上下文的协同推荐方法
US20120054233A1 (en) * 2007-12-21 2012-03-01 Napo Enterprises, Llc Method and system for generating media recommendations in a distributed environment based on tagging play history information with location information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120054233A1 (en) * 2007-12-21 2012-03-01 Napo Enterprises, Llc Method and system for generating media recommendations in a distributed environment based on tagging play history information with location information
CN101931638A (zh) * 2009-06-25 2010-12-29 李冰 一种建立向互联网用户推荐数据内容服务的方法
CN102231166A (zh) * 2011-07-12 2011-11-02 浙江大学 基于社会上下文的协同推荐方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021483A (zh) * 2014-06-26 2014-09-03 陈思恩 旅客需求推荐方法
CN104021483B (zh) * 2014-06-26 2017-08-25 陈思恩 旅客需求推荐方法
US9817885B2 (en) 2014-06-30 2017-11-14 Tencent Technology (Shenzhen) Company Limited Method and apparatus for grouping network service users
WO2016000562A1 (en) * 2014-06-30 2016-01-07 Tencent Technology (Shenzhen) Company Limited Method and apparatus for grouping network service users
CN105608219A (zh) * 2016-01-07 2016-05-25 上海通创信息技术有限公司 一种基于聚类的流式推荐引擎、推荐系统以及推荐方法
CN105608219B (zh) * 2016-01-07 2019-06-18 上海通创信息技术有限公司 一种基于聚类的流式推荐引擎、推荐系统以及推荐方法
CN105843928A (zh) * 2016-03-28 2016-08-10 西安电子科技大学 基于双层矩阵分解的推荐方法
CN106294288A (zh) * 2016-07-27 2017-01-04 中南大学 一种分布式非负矩阵分解方法
CN106294288B (zh) * 2016-07-27 2018-09-14 中南大学 一种分布式非负矩阵分解方法
CN106326470A (zh) * 2016-08-31 2017-01-11 无锡雅座在线科技发展有限公司 流式大数据的处理方法和装置
CN106851349A (zh) * 2017-03-21 2017-06-13 上海星红桉数据科技有限公司 基于海量跨屏收视行为数据的直播推荐方法
CN106980662A (zh) * 2017-03-21 2017-07-25 上海星红桉数据科技有限公司 基于海量跨屏收视行为数据的用户标签分类方法
CN110427545B (zh) * 2018-04-26 2021-11-02 中移(苏州)软件技术有限公司 一种信息推送方法及系统
CN110427545A (zh) * 2018-04-26 2019-11-08 中移(苏州)软件技术有限公司 一种信息推送方法及系统
CN110717116A (zh) * 2018-06-27 2020-01-21 北京京东尚科信息技术有限公司 关系网络的链接预测方法及系统、设备、存储介质
CN110717116B (zh) * 2018-06-27 2023-12-05 北京京东尚科信息技术有限公司 关系网络的链接预测方法及系统、设备、存储介质
CN109241422A (zh) * 2018-08-29 2019-01-18 广东工业大学 一种改进的基于协同过滤算法的用户兴趣度预测方法
CN109614549A (zh) * 2018-12-10 2019-04-12 北京字节跳动网络技术有限公司 用于推送信息的方法和装置
CN111047009B (zh) * 2019-11-21 2023-05-23 腾讯科技(深圳)有限公司 事件触发概率预估模型训练方法及事件触发概率预估方法
CN111047009A (zh) * 2019-11-21 2020-04-21 腾讯科技(深圳)有限公司 事件触发概率预估模型训练方法及事件触发概率预估方法
WO2021135192A1 (zh) * 2019-12-31 2021-07-08 华南理工大学 一种基于用户好奇心的贝叶斯个性化排序推荐方法
CN111159578A (zh) * 2019-12-31 2020-05-15 第四范式(北京)技术有限公司 一种推荐对象的方法和系统
CN111159578B (zh) * 2019-12-31 2023-10-13 第四范式(北京)技术有限公司 一种推荐对象的方法和系统
CN111695005A (zh) * 2020-06-02 2020-09-22 武汉大势智慧科技有限公司 一种互联网用户访问轨迹行为大数据分析算法的应用方法
CN114065044A (zh) * 2021-11-23 2022-02-18 聚好看科技股份有限公司 一种内容推荐优化方法及服务器

Also Published As

Publication number Publication date
CN103886047B (zh) 2017-07-07

Similar Documents

Publication Publication Date Title
CN103886047A (zh) 面向流式数据的分布式在线推荐方法
Ni et al. Perceive your users in depth: Learning universal user representations from multiple e-commerce tasks
CN109902708B (zh) 一种推荐模型训练方法及相关装置
Wang et al. Online interactive collaborative filtering using multi-armed bandit with dependent arms
Li et al. An unbiased offline evaluation of contextual bandit algorithms with generalized linear models
US10482482B2 (en) Predicting behavior using features derived from statistical information
Tang et al. Predicting individual retweet behavior by user similarity: a multi-task learning approach
CN104268292B (zh) 画像系统的标签词库更新方法
CN108021929A (zh) 基于大数据的移动端电商用户画像建立与分析方法及系统
CN106251174A (zh) 信息推荐方法及装置
US20170323268A1 (en) Scalable response prediction using personalized recommendation models
EP2960849A1 (en) Method and system for recommending an item to a user
CN103593353A (zh) 信息搜索方法、展示信息排序权重值确定方法及其装置
CN111506820B (zh) 推荐模型、方法、装置、设备及存储介质
Ifada et al. Tensor-based item recommendation using probabilistic ranking in social tagging systems
CN110175895A (zh) 一种物品推荐方法及装置
CN110647995A (zh) 规则训练方法、装置、设备及存储介质
Grolman et al. Utilizing transfer learning for in-domain collaborative filtering
CN112800109A (zh) 一种信息挖掘方法及系统
Ozcaglar et al. Entity personalized talent search models with tree interaction features
US20190385062A1 (en) System and method for quality assurance of media analysis
Avila Clemenshia et al. Click through rate prediction for display advertisement
CN106033332B (zh) 一种数据处理方法及设备
Jose et al. DistilledCTR: Accurate and scalable CTR prediction model through model distillation
Shi et al. Predicting the next scenic spot a user will browse on a tourism website based on markov prediction model

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant