CN105843860B - 一种基于并行item-based协同过滤算法的微博关注推荐方法 - Google Patents

一种基于并行item-based协同过滤算法的微博关注推荐方法 Download PDF

Info

Publication number
CN105843860B
CN105843860B CN201610153763.9A CN201610153763A CN105843860B CN 105843860 B CN105843860 B CN 105843860B CN 201610153763 A CN201610153763 A CN 201610153763A CN 105843860 B CN105843860 B CN 105843860B
Authority
CN
China
Prior art keywords
project
user
data
microblog users
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610153763.9A
Other languages
English (en)
Other versions
CN105843860A (zh
Inventor
袁东风
徐秀珊
张艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201610153763.9A priority Critical patent/CN105843860B/zh
Publication of CN105843860A publication Critical patent/CN105843860A/zh
Application granted granted Critical
Publication of CN105843860B publication Critical patent/CN105843860B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于并行item‑based协同过滤算法的微博关注推荐方法,首先,获取微博用户互动行为数据及微博用户关注行为数据;其次,从这些数据中提取出微博用户互动行为偏好数据及微博用户关注行为偏好数据,分别存储在HDFS上;再次,采用Hadoop的MapReduce框架与HDFS架构,对item‑based协同过滤算法进行并行化设计,并对上述提取出的微博用户互动行为偏好数据及微博用户关注行为偏好数据的进行挖掘分析,找出和用户已经关注过的项目最相似的项目,并过滤掉用户已经关注的项目,将其推荐给目标用户。本发明解决了在非传统场景下item‑based协同过滤算法的应用,不再依赖于显示的评分数据。提高了推荐的个性化。

Description

一种基于并行item-based协同过滤算法的微博关注推荐方法
技术领域
本发明涉及一种基于并行item-based协同过滤算法的微博关注推荐方法,属于推荐系统、数据挖掘技术领域。
背景技术
随着互联网的普及和社交网络的快速发展,微博已经成为最受欢迎的社交应用之一。在信息过载的时代,用户很难从海量信息中找到感兴趣的关注对象(可以是人、机构或者群组)。因此,抓住用户的兴趣点并有针对性地向用户推荐潜在感兴趣的关注对象是一个至关重要的问题。协同过滤算法是在个性化推荐系统中应用最广泛的算法。其中,基于项目的协同过滤算法的基本思想是可以根据用户已知的确定性偏好来找到此用户相关的喜好。
传统协同过滤算法更多用于推荐电影、商品等项目,然而在微博系统中,项目不再是普通的物品而是人、机构或者群体;历史行为数据不再是直接能表现用户倾向的显示评分数据,而是用户转发、评论、好友关系等隐式数据。因此,如何将微博隐式数据转化为用户偏好也是本发明所考虑的问题。目前,传统的微博关注推荐更倾向于向用户推荐粉丝众多的大V账号或者根据“朋友的朋友”进行推荐。然而,这些推荐关注对象虽然有较好的流行性,但是却没有考虑用户的个人偏好,因此缺乏个性化。
随着微博数据量的急剧增长,在利用item-based协同过滤算法计算项目之间的相似性和进行预测的时候,单机集中式计算已经不能满足推荐系统对于推荐效率的要求。
发明内容
针对现有技术的不足,本发明公开了一种基于并行item-based协同过滤算法的微博关注推荐方法;
首先,获取微博用户互动行为数据及微博用户关注行为数据;其次,从这些数据中提取出微博用户互动行为偏好数据及微博用户关注行为偏好数据,分别存储在HDFS上;再次,采用Hadoop的MapReduce框架与HDFS架构,对item-based协同过滤算法进行并行化设计,并对上述提取出的微博用户互动行为偏好数据及微博用户关注行为偏好数据的进行挖掘分析,找出和用户已经关注过的项目最相似的项目,并过滤掉用户已经关注的项目,将其推荐给目标用户。
术语解释
1、item-based协同过滤算法,也称基于项目或基于物品的协同过滤算法。算法思想是给用户推荐那些和他们之前喜欢的项目相似的项目。该算法基于以下假设:项目A和项目B具有很大的相似度是因为喜欢项目A的用户大都也喜欢项目B。因此,可以通过分析用户的行为记录来计算项目之间的相似度。
2、MapReduce,是一种并行编程模式,包括Map阶段和Reduce阶段。Map阶段主要实现将切片的数据并行化处理,而Reduce阶段实现将Map阶段的结果进行汇总,整个过程中输入输出均以<key,value>的形式进行计算。数据传输形式如下:
Map阶段:<K1,V1>→list<K2,V2>
Reduce阶段:<K2,list(V2)>→list<K3,V3>
MapReduce的输入是经过分割的HDFS文件块的<K1,V1>键值对,其中,K1为数据偏离原文件首行的数值;V1是Text类型,是该行的文本内容;Map阶段根据<K1,V1>进行相关计算,输出多个<K2,V2>,经过合并和排序,将相同key下的所有value进行相关处理后发送到Reduce阶段,输出最后的<K3,V3>到HDFS上。
3、HDFS,是指分布式文件系统。采用主从(Master/Slave)结构模型,一个HDFS集群是由一个NameNode和若干个DataNode组成的。文件被分成若干个数据块,存放在一组DataNode上。NameNode执行文件系统的命名空间操作,DataNode负责处理文件系统客户端的文件读写请求,并在DataNode的统一调动下进行数据块的创建、删除和复制工作。
本发明的技术方案为:
一种基于并行item-based协同过滤算法的微博关注推荐方法,具体步骤包括:
(1)获取微博用户互动行为数据及微博用户关注行为数据,微博用户互动行为数据包括用户ui、项目Ij、转发次数retwwetj、提到次数@j和评论次数commentj,微博用户关注行为数据包括用户ui、项目Ij
(2)从步骤(1)获取的微博用户互动行为数据及微博用户关注行为数据中提取用户偏好;步骤(2)将隐式反馈转化成用户偏好的目的是从用户的行为特征中发现其中隐藏的偏好信息,并基于此进行推荐。
①将步骤(1)获取的微博用户互动行为数据转换为微博用户互动行为偏好数据;微博用户互动行为偏好数据包括用户ui、项目Ij、P(uiIj),P(uiIj)是指用户ui对项目Ij的偏好值,求取P(uiIj)的公式如式(I)所示:
P(uiIj)=αm(uiIj)+βc(uiIj)+χr(uiIj) (I)
式(I)中,α+β+χ=1,m(uiIj)是用户ui对项目Ij提到次数与用户ui提到总次数的比值,c(uiIj)是用户ui对项目Ij评论次数与用户ui评论行为总次数的比值,r(uiIj)是用户ui对项目Ij转发次数与用户ui转发行为总次数的比值;
②将步骤(1)获取的微博用户关注行为数据转换为微博用户关注行为偏好数据,微博用户关注行为偏好数据包括用户ui、项目Ij、用户ui与项目Ij之间的偏好值,若用户ui关注项目Ij,用户ui与项目Ij之间的偏好值为1.0,否则,用户ui与项目Ij之间的偏好值为0.0;
③将步骤①及步骤②得到的数据分别存储在HDFS上;
(3)利用并行item-based协同过滤算法对目标用户产生推荐:
④获取用户矩阵:以步骤③存在HDFS上的文件为输入;输入为<offset,(ui,Ij,pij)>,offset是文件位置偏移量,(ui,Ij,pij)是文件中的文本行,ui表示用户、Ij表示项目和pij表示偏好值;对于微博用户互动行为偏好数据,pij=P(uiIj);对于微博用户关注行为偏好数据,pij为1.0或者0.0;Map阶段,用户ui为key,(Ij,pij)为value,输出<ui,(Ij,pij)>的键值对;Reduce阶段,将相同key值的value进行聚合,形成<ui,list(Ij,pij)>的键值对;
⑤构建共现矩阵并求出项目相似度
A、对于微博用户互动行为偏好数据,项目相似度的计算公式如式(II)、式(III)所示:
式(II)、式(III)中,Im、In分别是指项目Im、项目In,ui是指对项目Im、项目In都有过互动行为的用户,U是指对项目Im、项目In都有过互动行为的用户总数,PuiIm代表用户ui对项目Im的偏好值,PuiIn代表用户ui对项目In的偏好值,dotIm×In是指对项目Im、项目In都有过互动行为的所有用户的偏好值乘积的和;normsIm是指对应项目Im的所有偏好值的平方和,normsIn是指对应项目In的所有偏好值的平方和,SimiIm×In是指项目Im与项目In的相似度;
B、对于微博用户关注行为偏好数据,项目相似度的计算公式如式(IV)所示:
式(IV)中,|N(Io)|是关注项目Io的用户数,|N(Ip)|是关注项目Ip的用户数,|N(Io)∩N(Ip)是同时关注项目Io和项目Ip的用户数;
⑥生成项目相似度矩阵
将步骤(2)求取的微博用户互动行为偏好数据的项目相似度及微博用户关注行为偏好数据的项目相似度作为输入,即输入为<(Ii,Ij),SimiIi×Ij>,以某一项目为key,与该项目相似的项目发送到同一个reduce节点,输出为<Ii,list(Ij:SimiIi×Ij))>,得到互动相似度列表矩阵和关注相似度列表矩阵,并存储在可共享的存储平台上;
⑦生成用户-项目相似度矩阵
将步骤④求取的用户矩阵和步骤⑥求得的项目相似度矩阵进行拼接,Map阶段根据项目进行聚合,将与该项目互动过的用户、用户对该项目的偏好以及该项目的邻近项目聚合在一起,输出形式为<u,(list(Ij:SimiIi×Ij))>,u为目标用户,Ii为该用户已经关注的一个项目,Ij为待推荐给用户的项目,SimiIi×Ij是项目Ii和项目Ij之间的相似度。
⑧输出推荐结果
将步骤⑦中按照用户互动行为数据和用户关注行为数据生成的用户-项目相似度矩阵按照项目相似度从高到低排序;根据用户互动行为数据得到前N个项目,生成TOPN互动推荐数据A;根据用户关注行为数据得到前N个项目,生成TOPN关注推荐数据B;取A和B的交集,作为最后的推荐结果。
根据本发明优选的,α=0.4,β=0.4,χ=0.2。
根据本发明优选的,所述步骤(1)中,利用爬取工具从新浪微博平台抓取数据,经过对数据进行清洗、集成、变换,收集大量微博用户互动行为数据及微博用户关注行为数据,并存入mysql数据库中。
根据本发明优选的,N=20。
本发明的有益效果为:
1、将隐式反馈转换为用户偏好,解决了在非传统场景下item-based协同过滤算法的应用,不再依赖于显示的评分数据。
2、目前,传统的微博关注推荐更倾向于向用户推荐粉丝众多的大V账号或者根据“朋友的朋友”进行推荐。然而,这些推荐关注对象虽然有较好的流行性,但是却没有考虑用户的个人偏好,因此缺乏个性化。将微博用户互动行为数据和用户关注行为数据作为向用户推荐关注对象的依据,提高了推荐的个性化。
3、将item-based协同过滤算法在Hadoop平台上实现,利用并行化编程计算模型MapReduce和分布式文件系统HDFS,提高了算法的效率和可扩展性,能够满足大数据场景下对推荐系统实时性和可扩展性的需求。
附图说明
图1是本发明所述方法的总体流程图;
图2是本发明所述item-based协同过滤算法基本原理图;
图3是本发明所述MapReduce并行化处理框架流程图。
具体实施方式
下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。
实施例
一种基于并行item-based协同过滤算法的微博关注推荐方法,具体步骤包括:
(1)利用爬取工具从新浪微博平台抓取数据,经过对数据进行清洗、集成、变换,收集大量微博用户互动行为数据及微博用户关注行为数据,并存入mysql数据库中;微博用户互动行为数据包括用户ui、项目Ij、转发次数retwwetj、提到次数@j和评论次数commentj,微博用户关注行为数据包括:用户ui、项目Ij
(2)从步骤(1)获取的微博用户互动行为数据及微博用户关注行为数据中提取用户偏好;步骤(2)将隐式反馈转化成用户偏好的目的是从用户的行为特征中发现其中隐藏的偏好信息,并基于此进行推荐。
①将步骤(1)获取的微博用户互动行为数据转换为微博用户互动行为偏好数据;微博用户互动行为偏好数据包括用户ui、项目Ij、P(uiIj),P(uiIj)是指用户ui对项目Ij的偏好值,求取P(uiIj)的公式如式(I)所示:
P(uiIj)=αm(uiIj)+βc(uiIj)+χr(uiIj) (I)
式(I)中,α+β+χ=1,α=0.4,β=0.4,χ=0.2。m(uiIj)是用户ui对项目Ij提到次数与用户ui提到总次数的比值,c(uiIj)是用户ui对项目Ij评论次数与用户ui评论行为总次数的比值,r(uiIj)是用户ui对项目Ij转发次数与用户ui转发行为总次数的比值;
②将步骤(1)获取的微博用户关注行为数据转换为微博用户关注行为偏好数据,微博用户关注行为偏好数据包括用户ui、项目Ij、用户ui与项目Ij之间的偏好值,若用户ui关注项目Ij,用户ui与项目Ij之间的偏好值为1.0,否则,用户ui与项目Ij之间的偏好值为0.0;
③将步骤①及步骤②得到的数据分别存储在HDFS上;
(3)利用并行item-based协同过滤算法对目标用户产生推荐:所述item-based协同过滤算法基本原理图如图2所示。
④获取用户矩阵:以步骤③存在HDFS上的文件为输入;输入为<offset,(ui,Ij,pij)>,offset是文件位置偏移量,(ui,Ij,pij)是文件中的文本行,ui表示用户、Ij表示项目和pij表示偏好值;对于微博用户互动行为偏好数据,pij=P(uiIj);对于微博用户关注行为偏好数据,pij为1.0或者0.0;Map阶段,用户ui为key,(Ij,pij)为value,输出<ui,(Ij,pij)>的键值对;Reduce阶段,将相同key值的value进行聚合,形成<ui,list(Ij,pij)>的键值对;MapReduce并行化处理框架流程图如图3所示。
⑤构建共现矩阵并求出项目相似度
A、对于微博用户互动行为偏好数据,项目相似度的计算公式如式(II)、式(III)所示:
式(II)、式(III)中,Im、In分别是指项目Im、项目In,ui是指对项目Im、项目In都有过互动行为的用户,U是指对项目Im、项目In都有过互动行为的用户总数,PuiIm代表用户ui对项目Im的偏好值,PuiIn代表用户ui对项目In的偏好值,dotIm×In是指对项目Im、项目In都有过互动行为的所有用户的偏好值乘积的和;normsIm是指对应项目Im的所有偏好值的平方和,normsIn是指对应项目In的所有偏好值的平方和,SimiIm×In是指项目Im与项目In的相似度;
B、对于微博用户关注行为偏好数据,项目相似度的计算公式如式(IV)所示:
式(IV)中,|N(Io)|是关注项目Io的用户数,|N(Ip)|是关注项目Ip的用户数,|N(Io)∩N(Ip)是同时关注项目Io和项目Ip的用户数;
⑥生成项目相似度矩阵
将步骤(2)求取的微博用户互动行为偏好数据的项目相似度及微博用户关注行为偏好数据的项目相似度作为输入,即输入为<(Ii,Ij),SimiIi×Ij>,以某一项目为key,与该项目相似的项目发送到同一个reduce节点,输出为<Ii,list(Ij:SimiIi×Ij))>,得到互动相似度列表矩阵和关注相似度列表矩阵,并存储在可共享的存储平台上;
⑦生成用户-项目相似度矩阵
将步骤④求取的用户矩阵和步骤⑥求得的项目相似度矩阵进行拼接,Map阶段根据项目进行聚合,将与该项目互动过的用户、用户对该项目的偏好以及该项目的邻近项目聚合在一起,输出形式为<u,(list(Ij:SimiIi×Ij))>其中u为目标用户,Ii为该用户已经关注的一个项目,Ij为待推荐给用户的项目,SimiIi×Ij是项目Ii和项目Ij之间的相似度。
⑧输出推荐结果
将步骤⑦中按照用户互动行为数据和用户关注行为数据生成的用户-项目相似度矩阵按照项目相似度从高到低排序;根据用户互动行为数据得到前N个项目,生成“TOPN互动推荐数据A”;根据用户关注行为数据得到前N个项目,生成“TOPN关注推荐数据B”;取A和B的交集,作为最后的推荐结果。N=20。
本发明所述方法的总体流程图如图1所示。

Claims (4)

1.一种基于并行item-based协同过滤算法的微博关注推荐方法,其特征在于,具体步骤包括:
(1)获取微博用户互动行为数据及微博用户关注行为数据,微博用户互动行为数据包括用户ui、项目Ij、转发次数retwwetj、提到次数@j和评论次数commentj,微博用户关注行为数据包括:用户ui、项目Ij
(2)从步骤(1)获取的微博用户互动行为数据及微博用户关注行为数据中提取用户偏好;
①将步骤(1)获取的微博用户互动行为数据转换为微博用户互动行为偏好数据;微博用户互动行为偏好数据包括用户ui、项目Ij、P(uiIj),P(uiIj)是指用户ui对项目Ij的偏好值,求取P(uiIj)的公式如式(Ⅰ)所示:
P(uiIj)=αm(uiIj)+βc(uiIj)+χr(uiIj) (Ⅰ)
式(Ⅰ)中,α+β+χ=1,m(uiIj)是用户ui对项目Ij提到次数与用户ui提到总次数的比值,c(uiIj)是用户ui对项目Ij评论次数与用户ui评论行为总次数的比值,r(uiIj)是用户ui对项目Ij转发次数与用户ui转发行为总次数的比值;
②将步骤(1)获取的微博用户关注行为数据转换为微博用户关注行为偏好数据,微博用户关注行为偏好数据包括用户ui、项目Ij、用户ui与项目Ij之间的偏好值,若用户ui关注项目Ij,用户ui与项目Ij之间的偏好值为1.0,否则,用户ui与项目Ij之间的偏好值为0.0;
③将步骤①及步骤②得到的数据分别存储在HDFS上;
(3)利用并行item-based协同过滤算法对目标用户产生推荐:
④获取用户矩阵:以步骤③存在HDFS上的文件为输入;输入为<offset,(ui,Ij,pij)>,offset是文件位置偏移量,(ui,Ij,pij)是文件中的文本行,ui表示用户、Ij表示项目和pij表示偏好值;对于微博用户互动行为偏好数据,pij=P(uiIj);对于微博用户关注行为偏好数据,pij为1.0或者0.0;Map阶段,用户ui为key,(Ij,pij)为value,输出<ui,(Ij,pij)>的键值对;Reduce阶段,将相同key值的value进行聚合,形成<ui,list(Ij,pij)>的键值对;
⑤构建共现矩阵并求出项目相似度
A、对于微博用户互动行为偏好数据,项目相似度的计算公式如式(II)、式(Ⅲ)所示:
式(II)、式(Ⅲ)中,Im、In分别是指项目Im、项目In,ui是指对项目Im、项目In都有过互动行为的用户,U是指对项目Im、项目In都有过互动行为的用户总数,PuiIm代表用户ui对项目Im的偏好值,PuiIn代表用户ui对项目In的偏好值,dotIm×In是指对项目Im、项目In都有过互动行为的所有用户的偏好值乘积的和;normsIm是指对应项目Im的所有偏好值的平方和,normsIn是指对应项目In的所有偏好值的平方和,SimiIm×In是指项目Im与项目In的相似度;
B、对于微博用户关注行为偏好数据,项目相似度的计算公式如式(IV)所示:
式(IV)中,|N(Io)|是关注项目Io的用户数,|N(Ip)|是关注项目Ip的用户数,|N(Io)∩N(Ip)|是同时关注项目Io和项目Ip的用户数;
⑥生成项目相似度矩阵
将步骤(2)求取的微博用户互动行为偏好数据的项目相似度及微博用户关注行为偏好数据的项目相似度作为输入,即输入为<(Ii,Ij),SimiIi×Ij>,以某一项目为key,与该项目相似的项目发送到同一个reduce节点,输出为<Ii,list(Ij:SimiIi×Ij))>,得到互动相似度列表矩阵和关注相似度列表矩阵,并存储在可共享的存储平台上;
⑦生成用户-项目相似度矩阵
将步骤④求取的用户矩阵和步骤⑥求得的项目相似度矩阵进行拼接,Map阶段根据项目进行聚合,将与该项目互动过的用户、用户对该项目的偏好以及该项目的邻近项目聚合在一起,输出形式为<u,(list(Ij:SimiIi×Ij))>,u为目标用户,Ii为该用户已经关注的一个项目,Ij为待推荐给用户的项目,SimiIi×Ij是项目Ii和项目Ij之间的相似度;
⑧输出推荐结果
将步骤⑦中按照用户互动行为数据和用户关注行为数据生成的用户-项目相似度矩阵按照项目相似度从高到低排序;根据用户互动行为数据得到前N个项目,生成TOPN互动推荐数据A;根据用户关注行为数据得到前N个项目,生成TOPN关注推荐数据B;取A和B的交集,作为最后的推荐结果。
2.根据权利要求1所述的一种基于并行item-based协同过滤算法的微博关注推荐方法,其特征在于,α=0.4,β=0.4,χ=0.2。
3.根据权利要求1所述的一种基于并行item-based协同过滤算法的微博关注推荐方法,其特征在于,所述步骤(1)中,利用爬取工具从新浪微博平台抓取数据,经过对数据进行清洗、集成、变换,收集大量微博用户互动行为数据及微博用户关注行为数据,并存入mysql数据库中。
4.根据权利要求1所述的一种基于并行item-based协同过滤算法的微博关注推荐方法,其特征在于,N=20。
CN201610153763.9A 2016-03-17 2016-03-17 一种基于并行item-based协同过滤算法的微博关注推荐方法 Active CN105843860B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610153763.9A CN105843860B (zh) 2016-03-17 2016-03-17 一种基于并行item-based协同过滤算法的微博关注推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610153763.9A CN105843860B (zh) 2016-03-17 2016-03-17 一种基于并行item-based协同过滤算法的微博关注推荐方法

Publications (2)

Publication Number Publication Date
CN105843860A CN105843860A (zh) 2016-08-10
CN105843860B true CN105843860B (zh) 2019-03-22

Family

ID=56587292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610153763.9A Active CN105843860B (zh) 2016-03-17 2016-03-17 一种基于并行item-based协同过滤算法的微博关注推荐方法

Country Status (1)

Country Link
CN (1) CN105843860B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846029B (zh) * 2016-07-08 2020-12-29 华南师范大学 基于遗传算法和新型相似度计算策略的协同过滤推荐算法
CN107133279A (zh) * 2017-04-13 2017-09-05 西安电子科技大学 一种基于云计算的智能推荐方法及系统
CN107688637A (zh) * 2017-08-23 2018-02-13 广东欧珀移动通信有限公司 信息推送方法、装置、存储介质及电子终端
CN108038133A (zh) * 2017-11-20 2018-05-15 青岛鹏海软件有限公司 个性化推荐方法
CN109669965A (zh) * 2018-11-13 2019-04-23 广州欧赛斯信息科技有限公司 一种支持非结构化数据的采集分析系统和方法
CN109829109B (zh) * 2019-01-28 2021-02-02 山西大学 基于共现分析的推荐方法
CN114996561B (zh) * 2021-03-02 2024-03-29 腾讯科技(深圳)有限公司 一种基于人工智能的信息推荐方法及装置
CN116228282B (zh) * 2023-05-09 2023-08-11 湖南惟客科技集团有限公司 一种用户数据倾向的智能商品分销方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049486A (zh) * 2012-12-05 2013-04-17 北京奇虎科技有限公司 一种协同过滤距离的处理方法和系统
CN103500228A (zh) * 2013-10-23 2014-01-08 苏州大学 一种协同过滤推荐算法中改进的相似性度量方法
CN104090905A (zh) * 2014-05-19 2014-10-08 腾讯科技(深圳)有限公司 信息推荐方法和信息推荐系统
CN104156436A (zh) * 2014-08-13 2014-11-19 福州大学 一种社交云媒体协同过滤推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090287687A1 (en) * 2008-04-14 2009-11-19 Gianni Martire System and method for recommending venues and events of interest to a user

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049486A (zh) * 2012-12-05 2013-04-17 北京奇虎科技有限公司 一种协同过滤距离的处理方法和系统
CN103500228A (zh) * 2013-10-23 2014-01-08 苏州大学 一种协同过滤推荐算法中改进的相似性度量方法
CN104090905A (zh) * 2014-05-19 2014-10-08 腾讯科技(深圳)有限公司 信息推荐方法和信息推荐系统
CN104156436A (zh) * 2014-08-13 2014-11-19 福州大学 一种社交云媒体协同过滤推荐方法

Also Published As

Publication number Publication date
CN105843860A (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN105843860B (zh) 一种基于并行item-based协同过滤算法的微博关注推荐方法
CN109359244A (zh) 一种个性化信息推荐方法和装置
CN109241440A (zh) 一种基于深度学习的面向隐式反馈推荐方法
CN106055713B (zh) 基于用户兴趣和社交主题提取的社交网络用户推荐方法
CN108509551A (zh) 一种基于Spark环境下的微博网络关键用户挖掘系统及方法
CN108460153A (zh) 一种混合博文与用户关系的社交媒体好友推荐方法
CA2927150A1 (en) Systems and methods for determining influencers in a social data network
CN109189988A (zh) 一种视频推荐方法
CN106547864A (zh) 一种基于查询扩展的个性化信息检索方法
CN101957968A (zh) 基于Hadoop的网上交易服务聚合方法
CN102521420A (zh) 基于偏好模型的社会化过滤方法
Yigit et al. Extended topology based recommendation system for unidirectional social networks
Li Accurate digital marketing communication based on intelligent data analysis
CN105069003B (zh) 一种基于转发链相似度的用户关注对象推荐计算方法
CN105718457B (zh) 基于电子票据的信息推送方法及系统
US20210209177A1 (en) Academic search and analytics system and method therefor
CN103294791A (zh) 一种可扩展标记语言模式匹配方法
CN105787072B (zh) 一种面向流程的领域知识抽取与推送方法
CN108717445A (zh) 一种基于历史数据的在线社交平台用户兴趣推荐方法
Li et al. Big data gathering and mining pipelines for CRM using open-source
CN107679097A (zh) 一种分布式数据处理方法、系统和存储介质
Rao et al. Real time opinion mining of twitter data
CN105912727B (zh) 一种在线社交网络标注系统中的快速推荐方法
Moalla et al. Towards data mart building from social network for opinion analysis
KR101614311B1 (ko) 사회적 관계 특징을 이용한 콘텐츠 수집장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant