CN106326345A - 一种基于用户行为的社交网络中朋友关系挖掘方法 - Google Patents

一种基于用户行为的社交网络中朋友关系挖掘方法 Download PDF

Info

Publication number
CN106326345A
CN106326345A CN201610638825.5A CN201610638825A CN106326345A CN 106326345 A CN106326345 A CN 106326345A CN 201610638825 A CN201610638825 A CN 201610638825A CN 106326345 A CN106326345 A CN 106326345A
Authority
CN
China
Prior art keywords
user
restaurant
network
users
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610638825.5A
Other languages
English (en)
Other versions
CN106326345B (zh
Inventor
宣琦
周鸣鸣
张致远
傅晨波
翔云
吴哲夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201610638825.5A priority Critical patent/CN106326345B/zh
Publication of CN106326345A publication Critical patent/CN106326345A/zh
Application granted granted Critical
Publication of CN106326345B publication Critical patent/CN106326345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于用户行为的社交网络中朋友关系挖掘方法,包括以下步骤:1)通过用户已有社交行为的记录数据,分别建立二分图与有向转移网络,即用户—餐馆和用户—口味;2)根据网络拓扑关系,分别提取关于节点或连边的具有表征两两用户之间社交行为的特征变量;3)采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;4)取10次验证结果的平均值作为模型的最终评价成绩。本发明将人们的社交行为映射到网络中,用网络拓扑特征反映社交行为的共性变量,使得预测用户之间朋友关系的结果具有较高精确度,既有利于引导用户寻找合适的新朋友,也有助于商家推荐更有价值的信息。

Description

一种基于用户行为的社交网络中朋友关系挖掘方法
技术领域
本发明涉及数据挖掘与推荐系统领域,特别是涉及一种基于用户行为的社交网络中朋友关系挖掘方法。
背景技术
国内社交网络兴起于2005年前后,模仿Friendster、Facebook等美国社交平台应用,校内网(后来的人人网)、51.com、豆瓣网、若邻网、天际网等一批社交网站在这一时期先后上线服务。尤其是在2008年开心网推出的“朋友买卖”、“抢车位”、“偷菜”等社交网络游戏,让开心网在白领群体中迅速蹿红,直追当时的社交平台“老大”人人网。社交平台经过十多年的发展,如今国内主流平台——微信与微博,他们集社交、购物、理财于一身,功能愈加全面化。
六度空间理论指出:我们和任何一个陌生人之间所间隔的人不会超过六个,即我们最多通过五个中间人去认识一个陌生人。近年来社交工具越来越多地渗入到人们的日常生活中来,滴滴打车、美团外卖均可通过社交平台找到小伙伴进行拼单,六度空间理论无时无刻地发生在我们身边。而推荐系统的作用就在于尽快帮助用户们在社交平台上找到他们最热衷的信息或朋友。
专利201410025336.3将社交网络映射到一个无向网络,存在弊端:因为往往大多数人转发名人的消息,但名人根本不认识这些人,所以他们两两之间只有单向连边,从而导致推荐结果无法保持较高的准确率与召回率水平。专利201310689161.1需要用到关联好友数据,以及用户的所属公司、所属行业或学校等个人隐私数据,所以该专利技术只适用于在具有大数据处理能力的公司进行朋友关系的挖掘,对于那些需要了解用户的朋友关系的普通公司而言,他们很难获取用户之间的朋友关系网络。鉴于以上缺陷,本发明提取二分图的静态指标、与时序有向转移网络的动态指标共同作为用户间行为的特征,利用机器学习算法挖掘用户之间的朋友关系,弥补了缺失用户关系网络的不利影响,具有较好的推荐结果。
发明内容
为了克服传统朋友关系预测模型在准确率与召回率上无法保持两者均处在较高的水平的不足,本发明提出一种兼顾准确率与召回率、预测效果良好的基于用户行为的社交网络中朋友关系挖掘方法。
本发明解决其技术问题所采用的技术方案如下:
一种基于用户行为的社交网络中朋友关系挖掘方法,包括以下步骤:
S1:通过用户已有行为的记录数据,分别建立出两类二分图与有向转移网络,即用户—餐馆地区,用户—口味标签;
S2:根据用户—餐馆地区与用户—口味标签的二分图,从网络的节点角度,提取出每对用户的节点相似度特征,节点相似度特征用于表征两个用户之间的行为偏好差异;根据用户—餐馆地区与用户—口味标签的有向转移网络,从网络的连边角度,提取出每对用户的有向连边属性特征,有向连边属性特征用于表征两个用户之间的相互影响;
S3:由原始数据已知用户之间的朋友关系,采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;
S4:取交叉验证的10次验证结果的平均值作为用户关系预测器模型的最终评价成绩。
进一步,所述步骤S1中,用到的餐馆地区不是原数据集里的餐馆所在城市或州信息,因为这两个地理特征过于宽泛,无法量化反映用户选择餐馆时的地区移动模式。所以本发明利用自适应DBSCAN密度聚类算法,各城市的所有餐馆根据地理经纬度信息,分别聚类到各自密度可达的地区聚类簇,从而归纳出各个餐馆所属的地区特征。
再进一步,所述步骤S1中,建立二分图方法,构建用户—餐馆地区二分图、以及用户—口味标签二分图,建立用户—餐馆二分图的过程如下:定义二分图G(X,E1,Y),其中X=[x1,x2,…xm]表示各个用户,Y=[y1,y2,…yn]表示各个餐馆聚类簇,若用户xi去过餐馆聚类簇yj,则用有权连边eij表示该用户去了几次该餐馆聚类簇;同理,用户—口味标签二分图G(X,E2,T)。
所述步骤S1中,建立有向转移网络方法,构建用户之间关于餐馆地区、以及口味标签的有向转移网络,建立用户—餐馆地区有向转移网络的过程如下:定义两个用户之间的有向转移网络其中xi,xj分别表示用户xi,xj,{Yi},{Yj}分别表示用户xi,xj去过的餐馆聚类簇集合,根据原数据集已知各用户的用餐餐馆与相应用餐的时间,若用户xi,xj去过相同的餐馆聚类簇yi*=yj*,且用户xi去的时间先于用户xj,则用有向连边表示用户xi指向用户xj。有向连边的权重,根据用户xi,xj去该餐馆yi*=yj*的最小次数而定。若将各两两用户的有向网络合并可得整个社交社区的用户行为图谱;同理,构建用户之间的口味标签时序有向转移网络
所述步骤S2中,根据已建立的两类网络拓扑关系,分别提取关于节点或连边的用户之间社交行为的特征,包括以下步骤:
S2-1:根据二分图,求得两两用户之间的行为偏好相似度,例如在图2所示的用户—餐馆地区二分图G(X,E1,Y)中,可构建链接矩阵D∈R4×n,dij表示用户xi去餐馆聚类簇yj的次数,则用户xi去餐馆聚类簇yj的概率为
p i j = d i j Σ k d k j ,
根据不相关熵的定义,餐馆聚类簇yj的熵为
Ej值越大,表示餐馆聚类簇yj越受用户青睐。
用户xi,xj选择餐馆在地理上的相似度特征cluster_similarij定义为
Σ k ∈ Y i ∩ Y j exp ( - E k / d i k + d j k )
同理,可得用户—口味标签二分图G(X,E2,T)的两两用户之间选择餐馆,在共同口味上的相似度特征taste_similarij
S2-2:根据有向转移网络,求得两两用户之间的行为影响,例如在用户—餐馆地区有向转移网络中,用户xj对用户xi关于选择餐馆的影响定义为
q i j = ( 1 - β j ) a i j + β j / N i Σ k = 1 m [ ( 1 - β k ) a k j + β k / N k ] ,
其中aij表示在历史记录中,用户xj选择餐馆行为对用户xi行为的影响,
βj表示用户xj去历史记录之外的同一座城市餐馆的概率,Ni表示用户xi行为记录最多城市Ci的餐馆总数,Ii,Oi分别是网络中用户xi的入度邻居与出度邻居,即选择就餐地理位置时,用户xi的影响用户集与被影响用户集;同理,可得用户—口味标签有向转移网络中的关于选择口味的影响。
所述步骤S3中,采用机器学习分类器模型xgboost,由于在实际用户关系网络中两两朋友之间的1值连边数量非常少,占所有连边数量(1值连边与0值连边的总数)的小于3%,故对训练数据中的非朋友数据数量降采样至大致与朋友数据数量相当。训练分类器模型时,所有样本数据通过10折交叉验证增强分类模型的泛化能力。
本发明提取了静态二分图的节点相似度特征,与动态有向转移网络的有向连边属性特征,静态指标用于反映用户行为的偏好,动态指标用于映射用户之间的影响,两者相辅相成地表征了社交网络中用户的社交模式,根据这些模式采用机器学习分类器模型算法,挖掘社交网络中的用户关系(即用户关系网络中未知的连边状态)。最终的预测结果较高,能有效满足实际使用的要求。
本发明的适用对象是类似美团外卖、滴滴打车或饿了么这类具有完整用户行为数据,但没有用户身份等隐私数据的O2O商家。本发明以研究yelp餐饮社交平台的用户朋友关系为例,原始数据记录了各用户的历史行为。行为数据包括用户的用餐餐馆、用餐时间、用餐地区以及餐馆口味等信息。同时原始数据已知用户之间的朋友关系,若两个用户是朋友关系,则标签数据设为1,反之则为0,由此形成一张社交平台用户关系网络,这可以用于进行算法验证。
本发明的有益效果为:兼顾准确率与召回率、预测效果良好。
附图说明
图1为本发明实施例的基于用户行为的社交网络中朋友关系挖掘的流程图;
图2为本发明实施例的用户—餐馆地区二分图;
图3为本发明实施例的用户—餐馆地区有向转移网络。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1~图3,一种基于用户行为的社交网络中朋友关系挖掘方法,本发明使用yelp官方公开的数据进行用户朋友推荐系统的建模分析,原始数据记录了各个用户的历史行为信息,以本专利研究yelp用户为例,其行为数据包括用户的用餐餐馆、用餐时间、用餐地点(城市、州、经纬度)以及餐馆口味等信息。在用户数据中已知用户之间的朋友关系,若两个用户是朋友关系,则标签数据设为1,反之则为0,此用户之间的朋友关系数据只作为训练与测试推荐系统模型的标签数据,不用于提取特征。
本发明分为以下四个步骤:
S1:通过用户已有行为的记录数据,分别建立出两类二分图与时序有向转移网络,即用户—餐馆地区,用户—口味标签;
S2:根据用户—餐馆地区与用户—口味标签的二分图,从网络的节点角度,提取出每对用户的节点相似度特征,节点相似度特征用于表征两个用户之间的行为偏好差异;根据用户—餐馆地区与用户—口味标签的时序有向转移网络,从网络的连边角度,提取出每对用户的有向连边属性特征,有向连边属性特征用于表征两个用户之间的相互影响;
S3:由原始数据已知用户之间的朋友关系,采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;
S4:取交叉验证的10次验证结果的平均值作为用户关系预测器模型的最终评价成绩。
所述步骤S1中用到的餐馆地区不是原数据集里的餐馆所在城市或州信息,因为这两个地理特征过于宽泛,无法量化反映用户选择餐馆时的地区移动模式。所以本发明利用自适应DBSCAN密度聚类算法,各城市的所有餐馆根据地理经纬度信息,分别聚类到各自密度可达的地区聚类簇,从而归纳出各个餐馆所属的地区特征。
所述步骤S1中,建立二分图方法,例如建立用户—餐馆地区二分图,过程如下:定义二分图G(X,E1,Y),其中X=[x1,x2,…xm]表示各个用户,Y=[y1,y2,…yn]表示各个餐馆聚类簇,若用户xi去过餐馆聚类簇yj,则用有权连边eij表示该用户去了几次该餐馆聚类簇。图2所示为4个yelp用户关于n个餐馆聚类簇的选择情况;同理,可构建用户—口味标签二分图G(X,E2,T),其中X=[x1,x2,…xm]表示各个用户,T=[t1,t2,…tp]表示各个口味标签,若用户xi吃过口味tj,则用有权连边e′ij表示该用户吃过几次该口味。
所述步骤S1中,建立有向转移网络方法,例如建立用户—餐馆地区有向转移网络如图3所示,过程如下:定义两个用户之间的有向转移网络其中xi,xj分别表示用户xi,xj,{Yi},{Yj}分别表示用户xi,xj去过的餐馆聚类簇集合,根据原数据集已知各用户的用餐餐馆与相应用餐的时间,若用户xi,xj去过相同的餐馆聚类簇yi*=yj*,且用户xi去的时间先于用户xj,则用有向连边表示用户xi指向用户xj。有向连边的权重,根据用户xi,xj去该餐馆yi*=yj*的最小次数而定。若将各两两用户的有向网络合并可得整个社交社区的用户行为图谱;同理,可构建用户之间的口味标签时序有向转移网络其中xi,xj分别表示用户xi,xj,{Ti},{Tj}分别表示用户xi,xj吃过的口味标签集合,根据原数据集已知各用户的用餐餐馆口味标签与相应用餐的时间,若用户xi,xj吃过相同的口味ti*=tj*,且用户xi去吃该口味的时间先于用户xj,则用有向连边表示用户xi指向用户xj。有向连边的权重,根据用户xi,xj吃过该口味ti*=tj*的最小次数而定。
所述步骤S2,根据已建立的两类网络拓扑关系,分别提取关于节点或连边的用户之间社交行为的特征,包括以下步骤:
S2-1:根据二分图,求得两两用户之间的行为偏好相似度,例如在图2所示的用户—餐馆地区二分图G(X,E1,Y)中,可构建链接矩阵D∈R4×n,dij表示用户xi去餐馆聚类簇yj的次数,则用户xi去餐馆聚类簇yj的概率为
p i j = d i j Σ k d k j ,
根据不相关熵的定义,餐馆聚类簇yj的熵为
Ej值越大,表示餐馆聚类簇yj越受用户青睐。
用户xi,xj选择餐馆在地理上的相似度特征cluster_similarij定义为
Σ k ∈ Y i ∩ Y j exp ( - E k / d i k + d j k ) .
同理,在用户—口味标签二分图G(X,E2,T)中,可构建链接矩阵D′∈R4×p,d′ij表示用户xi吃过口味tj的次数,则用户xi去吃口味tj的概率为
p i j ′ = d i j ′ Σ k d k j ′ ,
根据不相关熵的定义,口味tj的熵为
Ej′值越大,表示口味tj越受用户欢迎。
则用户xi,xj选择餐馆在口味上的相似度特征taste_similarij定义为
Σ k ∈ T i ∩ T j exp ( - E k ′ / d i k ′ + d j k ′ ) .
S2-2:根据有向转移网络,求得两两用户之间的行为影响,例如在用户—餐馆地区有向转移网络中,借鉴PageRank网页排名算法的思想,用户xj对用户xi关于选择餐馆的影响定义为
q i j = ( 1 - β j ) a i j + β j / N i Σ k = 1 m [ ( 1 - β k ) a k j + β k / N k ] ,
其中aij表示在历史记录中,用户xj选择餐馆行为对用户xi的影响,
βj表示用户xj打算去历史记录之外的同一座城市餐馆的概率,Ni表示用户xi行为记录最多城市Ci的餐馆总数,Ii,Oi分别是网络中用户xi的入度邻居与出度邻居,即选择就餐地理位置时,用户xi的影响用户集与被影响用户集。
同理,在用户—口味标签有向转移网络中,用户xj对用户xi关于选择就餐口味的影响定义为
q i j ′ = ( 1 - β j ′ ) a i j ′ + β j ′ / N t Σ k = 1 m [ ( 1 - β k ′ ) a k j ′ + β k ′ / N t ] ,
其中a′ij表示在历史记录中,用户xj选择就餐口味对用户xi的影响,
βj′表示用户xj打算去吃历史记录之外的其他就餐口味的概率,Nt表示数据集中所有口味标签的总数,Ii′,Oi′分别是网络中用户xi的入度邻居与出度邻居,即选择就餐口味时,用户xi的影响用户集与被影响用户集。
在所述步骤S3与S4过程中,由于在用户关系网络中两两朋友之间的1值连边数量非常少,占所有连边数量(1值连边与0值连边)的小于3%,故对训练数据中的非朋友数据数量欠采样至大致与朋友数据数量相当。随后训练分类器模型时,采用机器学习分类模型——xgboost分类器,通过10折交叉验证增强分类模型的泛化能力。10折交叉验证,就是将全体样本分割成10个子样本,一个单独的子样本被保留作为验证模型的数据,其他9个样本用来训练分类器模型。交叉验证重复10次,每个子样本验证一次,平均10次的验证结果作为该分类器模型的最终评价成绩。
如上所述为本发明在yelp餐饮平台的用户朋友关系挖掘方法的实施例介绍,本发明提取静态二分图的节点相似度特征与动态有向转移网络的有向连边属性特征,采用机器学习分类器模型,最终的预测结果较高,达到了实际使用的要求。对发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。

Claims (5)

1.一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述挖掘方法包括以下步骤:
S1:通过用户已有行为的记录数据,分别建立出两类二分图与有向转移网络,即用户—餐馆地区,用户—口味标签;
S2:根据用户—餐馆地区与用户—口味标签的二分图,从网络的节点角度,提取出每对用户的节点相似度特征,节点相似度特征用于表征两个用户之间的行为偏好差异;根据用户—餐馆地区与用户—口味标签的有向转移网络,从网络的连边角度,提取出每对用户的有向连边属性特征,有向连边属性特征用于表征两个用户之间的相互影响;
S3:由原始数据已知用户之间的朋友关系,采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;
S4:取交叉验证的10次验证结果的平均值作为用户关系预测器模型的最终评价成绩。
2.如权利要求1所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述步骤S1中,利用自适应DBSCAN密度聚类算法,各城市的所有餐馆根据地理经纬度信息,分别聚类到各自密度可达的地区聚类簇,从而归纳出各个餐馆所属的地区特征。
3.如权利要求1或2所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述步骤S1中,建立二分图方法,构建用户—餐馆地区二分图、以及用户—口味标签二分图,建立用户—餐馆二分图的过程如下:定义二分图G(X,E1,Y),其中X=[x1,x2,…xm]表示各个用户,Y=[y1,y2,…yn]表示各个餐馆聚类簇,若用户xi去过餐馆聚类簇yj,则用有权连边eij表示该用户去了几次该餐馆聚类簇;同理,用户—口味标签二分图G(X,E2,T)。
4.如权利要求3所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所所述步骤S1中,建立有向转移网络方法,构建用户之间关于餐馆地区、以及口味标签的有向转移网络,建立用户—餐馆地区有向转移网络的过程如下:定义两个用户之间的有向转移网络其中xi,xj分别表示用户xi,xj,{Yi},{Yj}分别表示用户xi,xj去过的餐馆聚类簇集合,根据原数据集已知各用户的用餐餐馆与相应用餐的时间,若用户xi,xj去过相同的餐馆聚类簇yi*=yj*,且用户xi去的时间先于用户xj,则用有向连边表示用户xi指向用户xj,有向连边的权重,根据用户xi,xj去该餐馆yi*=yj*的最小次数而定,若将各两两用户的有向网络合并可得整个社交社区的用户行为图谱;同理,构建用户之间的口味标签时序有向转移网络
5.如权利要求1或2所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所所述步骤S2中,根据已建立的两类网络拓扑关系,分别提取关于节点或连边的用户之间社交行为的特征,包括以下步骤:
S2-1:根据二分图,求得两两用户之间的行为偏好相似度,在用户—餐馆地区二分图G(X,E1,Y)中,可构建链接矩阵D∈R4×n,dij表示用户xi去餐馆聚类簇yj的次数,则用户xi去餐馆聚类簇yj的概率为
p i j = d i j Σ k d k j ,
根据不相关熵的定义,餐馆聚类簇yj的熵为
Ej值越大,表示餐馆聚类簇yj越受用户青睐,
用户xi,xj选择餐馆在地理上的相似度特征cluster_similarij定义为
Σ k ∈ Y i ∩ Y j exp ( - E k / d i k + d j k )
同理,可得用户—口味标签二分图G(X,E2,T)的两两用户之间选择餐馆,在共同口味上的相似度特征taste_similarij
S2-2:根据有向转移网络,求得两两用户之间的行为影响,在用户—餐馆地区有向转移网络中,用户xj对用户xi关于选择餐馆的影响定义为
q i j = ( 1 - β j ) a i j + β j / N i Σ k = 1 m [ ( 1 - β k ) a k j + β k / N k ] ,
其中aij表示在历史记录中,用户xj选择餐馆行为对用户xi行为的影响,
a i j = | l j i → | Σ v k ∈ O j | l j k → | , v j ∈ I i 0 , v j ∉ I i ,
βj表示用户xj去历史记录之外的同一座城市餐馆的概率,Ni表示用户xi行为记录最多城市Ci的餐馆总数,Ii,Oi分别是网络中用户xi的入度邻居与出度邻居,即选择就餐地理位置时,用户xi的影响用户集与被影响用户集;同理,可得用户—口味标签有向转移网络中的关于选择口味的影响。
CN201610638825.5A 2016-08-08 2016-08-08 一种基于用户行为的社交网络中朋友关系挖掘方法 Active CN106326345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610638825.5A CN106326345B (zh) 2016-08-08 2016-08-08 一种基于用户行为的社交网络中朋友关系挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610638825.5A CN106326345B (zh) 2016-08-08 2016-08-08 一种基于用户行为的社交网络中朋友关系挖掘方法

Publications (2)

Publication Number Publication Date
CN106326345A true CN106326345A (zh) 2017-01-11
CN106326345B CN106326345B (zh) 2019-11-01

Family

ID=57739890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610638825.5A Active CN106326345B (zh) 2016-08-08 2016-08-08 一种基于用户行为的社交网络中朋友关系挖掘方法

Country Status (1)

Country Link
CN (1) CN106326345B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934489A (zh) * 2017-02-22 2017-07-07 南京邮电大学 一种面向复杂网络的时序链路预测方法
CN106992966A (zh) * 2017-02-28 2017-07-28 浙江工业大学 一种针对真假消息的网络信息传播实现方法
CN107688628A (zh) * 2017-08-21 2018-02-13 北京金堤科技有限公司 关系组数据常用分组构建方法及装置
CN107909038A (zh) * 2017-11-16 2018-04-13 北京邮电大学 一种社交关系分类模型训练方法、装置、电子设备及介质
CN108322473A (zh) * 2018-02-12 2018-07-24 北京京东金融科技控股有限公司 用户行为分析方法与装置
CN108491465A (zh) * 2018-03-06 2018-09-04 北京腾云天下科技有限公司 一种人群扩散方法及计算设备
CN108629671A (zh) * 2018-05-14 2018-10-09 浙江工业大学 一种融合用户行为信息的餐馆推荐方法
CN108650614A (zh) * 2018-03-19 2018-10-12 复旦大学 一种自动推断社会关系的移动用户位置预测方法与装置
CN108768718A (zh) * 2018-05-23 2018-11-06 湖南女子学院 基于熵增的二分网络模块识别方法、系统及存储介质
CN109299978A (zh) * 2018-09-13 2019-02-01 口碑(上海)信息技术有限公司 一种菜品推荐方法、装置以及设备
CN109754274A (zh) * 2017-11-06 2019-05-14 北京京东尚科信息技术有限公司 一种确定目标对象的方法和装置
CN109872242A (zh) * 2019-01-30 2019-06-11 北京字节跳动网络技术有限公司 信息推送方法和装置
CN110059795A (zh) * 2018-01-18 2019-07-26 中国科学院声学研究所 一种融合地理位置与时间特征的移动用户节点组网方法
TWI670608B (zh) * 2018-06-08 2019-09-01 林勁璋 拓樸圖的產生方法及其產生裝置
CN110309360A (zh) * 2019-06-13 2019-10-08 山东大学 一种短视频的话题标签个性化推荐方法及系统
CN111104609A (zh) * 2018-10-26 2020-05-05 百度在线网络技术(北京)有限公司 人际关系的预测方法及其装置、计算机程序、存储介质
CN111258994A (zh) * 2020-01-09 2020-06-09 华中师范大学 一种面向学生校园卡行为数据构建社交网络的方法
CN111652451A (zh) * 2020-08-06 2020-09-11 腾讯科技(深圳)有限公司 社交关系的获取方法和装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110234594A1 (en) * 2010-03-26 2011-09-29 Microsoft Corporation Graph clustering
CN103761665A (zh) * 2014-01-10 2014-04-30 东南大学 一种电子商务网站中顾客好友关系网络的挖掘方法
CN103795613A (zh) * 2014-01-16 2014-05-14 西北工业大学 一种在线社交网络中朋友关系预测的方法
US20140317033A1 (en) * 2013-04-23 2014-10-23 International Business Machines Corporation Predictive and descriptive analysis on relations graphs with heterogeneous entities
CN105190682A (zh) * 2013-03-01 2015-12-23 谷歌公司 基于内容发现社交联系

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110234594A1 (en) * 2010-03-26 2011-09-29 Microsoft Corporation Graph clustering
CN105190682A (zh) * 2013-03-01 2015-12-23 谷歌公司 基于内容发现社交联系
US20140317033A1 (en) * 2013-04-23 2014-10-23 International Business Machines Corporation Predictive and descriptive analysis on relations graphs with heterogeneous entities
CN103761665A (zh) * 2014-01-10 2014-04-30 东南大学 一种电子商务网站中顾客好友关系网络的挖掘方法
CN103795613A (zh) * 2014-01-16 2014-05-14 西北工业大学 一种在线社交网络中朋友关系预测的方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934489A (zh) * 2017-02-22 2017-07-07 南京邮电大学 一种面向复杂网络的时序链路预测方法
CN106992966A (zh) * 2017-02-28 2017-07-28 浙江工业大学 一种针对真假消息的网络信息传播实现方法
CN106992966B (zh) * 2017-02-28 2020-01-10 浙江工业大学 一种针对真假消息的网络信息传播实现方法
CN107688628B (zh) * 2017-08-21 2019-04-05 北京金堤科技有限公司 关系组数据常用分组构建方法及装置
CN107688628A (zh) * 2017-08-21 2018-02-13 北京金堤科技有限公司 关系组数据常用分组构建方法及装置
CN109754274A (zh) * 2017-11-06 2019-05-14 北京京东尚科信息技术有限公司 一种确定目标对象的方法和装置
CN107909038A (zh) * 2017-11-16 2018-04-13 北京邮电大学 一种社交关系分类模型训练方法、装置、电子设备及介质
CN107909038B (zh) * 2017-11-16 2022-01-28 北京邮电大学 一种社交关系分类模型训练方法、装置、电子设备及介质
CN110059795A (zh) * 2018-01-18 2019-07-26 中国科学院声学研究所 一种融合地理位置与时间特征的移动用户节点组网方法
CN108322473A (zh) * 2018-02-12 2018-07-24 北京京东金融科技控股有限公司 用户行为分析方法与装置
CN108491465A (zh) * 2018-03-06 2018-09-04 北京腾云天下科技有限公司 一种人群扩散方法及计算设备
CN108491465B (zh) * 2018-03-06 2020-10-16 北京腾云天下科技有限公司 一种人群扩散方法及计算设备
CN108650614A (zh) * 2018-03-19 2018-10-12 复旦大学 一种自动推断社会关系的移动用户位置预测方法与装置
CN108650614B (zh) * 2018-03-19 2020-07-28 复旦大学 一种自动推断社会关系的移动用户位置预测方法与装置
CN108629671A (zh) * 2018-05-14 2018-10-09 浙江工业大学 一种融合用户行为信息的餐馆推荐方法
CN108629671B (zh) * 2018-05-14 2021-10-29 浙江工业大学 一种融合用户行为信息的餐馆推荐方法
CN108768718A (zh) * 2018-05-23 2018-11-06 湖南女子学院 基于熵增的二分网络模块识别方法、系统及存储介质
TWI670608B (zh) * 2018-06-08 2019-09-01 林勁璋 拓樸圖的產生方法及其產生裝置
CN109299978A (zh) * 2018-09-13 2019-02-01 口碑(上海)信息技术有限公司 一种菜品推荐方法、装置以及设备
CN111104609B (zh) * 2018-10-26 2023-10-10 百度在线网络技术(北京)有限公司 人际关系的预测方法及其装置、存储介质
CN111104609A (zh) * 2018-10-26 2020-05-05 百度在线网络技术(北京)有限公司 人际关系的预测方法及其装置、计算机程序、存储介质
CN109872242A (zh) * 2019-01-30 2019-06-11 北京字节跳动网络技术有限公司 信息推送方法和装置
CN109872242B (zh) * 2019-01-30 2020-10-13 北京字节跳动网络技术有限公司 信息推送方法和装置
CN110309360A (zh) * 2019-06-13 2019-10-08 山东大学 一种短视频的话题标签个性化推荐方法及系统
CN111258994A (zh) * 2020-01-09 2020-06-09 华中师范大学 一种面向学生校园卡行为数据构建社交网络的方法
CN111652451A (zh) * 2020-08-06 2020-09-11 腾讯科技(深圳)有限公司 社交关系的获取方法和装置及存储介质

Also Published As

Publication number Publication date
CN106326345B (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
CN106326345A (zh) 一种基于用户行为的社交网络中朋友关系挖掘方法
CN104615616B (zh) 群组推荐方法和系统
CN103795613B (zh) 一种在线社交网络中朋友关系预测的方法
CN105740401B (zh) 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置
Andrienko et al. Scalable and privacy-respectful interactive discovery of place semantics from human mobility traces
CN107291888B (zh) 基于机器学习统计模型的入住酒店附近生活推荐系统方法
CN107330798A (zh) 一种基于种子节点传播的社交网络间用户身份识别方法
CN104133817A (zh) 网络社区交互方法、装置及网络社区平台
CN109241454A (zh) 一种将社交网络和图像内容融合的兴趣点推荐方法
CN105612514A (zh) 通过将语境线索与图像关联进行图像分类的系统和方法
CN109918452A (zh) 一种数据处理的方法、装置、计算机存储介质及终端
CN101510856A (zh) 一种sns网络中成员关系圈的提取方法和装置
CN112199608A (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN104965883B (zh) 一种匹配用户特征的个性化旅游信息筛选方法
CN104239399A (zh) 社交网络中的潜在好友推荐方法
Yu et al. Participant selection for offline event marketing leveraging location-based social networks
CN111191099B (zh) 一种基于社交媒体的用户活动类型识别方法
CN108647800A (zh) 一种基于节点嵌入的在线社交网络用户缺失属性预测方法
Gadar et al. The Settlement Structure Is Reflected in Personal Investments: Distance‐Dependent Network Modularity‐Based Measurement of Regional Attractiveness
CN107577782A (zh) 一种基于异质数据的人物相似度刻画方法
Panas et al. Evaluation of Athens as a city break destination: Tourist perspective explored via data mining techniques
CN108629671A (zh) 一种融合用户行为信息的餐馆推荐方法
CN110119478A (zh) 一种结合多种用户反馈数据的基于相似度的物品推荐方法
CN105141508B (zh) 一种基于近邻关系的微博系统朋友推荐方法
McKenzie et al. Measuring urban regional similarity through mobility signatures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant