CN107977726B - 用户关系预测模型的建立及用户动态关系的预测方法 - Google Patents

用户关系预测模型的建立及用户动态关系的预测方法 Download PDF

Info

Publication number
CN107977726B
CN107977726B CN201610921904.7A CN201610921904A CN107977726B CN 107977726 B CN107977726 B CN 107977726B CN 201610921904 A CN201610921904 A CN 201610921904A CN 107977726 B CN107977726 B CN 107977726B
Authority
CN
China
Prior art keywords
user
relationship
prediction model
population
individuals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610921904.7A
Other languages
English (en)
Other versions
CN107977726A (zh
Inventor
盛益强
李南星
刘学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Shanghai 3Ntv Network Technology Co Ltd
Original Assignee
Institute of Acoustics CAS
Shanghai 3Ntv Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS, Shanghai 3Ntv Network Technology Co Ltd filed Critical Institute of Acoustics CAS
Priority to CN201610921904.7A priority Critical patent/CN107977726B/zh
Publication of CN107977726A publication Critical patent/CN107977726A/zh
Application granted granted Critical
Publication of CN107977726B publication Critical patent/CN107977726B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户关系预测模型的建立方法,所述方法包括:步骤S1)从原始社交关系网络中通过随机游走抽样得到两个用户关系的子网络;步骤S2)分别提取子网络中每条边连接的用户二元组的共同好友数、共同好友集聚系数、好友集聚系数和最短路径距离四个拓扑特征,形成训练集;步骤S3)建立用户关系预测模型,该模型为前馈神经网络结构;步骤S4)基于训练集和建立的用户关系预测模型;使用遗传算法得到最优个体,该个体为训练好的用户关系预测模型。此外,本发明还提供了一种用户动态关系的预测方法,该方法能够预测用户关系的动态变化。该预测方法在预测用户关系时不受最短路径距离D的限制,提高了预测用户关系的准确率及弱关系的分析能力。

Description

用户关系预测模型的建立及用户动态关系的预测方法
技术领域
本发明涉及网络通信技术领域,尤其涉及用户关系预测模型的建立及用户动态关系的预测方法。
背景技术
随着社交网络的迅猛发展,基于社交网络的应用已经深刻地改变了人类的交互行为以及信息的传播方式。用户通过社交媒体获取与传播最新资讯,寻找相同兴趣或附近的人,维系当前的好友关系、分享购物经验、推荐视频信息等。根据尼尔森2014年的调查报告,社交媒体活跃用户数量达18.6亿,每个社交媒体用户每天在社交媒体上所花费的平均时间为1.5小时。尼尔森的调查结果显示,90%的用户相信朋友对他们的推荐,70%的用户相信其他用户对广告商品的评论。
由此可见社交网络的应用前景十分广阔。对社交网站、电子商务、视频服务网站等基于社交网络的应用而言,如何通过分析和挖掘社交网络促进用户交互、提升用户体验和忠诚度是一个关键性难题。
现有的对社交网络的研究主要集中在:1、根据用户地理位置分析社交网络;2、根据用户好友关系分析社交网络。
在根据用户地理位置分析社交网络的研究成果(见参考文献[1]:《FriendRecommendation Algorithm Based on Multiple factors in LBSNs》)中,可以通过用户的地理位置信息分析社交网络并应用于好友推荐场景。该方法适用于移动端的社交网络应用,通过移动端可以准确地收集到用户的地理位置信息,而对于在线社交网络应用却很难做到这点。
FOF(Friends Of Friends)方法是用户关系分析的基本的方法,其本质为三元闭包原理:用户二元组存在越多的共同好友,则彼此成为好友的几率越大。该方法的一个显著缺点是在分析用户关系时只考虑好友的好友即距离D=2的用户,对于D>2的用户无法给出分析结果,因此弱关系分析能力较差。
基于图模型的用户关系分析方法(见参考文献[2]:《A Graph-Based FriendRecommendation System Using Genetic Algorithm》),其原理是从社交关系网络中提取用户二元组的三个拓扑特征,通过遗传算法搜索这三个特征的最佳线性加权来分析用户二元组的社交关系并应用于好友推荐场景。虽然该方法有很好的线性分类能力,但非线性分类效果较差。
发明内容
本发明的目的在于为了克服现有用户关系分析方法存在的上述缺陷,提出了一种用户关系预测模型的建立方法,该方法建立了基于前馈神经网络模型的用户关系预测模型,并对该模型进行训练,该模型具有良好的非线性分类能力。此外,本发明还提供了一种用户动态关系的预测方法,该方法具有良好的全局搜索能力,而且在分析用户关系时不受最短路径距离D的限制。因此本发明的方法提高了分析用户关系的准确率与弱关系的能力。
为了实现上述目的,本发明提供了用户关系预测模型的建立方法,所述方法包括:
步骤S1)从原始社交关系网络中通过随机游走抽样得到两个用户关系的子网络;
步骤S2)分别提取子网络中每条边连接的用户二元组的共同好友数、共同好友集聚系数、好友集聚系数和最短路径距离四个拓扑特征,形成训练集;
步骤S3)建立用户关系预测模型,该模型为前馈神经网络结构;
步骤S4)基于训练集和建立的用户关系预测模型;使用遗传算法得到最优个体,该个体为训练好的用户关系预测模型。
上述技术方案中,所述步骤S2)的具体实现过程为:
用户二元组
Figure BDA0001135889100000028
用户Ui的邻接节点集合为Fi,用户Uj的邻接节点集合为Fj;Uij的QOCF、CCOCF、CCOF三个特征计算公式如下:
Figure BDA0001135889100000021
Figure BDA0001135889100000022
Figure BDA0001135889100000023
Figure BDA0001135889100000024
其中,F为节点集合;|F|为集合F的元素个数即节点个数;
Figure BDA0001135889100000025
的取值如下:
Figure BDA0001135889100000026
如果Up和Uq存在关注关系
Figure BDA0001135889100000027
如果Up和Uq不存在关注关系
Uij的D特征为Uij的最短路径距离,如果D(Uij)=1,则两个用户之间存在关注关系;如果D(Uij)>1,则两个用户之间不存在关注关系。
上述技术方案中,所述步骤S3)的具体实现过程为:
所述用户关系预测模型采用3层结构的前馈神经网络结构:输入层、隐藏层及输出层;输入层由4个输入构成,为用户二元组特征向量
Figure BDA0001135889100000031
的4个分量;隐藏层的神经元个数为10;输出层的输出值
Figure BDA0001135889100000032
Figure BDA0001135889100000033
则认为对应的用户二元组Uij不存在关注关系,若
Figure BDA0001135889100000034
则认为Uij存在关注关系。
上述技术方案中,所述步骤S4)的具体实现过程为:
步骤1)初始化当前种群为Pt={NNm,0<m≤100},将用户关系预测模型的各神经元的权值与阈值组成的向量
Figure BDA0001135889100000035
定义为种群个体NNm的染色体,其中
Figure BDA0001135889100000036
为神经网络中第l层第i个神经元连接该神经元的第j个输入的权值,
Figure BDA0001135889100000037
为神经网络中第l层第i个神经元的阈值;染色体
Figure BDA0001135889100000038
中每个位点为介于(-1,1)之间的随机浮点数;
步骤2)计算种群个体NNm的适应度;
适应度计算公式如下:
Figure BDA0001135889100000039
其中,用户二元组Uij关注关系判别函数为
Figure BDA00011358891000000310
Figure BDA00011358891000000311
为NNm正确判定训练集中关注关系类别的用户二元组个数,
Figure BDA00011358891000000312
为NNm错误判定训练集中关注关系类别的用户二元组个数;
步骤3)将NNm根据
Figure BDA00011358891000000313
降序排列,取第一个个体为最优个体NNBest,设NNBest的保持代数T=0;
步骤4)若T≥4,则转入步骤10);否则,转入步骤5);
步骤5)选出前10个精英个体,将这些精英个体加入下一代种群Pt+1中;Pt+1初始为空;
步骤6)判断S(Pt+1)≥S(Pt)是否成立,S(Pt+1)为种群Pt+1的个体个数,S(Pt)为种群Pt的个体个数;如果判断结果是肯定,转入步骤9);否则,转入步骤7);
步骤7)以轮盘赌方式从Pt中随机选择NNi和NNj执行交叉算子,得到两个子代;
步骤8)将生成的两个子代分别执行变异算子,得到两个新的子代,并将这两个新的子代加入Pt+1中;转入步骤6);
步骤9)令t=t+1,计算种群Pt中个体的适应度;
步骤10)将种群Pt中个体NNm根据
Figure BDA0001135889100000041
进行降序排列,若
Figure BDA0001135889100000042
则NNBest=NN0且T=0,若
Figure BDA0001135889100000043
则T=T+1;转入步骤4);
步骤10)返回最优个体NNBest,NNBest为训练好的用户关系预测模型。
上述技术方案中,所述步骤7)的具体实现过程为:
对相互配对的个体NNi和NNj,染色体交叉采用两点交叉方式,NNi和NNj以0.7的概率发生染色体交叉重组;若不发生交叉重组则将NNi和NNj作为子代;若发生交叉重组则在
Figure BDA0001135889100000044
Figure BDA0001135889100000045
上随机设置两个交叉点,然后交换两个交叉点之间的基因,得到两个新的子代。
基于上述方法建立的用户关系预测模型,本发明还提供了用户动态关系的预测方法,所述方法包括:
步骤T1)提取待预测用户Um和用户Un的二元组特征向量
Figure BDA0001135889100000046
的四个分量:
Figure BDA0001135889100000047
Figure BDA0001135889100000048
Figure BDA0001135889100000049
Figure BDA00011358891000000410
用户二元组
Figure BDA00011358891000000411
Um的邻接节点集合为Fm,Un的邻接节点集合为Fn
步骤T2)将特征向量
Figure BDA00011358891000000412
的四个分量输入所述用户关系预测模型的输入层;
步骤T3)获取所述用户关系预测模型的输出值
Figure BDA00011358891000000413
若如果D(Umn)=1,而
Figure BDA00011358891000000414
则预测用户m和用户n会取消关注关系,即从强关系转换为弱关系;如果D(Umn)>1,而
Figure BDA0001135889100000051
则预测用户Um和用户Un会产生关注关系,即从弱关系转换为强关系。
本发明的优点在于:
1、本发明提出了一种用户关系预测模型的建立方法,该模型具有良好的非线性分类能力,使用遗传算法对模型进行训练,该算法具有良好的全局搜索能力;
2、本发明的用户关系的预测方法在预测用户关系时不受最短路径距离D的限制,提高了预测用户关系的准确率及弱关系的分析能力。
附图说明
图1是本发明的用户关系预测模型的建立方法的流程图;
图2是本发明实施例提供的整体的神经网络的结构;
图3是本发明实施例提供的一个神经网络结构演示交叉过程;
图4是本发明实施例提供的染色体的交叉点在各基因交接点中选择方法;
图5是本发明实施例提供的训练前馈神经网络的流程图。
具体实施方式
以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种用户关系预测模型的建立方法,该方法包括:
步骤S1)从原始社交关系网络中通过随机游走抽样得到两个用户关系的子网络;
具体地,在一种具体实施方式中,以2012KDD Cup数据集为例,数据集包含user_sns.txt文件,为用户关注关系数据文件。
用户关注关系数据文件中每行是一个用户二元组关注关系,格式为:(Follower-userid)\t(Followee-userid)。Follower-userid为关注者ID,Followee-userid为被关注者ID。
步骤S2)分别提取子网络中每条边连接的用户二元组的共同好友数(QOCF)、共同好友集聚系数(CCOCF)、好友集聚系数(CCOF)和最短路径距离(D)四个拓扑特征,形成训练集;
用户二元组
Figure BDA0001135889100000052
用户Ui的邻接节点集合为Fi,用户Uj的邻接节点集合为Fj。Uij的QOCF、CCOCF、CCOF三个特征计算公式如下:
Figure BDA0001135889100000061
Figure BDA0001135889100000062
Figure BDA0001135889100000063
Figure BDA0001135889100000064
其中,F为节点集合;|F|指的是集合F的元素个数即节点个数,也可以用card(F)来表示;
Figure BDA0001135889100000065
的取值如下:
Figure BDA0001135889100000066
如果Up和Uq存在关注关系
Figure BDA0001135889100000067
如果Up和Uq不存在关注关系
Uij的D特征为Uij的最短路径距离,如果D(Uij)=1,则两个用户之间存在关注关系;如果D(Uij)>1,则两个用户之间不存在关注关系。
步骤S3)建立用户关系预测模型;
本实施例中用户关系预测模型采用3层结构的前馈神经网络结构,输入层、隐藏层及输出层各一层。神经网络的输入为训练集中用户二元组特征向量
Figure BDA0001135889100000068
由4个分量构成,因此输入层由4个输入构成;神经网络的输出
Figure BDA0001135889100000069
为用户二元组Uij的社交关系类别,在本实施例中只存在两种结果即该用户二元组存在或者不存在关注关系,因此输出层只需由1个神经元构成;隐藏层的神经元个数有很多的经验公式可供参考,经试验后得到隐藏层的神经元个数取10可以得到较好的结果。整体的神经网络的结构如下图2所示。
神经元的激活函数f取Sigmoid函数,函数表达式如下:
Figure BDA00011358891000000610
第j个神经元的输出:
Figure BDA00011358891000000611
其中,Nj为第j个神经元的输入个数,Wji为第j个神经元的第i个权值,xji为第j个神经元的第i个输入,bj为第j个神经元的阈值。
因为神经网络的输出层的神经元的激活函数也为Sigmoid函数,所以神经网络的输出
Figure BDA0001135889100000071
设定若
Figure BDA0001135889100000072
则认为对应的用户二元组Uij不存在关注关系,若
Figure BDA0001135889100000073
则认为Uij存在关注关系。
步骤S4)基于训练集使用遗传算法得到最优个体,该个体为训练好的用户关系预测模型;
具体地,在一种具体实施方式中,将前馈神经网络看作种群中的个体,使用遗传算法搜索全局最优的前馈神经网络。
神经网络NN的准确率计算公式如下:
Figure BDA0001135889100000074
其中,用户二元组Uij关注关系判别函数为
Figure BDA0001135889100000075
Figure BDA0001135889100000076
为NN正确判定关注关系类别的用户二元组个数,
Figure BDA0001135889100000077
为NN错误判定关注关系类别的用户二元组个数。
将NN的各神经元的权值与阈值组成向量
Figure BDA0001135889100000078
定义为种群个体NNm的染色体,其中
Figure BDA0001135889100000079
为神经网络中第l层第i个神经元连接该神经元的第j个输入的权值,
Figure BDA00011358891000000710
为神经网络中第l层第i个神经元的阈值;FNN定义为种群个体NN的适应度,从而将神经网络的训练转化为遗传算法的优化问题。
当代种群Pt大小
Figure BDA00011358891000000711
其中NNi为种群个体。遗传算法的选择算子:采用保留最佳个体策略,将Pt中所有个体NNi按照适应度
Figure BDA00011358891000000712
大小进行降序排序,选取前10个个体作为Pt的精英个体加入Pt+1,这10个精英个体不参与交叉算子和变异算子避免其优良基因被破坏。
遗传算法的交叉算子:对相互配对的个体NNi和NNj,染色体交叉采用两点交叉方式。NNi和NNj以0.7的概率发生染色体交叉重组。若不发生交叉重组则将NNi和NNj作为子代;若发生交叉重组则在
Figure BDA0001135889100000081
Figure BDA0001135889100000082
上随机设置两个交叉点,然后交换两个交叉点之间的基因,得到两个新的子代。以一个较简单的神经网络结构演示交叉过程,如图3所示。
因为个体染色体对应神经网络的权值向量,所以神经网络中神经元的权值向量对应染色体上的基因。在交叉算子中若交叉点是完全随机,则交叉点很可能落在某个基因内而不是基因之间,如图4所示,第一个交叉点落在NNi和NNj第一个神经元内,第二个交叉点落在NNi和NNj第二个神经元内。将导致经过优化后的神经元不能保留其完整的优良特性,降低优化效率。为了避免上述问题,染色体的交叉点应在各基因交接点中随机选择,如图4所示。
遗传算法的变异算子采用基本位变异的实值变异方式:对一个种群个体NNi,其染色体
Figure BDA0001135889100000083
上每个位点均以0.1概率发生变异,发生变异的位点在原来的浮点数值基础加上一个介于[-0.3,0.3]之间的随机数。
步骤1)初始化当前种群为Pt={NNm,0<m≤100},将用户关系预测模型的各神经元的权值与阈值组成的向量
Figure BDA0001135889100000084
定义为种群个体NNm的染色体;染色体
Figure BDA0001135889100000085
中每个位点为介于(-1,1)之间的随机浮点数;
步骤2)计算种群个体NNm的适应度;
适应度计算公式如下:
Figure BDA0001135889100000086
其中,用户二元组Uij关注关系判别函数为
Figure BDA0001135889100000087
Figure BDA0001135889100000088
为NNm正确判定训练集中关注关系类别的用户二元组个数,
Figure BDA0001135889100000089
为NNm错误判定训练集中关注关系类别的用户二元组个数;
步骤3)将NNm根据
Figure BDA00011358891000000810
降序排列,取第一个个体为最优个体NNBest,设NNBest的保持代数T=0;
步骤4)若T≥4,则转入步骤10);否则,转入步骤5);
步骤5)选出前10个精英个体,将这些精英个体加入下一代种群Pt+1中;Pt+1初始为空;
步骤6)判断S(Pt+1)≥S(Pt)是否成立,S(Pt+1)为种群Pt+1的个体个数,S(Pt)为种群Pt的个体个数;如果判断结果是肯定,转入步骤9);否则,转入步骤7);
步骤7)以轮盘赌方式从Pt中随机选择NNi和NNj执行交叉算子,得到两个子代;
步骤8)将生成的两个子代分别执行变异算子,得到两个新的子代,并将这两个新的子代加入Pt+1中;转入步骤6);
步骤9)令t=t+1,计算种群Pt中个体的适应度;
步骤10)将种群Pt中个体NNm根据
Figure BDA0001135889100000091
进行降序排列,若
Figure BDA0001135889100000092
则NNBest=NN0且T=0,若
Figure BDA0001135889100000093
则T=T+1;转入步骤4);
步骤10)返回最优个体NNBest,NNBest为训练好的用户关系预测模型。
基于上述方法建立的用户关系预测模型,本发明还提供了用户动态关系的预测方法,所述方法包括:
步骤T1)提取待预测用户Um和用户Un的二元组特征向量
Figure BDA0001135889100000094
的四个分量:
Figure BDA0001135889100000095
Figure BDA0001135889100000096
Figure BDA0001135889100000097
Figure BDA0001135889100000098
用户二元组
Figure BDA0001135889100000099
Um的邻接节点集合为Fm,Un的邻接节点集合为Fn
步骤T2)将特征向量
Figure BDA00011358891000000910
的四个分量输入用户关系预测模型的输入层;
具体地,将用户二元组
Figure BDA00011358891000000911
的四个拓扑特征作为预测模型NNBest的输入;
步骤T3)获取用户关系预测模型的输出值
Figure BDA00011358891000000912
若如果D(Umn)=1,而
Figure BDA00011358891000000913
则预测用户m和用户n会取消关注关系,即从强关系转换为弱关系;如果D(Umn)>1,而
Figure BDA00011358891000000914
则预测用户Um和用户Un会产生关注关系,即从弱关系转换为强关系。
若模型预测结果显示用户关系将从强关系转换为弱关系,则提示用户取消关注或者屏蔽;若模型预测结果显示用户关系将从弱关系转换为强关系,则根据现有技术如好友推荐提示用户关注。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.用户关系预测模型的建立方法,所述方法包括:
步骤S1)从原始社交关系网络中通过随机游走抽样得到两个用户关系的子网络;
步骤S2)分别提取子网络中每条边连接的用户二元组的共同好友数、共同好友集聚系数、好友集聚系数和最短路径距离四个拓扑特征,形成训练集;
步骤S3)建立用户关系预测模型,该模型为前馈神经网络结构;
步骤S4)基于训练集和建立的用户关系预测模型;使用遗传算法得到最优个体,该个体为训练好的用户关系预测模型。
2.根据权利要求1所述的用户关系预测模型的建立方法,其特征在于,所述步骤S2)的具体实现过程为:
用户二元组
Figure FDA0002840538660000011
用户Ui的邻接节点集合为Fi,用户Uj的邻接节点集合为Fj;Uij的共同好友数(QOCF)、共同好友集聚系数(CCOCF)、好友集聚系数(CCOF)三个特征计算公式如下:
Figure FDA0002840538660000012
Figure FDA0002840538660000013
Figure FDA0002840538660000014
Figure FDA0002840538660000015
其中,F为节点集合;|F|为集合F的元素个数即节点个数;
Figure FDA0002840538660000016
的取值如下:
Figure FDA0002840538660000017
如果Ui和Uj存在关注关系;
Figure FDA0002840538660000018
如果Ui和Uj不存在关注关系;
Uij的D特征为Uij的最短路径距离,如果D(Uij)=1,则两个用户之间存在关注关系;如果D(Uij)>1,则两个用户之间不存在关注关系。
3.根据权利要求2所述的用户关系预测模型的建立方法,其特征在于,所述步骤S3)的具体实现过程为:
所述用户关系预测模型采用3层结构的前馈神经网络结构:输入层、隐藏层及输出层;输入层由4个输入构成,为用户二元组特征向量
Figure FDA0002840538660000019
的4个分量;隐藏层的神经元个数为10;输出层的输出值
Figure FDA0002840538660000021
Figure FDA0002840538660000022
则认为对应的用户二元组Uij不存在关注关系,若
Figure FDA0002840538660000023
则认为Uij存在关注关系。
4.根据权利要求3所述的用户关系预测模型的建立方法,其特征在于,所述步骤S4)的具体实现过程为:
步骤1)初始化当前种群为Pt={NNm,0<m≤100},将用户关系预测模型的各神经元的权值与阈值组成的向量
Figure FDA0002840538660000024
Figure FDA0002840538660000025
定义为种群个体NNm的染色体,其中
Figure FDA0002840538660000026
为神经网络中第l层第i个神经元连接该神经元的第j个输入的权值,
Figure FDA0002840538660000027
为神经网络中第l层第i个神经元的阈值;染色体
Figure FDA0002840538660000028
中每个位点为介于(-1,1)之间的随机浮点数;
步骤2)计算种群个体NNm的适应度;
适应度计算公式如下:
Figure FDA0002840538660000029
其中,用户二元组Uij关注关系判别函数为
Figure FDA00028405386600000210
Figure FDA00028405386600000211
为NNm正确判定训练集中关注关系类别的用户二元组个数,
Figure FDA00028405386600000212
为NNm错误判定训练集中关注关系类别的用户二元组个数;
步骤3)将NNm根据
Figure FDA00028405386600000213
降序排列,取第一个个体为最优个体NNBest,设NNBest的保持代数T=0;
步骤4)若T≥4,则转入步骤10);否则,转入步骤5);
步骤5)选出前10个精英个体,将这些精英个体加入下一代种群Pt+1中;Pt+1初始为空;
步骤6)判断S(Pt+1)≥S(Pt)是否成立,S(Pt+1)为种群Pt+1的个体个数,S(Pt)为种群Pt的个体个数;如果判断结果是肯定,转入步骤9);否则,转入步骤7);
步骤7)以轮盘赌方式从Pt中随机选择NNi和NNj执行交叉算子,得到两个子代;
步骤8)将生成的两个子代分别执行变异算子,得到两个新的子代,并将这两个新的子代加入Pt+1中;转入步骤6);
步骤9)令t=t+1,计算种群Pt中个体的适应度;
步骤10)将种群Pt中个体NNm根据
Figure FDA0002840538660000031
进行降序排列,若
Figure FDA0002840538660000032
则NNBest=NN0且T=0,若
Figure FDA0002840538660000033
则T=T+1;转入步骤4);
步骤10)返回最优个体NNBest,NNBest为训练好的用户关系预测模型。
5.根据权利要求4所述的用户关系预测模型的建立方法,其特征在于,所述步骤7)的具体实现过程为:
对相互配对的个体NNi和NNj,染色体交叉采用两点交叉方式,NNi和NNj以0.7的概率发生染色体交叉重组;若不发生交叉重组则将NNi和NNj作为子代;若发生交叉重组则在
Figure FDA0002840538660000034
Figure FDA0002840538660000035
上随机设置两个交叉点,然后交换两个交叉点之间的基因,得到两个新的子代。
6.用户动态关系的预测方法,基于权利要求2-5之一所述的方法建立的用户关系预测模型实现,所述方法包括:
步骤T1)提取待预测用户Um和用户Un的二元组特征向量
Figure FDA0002840538660000036
的四个分量:
QOCF(Umn)=|Fm∩Fn|,
CCOCF(Umn)=LCC(Fm∩Fn),
CCOF(Umn)=LCC(FmUFn),
Figure FDA0002840538660000037
用户二元组
Figure FDA0002840538660000038
Um的邻接节点集合为Fm,Un的邻接节点集合为Fn
步骤T2)将特征向量
Figure FDA00028405386600000312
的四个分量输入所述用户关系预测模型的输入层;
步骤T3)获取所述用户关系预测模型的输出值
Figure FDA0002840538660000039
若如果D(Umn)=1,而
Figure FDA00028405386600000310
则预测用户m和用户n会取消关注关系,即从强关系转换为弱关系;如果D(Umn)>1,而
Figure FDA00028405386600000311
则预测用户Um和用户Um会产生关注关系,即从弱关系转换为强关系。
CN201610921904.7A 2016-10-21 2016-10-21 用户关系预测模型的建立及用户动态关系的预测方法 Expired - Fee Related CN107977726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610921904.7A CN107977726B (zh) 2016-10-21 2016-10-21 用户关系预测模型的建立及用户动态关系的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610921904.7A CN107977726B (zh) 2016-10-21 2016-10-21 用户关系预测模型的建立及用户动态关系的预测方法

Publications (2)

Publication Number Publication Date
CN107977726A CN107977726A (zh) 2018-05-01
CN107977726B true CN107977726B (zh) 2021-03-16

Family

ID=62004734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610921904.7A Expired - Fee Related CN107977726B (zh) 2016-10-21 2016-10-21 用户关系预测模型的建立及用户动态关系的预测方法

Country Status (1)

Country Link
CN (1) CN107977726B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102371A (zh) * 2018-08-22 2018-12-28 平安科技(深圳)有限公司 商品推荐方法、装置、计算机设备及存储介质
CN110069355B (zh) * 2019-04-22 2020-06-02 北京字节跳动网络技术有限公司 用户关系显示、用户关系转变方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1450493A (zh) * 2003-04-25 2003-10-22 北京工业大学 实现遗传算法的神经网络系统
CN103105246A (zh) * 2012-12-31 2013-05-15 北京京鹏环球科技股份有限公司 一种基于遗传算法改进的bp神经网络的温室环境预测反馈方法
CN103971162A (zh) * 2014-04-04 2014-08-06 华南理工大学 一种基于遗传算法改进bp神经网络的方法
CN104636985A (zh) * 2013-11-08 2015-05-20 国家电网公司 一种改进bp神经网络的输电线路无线电干扰预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1450493A (zh) * 2003-04-25 2003-10-22 北京工业大学 实现遗传算法的神经网络系统
CN103105246A (zh) * 2012-12-31 2013-05-15 北京京鹏环球科技股份有限公司 一种基于遗传算法改进的bp神经网络的温室环境预测反馈方法
CN104636985A (zh) * 2013-11-08 2015-05-20 国家电网公司 一种改进bp神经网络的输电线路无线电干扰预测方法
CN103971162A (zh) * 2014-04-04 2014-08-06 华南理工大学 一种基于遗传算法改进bp神经网络的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《社会网络用户关系分析与预测》;李德民;《中国优秀硕士学位论文全文数据库信息科技辑》;20160215;I139-164 *

Also Published As

Publication number Publication date
CN107977726A (zh) 2018-05-01

Similar Documents

Publication Publication Date Title
Lambora et al. Genetic algorithm-A literature review
Ciornei et al. Hybrid ant colony-genetic algorithm (GAAPI) for global continuous optimization
Gao et al. Exploring social-historical ties on location-based social networks
CN107123056B (zh) 一种基于位置的社交大数据信息最大化方法
Pham et al. A general model for out-of-town region recommendation
Chopade et al. A framework for community detection in large networks using game-theoretic modeling
Tsai et al. A genetic newgreedy algorithm for influence maximization in social network
Luo et al. Recent advances in clonal selection algorithms and applications
CN113065974A (zh) 一种基于动态网络表示学习的链路预测方法
Salunkhe et al. A hybrid approach for class imbalance problem in customer churn prediction: A novel extension to under-sampling
Wang et al. CD-CNN: a partially supervised cross-domain deep learning model for urban resident recognition
Xin et al. A location-context awareness mobile services collaborative recommendation algorithm based on user behavior prediction
CN104199884B (zh) 一种基于r覆盖率优先的社交网络观察点选取方法
CN107977726B (zh) 用户关系预测模型的建立及用户动态关系的预测方法
CN112837078B (zh) 一种基于集群的用户异常行为检测方法
CN109033288A (zh) 一种基于bp神经网络的智能终端安全等级分类方法
Yu et al. Multipopulation management in evolutionary algorithms and application to complex warehouse scheduling problems
Barki et al. New approach for selecting multi-point relays in the optimized link state routing protocol using self-organizing map artificial neural network: OLSR-SOM
Mochinski et al. Developing an Intelligent Decision Support System for large-scale smart grid communication network planning
Jenson et al. Mining location information from users' spatio-temporal data
Behzadi et al. Introducing a novel method to solve shortest path problems based on structure of network using genetic algorithm
Wu Solving unconstrained global optimization problems via hybrid swarm intelligence approaches
Belaissaoui et al. Machine Learning techniques optimized by Practical Swarm optimization for Intrusions Detection in IoT.
Maheshwari et al. Representation learning on graphs by integrating content and structure information
Rohini et al. An Analysis of Structural Properties in Social Network Links in Educational Data Mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210316