CN108491417B - 一种基于用户访问行为的群体偏好上下文重构方法 - Google Patents

一种基于用户访问行为的群体偏好上下文重构方法 Download PDF

Info

Publication number
CN108491417B
CN108491417B CN201810114535.XA CN201810114535A CN108491417B CN 108491417 B CN108491417 B CN 108491417B CN 201810114535 A CN201810114535 A CN 201810114535A CN 108491417 B CN108491417 B CN 108491417B
Authority
CN
China
Prior art keywords
user
access
preference
time
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810114535.XA
Other languages
English (en)
Other versions
CN108491417A (zh
Inventor
江昊
谢菁
黄国豪
羿舒文
曾园园
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201810114535.XA priority Critical patent/CN108491417B/zh
Publication of CN108491417A publication Critical patent/CN108491417A/zh
Application granted granted Critical
Publication of CN108491417B publication Critical patent/CN108491417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于用户访问行为的群体偏好上下文重构方法,计算用户热点对基站的影响以及用户热时对时隙的影响;构建用户中心点特征;通过中心点特征以及内容向量计算关联矩阵;通过中心点特征以及关联矩阵计算效用向量并进一步构建中心点向量;通过新用户的效用向量以及中心点向量计算欧式距离向量,通过欧式距离向量计算群体上下文偏好向量;新用户继续到来更新群体上下文偏好向量并作为历史数据。与现有技术相比,本发明能重构群体偏好上下文并具有较强的适用性。

Description

一种基于用户访问行为的群体偏好上下文重构方法
技术领域
本发明涉及移动互联网技术领域,特别涉及一种基于用户访问行为的群体偏好上下文重构方法。
背景技术
互联网由人创造目的为了方便人的生活,所以互联网更多是的为人类服务。随着5G时代的到来,移动互联网在人类的生活中扮演了必不可少的角色。随着移动互联网的迅速发展,移动数据流量的需求量也增长的越来越快,移动流量需求量的激增加重了无线接入网中回程链路带宽的消耗。人类行为的分析,研究人类行为的时空统计规律,是流量卸载,构建5G社会研究的热点问题。
人类行为学算起来不过有百年的历史,但对它的研究却分布在各个领域。由于人类自身的复杂性和多样性,每一个领域也都面临着巨大的挑战。随着大数据时代,移动互联网的飞速发展,用户上网行为的大量数据变得更易于获取和分析,导致统计分析用户在某时间空间内表现出的相似行为也变得更加的容易。
用户上网行为的时间特性是用户多次发生上网行为在时间上表现出的统计规律,同理可以定义用户上网行为的空间特性。用户上网行为的时间特性和空间特性统称为时空特性。对用户上网行文的时空特性进行统计分析,可以发现用户的行为具有高度的可预测性,使网络服务商可以更有效的利用分配网络资源。但尽管用户上网行为的时空信息被广泛的用于人类行为学的分析,它们在预测用户兴趣偏好中的重要性还没有完全体现。
移动互联网中,传统的用户的上下文信息可以定义为与用户行为相关的因素,例如用户年龄,用户的性别,用户的收入等。这些因素都可能潜在的影响用户的上网行为。在移动互联网的研究中,用户的上下文信息开始逐渐的走进研究者的视野,上下文无关的应用算法与上下文有关的应用算法比较起来缺少了适用性,并且对用户上下文信息的直接统计学习是非常单一的。
所以在本发明中,我们对用户的访问行为的时间和空间特性进行了联合分析,并根据用户上网的大量数据统计用户访问的行为,并根据用户对URL的偏好程度重构了群体偏好上下文。
发明内容
为了解决现有技术存在的问题,提出了一种基于用户访问的中心行为重构群体偏好上下文的方法。
本发明所采用的技术方案是一种基于用户访问行为的群体偏好上下文重构方法,具体步骤如下:
步骤1:根据历史一周用户基站访问量数据构建用户基站访问量矩阵,根据用户基站访问量矩阵构建用户热点访问量矩阵,根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵,根据用户时隙访问量矩阵构建用户热时访问量矩阵,通过热点访问量矩阵计算用户热点中心信息增益,通过热时访问量矩阵计算用户热时中心信息增益,通过用户热点中心信息增益计算用户热点对访问基站的影响,通过用户热时中心信息增益计算用户热时对访问时隙的影响;
步骤2:根据URL类型划分用户兴趣的偏好,通过历史一周用户基站访问量数据得到热点的兴趣偏好以及热时的兴趣偏好,结合热点对访问基站的影响以及用户热时对访问时隙的影响构建用户中心点特征;
步骤3:通过用户中心点特征、内容向量以及用户中心点特征对内容向量的偏好程度计算关联矩阵;
步骤4:通过k-means聚类算法对用户效用向量进行分类,并根据偏好以及偏好类的对象构建中心点向量;
步骤5:通过新用户效用向量以及中心点向量计算新用户的欧式距离向量,通过新用户的欧式距离向量构建群体上下文偏好向量;
步骤6:新用户继续到来进一步更新群体上下文偏好向量并作为将来时刻的历史数据;
作为优选,步骤1中所述根据历史一周用户基站访问量数据构建用户基站访问量矩阵为:
Figure BDA0001570263700000021
其中,Nus为用户数量,Nsta为总基站数量,
Figure BDA0001570263700000022
为用户i在基站nsta一周访问量之和,i∈[1 Nus],nsta∈[1 Nsta];
步骤1中所述根据用户基站访问量矩阵构建用户热点访问量矩阵为将用户基站访问量矩阵S的行向量根据
Figure BDA0001570263700000031
大小按降序排列,选择前m个基站作为用户i的热点,构建用户热点访问量矩阵:
Figure BDA0001570263700000032
其中,Nus为用户数量,m为热点数量,
Figure BDA0001570263700000033
为用户i在基站
Figure BDA0001570263700000034
(等效于热点nm)一周访问量之和,
Figure BDA0001570263700000035
步骤1中所述根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵为:
Figure BDA0001570263700000036
其中,Nus为用户数量,将1天划分成的24个时隙,以小时为单位,Nti为一天划分时隙数量,
Figure BDA0001570263700000037
为用户i在时隙nti一周访问量之和,nti∈[1 Nti];
步骤1中所述根据用户时隙访问量矩阵构建用户热时访问量矩阵为将用户基站访问量矩阵T的行向量根据
Figure BDA0001570263700000038
大小按降序排列,选择前n个基站作为用户i的热时,构建用户热时访问量矩阵:
Figure BDA0001570263700000039
其中,Nus为用户数量,n为热时数量,
Figure BDA00015702637000000310
为用户i在时隙
Figure BDA00015702637000000311
(等效于热时nn)一周访问量之和,
Figure BDA00015702637000000312
步骤1中所述用户热点中心信息增益为:
Figure BDA0001570263700000041
其中,Nold为用户访问过的基站总数,
Figure BDA0001570263700000042
为用户i在热点nm的访问量,
Figure BDA0001570263700000043
为用户i在所有访问基站的平均访问量,这里
Figure BDA0001570263700000044
Figure BDA0001570263700000045
步骤1中所述用户热时中心信息增益为:
Figure BDA0001570263700000046
其中,Nt为用户一周访问过的时隙总数,这里不同日期内的相同时隙计为同一时隙,Nt∈[1Nti],
Figure BDA0001570263700000047
为用户i在热时nn的访问量,
Figure BDA0001570263700000048
为用户i在所有访问时隙的平均访问量,这里
Figure BDA0001570263700000049
步骤1中所述用户热点对访问基站的影响为:
Figure BDA00015702637000000410
其中,dist(nsta,nm)为基站nsta与用户i的热点nm之间的欧氏距离,i∈[1 Nus],nsta∈[1 Nsta],nm∈[1 nbase];
步骤1中所述用户热时对访问时隙的影响为:
Figure BDA00015702637000000411
其中,inter(nti,nn)为时隙nti与用户i的热时nn之间的时间间隔,i∈[1 Nus],nti∈[1 Nti],nn∈[1 ntime];
作为优选,步骤2中所述根据URL类型划分用户兴趣的偏好为h类,步骤2中所述热点的兴趣偏好为:
Figure BDA00015702637000000412
步骤2中所述热时的兴趣偏好为:
Figure BDA00015702637000000413
步骤2中所述用户中心点特征为:
Figure BDA0001570263700000051
其中,i为用户序号,i∈[1Nus],
Figure BDA0001570263700000052
Figure BDA0001570263700000053
为步骤1中所述用户i热点对访问基站的影响,
Figure BDA0001570263700000054
Figure BDA0001570263700000055
为步骤1中所述用户i热时对访问时隙的影响;
作为优选,步骤3中所述用户中心点特征对内容向量的偏好程度为:
Figure BDA0001570263700000056
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1 Nus],W为关联矩阵,zj为步骤2中用户兴趣的偏好的子类内容向量,j为子类内容向量序号,j∈[1 Ne],可以从步骤1中所述基站获得;
用户中心点特征xi对内容zj的真实偏好为rij,rij与sij服从均值为0,方差为σ2的正态分布:
Figure BDA0001570263700000057
步骤3中所述计算关联矩阵为关联矩阵W的每个元素服从均值为0,方差为ζ2的正态分布,由贝叶斯公式可得后验概率为:
p(sij|rij)=p(rij|sij)*p(W)
通过求解最大后验概率的方法,可求解出关联矩阵W;
作为优选,步骤4中所述用户效用向量为:
Figure BDA0001570263700000058
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1 Nus],W为步骤3所述关联矩阵;
步骤4中所述k-means聚类算法对效用向量进行分类为Np个偏好类
Figure BDA0001570263700000059
,偏好类个数Np由轮廓系数α决定;
将偏好类
Figure BDA0001570263700000061
o∈[1,Np]中所有对象的均值作为偏好类Co的中心点Xo
Figure BDA0001570263700000062
步骤4中所述中心点向量为:
Figure BDA0001570263700000066
作为优选,步骤5中所述新用户r的欧式距离向量为:
Figure BDA0001570263700000063
其中,根据所述步骤4构建新用户r的效用向量为
Figure BDA0001570263700000064
r∈[1,q],r为新用户的序号,q为新用户的数量,X为步骤4中所述中心点向量;
步骤5中所述群体上下文偏好向量为:
Figure BDA0001570263700000065
其中,新用户r的欧式距离向量为Zr,r∈[1,q],r为新用户的序号,q为新用户的数量。
与现有技术相比,本发明能重构群体偏好上下文并具有较强的适用性。
附图说明
图1:为本发明实施例的方法流程图;
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,是本发明实施例的方法流程图。本发明提供了一种基于用户访问行为的群体偏好上下文重构方法,包括以下步骤:
步骤1:根据历史一周用户基站访问量数据构建用户基站访问量矩阵,根据用户基站访问量矩阵构建用户热点访问量矩阵,根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵,根据用户时隙访问量矩阵构建用户热时访问量矩阵,通过热点访问量矩阵计算用户热点中心信息增益,通过热时访问量矩阵计算用户热时中心信息增益,通过用户热点中心信息增益计算用户热点对访问基站的影响,通过用户热时中心信息增益计算用户热时对访问时隙的影响;
步骤1中所述根据历史一周用户基站访问量数据构建用户基站访问量矩阵为:
Figure BDA0001570263700000071
其中,Nus=251688为用户数量,Nsta=2542为总基站数量,
Figure BDA0001570263700000072
为用户i在基站nsta一周访问量之和,i∈[1Nus],nsta∈[1Nsta];
步骤1中所述根据用户基站访问量矩阵构建用户热点访问量矩阵为将用户基站访问量矩阵S的行向量根据
Figure BDA0001570263700000073
大小按降序排列,选择前m个基站作为用户i的热点,构建用户热点访问量矩阵:
Figure BDA0001570263700000074
其中,Nus为用户数量,m为热点数量,
Figure BDA0001570263700000075
为用户i在基站
Figure BDA0001570263700000076
(等效于热点nm)一周访问量之和,
Figure BDA0001570263700000077
步骤1中所述根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵为:
Figure BDA0001570263700000081
其中,Nus=251688为用户数量,Nti=24为一天划分时隙数量,
Figure BDA0001570263700000082
为用户i在时隙nti一周访问量之和,nti∈[1Nti];
步骤1中所述根据用户时隙访问量矩阵构建用户热时访问量矩阵为将用户时隙访问量矩阵T的行向量根据
Figure BDA0001570263700000083
大小按降序排列,选择前n个时隙作为用户i的热时,构建用户热时访问量矩阵:
Figure BDA0001570263700000084
其中,Nus=251688为用户数量,Nti=24为一天划分时隙数量,n为热时数量,
Figure BDA0001570263700000085
为用户i在时隙
Figure BDA0001570263700000086
(等效于热时nn)一周访问量之和,
Figure BDA0001570263700000087
Figure BDA0001570263700000088
步骤1中所述用户热点中心信息增益为:
Figure BDA0001570263700000089
其中,Nold为用户访问过的基站总数,Nold∈[1Nsta],Nsta=2542为总基站数量,
Figure BDA00015702637000000810
为用户i在热点nm的访问量,
Figure BDA00015702637000000811
为用户i在所有访问基站的平均访问量,这里
Figure BDA00015702637000000812
步骤1中所述用户热时中心信息增益为:
Figure BDA00015702637000000813
其中,Nt为用户一周访问过的时隙总数,这里不同日期内的相同时隙计为同一时隙,Nt∈[1Nti],Nti=24为一天划分时隙数量,
Figure BDA0001570263700000091
为用户i在热时nn的访问量,
Figure BDA0001570263700000092
为用户i在所有访问时隙的平均访问量,这里
Figure BDA0001570263700000093
Figure BDA0001570263700000094
步骤1中所述用户热点对访问基站的影响为:
Figure BDA0001570263700000095
其中,dist(nsta,nm)为基站nsta与用户i的热点nm之间的欧氏距离,i∈[1Nus],nsta∈[1Nsta],nm∈[1nbase],Nus=251688为用户数量,Nsta=2542为总基站数量;
步骤1中所述用户热时对访问时隙的影响为:
Figure BDA0001570263700000096
其中,inter(nti,nn)为时隙nti与用户i的热时nn之间的时间间隔,i∈[1 Nus],nti∈[1 Nti],nn∈[1 ntime],Nus=251688为用户数量,Nti=24为一天划分时隙数量;
步骤2:根据URL类型划分用户兴趣的偏好,通过历史一周用户基站访问量数据得到热点的兴趣偏好以及热时的兴趣偏好,结合热点对访问基站的影响以及用户热时对访问时隙的影响构建用户中心点特征;
步骤2中所述根据URL类型划分用户兴趣的偏好为h=18类,步骤2中所述热点的兴趣偏好为:
Figure BDA0001570263700000097
步骤2中所述热时的兴趣偏好为:
Figure BDA0001570263700000098
步骤2中所述用户中心点特征为:
Figure BDA0001570263700000099
其中,i为用户序号,i∈[1 Nus],Nus=251688为用户数,
Figure BDA0001570263700000101
Figure BDA0001570263700000102
为步骤1中所述用户i热点对访问基站的影响,
Figure BDA0001570263700000103
Figure BDA0001570263700000104
为步骤1中所述用户i热时对访问时隙的影响;
步骤3:通过用户中心点特征、内容向量以及用户中心点特征对内容向量的偏好程度计算关联矩阵;
步骤3中所述用户中心点特征对内容向量的偏好程度为:
Figure BDA0001570263700000105
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1 Nus],Nus=251688为用户数,W为关联矩阵,zj为步骤2中用户兴趣的偏好的子类内容向量,j为子类内容向量序号,j∈[1 Ne],Ne=215可以从步骤1中所述基站获得;
用户中心点特征xi对内容zj的真实偏好为rij,rij与sij服从均值为0,方差为σ2的正态分布:
Figure BDA0001570263700000106
步骤3中所述计算关联矩阵为关联矩阵W的每个元素服从均值为0,方差为ζ2的正态分布,由贝叶斯公式可得后验概率为:
p(sij|rij)=p(rij|sij)*p(W)
通过求解最大后验概率的方法,可求解出关联矩阵W;
步骤4:通过k-means聚类算法对用户效用向量进行分类,并根据偏好以及偏好类的对象构建中心点向量;
步骤4中所述用户效用向量为:
Figure BDA0001570263700000107
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1Nus],W为步骤3所述关联矩阵;
步骤4中所述k-means聚类算法对效用向量进行分类为Np个偏好类
Figure BDA0001570263700000108
偏好类个数Np=4由轮廓系数α=0.724决定;
将偏好类
Figure BDA0001570263700000111
o∈[1,Np]中所有对象的均值作为偏好类Co的中心点Xo
Figure BDA0001570263700000112
步骤4中所述中心点向量为:
Figure BDA0001570263700000116
步骤5:通过新用户效用向量以及中心点向量计算新用户的欧式距离向量,通过新用户的欧式距离向量构建群体上下文偏好向量;
步骤5中所述新用户r的欧式距离向量为:
Figure BDA0001570263700000113
其中,根据所述步骤4构建新用户r的效用向量为
Figure BDA0001570263700000114
r∈[1,q],r为新用户的序号,q=8579为新用户的数量,X为步骤4中所述中心点向量;
步骤5中所述群体上下文偏好向量为:
Figure BDA0001570263700000115
其中,新用户r的欧式距离向量为Zr,r∈[1,q],r为新用户的序号,q=8579为新用户的数量,Np=4为偏好类个数;
步骤6:新用户继续到来进一步更新群体上下文偏好向量并作为将来时刻的历史数据。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (2)

1.一种基于用户访问行为的群体偏好上下文重构方法,其特征在于,包括以下步骤:
步骤1:根据历史一周用户基站访问量数据构建用户基站访问量矩阵,根据用户基站访问量矩阵构建用户热点访问量矩阵,根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵,根据用户时隙访问量矩阵构建用户热时访问量矩阵,通过热点访问量矩阵计算用户热点中心信息增益,通过热时访问量矩阵计算用户热时中心信息增益,通过用户热点中心信息增益计算用户热点对访问基站的影响,通过用户热时中心信息增益计算用户热时对访问时隙的影响;
步骤2:根据URL类型划分用户兴趣的偏好,通过历史一周用户基站访问量数据得到热点的兴趣偏好以及热时的兴趣偏好,结合热点对访问基站的影响以及用户热时对访问时隙的影响构建用户中心点特征;
步骤3:通过用户中心点特征、内容向量以及用户中心点特征对内容向量的偏好程度计算关联矩阵;
步骤4:通过k-means聚类算法对用户效用向量进行分类,并根据偏好以及偏好类的对象构建中心点向量;
步骤5:通过新用户效用向量以及中心点向量计算新用户的欧式距离向量,通过新用户的欧式距离向量构建群体上下文偏好向量;
步骤5中所述新用户的欧式距离向量为:
Figure FDA0003311716080000011
其中,根据所述步骤4构建新用户r的效用向量为
Figure FDA0003311716080000012
r∈[1,q],r为新用户的序号,q为新用户的数量,X为步骤4中所述中心点向量;
步骤6:新用户继续到来进一步更新群体上下文偏好向量并作为将来时刻的历史数据。
2.根据权利要求1所述的基于用户访问行为的群体偏好上下文重构方法,其特征在于,步骤1中所述根据历史一周用户基站访问量数据构建用户基站访问量矩阵为:
Figure FDA0003311716080000021
其中,Nus为用户数量,Nsta为总基站数量,
Figure FDA0003311716080000022
为用户i在基站nsta一周访问量之和,i∈[1,Nus],nsta∈[1,Nsta];
步骤1中所述根据用户基站访问量矩阵构建用户热点访问量矩阵为将用户基站热点访问量矩阵S的行向量根据
Figure FDA0003311716080000023
大小按降序排列,选择前m个基站作为用户i的热点,构建用户热点访问量矩阵:
Figure FDA0003311716080000024
其中,Nus为用户数量,m为热点数量,
Figure FDA0003311716080000025
为用户i在基站
Figure FDA0003311716080000026
一周访问量之和,i∈[1 Nus],
Figure FDA0003311716080000027
nm∈[1 nbase];
步骤1中所述根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵为:
Figure FDA0003311716080000028
其中,Nus为用户数量,将1天划分成的24个时隙,以小时为单位,Nti为一天划分时隙数量,
Figure FDA0003311716080000029
为用户i在时隙nti一周访问量之和,nti∈[1,Nti];
步骤1中所述根据用户时隙访问量矩阵构建用户热时访问量矩阵为将用户基站热时访问量矩阵T的行向量根据
Figure FDA00033117160800000210
大小按降序排列,选择前n个基站作为用户i的热时,构建用户热时访问量矩阵:
Figure FDA0003311716080000031
其中,Nus为用户数量,n为热时数量,
Figure FDA0003311716080000032
为用户i在时隙
Figure FDA0003311716080000033
一周访问量之和,i∈[1 Nus],
Figure FDA0003311716080000034
nn∈[1 ntime];
步骤1中所述用户热点中心信息增益为:
Figure FDA0003311716080000035
其中,Nold为用户访问过的基站总数,Nold∈[1,Nsta],
Figure FDA0003311716080000036
为用户i在热点nm的访问量,
Figure FDA0003311716080000037
为用户i在所有访问基站的平均访问量,这里
Figure FDA0003311716080000038
步骤1中所述用户热时中心信息增益为:
Figure FDA0003311716080000039
其中,Nt为用户一周访问过的时隙总数,这里不同日期内的相同时隙计为同一时隙,Nt∈[1,Nti],
Figure FDA00033117160800000310
为用户i在热时nn的访问量,
Figure FDA00033117160800000311
为用户i在所有访问时隙的平均访问量,这里
Figure FDA00033117160800000312
步骤1中所述用户热点对访问基站的影响为:
Figure FDA00033117160800000313
其中,dist(nsta,nm)为基站nsta与用户i的热点nm之间的欧氏距离,
i∈[1,Nus],nsta∈[1,Nsta],nm∈[1,base];
步骤1中所述用户热时对访问时隙的影响为:
Figure FDA00033117160800000314
其中,inter(nti,nn)为时隙nti与用户i的热时nn之间的时间间隔,i∈[1,Nus],nti∈[1,Nti],nn∈[1,ntime];
步骤2中所述根据URL类型划分用户兴趣的偏好为h类,步骤2中所述热点的兴趣偏好为:
Figure FDA0003311716080000041
步骤2中所述热时的兴趣偏好为:
Figure FDA0003311716080000042
步骤2中所述用户中心点特征为:
Figure FDA0003311716080000043
其中,i为用户序号,i∈[1,Nus],
Figure FDA0003311716080000044
Figure FDA0003311716080000045
为步骤1中所述用户i热点对访问基站的影响,
Figure FDA0003311716080000046
Figure FDA0003311716080000047
为步骤1中所述用户i热时对访问时隙的影响;
步骤3中所述用户中心点特征对内容向量的偏好程度为:
sij=xi TWzj
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1,Nus],W为关联矩阵,zj为步骤2中用户兴趣的偏好的子类内容向量,j为子类内容向量序号,j∈[1,Ne],可以从步骤1中所述基站获得,Ne表达基站子类内容的总数;
用户中心点特征xi对用户兴趣的偏好的子类内容向量zj的真实偏好为rij,rij与sij服从均值为0,方差为σ2的正态分布:
Figure FDA0003311716080000048
步骤3中所述计算关联矩阵为关联矩阵W的每个元素服从均值为0,方差为
Figure FDA0003311716080000049
的正态分布,由贝叶斯公式可得后验概率为:
p(sij|rij)=p(rij|sij)*p(W)
通过求解最大后验概率的方法,可求解出关联矩阵W;
步骤4中所述用户效用向量为:
Figure FDA0003311716080000051
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1,Nus],W为步骤3所述关联矩阵;
步骤4中所述k-means聚类算法对效用向量进行分类为Np个偏好类
Figure FDA0003311716080000055
偏好类个数Np由轮廓系数α决定;
将偏好类
Figure FDA0003311716080000052
o∈[1,Np]中所有对象的均值作为偏好类Co的中心点Xo
Figure FDA0003311716080000053
步骤4中所述中心点向量为:
Figure FDA0003311716080000054
CN201810114535.XA 2018-02-05 2018-02-05 一种基于用户访问行为的群体偏好上下文重构方法 Active CN108491417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810114535.XA CN108491417B (zh) 2018-02-05 2018-02-05 一种基于用户访问行为的群体偏好上下文重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810114535.XA CN108491417B (zh) 2018-02-05 2018-02-05 一种基于用户访问行为的群体偏好上下文重构方法

Publications (2)

Publication Number Publication Date
CN108491417A CN108491417A (zh) 2018-09-04
CN108491417B true CN108491417B (zh) 2021-12-03

Family

ID=63344294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810114535.XA Active CN108491417B (zh) 2018-02-05 2018-02-05 一种基于用户访问行为的群体偏好上下文重构方法

Country Status (1)

Country Link
CN (1) CN108491417B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191117A (zh) * 2019-12-11 2020-05-22 中国地质大学(武汉) 一种用于政务地图服务的精准性用户兴趣检测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611785A (zh) * 2011-01-20 2012-07-25 北京邮电大学 面向手机的移动用户个性化新闻主动推荐服务系统及方法
CN104408643A (zh) * 2014-10-30 2015-03-11 西北大学 一种行为感知偏好获取系统及其获取方法
CN105430062A (zh) * 2015-11-04 2016-03-23 国家电网公司 一种基于兴趣-相关度的移动p2p网络数据预取方法
CN105682023A (zh) * 2015-12-31 2016-06-15 广州杰赛科技股份有限公司 一种用户聚集热点区域识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100281025A1 (en) * 2009-05-04 2010-11-04 Motorola, Inc. Method and system for recommendation of content items

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611785A (zh) * 2011-01-20 2012-07-25 北京邮电大学 面向手机的移动用户个性化新闻主动推荐服务系统及方法
CN104408643A (zh) * 2014-10-30 2015-03-11 西北大学 一种行为感知偏好获取系统及其获取方法
CN105430062A (zh) * 2015-11-04 2016-03-23 国家电网公司 一种基于兴趣-相关度的移动p2p网络数据预取方法
CN105682023A (zh) * 2015-12-31 2016-06-15 广州杰赛科技股份有限公司 一种用户聚集热点区域识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向用户行为理解的移动通讯数据可视分析;蒋宏宇等;《浙江大学学报(理学版)》;20180131;第45卷(第1期);第37-43页 *

Also Published As

Publication number Publication date
CN108491417A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
CN109902849B (zh) 用户行为预测方法及装置、行为预测模型训练方法及装置
US11188935B2 (en) Analyzing consumer behavior based on location visitation
US11823218B2 (en) Customer clustering using integer programming
CN109145210B (zh) 一种信息推荐的方法、装置及存储介质
CN108804551B (zh) 一种兼顾多样性与个性化的空间兴趣点推荐方法
CN109492166A (zh) 基于签到时间间隔模式的连续兴趣点推荐方法
CN101821757A (zh) 广告方法、sns广告系统以及记录介质
CN108205570A (zh) 一种数据检测方法和装置
CN106776925B (zh) 一种移动终端用户性别的预测方法、服务器和系统
CN105023026B (zh) 一种基于非负矩阵分解的半监督聚类方法及系统
CN110766438A (zh) 一种通过人工智能对电网用户的用户行为进行分析的方法
CN106649733B (zh) 一种基于无线接入点情境分类与感知的在线视频推荐方法
US20140207718A1 (en) Method and apparatus for identifying users from rating patterns
CN108491417B (zh) 一种基于用户访问行为的群体偏好上下文重构方法
CN105681089B (zh) 网络用户行为聚类方法、装置及终端
US20220167034A1 (en) Device topological signatures for identifying and classifying mobile device users based on mobile browsing patterns
CN112925990A (zh) 目标群体分类方法及装置
Du et al. Monte-carlo tree search aided contextual online learning approach for wireless caching
Wang et al. Predicting attributes and friends of mobile users from AP-Trajectories
Mishra et al. Efficient proactive caching in storage constrained 5g small cells
US20220167051A1 (en) Automatic classification of households based on content consumption
CN117112880A (zh) 信息推荐、多目标推荐模型训练方法、装置和计算机设备
CN114398960A (zh) 目标用户确定方法及装置、电子设备及存储介质
CN113935407A (zh) 一种异常行为识别模型确定方法及装置
CN115345635A (zh) 推荐内容的处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant