CN108491417B - 一种基于用户访问行为的群体偏好上下文重构方法 - Google Patents
一种基于用户访问行为的群体偏好上下文重构方法 Download PDFInfo
- Publication number
- CN108491417B CN108491417B CN201810114535.XA CN201810114535A CN108491417B CN 108491417 B CN108491417 B CN 108491417B CN 201810114535 A CN201810114535 A CN 201810114535A CN 108491417 B CN108491417 B CN 108491417B
- Authority
- CN
- China
- Prior art keywords
- user
- access
- preference
- time
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于用户访问行为的群体偏好上下文重构方法,计算用户热点对基站的影响以及用户热时对时隙的影响;构建用户中心点特征;通过中心点特征以及内容向量计算关联矩阵;通过中心点特征以及关联矩阵计算效用向量并进一步构建中心点向量;通过新用户的效用向量以及中心点向量计算欧式距离向量,通过欧式距离向量计算群体上下文偏好向量;新用户继续到来更新群体上下文偏好向量并作为历史数据。与现有技术相比,本发明能重构群体偏好上下文并具有较强的适用性。
Description
技术领域
本发明涉及移动互联网技术领域,特别涉及一种基于用户访问行为的群体偏好上下文重构方法。
背景技术
互联网由人创造目的为了方便人的生活,所以互联网更多是的为人类服务。随着5G时代的到来,移动互联网在人类的生活中扮演了必不可少的角色。随着移动互联网的迅速发展,移动数据流量的需求量也增长的越来越快,移动流量需求量的激增加重了无线接入网中回程链路带宽的消耗。人类行为的分析,研究人类行为的时空统计规律,是流量卸载,构建5G社会研究的热点问题。
人类行为学算起来不过有百年的历史,但对它的研究却分布在各个领域。由于人类自身的复杂性和多样性,每一个领域也都面临着巨大的挑战。随着大数据时代,移动互联网的飞速发展,用户上网行为的大量数据变得更易于获取和分析,导致统计分析用户在某时间空间内表现出的相似行为也变得更加的容易。
用户上网行为的时间特性是用户多次发生上网行为在时间上表现出的统计规律,同理可以定义用户上网行为的空间特性。用户上网行为的时间特性和空间特性统称为时空特性。对用户上网行文的时空特性进行统计分析,可以发现用户的行为具有高度的可预测性,使网络服务商可以更有效的利用分配网络资源。但尽管用户上网行为的时空信息被广泛的用于人类行为学的分析,它们在预测用户兴趣偏好中的重要性还没有完全体现。
移动互联网中,传统的用户的上下文信息可以定义为与用户行为相关的因素,例如用户年龄,用户的性别,用户的收入等。这些因素都可能潜在的影响用户的上网行为。在移动互联网的研究中,用户的上下文信息开始逐渐的走进研究者的视野,上下文无关的应用算法与上下文有关的应用算法比较起来缺少了适用性,并且对用户上下文信息的直接统计学习是非常单一的。
所以在本发明中,我们对用户的访问行为的时间和空间特性进行了联合分析,并根据用户上网的大量数据统计用户访问的行为,并根据用户对URL的偏好程度重构了群体偏好上下文。
发明内容
为了解决现有技术存在的问题,提出了一种基于用户访问的中心行为重构群体偏好上下文的方法。
本发明所采用的技术方案是一种基于用户访问行为的群体偏好上下文重构方法,具体步骤如下:
步骤1:根据历史一周用户基站访问量数据构建用户基站访问量矩阵,根据用户基站访问量矩阵构建用户热点访问量矩阵,根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵,根据用户时隙访问量矩阵构建用户热时访问量矩阵,通过热点访问量矩阵计算用户热点中心信息增益,通过热时访问量矩阵计算用户热时中心信息增益,通过用户热点中心信息增益计算用户热点对访问基站的影响,通过用户热时中心信息增益计算用户热时对访问时隙的影响;
步骤2:根据URL类型划分用户兴趣的偏好,通过历史一周用户基站访问量数据得到热点的兴趣偏好以及热时的兴趣偏好,结合热点对访问基站的影响以及用户热时对访问时隙的影响构建用户中心点特征;
步骤3:通过用户中心点特征、内容向量以及用户中心点特征对内容向量的偏好程度计算关联矩阵;
步骤4:通过k-means聚类算法对用户效用向量进行分类,并根据偏好以及偏好类的对象构建中心点向量;
步骤5:通过新用户效用向量以及中心点向量计算新用户的欧式距离向量,通过新用户的欧式距离向量构建群体上下文偏好向量;
步骤6:新用户继续到来进一步更新群体上下文偏好向量并作为将来时刻的历史数据;
作为优选,步骤1中所述根据历史一周用户基站访问量数据构建用户基站访问量矩阵为:
步骤1中所述根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵为:
步骤1中所述用户热点中心信息增益为:
步骤1中所述用户热时中心信息增益为:
步骤1中所述用户热点对访问基站的影响为:
其中,dist(nsta,nm)为基站nsta与用户i的热点nm之间的欧氏距离,i∈[1 Nus],nsta∈[1 Nsta],nm∈[1 nbase];
步骤1中所述用户热时对访问时隙的影响为:
其中,inter(nti,nn)为时隙nti与用户i的热时nn之间的时间间隔,i∈[1 Nus],nti∈[1 Nti],nn∈[1 ntime];
作为优选,步骤2中所述根据URL类型划分用户兴趣的偏好为h类,步骤2中所述热点的兴趣偏好为:
步骤2中所述热时的兴趣偏好为:
步骤2中所述用户中心点特征为:
作为优选,步骤3中所述用户中心点特征对内容向量的偏好程度为:
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1 Nus],W为关联矩阵,zj为步骤2中用户兴趣的偏好的子类内容向量,j为子类内容向量序号,j∈[1 Ne],可以从步骤1中所述基站获得;
用户中心点特征xi对内容zj的真实偏好为rij,rij与sij服从均值为0,方差为σ2的正态分布:
步骤3中所述计算关联矩阵为关联矩阵W的每个元素服从均值为0,方差为ζ2的正态分布,由贝叶斯公式可得后验概率为:
p(sij|rij)=p(rij|sij)*p(W)
通过求解最大后验概率的方法,可求解出关联矩阵W;
作为优选,步骤4中所述用户效用向量为:
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1 Nus],W为步骤3所述关联矩阵;
步骤4中所述中心点向量为:
作为优选,步骤5中所述新用户r的欧式距离向量为:
步骤5中所述群体上下文偏好向量为:
其中,新用户r的欧式距离向量为Zr,r∈[1,q],r为新用户的序号,q为新用户的数量。
与现有技术相比,本发明能重构群体偏好上下文并具有较强的适用性。
附图说明
图1:为本发明实施例的方法流程图;
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,是本发明实施例的方法流程图。本发明提供了一种基于用户访问行为的群体偏好上下文重构方法,包括以下步骤:
步骤1:根据历史一周用户基站访问量数据构建用户基站访问量矩阵,根据用户基站访问量矩阵构建用户热点访问量矩阵,根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵,根据用户时隙访问量矩阵构建用户热时访问量矩阵,通过热点访问量矩阵计算用户热点中心信息增益,通过热时访问量矩阵计算用户热时中心信息增益,通过用户热点中心信息增益计算用户热点对访问基站的影响,通过用户热时中心信息增益计算用户热时对访问时隙的影响;
步骤1中所述根据历史一周用户基站访问量数据构建用户基站访问量矩阵为:
步骤1中所述根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵为:
步骤1中所述用户热点中心信息增益为:
步骤1中所述用户热时中心信息增益为:
步骤1中所述用户热点对访问基站的影响为:
其中,dist(nsta,nm)为基站nsta与用户i的热点nm之间的欧氏距离,i∈[1Nus],nsta∈[1Nsta],nm∈[1nbase],Nus=251688为用户数量,Nsta=2542为总基站数量;
步骤1中所述用户热时对访问时隙的影响为:
其中,inter(nti,nn)为时隙nti与用户i的热时nn之间的时间间隔,i∈[1 Nus],nti∈[1 Nti],nn∈[1 ntime],Nus=251688为用户数量,Nti=24为一天划分时隙数量;
步骤2:根据URL类型划分用户兴趣的偏好,通过历史一周用户基站访问量数据得到热点的兴趣偏好以及热时的兴趣偏好,结合热点对访问基站的影响以及用户热时对访问时隙的影响构建用户中心点特征;
步骤2中所述根据URL类型划分用户兴趣的偏好为h=18类,步骤2中所述热点的兴趣偏好为:
步骤2中所述热时的兴趣偏好为:
步骤2中所述用户中心点特征为:
步骤3:通过用户中心点特征、内容向量以及用户中心点特征对内容向量的偏好程度计算关联矩阵;
步骤3中所述用户中心点特征对内容向量的偏好程度为:
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1 Nus],Nus=251688为用户数,W为关联矩阵,zj为步骤2中用户兴趣的偏好的子类内容向量,j为子类内容向量序号,j∈[1 Ne],Ne=215可以从步骤1中所述基站获得;
用户中心点特征xi对内容zj的真实偏好为rij,rij与sij服从均值为0,方差为σ2的正态分布:
步骤3中所述计算关联矩阵为关联矩阵W的每个元素服从均值为0,方差为ζ2的正态分布,由贝叶斯公式可得后验概率为:
p(sij|rij)=p(rij|sij)*p(W)
通过求解最大后验概率的方法,可求解出关联矩阵W;
步骤4:通过k-means聚类算法对用户效用向量进行分类,并根据偏好以及偏好类的对象构建中心点向量;
步骤4中所述用户效用向量为:
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1Nus],W为步骤3所述关联矩阵;
步骤4中所述中心点向量为:
步骤5:通过新用户效用向量以及中心点向量计算新用户的欧式距离向量,通过新用户的欧式距离向量构建群体上下文偏好向量;
步骤5中所述新用户r的欧式距离向量为:
步骤5中所述群体上下文偏好向量为:
其中,新用户r的欧式距离向量为Zr,r∈[1,q],r为新用户的序号,q=8579为新用户的数量,Np=4为偏好类个数;
步骤6:新用户继续到来进一步更新群体上下文偏好向量并作为将来时刻的历史数据。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (2)
1.一种基于用户访问行为的群体偏好上下文重构方法,其特征在于,包括以下步骤:
步骤1:根据历史一周用户基站访问量数据构建用户基站访问量矩阵,根据用户基站访问量矩阵构建用户热点访问量矩阵,根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵,根据用户时隙访问量矩阵构建用户热时访问量矩阵,通过热点访问量矩阵计算用户热点中心信息增益,通过热时访问量矩阵计算用户热时中心信息增益,通过用户热点中心信息增益计算用户热点对访问基站的影响,通过用户热时中心信息增益计算用户热时对访问时隙的影响;
步骤2:根据URL类型划分用户兴趣的偏好,通过历史一周用户基站访问量数据得到热点的兴趣偏好以及热时的兴趣偏好,结合热点对访问基站的影响以及用户热时对访问时隙的影响构建用户中心点特征;
步骤3:通过用户中心点特征、内容向量以及用户中心点特征对内容向量的偏好程度计算关联矩阵;
步骤4:通过k-means聚类算法对用户效用向量进行分类,并根据偏好以及偏好类的对象构建中心点向量;
步骤5:通过新用户效用向量以及中心点向量计算新用户的欧式距离向量,通过新用户的欧式距离向量构建群体上下文偏好向量;
步骤5中所述新用户的欧式距离向量为:
步骤6:新用户继续到来进一步更新群体上下文偏好向量并作为将来时刻的历史数据。
2.根据权利要求1所述的基于用户访问行为的群体偏好上下文重构方法,其特征在于,步骤1中所述根据历史一周用户基站访问量数据构建用户基站访问量矩阵为:
步骤1中所述根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵为:
步骤1中所述用户热点中心信息增益为:
步骤1中所述用户热时中心信息增益为:
步骤1中所述用户热点对访问基站的影响为:
其中,dist(nsta,nm)为基站nsta与用户i的热点nm之间的欧氏距离,
i∈[1,Nus],nsta∈[1,Nsta],nm∈[1,base];
步骤1中所述用户热时对访问时隙的影响为:
其中,inter(nti,nn)为时隙nti与用户i的热时nn之间的时间间隔,i∈[1,Nus],nti∈[1,Nti],nn∈[1,ntime];
步骤2中所述根据URL类型划分用户兴趣的偏好为h类,步骤2中所述热点的兴趣偏好为:
步骤2中所述热时的兴趣偏好为:
步骤2中所述用户中心点特征为:
步骤3中所述用户中心点特征对内容向量的偏好程度为:
sij=xi TWzj
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1,Nus],W为关联矩阵,zj为步骤2中用户兴趣的偏好的子类内容向量,j为子类内容向量序号,j∈[1,Ne],可以从步骤1中所述基站获得,Ne表达基站子类内容的总数;
用户中心点特征xi对用户兴趣的偏好的子类内容向量zj的真实偏好为rij,rij与sij服从均值为0,方差为σ2的正态分布:
p(sij|rij)=p(rij|sij)*p(W)
通过求解最大后验概率的方法,可求解出关联矩阵W;
步骤4中所述用户效用向量为:
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1,Nus],W为步骤3所述关联矩阵;
步骤4中所述中心点向量为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810114535.XA CN108491417B (zh) | 2018-02-05 | 2018-02-05 | 一种基于用户访问行为的群体偏好上下文重构方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810114535.XA CN108491417B (zh) | 2018-02-05 | 2018-02-05 | 一种基于用户访问行为的群体偏好上下文重构方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108491417A CN108491417A (zh) | 2018-09-04 |
CN108491417B true CN108491417B (zh) | 2021-12-03 |
Family
ID=63344294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810114535.XA Active CN108491417B (zh) | 2018-02-05 | 2018-02-05 | 一种基于用户访问行为的群体偏好上下文重构方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108491417B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111191117A (zh) * | 2019-12-11 | 2020-05-22 | 中国地质大学(武汉) | 一种用于政务地图服务的精准性用户兴趣检测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102611785A (zh) * | 2011-01-20 | 2012-07-25 | 北京邮电大学 | 面向手机的移动用户个性化新闻主动推荐服务系统及方法 |
CN104408643A (zh) * | 2014-10-30 | 2015-03-11 | 西北大学 | 一种行为感知偏好获取系统及其获取方法 |
CN105430062A (zh) * | 2015-11-04 | 2016-03-23 | 国家电网公司 | 一种基于兴趣-相关度的移动p2p网络数据预取方法 |
CN105682023A (zh) * | 2015-12-31 | 2016-06-15 | 广州杰赛科技股份有限公司 | 一种用户聚集热点区域识别方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100281025A1 (en) * | 2009-05-04 | 2010-11-04 | Motorola, Inc. | Method and system for recommendation of content items |
-
2018
- 2018-02-05 CN CN201810114535.XA patent/CN108491417B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102611785A (zh) * | 2011-01-20 | 2012-07-25 | 北京邮电大学 | 面向手机的移动用户个性化新闻主动推荐服务系统及方法 |
CN104408643A (zh) * | 2014-10-30 | 2015-03-11 | 西北大学 | 一种行为感知偏好获取系统及其获取方法 |
CN105430062A (zh) * | 2015-11-04 | 2016-03-23 | 国家电网公司 | 一种基于兴趣-相关度的移动p2p网络数据预取方法 |
CN105682023A (zh) * | 2015-12-31 | 2016-06-15 | 广州杰赛科技股份有限公司 | 一种用户聚集热点区域识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
面向用户行为理解的移动通讯数据可视分析;蒋宏宇等;《浙江大学学报(理学版)》;20180131;第45卷(第1期);第37-43页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108491417A (zh) | 2018-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109902849B (zh) | 用户行为预测方法及装置、行为预测模型训练方法及装置 | |
US11188935B2 (en) | Analyzing consumer behavior based on location visitation | |
US11823218B2 (en) | Customer clustering using integer programming | |
CN109145210B (zh) | 一种信息推荐的方法、装置及存储介质 | |
CN108804551B (zh) | 一种兼顾多样性与个性化的空间兴趣点推荐方法 | |
CN109492166A (zh) | 基于签到时间间隔模式的连续兴趣点推荐方法 | |
CN101821757A (zh) | 广告方法、sns广告系统以及记录介质 | |
CN108205570A (zh) | 一种数据检测方法和装置 | |
CN106776925B (zh) | 一种移动终端用户性别的预测方法、服务器和系统 | |
CN105023026B (zh) | 一种基于非负矩阵分解的半监督聚类方法及系统 | |
CN110766438A (zh) | 一种通过人工智能对电网用户的用户行为进行分析的方法 | |
CN106649733B (zh) | 一种基于无线接入点情境分类与感知的在线视频推荐方法 | |
US20140207718A1 (en) | Method and apparatus for identifying users from rating patterns | |
CN108491417B (zh) | 一种基于用户访问行为的群体偏好上下文重构方法 | |
CN105681089B (zh) | 网络用户行为聚类方法、装置及终端 | |
US20220167034A1 (en) | Device topological signatures for identifying and classifying mobile device users based on mobile browsing patterns | |
CN112925990A (zh) | 目标群体分类方法及装置 | |
Du et al. | Monte-carlo tree search aided contextual online learning approach for wireless caching | |
Wang et al. | Predicting attributes and friends of mobile users from AP-Trajectories | |
Mishra et al. | Efficient proactive caching in storage constrained 5g small cells | |
US20220167051A1 (en) | Automatic classification of households based on content consumption | |
CN117112880A (zh) | 信息推荐、多目标推荐模型训练方法、装置和计算机设备 | |
CN114398960A (zh) | 目标用户确定方法及装置、电子设备及存储介质 | |
CN113935407A (zh) | 一种异常行为识别模型确定方法及装置 | |
CN115345635A (zh) | 推荐内容的处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |