CN106658533B - 一种考虑用户分布的空域流量特征提取方法 - Google Patents
一种考虑用户分布的空域流量特征提取方法 Download PDFInfo
- Publication number
- CN106658533B CN106658533B CN201611001217.XA CN201611001217A CN106658533B CN 106658533 B CN106658533 B CN 106658533B CN 201611001217 A CN201611001217 A CN 201611001217A CN 106658533 B CN106658533 B CN 106658533B
- Authority
- CN
- China
- Prior art keywords
- user
- distribution
- flow
- matrix
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/18—Network planning tools
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/22—Traffic simulation tools or models
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明提供一种考虑用户分布的空域流量特征提取方法,首先,基于已有的流量形态建立二维平面坐标系,获取划定平面区域内的用户坐标;其次,采用网格划分的方法对划定平面区域进行N*N网格划分,统计每个网格区间内的用户个数作为某样例的流量分布特征,再对该特征进行2*2单元窗口单位重叠滑动,并统计每个滑动窗口内的用户总数作为再提取的新的流量分布特征;再次,基于新的流量分布特征进行无监督分类;最后,取类中心表征的各个流量模式的基站部署状态,测试各类内所有样例的用户覆盖率。本发明旨在有效地捕捉用户在空间中成簇分布的特征,在保证计算复杂度低的同时提高特征提取的准确性,为流量形态分类任务提供前期保证。
Description
技术领域
本发明属于无线通信网络技术领域,涉及一种用户分布的空域流量特征提取方法。
背景技术
在无线蜂窝网络中,SINR统计量对网络性能相关的研究至关重要,接收信号和干扰的强度非常依赖网络的集合特性,即发送方和接收方的相对位置,因此,空间中的流量特性对网络性能产生着直接的影响。
在无线蜂窝网络中,时域的流量建模已经开展过很多研究,而对空域中的流量建模研究较少,空域中的流量主要反映为用户的空间分布。已有研究将从运营上处获得的基站分布和用户的数据进行拟合,通过分析拟合后的闭合表达式,发现现实部署的基站和用户在一定程度上服从泊松分布。因此,结合随机几何和泊松过程对用户分布进行流量建模具有一定的合理性。
有研究指出时域中的流量模型可以看作空域中的流量模型在一维空间中的一个特例。空域中的流量模型与时域中的流量模型具有一定相似性,以时域一维过程为例:若采用“区间技术”的方法,将整个时域或空域划分为一个个小窗口,对每个小窗口中的点进行计数,理论上窗口内点的个数都应该服从泊松分布,这是一种基于密度的指标,找到合适的窗口大小对流量的准确建模是十分重要的。若采用时域内两个邻居节点的距离进行建模也是一种可行的方案。而在空域中,由于各点之间没有类似于时域内各点之间的明确顺序关系。因此针对空域内这种基于距离的建模方法还有待探索。空域流量建模的前提是对空域流量样本的特征提取,用合理的特征来区分不同的空间流量形态。
发明内容
本发明的目的在于提出一种考虑用户分布的空域流量特征提取方法,旨在有效地捕捉用户在空间中成簇分布的特征,在保证计算复杂度低的同时提高特征提取的准确性,为流量形态分类任务提供前期保证。
为实现上述技术目的,本发明的技术方案是,
一种考虑用户分布的空域流量特征提取方法,包括以下步骤:
S1基于已有的流量形态分布建立XOY二维平面坐标系,获取1600*1600平面区域内的用户坐标。
S2采用网格划分的方法对1600*1600平面区域进行N*N区域划分,统计每个网格区间内的用户个数,并将其存入矩阵a(N,N)。
S3对矩阵a(N,N)内各参数采用滑动窗口进行单位重叠滑动提取特征,并将新的特征存入矩阵b(N-1,N-1)。
S4将更新的矩阵b(N-1,N-1)内各参数作为每个样例新的流量形态分布特征,并对所有样例进行无监督分类。
S5取各类的类中心表征一类流量模式,获取基站部署状态,并将其带入到各类类内所有样例中,测试每个样例的用户覆盖率。
优选地,本发明S2的具体方法为:对1600*1600平面区域进行N*N网格划分,则单位网格宽度为1600/N;将每个用户的X、Y坐标同时除以1600/N并进行向上取整;基于取整后的X,Y坐标统计位于第i行第j列网格的用户个数,并将其存入矩阵a(N,N)中的a(i,j)中,矩阵a(N,N)的大小为N*N,则矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征。
优选地,本发明S3中采用滑动窗口进行单位重叠滑动提取特征按如下步骤进行:首先,采用2*2的单元滑动窗口对矩阵a(N,N)统计的用户分布的空域流量特征进行单位重叠滑动,再对单元滑动窗口内的用户总数进行求和计数,并将其存于矩阵b(N-1,N-1),该过程可通过以下运算实现:
b(i,j)=a(i,j)+a(i+1,j)+a(i,j+1)+a(i+1,j+1)
显然,经滑动窗口提取的特征数较直接经单元网格提取的特征数要少2N-1个。
优选地,本发明S4中采用经典的K均值算法对所有样例进行无监督分类,具体通过如下步骤实现:
S41为确定最佳聚类数,对代价函数J(K)进行统计分析,并根据肘部法则,找到代价函数曲线的拐点即为最佳聚类个数。其中,代价函数J(K)表示每个样例到其所属类内质心的距离平方和。
本发明主要目的为了测试特征提取方法的优效性,为了使得测试数据更加全面准确,本发明选取的最佳K值是拐点处的某个区间,这里使得K={6,8,10,12}。
S42在确定的最佳K值区间下,采用滑动窗口提取的流量分布空域特征表征训练样例,再对训练样例进行K均值聚类。其实现原理主要是根据训练样例到规定的K个类中心的距离和最小来进行样例归类。
优选地,本发明S5通过如下步骤实现:
S51对所有训练样例进行K均值聚类后,获取每个聚类的类中心空域特征;
S52将类中心样例的流量分布空域特征进行1600*1600平面区域内用户流量分布还原,获取每类类中心用户流量分布情况下的基站状态,同时使用这些基站状态表征所属类内所有样例的基站状态;
S53基于类中心流量分布表征的基站状态,测试每个类内所有样例的用户覆盖率。
本发明的有益效果是:
本发明在直接进行单位网格提取用户流量分布空域特征的基础上,采用2*2滑动窗口对用户流量分布空域特征进行单位重叠滑动实现特征的再提取,虽然该特征提取方法明显较直接网格提取的特征减少了2N-1个特征数,但可以很好地保留空间用户流量分布的边缘细节信息,且在一定程度上减小了计算复杂度,测试结果也表明该特征提取方法甚至比直接网格提取特征方法具有更高的准确性,更利于对所有样例进行高准确度无监督分类。
本发明提出了一种基于滑动窗口重叠提取用户分布的空域流量特征提取方法,所设计的特征向量有效保留了用户成簇分布的信息,能够有效地对空间流量形态进行模式识别,特性维数小且计算复杂度低,有利于处理高密度的用户分布场景,进而指导基站的部署规划。
附图说明
图1为本发明的流程图;
图2本发明用户流量分布的空域特征网格提取示意图;
图3基于本发明提取的空域特征进行无监督聚类分析,寻找最佳聚类数目的示意图;
图4基于本发明在固有聚类数目和网格划分情况下所有样例的用户覆盖率示意图;
图5基于本发明对所有样例在覆盖率为[0,0.9],[0.9,0.98],[0.98,1]的范围内进行频数统计的统计图;
图6基于本发明对比平滑窗口及单位网格两种提取特征方法的用户覆盖率对比图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明特征提取及用于流量形态分类的流程图。
S1基于已有的流量形态分布建立XOY二维平面坐标系,获取划定平面区域内的用户坐标。
本实施例中:对1600*1600平面区域进行N*N网格划分,则单位网格宽度为1600/N。将每个用户的X、Y坐标同时除以1600/N并进行向上取整。基于取整后的X,Y坐标统计位于第i行第j列网格的用户个数,并将其存入矩阵a(N,N)中的a(i,j)中,矩阵a(N,N)的大小为N*N,则矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征。
S2采用网格划分的方法对划定平面区域进行N*N区域划分,统计每个网格区间内的用户个数,并将其存入矩阵a(N,N),作为某样例的流量分布特征。
对1600*1600平面区域进行N*N网格划分,则单位网格宽度为1600/N;将每个用户的X、Y坐标同时除以1600/N并进行向上取整;基于取整后的X,Y坐标统计位于第i行第j列网格的用户个数,并将其存入矩阵a(N,N)中的a(i,j)中,矩阵a(N,N)的大小为N*N,则矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征。
S3对矩阵a(N,N)内各参数采用滑动窗口进行单位重叠滑动提取特征,并将新的特征存入矩阵b(N-1,N-1),作为再提取的新的流量分布特征。
采用2*2的单元滑动窗口对矩阵a(N,N)统计的用户分布的空域流量特征进行单位重叠滑动,再对单元滑动窗口内的用户总数进行求和计数,并将其存于矩阵b(N-1,N-1),该过程可通过以下运算实现:
b(i,j)=a(i,j)+a(i+1,j)+a(i,j+1)+a(i+1,j+1)
显然,经滑动窗口提取的特征数较直接经单元网格提取的特征数要少2N-1个。
S4将更新的矩阵b(N-1,N-1)内各参数作为每个样例新的流量形态分布特征,并对所有样例进行无监督分类。
S41本发明主要基于滑动窗口提取的流量分布空域特征采用经典的K均值算法对所有样例进行无监督分类,为确定最佳聚类数,对代价函数J(K)进行统计分析,并根据肘部法则,找到代价函数曲线的拐点即为最佳聚类个数,本发明主要目的为了测试特征提取方法的优效性,为了使得测试数据更加全面准确,本发明选取的最佳K值是拐点处的某个区间,这里使得K={6,8,10,12}。其中,代价函数J(K)表示每个样例到其所属类内质心的距离平方和。
S42在确定的最佳K值区间下,采用滑动窗口提取的流量分布空域特征表征训练样例,再对训练样例进行K均值聚类。其实现原理主要是根据训练样例到规定的K个类中心的距离和最小来进行样例归类。
S5取各类的类中心表征一类流量模式,获取基站部署状态,并将其带入到各类类内所有样例中,测试每个样例的用户覆盖率。
S51对所有训练样例进行K均值聚类后,获取每个聚类的类中心空域特征。
S52将类中心样例的流量分布空域特征进行1600*1600平面区域内用户流量分布还原,获取每类类中心用户流量分布情况下的基站状态,同时使用这些基站状态表征所属类内所有样例的基站状态。
S53基于类中心流量分布表征的基站状态,测试每个类内所有样例的用户覆盖率。
图2是本发明用户流量分布的空域特征网格提取方法。本实施例主要是对划定平面区域进行N*N网格划分后得到的用户流量特征进行滑动窗口的特征单元重叠提取的过程,这里总共进行了4组测试,N值分别为{4,8,16,32}。
图3是基于本发明提取的空域特征进行无监督聚类分析,找最佳聚类数目。实施例中,取k=1~30,基于4组网格{4*4,8*8,16*16,32*32}划分方式提取的样例特征对所有样例进行K均值分类,并计算每个样例到其所属类内质心的距离平方和J(k),作出J-k曲线,根据肘部法则可以找到曲线拐点K为9,事实上本发明选取的最佳K值是拐点处的某个区间,这里使得K={6,8,10,12}。
图4是基于本发明在固有聚类数目和网格划分情况下所有样例的用户覆盖率。实施例采用控制变量法测量聚类数和网格划分对样例用户覆盖率的影响,这里的用户覆盖率是指在类中心基站部署状态的前提下所属类类内的各样例的所有用户被服务的比率。由实验结果可以看到,K对用户覆盖率的影响并不显著;而网格划分对用户覆盖率的影响较明显,当网格划分得越细,所提取的样本特征越多,分类准确性提高,且所有样例用户覆盖率更高。
图5是基于本发明对所有样例的覆盖率进行频数统计的结果。实施例对图4中的用户服务情况在[0,0.9],[0.9,0.98],[0.98,1]的区间范围内进行频数统计,本发明设定用户覆盖率为0.98以上时,其基站开启状态最佳。由图5可知,随着网格划分越细,所获得的用户覆盖率越高,当K为8和10时,网格对用户覆盖率的影响十分明显呈梯状分布,当K为6和12时,网格为4*4和8*8的用户覆盖情况区分度不是非常明显,这也间接证实了最佳聚类数在9左右徘徊的结论。
图6是基于本发明对比平滑窗口及单位网格两种提取特征方法的用户覆盖率。实施例对采用平滑窗口和单位网格进行特征提取进行了对比试验,其结论可以发现:采用平滑窗口进行特征提取相对于直接采用网格进行特征提取,仍然可以获得与N2个特征相近甚至更好的分类结果,所得到的用户覆盖率更高,此外,理论上分析,平滑窗口进行特征提取可将样本特征减少2N-1,一定程度上减少了计算复杂度。综上,采用平滑窗口对用户流量分布进行空域特征提取是一种准确且高效的方法。
以上包含了本发明优选实施例的说明,这是为了详细说明本发明的技术特征,并不是想要将发明内容限制在实施例所描述的具体形式中,依据本发明内容主旨进行的其他修改和变型也受本专利保护。本发明内容的主旨是由权利要求书所界定,而非由实施例的具体描述所界定。
Claims (8)
1.一种考虑用户分布的空域流量特征提取方法,其特征在于,包括以下步骤:
S1基于已有的流量形态分布建立XOY二维平面坐标系,获取划定平面区域内的用户坐标;
S2采用网格划分的方法对划定平面区域进行N*N区域划分,统计每个网格区间内的用户个数,并将其存入矩阵a(N,N);
S3矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征,对矩阵a(N,N)内各参数采用滑动窗口进行单位重叠滑动提取特征,并将新的特征存入矩阵b(N-1,N-1);
S4将更新的矩阵b(N-1,N-1)内各参数作为每个样例新的流量形态分布特征,并对所有样例进行无监督分类;
S5取各类的类中心表征一类流量模式,获取基站部署状态,并将其带入到各类类内所有样例中,测试每个样例的用户覆盖率。
2.根据权利要求1所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S1中,划定平面区域取1600*1600平面区域。
3.根据权利要求2所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S2中,对1600*1600平面区域进行N*N网格划分,则单位网格宽度为1600/N;将每个用户的X、Y坐标同时除以1600/N并进行向上取整;基于取整后的X,Y坐标统计位于第i行第j列网格的用户个数,并将其存入矩阵a(N,N)中的a(i,j)中,矩阵a(N,N)的大小为N*N,则矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征。
4.根据权利要求3所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S3中,采用滑动窗口进行单位重叠滑动提取特征按如下步骤进行:首先,采用2*2的单元滑动窗口对矩阵a(N,N)统计的用户分布的空域流量特征进行单位重叠滑动,再对单元滑动窗口内的用户总数进行求和计数,并将其存于矩阵b(N-1,N-1),该过程可通过以下运算实现:
b(i,j)=a(i,j)+a(i+1,j)+a(i,j+1)+a(i+1,j+1)。
5.根据权利要求4所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S4中采用经典的K均值算法对所有样例进行无监督分类。
6.根据权利要求5所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S4通过如下步骤实现:
S41为确定最佳聚类数,对代价函数J(K)进行统计分析,并根据肘部法则,找到代价函数曲线的拐点即为最佳聚类个数;其中,代价函数J(K)表示每个样例到其所属类内质心的距离平方和;
S42在确定的最佳K值区间下,采用滑动窗口提取的流量分布空域特征表征训练样例,再对训练样例进行K均值聚类。
7.根据权利要求6所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S41中选取的最佳K值是代价函数曲线的拐点处的一个区间,取K={6,8,10,12}。
8.根据权利要求6所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S5通过如下步骤实现:
S51对所有样例进行K均值聚类后,获取每个聚类的类中心空域特征;
S52将类中心样例的流量分布空域特征进行1600*1600平面区域内用户流量分布还原,获取每类类中心用户流量分布情况下的基站状态,同时使用这些基站状态表征所属类内所有样例的基站状态;
S53基于类中心流量分布表征的基站状态,测试每个类内所有样例的用户覆盖率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611001217.XA CN106658533B (zh) | 2016-11-14 | 2016-11-14 | 一种考虑用户分布的空域流量特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611001217.XA CN106658533B (zh) | 2016-11-14 | 2016-11-14 | 一种考虑用户分布的空域流量特征提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106658533A CN106658533A (zh) | 2017-05-10 |
CN106658533B true CN106658533B (zh) | 2020-02-14 |
Family
ID=58806668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611001217.XA Active CN106658533B (zh) | 2016-11-14 | 2016-11-14 | 一种考虑用户分布的空域流量特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106658533B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886352B (zh) * | 2019-03-04 | 2020-08-18 | 北京航空航天大学 | 一种空域复杂度无监督评估方法 |
CN110310161A (zh) * | 2019-07-09 | 2019-10-08 | 西安点告网络科技有限公司 | 特征聚合的方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855778A (zh) * | 2012-09-10 | 2013-01-02 | 南京航空航天大学 | 一种基于复杂度评估的空域扇区分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9215244B2 (en) * | 2010-11-18 | 2015-12-15 | The Boeing Company | Context aware network security monitoring for threat detection |
-
2016
- 2016-11-14 CN CN201611001217.XA patent/CN106658533B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855778A (zh) * | 2012-09-10 | 2013-01-02 | 南京航空航天大学 | 一种基于复杂度评估的空域扇区分类方法 |
Non-Patent Citations (1)
Title |
---|
基于模糊聚类的CO2数据流时空异常模式的研究;刘莘;《计算机应用研究》;20160831;第33卷(第8期);第2353-2357页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106658533A (zh) | 2017-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110012428B (zh) | 一种基于WiFi的室内定位方法 | |
CN110324787B (zh) | 一种手机信令数据的职住地获取方法 | |
CN111867049B (zh) | 定位方法、装置及存储介质 | |
CN101639527B (zh) | 基于rss-p的k近邻模糊聚类wlan室内定位方法 | |
CN102480677B (zh) | 一种指纹定位误差的确定方法和设备 | |
CN112887902B (zh) | 一种基于高斯聚类与混合度量的WiFi指纹的室内定位方法 | |
CN104135327B (zh) | 基于支持向量机的频谱感知方法 | |
CN107948930A (zh) | 基于位置指纹算法的室内定位优化方法 | |
CN107367277B (zh) | 基于二次K-Means聚类的室内位置指纹定位方法 | |
CN104683984B (zh) | 无线通信信号实时监测处理方法和系统 | |
CN105407529B (zh) | 基于模糊c均值聚类的无线传感器网络节点定位算法 | |
CN112188532A (zh) | 网络异常检测模型的训练方法、网络检测方法及装置 | |
EP3034998A1 (en) | Target positioning method and system | |
CN104869630A (zh) | 基于离线指纹库的伪基站快速定位方法与系统 | |
CN107677989B (zh) | 一种基于rssi最大值进行rssi去除噪声的室内位置定位方法 | |
CN110224771B (zh) | 基于bp神经网络与信息几何的频谱感知方法及装置 | |
CN110413655B (zh) | 一种基于改进隐马尔科夫模型的楼层识别方法 | |
CN106658533B (zh) | 一种考虑用户分布的空域流量特征提取方法 | |
CN111901028B (zh) | 一种基于多天线上csi的人体行为识别方法 | |
CN108090462A (zh) | 一种基于盒维数的辐射源指纹特征提取方法 | |
Castro-Hernandez et al. | Classification of user trajectories in LTE HetNets using unsupervised shapelets and multiresolution wavelet decomposition | |
CN109541537B (zh) | 一种基于测距的普适室内定位方法 | |
Raivio et al. | Neural analysis of mobile radio access network | |
CN112183199B (zh) | 一种基于Fish-SVC的2.4GHz频段信号识别方法及系统 | |
CN111726861B (zh) | 异构设备室内定位方法、装置、系统和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |