CN106658533A - 一种考虑用户分布的空域流量特征提取方法 - Google Patents

一种考虑用户分布的空域流量特征提取方法 Download PDF

Info

Publication number
CN106658533A
CN106658533A CN201611001217.XA CN201611001217A CN106658533A CN 106658533 A CN106658533 A CN 106658533A CN 201611001217 A CN201611001217 A CN 201611001217A CN 106658533 A CN106658533 A CN 106658533A
Authority
CN
China
Prior art keywords
feature
class
distribution
user
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611001217.XA
Other languages
English (en)
Other versions
CN106658533B (zh
Inventor
周力
魏急波
赵海涛
张姣
黄圣春
程然
赵俣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201611001217.XA priority Critical patent/CN106658533B/zh
Publication of CN106658533A publication Critical patent/CN106658533A/zh
Application granted granted Critical
Publication of CN106658533B publication Critical patent/CN106658533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/18Network planning tools
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/22Traffic simulation tools or models

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种考虑用户分布的空域流量特征提取方法,首先,基于已有的流量形态建立二维平面坐标系,获取划定平面区域内的用户坐标;其次,采用网格划分的方法对划定平面区域进行N*N网格划分,统计每个网格区间内的用户个数作为某样例的流量分布特征,再对该特征进行2*2单元窗口单位重叠滑动,并统计每个滑动窗口内的用户总数作为再提取的新的流量分布特征;再次,基于新的流量分布特征进行无监督分类;最后,取类中心表征的各个流量模式的基站部署状态,测试各类内所有样例的用户覆盖率。本发明旨在有效地捕捉用户在空间中成簇分布的特征,在保证计算复杂度低的同时提高特征提取的准确性,为流量形态分类任务提供前期保证。

Description

一种考虑用户分布的空域流量特征提取方法
技术领域
本发明属于无线通信网络技术领域,涉及一种用户分布的空域流量特征提取方法。
背景技术
在无线蜂窝网络中,SINR统计量对网络性能相关的研究至关重要,接收信号和干扰的强度非常依赖网络的集合特性,即发送方和接收方的相对位置,因此,空间中的流量特性对网络性能产生着直接的影响。
在无线蜂窝网络中,时域的流量建模已经开展过很多研究,而对空域中的流量建模研究较少,空域中的流量主要反映为用户的空间分布。已有研究将从运营上处获得的基站分布和用户的数据进行拟合,通过分析拟合后的闭合表达式,发现现实部署的基站和用户在一定程度上服从泊松分布。因此,结合随机几何和泊松过程对用户分布进行流量建模具有一定的合理性。
有研究指出时域中的流量模型可以看作空域中的流量模型在一维空间中的一个特例。空域中的流量模型与时域中的流量模型具有一定相似性,以时域一维过程为例:若采用“区间技术”的方法,将整个时域或空域划分为一个个小窗口,对每个小窗口中的点进行计数,理论上窗口内点的个数都应该服从泊松分布,这是一种基于密度的指标,找到合适的窗口大小对流量的准确建模是十分重要的。若采用时域内两个邻居节点的距离进行建模也是一种可行的方案。而在空域中,由于各点之间没有类似于时域内各点之间的明确顺序关系。因此针对空域内这种基于距离的建模方法还有待探索。空域流量建模的前提是对空域流量样本的特征提取,用合理的特征来区分不同的空间流量形态。
发明内容
本发明的目的在于提出一种考虑用户分布的空域流量特征提取方法,旨在有效地捕捉用户在空间中成簇分布的特征,在保证计算复杂度低的同时提高特征提取的准确性,为流量形态分类任务提供前期保证。
为实现上述技术目的,本发明的技术方案是,
一种考虑用户分布的空域流量特征提取方法,包括以下步骤:
S1基于已有的流量形态分布建立XOY二维平面坐标系,获取1600*1600平面区域内的用户坐标。
S2采用网格划分的方法对1600*1600平面区域进行N*N区域划分,统计每个网格区间内的用户个数,并将其存入矩阵a(N,N)。
S3对矩阵a(N,N)内各参数采用滑动窗口进行单位重叠滑动提取特征,并将新的特征存入矩阵b(N-1,N-1)。
S4将更新的矩阵b(N-1,N-1)内各参数作为每个样例新的流量形态分布特征,并对所有样例进行无监督分类。
S5取各类的类中心表征一类流量模式,获取基站部署状态,并将其带入到各类类内所有样例中,测试每个样例的用户覆盖率。
优选地,本发明S2的具体方法为:对1600*1600平面区域进行N*N网格划分,则单位网格宽度为1600/N;将每个用户的X、Y坐标同时除以1600/N并进行向上取整;基于取整后的X,Y坐标统计位于第i行第j列网格的用户个数,并将其存入矩阵a(N,N)中的a(i,j)中,矩阵a(N,N)的大小为N*N,则矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征。
优选地,本发明S3中采用滑动窗口进行单位重叠滑动提取特征按如下步骤进行:首先,采用2*2的单元滑动窗口对矩阵a(N,N)统计的用户分布的空域流量特征进行单位重叠滑动,再对单元滑动窗口内的用户总数进行求和计数,并将其存于矩阵b(N-1,N-1),该过程可通过以下运算实现:
b(i,j)=a(i,j)+a(i+1,j)+a(i,j+1)+a(i+1,j+1)
显然,经滑动窗口提取的特征数较直接经单元网格提取的特征数要少2N-1个。
优选地,本发明S4中采用经典的K均值算法对所有样例进行无监督分类,具体通过如下步骤实现:
S41为确定最佳聚类数,对代价函数J(K)进行统计分析,并根据肘部法则,找到代价函数曲线的拐点即为最佳聚类个数。其中,代价函数J(K)表示每个样例到其所属类内质心的距离平方和。
本发明主要目的为了测试特征提取方法的优效性,为了使得测试数据更加全面准确,本发明选取的最佳K值是拐点处的某个区间,这里使得K={6,8,10,12}。
S42在确定的最佳K值区间下,采用滑动窗口提取的流量分布空域特征表征训练样例,再对训练样例进行K均值聚类。其实现原理主要是根据训练样例到规定的K个类中心的距离和最小来进行样例归类。
优选地,本发明S5通过如下步骤实现:
S51对所有训练样例进行K均值聚类后,获取每个聚类的类中心空域特征;
S52将类中心样例的流量分布空域特征进行1600*1600平面区域内用户流量分布还原,获取每类类中心用户流量分布情况下的基站状态,同时使用这些基站状态表征所属类内所有样例的基站状态;
S53基于类中心流量分布表征的基站状态,测试每个类内所有样例的用户覆盖率。
本发明的有益效果是:
本发明在直接进行单位网格提取用户流量分布空域特征的基础上,采用2*2滑动窗口对用户流量分布空域特征进行单位重叠滑动实现特征的再提取,虽然该特征提取方法明显较直接网格提取的特征减少了2N-1个特征数,但可以很好地保留空间用户流量分布的边缘细节信息,且在一定程度上减小了计算复杂度,测试结果也表明该特征提取方法甚至比直接网格提取特征方法具有更高的准确性,更利于对所有样例进行高准确度无监督分类。
本发明提出了一种基于滑动窗口重叠提取用户分布的空域流量特征提取方法,所设计的特征向量有效保留了用户成簇分布的信息,能够有效地对空间流量形态进行模式识别,特性维数小且计算复杂度低,有利于处理高密度的用户分布场景,进而指导基站的部署规划。
附图说明
图1为本发明的流程图;
图2本发明用户流量分布的空域特征网格提取示意图;
图3基于本发明提取的空域特征进行无监督聚类分析,寻找最佳聚类数目的示意图;
图4基于本发明在固有聚类数目和网格划分情况下所有样例的用户覆盖率示意图;
图5基于本发明对所有样例在覆盖率为[0,0.9],[0.9,0.98],[0.98,1]的范围内进行频数统计的统计图;
图6基于本发明对比平滑窗口及单位网格两种提取特征方法的用户覆盖率对比图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明特征提取及用于流量形态分类的流程图。
S1基于已有的流量形态分布建立XOY二维平面坐标系,获取划定平面区域内的用户坐标。
本实施例中:对1600*1600平面区域进行N*N网格划分,则单位网格宽度为1600/N。将每个用户的X、Y坐标同时除以1600/N并进行向上取整。基于取整后的X,Y坐标统计位于第i行第j列网格的用户个数,并将其存入矩阵a(N,N)中的a(i,j)中,矩阵a(N,N)的大小为N*N,则矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征。
S2采用网格划分的方法对划定平面区域进行N*N区域划分,统计每个网格区间内的用户个数,并将其存入矩阵a(N,N),作为某样例的流量分布特征。
对1600*1600平面区域进行N*N网格划分,则单位网格宽度为1600/N;将每个用户的X、Y坐标同时除以1600/N并进行向上取整;基于取整后的X,Y坐标统计位于第i行第j列网格的用户个数,并将其存入矩阵a(N,N)中的a(i,j)中,矩阵a(N,N)的大小为N*N,则矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征。
S3对矩阵a(N,N)内各参数采用滑动窗口进行单位重叠滑动提取特征,并将新的特征存入矩阵b(N-1,N-1),作为再提取的新的流量分布特征。
采用2*2的单元滑动窗口对矩阵a(N,N)统计的用户分布的空域流量特征进行单位重叠滑动,再对单元滑动窗口内的用户总数进行求和计数,并将其存于矩阵b(N-1,N-1),该过程可通过以下运算实现:
b(i,j)=a(i,j)+a(i+1,j)+a(i,j+1)+a(i+1,j+1)
显然,经滑动窗口提取的特征数较直接经单元网格提取的特征数要少2N-1个。
S4将更新的矩阵b(N-1,N-1)内各参数作为每个样例新的流量形态分布特征,并对所有样例进行无监督分类。
S41本发明主要基于滑动窗口提取的流量分布空域特征采用经典的K均值算法对所有样例进行无监督分类,为确定最佳聚类数,对代价函数J(K)进行统计分析,并根据肘部法则,找到代价函数曲线的拐点即为最佳聚类个数,本发明主要目的为了测试特征提取方法的优效性,为了使得测试数据更加全面准确,本发明选取的最佳K值是拐点处的某个区间,这里使得K={6,8,10,12}。其中,代价函数J(K)表示每个样例到其所属类内质心的距离平方和。
S42在确定的最佳K值区间下,采用滑动窗口提取的流量分布空域特征表征训练样例,再对训练样例进行K均值聚类。其实现原理主要是根据训练样例到规定的K个类中心的距离和最小来进行样例归类。
S5取各类的类中心表征一类流量模式,获取基站部署状态,并将其带入到各类类内所有样例中,测试每个样例的用户覆盖率。
S51对所有训练样例进行K均值聚类后,获取每个聚类的类中心空域特征。
S52将类中心样例的流量分布空域特征进行1600*1600平面区域内用户流量分布还原,获取每类类中心用户流量分布情况下的基站状态,同时使用这些基站状态表征所属类内所有样例的基站状态。
S53基于类中心流量分布表征的基站状态,测试每个类内所有样例的用户覆盖率。
图2是本发明用户流量分布的空域特征网格提取方法。本实施例主要是对划定平面区域进行N*N网格划分后得到的用户流量特征进行滑动窗口的特征单元重叠提取的过程,这里总共进行了4组测试,N值分别为{4,8,16,32}。
图3是基于本发明提取的空域特征进行无监督聚类分析,找最佳聚类数目。实施例中,取k=1~30,基于4组网格{4*4,8*8,16*16,32*32}划分方式提取的样例特征对所有样例进行K均值分类,并计算每个样例到其所属类内质心的距离平方和J(k),作出J-k曲线,根据肘部法则可以找到曲线拐点K为9,事实上本发明选取的最佳K值是拐点处的某个区间,这里使得K={6,8,10,12}。
图4是基于本发明在固有聚类数目和网格划分情况下所有样例的用户覆盖率。实施例采用控制变量法测量聚类数和网格划分对样例用户覆盖率的影响,这里的用户覆盖率是指在类中心基站部署状态的前提下所属类类内的各样例的所有用户被服务的比率。由实验结果可以看到,K对用户覆盖率的影响并不显著;而网格划分对用户覆盖率的影响较明显,当网格划分得越细,所提取的样本特征越多,分类准确性提高,且所有样例用户覆盖率更高。
图5是基于本发明对所有样例的覆盖率进行频数统计的结果。实施例对图4中的用户服务情况在[0,0.9],[0.9,0.98],[0.98,1]的区间范围内进行频数统计,本发明设定用户覆盖率为0.98以上时,其基站开启状态最佳。由图5可知,随着网格划分越细,所获得的用户覆盖率越高,当K为8和10时,网格对用户覆盖率的影响十分明显呈梯状分布,当K为6和12时,网格为4*4和8*8的用户覆盖情况区分度不是非常明显,这也间接证实了最佳聚类数在9左右徘徊的结论。
图6是基于本发明对比平滑窗口及单位网格两种提取特征方法的用户覆盖率。实施例对采用平滑窗口和单位网格进行特征提取进行了对比试验,其结论可以发现:采用平滑窗口进行特征提取相对于直接采用网格进行特征提取,仍然可以获得与N2个特征相近甚至更好的分类结果,所得到的用户覆盖率更高,此外,理论上分析,平滑窗口进行特征提取可将样本特征减少2N-1,一定程度上减少了计算复杂度。综上,采用平滑窗口对用户流量分布进行空域特征提取是一种准确且高效的方法。
以上包含了本发明优选实施例的说明,这是为了详细说明本发明的技术特征,并不是想要将发明内容限制在实施例所描述的具体形式中,依据本发明内容主旨进行的其他修改和变型也受本专利保护。本发明内容的主旨是由权利要求书所界定,而非由实施例的具体描述所界定。

Claims (8)

1.一种考虑用户分布的空域流量特征提取方法,其特征在于,包括以下步骤:
S1基于已有的流量形态分布建立XOY二维平面坐标系,获取划定平面区域内的用户坐标;
S2采用网格划分的方法对划定平面区域进行N*N区域划分,统计每个网格区间内的用户个数,并将其存入矩阵a(N,N);
S3对矩阵a(N,N)内各参数采用滑动窗口进行单位重叠滑动提取特征,并将新的特征存入矩阵b(N-1,N-1);
S4将更新的矩阵b(N-1,N-1)内各参数作为每个样例新的流量形态分布特征,并对所有样例进行无监督分类;
S5取各类的类中心表征一类流量模式,获取基站部署状态,并将其带入到各类类内所有样例中,测试每个样例的用户覆盖率。
2.根据权利要求1所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S1中,划定平面区域取1600*1600平面区域。
3.根据权利要求2所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S2中,对1600*1600平面区域进行N*N网格划分,则单位网格宽度为1600/N;将每个用户的X、Y坐标同时除以1600/N并进行向上取整;基于取整后的X,Y坐标统计位于第i行第j列网格的用户个数,并将其存入矩阵a(N,N)中的a(i,j)中,矩阵a(N,N)的大小为N*N,则矩阵a(N,N)内各参数直观反映了用户流量形态的空域分布特征。
4.根据权利要求3所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S3中,采用滑动窗口进行单位重叠滑动提取特征按如下步骤进行:首先,采用2*2的单元滑动窗口对矩阵a(N,N)统计的用户分布的空域流量特征进行单位重叠滑动,再对单元滑动窗口内的用户总数进行求和计数,并将其存于矩阵b(N-1,N-1),该过程可通过以下运算实现:
b(i,j)=a(i,j)+a(i+1,j)+a(i,j+1)+a(i+1,j+1)。
5.根据权利要求4所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S4中采用经典的K均值算法对所有样例进行无监督分类。
6.根据权利要求5所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S4通过如下步骤实现:
S41为确定最佳聚类数,对代价函数J(K)进行统计分析,并根据肘部法则,找到代价函数曲线的拐点即为最佳聚类个数;其中,代价函数J(K)表示每个样例到其所属类内质心的距离平方和;
S42在确定的最佳K值区间下,采用滑动窗口提取的流量分布空域特征表征训练样例,再对训练样例进行K均值聚类。
7.根据权利要求6所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S41中选取的最佳K值是代价函数曲线的拐点处的一个区间,取K={6,8,10,12}。
8.根据权利要求6所述的考虑用户分布的空域流量特征提取方法,其特征在于,步骤S5通过如下步骤实现:
S51对所有样例进行K均值聚类后,获取每个聚类的类中心空域特征;
S52将类中心样例的流量分布空域特征进行1600*1600平面区域内用户流量分布还原,获取每类类中心用户流量分布情况下的基站状态,同时使用这些基站状态表征所属类内所有样例的基站状态;
S53基于类中心流量分布表征的基站状态,测试每个类内所有样例的用户覆盖率。
CN201611001217.XA 2016-11-14 2016-11-14 一种考虑用户分布的空域流量特征提取方法 Active CN106658533B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611001217.XA CN106658533B (zh) 2016-11-14 2016-11-14 一种考虑用户分布的空域流量特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611001217.XA CN106658533B (zh) 2016-11-14 2016-11-14 一种考虑用户分布的空域流量特征提取方法

Publications (2)

Publication Number Publication Date
CN106658533A true CN106658533A (zh) 2017-05-10
CN106658533B CN106658533B (zh) 2020-02-14

Family

ID=58806668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611001217.XA Active CN106658533B (zh) 2016-11-14 2016-11-14 一种考虑用户分布的空域流量特征提取方法

Country Status (1)

Country Link
CN (1) CN106658533B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886352A (zh) * 2019-03-04 2019-06-14 北京航空航天大学 一种空域复杂度无监督评估方法
CN110310161A (zh) * 2019-07-09 2019-10-08 西安点告网络科技有限公司 特征聚合的方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855778A (zh) * 2012-09-10 2013-01-02 南京航空航天大学 一种基于复杂度评估的空域扇区分类方法
US20130305357A1 (en) * 2010-11-18 2013-11-14 The Boeing Company Context Aware Network Security Monitoring for Threat Detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130305357A1 (en) * 2010-11-18 2013-11-14 The Boeing Company Context Aware Network Security Monitoring for Threat Detection
CN102855778A (zh) * 2012-09-10 2013-01-02 南京航空航天大学 一种基于复杂度评估的空域扇区分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘莘: "基于模糊聚类的CO2数据流时空异常模式的研究", 《计算机应用研究》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886352A (zh) * 2019-03-04 2019-06-14 北京航空航天大学 一种空域复杂度无监督评估方法
CN110310161A (zh) * 2019-07-09 2019-10-08 西安点告网络科技有限公司 特征聚合的方法及装置

Also Published As

Publication number Publication date
CN106658533B (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN109344736B (zh) 一种基于联合学习的静态图像人群计数方法
CN106022509B (zh) 考虑地域和负荷性质双重差异的配电网空间负荷预测方法
CN108520357B (zh) 一种线损异常原因的判别方法、装置及服务器
CN103077402B (zh) 基于奇异值分解算法的变压器局部放电模式识别方法
CN106452629A (zh) 一种基于核功率密度的无线信道多径分簇方法
CN106096561A (zh) 基于图像块深度学习特征的红外行人检测方法
CN108921822A (zh) 基于卷积神经网络的图像目标计数方法
CN109726658A (zh) 人群计数及定位方法、系统、电子终端及存储介质
CN104700118A (zh) 基于卷积神经网络的肺结节良恶性预测方法
CN109615014A (zh) 一种基于kl散度优化的数据分类系统与方法
CN104198899B (zh) 一种多放电源情况下变压器局部放电类型识别方法
CN107086935A (zh) 基于wifi ap的人流量分布预测方法
CN103310235B (zh) 一种基于参数识别与估计的隐写分析方法
CN107729809A (zh) 一种自适应生成视频摘要的方法、装置及其可读存储介质
CN109118119A (zh) 风控模型生成方法及装置
CN104731916A (zh) 数据挖掘中基于密度优化初始中心的k均值聚类方法
CN109949176A (zh) 一种基于图嵌入的社交网络中异常用户检测方法
CN103955709B (zh) 基于加权合成核与tmf的极化sar图像分类方法
CN108076060A (zh) 基于动态k-means聚类的神经网络态势预测方法
CN110047081A (zh) 胸部x光图像的实例分割方法、装置、设备及介质
CN106650744A (zh) 局部形状迁移指导的图像对象共分割方法
CN108446616A (zh) 基于全卷积神经网络集成学习的道路提取方法
CN109446894A (zh) 基于概率分割及高斯混合聚类的多光谱图像变化检测方法
CN110502989A (zh) 一种小样本高光谱人脸识别方法及系统
CN109633448A (zh) 识别电池健康状态的方法、装置和终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant