CN115474203A - 区域补点规划方法、装置、电子设备和存储介质 - Google Patents
区域补点规划方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN115474203A CN115474203A CN202110654341.0A CN202110654341A CN115474203A CN 115474203 A CN115474203 A CN 115474203A CN 202110654341 A CN202110654341 A CN 202110654341A CN 115474203 A CN115474203 A CN 115474203A
- Authority
- CN
- China
- Prior art keywords
- grid
- flow
- region
- data
- raster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/18—Network planning tools
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
- H04L67/025—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/22—Traffic simulation tools or models
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种区域补点规划方法、装置、电子设备和存储介质,所述方法包括:获取待分析区域内各栅格区域当前时段的栅格数据;对所述栅格数据进行特征提取,得到各栅格区域的栅格特征数据,所述栅格特征数据包括栅格流量;基于所述栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,所述流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;基于所述预测栅格流量,对所述待分析区域进行补点规划。本发明提供的方法、装置、电子设备和存储介质,可以实现提前补点规划以解决未来流量高并发,提高补点规划的实效性和主动性,实现对高流量区域的精准定位,指导容量覆盖精准规划工作。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种区域补点规划方法、装置、电子设备和存储介质。
背景技术
通常情况下,大型居民区、商场、交通枢纽等场景在某些特定的时间段例如下班、周末以及节假日等,往往会产生大量的业务需求,超过了室外宏站的容量,导致网络拥塞的状况。
目前针对室外宏站主覆盖高流量场景,一般采用软硬件扩容的方式进行扩容,而当室外宏站已经满配,即无法通过软件、硬件扩容完成解决高流量问题的,一线人员会选择对这些场景进行补点规划。然而,现有补点规划方法存在如下缺陷:规划选点参考信息有限,主观因素多,准确性低,无法从数据上真实反映流量热点;实效性差,容易造成投资浪费。
发明内容
本发明提供一种区域补点规划方法、装置、电子设备和存储介质,用以解决现有技术中准确性低和实效性差的缺陷,实现提高区域补点规划的实效性和准确性。
第一方面,本发明提供一种区域补点规划方法,包括:
获取待分析区域内各栅格区域当前时段的栅格数据;
对所述栅格数据进行特征提取,得到各栅格区域的栅格特征数据,所述栅格特征数据包括栅格流量;
基于所述栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,所述流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;
基于所述预测栅格流量,对所述待分析区域进行补点规划。
在一个实施例中,所述基于所述预测栅格流量,对所述待分析区域进行补点规划,包括:
对各候选栅格区域进行聚类建模,确定持续超出流量阈值的目标区域,并基于串行算法或硬币算法,生成目标区域的凸包图层,所述候选栅格区域是所述预测栅格流量大于流量阈值的栅格区域;
基于所述凸包图层,对目标区域进行补点规划。
在一个实施例中,所述获取待分析区域内各栅格区域当前时段的栅格数据,包括:
基于用户面的HTTP(Hyper Text Transfer Protocol,超文本传输协议)信令数据,获取用户的经纬度数据;
基于所述经纬度数据以及基站工作参数,得到所述栅格数据。
在一个实施例中,所述对所述栅格数据进行特征提取,得到各栅格区域的栅格特征数据,之前还包括:
针对任一栅格区域进行数据分析,确定影响所述任一栅格区域的栅格流量的栅格特征类型;
所述栅格特征数据还包括所述栅格特征类型对应的特征值;
所述栅格特征类型包括节假日、天气和重大事件中的至少一种。
在一个实施例中,所述基于所述栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,包括:
对所述栅格流量进行独热编码,得到流量值;
对所述流量值和所述特征值进行特征缩放,并输入至所述流量预测模型中,得到所述预测栅格流量。
在一个实施例中,所述栅格流量包括流量增长率和/或历史流量峰值。
在一个实施例中,所述流量预测模型是基于如下方法构建的:
基于损失函数和梯度下降法,根据样本栅格特征数据以及所述样本栅格特征数据对应的预测栅格流量对初始模型进行训练,得到所述流量预测模型。
第二方面,本发明提供一种区域补点规划装置,包括:
获取模块,用于获取待分析区域内各栅格区域当前时段的栅格数据;
提取模块,用于对所述栅格数据进行特征提取,得到各栅格区域的栅格特征数据,所述栅格特征数据包括栅格流量;
预测模块,用于基于所述栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,所述流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;
规划模块,用于基于所述预测栅格流量,对所述待分析区域进行补点规划。
第三方面,本发明提供一种电子设备,包括存储器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述区域补点规划方法的步骤。
第四方面,本发明提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行第一方面所述区域补点规划方法的步骤。
本发明提供的区域补点规划方法、装置、电子设备和存储介质,通过流量预测模型预测得到各栅格区域下一时段的预测栅格流量,可以实现提前补点规划以解决未来流量高并发,提高补点规划的实效性和主动性,通过将待分析区域划分成各个栅格区域,并且根据预测栅格流量对待分析区域进行补点规划,可以实现对高流量区域的精准定位,指导容量覆盖精准规划工作,并且,无需工作人员进行人工补点规划,提高了高流量区域处理的效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的区域补点规划方法的流程示意图之一;
图2是本发明提供的经纬度数据获取方法的流程示意图;
图3是本发明提供的经纬度提取方法的流程示意图;
图4是本发明提供的区域补点规划装置的结构示意图;
图5是本发明提供的区域补点规划方法的流程示意图之二;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种区域补点规划方法,图1是本发明提供的区域补点规划方法的流程示意图,如图1所示,该方法包括:
步骤110,获取待分析区域内各栅格区域当前时段的栅格数据。
具体地,待分析区域即需要进行流量分析进而判断是否需要进行补点规划的区域。为了提高补点规划的准确性,本发明实施例预先将整个待分析区域进行栅格化及编号,得到多个栅格区域,在此基础上,即可根据信令数据获取各栅格区域当前时段的栅格数据,方便后续针对各栅格区域进行流量分析。此处,所划分的栅格区域的尺寸可以根据需求进行任意设定,例如,40米×40米、50米×50米等。另外,本发明实施例对当前时段的长度也不作具体限定,例如,小时、天等。
步骤120,对栅格数据进行特征提取,得到各栅格区域的栅格特征数据,栅格特征数据包括栅格流量;
步骤130,基于栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;
步骤140,基于预测栅格流量,对待分析区域进行补点规划。
具体地,目前各厂家北向采集历史OMC(Operations Maintenance Center,操作维护中心)统计中的容量负荷类统计,当达到高负荷门限时,生成工单,再进行扩减容/规划等方法处理,该方法实效性较差,容易造成投资浪费。针对这一问题,本发明实施例通过预先构建流量预测模型,流量预测模型预测得到各栅格区域下一时段的预测栅格流量,再根据预测栅格流量对待分析区域进行补点规划,从而可以对高流量区域提前进行补点规划,进而提高补点规划的实效性和主动性。
在得到各栅格区域的栅格数据之后,可以对栅格数据进行特征提取,从而可以提取出有利于预测栅格流量的栅格特征数据,可以理解的是,栅格特征数据包括每个栅格区域当前时段内发生的流量即栅格流量,在此基础上,即可将栅格特征数据输入至预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量。
另外,在执行步骤130之前,还可以预先训练得到流量预测模型,具体可通过如下方式训练得到流量预测模型:首先,收集大量各栅格区域在各历史时段的样本栅格特征数据,以及样本栅格特征数据对应的预测栅格流量,可以理解的是,此时样本栅格特征数据对应的预测栅格流量为实际值。随即,基于样本栅格特征数据,以及样本栅格特征数据对应的预测栅格流量对初始模型进行训练,从而得到流量预测模型。其中,初始模型可以是单一神经网络模型,也可以是多个神经网络模型的组合。
在得到各栅格区域的预测栅格流量之后,可以对预测栅格流量的大小进行判断,根据判断结果对待分析区域进行补点规划,从而规避该区域发生容量受限的情况,此处,可以是对预测栅格流量较高的各栅格区域进行单独补点规划,也可以是将预测栅格流量较高的各栅格区域进行聚类后再进行补点规划。另外,本发明实施例对于补点规划的方式不作具体限定,例如可以是进行基站扩容、基站参数调整,也可以是添加室外宏站、微站、室分、放大器等。
本发明实施例提供的方法,通过流量预测模型预测得到各栅格区域下一时段的预测栅格流量,可以实现提前补点规划以解决未来流量高并发,提高补点规划的实效性和主动性,通过将待分析区域划分成各个栅格区域,并且根据预测栅格流量对待分析区域进行补点规划,可以实现对高流量区域的精准定位,指导容量覆盖精准规划工作,并且,无需工作人员进行人工补点规划,提高了高流量区域处理的效率。
基于上述任一实施例,步骤140包括:
对各候选栅格区域进行聚类建模,确定持续超出流量阈值的目标区域,并基于串行算法或硬币算法,生成目标区域的凸包图层,候选栅格区域是预测栅格流量大于流量阈值的栅格区域;
基于凸包图层,对目标区域进行补点规划。
具体地,在得到各栅格区域的预测栅格流量之后,可以判断各预测栅格流量是否大于预设的流量阈值,如果预测栅格流量大于流量阈值,则将对应的栅格区域作为候选栅格区域,在此基础上,即可得到各个候选栅格区域。此处,流量阈值可以根据需要进行任意设定,本发明实施例对此不作具体限定。
考虑到高流量热点区域可能单个存在,也可能连片出现,为了提高区域补点规划的效率,本发明实施例随即对各候选栅格区域进行聚类建模,从而可以根据各候选栅格区域之间的位置关系,确定持续超出流量阈值的目标区域,此处的目标区域即由多个较为密集的候选栅格区域所组成的区域。
在得到目标区域之后,可以根据串行算法或硬币算法,生成目标区域的凸包图层,此处的凸包图层即为包含目标区域中所有点的最小凸多边形图层,具体可以通过如下方法得到:
1、串行算法:
对目标区域点集按照x的大小排序,找出集中点x坐标值的最小值和最大值的两个极限点pmin和pmax,此二值极点位于凸包边界上。用直线连接pmin和pmax,则点集中的点部分位于上方,部分位于下方,显然点集的最小凸包由这两部分组成,即将从pmin到pmax的上凸壳、下凸壳两者相加就是点集的最小凸包。
以计算上凸壳为例,下凸壳的计算方法相同。只考虑直线以上的点。上凸壳必然包含距离直线最远的居于直线上方的点,如果所有点都不在直线上方,则上凸壳由pmin和pmax直接确定。设位于直线上距离直线距离最大的点为pm,则类似的用直线连接pmin和pm以及pm和pmax,再次进行寻找直线上距离最远点,若pmin到pm和pm到pmax都找不到,则凸壳由pmin,pm,pmax直接确定,否则,再重复以上步骤进行划分,直到所有直线上都不再有点,上凸壳就可以由这些点确定。
2、硬币算法:
2-1.从目标区域点集中找一个必在凸包上的点,通常取纵坐标最小的点,记为P0。
2-2.连结P0与其他点,按照顺时针方向对这些连结得到的线段排序。(左转判定:这是经典的计算几何学问题,判断向量p1=(x1,y1)到p2=(x2,y2)是否做左转,只需要判断x1×y2-x2×y1的正负,如果结果为正,则从p1到p2做左转。)
2-3.在P0、P1、P2上分别放置一枚硬币;把这三枚硬币分别命名为“后”、“中”、“前”。
2-4.反复
如果三枚硬币按“后-中-前”的顺序“做左转”;
拿起“后”,放在“前”的前面;
将原先的“后”改名为“前”;
将原先的“前”改名为“中”;
将原先的“中”改名为“后”;
否则,
拿起“中”,放在“后”的后面;
移除刚才“中”所在的点;
将原先的“中”改名为“后”;
将原先的“后”改名为“中”;
直到“前”盖在P0上,三枚硬币“做左转”。
2-5.按照编号大小顺此连结剩下的点(编号最大的点连回P0),得到的多边形就是给定点集的最小凸包图层。
在得到目标区域的凸包图层之后,即可生成工单,基于凸包图层,优先对该目标区域进行补点规划,此处的补点规划方法可以是首先判断该目标区域的基站是否可以进行扩容或参数调整,再根据扩容或参数调整后的结果判断是否还需要进行补点,也可以是直接对该目标区域进行补点,本发明实施例对此不作具体限定。
基于上述任一实施例,步骤110包括:
基于用户面的HTTP信令数据,获取用户的经纬度数据;
基于经纬度数据以及基站工作参数,得到栅格数据。
具体地,可以通过如下方式获取待分析区域内各栅格区域当前时段的栅格数据:首先根据用户面的HTTP信令数据,得到用户的经纬度数据,随即可以根据经纬度数据和各栅格区域之间的对应关系、信令数据以及基站工作参数,获取各栅格区域当前时段的栅格数据。
进一步地,图2是本发明提供的经纬度数据获取方法的流程示意图,如图2所示,经纬度数据的获取经过了信令的采集、解码、XDR(X Data Recording,X数据记录)合成、经纬度提取、偏移修正几个过程。其中采集、解码、合成、识别遵循通信领域原有的规范,在规范的基础上对业务识别进行了灵活应用,通过提取业务信令中携带的经纬度信息,再对经纬度信息进行偏移修正,从而实现了经纬度数据的获取。
图3是本发明提供的经纬度提取方法的流程示意图,如图3所示,经纬度提取具体是通过如下步骤实现的:分析应用层的HTTP协议;捕捉用户的HTTP请求(GET/POST);在用户HTTP请求的上下行信息中,获取经纬度信息,此处,为了保证数据量,具体可以通过三种途径获取经纬度信息,分别是:URL(Uniform Resource Location,统一资源定位符)中的经纬度(上行)、PAYLOAD中的文本格式的经纬度(下行)、PAYLOAD中的HTML(Hyper Text MarkupLanguage,超文本标记语言)格式的经纬度(下行)。
基于上述任一实施例,步骤120之前还包括:
针对任一栅格区域进行数据分析,确定影响任一栅格区域的栅格流量的栅格特征类型;
栅格特征数据还包括栅格特征类型对应的特征值;
栅格特征类型包括节假日、天气和重大事件中的至少一种。
具体地,考虑到除了栅格流量之外还存在另外的特征数据有利于预测栅格流量,为了提高用栅格特征数据预测栅格流量的准确度,本发明实施例在对栅格数据进行特征提取之前,针对任意一个栅格区域使用绘制图表、统计测试等数据分析方法,确定出会影响该栅格区域栅格流量的特征类型有节假日(HOLIDAY)、天气(WEATHER)和重大事件(EVENT),因此可以从这三个特征类型中至少选取一种作为栅格特征类型。在此基础上,即可根据栅格特征类型对栅格数据进行特征提取,最终得到栅格特征类型对应的特征值,并和栅格流量一起组成栅格特征数据。
进一步地,为了进一步提高栅格特征数据预测栅格流量的准确度,栅格特征类型还可以包括进栅格人数(ENTRIE_PERS)、出栅格人数(EXIT_PERS)、场景(SCENETYPE)、历史高负荷(HIGHT_LOAD_HIS)中的至少一种,可以理解的是,上述这些特征类型同样有利于栅格流量的预测。此处的进栅格人数、出栅格人数表示当前时段内进出单一一个栅格区域(grid)的人数。
基于上述任一实施例,步骤120包括:
对栅格流量进行独热编码,得到流量值;
对流量值和特征值进行特征缩放,并输入至流量预测模型中,得到预测栅格流量。
具体地,考虑到栅格流量属于类别变量,而算法模型仅能识别numerical型(数值型)的数据,针对这一问题,本发明实施例对栅格流量进行独热编码,将其转化为numerical型的流量值。为了提高模型收敛的速度,本发明实施例随即将流量值和栅格特征类型对应的特征值进行特征缩放,即将流量值和特征值缩放到0附近,此处的特征缩放方式可以是标准化,也可以是归一化,本发明实施例对此不作具体限定。
在完成特征缩放之后,还可以对特征缩放后的流量值和特征值进行合并以及数据降维,再输入至流量预测模型中进行栅格流量的预测,最终即可得到各栅格区域下一时段的预测栅格流量。
基于上述任一实施例,栅格流量包括流量增长率和/或历史流量峰值。
具体地,考虑到各栅格区域的流量增长率和历史流量峰值对于未来流量值的影响,本发明实施例在进行流量预测时,输入至流量预测模型中的栅格特征数据除了包括栅格区域当前时段的栅格流量本身,还可以包括流量增长率,或者包括历史流量峰值,或者同时包括流量增长率和历史流量峰值。
本发明实施例提供的方法,通过在用栅格特征数据进行栅格流量预测时,考虑了流量增长率、历史流量峰值对于未来流量值的影响,提高了预测栅格流量的准确性,进而提高了补点规划的准确性。
基于上述任一实施例,流量预测模型是基于如下方法构建的:
基于损失函数和梯度下降法,根据样本栅格特征数据以及样本栅格特征数据对应的预测栅格流量对初始模型进行训练,得到流量预测模型。
具体地,在执行步骤130之前,具体可通过如下方式训练得到流量预测模型:基于样本栅格特征数据,以及样本栅格特征数据对应的预测栅格流量对初始模型进行训练,并通过模型输出的预测值和预测栅格流量的绝对误差构造损失函数,通过梯度下降方法获取该损失函数的最小损失值,根据最小损失值确定模型参数,从而得到流量预测模型。可以理解的是,此处的流量预测模型所完成的是预测连续变量的任务,该模型属于线性回归模型。
进一步地,流量预测模型的损失函数可以是:
其中,m为训练样本的个数,x表示样本,θTx为用参数θ和x得到的预测值,y为实际值;
使用梯度下降法,寻找θ值,使损失函数取得最小值,梯度下降法的公式如下:
其中,α为学习率(learning-rate)。
在流量预测模型训练完成之后,还可以使用绘制残差图方法对流量预测模型进行评估。残差被定义为预测值和实际值之间的差异,是一个模型中不希望数据存在的变化。残差图呈现正态分布,平均值为0,并且存在有限的方差。并且,引入“正态性检验”scipy.stats.normaltest(residuals)对残差图的优劣进行评估。当预测到下一时段的预测栅格流量超过峰值时,输出该预测栅格流量所对应的栅格区域的栅格数据,并对该栅格区域的历史高负荷信息进行评估。
基于上述任一实施例,本发明实施例回填OTT(Over The Top,互联网越过运营商)/MDT(Minimization Drive Test,小化路测)/指纹库经纬度数据的MRO(MeasurementReport Original,测量报告样本数据文件)、S1_MME、S1_u_http、Mw数据,并根据圆整后的经纬度数据和各栅格区域之间的对应关系以及信令数据,以小时为单位,统计各栅格区域的栅格数据,包括栅格常驻(静态)用户、栅格访问(动态)用户、栅格小时入用户、栅格小时出用户、栅格上网流量、栅格流量小时增长率、栅格流量历史峰值、栅格历史高负荷次数、栅格-常驻小区信息。结合基站工作参数,关联获取栅格所属区域、场景类型等。
在此基础上,统计每个栅格每小时的流量统计作为栅格流量的观测数据Xt。每一个观测张量就是X∈R(2×I×J),其中,R(2×I×J)表示二维数组:2是常量,I表示进栅格增加流量总数,J表示出栅格减少流量总数。进一步地,在统计每个栅格的流量观测数据时,还可以使用栅格常驻用户、栅格访问用户进一步校准进/出栅格流量。
基于上述任一实施例,本发明实施例对栅格数据进行数据预处理和特征提取,得到有效特征字段共计14行,可分为2种类型的数据:栅格业务数据和栅格特征数据,具体包括如表1所示:
表1:
特征 | 描述 |
GRID | 栅格 |
DATE | 日期 |
TIME | 时间 |
TRAFFIC | 流量 |
ENTRIE_PERS | 进栅格人数 |
EXIT_PERS | 出栅格人数 |
WEATHER | 天气 |
HOLIDAY | 节假日 |
EVENT | 重大事件 |
HIS_HIGHT_POINT | 历史流量峰值 |
GROWTHRATES | 流量增长率 |
AREA | 区域 |
SCENETYPE | 场景 |
HIGHT_LOAD_HIS | 历史高负荷次数 |
基于上述任一实施例,目前各分公司统一处理规划需求,不能简易直观的看到哪些规划需求为实时热点或高频热点区域。而本发明实施例在对高流量栅格区域进行聚类后,可参考聚类栅格场景、高流量栅格数、出入区域人数等特征信息,制定优先级不同的规划需求,优先处理高流量高危险区域规划流量,并且可以实现对高流量区域的精准定位。
基于上述任一实施例,在现有的宏站覆盖场景的容量规划技术中,参考信息仅为方便采集和度量的,包括流量热点区域面积、估算流量热点区域流动(常驻)人员数量/入住率等因素,主观因素多,准确性低,同时也无法真实反映流量热点。本发明实施例以40*40米栅格区域为基础粒度,对达到或预测达到扩容门限的栅格区域进行聚类,根据聚类区域内采样点主TOP小区参考流量峰值、RRC(Radio Resource Control,无线资源控制层)有效数、利用率(包括上行利用率和下行利用率)等指标,输出规划需求,并且考虑了流量热点区域用户及流量发展对规划效果的影响,从而实现提高区域补点规划的准确性。
基于上述任一实施例,本发明实施例对内蒙全区位置进行40米地理化栅格区域划分,形成32亿个栅格基础数据,使用户HTTP信令映射到具体的栅格区域,并对栅格区域的场景进行建模识别,最终实现对各个场景分别建立对应的流量预测模型。
另外,针对内蒙古地域进行了如下数据分析:
一、数据初步分析:
(a)绘制“任意时刻(DateTimeN)下,栅格流量(TRAFFIC)的分布折线图”;
结论:
1、栅格流量呈现“间歇性密集”分布;
2、大多栅格流量每周几乎都有1次峰值,峰值分布时段有迹可循;
3、深入分析,分析星期几如何影响每小时的栅格流量;
(b)绘制“不同星期(day)下,栅格流量的分布条形图”;
结论:
1、内蒙古是旅游季非旅游季明显的地域,不同月份栅格进出入数及栅格流量呈现“间歇性密集”分布;
2、景区/商超/居民区等场景栅格星期六和星期日是栅格流量最大的日子,商务区/美食街/工业园区等场景星期六和星期日是栅格流量最小的日子;
3、下一步绘制了分时段按小时分组后,各小时的栅格流量,以查看哪些时段的小时比其他小时更繁忙;
(c)绘制“以小时分组后,不同小时下,栅格流量的分布折线图”;
结论:
1、可以发现白天确实存在多个尖峰,详细的分布关系需进一步精细绘图;
2、接下来考虑重大事件对栅格流量的影响,如果无重大事件,EVENT项对应的特征值则为0,如果有重大事件,EVENT项对应的特征值则为1。
3、通过df.describe()发现:在重大事件时,小时栅格流量增长率和流量均值比在没有重大事件时高很多。
4、进一步绘制数据的核密度估计图(KDE,Kernel density estimation)。KDE是“平滑直方图”,通过KDE对栅格流量数据的概率分布函数(PDF)的估计,即“此时这个值的[0,1]的概率是多少”。
(d)对栅格流量取对数log10得到新增特征(TRAFFIC_log10)。绘制“TRAFFIC_log10的核密度估计图”;
结论:
1、通过在x轴上绘制TRAFFIC_log10的核密度曲线,可以更容易地在同一图表中拟合具有极值的数据,实现降噪的目的;
2、“以小时分组后,不同小时下,栅格流量的分布折线图”表明,貌似在重大事件时每小时有更多人进入栅格。通过绘制KDE发现:在MTA(multi-tier application,多层应用)上不同场景下的栅格流量根据重大事件而改变。
二、数据深度分析:
数字方式分析确定是否存在差异:
(a)给定不同特征值代入的两组样本数据,例如是否雨雪天气、是否节假日、是否重大活动等,我们需要比较,两组样本数据是否具有相同的平均值。
(b)考察“所给数据是否正常分布,以便可以对其进行t-检验?
(c)绘制“栅格流量的计数直方图”;“栅格流量的计数直方图”表明:栅格流量的数据貌似不呈现“正态分布”特征;
(d)为进一步确定栅格流量的数据分布特征,引入(k2,pvalue)=scipy.stats.normaltest(turnstile_data[“TRAFFIC”])模块,对栅格流量进行“正态性检验”(返回值pvalue——表示“假设检验的双侧卡方概率”);
在正态性检验中,Shapiro-Wilk测试(scipy.stats.shapiro),只适用于具有5000以下的数据集样本;
在本项目的正态性检验(scipy.stats.normaltest)中,返回了接近0的p值,这意味着数据确实不呈现正态分布,故使用Mann-Whitney U测试。
(e)将样本数据按照是否重大事件分开,即得到不同特征值的样本df_EVENT1和df_EVENT2,之后计算样本df_EVENT1和df_EVENT2的Mann-Whitney秩检验;
适用如下计算方法:
1、scipy.stats.mannwhiteneyu返回的是单侧p值,使用单侧p值×2得到双侧p值。
2、计算结果得知,在5%的确定度(degree of certainty)下,每小时栅格发生流量的平均值的差异,取决于是否正在进行重大事件活动。
基于上述任一实施例,图4是本发明提供的区域补点规划方法的流程示意图之二,如图4所示,整体流程如下:基于用户面HTTP信令数据的经纬度识别/回填,采集各栅格区域的小时级栅格数据;针对任一栅格区域进行数据初步分析、数据深度分析,确定影响栅格流量的栅格特征类型,如节假日、重大事件;根据栅格特征类型从样本栅格数据中提取样本栅格特征数据,进行流量预测模型的创建;流量预测模型创建时,基于损失函数和梯度下降法,以及数据处理后的样本栅格特征数据对初始模型进行训练;采用残差图方法评估流量预测模型;在分场景创建流量预测模型完成后,可以输入栅格特征数据,从而得到预测栅格流量;对预测栅格流量超过预设阈值的候选栅格区域进行聚类,得到未来持续高流量区域,并应用串行或硬币算法,最终生成分场景的持续高流量区域凸包图层。
下面对本发明提供的区域补点规划装置进行描述,下文描述的区域补点规划装置与上文描述的区域补点规划方法可相互对应参照。
图5是本发明提供的区域补点规划装置的结构示意图,如图5所示,该装置包括:
获取模块510,用于获取待分析区域内各栅格区域当前时段的栅格数据;
提取模块520,用于对所述栅格数据进行特征提取,得到各栅格区域的栅格特征数据,所述栅格特征数据包括栅格流量;
预测模块530,用于基于所述栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,所述流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;
规划模块540,用于基于所述预测栅格流量,对所述待分析区域进行补点规划。
本发明实施例提供的装置,通过流量预测模型预测得到各栅格区域下一时段的预测栅格流量,可以实现提前补点规划以解决未来流量高并发,提高补点规划的实效性和主动性,通过将待分析区域划分成各个栅格区域,并且根据预测栅格流量对待分析区域进行补点规划,可以实现对高流量区域的精准定位,指导容量覆盖精准规划工作,并且,无需工作人员进行人工补点规划,提高了高流量区域处理的效率。
基于上述任一实施例,规划模块540包括:
图层生成单元,用于对各候选栅格区域进行聚类建模,确定持续超出流量阈值的目标区域,并基于串行算法或硬币算法,生成目标区域的凸包图层,候选栅格区域是预测栅格流量大于流量阈值的栅格区域;
规划单元,用于基于凸包图层,对目标区域进行补点规划。
基于上述任一实施例,获取模块510包括:
经纬度数据获取单元,用于基于用户面的HTTP信令数据,获取用户的经纬度数据;
栅格数据获取单元,用于基于经纬度数据以及基站工作参数,得到栅格数据。
基于上述任一实施例,该装置还包括数据分析模块,用于:
针对任一栅格区域进行数据分析,确定影响任一栅格区域的栅格流量的栅格特征类型;
栅格特征数据还包括栅格特征类型对应的特征值;
栅格特征类型包括节假日、天气和重大事件中的至少一种。
基于上述任一实施例,预测模块530包括:
编码单元,用于对栅格流量进行独热编码,得到流量值;
预测单元,用于对流量值和特征值进行特征缩放,并输入至流量预测模型中,得到预测栅格流量。
基于上述任一实施例,栅格流量包括流量增长率和/或历史流量峰值。
基于上述任一实施例,流量预测模型是基于如下方法构建的:
基于损失函数和梯度下降法,根据样本栅格特征数据以及样本栅格特征数据对应的预测栅格流量对初始模型进行训练,得到流量预测模型。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communication Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的计算机程序,以执行区域补点规划方法的步骤,例如包括:获取待分析区域内各栅格区域当前时段的栅格数据;对栅格数据进行特征提取,得到各栅格区域的栅格特征数据,栅格特征数据包括栅格流量;基于栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;基于预测栅格流量,对待分析区域进行补点规划。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的区域补点规划方法,该方法包括:获取待分析区域内各栅格区域当前时段的栅格数据;对栅格数据进行特征提取,得到各栅格区域的栅格特征数据,栅格特征数据包括栅格流量;基于栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;基于预测栅格流量,对待分析区域进行补点规划。
另一方面,本申请实施例还提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行上述各实施例提供的方法,例如包括:获取待分析区域内各栅格区域当前时段的栅格数据;对栅格数据进行特征提取,得到各栅格区域的栅格特征数据,栅格特征数据包括栅格流量;基于栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;基于预测栅格流量,对待分析区域进行补点规划。
所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种区域补点规划方法,其特征在于,包括:
获取待分析区域内各栅格区域当前时段的栅格数据;
对所述栅格数据进行特征提取,得到各栅格区域的栅格特征数据,所述栅格特征数据包括栅格流量;
基于所述栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,所述流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;
基于所述预测栅格流量,对所述待分析区域进行补点规划。
2.根据权利要求1所述的区域补点规划方法,其特征在于,所述基于所述预测栅格流量,对所述待分析区域进行补点规划,包括:
对各候选栅格区域进行聚类建模,确定持续超出流量阈值的目标区域,并基于串行算法或硬币算法,生成目标区域的凸包图层,所述候选栅格区域是所述预测栅格流量大于流量阈值的栅格区域;
基于所述凸包图层,对目标区域进行补点规划。
3.根据权利要求1所述的区域补点规划方法,其特征在于,所述获取待分析区域内各栅格区域当前时段的栅格数据,包括:
基于用户面的HTTP信令数据,获取用户的经纬度数据;
基于所述经纬度数据以及基站工作参数,得到所述栅格数据。
4.根据权利要求1所述的区域补点规划方法,其特征在于,所述对所述栅格数据进行特征提取,得到各栅格区域的栅格特征数据,之前还包括:
针对任一栅格区域进行数据分析,确定影响所述任一栅格区域的栅格流量的栅格特征类型;
所述栅格特征数据还包括所述栅格特征类型对应的特征值;
所述栅格特征类型包括节假日、天气和重大事件中的至少一种。
5.根据权利要求4所述的区域补点规划方法,其特征在于,所述基于所述栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,包括:
对所述栅格流量进行独热编码,得到流量值;
对所述流量值和所述特征值进行特征缩放,并输入至所述流量预测模型中,得到所述预测栅格流量。
6.根据权利要求1至5中任一项所述的区域补点规划方法,其特征在于,所述栅格流量包括流量增长率和/或历史流量峰值。
7.根据权利要求1至5中任一项所述的区域补点规划方法,其特征在于,所述流量预测模型是基于如下方法构建的:
基于损失函数和梯度下降法,根据样本栅格特征数据以及所述样本栅格特征数据对应的预测栅格流量对初始模型进行训练,得到所述流量预测模型。
8.一种区域补点规划装置,其特征在于,包括:
获取模块,用于获取待分析区域内各栅格区域当前时段的栅格数据;
提取模块,用于对所述栅格数据进行特征提取,得到各栅格区域的栅格特征数据,所述栅格特征数据包括栅格流量;
预测模块,用于基于所述栅格特征数据,以及预先构建的流量预测模型,得到各栅格区域下一时段的预测栅格流量,所述流量预测模型是基于各栅格区域在各历史时段的样本栅格特征数据训练得到的;
规划模块,用于基于所述预测栅格流量,对所述待分析区域进行补点规划。
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述区域补点规划方法的步骤。
10.一种处理器可读存储介质,其特征在于,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行权利要求1至7任一项所述区域补点规划方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110654341.0A CN115474203A (zh) | 2021-06-11 | 2021-06-11 | 区域补点规划方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110654341.0A CN115474203A (zh) | 2021-06-11 | 2021-06-11 | 区域补点规划方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115474203A true CN115474203A (zh) | 2022-12-13 |
Family
ID=84363995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110654341.0A Pending CN115474203A (zh) | 2021-06-11 | 2021-06-11 | 区域补点规划方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115474203A (zh) |
-
2021
- 2021-06-11 CN CN202110654341.0A patent/CN115474203A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107547633B (zh) | 一种用户常驻点的处理方法、装置和存储介质 | |
WO2017076154A1 (zh) | 网络事件预测以及建立网络事件预测模型的方法和装置 | |
CN110492480A (zh) | 配电网拓扑识别方法、装置、计算机设备和可读存储介质 | |
CN111078818B (zh) | 地址分析方法、装置、电子设备及存储介质 | |
CN110942625A (zh) | 基于现实路径流量回溯调节的动态od估计方法及装置 | |
CN112990976A (zh) | 基于开源数据挖掘的商业网点选址方法、系统、设备及介质 | |
CN112101692B (zh) | 移动互联网质差用户的识别方法及装置 | |
CN111294841B (zh) | 一种无线网络问题的处理方法、装置及存储介质 | |
CN109995611B (zh) | 流量分类模型建立及流量分类方法、装置、设备和服务器 | |
CN117078048A (zh) | 基于数字孪生的智慧城市资源管理方法及系统 | |
CN113283824A (zh) | 智慧园区数据综合管理方法及系统 | |
CN118097961A (zh) | 交通流量数据的分析方法、装置、电子设备及存储介质 | |
CN115795329A (zh) | 一种基于大数据网格下的用电异常行为分析方法和装置 | |
CN111800807A (zh) | 一种基站用户数量告警的方法及装置 | |
CN109995549B (zh) | 一种评估流量价值的方法及装置 | |
CN116703132B (zh) | 共享车辆动态调度的管理方法、装置及计算机设备 | |
CN111310340B (zh) | 基于人类移动的城市区域交互异常关系识别方法及设备 | |
CN116227929A (zh) | 通信数据的分析方法、装置、设备及存储介质 | |
CN115474203A (zh) | 区域补点规划方法、装置、电子设备和存储介质 | |
CN114495137B (zh) | 票据异常检测模型生成方法与票据异常检测方法 | |
CN112529311B (zh) | 一种基于图卷积分析的道路流量预测方法和装置 | |
CN115150840A (zh) | 一种基于深度学习的移动网络流量预测方法 | |
CN110428627B (zh) | 一种公交出行潜力区域识别方法及识别系统 | |
CN114520773A (zh) | 一种服务请求的响应方法、装置、服务器及存储介质 | |
CN113011098A (zh) | 一种输电走廊区域雷电活动规律分析显示模型及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |