CN112312454A - 一种lte用户体验kpi与弱覆盖关系判定方法 - Google Patents

一种lte用户体验kpi与弱覆盖关系判定方法 Download PDF

Info

Publication number
CN112312454A
CN112312454A CN201910700136.6A CN201910700136A CN112312454A CN 112312454 A CN112312454 A CN 112312454A CN 201910700136 A CN201910700136 A CN 201910700136A CN 112312454 A CN112312454 A CN 112312454A
Authority
CN
China
Prior art keywords
weak coverage
training
samples
algorithm
key performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910700136.6A
Other languages
English (en)
Inventor
陈晓
张琪斌
张国华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Longqilin Information Technology Co ltd
Original Assignee
Jiangsu Longqilin Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Longqilin Information Technology Co ltd filed Critical Jiangsu Longqilin Information Technology Co ltd
Priority to CN201910700136.6A priority Critical patent/CN112312454A/zh
Publication of CN112312454A publication Critical patent/CN112312454A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开一种LTE用户体验KPI与弱覆盖关系判定方法,包括:对基站通信数据进行预处理,抽取跟弱覆盖问题相关的小区关键性能指标(即KPI),筛选弱覆盖训练样本;采用kmeans聚类算法,对样本进行聚类分析;利用lof算法剔除每类中的边缘异常样本;利用熵权法,计算指标权重;利用随机森林方法训练小区弱覆盖程度分类器。

Description

一种LTE用户体验KPI与弱覆盖关系判定方法
技术领域
本发明属于通信数据网络优化与数据挖掘领域,特别涉及一种LTE用户体验KPI与弱覆盖关系判定方法。
背景技术
根据工信部《2018年通信运营业统计公报》显示,2016年全国电话用户达17.5亿户,移动通信基站总数达648万个。面对用户数量的激增以及基站的增加,移动网流量以及信令非线性化高速增长,流量分布不均匀等问题越来越明显,通过部署密集的小区方式可以解决这些问题。但是这种网络变革导致网元节点数快速增加,网元之间的交互更加频繁、复杂,网络的组织结构也因此变得繁杂。在这种情况下,网络每天记录下的数据会非常庞大,运维任务越来越繁重,传统的基于人工的运维方式将会耗费大量的人力和时间。
网优人员的一个主要任务是关注每个基站辐射下的小区是否发生故障,是否接到投诉,进而对小区参数,基站建设位置等进行调整,尽量为用户提供良好的上网体验。
弱覆盖问题一直是网优人员重点关注的问题,也是影响网络环境的一个重要因素。弱覆盖指的是总采样点大于1000,参考信号接收功率<-114的采样点占比超过20%的小区。
在过往的案例中,网优人员主要是对于每类问题设置阈值进行监测,当基站设备的实时监测值长时间超过阈值的情况下,网优人员会定位出相应的小区,根据经验文档等进行问题排查。甚至在某些情况下是在用户投诉网络体验质量不佳之后才进行问题排查。这种依赖于人工的问题排查方式太依赖于经验,并且时效性不是很强。
随着网络体系的不断庞大,国内外对于基站历史数据进行学习,进而得到模型,提前预测网络问题的研究越来越多。
2016年8月17日公布的申请号为201610262009.9的发明专利申请,公布了一种“基于网络体验质量的移动通信网异常检测和定位方法”;该发明基于网络体验质量的异常检测子系统和异常根因定位子系统,对网络实现异常检测和异常定位。在异常检测子系统中,利用聚类算法得到轻微异常,异常和正常三大类;在异常根因定位子系统中,利用累积分布函数得到异常性能指标,然后在利用聚类得到异常根因类别。这种方法要依靠实时数据,不能采用历史数据对未来的网络状况进行预判。
LOF算法(Local Outlier Factor,局部离群因子检测方法),是一种无监督的离群检测方法,是基于密度的离群点检测方法中一个比较有代表性的算法。该算法会给数据集中的每个点计算一个离群因子LOF,通过判断LOF是否接近于1来判定是否是离群因子。若LOF远大于1,则认为是离群因子,接近于1,则是正常点。
熵最先由申农引入信息论,目前已经在工程技术、社会经济等领域得到了非常广泛的应用。熵权法的基本思路是根据指标变异性的大小来确定客观权重。一般来说,若某个指标的信息熵Ej越小,表明指标值得变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。相反,某个指标的信息熵越大,表明指标值得变异程度越小,提供的信息量也越少,在综合评价中所起到的作用也越小,其权重也就越小。
随机森林方法结合了 Breimans 的“Bootstrap aggregating”想法和 Ho 的“random subspace method”以此来构造决策树集合,它具有抗噪声、防止过拟合、处理非线性关系等优点。
发明内容
本发明的目的在于提供一种LTE用户体验KPI与弱覆盖关系判定方法,在网优人员进行网络优化时,能够对异常根因预先判定,以解决现有技术的不足。
为了实现上述目的,本发明采用如下技术方案:
本发明提供一种LTE用户体验KPI与弱覆盖关系判定方法,包括以下步骤:
步骤1:对基站通信数据进行预处理,抽取跟弱覆盖问题相关的小区关键性能指标(即KPI),筛选弱覆盖训练样本;
步骤2:采用kmeans聚类算法,对样本进行聚类分析;
步骤3:利用lof算法剔除每类中的边缘异常样本;
步骤4:利用熵权法,计算指标权重;
步骤5:利用随机森林方法训练小区弱覆盖程度分类器。
进一步的,步骤1中对基站通信数据进行预处理,抽取跟弱覆盖问题相关的小区关键性能指标(即KPI),筛选弱覆盖训练样本:对基站通信数据进行数据清洗、预处理,根据网优资料抽取与弱覆盖问题相关的关键性能指标。
进一步的,步骤2中用kmeans聚类算法,对样本进行聚类分析:将训练集利用kmeans聚类算法, 将训练样本分为5类,每一类代表一种弱覆盖程度。
进一步的,步骤3中利用lof算法剔除每类中的边缘异常样本:对于每一类训练集的数据样本,利用lof算法计算每个训练样本的局部异常因子,然后设置阈值,将边缘异常样本进行剔除。
进一步的,步骤4中利用熵权法,计算指标权重,包括:
4.1)熵权法计算指标的权重;
数据标准化处理:
Figure 245000DEST_PATH_IMAGE002
计算第i个样本第j项指标的比重:
Figure 453259DEST_PATH_IMAGE004
计算指标信息熵:
Figure 349189DEST_PATH_IMAGE006
计算信息熵冗余:
Figure 233969DEST_PATH_IMAGE008
计算指标权重:
Figure 579630DEST_PATH_IMAGE010
式中:Xij代表第i个样本第j个指标评价指标的数值,min{Xi}和max{Xj}分别代表所有样本中第j个指标的最小值和最大值, QUOTE
Figure 106427DEST_PATH_IMAGE012
Figure 588355DEST_PATH_IMAGE012
其中m为样本数量,n为指标数量。
4.2)将各个指标的权重加入到训练样本中。
进一步的,步骤5中利用随机森林方法训练小区弱覆盖程度分类器:利用randomforest算法训练数据集进行分类器训练。
5.1)对于t=1,2,3,...,T, 对样本集D进行第t次采集,每次采集m个特征,构成 Dm个训练集;
5.2)对于每个Dm训练集,分别训练第m个决策树模型Gm(x)
5.3)将生成的多棵决策树组成随机森林F(X),按多棵树分类器投票决定类别。
相对于现有技术,本发明具有以下有益效果:本发明一种LTE用户体验KPI与弱覆盖关系判定方法:对基站通信数据进行预处理,抽取跟弱覆盖问题相关的小区关键性能指标(即KPI),筛选弱覆盖训练样本;采用kmeans聚类算法,对样本进行聚类分析;利用lof算法剔除每类中的边缘异常样本;利用熵权法,计算指标权重;利用随机森林方法训练小区弱覆盖程度分类器。本发明能有效对网络中得根因进行判定分析,可快速地进行根因定位,减少网优人员的运维任务。
附图说明
图1是本发明实施例的LTE用户体验KPI与弱覆盖关系判定方法流程图。
图2是数据集示意图。
图3是lof算法的说明图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施列用于说明本发明,但不用来限制本发明的范围。
如图1所示,是本发明一种LTE用户体验KPI与弱覆盖关系判定方法流程图,本实例包括如下步骤:
步骤1:对基站通信数据进行预处理,抽取跟弱覆盖问题相关的小区关键性能指标(即KPI),筛选弱覆盖训练样本。
本实施例对基站通信数据进行预处理,抽取跟弱覆盖问题相关的小区KPI,筛选弱覆盖训练样本,对基站通信数据进行数据清洗、预处理,根据网优资料抽取与弱覆盖问题相关的关键性能指标,指标见图2。
步骤2:用kmeans聚类算法,对样本进行聚类分析。
本实施例对于将训练集利用kmeans聚类算法, 将训练样本分为5类,每一类代表一种弱覆盖程度。
步骤3:利用lof算法剔除每类中的边缘异常样本。
本实施例对于每一类训练样本,利用lof算法计算每个训练样本的局部异常因子,然后在每个类别中设置阈值0.9,将边缘异常样本进行剔除,如图3所示。
步骤4:利用熵权法,计算指标权重,包括:
1)熵权法计算指标的权重,数据标准化处理:
Figure 644035DEST_PATH_IMAGE002
计算第i个样本第j项指标的比重:
Figure 742573DEST_PATH_IMAGE014
计算指标信息熵:
Figure 289704DEST_PATH_IMAGE016
计算信息熵冗余:
Figure 140985DEST_PATH_IMAGE018
计算指标权重:
Figure 383879DEST_PATH_IMAGE020
式中:Xij代表第i个样本第j个指标评价指标的数值,min{Xi}和max{Xj}分别代表所有样本中第j个指标的最小值和最大值, QUOTE
Figure 953401DEST_PATH_IMAGE022
Figure 41574DEST_PATH_IMAGE022
其中m为样本数量,n为指标数量。
2)将各个指标的权重加入到训练样本中。
步骤5:利用随机森林方法训练小区弱覆盖程度分类器,步骤包括:
1)对于t=1,2,3,...,T, 对样本集D进行第t次采集,每次采集m个特征,构成 Dm个训练集;
2)对于每个Dm训练集,分别训练第m个决策树模型Gm(x)
3)将生成的多棵决策树组成随机森林F(X),按多棵树分类器投票决定类别。
实验结果表明,通过本技术方案,可以对复杂的网络问题,弱覆盖问题作出精确分类,对于训练样本达到98%的分类正确率。相比现有方法,本发明不但具有较高的识别精确率,同时增强了算法的鲁棒性,实现了基站根因的提前预测分析。
本发明跳出了传统的人工运维的方式,能够根据历史数据提前预测未来网络根因状况,可以有效地运用于网络运维,节约人力分析检测成本。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以提出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (6)

1.一种LTE用户体验KPI与弱覆盖关系判定方法,其特征在于,包括以下步骤:
对基站通信数据进行预处理,抽取跟弱覆盖问题相关的小区关键性能指标,筛选弱覆盖训练样本;
采用kmeans聚类算法,对所述弱覆盖训练样本进行聚类分析;
利用lof算法剔除每类中的边缘异常样本;
利用熵权法,计算指标权重;
利用随机森林方法训练小区弱覆盖程度分类器。
2.根据权利要求1所述的一种LTE用户体验KPI与弱覆盖关系判定方法,其特征在于,步骤1中对基站通信数据进行预处理,抽取跟弱覆盖问题相关的小区关键性能指标,筛选弱覆盖训练样本包括:对基站通信数据进行数据清洗、预处理,根据网优资料抽取与弱覆盖问题相关的关键性能指标。
3.根据权利要求1所述的一种LTE用户体验KPI与弱覆盖关系判定方法,其特征在于,采用kmeans聚类算法,对所述弱覆盖训练样本进行聚类分析:训练集利用kmeans聚类算法,将所述弱覆盖训练样本分为5类,每一类代表一种弱覆盖程度。
4.根据权利要求1所述的一种LTE用户体验KPI与弱覆盖关系判定方法,其特征在于,利用lof算法剔除每类中的边缘异常样本包括:对于每一类训练集的弱覆盖样本,利用lof算法计算每个弱覆盖训练样本的局部异常因子,然后设置阈值,将边缘异常样本进行剔除。
5.根据权利要求1所述的一种LTE用户体验KPI与弱覆盖关系判定方法,其特征在于,利用熵权法,计算指标权重,包括:
熵权法计算指标的权重;
将各个指标的权重加入到训练样本中。
6.根据权利要求1所述的一种LTE用户体验KPI与弱覆盖关系判定方法,其特征在于,利用随机森林方法训练小区弱覆盖程度分类器包括:利用randomforest算法训练数据集进行分类器训练。
CN201910700136.6A 2019-07-31 2019-07-31 一种lte用户体验kpi与弱覆盖关系判定方法 Pending CN112312454A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910700136.6A CN112312454A (zh) 2019-07-31 2019-07-31 一种lte用户体验kpi与弱覆盖关系判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910700136.6A CN112312454A (zh) 2019-07-31 2019-07-31 一种lte用户体验kpi与弱覆盖关系判定方法

Publications (1)

Publication Number Publication Date
CN112312454A true CN112312454A (zh) 2021-02-02

Family

ID=74486147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910700136.6A Pending CN112312454A (zh) 2019-07-31 2019-07-31 一种lte用户体验kpi与弱覆盖关系判定方法

Country Status (1)

Country Link
CN (1) CN112312454A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113727377A (zh) * 2021-09-02 2021-11-30 中国联合网络通信集团有限公司 基于基站参数判断无线通信环境变化的方法及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113727377A (zh) * 2021-09-02 2021-11-30 中国联合网络通信集团有限公司 基于基站参数判断无线通信环境变化的方法及设备
CN113727377B (zh) * 2021-09-02 2023-07-04 中国联合网络通信集团有限公司 基于基站参数判断无线通信环境变化的方法及设备

Similar Documents

Publication Publication Date Title
WO2021184630A1 (zh) 基于知识图谱定位排污对象的方法及相关设备
CN107528832B (zh) 一种面向系统日志的基线构建与未知异常行为检测方法
CN106888205B (zh) 一种非侵入式基于功耗分析的plc异常检测方法
CN113378990B (zh) 基于深度学习的流量数据异常检测方法
CN111385128B (zh) 突发负荷的预测方法及装置、存储介质、电子装置
CN109726246A (zh) 一种基于数据挖掘和可视化的电网事故关联原因回溯方法
CN114201374B (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN112019529B (zh) 新能源电力网络入侵检测系统
CN117575334A (zh) 公路施工安全监测系统
CN111506635A (zh) 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法
CN117674128A (zh) 基于电力调度系统自动化故障排除方法
CN116843955A (zh) 一种基于计算机视觉的微生物分类识别方法和系统
CN110781303A (zh) 一种短文本分类方法及系统
CN112312454A (zh) 一种lte用户体验kpi与弱覆盖关系判定方法
CN117391458A (zh) 基于数据分析的安全生产风险检测预警方法及系统
CN117633779A (zh) 电力网中网络威胁的元学习检测模型快速部署方法及系统
CN117390546A (zh) 一种面向即时反窃电检测的多模数据库融合存算模型
CN116796894A (zh) 一种高效深度学习气象预测模型的构建方法
CN111209955A (zh) 基于深度神经网络和随机森林的飞机电源系统故障识别方法
CN115392710A (zh) 一种基于数据过滤的风电机组运行决策方法及系统
CN115017238A (zh) 一种可动态预测的数据流量检测分类方法
Wang et al. Fault location of strip steel surface quality defects on hot-rolling production line based on information fusion of historical cases and process data
Hairuman et al. Evaluation of machine learning techniques for anomaly detection on hourly basis kpi
CN111612302A (zh) 一种集团级数据管理方法和设备
CN110569277A (zh) 一种配置数据信息自动识别与归类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210202

WD01 Invention patent application deemed withdrawn after publication