CN116723540A - 一种5g网络数据的质差检测模型训练及质差检测方法 - Google Patents
一种5g网络数据的质差检测模型训练及质差检测方法 Download PDFInfo
- Publication number
- CN116723540A CN116723540A CN202310778935.1A CN202310778935A CN116723540A CN 116723540 A CN116723540 A CN 116723540A CN 202310778935 A CN202310778935 A CN 202310778935A CN 116723540 A CN116723540 A CN 116723540A
- Authority
- CN
- China
- Prior art keywords
- data
- quality difference
- difference detection
- network
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 137
- 238000012549 training Methods 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 claims abstract description 37
- 230000003238 somatosensory effect Effects 0.000 claims abstract description 33
- 230000002159 abnormal effect Effects 0.000 claims abstract description 25
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 5
- 238000009499 grossing Methods 0.000 claims description 27
- 238000012512 characterization method Methods 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 238000007637 random forest analysis Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 5
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 2
- 230000000903 blocking effect Effects 0.000 claims 2
- 238000012544 monitoring process Methods 0.000 abstract description 8
- 238000010801 machine learning Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
- H04L43/55—Testing of service level quality, e.g. simulating service usage
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/10—Scheduling measurement reports ; Arrangements for measurement reports
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明实施例提供的一种5G网络数据的质差检测模型训练及质差检测方法,在原有的网络稳定性性能数据基础下,增加网络用户相关指标:用户数、用户流量,和用户体感相关指标:游戏登陆成功率、游戏登陆时长等。引入半监督学习概念,利用不断增加的历史数据,于上游使用无监督模型和业务规则构建异常标签,扩大质差业务场景;于下游使用标签进行有监督机器学习树模型训练,得到网络质差识别模型。通过模型多次迭代调整,提高有监督模型的准确度,用于后续线上实时监控识别。
Description
技术领域
本发明涉及运营商通信的监控运维领域,尤其涉及一种5G网络数据的质差检测模型训练及质差检测方法。
背景技术
现有运营商集中性能系统对通信设备上网业务进行整体监控检测。业务集中性能平台对通信设备运营商业务数据进行统一采集,并着重关注于网络稳定性评估指标TCP时延、TCP请求成功率、HTTP时延、TCP请求成功率、上下行RTT。通过对各个指标设定固定阈值,实现指标异常的判断。当发现指标有持续异常时,运维人员进行进一步分析,定位通信设备网络是否存在异常。运维人工分析费时费力,工作量大。且人工分析,对人员水平要求较高,场景分析难,人力成本高。
为解决网络分析人工投入大,效果不佳的问题。在原有指标阈值检测的前提下,总结专家业务知识制定规则,实时指标异常发生后,进行质差规则判断,最终实现对网络质差的识别。
通信设备运营商业务因受外部环境因素影响,通信设备网络具有变化频率高,变化度大等特性。通常的阈值规则质差检测方式,难以覆盖所有网络场景,整理规则耗时大,且存在较多质差误报漏报。当网络情况出现较大变化时,无法及时调整规则,无法实现对网络变化的及时响应。需要积累一定的专家知识作为支撑,构建规则费时费力。且因为网络业务复杂,构建覆盖全场景的规则难度较大,判断准确度也不高。
发明内容
针对现有技术中运营商通信监控运维存在的网络业务复杂,构建覆盖全场景的规则难度较大,判断准确度也不高,本发明实施例提供了一种5G网络数据的质差检测模型训练及质差检测方法。
第一方面,本发明提供了一种5G网络数据的质差检测模型训练方法,该方法,包括:
利用网络管理系统获得所述5G网络数据的业务数据,所述业务数据包括,用于反映5G网络性能的稳定性能数据、用户体感指标数据,以及用于间接判断所述5G网络质差的用户表征数据;
对业务数据进行预处理得到所述5G网络的质差检测关键特征、同环比特征、统计特征、时间特征以及数据平滑特征;基于所述质差检测关键特征、同环比特征、统计特征以及时间特征确定第一训练集和第一测试集;基于所述质差检测关键特征、统计特征确定第二训练集第二测试集;
将第一训练集输入随机森林模型进行训练得到有监督的第一质差检测模型;将第二训练集输入DNN神经网络模型进行训练得到有监督的第二质差检测模型;
将所述稳定性能数据、用户体感指标数据输入无监督模型进行训练得到带有异常标签的无标签数据;利用带有异常标签的无标签数据对有监督的第一质差检测模型以及第二质差检测模型进行迭代训练得到第一质差检测模型以及第二质差检测模型;
将第一测试集以及第二测试集分别输入第一质差检测模型以及第二质差检测模型得到训练完成的第一质差检测模型以及第二质差检测模型;
基于所述数据平滑特征得到第三质差检测模型的初始参数,对所述初始参数进行网格搜索确定第三质差检测模型;
使用第一质差检测模型、第二质差检测模型以及第三质差检测模型进行集成预测确定所述5G网络数据的质差检测结果。
另一方面,本发明实施例提供了一种5G网络数据的质差检测方法,应用于权利要求上述差检测模型,该方法包括:
利用网络管理系统获得所述5G网络数据的稳定性能数据、用户体感指标数据以及用户表征数据;
对所述稳定性能数据、用户体感指标数据以及用户表征数据进行预处理得到所述5G网络的质差检测关键特征、同环比特征、统计特征、时间特征以及数据平滑特征;
将质差检测关键特征、同环比特征、统计特征以及时间特征输入第一质差检测模型得到第一预测结果;将质差检测关键特征以及统计特征输入第二质差检测模型得到第二预测结果;将数据平滑特征输入第三质差检测模型确定第三预测结果;
基于第一预测结果、第二预测结果以及第三预测结果进行集成预测确定所述5G网络数据的质差检测结果。
相较于现有技术,本发明实施例提供的一种5G网络数据的质差检测模型训练及质差检测方法,在原有的网络稳定性性能数据基础下,增加网络用户相关指标:用户数、用户流量,和用户体感相关指标:游戏登陆成功率、游戏登陆时长等。引入半监督学习概念,利用不断增加的历史数据,于上游使用无监督模型和业务规则构建异常标签,扩大质差业务场景;于下游使用标签进行有监督机器学习树模型训练,得到网络质差识别模型。通过模型多次迭代调整,提高有监督模型的准确度,用于后续线上实时监控识别。
附图说明
图1是5G网络数据的质差检测模型训练方法的流程图;
图2是5G网络数据的质差检测模型的数据指标示意图;
图3是质差检测模型的数据指标相关性示意图;
图4是带有异常标签的无标签数据对有监督模型进行迭代的示意图;
图5是带有异常标签的无标签数据的标签示意图;
图6是5G网络数据的质差检测方法的流程示意图;
图7是5G网络数据的质差检测方法集成预测的图片示意图。
具体实施方式
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
本发明提供了一种5G网络数据的质差检测模型训练及质差检测方法,首先,通过特征工程构造特征、采用多种有监督模型调优等方式来获得效果最优的模型,从而提高结果判断准确率。然后,只需要利用历史数据加少量人工对异常标签的调整就能对模型进行迭代更新,在后续5G网络性能数据不断生成的过程中模型也能快速迭代。最后通过分类模型和时序预测算法相结合的方式,对用户体感指标数据KQI(Key Quality Indicator,关键质量指标)和KPI指标(Key Performance Indicator,关键绩效指标)是否存在异常做判断,提高结果的可靠性。
图1是5G网络数据的质差检测模型训练方法的流程图,如图所示,该方法具体通过步骤S110-S140实现质差检测模型的训练。
如框S110处所示,首先,通过网络管理系统获取5G通信设备网络的业务数据。
图2是5G网络数据的质差检测模型的数据指标示意图,如图所述,业务数据指标设计为稳定性能数据、用户体感指标数据以及用户表征数据。
稳定性性能数据体现了5G通信设备网络的具体性能,包括,TCP时延、TCP请求成功率、HTTP时延、TCP请求成功率、上下行RTT的指标数据。
用户体感指标数据从真实通信设备网络用户场景出发,细化至用户真实业务,在原用的通信设备网络稳定性评估指标下,增加用户感观侧的KQI指标,区分为视频、游戏、网页、视频VR等业务。
视频业务包括视频播放成功率、视频平均每次播放卡顿次数、视频播放卡顿时长占比、视频播放等待时长、视频下载速率、视频平均码率以及频速率码率的指标数据;
游戏业务包括游戏登陆成功率、游戏登陆时长、接口以上平均时延、接口以下时延、游戏对战时长以及对战时延的指标数据;
网页业务包括页面响应成功率、页面响应平均时长、页面显示成功率、页面显示平均时长以及页面下载速率的指标数据;
VR业务包括M2P上游平均时延、M2P下游平均时延、VR/AR视频播放等待时长、VR/AR视频下载速率以及VR/AR速率码率比的指标数据。
用户表征数据用于防止网络监控指标会出现漏采等问题,包括,用户量、实时流量等指标。通过用户行为表征数据,可以对当前网络进行基础判断是否存在质查,影响用户使用。
如框S120处所示,以保证据的准确性和可靠性,对5G网络的业务数据进行预处理得到所述5G网络的质差检测关键特征、同环比特征、统计特征、时间特征以及数据平滑特征。
首先,对采集到的稳定性能数据、用户体感指标数据以及用户表征数据数据进行清洗,去除无效或异常的数据点。数据清洗对缺失数据、异常值、重复数据等数据采用插值、删除或替换等方式,以保证数据的完整性和一致性。
其次,对清洗后的用户表征数据进行归一化处理,以消除数据之间的量纲差异或非线性关系,以助于提高后续数据分析和建模的效果。
再次,对归一化后的用户表征数据以及清洗后的稳定性能数据和用户体感指标数据进行相关性分析,并进行特征筛选5G网络的质差检测关键特征,图3是质差检测模型的数据指标相关性示意图,如图所示,质差检测关键特征包括,用户数、流量、TCP一二时延、HTTP成功率以及上行RTT的相关特征等。图中色块表示了两个特征的相关性的程度,由浅到深则分别表现了各个特征之间从无相关到正相关的变化。如,特征HTTP请求次数和自己对比时,相关性为“1”呈黑色;当与TCP一二成功率进行对比时则相关性为“0”,呈白色。对上述特征进行相关性分析,并进行特征筛选就得到了5G网络的质差检测关键特征。
然后,本发明公开的实施例结合专业领域经验和一些可行性方案,对历史数据进行了一系列操作和补充,以提取更有代表性和信息丰富的特征,具体为,根据筛选得到的质差检测关键特征,构建特征工程确定所述5G网络的同环比特征、统计特征以及时间特征。
同环比特征包括,通过对不同时间段的所述稳定性能数据、用户体感指标数据的比率以及差值进行计算确定得到的特征数据。考虑到5G网络稳定性能数据以及用户体感指标数据在不同时间段之间可能存在明显的变化趋势,实施例引入同环比特征来捕捉这些变化。其中,网络稳定性能数据通过KQI指标反应;用户体感指标数据通过KPI指标反应。
通过计算不同时间段内的特征值之间的比率或差值,实施例可以反映出5G网络性能的变化程度。在一些可能的实施方式中,计算KPI指标中上行RTT、TCP一二时延、TCP一二成功率等指标在当前时间点与前一时间点之间的比率,可以提供网络质差的动态变化信息。
统计特征用来描述数据的分布和变化情况,包括数据的均值以及标准差的统计量。在一些可能的实施方式中,统计特征包括,TCP请求次数、HTTP请求次数的均值、标准差。
时间特征包括,以反映出5g网络在不同时间段的行为模式。将每条特征数据提取小时、星期几、月份等时间信息作为特征,用以揭示出网络性能在不同时间粒度上的变化规律。
最后,对质差检测关键特征中的用户数、流量特征以及统计特征采用指数平滑法以消除噪声,减少数据波动并确定5G网络的数据平滑特征。
具体实施包括,根据预设时间质差检测关键特征中的用户数、流量特征以及统计特征确定所述特征的平滑系数α。在一些可能的实施方式中,选取近3月历史数据中用户数、流量、HTTP请求次数、TCP请求次数等指标的初始值选取平滑系数α。
根据所述平滑系数确定,每个时刻t,预设时间质差检测关键特征中的用户数、流量特征以及统计特征的平滑值St,直至得到所有时刻的平滑值。平滑值St的数学表达式为,
St=α*Yt+(1-α)*St-1
其中,Yt为原始数据值,St-1上一时刻的平滑值。在一些可能的实施方式中,基于上述每个时刻的平滑值选取对应的ARIMA模型。
如框S130处所示,由于采集到的5G网络质差数据中,真实发生告警的异常数据比率稀少,为了保证质差检查模型的准确率,本发明采用了半监督学习的概念来处理网络质差检测问题。半监督学习是一种利用有标签和无标签数据进行模型训练的方法,可以充分利用有限的有标签数据和大量的无标签数据来提高模型性能。
首先,通过对业务数据进行预处理,已经确定了有限的有标签质差检测关键特征、同环比特征、统计特征、时间特征,利用这些特征对网络质差进行建模。
在一些可能的实施方式中,通过采用随机森林、DNN神经网络分别进行建模建模,训练两个有监督学习模型,来学习网络质差的特征和模式。
随机森林(有监督的第一网络质差识别模型)输入数据采用5G网络的稳定性能数据、用户体感指标数据、质差检测关键特征中的、TCP一二时延、HTTP成功率、上行RTT等指标、KQI指标数据以及特征工程产生的同环比特征、时间特征、统计特征等指标数据。
DNN神经网络(有监督的第二网络质差识别模型)输入数据采用5G网络的稳定性能数据、KQI指标数据以及特征工程产生的统计特征等指标数据。
随机森林包括多个决策树,相对于DNN神经网络,更易于解释和理解。其中,每棵决策树独立地对稳定性能数据、用户体感指标数据、质差检测关键特征、同环比特征、统计特征以及时间特征数据进行分类或回归,最终的预测结果由所有树的结果综合得出。
DNN神经网络包括多个神经网络层组成,每个层都包含多个神经元,基于质差检测关键特征中的、统计特征数据通过多个非线性变换层进行处理和学习,从而对网络质差进行分类。
上述有监督模型可以作为初始模型,用于对网络质差进行分类和识别。通过采用随机森林、DNN神经网络分别进行建模,能够避免单一算法的强耦合性。
在一些可能的实施方式中,基于所述质差检测关键特征、同环比特征、统计特征以及时间特征获得了第一数据集,并将第一数据集按照8:2的划分作为第一训练集和第一测试集;基于所述质差检测关键特征、统计特征获得了第二数据集,并将第二数据集同样按照8:2的划分作为第二训练集第二测试集。
在一些可能的实施方式中,将一训练集输入随机森林模型进行训练得到有监督的第一质差检测模型;将第二训练集输入DNN神经网络模型进行训练得到有监督的第二质差检测模型;
其次,在有监督模型训练的基础上,利用大量的无标签数据,采用无监督模型学习方法,如孤立森林、Mean-shift等算法对稳定性能数据、用户体感指标数据进行训练,寻找异常离群点数据。根据预设规则对所述数据的异常离群点数据进行标记确定带有异常标签的无标签数据。
图4是带有异常标签的无标签数据对有监督模型进行迭代训练的示意图,如图所示,在一些可能的实施方式中,使用无监督的模型对离散的无标签数据进行标签,并利用上述带有异常标签的无标签数据对有监督模型进行迭代训练。图5是带有异常标签的无标签数据的标签示意图,如图所示,预设规则通过观察网络质差的历史数据,以及根据业务规则和领域知识定义一些异常模式和规则,并依据业务规则人工调整部分标记算法找出的异常数据,来确定一部分带有异常标签的无标签数据。
然后,使用带有异常标签的无标签数据和有标签数据来进行质差检测模型的迭代调整。通过将带有异常标签的无标签数据与有标签数据一起作为训练样本,通过自训练的方式不断优化有监督的质差检测模型的性能。
最后,根据多次迭代调整的过程,进一步提高模型的性能和准确度。每次迭代都利用带有异常标签的无标签数据来更新模型,并将新的质差检测模型用于网络质差的分类和识别。随着迭代的进行,模型的性能将逐步提升,对网络质差的检测和识别能力也会得到增强。
如框S140处所示,在步骤S120确定了数据平滑特征,在一些可能的实施方式中,根据这些数据平滑特征指标采用Auto-ARIMA算法,自动选择最佳的ARIMA模型(第三质差检测模型)进行时序预测。其中,数据平滑特征包括用户数、流量、HTTP请求次数、TCP请求次数等指标特征。
首先。确定用户数、流量、HTTP请求次数、TCP请求次数等指标特征序列的范围和对应ARIMA模型初始参数,这些模型参数包括差分阶数和MA阶数等信息。
然后,对初始参数进行网格搜索,网格搜索具体为,在预设的参数范围内,对每一组参数采用均方误差、残差平方和等指标来评估模型的拟合效果,并根据以上拟合效果选取最佳的ARIMA模型(第三质差检测模型)。
综上所述,本发明公开的实施例通过5G网络数据的质差检测模型训练方法训练得到了第一质差检测模型、第二质差检测模型以及第三质差检测模型。
图6是5G网络数据的质差检测方法的流程示意图,如图所示,该方法具体通过步骤S610~S640实现5G网络数据的质差检测。
如框S610所示,利用网络管理系统获得所述5G网络数据的稳定性能数据、用户体感指标数据以及用户表征数据。
如框S610所示,对稳定性能数据、用户体感指标数据以及用户表征数据进行预处理得到所述5G网络的质差检测关键特征、同环比特征、统计特征、时间特征以及数据平滑特征。
如框S630所示,首先,将质差检测关键特征、同环比特征、统计特征以及时间特征输入第一质差检测模型得到第一预测结果。然后,将质差检测关键特征以及统计特征输入第二质差检测模型得到第二预测结果。
在一些可能的实施方式中,方案选取三个月的质差检测关键特征中的用户数、流量特征以及统计特征的历史数据,并进行平滑处理确定5G网络的数据平滑特征。
将所述数据平滑特征输入第三质差检测模型得到预设时间的预测值;在该实施方式中预设时间设置为一周。
设置上下限阈值,根据所述上下限阈值对所述预测值进行判断确定第三预测结果。
如框S640所示,为了进一步提高方案的准确度,本发明实施例将第一预测结果、第二预测结果以及第三预测结果采用集成预测的方式确定5G网络数据的质差检测结果。图7是5G网络数据的质差检测方法集成预测的图片示意图,如图所示,实施例采用加权投票分类的方式进行集成。对于给定的样本,每个有监督学习算法都会对其进行分类预测,再根据各个算法的预测结果进行投票。最终,根据投票结果通过多数表决的方式确定集成预测的质差检测结果。
为了实现运营商通信监控运维的准确性和可靠性,本发明实施例提供了一种种5G网络数据的质差检测模型训练及质差检测方法,该方法不再利用传统的人工审核或者固定规则判断来对工单进行质检,而是采用半监督学习的方法,利用历史数据及行业内积累的业务规则构建异常标签,扩大质差业务场景。同时使用有监督树模型中的随机森林、神经网络等算法对通信设备5g网络质差数据进行异常检测分类、使用时序预测算法Auto-ARIMA,对于时序数据根据数据趋势判断异常指标。通过使用多种算法及模型进行集成学习,将各个模型的预测结果进行投票,综合利用它们的分类决策,提高5G网络质差检测的准确性和鲁棒性。通过对网络质差的实时检测和监控,及时发现并识别网络质差情况,为运营商提供准确、可靠的网络优化方案,提升用户的体验和满意度。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种5G网络数据的质差检测模型训练方法,其特征在于,包括:
利用网络管理系统获得所述5G网络数据的业务数据,所述业务数据包括,用于反映5G网络通信设备性能的稳定性能数据、反映5G网络业务质量的用户体感指标数据,以及用于基础(替换间接)判断所述5G网络质差的用户表征数据;
对业务数据进行预处理得到所述5G网络的质差检测关键特征、同环比特征、统计特征、以及时间特征;基于所述用户表征数据、质差检测关键特征、用户体感指标数据、同环比特征、统计特征以及时间特征确定第一训练集和第一测试集;基于所述稳定性能数据、用户体感指标数据、统计特征确定第二训练集第二测试集;
将第一训练集输入随机森林模型进行训练得到有监督的第一质差检测模型;将第二训练集输入DNN神经网络模型进行训练得到有监督的第二质差检测模型;
将所述稳定性能数据、用户体感指标数据输入无监督模型进行训练得到带有异常标签的无标签数据;利用带有异常标签的无标签数据对有监督的第一质差检测模型以及第二质差检测模型进行迭代训练得到第一质差检测模型以及第二质差检测模型;
将第一测试集以及第二测试集分别输入第一质差检测模型以及第二质差检测模型得到训练完成的第一质差检测模型以及第二质差检测模型;
使用第一质差检测模型、第二质差检测模型进行集成预测确定所述5G网络数据的质差检测结果。
2.根据权利要求1所述的5G网络数据的质差检测模型训练方法,其特征在于:
所述稳定性能数据包括,TCP时延、TCP请求成功率、HTTP时延、TCP请求成功率、上下行RTT的指标数据;
所述用户体感指标数据包括,视频业务的视频播放成功率、视频平均每次播放卡顿次数、视频播放卡顿时长占比、视频播放等待时长、视频下载速率、视频平均码率以及频速率码率的指标数据;游戏业务的游戏登陆成功率、游戏登陆时长、接口以上平均时延、接口以下时延、游戏对战时长以及对战时延的指标数据;网页业务的页面响应成功率、页面响应平均时长、页面显示成功率、页面显示平均时长以及页面下载速率的指标数据;VR业务的M2P上游平均时延、M2P下游平均时延、VR/AR视频播放等待时长、VR/AR视频下载速率以及VR/AR速率码率比的指标数据;
所述用户表征数据包括用户量、流量的指标数据。
3.根据权利要求1所述的5G网络数据的质差检测模型训练方法,其特征在于,所述业务数据的预处理方法,包括:
对所述稳定性能数据、用户体感指标数据以及用户表征数据进行清洗得到清洗后的稳定性能数据、用户体感指标数据以及用户表征数据;
对清洗后的用户表征数据进行处理确定归一化后的用户表征数据;
对归一化后的用户表征数据以及清洗后的稳定性能数据和用户体感指标数据进行相关性分析确定所述5G网络的质差检测关键特征;
根据所述质差检测关键特征构建特征工程确定所述5G网络的同环比特征、统计特征以及时间特征。
4.根据权利要求3所述的5G网络数据的质差检测模型训练方法,其特征在于,所述质差检测关键特征包括,用户数、流量、TCP一二时延、HTTP成功率以及上行RTT的相关特征。
5.根据权利要求3所述的5G网络数据的质差检测模型训练方法,其特征在于:
所述同环比特征包括,通过对不同时间段的所述稳定性能数据、用户体感指标数据的比率以及差值进行计算确定得到的特征数据;
所述统计特征包括,通过对TCP请求次数、HTTP请求次数进行统计确定的特征数据;
所述时间特征包括,对不同时间段行为模式根据时间信息进行提取确定的特征数据。
6.根据权利要求1所述的5G网络数据的质差检测模型训练方法,其特征在于,所述数据平滑的处理方法,包括:
根据预设时间质差检测关键特征中的用户数、流量特征以及统计特征确定所述特征的平滑系数α;
根据所述平滑系数确定,每个时刻t,预设时间质差检测关键特征中的用户数、流量特征以及统计特征的平滑值St,直至得到所有时刻的平滑值。
7.根据权利要求6所述的5G网络数据的质差检测模型训练方法,其特征在于,所述平滑值St的数学表达式为,
St=α*Yt+(1-α)*St-1
其中,Yt为原始数据值,St-1上一时刻的平滑值。
8.根据权利要求1所述的5G网络数据的质差检测模型训练方法,其特征在于,所述带有异常标签的无标签数据的确定方法,包括:
利用孤立森林、Mean-shift算法对清洗后的用户体感指标数据以及用户表征数据进行处理确定所述数据的异常离群点数据;
根据预设规则对所述数据的异常离群点数据进行标记确定带有异常标签的无标签数据。
9.根据权利要求1-8任一项所述的5G网络数据的质差检测模型训练方法,其特征在于,所述质差检测结果的确定方法,还包括:
对质差检测关键特征进行数据平滑处理确定5G网络的数据平滑特征;
基于所述数据平滑特征得到第三质差检测模型的初始参数,对所述初始参数进行网格搜索确定第三质差检测模型;
使用第一质差检测模型、第二质差检测模型以及第三质差检测模型进行集成预测确定所述5G网络数据的质差检测结果。
10.一种5G网络数据的质差检测方法,应用于权利要求1-9任一项所述的质差检测模型,其特征在于,包括:
利用网络管理系统获得所述5G网络数据的稳定性能数据、用户体感指标数据以及用户表征数据;
对所述稳定性能数据、用户体感指标数据以及用户表征数据进行预处理得到所述5G网络的质差检测关键特征、同环比特征、统计特征、以及时间特征;
将用户表征数据、质差检测关键特征、用户体感指标数据、同环比特征、统计特征以及时间特征输入第一质差检测模型得到第一预测结果;将稳定性能数据、用户体感指标数据、统计特征输入第二质差检测模型得到第二预测结果;
选取质差检测关键特征中的用户数、流量特征以及统计特征的历史数据并进行平滑处理确定5G网络的数据平滑特征;将所述数据平滑特征输入第三质差检测模型得到预设时间的预测值;根据上下限阈值对所述预测值进行判断确定第三预测结果;
基于第一预测结果、第二预测结果以及第三预测结果通过多数表决的方式进行集成预测确定所述5G网络数据的质差检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310778935.1A CN116723540A (zh) | 2023-06-28 | 2023-06-28 | 一种5g网络数据的质差检测模型训练及质差检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310778935.1A CN116723540A (zh) | 2023-06-28 | 2023-06-28 | 一种5g网络数据的质差检测模型训练及质差检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116723540A true CN116723540A (zh) | 2023-09-08 |
Family
ID=87869632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310778935.1A Pending CN116723540A (zh) | 2023-06-28 | 2023-06-28 | 一种5g网络数据的质差检测模型训练及质差检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116723540A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117692948A (zh) * | 2023-11-10 | 2024-03-12 | 广州丰石科技有限公司 | 一种质差ip识别方法及装置 |
CN118171196A (zh) * | 2024-05-16 | 2024-06-11 | 电子科技大学 | 一种基于光网络大数据的视频业务客户体验质量预测方法 |
-
2023
- 2023-06-28 CN CN202310778935.1A patent/CN116723540A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117692948A (zh) * | 2023-11-10 | 2024-03-12 | 广州丰石科技有限公司 | 一种质差ip识别方法及装置 |
CN118171196A (zh) * | 2024-05-16 | 2024-06-11 | 电子科技大学 | 一种基于光网络大数据的视频业务客户体验质量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021184630A1 (zh) | 基于知识图谱定位排污对象的方法及相关设备 | |
CN111858231A (zh) | 一种基于运维监控的单指标异常检测方法 | |
CN109544399B (zh) | 基于多源异构数据的输电设备状态评价方法及装置 | |
CN110139067A (zh) | 一种野生动物监测数据管理信息系统 | |
CN112016769B (zh) | 管理相对人风险预测以及信息推荐方法及装置 | |
CN109903053B (zh) | 一种基于传感器数据进行行为识别的反欺诈方法 | |
CN116723540A (zh) | 一种5g网络数据的质差检测模型训练及质差检测方法 | |
CN112468853B (zh) | 电视资源推荐方法、装置、计算机设备及存储介质 | |
CN116629465B (zh) | 智能电网视频监控与风险预测响应系统 | |
CN117421684B (zh) | 基于数据挖掘和神经网络的异常数据监测与分析方法 | |
CN117061322A (zh) | 物联网流量池管理方法及系统 | |
CN111368911A (zh) | 一种图像分类方法、装置和计算机可读存储介质 | |
CN111611519A (zh) | 一种个人异常行为检测方法及装置 | |
CN117875501B (zh) | 一种基于大数据的社交媒体用户行为预测系统及方法 | |
CN115982646B (zh) | 一种基于云平台的多源测试数据的管理方法及系统 | |
TW201911812A (zh) | 影像串流服務的障礙定位系統及維運方法 | |
CN116911500A (zh) | 一种基于大数据监测的草原鼠情智能监管系统及方法 | |
CN111506813A (zh) | 一种基于用户画像的遥感信息精准推荐方法 | |
CN116226769A (zh) | 一种基于用户行为序列的短视频异常行为识别方法 | |
CN111914905B (zh) | 一种基于半监督的反爬虫系统及设计方法 | |
CN113128452A (zh) | 一种基于图像识别的绿化满意度采集方法和系统 | |
CN114492657A (zh) | 植物疾病分类方法、装置、电子设备及存储介质 | |
CN110033295B (zh) | 对游戏中事件的奖励重要性的检测装置及方法 | |
CN110569277A (zh) | 一种配置数据信息自动识别与归类方法及系统 | |
CN112312454A (zh) | 一种lte用户体验kpi与弱覆盖关系判定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |