CN114897010A - 基于重采样改进的梯度提升树的强电离层闪烁检测方法 - Google Patents
基于重采样改进的梯度提升树的强电离层闪烁检测方法 Download PDFInfo
- Publication number
- CN114897010A CN114897010A CN202210464770.6A CN202210464770A CN114897010A CN 114897010 A CN114897010 A CN 114897010A CN 202210464770 A CN202210464770 A CN 202210464770A CN 114897010 A CN114897010 A CN 114897010A
- Authority
- CN
- China
- Prior art keywords
- tree
- samples
- sample
- training
- scintillation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 24
- 238000012952 Resampling Methods 0.000 title claims abstract description 14
- 230000006872 improvement Effects 0.000 title claims description 8
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000005516 engineering process Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims abstract description 12
- 239000005433 ionosphere Substances 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 238000013145 classification model Methods 0.000 claims abstract description 3
- 230000006870 function Effects 0.000 claims description 30
- 238000003066 decision tree Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005358 geomagnetic field Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/01—Satellite radio beacon positioning systems transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/13—Receivers
- G01S19/35—Constructional details or hardware or software details of the signal processing chain
- G01S19/37—Hardware or software details of the signal processing chain
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Medical Informatics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Measurement Of Radiation (AREA)
Abstract
基于重采样改进的梯度提升树的强电离层闪烁检测方法,该方法首先提取出GNSS信号中I、Q支路的相关值并计算与其相关的数学表达式作为电离层闪烁检测模型特征向量,采用人工分类将闪烁事件分为弱、中、强三等级并标记。将预处理后的数据集按一定比例分为训练集和测试集,对训练集采用SMOTE‑ENN技术进行重采样得到样本平衡后的数据集,用于XGBoost算法的建模与优化,测试集用于模型性能评估。训练后的分类模型可实现各种闪烁强度下的电离层闪烁事件分类。该方法相对于传统方法在保证整体检测准确率较高的同时,有效提高了强电离层闪烁的识别准确度。
Description
技术领域
本发明涉及无线通信技术领域,尤其涉及基于重采样改进的梯度提升树的强电离层闪烁检测方法。
背景技术
电离层为距地面约60至1000km高度的大气层,受到太阳辐射、地磁场等电离效应的影响。典型的电离层闪烁现象会使全球导航卫星系统(GNSS)信号等无线电波受到严重的影响。当GNSS信号穿过闪烁的电离层时,将发生振幅和相位波动、载波多普勒抖动等现象,甚至导致导航中断。全球卫星导航系统(GNSS)因其全天候、全球覆盖、时空分辨率高、成本低、长期稳定等特点,广泛应用于各个领域,使得电离层扰动成为GNSS导航定位技术中必须解决的关键问题之一。尽可能地降低电离层对GNSS无线电信号的影响,以提高GNSS导航定位精度是目前极具挑战且有重大意义的工作。
传统的电离层闪烁检测通过设定闪烁指数硬阈值实现简单分类,但闪烁现象体现为持续性的信号衰减和相位抖动,使得实际情况下该检测方法缺乏准确性和灵活性。机器学习算法的引入为电离层闪烁识别技术提供了更好的性能,该类方法可依据电离层闪烁指数波动及不同天数之间比对并结合当前卫星载噪比情况,采用人工标记以排除多径干扰等信息,获得准确度更高、分类更灵活的检测样本,进而实现准确率更高的识别效果。但此类方法一方面关于不同强度闪烁的样本比例单一,缺乏普遍性和适用性,且没有考虑占整体比例较小的强电离层闪烁样本对此类闪烁识别准确率的影响。
近年来,机器学习方法被引入电离层闪烁检测,支持向量机和卷积神经网络等方法都在检测闪烁上取得了不错的成果,给GNSS信号抗电离层干扰技术研发和措施提供高效、灵活的技术支撑,进而给卫星导航系统的正常运行提供了重大保障。但由于强闪烁相较于其他程度闪烁事件出现频率较低,导致了强电离层闪烁事件样本在用于模型训练的数据集中占比很小,而此类不平衡现象会造成模型训练上的偏差进而影响模型预测效果。虽然最终模型的总体精度比较高,但对电离层强闪烁事件存在一定的漏检。
发明内容
针对上述不足,本发明提供基于重采样改进的梯度提升树的强电离层闪烁检测方法,所述方法将含有较少强电离层闪烁的原始训练集利用SMOTE-ENN技术重新采样后使用XGBoost算法进行分类,实现了对于弱、中、强电离层闪烁事件自动检测。对比于传统方法,所述方法可以解决由训练集中强电离层闪烁样本数据小造成的分类不平衡导致强闪烁的漏检问题,且对于弱、中、强电离层闪烁事件自动识别的准确度和效率相对提高。
基于重采样改进的梯度提升树的强电离层闪烁检测方法,具体步骤如下:
步骤(1),从GNSS接收机接收到的信号中提取出I、Q支路的相关值I、Q的均值,计算一段时间内得I2、Q2以及信号强度SI、SI2的均值,再取I、Q、SI的方差σI、σQ、σSI以及I、Q之间的协方差cov(I2,Q2)共计10个参数,组合未检测模型的特征向量,弱、中、强电离层闪烁的类别分别标记为0、1、2,将特征值组成的特征向量和标记值组合为样本矩阵,作为模型训练与测试的数据集;
步骤(2),为解决训练集中强电离层闪烁事件数相对较少的问题,对步骤A中得到的训练样本进行重采样,首先使用SMOTE过采样技术对样本中的少数类数据进行过采样,所述少数类数据包括强电离层闪烁,即根据少数类样本人工合成新样本加入训练集,再使用ENN欠采样技术对训练样本集中的多数类数据进行欠采样,所述多数类数据包括弱、中程度的电离层闪烁,得到各闪烁事件数相对平衡的新训练集;
步骤(3),对经过重采样的训练集进行抽样获得多个子集,采用XGBoost算法训练多个具有相同结构的决策树,每一轮的决策树学习上一轮预测残差并采用二阶泰勒展开近似目标函数,寻找最小化目标函数的回归树并通过设置树的最大深度和样本权重阈值控制树的生长以防止过拟合,将每棵树对应的预测分数相加得样本最终预测结果。
作为本发明进一步改进,步骤(1)具体包括:
(1.1),特征值在分类模型中起着决定性的作用,在跟踪过程结束时,从软件GNSS接收机中提取出I、Q、支路信号以及信号强度SI,将其均值及平方均值一并作为特征元素反映电离层闪烁特性;
(1.2),考虑到电离层闪烁的非高斯噪声特性,基于上述特征元素,设计了另外4种方差和协方差作为反映电离层闪烁的特征值,表达公式如下:
其中σSI,σI,σQ分别为SI,I和Q的方差,cov(I2,Q2)为I2和Q2的协方差,N是每一特征值中使用的样本数,由σSI,cov(I2,Q2),σI,σQ补充了特征值集合,最终特征向量表示为:
X={<I>,<Q>,<I2>,<Q2>,<SI>,<SI2>,σSI,cov(I2,Q2),σI,σQ} (5)
I和Q通道的采样频率设置为f=1000Hz,对于每组特征值,设置滑动窗口长度T=60s,即每组样本有N=T·f=60000个初始观测值,设置样本频率为1Hz,滑动窗口步长为1s;
(1.3)S4为衡量电离层闪烁强度的指标,越大则闪烁强度越高,计算各GNSS信号的S4,把0<S4≤0.2、0.2<S4≤0.6和0.6≤S4的信号人工标记为闪烁事件L={0,1,2},0、1和2分别对应的弱、中、强闪烁事件;
作为本发明进一步改进,步骤(2)具体包括:
(2.1)针对预处理后的训练样本,在相邻的少数类别样本之间进行线性插值,合成新的少数类别样本加入到训练样本中,对于每一个少数类样本xm∈X,m=1,...,M,其中X是少数同类样本的集合,寻找k个最近的同类相邻样本K,然后根据采样率n在K中选择n个样本,将他们标记为ym,i∈Ym,i=1,...,n,m=1,...,M,其中Ym是少数同类样本集合X内每一个xm的k个最近同类样本的集合,最后在xm和ym,1,...,ym,n之间进行随机的线性插值;
新的少数类样本表述如下:
Xnew,m=xm+r*(Ym-xm),m=1,...,M (7)
其中,r为0到1的随机数,Xnew,m是包括由xm建立的n个新样本组成的向量,因此,有M*n个少数类新样本;
(2.2)从(2.1)中获得新的训练样本集后,再利用ENN方法对该样本集中的多数类样本进行欠采样,即对于某一多数类样本,若三个近邻样本中出现两个及以上不同样本,则删除该样本;
(2.3)将步骤(2.2)中经过删除一些多数类样本后的训练集输入XGBoost分类器进行训练。
作为本发明进一步改进,步骤(3)具体包括:
(3.1)初始化第一棵决策树,每一轮的决策树学习上一轮预测残差,从步骤(2.3)中获取训练集,将训练集划分为多个子集,利用各训练子集初始化一些对应的决策树;
(3.2)在生成树的过程中,寻找合适的回归树最小化包含损失函数和正则项的目标函数,由预测值与真实值之间的差异和正则项组成,表述如下:
(3.3)对(3.2)的目标函数在f(x)处使用泰勒展开后,Obj(t)近似为:
(3.4)枚举可能的树结构,计算(3.3)中的目标函数值,选择值最小树结构,由于树结构种类众多,采用贪心算法列举所有不同的树结构,从深度为0的树开始,对树的每个叶子节点尝试增加分裂节点,实现树分裂后的最大增益,对每个特征,通过特征值进行排序,运用线性扫描寻找特征的最优分裂点,增益表达式如下所示:
其中,GL和GR是树分叉后左右两边叶子节点的一阶梯度值,HL和HR是对应的二阶梯度值。式中前三项分别为左子树分数、右子树分数和不分裂分数,γ是加入新叶子节点引入的复杂度代价,Gain的值决定了该决策树的节点是否继续分裂;
(3.5)当训练完成得到k棵树,根据每棵树每个叶子节点对应的分数相加,得到样本预测值,表达式如下:
F={f(x)=ωq(x)}(q:Rm→T,ω∈RT) (13)
其中,f(x)为其中一棵决策树,ωq(x)为叶子节点q的分数;
(3.6)将样本预测值经过sigmoid函数,实现电离层闪烁的自动分类,最终预测类别表达式如下:
有益效果:
强电离层闪烁的出现频次相较于弱/中度闪烁较少,这种不平衡现象会对强电离层闪烁事件检测准确率造成很大影响,本发明设计了一种基于重采样改进的梯度提升树的强电离层闪烁检测方法。该方法首先使用SMOTE-ENN技术对训练集进行了重采样,使0/1/2类数据分布更加均衡,自动检测模型的训练过程中使用了XGBoost的机器学习方法,缓解了模型训练中过度拟合问题,优化了决策树训练的模型,有效地提高了检测精度。本发明有效地解决了电离层闪烁事件的自然和偶然出现引起训练集的不平衡问题,提高了电离层闪烁尤其是强闪烁事件的检测准确率。本发明对卫星信号的干扰检测(如电离层闪烁、太阳射电暴、欺骗),以及具有更高精度、可靠性和更高效率的先进卫星接收机的设计以及大气层和空间天气研究等领域的研究工作具有普遍意义。
附图说明
图1是基于重采样改进的梯度提升树的强电离层闪烁检测流程;
图2是XGBoost算法的原理图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。需要说明的是,下面描述中使用的词语“前”、“后”、“左”、“右”、“上”和“下”指的是附图中的方向,词语“内”和“外”分别指的是朝向或远离特定部件几何中心的方向。
下面结合附图,对本发明提出的基于重采样改进的梯度提升树的强电离层闪烁检测方法,其整体结构如附图1所示,下面进行详细说明:
步骤一、从GNSS接收机接收到的信号中提取出I、Q支路的相关值I、Q的均值,计算一段时间的I2、Q2以及信号强度SI、SI2的均值,再取I、Q、SI的方差σI、σQ、σSI以及I、Q之间的协方差cov(I2,Q2)共计10个参数,组合未检测模型的特征向量,弱中强电离层闪烁的标类别分别标记为0、1、2。将特征值组成的特征向量和标记值组合为样本矩阵,作为模型训练与测试的数据集。
该步骤具体包括:
(1.1)在跟踪过程结束时,从软件GNSS接收机中提取出I、Q、支路信号以及信号强度SI。将其均值及平方均值一并作为特征元素反映电离层闪烁特性。
(1.2)设计了另外4种方差和协方差作为反映电离层闪烁的特征值:σSI,σI,σQ分别为SI,I和Q的方差,cov(I2,Q2)为I2和Q2的协方差。
最终特征向量表示为:
X={<I>,<Q>,<I2>,<Q2>,<SI>,<SI2>,σSI,cov(I2,Q2),σI,σQ} (1)
I和Q通道的采样频率设置为f=1000Hz。对于每组特征值,设置滑动窗口长度为T=60s,即每组样本有N=T·f=60000个初始观测值。设置样本频率为1Hz,滑动窗口步长为1s。
(1.3)S4为衡量电离层闪烁强度的指标,越大则闪烁强度越高,计算各GNSS信号的S4,把0<S4≤0.2、0.2<S4≤0.6和0.6≤S4的信号人工标记为闪烁事件L={0,1,2},分别对应的弱、中、强闪烁事件。
步骤二、为解决训练集中强电离层闪烁事件数相对较少的问题,对步骤A中得到的训练样本进行重采样,首先使用SMOTE过采样技术对样本中的少数类数据进行过采样,所述少数类数据包括强电离层闪烁,即根据少数类样本人工合成新样本加入训练集。再使用ENN欠采样技术对训练样本集中的多数类数据进行欠采样,所述多数类数据包括弱、中程度电离层闪烁,得到各闪烁事件数相对平衡的新训练集。
该步骤具体包括:
(2.1)针对预处理后的训练样本,在相邻的少数类别样本之间进行线性插值。对于每一个少数类样本xm∈X(m=1,...,M),寻找k个最近的同类相邻样本K,根据采样率n在K中选择n个样本,将他们标记为ym,i∈Ym(i=1,...,n,m=1,...,M)。最后在xm和ym,1,...,ym,n之间进行随机的线性插值。新的少数类样本表述如下:Xnew,m=xm+r*(Ym-xm),m=1,...,M,r是0到1的随机数,Xnew,m是包括由xm建立的n个新样本组成的向量。
(2.2)从(2.1)中获得新的训练样本集后,再利用ENN方法对该样本集中的多数类样本进行欠采样,即对于某一多数类样本,若三个近邻样本中出现两个及以上不同样本,则删除该样本。
(2.3)将步骤(2.2)中经过删除一些多数类样本后的训练集输入XGBoost分类器进行训练。
步骤三、对经过重采样的训练集进行抽样获得多个子集,采用如图2所示XGBoost算法训练多个具有相同结构的决策树,每一轮的决策树学习上一轮预测残差并采用二阶泰勒展开近似目标函数,寻找最小化目标函数的回归树并通过设置树的最大深度和样本权重阈值控制树的生长以防止过拟合。将每棵树对应的预测分数相加得样本最终预测结果。
(3.1)初始化第一棵决策树,每一轮的决策树学习上一轮预测残差。从步骤(2.3)中获取训练集,将训练集划分为多个子集,利用各训练子集初始化一些对应的决策树。
(3.2)在生成树的过程中,寻找合适的回归树最小化包含损失函数和正则项的目标函数,由预测值与真实值之间的差异和正则项组成,表述如下:
(3.3)对(3.2)的目标函数在f(x)处使用泰勒展开后,Obj(t)可以近似为:
(3.4)枚举可能的树结构,计算(3.3)中的目标函数值,选择值最小树结构。由于树结构种类众多,采用贪心算法列举所有不同的树结构,从深度为0的树开始,对树的每个叶子节点尝试增加分裂节点,实现树分裂后的最大增益。对每个特征,通过特征值进行排序,运用线性扫描寻找特征的最优分裂点,增益表达式如下所示:
其中,GL和GR是树分叉后左右两边叶子节点的一阶梯度值,HL和HR是对应的二阶梯度值。式中前三项分别为左子树分数、右子树分数和不分裂分数,γ是加入新叶子节点引入的复杂度代价。Gain的值决定了该决策树的节点是否继续分裂。
(3.5)当训练完成得到k棵树,根据每棵树每个叶子节点对应的分数相加,得到样本预测值,表达式如下:
F={f(x)=ωq(x)}(q:Rm→T,ω∈RT) (8)
其中,f(x)为其中一棵决策树,ωq(x)为叶子节点q的分数。
(3.6)将样本预测值经过sigmoid函数,实现电离层闪烁的自动分类,针对本发明的三分类问题,最终预测类别表达式如下:
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.基于重采样改进的梯度提升树的强电离层闪烁检测方法,其特征在于,具体步骤如下:
步骤(1),从GNSS接收机接收到的信号中提取出I、Q支路的相关值I、Q的均值,计算一段时间内得I2、Q2以及信号强度SI、SI2的均值,再取I、Q、SI的方差σI、σQ、σSI以及I、Q之间的协方差cov(I2,Q2)共计10个参数,组合未检测模型的特征向量,弱、中、强电离层闪烁的类别分别标记为0、1、2,将特征值组成的特征向量和标记值组合为样本矩阵,作为模型训练与测试的数据集;
步骤(2),为解决训练集中强电离层闪烁事件数相对较少的问题,对步骤A中得到的训练样本进行重采样,首先使用SMOTE过采样技术对样本中的少数类数据进行过采样,所述少数类数据包括强电离层闪烁,即根据少数类样本人工合成新样本加入训练集,再使用ENN欠采样技术对训练样本集中的多数类数据进行欠采样,所述多数类数据包括弱、中程度的电离层闪烁,得到各闪烁事件数相对平衡的新训练集;
步骤(3),对经过重采样的训练集进行抽样获得多个子集,采用XGBoost算法训练多个具有相同结构的决策树,每一轮的决策树学习上一轮预测残差并采用二阶泰勒展开近似目标函数,寻找最小化目标函数的回归树并通过设置树的最大深度和样本权重阈值控制树的生长以防止过拟合,将每棵树对应的预测分数相加得样本最终预测结果。
2.根据权利要求1中所述的基于重采样改进的梯度提升树的强电离层闪烁检测方法,其特征在于:步骤(1)具体包括:
(1.1),特征值在分类模型中起着决定性的作用,在跟踪过程结束时,从软件GNSS接收机中提取出I、Q、支路信号以及信号强度SI,将其均值及平方均值一并作为特征元素反映电离层闪烁特性;
(1.2),考虑到电离层闪烁的非高斯噪声特性,基于上述特征元素,设计了另外4种方差和协方差作为反映电离层闪烁的特征值,表达公式如下:
其中σSI,σI,σQ分别为SI,I和Q的方差,cov(I2,Q2)为I2和Q2的协方差,N是每一特征值中使用的样本数,由σSI,cov(I2,Q2),σI,σQ补充了特征值集合,最终特征向量表示为:
X={<I>,<Q>,<I2>,<Q2>,<SI>,<SI2>,σSI,cov(I2,Q2),σI,σQ} (5)
I和Q通道的采样频率设置为f=1000Hz,对于每组特征值,设置滑动窗口长度T=60s,即每组样本有N=T·f=60000个初始观测值,设置样本频率为1Hz,滑动窗口步长为1s;
(1.3)S4为衡量电离层闪烁强度的指标,越大则闪烁强度越高,计算各GNSS信号的S4,把0<S4≤0.2、0.2<S4≤0.6和0.6≤S4的信号人工标记为闪烁事件L={0,1,2},0、1和2分别对应的弱、中、强闪烁事件;
3.根据权利要求1中所述的所述的基于重采样改进的梯度提升树的强电离层闪烁检测方法,其特征在于:步骤(2)具体包括:
(2.1)针对预处理后的训练样本,在相邻的少数类别样本之间进行线性插值,合成新的少数类别样本加入到训练样本中,对于每一个少数类样本xm∈X,m=1,...,M,其中X是少数同类样本的集合,寻找k个最近的同类相邻样本K,然后根据采样率n在K中选择n个样本,将他们标记为ym,i∈Ym,i=1,...,n,m=1,...,M,其中Ym是少数同类样本集合X内每一个xm的k个最近同类样本的集合,最后在xm和ym,1,...,ym,n之间进行随机的线性插值;
新的少数类样本表述如下:
Xnew,m=xm+r*(Ym-xm),m=1,...,M (7)
其中,r为0到1的随机数,Xnew,m是包括由xm建立的n个新样本组成的向量,因此,有M*n个少数类新样本;
(2.2)从(2.1)中获得新的训练样本集后,再利用ENN方法对该样本集中的多数类样本进行欠采样,即对于某一多数类样本,若三个近邻样本中出现两个及以上不同样本,则删除该样本;
(2.3)将步骤(2.2)中经过删除一些多数类样本后的训练集输入XGBoost分类器进行训练。
4.根据权利要求1中所述的基于重采样改进的梯度提升树的强电离层闪烁检测方法,其特征在于:步骤(3)具体包括:
(3.1)初始化第一棵决策树,每一轮的决策树学习上一轮预测残差,从步骤(2.3)中获取训练集,将训练集划分为多个子集,利用各训练子集初始化一些对应的决策树;
(3.2)在生成树的过程中,寻找合适的回归树最小化包含损失函数和正则项的目标函数,由预测值与真实值之间的差异和正则项组成,表述如下:
(3.3)对(3.2)的目标函数在f(x)处使用泰勒展开后,Obj(t)近似为:
(3.4)枚举可能的树结构,计算(3.3)中的目标函数值,选择值最小树结构,由于树结构种类众多,采用贪心算法列举所有不同的树结构,从深度为0的树开始,对树的每个叶子节点尝试增加分裂节点,实现树分裂后的最大增益,对每个特征,通过特征值进行排序,运用线性扫描寻找特征的最优分裂点,增益表达式如下所示:
其中,GL和GR是树分叉后左右两边叶子节点的一阶梯度值,HL和HR是对应的二阶梯度值。式中前三项分别为左子树分数、右子树分数和不分裂分数,γ是加入新叶子节点引入的复杂度代价,Gain的值决定了该决策树的节点是否继续分裂;
(3.5)当训练完成得到k棵树,根据每棵树每个叶子节点对应的分数相加,得到样本预测值,表达式如下:
F={f(x)=ωq(x)}(q:Rm→T,ω∈RT) (13)
其中,f(x)为其中一棵决策树,ωq(x)为叶子节点q的分数;
(3.6)将样本预测值经过sigmoid函数,实现电离层闪烁的自动分类,最终预测类别表达式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210464770.6A CN114897010A (zh) | 2022-04-29 | 2022-04-29 | 基于重采样改进的梯度提升树的强电离层闪烁检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210464770.6A CN114897010A (zh) | 2022-04-29 | 2022-04-29 | 基于重采样改进的梯度提升树的强电离层闪烁检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114897010A true CN114897010A (zh) | 2022-08-12 |
Family
ID=82719345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210464770.6A Pending CN114897010A (zh) | 2022-04-29 | 2022-04-29 | 基于重采样改进的梯度提升树的强电离层闪烁检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114897010A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115062678A (zh) * | 2022-08-19 | 2022-09-16 | 山东能源数智云科技有限公司 | 设备故障检测模型的训练方法、故障检测方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508730A (zh) * | 2018-09-27 | 2019-03-22 | 东南大学 | 一种基于非线性svm算法的电离层相位闪烁检测方法 |
US20190302274A1 (en) * | 2018-03-28 | 2019-10-03 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for GNSS Ambiguity Resolution |
CN114089443A (zh) * | 2021-10-17 | 2022-02-25 | 中国电波传播研究所(中国电子科技集团公司第二十二研究所) | 一种基于tec积分量及季节变化系数的uhf频段电离层闪烁事件预报方法 |
-
2022
- 2022-04-29 CN CN202210464770.6A patent/CN114897010A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190302274A1 (en) * | 2018-03-28 | 2019-10-03 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for GNSS Ambiguity Resolution |
CN109508730A (zh) * | 2018-09-27 | 2019-03-22 | 东南大学 | 一种基于非线性svm算法的电离层相位闪烁检测方法 |
CN114089443A (zh) * | 2021-10-17 | 2022-02-25 | 中国电波传播研究所(中国电子科技集团公司第二十二研究所) | 一种基于tec积分量及季节变化系数的uhf频段电离层闪烁事件预报方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115062678A (zh) * | 2022-08-19 | 2022-09-16 | 山东能源数智云科技有限公司 | 设备故障检测模型的训练方法、故障检测方法及装置 |
CN115062678B (zh) * | 2022-08-19 | 2022-11-04 | 山东能源数智云科技有限公司 | 设备故障检测模型的训练方法、故障检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106126807B (zh) | 一种基于大数据挖掘的无线信道建模方法 | |
CN106226212B (zh) | 基于深度残差网络的高光谱霾监测方法 | |
CN107241700B (zh) | 基于csi空频特性和参考点位置聚类算法的室内定位方法 | |
CN108696932A (zh) | 一种利用csi多径及机器学习的室外指纹定位方法 | |
CN111982129B (zh) | 一种基于月面数字高程地图的综合全局路径规划方法 | |
CN106093849B (zh) | 一种基于测距和神经网络算法的水下定位方法 | |
CN112990342B (zh) | 一种半监督sar目标识别方法 | |
CN110555841B (zh) | 基于自注意图像融合和dec的sar图像变化检测方法 | |
CN108229550A (zh) | 一种基于多粒度级联森林网络的云图分类方法 | |
Joelsson et al. | Random forest classifiers for hyperspectral data | |
CN105405118A (zh) | 基于量子衍生混合蛙跳的水下声纳图像目标检测方法 | |
CN108924756A (zh) | 基于WiFi双频带的室内定位方法 | |
CN107230197A (zh) | 基于卫星云图和rvm的热带气旋客观定强方法 | |
CN114897010A (zh) | 基于重采样改进的梯度提升树的强电离层闪烁检测方法 | |
He et al. | Random forests based path loss prediction in mobile communication systems | |
CN114900224B (zh) | 一种飞行器越区切换目标测控卫星的方法及相关设备 | |
CN112751633B (zh) | 一种基于多尺度窗口滑动的宽带频谱检测方法 | |
Zhang et al. | Phase arrival picking for bridging multi-source downhole microseismic data using deep transfer learning | |
CN116863327B (zh) | 一种基于双域分类器协同对抗的跨域小样本分类方法 | |
CN113271539A (zh) | 一种基于改进的cnn模型的室内目标定位方法 | |
Ma et al. | PPDTSA: Privacy-preserving deep transformation self-attention framework for object detection | |
CN115327544B (zh) | 基于自监督学习的少样本空间目标isar散焦补偿方法 | |
CN116343825A (zh) | 一种基于样本映射的少样本水声目标识别方法 | |
Denisenko et al. | Automated geosteering while drilling using machine learning. Case studies | |
CN113343924B (zh) | 一种基于循环谱特征和生成对抗网络的调制信号识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |