CN114611415B - 一种基于SL-TrellisNets网络的超视距传播损耗预测方法 - Google Patents
一种基于SL-TrellisNets网络的超视距传播损耗预测方法 Download PDFInfo
- Publication number
- CN114611415B CN114611415B CN202210505983.9A CN202210505983A CN114611415B CN 114611415 B CN114611415 B CN 114611415B CN 202210505983 A CN202210505983 A CN 202210505983A CN 114611415 B CN114611415 B CN 114611415B
- Authority
- CN
- China
- Prior art keywords
- network
- time
- propagation loss
- over
- horizon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000007613 environmental effect Effects 0.000 claims abstract description 28
- 238000011176 pooling Methods 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 230000003321 amplification Effects 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 230000004580 weight loss Effects 0.000 claims description 3
- 230000007774 longterm Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000004880 explosion Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000001704 evaporation Methods 0.000 description 2
- 230000008020 evaporation Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000003746 surface roughness Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/06—Power analysis or power optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/10—Noise analysis or noise optimisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Educational Administration (AREA)
- Geometry (AREA)
- Primary Health Care (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Error Detection And Correction (AREA)
Abstract
本发明涉及一种基于SL‑TrellisNets网络的超视距传播损耗预测方法,属于海洋大气遥感领域,所述方法提出了短时和长时并行网络时间卷积(SL‑TrellisNets)网络,来提高超视距传播损耗预测的精度。此外,为了过滤掉原始数据的时间噪声,运用一维卷积自动编码器提取数据特征来滤除超视距时间序列中的噪声,并且通过短时和长时并行网络时间卷积网络模型的精准预测,实现海洋温度、风速、相对湿度、大气温度和气海温差这些环境知识对超视距传播损耗信号预测精度的贡献进行解释和分析。
Description
技术领域
本发明属于海洋大气遥感领域,尤其涉及一种基于SL-TrellisNets网络的超视距传播损耗预测方法。
背景技术
海上蒸发波导超视距通信由于解决了在远距离、信号弱的情况下海上通信难的瓶颈而受到了广泛的关注。然而,受到近海海面复杂环境影响,传统气象数值模拟超视距传播损耗预报出现较大的误差,并且缺乏对超视距预报产生影响的环境知识解释分析。
国内外学者基于第五代中尺度模式(MM5)和天气研究与预报模式(WRF),模拟电磁传播的耦合物理方程,生成超视距传播损耗预测。受全球背景物理场的数据限制,蒸发波导环境的超视距预报的时间分辨率和水平分辨率较低。此外,在中国沿海陆海交界处,由于湍流和复杂的海气传热过程,以及表征海面粗糙度及其影响较为复杂,海洋环境在较短的时间和空间尺度上存在差异。使得这样的分辨率不能准确反映超视距传播损耗时间序列的非线性关系。更值得关注的是,预测未来的数据至少要考虑过去几小时的超视距传播损耗,过量的超视距观测样本使得传统的GRU和LSTM固有的递归神经网络结构体系在训练过程中出现梯度消失和爆炸,严重影响了实际预测结果的有效性。
发明内容
为解决以上问题,本发明提供了一种基于SL-TrellisNets网络的超视距传播损耗预测方法。所述方法提出了长期和短期并行双流时间卷积(SL-TrellisNets)网络,来提高超视距传播损耗预测的精度。此外,为了过滤掉原始数据的时间噪声,运用一维卷积自动编码器提取数据特征来滤除超视距时间序列中的噪声,并且通过长期和短期并行双流时间卷积网络模型的精准预测,实现海洋温度、风速、相对湿度、大气温度和气海温差这些环境知识对超视距传播损耗信号预测精度的贡献进行解释和分析。
本发明是通过如下技术方案来实现的:
一种基于SL-TrellisNets网络的超视距传播损耗预测方法,所述方法包括以下几个步骤:
(1)一维卷积自动编码器特征提取建模提出的一维卷积自动编码器特征提取网络包括两个阶段:编码器和解码器网络;在编码器阶段,应用3个卷积层和3个池化层来将超视距传播损耗数据编码为低自由度降噪矩阵;在解码阶段中,3个解码卷积层和3个上采样层解码超视距传播损耗数据,基于Adam优化器和反向误差传播算法获得良好的训练结果,从而显著提高一维卷积自动编码器的模型性能;
(2)超视距传播损耗时间特征建模为了对超视距传播损耗的时间序列进行时间序列关联关系分析,运用皮尔逊相关系数和皮尔逊偏自相关系数来定量分析超视距传播损耗时间序列;对超视距传播损耗长时间观测的线性相关性通过皮尔逊自相关系数来判断;对临近短时分钟的时间序列预测引用皮尔逊偏自相关系数来剔除中间时间间隔的干扰,判断短时超视距数据之间的关联性;
(3)基本的时间卷积TrellisNet网络模块建模TrellisNet网络由一个跨时间和跨网络层组成的像网格一样的网络组成,一个基本的TrellisNet的特征向量由上一层的隐藏输出和输入序列向量组成;首先将上一层的隐藏输出和输入序列向量进行前馈线性变换输出预激活向量,随后再通过激活函数对预激活的向量以及上一层的隐藏层输出进行非线性变换来输出特征向量在所有网络层和时间序列中都应用了以上的转换过程,实现了跨时间层和跨网络层的时间卷积TrellisNet网络模块的建模;
(4)SL-TrellisNet预测网络模块搭建SL-TrellisNets预测模型包括四个部分:输入数据、模型参数设置、短时和长时并行双流TrellsNets网络搭建及网络输出;输入数据来自经过一维卷积自动编码器进行特征提取的超视距传播损耗及环境参数,模型的超参包括Adam优化器、权重损失、空洞卷积和权值归一化;根据步骤(2)将皮尔逊相关系数进行超视距传播损耗时间序列长短时间序列区间划分,搭建短时和长时并行双流TrellisNets获得时间序列的非线性关系;基于对网络模型参数的训练,将传播损耗最精确的预测结果进行输出并对模型保存;
(5)环境知识驱动超视距传播损耗预测解释采用定制化的SL-TrellisNet模型来实现环境知识驱动的超视距传播损耗预测;将超视距传播损耗预测序列中分别抽取出一种环境因素,得出剩下的四种环境因素对超视距传播损耗预测的均方根误差,进而判断五种不同环境因素对超视距传播损耗预测准确率的贡献力。
进一步,在步骤(1)中的编码器阶段,滑动卷积核对输入序列实现卷积操作,池化层通过池化窗口输出池化后的最大值;上采样层通过零填充来实现对池化层的逆过程,反卷积核滑过特征以执行反卷积运算,反卷积层实现了数据解码;
对于卷积层,第i个一维卷积核,其输出是第i个特征通道:
Ci=ReLU(∑,X·ωi+bi)
ReLU作为激活函数,X代表输入,ωi为第i个卷积核,bi代表偏置;通过一维池化层降低了输入数据的维度;对于长度为L的第i个通道的特征,池化后的输出定义为:
池化窗口W大小为2,步幅S大小为2,Ti代表输入,L代表输入序列的长度,n代表跨度区间,经过池化后每个通道特征的长度变为原始数据长度的四分之一。
进一步,在步骤(1)中的解码阶段:
解码器网络由三个反卷积层和三个上采样层组成,与编码器网络的操作相反;由公式Ci=ReLU(∑X·ωi+bi)推导出反卷积层第i个通道的输出如下:
上采样层的输出是对上一层输入数据的放大,恢复池化后的数据维度;对于输入的第i个特征,其输出为:
其中long是特征的长度,jk是池化过程中记录的最大值的位置;Xi代表第i个输入的特征。
该网络通过最小化重构误差来训练,误差函数表示为:
其中,l代表重构误差函数,x为初始网络状态观测矩阵输入数据,g(h(x))为重构数据,n和m代表了输入的时间序列的长度和维度。
进一步,所述步骤(4)中,短时和长时并行双流TrellisNets:并行S-TrellisNets网络和L-TrellisNets网络获得时间序列的非线性关系;并行化的网络进行输出表示如下:
其中f和e分别代表了L-TrellisNet网络和S-TrellisNet网络的网络层的数量。Γ(e)(.)代表TrellisNet网络在e层的整体操作,Γ(f)(.)代表TrellisNet网络在f层的整体操作;代表了SL-TrellisNet网络的实际输出;||代表两个网络输出的拼接操作。
本发明与现有技术相比的有益效果:
气象梯度塔和光谱仪需要不断的采集环境参数数据和电磁信号。这些原始数据在传输、转换、存储和测量设备内受到时间噪声的影响。为滤除时间噪声,提出一维卷积自编码器提取接收信号和测量环境数据的噪声,基于1DCAE的去噪模型,MAE和RMSE分别降低18.34%和25.62%。本专利在对环境和超视距传播损耗数据进行过滤的基础上,提出了一种新颖的环境知识驱动深度学习框架SL-TrellisNets,实现超视距传播损失预测。具体来说,从时间序列预测的角度,提出将TrellisNet网络框架来解决输入长区间的观测序列导致的梯度爆炸问题。提出了两个并行的TrellisNets网络,以获取非均匀变化的超视距传播损失的长时和短时时间相关性。实验结果表明,与1DCAE-TrellisNet相比,考虑短时和长时特征的模型的MAE和RMSE分别降低了1.0623dBm和1.6984dBm。此外,针对缺乏对影响超视距传播损耗预测精度的环境知识问题,本发明首次结合深度学习框架对超视距传播损失预测精度的影响进行了解释,得出的结论是大气温度对超视距传播损耗精度的贡献位居第一,达到78%,其次是海面温度的57%,海气温度的48%,相对湿度的42%,最后是36%风速,以上环境因素在海气耦合过程中起关键作用,对超视距传播的形成贡献较大。
附图说明
图1为一维卷积自动编码器进行特征提取降噪的工作流程图;
图2为皮尔逊相关系数定量判断超视距传播损耗时间序列样本图;
图3为皮尔逊相关系数定量判断超视距传播损耗长时和短时序列相关性分析图,a为偏自相关分析图,b为自相关分析图;
图4为基本的时间卷积TrellisNet网络示意图;
图5为超视距传播损耗预测模型流程图;
图6不同环境数据对超视距传播损耗预报准确率的影响的分析图;
图7为天线高度为2米时1DCAE-TrellisNet模型与1DCAE-SL-TrellisNets模型MAE值的对比图;
图8为天线高度为6米时1DCAE-TrellisNet模型与1DCAE-SL-TrellisNets模型MAE值的对比图;
图9为天线高度为25米时1DCAE-TrellisNet模型与1DCAE-SL-TrellisNets模型MAE值的对比图;
图10为天线高度为2米时1DCAE-TrellisNet模型与1DCAE-SL-TrellisNets模型RMSE值的对比图;
图11为天线高度为6米时1DCAE-TrellisNet模型与1DCAE-SL-TrellisNets模型RMSE值的对比图;
图12为天线高度为25米时1DCAE-TrellisNet模型与1DCAE-SL-TrellisNets模型RMSE值的对比图。
具体实施方式
下面结合附图详细介绍本发明,具体实施步骤如下:
(1)一维卷积自动编码器特征提取建模。提出的一维卷积自动编码器网络特征提取网络(1DCAE)结构如图1所示。1DCAE网络包括两个阶段:编码器和解码器网络。在编码器阶段,应用卷积层(Conv1、Conv2、Conv3)和池化层(即Pooling1、Pooling2、Pooling3)将超视距传播损耗数据编码为低自由度降噪矩阵。在解码阶段中,解码卷积层(DeConv1、DeConv2、DeConv3)和上采样层(Upsample1、Upsample2、Upsample3)用于重构超视距传播损耗数据。基于Adam优化器和反向误差传播算法来提高训练结果的准确性,从而提高1DCAE模型降噪的性能。
编码器网络:
编码器网络由三个一维卷积层和三个一维池化层组成。滑动卷积核对输入序列实现卷积操作,池化层通过池化窗口输出池化后的最大值。上采样层通过零填充来实现对池化层的逆过程,反卷积核滑过特征以执行反卷积运算,反卷积层实现了数据解码。
对于卷积层,第i个一维卷积核,其输出是第i个特征通道:
Ci=ReLU(∑X·ωi+bi)
ReLU作为激活函数,ωi为第i个卷积核,bi代表偏置。通过一维池化层降低了输入数据的维度。对于长度为L的第i个通道的特征,池化后的输出定义为:
其中池化窗口大小为2,步幅大小为2,经过池化后每个通道特征的长度变为原始数据长度的四分之一。
解码器网络:
解码器网络由三个反卷积层和三个上采样层组成,与编码器网络的操作相反。由公式Ci=ReLU(∑X·ωi+bi)可以推导出反卷积层第i个通道的输出如下:
上采样层的输出是对上一层输入数据的放大,恢复池化后的数据维度。对于输入的第i个特征,其输出为:
其中long是特征的长度,jk是池化过程中记录的最大值的位置。
该网络可以通过最小化重构误差来训练,误差函数可表示为:
其中,x为初始网络状态观测矩阵输入数据,g(h(x))为重构数据,n和m代表了输入的时间序列的长度和维度。
(2)超视距传播损耗时间特征建模。为了对时间序列进行初步关联关系分析,运用皮尔逊相关系数和皮尔逊偏自相关系数来定量分析时间序列。对定距的超视距传播损耗长时间观测的线性相关性通过皮尔逊自相关系数来衡量。对临近短时分钟的时间序列预测引用皮尔逊偏自相关系数来剔除中间时间间隔的干扰,判断短时超视距数据之间的关联性。若皮尔逊偏自相关系数=0,说明x与y之间的传播损耗无线性相关关系,当皮尔逊偏自相关系数>0表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;皮尔逊偏自相关系数<0表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。皮尔逊偏自相关系数的绝对值越大,则两变量相关性越强。因此,通过皮尔逊偏自相关系数的判断构建超视距短时区间的判断。与此同时,为了对超视距传播损耗的长时间序列进行时间序列关联关系分析,采用皮尔逊自相关系数对历史数据对现在传播损耗产生的影响进行分析,在对超视距传播损耗时间序列分析中,对于时间序列{Xt,x∈T},任取t,s∈T,定义γ(t,s)为序列{Xt}的自协方差函数:γ(t,s)=E(Xt-μt)(Xs-μs),定义ρ(t,s)为时间序列{Xt}的自相关系数,简记为ACF:ρ(t,s)=γ(t,s)/sqrt(DXt×DXs),其中,E表示数学期望,D表示方差。当皮尔逊自相关系数r的绝对值在0.8以上,认为A和B之间的区间具有有强的相关性。当r的绝对值在0.3到0.8之间,可以认为有弱的相关性。0.3以下,认为没有相关性。
如图2、图3所示,对于偏自相关系数大于0的时间区间(8min短时区间)输入到Short-TrellisNet网络,对于长区间时间序列的关联性采用自相关系数等于0.5(60min的长时间序列)观测数据输入到Long-TrellisNet网络,拼接双流网络实现单流输出,在超视距传播损耗时间序列预测中,获得了非均匀变化的超视距传播损耗短期和长期特征。
因此,对给定输入的超视距传播损耗时间序列X1:A,TrellisNet在每n层的计算可以总结为:
其中*表示应用零填充卷积将前一层的输出仅与过去间隔的数据进行卷积的一维因果卷积操作,而W表示在所有层共享的核权重矩阵参数。我们在1维卷积操作过程中增加了一个扩张因子来增加我们的TrellisNet网络的接受域。
通过e层的卷积运算,我们定义第e层的最终输出作为Trellisnet网络的输出。定义为:
(4)SL-TrellisNet预测网络模块搭建。为了捕获超视距传播损耗输出的非线性时间序列关系,本实施例提出了SL-TrellisNets网络。如图5所示,本专利提出的预测模型结构主要划分为四个部分:输入数据、模型参数设置、短时和长时并行双流TrellsNets网络及网络输出。
输入数据:输入数据来自于经过一维卷积自动编码器进行特征提取的2013年9月14日到10月14日在中国渤海实测的超视距传播损耗、海面温度、风速、大气温度、相对湿度、气海温差环境参数。
模型参数设置:在整个网络的评估过程中模型的参数设置扮演着重要的角色。在SL-TrellisNets网络模型中主要的参数如下:
优化器:Adam优化器继承了Adagrad自适应学习率梯度下降算法和动量梯度下降算法的优点,容易执行并且具有较高的运算效率,因此很适用于解决超视距传播损耗参数的相关性问题。
权重损失:通过调节隐藏层到隐藏层之间的权重W能够优化序列模型并且提高模型训练的有效性,将这样的方法应用于TrellisNet网络。
空洞卷积:空洞卷积网络能够帮助模型增加感受野并且提高模型的收敛速度,并且空洞卷积也可以用于TrellisNet网络提高模型训练效率。
权重归一化:权重归一化能够直接发现权重矩阵的尺寸和大小。在TrellisNet卷积核中引用权重归一化能够识别有效的正则化过滤器来提高模型收敛的速度。
短时和长时并行双流TrellisNets:划分短时时间区间为8分钟,长时区间为60分钟,并行S-TrellisNets(8分钟)网络和L-TrellisNets(60分钟)网络去获得时间序列的非线性关系。并行化的网络进行输出表示如下:
网络输出:通过对模型参数的训练能够得到超视距传播损耗准确的预测结果。如图5所示,如对测试数据集模型取得了最好的预测结果,我们将传播损耗的预测结果进行输出并对训练的模型进行保存。如果结果相反,返回模型参数层来调整网络参数来优化网络预测结果。
(5)环境知识驱动超视距传播损耗预测解释。我们将超视距传播损耗预测序列中分别抽取出一种环境因素,得出剩下的四种环境因素对超视距传播损耗预测的均方根误差,并代入到以下公式中:
其中,ERROR%表示不同环境因素对预测值均方根误差的影响百分比,Ri表示四种不同环境因素对预测值的均方根误差的影响。Rall均表示受五种环境因素影响的预测的均方根误差。
如图6所示,对比了在2013年9月到10月之间的中国渤海不同环境数据对超视距传播损耗预报一个小时准确率的影响,五种环境因素对超视距传播损耗的准确率的影响都有所差异,这也充分的说明了环境变化的复杂性。其中贡献力排在第一位的是大气温度对超视距传播损耗准确率的影响到达了78%,其次分别为57%的海面温度、48%的海气温差及42%的相对湿度和36%的风速。不同的环境知识因素对预测精度的贡献力也表明了提高重要环境因素的分辨率对超视距传播损耗预测的必要性。
实施例2
1、变体模型长时预测模型评估
对于超视距传播损耗的8分钟短时预报,r-LSTM,Transformer,TrellisNet三种变体模型预报的准确率比较理想,但是在实际的海洋环境中,研究团体更关心长时间预报的准确率。如表1所示,对比了以上模型在过去1小时、2小时及3小时三种不同长时间区间三种数据集上模型的表现能力。首先,我们明显观察到,相比于其他两种模型TrellisNet模型预测性能较好。其次,我们可以得出结论,所有模型在MAE和RMSE评价指标上的性能随着观测时间区间长度的增强而误差变大。这是因为超视距传播损耗的长时间的不确定性的因素积累。除此之外,整体预测的MAE和RMSE的结果并不是很理想,这反映了原始数据中仍然存在大量时间噪声和超视距传播损耗的时间序列中存在大量的不规则变化的时间区间,也证明了有必要提出一个有效的模型来预测超视距传播损耗。
表1.长时预报的变体模型对比
2、不同模型的有效性验证
为了进一步验证本发明所提出的深度学习变体结构的有效性,在天线高度为2米的数据集上以8分钟为短时间间隔预测来验证几个变体模型的有效性。本实施例对比了几种基本模型的变体,模型收敛速度都有所提升。TrellisNet的收敛速度比其他变体模型更快,在第10个迭代次数左右实现收敛,随后是Transformer在第30次左右收敛,r-LSTM在第40次左右收敛,Dilated GRU在第70次收敛,最后是IndRNN,在第100次左右收敛。可以很容易地观察到,TrellisNet网络实现了更快的训练和收敛速度。此外,如表2所示,进一步实现在天线高度为2米的数据集上的预测的性能。IndRNN作为RNN的变体,其本质还是递归神经网络的变体,虽然预测的准确率有所升高,但仍无法实现并行化的运算,即便是增加空洞卷积的GRU模型,在超视距观察序列增长的情况下,出现了梯度消失,无法保证模型预测的准确率。r-LSTM网络作为LSTM网络的变体,结合了辅助损失机制,相比于其他两种模型,预测的准确率要更高。Transformer引入自注意力机制,相比于r-LSTM,超视距传播损耗预测的MAE和RMSE误差分别降低了32.50%和29.72%。采用的具有权值共享和输入注入的TrellisNet网络,并通过并行化的时序卷积网络避免超视距传播损耗预测出现梯度爆炸,试验结果表明,相比于Transformer模型,超视距传播损耗预测的MAE和RMSE误差进一步降低了65.66%和66.94%。
表2.短时预报的变体模型对比
超视距传播损耗时间序列存在不规律变化的特征,为了解决非均匀变化,提出了SL-TrellisNets网络去解决超视距传播损耗时间序列非线性关系。为了验证这种模型结构的必要性。将1DCAE-SL-TellisNets模型与已经在长时间预测序列预测过程中取得良好效果但是没有考虑超视距时间序列的关联关系的1DCAE-TellisNet模型进行对比。图7-图12展示了在三种天线高度的数据集下对不同时间区间的超视距传播损耗的预测,考虑了长短时间特征的1DCAE-SL-TellisNets网络预测的准确率远远超过了1DCAE-TellisNet模型。这样的结果充分说明了长短时并行网络对解决超视距传播损耗不均匀变化预测的必要性,并且验证了SL-TellisNets模型的有效性。
Claims (4)
1.一种基于SL-TrellisNets网络的超视距传播损耗预测方法,其特征在于所述方法包括以下几个步骤:
(1)一维卷积自动编码器特征提取建模提出的一维卷积自动编码器特征提取网络包括两个阶段:编码器和解码器网络;在编码器阶段,应用3个卷积层和3个池化层来将超视距传播损耗数据编码为低自由度降噪矩阵;在解码阶段中,3个解码卷积层和3个上采样层解码超视距传播损耗数据;
(2)超视距传播损耗时间特征建模运用皮尔逊相关系数和皮尔逊偏自相关系数来定量分析超视距传播损耗时间序列关联关系分析;对超视距传播损耗长时间观测的线性相关性通过皮尔逊自相关系数来判断;对临近短时分钟的时间序列预测引用皮尔逊偏自相关系数来剔除中间时间间隔的干扰,判断短时超视距数据之间的关联性;
(3)基本的时间卷积TrellisNet网络模块建模TrellisNet网络由一个跨时间和跨网络层组成的像网格一样的网络组成,一个基本的TrellisNet的特征向量由上一层的隐藏输出和输入序列向量组成,其中i为时间步长,n+1为网络层;首先将上一层的隐藏输出和输入序列向量进行前馈线性变换输出预激活向量,随后再通过激活函数对预激活的向量以及上一层的隐藏层输出进行非线性变换来输出特征向量在所有网络层和时间序列中都应用了以上的变 换过程,实现了跨时间层和跨网络层的时间卷积TrellisNet网络模块的建模;
(4)SL-TrellisNet预测网络模块搭建SL-TrellisNets预测模型包括四个部分:输入数据、模型参数设置、短时和长时并行双流TrellsNets网络搭建及网络输出;输入数据来自经过一维卷积自动编码器进行特征提取的超视距传播损耗及环境参数,所述的环境参数包括海面温度、风速、大气温度、相对湿度和气海温差,模型的超参包括Adam优化器、权重损失、空洞卷积和权值归一化;根据步骤(2)将皮尔逊相关系数进行超视距传播损耗时间序列长短时间序列区间划分,搭建短时和长时并行双流TrellisNets获得时间序列的非线性关系;基于对网络模型参数的训练,将传播损耗最精确的预测结果进行输出并对模型保存;
(5)环境知识驱动超视距传播损耗预测解释采用定制化的SL-TrellisNet模型来实现环境知识驱动的超视距传播损耗预测;将超视距传播损耗预测序列中分别抽取出一种环境因素,得出剩下的四种环境因素对超视距传播损耗预测的均方根误差,进而判断五种不同环境因素对超视距传播损耗预测准确率的贡献力。
2.根据权利要求1所述的一种基于SL-TrellisNets网络的超视距传播损耗预测方法,其特征在于所述步骤(1)中的编码器阶段,滑动卷积核对输入序列实现卷积操作,池化层通过池化窗口输出池化后的最大值;上采样层通过零填充来实现对池化层的逆过程,反卷积核滑过特征以执行反卷积运算,反卷积层实现了数据解码;
对于卷积层,第i个一维卷积核,其输出是第i个特征通道:
Ci=ReLU(∑X·ωi+bi),
ReLU作为激活函数,X代表输入,ωi为第i个卷积核,bi代表偏置;通过一维池化层降低了输入数据的维度;对于长度为L的第i个通道的特征,池化后的输出定义为:
池化窗口W大小为2,步幅S大小为2,Ti代表输入,L代表输入序列的长度,n代表跨度区间,经过池化后每个通道特征的长度变为原始数据长度的四分之一。
3.根据权利要求1所述的一种基于SL-TrellisNets网络的超视距传播损耗预测方法,其特征在于所述步骤(1)中的解码阶段:
解码器网络由三个反卷积层和三个上采样层组成,与编码器网络的操作相反;由公式Ci=ReLU(∑X·ωi+bi)推导出反卷积层第i个通道的输出如下:
上采样层的输出是对上一层输入数据的放大,恢复池化后的数据维度;对于输入的第i个特征,其输出为:
其中long是特征的长度,jk是池化过程中记录的最大值的位置;Xi代表第i个输入的特征;该网络通过最小化重构误差来训练,误差函数表示为:
其中,l代表重构误差函数,x为初始网络状态观测矩阵输入数据,g(h(x))为重构数据,n和m代表了输入的时间序列的长度和维度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210505983.9A CN114611415B (zh) | 2022-05-11 | 2022-05-11 | 一种基于SL-TrellisNets网络的超视距传播损耗预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210505983.9A CN114611415B (zh) | 2022-05-11 | 2022-05-11 | 一种基于SL-TrellisNets网络的超视距传播损耗预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114611415A CN114611415A (zh) | 2022-06-10 |
CN114611415B true CN114611415B (zh) | 2022-08-12 |
Family
ID=81868738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210505983.9A Expired - Fee Related CN114611415B (zh) | 2022-05-11 | 2022-05-11 | 一种基于SL-TrellisNets网络的超视距传播损耗预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611415B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117421601B (zh) * | 2023-12-19 | 2024-03-01 | 山东省科学院海洋仪器仪表研究所 | 一种海面蒸发波导临近期快速预报方法 |
CN117592381B (zh) * | 2024-01-18 | 2024-05-17 | 中国船舶集团有限公司第七〇七研究所 | 一种大气波导参数反演模型训练方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002164798A (ja) * | 2000-11-24 | 2002-06-07 | Nec Eng Ltd | 見通し外通信システム |
CN106772300A (zh) * | 2016-12-02 | 2017-05-31 | 中国电波传播研究所(中国电子科技集团公司第二十二研究所) | 一种微波超视距雷达回波图计算方法 |
US10205513B1 (en) * | 2015-03-27 | 2019-02-12 | Lockheed Martin Corporation | System and method for improved beyond line-of-sight communications using natural phenomena |
CN110568403A (zh) * | 2019-08-10 | 2019-12-13 | 中国人民解放军战略支援部队信息工程大学 | 一种协同短波与卫星系统的超视距目标无源定位方法 |
CN111310889A (zh) * | 2020-01-16 | 2020-06-19 | 西北工业大学 | 一种基于深度神经网络的蒸发波导剖面估计方法 |
-
2022
- 2022-05-11 CN CN202210505983.9A patent/CN114611415B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002164798A (ja) * | 2000-11-24 | 2002-06-07 | Nec Eng Ltd | 見通し外通信システム |
US10205513B1 (en) * | 2015-03-27 | 2019-02-12 | Lockheed Martin Corporation | System and method for improved beyond line-of-sight communications using natural phenomena |
CN106772300A (zh) * | 2016-12-02 | 2017-05-31 | 中国电波传播研究所(中国电子科技集团公司第二十二研究所) | 一种微波超视距雷达回波图计算方法 |
CN110568403A (zh) * | 2019-08-10 | 2019-12-13 | 中国人民解放军战略支援部队信息工程大学 | 一种协同短波与卫星系统的超视距目标无源定位方法 |
CN111310889A (zh) * | 2020-01-16 | 2020-06-19 | 西北工业大学 | 一种基于深度神经网络的蒸发波导剖面估计方法 |
Non-Patent Citations (2)
Title |
---|
一种基于海洋气象数据的蒸发波导传播统计方法;李建儒等;《电波科学学报》;20131015(第05期);全文 * |
岸海交界处微波雷达超视距探测实验研究;刘爱国等;《电波科学学报》;20130815(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114611415A (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114611415B (zh) | 一种基于SL-TrellisNets网络的超视距传播损耗预测方法 | |
CN107330514B (zh) | 一种基于集成极限学习机的空气质量预测方法 | |
Wang et al. | An ensemble hybrid forecasting model for annual runoff based on sample entropy, secondary decomposition, and long short-term memory neural network | |
CN111310968A (zh) | 一种基于互信息的lstm神经网络循环水文预报方法 | |
CN110309603B (zh) | 一种基于风速特性的短期风速预测方法及系统 | |
CN109299430A (zh) | 基于两阶段分解与极限学习机的短期风速预测方法 | |
CN115222163B (zh) | 港池入口波浪多要素的中长期实时预测方法、系统及应用 | |
CN111967679A (zh) | 基于tcn模型的电离层总电子含量预报方法 | |
CN113240170A (zh) | 一种基于季节性循环神经网络的空气质量预测方法 | |
CN113592165B (zh) | 基于旬倾向和物理模态建模的次季节气候预测方法与系统 | |
CN111242351A (zh) | 基于自编码器和gru神经网络的热带气旋轨迹预测方法 | |
Yao et al. | Wave height forecast method with multi-step training set extension LSTM neural network | |
CN115343784A (zh) | 一种基于seq2seq-attention模型的局部气温预测方法 | |
CN111368461B (zh) | 基于svd消噪处理的改进灰色模型隧道沉降监测方法 | |
CN110852415B (zh) | 基于神经网络算法的植被指数预测方法、系统及设备 | |
CN117114168A (zh) | 一种长时间尺度的海面温度智能预报方法 | |
CN116709409A (zh) | 基于知识蒸馏的轻量化频谱预测方法 | |
CN115860165A (zh) | 一种考虑初损的神经网络流域降雨径流预报方法及系统 | |
CN116663727A (zh) | 一种光伏功率预测方法及系统 | |
CN116028791A (zh) | 一种基于超声导波和卷积神经网络的钢绞线应力识别方法 | |
CN113537573A (zh) | 基于双重时空特征提取的风电功率运行趋势预测方法 | |
CN111462479A (zh) | 一种基于傅里叶-递归神经网络的交通流预测方法 | |
CN117239744B (zh) | 融合风云4号气象卫星数据的超短期光伏功率预测方法 | |
CN116992781B (zh) | 基于深度学习的多步多要素风浪预报方法 | |
CN114971058B (zh) | 基于深度注意力网络和晴空辐射先验融合的光伏预报方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220812 |