CN113538239B - 一种基于时空自回归神经网络模型的插值方法 - Google Patents
一种基于时空自回归神经网络模型的插值方法 Download PDFInfo
- Publication number
- CN113538239B CN113538239B CN202110784921.1A CN202110784921A CN113538239B CN 113538239 B CN113538239 B CN 113538239B CN 202110784921 A CN202110784921 A CN 202110784921A CN 113538239 B CN113538239 B CN 113538239B
- Authority
- CN
- China
- Prior art keywords
- space
- time
- distance
- spatio
- temporal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000003062 neural network model Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 31
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000002123 temporal effect Effects 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 15
- 238000013461 design Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 14
- 238000012795 verification Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000013535 sea water Substances 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Remote Sensing (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于时空自回归神经网络模型的插值方法。本发明利用神经网络架构,将时空距离和时空权重解算任务转化为可量化的神经网络模型构建与训练优化问题。以时空对象的投影坐标和时间为基本输入单元,再分别计算对象间的空间距离差和时间距离差,设计模型将其向量化表达,通过神经网络拟合时空距离和时空权重,输出未知时空点的属性值。本发明的优点在于将神经网络模型引入到时空权重的解算中,利用神经网络充分拟合时空相关关系,实现时空插值,操作简单易行,能够减小插值模型和参数选择的主观因素影响,对于时空权重解算和时空数据插值具有一定应用价值。
Description
技术领域
本发明属于GIS(地理信息系统)的数据插值领域,具体涉及一种基于时空自回归神经网络的插值方法。
背景技术
在现实环境中,由于存在着地形、气候和设备等诸多限制,往往只能获得一部分目标点的在某些时间点的观测数据。随着人们对时空数据挖掘的需求更加迫切、时空数据的粒度更加细化,即使是在当今的大数据时代,时空数据的缺失和稀疏分布依然是个突出的问题。而时空数据插值的效果与精度影响着后续时空挖掘过程与结果。时空数据插值的目的在于利用有限观测数据的时空属性,运用合理的方法进行估计以获得符合真实分布的密集或者连续的数据。时空插值对于理解和分析时空数据具有重要的意义,完善和发展时空插值方法,对于探索时空数据的时空分布和变化趋势具有重要的理论价值和实践意义。
从空间模型到时空模型的拓展是统计分析模型的必然发展趋势。时空插值方法多从归约和拓展法两个角度展开。归约法是先进行时间维度内插再进行空间内插,将时空内插问题简化为常规的空间内插问题。拓展法是将时间作为空间的另一个维度进行处理,这样就将时空插值问题转换为了高维空间插值问题。在拓展法中常见的是时空克里金插值,通过构建时空变异函数和时空协方差函数拟合时空相关性,但由于数学模型限制和人为因素影响,存在难以拟合时空数据间复杂非线性关系的问题。
发明内容
本发明的目的是克服现有的不足,提供一种基于时空自回归神经网络的插值方法。
为实现本发明目的,提供的技术方案如下:
一种基于时空自回归神经网络模型的插值方法,用于对时空点观测数据中的缺失属性值进行插值补全,其包括如下步骤:
S1:对待插值的时空点的原始观测数据进行预处理,去除存在值缺失的时空点样本,保留时空点的空间坐标、时间和属性值均完整的时空点样本;对保留的所有时空点样本通过遍历进行两两配对,计算每一对时空点样本间的空间距离和时间距离,构建形成训练数据集;
S2:利用所述训练数据集对预先构建的时空自回归神经网络模型进行训练;
所述时空自回归神经网络模型包含输入层、时空距离网络、时空权重网络和输出层;
所述输入层的输入为时空点间的空间距离和时间距离,通过所述时空距离网络进行转换,输出时空点间的时空距离,以得到待插值的未知时空点与任一已知时空点之间的时空距离;
所述时空权重网络的输入为未知时空点与每个已知时空点之间的时空距离向量,输出为每个已知时空点相对于未知时空点的时空权重向量;
所述输出层中将时空权重向量与所有已知时空点的属性值向量相乘,输出未知时空点的属性值预测结果;
S3:利用训练后的时空自回归神经网络模型对原始观测数据中待插值的每个缺失属性值进行预测,进而实现原始观测数据中的缺失属性值的插值补全。
基于上述方案,各步骤可具体采用以下具体方式实现。
作为优选,所述步骤S1中,构建训练数据集的执行流程包括:
S11:获取存在数据缺失的时空点的原始观测数据,原始观测数据中每一个时空点样本均含有空间坐标、时间和属性值三种信息;遍历每个时空点样本,将空间坐标、时间和属性值三者任一存在缺失的时空点样本进行删除,将剩余的时空点样本的属性值做归一化处理;
S12:对S11中保留的所有时空点样本进行两两遍历配对,对于任意一对时空点i与时空点j,获取对空对象i的空间坐标(ui,vi)和时间ti,获取对空对象j的空间坐标(uj,vj)和时间tj,计算时空点i与时空点j之间的投影坐标差(ui-uj,vi-vj)和时间差ti-tj,分别代表空间距离和时间距离;所有计算结果以向量形式表示;
S13:将S11中归一化处理后的观测数据,结合S12中计算得到的时空点样本间的空间距离和时间距离,构建为训练数据集。
作为优选,所述S2的时空自回归神经网络模型中,各网络层的结构如下:
所述时空距离网络f表示为:
其中:(ui-uj,vi-vj,ti-tj)表示时空距离网络f的输入,表示时空距离网络f的输出;
所述时空权重网络fST表示为:
其中:为所述输入层传递的时空权重网络fST的输入,表示待插值的未知时空点i与所有n个已知时空点之间的时空距离组成的时空距离向量,wi为时空权重网络fST的输出,表示所有n个已知时空点相对于未知时空点i的时空权重组成的时空权重向量;
所述输出层表示为:
其中:y=(y1,y2,…,yn)T表示n个已知时空点的属性值向量,表示未知时空点i的属性值预测结果。
进一步的,所述时空自回归神经网络模型中,时空权重网络通过时空权重矩阵来实现多个未知时空点的属性值预测,时空权重矩阵W由时空权重系数分量矩阵ρ和标准时空权重分量矩阵β相乘得到:
其中:*表示哈达马积,ρij表示时空点i和时空点j之间的时空权重系数分量,由时空权重网络预测得到;βij表示时空点i和时空点j之间的标准时空权重分量,定义为:
最终,在输出层中以向量形式输出多个未知时空点的属性值预测结果:
作为优选,所述时空自回归神经网络模型通过批训练方式进行参数优化。
作为优选,所述归一化的方式为Min-Max归一化。
作为优选,所述时空距离网络采用3层结构,包括1个输入层、1个隐藏层和1个输出层,隐藏层以PReLU为激活函数。
作为优选,所述时空权重网络采用5层结构,包括1个输入层、3个隐藏层和1个输出层,隐藏层以PReLU为激活函数。
作为优选,所述观测数据为水域空间上的水质监测数据,每个采样点记录分别代表空间坐标、时间和属性值的采样位置坐标、采样时间和监测指标。
进一步的,所述监测指标为每个采样点的温度数据。
本发明与现有技术相比具有的有益效果:
针对常见时空插值方法基于数学模型进行人为主观参数拟合,难以将时间和空间距离转换为时空距离,拟合时空距离对时空权重间的复杂非线性作用等问题,利用神经网络强大的学习和抽象能力,将时空距离与时空权重的拟合问题转换成了神经网络的构建与训练优化问题,减小模型选择和参数设置的主观因素影响,能够有效提升时空数据的插值精度,为时空插值模型提供了一定了拓展思路。
附图说明
图1为基于时空自回归神经网络的插值方法流程图;
图2为时空自回归神经网络模型的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
本发明提供了一种基于时空自回归神经网络模型的插值方法,该插值方法的作用是对时空点观测数据中的缺失属性值进行插值补全。所谓时空点观测数据是指在记录过程中既有空间信息也有时间信息的观测数据,例如在一定区域内不同位置定期采集的数据,其中的采样点就是时空点,而采集的数据就是其记录的属性值,每一条属性值对应于其采集位置的坐标和采集时间。因此时空点存的完整性在两个维度,空间维度和时间维度。此类数据采集过程中由于存在着各种客观和主观原因限制,往往只能获得一部分点位的在某些时间点的观测数据,而无法获得完整的所有时空点的观测数据。
如图1所示,在本发明的一个较佳实施例中,提供了一种基于时空自回归神经网络模型的插值方法的流程图,其主要步骤包括4步,分别为S1~S4:
S1:对待插值的时空点的原始观测数据进行预处理,去除存在值缺失的时空点样本,保留时空点的空间坐标、时间和属性值均完整的时空点样本。对保留的所有时空点样本通过遍历进行两两配对,计算每一对时空点样本间的空间距离和时间距离,构建形成训练数据集。
S2:利用上述训练数据集对预先构建的时空自回归神经网络模型进行训练。
其中,本发明利用神经网络架构构建了时空自回归神经网络模型,将时空距离和时空权重解算任务转化为可量化的神经网络模型构建与训练优化问题。以时空对象的投影坐标和时间为基本输入单元,再分别计算对象间的空间距离差和时间距离差,设计模型将其向量化表达,通过神经网络拟合时空距离和时空权重,输出未知时空点的属性值。如图2所示,时空自回归神经网络模型包含输入层、时空距离网络、时空权重网络和输出层,其中时空距离网络的作用是实现从时间与空间距离到时空距离的转换,而时空权重网络的作用是实现从时空距离到时空权重的转换。各网络层的具体功能如下:
输入层的输入为时空点间的空间距离和时间距离,输入数据传输至时空距离网络中,通过时空距离网络进行空间距离和时间距离到时空距离的转换,输出时空点间的时空距离。时空距离网络的输出可作为时空权重网络的输入。由于时空距离网络可输出任意两个时空点之间的时空距离,因此以得到待插值的未知时空点与任一已知时空点之间的时空距离。
时空权重网络的输入为未知时空点与每个已知时空点之间的时空距离向量,输出为每个已知时空点相对于未知时空点的时空权重向量。
时空权重网络的输出传递置输出层,由输出层中将时空权重向量与所有已知时空点的属性值向量相乘,输出未知时空点的属性值预测结果。
S3:利用训练后的时空自回归神经网络模型对原始观测数据中待插值的每个缺失属性值进行预测,进而实现原始观测数据中的缺失属性值的插值补全。
下面对本实施例中S1~S4的具体实现方式以及其效果进行详细描述。
在上述S1步骤中,构建训练数据集的具体执行流程包括:
S11:获取存在数据缺失的时空点的原始观测数据,原始观测数据中每一个时空点样本均含有空间坐标(即投影坐标)、时间和属性值三种信息。遍历每个时空点样本,将空间坐标、时间和属性值三者任一存在缺失的时空点样本进行删除,将剩余的时空点样本集合记为A,将集合A中每个时空点的属性值做归一化处理。输入数据可能分布不均匀,为了优化网络训练,因此归一化转换采用Min-Max归一化公式,归一化到[0,1]范围。
S12:对集合A中保留的所有时空点样本进行两两遍历配对,对于任意一对时空点i与时空点j,获取对空对象i的空间坐标(ui,vi)和时间ti,获取对空对象j的空间坐标(uj,vj)和时间tj,计算时空点i与时空点j之间的投影坐标差(ui-uj,vi-vj)和时间差ti-tj,分别代表空间距离和时间距离,空间距离和时间距离可均采用绝对值记录。所有计算结果以向量形式表示。由此,对于任意一个时空点,就得到了其与其他数据的在各个方向的投影坐标差和时间差。
S13:将S11中归一化处理后的观测数据,结合S12中计算得到的时空点样本间的空间距离和时间距离,构建为训练数据集。
在上述S2步骤中,描述了时空自回归神经网络模型的基本流程,下面对模型中各网络层的具体结构进行详细描述:
1)若有任意两个时空点i与j,定义其时空距离为时空距离网络f可以视为是一个将时间与空间距离映射到时空距离的函数,表示为:
其中:(ui-uj,vi-vj,ti-tj)表示时空距离网络f的输入,表示时空距离网络f的输出;/>表示空间距离,/>表示时间距离。
函数f是一种需要拟合时间、空间距离与时空距离的复杂非线性关系,因此其在本发明中用神经网络的形式进行拟合,可以时间距离和空间距离为输入、时空距离为输出,构造时空距离神经网络。该时空距离网络采用3层结构,包括1个输入层、1个隐藏层和1个输出层,隐藏层神经元数量为4,隐藏层以PReLU为激活函数。
2)对于任意一个缺失属性值的时空点i,定义其时空权重wi=(wi1,wi2,…,win),n为所有具有属性值的已知时空点个数,wik表示时空点k相对于时空点i的时空权重,因此表示已知时空点k相对于未知时空点i的时空权重。那么时空权重网络fST可以视为是一个以为输入、时空权重向量wi为输出的时空权重计算函数,表示为:
其中:为输入层传递的时空权重网络fST的输入,表示待插值的未知时空点i与所有n个已知时空点之间的时空距离组成的时空距离向量,wi为时空权重网络fST的输出,表示所有n个已知时空点相对于未知时空点i的时空权重组成的时空权重向量。
同样的,函数fST需要拟合复杂非线性关系,因此在本发明中用神经网络的形式进行拟合,输入是构建的时空距离网络的输出,以此方式将两个网络结构连接起来。本实施例中时空权重网络采用5层结构,包括1个输入层、3个隐藏层和1个输出层,隐藏层以PReLU为激活函数。
3)输出层中可以以n个已知时空点的属性值结合时空权重向量来对未知时空点i的属性值进行预测,表示为:
其中:y=(y1,y2,…,yn)T表示n个已知时空点的属性值向量,yk表示已知时空点k的属性值,表示未知时空点i的属性值预测结果。
上述训练数据集由于已删除了所有缺失值的样本,因此相当于所有时空点样本都带有训练所需的真值标签。训练数据集可通过批训练的方式,通过分批输入时空自回归神经网络模型中,对模型进行训练使其能够准确地利用已知时空点的信息来实现位置时空点的信息插值补全。
具体的模型训练方式属于现有技术,本实施例中以均方误差MSE为网络的损失函数,计算公式如下:
式中,n为样本总数,为预测值,y为真实值。
采用梯度下降法更新模型内部的神经网络参数变量,使其逼近或达到最优值,从而使损失函数结果最小。引入学习率衰减(learning rate decay)作为梯度更新优化策略。另在隐藏层用批归一化(Batch Normalization)和随机失活正则化(drop out)进行优化。超参数包括训练样本大小batch_size、学习率α、训练轮数epoch,drop out的存活概率keep-alive。需要根据数据内容、体量、硬件资源,综合确定模型训练时的超参数取值。
因此,在上述S3步骤中,就可以利用训练后的时空自回归神经网络模型对原始观测数据中待插值的每个缺失属性值进行预测,预测值代替缺失值重新补全至原始观测数据中。由此,通过这种做法可以得到任意时空点的缺失属性值,大大提高了观测数据的完整性和可用性。
另外,需要注意的是,上述时空权重网络fST可以逐个输出时空权重向量,也可以利用矩阵形式直接输出多个时空权重向量组成的时空权重矩阵,以便于实现多个未知时空点的属性值预测,两种方式的基本原理一致,区别仅在于形式不同。本实施例中需要预测的未知时空点较多,因此通过构建时空权重矩阵的方式进行预测。
当时空权重网络通过时空权重矩阵来实现多个未知时空点的属性值预测时,我们需要先定义时空权重矩阵W:
时空权重矩阵W由元素wij组成,位于时空权重矩阵对角线上的元素表示两个相同时空位置互相的权重,为了消除时空点自身的影响,需要将对角线元素的权重设为0,其余则由时空权重网络fST输出,按下式表示:
为了在模型中实现时空点自身影响的消除,可再定义标准权重分量βij为:
wij可以表示为:
wij=ρij×βij
式中,ρij为时空权重系数分量。
由此,时空权重矩阵可时空权重矩阵W由时空权重系数分量矩阵ρ和标准时空权重分量矩阵β逐元素相乘得到,即由时空权重系数分量ρij和标准时空权重分量βij相乘得到:
其中:*表示哈达马积(Hadamard product),ρij表示时空点i和时空点j之间的时空权重系数分量,由时空权重网络预测得到;βij表示时空点i和时空点j之间的标准时空权重分量,定义如前所述。
因此,在这种做法中,时空权重网络fST先预测的实际上是时空权重系数分量矩阵ρ,最终在输出层中将时空权重系数分量矩阵ρ和标准时空权重分量矩阵β逐元素相乘,以向量形式输出m个未知时空点的属性值预测结果:
上述时空自回归神经网络模型可以对区域内存在的复杂非线性关系进行拟合,得到未知时空点的预测值。该未知时空点可以是空间点也可以是时间点。
下面基于上述S1~S3描述的方法,将其应用至实施例中,以直观展示其技术效果。
实施例
本实施例中,将2018年1-3月浙江近岸海域水质监测数据作为待插值的原始观测数据,每个采样点样本记录有采集位置的坐标、采集时间以及多种水质监测指标。此处以海水温度作为待插值补全的属性,将原数据中的采集位置的坐标、采集时间以及海水温度数据按9:1比例分为训练集和验证集,以之为研究对象进行插值实验。其基本步骤如前述的S1~S4所述,不再赘述,下面主要对各步骤的一些具体实现细节和效果进行展示。
1、根据S1~S2中描述的方法,使用TensorFlow框架构建网络,模型的超参数设置如下:
1)训练样本大小batch_size:64;2)学习率α:0.1;3)训练轮数epoch:40000;4)keep-alive:0.8。
2、开展温度数据训练集的训练,每隔1000步保存模型实例,并对验证集进行一次验证,同时利用TensorBoard插件绘制训练梯度曲线和测试梯度曲线,判断模型是否存在过拟合或欠拟合,最终选取验证准确率最高的保存点作为模型生成结果。
3、将本发明方法(STARNN)与时空反距离加权法(STIDW)进行对比。实验结果如表1和表2所示。本发明相比时空反距离加权法在拟合能力和预测能力上都有所提升,如下表1训练集结果所示,在训练集,R2从0.9224提升到0.9736,平均绝对误差MAE从0.5017下降至0.3662。如下表1验证集结果所示,在验证集,R2从0.9184提升到0.9353,平均绝对误差MAE从0.4035下降至0.3809。
表1
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (8)
1.一种基于时空自回归神经网络模型的插值方法,用于对时空点观测数据中的缺失属性值进行插值补全,其特征在于,包括如下步骤:
S1:对待插值的时空点的原始观测数据进行预处理,去除存在值缺失的时空点样本,保留时空点的空间坐标、时间和属性值均完整的时空点样本;对保留的所有时空点样本通过遍历进行两两配对,计算每一对时空点样本间的空间距离和时间距离,构建形成训练数据集;
S2:利用所述训练数据集对预先构建的时空自回归神经网络模型进行训练;
所述时空自回归神经网络模型包含输入层、时空距离网络、时空权重网络和输出层;
所述输入层的输入为时空点间的空间距离和时间距离,通过所述时空距离网络进行转换,输出时空点间的时空距离,以得到待插值的未知时空点与任一已知时空点之间的时空距离;
所述时空权重网络的输入为未知时空点与每个已知时空点之间的时空距离向量,输出为每个已知时空点相对于未知时空点的时空权重向量;
所述输出层中将时空权重向量与所有已知时空点的属性值向量相乘,输出未知时空点的属性值预测结果;
S3:利用训练后的时空自回归神经网络模型对原始观测数据中待插值的每个缺失属性值进行预测,进而实现原始观测数据中的缺失属性值的插值补全;
所述S2的时空自回归神经网络模型中,各网络层的结构如下:
所述时空距离网络f表示为:
其中:(ui-uj,vi-vj,ti-tj)表示时空距离网络f的输入,表示时空距离网络f的输出;
所述时空权重网络fST表示为:
其中:为所述输入层传递的时空权重网络fST的输入,表示待插值的未知时空点i与所有n个已知时空点之间的时空距离组成的时空距离向量,wi为时空权重网络fST的输出,表示所有n个已知时空点相对于未知时空点i的时空权重组成的时空权重向量;
所述输出层表示为:
其中:y=(y1,y2,…,yn)T表示n个已知时空点的属性值向量,表示未知时空点i的属性值预测结果;
所述时空自回归神经网络模型中,时空权重网络通过时空权重矩阵来实现多个未知时空点的属性值预测,时空权重矩阵W由时空权重系数分量矩阵ρ和标准时空权重分量矩阵β相乘得到:
其中:*表示哈达马积,ρij表示时空点i和时空点j之间的时空权重系数分量,由时空权重网络预测得到;βij表示时空点i和时空点j之间的标准时空权重分量,定义为:
最终,在输出层中以向量形式输出多个未知时空点的属性值预测结果:
2.根据权利要求1所述的插值方法,其特征在于,所述步骤S1中,构建训练数据集的执行流程包括:
S11:获取存在数据缺失的时空点的原始观测数据,原始观测数据中每一个时空点样本均含有空间坐标、时间和属性值三种信息;遍历每个时空点样本,将空间坐标、时间和属性值三者任一存在缺失的时空点样本进行删除,将剩余的时空点样本的属性值做归一化处理;
S12:对S11中保留的所有时空点样本进行两两遍历配对,对于任意一对时空点i与时空点j,获取对空对象i的空间坐标(ui,vi)和时间ti,获取对空对象j的空间坐标(uj,vj)和时间tj,计算时空点i与时空点j之间的投影坐标差
(ui-uj,vi-vj)和时间差ti-tj,分别代表空间距离和时间距离;所有计算结果以向量形式表示;
S13:将S11中归一化处理后的观测数据,结合S12中计算得到的时空点样本间的空间距离和时间距离,构建为训练数据集。
3.根据权利要求1所述的插值方法,其特征在于,所述时空自回归神经网络模型通过批训练方式进行参数优化。
4.根据权利要求2所述的插值方法,其特征在于,所述归一化的方式为Min-Max归一化。
5.根据权利要求1所述的插值方法,其特征在于,所述时空距离网络采用3层结构,包括1个输入层、1个隐藏层和1个输出层,隐藏层以PReLU为激活函数。
6.根据权利要求1所述的插值方法,其特征在于,所述时空权重网络采用5层结构,包括1个输入层、3个隐藏层和1个输出层,隐藏层以PReLU为激活函数。
7.根据权利要求1所述的插值方法,其特征在于,所述观测数据为水域空间上的水质监测数据,每个采样点记录分别代表空间坐标、时间和属性值的采样位置坐标、采样时间和监测指标。
8.根据权利要求7所述的插值方法,其特征在于,所述监测指标为每个采样点的温度数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110784921.1A CN113538239B (zh) | 2021-07-12 | 2021-07-12 | 一种基于时空自回归神经网络模型的插值方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110784921.1A CN113538239B (zh) | 2021-07-12 | 2021-07-12 | 一种基于时空自回归神经网络模型的插值方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113538239A CN113538239A (zh) | 2021-10-22 |
CN113538239B true CN113538239B (zh) | 2024-03-19 |
Family
ID=78127479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110784921.1A Active CN113538239B (zh) | 2021-07-12 | 2021-07-12 | 一种基于时空自回归神经网络模型的插值方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113538239B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117421562B (zh) * | 2023-12-18 | 2024-03-15 | 浙江大学 | 海洋溶解氧含量时空分布预测方法、系统、介质及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107610021A (zh) * | 2017-07-21 | 2018-01-19 | 华中农业大学 | 环境变量时空分布的综合分析方法 |
CN110046771A (zh) * | 2019-04-25 | 2019-07-23 | 河南工业大学 | 一种pm2.5浓度预测方法与装置 |
-
2021
- 2021-07-12 CN CN202110784921.1A patent/CN113538239B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107610021A (zh) * | 2017-07-21 | 2018-01-19 | 华中农业大学 | 环境变量时空分布的综合分析方法 |
CN110046771A (zh) * | 2019-04-25 | 2019-07-23 | 河南工业大学 | 一种pm2.5浓度预测方法与装置 |
Non-Patent Citations (2)
Title |
---|
Modeling spatially anisotropic nonstationary processes in coastal environments based on a directional geographically neural network weighted regression;Sensen Wu;Elsevier;全文 * |
基于空间自回归神经网络模型的空间插值研究;曾金迪;浙江大学学报(理科版);第47卷(第5期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113538239A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Feature selection using rough entropy-based uncertainty measures in incomplete decision systems | |
Uzielli et al. | Risk analysis for the Ancona landslide—II: estimation of risk to buildings | |
Li et al. | A multi-scale cucumber disease detection method in natural scenes based on YOLOv5 | |
CN112131731B (zh) | 一种基于空间特征向量滤波的城市生长元胞模拟方法 | |
Adelfio et al. | FLP estimation of semi-parametric models for space–time point processes and diagnostic tools | |
CN107403188A (zh) | 一种水质评价方法及装置 | |
CN116451553A (zh) | 一种改进的变分模态分解与BiGRU融合的水质预测方法 | |
CN113538239B (zh) | 一种基于时空自回归神经网络模型的插值方法 | |
CN117390635A (zh) | 一种基于大数据分析的安全监测方法和系统 | |
CN117992757B (zh) | 基于多维数据的国土生态环境遥感数据分析方法 | |
CN105938524A (zh) | 一种微生物关联网络预测方法及装置 | |
CN111714124A (zh) | 磁共振电影成像方法、装置、成像设备及存储介质 | |
CN109001805B (zh) | 一种地震震源反演不确定性分析方法、存储介质及服务器 | |
CN106772354A (zh) | 基于并行模糊高斯和粒子滤波的目标跟踪方法及装置 | |
CN116881798A (zh) | 用于气象等复杂系统的基于变量选择和反向时滞特征选择的条件格兰杰因果分析方法 | |
CN117131654A (zh) | 基于预分析初猜值条件非线性最优扰动的目标观测方法 | |
Chung et al. | Sampled limited memory methods for massive linear inverse problems | |
Mu et al. | Prediction of North Atlantic Oscillation Index Associated with the Sea Level Pressure Using DWT‐LSTM and DWT‐ConvLSTM Networks | |
Singh et al. | Forecasting solar radiation by the machine learning algorithm and their different techniques | |
CN117496279B (zh) | 影像分类模型建立方法及装置、分类方法、装置及系统 | |
CN103810689A (zh) | 一种新的图像融合效果评价算法 | |
CN117671278A (zh) | 电力图像数据处理方法、装置、设备、介质和程序产品 | |
Xu et al. | [Retracted] Quality Evaluation and Informatization Analysis of Physical Education Teaching Reform Based on Artificial Intelligence | |
Wang et al. | Improving Precipitation Forecasting through Early Fusion and Spatiotemporal Prediction: A Case Study Using the MultiPred Model | |
CN118193507A (zh) | 一种基于张量补全和图注意力网络的交通流量数据插补方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |