CN110134907A - 一种降雨缺失数据填补方法、系统及电子设备 - Google Patents
一种降雨缺失数据填补方法、系统及电子设备 Download PDFInfo
- Publication number
- CN110134907A CN110134907A CN201910373908.XA CN201910373908A CN110134907A CN 110134907 A CN110134907 A CN 110134907A CN 201910373908 A CN201910373908 A CN 201910373908A CN 110134907 A CN110134907 A CN 110134907A
- Authority
- CN
- China
- Prior art keywords
- rainfall
- station
- filled
- filling
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012216 screening Methods 0.000 claims description 43
- 238000004364 calculation method Methods 0.000 claims description 21
- 230000007812 deficiency Effects 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 4
- 230000006735 deficit Effects 0.000 claims description 2
- 230000003447 ipsilateral effect Effects 0.000 abstract 1
- 238000007619 statistical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012896 Statistical algorithm Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005429 filling process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本申请涉及一种降雨缺失数据填补方法、系统及电子设备。包括:步骤a:根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;步骤b:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;步骤c:根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。本申请基于高程信息和距离筛选出与待填补站点位于山体同侧且距离最近的k个邻近站点,对待填补站点进行k次降雨数据填补,使得填补后的数据相比大多统计算法更加准确,改善现阶段降雨数据填补的精确度。
Description
技术领域
本申请属于气象服务技术领域,特别涉及一种降雨缺失数据填补方法、系统及电子设备。
背景技术
近年来,全球气候变暖影响着全球的气候变化条件,其中降雨特征变化的研究对人们的日常生活具有较大的影响,对各地区的水资源合理利用与分配也有一定指导作用。因此掌握各地区降雨变化趋势对各地区的可持续发展具有重要的意义。研究降雨的特征变化往往需要更加准确的降雨数据,降雨数据源于气象观测站,观测站一般通过一些设备或者人工的方法测得降雨量。测量设备因地形差异易受到外界环境的影响(比如强台风天气可能会使一些观测设备出现故障),各地区观测站数目随着社会发展不断增多而设备的维护人员较少,以及一些人为的原因均有可能导致观测站降雨数据的缺失。降雨数据的缺失会在一定程度上影响气象研究人员统计分析的结果。
目前,针对各类气象数据的缺失更多的是通过统计学的方法进行统一填补,包括临近法、平均值、等具有代表性的数值填补方法,通过分析已有数据之间的统计联系和规律,最终填补缺失数据。一方面,考虑到降雨天气发生的随机性,在某些地区上(比如深圳)可能存在某个时刻还是倾盆大雨,降雨量很大,然而下一时刻就天晴了,降雨量为0。如果这种情况下通过临近填补法或者统计学方法进行填补,而不考虑降雨数据本身固有的属性,会影响填补数据的准确性。另一方面,考虑到降雨易受到地形、迎风坡、背风坡的影响,湿润气流遇到山脉等高地阻挡时被迫抬升而气温降低形成的降水,降水的山坡正好是迎风的一面,而背风的一面,因为气流下沉,温度升高,不再形成降水。这种情况下若地区存在山体丘陵,山体两侧的降雨量往往会存在较大差异。普通的数据填补方法大都基于数理统计的角度填补数据,而未考虑降雨的本身特殊形成条件,会导致降雨数据填补的精确度不高。
发明内容
本申请提供了一种降雨缺失数据填补方法、系统及电子设备,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种降雨缺失数据填补方法,包括以下步骤:
步骤a:根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
步骤b:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
步骤c:根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
本申请实施例采取的技术方案还包括:在所述步骤a中,所述距离计算公式为:
上述公式中,θ1,θ2是两个站点经度的弧度制表示,Δλ是两个站点纬度差值的弧度制表示,a是中间变量,R=6371km是地球半径的平均值,d是两个站点的距离。
本申请实施例采取的技术方案还包括:在所述步骤b中,所述基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点具体为:根据所述临近站点的距离排序结果,首先判定第一临近站点与待填补站点是否位于山体同一侧,如果第一临近站点与待填补站点位于山体同一侧,则将第一临近站点作为待填补站点的第一降雨填补参考站;如果第一临近站点与待填补站点不在山体同一侧,则剔除该第一临近站点,并进行第二临近站点的筛选,直到筛选出与待填补站点位于山体同一侧且距离最近的k个降雨填补参考站。
本申请实施例采取的技术方案还包括:所述步骤a还包括:统计待填补站点预定时间内的降雨数据缺失时刻信息;所述步骤c中,所述根据至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补具体为:根据待填补站点的降雨数据缺失时刻信息,按照k个降雨填补参考站点的筛选排序结果依次对待填补站点进行降雨数据填补。
本申请实施例采取的技术方案还包括:所述步骤c后还包括:判断所述待填补站点填补后的降雨数据是否完整,如果仍不完整,利用地区内代表性站点或者扩大k值再次对待填补站点进行降雨数据填补,直到得到填补完整的降雨数据。
本申请实施例采取的另一技术方案为:一种降雨缺失数据填补系统,包括:
距离计算模块:用于根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
站点筛选模块:用于基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
第一数据填补模块:用于根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
本申请实施例采取的技术方案还包括:所述距离计算公式为:
上述公式中,θ1,θ2是两个站点经度的弧度制表示,Δλ是两个站点纬度差值的弧度制表示,a是中间变量,R=6371km是地球半径的平均值,d是两个站点的距离。
本申请实施例采取的技术方案还包括:所述站点筛选模块基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点具体为:根据所述临近站点的距离排序结果,首先判定第一临近站点与待填补站点是否位于山体同一侧,如果第一临近站点与待填补站点位于山体同一侧,则将第一临近站点作为待填补站点的第一降雨填补参考站;如果第一临近站点与待填补站点不在山体同一侧,则剔除该第一临近站点,并进行第二临近站点的筛选,直到筛选出与待填补站点位于山体同一侧且距离最近的k个降雨填补参考站。
本申请实施例采取的技术方案还包括时刻统计模块,所述时刻统计模块用于统计待填补站点预定时间内的降雨数据缺失时刻信息;所述第一数据填补模块根据至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补具体为:根据待填补站点的降雨数据缺失时刻信息,按照k个降雨填补参考站点的筛选排序结果依次对待填补站点进行降雨数据填补。
本申请实施例采取的技术方案还包括第二数据填补模块,所述第二数据填补模块用于判断所述待填补站点填补后的降雨数据是否完整,如果仍不完整,利用地区内代表性站点或者扩大k值再次对待填补站点进行降雨数据填补,直到得到填补完整的降雨数据。
本申请实施例采取的又一技术方案为:一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的降雨缺失数据填补方法的以下操作:
步骤a:根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
步骤b:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
步骤c:根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的降雨缺失数据填补方法、系统及电子设备首次提出了一种基于高程信息的降雨缺失数据临近填补方法,基于高程信息和距离筛选出与待填补站点位于山体同侧且距离最近的k个邻近站点,对待填补站点进行k次降雨数据填补。在数据填补的过程中主要考虑了降雨天气现象本身固有的属性,比如地形状况对降雨的影响,降雨现象出现的随机性,其次也充分利用了周边站点的信息,使得填补后的数据相比大多统计算法更加准确,改善现阶段降雨数据填补的精确度,对气象研究工作者获取完整的降雨数据以及气象大数据应用具有重要意义。
附图说明
图1是本申请实施例的降雨缺失数据填补方法的流程图;
图2为深圳地区观测站B的降雨缺失数据k(k=3)次填补流程图;
图3为深圳地区高程信息和观测站B的最近4个邻近站点示意图;
图4是本申请实施例的降雨缺失数据填补系统的结构示意图;
图5是本申请实施例提供的降雨缺失数据填补方法的硬件设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请实施例的降雨缺失数据填补方法的流程图。本申请实施例的降雨缺失数据填补方法包括以下步骤:
步骤100:统计待填补站点预定时间内的降雨数据缺失时刻信息;
步骤100中,降雨数据缺失时刻信息的统计方法具体为:由于气象数据集包括月、日、时、分等不同时间节点的数据集,因此需要根据原始降雨数据的不同时间节点确定具体缺失时刻,例如,如果原始降雨数据是小时降雨数据,即降雨数据是每一个小时记录一次,而待填补站点在该小时内无降雨数据记录,则判定该时刻为降雨数据缺失时刻。其他时间节点的降雨数据缺失时刻统计方法类似。
步骤200:根据各个观测站的经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
步骤200中,距离计算公式采用Haversine公式:
公式(1)中,θ1,θ2是两个站点经度的弧度制表示,Δλ是两个站点纬度差值的弧度制表示,a是中间变量,R=6371km是地球半径的平均值,d是两个站点的距离。该公式采用了相对较多正弦函数,使得在计算小范围距离也能保持足够的精确,适用性相对更广。
步骤300:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定k个临近站点作为待填补站点的降雨填补参考站点;
步骤300中,筛选条件是:基于地区的高程信息和各个临近站点的距离排序结果,首先判断第一临近站点与待填补站点是否位于山体同一侧,如果第一临近站点与待填补站点位于山体同一侧,则将第一临近站点作为待填补站点的第一降雨填补参考站;反之,如果第一临近站点与待填补站点不在山体同一侧,则剔除该第一临近站点,并进行第二临近站点的筛选。以此类推,直到筛选出与待填补站点位于山体同一侧且距离最近的k个降雨填补参考站,利用此k个降雨填补参考站的降雨数据对待填补站点的降雨数据进行填补。本申请实施例中,k的数量可根据实际应用进行设定。本申请实施例中,优选使用高程信息以及距离进行降雨填补参考站的筛选,更深层次的,还可以根据地区的高程信息图,对各个站点进行分类分析,判断是否属于同类型大陆、沿海周边地区等方法确定k个降雨填补参考站。
具体请一并参阅图2和图3,图2为深圳地区观测站B的降雨缺失数据k(k=3)次填补流程图,图3为深圳地区高程信息和观测站B的最近4个邻近站点示意图。以深圳地区为例,需要确定该地区内站点B的k(k取3)个降雨填补参考站。首先,根据各站点的经纬度信息,将各站点绘制在深圳的高程图上,图3中给出了站点B附近的最近的4个观测站,由近到远排序依次是站点A、C、D、E。第一次对站点A进行筛选,图3中可以看出,站点A距离站点B最近,但其与站点B在山体的不同侧,不能作为站点B的降雨填补参考站点,所以剔除掉站点A;第二次对站点C进行筛选,站点C与站点B在山体一侧,则保留站点C作为站点B数据填补的第一降雨填补参考站点;第三次对站点D进行筛选,站点D与站点B在山体一侧,则保留站点D作为站点B数据填补的第二降雨填补参考站点;第四次对站点E进行筛选,以此类推得到站点B同侧的3个站点作为降雨填补参考站,且距离由近到远排序为C、D、E。
步骤400:根据待填补站点的降雨数据缺失时刻信息,按照k个降雨填补参考站点的筛选排序结果依次对待填补站点进行降雨数据填补;
步骤400中,降雨数据填补具体为:根据步骤300中的筛选结果,如果站点B的降雨数据有缺失,则根据降雨数据缺失时刻信息,首先利用站点C的降雨数据对站点B进行第一次填补,如果填补后仍有缺失再利用站点D的降雨数据对站点B进行第二次填补,无缺失则填补结束,以此类推得到3次填补后的B站点的降雨数据。每填补一次则对待填补站点进行一次数据缺失检验,判断是否填补完整,如果填补完整,则停止填补;否则通过下一个降雨填补参考站的降雨数据对待填补站点进入下一次填补,直到k个降雨填补参考站点全部利用结束。
步骤500:判断待填补站点填补后的降雨数据是否完整,如果仍不完整,利用地区内代表性站点或者扩大k值再次对待填补站点进行降雨数据填补,直到得到填补完整的降雨数据;
步骤500中,各地区代表性站点的降雨数据都是相对完整的,例如深圳地区,国家基准站59493的数据相对完整,可以充分利用国家基本站数据对待填补站点缺失的降雨数据做最后填补,或者扩大k值(即增加降雨填补参考站点的数量),得到完整的降雨数据。
请参阅图4,是本申请实施例的降雨缺失数据填补系统的结构示意图。本申请实施例的降雨缺失数据填补系统包括时刻统计模块、距离计算模块、站点筛选模块、第一数据填补模块和第二数据填补模块。
时刻统计模块:用于统计待填补站点预定时间内的降雨数据缺失时刻信息;其中,降雨数据缺失时刻信息的统计方法具体为:由于气象数据集包括月、日、时、分等不同时间节点的数据集,因此需要根据原始降雨数据的不同时间节点确定具体缺失时刻,例如,如果原始降雨数据是小时降雨数据,即降雨数据是每一个小时记录一次,而待填补站点在该小时内无降雨数据记录,则判定该时刻为降雨数据缺失时刻。其他时间节点的降雨数据缺失时刻统计方法类似。
距离计算模块:用于根据各个观测站的经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;其中,距离计算公式采用Haversine公式:
公式(1)中,θ1,θ2是两个站点经度的弧度制表示,Δλ是两个站点纬度差值的弧度制表示,a是中间变量,R=6371km是地球半径的平均值,d是两个站点的距离。该公式采用了相对较多正弦函数,使得在计算小范围距离也能保持足够的精确,适用性相对更广。
站点筛选模块:用于基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定k个临近站点作为待填补站点的降雨填补参考站点;其中,筛选条件是:基于地区的高程信息,判定临近站点与待填补站点是否位于山体同一侧,如果该临近站点与待填补站点位于山体同一侧,则将该临近站点作为待填补站点的第一降雨填补参考站;反之,如果临近站点与待填补站点不在山体同一侧,则剔除该临近站点。以此类推,直到筛选出与待填补站点位于山体同一侧且距离最近的k个降雨填补参考站,利用此k个降雨填补参考站的降雨数据对待填补站点的降雨数据进行填补。本申请实施例中,k的数量可根据实际应用进行设定。
具体请一并参阅图2和图3,以深圳地区为例,需要确定该地区内站点B的k(k取3)个降雨填补参考站。首先,根据各站点的经纬度信息,将各站点绘制在深圳的高程图上,图3中给出了站点B附近的最近的4个观测站,由近到远排序依次是站点A、C、D、E。第一次对站点A进行筛选,图2中可以看出,站点A距离站点B最近,但其与站点B在山体的不同侧,不能作为站点B的降雨填补参考站点,所以剔除掉站点A;第二次对站点C进行筛选,站点C与站点B在山体一侧,则保留站点C作为站点B数据填补的第一降雨填补参考站点;第三次对站点D进行筛选,站点D与站点B在山体一侧,则保留站点D作为站点B数据填补的第二降雨填补参考站点;第四次对站点E进行筛选,以此类推得到站点B同侧的3个站点作为降雨填补参考站,且距离由近到远排序为C、D、E。
第一数据填补模块:用于根据待填补站点的降雨数据缺失时刻信息,按照k个降雨填补参考站点的筛选排序结果依次对待填补站点进行降雨数据填补;其中,降雨数据填补具体为:根据步骤300中的筛选结果,如果站点B的降雨数据有缺失,则根据降雨数据缺失时刻信息,首先利用站点C的降雨数据对站点B进行第一次填补,如果填补后仍有缺失再利用站点D的降雨数据对站点B进行第二次填补,无缺失则填补结束,以此类推得到3次填补后的B站点的降雨数据。每填补一次则对待填补站点进行一次数据缺失检验,判断是否填补完整,如果填补完整,则停止填补;否则通过下一个降雨填补参考站的降雨数据对待填补站点进入下一次填补,直到k个降雨填补参考站点全部利用结束。
第二数据填补模块:用于判断待填补站点填补后的降雨数据是否完整,如果仍不完整,利用地区内代表性站点或者扩大k值再次对待填补站点进行降雨数据填补,直到得到填补完整的降雨数据;其中,各地区代表性站点的降雨数据都是相对完整的,例如深圳地区,国家基准站59493的数据相对完整,可以充分利用国家基本站数据对待填补站点缺失的降雨数据做最后填补,或者通过站点筛选模块扩大k值(即增加降雨填补参考站点的数量)继续进行填充,直到得到完整的降雨数据。
本申请已通过深圳地区降雨小时数据缺失的有效测试,经实际情况的对比发现,本申请可以精确地填补缺失的降雨数据。
图5是本申请实施例提供的降雨缺失数据填补方法的硬件设备结构示意图。如图5所示,该设备包括一个或多个处理器以及存储器。以一个处理器为例,该设备还可以包括:输入系统和输出系统。
处理器、存储器、输入系统和输出系统可以通过总线或者其他方式连接,图5中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例的处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入系统可接收输入的数字或字符信息,以及产生信号输入。输出系统可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个处理器执行时,执行上述任一方法实施例的以下操作:
步骤a:根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
步骤b:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
步骤c:根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例提供的方法。
本申请实施例提供了一种非暂态(非易失性)计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行以下操作:
步骤a:根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
步骤b:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
步骤c:根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
本申请实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行以下操作:
步骤a:根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
步骤b:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
步骤c:根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
本申请实施例的降雨缺失数据填补方法、系统及电子设备首次提出了一种基于高程信息的降雨缺失数据临近填补方法,基于高程信息和距离筛选出与待填补站点位于山体同侧且距离最近的k个邻近站点,对待填补站点进行k次降雨数据填补。在数据填补的过程中主要考虑了降雨天气现象本身固有的属性,比如地形状况对降雨的影响,降雨现象出现的随机性,其次也充分利用了周边站点的信息,使得填补后的数据相比大多统计算法更加准确,改善现阶段降雨数据填补的精确度,对气象研究工作者获取完整的降雨数据以及气象大数据应用具有重要意义。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。
Claims (11)
1.一种降雨缺失数据填补方法,其特征在于,包括以下步骤:
步骤a:根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
步骤b:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
步骤c:根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
2.根据权利要求1所述的降雨缺失数据填补方法,其特征在于,在所述步骤a中,所述距离计算公式为:
上述公式中,θ1,θ2是两个站点经度的弧度制表示,Δλ是两个站点纬度差值的弧度制表示,a是中间变量,R=6371km是地球半径的平均值,d是两个站点的距离。
3.根据权利要求1所述的降雨缺失数据填补方法,其特征在于,在所述步骤b中,所述基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点具体为:根据所述临近站点的距离排序结果,首先判定第一临近站点与待填补站点是否位于山体同一侧,如果第一临近站点与待填补站点位于山体同一侧,则将第一临近站点作为待填补站点的第一降雨填补参考站;如果第一临近站点与待填补站点不在山体同一侧,则剔除该第一临近站点,并进行第二临近站点的筛选,直到筛选出与待填补站点位于山体同一侧且距离最近的k个降雨填补参考站。
4.根据权利要求3所述的降雨缺失数据填补方法,其特征在于,所述步骤a还包括:统计待填补站点预定时间内的降雨数据缺失时刻信息;所述步骤c中,所述根据至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补具体为:根据待填补站点的降雨数据缺失时刻信息,按照k个降雨填补参考站点的筛选排序结果依次对待填补站点进行降雨数据填补。
5.根据权利要求4所述的降雨缺失数据填补方法,其特征在于,所述步骤c后还包括:判断所述待填补站点填补后的降雨数据是否完整,如果仍不完整,利用地区内代表性站点或者扩大k值再次对待填补站点进行降雨数据填补,直到得到填补完整的降雨数据。
6.一种降雨缺失数据填补系统,其特征在于,包括:
距离计算模块:用于根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
站点筛选模块:用于基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
第一数据填补模块:用于根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
7.根据权利要求6所述的降雨缺失数据填补系统,其特征在于,所述距离计算公式为:
上述公式中,θ1,θ2是两个站点经度的弧度制表示,Δλ是两个站点纬度差值的弧度制表示,a是中间变量,R=6371km是地球半径的平均值,d是两个站点的距离。
8.根据权利要求6所述的降雨缺失数据填补系统,其特征在于,所述站点筛选模块基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点具体为:根据所述临近站点的距离排序结果,首先判定第一临近站点与待填补站点是否位于山体同一侧,如果第一临近站点与待填补站点位于山体同一侧,则将第一临近站点作为待填补站点的第一降雨填补参考站;如果第一临近站点与待填补站点不在山体同一侧,则剔除该第一临近站点,并进行第二临近站点的筛选,直到筛选出与待填补站点位于山体同一侧且距离最近的k个降雨填补参考站。
9.根据权利要求8所述的降雨缺失数据填补系统,其特征在于,还包括时刻统计模块,所述时刻统计模块用于统计待填补站点预定时间内的降雨数据缺失时刻信息;所述第一数据填补模块根据至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补具体为:根据待填补站点的降雨数据缺失时刻信息,按照k个降雨填补参考站点的筛选排序结果依次对待填补站点进行降雨数据填补。
10.根据权利要求9所述的降雨缺失数据填补系统,其特征在于,还包括第二数据填补模块,所述第二数据填补模块用于判断所述待填补站点填补后的降雨数据是否完整,如果仍不完整,利用地区内代表性站点或者扩大k值再次对待填补站点进行降雨数据填补,直到得到填补完整的降雨数据。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述1至5任一项所述的降雨缺失数据填补方法的以下操作:
步骤a:根据经纬度信息计算待填补站点与各个临近站点之间的距离,并根据距离计算结果对各个临近站点进行由近至远的排序;
步骤b:基于地区的高程信息,根据各个临近站点的距离排序结果依次对各个临近站点进行筛选,确定至少一个临近站点作为待填补站点的降雨填补参考站点;
步骤c:根据所述至少一个降雨填补参考站点的降雨数据对待填补站点进行降雨数据填补。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910373908.XA CN110134907B (zh) | 2019-05-07 | 2019-05-07 | 一种降雨缺失数据填补方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910373908.XA CN110134907B (zh) | 2019-05-07 | 2019-05-07 | 一种降雨缺失数据填补方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110134907A true CN110134907A (zh) | 2019-08-16 |
CN110134907B CN110134907B (zh) | 2024-02-09 |
Family
ID=67576448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910373908.XA Active CN110134907B (zh) | 2019-05-07 | 2019-05-07 | 一种降雨缺失数据填补方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110134907B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110657798A (zh) * | 2019-09-11 | 2020-01-07 | 广州海洋地质调查局 | 一种地磁日变数据补缺方法及处理终端 |
CN111443163A (zh) * | 2020-03-10 | 2020-07-24 | 中国科学院深圳先进技术研究院 | 一种臭氧缺失数据的插补方法、装置及插补设备 |
CN113377750A (zh) * | 2021-05-19 | 2021-09-10 | 山东大学 | 水文数据清洗方法及系统 |
CN113468152A (zh) * | 2021-06-04 | 2021-10-01 | 国网上海市电力公司 | 高频用户用电数据清洗方法、系统、设备及存储介质 |
CN115166862A (zh) * | 2022-07-14 | 2022-10-11 | 华云升达(北京)气象科技有限责任公司 | 一种智能观测气象站 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819677A (zh) * | 2012-07-30 | 2012-12-12 | 河海大学 | 基于单场降雨类型的降雨站点相似性评价方法 |
CN107679644A (zh) * | 2017-08-28 | 2018-02-09 | 河海大学 | 一种基于降雨类型特征的站点雨量资料插补方法 |
-
2019
- 2019-05-07 CN CN201910373908.XA patent/CN110134907B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819677A (zh) * | 2012-07-30 | 2012-12-12 | 河海大学 | 基于单场降雨类型的降雨站点相似性评价方法 |
CN107679644A (zh) * | 2017-08-28 | 2018-02-09 | 河海大学 | 一种基于降雨类型特征的站点雨量资料插补方法 |
Non-Patent Citations (3)
Title |
---|
原立峰等: "鄱阳湖流域近49年降雨序列一致性检验与分析", 《安徽农业科学》 * |
原立峰等: "鄱阳湖流域近49年降雨序列一致性检验与分析", 《安徽农业科学》, no. 02, 10 January 2013 (2013-01-10), pages 732 - 735 * |
陈举, 施平, 杜岩: "南海及其邻近地区几种常用降雨产品的相互比较", 热带海洋学报, no. 06, pages 40 - 51 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110657798A (zh) * | 2019-09-11 | 2020-01-07 | 广州海洋地质调查局 | 一种地磁日变数据补缺方法及处理终端 |
CN111443163A (zh) * | 2020-03-10 | 2020-07-24 | 中国科学院深圳先进技术研究院 | 一种臭氧缺失数据的插补方法、装置及插补设备 |
CN113377750A (zh) * | 2021-05-19 | 2021-09-10 | 山东大学 | 水文数据清洗方法及系统 |
CN113468152A (zh) * | 2021-06-04 | 2021-10-01 | 国网上海市电力公司 | 高频用户用电数据清洗方法、系统、设备及存储介质 |
CN115166862A (zh) * | 2022-07-14 | 2022-10-11 | 华云升达(北京)气象科技有限责任公司 | 一种智能观测气象站 |
Also Published As
Publication number | Publication date |
---|---|
CN110134907B (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110134907A (zh) | 一种降雨缺失数据填补方法、系统及电子设备 | |
Sakieh et al. | Simulating urban expansion and scenario prediction using a cellular automata urban growth model, SLEUTH, through a case study of Karaj City, Iran | |
CN108876027B (zh) | 一种基于gis的农村居民点集中居住区选址和优化方法 | |
Ariza-Villaverde et al. | Multifractal analysis of axial maps applied to the study of urban morphology | |
Lumsden et al. | Evaluation of potential changes in hydrologically relevant statistics of rainfall in Southern Africa under conditions of climate change | |
CN106780089B (zh) | 基于神经网络元胞自动机模型的永久性基本农田划定方法 | |
Yeganeh-Bakhtiary et al. | Machine learning as a downscaling approach for prediction of wind characteristics under future climate change scenarios | |
CN110390343B (zh) | 一种空间气象数据的订正方法及系统 | |
CN108632832B (zh) | 网络覆盖分析方法及系统 | |
CN113435630B (zh) | 一种产流模式自适应的流域水文预报方法及系统 | |
Folorunsho et al. | Application of adaptive neuro fuzzy inference system (Anfis) in River kaduna discharge forecasting | |
Ma et al. | Seasonal drought predictability and forecast skill in the semi-arid endorheic Heihe River basin in northwestern China | |
CN110837911B (zh) | 一种大尺度地表节肢动物空间分布模拟方法 | |
CN111222662A (zh) | 一种电网台风洪涝灾害预警方法和装置 | |
CN117332291A (zh) | 一种面向分布式光伏的区域资源监测布局方法及系统 | |
Cui et al. | Bayesian optimization of typhoon full-track simulation on the Northwestern Pacific segmented by QuadTree decomposition | |
Sarhadi et al. | Flood seasonality‐based regionalization methods: a data‐based comparison | |
CN116227362A (zh) | 一种基于图与深度学习的市政排水管网状态预测方法 | |
Deepthi et al. | Performance assessment of general circulation models: application of compromise programming method and global performance indicator technique | |
CN109995549B (zh) | 一种评估流量价值的方法及装置 | |
CN112541047A (zh) | 一种适用于多级网格化管理系统的海量数据聚合方法 | |
CN116151437A (zh) | 一种浅层崩塌灾害预警模型建立方法、装置、设备及介质 | |
Kyselý et al. | Return periods of the August 2010 heavy precipitation in northern Bohemia (Czech Republic) in the present climate and under climate change | |
CN114818857A (zh) | 一种积雪深度融合方法 | |
Goodarzi et al. | Assessment of climate change using SDSM downscaling Model (A case study: West of Iran) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |