CN113742929A - 一种针对格点气象实况的数据质量评价方法 - Google Patents
一种针对格点气象实况的数据质量评价方法 Download PDFInfo
- Publication number
- CN113742929A CN113742929A CN202111049598.XA CN202111049598A CN113742929A CN 113742929 A CN113742929 A CN 113742929A CN 202111049598 A CN202111049598 A CN 202111049598A CN 113742929 A CN113742929 A CN 113742929A
- Authority
- CN
- China
- Prior art keywords
- data
- meteorological
- standard
- point
- grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 11
- 238000007689 inspection Methods 0.000 claims abstract description 21
- 238000011157 data evaluation Methods 0.000 claims abstract description 12
- 230000000737 periodic effect Effects 0.000 claims abstract description 5
- 238000011156 evaluation Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 abstract description 3
- 238000001556 precipitation Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于气象数据评价技术领域,具体涉及一种针对格点气象实况的数据质量评价方法。本发明提出了一套格点气象实况数据评价指标体系,包括数据的周期性检验,趋势性检验,相似性检验以及差异性分析;并提出了从数据获取,数据清洗,数据评价指标体系建立到格点气象实况数据评价的全流程实现,为后续格点气象实况数据的应用提供了数据支撑。
Description
技术领域
本发明属于气象数据评价技术领域,具体涉及一种针对格点气象实况的数据质量评价方法。
背景技术
随着气象数据在各行各业的广泛应用,如交通运输、新能源、农业、移动互联软件开发和服务、智慧城市、智慧交通、智慧粮食等领域,各行业对时空连续的栅格气象数据产品要求越来越高。其中,格点数据指的是将空间分割成有规律的网格,每一个网格称为一个单元,并在各单元上赋予相应的属性值来表示实体的一种数据形式。在实际应用中,尤其是现场作业,偶有反应格点气象实况数据和实际不符,因此本发明以地面自动站观测数据为标准,实现对格点气象实况数据的评价方法。
对于格点气象实况数据,目前更多是数据的生成、存储以及数据的应用。对于气象评价,基本上是双套地面自动站的气象数据差异分析或者自动站和人工观测数据的差异分析,在差异分析技术上,选择的是每年数据对比,每月数据对比,以及差值的一致率、粗差率等。综上所述,目前的技术领域缺乏针对格点气象实况的数据质量评价。
发明内容
本发明提供了针对格点气象实况的数据质量评价方法,包括:数据获取,数据清洗,数据评价指标体系建立,格点气象实况数据质量评价。
为实现上述目的,本发明采用如下技术方案:
一种针对格点气象实况的数据质量评价方法,如图1所示,包括以下步骤:
S1、获取标准气象数据和格点气象实况数据;
S2、对步骤S1获取到的数据进行预处理,包括数据重复性检查、界限值检查、极值检查、时间一致性检查和空间一致性检查,通过预处理消除错误数据后,将得到的标准气象数据和格点气象实况数据进行时空上的近邻匹配,获得时空匹配后的数据,同时对匹配后的数据按照标准气象数据的位置信息标记不同的点位;
S3、构建数据评价指标体系,包括:
1)周期性:以时间序列的周期T为分割点,对序列进行分割;对长度是n的序列,分割后就得到n/T个单元,比较这n/T个单元的相似度,如果满足设定的相似度,则说明具有周期性,如果不是,则不具有周期性;
2)趋势性:包括同比和环比,同比是为了消除数据周期性波动的影响,将本周期的数据Xt与之前周期中相同时间点的数据Xt+nT进行比较:
其中,T表示周期,n表示周期数;
环比是将本周期的数据与上一期的数据进行对比,反应的是数据连续变化的趋势:
其中,Δt表示时间差;
3)相似性:通过Pearson系数判断相似性
设对比差值标准差为σ,σ反映了标准数据和格点气象实况数据之间偏差的离散程度,则有:
S4、采用步骤S3的评价体系,依次对步骤S2获得的时空匹配后的数据按照标记的点位进行评价,同时对每个点位的评价是按照每个气象要素逐一进行评价,对一个点位一个气象像素的评价方法为:
S41、对所选点位的标准数据和格点气象实况数据中的一个气象要素分别根据S3中的方法计算出对应的周期,比较得到的两个周期是否一致,如果周期一致,进入S42,周期不一致则直接进入S43;
S42、根据周期,分别计算该点位的标准数据和格点气象实况数据中气象要素的同比和环比,比较同比、环比的正负是否一致,如果正负一致则表示两类数据的变化趋势相同,进入S43;如果正负不一致,进入S44;
S43、计算该点位标准数据和格点气象实况数据中气象要素的Pearson系数,该值越接近1,表示两种来源的气象要素A1的数据相似度越高;
S44、计算该点位的标准数据和格点气象实况数据中气象要素差值的平均值、标准差、一致率、粗差率,并和阈值进行比较,如果在阈值范围内表示该点位附近的格点气象实况数据中气象要素接近标准数据;如果超过阈值,则认为远离标准数据;
重复步骤S4直至完成对所有点位所有气象要素的评价,得到质量评价结论。
本发明的有益效果为,本发明提出了一套格点气象实况数据评价指标体系,包括数据的周期性检验,趋势性检验,相似性检验以及差异性分析;并提出了从数据获取,数据清洗,数据评价指标体系建立到格点气象实况数据评价的全流程实现,为后续格点气象实况数据的应用提供了数据支撑。
附图说明
图1为本发明的逻辑顺序示意图;
具体实施方式
下面对本发明的方案进行进一步的描述:
本发明的详细步骤为:
S1、获取标准气象数据和格点气象实况数据;标准数据的获取,可选择的数据来源包括地面气象站、卫星、雷达以及人工观测数据,其中地面气象站的观测数据从获取方式、数据量、覆盖范围方面更有优势,因此选择地面气象站的观测数据作为标准数据,通过网络或者购买获取该数据。其中,数据字段有气象站位置信息(经纬度),气象要素(风速、温度、湿度、降水),数据更新时间。格点气象实况数据,指多源气象数据融合生成的格点实况数据。其中,数据字段有经纬度,气象要素(风速、温度、湿度、降水),数据更新时间。
S2、对步骤S1获取到的数据进行预处理,包括数据重复性检查、界限值检查、极值检查、时间一致性检查和空间一致性检查,通过预处理消除错误数据后,将得到的标准气象数据和格点气象实况数据进行时空上的近邻匹配,获得时空匹配后的数据,同时对匹配后的数据按照标准气象数据的位置信息标记不同的点位;
本步骤用于数据清洗,即通过某些方法对数据中的错误数据进行检查和消除。其中,数据重复性检查,指数据没有重复数据;界限值检查,指数据必须在界限值之内的检查。界限值这里特指从气候学的角度不可能发生的值;极值检查,指数据是否超过极值的检查。极值是指在某个固定地点的某个的时间段内出现概率很小或不可能出现的气象数据;时间一致性检查,指一定时间范围内,同一位置的气候数据变化具有特定的规律;空间一致性检查,指在一个地区内,气象要素分布的地理空间具有相关性。空间距离近的气象观测站比距离较远的具有更大的相关性;数据时空匹配,标准数据和格点气象实况数据的时间、空间并未完全对齐,为便于后续分析,需要对数据进行时间和空间的近邻匹配。为了后续分析,对匹配后的数据按照标准数据的位置信息标记不同的点位A,B,C,……;
S3、构建数据评价指标体系,包括:
1)周期性:以时间序列的周期T为分割点,对序列进行分割;对长度是n的序列,分割后就得到n/T个单元,比较这n/T个单元的相似度,如果满足设定的相似度,则说明具有周期性,如果不是,则不具有周期性;
2)趋势性:包括同比和环比,同比是为了消除数据周期性波动的影响,将本周期的数据Xt与之前周期中相同时间点的数据Xt+nT进行比较:
其中,T表示周期,n表示周期数;
环比是将本周期的数据与上一期的数据进行对比,反应的是数据连续变化的趋势:
其中,Δt表示时间差;
3)相似性:通过Pearson系数判断相似性
设对比差值标准差为σ,σ反映了标准数据和格点气象实况数据之间偏差的离散程度,则有:
粗差率反映了标准数据和格点气象实况数据异常值的多寡,当时,视为粗差;粗差次数计算方法:先根据全部数据计算σ,逐个检查对比差值,若有时,剔除其中一个最大者,再按计算标准差的公式计算新的σ,若还有差值者,再剔除其中的一个最大者,然后计算新的σ,直到无数据需要剔除为止;
S4、采用步骤S3的评价体系,依次对步骤S2获得的时空匹配后的数据按照标记的点位进行评价,由于S3中的各评价指标都是针对某一固定点位的某一气象要素设计的,因此本步骤中选择点位A和气象要素A1(A1可以选择风速、温度、湿度、降水等)进行评价:
S41、对点位A的标准数据和格点气象实况数据中的气象要素A1分别根据S3中的方法计算出对应的周期TXA1,TYA1,比较周期是否一致,如果周期一致,进入S42,周期不一致则直接进入S43;
S42、根据周期,分别计算点位A的标准数据和格点气象实况数据中气象要素A1的同比和环比,比较同比、环比的正负是否一致,如果正负一致则表示两类数据的变化趋势相同,进入S43;如果正负不一致,需要进一步分析不一致的原因,可以直接进入S44;
S43、计算点位A标准数据和格点气象实况数据中气象要素A1的Pearson系数,该值越接近1,表示两种来源的气象要素A1的数据相似度越高;
S44、计算点位A的标准数据和格点气象实况数据中气象要素A1差值的平均值、标准差、一致率、粗差率,并和阈值进行比较,如果在阈值范围内表示点位A附近的格点气象实况数据中气象要素A1接近标准数据;如果超过阈值,需要进一步分析超过的原因,是否是客观原因,比如不同海拔温度会有差距,迎风坡和背风坡的风速会有差距;
重复以上步骤,对点位A的其他气象要素和其他点位的气象要素进行评价,并得出最终的评价结果。
格点气象数据评价过程中,可能会出现位置相近但是地理环境有差异的情况,比如距离很近但是海拔不同,温度可能会相差较大,但是周期性和趋势性一致。因此,本发明在进行差异分析之前,对数据的周期性、趋势性、相似性分析给出了明确的方法。
Claims (1)
1.一种针对格点气象实况的数据质量评价方法,其特征在于,包括以下步骤:
S1、获取标准气象数据和格点气象实况数据;
S2、对步骤S1获取到的数据进行预处理,包括数据重复性检查、界限值检查、极值检查、时间一致性检查和空间一致性检查,通过预处理消除错误数据后,将得到的标准气象数据和格点气象实况数据进行时空上的近邻匹配,获得时空匹配后的数据,同时对匹配后的数据按照标准气象数据的位置信息标记不同的点位;
S3、构建数据评价指标体系,包括:
1)周期性:以时间序列的周期T为分割点,对序列进行分割;对长度是n的序列,分割后就得到n/T个单元,比较这n/T个单元的相似度,如果满足设定的相似度,则说明具有周期性,如果不是,则不具有周期性;
2)趋势性:包括同比和环比,同比是为了消除数据周期性波动的影响,将本周期的数据Xt与之前周期中相同时间点的数据Xt+nT进行比较:
其中,T表示周期,n表示周期数;
环比是将本周期的数据与上一期的数据进行对比,反应的是数据连续变化的趋势:
其中,Δt表示时间差;
3)相似性:通过Pearson系数判断相似性
设对比差值标准差为σ,σ反映了标准数据和格点气象实况数据之间偏差的离散程度,则有:
S4、采用步骤S3的评价体系,依次对步骤S2获得的时空匹配后的数据按照标记的点位进行评价,同时对每个点位的评价是按照每个气象要素逐一进行评价,对一个点位一个气象像素的评价方法为:
S41、对所选点位的标准数据和格点气象实况数据中的一个气象要素分别根据S3中的方法计算出对应的周期,比较得到的两个周期是否一致,如果周期一致,进入S42,周期不一致则直接进入S43;
S42、根据周期,分别计算该点位的标准数据和格点气象实况数据中气象要素的同比和环比,比较同比、环比的正负是否一致,如果正负一致则表示两类数据的变化趋势相同,进入S43;如果正负不一致,进入S44;
S43、计算该点位标准数据和格点气象实况数据中气象要素的Pearson系数,该值越接近1,表示两种来源的气象要素A1的数据相似度越高;
S44、计算该点位的标准数据和格点气象实况数据中气象要素差值的平均值、标准差、一致率、粗差率,并和阈值进行比较,如果在阈值范围内表示该点位附近的格点气象实况数据中气象要素接近标准数据;如果超过阈值,则认为远离标准数据;
重复步骤S4直至完成对所有点位所有气象要素的评价,得到质量评价结论。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111049598.XA CN113742929B (zh) | 2021-09-08 | 2021-09-08 | 一种针对格点气象实况的数据质量评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111049598.XA CN113742929B (zh) | 2021-09-08 | 2021-09-08 | 一种针对格点气象实况的数据质量评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113742929A true CN113742929A (zh) | 2021-12-03 |
CN113742929B CN113742929B (zh) | 2024-01-26 |
Family
ID=78737003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111049598.XA Active CN113742929B (zh) | 2021-09-08 | 2021-09-08 | 一种针对格点气象实况的数据质量评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113742929B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115759416A (zh) * | 2022-11-21 | 2023-03-07 | 四川省气象探测数据中心 | 一种网格实况产品的评估分析方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100989845B1 (ko) * | 2010-04-29 | 2010-10-29 | 서울대학교산학협력단 | 특이기상 변화 추정 방법 |
CN107367773A (zh) * | 2017-03-14 | 2017-11-21 | 北京维艾思气象信息科技有限公司 | 一种基于北斗定位的单点气象要素确定方法 |
KR20180116507A (ko) * | 2017-04-14 | 2018-10-25 | 동국대학교 산학협력단 | 기상 자료 분석 장치 및 방법 |
CN110390343A (zh) * | 2018-04-16 | 2019-10-29 | 中国电力科学研究院有限公司 | 一种空间气象数据的订正方法及系统 |
CN110555554A (zh) * | 2019-08-28 | 2019-12-10 | 向波 | 一种基于客观定量化的智能气候预测技术 |
CN113159714A (zh) * | 2021-04-01 | 2021-07-23 | 国网河南省电力公司电力科学研究院 | 一种面向电网的气象数据订正方法 |
-
2021
- 2021-09-08 CN CN202111049598.XA patent/CN113742929B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100989845B1 (ko) * | 2010-04-29 | 2010-10-29 | 서울대학교산학협력단 | 특이기상 변화 추정 방법 |
CN107367773A (zh) * | 2017-03-14 | 2017-11-21 | 北京维艾思气象信息科技有限公司 | 一种基于北斗定位的单点气象要素确定方法 |
KR20180116507A (ko) * | 2017-04-14 | 2018-10-25 | 동국대학교 산학협력단 | 기상 자료 분석 장치 및 방법 |
CN110390343A (zh) * | 2018-04-16 | 2019-10-29 | 中国电力科学研究院有限公司 | 一种空间气象数据的订正方法及系统 |
CN110555554A (zh) * | 2019-08-28 | 2019-12-10 | 向波 | 一种基于客观定量化的智能气候预测技术 |
CN113159714A (zh) * | 2021-04-01 | 2021-07-23 | 国网河南省电力公司电力科学研究院 | 一种面向电网的气象数据订正方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115759416A (zh) * | 2022-11-21 | 2023-03-07 | 四川省气象探测数据中心 | 一种网格实况产品的评估分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113742929B (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112905560B (zh) | 一种多源时空大数据深度融合的空气污染预测方法 | |
CN113919231B (zh) | 基于时空图神经网络的pm2.5浓度时空变化预测方法及系统 | |
CN111242404B (zh) | 一种强降雨诱发洪灾事件的极端性评估方法及系统 | |
CN113743013A (zh) | 一种基于XGBoost气温预测数据修正的方法 | |
KR101908865B1 (ko) | 기온 측정 자료의 품질 분석방법 | |
CN110134907B (zh) | 一种降雨缺失数据填补方法、系统及电子设备 | |
CN111401602A (zh) | 基于神经网络的卫星以及地面降水测量值同化方法 | |
CN110826689A (zh) | 一种基于深度学习的预测县级单位时序gdp的方法 | |
CN114298162A (zh) | 融合卫星雷达多源数据的降水质量控制与评估方法及应用 | |
CN114936201A (zh) | 基于自适应分块神经网络模型的卫星降水数据校正方法 | |
CN113704693A (zh) | 一种高精度的有效波高数据估计方法 | |
Tsakiris et al. | Regional drought identification and assessment. Case study in Crete | |
CN115861845A (zh) | 一种湿地监测方法及系统 | |
CN116449331A (zh) | 一种基于w波段雷达和气象卫星的沙尘粒子数浓度估算方法 | |
CN116415730A (zh) | 一种预测水位的融合自注意力机制时空深度学习模型 | |
CN115994685A (zh) | 一种国土空间规划现状评估方法 | |
CN113742929B (zh) | 一种针对格点气象实况的数据质量评价方法 | |
CN116432032A (zh) | 基于多源数据和机器学习的气象数据异常事件识别方法 | |
CN108957594B (zh) | 一种商遥卫星轨道总云量预报修正方法及修正系统 | |
CN115236770B (zh) | 基于时空堆叠和样本重构的非线性短时临近降水预报方法 | |
CN113610436A (zh) | 一种承灾体动态脆弱性评估方法及系统 | |
CN116663432B (zh) | 一种百米高度风速预报订正降尺度方法及装置 | |
Dabrowski et al. | Quality Control in Weather Monitoring with Dynamic Linear Models | |
CN116823067B (zh) | 管网水质清污状态的确定方法、装置及电子设备 | |
CN112990701B (zh) | 一种基于eof的自动站温度资料质量控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |