CN113742929A - 一种针对格点气象实况的数据质量评价方法 - Google Patents

一种针对格点气象实况的数据质量评价方法 Download PDF

Info

Publication number
CN113742929A
CN113742929A CN202111049598.XA CN202111049598A CN113742929A CN 113742929 A CN113742929 A CN 113742929A CN 202111049598 A CN202111049598 A CN 202111049598A CN 113742929 A CN113742929 A CN 113742929A
Authority
CN
China
Prior art keywords
data
meteorological
standard
point
grid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111049598.XA
Other languages
English (en)
Other versions
CN113742929B (zh
Inventor
徐珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Cap Data Service Co ltd
Original Assignee
Chengdu Cap Data Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Cap Data Service Co ltd filed Critical Chengdu Cap Data Service Co ltd
Priority to CN202111049598.XA priority Critical patent/CN113742929B/zh
Publication of CN113742929A publication Critical patent/CN113742929A/zh
Application granted granted Critical
Publication of CN113742929B publication Critical patent/CN113742929B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于气象数据评价技术领域,具体涉及一种针对格点气象实况的数据质量评价方法。本发明提出了一套格点气象实况数据评价指标体系,包括数据的周期性检验,趋势性检验,相似性检验以及差异性分析;并提出了从数据获取,数据清洗,数据评价指标体系建立到格点气象实况数据评价的全流程实现,为后续格点气象实况数据的应用提供了数据支撑。

Description

一种针对格点气象实况的数据质量评价方法
技术领域
本发明属于气象数据评价技术领域,具体涉及一种针对格点气象实况的数据质量评价方法。
背景技术
随着气象数据在各行各业的广泛应用,如交通运输、新能源、农业、移动互联软件开发和服务、智慧城市、智慧交通、智慧粮食等领域,各行业对时空连续的栅格气象数据产品要求越来越高。其中,格点数据指的是将空间分割成有规律的网格,每一个网格称为一个单元,并在各单元上赋予相应的属性值来表示实体的一种数据形式。在实际应用中,尤其是现场作业,偶有反应格点气象实况数据和实际不符,因此本发明以地面自动站观测数据为标准,实现对格点气象实况数据的评价方法。
对于格点气象实况数据,目前更多是数据的生成、存储以及数据的应用。对于气象评价,基本上是双套地面自动站的气象数据差异分析或者自动站和人工观测数据的差异分析,在差异分析技术上,选择的是每年数据对比,每月数据对比,以及差值的一致率、粗差率等。综上所述,目前的技术领域缺乏针对格点气象实况的数据质量评价。
发明内容
本发明提供了针对格点气象实况的数据质量评价方法,包括:数据获取,数据清洗,数据评价指标体系建立,格点气象实况数据质量评价。
为实现上述目的,本发明采用如下技术方案:
一种针对格点气象实况的数据质量评价方法,如图1所示,包括以下步骤:
S1、获取标准气象数据和格点气象实况数据;
S2、对步骤S1获取到的数据进行预处理,包括数据重复性检查、界限值检查、极值检查、时间一致性检查和空间一致性检查,通过预处理消除错误数据后,将得到的标准气象数据和格点气象实况数据进行时空上的近邻匹配,获得时空匹配后的数据,同时对匹配后的数据按照标准气象数据的位置信息标记不同的点位;
S3、构建数据评价指标体系,包括:
1)周期性:以时间序列的周期T为分割点,对序列进行分割;对长度是n的序列,分割后就得到n/T个单元,比较这n/T个单元的相似度,如果满足设定的相似度,则说明具有周期性,如果不是,则不具有周期性;
2)趋势性:包括同比和环比,同比是为了消除数据周期性波动的影响,将本周期的数据Xt与之前周期中相同时间点的数据Xt+nT进行比较:
Figure BDA0003252268680000021
其中,T表示周期,n表示周期数;
环比是将本周期的数据与上一期的数据进行对比,反应的是数据连续变化的趋势:
Figure BDA0003252268680000022
其中,Δt表示时间差;
3)相似性:通过Pearson系数判断相似性
Figure BDA0003252268680000023
其中,
Figure BDA0003252268680000024
T表示周期
4)差异性:包括差值及平均值、差值标准差、一致率和粗差率;设时空匹配后的数据有效样本数为N,X为标准数据,Y为格点气象实况数据,则差值ZN及其平均值
Figure BDA0003252268680000025
为:
Figure BDA0003252268680000026
设对比差值标准差为σ,σ反映了标准数据和格点气象实况数据之间偏差的离散程度,则有:
Figure BDA0003252268680000027
一致率表示标准数据和格点气象实况数据相一致的程度,将对比差值小于等于标准差的2倍的即认为一致,
Figure BDA0003252268680000028
粗差率反映了标准数据和格点气象实况数据异常值的多寡,当
Figure BDA0003252268680000029
时,视为粗差;
S4、采用步骤S3的评价体系,依次对步骤S2获得的时空匹配后的数据按照标记的点位进行评价,同时对每个点位的评价是按照每个气象要素逐一进行评价,对一个点位一个气象像素的评价方法为:
S41、对所选点位的标准数据和格点气象实况数据中的一个气象要素分别根据S3中的方法计算出对应的周期,比较得到的两个周期是否一致,如果周期一致,进入S42,周期不一致则直接进入S43;
S42、根据周期,分别计算该点位的标准数据和格点气象实况数据中气象要素的同比和环比,比较同比、环比的正负是否一致,如果正负一致则表示两类数据的变化趋势相同,进入S43;如果正负不一致,进入S44;
S43、计算该点位标准数据和格点气象实况数据中气象要素的Pearson系数,该值越接近1,表示两种来源的气象要素A1的数据相似度越高;
S44、计算该点位的标准数据和格点气象实况数据中气象要素差值的平均值、标准差、一致率、粗差率,并和阈值进行比较,如果在阈值范围内表示该点位附近的格点气象实况数据中气象要素接近标准数据;如果超过阈值,则认为远离标准数据;
重复步骤S4直至完成对所有点位所有气象要素的评价,得到质量评价结论。
本发明的有益效果为,本发明提出了一套格点气象实况数据评价指标体系,包括数据的周期性检验,趋势性检验,相似性检验以及差异性分析;并提出了从数据获取,数据清洗,数据评价指标体系建立到格点气象实况数据评价的全流程实现,为后续格点气象实况数据的应用提供了数据支撑。
附图说明
图1为本发明的逻辑顺序示意图;
具体实施方式
下面对本发明的方案进行进一步的描述:
本发明的详细步骤为:
S1、获取标准气象数据和格点气象实况数据;标准数据的获取,可选择的数据来源包括地面气象站、卫星、雷达以及人工观测数据,其中地面气象站的观测数据从获取方式、数据量、覆盖范围方面更有优势,因此选择地面气象站的观测数据作为标准数据,通过网络或者购买获取该数据。其中,数据字段有气象站位置信息(经纬度),气象要素(风速、温度、湿度、降水),数据更新时间。格点气象实况数据,指多源气象数据融合生成的格点实况数据。其中,数据字段有经纬度,气象要素(风速、温度、湿度、降水),数据更新时间。
S2、对步骤S1获取到的数据进行预处理,包括数据重复性检查、界限值检查、极值检查、时间一致性检查和空间一致性检查,通过预处理消除错误数据后,将得到的标准气象数据和格点气象实况数据进行时空上的近邻匹配,获得时空匹配后的数据,同时对匹配后的数据按照标准气象数据的位置信息标记不同的点位;
本步骤用于数据清洗,即通过某些方法对数据中的错误数据进行检查和消除。其中,数据重复性检查,指数据没有重复数据;界限值检查,指数据必须在界限值之内的检查。界限值这里特指从气候学的角度不可能发生的值;极值检查,指数据是否超过极值的检查。极值是指在某个固定地点的某个的时间段内出现概率很小或不可能出现的气象数据;时间一致性检查,指一定时间范围内,同一位置的气候数据变化具有特定的规律;空间一致性检查,指在一个地区内,气象要素分布的地理空间具有相关性。空间距离近的气象观测站比距离较远的具有更大的相关性;数据时空匹配,标准数据和格点气象实况数据的时间、空间并未完全对齐,为便于后续分析,需要对数据进行时间和空间的近邻匹配。为了后续分析,对匹配后的数据按照标准数据的位置信息标记不同的点位A,B,C,……;
S3、构建数据评价指标体系,包括:
1)周期性:以时间序列的周期T为分割点,对序列进行分割;对长度是n的序列,分割后就得到n/T个单元,比较这n/T个单元的相似度,如果满足设定的相似度,则说明具有周期性,如果不是,则不具有周期性;
2)趋势性:包括同比和环比,同比是为了消除数据周期性波动的影响,将本周期的数据Xt与之前周期中相同时间点的数据Xt+nT进行比较:
Figure BDA0003252268680000041
其中,T表示周期,n表示周期数;
环比是将本周期的数据与上一期的数据进行对比,反应的是数据连续变化的趋势:
Figure BDA0003252268680000042
其中,Δt表示时间差;
3)相似性:通过Pearson系数判断相似性
Figure BDA0003252268680000051
其中,
Figure BDA0003252268680000052
T表示周期
4)差异性:包括差值及平均值、差值标准差、一致率和粗差率;设时空匹配后的数据有效样本数为N,X为标准数据,Y为格点气象实况数据,则差值ZN及其平均值
Figure BDA0003252268680000053
为:
Figure BDA0003252268680000054
设对比差值标准差为σ,σ反映了标准数据和格点气象实况数据之间偏差的离散程度,则有:
Figure BDA0003252268680000055
一致率表示标准数据和格点气象实况数据相一致的程度,将对比差值小于等于标准差的2倍的即认为一致,
Figure BDA0003252268680000056
粗差率反映了标准数据和格点气象实况数据异常值的多寡,当
Figure BDA0003252268680000057
时,视为粗差;粗差次数计算方法:先根据全部数据计算σ,逐个检查对比差值,若有
Figure BDA0003252268680000058
时,剔除其中一个最大者,再按计算标准差的公式计算新的σ,若还有差值
Figure BDA0003252268680000059
者,再剔除其中的一个最大者,然后计算新的σ,直到无数据需要剔除为止;
S4、采用步骤S3的评价体系,依次对步骤S2获得的时空匹配后的数据按照标记的点位进行评价,由于S3中的各评价指标都是针对某一固定点位的某一气象要素设计的,因此本步骤中选择点位A和气象要素A1(A1可以选择风速、温度、湿度、降水等)进行评价:
S41、对点位A的标准数据和格点气象实况数据中的气象要素A1分别根据S3中的方法计算出对应的周期TXA1,TYA1,比较周期是否一致,如果周期一致,进入S42,周期不一致则直接进入S43;
S42、根据周期,分别计算点位A的标准数据和格点气象实况数据中气象要素A1的同比和环比,比较同比、环比的正负是否一致,如果正负一致则表示两类数据的变化趋势相同,进入S43;如果正负不一致,需要进一步分析不一致的原因,可以直接进入S44;
S43、计算点位A标准数据和格点气象实况数据中气象要素A1的Pearson系数,该值越接近1,表示两种来源的气象要素A1的数据相似度越高;
S44、计算点位A的标准数据和格点气象实况数据中气象要素A1差值的平均值、标准差、一致率、粗差率,并和阈值进行比较,如果在阈值范围内表示点位A附近的格点气象实况数据中气象要素A1接近标准数据;如果超过阈值,需要进一步分析超过的原因,是否是客观原因,比如不同海拔温度会有差距,迎风坡和背风坡的风速会有差距;
重复以上步骤,对点位A的其他气象要素和其他点位的气象要素进行评价,并得出最终的评价结果。
格点气象数据评价过程中,可能会出现位置相近但是地理环境有差异的情况,比如距离很近但是海拔不同,温度可能会相差较大,但是周期性和趋势性一致。因此,本发明在进行差异分析之前,对数据的周期性、趋势性、相似性分析给出了明确的方法。

Claims (1)

1.一种针对格点气象实况的数据质量评价方法,其特征在于,包括以下步骤:
S1、获取标准气象数据和格点气象实况数据;
S2、对步骤S1获取到的数据进行预处理,包括数据重复性检查、界限值检查、极值检查、时间一致性检查和空间一致性检查,通过预处理消除错误数据后,将得到的标准气象数据和格点气象实况数据进行时空上的近邻匹配,获得时空匹配后的数据,同时对匹配后的数据按照标准气象数据的位置信息标记不同的点位;
S3、构建数据评价指标体系,包括:
1)周期性:以时间序列的周期T为分割点,对序列进行分割;对长度是n的序列,分割后就得到n/T个单元,比较这n/T个单元的相似度,如果满足设定的相似度,则说明具有周期性,如果不是,则不具有周期性;
2)趋势性:包括同比和环比,同比是为了消除数据周期性波动的影响,将本周期的数据Xt与之前周期中相同时间点的数据Xt+nT进行比较:
Figure FDA0003252268670000011
其中,T表示周期,n表示周期数;
环比是将本周期的数据与上一期的数据进行对比,反应的是数据连续变化的趋势:
Figure FDA0003252268670000012
其中,Δt表示时间差;
3)相似性:通过Pearson系数判断相似性
Figure FDA0003252268670000013
其中,
Figure FDA0003252268670000014
T表示周期;
4)差异性:包括差值及平均值、差值标准差、一致率和粗差率;设时空匹配后的数据有效样本数为N,X为标准数据,Y为格点气象实况数据,则差值ZN及其平均值
Figure FDA0003252268670000015
为:
Figure FDA0003252268670000021
设对比差值标准差为σ,σ反映了标准数据和格点气象实况数据之间偏差的离散程度,则有:
Figure FDA0003252268670000022
一致率表示标准数据和格点气象实况数据相一致的程度,将对比差值小于等于标准差的2倍的即认为一致,
Figure FDA0003252268670000023
粗差率反映了标准数据和格点气象实况数据异常值的多寡,当
Figure FDA0003252268670000024
时,视为粗差;
S4、采用步骤S3的评价体系,依次对步骤S2获得的时空匹配后的数据按照标记的点位进行评价,同时对每个点位的评价是按照每个气象要素逐一进行评价,对一个点位一个气象像素的评价方法为:
S41、对所选点位的标准数据和格点气象实况数据中的一个气象要素分别根据S3中的方法计算出对应的周期,比较得到的两个周期是否一致,如果周期一致,进入S42,周期不一致则直接进入S43;
S42、根据周期,分别计算该点位的标准数据和格点气象实况数据中气象要素的同比和环比,比较同比、环比的正负是否一致,如果正负一致则表示两类数据的变化趋势相同,进入S43;如果正负不一致,进入S44;
S43、计算该点位标准数据和格点气象实况数据中气象要素的Pearson系数,该值越接近1,表示两种来源的气象要素A1的数据相似度越高;
S44、计算该点位的标准数据和格点气象实况数据中气象要素差值的平均值、标准差、一致率、粗差率,并和阈值进行比较,如果在阈值范围内表示该点位附近的格点气象实况数据中气象要素接近标准数据;如果超过阈值,则认为远离标准数据;
重复步骤S4直至完成对所有点位所有气象要素的评价,得到质量评价结论。
CN202111049598.XA 2021-09-08 2021-09-08 一种针对格点气象实况的数据质量评价方法 Active CN113742929B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111049598.XA CN113742929B (zh) 2021-09-08 2021-09-08 一种针对格点气象实况的数据质量评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111049598.XA CN113742929B (zh) 2021-09-08 2021-09-08 一种针对格点气象实况的数据质量评价方法

Publications (2)

Publication Number Publication Date
CN113742929A true CN113742929A (zh) 2021-12-03
CN113742929B CN113742929B (zh) 2024-01-26

Family

ID=78737003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111049598.XA Active CN113742929B (zh) 2021-09-08 2021-09-08 一种针对格点气象实况的数据质量评价方法

Country Status (1)

Country Link
CN (1) CN113742929B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115759416A (zh) * 2022-11-21 2023-03-07 四川省气象探测数据中心 一种网格实况产品的评估分析方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100989845B1 (ko) * 2010-04-29 2010-10-29 서울대학교산학협력단 특이기상 변화 추정 방법
CN107367773A (zh) * 2017-03-14 2017-11-21 北京维艾思气象信息科技有限公司 一种基于北斗定位的单点气象要素确定方法
KR20180116507A (ko) * 2017-04-14 2018-10-25 동국대학교 산학협력단 기상 자료 분석 장치 및 방법
CN110390343A (zh) * 2018-04-16 2019-10-29 中国电力科学研究院有限公司 一种空间气象数据的订正方法及系统
CN110555554A (zh) * 2019-08-28 2019-12-10 向波 一种基于客观定量化的智能气候预测技术
CN113159714A (zh) * 2021-04-01 2021-07-23 国网河南省电力公司电力科学研究院 一种面向电网的气象数据订正方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100989845B1 (ko) * 2010-04-29 2010-10-29 서울대학교산학협력단 특이기상 변화 추정 방법
CN107367773A (zh) * 2017-03-14 2017-11-21 北京维艾思气象信息科技有限公司 一种基于北斗定位的单点气象要素确定方法
KR20180116507A (ko) * 2017-04-14 2018-10-25 동국대학교 산학협력단 기상 자료 분석 장치 및 방법
CN110390343A (zh) * 2018-04-16 2019-10-29 中国电力科学研究院有限公司 一种空间气象数据的订正方法及系统
CN110555554A (zh) * 2019-08-28 2019-12-10 向波 一种基于客观定量化的智能气候预测技术
CN113159714A (zh) * 2021-04-01 2021-07-23 国网河南省电力公司电力科学研究院 一种面向电网的气象数据订正方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115759416A (zh) * 2022-11-21 2023-03-07 四川省气象探测数据中心 一种网格实况产品的评估分析方法

Also Published As

Publication number Publication date
CN113742929B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN112905560B (zh) 一种多源时空大数据深度融合的空气污染预测方法
CN113919231B (zh) 基于时空图神经网络的pm2.5浓度时空变化预测方法及系统
CN111242404B (zh) 一种强降雨诱发洪灾事件的极端性评估方法及系统
CN113743013A (zh) 一种基于XGBoost气温预测数据修正的方法
KR101908865B1 (ko) 기온 측정 자료의 품질 분석방법
CN110134907B (zh) 一种降雨缺失数据填补方法、系统及电子设备
CN111401602A (zh) 基于神经网络的卫星以及地面降水测量值同化方法
CN110826689A (zh) 一种基于深度学习的预测县级单位时序gdp的方法
CN114298162A (zh) 融合卫星雷达多源数据的降水质量控制与评估方法及应用
CN114936201A (zh) 基于自适应分块神经网络模型的卫星降水数据校正方法
CN113704693A (zh) 一种高精度的有效波高数据估计方法
Tsakiris et al. Regional drought identification and assessment. Case study in Crete
CN115861845A (zh) 一种湿地监测方法及系统
CN116449331A (zh) 一种基于w波段雷达和气象卫星的沙尘粒子数浓度估算方法
CN116415730A (zh) 一种预测水位的融合自注意力机制时空深度学习模型
CN115994685A (zh) 一种国土空间规划现状评估方法
CN113742929B (zh) 一种针对格点气象实况的数据质量评价方法
CN116432032A (zh) 基于多源数据和机器学习的气象数据异常事件识别方法
CN108957594B (zh) 一种商遥卫星轨道总云量预报修正方法及修正系统
CN115236770B (zh) 基于时空堆叠和样本重构的非线性短时临近降水预报方法
CN113610436A (zh) 一种承灾体动态脆弱性评估方法及系统
CN116663432B (zh) 一种百米高度风速预报订正降尺度方法及装置
Dabrowski et al. Quality Control in Weather Monitoring with Dynamic Linear Models
CN116823067B (zh) 管网水质清污状态的确定方法、装置及电子设备
CN112990701B (zh) 一种基于eof的自动站温度资料质量控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant