CN112559588A - 地面气象站观测的百年均一化气温日值序列的构建方法 - Google Patents

地面气象站观测的百年均一化气温日值序列的构建方法 Download PDF

Info

Publication number
CN112559588A
CN112559588A CN202011422932.7A CN202011422932A CN112559588A CN 112559588 A CN112559588 A CN 112559588A CN 202011422932 A CN202011422932 A CN 202011422932A CN 112559588 A CN112559588 A CN 112559588A
Authority
CN
China
Prior art keywords
sequence
data
air temperature
value
year
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011422932.7A
Other languages
English (en)
Other versions
CN112559588B (zh
Inventor
司鹏
罗传军
王琪
王敏
姜罕盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Meteorological Information Center Tianjin Meteorological Archives
Original Assignee
Tianjin Meteorological Information Center Tianjin Meteorological Archives
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Meteorological Information Center Tianjin Meteorological Archives filed Critical Tianjin Meteorological Information Center Tianjin Meteorological Archives
Priority to CN202011422932.7A priority Critical patent/CN112559588B/zh
Publication of CN112559588A publication Critical patent/CN112559588A/zh
Application granted granted Critical
Publication of CN112559588B publication Critical patent/CN112559588B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Environmental & Geological Engineering (AREA)
  • Strategic Management (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

本发明提供了地面气象站观测的百年均一化气温日值序列的构建方法,建立百年均一化气温日值序列的基础数据,数据拼接形成完整的百年序列,然后对其进行质量控制,百年序列进行均一化检验,在均一化检验中建立月值参考序列,通过检验得到断点;进而,在日值参考序列下,基于有参考序列法的订正,得到百年观测的均一化气温日值序列;对百年观测的均一化气温日值序列,通过数据插补得到最优插补序列;对最优插补序列进行评估,得到最终的均一化气温日值序列。本发明所述的构建方法,克服代用资料对极端气候变化定量分析的困难;发展组合性均一化分析方法,提高检测断点的真实性,增强修正数据的可靠性,为极端气候变化研究领域建立新的数据基础。

Description

地面气象站观测的百年均一化气温日值序列的构建方法
技术领域
本发明属于地面气象站观测数据技术领域,尤其是涉及地面气象站观测的百年均一化气温日值序列的构建方法。
背景技术
作为第一手资料的气象站观测记录得到了最为广泛的应用,与其他数据相比,其具有代表性和准确性的优点。但目前,由于站点覆盖度、资料的完整性及观测序列的非均一化等问题,使得19世纪到20世纪中叶长达百年尺度的气候变化特征仍然存在着许多不确定性,对于深入系统地检测区域或局地气候变化规律及预测未来的气候变化趋势缺乏可靠观测依据。我国能够收集到最早的仪器观测资料始于19世纪40年代,20世纪40年代又由于历史原因使得部分站点观测中断、资料缺失,导致1950年以前的气候变化研究结论无法得到很好的诠释。同时,在实际观测中由于观测站点迁移、仪器变更、观测时次改变等不可避免地造成长期观测资料存在非均一化问题,导致序列产生突变。均一化是解决气候资料非均一化的重要技术手段,通过剔出数据中的系统偏差,保留真实的气候变化特征。然而,我国1950年以前的站点数量稀少,元数据信息普遍严重缺失,给长年代气候资料的均一化分析带来很大困难。因此,如何建立完整可靠的长时间观测序列一直是气候变化研究中首先需要解决的关键问题。
目前,国内外对于长年代序列的建立普遍基于年值和月值的研究,这对于百年尺度极端气候事件的检测特别是1950年以前的事件存在很大困难。并且由于资料的均一化处理程度不够,没有对仪器变更、观测时次改变、业务变更等影响因素进行全面系统的剔除。检验方法存在单一性,参考序列的建立方法缺乏普遍适用性,影响序列断点判识的真实性。第一,在以往长年代气候序列的建立中,研究较多的是平均气温要素,并且缺测数据的插补采用代用资料,对近百年极端气候变化的定量检测有很大困难;第二,前人对建立序列的气候代表性或质量并未进行深入考量,尤其是均一化处理技术的应用不够;第三,在数据处理分析过程中,由于考虑的是区域大范围的空间尺度,对各个站点具体沿革背景了解不够深入,造成部分站点资料的断点订正不合理;第四,由于日值序列自身变率较大,均一化检测存在困难,导致长年代可靠的日值资料研究甚少,严重阻碍了百年来极端气候事件变化的研究。因此,需要采用更加完整的元数据信息及组合性均一化技术方法,基于更加细致的时间分辨率资料,如日值尺度,构建我国数量有限的珍贵的百年可靠气候序列,为我国不同区域气候背景条件下长年代日值序列的建立提供借鉴。进而更为客观的揭示我国百年来极端气候事件的变化规律,量化其变化幅度,从而为制定科学的对策减缓和适应极端气候变化带来的不利影响提供基础支撑。
发明内容
有鉴于此,本发明旨在提出地面气象站观测的百年均一化气温日值序列的构建方法,以解决原始观测的百年逐日平均气温、最高气温和最低气温序列中连续缺测数据较多,非均一化问题明显,如何构建完整可靠的百年尺度日值序列的问题。
为达到上述目的,本发明的技术方案是这样实现的:
地面气象站观测的百年均一化气温日值序列的构建方法,包括以下步骤:
S1、根据地面气象站观测的信息建立百年均一化气温日值序列的基础数据;
S2、对百年均一化气温日值序列的基础数据通过数据拼接形成完整的百年序列,然后对其进行质量控制;
S3、基于质量控制后的百年序列进行均一化检验,在均一化检验中建立月值参考序列,通过检验得到断点;
S4、利用建立的日值参考序列通过分位数匹配法进行断点订正,得到百年观测的均一化气温日值序列;
S5、基于步骤S4中得到百年观测的均一化气温日值序列,通过数据插补得到最优插补序列;
S6、对最优插补序列进行评估,最终得到新建的百年均一化气温日值序列。
进一步的,所述步骤S2中的质量控制过程如下:
1)、对气候界限值检验进行初步质量控制,范围在-80℃≤气温日值≤60℃,超出阈值范围认为是错误数据;
2)、气候异常值检验进行初步质量控制,气温序列3-5倍标准差为阈值标准,超出阈值认为是可疑数据,通过人工判断是否为错误数据;
3)、内部一致性检验进行初步质量控制,最低气温≤平均气温≤最高气温,超出阈值范围认为是错误数据;
人工通过对以上3步认为错误数据均置为缺测标志。
进一步的,界限值检验通过以下公式得到:
Figure BDA0002823334050000031
公式中,
Figure BDA0002823334050000032
和σx分别为气温序列累年平均值和标准差,累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010,超出阈值范围认为是可疑数据。
进一步的,突变检验通过以下公式得到:
Figure BDA0002823334050000041
公式中,xi=di-di-1,di-1,di分别为前后连续时间点的数据,
Figure BDA0002823334050000042
Figure BDA0002823334050000043
分别为气温差值序列xi的累年平均值和标准差,累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010,超出阈值范围认为是可疑数据。
进一步的,一致性检验通过以下公式得到:
Figure BDA0002823334050000044
公式中,σ为气温序列标准差,σ为某日历年所有年份标准差的平均值,
Figure BDA0002823334050000045
为某日累年标准差的平均值,累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010,超出阈值范围认为是可疑数据。
进一步的,所述步骤S3中建立月值参考序列的方法如下:(1)对Berkeley Earth,CRUTS4.03和GHCNV3三类月值序列进行加权平均得到月值参考序列,其中,加权系数分别为三类数据与待检序列相关系数的平方;
(2)首先,从待检序列水平距离300km以内,海拔高度差200m范围内,选取20个地面气象站;其次,选取距离待检序列球面距离最近的10个地面气象站;最后,选取第一步和第二步相同的地面气象站,作为参考站;通过插值法,将对应参考站的Berkeley Earth月值格点数据插到站点水平,利用加权平均得到Berkeley Earth月值参考序列,其中,加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。
进一步的,所述步骤S4中建立日值参考序列的方法如下:
首先,从待检序列水平距离300km以内,海拔高度差200m范围内,选取20个地面气象站;其次,选取距离待检序列球面距离最近的10个地面气象站;最后,选取第一步和第二步相同的地面气象站,作为参考站;通过插值法,将对应参考站的Berkeley Earth日值格点数据插到站点水平,利用加权平均得到Berkeley Earth日值参考序列,其中,加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。
进一步的,所述步骤S4中的断点订正过程如下:利用惩罚最大T检验,通过两种月值参考序列对待检序列的月值序列同时进行检验,利用分位数匹配法,在日值参考序列下,采用有参考序列法对逐日气温序列进行订正,得到百年观测的均一化气温日值序列。
进一步的,所述步骤S6中评估过程如下:
比较最优插补序列与国际上权威的数据集,在不同空间尺度的趋势变化特点及其变化幅度,年代际变化特征,空间尺度包括独立的地面气象站点及中国区域;
比较最优插补序列与国际上权威的数据集,在不同空间尺度的极端温度事件及其趋势变化特点和幅度;
空间尺度包括独立的地面气象站点及中国区域;
极端温度事件包括日最低气温小于10%阈值或大于90%阈值的天数;
日最高气温小于10%阈值或大于90%阈值的天数。
相对于现有技术,本发明所述的地面气象站观测的百年均一化气温日值序列的构建方法具有以下优势:
(1)本发明所述的基于百年观测资料的序列完整性恢复方法,克服代用资料对极端气候变化定量分析的困难;发展组合性均一化分析方法,提高检测断点的真实性,增强修正数据的可靠性。
(2)本发明所述的构建方法,为极端气候变化研究领域建立新的数据基础。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例所述的地面气象站观测的百年均一化气温日值序列的构建方法流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
下面将参考附图并结合实施例来详细说明本发明。
如图1所示,地面气象站观测的百年均一化气温日值序列的构建方法,包括以下步骤:
S1、根据地面气象站观测的信息建立百年均一化气温日值序列的基础数据;
S2、对百年均一化气温日值序列的基础数据通过数据拼接形成完整的百年序列,然后对其进行质量控制。
S3、基于质量控制后的百年序列进行均一化检验,在均一化检验中建立月值参考序列,通过检验得到断点;
S4、利用建立的日值参考序列通过分位数匹配法进行断点订正,得到百年观测的均一化气温日值序列;
S5、基于步骤S4中得到百年观测的均一化气温日值序列,通过数据插补得到最优插补序列;
S6、对最优插补序列进行评估,最终得到新建的百年均一化气温日值序列。
所述步骤S2中数据拼接过程如下:
①对多来源资料的数据质量由低到高依次排序;
②对多来源数据的重合记录,设置一致率、相关系数、均值t检验、方差F检验4步综合判断,仅对满足上述4个条件的数据源进行整合。
一致率检验判断过程如下:
一致率P定义为:δj=|Tj a-Tj b| (1)
Figure BDA0002823334050000071
Figure BDA0002823334050000081
Figure BDA0002823334050000082
公式(1)-(2)中,上标a、b分别代表来自两个数据源的要素资料,δj为绝对误差,εj为最小相对误差。当εj≤15%或δj≤5℃时,认为两组数据一致,
Figure BDA0002823334050000083
赋值为1,统计数据重合时期
Figure BDA0002823334050000084
为1的百分比即为一致率;当一致率大于85%,通过检验。
相关系数检验判断过程如下:当两个数据源逐日气温要素相关系数大于0.9,通过检验。
均值t检验判断过程如下:95%-99%显著性检验判定两组资料均值不存在显著差异,通过检验。
方差F检验判断过程如下:95%-99%显著性检验判定两组资料方方差不存在显著差异,通过检验。
所述步骤S2中的质量控制过程如下:
1)、对气候界限值检验进行初步质量控制,范围在-80℃≤气温日值≤60℃,超出阈值范围认为是错误数据;
2)、气候异常值检验进行初步质量控制,气温序列3-5倍标准差为阈值标准,超出阈值认为是可疑数据,通过人工判断是否为错误数据;
3)、内部一致性检验进行初步质量控制,最低气温≤平均气温≤最高气温,超出阈值范围认为是错误数据;
人工通过对以上3步认为错误数据均置为缺测标志。
界限值检验通过以下公式得到:
Figure BDA0002823334050000085
公式(5)中,
Figure BDA0002823334050000091
和σx分别为气温序列累年平均值和标准差,累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010,超出阈值范围认为是可疑数据。
突变检验通过以下公式得到:
Figure BDA0002823334050000092
公式(6)中,xi=di-di-1,di-1,di分别为前后连续时间点的数据,
Figure BDA0002823334050000093
Figure BDA0002823334050000094
分别为气温差值序列xi的累年平均值和标准差累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010,超出阈值范围认为是可疑数据。
一致性检验通过以下公式得到:
Figure BDA0002823334050000095
公式(7)中,σ为气温序列标准差,σ为某日历年所有年份标准差的平均值,
Figure BDA0002823334050000096
为某日累年标准差的平均值,超出阈值范围认为是可疑数据,其中累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010。
所述步骤S3中建立月值参考序列的方法如下:(1)对Berkeley Earth,CRUTS4.03和GHCNV3三类月值序列进行加权平均得到月值参考序列,其中,加权系数分别为三类数据与待检序列相关系数的平方;
(2)首先,从待检序列水平距离300km以内,海拔高度差200m范围内,选取20个地面气象站;其次,选取距离待检序列球面距离最近的10个地面气象站;最后,选取第一步和第二步相同的地面气象站,作为参考站;通过插值法(此处的插值法最优为双线性插值法),将对应参考站的Berkeley Earth格点数据插到站点水平,利用加权平均得到Berkeley Earth月值参考序列,其中,加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。
所述步骤S4中建立日值参考序列的方法如下:
首先,从待检序列水平距离300km以内,海拔高度差200m范围内,选取20个地面气象站;其次,选取距离待检序列球面距离最近的10个地面气象站;最后,选取第一步和第二步相同的地面气象站,作为参考站;通过插值法(此处的插值法最优为双线性插值法),将对应参考站的Berkeley Earth日值格点数据插到站点水平,利用加权平均得到BerkeleyEarth日值参考序列,其中,加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。
所述步骤S4中的断点订正过程如下:利用惩罚最大T检验,通过两种参考序列对待检序列的月值序列同时进行检验,利用分位数匹配法,在日值参考序列下,采用有参考序列法对逐日气温序列进行订正,得到百年观测的均一化气温日值序列。
所述步骤S5中的数据插补方法如下:利用标准化序列法和线性回归法对各要素连续缺测年份的逐日资料进行插补。
所述步骤S6中评估过程如下:
比较最优插补序列与国际上权威的数据集,在不同空间尺度的趋势变化特点及其变化幅度,年代际变化特征,空间尺度包括独立的地面气象站点及中国区域;
比较最优插补序列与国际上权威的数据集,在不同空间尺度的极端温度事件及其趋势变化特点和幅度,空间尺度包括独立的地面气象站点及中国区域。极端温度事件包括日最低气温小于10%阈值或大于90%阈值的天数;日最高气温小于10%阈值或大于90%阈值的天数;气温日较差;每月内日最高气温的最大值;每月内日最低气温的最小值。
本专利的3个关键技术分别是均一化检验和订正方法、参考序列建立方法、资料插补方法。
1、数据源
(1)基础资料源
①地面气象站观测的逐日平均气温、最高气温和最低气温数据。
②地面气象站元数据:地面气象站的历史沿革资料和历史档案信息。
(2)参考站资料源
①Berkeley Earth:Berkeley Earth Surface Temperature group landTemperature日值和月值1°×1°格点数据;网址为:http://berkeleyearth.org/data/。
②CRUTS4.03:Climatic Research Unit Time-Series land temperature,version 4.03月值0.5°×0.5°格点数据;网址为:http://data.ceda.ac.uk/badc/cru/data/cru_ts/cru_ts_4.03/data/。
③GHCNV3:Global Historical Climatology Network land temperature,version3月值站点数据;网址为:https://www.ncdc.noaa.gov/ghcnd-data-access。
以上(2)中的①、②、③均为国外数据集的名字分别对应以上Berkeley Earth、CRUTS4.03、GHCNV3。
2、数据整合
(1)数据拼接
①数据源优先级原则:针对1951年以前的资料,从数据量优势角度,同时兼顾资料的完整性和时间长度对多来源资料的数据质量由低到高依次排序。
②多源数据整合:对多来源数据的重合记录,设置一致率、相关系数、均值t检验、方差F检验4步综合判断,仅对满足上述4个条件的数据源进行整合,整合遵循①数据源筛选原则。
一致率检验:
一致率P定义为:δj=|Tj a-Tj b| (1)
Figure BDA0002823334050000121
Figure BDA0002823334050000122
Figure BDA0002823334050000123
公式(1)-(2)中,上标a、b分别代表来自两个数据源的要素资料,δj为绝对误差,εj为最小相对误差。当εj≤15%或δj≤5℃时,认为两组数据一致,
Figure BDA0002823334050000124
赋值为1,统计数据重合时期
Figure BDA0002823334050000125
为1的百分比即为一致率。当一致率大于85%,通过检验。
相关系数检验:当两个数据源逐日气温要素相关系数大于0.9,通过检验。
均值t检验:95%-99%显著性检验判定两组资料均值不存在显著差异,通过检验。
方差F检验:95%-99%显著性检验判定两组资料方差不存在显著差异,通过检验。
(2)质量控制
①初步质量控制:包括气候界限值检验、气候异常值检验、内部一致性检验。
气候界限值检验:-80℃≤气温日值≤60℃,超出阈值范围认为是错误数据。
气候异常值检验:气温序列3-5倍标准差为阈值标准,超出阈值认为是可疑数据,通过人工判断是否为错误数据。
内部一致性检验:最低气温≤平均气温≤最高气温,超出阈值范围认为是错误数据。
对以上3步认为错误数据均置为缺测标志。
②动态f值检验:包括界限值检验、突变检验、时间一致性检验。f值定义为动态的,依据检验出的疑误数据量不能超过总数据量的2%或5%来定义。
界限值检验:
Figure BDA0002823334050000131
公式(5)中,
Figure BDA0002823334050000132
和σx分别为气温序列累年平均值和标准差,累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010,超出阈值范围认为是可疑数据。
突变检验:
Figure BDA0002823334050000133
公式(6)中,xi=di-di-1,di-1,di分别为前后连续时间点的数据,
Figure BDA0002823334050000134
Figure BDA0002823334050000135
分别为气温差值序列xi的累年平均值和标准差,累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010,超出阈值范围认为是可疑数据。
一致性检验:
Figure BDA0002823334050000136
公式(7)中,σ为气温序列标准差,σ为某日历年所有年份标准差的平均值,
Figure BDA0002823334050000137
为某日累年标准差的平均值,累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010,超出阈值范围认为是可疑数据。
对公式(5)-(7)检验出的可疑数据进行综合分析,通过人工判断是否为错误数据,对错误数据均置为缺测标志。
3、数据均一化
基于2步质量控制后的序列(以下称为“待检序列”),通过RHtestV4中惩罚最大T检验法及分位数匹配法,结合地面气象站历史沿革和档案信息,对其进行均一化检验和订正,剔除逐日气温序列中因迁站、仪器变更、观测时次改变、自动站业务化等导致的序列系统误差,建立能够反映真实气候变化特征的气温日值序列。
①参考序列的建立:均一化分析处理中,参考序列建立的合理与否关系到断点的检验是否可靠。在这个过程中,建立月值参考序列来检验待检序列断点,建立日值参考序列作为待检序列断点的订正序列。
月值参考序列的建立分两种方法:一种对Berkeley Earth,CRUTS4.03和GHCNV3三类月值序列进行加权平均得到,其中,加权系数分别为三类数据与待检序列相关系数的平方。另一种仅用到Berkeley Earth月值数据,首先,从待检序列水平距离300km以内,海拔高度差200m范围内,选取20个地面气象站(第一步);其次,选取距离待检序列球面距离最近的10个地面气象站(第二步);最后,选取第一步和第二步相同的地面气象站,作为参考站。通过插值法(此处的插值法最优为双线性插值法),将对应参考站的Berkeley Earth月值格点数据插到站点水平,利用加权平均得到Berkeley Earth月值参考序列,其中,加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。
日值参考序列的建立:仅用到Berkeley Earth日值数据,参考序列的建立方法同上述Berkeley Earth月值参考序列。
②断点检验和订正:利用惩罚最大T检验(95%显著性水平下),通过两种月值参考序列对待检序列的月值序列同时进行检验。断点的确定分两种情况:一种是,在没有地面气象站历史沿革资料和档案信息情况下,选取在两种月值参考序列下同时被检验出的显著的序列断点;另一种是,在有地面气象站历史沿革资料和档案信息情况下,如果检验得到的显著序列断点的时间位置,与这些资料记载的时间一致,则保留该断点。
利用分位数匹配法,在日值参考序列下,采用有参考序列法对逐日气温序列进行订正,订正的断点为上述两种情况保留的显著断点。从而,得到百年观测的均一化气温日值序列。
4、数据插补
基于3步得到的百年观测的均一化气温日值序列,利用标准化序列法和线性回归法对各要素连续缺测年份的逐日资料进行插补。参考站资料源最优为Berkeley Earth逐日气温资料,利用通过插值法(此处的插值法最优为双线性插值法),根据地面气象站经纬度位置,将Berkeley Earth1°×1°格点数据插到站点水平。
①标准化序列法:该方法是假设对于在同一气候区域内的所有站点,某一时间点的气象要素值与该时间点多年平均值的距平都是相似的。表示为:
Figure BDA0002823334050000151
Figure BDA0002823334050000152
公式(8)-(9)中,Z是参考站资料源逐日气温标准化序列,xi
Figure BDA0002823334050000153
和si分别是参考站资料源某日气温值,某日累年气温平均值和标准差。yTj插补序列,
Figure BDA0002823334050000154
和sTj分别表示地面气象站观测的某日累年气温平均值和标准差。累年的定义范围为待插补序列与参考站资料源重合的连续的并且没有显著断点的时段,累年最优为30年,30年标准气候期定义可以是1961-1990、1971-2000、1981-2010。
②线性回归法:该方法是通过建立邻近站与待插补站时间序列的定量线性统计关系,来对待插补站序列
Figure BDA0002823334050000155
进行插补,表达关系式如下:
Figure BDA0002823334050000156
Figure BDA0002823334050000157
源和地面气象站观测的累年逐日气温序列,累年的定义范围为待插补序列与参考站资料源重合的连续的并且没有显著断点的时段,例如30年。
对于建立的定量统计关系公式(10)是否确有线性关系,需要通过回归方程的显著性检验进行验证,检验统计量F如公式(12)所示,服从分子自由度为1,分母自由度为(n-2)的F分布。在显著性水平α=0.05下,若F>F0.05,则认为回归方程显著,线性关系成立。
Figure BDA0002823334050000161
Figure BDA0002823334050000162
Figure BDA0002823334050000163
公式(12)-(14)中,
Figure BDA0002823334050000164
yj
Figure BDA0002823334050000165
分别是某日插补值,实际观测值以及实际观测序列累年平均值,累年的定义范围为插补序列与参考站资料源重合的连续的并且没有显著断点的时段,例如30年。
同时,为确定建立的线性统计关系的可信度,研究中还对得到的回归系数进行了显著性检验,检验统计量t如公式(15)所示,服从自由度为(n-2)的t分布,在显著性水平α=0.05下,若|t|>t0.05,则认为拟合的回归系数通过显著性t检验,线性关系成立。
Figure BDA0002823334050000166
Figure BDA0002823334050000167
公式(15)中,b利用公式(11)求得,Q利用公式(14)求得。公式(16)中,xj
Figure BDA0002823334050000168
分别是参考站资料源某日气温值,参考站资料源某日累年气温平均值。累年的定义范围为插补序列与参考站资料源重合的连续的并且没有显著断点的时段,例如30年。
③误差分析:对①和②插补得到的逐日气温序列与地面气象站实际观测的逐日气温序列进行误差分析,误差评估指标分别包括标准均方误(SMSE)、标准误差(SE)、插补值与地面气象站实际观测值差值在±0.5℃范围内的样本比例(P)、插补值与地面气象站实际观测值的相关性。通过比较误差大小,选取最优的插补序列进行下一步分析,即标准均方误(SMSE)和标准误差(SE)误差较小,样本比例(P)较大、相关系数较高的插补方法得到的逐日气温序列。
Figure BDA0002823334050000171
公式(17)中,m是样本总量,
Figure BDA0002823334050000172
和yi分别是某日气温插补值和实际观测值,s是地面气象站实际观测的某日30年气温标准差。30年气候期可以定义为1961-1990、1971-2000、1981-2010。
Figure BDA0002823334050000173
公式(18)中,
Figure BDA0002823334050000174
m,
Figure BDA0002823334050000175
和yi与公式(17)一致。
Figure BDA0002823334050000176
公式(19)中,mp是逐日插补值与实际观测值差值在±0.5℃范围内的样本数量,m是样本总量。
Figure BDA0002823334050000177
公式(20)中,xki和xli分别是某日插补值与实际观测值,
Figure BDA0002823334050000178
Figure BDA0002823334050000179
分别是某日插补序列和实际观测序列样本总量的平均值,m是样本总量。
5、可用性评估
通过与国际上权威的数据集(Berkeley Earth、CRUTS4.03)进行对比,评估基于4步得到的最优插补序列的可靠性。
①百年平均温度的趋势变化
比较最优插补序列(平均气温、最高气温、最低气温)与国际上权威的数据集,在不同空间尺度的趋势变化特点及其变化幅度,年代际变化特征,空间尺度包括独立的地面气象站点及中国区域。
②百年极端温度的趋势变化
比较最优插补序列(最高气温、最低气温)与国际上权威的数据集,在不同空间尺度的极端温度事件及其趋势变化特点和幅度,空间尺度包括独立的地面气象站点及中国区域。极端温度事件包括日最低气温小于10%阈值或大于90%阈值的天数;日最高气温小于10%阈值或大于90%阈值的天数;气温日较差;每月内日最高气温的最大值;每月内日最低气温的最小值。
具体方法如下:
1、选取基础资料源,包括①地面气象站观测的逐日平均气温、最高气温和最低气温数据,作为建立百年均一化气温日值序列的基础数据。②地面气象站的历史沿革资料和历史档案信息,作为均一化检验断点判断的依据。
选取参考站资料源,作为数据均一化中建立参考序列以及数据插补的参考序列。
2、首先对基础资料源中的①通过数据拼接形成完整的百年序列。然后对其进行质量控制。
3、基于质量控制后的百年序列进行均一化检验,其中,在均一化检验中,需要建立月值参考序列,通过检验得到断点。然后,利用建立的日值参考序列通过分位数匹配法进行断点订正,得到百年观测的均一化气温日值序列。
4、基于3步得到百年观测的均一化气温日值序列,通过数据插补得到最优插补序列。
5、对最优插补序列进行评估,通过与国际上权威的数据集(Berkeley Earth、CRUTS4.03)进行对比,对比的指标分别是百年平均温度的趋势变化、百年极端温度事件的变化。最终得到新建的百年均一化气温日值序列。
在上述具体方法中,基于具体方法如下的步骤2质量控制后的百年序列,首先进行数据插补,然后进行均一化检验和订正,也是可行的实施方法,该方法对于大量连续缺测的观测序列具有较好的优势。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于包括以下步骤:
S1、根据地面气象站观测的信息建立百年均一化气温日值序列的基础数据;
S2、对百年均一化气温日值序列的基础数据通过数据拼接形成完整的百年序列,然后对其进行质量控制;
S3、基于质量控制后的百年序列进行均一化检验,在均一化检验中建立月值参考序列,通过检验得到断点;
S4、利用建立的日值参考序列通过分位数匹配法进行断点订正,得到百年观测的均一化气温日值序列;
S5、基于步骤S4中得到百年观测的均一化气温日值序列,通过数据插补得到最优插补序列;
S6、对最优插补序列进行评估,最终得到新建的百年均一化气温日值序列。
2.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于:所述步骤S2中的质量控制过程如下:
1)、对气候界限值检验进行初步质量控制,范围在-80℃≤气温日值≤60℃,超出阈值范围认为是错误数据;
2)、气候异常值检验进行初步质量控制,气温序列3-5倍标准差为阈值标准,超出阈值认为是可疑数据,通过人工判断是否为错误数据;
3)、内部一致性检验进行初步质量控制,最低气温≤平均气温≤最高气温,超出阈值范围认为是错误数据;
人工通过对以上3步认为错误数据均置为缺测标志。
3.根据权利要求2所述的地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于:界限值检验通过以下公式得到:
Figure FDA0002823334040000021
公式中,
Figure FDA0002823334040000022
和σx分别为气温序列为累年平均值和标准差,超出阈值范围认为是可疑数据。
4.根据权利要求2所述的地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于:突变检验通过以下公式得到:
Figure FDA0002823334040000023
公式中,xi=di-di-1,di-1,di分别为前后连续时间点的数据,
Figure FDA0002823334040000024
Figure FDA0002823334040000025
分别为气温差值序列xi的累年平均值和标准差,超出阈值范围认为是可疑数据。
5.根据权利要求2所述的地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于:一致性检验通过以下公式得到:
Figure FDA0002823334040000026
公式中,σ为气温序列标准差,σ为某日历年所有年份标准差的平均值,
Figure FDA0002823334040000027
为某日累年标准差的平均值,超出阈值范围认为是可疑数据。
6.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于:所述步骤S3中建立月值参考序列的方法如下:
(1)对Berkeley Earth,CRUTS4.03和GHCNV3三类月值序列进行加权平均得到月值参考序列,其中,加权系数分别为三类数据与待检序列相关系数的平方;
(2)首先,从待检序列水平距离300km以内,海拔高度差200m范围内,选取20个地面气象站;其次,选取距离待检序列球面距离最近的10个地面气象站;最后,选取第一步和第二步相同的地面气象站,作为参考站;通过插值法,将对应参考站的Berkeley Earth月值格点数据插到站点水平,利用加权平均得到Berkeley Earth月值参考序列,其中,加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。
7.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于:所述步骤S4中建立日值参考序列的方法如下:
首先,从待检序列水平距离300km以内,海拔高度差200m范围内,选取20个地面气象站;其次,选取距离待检序列球面距离最近的10个地面气象站;最后,选取第一步和第二步相同的地面气象站,作为参考站;通过插值法,将对应参考站的Berkeley Earth日值格点数据插到站点水平,利用加权平均得到Berkeley Earth日值参考序列,其中,加权系数为BerkeleyEarth对应站点序列与待检序列相关系数的平方。
8.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于:所述步骤S4中的断点订正过程如下:利用惩罚最大T检验,通过两种月值参考序列对待检序列的月值序列同时进行检验,利用分位数匹配法,在日值参考序列下,采用有参考序列法对逐日气温序列进行订正,得到百年观测的均一化气温日值序列。
9.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法,其特征在于:所述步骤S6中评估过程如下:
比较最优插补序列与国际上权威的数据集,在不同空间尺度的趋势变化特点及其变化幅度,年代际变化特征,空间尺度包括独立的地面气象站点及中国区域;
比较最优插补序列与国际上权威的数据集,在不同空间尺度的极端温度事件及其趋势变化特点和幅度;
空间尺度包括独立的地面气象站点及中国区域;
极端温度事件包括日最低气温小于10%阈值或大于90%阈值的天数;
日最高气温小于10%阈值或大于90%阈值的天数。
CN202011422932.7A 2020-12-08 2020-12-08 地面气象站观测的百年均一化气温日值序列的构建方法 Active CN112559588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011422932.7A CN112559588B (zh) 2020-12-08 2020-12-08 地面气象站观测的百年均一化气温日值序列的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011422932.7A CN112559588B (zh) 2020-12-08 2020-12-08 地面气象站观测的百年均一化气温日值序列的构建方法

Publications (2)

Publication Number Publication Date
CN112559588A true CN112559588A (zh) 2021-03-26
CN112559588B CN112559588B (zh) 2023-01-24

Family

ID=75059539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011422932.7A Active CN112559588B (zh) 2020-12-08 2020-12-08 地面气象站观测的百年均一化气温日值序列的构建方法

Country Status (1)

Country Link
CN (1) CN112559588B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704558A (zh) * 2021-08-25 2021-11-26 成都信息工程大学 一种以差分序列为基础的自动气象站自动集群方法及系统
CN113761721A (zh) * 2021-08-17 2021-12-07 中国科学院新疆生态与地理研究所 —种基于栅格数据快速识别极端高/低温事件的方法
CN114706143A (zh) * 2022-02-18 2022-07-05 中国气象局成都高原气象研究所 一种基于气温日极小值的观测环境影响判别与评估方法
CN115587502A (zh) * 2022-11-23 2023-01-10 河北省气象技术装备中心 基于改进三次样条插值的探空资料插补方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942251A (zh) * 2014-03-13 2014-07-23 南京信息工程大学 基于多种质控方法的高空气象资料入库方法和入库系统
CN108846501A (zh) * 2018-04-26 2018-11-20 北京建筑大学 一种雨水低影响开发设施建设规模确定方法
CN111815155A (zh) * 2020-07-07 2020-10-23 南京信息工程大学 一种改进后的核回归地面气温观测资料质量控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942251A (zh) * 2014-03-13 2014-07-23 南京信息工程大学 基于多种质控方法的高空气象资料入库方法和入库系统
CN108846501A (zh) * 2018-04-26 2018-11-20 北京建筑大学 一种雨水低影响开发设施建设规模确定方法
CN111815155A (zh) * 2020-07-07 2020-10-23 南京信息工程大学 一种改进后的核回归地面气温观测资料质量控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
司鹏等: "利用RHtestsV4软件包对天津1951-2012年逐日气温序列的均一性分析", 《气候与环境研究》 *
司鹏等: "河北保定气象站长序列气温资料缺测记录插补和非均一性订正", 《气候变化研究进展》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113761721A (zh) * 2021-08-17 2021-12-07 中国科学院新疆生态与地理研究所 —种基于栅格数据快速识别极端高/低温事件的方法
CN113761721B (zh) * 2021-08-17 2024-04-19 中国科学院新疆生态与地理研究所 一种基于栅格数据快速识别极端高/低温事件的方法
CN113704558A (zh) * 2021-08-25 2021-11-26 成都信息工程大学 一种以差分序列为基础的自动气象站自动集群方法及系统
CN114706143A (zh) * 2022-02-18 2022-07-05 中国气象局成都高原气象研究所 一种基于气温日极小值的观测环境影响判别与评估方法
CN114706143B (zh) * 2022-02-18 2022-11-25 中国气象局成都高原气象研究所 一种基于气温日极小值的观测环境影响判别与评估方法
CN115587502A (zh) * 2022-11-23 2023-01-10 河北省气象技术装备中心 基于改进三次样条插值的探空资料插补方法
CN115587502B (zh) * 2022-11-23 2023-05-05 河北省气象技术装备中心 基于改进三次样条插值的探空资料插补方法

Also Published As

Publication number Publication date
CN112559588B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
CN112559588B (zh) 地面气象站观测的百年均一化气温日值序列的构建方法
Peterson et al. Global Historical Climatology Network (GHCN) quality control of monthly temperature data
Clarke et al. Derivation of a biological quality index for river sites: comparison of the observed with the expected fauna
Pielke Sr et al. Documentation of uncertainties and biases associated with surface temperature measurement sites for climate change assessment
CN107066831B (zh) 一种区域综合环境评价方法、装置及系统
Peterson et al. An overview of the Global Historical Climatology Network temperature database
Lakatos et al. Creation of a homogenized climate database for the Carpathian region by applying the MASH procedure and the preliminary analysis of the data
CN105824891B (zh) 测风塔数据自动上传的方法
KR101908865B1 (ko) 기온 측정 자료의 품질 분석방법
Mamara et al. Detection and correction of inhomogeneities in Greek climate temperature series.
CN110334404A (zh) 一种流域尺度骤发干旱精准识别方法
CN110738346A (zh) 一种基于威布尔分布的批次电能表可靠度预测方法
CN114936201A (zh) 基于自适应分块神经网络模型的卫星降水数据校正方法
Tuomenvirta Homogeneity testing and adjustment of climatic time series in Finland
CN116485263A (zh) 河流湿地碳汇监测评估方法
Zahradníček et al. Homogenization of monthly precipitation time series in Croatia.
Dumitrescu et al. Homogenization of a combined hourly air temperature dataset over Romania
Brugnara et al. The EUSTACE global land station daily air temperature dataset
CN113592260B (zh) 一种村庄空心化程度评估方法
Tolika et al. An evaluation of a general circulation model (GCM) and the NCEP–NCAR reanalysis data for winter precipitation in Greece
Cole et al. The use of flow duration curves as a data quality tool
CN116307858A (zh) 测绘成果质量检查与评分系统
CN116432032A (zh) 基于多源数据和机器学习的气象数据异常事件识别方法
CN113157684B (zh) 一种水利海量数据的查错方法
CN115407388A (zh) 一种基于arima模型的地震预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant