CN112559588A

CN112559588A - 地面气象站观测的百年均一化气温日值序列的构建方法

Info

Publication number: CN112559588A
Application number: CN202011422932.7A
Authority: CN
Inventors: 司鹏; 罗传军; 王琪; 王敏; 姜罕盛
Original assignee: Tianjin Meteorological Information Center Tianjin Meteorological Archives
Current assignee: Tianjin Meteorological Information Center Tianjin Meteorological Archives
Priority date: 2020-12-08
Filing date: 2020-12-08
Publication date: 2021-03-26
Anticipated expiration: 2040-12-08
Also published as: CN112559588B

Abstract

本发明提供了地面气象站观测的百年均一化气温日值序列的构建方法，建立百年均一化气温日值序列的基础数据，数据拼接形成完整的百年序列，然后对其进行质量控制，百年序列进行均一化检验，在均一化检验中建立月值参考序列，通过检验得到断点；进而，在日值参考序列下，基于有参考序列法的订正，得到百年观测的均一化气温日值序列；对百年观测的均一化气温日值序列，通过数据插补得到最优插补序列；对最优插补序列进行评估，得到最终的均一化气温日值序列。本发明所述的构建方法，克服代用资料对极端气候变化定量分析的困难；发展组合性均一化分析方法，提高检测断点的真实性，增强修正数据的可靠性，为极端气候变化研究领域建立新的数据基础。

Description

地面气象站观测的百年均一化气温日值序列的构建方法

技术领域

本发明属于地面气象站观测数据技术领域，尤其是涉及地面气象站观测的百年均一化气温日值序列的构建方法。

背景技术

作为第一手资料的气象站观测记录得到了最为广泛的应用，与其他数据相比，其具有代表性和准确性的优点。但目前，由于站点覆盖度、资料的完整性及观测序列的非均一化等问题，使得19世纪到20世纪中叶长达百年尺度的气候变化特征仍然存在着许多不确定性，对于深入系统地检测区域或局地气候变化规律及预测未来的气候变化趋势缺乏可靠观测依据。我国能够收集到最早的仪器观测资料始于19世纪40年代，20世纪40年代又由于历史原因使得部分站点观测中断、资料缺失，导致1950年以前的气候变化研究结论无法得到很好的诠释。同时，在实际观测中由于观测站点迁移、仪器变更、观测时次改变等不可避免地造成长期观测资料存在非均一化问题，导致序列产生突变。均一化是解决气候资料非均一化的重要技术手段，通过剔出数据中的系统偏差，保留真实的气候变化特征。然而，我国1950年以前的站点数量稀少，元数据信息普遍严重缺失，给长年代气候资料的均一化分析带来很大困难。因此，如何建立完整可靠的长时间观测序列一直是气候变化研究中首先需要解决的关键问题。

目前，国内外对于长年代序列的建立普遍基于年值和月值的研究，这对于百年尺度极端气候事件的检测特别是1950年以前的事件存在很大困难。并且由于资料的均一化处理程度不够，没有对仪器变更、观测时次改变、业务变更等影响因素进行全面系统的剔除。检验方法存在单一性，参考序列的建立方法缺乏普遍适用性，影响序列断点判识的真实性。第一，在以往长年代气候序列的建立中，研究较多的是平均气温要素，并且缺测数据的插补采用代用资料，对近百年极端气候变化的定量检测有很大困难；第二，前人对建立序列的气候代表性或质量并未进行深入考量，尤其是均一化处理技术的应用不够；第三，在数据处理分析过程中，由于考虑的是区域大范围的空间尺度，对各个站点具体沿革背景了解不够深入，造成部分站点资料的断点订正不合理；第四，由于日值序列自身变率较大，均一化检测存在困难，导致长年代可靠的日值资料研究甚少，严重阻碍了百年来极端气候事件变化的研究。因此，需要采用更加完整的元数据信息及组合性均一化技术方法，基于更加细致的时间分辨率资料，如日值尺度，构建我国数量有限的珍贵的百年可靠气候序列，为我国不同区域气候背景条件下长年代日值序列的建立提供借鉴。进而更为客观的揭示我国百年来极端气候事件的变化规律，量化其变化幅度，从而为制定科学的对策减缓和适应极端气候变化带来的不利影响提供基础支撑。

发明内容

有鉴于此，本发明旨在提出地面气象站观测的百年均一化气温日值序列的构建方法，以解决原始观测的百年逐日平均气温、最高气温和最低气温序列中连续缺测数据较多，非均一化问题明显，如何构建完整可靠的百年尺度日值序列的问题。

为达到上述目的，本发明的技术方案是这样实现的：

地面气象站观测的百年均一化气温日值序列的构建方法，包括以下步骤：

S1、根据地面气象站观测的信息建立百年均一化气温日值序列的基础数据；

S2、对百年均一化气温日值序列的基础数据通过数据拼接形成完整的百年序列，然后对其进行质量控制；

S3、基于质量控制后的百年序列进行均一化检验，在均一化检验中建立月值参考序列，通过检验得到断点；

S4、利用建立的日值参考序列通过分位数匹配法进行断点订正，得到百年观测的均一化气温日值序列；

S5、基于步骤S4中得到百年观测的均一化气温日值序列，通过数据插补得到最优插补序列；

S6、对最优插补序列进行评估，最终得到新建的百年均一化气温日值序列。

进一步的，所述步骤S2中的质量控制过程如下：

1)、对气候界限值检验进行初步质量控制，范围在-80℃≤气温日值≤60℃，超出阈值范围认为是错误数据；

2)、气候异常值检验进行初步质量控制，气温序列3-5倍标准差为阈值标准，超出阈值认为是可疑数据，通过人工判断是否为错误数据；

3)、内部一致性检验进行初步质量控制，最低气温≤平均气温≤最高气温，超出阈值范围认为是错误数据；

人工通过对以上3步认为错误数据均置为缺测标志。

进一步的，界限值检验通过以下公式得到：

公式中，

和σ_x分别为气温序列累年平均值和标准差，累年最优为30年，30年标准气候期定义可以是1961-1990、1971-2000、1981-2010，超出阈值范围认为是可疑数据。

进一步的，突变检验通过以下公式得到：

公式中，x_i＝d_i-d_i-1,d_i-1,d_i分别为前后连续时间点的数据，

和

分别为气温差值序列x_i的累年平均值和标准差，累年最优为30年，30年标准气候期定义可以是1961-1990、1971-2000、1981-2010，超出阈值范围认为是可疑数据。

进一步的，一致性检验通过以下公式得到：

公式中，σ为气温序列标准差，σ_jσ为某日历年所有年份标准差的平均值，

为某日累年标准差的平均值，累年最优为30年，30年标准气候期定义可以是1961-1990、1971-2000、1981-2010，超出阈值范围认为是可疑数据。

进一步的，所述步骤S3中建立月值参考序列的方法如下：(1)对Berkeley Earth，CRUTS4.03和GHCNV3三类月值序列进行加权平均得到月值参考序列，其中，加权系数分别为三类数据与待检序列相关系数的平方；

(2)首先，从待检序列水平距离300km以内，海拔高度差200m范围内，选取20个地面气象站；其次，选取距离待检序列球面距离最近的10个地面气象站；最后，选取第一步和第二步相同的地面气象站，作为参考站；通过插值法，将对应参考站的Berkeley Earth月值格点数据插到站点水平，利用加权平均得到Berkeley Earth月值参考序列，其中，加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。

进一步的，所述步骤S4中建立日值参考序列的方法如下：

首先，从待检序列水平距离300km以内，海拔高度差200m范围内，选取20个地面气象站；其次，选取距离待检序列球面距离最近的10个地面气象站；最后，选取第一步和第二步相同的地面气象站，作为参考站；通过插值法，将对应参考站的Berkeley Earth日值格点数据插到站点水平，利用加权平均得到Berkeley Earth日值参考序列，其中，加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。

进一步的，所述步骤S4中的断点订正过程如下：利用惩罚最大T检验，通过两种月值参考序列对待检序列的月值序列同时进行检验，利用分位数匹配法，在日值参考序列下，采用有参考序列法对逐日气温序列进行订正，得到百年观测的均一化气温日值序列。

进一步的，所述步骤S6中评估过程如下：

比较最优插补序列与国际上权威的数据集，在不同空间尺度的趋势变化特点及其变化幅度，年代际变化特征，空间尺度包括独立的地面气象站点及中国区域；

比较最优插补序列与国际上权威的数据集，在不同空间尺度的极端温度事件及其趋势变化特点和幅度；

空间尺度包括独立的地面气象站点及中国区域；

极端温度事件包括日最低气温小于10％阈值或大于90％阈值的天数；

日最高气温小于10％阈值或大于90％阈值的天数。

相对于现有技术，本发明所述的地面气象站观测的百年均一化气温日值序列的构建方法具有以下优势：

(1)本发明所述的基于百年观测资料的序列完整性恢复方法，克服代用资料对极端气候变化定量分析的困难；发展组合性均一化分析方法，提高检测断点的真实性，增强修正数据的可靠性。

(2)本发明所述的构建方法，为极端气候变化研究领域建立新的数据基础。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明实施例所述的地面气象站观测的百年均一化气温日值序列的构建方法流程图。

具体实施方式

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以通过具体情况理解上述术语在本发明中的具体含义。

下面将参考附图并结合实施例来详细说明本发明。

如图1所示，地面气象站观测的百年均一化气温日值序列的构建方法，包括以下步骤：

S2、对百年均一化气温日值序列的基础数据通过数据拼接形成完整的百年序列，然后对其进行质量控制。

所述步骤S2中数据拼接过程如下：

①对多来源资料的数据质量由低到高依次排序；

②对多来源数据的重合记录，设置一致率、相关系数、均值t检验、方差F检验4步综合判断，仅对满足上述4个条件的数据源进行整合。

一致率检验判断过程如下：

一致率P定义为：δ_j＝|T_j ^a-T_j ^b| (1)

公式(1)-(2)中，上标a、b分别代表来自两个数据源的要素资料，δ_j为绝对误差，ε_j为最小相对误差。当ε_j≤15％或δ_j≤5℃时，认为两组数据一致，

赋值为1，统计数据重合时期

为1的百分比即为一致率；当一致率大于85％，通过检验。

相关系数检验判断过程如下：当两个数据源逐日气温要素相关系数大于0.9，通过检验。

均值t检验判断过程如下：95％-99％显著性检验判定两组资料均值不存在显著差异，通过检验。

方差F检验判断过程如下：95％-99％显著性检验判定两组资料方方差不存在显著差异，通过检验。

所述步骤S2中的质量控制过程如下：

人工通过对以上3步认为错误数据均置为缺测标志。

界限值检验通过以下公式得到：

公式(5)中，

突变检验通过以下公式得到：

公式(6)中，x_i＝d_i-d_i-1,d_i-1,d_i分别为前后连续时间点的数据，

和

分别为气温差值序列x_i的累年平均值和标准差累年最优为30年，30年标准气候期定义可以是1961-1990、1971-2000、1981-2010，超出阈值范围认为是可疑数据。

一致性检验通过以下公式得到：

公式(7)中，σ为气温序列标准差，σ_jσ为某日历年所有年份标准差的平均值，

为某日累年标准差的平均值，超出阈值范围认为是可疑数据，其中累年最优为30年，30年标准气候期定义可以是1961-1990、1971-2000、1981-2010。

所述步骤S3中建立月值参考序列的方法如下：(1)对Berkeley Earth，CRUTS4.03和GHCNV3三类月值序列进行加权平均得到月值参考序列，其中，加权系数分别为三类数据与待检序列相关系数的平方；

(2)首先，从待检序列水平距离300km以内，海拔高度差200m范围内，选取20个地面气象站；其次，选取距离待检序列球面距离最近的10个地面气象站；最后，选取第一步和第二步相同的地面气象站，作为参考站；通过插值法(此处的插值法最优为双线性插值法)，将对应参考站的Berkeley Earth格点数据插到站点水平，利用加权平均得到Berkeley Earth月值参考序列，其中，加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。

所述步骤S4中建立日值参考序列的方法如下：

首先，从待检序列水平距离300km以内，海拔高度差200m范围内，选取20个地面气象站；其次，选取距离待检序列球面距离最近的10个地面气象站；最后，选取第一步和第二步相同的地面气象站，作为参考站；通过插值法(此处的插值法最优为双线性插值法)，将对应参考站的Berkeley Earth日值格点数据插到站点水平，利用加权平均得到BerkeleyEarth日值参考序列，其中，加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。

所述步骤S4中的断点订正过程如下：利用惩罚最大T检验，通过两种参考序列对待检序列的月值序列同时进行检验，利用分位数匹配法，在日值参考序列下，采用有参考序列法对逐日气温序列进行订正，得到百年观测的均一化气温日值序列。

所述步骤S5中的数据插补方法如下：利用标准化序列法和线性回归法对各要素连续缺测年份的逐日资料进行插补。

所述步骤S6中评估过程如下：

比较最优插补序列与国际上权威的数据集，在不同空间尺度的极端温度事件及其趋势变化特点和幅度，空间尺度包括独立的地面气象站点及中国区域。极端温度事件包括日最低气温小于10％阈值或大于90％阈值的天数；日最高气温小于10％阈值或大于90％阈值的天数；气温日较差；每月内日最高气温的最大值；每月内日最低气温的最小值。

本专利的3个关键技术分别是均一化检验和订正方法、参考序列建立方法、资料插补方法。

1、数据源

(1)基础资料源

①地面气象站观测的逐日平均气温、最高气温和最低气温数据。

②地面气象站元数据：地面气象站的历史沿革资料和历史档案信息。

(2)参考站资料源

①Berkeley Earth：Berkeley Earth Surface Temperature group landTemperature日值和月值1°×1°格点数据；网址为：http://berkeleyearth.org/data/。

②CRUTS4.03：Climatic Research Unit Time-Series land temperature,version 4.03月值0.5°×0.5°格点数据；网址为：http://data.ceda.ac.uk/badc/cru/data/cru_ts/cru_ts_4.03/data/。

③GHCNV3：Global Historical Climatology Network land temperature,version3月值站点数据；网址为：https://www.ncdc.noaa.gov/ghcnd-data-access。

以上(2)中的①、②、③均为国外数据集的名字分别对应以上Berkeley Earth、CRUTS4.03、GHCNV3。

2、数据整合

(1)数据拼接

①数据源优先级原则：针对1951年以前的资料，从数据量优势角度，同时兼顾资料的完整性和时间长度对多来源资料的数据质量由低到高依次排序。

②多源数据整合：对多来源数据的重合记录，设置一致率、相关系数、均值t检验、方差F检验4步综合判断，仅对满足上述4个条件的数据源进行整合，整合遵循①数据源筛选原则。

一致率检验：

一致率P定义为：δ_j＝|T_j ^a-T_j ^b| (1)

赋值为1，统计数据重合时期

为1的百分比即为一致率。当一致率大于85％，通过检验。

相关系数检验：当两个数据源逐日气温要素相关系数大于0.9，通过检验。

均值t检验：95％-99％显著性检验判定两组资料均值不存在显著差异，通过检验。

方差F检验：95％-99％显著性检验判定两组资料方差不存在显著差异，通过检验。

(2)质量控制

①初步质量控制：包括气候界限值检验、气候异常值检验、内部一致性检验。

气候界限值检验：-80℃≤气温日值≤60℃，超出阈值范围认为是错误数据。

气候异常值检验：气温序列3-5倍标准差为阈值标准，超出阈值认为是可疑数据，通过人工判断是否为错误数据。

内部一致性检验：最低气温≤平均气温≤最高气温，超出阈值范围认为是错误数据。

对以上3步认为错误数据均置为缺测标志。

②动态f值检验：包括界限值检验、突变检验、时间一致性检验。f值定义为动态的，依据检验出的疑误数据量不能超过总数据量的2％或5％来定义。

界限值检验：

公式(5)中，

突变检验：

和

一致性检验：

对公式(5)-(7)检验出的可疑数据进行综合分析，通过人工判断是否为错误数据，对错误数据均置为缺测标志。

3、数据均一化

基于2步质量控制后的序列(以下称为“待检序列”)，通过RHtestV4中惩罚最大T检验法及分位数匹配法，结合地面气象站历史沿革和档案信息，对其进行均一化检验和订正，剔除逐日气温序列中因迁站、仪器变更、观测时次改变、自动站业务化等导致的序列系统误差，建立能够反映真实气候变化特征的气温日值序列。

①参考序列的建立：均一化分析处理中，参考序列建立的合理与否关系到断点的检验是否可靠。在这个过程中，建立月值参考序列来检验待检序列断点，建立日值参考序列作为待检序列断点的订正序列。

月值参考序列的建立分两种方法：一种对Berkeley Earth，CRUTS4.03和GHCNV3三类月值序列进行加权平均得到，其中，加权系数分别为三类数据与待检序列相关系数的平方。另一种仅用到Berkeley Earth月值数据，首先，从待检序列水平距离300km以内，海拔高度差200m范围内，选取20个地面气象站(第一步)；其次，选取距离待检序列球面距离最近的10个地面气象站(第二步)；最后，选取第一步和第二步相同的地面气象站，作为参考站。通过插值法(此处的插值法最优为双线性插值法)，将对应参考站的Berkeley Earth月值格点数据插到站点水平，利用加权平均得到Berkeley Earth月值参考序列，其中，加权系数为Berkeley Earth对应站点序列与待检序列相关系数的平方。

日值参考序列的建立：仅用到Berkeley Earth日值数据，参考序列的建立方法同上述Berkeley Earth月值参考序列。

②断点检验和订正：利用惩罚最大T检验(95％显著性水平下)，通过两种月值参考序列对待检序列的月值序列同时进行检验。断点的确定分两种情况：一种是，在没有地面气象站历史沿革资料和档案信息情况下，选取在两种月值参考序列下同时被检验出的显著的序列断点；另一种是，在有地面气象站历史沿革资料和档案信息情况下，如果检验得到的显著序列断点的时间位置，与这些资料记载的时间一致，则保留该断点。

利用分位数匹配法，在日值参考序列下，采用有参考序列法对逐日气温序列进行订正，订正的断点为上述两种情况保留的显著断点。从而，得到百年观测的均一化气温日值序列。

4、数据插补

基于3步得到的百年观测的均一化气温日值序列，利用标准化序列法和线性回归法对各要素连续缺测年份的逐日资料进行插补。参考站资料源最优为Berkeley Earth逐日气温资料，利用通过插值法(此处的插值法最优为双线性插值法)，根据地面气象站经纬度位置，将Berkeley Earth1°×1°格点数据插到站点水平。

①标准化序列法：该方法是假设对于在同一气候区域内的所有站点，某一时间点的气象要素值与该时间点多年平均值的距平都是相似的。表示为：

公式(8)-(9)中，Z是参考站资料源逐日气温标准化序列，x_i、

和s_i分别是参考站资料源某日气温值，某日累年气温平均值和标准差。y_Tj插补序列，

和s_Tj分别表示地面气象站观测的某日累年气温平均值和标准差。累年的定义范围为待插补序列与参考站资料源重合的连续的并且没有显著断点的时段，累年最优为30年，30年标准气候期定义可以是1961-1990、1971-2000、1981-2010。

②线性回归法：该方法是通过建立邻近站与待插补站时间序列的定量线性统计关系，来对待插补站序列

进行插补，表达关系式如下：

源和地面气象站观测的累年逐日气温序列，累年的定义范围为待插补序列与参考站资料源重合的连续的并且没有显著断点的时段，例如30年。

对于建立的定量统计关系公式(10)是否确有线性关系，需要通过回归方程的显著性检验进行验证，检验统计量F如公式(12)所示，服从分子自由度为1，分母自由度为(n-2)的F分布。在显著性水平α＝0.05下，若F>F_0.05，则认为回归方程显著，线性关系成立。

公式(12)-(14)中，

y_j和

分别是某日插补值，实际观测值以及实际观测序列累年平均值，累年的定义范围为插补序列与参考站资料源重合的连续的并且没有显著断点的时段，例如30年。

同时，为确定建立的线性统计关系的可信度，研究中还对得到的回归系数进行了显著性检验，检验统计量t如公式(15)所示，服从自由度为(n-2)的t分布，在显著性水平α＝0.05下，若|t|>t_0.05，则认为拟合的回归系数通过显著性t检验，线性关系成立。

公式(15)中，b利用公式(11)求得，Q利用公式(14)求得。公式(16)中，x_j和

分别是参考站资料源某日气温值，参考站资料源某日累年气温平均值。累年的定义范围为插补序列与参考站资料源重合的连续的并且没有显著断点的时段，例如30年。

③误差分析：对①和②插补得到的逐日气温序列与地面气象站实际观测的逐日气温序列进行误差分析，误差评估指标分别包括标准均方误(SMSE)、标准误差(SE)、插补值与地面气象站实际观测值差值在±0.5℃范围内的样本比例(P)、插补值与地面气象站实际观测值的相关性。通过比较误差大小，选取最优的插补序列进行下一步分析，即标准均方误(SMSE)和标准误差(SE)误差较小，样本比例(P)较大、相关系数较高的插补方法得到的逐日气温序列。

公式(17)中，m是样本总量，

和y_i分别是某日气温插补值和实际观测值，s是地面气象站实际观测的某日30年气温标准差。30年气候期可以定义为1961-1990、1971-2000、1981-2010。

公式(18)中，

m，

和y_i与公式(17)一致。

公式(19)中，m_p是逐日插补值与实际观测值差值在±0.5℃范围内的样本数量，m是样本总量。

公式(20)中，x_ki和x_li分别是某日插补值与实际观测值，

和

分别是某日插补序列和实际观测序列样本总量的平均值，m是样本总量。

5、可用性评估

通过与国际上权威的数据集(Berkeley Earth、CRUTS4.03)进行对比，评估基于4步得到的最优插补序列的可靠性。

①百年平均温度的趋势变化

比较最优插补序列(平均气温、最高气温、最低气温)与国际上权威的数据集，在不同空间尺度的趋势变化特点及其变化幅度，年代际变化特征，空间尺度包括独立的地面气象站点及中国区域。

②百年极端温度的趋势变化

比较最优插补序列(最高气温、最低气温)与国际上权威的数据集，在不同空间尺度的极端温度事件及其趋势变化特点和幅度，空间尺度包括独立的地面气象站点及中国区域。极端温度事件包括日最低气温小于10％阈值或大于90％阈值的天数；日最高气温小于10％阈值或大于90％阈值的天数；气温日较差；每月内日最高气温的最大值；每月内日最低气温的最小值。

具体方法如下：

1、选取基础资料源，包括①地面气象站观测的逐日平均气温、最高气温和最低气温数据，作为建立百年均一化气温日值序列的基础数据。②地面气象站的历史沿革资料和历史档案信息，作为均一化检验断点判断的依据。

选取参考站资料源，作为数据均一化中建立参考序列以及数据插补的参考序列。

2、首先对基础资料源中的①通过数据拼接形成完整的百年序列。然后对其进行质量控制。

3、基于质量控制后的百年序列进行均一化检验，其中，在均一化检验中，需要建立月值参考序列，通过检验得到断点。然后，利用建立的日值参考序列通过分位数匹配法进行断点订正，得到百年观测的均一化气温日值序列。

4、基于3步得到百年观测的均一化气温日值序列，通过数据插补得到最优插补序列。

5、对最优插补序列进行评估，通过与国际上权威的数据集(Berkeley Earth、CRUTS4.03)进行对比，对比的指标分别是百年平均温度的趋势变化、百年极端温度事件的变化。最终得到新建的百年均一化气温日值序列。

在上述具体方法中，基于具体方法如下的步骤2质量控制后的百年序列，首先进行数据插补，然后进行均一化检验和订正，也是可行的实施方法，该方法对于大量连续缺测的观测序列具有较好的优势。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于包括以下步骤：

2.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于：所述步骤S2中的质量控制过程如下：

人工通过对以上3步认为错误数据均置为缺测标志。

3.根据权利要求2所述的地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于：界限值检验通过以下公式得到：

公式中，

和σ_x分别为气温序列为累年平均值和标准差，超出阈值范围认为是可疑数据。

4.根据权利要求2所述的地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于：突变检验通过以下公式得到：

公式中，x_i＝d_i-d_i-1,d_i-1,d_i分别为前后连续时间点的数据，

和

分别为气温差值序列x_i的累年平均值和标准差，超出阈值范围认为是可疑数据。

5.根据权利要求2所述的地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于：一致性检验通过以下公式得到：

为某日累年标准差的平均值，超出阈值范围认为是可疑数据。

6.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于：所述步骤S3中建立月值参考序列的方法如下：

(1)对Berkeley Earth，CRUTS4.03和GHCNV3三类月值序列进行加权平均得到月值参考序列，其中，加权系数分别为三类数据与待检序列相关系数的平方；

7.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于：所述步骤S4中建立日值参考序列的方法如下：

首先，从待检序列水平距离300km以内，海拔高度差200m范围内，选取20个地面气象站；其次，选取距离待检序列球面距离最近的10个地面气象站；最后，选取第一步和第二步相同的地面气象站，作为参考站；通过插值法，将对应参考站的Berkeley Earth日值格点数据插到站点水平，利用加权平均得到Berkeley Earth日值参考序列，其中，加权系数为BerkeleyEarth对应站点序列与待检序列相关系数的平方。

8.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于：所述步骤S4中的断点订正过程如下：利用惩罚最大T检验，通过两种月值参考序列对待检序列的月值序列同时进行检验，利用分位数匹配法，在日值参考序列下，采用有参考序列法对逐日气温序列进行订正，得到百年观测的均一化气温日值序列。

9.根据权利要求1所述的地面气象站观测的百年均一化气温日值序列的构建方法，其特征在于：所述步骤S6中评估过程如下：

空间尺度包括独立的地面气象站点及中国区域；

日最高气温小于10％阈值或大于90％阈值的天数。