CN117057165B - 一种基于地面气象数据集群的模型参数优化方法 - Google Patents

一种基于地面气象数据集群的模型参数优化方法 Download PDF

Info

Publication number
CN117057165B
CN117057165B CN202311310875.7A CN202311310875A CN117057165B CN 117057165 B CN117057165 B CN 117057165B CN 202311310875 A CN202311310875 A CN 202311310875A CN 117057165 B CN117057165 B CN 117057165B
Authority
CN
China
Prior art keywords
model
station
stations
area
month
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311310875.7A
Other languages
English (en)
Other versions
CN117057165A (zh
Inventor
曾燕
邱新法
朱晓晨
谢志清
吴泓
刘岩
王珂清
吴昊
严殊祺
许金萍
徐进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute Of Meteorological Science And Technology Innovation
Nanjing University of Information Science and Technology
Original Assignee
Nanjing Institute Of Meteorological Science And Technology Innovation
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute Of Meteorological Science And Technology Innovation, Nanjing University of Information Science and Technology filed Critical Nanjing Institute Of Meteorological Science And Technology Innovation
Priority to CN202311310875.7A priority Critical patent/CN117057165B/zh
Publication of CN117057165A publication Critical patent/CN117057165A/zh
Application granted granted Critical
Publication of CN117057165B publication Critical patent/CN117057165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/06Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Geometry (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于地面气象数据集群的模型参数优化方法。基于气象站数据建模,需要充分考虑模型要素的时、空变化特征,传统模型以单站模型和集总模型为主,对上述因素的考虑不够全面。本发明设计的集群方法,通过不同组合的数据集群形式,多重优化建模的样本数据集,进而找到最优模型参数。

Description

一种基于地面气象数据集群的模型参数优化方法
技术领域
本发明属于大气与环境科学技术领域,尤其涉及基于地面气象数据集群的模型参数优化方法。
背景技术
常规地面气象数据具有时间序列长、观测规范、质量高等优势,大量模型的建立需要利用地面气象数据确定模型参数。受气候类型、地理环境等因素的影响,模型参数在空间和时间上存在变化,具有地域和季节差异,是决定模型性能的关键。
现有模型包括单站模型和集总模型两大类。单站模型以单个气象站数据为基础建模,模型参数受限于地面站密度及其分布特征;集总模型将研究域内所有气象站数据作为一个数据集建模,采用一套模型参数,忽略了模型参数在空间域的差异性。
发明内容
发明目的:针对现有技术存在的问题,本发明设计了一种基于地面气象数据集群的模型参数优化方法,通过在空间域、时间域两个维度的多种数据集群方案及其组合,设计建模的样本数据集,筛选优化模型参数,从而达到建立最优模型的目的。
技术方案:为实现上述发明目的,本发明采用以下技术方案:一种基于地面气象数据集群的模型参数优化方法,从空间域和时间域两个维度,采用不同的数据集群方案建立模型,并确定模型参数;所述模型包括集总模型、单站模型和区域模型;其中,所述集总模型和单站模型为区域模型的两种极端情况,所述区域模型及最优模型参数通过以下步骤确定:
步骤S1,邻近站与目标站距离计算
以目标站S i 为中心,通过式(1)计算周边邻近站与目标站距离,站间的距离计算式为:
(1)
式中,为周边邻近站S j 与目标站S i 的距离,/>分别为目标站S i 的经纬度坐标,/>分别为邻近站S j 的经纬度坐标,d为形状系数,/>,通过形状系数调节子区域形状,用距离指标/>衡量邻近站S j 与目标站S i 的邻近关系;
在确认站间距离的前提下,进而确定周边邻近站S j 与目标站S i 邻近次序;
步骤S2,设置最大邻近站数N max
步骤S3,目标站子区域确定
对于目标站S i ,在形状系数d为某一确定值情况下,按站间的邻近次序,选定n个与其最邻近站作为子区域站,
步骤S4,目标站子区域模型的确定
对于每个确定的子区域,采用区域模型数据集群方案,分别建立区域全年模型和区域分月模型,其中:
对于目标站S i ,最多可能建立的子区域模型数目为:;对于整个研究区,目标站遍历所有气象站,则研究区内最多可能的子区域模型数目为:站数;对所有子区域模型进行模型参数拟合,优选模型参数;
步骤S5,目标站最优模型参数确定
对于目标站S i ,在其所有子区域模型中,选取统计指标最优者对应的模型参数作为目标站S i 最优模型参数;
步骤S6,选取下一个目标站S i+1为中心,然后重复步骤S1- S5获得目标站S i+1的子区域模型及最优模型参数,直至遍历研究区所有气象站。
作为优选,步骤S2中所述最大邻近站数N max,取值结合站点密度确定,且N max不能超过研究区内总站数N,其最大赋值为N-1。
作为优选,步骤S2所述最大邻近站数N max,全国2400个站点密度的情况下,取值为20、30或40。
作为优选,所述集总模型包括集总全年模型和集总分月模型,其中:
所述集总全年模型,是将研究区内所有站所有月份的数据作为一个样本数据集,从而确定一套模型参数;
所述集总分月模型,是将研究区内所有站同一月份的数据作为一个样本数据集,按12个月份确定模型参数,得到各个月的模型参数。
作为优选,所述单站模型包括单站全年模型和单站分月模型,其中:
单站全年模型,是将单个站全年所有月份数据集作为一个样本数据集,分别确定各站模型参数;
单站分月模型,是将单个站同一月份的所有数据作为一个样本数据集,按12个月份确定模型参数,得到单站各个月的模型参数。
作为优选,所述区域模型包括区域全年模型和区域分月模型,其中:
区域全年模型,是将单个子区域内所有站全年所有月份数据作为一个样本数据集,分别确定各个子区域模型参数;
区域分月模型,是将单个子区域内所有站同一月份的所有数据作为一个样本数据集,按12个月份确定模型参数,得到子区域各个月的模型参数。
作为优选,所述数据集为地面气象观测数据集,所述地面气象观测数据包括气温、降水、湿度、风速、日照、云量和太阳辐射。
有益效果:与现有技术相比,本发明基于气象站数据建模,充分考虑了拟合要素的时、空变化特征。传统模型以单站模型和集总模型为主,对上述因素的考虑不够全面;而本发明设计的集群方法,通过不同组合的数据集群形式,多重优化建模的样本数据集,进而找到最优模型参数。
附图说明
图1为本发明所述区域模型及最优参数确定流程示意图。
实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明从空间域和时间域两个维度,采用不同的数据集群方案建立模型,并确定模型参数。模型的建立基于数据集类型选择,并通过数据拟合等方式确定模型参数,该过程为现有常规技术,本发明不展开介绍。所述数据集群方案分三类,分别是集总模型、单站模型和区域模型。三类模型空间域的范围不同,集总模型和单站模型是区域模型空间域范围的两种极端情况。每种类型按是否考虑时间域又分为两种类型,具体说明如下:
集总模型:不考虑模型参数在空间上的变化,将研究区域内所有气象站(简称为站,以下同)实测数据集群,建立模型,确定模型参数。包括两种模型:
集总全年模型:研究区内将所有站所有月份的数据作为一个样本数据集,确定一套模型参数,模型参数没有时间和空间的变化,模型数量为:1。
集总分月模型:将研究区内所有站同一月份的数据作为一个样本数据集,分1-12月确定模型参数,即1-12月各有一套模型参数,考虑了模型参数的季节(时间)变化,模型数量为:12。
单站模型:以单个站为基本空间单元,将每个站的实测数据作为样本数据集单元,建立模型,确定模型参数。包括两种模型:
单站全年模型:将单个站全年所有月份数据集作为一个样本数据集,分别确定各站模型参数,即每个站具有一套模型参数,考虑了模型参数的空间(区域)变化,模型数量为站数。
单站分月模型:将单个站同一月份的所有数据作为一个样本数据集,分1-12月确定各站模型参数,即每个站每个月具有一套模型参数,考虑了模型参数的时间(季节)和空间(区域)变化,模型数量为:站数×12。
区域模型:在整个研究区域内,将局部区域作为子区域,以每个子区域为基本空间单元,将子区域内所有站的实测数据作为一个样本数据集单元,建立模型,确定模型参数。包括两种模型:
区域全年模型:将单个子区域内所有站全年所有月份数据作为一个样本数据集,分别确定各子区域模型参数,即每个子区域具有一套模型参数,模型数量为:子区域数;
区域分月模型:将单个子区域内所有站同一月份的所有数据作为一个样本数据集,分1-12月确定各子区域模型参数,即每个子区域每个月具有一套模型参数,模型数量为:子区域数×12。
常规传统的模型建立,通常采用的是集总模型或单站模型形式,本发明创新性提出区域模型,并通过调节子区域的大小,涵盖单站模型与集总模型情况。区域模型需要解决子区域的自动划分问题,即子区域中包含哪些站、包含多少站等问题,从而确定数据集群方案。结合图1的流程,区域模型及最优模型参数确定,详见过程如下:
计算邻近站与目标站距离:以目标站S i 为中心,计算周边邻近站与目标站距离,确定周边邻近站S j 与目标站S i 邻近次序。考虑到气象要素的区域性分布特征,站间的距离计算式为:
(1)
式中,为距离指标,/>为目标站S i 位置,/>为邻近站S j 位置,d为形状系数,/>,通过形状系数调节子区域形状,用距离指标/>衡量邻近站S j 与目标站S i 的邻近关系,按距离指标/>由低到高排序确定邻近站的邻近次序。
设置最大邻近站数N max :子区域大小由气象站数目决定,参加数据集群的气象站数目需适度,如果太多则不能充分反映拟合要素规律的地域性;如果太少则会影响模型参数的可靠性和稳定性,通过设定最大邻近站数N max ,确定最大子区域大小。N max取值结合研究区站点密度确定,且N max不能超过研究区内总站数N,其最大赋值为N-1,全国2400个站点密度的情况下,其取值可为20、30或40。
目标站子区域确定:对于目标站S i ,在形状系数d为某一确定值情况下,按站间的邻近次序,选定n个与其最邻近站作为子区域站。/>时,对应于单站模型情形,/>且/>时,对应于集总模型情形。对于每个目标站,在形状系数按照/>取值情况下,邻近站数目按照/>取值情况下,最大可选的子区域数为:/>
目标站子区域模型确定:对于每个确定的子区域,采用区域模型数据集群方案,可分别建立区域全年模型和区域分月模型共13个模型。对于目标站S i ,最多可能建立的子区域模型数目为:。对于整个研究区,目标站遍历所有气象站,则研究区内最多可能的子区域模型数目为:/>站数。对所有子区域模型进行模型参数拟合,确定模型参数。
目标站最优模型参数确定:对于目标站S i ,在其所有子区域模型中,选取统计指标最优对应的模型参数作为目标站S i 最优模型参数,目标站遍历所有气象站,确定研究区内所有站的最优模型参数。
实施例
地表太阳辐射量是重要的气候要素,精确、定量地估测太阳辐射,具有十分重要的意义。太阳辐射的观测气象站比较少,应用常规气象观测资料,估算太阳辐射是众多太阳辐射计算方法的基本出发点。太阳总辐射主要依据Prescott(1940)计算式确定,即:
(2)
其中,Q为太阳总辐射量;Q 0为天文辐射量(可通过理论公式计算获得);R为日照百分率;ab为经验系数,与地区、季节和大气状态有关,需要用长期的观测资料来确定。
日照百分率R为常规气象资料,大部分常规气象站均有此观测资料,太阳总辐射为非常规观测资料,我国具有太阳总辐射观测的气象站(又称日射站)仅有一百多个,运用1961-2010年我国97个日射站观测资料,按照数据集群的模型参数优化方法,通过区域模型确定的各日射站最优模型参数见表1与表2(节选)。
表1 我国各日射站1-6月太阳总辐射计算经验系数
表2 我国各日射站7-12月太阳总辐射计算经验系数
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (7)

1.一种基于地面气象数据集群的模型参数优化方法,其特征在于,从空间域和时间域两个维度,采用不同的数据集群方案建立模型,并确定模型参数;所述模型包括集总模型、单站模型和区域模型;其中,所述集总模型和单站模型为区域模型的两种极端情况,所述区域模型及最优模型参数通过以下步骤确定:
步骤S1,邻近站与目标站距离计算
以目标站S i 为中心,通过式(1)计算周边邻近站与目标站距离,站间的距离计算式为:
(1)
式中,为周边邻近站S j 与目标站S i 的距离,/>分别为目标站S i 的经纬度坐标,分别为邻近站S j 的经纬度坐标,d为形状系数,/>,通过形状系数调节子区域形状,用距离指标/>衡量邻近站S j 与目标站S i 的邻近关系;
在确认站间距离的前提下,进而确定周边邻近站S j 与目标站S i 邻近次序;
步骤S2,设置最大邻近站数N max
步骤S3,目标站子区域确定
对于目标站S i ,在形状系数d为某一确定值情况下,按站间的邻近次序,选定n个与其最邻近站作为子区域站,
步骤S4,目标站子区域模型的确定
对于每个确定的子区域,采用区域模型数据集群方案,分别建立区域全年模型和区域分月模型,其中:
对于目标站S i ,最多可能建立的子区域模型数目为:;对于整个研究区,目标站遍历所有气象站,则研究区内最多可能的子区域模型数目为:站数;对所有子区域模型进行模型参数拟合,优选模型参数;
步骤S5,目标站最优模型参数确定
对于目标站S i ,在其所有子区域模型中,选取统计指标最优者对应的模型参数作为目标站S i 最优模型参数;
步骤S6,选取下一个目标站S i+1为中心,然后重复步骤S1- S5获得目标站S i+1的子区域模型及最优模型参数,直至遍历研究区所有气象站。
2.根据权利要求1所述基于地面气象数据集群的模型参数优化方法,其特征在于:步骤S2中所述最大邻近站数N max,取值结合站点密度确定,且N max不能超过研究区内总站数N,其最大赋值为N-1。
3.根据权利要求2所述基于地面气象数据集群的模型参数优化方法,其特征在于:步骤S2所述最大邻近站数N max,全国2400个站点密度的情况下,取值为20、30或40。
4.根据权利要求1所述基于地面气象数据集群的模型参数优化方法,其特征在于:所述集总模型包括集总全年模型和集总分月模型,其中:
所述集总全年模型,是将研究区内所有站所有月份的数据作为一个样本数据集,从而确定一套模型参数;
所述集总分月模型,是将研究区内所有站同一月份的数据作为一个样本数据集,按12个月份确定模型参数,得到各个月的模型参数。
5.根据权利要求1所述基于地面气象数据集群的模型参数优化方法,其特征在于:所述单站模型包括单站全年模型和单站分月模型,其中:
单站全年模型,是将单个站全年所有月份数据集作为一个样本数据集,分别确定各站模型参数;
单站分月模型,是将单个站同一月份的所有数据作为一个样本数据集,按12个月份确定模型参数,得到单站各个月的模型参数。
6.根据权利要求1所述基于地面气象数据集群的模型参数优化方法,其特征在于:所述区域模型包括区域全年模型和区域分月模型,其中:
区域全年模型,是将单个子区域内所有站全年所有月份数据作为一个样本数据集,分别确定各个子区域模型参数;
区域分月模型,是将单个子区域内所有站同一月份的所有数据作为一个样本数据集,按12个月份确定模型参数,得到子区域各个月的模型参数。
7.根据权利要求4所述基于地面气象数据集群的模型参数优化方法,其特征在于:所述数据集为地面气象观测数据集,所述地面气象观测数据包括气温、降水、湿度、风速、日照、云量和太阳辐射。
CN202311310875.7A 2023-10-11 2023-10-11 一种基于地面气象数据集群的模型参数优化方法 Active CN117057165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311310875.7A CN117057165B (zh) 2023-10-11 2023-10-11 一种基于地面气象数据集群的模型参数优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311310875.7A CN117057165B (zh) 2023-10-11 2023-10-11 一种基于地面气象数据集群的模型参数优化方法

Publications (2)

Publication Number Publication Date
CN117057165A CN117057165A (zh) 2023-11-14
CN117057165B true CN117057165B (zh) 2023-12-22

Family

ID=88659402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311310875.7A Active CN117057165B (zh) 2023-10-11 2023-10-11 一种基于地面气象数据集群的模型参数优化方法

Country Status (1)

Country Link
CN (1) CN117057165B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488871A (zh) * 2013-08-27 2014-01-01 国家电网公司 一种无径流资料地区的洪水预报方法
CN104680008A (zh) * 2015-02-12 2015-06-03 东南大学 一种基于多参考站的网络rtk区域大气误差建模方法
CN106874605A (zh) * 2017-02-22 2017-06-20 中国水利水电科学研究院 一种片麻岩土石山区山坡尺度水文过程模拟方法
CN106991274A (zh) * 2017-03-10 2017-07-28 李文华 流域库群及区域洪水联合调度方法、系统
CN107862148A (zh) * 2017-11-16 2018-03-30 清华大学 一种基于遥感数据的参考作物腾发量计算方法
CN113544744A (zh) * 2021-06-01 2021-10-22 华为技术有限公司 一种头部姿态测量方法及装置
WO2022042904A1 (en) * 2020-08-24 2022-03-03 Bareways GmbH Method and system for determining a condition of a geographical line

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488871A (zh) * 2013-08-27 2014-01-01 国家电网公司 一种无径流资料地区的洪水预报方法
CN104680008A (zh) * 2015-02-12 2015-06-03 东南大学 一种基于多参考站的网络rtk区域大气误差建模方法
CN106874605A (zh) * 2017-02-22 2017-06-20 中国水利水电科学研究院 一种片麻岩土石山区山坡尺度水文过程模拟方法
CN106991274A (zh) * 2017-03-10 2017-07-28 李文华 流域库群及区域洪水联合调度方法、系统
CN107862148A (zh) * 2017-11-16 2018-03-30 清华大学 一种基于遥感数据的参考作物腾发量计算方法
WO2022042904A1 (en) * 2020-08-24 2022-03-03 Bareways GmbH Method and system for determining a condition of a geographical line
CN113544744A (zh) * 2021-06-01 2021-10-22 华为技术有限公司 一种头部姿态测量方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"重庆市主城区生态用地对城市热环境影响研究";房力川;《中国优秀硕士学位论文全文数据库 基础科学辑》(第1期);A009-100 *
"Determination of the tridimensional shape of canopy gaps using two hemispherical photographs";Lile Hu等;《Agricultural and Forest Meteorology》;第149卷(第5期);862-872 *

Also Published As

Publication number Publication date
CN117057165A (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
CN110008982B (zh) 一种基于光伏发电出力聚类的气象监测点选择方法
CN111259522B (zh) 一种水文模型在地理空间上多流域并行率定的方法
KR101383617B1 (ko) 일사량 예측 방법 및 장치
CN106600060B (zh) 基于相似日晴朗系数修正的太阳辐照量预测方法
CN110781458B (zh) 一种基于混合回归模型预测地表太阳辐照度的方法
CN110501761B (zh) 一种不同预见期区域作物ETc预测预报方法
CN107818403A (zh) 基于代表性水平面辐射数据优化光伏面板安装倾角的方法
CN101873605B (zh) 一种网络规划中自适应传播环境分类方法
Yin et al. Relationship between urban morphology and land surface temperature—A case study of Nanjing City
CN111815021A (zh) 一种基于太阳辐射气候特征识别的光伏功率预测方法
CN115114873B (zh) 海洋环境重现期设计标准推算方法与系统
CN111553459A (zh) 一种基于遥感信息的灌溉地区逐日实际蒸散发估算方法
CN117057165B (zh) 一种基于地面气象数据集群的模型参数优化方法
CN109614649B (zh) 一种面向华南地区桥梁的全气候热分析方法
CN111815020A (zh) 一种基于太阳辐射气候特征识别的南墙辐射预测方法
CN113437938B (zh) 考虑因地域差异的现场特征的光伏阵列输出功率计算方法
CN110765420A (zh) 一种基于pso-fi的地面自动气象站气温观测资料质量控制方法
Mutani et al. Urban Building Energy Modeling: an hourly energy balance model of residential buildings at a district scale
CN106875038B (zh) 基于集合局地多点不同气候特征的风功率预测方法及装置
CN110210525B (zh) 基于K-Means聚类的设计日气象要素逐时变化特征提取方法
CN103617452A (zh) 一种大型光伏基地区域测光网络布局方法
CN111815155A (zh) 一种改进后的核回归地面气温观测资料质量控制方法
CN113283100B (zh) 一种陆上风资源数字信息化开发方法
CN116645011B (zh) 一种评估建筑气候分区性能的量化指数计算方法
Haider DIURNAL TEMPERATURE RANGE (DTR) ASSESSMENT IN MAJOR CITIES OF PUNJAB, PAKISTAN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant