CN107526083B - 一种基于天气雷达数据的强对流风力等级预测方法 - Google Patents

一种基于天气雷达数据的强对流风力等级预测方法 Download PDF

Info

Publication number
CN107526083B
CN107526083B CN201710978296.8A CN201710978296A CN107526083B CN 107526083 B CN107526083 B CN 107526083B CN 201710978296 A CN201710978296 A CN 201710978296A CN 107526083 B CN107526083 B CN 107526083B
Authority
CN
China
Prior art keywords
sample
sub
wind
ratio
moment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710978296.8A
Other languages
English (en)
Other versions
CN107526083A (zh
Inventor
庄文兵
熊小伏
李勇杰
孙谊媊
张龙
魏伟
王建
王伟
刘泽青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd
Original Assignee
Chongqing University
Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University, Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd filed Critical Chongqing University
Priority to CN201710978296.8A priority Critical patent/CN107526083B/zh
Publication of CN107526083A publication Critical patent/CN107526083A/zh
Application granted granted Critical
Publication of CN107526083B publication Critical patent/CN107526083B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/88Radar or analogous systems specially adapted for specific applications
    • G01S13/95Radar or analogous systems specially adapted for specific applications for meteorological use
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/40Means for monitoring or calibrating
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/41Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Electromagnetism (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于天气雷达数据的强对流风力等级预测方法,以天气雷达监测数据为预测信息源,将强对流大风风力的预测问题处理为“有监督学习下的分类问题”,根据天气雷达对强对流的监测数据与自动气象站的风速监测数据间的对应关系,利用串行SVM方法构造了分类器,实现对风力的三级预测,并通过下采样方法改善了低风速、高风速数据样本间的不平衡对模型分类效果影响;该风力预测模型可对强对流天气带来的地面大风情况进行定量预测,将弥补气象部门的常规风预报不能覆盖“小尺度、突发且易消逝”的强对流天气的不足,可作为强对流天气下输电线路风偏放电风险预警的重要支撑。

Description

一种基于天气雷达数据的强对流风力等级预测方法
技术领域
本发明涉及电力气象技术领域,尤其涉及一种预测强对流风力的方法。
背景技术
雷达应用于气象行业至今已有半个多世纪的历史,新一代多普勒天气雷达为强对流等灾害性天气的监测、预报、预警等气象学难题提供了有效的途径。强对流天气是指出现短时强将水、雷雨大风、龙卷风、冰雹和飑线等现象的灾害性天气,它发生在对流云系或单体对流云块中,在气象上属于中小尺度天气系统。强对流天气的根源是空气强烈的垂直运动,在强对流天气下,输电线路极容易发生安全故障,尤其是发生线路风偏。由于强对流天气持续时间很短,常规的风速预报是整点预报,预报周期最短只能达到1小时,采用风速预报无法准确的反映出强对流天气下的风力情况,例如:10:10~10:50发生强对流天气,那么11:00时的常规风速预报仍很低,仅凭常规风预报无法判断是否已发生过强对流天气。
雷达回波特征是进行预报强对流天气的重要依据,例如强冰雹天气在雷达上表现为“高悬的强回波”特征,雷暴大风天气表现为“中层径向辐合”和“弓形回波”等,基于这些雷达特征衍生出众多强对流天气的预报方法,但大都是关于强对流天气发生与否、发生类型以及落区等的定性预报。对电网部门来说,往往更希望了解并量化“强对流天气将带来的风险”以制定科学合理的防控决策,相比于定性预报,强对流天气的定量预报或预测能为电网提供更多有价值的信息,也是进行电网气象预警不可或缺的一部分。尤其是,针对强对流天气下的线路风偏放电预警,气象部门发布的常规气象预报往往难以满足其需求。
发明内容
针对上述现有技术的不足,本发明提供一种基于天气雷达数据的强对流风力等级预测方法,解决现有技术中不能对强对流风力进行定量预测的技术问题,目的在于实现对强对流天气下的风力等级的预测。
为了解决上述技术问题,本发明采用了如下的技术方案:一种基于天气雷达数据的强对流风力等级预测方法,其特征在于:包括以下步骤:
步骤101:根据风速阈值将风力等级划分为0到m级,风力等级用LV表示,则LV∈{LV0,LV1,....,LVj,...,LVm},j∈{0,1,...,m};
步骤102:以支持矢量机SVM作为子分类器,采用n个子分类器从第1个到第n个依次串联的方式构造多分类器,其中n=m;每一个子分类器能够将风力等级分为两类;为每一个子分类器设置一个对应的标签,第i个子分类器的标签为其中,t代表时刻,j=i-1,i∈{1,2,...,n};
步骤103:利用天气雷达对强对流的历史监测数据构造若干个输入矢量,并根据气象站风速的历史监测数据为每个输入矢量确定风力等级;其中,t时刻的输入矢量为x(t);t时刻的输入矢量x(t)对应的风力等级根据气象站t′时刻的风速监测数据确定,其中,时刻t′为时刻t的下一整点时刻;
步骤104:利用气象站风速的历史监测数据为每一个输入矢量构造对应的矢量标签,其中,t时刻的输入矢量x(t)所对应的矢量标签为yL(t),矢量标签yL(t)根据时刻t所对应的风力等级进行确定,yL(t)=(l1(t),...,li(t),...,ln(t));
步骤105:根据步骤103以及步骤104的输入矢量以及矢量标签构造样本集,样本集中单个样本表示为(x(t),yL(t));
步骤106:筛选样本集,构造训练集TR={(x(t),yL(t))|t′-t≤Δt},其中,Δt表示时刻t与时刻t′的时距阈值;
步骤107:利用训练集TR对多分类器进行训练,使得多分类器具备能够根据输入矢量,预测出对应风力等级的能力;
步骤108:采集天气雷达对强对流的实时监测数据,重新构造输入矢量,将输入矢量输入训练完成后的多分类器中,多分类器根据输入矢量输出对应时刻的风力等级,实现对风力的多级预测。
优选的,t时刻的输入矢量x(t)按如下步骤构造:
步骤201:提取天气雷达对强对流的监测数据中的14种雷达数据,构造基本雷达回波数据矢量xB(t),如下:
xB(t)=(平均反射率因子,最大反射率因子,最大反射率因子对应高度,风暴高度,垂直液态水含量,平均反射率因子梯度,最大反射率因子梯度,风暴质量,平均面积,风暴顶高度,风暴底高度,移动速度,长轴长,短轴长);
步骤202:计算基本雷达回波数据矢量增量:xB(t)-xB(t-1),其中,t-1表示雷达的上一体扫时刻;
步骤203:以天气雷达对强对流的监测数据中的剩余数据构造矢量xR(t),如下:
xR(t)=(降雹概率,强降雹概率,降水面积,二维风暴个数);
步骤204:构造输入矢量x(t),如下:
x(t)=(xB(t),xB(t)-xB(t-1),xR(t))。
优选的,在步骤107与步骤108之间进行步骤301:采用测试集对多分类器的预测准确率进行测试,其中,测试集为样本集中随机选取的部分样本,样本集余下部分作为训练集的来源。采用测试集对多分类器进行测试的工作流程:子分类器SVM-1根据测试集中的输入矢量预测风力等级是否为LV0,若是,则输出预测结果,若否,则将测试集继续传递到子分类器SVM-2中,进行正类样本的分类,
优选的,子分类器的个数n=2,第一个子分类器表示为SVM-1,第二个子分类器表示为SVM-2;风力等级LV∈{LV0,LV1,LV2},样本集中与风力等级LV0对应的样本为负类样本,其余为正类样本;在多分类器的训练过程中子分类器SVM-1用于筛选出负类样本,子分类器SVM-2用于对正类样本进行进一步分类,以将正类样本分成分别与风力等级LV1、风力等级LV2对应的两类正类样本。
优选的,子分类器SVM-1与子分类器SVM-2分别采用不同的子训练集TR-1、TR-2进行训练,并且,TR-1∈TR,TR-2∈TR;
子训练集TR-1由训练集TR中的正类样本以及对训练集TR中负类样本随机下采样所获得的负类样本组成,并且子训练集TR-1中负类样本数量与正类样本数量的最佳比值为P,使得子分类器SVM-1具有最优分类界面;
子训练集TR-2为训练集TR中全部正类样本的集合。
与现有技术相比,本发明具有以下有益效果:
1、本发明以天气雷达对强对流的监测数据作为预测信息源,采用多分类器将对强对流风力的预测问题转化为“有监督学习下的分类问题”,根据天气雷达的历史监测数据构造输入矢量(输入矢量与风力等级的对应关系为已知),并根据气象站的历史风速监测数据构造矢量标签,利用输入矢量与矢量标签的对应关系构成训练集对多分类器进行训练,使得多分类器能够根据输入矢量输出预测结果即风力等级。
2、从气象站记录的强对流天气对应的风速数据来看,高风速数据只占很小比例,可生成的高风速训练样数量将很少,并且输入矢量的维数较大(共计32维),因此,属于小样本、高维输入的分类问题,采用支持矢量机SVM作为分类器在解决小样本、高维输入的分类问题上具有较大优势,而且SVM基于结构风险最小化设计,对新的、未知的样本同样有较好的分类效果,有较强的泛化能力。
3、多分类器为串行结构,通过逐层筛选实现多分类,具有较高的分类效率。由于串行结构的多分类器中每层子分类器的效果都建立在上层子分类器的效果上,多分类器的分类效果随层数增多而下降,本发明采用两个子分类器能够提高分类的准确性,对风力等级进行三级预测。
4、由于负类样本的数量远大于正来样本的数量,这种数据不平衡性会严重影响子分类器SVM-1的分类效果,并且这种不利影响会传递至下一层的子分类器SVM-2,为了降低数据不平衡性对风力预测效果的不利影响,对子分类器SVM-1的子训练集进行最佳比值Pbest下的随机下采样。
附图说明
图1是基于天气雷达数据对强对流风力等级预测的原理图;
图2是数据不平衡性对支持矢量机SVM分类效果的影响示意图;
图3是某省电网历史风偏事件对应自动气象站风速分布图;
图4是某省2013~2014年夏季强对流天气对应自动气象站风速分布情况拟合图;
图5是各个比值P下综合评价指标Zc的变化图;
具体实施方式
下面结合附图和优选实施方式对本发明作进一步的详细说明。
为了使本发明更容易理解,首先对本发明的原理进行说明,本发明的多分类器可以看作为“黑箱”,输入矢量作为信息刺激,多分类器的输出(风力等级的预测结果)是对信息刺激的反应,多分类器在训练过程中输入(输入矢量)与输出(风力等级的预测结果)的关系为已知的,通过训练集(训练模型)对多分类器进行训练后,多分类器便能够对输入矢量这一信息刺激进行反应,从而输出对风力等级的预测。
一种基于天气雷达数据的强对流风力等级预测方法,包括以下步骤:
步骤101:根据风速阈值将风力等级划分为0到m级,风力等级用LV表示,则LV∈{LV0,LV1,....,LVj,...,LVm},j∈{0,1,...,m};
本具体实施方式中将风力等级划分为3级,风力等级划分规则如下:
其中,v表示风速,v1、v2表示风速阈值;
步骤102:以支持矢量机SVM作为子分类器,采用n个子分类器从第1个到第n个依次串联的方式构造多分类器,本具体实施方式中,子分类器的个数为2个,其中n=m=2;每一个子分类器能够将风力等级分为两类;为每一个子分类器设置一个对应的标签,第i个子分类器的标签为其中,t代表时刻,j=i-1,i∈{1,2,...,n};
本具体实施方式中,第一个子分类器的标签为:第二个子分类器的标签为
步骤103:利用天气雷达对强对流的历史监测数据构造若干个输入矢量,并根据气象站风速的历史监测数据为每个输入矢量确定风力等级;其中,t时刻的输入矢量为x(t);t时刻的输入矢量x(t)对应的风力等级根据气象站t′时刻的风速监测数据确定,其中,时刻t′为时刻t的下一整点时刻;
步骤104:利用气象站风速的历史监测数据为每一个输入矢量构造对应的矢量标签,其中,t时刻的输入矢量x(t)所对应的矢量标签为yL(t),矢量标签yL(t)根据时刻t所对应的风力等级进行确定,yL(t)=(l1(t),...,li(t),...,ln(t));本具体实施方式中,yL(t)=(l1(t),l2(t));
步骤105:根据步骤103以及步骤104的输入矢量以及矢量标签构造样本集,样本集中单个样本表示为(x(t),yL(t));
步骤106:筛选样本集,构造训练集TR={(x(t),yL(t))|t′-t≤Δt},其中,Δt表示时刻t与时刻t′的时距阈值;
步骤107:利用训练集TR对多分类器进行训练,使得多分类器具备能够根据输入矢量,预测出对应风力等级的能力;
步骤108:采集天气雷达对强对流的实时监测数据,重新构造输入矢量,将输入矢量输入训练完成后的多分类器中,多分类器根据输入矢量输出对应时刻的风力等级,实现对风力的多级预测。
上述步骤中,步骤108之前的步骤均是为了构建基于天气雷达数据对强对流风力等级进行预测的预测模型,其原理如图1所示,本具体实施方式中采用了天气雷达SCIT产品历史数据来构造的输入矢量x,风力等级为预测结果y,在采用训练集(训练模型)对分类器进行训练完成后,得到预测模型,利用测试集对预测模型进行测试,能够修正预测模型,提高预测模型的准确性。
本具体实施方式中,t时刻的输入矢量x(t)按如下步骤构造:
步骤201:提取天气雷达对强对流的监测数据中的14种雷达数据,构造基本雷达回波数据矢量xB(t),如下:
xB(t)=(平均反射率因子,最大反射率因子,最大反射率因子对应高度,风暴高度,垂直液态水含量,平均反射率因子梯度,最大反射率因子梯度,风暴质量,平均面积,风暴顶高度,风暴底高度,移动速度,长轴长,短轴长);
步骤202:计算基本雷达回波数据矢量增量:xB(t)-xB(t-1),其中,t-1表示雷达的上一体扫时刻;
步骤203:以天气雷达对强对流的监测数据中的剩余数据构造矢量xR(t),如下:
xR(t)=(降雹概率,强降雹概率,降水面积,二维风暴个数);
步骤204:构造输入矢量x(t),如下:
x(t)=(xB(t),xB(t)-xB(t-1),xR(t))。
本具体实施方式中,在步骤107与步骤108之间进行步骤301:采用测试集对多分类器的预测准确率进行测试,其中,测试集为样本集中随机选取的部分样本,样本集余下部分作为训练集的来源,即训练集是对样本集余下部分进行筛选得到,筛选的规则即步骤106中只选取时刻t与时刻t′的时距小于等于时距阈值Δt的输入矢量,本具体实施方式中Δt=20min,例如,样本集中有以下时刻:10:10、10:15、10:30、10:40、10:45以及10:50的输入矢量x(10:10)、x(10:15)、x(10:30)、x(10:40)、x(10:45)、x(10:55),上述时刻的下一整点时刻均为11:00,那么只选取与下一整点时刻的时距小于等于20min的输入矢量,即x(10:40)、x(10:45)、x(10:55)。
采用测试集对多分类器进行测试的工作流程:子分类器SVM-1根据测试集中的输入矢量预测风力等级是否为LV0,若是,则输出预测结果,若否,则将测试集继续传递到子分类器SVM-2中,进行正类样本的分类。
本具体实施方式中,子分类器的个数n=2,第一个子分类器表示为SVM-1,第二个子分类器表示为SVM-2;风力等级LV∈{LV0,LV1,LV2},样本集中与风力等级LV0对应的样本为负类样本,其余为正类样本;在多分类器的训练过程中子分类器SVM-1用于筛选出负类样本,子分类器SVM-2用于对正类样本进行进一步分类,以将正类样本分成分别与风力等级LV1、风力等级LV2对应的两类正类样本。
本具体实施方式中,子分类器SVM-1与子分类器SVM-2分别采用不同的子训练集TR-1、TR-2进行训练,并且,TR-1∈TR,TR-2∈TR;
由于负类样本的数量远大于正来样本的数量,如图2所示,这种数据不平衡性会严重影响子分类器SVM-1的分类效果,并且这种不利影响会传递至下一层的子分类器SVM-2,为了降低数据不平衡性对风力预测效果的不利影响,对子分类器SVM-1的子训练集进行最佳比值Pbest下的随机下采样。
子训练集TR-1由训练集TR中的正类样本以及对训练集TR中负类样本随机下采样所获得的负类样本组成,并且子训练集TR-1中负类样本数量与正类样本数量的最佳比值为P,使得子分类器SVM-1具有最优分类界面;
子训练集TR-2为训练集TR中全部正类样本的集合。
本具体实施方式中,最佳比值P采用z分综合评价法进行确定,z分综合评价法包括以下步骤:
步骤701:随机选取样本集中部分样本作为测试集,样本集余下部分作为训练集的来源,筛选样本集构造训练集TR;
步骤702:令P依次取1到10的自然数;在P的每次取值下构造子训练集,使得子训练集TR-1中负类样本数量与正类样本数量的比值为P;然后利用当前比值P下的子训练集TR-1对子分类器SVM-1进行训练;
步骤703:利用测试集依次对各个比值P下的子训练集TR-1训练后的多分类器进行测试,并根据对测试集的实际分类结果计算各个比值P下的以下3类指标,每个比值P下的3类指标均按如下公式计算:
其中,N0-1表示实际为负类样本,但被预测为正类样本的样本数量,N1-1表示实际为正类样本,预测也为正类样本的样本数量;
其中,N1-0表示实际为正类样本,但被预测为负类样本的样本数量;
其中,N0-0表示实际为负类样本,预测也为负类样本的样本数量;
步骤703:获取各个比值P下的空报率、漏报率以及G-mean指标;
步骤704:依次计算各个比值P下三类指标各自对应的z分数,其中,当前比值P下的各类指标对应的z分数分别按如下公式:
与空报率对应的z分数zp1
其中,Xp1表示当前比值P下的空报率,表示各个比值P下空报率的平均值,S1表示各个比值P下空报率Xp1的标准差;
与漏报率对应的z分数zp2
其中,Xp2表示当前比值P下的漏报率,表示各个比值P下漏报率的平均值,S2表示各个比值P下漏报率Xp2的标准差;
与G-mean指标对应的z分数zp3
其中,Xp3表示当前比值P下的G-mean指标,表示各个比值P下G-mean的平均值,S3表示各个比值P下G-meanXp3的标准差;
步骤705:计算各个比值P下的综合评价指标Zc
Zc=zp3-zp2-zp1
步骤706:比较各个比值P下的综合评价指标Zc的大小,以最大的综合评价指标Zc所对应的比值P作为最佳比值Pbest
按比值对训练集进行下采样,构造出子训练集TR-1以消除数据不平衡性对子分类器SVM-1的分类效果的影响,并且利用测试集对每个比值P下训练出的子分类器SVM-1进行测试,比较各个比值P下的综合评价指标Zc,从而选择出最佳比值Pbest,保证子分类器SVM-1具有最佳的分类效果。另外,由于正类样本不存在明显的数据不平衡性,因此本具体实施方式中采用训练集TR中全部正类样本的集合作为训练子分类器SVM-2的子训练集TR-2,最终仍然能够获得良好的分类效果。
为了更好的说明本发明对强对流风力等级的预测效果,对我国某省的强对流风力等级的预测案例如下:
首先,对某省电网历史风偏事件对应的自动气象站的风速进行统计,如图3所示:95%的风偏事件发生时,附近自动气象站的观测风速均在8m/s以上。并且,根据某省2013—2014年夏季强度对流天气对应的自动气象站风速分布情况进行拟合,如图4所示,从图中的风速分布不难看出,如果LV 1和LV 2间的阈值太大,会导致LV 2的样本过少,从而影响子分类器SVM-2对LV 1和LV 2的分类效果。综合上述原因,选择11m/s作为LV 1、LV 2的划分阈值,因此,基于天气雷达数据的强对流大风预测模型的风力等级划分规则如下:
然后,构造训练集对多分类器进行训练,其中,按照步骤701~706计算最佳比值Pbest,为了更加直观的选取最佳比值Pbest绘制了综合评价指标指标Zc的分布图,如图5所示,当P=3时,综合评价指标指标Zc为最大值,因此,最佳比值Pbest=3。
在该省2013—2014年历史夏季强对流天气雷达数据及对应自动气象站风速数据的基础上,对模型进行了测试及验证。选取历史某天185条样本作为测试集,其余样本按上述步骤构造训练集,对模型进行训练及测试;更换测试集,选取另一天的107条样本,重复上述步骤。两次测试的结果见表1。
表1
根据表1结果,子分类器SVM-1两次测试的G-menas指标分别为90.5%和86.8%,对不平衡风速样本有较好的分类效果;而子分类器SVM-2也能正确识别出高风速LV 2的样本。如表1所示,对角线元素代表正确预测的情况,测试结果表明整体模型对强对流大风的风力情况有较好的预测效果。

Claims (7)

1.一种基于天气雷达数据的强对流风力等级预测方法,其特征在于:包括以下步骤:
步骤101:根据风速阈值将风力等级划分为0到m级,风力等级用LV表示,则LV∈{LV0,LV1,....,LVj,...,LVm},j∈{0,1,...,m};
步骤102:以支持矢量机SVM作为子分类器,采用n个子分类器从第1个到第n个依次串联的方式构造多分类器,其中n=m;每一个子分类器能够将风力等级分为两类;为每一个子分类器设置一个对应的标签,第i个子分类器的标签为其中,t代表时刻,j=i-1,i∈{1,2,...,n};
步骤103:利用天气雷达对强对流的历史监测数据构造若干个输入矢量,并根据气象站风速的历史监测数据为每个输入矢量确定风力等级;其中,t时刻的输入矢量为x(t);t时刻的输入矢量x(t)对应的风力等级根据气象站t′时刻的风速监测数据确定,其中,时刻t′为时刻t的下一整点时刻;
步骤104:利用气象站风速的历史监测数据为每一个输入矢量构造对应的矢量标签,其中,t时刻的输入矢量x(t)所对应的矢量标签为yL(t),矢量标签yL(t)根据时刻t所对应的风力等级进行确定,yL(t)=(l1(t),...,li(t),...,ln(t));
步骤105:根据步骤103以及步骤104的输入矢量以及矢量标签构造样本集,样本集中单个样本表示为(x(t),yL(t));
步骤106:筛选样本集,构造训练集TR={(x(t),yL(t))|t′-t≤Δt},其中,Δt表示时刻t与时刻t′的时距阈值;
步骤107:利用训练集TR对多分类器进行训练,使得多分类器具备能够根据输入矢量,预测出对应风力等级的能力;
步骤108:采集天气雷达对强对流的实时监测数据,重新构造输入矢量,将输入矢量输入训练完成后的多分类器中,多分类器根据输入矢量输出对应时刻的风力等级,实现对风力的多级预测。
2.根据权利要求1所述的基于天气雷达数据的强对流风力等级预测方法,其特征在于:t时刻的输入矢量x(t)按如下步骤构造:
步骤201:提取天气雷达对强对流的监测数据中的14种雷达数据,构造基本雷达回波数据矢量xB(t),如下:
xB(t)=(平均反射率因子,最大反射率因子,最大反射率因子对应高度,风暴高度,垂直液态水含量,平均反射率因子梯度,最大反射率因子梯度,风暴质量,平均面积,风暴顶高度,风暴底高度,移动速度,长轴长,短轴长);
步骤202:计算基本雷达回波数据矢量增量:xB(t)-xB(t-1),其中,t-1表示雷达的上一体扫时刻;
步骤203:以天气雷达对强对流的监测数据中的剩余数据构造矢量xR(t),如下:
xR(t)=(降雹概率,强降雹概率,降水面积,二维风暴个数);
步骤204:构造输入矢量x(t),如下:
x(t)=(xB(t),xB(t)-xB(t-1),xR(t))。
3.根据权利要求1所述的基于天气雷达数据的强对流风力等级预测方法,其特征在于:在步骤107与步骤108之间进行步骤301:采用测试集对多分类器的预测准确率进行测试,其中,测试集为样本集中随机选取的部分样本,样本集余下部分作为训练集的来源。
4.根据权利要求1所述的基于天气雷达数据的强对流风力等级预测方法,其特征在于:子分类器的个数n=2,第一个子分类器表示为SVM-1,第二个子分类器表示为SVM-2;风力等级LV∈{LV0,LV1,LV2},样本集中与风力等级LV0对应的样本为负类样本,其余为正类样本;在多分类器的训练过程中子分类器SVM-1用于筛选出负类样本,子分类器SVM-2用于对正类样本进行进一步分类,以将正类样本分成分别与风力等级LV1、风力等级LV2对应的两类正类样本。
5.根据权利要求4所述的基于天气雷达数据的强对流风力等级预测方法,其特征在于:子分类器SVM-1与子分类器SVM-2分别采用不同的子训练集TR-1、TR-2进行训练,并且,TR-1∈TR,TR-2∈TR;
子训练集TR-1由训练集TR中的正类样本以及对训练集TR中负类样本随机下采样所获得的负类样本组成,并且子训练集TR-1中负类样本数量与正类样本数量的最佳比值为Pbest,使得子分类器SVM-1具有最优分类界面;
子训练集TR-2为训练集TR中全部正类样本的集合。
6.根据权利要求5所述的基于天气雷达数据的强对流风力等级预测方法,其特征在于:最佳比值Pbest采用z分综合评价法进行确定。
7.根据权利要求6所述的基于天气雷达数据的强对流风力等级预测方法,其特征在于:z分综合评价法包括以下步骤:
步骤701:随机选取样本集中部分样本作为测试集,样本集余下部分作为训练集的来源,筛选样本集构造训练集TR;
步骤702:令P依次取1到10的自然数;在P的每次取值下构造子训练集,使得子训练集TR-1中负类样本数量与正类样本数量的比值为P;然后利用当前比值P下的子训练集TR-1对子分类器SVM-1进行训练,并根据实际分类结果计算当前比值P下的以下3类指标:
其中,N0-1表示实际为负类样本,但被预测为正类样本的样本数量,N1-1表示实际为正类样本,预测也为正类样本的样本数量;
其中,N1-0表示实际为正类样本,但被预测为负类样本的样本数量;
其中,N0-0表示实际为负类样本,预测也为负类样本的样本数量;
步骤703:获取各个比值P下的空报率、漏报率以及G-mean指标;
步骤704:计算各个比值P下三类指标各自对应的z分数,其中,当前比值P下的各类指标对应的z分数分别按如下公式:
与空报率对应的z分数zp1
其中,Xp1表示当前比值P下的空报率,表示各个比值P下空报率的平均值,S1表示各个比值P下空报率Xp1的标准差;
与漏报率对应的z分数zp2
其中,Xp2表示当前比值P下的漏报率,表示各个比值P下漏报率的平均值,S2表示各个比值P下漏报率Xp2的标准差;
与G-mean指标对应的z分数zp3
其中,Xp3表示当前比值P下的G-mean指标P,表示各个比值P下G-mean的平均值,S3表示各个比值P下G-meanXp3的标准差;
步骤705:计算各个比值P下的综合评价指标Zc
Zc=zp3-zp2-zp1
步骤706:比较各个比值P下的综合评价指标Zc的大小,以最大的综合评价指标Zc所对应的比值P作为最佳比值Pbest
CN201710978296.8A 2017-10-18 2017-10-18 一种基于天气雷达数据的强对流风力等级预测方法 Active CN107526083B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710978296.8A CN107526083B (zh) 2017-10-18 2017-10-18 一种基于天气雷达数据的强对流风力等级预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710978296.8A CN107526083B (zh) 2017-10-18 2017-10-18 一种基于天气雷达数据的强对流风力等级预测方法

Publications (2)

Publication Number Publication Date
CN107526083A CN107526083A (zh) 2017-12-29
CN107526083B true CN107526083B (zh) 2019-05-31

Family

ID=60685419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710978296.8A Active CN107526083B (zh) 2017-10-18 2017-10-18 一种基于天气雷达数据的强对流风力等级预测方法

Country Status (1)

Country Link
CN (1) CN107526083B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109100722B (zh) * 2018-07-25 2022-08-12 南京信息工程大学 基于雷达回波图像扇区分量分析的风暴趋势预测方法
CN109087020B (zh) * 2018-08-21 2022-03-04 中国气象局上海台风研究所 基于台风气候降水率的降水类型分类方法及其分类系统
CN109164450B (zh) * 2018-09-12 2022-11-22 天津大学 一种基于多普勒雷达数据的下击暴流预测方法
CN110018479A (zh) * 2019-04-28 2019-07-16 中国气象局广州热带海洋气象研究所 C波段双偏振天气雷达反射率地形遮挡衰减订正方法
CN110197218B (zh) * 2019-05-24 2021-02-12 绍兴达道生涯教育信息咨询有限公司 基于多源卷积神经网络的雷雨大风等级预测分类方法
CN110488296B (zh) * 2019-08-21 2022-11-25 成都信息工程大学 对流单体降雹偏振雷达zdr柱在线监测数据预警方法
CN111427101B (zh) * 2020-04-07 2022-04-26 南京气象科技创新研究院 一种雷雨大风分级预警方法、系统、存储介质
CN111783821B (zh) * 2020-05-19 2023-09-12 知天(珠海横琴)气象科技有限公司 强对流阵风的判别方法及系统
CN112015776B (zh) * 2020-07-07 2024-02-23 盛威时代科技集团有限公司 基于云计算技术的旅客出行分析应用方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101519073A (zh) * 2009-04-07 2009-09-02 北京大学 一种混合动力汽车行驶负载预测方法
CN103150578A (zh) * 2013-04-09 2013-06-12 山东师范大学 一种基于半监督学习的支持向量机分类器训练方法
CN104239970A (zh) * 2014-09-04 2014-12-24 国家电网公司 一种基于Adaboost的输电线舞动风险预警方法
CN106503751A (zh) * 2016-11-10 2017-03-15 国网河南省电力公司电力科学研究院 一种基于svm分类器的输电线路易舞气象条件预报方法
CN106526708A (zh) * 2016-09-21 2017-03-22 广东奥博信息产业有限公司 一种基于机器学习的气象强对流天气的智能预警分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101519073A (zh) * 2009-04-07 2009-09-02 北京大学 一种混合动力汽车行驶负载预测方法
CN103150578A (zh) * 2013-04-09 2013-06-12 山东师范大学 一种基于半监督学习的支持向量机分类器训练方法
CN104239970A (zh) * 2014-09-04 2014-12-24 国家电网公司 一种基于Adaboost的输电线舞动风险预警方法
CN106526708A (zh) * 2016-09-21 2017-03-22 广东奥博信息产业有限公司 一种基于机器学习的气象强对流天气的智能预警分析方法
CN106503751A (zh) * 2016-11-10 2017-03-15 国网河南省电力公司电力科学研究院 一种基于svm分类器的输电线路易舞气象条件预报方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Early warning method for transmission line galloping based on SVM and AdaBoost bi-level classifiers;Jian Wang et al.;《 IET Generation, Transmission & Distribution》;20161027;3499-3507
输电线路气象灾害风险分析与预警方法研究;王建;《中国博士学位论文全文数据库 工程科技Ⅱ辑》;20170315;C042-36

Also Published As

Publication number Publication date
CN107526083A (zh) 2017-12-29

Similar Documents

Publication Publication Date Title
CN107526083B (zh) 一种基于天气雷达数据的强对流风力等级预测方法
CN108375808A (zh) Nriet基于机器学习的大雾预报方法
CN109272146A (zh) 一种基于深度学习模型和bp神经网络校正的洪水预测方法
CN110728411B (zh) 一种基于卷积神经网络的高低空区域联合降雨预测方法
CN111414991B (zh) 一种基于多元回归的气象锋面自动识别方法
CN109958588A (zh) 结冰预测方法、装置、存储介质、模型生成方法及装置
CN111665575B (zh) 一种基于统计动力的中长期降雨分级耦合预报方法及系统
CN109765559A (zh) 一种基于多普勒雷达和深度学习的山区致灾暴雨识别方法
CN104573879A (zh) 基于最优相似日集的光伏电站出力预测方法
CN109299812A (zh) 一种基于深度学习模型和knn实时校正的洪水预测方法
CN109948839B (zh) 架空输电线路舞动风险的预测和预警方法及系统
CN110346800A (zh) 一种基于双偏振天气雷达体扫数据的雷暴识别方法
CN102147839A (zh) 一种光伏发电量预测方法
CN110059713A (zh) 一种基于降水粒子多特征参量的降水类型识别方法
CN109858700A (zh) 基于相似样本筛选的bp神经网络供暖系统能耗预测方法
CN112349420B (zh) 一种基于气象数据的疾病预测模型的构建方法及系统
CN110502526A (zh) 一种适用于结冰现象的资料序列插补的方法
Shield et al. Diagnosing supercell environments: A machine learning approach
Jie et al. Improvement of 6–15 day precipitation forecasts using a time-lagged ensemble method
Miller et al. A preliminary assessment of using spatiotemporal lightning patterns for a binary classification of thunderstorm mode
Lack et al. Development of an automated approach for identifying convective storm type using reflectivity-derived and near-storm environment data
CN115902812A (zh) 一种短时暴雨天气背景自动判别方法、系统、设备及终端
CN105070102A (zh) 一种基于模糊逻辑的船舶航行动态风险推理系统及其方法
CN115576034A (zh) 一种表征寒潮强度的指数方法
Gallus Jr et al. Differences in near-storm parameters useful for forecasting intensity of nocturnal and diurnal bow echo winds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant