CN110852245B - 基于离散属性bnt的双偏振气象雷达降水粒子分类方法 - Google Patents

基于离散属性bnt的双偏振气象雷达降水粒子分类方法 Download PDF

Info

Publication number
CN110852245B
CN110852245B CN201911079020.1A CN201911079020A CN110852245B CN 110852245 B CN110852245 B CN 110852245B CN 201911079020 A CN201911079020 A CN 201911079020A CN 110852245 B CN110852245 B CN 110852245B
Authority
CN
China
Prior art keywords
discretization
precipitation
information
polarization
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911079020.1A
Other languages
English (en)
Other versions
CN110852245A (zh
Inventor
李海
孙婷逸
尚金雷
冯青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Civil Aviation University of China
Original Assignee
Civil Aviation University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Civil Aviation University of China filed Critical Civil Aviation University of China
Priority to CN201911079020.1A priority Critical patent/CN110852245B/zh
Publication of CN110852245A publication Critical patent/CN110852245A/zh
Application granted granted Critical
Publication of CN110852245B publication Critical patent/CN110852245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了一种基于离散属性BNT的双偏振气象雷达降水粒子分类方法。其首先对输入偏振参量进行离散化处理,然后使用离散化后的数据构造离散属性的贝叶斯网络,充分利用先验信息确定类先验概率,最后根据贝叶斯原理实现对降水粒子的分类。与传统FLA分类算法相比,本发明方法提高了对降水粒子的识别率,有效避免了传统方法中因概率模型或隶属度函数的选择造成的误差,对冰晶等非单峰分布的降水粒子识别能力有明显提升,算法可操作性和泛化性更强。仿真实验验证了本发明方法的有效性。

Description

基于离散属性BNT的双偏振气象雷达降水粒子分类方法
技术领域
本发明属于气象雷达信号处理技术领域,特别是涉及一种基于离散属性贝叶斯网络(BNT)的双偏振气象雷达降水粒子分类方法。
背景技术
云内降水粒子相态的合理识别在云降水物理、人工影响天气等领域具有非常重要的科学意义,不仅对了解水凝物在云中的生成和转换、提高降水量的测量精度有重要的应用价值,而且能为人工影响天气的决策和评估提供重要的参考依据。
由于传统的单偏振气象雷达只发射和接受单一方向的功率信息,因此得到的信息有限,限制了其对降水粒子分类的准确性。双线偏振气象雷达作为一种新型的天气信号回波探测工具,由于能同时发射和接收水平与垂直极化方向的信号,较传统的单偏振气象雷达可以获得更多的极化信息,因而在天气信号处理中的降水粒子分类方面具有一定的优势。
目前双偏振气象雷达降水粒子分类方法的研究主要集中在两大领域,一类是基于模糊逻辑分类算法(Fuzzy Logic Algorithms,FLA)的降水粒子分类方法,另一类是基于机器学习理论的降水粒子分类方法。其中模糊逻辑分类算法第一次被应用到双偏振气象雷达降水粒子分类中是在1996年,Straka等根据不同类型的降水粒子的偏振参量具有不同取值范围提出了基于模糊逻辑分类算法的降水粒子分类算法并取得成功。此后对FLA的研究大部分专注于对隶属度函数(Membership Function,MF)的改进、对特定降水粒子识别的研究以及提高模糊逻辑分类算法的鲁棒性。但其一直存在的问题:不同降水粒子的偏振参量隶属度函数的选取以及不同降水粒子权重的确定方式都需要依靠专家经验,这个问题一直没有得到有效解决。
二十世纪七十年代以来,随着机器学习理论的再次兴起,布尔决策树方法、支持向量机(Support Vector Machine,SVM)方法以及聚类方法相继被应用到降水粒子分类中来。其中布尔决策树方法原理简单,可以直观体现数据的特点,但在类别较多时决策树复杂度呈指数增长;SVM算法在处理2分类问题上表现优越,但在对降水粒子分类问题上需要由2分类构建多分类,相比其他方法,计算量随类别标签数量成倍增加;聚类方法具有实现要求低、不需要训练样本等优点,但某些降水粒子回波数据在属性空间中的真实集群并不是类球状的,传统聚类方法在面对这种降水粒子时表现欠佳。2008年Marzano等首次探索了贝叶斯方法(Bayes Approach)在降水粒子分类中的应用,并提出相较模糊逻辑分类算法,贝叶斯方法至少有两个优点:1)可以处理高维更复杂的信息2)可以充分利用先验信息。Marzano首先用T-Matrix加上高斯噪声仿真了双偏振气象雷达回波数据,然后提出了用多维高斯模型来估计降水粒子回波数据的联合概率密度函数,依据贝叶斯原理进行降水粒子分类的方法。但是近年来随着对降水粒子分布特性深入研究,在分类类别较多时,某些降水粒子(例如冰晶)的雷达回波数据的概率分布呈双峰性,继续使用高斯模型会因模型的选取而带来较大误差。并且Marzano仅采用温度信息作为附加信息确定类先验概率信息,没有作更全面的考虑。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于离散属性BNT的双偏振气象雷达降水粒子分类方法。
为了达到上述目的,本发明提供的基于离散属性BNT的双偏振气象雷达降水粒子分类方法包括按顺序进行的下列步骤:
1)获取双偏振气象雷达的实测偏振参量数据,从中随机选取部分或全部数据作为离散化数据集,同时选取部分数据作为训练数据集,采用基于粗糙集信息熵的离散化算法对离散化数据集中的离散化数据进行离散化而获得离散化标准,之后利用离散化标准对训练数据集中的训练数据进行离散化的S1阶段;
2)使用上述训练数据集中离散化后的训练数据对贝叶斯网络进行基于互信息的贝叶斯网络结构学习以及与学得结构相对应的参数学习,获得条件概率密度表,并完成贝叶斯网络分类器构建的S2阶段;
3)利用融化层信息、异常值信息以及场景影响信息计算出降水粒子的类先验概率的S3阶段;
4)将步骤2)中获得的条件概率密度表、步骤3)中获得的降水粒子的类先验概率输入到步骤3)中构建的贝叶斯网络分类器中,由此进行降水粒子分类的S4阶段。
在步骤1)中,所述的获取双偏振气象雷达的实测偏振参量数据,从中随机选取部分或全部数据作为离散化数据集,同时选取部分数据作为训练数据集,采用基于粗糙集信息熵的离散化算法对离散化数据集中的离散化数据进行离散化而获得离散化标准,之后利用离散化标准对训练数据集中的训练数据进行离散化的方法是:
对离散化数据集中数据进行排序去重,取相邻两个数据的中点值作为候选断点集合,结果断点集初始化为空集;计算候选断点对论域的信息熵值,取最小者加入到结果断点集合中,之后计算离散化数据集中的样本值与结果断点集合中每一个元素的欧氏距离集合,找到与欧氏距离集合中最小元素对应的断点与样本值,令该断点代替样本值;根据这个最小欧式距离准则,更新离散化数据集中全部样本的值可得到一个新的决策表,判断新决策表的相容性,迭代直到整个决策表相容为止;最终输出的结果断点集合D称为离散化标准;得到的离散化标准用最小欧式距离准则更新训练数据集,可得到离散化的训练数据集。
在步骤2)中,所述的使用上述训练数据集中离散化后的训练数据对贝叶斯网络进行基于互信息的贝叶斯网络结构学习以及与学得结构相对应的参数学习,获得条件概率密度表,并完成贝叶斯网络分类器构建的方法是:
基于互信息的贝叶斯网络结构学习是:计算两两属性节点间的互信息,并且选取大于门限值的节点对建立无向边;之后对建立的无向边定向,定向原则是与类节点互信息值大的属性节点指向与类节点互信息值小的属性节点;如果求得的贝叶斯网络中存在成环的部分,则去掉环中互信息最小的边,最终得到一个有向无环图;与学得结构相对应的参数学习的方法是:对离散化后的训练数据进行统计计数,然后根据结构学习学得的贝叶斯网络结构以及偏振参量的不同取值求出每种组合情况相应的概率,之后进行拉普拉斯平滑处理构成条件概率密度表。
在步骤3)中,所述的利用融化层信息、异常值信息以及场景影响信息计算出降水粒子的类先验概率的方法是:
某雷达距离单元内不存在某种降水粒子,将该降水粒子类先验概率置为0,否则为1;属性特定范围内禁止存在的降水粒子先验概率置为0;针对特定应用场景对降水粒子分类的影响,适当提高或降低对应降水粒子的类先验概率。
本发明提供的基于离散属性BNT的双偏振气象雷达降水粒子分类方法首先将偏振参量数据离散化,生成离散化标准,然后按照离散化标准对训练数据集离散化,使用离散化的训练数据集对贝叶斯网络进行结构学习和参数学习,完成贝叶斯网络分类器的构建,最后引入了包括融化层信息、异常值信息以及场景影响信息作为BNT的类先验概率信息,根据贝叶斯原理实现对降水粒子的分类,相较传统分类算法,本方法性能的提高主要体现在1)通过对类先验概率的控制,对每一个分类单元构建其专属分类器进行分类,提高了对降水粒子的识别率。2)对雷达回波偏振参量取值进行离散化处理,使用CPT描述雷达偏振参量概率分布,有效避免了传统方法中因概率模型或隶属度函数的选择造成的误差,对冰晶等非单峰分布的降水粒子识别能力有明显提升。3)在需要检测某些特定降水粒子的应用场景,通过改变场景影响因子,可以有效提高该类降水粒子的识别能力。实测数据实验验证了本方法的有效性。
附图说明
图1为本发明提供的基于离散属性BNT的双偏振气象雷达降水粒子分类方法流程图。
图2为离散化流程图。
图3为朴素贝叶斯分类器示意图。
图4为贝叶斯网络结构学习流程图。
图5为贝叶斯网络结构图。
图6为差分传播相移ZDR的条件概率密度表示意图。
图7为不同融化区域内允许存在降水粒子示意图。
图8为基于离散属性BNT的降水粒子分类算法基本流程图。
图9为分类结果图(2018/06/07 15:14),其中(a)为本发明方法分类结果,(b)为模糊逻辑分类算法分类结果。
图10为北偏东14°不同仰角(0.5°0.8°1.5°2.4°3.4°)降水粒子分布图(2018/06/07 15:14),其中(a)为本发明方法分类结果,(b)为模糊逻辑分类算法分类结果。
图11为分类结果图(2018/09/21 18:33),其中(a)为BNT分类结果图(b)为模糊逻辑分类算法分类结果图。
具体实施方式
下面结合附图和具体实施例对本发明提供的基于离散属性BNT的双偏振气象雷达降水粒子分类方法进行详细说明。
如图1所示,本发明提供的基于离散属性BNT的双偏振气象雷达降水粒子分类方法包括按顺序进行的下列步骤:
1)获取双偏振气象雷达的实测偏振参量数据,从中随机选取部分或全部数据作为离散化数据集,同时选取部分数据作为训练数据集,采用基于粗糙集信息熵的离散化算法对离散化数据集中的离散化数据进行离散化而获得离散化标准,之后利用离散化标准对训练数据集中的训练数据进行离散化的S1阶段;
双偏振气象雷达可以发射两种偏振状态的电磁波(水平偏振波与垂直偏振波),其不仅能获得探测目标对两种不同偏振波的后向散射信号的强度和相位信息,还能得到探测目标对两种偏振波后向散射回波的差异信息,即除了反射率因子、径向速度和速度谱宽等常规雷达可以获取的参量之外,双偏振气象雷达还可以获得差分反射率因子ZH、差分传播相移ZDR、差分传播相移率KDP及零滞后互相关系数ρHV等反映降水粒子的尺寸大小、形态特征、排列取向、空间位置和相态变化的偏振参量,本发明选取这四种偏振参量作为降水粒子分类依据,采用基于粗糙集信息熵的离散化算法对这些偏振参量数据进行离散化处理,使用四元知识表达系统——决策表来描述由偏振参量数据及其对应降水粒子类别标签组成的粗糙集,根据使离散化标准信息熵最小的原理求得偏振参量数据的离散化标准,并使离散化后决策表的相容度与离散化前决策表的相容度相等,以此保证偏振参量数据离散化对降水粒子分类的影响足够小。
具体方法如下:
本发明利用由模糊逻辑分类算法提供的降水粒子样本集合进行偏振参量数据离散化。该降水粒子样本集合共包括9类降水粒子(地杂波也认为是一类降水粒子)。
表1降水粒子样本集合
Figure BDA0002263367740000051
决策表是用表格的方式来表达降水粒子分类中的信息和知识。获取差分反射率因子ZH、差分传播相移ZDR、差分传播相移率KDP及零滞后互相关系数ρHV这四种偏振参量的实测数据,然后从中随机选取部分或全部数据作为离散化数据集,同时选取部分数据作为训练数据集。
其中,离散化数据集在决策表中称作论域U,选取差分反射率因子ZH、差分传播相移ZDR、零滞后互相关系数ρHV以及差分传播相移率KDP作为决策表的条件属性,分类结果即类别标签C(C∈{1,2,…,9})作为决策表的决策属性。决策表内容如表2所示。
表2决策表
Figure BDA0002263367740000052
其中N为论域U={u1,u2,…uN}中的样本个数,将表2中决策属性为j(j∈{1,2,…,9})的样本个数记为G(j),则该决策表的信息熵可以表示成:
Figure BDA0002263367740000061
其中
Figure BDA0002263367740000062
下面以条件属性中差分反射率因子ZH为例(其他条件属性同理)来介绍离散化算法:首先对论域U中的样本按差分反射率因子ZH取值大小进行排序和去重处理,生成集合U',初始化候选断点集合Dhx为集合U'中相邻元素的中点,初始化断点集合
Figure BDA0002263367740000063
设论域U中差分反射率因子ZH的值域为ZY=[lZ,rZ],候选断点集合Dhx中的某一候选断点dhx(dhx∈Dhx)将值域ZY分为[lZ,dhx)∪[dhx,rZ],论域U中差分反射率因子ZH取值属于[lZ,dhx)的样本集记为Ul,论域U中差分反射率因子ZH取值属于[dhx,rZ]的样本集记为Ur,用G(Ul)和G(Ur)分别表示样本集Ul和Ur中的样本个数,则加入候选断点dhx后论域U的信息熵计算公式如下式所示:
Figure BDA0002263367740000064
设论域U中样本的差分反射率因子ZH小于候选断点dhx且决策属性为jl(jl∈{1,2,…,9})的样本个数记为G(jl),差分反射率因子ZH大于等于候选断点dhx且决策属性为jr(jr∈{1,2,…,9})的样本个数记为G(jr)。那么式(2)中H(Ul)和H(Ur)的计算公式如下:
Figure BDA0002263367740000065
根据式(2)计算候选断点集合Dhx中所有候选断点针对论域U的信息熵,选取具有最小信息熵的候选断点
Figure BDA0002263367740000066
并作为结果断点加入到结果断点集合D中,并从候选断点集合Dhx中去掉具有最小信息熵的候选断点
Figure BDA0002263367740000067
由此完成一个断点的选取工作。
迭代计算剩余候选断点针对论域U的信息熵,需要指出的是,当迭代次数为a时,结果断点集合D={d1,d2,…,da}将值域ZY划分为[lZ,d1)∪[d1,d2)∪…∪[da,rZ]并记为U1,U2,…,Ua+1,根据公式(2),则此时候选断点
Figure BDA0002263367740000068
针对论域U的信息熵公式所示:
Hd(U)=Hd(U1)+Hd(U2)+…+Hd(Ua+1)  (4)
离散化过程实际就是不断地从候选断点集合Dhx中选取使论域U信息熵最小的断点并加入到结果断点集合D中,每次迭代后验证决策表的相容性作为迭代是否终止的条件。当迭代次数为a时,计算样本un=[un,1,un,2,un,3,un,4],(un∈U)中un,1值(即样本的差分反射率因子ZH)与结果断点集合D,(D={d1,d2,…,da})中每一个元素d(d∈D)的欧氏距离集合O={Ou,1,Ou,2,…,Ou,a+1},找到与欧氏距离集合O中最小元素Ou,mi,(Ou,mi∈O)对应的断点dmi(dmi∈D),令un,1=dmi。根据这个最小欧式距离准则,更新离散化数据集中全部样本的un,1值,则得到一个新的决策表。判断新决策表的相容性,如果新决策表相容则结束,此时结果断点集合D即为离散化结果;如果新决策表不相容,则继续迭代直到整个决策表相容为止。最终输出的结果断点集合D称为离散化标准。
利用上述离散化标准对训练数据集和测试数据集中的数据进行离散化,离散化流程如图2所示。
2)使用上述训练数据集中离散化后的训练数据对贝叶斯网络进行基于互信息的贝叶斯网络结构学习以及与学得结构相对应的参数学习,获得条件概率密度表,并完成贝叶斯网络分类器构建的S2阶段;
在此阶段中,对基于互信息的贝叶斯网络进行结构学习的方法是使用离散化后的训练数据,利用信息论的方法定量地分析偏振参量属性节点间的依赖关系而求得表述偏振参量属性节点关系的网络结构。与学得结构相对应的参数学习的方法是:对离散化后的训练数据进行统计计数,根据偏振参量存在的不同取值求出每种组合情况相应的概率,构成条件概率密度表(CPT)。
具体方法如下:
贝叶斯网络分类器可以理解为朴素贝叶斯分类器(Naive Bayes Classifier,NBC)的网络依赖扩展,允许属性节点(即雷达偏振参量属性节点)之间形成任意有向图。朴素贝叶斯分类器规定每个属性节点仅以类节点作为父节点,各属性节点之间相互独立,如图3所示。在图3的基础上进行贝叶斯网络拓展(以差分反射率因子ZH和差分传播相移ZDR为例):首先计算两两属性节点间的互信息。设偏振参量数据离散化计算出的差分反射率因子ZH和差分传播相移ZDR的离散化标准为
Figure BDA0002263367740000071
训练数据集记为Y,其样本个数为G(Y)。训练数据集Y中样本记为y=[zh,zdrhv,kdp,c],(y∈Y),满足
Figure BDA0002263367740000081
Figure BDA0002263367740000082
的样本个数分别为
Figure BDA0002263367740000083
Figure BDA0002263367740000084
则差分反射率因子ZH,差分传播相移ZDR的互信息I(ZH,ZDR)计算公式如下:
Figure BDA0002263367740000085
其中,
Figure BDA0002263367740000086
表示差分反射率因子ZH和差分传播相移ZDR的联合概率分布列,
Figure BDA0002263367740000087
分别表示差分反射率因子ZH和差分传播相移ZDR的边缘概率分布列。
选取大于门限值e(门限值e一般取0.1-0.3,本发明中e=0.25)的节点对建立无向边。接下来对建立的无向边定向,定向原则为由与类节点C互信息值大的属性节点指向与类节点C互信息值小的属性节点。如果求得的贝叶斯网络中存在成环的部分,则去掉环中互信息最小的边,最终得到一个有向无环图,由此完成贝叶斯网络结构学习。贝叶斯网络结构学习流程图如图4所示,学得的贝叶斯网络结构如图5所示。
针对学习得到的贝叶斯网络结构进行对应的参数学习,即学得相应的条件概率密度表(CPT)。条件概率密度表定量描述贝叶斯网络中属性节点间的依赖关系。如图5所示,在求得的贝叶斯网络结构中,作为节点的差分传播相移ZDR有两个父节点ρHV和C,在这种情况下差分传播相移ZDR的条件概率密度表中记录的条件概率不仅与差分传播相移ZDR的取值有关,还与父节点ρHV和C的取值有关。设差分传播相移ZDR和父节点ρHV的离散化标准为
Figure BDA0002263367740000088
父节点C={1,2,3,4,5,6,7,8,9},则差分传播相移ZDR的条件概率密度表应为G(DDR)×G(DHV)×9的三维分布列。
将训练数据集Y中满足
Figure BDA0002263367740000089
Figure BDA00022633677400000810
且C=j(j∈{1,…,9})的样本个数记为
Figure BDA00022633677400000811
那么条件概率密度表中条件概率的计算公式如下:
Figure BDA00022633677400000812
在参数学习过程中可能会存在样本个数
Figure BDA00022633677400000813
的情况,而后续分类过程中后验概率的计算都是乘法运算。为了消除这种情况对分类性能的影响,对公式(6)进行拉普拉斯平滑处理,如式(7)所示:
Figure BDA0002263367740000091
以差分传播相移ZDR学习为例,图6为差分传播相移ZDR的条件概率密度表示意图。
易知差分传播相移ZDR的条件概率密度表为一个三维分布列,其中每个单元格表示对应各偏振参量取值的概率。假设训练数据集Y中样本个数为sY,满足图中标出单元格ZDR=-0.2813,ρHV=0.9100,C=1的样本个数为sz,则该单元格内的条件概率计算公式如式(8)所示,根据这种计算方式,计算出每个偏振参量属性节点的条件概率密度表,由此完成参数学习。
Figure BDA0002263367740000092
3)利用融化层信息、异常值信息以及场景影响信息计算出降水粒子的类先验概率的S3阶段;
在此阶段中,本发明将附加信息加入到类先验概率中,利用类先验概率可以为0的特性,对类节点取值数量进行控制,达到根据雷达回波数据满足不同条件的分类单元构建不同分类器的目的。本发明引入融化层信息、异常值信息以及场景影响信息作为降水粒子的类先验概率组成部分。
具体方法如下:
融化层信息为一对高度信息,气象学中将干球温度0°层作为融化层底部,将湿球温度0°层作为融化层顶部,根据已知的融化层与雷达径向距离的关系,并依靠主瓣波束宽度信息和雷达仰角信息对融化层信息进行扩展,求得4个雷达径向距离信息Rbb,Rb,Rt,Rtt,将雷达扫描区域分为5个融化区域,不同融化区域内允许存在的降水粒子如图7所示,图中标记出来的降水粒子表明该区域仅允许这些降水粒子存在。若某雷达距离单元内不允许某种类型降水粒子存在,将该降水粒子类先验概率置为0,否则为1,将第j类降水粒子融化层先验概率记为P1(C=j),j∈{1,2,…,9}
异常值信息:根据偏振参量取值可以进行降水粒子的筛选,例如暴雨(HR)的反射率强度不可能小于30dBZ,因此当差分反射率因子ZH≤30dBZ时,令暴雨(HR)第二部分P2(c6)=0。第j类降水粒子异常值先验概率记为P2(C=j),j∈{1,2,…,9}。更多异常值信息参见表3。
表3属性特定范围内禁止存在降水粒子类别
Figure BDA0002263367740000101
场景影响信息:针对不同应用场景中不同降水粒子对分类要求的影响程度不同,引入场景影响因子λ。例如在飞机飞行过程中,冰雹、冰晶的影响程度明显高于其他降水粒子,为提高在特定应用场景对特定降水粒子的分类性能,将场景影响因子λ加入类先验概率中,第j类降水粒子场景影响先验概率记为λ(C=j),j∈{1,2,…,9}。
因此对类别标签为j,j∈{1,2,...,9}的降水粒子的类先验概率公式可以表示成式(9),最终计算出每种降水粒子的类先验概率P(C=j),(j∈{1,2,…,9})
P(C=j)=λ(C=j)P1(C=j)P2(C=j),j∈{1,2,…,9}   (9)
4)将步骤2)中获得的条件概率密度表、步骤3)中获得的降水粒子的类先验概率输入到步骤3)中构建的贝叶斯网络分类器中,由此进行降水粒子分类的S4阶段。
设贝叶斯网络分类器四个偏振参量属性节点的输入为[ZH,ZDRHV,KDP]=[x1,x2,x3,x4],根据最大后验概率准则,贝叶斯网络实现降水粒子分类问题可以描述为如下最大后验概率问题:
Figure BDA0002263367740000102
其中j表示类别标签,cj表示第j类降水粒子。根据贝叶斯公式可将式(10)转化为:
Figure BDA0002263367740000103
其中xi表示第i(i∈{1,2,3,4})号双偏振气象雷达的偏振参量属性节点,πi表示节点xi的父节点数量,P(x1,x2,x3,x4)为常数,公式(10)所示后验概率问题转化为先验概率问题,如公式(12)所示:
Figure BDA0002263367740000111
其中父节点数量πi可以通过读取贝叶斯网络结构获得;P(xii,cj)是偏振参量的条件概率,记录在条件概率密度表中;P(cj)表示第j类降水粒子cj的先验概率。最终求得的第j类降水粒子cj对应的类型即为降水粒子分类结果。基本流程图如图8所示。
为了验证本发明方法的效果,本发明人进行了如下试验:
双偏振气象雷达的实测数据采自NOAA(National Oceanic and AtmosphericAdministration,美国国家海洋和大气管理局)官方网站,选取WSR-88D雷达网中坐落于俄克拉荷马市(OKLAHOMA)的一部双偏振气象雷达KTLX,该雷达位于35.1958N°97.1640W°。连续采集双偏振气象雷达KTLX于2018年5月15-16日的雷达回波数据作为离散化数据集并进行了偏振参量数据离散化,最终得到满足需求的差分反射率因子ZH、差分传播相移ZDR、差分传播相移率KDP及零滞后互相关系数ρHV的离散化标准如下表所示。
表4双偏振气象雷达偏振参量离散化标准
Figure BDA0002263367740000112
实验一:采集了双偏振气象雷达KTLX在2018年6月7日15:14的一次中型降雨天气的雷达回波数据,并利用本发明方法进行了降水粒子分类,然后与模糊逻辑分类算法(FLA)的分类结果进行对比,如图9所示。两种分类算法得到的不同类别降水粒子数量统计如表5所示。为了更清楚体现两种分类算法的差异,引入基于灰度共生矩阵(Gray-level co-occurrence matrix,GLCM)的纹理特征统计量来定量地评估两种分类结果。本发明选取以下3种统计特征:1)角二阶矩是一种对图像灰度分布均匀性的度量,由于是灰度共生矩阵元素值平方和,所以也称为能量。2)图像的熵即是图像所包含的信息量多少,熵的大小代表了图像中纹理信息的多少,当图像分布不均匀时,GLCM元素的值很小,熵值很大。3)同质性表明图像相邻像素间的同质性,它对GLCM对角线附近的元素更加敏感,当图像中的所有元素都相同时,同质性达到最大。分别计算了两种分类结果的上述3个统计特征如表6所示。通过图9(a)可以看出,本发明方法可以很好地完成降水粒子分类,已达到业务应用水平。比较图9(a)、(b)发现:图9(a)中图像相邻分类单元连续性强(两种算法都是逐回波单元进行分类),物理聚类特征表现更明显,这在表6的特征统计量中已得到验证,贝叶斯网络分类结果图各个方向的角二阶矩以及同质性均略高于模糊逻辑分类结果。从图9(b),图9(a)可以看出,主要区别集中在右上方区域,本发明方法识别出了更多的霰(GR),而模糊逻辑分类算法将其分为干雪。通过表5发现,在中型降雨天气下,本发明方法识别出的地杂波(GC)较多,这主要因为模糊逻辑分类算法中地杂波中存在很多未知点。本发明方法分类结果中降水粒子总量比模糊逻辑分类算法有所提升,证明了本发明方法将附加信息加入到类先验概率中提高了分类算法对降水粒子的识别能力。
表5各类降水粒子数量及占比(2018/06/07 15:14)
Figure BDA0002263367740000121
表6灰度共生矩阵统计特征(2018/06/07 15:14),其中方向角度表示的是图像纹理方向,例如0°表示水平纹理特征,90°表示垂直纹理特征
Figure BDA0002263367740000122
Figure BDA0002263367740000131
然后分别选取2018年6月7日15:14,双偏振气象雷达KTLX在北偏东14°方位角下不同仰角的雷达体扫数据经上述两种分类算法的分类结果如图10所示,比较图10(a)和图10(b)可以看出,两种分类算法结果基本一致,在0.8°仰角处,霰、干雪和湿雪的分类结果存在一定差异,但是在0.5°处降雹地点的估计一致。针对1.5度仰角下148公里处模糊逻辑分类算法未给出分类结果的空白区域,本发明方法给出的分类结果是湿雪(WS),符合此处物理环境特征。
实验二:强对流天气是具有重大杀伤性的灾害性天气之一,常常伴随着冰雹(HA)与短时强降雨,分类算法能否有效地识别冰雹(HA)显得尤为重要,因此选取KTLX在2018年9月21日18:33采集的一次强对流天气的雷达回波数据,并在此次实验中提高冰雹(HA)影响因子,令λ=[1,1,1,1,1,1,1,1,3]。分类结果如图11所示。两种分类算法得到的不同类别降水粒子数量统计如表7所示。
表7各类别降水粒子数量及占比(2018/09/21 18:33)
Figure BDA0002263367740000132
从图11可以看出,本发明方法在强对流恶劣天气下依然可以准确地完成降水粒子分类。相比于实验一,此次降雨规模已经全部覆盖地杂波(GC),在这种情况下,不同于之前实验结果,本发明方法识别出的地杂波(GC)较少,说明在强对流天气模式下本发明方法可以更有效摆脱地杂波的干扰,完成降水粒子分类,体现了本发明方法的泛化性更强。观察表7数据可知,本发明方法对冰雹(HA)粒子的识别能力明显提升,达到了我们通过控制场景影响因子提高特定降水粒子识别能力的目的,体现了本发明方法的可操作性。

Claims (4)

1.一种基于离散属性BNT的双偏振气象雷达降水粒子分类方法,其特征在于:所述的基于离散属性BNT的双偏振气象雷达降水粒子分类方法包括按顺序进行的下列步骤:
1)获取双偏振气象雷达的实测偏振参量数据,从中随机选取部分或全部数据作为离散化数据集,同时选取部分数据作为训练数据集,采用基于粗糙集信息熵的离散化算法对离散化数据集中的离散化数据进行离散化而获得离散化标准,之后利用离散化标准对训练数据集中的训练数据进行离散化的S1阶段;
2)使用上述训练数据集中离散化后的训练数据对贝叶斯网络进行基于互信息的贝叶斯网络结构学习以及与学得结构相对应的参数学习,获得条件概率密度表,并完成贝叶斯网络分类器构建的S2阶段;
3)利用融化层信息、异常值信息以及场景影响信息计算出降水粒子的类先验概率的S3阶段;
4)将步骤2)中获得的条件概率密度表、步骤3)中获得的降水粒子的类先验概率输入到步骤3)中构建的贝叶斯网络分类器中,由此进行降水粒子分类的S4阶段。
2.根据权利要求1所述的基于离散属性BNT的双偏振气象雷达降水粒子分类方法,其特征在于:在步骤1)中,所述的获取双偏振气象雷达的实测偏振参量数据,从中随机选取部分或全部数据作为离散化数据集,同时选取部分数据作为训练数据集,采用基于粗糙集信息熵的离散化算法对离散化数据集中的离散化数据进行离散化而获得离散化标准,之后利用离散化标准对训练数据集中的训练数据进行离散化的方法是:
对离散化数据集中数据进行排序去重,取相邻两个数据的中点值作为候选断点集合,结果断点集初始化为空集;计算候选断点对论域的信息熵值,取最小者加入到结果断点集合中,之后计算离散化数据集中的样本值与结果断点集合中每一个元素的欧氏距离集合,找到与欧氏距离集合中最小元素对应的断点与样本值,令该断点代替样本值;根据这个最小欧式距离准则,更新离散化数据集中全部样本的值可得到一个新的决策表,判断新决策表的相容性,迭代直到整个决策表相容为止;最终输出的结果断点集合D称为离散化标准;得到的离散化标准用最小欧式距离准则更新训练数据集,可得到离散化的训练数据集。
3.根据权利要求1所述的基于离散属性BNT的双偏振气象雷达降水粒子分类方法,其特征在于:在步骤2)中,所述的使用上述训练数据集中离散化后的训练数据对贝叶斯网络进行基于互信息的贝叶斯网络结构学习以及与学得结构相对应的参数学习,获得条件概率密度表,并完成贝叶斯网络分类器构建的方法是:
基于互信息的贝叶斯网络结构学习是:计算两两属性节点间的互信息,并且选取大于门限值的节点对建立无向边;之后对建立的无向边定向,定向原则是与类节点互信息值大的属性节点指向与类节点互信息值小的属性节点;如果求得的贝叶斯网络中存在成环的部分,则去掉环中互信息最小的边,最终得到一个有向无环图;与学得结构相对应的参数学习的方法是:对离散化后的训练数据进行统计计数,然后根据结构学习学得的贝叶斯网络结构以及偏振参量的不同取值求出每种组合情况相应的概率,之后进行拉普拉斯平滑处理构成条件概率密度表。
4.根据权利要求1所述的基于离散属性BNT的双偏振气象雷达降水粒子分类方法,其特征在于:在步骤3)中,所述的利用融化层信息、异常值信息以及场景影响信息计算出降水粒子的类先验概率的方法是:
某雷达距离单元内不存在某种降水粒子,将该降水粒子类先验概率置为0,否则为1;属性范围内禁止存在的降水粒子先验概率置为0;针对应用场景对降水粒子分类的影响,适当提高或降低对应降水粒子的类先验概率。
CN201911079020.1A 2019-11-07 2019-11-07 基于离散属性bnt的双偏振气象雷达降水粒子分类方法 Active CN110852245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911079020.1A CN110852245B (zh) 2019-11-07 2019-11-07 基于离散属性bnt的双偏振气象雷达降水粒子分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911079020.1A CN110852245B (zh) 2019-11-07 2019-11-07 基于离散属性bnt的双偏振气象雷达降水粒子分类方法

Publications (2)

Publication Number Publication Date
CN110852245A CN110852245A (zh) 2020-02-28
CN110852245B true CN110852245B (zh) 2023-04-28

Family

ID=69598642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911079020.1A Active CN110852245B (zh) 2019-11-07 2019-11-07 基于离散属性bnt的双偏振气象雷达降水粒子分类方法

Country Status (1)

Country Link
CN (1) CN110852245B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111310739A (zh) * 2020-04-01 2020-06-19 泸州市气象局 一种暴雨天气检测方法、系统及终端
CN111738339A (zh) * 2020-06-23 2020-10-02 中国民航大学 一种针对双偏振气象雷达低分辨数据的降水粒子分类方法
CN112085060A (zh) * 2020-08-07 2020-12-15 中国民航大学 基于SVT-DTSVMs的双偏振气象雷达降水粒子分类方法及装置
CN113095442B (zh) * 2021-06-04 2021-09-10 成都信息工程大学 基于半监督学习在多维度雷达数据下的冰雹识别方法
CN113625283B (zh) * 2021-07-28 2024-04-02 南京航空航天大学 基于残差卷积神经网络的双极化气象雷达水凝物粒子相态识别方法
CN113777573B (zh) * 2021-08-30 2023-12-01 中船鹏力(南京)大气海洋信息系统有限公司 基于朴素贝叶斯分类器的双偏振雷达二次回波识别方法
CN113933809B (zh) * 2021-09-30 2022-07-29 中山大学 一种基于Kmeans聚类的降水粒子识别方法及装置
CN114545416A (zh) * 2022-02-25 2022-05-27 中山大学 一种面向对象的定量降水估测方法、装置及终端设备
CN114895381B (zh) * 2022-07-11 2022-09-30 南京气象科技创新研究院 一种基于双线偏振雷达的地闪分级预警方法
CN116108338B (zh) * 2023-04-13 2023-06-23 北京弘象科技有限公司 一种针对粒子相态的动态集合识别方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107607954A (zh) * 2017-09-11 2018-01-19 中国民航大学 一种基于t‑s模型的fnn降水粒子相态识别方法
CN108647740A (zh) * 2018-05-16 2018-10-12 河海大学 利用高分辨率地形和气象因子进行多源降水融合的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120078678A1 (en) * 2010-09-23 2012-03-29 Infosys Technologies Limited Method and system for estimation and analysis of operational parameters in workflow processes
US10407078B2 (en) * 2016-04-26 2019-09-10 Sivalogeswaran Ratnasingam Dynamic learning driving system and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107607954A (zh) * 2017-09-11 2018-01-19 中国民航大学 一种基于t‑s模型的fnn降水粒子相态识别方法
CN108647740A (zh) * 2018-05-16 2018-10-12 河海大学 利用高分辨率地形和气象因子进行多源降水融合的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李海军,王钲旋,王利民,苑森淼.一种基于贝叶斯测度的有监督离散化方法.仪器仪表学报.2006,(第08期),全文. *

Also Published As

Publication number Publication date
CN110852245A (zh) 2020-02-28

Similar Documents

Publication Publication Date Title
CN110852245B (zh) 基于离散属性bnt的双偏振气象雷达降水粒子分类方法
CN107194336B (zh) 基于半监督深度距离度量网络的极化sar图像分类方法
Zhao et al. Automatic recognition of loess landforms using Random Forest method
CN103345757A (zh) 多层次多特征约束下的光学和sar影像自动配准方法
Zhang et al. A GANs-based deep learning framework for automatic subsurface object recognition from ground penetrating radar data
CN104794730B (zh) 基于超像素的sar图像分割方法
CN107944357A (zh) 基于证据融合自适应阈值的多源遥感图像云检测方法
JP2019211342A (ja) 気象解析装置、気象解析方法、およびプログラム
Tapiador et al. Neural networks in satellite rainfall estimation
CN110059713A (zh) 一种基于降水粒子多特征参量的降水类型识别方法
Ni et al. DNN-based PolSAR image classification on noisy labels
CN112116019A (zh) 一种多传感器Vine Copula异构信息决策融合方法
Orescanin et al. Bayesian deep learning for passive microwave precipitation type detection
Günen Adaptive neighborhood size and effective geometric features selection for 3D scattered point cloud classification
Ma et al. A Bayesian domain adversarial neural network for corn yield prediction
Hou et al. Storm tracking via tree structure representation of radar data
Vignesh et al. A novel multiple unsupervised algorithm for land use/land cover classification
CN111460943A (zh) 一种遥感影像地物分类方法及系统
Jin A random forest based method for urban land cover classification using LiDAR data and aerial imagery
Ju et al. Modified diversity of class probability estimation co-training for hyperspectral image classification
Wu et al. Optimized Intelligent Algorithm for Classifying Cloud Particles Recorded by a Cloud Particle Imager
Lee et al. Anomalous propagation echo classification of imbalanced radar data with support vector machine
Mansourmoghaddam et al. Evaluation of the classification accuracy of NDVI index in the preparation of land cover map
Narayanan et al. Classification of SHOALS 3000 bathymetric LiDAR signals using decision tree and ensemble techniques
Gupta et al. Improved framework of many‐objective evolutionary algorithm to handle cloud detection problem in satellite imagery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant