CN103413148A - 基于随机自适应符号稀疏编码的地基云图分类方法 - Google Patents

基于随机自适应符号稀疏编码的地基云图分类方法 Download PDF

Info

Publication number
CN103413148A
CN103413148A CN2013103893460A CN201310389346A CN103413148A CN 103413148 A CN103413148 A CN 103413148A CN 2013103893460 A CN2013103893460 A CN 2013103893460A CN 201310389346 A CN201310389346 A CN 201310389346A CN 103413148 A CN103413148 A CN 103413148A
Authority
CN
China
Prior art keywords
cloud atlas
sparse coding
code book
ground
ground cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013103893460A
Other languages
English (en)
Other versions
CN103413148B (zh
Inventor
王春恒
刘爽
肖柏华
张重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201310389346.0A priority Critical patent/CN103413148B/zh
Publication of CN103413148A publication Critical patent/CN103413148A/zh
Application granted granted Critical
Publication of CN103413148B publication Critical patent/CN103413148B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于随机自适应符号稀疏编码的地基云图分类方法,该方法包括:对于训练样本集合随机提取样本的局部特征;利用自适应符号稀疏编码对这些局部特征组成的集合进行聚类得到码本;对每个样本随机提取的局部特征,计算其与码本对应的稀疏编码系数,得到该样本随机局部特征的稀疏编码系数组成的矩阵;接下来利用最大化抽取操作得到样本的特征表示;计算测试地基云图的特征表示;利用分类器得到测试地基云图的分类结果。本发明通过随机提取地基云图的局部特征来提高地基云图分类的效率,节省时间开销;同时本发明采用自适应符号稀疏编码的方法来获得码本并计算局部特征的稀疏编码系数,从而可以更好地表示云图中信息,提高分类性能。

Description

基于随机自适应符号稀疏编码的地基云图分类方法
技术领域
本发明属于图像处理技术领域,尤其是一种基于随机自适应符号稀疏编码的地基云图分类方法。
背景技术
云是大气中热力过程和动力过程的外部表现,其生成及演变是大气中发生的错综复杂的物理过程的具体表现之一,不仅反映当时大气的运动、稳定度和水汽情况等,而且能够预示未来一定时间内的天气变化趋势。因此,云的观测是气象观测的重要内容,准确地获取云的信息,对于天气预报以及国民经济和军事保障等诸多领域都有十分重要的意义。目前,云的观测主要是通过地基观测和卫星遥感来完成。其中卫星遥感在大尺度云的观测取得了很好的成果,但由于其空间分辨率以及对云底和多层云的下层云的观测能力的限制,所以不能满足大气科学研究的需要。而地基云观测的范围较小,反映的是云块大小、排列方式以及云的高低分布等局地分部信息,弥补了卫星观测的不足,同时对大气科学许多研究领域具有重要意义。
在地基云观测中,云状分类是地基云观测的主要要素,也是分析云资料时的重要统计内容。目前,主要通过地面的人工目测来进行云状分类,即依靠气象观测员主观判断当前天空云状类型。然而,目测云状类型有很多缺点。首先,云状分类采用人工目测方式,每个地面观测站都需要观测人员进行观测,成本较高;其次,人工目测带有较大的主观性,不但容易受到心理、生理、视力、责任心等方面的影响,还会受到观测人员经验和水平的影响。相同的云状由不同的人观测可能会产生不同的观测结果,即使相同的观测员在不同条件下也可能会给出不同的观测结果。因此实现云状的自动分类是当前的迫切需要。
近年来,随着硬件技术的发展和数字图像处理技术的不断完善,很多地基遥感测云仪器研制成功,从而获得天空图像,比如国外的全天空成像仪WSI(whole sky imager)、总天空成像仪TSI(total sky imager)、红外云成像仪ICI(infrared cloud imager)、全天空数字相机等。上述设备为分析地基云图提供了硬件支持,使得地基云的自动化观测成为可能。国际上云的分类主要以云的基本外形特征和高度特征为依据,并结合云的成因发展和内部微观结构,将云状划分为3族10属29类。其中,3族是把云按照高低分为高云、中云和低云三族,每一族云又划分为几类形成10属云,包括积云、积雨云、层积云、层云、雨层云、高层云、高积云、卷云、卷层云和卷积云。对10属云可进一步划分为29类。然而此分类方法的可操作性并不强,不仅很难适用于器测云分类,而且即使具有相当水平的观测员也很难准确识别这29类云。
在云状自动分类的研究方面,国际上Buch等人对WSI云图进行了分类,主要考察云图的纹理特征、位置信息和像元亮度信息,纹理特征选择采用了LAWS纹理分析法;运用二元决策树进行高积云、卷云、层云、积云和晴空等5种天空类型的判断。Peura等人利用云的基本物理信息作为特征将全天空云图分为10属。Singh等人对数字相机得到的云图进行分类,对积云、浓积云、积雨云、天空和其他云类这5种天空类型分类。Heinle等人采用德国吉尔大学获得的全天空图像,通过提取云图的纹理、结构以及统计特征来对云图进行分类。孙学金等人通过研究WSIRCMS获取的红外云图,提出了基于结合模糊纹理光谱和云物理属性的全天空云类识别方法。以上分类方法均是对云图提取简单的纹理特征,显然不能很好地表示地基云图这种包含丰富信息的自然纹理图像,同时能够快速获得云图的分类结果对于那些有实时性要求的系统尤为重要。
发明内容
为了解决上述现有技术存在的问题,本发明的目的是根据地基云图的特点,提出一种分类性能更好的地基云图分类方法。由于地基云图包含丰富的纹理信息,同时地基云图分类系统要求快速地对地基云图进行分类。为此,本发明提供一种基于随机自适应符号稀疏编码的地基云图分类方法,该方法通过随机提取地基云图的局部特征,从而可以提高地基云图分类系统的效率,节省时间开销;同时本发明采用自适应符号稀疏编码的方法来获得码本并计算局部特征的稀疏编码系数,从而可以更好地表示云图中信息,获得分类性能的提高。
为了实现上述目的,本发明提出的一种基于随机自适应符号稀疏编码的地基云图分类方法,该方法包括以下步骤:
步骤1,对于训练地基云图样本集合,随机提取每一训练地基云图样本的多个局部特征;
步骤2,利用自适应符号稀疏编码对这些局部特征组成的集合进行聚类得到码本D;
步骤3,根据所述步骤2,对于每张训练地基云图样本随机提取得到多个局部特征,计算与每个局部特征和所述码本D对应的稀疏编码系数向量,从而得到每张训练地基云图样本的多个局部特征的稀疏编码系数向量组成的矩阵A′,对所述矩阵A′利用最大化抽取操作计算得到所述训练地基云图样本最终的特征表示;
步骤4,对于测试地基云图,按照所述步骤3得到所述测试地基云图的最终特征表示;
步骤5,基于所述训练地基云图样本的最终特征表示和所述测试地基云图的最终特征表示,利用分类器对所述测试地基云图进行分类,得到所述测试地基云图的分类结果。
本发明的有益效果:本发明通过随机提取地基云图的局部特征来计算码本,并且通过随机提取的局部特征来获得图像最终的特征表示,从而提高了地基云图分类系统的效率,节省了时间开销;同时本发明采用自适应符号稀疏编码的方法来获得码本并计算局部特征的编码系数,可以更好地表示云图中信息,获得分类性能的提高。以上特点使本发明可以获得较快的分类速度和更为精确的分类准确性。
附图说明
图1是本发明提出的基于随机自适应符号稀疏编码的地基云图分类方法的流程图;
图2是本发明方法在Kiel数据集上的分类结果示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图1是本发明提出的基于随机自适应符号稀疏编码的地基云图分类方法的流程图,如图1所示,所述方法包括以下步骤:
步骤1,对于训练地基云图样本集合,随机提取每一训练地基云图样本的多个局部特征;
在本发明一实施例中,利用局部图像的强度值作为训练地基云图样本的局部特征。
步骤2,利用自适应符号稀疏编码对这些局部特征组成的集合进行聚类得到码本D;
该步骤中,基于下式,利用自适应符号稀疏编码对这些局部特征组成的集合X=[x1,x2,…,xL]进行聚类得到码本D:
min D , A Σ i = 1 L | | x i - Da i | | 2 + λ | | a i | | 1 + μ | | | a i | - a i | | 1 - - - ( 1 )
s . t . | | d k | | 2 ≤ 1 , ∀ k = 1,2 , . . . , N
其中,xi代表第i个局部特征,ai代表与局部特征xi对应的稀疏编码系数向量,A=[a1,…,aL]代表与局部特征集合X对应的稀疏编码系数向量组成的矩阵,L代表局部特征和稀疏编码系数向量的数量,λ、μ代表正则化参数,其中λ用来约束系数向量的稀疏性,μ用来控制非零稀疏编码系数的正负比,dk代表码本D中的第k个元素,N代表码本D中的元素数量,||·||1代表向量的l1范数,|·|代表一个向量,向量中的每一元素为ai中相应元素的绝对值,||·||2代表向量中元素绝对值的平方和。
求解上式可以同时得到码本D和局部特征集合的稀疏编码系数向量矩阵A,但由于此优化函数属于非凸函数,无法直接求解,因此,可采用固定D和A其中一个,求解另一个,然后迭代优化方程(1)的方法进行求解,具体为:
步骤21,利用聚类算法,比如K-means算法对训练地基云图样本的局部特征组成的集合X进行聚类,将聚类中心作为初始化的码本D;
步骤22,固定所述初始化的码本D,公式(1)的求解可以通过优化每一个局部特征的稀疏编码系数向量得到:
min a i | | x i - Da i | | 2 + λ | | a i | | 1 + μ | | | a i | - a i | | 1 - - - ( 2 )
该问题是一个自适应约束和L1范数的线性回归问题,采用特征符号搜索算法就可以求解该问题,得到初始化的稀疏编码系数矩阵A。
步骤23,固定所述初始化的稀疏编码系数矩阵A,公式(1)的优化问题又转化为一个最小二乘问题:
min D | | X - DA | | F 2 - - - ( 3 )
其中,||·||F代表矩阵的Frobenius范数,该问题可通过拉格朗日对偶算法来求解,从而得到新的码本D。
步骤24,重复所述步骤22和23直至迭代收敛,最终得到码本D和对应的稀疏编码系数矩阵A。
步骤3,根据所述步骤2,对于每张训练地基云图样本随机提取得到多个局部特征,计算与每个局部特征和所述码本D对应的稀疏编码系数向量,从而得到每张训练地基云图样本的多个局部特征的稀疏编码系数向量组成的矩阵A′,对所述矩阵A′利用最大化抽取操作计算得到所述训练地基云图样本最终的特征表示;
该步骤中,对每张训练地基云图样本随机提取得到的局部特征xw,按照公式(2)计算与所述码本D对应的稀疏编码系数向量aw,得到该训练地基云图样本随机局部特征的稀疏编码系数向量组成的矩阵,记为A′=[a1,…,aW],其中W代表所述训练地基云图样本的局部特征的数量。
接下来,根据获得的训练地基云图样本随机局部特征的稀疏编码系数向量组成的矩阵A′,利用最大化抽取操作计算所述训练地基云图样本的最终特征表示z,公式如下:
zn=max{an1,an2,K,anW}      (4)
这里,zn代表向量z的第n个元素,anw代表矩阵A′中第n行w列的元素。
步骤4,对于测试地基云图,按照所述步骤3得到所述测试地基云图的最终特征表示;
步骤5,基于所述训练地基云图样本的最终特征表示和所述测试地基云图的最终特征表示,利用支持向量机(SVM)之类的分类器对所述测试地基云图进行分类,得到所述测试地基云图的分类结果。
接下来以德国基尔大学莱布尼茨实验室提供的全天空可见光地基云图数据(简记为Kiel)作为测试对象来检验本发明方法的有效性。首先按照相似的天空指示意义把天空图像分为7类,具体地,将卷积云和高积云合并为一类,层云和高层云合并为一类,积雨云和雨层云合并为一类,卷云和卷层云合并为一类,这样剩余的云属加上晴空就把天空图像分为7类。实验时,随机选取每类样本中的1/3作为训练样本,剩下的2/3作为测试样本。为了保障结果的稳定性,将这种随机划分方式重复100次,并将100次的平均值作为最后的分类结果。图2显示的是本发明方法与基于自适应符号稀疏编码(Soft Sparse coding,SSC)的地基云图分类方法以及基于稀疏编码(Sparse coding,SC)的地基云图分类方法的分类性能比较示意图。
从图2中可以看出,本发明方法与基于SSC方法的分类性能均超过基于SC的分类方法;同时本发明方法可以获得和SSC方法相似的分类性能,但是所用时间却比基于SSC的分类方法低很多。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于随机自适应符号稀疏编码的地基云图分类方法,其特征在于,该方法包括以下步骤:
步骤1,对于训练地基云图样本集合,随机提取每一训练地基云图样本的多个局部特征;
步骤2,利用自适应符号稀疏编码对这些局部特征组成的集合进行聚类得到码本D;
步骤3,根据所述步骤2,对于每张训练地基云图样本随机提取得到多个局部特征,计算与每个局部特征和所述码本D对应的稀疏编码系数向量,从而得到每张训练地基云图样本的多个局部特征的稀疏编码系数向量组成的矩阵A′,对所述矩阵A′利用最大化抽取操作计算得到所述训练地基云图样本最终的特征表示;
步骤4,对于测试地基云图,按照所述步骤3得到所述测试地基云图的最终特征表示;
步骤5,基于所述训练地基云图样本的最终特征表示和所述测试地基云图的最终特征表示,利用分类器对所述测试地基云图进行分类,得到所述测试地基云图的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述局部特征为局部图像的强度值。
3.根据权利要求1所述的方法,其特征在于,所述步骤2中,基于下式,利用自适应符号稀疏编码对所述局部特征组成的集合X=[x1,x2,…,xL]进行聚类得到码本D:
min D , A Σ i = 1 L | | x i - Da i | | 2 + λ | | a i | | 1 + μ | | | a i | - a i | | 1 ,
s . t . | | d k | | 2 ≤ 1 , ∀ k = 1,2 , . . . , N ,
其中,xi代表第i个局部特征,ai代表与局部特征xi对应的稀疏编码系数向量,A=[a1,…,aL]代表与局部特征集合X对应的稀疏编码系数向量组成的矩阵,L代表局部特征和稀疏编码系数向量的数量,λ、μ代表正则化参数,λ用来约束系数向量的稀疏性,μ用来控制非零稀疏编码系数的正负比,dk代表码本D中的第k个元素,N代表码本D中的元素数量,||·||1代表向量的l1范数,|·|代表一个向量,向量中的每一元素为ai中相应元素的绝对值,||·||2代表向量中元素绝对值的平方和。
4.根据权利要求3所述的方法,其特征在于,得到码本D的步骤进一步包括:
步骤21,利用聚类算法对训练地基云图样本的局部特征集合X进行聚类,将得到的聚类中心作为初始化的码本D;
步骤22,固定所述初始化的码本D,通过优化每一个局部特征的稀疏编码系数向量得到初始化的稀疏编码系数矩阵A:
min a i | | x i - Da i | | 2 + λ | | a i | | 1 + μ | | | a i | - a i | | 1 ;
步骤23,固定所述初始化的稀疏编码系数矩阵A,通过求解最小二乘问题得到新的码本D:
min D | | X - DA | | F 2 ,
其中,||·||F代表矩阵的Frobenius范数;
步骤24,重复所述步骤22和23直至迭代收敛,最终得到码本D和对应的稀疏编码系数矩阵A。
5.根据权利要求1所述的方法,其特征在于,利用下式计算所述训练地基云图样本的最终特征表示z:
zn=max{an1,an2,K,anW},
其中,zn代表最终特征表示z的第n个元素,anw代表矩阵A′中第n行w列的元素。
6.根据权利要求1所述的方法,其特征在于,所述分类器为支持向量机分类器。
CN201310389346.0A 2013-08-30 2013-08-30 基于随机自适应符号稀疏编码的地基云图分类方法 Expired - Fee Related CN103413148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310389346.0A CN103413148B (zh) 2013-08-30 2013-08-30 基于随机自适应符号稀疏编码的地基云图分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310389346.0A CN103413148B (zh) 2013-08-30 2013-08-30 基于随机自适应符号稀疏编码的地基云图分类方法

Publications (2)

Publication Number Publication Date
CN103413148A true CN103413148A (zh) 2013-11-27
CN103413148B CN103413148B (zh) 2017-05-24

Family

ID=49606155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310389346.0A Expired - Fee Related CN103413148B (zh) 2013-08-30 2013-08-30 基于随机自适应符号稀疏编码的地基云图分类方法

Country Status (1)

Country Link
CN (1) CN103413148B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101876993A (zh) * 2009-11-26 2010-11-03 中国气象科学研究院 一种地基数字云图的纹理特征抽取和检索方法
CN102393914A (zh) * 2011-10-28 2012-03-28 华中科技大学 一种基于支持向量机分类树的地基云图识别方法
CN103235954A (zh) * 2013-04-23 2013-08-07 南京信息工程大学 一种基于改进AdaBoost算法的地基云图识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101876993A (zh) * 2009-11-26 2010-11-03 中国气象科学研究院 一种地基数字云图的纹理特征抽取和检索方法
CN102393914A (zh) * 2011-10-28 2012-03-28 华中科技大学 一种基于支持向量机分类树的地基云图识别方法
CN103235954A (zh) * 2013-04-23 2013-08-07 南京信息工程大学 一种基于改进AdaBoost算法的地基云图识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘瑞涛: "基于支持向量机分类树的地基云图分类研究", 《中国优秀硕士论文全文数据库(电子期刊)》 *

Also Published As

Publication number Publication date
CN103413148B (zh) 2017-05-24

Similar Documents

Publication Publication Date Title
CN112766199B (zh) 基于自适应多尺度特征提取模型的高光谱图像分类方法
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
Ohba et al. Impacts of synoptic circulation patterns on wind power ramp events in East Japan
CN107728234B (zh) 一种基于大气电场数据的雷电强度值预测方法
CN107392901A (zh) 一种用于输电线路部件智能自动识别的方法
CN106991666B (zh) 一种适用于多尺寸图片信息的病害图像识别方法
CN100595782C (zh) 一种融合光谱信息和多点模拟空间信息的分类方法
CN113837499A (zh) 一种超短期风电功率预测方法及系统
CN110888186A (zh) 基于gbdt+lr模型的冰雹和短时强降水预报方法
CN117290810B (zh) 基于循环卷积神经网络的短时强降水概率预报融合方法
CN111582555B (zh) 基于地基云图图像特征的光伏功率预测方法
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
CN116543282A (zh) 基于多尺度融合与CBAM-ResNet50的农作物病害分割方法、系统、设备及介质
Chidean et al. Spatio-temporal analysis of wind resource in the Iberian Peninsula with data-coupled clustering
CN103336972A (zh) 一种基于完备化局部三值模式的地基云图分类方法
CN105279582B (zh) 基于动态相关性特征的超短期风电功率预测方法
CN111488974A (zh) 基于深度学习神经网络的海洋风能降尺度方法
CN114882373A (zh) 基于深度神经网络的多特征融合沙尘暴预测方法
CN104463252A (zh) 一种基于自适应极限学习机的地基云分类方法
CN103605988A (zh) 一种基于空间金字塔随机映射的地基云图分类方法
CN114386654A (zh) 一种多尺度数值天气预报模式融合的天气预报方法及装置
CN113671599A (zh) 一种基于全球气候模式的登陆气旋识别方法
Yang et al. Intra-day solar irradiation forecast using machine learning with satellite data
Wang et al. Comparing different boundary layer schemes of WRF by simulation the low-level wind over complex terrain
CN117710508A (zh) 基于改进条件生成对抗网络的近地表温度反演方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170524

CF01 Termination of patent right due to non-payment of annual fee