CN112597863A - 云分类方法及设备 - Google Patents
云分类方法及设备 Download PDFInfo
- Publication number
- CN112597863A CN112597863A CN202011488861.0A CN202011488861A CN112597863A CN 112597863 A CN112597863 A CN 112597863A CN 202011488861 A CN202011488861 A CN 202011488861A CN 112597863 A CN112597863 A CN 112597863A
- Authority
- CN
- China
- Prior art keywords
- data
- training
- cloud
- model
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000012549 training Methods 0.000 claims abstract description 100
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 19
- 238000012544 monitoring process Methods 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 238000005520 cutting process Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 239000002352 surface water Substances 0.000 claims description 6
- 238000005096 rolling process Methods 0.000 claims description 4
- 230000010365 information processing Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 3
- 238000003860 storage Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000005291 magnetic effect Effects 0.000 description 5
- 241000208818 Helianthus Species 0.000 description 4
- 235000003222 Helianthus annuus Nutrition 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 101100269850 Caenorhabditis elegans mask-1 gene Proteins 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000001752 chlorophylls and chlorophyllins Substances 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003595 mist Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Remote Sensing (AREA)
- Astronomy & Astrophysics (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明的目的是提供一种云分类方法及设备,通过卫星图像和神经网络的结合,同时输入地形、晨昏线数据和标签数据的重要信息,综合考虑到地形数据、晨昏线数据、标签数据对云状的影响,共同训练出一个可在夜晚和白天通用的,且能考虑到不同地形影响的卫星图像反演云状模型,能够更高效和准确的完成全天候的云状产品输出。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种云分类方法及设备。
背景技术
气象观测是气象工作的基础,地面气象观测是气象观测的重要组成部分。而天空中云的观测是地面观测的重要部分之一,云的准确无误的观测对飞机航行、人工影响天气(人工影响天气是指为避免或者减轻气象灾害,合理利用气候资源,在适当条件下通过科技手段对局部大气的物理过程进行人工影响,实现增雨(雪)、防雹、消雨、消雾、防霜等目的的活动)和天气预报都有重要意义。
天空中云的观测,包括云状、云量和云高的观测。云量是指云遮蔽天空视野的成数,云高是指云底距离观测站的垂直高度。如果有条件可通过云幕球、激光测云仪等进行实测云高,否则可通过目测和经验公式等估测云高。然而唯有云状的观测为最不易掌握。因为云的演变是千变万化的,几分钟前的某种云状,几分钟后就有可能发展变化为另一种云状。并且云状的变化受到当时天气条件等多方面的影响,如天空中风速的大小、天空中对流、乱流、水汽含量、逆温层、局地环流变化及大范围天气系统变化等诸多因素的影响,使得天空中云状的变化难以捕捉和确认。如何准确无误的取准天空中的每一种云状,这就需要观测员的综合判断能力。
然而,一方面人为的判断容易受主观影响,另一方面,人力有穷尽时,器材也有不方便安装的时候,比如海上和无人区等。这个时候想要获取局地的准确云状就是一个极大的问题。所以,国际上目前比较通用的方法是通过气象卫星云图反演云状产品,通过1982年建立的国际卫星云气候计划(ISCCP)制定的标准,通过阈值法确定遥感图像上的云状。然而这种方法也存在几点不足:
1.该方法需要可见光的辅助,基本只在有可见光通道即白天的时候才能较为准确的输出结果。
2.由于阈值的选取一般较为固定,不能很好的考虑到不同地形的影响,从而对于高原或者盆地等容易产生较大偏差。
发明内容
本发明的一个目的是提供一种云分类方法及设备。
根据本发明的一个方面,提供了一种云分类方法,该方法包括:
获取各组初始数据,每组初始数据包括:样本卫星图像数据及其对应的地形数据、晨昏线数据和标签数据;
对每组初始数据进行预处理,以得到预处理后的各组训练数据;
将预处理后的各组训练数据输入模型进行训练,以得到训练完成的模型;
将一组待检测数据输入到训练完成的模型中,以得到待检测数据对应的云状类别,其中,每组待检测数据包括:待检测的卫星图像数据及其对应的地形数据和晨昏线数据。
进一步的,上述方法中,每组初始数据中的样本卫星图像数据采用卫星云图中的监测下层云雾、监测中层水汽、监测地表温度及监测云的图像和海面水温的四个通道的数据;每组待检测数据中的待检测的卫星图像数据采用卫星云图中的监测下层云雾、监测中层水汽、监测地表温度及监测云的图像和海面水温的四个通道的数据;
每组初始数据中的样本卫星图像数据对应的地形数据包括:对应的水陆数据和海拔高度数据,其中,所述水陆数据包括陆地或水面数据;每组待检测数据中的待检测的卫星图像数据对应的地形数据包括:对应的水陆数据和海拔高度数据,其中,所述水陆数据包括陆地或水面数据;
每组初始数据中的样本卫星图像数据对应的晨昏线数据包括:对应的以晨昏线为分界线生成的白天和黑夜数据;每组待检测数据中的待检测的卫星图像数据对应的晨昏线数据包括:对应的以晨昏线为分界线生成的白天和黑夜数据;
每组初始数据中的样本卫星图像对应的标签数据标记的云状分类包括11类:卷云、卷层云、深对流、高积云、高层云、雨层云、积云、层积云、层云、未知和无云。
进一步的,上述方法中,对每组初始数据进行预处理,以得到预处理后的各组训练数据,包括:
从每组初始数据中的四个通道的数据中获取东经80°~东经140°和北纬55°~南纬5°,且空间分辨率为1~2km每个像素点数据,作为预处理后的样本卫星图像数据;
基于每组初始数据中的水陆数据生成对应的第一掩膜图,其中,所述第一掩膜图中,用0表示陆地,用1表示水面;
基于每组初始数据中的海拔高度数据生成对应的第二掩膜图,其中,所述第二掩膜图中,所述海拔高度数据归一化为0~1之间数据;
基于每组初始数据中的白天和黑夜数据,得到第三掩膜图,其中,所述第三掩膜图中的白天的部分取值为0,黑夜的部分取值为1;
基于每组初始数据中的预处理后的样本卫星图像数据用所述11类的云状分类进行对应的标记,以得到每组初始数据中的预处理后的标签数据。
进一步的,上述方法中,将各组训练数据输入模型进行训练,以得到训练完成的模型,包括:
采用随机裁剪的方式或重叠的滑窗裁剪的方式,将每组训练数据输入模型进行裁剪,得到每组训练数据对应的小块数据;
将各个小块数据输入模型进行训练,以得到训练完成的模型。
进一步的,上述方法中,将各组预处理后的训练数据输入模型进行训练,以得到训练完成的模型,包括:
步骤S31,将各组预处理后的训练数据分为互不重复的训练集数据、验证集数据和测试集数据;
步骤S32,基于训练集数据中的预处理后的晨昏线数据,将白天部分的训练集数据输入模型进行训练,基于预设的损失函数计算训练过程中的损失值,基于所述损失值,得到训练收敛之后的模型,基于所述验证集数据和训练收敛之后的模型,得到筛选后的第一模型;
步骤S33,从所述训练集数据中挑选预设数量的未挑选过的数据,将所挑选的数据输入所述第一模型进行检测,以得到云状类别结果数据,获取所挑选的数据对应的红外数据,将所述红外数据中的实际云状类别标签与云状类别结果标签进行比较,得到比较为不一致的云状类别结果数据,将所挑选的数据中的比较为不一致的云状类别结果标签修正为对应的实际云状类别标签,以得到修正标签后的数据;
步骤S34,基于修正标签后的数据中的晨昏线数据,将白天部分和黑夜部分的修正标签后的数据输入所述第一模型进行优化训练,基于预设的损失函数计算优化训练过程中的损失值,基于所述损失值,得到训练收敛之后的第二模型;
步骤S35,将所述第二模型作为新的第一模型后,循环依次执行步骤S33~步骤S35预设次数,以得到最终模型,基于所述测试集数据从所述最终模型中筛选得到训练完成的模型。
进一步的,上述方法中,所述预设的损失函数为加权交叉熵损失函数。
进一步的,上述方法中,所述加权交叉熵损失函数为:
L(x,class)=weight[class](-x[class]+log(∑jexp(x[j]))),
其中,x为模型最后一层的输出,class为云状类别,weight[class]=1/p[class]表示该云状类别class所占权重值,p[class]为标签数据中各个云状类别class所占比例,j为云状类别class的总数量。
根据本发明的另一方面,还提供一种云分类设备,其中,该设备包括:
获取数据装置,用于获取各组初始数据,每组初始数据包括:样本卫星图像数据及其对应的地形数据、晨昏线数据和标签数据;
预处理装置,用于对每组初始数据进行预处理,以得到预处理后的各组训练数据;
训练装置,用于将预处理后的各组训练数据输入模型进行训练,以得到训练完成的模型;
检测装置,用于将一组待检测数据输入到训练完成的模型中,以得到待检测数据对应的云状类别,其中,每组待检测数据包括:待检测的卫星图像数据及其对应的地形数据和晨昏线数据。
根据本发明的另一方面,还提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。
根据本发明的另一方面,还提供一种用于在网络设备端信息处理的设备,该设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该设备执行上述任一项所述的方法。
与现有技术相比,本发明通过卫星图像和神经网络的结合,同时输入地形、晨昏线数据和标签数据的重要信息,综合考虑到地形数据、晨昏线数据、标签数据对云状的影响,共同训练出一个可在夜晚和白天通用的,且能考虑到不同地形影响的卫星图像反演云状模型,能够更高效和准确的完成全天候的云状产品输出。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出本发明一实施例的云分类方法的流程图;
图2示出本发明一实施例的标签可视化后的输出的示意图;
图3示出本发明一实施例的云分类方法的详细流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
如图1所示,本发明提供一种云分类方法,所述方法包括:
步骤S1,获取各组初始数据,每组初始数据包括样本卫星图像数据及其对应的地形数据、晨昏线数据和标签数据;
其中,每组初始数据中的地形数据与该组初始数据中的样本卫星图像数据的地理位置对应,每组初始数据中的晨昏线数据和标签数据的时间与该组初始数据中的样本卫星图像数据的时间对应;
步骤S2,对每组初始数据进行预处理,以得到预处理后的各组训练数据;
步骤S3,将预处理后的各组训练数据输入模型进行训练,以得到训练完成的模型;
步骤S4,将一组待检测数据输入到训练完成的模型中,以得到待检测数据对应的云状类别,其中,每组待检测数据包括:待检测的卫星图像数据及其对应的地形数据和晨昏线数据;
在此,一组待检测数据中的地形数据与该组待检测的卫星图像数据的地理位置对应,一组待检测数据中的晨昏线数据与该组待检测的卫星图像数据的时间对应。
本发明通过卫星图像和神经网络的结合,同时输入地形、晨昏线数据(太阳高度角)和标签数据的重要信息,综合考虑到地形数据、晨昏线数据、标签数据对云状的影响,共同训练出一个可在夜晚和白天通用的,且能考虑到不同地形影响的卫星图像反演云状模型,能够更高效和准确的完成全天候的云状产品输出。
本发明的云分类方法一实施例中,每组初始数据中的样本卫星图像数据和每组待检测数据中的待检测的卫星图像数据分别采用卫星云图中的监测下层云雾、监测中层水汽、监测地表温度及监测云的图像和海面水温的四个通道的数据;
在此,卫星图像数据可以采用日本的葵花8卫星采集的16通道数据中的及各相关通道数据,经过相关性分析,采用的是卫星云图中的四个通道(B07,B10,IR1,IR2),这四个通道主要用途分别是监测下层云雾、监测中层水汽、监测地表温度、监测云的图像和海面水温,根据经验和数据的相关性分析,这四个通道和云的类别相关性最大。
每组初始数据中的样本卫星图像数据对应的地形数据和每组待检测数据中的待检测的卫星图像数据对应的地形数据分别包括:对应的水陆数据和海拔高度数据,其中,所述水陆数据包括陆地或水面数据;
在此,由于本发明主要应用于大中国区,所以包含的地形数据包括该区域的湖泊海洋分布数据以及地形地势数据,可以区分该地区属于陆地还是水面,以及该地区的海拔高度,从而更准确的估测云的类别。
每组初始数据中的样本卫星图像数据对应的晨昏线数据和每组待检测数据中的待检测的卫星图像数据对应的晨昏线数据分别包括:以晨昏线为分界线生成的白天和黑夜数据。
在此,卫星的红外通道会受到可见光的影响,所以为了考虑昼夜情况下的不同,引入晨昏线数据,可以晨昏线为分界线,将黑夜部分的掩膜图设为0,白天部分的掩膜图设为1。
所述样本卫星图像对应的标签数据标记的云状分类包括11类:卷云、卷层云、深对流、高积云、高层云、雨层云、积云、层积云、层云、未知和无云。
在此,标签数据由于难以直接标记,所以此处可以采用葵花8卫星已有的云状分类产品作为标签。该产品以ISCCP分类标准生成,将云状分类成:卷云、卷层云、深对流、高积云、高层云、雨层云、积云、层积云和层云九类。再加上超出标准,不能确定类型的未知的类别以及无云的地方的类别,整个标签中类别数为11类。
如图2所示,即为所用的标签可视化后的输出,左上角纯白色的部分是由于该地区处在黑夜状态,该产品不支持黑夜状态下的云状输出。右下角部分中,不同颜色则对应着不同类别的云状。
本发明的云分类方法一实施例中,步骤S2,对每组初始数据进行预处理,以得到预处理后的各组训练数据,包括:
从每组初始数据中的四个通道的数据中获取东经80°~东经140°和北纬55°~南纬5°,且空间分辨率为1~2km每个像素点数据,作为预处理后的样本卫星图像数据;
在此,卫星图像数据的输出范围是东经80°~东经200°(E80°~E200°),北纬60°~南纬60°(N60°~S60°),空间分辨率为1~2km每个像素点,囊括的范围包括大部分东南亚地区以及澳大利亚地区。可以将反演中国区的云状分类作为主要目标,所以需要对解析出来的卫星数据进行截取处理。同时,部分通道的分辨率不一致,需要进行插值之后相互统一,最终处理出的数据为东经80°~东经140°(E80°~E140°),北纬55°~南纬5°(N55°~S5°)范围内的卫星数据,共4个通道,宽1751像素,高1001像素。
基于每组初始数据中的水陆数据生成对应的第一掩膜图(Mask1),其中,所述第一掩膜图中,用0表示陆地,用1表示水面;
基于每组初始数据中的海拔高度数据生成对应的第二掩膜图,其中,所述第二掩膜图中,所述海拔高度数据归一化为0~1之间数据。
在此,同时可以对应截取东经80°~东经140°(E80°~E140°),北纬55°~南纬5°(N55°~S5°)范围内的卫星数据的地形数据,生成两张掩膜图分别为第一掩膜图和第二掩膜图。第一掩膜图(Mask1)中0表示陆地,1表示水面。第二掩膜图(Mask2)上,是归一化到0~1之间的海拔高度数据,归一化方法例如可以采用海拔高度直接除以10000获得。
基于每组初始数据中的白天和黑夜数据,得到第三掩膜图(Mask3),其中,所述第三掩膜图中的白天的部分取值为0,黑夜的部分取值为1。
在此,可以对应于处理后的样本卫星图像数据中的不同时间,计算当时的晨昏线,以此为分界线生成Mask3,白天的部分取值为0,黑夜的部分取值为1。
基于每组初始数据中的预处理后的样本卫星图像数据用所述11类的云状分类进行对应的标记,以得到每组初始数据中的预处理后的标签数据(Mask_label)。
在此,标签数据为Mask_label,同样截取葵花11云状分类产品上相同经纬度的内容,作为训练标签。
最终的训练的输入数据即为[B07,B10,IR1,IR2,Mask1,Mask2,Mask3,Mask_label]在通道维度的融合形成的8通道数据。
另外,后续每组待检测数据输入检测前,也可以如本实施的相同方法对每组待检测数据进行预处理。
本发明的云分类方法一实施例中,步骤S3,将各组训练数据输入模型进行训练,以得到训练完成的模型,包括:
采用随机裁剪的方式或重叠的滑窗裁剪的方式,将每组训练数据输入模型进行裁剪,得到每组训练数据对应的小块数据;
将各个小块数据输入模型进行训练,以得到训练完成的模型。
在此,整体任务偏向于分割任务,即数据输入模型后,输出每个像素点的类别。可以采用U-Net网络作为训练模型,首先进行卷积和下采样(Conv+Pooling),然后接反卷积(DeConv)进行上采样,裁剪(crop)之前的低层特征图,进行融合,然后再次上采样,重复这个过程,最后通过softmax函数获得输出的分割图。(此处采用的就是官方UNet网络,没有做任何修改。)
由于硬件限制,不可能直接训练一个1751×1001像素这么大尺寸的网络,所以需要进行裁剪(crop)来训练,可以采用的是480×480像素的输入(经验值,因为必须是32的整数倍)。训练的时候可以根据数据量选择裁剪(crop)的方式,如果数据较多可以随机crop一次,如果数据较少可以采用有重叠的滑窗方式crop。前向推理过程的时候,也采用有重叠的滑窗方式,将整张大图切分成小块(patch)数据,输出云状类别结果时,再整合所有的小块(patch)数据的结果,小块(patch)重叠的部分可以看置信度选择输出云状类别结果。
如图3所示,本发明的云分类方法一实施例中,步骤S3,将各组预处理后的训练数据输入模型进行训练,以得到训练完成的模型,包括:
步骤S31,将各组预处理后的训练数据分为互不重复的训练集数据、验证集数据和测试集数据;
在此,可以总共采用2500组预处理后的训练数据,其中,1800组作为训练数据,训练过程中随机选取200组数据作为验证集数据,剩下的500组数据作为测试集数据。训练过程中,每张原图随机裁剪crop三次,从而生成我们需要的480×480像素大小的训练数据。挑选数据的修正标签可以从训练数据中挑选。
步骤S32,基于训练集数据中的预处理后的晨昏线数据,将白天部分的训练集数据输入模型进行训练,基于预设的损失函数计算训练过程中的损失值,基于所述损失值,得到训练收敛之后的模型,基于所述验证集数据和训练收敛之后的模型,得到筛选后的第一模型(P1);
在此,由于葵花8云分类产品没有黑夜处的标签数据,所以我们训练的时候,分两步走。首先只训练白天的部分,对于黑夜部分的mask3,不加入loss的计算,即只训练白天部分有云状标签的部分,训练收敛之后得到第一模型P1;
步骤S33,从所述训练集数据中挑选预设数量的未挑选过的数据,将所挑选的数据输入所述第一模型(P1)进行检测,以得到云状类别结果数据,获取所挑选的数据对应的红外数据,将所述红外数据中的实际云状类别标签与云状类别结果标签进行比较,得到比较为不一致的云状类别结果数据,将所挑选的数据中的比较为不一致的云状类别结果标签修正为对应的实际云状类别标签,以得到修正标签后的数据;
在此,可以挑选训练集数据中的部分数据(如1800组训练集数据中的100组,太多了标注太麻烦),利用第一模型P1进行检测,得到整图的云状类别结果数据。然后可以基于卫星图像数据中的红外数据对这些云状类别结果数据中不合理的部分进行修改,比如明显有云的地方识别成无云,明显云层很厚的地方识别成卷云以及明显断层不合理之类别的问题。并且主要修正黑夜部分,白天的部分如果不确定问题所在则依然采用原本的类别标签;
步骤S34,基于修正标签后的数据中的晨昏线数据,将白天部分和黑夜部分的修正标签后的数据输入所述第一模型(P1)进行优化训练,基于预设的损失函数计算优化训练过程中的损失值,基于所述损失值,得到训练收敛之后的第二模型(P2);
针对修正标签后的预设数量的数据,基于之前的第一模型模型P1进行优化(finetune),此时黑夜的标签也会参与损失值(loss)计算,训练收敛后得到第二模型P2;
步骤S35,将所述第二模型(P2)作为第一模型(P1)后,循环依次执行步骤S33~步骤S35预设次数,以得到最终模型(P),基于所述测试集数据从所述最终模型P中筛选得到训练完成的模型。
在此,可以挑选从所述训练集数据中挑选一批的不同数据,再将第二模型(P2)作为新的第一模型(P1),重复步骤S33~步骤S35去优化(finetune)模型,如此重复步骤S33~步骤S35次,即可得到一个较为准确的最终模型P。
本发明的云分类方法一实施例中,所述预设的损失函数为加权交叉熵损失函数。
本发明的云分类方法一实施例中,所述加权交叉熵损失函数为:
L(x,class)=weight[class](-x[class]+log(∑jexp(x[j]))),
其中,x为模型最后一层的输出,class为云状类别,weight[class]=1/p[class]表示该云状类别class所占权重值,p[class]为标签数据中各个云状类别class所占比例,j为云状类别class的总数量。
另外,本发明不仅可以用上述UNet网络,别的优秀的分割网络(如Deeplab,SegNet等)都可以按照这个思路进行训练,从而实现全天候云状产品输出。
根据本发明的另一方面,还提供一种云分类设备,其中,该设备包括:
获取数据装置,用于获取各组初始数据,每组初始数据包括:样本卫星图像数据及其对应的地形数据、晨昏线数据和标签数据;
预处理装置,用于对每组初始数据进行预处理,以得到预处理后的各组训练数据;
训练装置,用于将预处理后的各组训练数据输入模型进行训练,以得到训练完成的模型;
检测装置,用于将一组待检测数据输入到训练完成的模型中,以得到待检测数据对应的云状类别,其中,每组待检测数据包括:待检测的卫星图像数据及其对应的地形数据和晨昏线数据。
根据本发明的另一方面,还提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。
根据本发明的另一方面,还提供一种用于在网络设备端信息处理的设备,该设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该设备执行上述任一项所述的方法。
本发明的各设备和存储介质实施例的详细内容,具体可参见各方法实施例的对应部分,在此,不再赘述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (10)
1.一种云分类方法,其中,该方法包括:
获取各组初始数据,每组初始数据包括:样本卫星图像数据及其对应的地形数据、晨昏线数据和标签数据;
对每组初始数据进行预处理,以得到预处理后的各组训练数据;
将预处理后的各组训练数据输入模型进行训练,以得到训练完成的模型;
将一组待检测数据输入到训练完成的模型中,以得到待检测数据对应的云状类别,其中,每组待检测数据包括:待检测的卫星图像数据及其对应的地形数据和晨昏线数据。
2.根据权利要求1所述的方法,其中,每组初始数据中的样本卫星图像数据采用卫星云图中的监测下层云雾、监测中层水汽、监测地表温度及监测云的图像和海面水温的四个通道的数据;每组待检测数据中的待检测的卫星图像数据采用卫星云图中的监测下层云雾、监测中层水汽、监测地表温度及监测云的图像和海面水温的四个通道的数据;
每组初始数据中的样本卫星图像数据对应的地形数据包括:对应的水陆数据和海拔高度数据,其中,所述水陆数据包括陆地或水面数据;每组待检测数据中的待检测的卫星图像数据对应的地形数据包括:对应的水陆数据和海拔高度数据,其中,所述水陆数据包括陆地或水面数据;
每组初始数据中的样本卫星图像数据对应的晨昏线数据包括:对应的以晨昏线为分界线生成的白天和黑夜数据;每组待检测数据中的待检测的卫星图像数据对应的晨昏线数据包括:对应的以晨昏线为分界线生成的白天和黑夜数据;
每组初始数据中的样本卫星图像对应的标签数据标记的云状分类包括11类:卷云、卷层云、深对流、高积云、高层云、雨层云、积云、层积云、层云、未知和无云。
3.根据权利要求2所述的方法,其中,对每组初始数据进行预处理,以得到预处理后的各组训练数据,包括:
从每组初始数据中的四个通道的数据中获取东经80°~东经140°和北纬55°~南纬5°,且空间分辨率为1~2km每个像素点数据,作为预处理后的样本卫星图像数据;
基于每组初始数据中的水陆数据生成对应的第一掩膜图,其中,所述第一掩膜图中,用0表示陆地,用1表示水面;
基于每组初始数据中的海拔高度数据生成对应的第二掩膜图,其中,所述第二掩膜图中,所述海拔高度数据归一化为0~1之间数据;
基于每组初始数据中的白天和黑夜数据,得到第三掩膜图,其中,所述第三掩膜图中的白天的部分取值为0,黑夜的部分取值为1;
基于每组初始数据中的预处理后的样本卫星图像数据用所述11类的云状分类进行对应的标记,以得到每组初始数据中的预处理后的标签数据。
4.根据权利要求1所述的方法,其中,将各组训练数据输入模型进行训练,以得到训练完成的模型,包括:
采用随机裁剪的方式或重叠的滑窗裁剪的方式,将每组训练数据输入模型进行裁剪,得到每组训练数据对应的小块数据;
将各个小块数据输入模型进行训练,以得到训练完成的模型。
5.根据权利要求1所述的方法,其中,将各组预处理后的训练数据输入模型进行训练,以得到训练完成的模型,包括:
步骤S31,将各组预处理后的训练数据分为互不重复的训练集数据、验证集数据和测试集数据;
步骤S32,基于训练集数据中的预处理后的晨昏线数据,将白天部分的训练集数据输入模型进行训练,基于预设的损失函数计算训练过程中的损失值,基于所述损失值,得到训练收敛之后的模型,基于所述验证集数据和训练收敛之后的模型,得到筛选后的第一模型;
步骤S33,从所述训练集数据中挑选预设数量的未挑选过的数据,将所挑选的数据输入所述第一模型进行检测,以得到云状类别结果数据,获取所挑选的数据对应的红外数据,将所述红外数据中的实际云状类别标签与云状类别结果标签进行比较,得到比较为不一致的云状类别结果数据,将所挑选的数据中的比较为不一致的云状类别结果标签修正为对应的实际云状类别标签,以得到修正标签后的数据;
步骤S34,基于修正标签后的数据中的晨昏线数据,将白天部分和黑夜部分的修正标签后的数据输入所述第一模型进行优化训练,基于预设的损失函数计算优化训练过程中的损失值,基于所述损失值,得到训练收敛之后的第二模型;
步骤S35,将所述第二模型作为新的第一模型后,循环依次执行步骤S33~步骤S35预设次数,以得到最终模型,基于所述测试集数据从所述最终模型中筛选得到训练完成的模型。
6.根据权利要求5所述的方法,其中,所述预设的损失函数为加权交叉熵损失函数。
7.根据权利要求6所述的方法,其中,所述加权交叉熵损失函数为:
L(x,class)=weight[class](-x[class]+log(∑jexp(x[j]))),
其中,x为模型最后一层的输出,class为云状类别,weight[class]=1/p[class]表示该云状类别class所占权重值,p[class]为标签数据中各个云状类别class所占比例,j为云状类别class的总数量。
8.一种云分类设备,其中,该设备包括:
获取数据装置,用于获取各组初始数据,每组初始数据包括:样本卫星图像数据及其对应的地形数据、晨昏线数据和标签数据;
预处理装置,用于对每组初始数据进行预处理,以得到预处理后的各组训练数据;
训练装置,用于将预处理后的各组训练数据输入模型进行训练,以得到训练完成的模型;
检测装置,用于将一组待检测数据输入到训练完成的模型中,以得到待检测数据对应的云状类别,其中,每组待检测数据包括:待检测的卫星图像数据及其对应的地形数据和晨昏线数据。
9.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现权利要求1至7中任一项所述的方法。
10.一种用于在网络设备端信息处理的设备,该设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该设备执行权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011488861.0A CN112597863A (zh) | 2020-12-16 | 2020-12-16 | 云分类方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011488861.0A CN112597863A (zh) | 2020-12-16 | 2020-12-16 | 云分类方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112597863A true CN112597863A (zh) | 2021-04-02 |
Family
ID=75196400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011488861.0A Pending CN112597863A (zh) | 2020-12-16 | 2020-12-16 | 云分类方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112597863A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104502999A (zh) * | 2014-12-10 | 2015-04-08 | 中国科学院遥感与数字地球研究所 | 一种基于静止卫星多通道数据的昼夜云检测方法与装置 |
CN110728642A (zh) * | 2019-10-17 | 2020-01-24 | 自然资源部第二海洋研究所 | 一种针对goci卫星晨昏观测的神经网络大气校正方法 |
CN111340093A (zh) * | 2020-02-21 | 2020-06-26 | 上海眼控科技股份有限公司 | 云状识别的方法和装置 |
CN111507399A (zh) * | 2020-04-16 | 2020-08-07 | 上海眼控科技股份有限公司 | 基于深度学习的云状识别和模型训练方法、装置、终端及介质 |
-
2020
- 2020-12-16 CN CN202011488861.0A patent/CN112597863A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104502999A (zh) * | 2014-12-10 | 2015-04-08 | 中国科学院遥感与数字地球研究所 | 一种基于静止卫星多通道数据的昼夜云检测方法与装置 |
CN110728642A (zh) * | 2019-10-17 | 2020-01-24 | 自然资源部第二海洋研究所 | 一种针对goci卫星晨昏观测的神经网络大气校正方法 |
CN111340093A (zh) * | 2020-02-21 | 2020-06-26 | 上海眼控科技股份有限公司 | 云状识别的方法和装置 |
CN111507399A (zh) * | 2020-04-16 | 2020-08-07 | 上海眼控科技股份有限公司 | 基于深度学习的云状识别和模型训练方法、装置、终端及介质 |
Non-Patent Citations (2)
Title |
---|
吴昊: "高分辨率卫星多光谱影像的云雪分离研究", 《全国优秀硕士论文 基础科学》, no. 6, 15 June 2019 (2019-06-15) * |
王伟;宋卫国;刘士兴;张永明;郑红阳;田伟;: "Kmeans聚类与多光谱阈值相结合的MODIS云检测算法", 光谱学与光谱分析, no. 04, 15 April 2011 (2011-04-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11521379B1 (en) | Method for flood disaster monitoring and disaster analysis based on vision transformer | |
CN109840553B (zh) | 耕地作物类型的提取方法及系统、存储介质、电子设备 | |
Morsdorf et al. | Assessment of the influence of flying altitude and scan angle on biophysical vegetation products derived from airborne laser scanning | |
CN111553245A (zh) | 基于机器学习算法和多源遥感数据融合的植被分类方法 | |
Davaze et al. | Monitoring glacier albedo as a proxy to derive summer and annual surface mass balances from optical remote-sensing data | |
Shimamura et al. | Evaluation of a useful method to identify snow‐covered areas under vegetation–comparisons among a newly proposed snow index, normalized difference snow index, and visible reflectance | |
CN106403904A (zh) | 一种基于无人机的景观尺度植被覆盖度的计算方法及系统 | |
CN109375290B (zh) | 一种基于机器学习的跨海大桥雾监测系统及其应用方法 | |
Kidd et al. | Derivation of sky-view factors from lidar data | |
Filhol et al. | Time‐Lapse Photogrammetry of Distributed Snow Depth During Snowmelt | |
CN114819737B (zh) | 公路路域植被的碳储量估算方法、系统及存储介质 | |
CN115267786A (zh) | 融合卫星观测亮温和高程的ResUNet-GAN全球雷达反演方法及装置 | |
CN110428013B (zh) | 一种农作物遥感分类方法及系统 | |
CN115909096A (zh) | 无人机巡航管道隐患分析方法、装置及系统 | |
Drolon et al. | Monitoring of seasonal glacier mass balance over the European Alps using low-resolution optical satellite images | |
Niederheiser et al. | Dense image matching of terrestrial imagery for deriving high-resolution topographic properties of vegetation locations in alpine terrain | |
CN112581301A (zh) | 一种基于深度学习的农田残膜残留量的检测预警方法及系统 | |
CN115546658B (zh) | 一种数据集质量提升与改进cnn相结合的夜间云检测方法 | |
Borde et al. | A direct link between feature tracking and height assignment of operational atmospheric motion vectors | |
Adhikari et al. | Does topographic normalization of landsat images improve fractional tree cover mapping in tropical mountains? | |
CN112597863A (zh) | 云分类方法及设备 | |
Heygster et al. | AMSR-E geolocation and validation of sea ice concentrations based on 89GHz data | |
Hu et al. | Defogging of Monitoring Images of Soil and Water Conservation of Consumer UAV Based on Image Enhancement | |
CN111121781A (zh) | 基于地基云图的太阳定位和太阳光干扰判别方法 | |
Wang et al. | Monitoring urban expansion of the Greater Toronto area from 1985 to 2013 using Landsat images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |