CN111695640A - 地基云图识别模型训练方法及地基云图识别方法 - Google Patents
地基云图识别模型训练方法及地基云图识别方法 Download PDFInfo
- Publication number
- CN111695640A CN111695640A CN202010560153.7A CN202010560153A CN111695640A CN 111695640 A CN111695640 A CN 111695640A CN 202010560153 A CN202010560153 A CN 202010560153A CN 111695640 A CN111695640 A CN 111695640A
- Authority
- CN
- China
- Prior art keywords
- cloud picture
- foundation
- training
- foundation cloud
- cloud
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 144
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000008569 process Effects 0.000 claims abstract description 30
- 238000012795 verification Methods 0.000 claims abstract description 22
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 17
- 230000002779 inactivation Effects 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 18
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000005520 cutting process Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 15
- 230000008014 freezing Effects 0.000 description 8
- 238000007710 freezing Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000009849 deactivation Effects 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开一种地基云图识别模型训练方法及地基云图识别方法,地基云图识别模型训练方法包括:建立包括多种云类别的地基云图样本库;搭建卷积神经网络AlexNet;利用ImageNet图像样本库对AlexNet网络进行预训练;从地基云图样本库中选择训练集样本,对预训练的地基云图识别模型进行倒推分层微调,保存倒推分层微调过程中对应不同微调阶段的多个优化后地基云图识别模型;从地基云图样本库中选择验证集样本,对所述多个优化后地基云图识别模型进行准确率验证,将其中准确率最高的作为最终地基云图识别模型。利用本发明的地基云图识别模型能够对多种地基云图进行智能化识别,提高云识别的范围和识别精度。
Description
技术领域
本发明涉及大气探测技术领域,特别是一种地基云图识别模型训练方法及地基云图识别方法。
背景技术
云的形成和演变是大气中物理过程的宏观体现,地面云观测在天气现象的观测、记录和研究中占有重要地位。地基云按云的外形特征、结构、特点和云底高度可将云状分为高、中、低3族10属29类,具有种类多、变化快、相似、易与天空背景融合等特点。传统的自动云分类当前主要还是采用图像预处理、特征提取、分类器分类这样的流程,提取的特征有效性限制了识别分类的效果,无法对所有10属类别的云进行高精度的自动识别分类。
深度学习技术经过深入学习有可能表达上述常规难以表达的特征、充分挖掘数据之间的关联,提取图像的全局特征和上下文信息,对千变万化的云进行统计识别,进而得到精度更高的识别结果,已在人脸识别、场景识别等常规模式识别领域发挥了重要作用。虽然深度学习算法在不同的机器学习应用中取得了很好的结果,但在云图像识别分类的应用中还存在以下难点:首先,在实际应用中,卷积神经网络需要大量的标记数据进行训练,而目前的云图数据尚属缺乏,注释云图像需要专业知识,因此非常昂贵耗时,并且受制于观察者的可变性。在缺乏大量且有标记数据的情况下,如何保证卷积神经网络对地基云图像的分类效果是难题。其次,有限的训练数据易导致“过度拟合”,特征不能很好地被概括。在云图像中,云的外观变化无常,当其变化性非常大时,过拟合会变得更加严重。第三,从零开始训练卷积神经网络需要较高的计算能力、广泛的内存资源和时间,在实际的操作过程中具有一定的局限性。
名词解释
AlexNet,一种卷积神经网络,在LeNet的基础上加深了网络的结构,学习更丰富更高维的图像特征,2012年由Alex等人提出。
ImageNet,是一个计算机视觉系统识别项目名称,模拟人类的识别系统建立,是目前世界上最大的图像识别数据库。
发明内容
本发明的目的是提供一种地基云图识别模型训练方法及地基云图识别方法和装置,利用迁移学习和微调AlexNet网络实现地基云图识别模型,以能够对多种地基云图进行智能化识别,提高云识别的范围和识别精度。
本发明采用的技术方案如下:
一方面,本发明提供一种地基云图识别模型训练方法,包括:
建立包括多种云类别的地基云图样本库;
搭建卷积神经网络AlexNet;
利用ImageNet图像样本库对AlexNet网络进行预训练,得到预训练的地基云图识别模型;
从地基云图样本库中选择训练集样本,对预训练的地基云图识别模型进行倒推分层微调,保存倒推分层微调过程中对应不同微调阶段的多个优化后地基云图识别模型;
从地基云图样本库中选择验证集样本,对所述多个优化后地基云图识别模型进行准确率验证,将其中准确率最高的作为最终地基云图识别模型。
可选的,方法还包括:
将地基云图样本库中的地基云图样本划分为训练集、验证集和测试集,训练集、验证集、测试集的样本数量比值为8:1:1。
从地基云图样本库中选择测试集样本,对最终地基云图识别模型进行测试,可根据测试集的测试结果对最终得到的识别模型进行评价。
可选的,建立云图样本库包括:
对应多种云类别分别获取多个地基云图图像;
对获取到的地基云图图像进行归一化处理,得到像素大小一致的地基云图图像;
利用水平翻转、调整亮度和/或随机裁剪方法,对归一化处理后的地基云图图像进行处理,将处理后的图像作为新的地基云图图像样本,使得云图样本库的样本数量增加至原数量的N倍。所述归一化处理可采用非线性插值归一化方法,所述相同像素大小可为227*227像素,N可根据能够直接获取的图像样本数量进行调整,如设置为4倍等。
可选的,所述卷积神经网络AlexNet包括5个卷积层和3个全连接层,最后一个全连接层对应云图样本库中的云类别数量设有相同数量的输出节点。
可选的,云图样本库中包括10种云类别的云图像样本,卷积神经网络AlexNet的最后一个全连接层包括10个输出节点。
可选的,对预训练的地基云图识别模型进行倒推分层微调为:从最后一层开始选择为当前训练层进行第一轮微调训练,后续每轮依次向前递加一层作为当前训练层进行微调训练;每一轮微调训练冻结当前训练层之外的其它所有层的网络参数;对于当前训练层进行训练的参数设置包括:epoch数量,epoch中批处理的大小,最大迭代步数;微调训练过程采用Adam优化器,通过小批量梯度下降法L2正则化反向传播更新网络权值参数;对于网络中的前两个全连接层采用随机失活进行正则化。
可选的,每轮微调训练中,批处理大小为32,最大迭代步数为2000步,训练在180个epoch处停止;使用Adam优化器进行随机优化时,当前训练层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0;所述L2正则化系数设置为0.001,随机失活比例设置为0.5。
可选的,每轮对当前训练层进行微调训练过程中,将网络收敛时的地基云图识别模型作为相应微调阶段的优化后地基云图识别模型。可在网络收敛时计算准确率,或者在全部轮数训练结束后,统一利用验证集计算准确率。
可选的,每轮对当前训练层进行微调训练的过程中,每迭代5步保存一次网络参数。可节约计算机执行训练算法时的内存,提高训练效率。
每次保存网络参数后,网络是否收敛通过计算损失函数判断,可利用AlexNet网络内部的Softmax-cross-entropy损失函数曲线。网络分类函数采用Softmax函数,损失函数采用交叉熵损失函数。损失函数曲线中损失函数趋势下降,则判断为网络收敛。
具体的,将验证集样本输入识别模型,判断模型预测到的标签值与样本正确的标签是否一致,来判别其分类结果是否正确,将所有分类正确的样本数与样本总数的比值作为最终的识别准确率结果,即其中Tp为分类正确的样本数,T为所有样本数。
第二方面,本发明提供一种利用第一方面所述地基云图识别模型训练方法训练所得模型的地基云图识别方法,包括:
采集待识别地基云图;
对待识别地基云图进行预处理;
将预处理后的地基云图作为预先训练的地基云图识别模型的输入,进行云图识别;
将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别。
可选的,所述对待识别地基云图进行预处理包括:
利用非线性插值方法将待识别地基云图的大小调整到预设像素大小;所述预设像素大小与地基云图识别模型训练样本的图像像素相同。
第三方面,本发明提供一种利用第一方面所述地基云图识别模型训练方法训练所得模型的地基云图识别装置,包括:
云图采集模块,被配置用于采集待识别地基云图;
预处理模块,被配置用于对待识别地基云图进行预处理;
云图识别模块,被配置用于将预处理后的地基云图作为预先训练的地基云图识别模型的输入,进行云图识别;
云图识别结果确定模块,别配置用于将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别。
有益效果
本发明利用卷积神经网络AlexNet的深层次网络结构和对图像特征更强的学习能力,实现了一种识别准确率较高、识别对象类别范围较广的地基云图类别识别模型。在模型训练过程中,利用ImageNet图像样本库对AlexNet网络进行预训练,通过迁移学习和倒推微调对地基全天空云图样本库进行深度学习,在倒退微调过程中,通过小批量梯度下降、随机失活等算法的结合,减少模型过拟合的情形,能显著提高模型训练的效率,有效地提高训练所得模型对地基云图云状识别的精度和范围,从而可提高对降水、降雪等天气活动的预报精度,具有广阔的市场应用前景与经济价值。
附图说明
图1是本发明地基云图识别模型建立流程示意图;
图2是本发明的地基云图样本库示意图;
图3是本发明的非线性插值归一化图像处理示意图;
图4是本发明的地基云图样本库数据增强示意图;
图5是本发明的AlexNet网络结构示意图;
图6是本发明选用的部分ImageNet数据集预训练结果示意图;
图7是本发明微调时最优一次验证集准确率的程序日志图;
图8是本发明分层微调方法验证集准确率结果比较图;
图9是本发明的云图识别测试结果混淆矩阵图,其中横坐标为10类云的预测标签,纵坐标为10类云的真实标签。
具体实施方式
以下结合附图和具体实施例进一步描述。
本发明的技术构思为:利用迁移学习和微调的卷积神经网络,实现一种地基云图识别模型,以能够对地基云图进行自动识别,提高云识别范围和识别精度。
实施例1
本实施例为一种地基云图识别模型训练方法,参考图1所示,包括:
建立包括多种云类别的地基云图样本库;
搭建卷积神经网络AlexNet;
利用ImageNet图像样本库对AlexNet网络进行预训练,得到预训练的地基云图识别模型;
从地基云图样本库中选择训练集样本,对预训练的地基云图识别模型进行倒推分层微调,保存倒推分层微调过程中对应不同微调阶段的多个优化后地基云图识别模型;
从地基云图样本库中选择验证集样本,对所述多个优化后地基云图识别模型进行准确率验证,将其中准确率最高的作为最终地基云图识别模型。
实施例1-1
在实施例1的基础上,本实施例地基云图识别模型训练方法还包括:
将地基云图样本库中的地基云图样本划分为训练集、验证集和测试集,训练集、验证集、测试集的样本数量比值为8:1:1。
测试集样本可用于对最终地基云图识别模型进行测试,根据测试集的测试结果对最终得到的识别模型进行评价。
建立云图样本库包括:
对应多种云类别分别获取多个地基云图图像;
对获取到的地基云图图像进行归一化处理,得到像素大小一致的地基云图图像;
利用水平翻转、调整亮度和/或随机裁剪方法,对归一化处理后的地基云图图像进行处理,将处理后的图像作为新的地基云图图像样本,使得云图样本库的样本数量增加至原数量的N倍。
样本库建立时,可用数码相机拍摄地基云图,或者从网上下载地基云图,建立待识别种类范围的所有种类的地基云图样本库,每种样本云图越多越好。
所述归一化处理可采用非线性插值归一化方法,所述相同像素大小可为227*227像素,N可根据能够直接获取的图像样本数量进行调整,如设置为4倍等。
本实施例中,云图样本库中包括10种云类别的云图像样本,卷积神经网络AlexNet包括5个卷积层和3个全连接层,最后一个全连接层对应云图样本库中的云类别数量设有相同数量的输出节点,即10个输出节点。
对预训练的地基云图识别模型进行倒推分层微调为:从最后一层开始选择为当前训练层进行第一轮微调训练,后续每轮依次向前递加一层作为当前训练层进行微调训练;每一轮微调训练冻结当前训练层之外的其它所有层的网络参数;对于当前训练层进行训练的参数设置包括:epoch数量,epoch中批处理的大小,最大迭代步数;微调训练过程采用Adam优化器,通过小批量梯度下降法L2正则化反向传播更新网络权值参数;对于网络中的前两个全连接层采用随机失活进行正则化。
每轮微调训练中,批处理大小为32,最大迭代步数为2000步,训练在180个epoch处停止;使用Adam优化器进行随机优化时,当前训练层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0;所述L2正则化系数设置为0.001,随机失活比例设置为0.5。
每轮对当前训练层进行微调训练的过程中,可每迭代5步保存一次网络参数,节约执行迭代的计算机内存。
每轮对当前训练层进行微调训练过程中,将网络收敛时的地基云图识别模型作为相应微调阶段的优化后地基云图识别模型。在网络收敛时计算准确率,或者在全部轮数训练结束后,统一利用验证集计算准确率。
网络是否收敛通过计算损失函数判断,可利用AlexNet网络内部的Softmax-cross-entropy损失函数曲线。网络分类函数采用Softmax函数,损失函数采用交叉熵损失函数。损失函数曲线中损失函数趋势下降,则判断为网络收敛。
准确率计算为:将验证集样本输入识别模型,判断模型预测到的标签值与样本正确的标签是否一致,来判别其分类结果是否正确,将所有分类正确的样本数与样本总数的比值作为最终的识别准确率结果,即其中Tp为分类正确的样本数,T为所有样本数。
本实施例的方法具体操作可按照如下步骤,包括:
步骤001.建立地基云图样本库,包括步骤00101-步骤00103:
步骤00101.如图2所示,用数码相机拍摄地基云图,或者从网上下载地基云图,建立所有10种类的地基云图样本库,每种样本云图越多越好;
步骤00102.如图3所示,利用非线性插值归一化方法将样本库所有图像大小统一调整到227*227像素;
步骤00103.如图4所示,利用水平翻转、调整图像亮度、随机裁剪方法将样本库增强至原数量的四倍。
步骤002.搭建卷积神经网络AlexNet,如图5所示,包括5个卷积层和3个全连接层,最后一个全连接层输出为10个节点,每个节点代表云图像样本库中的一个类别。初始化网络参数设置按照原AlexNet网络初始化参数设置。
步骤003.参考图6,利用ImageNet数据集对AlexNet进行预训练并保存网络参数,得到一个预训练的网络。
步骤004.将步骤001建立的地基云图样本库进行划分,其中80%作为训练集,10%作为验证集,10%作为测试集。
步骤005.取地基云图样本库中的训练集对模型进行倒推分层微调,保存多个不同微调阶段的优化后地基云图识别模型。按照步骤00501-00508进行。
步骤00501.第一轮微调:使用云图训练集对预训练后的AlexNet网络的最后一层进行再训练,同时冻结其它所有层的所有参数,直到网络收敛后计算该轮训练的分类准确率。
其中网络参数设置为:批处理大小设置为32,训练在180个epoch处停止。使用Adam优化器,微调层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0。训练过程通过小批量梯度下降法L2正则化反向传播更新网络权值参数ωt=ωt-1-η(ΔE+γωt-1)其中E为网络实际预测值f(xi)与对应标签yi之间的误差,m为批量样本量,ωt为权值,η为学习率,γ为正则化系数,取为0.001,前两个全连接层进行随机失活防止网络过拟合,即以概率1-p随机丢弃部分单元,其中p设置为0.5。
步骤00502.第二轮微调,使用地基云图样本库的训练集对预训练后AlexNet网络的最后两层进行训练,并在训练过程中冻结其它层的所有网络参数,直到收敛后计算准确率。
其中网络参数设置为:批处理大小设置为32,训练在180个epoch处停止。使用Adam优化器,微调层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001),前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。
步骤00503.第三轮微调,使用地基云图样本库的训练集对预训练后AlexNet网络的最后三层进行训练,并在训练过程中冻结其它层的所有参数,直到收敛后计算准确率。
其中网络参数设置为:批处理大小设置为32,训练在180个epoch处停止。使用Adam优化器,微调层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001),前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。
步骤00504.第四轮微调,使用地基云图样本库的训练集对预训练后AlexNet网络的最后四层进行训练,并在训练过程中冻结其它层的所有参数,直到收敛后计算准确率。
其中网络参数设置为:批处理大小设置为32,训练在180个epoch处停止。使用Adam优化器,微调层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001),前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。
步骤00505.第五轮微调,使用地基云图样本库的训练集对预训练后AlexNet网络的最后五层进行训练,并在训练过程中冻结其它层的所有参数,直到收敛后计算准确率。
其中网络参数设置为:批处理大小设置为32,训练在180个epoch处停止。使用Adam优化器,微调层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001),前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。
步骤00506.第六轮微调,使用地基云图样本库的训练集对预训练后AlexNet网络的最后六层进行训练,并在更新过程中冻结其它层的所有参数,直到收敛后计算准确率。其中网络参数设置为:批处理大小设置为32,训练在180个epoch处停止。使用Adam优化器,微调层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001),前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。
步骤00507.第七轮,使用地基云图样本库的训练集对预训练后AlexNet网络的最后七层进行训练,并在训练过程中冻结其它层的所有参数,直到收敛后计算准确率。其中网络参数设置为:批处理大小设置为32,训练在180个epoch处停止。使用Adam优化器,微调层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001),前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。
步骤00508.第八轮,使用地基云图样本库的训练集对预训练后AlexNet网络的最后八层预训练,并在更新过程中冻结其它层的所有参数,直到收敛后计算准确率。其中网络参数设置为:批处理大小设置为32,训练在180个epoch处停止。使用Adam优化器,微调层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001),前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。
每一轮微调训练,将网络收敛时的网络模型参数进行保存。每一轮微调训练过程中,由于迭代步数达20000步,因此可设计每隔5步迭代对网络进行一次保存,从而可节约计算机内存,提高效率。
步骤006.如图7和8所示,将步骤005保存好的网络模型依次在地基云图验证集上验证准确率,保存其中准确率最高的1个网络模型,即得到最终地基云图识别模型。
此外,如图9所示,在得到最终地基云图识别模型后,还可利用测试集云图像在模型上进行自动识别测试,作为对模型最终识别结果的评价。
实施例2
与实施例1基于相同的发明构思,本实施例为利用实施例1地基云图识别模型训练方法训练所得模型的地基云图识别方法,包括:
采集待识别地基云图;可采用相机拍摄采集;
对待识别地基云图进行预处理;
将预处理后的地基云图作为预先训练的地基云图识别模型的输入,进行云图识别;
将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别。
对待识别地基云图进行预处理包括:
利用非线性插值方法将待识别地基云图的大小调整到预设像素大小;所述预设像素大小与地基云图识别模型训练样本的图像像素相同。预处理还可包括其它如去噪、增强等手段,可使得地基云图的识别结果更快速准确。
实施例3
与实施例1基于相同的发明构思,本实施例为利用实施例1地基云图识别模型训练方法训练所得模型的地基云图识别装置,包括:
云图采集模块,被配置用于采集待识别地基云图;
预处理模块,被配置用于对待识别地基云图进行预处理;
云图识别模块,被配置用于将预处理后的地基云图作为预先训练的地基云图识别模型的输入,进行云图识别;
云图识别结果确定模块,别配置用于将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (10)
1.一种地基云图识别模型训练方法,其特征是,包括:
建立包括多种云类别的地基云图样本库;
搭建卷积神经网络AlexNet;
利用ImageNet图像样本库对AlexNet网络进行预训练,得到预训练的地基云图识别模型;
从地基云图样本库中选择训练集样本,对预训练的地基云图识别模型进行倒推分层微调,保存倒推分层微调过程中对应不同微调阶段的多个优化后地基云图识别模型;
从地基云图样本库中选择验证集样本,对所述多个优化后地基云图识别模型进行准确率验证,将其中准确率最高的作为最终地基云图识别模型。
2.根据权利要求1所述的方法,其特征是,还包括:
将地基云图样本库中的地基云图样本划分为训练集、验证集和测试集,训练集、验证集、测试集的样本数量比值为8:1:1。
3.根据权利要求1所述的方法,其特征是,建立云图样本库包括:
对应多种云类别分别获取多个地基云图图像;
对获取到的地基云图图像进行归一化处理,得到像素大小一致的地基云图图像;
利用水平翻转、调整亮度和/或随机裁剪方法,对归一化处理后的地基云图图像进行处理,将处理后的图像作为新的地基云图图像样本,使得云图样本库的样本数量增加至原数量的N倍。
4.根据权利要求1所述的方法,其特征是,所述卷积神经网络AlexNet包括5个卷积层和3个全连接层,最后一个全连接层对应云图样本库中的云类别数量设有相同数量的输出节点。
5.根据权利要求5所述的方法,其特征是,云图样本库中包括10种云类别的云图像样本,卷积神经网络AlexNet的最后一个全连接层包括10个输出节点。
6.根据权利要求1所述的方法,其特征是,对预训练的地基云图识别模型进行倒推分层微调为:从最后一层开始选择为当前训练层进行第一轮微调训练,后续每轮依次向前递加一层作为当前训练层进行微调训练;每一轮微调训练冻结当前训练层之外的其它所有层的网络参数;对于当前训练层进行训练的参数设置包括:epoch数量,epoch中批处理的大小,最大迭代步数;微调训练过程采用Adam优化器,通过小批量梯度下降法L2正则化反向传播更新网络权值参数;对于网络中的前两个全连接层采用随机失活进行正则化;
每轮微调训练中,批处理大小为32,最大迭代步数为2000步,训练在180个epoch处停止;使用Adam优化器进行随机优化时,当前训练层的学习率为0.0001,学习率衰减为0.99,冻结层的学习率为0;所述L2正则化系数设置为0.001,随机失活比例设置为0.5。
7.根据权利要求6所述的方法,其特征是,每轮对当前训练层进行微调训练过程中,将网络收敛时的地基云图识别模型作为相应微调阶段的优化后地基云图识别模型。
8.根据权利要求6所述的方法,其特征是,每轮对当前训练层进行微调训练的过程中,每迭代5步保存一次网络参数。
9.一种利用权利要求1-8任一项所述地基云图识别模型训练方法训练所得地基云图识别模型的地基云图识别方法,其特征是,包括:
采集待识别地基云图;
对待识别地基云图进行预处理;
将预处理后的地基云图作为预先训练的地基云图识别模型的输入,进行云图识别;
将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别;
所述对待识别地基云图进行预处理包括:
利用非线性插值方法将待识别地基云图的大小调整到预设像素大小;所述预设像素大小与地基云图识别模型训练样本的图像像素相同。
10.一种利用权利要求1-8任一项所述地基云图识别模型训练方法训练所得地基云图识别模型的地基云图识别装置,其特征是,包括:
云图采集模块,被配置用于采集待识别地基云图;
预处理模块,被配置用于对待识别地基云图进行预处理;
云图识别模块,被配置用于将预处理后的地基云图作为预先训练的地基云图识别模型的输入,进行云图识别;
云图识别结果确定模块,别配置用于将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010560153.7A CN111695640B (zh) | 2020-06-18 | 2020-06-18 | 地基云图识别模型训练方法及地基云图识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010560153.7A CN111695640B (zh) | 2020-06-18 | 2020-06-18 | 地基云图识别模型训练方法及地基云图识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111695640A true CN111695640A (zh) | 2020-09-22 |
CN111695640B CN111695640B (zh) | 2024-04-09 |
Family
ID=72481736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010560153.7A Active CN111695640B (zh) | 2020-06-18 | 2020-06-18 | 地基云图识别模型训练方法及地基云图识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111695640B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434554A (zh) * | 2020-10-16 | 2021-03-02 | 中科院成都信息技术股份有限公司 | 一种基于异质化缩减的云状图像识别方法及系统 |
CN112884031A (zh) * | 2021-02-04 | 2021-06-01 | 南京信息工程大学 | 一种基于卷积神经网络的地基云图云状自动识别方法 |
CN113033653A (zh) * | 2021-03-23 | 2021-06-25 | 浙江工业大学 | 一种边-云协同的深度神经网络模型训练方法 |
CN113435539A (zh) * | 2021-07-21 | 2021-09-24 | 天津大学 | 基于深度学习的面向南极夜空云图的云量等级分类方法 |
CN113869157A (zh) * | 2021-09-16 | 2021-12-31 | 中国科学院合肥物质科学研究院 | 一种基于可见光和红外云图的云分类方法 |
CN118279671A (zh) * | 2024-05-08 | 2024-07-02 | 北京弘象科技有限公司 | 卫星反演云分类方法、装置、电子设备和计算机存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106651886A (zh) * | 2017-01-03 | 2017-05-10 | 北京工业大学 | 一种基于超像素聚类优化cnn的云图分割方法 |
CN106951836A (zh) * | 2017-03-05 | 2017-07-14 | 北京工业大学 | 基于先验阈值优化卷积神经网络的作物覆盖度提取方法 |
CN109508650A (zh) * | 2018-10-23 | 2019-03-22 | 浙江农林大学 | 一种基于迁移学习的树种识别方法 |
CN110378252A (zh) * | 2019-06-28 | 2019-10-25 | 浙江大学 | 一种基于深度迁移学习的混凝土裂缝识别方法 |
US20200020097A1 (en) * | 2016-09-21 | 2020-01-16 | The General Hospital Corporation | Systems, methods and media for automatically generating a bone age assessment from a radiograph |
CN110929602A (zh) * | 2019-11-09 | 2020-03-27 | 北京工业大学 | 一种基于卷积神经网络的地基云图云状识别方法 |
CN111178439A (zh) * | 2019-12-31 | 2020-05-19 | 杭州电子科技大学 | 基于卷积神经网络及微调的sar图像分类方法 |
CN111275677A (zh) * | 2020-01-17 | 2020-06-12 | 哈尔滨工业大学 | 一种基于卷积神经网络的天花板震害的识别方法 |
-
2020
- 2020-06-18 CN CN202010560153.7A patent/CN111695640B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200020097A1 (en) * | 2016-09-21 | 2020-01-16 | The General Hospital Corporation | Systems, methods and media for automatically generating a bone age assessment from a radiograph |
CN106651886A (zh) * | 2017-01-03 | 2017-05-10 | 北京工业大学 | 一种基于超像素聚类优化cnn的云图分割方法 |
CN106951836A (zh) * | 2017-03-05 | 2017-07-14 | 北京工业大学 | 基于先验阈值优化卷积神经网络的作物覆盖度提取方法 |
CN109508650A (zh) * | 2018-10-23 | 2019-03-22 | 浙江农林大学 | 一种基于迁移学习的树种识别方法 |
CN110378252A (zh) * | 2019-06-28 | 2019-10-25 | 浙江大学 | 一种基于深度迁移学习的混凝土裂缝识别方法 |
CN110929602A (zh) * | 2019-11-09 | 2020-03-27 | 北京工业大学 | 一种基于卷积神经网络的地基云图云状识别方法 |
CN111178439A (zh) * | 2019-12-31 | 2020-05-19 | 杭州电子科技大学 | 基于卷积神经网络及微调的sar图像分类方法 |
CN111275677A (zh) * | 2020-01-17 | 2020-06-12 | 哈尔滨工业大学 | 一种基于卷积神经网络的天花板震害的识别方法 |
Non-Patent Citations (3)
Title |
---|
吴建 等: "基于集成迁移学习的细粒度图像分类算法" * |
王艳玲 等: "基于迁移学习的番茄叶片病害图像分类" * |
赵嘉: "基于迁移学习的遥感图像分类研究" * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434554A (zh) * | 2020-10-16 | 2021-03-02 | 中科院成都信息技术股份有限公司 | 一种基于异质化缩减的云状图像识别方法及系统 |
CN112434554B (zh) * | 2020-10-16 | 2023-08-04 | 中科院成都信息技术股份有限公司 | 一种基于异质化缩减的云状图像识别方法及系统 |
CN112884031A (zh) * | 2021-02-04 | 2021-06-01 | 南京信息工程大学 | 一种基于卷积神经网络的地基云图云状自动识别方法 |
CN113033653A (zh) * | 2021-03-23 | 2021-06-25 | 浙江工业大学 | 一种边-云协同的深度神经网络模型训练方法 |
CN113033653B (zh) * | 2021-03-23 | 2024-04-19 | 浙江工业大学 | 一种边-云协同的深度神经网络模型训练方法 |
CN113435539A (zh) * | 2021-07-21 | 2021-09-24 | 天津大学 | 基于深度学习的面向南极夜空云图的云量等级分类方法 |
CN113869157A (zh) * | 2021-09-16 | 2021-12-31 | 中国科学院合肥物质科学研究院 | 一种基于可见光和红外云图的云分类方法 |
CN118279671A (zh) * | 2024-05-08 | 2024-07-02 | 北京弘象科技有限公司 | 卫星反演云分类方法、装置、电子设备和计算机存储介质 |
CN118279671B (zh) * | 2024-05-08 | 2024-09-13 | 北京弘象科技有限公司 | 卫星反演云分类方法、装置、电子设备和计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111695640B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695640B (zh) | 地基云图识别模型训练方法及地基云图识别方法 | |
CN108681752B (zh) | 一种基于深度学习的图像场景标注方法 | |
JP2023003026A (ja) | 深層学習に基づく農村地域分けゴミ識別方法 | |
CN109523013B (zh) | 基于浅层卷积神经网络的空气颗粒物污染程度估计方法 | |
CN110929610B (zh) | 基于cnn模型和迁移学习的植物病害识别方法及系统 | |
CN112541508A (zh) | 果实分割识别方法及系统、果实采摘机器人 | |
CN111833322B (zh) | 一种基于改进YOLOv3的垃圾多目标检测方法 | |
CN109002755B (zh) | 基于人脸图像的年龄估计模型构建方法及估计方法 | |
CN111079784B (zh) | 基于卷积神经网络的烘烤过程中烤烟烘烤阶段识别方法 | |
CN113076871A (zh) | 一种基于目标遮挡补偿的鱼群自动检测方法 | |
CN114998603B (zh) | 一种基于深度多尺度特征因子融合的水下目标检测方法 | |
CN112364791B (zh) | 一种基于生成对抗网络的行人重识别方法和系统 | |
CN112766062B (zh) | 一种基于双流深度神经网络的人体行为识别方法 | |
CN113420794B (zh) | 一种基于深度学习的二值化Faster R-CNN柑橘病虫害识别方法 | |
CN109190666B (zh) | 基于改进的深度神经网络的花卉图像分类方法 | |
CN109740656A (zh) | 一种基于卷积神经网络的矿石分选方法 | |
CN112749675A (zh) | 一种基于卷积神经网络的马铃薯病害识别方法 | |
CN111079837B (zh) | 一种用于二维灰度图像检测识别分类的方法 | |
CN114092699B (zh) | 基于迁移学习的群猪图像分割的方法及系统 | |
CN110599459A (zh) | 基于深度学习的地下管网风险评估云系统 | |
CN111178438A (zh) | 一种基于ResNet101的天气类型识别方法 | |
CN113269224A (zh) | 一种场景图像分类方法、系统及存储介质 | |
CN111126155B (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN113627240B (zh) | 一种基于改进ssd学习模型的无人机树木种类识别方法 | |
CN111310837A (zh) | 车辆改装识别方法、装置、系统、介质和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |