CN111695640A

CN111695640A - 地基云图识别模型训练方法及地基云图识别方法

Info

Publication number: CN111695640A
Application number: CN202010560153.7A
Authority: CN
Inventors: 段向军; 朱方园
Original assignee: Nanjing Vocational College Of Information Technology
Current assignee: Nanjing Vocational College Of Information Technology
Priority date: 2020-06-18
Filing date: 2020-06-18
Publication date: 2020-09-22
Anticipated expiration: 2040-06-18
Also published as: CN111695640B

Abstract

本发明公开一种地基云图识别模型训练方法及地基云图识别方法，地基云图识别模型训练方法包括：建立包括多种云类别的地基云图样本库；搭建卷积神经网络AlexNet；利用ImageNet图像样本库对AlexNet网络进行预训练；从地基云图样本库中选择训练集样本，对预训练的地基云图识别模型进行倒推分层微调，保存倒推分层微调过程中对应不同微调阶段的多个优化后地基云图识别模型；从地基云图样本库中选择验证集样本，对所述多个优化后地基云图识别模型进行准确率验证，将其中准确率最高的作为最终地基云图识别模型。利用本发明的地基云图识别模型能够对多种地基云图进行智能化识别，提高云识别的范围和识别精度。

Description

地基云图识别模型训练方法及地基云图识别方法

技术领域

本发明涉及大气探测技术领域，特别是一种地基云图识别模型训练方法及地基云图识别方法。

背景技术

云的形成和演变是大气中物理过程的宏观体现，地面云观测在天气现象的观测、记录和研究中占有重要地位。地基云按云的外形特征、结构、特点和云底高度可将云状分为高、中、低3族10属29类，具有种类多、变化快、相似、易与天空背景融合等特点。传统的自动云分类当前主要还是采用图像预处理、特征提取、分类器分类这样的流程，提取的特征有效性限制了识别分类的效果，无法对所有10属类别的云进行高精度的自动识别分类。

深度学习技术经过深入学习有可能表达上述常规难以表达的特征、充分挖掘数据之间的关联，提取图像的全局特征和上下文信息，对千变万化的云进行统计识别，进而得到精度更高的识别结果，已在人脸识别、场景识别等常规模式识别领域发挥了重要作用。虽然深度学习算法在不同的机器学习应用中取得了很好的结果，但在云图像识别分类的应用中还存在以下难点：首先，在实际应用中，卷积神经网络需要大量的标记数据进行训练，而目前的云图数据尚属缺乏，注释云图像需要专业知识，因此非常昂贵耗时，并且受制于观察者的可变性。在缺乏大量且有标记数据的情况下，如何保证卷积神经网络对地基云图像的分类效果是难题。其次，有限的训练数据易导致“过度拟合”，特征不能很好地被概括。在云图像中，云的外观变化无常，当其变化性非常大时，过拟合会变得更加严重。第三，从零开始训练卷积神经网络需要较高的计算能力、广泛的内存资源和时间，在实际的操作过程中具有一定的局限性。

名词解释

AlexNet，一种卷积神经网络，在LeNet的基础上加深了网络的结构，学习更丰富更高维的图像特征，2012年由Alex等人提出。

ImageNet，是一个计算机视觉系统识别项目名称，模拟人类的识别系统建立，是目前世界上最大的图像识别数据库。

发明内容

本发明的目的是提供一种地基云图识别模型训练方法及地基云图识别方法和装置，利用迁移学习和微调AlexNet网络实现地基云图识别模型，以能够对多种地基云图进行智能化识别，提高云识别的范围和识别精度。

本发明采用的技术方案如下：

一方面，本发明提供一种地基云图识别模型训练方法，包括：

建立包括多种云类别的地基云图样本库；

搭建卷积神经网络AlexNet；

利用ImageNet图像样本库对AlexNet网络进行预训练，得到预训练的地基云图识别模型；

从地基云图样本库中选择训练集样本，对预训练的地基云图识别模型进行倒推分层微调，保存倒推分层微调过程中对应不同微调阶段的多个优化后地基云图识别模型；

从地基云图样本库中选择验证集样本，对所述多个优化后地基云图识别模型进行准确率验证，将其中准确率最高的作为最终地基云图识别模型。

可选的，方法还包括：

将地基云图样本库中的地基云图样本划分为训练集、验证集和测试集，训练集、验证集、测试集的样本数量比值为8:1:1。

从地基云图样本库中选择测试集样本，对最终地基云图识别模型进行测试，可根据测试集的测试结果对最终得到的识别模型进行评价。

可选的，建立云图样本库包括：

对应多种云类别分别获取多个地基云图图像；

对获取到的地基云图图像进行归一化处理，得到像素大小一致的地基云图图像；

利用水平翻转、调整亮度和/或随机裁剪方法，对归一化处理后的地基云图图像进行处理，将处理后的图像作为新的地基云图图像样本，使得云图样本库的样本数量增加至原数量的N倍。所述归一化处理可采用非线性插值归一化方法，所述相同像素大小可为227*227像素，N可根据能够直接获取的图像样本数量进行调整，如设置为4倍等。

可选的，所述卷积神经网络AlexNet包括5个卷积层和3个全连接层，最后一个全连接层对应云图样本库中的云类别数量设有相同数量的输出节点。

可选的，云图样本库中包括10种云类别的云图像样本，卷积神经网络AlexNet的最后一个全连接层包括10个输出节点。

可选的，对预训练的地基云图识别模型进行倒推分层微调为：从最后一层开始选择为当前训练层进行第一轮微调训练，后续每轮依次向前递加一层作为当前训练层进行微调训练；每一轮微调训练冻结当前训练层之外的其它所有层的网络参数；对于当前训练层进行训练的参数设置包括：epoch数量，epoch中批处理的大小，最大迭代步数；微调训练过程采用Adam优化器，通过小批量梯度下降法L2正则化反向传播更新网络权值参数；对于网络中的前两个全连接层采用随机失活进行正则化。

可选的，每轮微调训练中，批处理大小为32，最大迭代步数为2000步，训练在180个epoch处停止；使用Adam优化器进行随机优化时，当前训练层的学习率为0.0001，学习率衰减为0.99，冻结层的学习率为0；所述L2正则化系数设置为0.001，随机失活比例设置为0.5。

可选的，每轮对当前训练层进行微调训练过程中，将网络收敛时的地基云图识别模型作为相应微调阶段的优化后地基云图识别模型。可在网络收敛时计算准确率，或者在全部轮数训练结束后，统一利用验证集计算准确率。

可选的，每轮对当前训练层进行微调训练的过程中，每迭代5步保存一次网络参数。可节约计算机执行训练算法时的内存，提高训练效率。

每次保存网络参数后，网络是否收敛通过计算损失函数判断，可利用AlexNet网络内部的Softmax-cross-entropy损失函数曲线。网络分类函数采用Softmax函数，损失函数采用交叉熵损失函数。损失函数曲线中损失函数趋势下降，则判断为网络收敛。

具体的，将验证集样本输入识别模型，判断模型预测到的标签值与样本正确的标签是否一致，来判别其分类结果是否正确，将所有分类正确的样本数与样本总数的比值作为最终的识别准确率结果，即

其中T_p为分类正确的样本数，T为所有样本数。

第二方面，本发明提供一种利用第一方面所述地基云图识别模型训练方法训练所得模型的地基云图识别方法，包括：

采集待识别地基云图；

对待识别地基云图进行预处理；

将预处理后的地基云图作为预先训练的地基云图识别模型的输入，进行云图识别；

将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别。

可选的，所述对待识别地基云图进行预处理包括：

利用非线性插值方法将待识别地基云图的大小调整到预设像素大小；所述预设像素大小与地基云图识别模型训练样本的图像像素相同。

第三方面，本发明提供一种利用第一方面所述地基云图识别模型训练方法训练所得模型的地基云图识别装置，包括：

云图采集模块，被配置用于采集待识别地基云图；

预处理模块，被配置用于对待识别地基云图进行预处理；

云图识别模块，被配置用于将预处理后的地基云图作为预先训练的地基云图识别模型的输入，进行云图识别；

云图识别结果确定模块，别配置用于将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别。

有益效果

本发明利用卷积神经网络AlexNet的深层次网络结构和对图像特征更强的学习能力，实现了一种识别准确率较高、识别对象类别范围较广的地基云图类别识别模型。在模型训练过程中，利用ImageNet图像样本库对AlexNet网络进行预训练，通过迁移学习和倒推微调对地基全天空云图样本库进行深度学习，在倒退微调过程中，通过小批量梯度下降、随机失活等算法的结合，减少模型过拟合的情形，能显著提高模型训练的效率，有效地提高训练所得模型对地基云图云状识别的精度和范围，从而可提高对降水、降雪等天气活动的预报精度，具有广阔的市场应用前景与经济价值。

附图说明

图1是本发明地基云图识别模型建立流程示意图；

图2是本发明的地基云图样本库示意图；

图3是本发明的非线性插值归一化图像处理示意图；

图4是本发明的地基云图样本库数据增强示意图；

图5是本发明的AlexNet网络结构示意图；

图6是本发明选用的部分ImageNet数据集预训练结果示意图；

图7是本发明微调时最优一次验证集准确率的程序日志图；

图8是本发明分层微调方法验证集准确率结果比较图；

图9是本发明的云图识别测试结果混淆矩阵图，其中横坐标为10类云的预测标签，纵坐标为10类云的真实标签。

具体实施方式

以下结合附图和具体实施例进一步描述。

本发明的技术构思为：利用迁移学习和微调的卷积神经网络，实现一种地基云图识别模型，以能够对地基云图进行自动识别，提高云识别范围和识别精度。

实施例1

本实施例为一种地基云图识别模型训练方法，参考图1所示，包括：

建立包括多种云类别的地基云图样本库；

搭建卷积神经网络AlexNet；

实施例1-1

在实施例1的基础上，本实施例地基云图识别模型训练方法还包括：

测试集样本可用于对最终地基云图识别模型进行测试，根据测试集的测试结果对最终得到的识别模型进行评价。

建立云图样本库包括：

对应多种云类别分别获取多个地基云图图像；

利用水平翻转、调整亮度和/或随机裁剪方法，对归一化处理后的地基云图图像进行处理，将处理后的图像作为新的地基云图图像样本，使得云图样本库的样本数量增加至原数量的N倍。

样本库建立时，可用数码相机拍摄地基云图，或者从网上下载地基云图，建立待识别种类范围的所有种类的地基云图样本库，每种样本云图越多越好。

所述归一化处理可采用非线性插值归一化方法，所述相同像素大小可为227*227像素，N可根据能够直接获取的图像样本数量进行调整，如设置为4倍等。

本实施例中，云图样本库中包括10种云类别的云图像样本，卷积神经网络AlexNet包括5个卷积层和3个全连接层，最后一个全连接层对应云图样本库中的云类别数量设有相同数量的输出节点，即10个输出节点。

对预训练的地基云图识别模型进行倒推分层微调为：从最后一层开始选择为当前训练层进行第一轮微调训练，后续每轮依次向前递加一层作为当前训练层进行微调训练；每一轮微调训练冻结当前训练层之外的其它所有层的网络参数；对于当前训练层进行训练的参数设置包括：epoch数量，epoch中批处理的大小，最大迭代步数；微调训练过程采用Adam优化器，通过小批量梯度下降法L2正则化反向传播更新网络权值参数；对于网络中的前两个全连接层采用随机失活进行正则化。

每轮微调训练中，批处理大小为32，最大迭代步数为2000步，训练在180个epoch处停止；使用Adam优化器进行随机优化时，当前训练层的学习率为0.0001，学习率衰减为0.99，冻结层的学习率为0；所述L2正则化系数设置为0.001，随机失活比例设置为0.5。

每轮对当前训练层进行微调训练的过程中，可每迭代5步保存一次网络参数，节约执行迭代的计算机内存。

每轮对当前训练层进行微调训练过程中，将网络收敛时的地基云图识别模型作为相应微调阶段的优化后地基云图识别模型。在网络收敛时计算准确率，或者在全部轮数训练结束后，统一利用验证集计算准确率。

网络是否收敛通过计算损失函数判断，可利用AlexNet网络内部的Softmax-cross-entropy损失函数曲线。网络分类函数采用Softmax函数，损失函数采用交叉熵损失函数。损失函数曲线中损失函数趋势下降，则判断为网络收敛。

准确率计算为：将验证集样本输入识别模型，判断模型预测到的标签值与样本正确的标签是否一致，来判别其分类结果是否正确，将所有分类正确的样本数与样本总数的比值作为最终的识别准确率结果，即

其中T_p为分类正确的样本数，T为所有样本数。

本实施例的方法具体操作可按照如下步骤，包括：

步骤001.建立地基云图样本库，包括步骤00101-步骤00103：

步骤00101.如图2所示，用数码相机拍摄地基云图，或者从网上下载地基云图，建立所有10种类的地基云图样本库，每种样本云图越多越好；

步骤00102.如图3所示，利用非线性插值归一化方法将样本库所有图像大小统一调整到227*227像素；

步骤00103.如图4所示，利用水平翻转、调整图像亮度、随机裁剪方法将样本库增强至原数量的四倍。

步骤002.搭建卷积神经网络AlexNet，如图5所示，包括5个卷积层和3个全连接层，最后一个全连接层输出为10个节点，每个节点代表云图像样本库中的一个类别。初始化网络参数设置按照原AlexNet网络初始化参数设置。

步骤003.参考图6，利用ImageNet数据集对AlexNet进行预训练并保存网络参数，得到一个预训练的网络。

步骤004.将步骤001建立的地基云图样本库进行划分，其中80％作为训练集，10％作为验证集，10％作为测试集。

步骤005.取地基云图样本库中的训练集对模型进行倒推分层微调，保存多个不同微调阶段的优化后地基云图识别模型。按照步骤00501-00508进行。

步骤00501.第一轮微调：使用云图训练集对预训练后的AlexNet网络的最后一层进行再训练，同时冻结其它所有层的所有参数，直到网络收敛后计算该轮训练的分类准确率。

其中网络参数设置为：批处理大小设置为32，训练在180个epoch处停止。使用Adam优化器，微调层的学习率为0.0001，学习率衰减为0.99，冻结层的学习率为0。训练过程通过小批量梯度下降法L2正则化反向传播更新网络权值参数

ω_t＝ω_t-1-η(ΔE+γω_t-1)其中E为网络实际预测值f(x_i)与对应标签y_i之间的误差，m为批量样本量，ω_t为权值，η为学习率，γ为正则化系数，取为0.001，前两个全连接层进行随机失活防止网络过拟合，即以概率1-p随机丢弃部分单元，其中p设置为0.5。

步骤00502.第二轮微调，使用地基云图样本库的训练集对预训练后AlexNet网络的最后两层进行训练，并在训练过程中冻结其它层的所有网络参数，直到收敛后计算准确率。

其中网络参数设置为：批处理大小设置为32，训练在180个epoch处停止。使用Adam优化器，微调层的学习率为0.0001，学习率衰减为0.99，冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001)，前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。

步骤00503.第三轮微调，使用地基云图样本库的训练集对预训练后AlexNet网络的最后三层进行训练，并在训练过程中冻结其它层的所有参数，直到收敛后计算准确率。

步骤00504.第四轮微调，使用地基云图样本库的训练集对预训练后AlexNet网络的最后四层进行训练，并在训练过程中冻结其它层的所有参数，直到收敛后计算准确率。

步骤00505.第五轮微调，使用地基云图样本库的训练集对预训练后AlexNet网络的最后五层进行训练，并在训练过程中冻结其它层的所有参数，直到收敛后计算准确率。

步骤00506.第六轮微调，使用地基云图样本库的训练集对预训练后AlexNet网络的最后六层进行训练，并在更新过程中冻结其它层的所有参数，直到收敛后计算准确率。其中网络参数设置为：批处理大小设置为32，训练在180个epoch处停止。使用Adam优化器，微调层的学习率为0.0001，学习率衰减为0.99，冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001)，前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。

步骤00507.第七轮，使用地基云图样本库的训练集对预训练后AlexNet网络的最后七层进行训练，并在训练过程中冻结其它层的所有参数，直到收敛后计算准确率。其中网络参数设置为：批处理大小设置为32，训练在180个epoch处停止。使用Adam优化器，微调层的学习率为0.0001，学习率衰减为0.99，冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001)，前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。

步骤00508.第八轮，使用地基云图样本库的训练集对预训练后AlexNet网络的最后八层预训练，并在更新过程中冻结其它层的所有参数，直到收敛后计算准确率。其中网络参数设置为：批处理大小设置为32，训练在180个epoch处停止。使用Adam优化器，微调层的学习率为0.0001，学习率衰减为0.99，冻结层的学习率为0。训练通过权重衰减来正则化(L2正则化系数设置为0.001)，前两个全连接层则通过随机失活进行正则化(随机失活比例默认设置为0.5)。

每一轮微调训练，将网络收敛时的网络模型参数进行保存。每一轮微调训练过程中，由于迭代步数达20000步，因此可设计每隔5步迭代对网络进行一次保存，从而可节约计算机内存，提高效率。

步骤006.如图7和8所示，将步骤005保存好的网络模型依次在地基云图验证集上验证准确率，保存其中准确率最高的1个网络模型，即得到最终地基云图识别模型。

此外，如图9所示，在得到最终地基云图识别模型后，还可利用测试集云图像在模型上进行自动识别测试，作为对模型最终识别结果的评价。

实施例2

与实施例1基于相同的发明构思，本实施例为利用实施例1地基云图识别模型训练方法训练所得模型的地基云图识别方法，包括：

采集待识别地基云图；可采用相机拍摄采集；

对待识别地基云图进行预处理；

对待识别地基云图进行预处理包括：

利用非线性插值方法将待识别地基云图的大小调整到预设像素大小；所述预设像素大小与地基云图识别模型训练样本的图像像素相同。预处理还可包括其它如去噪、增强等手段，可使得地基云图的识别结果更快速准确。

实施例3

与实施例1基于相同的发明构思，本实施例为利用实施例1地基云图识别模型训练方法训练所得模型的地基云图识别装置，包括：

云图采集模块，被配置用于采集待识别地基云图；

预处理模块，被配置用于对待识别地基云图进行预处理；

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种地基云图识别模型训练方法，其特征是，包括：

建立包括多种云类别的地基云图样本库；

搭建卷积神经网络AlexNet；

2.根据权利要求1所述的方法，其特征是，还包括：

3.根据权利要求1所述的方法，其特征是，建立云图样本库包括：

对应多种云类别分别获取多个地基云图图像；

4.根据权利要求1所述的方法，其特征是，所述卷积神经网络AlexNet包括5个卷积层和3个全连接层，最后一个全连接层对应云图样本库中的云类别数量设有相同数量的输出节点。

5.根据权利要求5所述的方法，其特征是，云图样本库中包括10种云类别的云图像样本，卷积神经网络AlexNet的最后一个全连接层包括10个输出节点。

6.根据权利要求1所述的方法，其特征是，对预训练的地基云图识别模型进行倒推分层微调为：从最后一层开始选择为当前训练层进行第一轮微调训练，后续每轮依次向前递加一层作为当前训练层进行微调训练；每一轮微调训练冻结当前训练层之外的其它所有层的网络参数；对于当前训练层进行训练的参数设置包括：epoch数量，epoch中批处理的大小，最大迭代步数；微调训练过程采用Adam优化器，通过小批量梯度下降法L2正则化反向传播更新网络权值参数；对于网络中的前两个全连接层采用随机失活进行正则化；

7.根据权利要求6所述的方法，其特征是，每轮对当前训练层进行微调训练过程中，将网络收敛时的地基云图识别模型作为相应微调阶段的优化后地基云图识别模型。

8.根据权利要求6所述的方法，其特征是，每轮对当前训练层进行微调训练的过程中，每迭代5步保存一次网络参数。

9.一种利用权利要求1-8任一项所述地基云图识别模型训练方法训练所得地基云图识别模型的地基云图识别方法，其特征是，包括：

采集待识别地基云图；

对待识别地基云图进行预处理；

将地基云图识别模型输出的云图类别结果作为待识别地基云图的云图类别；

所述对待识别地基云图进行预处理包括：

10.一种利用权利要求1-8任一项所述地基云图识别模型训练方法训练所得地基云图识别模型的地基云图识别装置，其特征是，包括：

云图采集模块，被配置用于采集待识别地基云图；

预处理模块，被配置用于对待识别地基云图进行预处理；