CN117292213A

CN117292213A - 多类型相机下样本不均衡的松林变色异木识别方法

Info

Publication number: CN117292213A
Application number: CN202311593053.4A
Authority: CN
Inventors: 习雍; 叶绍泽; 黄晓霞; 田遥; 李翔
Original assignee: Jiangxi Woodpecker Bee Technology Co ltd
Current assignee: Jiangxi Woodpecker Bee Technology Co ltd
Priority date: 2023-11-27
Filing date: 2023-11-27
Publication date: 2023-12-26
Anticipated expiration: 2043-11-27
Also published as: CN117292213B

Abstract

本发明公开了一种多类型相机下样本不均衡的松林变色异木识别方法，包括选取K类相机拍摄得到K个子数据集，计算每个子数据集的占比，按占比从高到低标记为D₁~D_K，构成数据集D；在Faster R‑CNN网络中设计数据相关性损失、RPN网络中设计数据相似性损失来优化目标函数，训练网络得到目标识别模型。本发明以占比最大的D₁中变色异木区域特征为中心，使其他占比小的子数据集的变色异木区域特征与其相似，从而在确保D₁识别准确性的基础上，提高对D₂~D_K的识别能力，也就提升了对不同相机采集的松林影像中变色异木区域的识别能力，且无需增加检测模型增参数。

Description

多类型相机下样本不均衡的松林变色异木识别方法

技术领域

本发明涉及一种图像识别方法，尤其涉及一种多类型相机下样本不均衡的松林变色异木识别方法。

背景技术

松木线虫病会导致大量松树枯死，所以需要对松木线虫病害进行识别。目前采用的方法为：首先通过无人机采集松林视频影像，再对影像进行分析来识别变色异木，是监测松木线虫病害的重要手段。近年来深度学习等人工智能技术被用于变色异木的识别。

然而不同厂家、型号的相机，采集到的无人机影像特征差异大，并且所有识别的变色异木呈现的特征差异也大；另一方面在不同条件下，采集到的影像数据也不平衡，如：相机A采集的变色异木占比85%，相机B采集的变色异木占比10%，相机C采集的变色异木占比5%。这些不同类型相机造成的影像特征差异大、变色异木特征差异大，以及不同相机采集的变色异木数据量不均衡等问题为基于深度学习的变色异木识别模型带来了极大的挑战。

目前常用的识别模型为Faster R-CNN网络模型。该模型包括四个部分：特征提取网络、RPN网络、兴趣区域池化层、分类和回归网络；图像输入网络之后，（1）先经卷积操作进行特征提取得到特征图，（2）将特征图输入RPN网络，生成目标区域的候选框，（3）由兴趣区域池化单元结合候选框和特征图，从特征图中抠出对应的区域特征，也被称为兴趣区域特征，并转换为某一特定尺寸的特征图，（4）最后由分类和回归网络进行类别计算和候选框微调，输出微调后得到的检测框，和检测框内的目标类别。训练Faster R-CNN网络模型时，通常将分类和回归网络的分类损失和边框回归损失之和作为目标函数，以追求分类损失和边框回归损失最小化。

由于不同相机差异大、影像数据不平衡，若用不同相机的影像构成单一相机的数据集训练Faster R-CNN网络，得到的模型差异大，无法对其他相机的影像进行精确识别。

发明内容

本发明的目的就在于提供一种解决上述问题，克服不同类型相机采集的影像的特征差异大、导致模型训练不准确等缺陷的，多类型相机下样本不均衡的松林变色异木识别方法。

为了实现上述目的，本发明采用的技术方案是这样的：一种多类型相机下样本不均衡的松林变色异木识别方法，包括以下步骤；

S1，构建数据集D，包括S11~S14；

S11，选取K个不同类型的相机对松林进行拍摄，每个相机每次拍摄得到一松林影像，同一相机的松林影像构成一子数据集；

S12，将变色异木作为目标，在松林影像中人工标记目标区域，统计每个子数据集中目标区域面积、所有目标区域面积总和S，并将标记了目标区域的松林影像作为训练样本；

S13，计算每个子数据集的占比，对其中一子数据集，其占比=S_z÷S×100%，其中，S_z为该子数据集的目标区域面积；

S14，将子数据集按占比从高到低排序，并依次标记为D₁~D_K，数据集D={D₁,D₂,…,D_i,…,D_K}，D_i是第i个子数据集，i=1~K；

S2，选取Faster R-CNN网络，包括特征提取网络、RPN网络、兴趣区域池化层、分类和回归网络；

S3，预设迭代次数t、构建训练集X，用训练集训练Faster R-CNN网络至收敛，得到目标识别模型；其中第W次训练包括步骤S31~S38，W=1~t；

S31，构建训练集X={X₁,X₂,…, X_i,…,X_K}，其中，X_i为从D_i中选取多张训练样本构成的集合，X₁~X_K中训练样本的占比为D₁~D_K的占比；

S32，将训练集X输入Faster R-CNN网络，对训练集X的每个训练样本，由特征提取网络提取特征图，再扁平化处理为D维的向量标记为深度向量；

S33，计算训练集X的数据相关性损失L_Corr；

，

式中，j=1~K，且i≠j，x_m为X_i中的训练样本，x_n为X_j中的训练样本，y_m、y_n分别为x_m、x_n对应的深度向量，D为深度向量的维度，T为转置操作；

S34，对每张特征图，经RPN网络对目标区域生成候选框、并由兴趣区域池化层输出兴趣区域特征；

S35，把兴趣区域特征扁平化处理为特征向量，将X_i对应的所有特征向量构成特征向量集合Q_i，得到X₁~X_K对应的特征向量集合Q₁~Q_K；

计算Q₂~Q_K与Q₁的相似性，其中Q_i与Q₁的相似性H（Q_i|Q₁）通过下式得到；

，

式中，e为自然常数，q为Q_i中的特征向量，p为Q₁中的特征向量，V(•|•)为两个特征向量条件协方差计算，K(•,•)为两个特征向量的协方差计算；

S36，根据下式计算训练集X的数据相似性损失L _mutual；

，

S37，将兴趣区域特征送入分类和回归网络，输出候选框及候选框内的目标类别，并计算分类损失L _cls和边框回归损失L _res；

S38，设计目标函数L，并用目标函数L训练Faster R-CNN网络；

，

其中，a ₁ 、a ₂ 、a ₃分别为L _cls+ L _res、L _Corr、L_mutual的权重；

S4，用目标识别模型进行目标识别；

用K类相机中任一相机对松林进行拍摄，得到待识别松林影像，送入目标识别模型，输出其中的变色异木区域。

作为优选：每次训练时构建的训练集X都不同，由随机抽取的训练样本构成。

作为优选：S38中，a ₁=1、a ₃=0.5，，a为a ₂的权函数变量，a=0.5。

作为优选：所述分类损失L _cls根据下式得到；

，

式中，N为候选框总数，f为第f个候选框，f=1~N，c _f为第f个候选框的类别标签，取值为0或1，其中0为目标，1为背景，p _f为第f个候选框为目标的预测概率，log（·）为log函数。

作为优选：所述边框回归损失L _res通过下式得到；

，

式中，N为候选框总数，f为第f个候选框，f=1~N；

d _xf、d _yf、d _wf、d _hf分别表示对第f个候选框预测的x坐标、y坐标、宽度和高度，t _xf、t _yf、t _wf、t _hf分别表示第f个候选框真实的x坐标、y坐标、宽度和高度，Smooth _L1(·)为平滑L1函数，根据下式得到，，uv为Smooth _L1(·)中的变量。

本发明的思路为：

首先，将不同相机对应的子数据集，按变色异木区域面积多少计算占比并排序，变色异木区域面积最大的子数据集为D₁，其余按降序依次为D₂~ D_K，从而得到各子数据集的占比和顺序。

第二：每次训练时，随机按占比从D₁~D_K中抽取训练数据构成X₁~ X_K，再针对不同类型相机采集的松林影像的特征差异大的特点，提出一种特征相关性的计算方法，通过步骤S33提高不同类型相机采集的松林影像之间的特征相关性，使得后续的变色异木的检测能够在高度相关的特征下进行。

第三针对不同相机采集的变色木区域数量不均衡的问题，本发明以占比最多的子数据集D₁对应的相机采集的变色异木为中心，使占比小的相机采集到的变色异木的特征尽量与其相似。

本发明设计数据相关性损失L_Corr的目的是提升最终训练出来的模型检测来自不同类型的相机拍摄的图像的检测性能。

本发明设计数据相似性损失L_mutual的目的是提升最终训练出来的模型检测不同相机采集的数量不均衡的图像的检测性能。

与现有技术相比，本发明的优点在于：

（1）在处理不同相机产生的影像特征差异、松林变色异木特征和不同相机采集样本量不同问题上，未增加检测模型中的参数。

（2）以大比例变色异木区域特征为中心，使小比例变色异木区域与其相似，在解决不平衡问题和变色异木区域特征差异大的问题时，首先确保了大比例变色异木区域的识别准确性。

（3）在学习过程的不同阶段解决问题的侧重不同，早期注重解决特征差异大，后期注重检测问题，使得学习更加有效。

（4）对分类损失L _cls进行了改进，分类损失采用交叉熵损失函，它是连续可导的凸函数，这使得训练过程变得更加高效和稳定，提高了松林变色异木识别模型的训练效率。并且交叉熵损失函数可以方便地与其他损失函数进行组合使用，在松林变色异木识别中，需要同时考虑目标的位置和类别信息，因此通过将交叉熵损失函数与回归损失函数结合起来，构建一个综合的损失函数来同时优化目标的位置和类别预测，提高了松林变色异木模型的优化效率。

（5）对边框回归损失L _res进行了改进，在边框回归损失L _res中使用了平滑L1损失，这是因为，在松林变色异木识别任务中，由于目标位置可能存在噪声或者不准确的标注，使用常用的均方误差损失会对异常值非常敏感。而平滑L1损失通过引入了一个平滑因子，可以减少异常值的影响，提高了松林变色异木识别模型的鲁棒性。缺省框处理：在目标检测任务中，通常需要预测目标的位置，包括边界框的坐标。平滑L1损失能够有效地应对预定义边界框的处理，使得模型对变色异木位置的预测更加准确。

附图说明

图1为Faster R-CNN网络；

图2为本发明流程图；

图3为一相机拍摄的松林影像中人工标记目标区域的示意图；

图4为迭代次数变化图。

具体实施方式

下面将结合附图对本发明作进一步说明。

实施例1：参见图1-图4，一种多类型相机下样本不均衡的松林变色异木识别方法，包括以下步骤；

S1，构建数据集D，包括S11~S14；

S33，计算训练集X的数据相关性损失L_Corr；

，

S36，根据下式计算训练集X的数据相似性损失L _mutual；

，

S38，设计目标函数L，并用目标函数L训练Faster R-CNN网络；

，

S4，用目标识别模型进行目标识别；

本实施例中，每次训练时构建的训练集X都不同，由随机抽取的训练样本构成。

步骤S38中，a ₁=1、a ₃=0.5，，a为a ₂的权函数变量，a=0.5。

所述分类损失L _cls根据下式得到；

，

所述边框回归损失L _res通过下式得到；

，

式中，N为候选框总数，f为第f个候选框，f=1~N；

关于图3，将变色异木作为目标，标记目标区域，如图3中方框所示。

实施例2：参见图1-图4，本实施例中，我们在多个林区共计14600亩松林由直升机挂载三款不同厂家相机，按本发明方法进行数据采集、数据标注、模型训练和变色异木智能识别工作。

首先，三款相机按本发明步骤S11先拍摄松林影像构成子数据集，再按步骤S12进行人工标记，标记标目标区域的示意图如图3所示。再按S13计算每个子数据集的占比；三个子数据集的占比为78%：12%：10%。再按步骤S14将子数据集按占比从高到低排序，得到子数据集D₁、D₂、D₃。我们将D₁、D₂、D₃对应的相机分别标记为相机A、相机B和相机C，并从D₁、D₂、D₃中各取70%作为训练集，30%作为测试集。

然后，按本发明步骤S2、S3训练得到目标识别模型，也称为本发明模型。

为了说明本发明效果，本实施例用同样的数据集，采用Faster R-CNN方法和本发明方法进行对比实验，输入待识别松林影像，输出其中的变色异木区域。且本实施例使用目标检测中的mAP（mean Average Precision）作为识别的评估标准，得到表1。

表1. 对比实验表

，

从表1可以看出，相对Faster R-CNN，本发明方法在相机A采集的数据上的异木检测性能稍有下降，下降约0.08%，但在相机B采集的数据上，性能获得了极大的提高，提高约6.31%；在相机C采集的数据上，性能也获得了极大的提高，提高约6.71%。从中可以看出本方法在保证大比例相机影像数据中变色异木检测的性能基础上，极大提高了小比例相机影像数据中变色异木检测的性能。

另外，本实施例还在Faster R-CNN基础上，在主特征提取网络中构建数据相关性损失L_Corr和在RPN网络中构建数据相似性损失L_mutual，因此开展消融实验，对所提出方法进行剥离。在Faster R-CNN上分别加入L_Corr和L_mutual，并进行评估。实验结果在表2中。

表2.消融实验结果表

，

表2中，Faster R-CNN+L_corr+L_mutual即为本发明方法，从表2中可以看出，本方法构建的数据相关性损失L_Corr、数据相似性损失L_mutual，均对多相机下的变色异木检测起到了提升作用，且基于本发明的方法，整体应用L_corr和L_mutual，效果更显著。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种多类型相机下样本不均衡的松林变色异木识别方法，其特征在于：包括以下步骤；

S1，构建数据集D，包括S11~S14；

S33，计算训练集X的数据相关性损失L_Corr；

，

S36，根据下式计算训练集X的数据相似性损失L _mutual；

，

S38，设计目标函数L，并用目标函数L训练Faster R-CNN网络；

，

S4，用目标识别模型进行目标识别；

2.根据权利要求1所述的多类型相机下样本不均衡的松林变色异木识别方法，其特征在于：每次训练时构建的训练集X都不同，由随机抽取的训练样本构成。

3.根据权利要求1所述的多类型相机下样本不均衡的松林变色异木识别方法，其特征在于：S38中，a ₁=1、a ₃=0.5，，a为a ₂的权函数变量，a=0.5。

4.根据权利要求1所述的多类型相机下样本不均衡的松林变色异木识别方法，其特征在于：所述分类损失L _cls根据下式得到；

，

5.根据权利要求1所述的多类型相机下样本不均衡的松林变色异木识别方法，其特征在于：所述边框回归损失L _res通过下式得到；

，

式中，N为候选框总数，f为第f个候选框，f=1~N；