CN112183640A

CN112183640A - 一种基于不规则物体的检测和分类方法

Info

Publication number: CN112183640A
Application number: CN202011054380.9A
Authority: CN
Inventors: 张茂彬; 刘双; 董进华; 孙小龙; 韩承启
Original assignee: Wuxi Xinje Electric Co Ltd
Current assignee: Wuxi Xinje Electric Co Ltd
Priority date: 2020-09-29
Filing date: 2020-09-29
Publication date: 2021-01-05

Abstract

本发明公开了一种基于不规则物体的检测和分类方法，涉及图像采集技术领域，海产品采集，并构建海产品数据集；30％作为测试集、70％作为训练集，并将该图像输入到海产品分类分割模型中进行训练，得分类输出和分割输出；设计海产品分类分割模型的损失函数，并对其进行优化训练，得优化后模型；设计模型的评价指标，进行检测性能评价得检测模型；对检测模型的输出进行区域连通性分析，获得目标的尺寸和最小外接矩形；将在所述训练集和所述测试集中评价指标都表现好的模型保存并部署到现场。本方法对海产品检测效果较好，检测速度快，检测精度高，能够实现海产品的实时尺寸检测。

Description

一种基于不规则物体的检测和分类方法

技术领域

本发明涉及图像采集技术领域，尤其是一种基于不规则物体的检测和分类方法。

背景技术

随着物质生活水平的不断提升，越来越多的海产品成为大众餐桌的主角。不同于猪牛羊等基于部位的报价方式，大多数海产品按照产品规格大小来计价，这种特殊的计价方式，决定了海产品分选在海产品加工产业链中的重要地位。

中国作为世界上最大的海产养殖国，每天有数以万计的海产品被捕捞出水，完成等级分选后，送往全球各地的市场。庞大的市场需求，要求海产品分选速度不断加快，精度不断提高。

传统的海产品分选主要依赖人工，仅靠工人肉眼看、手工称来对海产品规格进行分选，这种方式劳动强度大，分选速度慢，同时，分选结果的主观性影响大，即便是经验丰富的分选工人也无法确保每一次分选结果的一致性。

海产品称重分选机的出现在一定程度上弥补了人工分选的短板，但称重算法容易受到外因影响，导致分选失败。例如冷冻是海产品保鲜最常用的方式，但冷冻后海产品表面附着的冰水混合物会对称重算法产生影响，导致分选精度下降，此外，根据重量分选也无法精准的确定冷冻海产品的实际规格。

视觉分选机是在称重分选机的基础上，融合视觉分选功能的新一代分选机，除传统的重量分选外，还可同时检测产品的外观、尺寸等。但当前市场上主流的视觉分选机均使用传统视觉算法，无法对产品图像实现像素级别的识别，计算误差大，难以实现高精度分选。

鉴于上述情况，急需一种新的技术方案来解决上述问题。

发明内容

本发明针对现有技术的不足，提出一种基于不规则物体的检测和分类方法，通过将采集的海产品数据集输入到自建的海产品分类分割模型中实现图像分类和分割双输出，并通过引入损失函数和评价指标来对模型进行优化，再对优化后模型的输出进行区域连通性分析，获取目标的尺寸和最小外接矩形。本方法对海产品检测效果较好，检测速度快，检测精度高，能够实现海产品的实时尺寸检测。

为了实现上述发明目的，本发明提供以下技术方案：

一种基于不规则物体的检测和分类方法，包括如下步骤：

步骤(1)海产品采集，并构建海产品数据集；

步骤(2)通过分层抽样的方法选取步骤(1)中所述海产品数据集的30％作为测试集、70％作为训练集，对所述训练集的数据进行数据增广，得训练后图像，并将该图像输入到海产品分类分割模型中进行训练，得分类输出和分割输出；

步骤(3)根据步骤(2)中所述分类输出和所述分割输出设计海产品分类分割模型的损失函数，将所述损失函数作为目标函数，并对其进行优化训练，得优化后模型；

步骤(4)设计模型的评价指标，对步骤(3)中所述优化后模型的检测效果进行检测性能评价，得经过性能评价后的检测模型；

步骤(5)对步骤(5)中得经过性能评价后的检测模型的输出进行区域连通性分析，获得目标的尺寸和最小外接矩形；

步骤(6)将在所述训练集和所述测试集中评价指标都表现好的模型保存并部署到现场。

优选的，所述步骤(1)海产品采集，并构建海产品数据集；具体为：通过RGB面阵相机对工业生产线上的海产品采集多种位置、类型的图片，构建海产品数据集。

优选的，步骤(2)中所述数据增广，包括：颜色变换、随机翻转、随机裁剪和添加随机噪声。

优选的，步骤(2)中所述海产品分类分割模型，包括：特征提取网络层、分类网络层和分割解码网络层；

所述特征提取网络层包括用于提取目标不同尺寸特征的下采样模块、注意力模块、非瓶颈残差通道分离和洗牌模块；

所述分类网络层包括用于输出目标所属类别的池化模块和全连接层；

所述分割解码网络层包括用于输出目标像素所述类别的特征融合模块、上采样模块和所述注意力模块；

所述海产品分类分割模型的训练，具体为：

给出一个480*640*3的彩色图片，输入到所述特征提取网络层，输出高层信息60*80*128的特征图和低层信息120*160*64的特征图，将两个特征图输入到分割解码网络层：其中，低层信息120*160*64的特征图经过所述注意力模块作为分支一，高层信息60*80*128的特征图经过所述特征融合模块输出，再经过所述上采样模块作为分支二；将所述分之一和所述分支二进行像素点乘求和，经过所述上采样模块输出分割结果。同时，由所述特征提取网络层的低层信息120*160*64的特征图经过所述下采样模块，再经过所述全连接层输出分类结果。

优选的，所述注意力模块是一种轻量的注意力模块，包括可以在通道和空间维度进行注意的通道注意力模块和空间注意力模块。

优选的，所述特征融合模块的操作，包括分别对高层信息和低层信息进行处理后融合；

对所述高层信息的处理包括：

步骤a.将高层信息60*80*128的特征图输入到所述注意力模块，经过所述上采样模块得到分支一；

步骤b.将高层信息60*80*128的特征图和分支一进行点乘得到分支二；

步骤c.将高层信息60*80*128的特征图经过所述下采样模块得到分支三，该分支三经过下采样引出下采样分支四，分支三和分支四进行点乘求和，求和结果和分支二进行点乘求和得到分支五。

第二，对低层信息120*160*64的特征图经过所述注意力模块和所述分支五进行点乘求和，求和结果进行所述上采样模块得到分割结果。

优选的，所述步骤(3)具体为：

海产品分类分割网络模型构建两个输出分支，分别为分类输出和分割输出，其中，所述分类网络层计算的预测输出q_i与样本标签p_i，设计交叉熵损失函数做为分类分支的目标函数；同时，在所述分割解码网络层分支计算预测值，设计所述损失函数为分割分支的目标函数，优化两个目标函数，让模型预测结果不断逼近真实标签；

模型总体目标函数为：

Loss＝L_cls+F_seg

分类网络损失函数为的交叉熵损失函数，其公式为：

其中，p_i为样本标签，q_i为预测输出；

分割模型损失函数公式如下：

其中，y′为预测值，α和γ为超参数。

优选的，步骤(4)中所述设计模型的评价指标，具体为：

在分类输出中，首先对输出的预测结果和真实标签进行统计，建立混淆矩阵，然后对模型的分类预测结果和真实标签进行精准率和召回率计算，精准率计算公式如下：

召回率计算公式如下：

其中，TP为将正类预测为正类数；FP为将负类预测为正类数；FN为将正类预测为负类数；

模型分类分支的最终评价指标为F_score，该指标综合精准率和召回率的结果，当F越高说明试验方法比较有效，公式如下：

在分割输出中，评价指标采用平均交并比，对分割结果的每一类的掩码像素进行统计，公式如下：

其中，p_ij表示真实值为i、被预测为j的数量，p_ii表示真实值为i、预测值为i的数量，p_ji表示真实值为j、预测值为i的数量。k+1是类别个数(包含空类)；

当mIoU接近1时候，预测值越逼近真实值。

有益效果

本发明所提供的一种基于不规则物体的检测和分类方法，适用于外形不规则物品，如海产品等，通过将采集的海产品数据集输入到自建的海产品分类分割模型中实现图像分类和分割双输出，并通过引入损失函数和评价指标来对模型进行优化，再对优化后模型的输出进行区域连通性分析，获取目标的尺寸和最小外接矩形。本方法对海产品检测效果较好，检测速度快，检测精度高，能够实现海产品的实时尺寸检测。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1为本发明所述一种基于不规则物体的检测和分类方法的分类分割模型结构示意图；

图2为本发明所述一种基于不规则物体的检测和分类方法的轻量的注意力模块示意图；

图3为本发明所述一种基于不规则物体的检测和分类方法的混淆矩阵示意图；

图4为本发明所述一种基于不规则物体的检测和分类方法的平均交并比示意图；

图5为本发明所述一种基于不规则物体的检测和分类方法的掩码结果预测值示意图；

图6为本发明所述一种基于不规则物体的检测和分类方法的目标掩码的最小外接矩形示意图；

图7为本发明所述一种基于不规则物体的检测和分类方法的映射到实际工作的世界坐标系示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于不规则物体的检测和分类方法，包括如下步骤：

步骤(1)海产品采集，并构建海产品数据集；

具体的，所述步骤(1)海产品采集，并构建海产品数据集；具体为：通过RGB面阵相机对工业生产线上的海产品采集多种位置、类型的图片，构建海产品数据集。

步骤(2)中对采集到的数据集采用分层抽样的方法随机取每种海产品类型的70％作为训练集，30％作为测试集，并进行标准化处理。为增加训练样本数量及增强模型的泛化性能，对训练集数据进行数据增广，包括颜色变换、随机翻转、随机裁剪和添加随机噪声，将处理后的训练图像输入到海产品分类分割模型中进行模型的训练。测试集本身不进行训练，可以用于检验模型泛化性能，因此不需要手动改变其分布规律。

如图1所示，所述海产品分类分割模型，包括：特征提取网络层(Encoder)、分类网络层(Classification)和分割解码网络层(Segmentation Decoder)；

所述特征提取网络层(Encoder)包括用于提取目标不同尺寸特征的下采样模块(Down-sampling)、注意力模块(attention-block)、非瓶颈残差通道分离和洗牌模块；具体的：

所述下采样模块是特征的“筛选”过程，筛选不必要的特征信息，以保留最关键的特征信息，减少计算负担；

所述注意力模块是将特征图在空间维度上进行压缩，得到一个一维矢量后再进行操作，在空间维度上进行压缩时，通过池化过程聚合特征映射的空间信息，送到一个共享网络，压缩输入特征图的空间维数，逐元素求和合并，以产生通道注意力图，对输入的图层而言，通道注意力，关注图层某些内容重要性，池化过程中的平均池化反馈每个像素点，最大池化响应图层最大梯度信息；本实施例中，如图2所示，所述注意力模块是一种轻量的注意力模块(Convolutional Block Attention Module，简称CBAM)，包括可以在通道和空间维度进行注意的通道注意力模块(Channel Attention Module(CAM))和空间注意力模块(Spartial Attention Module(SAM))。

所述非瓶颈残差通道分离和洗牌模块，残差中，通道的分离split与洗牌shuffle机制可以减小网络规模，提升特征表达能力。

所述分类网络层(Classification)包括用于输出目标所属类别的池化模块和全连接层；

所述分割解码网络层(Segmentation Decoder)包括用于输出目标像素所述类别的特征融合模块、上采样模块(Upsampling)和所述注意力模块(attention--block)；

所述海产品分类分割模型的训练，具体为：

给出一个480*640*3的彩色图片，输入到特征提取网络层(Encoder)，输出高层信息60*80*128的特征图和低层信息120*160*64的特征图，由特征提取网络层(Encoder)获得的两个特征图输入到所述分割解码网络层(Segmentation Decoder)；其中，

低层信息120*160*64的特征图经过注意力模块(attention-block)作为分支branch1，

高层信息60*80*128的特征图经过特征融合模块输出经过上采样模块作为分支branch2，

branch1和branch2进行像素点乘求和point-wise sum，经过上采样输出分割结果。同时，由特征提取网络层低层信息层60*80*128的特征图经过下采样，经过全连接层输出分类结果。

本实施例中，所述分类网络层(Classification)包括用于输出目标所属类别的池化模块和全连接层。具体的：

(1)池化模块，对高层信息60*80*128进行压缩，避免直接经过全连接层导致信息丢失，得到29*39*3池化结果；

(2)全连接层，使用softmax对池化结果进行类别回归，在输出类别上产生概率分布，对给定无标记输入图像，对其进行分类，得到所属类别的概率，通过该概率结果判断该输入的类别。

本实施例中，所述分割解码网络层(Segmentation Decoder)包括用于输出目标像素所述类别的特征融合模块、上采样模块(Upsampling)和所述注意力模块(attention-block)，用于输出目标的每个像素所属的类别(背景和前景)。

所述特征融合模块的操作，包括分别对高层信息和低层信息进行处理后融合；

对所述高层信息的处理包括：

步骤a.将高层信息60*80*128的特征图输入到所述注意力模块，经过所述上采样模块得到分支branch_1；

步骤b.将高层信息60*80*128的特征图和分支branch_1进行点乘得到分支branch_2；

步骤c.将高层信息60*80*128的特征图经过所述下采样模块得到分支Down_1，该分支Down_1经过下采样引出下采样分支Down_2，分支Down_1和分支Down_2进行点乘求和，求和结果和分支branch_2进行点乘求和得到分支branch_3。

第二，对低层信息120*160*64的特征图经过所述注意力模块和所述分支branch_3进行点乘求和，求和结果进行所述上采样模块得到分割结果。

本实施例中，模型学习的过程，实质是算法对目标函数的优化过程，特别是在分类或者回归任务中，便是使用损失函数(Loss Function)作为其目标函数，又称为代价函数(Cost Function)，通过优化目标函数，让预测值结果不断逼近真实值。

模型总体目标函数为：

Loss＝L_cls+F_seg

分类网络损失函数为的交叉熵损失函数，其公式为：

其中，p_i为样本标签，q_i为预测输出；

分割模型损失函数公式如下：

其中，y′为预测值，α和γ为超参数。

对目标函数优化训练后得到的模型，需要对该模型检测效果进行检测性能评价。只有达到规定下的检测性能，该模型才具备检测能力，因此，分别对两个输出分支设计模型的评价指标。

在分类输出中，首先对输出的预测结果和真实标签进行统计，建立混淆矩阵(如图3所示)，然后对模型的分类预测结果和真实标签进行精准率和召回率计算，精准率计算公式如下：

召回率计算公式如下：

如图4所示，当mIoU接近1时候，预测值越逼近真实值。

经过性能评价后的检测模型，其图像分割分支经过解码器模块(SegmentationDecoder)得到的掩码结果预测值(如图5所示)，对该掩码结果进行连通性分析，过滤低于阈值的噪声掩码区域，获取目标掩码的最小外接矩形(如图6所示)。

由于掩码的外接矩形和像素数量是基于图像像素坐标系，因此，需要通过相机参数转换为空间世界坐标系，获得真实目标尺寸，模型分割结果以及矩形坐标通过相机的内外参R和映射T到实际工作的世界坐标系(如图7所示)。

图像像素坐标到世界坐标的转换公式如下：

其中，f为相机焦距，R和T为相机内外参，由张正友标定法获得，为图像像素原点；由实际工作台距离进行调节。

综上，保存一个在训练集和测试集中评价指标都表现较好的模型，将训练好的模型部署到现场，此时该模型f1 score和mIoU分别有99.95％和97.5％以上，且不存在过拟合现象。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于不规则物体的检测和分类方法，其特征在于：包括

步骤(1)海产品采集，并构建海产品数据集；

步骤(5)对步骤(4)中得经过性能评价后的检测模型的输出进行区域连通性分析，获得目标的尺寸和最小外接矩形；

2.根据权利要求1所述一种基于不规则物体的检测和分类方法，其特征在于：所述步骤(1)海产品采集，并构建海产品数据集；具体为：通过RGB面阵相机对工业生产线上的海产品采集多种位置、类型的图片，构建海产品数据集。

3.根据权利要求1所述一种基于不规则物体的检测和分类方法，其特征在于：步骤(2)中所述数据增广，包括：颜色变换、随机翻转、随机裁剪和添加随机噪声。

4.根据权利要求1所述一种基于不规则物体的检测和分类方法，其特征在于：步骤(2)中所述海产品分类分割模型，包括：特征提取网络层、分类网络层和分割解码网络层；

所述海产品分类分割模型的训练，具体为：

5.根据权利要求4所述一种基于不规则物体的检测和分类方法，其特征在于：所述注意力模块是一种轻量的注意力模块，包括可以在通道和空间维度进行注意的通道注意力模块和空间注意力模块。

6.根据权利要求4所述一种基于不规则物体的检测和分类方法，其特征在于：所述特征融合模块的操作，包括分别对高层信息和低层信息进行处理后融合；

对所述高层信息的处理包括：

7.根据权利要求1所述一种基于不规则物体的检测和分类方法，其特征在于：所述步骤(3)具体为：

模型总体目标函数为：

Loss＝L_cls+F_seg

分类网络损失函数为的交叉熵损失函数，其公式为：

其中，p_i为样本标签，q_i为预测输出；

分割模型损失函数公式如下：

其中，y′为预测值，α和γ为超参数。

8.根据权利要求1所述一种基于不规则物体的检测和分类方法，其特征在于：步骤(4)中所述设计模型的评价指标，具体为：

召回率计算公式如下：

当mIoU接近1时候，预测值越逼近真实值。