CN114219957A - 一种基于Resnet和随机森林融合的鱼类分类方法 - Google Patents

一种基于Resnet和随机森林融合的鱼类分类方法 Download PDF

Info

Publication number
CN114219957A
CN114219957A CN202111295872.1A CN202111295872A CN114219957A CN 114219957 A CN114219957 A CN 114219957A CN 202111295872 A CN202111295872 A CN 202111295872A CN 114219957 A CN114219957 A CN 114219957A
Authority
CN
China
Prior art keywords
image
fish
size
feature
random forest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111295872.1A
Other languages
English (en)
Inventor
陈露露
臧兆祥
黄天星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN202111295872.1A priority Critical patent/CN114219957A/zh
Publication of CN114219957A publication Critical patent/CN114219957A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

一种基于Resnet和随机森林融合的鱼类分类方法,它包括以下步骤:1.进行数据集的采集、选择,采集若干类海洋鱼类作为初始数据集;2.进行数据集预处理;3.进行数据集的增强;4.进行特征提取网络的构造和图像特征提取,提取出若干类鱼的特征信息;5.进行随机森林的构造,将若干类鱼的特征信息放入随机森林分类器中进行训练;6.构造特征提取网络和随机森林鱼类分类模型;采用所构造的鱼类分类模型进行鱼类的分类。本发明能够在特征信息充分提取的前提下,保证鱼类分类的准确率。

Description

一种基于Resnet和随机森林融合的鱼类分类方法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于Resnet和随机森林融合的鱼类分类方法。
背景技术
在渔业和海洋鱼类研究中,鱼类分类对鱼类食品加工和鱼类资源保护有重要的作用。海洋鱼类种类繁多,且颜色相近,外形相似,这都加重了鱼类分类的难度。传统的鱼类分类方法大多为手动提取鱼类特征信息,根据鱼类的轮廓、颜色、纹理等表层信息进行特征提取,这样的方式具有很大的盲目性且无法对鱼类图像的深层信息进行提取。
近年来,也有利用神经网络模型自动提取特征信息进行分类,大部分使用国外公开的数据集,一些数据集采集年限较久且数据集图像清晰度不高,并且组成数据集的大多数鱼类都在国外海域采集,不太符合我国周边海域鱼类种类的实际分布情况。
因此,提出一种基于Resnet和随机森林相结合的海洋鱼类分类方法,并使用从海域采集的自建数据集,使用神经网络多个卷积层的前几层提取鱼类图像的表层信息,再使用后几层提取图像的深层信息,最后将提取的特征用随机森林进行分类。
发明内容
本发明的目的是为了解决现有的对鱼类图像进行提取、处理所存在的手工提取特征困难、噪声环境下分类准确低的技术问题。
一种基于Resnet和随机森林融合的鱼类分类方法,它包括以下步骤:
1.进行数据集的采集、选择,采集若干类海洋鱼类作为初始数据集;
2.进行数据集预处理;
3.进行数据集的增强;
4.进行特征提取网络的构造和图像特征提取,提取出若干类鱼的特征信息;
5.进行随机森林的构造,将若干类鱼的特征信息放入随机森林分类器中进行训练;
6.构造特征提取网络和随机森林鱼类分类模型;
采用所构造的鱼类分类模型进行鱼类的分类。
在步骤1中,收集拍摄海洋鱼类图片,做好鱼类种类标签和数量的对应整理。
在步骤2中,包括以下步骤:
1)使用预训练的多类别目标检测网络模型、使用网上公开的鱼类数据集进行鱼类目标检测训练;
2)进行鱼类图片的目标定位,保留少量的背景信息,裁剪出只有鱼类目标的矩形区域。
在步骤3中,包括以下步骤:
1)进行图像翻转:对鱼类图像进行水平翻转或者是垂直翻转;
2)进行图像旋转:将鱼类图像旋转一定角度;
3)进行图像平移:将鱼类图像沿水平方向平移或者竖直方向平移;
4)进行对比度变换:改变鱼类图像的S和V亮度分量;
5)噪声扰动:对鱼类图像进行椒盐噪声或者高斯噪声;
通过以上步骤,扩展每类鱼的图像的数量,并随机打散划分成若干张鱼类训练集和若干张鱼类验证集。
在步骤4中,包括以下步骤:
1)将步骤3获得的鱼类图片输入Resnet网络中,输入图像为多通道,大小为H×W,经过一个卷积核为F,卷积核个数为K,步长为S,在使用CNN处理图像信息时,输入图像中的大部分边缘像素只被卷积核操作一次,而图像中间的像素会被多次扫描;这在一定程度上降低了边界信息的参考程度;另一方面,在使用零填充后,新边界对实际处理的某个部分有影响;在某种程度上,这个问题是可以解决的;同时,可以对不同尺寸的输入图像进行补齐,使其大小一致;设输入尺寸为(H,W),后置尺寸为(FH,FW),输出尺寸为(OPH,OPW),填充长度为P,步幅为S,则输出尺寸公式如下零填充大小为P的卷积操作,输出的大小为H1×W1×K计算公式如式(1)、式(2)所示:
Figure BDA0003336558680000021
Figure BDA0003336558680000022
2)将步骤1)得出的结果经过Batch Normalization层,能够加速网络收敛和控制过拟合,在BN层中,均值:μ,方差:δ,偏移:β,可学习参数:γ,一个较小数(防止分母为0):∈,输入为X,输出为Y,计算公式如式(3)、式(4)所示:
Figure BDA0003336558680000023
Y=γX1+β (4)
3)再经过修正线性单元ReLU激活函数,偏置为:b,权重为:W,转置矩阵为T,输入为X,输出为Y,计算公式如式(5)所示:
Y=max(0,WT×X+b) (5)
4)再经过最大池化层MAXPOOL,得出第一阶段的特征图;
5)将步骤4)的输出特征图输入到第二阶段,第二阶段由3个bottleneck组成,第1个bottleneck将图像通道增加4倍,第2个和第3个bottleneck保持通道和图像大小不变,得到特征图;
6)将步骤5)的输出特征图输入到第三阶段,第三阶段由4个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2个、第3个和第4个bottleneck保持通道和图像大小不变,得到特征图;
7)将步骤6)的输出特征图输入到第四阶段,第四阶段由6个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2、3、4、5、6个bottleneck保持通道和图像大小不变,得到特征图;
8)将步骤7)的输出特征图输入到第五阶段,第五阶段由3个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2个和第3个bottleneck保持通道和图像大小不变,得到特征图;
9)将步骤8)得到的特征图经过输出大小为1×1的平均池化层,减小计算的参数量,防止过拟合,再经过展平操作,得出维度为D的图像特征向量;
10)Resnet网络选用NLLLoss损失函数,在NLLLoss损失函数中,输入为x,目标为y,权重为w,批次大小为N(从n=1开始),输出为l(x,y),默认还原为“mean”,它的计算公式如式(6)所示:
Figure BDA0003336558680000031
11)网络权重的更新,预测结果和实际结果的计算损失进行网络节点的更新;
12)获取训练集的特征集,将数据集经过上述步骤1)至11)更新之后的特征提取网络,得出大小为N,长度为D的图像特征集。
在步骤5中,具体包括以下步骤:
1)进行特征样本集的选择,使用步骤4中获取的图像特征集,每轮从图像特征集中通过Bootstraping(有放回抽样)的方式抽取N个样例,得到一个大小为N的样本子集,用来训练一个决策树,共进行X轮的抽取,一共生成X个决策树;
2)进行决策树的生成,图像特征集中每张图像的特征向量为D维,在每一轮生成决策树的过程中,从D个特征中随机选择其中的若干个特征组成一个新的特征子集,通过使用新的特征子集来生成决策树,在生成决策树的过程中,由于这X个决策树在训练集的选择和特征的选择上都是随机的,因此各个决策树之间是相互独立的,在决策树节点的特征选择使用“gini”量化评估标准,表示在样本集合中一个随机选中的样本被分错的概率,“gini”指数越小表示集和被选中的样本被分错的概率越小,即集合的纯度越高,分类类别数为K(从k=1开始),样本属于第k类的概率为pk,概率分布按照式(7)计算:
Figure BDA0003336558680000041
3)进行决策树的组合,由于生成的X个决策树之间是相互独立的,每个决策树的重要性是相等的,因而在将它们进行组合时,无需考虑他们的权值,或者可以认为他们具有相同的权值,对于分类问题,最终的分类结果使用所有的决策树投票来确定最终分类结果。
在步骤6中,将步骤4构造的Resnet特征提取器和步骤5构造的随机森林分类器进行整合,构造出Resnet+随机森林的鱼类分类模型。
与现有技术相比,本发明具有如下技术效果:
本发明使用YOLOv3目标检测网络对鱼类图像进行定位,裁剪掉图像多余背景信息,能够减小对后续鱼类分类精确度的影响;基于残差单元的Resnet50卷积神经网络能够自动提取出鱼类图形的深层特征;基于决策树的随机森林分类器能够有效避免噪声的干扰,对提取的鱼类特征进行精确分类。使用Resnet50和随机森林融合的模型,能够在特征信息充分提取的前提下,保证鱼类分类的准确率。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1是本发明的流程图;
图2为实施例中Resnet50残差单元的结构示意图;
图3为实施例中Resnet50特征提取器的结构示意图;
图4为实施例中随机森林分类器的结构示意图;
具体实施方式
实施例:一种基于Resnet和随机森林融合的鱼类分类方法,在具体实施例中以Resnet50为例,具体的实施方法流程图如图1所示,包括以下步骤:
1.采集40类海洋鱼类作为初始数据集。
2.鱼类数据集预处理。
2.1使用鱼类数据集对预训练的YOLOv3目标检测网络进行鱼类目标检测训练。
2.2使用经过训练的YOLOv3网络对初始数据集进行鱼类检测定位,并裁剪出包含鱼类目标区域的图像数据集。
3.数据集增强。
3.1使用多种数据增强方法对YOLOv3处理后的鱼类数据集进行增强。
3.2对增强后的数据集随机划分训练集8000张和验证集2000张。
4.构造Resnet50特征提取网络。特征提取网络的结构如图3所示。提取出40类鱼的特征信息。
5.构造随机森林分类器。分类器的结构如图4所示。将40类鱼的特征信息放入随机森林分类器中进行训练。
6.得出Resnet50和随机森林融合的鱼类分类模型。
其中,步骤1具体包括:
1.1人工手动收集拍摄海洋鱼类图片,每一张图片里只包含一条鱼;
1.2初始采集40种海洋鱼类,并做好鱼类种类标签和数量的对应整理;
步骤2具体包括:
2.1使用预训练的多类别目标检测网络YOLOv3模型,再使用网上公开的大型鱼类数据集进行鱼类目标检测训练。
2.2将步骤1获取的鱼类数据集经过YOLOv3网络进行鱼类图片的目标定位,保留少量的背景信息,裁剪出只有鱼类目标的矩形区域。
步骤3具体包括:
3.1图像翻转:对鱼类图像进行水平翻转或者是垂直翻转。
3.2图像旋转:将鱼类图像旋转90度、-90度或180度。
3.3图像平移:将鱼类图像沿水平方向平移或者竖直方向平移。
3.4对比度变换:改变鱼类图像的S和V亮度分量。
3.5噪声扰动:对鱼类图像进行椒盐噪声或者高斯噪声。
3.6经过上述的五个步骤,每类鱼的数量扩展为250张,四十类鱼图像共10000张,随机打散划分成8000张鱼类训练集和2000张鱼类验证集。
步骤4具体包括:
4.1将步骤3获得的鱼类图片输入Resnet50网络中,残差单元结构如图2所示,Resnet50网络结构如图3所示,输入图像为3通道,大小为224×224,经过一个卷积核为F=7×7,卷积核个数为K=64,步长为S=2,在使用CNN处理图像信息时,输入图像中的大部分边缘像素只被卷积核操作一次,而图像中间的像素会被多次扫描。这在一定程度上降低了边界信息的参考程度。另一方面,在使用零填充后,新边界对实际处理的某个部分有影响。在某种程度上,这个问题是可以解决的。同时,可以对不同尺寸的输入图像进行补齐,使其大小一致。设输入尺寸为(H,W),后置尺寸为(FH,FW),输出尺寸为(OPH,OPW),填充长度为P,步幅为S,则输出尺寸公式如下零填充大小为P的卷积操作,输出的大小为H1×W1×K计算公式如式(1)、式(2)所示。
Figure BDA0003336558680000061
Figure BDA0003336558680000062
4.2将步骤4.1得出的结果经过Batch Normalization层,能够加速网络收敛和控制过拟合,在BN层中,均值:μ,方差:δ,偏移:β,可学习参数:γ,一个较小数(防止分母为0):∈,输入为X,输出为Y,计算公式如式(3)、式(4)所示。
Figure BDA0003336558680000063
Y=γX1+β (4)
4.3再经过修正线性单元ReLU激活函数,偏置为:b,权重为:W,转置矩阵为T,输入为X,输出为Y,计算公式如式(5)所示。
Y=max(0,WT×X+b) (5)
4.4再经过最大池化层MAXPOOL,得出第一阶段的特征图大小为64×56×56。
4.5将步骤4.4的输出特征图输入到第二阶段,第二阶段由3个bottleneck组成,第1个bottleneck将图像通道增加4倍,第2个和第3个bottleneck保持通道和图像大小不变,得到256×56×56的特征图。
4.6将步骤4.5的输出特征图输入到第三阶段,第三阶段由4个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2个、第3个和第4个bottleneck保持通道和图像大小不变,得到512×28×28的特征图。
4.7将步骤4.6的输出特征图输入到第四阶段,第四阶段由6个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2、3、4、5、6个bottleneck保持通道和图像大小不变,得到1024×14×14的特征图。
4.8将步骤4.7的输出特征图输入到第五阶段,第五阶段由3个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2个和第3个bottleneck保持通道和图像大小不变,得到2048×7×7的特征图。
4.9将步骤4.8得到的特征图经过输出大小为1×1的平均池化层,减小计算的参数量,防止过拟合。再经过展平操作,得出维度为2048的图像特征向量。
4.10Resnet50网络选用NLLLoss损失函数。在NLLLoss损失函数中,输入为x,目标为y,权重为w,批次大小为N(从n=1开始),输出为l(x,y),默认还原为“mean”,它的计算公式如式(6)所示。
Figure BDA0003336558680000071
4.11网络权重的更新。预测结果和实际结果的计算损失进行网络节点的更新。
4.12获取训练集的特征集。将数据集经过上述步骤4.1至4.11更新之后的特征提取网络,得出大小为10000,长度为2048的图像特征集。
步骤5具体包括:
5.1特征样本集的选择。步骤4.12获取的图像特征集总共有10000个样例,每轮从图像特征集中通过Bootstraping(有放回抽样)的方式抽取10000个样例,得到一个大小为10000的样本子集,用来训练一个决策树。共进行90轮的抽取,一共生成90个决策树。
5.2决策树的生成。图像特征集中每张图像的特征向量为2048维,在每一轮生成决策树的过程中,从2048个特征中随机选择其中的50个特征组成一个新的特征子集,通过使用新的特征子集来生成决策树。在生成决策树的过程中,由于这90个决策树在训练集的选择和特征的选择上都是随机的,因此各个决策树之间是相互独立的。在决策树节点的特征选择使用“gini”量化评估标准,表示在样本集合中一个随机选中的样本被分错的概率,“gini”指数越小表示集合被选中的样本被分错的概率越小,即集合的纯度越高,分类类别数为K(从k=1开始),样本属于第k类的概率为pk,概率分布按照式(7)计算。
Figure BDA0003336558680000081
5.3决策树的组合。由于生成的90个决策树之间是相互独立的,每个决策树的重要性是相等的,因而在将它们进行组合时,无需考虑他们的权值,或者可以认为他们具有相同的权值。对于分类问题,最终的分类结果使用所有的决策树投票来确定最终分类结果。
步骤6具体包括:
6.1将步骤4构造的Resnet50特征提取器和步骤5构造的随机森林分类器进行整合,构造出Resnet50+随机森林的鱼类分类模型。
本发明提出一种基于Resnet和随机森林相结合的海洋鱼类分类方法,并使用从海域采集的自建数据集,使用神经网络多个卷积层的前几层提取鱼类图像的表层信息,再使用后几层提取图像的深层信息,最后将提取的特征用随机森林进行分类;能够在特征信息充分提取的前提下,保证鱼类分类的准确率。

Claims (7)

1.一种基于Resnet和随机森林融合的鱼类分类方法,其特征在于,它包括以下步骤:
1.进行数据集的采集、选择,采集若干类海洋鱼类作为初始数据集;
2.进行数据集预处理;
3.进行数据集的增强;
4.进行特征提取网络的构造和图像特征提取,提取出若干类鱼的特征信息;
5.进行随机森林的构造,将若干类鱼的特征信息放入随机森林分类器中进行训练;
6.构造特征提取网络和随机森林鱼类分类模型;
采用所构造的鱼类分类模型进行鱼类的分类。
2.根据权利要求1所述的方法,其特征在于,在步骤1中,收集拍摄海洋鱼类图片,做好鱼类种类标签和数量的对应整理。
3.根据权利要求2所述的方法,其特征在于,在步骤2中,包括以下步骤:
1)使用预训练的多类别目标检测网络模型、使用网上公开的鱼类数据集进行鱼类目标检测训练;
2)进行鱼类图片的目标定位,保留少量的背景信息,裁剪出只有鱼类目标的矩形区域。
4.根据权利要求1所述的方法,其特征在于,在步骤3中,包括以下步骤:
1)进行图像翻转:对鱼类图像进行水平翻转或者是垂直翻转;
2)进行图像旋转:将鱼类图像旋转一定角度;
3)进行图像平移:将鱼类图像沿水平方向平移或者竖直方向平移;
4)进行对比度变换:改变鱼类图像的S和V亮度分量;
5)噪声扰动:对鱼类图像进行椒盐噪声或者高斯噪声;
通过以上步骤,扩展每类鱼的图像的数量,并随机打散划分成若干张鱼类训练集和若干张鱼类验证集。
5.根据权利要求1所述的方法,其特征在于,在步骤4中,包括以下步骤:
1)将步骤3获得的鱼类图片输入Resnet网络中,输入图像为多通道,大小为H×W,经过一个卷积核为F,卷积核个数为K,步长为S,在使用CNN处理图像信息时,输入图像中的大部分边缘像素只被卷积核操作一次,而图像中间的像素会被多次扫描;这在一定程度上降低了边界信息的参考程度;另一方面,在使用零填充后,新边界对实际处理的某个部分有影响;在某种程度上,这个问题是可以解决的;同时,可以对不同尺寸的输入图像进行补齐,使其大小一致;设输入尺寸为(H,W),后置尺寸为(FH,FW),输出尺寸为(OPH,OPW),填充长度为P,步幅为S,则输出尺寸公式如下零填充大小为P的卷积操作,输出的大小为H1×W1×K计算公式如式(1)、式(2)所示:
Figure FDA0003336558670000021
Figure FDA0003336558670000022
2)将步骤1)得出的结果经过Batch Normalization层,能够加速网络收敛和控制过拟合,在BN层中,均值:μ,方差:δ,偏移:β,可学习参数:γ,一个较小数(防止分母为0):∈,输入为X,输出为Y,计算公式如式(3)、式(4)所示:
Figure FDA0003336558670000023
Y=γX1+β (4)
3)再经过修正线性单元ReLU激活函数,偏置为:b,权重为:W,转置矩阵为T,输入为X,输出为Y,计算公式如式(5)所示:
Y=max(0,WT×X+b) (5)
4)再经过最大池化层MAXPOOL,得出第一阶段的特征图;
5)将步骤4)的输出特征图输入到第二阶段,第二阶段由3个bottleneck组成,第1个bottleneck将图像通道增加4倍,第2个和第3个bottleneck保持通道和图像大小不变,得到特征图;
6)将步骤5)的输出特征图输入到第三阶段,第三阶段由4个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2个、第3个和第4个bottleneck保持通道和图像大小不变,得到特征图;
7)将步骤6)的输出特征图输入到第四阶段,第四阶段由6个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2、3、4、5、6个bottleneck保持通道和图像大小不变,得到特征图;
8)将步骤7)的输出特征图输入到第五阶段,第五阶段由3个bottleneck组成,第1个bottleneck将图像通道增加2倍,图像尺寸减半,第2个和第3个bottleneck保持通道和图像大小不变,得到特征图;
9)将步骤8)得到的特征图经过输出大小为1×1的平均池化层,减小计算的参数量,防止过拟合,再经过展平操作,得出维度为D的图像特征向量;
10)Resnet网络选用NLLLoss损失函数,在NLLLoss损失函数中,输入为x,目标为y,权重为w,批次大小为N(从n=1开始),输出为l(x,y),默认还原为“mean”,它的计算公式如式(6)所示:
Figure FDA0003336558670000031
11)网络权重的更新,预测结果和实际结果的计算损失进行网络节点的更新;
12)获取训练集的特征集,将数据集经过上述步骤1)至11)更新之后的特征提取网络,得出大小为N,长度为D的图像特征集。
6.根据权利要求5所述的方法,其特征在于,在步骤5中,具体包括以下步骤:
1)进行特征样本集的选择,使用步骤4中获取的图像特征集,每轮从图像特征集中通过Bootstraping(有放回抽样)的方式抽取N个样例,得到一个大小为N的样本子集,用来训练一个决策树,共进行X轮的抽取,一共生成X个决策树;
2)进行决策树的生成,图像特征集中每张图像的特征向量为D维,在每一轮生成决策树的过程中,从D个特征中随机选择其中的若干个特征组成一个新的特征子集,通过使用新的特征子集来生成决策树,在生成决策树的过程中,由于这X个决策树在训练集的选择和特征的选择上都是随机的,因此各个决策树之间是相互独立的,在决策树节点的特征选择使用“gini”量化评估标准,表示在样本集合中一个随机选中的样本被分错的概率,“gini”指数越小表示集和被选中的样本被分错的概率越小,即集合的纯度越高,分类类别数为K(从k=1开始),样本属于第k类的概率为pk,概率分布按照式(7)计算:
Figure FDA0003336558670000032
3)进行决策树的组合,由于生成的X个决策树之间是相互独立的,每个决策树的重要性是相等的,因而在将它们进行组合时,无需考虑他们的权值,或者可以认为他们具有相同的权值,对于分类问题,最终的分类结果使用所有的决策树投票来确定最终分类结果。
7.根据权利要求1所述的方法,其特征在于,在步骤6中,将步骤4构造的Resnet特征提取器和步骤5构造的随机森林分类器进行整合,构造出Resnet+随机森林的鱼类分类模型。
CN202111295872.1A 2021-11-03 2021-11-03 一种基于Resnet和随机森林融合的鱼类分类方法 Pending CN114219957A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111295872.1A CN114219957A (zh) 2021-11-03 2021-11-03 一种基于Resnet和随机森林融合的鱼类分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111295872.1A CN114219957A (zh) 2021-11-03 2021-11-03 一种基于Resnet和随机森林融合的鱼类分类方法

Publications (1)

Publication Number Publication Date
CN114219957A true CN114219957A (zh) 2022-03-22

Family

ID=80696506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111295872.1A Pending CN114219957A (zh) 2021-11-03 2021-11-03 一种基于Resnet和随机森林融合的鱼类分类方法

Country Status (1)

Country Link
CN (1) CN114219957A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117058106A (zh) * 2023-08-16 2023-11-14 广东理工学院 基于随机森林的柔性玻璃平面度及表面缺陷的测量方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117058106A (zh) * 2023-08-16 2023-11-14 广东理工学院 基于随机森林的柔性玻璃平面度及表面缺陷的测量方法

Similar Documents

Publication Publication Date Title
Jaware et al. Crop disease detection using image segmentation
CN111400536B (zh) 一种基于轻量化深度神经网络的低成本番茄叶片病害识别方法
CN111179216B (zh) 一种基于图像处理与卷积神经网络的作物病害识别方法
CN106845450A (zh) 基于近红外成像与深度学习的黑暗环境人脸识别方法
CN107679509A (zh) 一种小环藻识别方法及装置
CN110032925A (zh) 一种基于改进胶囊网络与算法的手势图像分割与识别方法
Aydogdu et al. Comparison of three different CNN architectures for age classification
CN110717451B (zh) 一种基于深度学习的药用植物叶部病害图像识别方法
CN109359661A (zh) 一种基于卷积神经网络的Sentinel-1雷达图像分类方法
CN110689039A (zh) 一种基于四通道卷积神经网络的树干纹理识别方法
CN113887410A (zh) 一种基于深度学习的多类别食材识别系统及方法
Liu et al. Deep learning based research on quality classification of shiitake mushrooms
CN112926652A (zh) 一种基于深度学习的鱼类细粒度图像识别方法
CN109977899A (zh) 一种物品识别的训练、推理以及增加新种类的方法和系统
CN114219957A (zh) 一种基于Resnet和随机森林融合的鱼类分类方法
Borman et al. Classification of Medicinal Wild Plants Using Radial Basis Function Neural Network with Least Mean Square
CN111881803A (zh) 一种基于改进YOLOv3的畜脸识别方法
CN110853052A (zh) 一种基于深度学习的土家织锦图案图元的分割方法
De Silva et al. Plant disease detection using deep learning on natural environment images
CN109685146A (zh) 一种基于双卷积和主题模型的场景识别方法
Yang et al. Intelligent collection of rice disease images based on convolutional neural network and feature matching
CN113469129A (zh) 一种基于卷积神经网络的小麦杂质图像检测方法
CN113808055B (zh) 基于混合膨胀卷积的植物识别方法、装置及存储介质
Chen et al. Application of Machine Vision and Convolutional Neural Networks in Distinguishing of Tobacco Leaf Maturity by Mobile Devices
CN110489584A (zh) 基于密集连接的MobileNets模型的图像分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination