CN113449756A - 一种基于改进的DenseNet的多尺度图像识别方法和装置 - Google Patents
一种基于改进的DenseNet的多尺度图像识别方法和装置 Download PDFInfo
- Publication number
- CN113449756A CN113449756A CN202010225286.9A CN202010225286A CN113449756A CN 113449756 A CN113449756 A CN 113449756A CN 202010225286 A CN202010225286 A CN 202010225286A CN 113449756 A CN113449756 A CN 113449756A
- Authority
- CN
- China
- Prior art keywords
- image
- denseblock
- densenet
- improved
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种基于改进的DenseNet的多尺度图像识别方法和装置,该方法包括:构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;训练所述改进的DenseNet多尺度网络;将待识别的图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。本申请的基于改进的DenseNet的多尺度图像识别方法和装置能够从不同角度增强对图像的理解,从而实现多尺度图像识别,同时增强了识别的精度和鲁棒性。
Description
技术领域
本申请涉及图像识别技术,特别涉及基于改进的DenseNet的多尺度图像识别方法和装置。
背景技术
随着科学技术的发展,图像识别的技术也越来越成熟,从最初的LeNet-5,AlexNet,VGGNet到GoogleNet,ResNet,各种网络的构造,创新和发展,使得图像识别这门技术的应用面越来越广。
DenseNet网络是2017年提出的一种网络。图1示出了现有技术的DensetNet网络。图2示出了现有技术的DensetNet网络中的DenseBlock的结构。DenseNet网络从特征出发,通过对特征的极致利用达到更好的效果,简单来说,就是每一层的输入来自前面所有层的输出。然后最终的整体框架是把DenseNet分成3个denseblock,为了将每个denseblock内的featuremap的尺寸统一。DenseNet有着以下几点的优势:(1)减轻了梯度消失;(2)加强了feature的传递;(3)更有效地利用了feature;(4)一定程度上减少了参数数量。但是,现有的DenseNet网络无法很好地适应多尺度图像识别。
发明内容
本申请的目的在于,针对上述存在的问题,提供一种基于改进的DenseNet的多尺度图像识别方法和装置以及一种基于目标检测和改进的DenseNet的多尺度图像识别方法和装置,其能够从不同角度增强对图像的理解,从而实现多尺度图像识别,同时增强了识别的精度和鲁棒性。
本申请提供一种基于改进的DenseNet的多尺度图像识别方法,包括:构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;训练所述改进的DenseNet多尺度网络;将待识别的图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
进一步地,所述三个DenseBlock为第一DenseBlock、第二DenseBlock和第三DenseBlock,第一DenseBlock经过第一纵向过渡层后的输出与第三DenseBlock经过第三纵向过渡层后的第三最终输出拼接,从而得到第一最终输出;第二DenseBlock经过第二纵向过渡层后的输出与所述第三最终输出拼接,从而得到第二最终输出。
进一步地,所述第一最终输出、所述第二最终输出和所述第三最终输出拼接。
进一步地,所述第一最终输出、所述第二最终输出和所述第三最终输出拼接后经过BN层、ReLU层和池化层,再经过Flatten层和全拼接层,得到所述图像属于每个类别的概率。
进一步地,过渡层包括BN层、ReLU层、1x1卷积层和2x2平均池化层。
进一步地,在每个DenseBlock中,每一层的输入来自前面所有层的输出。
本申请还提供一种基于目标检测和改进的DenseNet的多尺度图像识别方法,包括:获取图像数据;对图像进行预处理并获取候选框;对处理后的图像进行目标检测,得到目标区域图像;使用上文所述的基于改进的DenseNet的多尺度图像识别方法来识别所述目标区域图像,得到所述目标区域图像中的物体的类别。
进一步地,对处理后的图像进行目标检测,得到目标区域图像包括将处理后的图像输入至FastR-CNN,得到目标区域框,并将目标区域框内的图像作为所述目标区域图像。
本申请还一种基于改进的DenseNet的多尺度图像识别装置,包括:存储器;以及处理器,所述处理器被配置为执行:构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;训练所述改进的DenseNet多尺度网络;将待识别的图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
本申请还提供一种基于目标检测和改进的DenseNet的多尺度图像识别装置,包括:存储器;以及处理器,所述处理器被配置为执行:获取图像数据;对图像进行预处理并获取候选框;对处理后的图像进行目标检测,得到目标区域图像;构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;训练所述改进的DenseNet多尺度网络;将所述目标区域图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
根据本申请的基于改进的DenseNet的多尺度图像识别方法和装置以及基于目标检测和改进的DenseNet的多尺度图像识别方法和装置能够从不同角度增强对图像的理解,从而实现多尺度图像识别,同时增强了识别的精度和鲁棒性。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了现有技术的DensetNet网络。
图2示出了现有技术的DensetNet网络中的DenseBlock的结构。
图3示出了根据本申请的示例性实施方案的DensetNet多尺度网络。
图4示出了根据本申请的示例性实施方案的基于改进的DenseNet的多尺度图像识别方法的流程图。
图5示出了根据本申请的示例性实施方案的基于目标检测和改进的DenseNet的多尺度图像识别方法的流程图。
图6示出了FastR-CNN网络。
图7示出了根据本申请的示例性实施方案的基于目标检测和改进的DenseNet的多尺度图像识别方法中对改进的DenseNet多尺度网络进行训练的流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本申请及其应用或使用的任何限制。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图3示出了根据本申请的示例性实施方案的DensetNet多尺度网络。
图4示出了根据本申请的示例性实施方案的基于改进的DenseNet的多尺度图像识别方法的流程图。下面参考图3和图4详细描述本申请的示例性实施方案的基于改进的DenseNet的多尺度图像识别方法。
根据本申请的实施方案,提供一种基于改进的DenseNet的多尺度图像识别方法,包括:
S110:构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;
S120:训练所述改进的DenseNet多尺度网络;
S130:将待识别的图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
在步骤S110中,构建改进的DenseNet多尺度网络。本申请的改进的DenseNet多尺度网络对现有的DenseNet模型进行了改进,其具有以下特点:将每一个DenseBlock的输出结果一方面通过横向TransitionLayer(过渡层)输入给下一个DenseBlock,另一方面将输出结果通过纵向TransitionLayer直接传递给最后一层,不同层级和不同空间位置的神经元扮演的角色并不相同,跨层的信息交互可以从不同角度增强对图像的理解。
具体地,如图3所示,本申请所构建的改进的DenseNet多尺度网络包括三个DenseBlock,分别为DenseBlock1(第一DenseBlock),DenseBlock2(第二DenseBlock)和DenseBlock3(第三DenseBlock)。每个DenseBlock与现有的DenseNet中的DenseBlock的结构相同,如图2所示。在每个DenseBlock中,每一层的输入来自前面所有层的输出,从而能够实现特征重用。
本申请的改进的DenseNet多尺度网络在工作时,图像首先输入到第一层卷积层和池化层,得到局部特征图。卷积层主要用于提取局部特征。池化层的作用主要是保留主要的特征同时减少参数,起到降维作用,减少计算量。
将经过卷积层操作得到的局部特征,输入到设计好的DenseBlock模块中,实现特征重用。在每个DenseBlock中,特征图之间通过Bottleneck层来进行相应的变化,同时该层可以减少计算量。Bottleneck的结构为:BN+ReLU+1x1 Conv+BN+ReLU+3x3 Conv,即批归一化BN,激活函数ReLU以及不同卷积核大小的卷积层的相互组合。为了保证DenseBlock网络中最大的信息流通,让每层都与该层之前的所有层相连。即每层的输入,是前面所有层的输出的拼接。在一个DenseBlock中,每层的输出和输入的特征图大小都是不变的,而每层的输入的通道数都是增加的,这也反映出每层的输入是前面所有层的拼接。这个拼接可以采取简单的通道数相加进行操作。
在一个DenseBlock中,特征图大小并没有发生变化,即输入DenseBlock的特征图大小和DenseBlock输出的特征图大小是相同的。因为需要对不同层的特征图进行拼接,所以需要保持相同的特征图的大小,因此在这里,相邻的DenseBlock采用一种已经设计好的层:横向TransitionLayer(过渡层)进行连接,它主要的作用是进行下采样,来增大感受野,同时降低特征图大小以及压缩模型。横向TransitionLayer的结构为:BN+ReLU+1x1 Conv+2x2AvgPooling。批归一化的作用是保证模型的非线性表达能力。激活函数的作用是增加了层与层之间的非线性关系,增强稀疏性以及减少梯度消失问题。
如图3所示,在本申请构建的改进的DenseNet多尺度网络中,信息在横向方向上的传递方式与现有的DenseNet相同,即每一个DenseBlock的输出结果通过TransitionLayer顺序传递至下一个DenseBlock,并且在DenseBlock内部得到信息复用。但本申请所构建的改进的DenseNet多尺度网络中的信息除在横向上传递之外,还在纵向上进行传递和拼接复用。事实上,如图3所示,前两个DenseBlock(DenseBlock1,DenseBlock2)的每一个都经过两个TransitionLayer,一方面经过横向过渡层(TransitionLayer1.1,TransitionLayer2.1)传递给下一个DenseBlock,另一方面经过纵向过渡层(TransitionLayer1.2(第一纵向过渡层),TransitionLayer2.2(第二纵向过渡层))后与第三DenseBlock经过经过第三纵向过渡层(TransitionLayer3)后的特征图进行拼接操作。前两个DenseBlock经过TransitionLayer1.2和TransitionLayer2.2后得到的特征图大小和第三DenseBlock经过TransitionLayer3后的特征图大小相同,这样便于后面的拼接操作。纵向过渡层主要的作用也是进行下采样,来增大感受野,同时降低特征图大小以及压缩模型。纵向TransitionLayer的结构为:BN+ReLU+1x1 Conv+2x2AvgPooling。批归一化的作用是保证模型的非线性表达能力。激活函数的作用是增加了层与层之间的非线性关系,增强稀疏性以及减少梯度消失问题。
本模型的三个DenseBlock(DenseBlock1,DenseBlock2,DenseBlock3)经过纵向过渡层(TransitionLayer1.2,TransitionLayer2.2,TransitionLayer3)得到三个输出(output1,output2,output3),这三个输出的特征图大小都是相同的。将output1与output3通过拼接操作得到新的输出,记为第一最终输出(finaloutput1),将output2与output3通过拼接操作得到新的输出,记为第二最终输出(finaloutput2),将output3直接输出,记为第三最终输出(finaloutput3)。拼接操作可以通过相应的函数(如pytorch中cat函数)直接实现。
也就是说,通过如下方式对三个DenseBlock经过纵向过渡层的输出进行交互提取其特征:第一DenseBlock经过第一纵向过渡层后的输出与第三DenseBlock经过第三纵向过渡层后的第三最终输出拼接,从而得到第一最终输出;第二DenseBlock经过第二纵向过渡层后的输出与第三最终输出拼接,从而得到第二最终输出。在这种方式中,保持最后一个也就是传统DenseNet的输出,然后将其与前面两个输出分别进行交互,得到三个最后的输出,这种方法有三个作用:
①因为DenseNet的本来效果已经非常不错,所以不需要对其进行交互,它的直接输出结果已经可以代表最终结果;
②将最后一个DenseBlock的输出与另外两个DenseBlock的输出分别进行交互,可以提取更多的特征,同时也可以对最后一个DenseBlock的信息产生一个噪声,使其结果更具有鲁棒性;
③DenseNet网络的一大优点就是减少了参数,加强了特征传递,所以摒弃所有三个输出的两两交互,只进行两次交互,减少参数,但依旧保留加强特征传递的优势。
之后将finaloutput1,finaloutput2,finaloutput3进行拼接,然后通过BN层、ReLU层和池化层,再经过Flatten层将拼接操作后的三维输出铺平为两维输出,最后经过一个全拼接层,得到图像属于每个类别的概率,选择其中最大概率,其对应的类别,即为该图像所对应的类别。拼接操作可以通过相应的函数(如pytorch中cat函数)直接实现。
参见图3,根据本申请的示例性实施方案的改进的DenseNet多尺度网络的运行流程如下:
1:输入:图像。
2:经过卷积层和池化层。
3:经过DenseBlock1(第一DenseBlock)。
4:经过TransitionLayer1.1(第一横向过渡层),传递给DenseBlock2(第二DenseBlock),同时经过TransitionLayer1.2(第一纵向过渡层),得到输出output1,并保存输出。
5:经过DenseBlock2。
6:经过TransitionLayer2.1(第二横向过渡层),传递给DenseBlock3(第三DenseBlock),同时经过TransitionLayer2.2(第二纵向过渡层),得到输出output2,并保存输出。
7:经过DenseBlock3(第三DenseBlock)。
8:经过TransitionLayer3(第三纵向过渡层),得到输出output3,并保存输出。
9:output1与output3通过拼接操作得到新的输出,记为finaloutput1(第一最终输出),将output2与output3通过拼接操作得到新的输出,记为finaloutput2(第二最终输出),将output3直接输出,记为finaloutput3(第三最终输出)。
10:将finaloutput1,finaloutput2,finaloutput3进行拼接,通过BN层、ReLU层和池化层。
11:经过Flatten层。
12:经过全拼接层进行预测。
13:输出:分类概率。
在S120中,对所构建的改进的DenseNet多尺度网络进行训练。在一个实施例中,测试数据集例如可从PASCALVOC下载,使用JPEGImages数据进行实验。对数据集进行适当的预处理后,将样本图像按照8:1:1的比例分成训练集,验证集和测试集,将训练集输入改进的DenseNet多尺度网络,采用Adam优化器,初始学习率设为0.001。将验证集输入到改进的DenseNet多尺度网络进行验证操作,对超参数进行调整,防止过拟合。将测试集输入到最后已经训练、验证好的改进的DenseNet多尺度网络,测试该模型对测试数据集的判断准确率。
在步骤S130中,将待识别的图像输入至训练好的改进的DenseNet多尺度网络,对图像中的物体的类别进行识别预测。
为了更好地运用本申请的DenseNet多尺度网络进行图像识别,可在识别之前,先对图像进行目标检测,从而定位出待识别物体在图像中的位置后再对其类别进行识别。因此,本申请在上述基于改进的DenseNet的多尺度图像识别方法的基础上,提出一种基于目标检测和改进的DenseNet的多尺度图像识别方法,包括:
S210:获取图像数据;
S220:对图像进行预处理并获取候选框;
S230:对处理后的图像进行目标检测,得到目标区域图像;
S240:使用上文所述的基于改进的DenseNet的多尺度图像识别方法来识别目标区域图像,得到所述目标区域图像中的物体的类别。
目标检测是用于识别图像中目标位置的技术,是对物体所在位置进行定位的一种技术。在步骤S230中,可使用现有技术中已知的目标检测技术来对图像进行目标检测,例如,可使用FastR-CNN模型来实现目标检测。
如图1所示,FastR-CNN的模型分成两步:(1)选取候选区域;(2)提出一个Rol层,整合整个模型,把CNN,变换层,bbox回归以及SVM分类器这几个模块整在一起,一起训练。FastR-CNN模型先将任意尺寸图片输入CNN网络,得到特征图,然后提取候选区域,找到每个候选区域对应的特征图,并在Rol层固定到相同的大小,最后将特征图输入到全拼接层得到固定大小的特征向量,再经过各自的全拼接层得到Bounding-box窗口回归向量。
在本申请中,可以直接采用已训练好的FastR-CNN进行目标检测,或者也可以将FastR-CNN与本申请构建的改进的DenseNet多尺度网络一同训练。下面给出将FastR-CNN与本申请构建的改进的DenseNet多尺度网络一同训练和测试的示例。该示例中包括以下步骤:
1:从PASCALVOC下载图像数据,使用JPEGImages数据进行实验;
2:对于每张训练图片首先以50%的概率水平翻转,然后进行selectivesearch提取候选区域,将这些候选区域与训练图片的groundtruth进行IoU计算,大于0.5的作为正样本;
3:对于所有正样本根据IoU值进行排序,每张图片取前64个区域,将这些区域的坐标保存下来,作为训练样本;
4:采用batch_size=2进行训练,即每次输入2张图片以及128个候选框进入FastR-CNN进行训练,得到(dx,dy,dw,dh)的回归坐标,然后通过Bounding-boxregression进行回归损失;
5:按最终的目标区域框对图像进行裁剪,得到要进行DenseNet多尺度网络训练的图像数据;
6:将训练好的数据按照8:1:1的比例分成训练集,验证集和测试集,将训练集输入改进的DenseNet多尺度网络,采用Adam优化器,初始学习率设为0.001;
7:将验证集输入到改进的DenseNet多尺度网络进行验证操作,对超参数进行调整,防止过拟合;
8:将测试集输入到最后已经训练,验证好的DenseNet多尺度网络,测试该模型对测试数据集的判断准确率。
根据本申请的另一实施方案,提供一种基于改进的DenseNet的多尺度图像识别装置,包括:
存储器;以及
处理器,所述处理器被配置为执行:
构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;
训练所述改进的DenseNet多尺度网络;
将待识别的图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
根据本申请的又一实施方案,提供一种基于目标检测和改进的DenseNet的多尺度图像识别装置,包括:
存储器;以及
处理器,所述处理器被配置为执行:
获取图像数据;
对图像进行预处理并获取候选框;
对处理后的图像进行目标检测,得到目标区域图像;
构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;
训练所述改进的DenseNet多尺度网络;
将所述目标区域图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
根据本申请的基于改进的DenseNet的多尺度图像识别方法和装置以及基于目标检测和改进的DenseNet的多尺度图像识别方法和装置能够从不同角度增强对图像的理解,从而实现多尺度图像识别,同时增强了识别的精度和鲁棒性。
在本申请的描述中,需要理解的是,方位词如“前、后、上、下、左、右”、“横向、竖向、垂直、水平”和“顶、底”等所指示的方位或位置关系通常是基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,在未作相反说明的情况下,这些方位词并不指示和暗示所指的装置或元件必须具有特定的方位或者以特定的方位构造和操作,因此不能理解为对本申请保护范围的限制;方位词“内、外”是指相对于各部件本身的轮廓的内外。
为了便于描述,在这里可以使用空间相对术语,如“在……之上”、“在……上方”、“在……上表面”、“上面的”等,用来描述如在图中所示的一个器件或特征与其他器件或特征的空间位置关系。应当理解的是,空间相对术语旨在包含除了器件在图中所描述的方位之外的在使用或操作中的不同方位。例如,如果附图中的器件被倒置,则描述为“在其他器件或构造上方”或“在其他器件或构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其他器件或构造之下”。因而,示例性术语“在……上方”可以包括“在……上方”和“在……下方”两种方位。该器件也可以其他不同方式定位(旋转90度或处于其他方位),并且对这里所使用的空间相对描述作出相应解释。
此外,需要说明的是,使用“第一”、“第二”等词语来限定零部件,仅仅是为了便于对相应零部件进行区别,如没有另行声明,上述词语并没有特殊含义,因此不能理解为对本申请保护范围的限制。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于改进的DenseNet的多尺度图像识别方法,其特征在于,包括:
构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;
训练所述改进的DenseNet多尺度网络;
将待识别的图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
2.根据权利要求1所述的基于改进的DenseNet的多尺度图像识别方法,其特征在于,所述三个DenseBlock为第一DenseBlock、第二DenseBlock和第三DenseBlock,第一DenseBlock经过第一纵向过渡层后的输出与第三DenseBlock经过第三纵向过渡层后的第三最终输出拼接,从而得到第一最终输出;第二DenseBlock经过第二纵向过渡层后的输出与所述第三最终输出拼接,从而得到第二最终输出。
3.根据权利要求2所述的基于改进的DenseNet的多尺度图像识别方法,其特征在于,所述第一最终输出、所述第二最终输出和所述第三最终输出拼接。
4.根据权利要求3所述的基于改进的DenseNet的多尺度图像识别方法,其特征在于,所述第一最终输出、所述第二最终输出和所述第三最终输出拼接后经过BN层、ReLU层和池化层,再经过Flatten层和全拼接层,得到所述图像属于每个类别的概率。
5.根据权利要求1所述的基于改进的DenseNet的多尺度图像识别方法,其特征在于,过渡层包括BN层、ReLU层、1x1卷积层和2x2平均池化层。
6.根据权利要求1所述的基于改进的DenseNet的多尺度图像识别方法,其特征在于,在每个DenseBlock中,每一层的输入来自前面所有层的输出。
7.一种基于目标检测和改进的DenseNet的多尺度图像识别方法,其特征在于,包括:
获取图像数据;
对图像进行预处理并获取候选框;
对处理后的图像进行目标检测,得到目标区域图像;
使用权利要求1-6中任一项所述的基于改进的DenseNet的多尺度图像识别方法来识别所述目标区域图像,得到所述目标区域图像中的物体的类别。
8.根据权利要求7所述的基于目标检测和改进的DenseNet的多尺度图像识别方法,其特征在于,对处理后的图像进行目标检测,得到目标区域图像包括将处理后的图像输入至FastR-CNN,得到目标区域框,并将目标区域框内的图像作为所述目标区域图像。
9.一种基于改进的DenseNet的多尺度图像识别装置,其特征在于,包括:
存储器;以及
处理器,所述处理器被配置为执行:
构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;
训练所述改进的DenseNet多尺度网络;
将待识别的图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
10.一种基于目标检测和改进的DenseNet的多尺度图像识别装置,其特征在于,包括:
存储器;以及
处理器,所述处理器被配置为执行:
获取图像数据;
对图像进行预处理并获取候选框;
对处理后的图像进行目标检测,得到目标区域图像;
构建改进的DenseNet多尺度网络,所述改进的DenseNet包括三个DenseBlock,相邻的DenseBlock之间通过横向过渡层连接,所述三个DenseBlock经过各自的纵向过渡层后进行交互拼接;
训练所述改进的DenseNet多尺度网络;
将所述目标区域图像输入至所述改进的DenseNet多尺度网络,对所述图像中的物体的类别进行识别预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010225286.9A CN113449756B (zh) | 2020-03-26 | 2020-03-26 | 一种基于改进的DenseNet的多尺度图像识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010225286.9A CN113449756B (zh) | 2020-03-26 | 2020-03-26 | 一种基于改进的DenseNet的多尺度图像识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113449756A true CN113449756A (zh) | 2021-09-28 |
CN113449756B CN113449756B (zh) | 2022-08-16 |
Family
ID=77807357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010225286.9A Active CN113449756B (zh) | 2020-03-26 | 2020-03-26 | 一种基于改进的DenseNet的多尺度图像识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113449756B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180373925A1 (en) * | 2017-06-22 | 2018-12-27 | Koninklijke Philips N.V. | Subject identification systems and methods |
CN109376576A (zh) * | 2018-08-21 | 2019-02-22 | 中国海洋大学 | 基于交替更新密集连通从零训练网络的目标检测方法 |
CN109559287A (zh) * | 2018-11-20 | 2019-04-02 | 北京工业大学 | 一种基于DenseNet生成对抗网络的语义图像修复方法 |
CN109685776A (zh) * | 2018-12-12 | 2019-04-26 | 华中科技大学 | 一种基于ct图像的肺结节检测方法及系统 |
CN109785320A (zh) * | 2019-01-28 | 2019-05-21 | 太原理工大学 | 一种采用改进型AlexNet模型对乳腺钼靶X线图像进行分类和识别的方法 |
CN110084292A (zh) * | 2019-04-18 | 2019-08-02 | 江南大学 | 基于DenseNet和多尺度特征融合的目标检测方法 |
US20190287674A1 (en) * | 2017-12-20 | 2019-09-19 | Canon Medical Systems Corporation | Medical signal processing apparatus |
US20190384963A1 (en) * | 2016-12-01 | 2019-12-19 | Berkeley Lights, Inc. | Automated detection and repositioning of micro-objects in microfluidic devices |
CN110706154A (zh) * | 2019-08-28 | 2020-01-17 | 西北大学 | 一种基于层次化残差神经网络的图像超分辨率方法 |
-
2020
- 2020-03-26 CN CN202010225286.9A patent/CN113449756B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190384963A1 (en) * | 2016-12-01 | 2019-12-19 | Berkeley Lights, Inc. | Automated detection and repositioning of micro-objects in microfluidic devices |
US20180373925A1 (en) * | 2017-06-22 | 2018-12-27 | Koninklijke Philips N.V. | Subject identification systems and methods |
US20190287674A1 (en) * | 2017-12-20 | 2019-09-19 | Canon Medical Systems Corporation | Medical signal processing apparatus |
CN109376576A (zh) * | 2018-08-21 | 2019-02-22 | 中国海洋大学 | 基于交替更新密集连通从零训练网络的目标检测方法 |
CN109559287A (zh) * | 2018-11-20 | 2019-04-02 | 北京工业大学 | 一种基于DenseNet生成对抗网络的语义图像修复方法 |
CN109685776A (zh) * | 2018-12-12 | 2019-04-26 | 华中科技大学 | 一种基于ct图像的肺结节检测方法及系统 |
CN109785320A (zh) * | 2019-01-28 | 2019-05-21 | 太原理工大学 | 一种采用改进型AlexNet模型对乳腺钼靶X线图像进行分类和识别的方法 |
CN110084292A (zh) * | 2019-04-18 | 2019-08-02 | 江南大学 | 基于DenseNet和多尺度特征融合的目标检测方法 |
CN110706154A (zh) * | 2019-08-28 | 2020-01-17 | 西北大学 | 一种基于层次化残差神经网络的图像超分辨率方法 |
Non-Patent Citations (3)
Title |
---|
KE ZHANG: "Multiple Feature Reweight DenseNet for Image Classification", 《IEEE ACCESS》 * |
韩哲等: "基于改进遗传模糊聚类和水平集的图像分割算法", 《计算机工程与设计》 * |
高建瓴等: "基于DenseNet的图像识别方法研究", 《贵州大学学报(自然科学版)》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113449756B (zh) | 2022-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509978B (zh) | 基于cnn的多级特征融合的多类目标检测方法及模型 | |
WO2021139324A1 (zh) | 图像识别方法、装置、计算机可读存储介质及电子设备 | |
CN111160350B (zh) | 人像分割方法、模型训练方法、装置、介质及电子设备 | |
CN113361432B (zh) | 一种基于深度学习的视频文字端到端检测与识别的方法 | |
CN114187311A (zh) | 一种图像语义分割方法、装置、设备及存储介质 | |
CN111767906B (zh) | 人脸检测模型训练方法、人脸检测方法、装置及电子设备 | |
CN110147707B (zh) | 一种高精度车辆识别方法及系统 | |
CN107066916A (zh) | 基于反卷积神经网络的场景语义分割方法 | |
CN113591872A (zh) | 一种数据处理系统、物体检测方法及其装置 | |
CN110222718A (zh) | 图像处理的方法及装置 | |
Xing et al. | Traffic sign recognition using guided image filtering | |
CN111382737A (zh) | 多路负载均衡异步目标检测方法、存储介质及处理器 | |
CN115131797A (zh) | 一种基于特征增强金字塔网络的场景文本检测方法 | |
CN113034506A (zh) | 遥感图像语义分割方法、装置、计算机设备和存储介质 | |
CN114037640A (zh) | 图像生成方法及装置 | |
CN114519877A (zh) | 人脸识别方法、人脸识别装置、计算机设备及存储介质 | |
He et al. | Aggregating local context for accurate scene text detection | |
CN113435370A (zh) | 一种基于图像特征融合获取车辆排队长度的方法及装置 | |
CN113449756B (zh) | 一种基于改进的DenseNet的多尺度图像识别方法和装置 | |
CN116958615A (zh) | 图片识别方法、装置、设备和介质 | |
CN115761667A (zh) | 一种基于改进fcos算法的无人车辆搭载摄像头目标检测方法 | |
CN112232162B (zh) | 一种基于多特征融合级联分类器的行人检测方法及装置 | |
CN113592807A (zh) | 一种训练方法、图像质量确定方法及装置、电子设备 | |
CN113516148A (zh) | 基于人工智能的图像处理方法、装置、设备及存储介质 | |
CN111860601A (zh) | 预测大型真菌种类的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |