CN111401309B - 基于小波变换的cnn训练和遥感图像目标识别方法 - Google Patents

基于小波变换的cnn训练和遥感图像目标识别方法 Download PDF

Info

Publication number
CN111401309B
CN111401309B CN202010271261.2A CN202010271261A CN111401309B CN 111401309 B CN111401309 B CN 111401309B CN 202010271261 A CN202010271261 A CN 202010271261A CN 111401309 B CN111401309 B CN 111401309B
Authority
CN
China
Prior art keywords
image
training
wavelet
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010271261.2A
Other languages
English (en)
Other versions
CN111401309A (zh
Inventor
姚力波
李孟洋
周坚毅
孙炜玮
张筱晗
刘瑜
李亚涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naval Aeronautical University
Original Assignee
Naval Aeronautical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naval Aeronautical University filed Critical Naval Aeronautical University
Priority to CN202010271261.2A priority Critical patent/CN111401309B/zh
Publication of CN111401309A publication Critical patent/CN111401309A/zh
Application granted granted Critical
Publication of CN111401309B publication Critical patent/CN111401309B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于小波变换的CNN训练及遥感图像目标识别,其中,基于小波变换的CNN训练方法包括:构建目标对象的训练集;对所述训练集中的训练图像进行图像预处理,得到预处理训练图像;对所述预处理训练图像进行小波变换,得到变换小波图像;将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练。本发明的技术方案能够提高基于卷积神经网络的图像识别方法的准确率和识别精度。

Description

基于小波变换的CNN训练和遥感图像目标识别方法
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种基于小波变换的CNN训练、基于小波变换卷积神经网络CNN的遥感图像识别方法、装置、设备及介质。
背景技术
图像识别是人工智能的一个重要领域,图像识别技术的过程主要分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策等步骤。
现有的图像识别方法中,主要包括基于特征提取的图像识别方法以及卷积神经网络(Convolutional Neural Network,CNN)的方法。其中,基于特征提取的图像识别方法主要包括定向梯度直方图(Histogram Of Gradient,HOG)、尺度不变特征变换(Scale-invariant feature transform,SIFT)以及局部二进制模式(Local Binary Patterns,LBP)等。卷积神经网络可以用于从图像中提取特征,并在特征提取之后直接进行分类任务,能够实现端到端识别。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:基于特征提取的图像识别方法所提取的特征仅包含图像的浅层信息,并非高级语义信息。另外,在基于特征提取的图像识别方法中,特征提取和分类通常是两个独立的过程,无法做到端到端识别,使得分类结果无法反馈给特征提取过程使其及时做出调整,从而影响图像识别的准确率。卷积神经网络虽然能够实现端到端识别,但在应用于图像识别时也存在一些问题。一方面,卷积神经网络作为数据驱动算法,深度学习方法需要大量的训练数据,这种需求对于具有类内差异性和类间相似性的细粒度识别目标分类来说尤为重要。但是由于数据的标注成本高昂,导致训练样本有限,易产生训练效果差或过拟合问题。另一反面,卷积神经网络的特征学习过程是基于浅层信息,在卷积过程中不可避免地会丢失一些重要信息,例如识别目标的边缘和轮廓特征等,从而导致识别精度较低。
发明内容
本发明实施例提供一种基于小波变换的CNN训练、基于小波变换的图像识别方法、装置、设备及介质,以提高基于卷积神经网络的图像识别方法的准确率和识别精度。
第一方面,本发明实施例提供了一种基于小波变换的CNN训练方法,包括:
构建目标对象的训练集;
对所述训练集中的训练图像进行图像预处理,得到预处理训练图像;
对所述预处理训练图像进行小波变换,得到变换小波图像;
将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练。
第二方面,本发明实施例还提供了一种基于小波变换的图像识别方法,包括:
获取待识别图像;
对所述待识别图像进行图像预处理,得到预处理待识别图像;
对所述预处理待识别图像进行小波变换,得到变换小波待识别图像;
将所述变换小波待识别图像和所述预处理待识别图像分别输入至通过第一方面所述基于小波变换的CNN训练方法得到的卷积神经网络,得到两路输出结果;
对所述两路输出结果进行融合。
第三方面,本发明实施例还提供了一种基于小波变换的CNN训练装置,包括:
训练集构建模块,用于构建目标对象的训练集;
第一图像预处理模块,用于对所述训练集中的训练图像进行图像预处理,得到预处理训练图像;
第一小波变换模块,用于对所述预处理训练图像进行小波变换,得到变换小波图像;
网络训练模块,用于将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练。
第四方面,本发明实施例还提供了一种基于小波变换的图像识别装置,其特征在于,包括:
待识别图像获取模块,用于获取待识别图像;
第二图像预处理模块,用于对所述待识别图像进行图像预处理,得到预处理待识别图像;
第二小波变换模块,用于对所述预处理待识别图像进行小波变换,得到变换小波待识别图像;
输出结果获取模块,用于将所述变换小波待识别图像和所述预处理待识别图像分别输入至通过第一方面所述基于小波变换的CNN训练方法得到的卷积神经网络,得到两路输出结果;
输出结果融合模块,用于对所述两路输出结果进行融合。
第五方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的基于小波变换的CNN训练方法。
第六方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的基于小波变换的CNN训练方法。
第七方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的基于小波变换的图像识别方法。
第八方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的基于小波变换的图像识别方法。
本发明实施例通过构建目标对象的训练集,以对训练集中的训练图像进行图像预处理得到预处理训练图像,然后对预处理训练图像进行小波变换,得到变换小波图像,并将变换小波图像和预处理训练图像分别输入至卷积神经网络进行训练,然后将对待识别图像处理得到的预处理待识别图像和变换小波待识别图像分别输入至训练好的卷积神经网络,并对卷积神经网络输出的两路输出结果进行融合,以得到最终的识别结果,解决现有图像识别算法存在的准确率和识别精度较低的问题,从而提高基于卷积神经网络的图像识别方法的准确率和识别精度。
附图说明
图1是本发明实施例一提供的一种基于小波变换的CNN训练方法的流程图;
图2a是本发明实施例二提供的一种基于小波变换的CNN训练方法的流程图;
图2b是本发明实施例二提供的一种基于小波变换的CNN训练方法的流程示意图;
图2c是本发明实施例二提供的一种卷积神经网络输入方式的示意图;
图2d是本发明实施例二提供的一种卷积神经网络输入方式的示意图;
图2e是本发明实施例二提供的一种卷积神经网络输入方式的示意图;
图3是本发明实施例三提供的一种基于小波变换的图像识别方法的流程图;
图4是本发明实施例四提供的一种基于小波变换的CNN训练装置的示意图;
图5是本发明实施例五提供的一种基于小波变换的图像识别装置的示意图;
图6为本发明实施例六提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
本发明实施例的说明书和权利要求书及附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
实施例一
图1是本发明实施例一提供的一种基于小波变换的CNN训练方法的流程图,本实施例可适用于结合小波变换方法对卷积神经网络进行训练的情况,该方法可以由基于小波变换的CNN训练装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在计算机设备。相应的,如图1所示,该方法包括如下操作:
S110、构建目标对象的训练集。
其中,目标对象可以是任意图像中需要识别的图像,例如,遥感图像或光学图像中的飞机、舰船等均可以作为目标对象,本发明实施例并不对目标对象的类型以及包括目标对象的图像类型进行限定。
在对卷积神经网络进行训练之前,首先需要构建目标对象的训练集。
S120、对所述训练集中的训练图像进行图像预处理,得到预处理训练图像。
其中,训练图像可以是包括目标对象的各种类型的图像,训练图像可以用于训练卷积神经网络。预处理训练图像可以是对训练图像进行图像预处理操作后得到的图像。
在本发明实施例中,目标对象的训练集构建完成后,需要对训练集中的训练图像进行图像预处理。可选的,图像预处理可以包括但不限于图像大小调整或图像数量扩增等。对训练集中的训练图像进行图像预处理后,即可得到处理后的预处理训练图像。
S130、对所述预处理训练图像进行小波变换,得到变换小波图像。
其中,变换小波图像可以是对预处理训练图像进行小波变换后得到的图像。
相应的,图像预处理完成后,可以对获取的预处理训练图像进行小波变换,进而得到变换小波图像。小波变换经过傅里叶变换的改进,在图像处理中被称为显微镜。小波变换可以通过高通和低通滤波器逐层分解图片信息,从而使图片中的细节信息更加突出。同时,对预处理训练图像进行小波变换可以增加训练样本的数量。示例性的,对一幅预处理训练图像进行小波变换,可以对应得到4幅变换小波图像。训练样本数量的增加可以解决过拟合问题,缓解梯度消失现象,从而提高卷积神经网络的训练效果,进而提高卷积神经网络的识别效果。
S140、将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练。
在传统的卷积神经网络中,卷积层通常只有一个卷积分支,训练集中的样本图像会作为输入图像直接输入至卷积神经网络中进行训练。本发明实施例通过将变换小波图像和预处理训练图像分别输入至卷积神经网络进行训练,能够综合利用变换小波图像丰富的细节信息以及预处理训练图像的全局信息对卷积神经网络进行训练,从而提高卷积神经网络的识别性能。
本发明实施例通过构建目标对象的训练集,以对训练集中的训练图像进行图像预处理得到预处理训练图像,然后对预处理训练图像进行小波变换,得到变换小波图像,并将变换小波图像和预处理训练图像分别输入至卷积神经网络进行训练,训练好的卷积神经网络可以对待识别图像进行识别,解决现有图像识别算法存在的准确率和识别精度较低的问题,从而提高基于卷积神经网络的图像识别方法的准确率和识别精度。
实施例二
图2a是本发明实施例二提供的一种基于小波变换的CNN训练方法的流程图,本实施例以上述实施例为基础进行具体化,将目标对象具体为舰船进行具体说明。相应的,如图2a所示,本实施例的方法可以包括:
S210、构建目标对象的训练集。
在本发明实施例中,目标对象可以是舰船目标。舰船目标具有类内差异性和类间相似性的细粒度船舶分类,后续利用小波变换方法结合卷积神经网络对包括舰船目标的图像进行训练,可以更有效提取舰船目标边缘等细节信息,从而提高对舰船目标识别的准确率。图2b是本发明实施例二提供的一种基于小波变换的CNN训练方法的流程示意图,下面结合图2a和图2b描述具体的训练过程。
相应的,S210具体可以包括:
S211、获取所述目标对象的源数据,并根据所述源数据确定原始数据集。
其中,目标对象的源数据可以是HRSC2016高分辨率遥感图像数据集。
相应的,根据源数据确定原始数据集,具体可以是:在HRSC2016用于舰船检测的数据集基础上,通过python(一种计算机程序设计语言)编程,批量获取用于遥感图像舰船识别的HRSC_CLS数据集作为原始数据集。
具体的,HRSC2016数据集有1061张图像,包含2976个船舶样本,涉及4个大类25个小类,且数量分布不均匀。可以通过python编程,从HRSC2016数据集中,提取出船舶小类数量最多的14个类别共1683个样本,每张图像有且仅有一个船舶目标,用作舰船识别HRSC_CLS数据集。其中,HRSC_CLS数据集具体类别和数量参见表1。
表1 HRSC_CLS数据集列表
Figure BDA0002443230120000061
Figure BDA0002443230120000071
S212、将根据设定数据集比例从所述原始数据集抽取得到的数据作为所述训练集。
其中,设定数据集比例可以是对原始数据集进行划分以得到训练集和测试集的比例,示例性的,设定数据集比例可以是8:2或7:3等,可以根据实际需求设定,本发明实施例并不对设定数据集比例的具体数值进行限定。
相应的,在得到HRSC_CLS数据集后,可以对HRSC_CLS数据集中的样本图像按照设定数据集比例抽取得到的数据作为训练集。例如,将HRSC_CLS数据集中随机抽取的80%的图像作为训练集,剩余的图像作为测试集。测试集主要用于对训练好的卷积神经网络进行测试,本发明实施例对此不再详述。
S220、对所述训练集中的训练图像进行图像预处理,得到预处理训练图像。
相应的,S220具体可以包括:
S221、对各所述训练图像进行调整,得到大小一致的调整训练图像。
其中,调整训练图像可以是对训练图像的大小进行调整后得到的图像。
示例性的,对各训练图像进行调整,得到大小一致的调整训练图像,具体可以是:将训练集中的各训练图像统一调整为448*448大小的调整训练图像。
S222、对所述调整训练图像进行数据扩增,得到所述预处理训练图像。
相应的,对调整训练图像进行数据扩增,得到预处理训练图像,具体可以是:通过随机水平翻转或随机旋转等方式对调整训练图像进行扩增。例如,对调整训练图像进行水平翻转,得到的新的镜像图像作为一个新样本加入训练集中。
S230、对所述预处理训练图像进行小波变换,得到变换小波图像。
相应的,S230具体可以包括:
S231、对所述预处理训练图像的RGB通道分别进行小波变换,得到中间处理小波图像。
相应的,对预处理训练图像的RGB通道分别进行小波变换,具体可以是:通过python的PIL(Python处理图像的库)库,将预处理训练图像的RGB三通道进行分离,并分别针对分离得到的三通道图像利用python中的小波库进行快速小波变换。
S232、对所述中间处理小波图像沿RGB通道进行拼接,得到所述变换小波图像。
相应的,在得到中间处理小波图像后,将中间处理小波图像沿RGB通道进行拼接,得到变换小波图像。
在一个具体的例子中,假设对一幅预处理训练图像的RGB通道分别进行小波变换,得到中间处理小波图像,也即,R通道对应4幅中间处理小波图像,G通道对应4幅中间处理小波图像,B通道对应4幅中间处理小波图像。然后,对上述三个通道的中间处理小波图像进行归一化处理,将各中间处理小波图像沿RGB通道进行拼接。也即,R通道对应4幅中间处理小波图像后拼接G通道对应4幅中间处理小波图像,再继续拼接B通道对应4幅中间处理小波图像,从而得到12通道的完整变换小波图像。
S240、将所述变换小波图像作为第一输入图像输入至所述卷积神经网络的第一分支卷积,将所述预处理训练图像作为第二输入图像输入至所述卷积神经网络的第二分支卷积,以对所述卷积神经网络进行训练。
其中,所述卷积神经网络的第一层卷积包括第一分支卷积和第二分支卷积;所述第一分支卷积和所述第二分支卷积采用初始化权重;所述卷积神经网络最后一组卷积层和池化层之间包括通道注意力机制模块。
其中,所述卷积神经网络的损失函数根据所述第一分支卷积对应支路的第一损失函数、所述第二分支卷积对应支路的第二损失函数,以及根据所述第一损失函数和所述第二损失函数产生的对抗损失函数
在本发明实施例中,可选的,可以将VGG16模型作为卷积神经网络并进行训练。需要说明的是,VGG16模型中的第一层卷积为3*3*3*64卷积,需要采用3*3*12*64的分支结构作为第一分支卷积,并采用3*3*3*64的分支结构作为第二分支卷积。其中,第一分支卷积和第二分支卷积均位于第一层卷积,属于并列逻辑关系。同时,可以在VGG16模型中的最后一组卷积层和池化层之间设置通道注意力机制模块,形成最终的目标卷积神经网络。通道注意力机制模块可以用于在训练的过程中,筛选利于图像识别的特征对应的通道,从而使得卷积神经网络能够更好的利用各通道所提供的特征。
在目标卷积神经网络的训练过程中,可以采用3*3的卷积进行操作,每一层卷积都可以得到比上一层卷积更高维更抽象的目标,在每层卷积后,对所得特征图进行最大值池化操作,最大值池化使用2*2模板遍历特征图,在遍历过程中选取最大值作为采样输出,最终得到经过降维的特征图作为下一层卷积的时输入图像,该池化方式在避免数据冗余的同时可以最大程度保留目标特征信息,选择RELU(带泄露随机线性整流,Randomized Leaky)作为激励函数,可以防止训练中梯度消失问题。同时,目标卷积神经网络的训练可以使用SGD(Stochastic Gradient Descent,随机梯度下降)方法,设置初始学习率为0.001,每20轮迭代下降0.1,目标卷积神经网络的其他参数见表2。
具体的,可以将变换小波图像作为第一输入图像输入至目标卷积神经网络的第一分支卷积,同时将预处理训练图像作为第二输入图像输入至目标卷积神经网络的第二分支卷积,并行进行特征提取。为验证本发明实施例所提供的输入方式能够最为有效的提取目标特征信息,共采取三种输入方式进行对比实验。图2c是本发明实施例二提供的一种卷积神经网络输入方式的示意图,图2d是本发明实施例二提供的一种卷积神经网络输入方式的示意图,图2e是本发明实施例二提供的一种卷积神经网络输入方式的示意图。其中,图2c所提供的输入方式本发明实施例所采用的输入方式,即将变换小波图像输入至目标卷积神经网络的第一分支卷积,同时将预处理训练图像输入至目标卷积神经网络的第二分支卷积。图2d所提供的输入方式为预处理训练图像和变换小波图像沿通道拼接成15维的输入图像,直接输入至卷积神经网络(未替换第一层卷积的VGG16模型),图2e所提供的输入方式为预处理训练图像和变换小波图像的R、G、B图像一次输入至卷积神经网络(未替换第一层卷积的VGG16模型)。经过实验对比,图2c所提供的输入方式的测试集的准确率为97.794%,图2d所提供的输入方式的测试集的准确率为97.058%,图2e所提供的输入方式的测试集的准确率为96.078%。由此可见,本发明实施例所采用的输入方式能够最为有效的提取目标特征信息。
表2目标卷积神经网络的网络参数
参数
Batch size(批大小) 10
Learning rate(学习率) 0.001
Num epoch(时期) 70
Momentum(动量) 0.9
Decay/step(衰减/轮次) 0.1/20
相应的,目标卷积神经网络将第一层卷积的两个分支卷积提取的浅层特征送去后续网络进行抽象语义特征的提。由于是双分支输入,故第二层卷积后的batch size参数是原始的双倍,预处理训练图像和变换小波图像由第一层的两个分支卷积输入,后续的网络权值等参数共享,可以降低运算成本,并增加目标卷积神经网络的鲁棒性。相应的,目标卷积神经网络可以有两路输出结果,分别产生交叉熵损失函数,也即第一分支卷积对应支路的第一损失函数以及第二分支卷积对应支路的第二损失函数。其中,第一损失函数可以为:
Figure BDA0002443230120000101
第二损失函数可以为:
Figure BDA0002443230120000102
其中,xi和yi分别代表预处理训练图像和小波变换图像经过卷积网络生成特征图的第i个特征。ti代表目标识别标签,也即期待识别出的特征。m代表训练集的批次的大小,n代表舰船的总类别数量,W是目标卷积神经网络中分类网络针对各特征的权重,T代表转置计算。相应的,预处理训练图像和变换小波图像对应的两路输出之间可以产生对抗性损失,也即,根据第一损失函数和第二损失函数可以产生对抗损失函数:
Figure BDA0002443230120000103
然后将卷积所得特征送入全连接层进行分类输出,计算目标卷积神经网络的损失函数为:L=L1+L2+Ladv,如果损失值还在发生变化,则对其进行反向传播,得到网络参数增量,用增量对目标卷积神经网络的权重进行更新,直至损失值不再发生变化为止,此时,标识目标卷积神经网络已经训练成功。
本发明实施例通过构建目标对象的训练集,以对训练集中的训练图像进行图像预处理得到预处理训练图像,然后对预处理训练图像进行小波变换,得到变换小波图像,并将变换小波图像和预处理训练图像分别输入至卷积神经网络进行训练,训练好的卷积神经网络可以对待识别图像进行识别,解决现有图像识别算法存在的准确率和识别精度较低的问题,从而提高基于卷积神经网络的图像识别方法的准确率和识别精度。
实施例三
图3是本发明实施例三提供的一种基于小波变换的图像识别方法的流程图,本实施例可适用于利用结合小波变换方法训练得到的卷积神经网络进行图像识别的情况,该方法可以由基于小波变换的图像识别装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在计算机设备。相应的,如图3所示,该方法包括如下操作:
S310、获取待识别图像。
其中,待识别图像即为需要通过上述训练好的卷积神经网络进行图像识别的图像。
在本发明实施例中,可选的,待识别图像可以是包括舰船目标的图像。相应的,对待识别图像进行识别,即为识别图像中的舰船目标。
S320、对所述待识别图像进行图像预处理,得到预处理待识别图像。
相应的,对待识别图像进行图像预处理,得到预处理待识别图像,具体可以是:对各待识别图像进行调整,得到大小一致的调整待识别图像;对调整待识别图像进行数据扩增,得到预处理待识别图像。其中,对待识别图像进行图像预处理过程与卷积神经网络训练过程中对训练集中的训练图像进行图像预处理原理相同,不再累述。
S330、对所述预处理待识别图像进行小波变换,得到变换小波待识别图像。
相应的,对预处理待识别图像进行小波变换,得到变换小波待识别图像,具体可以是:对预处理待识别图像的RGB通道分别进行小波变换,得到中间处理小波待识别图像,对中间处理小波待识别图像沿RGB通道进行拼接,得到变换小波待识别图像。其中,对预处理待识别图像进行小波变换过程与卷积神经网络训练过程中对预处理训练图像进行小波变换的原理相同,不再累述。
小波变换经过傅里叶变换的改进,在图像处理中被称为显微镜。小波变换可以通过高通和低通滤波器逐层分解图片信息,从而使图片中的细节信息更加突出,进而提高卷积神经网络的识别效果。
S340、将所述变换小波待识别图像和所述预处理待识别图像分别输入至通过上述任一所述的基于小波变换的CNN训练方法得到的卷积神经网络,得到两路输出结果。
其中,通过上述任一所述的基于小波变换的CNN训练方法得到的卷积神经网络的第一层卷积包括第一分支卷积和第二分支卷积;所述第一分支卷积和所述第二分支卷积采用初始化权重;所述卷积神经网络最后一组卷积层和池化层之间包括通道注意力机制模块。
其中,通过上述任一所述的基于小波变换的CNN训练方法得到的卷积神经网络的损失函数根据所述第一分支卷积对应支路的第一损失函数、所述第二分支卷积对应支路的第二损失函数,以及根据所述第一损失函数和所述第二损失函数产生的对抗损失函数确定。
相应的,将变换小波待识别图像和预处理待识别图像分别输入至通过上述任一所述的基于小波变换的CNN训练方法得到的卷积神经网络,得到两路输出结果,具体可以是:将变换小波待识别图像作为第一输入图像输入至已训练好的卷积神经网络的第一分支卷积,并同时将预处理待识别图像作为第二输入图像输入至已训练好的卷积神经网络的第二分支卷积,得到对应的两路输出结果。
S350、对所述两路输出结果进行融合。
在本发明实施例中,对两路输出结果进行融合,具体可以是:采用决策级融合方式对两路输出结果进行融合。可选的,具体的融合方法可以是:
Figure BDA0002443230120000121
其中,y1为已训练好的卷积神经网络的第一分支卷积对应的输出结果,y2为已训练好的卷积神经网络的第一分支卷积对应的输出结果。决策级融合方式可以进一步提高卷积神经网络的识别效果。
本发明实施例通过构建目标对象的训练集,以对训练集中的训练图像进行图像预处理得到预处理训练图像,然后对预处理训练图像进行小波变换,得到变换小波图像,并将变换小波图像和预处理训练图像分别输入至卷积神经网络进行训练,然后将对待识别图像处理得到的预处理待识别图像和变换小波待识别图像分别输入至训练好的卷积神经网络,并对卷积神经网络输出的两路输出结果进行融合,以得到最终的识别结果,解决现有图像识别算法存在的准确率和识别精度较低的问题,从而提高基于卷积神经网络的图像识别方法的准确率和识别精度。
需要说明的是,以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。
实施例四
图4是本发明实施例四提供的一种基于小波变换的CNN训练装置的示意图,如图4所示,所述装置包括:训练集构建模块410、第一图像预处理模块420、第一小波变换模块430以及网络训练模块440,其中:
训练集构建模块410,用于构建目标对象的训练集;
第一图像预处理模块420,用于对所述训练集中的训练图像进行图像预处理,得到预处理训练图像;
第一小波变换模块430,用于对所述预处理训练图像进行小波变换,得到变换小波图像;
网络训练模块440,用于将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练。
本发明实施例通过构建目标对象的训练集,以对训练集中的训练图像进行图像预处理得到预处理训练图像,然后对预处理训练图像进行小波变换,得到变换小波图像,并将变换小波图像和预处理训练图像分别输入至卷积神经网络进行训练,训练好的卷积神经网络可以对待识别图像进行识别,解决现有图像识别算法存在的准确率和识别精度较低的问题,从而提高基于卷积神经网络的图像识别方法的准确率和识别精度。
可选的,训练集构建模块410,包括:原始数据集获取单元,用于获取所述目标对象的源数据,并根据所述源数据确定原始数据集;训练集获取单元,用于将根据设定数据集比例从所述原始数据集抽取得到的数据作为所述训练集。
可选的,第一图像预处理模块420,包括:训练图像调整单元,用于对各所述训练图像进行调整,得到大小一致的调整训练图像;图像数据扩增单元,用于对所述调整训练图像进行数据扩增,得到所述预处理训练图像。
可选的,第一小波变换模块430,包括:中间处理小波图像获取单元,用于对所述预处理训练图像的RGB通道分别进行小波变换,得到中间处理小波图像;变换小波图像获取单元,用于对所述中间处理小波图像沿RGB通道进行拼接,得到所述变换小波图像。
可选的,所述卷积神经网络的第一层卷积包括第一分支卷积和第二分支卷积;所述第一分支卷积和所述第二分支卷积采用初始化权重;所述卷积神经网络最后一组卷积层和池化层之间包括通道注意力机制模块;网络训练模块440,具体用于:将所述变换小波图像作为第一输入图像输入至所述卷积神经网络的第一分支卷积,将所述预处理训练图像作为第二输入图像输入至所述卷积神经网络的第二分支卷积,以对所述卷积神经网络进行训练;其中,所述卷积神经网络的损失函数根据所述第一分支卷积对应支路的第一损失函数、所述第二分支卷积对应支路的第二损失函数,以及根据所述第一损失函数和所述第二损失函数产生的对抗损失函数确定。
上述基于小波变换的CNN训练装置可执行本发明任意实施例所提供的基于小波变换的CNN训练方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的基于小波变换的CNN训练方法。
由于上述所介绍的基于小波变换的CNN训练装置为可以执行本发明实施例中的基于小波变换的CNN训练方法的装置,故而基于本发明实施例中所介绍的基于小波变换的CNN训练方法,本领域所属技术人员能够了解本实施例的基于小波变换的CNN训练装置的具体实施方式以及其各种变化形式,所以在此对于该基于小波变换的CNN训练装置如何实现本发明实施例中的基于小波变换的CNN训练方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中基于小波变换的CNN训练方法所采用的装置,都属于本申请所欲保护的范围。
实施例五
图5是本发明实施例五提供的一种基于小波变换的图像识别装置的示意图,如图5所示,所述装置包括:待识别图像获取模块510、第二图像预处理模块520、第二小波变换模块530、输出结果获取模块540以及输出结果融合模块550,其中:
待识别图像获取模块510,用于获取待识别图像;
第二图像预处理模块520,用于对所述待识别图像进行图像预处理,得到预处理待识别图像;
第二小波变换模块530,用于对所述预处理待识别图像进行小波变换,得到变换小波待识别图像;
输出结果获取模块540,用于将所述变换小波待识别图像和所述预处理待识别图像分别输入至通过上述任一所述的基于小波变换的CNN训练方法得到的卷积神经网络,得到两路输出结果;
输出结果融合模块550,用于对所述两路输出结果进行融合。
本发明实施例通过构建目标对象的训练集,以对训练集中的训练图像进行图像预处理得到预处理训练图像,然后对预处理训练图像进行小波变换,得到变换小波图像,并将变换小波图像和预处理训练图像分别输入至卷积神经网络进行训练,然后将对待识别图像处理得到的预处理待识别图像和变换小波待识别图像分别输入至训练好的卷积神经网络,并对卷积神经网络输出的两路输出结果进行融合,以得到最终的识别结果,解决现有图像识别算法存在的准确率和识别精度较低的问题,从而提高基于卷积神经网络的图像识别方法的准确率和识别精度。
上述基于小波变换的图像识别装置可执行本发明任意实施例所提供的基于小波变换的图像识别方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的基于小波变换的图像识别方法。
由于上述所介绍的基于小波变换的图像识别装置为可以执行本发明实施例中的基于小波变换的图像识别方法的装置,故而基于本发明实施例中所介绍的基于小波变换的图像识别方法,本领域所属技术人员能够了解本实施例的基于小波变换的图像识别装置的具体实施方式以及其各种变化形式,所以在此对于该基于小波变换的图像识别装置如何实现本发明实施例中的基于小波变换的图像识别方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中基于小波变换的图像识别方法所采用的装置,都属于本申请所欲保护的范围。
实施例六
图6为本发明实施例六提供的一种计算机设备的结构示意图。图6示出了适于用来实现本发明实施方式的计算机设备612的框图。图6显示的计算机设备612仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备612以通用计算设备的形式表现。计算机设备612的组件可以包括但不限于:一个或者多个处理器616,存储装置628,连接不同系统组件(包括存储装置628和处理器616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备612访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)630和/或高速缓存存储器632。计算机设备612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统634可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储装置628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块626的程序636,可以存储在例如存储装置628中,这样的程序模块626包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块626通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备612也可以与一个或多个外部设备614(例如键盘、指向设备、摄像头、显示器624等)通信,还可与一个或者多个使得用户能与该计算机设备612交互的设备通信,和/或与使得该计算机设备612能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output,I/O)接口622进行。并且,计算机设备612还可以通过网络适配器620与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器620通过总线618与计算机设备612的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备612使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arraysof Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器616通过运行存储在存储装置628中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的基于小波变换的CNN训练方法。
也即,所述处理单元执行所述程序时实现:构建目标对象的训练集;对所述训练集中的训练图像进行图像预处理,得到预处理训练图像;对所述预处理训练图像进行小波变换,得到变换小波图像;将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练。
实施例七
本实施例七是本发明实施例提供的一种用于执行本发明实施例三所提供的基于小波变换的图像识别方法的设备,该设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例三所提供的基于小波变换的图像识别方法:获取待识别图像;对所述待识别图像进行图像预处理,得到预处理待识别图像;对所述预处理待识别图像进行小波变换,得到变换小波待识别图像;将所述变换小波待识别图像和所述预处理待识别图像分别输入至通过上述任一所述的基于小波变换的CNN训练方法得到的卷积神经网络,得到两路输出结果;对所述两路输出结果进行融合。其具体结构以及细节内容可参照图6和实施例六。
实施例八
本发明实施例八还提供一种存储计算机程序的计算机存储介质,所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的基于小波变换的CNN训练方法:构建目标对象的训练集;对所述训练集中的训练图像进行图像预处理,得到预处理训练图像;对所述预处理训练图像进行小波变换,得到变换小波图像;将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory,ROM)、可擦式可编程只读存储器((Erasable Programmable ReadOnly Memory,EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
实施例九
本发明实施例九还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可实现上述实施例三所述的基于小波变换的图像识别方法:获取待识别图像;对所述待识别图像进行图像预处理,得到预处理待识别图像;对所述预处理待识别图像进行小波变换,得到变换小波待识别图像;将所述变换小波待识别图像和所述预处理待识别图像分别输入至通过上述任一所述的基于小波变换的CNN训练方法得到的卷积神经网络,得到两路输出结果;对所述两路输出结果进行融合。其具体的细节内容描述可参照实施例八。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (5)

1.一种基于小波变换的卷积神经网络CNN方法,其特征在于,包括:
构建目标对象的训练集;
对所述训练集中的训练图像进行图像预处理,得到预处理训练图像;
对所述预处理训练图像进行小波变换,得到变换小波图像;
将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练;
所述卷积神经网络的第一层卷积包括第一分支卷积和第二分支卷积;所述第一分支卷积和所述第二分支卷积采用初始化权重;所述卷积神经网络最后一组卷积层和池化层之间包括通道注意力机制模块;
所述将所述变换小波图像和所述预处理训练图像分别输入至卷积神经网络进行训练,包括:
将所述变换小波图像作为第一输入图像输入至所述卷积神经网络的第一分支卷积,将所述预处理训练图像作为第二输入图像输入至所述卷积神经网络的第二分支卷积,以对所述卷积神经网络进行训练;
其中,所述卷积神经网络的损失函数根据所述第一分支卷积对应支路的第一损失函数
Figure FDA0003606335160000011
所述第二分支卷积对应支路的第二损失函数
Figure FDA0003606335160000012
以及根据所述第一损失函数L1和所述第二损失函数L2产生的对抗损失函数
Figure FDA0003606335160000013
确定;xi和yi分别代表所述预处理训练图像和所述变换小波 图像经过所述卷积神经网络生成特征图的第i个特征,ti代表目标识别标签,也即期待识别出的特征,m代表训练集的批次的大小,n代表舰船的总类别数量,W是目标卷积神经网络中分类网络针对各特征的权重,T代表转置计算。
2.根据权利要求1所述的方法,其特征在于,所述构建目标对象的训练集,包括:
获取所述目标对象的源数据,并根据所述源数据确定原始数据集;
将根据设定数据集比例从所述原始数据集抽取得到的数据作为所述训练集。
3.根据权利要求1所述的方法,其特征在于,所述对所述训练集中的训练图像进行图像预处理,得到预处理训练图像,包括:
对各所述训练图像进行调整,得到大小一致的调整训练图像;
对所述调整训练图像进行数据扩增,得到所述预处理训练图像。
4.根据权利要求1所述的方法,其特征在于,所述对所述预处理训练图像进行小波变换,得到变换小波图像,包括:
对所述预处理训练图像的RGB通道分别进行小波变换,得到中间处理小波图像;
对所述中间处理小波图像沿RGB通道进行拼接,得到所述变换小波图像。
5.一种基于小波变换卷积神经网络CNN的图像识别方法,其特征在于,包括:
获取待识别图像;
对所述待识别图像进行图像预处理,得到预处理待识别图像;
对所述预处理待识别图像进行小波变换,得到变换小波待识别图像;
将所述变换小波待识别图像和所述预处理待识别图像分别输入至通过权利要求1-4任一所述的基于小波变换的CNN训练方法得到的卷积神经网络,得到两路输出结果;
对所述两路输出结果进行融合。
CN202010271261.2A 2020-04-08 2020-04-08 基于小波变换的cnn训练和遥感图像目标识别方法 Active CN111401309B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010271261.2A CN111401309B (zh) 2020-04-08 2020-04-08 基于小波变换的cnn训练和遥感图像目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010271261.2A CN111401309B (zh) 2020-04-08 2020-04-08 基于小波变换的cnn训练和遥感图像目标识别方法

Publications (2)

Publication Number Publication Date
CN111401309A CN111401309A (zh) 2020-07-10
CN111401309B true CN111401309B (zh) 2022-07-12

Family

ID=71435011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010271261.2A Active CN111401309B (zh) 2020-04-08 2020-04-08 基于小波变换的cnn训练和遥感图像目标识别方法

Country Status (1)

Country Link
CN (1) CN111401309B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914935B (zh) * 2020-08-03 2022-07-15 哈尔滨工程大学 一种基于深度学习的船舶图像目标检测方法
CN111815627B (zh) * 2020-08-24 2020-12-01 成都睿沿科技有限公司 遥感图像变化检测方法、模型训练方法及对应装置
CN113128521B (zh) * 2021-04-30 2023-07-18 西安微电子技术研究所 一种小型化人工智能模型特征提取方法、系统、计算机设备及存储介质
CN113762290A (zh) * 2021-08-05 2021-12-07 清华大学 小波域cnn学习的图像识别方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104766096A (zh) * 2015-04-17 2015-07-08 南京大学 一种基于多尺度全局特征和局部特征的图像分类方法
CN107038692A (zh) * 2017-04-16 2017-08-11 南方医科大学 基于小波分解和卷积神经网络的x线胸片骨抑制处理方法
CN110443775A (zh) * 2019-06-20 2019-11-12 吉林大学 基于卷积神经网络的离散小波变换域多聚焦图像融合方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009073963A1 (en) * 2007-12-13 2009-06-18 University Of Saskatchewan Image analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104766096A (zh) * 2015-04-17 2015-07-08 南京大学 一种基于多尺度全局特征和局部特征的图像分类方法
CN107038692A (zh) * 2017-04-16 2017-08-11 南方医科大学 基于小波分解和卷积神经网络的x线胸片骨抑制处理方法
CN110443775A (zh) * 2019-06-20 2019-11-12 吉林大学 基于卷积神经网络的离散小波变换域多聚焦图像融合方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Fusion of Convolutional Neural Network and Statistical Features for Texture classification;Mourad Jbene et.al;《2019 International Conference on Wireless Networks and Mobile Communications (WINCOM)》;20191231;第1-4页 *
一种融合小波变换与卷积神经网络的同相似度图像识别与分类算法;姜文超 等;《计算机工程与科学》;20180930;第40卷(第9期);第1646-1652页 *
基于Harr-CNN模型的自然场景图像分类的研究;张慧娜 等;《四川师范大学学报(自然科学版)》;20170131;第40卷(第1期);第120-123页 *
融合原始图像与小波变换图像的人脸识别;崔玉叶;《电子制作》;20131231;第83-84页 *

Also Published As

Publication number Publication date
CN111401309A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN111401309B (zh) 基于小波变换的cnn训练和遥感图像目标识别方法
US11232318B2 (en) Methods and apparatuses for vehicle appearance feature recognition, methods and apparatuses for vehicle retrieval, storage medium, and electronic devices
CN109598231B (zh) 一种视频水印的识别方法、装置、设备及存储介质
US10424072B2 (en) Leveraging multi cues for fine-grained object classification
CN112633419B (zh) 小样本学习方法、装置、电子设备和存储介质
WO2018184195A1 (en) Joint training of neural networks using multi-scale hard example mining
CN113469088B (zh) 一种无源干扰场景下的sar图像舰船目标检测方法及系统
CN112288018B (zh) 文字识别网络的训练方法、文字识别方法和装置
US20220327816A1 (en) System for training machine learning model which recognizes characters of text images
CN110796108B (zh) 一种人脸质量检测的方法、装置、设备及存储介质
CN113221918B (zh) 目标检测方法、目标检测模型的训练方法及装置
US11250299B2 (en) Learning representations of generalized cross-modal entailment tasks
Slavin Using special text points in the recognition of documents
Xu et al. Using convolutional neural networks incorporating hierarchical active learning for target-searching in large-scale remote sensing images
Khalil et al. Text detection and script identification in natural scene images using deep learning
CN114330588A (zh) 一种图片分类方法、图片分类模型训练方法及相关装置
CN113111684A (zh) 神经网络模型的训练方法、装置和图像处理系统
KR20210010602A (ko) 글자 인식 장치 및 이에 의한 글자 인식 방법
CN112785601B (zh) 一种图像分割方法、系统、介质及电子终端
CN112906726A (zh) 模型训练方法、图像处理方法、装置、计算设备、介质
CN116308625A (zh) 一种商品匹配方法、装置、电子设备及存储介质
Wang et al. Oil tank detection via target-driven learning saliency model
Rodin et al. Document image quality assessment via explicit blur and text size estimation
US20200372368A1 (en) Apparatus and method for semi-supervised learning
CN116958615A (zh) 图片识别方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant