CN109002863B - 一种基于紧凑卷积神经网络的图像处理方法 - Google Patents

一种基于紧凑卷积神经网络的图像处理方法 Download PDF

Info

Publication number
CN109002863B
CN109002863B CN201810682103.9A CN201810682103A CN109002863B CN 109002863 B CN109002863 B CN 109002863B CN 201810682103 A CN201810682103 A CN 201810682103A CN 109002863 B CN109002863 B CN 109002863B
Authority
CN
China
Prior art keywords
compact
layer
branch
neural network
convolutional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810682103.9A
Other languages
English (en)
Other versions
CN109002863A (zh
Inventor
李禹源
张东
吴增程
李骁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Foshan Shunde Sun Yat-Sen University Research Institute
Sun Yat Sen University
SYSU CMU Shunde International Joint Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Shunde Sun Yat-Sen University Research Institute, Sun Yat Sen University, SYSU CMU Shunde International Joint Research Institute filed Critical Foshan Shunde Sun Yat-Sen University Research Institute
Priority to CN201810682103.9A priority Critical patent/CN109002863B/zh
Publication of CN109002863A publication Critical patent/CN109002863A/zh
Application granted granted Critical
Publication of CN109002863B publication Critical patent/CN109002863B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于紧凑卷积神经网络的图像处理方法,包括获取图像输入数据;构建紧凑卷积神经网络,其中,所述紧凑卷积神经网络包括依次连接设置的原始输入层、特征卷积结构、若干个微型结构和平均池化层;通过所述紧凑卷积神经网络对所述图像输入数据进行多重处理得到所述图像输入数据分类结果,其中所述微型结构用于控制网络参数量、改善网络对输入特征图的抽象表征能力。相比于传统技术,本发明能够加强对输入图像的抽象表征,有利于提高识别效率,并且兼容资源受限、适当降低网络深度的计算机系统,可减小计算机资源消耗。

Description

一种基于紧凑卷积神经网络的图像处理方法
技术领域
本发明涉及基于卷积神经网络的图像识别领域,尤其是一种基于紧凑卷积神经网络的图像处理方法。
背景技术
传统的图像识别算法需要专家人员去设计图像的特征集,该方法易受样本集的变动和外界因素的影响:如光照,抖动等噪声影响。近年来,作为机器学习研究中的一个新领域,基于深度学习框架的卷积神经网络的识别算法在许多图像识别领域取得了巨大的成功;基于深度学习框架的卷积神经网络不需要专家人员去设计特征,其能够自动从训练集中产生有效的特征,并通过组合底层特征形成更加抽象的高层特征,从而能够实现高效的图像识别。
在1998年,LeCun成功地将LeNet应用于手写体文本识别之后,卷积神经网络就受到了广泛的关注,越来越多的卷积神经网络框架被提出来了,如AlexNet,Network-in-Network,VGGNet,GoogLNet等。这些基于深度学习框架的卷积神经网络在图像识别领域取得了一系列的突破。但是大部分在深度卷积神经网络的研究都关注于提高网络在计算机视觉数据集上的识别准确率,这些研究最通常的做法就是不断加深和加宽网络,但是一个过于宽且深的卷积神经网络会产生大量的参数并且严重消耗计算机资源,不适用于一些资源受限系统。
发明内容
为了解决上述问题,本发明的目的是提供一种基于紧凑卷积神经网络的图像处理方法,在传统技术的基础上,引入了具有多层感知的微型结构,并在微型结构中,通过执行多尺度滤波、多位置池化、滤波器分解和参数缩减从而构建出紧凑模块。在识别准确率可比的情况下,能够有效地减少卷积神经网络的参数量,提高网络的计算性能,并生成尺寸较小的网络模型,使其能轻松应用于资源受限的硬件平台。
为了弥补现有的不足,本发明采用的方案是:
一种基于紧凑卷积神经网络的图像处理方法,其特征在于,包括:
获取图像输入数据;
构建紧凑卷积神经网络,其中,所述紧凑卷积神经网络包括依次连接设置的原始输入层、特征卷积结构、若干个微型结构和平均池化层;
通过所述紧凑卷积神经网络对所述图像输入数据进行多重处理得到所述图像输入数据分类结果,包括:
所述原始输入层将所述图像输入数据输入到所述特征卷积结构;
所述特征卷积结构提取所述图像输入数据的特征;
所述微型结构用于控制网络参数量、改善网络对输入特征图的抽象表征能力,其中,所述微型结构包括依次连接设置的紧凑模块、中间卷积层和最大池化层,所述中间卷积层通过ReLU与最大池化层构建连接;
所述紧凑模块包括四条平行支路,即支路1、支路2、支路3和支路4;
所述紧凑模块基于多尺度滤波构建,多尺度滤波是指用三个不同尺度的卷积核1×1、3×3、5×5分别在所述支路1、所述支路2和所述支路3去卷积输入,最后将这三个不同的所述平行支路的输出级联起来,从而实现提取输入图片不同尺度的特征;
所述紧凑模块基于多位置池化构建,支路4同样先用1×1的卷积层进行降维,压缩输入通道数,再用两个交叠的池化层进行多个位置的池化操作,用于补充提取输入图像中不同位置的特征;
所述紧凑模块基于滤波器分解构建,包括:选择将各支路单层卷积层替换为多层卷积核数更小的卷积层,即所述支路3中的5×5卷积层用两层连续的3×3卷积层替换;
所述紧凑模块基于参数缩减构建,包括:减少各支路的输入通道数以及缩小各支路各层上的卷积核,即所述支路2和所述支路3中参数量大的3×3卷积层之前先用1×1的卷积层去压缩输入特征图从而对输入通道形成一个紧凑的表征,实现减少支路的输入通道,将支路2一半数量的3×3滤波器用1×1的滤波器替代从而实现缩小支路的卷积核。
进一步,所述紧凑模块的四条所述平行支路的输出端相互级联。
进一步,所述特征卷积结构包括三层依次连接设置的相同卷积层。
进一步,所述特征卷积结构与微型结构之间设置有用于将特征图归一化的LRN。
进一步,所述平均池化层的输出端还连接有用于区分图像类别的softmax。
进一步,所述原始输入层采用ImageNet 2012分类数据集的图像作为所述图像输入数据。
本发明的有益效果是:采用基于多个微型结构的整体卷积结构,增加了网络的多层感知能力。在微型结构中,卷积层可以对紧凑模块的输出的局部感受野的神经元进行更复杂的运算,并实现了跨通道的信息整合;非线性激活函数ReLU改善网络提取非线性特征的能力;最大池化层改善了网络对平移和畸变的鲁棒性,整体上可以改善网络对输入特征图的抽象表征能力;并且通过执行多尺度滤波、多位置池化、滤波器分解和参数缩减构建出紧凑模块,相比于传统技术,能够减小识别过程中的参数量,因此对计算机资源的要求不是很高,可以适当降低网络深度,这对于资源受限的系统而言是非常适用的。因此,本发明能够加强对输入图像的抽象表征,有利于提高识别效率,并且兼容资源受限、适当降低网络深度的计算机系统,可减小计算机资源消耗。
附图说明
下面结合附图给出本发明较佳实施例,以详细说明本发明的实施方案。
图1是本发明一种面向资源受限系统的紧凑卷积神经网络的结构示意图;
图2是本发明一种面向资源受限系统的紧凑卷积神经网络的微型结构的示意图;
图3是本发明一种面向资源受限系统的紧凑卷积神经网络的紧凑模块的结构示意图。
具体实施方式
参照图1-图3,本发明的一种面向资源受限系统的紧凑卷积神经网络,其特征在于,包括:
依次连接设置的原始输入层、特征卷积结构、若干个微型结构和平均池化层;
所述微型结构包括依次连接设置的紧凑模块、中间卷积层和最大池化层,所述中间卷积层通过ReLU与最大池化层构建连接;
所述紧凑模块基于多尺度滤波、多位置池化、滤波器分解和参数缩减构建若干条平行支路而成;
所述紧凑模块基于多尺度滤波构建,包括:将具有不同尺度的卷积核的卷积层分别分配为各平行支路上输入层的下一层;
所述紧凑模块基于多位置池化构建,包括:增加新的平行支路,用于补充提取输入图像中不同位置的特征;
所述紧凑模块基于滤波器分解构建,包括:选择将各支路单层卷积层替换为多层卷积核数更小的卷积层;
所述紧凑模块基于参数缩减构建,包括:减少各支路的输入通道数以及缩小各支路各层上的卷积核。
采用基于多个微型结构的整体卷积结构,增加了网络的多层感知能力,在微型结构中,卷积层可以对紧凑模块的输出的局部感受野的神经元进行更复杂的运算,并实现了跨通道的信息整合;非线性激活函数ReLU改善网络提取非线性特征的能力;最大池化层改善了网络对平移和畸变的鲁棒性,整体上可以改善网络对输入特征图的抽象表征能力;并且通过执行多尺度滤波、多位置池化、滤波器分解和参数缩减构建出紧凑模块,相比于传统技术,能够减小识别过程中的参数量,因此对计算机资源的要求不是很高,可以适当降低网络深度,这对于资源受限的系统而言是非常适用的。因此,本发明能够加强对输入图像的抽象表征,有利于提高识别效率,并且兼容资源受限、适当降低网络深度的计算机系统,可减小计算机资源消耗。
进一步,所述紧凑模块的各支路的输出端相互级联。
进一步,所述特征卷积结构包括三层依次连接设置的相同卷积层。
进一步,所述特征卷积结构与微型结构之间设置有用于将特征图归一化的LRN。
进一步,所述平均池化层的输出端还连接有用于区分图像类别的softmax。
进一步,所述原始输入层采用ImageNet 2012分类数据集的图像作为输入。
具体地,在本实施例中,仅为了方便描述,将本发明简记为CNet,紧凑网络也可记为英文名Compact module;
将ImageNet 2012分类数据集的图像作为输入,该数据集由1000个不同类别组成;将CNet在具有128万张图片的训练集上训练,在5万张验证图片上评估以及在10万张测试图片上测试,从而得到CNet在ImageNet 2012数据集上的最终识别结果;参照图1,特征卷积结构的三个卷积层在不同的抽象水平提取输入图片的特征,并将最后的输出特征输入到接下来的结构中;LRN用来归一化局部输入区域;优选地,选取了四个微型结构(即微型结构(1)、微型结构(2)、微型结构(3)和微型结构(4))堆叠在LRN后面,能够在控制网络参数量的同时,改善网络对输入特征图的抽象表征能力,最后一个微型结构的输出将会提供给平均池化层;在最后阶段,CNet应用了一层softmax,softmax可以在1000个类别中产生一个概率分布,从而使网络区分1000类图像。
参照图2,在CNet中,微型结构起到了至关重要的作用,其可以提取输入图像的抽象特征,与此同时还可以控制参数数量;有选地,微型结构包括紧凑模块、一层1×1卷积层(即中间卷积层),该卷积层配备一个激活函数ReLU和一层步长为2,像素窗口为3×3的最大池化层。
其中,微型结构中的1×1卷积层可对紧凑模块输出的局部感受野的神经元进行复杂计算,实现了跨通道的信息整合;ReLU则增强了网络提取非线性特征的能力;最大池化层则改善了网络对平移和畸变的鲁棒性。微型结构的多层感知产生的特征图可以由下式计算而得到:
Figure GDA0003508394990000071
Figure GDA0003508394990000072
其中的f(1),
Figure GDA0003508394990000073
和fi,j,n分别表示紧凑模块、1×1卷积层和微型结构的输出特征图,fmaxpool表示对ReLU产生的特征图进行最大池化操作,n和(i,j)是指特征图的通道索引和特征图的像素索引,Wn和*分别指对应通道的卷积权值和卷积操作。因此,本微型结构改善了网络对输入特征图的抽象表征能力,而CNet堆叠了几个这样的微型结构可以为网络提供多层感知的能力。
优选地,参照图3,紧凑模块包括4条平行支路,前三个平行支路分为支路1、支路2和支路3,其中图3中的上一层可以是特征卷积结构,也可以是其余微型结构的输出层,即最大池化层,因为本实施例包括若干个微型结构;多尺度滤波是指用三个不同尺度的卷积核1×1,3×3,5×5分别在三个分离的平行支路去卷积输入,最后将这三个不同的卷积支路的输出级联起来,从而实现提取输入图片不同尺度的特征。另外,两个连续的3×3的卷积运算和一个5×5的卷积运算的感受野一样,紧凑模块的滤波器分解就是将多尺度滤波分析中的支路3,即5×5卷积支路(层)用两层连续的3×3卷积层替换,因为两个连续3×3的卷积操作比一个5×5的卷积操作参数量少28%,且给网络提供了更多的非线性,并改善了非线性判决函数的区分性,故采用滤波器分解技术;此外,由于紧凑模块中每条支路的参数量可由下式计算得到:参数量=输入通道数×滤波器个数×滤波器卷积核的大小;因此,参数缩减可以通过减少支路的输入通道数和缩小支路的卷积核来进行,以支路2和支路3为例,在参数量较大的3×3卷积层之前先用1×1的卷积层去压缩输入特征图从而对输入通道形成一个紧凑的表征,实现减少支路的输入通道;此外,将支路2一半数量的3×3滤波器用1×1的滤波器替代从而实现缩小支路的卷积核。而多位置池化技术就是增加一个平行支路4,该支路用于补充提取不同位置的特征,具体为:支路4同样先用1×1的卷积层进行降维,压缩输入通道数,再用两个交叠的池化层(步长均为1,像素窗口分别为3×3和5×5)进行多个位置的池化操作,新增的交叠池化操作可以有效地避免过拟合。
最后,根据实验结果,本发明的一种面向资源受限系统的紧凑卷积神经网络在ImageNet 2012测试集中得到了很好的分类性能,包括识别(分类)检测率以及网络模型大小。具体而言,本发明的卷积神经网络在ImageNet 2012测试集上达到了85.50%的准确率(高于AlexNet的83.6%),并且训练生成的网络模型比AlexNet小了50倍,明显适用于资源受限(存储空间有限)或者需要实时检测的系统。
以上内容对本发明的较佳实施例和基本原理作了详细论述,但本发明并不局限于上述实施方式,熟悉本领域的人员应该了解在不违背本发明精神的前提下还会有各种等同变形和替换,这些等同变形和替换都落入要求保护的本发明范围内。

Claims (6)

1.一种基于紧凑卷积神经网络的图像处理方法,其特征在于,包括:
获取图像输入数据;
构建紧凑卷积神经网络,其中,所述紧凑卷积神经网络包括依次连接设置的原始输入层、特征卷积结构、若干个微型结构和平均池化层;
通过所述紧凑卷积神经网络对所述图像输入数据进行多重处理得到所述图像输入数据分类结果,包括:
所述原始输入层将所述图像输入数据输入到所述特征卷积结构;
所述特征卷积结构提取所述图像输入数据的特征;
所述微型结构用于控制网络参数量、改善网络对输入特征图的抽象表征能力,其中,所述微型结构包括依次连接设置的紧凑模块、中间卷积层和最大池化层,所述中间卷积层通过ReLU与最大池化层构建连接;
所述紧凑模块包括四条平行支路,即支路1、支路2、支路3和支路4;
所述紧凑模块基于多尺度滤波构建,多尺度滤波是指用三个不同尺度的卷积核1×1、3×3、5×5分别在所述支路1、所述支路2和所述支路3去卷积输入,最后将这三个不同的所述平行支路的输出级联起来,从而实现提取输入图片不同尺度的特征;
所述紧凑模块基于多位置池化构建,支路4同样先用1×1的卷积层进行降维,压缩输入通道数,再用两个交叠的池化层进行多个位置的池化操作,用于补充提取输入图像中不同位置的特征;
所述紧凑模块基于滤波器分解构建,包括:选择将各支路单层卷积层替换为多层卷积核数更小的卷积层,即所述支路3中的5×5卷积层用两层连续的3×3卷积层替换;
所述紧凑模块基于参数缩减构建,包括:减少各支路的输入通道数以及缩小各支路各层上的卷积核,即所述支路2和所述支路3中参数量大的3×3卷积层之前先用1×1的卷积层去压缩输入特征图从而对输入通道形成一个紧凑的表征,实现减少支路的输入通道,将支路2一半数量的3×3滤波器用1×1的滤波器替代从而实现缩小支路的卷积核。
2.根据权利要求1所述的一种基于紧凑卷积神经网络的图像处理方法,其特征在于,所述紧凑模块的四条所述平行支路的输出端相互级联。
3.根据权利要求1所述的一种基于紧凑卷积神经网络的图像处理方法,其特征在于,所述特征卷积结构包括三层依次连接设置的相同卷积层。
4.根据权利要求1或3所述的一种基于紧凑卷积神经网络的图像处理方法,其特征在于,所述特征卷积结构与微型结构之间设置有用于将特征图局部进行归一化的LRN。
5.根据权利要求1所述的一种基于紧凑卷积神经网络的图像处理方法,其特征在于,所述平均池化层的输出端还连接有用于区分图像类别的softmax。
6.根据权利要求1所述的一种基于紧凑卷积神经网络的图像处理方法,其特征在于,所述原始输入层采用ImageNet 2012分类数据集的图像作为所述图像输入数据。
CN201810682103.9A 2018-06-27 2018-06-27 一种基于紧凑卷积神经网络的图像处理方法 Active CN109002863B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810682103.9A CN109002863B (zh) 2018-06-27 2018-06-27 一种基于紧凑卷积神经网络的图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810682103.9A CN109002863B (zh) 2018-06-27 2018-06-27 一种基于紧凑卷积神经网络的图像处理方法

Publications (2)

Publication Number Publication Date
CN109002863A CN109002863A (zh) 2018-12-14
CN109002863B true CN109002863B (zh) 2022-04-15

Family

ID=64602113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810682103.9A Active CN109002863B (zh) 2018-06-27 2018-06-27 一种基于紧凑卷积神经网络的图像处理方法

Country Status (1)

Country Link
CN (1) CN109002863B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465251A (zh) * 2020-12-08 2021-03-09 上海电力大学 一种基于最简门控神经网络的短期光伏出力概率预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975931A (zh) * 2016-05-04 2016-09-28 浙江大学 一种基于多尺度池化的卷积神经网络人脸识别方法
CN106471526A (zh) * 2014-08-29 2017-03-01 谷歌公司 使用深度神经网络来处理图像
CN106504064A (zh) * 2016-10-25 2017-03-15 清华大学 基于深度卷积神经网络的服装分类与搭配推荐方法及系统
CN107239802A (zh) * 2017-06-28 2017-10-10 广东工业大学 一种图像分类方法及装置
CN107945182A (zh) * 2018-01-02 2018-04-20 东北农业大学 基于卷积神经网络模型GoogleNet的玉米叶片病害识别方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015180101A1 (en) * 2014-05-29 2015-12-03 Beijing Kuangshi Technology Co., Ltd. Compact face representation
CN105917354A (zh) * 2014-10-09 2016-08-31 微软技术许可有限责任公司 用于图像处理的空间金字塔池化网络
CN106503729A (zh) * 2016-09-29 2017-03-15 天津大学 一种基于顶层权值的图像卷积特征的生成方法
CN107220643A (zh) * 2017-04-12 2017-09-29 广东工业大学 基于紧凑型神经网络的深度学习模型的交通标志识别系统
CN107194371B (zh) * 2017-06-14 2020-06-09 易视腾科技股份有限公司 基于层次化卷积神经网络的用户专注度识别方法及系统
CN107688808B (zh) * 2017-08-07 2021-07-06 电子科技大学 一种快速的自然场景文本检测方法
CN107844740A (zh) * 2017-09-05 2018-03-27 中国地质调查局西安地质调查中心 一种脱机手写、印刷汉字识别方法及系统
CN107610123A (zh) * 2017-10-11 2018-01-19 中共中央办公厅电子科技学院 一种基于深度卷积神经网络的图像美学质量评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106471526A (zh) * 2014-08-29 2017-03-01 谷歌公司 使用深度神经网络来处理图像
CN105975931A (zh) * 2016-05-04 2016-09-28 浙江大学 一种基于多尺度池化的卷积神经网络人脸识别方法
CN106504064A (zh) * 2016-10-25 2017-03-15 清华大学 基于深度卷积神经网络的服装分类与搭配推荐方法及系统
CN107239802A (zh) * 2017-06-28 2017-10-10 广东工业大学 一种图像分类方法及装置
CN107945182A (zh) * 2018-01-02 2018-04-20 东北农业大学 基于卷积神经网络模型GoogleNet的玉米叶片病害识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Going deeper with convolutions;Christian Szegedy等;《Computer Vision and Pattern Recognition》;20140917;第1-12页 *
Rethinking the Inception Architecture for Computer Vision;Christian Szegedy等;《Computer Vision and Pattern Recognition》;20151211;第1-10页 *
多尺寸池化卷积神经网络的人体行为识别研究;周书仁等;《小型微型计算机系统》;20170831;第38卷(第8期);第1893-1898页 *

Also Published As

Publication number Publication date
CN109002863A (zh) 2018-12-14

Similar Documents

Publication Publication Date Title
CN112308158B (zh) 一种基于部分特征对齐的多源领域自适应模型及方法
CN110210539B (zh) 多级深度特征融合的rgb-t图像显著性目标检测方法
CN106919920B (zh) 基于卷积特征和空间视觉词袋模型的场景识别方法
US20190228268A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN109993100B (zh) 基于深层特征聚类的人脸表情识别的实现方法
CN112381097A (zh) 一种基于深度学习的场景语义分割方法
CN108596240B (zh) 一种基于判别特征网络的图像语义分割方法
CN104408479A (zh) 一种基于深度局部特征描述符的海量图像分类方法
CN114693624A (zh) 一种图像检测方法、装置、设备及可读存储介质
CN110110724A (zh) 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法
CN114863572B (zh) 一种多通道异构传感器的肌电手势识别方法
CN107545281B (zh) 一种基于深度学习的单一有害气体红外图像分类识别方法
CN115965864A (zh) 一种用于农作物病害识别的轻量级注意力机制网络
CN114882278A (zh) 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置
CN112989955B (zh) 基于空时双流异构嫁接卷积神经网络人体动作识别方法
CN109002863B (zh) 一种基于紧凑卷积神经网络的图像处理方法
CN110782001A (zh) 一种基于组卷积神经网络使用共享卷积核的改进方法
CN117744745A (zh) 一种基于YOLOv5网络模型的图像优化方法及优化系统
CN113642480A (zh) 一种字符识别方法、装置、设备及存储介质
CN117853862A (zh) 基于rgb通道信息融合的深度学习图像操作链取证方法
CN110490876B (zh) 一种基于轻量级神经网络的图像分割方法
CN109934281A (zh) 一种二分类网络的非监督训练方法
CN114049500A (zh) 基于元学习重加权网络伪标签训练的图像评价方法及系统
Liu Comparison of different Convolutional Neural Network models on Fruit 360 Dataset
CN114581903A (zh) 一种基于卷积神经网络的车牌字符识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240612

Address after: 510000 No. 135 West Xingang Road, Guangdong, Guangzhou

Patentee after: SUN YAT-SEN University

Country or region after: China

Address before: No.9, Nanguo East Road, Yunlu community residents committee, Daliang sub district office, Shunde District, Foshan City, Guangdong Province, 528399

Patentee before: FOSHAN SHUNDE SUN YAT-SEN UNIVERSITY Research Institute

Country or region before: China

Patentee before: SYSU-CMU SHUNDE INTERNATIONAL JOINT Research Institute

Patentee before: SUN YAT-SEN University