CN110298387A - 融入像素级attention机制的深度神经网络目标检测方法 - Google Patents
融入像素级attention机制的深度神经网络目标检测方法 Download PDFInfo
- Publication number
- CN110298387A CN110298387A CN201910498118.4A CN201910498118A CN110298387A CN 110298387 A CN110298387 A CN 110298387A CN 201910498118 A CN201910498118 A CN 201910498118A CN 110298387 A CN110298387 A CN 110298387A
- Authority
- CN
- China
- Prior art keywords
- image
- training
- pixel
- network
- attention mechanism
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 44
- 230000007246 mechanism Effects 0.000 title claims abstract description 28
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000013461 design Methods 0.000 claims abstract description 7
- 230000000694 effects Effects 0.000 claims abstract description 7
- 238000005070 sampling Methods 0.000 claims abstract description 7
- 230000002708 enhancing effect Effects 0.000 claims abstract description 3
- 238000012360 testing method Methods 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 239000011248 coating agent Substances 0.000 claims description 2
- 238000000576 coating method Methods 0.000 claims description 2
- 238000002203 pretreatment Methods 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 claims 1
- 210000005036 nerve Anatomy 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/758—Involving statistics of pixels or of feature values, e.g. histogram matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种融入像素级attention机制的深度神经网络目标检测方法,包括下列步骤:收集训练样本图像;将收集到的图像数据集中的数据通过预处理转为训练深度卷积神经网络所要求的格式,并进行数据增强以提升神经网络的训练效果;设计融入像素级attention机制的深度卷积神经网络结构,该网络结构用于接收输入图像并对图像中的物体输出边界框回归信息和类别信息:网络结构包括两部分,一部分是用来初步提取特征的基础网络;另一部分为在基础网络末端添加的多个级联的卷积层或下采样层,用于提取不同尺度的卷积特征图,将多尺度特征图与像素级attention机制融合;训练。
Description
技术领域
本发明涉及一种图像中目标检测方法,特别是涉及一种融入像素级attention机制的神经网络目标检测方法。
背景技术
随着社会的发展和科技的进步,卷积神经网络在计算机视觉领域逐步克服了传统方法的缺陷,已被证明是解决各种视觉任务的有效模型,被应用于许多实际场景。卷积神经网络建立在卷积运算的基础上,通过融合局部感受野内的空间信息和通道信息来提取信息特征。卷积神经网络通过叠加一系列非线性卷积层和下采样层,能够捕获具有全局感受野的分层特征作为强大的图像描述。为了提高网络的表示能力,许多现有的工作已经显示出增强空间编码的好处。JieHu等人提出了“Squeeze-and-Excitation”模块,通过显式地建模通道之间的相互依赖关系,自适应地重新校准通道式的特征响应,提出了通道注意力机制。通过将这些块堆叠在一起,构建了SENet架构,在具有挑战性的图像分类数据集中以微小的计算成本提升取得了分类准确率的提升。
目标检测是计算机视觉领域的重要研究方向之一,目标检测技术在智能医疗、无人驾驶和机器人等实际场景均有重要的应用价值。基于图像输入的目标检测任务要求针对图像中的物体给出边界框坐标信息和物体的类别信息,因此目标检测任务是一个对位置敏感的任务,SENet架构尽管对图像分类有一定的改善,但是“Squeeze-and-Excitation”模块首先对特征平面的每个通道进行全局池化,损失了特征平面的位置信息,直接将SENet架构迁移到目标检测任务中则不能对物体的边界框定位有任何的帮助。GRP-DSOD在目标检测网络中融入“Squeeze-and-Excitation”模块来提升特征平面通道间表征能力的同时还引入了一个门控预测策略在不同目标尺寸的尺度预测上自适应地增强或减弱监督,来提升神经网络的检测效果,并加快神经网络的收敛。
上述方法尽管在对物体的分类能力上有所改进,但没能提升物体边界框的检测精确度。为了使神经网络对物体的定位更加精确,本专利提出了一种新的方法,用于进一步提升深度神经网络的性能。
[1]Hu,J.,Shen,L.,&Sun,G.(2018).Squeeze-and-excitation networks.InProceedings of the IEEE Conference on Computer Vision and Pattern Recognition(pp.7132-7141).
[2]Shen,Z.,Shi,H.,Feris,R.,Cao,L.,Yan,S.,Liu,D.,...&Huang,T.S.(2017).Learning Object Detectors from Scratch with Gated Recurrent FeaturePyramids.arXiv preprint arXiv:1712.00886.
发明内容
本专利提供一种融入像素级attention机制的深度神经网络目标检测方法,以解决现有目标检测技术中对物体的定位不够精确的问题,该方法能够有效的提取特征,以较低的计算成本提高神经的目标检测能力,以取得较高的检测速度和定位精度。技术方案如下:
一种融入像素级attention机制的深度神经网络目标检测方法,包括下列步骤:
1)收集训练样本图像,要求图像为包含RGB三通道的彩色图像,并附有物体检测框标注和每个物体的类别标注信息。
2)将收集到的图像数据集中的数据通过预处理转为训练深度卷积神经网络所要求的格式,并进行数据增强以提升神经网络的训练效果;
3)图像集划分;将收集到的数据集划分为训练集,验证集和测试集三个部分,训练集用于训练深度卷积神经网络,验证集用于选择最优的训练模型,测试集用于后续测试模型的效果或在实际应用时测试使用;
4)设计融入像素级attention机制的深度卷积神经网络结构,该网络结构用于接收输入图像并对图像中的物体输出边界框回归信息和类别信息:网络结构包括两部分,一部分是用来初步提取特征的基础网络,基础网络结构包含卷积层、批量正则化层、激活函数层、下采样层,设计每个层的特征图个数和输入输出的尺寸;另一部分为在基础网络末端添加的多个级联的卷积层或下采样层,用于提取不同尺度的卷积特征图,每个卷积层利用多个卷积核学习局部感受野上的信息,生成特征图,实现特征提取;每个卷积核只能根据上一层的感受野内的局部特征进行计算生成该层新的特征,将多尺度特征图与像素级attention机制融合,即在用于检测的每一个尺度的特征图上均置入像素级attention机制模块,学习多尺度特征图中不同位置的特征的关系,自适应的调整每个特征点的权重,然后对原特征图与对应的权重相乘后再输入检测模块,其中,像素级attention机制的具体步骤如下:
a)给定一组卷积特征图F∈RH×W×C,长和宽为H和W,通道数为C,首先应用1×1卷积层将通道数压缩为1,该层输出特征图为Z∈RH×W×1,即Z=W1×1conv*F;
b)构造基于sigmoid函数的门限机制,来学习特征图中每个特征点的权重;首先通过全连接层将输入的H×W个特征点压缩为原来的1/16,经过Relu激活层后再通过一个全连接层还原至H×W个特征点,以实现学习较远特征点之间的关系,并突出重要的特征位置;之后利用Sigmoid函数将各个特征点的权重归一化至[0,1];最后,通过乘法多尺度特征图中的每个位置的特征点乘以对应位置的权重,完成像素级特征的自适应标定过程;
5)定义目标检测的损失函数;训练阶段要对图像中物体的类别和边界框偏移量进行回归;
6)随机初始化神经网络各层的参数,并设置足够完成训练的迭代次数和合适的学习率;随机输入训练集里的图像,经过步骤4)的深度卷积神经网络输出检测结果,并通过损失函数计算相应的损失值,再通过随机梯度下降算法,计算出损失值对每个参数的梯度,根据学习率对网络中的参数逐层更新,即可实现一轮网络模型的训练;重复步骤上述步骤,直到网络的训练达到预先设置好的迭代次数为止。
(2)的方法如下:
a)将数据集中的图像缩放到m×n像素大小,标签数据也根据对应的比例缩放到对应的大小;
b)对缩放之后的图像随机裁剪包含标签的地方得到a×b像素大小的矩形图像,其中a≤m,b≤m;
c)以0.5的概率随机水平翻转裁剪后的图像;
d)依照均值为0方差为1的高斯分布,随机调整图像的亮度、对比度、饱和度;
e)将经过上述预处理步骤的图像各通道中的像素值从[0,255]均匀转换到[-1,1]范围内。
本发明的有益效果在于,将融入像素级attention机制的深度卷积神经网络用于目标检测任务中,可以保证网络具有学习图像中较远距离特征关系的能力,进一步提升网络的检测准确率。同时,该方法实现简单,仅需在现有的单阶段检测网络中融入像素级attention机制即可,计算复杂度较低。较好的平衡了检测速度和精度之间的关系。该方法具有较强的泛化能力。
附图说明
图1为本发明一种融入像素级attention机制的深度神经网络目标检测方法流程图。
图2为本发明融入像素级attention机制的深度神经网络目标检测方法结构示意图。
具体实施方式
下面结合附图和具体实例对本专利作进一步的描述。
本专利可应用于图像目标检测任务,但不局限于此任务。融入像素级attention机制的深度卷积神经网络也可用于解决例如语义分割等对位置敏感的诸多任务。图1是本方法示例的流程图。图2描述了本发明融入像素级attention机制的深度卷积神经网络用于图像目标检测的方法结构示意图。
将本发明应用于图像目标检测任务中,主要包含三个步骤:收集图像,准备数据集;设计并训练融入像素级attention机制的深度卷积神经网络;测试/应用检测模型。其具体实现步骤描述如下:
第一步:收集图像,准备数据集。
(1)收集图像。收集各种含有不同类别物体的图像,并对图像中物体的坐标和类别进行标注。对收集到的图像进行预处理,作为一种示例,将数据集中的所有图像转换为350×350的尺寸,标签数据也根据相应比例缩放到对应大小。在缩放后的图像上随机裁剪出大小为300x300像素的正方形图像。以0.5的概率水平翻转裁剪后的图像,按照均值为0方差为1的高斯分布调整图像的亮度、饱和度、对比度。将经过以上全部步骤处理后的图像各通道像素值转换到[-1,1]范围内。
(2)图像集划分。将收集的图像划分为训练集,验证集和测试集。训练集用于训练深度卷积神经网络,验证集用于选择训练后最佳的深度神经网络模型,测试集为后续测试模型效果或实际应用时使用。
第二步:设计并训练融入像素级attention机制的深度卷积神经网络。
(1)设计卷积神经网络结构。设计应用于目标检测的融入像素级attention机制的神经网络结构,示例如图2所示,选择VGG-16作为特征提取基础网络,将VGG16的FC6和FC7层转换为卷积层,即FC6层变成CONV6层,FC7层变成CONV7层。在FC7层后面添加一系列下采样层和卷积层,生成多个不同尺度的卷积特征图。选择CONV4_3层、CONV7层、CONV8_2层、CONV9_2层、CONV10_2层、CONV11_2层输出的特征图用于目标检测。将上述特征图与像素级attention机制结合,对特征图各个位置的特征之间的关系进行建模,优化网络的特征表达能力。将增强后的特征图检测模型进行目标位置回归和分类。最后使用非极大值抑制过滤重复的物体边界框,作为最终的检测结果。定义网络的损失函数,定位损失函数为SmoothL1Loss,分类任务损失函数为SoftmaxLoss。总的损失函数是上述两个损失函数的加权和。
(2)训练设计好的深度卷积神经网络。将训练数据批量的输入到该网络中,进行计算和训练,具体步骤如下:
a)初始化网络各层的参数,对所有卷积层采用均值为0,标准差为0.02的高斯分布进行初始化,而对所有的批量正则化层采用均值为1,标准差为0.02的高斯分布进行初始化。
b)将经过步骤一处理的图像批量输入到设计好的深度神经网路结构中,经过神经网络各层的计算,网络的输出层输出类别信息和回归框的坐标信息。
c)计算损失函数的值并进行反向传播,按照梯度下降法逐层更新网络权重。
d)循环步骤b)~c),经过多次迭代后,损失函数值逐步降到最低,验证集检测准确率逐渐上升,得到训练好的神经网络模型。
第三步:测试训练好的网络模型。
(1)将训练结束后的网络参数加载到神经网络结构中,并将测试集中的图片批量或单张的输入到训练好的模型中。
(2)前向计算,将数据依次通过深度卷积神经网络的各层,计算出网络的输出值,得出检测结果。
(3)根据目标检测的评价指标计算出网络目标检测的mAP和检测速度。
Claims (2)
1.一种融入像素级attention机制的深度神经网络目标检测方法,包括下列步骤:
1)收集训练样本图像,要求图像为包含RGB三通道的彩色图像,并附有物体检测框标注和每个物体的类别标注信息。
2)将收集到的图像数据集中的数据通过预处理转为训练深度卷积神经网络所要求的格式,并进行数据增强以提升神经网络的训练效果;
3)图像集划分;将收集到的数据集划分为训练集,验证集和测试集三个部分,训练集用于训练深度卷积神经网络,验证集用于选择最优的训练模型,测试集用于后续测试模型的效果或在实际应用时测试使用;
4)设计融入像素级attention机制的深度卷积神经网络结构,该网络结构用于接收输入图像并对图像中的物体输出边界框回归信息和类别信息:网络结构包括两部分,一部分是用来初步提取特征的基础网络,基础网络结构包含卷积层、批量正则化层、激活函数层、下采样层,设计每个层的特征图个数和输入输出的尺寸;另一部分为在基础网络末端添加的多个级联的卷积层或下采样层,用于提取不同尺度的卷积特征图,每个卷积层利用多个卷积核学习局部感受野上的信息,生成特征图,实现特征提取;每个卷积核只能根据上一层的感受野内的局部特征进行计算生成该层新的特征,将多尺度特征图与像素级attention机制融合,即在用于检测的每一个尺度的特征图上均置入像素级attention机制模块,学习多尺度特征图中不同位置的特征的关系,自适应的调整每个特征点的权重,然后对原特征图与对应的权重相乘后再输入检测模块,其中,像素级attention机制的具体步骤如下:
a)给定一组卷积特征图F∈RH×W×C,长和宽为H和W,通道数为C,首先应用1×1卷积层将通道数压缩为1,该层输出特征图为Z∈RH×W×1,即Z=W1×1conv*F;
b)构造基于sigmoid函数的门限机制,来学习特征图中每个特征点的权重;首先通过全连接层将输入的H×W个特征点压缩为原来的1/16,经过Relu激活层后再通过一个全连接层还原至H×W个特征点,以实现学习较远特征点之间的关系,并突出重要的特征位置;之后利用Sigmoid函数将各个特征点的权重归一化至[0,1];最后,通过乘法多尺度特征图中的每个位置的特征点乘以对应位置的权重,完成像素级特征的自适应标定过程;
5)定义目标检测的损失函数;训练阶段要对图像中物体的类别和边界框偏移量进行回归;
6)随机初始化神经网络各层的参数,并设置足够完成训练的迭代次数和合适的学习率;随机输入训练集里的图像,经过步骤4)的深度卷积神经网络输出检测结果,并通过损失函数计算相应的损失值,再通过随机梯度下降算法,计算出损失值对每个参数的梯度,根据学习率对网络中的参数逐层更新,即可实现一轮网络模型的训练;重复步骤上述步骤,直到网络的训练达到预先设置好的迭代次数为止。
2.根据权利要求1所述的方法,其特征在于,(2)的方法如下:
a)将数据集中的图像缩放到m×n像素大小,标签数据也根据对应的比例缩放到对应的大小;
b)对缩放之后的图像随机裁剪包含标签的地方得到a×b像素大小的矩形图像,其中a≤m,b≤m;
c)以0.5的概率随机水平翻转裁剪后的图像;
d)依照均值为0方差为1的高斯分布,随机调整图像的亮度、对比度、饱和度;
e)将经过上述预处理步骤的图像各通道中的像素值从[0,255]均匀转换到[-1,1]范围内。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910498118.4A CN110298387A (zh) | 2019-06-10 | 2019-06-10 | 融入像素级attention机制的深度神经网络目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910498118.4A CN110298387A (zh) | 2019-06-10 | 2019-06-10 | 融入像素级attention机制的深度神经网络目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110298387A true CN110298387A (zh) | 2019-10-01 |
Family
ID=68027819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910498118.4A Pending CN110298387A (zh) | 2019-06-10 | 2019-06-10 | 融入像素级attention机制的深度神经网络目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110298387A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110796665A (zh) * | 2019-10-21 | 2020-02-14 | Oppo广东移动通信有限公司 | 图像分割方法及相关产品 |
CN111080729A (zh) * | 2019-12-24 | 2020-04-28 | 山东浪潮人工智能研究院有限公司 | 基于Attention机制的训练图片压缩网络的构建方法及系统 |
CN111242839A (zh) * | 2020-01-13 | 2020-06-05 | 华南理工大学 | 一种基于尺度等级的图像缩放裁剪方法 |
CN111461190A (zh) * | 2020-03-24 | 2020-07-28 | 华南理工大学 | 一种基于深度卷积神经网络的非均衡船舶分类方法 |
CN111476159A (zh) * | 2020-04-07 | 2020-07-31 | 哈尔滨工业大学 | 一种基于双角回归的检测模型训练、检测方法及装置 |
CN111681228A (zh) * | 2020-06-09 | 2020-09-18 | 创新奇智(合肥)科技有限公司 | 瑕疵检测模型、训练方法、检测方法、装置、设备及介质 |
CN111754507A (zh) * | 2020-07-03 | 2020-10-09 | 征图智能科技(江苏)有限公司 | 一种轻量化的基于强注意力机制的工业缺陷图像分类方法 |
CN111860683A (zh) * | 2020-07-30 | 2020-10-30 | 中国人民解放军国防科技大学 | 一种基于特征融合的目标检测方法 |
CN112116538A (zh) * | 2020-09-04 | 2020-12-22 | 海略(连云港)科技有限公司 | 一种基于深度神经网络的海洋勘测图像质量增强方法 |
CN112257728A (zh) * | 2020-11-12 | 2021-01-22 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备以及存储介质 |
CN112883807A (zh) * | 2021-01-22 | 2021-06-01 | 中汽创智科技有限公司 | 车道线检测方法和系统 |
CN113128316A (zh) * | 2020-01-15 | 2021-07-16 | 北京四维图新科技股份有限公司 | 目标检测方法及装置 |
CN113283390A (zh) * | 2021-06-24 | 2021-08-20 | 中国人民解放军国防科技大学 | 基于门控多尺度匹配网络的sar图像小样本目标识别方法 |
CN113392823A (zh) * | 2021-04-30 | 2021-09-14 | 杭州电子科技大学 | 一种基于深度网络回归的油位表读数方法 |
CN113409300A (zh) * | 2021-07-12 | 2021-09-17 | 上海市第一人民医院 | 基于人工智能技术的新冠肺炎数据处理系统 |
CN113934302A (zh) * | 2021-10-21 | 2022-01-14 | 燕山大学 | 基于SeNet和门控时序卷积网络的肌电手势识别方法 |
CN113971745A (zh) * | 2021-09-27 | 2022-01-25 | 哈尔滨工业大学 | 一种基于深度神经网络的出入境验讫章识别方法及装置 |
CN114821018A (zh) * | 2022-04-11 | 2022-07-29 | 北京航空航天大学 | 一种利用多方向性特征构造卷积神经网络的红外弱小目标检测方法 |
TWI793516B (zh) * | 2021-02-04 | 2023-02-21 | 國立中興大學 | 神經網路之自適應調節批量大小的訓練方法 |
CN115965571A (zh) * | 2022-04-28 | 2023-04-14 | 锋睿领创(珠海)科技有限公司 | 增量自主学习的多源信息融合检测、模型训练方法和介质 |
CN116385466A (zh) * | 2023-05-05 | 2023-07-04 | 北京信息科技大学 | 一种基于边界框弱标注的图像中目标分割方法及系统 |
CN117408304A (zh) * | 2023-12-14 | 2024-01-16 | 江苏未来网络集团有限公司 | 6d姿态预测神经网络模型及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170011280A1 (en) * | 2015-07-07 | 2017-01-12 | Xerox Corporation | Extracting gradient features from neural networks |
CN107506822A (zh) * | 2017-07-26 | 2017-12-22 | 天津大学 | 一种基于空间融合池化的深度神经网络方法 |
CN108510012A (zh) * | 2018-05-04 | 2018-09-07 | 四川大学 | 一种基于多尺度特征图的目标快速检测方法 |
CN108564097A (zh) * | 2017-12-05 | 2018-09-21 | 华南理工大学 | 一种基于深度卷积神经网络的多尺度目标检测方法 |
CN109145713A (zh) * | 2018-07-02 | 2019-01-04 | 南京师范大学 | 一种结合目标检测的小目标语义分割方法 |
CN109165697A (zh) * | 2018-10-12 | 2019-01-08 | 福州大学 | 一种基于注意力机制卷积神经网络的自然场景文字检测方法 |
CN109584248A (zh) * | 2018-11-20 | 2019-04-05 | 西安电子科技大学 | 基于特征融合和稠密连接网络的红外面目标实例分割方法 |
-
2019
- 2019-06-10 CN CN201910498118.4A patent/CN110298387A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170011280A1 (en) * | 2015-07-07 | 2017-01-12 | Xerox Corporation | Extracting gradient features from neural networks |
CN107506822A (zh) * | 2017-07-26 | 2017-12-22 | 天津大学 | 一种基于空间融合池化的深度神经网络方法 |
CN108564097A (zh) * | 2017-12-05 | 2018-09-21 | 华南理工大学 | 一种基于深度卷积神经网络的多尺度目标检测方法 |
CN108510012A (zh) * | 2018-05-04 | 2018-09-07 | 四川大学 | 一种基于多尺度特征图的目标快速检测方法 |
CN109145713A (zh) * | 2018-07-02 | 2019-01-04 | 南京师范大学 | 一种结合目标检测的小目标语义分割方法 |
CN109165697A (zh) * | 2018-10-12 | 2019-01-08 | 福州大学 | 一种基于注意力机制卷积神经网络的自然场景文字检测方法 |
CN109584248A (zh) * | 2018-11-20 | 2019-04-05 | 西安电子科技大学 | 基于特征融合和稠密连接网络的红外面目标实例分割方法 |
Non-Patent Citations (4)
Title |
---|
YING ZHANG ET AL.: "Object Detection Network Based on Feature Fusion and Attention Mechanism", 《FUTURE INTERNET》 * |
ZHIQIANG SHEN ET AL.: "DSOD: Learning Deeply Supervised Object Detectors from Scratch", 《2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 * |
孙萍等: "结合注意力机制的深度学习图像目标检测", 《计算机工程与应用》 * |
徐诚极等: "Attention-YOLO:引入注意力机制的YOLO检测算法", 《计算机工程与应用》 * |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110796665A (zh) * | 2019-10-21 | 2020-02-14 | Oppo广东移动通信有限公司 | 图像分割方法及相关产品 |
CN110796665B (zh) * | 2019-10-21 | 2022-04-22 | Oppo广东移动通信有限公司 | 图像分割方法及相关产品 |
CN111080729A (zh) * | 2019-12-24 | 2020-04-28 | 山东浪潮人工智能研究院有限公司 | 基于Attention机制的训练图片压缩网络的构建方法及系统 |
CN111080729B (zh) * | 2019-12-24 | 2023-06-13 | 山东浪潮科学研究院有限公司 | 基于Attention机制的训练图片压缩网络的构建方法及系统 |
CN111242839A (zh) * | 2020-01-13 | 2020-06-05 | 华南理工大学 | 一种基于尺度等级的图像缩放裁剪方法 |
CN111242839B (zh) * | 2020-01-13 | 2023-04-21 | 华南理工大学 | 一种基于尺度等级的图像缩放裁剪方法 |
CN113128316A (zh) * | 2020-01-15 | 2021-07-16 | 北京四维图新科技股份有限公司 | 目标检测方法及装置 |
CN111461190A (zh) * | 2020-03-24 | 2020-07-28 | 华南理工大学 | 一种基于深度卷积神经网络的非均衡船舶分类方法 |
CN111461190B (zh) * | 2020-03-24 | 2023-03-28 | 华南理工大学 | 一种基于深度卷积神经网络的非均衡船舶分类方法 |
CN111476159A (zh) * | 2020-04-07 | 2020-07-31 | 哈尔滨工业大学 | 一种基于双角回归的检测模型训练、检测方法及装置 |
CN111476159B (zh) * | 2020-04-07 | 2023-04-07 | 哈尔滨工业大学 | 一种基于双角回归的检测模型训练、检测方法及装置 |
CN111681228A (zh) * | 2020-06-09 | 2020-09-18 | 创新奇智(合肥)科技有限公司 | 瑕疵检测模型、训练方法、检测方法、装置、设备及介质 |
CN111754507A (zh) * | 2020-07-03 | 2020-10-09 | 征图智能科技(江苏)有限公司 | 一种轻量化的基于强注意力机制的工业缺陷图像分类方法 |
CN111860683B (zh) * | 2020-07-30 | 2021-04-27 | 中国人民解放军国防科技大学 | 一种基于特征融合的目标检测方法 |
CN111860683A (zh) * | 2020-07-30 | 2020-10-30 | 中国人民解放军国防科技大学 | 一种基于特征融合的目标检测方法 |
CN112116538A (zh) * | 2020-09-04 | 2020-12-22 | 海略(连云港)科技有限公司 | 一种基于深度神经网络的海洋勘测图像质量增强方法 |
CN112257728A (zh) * | 2020-11-12 | 2021-01-22 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备以及存储介质 |
CN112257728B (zh) * | 2020-11-12 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备以及存储介质 |
CN112883807A (zh) * | 2021-01-22 | 2021-06-01 | 中汽创智科技有限公司 | 车道线检测方法和系统 |
TWI793516B (zh) * | 2021-02-04 | 2023-02-21 | 國立中興大學 | 神經網路之自適應調節批量大小的訓練方法 |
CN113392823A (zh) * | 2021-04-30 | 2021-09-14 | 杭州电子科技大学 | 一种基于深度网络回归的油位表读数方法 |
CN113392823B (zh) * | 2021-04-30 | 2024-03-19 | 杭州电子科技大学 | 一种基于深度网络回归的油位表读数方法 |
CN113283390A (zh) * | 2021-06-24 | 2021-08-20 | 中国人民解放军国防科技大学 | 基于门控多尺度匹配网络的sar图像小样本目标识别方法 |
CN113283390B (zh) * | 2021-06-24 | 2022-03-08 | 中国人民解放军国防科技大学 | 基于门控多尺度匹配网络的sar图像小样本目标识别方法 |
CN113409300A (zh) * | 2021-07-12 | 2021-09-17 | 上海市第一人民医院 | 基于人工智能技术的新冠肺炎数据处理系统 |
CN113971745A (zh) * | 2021-09-27 | 2022-01-25 | 哈尔滨工业大学 | 一种基于深度神经网络的出入境验讫章识别方法及装置 |
CN113971745B (zh) * | 2021-09-27 | 2024-04-16 | 哈尔滨工业大学 | 一种基于深度神经网络的出入境验讫章识别方法及装置 |
CN113934302B (zh) * | 2021-10-21 | 2024-02-06 | 燕山大学 | 基于SeNet和门控时序卷积网络的肌电手势识别方法 |
CN113934302A (zh) * | 2021-10-21 | 2022-01-14 | 燕山大学 | 基于SeNet和门控时序卷积网络的肌电手势识别方法 |
CN114821018A (zh) * | 2022-04-11 | 2022-07-29 | 北京航空航天大学 | 一种利用多方向性特征构造卷积神经网络的红外弱小目标检测方法 |
CN114821018B (zh) * | 2022-04-11 | 2024-05-31 | 北京航空航天大学 | 一种利用多方向性特征构造卷积神经网络的红外弱小目标检测方法 |
CN115965571A (zh) * | 2022-04-28 | 2023-04-14 | 锋睿领创(珠海)科技有限公司 | 增量自主学习的多源信息融合检测、模型训练方法和介质 |
CN115965571B (zh) * | 2022-04-28 | 2023-08-22 | 锋睿领创(珠海)科技有限公司 | 增量自主学习的多源信息融合检测、模型训练方法和介质 |
CN116385466A (zh) * | 2023-05-05 | 2023-07-04 | 北京信息科技大学 | 一种基于边界框弱标注的图像中目标分割方法及系统 |
CN117408304B (zh) * | 2023-12-14 | 2024-02-27 | 江苏未来网络集团有限公司 | 6d姿态预测神经网络模型系统及方法 |
CN117408304A (zh) * | 2023-12-14 | 2024-01-16 | 江苏未来网络集团有限公司 | 6d姿态预测神经网络模型及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298387A (zh) | 融入像素级attention机制的深度神经网络目标检测方法 | |
CN109584248B (zh) | 基于特征融合和稠密连接网络的红外面目标实例分割方法 | |
CN113065558B (zh) | 一种结合注意力机制的轻量级小目标检测方法 | |
CN110298266B (zh) | 基于多尺度感受野特征融合的深度神经网络目标检测方法 | |
CN111814661B (zh) | 基于残差-循环神经网络的人体行为识别方法 | |
CN111291809B (zh) | 一种处理装置、方法及存储介质 | |
CN111310862A (zh) | 复杂环境下基于图像增强的深度神经网络车牌定位方法 | |
CN108830196A (zh) | 基于特征金字塔网络的行人检测方法 | |
CN108171112A (zh) | 基于卷积神经网络的车辆识别与跟踪方法 | |
CN113807464B (zh) | 基于改进yolo v5的无人机航拍图像目标检测方法 | |
CN109635744A (zh) | 一种基于深度分割网络的车道线检测方法 | |
CN110263833A (zh) | 基于编码-解码结构的图像语义分割方法 | |
CN104299006A (zh) | 一种基于深度神经网络的车牌识别方法 | |
CN104517103A (zh) | 一种基于深度神经网络的交通标志分类方法 | |
CN111368972B (zh) | 一种卷积层量化方法及其装置 | |
CN111832592B (zh) | Rgbd显著性检测方法以及相关装置 | |
CN114255238A (zh) | 一种融合图像特征的三维点云场景分割方法及系统 | |
CN110610210B (zh) | 一种多目标检测方法 | |
CN113160062B (zh) | 一种红外图像目标检测方法、装置、设备及存储介质 | |
CN107220643A (zh) | 基于紧凑型神经网络的深度学习模型的交通标志识别系统 | |
CN110991444A (zh) | 面向复杂场景的车牌识别方法及装置 | |
CN114972208B (zh) | 一种基于YOLOv4的轻量化小麦赤霉病检测方法 | |
CN109919246A (zh) | 基于自适应特征聚类和多重损失融合的行人重识别方法 | |
CN109086765B (zh) | 车牌识别方法、装置、介质、服务器和行车记录仪 | |
CN110930378A (zh) | 基于低数据需求的肺气肿影像处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191001 |
|
RJ01 | Rejection of invention patent application after publication |