CN112508099A - 一种实时目标检测的方法和装置 - Google Patents
一种实时目标检测的方法和装置 Download PDFInfo
- Publication number
- CN112508099A CN112508099A CN202011429134.7A CN202011429134A CN112508099A CN 112508099 A CN112508099 A CN 112508099A CN 202011429134 A CN202011429134 A CN 202011429134A CN 112508099 A CN112508099 A CN 112508099A
- Authority
- CN
- China
- Prior art keywords
- feature
- feature map
- layer
- target
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000001514 detection method Methods 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims description 53
- 238000005070 sampling Methods 0.000 claims description 34
- 230000004927 fusion Effects 0.000 claims description 26
- 230000007704 transition Effects 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 21
- 238000013527 convolutional neural network Methods 0.000 claims description 20
- 238000013507 mapping Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种实时目标检测的方法和装置,所述方法包括:获取目标对象的原始图像;对所述原始图像进行特征提取,获得多个不同尺度的特征图;对多个不同多尺度的特征图进行融合,得到多个目标图像。本发明的技术方案,克服了现有技术目标检测方法和装置精度差和检测速度较慢的问题。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种实时目标检测的方法和装置。
背景技术
基于深度学习的通用目标检测方法可以分为两类,第一类是两阶段目标检测方法,如R-CNN,FastR-CNN,FasterR-CNN,MaskR-CNN等。这些算法将目标检测过程分为两个阶段。首先生成候选目标的稀疏值,提取候选目标的特征信息,然后进一步预测和识别候选目标的位置和类别。这些方法不适合一些实时情况。第二类是单阶段目标检测算法,如OverFeat,SSD,DSSD,YOLOV3等。此类方法不需要首先生成候选目标,直接通过网络预测目标的位置和类别。因此,单阶段目标检测方法具有更快的检测速度。
上述基于深度学习的目标检测在精度和速度上取得了显著的提升,为无人机输电线路智能巡检的落地应用提供了更多的条件和可能。但由于参数量多导致在资源受限的嵌入式设备上运行速度较慢。现有技术针对YOLOv3目标检测的卷积层和通道层进行剪枝操作,在检测精度略有下降的情况下,推理时间和参数量大大减少,适合于在无人机中部署目标检测。现有技术针对无人机航拍目标检测精度较低等问题,提出一种基于残差网络的航拍目标检测,并引入跳跃连接机制和特征融合机制,提升了目标检测的精度和速度。无人机输电线路巡检过程中,连接部件距离无人机较远,目标特征不明显且目标尺度不一致,给输电线路连接部件的实时检测带来了一定挑战。
此外,上述目标检测均采用计算资源强大的服务器进行分析,若直接部署在资源受限的嵌入式平台进行检测,检测速度很慢甚至无法运行,不能满足无人机实时巡检的需求。
发明内容
本发明提供一种实时目标检测的方法和装置,用于克服现有技术目标检测方法和装置精度差和检测速度较慢的问题。
为了解决上述技术问题,本发明实施例提供如下技术问题:
一种实时目标检测的方法,包括:
获取目标对象的原始图像;
对所述原始图像进行特征提取,获得多个不同尺度的特征图;
对多个不同多尺度的特征图进行融合,得到多个目标图像。
可选的,对所述原始图像进行特征提取,获得多个不同尺度的特征图,包括:
对所述原始图像缩放至目标分辨率,得到输入图像;
对所述输入图像下采样得到第一特征图;
对所述第一特征图下采样得到第二特征图;
对所述第二特征图下采样得到第三特征图;
对所述第三特征图下采样得到第四特征图;
对所述第四特征图下采样得到第五特征图。
可选的,所述第三特征图的分辨率是第四特征图的分辨率的2倍,所述第四特征图的分辨率是第五特征图的分辨率的2倍。
可选的,对多个不同多尺度的特征图进行融合,得到多个目标图像,包括:
将所述第五特征图输入至特征融合模块的第一CBL单元,并进行上采样得到第一结果,并输出至第二CBL单元;
将所述第四特征图与所述第二CBL单元的输出进行合并,得到第二结果,输入到第三CBL单元,并进行上采样,得到第三结果,并输出至第四CBL单元;
将所述第三特征图与所述第四CBL单元的输出进行合并,得到第四结果;
分别将所述第一结果、第二结果、第四结果通过卷积神经网络进行处理,得到多个目标图像。
可选的,还包括:在不同尺度的特征图上构造k个不同比例的锚框,对锚框进行分类和位置回归。
可选的,所述对锚框进行分类包括:采用公式:d(boxP,boxc)=1-IOU(boxP,boxc)进行分类;
d(boxP,boxC)表示IOU得分,boxP表示目标真值框,boxc表示目标框分布的聚类中心。
可选的,所述卷积神经网络的特征提取模块包括:
通过依次连接的输入层、处理层以及过渡层对所述原始图像进行特征提取;
所述处理层包括第一处理层和第二处理层,所述第一处理层、第二处理层分别与过渡层连接;所述第二处理层包括依次连接的基础层、残差单元以及中间过渡层;
所述输入层对所述原始图像进行多次下采样并通过第一处理层直接映射获取低层特征图然后进入所述过渡层;
所述输入层对所述原始图像进行多次下采样并通过第二处理层残差处理获取高层特征图然后进入所述过渡层。
可选的,所述卷积神经网络的特征融合模块包括:
通过空间特征融合层将所述低层特征图与高层特征图合并,获取合并特征图。
可选的,所述卷积神经网络的特征融合模块还包括:
通过所述特征增强层的多分支卷积将所述高层特征图并联生成图像特征并进行通道合并,然后进行空洞卷积处理。
本发明实施例还提供一种实时目标检测的装置,包括:
特征提取模块,用于获取目标对象的原始图像;对所述原始图像进行特征提取,获得多个不同尺度的特征图;
特征融合模块,用于对多个不同多尺度的特征图进行融合,得到多个目标图像。
本发明的实施例,具有如下技术效果:
本发明实施例的上述技术方案,包括特征提取模块和特征融合模块,特征提取模块在残差网络基础上引入跨阶段局部网络,获取信息丰富的特征图,减少参数量;特征融合模块充分融合不同层次的特征信息,实现了精确目标检测,克服了现有技术目标检测精度差和检测速度较慢的问题。
附图说明
图1为本发明实施例提供的实时目标检测的方法的流程示意图;
图2为本发明实施例提供的实时目标检测的装置的运行示意图;
图3为本发明实施例提供的装置的部分模块的工作原理示意图;
图4为本发明实施例提供的残差网络示意图;
图5为本发明实施例提供的特征提取模块的结构示意图;
图6为本发明实施例提供的空间特征融合层结构示意图;
图7为本发明实施例提供的特征增强层结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
如图1所示,本发明实施例提供一种实时目标检测的方法,包括:
S1:获取目标对象的原始图像;
S2:对所述原始图像进行特征提取,获得多个不同尺度的特征图;
S3:对多个不同多尺度的特征图进行融合,得到多个目标图像。
本发明实施例的上述技术方案,包括特征提取模块(CSPResNet)和特征融合模块,特征提取模块在残差网络基础上引入跨阶段局部网络,获取信息丰富的特征图,减少参数量;特征融合模块充分融合不同层次的特征信息,实现了精确目标检测,克服了目标检测精度差和检测速度较慢的问题。
本发明一可选的实施例,步骤S2中,对所述原始图像进行特征提取,获得多个不同尺度的特征图,包括:
对所述原始图像缩放至目标分辨率,得到输入图像;
对所述输入图像下采样得到第一特征图;
对所述第一特征图下采样得到第二特征图;
对所述第二特征图下采样得到第三特征图;
对所述第三特征图下采样得到第四特征图;
对所述第四特征图下采样得到第五特征图。
具体的,如图2所示,原始图像采用416×416的图像分辨率,特征提取模块对获取的原始图像进行5次下采操作,采用步长为2的卷积进行下采样,对原始图像不断压缩尺寸,每次压缩为被压缩图像的一半,可以对输入的特征图进行压缩,减少网络计算复杂度,同时对特征压缩,以提取主要特征,最终获得待处理的第三特征图、第四特征图以及第五特征图。
本发明一可选的实施例,步骤S2中,所述第三特征图的分辨率是第四特征图的分辨率的2倍,所述第四特征图的分辨率是第五特征图的分辨率的2倍。
本发明一可选的实施例,步骤S3中,对多个不同多尺度的特征图进行融合,得到多个目标图像,包括:
将所述第五特征图输入至特征融合模块的第一CBL单元,并进行上采样得到第一结果,并输出至第二CBL单元;
将所述第四特征图与所述第二CBL单元的输出进行合并,得到第二结果,输入到第三CBL单元,并进行上采样,得到第三结果,并输出至第四CBL单元;
将所述第三特征图与所述第四CBL单元的输出进行合并,得到第四结果;
分别将所述第一结果、第二结果、第四结果通过卷积神经网络进行处理,得到多个目标图像。
如图3所示,CBL包括向量卷积运算Conv、批处理规范BN以及带泄露修正线性单元函数Leak-RELU。
Res(ResNet,残差网络)包括直接相加,或者经过一组CBL后再相加;
CSR包括直接经过Conv卷积处理,得到第一特征,或者经过CBL、Res后,再经过Conv卷积处理,得到第二特征,然后将第二特征和第一特征合并,再经过Leak-RELU处理。
其中,第一结果、第二结果、第四结果经过注意力模块处理,获得n1×n2×n3的目标图像;其中,n1×n2为网格数,n3为通道数。
具体的,以如下目标图像为例:
第一结果经过注意力模块处理,获得13×13×24的目标图像;
第二结果经过注意力模块处理,获得26×26×24的目标图像;
第四结果输入至第五CBL单元后经过注意力模块处理,获得52×52×24的目标图像;
本发明的该实施例可以得到具备不同特征信息的目标图像,其中,目标图像的通道固定为24,特征图像的信息也是固定的。
本发明一可选的实施例,还包括:在不同尺度的特征图上构造k个不同比例的锚框,对锚框进行分类和位置回归。
采用一种改进的K-means算法;聚类评价的标准是IOU评分。
通过绘制预设不同目标框数量和精度的折线图,最终选择9个不同大小的锚框作为先验框,三个最大的锚框被分配给13×13尺寸的特征图,三个中等尺寸的锚框被分配给26×26尺寸的特征图,三个小尺寸锚框被分配给52×52尺寸的特征图。
本发明一可选的实施例,所述对锚框进行分类包括:采用公式:d(boxP,boxc)=1-IOU(boxP,boxc)进行分类;
d(boxP,boxC)表示IOU得分,boxP表示目标真值框,boxc表示目标框分布的聚类中心。
本发明一可选的实施例,如图5所示,所述卷积神经网络的特征提取模块包括:
通过依次连接的输入层、处理层以及过渡层对所述原始图像进行特征提取;
所述处理层包括第一处理层和第二处理层,所述第一处理层、第二处理层分别与过渡层连接;所述第二处理层包括依次连接的第二基础层、残差单元以及中间过渡层;
所述输入层对所述原始图像进行多次下采样并通过第一处理层直接映射获取低层特征图然后进入所述过渡层;
所述输入层对所述原始图像进行多次下采样并通过第二处理层残差处理获取高层特征图然后进入所述过渡层。
具体的,如图4所示,残差网络(ResNet),分为直接映射部分和残差部分,用于使检测方法更为优化;另外,所有的卷积层后均添加批处理规范BN和非线性激活函数ReLU。
如图5所示,输入层将特征图分为两部分,一部分依次经过输入层、第一基础层、过渡层;
另一部分依次经过输入层、第二基础层、残差单元、中间过渡层、过渡层。
本发明的该实施例采用了跨阶段局部网络的策略,解决了使用显式特征映射复制进行连接的缺点;其中,过渡层是一种层次化的特征融合机制,采用截断梯度流的策略来防止不同层学习重复的梯度信息。
本发明一可选的实施例,所述卷积神经网络的特征融合模块包括:
如图6所示,通过空间特征融合层将所述低层特征图与高层特征图合并,获取合并特征图。
本发明的该实施例,首先通过特征提取模块获取不同尺度的特征图,进而采用特征融合方式进一步提升检测精度;空间特征融合层针对相应的多尺度检测层,将高层特征图进行上采样和低层特征图通过通道合并的方式进行融合,用于将高层特征图上采样得到的丰富语义信息与低层特征图包含的丰富位置信息进行充分融合,生成新的特征图,增强特征图的上下文信息,以得到含有丰富语义信息和位置信息的特征图,然后采用注意力模块关注来自相关背景的信息,而少关注来自不相关区域的信息。
本发明一可选的实施例,所述卷积神经网络的特征融合模块还包括:
如图7所示,通过所述特征增强层的多分支卷积将所述高层特征图并联生成图像特征并进行通道合并,然后进行空洞卷积处理。
具体的,为在检测阶段增加相应检测层的感受野和提高目标的检测精度,特征增强层,对于每个用于检测分支的特征图,在进行预测之前先构建一个特征增强层,上一层的特征图通过多分支卷积并联生成具有丰富信息的图像特征进行通道合并,最后应用空洞卷积扩大感受野,可以检测大尺度目标并且精确定位目标。
此外,在特征增强模块中采用1×1卷积替代3×3卷积进行类别预测和位置回归,可达到与3×3卷积模型相同的精度,大大减少模型的计算成本。
本发明实施例还提供一种实时目标检测的装置,包括:
特征提取模块,用于获取目标对象的原始图像;对所述原始图像进行特征提取,获得多个不同尺度的特征图;
特征融合模块,用于对多个不同多尺度的特征图进行融合,得到多个目标图像。
可选的,对所述原始图像进行特征提取,获得多个不同尺度的特征图,包括:
对所述原始图像缩放至目标分辨率,得到输入图像;
对所述输入图像下采样得到第一特征图;
对所述第一特征图下采样得到第二特征图;
对所述第二特征图下采样得到第三特征图;
对所述第三特征图下采样得到第四特征图;
对所述第四特征图下采样得到第五特征图。
可选的,所述第三特征图的分辨率是第四特征图的分辨率的2倍,所述第四特征图的分辨率是第五特征图的分辨率的2倍。
可选的,对多个不同多尺度的特征图进行融合,得到多个目标图像,包括:
将所述第五特征图输入至特征融合模块的第一CBL单元,并进行上采样得到第一结果,并输出至第二CBL单元;
将所述第四特征图与所述第二CBL单元的输出进行合并,得到第二结果,输入到第三CBL单元,并进行上采样,得到第三结果,并输出至第四CBL单元;
将所述第三特征图与所述第四CBL单元的输出进行合并,得到第四结果;
分别将所述第一结果、第二结果、第四结果通过卷积神经网络进行处理,得到多个目标图像。
可选的,还包括:在不同尺度的特征图上构造k个不同比例的锚框,对锚框进行分类和位置回归。
可选的,所述对锚框进行分类包括:采用公式:d(boxP,boxc)=1-IOU(boxP,boxc)进行分类;
d(boxP,boxC)表示IOU得分,boxP表示目标真值框,boxc表示目标框分布的聚类中心。
可选的,所述卷积神经网络的特征提取模块包括:
通过依次连接的输入层、处理层以及过渡层对所述原始图像进行特征提取;
所述处理层包括第一处理层和第二处理层,所述第一处理层、第二处理层分别与过渡层连接;所述第二处理层包括依次连接的基础层、残差单元以及中间过渡层;
所述输入层对所述原始图像进行多次下采样并通过第一处理层直接映射获取低层特征图然后进入所述过渡层;
所述输入层对所述原始图像进行多次下采样并通过第二处理层残差处理获取高层特征图然后进入所述过渡层。
可选的,所述卷积神经网络的特征融合模块包括:
通过空间特征融合层将所述低层特征图与高层特征图合并,获取合并特征图。
可选的,所述卷积神经网络的特征融合模块还包括:
通过所述特征增强层的多分支卷积将所述高层特征图并联生成图像特征并进行通道合并,然后进行空洞卷积处理。
需要说明的是,该装置是与上述图1所示方法的实施例对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种实时目标检测的方法,其特征在于,包括:
获取目标对象的原始图像;
对所述原始图像进行特征提取,获得多个不同尺度的特征图;
对多个不同多尺度的特征图进行融合,得到多个目标图像。
2.根据权利要求1所述的实时目标检测的方法,其特征在于,对所述原始图像进行特征提取,获得多个不同尺度的特征图,包括:
对所述原始图像缩放至目标分辨率,得到输入图像;
对所述输入图像下采样得到第一特征图;
对所述第一特征图下采样得到第二特征图;
对所述第二特征图下采样得到第三特征图;
对所述第三特征图下采样得到第四特征图;
对所述第四特征图下采样得到第五特征图。
3.根据权利要求2所述的实时目标检测的方法,其特征在于,所述第三特征图的分辨率是第四特征图的分辨率的2倍,所述第四特征图的分辨率是第五特征图的分辨率的2倍。
4.根据权利要求2或3所述的实时目标检测的方法,其特征在于,对多个不同多尺度的特征图进行融合,得到多个目标图像,包括:
将所述第五特征图输入至特征融合模块的第一CBL单元,并进行上采样得到第一结果,并输出至第二CBL单元;
将所述第四特征图与所述第二CBL单元的输出进行合并,得到第二结果,输入到第三CBL单元,并进行上采样,得到第三结果,并输出至第四CBL单元;
将所述第三特征图与所述第四CBL单元的输出进行合并,得到第四结果;
分别将所述第一结果、第二结果、第四结果通过卷积神经网络进行处理,得到多个目标图像。
5.根据权利要求4所述的实时目标检测的方法,其特征在于,还包括:
在不同尺度的特征图上构造k个不同比例的锚框,对锚框进行分类和位置回归。
6.根据权利要求5所述的实时目标检测的方法,其特征在于,所述对锚框进行分类包括:采用公式:d(boxP,boxc)=1-IOU(boxP,boxc)进行分类;
d(boxP,boxC)表示IOU得分,boxP表示目标真值框,boxc表示目标框分布的聚类中心。
7.根据权利要求4所述的实时目标检测的方法,其特征在于,所述卷积神经网络的特征提取模块包括:
通过依次连接的输入层、处理层以及过渡层对所述原始图像进行特征提取;
所述处理层包括第一处理层和第二处理层,所述第一处理层、第二处理层分别与过渡层连接;所述第二处理层包括依次连接的基础层、残差单元以及中间过渡层;
所述输入层对所述原始图像进行多次下采样并通过第一处理层直接映射获取低层特征图然后进入所述过渡层;
所述输入层对所述原始图像进行多次下采样并通过第二处理层残差处理获取高层特征图然后进入所述过渡层。
8.根据权利要求4所述的实时目标检测的方法,其特征在于,所述卷积神经网络的特征融合模块包括:
通过空间特征融合层将所述低层特征图与高层特征图合并,获取合并特征图。
9.根据权利要求4所述的实时目标检测的方法,其特征在于,所述卷积神经网络的特征融合模块还包括:
通过所述特征增强层的多分支卷积将所述高层特征图并联生成图像特征并进行通道合并,然后进行空洞卷积处理。
10.一种实时目标检测的装置,其特征在于,包括:
特征提取模块,用于获取目标对象的原始图像;对所述原始图像进行特征提取,获得多个不同尺度的特征图;
特征融合模块,用于对多个不同多尺度的特征图进行融合,得到多个目标图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011429134.7A CN112508099A (zh) | 2020-12-07 | 2020-12-07 | 一种实时目标检测的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011429134.7A CN112508099A (zh) | 2020-12-07 | 2020-12-07 | 一种实时目标检测的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112508099A true CN112508099A (zh) | 2021-03-16 |
Family
ID=74970071
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011429134.7A Pending CN112508099A (zh) | 2020-12-07 | 2020-12-07 | 一种实时目标检测的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112508099A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113111802A (zh) * | 2021-04-20 | 2021-07-13 | 池州学院 | 一种基于深度神经网络的绝缘子检测模型 |
CN113313162A (zh) * | 2021-05-25 | 2021-08-27 | 国网河南省电力公司电力科学研究院 | 一种多尺度特征融合目标检测的方法及系统 |
CN113435303A (zh) * | 2021-06-23 | 2021-09-24 | 中国电子科技集团公司第五十四研究所 | 一种非合作无人机视觉探测及识别方法 |
CN113870183A (zh) * | 2021-08-27 | 2021-12-31 | 福建省海洋预报台 | 一种港口目标动态检测的方法及终端 |
CN114998692A (zh) * | 2022-06-30 | 2022-09-02 | 西安理工大学 | 基于轨道交通四电设备的目标检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461039A (zh) * | 2020-04-07 | 2020-07-28 | 电子科技大学 | 基于多尺度特征融合的地标识别方法 |
CN111563466A (zh) * | 2020-05-12 | 2020-08-21 | Oppo广东移动通信有限公司 | 人脸检测方法及相关产品 |
CN111754438A (zh) * | 2020-06-24 | 2020-10-09 | 安徽理工大学 | 基于多分支门控融合的水下图像复原模型及其复原方法 |
CN111882002A (zh) * | 2020-08-06 | 2020-11-03 | 桂林电子科技大学 | 一种基于msf-am的低照度目标检测方法 |
CN111967305A (zh) * | 2020-07-01 | 2020-11-20 | 华南理工大学 | 一种基于轻量级卷积神经网络的实时多尺度目标检测方法 |
-
2020
- 2020-12-07 CN CN202011429134.7A patent/CN112508099A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461039A (zh) * | 2020-04-07 | 2020-07-28 | 电子科技大学 | 基于多尺度特征融合的地标识别方法 |
CN111563466A (zh) * | 2020-05-12 | 2020-08-21 | Oppo广东移动通信有限公司 | 人脸检测方法及相关产品 |
CN111754438A (zh) * | 2020-06-24 | 2020-10-09 | 安徽理工大学 | 基于多分支门控融合的水下图像复原模型及其复原方法 |
CN111967305A (zh) * | 2020-07-01 | 2020-11-20 | 华南理工大学 | 一种基于轻量级卷积神经网络的实时多尺度目标检测方法 |
CN111882002A (zh) * | 2020-08-06 | 2020-11-03 | 桂林电子科技大学 | 一种基于msf-am的低照度目标检测方法 |
Non-Patent Citations (2)
Title |
---|
于红刚: "基于深度学习的森林火灾检测方法研究", 《万方在线出版》 * |
仇梓峰: "基于计算机视觉的风机叶片表面损伤检测研究", 《中国优秀硕士学位论文全文数据库(工程科技Ⅱ辑)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113111802A (zh) * | 2021-04-20 | 2021-07-13 | 池州学院 | 一种基于深度神经网络的绝缘子检测模型 |
CN113111802B (zh) * | 2021-04-20 | 2023-05-23 | 池州学院 | 一种基于深度神经网络的绝缘子检测模型 |
CN113313162A (zh) * | 2021-05-25 | 2021-08-27 | 国网河南省电力公司电力科学研究院 | 一种多尺度特征融合目标检测的方法及系统 |
CN113435303A (zh) * | 2021-06-23 | 2021-09-24 | 中国电子科技集团公司第五十四研究所 | 一种非合作无人机视觉探测及识别方法 |
CN113870183A (zh) * | 2021-08-27 | 2021-12-31 | 福建省海洋预报台 | 一种港口目标动态检测的方法及终端 |
CN113870183B (zh) * | 2021-08-27 | 2024-05-31 | 福建省海洋预报台 | 一种港口目标动态检测的方法及终端 |
CN114998692A (zh) * | 2022-06-30 | 2022-09-02 | 西安理工大学 | 基于轨道交通四电设备的目标检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112508099A (zh) | 一种实时目标检测的方法和装置 | |
CN110188765B (zh) | 图像语义分割模型生成方法、装置、设备及存储介质 | |
CN108764063B (zh) | 一种基于特征金字塔的遥感影像时敏目标识别系统及方法 | |
CN111461083A (zh) | 基于深度学习的快速车辆检测方法 | |
CN110781850A (zh) | 道路识别的语义分割系统和方法、计算机存储介质 | |
CN111461212A (zh) | 一种用于点云目标检测模型的压缩方法 | |
CN112434618B (zh) | 基于稀疏前景先验的视频目标检测方法、存储介质及设备 | |
JP2022078310A (ja) | 画像分類モデル生成方法、装置、電子機器、記憶媒体、コンピュータプログラム、路側装置およびクラウド制御プラットフォーム | |
CN113361528B (zh) | 一种多尺度目标检测方法及系统 | |
CN111553414A (zh) | 一种基于改进Faster R-CNN的车内遗失物体检测方法 | |
CN109376763A (zh) | 基于多样本推理神经网络的样本分类方法、系统及介质 | |
CN111723660A (zh) | 一种用于长形地面目标检测网络的检测方法 | |
CN110852199A (zh) | 一种基于双帧编码解码模型的前景提取方法 | |
US20230154005A1 (en) | Panoptic segmentation with panoptic, instance, and semantic relations | |
CN117649526A (zh) | 一种面向自动驾驶道路场景的高精度语义分割方法 | |
CN113313162A (zh) | 一种多尺度特征融合目标检测的方法及系统 | |
CN110532868B (zh) | 一种预测自由空间语义边界的方法 | |
CN117197632A (zh) | 一种基于Transformer的电镜花粉图像目标检测方法 | |
CN116451148A (zh) | 一种模态分解预测双向注意力网络的轴承故障诊断方法 | |
KR20230156911A (ko) | 비디오 프로세싱을 위한 효율적인 셀프-어텐션 | |
CN111382761B (zh) | 一种基于cnn的检测器、图像检测方法及终端 | |
CN114329070A (zh) | 视频特征提取方法、装置、计算机设备和存储介质 | |
Kapo et al. | Early stage flame segmentation with deep learning and intel's openvino toolkit | |
CN112016571A (zh) | 一种基于注意力机制的特征提取方法、装置及电子设备 | |
CN113343979B (zh) | 用于训练模型的方法、装置、设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210316 |
|
RJ01 | Rejection of invention patent application after publication |