CN110008949B - 一种图像目标检测方法、系统、装置和存储介质 - Google Patents

一种图像目标检测方法、系统、装置和存储介质 Download PDF

Info

Publication number
CN110008949B
CN110008949B CN201910068062.9A CN201910068062A CN110008949B CN 110008949 B CN110008949 B CN 110008949B CN 201910068062 A CN201910068062 A CN 201910068062A CN 110008949 B CN110008949 B CN 110008949B
Authority
CN
China
Prior art keywords
convolution
feature information
information
pixel point
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910068062.9A
Other languages
English (en)
Other versions
CN110008949A (zh
Inventor
高英
谢杰
罗雄文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201910068062.9A priority Critical patent/CN110008949B/zh
Publication of CN110008949A publication Critical patent/CN110008949A/zh
Application granted granted Critical
Publication of CN110008949B publication Critical patent/CN110008949B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像目标检测方法、系统、装置和存储介质。所述方法使用Faster‑RCNN算法对待处理图像依次进行提取特征图等处理步骤,所述方法还包括对特征图分别进行多次膨胀卷积处理,接收各次所述膨胀卷积处理输出的多个并行特征信息,将多个并行特征信息融合得到第一融合特征信息和将所述第一融合特征信息与特征图融合得到第二融合特征信息等步骤。本发明可以在现有Faster‑RCNN算法能够提取到较丰富的图像细节特征的技术优势基础上,克服特征图的分辨率过低、待处理图像中的细节信息过多地丢失造成的Faster‑RCNN的总体识别精度较低的缺点,获得较高的目标检测准确率。本发明广泛应用于图像处理技术领域。

Description

一种图像目标检测方法、系统、装置和存储介质
技术领域
本发明涉及图像处理技术领域,尤其是一种图像目标检测方法、系统、装置和存储介质。
背景技术
在图像识别领域,经常要进行目标检测,将图像中包含的目标检测出来。例如对于一幅包含有汽车的图像,将汽车设定为目标之后,需要将图像中的目标检测出来,将图像分为汽车区域和背景区域。Faster-RCNN是一种用来进行目标检测的常用算法,它的主要步骤包括对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层进行处理,输出图像分类结果和图像边框回归结果,实现对图像的目标检测。Faster-RCNN的一个重要部分是特征提取网络,它可以从待处理图像中提取出特征图,然后进行后续的分析。特征提取网络一般使用卷积神经网络来实现,在卷积过程中,图像的精度被降低,得到的特征图的分辨率相应降低。为了得到更多的特征,卷积神经网络被设计为具有较高的深度,这使得特征图的分辨率过低,待处理图像中的细节信息过多地丢失,造成Faster-RCNN的总体识别精度较低。
发明内容
为了解决上述技术问题,本发明的目在于提供一种图像目标检测方法、系统、装置和存储介质。
一方面,本发明实施例包括一种图像目标检测方法,所述方法使用Faster-RCNN算法对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层的处理步骤,所述方法还包括以下用于对所述特征图进行优化的步骤:
对所述特征图分别进行多次膨胀卷积处理;
接收各次所述膨胀卷积处理输出的多个并行特征信息;
将多个所述并行特征信息融合得到第一融合特征信息;
将所述第一融合特征信息与特征图融合得到第二融合特征信息;所述第二融合特征信息用于所述Faster-RCNN算法中提取感兴趣区域和感兴趣区域映射的处理步骤。
进一步地,所述多次膨胀卷积处理包括第一3×3膨胀卷积、第二3×3膨胀卷积和第三3×3膨胀卷积;
所述第一3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第一卷积核点乘后求和,将求和的结果作为第一并行特征信息输出;
所述第二3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第二卷积核点乘后求和,将求和的结果作为第二并行特征信息输出;
所述第三3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第三卷积核点乘后求和,将求和的结果作为第三并行特征信息输出。
进一步地,所述第一3×3膨胀卷积的膨胀系数为2,所述第二3×3膨胀卷积的膨胀系数为4,所述第三3×3膨胀卷积的膨胀系数为8。
进一步地,所述将多个所述并行特征信息融合得到第一融合特征信息这一步骤,具体包括:
将多个所述并行特征信息各自的通道维度进行拼接,所述拼接的结果为第一融合特征信息。
进一步地,所述将所述第一融合特征信息与特征图融合得到第二融合特征信息这一步骤,具体包括:
将所述第一融合特征信息的通道维度与所述特征图的通道维度进行拼接,所述拼接的结果为第二融合特征信息。
进一步地,所述用于对所述特征图进行优化的步骤还包括:
对所述第二融合特征信息在通道维度进行降维。
进一步地,所述对所述第二融合特征信息在通道维度进行降维这一步骤,是通过1×1卷积进行的。
另一方面,本发明实施例还包括一种图像目标检测装置,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行本发明图像目标检测方法。
另一方面,本发明实施例还包括一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行本发明图像目标检测方法。
本发明的有益效果是:通过对特征图进行膨胀卷积处理,所得的并行特征信息中包含特征图的上下文特征信息;通过多次不同的膨胀卷积处理以及融合处理,所得到的第一融合特征信息中包含多组不同的上下文特征信息。根据第一融合特征信息和特征图融合得到的第二融合特征信息用于后续的处理,可以在现有Faster-RCNN算法能够提取到较丰富的图像细节特征的技术优势基础上,克服特征图的分辨率过低、待处理图像中的细节信息过多地丢失造成的Faster-RCNN的总体识别精度较低的缺点,获得较高的目标检测准确率。
附图说明
图1为现有的Faster-RCNN算法的原理图;
图2为本发明方法实施例的原理图。
具体实施方式
本实施例中的图像目标检测方法是在现有的Faster-RCNN算法基础上实现的。Faster-RCNN算法的原理如图1所示。
现有的Faster-RCNN算法主要包括提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层进行处理等步骤。
Faster-RCNN算法中,提取特征图这一步骤是通过特征提取网络来实现的。图1中的特征提取网络是卷积神经网络,它可以接收待处理图像并进行特征提取,输出特征图。
Faster-RCNN算法中,提取感兴趣区域这一步骤是通过感兴趣区域提取网络来实现的。图1中的感兴趣区域提取网络(Region Proposal Network,RPN)可以对特征图进行分析,提取并生成图像中所有可能存在目标个体的区域。本实施例中,感兴趣区域提取网络可以输出2000个感兴趣区域,然后从中筛选出300个最优的感兴趣区域。
Faster-RCNN算法中,感兴趣区域映射这一步骤是通过感兴趣区域池化层来实现的。图1中的感兴趣区域池化层可以将多个感兴趣区域映射到特征图上,然后对映射后的特征图进行尺寸统一化处理。本实施例中,将特征图的尺寸统一化为7×7。
图1中的全连接层利用探测分类概率和探测边框回归的方法实现分类概率和边框回归,输出图像分类结果和图像边框回归结果,实现对图像中的目标检测。其中,探测分类概率使用了Softmax Loss损失函数,探测边框回归中使用了Smooth L1 Loss损失函数。
现有的Faster-RCNN算法未对特征图进行优化处理,直接对特征图进行感兴趣区域提取以及感兴趣区域映射,没有利用特征图中的上下文信息,因此最终的目标检测精度较低。
本实施例中的图像目标检测方法对特征图进行了优化处理,所述优化处理包括以下步骤:
S1.对所述特征图分别进行多次膨胀卷积处理;
S2.接收各次所述膨胀卷积处理输出的多个并行特征信息;
S3.将多个所述并行特征信息融合得到第一融合特征信息;
S4.将所述第一融合特征信息与特征图融合得到第二融合特征信息;所述第二融合特征信息用于所述Faster-RCNN算法中提取感兴趣区域和感兴趣区域映射的处理步骤。
本实施例中,所述优化处理是在Faster-RCNN算法的基础上进行的,所述优化处理的原理参照图2中虚线框内的部分。步骤S1中,每次膨胀卷积处理是独立进行的,每次膨胀处理都将得到一个对应的并行特征信息。步骤S3中,将多个并行特征信息融合在一起,得到第一融合特征信息。步骤S4中,将特征图与步骤S3得到的第一融合特征信息融合在一起,得到第二融合特征信息。所述第二融合特征信息作为对现有的Faster-RCNN算法过程中所得的特征图的优化结果,用于代替特征图进行Faster-RCNN算法中后续的提取感兴趣区域和感兴趣区域映射等处理步骤。
对特征图进行膨胀卷积处理,所得的并行特征信息中包含特征图的上下文特征信息。通过多次不同的膨胀卷积处理以及融合处理,所得到的第一融合特征信息中包含多组不同的上下文特征信息。根据第一融合特征信息和特征图融合得到的第二融合特征信息用于后续的处理,可以在现有Faster-RCNN算法能够提取到较丰富的图像细节特征的技术优势基础上,克服特征图的分辨率过低、待处理图像中的细节信息过多地丢失造成的Faster-RCNN的总体识别精度较低的缺点,获得较高的目标检测准确率。
进一步作为优选的实施方式,本实施例中所述的多次膨胀卷积处理,具体包括第一3×3膨胀卷积、第二3×3膨胀卷积和第三3×3膨胀卷积;
所述第一3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第一卷积核点乘后求和,将求和的结果作为第一并行特征信息输出;
所述第二3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第二卷积核点乘后求和,将求和的结果作为第二并行特征信息输出;
所述第三3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第三卷积核点乘后求和,将求和的结果作为第三并行特征信息输出。
本实施例中,第一3×3膨胀卷积为dilated-2算法,第二3×3膨胀卷积为dilated-4算法,第三3×3膨胀卷积为dilated-8算法。即第一3×3膨胀卷积的膨胀系数为2,所述第二3×3膨胀卷积的膨胀系数为4,所述第三3×3膨胀卷积的膨胀系数为8。
第一3×3膨胀卷积的原理为:对于特征图中的各像素点,每隔1个像素点采样一次,并将采样结果与3×3卷积核进行点乘,将多个点乘的结果之和作为中心像素的特征值,所述中心像素点的特征值作为第一并行特征信息输出。所述第一3×3膨胀卷积输出的第一并行特征信息包含了中心像素点周围2个像素点的上下文信息。
第二3×3膨胀卷积的原理为:对于特征图中的各像素点,每隔3个像素点采样一次,并将采样结果与3×3卷积核进行点乘,将多个点乘的结果之和作为中心像素的特征值,所述中心像素点的特征值作为第二并行特征信息输出。所述第二3×3膨胀卷积输出的第二并行特征信息包含了中心像素点周围4个像素点的上下文信息。
第三3×3膨胀卷积的原理为:对于特征图中的各像素点,每隔7个像素点采样一次,并将采样结果与3×3卷积核进行点乘,将多个点乘的结果之和作为中心像素的特征值,所述中心像素点的特征值作为第三并行特征信息输出。所述第三3×3膨胀卷积输出的第三并行特征信息包含了中心像素点周围8个像素点的上下文信息。
进一步作为优选的实施方式,所述步骤S3,即将多个所述并行特征信息融合得到第一融合特征信息这一步骤,具体包括:
将多个所述并行特征信息各自的通道(Channel)维度进行拼接(Concat),所述拼接的结果为第一融合特征信息。
本实施例中,将第一并行特征信息、第二并行特征信息和第三并行特征信息各自的通道维度进行拼接,所述拼接的结果为第一融合特征信息。
进一步作为优选的实施方式,所述步骤S4,即将所述第一融合特征信息与特征图融合得到第二融合特征信息这一步骤,具体包括:
将所述第一融合特征信息的通道(Channel)维度与所述特征图的通道维度进行拼接(Concat),所述拼接的结果为第二融合特征信息。
进一步作为优选的实施方式,所述用于对所述特征图进行优化的步骤还包括:
S5.对所述第二融合特征信息在通道维度进行降维。
本实施例中,步骤S5是通过1×1卷积进行的,也就是对第二融合特征信息通过1×1卷积在通道(Channel)维度进行降维。通过步骤S5的降维,可以降低网络宽度,降低对计算机资源的占用。
本实施例还包括一种图像目标检测系统,所述系统包括用于对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层进行处理的Faster-RCNN模块,所述系统还包括:
膨胀卷积模块,用于对所述特征图分别进行多次膨胀卷积处理;
并行特征信息模块,用于接收各次所述膨胀卷积处理输出的多个并行特征信息;
第一融合特征信息模块,用于将多个所述并行特征信息融合得到第一融合特征信息;
第二融合特征信息模块,用于将所述第一融合特征信息与特征图融合得到第二融合特征信息;
输入模块,用于将所述第二融合特征信息输入到所述Faster-RCNN模块中,从而使Faster-RCNN模块进行提取感兴趣区域和感兴趣区域映射的处理。
本实施例还包括一种图像目标检测装置,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行本发明图像目标检测方法。
本实施例还包括一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行本发明图像目标检测方法。
本实施例中的图像目标检测系统、装置和存储介质,可以执行本发明的图像目标检测方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
以上是对本发明的较佳实施进行了具体说明,但对本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (5)

1.一种图像目标检测方法,所述方法使用Faster-RCNN算法对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层的处理步骤,其特征在于,所述方法还包括以下用于对所述特征图进行优化的步骤:
对所述特征图分别进行多次膨胀卷积处理;
接收各次所述膨胀卷积处理输出的多个并行特征信息;
将多个所述并行特征信息融合得到第一融合特征信息;
将所述第一融合特征信息与特征图融合得到第二融合特征信息;所述第二融合特征信息用于所述Faster-RCNN算法中提取感兴趣区域和感兴趣区域映射的处理步骤;将所述第二融合特征信息降维,一方面将降维以后的融合特征信息通过感兴趣区域提取网络(Region Proposal Network,RPN)得到感兴趣区域(Rois),再通过感兴趣区域池化层(RoiPooling)得到被映射感兴趣区域的特征图;另一方面将降维以后的融合特征信息直接通过感兴趣区域池化层(Roi Pooling)得到被映射感兴趣区域的特征图;
所述多次膨胀卷积处理包括第一3×3膨胀卷积、第二3×3膨胀卷积和第三3×3膨胀卷积;
所述第一3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第一卷积核点乘后求和,将求和的结果作为第一并行特征信息输出;
所述第二3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第二卷积核点乘后求和,将求和的结果作为第二并行特征信息输出;
所述第三3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第三卷积核点乘后求和,将求和的结果作为第三并行特征信息输出;
所述将多个所述并行特征信息融合得到第一融合特征信息这一步骤,具体包括:
将多个所述并行特征信息各自的通道维度进行拼接,所述拼接的结果为第一融合特征信息;
所述将所述第一融合特征信息与特征图融合得到第二融合特征信息这一步骤,具体包括:
将所述第一融合特征信息的通道维度与所述特征图的通道维度进行拼接,所述拼接的结果为第二融合特征信息;
所述用于对所述特征图进行优化的步骤还包括:
对所述第二融合特征信息在通道维度进行降维;
所述对所述第二融合特征信息在通道维度进行降维这一步骤,是通过1×1卷积进行的。
2.根据权利要求1所述的一种图像目标检测方法,其特征在于,所述第一3×3膨胀卷积的膨胀系数为2,所述第二3×3膨胀卷积的膨胀系数为4,所述第三3×3膨胀卷积的膨胀系数为8。
3.一种图像目标检测系统,所述系统包括用于对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层进行处理的Faster-RCNN模块,其特征在于,所述系统还包括:
膨胀卷积模块,用于对所述特征图分别进行多次膨胀卷积处理;
并行特征信息模块,用于接收各次所述膨胀卷积处理输出的多个并行特征信息;
第一融合特征信息模块,用于将多个所述并行特征信息融合得到第一融合特征信息;
第二融合特征信息模块,用于将所述第一融合特征信息与特征图融合得到第二融合特征信息;
输入模块,用于将所述第二融合特征信息输入到所述Faster-RCNN模块中,从而使Faster-RCNN模块进行提取感兴趣区域和感兴趣区域映射的处理;将所述第二融合特征信息降维,一方面将降维以后的融合特征信息通过感兴趣区域提取网络(Region ProposalNetwork,RPN)得到感兴趣区域(Rois),再通过感兴趣区域池化层(Roi Pooling)得到被映射感兴趣区域的特征图;另一方面将降维以后的融合特征信息直接通过感兴趣区域池化层(Roi Pooling)得到被映射感兴趣区域的特征图;
所述多次膨胀卷积处理包括第一3×3膨胀卷积、第二3×3膨胀卷积和第三3×3膨胀卷积;
所述第一3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第一卷积核点乘后求和,将求和的结果作为第一并行特征信息输出;
所述第二3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第二卷积核点乘后求和,将求和的结果作为第二并行特征信息输出;
所述第三3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第三卷积核点乘后求和,将求和的结果作为第三并行特征信息输出;
所述将多个所述并行特征信息融合得到第一融合特征信息这一步骤,具体包括:
将多个所述并行特征信息各自的通道维度进行拼接,所述拼接的结果为第一融合特征信息;
所述将所述第一融合特征信息与特征图融合得到第二融合特征信息这一步骤,具体包括:
将所述第一融合特征信息的通道维度与所述特征图的通道维度进行拼接,所述拼接的结果为第二融合特征信息;
所述用于对所述特征图进行优化的步骤还包括:
对所述第二融合特征信息在通道维度进行降维;
所述对所述第二融合特征信息在通道维度进行降维这一步骤,是通过1×1卷积进行的。
4.一种图像目标检测装置,其特征在于,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行权利要求1-2任一项所述方法。
5.一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-2任一项所述方法。
CN201910068062.9A 2019-01-24 2019-01-24 一种图像目标检测方法、系统、装置和存储介质 Active CN110008949B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910068062.9A CN110008949B (zh) 2019-01-24 2019-01-24 一种图像目标检测方法、系统、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910068062.9A CN110008949B (zh) 2019-01-24 2019-01-24 一种图像目标检测方法、系统、装置和存储介质

Publications (2)

Publication Number Publication Date
CN110008949A CN110008949A (zh) 2019-07-12
CN110008949B true CN110008949B (zh) 2020-03-17

Family

ID=67165500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910068062.9A Active CN110008949B (zh) 2019-01-24 2019-01-24 一种图像目标检测方法、系统、装置和存储介质

Country Status (1)

Country Link
CN (1) CN110008949B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052917A (zh) * 2020-10-22 2020-12-08 上海明略人工智能(集团)有限公司 一种图像分类方法、系统、电子设备及存储介质
CN112954051B (zh) * 2021-02-07 2021-09-03 广州一盒科技有限公司 一种用于食材加工的远程控制方法及系统
CN113139542B (zh) * 2021-04-28 2023-08-11 北京百度网讯科技有限公司 目标检测方法、装置、设备和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107492095A (zh) * 2017-08-02 2017-12-19 西安电子科技大学 基于深度学习的医学图像肺结节检测方法
CN108596330A (zh) * 2018-05-16 2018-09-28 中国人民解放军陆军工程大学 一种并行特征全卷积神经网络及其构建方法
CN108830280A (zh) * 2018-05-14 2018-11-16 华南理工大学 一种基于区域提名的小目标检测方法
CN108961253A (zh) * 2018-06-19 2018-12-07 深动科技(北京)有限公司 一种图像分割方法和装置
CN109086437A (zh) * 2018-08-15 2018-12-25 重庆大学 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法
CN109145843A (zh) * 2018-08-29 2019-01-04 上海萃舟智能科技有限公司 一种卡口高清相机全车信息识别系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107945185B (zh) * 2017-11-29 2020-02-07 北京工商大学 基于宽残差金字塔池化网络的图像分割方法及系统
CN108256562B (zh) * 2018-01-09 2022-04-15 深圳大学 基于弱监督时空级联神经网络的显著目标检测方法及系统
CN108268870B (zh) * 2018-01-29 2020-10-09 重庆师范大学 基于对抗学习的多尺度特征融合超声图像语义分割方法
CN108470159B (zh) * 2018-03-09 2019-12-20 腾讯科技(深圳)有限公司 车道线数据处理方法、装置、计算机设备和存储介质
CN108647776A (zh) * 2018-05-08 2018-10-12 济南浪潮高新科技投资发展有限公司 一种卷积神经网络卷积膨胀处理电路及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107492095A (zh) * 2017-08-02 2017-12-19 西安电子科技大学 基于深度学习的医学图像肺结节检测方法
CN108830280A (zh) * 2018-05-14 2018-11-16 华南理工大学 一种基于区域提名的小目标检测方法
CN108596330A (zh) * 2018-05-16 2018-09-28 中国人民解放军陆军工程大学 一种并行特征全卷积神经网络及其构建方法
CN108961253A (zh) * 2018-06-19 2018-12-07 深动科技(北京)有限公司 一种图像分割方法和装置
CN109086437A (zh) * 2018-08-15 2018-12-25 重庆大学 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法
CN109145843A (zh) * 2018-08-29 2019-01-04 上海萃舟智能科技有限公司 一种卡口高清相机全车信息识别系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS;Fisher Yu 等;《ICLR2016》;20161231;参见第2-3节 *
Pyramid Scene Parsing Network;Hengshuang Zhao等;《arXiv:1612.01105v2 [cs.CV]》;20170430;参见第3节,图3 *

Also Published As

Publication number Publication date
CN110008949A (zh) 2019-07-12

Similar Documents

Publication Publication Date Title
CN110533084B (zh) 一种基于自注意力机制的多尺度目标检测方法
CN110414507B (zh) 车牌识别方法、装置、计算机设备和存储介质
CN111652217B (zh) 文本检测方法、装置、电子设备及计算机存储介质
CN110008949B (zh) 一种图像目标检测方法、系统、装置和存储介质
CN111461083A (zh) 基于深度学习的快速车辆检测方法
CN111160407B (zh) 一种深度学习目标检测方法及系统
CN111652218A (zh) 文本检测方法、电子设备及计算机可读介质
CN111524137A (zh) 基于图像识别的细胞识别计数方法、装置和计算机设备
CN112365497A (zh) 基于TridentNet和Cascade-RCNN结构的高速目标检测方法和系统
CN113139543A (zh) 目标对象检测模型的训练方法、目标对象检测方法和设备
CN111932577B (zh) 文本检测方法、电子设备及计算机可读介质
CN116012291A (zh) 工业零件图像缺陷检测方法及系统、电子设备和存储介质
CN111914654A (zh) 一种文本版面分析方法、装置、设备和介质
CN114266894A (zh) 一种图像分割方法、装置、电子设备及存储介质
CN114998756A (zh) 一种基于yolov5的遥感图像检测方法、装置及存储介质
CN108960247B (zh) 图像显著性检测方法、装置以及电子设备
CN110135428B (zh) 图像分割处理方法和装置
CN115496976A (zh) 多源异构数据融合的视觉处理方法、装置、设备及介质
CN112052702A (zh) 一种识别二维码的方法和装置
CN116823793A (zh) 设备缺陷检测方法、装置、电子设备和可读存储介质
CN108921017B (zh) 人脸检测方法及系统
CN112183554B (zh) 一种自动化道路边界轮廓提取方法
CN117636298A (zh) 基于多尺度特征学习的车辆重识别方法、系统及存储介质
CN110580462B (zh) 一种基于非局部网络的自然场景文本检测方法和系统
CN116030346A (zh) 基于马尔可夫判别器的非成对弱监督云检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant