CN110008949A - 一种图像目标检测方法、系统、装置和存储介质 - Google Patents
一种图像目标检测方法、系统、装置和存储介质 Download PDFInfo
- Publication number
- CN110008949A CN110008949A CN201910068062.9A CN201910068062A CN110008949A CN 110008949 A CN110008949 A CN 110008949A CN 201910068062 A CN201910068062 A CN 201910068062A CN 110008949 A CN110008949 A CN 110008949A
- Authority
- CN
- China
- Prior art keywords
- feature information
- convolution
- characteristic pattern
- expansion
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像目标检测方法、系统、装置和存储介质。所述方法使用Faster‑RCNN算法对待处理图像依次进行提取特征图等处理步骤,所述方法还包括对特征图分别进行多次膨胀卷积处理,接收各次所述膨胀卷积处理输出的多个并行特征信息,将多个并行特征信息融合得到第一融合特征信息和将所述第一融合特征信息与特征图融合得到第二融合特征信息等步骤。本发明可以在现有Faster‑RCNN算法能够提取到较丰富的图像细节特征的技术优势基础上,克服特征图的分辨率过低、待处理图像中的细节信息过多地丢失造成的Faster‑RCNN的总体识别精度较低的缺点,获得较高的目标检测准确率。本发明广泛应用于图像处理技术领域。
Description
技术领域
本发明涉及图像处理技术领域,尤其是一种图像目标检测方法、系统、装置和存储介质。
背景技术
在图像识别领域,经常要进行目标检测,将图像中包含的目标检测出来。例如对于一幅包含有汽车的图像,将汽车设定为目标之后,需要将图像中的目标检测出来,将图像分为汽车区域和背景区域。Faster-RCNN是一种用来进行目标检测的常用算法,它的主要步骤包括对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层进行处理,输出图像分类结果和图像边框回归结果,实现对图像的目标检测。Faster-RCNN的一个重要部分是特征提取网络,它可以从待处理图像中提取出特征图,然后进行后续的分析。特征提取网络一般使用卷积神经网络来实现,在卷积过程中,图像的精度被降低,得到的特征图的分辨率相应降低。为了得到更多的特征,卷积神经网络被设计为具有较高的深度,这使得特征图的分辨率过低,待处理图像中的细节信息过多地丢失,造成Faster-RCNN的总体识别精度较低。
发明内容
为了解决上述技术问题,本发明的目在于提供一种图像目标检测方法、系统、装置和存储介质。
一方面,本发明实施例包括一种图像目标检测方法,所述方法使用Faster-RCNN算法对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层的处理步骤,所述方法还包括以下用于对所述特征图进行优化的步骤:
对所述特征图分别进行多次膨胀卷积处理;
接收各次所述膨胀卷积处理输出的多个并行特征信息;
将多个所述并行特征信息融合得到第一融合特征信息;
将所述第一融合特征信息与特征图融合得到第二融合特征信息;所述第二融合特征信息用于所述Faster-RCNN算法中提取感兴趣区域和感兴趣区域映射的处理步骤。
进一步地,所述多次膨胀卷积处理包括第一3×3膨胀卷积、第二3×3膨胀卷积和第三3×3膨胀卷积;
所述第一3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第一卷积核点乘后求和,将求和的结果作为第一并行特征信息输出;
所述第二3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第二卷积核点乘后求和,将求和的结果作为第二并行特征信息输出;
所述第三3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第三卷积核点乘后求和,将求和的结果作为第三并行特征信息输出。
进一步地,所述第一3×3膨胀卷积的膨胀系数为2,所述第二3×3膨胀卷积的膨胀系数为4,所述第三3×3膨胀卷积的膨胀系数为8。
进一步地,所述将多个所述并行特征信息融合得到第一融合特征信息这一步骤,具体包括:
将多个所述并行特征信息各自的通道维度进行拼接,所述拼接的结果为第一融合特征信息。
进一步地,所述将所述第一融合特征信息与特征图融合得到第二融合特征信息这一步骤,具体包括:
将所述第一融合特征信息的通道维度与所述特征图的通道维度进行拼接,所述拼接的结果为第二融合特征信息。
进一步地,所述用于对所述特征图进行优化的步骤还包括:
对所述第二融合特征信息在通道维度进行降维。
进一步地,所述对所述第二融合特征信息在通道维度进行降维这一步骤,是通过1×1卷积进行的。
另一方面,本发明实施例还包括一种图像目标检测装置,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行本发明图像目标检测方法。
另一方面,本发明实施例还包括一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行本发明图像目标检测方法。
本发明的有益效果是:通过对特征图进行膨胀卷积处理,所得的并行特征信息中包含特征图的上下文特征信息;通过多次不同的膨胀卷积处理以及融合处理,所得到的第一融合特征信息中包含多组不同的上下文特征信息。根据第一融合特征信息和特征图融合得到的第二融合特征信息用于后续的处理,可以在现有Faster-RCNN算法能够提取到较丰富的图像细节特征的技术优势基础上,克服特征图的分辨率过低、待处理图像中的细节信息过多地丢失造成的Faster-RCNN的总体识别精度较低的缺点,获得较高的目标检测准确率。
附图说明
图1为现有的Faster-RCNN算法的原理图;
图2为本发明方法实施例的原理图。
具体实施方式
本实施例中的图像目标检测方法是在现有的Faster-RCNN算法基础上实现的。Faster-RCNN算法的原理如图1所示。
现有的Faster-RCNN算法主要包括提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层进行处理等步骤。
Faster-RCNN算法中,提取特征图这一步骤是通过特征提取网络来实现的。图1中的特征提取网络是卷积神经网络,它可以接收待处理图像并进行特征提取,输出特征图。
Faster-RCNN算法中,提取感兴趣区域这一步骤是通过感兴趣区域提取网络来实现的。图1中的感兴趣区域提取网络(Region Proposal Network,RPN)可以对特征图进行分析,提取并生成图像中所有可能存在目标个体的区域。本实施例中,感兴趣区域提取网络可以输出2000个感兴趣区域,然后从中筛选出300个最优的感兴趣区域。
Faster-RCNN算法中,感兴趣区域映射这一步骤是通过感兴趣区域池化层来实现的。图1中的感兴趣区域池化层可以将多个感兴趣区域映射到特征图上,然后对映射后的特征图进行尺寸统一化处理。本实施例中,将特征图的尺寸统一化为7×7。
图1中的全连接层利用探测分类概率和探测边框回归的方法实现分类概率和边框回归,输出图像分类结果和图像边框回归结果,实现对图像中的目标检测。其中,探测分类概率使用了Softmax Loss损失函数,探测边框回归中使用了Smooth L1 Loss损失函数。
现有的Faster-RCNN算法未对特征图进行优化处理,直接对特征图进行感兴趣区域提取以及感兴趣区域映射,没有利用特征图中的上下文信息,因此最终的目标检测精度较低。
本实施例中的图像目标检测方法对特征图进行了优化处理,所述优化处理包括以下步骤:
S1.对所述特征图分别进行多次膨胀卷积处理;
S2.接收各次所述膨胀卷积处理输出的多个并行特征信息;
S3.将多个所述并行特征信息融合得到第一融合特征信息;
S4.将所述第一融合特征信息与特征图融合得到第二融合特征信息;所述第二融合特征信息用于所述Faster-RCNN算法中提取感兴趣区域和感兴趣区域映射的处理步骤。
本实施例中,所述优化处理是在Faster-RCNN算法的基础上进行的,所述优化处理的原理参照图2中虚线框内的部分。步骤S1中,每次膨胀卷积处理是独立进行的,每次膨胀处理都将得到一个对应的并行特征信息。步骤S3中,将多个并行特征信息融合在一起,得到第一融合特征信息。步骤S4中,将特征图与步骤S3得到的第一融合特征信息融合在一起,得到第二融合特征信息。所述第二融合特征信息作为对现有的Faster-RCNN算法过程中所得的特征图的优化结果,用于代替特征图进行Faster-RCNN算法中后续的提取感兴趣区域和感兴趣区域映射等处理步骤。
对特征图进行膨胀卷积处理,所得的并行特征信息中包含特征图的上下文特征信息。通过多次不同的膨胀卷积处理以及融合处理,所得到的第一融合特征信息中包含多组不同的上下文特征信息。根据第一融合特征信息和特征图融合得到的第二融合特征信息用于后续的处理,可以在现有Faster-RCNN算法能够提取到较丰富的图像细节特征的技术优势基础上,克服特征图的分辨率过低、待处理图像中的细节信息过多地丢失造成的Faster-RCNN的总体识别精度较低的缺点,获得较高的目标检测准确率。
进一步作为优选的实施方式,本实施例中所述的多次膨胀卷积处理,具体包括第一3×3膨胀卷积、第二3×3膨胀卷积和第三3×3膨胀卷积;
所述第一3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第一卷积核点乘后求和,将求和的结果作为第一并行特征信息输出;
所述第二3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第二卷积核点乘后求和,将求和的结果作为第二并行特征信息输出;
所述第三3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第三卷积核点乘后求和,将求和的结果作为第三并行特征信息输出。
本实施例中,第一3×3膨胀卷积为dilated-2算法,第二3×3膨胀卷积为dilated-4算法,第三3×3膨胀卷积为dilated-8算法。即第一3×3膨胀卷积的膨胀系数为2,所述第二3×3膨胀卷积的膨胀系数为4,所述第三3×3膨胀卷积的膨胀系数为8。
第一3×3膨胀卷积的原理为:对于特征图中的各像素点,每隔1个像素点采样一次,并将采样结果与3×3卷积核进行点乘,将多个点乘的结果之和作为中心像素的特征值,所述中心像素点的特征值作为第一并行特征信息输出。所述第一3×3膨胀卷积输出的第一并行特征信息包含了中心像素点周围2个像素点的上下文信息。
第二3×3膨胀卷积的原理为:对于特征图中的各像素点,每隔3个像素点采样一次,并将采样结果与3×3卷积核进行点乘,将多个点乘的结果之和作为中心像素的特征值,所述中心像素点的特征值作为第二并行特征信息输出。所述第二3×3膨胀卷积输出的第二并行特征信息包含了中心像素点周围4个像素点的上下文信息。
第三3×3膨胀卷积的原理为:对于特征图中的各像素点,每隔7个像素点采样一次,并将采样结果与3×3卷积核进行点乘,将多个点乘的结果之和作为中心像素的特征值,所述中心像素点的特征值作为第三并行特征信息输出。所述第三3×3膨胀卷积输出的第三并行特征信息包含了中心像素点周围8个像素点的上下文信息。
进一步作为优选的实施方式,所述步骤S3,即将多个所述并行特征信息融合得到第一融合特征信息这一步骤,具体包括:
将多个所述并行特征信息各自的通道(Channel)维度进行拼接(Concat),所述拼接的结果为第一融合特征信息。
本实施例中,将第一并行特征信息、第二并行特征信息和第三并行特征信息各自的通道维度进行拼接,所述拼接的结果为第一融合特征信息。
进一步作为优选的实施方式,所述步骤S4,即将所述第一融合特征信息与特征图融合得到第二融合特征信息这一步骤,具体包括:
将所述第一融合特征信息的通道(Channel)维度与所述特征图的通道维度进行拼接(Concat),所述拼接的结果为第二融合特征信息。
进一步作为优选的实施方式,所述用于对所述特征图进行优化的步骤还包括:
S5.对所述第二融合特征信息在通道维度进行降维。
本实施例中,步骤S5是通过1×1卷积进行的,也就是对第二融合特征信息通过1×1卷积在通道(Channel)维度进行降维。通过步骤S5的降维,可以降低网络宽度,降低对计算机资源的占用。
本实施例还包括一种图像目标检测系统,所述系统包括用于对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层进行处理的Faster-RCNN模块,所述系统还包括:
膨胀卷积模块,用于对所述特征图分别进行多次膨胀卷积处理;
并行特征信息模块,用于接收各次所述膨胀卷积处理输出的多个并行特征信息;
第一融合特征信息模块,用于将多个所述并行特征信息融合得到第一融合特征信息;
第二融合特征信息模块,用于将所述第一融合特征信息与特征图融合得到第二融合特征信息;
输入模块,用于将所述第二融合特征信息输入到所述Faster-RCNN模块中,从而使Faster-RCNN模块进行提取感兴趣区域和感兴趣区域映射的处理。
本实施例还包括一种图像目标检测装置,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行本发明图像目标检测方法。
本实施例还包括一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行本发明图像目标检测方法。
本实施例中的图像目标检测系统、装置和存储介质,可以执行本发明的图像目标检测方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
以上是对本发明的较佳实施进行了具体说明,但对本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种图像目标检测方法,所述方法使用Faster-RCNN算法对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层的处理步骤,其特征在于,所述方法还包括以下用于对所述特征图进行优化的步骤:
对所述特征图分别进行多次膨胀卷积处理;
接收各次所述膨胀卷积处理输出的多个并行特征信息;
将多个所述并行特征信息融合得到第一融合特征信息;
将所述第一融合特征信息与特征图融合得到第二融合特征信息;所述第二融合特征信息用于所述Faster-RCNN算法中提取感兴趣区域和感兴趣区域映射的处理步骤。
2.根据权利要求1所述的一种图像目标检测方法,其特征在于,所述多次膨胀卷积处理包括第一3×3膨胀卷积、第二3×3膨胀卷积和第三3×3膨胀卷积;
所述第一3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第一卷积核点乘后求和,将求和的结果作为第一并行特征信息输出;
所述第二3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第二卷积核点乘后求和,将求和的结果作为第二并行特征信息输出;
所述第三3×3膨胀卷积用于从所述特征图中采集像素点值,并将采集到的像素点值分别与第三卷积核点乘后求和,将求和的结果作为第三并行特征信息输出。
3.根据权利要求2所述的一种图像目标检测方法,其特征在于,所述第一3×3膨胀卷积的膨胀系数为2,所述第二3×3膨胀卷积的膨胀系数为4,所述第三3×3膨胀卷积的膨胀系数为8。
4.根据权利要求1所述的一种图像目标检测方法,其特征在于,所述将多个所述并行特征信息融合得到第一融合特征信息这一步骤,具体包括:
将多个所述并行特征信息各自的通道维度进行拼接,所述拼接的结果为第一融合特征信息。
5.根据权利要求1所述的一种图像目标检测方法,其特征在于,所述将所述第一融合特征信息与特征图融合得到第二融合特征信息这一步骤,具体包括:
将所述第一融合特征信息的通道维度与所述特征图的通道维度进行拼接,所述拼接的结果为第二融合特征信息。
6.根据权利要求1所述的一种图像目标检测方法,其特征在于,所述用于对所述特征图进行优化的步骤还包括:
对所述第二融合特征信息在通道维度进行降维。
7.根据权利要求6所述的一种图像目标检测方法,其特征在于,所述对所述第二融合特征信息在通道维度进行降维这一步骤,是通过1×1卷积进行的。
8.一种图像目标检测系统,所述系统包括用于对待处理图像依次进行提取特征图、提取感兴趣区域、感兴趣区域映射以及输入到全连接层进行处理的Faster-RCNN模块,其特征在于,所述系统还包括:
膨胀卷积模块,用于对所述特征图分别进行多次膨胀卷积处理;
并行特征信息模块,用于接收各次所述膨胀卷积处理输出的多个并行特征信息;
第一融合特征信息模块,用于将多个所述并行特征信息融合得到第一融合特征信息;
第二融合特征信息模块,用于将所述第一融合特征信息与特征图融合得到第二融合特征信息;
输入模块,用于将所述第二融合特征信息输入到所述Faster-RCNN模块中,从而使Faster-RCNN模块进行提取感兴趣区域和感兴趣区域映射的处理。
9.一种图像目标检测装置,其特征在于,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行权利要求1-7任一项所述方法。
10.一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-7任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910068062.9A CN110008949B (zh) | 2019-01-24 | 2019-01-24 | 一种图像目标检测方法、系统、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910068062.9A CN110008949B (zh) | 2019-01-24 | 2019-01-24 | 一种图像目标检测方法、系统、装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110008949A true CN110008949A (zh) | 2019-07-12 |
CN110008949B CN110008949B (zh) | 2020-03-17 |
Family
ID=67165500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910068062.9A Active CN110008949B (zh) | 2019-01-24 | 2019-01-24 | 一种图像目标检测方法、系统、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110008949B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052917A (zh) * | 2020-10-22 | 2020-12-08 | 上海明略人工智能(集团)有限公司 | 一种图像分类方法、系统、电子设备及存储介质 |
CN112954051A (zh) * | 2021-02-07 | 2021-06-11 | 广州一盒科技有限公司 | 一种用于食材加工的远程控制方法及系统 |
CN113139542A (zh) * | 2021-04-28 | 2021-07-20 | 北京百度网讯科技有限公司 | 目标检测方法、装置、设备和计算机可读存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107492095A (zh) * | 2017-08-02 | 2017-12-19 | 西安电子科技大学 | 基于深度学习的医学图像肺结节检测方法 |
CN107945185A (zh) * | 2017-11-29 | 2018-04-20 | 北京工商大学 | 基于宽残差金字塔池化网络的图像分割方法及系统 |
CN108256562A (zh) * | 2018-01-09 | 2018-07-06 | 深圳大学 | 基于弱监督时空级联神经网络的显著目标检测方法及系统 |
CN108268870A (zh) * | 2018-01-29 | 2018-07-10 | 重庆理工大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
CN108470159A (zh) * | 2018-03-09 | 2018-08-31 | 腾讯科技(深圳)有限公司 | 车道线数据处理方法、装置、计算机设备和存储介质 |
CN108596330A (zh) * | 2018-05-16 | 2018-09-28 | 中国人民解放军陆军工程大学 | 一种并行特征全卷积神经网络及其构建方法 |
CN108647776A (zh) * | 2018-05-08 | 2018-10-12 | 济南浪潮高新科技投资发展有限公司 | 一种卷积神经网络卷积膨胀处理电路及方法 |
CN108830280A (zh) * | 2018-05-14 | 2018-11-16 | 华南理工大学 | 一种基于区域提名的小目标检测方法 |
CN108961253A (zh) * | 2018-06-19 | 2018-12-07 | 深动科技(北京)有限公司 | 一种图像分割方法和装置 |
CN109086437A (zh) * | 2018-08-15 | 2018-12-25 | 重庆大学 | 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 |
CN109145843A (zh) * | 2018-08-29 | 2019-01-04 | 上海萃舟智能科技有限公司 | 一种卡口高清相机全车信息识别系统及方法 |
-
2019
- 2019-01-24 CN CN201910068062.9A patent/CN110008949B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107492095A (zh) * | 2017-08-02 | 2017-12-19 | 西安电子科技大学 | 基于深度学习的医学图像肺结节检测方法 |
CN107945185A (zh) * | 2017-11-29 | 2018-04-20 | 北京工商大学 | 基于宽残差金字塔池化网络的图像分割方法及系统 |
CN108256562A (zh) * | 2018-01-09 | 2018-07-06 | 深圳大学 | 基于弱监督时空级联神经网络的显著目标检测方法及系统 |
CN108268870A (zh) * | 2018-01-29 | 2018-07-10 | 重庆理工大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
CN108470159A (zh) * | 2018-03-09 | 2018-08-31 | 腾讯科技(深圳)有限公司 | 车道线数据处理方法、装置、计算机设备和存储介质 |
CN108647776A (zh) * | 2018-05-08 | 2018-10-12 | 济南浪潮高新科技投资发展有限公司 | 一种卷积神经网络卷积膨胀处理电路及方法 |
CN108830280A (zh) * | 2018-05-14 | 2018-11-16 | 华南理工大学 | 一种基于区域提名的小目标检测方法 |
CN108596330A (zh) * | 2018-05-16 | 2018-09-28 | 中国人民解放军陆军工程大学 | 一种并行特征全卷积神经网络及其构建方法 |
CN108961253A (zh) * | 2018-06-19 | 2018-12-07 | 深动科技(北京)有限公司 | 一种图像分割方法和装置 |
CN109086437A (zh) * | 2018-08-15 | 2018-12-25 | 重庆大学 | 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 |
CN109145843A (zh) * | 2018-08-29 | 2019-01-04 | 上海萃舟智能科技有限公司 | 一种卡口高清相机全车信息识别系统及方法 |
Non-Patent Citations (2)
Title |
---|
FISHER YU 等: "MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS", 《ICLR2016》 * |
HENGSHUANG ZHAO等: "Pyramid Scene Parsing Network", 《ARXIV:1612.01105V2 [CS.CV]》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052917A (zh) * | 2020-10-22 | 2020-12-08 | 上海明略人工智能(集团)有限公司 | 一种图像分类方法、系统、电子设备及存储介质 |
CN112954051A (zh) * | 2021-02-07 | 2021-06-11 | 广州一盒科技有限公司 | 一种用于食材加工的远程控制方法及系统 |
CN113139542A (zh) * | 2021-04-28 | 2021-07-20 | 北京百度网讯科技有限公司 | 目标检测方法、装置、设备和计算机可读存储介质 |
CN113139542B (zh) * | 2021-04-28 | 2023-08-11 | 北京百度网讯科技有限公司 | 目标检测方法、装置、设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110008949B (zh) | 2020-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Westphal et al. | Document image binarization using recurrent neural networks | |
US11392800B2 (en) | Computer vision systems and methods for blind localization of image forgery | |
CN112070649B (zh) | 一种去除特定字符串水印的方法及系统 | |
CN110008949A (zh) | 一种图像目标检测方法、系统、装置和存储介质 | |
CN114187311A (zh) | 一种图像语义分割方法、装置、设备及存储介质 | |
CN110210480B (zh) | 文字识别方法、装置、电子设备和计算机可读存储介质 | |
CN111680690A (zh) | 一种文字识别方法及装置 | |
Alnuaim et al. | Human‐Computer Interaction with Hand Gesture Recognition Using ResNet and MobileNet | |
CN111353544A (zh) | 一种基于改进的Mixed Pooling-YOLOV3目标检测方法 | |
CN108268890A (zh) | 一种高光谱图像分类方法 | |
CN111666937A (zh) | 一种图像中的文本识别方法及系统 | |
CN116012291A (zh) | 工业零件图像缺陷检测方法及系统、电子设备和存储介质 | |
CN110826534B (zh) | 一种基于局部主成分分析的人脸关键点检测方法及系统 | |
CN113160200A (zh) | 一种基于多任务孪生网络的工业图像缺陷检测方法及系统 | |
CN112861718A (zh) | 一种轻量级特征融合人群计数方法及系统 | |
CN111723852A (zh) | 针对目标检测网络的鲁棒训练方法 | |
Zhang et al. | Residual attentive feature learning network for salient object detection | |
Wicht et al. | Camera-based sudoku recognition with deep belief network | |
Wicht et al. | Mixed handwritten and printed digit recognition in Sudoku with Convolutional Deep Belief Network | |
Xiang et al. | Recognition of characters on curved metal workpiece surfaces based on multi-exposure image fusion and deep neural networks | |
CN113486715A (zh) | 图像翻拍识别方法、智能终端以及计算机存储介质 | |
CN110738213B (zh) | 一种包括周边环境的图像识别方法及装置 | |
CN111860601A (zh) | 预测大型真菌种类的方法及装置 | |
Marjusalinah et al. | Classification of finger spelling American sign language using convolutional neural network | |
CN111242114A (zh) | 文字识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |