CN110084284A - 基于区域卷积神经网络的目标检测与二级分类算法及装置 - Google Patents
基于区域卷积神经网络的目标检测与二级分类算法及装置 Download PDFInfo
- Publication number
- CN110084284A CN110084284A CN201910273365.4A CN201910273365A CN110084284A CN 110084284 A CN110084284 A CN 110084284A CN 201910273365 A CN201910273365 A CN 201910273365A CN 110084284 A CN110084284 A CN 110084284A
- Authority
- CN
- China
- Prior art keywords
- target
- algorithm
- region
- classification
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于区域全卷积神经网络的目标检测与二级分类算法及装置,该算法包括对目标图像进行数据增强处理;进行数据增强后的图像做目标检测与分类的R‑FCN算法处理;对基于R‑FCN训练好的图像检测模型进行训练改进三个步骤。针对现存算法的这些特定问题,本发明提出的算法进行了进一步改进,使得算法模型除了原有的准确检测,分类需要特征具有评议不变性之外,还使得算法模型同时实现了检测与二级分类的功能,相比于现有的算法,本算法可靠性高,目标识别度高,鲁棒性好,同时步骤计算简单,大大减少了计算量,能保持高效率,实际应用性能也能满足需求。
Description
技术领域
本发明涉及计算机视觉领域,具体涉及一种基于区域全卷积神经网络的目标检测与二级分类算法及装置。
背景技术
随着现代化交通、安防等行业的迅速发展,目标识别技术越来越多的被应用于各种领域,是近年来计算机视觉与模式识别技术在智能交通领域的重要研究课题之一。
伴随着最近几年深度学习的兴起,基于深度学习的方法在图像分类领域也取得了优异的成绩。很多研究者基于此也尝试将深度学习应用于目标检测领域。从目前的情况来看,现在的大部分CNN在分类上可以做的很好,但用在检测上效果不佳。传统的SPP,FasterR-CNN类的方法在感兴趣的目标区域池化(ROI pooling)前都是卷积,是具备平移不变性的,但一旦插入感兴趣的目标区域池化(ROI pooling)之后,后面的网络结构就不再具备平移不变性了。在目标检测算法中,通常分类需要特征具有平移不变性,检测则要求对目标的平移做出准确响应,基于区域的全卷积神经网络(R-FCN)由输入层、卷积层、激活函数、池化层等组成,即I NPUT-CONV-RELU-POOL-FC,R-FCN可以用于解决复杂的计算机视觉问题,并取得很好的效果。
虽然R-FCN方法在通用的目标检测取得了较好的结果,但是在实际应用过程中,也存在着一些问题,比如不能同时实现复杂监控场景中对检测目标的检测与具体细分类功能,不能直接适用于复杂场景智能系统中的算法应用,无法满足计算简便以及实时性需求。
发明内容
本发明的主要目的是提供一种基于区域全卷积神经网络的目标检测与二级分类算法及装置,旨在提高目标视频检测系统的准确性与可靠性,使其能满足实时性需求,通过对现有算法进一步改进,使得算法模型除了原有的准确检测,分类需要特征具有评议不变性之外,还使得算法模型同时实现了检测与二级分类的功能,相比于现有的算法,本算法可靠性高,目标识别度高,鲁棒性好,同时步骤计算简单,大大减少了计算量,能保持高效率,实际应用性能也能满足需求。
为实现上述目的,本发明提供一种基于区域全卷积神经网络的目标检测与二级分类算法,包括以下步骤:
S1:采集目标图像并进行基于PCA的数据增强处理;
S2:对数据增强后的图像做目标检测的R-FCN算法处理,具体步骤如下:
S2.1:定位并确定目标:利用ResNet网络生成特征映射图,并利用区域建议网络对生成的特征映射图进行全图的前后景目标搜索和筛选,以确定目标框;
S2.2:进行目标具体类别的分类:在确定的目标框的基础上利用R-FCN的分类网络对目标框进行分类识别;
S3:对基于R-FCN训练好的图像检测模型进行训练改进,具体步骤如下:
S3.1:增加多个分支,同时调整算法中对输入图片动态长宽比的实际需求模型;
S3.2:训练出需要的目标模型,对目标模型进行二级细分类。
优选的,所述步骤S1包括:
S1.1:对目标图像进行镜面对称,获得翻倍的数据集;
S1.2:在获得的数据集中对于目标系列的数据集进行背景分割;
S1.3:对数据集中的图像进行PCA处理。
优选的,所述步骤S1.1中对目标图像的数据进行镜面对称的方式为:左右对称和上下对称,将数据集数量翻两番。
优选的,所述步骤S1.3包括:
首先根据RGB三色对样本阵元进行标准化处理,变换色通道计算均值和标准差,对网络的输入数据进行规范化,其公式具体如下:
随后在整个训练集上计算协方差矩阵,其公式具体如下:
解相关矩阵R的特征方程|R-λIp|=0得到p个特征根,确定主成分的每个λj,j=1,2,...m,解方程组Rb=λjb得到单位特征向量j=1,2,...m,将标准化后的指标变量变换为主成分;
将求出的特征向量按照特征值的大小进行组合形成一个映射矩阵,并根据指定的PCA保留的特征个数取出映射矩阵的前n行或者前n列作为最终的映射矩阵,用映射矩阵对原始数据进行映射,并将上述经过数据增强预处理的图像输出最终结果。
优选的,所述S2.1具体为使用ResNet50网络对图片进行卷积池化操作,将特征映射图里的信息转换为候选区域的位置信息和其为前后景的概率信息,RPN默认用9个搜索框来搜索一块区域,通用目标的其中搜索区域的尺度设置图片的长宽比可变,总体图片大小不变。
优选的,所述S2.2具体为基于ResNet50网络生成的特征映射图,利用卷积操作在整幅图像上为每类生成k×k个位置敏感分数图;每个位置敏感图有C个通道输出,代表C-1类物体外加一个背景,对于一个w×h大小的候选目标框,此由RPN网络获得,将目标框划分为k×k个子区域,则每个子区域为w×h/k2大小,对于任意一个子区域bin(i,j),0≤i,j≤k-1,定义一个位置敏感池化操作,具体公式为:
rc(i,j|Θ)是子区域bin(i,j)对C个类别的池化响应,zi,j,C是子区域bin(i,j)所对应的位置敏感分数图,(x0,y0)代表目标候选框左上角的坐标,n是子区域bin(i,j)中的像素数,Θ代表网络的所有学习得到的参数,计算k×k个子区域的池化响应输出rc(i,j|Θ)的均值,利用Softmax回归分类方法获得其属于每个类别的概率。
优选的,所述S3中,对R-FCN检测输出的结果进行二次分类时,二次分类网络与位置敏感区域池化相结合,其输入为R-FCN的目标检测框的图片信息,输出为相应的类别信息。
为实现上述目的,本发明提供一种计算机装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述任一项所述的基于区域全卷积神经网络的目标检测与二级分类算法的步骤。
本发明提出的一种基于区域全卷积神经网络的目标检测与二级分类算法,针对现存算法的这些特定问题,本算法进行了进一步改进,使得算法模型除了原有的准确检测,分类需要特征具有评议不变性之外,还使得算法模型同时实现了检测与二级分类的功能,相比于现有的算法,本算法可靠性高,目标识别度高,鲁棒性好,同时步骤计算简单,大大减少了计算量,能保持高效率,实际应用性能也能满足需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明一实施例所述整体算法流程图。
图2是本发明一实施例所述R-FCN目标检测框图。
图3是本发明一实施例所述RPN网络整体结构图。
图4是本发明一实施例所述目标检测效果图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1-4,为本发明一种基于区域全卷积神经网络的目标检测与二级分类算法的一实施例,所述基于区域全卷积神经网络的目标检测与二级分类算法包括以下步骤:
S1:对目标图像进行数据增强处理;
S2:进行数据增强后的图像做目标检测与分类的R-FCN算法处理;
S3:对基于R-FCN训练好的图像检测模型进行训练改进,增加多个分支,同时调整算法中对输入图片动态长宽比的实际需求模型,训练出需要的目标模型并能对目标模型进行二级细分类。
进一步地,所述S1中对目标图像进行基于PCA的数据增强预处理,其具体步骤如下:
S1.1:对数据进行镜面对称增强数据集:分为左右和上下对称,将数据集数量翻两番;
S1.2:对于一个系列的数据集,进行背景分割,数据集主要语义只占全部图像的10%左右,且大部分集中在中部区域,增加其突出特征;
S1.3:对通过变换的图像进行PCA处理:
首先根据RGB三色对样本阵元进行如下标准化,变换色通道计算均值和标准差,对网络的输入数据进行规范化,其公式具体如下:
随后在整个训练集上计算协方差矩阵,其公式具体如下:
解相关矩阵R的特征方程|R-λIp|=0得到p个特征根,确定主成分的每个λj,j=1,2,...m,解方程组Rb=λjb得到单位特征向量j=1,2,...m,将标准化后的指标变量变换为主成分;
将求出的特征向量按照特征值的大小进行组合形成一个映射矩阵,并根据指定的PCA保留的特征个数取出映射矩阵的前n行或者前n列作为最终的映射矩阵,用映射矩阵对原始数据进行映射,达到数据降维的目的;
将上述经过数据增强预处理的图像输出最终结果。
进一步地,S2中进行数据增强后的图像做目标检测的R-FCN算法处理,首先利用ResNet网络生成特征映射图,并利用区域建议网络(Region Proposal Networks,RPN)对生成的特征映射图进行全图的前后景目标搜索和筛选,以确定目标框,在此基础上,利用分类网络对目标框进行分类识别;
整个网络可以通过端到端学习,一个底层的卷积(conv)网络如ResNet,一个RPN,一个位置敏感(position sensitive)的预测(prediction)层,最后的兴趣区域的池化层(ROI pooling)加上投票的决策层(vote),具体的图像R-FCN算法处理步骤如下:
S2.1:利用区域建议网络(RPN)进行目标候选区域搜索,同时调整算法中对输入图片动态长宽比的实际需求模型参数;
R-FCN网络使用ResNet50网络对图片进行卷积池化等操作,ResNet50网络的输出层为一个1×2048×63×38的张量,RPN在ResNet50输出层上完成候选区域的搜索,具体的形式是在输出层上利用512个,尺寸为3x3的卷积核进行卷积操作,获得一个512×63×38的张量,将该张量作为两个独立卷积层的输入,从而将特征映射图里的信息转换为候选区域的位置信息和其为前后景的概率信息,RPN默认用9个搜索框来搜索一块区域,尺度为642、1282、2562,长宽比为1:1、1:2、2:1,以上搜索框的默认属性是针对ImageNet和VOC数据集中的通用目标的;
考虑到实际应用中目标检测的需要,本发明在将搜索区域的尺度设置图片的长宽比可变,总体图片大小不变,这不仅有利于增加视频图像的处理需求,也大大减少了计算量,对于原始的输入图片,RPN网络会得到约两万个搜索框,在实际应用时,一些超出图片边界的搜索框会被剔除,同时,对于同一目标重叠覆盖的搜索框,采用非极大值抑制(Non-Maximum Suppression,NMS)方法来处理,以达到去除重叠搜索框的目的,上述策略可显著提高候选目标框的搜索效率;
S2.2:对R-FCN进行分类检测,R-FCN的分类网络基于ResNet50网络生成的特征映射图,利用卷积操作在整幅图像上为每类生成k×k个位置敏感分数图,用来描述对应位置的空间网格;
每个位置敏感图有C个通道输出(代表C-1类物体外加一个背景),对于一个w×h大小的候选目标框(由RPN网络获得),将目标框划分为k×k个子区域,则每个子区域为w×h/k2大小,对于任意一个子区域bin(i,j),0≤i,j≤k-1,定义一个位置敏感池化操作,具体公式为:
rc(i,j|Θ)是子区域bin(i,j)对C个类别的池化响应,zi,j,C是子区域bin(i,j)所对应的位置敏感分数图,(x0,y0)代表目标候选框左上角的坐标,n是子区域bin(i,j)中的像素数,Θ代表网络的所有学习得到的参数,计算k×k个子区域的池化响应输出rc(i,j|Θ)的均值,利用Softmax回归分类方法获得其属于每个类别的概率;
在实际测试中,经过处理后的图像,用50层的Residual Net,R-FCN取得了83.6%的mAP在VOC2007上,2012上取得了82.0,同时时间170ms每张图片,是Faster RCNN的2.5倍以上。
进一步地,S3中引入二次分类思想,利用对ResNet-50网络进行位置敏感区域池化(Psroi pooling),对R-FCN检测输出的结果进行二次分类,二次分类网络(ResNet-50)与位置敏感区域池化(Psroi pooling)相结合,输入为R-FCN的目标检测框的图片信息,输出为相应的类别信息,降低误报率,进一步改善网络的性能;
在训练二次分类器时,为了增大负样本(R-FCN目标检测网络的误报样本)的数量,本发明采用了复制扩充训练集的方法,加强二次分类网络(ResNet-50)对位置敏感区域池化(Psroi pooling)后原始R-FCN网络中误报样本特征的学习,从而降低误报率,在实际应用中,也能保证系统实时性。
进一步地,本发明中提出的方法实际上可嵌入视频监控系统实现,运用于具有实时输出图像功能的目标检测与分类的监控系统中。
本发明还提供一种计算机装置,在一实施例中,该计算机装置包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例中的基于区域全卷积神经网络的目标检测与二级分类算法的步骤。可以理解,该计算机装置可以为电视、IPAD、PC、手机等。
在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第X实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料、方法步骤或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (8)
1.一种基于区域全卷积神经网络的目标检测与二级分类算法,其特征在于,包括以下步骤:
S1:采集目标图像并进行基于PCA的数据增强处理;
S2:对数据增强后的图像做目标检测的R-FCN算法处理,具体步骤如下:
S2.1:定位并确定目标:利用ResNet网络生成特征映射图,并利用区域建议网络对生成的特征映射图进行全图的前后景目标搜索和筛选,以确定目标框;
S2.2:进行目标具体类别的分类:在确定的目标框的基础上利用R-FCN的分类网络对目标框进行分类识别;
S3:对基于R-FCN训练好的图像检测模型进行训练改进,具体步骤如下:
S3.1:增加多个分支,同时调整算法中对输入图片动态长宽比的实际需求模型;
S3.2:训练出需要的目标模型,对目标模型进行二级细分类。
2.如权利要求1所述的基于区域全卷积神经网络的目标检测与二级分类算法,其特征在于,所述步骤S1包括:
S1.1:对目标图像进行镜面对称,获得翻倍的数据集;
S1.2:在获得的数据集中对于目标系列的数据集进行背景分割;
S1.3:对数据集中的图像进行PCA处理。
3.如权利要求2所述的基于区域全卷积神经网络的目标检测与二级分类算法,其特征在于,所述步骤S1.1中对目标图像的数据进行镜面对称的方式为:左右对称和上下对称,将数据集数量翻两番。
4.如权利要求2所述的基于区域全卷积神经网络的目标检测与二级分类算法,其特征在于,所述步骤S1.3包括:
首先根据RGB三色对样本阵元进行标准化处理,变换色通道计算均值和标准差,对网络的输入数据进行规范化,其公式具体如下:
随后在整个训练集上计算协方差矩阵,其公式具体如下:
解相关矩阵R的特征方程|R-λIp|=0得到p个特征根,确定主成分的每个λj,j=1,2,...m,解方程组Rb=λjb得到单位特征向量将标准化后的指标变量变换为主成分;
将求出的特征向量按照特征值的大小进行组合形成一个映射矩阵,并根据指定的PCA保留的特征个数取出映射矩阵的前n行或者前n列作为最终的映射矩阵,用映射矩阵对原始数据进行映射,并将上述经过数据增强预处理的图像输出最终结果。
5.如权利要求1所述的基于区域全卷积神经网络的目标检测与二级分类算法,其特征在于,所述S2.1具体为使用ResNet50网络对图片进行卷积池化操作,将特征映射图里的信息转换为候选区域的位置信息和其为前后景的概率信息,RPN默认用9个搜索框来搜索一块区域,通用目标的其中搜索区域的尺度设置图片的长宽比可变,总体图片大小不变。
6.如权利要求5所述的基于区域全卷积神经网络的目标检测与二级分类算法,其特征在于,所述S2.2具体为基于ResNet50网络生成的特征映射图,利用卷积操作在整幅图像上为每类生成k×k个位置敏感分数图;每个位置敏感图有C个通道输出,代表C-1类物体外加一个背景,对于一个w×h大小的候选目标框,此由RPN网络获得,将目标框划分为k×k个子区域,则每个子区域为w×h/k2大小,对于任意一个子区域bin(i,j),0≤i,j≤k-1,定义一个位置敏感池化操作,具体公式为:
rc(i,j|Θ)是子区域bin(i,j)对C个类别的池化响应,zi,j,C是子区域bin(i,j)所对应的位置敏感分数图,(x0,y0)代表目标候选框左上角的坐标,n是子区域bin(i,j)中的像素数,Θ代表网络的所有学习得到的参数,计算k×k个子区域的池化响应输出rc(i,j|Θ)的均值,利用Softmax回归分类方法获得其属于每个类别的概率。
7.如权利要求6所述的基于区域全卷积神经网络的目标检测与二级分类算法,其特征在于,所述S3中,对R-FCN检测输出的结果进行二次分类时,二次分类网络与位置敏感区域池化相结合,其输入为R-FCN的目标检测框的图片信息,输出为相应的类别信息。
8.一种计算机装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于区域全卷积神经网络的目标检测与二级分类算法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910273365.4A CN110084284A (zh) | 2019-04-04 | 2019-04-04 | 基于区域卷积神经网络的目标检测与二级分类算法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910273365.4A CN110084284A (zh) | 2019-04-04 | 2019-04-04 | 基于区域卷积神经网络的目标检测与二级分类算法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110084284A true CN110084284A (zh) | 2019-08-02 |
Family
ID=67414284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910273365.4A Pending CN110084284A (zh) | 2019-04-04 | 2019-04-04 | 基于区域卷积神经网络的目标检测与二级分类算法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110084284A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647912A (zh) * | 2019-08-15 | 2020-01-03 | 深圳久凌软件技术有限公司 | 细粒度图像识别方法、装置、计算机设备及存储介质 |
CN111401128A (zh) * | 2020-01-16 | 2020-07-10 | 杭州电子科技大学 | 一种提高车辆识别率的方法 |
CN111680698A (zh) * | 2020-04-21 | 2020-09-18 | 北京三快在线科技有限公司 | 图像识别方法、装置及图像识别模型的训练方法、装置 |
CN113159028A (zh) * | 2020-06-12 | 2021-07-23 | 杭州喔影网络科技有限公司 | 显著性感知图像裁剪方法、装置、计算设备和存储介质 |
CN113159112A (zh) * | 2021-03-09 | 2021-07-23 | 西南石油大学 | 一种古生物化石图像自动标注方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299644A (zh) * | 2018-07-18 | 2019-02-01 | 广东工业大学 | 一种基于区域全卷积网络的车辆目标检测方法 |
-
2019
- 2019-04-04 CN CN201910273365.4A patent/CN110084284A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299644A (zh) * | 2018-07-18 | 2019-02-01 | 广东工业大学 | 一种基于区域全卷积网络的车辆目标检测方法 |
Non-Patent Citations (2)
Title |
---|
HANLINGER_: "R-FCN", 《CSDN,HTTPS://BLOG.CSDN.NET/HANLINGER_/ARTICLE/DETAILS/80357057?SPM=1001.2014.3001.5501》 * |
SUNUECHAO: "PCA中关于协方差矩阵的问题", 《CSDN,HTTPS://BLOG.CSDN.NET/SUNUECHAO/ARTICLE/DETAILS/12717771?SPM=1001.2014.3001.5502》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647912A (zh) * | 2019-08-15 | 2020-01-03 | 深圳久凌软件技术有限公司 | 细粒度图像识别方法、装置、计算机设备及存储介质 |
CN111401128A (zh) * | 2020-01-16 | 2020-07-10 | 杭州电子科技大学 | 一种提高车辆识别率的方法 |
CN111680698A (zh) * | 2020-04-21 | 2020-09-18 | 北京三快在线科技有限公司 | 图像识别方法、装置及图像识别模型的训练方法、装置 |
CN113159028A (zh) * | 2020-06-12 | 2021-07-23 | 杭州喔影网络科技有限公司 | 显著性感知图像裁剪方法、装置、计算设备和存储介质 |
CN113159028B (zh) * | 2020-06-12 | 2022-04-05 | 杭州喔影网络科技有限公司 | 显著性感知图像裁剪方法、装置、计算设备和存储介质 |
CN113159112A (zh) * | 2021-03-09 | 2021-07-23 | 西南石油大学 | 一种古生物化石图像自动标注方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109902677B (zh) | 一种基于深度学习的车辆检测方法 | |
CN110135267B (zh) | 一种大场景sar图像细微目标检测方法 | |
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
CN109584248B (zh) | 基于特征融合和稠密连接网络的红外面目标实例分割方法 | |
CN110084284A (zh) | 基于区域卷积神经网络的目标检测与二级分类算法及装置 | |
CN109753903A (zh) | 一种基于深度学习的无人机检测方法 | |
CN106909924A (zh) | 一种基于深度显著性的遥感影像快速检索方法 | |
CN109101897A (zh) | 水下机器人的目标检测方法、系统及相关设备 | |
CN108710913A (zh) | 一种基于深度学习的开关柜图像开关状态自动识别方法 | |
CN113160062B (zh) | 一种红外图像目标检测方法、装置、设备及存储介质 | |
CN107016357A (zh) | 一种基于时间域卷积神经网络的视频行人检测方法 | |
CN113486764B (zh) | 一种基于改进的YOLOv3的坑洼检测方法 | |
CN108734171A (zh) | 一种深度协同稀疏编码网络的合成孔径雷达遥感图像海洋浮筏识别方法 | |
CN111460968A (zh) | 基于视频的无人机识别与跟踪方法及装置 | |
CN108664838A (zh) | 基于改进rpn深度网络的端到端的监控场景行人检测方法 | |
CN112949572A (zh) | 基于Slim-YOLOv3的口罩佩戴情况检测方法 | |
CN109034233A (zh) | 一种结合OpenStreetMap的高分辨率遥感影像多分类器联合分类方法 | |
CN110096982A (zh) | 一种基于深度学习的视频车辆大数据搜索方法 | |
CN110096962A (zh) | 基于区域卷积网络的车辆细节识别二次结构化方法及装置 | |
CN110096981A (zh) | 一种基于深度学习的视频大数据交通场景分析方法 | |
CN115294473A (zh) | 一种基于目标检测与实例分割的绝缘子故障识别方法及系统 | |
CN107944403A (zh) | 一种图像中的行人属性检测方法及装置 | |
CN115965812B (zh) | 无人机影像对湿地植被物种和地物分类的评估方法 | |
CN111507416B (zh) | 一种基于深度学习的吸烟行为实时检测方法 | |
CN116958962A (zh) | 一种基于改进YOLOv8s的疏果前石榴果实检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |