CN110059554A - 一种基于交通场景的多支路目标检测方法 - Google Patents
一种基于交通场景的多支路目标检测方法 Download PDFInfo
- Publication number
- CN110059554A CN110059554A CN201910187966.3A CN201910187966A CN110059554A CN 110059554 A CN110059554 A CN 110059554A CN 201910187966 A CN201910187966 A CN 201910187966A CN 110059554 A CN110059554 A CN 110059554A
- Authority
- CN
- China
- Prior art keywords
- network
- target
- bounding box
- prediction
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明请求保护一种基于交通场景的多支路目标检测方法,包括步骤:S1获取交通路口拍摄的高清照片构建相关数据集,对交通场景图像进行分类和标注,生成相应的类别标签,并划分训练集和测试集;S2搭建基于深度学习的具有32层的网络模型,采用k‑means聚类算法获取9个锚框先验,将这9个锚框平均分配到三个检测分支中,该网络将检测任务转化为回归任务,在一个网络上同时完成目标的分类与边界框的回归,即将目标检测算法的候选框生成、特征提取、分类及位置精修这4个步骤统一到一个深度网络框架之内,采用反向传播和随机梯度下降方法对网络模型进行端到端训练,通过迭代训练使损失函数降到一个小的范围然后停止训练。
Description
技术领域
本发明属于深度学习、图像处理、模式识别等领域,尤其是涉及一种基于深度学习的采用多个分支来对交通场景中不同尺度大小的目标进行检测的目标检测方法。
背景技术
从交通场景中自动地检测交通场景中的各种目标(例如车辆和行人)是许多智能交通系统的首要处理步骤。对主要道路进行合理的交通管理和控制可以减少诸如交通事故、道路拥堵等问题的发生。
在过去的十年中,许多学者与研究人员在这一领域做出了相当大的努力,并提出了一些具有挑战性的基准数据集,如KITTI和LSVH等,用于评价和比较各种检测算法的性能。由于卷积神经网络提取的特征比传统人工特征的泛化性能好,因此基于CNN的目标检测方法在车辆检测、行人检测以及各种其他物体的检测任务方面取得了惊人的成功。由于基于滑动窗口的对象检测算法的效率低、计算成本巨大,对象检测的两种其他方法,即基于候选区域的目标检测算法和基于回归的目标检测算法受到了广泛的关注。前者首先使用诸如选择性搜索(selective search)和edge boxes这样的区域生成算法来生成候选区域(即region proposal),然后通过卷积神经网络对其进行处理。这些方法具有较高的精度,但是不能满足实时性的要求。其中的代表性算法包括RCNN、Fast RCNN、Faster RCNN、Mask RCNN等,它们是典型的two-stage方法(首先使用区域生成方法生成候选区域,然后对候选区域进行分类和回归)。另一种是基于回归方法的目标检测算法,这一方法将目标检测问题转化为回归问题,直接预测出对象的位置和分类。这些方法是典型的one-stage方法,它们的检测速度较快,但是精度一般低于two-stage方法。代表性算法有YOLO、SSD、YOLOv2、YOLOv3等。尽管CNN的性能强大,但是当将CNN应用于交通场景的目标检测时,面临的难题之一是传统的基于CNN的方法对尺度敏感,CNN的全连接层需要固定尺寸的输入,而传统的ROIPooling层采用简单复制候选区域的某些部分以填充额外的空间来获得指定大小的特征映射的方案会破坏小目标的原始结构。在网络训练过程中,填充复制值不仅会导致前向传播过程中的特征表示不准确,而且在反向传播过程中会积累误差。不准确的表示和积累的误差会误导了网络训练并防止网络正确地检测出小尺度的对象。此外,当特征映射达到某一深度时,小尺度的目标可能已经丢失了它的信息,这无疑使得这些方法更难以准确地检测出小目标。针对以上这些问题,本文提出了一个针对交通场景的具有32层的卷积神经网络来对大、中、小各种不同尺度的物体进行检测,具有较高的精度和检测速度,能基本满足工业上的实时性需要。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种具有检测准确度高与速度快的优点的基于交通场景的多支路目标检测方法,该网络具有三个检测分支,分别采用16×16,32×32和64×64的特征图来优化对于大、中、小型目标的检测,其准确度高,召回率高,并且具有实时检测的优点。
本发明的技术方案如下:
一种基于交通场景的多支路目标检测方法,其包括以下步骤:
S1、获取交通路口拍摄的高清照片构建相关数据集,对交通场景图像进行分类和标注,生成相应的类别标签,并划分训练集和测试集,用于后续的网络训练及测试;
S2、搭建基于深度学习的具有32层的网络模型,其中17个卷积层用于提取特征,6个最大池化层用于简化特征图,2个上采样层用于获取高维特征图,4个连接层用于获取指定层的特征图或者将不同层的特征图进行拼接,此外还有3个Yolo层作为三个检测分支。采用k-means聚类算法获取9个锚框先验,将这9个锚框平均分配到三个检测分支中,即一个分支为每一个可能的目标预测3个边界框,每个边界框除了要预测4个坐标和1个置信度之外,还需要预测7个类别分。作为一个基于回归方法的网络,该网络将检测任务转化为回归任务,在一个网络上同时完成目标的分类与边界框的回归,即将目标检测算法的候选框生成、特征提取、分类及位置精修这4个步骤统一到一个深度网络框架之内,利用NVIDIA GTX1060GPU进行并行运算。在该网络中使用Leaky Relu函数作为激活函数,采用反向传播和随机梯度下降方法对网络模型进行端到端训练,通过迭代训练使损失函数降到一个小的范围然后停止训练;
S3、利用步骤S1中划分好的测试集对步骤S2中训练好的网络模型进行测试,并根据测试结果对网络参数进一步进行调整。
进一步的,所述S2目标的边界框回归过程通过以下公式计算,
首先通过tx=Gx-Cx,ty=Gy-Cy,tw=log(Gw/Pw),th=log(Gh/Ph)这四个公式计算网络的预测值tx、ty、tw、th,其中(tx,ty)是真实框的中心到负责对目标进行预测的单元格左上角的偏移量,(tw,th)是边界框大小的缩放比例,根据此缩放比例将边界框缩放到与真实框相似的大小。如果负责预测的单元格与图像左上角的偏移为(Cx,Cy),且锚框先验的长宽分别为Pw、Ph,则待预测的边界框的坐标可以通过以下公式进行计算:bx=σ(tx)+Cx,by=σ(ty)+Cy,这四个公式计算出预测框的坐标,其中bx,by,bw,bh分别为预测框的中心坐标及其长和宽。在上述公式中,Gx、Gy、Gw、Gh分别代表真实框的中心坐标及其长和宽,Pw、Ph分别代表锚框的宽和高。经过以上计算,我们即获得了边界框的预测坐标输出。公式中的σ(·)为logistic函数,它的使用是为了将tx和ty的值压缩到[0,1]区间,此操作能确保待预测的目标的中心落在此单元格内,防止偏差过大。
进一步的,所述步骤S2的置信度通过以下公式计算,
confidence=Pr(Object)*IOU(truth|pred),
然后将置信度分别乘以7个类别分即得到了该边界框基于某一具体类别的置信度分,其计算公式如下,
式中,Pr(Object)表示预测框中有无目标的置信度,IOU(truth|pred)表示预测框与真实框的重叠率,Pr(Classi|Object)表示在有目标的条件下含有目标i的概率,Pr(Classi)表示预测框中含有目标i的概率。综上所述,confidence值包含了预测框中含有目标的置信度(含有目标则为1,否则为0)以及这个边界框预测的有多准两重信息;confidence score代表了预测的边界框中包含某一特定类别的概率。
进一步的,所述步骤S2网络训练的损失函数通过以下公式计算,
式中,ci表示真实的类别,表示预测的类别,(xi,yi,wi,hi)表示真实框的中心坐标及其长宽,表示预测框的中心坐标及其长宽。S表示将原图划分为S×S的网格,在此网络中分别为16,32和64;B表示每个单元格需要预测B个边界框,此处为3;λnoobj,λobj,λclass,λcoord,表示相应的权重参数,其中λnoobj、λobj分别表示不含目标及含有目标的边界框的预测所占的权重,λclass表示含有目标的边界框的各个类别的置信度预测权重,λcoord为坐标预测权重,和分别表示第i个网格中的第j个单元格是否负责目标的预测。
本发明的优点及有益效果如下:
本发明提出了一种具有32层的基于交通场景的多分支目标检测网络。该网络包括以下创新点:
1、现有的基于CNN的算法普遍存在小目标难以检测的问题,因为当特征图达到一定深度时,小目标可能失去其响应信息,而交通图像和视频中包含的目标(如汽车、公共汽车和行人)的尺度变化很大,因此本文提出了一个32层的多支路目标检测网络,其中三个检测分支分别使用16×16、32×32和64×64的特征图来优化对于大、中、小型目标的检测,具有准确度高,召回率高的特点。
2、本网络为一个32层的轻量级网络,其参数量较少,运行效率高,能满足工业应用的实时检测需求。
附图说明
图1是本发明提供优选实施例所构建网络的整体结构图;
图2为本发明所构建网络的具体参数;
图3为网络训练过程图;
图4为区域平均IOU随训练次数的变化图;
图5为损失函数曲线随训练次数的变化图;
图6为部分实验结果图示例。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
本发明的网络结构如附图1所示,附图2给出了该网络各层的具体参数。
具体步骤:
步骤S1:获取交通路口拍摄的高清照片构建相关数据集,对交通场景图像进行分类和标注,生成相应的类别标签,并划分训练集和测试集,用于后续的网络训练及测试;
步骤S2:边界框回归过程通过以下公式计算:
首先通过
tx=Gx-Cx, (1)
ty=Gy-Cy, (2)
tw=log(Gw/Pw), (3)
th=log(Gh/Ph), (4)
这四个公式计算网络的预测值tx,ty,tw,th,其中(tx,ty)是真实框的中心到负责对目标进行预测的单元格左上角的偏移量,(tw,th)是边界框大小的缩放比例,根据此缩放比例将边界框缩放到与真实框相似的大小。如果负责预测的单元格与图像左上角的偏移为(Cx,Cy),且锚框先验的长宽分别为Pw、Ph,则待预测的边界框的坐标可以通过以下公式进行计算:
bx=σ(tx)+Cx, (5)
by=σ(ty)+Cy, (6)
这四个公式计算出预测框的坐标,其中bx,by,bw,bh分别为预测框的中心坐标及其长和宽。在上述公式中,Gx、Gy、Gw、Gh分别代表真实框的中心坐标及其长和宽,Pw、Ph分别代表锚框的宽和高。经过以上计算,我们即获得了边界框的预测坐标输出。公式中的σ(·)为logistic函数,它的使用是为了将tx和ty的值压缩到[0,1]区间,此操作能确保待预测的目标的中心落在此单元格内,防止偏差过大。
置信度通过以下公式计算,
confidence=Pr(Object)*IOU(truth|pred), (9)
然后将置信度分别乘以7个类别分即得到了该边界框基于某一具体类别的置信度分,其计算公式如下,
式中,Pr(Object)表示预测框中有无目标的置信度,IOU(truth|pred)表示预测框与真实框的重叠率,Pr(Classi|Object)表示在有目标的条件下含有目标i的概率,Pr(Classi)表示预测框中含有目标i的概率。综上所述,confidence值包含了预测框中含有目标的置信度(含有目标则为1,否则为0)以及这个边界框预测的有多准两重信息;confidence score代表了预测的边界框中包含某一特定类别的概率。
网络训练时的损失函数通过以下公式计算,
式中,ci表示真实的类别,表示预测的类别,(xi,yi,wi,hi)表示真实框的中心坐标及其长宽,表示预测框的中心坐标及其长宽。S表示将原图划分为S×S的网格,在此网络中分别为16,32和64;B表示每个单元格需要预测B个边界框,此处为3;λnoobj,λobj,λclass,λcoord,表示相应的权重参数,其中λnoobj、λobj分别表示不含目标及含有目标的边界框的预测所占的权重,λclass表示含有目标的边界框的各个类别的置信度预测权重,λcoord为坐标预测权重,和分别表示第i个网格中的第j个单元格是否负责目标的预测。网络训练的流程图如附图3所示。附图4和附图5分别为区域平均IOU随训练次数的变化图以及损失函数曲线随训练次数的变化图。
步骤S3:利用步骤S1中划分好的测试集对步骤S2中训练好的网络模型进行测试,并根据测试结果对网络参数进一步进行调整。
为了评估本算法的性能,本发明采用从交通路口拍摄的高清照片构建相关数据集,并且根据实际的识别需要,选择了准确率、召回率和重叠率这几个评价指标来对模型性能进行定性定量评价:
其中TP表示预测为正,实际为正;FP表示预测为正,实际为负;FN表示预测为负,实际为正。准确率表示所有预测为正的样本中实际为正的样本所占的比例;召回率即为查全率,表示检测出的样本与实际存在的所有样本数的比率;重叠率则为检测框与真实框相交的面积与相并的面积的比率,衡量的是检测框的准确度有多高。部分实验结果图如附图6所示。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
Claims (5)
1.一种基于交通场景的多支路目标检测方法,其特征在于,包括以下步骤:
S1、获取交通路口拍摄的高清照片构建相关数据集,对交通场景图像进行分类和标注,生成相应的类别标签,并划分训练集和测试集,用于后续的网络训练及测试;
S2、搭建基于深度学习的具有32层的网络模型,其中17个卷积层用于提取特征,6个最大池化层用于简化特征图,2个上采样层用于获取高维特征图,4个连接层用于获取指定层的特征图或者将不同层的特征图进行拼接,此外还有3个Yolo层作为三个检测分支,采用k-means聚类算法获取9个锚框先验,将这9个锚框平均分配到三个检测分支中,即一个分支为每一个可能的目标预测3个边界框,每个边界框除了要预测4个坐标和1个置信度之外,还需要预测7个类别分,作为一个基于回归方法的网络,该网络将检测任务转化为回归任务,在一个网络上同时完成目标的分类与边界框的回归,即将目标检测算法的候选框生成、特征提取、分类及位置精修这4个步骤统一到一个深度网络框架之内,利用NVIDIA GTX 1060GPU进行并行运算。在该网络中使用Leaky Relu函数作为激活函数,采用反向传播和随机梯度下降方法对网络模型进行端到端训练,通过迭代训练使损失函数降到一个小的范围然后停止训练;
S3、利用步骤S1中划分好的测试集对步骤S2中训练好的网络模型进行测试,并根据测试结果对网络参数进一步进行调整。
2.根据权利要求1所述的一种基于交通场景的多支路目标检测方法,其特征在于,所述步骤S2目标的边界框回归过程通过以下公式计算:
首先通过tx=Gx-Cx,ty=Gy-Cy,tw=log(Gw/Pw),th=log(Gh/Ph)这四个公式计算网络的预测值tx、ty、tw、th,其中(tx,ty)是真实框的中心到负责对目标进行预测的单元格左上角的偏移量,(tw,th)是边界框大小的缩放比例,根据此缩放比例将边界框缩放到与真实框相似的大小,如果负责预测的单元格与图像左上角的偏移为(Cx,Cy),且锚框先验的长宽分别为Pw、Ph,则待预测的边界框的坐标可以通过以下公式进行计算:bx=σ(tx)+Cx,by=σ(ty)+Cy,这四个公式计算出预测框的坐标,其中bx,by,bw,bh分别为预测框的中心坐标及其长和宽,在上述公式中,Gx、Gy、Gw、Gh分别代表真实框的中心坐标及其长和宽,Pw、Ph分别代表锚框的宽和高,经过以上计算,我们即获得了边界框的预测坐标输出,公式中的σ(·)为logistic函数,它的使用是为了将tx和ty的值压缩到[0,1]区间,此操作能确保待预测的目标的中心落在此单元格内,防止偏差过大。
3.根据权利要求2所述的一种基于交通场景的多支路目标检测方法,其特征在于,所述步骤S2的置信度通过以下公式计算,
confidence=Pr(Object)*IOU(truth|pred),
然后将置信度分别乘以7个类别分即得到了该边界框基于某一具体类别的置信度分,其计算公式如下,
式中,Pr(Object)表示预测框中有无目标的置信度,IOU(truth|pred)表示预测框与真实框的重叠率,Pr(Classi|Object)表示在有目标的条件下含有目标i的概率,Pr(Classi)表示预测框中含有目标i的概率。综上所述,confidence值包含了预测框中含有目标的置信度(含有目标则为1,否则为0)以及这个边界框预测的有多准两重信息;confidence score代表了预测的边界框中包含某一特定类别的概率。
4.根据权利要求1所述的一种基于交通场景的多支路目标检测方法,其特征在于,所述步骤S2网络训练的损失函数通过以下公式计算,
式中,ci表示真实的类别,表示预测的类别,(xi,yi,wi,hi)表示真实框的中心坐标及其长宽,表示预测框的中心坐标及其长宽。S表示将原图划分为S×S的网格,在此网络中分别为16,32和64;B表示每个单元格需要预测B个边界框,此处为3;λnoobj,λobj,λclass,λcoord,表示相应的权重参数,其中λnoobj、λobj分别表示不含目标及含有目标的边界框的预测所占的权重,λclass表示含有目标的边界框的各个类别的置信度预测权重,λcoord为坐标预测权重,和分别表示第i个网格中的第j个单元格是否负责目标的预测。
5.根据权利要求1所述的一种基于交通场景的多支路目标检测方法,其特征在于,所述步骤S2的32层网络的具体网络层如下,
该网络由32层组成,包括17个用于特征提取的卷积层、6个用于简化特征图的最大池化层、2个获取高维特征图的上采样层(将一个层上采样2×然后将其连接到其他层)和3个Yolo层用于接收输出特征图并作为网络中的三个检测分支。此外,还有4个连接层用于获取某一特定层的特征图或者将不同层的特征图进行融合。我们在每个卷积层后加入了批量归一化层(Batch normalization),对数据输出进行归一化,大大提高了训练速度,避免了梯度消失的发生。在该网络中,我们使用Leaky Relu函数作为激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910187966.3A CN110059554B (zh) | 2019-03-13 | 2019-03-13 | 一种基于交通场景的多支路目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910187966.3A CN110059554B (zh) | 2019-03-13 | 2019-03-13 | 一种基于交通场景的多支路目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110059554A true CN110059554A (zh) | 2019-07-26 |
CN110059554B CN110059554B (zh) | 2022-07-01 |
Family
ID=67316862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910187966.3A Active CN110059554B (zh) | 2019-03-13 | 2019-03-13 | 一种基于交通场景的多支路目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110059554B (zh) |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728200A (zh) * | 2019-09-23 | 2020-01-24 | 武汉大学 | 一种基于深度学习的实时行人检测方法及系统 |
CN110796168A (zh) * | 2019-09-26 | 2020-02-14 | 江苏大学 | 一种基于改进YOLOv3的车辆检测方法 |
CN110852243A (zh) * | 2019-11-06 | 2020-02-28 | 中国人民解放军战略支援部队信息工程大学 | 一种基于改进YOLOv3的道路交叉口检测方法及装置 |
CN110929670A (zh) * | 2019-12-02 | 2020-03-27 | 合肥城市云数据中心股份有限公司 | 基于yolo3技术的渣土车洁净度视频识别分析方法 |
CN110929646A (zh) * | 2019-11-22 | 2020-03-27 | 国网福建省电力有限公司 | 一种基于无人机航拍图像的配电杆塔倒断信息快速识别方法 |
CN110992307A (zh) * | 2019-11-04 | 2020-04-10 | 华北电力大学(保定) | 基于yolo的绝缘子定位识别方法及装置 |
CN111008994A (zh) * | 2019-11-14 | 2020-04-14 | 山东万腾电子科技有限公司 | 基于MPSoC的运动目标实时检测跟踪系统及方法 |
CN111046767A (zh) * | 2019-12-04 | 2020-04-21 | 武汉大学 | 一种基于单目图像的3d目标检测方法 |
CN111046787A (zh) * | 2019-12-10 | 2020-04-21 | 华侨大学 | 一种基于改进YOLO v3模型的行人检测方法 |
CN111079638A (zh) * | 2019-12-13 | 2020-04-28 | 河北爱尔工业互联网科技有限公司 | 基于卷积神经网络的目标检测模型训练方法、设备和介质 |
CN111178451A (zh) * | 2020-01-02 | 2020-05-19 | 中国民航大学 | 一种基于YOLOv3网络的车牌检测方法 |
CN111191648A (zh) * | 2019-12-30 | 2020-05-22 | 飞天诚信科技股份有限公司 | 一种基于深度学习网络进行图像识别的方法及装置 |
CN111428625A (zh) * | 2020-03-23 | 2020-07-17 | 武汉理工大学 | 一种基于深度学习的交通场景目标检测方法及系统 |
CN111460924A (zh) * | 2020-03-16 | 2020-07-28 | 上海师范大学 | 一种基于目标检测的闸机通过逃票行为检测方法 |
CN111524095A (zh) * | 2020-03-24 | 2020-08-11 | 西安交通大学 | 一种用于旋转物体的目标检测方法 |
CN111553236A (zh) * | 2020-04-23 | 2020-08-18 | 福建农林大学 | 基于道路前景图像的路面病害目标检测与实例分割方法 |
CN111599444A (zh) * | 2020-05-18 | 2020-08-28 | 深圳市悦动天下科技有限公司 | 智能舌诊检测方法、装置、智能终端和存储介质 |
CN111612002A (zh) * | 2020-06-04 | 2020-09-01 | 广州市锲致智能技术有限公司 | 一种基于神经网络的多目标物体运动追踪方法 |
CN111695638A (zh) * | 2020-06-16 | 2020-09-22 | 兰州理工大学 | 一种改进的YOLOv3候选框加权融合选取策略 |
CN111832548A (zh) * | 2020-06-29 | 2020-10-27 | 西南交通大学 | 一种列车定位方法 |
CN112052826A (zh) * | 2020-09-18 | 2020-12-08 | 广州瀚信通信科技股份有限公司 | 基于YOLOv4算法的智慧执法多尺度目标检测方法、装置、系统及存储介质 |
CN112084992A (zh) * | 2020-09-18 | 2020-12-15 | 北京中电兴发科技有限公司 | 一种人脸关键点检测模块中人脸框选取方法 |
CN112132130A (zh) * | 2020-09-22 | 2020-12-25 | 福州大学 | 一种面向全场景的实时性车牌检测方法及系统 |
CN112163492A (zh) * | 2020-09-21 | 2021-01-01 | 华南理工大学 | 一种长时跨场景优化的交通物体检测方法、系统及介质 |
CN112200764A (zh) * | 2020-09-02 | 2021-01-08 | 重庆邮电大学 | 一种基于热红外图像的光伏电站热斑检测与定位方法 |
CN112560852A (zh) * | 2020-12-15 | 2021-03-26 | 三峡大学 | 基于YOLOv3网络具有旋转适应能力的单阶段目标检测方法 |
WO2021088504A1 (zh) * | 2019-11-07 | 2021-05-14 | 北京市商汤科技开发有限公司 | 路口检测、神经网络训练及智能行驶方法、装置和设备 |
CN112861979A (zh) * | 2021-02-20 | 2021-05-28 | 数贸科技(北京)有限公司 | 商标识别方法、装置、计算设备及计算机存储介质 |
CN113538389A (zh) * | 2021-07-23 | 2021-10-22 | 仲恺农业工程学院 | 一种鸽蛋品质识别方法 |
CN113591575A (zh) * | 2021-06-29 | 2021-11-02 | 北京航天自动控制研究所 | 一种基于改进YOLO v3网络的目标检测方法 |
CN113628245A (zh) * | 2021-07-12 | 2021-11-09 | 中国科学院自动化研究所 | 多目标跟踪方法、装置、电子设备和存储介质 |
CN114495060A (zh) * | 2022-01-25 | 2022-05-13 | 青岛海信网络科技股份有限公司 | 一种道路交通标线识别方法及装置 |
CN115205568A (zh) * | 2022-07-13 | 2022-10-18 | 昆明理工大学 | 一种多尺度特征融合的道路交通多要素检测方法 |
CN117315596A (zh) * | 2023-09-07 | 2023-12-29 | 重庆云网科技股份有限公司 | 一种基于深度学习的机动车黑烟检测及识别方法 |
CN112560852B (zh) * | 2020-12-15 | 2024-07-16 | 北京乐愚科技有限公司 | 基于YOLOv3网络具有旋转适应能力的单阶段目标检测方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295678A (zh) * | 2016-07-27 | 2017-01-04 | 北京旷视科技有限公司 | 神经网络训练与构建方法和装置以及目标检测方法和装置 |
US20170124409A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Cascaded neural network with scale dependent pooling for object detection |
US20170147905A1 (en) * | 2015-11-25 | 2017-05-25 | Baidu Usa Llc | Systems and methods for end-to-end object detection |
CN107862287A (zh) * | 2017-11-08 | 2018-03-30 | 吉林大学 | 一种前方小区域物体识别及车辆预警方法 |
CN108416327A (zh) * | 2018-03-28 | 2018-08-17 | 京东方科技集团股份有限公司 | 一种目标检测方法、装置、计算机设备及可读存储介质 |
US20180307897A1 (en) * | 2016-05-28 | 2018-10-25 | Samsung Electronics Co., Ltd. | System and method for a unified architecture multi-task deep learning machine for object recognition |
CN109118523A (zh) * | 2018-09-20 | 2019-01-01 | 电子科技大学 | 一种基于yolo的图像目标跟踪方法 |
WO2019028725A1 (en) * | 2017-08-10 | 2019-02-14 | Intel Corporation | CONVOLUTIVE NEURAL NETWORK STRUCTURE USING INVERTED CONNECTIONS AND OBJECTIVITY ANTERIORITIES TO DETECT AN OBJECT |
-
2019
- 2019-03-13 CN CN201910187966.3A patent/CN110059554B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124409A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Cascaded neural network with scale dependent pooling for object detection |
US20170147905A1 (en) * | 2015-11-25 | 2017-05-25 | Baidu Usa Llc | Systems and methods for end-to-end object detection |
US20180307897A1 (en) * | 2016-05-28 | 2018-10-25 | Samsung Electronics Co., Ltd. | System and method for a unified architecture multi-task deep learning machine for object recognition |
CN106295678A (zh) * | 2016-07-27 | 2017-01-04 | 北京旷视科技有限公司 | 神经网络训练与构建方法和装置以及目标检测方法和装置 |
WO2019028725A1 (en) * | 2017-08-10 | 2019-02-14 | Intel Corporation | CONVOLUTIVE NEURAL NETWORK STRUCTURE USING INVERTED CONNECTIONS AND OBJECTIVITY ANTERIORITIES TO DETECT AN OBJECT |
CN107862287A (zh) * | 2017-11-08 | 2018-03-30 | 吉林大学 | 一种前方小区域物体识别及车辆预警方法 |
CN108416327A (zh) * | 2018-03-28 | 2018-08-17 | 京东方科技集团股份有限公司 | 一种目标检测方法、装置、计算机设备及可读存储介质 |
CN109118523A (zh) * | 2018-09-20 | 2019-01-01 | 电子科技大学 | 一种基于yolo的图像目标跟踪方法 |
Non-Patent Citations (5)
Title |
---|
CHEN WANG: "Multiscale Visual Attention Networks for Object Detection in VHR Remote Sensing Images", 《IEEE GEOSCIENCE AND REMOTE SENSING LETTERS》 * |
吴玉枝等: "基于卷积神经网络的小样本车辆检测与识别", 《计算机技术与发展》 * |
吴金亮等: "基于Mask R-CNN的舰船目标检测研究", 《无线电工程》 * |
林等: "端对端的基于移动嵌入式端的车辆动态实时细粒度分类方法", 《现代计算机(专业版)》 * |
肖永杰: "基于卷积神经网络的多尺度车辆检测及其域自适应研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728200B (zh) * | 2019-09-23 | 2023-06-06 | 武汉大学 | 一种基于深度学习的实时行人检测方法及系统 |
CN110728200A (zh) * | 2019-09-23 | 2020-01-24 | 武汉大学 | 一种基于深度学习的实时行人检测方法及系统 |
CN110796168B (zh) * | 2019-09-26 | 2023-06-13 | 江苏大学 | 一种基于改进YOLOv3的车辆检测方法 |
CN110796168A (zh) * | 2019-09-26 | 2020-02-14 | 江苏大学 | 一种基于改进YOLOv3的车辆检测方法 |
CN110992307A (zh) * | 2019-11-04 | 2020-04-10 | 华北电力大学(保定) | 基于yolo的绝缘子定位识别方法及装置 |
CN110852243A (zh) * | 2019-11-06 | 2020-02-28 | 中国人民解放军战略支援部队信息工程大学 | 一种基于改进YOLOv3的道路交叉口检测方法及装置 |
WO2021088504A1 (zh) * | 2019-11-07 | 2021-05-14 | 北京市商汤科技开发有限公司 | 路口检测、神经网络训练及智能行驶方法、装置和设备 |
CN111008994A (zh) * | 2019-11-14 | 2020-04-14 | 山东万腾电子科技有限公司 | 基于MPSoC的运动目标实时检测跟踪系统及方法 |
CN110929646A (zh) * | 2019-11-22 | 2020-03-27 | 国网福建省电力有限公司 | 一种基于无人机航拍图像的配电杆塔倒断信息快速识别方法 |
CN110929670A (zh) * | 2019-12-02 | 2020-03-27 | 合肥城市云数据中心股份有限公司 | 基于yolo3技术的渣土车洁净度视频识别分析方法 |
CN111046767A (zh) * | 2019-12-04 | 2020-04-21 | 武汉大学 | 一种基于单目图像的3d目标检测方法 |
CN111046767B (zh) * | 2019-12-04 | 2022-06-07 | 武汉大学 | 一种基于单目图像的3d目标检测方法 |
CN111046787A (zh) * | 2019-12-10 | 2020-04-21 | 华侨大学 | 一种基于改进YOLO v3模型的行人检测方法 |
CN111079638A (zh) * | 2019-12-13 | 2020-04-28 | 河北爱尔工业互联网科技有限公司 | 基于卷积神经网络的目标检测模型训练方法、设备和介质 |
CN111191648A (zh) * | 2019-12-30 | 2020-05-22 | 飞天诚信科技股份有限公司 | 一种基于深度学习网络进行图像识别的方法及装置 |
CN111178451A (zh) * | 2020-01-02 | 2020-05-19 | 中国民航大学 | 一种基于YOLOv3网络的车牌检测方法 |
CN111460924B (zh) * | 2020-03-16 | 2023-04-07 | 上海师范大学 | 一种基于目标检测的闸机通过逃票行为检测方法 |
CN111460924A (zh) * | 2020-03-16 | 2020-07-28 | 上海师范大学 | 一种基于目标检测的闸机通过逃票行为检测方法 |
CN111428625A (zh) * | 2020-03-23 | 2020-07-17 | 武汉理工大学 | 一种基于深度学习的交通场景目标检测方法及系统 |
CN111524095A (zh) * | 2020-03-24 | 2020-08-11 | 西安交通大学 | 一种用于旋转物体的目标检测方法 |
CN111553236A (zh) * | 2020-04-23 | 2020-08-18 | 福建农林大学 | 基于道路前景图像的路面病害目标检测与实例分割方法 |
CN111553236B (zh) * | 2020-04-23 | 2022-06-07 | 福建农林大学 | 基于道路前景图像的路面病害目标检测与实例分割方法 |
CN111599444A (zh) * | 2020-05-18 | 2020-08-28 | 深圳市悦动天下科技有限公司 | 智能舌诊检测方法、装置、智能终端和存储介质 |
CN111612002A (zh) * | 2020-06-04 | 2020-09-01 | 广州市锲致智能技术有限公司 | 一种基于神经网络的多目标物体运动追踪方法 |
CN111695638A (zh) * | 2020-06-16 | 2020-09-22 | 兰州理工大学 | 一种改进的YOLOv3候选框加权融合选取策略 |
CN111832548A (zh) * | 2020-06-29 | 2020-10-27 | 西南交通大学 | 一种列车定位方法 |
CN111832548B (zh) * | 2020-06-29 | 2022-11-15 | 西南交通大学 | 一种列车定位方法 |
CN112200764A (zh) * | 2020-09-02 | 2021-01-08 | 重庆邮电大学 | 一种基于热红外图像的光伏电站热斑检测与定位方法 |
CN112200764B (zh) * | 2020-09-02 | 2022-05-03 | 重庆邮电大学 | 一种基于热红外图像的光伏电站热斑检测与定位方法 |
CN112084992A (zh) * | 2020-09-18 | 2020-12-15 | 北京中电兴发科技有限公司 | 一种人脸关键点检测模块中人脸框选取方法 |
CN112052826A (zh) * | 2020-09-18 | 2020-12-08 | 广州瀚信通信科技股份有限公司 | 基于YOLOv4算法的智慧执法多尺度目标检测方法、装置、系统及存储介质 |
CN112084992B (zh) * | 2020-09-18 | 2021-04-13 | 北京中电兴发科技有限公司 | 一种人脸关键点检测模块中人脸框选取方法 |
CN112163492A (zh) * | 2020-09-21 | 2021-01-01 | 华南理工大学 | 一种长时跨场景优化的交通物体检测方法、系统及介质 |
CN112163492B (zh) * | 2020-09-21 | 2023-09-08 | 华南理工大学 | 一种长时跨场景优化的交通物体检测方法、系统及介质 |
CN112132130A (zh) * | 2020-09-22 | 2020-12-25 | 福州大学 | 一种面向全场景的实时性车牌检测方法及系统 |
CN112132130B (zh) * | 2020-09-22 | 2022-10-04 | 福州大学 | 一种面向全场景的实时性车牌检测方法及系统 |
CN112560852A (zh) * | 2020-12-15 | 2021-03-26 | 三峡大学 | 基于YOLOv3网络具有旋转适应能力的单阶段目标检测方法 |
CN112560852B (zh) * | 2020-12-15 | 2024-07-16 | 北京乐愚科技有限公司 | 基于YOLOv3网络具有旋转适应能力的单阶段目标检测方法 |
CN112861979A (zh) * | 2021-02-20 | 2021-05-28 | 数贸科技(北京)有限公司 | 商标识别方法、装置、计算设备及计算机存储介质 |
CN112861979B (zh) * | 2021-02-20 | 2024-01-30 | 数贸科技(北京)有限公司 | 商标识别方法、装置、计算设备及计算机存储介质 |
CN113591575A (zh) * | 2021-06-29 | 2021-11-02 | 北京航天自动控制研究所 | 一种基于改进YOLO v3网络的目标检测方法 |
CN113628245A (zh) * | 2021-07-12 | 2021-11-09 | 中国科学院自动化研究所 | 多目标跟踪方法、装置、电子设备和存储介质 |
CN113628245B (zh) * | 2021-07-12 | 2023-10-31 | 中国科学院自动化研究所 | 多目标跟踪方法、装置、电子设备和存储介质 |
CN113538389A (zh) * | 2021-07-23 | 2021-10-22 | 仲恺农业工程学院 | 一种鸽蛋品质识别方法 |
CN113538389B (zh) * | 2021-07-23 | 2023-05-09 | 仲恺农业工程学院 | 一种鸽蛋品质识别方法 |
CN114495060A (zh) * | 2022-01-25 | 2022-05-13 | 青岛海信网络科技股份有限公司 | 一种道路交通标线识别方法及装置 |
CN114495060B (zh) * | 2022-01-25 | 2024-03-26 | 青岛海信网络科技股份有限公司 | 一种道路交通标线识别方法及装置 |
CN115205568A (zh) * | 2022-07-13 | 2022-10-18 | 昆明理工大学 | 一种多尺度特征融合的道路交通多要素检测方法 |
CN115205568B (zh) * | 2022-07-13 | 2024-04-19 | 昆明理工大学 | 一种多尺度特征融合的道路交通多要素检测方法 |
CN117315596A (zh) * | 2023-09-07 | 2023-12-29 | 重庆云网科技股份有限公司 | 一种基于深度学习的机动车黑烟检测及识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110059554B (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059554A (zh) | 一种基于交通场景的多支路目标检测方法 | |
CN109829399B (zh) | 一种基于深度学习的车载道路场景点云自动分类方法 | |
CN109614985A (zh) | 一种基于密集连接特征金字塔网络的目标检测方法 | |
CN110490100A (zh) | 基于深度学习的岩土自动识别定名方法及系统 | |
CN109932730A (zh) | 基于多尺度单极三维检测网络的激光雷达目标检测方法 | |
Zhang et al. | A GANs-based deep learning framework for automatic subsurface object recognition from ground penetrating radar data | |
CN110472597A (zh) | 基于深度学习的岩石图像风化程度检测方法及系统 | |
CN108921198A (zh) | 基于深度学习的商品图像分类方法、服务器及系统 | |
CN115049944B (zh) | 一种基于多任务优化的小样本遥感图像目标检测方法 | |
KR20200091331A (ko) | 다중 카메라 혹은 서라운드 뷰 모니터링에 이용되기 위해, 타겟 객체 통합 네트워크 및 타겟 영역 예측 네트워크를 이용하여 핵심성과지표와 같은 사용자 요구 사항에 적응 가능한 cnn 기반 객체 검출기를 학습하는 방법 및 학습 장치, 그리고 이를 이용한 테스팅 방법 및 테스팅 장치 | |
CN112541532B (zh) | 基于密集连接结构的目标检测方法 | |
CN110706211A (zh) | 基于卷积神经网络的铁路路基病害雷达图实时检测方法 | |
KR20200091324A (ko) | 원거리 검출 또는 군사 목적을 위해, 이미지 컨캐터네이션을 이용한, cnn 기반의 하드웨어 최적화가 가능한 객체 검출기를 학습하는 방법 및 학습 장치, 이를 이용한 테스팅 방법 및 테스팅 장치 | |
Nurkarim et al. | Building footprint extraction and counting on very high-resolution satellite imagery using object detection deep learning framework | |
CN111985325A (zh) | 特高压环境评价中的航拍小目标快速识别方法 | |
Xiu et al. | 3D semantic segmentation for high-resolution aerial survey derived point clouds using deep learning | |
CN113609895A (zh) | 基于改进Yolov3的获取道路交通信息方法 | |
CN116580322A (zh) | 一种地面背景下无人机红外小目标检测方法 | |
Xiong et al. | Automatic detection and location of pavement internal distresses from ground penetrating radar images based on deep learning | |
Wang et al. | Based on the improved YOLOV3 small target detection algorithm | |
Yanchen | Sonar image target detection and recognition based on convolution neural network | |
Men et al. | Airport runway semantic segmentation based on DCNN in high spatial resolution remote sensing images | |
CN116413740B (zh) | 一种激光雷达点云地面检测方法及装置 | |
CN117671480A (zh) | 基于视觉大模型的滑坡自动识别方法、系统和计算机设备 | |
CN109615007A (zh) | 基于粒子滤波的深度学习网络目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |