CN113869292A - 用于自动驾驶的目标检测方法、装置及设备 - Google Patents

用于自动驾驶的目标检测方法、装置及设备 Download PDF

Info

Publication number
CN113869292A
CN113869292A CN202111458746.3A CN202111458746A CN113869292A CN 113869292 A CN113869292 A CN 113869292A CN 202111458746 A CN202111458746 A CN 202111458746A CN 113869292 A CN113869292 A CN 113869292A
Authority
CN
China
Prior art keywords
detection
image
target object
classification
small target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111458746.3A
Other languages
English (en)
Other versions
CN113869292B (zh
Inventor
张雪
罗壮
张海强
李成军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhidao Network Technology Beijing Co Ltd
Original Assignee
Zhidao Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhidao Network Technology Beijing Co Ltd filed Critical Zhidao Network Technology Beijing Co Ltd
Priority to CN202111458746.3A priority Critical patent/CN113869292B/zh
Publication of CN113869292A publication Critical patent/CN113869292A/zh
Application granted granted Critical
Publication of CN113869292B publication Critical patent/CN113869292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种用于自动驾驶的目标检测方法、装置及设备。该方法包括:获取待检测图像;将所述待检测图像输入至预设目标检测模型中,得到所述预设目标检测模型输出的检测结果;利用预设目标分类模型,对所述检测结果中的小目标物体所在的图像区域进行分类,得到所述小目标物体的分类结果;利用所述分类结果,对所述检测结果中所述小目标物体的类别信息进行校正,得到经所述分类结果校正后的所述检测结果。本申请提供的方案,能够提升对图像中小目标物体的识别正确率。

Description

用于自动驾驶的目标检测方法、装置及设备
技术领域
本申请涉及导航技术领域,尤其涉及一种用于自动驾驶的目标检测方法、装置及设备。
背景技术
中国专利CN112288031A,公开了一种交通信号灯检测方法、装置、电子设备和存储介质,通过交通信号灯检测模型对获取到的待检测图像进行卷积处理,从而获取所述待检测图像中包括的交通信号灯的候选区域;再通过交通信号灯分类模型对候选区域进行分类运算,最终获得所述待检测图像中包括的交通信号灯的类别。本申请在进行交通信号灯的类别检测时,仅需要对预先检测到的候选区域进行分类运算,而不是对整个图像进行分类运算,在无需对模型尺寸进行压缩的前提下,提高交通信号灯类别检测的速度和效率,降低了检测过程中需要占用的内存,同时也保证了交通信号灯检测结果的准确度。
中国专利CN111160206A,公开了一种交通环境元素视觉感知方法及装置,其中,该装置包括:图像处理模块、多任务网络、小目标图像提取模块、小目标分类网络;图像处理模块用于获取交通环境的原始图像,将原始图像进行降分辨率处理得到交通环境图像;多任务网络用于根据交通环境图像获取目标对象在交通环境图像中的定位结果及交通环境图像中的交通环境元素的预测结果,交通环境元素不包含目标对象;小目标图像提取模块用于根据定位结果提取原始图像中与定位结果相对应的目标图像;小目标分类网络用于根据目标图像获取目标对象的分类结果。该装置不仅可以获取多种交通环境元素的预测结果,且可以通过更小的计算量,更快的得到在图像中占比较小的目标图像的分类结果。
中国专利CN113516082A,公开了一种安全帽的检测方法、装置、计算机设备及存储介质,该方法包括:获取包括至少一个检测对象的目标检测图像;将目标检测图像输入至预先训练的检测模型中,并获取检测模型输出的,在目标检测图像中检测得到的至少一个检测对象的头部所在区域;根据检测模型输出的检测结果,在目标检测图像中分别截取各检测对象的头部区域图像;将各检测对象的头部区域图像分别输入至分类模型中,并获取分类模型输出的各检测对象是否佩戴安全帽,或者是否佩戴设定颜色的安全帽的分类结果。本发明实施例的技术方案可以有效提高安全帽的检测精度,在保证安全帽检测精度的基础上,同时可以提高对每个独立模型的训练和优化速度。
中国专利CN111783590A,公开了一种基于度量学习的多类别小目标检测方法,本发明针对多类别小目标的识别特点,将深度学习的特征表达能力与度量学习的相似性判别能力相结合,设计了新型深度神经网络结构。其特点是采用结合特征金字塔网络(FeaturePyramid Network,FPN)的Faster RCNN网络结构基于整张图像数据对多类别小目标进行检测,并在该网络中嵌入图网络模块对图像内各区域间的相似度信息进行传递计算,在该网络后端采用基于三元组损失的相似性度量模块区分样本间的细节信息,充分提取小目标特征信息及其目标间的相似性关系,提高对多类别小目标检测的准确率。
目标检测是计算机视觉领域的传统任务,与图像识别不同,目标检测不仅需要识别出图像上存在的物体,给出对应的类别,还需要将该物体的位置通过最小包围框的方式给出。目标检测任务可以通过目标检测模型(例如YOLO模型、Faster R-CNN模型、SSD模型等)完成,目标检测模型可以对输入图像进行检测,从而识别出图像中目标物体的位置以及类别。在导航技术领域,目标检测技术已得到广泛运用,为汽车自动驾驶功能的实现提供了技术支持。
然而,对于待检测的图像中的小目标物体而言,小目标物体的信息较少,且相对于图像的全局信息来说占比很小,例如远距离的黄灯和红灯等结构相似的小目标物体,目标检测模型难以正确识别出这类小目标物体的类别。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种用于自动驾驶的目标检测方法、装置及设备,能够提升对图像中小目标物体的识别正确率。
本申请第一方面提供一种用于自动驾驶的目标检测方法,包括:
获取待检测图像;
将所述待检测图像输入至预设目标检测模型中,得到所述预设目标检测模型输出的检测结果;
利用预设目标分类模型,对所述检测结果中的小目标物体所在的图像区域进行分类,得到所述小目标物体的分类结果;
利用所述分类结果,对所述检测结果中所述小目标物体的类别信息进行校正,得到经所述分类结果校正后的所述检测结果。
在一种实施方式中,所述预设目标分类模型包括卷积层、池化层及全连接层,以使得所述小目标物体所在的图像区域依次经过所述卷积层、所述池化层及所述全连接层处理后,得到所述分类结果。
在一种实施方式中,所述卷积层包括用于获取不同感受野信息的至少两个卷积处理层,所述至少两个卷积处理层分别接收处理所述小目标物体所在的图像区域,以向所述池化层输出各自的处理数据。
在一种实施方式中,所述池化层包括空间金字塔池化层与全局平均池化层,所述空间金字塔池化层接收处理所述至少两个卷积处理层的输出数据,所述全局平均池化层接收处理所述空间金字塔池化层的输出数据后,向所述全连接层输出数据。
在一种实施方式中,所述至少两个卷积处理层包括二维卷积层与空洞卷积层。
在一种实施方式中,所述对所述检测结果中的小目标物体所在的图像区域进行分类,包括:
对所述检测结果中长或宽在预设长度值内的小目标物体所在的图像区域进行分类。
在一种实施方式中,所述预设长度值为32个像素值。
本申请第二方面提供一种用于自动驾驶的目标检测装置,包括:
获取模块,用于获取待检测图像;
检测模块,用于将所述获取模块获取的待检测图像输入至预设目标检测模型中,得到所述预设目标检测模型输出的检测结果;
分类模块,用于利用预设目标分类模型,对所述检测模块得到的检测结果中的小目标物体所在的图像区域进行分类,得到所述小目标物体的分类结果;
校正模块,用于利用所述分类模块得到的分类结果,对所述检测结果中所述小目标物体的类别信息进行校正,得到经所述分类结果校正后的所述检测结果。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
本申请提供的技术方案可以包括以下有益效果:
本申请提供的方法,通过预设目标检测模型输出对待检测图像的检测结果,利用预设目标分类模型对检测结果中的小目标物体所在的图像区域进行分类,得到小目标物体的分类结果,从而可以利用分类结果校正检测结果中小目标物体的类别信息,得到经分类结果校正后的检测结果。这样,小目标物体的类别可以依靠其对应的图像区域的信息进行确定,不受图像的全局信息影响,进而有效提升了对图像中小目标物体的识别正确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的用于自动驾驶的目标检测方法的流程示意图;
图2是本申请实施例示出的预设目标检测模型的网络结构示意图;
图3是本申请实施例示出的预设目标分类模型的网络结构示意图;
图4是本申请实施例示出的用于自动驾驶的目标检测装置的结构示意图;
图5是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
相关技术中,对于待检测的图像中的小目标物体而言,小目标物体的信息较少,且相对于图像的全局信息来说占比很小,例如远距离的黄灯和红灯等结构相似的小目标物体,目标检测模型难以正确识别出这类小目标物体的类别。
针对上述问题,本申请实施例提供一种用于自动驾驶的目标检测方法,能够提升对图像中小目标物体的识别正确率。
以下结合附图详细描述本申请实施例的技术方案。
图1是本申请实施例示出的用于自动驾驶的目标检测方法的流程示意图。
参见图1,该方法包括:
步骤S101、获取待检测图像。
在该步骤中,待检测图像可以是汽车行驶过程中由汽车装载的摄像设备采集的图像。
步骤S102、将待检测图像输入至预设目标检测模型中,得到预设目标检测模型输出的检测结果。
其中,预设目标检测模型可以是One-stage目标检测模型(例如YOLO、SSD、SqueezeDet、DetectNet),也可以是Two-stage目标检测模型(例如Faster R-CNN)。
在其中一个实施例中,预设目标检测模型为YOLO-V5模型,请一并参见图2,图2为YOLO-V5模型的网络结构图,在该步骤中,将待检测图像输入至YOLO-V5模型中,YOLO-V5模型的输出层(即图2中的Detection output模块)输出待检测图像的检测结果。其中,检测结果包括待检测图像中不同目标物体(目标对象)的位置信息以及类别信息,其中,位置信息包括目标物体的中心点坐标以及其最小包围框的长与宽(即目标物体的在图像中的长与宽),位置信息通常用x,y,w,h来表示,类别信息为对应目标物体的类别(例如,汽车、行人、建筑物、交通灯等类别)。
需要说明的是,YOLO-V5模型从待检测图像的全局信息中通过卷积在三个不同尺度不同层次的特征图上检测识别出目标结果,得到待检测图像的检测结果。检测结果可以在待检测图像中进行标注,以得到检测结果的可视化结果。举例来说,如图2中的(a)图所示,其为YOLO-V5模型输出的检测结果的可视化结果,其中,图2中的(b)图为图2中的(a)图的部分区域放大图,如图2中的(b)图所示,其为图2中的(a)图的交通灯所在处的放大图,图2中的(b)图中的各交通灯的包围框为检测结果中目标物体的位置信息在图像中所作的标注。
可以理解,在YOLO-V5模型的网络结构中,待检测图像对于模型输入尺寸为3倍下采样,并使用最浅层特征为输入尺寸的8倍下采样,即待检测图像为24*24像素时,在检测识别分支的信息表达为1个像素表达,当目标更小时,其对模型的检测识别更困难。因此,对于目前的目标检测模型而言,大目标物体在检测识别中信息量丰富,模型的识别结果是可靠的;而对于小目标物体,其信息量太少,周围背景信息影响大,模型对小目标物体的识别结果不可靠。
需要注意的是,目前的目标检测模型对图像中的小目标物体所进行的检测,因模型网络结构很深,且目标信息相对于全局信息来说占比很小,该小目标物体的位置信息通常可以被正确检测出来,但是其类别信息往往会识别错误。这种位置信息检测正确但类别信息检测错误的目标对象通常称为假阳,目标检测模型出现假阳现象越严重,即表示该目标检测模型的误识别率越高,进而会导致该目标检测模型的评价指数降低。
步骤S103、利用预设目标分类模型,对检测结果中的小目标物体所在的图像区域进行分类,得到小目标物体的分类结果。
在该步骤中,检测结果中被检测出来的小目标物体的数量可以是一个或多个。检测结果中的小目标物体所在的图像区域,可以是检测结果中的小目标物体的最小包围框所对应的图像区域。例如,图2中(b)图所示,包括有四个小目标物体,这四个小目标物体为交通杆上设置的四个不同的交通指示灯,这四个交通指示灯均被其最小包围框所标注。也就是说,检测结果中的小目标物体所在的图像区域,可以是如图2中(b)图所示的各交通灯被其最小包围框所包围的图像区域。
在其中一种实施方式中,利用预设目标分类模型,对检测结果中的小目标物体所在的图像区域进行分类,得到小目标物体的分类结果,包括:
利用预设目标分类模型,对检测结果中长或宽在预设长度值内的小目标物体所在的图像区域进行分类,得到小目标物体的分类结果。其中,小目标物体所在的图像区域可以是小目标物体在待检测图像中其最小包围框所对应区域的图像,小目标物体的长与宽即其最小包围框的长与宽。在其中一种实施方式中,预设长度值为32个像素值。也就是说,在该实施方式中,对检测结果中长或宽在32个像素值内的小目标物体所在的图像区域进行分类。例如,可以利用预设目标分类模型对待检测图像中的最小包围框的长或宽的长度在32个像素值内的小目标物体进行识别,预设目标分类模型接收的输入图像为待检测图像中的小目标物体的最小包围框所对应的图像区域。
请一并参见图3,图3为预设目标分类模型的网络结构图,图3所示图中的左侧方框内为:检测结果中的小目标物体所在的图像区域,即该预设目标分类模型的输入图像。可以发现,在图3所示实施例中,预设目标分类模型接收的输入图像为检测结果中的小目标物体所在的图像区域,例如可以是图2所示的(b)图中的各交通灯的最小包围框所对应区域的图像。
其中,预设目标分类模型可以是图像分类模型,预设目标分类模型用于识别输入图像中的目标物体的类别。预设目标分类模型也可以是一种预先构建的针对小目标物体的分类模块。
在其中一种实施方式中,预设目标分类模型可以包括卷积层、池化层及全连接层,以使得小目标物体所在的图像区域依次经过卷积层、池化层及全连接层处理后,得到分类结果。
进一步的,卷积层可以包括用于获取不同感受野信息的至少两个卷积处理层,至少两个卷积处理层分别接收处理小目标物体所在的图像区域,以向池化层输出各自的处理数据。检测结果中的小目标物体所在的图像区域,通过被至少两个卷积处理层进行卷积,提取目标特征。这样,可以获取不同感受野信息,得到更丰富的信息。在其中一种实施方式中,至少两个卷积处理层包括二维卷积层(即Conv2d)与空洞卷积层(即Dilated Conv)。其中,二维卷积层有高和宽两个空间维度,可用于处理图像数据。空洞卷积层可以扩大感受野,捕获多尺度上下文信息。
进一步的,池化层可以包括空间金字塔池化层(Spatial Pyramid Pooling,即SPP)与全局平均池化层(Global average Pooling,即GAP),空间金字塔池化层接收处理至少两个卷积处理层的输出数据,全局平均池化层接收处理空间金字塔池化层的输出数据后,向全连接层输出数据。
可以理解,检测结果中可以包括多个小目标物体,各小目标物体所在的图像区域的分辨率可以是不相同的,至少两个卷积处理层的输出数据的输出特征图的尺寸可以是各不相同的,而金字塔池化层能够使不同输入尺寸的特征图产生一个固定长度的输出,以实现对分辨率各不相同的各小目标物体对应的特征图的处理。全局平均池化层起到了防止过拟合的作用。
如图3所示实施例中,预设目标分类模型包括二维卷积层(即Conv2d)、空洞卷积层(即Dilated Conv)、空间金字塔池化层(即SPP)、全局平均池化层(即GAP)以及全连接层(fully connected layers,即FC)。检测结果中的小目标物体所在的图像区域分别经过二维卷积层与空洞卷积层卷积处理后,输入至空间金字塔池化层,经过空间金字塔池化层、全局平均池化层以及全连接层处理后,通过该预设目标分类模型的输出层(output)输出小目标物体的分类结果。小目标物体的分类结果即对检测结果中的小目标物体所在的图像区域进行分类后所得到的识别结果,其对小目标物体的类别重新做出了识别。
步骤S104、利用分类结果,对检测结果中小目标物体的类别信息进行校正,得到经分类结果校正后的检测结果。
在该步骤中,利用预设目标分类模型输出的分类结果,校正预设目标检测模型输出的检测结果中小目标物体的类别信息。举例来说,例如,预设目标检测模型输出的分类结果中对其中一个小目标物体的类别信息判断为“左转向灯”,预设目标分类模型得到的分类结果判断为“红灯”,则用“红灯”替换“左转向灯”,以校正检测结果中小目标物体的类别信息,从而得到经分类结果校正后的检测结果。
从该实施例可以看出,本申请实施例提供的方法,通过预设目标检测模型输出对待检测图像的检测结果,利用预设目标分类模型对检测结果中的小目标物体所在的图像区域进行分类,得到小目标物体的分类结果,从而可以利用分类结果校正检测结果中小目标物体的类别信息,得到经分类结果校正后的检测结果。这样,小目标物体的类别可以依靠其对应的图像区域的信息进行确定,不受图像的全局信息影响,进而有效提升了对图像中小目标物体的识别正确率。
可以理解,在目标检测任务中,原始图像中的小目标物体的信息往往因为太少,使其识别率很低,尤其对于相似结构的小目标,如远距离的黄灯和红灯,自行车和电动车,电动三轮车和小汽车等。原始图像中的小目标物体的位置信息通常是可以被正确检测得出的,但却因为距离远,目标很小,而且目标检测模型的网络结构很深,使得目标信息相对于全局信息来说占比很小,从而导致对于小目标物体的类别信息的识别率正确率大大降低,误识别的机率很高。本申请实施例通过利用预设目标分类模型输出的分类结果,校正预设目标检测模型输出的检测结果中小目标物体的类别信息,从而使得小目标物体在进行分类时可以依靠其对应的图像区域的信息,不受图像的全局信息影响,进而有效提升了对图像中小目标物体的识别正确率。本申请提供的目标检测方法可以应用于汽车的自动驾驶功能中,以提升汽车在行驶过程中对周边环境的小目标物体的识别正确率,从而保障汽车自动驾驶功能的安全性及可靠性。
与前述应用功能实现方法实施例相对应,本申请还提供了一种用于自动驾驶的目标检测装置、电子设备及相应的实施例。
图4是本申请实施例示出的用于自动驾驶的目标检测装置的结构示意图。
参见图4,该装置包括:获取模块401、检测模块402、分类模块403、校正模块404。
获取模块401,用于获取待检测图像。
检测模块402,用于将获取模块401获取的待检测图像输入至预设目标检测模型中,得到预设目标检测模型输出的检测结果。
分类模块403,用于利用预设目标分类模型,对检测模块402得到的检测结果中的小目标物体所在的图像区域进行分类,得到小目标物体的分类结果。
其中,预设目标分类模型可以包括卷积层、池化层及全连接层,以使得小目标物体所在的图像区域依次经过卷积层、池化层及全连接层处理后,得到分类结果。
进一步的,卷积层可以包括用于获取不同感受野信息的至少两个卷积处理层,至少两个卷积处理层分别接收处理小目标物体所在的图像区域,以向池化层输出各自的处理数据。
进一步的,池化层可以包括空间金字塔池化层与全局平均池化层,空间金字塔池化层接收处理至少两个卷积处理层的输出数据,全局平均池化层接收处理空间金字塔池化层的输出数据后,向全连接层输出数据。
校正模块404,用于利用分类模块403得到的分类结果,对检测结果中小目标物体的类别信息进行校正,得到经分类结果校正后的检测结果。
从该实施例可以看出,本申请实施例提供的用于自动驾驶的目标检测装置,通过预设目标检测模型输出对待检测图像的检测结果,利用预设目标分类模型对检测结果中的小目标物体所在的图像区域进行分类,得到小目标物体的分类结果,从而可以利用分类结果校正检测结果中小目标物体的类别信息,得到经分类结果校正后的检测结果。这样,小目标物体的分类可以依靠其对应的图像区域的信息进行确定,不受图像的全局信息影响,进而有效提升了对图像中小目标物体的识别正确率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图5是本申请实施例示出的电子设备的结构示意图。
参见图5,电子设备500包括存储器510和处理器520。
处理器520可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器510可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器520或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器510可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器510可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器510上存储有可执行代码,当可执行代码被处理器520处理时,可以使处理器520执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种用于自动驾驶的目标检测方法,其特征在于,包括:
获取待检测图像;
将所述待检测图像输入至预设目标检测模型中,得到所述预设目标检测模型输出的检测结果;
利用预设目标分类模型,对所述检测结果中的小目标物体所在的图像区域进行分类,得到所述小目标物体的分类结果;
利用所述分类结果,对所述检测结果中所述小目标物体的类别信息进行校正,得到经所述分类结果校正后的所述检测结果。
2.根据权利要求1所述的方法,其特征在于:
所述预设目标分类模型包括卷积层、池化层及全连接层,以使得所述小目标物体所在的图像区域依次经过所述卷积层、所述池化层及所述全连接层处理后,得到所述分类结果。
3.根据权利要求2所述的方法,其特征在于:
所述卷积层包括用于获取不同感受野信息的至少两个卷积处理层,所述至少两个卷积处理层分别接收处理所述小目标物体所在的图像区域,以向所述池化层输出各自的处理数据。
4.根据权利要求3所述的方法,其特征在于:
所述池化层包括空间金字塔池化层与全局平均池化层,所述空间金字塔池化层接收处理所述至少两个卷积处理层的输出数据,所述全局平均池化层接收处理所述空间金字塔池化层的输出数据后,向所述全连接层输出数据。
5.根据权利要求3或4所述的方法,其特征在于:
所述至少两个卷积处理层包括二维卷积层与空洞卷积层。
6.根据权利要求1所述的方法,其特征在于,所述对所述检测结果中的小目标物体所在的图像区域进行分类,包括:
对所述检测结果中长或宽在预设长度值内的小目标物体所在的图像区域进行分类。
7.根据权利要求6所述的方法,其特征在于:
所述预设长度值为32个像素值。
8.一种用于自动驾驶的目标检测装置,其特征在于,包括:
获取模块,用于获取待检测图像;
检测模块,用于将所述获取模块获取的待检测图像输入至预设目标检测模型中,得到所述预设目标检测模型输出的检测结果;
分类模块,用于利用预设目标分类模型,对所述检测模块得到的检测结果中的小目标物体所在的图像区域进行分类,得到所述小目标物体的分类结果;
校正模块,用于利用所述分类模块得到的分类结果,对所述检测结果中所述小目标物体的类别信息进行校正,得到经所述分类结果校正后的所述检测结果。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
CN202111458746.3A 2021-12-02 2021-12-02 用于自动驾驶的目标检测方法、装置及设备 Active CN113869292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111458746.3A CN113869292B (zh) 2021-12-02 2021-12-02 用于自动驾驶的目标检测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111458746.3A CN113869292B (zh) 2021-12-02 2021-12-02 用于自动驾驶的目标检测方法、装置及设备

Publications (2)

Publication Number Publication Date
CN113869292A true CN113869292A (zh) 2021-12-31
CN113869292B CN113869292B (zh) 2022-03-01

Family

ID=78985632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111458746.3A Active CN113869292B (zh) 2021-12-02 2021-12-02 用于自动驾驶的目标检测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN113869292B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105894045A (zh) * 2016-05-06 2016-08-24 电子科技大学 一种基于空间金字塔池化的深度网络模型的车型识别方法
CN106599773A (zh) * 2016-10-31 2017-04-26 清华大学 用于智能驾驶的深度学习图像识别方法、系统及终端设备
CN107610113A (zh) * 2017-09-13 2018-01-19 北京邮电大学 一种图像中基于深度学习的小目标的检测方法及装置
CN110110751A (zh) * 2019-03-31 2019-08-09 华南理工大学 一种基于注意力机制的金字塔网络的中草药识别方法
CN111738111A (zh) * 2020-06-10 2020-10-02 杭州电子科技大学 基于多分支级联空洞空间金字塔的高分辨遥感图像的道路提取方法
WO2020243826A1 (en) * 2019-06-04 2020-12-10 University Of Manitoba Computer-implemented method of analyzing an image to segment article of interest therein
CN112580660A (zh) * 2020-11-17 2021-03-30 上海闻泰信息技术有限公司 图像处理方法、装置、计算机设备和可读存储介质
CN112597887A (zh) * 2020-12-22 2021-04-02 深圳集智数字科技有限公司 一种目标识别方法及装置
CN113095418A (zh) * 2021-04-19 2021-07-09 航天新气象科技有限公司 一种目标检测方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105894045A (zh) * 2016-05-06 2016-08-24 电子科技大学 一种基于空间金字塔池化的深度网络模型的车型识别方法
CN106599773A (zh) * 2016-10-31 2017-04-26 清华大学 用于智能驾驶的深度学习图像识别方法、系统及终端设备
CN107610113A (zh) * 2017-09-13 2018-01-19 北京邮电大学 一种图像中基于深度学习的小目标的检测方法及装置
CN110110751A (zh) * 2019-03-31 2019-08-09 华南理工大学 一种基于注意力机制的金字塔网络的中草药识别方法
WO2020243826A1 (en) * 2019-06-04 2020-12-10 University Of Manitoba Computer-implemented method of analyzing an image to segment article of interest therein
CN111738111A (zh) * 2020-06-10 2020-10-02 杭州电子科技大学 基于多分支级联空洞空间金字塔的高分辨遥感图像的道路提取方法
CN112580660A (zh) * 2020-11-17 2021-03-30 上海闻泰信息技术有限公司 图像处理方法、装置、计算机设备和可读存储介质
CN112597887A (zh) * 2020-12-22 2021-04-02 深圳集智数字科技有限公司 一种目标识别方法及装置
CN113095418A (zh) * 2021-04-19 2021-07-09 航天新气象科技有限公司 一种目标检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XINYU CAO 等,: "Improved U-Net for Plaque Segmentation of Intracoronary Optical Coherence Tomography Images", 《ICANN 2021: ARTIFICIAL NEURAL NETWORKS AND MACHINE LEARNING–ICANN 2021》 *
刘涛 等,: "采用卷积核金字塔和空洞卷积的单阶段目标检测", 《中国图象图形学报》 *

Also Published As

Publication number Publication date
CN113869292B (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
US20190122059A1 (en) Signal light detection
CN118115557A (zh) 关联lidar数据和图像数据
KR101848019B1 (ko) 차량 영역 검출을 통한 차량 번호판 검출 방법 및 장치
JP5747549B2 (ja) 信号機検出装置及びプログラム
US11087153B2 (en) Traffic light recognition system and method
JP2007179386A (ja) 白線認識方法及び白線認識装置
Ji et al. Integrating visual selective attention model with HOG features for traffic light detection and recognition
JP2018063680A (ja) 交通信号認識方法および交通信号認識装置
CN107644538B (zh) 交通信号灯的识别方法及装置
CN112598743B (zh) 一种单目视觉图像的位姿估算方法及相关装置
CN112784675B (zh) 目标检测方法及装置、存储介质、终端
CN112307840A (zh) 指示灯检测方法、装置、设备及计算机可读存储介质
CN111539907A (zh) 用于目标检测的图像处理方法及装置
JP2009276910A (ja) 画像処理装置、方法及びプログラム
WO2020129522A1 (ja) 画像処理装置
Sung et al. Real-time traffic light recognition on mobile devices with geometry-based filtering
KR20170106823A (ko) 부분적인 깊이 맵에 기초하여 관심 객체를 식별하는 영상 처리 장치
CN112784817B (zh) 车辆所在车道检测方法、装置、设备及存储介质
JP2004086417A (ja) 横断歩道等における歩行者検出方法及び同装置
CN107506739B (zh) 一种夜间前向车辆检测及测距方法
KR20200133920A (ko) 인공신경망 기반의 투사정보 인식 장치 및 그 방법
CN118230279A (zh) 基于孪生网络的交通信号灯识别方法、设备、介质和车辆
CN113869292B (zh) 用于自动驾驶的目标检测方法、装置及设备
CN110555344B (zh) 车道线识别方法、装置、电子设备、存储介质
CN112955928A (zh) 信息处理方法以及信息处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant