CN117409380A - 识别车辆的方法和装置 - Google Patents
识别车辆的方法和装置 Download PDFInfo
- Publication number
- CN117409380A CN117409380A CN202311685078.7A CN202311685078A CN117409380A CN 117409380 A CN117409380 A CN 117409380A CN 202311685078 A CN202311685078 A CN 202311685078A CN 117409380 A CN117409380 A CN 117409380A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- image
- identification
- detection area
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000001514 detection method Methods 0.000 claims abstract description 57
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 8
- 230000000903 blocking effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 22
- 238000007635 classification algorithm Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 206010061274 Malocclusion Diseases 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000010865 sewage Substances 0.000 description 2
- 229910052709 silver Inorganic materials 0.000 description 2
- 239000004332 silver Substances 0.000 description 2
- 206010037180 Psychiatric symptoms Diseases 0.000 description 1
- 241000791900 Selene vomer Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提出一种识别车辆的方法和装置、电子设备以及非瞬时性计算机可读存储介质,所述方法包括响应于所述车辆的识别指令,对所述车辆的图像进行预处理;对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域;利用所述车辆检测区域,对所述车辆进行状态识别,得到状态识别结果。根据一些实施例,在车辆识别前,通过对图像进行预处理提高了车辆图像的分辨率和图像质量;并通过对车辆状态进行识别,以获得清晰度符合要求的车辆图像。
Description
技术领域
本发明涉及车辆识别领域,具体而言,涉及一种识别车辆的方法和装置、电子设备以及非瞬时性计算机可读存储介质。
背景技术
随着人工智能技术的发展以及监控设备的日益普及,图片数据资源正在突飞猛进地增长。图像作为信息传播的核心,蕴含着丰富的信息,并随着机器学习和深度学习技术的飞速发展,使得它的应用领域非常广泛。例如,安防、安监、化工和加油站等。
车辆属性识别是刑侦、交通执法的重要辅助手段,可以有效地快速地获取与目标车辆相似的车辆。因此,如何对车辆属性准确识别是当前亟待解决的技术问题。
发明内容
本发明旨在提出一种识别车辆属性的方法和装置、电子设备以及非瞬时性计算机可读存储介质,以解决如何获取高清晰度的车辆图片的问题。
根据本发明的一方面,提出一种识别车辆属性的方法,包括:响应于所述车辆属性的识别指令,对所述车辆的图像进行预处理;对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域;利用所述车辆检测区域,对所述车辆进行状态识别,得到状态识别结果。
根据一些实施例,利用所述车辆检测区域,对所述车辆进行状态识别包括对所述车辆进行遮挡、模糊、角度识别。
根据一些实施例,在利用所述车辆检测区域,对所述车辆进行状态识别之前,所述方法还包括:对所述车辆检测区域进行车辆跟踪得到跟踪结果,并为所述车辆配置获得唯一的车辆编码。
根据一些实施例,所述方法还包括:根据所述车辆的所述状态识别结果和所述跟踪结果,对所述车辆属性进行识别。
根据一些实施例,所述车辆属性包括所述车辆的颜色、车型、朝向和/或品牌。
根据一些实施例,响应于所述车辆的识别指令,对所述车辆的图像进行预处理,包括:根据摄像头的配置参数对所述车辆的图像进行畸变校正;对畸变校正后的图像进行图像超分处理。
根据一些实施例,所述对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域,包括:对所述图像进行分块处理,其中,得到的相邻的图像分块有部分重合;分别对所述图像的每个分块进行检测;整合所述图像的所有分块的检测结果,以得到所述图像中的车辆检测区域。
根据本发明的一方面,提出一种识别车辆属性的装置,包括:预处理单元,用于响应于所述车辆属性的识别指令,对所述车辆的图像进行预处理;车辆检测单元,用于对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域;状态识别单元,用于利用所述车辆检测区域,对所述车辆进行状态识别,得到状态识别结果。
根据本发明的一方面,提出一种电子设备,包括:处理器;以及
存储器,存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行如前任一实施例所述的方法。
根据本发明的一方面,提出一种非瞬时性计算机可读存储介质,其上存储有计算机可读指令,当所述指令被处理器执行时,使得所述处理器执行如前任一实施例所述的方法。
根据本发明的实施例,在车辆识别前,通过对图像进行预处理提高了车辆图像的分辨率和图像质量;并通过对车辆状态进行识别,以获得清晰度符合要求的车辆图像。
根据本申请的另一些实施例,通过在对车辆属性识别前,首先对车辆的状态进行识别,使得在对车辆属性识别时,可以过滤掉一些不符合识别要求的图像,在提高车辆识别准确度的同时,也减少了识别车辆属性时的计算量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。通过参照附图详细描述其示例实施例,本发明的上述和其他目标、特征及优点将变得更加显而易见。
图1示出根据本发明示例实施例的一种识别车辆的方法流程图。
图2示出了根据本发明示例实施例的另一种识别车辆的方法流程图。
图3示出了根据本发明示例实施例的另一种识别车辆的方法流程图。
图4示出了根据本发明示例实施例的一种识别车辆的装置框图。
图5示出了根据本发明示例实施例的识别的车辆品牌示意图。
图6a示出了根据本发明示例实施例的识别的车辆颜色示意图。
图6b示出了根据本发明示例实施例的另一识别的车辆颜色示意图。
图7a示出了根据本发明示例实施例的识别的车辆型号示意图。
图7b示出了根据本发明示例实施例的另一识别的车辆型号示意图。
图8a示出了根据本发明示例实施例的识别的车辆朝向示意图。
图8b示出了根据本发明示例实施例的另一识别的车辆朝向示意图。
图9a示出了根据本发明示例实施例的识别的车辆品牌示意图。
图9b示出了根据本发明示例实施例的另一识别的车辆品牌示意图。
图10示出根据本发明示例性实施例的一种电子设备。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图显示表示相同或类似的部分,因而将省略对它们的重复描述。
本发明所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有这些特定细节中的一个或更多,或者可以采用其它的方式、组元、材料、装置或操作等。在这些情况下,将不详细示出或描述公知结构、方法、装置、实现、材料或者操作。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
下面结合附图,对根据本发明的具体实施例进行详细说明。
图1示出根据本发明示例实施例的一种识别车辆的方法流程图,下面以图1为例,对根据本发明示例实施例的一种识别车辆的方法进行详细说明。
如图1所示的方法包括步骤S101、S103和S105。
在步骤S101,响应于所述车辆的识别指令,对所述车辆的图像进行预处理,得到状态识别结果。
为了提高图像的分辨率和图像的质量,需要对所述车辆的图像进行预处理。在此需要说明的是,本发明并不对图像的预处理的方式进行限定。例如,进行预处理的方式包括但不限于对所述图像进行降噪处理、畸变校正和/或图像超分。
在具体的实施例中,对所述车辆的图像进行预处理包括首先根据摄像头的配置参数对所述车辆的图像进行畸变校正;然后,对畸变校正后的图像进行图像超分处理。其中,摄像头的配置参数包括内参矩阵和/或畸变系数。
在步骤S103,对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域。
根据本发明的实施例,在步骤S103,首先按照预设的规则对预处理后的图像进行分块切分;然后,对得到的图像分块分别进行检测;最后,整合所有分块的检测结果,以得到所述图像中的车辆检测区域。
在一些实施例中,为了确保目标检测的完整性,在对图像进行切分时,相邻图像块之间有部分重合。
在具体的实施例中,按照预设的重叠面积比例对图像进行切分。其中,重叠面积比例为重叠像素面积与相邻图像块像素总面积的比值。在一些实施例中,重叠面积比例为1/4。
由于相邻图像块的重叠区域可能有相同的车辆,这样就相当于对同一辆车进行了重复检测,所以,在将每块中的车辆检测区域还原到原图区域的时候,可能会出现多个重叠比较大的框。
根据本发明的实施例,在步骤S103,在整合所有分块的检测结果时,还需要过滤掉重复框。
再具体的实施例中,采用非极大抑制算法过滤在整合分块图片时出现的重复框。
在步骤S105,利用所述车辆检测区域,对所述车辆进行状态识别。
在具体的实施例中,对车辆角度识别包括采用车辆角度分类算法,将车辆归类为正前、正后、正左、正右、左前、右前、左后、右后或垂直俯视。
在另一些实施例中,对车辆模糊识别包括采用DCT(Discrete Cosine Transform,简称离散余弦变换)算法,并给预设的模糊值将车辆分为清晰、轻度模糊或严重模糊。例如,将模糊度的值小于阈值1的车辆识别为清晰,在阈值1和阈值2之间的车辆识别为轻度模糊,将大于阈值2的车辆识别为严重模糊。在一些实施例中,阈值1设置为0.5,阈值2设置为0.7。
在另一些实施例中,对车辆遮挡识别包括采用车辆遮挡分类算法,将车辆归类为轻微遮挡或者轻微截断、中度遮挡或者中度截断、严重遮挡或者严重截断,轻微遮挡或者轻微截断是指车辆被遮挡或者截断长度与车辆长度的比值大于等于0小于等于阈值3,中度遮挡或者中度截断是指车辆被遮挡或者截断长度与车辆长度的比值大于阈值3小于等于阈值4,严重遮挡或者严重截断是指车辆被遮挡或者截断长度与车辆长度的比值大于阈值4小于等于1,在一些实施例中,阈值3设置为1/3,阈值4设置为2/3。
在一些实施例中,车辆角度识别和车辆遮挡识别采用相同的主干网络,并且主干网络的权重参数相同。因此,相同车辆同一张图片只需要进行一次主干网络的特征提取,之后可以被车辆角度识别和车辆遮挡识别重复使用,从而有效减少计算量,提高了车辆角度识别和车辆遮挡识别的整体运行速度。
根据图1所示的实施例,在车辆识别前,通过对图像进行预处理提高了车辆图像的分辨率和图像质量;通过对车辆进行状态识别,将车辆归类为不同的分组,以使得在对车辆属性识别时可以过滤掉一些不符合识别要求的图像,从而减少了车辆属性识别时的计算量,提高车辆属性识别的速度。
另外,通过车辆图像采用分块检测,从而可以并行处理各个图像分块,从而加快了图像的检测过程;采用相同的主干网络对相同车辆同一张图片进行识别的方式减少了车辆角度识别和车辆遮挡识别的计算量,提高了车辆角度识别和车辆遮挡识别的整体运行速度。
图2示出了根据本发明示例实施例的另一种识别车辆的方法流程图,如图2所示,除了步骤S101、S103和S105之外,图2所示的方法还包括步骤S104和步骤S107。其中,步骤S104在步骤S103之后和步骤S105之前执行,步骤S107在步骤S105之后执行。
为了简要起见,以下将仅描述图2所示的实施方式与图1的不同之处,并将略去与其相同之处的详细描述。
在步骤S104,对所述车辆检测区域进行车辆跟踪得到跟踪结果,并为所述车辆配置获得唯一的车辆编码。
根据一些实施例,车辆编码是车辆跟踪过程中生成的唯一车辆ID,它通常为一个整数。由于车辆跟踪算法可自动实现将同一个摄像头中获取的连续图片中的同一个车辆关联起来,并且相同车辆只有一个唯一的车辆编号。在具体的实施例中,如果当前识别的某个编号的所述车辆已经完成1次车辆属性识别,则在步骤S105之后,不再执行步骤S107,从而避免对所述车辆重复识别;否则,则说明当前需要识别的图像中的车辆为新的车辆,需要在步骤S105之后,执行步骤S107,对所述车辆的属性进行识别。
在此需要说明的是,由于车辆朝向是不断变化的,车辆朝向会基于获取的车辆图片不断更新。因此,即使车辆已被识别,也需要对车辆继续进行车辆朝向识别。
在步骤S107,根据所述车辆的所述状态识别结果和所述跟踪结果,对所述车辆属性进行识别。
根据一些实施例,识别的车辆属性包括所述车辆的颜色、车型、朝向、品牌。在一些实施例中,基于车头和/或车尾识别车辆的品牌。
根据本发明的实施例,为了加快车辆属性的识别速度,在步骤S107对车辆属性进行识别之前,根据步骤S105对所述车辆的遮挡、模糊、角度识别结果,过滤掉一些不符合识别要求的图片。
例如,在车辆进行颜色识别时,首先过滤掉严重模糊,严重遮挡或者严重截断的车辆图像,然后通过车辆颜色分类算法,实现车身颜色识别。根据一些实施例,识别的车辆颜色包括棕、绿、蓝、黄、橙、银灰、红、紫、白、黑和/或粉。
又例如,在对车辆进行对于车型识别时,首先过滤掉垂直俯视、正前、正后角度、严重模糊、轻微遮挡或者轻微截断、严重遮挡或者严重截断的车辆图像,然后通过车型分类算法,实现车辆型号识别。根据一些实施例,识别的车辆型号包括公交或客车、小轿车、搅拌车、小型客车或面包车、皮卡车、运动型多用途汽车、油罐车或洒水车或污水车、出租车、卡车或货车。
又例如,在对车辆朝向进行识别时,首先过滤掉严重模糊,严重遮挡或者严重截断的车辆图像,然后采用车辆朝向识别算法进行车辆朝向识别。根据一些实施例,识别的车辆朝向包括前向、后向或其他。
在一些实施例中,如果车辆角度为正前、左前、右前,则识别车辆朝向为前向;如果车辆角度为正后、左后、右后,则识别车辆朝向为后向;如果车辆角度为垂直俯视、正左、正右,则识别车辆朝向为其他。
又例如,在对车辆品牌进行识别时,首先过滤掉垂直俯视、正左、正右、严重模糊、严重遮挡或者严重截断的车辆图像,对过滤之后的车辆图像,进行车头、车尾检测,获取车头、车尾图像,然后通过车头车尾分类算法,实现车辆品牌识别,根据本发明的实施例,通过首先对车辆的车头车尾进行检测,然后再对车辆品牌进行识别,相比于传统的直接对车辆图片进行车辆品牌分类的方式,精确度更高。根据本发明的实施例,可识别149个车辆品牌,如图5所示。
根据本发明的实施例,车辆颜色识别、车型识别和朝向识别采用相同的主干网络,并且主干网络的权重参数相同,因此,相同车辆同一张图片只需要进行一次主干网络的特征提取,就可以被车辆颜色识别、车型识别和朝向识别算法重复使用,从而有效减少了车辆属性识别的计算量,从而提高了算法的整体运行速度。
图3示出了根据本发明示例实施例的另一种识别车辆的方法流程图,如图3所示,在步骤S301,对摄像头进行选材,并固定所述摄像头的焦距、位置和角度。
在一些实施例中,步骤S301采用单目摄像头。
在步骤S303,对所述摄像头进行内参标定。
根据一些实施例,利用张正友内参标定法对所述摄像头进行内参标定,以得到内参矩阵和畸变系数。
在步骤S305,将得到的内参矩阵和畸变系数存储到配置文件中。
在步骤S307,对图像进行畸变校正。
在具体的实施例中,从步骤S3的配置文件中,获取单目摄像头的内参矩阵和畸变系数,然后对单目摄像头新获取的图片,进行畸变校正,得到畸变校正之后的图片。
在步骤S309,进行图像超分。
图像超分是为了提高图像的分辨率和图像的质量,例如,将1080P(分辨率为1920*1080)转变为4K(分辨率为3840*2160),以便于后续的车辆识别,同时可以降低摄像头的成本,可以充分利用老旧摄像头。
根据现有技术,在步骤S309可采用公式(1)所示的总损失函数进行图像超分。
(1)
其中,是预测图像,/>是实际图像,/>分别为图像的高、宽、通道数,/>表示的横坐标为/>,纵坐标为/>,通道编号为/>的像素点的像素值,/>表示/>的横坐标为/>,纵坐标为/>,通道编号为/>的像素点的像素值。
在步骤S311,进行图像分块。
对获取图像超分之后的图片后,通过对该图片进行分块,可以提升小目标车辆的检测,以及提升后续算法的计算效果。
在具体的实施例中,按照相邻图像块之间部分重合的方式对图像分块,以确保图像目标检测的完整性。
在步骤S313,进行车辆检测。
对分块图片分别进行车辆检测,整合所有图像块的检测结果。由于相邻图像块的重叠区域可能有相同的车辆,这样相当于同一辆车进行了重复检测,将每块中的车辆区域还原到原图区域的时候,可能会出现多个重叠比较大的框。在具体的实施例中,采用非极大抑制(Non Maximum Suppression,简称NMS) 算法,对重复检测框进行过滤,得到最终的车辆检测结果,即车辆区域图像。
根据一些实施例,车辆检测算法包括但不限于SSD、YOLO、FCOS和/或DETR。
根据现有技术,步骤S313可采用公式(2)所示的总损失函数进行车辆检测。
(2)
其中,lossloc为位置损失函数,如公式(3)~(6)所示;lossobj为物体置信度损失函数,如公式(7)所示;losscls为分类损失函数,如公式(8)所示。
(3)
(4)
(5)
(6)
(7)
(8)
其中,表示网格序号,B表示当前网格的第B个框,每个网格有3个框;/>表示当前网格,有物体=1,没物体=0;/>刚好相反,有物体=0,没物体=1;/>表示所有网格里,所有框有物体的累加;/>表示参数因子;/>分别表示预测框和真实框的中心点距离,以及外包矩形的斜边长;/>表示预测框和真实框的交并比;/>表示预测框的宽和高;/>表示真实框的宽和高;/>表示第/>个网格的第/>个框置信度,/>表示第/>个网格的第/>个框的预测框的置信度;/>表示第/>个网格的第j个框为类别C的概率值,/>表示第/>个网格的第j个预测框为类别C的概率值。
在步骤S315,基于车辆检测的区域图像,进行车辆跟踪,并为每个车辆配置唯一的车辆编号。
根据一些实施例,车辆跟踪算法包括但不限于Deepsort、CenterTrack和/或ByteTrack。
根据现有技术,步骤S315可采用公式(9)所示的总损失函数进行车辆跟踪。
(9)
其中,是heatmap损失函数,如公式(10)所示,/>是Offset和Size 损失函数,如公式(11)所示,/>是Re-ID的Embedding损失,如公式(14)所示。
(10)
其中,是预测的heatmap特征图,/>是heatmap的ground-truth。
(11)
其中,N为一个图中物体总数量。和/>分别为偏移的预测特征图与检测大小的预测特征图。
在计算机科学和机器学习领域,ground truth指的是与模型的预测结果进行比较的真实或准确的标签或数据,用于评估模型的性能和准确性。根据现有技术,ground-truth特征图如公式(12)和公式(13)所示。
(12)
(13)
其中,为物体的左上角坐标,/>为物体右下角的坐标,/>为物体的中心坐标。
(14)
其中,为第/>个物体的预测的类别(例如,ID编号)可能性分布,/>为第/>个物体真实的one-hot编码。
在步骤S317,进行车辆角度识别。
在具体的实施例中,采用车辆角度分类算法,分为正前、正后、正左、正右、左前、右前、左后、右后、垂直俯视,共9个类别。其中,车辆角度分类算法包括但不限于Vgg,ResNet,ResNeXt,Inception,Xception 、RegNet、ConvNeXt和/或ViT。
根据现有技术,步骤S317可采用公式(15)所示的损失函数进行车辆角度识别。
(15)
其中表示第/>个样本属于第/>类的标签,/>表示第/>个样本被预测为第/>类的概率,n为每批次的图片数量,/>为类别数。
在步骤S319,进行车辆模糊识别。
在具体的实施例中,车辆模糊识别采用离散余弦变换 (Discrete CosineTransform,简称DCT)算法,其中,当模糊度的值小于阈值1时识别为清晰,在阈值1和阈值2之间时识别为轻度模糊,大于阈值2时识别为严重模糊。建议阈值1设置为0.5,阈值2设置为0.7。
在步骤S321,进行车辆遮挡识别。
在具体的实施例中,车辆遮挡识别采用车辆遮挡分类算法,将车辆分为轻微遮挡或者轻微截断,中度遮挡或者中度截断,严重遮挡或者严重截断。
在一些实施例中,在进行车辆角度识别和车辆遮挡识别时,采用相同的主干网络,并且主干网络的权重参数相同。因此,相同车辆同一张图片只需要进行一次主干网络的特征提取,便可以被这些算法复用,从而可以有效减少计算量。同时,也提高了识别算法的整体运行速度。
车辆编号为每辆车的唯一标识,每辆车都会有车身颜色、车辆型号、车辆朝向、车辆品牌等属性。在具体的实施例中,当图像中某个编号的车辆,如果以上车辆属性均进行1次识别,那么该车辆不再进行车辆颜色、车辆型号和车辆品牌的识别;否则,执行步骤S323至S329。但由于车辆朝向是不断变化的,车辆朝向会基于获取的车辆图片不断更新,因此,即使某个编号的车辆已经识别1次车辆朝向,也需要对该车辆继续进行车辆朝向识别。
在步骤S323,进行车辆颜色识别。
在具体的实施例中,在对车辆进行颜色识别时,需要过滤掉严重模糊,严重遮挡或者严重截断的车辆图像,然后通过车辆颜色分类算法,实现车身颜色识别,如图6a和图6b所示。其中,识别的车身颜色包括棕、绿、蓝、黄、橙、银灰、红、紫、白、黑和/或粉。如图6a所示,识别的车辆颜色为蓝色。又如图6b所示,识别的车辆颜色为黑色。
在步骤S325,进行车型和朝向识别。
在具体的实施例中,在对车辆型号识别时,需要过滤掉垂直俯视、正前、正后角度、严重模糊、中度遮挡或者中度截断、严重遮挡或者严重截断的车辆图像,然后通过车型分类算法,实现车辆型号识别。其中,识别的车辆型号包括公交或客车、小轿车、搅拌车、小型客车或面包车、皮卡车、运动型多用途汽车、油罐车或洒水车或污水车、出租车、卡车或货车。如图7a所示,识别的车型为出租车。又如图7b所示,识别的车型为货车。
在具体的实施例中,车辆朝向识别是将车辆分别分为前向、后向或其他。在对车辆朝向识别时,需要首先过滤掉严重模糊、严重遮挡或者严重截断。当车辆角度为正前、左前、右前,则将车辆朝向识别为前向;当车辆角度为正后、左后、右后,则将车辆朝向识别为后向;当车辆角度为垂直俯视、正左、正右,则识别车辆朝向为其他,以实现车辆朝向识别。图8a所示,识别的车辆朝向为前向。又如图8b所示,识别往右方向行驶的车辆朝向为其他,识别的图片下方的车辆朝向为后向。
根据本发明的实施例,车辆颜色识别、车型识别和车辆朝向识别,采用相同的主干网络(例如,resnet50),并且主干网络的权重参数相同。因此,相同车辆同一张图片只需要进行1次主干网络的特征提取,之后可以这些算法复用,从而可以有效减少计算量,提高识别的整体运行速度。
在步骤S327,车头、车尾检测。
在对车辆品牌识别时,需要首先过滤掉垂直俯视、正左、正右、严重模糊、严重遮挡或者严重截断的车辆图像,对过滤之后的车辆图像,进行车头、车尾检测,获取车头、车尾图像。
在步骤S329,进行车辆品牌识别。
在步骤S327对车头车尾检测后,通过车辆品牌分类(车头、车尾分类)算法,实现车辆品牌识别。通过首先进行车头车尾检测,在进行车辆品牌识别,这种方式相比于利用车辆图像直接做品牌分类的方式精度更高。根据本发明的实施例,可识别149个车辆品牌,如图5所示。
如图9a所示,识别的车辆品牌为马自达。又如图9b所示,识别的车辆品牌为北京现代。
根据本发明的实施例,车辆检测算法采用yolov7,车辆跟踪算法采用CenterTrack,角度识别和遮挡识别算法采用resnet18,模糊识别算法采用DCT,颜色识别、车型和朝向采用resnet50,车头车尾检测采用算法yolov7,品牌识别算法采用resnet50。其中,在进行车辆角度识别和车辆遮挡识别时,采用相同的主干网络,并且主干网络的权重参数相同,在进行车身颜色识别、车型识别和车辆朝向识别,采用相同的主干网络,并且主干网络的权重参数相同。通过这种方式,相同车辆同一张图片只需要进行一次主干网络的特征提取,从而通过这些算法复用这些特征,从而可以有效减少计算量,提高识别的整体运行速度。
上面主要从方法的角度对本发明实施例进行了介绍。本领域技术人员应该很容易意识到,结合本文中所公开的实施例所描述的各示例的操作或步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。本领域技术人员可以对每个特定的操作或方法使用不同方式来实现所描述的功能,这种实现不应认为超出本发明的范围。
下面描述本发明的装置实施例。对于本发明装置实施例中未说明的细节,可参照本发明方法实施例。
图4示出了根据本发明示例实施例的一种识别车辆的装置框图,如图4所示的装置包括预处理单元401、车辆检测单元403和状态识别单元405。其中,预处理单元401用于响应于所述车辆的识别指令,对所述车辆的图像进行预处理;车辆检测单元403用于对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域;状态识别单元405用于利用所述车辆检测区域,对所述车辆进行状态识别,得到状态识别结果。
图10示出根据本发明示例性实施例的一种电子设备。下面参照图10来描述根据本发明的这种实施方式的电子设备200。图10显示的电子设备200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
其中,存储单元存储有程序代码,程序代码可以被处理单元210执行,使得处理单元210执行本说明书描述的根据本发明各种示例性实施方式的方法。例如,处理单元210可以执行如图1中所示的方法。
存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。
存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明实施方式的上述方法。
软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现前述功能。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
根据本发明的实施例,提出一种计算机程序,包括计算机程序或指令,该计算机程序或指令被处理器执行时,可以执行以上描述的方法。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明仅用于帮助理解本发明的方法及其核心思想。同时,本领域技术人员依据本发明的思想,基于本发明的具体实施方式及应用范围上做出的改变或变形之处,都属于本发明保护的范围。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种识别车辆的方法,其特征在于,包括:
响应于所述车辆的识别指令,对所述车辆的图像进行预处理;
对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域;
利用所述车辆检测区域,对所述车辆进行状态识别,得到状态识别结果。
2.根据权利要求1所述的方法,其特征在于,利用所述车辆检测区域,对所述车辆进行状态识别包括:
对所述车辆进行遮挡、模糊、角度识别。
3.根据权利要求2所述的方法,其特征在于,在利用所述车辆检测区域,对所述车辆进行状态识别之前,所述方法还包括:
对所述车辆检测区域进行车辆跟踪得到跟踪结果,并为所述车辆配置获得唯一的车辆编码。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述车辆的所述状态识别结果和所述跟踪结果,对所述车辆的状态进行识别。
5.根据权利要求4所述的方法,其特征在于,所述车辆属性包括所述车辆的颜色、车型、朝向和/或品牌。
6.根据权利要求4所述的方法,其特征在于,响应于所述车辆的识别指令,对所述车辆的图像进行预处理,包括:
根据摄像头的配置参数对所述车辆的图像进行畸变校正;
对畸变校正后的图像进行图像超分处理。
7.根据权利要求1所述的方法,其特征在于,所述对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域,包括:
对所述图像进行分块处理,其中,得到的相邻的图像分块有部分重合;
分别对所述图像的每个分块进行检测;
整合所述图像的所有分块的检测结果,以得到所述图像中的车辆检测区域。
8.一种识别车辆的装置,其特征在于,包括:
预处理单元,用于响应于所述车辆的识别指令,对所述车辆的图像进行预处理;
车辆检测单元,用于对预处理后的图像进行分块检测,以得到所述图像中的车辆检测区域;
状态识别单元,用于利用所述车辆检测区域,对所述车辆进行状态识别,得到状态识别结果。
9.一种电子设备,包括:
处理器;以及
存储器,存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种非瞬时性计算机可读存储介质,其上存储有计算机可读指令,当所述指令被处理器执行时,使得所述处理器执行如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311685078.7A CN117409380A (zh) | 2023-12-11 | 2023-12-11 | 识别车辆的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311685078.7A CN117409380A (zh) | 2023-12-11 | 2023-12-11 | 识别车辆的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117409380A true CN117409380A (zh) | 2024-01-16 |
Family
ID=89491090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311685078.7A Pending CN117409380A (zh) | 2023-12-11 | 2023-12-11 | 识别车辆的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117409380A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103456179A (zh) * | 2012-06-04 | 2013-12-18 | 中兴通讯股份有限公司 | 车辆统计方法、装置及视频监控系统 |
CN112017065A (zh) * | 2020-08-27 | 2020-12-01 | 中国平安财产保险股份有限公司 | 车辆定损理赔方法、装置及计算机可读存储介质 |
CN116129369A (zh) * | 2022-12-30 | 2023-05-16 | 中国电信股份有限公司 | 基于视频流跟踪融合的车辆属性识别方法及相关设备 |
CN116205948A (zh) * | 2023-01-06 | 2023-06-02 | 厦门科拓软件研发中心有限公司 | 车辆跟踪匹配方法、装置、电子设备和存储介质 |
-
2023
- 2023-12-11 CN CN202311685078.7A patent/CN117409380A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103456179A (zh) * | 2012-06-04 | 2013-12-18 | 中兴通讯股份有限公司 | 车辆统计方法、装置及视频监控系统 |
CN112017065A (zh) * | 2020-08-27 | 2020-12-01 | 中国平安财产保险股份有限公司 | 车辆定损理赔方法、装置及计算机可读存储介质 |
CN116129369A (zh) * | 2022-12-30 | 2023-05-16 | 中国电信股份有限公司 | 基于视频流跟踪融合的车辆属性识别方法及相关设备 |
CN116205948A (zh) * | 2023-01-06 | 2023-06-02 | 厦门科拓软件研发中心有限公司 | 车辆跟踪匹配方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020173056A1 (zh) | 交通图像识别方法、装置、计算机设备和介质 | |
CN110969160B (zh) | 一种基于深度学习的车牌图像校正、识别方法及系统 | |
CN111598030A (zh) | 一种航拍图像中车辆检测和分割的方法及系统 | |
CN113723377B (zh) | 一种基于ld-ssd网络的交通标志检测方法 | |
CN112990065B (zh) | 一种基于优化的YOLOv5模型的车辆分类检测方法 | |
CN114092917B (zh) | 一种基于mr-ssd的被遮挡交通标志检测方法及系统 | |
CN109993138A (zh) | 一种车牌检测与识别方法及装置 | |
CN115019279A (zh) | 一种基于MobileNet轻量化网络的上下文特征融合方法 | |
CN115546742A (zh) | 一种基于单目热红外摄像头的铁轨异物识别方法及系统 | |
CN116052090A (zh) | 图像质量评估方法、模型训练方法、装置、设备及介质 | |
CN113033715B (zh) | 目标检测模型训练方法和目标车辆检测信息生成方法 | |
de Almeida et al. | Vehicle occurrence-based parking space detection | |
CN115761552B (zh) | 面向无人机机载平台的目标检测方法、设备及介质 | |
CN116386018A (zh) | 车牌字符分类方法以及系统 | |
CN117409380A (zh) | 识别车辆的方法和装置 | |
CN111127503A (zh) | 检测车辆轮胎的花纹的方法、设备和存储介质 | |
CN115965831A (zh) | 一种车辆检测模型训练方法和车辆检测方法 | |
CN109977844A (zh) | 一种基于图像识别机动车礼让行人控制系统及控制方法 | |
CN114973169A (zh) | 基于多目标检测和跟踪的车辆分类计数方法及系统 | |
CN115565155A (zh) | 神经网络模型的训练方法、车辆视图的生成方法和车辆 | |
CN113408514B (zh) | 一种基于深度学习检测路侧停车场泊位的方法及装置 | |
CN113011268A (zh) | 车辆智能导航方法、装置、电子设备及存储介质 | |
CN114255450A (zh) | 一种基于前向全景图像的近场车辆加塞行为预测方法 | |
CN114627400A (zh) | 一种车道拥堵检测方法、装置、电子设备和存储介质 | |
CN112686136A (zh) | 一种对象检测方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |