CN112131935A - 一种机动车车厢载人识别方法、装置和计算机设备 - Google Patents
一种机动车车厢载人识别方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN112131935A CN112131935A CN202010810097.8A CN202010810097A CN112131935A CN 112131935 A CN112131935 A CN 112131935A CN 202010810097 A CN202010810097 A CN 202010810097A CN 112131935 A CN112131935 A CN 112131935A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- compartment
- deep learning
- picture
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000001514 detection method Methods 0.000 claims abstract description 115
- 238000013136 deep learning model Methods 0.000 claims abstract description 65
- 238000012549 training Methods 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000013135 deep learning Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种机动车车厢载人识别方法、装置和计算机设备,其中,该机动车车厢载人识别方法包括:相比于相关技术,本申请实施例提供的机动车车厢载人识别方法,通过获取目标车辆的图片,将所述图片输入到深度学习模型,获得所述目标车辆的车辆类型,以及获得所述目标车辆的车辆关键点;其中,采用车辆类型和车辆关键点训练所述深度学习模型,在所述车辆类型是预设车辆类型的情况下,根据车辆关键点确定车厢检测区域,并利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定车厢是否载人,解决了相关技术中依赖具体的定位设备,对机动车车厢内是否载人进行识别,存在机动车车厢载人识别准确率低的问题,提高了机动车车厢载人识别的准确率。
Description
技术领域
本申请涉及计算机视觉领域,特别是涉及一种机动车车厢载人识别方法、装置和计算机设备。
背景技术
城市道路机动车车辆的不断增加,机动车违规驾驶的行为也越来越多,造成严重的交通事故,危及人们的生命安全。由于计算机视觉技术的不断进步,在智能交通领域也得到了广泛的应用,可以对这些违法驾驶车辆进行抓拍、处罚。
相关技术中,在识别货车或者皮卡车等机动车车厢内是否载人时,通过定位人员携带的终端设备,当终端设备处于指定的目标区域(车厢)内时,获取终端设备的速度,当该速度超过给定的速度值时,判断机动车车厢内载有人,这种机动车车厢载人识别方式,需要人员携带定位设备,也就是依赖具体的定位设备,才能对机动车车厢内是否载人进行识别,因此一旦机动车车厢内的人未携带定位设备,则无法识别到机动车车厢内的人,进而该识别方式存在机动车车厢载人识别准确率低的问题。
目前针对相关技术中依赖具体的定位设备,对机动车车厢内是否载人进行识别,存在机动车车厢载人识别准确率低的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种机动车车厢载人识别方法、装置和计算机设备,以至少解决相关技术中依赖具体的定位设备,对机动车车厢内是否载人进行识别,存在机动车车厢载人识别准确率低的问题。
第一方面,本申请实施例提供了一种机动车车厢载人识别方法,所述方法包括:
获取目标车辆的图片;
将所述图片输入到深度学习模型,获得所述目标车辆的车辆类型,以及获得所述目标车辆的车辆关键点;其中,采用车辆类型和车辆关键点训练所述深度学习模型;
在所述车辆类型是预设车辆类型的情况下,根据所述车辆关键点确定车厢检测区域,并利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人。
在其中一些实施例中,训练所述深度学习模型的方法包括:
建立带有第一分支网络和第二分支网络的深度学习模型;其中,所述第一分支网络用于车辆类型的识别,所述第二分支网络用于车辆关键点的定位;
从图像数据库中获取车辆图片和与所述车辆图片相对应的标注信息;
根据所述车辆图片和所述标注信息训练所述深度学习模型,且所述深度学习模型的损失函数为所述第一分支网络的损失函数与所述第二分支网络的损失函数之和。
在其中一些实施例中,用所述车辆图片和所述标注信息训练所述深度学习模型包括:
根据所述车辆图片和所述标注信息分别训练所述第一分支网络和所述第二分支网络;
在训练所述第二分支网络的情况下,分别获取所述第一分支网络中的车辆类型特征图和所述第二分支网络的车辆关键点特征图,并根据所述车辆类型特征图和所述车辆关键点特征图确定所述第二分支网络的第二特征图,并根据所述第二特征图训练所述第二分支网络。
在其中一些实施例中,根据所述车辆类型特征图和所述车辆关键点特征图确定所述第二分支网络的第二特征图包括:
对所述车辆类型特征图进行跨通道采样,以生成注意力特征图;
将所述注意力特征图与所述车辆关键点特征图对应像素点乘,以确定第二特征图。
在其中一些实施例中,将所述图片输入到深度学习模型之前,所述方法还包括:
根据车辆检测模型对所述图片中的所述目标车辆进行检测,确定所述目标车辆在所述图片中的位置信息,以将包含有所述目标车辆位置信息的图片输入到所述深度学习模型。
在其中一些实施例中,利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人包括:
在所述人脸检测模型检测到人脸,且置信度大于预设阈值的情况下,确定所述车厢载人,并在所述车辆载人的情况下,利用所述人脸检测模型获取所述人脸检测数目以及所述人脸的位置。
在其中一些实施例中,所述车辆关键点为四个;根据所述车辆关键点确定车厢检测区域包括:
获取各个所述关键点的坐标;
根据所述坐标确定所述车辆关键点形成的区域,选取面积最大的所述区域作为所述车厢检测区域。
第二方面,本申请实施例提供了一种机动车车厢载人识别装置,所述装置包括:获取模块、深度学习模块和人脸检测模块;
所述获取模块,用于获取目标车辆的图片;
所述深度学习模块,用于将所述图片输入到深度学习模型,获得所述目标车辆的车辆类型,以及获得所述目标车辆的车辆关键点;其中,所述深度学习模型是采用车辆类型和车辆关键点训练的;
所述人脸检测模块,用于在所述车辆类型是预设车辆类型的情况下,根据所述车辆关键点确定车厢检测区域,并利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人。
第三方面,本申请实施例提供了一种机动车车厢载人识别系统,所述系统包括:摄像头和中央处理器;
所述摄像头,用于获取目标车辆的图片;
所述中央处理器,用于将所述图片输入到深度学习模型,获得所述目标车辆的车辆类型,以及获得所述目标车辆的车辆关键点;其中,所述深度学习模型是采用车辆类型和车辆关键点训练的,并在所述车辆类型是预设车辆类型的情况下,根据所述车辆关键点确定车厢检测区域,并利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人。
第四方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的机动车车厢载人识别方法。
相比于相关技术,本申请实施例提供的机动车车厢载人识别方法,通过获取目标车辆的图片,将所述图片输入到深度学习模型,获得所述目标车辆的车辆类型,以及获得所述目标车辆的车辆关键点;其中,采用车辆类型和车辆关键点训练所述深度学习模型,在所述车辆类型是预设车辆类型的情况下,根据所述车辆关键点确定车厢检测区域,并利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人,解决了相关技术中依赖具体的定位设备,对机动车车厢内是否载人进行识别,存在机动车车厢载人识别准确率低的问题,提高了机动车车厢载人识别的准确率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的机动车车厢载人识别方法的流程图一;
图2是根据本申请实施例的训练深度学习模型的方法的流程图一;
图3是根据本申请实施例的训练深度学习模型的方法的流程图二;
图4是根据本申请实施例的训练深度学习模型的方法的流程图三;
图5是根据本申请实施例的机动车车厢载人识别方法的流程图二;
图6是根据本申请实施例的机动车车厢载人识别方法的流程图三;
图7a是根据本申请实施例的机动车车厢载人识别方法的流程图四;
图7b是根据本申请实施例的目标车辆的车辆关键点的示意图;
图8是根据本申请实施例的机动车车厢载人识别装置的结构框图;
图9是根据本申请实施例的机动车车厢载人识别系统的结构框图;
图10是根据本申请实施例的计算机设备的硬件结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本申请提供的机动车车厢载人识别方法,可以应用于智能交通中,例如,车辆类型是货车、皮卡车等具有外部车厢的车型,对该车厢内是否载人进行识别,以实现对违法驾驶车辆进行抓拍、处罚,通过获取目标车辆的图片,将图片输入到深度学习模型,获得目标车辆的车辆类型,以及获得目标车辆的车辆关键点,其中,采用车辆类型和车辆关键点训练深度学习模型,在车辆类型是预设车辆类型的情况下,根据车辆关键点确定车厢检测区域,并利用人脸检测模型对车厢检测区域进行人脸检测,以确定车厢是否载人。
本实施例提供了一种机动车车厢载人识别方法,图1是根据本申请实施例的机动车车厢载人识别方法的流程图一,如图1所示,该流程包括如下步骤:
步骤S101,获取目标车辆的图片,需要说明的是,目标车辆的图片可以是卡口摄像机或者电警摄像机的道路图像,其中,卡口摄像机主要是用于城市道路或者高速公路出入口、收费站等重点治安监控地段的全天候实时监测与记录,像收费站、交通或治安检查站等地点大部分都安装有卡口摄像机;电警摄像机主要是对城市道路违规的车辆进行抓拍;
步骤S102,将图片输入到深度学习模型,获得目标车辆的车辆类型,以及获得目标车辆的车辆关键点;其中,采用车辆类型和车辆关键点训练深度学习模型;需要说明的是,目标车辆的车辆类型可以是以下几种:货车、小轿车、面包车、皮卡车、非机动车和客车;
步骤S103,在车辆类型是预设车辆类型的情况下,根据车辆关键点确定车厢检测区域,并利用人脸检测模型对车厢检测区域进行人脸检测,以确定车厢是否载人;
需要说明的是,在深度学习模型输出目标车辆的车辆类型之后,对目标车辆的车辆类型进行过滤,也就是过滤到车辆类型不属于货车、皮卡车等具有外部车厢的车型,留下车辆类型属于货车、皮卡车等具有外部车厢的车型,也可以理解为货车、皮卡车等具有外部车厢的车型是预设车辆类型。在车辆类型是预设车辆类型的情况下,根据车辆关键点确定车厢检测区域,并利用人脸检测模型对车厢检测区域进行检测,需要进一步说明的是,人脸检测模型包括但不限于Yolo目标检测、Mtcnn人脸检测、RetinaNet目标检测等模型;
通过上述步骤S101至步骤S103,将目标车辆的图片输入已经训练好的多任务深度学习模型中,获取到目标车辆的车辆类型和目标车辆的车辆关键点,并在目标车辆的车辆类型是预设车辆类型的情况下,根据目标车辆的车辆关键点确定车厢检测区域,并利用人脸检测模型对车厢检测区域进行人脸检测,进而来识别货车、皮卡车等外部车厢中是否载人,解决了相关技术中依赖具体的定位设备对机动车车厢内是否载人进行识别,存在机动车车厢载人识别准确率低的问题,提高了机动车车厢载人识别的准确率,并相较于关技术中依赖具体的定位设备对机动车车厢内是否载人进行识别,不需要人员携带定位设备,没有额外的设备成本。
在其中一些实施例中,图2是根据本申请实施例的训练深度学习模型的方法的流程图一,如图2所示,该流程包括如下步骤:
步骤S201,建立带有第一分支网络和第二分支网络的深度学习模型;其中,第一分支网络用于车辆类型的识别,第二分支网络用于车辆关键点的定位;
需要说明的是,第一分支网络,获取输入图片,可以是经过CNN卷积神经网络模型,进行特征提取、分类,输出车型结果信息;第二分支网络与第一分支网络采用相同的输入图片,第二分支网络经过CNN网络模型,输出车辆关键点的坐标信息;
步骤S202,从图像数据库中获取车辆图片和与车辆图片相对应的标注信息;需要说明的是,与车辆图片相对应的标注信息包括:该车辆图片中目标车辆的车辆类别以及目标车辆的关键点位置信息;
步骤S203,根据车辆图片和标注信息训练深度学习模型,且深度学习模型的损失函数为第一分支网络的损失函数与第二分支网络的损失函数之和;
其中,将通过深度学习模型预测出的车辆类型与标注的车辆类型进行比较,以确定损失函数用Ltype,第一分支网络也就是车辆类型分类网络,可以采用交叉熵损失函数进行训练;将预测出的车辆关键点和标注的车辆关键点进行比较,损失函数采用均方误差函数Lpoint来评估预测,深度学习模型最终的损失函数是第一分支网络的损失函数Ltype加上第二分支网络的损失函数Lpoint,深度学习模型的损失函数可以用如下公式进行表示:
Lall=Ltype+Lpoint 公式1
上述公式1中,Lall为深度学习模型的损失函数,Ltype为第一分支网络的损失函数,Lpoint为第二分支网络的损失函数;
通过上述步骤S201至步骤S203,通过从图像数据库中获取车辆图片和与车辆图片相对应的标注信息,对带有第一分支网络和第二分支网络的深度学习模型进行训练,并将两分支网络的损失函数之和作为该深度学习模型的损失函数,使得一个深度学习模型可以在输入关于目标车辆的图片的情况下,可以输出车辆类型和车辆标注,实现多任务的完成,提高对带有目标车辆图片的处理效率。
在其中一些实施例中,图3是根据本申请实施例的训练深度学习模型的方法的流程图二,如图3所示,用车辆图片和标注信息训练深度学习模型的流程包括如下步骤:
步骤S301,根据车辆图片和标注信息分别训练第一分支网络和第二分支网络。其中,用车辆图片与标注信息中的车辆类别训练第一分支网络,用车辆图片与标注信息中的车辆关键点训练第二分支网络;
步骤S302,在训练第二分支网络的情况下,分别获取第一分支网络中的车辆类型特征图和第二分支网络的车辆关键点特征图,并根据车辆类型特征图和车辆关键点特征图确定第二分支网络的第二特征图,并根据第二特征图训练第二分支网络;
其中,由于不同类型的车辆关键点的位置有所不同,因此在用车辆图片与标注信息中的车辆关键点训练第二分支网络的情况下,借助第一分支网络中所提取的目标车辆的车辆类型特征图,并根据车辆类型特征图和车辆关键点特征图进行第二分支网络的训练;
通过上述步骤S301至步骤S302,在用车辆图片与标注信息中的车辆关键点训练第二分支网络的情况下,借助第一分支网络中所提取的目标车辆的车辆类型特征图,进而提高第二分支网络的精度。
在其中一些实施例中,图4是根据本申请实施例的训练深度学习模型的方法的流程图三,如图4所示,根据车辆类型特征图和车辆关键点特征图确定第二分支网络的第二特征图的流程包括如下步骤:
步骤S401,对车辆类型特征图进行跨通道采样,以生成注意力特征图;需要说明的是,在对车辆关键点定位的模型中,加入了注意力机制,也就是融合车辆类型的特征信息,进行车辆关键点定位。对车辆类型特征图Ftype进行跨通道采样,其中Ftype的维度可以为RM *H*W,取M通道的最大值,得到注意力特征图Att∈R1*H*W;
步骤S402,将注意力特征图与车辆关键点特征图对应像素点乘,以确定第二特征图。其中,车辆关键点特征图Fpoint∈RN*H*W,对Fpoint的每一通道fpoint∈R1*H*W,与注意力特征图Att∈R1*H*W进行对应像素点乘,得到新的特征图F'point∈RN*H*W,也就是第二特征图,在确定第二特征图的基础上,进行后续的特征计算;
通过上述步骤S401至步骤S402,在深度学习模型中,车辆关键点特征图和注意力特征图对应像素点乘,融合了车辆类型的特征图信息,有利于有效的利用车辆类型特征,进而进一步提高深度学习模型的精度。
在其中一些实施例中,图5是根据本申请实施例的机动车车厢载人识别方法的流程图二,如图5所示,将图片输入到深度学习模型之前,该方法还包括如下步骤:
步骤S501,根据车辆检测模型对图片中的目标车辆进行检测,确定目标车辆在图片中的位置信息,以将包含有目标车辆位置信息的图片输入到深度学习模型;需要说明的是,对城市道路场景中的车辆进行标注,标注结果包含每一个车辆的位置信息,利用标注结果,训练一个车辆检测模型,模型包括但不限于SSD目标检测算法(其英文全名是SingleShot MultiBox Detector)、Yolo检测算法(其英文全名是You Only Look Once)等,主干网络可以是ResNet网络、Inception网络、DenseNet网络,Mobile Net网络等;
通过上述步骤S501,在将城市道路中关于目标车辆的图片输入深度学习模型之前,先对该图片进行目标车辆的检测,以在图片中标注好每一个目标车辆的位置,然后将带有目标车辆位置信息的图片输入到深度学习模型中,也就是在将图片输入至深度学习模型之前做一个预处理,以便于深度学习模型对图片中目标车辆特征的拾取。
在其中一些实施例中,图6是根据本申请实施例的机动车车厢载人识别方法的流程图三,如图6所示,利用人脸检测模型对车厢检测区域进行人脸检测,以确定车厢是否载人的流程包括如下步骤:
步骤S601,在人脸检测模型检测到人脸,且置信度大于预设阈值的情况下,确定车厢载人,并在车辆载人的情况下,利用人脸检测模型获取人脸检测数目以及人脸的位置;
其中,人脸检测模型包括但不限于Yolo、Mtcnn、RetinaNet等模型,置信度是指在人脸检测模型检测到人脸的情况下,对该人脸实行一个评分机制,例如,从人脸遮挡、位置、大小等不同形式中去评价所检测到的人脸,若检测到人脸,并且置信度大于指定的阈值,则可以进行车辆违章判罚,利用人脸检测模型获取人脸检测数目以及人脸的位置,可用于作为违章判罚的依据;
通过上述步骤S601,在人脸检测模型检测到人脸之后,并进一步判断所检测到的人脸所对应的置信度是否大于预设阈值,以确保人脸检测的精度,并在人脸的置信度大于预设阈值的情况下,利用人脸检测模型获取人脸检测数目以及人脸的位置,便于后期作为对外部车厢载人违章判罚的依据。
在其中一些实施例中,图7a是根据本申请实施例的机动车车厢载人识别方法的流程图四,其中车辆关键点为四个,图7b是根据本申请实施例的目标车辆的车辆关键点的示意图,如图7b所示,四个关键点分别为A点、B点、C点和D点,且A点、B点、C点和D点均位于皮卡车或者货车等带有车厢的车辆顶部;如图7a所示,根据车辆关键点确定车厢检测区域的流程包括以下步骤:
步骤S701,获取各个关键点的坐标;例如,四个关键点的坐标分别为(XA,YA)、(XB,YB)、(XC,YC)、(XD,YD);
步骤S702,根据坐标确定车辆关键点形成的区域,选取面积最大的区域作为车厢检测区域;
其中,通过A点中的XA和C点中的XC确定车厢检测区域的左上角坐标XL,通过A点中的YA和B点中的YB确定车厢检测区域的左上角坐标YL,进而确定车厢检测区域的左上角坐标(XL,YL);通过B点中的XB和D点中的XD确定车厢检测区域的右下角坐标XR,通过C点中的YC和D点中的YD确定车厢检测区域的右下角坐标YR,进而选取四个关键点所组成的最大面积区域作为车厢检测区域,进而确定车厢检测区域的右下角坐标(XR,YR);
通过上述步骤S701至步骤S702,根据四个关键点的坐标(XA,YA)、(XB,YB)、(XC,YC)、(XD,YD),选取四个关键点所组成的最大面积区域作为车厢检测区域,以降低漏掉外部部分车厢区域未进行人脸检测的概率。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种机动车车厢载人识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图8是根据本申请实施例的机动车车厢载人识别装置的结构框图,如图8所示,该装置包括:获取模块80、深度学习模块81和人脸检测模块82;
获取模块80,用于获取目标车辆的图片;
深度学习模块81,用于将图片输入到深度学习模型,获得目标车辆的车辆类型,以及获得目标车辆的车辆关键点;其中,深度学习模型是采用车辆类型和车辆关键点训练的;
人脸检测模块82,用于在车辆类型是预设车辆类型的情况下,根据车辆关键点确定车厢检测区域,并利用人脸检测模型对车厢检测区域进行人脸检测,以确定车厢是否载人。
在其中一些实施例中,深度学习模块81和人脸检测模块82还用于实现上述各实施例提供的机动车车厢载人识别方法中的步骤,在这里不再赘述。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本申请还提供了一种机动车车厢载人识别系统,图9是根据本申请实施例的机动车车厢载人识别系统的结构框图,该系统包括摄像头90和中央处理器91;
摄像头90,用于获取目标车辆的图片;
中央处理器91,用于将图片输入到深度学习模型,获得目标车辆的车辆类型,以及获得目标车辆的车辆关键点;其中,深度学习模型是采用车辆类型和车辆关键点训练的,并在车辆类型是预设车辆类型的情况下,根据车辆关键点确定车厢检测区域,并利用人脸检测模型对车厢检测区域进行人脸检测,以确定车厢是否载人。
在其中一些实施例中,中央处理器91还用于实现上述各实施例提供的机动车车厢载人识别方法中的步骤,在这里不再赘述。
另外,结合图1描述的本申请实施例的机动车车厢载人识别方法可以由计算机设备来实现。计算机设备可以包括处理器以及存储有计算机程序指令的存储器。
具体地,上述处理器可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器可在数据处理装置的内部或外部。在特定实施例中,存储器是非易失性(Non-Volatile)存储器。在特定实施例中,存储器包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(Random AccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(ProgrammableRead-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器所执行的可能的计算机程序指令。
处理器通过读取并执行存储器中存储的计算机程序指令,以实现上述实施例中的任意一种机动车车厢载人识别方法。
在其中一些实施例中,计算机设备还可包括通信接口103和总线100,图10是根据本申请实施例的计算机设备的硬件结构示意图,如图10所示,处理器101、存储器102、通信接口103通过总线100连接并完成相互间的通信。
通信接口103用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信接口103还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线100包括硬件、软件或两者,将计算机设备的部件彼此耦接在一起。总线100包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(Control Bus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线100可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(Front Side Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽互连、低引脚数(LowPin Count,简称为LPC)总线、存储器总线、微信道架构(Micro Channel Architecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial Advanced TechnologyAttachment,简称为SATA)总线、视频电子标准协会局部(Video Electronics StandardsAssociation Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线100可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的机动车车厢载人识别方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意机动车车厢载人识别方法。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种机动车车厢载人识别方法,其特征在于,所述方法包括:
获取目标车辆的图片;
将所述图片输入到深度学习模型,获得所述目标车辆的车辆类型,以及获得所述目标车辆的车辆关键点;其中,采用车辆类型和车辆关键点训练所述深度学习模型;
在所述车辆类型是预设车辆类型的情况下,根据所述车辆关键点确定车厢检测区域,并利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人。
2.根据权利要求1所述的方法,其特征在于,训练所述深度学习模型的方法包括:
建立带有第一分支网络和第二分支网络的深度学习模型;其中,所述第一分支网络用于车辆类型的识别,所述第二分支网络用于车辆关键点的定位;
从图像数据库中获取车辆图片和与所述车辆图片相对应的标注信息;
根据所述车辆图片和所述标注信息训练所述深度学习模型,且所述深度学习模型的损失函数为所述第一分支网络的损失函数与所述第二分支网络的损失函数之和。
3.根据权利要求2所述的方法,其特征在于,用所述车辆图片和所述标注信息训练所述深度学习模型包括:
根据所述车辆图片和所述标注信息分别训练所述第一分支网络和所述第二分支网络;
在训练所述第二分支网络的情况下,分别获取所述第一分支网络中的车辆类型特征图和所述第二分支网络的车辆关键点特征图,并根据所述车辆类型特征图和所述车辆关键点特征图确定所述第二分支网络的第二特征图,并根据所述第二特征图训练所述第二分支网络。
4.根据权利要求3所述的方法,其特征在于,根据所述车辆类型特征图和所述车辆关键点特征图确定所述第二分支网络的第二特征图包括:
对所述车辆类型特征图进行跨通道采样,以生成注意力特征图;
将所述注意力特征图与所述车辆关键点特征图对应像素点乘,以确定第二特征图。
5.根据权利要求1所述的方法,其特征在于,将所述图片输入到深度学习模型之前,所述方法还包括:
根据车辆检测模型对所述图片中的所述目标车辆进行检测,确定所述目标车辆在所述图片中的位置信息,以将包含有所述目标车辆位置信息的图片输入到所述深度学习模型。
6.根据权利要求1所述的方法,其特征在于,利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人包括:
在所述人脸检测模型在所述车厢检测区域检测到人脸,且置信度大于预设阈值的情况下,确定所述车厢载人,并在所述车辆载人的情况下,利用所述人脸检测模型获取所述人脸检测数目以及所述人脸的位置。
7.根据权利要求1所述的方法,其特征在于,所述车辆关键点为四个;根据所述车辆关键点确定车厢检测区域包括:
获取各个所述关键点的坐标;
根据所述坐标确定所述车辆关键点形成的区域,选取面积最大的所述区域作为所述车厢检测区域。
8.一种机动车车厢载人识别装置,其特征在于,所述装置包括:获取模块、深度学习模块和人脸检测模块;
所述获取模块,用于获取目标车辆的图片;
所述深度学习模块,用于将所述图片输入到深度学习模型,获得所述目标车辆的车辆类型,以及获得所述目标车辆的车辆关键点;其中,所述深度学习模型是采用车辆类型和车辆关键点训练的;
所述人脸检测模块,用于在所述车辆类型是预设车辆类型的情况下,根据所述车辆关键点确定车厢检测区域,并利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人。
9.一种机动车车厢载人识别系统,其特征在于,所述系统包括:摄像头和中央处理器;
所述摄像头,用于获取目标车辆的图片;
所述中央处理器,用于将所述图片输入到深度学习模型,获得所述目标车辆的车辆类型,以及获得所述目标车辆的车辆关键点;其中,所述深度学习模型是采用车辆类型和车辆关键点训练的,并在所述车辆类型是预设车辆类型的情况下,根据所述车辆关键点确定车厢检测区域,并利用人脸检测模型对所述车厢检测区域进行人脸检测,以确定所述车厢是否载人。
10.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的机动车车厢载人识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010810097.8A CN112131935A (zh) | 2020-08-13 | 2020-08-13 | 一种机动车车厢载人识别方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010810097.8A CN112131935A (zh) | 2020-08-13 | 2020-08-13 | 一种机动车车厢载人识别方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112131935A true CN112131935A (zh) | 2020-12-25 |
Family
ID=73851816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010810097.8A Pending CN112131935A (zh) | 2020-08-13 | 2020-08-13 | 一种机动车车厢载人识别方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112131935A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819885A (zh) * | 2021-02-20 | 2021-05-18 | 深圳市英威诺科技有限公司 | 基于深度学习的动物识别方法、装置、设备及存储介质 |
CN113052037A (zh) * | 2021-03-16 | 2021-06-29 | 蔡勇 | 一种采用ai技术判断移动车辆与人形方法 |
CN114419329A (zh) * | 2022-03-30 | 2022-04-29 | 浙江大华技术股份有限公司 | 车辆载人数量检测方法及装置 |
CN114694284A (zh) * | 2022-03-24 | 2022-07-01 | 北京金和网络股份有限公司 | 特种车辆驾驶员身份验证方法及装置 |
WO2023005275A1 (zh) * | 2021-07-30 | 2023-02-02 | 上海商汤智能科技有限公司 | 交通行为识别方法及装置、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108241822A (zh) * | 2016-12-23 | 2018-07-03 | 杭州海康威视数字技术股份有限公司 | 一种车辆类型的识别方法及装置 |
CN108960107A (zh) * | 2018-06-25 | 2018-12-07 | 安徽百诚慧通科技有限公司 | 一种小微型面包车超员识别方法及装置 |
CN109543648A (zh) * | 2018-11-30 | 2019-03-29 | 公安部交通管理科学研究所 | 一种过车图片中人脸提取方法 |
CN109753903A (zh) * | 2019-02-27 | 2019-05-14 | 北航(四川)西部国际创新港科技有限公司 | 一种基于深度学习的无人机检测方法 |
CN110059623A (zh) * | 2019-04-18 | 2019-07-26 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
US20200019761A1 (en) * | 2019-08-26 | 2020-01-16 | Lg Electronics Inc. | Method and apparatus for passenger recognition and boarding support of autonomous vehicle |
CN110782420A (zh) * | 2019-09-19 | 2020-02-11 | 杭州电子科技大学 | 一种基于深度学习的小目标特征表示增强方法 |
-
2020
- 2020-08-13 CN CN202010810097.8A patent/CN112131935A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108241822A (zh) * | 2016-12-23 | 2018-07-03 | 杭州海康威视数字技术股份有限公司 | 一种车辆类型的识别方法及装置 |
CN108960107A (zh) * | 2018-06-25 | 2018-12-07 | 安徽百诚慧通科技有限公司 | 一种小微型面包车超员识别方法及装置 |
CN109543648A (zh) * | 2018-11-30 | 2019-03-29 | 公安部交通管理科学研究所 | 一种过车图片中人脸提取方法 |
CN109753903A (zh) * | 2019-02-27 | 2019-05-14 | 北航(四川)西部国际创新港科技有限公司 | 一种基于深度学习的无人机检测方法 |
CN110059623A (zh) * | 2019-04-18 | 2019-07-26 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
US20200019761A1 (en) * | 2019-08-26 | 2020-01-16 | Lg Electronics Inc. | Method and apparatus for passenger recognition and boarding support of autonomous vehicle |
CN110782420A (zh) * | 2019-09-19 | 2020-02-11 | 杭州电子科技大学 | 一种基于深度学习的小目标特征表示增强方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819885A (zh) * | 2021-02-20 | 2021-05-18 | 深圳市英威诺科技有限公司 | 基于深度学习的动物识别方法、装置、设备及存储介质 |
CN113052037A (zh) * | 2021-03-16 | 2021-06-29 | 蔡勇 | 一种采用ai技术判断移动车辆与人形方法 |
WO2023005275A1 (zh) * | 2021-07-30 | 2023-02-02 | 上海商汤智能科技有限公司 | 交通行为识别方法及装置、电子设备和存储介质 |
CN114694284A (zh) * | 2022-03-24 | 2022-07-01 | 北京金和网络股份有限公司 | 特种车辆驾驶员身份验证方法及装置 |
CN114694284B (zh) * | 2022-03-24 | 2024-03-22 | 北京金和网络股份有限公司 | 特种车辆驾驶员身份验证方法及装置 |
CN114419329A (zh) * | 2022-03-30 | 2022-04-29 | 浙江大华技术股份有限公司 | 车辆载人数量检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112131935A (zh) | 一种机动车车厢载人识别方法、装置和计算机设备 | |
CN110659539B (zh) | 一种信息处理方法、装置及机器可读存储介质 | |
CN105702048B (zh) | 基于行车记录仪的高速公路前车违法占道识别系统及方法 | |
Rasheed et al. | Automated number plate recognition using hough lines and template matching | |
CN109800633B (zh) | 一种非机动车交通违法判断方法、装置和电子设备 | |
CN109711264B (zh) | 一种公交车道占道检测方法及装置 | |
CN107862340A (zh) | 一种车型识别方法及装置 | |
CN107305627A (zh) | 一种车辆视频监控方法、服务器及系统 | |
CN113033604A (zh) | 一种基于SF-YOLOv4网络模型的车辆检测方法、系统及存储介质 | |
CN104766042A (zh) | 交通标志板识别方法及装置 | |
CN106652477A (zh) | 一种违章识别的方法及装置 | |
CN111931683B (zh) | 图像识别方法、装置及计算机可读存储介质 | |
CN111444798A (zh) | 电动自行车驾驶行为的识别方法、装置和计算机设备 | |
CN103390145A (zh) | 一种目标区域车辆检测方法以及系统 | |
CN111860219B (zh) | 一种高速占道判断方法、装置及电子设备 | |
CN111508269A (zh) | 一种基于图像识别的开放式停车位车辆判别方法与装置 | |
CN112183206B (zh) | 一种基于路侧单目摄像头的交通参与者定位方法和系统 | |
CN112489436B (zh) | 一种车辆身份识别方法、装置、系统、以及电子装置 | |
CN114973156B (zh) | 一种基于知识蒸馏的夜间渣土车检测方法 | |
CN111985304A (zh) | 巡防告警方法、系统、终端设备及存储介质 | |
CN113392680A (zh) | 道路识别装置及方法、电子设备 | |
Amin et al. | An automatic number plate recognition of Bangladeshi vehicles | |
Deng et al. | An integrated forward collision warning system based on monocular vision | |
Ramadan et al. | Real-time Automated License Plate Recognition and Tracking of Runaway Vehicles | |
CN114724107A (zh) | 一种图像检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |