CN116778450A - 车位检测模型训练方法、车位检测方法、训练装置及设备 - Google Patents

车位检测模型训练方法、车位检测方法、训练装置及设备 Download PDF

Info

Publication number
CN116778450A
CN116778450A CN202310532626.6A CN202310532626A CN116778450A CN 116778450 A CN116778450 A CN 116778450A CN 202310532626 A CN202310532626 A CN 202310532626A CN 116778450 A CN116778450 A CN 116778450A
Authority
CN
China
Prior art keywords
parking space
space detection
detection model
loss
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310532626.6A
Other languages
English (en)
Inventor
贺克赛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inceptio Star Intelligent Technology Shanghai Co Ltd
Original Assignee
Inceptio Star Intelligent Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inceptio Star Intelligent Technology Shanghai Co Ltd filed Critical Inceptio Star Intelligent Technology Shanghai Co Ltd
Priority to CN202310532626.6A priority Critical patent/CN116778450A/zh
Publication of CN116778450A publication Critical patent/CN116778450A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/586Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of parking space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供的车位检测模型训练方法、车位检测方法、训练装置及设备,训练方法包括:获取车位样本图像及对应的特征标签,特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;根据车位样本图像,经由车位检测模型,输出车位检测训练结果;基于车位检测训练结果和特征标签,经由损失函数,生成损失值,对车位检测模型进行更新直至收敛,以得到训练好的车位检测模型。本发明针对特殊的车位类型,不需要重新收集图片数据,也无需另做数据标注,因此,在几乎不增加计算量以及不需要任何额外数据标注下,极大提高了车位检测模型对各种车位类型进行识别的鲁棒性。

Description

车位检测模型训练方法、车位检测方法、训练装置及设备
技术领域
本发明涉及车辆自动驾驶技术领域,尤其涉及一种车位检测模型训练方法、车位检测方法、训练装置及设备。
背景技术
自动泊车是指汽车自动泊车入位不需要人工控制。目前智能车辆的自动泊车是通过外部传感器实现的。通过将外部传感器设置在某一个固定的标定位置检测车辆,当感知到目标车辆时引导车辆进行泊车,使其停放在划定的车位框内。因此,精确的自动泊车功能极大地提升驾驶员用车效率以及驾驶感受。
车位检测作为自动泊车中第一步,其重要性不言而喻,车位检测算法利用鱼眼摄像头数据可以有效的识别车位,并准确判断车位位置,为自动泊车提供可靠的车位信息。车位检测算法应用场景包括室内停车场以及室外停车场,在雨天、雾天、雪天等恶劣天气下依然需要较好的识别效果,但由于停车位类型的多样性,除常规的车位类型,特殊类型的停车位往往受限于停车位周围环境的变化使得车位检测变得困难,其检测结果的精确度降低。
发明内容
针对现有技术中存在的问题,本发明提供一种车位检测模型训练方法、车位检测方法、训练装置及设备,提高了车位检测模型对各种车位类型的停车区域识别的鲁棒性。
本发明提供一种车位检测模型训练方法,包括:
获取车位样本图像及对应的特征标签,所述特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
根据所述车位样本图像,经由车位检测模型,输出车位检测训练结果,所述车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
基于所述车位检测训练结果和所述特征标签,经由损失函数,生成损失值,对所述车位检测模型进行更新直至收敛,以得到训练好的所述车位检测模型。
根据本发明提供的一种车位检测模型训练方法,所述损失函数包括:角点距离损失函数、车位四边形距离损失函数和车位内区域损失函数,对应地,所述损失值包括:所述车位四边形距离损失函数的四边形特征损失值,所述角点距离损失函数的角点特征损失值,所述车位内区域损失函数的交叉熵损失值。
根据本发明提供的一种车位检测模型训练方法,生成所述损失值,包括:
由四个角点坐标围成四边形预测框,计算所述四边形预测框与四边形真值之间的交并比;
计算车位内区域训练结果与车位内区域真值之间的距离损失值;
将所述距离损失值与所述交并比之和作为四边形特征损失值。
根据本发明提供的一种车位检测模型训练方法,基于所述车位内区域真值,对所述车位样本图像采用像素点标签标注,其中,将所述车位内区域样本像素的置信度标注为1,将所述车位内区域区域外样本像素的置信度标注为0;
对应地,生成所述损失值,包括:根据预测的车位内区域和车位内区域真值,计算交叉熵损失值。
根据本发明提供的一种车位检测模型训练方法,生成所述损失值,包括:根据预测的四个角点坐标和四个角点坐标真值,计算角点特征损失值。
根据本发明提供的一种车位检测模型训练方法,还包括:训练所述车位检测模型时,基于所述车位四边形距离损失函数的四边形特征损失值、所述车位内区域损失函数的交叉熵损失值以及所述角点距离损失函数的角点特征损失值作为所述损失函数的总损失函数值,进行反向传播训练,对各损失函数对应的权重参数进行更新,最后得到所述车位检测模型。
本发明还提供一种车位检测方法,包括:
获取鱼眼相机拍摄的车位环视鱼眼图;
将所述车位环视鱼眼图输入至训练好的车位检测模型,得到所述车位检测模型输出的车位检测框,所述车位检测框即为车辆沿泊车路径泊车入位的车位内区域,其中,所述训练好的车位检测模型通过如上述任一种所述的车位检测模型训练方法训练得到。
本发明还提供一种车位检测模型训练装置,包括:
样本图像获取模块,用于获取车位样本图像及对应的特征标签,所述特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
训练结果获取模块,用于根据所述车位样本图像,经由车位检测模型,输出车位检测训练结果,所述车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
车位检测模型训练模块,用于基于所述车位检测训练结果和所述特征标签,经由损失函数,生成损失值,对所述车位检测模型进行更新直至收敛,以得到训练好的所述车位检测模型。
本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的车位检测模型训练方法,或实现上述所述的车位检测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的车位检测模型训练方法,或实现上述所述的车位检测方法。
本发明提供的车位检测模型训练方法、车位检测方法、训练装置及设备,通过获取车位样本图像及对应的特征标签,特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;根据车位样本图像,经由车位检测模型,输出车位检测训练结果,车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;基于车位检测训练结果和特征标签,经由损失函数,生成损失值,对车位检测模型进行更新直至收敛,以得到训练好的车位检测模型针对特殊的车位类型,本发明不需要重新收集此类特殊车位类型的图片数据,利用现有的车位样本图像数据,无需在该图像数据上进行额外的数据标注,使得本发明不仅能够预测车位区域的四个角点和车位内区域,还能够预测车位四边形,四边形预测框内的区域为车位内区域,预测框外的区域为车位外区域,这样能使车位检测模型充分学习到车位内、外区域对应的正负样本的分布,获得准确的预测结果。因此,本发明在几乎不增加计算量以及不需要任何额外数据标注下,极大提高了车位检测模型对各种车位类型的停车区域进行识别的鲁棒性,同时还节省了数据标注需要耗费的大量人力、物力资源。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种车位检测模型训练方法的流程示意图;
图2为本发明实施例提供的特殊车位类型的图例;
图3为本发明实施例提供的IOU_loss损失函数对应的数学表达模型图示;
图4为本发明实施例提供的对车位样本图像采用像素点标签标注以划分为车位内区域和车位外区域的图示;
图5为本发明实施例提供的车位检测模型的网络结构示意图;
图6为本发明提供的一种车位检测方法的流程示意图;
图7为本发明提供的一种车位检测模型训练装置的结构示意图;
图8为本发明提供的电子设备的结构示意图。
附图标记:
21:样本图像获取模块;22:训练结果获取模块;23:车位检测模型训练模块。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例和附图对本发明进行清楚、完整的描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本领域普通技术人员显式地和隐式地理解的是,本发明所描述的实施例在不冲突的情况下,可以与其它实施例相结合。除非另作定义,本发明所涉及的技术术语或者科学术语应当为本发明所属技术领域内具有一般技能的人士所理解的通常意义。本发明所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本发明所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;本发明所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
常规车位类型是通过标注白线/黄线等界线标识确定车位,因此对此类常规的车位类型,车位检测模型只需对使用该界线标识框定的车位进行识别以预测出车位的四个角点,通过预测的车位四个角点来确定车位内区域(即停车区域),除了常规的车位类型,还存在特殊的车位类型,例如图2中,植草砖和以砖线为分界线组成的车位(图2a所示),地砖和以草坪为分界组成的车位(图2b所示)等,神经网络模型如果预测此类场景下的车位,如果模型训练的数据集没有包含此类特殊车位的图片数据,模型的预测算法大概率会失效(将砖线或者草坪预测为车位)。
如果遇到上述特殊的车位类型,如采用传统做法,其流程一般为:收集关于此类特殊车位类型的图片数据→数据集标注→训练模型→更新模型,但此种做法不仅周期长,加大了计算量,而且浪费了大量人力和物力成本去标注数据。
针对现有技术存在的问题,本发明通过以下实施例进行了改进,以在几乎不增加模型计算量以及不需要任何额外数据标注的情况下,极大地提高了模型对各种场景中不同车位类型的停车区域进行识别的鲁棒性。
实施例一
参照图1所示,本实施例提供一种车位检测模型训练方法,包括:
步骤S1:获取车位样本图像及对应的特征标签,特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
步骤S2:根据车位样本图像,经由车位检测模型,输出车位检测训练结果,车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
步骤S3:基于车位检测训练结果和特征标签,经由损失函数,生成损失值,对车位检测模型进行更新直至收敛,以得到训练好的车位检测模型。
具体地,为了使车位检测模型不仅能够识别出常规的车位类型,还能够识别出上述特殊的车位类型,因此车位检测模型需充分考虑车位内、外的信息,本发明利用现有的车位样本图像数据,无需在该图像数据上进行额外的数据标注,除了预测出车位的四个角点和车位内区域,还能预测出车位四边形,即由四个角点围成的车位四边形,通过车位四边形预测框识别出车位内区域和车位外区域,即四边形预测框内的区域为车位内区域,预测框外的区域为车位外区域,因此车位预测模型充分学习到车位内、外区域对应的正、负样本分布,能够将特殊车位类型中包括的砖线或者草坪预测为车位外区域,获得准确的预测结果,从而不会导致模型预测失效。且,因为没有额外的数据标注,该预测模型网络结构的输入层不变,模型的计算量也不会加大,因此,本发明在几乎不增加计算量以及不需要任何额外数据标注下,极大提高了车位检测模型对各种车位类型的停车区域进行识别的鲁棒性,同时还节省了数据标注需要耗费的大量人力、物力资源。
损失函数包括:角点距离损失函数、车位四边形距离损失函数和车位内区域损失函数,对应地,损失值包括:车位四边形距离损失函数的四边形特征损失值,角点距离损失函数的角点特征损失值,车位内区域损失函数的交叉熵损失值。
其中,生成角点特征损失值,包括:根据预测的四个角点坐标和四个角点坐标真值,计算角点特征损失值。
具体地,构建角点距离损失函数Loss11,可采用回归损失函数smooth L1 loss计算,即loss11=L1(pred1,target1),pred1为角点训练结果,target1为四个角点坐标真值。loss11的具体函数式表示为:loss11=L1(pred_points-gt_points),其中,pred_points为预测的四个角点坐标,gt_points为四个角点坐标真值。
其中,生成四边形特征损失值,包括:
由四个角点坐标围成四边形预测框,计算四边形预测框与四边形真值之间的交并比;
计算车位内区域训练结果与车位内区域真值之间的距离损失值;
将距离损失值与交并比之和作为四边形特征损失值。
具体地,构建车位四边形距离损失函数Loss12,即loss12=L2(pred2,target2),pred2为车位四边形训练结果,target2为四个角点坐标真值围成的四边形真值。loss12具体函数式表示为:loss12=L2(pred_map-gt_map)+IOU_loss(A,B),其中,L2(pred_map-gt_map)为计算车位内区域训练结果与车位内区域真值之间差值的损失函数,A为预测的四个角点坐标围成的四边形预测框,B为实际标注框。IOU_loss(A,B)在数学模型上的表现形式如图3所示,以表示四边形预测框与实际标注框之间的重合度,车位四边形距离损失函数采用距离损失值与IOU_loss损失函数的交并比之和作为其函数损失值,有效提升了四边形预测框回归的鲁棒性。
本实施例中,基于车位内区域真值,对车位样本图像采用像素点标签标注,其中,将车位内区域样本像素的置信度标注为1,将车位内区域区域外样本像素的置信度标注为0。
具体地,图4中标①虚线框所示区域,即为样本像素的置信度标注为1的区域;虚线框所示区域外的区域,即为样本像素的置信度标注为0,这样能使预测到的角点连接成的矩形区域为车位内区域,对于特殊的车位类型,避免预测结果出现有砖线或者草坪的情况。
对应地,生成交叉熵损失值,包括:根据预测的车位内区域和车位内区域真值,计算交叉熵损失值。
具体地,采用交叉熵损失函数构建车位内区域损失函数Loss13,即loss13=L3(pred3,target3),pred3为车位内区域训练结果,target3为车位内区域真值。loss13具体函数式表示为:loss13=Cross Entropy(pred_map,gt_map)。
最终的损失函数Loss1为:
Loss1=w1·loss11+w2·loss12+w3·loss13;
训练车位检测模型时,基于车位四边形距离损失函数Loss12的四边形特征损失值、车位内区域损失函数Loss13的交叉熵损失值以及角点距离损失函数Loss11的角点特征损失值作为损失函数Loss1的总损失函数值,进行反向传播训练,对各损失函数对应的权重参数(w1,w2,w3)进行更新,上述各pred接近相应的target时,且使损失函数Loss1的损失值小于预设的阈值时,则认为损失函数收敛,训练完成,以得到训练好的车位检测模型。本实施例中,最后训练好的车位检测模型损失函数的权重参数的值为w1=1,w2=1,w3=2。
调整现有车位检测模型的网络结构以对应上述改进点(该车位检测模型为基于R-CNN系列的神经网络模型,用于对图像进行目标检测),如图5所示,虚线框为添加的分支结构,以针对特殊车位类型的车位内区域的预测,添加分支结构后的该车位检测模型包括:特征提取层和网络输出层,对应地,训练该车位检测模型,具体包括:将车位样本图像输入特征提取层;特征提取层提取车位样本图像的样本特征;网络输出层根据样本特征输出车位检测训练结果。
实施例二
参照图6所示,本实施例提供一种车位检测方法,包括:
步骤A1:获取鱼眼相机拍摄的车位环视鱼眼图;
步骤A2:将车位环视鱼眼图输入至训练好的车位检测模型,得到车位检测模型输出的车位检测框,车位检测框即为车辆沿泊车路径泊车入位的车位内区域,其中,训练好的车位检测模型通过如实施例一所述的车位检测模型训练方法训练得到。
本实施例中,基于训练好的车位检测模型能够对各种车位类型的停车区域进行有效识别,通过车载鱼眼相机拍摄的车位环视鱼眼图,输入至车位检测模型,以得到输出的车位检测框,规划泊车路径,控制车辆沿泊车路径移动至该车位检测框,以完成泊车入位。
实施例三
基于与上述方法相同的发明思路,参照图7所示,本实施例提供一种车位检测模型训练装置,包括:
样本图像获取模块21,用于获取车位样本图像及对应的特征标签,特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
训练结果获取模块22,用于根据车位样本图像,经由车位检测模型,输出车位检测训练结果,车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
车位检测模型训练模块23,用于基于车位检测训练结果和特征标签,经由损失函数,生成损失值,对车位检测模型进行更新直至收敛,以得到训练好的车位检测模型。
车位检测模型训练模块23具体包括:第一损失值生成单元,用于生成车位四边形距离损失函数的四边形特征损失值;第二损失值生成单元,用于生成角点距离损失函数的角点特征损失值;第三损失值生成单元,用于生成车位内区域损失函数的交叉熵损失值。
其中,第一损失值生成单元具体包括:第一计算子单元,用于由四个角点坐标围成四边形预测框,计算四边形预测框与四边形真值之间的交并比;第二计算子单元,用于计算车位内区域训练结果与车位内区域真值之间的距离损失值;第三计算子单元,用于将距离损失值与交并比之和作为四边形特征损失值。
第二损失值生成单元具体用于根据预测的四个角点坐标和四个角点坐标真值,计算角点特征损失值。
第三损失值生成单元具体用于根据预测的车位内区域和车位内区域真值,计算交叉熵损失值。
样本图像获取模块21还用于基于车位内区域真值,对车位样本图像采用像素点标签标注,其中,将车位内区域样本像素的置信度标注为1,将车位内区域区域外样本像素的置信度标注为0。
车位检测模型训练模块23还用于基于车位四边形距离损失函数的四边形特征损失值、车位内区域损失函数的交叉熵损失值以及角点距离损失函数的角点特征损失值作为损失函数的总损失函数值,进行反向传播训练,对各损失函数对应的权重参数进行更新,最后得到车位检测模型。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,所以相关之处参见方法实施例的部分说明即可,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,在实施例中的各功能模块可以全部集成在一个处理器中,也可以是各模块分别单独作为一个器件,也可以两个或两个以上模块集成在一个器件中;各实施例中的各功能模块既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
实施例四
参照图8所示,本实施例提供一种电子设备,该电子设备包括:处理器310(processor)、通信接口320(Communications Interface)、存储器330(memory)和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,处理器310执行如实施例一所述的车位检测模型训练方法,该方法包括:
获取车位样本图像及对应的特征标签,特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
根据车位样本图像,经由车位检测模型,输出车位检测训练结果,车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
基于车位检测训练结果和特征标签,经由损失函数,生成损失值,对车位检测模型进行更新直至收敛,以得到训练好的车位检测模型。
或者,执行如实施例二所述的车位检测方法,该方法包括:
获取鱼眼相机拍摄的车位环视鱼眼图;
将车位环视鱼眼图输入至训练好的车位检测模型,得到车位检测模型输出的车位检测框,车位检测框即为车辆沿泊车路径泊车入位的车位内区域,其中,训练好的车位检测模型通过如实施例一所述车位检测模型训练方法训练得到。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行如实施例一所述的车位检测模型训练方法,该方法包括:
获取车位样本图像及对应的特征标签,特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
根据车位样本图像,经由车位检测模型,输出车位检测训练结果,车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
基于车位检测训练结果和特征标签,经由损失函数,生成损失值,对车位检测模型进行更新直至收敛,以得到训练好的车位检测模型。
或者,执行如实施例二所述的车位检测方法,该方法包括:
获取鱼眼相机拍摄的车位环视鱼眼图;
将车位环视鱼眼图输入至训练好的车位检测模型,得到车位检测模型输出的车位检测框,车位检测框即为车辆沿泊车路径泊车入位的车位内区域,其中,训练好的车位检测模型通过如实施例一所述车位检测模型训练方法训练得到。
实施例五
本实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如实施例一所述的车位检测模型训练方法,该方法包括:
获取车位样本图像及对应的特征标签,特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
根据车位样本图像,经由车位检测模型,输出车位检测训练结果,车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
基于车位检测训练结果和特征标签,经由损失函数,生成损失值,对车位检测模型进行更新直至收敛,以得到训练好的车位检测模型。
或者,执行如实施例二所述的车位检测方法,该方法包括:
获取鱼眼相机拍摄的车位环视鱼眼图;
将车位环视鱼眼图输入至训练好的车位检测模型,得到车位检测模型输出的车位检测框,车位检测框即为车辆沿泊车路径泊车入位的车位内区域,其中,训练好的车位检测模型通过如实施例一所述车位检测模型训练方法训练得到。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程方法商品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程方法商品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程方法商品或者方法中还存在另外的相同要素。
以上仅为本发明的实施例而已,并不用于限制本发明。虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (10)

1.一种车位检测模型训练方法,其特征在于,包括:
获取车位样本图像及对应的特征标签,所述特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
根据所述车位样本图像,经由车位检测模型,输出车位检测训练结果,所述车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
基于所述车位检测训练结果和所述特征标签,经由损失函数,生成损失值,对所述车位检测模型进行更新直至收敛,以得到训练好的所述车位检测模型。
2.根据权利要求1所述的车位检测模型训练方法,其特征在于,所述损失函数包括:角点距离损失函数、车位四边形距离损失函数和车位内区域损失函数,对应地,所述损失值包括:所述车位四边形距离损失函数的四边形特征损失值,所述角点距离损失函数的角点特征损失值,所述车位内区域损失函数的交叉熵损失值。
3.根据权利要求1所述的车位检测模型训练方法,其特征在于,生成所述损失值,包括:
由四个角点坐标围成四边形预测框,计算所述四边形预测框与四边形真值之间的交并比;
计算车位内区域训练结果与车位内区域真值之间的距离损失值;
将所述距离损失值与所述交并比之和作为四边形特征损失值。
4.根据权利要求1所述的车位检测模型训练方法,其特征在于,基于所述车位内区域真值,对所述车位样本图像采用像素点标签标注,其中,将所述车位内区域样本像素的置信度标注为1,将所述车位内区域区域外样本像素的置信度标注为0;对应地,
生成所述损失值,包括:根据预测的车位内区域和车位内区域真值,计算交叉熵损失值。
5.根据权利要求1所述的车位检测模型训练方法,其特征在于,生成所述损失值,包括:根据预测的四个角点坐标和四个角点坐标真值,计算角点特征损失值。
6.根据权利要求2所述的车位检测模型训练方法,其特征在于,还包括:训练所述车位检测模型时,基于所述车位四边形距离损失函数的四边形特征损失值、所述车位内区域损失函数的交叉熵损失值以及所述角点距离损失函数的角点特征损失值作为所述损失函数的总损失函数值,进行反向传播训练,对各损失函数对应的权重参数进行更新,最后得到所述车位检测模型。
7.一种车位检测方法,其特征在于,包括:
获取鱼眼相机拍摄的车位环视鱼眼图;
将所述车位环视鱼眼图输入至训练好的车位检测模型,得到所述车位检测模型输出的车位检测框,所述车位检测框即为车辆沿泊车路径泊车入位的车位内区域,其中,所述训练好的车位检测模型通过如权利要求1~6任一项所述的车位检测模型训练方法训练得到。
8.一种车位检测模型训练装置,其特征在于,包括:
样本图像获取模块,用于获取车位样本图像及对应的特征标签,所述特征标签包括:四个角点坐标真值、四个角点坐标真值围成的四边形真值和车位内区域真值;
训练结果获取模块,用于根据所述车位样本图像,经由车位检测模型,输出车位检测训练结果,所述车位检测训练结果包括预测的四个角点坐标、由四个角点围成的车位四边形以及车位内区域;
车位检测模型训练模块,用于基于所述车位检测训练结果和所述特征标签,经由损失函数,生成损失值,对所述车位检测模型进行更新直至收敛,以得到训练好的所述车位检测模型。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一项所述的车位检测模型训练方法,或实现如权利要求7所述的车位检测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的车位检测模型训练方法,或实现如权利要求7所述的车位检测方法。
CN202310532626.6A 2023-05-11 2023-05-11 车位检测模型训练方法、车位检测方法、训练装置及设备 Pending CN116778450A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310532626.6A CN116778450A (zh) 2023-05-11 2023-05-11 车位检测模型训练方法、车位检测方法、训练装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310532626.6A CN116778450A (zh) 2023-05-11 2023-05-11 车位检测模型训练方法、车位检测方法、训练装置及设备

Publications (1)

Publication Number Publication Date
CN116778450A true CN116778450A (zh) 2023-09-19

Family

ID=87988607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310532626.6A Pending CN116778450A (zh) 2023-05-11 2023-05-11 车位检测模型训练方法、车位检测方法、训练装置及设备

Country Status (1)

Country Link
CN (1) CN116778450A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115148047A (zh) * 2022-07-25 2022-10-04 中汽创智科技有限公司 一种车位检测方法及装置
CN117576645A (zh) * 2024-01-16 2024-02-20 深圳市欧冶半导体有限公司 基于bev视角的车位检测方法、装置和计算机设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115148047A (zh) * 2022-07-25 2022-10-04 中汽创智科技有限公司 一种车位检测方法及装置
CN115148047B (zh) * 2022-07-25 2024-05-24 中汽创智科技有限公司 一种车位检测方法及装置
CN117576645A (zh) * 2024-01-16 2024-02-20 深圳市欧冶半导体有限公司 基于bev视角的车位检测方法、装置和计算机设备
CN117576645B (zh) * 2024-01-16 2024-03-22 深圳市欧冶半导体有限公司 基于bev视角的车位检测方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
CN116778450A (zh) 车位检测模型训练方法、车位检测方法、训练装置及设备
CN112793564B (zh) 一种基于全景鸟瞰图和深度学习的自主泊车辅助系统
JP7204326B2 (ja) 情報処理装置及びその制御方法及びプログラム、並びに、車両の運転支援システム
CN110497901A (zh) 一种基于机器人vslam技术的泊车位自动搜索方法和系统
JP2020052694A (ja) 物体検出装置、物体検出方法及び物体検出用コンピュータプログラム
CN110758246A (zh) 一种自动泊车方法及装置
CN112435300B (zh) 定位方法及装置
CN111376895A (zh) 一种环视泊车感知方法、装置、自动泊车系统和车辆
CN111860072A (zh) 泊车控制方法、装置、计算机设备及计算机可读存储介质
CN111381585B (zh) 一种构建占据栅格地图的方法及其装置、相关设备
CN115830265A (zh) 一种基于激光雷达的自动驾驶运动障碍物分割方法
CN111553242B (zh) 用于预测驾驶行为的生成对抗网络的训练方法和电子设备
CN115493602A (zh) 语义地图构建方法、装置及电子设备、存储介质
CN108364320A (zh) 摄像头标定方法、终端设备及计算机可读存储介质
CN113963061A (zh) 路沿分布信息获取方法、装置、电子设备和存储介质
CN112179359A (zh) 一种地图匹配方法、装置、电子设备和存储介质
CN116664498A (zh) 车位检测模型的训练方法、车位检测方法、装置和设备
CN114821513B (zh) 一种基于多层网络的图像处理方法及装置、电子设备
CN113190564A (zh) 地图更新系统、方法及设备
CN113624223B (zh) 一种室内停车场地图构建方法及装置
CN113256711B (zh) 一种单目相机的位姿估计方法及系统
CN114379544A (zh) 一种基于多传感器前融合的自动泊车系统、方法及装置
CN115147549A (zh) 基于多源数据融合的城市三维模型生成及更新方法
CN114463717A (zh) 一种障碍物位置判断方法、系统、电子设备及存储介质
CN112308904A (zh) 一种基于视觉的建图方法、装置及车载终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination