CN112084919A - 目标物检测方法、装置、车辆及存储介质 - Google Patents

目标物检测方法、装置、车辆及存储介质 Download PDF

Info

Publication number
CN112084919A
CN112084919A CN202010898757.2A CN202010898757A CN112084919A CN 112084919 A CN112084919 A CN 112084919A CN 202010898757 A CN202010898757 A CN 202010898757A CN 112084919 A CN112084919 A CN 112084919A
Authority
CN
China
Prior art keywords
target object
image
detection model
vehicle
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010898757.2A
Other languages
English (en)
Inventor
易虹
吴安飞
陈利强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xiaopeng Motors Technology Co Ltd
Original Assignee
Guangzhou Xiaopeng Motors Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Xiaopeng Motors Technology Co Ltd filed Critical Guangzhou Xiaopeng Motors Technology Co Ltd
Priority to CN202010898757.2A priority Critical patent/CN112084919A/zh
Publication of CN112084919A publication Critical patent/CN112084919A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请实施例公开了一种目标物检测方法、装置、车辆以及存储介质。所述方法包括:获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建;获取所述检测模型对所述图像进行图像识别后输出的目标物;若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注车辆内部的状况。通过上述方法,利用预先构建的基于元学习的检测模型能够高精度的识别车辆中的目标物,提高了目标物的识别率,此外,在检测到有危险目标物时,触发报警,提示驾驶员关注车辆内部的状况,可以减少交通事故的发生。

Description

目标物检测方法、装置、车辆及存储介质
技术领域
本申请涉及智能汽车技术领域,更具体地,涉及一种目标物检测方法、装置、车辆及存储介质。
背景技术
随着计算机视觉技术的发展,以及自动驾驶和车内智能应用场景的普及,车辆使用摄像头进行目标物识别的需求越来越多,比如:车内乘员识别,驾驶员眼球追踪和表情识别等等。在相关的,目标物的检测方法中,对目标物的识别率还有待提高。
发明内容
鉴于上述问题,本申请提出了一种目标物检测方法、装置、车辆以及存储介质,以改善上述问题。
第一方面,本申请提供了一种目标物检测方法,所述方法包括:获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建;获取所述检测模型对所述图像进行图像识别后输出的目标物;若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。
第二方面,本申请提供了一种目标物检测装置,所述装置包括:图像输入单元,用于获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建;目标物获取单元,用于获取所述检测模型对所述图像进行图像识别后输出的目标物;报警单元,用于若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。
第三方面,本申请提供了一种车辆,包括一个或多个处理器以及存储器;一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的方法。
第四方面,本申请提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述的方法。
本申请提供的一种目标物检测方法、装置、车辆以及存储介质,首先获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建,然后获取检测模型对图像进行图像识别后输出的目标物,如果目标物中有危险目标物,则触发报警,以提示驾驶员关注车辆内部的状况。通过上述方法,利用预先构建的基于元学习的检测模型能够高精度的识别车辆中的目标物,提高了目标物的识别率,此外,在检测到有危险目标物时,触发报警,提示驾驶员关注车辆内部的状况,可以减少交通事故的发生。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请提出的一种目标物检测方法的流程图;
图2示出了本申请提出的一种目标物检测方法中的网格尺划分的示意图;
图3示出了本申请提出的另一种目标物检测方法的流程图;
图4示出了本申请提出的再一种目标物检测方法的流程图;
图5示出了本申请提出的又一种目标物检测方法的流程图;
图6示出了本申请提出的一种目标物检测装置的结构框图;
图7示出了本申请提出的又一种目标物检测装置的结构框图;
图8示出了本申请的用于执行根据本申请实施例的目标物检测方法的车辆的结构框图;
图9是本申请实施例的用于保存或者携带实现根据本申请实施例的目标物检测方法的程序代码的存储介质。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着计算机视觉技术的发展,以及自动驾驶和车内智能应用场景的普及,车辆使用摄像头进行目标物识别的需求越来越多,比如:车内乘员识别,驾驶员眼球追踪和表情识别等等。
而发明人在对相关的目标物检测方法的研究中发现,相关的目标物检测方法在识别目标物时,对目标物的识别率还有待提高。
因此,发明人提出了本申请中的首先获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建,然后获取检测模型对图像进行图像识别后输出的目标物,如果目标物中有危险目标物,则触发报警,以提示驾驶员关注车辆内部的状况,利用预先构建的基于元学习的检测模型能够高精度的识别车辆中的目标物,提高了目标物的识别率,此外,在检测到有危险目标物时,触发报警,提示驾驶员关注车辆内部的状况,可以减少因驾驶员注意力分散而导致的交通事故的发生的方法、装置、车辆以及存储介质。
下面将结合附图具体描述本申请的各实施例。
请参阅图1,本申请提供的一种目标物检测方法,应用于车辆,所述方法包括:
步骤110:获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建。
其中,所述采集装置可以为安装在车辆内部的车载摄像头。可选的,所述采集装置还可以为智能手机和行车记录仪等。
作为一种方式,所述预先构建的检测模型可以在服务器中,也可以在车载系统中,其中所述车载系统可以为安装在车辆内部的具有数据处理功能的系统,进一步的,当通过安装在车辆内部的车载摄像头实时采集到车辆内部的图像时,可以将采集到的图像发送给预先建立的检测模型所在的服务器或者车载系统。
可选的,可以当检测到车辆开始启动时,采集装置开始采集的车辆内部的图像。
具体的,当检测到车辆的发动机启动时,采集装置开始实时采集车辆内部的图像,并将实时采集到的车辆内部的图像存储到车辆的存储区域中,当需要获取采集装置采集的图像时,可以从存储区域中读取采集装置采集的车辆内部的图像。
步骤120:获取所述检测模型对所述图像进行图像识别后输出的目标物。
其中,目标物可以理解为需要识别出的物体,可选的,目标物可以为人或者其他物体。作为一种方式,所述目标物可以由检测模型根据提取到的输入的图像所包括的特征信息识别出。
可选的,当将车辆内部的图像输入到检测模型中后,检测模型对输入的车辆内部的图像进行了粗、中和细网格划分,以便分别实现对图像中的大尺寸物体、中尺寸物体和小尺寸物体的预测。比如,假如输入的图像的尺寸为416*416,那么得到粗、中和细网格的尺寸可以分别为13*13、26*26和52*52,如图2所示。
具体的,可以将输入的图像划分为S*S个网格,每个网格生成B个边界框,每个边界框预测6个值,分别为:位置信息(x,y,w,h)、置信度和角度。其中,(x,y)表示边界框对于网格中的坐标,(w,h)是边界框相对于整张图像的高度和宽度,将每个边界框根据类别置信度预测一个目标物的类别信息。
进一步的,检测模型可以通过上述方式输出图像中所包括的每一个目标物。进而车辆可以从服务器中获取检测模型对图像进行图像识别后输出的目标物。
步骤130:若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。
作为一种方式,当车辆获取到检测模型根据提取到的图像的特征信息输出图像中的目标物为危险目标物时,触发报警,其中,报警的方式可以包括通过语音提示、文字提醒以及亮灯提醒等方法。
具体的,通过语音提示的方式进行报警,可以为向FM播放器或者音乐播放器发送触发指令,使所述FM播放器或者音乐播放器对当前车辆内部的状况进行播报。其中,所述触发指令,可以为开启FM播放器或者音乐播放器,并播放对应的音频。进一步的,所述对应的音频可以为FM播放器或者音乐播放器中预先存储的提醒音频。
本实施例提供的一种目标物检测方法,首先获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建,然后获取检测模型对图像进行图像识别后输出的目标物,如果目标物中有危险目标物,则触发报警,以提示驾驶员关注车辆内部的状况。通过上述方法,利用预先构建的基于元学习的检测模型能够高精度的识别车辆中的目标物,提高了目标物的识别率,此外,在检测到有危险目标物时,触发报警,提示驾驶员关注车辆内部的状况,可以减少交通事故的发生。
请参阅图3,本申请提供的一种目标物检测方法,应用于车辆,所述方法包括:
步骤210:构建检测模型。
作为一种方式,所述构建检测模型的步骤包括:获取预先通过所述采集装置采集到的指定数量的车辆内部的图像;对所述图像进行标定,将所述图像中具有相同语义的图像划分为一类,得到标定后的图像;将所述标定后的图像按比例划分为训练集图像、测试集图像和验证集图像,其中,所述训练集图像、测试集图像和验证集图像所包括的图像的种类不同;将所述训练集图像输入到初始检测模型中,对所述初始检测模型进行训练;将所述测试集图像和所述验证集图像输入到训练后的初始检测模型中,得到目标物识别率的损失函数,基于所述损失函数对所述训练后的初始检测模型进行多次模型参数调整,得到目标物识别率最高的检测模型,将所述目标物识别率最高的检测模型作为所述预先构建的检测模型,其中,所述损失函数的表达式为loss=coordErr+iouErr+clsErr,其中,loss表示损失函数,coordErr表示坐标损失函数,iouErr表示置信度损失函数,claErr表示类别损失函数。
可选的,上述指定数量的车辆内部的图片可以为采集的小样本图片,其中小样本图片可以为采集的图片的样本容量小于或等于30。
可选的,可以利用标定工具对采集的指定数量的车辆内部的图像进行人工标定。其中,标定工具可以为labelImage工具。具体的,在标定时,可以标定好图像中的目标物的种类,比如,采集设备采集到婴儿的图片,就标定为婴儿,采集到水杯的图片,就标定为水杯。通过上述方法,通过对采集装置预先采集到的指定数量的图像进行人工标定就是为了帮助衡量训练集在完成初始模型训练后输出的图像标定的正确率。
进一步的,可以将标定后的图像按一定比例划分为训练集图像、测试集图像以及验证集图像。比如,可以将标定后的图像中的65%的图像划分为训练集图像、25%的图像划分为测试集图像和剩下的10%的图像划分为验证集图像,或者可以将标定后的图像数据按照3:1:1的比例划分成训练集图像、测试集图像和验证集图像等。具体的比例可以根据模型训练要求进行划分。进一步的,训练集图像用来训练模型,测试集图像用来测试模型,验证集图像用来调整模型,其中的训练集图像、测试集图像和验证集图像都包括图片和标签。
可选的,将所述训练集图像输入到初始检测模型中,对所述初始检测模型进行训练的步骤,包括:将所述训练集图像通过M-way N-shot的方式输入到初始检测模型中,对所述初始检测模型进行训练,其中,M和N为正整数。
其中,M-way N-shot是元学习中常见的实验设置,M-way指训练数据中有M个类别,N-shot指每个类别下有N个样本被标记。比如,5-way 1-shot,就可以理解为训练数据中有5个类别,并且这5个类别中有1个样本被标记。可选的,所述初始检测模型可以为yolov3模型。
具体的,元学习的训练集中包含了很多的类别,每个类别中有多个样本。其中,元学习的训练集为采集的全部的数据集。在训练阶段,会在训练集中随机抽取M个类别,每个类别抽取N个样本(总共M*N个数据),构建一个元学习任务,作为模型的训练集输入;再从这M个类中剩余的数据中抽取一批样本作为模型的测试集。即要求模型从M*N个数据中学会如何区分这M个类别。
在训练过程中,每次训练都会采样得到不同元学习任务,所以总体来看,训练包含了不同的类别的组合,这种机制使得模型可以学会不同元学习任务中的共性部分,比如如何提取重要特征及比较样本相似等。通过这种学习机制训练得到的模型,在面对新的未见过的元学习任务时,也能较好地对目标物进行分类。示例性的,在进行模型训练时,可以只利用少量的不同类型的样本对检测模型进行训练,比如猫,狗之类的动物样本。当通过使用少量的猫、狗的样本训练好检测模型后,当将该模型运用到实际场景的时候,检测模型对于输入的图像中包括的车、树或者其他种类的物体都能识别。通过上述方法,减少了数据的使用,增加了运用场景,加快了模型训练的速度。
因此,可以将标定后的训练集图像按照5-way 1-shot的方式输入到初始yolov3模型中,对初始yolov3模型进行训练,得到训练后的yolov3模型,然后将测试集图像和验证集图像同时输入到训练后的yolov3模型中,对训练后的yolov3模型进行训练,以使训练后的yolov3模型能够学习到训练集图像、测试集图像和验证集图像的共同特征,比如图像的外轮廓、图像的颜色信息等。其中,训练集图像、测试集图像以及验证集图像所包括的目标物的种类可以不同,比如训练集图像中可以包括5个类别的目标物,而测试集图像中可以包括10个与训练集图像的类别不同的目标物等。
即,每一次训练时从标定后的训练集图像中选取5个种类的目标物图像,再从每个种类的目标物图像中选取1张目标物图像作为小样本训练集,输入到初始yolov3模型中,对该初始yolov3模型进行训练。比如,每一次输入五个种类的图像,比如狗,猫,鸟,婴儿,眼镜5个种类的图像,再从每个种类选取一张图像作为小样本训练集输入到初始模型中,对该初始yolov3模型进行训练。
进一步的,在训练检测模型的过程中可以随机改变输入图像的尺寸,用多尺度输入的方式训练模型,用测试集图像的特征向量与训练集图像的特征向量一一计算相似度,得到检测模型的损失函数loss=coordErr+iouErr+clsErr,其中,coordErr表示坐标损失函数,iouErr表示置信度损失函数,claErr表示分类损失函数,三种损失函数公式如下,
Figure BDA0002659194430000081
Figure BDA0002659194430000082
其中,进一步的,给coordErr设置权重λcoord=5,使用λnoobj=0.5来修正iouErr。进而可以通过损失函数对预测值和真实值之间的差距进行一定规则的计算,然后经过反向传播求取梯度,基于所述损失函数检测模型进行K次迭代训练,其中,K值可以设置为任意值,比如K>1000,进而对检测模型进行权重更新,最终得到目标识别率最高的检测模型。
具体的,在训练模型时,随机选择一个测试图像集qc,一个包含相同c类目标物的训练图像集sc和另一个包含不同n类目标物的训练图像集sn来构建训练三元组(qc,sc,sn),其中c=n。在训练三元组的过程中,仅将训练图像集中的第c个类别的目标物标记为前景,而将所有其他的目标物视为背景。因此,该模型不仅学习匹配(qc,sn)两个图像集之间的相同类别的目标物,而且还可以区分(qc,sn)两个图像集之间的不同类别的目标物。但是,如果在训练时有大量的背景建议的图像通常会主导样本,尤其是带有负面支持的图像时。所以,在训练模型时需要进行正负样本平衡。对于前景建议和正训练样本(pf,sp),背景建议和正训练样本(pb,sp)和建议(前景或背景)和负训练样本(pb,sn),可以按1:2:1的比例来平衡正负样本平衡,并通过上述损失函数计算所选对的匹配损失。
进一步的,还可以将所述测试集图像和所述验证集图像输入到训练后的初始检测模型中,通过finetune的方式对所述训练后的初始检测模型进行多次模型参数调整,直至所述训练后的检测模型识别目标物的误差小于预设值,得到目标物识别率最高的检测模型,其中,调整的模型参数包括:dropout的比例、学习的速度以及模型结构的层数。
其中,finetune指对训练后的初始模型的进行微调是对已经成熟的框架和更大训练样本下已经训练好的模型的参数进行微调,使该模型能够适应当前场景,具体的,调整的内容可以包括:dropout的比例,学习learning-rate的速度以及算法结构的层数等等。
具体的,可以通过finetune的方式对训练后的初始检测模型的dropout的比例,学习learning-rate的速度以及算法结构的层数等参数进行调整,使该训练后的初始检测模型能够适应当前检测目标物的应用场景,直至该检测模型识别目标物的误差小于预先设置的误差范围时,停止调整,得到目标物识别率最高的检测模型。
具体的调整方式可以为,将初始检测模型原来用于单标签多分类的softmax层换成用于多标签多分类的逻辑回归层,通过finetune的方式对所述训练后的初始检测模型进行多次模型参数调整,当训练后的检测模型识别目标物的损失为合理较低值时,即可选择此时的参数作为检测模型的最终参数。其中,逻辑回归层主要用到sigmoid函数,该函数可以将输入约束在0到1的范围内,因此当一张图像经过特征提取后的某一类输出经过sigmoid函数约束后如果大于0.5,就表示属于该类。进一步的,在训练检测模型之前对检测模型的训练参数进行初始化设置,具体的,可以将最大迭代次数max_batches设为45000次,图片批处理大小设为64,初始学习率设为0.0001等。
步骤220:获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建。
步骤230:获取所述检测模型对所述图像进行图像识别后输出的目标物。
步骤240:若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。
步骤220、步骤230以及步骤240所包括的步骤的详细解释可以参照前述实施例中的对应步骤,这里不再赘述。
本实施例提供的一种目标物检测方法,构建检测模型,获取采集装置实时采集的车辆内部的图像,并将图像输入到检测模型中,然后根据获取到的检测模型对图像进行识别后输出的目标物,如果目标物中有危险目标物,则触发报警,以提示驾驶员关注车辆内部的状况。通过上述方法,使用小样本数据训练检测模型,减少了人工标定的工作量,进一步的,通过使用finetune的方式改变检测模型的参数,使得该检测模型能够一次性识别出目标物的位置和种类,提高了检测模型的目标物识别率。
请参阅图4,本申请提供的一种目标物检测方法,应用于车辆,所述方法包括:
步骤310:获取所述采集装置实时采集的图像。
步骤310所包括的步骤的详细解释可以参照前述实施例中的对应步骤,这里不再赘述。
步骤320:对所述图像进行图像处理,得到具有更高清晰度的图像。
作为一种方式,采集装置采集到的图像是不能直接使用的,因为会有曝光,噪音之类的问题,所以需要对采集装置采集到的图像进行图像处理。其中,所述对所述图像进行图像处理可以包括对所述图像进行去噪处理、对所述图像进行白平衡处理以及对所述图像进行截取处理等。进而通过对采集装置采集到的图像进行图像处理后,可以得到比原图像具有更少噪声、更合适的白平衡比例、更具有针对性的图像。进一步的,对原图像进行白平衡处理后,得到的图像可以比原图像具有更高的清晰度。
步骤330:将所述具有更高清晰度的图像输入预先构建的检测模型。
步骤340:获取所述检测模型对所述图像进行图像识别后输出的目标物。
步骤350:若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。
步骤330、步骤340及步骤350所包括的步骤的详细解释可以参照前述实施例中的对应步骤,这里不再赘述。
本实施例提供的一种目标物检测方法,获取采集装置实时采集的图像,对图像进行图像处理,得到具有更高清晰度的图像,将具有更高清晰度的图像输入预先构建的检测模型,获取检测模型对所述图像进行图像识别后输出的目标物,若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。通过上述方法,使得检测模型对具有更高清晰度的图像进行识别,可以缩短该检测模型识别所述图像的时间,进一步的,也可以提高该检测模型对目标物的识别率。
请参阅图5,本申请提供的一种目标物检测方法,应用于车辆,所述方法包括:
步骤410:获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建。
步骤420:获取所述检测模型对所述图像进行图像识别后输出的目标物。
步骤410以及步骤420所包括的步骤的详细解释可以参照前述实施例中的对应步骤,这里不再赘述。
步骤430:若所述目标物中包含有第一目标物,获取参考目标物的位置信息,所述参考目标物为所述车辆内部所包括的除第一目标物以外的目标物。
作为一种方式,所述第一目标物可以理解为当前应用场景中首先需要检测的目标物。比如在解决车内婴幼儿独自乘坐在后排可能遇到的危险的应用场景中,婴幼儿就可以作为第一目标物。
当检测到车辆内部所包括的目标物中有第一目标物时,再对在第一目标物指定范围内的目标物进行检测。
其中,可以根据不同目标物之间的位置信息关系来确定在第一目标物指定范围内的目标物。
具体的,可以获取检测模型输出的参考目标物在图像中的位置信息以及第一目标物在图像中的位置信息,然后通过参考目标物的位置信息与第一目标物的位置信息之间的关系,来确定在第一目标物指定范围内的目标物。
示例性的,当确定第一目标物为婴儿后,获取婴儿的位置信息,进一步的,可以获取除婴儿以外的物品的位置信息,然后根据婴儿与其他物品之间的位置信息关系,来确定在婴儿指定范围内的物品。
步骤440:将对应的位置信息与所述第一目标物的位置信息的差值在预设范围内的参考目标物作为第二目标物,对所述第二目标物进行图像识别,检测所述第二目标物中是否有危险目标物。
作为一种方式,所述预设范围可以理解为预先设置的不同目标物之间的位置信息的差值范围。进一步的,将获取到的多个参考目标物的位置信息分别与第一目标物的位置信息做差值运算,得到多个差值,判断所述多个差值是否满足预设差值范围,将对应的位置信息与所述第一目标物的位置信息的差值在预设范围内的参考目标物作为第二目标物。
通过上述方法确定好第二目标物后,车辆再对第二目标物进行图像识别,检测第二目标物中是否有危险目标物。
步骤450:若所述第二目标物中有危险目标物,触发报警,以提示驾驶员关注所述车辆内部的状况。
作为一种方式,所述若所述第二目标物中有危险目标物,触发报警,以提示驾驶员关注车辆内部的状况的步骤,包括:检测所述第二目标物所包括的目标物中是否有危险标志;若有所述危险标志,将所述第二目标物中与所述危险标志对应的目标物作为危险目标物,触发报警,以提示驾驶员关注车辆内部的状况。
其中,所述危险标志可以为第二目标物上带有的危险图案标志,比如水杯上会印刷有“小心烫手”的图案。进一步的,车辆可以检测第二目标物中是否有目标物具有危险标志,如果检测到有目标物具有危险标志,则确定该目标物可能会导致第一目标物处于危险中,因此,可以触发报警,以提示驾驶员关注车辆内部的情况。
示例性的,若检测到车辆的后排作为上只有单独的小孩且没有大人陪同时,可以着重小孩对周边的物体进行检测识别,若检测到小孩周围的水杯或者其他物品上有危险标志时,可以触发提醒驾驶员关注车辆的后排座位上的小孩。这在一定程度上可以减少驾驶员需时刻关注后排小孩而导致分神开车的风险,也保护了小孩的安全。
本实施例提供的一种目标物检测方法,获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建,获取所述检测模型对所述图像进行图像识别后输出的目标物,若所述目标物中包含有第一目标物,获取参考目标物的位置信息,所述参考目标物为所述车辆内部所包括的除第一目标物以外的目标物,将对应的位置信息与所述第一目标物的位置信息的差值在预设范围内的参考目标物作为第二目标物,对所述第二目标物进行图像识别,检测所述第二目标物中是否有危险目标物,若所述第二目标物中有危险目标物,触发报警,以提示驾驶员关注所述车辆内部的状况。通过上述方法,使得驾驶员可以及时关注到车辆内部的状况,进而可以减少因驾驶员过多关注车内状况而导致的交通事故的发生。
请参阅图6,本申请提供的一种目标物检测装置500,所述装置500包括图像输入单元510、目标物获取单元520以及报警单元530。
图像输入单元510,用于获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建。
具体的,所述图像输入单元用于获取所述采集装置实时采集的图像;对所述图像进行图像处理,得到具有更高清晰度的图像;将所述具有更高清晰度的图像输入预先构建的检测模型。
目标物获取单元520,用于获取所述检测模型对所述图像进行图像识别后输出的目标物。
报警单元530,用于若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。
所述报警单元530用于若所述目标物中包含有第一目标物,获取参考目标物的位置信息,所述参考目标物为所述车辆内部所包括的除第一目标物以外的目标物;将对应的位置信息与所述第一目标物的位置信息的差值在预设范围内的参考目标物作为第二目标物,对所述第二目标物进行图像识别,检测所述第二目标物中是否有危险目标物。若所述第二目标物中有危险目标物,触发报警,以提示驾驶员关注所述车辆内部的状况。
可选的,所述报警单元530还用于检测所述第二目标物所包括的目标物中是否有危险标志;若有所述危险标志,将所述第二目标物中与所述危险标志对应的目标物作为危险目标物,触发报警,以提示驾驶员关注所述车辆内部的状况。
如图7所示,所述装置500还包括:
模型构建单元540,用于获取预先通过所述采集装置采集到的指定数量的车辆内部的图像;对所述图像进行标定,得到标定后的图像;将所述标定后的图像划分为训练集图像、测试集图像和验证集图像;将所述训练集图像输入到初始检测模型中,对所述初始检测模型进行训练;将所述测试集图像和所述验证集图像输入到训练后的初始检测模型中,得到目标物识别率的损失函数,基于所述损失函数对所述训练后的初始检测模型进行多次模型参数调整,得到目标物识别率最高的检测模型,将所述目标物识别率最高的检测模型作为所述预先构建的检测模型。
其中,所述模型构建单元540还用于将所述训练集图像通过M-way N-shot的方式输入到初始检测模型中,对所述初始检测模型进行训练,其中,M和N为正整数。
进一步的,所述模型构建单元540还用于将所述测试集图像和所述验证集图像输入到训练后的初始检测模型中,通过finetune的方式对所述训练后的初始检测模型进行多次模型参数调整,直至所述训练后的检测模型识别目标物的误差小于预设值,得到目标物识别率最高的检测模型,其中,调整的模型参数包括:dropout的比例、学习的速度以及模型结构的层数。
需要说明的是,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
下面将结合图8对本申请提供的一种车辆进行说明。
请参阅图8,基于上述的目标物检测方法、装置,本申请实施例还提供的另一种可以执行前述目标物检测方法的车辆100。本申请中的车辆100可以包括相互耦合的一个或多个(图中仅示出一个)处理器102、存储器104以及无线模块106。其中,该存储器104中存储有可以执行前述实施例中内容的程序,而处理器102可以执行该存储器104中存储的程序。
其中,处理器102可以包括一个或者多个处理核。处理器102利用各种接口和线路连接整个车辆100内的各个部分,通过运行或执行存储在存储器104内的指令、程序、代码集或指令集,以及调用存储在存储器104内的数据,执行车辆100的各种功能和处理数据。可选地,处理器102可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器102中,单独通过一块通信芯片进行实现。
存储器104可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储车辆100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
所述无线模块106用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯,例如和音频播放设备进行通讯。所述无线模块106可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。所述无线模块106可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。
请参考图9,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质800包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。
综上所述,本申请提供的一种目标物检测方法、装置、车辆以及存储介质,首先获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建,然后获取检测模型对图像进行图像识别后输出的目标物,如果目标物中有危险目标物,则触发报警,以提示驾驶员关注车辆内部的状况。通过上述方法,利用预先构建的基于元学习的检测模型能够高精度的识别车辆中的目标物,提高了目标物的识别率,此外,在检测到有危险目标物时,触发报警,提示驾驶员关注车辆内部的状况,可以减少交通事故的发生。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种目标物检测方法,其特征在于,应用于车辆,所述方法包括:
获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建;
获取所述检测模型对所述图像进行图像识别后输出的目标物;
若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。
2.根据权利要求1所述的方法,其特征在于,所述将通过采集装置实时采集的所述车辆内部的图像输入预先构建的检测模型之前还包括:
获取预先通过所述采集装置采集到的指定数量的车辆内部的图像;
对所述图像进行标定,将所述图像中具有相同语义的图像划分为一类,得到标定后的图像;
将所述标定后的图像按比例划分为训练集图像、测试集图像和验证集图像,其中,所述训练集图像、测试集图像和验证集图像所包括的图像的种类不同;
将所述训练集图像输入到初始检测模型中,对所述初始检测模型进行训练;
将所述测试集图像和所述验证集图像输入到训练后的初始检测模型中,得到目标物识别率的损失函数,基于所述损失函数对所述训练后的初始检测模型进行多次模型参数调整,得到目标物识别率最高的检测模型,将所述目标物识别率最高的检测模型作为所述预先构建的检测模型,其中,所述损失函数的表达式为loss=coordErr+iouErr+clsErr,其中,loss表示损失函数,coordErr表示坐标损失函数,iouErr表示置信度损失函数,claErr表示类别损失函数。
3.根据权利要求2所述的方法,其特征在于,所述将所述训练集图像输入到初始检测模型中,对所述初始检测模型进行训练,包括:
将所述训练集图像通过M-way N-shot的方式输入到初始检测模型中,对所述初始检测模型进行训练,其中,M和N为正整数。
4.根据权利要求2所述的方法,其特征在于,所述将所述测试集图像和所述验证集图像输入到训练后的初始检测模型中,得到目标物识别率的损失函数,基于所述损失函数对所述训练后的初始检测模型进行多次模型参数调整,得到目标物识别率最高的检测模型,将所述目标物识别率最高的检测模型作为所述预先建立的检测模型,包括:
将所述测试集图像和所述验证集图像输入到训练后的初始检测模型中,通过finetune的方式对所述训练后的初始检测模型进行多次模型参数调整,直至所述训练后的检测模型识别目标物的误差小于预设值,得到目标物识别率最高的检测模型,其中,调整的模型参数包括:dropout的比例、学习的速度以及模型结构的层数。
5.根据权利要求1所述的方法,其特征在于,所述获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,包括:
获取所述采集装置实时采集的图像;
对所述图像进行图像处理,得到具有更高清晰度的图像;
将所述具有更高清晰度的图像输入预先构建的检测模型。
6.根据权利要求1所述的方法,其特征在于,所述若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况,包括:
若所述目标物中包含有第一目标物,获取参考目标物的位置信息,所述参考目标物为所述车辆内部所包括的除第一目标物以外的目标物;
将对应的位置信息与所述第一目标物的位置信息的差值在预设范围内的参考目标物作为第二目标物,对所述第二目标物进行图像识别,检测所述第二目标物中是否有危险目标物;
若所述第二目标物中有危险目标物,触发报警,以提示驾驶员关注所述车辆内部的状况。
7.根据权利要求6所述的方法,其特征在于,所述若所述第二目标物中有危险目标物,触发报警,以提示驾驶员关注所述车辆内部的状况,包括:
检测所述第二目标物所包括的目标物中是否有危险标志;
若有所述危险标志,将所述第二目标物中与所述危险标志对应的目标物作为危险目标物,触发报警,以提示驾驶员关注所述车辆内部的状况。
8.一种目标物检测装置,其特征在于,应用于车辆,所述装置包括:
图像输入单元,用于获取采集装置实时采集的所述车辆内部的图像,并将所述图像输入到预先构建的检测模型,所述检测模型为基于元学习的方式构建;
目标物获取单元,用于获取所述检测模型对所述图像进行图像识别后输出的目标物;
报警单元,用于若所述目标物中有危险目标物,则触发报警,以提示驾驶员关注所述车辆内部的状况。
9.一种车辆,其特征在于,包括一个或多个处理器以及存储器;
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行权利要求1-7任一所述的方法。
10.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-7任一所述的方法。
CN202010898757.2A 2020-08-31 2020-08-31 目标物检测方法、装置、车辆及存储介质 Pending CN112084919A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010898757.2A CN112084919A (zh) 2020-08-31 2020-08-31 目标物检测方法、装置、车辆及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010898757.2A CN112084919A (zh) 2020-08-31 2020-08-31 目标物检测方法、装置、车辆及存储介质

Publications (1)

Publication Number Publication Date
CN112084919A true CN112084919A (zh) 2020-12-15

Family

ID=73732285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010898757.2A Pending CN112084919A (zh) 2020-08-31 2020-08-31 目标物检测方法、装置、车辆及存储介质

Country Status (1)

Country Link
CN (1) CN112084919A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766388A (zh) * 2021-01-25 2021-05-07 深圳中兴网信科技有限公司 模型获取方法、电子设备和可读存储介质
CN113763747A (zh) * 2021-08-20 2021-12-07 的卢技术有限公司 一种基于图像识别的停车场智能找车方法和系统
CN115019112A (zh) * 2022-08-09 2022-09-06 威海凯思信息科技有限公司 基于图像的目标对象检测方法、装置及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102007373A (zh) * 2008-04-14 2011-04-06 丰田自动车株式会社 导航装置、操作部显示方法
CN105205454A (zh) * 2015-08-27 2015-12-30 深圳市国华识别科技开发有限公司 自动捕捉目标物的系统和方法
CN107170289A (zh) * 2017-06-01 2017-09-15 岭南师范学院 一种基于光学多目视觉车辆追尾预警系统
CN109635710A (zh) * 2018-12-06 2019-04-16 中山乐心电子有限公司 危险状态确定方法、装置、危险告警设备及储存介质
CN110399767A (zh) * 2017-08-10 2019-11-01 北京市商汤科技开发有限公司 车内人员危险动作识别方法和装置、电子设备、存储介质
CN110781968A (zh) * 2019-10-29 2020-02-11 中国人民解放军国防科技大学 一种基于塑性卷积神经网络的可扩展类别的图像识别方法
CN111079474A (zh) * 2018-10-19 2020-04-28 上海商汤智能科技有限公司 乘客状态分析方法和装置、车辆、电子设备、存储介质
CN111325285A (zh) * 2020-03-10 2020-06-23 五邑大学 基于自动机器学习的疲劳驾驶预测方法、装置及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102007373A (zh) * 2008-04-14 2011-04-06 丰田自动车株式会社 导航装置、操作部显示方法
CN105205454A (zh) * 2015-08-27 2015-12-30 深圳市国华识别科技开发有限公司 自动捕捉目标物的系统和方法
CN107170289A (zh) * 2017-06-01 2017-09-15 岭南师范学院 一种基于光学多目视觉车辆追尾预警系统
CN110399767A (zh) * 2017-08-10 2019-11-01 北京市商汤科技开发有限公司 车内人员危险动作识别方法和装置、电子设备、存储介质
CN111079474A (zh) * 2018-10-19 2020-04-28 上海商汤智能科技有限公司 乘客状态分析方法和装置、车辆、电子设备、存储介质
CN109635710A (zh) * 2018-12-06 2019-04-16 中山乐心电子有限公司 危险状态确定方法、装置、危险告警设备及储存介质
CN110781968A (zh) * 2019-10-29 2020-02-11 中国人民解放军国防科技大学 一种基于塑性卷积神经网络的可扩展类别的图像识别方法
CN111325285A (zh) * 2020-03-10 2020-06-23 五邑大学 基于自动机器学习的疲劳驾驶预测方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DANYANG CAO 等: "An improved object detection algorithm based on multi-scaled and deformable convolutional neural networks", HUMAN CENTRIC COMPUTING AND INFORMATION SCIENCES, 11 April 2020 (2020-04-11), pages 1 - 22, XP021275217, DOI: 10.1186/s13673-020-00219-9 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766388A (zh) * 2021-01-25 2021-05-07 深圳中兴网信科技有限公司 模型获取方法、电子设备和可读存储介质
CN113763747A (zh) * 2021-08-20 2021-12-07 的卢技术有限公司 一种基于图像识别的停车场智能找车方法和系统
CN115019112A (zh) * 2022-08-09 2022-09-06 威海凯思信息科技有限公司 基于图像的目标对象检测方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN112084919A (zh) 目标物检测方法、装置、车辆及存储介质
CN106778583B (zh) 基于卷积神经网络的车辆属性识别方法与装置
WO2019051941A1 (zh) 车型识别方法、装置、设备及计算机可读存储介质
US8792722B2 (en) Hand gesture detection
CN108776819A (zh) 一种目标识别方法、移动终端及计算机可读存储介质
CN110689043A (zh) 一种基于多重注意力机制的车辆细粒度识别方法及装置
CN107529659B (zh) 安全带佩戴检测方法、装置及电子设备
CN110580466A (zh) 婴儿踢被子行为识别方法、装置、计算机设备及存储介质
CN114820465A (zh) 点云检测模型训练方法、装置、电子设备及存储介质
Nieto et al. On creating vision‐based advanced driver assistance systems
CN110852358A (zh) 一种基于深度学习的车辆类型判别方法
CN111783654A (zh) 车辆重识别方法、装置及电子设备
CN113255444A (zh) 图像识别模型的训练方法、图像识别方法和装置
CN115512238A (zh) 病害区域的确定方法、装置、存储介质及电子装置
CN113903041A (zh) 文本识别方法、装置、车辆及存储介质
CN111860623A (zh) 基于改进ssd神经网络的统计树木数量的方法及系统
CN112509321A (zh) 一种基于无人机的城市复杂交通情景的驾驶控制方法、系统及可读存储介质
CN116823884A (zh) 多目标跟踪方法、系统、计算机设备及存储介质
CN116468931A (zh) 车辆部件检测方法、装置、终端及存储介质
CN115731451A (zh) 模型训练方法、装置、电子设备及存储介质
CN112907541B (zh) 一种手掌图像质量评估模型构建方法及装置
CN112232317B (zh) 用于目标朝向识别的目标检测方法及装置、设备及介质
CN114067401A (zh) 目标检测模型的训练及身份验证方法和装置
CN113420801A (zh) 一种网络模型的生成方法、装置、终端和存储介质
CN113095347A (zh) 基于深度学习的标记识别方法和训练方法及其系统和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination