CN111832459A - 目标检测方法、装置、设备以及存储介质 - Google Patents
目标检测方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN111832459A CN111832459A CN202010634543.4A CN202010634543A CN111832459A CN 111832459 A CN111832459 A CN 111832459A CN 202010634543 A CN202010634543 A CN 202010634543A CN 111832459 A CN111832459 A CN 111832459A
- Authority
- CN
- China
- Prior art keywords
- target
- detected
- image
- external frame
- filtering condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 94
- 238000001914 filtration Methods 0.000 claims abstract description 145
- 238000000034 method Methods 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 19
- 239000000126 substance Substances 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 6
- 238000013135 deep learning Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种目标检测方法、装置、设备以及存储介质,涉及图像处理技术领域,尤其涉及人工智能、智能交通、智慧城市、智慧零售、计算机视觉、深度学习等技术领域。具体实现方案为:对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框;根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件;基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。根据本申请的技术提高了目标检测的准确率,进而提高了目标跟踪的准确率。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及人工智能、智能交通、智慧城市、智慧零售、计算机视觉、深度学习等技术领域。具体地,本申请提供一种目标检测方法、装置、设备以及存储介质。
背景技术
在智慧城市、智能交通、智慧零售等场景下需要对基于摄像头采集的视频流进行行人、车辆的跟踪,以根据跟踪目标的位置、身份、运动状态以及历史轨迹等信息感知用户习惯,预测用户行为趋势,为用户提供多样化、个性化的产品和服务。其中对视频流的目标跟踪准确率直接影响后续感知和预测操作的准确率。
发明内容
本公开提供了一种目标检测方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种目标检测方法,该方法包括:
对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框;
根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件;
基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
根据本公开的另一方面,提供了一种目标检测装置,包括:
目标检测模块,用于对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框;
条件确定模块,用于根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件;
外接框过滤模块,用于基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
根据本公开的又一方面,提供了一种电子设备,其中,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例中任一项所述的方法。
根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本申请实施例中任一项所述的方法。
根据本申请的技术提高了目标检测的准确率,进而提高了目标跟踪的准确率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的一种目标检测方法的流程图;
图2是本申请实施例提供的另一种目标检测方法的流程图;
图3是本申请实施例提供的又一种目标检测方法的流程图;
图4是本申请实施例提供的又一种目标检测方法的流程图;
图5是本申请实施例提供的又一种目标检测方法的流程图;
图6是本申请实施例提供的又一种目标检测方法的流程图;
图7是本申请实施例提供的一种待检测图像的划分示意图;
图8是本申请实施例提供的一种目标检测装置的结构示意图;
图9是根据本申请实施例的目标检测方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是本申请实施例提供的一种目标检测方法的流程图。本申请实施例可适用于对图像进行目标检测的情况。典型地,本申请实施例可适用于对视频流中的视频图像进行目标对象检测,以实现对目标对象进行运动轨迹跟踪的情况。该方法可以由一种目标检测装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本申请实施例提供的目标检测方法包括:
S110、对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框。
其中,待检测图像是指待进行目标对象检测的图像。该图像可以直接获取,也可以从视频流中抽取。
目标对象是指待检测的对象。在一个实施例中目标对象可以是行人,也可以车辆,还可以是其他待检测的对象。
外接框是指在待检测图像中标识目标对象所在区域的多边形。
可选地,对待检测图像进行目标对象检测的方法可以是任意目标检测方法,本实施例对此不做限定。
S120、根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件。
其中,图像位置是指外接框在待检测图像中的位置。
在一个实施例中,图像位置可以是待检测图像的上部分、中间部分或下部分。
目标过滤条件是指适用于外接框的过滤条件。该过滤条件是指过滤外接框的条件。
在一个实施例中目标过滤条件可以是阈值,也可是数值范围,还可以逻辑条件。
可选地,目标过滤条件关联的参数可以是外接框内图像的分辨率,也可以是外接框内图像的其他属性参数。
在一个实施例中,根据外接框在待检测图像中的图像位置,确定外接框的目标过滤条件,包括:
根据各外接框在待检测图像中的图像位置,确定各外接框的目标过滤条件。
也即,若外接框在待检测图像中的图像位置不同,则外接框的目标过滤条件也可能不同。
在一个实施例中,根据外接框在待检测图像中的图像位置,确定外接框的目标过滤条件,包括:
基于图像位置与预设过滤条件之间的映射关系,根据外接框在待检测图像中的图像位置,从预设过滤条件中确定外接框的目标过滤条件。
S130、基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
其中,剩余外接框是指经过过滤保留下来的外接框。
在一个实施例中,基于确定的目标过滤条件,对至少一个外接框进行过滤,包括:
利用确定的目标过滤条件,根据检测得到的外接框中图像的灰度信息,对至少一个外接框进行过滤。
本申请实施例通过根据外接框在待检测图像中的图像位置,确定外接框的目标过滤条件,并利用该目标过滤条件对检测得到的至少一个外接框进行过滤。因为位于待检测图像中不同图像位置的外接框内目标对象的图像信息不同,基于单一固定的过滤条件对外接框进行过滤,会导致误检和漏检的问题。而本申请实施例可以有效解决该问题,从而提高目标检测的准确率,进而提高目标跟踪的准确率。
图2是本申请实施例提供的另一种目标检测方法的流程图。本方案是在上述实施例的基础上,对步骤“根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件”的具体优化。参见图2,本申请实施例提供的目标检测方法包括:
S210、对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框。
S220、根据所述外接框在所述待检测图像中的图像位置,确定所述外接框内目标对象在所述图像位置处的细节丰富度。
其中,细节丰富度是指外接框内目标对象的图像细节的丰富程度。
S230、根据所述细节丰富度,确定所述外接框的目标过滤条件。
在一个实施例中,根据细节丰富度,确定外接框的目标过滤条件,包括:
若细节丰富度越高,则确定的目标过滤条件越严格;否则,确定的目标过滤条件越宽松。
S240、基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
本方案通过根据外接框内目标对象在图像位置处的细节丰富度的不同,确定不同的目标过滤条件,从而减少对细节丰富的外接框的误检,对细节较少的外接框的漏检。
图3是本申请实施例提供的又一种目标检测方法的流程图。本方案是在上述方案的基础上,对步骤“基于确定的目标过滤条件,对所述至少一个外接框进行过滤”的具体优化。参见图3,本申请实施例提供的目标检测方法包括:
S310、对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框。
S320、根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件。
S330、基于所述目标过滤条件,根据检测得到的所述外接框的置信度,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
其中,外接框的置信度反应的是外接框的准确度。
本方案通过基于目标过滤条件,根据检测得到的外接框的置信度,对至少一个外接框进行过滤。因为外接框的置信度反应的是外接框的准确度,所以根据外接框的置信度对至少一个外接框进行过滤,可以提高外接框的过滤准确率。
图4是本申请实施例提供的又一种目标检测方法的流程图。本方案是在上述方案的基础上,对上述方案的扩展。参见图4,本申请实施例提供的目标检测方法包括:
S410、对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框。
S420、根据检测得到的所述待检测图像的外接框信息,对相邻已检测图像关联的原过滤条件进行调整。
其中,相邻已检测图像是指与待检测图像相邻的已经进行了目标对象检测的图像。
在一个实施例中,若待检测图像是视频流中的当前帧图像,则相邻已检测图像是该视频流中的上一帧图像。
原过滤条件是指与相邻已检测图像关联的过滤条件。
在一个实施例中,根据检测得到的待检测图像的外接框信息,对相邻已检测图像关联的原过滤条件进行调整,包括:
比较待检测图像中外接框的置信度与相邻已检测图像中外接框的置信度;
根据比较结果,对原过滤条件进行调整。
比较待检测图像中外接框的置信度与相邻已检测图像中外接框的置信度,包括:
确定待检测图像中至少一个外接框的置信度平均值;
确定置信度平均值与原过滤条件关联的置信度中值的差值。
其中,置信度中值是指原过滤条件关联置信度阈值范围的中位数。
根据比较结果,对原过滤条件进行调整,包括:
根据确定的差值,对原过滤条件关联置信度阈值范围的最大值和最小值进行调整。
S430、将调整后的新过滤条件作为候选过滤条件。
S440、根据所述外接框在所述待检测图像中的图像位置,从所述候选过滤条件中确定所述外接框的目标过滤条件。
S450、基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
本方案对上述步骤的执行顺序不做限定。可选地,S420和S430可以先于S410执行。
本方案通过根据检测得到的待检测图像的外接框信息,对相邻已检测图像关联的原过滤条件进行调整;将调整后的新过滤条件作为候选过滤条件,从而使得候选过滤条件适用于待检测图像的应用场景,进而提高目标检测的准确率。
图5是本申请实施例提供的又一种目标检测方法的流程图。本方案是在上述方案的基础上,对上述方案的扩展。参见图5,本申请实施例提供的目标检测方法包括:
S510、对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框。
S520、根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件。
S530、基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
S540、匹配所述剩余外接框内的目标对象与已有轨迹中外接框内的目标对象。
S550、根据匹配结果,将所述剩余外接框加入已有轨迹,生成至少一条新轨迹。
其中,新轨迹是指加入剩余外接框后的轨迹。
S560、利用新轨迹中外接框的置信度,对所述至少一条新轨迹进行过滤,得到所述目标对象的跟踪轨迹。
在一个实施例中,利用新轨迹中外接框的置信度的平均值,对所述至少一条新轨迹进行过滤,得到所述目标对象的跟踪轨迹
本方案通过利用新轨迹中外接框的置信度,对所述至少一条新轨迹进行过滤,得到所述目标对象的跟踪轨迹,从而提高跟踪轨迹的准确率。
图6是本申请实施例提供的又一种目标检测方法的流程图。本方案是在上述方案的基础上,对上述方案的扩展。参见图6,本申请实施例提供的目标检测方法包括:
S610、对从实时视频流抽取得到的当前帧图像进行缩放和颜色值归一化处理,得到与模型训练过程统一的待检测图像。
S620、将待检测图像输入目标检测器模型,输出至少一个外接框。
在一个实施例中,每个外接框是包含目标对象的一个外接矩形,由左上顶点坐标(x,y)、矩形宽高(w,h)、目标对象类别c以及置信度conf来描述,其中(x,y,w,h)以像素为单位,c为一个范围在[1,N]之间的一个整数,conf为范围在[0,1]之间的一个小数。其中N可以根据实际需要设定。类别c用来表示该外接框内目标对象被识别为第c类物体。置信度描述了该外接框内目标对象属于类别c类物体的置信度,置信度越大则认为该外接框更可靠。
目标检测的目的在于获取摄像头当前图像中的所有目标对象的位置、尺寸、类别和置信度信息。
其中,目标检测器模型可以选择任意基于深度学习的方法,如SSD(直接多目标检测,Single Shot Multi Box Detector)模型、RefineDet(精细直接多目标检测,Single-Shot Refinement Neural Network for Object Detection)模型、MobileNet-SSD(基于针对移动端视觉应用的高效卷积神经网络的直接多目标检测,MobileNet based SingleShot Multi Box Detector)模型、YOLO(统一实时目标检测,You Only Look Once:Unified,Real-Time Object Detection)模型等。
S630、计算目标图像序列中外接框的置信度平均值,并依照如下公式计算待检测图像与相邻已检测图像之间的置信度差值:
confadjust=confT-(thl+thh)/2
其中,confT为目标图像序列中外接框的置信度平均值,thl为相邻已检测图像关联的原过滤条件中置信度阈值范围的最小值,thh为相邻已检测图像关联的原过滤条件中置信度阈值范围的最大值,thl<thh。
目标图像序列是指包括上述待检测图像在内的连续至少两帧图像。
S640、根据待检测图像与相邻已检测图像之间的置信度差值,确定适用于待检测图像的目标过滤条件。
具体计算公式如下:
thl′=thl+confadjust,thh′=thh+confadjust
其中thl′为目标过滤条件中置信度阈值范围的最小值,thh′为目标过滤条件中置信度阈值范围的最大值。
S650、根据外接框所在位置,从目标过滤条件关联置信度阈值范围中确定目标置信度阈值。
具体计算公式如下:
其中,y表示每个检测框底边的纵坐标,yl和yh是设置的两个纵坐标阈值,yl<yh,yl和yh均属于[0,him],him为待检测图像的高,thl′和thh′是目标过滤条件关联置信度阈值范围的最小值和最大值,thl′<thh′,thl′和thh′均属于[0,1。
yl,yh的设置将待检测图像被划分为三部分,划分后的效果参见图7。
S660、利用确定的目标置信度阈值,对检测得到的外接框进行过滤。
该步骤的目的在于利用动态阈值取代现有单一阈值的方法,使检测结果中更多有效目标得以保留,用于目标跟踪后续步骤中。
S670、利用轨迹与外接框内目标对象的外观特征相似度,形成外接框与轨迹之间的相似度矩阵,并利用匹配算法(如匈牙利算法等图匹配算法)对外接框与轨迹进行匹配,得到若干匹配对(外接框-轨迹)。
S680、将匹配对中的外接框归属于该匹配对中的轨迹,也即认为两者属于同一目标,并赋予统一轨迹标识。
该过程的目的在于找出属于同一目标对象的外接框和轨迹匹配对。
S690、利用轨迹置信度对得到的轨迹进行过,将剩余轨迹作为当前帧图像的跟踪结果,并对抽取的实时视频流的下一帧图像重复上述操作,直至视频流结束。
其中,轨迹置信度用于描述轨迹的可信程度。
在一个实施例中,轨迹置信度可以是轨迹内各帧图像所匹配检测框的置信度的平均值。
对于系统中存在记录却在一定时间内(超过若干图像帧)未与任何外接框所匹配上的轨迹标识,在系统中将其标记为离场,并不再参与轨迹匹配。
该步骤目的在于利用轨迹内多帧外接框的置信度对系统内轨迹进行二次过滤,保留多帧置信度更高的轨迹。
本方案对跟踪过程中外接框的过滤条件进行了空间和时间上的动态调整,在空间上用渐变阈值代替单一阈值;在时间上利用最近一段时间内目标对象置信度分布统计值来调整渐变阈值。与现有方案相比,本方案可以输出更多有效目标对象,减少目标对象的漏检和误检。其次,本方案利用轨迹多帧外接框的置信度平均统计值来对跟踪轨迹进行过滤,减少错误轨迹对跟踪结果带来的影响。
图8是本申请实施例提供的一种目标检测装置的结构示意图。参见图8,本申请实施例提供的目标检测装置800,包括:目标检测模块801、条件确定模块802和外接框过滤模块803。
其中,目标检测模块801,用于对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框;
条件确定模块802,用于根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件;
外接框过滤模块803,用于基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
本申请实施例通过根据外接框在待检测图像中的图像位置,确定外接框的目标过滤条件,并利用该目标过滤条件对检测得到的至少一个外接框进行过滤。因为位于待检测图像中不同图像位置的外接框内目标对象的图像信息不同,基于单一固定的过滤条件对外接框进行过滤,会导致误检和漏检的问题。而本申请实施例可以有效解决该问题,从而提高目标检测的准确率,进而提高目标跟踪的准确率。
进一步地,所述条件确定模块,包括:
丰富度确定单元,用于根据所述外接框在所述待检测图像中的图像位置,确定所述外接框内目标对象在所述图像位置处的细节丰富度;
条件确定单元,用于根据所述细节丰富度,确定所述外接框的目标过滤条件。
进一步地,所述外接框过滤模块,包括:
外接框过滤单元,用于基于所述目标过滤条件,根据检测得到的所述外接框的置信度,对所述至少一个外接框进行过滤。
进一步地,所述装置还包括:
条件更新模块,用于所述根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件之前,根据检测得到的所述待检测图像的外接框信息,对相邻已检测图像关联的原过滤条件进行调整;
候选确定模块,用于将调整后的新过滤条件作为候选过滤条件,以从所述候选过滤条件中确定所述目标过滤条件。
进一步地,所述条件更新模块,包括:
置信度比较单元,用于比较所述待检测图像中外接框的置信度与所述相邻已检测图像中外接框的置信度;
条件更新单元,用于根据比较结果,对所述原过滤条件进行调整。
进一步地,所述置信度比较单元具体用于:
确定所述待检测图像中至少一个外接框的置信度平均值;
计算所述置信度平均值与所述原过滤条件关联的置信度中值的差值;
其中所述置信度中值是指所述原过滤条件关联置信度阈值范围的中位数。
进一步地,所述条件更新单元具体用于:
根据确定的差值,对所述原过滤条件关联置信度阈值范围的最大值和最小值进行调整。
进一步地,所述装置还包括:
对象匹配模块,用于所述将剩余外接框作为所述目标对象的检测结果之后,匹配所述剩余外接框内的目标对象与已有轨迹中外接框内的目标对象;
轨迹生成模块,用于根据匹配结果,将所述剩余外接框加入已有轨迹,生成至少一条新轨迹;
轨迹过滤模块,用于利用新轨迹中外接框的置信度,对所述至少一条新轨迹进行过滤,得到所述目标对象的跟踪轨迹。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图9所示,是根据本申请实施例的目标检测方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的目标检测方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的目标检测方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的目标检测方法对应的程序指令/模块(例如,附图8所示的目标检测模块801、条件确定模块802和外接框过滤模块803)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的目标检测方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据目标检测电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至目标检测电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
目标检测方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与目标检测电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
根据本申请的技术提高了目标检测的准确率,进而提高了目标跟踪的准确率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (18)
1.一种目标检测方法,包括:
对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框;
根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件;
基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
2.根据权利要求1所述的方法,其中,所述根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件,包括:
根据所述外接框在所述待检测图像中的图像位置,确定所述外接框内目标对象在所述图像位置处的细节丰富度;
根据所述细节丰富度,确定所述外接框的目标过滤条件。
3.根据权利要求1或2所述的方法,其中,所述基于确定的目标过滤条件,对所述至少一个外接框进行过滤,包括:
基于所述目标过滤条件,根据检测得到的所述外接框的置信度,对所述至少一个外接框进行过滤。
4.根据权利要求1或2所述的方法,所述根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件之前,所述方法还包括:
根据检测得到的所述待检测图像的外接框信息,对相邻已检测图像关联的原过滤条件进行调整;
将调整后的新过滤条件作为候选过滤条件,以从所述候选过滤条件中确定所述目标过滤条件。
5.根据权利要求4所述的方法,其中,所述根据检测得到的所述待检测图像的外接框信息,对相邻已检测图像关联的原过滤条件进行调整,包括:
比较所述待检测图像中外接框的置信度与所述相邻已检测图像中外接框的置信度;
根据比较结果,对所述原过滤条件进行调整。
6.根据权利要求5所述的方法,其中,所述比较所述待检测图像中外接框的置信度与所述相邻已检测图像中外接框的置信度,包括:
确定所述待检测图像中至少一个外接框的置信度平均值;
计算所述置信度平均值与所述原过滤条件关联的置信度中值的差值;
其中所述置信度中值是指所述原过滤条件关联置信度阈值范围的中位数。
7.根据权利要求6所述的方法,其中,所述根据比较结果,对所述原过滤条件进行调整,包括:
根据确定的差值,对所述原过滤条件关联置信度阈值范围的最大值和最小值进行调整。
8.根据权利要求1或2所述的方法,所述将剩余外接框作为所述目标对象的检测结果之后,所述方法还包括:
匹配所述剩余外接框内的目标对象与已有轨迹中外接框内的目标对象;
根据匹配结果,将所述剩余外接框加入已有轨迹,生成至少一条新轨迹;
利用新轨迹中外接框的置信度,对所述至少一条新轨迹进行过滤,得到所述目标对象的跟踪轨迹。
9.一种目标检测装置,包括:
目标检测模块,用于对待检测图像进行目标对象检测,得到所述目标对象所在区域的至少一个外接框;
条件确定模块,用于根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件;
外接框过滤模块,用于基于确定的目标过滤条件,对所述至少一个外接框进行过滤,并将剩余外接框作为所述目标对象的检测结果。
10.根据权利要求9所述的装置,其中,所述条件确定模块,包括:
丰富度确定单元,用于根据所述外接框在所述待检测图像中的图像位置,确定所述外接框内目标对象在所述图像位置处的细节丰富度;
条件确定单元,用于根据所述细节丰富度,确定所述外接框的目标过滤条件。
11.根据权利要求9或10所述的装置,其中,所述外接框过滤模块,包括:
外接框过滤单元,用于基于所述目标过滤条件,根据检测得到的所述外接框的置信度,对所述至少一个外接框进行过滤。
12.根据权利要求9或10所述的装置,所述装置还包括:
条件更新模块,用于所述根据所述外接框在所述待检测图像中的图像位置,确定所述外接框的目标过滤条件之前,根据检测得到的所述待检测图像的外接框信息,对相邻已检测图像关联的原过滤条件进行调整;
候选确定模块,用于将调整后的新过滤条件作为候选过滤条件,以从所述候选过滤条件中确定所述目标过滤条件。
13.根据权利要求12所述的装置,其中,所述条件更新模块,包括:
置信度比较单元,用于比较所述待检测图像中外接框的置信度与所述相邻已检测图像中外接框的置信度;
条件更新单元,用于根据比较结果,对所述原过滤条件进行调整。
14.根据权利要求13所述的装置,其中,所述置信度比较单元具体用于:
确定所述待检测图像中至少一个外接框的置信度平均值;
计算所述置信度平均值与所述原过滤条件关联的置信度中值的差值;
其中所述置信度中值是指所述原过滤条件关联置信度阈值范围的中位数。
15.根据权利要求14所述的装置,其中,所述条件更新单元具体用于:
根据确定的差值,对所述原过滤条件关联置信度阈值范围的最大值和最小值进行调整。
16.根据权利要求9或10所述的装置,所述装置还包括:
对象匹配模块,用于所述将剩余外接框作为所述目标对象的检测结果之后,匹配所述剩余外接框内的目标对象与已有轨迹中外接框内的目标对象;
轨迹生成模块,用于根据匹配结果,将所述剩余外接框加入已有轨迹,生成至少一条新轨迹;
轨迹过滤模块,用于利用新轨迹中外接框的置信度,对所述至少一条新轨迹进行过滤,得到所述目标对象的跟踪轨迹。
17.一种电子设备,其中,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010634543.4A CN111832459A (zh) | 2020-07-02 | 2020-07-02 | 目标检测方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010634543.4A CN111832459A (zh) | 2020-07-02 | 2020-07-02 | 目标检测方法、装置、设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111832459A true CN111832459A (zh) | 2020-10-27 |
Family
ID=72900143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010634543.4A Withdrawn CN111832459A (zh) | 2020-07-02 | 2020-07-02 | 目标检测方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832459A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115661131A (zh) * | 2022-11-17 | 2023-01-31 | 菲特(天津)检测技术有限公司 | 一种图像识别方法、装置、电子设备及存储介质 |
-
2020
- 2020-07-02 CN CN202010634543.4A patent/CN111832459A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115661131A (zh) * | 2022-11-17 | 2023-01-31 | 菲特(天津)检测技术有限公司 | 一种图像识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220383535A1 (en) | Object Tracking Method and Device, Electronic Device, and Computer-Readable Storage Medium | |
CN110929639B (zh) | 用于确定图像中障碍物位置的方法、装置、设备和介质 | |
CN111079670B (zh) | 人脸识别方法、装置、终端和介质 | |
US8218818B2 (en) | Foreground object tracking | |
US8218819B2 (en) | Foreground object detection in a video surveillance system | |
CN112528786B (zh) | 车辆跟踪方法、装置及电子设备 | |
CN113691733B (zh) | 视频抖动检测方法、装置、电子设备和存储介质 | |
TWI668669B (zh) | 物件追蹤系統及方法 | |
CN111612820A (zh) | 多目标跟踪方法、特征提取模型的训练方法和装置 | |
CN112149636A (zh) | 用于检测目标物体的方法、装置、电子设备及存储介质 | |
CN110659600A (zh) | 物体检测方法、装置及设备 | |
CN111814633B (zh) | 陈列场景检测方法、装置、设备以及存储介质 | |
CN110968718A (zh) | 目标检测模型负样本挖掘方法、装置及电子设备 | |
CN113608663B (zh) | 一种基于深度学习和k-曲率法的指尖跟踪方法 | |
CN111814628B (zh) | 陈列立柜识别方法、装置、设备以及存储介质 | |
CN111815595A (zh) | 图像语义分割方法、装置、设备和可读存储介质 | |
CN111626263B (zh) | 一种视频感兴趣区域检测方法、装置、设备及介质 | |
CN111601013B (zh) | 用于处理视频帧的方法和装置 | |
CN112184837A (zh) | 一种图像检测方法、装置、电子设备及存储介质 | |
CN111191619A (zh) | 车道线虚线段的检测方法、装置、设备和可读存储介质 | |
CN111832459A (zh) | 目标检测方法、装置、设备以及存储介质 | |
CN110798681B (zh) | 成像设备的监测方法、装置和计算机设备 | |
CN111401248A (zh) | 一种天空区域的识别方法、装置、电子设备及存储介质 | |
CN113449148A (zh) | 视频分类方法、装置、电子设备及存储介质 | |
CN112085002A (zh) | 人像分割方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201027 |