CN110032916A - 一种检测目标物体的方法和装置 - Google Patents
一种检测目标物体的方法和装置 Download PDFInfo
- Publication number
- CN110032916A CN110032916A CN201810031047.2A CN201810031047A CN110032916A CN 110032916 A CN110032916 A CN 110032916A CN 201810031047 A CN201810031047 A CN 201810031047A CN 110032916 A CN110032916 A CN 110032916A
- Authority
- CN
- China
- Prior art keywords
- threshold value
- confidence threshold
- detection block
- detection
- confidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000001514 detection method Methods 0.000 claims abstract description 283
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000012360 testing method Methods 0.000 claims description 39
- 239000012141 concentrate Substances 0.000 claims description 34
- 238000007689 inspection Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000006854 communication Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
Abstract
本发明公开了一种检测目标物体的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从对待检测区域录制的历史视频文件中提取样本图片集;分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以得到不同置信度阈值下的样本数据集;通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域;在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。该实施方式能够提高检测目标物体时的准确度。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种检测目标物体的方法和装置。
背景技术
“物体检测”是利用计算机视觉技术判断图像或者视频序列中是否存在目标物体并给予定位的技术手段;其中,以“行人检测”应用最为广泛,在人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析和智能交通等领域均有重要作用。
现有的物体检测算法多种多样,但其输出结果时的方法基本相同:对于检测到的物体使用检测框进行定位,并分别计算该物体属于预设的多个类别中每一个类别的概率,取概率最大值作为该检测框中的物体为特定类别的置信度。在实际的检测过程中,若需要检测某一特定类别的目标物体,则额外设置一个置信度阈值,并保留该特定类别中置信度大于该置信度阈值的检测框作为最终的检测结果。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术的检测方法中,置信度阈值很难确定;若置信度阈值过小,则检测结果中可能误检到其他物体,造成结果不准确;若置信度阈值过大,则检测结果的个数会大大降低,同时漏检一些真正的目标物体,同样存在结果不准确的问题。
发明内容
有鉴于此,本发明实施例提供一种检测目标物体的方法和装置,能够提高检测目标物体时的准确度。
为实现上述目的,根据本发明实施例的一个方面,提供了一种检测目标物体的方法,包括:
从对待检测区域录制的历史视频文件中提取样本图片集;
分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以分别得到两种置信度阈值下的样本数据集;
通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域;
在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。
可选的,所述分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以分别得到两种置信度阈值下的样本数据集的步骤包括:
对所述样本图片集中的各帧图片进行目标物体检测,以得到检测结果;其中,所述检测结果包括目标物体的检测框和与该检测框对应的置信度;
若判定所述检测结果的置信度不小于所述置信度阈值,则将该检测结果加入所述样本数据集;
分别基于第一置信度阈值和第二置信度阈值重复上述步骤,以分别得到第一置信度阈值和第二置信度阈值下的样本数据集。
可选的,通过对比第一置信度阈值和第二置信度阈值下的所述样本数据集确定无效区域的步骤前,还包括:
将所述待检测区域划分为多个子区域;
所述通过对比第一置信度阈值和第二置信度阈值下的所述样本数据集确定无效区域的步骤包括:
分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于子区域的检测框集;
计算第一置信度阈值和第二置信度阈值下的检测框集中各检测框之间的重叠率,根据所述重叠率判断该子区域是否为有效区域;
重复上述过程直至遍历全部子区域,将所述待检测区域中除所述有效区域之外的其他区域作为无效区域。
可选的,所述第二置信度阈值大于所述第一置信度阈值,所述分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于该子区域的检测框集的步骤包括:
从所述第一置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第一检测框集,从所述第二置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第二检测框集;
所述计算不同置信度阈值下的检测框集中各检测框之间的重叠率,根据所述重叠率判断该子区域是否为有效区域的步骤包括:
从所述第一检测框集中获取第一检测框,计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例;
重复上述步骤直至遍历所述第一检测框集中的全部检测框;
若判定计算得到的比例中的最大值大于预设的比例阈值,则确定所述子区域为有效区域。
可选的,所述第一置信度阈值与所述第二置信度阈值的差值不小于所述第一置信度阈值的20%。
可选的,所述第一置信度阈值的取值范围是[0.3,0.5];所述第二置信度阈值的取值范围是[0.6,0.7]。
可选的,第一检测框与第二检测框的重叠率为第一检测框与第二检测框交集除以第一检测框与第二检测框并集的计算结果。
可选的,分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于该子区域的检测框集的步骤还包括:
若判定某检测框的底端中点落在该子区域内,则确定该检测框对应于该子区域。
可选的,所述从对待检测区域录制的历史视频文件中提取样本图片集的步骤包括:
从对待检测区域录制的历史视频文件中以均匀的时间间隔提取图片,以得到所述样本图片集。
为实现上述目的,根据本发明实施例的另一个方面,提供了一种检测目标物体的装置,包括:
样本提取模块,用于从对待检测区域录制的历史视频文件中提取样本图片集;
结果生成模块,用于分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以分别得到两种置信度阈值下的样本数据集;
无效区域确定模块,用于通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域;
检测模块,用于在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。
可选的,所述结果生成模块还用于:
对所述样本图片集中的各帧图片进行目标物体检测,以得到检测结果;其中,所述检测结果包括目标物体的检测框和与该检测框对应的置信度;
若判定所述检测结果的置信度不小于所述置信度阈值,则将该检测结果加入所述样本数据集;
分别基于第一置信度阈值和第二置信度阈值重复上述步骤,以分别得到第一置信度阈值和第二置信度阈值下的样本数据集。
可选的,所述装置还包括:
区域划分模块,用于将所述待检测区域划分为多个子区域;
所述无效区域确定模块还用于:
分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于子区域的检测框集;
计算第一置信度阈值和第二置信度阈值下的检测框集中各检测框之间的重叠率,根据所述重叠率判断该子区域是否为有效区域;
重复上述过程直至遍历全部子区域,将所述待检测区域中除所述有效区域之外的其他区域作为无效区域。
可选的,所述第二置信度阈值大于所述第一置信度阈值,所述无效区域确定模块还用于:
从所述第一置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第一检测框集,从所述第二置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第二检测框集;
从所述第一检测框集中获取第一检测框,计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例;
重复上述步骤直至遍历所述第一检测框集中的全部检测框;
若判定计算得到的比例中的最大值大于预设的比例阈值,则确定所述子区域为有效区域。
可选的,所述第一置信度阈值与所述第二置信度阈值的差值不小于所述第一置信度阈值的20%。
可选的,所述第一置信度阈值的取值范围是[0.3,0.5];所述第二置信度阈值的取值范围是[0.6,0.7]。
可选的,第一检测框与第二检测框的重叠率为第一检测框与第二检测框交集除以第一检测框与第二检测框并集的计算结果。
可选的,所述无效区域确定模块还用于:
若判定某检测框的底端中点落在该子区域内,则确定该检测框对应于该子区域。
可选的,所述样本提取模块还用于:
从对待检测区域录制的历史视频文件中以均匀的时间间隔提取图片,以得到所述样本图片集。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种检测目标物体的电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器至少实现:
从对待检测区域录制的历史视频文件中提取样本图片集;
分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以分别得到两种置信度阈值下的样本数据集;
通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域;
在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。
为实现上述目的,根据本发明实施例的又一个方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时至少实现:
从对待检测区域录制的历史视频文件中提取样本图片集;
分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以分别得到两种置信度阈值下的样本数据集;
通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域;
在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。
上述发明中的一个实施例具有如下优点或有益效果:因为采用基于不同置信度阈值进行目标物体检测,并通过比对检测结果确定无效区域,在检测时排除无效区域中出现的检测结果技术手段,这样一来,实际检测过程可以在较低的置信度阈值下运行,既能够防止漏检,又可以避免低置信度阈值下无效区域中物体的误检,从而解决了现有目标检测技术中可能出现的漏检和误检问题,达到了提高检测准确度的技术效果。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的检测目标物体的方法的主要步骤的示意图;
图2是基于现有技术中的检测方法以在置信度阈值为0.5时的检测结果示意图;
图3是基于现有技术中的检测方法以在置信度阈值为0.7时的检测结果示意图;
图4是基于本发明实施例中的方法以在置信度阈值为0.5时的检测结果示意图;
图5是根据本发明实施例的检测目标物体的装置的主要模块的示意图;
图6是本发明实施例可以应用于其中的示例性系统架构图;
图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的检测目标物体的方法的主要步骤的示意图。
如图1所示,根据本实施例提供的一种检测目标物体的方法,包括:
S10,从对待检测区域录制的历史视频文件中提取样本图片集。本实施例较佳的应用场景为固定的摄像头中的目标物体检测,通常的监控状态下,摄像头的取景范围一定,获取一段时间长度的历史监控视频文件,并从该监控视频文件中提取帧图片以得到样本图片集。当然,除适用于固定监控摄像头的场景外,本实施例还适用于其他待检测区域固定或有规律变化的使用环境。
需说明的是,在从视频文件中提取样本图片集时,应以均匀的时间间隔提取帧图片,例如可以从每一秒的帧图片中等间隔地取出5帧图片,将提取的到的帧图片集合作为样本图片集。
S11,基于不同的置信度阈值对所述样本图片集进行目标物体检测,以得到样本数据集。本实施例中,采用至少2个不同的置信度阈值对样本图片集中的各帧图片进行目标物体检测,包括第一置信度阈值,以及大于该第一置信度阈值的第二置信度阈值。
S12,通过对比不同置信度阈值下的所述样本数据集确定所述待检测区域中的无效区域。本实施例的实现原理,是根据不同置信度阈值下得到的至少两组样本数据集进行对比,若某一检测框在两组样本数据集中均出现,则说明该检测框对应的区域具备较好的可信度,即是有效的;若某一检测框仅在低置信度阈值下的样本数据集中出现,说明该检测框对应的区域可能无法在低置信度阈值时获取到准确的检测结果,即为无效区域。具体的对比方法在后续实施例中详述。
S13,在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。确定了无效区域之后,即可使用较低的置信度阈值进行目标物体检测,并在进行当前实际的检测过程时,将无效区域中的检测结果排除,从而既保证不会出现漏检的问题,又尽可能地降低了误检率。
从上面所述可以看出,本实施提供的方法通过采用不同置信度阈值进行目标物体检测,并通过比对检测结果确定无效区域,在检测时排除无效区域中出现的检测结果;这样一来,后续的检测过程可以在较低的置信度阈值下运行,既能够防止漏检,又可以避免低置信度阈值下无效区域中物体的误检,从而解决了现有目标检测技术中可能出现的漏检和误检问题,达到了提高检测准确度的技术效果。
在一些可选的实施例中,S11,所述基于不同的置信度阈值对所述样本图片集进行目标物体检测,以得到样本数据集的步骤包括:
对所述样本图片集中的各帧图片进行目标物体检测,以得到检测结果;其中,所述检测结果包括目标物体的检测框和与该检测框对应的置信度;
若判定所述检测结果的置信度不小于所述置信度阈值,则将该检测结果加入所述样本数据集;
分别基于不同的置信度阈值重复上述步骤,以得到不同置信度阈值下的样本数据集。
在本实施例中,优选采用两个不同的置信度阈值进行检测;其中较低的置信度阈值应当等于或者接近在当前检测工作中希望采用的置信度阈值,较高的置信度阈值可以根据需要进行确定。
在一些可选的实施例中,在S12,通过对比不同置信度阈值下的样本数据集确定所述待检测区域中的无效区域的步骤前,还包括:
将所述待检测区域划分为多个子区域。子区域的划分是为了更加方便地确定有效区域和无效区域;较佳的实现方法是将矩形的待检测区域划分为例如M*N的网格型子区域,分别判断各子区域有效或者无效,从而最终确定整个待检测区域的有效区域或无效区域。
在划分子区域后,S12,所述通过对比不同置信度阈值下的样本数据集确定所述待检测区域中的无效区域的步骤包括:
对于某子区域,分别从不同置信度阈值下的样本数据集中获取对应于该子区域的检测框集。对于2个不同的置信度阈值的情况而言,例如第一置信度阈值和第二置信度阈值,所述第二置信度阈值大于所述第一置信度阈值;从所述第一置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第一检测框集,从所述第二置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第二检测框集。其中,“对应于该子区域的检测框”是指检测框的检测中心落在该子区域内。检测中心在检测框中的位置取决于检测场景;例如,在商店的行人检测中,应当以行人可以行走的位置作为主要的有效检测区域,那么可以将矩形的检测框的下边缘中点位置作为该检测框的检测中心,以定位至行人脚部,从而提高有效区域划分的精确度和行人检测系统的检测精度。
计算不同置信度阈值下的检测框集中各检测框之间的重叠率,根据所述重叠率判断该子区域是否为有效区域。具体而言,本步骤从所述第一检测框集中获取第一检测框,计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例;重复上述步骤直至遍历所述第一检测框集中的全部检测框;若判定计算得到的比例中的最大值大于预设的比例阈值,则确定所述子区域为有效区域。本实施例中的重叠率阈值和比例阈值可以根据算法、场景、人员复杂程度等进行确定。
重复上述过程直至遍历全部子区域,将所述待检测区域中除所述有效区域之外的其他区域作为无效区域。除此之外,在其他一些可选的实施例中,若确定某一子区域的检测框数量小于预设的数量阈值,则将确定该子区域为无效区域;即,当经过大量样本检测后,某一检测框中几乎没有出现过目标物体时,则认为该检测框对于整体的数据影响很小,为了避免误检问题,可以将这些检测框排除。
本实施例步骤中的“重叠率”用于表示两个检测框的重叠程度,重叠的部分越多,说明这两个检测框所标识的检测结果越接近;当重叠率达到预设的重叠率阈值,则可以近似地认为这两个检测框所标识的物体是同一个。本实施例中以“交并比”来表示两个检测框之间的重叠率,例如有第一检测框和第二检测框,则以交并比表示二者之间重叠率为:
本实施例步骤的最后,根据有效区域划分无效区域,并通过无效区域来对检测框进行筛选,这是因为使用无效区域在算法上更加容易表示,并且除了通过本实施例方法得到的无效区域之外,还可以根据实际的待检测区域人工对无效区域边界进行优化,例如可以根据场景的实际布置对无效区域的边界进行调整等。
下面通过另一个实施例说明本发明提供的方法在商店的行人检测中的应用。
步骤1:对于一个特定摄像头,选择该摄像头的监控区域(即待检测区域)中客流量较大的时段,获取该时段中时长为8小时左右的监控视频。
步骤2:从监控视频文件中提取视频帧图片,具体为从每秒的全部帧图片中提取5幅帧图片。
步骤3:在执行检测前,对各帧图片进行区域划分;例如对于1280*720像素分辨率的视频文件,可以将其帧图片按照每个子区域80*80像素的规格划分为16*9分布的子区域网格。需说明,本步骤并非对每一副图片进行单独划分,而是对于图片大小的区域进行划分,并将后续步骤得到的样本数据集根据子区域进行分类,以便判断每个子区域属于有效区域或者无效区域。视频文件的时长越长、子区域划分的越细致,最终得到的无效区域结果越精确,但相应的需要消耗更长的计算时间,实际工程中可以根据设备性能进行调整。
步骤4:分别在第一置信度阈值和第二置信度阈值下(第二置信度阈值大于第一置信度阈值),通过行人检测算法对提取得到的帧图片进行检测,分别得到第一置信度阈值和第二置信度阈值下的样本数据集。本实施例采用的行人检测算法为YOLO(You only lookonce)算法,基于该算法,上述第一置信度阈值的较佳取值范围是0.3-0.5,若低于该范围则物体误检和错检概率大大增加;第二置信度阈值的较佳取值范围是0.6-0.7,若高于该范围则会导致检测到的行人过少,无法得到真实的行人数据。在采用其他行人检测算法时,可以根据算法输出置信度的准确性对第一置信度阈值和第二置信度阈值进行调整,并应当保证第一置信度阈值与第二置信度阈值之差较大,建议将该差值设置为第一置信度阈值的数值的20%以上,以便后续步骤的比对中取得较为准确的结果。
步骤5:对于某一子区域,从第一置信度阈值对应的样本数据集中查找检测中心落在该子区域中的检测框,以得到第一检测框集;同样从第二子区域中查找检测中心落在该子区域中的检测框,以得到第二检测框集(需要说明,第一检测框集和第二检测框集的概念只是为了便于表述,在实际的算法程序中并非一定存在该实体)。
步骤6:从第一检测框集中获取第一检测框,分别计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例。
本步骤中的重叠率以交并比(Intersection-over-Union,IoU)来表示,例如有第一检测框和第二检测框,则以交并比表示二者之间重叠率为:
对于商店场景下、720像素分辨率的视频文件、以80*80像素大小的子区域进行划分、第一置信度阈值为0.3-0.5、第二置信度阈值为0.6-0.7的情况,重叠率阈值的较佳数值为80%。对于其他场景,可以根据参数和场景的变化对重叠率阈值进行适应性调整。
步骤7:重复步骤6直至遍历第一检测框集中的全部检测框;判断得到的全部比例中的最大值是否大于预设的比例阈值,若大于,则确定该子区域为有效区域。
基于步骤6中所述的场景和参数,本步骤中的比例阈值宜设置为86%,同样可以根据参数和场景的变化对比例阈值进行适应性调整。
步骤8:重复步骤7直至遍历全部子区域,以得到待检测区域的全部有效区域;以待检测区域中除该有效区域外的其他区域作为无效区域。
除了根据有效区域确定无效区域外,在执行步骤5时,若判断第二检测框集中检测框的数量过少(可以通过设置阈值来判断),则可以将该子区域设置为无效区域。这是因为若检测框过少,说明该区域并非行人常经过的区域,偶尔出现在该区域中的大多并非行人,而是例如利用梯子上货的工作人员、电灯维修工等。在第二检测框集中检测框的数量过少时,即使该子区域的第一检测框集中的检测框数量很多,也不应当将其纳入考虑范围,因为这种情况说明该子区域中经常存在类人物体,例如广告宣传板、大型拟人玩具等等。无论是何种情况都会对行人数据产生干扰,所以应当将其排除。
步骤9:在进行实时的行人检测的过程中,排除检测中心落在无效区域中的结果。
步骤1-8的目的是根据监控区域中的大量行人样本确定无效区域。对于同一个摄像头而言,其监控的区域中的场景通常是固定的,例如货架的位置、墙壁的位置等。当然可能会出现监控区域中场景改变的问题,此时可以重复上述步骤1-8,重新划分无效区域。步骤9是当前实时的检测过程,通过获取实时的图像数据并执行检测,得到将检测得到的行人数据,从而可以根据行人数据统计出商店中的行人热度,以便于进行销售规划。
图2是基于现有技术中的检测方法以在置信度阈值为0.5时的检测结果示意图;图3是基于现有技术中的检测方法以在置信度阈值为0.7时的检测结果示意图;图4是基于本发明实施例中的方法以在置信度阈值为0.5时的检测结果示意图。在图2-图4中,虚线框体表示检测框,检测框旁的数字表示该检测框的置信度。
如图2所示,为商店场景中的某一待检测区域,包括三列货架。在置信度阈值为0.5时,采用现有技术中的行人检测算法可以检测出行人21、行人22、行人23、行人24和行人25,但是由于置信度阈值较低,所以摆放在货架上的玩具熊26也被作为行人识别出来,造成误检。如图3所示,当提高置信度阈值至0.7后,虽然玩具熊26被排除在结果之外,但是行人24和行人25由于距离摄像头较远,特征不够明显,同样被排除在结果之外,造成结果不准确的问题。
如图4所示,在基于本发明实施例中的方法对该待检测区域进行处理后,划出无效区域(图中以斜线覆盖的区域,为了使图像清楚,并未按照子区域进行覆盖,仅示意性地标识)。可见玩具熊26所在的区域已经被置为无效区域,因此不会将玩具熊26纳入检测结果中;而行人24、行人25所在的走道,由于常有行人经过,在大量数据的支撑下符合有效区域的条件。此时将置信度阈值设置为0.5进行检测,全部的行人被准确地检测出来,并且玩具熊被排除在检测结果之外。
图5是根据本发明实施例的检测目标物体的装置的主要模块的示意图。
如图5所示,本发明实施例还体用一种检测目标物体的装置500,包括:
样本提取模块501,用于从对待检测区域录制的历史视频文件中提取样本图片集;
结果生成模块502,用于基于不同的置信度阈值对所述样本图片集进行目标物体检测,以得到样本数据集;
无效区域确定模块503,用于通过对比不同置信度阈值下的所述样本数据集确定无效区域;
检测模块504,用于在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。
从上面所述可以看出,本实施提供的装置通过采用不同置信度阈值进行目标物体检测,并通过比对检测结果确定无效区域,在检测时排除无效区域中出现的检测结果;这样一来,后续的检测过程可以在较低的置信度阈值下运行,既能够防止漏检,又可以避免低置信度阈值下无效区域中物体的误检,从而解决了现有目标检测技术中可能出现的漏检和误检问题,达到了提高检测准确度的技术效果。
在一些可选的实施例中,所述结果生成模块502还用于:
对所述样本图片集中的各帧图片进行目标物体检测,以得到检测结果;其中,所述检测结果包括目标物体的检测框和与该检测框对应的置信度;
若判定所述检测结果的置信度不小于所述置信度阈值,则将该检测结果加入所述样本数据集;
分别基于不同的置信度阈值重复上述步骤,以得到不同置信度阈值下的样本数据集。
在一些可选的实施例中,所述装置500还包括:
区域划分模块505,用于将待检测区域划分为多个子区域;
所述无效区域确定模块503还用于:
分别从不同置信度阈值下的样本数据集中获取对应于子区域的检测框集;
计算不同置信度阈值下的检测框集中各检测框之间的重叠率,根据所述重叠率判断该子区域是否为有效区域;
重复上述过程直至遍历全部子区域,将所述待检测区域中除所述有效区域之外的其他区域作为无效区域。
在一些可选的实施例中,所述不同的置信度阈值包括第一置信度阈值和第二置信度阈值,所述第二置信度阈值大于所述第一置信度阈值;所述无效区域确定模块503还用于:
从所述第一置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第一检测框集,从所述第二置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第二检测框集;
从所述第一检测框集中获取某一检测框,计算所述第二检测框集中与所述某一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例;
重复上述步骤直至遍历所述第一检测框集中的全部检测框;
若判定计算得到的比例中的最大值大于预设的比例阈值,则确定所述子区域为有效区域。
在一些可选的实施例中,计算两检测框之间重叠率的公式为:
在一些可选的实施例中,所述无效区域确定模块503还用于:
若判定某检测框的底端中点落在该子区域内,则确定该检测框对应于该子区域。
在一些可选的实施例中,所述样本提取模块501还用于:
从历史视频文件中以均匀的时间间隔提取图片,以得到所述样本图片集。
图6示出了可以应用本发明实施例的检测目标物体的方法或检测目标物体的装置的示例性系统架构600。
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所采集的视频数据进行收集和处理的后台服务器。
需要说明的是,本发明实施例所提供的检测目标物体的方法一般由服务器605执行,相应地,检测目标物体的装置一般设置于服务器605中。
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种可读存储介质。
图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明的实施例,上文主要步骤的示意图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤的示意图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括样本提取模块、结果生成模块、无效区域确定模块、检测模块和区域划分模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,结果生成模块还可以被描述为“用于基于不同的置信度阈值对所述样本图片集进行目标物体检测,以得到样本数据集的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
从历史视频文件中提取样本图片集;
基于不同的置信度阈值对所述样本图片集进行目标物体检测,以得到样本数据集;
通过对比不同置信度阈值下的所述样本数据集确定无效区域;
在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。
本实施提供的方案通过采用不同置信度阈值进行目标物体检测,并通过比对检测结果确定无效区域,在检测时排除无效区域中出现的检测结果;这样一来,后续的检测过程可以在较低的置信度阈值下运行,既能够防止漏检,又可以避免低置信度阈值下无效区域中物体的误检,从而解决了现有目标检测技术中可能出现的漏检和误检问题,达到了提高检测准确度的技术效果。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (20)
1.一种检测目标物体的方法,其特征在于,包括:
从对待检测区域录制的历史视频文件中提取样本图片集;
分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以分别得到两种置信度阈值下的样本数据集;
通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域;
在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。
2.根据权利要求1所述的方法,其特征在于,所述分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以分别得到两种置信度阈值下的样本数据集的步骤包括:
对所述样本图片集中的各帧图片进行目标物体检测,以得到检测结果;其中,所述检测结果包括目标物体的检测框和与该检测框对应的置信度;
若判定所述检测结果的置信度不小于所述置信度阈值,则将该检测结果加入所述样本数据集;
分别基于第一置信度阈值和第二置信度阈值重复上述步骤,以分别得到第一置信度阈值和第二置信度阈值下的样本数据集。
3.根据权利要求2所述的方法,其特征在于,通过对比第一置信度阈值和第二置信度阈值下的所述样本数据集确定无效区域的步骤前,还包括:
将所述待检测区域划分为多个子区域;
所述通过对比第一置信度阈值和第二置信度阈值下的所述样本数据集确定无效区域的步骤包括:
分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于子区域的检测框集;
计算第一置信度阈值和第二置信度阈值下的检测框集中各检测框之间的重叠率,根据所述重叠率判断该子区域是否为有效区域;
重复上述过程直至遍历全部子区域,将所述待检测区域中除所述有效区域之外的其他区域作为无效区域。
4.根据权利要求3所述的方法,其特征在于,所述第二置信度阈值大于所述第一置信度阈值,所述分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于该子区域的检测框集的步骤包括:
从所述第一置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第一检测框集,从所述第二置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第二检测框集;
所述计算不同置信度阈值下的检测框集中各检测框之间的重叠率,根据所述重叠率判断该子区域是否为有效区域的步骤包括:
从所述第一检测框集中获取第一检测框,计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例;
重复上述步骤直至遍历所述第一检测框集中的全部检测框;
若判定计算得到的比例中的最大值大于预设的比例阈值,则确定所述子区域为有效区域。
5.根据权利要求4所述的方法,其特征在于,所述第一置信度阈值与所述第二置信度阈值的差值不小于所述第一置信度阈值的20%。
6.根据权利要求4所述的方法,其特征在于,所述第一置信度阈值的取值范围是[0.3,0.5];所述第二置信度阈值的取值范围是[0.6,0.7]。
7.根据权利要求3所述的方法,其特征在于,第一检测框与第二检测框的重叠率为第一检测框与第二检测框交集除以第一检测框与第二检测框并集的计算结果。
8.根据权利要求3所述的方法,其特征在于,分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于该子区域的检测框集的步骤还包括:
若判定某检测框的底端中点落在该子区域内,则确定该检测框对应于该子区域。
9.根据权利要求1所述的方法,其特征在于,所述从对待检测区域录制的历史视频文件中提取样本图片集的步骤包括:
从对待检测区域录制的历史视频文件中以均匀的时间间隔提取图片,以得到所述样本图片集。
10.一种检测目标物体的装置,其特征在于,包括:
样本提取模块,用于从对待检测区域录制的历史视频文件中提取样本图片集;
结果生成模块,用于分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测,以分别得到两种置信度阈值下的样本数据集;
无效区域确定模块,用于通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域;
检测模块,用于在对当前获取的图像数据进行检测时,排除所述无效区域中的目标物体。
11.根据权利要求10所述的装置,其特征在于,所述结果生成模块还用于:
对所述样本图片集中的各帧图片进行目标物体检测,以得到检测结果;其中,所述检测结果包括目标物体的检测框和与该检测框对应的置信度;
若判定所述检测结果的置信度不小于所述置信度阈值,则将该检测结果加入所述样本数据集;
分别基于第一置信度阈值和第二置信度阈值重复上述步骤,以分别得到第一置信度阈值和第二置信度阈值下的样本数据集。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
区域划分模块,用于将所述待检测区域划分为多个子区域;
所述无效区域确定模块还用于:
分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于子区域的检测框集;
计算第一置信度阈值和第二置信度阈值下的检测框集中各检测框之间的重叠率,根据所述重叠率判断该子区域是否为有效区域;
重复上述过程直至遍历全部子区域,将所述待检测区域中除所述有效区域之外的其他区域作为无效区域。
13.根据权利要求12所述的装置,其特征在于,所述第二置信度阈值大于所述第一置信度阈值,所述无效区域确定模块还用于:
从所述第一置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第一检测框集,从所述第二置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第二检测框集;
从所述第一检测框集中获取第一检测框,计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例;
重复上述步骤直至遍历所述第一检测框集中的全部检测框;
若判定计算得到的比例中的最大值大于预设的比例阈值,则确定所述子区域为有效区域。
14.根据权利要求13所述的装置,其特征在于,所述第一置信度阈值与所述第二置信度阈值的差值不小于所述第一置信度阈值的20%。
15.根据权利要求13所述的装置,其特征在于,所述第一置信度阈值的取值范围是[0.3,0.5];所述第二置信度阈值的取值范围是[0.6,0.7]。
16.根据权利要求12所述的装置,其特征在于,第一检测框与第二检测框的重叠率为第一检测框与第二检测框交集除以第一检测框与第二检测框并集的计算结果。
17.根据权利要求12所述的装置,其特征在于,所述无效区域确定模块还用于:
若判定某检测框的底端中点落在该子区域内,则确定该检测框对应于该子区域。
18.根据权利要求10所述的装置,其特征在于,所述样本提取模块还用于:
从对待检测区域录制的历史视频文件中以均匀的时间间隔提取图片,以得到所述样本图片集。
19.一种检测目标物体的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
20.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810031047.2A CN110032916A (zh) | 2018-01-12 | 2018-01-12 | 一种检测目标物体的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810031047.2A CN110032916A (zh) | 2018-01-12 | 2018-01-12 | 一种检测目标物体的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110032916A true CN110032916A (zh) | 2019-07-19 |
Family
ID=67234926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810031047.2A Pending CN110032916A (zh) | 2018-01-12 | 2018-01-12 | 一种检测目标物体的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110032916A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110705461A (zh) * | 2019-09-29 | 2020-01-17 | 北京百度网讯科技有限公司 | 一种图像处理方法及装置 |
CN110796071A (zh) * | 2019-10-28 | 2020-02-14 | 广州博衍智能科技有限公司 | 行为检测方法、系统、机器可读介质及设备 |
CN111062313A (zh) * | 2019-12-13 | 2020-04-24 | 歌尔股份有限公司 | 一种图像识别方法、装置、监控系统及存储介质 |
CN111124863A (zh) * | 2019-12-24 | 2020-05-08 | 北京安兔兔科技有限公司 | 智能设备性能测试方法、装置及智能设备 |
CN111507327A (zh) * | 2020-04-07 | 2020-08-07 | 浙江大华技术股份有限公司 | 一种目标检测方法及装置 |
CN112131951A (zh) * | 2020-08-26 | 2020-12-25 | 中通服咨询设计研究院有限公司 | 一种自动化识别施工中违规使用梯子行为的系统 |
CN112633496A (zh) * | 2020-12-18 | 2021-04-09 | 杭州海康威视数字技术股份有限公司 | 一种检测模型的处理方法及装置 |
CN113052026A (zh) * | 2021-03-12 | 2021-06-29 | 北京经纬恒润科技股份有限公司 | 座舱内抽烟行为定位方法及装置 |
CN113392754A (zh) * | 2021-06-11 | 2021-09-14 | 成都掌中全景信息技术有限公司 | 一种基于yolov5行人检测算法减少行人误检测率的方法 |
CN113642510A (zh) * | 2021-08-27 | 2021-11-12 | 北京京东乾石科技有限公司 | 目标检测方法、装置、设备和计算机可读介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103235938A (zh) * | 2013-05-03 | 2013-08-07 | 北京国铁华晨通信信息技术有限公司 | 车牌检测与识别的方法及系统 |
CN104484680A (zh) * | 2014-09-26 | 2015-04-01 | 徐晓晖 | 一种多模型多阈值组合的行人检测方法 |
CN105264570A (zh) * | 2013-06-14 | 2016-01-20 | 高通股份有限公司 | 跟踪器辅助的图像捕获 |
CN105336169A (zh) * | 2015-12-09 | 2016-02-17 | 青岛海信网络科技股份有限公司 | 一种基于视频判断交通拥堵的方法和系统 |
CN105844283A (zh) * | 2015-01-16 | 2016-08-10 | 阿里巴巴集团控股有限公司 | 用于识别图像类目归属的方法、图像搜索方法及装置 |
CN106650641A (zh) * | 2016-12-05 | 2017-05-10 | 北京文安智能技术股份有限公司 | 一种交通信号灯定位识别方法、装置及系统 |
CN106886795A (zh) * | 2017-02-17 | 2017-06-23 | 北京维弦科技有限责任公司 | 基于图像中的显著物体的物体识别方法 |
-
2018
- 2018-01-12 CN CN201810031047.2A patent/CN110032916A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103235938A (zh) * | 2013-05-03 | 2013-08-07 | 北京国铁华晨通信信息技术有限公司 | 车牌检测与识别的方法及系统 |
CN105264570A (zh) * | 2013-06-14 | 2016-01-20 | 高通股份有限公司 | 跟踪器辅助的图像捕获 |
CN104484680A (zh) * | 2014-09-26 | 2015-04-01 | 徐晓晖 | 一种多模型多阈值组合的行人检测方法 |
CN105844283A (zh) * | 2015-01-16 | 2016-08-10 | 阿里巴巴集团控股有限公司 | 用于识别图像类目归属的方法、图像搜索方法及装置 |
CN105336169A (zh) * | 2015-12-09 | 2016-02-17 | 青岛海信网络科技股份有限公司 | 一种基于视频判断交通拥堵的方法和系统 |
CN106650641A (zh) * | 2016-12-05 | 2017-05-10 | 北京文安智能技术股份有限公司 | 一种交通信号灯定位识别方法、装置及系统 |
CN106886795A (zh) * | 2017-02-17 | 2017-06-23 | 北京维弦科技有限责任公司 | 基于图像中的显著物体的物体识别方法 |
Non-Patent Citations (1)
Title |
---|
丁明宇;牛玉磊;卢志武;文继荣;: "基于深度学习的图片中商品参数识别方法", 软件学报, no. 04, 4 December 2017 (2017-12-04) * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110705461B (zh) * | 2019-09-29 | 2022-11-01 | 北京百度网讯科技有限公司 | 一种图像处理方法及装置 |
CN110705461A (zh) * | 2019-09-29 | 2020-01-17 | 北京百度网讯科技有限公司 | 一种图像处理方法及装置 |
CN110796071A (zh) * | 2019-10-28 | 2020-02-14 | 广州博衍智能科技有限公司 | 行为检测方法、系统、机器可读介质及设备 |
CN111062313A (zh) * | 2019-12-13 | 2020-04-24 | 歌尔股份有限公司 | 一种图像识别方法、装置、监控系统及存储介质 |
CN111124863A (zh) * | 2019-12-24 | 2020-05-08 | 北京安兔兔科技有限公司 | 智能设备性能测试方法、装置及智能设备 |
CN111124863B (zh) * | 2019-12-24 | 2024-02-13 | 北京安兔兔科技有限公司 | 智能设备性能测试方法、装置及智能设备 |
CN111507327B (zh) * | 2020-04-07 | 2023-04-14 | 浙江大华技术股份有限公司 | 一种目标检测方法及装置 |
CN111507327A (zh) * | 2020-04-07 | 2020-08-07 | 浙江大华技术股份有限公司 | 一种目标检测方法及装置 |
CN112131951A (zh) * | 2020-08-26 | 2020-12-25 | 中通服咨询设计研究院有限公司 | 一种自动化识别施工中违规使用梯子行为的系统 |
CN112131951B (zh) * | 2020-08-26 | 2024-03-01 | 中通服咨询设计研究院有限公司 | 一种自动化识别施工中违规使用梯子行为的系统 |
CN112633496A (zh) * | 2020-12-18 | 2021-04-09 | 杭州海康威视数字技术股份有限公司 | 一种检测模型的处理方法及装置 |
CN112633496B (zh) * | 2020-12-18 | 2023-08-08 | 杭州海康威视数字技术股份有限公司 | 一种检测模型的处理方法及装置 |
CN113052026A (zh) * | 2021-03-12 | 2021-06-29 | 北京经纬恒润科技股份有限公司 | 座舱内抽烟行为定位方法及装置 |
CN113052026B (zh) * | 2021-03-12 | 2023-07-18 | 北京经纬恒润科技股份有限公司 | 座舱内抽烟行为定位方法及装置 |
CN113392754A (zh) * | 2021-06-11 | 2021-09-14 | 成都掌中全景信息技术有限公司 | 一种基于yolov5行人检测算法减少行人误检测率的方法 |
CN113392754B (zh) * | 2021-06-11 | 2022-06-28 | 成都掌中全景信息技术有限公司 | 一种基于yolov5行人检测算法减少行人误检测率的方法 |
CN113642510A (zh) * | 2021-08-27 | 2021-11-12 | 北京京东乾石科技有限公司 | 目标检测方法、装置、设备和计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110032916A (zh) | 一种检测目标物体的方法和装置 | |
CN109255288A (zh) | 一种路面破损检测方法、装置及终端设备 | |
CN108510472B (zh) | 用于处理图像的方法和装置 | |
CN110188720A (zh) | 一种基于卷积神经网络的目标检测方法及系统 | |
CN110148130A (zh) | 用于检测零件缺陷的方法和装置 | |
CN109753928A (zh) | 违章建筑物识别方法和装置 | |
CN102959354A (zh) | 用于利用LiDAR数据来分析树冠层的方法和装置 | |
CN110910445B (zh) | 一种物件尺寸检测方法、装置、检测设备及存储介质 | |
CN109145828A (zh) | 用于生成视频类别检测模型的方法和装置 | |
CN110533654A (zh) | 零部件的异常检测方法及装置 | |
CN109697392A (zh) | 绘制目标对象热力图的方法及装置 | |
CN110225366A (zh) | 视频数据处理及广告位确定方法、装置、介质及电子设备 | |
CN110263748A (zh) | 用于发送信息的方法和装置 | |
CN109472264A (zh) | 用于生成物体检测模型的方法和装置 | |
CN109145973A (zh) | 用于检测单晶硅太阳能电池缺陷的方法和装置 | |
CN109671055B (zh) | 肺结节检测方法及装置 | |
CN110110666A (zh) | 目标检测方法和装置 | |
CN110363137A (zh) | 人脸检测优化模型、方法、系统及其电子设备 | |
CN113096158A (zh) | 运动对象的识别方法、装置、电子设备及可读存储介质 | |
CN110287907A (zh) | 一种对象检测方法和装置 | |
CN109283182A (zh) | 一种电池焊点缺陷的检测方法、装置及系统 | |
CN108229289A (zh) | 目标检索方法、装置和电子设备 | |
CN110276300A (zh) | 用于识别垃圾品质的方法和装置 | |
CN110490058A (zh) | 行人检测模型的训练方法、装置、系统和计算机可读介质 | |
CN112529836A (zh) | 高压线路缺陷检测方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |