CN110287907B - 一种对象检测方法和装置 - Google Patents
一种对象检测方法和装置 Download PDFInfo
- Publication number
- CN110287907B CN110287907B CN201910572201.1A CN201910572201A CN110287907B CN 110287907 B CN110287907 B CN 110287907B CN 201910572201 A CN201910572201 A CN 201910572201A CN 110287907 B CN110287907 B CN 110287907B
- Authority
- CN
- China
- Prior art keywords
- video image
- detected
- objects
- current video
- rectangular frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 55
- 238000012544 monitoring process Methods 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000000611 regression analysis Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000011176 pooling Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 230000001629 suppression Effects 0.000 claims description 8
- 238000013519 translation Methods 0.000 claims description 6
- 238000009395 breeding Methods 0.000 claims description 5
- 230000001488 breeding effect Effects 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种对象检测方法和装置,该方法包括:获取监控区域的视频图像;结合对获取的前一视频图像的识别结果,识别确定当前视频图像中的所有待检测对象;比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数;基于当前视频图像中不属于前一视频图像的待检测对象的个数,增加当前统计的监控区域中的待检测对象的数量。本发明能够对监控区域的视频中所有视频图像进行检测,从而对监控区域中的待检测对象进行准确识别和数量统计。
Description
技术领域
本发明涉及计算机视觉技术领域,特别涉及一种对象检测方法和装置。
背景技术
图像分类、目标检测、及图像分割是计算机视觉领域的三大任务。图像分类模型是将图像划分为单个类别,通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体,仅使用图像分类模型为图像分配一个单一标签其实是非常粗糙的,并不准确。对于这样的情况,可以使用目标检测模型识别一张图片的多个物体,并定位出识别的不同物体。
目标检测是当前计算机视觉领域的研究热点,从过去的十多年来看,图像的目标检测算法大体上可分为基于传统手工特征的时期以及基于深度学习的目标检测时期。Girshick等人提出了区域卷积网络目标检测框架(Regionswith CNN features,R-CNN)后,目标检测领域开始以前所未有的速度发展。
目标检测应用在了很多场景,如无人驾驶和安防系统,但尚不存在智能养殖场景中利用目标检测对视频中养殖对象进行检测的技术方案。
发明内容
有鉴于此,本发明的目的在于提供一种对象检测方法和装置,能够对监控区域的视频中所有视频图像进行检测,从而对监控区域中的待检测对象进行准确识别和数量统计。
为了达到上述目的,本发明提供了如下技术方案:
一种对象检测方法,包括:
获取监控区域的视频图像;
结合对获取的前一视频图像的识别结果,识别确定当前视频图像中的所有待检测对象;
比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数;
基于当前视频图像中不属于前一视频图像的待检测对象的个数,增加当前统计的监控区域中的待检测对象的数量。
一种对象检测装置,包括:
获取单元,用于获取监控区域的视频图像;
识别单元,用于结合对获取的前一视频图像的识别结果,识别确定当前视频图像中的所有待检测对象;
比对单元,用于比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数;
统计单元,用于基于当前视频图像中不属于前一视频图像的待检测对象的个数,增加当前统计的监控区域中的待检测对象的数量。
一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通过总线相连的存储器;所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序;所述至少一个处理器执行所述一个或多个计算机程序时实现上述对象检测方法中的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个计算机程序,所述一个或多个计算机程序被处理器执行时实现上述对象检测方法。
由上面的技术方案可知,本发明中,结合对获取的前一视频图像的识别结果,对当前获取的视频图像中的待检测对象进行识别,将从前后两帧视频图像中识别的待检测对象进行比较,即可确定后一帧视频图像中新增的待检测对象个数,从而相应增加当前统计的监控区域中的待检测对象的数量。可以看出,本发明中,通过计算确定前后两帧视频图像中待检测对象的增量,可以准确识别和统计出整个监控区域中的待检测对象的数量。
附图说明
图1是本发明实施例对象检测方法流程图;
图2是本发明实施例一对视频图像的检测结果示意图;
图3是本发明实施例二对视频图像的检测结果示意图;
图4是本发明实施例对象检测装置的结构示意图;
图5是本发明实施例电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图并据实施例,对本发明的技术方案进行详细说明。
在智能养殖场景中,使用机器视觉统计养殖对象的数量,能够最大限度上减少人力资源的支出。本发明提供的技术方案可用于对智能养殖场景的养殖对象进行数量统计,以降低人工成本。
本发明主要通过对监控区域的监控视频进行分析,识别出监控区域中所有待检测对象并统计待检测对象的总数量。以下结合图1进行说明。
参见图1,图1是本发明实施例对象检测方法流程图,如图1所示,该方法主要包括以下步骤:
步骤101、获取监控区域的视频图像。
本发明中,使用可以移动的摄像头拍摄整个监控区域的视频,通过对视频中的视频图像逐帧进行检测和目标追踪,确定监控区域中的所有待检测对象。
本步骤中,每次获取视频中的一帧视频图像,并结合对前一帧视频图像的识别结果,对当前获取的一帧视频图像进行检测和目标追踪。
步骤102、结合对获取的前一视频图像的识别结果,检测确定当前视频图像中的所有待检测对象。
在实际应用中,前后两帧视频图像之间的拍摄时间间隔很小,因此,其中包括的同一待检测对象的位置变化也很小。为了在当前视频图像中找出新出现的待检测对象,检测确定当前视频图像中的所有待检测对象时,可以将前一帧视频图像的识别结果叠加到当前视频图像中,从而保证相邻两帧视频图像中的待检测对象有较为准确的召回率。
结合对获取的前一帧视频图像的识别结果,检测确定当前视频图像中的所有待检测对象,具体可以采用以下两个步骤实现:
S01、结合对获取的前一视频图像的识别结果,利用预先训练的R2CNN检测模型检测确定当前视频图像中包围每一待检测对象的矩形框;
S02、对当前视频图像中包围每一待检测对象的各矩形框进行非极大值抑制NMS,得到对当前视频图像的识别结果。
在实际应用中,上述步骤S01中,确定视频图像中包围每个待检测对象的矩形框,可以使用图像处理技术中的多种方法实现。
本发明实施例中,利用R2CNN技术确定视频图像中包围每个待检测对象的矩形框,具体地,可以预先使用多个待检测对象的训练样本进行训练得到R2CNN检测模型,之后就可以将该R2CNN检测模型用于本发明的对象检测过程中,具体是利用R2CNN检测模型确定视频图像中包围每个待检测对象的矩形框,即:将视频图像输入到R2CNN检测模型,R2CNN检测模型对输入的视频图像进行图像检测,即可输出视频图像中包围每个待检测对象的矩形框。
另外,为了保证相邻两帧视频图像中待检测对象的召回率,在确定视频图像中包围每个待检测对象的矩形框的过程中,还将对前一帧视频图像的识别结果叠加到当前视频图像中。
因此,上述步骤S01的一种较佳实施方法如下:
S011、利用候选区域网络RPN算法确定当前视频图像中包围每个待检测对象的水平矩形框;
S012、将从前一视频图像识别出的包围每个待检测对象的倾斜矩形框,叠加到当前视频图像中;
S013、利用感兴趣区域池化ROI Pooling算法生成当前视频图像中每个矩形框的图像特征,对该图像特征进行回归分析,根据回归分析结果将该水平矩形框调整为倾斜矩形框;所述回归分析结果包括该水平矩形框对应的平移和旋转角度信息。
图2和图3分别示出了采用上述三个步骤对一帧视频图像的检测结果。
实际应用,上述步骤S01也可以采用其它方法实现,例如,先将对前一帧视频图像的识别结果叠加到当前视频图像中,再利用预先训练的R2CNN检测模型对当前视频图像进行图像检测,即按照步骤S012、S011、S013的顺序执行。又如,先利用预先训练的R2CNN检测模型对当前视频图像进行图像检测,再将对前一帧视频图像的识别结果叠加到对当前视频图像的识别结果中,即按照步骤S011、S013、S012的顺序执行。
上述步骤S011中,利用候选区域网络(RPN)算法确定当前视频图像中包围每个待检测对象的水平矩形框,主要是通过卷积算法提取不同尺度下的图像特征,其中既包括低级的边缘纹理特征,也包括高级的语义特征,通过将这两种特征融合起来,可以生成包围每个待检测对象的完整信息以及和当前视频图像边界平行的矩形框(称为水平矩形框)。
现有大多数对活体检测的方法所检测的结果没有显示方向性,仅有水平或垂直方向的检测结果,而人工对养殖对象进行数数时,通常是俯视的视角,因此,在智能养殖这种实际生产场景中的活体检测,不同于普通目标的检测任务,除了框出养殖对象信息之外,还应添加面向任意方向场景的活体检测。
为了充分识别待检测对象信息,上述步骤S013中,针对当前视频图像中的包围每个待检测对象的矩形框,可以通过感兴趣区域池化(ROI Pooling)算法进行图片信息检测,生成该矩形框的图像特征,然后对利用ROI Pooling算法生成的图像特征进行回归分析,得到的回归分析结果包括该矩形框对应的平移和旋转角度信息,此平移和旋转角度信息表明了需要对该矩形框进行的方向调整,是将水平矩形框调整为具有方向性的倾斜矩形框的依据。
另外,在执行上述步骤S012时,还可以对当前视频图像中的各个矩形框命中该矩形框包围的待统计对象的概率进行调整和设置,具体包括:
S0121、将叠加到当前视频图像中的倾斜矩形框命中该倾斜矩形框包围的待检测对象的概率设置为1;
S0122、将当前视频图像中包围每个待检测对象的水平矩形框命中该待检测对象的概率减少预设概率阈值。
上述步骤S0121和S0122不分先后顺序,上述概率的设置可以影响上述步骤S013的执行结果,这属于R2CNN技术,不再详述。
步骤103、比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数。
由于视频中的相邻两帧视频图像之间的拍摄时间间隔很小,其中包括的同一待检测对象的位置变化也很小。因此,可以基于分别属于前后两帧视频图像的两个待检测对象在各自所属视频图像的中心位置坐标,计算该两个待检测对象的欧式距离,如果该两个待检测对象之间的欧式距离较大,超过一定阈值,则可认为是不同的待检测对象,如果该两个待检测对象之间的欧式距离较小,则可认为该两个待检测对象是同一待检测对象。
基于上述判断分属于前后两帧视频图像的两个待检测对象是否为同一待检测对象的原理,本发明实施例中,对于当前视频图像中的每个待检测对象,可以计算该待检测对象与前一帧视频图像中的所有待检测对象的欧式距离,如果该待检测对象与前一帧视频图像中的任一待检测对象的欧式距离都大于预设距离阈值,则可以确定该待检测对象是当前视频图像中新出现的待检测对象,未在前一帧视频图像中出现,因此不属于前一帧视频图像,否则,可以确定该待检测对象在前一帧视频图像中已经出现,属于前一帧视频图像。
为此,本步骤中,比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数,具体包括:针对当前视频图像中每个待检测对象,计算该待检测对象与前一视频图像中所有待检测对象的欧式距离,如果该待检测对象与前一视频图像中各待检测对象中的最小欧式距离大于预设距离阈值,则将当前视频图像中不属于前一视频图像的待检测对象的个数增加1。
步骤104、基于当前视频图像中不属于前一视频图像的待检测对象的个数,增加当前统计的监控区域中的待检测对象的数量。
基于当前视频图像中不属于前一视频图像的待检测对象的个数,即当前视频图像与前一帧视频图像相比,新出现的待检测对象的个数。
本发明中,对监控区域拍摄的视频中每一帧视频图像均执行以上步骤101至步骤104,以确定每一帧视频图像比前一帧视频图像新出现的待检测对象的个数,通过对此个数进行累计,从而可以得到整个监控区域中所有待检测对象的数量。例如视频中总包括10帧视频图像,假设对第1-10帧视频图像均执行上述步骤101-步骤104得到后一帧视频图像与前一帧视频图像相比,新出现的待检测对象的个数分别为:10(由于不存在第0帧视频图像,因此,第1帧视频图像中的待检测对象的个数,即为第1帧视频图像比第0帧视频图像新出现的待检测对象的个数)、1、0、2、1、3、0、1、2、1,则通过累计计算,可以最终得到监控区域中的所有待检测对象的数量为10+1+0+2+1+3+0+1+2+1=21个。
以上对本发明实施例对象统计方法进行了详细说明,本发明还提供了一种对象统计装置,以下结合图4进行详细说明。
参见图4,图4是本发明实施例对象检测装置的结构示意图,如图4所示,该装置包括:
获取单元401,用于获取监控区域的视频图像;
识别单元402,用于结合对获取的前一视频图像的识别结果,识别确定当前视频图像中的所有待检测对象;
比对单元403,用于比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数;
统计单元404,用于基于当前视频图像中不属于前一视频图像的待检测对象的个数,增加当前统计的监控区域中的待检测对象的数量。
图4所示装置中,
所述识别单元402,包括检测子单元4021和抑制子单元4022;
所述检测子单元4021,用于结合对获取的前一视频图像的识别结果,利用预先训练的R2CNN检测模型检测确定当前视频图像中包围每一待检测对象的矩形框;
所述抑制子单元4022,用于对当前视频图像中包围每一待检测对象的各矩形框进行非极大值抑制NMS,得到对当前视频图像的识别结果。
图4所示装置中,
所述检测子单元4021,结合对获取的前一视频图像的识别结果,利用预先训练的R2CNN检测模型检测确定当前视频图像中包围每一待检测对象的矩形框,包括:
利用候选区域网络RPN算法确定当前视频图像中包围每个待检测对象的水平矩形框;
将从前一视频图像识别出的包围每个待检测对象的倾斜矩形框,叠加到当前视频图像中;
利用感兴趣区域池化ROI Pooling算法生成当前视频图像中每个矩形框的图像特征,对该图像特征进行回归分析,根据回归分析结果将该水平矩形框调整为倾斜矩形框;所述回归分析结果包括该水平矩形框对应的平移和旋转角度信息。
图4所示装置中,
所述检测子单元4021,将从前一视频图像识别出的包围每个待检测对象的倾斜矩形框,叠加到当前视频图像中时,进一步用于:
将叠加到当前视频图像中的倾斜矩形框命中该倾斜矩形框包围的待检测对象的概率设置为1;
将当前视频图像中包围每个待检测对象的水平矩形框命中该待检测对象的概率减少预设概率阈值。
图4所示装置中,
所述比对单元403,比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数,包括:
针对当前视频图像中每个待检测对象,计算该待检测对象与前一视频图像中所有待检测对象的欧式距离,如果该待检测对象与前一视频图像中各待检测对象中的最小欧式距离大于预设距离阈值,则将当前视频图像中不属于前一视频图像的待检测对象的个数增加1。
图4所示装置中,
所述比对单元403,基于两个待检测对象在各自所属视频图像的中心位置坐标,计算该两个待检测对象的欧式距离。
本发明实施例还提供了一种电子设备,如图5所示,该电子设备500包括:至少一个处理器501,以及与所述至少一个处理器501通过总线相连的存储器502;所述存储器502存储有可被所述至少一个处理器501执行的一个或多个计算机程序;所述至少一个处理器501执行所述一个或多个计算机程序时实现如上述图1所示对象检测方法中的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个计算机程序,所述一个或多个计算机程序被处理器执行时实现如上述图1所示对象检测方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种对象检测方法,其特征在于,该方法应用于智能养殖场景,包括:
获取可移动摄像头拍摄的监控区域的视频图像;
结合对获取的前一视频图像的识别结果,识别确定当前视频图像中的所有待检测对象;
比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数;
基于当前视频图像中不属于前一视频图像的待检测对象的个数,增加当前统计的监控区域中的待检测对象的数量;
其中,
结合对获取的前一视频图像的识别结果,识别确定当前视频图像中的所有待检测对象,包括:
结合对获取的前一视频图像的识别结果,利用预先训练的R2CNN检测模型检测确定当前视频图像中包围每一待检测对象的矩形框;
对当前视频图像中包围每一待检测对象的各矩形框进行非极大值抑制NMS,得到对当前视频图像的识别结果;
所述结合对获取的前一视频图像的识别结果,利用预先训练的R2CNN检测模型检测确定当前视频图像中包围每一待检测对象的矩形框,包括:
利用候选区域网络RPN算法确定当前视频图像中包围每个待检测对象的水平矩形框;
将从前一视频图像识别出的包围每个待检测对象的倾斜矩形框,叠加到当前视频图像中;
利用感兴趣区域池化ROI Pooling算法生成当前视频图像中每个矩形框的图像特征,对该图像特征进行回归分析,根据回归分析结果将该水平矩形框调整为倾斜矩形框;所述回归分析结果包括该水平矩形框对应的平移和旋转角度信息。
2.根据权利要求1所述的方法,其特征在于,
将从前一视频图像识别出的包围每个待检测对象的倾斜矩形框,叠加到当前视频图像中时,进一步包括:
将叠加到当前视频图像中的倾斜矩形框命中该倾斜矩形框包围的待检测对象的概率设置为1;
将当前视频图像中包围每个待检测对象的水平矩形框命中该待检测对象的概率减少预设概率阈值。
3.根据权利要求1所述的方法,其特征在于,
比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数,包括:
针对当前视频图像中每个待检测对象,计算该待检测对象与前一视频图像中所有待检测对象的欧式距离,如果该待检测对象与前一视频图像中各待检测对象中的最小欧式距离大于预设距离阈值,则将当前视频图像中不属于前一视频图像的待检测对象的个数增加1。
4.根据权利要求3所述的方法,其特征在于,
基于两个待检测对象在各自所属视频图像的中心位置坐标,计算该两个待检测对象的欧式距离。
5.一种对象检测装置,其特征在于,该装置应用于智能养殖场景,包括:
获取单元,用于获取可移动摄像头拍摄的监控区域的视频图像;
识别单元,用于结合对获取的前一视频图像的识别结果,识别确定当前视频图像中的所有待检测对象;
比对单元,用于比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数;
统计单元,用于基于当前视频图像中不属于前一视频图像的待检测对象的个数,增加当前统计的监控区域中的待检测对象的数量;
其中,
所述识别单元,包括检测子单元和抑制子单元;
所述检测子单元,用于结合对获取的前一视频图像的识别结果,利用预先训练的R2CNN检测模型检测确定当前视频图像中包围每一待检测对象的矩形框;
所述抑制子单元,用于对当前视频图像中包围每一待检测对象的各矩形框进行非极大值抑制NMS,得到对当前视频图像的识别结果;
所述检测子单元,结合对获取的前一视频图像的识别结果,利用预先训练的R2CNN检测模型检测确定当前视频图像中包围每一待检测对象的矩形框,包括:
利用候选区域网络RPN算法确定当前视频图像中包围每个待检测对象的水平矩形框;
将从前一视频图像识别出的包围每个待检测对象的倾斜矩形框,叠加到当前视频图像中;
利用感兴趣区域池化ROI Pooling算法生成当前视频图像中每个矩形框的图像特征,对该图像特征进行回归分析,根据回归分析结果将该水平矩形框调整为倾斜矩形框;所述回归分析结果包括该水平矩形框对应的平移和旋转角度信息。
6.根据权利要求5所述的装置,其特征在于,
所述检测子单元,将从前一视频图像识别出的包围每个待检测对象的倾斜矩形框,叠加到当前视频图像中时,进一步用于:
将叠加到当前视频图像中的倾斜矩形框命中该倾斜矩形框包围的待检测对象的概率设置为1;
将当前视频图像中包围每个待检测对象的水平矩形框命中该待检测对象的概率减少预设概率阈值。
7.根据权利要求5所述的装置,其特征在于,
所述比对单元,比对当前视频图像和前一视频图像中的所有待检测对象,确定当前视频图像中不属于前一视频图像的待检测对象的个数,包括:
针对当前视频图像中每个待检测对象,计算该待检测对象与前一视频图像中所有待检测对象的欧式距离,如果该待检测对象与前一视频图像中各待检测对象中的最小欧式距离大于预设距离阈值,则将当前视频图像中不属于前一视频图像的待检测对象的个数增加1。
8.根据权利要求7所述的装置,其特征在于,
所述比对单元,基于两个待检测对象在各自所属视频图像的中心位置坐标,计算该两个待检测对象的欧式距离。
9.一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通过总线相连的存储器;所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序;其特征在于,所述至少一个处理器执行所述一个或多个计算机程序时实现权利要求1-4任一权项所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储一个或多个计算机程序,所述一个或多个计算机程序被处理器执行时实现权利要求1-4中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910572201.1A CN110287907B (zh) | 2019-06-28 | 2019-06-28 | 一种对象检测方法和装置 |
PCT/CN2020/083515 WO2020258978A1 (zh) | 2019-06-28 | 2020-04-07 | 对象检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910572201.1A CN110287907B (zh) | 2019-06-28 | 2019-06-28 | 一种对象检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110287907A CN110287907A (zh) | 2019-09-27 |
CN110287907B true CN110287907B (zh) | 2020-11-03 |
Family
ID=68019378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910572201.1A Active CN110287907B (zh) | 2019-06-28 | 2019-06-28 | 一种对象检测方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110287907B (zh) |
WO (1) | WO2020258978A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110287907B (zh) * | 2019-06-28 | 2020-11-03 | 北京海益同展信息科技有限公司 | 一种对象检测方法和装置 |
CN110838134B (zh) * | 2019-10-10 | 2020-09-29 | 北京海益同展信息科技有限公司 | 目标对象的统计方法、装置、计算机设备和存储介质 |
CN111080697B (zh) * | 2019-10-29 | 2024-04-09 | 京东科技信息技术有限公司 | 检测目标对象方向的方法、装置、计算机设备和存储介质 |
CN111753766B (zh) * | 2020-06-28 | 2024-08-27 | 平安科技(深圳)有限公司 | 一种图像处理方法、装置、设备及介质 |
CN113627403B (zh) * | 2021-10-12 | 2022-03-08 | 深圳市安软慧视科技有限公司 | 一种选图推图方法、系统及相关设备 |
CN113936256A (zh) * | 2021-10-15 | 2022-01-14 | 北京百度网讯科技有限公司 | 一种图像目标检测方法、装置、设备以及存储介质 |
CN115115825B (zh) * | 2022-05-27 | 2024-05-03 | 腾讯科技(深圳)有限公司 | 图像中的对象检测方法、装置、计算机设备和存储介质 |
CN118537341B (zh) * | 2024-07-26 | 2024-10-01 | 浙江国遥地理信息技术有限公司 | 一种实时视频流中抓取物的智能计数方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281837A (zh) * | 2014-09-26 | 2015-01-14 | 哈尔滨工业大学深圳研究生院 | 结合卡尔曼滤波和相邻帧间roi扩大的行人跟踪方法 |
CN107316462A (zh) * | 2017-08-30 | 2017-11-03 | 济南浪潮高新科技投资发展有限公司 | 一种流量统计方法及装置 |
CN108932496A (zh) * | 2018-07-03 | 2018-12-04 | 北京佳格天地科技有限公司 | 区域内目标物的数量统计方法及装置 |
WO2019007214A1 (en) * | 2017-07-06 | 2019-01-10 | Huawei Technologies Co., Ltd. | RECONNAISSANCE AND RECONSTRUCTION OF OBJECTS HAVING A PARTIAL APPEARANCE |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11587304B2 (en) * | 2017-03-10 | 2023-02-21 | Tusimple, Inc. | System and method for occluding contour detection |
CN108062548B (zh) * | 2017-11-03 | 2020-11-03 | 中国科学院计算技术研究所 | 一种盲文方自适应定位方法及系统 |
CN110287907B (zh) * | 2019-06-28 | 2020-11-03 | 北京海益同展信息科技有限公司 | 一种对象检测方法和装置 |
-
2019
- 2019-06-28 CN CN201910572201.1A patent/CN110287907B/zh active Active
-
2020
- 2020-04-07 WO PCT/CN2020/083515 patent/WO2020258978A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281837A (zh) * | 2014-09-26 | 2015-01-14 | 哈尔滨工业大学深圳研究生院 | 结合卡尔曼滤波和相邻帧间roi扩大的行人跟踪方法 |
WO2019007214A1 (en) * | 2017-07-06 | 2019-01-10 | Huawei Technologies Co., Ltd. | RECONNAISSANCE AND RECONSTRUCTION OF OBJECTS HAVING A PARTIAL APPEARANCE |
CN107316462A (zh) * | 2017-08-30 | 2017-11-03 | 济南浪潮高新科技投资发展有限公司 | 一种流量统计方法及装置 |
CN108932496A (zh) * | 2018-07-03 | 2018-12-04 | 北京佳格天地科技有限公司 | 区域内目标物的数量统计方法及装置 |
Non-Patent Citations (1)
Title |
---|
R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection;Yingying Jiang等;《arXiv:1706.09579 v2》;20170630;第1-8页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110287907A (zh) | 2019-09-27 |
WO2020258978A1 (zh) | 2020-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287907B (zh) | 一种对象检测方法和装置 | |
US10769480B2 (en) | Object detection method and system | |
CN106960446B (zh) | 一种面向无人艇应用的水面目标检测跟踪一体化方法 | |
CN102542289B (zh) | 一种基于多高斯计数模型的人流量统计方法 | |
CN109389086B (zh) | 检测无人机影像目标的方法和系统 | |
CN106886216B (zh) | 基于rgbd人脸检测的机器人自动跟踪方法和系统 | |
CN110570454B (zh) | 一种检测异物入侵的方法及装置 | |
CN106682619B (zh) | 一种对象跟踪方法及装置 | |
CN112883819A (zh) | 多目标跟踪方法、装置、系统及计算机可读存储介质 | |
CN110543867A (zh) | 一种多摄像头条件下的人群密度估测系统及方法 | |
CN109544592B (zh) | 针对相机移动的运动目标检测算法 | |
CN109086724B (zh) | 一种加速的人脸检测方法及存储介质 | |
US20200167959A1 (en) | Method and device for capturing target object and video monitoring device | |
CN103824070A (zh) | 一种基于计算机视觉的快速行人检测方法 | |
CN109711332B (zh) | 一种基于回归算法的人脸跟踪方法及应用 | |
CN107403451B (zh) | 自适应二值特征单目视觉里程计方法及计算机、机器人 | |
CN110992378B (zh) | 基于旋翼飞行机器人的动态更新视觉跟踪航拍方法及系统 | |
CN107862713B (zh) | 针对轮询会场的摄像机偏转实时检测预警方法及模块 | |
CN114022531A (zh) | 图像处理方法、电子设备和存储介质 | |
CN103607558A (zh) | 一种视频监控系统及其目标匹配方法和装置 | |
US20230419500A1 (en) | Information processing device and information processing method | |
CN113255549B (zh) | 一种狼群围猎行为状态智能识别方法及系统 | |
WO2012153868A1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
CN107067411B (zh) | 一种结合密集特征的Mean-shift跟踪方法 | |
CN109389543A (zh) | 公交运营数据统计方法、系统、计算设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 601, 6 / F, building 2, No. 18, Kechuang 11th Street, Daxing District, Beijing, 100176 Patentee after: Jingdong Technology Information Technology Co.,Ltd. Address before: 601, 6 / F, building 2, No. 18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, 100176 Patentee before: BEIJING HAIYI TONGZHAN INFORMATION TECHNOLOGY Co.,Ltd. |