CN110276363A - 一种基于密度图估计的鸟类小目标检测方法 - Google Patents
一种基于密度图估计的鸟类小目标检测方法 Download PDFInfo
- Publication number
- CN110276363A CN110276363A CN201810212915.7A CN201810212915A CN110276363A CN 110276363 A CN110276363 A CN 110276363A CN 201810212915 A CN201810212915 A CN 201810212915A CN 110276363 A CN110276363 A CN 110276363A
- Authority
- CN
- China
- Prior art keywords
- density map
- image
- birds
- pixel
- density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公布了一种基于密度图估计的鸟类小目标检测方法,涉及基于计算机视觉的生态监测技术。本发明方法包括训练阶段和检测阶段,利用基于实例学习的方法学习密度图,在密度图上,通过滑动窗口和求窗口内局部极值的方法估计鸟类小目标的位置,进行基于超像素的包围框估计,实现小样本训练集下的鸟类小目标检测。本发明降低了对训练集规模的依赖性,同时减轻大量繁琐的训练样本人工标注的工作;能够更好地匹配小目标的形状和轮廓,检测精度较高。
Description
技术领域
本发明属于计算机视觉技术、目标检测技术领域,涉及基于计算机视觉的生态监测技术,尤其涉及一种基于密度图估计的鸟类小目标检测方法。
背景技术
鸟类因具有分布广泛、种类多样以及易于识别等特点,是研究最多和调查最为频繁的动物类群之一,也是一类对栖息地改变和环境变化反应极为敏感的动物。鸟类物种的组成、数量、多样性和群落等特征可直接反映栖息地的适宜性、生态系统健康与生物多样性状况、人类活动对生态系统的干扰程度、土地利用和景观改变对生态系统影响程度,以及区域生态环境的质量。迄今为止,野外监测站点主要还是沿用人工调查的传统工作方式,获得的鸟类信息资料的连续性、可信度和时效性较差。因此,实现鸟类目标检测技术是实现自动化鸟类生态数据获取的重要方式。
近年来,计算机视觉技术迅速发展,已从学术研究领域逐步拓展到工业应用领域。快速、精确地检测图像中特定目标是计算机视觉领域中的关键研究问题之一,其核心思想是结合图像处理技术和机器学习算法,模拟人类视觉器官和大脑系统,对输入图像中目标进行准确表达和精确定位。静态图像的目标检测技术可分为传统的目标检测技术和基于深度学习的目标检测技术。传统目标检测方法的研究重点在特征提取(如何提高特征的表达能力和抗形变能力)和特征分类(如何提高分类器的准确度和速度)。然而,由于传统目标检测方法使用设计的大多为人工特征,对于实际场景中复杂多变的应用需求,其特征表达能力十分有限,从而影响目标检测效果。为了提取更好的特征,Hinton在2006年提出了深度学习,利用深度神经网络从大量的数据中自动地学习高层特征。随着深度学习的不断发展,研究者发现,利用卷积神经网络进行目标检测,准确度可以获得较大的提升。卷积神经网络不仅能够提取高层语义特征,提高了特征的表达能力;还能够将特征提取、特征选择和特征分类融合在同一模型中,通过端到端的训练,从整体上进行功能优化,增强了特征的可分性。
然而,在自然状态下,鸟类通常为聚集和群居分布,且栖息地距离可达监测点的距离相对较远,使得鸟类个体在视觉上的显著性较低。因此,在获取的图像中,鸟类多呈现为尺度小,分辨率低的目标个体,且在分布上存在遮挡和密集分布等特点。针对鸟类小目标检测,基于传统目标检测算法和基于深度神经网络的目标检测算法等主流目标检测算法依然存在诸多挑战。鸟类个体的尺度小,遮挡重叠等问题使得图像中有效特征信息损失;同时,大量密集分布的鸟类小目标为人工标注训练样本带来了难度。针对上述问题,现有的这些主流目标检测算法在鸟类小目标检测任务中的检测效果有所下降,检测效果不佳。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于密度图估计的鸟类小目标检测方法,利用基于实例学习的方法学习密度图,实现小样本训练集下的鸟类小目标检测,对训练集规模的依赖性降低,同时减轻大量繁琐的训练样本人工标注的工作;本发明方法能够更好地匹配小目标的形状和轮廓,检测精度较高。
本发明的技术方案如下:
一种基于密度图估计的鸟类小目标检测方法,利用基于实例学习的方法学习密度图,通过密度图和超像素分割实现小样本训练集下的鸟类小目标检测;该方法包括密度图估计阶段和基于密度图估计的鸟类小目标检测阶段,密度图估计阶段包括训练阶段和测试阶段,具体包括如下步骤:
A.在密度图估计阶段的训练阶段,对于每幅训练图像Ii,i∈{1,2,…,N},使用固定大小的滑动窗口(窗口大小为4×4,滑动距离为2)从图像中提取图像块。图像块构成训练集合Y={y1,y2,…,yM}相对应的,使用同样的滑动窗口,从训练图像生成的密度图中提取相应的密度图图像块,其构成训练集合 这里,M为图像块及密度图块的总个数。实际处理时,4×4大小的图像块通常拉伸成16×1的列向量处理。
其中,图像块训练集Y和其对应的密度图训练集Yd生成方式如下:
给定N张训练图像I1,I2,…,IN。对于每张训练图像Ii(1≤i≤N),所有的感兴趣目标都使用2维点标注出其具体位置(一般标注在目标形状的重心上,理论上标注在目标形状内即可),这些2维点集合这里标记成Pi。因此对于Ii中的每一个像素p(p∈Ii)而言,其对应的真实目标密度函数可以定义为基于标注点的2维高斯核的累积。用公式可以表示为:
其中,P是Pi种的一个标注点的位置,δ是控制2维高斯核平滑程度的参数,本发明设置为3。
B.密度图估计方法的测试阶段;
密度图学习方法假设:图像块形成的流形空间和其对应的密度图块形成的流形空间共享相似的局部几何结构。基于局部线性嵌入理论,这种特征向量的局部几何结构可以通过其相邻特征向量线性重构该向量来表示。因此,基于实例学习的密度图估计方法的测试阶段包括如下步骤:
B1.输入一张测试图片X,用固定大小的滑动窗口从中提取图像块xij,即xij是从X中提取出的第(i,j)个图像块。具体实施时,滑动窗口大小为像素4×4,滑动距离为2。
B2.基于切比雪夫距离和K近邻算法,从训练样本集Y中选择和xij最相似(即切比雪夫距离最小)的K个图像块(近邻数K=128),分别记为构成近邻块字典 这些近邻块对应的密度图构成的字典为
B3.使用正交匹配追踪算法求解公式,求得最终选择的样本集字典DY和对应样本使用的权重w*:
其中,wi为样本xij与其相邻样本块的线性重构权重,w=[w1,w2,…,wK]T,λ为是用来平衡局部性和稀疏性的正则项系数。
B4.根据B3中得到的样本与其相邻样本字典的权重w*和相邻样本的密度图字典来估计测试图像X对应的密度图xd,具体地,根据如下公式求得图像块xij对应的密度图
其中,w为样本与其相邻样本字典的对应权重,为相邻样本的密度图字典。
将放置到X对应密度图Xd的对应位置。若xij是X中最后一个图像块则进行下一步操作,否则跳转到步骤B1。
C.基于密度图估计的鸟类小目标检测阶段,在得到的密度图xd上,通过滑动窗口和求窗口内局部极值的方式粗略估计鸟类小目标的位置,实现方法为:
C1.定义一系列滑动窗口用于计算各窗口中的局部极大值,粗略估计鸟类小目标的位置,从而实现目标定位;窗口大小设为鸟类小目标的平均个体大小;根据密度图的定义计算得到窗口中的鸟类小目标数量ni;
C2.当窗口内目标数量ni>cb时(其中cb为阈值),则认为该窗口中含有至少一个鸟类小目标个体,则可在该窗口中计算局部极大值来估计目标位置
D.根据步骤C得到的目标位置结果,在原图像空间的超像素层次上估计该图像的Bounding Box(包围框),实现方法为:
D1.通过简单线性聚类SLIC(simple linear iterative clustering)超像素分割算法将图像分割成一定数量的超像素块;
D2.结合步骤C得到的鸟类小目标位置结果,取所有包含鸟类小目标位置(1≤i≤M,M为滑动窗口的总数量)的超像素块作为目标超像素集合,记为q,q中的超像素即为所需检测的鸟类小目标,鸟类小目标的包围框可通过每个超像素的边缘像素的位置极值来表示,即得到鸟类小目标的包围框;
E.借助密度图中的密度值信息,将步骤D中得到的图像的Bounding box进行后处理。
由于基于超像素分割的方式可能出现将一个完整的鸟类小目标分割成若干超像素的情况,进而会生成包围不完整的鸟类小目标的Bounding box。借助密度图的密度值信息,对于原本应包围一个完整鸟类小目标却生成若干包围不完整的Bounding boxes,求它们的坐标极值,融合这些不完整的Bounding boxes形成一个完整的Bounding box,作为最终的鸟类小目标检测结果。
与现有技术相比,本发明的有益效果是:
本发明利用基于实例学习的方法来学习密度图,使得算法对训练集规模的依赖性降低,从而实现小样本训练集下的鸟类小目标检测,减轻大量繁琐的训练样本人工标注的工作。另一方面,考虑到超像素块具有保留目标轮廓信息的特点,本发明在超像素层次上进行Bounding box的估计,使得得到的Bounding box能够很好地匹配小目标的形状和轮廓。
附图说明
图1是本发明方法的流程框图。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明提供一种基于密度图估计的鸟类小目标检测方法,利用基于实例学习的方法学习密度图,实现小样本训练集下的鸟类小目标检测,对训练集规模的依赖性降低,同时减轻大量繁琐的训练样本人工标注的工作;本发明方法能够更好地匹配小目标的形状和轮廓,检测精度较高。
本发明方法可应用于个人电脑PC(Personal computer)中,也可应用于手机、平板电脑等移动终端设备,在此不作限定。
本发明方法包括密度图估计阶段和基于密度图估计的鸟类小目标检测阶段,密度图估计阶段包括训练阶段和测试阶段。
A.在密度图估计阶段的训练阶段,对于每幅训练图像Ii,i∈{1,2,…,N},使用固定大小的滑动窗口(窗口大小为4×4,滑动距离为2)从图像中提取图像块。图像块构成训练集合Y={y1,y2,…,yM}相对应的,使用同样的滑动窗口,从训练图像生成的密度图中提取相应的密度图图像块,其构成训练集合 这里,M为图像块及密度图块的总个数。实际处理时,4×4大小的图像块通常拉伸成16×1的列向量处理。
其中,图像块训练集Y和其对应的密度图训练集Yd生成方式如下:
给定N张训练图像I1,I2,…,IN。对于每张训练图像Ii(1≤i≤N),所有的感兴趣目标都使用2维点标注出其具体位置(一般标注在目标形状的重心上,理论上标注在目标形状内即可),这些2维点集合这里标记成Pi。因此对于Ii中的每一个像素p(p∈Ii)而言,其对应的真实目标密度函数可以定义为基于标注点的2维高斯核的累积。用公式可以表示为:
其中,P是Pi种的一个标注点的位置,δ是控制2维高斯核平滑程度的参数,本发明设置为3。
B.密度图估计方法的测试阶段;
密度图学习方法假设:图像块形成的流形空间和其对应的密度图块形成的流形空间共享相似的局部几何结构。基于局部线性嵌入理论,这种特征向量的局部几何结构可以通过其相邻特征向量线性重构该向量来表示。因此,基于实例学习的密度图估计方法的测试阶段包括如下步骤:
B1.输入一张测试图片X,用固定大小的滑动窗口从中提取图像块xij,即xij是从X中提取出的第(i,j)个图像块。具体实施时,滑动窗口大小为像素4×4,滑动距离为2。
B2.基于切比雪夫距离和K近邻算法,从训练样本集Y中选择和xij最相似(即切比雪夫距离最小)的K个图像块(近邻数K=128),分别记为构成近邻块字典 这些近邻块对应的密度图构成的字典为
B3.使用正交匹配追踪算法求解公式,求得最终选择的样本集字典DY和对应样本使用的权重w*:
B4.根据B3中得到的样本与其相邻样本字典的权重w*和相邻样本的密度图字典来估计测试图像X对应的密度图xd,具体地,根据如下公式求得图像块xij对应的密度图
其中,w为样本与其相邻样本字典的对应权重,为相邻样本的密度图字典。
将放置到X对应密度图Xd的对应位置。若xij是X中最后一个图像块则进行下一步操作,否则跳转到步骤B1。
如图1为本发明方法基于密度图估计的鸟类小目标检测阶段的技术流程,主要包括小目标定位、Bounding box估计、Bounding box后处理。具体实施过程如下:
1、小目标定位
真实标注的密度图(ground-truth density map)可看作是由标注的目标位置点图经二维高斯分布函数滤波后生成的图像,密度图中各像素的值代表图像中该像素点位置上目标分布的数量密度。由此,在得到密度图后,可通过在密度图上滑动窗口和求窗口内局部极值的方式来进行简单的目标定位。
本发明采用基于实例学习的密度图估计算法训练密度图,得到图像I对应的密度图xd后,定义一系列滑动窗口S1,S2,…,SM来计算各窗口中的密度值的极大值,从而实现目标定位,窗口大小设为目标的平均个体大小。窗口Si(1≤i≤M)中的密度图块记为对于窗口中的任意像素p,如公式1,中的目标数量ni即为中的各密度值积分。
当该窗口内目标数量ni>cb时(其中cb为阈值,通常设置在0.7到1之间),则认为该窗口中含有至少一个目标个体,则可通过公式2在该窗口中计算局部极大值来估计该目标的位置即将该窗口的局部极大值作为目标位置的估计值:
2、Bounding box估计
在Bounding box估计步骤/模块,根据前一步骤得到的目标位置的估计值,在可提供目标轮廓信息的超像素层次上展开。Bounding box估计模块首先通过简单的线性迭代聚类(simple linear iterative clustering,SLIC)超像素分割算法将图像分割成一定数量的超像素块,进而根据目标定位部分的结果选取包含目标位置所在的超像素块来估计Bounding box。
21)SLIC超像素分割
超像素是指具有相似纹理、颜色、亮度等特征的相邻像素构成的有一定视觉意义的不规则像素块。它利用像素之间特征的相似性将像素分组,用少量的超像素代替大量的像素来表达图片特征,很大程度上降低了图像处理的复杂度。本发明采用超像素分割算法SLIC将输入图像分割为N个超像素,其中,N应设置为足够大(如大于整个图像面积对目标个体面积的比值),使得各超像素的平均尺度略小于平均的目标大小。
22)基于超像素块的Bounding Box估计
得到目标分布位置后,取所有包含目标位置的超像素作为目标超像素集合,记为q。q中的超像素即为所需检测的最终目标,它们的Bounding box可被表示为式3:
B=(x1,y1,x2,y2)=(min(xt),min(yt),max(xt),max(yt)) (3)
这里,B为最终得到的包围框;(xt,yt)表示超像素t中所有像素的坐标值,(x1,y1,x2,y2)表示预测得到的矩形Bounding box的四个顶点坐标。
3、Bounding box后处理
本发明中目标Bounding box的估计是基于每个超像素的轮廓信息完成的,因此,可能会出现一个完整的目标被分割为多于一个的超像素的情况,则该目标个体会被多于一个的Bounding box分别部分检测。为了避免上述情况的发生,需要进行Bounding box的后处理。
对于每个Bounding box Bj,本发明采用的方法是:在距离Bi的中心的欧式距离小于d的范围内遍历其邻居Bounding box Bj,若Bi和Bj满足(计数的阈值db设置在1附近),则Bi和Bj被认为是由一个完整目标分割而成的两个不完整的超像素构成的Bounding boxes,则将Bi和Bj融合成一个完整的Bounding box,即B=(x1,y1,x2,y2)=(min(xi1,xj1),min(yi1,yj1),max(xi2,xj2),max(yi2,yj2)),这里,B表示最终得到的完整的Bounding box的位置坐标,Bi=(xi1,yi1,xi2,yi2)表示Bounding box Bi的位置坐标,Bj=(xj1,yj1,xj2,yj2)表示Bounding box Bj的位置坐标。若不满足上述条件,则不做任何操作。由此,将得到完整的Bounding box作为最终的鸟类小目标检测结果。
具体实施时,将采用本发明方法与采用其他现有的优秀的相关算法得到鸟类小目标检测效果进行对比,可以得到,本发明在鸟类小目标密集分布的条件下有良好的检测效果。同时,相比于其他优秀的相关算法,如仅基于密度图中局部极大值(LM)算法和基于深度学习的Faster RCNN(Regional-based convolutional neural network,更快的区域卷积神经网络)算法,本发明的鸟类小目标检测算法得到的Bounding box更匹配目标的形状和轮廓。另一方面,本发明的算法仅需要小训练集来完成学习,对训练集的规模要求不高,减轻了人工标注和数据采集的负担,可适用于更广泛的应用场景。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (7)
1.一种基于密度图估计的鸟类小目标检测方法,利用基于实例学习的方法学习密度图,通过密度图和超像素分割实现小样本训练集下的鸟类小目标检测;包括密度图估计阶段和基于密度图估计的鸟类小目标检测阶段,密度图估计阶段包括训练阶段和测试阶段;具体包括如下步骤:
A.在密度图估计阶段,由标注的目标位置点图经二维高斯分布函数滤波后生成的图像作为真实标注的密度图,密度图中各像素的值代表图像中该像素点位置上目标分布的数量密度;采用基于实例学习的密度图估计方法学习原图像空间到密度图空间的映射关系,再估计得到测试图像I对应的密度图xd;
B.基于密度图估计的鸟类小目标检测阶段,在得到的密度图xd上,通过滑动窗口和求窗口内局部极值的方式粗略估计鸟类小目标的位置其中,1≤i≤M,M为滑动窗口的总数量;
C.根据得到的目标位置在原图像空间的超像素层次上估计得到该图像的包围框;执行如下操作:
C1.通过简单线性迭代聚类超像素分割算法,将图像分割成多个超像素块,使得各超像素的平均尺度略小于平均的目标大小;
C2.根据步骤B得到的鸟类小目标位置,取所有包含鸟类小目标位置的超像素块作为目标超像素集合,记为q;q中的超像素即为所需检测的鸟类小目标;通过每个超像素的轮廓表示鸟类小目标的包围框,由此得到图像的包围框;表示为式3:
B=(x1,y1,x2,y2)=(min(xt),min(yt),max(xt),max(yt)) (式3)
其中,B为最终得到的包围框;(x1,y1,x2,y2)表示预测得到的矩形包围框的四个顶点坐标;(xt,yt)表示超像素t中所有像素的坐标值;
D.根据密度图中的密度值,将步骤C中得到的图像的包围框进行后处理,将只检测部分目标的包围框融合形成一个完整的包围框,作为鸟类小目标检测结果。
2.如权利要求1所述基于密度图估计的鸟类小目标检测方法,其特征是,步骤A中,具体地,图像块训练集Y和其对应的密度图训练集Yd的生成方法如下:
给定N张训练图像I1,I2,…,IN。对于每张训练图像Ii(1≤i≤N),所有的感兴趣目标都使用二维点标注出其具体位置,二维点集合标记成Pi;对于Ii中的每一个像素p,p∈Ii,对应的真实目标密度函数定义为基于标注点的二维高斯核的累积,表示为:
其中,P是Pi种的一个标注点的位置,δ是控制2维高斯核平滑程度的参数。
3.如权利要求1所述基于密度图估计的鸟类小目标检测方法,其特征是,步骤A具体执行如下操作:
A1.在密度图估计阶段的训练阶段,对于每幅训练图像Ii,i∈{1,2,…,N},使用固定大小的滑动窗口从图像中提取图像块;图像块构成训练集合相对应的,使用同样的滑动窗口,从训练图像生成的密度图中提取相应的密度图图像块,构成训练集合其中,M为图像块及密度图块的总个数;
A2.密度图估计方法的测试阶段,执行如下操作:
A21.输入一张测试图片X,用固定大小的滑动窗口从中提取图像块xij,即xij是从X中提取出的第(i,j)个图像块;
A22.基于切比雪夫距离和K近邻算法,从训练样本集Y中选择和xij最相似的K个图像块,分别记为构成近邻块字典近邻块对应的密度图构成的字典为
A23.使用正交匹配追踪算法求解公式,求得最终选择的样本集字典DY和对应样本使用的权重w*:
其中,wi为样本xij与其相邻样本块的线性重构权重,w=[w1,w2,…,wK]T,λ为是用来平衡局部性和稀疏性的正则项系数;
A24.根据A23中得到的样本与其相邻样本字典的权重w*和相邻样本的密度图字典来估计测试图像X对应的密度图xd,具体地,根据如下公式求得图像块xij对应的密度图
其中,w为样本与其相邻样本字典的对应权重,为相邻样本的密度图字典;
将放置到X对应密度图Xd的对应位置;若xij是X中最后一个图像块则进行下一步操作,否则跳转到步骤A21执行操作。
4.如权利要求1所述基于密度图估计的鸟类小目标检测方法,其特征是,步骤B通过滑动窗口和求窗口内局部极值的方法估计鸟类小目标的位置具体执行如下操作:
B1.定义滑动窗口S1,S2,…,SM,用于计算各窗口中的极大值;窗口大小设为鸟类小目标的平均个体大小;窗口Si中的密度图块记为对于窗口中的任意像素p, p∈Si;根据密度计算得到窗口Si中的鸟类小目标数量ni,Si中的目标数量ni为中的各密度值积分,表示为公式1:
B2.设定阈值cb,当该窗口内目标数量ni>cb时,则该窗口中含有至少一个目标个体,通过公式2在该窗口中计算局部极大值来估计得到该目标的位置
即将该窗口的局部极大值作为目标位置的估计值。
5.如权利要求1所述基于密度图估计的鸟类小目标检测方法,其特征是,步骤D将得到的图像的包围框进行后处理,具体是:
设置计数阈值db;对于每个包围框Bi,在距离Bi的中心的欧式距离小于d的范围内遍历邻居包围框Bj,若Bi和Bj满足则Bi和Bj为由一个完整目标分割而成的两个不完整的超像素构成的包围框;将Bi和Bj融合成一个完整的包围框。
6.如权利要求5所述基于密度图估计的鸟类小目标检测方法,其特征是,计数阈值db的取值约为1。
7.如权利要求5所述基于密度图估计的鸟类小目标检测方法,其特征是,将Bi和Bj融合成一个完整的包围框,具体表示为:
B=(x1,y1,x2,y2)=(min(xi1,xj1),min(yi1,yj1),max(xi2,xj2),max(yi2,yj2))
其中,B表示最终得到的完整的Bounding box的位置坐标,Bi=(xi1,yi1,xi2,yi2)表示Bounding box Bi的位置坐标,Bj=(xj1,yj1,xj2,yj2)表示Bounding box Bj的位置坐标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810212915.7A CN110276363A (zh) | 2018-03-15 | 2018-03-15 | 一种基于密度图估计的鸟类小目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810212915.7A CN110276363A (zh) | 2018-03-15 | 2018-03-15 | 一种基于密度图估计的鸟类小目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110276363A true CN110276363A (zh) | 2019-09-24 |
Family
ID=67958474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810212915.7A Pending CN110276363A (zh) | 2018-03-15 | 2018-03-15 | 一种基于密度图估计的鸟类小目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110276363A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111027522A (zh) * | 2019-12-30 | 2020-04-17 | 华通科技有限公司 | 基于深度学习的探鸟定位系统 |
CN111062274A (zh) * | 2019-12-02 | 2020-04-24 | 汇纳科技股份有限公司 | 上下文感知嵌入的人群计数方法、系统、介质及电子设备 |
CN111862223A (zh) * | 2020-08-05 | 2020-10-30 | 西安交通大学 | 一种电子元件的视觉计数及定位方法 |
CN113378754A (zh) * | 2021-06-24 | 2021-09-10 | 中国计量大学 | 一种工地裸土监测方法 |
WO2023231021A1 (zh) * | 2022-06-02 | 2023-12-07 | 深圳市正浩创新科技股份有限公司 | 目标物归集方法、设备和存储介质 |
CN117670892A (zh) * | 2023-12-07 | 2024-03-08 | 百鸟数据科技(北京)有限责任公司 | 一种水鸟密度估计方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631858A (zh) * | 2015-12-21 | 2016-06-01 | 北京大学深圳研究生院 | 基于样本块的图像目标计数方法 |
CN105701469A (zh) * | 2016-01-13 | 2016-06-22 | 北京大学深圳研究生院 | 一种基于代价敏感稀疏线性回归的鲁棒人群计数方法 |
CN105740819A (zh) * | 2016-01-29 | 2016-07-06 | 中国科学院信息工程研究所 | 一种基于整数规划的人群密度估计方法 |
CN107679503A (zh) * | 2017-10-12 | 2018-02-09 | 中科视拓(北京)科技有限公司 | 一种基于深度学习的人群计数算法 |
-
2018
- 2018-03-15 CN CN201810212915.7A patent/CN110276363A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631858A (zh) * | 2015-12-21 | 2016-06-01 | 北京大学深圳研究生院 | 基于样本块的图像目标计数方法 |
CN105701469A (zh) * | 2016-01-13 | 2016-06-22 | 北京大学深圳研究生院 | 一种基于代价敏感稀疏线性回归的鲁棒人群计数方法 |
CN105740819A (zh) * | 2016-01-29 | 2016-07-06 | 中国科学院信息工程研究所 | 一种基于整数规划的人群密度估计方法 |
CN107679503A (zh) * | 2017-10-12 | 2018-02-09 | 中科视拓(北京)科技有限公司 | 一种基于深度学习的人群计数算法 |
Non-Patent Citations (2)
Title |
---|
X. Q. ZHOU ET AL.: "ACCURATE SMALL OBJECT DETECTION VIA DENSITY MAP AIDED SALIENCY ESTIMATION", 《2017 24TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)》 * |
Y. WANG ET AL.: "Fast visual object counting via example-based density estimation", 《IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062274A (zh) * | 2019-12-02 | 2020-04-24 | 汇纳科技股份有限公司 | 上下文感知嵌入的人群计数方法、系统、介质及电子设备 |
CN111062274B (zh) * | 2019-12-02 | 2023-11-28 | 汇纳科技股份有限公司 | 上下文感知嵌入的人群计数方法、系统、介质及电子设备 |
CN111027522A (zh) * | 2019-12-30 | 2020-04-17 | 华通科技有限公司 | 基于深度学习的探鸟定位系统 |
CN111027522B (zh) * | 2019-12-30 | 2023-09-01 | 华通科技有限公司 | 基于深度学习的探鸟定位系统 |
CN111862223A (zh) * | 2020-08-05 | 2020-10-30 | 西安交通大学 | 一种电子元件的视觉计数及定位方法 |
CN111862223B (zh) * | 2020-08-05 | 2022-03-22 | 西安交通大学 | 一种电子元件的视觉计数及定位方法 |
CN113378754A (zh) * | 2021-06-24 | 2021-09-10 | 中国计量大学 | 一种工地裸土监测方法 |
CN113378754B (zh) * | 2021-06-24 | 2023-06-20 | 中国计量大学 | 一种工地裸土监测方法 |
WO2023231021A1 (zh) * | 2022-06-02 | 2023-12-07 | 深圳市正浩创新科技股份有限公司 | 目标物归集方法、设备和存储介质 |
CN117670892A (zh) * | 2023-12-07 | 2024-03-08 | 百鸟数据科技(北京)有限责任公司 | 一种水鸟密度估计方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109614985B (zh) | 一种基于密集连接特征金字塔网络的目标检测方法 | |
CN110276363A (zh) | 一种基于密度图估计的鸟类小目标检测方法 | |
Xie et al. | Multilevel cloud detection in remote sensing images based on deep learning | |
CN108416353B (zh) | 基于深度全卷积神经网络的大田稻穗快速分割方法 | |
CN108596108B (zh) | 基于三元组语义关系学习的航拍遥感图像变化检测方法 | |
CN108764308A (zh) | 一种基于卷积循环网络的行人重识别方法 | |
CN106295613A (zh) | 一种无人机目标定位方法及系统 | |
CN109101938A (zh) | 一种基于卷积神经网络的多标签年龄估计方法 | |
Shen et al. | Biomimetic vision for zoom object detection based on improved vertical grid number YOLO algorithm | |
CN110310253A (zh) | 数字切片分类方法和装置 | |
CN110853070A (zh) | 基于显著性与Grabcut的水下海参图像分割方法 | |
CN112348758B (zh) | 一种光学遥感图像数据增强方法及目标识别方法 | |
CN108776777A (zh) | 一种基于Faster RCNN的遥感影像对象间空间关系的识别方法 | |
CN113435282A (zh) | 基于深度学习的无人机影像麦穗识别方法 | |
CN111079807A (zh) | 一种地物分类方法及装置 | |
Guo et al. | Foreign object detection of transmission lines based on faster R-CNN | |
CN114494586B (zh) | 晶格投影的深度学习网络阔叶树枝叶分离与骨架重建方法 | |
Patel et al. | Deep Learning-Based Plant Organ Segmentation and Phenotyping of Sorghum Plants Using LiDAR Point Cloud | |
CN113139540B (zh) | 背板检测方法及设备 | |
CN114202694A (zh) | 基于流形混合插值和对比学习的小样本遥感场景图像分类方法 | |
Shi et al. | Fine object change detection based on vector boundary and deep learning with high-resolution remote sensing images | |
Wang et al. | A new chaos cat swarm optimization algorithm based on saliency gradient for power equipment infrared and visible images registration | |
CN117557780A (zh) | 一种机载多模态学习的目标检测算法 | |
Wang et al. | Insulator defect detection based on improved you-only-look-once v4 in complex scenarios | |
CN105528791B (zh) | 一种面向触摸屏手绘图像的质量评价装置及其评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190924 |
|
WD01 | Invention patent application deemed withdrawn after publication |