CN115063410B - 一种基于无锚点目标检测的钢管计数方法 - Google Patents
一种基于无锚点目标检测的钢管计数方法 Download PDFInfo
- Publication number
- CN115063410B CN115063410B CN202210931877.7A CN202210931877A CN115063410B CN 115063410 B CN115063410 B CN 115063410B CN 202210931877 A CN202210931877 A CN 202210931877A CN 115063410 B CN115063410 B CN 115063410B
- Authority
- CN
- China
- Prior art keywords
- central point
- point coordinate
- predicted
- thermodynamic diagram
- target detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30242—Counting objects in image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于无锚点目标检测的钢管计数方法,属于目标检测技术领域,包括采集钢管堆垛横截面图片;将采集的图片作为输入,构建DLA网络模型进行下采样抽取特征图;将特征图转化为热力图,计算中心点坐标分散到热力图上的预测值,计算中心点坐标的半径;采用最大池化层选取池化窗口热力图上最大预测值的中心点坐标,基于选取的中心点坐标构建中心点坐标集合,过滤掉中心点坐标集合中预测值小于阈值的中心点坐标。本发明解决当下人力清点钢管计数不准确问题,可有效减轻计数工人的劳动强度,提高计数效率,基于传统描点的目标检测,采用了无锚点的目标检测,具备更简单的网络设计、更少的超参数,并且确保目标对象的旋转不变性。
Description
技术领域
本发明属于目标检测技术领域,具体涉及一种基于无锚点目标检测的钢管计数方法。
背景技术
在建筑行业中,钢管是不可缺少的建筑材料之一。根据钢结构行业的统计数据,钢管在建筑钢结构中的用量占比约为14%。通常钢管在生产线、运输、使用过程中对钢管数量是有数量要求的。传统的钢管清点方式采用人工清点,该方式过程繁琐、耗时耗力且人力成本较高。随着人工智能的发展,深度学习技术在目标检测等中取得了重大突破,但钢管是体积较小、大小不一的圆形物体,很难被矩阵检测框探测到。一般的目标检测预测框用于标识模型计算输出的框位置,常用格式有左上右下坐标或者中心宽高坐标,然而钢管通常是圆形截面,传统的锚点(anchor)机制存在尺寸固定、模型鲁棒性差等问题,并且涵盖了大量非目标物体的区域,引入较多的干扰,成为所属技术领域技术人员亟待解决的技术问题。
因此,本发明提供了一种基于无锚点目标检测的钢管计数方法,以至少解决上述部分技术问题。
发明内容
本发明要解决的技术问题是:提供一种基于无锚点目标检测的钢管计数方法,以至少解决上述部分技术问题。
为实现上述目的,本发明采用的技术方案如下:
一种基于无锚点目标检测的钢管计数方法,其特征在于,包括以下步骤:
步骤S1、采集钢管堆垛横截面图片;
步骤S2、将采集的图片作为输入,构建DLA网络模型进行下采样抽取特征图;
步骤S3、将特征图转化为热力图,计算中心点坐标分散到热力图上的预测值,计算中心点坐标的半径;
步骤S4、采用最大池化层选取池化窗口热力图上最大预测值的中心点坐标,基于选取的中心点坐标构建中心点坐标集合,过滤掉中心点坐标集合中预测值小于阈值的中心点坐标。
进一步的,所述步骤S1中,所述图片为不同拍摄角度状态下对钢管堆垛截面拍摄的图片,所述钢管堆垛截面的钢管数量为10-500。
进一步的,所述步骤S2中,输入I∈Rw×h×3,其中R表示维度,w和h表示特征图的宽和高,3表示特征图通道数。
进一步的,所述步骤S3包括以下过程:步骤S31、将DLA主干网络至少经全连接、池化、卷积解码方式得到的第一分支,构建第一分支的输出维度为,其中L表示待识别的类别数,s表示下采样率,w和h表示特征图的宽和高,基于第一分支将特征图转化为热力图;步骤S32、将热力图上中心点坐标通过高斯核函数进行描述;步骤S33、采用焦点损失函数对中心点预测损失函数进行优化,得到优化后的中心点坐标的预测值;步骤S34、将DLA主干网络至少经全连接、池化、卷积解码方式得到的第二分支,构建第二分支的输出维度为 ,其中R表示维度,s表示下采样率,w和h表示特征图的宽和高,计算中心点坐标的半径。
进一步的,所述步骤S4中:采用3×3最大池化层选取热力图上的预测值大于或者等于周围8个邻居节点预测值的中心点坐标,基于选取的中心点坐标构建预测中心点坐标集合,过滤掉预测中心点坐标集合中预测值小于0.45的中心点坐标。
与现有技术相比,本发明具有以下有益效果:
本发明设计科学合理,使用方便,用于解决当下人力清点钢管计数不准确问题,可有效减轻计数工人的劳动强度,提高计数效率。本发明基于传统描点的目标检测,采用了无描点的目标检测,具备更简单的网络设计、更少的超参数,并且确保目标对象的旋转不变性。
附图说明
图1为本发明方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进一步详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供的一种基于无锚点目标检测的钢管计数方法,设计科学合理,使用方便,用于解决当下人力清点钢管计数不准确问题,可有效减轻计数工人的劳动强度,提高计数效率。本发明基于传统描点的目标检测,采用了无描点的目标检测,具备更简单的网络设计、更少的超参数,并且确保目标对象的旋转不变性。
本发明包括以下步骤:
步骤S1、采集钢管堆垛横截面图片;
步骤S2、将采集的图片作为输入,构建DLA网络模型进行下采样抽取特征图;
步骤S3、将特征图转化为热力图,计算中心点坐标分散到热力图上的预测值,计算中心点坐标的半径;
步骤S4、采用最大池化层选取池化窗口热力图上最大预测值的中心点坐标,基于选取的中心点坐标构建中心点坐标集合,过滤掉中心点坐标集合中预测值小于阈值的中心点坐标。
本发明所述步骤S1中,所述图片为不同拍摄角度状态下对钢管堆垛截面拍摄的图片,所述钢管堆垛截面的钢管数量为10-500。如此可用于本发明所述的方法对钢管堆垛实行快速计数,有效提高了计数效率和计数准确性。
本发明所述步骤S2中,输入,其中R表示维度,w和h表示特征图的宽和高,3表示特征图通道数。然后构建DLA网络模型用于图像的特征图抽取,DLA网络有丰富的特征跨度表示,尺度从小到大、分辨率从细粒度到粗粒度,符合不同尺寸钢管信息需要多层级信息融合的特点。
本发明基于无锚点的边界圆,具体表示为(xc,yc,rc),其中xc、yc代表中心点坐标,rc表示目标中心点对应的圆形半径。将步骤S2得到的特征图转化为热力图,计算中心点坐标分散到热力图上的预测值,计算中心点坐标的半径。
所述步骤S3包括以下过程:步骤S31、将DLA主干网络至少经全连接、池化、卷积解码方式得到的第一分支,构建第一分支的输出维度为,其中L表示待识别的类别数,s表示下采样率,w和h表示特征图的宽和高,基于第一分支将特征图转化为热力图;步骤S32、将热力图上中心点坐标通过高斯核函数进行描述;步骤S33、采用焦点损失函数对中心点预测损失函数进行优化,得到优化后的中心点坐标的预测值;步骤S34、将DLA主干网络至少经全连接、池化、卷积解码方式得到的第二分支,构建第二分支的输出维度为,其中R表示维度,s表示下采样率,w和h表示特征图的宽和高,计算中心点坐标的半径。
由DLA主干网络得到的第一分支构成circle heatmap模块,经circle heatmap模块输出的热力图为类似二值化掩码,而真实值只是热力图上一个点,将热力图上的二维关键点坐标通过所述高斯核函数拟合为。所述高斯核函数为:,其中, 表示高斯核函数的值,x、y表示热力图上关键点的二维坐标,c表示类别的索引编号, 表示关键点经DLA网络模型下采样后得到的中心点坐标,表示关键点宽和高相关的标准差。由于每个钢管只有一个实际中心点,的情况表示为目标点,其余点都为负样本,的情况表示为背景。
由DLA主干网络得到的第二分支构成circle radius模块。采用焦点损失函数对中心点预测损失函数进行优化,得到优化后的中心点坐标的预测值,优化后的中心点预测损失函数为:,其中ɑ、β是焦点损失函数的超参数,表示高斯核函数的值的预测值,N表示图像的关键点数量。
本发明还需对中心点坐标的半径进行预测,中心点坐标的半径的预测损失函数为:,其中为每个关键点预测位置半径,表示目标中心点对应的圆形半径,N表示图像的关键点数量。而后通过反向传播计算模型参数梯度,根据基于动量的随机梯度下降法更新模型参数,DLA主干网络模型的总损失函数为:,其中表示中心点预测损失函数,为中心点坐标的半径的预测损失函数,θ表示权重调节系数,θ设置为0.1。
原始采集图像经DLA网络模型下采样抽取和预测后,采用最大池化层选取池化窗口热力图上最大预测值的中心点坐标,基于选取的中心点坐标构建中心点坐标集合,过滤掉中心点坐标集合中预测值小于阈值的中心点坐标。具体为:采用3×3最大池化层选取热力图上的预测值大于或者等于周围8个邻居节点预测值的中心点坐标,基于选取的中心点坐标构建预测中心点坐标集合,过滤掉预测中心点坐标集合中预测值小于0.45的中心点坐标。
为客观评估钢管数量检测的评分算法,采用F1分数具体计算测试拍摄钢筋数量的召回率(recall)和准确率(precision),F1分数是统计学中用来衡量二分类模型精确度的一种指标,采用预测圆框与真实圆框的交并比(IoU≥0.7)作为匹配正确的依据,与当前若干主流模型对比,结果如表1所示:
表1 本发明与其他模型的对比
结果显示,针对召回率、准确率和F1分数值的对比,本发明均优于Yolo-v3、SSD和CornerNet模型,为此本发明具有较好的应用优势。
本发明不仅适用于钢管计数,还可应用到病例图像检测和人体姿态识别等场景。
最后应说明的是:以上各实施例仅仅为本发明的较优实施例用以说明本发明的技术方案,而非对其限制,当然更不是限制本发明的专利范围;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围;也就是说,但凡在本发明的主体设计思想和精神上作出的毫无实质意义的改动或润色,其所解决的技术问题仍然与本发明一致的,均应当包含在本发明的保护范围之内;另外,将本发明的技术方案直接或间接的运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (3)
1.一种基于无锚点目标检测的钢管计数方法,其特征在于,包括以下步骤:
步骤S1、采集钢管堆垛横截面图片;
步骤S2、将采集的图片作为输入,构建DLA网络模型进行下采样抽取特征图;
步骤S3、将特征图转化为热力图,计算中心点坐标分散到热力图上的预测值,计算中心点坐标的半径;
步骤S4、采用最大池化层选取池化窗口热力图上最大预测值的中心点坐标,基于选取的中心点坐标构建中心点坐标集合,过滤掉中心点坐标集合中预测值小于阈值的中心点坐标;
所述步骤S3包括以下过程:步骤S31、将DLA主干网络至少经全连接、池化、卷积解码方式得到的第一分支,构建第一分支的输出维度为,其中L表示待识别的类别数,s表示下采样率,w和h表示特征图的宽和高,基于第一分支将特征图转化为热力图;步骤S32、将热力图上中心点坐标通过高斯核函数进行描述;步骤S33、采用焦点损失函数对中心点预测损失函数进行优化,得到优化后的中心点坐标的预测值;步骤S34、将DLA主干网络至少经全连接、池化、卷积解码方式得到的第二分支,构建第二分支的输出维度为 ,其中R表示维度,s表示下采样率,w和h表示特征图的宽和高,计算中心点坐标的半径;
所述步骤S33中,所述中心点预测损失函数为:
所述步骤S4中:采用3×3最大池化层选取热力图上的预测值大于或者等于周围8个邻居节点预测值的中心点坐标,基于选取的中心点坐标构建预测中心点坐标集合,过滤掉预测中心点坐标集合中预测值小于0.45的中心点坐标。
2.根据权利要求1所述的一种基于无锚点目标检测的钢管计数方法,其特征在于,所述步骤S1中,所述图片为不同拍摄角度状态下对钢管堆垛截面拍摄的图片,所述钢管堆垛截面的钢管数量为10-500。
3.根据权利要求1所述的一种基于无锚点目标检测的钢管计数方法,其特征在于,所述步骤S2中,输入I∈Rw×h×3,其中R表示维度,w和h表示特征图的宽和高,3表示特征图通道数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210931877.7A CN115063410B (zh) | 2022-08-04 | 2022-08-04 | 一种基于无锚点目标检测的钢管计数方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210931877.7A CN115063410B (zh) | 2022-08-04 | 2022-08-04 | 一种基于无锚点目标检测的钢管计数方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115063410A CN115063410A (zh) | 2022-09-16 |
CN115063410B true CN115063410B (zh) | 2023-01-10 |
Family
ID=83207784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210931877.7A Active CN115063410B (zh) | 2022-08-04 | 2022-08-04 | 一种基于无锚点目标检测的钢管计数方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115063410B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116703820B (zh) * | 2023-04-17 | 2024-05-03 | 之江实验室 | 一种基于热力图的高密度豆粒计数及中心点定位方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022121156A1 (zh) * | 2020-12-10 | 2022-06-16 | 平安科技(深圳)有限公司 | 图像中目标物检测方法、装置、电子设备及可读存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105303233A (zh) * | 2015-10-15 | 2016-02-03 | 陕西科技大学 | 一种基于计算机视觉的钢筋数量统计方法 |
CN105513082B (zh) * | 2015-12-28 | 2018-07-24 | 中建三局第一建设工程有限责任公司 | 一种成捆棒材识别计数方法和装置 |
JP6770811B2 (ja) * | 2016-03-22 | 2020-10-21 | 山九株式会社 | 結束鋼管検査装置及び結束鋼管検査方法 |
CN105976390B (zh) * | 2016-05-25 | 2018-09-18 | 南京信息职业技术学院 | 一种结合支持向量机阈值统计与斑点检测的钢管计数方法 |
CN109741301A (zh) * | 2018-12-19 | 2019-05-10 | 北京理工大学 | 一种更快的基于深度学习的密集目标计数方法 |
CN110895809B (zh) * | 2019-10-18 | 2022-07-15 | 中国科学技术大学 | 准确提取髋关节影像中关键点的方法 |
CN111815594B (zh) * | 2020-06-29 | 2024-10-15 | 浙江大华技术股份有限公司 | 钢筋检测方法以及相关设备、装置 |
CN112580529B (zh) * | 2020-12-22 | 2024-08-20 | 上海有个机器人有限公司 | 移动机器人感知识别方法、装置、终端及存储介质 |
CN114266975B (zh) * | 2021-12-23 | 2024-04-16 | 华南农业大学 | 无人机遥感图像的荔枝果实检测与计数方法 |
CN114463298A (zh) * | 2022-01-25 | 2022-05-10 | 浙江大学 | 一种x光脊椎图像关键点检测与识别方法 |
CN114612767B (zh) * | 2022-03-11 | 2022-11-15 | 电子科技大学 | 一种基于场景图的图像理解与表达方法、系统与存储介质 |
CN114694032A (zh) * | 2022-06-02 | 2022-07-01 | 中建电子商务有限责任公司 | 一种基于密集目标检测的钢筋计数处理方法 |
-
2022
- 2022-08-04 CN CN202210931877.7A patent/CN115063410B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022121156A1 (zh) * | 2020-12-10 | 2022-06-16 | 平安科技(深圳)有限公司 | 图像中目标物检测方法、装置、电子设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
Guojun Wang 等.CenterNet3D: An Anchor free Object Detector for Autonomous Driving.《arxiV preprint arXiv:2007.07214》.2020,第1-9页. * |
Also Published As
Publication number | Publication date |
---|---|
CN115063410A (zh) | 2022-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111738124B (zh) | 基于Gabor变换和注意力的遥感图像云检测方法 | |
CN111401361B (zh) | 一种端到端的轻量级深度车牌识别方法 | |
CN110543878A (zh) | 一种基于神经网络的指针仪表读数识别方法 | |
CN112597985B (zh) | 一种基于多尺度特征融合的人群计数方法 | |
CN110246148B (zh) | 多模态的深度信息融合和注意力学习的显著性检测方法 | |
CN111340123A (zh) | 一种基于深度卷积神经网络的图像分数标签预测方法 | |
CN109190446A (zh) | 基于三元组聚焦损失函数的行人再识别方法 | |
CN113516124A (zh) | 基于计算机视觉技术的电能表用电信息识别算法 | |
CN109410238A (zh) | 一种基于PointNet++网络的枸杞识别计数方法 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
CN117495735B (zh) | 一种基于结构引导的建筑物立面纹理自动修复方法及系统 | |
CN115063410B (zh) | 一种基于无锚点目标检测的钢管计数方法 | |
CN112085072A (zh) | 基于时空特征信息的草图检索三维模型的跨模态检索方法 | |
CN114821299B (zh) | 一种遥感图像变化检测方法 | |
CN113077444A (zh) | 一种基于cnn的超声无损检测图像缺陷分类方法 | |
CN114092815A (zh) | 一种大范围光伏发电设施遥感智能提取方法 | |
CN112529908A (zh) | 一种基于级联卷积网络的数字病理图像分割方法及其模型 | |
CN117274789B (zh) | 一种水工混凝土结构水下裂缝语义分割方法 | |
CN114511787A (zh) | 一种基于神经网络的遥感图像地物信息生成方法及其系统 | |
CN114882490B (zh) | 一种基于点引导定位的无受限场景车牌检测分类方法 | |
CN116862883A (zh) | 基于图像语义分割的混凝土坍落度检测方法 | |
CN113673534B (zh) | 一种基于Faster RCNN的RGB-D图像果实检测方法 | |
CN115797765A (zh) | 基于边界提取和断点连接后处理的田块提取方法及系统 | |
CN115457366A (zh) | 基于图卷积神经网络的中草药多标签识别模型 | |
CN114998363B (zh) | 一种高分辨率遥感影像渐进式分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |