CN114283275B - 一种基于优化深度学习的多图形目标检测方法 - Google Patents

一种基于优化深度学习的多图形目标检测方法 Download PDF

Info

Publication number
CN114283275B
CN114283275B CN202210206214.9A CN202210206214A CN114283275B CN 114283275 B CN114283275 B CN 114283275B CN 202210206214 A CN202210206214 A CN 202210206214A CN 114283275 B CN114283275 B CN 114283275B
Authority
CN
China
Prior art keywords
iou
target detection
ellipse
data set
triangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210206214.9A
Other languages
English (en)
Other versions
CN114283275A (zh
Inventor
甘胜丰
吴笑民
师伟海
吴世杰
刘世超
李少义
罗德龙
雷维新
郭海强
李刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Jiayun Technology Co ltd
Huazhong Agricultural University
Nanchang Institute of Technology
Hubei University of Education
Original Assignee
Suzhou Jiayun Technology Co ltd
Huazhong Agricultural University
Nanchang Institute of Technology
Hubei University of Education
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Jiayun Technology Co ltd, Huazhong Agricultural University, Nanchang Institute of Technology, Hubei University of Education filed Critical Suzhou Jiayun Technology Co ltd
Priority to CN202210206214.9A priority Critical patent/CN114283275B/zh
Publication of CN114283275A publication Critical patent/CN114283275A/zh
Application granted granted Critical
Publication of CN114283275B publication Critical patent/CN114283275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于优化深度学习的多图形目标检测方法,包括以下步骤:采用标记工具对所需要识别的数据集进行标定,得到标定数据集;建立多目标检测模型;所述多目标检测模型包括选定模块和4个不同的计算模块;4个不同的计算模块分别用于预测圆形、椭圆、倾斜矩形和三角形目标;选定模块用于根据实际情况选定4个计算模块中的一个;利用标定数据集训练所述多目标检测模型,通过计算不同计算模块的iou及优化损失函数,得到训练完成的多目标检测模型;利用训练完成的多目标检测模型完成检测;有益效果是:相比于多个单独的目标检测算法,在检测速度效果上有所提升,单张图片处理速度平均缩短了18.8%,更适合用于工业和工程生产过程中。

Description

一种基于优化深度学习的多图形目标检测方法
技术领域
本发明涉及图像目标检测领域,更具体地说,涉及一种基于优化深度学习的多图形目标检测方法。
背景技术
现在主流的图形检测主要通过中值滤波去噪,通过图形的特性查找到图形的轮廓,再通过判断过滤,得到质量较高的识别结果,不同的图形特性也不同。
比如圆形可以使用Canny边缘检测和霍夫圆来得到图片中的圆形;椭圆可以通过拼接弧支撑线段,椭圆聚类,候选椭圆验证来得到高质量椭圆或使用随机Hough变换来识别椭圆,矩形和凸多边形也可以通过常规的算法来识别。
而常见的目标识别算法大多使用矩形框来预测、框选目标。另外也存在使用倾斜矩形框的算法如使用5参数的RRPN、R3det,8参数的Rsdet,极坐标的P-RSDet等来避免密集目标识别效果差等水平框存在的问题。
但对于某些特定的图形,矩形框的目标识别算法得到的矩形框不能较好的贴合物体,而图形检测如果用来目标识别存在被相同形状不同类别干扰的情况。
发明内容
由此,本发明要解决的技术问题在于,针对不同图形的目标检测时参数不同、以及某些特定的,存在相同形状干扰目标检测的问题,提出一种基于优化深度学习的多图形目标检测方法。
本发明提供的一种基于优化深度学习的多图形目标检测方法,包括以下步骤:
S101:采用标记工具对所需要识别的数据集进行标定,得到标定数据集;
S102:建立多目标检测模型;所述多目标检测模型包括选定模块和4个不同的计算模块;4个不同的计算模块分别用于预测圆形、椭圆、倾斜矩形和三角形目标;选定模块用于根据实际情况选定4个计算模块中的一个;
S103:利用标定数据集训练所述多目标检测模型,通过计算不同计算模块的iou及优化损失函数,得到训练完成的多目标检测模型;
S104:利用训练完成的多目标检测模型完成多目标检测。
进一步地,步骤S101中,对所需要识别的数据集进行标定,其标定规则具体为:使用多参数方法进行标定,多参数包括:x,y,w,h,r,2a,2b,c,theta,shape,它们分别代表需要预测目标的中心点x轴坐标、y轴坐标、倾斜矩形的宽w、高h、圆形半径r、椭圆两倍的长轴2a、短轴2b、三角形边长c、倾斜矩形和倾斜椭圆的夹角theta、图形类别shape;标定时,2a>2bw>h。
进一步地,步骤S103中,不同计算模块的iou具体指:圆形iou、椭圆iou、倾斜矩形iou、三角形iou。
进一步地,所述圆形iou的计算方法具体如下:
S201:获取标定数据集中的两圆中心点坐标(x4,y4)、(x6,y6),并再获取其对应的半径r4,r6
S202:计算圆心距离d:
Figure 49074DEST_PATH_IMAGE001
S203:通过两圆中心点之间的距离与半径判断两圆的位置关系, 位置关系分为:相离,包含,相交,具体如下式:
Figure 238747DEST_PATH_IMAGE002
S204:最终得到的圆形iou,如下式:
圆形iou=
Figure 138569DEST_PATH_IMAGE003
其中,S1、S2、Siou-inter的计算过程如下:
Figure 321990DEST_PATH_IMAGE004
O1、O2分别表示半径r4、r6的圆的圆心;A、B表示两个圆在相交情况下的两个交点。
进一步地,所述椭圆iou的具体计算方法如下:
S301:获取标定数据集中的两椭圆中心点坐标(x 1 ,y 1 )、(x 2 ,y 2 ),同时获取其长轴a 1 a 2 短轴b 1 b 2 、以及角度theta 1 、theta 2
S302:计算两椭圆的焦点长度c 1 ,c 2
Figure 312073DEST_PATH_IMAGE005
S303:计算椭圆的焦点的偏移量从d 1x ,d 1y ,d 2x ,d 2y 而得到焦点的坐标(c 11x ,c 11y ),(c 12x ,c 12y ),(c 21x ,c 21y ),(c 22x ,c 22y ),具体如下:
Figure 734964DEST_PATH_IMAGE006
S304:利用遍历像素点的方法通过判断椭圆内的点到焦点的距离是否小于两倍的长轴判断像素点是否在椭圆内,记两椭圆各自椭圆内的像素点的数量为n1, 两椭圆相交区域包含像素点的数量为n2,则得到椭圆iou计算公式如下:
椭圆iou=
Figure 122083DEST_PATH_IMAGE007
进一步地,所述倾斜矩形iou的计算方法具体如下:
S401:获取标定数据集中的两矩形中心点坐标(x 3 ,y 3 )、(x 4 ,y 4 ),长a 3 a 4, b 3 b 4 、角度theta 3 、theta 4
S402:计算两矩形的面积:
Figure 491885DEST_PATH_IMAGE008
S403:利用两矩形中心点坐标以及角度,通过opencv中旋转矩形交点方法判断矩形是否有交集,如果没有交集,则倾斜矩形iou=0;如果有交集,则倾斜矩形iou=s/(s 3+s 4-s),其中s表示两矩形之间的交集面积。
进一步地,所述三角形iou的计算方法具体如下:
S501:获取标定数据集中的两等边三角形边长c 1 ,c 2 和中心点坐标(x 1 ,y 1 )、(x 2,y 2 );
S502:通过边长和中心点坐标求得两三角形端点坐标(x 11 ,y 11 )、(x 12 ,y 12 )、(x 13 ,y 13 )、(x 21 ,y 21 )、(x 22 ,y 22 )、(x 23 ,y 23 );
S503:通过两三角形端点坐标判断两三角形是否存在包含情况,若存在,则三角形iou=s 1 /s 2 ;若不包含,进一步判断两三角形是否存在交点,若不存在,则三角形iou=0,若存在交点,则三角形iou=s /(s 1 +s 2 ),其中s 为两三角形重合区域面积,s 1 s 2 分别为小三角形面积和大三角形面积。
进一步地,步骤S103中所述的优化损失函数与圆形iou、椭圆iou以及倾斜矩形iou、三角形iou分别一一对应,分为圆形损失函数、椭圆损失函数、倾斜矩形损失函数以及三角形损失函数,具体如下:
loss1=1-圆形iou
loss2=1-椭圆iou
loss3=1-倾斜矩形iou
Loss4=1-三角形iou。
步骤S103中,在训练进行第一轮迭代时,默认使用倾斜矩形的iou与loss进行计算;正样本shape预测值根据二元交叉熵公式计算反向传播更新参数后用于新一轮的判断计算,通过判断此时的四个维度的shape值哪个最大,就使用相应的图形iou与对应的损失函数。
本发明提供的有益效果是:相比于一般的矩形框目标检测,本申请的目标检测算法更具有专业趋向性,解决了不同图形的目标检测时参数不同的问题,并实现了多图形目标检测的统一集合化。
相比于多个单独的目标检测算法,本算法在检测速度效果上也有所提升,单张图片处理速度平均缩短了18.8%,更适合用于工业和工程生产过程中。
附图说明
图1是本发明方法流程示意图;
图2表示两圆在相交情况下的示意图;
图3表示两椭圆相交情况下的示意图;
图4是本发明整体方法示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
请参考图1,图1是本发明方法流程示意图;
一种基于优化深度学习的多图形目标检测方法,包括以下步骤:
S101:采用标记工具对所需要识别的数据集进行标定,得到标定数据集;
作为一种实施例,步骤S101中,对所需要识别的数据集进行标定,其标定规则具体为:使用多参数方法进行标定,多参数包括:x,y,w,h,r,2a,2b,c,theta,shape,它们分别代表需要预测目标的中心点x轴坐标、y轴坐标、倾斜矩形的宽w、高h、圆形半径r、椭圆两倍的长轴2a、短轴2b、三角形边长c、倾斜矩形和倾斜椭圆的夹角theta、图形类别shape;标定时,2a>2bw>h。具体的说:在标定时需要确保2a>2bw>h(即椭圆都是x型椭圆或由x型椭圆旋转得来的椭圆,倾斜矩形都是由w>h的矩形或由w>h的矩形旋转得来的矩形)方便后续iou的计算与不同图形夹角的统一。另外需要注意只有倾斜矩形和倾斜椭圆是有夹角theta的,夹角指的是h边或以2b的延长线旋转后与水平线的夹角。
S102:建立多目标检测模型;所述多目标检测模型包括选定模块和4个不同的计算模块;4个不同的计算模块分别用于预测圆形、椭圆、倾斜矩形和三角形目标;选定模块用于根据实际情况选定4个计算模块中的一个;
S103:利用标定数据集训练所述多目标检测模型,通过计算不同计算模块的iou及优化损失函数,得到训练完成的多目标检测模型;
S104:利用训练完成的多目标检测模型完成多目标检测。
作为一种实施例,步骤S103中,不同计算模块的iou具体指:圆形iou、椭圆iou、倾斜矩形iou、三角形iou。
所述圆形iou的计算方法具体如下:
S201:获取标定数据集中的两圆中心点坐标(x4,y4)、(x6,y6),并再获取其对应的半径r4,r6
S202:计算圆心距离d:
Figure 943333DEST_PATH_IMAGE009
S203:通过两圆中心点之间的距离与半径判断两圆的位置关系, 位置关系分为:相离,包含,相交,具体如下式:
Figure 740387DEST_PATH_IMAGE010
S204:对于不同的位置关系,使用不同的计算方法计算交集。如果是相离情况iou(圆形)为0,如果是包含情况,iou为小圆的半径的平方比上大圆半径的平方。如果是相交(见图2)先计算出两圆形面积S1,S2与夹角a,再通过扇形面积计算出交集的大小,从而得到iou。
因此,最终得到的圆形iou,如下式:
圆形iou=
Figure 349223DEST_PATH_IMAGE011
需要说明的是,r4<r6;当r4大于且等于r6时,在包含情况下,圆形iou=r6 2/r4 2;即r4与r6进行互换,互换情况仅求解圆形iou在包含情况下,进行互换,下文计算中,不进行互换;
其中,S1、S2、Siou-inter的计算过程如下:
Figure 522716DEST_PATH_IMAGE012
O1、O2分别表示半径r4、r6的圆的圆心;请参考图2,图2表示两圆在相交情况下的示意图;A、B表示两个圆在相交情况下的两个交点。
所述椭圆iou的具体计算方法如下:
S301:获取标定数据集中的两椭圆中心点坐标(x 1 ,y 1 )、(x 2 ,y 2 ),同时获取其长轴a 1 a 2 短轴b 1 b 2 、以及角度theta 1 、theta 2
S302:计算两椭圆的焦点长度c 1 ,c 2
Figure 533397DEST_PATH_IMAGE005
S303:计算椭圆的焦点的偏移量从d 1x ,d 1y ,d 2x ,d 2y 而得到焦点的坐标(c 11x ,c 11y ),(c 12x ,c 12y ),(c 21x ,c 21y ),(c 22x ,c 22y ),具体如下:
Figure 563670DEST_PATH_IMAGE013
S304:利用遍历像素点的方法通过判断椭圆内的点到焦点的距离是否小于两倍的长轴判断像素点是否在椭圆内,请参考图3,图3表示两椭圆相交情况下的示意图;图3中,用1和2区别两个椭圆;记两椭圆各自椭圆内的像素点的数量为n1(图3中1和2的数目总和),两椭圆相交区域包含像素点的数量为n2(图3中2数目的总和),最终得到椭圆iou计算公式如下:
椭圆iou=
Figure 659802DEST_PATH_IMAGE007
所述倾斜矩形iou的计算方法具体如下:
S401:获取标定数据集中的两矩形中心点坐标(x 3 ,y 3 )、(x 4 ,y 4 ),长a 3 a 4, b 3 b 4 、角度theta 3 、theta 4
S402:计算两矩形的面积:
Figure 371406DEST_PATH_IMAGE014
S403:判断矩形是否有交集,如果没有交集,则倾斜矩形iou=0;如果有交集,则倾斜矩形iou=s/(s 3+s 4-s),其中s表示两矩形之间的交集面积。
作为一种实施例,本申请中判断矩形是否有交集,采用的是cv2.rotatedRectangleIntersection方法,该方法返回值为0,1,2分别表示没有,有,包含,以及一个由两矩形交点内含点组成的阵列。
作为一种实施例,本申请中,若矩形有交集,则采用cv2.convexHull生成凸包,并用cv2.contourArea计算凸包面积s(两矩形交集面积)。
所述三角形iou的计算方法具体如下:
S501:获取标定数据集中的两等边三角形边长c 1 ,c 2 和中心点坐标(x 1 ,y 1 )、(x 2,y 2 );
S502:通过边长和中心点坐标求得两三角形端点坐标(x 11 ,y 11 )、(x 12 ,y 12 )、(x 13 ,y 13 )、(x 21 ,y 21 )、(x 22 ,y 22 )、(x 23 ,y 23 );坐标计算式如下:
Figure 236594DEST_PATH_IMAGE015
S503:通过两三角形端点坐标判断两三角形是否存在包含情况(只需遍历三角形的端点判断是否端点都在另一个三角形的区域内过边界上),若存在(内切情况算作包含不做另外讨论),则三角形iou=s 1 /s 2 ;若不包含,进一步判断两三角形是否存在交点,若不存在,则三角形iou=0,若存在交点,则三角形
iou=s /(s 1 +s 2 ),其中s 为两三角形重合区域面积,s 1 s 2 分别为小三角形面积和 大三角形面积。存在交点情况下通过三角形内部点到交点的距离确定重合三角形的边长从 而求得相交区域面积从而求得iou公式如下:
Figure 375451DEST_PATH_IMAGE016
其中(x3,y3)为落入另一个三角形内部的点。
作为一种实施例,不同的图形由不同的计算模块使用不同的损失函数进行计算。
步骤S103中所述的优化损失函数与圆形iou、椭圆iou以及倾斜矩形iou、三角形iou分别一一对应,分为圆形损失函数、椭圆损失函数、倾斜矩形损失函数以及三角形损失函数,具体如下:
loss1=1-圆形iou
loss2=1-椭圆iou
loss3=1-倾斜矩形iou
Loss4=1-三角形iou.
另外,关于存在角度图形如椭圆,倾斜图形角度的损失区别于其他损失,单独使用MSE损失进行计算,则完整的损失计算公式如下:
Figure 958879DEST_PATH_IMAGE017
其中λcoord和λnoobj为系数,S2,B用来控制遍历所有预测框;
Figure 270912DEST_PATH_IMAGE018
当为正样本是为 1,否则为0;
Figure 256185DEST_PATH_IMAGE019
仅当本轮迭代shape值对应的相应图形最大时为1,否则为0(即4个
Figure 565944DEST_PATH_IMAGE020
中 只有一个为1其余为0);
Figure 636668DEST_PATH_IMAGE021
为负样本是为1,否则为0。n代表类别数;pc为置信度。
在训练进行第一轮迭代时,默认使用倾斜矩形的iou与loss进行计算。正样本shape预测值根据二元交叉熵公式计算反向传播更新参数后用于新一轮的判断计算,通过判断此时的四个维度的shape值哪个最大,就使用相应的图形iou与对应的损失函数。
下面给出计算公式,二元交叉熵损失和激活函数如下:
Figure 690075DEST_PATH_IMAGE022
其中shape标签为shape的标签值非0即1,shape值对应本轮形状的预测值范围在0,1之间,s(x)为sigmoid激活函数;
Loss对shape值求偏导,计算如下:
Figure 592172DEST_PATH_IMAGE023
求得偏导后后续便可根据动量梯度下降法迭代更新参数:
Figure 72832DEST_PATH_IMAGE024
其中
Figure 365273DEST_PATH_IMAGE025
为第i轮的动量梯度,β为动量参数,shapei为第i轮的shape预测值,α 为学习率。值得注意不同维度的标签值表示为那个维度是否是对应的图形,如倾斜椭圆维 度为1表示此目标形状为倾斜椭圆,相应的倾斜矩形维度与圆形维度和三角形维度的shape 标签为0。
请参考图4,图4是本发明方法的整体示意图;作为一个实施例,算法本身作为一个整体,识别单形状目标或多形状目标无需进行格外的说明,只需将所要识别的图形形状在包含图片形状信息的文件中的值与数据集中的shape值对应即可。本算法支持四种形状分别为椭圆,圆形,旋转矩形,等边三角形即最多四种,最少一种。
本申请方法在显卡为2080TI的配置下进行试验,得到的结果如下表:
表1 不同方法不同阶段单张图片平均处理时间
Figure 222370DEST_PATH_IMAGE026
从结果可以看出,图形框检测算法在较好的融合实现其他图形检测的同时,单张图片的需要检测的时间相比于分别单独检测四种图形框缩短了18.8%,更适合用于工业和工程生产过程中。
本发明的有益效果是:相比于一般的矩形框目标检测,本申请的目标检测算法更具有专业趋向性,解决了不同图形的目标检测时参数不同的问题,并实现了多图形目标检测的统一集合化。相比于多个单独的目标检测算法,本算法在检测速度效果上也有所提升,单张图片处理速度平均缩短了18.8%,更适合用于工业和工程生产过程中。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于优化深度学习的多图形目标检测方法,其特征在于:包括以下步骤:
S101:采用标记工具对所需要识别的数据集进行标定,得到标定数据集;
步骤S101中,对所需要识别的数据集进行标定,其标定规则具体为:使用多参数方法进行标定,多参数包括:x,y,w,h,r,2a,2b,c,theta,shape,它们分别代表需要预测目标的中心点x轴坐标、y轴坐标、倾斜矩形的宽w、高h、圆形半径r、椭圆两倍的长轴2a、短轴2b、三角形边长c、倾斜矩形和倾斜椭圆的夹角theta、图形类别shape;标定时,2a>2bw>h
S102:建立多目标检测模型;所述多目标检测模型包括选定模块和4个不同的计算模块;4个不同的计算模块分别用于预测圆形、椭圆、倾斜矩形和三角形目标;选定模块用于根据实际情况选定4个计算模块中的一个;
S103:利用标定数据集训练所述多目标检测模型,通过计算不同计算模块的iou及优化损失函数,得到训练完成的多目标检测模型;
步骤S103中,不同计算模块的iou具体指:圆形iou、椭圆iou、倾斜矩形iou、三角形iou;
所述椭圆iou的具体计算方法如下:
S301:获取标定数据集中的两椭圆中心点坐标(x 1 ,y 1 )、(x 2 ,y 2 ),同时获取其长轴a 1 a 2 短轴b 1 b 2 、以及角度theta 1 、theta 2
S302:计算两椭圆的焦点长度c 1 ,c 2
Figure 932858DEST_PATH_IMAGE001
S303:计算椭圆的焦点的偏移量从d 1x ,d 1y ,d 2x ,d 2y 而得到焦点的坐标(c 11x ,c 11y ),(c 12x ,c 12y ),(c 21x ,c 21y ),(c 22x ,c 22y ),具体如下:
Figure 849998DEST_PATH_IMAGE002
S304:利用遍历像素点的方法通过判断椭圆内的点到焦点的距离是否小于两倍的长轴判断像素点是否在椭圆内,记两椭圆各自椭圆内的像素点的数量为n1,两椭圆相交区域包含像素点的数量为n2,则得到椭圆iou计算公式如下:
椭圆iou=
Figure 629735DEST_PATH_IMAGE003
步骤S103中所述的优化损失函数与圆形iou、椭圆iou以及倾斜矩形iou、三角形iou分别一一对应,分为圆形损失函数、椭圆损失函数、倾斜矩形损失函数以及三角形损失函数,具体如下:
loss1=1-圆形iou
loss2=1-椭圆iou
loss3=1-倾斜矩形iou
Loss4=1-三角形iou;
步骤S103中,在训练进行第一轮迭代时,默认使用倾斜矩形的iou与loss进行计算;正样本shape预测值根据二元交叉熵公式计算反向传播更新参数后用于新一轮的判断计算,通过判断此时的四个维度的shape值哪个最大,就使用相应的图形iou与对应的损失函数;
S104:利用训练完成的多目标检测模型对输入的一幅 图像同时完成多目标检测。
2.如权利要求1所述的一种基于优化深度学习的多图形目标检测方法,其特征在于:所述圆形iou的计算方法具体如下:
S201:获取标定数据集中的两圆中心点坐标(x4,y4)、(x6,y6),并再获取其对应的半径r4,r6
S202:计算圆心距离d:
Figure 962628DEST_PATH_IMAGE004
S203:通过两圆中心点之间的距离与半径判断两圆的位置关系, 位置关系分为:相离,包含,相交,具体如下式:
Figure 777000DEST_PATH_IMAGE005
S204:最终得到的圆形iou,如下式:
圆形iou=
Figure 599462DEST_PATH_IMAGE006
其中,S1、S2、Siou-inter的计算过程如下:
Figure 866496DEST_PATH_IMAGE008
O1、O2分别表示半径r4、r6的圆的圆心;A、B表示两个圆在相交情况下的两个交点。
3.如权利要求1所述的一种基于优化深度学习的多图形目标检测方法,其特征在于:所述倾斜矩形iou的计算方法具体如下:
S401:获取标定数据集中的两矩形中心点坐标(x 3 ,y 3 )、(x 4 ,y 4 ),长a 3 a 4 ,宽b 3 b 4 、角度theta 3 、theta 4
S402:计算两矩形的面积:
Figure DEST_PATH_IMAGE009
S403:利用两矩形中心点坐标以及角度,通过opencv中旋转矩形交点方法判断矩形是否有交集,如果没有交集,则倾斜矩形iou=0;如果有交集,则倾斜矩形iou=s/(s 3+s 4-s),其中s表示两矩形之间的交集面积。
4.如权利要求1所述的一种基于优化深度学习的多图形目标检测方法,其特征在于:所述三角形iou的计算方法具体如下:
S501:获取标定数据集中的两等边三角形边长c 1 ,c 2 和中心点坐标(x 1 ,y 1 )、(x 2,y 2 );
S502:通过边长和中心点坐标求得两三角形端点坐标(x 11 ,y 11 )、(x 12 ,y 12 )、(x 13 ,y 13 )、(x 21 ,y 21 )、(x 22 ,y 22 )、(x 23 ,y 23 );
S503:通过两三角形端点坐标判断两三角形是否存在包含情况,若存在,则三角形iou=s 1 /s 2 ;若不包含,进一步判断两三角形是否存在交点,若不存在,则三角形iou=0,若存在交点,则三角形iou=s /(s 1 +s 2 ),其中s 为两三角形重合区域面积,s 1 s 2 分别为小三角形面积和大三角形面积。
CN202210206214.9A 2022-03-04 2022-03-04 一种基于优化深度学习的多图形目标检测方法 Active CN114283275B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210206214.9A CN114283275B (zh) 2022-03-04 2022-03-04 一种基于优化深度学习的多图形目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210206214.9A CN114283275B (zh) 2022-03-04 2022-03-04 一种基于优化深度学习的多图形目标检测方法

Publications (2)

Publication Number Publication Date
CN114283275A CN114283275A (zh) 2022-04-05
CN114283275B true CN114283275B (zh) 2022-08-16

Family

ID=80882201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210206214.9A Active CN114283275B (zh) 2022-03-04 2022-03-04 一种基于优化深度学习的多图形目标检测方法

Country Status (1)

Country Link
CN (1) CN114283275B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288049A (zh) * 2019-07-02 2019-09-27 北京字节跳动网络技术有限公司 用于生成图像识别模型的方法和装置
CN112418212A (zh) * 2020-08-28 2021-02-26 西安电子科技大学 一种基于EIoU改进的YOLOv3算法
CN113469302A (zh) * 2021-09-06 2021-10-01 南昌工学院 一种视频图像的多圆形目标识别方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305248B (zh) * 2018-01-17 2020-05-29 慧影医疗科技(北京)有限公司 一种骨折识别模型的构建方法及应用
CN109785298B (zh) * 2018-12-25 2021-03-05 中国科学院计算技术研究所 一种多角度物体检测方法和系统
CN110223302B (zh) * 2019-05-08 2021-11-19 华中科技大学 一种基于旋转区域提取的舰船多目标检测方法
CN110598692B (zh) * 2019-08-09 2021-04-13 清华大学 一种基于深度学习的椭圆识别方法
CN112634256B (zh) * 2020-12-30 2024-03-15 杭州三坛医疗科技有限公司 圆检测及拟合方法、装置、电子设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288049A (zh) * 2019-07-02 2019-09-27 北京字节跳动网络技术有限公司 用于生成图像识别模型的方法和装置
CN112418212A (zh) * 2020-08-28 2021-02-26 西安电子科技大学 一种基于EIoU改进的YOLOv3算法
CN113469302A (zh) * 2021-09-06 2021-10-01 南昌工学院 一种视频图像的多圆形目标识别方法和系统

Also Published As

Publication number Publication date
CN114283275A (zh) 2022-04-05

Similar Documents

Publication Publication Date Title
WO2022148192A1 (zh) 图像处理方法、图像处理装置以及非瞬时性存储介质
CN112949564B (zh) 一种基于深度学习的指针式仪表自动读数方法
TW202101377A (zh) 目標檢測及目標檢測網路的訓練方法、裝置、設備及儲存媒體
CN111665842B (zh) 一种基于语义信息融合的室内slam建图方法及系统
JP6262748B2 (ja) 教師あり形状ランク付けに基づく生物学的単位の識別
AU2018206791A1 (en) Systems and methods for detecting grasp poses for handling target objects
CN109977997B (zh) 基于卷积神经网络快速鲁棒的图像目标检测与分割方法
CN111832659B (zh) 一种基于特征点提取算法检测的激光标刻系统及方法
JP2006053919A (ja) 画像データ分離システム及びその方法
CN105184763A (zh) 图像处理方法和装置
WO2020107326A1 (zh) 车道线检测方法、设备、计算机可读存储介质
CN107192716A (zh) 一种基于轮廓特征的工件缺陷快速检测方法
CN114419467A (zh) 旋转船只目标检测模型的训练方法、训练装置和存储介质
CN110443242B (zh) 读数框检测方法、目标识别模型训练方法及相关装置
CN112800955A (zh) 基于加权双向特征金字塔的遥感影像旋转目标检测方法及系统
CN115609591A (zh) 一种基于2D Marker的视觉定位方法和系统、复合机器人
CN115861368A (zh) 一种针对多类图像的多类轮廓跟踪方法、装置和介质
CN117788472B (zh) 一种基于dbscan算法的飞机蒙皮表面铆钉腐蚀程度判断的方法
CN114283275B (zh) 一种基于优化深度学习的多图形目标检测方法
CN113420648B (zh) 一种具有旋转适应性的目标检测方法及系统
CN111598911B (zh) 一种机器人平台的自主巡线方法、装置及存储介质
CN116342631A (zh) 环形区域及环形区域目标特征检测方法、检测设备
CN115112098A (zh) 一种单目视觉的一维二维测量方法
CN113033593B (zh) 基于深度学习的文本检测训练方法及装置
CN112419331A (zh) 一种图像分割方法、装置、终端、存储介质及处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant