CN113344113A - 一种基于改进k-means聚类的Yolov3锚框确定方法 - Google Patents

一种基于改进k-means聚类的Yolov3锚框确定方法 Download PDF

Info

Publication number
CN113344113A
CN113344113A CN202110715329.6A CN202110715329A CN113344113A CN 113344113 A CN113344113 A CN 113344113A CN 202110715329 A CN202110715329 A CN 202110715329A CN 113344113 A CN113344113 A CN 113344113A
Authority
CN
China
Prior art keywords
clustering
yolov3
anchor frame
sample
improved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110715329.6A
Other languages
English (en)
Other versions
CN113344113B (zh
Inventor
张涛
张驰
赵声根
肖扬
王恩东
刘咏怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202110715329.6A priority Critical patent/CN113344113B/zh
Publication of CN113344113A publication Critical patent/CN113344113A/zh
Application granted granted Critical
Publication of CN113344113B publication Critical patent/CN113344113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供的是一种基于改进k‑means聚类的Yolov3锚框确定方法。本发明改变传统一次k‑means聚类直接得到Yolov3锚框的方法,对样本数据进行两次聚类。第一次聚类把样本数据聚类到不同大小的三个尺度上,达到尺度分化的目的。第二次聚类在前一次聚类得到的三个聚类子集的基础上,根据样本标注框的形状特征再次进行聚类,最终得到分布三个尺度下的9个聚类结果,适配Yolov3的锚框。本发明利用两次聚类得到的锚框更加符合Yolov3的检测过程,能够减少k‑means随机初始点对最终结果的影响,两次聚类大大减少了样本的数据量,提高算法速度。

Description

一种基于改进k-means聚类的Yolov3锚框确定方法
技术领域
本发明涉及锚框确定方法领域,特别是涉及一种基于改进k-means聚类的Yolov3锚框确定方法,适用于确定Yolov3目标检测算法的锚框。
背景技术
近年来,随着计算机算力的突破性发展,涌现出多种以深度学习为基础的目标检测技术。作为其中代表之一,Yolov3凭借检测速度快,精度高的特点,被广泛应用于目标跟踪,环境探测,物体识别等领域。从Yolov2开始,Yolo系列算法开始借鉴Faster R-CNN的思想,引入锚框预先给出检测目标的粗略尺寸,避免算法训练过程中盲目学习目标的尺寸和位置,提高了模型的表示能力,选择合适的锚框能够有效提高算法的训练结果和检测精度。作为Yolo2的改进版本,Yolov3的锚框数量由原来的5个增加至9个,根据大小分为三组,将这些锚框分布到特征图上,再通过网络预测这些锚框的偏移量。
传统Yolov3锚框是利用k-means算法进行聚类得到,但是k-means随机生成的聚类初始点对最后的聚类结果有很大影响,易导致每次聚类结果差别严重,难以选择合适的数据作为最终的结果。此外,K-means聚类没有考虑Yolov3其实是在不同尺度下实现检测的,因此最终得到的聚类结果在尺寸上没有明显的差别,难以根据算法要求对这些锚框进行排序,如果直接将聚类结果应用到各个尺度的特征图进行检测,难以达到理想的效果。
发明内容
针对传统k-means聚类得到的Yolov3锚框,无法合理分配到不同检测尺度上的问题,本发明提供一种基于改进k-means聚类的Yolov3锚框确定方法,本发明提出两次聚类的方法,得到适合不同检测尺度的锚框。
本发明提供一种基于改进k-means聚类的Yolov3锚框确定方法,包括以下步骤:
步骤1:Yolov3使用的数据集标注文件格式为(c*,x*,y*,w*,h*),包括目标的类别c*,标注框的中心位置坐标(x*,y*)以及宽度和高度(w*,h*),w=w*/W,h=h*/H,其中W和H分别为图像的宽和高,归一化结果(w,h)作为聚类的样本;
步骤2:计算每个样本标注框的面积,根据面积大小,将样本等分为三个子集(A,B,C),计算每个子集内样本的平均宽和高,作为第一次聚类初始值。对全体样本进行第一次k-means聚类,距离函数在IOU的基础上,增加了尺度信息,具体形式为:d=(1-λ)*(1-IOU)+2λ*(σ(Sr)-0.5),其中,IOU为标注框与聚类中心的交并比,Sr为两者面积差值与聚类中心面积比值的绝对值,λ为权重系数,σ为Sigmoid变换,将Sr限制到0.5-1;
步骤3:根据第一次聚类结果,更新子集数据,得到三个不同尺度下的新子集(A',B',C');
步骤4:为了减少随机初始值对聚类结果的影响,三个新子集(A',B',C')分别利用k-means++算法进行聚类,距离函数为:d=1-IOU;
步骤5:两次聚类得到分布在三个不同尺度上的9个聚类点,按顺序排列后,替换Yolov3原来的锚框数据。
作为本发明进一步改进,步骤2计算3个子集的平均宽和高作为第一次聚类初始点。
作为本发明进一步改进,步骤2对样本进行第一次聚类,距离函数增加了样本的尺度信息,将样本划分到三个不同的尺度下。
作为本发明进一步改进,步骤4在三个子集下选取聚类初始点的选择上,增加了概率加权,使初始点位置尽可能分散。
本发明与现有技术相比的优点在于:传统Yolov3仅进行一次聚类,提取得到的9个锚框,没有考虑聚类框在不同尺度上的分布,可能导致仅对特定尺度的目标检测效果较好;随机生成的初始值对最终的聚类结果有很大影响,导致每次聚类结果差别严重,难以选择合适的数据作为最终结果。针对以上的不足,本发明提出的两次聚类方法,第一次聚类增加了尺度因素的影响,使得最终的锚框能够较为均匀地分布在不同尺寸上;第一次聚类以子集内样本均值作为初始值,第二次聚类根据k-means++算法选择初始值,尽量使得聚类初始点分散开来,大大降低了随机初始值对聚类结果的影响;分两次聚类,虽然增加了聚类次数,但每次迭代的样本数量大大减少,极大减少了数据的复杂度,有效提高了算法速度。
附图说明
图1为锚框聚类整体流程图;
图2为第一次聚类结果;
图3为第二次聚类结果;
图4为传统k-means与本发明提出的两次k-means算法在不同样本数量下的运行时间对比。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
本发明提供一种基于改进k-means聚类的Yolov3锚框确定方法,本发明提出两次聚类的方法,得到适合不同检测尺度的锚框。
作为本发明具体实施例,其中锚框聚类整体流程图如图1所示,第一次聚类结果如图2所示,第二次聚类结果如图3所示,传统k-means与本发明提出的两次k-means算法在不同样本数量下的运行时间对比如图4所示,本发明具体步骤如下;
步骤一:选取COCO数据集中的3000份标注文件,共包含21405份标注信息,标注格式为(c*,x*,y*,w*,h*),包括目标的类别c*,标注框的中心位置坐标(x*,y*)以及宽度和高度(w*,h*),w=w*/W,h=h*/H,其中W和H分别为图像的宽和高,归一化结果(w,h)作为聚类的样本;
步骤二:计算每个样本标注框的面积,根据面积大小,将样本等分为三个子集(A,B,C),计算每个子集内样本的平均宽和高(wA0,hA0),(wB0,hB0),(wC0,hC0),以子集的平均宽和高为初始值,对全体样本进行k-means聚类,距离函数在IOU的基础上,增加尺度信息,具体形式为:d=(1-λ)*(1-IOU)+2λ*(σ(Sr)-0.5),其中,IOU为标注框与聚类中心的交并比,Sr为两者面积差值与聚类中心面积比值的绝对值,λ为权重系数,σ为Sigmoid变换,将Sr限制到0.5-1;
步骤三:根据第一次聚类结果,更新得到三个不同尺度下的子集(A',B',C');
步骤四:为了减少随机初始值对聚类结果的影响,三个新子集(A',B',C')分别利用k-means++算法进行初始值的确定。具体过程是:随机选择一个样本作为第一个聚类初始点,计算其他所有样本与已确定聚类点的最小距离d,其中,d=1-IOU,d越大者,表明该样本与其他聚类初始点的距离越远,有更高的可能性被选择为下一个聚类初始点,在加权概率的基础上,随机选择一个新的聚类点,重复这一过程,直至完成三个初始聚类点的选择,后面依照k-means算法过程完成聚类;
步骤五:两次聚类得到分布在三个不同尺度上的9个聚类点,按顺序排列,替换Yolov3原来的锚框数据。
以上所述,仅是本发明的较佳实施例之一,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。

Claims (4)

1.一种基于改进k-means聚类的Yolov3锚框确定方法,其特征在于:包括以下步骤:
步骤1:Yolov3使用的数据集标注文件格式为(c*,x*,y*,w*,h*),包括目标的类别c*,标注框的中心位置坐标(x*,y*)以及宽度和高度(w*,h*),w=w*/W,h=h*/H,其中W和H分别为图像的宽和高,归一化结果(w,h)作为聚类的样本;
步骤2:计算每个样本标注框的面积,根据面积大小,将样本等分为三个子集(A,B,C),计算每个子集内样本的平均宽和高,作为第一次聚类初始值。对全体样本进行第一次k-means聚类,距离函数在IOU的基础上,增加了尺度信息,具体形式为:d=(1-λ)*(1-IOU)+2λ*(σ(Sr)-0.5),其中,IOU为标注框与聚类中心的交并比,Sr为两者面积差值与聚类中心面积比值的绝对值,λ为权重系数,σ为Sigmoid变换,将Sr限制到0.5-1;
步骤3:根据第一次聚类结果,更新子集数据,得到三个不同尺度下的新子集(A',B',C');
步骤4:为了减少随机初始值对聚类结果的影响,三个新子集(A',B',C')分别利用k-means++算法进行聚类,距离函数为:d=1-IOU;
步骤5:两次聚类得到分布在三个不同尺度上的9个聚类点,按顺序排列后,替换Yolov3原来的锚框数据。
2.根据权利要求1所述的一种基于改进k-means聚类的Yolov3锚框确定方法,其特征在于:步骤2计算3个子集的平均宽和高作为第一次聚类初始点。
3.根据权利要求1所述一种基于改进k-means聚类的Yolov3锚框确定方法,其特征在于:步骤2对样本进行第一次聚类,距离函数增加了样本的尺度信息,将样本划分到三个不同的尺度下。
4.根据权利要求1所述一种基于改进k-means聚类的Yolov3锚框确定方法,其特征在于:步骤4在三个子集下选取聚类初始点的选择上,增加了概率加权,使初始点位置尽可能分散。
CN202110715329.6A 2021-06-27 2021-06-27 一种基于改进k-means聚类的Yolov3锚框确定方法 Active CN113344113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110715329.6A CN113344113B (zh) 2021-06-27 2021-06-27 一种基于改进k-means聚类的Yolov3锚框确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110715329.6A CN113344113B (zh) 2021-06-27 2021-06-27 一种基于改进k-means聚类的Yolov3锚框确定方法

Publications (2)

Publication Number Publication Date
CN113344113A true CN113344113A (zh) 2021-09-03
CN113344113B CN113344113B (zh) 2024-03-19

Family

ID=77478940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110715329.6A Active CN113344113B (zh) 2021-06-27 2021-06-27 一种基于改进k-means聚类的Yolov3锚框确定方法

Country Status (1)

Country Link
CN (1) CN113344113B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949385A (zh) * 2021-01-24 2021-06-11 西北工业大学 一种基于光视觉的水面目标检测与识别方法
CN113516105A (zh) * 2021-09-07 2021-10-19 腾讯科技(深圳)有限公司 一种车道检测方法、装置及计算机可读存储介质
CN115661499A (zh) * 2022-12-08 2023-01-31 常州星宇车灯股份有限公司 智能驾驶预设锚框的确定装置、方法及存储介质
CN118015388A (zh) * 2024-04-10 2024-05-10 西南科技大学 小目标检测方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200265591A1 (en) * 2019-04-23 2020-08-20 Jiangnan University Visual Multi-Object Tracking based on Multi-Bernoulli Filter with YOLOv3 Detection
CN111652836A (zh) * 2020-03-19 2020-09-11 天津大学 一种基于聚类算法和神经网络的多尺度目标检测方法
CN112861744A (zh) * 2021-02-20 2021-05-28 哈尔滨工程大学 一种基于旋转锚点聚类的遥感图像目标快速检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200265591A1 (en) * 2019-04-23 2020-08-20 Jiangnan University Visual Multi-Object Tracking based on Multi-Bernoulli Filter with YOLOv3 Detection
CN111652836A (zh) * 2020-03-19 2020-09-11 天津大学 一种基于聚类算法和神经网络的多尺度目标检测方法
CN112861744A (zh) * 2021-02-20 2021-05-28 哈尔滨工程大学 一种基于旋转锚点聚类的遥感图像目标快速检测方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949385A (zh) * 2021-01-24 2021-06-11 西北工业大学 一种基于光视觉的水面目标检测与识别方法
CN112949385B (zh) * 2021-01-24 2022-12-23 西北工业大学 一种基于光视觉的水面目标检测与识别方法
CN113516105A (zh) * 2021-09-07 2021-10-19 腾讯科技(深圳)有限公司 一种车道检测方法、装置及计算机可读存储介质
CN115661499A (zh) * 2022-12-08 2023-01-31 常州星宇车灯股份有限公司 智能驾驶预设锚框的确定装置、方法及存储介质
CN118015388A (zh) * 2024-04-10 2024-05-10 西南科技大学 小目标检测方法、装置及存储介质

Also Published As

Publication number Publication date
CN113344113B (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
CN113344113A (zh) 一种基于改进k-means聚类的Yolov3锚框确定方法
CN113449594B (zh) 一种多层网络组合的遥感影像地类语义分割与面积计算方法
CN106228185B (zh) 一种基于神经网络的通用图像分类识别系统及方法
CN111783844B (zh) 基于深度学习的目标检测模型训练方法、设备及存储介质
CN108540988B (zh) 一种场景划分方法及装置
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN114663373B (zh) 一种用于零件表面质量检测的点云配准方法及装置
CN112116952A (zh) 基于扩散及混沌局部搜索的灰狼优化算法的基因选择方法
CN113988203A (zh) 一种基于深度学习的轨迹序列聚类方法
CN111259808A (zh) 一种基于改进ssd算法的交通标识的检测识别方法
CN113723492A (zh) 一种改进主动深度学习的高光谱图像半监督分类方法及装置
CN111723897A (zh) 一种基于粒子群算法的多模态特征选择方法
CN113435108A (zh) 一种基于改进的鲸鱼优化算法的战场目标分群方法
CN114201632B (zh) 一种面向多标记目标检测任务的标签带噪数据集扩增方法
CN113420173A (zh) 基于四元组深度学习的少数民族服饰图像检索方法
CN117830873B (zh) 一种城乡规划图像的数据处理方法
CN108846845A (zh) 基于缩略图与分层模糊聚类的sar图像分割方法
CN113298184B (zh) 用于小样本图像识别的样本抽取、扩充方法及存储介质
CN106251004B (zh) 基于改进空间距离划分的目标分群方法
CN113223098B (zh) 图像颜色分类的预处理优化方法
CN117634806A (zh) 电动汽车负荷聚合方法、系统、设备及介质
KR100895261B1 (ko) 평형기반 서포트 벡터를 이용한 귀납적이고 계층적인군집화 방법
CN116844040A (zh) 一种基于双流结构的小样本遥感图像场景分类方法
CN110956177A (zh) 一种混合型验证码的识别方法及系统
CN115661504A (zh) 基于迁移学习和视觉词包的遥感样本分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant