CN113344113A - 一种基于改进k-means聚类的Yolov3锚框确定方法 - Google Patents
一种基于改进k-means聚类的Yolov3锚框确定方法 Download PDFInfo
- Publication number
- CN113344113A CN113344113A CN202110715329.6A CN202110715329A CN113344113A CN 113344113 A CN113344113 A CN 113344113A CN 202110715329 A CN202110715329 A CN 202110715329A CN 113344113 A CN113344113 A CN 113344113A
- Authority
- CN
- China
- Prior art keywords
- clustering
- yolov3
- anchor frame
- sample
- improved
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000003064 k means clustering Methods 0.000 title claims abstract description 17
- 238000002372 labelling Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 11
- 230000008569 process Effects 0.000 abstract description 5
- 230000004069 differentiation Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明提供的是一种基于改进k‑means聚类的Yolov3锚框确定方法。本发明改变传统一次k‑means聚类直接得到Yolov3锚框的方法,对样本数据进行两次聚类。第一次聚类把样本数据聚类到不同大小的三个尺度上,达到尺度分化的目的。第二次聚类在前一次聚类得到的三个聚类子集的基础上,根据样本标注框的形状特征再次进行聚类,最终得到分布三个尺度下的9个聚类结果,适配Yolov3的锚框。本发明利用两次聚类得到的锚框更加符合Yolov3的检测过程,能够减少k‑means随机初始点对最终结果的影响,两次聚类大大减少了样本的数据量,提高算法速度。
Description
技术领域
本发明涉及锚框确定方法领域,特别是涉及一种基于改进k-means聚类的Yolov3锚框确定方法,适用于确定Yolov3目标检测算法的锚框。
背景技术
近年来,随着计算机算力的突破性发展,涌现出多种以深度学习为基础的目标检测技术。作为其中代表之一,Yolov3凭借检测速度快,精度高的特点,被广泛应用于目标跟踪,环境探测,物体识别等领域。从Yolov2开始,Yolo系列算法开始借鉴Faster R-CNN的思想,引入锚框预先给出检测目标的粗略尺寸,避免算法训练过程中盲目学习目标的尺寸和位置,提高了模型的表示能力,选择合适的锚框能够有效提高算法的训练结果和检测精度。作为Yolo2的改进版本,Yolov3的锚框数量由原来的5个增加至9个,根据大小分为三组,将这些锚框分布到特征图上,再通过网络预测这些锚框的偏移量。
传统Yolov3锚框是利用k-means算法进行聚类得到,但是k-means随机生成的聚类初始点对最后的聚类结果有很大影响,易导致每次聚类结果差别严重,难以选择合适的数据作为最终的结果。此外,K-means聚类没有考虑Yolov3其实是在不同尺度下实现检测的,因此最终得到的聚类结果在尺寸上没有明显的差别,难以根据算法要求对这些锚框进行排序,如果直接将聚类结果应用到各个尺度的特征图进行检测,难以达到理想的效果。
发明内容
针对传统k-means聚类得到的Yolov3锚框,无法合理分配到不同检测尺度上的问题,本发明提供一种基于改进k-means聚类的Yolov3锚框确定方法,本发明提出两次聚类的方法,得到适合不同检测尺度的锚框。
本发明提供一种基于改进k-means聚类的Yolov3锚框确定方法,包括以下步骤:
步骤1:Yolov3使用的数据集标注文件格式为(c*,x*,y*,w*,h*),包括目标的类别c*,标注框的中心位置坐标(x*,y*)以及宽度和高度(w*,h*),w=w*/W,h=h*/H,其中W和H分别为图像的宽和高,归一化结果(w,h)作为聚类的样本;
步骤2:计算每个样本标注框的面积,根据面积大小,将样本等分为三个子集(A,B,C),计算每个子集内样本的平均宽和高,作为第一次聚类初始值。对全体样本进行第一次k-means聚类,距离函数在IOU的基础上,增加了尺度信息,具体形式为:d=(1-λ)*(1-IOU)+2λ*(σ(Sr)-0.5),其中,IOU为标注框与聚类中心的交并比,Sr为两者面积差值与聚类中心面积比值的绝对值,λ为权重系数,σ为Sigmoid变换,将Sr限制到0.5-1;
步骤3:根据第一次聚类结果,更新子集数据,得到三个不同尺度下的新子集(A',B',C');
步骤4:为了减少随机初始值对聚类结果的影响,三个新子集(A',B',C')分别利用k-means++算法进行聚类,距离函数为:d=1-IOU;
步骤5:两次聚类得到分布在三个不同尺度上的9个聚类点,按顺序排列后,替换Yolov3原来的锚框数据。
作为本发明进一步改进,步骤2计算3个子集的平均宽和高作为第一次聚类初始点。
作为本发明进一步改进,步骤2对样本进行第一次聚类,距离函数增加了样本的尺度信息,将样本划分到三个不同的尺度下。
作为本发明进一步改进,步骤4在三个子集下选取聚类初始点的选择上,增加了概率加权,使初始点位置尽可能分散。
本发明与现有技术相比的优点在于:传统Yolov3仅进行一次聚类,提取得到的9个锚框,没有考虑聚类框在不同尺度上的分布,可能导致仅对特定尺度的目标检测效果较好;随机生成的初始值对最终的聚类结果有很大影响,导致每次聚类结果差别严重,难以选择合适的数据作为最终结果。针对以上的不足,本发明提出的两次聚类方法,第一次聚类增加了尺度因素的影响,使得最终的锚框能够较为均匀地分布在不同尺寸上;第一次聚类以子集内样本均值作为初始值,第二次聚类根据k-means++算法选择初始值,尽量使得聚类初始点分散开来,大大降低了随机初始值对聚类结果的影响;分两次聚类,虽然增加了聚类次数,但每次迭代的样本数量大大减少,极大减少了数据的复杂度,有效提高了算法速度。
附图说明
图1为锚框聚类整体流程图;
图2为第一次聚类结果;
图3为第二次聚类结果;
图4为传统k-means与本发明提出的两次k-means算法在不同样本数量下的运行时间对比。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
本发明提供一种基于改进k-means聚类的Yolov3锚框确定方法,本发明提出两次聚类的方法,得到适合不同检测尺度的锚框。
作为本发明具体实施例,其中锚框聚类整体流程图如图1所示,第一次聚类结果如图2所示,第二次聚类结果如图3所示,传统k-means与本发明提出的两次k-means算法在不同样本数量下的运行时间对比如图4所示,本发明具体步骤如下;
步骤一:选取COCO数据集中的3000份标注文件,共包含21405份标注信息,标注格式为(c*,x*,y*,w*,h*),包括目标的类别c*,标注框的中心位置坐标(x*,y*)以及宽度和高度(w*,h*),w=w*/W,h=h*/H,其中W和H分别为图像的宽和高,归一化结果(w,h)作为聚类的样本;
步骤二:计算每个样本标注框的面积,根据面积大小,将样本等分为三个子集(A,B,C),计算每个子集内样本的平均宽和高(wA0,hA0),(wB0,hB0),(wC0,hC0),以子集的平均宽和高为初始值,对全体样本进行k-means聚类,距离函数在IOU的基础上,增加尺度信息,具体形式为:d=(1-λ)*(1-IOU)+2λ*(σ(Sr)-0.5),其中,IOU为标注框与聚类中心的交并比,Sr为两者面积差值与聚类中心面积比值的绝对值,λ为权重系数,σ为Sigmoid变换,将Sr限制到0.5-1;
步骤三:根据第一次聚类结果,更新得到三个不同尺度下的子集(A',B',C');
步骤四:为了减少随机初始值对聚类结果的影响,三个新子集(A',B',C')分别利用k-means++算法进行初始值的确定。具体过程是:随机选择一个样本作为第一个聚类初始点,计算其他所有样本与已确定聚类点的最小距离d,其中,d=1-IOU,d越大者,表明该样本与其他聚类初始点的距离越远,有更高的可能性被选择为下一个聚类初始点,在加权概率的基础上,随机选择一个新的聚类点,重复这一过程,直至完成三个初始聚类点的选择,后面依照k-means算法过程完成聚类;
步骤五:两次聚类得到分布在三个不同尺度上的9个聚类点,按顺序排列,替换Yolov3原来的锚框数据。
以上所述,仅是本发明的较佳实施例之一,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
Claims (4)
1.一种基于改进k-means聚类的Yolov3锚框确定方法,其特征在于:包括以下步骤:
步骤1:Yolov3使用的数据集标注文件格式为(c*,x*,y*,w*,h*),包括目标的类别c*,标注框的中心位置坐标(x*,y*)以及宽度和高度(w*,h*),w=w*/W,h=h*/H,其中W和H分别为图像的宽和高,归一化结果(w,h)作为聚类的样本;
步骤2:计算每个样本标注框的面积,根据面积大小,将样本等分为三个子集(A,B,C),计算每个子集内样本的平均宽和高,作为第一次聚类初始值。对全体样本进行第一次k-means聚类,距离函数在IOU的基础上,增加了尺度信息,具体形式为:d=(1-λ)*(1-IOU)+2λ*(σ(Sr)-0.5),其中,IOU为标注框与聚类中心的交并比,Sr为两者面积差值与聚类中心面积比值的绝对值,λ为权重系数,σ为Sigmoid变换,将Sr限制到0.5-1;
步骤3:根据第一次聚类结果,更新子集数据,得到三个不同尺度下的新子集(A',B',C');
步骤4:为了减少随机初始值对聚类结果的影响,三个新子集(A',B',C')分别利用k-means++算法进行聚类,距离函数为:d=1-IOU;
步骤5:两次聚类得到分布在三个不同尺度上的9个聚类点,按顺序排列后,替换Yolov3原来的锚框数据。
2.根据权利要求1所述的一种基于改进k-means聚类的Yolov3锚框确定方法,其特征在于:步骤2计算3个子集的平均宽和高作为第一次聚类初始点。
3.根据权利要求1所述一种基于改进k-means聚类的Yolov3锚框确定方法,其特征在于:步骤2对样本进行第一次聚类,距离函数增加了样本的尺度信息,将样本划分到三个不同的尺度下。
4.根据权利要求1所述一种基于改进k-means聚类的Yolov3锚框确定方法,其特征在于:步骤4在三个子集下选取聚类初始点的选择上,增加了概率加权,使初始点位置尽可能分散。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110715329.6A CN113344113B (zh) | 2021-06-27 | 2021-06-27 | 一种基于改进k-means聚类的Yolov3锚框确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110715329.6A CN113344113B (zh) | 2021-06-27 | 2021-06-27 | 一种基于改进k-means聚类的Yolov3锚框确定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113344113A true CN113344113A (zh) | 2021-09-03 |
CN113344113B CN113344113B (zh) | 2024-03-19 |
Family
ID=77478940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110715329.6A Active CN113344113B (zh) | 2021-06-27 | 2021-06-27 | 一种基于改进k-means聚类的Yolov3锚框确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113344113B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949385A (zh) * | 2021-01-24 | 2021-06-11 | 西北工业大学 | 一种基于光视觉的水面目标检测与识别方法 |
CN113516105A (zh) * | 2021-09-07 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 一种车道检测方法、装置及计算机可读存储介质 |
CN115661499A (zh) * | 2022-12-08 | 2023-01-31 | 常州星宇车灯股份有限公司 | 智能驾驶预设锚框的确定装置、方法及存储介质 |
CN118015388A (zh) * | 2024-04-10 | 2024-05-10 | 西南科技大学 | 小目标检测方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200265591A1 (en) * | 2019-04-23 | 2020-08-20 | Jiangnan University | Visual Multi-Object Tracking based on Multi-Bernoulli Filter with YOLOv3 Detection |
CN111652836A (zh) * | 2020-03-19 | 2020-09-11 | 天津大学 | 一种基于聚类算法和神经网络的多尺度目标检测方法 |
CN112861744A (zh) * | 2021-02-20 | 2021-05-28 | 哈尔滨工程大学 | 一种基于旋转锚点聚类的遥感图像目标快速检测方法 |
-
2021
- 2021-06-27 CN CN202110715329.6A patent/CN113344113B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200265591A1 (en) * | 2019-04-23 | 2020-08-20 | Jiangnan University | Visual Multi-Object Tracking based on Multi-Bernoulli Filter with YOLOv3 Detection |
CN111652836A (zh) * | 2020-03-19 | 2020-09-11 | 天津大学 | 一种基于聚类算法和神经网络的多尺度目标检测方法 |
CN112861744A (zh) * | 2021-02-20 | 2021-05-28 | 哈尔滨工程大学 | 一种基于旋转锚点聚类的遥感图像目标快速检测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949385A (zh) * | 2021-01-24 | 2021-06-11 | 西北工业大学 | 一种基于光视觉的水面目标检测与识别方法 |
CN112949385B (zh) * | 2021-01-24 | 2022-12-23 | 西北工业大学 | 一种基于光视觉的水面目标检测与识别方法 |
CN113516105A (zh) * | 2021-09-07 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 一种车道检测方法、装置及计算机可读存储介质 |
CN115661499A (zh) * | 2022-12-08 | 2023-01-31 | 常州星宇车灯股份有限公司 | 智能驾驶预设锚框的确定装置、方法及存储介质 |
CN118015388A (zh) * | 2024-04-10 | 2024-05-10 | 西南科技大学 | 小目标检测方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113344113B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113344113A (zh) | 一种基于改进k-means聚类的Yolov3锚框确定方法 | |
CN113449594B (zh) | 一种多层网络组合的遥感影像地类语义分割与面积计算方法 | |
CN106228185B (zh) | 一种基于神经网络的通用图像分类识别系统及方法 | |
CN111783844B (zh) | 基于深度学习的目标检测模型训练方法、设备及存储介质 | |
CN108540988B (zh) | 一种场景划分方法及装置 | |
CN111311702B (zh) | 一种基于BlockGAN的图像生成和识别模块及方法 | |
CN114663373B (zh) | 一种用于零件表面质量检测的点云配准方法及装置 | |
CN112116952A (zh) | 基于扩散及混沌局部搜索的灰狼优化算法的基因选择方法 | |
CN113988203A (zh) | 一种基于深度学习的轨迹序列聚类方法 | |
CN111259808A (zh) | 一种基于改进ssd算法的交通标识的检测识别方法 | |
CN113723492A (zh) | 一种改进主动深度学习的高光谱图像半监督分类方法及装置 | |
CN111723897A (zh) | 一种基于粒子群算法的多模态特征选择方法 | |
CN113435108A (zh) | 一种基于改进的鲸鱼优化算法的战场目标分群方法 | |
CN114201632B (zh) | 一种面向多标记目标检测任务的标签带噪数据集扩增方法 | |
CN113420173A (zh) | 基于四元组深度学习的少数民族服饰图像检索方法 | |
CN117830873B (zh) | 一种城乡规划图像的数据处理方法 | |
CN108846845A (zh) | 基于缩略图与分层模糊聚类的sar图像分割方法 | |
CN113298184B (zh) | 用于小样本图像识别的样本抽取、扩充方法及存储介质 | |
CN106251004B (zh) | 基于改进空间距离划分的目标分群方法 | |
CN113223098B (zh) | 图像颜色分类的预处理优化方法 | |
CN117634806A (zh) | 电动汽车负荷聚合方法、系统、设备及介质 | |
KR100895261B1 (ko) | 평형기반 서포트 벡터를 이용한 귀납적이고 계층적인군집화 방법 | |
CN116844040A (zh) | 一种基于双流结构的小样本遥感图像场景分类方法 | |
CN110956177A (zh) | 一种混合型验证码的识别方法及系统 | |
CN115661504A (zh) | 基于迁移学习和视觉词包的遥感样本分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |