CN113569968B - 模型训练方法、目标检测方法、装置、设备及存储介质 - Google Patents
模型训练方法、目标检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113569968B CN113569968B CN202110871128.5A CN202110871128A CN113569968B CN 113569968 B CN113569968 B CN 113569968B CN 202110871128 A CN202110871128 A CN 202110871128A CN 113569968 B CN113569968 B CN 113569968B
- Authority
- CN
- China
- Prior art keywords
- target
- frame
- detected
- target detection
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 227
- 238000012549 training Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012795 verification Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种模型训练方法、目标检测方法、装置、设备及存储介质。其中,该方法包括:将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,其中,数据集包括待检测目标对应的矩形框的尺寸;对锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;将目标锚框尺寸作为预设目标检测算法中的锚框参数,并将数据集中的训练集中包含的样本依次输入至预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。本发明实施例提供的技术方案,可以优化现有的用于目标检测的神经网络模型的训练方案。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及模型训练方法、目标检测方法、装置、设备及存储介质。
背景技术
随着深度学习技术的快速发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。神经网络,是一种模拟大脑神经突触联接的结构进行信息处理的模型。在计算机视觉领域,利用神经网络技术可以构建用于目标检测的神经网络模型,相比于传统的混合高斯模型以及隐马尔科夫模型等,具有很多优势。目前,用于目标检测的神经网络模型的训练方案仍不够完善,导致进行目标检测时效果并不理想,容易出现误检、目标检测精度低的情况。
发明内容
本发明实施例提供了模型训练方法、目标检测方法、装置、设备及存储介质,可以优化现有的用于目标检测的神经网络模型的训练方案。
第一方面,本发明实施例提供了一种模型训练方法,该方法包括:
将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集包括所述待检测目标对应的矩形框的尺寸;
对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;
将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
第二方面,本发明实施例提供了一种目标检测方法,该方法包括:
获取待检测目标的图像数据;
将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,其中,所述目标检测模型采用本发明实施例提供的模型训练方法训练得到;
根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果。
第三方面,本发明实施例提供了一种模型训练装置,该装置包括:
聚类模块,用于将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集包括所述待检测目标对应的矩形框的尺寸;
缩放模块,用于对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;
训练模块,用于将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
第四方面,本发明实施例提供了一种目标检测装置,该装置包括:
图像数据获取模块,用于获取待检测目标的图像数据;
输出结果确定模块,用于将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,其中,所述目标检测模型采用本发明实施例提供的模型训练方法训练得到;
检测结果确定模块,用于根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果。
第五方面,本发明实施例提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的模型训练方法或者目标检测方法。
第六方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的模型训练方法或者目标检测方法。
本发明实施例提供了一种模型训练方法、目标检测方法、装置、设备及存储介质,首先将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,其中,数据集包括待检测目标对应的矩形框的尺寸,然后对锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸,最后将目标锚框尺寸作为预设目标检测算法中的锚框参数,并将数据集中的训练集中包含的样本依次输入至预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型,通过采用上述技术方案,可以优化现有的用于目标检测的神经网络模型的训练方案,有利于提高目标检测结果的准确性。
附图说明
图1为本发明实施例一提供的一种模型训练方法的流程图;
图2A为本发明实施例二提供的一种目标检测方法的流程图;
图2B为本发明提供的训练方法中未对锚框的尺寸进行线性尺度缩放得到第一目标检测模型,并通过第一目标检测模型得到的第一检测结果;
图2C为本发明实施例二提供的方法中通过目标检测模型得到的检测结果;
图3为本发明实施例三提供的一种模型训练装置的结构示意图;
图4为本发明实施例四提供的一种目标检测装置的结构示意图;
图5为本发明实施例五提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种模型训练方法的流程图,本实施例可适用于通过训练得到目标检测模型的情况。本实施例提供的模型训练方法可以由本发明实施例提供的模型训练装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在执行本方法的计算机设备中。
参见图1,本实施例的方法包括但不限于如下步骤:
S110,将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,其中,数据集包括待检测目标对应的矩形框的尺寸。
其中,待检测目标可以为日常生活中的各物体,例如轮胎或者汽车等,还可以是行人。待检测目标的数据集可以理解为:对待检测目标进行不同角度的拍摄所得到的图像数据进行标注所得到的对应的矩形框的尺寸汇总起来所得到的数据集。预设聚类算法可以为预先设定的聚类方法,例如:K均值聚类方法、基于密度的聚类方法、凝聚层次聚类方法以及图团体检测方法等等,也可以视具体情况而定,本发明实施例不做具体限制。预设个数可以为预先设定好的,例如9个类,也可以视具体情况而定,本发明实施例不做具体限制。
现有技术中,用于目标检测的神经网络模型的训练方案不够完善,导致进行目标检测时效果并不理想,容易出现误检、目标检测精度低的情况。因此,本发明实施例中将待检测目标的数据集划分为预设个数的类,即:将所有待检测目标对应的矩形框的尺寸划分为预设个数的类,针对预设个数的类中的每个类,将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,即:将聚类后得到的预设个数的矩形框的尺寸作为与待检测目标对应的锚框的尺寸,便于后续对锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸,进而有利于加速后续的训练过程以及提高目标的检测精度。
S120,对锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸。
其中,线性尺度缩放可以理解为将锚框的尺寸乘以对应的缩放系数。目标锚框尺寸可以理解为尺寸大小比较合适的,更有利于对检测目标进行检测的锚框的尺寸。
在得到待检测目标对应的锚框的尺寸之后,由于数据集中矩形框的尺寸可能比较集中,导致泛化能力很差,那么得到的锚框的尺寸可能也比较集中,此时对锚框的尺寸进行线性尺度缩放,能够得到对应的目标锚框尺寸,以便后续将目标锚框尺寸作为预设目标检测算法中的锚框参数,并将数据集中的训练集中包含的样本依次输入至预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
可选的,缩放系数的数量为至少两个。进一步的,至少一个缩放系数大于1,至少一个缩放系数小于1。
S130,将目标锚框尺寸作为预设目标检测算法中的锚框参数,并将数据集中的训练集中包含的样本依次输入至预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
其中,所述预设目标检测算法可以包括YOLOv4算法。数据集中的训练集可以理解为从数据集中选出的样本所形成的用于后续模型训练的集合。
在得到目标锚框尺寸之后,将目标锚框尺寸作为预设目标检测算法中的锚框参数,即:用目标锚框尺寸替换预设目标检测算法中的锚框参数的原始值,由于原始值是在通用数据集(例如Pascal VOC数据集)基础上进行聚类得到的锚框的值,可能不是很适用于某些具体的训练场景,例如,识别不同宽高比的轮胎的检测模型的训练场景,那么在替换掉锚框参数的原始值之后,将数据集中的训练集中包含的所有样本依次输入至预设目标检测算法对应的网络中进行训练,就能够得到对应的目标检测模型,便于后续用于目标检测。
本实施例提供的技术方案,首先将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,其中,数据集包括待检测目标对应的矩形框的尺寸,然后对锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸,最后将目标锚框尺寸作为预设目标检测算法中的锚框参数,并将数据集中的训练集中包含的样本依次输入至预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型,通过采用上述技术方案,可以优化现有的用于目标检测的神经网络模型的训练方案,有利于提高目标检测结果的准确性以及提高检测精度。
在一些实施例中,所述对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸,可以具体包括:根据所述锚框的尺寸以及对应的所述数据集中的验证集中所述待检测目标对应的矩形框的尺寸,确定各锚框的尺寸分别对应的线性尺度缩放系数;将所述各锚框的尺寸与对应的线性尺度缩放系数相乘,得到对应的目标锚框尺寸。
其中,数据集中的验证集可以理解为从数据集中选出的样本所形成的用于后续模型训练的验证过程的集合。
本发明实施例中,根据锚框的尺寸以及对应的数据集中的验证集中待检测目标对应的矩形框的尺寸,能够确定各锚框的尺寸分别对应的线性尺度缩放系数,然后将各锚框的尺寸与对应的线性尺度缩放系数相乘,就得到了对应的目标锚框尺寸,使得目标锚框更具鲁棒性,从而消除了采集的图像数据场景和类型单一及图像标记框尺寸过于集中的问题,有利于加速后续的模型训练过程。
示例性的,假设待检测目标为轮胎,假设轮胎对应的锚框的尺寸有9组,分别是:[-16,-32]、[-12,-26]、[-1,0]、[0,-47]、[12,17]、[17,25]、[27,-32]、[29,13]和[47,75],每组锚框的尺寸中的第一个数字可以代表矩形框的宽度值,每组锚框的尺寸中的第二个数字可以代表矩形框的高度值。各组锚框对应的线性尺度缩放系数分别为0.5、0.5、1、1、1、2、2、3和3,那么最终的目标锚框尺寸分别为:[-8,-16]、[-6,-13]、[-1,0]、[0,-47]、[12,17]、[34,50]、[54,-64]、[87,39]和[141,225]。
在一些实施例中,所述待检测目标的数据集可以具体通过以下方式得到:通过图像采集设备采集所述待检测目标的图像,得到对应的图像集合;采用标注软件对所述图像集合中的每个图像进行矩形框标注,并汇总所有矩形框的尺寸,得到所述待检测目标的数据集。
本发明实施例中,通过图像采集设备,例如相机或者摄像头等采集待检测目标在各个角度的图像,能够得到对应的图像集合,然后采用标注软件,例如LabelImage软件对图像集合中的每个图像进行矩形框标注,标注完成后能够得到一个XML格式的文档,里面包含了待检测目标在图像中的位置坐标信息以及待检测目标在图像中对应的每个矩形框的尺寸,汇总所有矩形框的尺寸之后,就得到了待检测目标的数据集,通过上述方法得到待检测目标的数据集中矩形框的尺寸更准确,有利于后续的模型训练过程。
示例性的,假设待检测目标为轮胎,则待检测目标的数据集可以为采集的不同角度的轮胎照片中轮胎所对应的矩形框的尺寸。
在一些实施例中,所述训练过程中的学习率随着迭代次数的增加而减小。
本发明实施例中,训练过程中的学习率随着迭代次数的增加而减小,例如:初始学习率可以为0.001,假设最大迭代次数为6000次,在迭代次数为4800和5400次时,学习率可以分别设置为0.0001和0.00001,这样训练完成得到的目标检测模型也更准确。
实施例二
图2A为本发明实施例二提供的一种目标检测方法的流程图,本实施例可适用于通过目标检测模型对待检测目标进行检测的情况。本实施例提供的目标检测方法可以由本发明实施例提供的目标检测装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在执行本方法的计算机设备中。
参见图2A,本实施例的方法包括但不限于如下步骤:
S210,获取待检测目标的图像数据。
通过图像采集设备采集待检测目标的图像,即可获取到待检测目标的图像数据。
S220,将所述图像数据输入至目标检测模型中,得到目标检测模型的输出结果。
其中,所述目标检测模型采用本发明实施例提供的模型训练方法训练得到。
将图像数据输入至目标检测模型中之后,通过目标检测模型的作用能够得到目标检测模型的输出结果,例如通过目标检测模型将图像数据划分后确定的每个识别框对应的置信得分,便于后续根据目标检测模型的输出结果确定图像数据中的待检测目标的检测结果。
S230,根据目标检测模型的输出结果确定图像数据中的待检测目标的检测结果。
根据得到的目标检测模型的输出结果,例如每个识别框对应的置信得分,能够确定图像数据中的待检测目标的检测结果,即:待检测目标在图像数据中的具体位置是否检测的准确。
本实施例提供的技术方案,首先获取待检测目标的图像数据,然后将图像数据输入至目标检测模型中,得到目标检测模型的输出结果,最后根据目标检测模型的输出结果确定图像数据中的待检测目标的检测结果,由于目标检测模型是采用本发明实施例提供的模型训练方法训练得到的,因此上述方案有利于提高目标检测的精度以及减少误检情况的发生。
在一些实施例中,将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,可以具体包括:通过所述目标检测模型将所述待检测目标的图像数据划分成预设规格的网格,其中,每个网格对应预设个数的识别框;获取每个识别框的中心点的坐标、每个识别框的宽度值、每个识别框的高度值以及与每个识别框相交的目标检测框的尺寸值,其中,所述目标检测框与所述待检测目标的图像中的待检测目标相对应;根据所述中心点的坐标、所述宽度值、所述高度值以及所述目标检测框的尺寸值,确定每个识别框和与每个识别框相交的目标检测框的交集部分的面积,以及每个识别框和与每个识别框相交的目标检测框的并集部分的面积;将所述交集部分的面积与所述并集部分的面积相除,得到每个识别框对应的准确度;根据每个识别框中是否包含待检测目标,确定所述每个识别框对应的条件概率;针对所述每个识别框,将当前识别框对应的准确度与所述当前识别框对应的条件概率相乘,作为所述当前识别框对应的置信得分;将所有网格对应的识别框中,每个识别框对应的置信得分作为所述目标检测模型的输出结果;相应的,根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果,可以具体包括:根据所述置信得分的大小确定所述图像数据中的待检测目标的检测结果。
其中,预设规格可以是预先设计好的尺寸规格,例如7*7,也可以视具体情况而定,本发明实施例对此不做具体限制。预设个数可以是预先设计好的,也可以视具体情况而定,本发明实施例对此不做具体限制。目标检测框可以理解为最终框选待检测目标的矩形框。
具体的,先通过目标检测模型将待检测目标的图像数据划分成预设规格(例如7*7)的网格,每个网格可以对应预设个数(例如,2个)的识别框,然后获取每个识别框的中心点的坐标、每个识别框的宽度值、每个识别框的高度值以及与每个识别框相交的目标检测框的尺寸值(即总共:7×7×4×2个数值)之后,根据各识别框的中心点的坐标、各识别框的宽度值、各识别框的高度值以及目标检测框的尺寸值,能够确定出每个识别框和与每个识别框相交的目标检测框的交集部分的面积,以及每个识别框和与每个识别框相交的目标检测框的并集部分的面积,再将交集部分的面积与并集部分的面积相除,能够得到每个识别框对应的准确度。若某个识别框中包含待检测目标,则确定该识别框对应的条件概率为1;否则,若某个识别框中不包含待检测目标,则确定该识别框对应的条件概率为0。在确定了每个识别框对应的准确度和条件概率之后,针对每个识别框,将当前识别框对应的准确度与当前识别框对应的条件概率相乘,就得到了当前识别框对应的置信得分,将每个识别框对应的置信得分作为目标检测模型的输出结果,然后根据置信得分的大小能够确定图像数据中的待检测目标的检测结果,即:不同识别框对应的置信得分中,置信得分越高,则说明待检测目标的检测结果越准确,置信得分为0,则说明该网格中不包含待检测目标。
本发明实施例中,通过上述方案,根据置信得分的大小能够衡量待检测目标的检测结果是否准确,从而提高待检测目标的检测精度,避免误检和漏检的发生。
示例性的,假设待检测目标为轮胎,图2B为本发明提供的训练方法中未对锚框的尺寸进行线性尺度缩放得到第一目标检测模型,并通过第一目标检测模型得到的第一检测结果;图2C为本发明实施例二提供的方法中通过目标检测模型得到的检测结果。图2B和图2C为示例性的一种展示。
如图2B所示,未对锚框的尺寸进行线性尺度缩放得到第一目标检测模型,并通过第一目标检测模型得到的第一检测结果中识别框有三个,识别框从左到右对应的置信得分分别为fire99.22%、fire98.88和fire98.40%,即第一个识别框对应的待检测目标的检测结果更为准确。如图2B所示,通过目标检测模型得到的检测结果中识别框有两个,识别框从左到右对应的置信得分分别为fire98.60%、fire98.30。从图2B和图2C的对比中,虽然图2B中第一个识别框的置信得分最高,但是可以明显看出图2C中待检测目标的识别框相对于图2B中的识别框框选的待检测目标更为准确。
实施例三
图3为本发明实施例三提供的一种模型训练装置的结构示意图,如图3所示,该装置可以包括:
聚类模块310,用于将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集包括所述待检测目标对应的矩形框的尺寸;
缩放模块320,用于对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;
训练模块330,用于将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
本实施例提供的技术方案,首先将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,其中,数据集包括待检测目标对应的矩形框的尺寸,然后对锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸,最后将目标锚框尺寸作为预设目标检测算法中的锚框参数,并将数据集中的训练集中包含的样本依次输入至预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型,通过采用上述技术方案,可以优化现有的用于目标检测的神经网络模型的训练方案,有利于提高目标检测结果的准确性。
进一步的,上述缩放模块320,可以具体用于:根据所述锚框的尺寸以及对应的所述数据集中的验证集中所述待检测目标对应的矩形框的尺寸,确定各锚框的尺寸分别对应的线性尺度缩放系数;将所述各锚框的尺寸与对应的线性尺度缩放系数相乘,得到对应的目标锚框尺寸。
进一步的,所述待检测目标的数据集可以通过以下方式得到:通过图像采集设备采集所述待检测目标的图像,得到对应的图像集合;采用标注软件对所述图像集合中的每个图像进行矩形框标注,并汇总所有矩形框的尺寸,得到所述待检测目标的数据集。
进一步的,所述预设目标检测算法包括YOLOv4算法。
本实施例提供的模型训练装置可适用于上述任意实施例提供的模型训练方法,具备相应的功能和有益效果。
实施例四
图4为本发明实施例四提供的一种目标检测装置的结构示意图,如图4所示,该装置可以包括:
图像数据获取模块410,用于获取待检测目标的图像数据;
输出结果确定模块420,用于将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,其中,所述目标检测模型采用上述一种模型训练方法训练得到;
检测结果确定模块430,用于根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果。
本实施例提供的技术方案,首先获取待检测目标的图像数据,然后将图像数据输入至目标检测模型中,得到目标检测模型的输出结果,最后根据目标检测模型的输出结果确定图像数据中的待检测目标的检测结果,有利于提高目标检测的精度以及减少误检情况的发生。
进一步的,上述输出结果确定模块420,可以具体用于:将所述图像数据输入至目标检测模型中,通过所述目标检测模型将所述待检测目标的图像数据划分成预设规格的网格,其中,每个网格对应预设个数的识别框;获取每个识别框的中心点的坐标、每个识别框的宽度值、每个识别框的高度值以及与每个识别框相交的目标检测框的尺寸值,其中,所述目标检测框与所述待检测目标的图像中的待检测目标相对应;根据所述中心点的坐标、所述宽度值、所述高度值以及所述目标检测框的尺寸值,确定每个识别框和与每个识别框相交的目标检测框的交集部分的面积,以及每个识别框和与每个识别框相交的目标检测框的并集部分的面积;将所述交集部分的面积与所述并集部分的面积相除,得到每个识别框对应的准确度;根据每个识别框中是否包含待检测目标,确定所述每个识别框对应的条件概率;针对所述每个识别框,将当前识别框对应的准确度与所述当前识别框对应的条件概率相乘,作为所述当前识别框对应的置信得分;将所有网格对应的识别框中,每个识别框对应的置信得分作为所述目标检测模型的输出结果;相应的,上述检测结果确定模块430,可以具体用于:根据所述置信得分的大小确定所述图像数据中的待检测目标的检测结果。
本实施例提供的目标检测装置可适用于上述任意实施例提供的目标检测方法,具备相应的功能和有益效果。
实施例五
图5为本发明实施例五提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括处理器510和存储装置520;计算机设备中处理器510的数量可以是一个或多个,图5中以一个处理器510为例;计算机设备中的处理器510和存储装置520可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储装置520作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的模型训练方法对应的模块(例如,用于模型训练装置中的聚类模块310、缩放模块320和训练模块330),如本发明实施例中的目标检测方法对应的模块(例如,用于目标检测装置中的图像数据获取模块410、输出结果确定模块420和检测结果确定模块430)。处理器510通过运行存储在存储装置520中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的模型训练方法或者目标检测方法。
存储装置520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置520可进一步包括相对于处理器510远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本实施例提供的一种计算机设备可用于执行上述任意实施例提供的模型训练方法或者目标检测方法,具备相应的功能和有益效果。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例中的模型训练方法或者目标检测方法。
其中,模型训练方法具体包括:
将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集包括所述待检测目标对应的矩形框的尺寸;
对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;
将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
其中,目标检测方法具体包括:
获取待检测目标的图像数据;
将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,其中,所述目标检测模型采用上述一种模型训练方法训练得到;
根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的模型训练方法或者目标检测方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述模型训练装置和目标检测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种目标检测方法,其特征在于,包括:
获取待检测目标的图像数据;
将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果;
根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果;
其中,将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,包括:
通过所述目标检测模型将所述待检测目标的图像数据划分成预设规格的网格,其中,每个网格对应预设个数的识别框;
获取每个识别框的中心点的坐标、每个识别框的宽度值、每个识别框的高度值以及与每个识别框相交的目标检测框的尺寸值,其中,所述目标检测框与所述待检测目标的图像中的待检测目标相对应;
根据所述中心点的坐标、所述宽度值、所述高度值以及所述目标检测框的尺寸值,确定每个识别框和与每个识别框相交的目标检测框的交集部分的面积,以及每个识别框和与每个识别框相交的目标检测框的并集部分的面积;
将所述交集部分的面积与所述并集部分的面积相除,得到每个识别框对应的准确度;
根据每个识别框中是否包含待检测目标,确定所述每个识别框对应的条件概率;
针对所述每个识别框,将当前识别框对应的准确度与所述当前识别框对应的条件概率相乘,作为所述当前识别框对应的置信得分;
将所有网格对应的识别框中,每个识别框对应的置信得分作为所述目标检测模型的输出结果;
相应的,根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果,包括:
根据所述置信得分的大小确定所述图像数据中的待检测目标的检测结果;
其中,得到目标检测模型的步骤,包括:
将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集为所述待检测目标对应的矩形框的尺寸;
对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;
将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
2.根据权利要求1所述的方法,其特征在于,所述对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸,包括:
根据所述锚框的尺寸以及对应的所述数据集中的验证集中所述待检测目标对应的矩形框的尺寸,确定各锚框的尺寸分别对应的线性尺度缩放系数;
将所述各锚框的尺寸与对应的线性尺度缩放系数相乘,得到对应的目标锚框尺寸。
3.根据权利要求1所述的方法,其特征在于,所述待检测目标的数据集通过以下方式得到:
通过图像采集设备采集所述待检测目标的图像,得到对应的图像集合;
采用标注软件对所述图像集合中的每个图像进行矩形框标注,并汇总所有矩形框的尺寸,得到所述待检测目标的数据集。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述预设目标检测算法包括YOLOv4算法。
5.一种目标检测装置,其特征在于,包括:
图像数据获取模块,用于获取待检测目标的图像数据;
输出结果确定模块,用于将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果;
检测结果确定模块,用于根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果;
其中,将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,包括:
通过所述目标检测模型将所述待检测目标的图像数据划分成预设规格的网格,其中,每个网格对应预设个数的识别框;
获取每个识别框的中心点的坐标、每个识别框的宽度值、每个识别框的高度值以及与每个识别框相交的目标检测框的尺寸值,其中,所述目标检测框与所述待检测目标的图像中的待检测目标相对应;
根据所述中心点的坐标、所述宽度值、所述高度值以及所述目标检测框的尺寸值,确定每个识别框和与每个识别框相交的目标检测框的交集部分的面积,以及每个识别框和与每个识别框相交的目标检测框的并集部分的面积;
将所述交集部分的面积与所述并集部分的面积相除,得到每个识别框对应的准确度;
根据每个识别框中是否包含待检测目标,确定所述每个识别框对应的条件概率;
针对所述每个识别框,将当前识别框对应的准确度与所述当前识别框对应的条件概率相乘,作为所述当前识别框对应的置信得分;
将所有网格对应的识别框中,每个识别框对应的置信得分作为所述目标检测模型的输出结果;
相应的,根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果,包括:
根据所述置信得分的大小确定所述图像数据中的待检测目标的检测结果;
其中,得到目标检测模型的步骤,包括:
将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集为所述待检测目标对应的矩形框的尺寸;
对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;
将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
6.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110871128.5A CN113569968B (zh) | 2021-07-30 | 2021-07-30 | 模型训练方法、目标检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110871128.5A CN113569968B (zh) | 2021-07-30 | 2021-07-30 | 模型训练方法、目标检测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113569968A CN113569968A (zh) | 2021-10-29 |
CN113569968B true CN113569968B (zh) | 2024-05-17 |
Family
ID=78169473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110871128.5A Active CN113569968B (zh) | 2021-07-30 | 2021-07-30 | 模型训练方法、目标检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569968B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114387332B (zh) * | 2022-01-17 | 2022-11-08 | 江苏省特种设备安全监督检验研究院 | 一种管道测厚方法及装置 |
CN114092920B (zh) * | 2022-01-18 | 2022-04-15 | 腾讯科技(深圳)有限公司 | 一种模型训练的方法、图像分类的方法、装置及存储介质 |
CN114821034A (zh) * | 2022-03-29 | 2022-07-29 | 恒安嘉新(北京)科技股份公司 | 目标检测模型的训练方法、装置、电子设备及介质 |
CN115880512B (zh) * | 2023-02-01 | 2023-07-21 | 有米科技股份有限公司 | 一种图标匹配方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222780A (zh) * | 2019-06-12 | 2019-09-10 | 北京百度网讯科技有限公司 | 物体检测方法、装置、设备和存储介质 |
CN111062413A (zh) * | 2019-11-08 | 2020-04-24 | 深兰科技(上海)有限公司 | 一种道路目标检测方法、装置、电子设备及存储介质 |
CN111222474A (zh) * | 2020-01-09 | 2020-06-02 | 电子科技大学 | 一种任意尺度的高分辨率图像小目标检测方法 |
CN111401148A (zh) * | 2020-02-27 | 2020-07-10 | 江苏大学 | 一种基于改进的多级YOLOv3的道路多目标检测方法 |
CN112016614A (zh) * | 2020-08-27 | 2020-12-01 | 北京理工大学 | 光学图像目标检测模型的构建方法、目标检测方法及装置 |
CN112132005A (zh) * | 2020-09-21 | 2020-12-25 | 福州大学 | 一种基于聚类分析与模型压缩的人脸检测方法 |
WO2021098796A1 (zh) * | 2019-11-20 | 2021-05-27 | Oppo广东移动通信有限公司 | 图像处理方法、装置、设备及计算机可读存储介质 |
WO2021111622A1 (ja) * | 2019-12-06 | 2021-06-10 | 日本電気株式会社 | パラメータ決定装置、パラメータ決定方法、及び、非一時的なコンピュータ可読媒体 |
-
2021
- 2021-07-30 CN CN202110871128.5A patent/CN113569968B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222780A (zh) * | 2019-06-12 | 2019-09-10 | 北京百度网讯科技有限公司 | 物体检测方法、装置、设备和存储介质 |
CN111062413A (zh) * | 2019-11-08 | 2020-04-24 | 深兰科技(上海)有限公司 | 一种道路目标检测方法、装置、电子设备及存储介质 |
WO2021098796A1 (zh) * | 2019-11-20 | 2021-05-27 | Oppo广东移动通信有限公司 | 图像处理方法、装置、设备及计算机可读存储介质 |
WO2021111622A1 (ja) * | 2019-12-06 | 2021-06-10 | 日本電気株式会社 | パラメータ決定装置、パラメータ決定方法、及び、非一時的なコンピュータ可読媒体 |
CN111222474A (zh) * | 2020-01-09 | 2020-06-02 | 电子科技大学 | 一种任意尺度的高分辨率图像小目标检测方法 |
CN111401148A (zh) * | 2020-02-27 | 2020-07-10 | 江苏大学 | 一种基于改进的多级YOLOv3的道路多目标检测方法 |
CN112016614A (zh) * | 2020-08-27 | 2020-12-01 | 北京理工大学 | 光学图像目标检测模型的构建方法、目标检测方法及装置 |
CN112132005A (zh) * | 2020-09-21 | 2020-12-25 | 福州大学 | 一种基于聚类分析与模型压缩的人脸检测方法 |
Non-Patent Citations (1)
Title |
---|
复杂场景下基于增强YOLOv3的船舶目标检测;聂鑫;刘文;吴巍;;计算机应用(第09期);89-98 * |
Also Published As
Publication number | Publication date |
---|---|
CN113569968A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113569968B (zh) | 模型训练方法、目标检测方法、装置、设备及存储介质 | |
CN108038474B (zh) | 人脸检测方法、卷积神经网络参数的训练方法、装置及介质 | |
CN107944020B (zh) | 人脸图像查找方法及装置、计算机装置和存储介质 | |
CN110197146B (zh) | 基于深度学习的人脸图像分析方法、电子装置及存储介质 | |
CN107833213B (zh) | 一种基于伪真值自适应法的弱监督物体检测方法 | |
CN110020592A (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
CN109960742B (zh) | 局部信息的搜索方法及装置 | |
CN110619333B (zh) | 一种文本行分割方法、文本行分割装置及电子设备 | |
JP2014232533A (ja) | Ocr出力検証システム及び方法 | |
CN112613553B (zh) | 图片样本集生成方法、装置、计算机设备和存储介质 | |
CN105809672A (zh) | 一种基于超像素和结构化约束的图像多目标协同分割方法 | |
CN109726746A (zh) | 一种模板匹配的方法及装置 | |
CN112016605A (zh) | 一种基于边界框角点对齐和边界匹配的目标检测方法 | |
CN114038004A (zh) | 一种证件信息提取方法、装置、设备及存储介质 | |
CN110852327A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111738319B (zh) | 一种基于大规模样本的聚类结果评价方法及装置 | |
CN114219936A (zh) | 目标检测方法、电子设备、存储介质和计算机程序产品 | |
CN112001453A (zh) | 一种视频事件检测算法的准确率计算方法及装置 | |
US20240203081A1 (en) | Processing method for image recognition model and related product | |
CN110766938B (zh) | 路网拓扑结构的构建方法、装置、计算机设备及存储介质 | |
CN110210572B (zh) | 图像分类方法、装置、存储介质及设备 | |
CN111967383A (zh) | 年龄估计方法、年龄估计模型的训练方法和装置 | |
CN115984671A (zh) | 模型在线更新方法、装置、电子设备及可读存储介质 | |
CN116052231A (zh) | 掌静脉识别方法、装置、设备及存储介质 | |
CN112818865B (zh) | 车载领域图像识别方法、识别模型建立方法、装置、电子设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |