CN117392477A - 目标对象检测模型的训练、装置、计算机设备和存储介质 - Google Patents
目标对象检测模型的训练、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117392477A CN117392477A CN202311110695.4A CN202311110695A CN117392477A CN 117392477 A CN117392477 A CN 117392477A CN 202311110695 A CN202311110695 A CN 202311110695A CN 117392477 A CN117392477 A CN 117392477A
- Authority
- CN
- China
- Prior art keywords
- object detection
- target
- target object
- data set
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 195
- 238000012549 training Methods 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 claims abstract description 60
- 238000004590 computer program Methods 0.000 claims abstract description 40
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000000605 extraction Methods 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims description 23
- 238000004140 cleaning Methods 0.000 claims description 13
- 238000010801 machine learning Methods 0.000 description 9
- 238000002372 labelling Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种目标对象检测模型的训练方法、装置、计算机设备、存储介质和计算机程序产品,获取图像样本数据和当前目标对象检测模型,并对图像样本数据进行数据处理,得到目标数据集,基于目标数据集对当前目标对象检测模型中的分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合,基于目标数据集对组合后的目标对象检测模型进行训练,能够在保证目标对象检测模型的检测精度的同时,提高目标对象检测模型的检测速度,实现快速准确地定位目标对象。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种目标对象检测模型的训练、装置、计算机设备、存储介质和计算机程序产品。
背景技术
目标检测技术可以帮助定位到想要锁定的目标,例如,在一张图片中快速定位到指定区域。目前,在进行目标检测时,通常采用机器学习模型对图像数据进行识别,然而,为了保证模型的检测精度,往往需要对机器学习模型进行大量的训练,并且,容易影响检测速度。
发明内容
基于此,有必要针对上述技术问题,提供一种能够快速准确地定位目标对象的目标对象检测模型的训练、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种目标对象检测模型的训练方法,该方法包括:
获取图像样本数据和当前目标对象检测模型,当前目标对象检测模型包括分类网络模型和特征提取网络模型;
对图像样本数据进行数据处理,得到目标数据集,目标数据集为与当前目标对象检测模型相匹配的数据集;
基于目标数据集对分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合;
基于目标数据集对组合后的目标对象检测模型进行训练。
在其中一个实施例中,对图像样本数据进行数据处理,得到目标数据集的步骤,包括:
对图像样本数据进行数据标注,数据标注用于指示图像样本数据的图像类型;
对图像样本数据进行数据清洗处理,得到初始数据集;
对初始数据集的数据格式进行转换,得到目标数据集。
在其中一个实施例中,基于目标数据集对分类网络模型进行训练的步骤,包括:
将目标数据集输入至分类网络模型,输出得到预测图像类型;
调整分类网络模型的特征权重,更新目标数据集,返回将目标数据集输入至分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束对分类网络模型进行训练的过程。
在其中一个实施例中,基于目标数据集对组合后的目标对象检测模型进行训练的步骤,包括:
将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域;
调整组合后的目标对象检测模型中的模型参数,更新目标数据集,返回将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束对组合后的目标对象检测模型进行训练的过程。
在其中一个实施例中,调整组合后的目标对象检测模型的模型参数的步骤,包括:
调整组合后的目标对象检测模型的超参数和模型配置参数。
在其中一个实施例中,该方法还包括:
获取待进行检测的目标图像数据;
将目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域;
通过标记框对目标区域进行标记。
第二方面,本申请还提供了一种目标对象检测模型的训练装置,该装置包括:
模型获取模块,用于获取图像样本数据和当前目标对象检测模型,当前目标对象检测模型包括分类网络模型和特征提取网络模型;
数据处理模块,用于对图像样本数据进行数据处理,得到目标数据集,目标数据集为与当前目标对象检测模型相匹配的数据集;
第一训练模块,用于基于目标数据集对分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合;
第二训练模块,用于基于目标数据集对组合后的目标对象检测模型进行训练。
第三方面,本申请还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现第一方面中任意一项的方法步骤。
第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现第一方面中任意一项的方法步骤。
第五方面,本申请还提供了一种计算机程序产品,该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面中任意一项的方法步骤。
上述目标对象检测模型的训练方法、装置、计算机设备、存储介质和计算机程序产品,获取图像样本数据和当前目标对象检测模型,并对图像样本数据进行数据处理,得到目标数据集,基于目标数据集对当前目标对象检测模型中的分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合,基于目标数据集对组合后的目标对象检测模型进行训练,能够在保证目标对象检测模型的检测精度的同时,提高目标对象检测模型的检测速度,实现快速准确地定位目标对象。
附图说明
图1为一个实施例中目标对象检测模型的训练方法的应用环境图;
图2为一个实施例中目标对象检测模型的训练方法的流程示意图;
图3为一个实施例中目标对象检测模型的训练方法的流程示意图;
图4为一个实施例中目标对象检测模型的训练方法的流程示意图;
图5为一个实施例中目标对象检测模型的训练装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的目标对象检测模型的训练方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,终端102通过服务器104获取图像样本数据,并获取当前目标对象检测模型,对图像样本数据进行数据处理,得到目标数据集,基于目标数据集对当前目标对象检测模型中的分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合,基于目标数据集对组合后的目标对象检测模型进行训练。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种目标对象检测模型的训练方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
S202:获取图像样本数据和当前目标对象检测模型,当前目标对象检测模型包括分类网络模型和特征提取网络模型。
其中,图像样本数据可以是终端通过服务器获取的其他数据平台的数据,也可以是终端通过指定服务器获取的业务图像数据,例如业务界面图像。目标对象检测模型是用于从图像数据中检测指定目标对象的模型,传统的目标对象检测模型通常是通过对图像数据进行区域选择,筛选出用于检测目标的候选区域,并对这些候选区域进行特征提取,通过分类器对提取到的特征进行分类,以筛选出属于目标对象的特征,从而定位目标对象。其中,目标对象检测模型中,用于进行特征提取的部分是特征提取网络模型,用于进行特征分类的部分是分类网络模型。
S204:对图像样本数据进行数据处理,得到目标数据集,目标数据集为与当前目标对象检测模型相匹配的数据集。
其中,对于获取到的图像样本数据,终端首先需要对初始的数据进行相应的数据处理,包括数据清洗、提出异常值等,得到初始的数据集,为了保证数据集与当前目标对象检测模型的检测数据集的格式更匹配,终端还需要对初始的数据集进行格式转化,将初始数据转换成适应机器学习模型的输入形式,通常情况下,机器学习模型的输入数据为定长度的数据,也就是字符长度不变的数据,这里对初始的数据集进行格式转换就是将图像数据转换为能够被机器学习模型识别的机器语言数据。
S206:基于目标数据集对分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合。
其中,为了提升目标检测模型的检测速度,终端首先对分类网络模型进行训练,具体地,终端将目标数据集输入至分类网络模型,在训练的过程中,调账分类网络模型的特征权重,直至确定最优的特征权重,在保证分类效果的同时,使得分类网络模型的分类速度更快,以得到训练完成的分类网络模型,再将训练后的分类网络模型与特征提取网络模型重新进行组合。
S208:基于目标数据集对组合后的目标对象检测模型进行训练。
其中,对于组合后的目标对象检测模型,由于分类网络模型已经训练完成,在对目标对象检测模型进行训练的过程中,只需要对特征提取网络模型的模型参数进行调整,使得特征提取网络模型的提取效果最佳,同时,还可以调整分类网络模型和特征提取网络模型之间的组合参数,使得组合后的目标对象检测模型的能够快速准确的识别小目标。
上述目标对象检测模型的训练方法中,通过获取图像样本数据和当前目标对象检测模型,并对图像样本数据进行数据处理,得到目标数据集,基于目标数据集对当前目标对象检测模型中的分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合,基于目标数据集对组合后的目标对象检测模型进行训练,能够在保证目标对象检测模型的检测精度的同时,提高目标对象检测模型的检测速度,实现快速准确地定位目标对象。
在一个实施例中,对图像样本数据进行数据处理,得到目标数据集的步骤,包括:对图像样本数据进行数据标注,数据标注用于指示图像样本数据的图像类型;对图像样本数据进行数据清洗处理,得到初始数据集;对初始数据集的数据格式进行转换,得到目标数据集。
其中,终端在对图像样本数据进行数据处理时,首先需要对样本数据进行数据标注,以对图像样本数据的图像类型进行标注,具体地,图像类型可以是图像样本数据的数据来源,或者是图像样本数据表征的目标对象的类型。之后终端对图像样本数据进行数据清洗处理,剔除初始数据中的异常值,并对缺失地方进行补足,得到初始数据集,并对初始数据集的数据格式进行转换,得到目标数据集,目标数据集为与当前目标对象检测模型相匹配的数据集。
本实施例中,通过对图像样本数据进行数据标注,数据标注用于指示图像样本数据的图像类型,对图像样本数据进行数据清洗处理,得到初始数据集,对初始数据集的数据格式进行转换,得到目标数据集,能够保证图像样本数据是机器学习模型可以识别的数据,从而对机器学习模型进行训练。
在一个实施例中,基于目标数据集对分类网络模型进行训练的步骤,包括:将目标数据集输入至分类网络模型,输出得到预测图像类型;调整分类网络模型的特征权重,更新目标数据集,返回将目标数据集输入至分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束对分类网络模型进行训练的过程。
其中,终端将数据处理得到的目标数据集输入至分类网络模型,分类网络模型的输出为预测图像类型,根据预测图像类型与相应数据标注指示的图像类型间的差异程度,调整分类网络模型的特征权重,并更新目标数据集,将更新后的目标数据集输入至分类网络模型重新进行预测,直至得到的预测图像类型为相应的数据标注所指示的图像类型,则确定分类网络模型训练完成,结束对分类网络模型进行训练的过程。
本实施例中,通过将目标数据集输入至分类网络模型,输出得到预测图像类型;调整分类网络模型的特征权重,更新目标数据集,返回将目标数据集输入至分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束对分类网络模型进行训练的过程,能够实现对分类网络模型的训练,保证分类网络模型的模型精度,并提高模型处理效率。
在一个实施例中,基于目标数据集对组合后的目标对象检测模型进行训练的步骤,包括:将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域;调整组合后的目标对象检测模型中的模型参数,更新目标数据集,返回将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束对组合后的目标对象检测模型进行训练的过程。
其中,在对目标对象检测模型进行训练时,为了在提升模型检测速度的同时保证模型检测精度,终端将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,目标对象检测模型的输出为目标对象的得到预测区域,终端根据预测区域与目标对象实际区域间的差异程度,调整组合后的目标对象检测模型中的模型参数,并更新目标数据集,重复将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,直至得到的预测区域与目标区域间的误差满足误差要求条件,确定目标检测模型训练完成,结束对组合后的目标对象检测模型进行训练的过程。
本实施例中,通过将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域,调整组合后的目标对象检测模型中的模型参数,更新目标数据集,返回将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束对组合后的目标对象检测模型进行训练的过程,能够实现对目标对象检测模型的训练,保证目标对象检测模型的模型精度,并提高模型处理效率。
在一个实施例中,调整组合后的目标对象检测模型的模型参数的步骤,包括:调整组合后的目标对象检测模型的超参数和模型配置参数。
其中,机器学习模型的模型参数包括超参数和模型配置参数,超参数指的是机器学习模型的框架参数,终端在训练组合后的目标对象检测模型时,需要对组合后的目标对象检测模型的超参数和模型配置参数都进行调整,直至训练结束。
本实施例中,通过调整组合后的目标对象检测模型的超参数和模型配置参数,能够使得训练后的目标对象检测模型检测精度更高,且检测速度更快,实现快速准确地定位目标对象。
在一个实施例中,如图3所示,该方法还包括:
S302:获取待进行检测的目标图像数据。
其中,在实际应用中,终端获取待进行检测的目标图像数据,并对目标图像数据进行相应的数据处理,使得目标图像数据的数据格式与目标对象检测模型相匹配。
S304:将目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域。
其中,终端将目标图像数据输入至训练得到的目标对象检测模型中,目标对象检测模型的输出为预测的目标对象的目标区域。
S306:通过标记框对目标区域进行标记。
其中,为了对目标区域进行定位,终端通过标记框对目标区域进行标记,以提示目标区域的准确位置。
本实施例中,通过获取待进行检测的目标图像数据,将目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域,通过标记框对目标区域进行标记,能够实现快速准确地定位目标对象。
在一个实施例中,如图4所示,提供了一种目标对象检测模型的训练方法,该方法包括以下步骤:
S402:获取图像样本数据和当前目标对象检测模型,当前目标对象检测模型包括分类网络模型和特征提取网络模型。
S404:对图像样本数据进行数据标注,数据标注用于指示图像样本数据的图像类型;对图像样本数据进行数据清洗处理,得到初始数据集;对初始数据集的数据格式进行转换,得到目标数据集;目标数据集为与当前目标对象检测模型相匹配的数据集。
S406:将目标数据集输入至分类网络模型,输出得到预测图像类型;调整分类网络模型的特征权重,更新目标数据集,返回将目标数据集输入至分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束对分类网络模型进行训练的过程;将训练后的分类网络模型与特征提取网络模型进行组合。
S408:将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域;调整组合后的目标对象检测模型的超参数和模型配置参数,更新目标数据集,返回将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束对组合后的目标对象检测模型进行训练的过程。
S410:获取待进行检测的目标图像数据;将目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域;通过标记框对目标区域进行标记。
本实施例中,通过获取图像样本数据和当前目标对象检测模型,并对图像样本数据进行数据处理,得到目标数据集,基于目标数据集对当前目标对象检测模型中的分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合,基于目标数据集对组合后的目标对象检测模型进行训练,能够在保证目标对象检测模型的检测精度的同时,提高目标对象检测模型的检测速度,实现快速准确地定位目标对象。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的目标对象检测模型的训练方法的目标对象检测模型的训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个目标对象检测模型的训练装置实施例中的具体限定可以参见上文中对于目标对象检测模型的训练方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种目标对象检测模型的训练装置,包括:模型获取模块10、数据处理模块20、第一训练模块30和第二训练模块40,其中:
模型获取模块10,用于获取图像样本数据和当前目标对象检测模型,当前目标对象检测模型包括分类网络模型和特征提取网络模型。
数据处理模块20,用于对图像样本数据进行数据处理,得到目标数据集,目标数据集为与当前目标对象检测模型相匹配的数据集。
第一训练模块30,用于基于目标数据集对分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合。
第二训练模块40,用于基于目标数据集对组合后的目标对象检测模型进行训练。
在一个实施例中,数据处理模块20包括:数据标注单元、数据清洗单元和格式转换单元,其中:
数据标注单元,用于对图像样本数据进行数据标注,数据标注用于指示图像样本数据的图像类型。
数据清洗单元,用于对图像样本数据进行数据清洗处理,得到初始数据集。
格式转换单元,用于对初始数据集的数据格式进行转换,得到目标数据集。
在一个实施例中,第一训练模块30还用于将目标数据集输入至分类网络模型,输出得到预测图像类型;调整分类网络模型的特征权重,更新目标数据集,返回将目标数据集输入至分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束对分类网络模型进行训练的过程。
在一个实施例中,第二训练模块40还用于将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域;调整组合后的目标对象检测模型中的模型参数,更新目标数据集,返回将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束对组合后的目标对象检测模型进行训练的过程。
在一个实施例中,第二训练模块40还用于调整组合后的目标对象检测模型的超参数和模型配置参数。
在一个实施例中,第二训练模块40还用于获取待进行检测的目标图像数据;将目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域;通过标记框对目标区域进行标记。
上述目标对象检测模型装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种目标对象检测模型的训练方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取图像样本数据和当前目标对象检测模型,当前目标对象检测模型包括分类网络模型和特征提取网络模型;对图像样本数据进行数据处理,得到目标数据集,目标数据集为与当前目标对象检测模型相匹配的数据集;基于目标数据集对分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合;基于目标数据集对组合后的目标对象检测模型进行训练。
在一个实施例中,处理器执行计算机程序时涉及的对图像样本数据进行数据处理,得到目标数据集,包括:对图像样本数据进行数据标注,数据标注用于指示图像样本数据的图像类型;对图像样本数据进行数据清洗处理,得到初始数据集;对初始数据集的数据格式进行转换,得到目标数据集。
在一个实施例中,处理器执行计算机程序时涉及的基于目标数据集对分类网络模型进行训练,包括:将目标数据集输入至分类网络模型,输出得到预测图像类型;调整分类网络模型的特征权重,更新目标数据集,返回将目标数据集输入至分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束对分类网络模型进行训练的过程。
在一个实施例中,处理器执行计算机程序时涉及的基于目标数据集对组合后的目标对象检测模型进行训练,包括:将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域;调整组合后的目标对象检测模型中的模型参数,更新目标数据集,返回将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束对组合后的目标对象检测模型进行训练的过程。
在一个实施例中,处理器执行计算机程序时涉及的调整组合后的目标对象检测模型的模型参数,包括:调整组合后的目标对象检测模型的超参数和模型配置参数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待进行检测的目标图像数据;将目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域;通过标记框对目标区域进行标记。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取图像样本数据和当前目标对象检测模型,当前目标对象检测模型包括分类网络模型和特征提取网络模型;对图像样本数据进行数据处理,得到目标数据集,目标数据集为与当前目标对象检测模型相匹配的数据集;基于目标数据集对分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合;基于目标数据集对组合后的目标对象检测模型进行训练。
在一个实施例中,计算机程序被处理器执行时涉及的对图像样本数据进行数据处理,得到目标数据集,包括:对图像样本数据进行数据标注,数据标注用于指示图像样本数据的图像类型;对图像样本数据进行数据清洗处理,得到初始数据集;对初始数据集的数据格式进行转换,得到目标数据集。
在一个实施例中,计算机程序被处理器执行时涉及的基于目标数据集对分类网络模型进行训练,包括:将目标数据集输入至分类网络模型,输出得到预测图像类型;调整分类网络模型的特征权重,更新目标数据集,返回将目标数据集输入至分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束对分类网络模型进行训练的过程。
在一个实施例中,计算机程序被处理器执行时涉及的基于目标数据集对组合后的目标对象检测模型进行训练,包括:将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域;调整组合后的目标对象检测模型中的模型参数,更新目标数据集,返回将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束对组合后的目标对象检测模型进行训练的过程。
在一个实施例中,计算机程序被处理器执行时涉及的调整组合后的目标对象检测模型的模型参数,包括:调整组合后的目标对象检测模型的超参数和模型配置参数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取待进行检测的目标图像数据;将目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域;通过标记框对目标区域进行标记。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:获取图像样本数据和当前目标对象检测模型,当前目标对象检测模型包括分类网络模型和特征提取网络模型;对图像样本数据进行数据处理,得到目标数据集,目标数据集为与当前目标对象检测模型相匹配的数据集;基于目标数据集对分类网络模型进行训练,并将训练后的分类网络模型与特征提取网络模型进行组合;基于目标数据集对组合后的目标对象检测模型进行训练。
在一个实施例中,计算机程序被处理器执行时涉及的对图像样本数据进行数据处理,得到目标数据集,包括:对图像样本数据进行数据标注,数据标注用于指示图像样本数据的图像类型;对图像样本数据进行数据清洗处理,得到初始数据集;对初始数据集的数据格式进行转换,得到目标数据集。
在一个实施例中,计算机程序被处理器执行时涉及的基于目标数据集对分类网络模型进行训练,包括:将目标数据集输入至分类网络模型,输出得到预测图像类型;调整分类网络模型的特征权重,更新目标数据集,返回将目标数据集输入至分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束对分类网络模型进行训练的过程。
在一个实施例中,计算机程序被处理器执行时涉及的基于目标数据集对组合后的目标对象检测模型进行训练,包括:将目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域;调整组合后的目标对象检测模型中的模型参数,更新目标数据集,返回将目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束对组合后的目标对象检测模型进行训练的过程。
在一个实施例中,计算机程序被处理器执行时涉及的调整组合后的目标对象检测模型的模型参数,包括:调整组合后的目标对象检测模型的超参数和模型配置参数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取待进行检测的目标图像数据;将目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域;通过标记框对目标区域进行标记。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种目标对象检测模型的训练方法,其特征在于,所述方法包括:
获取图像样本数据和当前目标对象检测模型,所述当前目标对象检测模型包括分类网络模型和特征提取网络模型;
对所述图像样本数据进行数据处理,得到目标数据集,所述目标数据集为与所述当前目标对象检测模型相匹配的数据集;
基于所述目标数据集对所述分类网络模型进行训练,并将训练后的分类网络模型与所述特征提取网络模型进行组合;
基于所述目标数据集对组合后的目标对象检测模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述对所述图像样本数据进行数据处理,得到目标数据集,包括:
对所述图像样本数据进行数据标注,所述数据标注用于指示所述图像样本数据的图像类型;
对所述图像样本数据进行数据清洗处理,得到初始数据集;
对所述初始数据集的数据格式进行转换,得到目标数据集。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标数据集对所述分类网络模型进行训练,包括:
将所述目标数据集输入至所述分类网络模型,输出得到预测图像类型;
调整所述分类网络模型的特征权重,更新所述目标数据集,返回所述将所述目标数据集输入至所述分类网络模型的步骤,并继续执行,直至得到的预测图像类型为相应的数据标注所指示的图像类型,结束所述对所述分类网络模型进行训练的过程。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标数据集对组合后的目标对象检测模型进行训练,包括:
将所述目标数据集作为可变输入数据,输入至组合后的目标对象检测模型,得到预测区域;
调整组合后的目标对象检测模型中的模型参数,更新所述目标数据集,返回所述将所述目标数据集作为可变输入数据,输入至组合后的目标检测模型的步骤,并继续执行,直至得到的预测区域与目标区域间的误差满足误差要求条件,结束所述对组合后的目标对象检测模型进行训练的过程。
5.根据权利要求4所述的方法,其特征在于,所述调整组合后的目标对象检测模型的模型参数,包括:
调整组合后的目标对象检测模型的超参数和模型配置参数。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待进行检测的目标图像数据;
将所述目标图像数据输入至训练得到的目标对象检测模型中,得到目标区域;
通过标记框对所述目标区域进行标记。
7.一种目标对象检测模型的训练装置,其特征在于,所述装置包括:
模型获取模块,用于获取图像样本数据和当前目标对象检测模型,所述当前目标对象检测模型包括分类网络模型和特征提取网络模型;
数据处理模块,用于对所述图像样本数据进行数据处理,得到目标数据集,所述目标数据集为与所述当前目标对象检测模型相匹配的数据集;
第一训练模块,用于基于所述目标数据集对所述分类网络模型进行训练,并将训练后的分类网络模型与所述特征提取网络模型进行组合;
第二训练模块,用于基于所述目标数据集对组合后的目标对象检测模型进行训练。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311110695.4A CN117392477A (zh) | 2023-08-31 | 2023-08-31 | 目标对象检测模型的训练、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311110695.4A CN117392477A (zh) | 2023-08-31 | 2023-08-31 | 目标对象检测模型的训练、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117392477A true CN117392477A (zh) | 2024-01-12 |
Family
ID=89467336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311110695.4A Pending CN117392477A (zh) | 2023-08-31 | 2023-08-31 | 目标对象检测模型的训练、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117392477A (zh) |
-
2023
- 2023-08-31 CN CN202311110695.4A patent/CN117392477A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2020240809A1 (ja) | 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム | |
CN110956131A (zh) | 单目标追踪方法、装置及系统 | |
CN112329762A (zh) | 图像处理方法、模型训练方法、装置、计算机设备和介质 | |
CN115393376A (zh) | 医学图像处理方法、装置、计算机设备和存储介质 | |
CN117953341A (zh) | 一种病理图像分割网络模型、方法、装置及介质 | |
CN117332766A (zh) | 流程图生成方法、装置、计算机设备和存储介质 | |
CN116932935A (zh) | 地址匹配方法、装置、设备、介质和程序产品 | |
US20230016455A1 (en) | Decomposing a deconvolution into multiple convolutions | |
CN116051959A (zh) | 一种目标检测方法、装置 | |
CN116704511A (zh) | 设备清单文字识别方法和装置 | |
CN116310308A (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
CN117392477A (zh) | 目标对象检测模型的训练、装置、计算机设备和存储介质 | |
CN116612474B (zh) | 对象检测方法、装置、计算机设备及计算机可读存储介质 | |
JP7344501B1 (ja) | プログラム、方法、情報処理装置、システム | |
CN115601550B (zh) | 模型确定方法、装置、计算机设备及计算机可读存储介质 | |
CN114898094B (zh) | 点云上采样方法、装置、计算机设备和存储介质 | |
CN118230072B (zh) | 基于二维分类模型的三维点云分类模型训练方法和介质 | |
WO2023220891A1 (en) | Resolution-switchable segmentation networks | |
CN117953415A (zh) | 物品摆放检测方法、装置、计算机设备及存储介质 | |
CN116993961A (zh) | 目标检测模型的训练方法、装置、计算机设备和存储介质 | |
CN117436484A (zh) | 图像识别模型构建、装置、计算机设备和存储介质 | |
CN115761397A (zh) | 模型训练方法、图像分类方法、装置、设备及存储介质 | |
CN118570488A (zh) | 图像寻边方法、装置、计算机设备、存储介质和程序产品 | |
US20220414077A1 (en) | Graph searching apparatus, graph searching method, and computer-readable recording medium | |
CN118820950A (zh) | 作业结果自动确定方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |