CN116402665A - 图像任务处理方法、装置、设备及存储介质 - Google Patents

图像任务处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116402665A
CN116402665A CN202310054901.8A CN202310054901A CN116402665A CN 116402665 A CN116402665 A CN 116402665A CN 202310054901 A CN202310054901 A CN 202310054901A CN 116402665 A CN116402665 A CN 116402665A
Authority
CN
China
Prior art keywords
training
image
target
model
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310054901.8A
Other languages
English (en)
Inventor
黄耀
孟超超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aqiu Technology Co ltd
Original Assignee
Beijing Aqiu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aqiu Technology Co ltd filed Critical Beijing Aqiu Technology Co ltd
Priority to CN202310054901.8A priority Critical patent/CN116402665A/zh
Publication of CN116402665A publication Critical patent/CN116402665A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于图像处理技术领域,公开了一种图像任务处理方法、装置、设备及存储介质。该方法包括:在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型;对所述任务类型的初始神经网络进行参数调整,得到待训练网络;根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型;根据所述目标训练模型完成所述图像处理任务。通过上述方式,基于训练得到的目标训练模型完成图像处理任务,可保证图像处理任务的准确性和效率,同时使模型训练过程更为智能且保证目标训练模型的性能,减少了模型训练时间和训练难度。

Description

图像任务处理方法、装置、设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像任务处理方法、装置、设备及存储介质。
背景技术
随着深度学习在AI方面的广泛应用,如分类与目标检测、语言建模和推荐系统等,深度学习渗透到我们生活的方方面面,为我们带来了极大的便利。然而,为特定任务建立高质量深度学习系统的过程不仅耗时,而且需要大量资源并依赖于人类专业知识,这阻碍了工业界和学术界的深度学习的发展。同时,现有的深度学习算法模型从初期训练到后期判断模型是否满足要求均需要依赖人工经验,不仅错误率高,还效率低下。
发明内容
本发明的主要目的在于提供一种图像任务处理方法、装置、设备及存储介质,旨在解决现有技术中如何使模型训练过程更为智能且保证模型的性能,从而提高图像处理任务的准确性和效率的技术问题。
为实现上述目的,本发明提供了一种图像任务处理方法,所述图像任务处理方法包括:
在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型;
对所述任务类型的初始神经网络进行参数调整,得到待训练网络;
根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型;
根据所述目标训练模型完成所述图像处理任务。
可选地,所述对所述任务类型的初始神经网络进行参数调整,得到待训练网络,包括:
根据预设优化策略对所述任务类型的初始神经网络进结构调整,得到目标神经元数量和目标层数;
根据所述预设优化策略对所述初始神经网络进行参数调整,得到目标超参数;
根据所述目标神经元数量、所述目标层数以及所述目标超参数得到待训练网络。
可选地,所述根据所述预设优化策略对所述初始神经网络进行参数调整,得到目标超参数,包括:
根据初始超参数候选集确定优化样本点;
根据所述优化样本点和所述初始神经网络确定模型评价指标;
根据预设代理函数、所述优化样本点以及所述模型评价指标进行拟合,得到拟合结果;
根据所述拟合结果确定目标函数值;
根据所述目标函数值得到目标超参数。
可选地,所述根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型,包括:
获取初始图像集;
根据所述图像处理任务对所述初始图像集中的样本图像进行图像标注,得到目标图像集;
对所述目标图像集进行划分,得到目标训练集和目标测试集;
根据所述目标训练集对所述待训练模型进行模型训练,得到初始训练模型;
根据所述目标测试集和预设挑选策略对所述初始训练模型进行模型更新,得到目标训练模型。
可选地,所述根据所述目标测试集和预设挑选策略对所述初始训练模型进行模型更新,得到目标训练模型,包括:
输入所述目标测试集至所述初始训练模型,得到预测输出结果;
根据所述预测输出结果和预设挑选策略在所述目标测试集中确定更新训练集;
根据所述目标训练集和所述更新训练集确定调整训练集;
根据所述调整训练集对所述初始训练模型进行更新训练,得到目标训练模型。
可选地,所述根据所述预测输出结果和预设挑选策略在所述目标测试集中确定更新训练集,包括:
根据所述预测输出结果进行梯度计算,得到挑选梯度;
根据目标测试集的梯度向量和预设聚类算法进行样本选择,确定多样性样本;
根据所述挑选梯度和所述多样性样本在所述目标测试集中确定更新训练集。
可选地,所述根据所述调整训练集对所述初始训练模型进行更新训练,得到目标训练模型,包括:
根据所述调整训练集对所述初始训练模型进行更新训练,得到待检测模型;
获取所述待检测模型的召回率和准确率;
在所述召回率和所述准确率达到预设指标标准时,根据所述待检测模型得到目标训练模型。
此外,为实现上述目的,本发明还提出一种图像任务处理装置,所述图像任务处理装置包括:
确定模块,用于在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型;
调整模块,用于对所述任务类型的初始神经网络进行参数调整,得到待训练网络;
训练模块,用于根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型;
完成模块,用于根据所述目标训练模型完成所述图像处理任务。
此外,为实现上述目的,本发明还提出一种图像任务处理设备,所述图像任务处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像任务处理程序,所述图像任务处理程序配置为实现如上文所述的图像任务处理方法。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有图像任务处理程序,所述图像任务处理程序被处理器执行时实现如上文所述的图像任务处理方法。
本发明通过在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型;对所述任务类型的初始神经网络进行参数调整,得到待训练网络;根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型;根据所述目标训练模型完成所述图像处理任务。通过上述方式,在接收到用户发送的图像处理任务时,基于图像处理任务的任务类型确定对应的初始神经网络,并对初始神经网络进行参数调整,从而得到对应的待训练网络,并根据图像训练集和预设挑选策略对待训练网络进行模型训练,基于训练得到的目标训练模型完成图像处理任务,可保证图像处理任务的准确性和效率,同时使模型训练过程更为智能且保证目标训练模型的性能,减少了模型训练时间和训练难度。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的图像任务处理设备的结构示意图;
图2为本发明图像任务处理方法第一实施例的流程示意图;
图3为本发明图像任务处理方法第二实施例的流程示意图;
图4为本发明图像任务处理装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的图像任务处理设备结构示意图。
如图1所示,该图像任务处理设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对图像任务处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图像任务处理程序。
在图1所示的图像任务处理设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明图像任务处理设备中的处理器1001、存储器1005可以设置在图像任务处理设备中,所述图像任务处理设备通过处理器1001调用存储器1005中存储的图像任务处理程序,并执行本发明实施例提供的图像任务处理方法。
本发明实施例提供了一种图像任务处理方法,参照图2,图2为本发明一种图像任务处理方法第一实施例的流程示意图。
图像任务处理方法包括以下步骤:
步骤S10:在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型。
需要说明的是,本实施例的执行主体为终端设备,终端设备可为电脑、手机或平板等智能终端,还可为其他智能终端,本实施例对此不加以限制,终端设备上存在图像任务处理系统,图像任务处理系统以AutoML系统为基础,AutoML是自动化端到流程端的过程,应用适当的数据预处理、特征工程、模型选择以及模型评估来解决特定任务。图像任务处理系统在接收到用户发送的图像处理任务时,确定图像处理任务的任务类型,对任务类型的初始神经网络进行参数调整,得到待训练网络,根据图像处理任务的图像训练集和预设挑选策略对待训练网络进行模型训练,得到目标训练模型,根据目标训练模型完成图像处理任务。
可以理解的是,图像处理任务可以是图像分类任务、语义分割任务以及图像检测任务,在接收到用户向终端设备发送的图像处理任务后,确定图像处理任务的任务类型,任务类型包括但不限于图像分类、语义分割以及图像检测,任何适用于深度神经网络的任务类型均可。
步骤S20:对所述任务类型的初始神经网络进行参数调整,得到待训练网络。
需要说明的是,获取任务类型对应的深度神经网络,任务类型对应的深度神经网络即为初始神经网络。初始神经网络的基本结构为:卷积层(Convolutional layer),卷积神经网路中每层卷积层由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法优化得到的。卷积运算的目的是提取输入的不同特征,第一层卷积层只能提取一些低级的特征如边缘、线条和角等层级,更多层的网络能从低级特征中迭代提取更复杂的特征。线性整流层(Rectified Linear Units layer, ReLU layer),这一层神经的活性化函数(Activation function)使用线性整流(Rectified Linear Units, ReLU)
Figure SMS_1
。池化层(Pooling layer),通常在卷积层之后会得到维度很大的特征,将特征切成几个区域,取其最大值或平均值,得到新的、维度较小的特征。全连接层( Fully-Connectedlayer), 把所有局部特征结合变成全局特征,用来计算最后每一类的得分。
可以理解的是,基于图像处理系统中的AutoML系统使用贝叶斯优化方法针对初始神经网络中的网络神经元数量、层数以及超参数进行调整,得到调整后的初始神经网络,调整后的初始神经网络即为待训练网络。
在具体实现中,为了保证对初始神经网络参数调整的准确性,进一步地,所述对所述任务类型的初始神经网络进行参数调整,得到待训练网络,包括:根据预设优化策略对所述任务类型的初始神经网络进结构调整,得到目标神经元数量和目标层数;根据所述预设优化策略对所述初始神经网络进行参数调整,得到目标超参数;根据所述目标神经元数量、所述目标层数以及所述目标超参数得到待训练网络。
需要说明的是,预设优化策略指的是基于贝叶斯优化方法所形成的参数优化策略。根据预设优化策略针对初始神经网络的网络神经元数量和层数进行调整,从而得到调整后的目标神经元数量和目标层数。
可以理解的是,根据预设优化策略针对初始神经网络的超参数进行调整,从而得到目标超参数,目标超参数包括初始神经网络的损失函数、批次大小、迭代次数、学习率、正则方法以及系数等超参数的最优解。
在具体实现中,在根据预设优化策略对初始神经网络的网络神经元数量、层数以及超参数进行调整后,基于得到的目标神经元数量、目标层数以及目标超参数可得到调参后的初始神经网络,调参后的初始神经网络即为待训练网络。
需要说明的是,为了根据预设优化策略对初始神经网络进行准确的参数调整,进一步地,所述根据所述预设优化策略对所述初始神经网络进行参数调整,得到目标超参数,包括:根据初始超参数候选集确定优化样本点;根据所述优化样本点和所述初始神经网络确定模型评价指标;根据预设代理函数、所述优化样本点以及所述模型评价指标进行拟合,得到拟合结果;根据所述拟合结果确定目标函数值;根据所述目标函数值得到目标超参数。
可以理解的是,初始超参数候选集指的是由损失函数、批次大小、迭代次数、学习率、正则方法以及系数所构成的集,在初始超参数候选集中随机选取几个样本点,一个样本点可为上述某一项参数的数值,也可为任意几项的组合,在初始超参数候选集中随机选取的样本点即为优化样本点。
在具体实现中,预设优化策略通过基于目标函数的过去评估结果建立替代函数(概率模型),来找到最小化目标函数的值,预设优化策略要求存在优化样本点,并且通过高斯过程回归(假设超参数间符合联合高斯分布)计算前面n个优化样本点的后验概率分布,得到每一个超参数在每一个取值点的期望均值和方差,其中均值代表这个点最终的期望效果,均值越大表示模型最终指标越大,方差表示这个点的效果不确定性。
需要说明的是,根据预设优化策略对初始神经网络的超参数进行调整优化的具体过程为:针对
Figure SMS_6
,目标为从N中选择一个/>
Figure SMS_16
,使得/>
Figure SMS_20
的值最小或者最大。可能/>
Figure SMS_5
的具体公式形态无法得知,但是假如选择一个/>
Figure SMS_14
,可以通过实验或者观察得出
Figure SMS_24
的值。/>
Figure SMS_27
是一个黑盒的函数,N为初始超参数候选集,/>
Figure SMS_8
为优化样本点。在初始超参数候选集中随机选择若干组优化样本点/>
Figure SMS_10
,对初始神经网络进行训练,得到相应的模型评价指标/>
Figure SMS_18
,用预设代理函数(高斯过程)来拟合/>
Figure SMS_26
、/>
Figure SMS_7
,用采集函数来选择最佳的/>
Figure SMS_11
,并将/>
Figure SMS_17
带入初始神经网络,得到新的/>
Figure SMS_23
,然后重新进入用预设代理函数来拟合/>
Figure SMS_3
、/>
Figure SMS_12
的过程,直至选出满足要求的/>
Figure SMS_19
、/>
Figure SMS_25
,用预设代理函数(高斯过程)来拟合/>
Figure SMS_2
、/>
Figure SMS_9
,用采集函数来选择最佳的/>
Figure SMS_15
,并将/>
Figure SMS_21
带入初始神经网络,得到新的/>
Figure SMS_4
所得到的结果即为拟合结果。选择拟合结果中满足要求的/>
Figure SMS_13
、/>
Figure SMS_22
,目标函数值应为最小化目标函数/>
Figure SMS_28
的值。最终根据目标函数值可确定损失函数、批次大小、迭代次数、学习率、正则方法以及系数等超参数的最优解,损失函数、批次大小、迭代次数、学习率、正则方法以及系数等超参数的最优解即为目标超参数。
可以理解的是,高斯过程的思想为:假设
Figure SMS_29
服从高维正态分布(先验),而根据训练集可以得到最优的核矩阵,从而得到后验以估计测试集/>
Figure SMS_30
,后验如下:
Figure SMS_31
,其中,/>
Figure SMS_32
为训练集的核向量,有如下关系:
Figure SMS_33
,在后验公式中,只有均值和训练集/>
Figure SMS_34
有关,方差则仅仅和核矩阵,也就是训练集和测试集的/>
Figure SMS_35
有关,与训练集/>
Figure SMS_36
无关。
步骤S30:根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型。
需要说明的是,图像训练集指的是根据图像处理任务的任务要求对样本图像进行图像标注后得到的图像集。预设挑选策略指的是基于主动选择算法所形成的训练集挑选策略,目标训练模型指的是训练完成的待训练网络对应的模型。
可以理解的是,根据图像训练集和预设挑选策略对待训练网络进行模型训练,从而得到性能好置信度高的目标训练模型。
步骤S40:根据所述目标训练模型完成所述图像处理任务。
需要说明的是,输入图像处理任务中的待处理图像至目标训练模型,从而得到待处理图像的处理结果,基于待处理图像的处理结果完成图像处理任务。
本实施例通过在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型;对所述任务类型的初始神经网络进行参数调整,得到待训练网络;根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型;根据所述目标训练模型完成所述图像处理任务。通过上述方式,在接收到用户发送的图像处理任务时,基于图像处理任务的任务类型确定对应的初始神经网络,并对初始神经网络进行参数调整,从而得到对应的待训练网络,并根据图像训练集和预设挑选策略对待训练网络进行模型训练,基于训练得到的目标训练模型完成图像处理任务,可保证图像处理任务的准确性和效率,同时使模型训练过程更为智能且保证目标训练模型的性能,减少了模型训练时间和训练难度。
参考图3,图3为本发明一种图像任务处理方法第二实施例的流程示意图。
基于上述第一实施例,本实施例图像任务处理方法中所述步骤S30,包括:
步骤S31:获取初始图像集。
需要说明的是,初始图像集指的是图像处理系统中存储的未经标注的样本图像集。
步骤S32:根据所述图像处理任务对所述初始图像集中的样本图像进行图像标注,得到目标图像集。
需要说明的是,根据图像处理任务的任务要求对初始图像集中的各样本图像进行图像标注,从而得到标注后的初始图像集,图像标注后的初始图像集即为目标图像集。
步骤S33:对所述目标图像集进行划分,得到目标训练集和目标测试集。
需要说明的是,对目标图像集进行划分,具体过程为:在目标图像集中随机挑选一定比例的图像数据,将其作为目标训练集initial train data,剩余数据即作为目标测试集initial train data,目标训练集中包含各种类别的图像数据。
步骤S34:根据所述目标训练集对所述待训练网络进行模型训练,得到初始训练模型。
需要说明的是,根据目标训练集对待训练网络进行模型训练,从而得到训练后的待训练网络,训练后的待训练网络即为初始训练模型。
步骤S35:根据所述目标测试集和预设挑选策略对所述初始训练模型进行模型更新,得到目标训练模型。
需要说明的是,根据目标测试集和预设挑选策略对初始训练模型进行模型更新,更新后的初始训练模型即为目标训练模型。
可以理解的是,为了根据目标测试集和预设挑选策略得到准确的目标训练模型,进一步地,所述根据所述目标测试集和预设挑选策略对所述初始训练模型进行模型更新,得到目标训练模型,包括:输入所述目标测试集至所述初始训练模型,得到预测输出结果;根据所述预测输出结果和预设挑选策略在所述目标测试集中确定更新训练集;根据所述目标训练集和所述更新训练集确定调整训练集;根据所述调整训练集对所述初始训练模型进行更新训练,得到目标训练模型。
在具体实现中,根据本实施例的预设挑选策略,利用每一轮训练后得到的模型对目标测试集进行预测,并将预测结果输入预设挑选策略中的主动选择算法,从而在目标测试集中挑选出信息量最大的图像数据,将该图像数据作为更新训练集,将更新训练集和目标训练集进行汇总,得到调整训练集,利用调整训练集对初始训练模型进行更新训练,最终得到训练完成的目标训练模型。
需要说明的是,更新训练过程具体为:若当前是初始训练轮次,则表明还没有当前最优模型,也即无法使用模型对数据的反馈来进行主动的数据挑选,则此时利用随机策略,即采用在目标图像集中随机挑选确定目标训练集的方式,然后得到训练后的初始训练模型,基于预设挑选策略进入主动学习的过程;若当前不是初始训练轮次,则使用训练得到的初始训练模型对目标测试集进行预测,得到预测输出结果,并将预测输出结果输入至预设挑选策略中的主动选择算法,从而在目标测试集中确定更新训练集。
可以理解的是,为了基于预测输出结果和预设挑选策略得到准确的更新训练集,进一步地,所述根据所述预测输出结果和预设挑选策略在所述目标测试集中确定更新训练集,包括:根据所述预测输出结果进行梯度计算,得到挑选梯度;根据目标测试集的梯度向量和预设聚类算法进行样本选择,确定多样性样本;根据所述挑选梯度和所述多样性样本在所述目标测试集中确定更新训练集。
在具体实现中,预测挑选策略是融合不确定性和多样性进行挑选,其中不确定性通过网络参数的梯度范数衡量,多样性通过梯度空间中一组分散的样本来获得,梯度表示多样性,根据预测输出结果进行梯度计算,得到挑选梯度,具体过程为:输入目标测试集中的测试样本
Figure SMS_54
,得到预测输出结果/>
Figure SMS_43
,并确定损失函数,基于损失函数和预测输出结果计算初始训练模型中网络的最后一层参数的梯度/>
Figure SMS_49
。梯度/>
Figure SMS_38
的量级能够有效的估计样本对模型训练的影响,比如具有较高置信度的样本通常具有较小的梯度量级,而较大的梯度量级表明模型需要较大的调整参数才能提高预测结果的置信度。梯度范数不确定的计算公式如下:/>
Figure SMS_47
、/>
Figure SMS_39
Figure SMS_50
、/>
Figure SMS_44
,其中/>
Figure SMS_52
为非线性的神经网络函数,由/>
Figure SMS_37
参数初始化,/>
Figure SMS_45
,/>
Figure SMS_41
是网络/>
Figure SMS_46
的参数,/>
Figure SMS_42
是将输入/>
Figure SMS_48
映射到网络倒数第二层输出的非线性函数,/>
Figure SMS_40
是标签/>
Figure SMS_51
的梯度。最终所得到的/>
Figure SMS_53
即为挑选梯度。
需要说明的是,预设聚类算法在本实施例中为k-means算法,用梯度向量来聚类,选到差异大的测试样本就变成让模型参数更新方向不同的样本,而不是测试样本特征本身不同;根据目标测试集的梯度嵌入,通过预设据类算法选择目标测试集中的更新训练集,根据目标测试集的梯度向量和预设聚类算法进行样本选择,确定多样性样本,具体过程为:为每个聚类选择一个初始聚类中心,根据目标测试集的梯度向量选择梯度最大的作为初始聚类中心;计算欧式距离,并对其进行归类,遍历目标测试集中的每一个测试样本,计算每一个测试样本与所有初始聚类中心的欧式距离
Figure SMS_55
,将其加入到欧式距离最小的那个聚类中心的一类中,这里采用欧式距离公式如下:/>
Figure SMS_56
更新聚类中心,重新计算每一类的中心;重复步骤计算欧式距离和更新聚类中心直至聚类中心的位置不再发生变化,从而确定目标测试集中具有多样性的测试样本,具有多样性的测试样本即为多样性样本。
可以理解的是,根据挑选梯度和多样性样本在所述目标测试集中确定不确定性高且多样性的测试样本,不确定性高且多样性的测试样本即为更新训练集,目标测试集中剩余的测试样本即为更新测试集。
在具体实现中,为了保证模型训练终止时的准确性,从而保证目标训练模型的性能,进一步地,所述根据所述调整训练集对所述初始训练模型进行更新训练,得到目标训练模型,包括:根据所述调整训练集对所述初始训练模型进行更新训练,得到待检测模型;获取所述待检测模型的召回率和准确率;在所述召回率和所述准确率达到预设指标标准时,根据所述待检测模型得到目标训练模型。
需要说明的是,在确定调整训练集后,根据调整训练集对初始训练模型进行更新训练,得到待检测模型,且需判断待检测模型是否相比于前面轮次的模型有所提升,以及待检测模型的指标是否达到预设指标标准,来判断是否继续根据更新训练集对待检测模型进行更新训练的步骤,若待检测模型的指标达到预设指标标准,则将待检测模型作为目标训练模型。
可以理解的是,预设指标指标包括准确率指标标准和召回率指标标准,计算待检测模型的召回率和准确率,判断待检测模型的召回率和准确率是否达到预设指标标准,召回率和准确率的计算公式如下:
Figure SMS_57
、/>
Figure SMS_58
,其中1Positive(真正,TP):将正类预测为正类数量,1 Negative(真负,TN):将负类预测为负类数量,FN(0 Negative):错误的反例,漏报,本为正类但判定为假类,在本实施例中Accuracy设为0.9,Recall设为0.85,也可设置为其他值,本实施例对此不加以限制。
在具体实现中,在得到待检测模型后,也可采用在预设挑选策略的训练集数量达到预设数量时停止迭代更新,即将待检测模型作为目标训练模型,例如,目标图像集为10000张,预设数量为7000张,通过预设挑选策略时训练集数量达到7000张时停止迭代更新,将更新训练得到的待检测模型作为目标训练模型。
需要说明的是,模型训练过程即为通过目标训练集对待训练网络进行训练,得到初始训练模型,输入目标测试集至初始训练模型,根据预测输出结果和预设挑选策略在目标测试集中确定信息量大的更新训练集,目标测试集中剩余的测试样本为更新测试集,根据更新训练集和目标训练集得到调整训练集,根据调整训练集对初始训练模型进行更新训练,得到待检测模型,若待检测模型的召回率指标和准确率指标不满足预设指标标准,则输入更新测试集至待检测模型,根据预测输出结果和预设挑选策略在更新测试集中确定信息量大的二次更新训练集,更新测试集中剩余的测试样本为二次更新测试集,根据调整训练集和二次更新训练集得到二次调整训练集,根据二次调整训练集对待检测模型进行更新训练,得到二次待检测模型,重复上述步骤,直至待检测模型的召回率和准确率达到预设指标标准时,则将待检测模型作为目标训练模型。
本实施例中通过获取初始图像集;根据所述图像处理任务对所述初始图像集中的样本图像进行图像标注,得到目标图像集;对所述目标图像集进行划分,得到目标训练集和目标测试集;根据所述目标训练集对所述待训练模型进行模型训练,得到初始训练模型;根据所述目标测试集和预设挑选策略对所述初始训练模型进行模型更新,得到目标训练模型。通过上述方式,保证了目标训练模型的性能,同时降低了深度学习的使用难度和模型训练时间。
此外,参照图4,本发明实施例还提出一种图像任务处理装置,所述图像任务处理装置包括:
确定模块10,用于在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型。
调整模块20,用于对所述任务类型的初始神经网络进行参数调整,得到待训练网络。
训练模块30,用于根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型。
完成模块40,用于根据所述目标训练模型完成所述图像处理任务。
本实施例通过在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型;对所述任务类型的初始神经网络进行参数调整,得到待训练网络;根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型;根据所述目标训练模型完成所述图像处理任务。通过上述方式,在接收到用户发送的图像处理任务时,基于图像处理任务的任务类型确定对应的初始神经网络,并对初始神经网络进行参数调整,从而得到对应的待训练网络,并根据图像训练集和预设挑选策略对待训练网络进行模型训练,基于训练得到的目标训练模型完成图像处理任务,可保证图像处理任务的准确性和效率,同时使模型训练过程。
在一实施例中,所述调整模块20,还用于根据预设优化策略对所述任务类型的初始神经网络进结构调整,得到目标神经元数量和目标层数;
根据所述预设优化策略对所述初始神经网络进行参数调整,得到目标超参数;
根据所述目标神经元数量、所述目标层数以及所述目标超参数得到待训练网络。
在一实施例中,所述调整模块20,还用于根据初始超参数候选集确定优化样本点;
根据所述优化样本点和所述初始神经网络确定模型评价指标;
根据预设代理函数、所述优化样本点以及所述模型评价指标进行拟合,得到拟合结果;
根据所述拟合结果确定目标函数值;
根据所述目标函数值得到目标超参数。
在一实施例中,所述训练模块30,还用于获取初始图像集;
根据所述图像处理任务对所述初始图像集中的样本图像进行图像标注,得到目标图像集;
对所述目标图像集进行划分,得到目标训练集和目标测试集;
根据所述目标训练集对所述待训练模型进行模型训练,得到初始训练模型;
根据所述目标测试集和预设挑选策略对所述初始训练模型进行模型更新,得到目标训练模型。
在一实施例中,所述训练模块30,还用于输入所述目标测试集至所述初始训练模型,得到预测输出结果;
根据所述预测输出结果和预设挑选策略在所述目标测试集中确定更新训练集;
根据所述目标训练集和所述更新训练集确定调整训练集;
根据所述调整训练集对所述初始训练模型进行更新训练,得到目标训练模型。
在一实施例中,所述训练模块30,还用于根据所述预测输出结果进行梯度计算,得到挑选梯度;
根据目标测试集的梯度向量和预设聚类算法进行样本选择,确定多样性样本;
根据所述挑选梯度和所述多样性样本在所述目标测试集中确定更新训练集。
在一实施例中,所述训练模块30,还用于根据所述调整训练集对所述初始训练模型进行更新训练,得到待检测模型;
获取所述待检测模型的召回率和准确率;
在所述召回率和所述准确率达到预设指标标准时,根据所述待检测模型得到目标训练模型。
由于本装置采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有图像任务处理程序,所述图像任务处理程序被处理器执行时实现如上文所述的图像任务处理方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的图像任务处理方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光 盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种图像任务处理方法,其特征在于,所述图像任务处理方法包括:
在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型;
对所述任务类型的初始神经网络进行参数调整,得到待训练网络;
根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型;
根据所述目标训练模型完成所述图像处理任务。
2.如权利要求1所述的图像任务处理方法,其特征在于,所述对所述任务类型的初始神经网络进行参数调整,得到待训练网络,包括:
根据预设优化策略对所述任务类型的初始神经网络进结构调整,得到目标神经元数量和目标层数;
根据所述预设优化策略对所述初始神经网络进行参数调整,得到目标超参数;
根据所述目标神经元数量、所述目标层数以及所述目标超参数得到待训练网络。
3.如权利要求2所述的图像任务处理方法,其特征在于,所述根据所述预设优化策略对所述初始神经网络进行参数调整,得到目标超参数,包括:
根据初始超参数候选集确定优化样本点;
根据所述优化样本点和所述初始神经网络确定模型评价指标;
根据预设代理函数、所述优化样本点以及所述模型评价指标进行拟合,得到拟合结果;
根据所述拟合结果确定目标函数值;
根据所述目标函数值得到目标超参数。
4.如权利要求1所述的图像任务处理方法,其特征在于,所述根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型,包括:
获取初始图像集;
根据所述图像处理任务对所述初始图像集中的样本图像进行图像标注,得到目标图像集;
对所述目标图像集进行划分,得到目标训练集和目标测试集;
根据所述目标训练集对所述待训练模型进行模型训练,得到初始训练模型;
根据所述目标测试集和预设挑选策略对所述初始训练模型进行模型更新,得到目标训练模型。
5.如权利要求4所述的图像任务处理方法,其特征在于,所述根据所述目标测试集和预设挑选策略对所述初始训练模型进行模型更新,得到目标训练模型,包括:
输入所述目标测试集至所述初始训练模型,得到预测输出结果;
根据所述预测输出结果和预设挑选策略在所述目标测试集中确定更新训练集;
根据所述目标训练集和所述更新训练集确定调整训练集;
根据所述调整训练集对所述初始训练模型进行更新训练,得到目标训练模型。
6.如权利要求5所述的图像任务处理方法,其特征在于,所述根据所述预测输出结果和预设挑选策略在所述目标测试集中确定更新训练集,包括:
根据所述预测输出结果进行梯度计算,得到挑选梯度;
根据目标测试集的梯度向量和预设聚类算法进行样本选择,确定多样性样本;
根据所述挑选梯度和所述多样性样本在所述目标测试集中确定更新训练集。
7.如权利要求5所述的图像任务处理方法,其特征在于,所述根据所述调整训练集对所述初始训练模型进行更新训练,得到目标训练模型,包括:
根据所述调整训练集对所述初始训练模型进行更新训练,得到待检测模型;
获取所述待检测模型的召回率和准确率;
在所述召回率和所述准确率达到预设指标标准时,根据所述待检测模型得到目标训练模型。
8.一种图像任务处理装置,其特征在于,所述图像任务处理装置包括:
确定模块,用于在接收到用户发送的图像处理任务时,确定所述图像处理任务的任务类型;
调整模块,用于对所述任务类型的初始神经网络进行参数调整,得到待训练网络;
训练模块,用于根据所述图像处理任务的图像训练集和预设挑选策略对所述待训练网络进行模型训练,得到目标训练模型;
完成模块,用于根据所述目标训练模型完成所述图像处理任务。
9.一种图像任务处理设备,其特征在于,所述图像任务处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像任务处理程序,所述图像任务处理程序配置为实现如权利要求1至7中任一项所述的图像任务处理方法。
10.一种存储介质,其特征在于,所述存储介质上存储有图像任务处理程序,所述图像任务处理程序被处理器执行时实现如权利要求1至7任一项所述的图像任务处理方法。
CN202310054901.8A 2023-02-03 2023-02-03 图像任务处理方法、装置、设备及存储介质 Pending CN116402665A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310054901.8A CN116402665A (zh) 2023-02-03 2023-02-03 图像任务处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310054901.8A CN116402665A (zh) 2023-02-03 2023-02-03 图像任务处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116402665A true CN116402665A (zh) 2023-07-07

Family

ID=87006377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310054901.8A Pending CN116402665A (zh) 2023-02-03 2023-02-03 图像任务处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116402665A (zh)

Similar Documents

Publication Publication Date Title
US20230267730A1 (en) Image abnormality detection model training
CN111127364B (zh) 图像数据增强策略选择方法及人脸识别图像数据增强方法
CN111027428A (zh) 一种多任务模型的训练方法、装置及电子设备
CN116596095B (zh) 基于机器学习的碳排放量预测模型的训练方法及装置
CN113065525A (zh) 年龄识别模型训练方法、人脸年龄识别方法及相关装置
CN112651490A (zh) 人脸关键点检测模型的训练方法及设备、可读存储介质
CN111241992A (zh) 人脸识别模型构建方法、识别方法、装置、设备及存储介质
CN115496144A (zh) 配电网运行场景确定方法、装置、计算机设备和存储介质
CN111161238A (zh) 图像质量评价方法及装置、电子设备、存储介质
CN111222026B (zh) 用户类别识别模型的训练方法和用户类别识别方法
CN116402665A (zh) 图像任务处理方法、装置、设备及存储介质
CN112905166B (zh) 人工智能编程系统、计算机设备、计算机可读存储介质
CN111914751A (zh) 一种图像人群密度识别检测方法及系统
CN117611580B (zh) 瑕疵检测方法、装置、计算机设备和存储介质
CN110728292A (zh) 一种多任务联合优化下的自适应特征选择算法
CN117058498B (zh) 分割图评估模型的训练方法、分割图的评估方法及装置
CN116610783B (zh) 基于人工智能决策的服务优化方法及数字化在线页面系统
CN112396648B (zh) 一种可定位目标物质心的目标识别方法和系统
CN116610806B (zh) 基于ai的rpa数字化业务处理方法及计算机设备
CN114928477B (zh) 一种网络入侵检测方法、装置、可读存储介质及终端设备
CN113706040B (zh) 风险识别方法、装置、设备及存储介质
CN111309875B (zh) 问题应答的方法、装置、设备和存储介质
CN118094280A (zh) 对象分类预测方法、装置、设备、介质及程序产品
CN116308750A (zh) 账户风险评估方法、装置、设备和存储介质
CN115310524A (zh) 基于风控模型的样本生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination