CN117036870B - 一种基于积分梯度多样性的模型训练和图像识别方法 - Google Patents
一种基于积分梯度多样性的模型训练和图像识别方法 Download PDFInfo
- Publication number
- CN117036870B CN117036870B CN202311298498.XA CN202311298498A CN117036870B CN 117036870 B CN117036870 B CN 117036870B CN 202311298498 A CN202311298498 A CN 202311298498A CN 117036870 B CN117036870 B CN 117036870B
- Authority
- CN
- China
- Prior art keywords
- model
- target
- determining
- base
- sample data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000012549 training Methods 0.000 title claims abstract description 70
- 238000003860 storage Methods 0.000 claims description 17
- 230000010354 integration Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 238000005457 optimization Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 230000006872 improvement Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000007123 defense Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本说明书公开了一种基于积分梯度多样性的模型训练和图像识别方法。所述方法包括:将样本数据分别输入各基模型,确定每个基模型对应的图像识别结果;针对每个基模型,根据该基模型对应的图像识别结果以及样本数据的实际标签,确定该基模型对应的分类损失,以及,确定该基模型相对于样本数据的积分梯度,作为该基模型对应的积分梯度;根据每个基模型对应的分类损失,确定目标集成模型对应的目标分类损失,以及,根据各基模型对应的积分梯度之间的偏差,确定目标集成模型对应的积分梯度正则项损失;根据目标分类损失以及积分梯度正则项损失,对目标集成模型进行训练。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种基于积分梯度多样性的模型训练和图像识别方法。
背景技术
深度学习作为一种重要的数据分析方法,在诸如生物特征识别、图像分类、汽车自动驾驶、语音识别、自然语言处理等应用领域表现出了优异的性能。尽管深度学习技术取得了巨大成功,但深度神经网络模型很容易遭受由恶意用户精心设计的对抗样本的攻击。这里对抗样本指的是对原始样本加入微小的、人类察觉不到的扰动,以改变模型对该样本的预测结果。
模型集成的方法可以通过集成在一起的多个模型来对输入的数据进行预测,以根据多个预测结果来确定最终的目标结果,从而在一定程度上克服上述情况。
然而,由于对抗攻击具有迁移性,现有模型集成方法中多个模型的图像识别结果都有可能受到同一种异常数据的干扰,其准确性和鲁棒性较低,难以对模型数据的安全进行有效保障,严重影响了后续图像识别业务的准确性以及安全性。
因此,如何有效的防止对抗攻击,保证集成模型的可靠性和鲁棒性,进而保证后续图像识别结果的准确性,是一个亟待解决的问题。
发明内容
本说明书提供一种基于积分梯度多样性的模型训练和图像识别方法,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种基于积分梯度多样性的模型训练方法,包括:
获取样本数据以及待训练的目标集成模型,其中,所述目标集成模型中包含至少两个基模型,所述目标集成模型为图像识别模型,所述样本数据为图像数据;
将所述样本数据分别输入各基模型,确定每个基模型对应的图像识别结果;
针对每个基模型,根据该基模型对应的图像识别结果以及所述样本数据的实际标签,确定该基模型对应的分类损失,以及,确定该基模型相对于所述样本数据的积分梯度,作为该基模型对应的积分梯度;
根据每个基模型对应的分类损失,确定所述目标集成模型对应的目标分类损失,以及,根据所述各基模型对应的积分梯度之间的偏差,确定所述目标集成模型对应的积分梯度正则项损失;
根据所述目标分类损失以及所述积分梯度正则项损失,对所述目标集成模型进行训练。
可选地,在获取样本数据之前,所述方法还包括:
获取初始样本数据;
对所述初始样本数据进行归一化、顺序打乱以及分配训练集、测试集中的至少一种预处理,得到所述样本数据。
可选地,确定该基模型相对于所述样本数据的积分梯度,作为该基模型对应的积分梯度,具体包括:
确定所述样本数据对应的输入值以及预设的基准值;
在所述基准值与所述输入值之间的路径上进行线性插值,并确定各插值对应的梯度;
根据至少部分插值对应的梯度,确定所述积分梯度。
可选地,根据所述目标分类损失以及所述积分梯度正则项损失,对所述目标集成模型进行训练,具体包括:
根据所述目标分类损失以及所述积分梯度正则项损失,确定综合损失;
以最小化所述综合损失为优化目标,对所述目标集成模型进行训练,并对所述目标集成模型中的每个基模型的参数进行调整。
可选地,所述各基模型对应的积分梯度之间的偏差越大,所述积分梯度正则项损失越小。
本说明书提供了一种图像识别方法,包括:
获取待识别图像;
将所述待识别图像输入预先训练的目标集成模型,通过所述目标集成模型,确定所述待识别图像对应的目标识别结果,所述目标集成模型是通过上述基于积分梯度多样性的模型训练方法训练得到的。
可选地,将所述待识别图像输入预先训练的目标集成模型,通过所述目标集成模型,确定所述待识别图像对应的目标识别结果,具体包括:将所述待识别图像输入所述目标集成模型中的各基模型,确定所述各基模型对应的识别结果;
根据每个基模型对应的识别结果,确定所述待识别图像的目标识别结果。
本说明书提供了一种基于积分梯度多样性的模型训练装置,包括:
获取模块,获取样本数据以及待训练的目标集成模型,其中,所述目标集成模型中包含至少两个基模型,所述目标集成模型为图像识别模型,所述样本数据为图像数据;
输入模块,将所述样本数据分别输入各基模型,确定每个基模型对应的图像识别结果;
第一确定模块,针对每个基模型,根据该基模型对应的图像识别结果以及所述样本数据的实际标签,确定该基模型对应的分类损失,以及,确定该基模型相对于所述样本数据的积分梯度,作为该基模型对应的积分梯度;
第二确定模块,根据每个基模型对应的分类损失,确定所述目标集成模型对应的目标分类损失,以及,根据所述各基模型对应的积分梯度之间的偏差,确定所述目标集成模型对应的积分梯度正则项损失;
训练模块,根据所述目标分类损失以及所述积分梯度正则项损失,对所述目标集成模型进行训练。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于积分梯度多样性的模型训练和图像识别方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于积分梯度多样性的模型训练和图像识别方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的基于积分梯度多样性的模型训练方法中,将样本数据分别输入各基模型,确定每个基模型对应的图像识别结果;针对每个基模型,根据该基模型对应的图像识别结果以及样本数据的实际标签,确定该基模型对应的分类损失,以及,确定该基模型相对于样本数据的积分梯度,作为该基模型对应的积分梯度;根据每个基模型对应的分类损失,确定目标集成模型对应的目标分类损失,以及,根据各基模型对应的积分梯度之间的偏差,确定目标集成模型对应的积分梯度正则项损失;根据目标分类损失以及积分梯度正则项损失,对目标集成模型进行训练。
从上述方法可以看出,本方案对集成模型训练的过程中,可以基于图像识别结果与实际标签之间的偏差确定分类损失,以及根据各基模型积分梯度之间的偏差确定第二损失,从而在保证各基模型准确性的同时,使各基模型按照不同积分梯度进行更新,提高各基模型之间的差异性,避免出现梯度饱和的情况。这样一来,当遭受到对抗攻击时,由于不同的基模型之间具体一定的差异性,并不会全部被异常数据所干扰,从而保证图像识别结果的准确性以及模型数据的安全。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中提供的一种基于积分梯度多样性的模型训练方法的流程示意图;
图2为本说明书中提供的一种目标集成模型损失函数的确定过程示意图;
图3为本说明书中提供的一种图像识别方法的流程示意图;
图4为本说明书提供的一种基于积分梯度多样性的模型训练装置示意图;
图5为本说明书提供的一种图像识别装置示意图;
图6为本说明书提供的一种对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
传统的对抗训练、输入转换、梯度掩码和对抗样本检测等防御方法存在各自的缺点。输入转换是在样本输入到模型进行判定之前,先对样本进行去噪,剔除其中扰动的信息。但输入转换同时也会影响对真实样本的图像识别结果,降低真实样本的预测准确率。梯度掩码通过隐藏模型的原始梯度,能够防御基于梯度方法产生的对抗样本,但对其他方法的对抗样本几乎没有抵御效果。对抗样本检测只是能够发现输入样本中的对抗样本,但无法进行防御。对抗训练即在模型每一轮训练过程中,生成特定的对抗样本,将这些对抗样本加入到原始样本中共同训练,从而提高模型鲁棒性。这种方法虽然能够提升深度模型的鲁棒性,但也会在一定程度上降低模型对于正常样本的泛化能力;并且该方法十分耗费计算机系统资源,在复杂数据集上难以应用。此外以上方法主要针对于提高单个深度分类模型的鲁棒性。
多样化集成方法试图通过提高集成模型成员之间的多样性来改善集成的对抗鲁棒性。包括有的使用单个成员的非最大预测定义了多样性度量,提出一种自适应多样性促进正则化器,对神经网络进行多样化的训练,以鼓励非最大预测之间的多样性,这种可能无法捕获与正确预测相关的图像内容的共享梯度信息。而基于对抗训练的集成防御方法,每个样本数据上提取所有子模型的非鲁棒特征样本(对抗样本),然后在子模型间通过相互训练彼此生成的非鲁棒特征样本以学习彼此的“脆弱性”来提升集成模型的鲁棒性。这些方法需要生成对抗样本参与训练过程,训练效率非常低。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种基于积分梯度多样性的模型训练方法的流程示意图,包括以下步骤:
S101:获取样本数据以及待训练的目标集成模型,其中,所述目标集成模型中包含至少两个基模型,所述目标集成模型为图像识别模型,所述样本数据为图像数据。
为了克服深度神经网络模型易受对抗样本的影响,解决当前提高模型鲁棒性的方法性能不足、无法对所有方法产生的对抗样本都能有效防御的技术问题,本说明书提供了一种基于积分梯度多样性的模型训练方法,通过在学习目标中引入一种额外的积分梯度多样性(Inverted Generational Distance,IGD)正则化来促进集成模型成员的多样性,以防止攻击者可一次性针对所有集成的模型成员,增加集成模型对基于迁移攻击的对抗鲁棒性。
在本说明书中,用于实现一种基于积分梯度多样性的模型训练方法的执行主体可以是服务器等指定设备,为了便于描述,本说明书仅以服务器作为执行主体为例,对本说明书提供的一种基于积分梯度多样性的模型训练方法进行说明。
其中,服务器需要获取样本数据以及待训练的目标集成模型。
在本说明书中,上述目标集成模型可以为图像识别模型,并且目标集成模型中集成有多个(两个或两个以上)基模型,每个基模型均为一个独立的用于图像识别的神经网络模型(包括但不局限于ResNet20),并且能够单独执行图像识别任务。
相应的,上述样本数据可以为图像数据,服务器可以先获取初始样本数据,而后对各初始样本数据的像素进行归一化,以及顺序打乱、分配训练集和数据集等预处理,从而得到最终的样本数据。
S102:将所述样本数据分别输入各基模型,确定每个基模型对应的图像识别结果。
S103:针对每个基模型,根据该基模型对应的图像识别结果以及所述样本数据的实际标签,确定该基模型对应的分类损失,以及,确定该基模型相对于所述样本数据的积分梯度,作为该基模型对应的积分梯度。
服务器可以将样本数据输入目标集成模型的每个基模型中,确定每个基模型对应的图像识别结果。当样本数据为图像数据时,该识别结果可以为图像被识别为目标类别的概率。
服务器可以根据上述图像识别结果与样本数据的实际标签(实际类别)之间的偏差,通过交叉熵损失函数确定各基模型对应的分类损失,该分类损失可以表示为:
其中,为基模型/>针对样本数据/>的图像识别结果,/>为样本数据/>的实际标签。
与此同时,服务器可以确定各基模型相对于样本数据的积分梯度,作为各基模型对应的积分梯度。
具体的,服务器可以将样本数据对应的像素值作为输入值,并确定预设的基准值,在本说明书中,可以将全黑图(像素值为0)作为基准值,输入值的范围可以为0~255。
而后服务器可以在基准值与输入值之间的路径上按照预设步长进行线性插值,根据每个插值确定上述图像识别结果对应的梯度,作为各插值对应的梯度。之后服务器可以对至少部分插值(如第20步到第300步的值)对应的梯度进行积分运算,得到每个基模型对应的积分梯度。该积分梯度可以表示为:
其中,为基模型/>对应的积分梯度,/>为输入基模型/>的样本数据对应的输入值,/>为基准值,/>表示插值总步数。
S104:根据每个基模型对应的分类损失,确定所述目标集成模型对应的目标分类损失,以及,根据所述各基模型对应的积分梯度之间的偏差,确定所述目标集成模型对应的积分梯度正则项损失。
S105:根据所述目标分类损失以及所述积分梯度正则项损失,对所述目标集成模型进行训练。
服务器可以根据每个基模型对应分类损失的平均值,确定目标集成模型对应的目标分类损失,另外,根据各基模型对应的积分梯度之间的偏差,确定目标集成模型对应的积分梯度正则项损失,该积分梯度正则项损失可以表示为:
其中,为目标集成模型针对样本数据/>的积分梯度正则项损失,/>为基模型总数量,从该公式可以看出,不同模型的积分梯度之间的差异越大,则积分梯度正则项损失越小。为了便于理解,本说明书提供了一种目标集成模型损失函数的确定过程示意图,如图2所示。
图2为本说明书中提供的一种目标集成模型损失函数的确定过程示意图。
其中,服务器可以根据每个基模型对应分类损失的平均值,确定目标分类损失,根据每个基模型的积分梯度,确定积分梯度正则项损失。
进一步的,服务器可以根据目标集成模型的目标分类损失以及积分梯度正则项损失,确定目标集成模型针对样本数据的综合损失,该综合损失可以表示为:
其中,表示目标集成模型的综合损失,/>为预设惩罚项,服务器可以最小化该综合损失为优化目标,对目标集成模型进行训练,随着训练轮次的增加,各基模型的图像识别结果和实际标签之间的偏差逐渐减小,保证各基模型的准确性,各基模型的积分梯度之间的差异逐渐增大,使每个基模型都朝着不同的方向进行更新,在保证各基模型之间的差异性防止模型出现梯度饱和。
具体的,服务器可以利用自适应矩估计(Adam)优化器对目标集成模型参数进行迭代优化。依据经验设定训练最大次数为200;设置初始学习率为0 .001,训练到第100次及第150次时,将当前学习率乘以0 .1,超参数惩罚项设置为1。
基于各基模型的分类损失结合积分梯度多样性正则项损失的综合损失可以在训练过程中对目标集成模型中所有基模型的参数值进行调整,将样本数据输入调整后的当前集成模型继续训练,直至综合损失收敛至预设范围或所有基模型达到最大训练轮数,则得到最终的目标集成模型,上述预设范围和最大训练轮数可以根据实际情况进行设定,本说明书对此不做具体限定。
对目标集成模型训练完成后,服务器可以将该目标集成模型进行部署,以通过该目标集成模型执行后续的图像识别任务。
以下将从实际应用的角度出发,对本说明书中提供的一种基于上述目标集成模型的图像识别方法进行说明,如图3所示。
图3为本说明书中提供的一种图像识别方法的流程示意图,包括以下步骤:
S301:获取待识别图像。
S302:将所述待识别图像输入预先训练的目标集成模型,通过所述目标集成模型,确定所述待识别图像对应的目标识别结果,所述目标集成模型是通过上述一种基于积分梯度多样性的模型训练方法训练得到的。
具体的,服务器可以将获取到的待识别图像输入上述目标集成模型中的每个基模型,确定各基模型对应的识别结果,而后根据每个基模型对应的识别结果,确定待识别图像的目标识别结果。
具体的,服务器可以计算各基模型识别结果的均值,并将该均值作为最终的目标识别结果,该目标识别结果可以表示为:
其中,为基模型对应的识别结果(概率),/>则是结合了所有基模型的识别结果得到的当前目标集成模型的目标识别结果。
当然,在实际应用中,上述目标集成模型也可以为诸如自然语言处理、文本识别、语音识别等其它基模型的集成模型,其对应的样本数据可以为文本数据、音频数据等,从而通过训练完成的集成模型执行相应的后续任务。
从上述方法可以看出,本方案在对集成模型的训练过程中,通过在目标损失函数中结合各个基模型的分类损失及积分梯度正则项损失,从而使得能够在保证对正常样本的泛化能力的同时,通过对各个基模型积分梯度的差异化多样化处理,显著提高集成模型的鲁棒性。
另外,相比于梯度,积分梯度(Integrated Gradients)使用沿整条梯度线的积分值,作为特征重要性指标,不再受某一点梯度为0的限制,解决了传统基于梯度的梯度饱和缺陷,比单点处的梯度效果更好,能更精细地突出重点特征。本方法显著提高了集成的对抗鲁棒性,也可以与现有的方法相结合,以创建更强的防御。
以上为本说明书的一个或多个实施基于积分梯度多样性的模型训练方法,基于同样的思路,本说明书还提供了相应的基于积分梯度多样性的模型训练装置和图像识别装置,如图4和图5所示。
图4为本说明书提供的一种基于积分梯度多样性的模型训练装置示意图,包括:
获取模块401,获取样本数据以及待训练的目标集成模型,其中,所述目标集成模型中包含至少两个基模型,所述目标集成模型为图像识别模型,所述样本数据为图像数据;
输入模块402,用于将所述样本数据分别输入各基模型,确定每个基模型对应的图像识别结果;
第一确定模块403,用于针对每个基模型,根据该基模型对应的图像识别结果以及所述样本数据的实际标签,确定该基模型对应的分类损失,以及,确定该基模型相对于所述样本数据的积分梯度,作为该基模型对应的积分梯度;
第二确定模块404,用于根据每个基模型对应的分类损失,确定所述目标集成模型对应的目标分类损失,以及,根据所述各基模型对应的积分梯度之间的偏差,确定所述目标集成模型对应的积分梯度正则项损失;
训练模块405,用于根据所述目标分类损失以及所述积分梯度正则项损失,对所述目标集成模型进行训练。
可选地,在获取样本数据以及待训练的目标集成模型之前,所述获取模块401还用于,获取初始样本数据;对所述初始样本数据进行归一化、顺序打乱以及分配训练集、测试集中的至少一种预处理,得到所述样本数据。
可选地,所述第一确定模块403具体用于,确定所述样本数据对应的输入值以及预设的基准值;在所述基准值与所述输入值之间的路径上进行线性插值,并确定各插值对应的梯度;根据至少部分插值对应的梯度,确定所述积分梯度。
可选地,所述训练模块405具体用于,根据所述目标分类损失以及所述积分梯度正则项损失,确定综合损失;以最小化所述综合损失为优化目标,对所述目标集成模型进行训练,并对所述目标集成模型中的每个基模型的参数进行调整。
可选地,所述各基模型对应的积分梯度之间的偏差越大,所述积分梯度正则项损失越小。
图5为本说明书提供的一种图像识别装置示意图,包括:
获取模块501,用于获取待识别图像;
识别模块502,用于将所述待识别图像输入预先训练的目标集成模型,通过所述目标集成模型,确定所述待识别图像对应的目标识别结果,所述目标集成模型是通过上述基于积分梯度多样性的模型训练方法训练得到的。
可选地,所述识别模块502具体用于,将所述待识别图像输入所述目标集成模型中的各基模型,确定所述各基模型对应的识别结果;根据每个基模型对应的识别结果,确定所述待识别图像的目标识别结果。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种基于积分梯度多样性的模型训练方法。
本说明书还提供了图6所示的一种对应于图1的电子设备的示意结构图。如图6所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的基于积分梯度多样性的模型训练方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(ProgrammableLogic Device, PLD)(例如现场可编程门阵列(Field Programmable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(HardwareDescription Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(AdvancedBoolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(JavaHardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby HardwareDescription Language)等,目前最普遍使用的是VHDL(Very-High-Speed IntegratedCircuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (9)
1.一种基于积分梯度多样性的模型训练方法,其特征在于,包括:
获取样本数据以及待训练的目标集成模型,其中,所述目标集成模型中包含至少两个基模型,所述目标集成模型为图像识别模型,所述样本数据为图像数据;
将所述样本数据分别输入各基模型,确定每个基模型对应的图像识别结果;
针对每个基模型,根据该基模型对应的图像识别结果以及所述样本数据的实际标签,确定该基模型对应的分类损失,以及,确定所述样本数据对应的输入值以及预设的基准值,在所述基准值与所述输入值之间的路径上进行线性插值,并确定各插值对应的梯度,根据至少部分插值对应的梯度,确定该基模型相对于所述样本数据的积分梯度,作为该基模型对应的积分梯度;
根据每个基模型对应的分类损失,确定所述目标集成模型对应的目标分类损失,以及,根据所述各基模型对应的积分梯度之间的偏差,确定所述目标集成模型对应的积分梯度正则项损失;
根据所述目标分类损失以及所述积分梯度正则项损失,对所述目标集成模型进行训练。
2.如权利要求1所述的方法,其特征在于,在获取样本数据之前,所述方法还包括:
获取初始样本数据;
对所述初始样本数据进行归一化、顺序打乱以及分配训练集、测试集中的至少一种预处理,得到所述样本数据。
3.如权利要求1所述的方法,其特征在于,根据所述目标分类损失以及所述积分梯度正则项损失,对所述目标集成模型进行训练,具体包括:
根据所述目标分类损失以及所述积分梯度正则项损失,确定综合损失;
以最小化所述综合损失为优化目标,对所述目标集成模型进行训练,并对所述目标集成模型中的每个基模型的参数进行调整。
4.如权利要求3所述的方法,其特征在于,所述各基模型对应的积分梯度之间的偏差越大,所述积分梯度正则项损失越小。
5.一种图像识别方法,其特征在于,包括:
获取待识别图像;
将所述待识别图像输入预先训练的目标集成模型,通过所述目标集成模型,确定所述待识别图像对应的目标识别结果,所述目标集成模型是通过上述权利要求1~4任一项所述的方法训练得到的。
6.如权利要求5所述的方法,其特征在于,将所述待识别图像输入预先训练的目标集成模型,通过所述目标集成模型,确定所述待识别图像对应的目标识别结果,具体包括:
将所述待识别图像输入所述目标集成模型中的各基模型,确定所述各基模型对应的识别结果;
根据每个基模型对应的识别结果,确定所述待识别图像的目标识别结果。
7.一种基于积分梯度多样性的模型训练装置,其特征在于,包括:
获取模块,获取样本数据以及待训练的目标集成模型,其中,所述目标集成模型中包含至少两个基模型,所述目标集成模型为图像识别模型,所述样本数据为图像数据;
输入模块,将所述样本数据分别输入各基模型,确定每个基模型对应的图像识别结果;
第一确定模块,针对每个基模型,根据该基模型对应的图像识别结果以及所述样本数据的实际标签,确定该基模型对应的分类损失,以及,确定所述样本数据对应的输入值以及预设的基准值,在所述基准值与所述输入值之间的路径上进行线性插值,并确定各插值对应的梯度,根据至少部分插值对应的梯度,确定该基模型相对于所述样本数据的积分梯度,作为该基模型对应的积分梯度;
第二确定模块,根据每个基模型对应的分类损失,确定所述目标集成模型对应的目标分类损失,以及,根据所述各基模型对应的积分梯度之间的偏差,确定所述目标集成模型对应的积分梯度正则项损失;
训练模块,根据所述目标分类损失以及所述积分梯度正则项损失,对所述目标集成模型进行训练。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~6任一项所述的方法。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311298498.XA CN117036870B (zh) | 2023-10-09 | 2023-10-09 | 一种基于积分梯度多样性的模型训练和图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311298498.XA CN117036870B (zh) | 2023-10-09 | 2023-10-09 | 一种基于积分梯度多样性的模型训练和图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117036870A CN117036870A (zh) | 2023-11-10 |
CN117036870B true CN117036870B (zh) | 2024-01-09 |
Family
ID=88641649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311298498.XA Active CN117036870B (zh) | 2023-10-09 | 2023-10-09 | 一种基于积分梯度多样性的模型训练和图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117036870B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113228062A (zh) * | 2021-02-25 | 2021-08-06 | 东莞理工学院 | 基于特征多样性学习的深度集成模型训练方法 |
WO2022116440A1 (zh) * | 2020-12-02 | 2022-06-09 | 平安科技(深圳)有限公司 | 模型训练方法、装置和设备 |
WO2022213846A1 (zh) * | 2021-04-07 | 2022-10-13 | 北京三快在线科技有限公司 | 识别模型的训练 |
CN115481716A (zh) * | 2022-08-29 | 2022-12-16 | 南京航空航天大学 | 一种基于深度网络前景激活特征转移的物理世界对抗攻击方法 |
CN115861799A (zh) * | 2022-11-21 | 2023-03-28 | 北京理工大学 | 基于注意力梯度的轻量化空对地目标检测方法 |
CA3137612A1 (en) * | 2021-11-05 | 2023-05-05 | Pulsemedica Corp. | Hybrid classifier training for feature extraction |
CN116310585A (zh) * | 2023-04-03 | 2023-06-23 | 安徽工业大学 | 一种多标记分类模型构建方法、分类方法、分类装置、电子设备及存储介质 |
CN116824331A (zh) * | 2023-06-02 | 2023-09-29 | 支付宝(杭州)信息技术有限公司 | 一种模型训练、图像识别方法、装置、设备及存储介质 |
-
2023
- 2023-10-09 CN CN202311298498.XA patent/CN117036870B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022116440A1 (zh) * | 2020-12-02 | 2022-06-09 | 平安科技(深圳)有限公司 | 模型训练方法、装置和设备 |
CN113228062A (zh) * | 2021-02-25 | 2021-08-06 | 东莞理工学院 | 基于特征多样性学习的深度集成模型训练方法 |
WO2022213846A1 (zh) * | 2021-04-07 | 2022-10-13 | 北京三快在线科技有限公司 | 识别模型的训练 |
CA3137612A1 (en) * | 2021-11-05 | 2023-05-05 | Pulsemedica Corp. | Hybrid classifier training for feature extraction |
CN115481716A (zh) * | 2022-08-29 | 2022-12-16 | 南京航空航天大学 | 一种基于深度网络前景激活特征转移的物理世界对抗攻击方法 |
CN115861799A (zh) * | 2022-11-21 | 2023-03-28 | 北京理工大学 | 基于注意力梯度的轻量化空对地目标检测方法 |
CN116310585A (zh) * | 2023-04-03 | 2023-06-23 | 安徽工业大学 | 一种多标记分类模型构建方法、分类方法、分类装置、电子设备及存储介质 |
CN116824331A (zh) * | 2023-06-02 | 2023-09-29 | 支付宝(杭州)信息技术有限公司 | 一种模型训练、图像识别方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
基于组合模型的软件可靠性预计方法;张红祥;朱浩悦;;黑龙江科技信息(第03期);全文 * |
导引概率图与显著特征相结合的行人目标检测;刘琼;;高技术通讯(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117036870A (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107358157B (zh) | 一种人脸活体检测方法、装置以及电子设备 | |
CN116343314B (zh) | 一种表情识别方法、装置、存储介质及电子设备 | |
CN116304720B (zh) | 一种代价模型训练的方法、装置、存储介质及电子设备 | |
CN111160251B (zh) | 一种活体识别方法及装置 | |
CN116049761A (zh) | 数据处理方法、装置及设备 | |
CN110532755B (zh) | 一种计算机实现的风险识别的方法及装置 | |
CN116167461A (zh) | 一种模型训练的方法、装置、存储介质及电子设备 | |
CN116152933A (zh) | 一种异常检测模型的训练方法、装置、设备及存储介质 | |
CN117392694B (zh) | 数据处理方法、装置及设备 | |
CN117036829A (zh) | 一种基于原型学习实现标签增强的叶片细粒度识别方法和系统 | |
CN117036870B (zh) | 一种基于积分梯度多样性的模型训练和图像识别方法 | |
CN117113174A (zh) | 一种模型训练的方法、装置、存储介质及电子设备 | |
CN115545572B (zh) | 一种业务风控的方法、装置、设备及存储介质 | |
CN116402108A (zh) | 一种模型训练及图数据的处理方法、装置、介质及设备 | |
CN114710318B (zh) | 一种限制爬虫高频访问的方法、装置、设备及介质 | |
CN115545720A (zh) | 一种模型训练的方法、业务风控的方法及装置 | |
CN115578796A (zh) | 一种活体检测模型的训练方法、装置、设备及介质 | |
CN115204395A (zh) | 数据的处理方法、装置及设备 | |
CN115171735A (zh) | 一种语音活动检测方法、存储介质及电子设备 | |
CN111242195B (zh) | 模型、保险风控模型训练方法、装置及电子设备 | |
CN117036869B (zh) | 一种基于多样性和随机策略的模型训练方法及装置 | |
CN111539520A (zh) | 增强深度学习模型鲁棒性的方法及装置 | |
CN115423485B (zh) | 数据处理方法、装置及设备 | |
CN115840932B (zh) | 一种漏洞修复方法、装置、存储介质及电子设备 | |
CN116991388B (zh) | 一种深度学习编译器的图优化序列生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |