CN115909007A - 一种图像扩充方法、装置、设备及存储介质 - Google Patents
一种图像扩充方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115909007A CN115909007A CN202211339044.8A CN202211339044A CN115909007A CN 115909007 A CN115909007 A CN 115909007A CN 202211339044 A CN202211339044 A CN 202211339044A CN 115909007 A CN115909007 A CN 115909007A
- Authority
- CN
- China
- Prior art keywords
- image
- pixel matrix
- type
- model
- extended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000011159 matrix material Substances 0.000 claims abstract description 133
- 238000012549 training Methods 0.000 claims abstract description 20
- 230000003190 augmentative effect Effects 0.000 claims abstract description 13
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000003416 augmentation Effects 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 6
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种图像扩充方法、装置、设备及存储介质。包括:获取对抗攻击模型和类型识别模型;通过类型识别模型对获取的原始图像进行识别,获取原始图像的图像类型;通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵;根据原始图像和最终扩充像素矩阵生成扩充图像。通过建立对抗攻击模型,将对抗噪声加入到模型训练中,可以使模型也能辨别出有对抗噪声的图像,并且能够有效应对对抗攻击,提升了识别效果,通过类型识别模型识别出原始图像的图像类型,再通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵,最后根据原始图像和最终扩充像素矩阵生成扩充图像,保证了图像扩充的准确率。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像扩充方法、装置、设备及存储介质。
背景技术
随着深度学习的发展,大量的人工智能技术被应用到了日常生活中,如人脸识别、自动驾驶等,其中,深度神经网络功不可没,但通过深度神经网络训练一个效果较好的模型需要大量的数据做支撑,获取大量数据并不容易,因此需要进行数据扩充,如使用镜像、旋转、尺度变换、仿射变换等。
现有技术通过空间变换网络,可实现对卷积神经网络的特征图进行仿射变换,能够对输入图像进行动态地空间变换,输出一张新的矫正图像。
但现有技术通过空间变换网络的方式,生成的扩充数据是以仿射变换为主,生成人眼和模型都能识别的数据,但面对含有对抗噪声的样本时,模型无法准确识别,可能会做出错误的判断。
发明内容
本发明提供了一种图像扩充方法、装置、设备及存储介质,以实现对图像的识别和扩充。
根据本发明的一方面,提供了一种图像扩充方法,该方法包括:
获取对抗攻击模型和类型识别模型;
通过类型识别模型对获取的原始图像进行识别,获取原始图像的图像类型;
通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵;
根据原始图像和最终扩充像素矩阵生成扩充图像。
可选的,获取对抗攻击模型和类型识别模型,包括:获取图像样本集,其中,图像样本集中包含各图像样本,以及图像样本的图像类型;获取各图像样本的初始扩充像素矩阵,确定初始扩充像素矩阵和图像类型的第一对应关系,根据第一对应关系建立对抗攻击模型;获取各图像样本的图像特征,确定图像特征和图像类型的第二对应关系,根据第二对应关系建立类型识别模型。
可选的,获取各图像样本的初始扩充像素矩阵,包括:提取各图像样本的像素点,对各像素点进行对抗计算以生成扩充像素;将扩充像素组成的矩阵作为初始扩充像素矩阵。
可选的,对各像素点进行对抗计算以生成扩充像素,包括:根据像素点生成初始值和对抗值;计算初始值和对抗值在神经网络中间层的差值,将差值的优化结果作为扩充像素。
可选的,在确定初始扩充像素矩阵和图像类型的第一对应关系之后,还包括:将图像样本集按照指定范围划分成测试集和训练集;基于测试集,确定训练集中各初始扩充像素矩阵的准确率;将各图像类型中准确率最高的初始扩充像素矩阵作为最终扩充像素矩阵;根据第一对应关系建立对抗攻击模型,包括:根据图像类型和最终扩充像素矩阵的第一对应关系建立对抗攻击模型。
可选的,通过类型识别模型对获取的原始图像进行识别,获取原始图像的图像类型,包括:获取原始图像的待测特征;确定待测特征和图像特征的相似度,将相似度最高的图像特征对应的图像类型作为原始图像的图像类型。
可选的,根据原始图像和最终扩充像素矩阵生成扩充图像,包括:获取原始图像对应的原始像素矩阵;将原始像素矩阵和最终扩充像素矩阵叠加生成最终图像矩阵;根据最终图像矩阵生成扩充图像。
根据本发明的另一方面,提供了一种图像扩充装置,该装置包括:
模型获取模块,用于获取对抗攻击模型和类型识别模型;
图像类型获取模块,用于通过类型识别模型对获取的原始图像进行识别,获取原始图像的图像类型;
最终扩充像素矩阵获取模块,用于通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵;
扩充图像生成模块,用于根据原始图像和最终扩充像素矩阵生成扩充图像。
根据本发明的另一方面,提供了一种电子设备,电子设备包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的一种图像扩充方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的一种图像扩充方法。
本发明实施例的技术方案,通过建立对抗攻击模型,将对抗噪声加入到模型训练中,可以使模型也能辨别出有对抗噪声的图像,并且能够有效应对对抗攻击,提升了识别效果,通过类型识别模型识别出原始图像的图像类型,再通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵,最后根据原始图像和最终扩充像素矩阵生成扩充图像,保证了图像扩充的准确率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种图像扩充方法的流程图;
图2是根据本发明实施例一提供的另一种图像扩充方法的流程图;
图3是根据本发明实施例二提供的另一种图像扩充方法的流程图;
图4是根据本发明实施例三提供的一种图像扩充装置的结构示意图;
图5是实现本发明实施例的一种图像扩充方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种图像扩充方法的流程图,本实施例可适用于对图像进行扩充的情况,该方法可以由图像扩充装置来执行,该图像扩充装置可以采用硬件和/或软件的形式实现,该图像扩充装置可配置于计算机中。如图1所示,该方法包括:
S110、获取对抗攻击模型和类型识别模型。
其中,对抗攻击模型是指对原始图像的像素点进行扩充的模型,类型识别模型是指确定原始图像对应的图像类型的模型,原始图像是指用户输入的图像,用户是指进行图像扩充的人员,对抗攻击模型和类型识别模型都是基于大量图像样本进行训练得到的。类型识别模型中包含图像特征和图像类型的对应关系,通过类型识别模型,可以提取原始图像的图像特征来确定图像类型,然后再通过对抗攻击模型确定该图像类型对应的扩充像素矩阵,以实现对原始图像的扩充。
图2为本发明实施例一提供了一种图像扩充方法的流程图,步骤S110主要包括如下的步骤S111至步骤S113:
S111、获取图像样本集,其中,图像样本集中包含各图像样本,以及图像样本的图像类型。
具体的,图像样本集是指包含图像样本的集合,图像样本具有图像类型的标签,图像类型是用户对各图像样本进行标注后和图像样本一起输入至控制器的,图像样本和图片类型具有对应关系,控制器会将图像样本和图像类型一起构成图像样本集。
S112、获取各图像样本的初始扩充像素矩阵,确定初始扩充像素矩阵和图像类型的第一对应关系,根据第一对应关系建立对抗攻击模型。
其中,初始扩充像素矩阵是指根据各图像样本的像素点进行像素扩充后组成的矩阵,第一对应关系是指初始扩充像素矩阵和图像类型的对应关系,控制器可以根据第一对应关系建立对抗攻击模型。
可选的,获取各图像样本的初始扩充像素矩阵,包括:提取各图像样本的像素点,对各像素点进行对抗计算以生成扩充像素;将扩充像素组成的矩阵作为初始扩充像素矩阵。
其中,像素点是指把图像分割成若干个小方格,每个小方格称为一个像素点,这些小方格都有一个明确的位置和被分配的色彩数值,而这些一小方格的颜色和位置就决定该图像所呈现出来的样子,可以将像素视为整个图像中不可分割的单位或者是元素。扩充像素是指对像素点进行对抗计算生成的像素。控制器在获取各图像样本的初始扩充像素矩阵时,是对各图像样本中的像素点进行对抗计算来生成扩充像素的。对抗是指对像素点添加特定的扰动得到对抗样本的过程。
可选的,对各像素点进行对抗计算以生成扩充像素,包括:根据像素点生成初始值和对抗值;计算初始值和对抗值在神经网络中间层的差值,将差值的优化结果作为扩充像素。
具体的,控制器会根据像素点生成初始值和对抗值,初始值是指根据像素点生成的干净样本,干净样本中包含像素点和图像类型,干净样本通常用(x,y)表示,其中x表示图像像素点,y表示预先对图像x标注的分类标签,一般为数字,代表图像类型,如1代表猫,2代表狗等。然后将干净样本通过反复快速梯度标志攻击(Iterative-FastGradientSignMethod,I-FGSM)算法生成对抗样本,对抗样本是一类能够攻击机器学习模型的样本,它们与真实样本的区别几乎无法用肉眼分辨,但是却会导致模型做出错误的判断,可以将生成的对抗样本作为深度学习模型的训练样本,以提高深度学习模型的鲁棒性。控制器会计算初始值和对抗值在神经网络中间层的差值,即计算对抗样本在神经网络中间层l的输出与干净样本在l层输出的差值,即采用如下公式(1)计算差值:
其中,gl(·)表示l层的输出,T表示迭代次数,h0表示干净样本在隐层的输出。表示初次攻击得到的指导方向,优化就是指最大化对抗样本相对干净样本的隐层输出差在指导方向上的投影。本实施方式通过最大化对抗样本与干净样本在初次攻击的整个优化过程的所有历史隐层上的差在某一指导方向的投影,增强对抗样本的迁移性,即使用初次攻击过程中所有的历史样本能提供更多的信息和更具迁移性的指导方向。基于迁移的攻击的优化目标一般是最大化一些损失函数的输出来进行对抗攻击,例如交叉熵损失,这些预测损失(即对抗损失)描述了源模型对输入进行错误分类的可能性,即损失值越大,源模型越可能对输入误分类。需要说明的是,在实际应用中可以进行多次迭代,选择多种不同的对抗样本生成算法来生成扩充像素。
具体的,控制器会获取各像素点生成的扩充像素,并将扩充像素组成的矩阵作为初始扩充像素矩阵,例如,扩充像素矩阵可以是控制器会对各图像样本都分别生成初始扩充像素矩阵,由于各图像样本都有对应的图像类型,所以初始扩充像素矩阵和图像类型具有对应关系。
具体的,由于控制器是对各图像样本都分别生成初始扩充像素矩阵,各图像样本都有对应的图像类型,所以初始扩充像素矩阵和图像类型具有对应关系,控制器会将初始扩充像素矩阵和图像类型的对应关系作为第一对应关系,例如,初始扩充像素矩阵A对应的图像类型为1,初始扩充像素矩阵B对应的图像类型为2,其中,1代表猫,2代表狗。
可选的,在确定初始扩充像素矩阵和图像类型的第一对应关系之后,还包括:将图像样本集按照指定范围划分成测试集和训练集;基于测试集,确定训练集中各初始扩充像素矩阵的准确率;将各图像类型中准确率最高的初始扩充像素矩阵作为最终扩充像素矩阵;根据第一对应关系建立对抗攻击模型,包括:根据图像类型和最终扩充像素矩阵的第一对应关系建立对抗攻击模型。
具体的,控制器在确定初始扩充像素矩阵和图像类型的第一对应关系之后,会根据第一对应关系建立对抗攻击模型,控制器会将图像样本集按照指定范围划分成测试集和训练集,然后用测试集对训练集中各初始扩充像素矩阵进行测试,以确定训练集中各初始扩充像素矩阵的准确率,并将各图像类型中准确率最高的初始扩充像素矩阵作为最终扩充像素矩阵,然后根据图像类型和最终扩充像素矩阵的第一对应关系建立对抗攻击模型。
S113、获取各图像样本的图像特征,确定图像特征和图像类型的第二对应关系,根据第二对应关系建立类型识别模型。
具体的,控制器也会用测试集对训练集进行测试来建立类型识别模型,在测试过程中,会确定各图像特征对图像类型贡献度,控制器会保留贡献度高的图像特征建立类型识别模型,通过贡献度对图像特征筛选的目的是为了使类型识别模型可以更快速更准确的进行图像类型的判断。
S120、通过类型识别模型对获取的原始图像进行识别,获取原始图像的图像类型。
具体的,由于类型识别模型可以对原始图像进行识别,故将原始图像输入类型识别模型后,即可输出原始图像的图像类型。
S130、通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵。
具体的,由于对抗攻击模型中包含图像类型和最终扩充像素矩阵的对应关系,由类型识别模型对原始图像进行识别后,控制器会将类型识别模型输出的原始图像的图像类型输入对抗攻击模型,通过对抗攻击模型可以获取到与图像类型对应的最终扩充像素矩阵。
S140、根据原始图像和最终扩充像素矩阵生成扩充图像。
可选的,根据原始图像和最终扩充像素矩阵生成扩充图像,包括:获取原始图像对应的原始像素矩阵;将原始像素矩阵和最终扩充像素矩阵叠加生成最终图像矩阵;根据最终图像矩阵生成扩充图像。
具体的,控制器可以根据原始图像和最终扩充像素矩阵生成扩充图像,即获取原始图像对应的原始像素矩阵,并将原始像素矩阵与对抗攻击模型输出的最终扩充像素矩阵相叠加,即可生成最终图像矩阵,例如,表示原始图像,表示模型输出的最终扩充像素矩阵,即有由于最终图像矩阵每个矩阵元素都是一个像素点,且数值在0-255之间,0表示最黑,255表示最白,根据最终图像矩阵即生成扩充图像。
本发明实施例的技术方案,通过建立对抗攻击模型,将对抗噪声加入到模型训练中,可以使模型也能辨别出有对抗噪声的图像,并且能够有效应对对抗攻击,提升了识别效果,通过类型识别模型识别出原始图像的图像类型,再通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵,最后根据原始图像和最终扩充像素矩阵生成扩充图像,保证了图像扩充的准确率。
实施例二
图3为本发明实施例二提供的一种图像扩充方法的流程图,本实施例上述实施例一的基础上对通过类型识别模型对获取的原始图像进行识别,获取原始图像的图像类型的具体说明。其中,步骤S210和S240-S250的具体内容与实施例一中的步骤S110和S130-S140大致相同,因此本实施方式中不再进行赘述。如图3所示,该方法包括:
S210、获取对抗攻击模型和类型识别模型。
可选的,获取对抗攻击模型和类型识别模型,包括:获取图像样本集,其中,图像样本集中包含各图像样本,以及图像样本的图像类型;获取各图像样本的初始扩充像素矩阵,确定初始扩充像素矩阵和图像类型的第一对应关系,根据第一对应关系建立对抗攻击模型;获取各图像样本的图像特征,确定图像特征和图像类型的第二对应关系,根据第二对应关系建立类型识别模型。
S220、获取原始图像的待测特征。
具体的,通过类型识别模型可以对原始图像进行图像特征提取,图像特征提取指对图像中的信息进行处理和分析,将其中不易受随机因素干扰的、具有标志性的信息作为该图像的特征信息提取出来,并将提取出的原始图像的图像特征作为待测特征。示例性的,待测特征可以是点特征、线特征和面特征等。
S230、确定待测特征和图像特征的相似度,将相似度最高的图像特征对应的图像类型作为原始图像的图像类型。
具体的,类型识别模型会确定待测特征和图像特征的相似度,计算相似度可以采用欧式距离,即计算待测特征和图像特征的欧式距离,欧式距离越大,表示待测特征与图像特征的相似度越高,最后,类型识别模型会输出相似度最高的图像特征对应的图像类型作为原始图像的图像类型。
S240、通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵。
S250、根据原始图像和最终扩充像素矩阵生成扩充图像。
可选的,根据原始图像和最终扩充像素矩阵生成扩充图像,包括:获取原始图像对应的原始像素矩阵;将原始像素矩阵和最终扩充像素矩阵叠加生成最终图像矩阵;根据最终图像矩阵生成扩充图像。
本发明实施例的技术方案,通过建立对抗攻击模型,将对抗噪声加入到模型训练中,可以使模型也能辨别出有对抗噪声的图像,并且能够有效应对对抗攻击,提升了识别效果,通过类型识别模型识别出原始图像的图像类型,再通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵,最后根据原始图像和最终扩充像素矩阵生成扩充图像,保证了图像扩充的准确率。
实施例三
图4为本发明实施例三提供的一种图像扩充装置的结构示意图。如图4所示,该装置包括:模型获取模块310,用于获取对抗攻击模型和类型识别模型;图像类型获取模块320,用于通过类型识别模型对获取的原始图像进行识别,获取原始图像的图像类型;最终扩充像素矩阵获取模块330,用于通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵;扩充图像生成模块340,用于根据原始图像和最终扩充像素矩阵生成扩充图像。
可选的,模型获取模块310,具体包括:图像样本集获取单元,用于获取图像样本集,其中,图像样本集中包含各图像样本,以及图像样本的图像类型;对抗攻击模型建立单元,用于获取各图像样本的初始扩充像素矩阵,确定初始扩充像素矩阵和图像类型的第一对应关系,根据第一对应关系建立对抗攻击模型;类型识别模型建立单元,用于获取各图像样本的图像特征,确定图像特征和图像类型的第二对应关系,根据第二对应关系建立类型识别模型。
可选的,对抗攻击模型建立单元,具体包括:扩充像素生成子单元,用于提取各图像样本的像素点,对各像素点进行对抗计算以生成扩充像素;初始扩充像素矩阵生成子单元,用于将扩充像素组成的矩阵作为初始扩充像素矩阵。
可选的,扩充像素生成子单元,具体用于:根据像素点生成初始值和对抗值;计算初始值和对抗值在神经网络中间层的差值,将差值的优化结果作为扩充像素。
可选的,对抗攻击模型建立单元,还包括:最终扩充像素矩阵生成子单元,用于将图像样本集按照指定范围划分成测试集和训练集;基于测试集,确定训练集中各初始扩充像素矩阵的准确率;将各图像类型中准确率最高的初始扩充像素矩阵作为最终扩充像素矩阵;根据第一对应关系建立对抗攻击模型,包括:根据图像类型和最终扩充像素矩阵的第一对应关系建立对抗攻击模型。
可选的,图像类型获取模块320,具体用于:获取原始图像的待测特征;确定待测特征和图像特征的相似度,将相似度最高的图像特征对应的图像类型作为原始图像的图像类型。
可选的,扩充图像生成模块340,具体用于:获取原始图像对应的原始像素矩阵;将原始像素矩阵和最终扩充像素矩阵叠加生成最终图像矩阵;根据最终图像矩阵生成扩充图像。
本发明实施例的技术方案,通过建立对抗攻击模型,将对抗噪声加入到模型训练中,可以使模型也能辨别出有对抗噪声的图像,并且能够有效应对对抗攻击,提升了识别效果,通过类型识别模型识别出原始图像的图像类型,再通过对抗攻击模型获取与图像类型对应的最终扩充像素矩阵,最后根据原始图像和最终扩充像素矩阵生成扩充图像,保证了图像扩充的准确率。
本发明实施例所提供的一种图像扩充装置可执行本发明任意实施例所提供的一种图像扩充方法,具备执行方法相应的功能模块和有益效果。
实施例四
如图5所示,可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如一种图像扩充方法。
在一些实施例中,一种图像扩充方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的一种图像扩充方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行一种图像扩充方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种图像扩充方法,其特征在于,包括:
获取对抗攻击模型和类型识别模型;
通过所述类型识别模型对获取的原始图像进行识别,获取所述原始图像的图像类型;
通过所述对抗攻击模型获取与所述图像类型对应的最终扩充像素矩阵;
根据所述原始图像和所述最终扩充像素矩阵生成扩充图像。
2.根据权利要求1所述的方法,其特征在于,所述获取对抗攻击模型和类型识别模型,包括:
获取图像样本集,其中,所述图像样本集中包含各图像样本,以及所述图像样本的图像类型;
获取各所述图像样本的初始扩充像素矩阵,确定所述初始扩充像素矩阵和所述图像类型的第一对应关系,根据所述第一对应关系建立所述对抗攻击模型;
获取各所述图像样本的图像特征,确定所述图像特征和所述图像类型的第二对应关系,根据所述第二对应关系建立所述类型识别模型。
3.根据权利要求2所述的方法,其特征在于,所述获取各所述图像样本的初始扩充像素矩阵,包括:
提取各所述图像样本的像素点,对各所述像素点进行对抗计算以生成扩充像素;
将所述扩充像素组成的矩阵作为初始扩充像素矩阵。
4.根据权利要求3所述的方法,其特征在于,所述对各所述像素点进行对抗计算以生成扩充像素,包括:
根据所述像素点生成初始值和对抗值;
计算所述初始值和所述对抗值在神经网络中间层的差值,将所述差值的优化结果作为所述扩充像素。
5.根据权利要求2所述的方法,其特征在于,在所述确定所述初始扩充像素矩阵和所述图像类型的第一对应关系之后,还包括:
将所述图像样本集按照指定范围划分成测试集和训练集;
基于所述测试集,确定所述训练集中各所述初始扩充像素矩阵的准确率;
将各所述图像类型中准确率最高的所述初始扩充像素矩阵作为所述最终扩充像素矩阵;
所述根据所述第一对应关系建立所述对抗攻击模型,包括:
根据所述图像类型和所述最终扩充像素矩阵的第一对应关系建立所述对抗攻击模型。
6.根据权利要求1所述的方法,其特征在于,所述通过所述类型识别模型对获取的原始图像进行识别,获取所述原始图像的图像类型,包括:
获取所述原始图像的待测特征;
确定所述待测特征和所述图像特征的相似度,将所述相似度最高的图像特征对应的图像类型作为所述原始图像的图像类型。
7.根据权利要求1所述的方法,其特征在于,所述根据所述原始图像和所述最终扩充像素矩阵生成扩充图像,包括:
获取所述原始图像对应的原始像素矩阵;
将所述原始像素矩阵和所述最终扩充像素矩阵叠加生成最终图像矩阵;
根据所述最终图像矩阵生成所述扩充图像。
8.一种图像扩充装置,其特征在于,包括:
模型获取模块,用于获取对抗攻击模型和类型识别模型;
图像类型获取模块,用于通过所述类型识别模型对获取的原始图像进行识别,获取所述原始图像的图像类型;
最终扩充像素矩阵获取模块,用于通过所述对抗攻击模型获取与所述图像类型对应的最终扩充像素矩阵;
扩充图像生成模块,用于根据所述原始图像和所述最终扩充像素矩阵生成扩充图像。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211339044.8A CN115909007A (zh) | 2022-10-28 | 2022-10-28 | 一种图像扩充方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211339044.8A CN115909007A (zh) | 2022-10-28 | 2022-10-28 | 一种图像扩充方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115909007A true CN115909007A (zh) | 2023-04-04 |
Family
ID=86476950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211339044.8A Pending CN115909007A (zh) | 2022-10-28 | 2022-10-28 | 一种图像扩充方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115909007A (zh) |
-
2022
- 2022-10-28 CN CN202211339044.8A patent/CN115909007A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112581463A (zh) | 图像缺陷的检测方法、装置、电子设备、存储介质及产品 | |
CN112597837B (zh) | 图像检测方法、装置、设备、存储介质和计算机程序产品 | |
CN113095336B (zh) | 关键点检测模型的训练方法和检测目标对象关键点的方法 | |
CN113971751A (zh) | 训练特征提取模型、检测相似图像的方法和装置 | |
CN112966742A (zh) | 模型训练方法、目标检测方法、装置和电子设备 | |
CN114550177A (zh) | 图像处理的方法、文本识别方法及装置 | |
CN113657274B (zh) | 表格生成方法、装置、电子设备及存储介质 | |
CN112633276A (zh) | 训练方法、识别方法、装置、设备、介质 | |
CN113379813A (zh) | 深度估计模型的训练方法、装置、电子设备及存储介质 | |
CN113780098A (zh) | 文字识别方法、装置、电子设备以及存储介质 | |
CN113378696A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN113378958A (zh) | 自动标注方法、装置、设备、存储介质及计算机程序产品 | |
CN112580666A (zh) | 图像特征的提取方法、训练方法、装置、电子设备及介质 | |
CN113177449A (zh) | 人脸识别的方法、装置、计算机设备及存储介质 | |
CN113378712A (zh) | 物体检测模型的训练方法、图像检测方法及其装置 | |
CN113642583A (zh) | 用于文本检测的深度学习模型训练方法及文本检测方法 | |
CN115311469A (zh) | 图像标注方法、训练方法、图像处理方法以及电子设备 | |
CN114511743B (zh) | 检测模型训练、目标检测方法、装置、设备、介质及产品 | |
CN117437624B (zh) | 违禁品检测方法、装置及电子设备 | |
CN114581732A (zh) | 一种图像处理及模型训练方法、装置、设备和存储介质 | |
CN115359308A (zh) | 模型训练、难例识别方法、装置、设备、存储介质及程序 | |
CN114445682A (zh) | 训练模型的方法、装置、电子设备、存储介质及产品 | |
CN116188917B (zh) | 缺陷数据生成模型训练方法、缺陷数据生成方法及装置 | |
CN115909007A (zh) | 一种图像扩充方法、装置、设备及存储介质 | |
CN115359322A (zh) | 一种目标检测模型训练方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |