CN115082299B - 非严格对齐的小样本不同源图像转换方法、系统及设备 - Google Patents
非严格对齐的小样本不同源图像转换方法、系统及设备 Download PDFInfo
- Publication number
- CN115082299B CN115082299B CN202210857769.XA CN202210857769A CN115082299B CN 115082299 B CN115082299 B CN 115082299B CN 202210857769 A CN202210857769 A CN 202210857769A CN 115082299 B CN115082299 B CN 115082299B
- Authority
- CN
- China
- Prior art keywords
- image
- type
- class
- images
- image conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000006243 chemical reaction Methods 0.000 claims abstract description 128
- 230000006870 function Effects 0.000 claims abstract description 63
- 238000012549 training Methods 0.000 claims abstract description 41
- 230000004913 activation Effects 0.000 claims abstract description 9
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 9
- 238000003860 storage Methods 0.000 claims description 15
- 230000009977 dual effect Effects 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 12
- 230000007246 mechanism Effects 0.000 claims description 10
- 238000005457 optimization Methods 0.000 claims description 10
- 238000013519 translation Methods 0.000 claims description 10
- 238000005520 cutting process Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 claims description 6
- 238000005315 distribution function Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 2
- 238000013136 deep learning model Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明属于图像转换技术领域,具体涉及了一种非严格对齐的小样本不同源图像转换方法、系统及设备,旨在解决现有深度学习的模型训练样本图像少、获取困难,导致训练好的模型性能较低的问题。本发明包括:构建图像转换模型,其生成器基于编码器、转换器和解码器构建,判别器基于卷积神经网络和激活函数构建;获取X类别和Y类别图像对,并进行图像增强;通过增强后的图像对进行图像转换模型的训练;通过训练好的图像转换模型,将获取的一个或少量X类别图像转换为Y类别图像。本发明通过非严格对齐方法构建容易获得的图像类别向不容易获得的图像的转换,有效提升不容易获得的图像的目标特征学习效果。
Description
技术领域
本发明属于图像转换技术领域,具体涉及了一种非严格对齐的小样本不同源图像转换方法、系统及设备。
背景技术
近年来,大数据为驱动的深度学习技术在图像转换应用上得到快速发展,然而大多数情况下,基于深度学习的不同源图像转换方法要求大量的标注图像,同时这些标注图像需要严格对齐。在实际场景中,良好对齐的标注图像数据往往难以大量获取,如热感红外图像相对于光学图像在观测目标上具有不受天气和云层影响的优势,同时,在成像上,相对于光学图像,热感红外图像能更好表现具有金属外壳的目标,也更加有利于此类目标的检测。然而,在实际应用中,热感红外图像相对于光学图像采集费用昂贵,这类热感红外图像通常属于小样本数据。
如果将一种类别区域的光学图像,通过非严格对齐的方法转换为热感红外图像,则有利于获得相似的大量的热感红外图像,可用于训练出更好的热感红外图像目标检测模型。
因此,针对该应用背景,本领域还急需一种非严格对齐的小样本不同源图像转换方法,通过小样本的图像转换训练,将大量的容易获得的图像转换为另一种不容易获得的图像数据,以满足模型训练的需求。
发明内容
为了解决现有技术中的上述问题,即在一些应用中,难以大量获取某区域的精准对齐的不同类别图像,导致采用传统深度学习方法的训练样本图像少、获取困难,训练好的模型性能较低的问题,本发明提供了一种非严格对齐的小样本不同源图像转换方法,所述图像转换方法包括:
步骤S10,获取一个或少量X类别图像;
步骤S20,通过训练好的图像转换模型进行所述X类别图像的非对齐转换,获得Y类别图像;所述非对齐代表所述图像转换模型在训练阶段,图像中的场景和内容不同;
其中,所述图像转换模型基于CycleGAN网络构建,所述图像转换模型包括两个呈现对偶关系的生成器和两个判别器,在所述转换器的ResNe Block模块中添加空间注意力机制,所述生成器基于编码器、转换器和解码器构建,所述判别器基于卷积神经网络和激活函数构建。
在转换模块方面,对原来CycleGAN网络结构中转换器部分的ResNe Block模块添加空间注意力机制,在判别阶段,将原CycleGAN判别阶段的循环一致损失函数的L1范式替换为区域直方图余弦度量,该方法能够实现非对齐的不同源图像的转换,同时保留更多图像自身的结构特征。
在一些优选的实施例中,所述图像转换模型,其训练方法为:
步骤B10,获取不同场景目标的X类别和Y类别图像对序列;
步骤B20,进行所述X类别和Y类别图像对序列中各图像对的非严格对齐,获得第一X类别和Y类别图像对序列;
步骤B30,将所述第一X类别和Y类别图像对序列中各图像的尺寸调整为设定大小,获得第二X类别和Y类别图像对序列;
步骤B40,分别进行所述第二X类别和Y类别图像对序列中各图像的平移、缩放、裁剪的几何变换以及亮度调整、添加高斯噪声操作,获得增强X类别和Y类别图像对序列;
步骤B50,通过所述增强X类别和Y类别图像对序列进行所述图像转换模型的迭代训练,直至所述图像转换模型的总优化损失函数值低于设定阈值或达到设定训练次数,获得训练好的图像转换模型。
在一些优选的实施例中,步骤B20中进行所述X类别和Y类别图像对序列中各图像对的非严格对齐,其方法为:
以各图像对中的目标为基准,将所述X类别和Y类别图像对序列中各图像对的成像范围的偏差调整至设定阈值范围内,完成图像的非严格对齐。
在一些优选的实施例中,所述总优化损失函数,其表示为:
其中,为总优化损失函数,和分别为呈现对偶关系的生成器和的
损失函数,和分别为判别器和的损失函数,生成器用于将类别图像转换为类别图像,生成器用于将类别图像转换为类别图像,判别器用于判别生成器
基于类别图像转换的类别图像属于类别的概率,判别器用于判别生成器基于
类别图像转换的类别图像属于类别的概率,分别为总优化损失函数中损失函数的重要性权重参数。
其中,代表当前给定样本,代表转换的目标样本集,代表当前给定样本被判定为类图像的概率,代表生成器将当前给定样本由类图像转换为类
图像,代表生成器将生成器转换的图像转换为类图像,代表
预设的权重参数,代表图余弦度量函数, (.)为区域直方图分布函数,代表选定
区域的像素集合。
本发明的另一方面,提出了一种非严格对齐的小样本不同源图像转换系统,所述图像转换系统包括图像获取模块、图像转换模块、模型构建模块、图像对齐模块、图像尺寸调整模块、图像增强模块和模型训练模块;
所述图像获取模块,用于获取待转换的一个或少量X类别图像;还用于获取模型训练的不同场景目标的X类别和Y类别图像对序列;
所述图像转换模块,通过训练好的图像转换模型进行所述X类别图像的非对齐转换,获得Y类别图像;所述非对齐代表所述图像转换模型在训练阶段,图像中的场景和内容不同;
所述模型构建模块,基于CycleGAN网络构建图像转换模型,所述图像转换模型包括两个呈现对偶关系的生成器和两个判别器,并在所述CycleGAN网络判别器对应的转换器的ResNe Block模块中添加空间注意力机制,所述生成器基于编码器、转换器和解码器构建,所述判别器基于卷积神经网络和激活函数构建;
所述图像对齐模块,进行所述X类别和Y类别图像对序列中各图像对的非严格对齐,获得第一X类别和Y类别图像对序列;
所述图像尺寸调整模块,将所述第一X类别和Y类别图像对序列中各图像的尺寸调整为设定大小,获得第二X类别和Y类别图像对序列;
所述图像增强模块,分别进行所述第二X类别和Y类别图像对序列中各图像的平移、缩放、裁剪的几何变换以及亮度调整、添加高斯噪声操作,获得增强X类别和Y类别图像对序列;
所述模型训练模块,通过所述增强X类别和Y类别图像对序列进行所述图像转换模型的迭代训练,直至所述图像转换模型的总优化损失函数值低于设定阈值或达到设定训练次数,获得训练好的图像转换模型。
本发明的第三方面,提出了一种电子设备,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述的非严格对齐的小样本不同源图像转换方法。
本发明的第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现上述的非严格对齐的小样本不同源图像转换方法。
本发明的有益效果:
(1)本发明非严格对齐的小样本不同源图像转换方法,针对Y类别图像样本数量稀缺导致样本特征少的问题,将容易获取的X类别图像样本转换为难以获取的Y类别的小样本图像,能够有效增加Y类别图像的数量,从而提升模型训练后的性能。
(2)本发明非严格对齐的小样本不同源图像转换方法,通过改进的CycleGAN图像转换神经网络模型(即图像转换模型)进行X类别图像到Y类别图像的转换,并针对模型的两个改进的生成器的对偶关系定义损失函数,结合两个改进的判别器的损失函数,进行模型训练,其中改进的CycleGAN图像在转换模块方面,在原来CycleGAN网络结构中转换器部分的ResNe Block模块添加空间注意力机制,并将循环一致损失函数的L1范式替换为区域直方图余弦度量,该方法能够实现非对齐的不同源图像的转换,同时保留更多图像自身的结构特征。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明非严格对齐的小样本不同源图像转换方法的流程示意图;
图2是用于实现本申请方法、系统、设备实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明提供一种非严格对齐的小样本不同源图像转换方法,为了解决上述类似空间热感红外图像样本少等问题,提出一种面向不同源的小样本非严格对齐的图像转换增强方法,首先准备不同场景目标的图像序列,记容易获得的图像为X,不容易获取的图像类别图像为Y(小样本图像),针对上述图像对进行增广处理构建训练样本集,采用改进的CycleGAN训练网络模型实现从X到Y的转换。
本发明的一种非严格对齐的小样本不同源图像转换方法,所述图像转换方法包括:
步骤S10,获取一个或少量X类别图像;
步骤S20,通过训练好的图像转换模型进行所述X类别图像的非对齐转换,获得Y类别图像;所述非对齐代表所述图像转换模型在训练阶段,图像中的场景和内容不同;
其中,所述图像转换模型基于CycleGAN网络构建,所述图像转换模型包括两个呈现对偶关系的生成器和两个判别器,在所述转换器的ResNe Block模块中添加空间注意力机制,所述生成器基于编码器、转换器和解码器构建,所述判别器基于卷积神经网络和激活函数构建。
为了更清晰地对本发明非严格对齐的小样本不同源图像转换方法进行说明,下面结合图1对本发明实施例中各步骤展开详述。
本发明第一实施例的非严格对齐的小样本不同源图像转换方法,各步骤详细描述如下:
步骤S10,获取一个或少量X类别图像。
步骤S20,通过训练好的图像转换模型进行所述X类别图像的非对齐转换,获得Y类别图像;所述非对齐代表所述图像转换模型在训练阶段,图像中的场景和内容不同。
也就是说,本发明通过训练好的图像转换模型将容易获取大量样本的图像转换为不容易获取大量样本的图像,使得对应的小样本领域的模型在训练的时候不收样本数量少的限制,可以获得性能更优的模型,从而提升后续模型处理的准确性和精度。
训练好的图像转换模型包括两个呈现对偶关系的生成器和两个判别器,生成器基于编码器、转换器和解码器构建,判别器基于卷积神经网络和激活函数构建,在转换模块方面,对原来CycleGAN网络结构中转换器部分的ResNe Block模块添加空间注意力机制,并将循环一致损失函数的L1范式替换为区域直方图余弦度量,该方法能够实现非对齐的不同源图像的转换,同时保留更多图像自身的结构特征。
图像转换模型,其训练方法为:
步骤B10,获取不同场景目标的X类别和Y类别图像对序列。
步骤B20,进行所述X类别和Y类别图像对序列中各图像对的非严格对齐,获得第一X类别和Y类别图像对序列。
进行所述X类别和Y类别图像对序列中各图像对的非严格对齐,其方法为:
以各图像对中的目标为基准,将所述X类别和Y类别图像对序列中各图像对的成像范围的偏差调整至设定阈值范围内,完成图像的非严格对齐。
本过程的对齐仅仅只需要使X和Y图像成像范围大致相同即可,与传统的图像转换方法中的像素级对齐完全不同,因此将本过程称为非严格对齐。
X类别和Y类别的小样本图像对齐处理:针对上述图像序列,在不同的类别内以目
标特征为基准在其附近区类别分别将X类别中的图像和Y类别中的图像进行对齐,得到X类
别图像序列,,…,和Y类别图像序列,,…,。这个过程的目的是建立目标特征
的映射关系,即,,…,。
步骤B30,将所述第一X类别和Y类别图像对序列中各图像的尺寸调整为设定大小,获得第二X类别和Y类别图像对序列。
对目标特征映射后的图像进行Resize处理获取同一尺寸大小的图像序列。
步骤B40,分别进行所述第二X类别和Y类别图像对序列中各图像的平移、缩放、裁剪的几何变换以及亮度调整、添加高斯噪声操作,获得增强X类别和Y类别图像对序列。
采用数据增强的方法包括图像旋转、平移、缩放、裁剪、加高斯噪声等处理方法。
f(x, y)表示输入图像,g(x , y)表示输出图像,T表示对f(x, y)进行处理的操作符。
本发明一个实施例中,T操作包括:
旋转:对X类别和Y类别的图像分别进行30°、60°、90°旋转得到三种不同角度的样本。
平移:对任一个旋转后的样本,进行不同设定距离的平移操作,得到不同设定距离平移后的样本。
缩放:对任一个平移后的样本,进行不同设定倍数的缩放操作,得到不同设定倍数缩放后的样本。
裁剪:对任一个缩放后的样本,进行不同设定大小的裁剪操作,得到不同设定大小的裁剪后的样本。
通过亮度变化和添加高斯噪声以增加图像多样性,用I(x, y)表示图像亮度,则亮
度变化可以表示为I(x,y) =,当gamma值越大,处理后图像的像素亮度值就越
低,改变不同的gamma值获取不同亮度的图像。
上述图像序列增强方式大大增加了原数据中样本的数量,从而增加了CycleGAN图像转换神经网络训练所需的样本。
步骤B50,通过所述增强X类别和Y类别图像对序列进行所述图像转换模型的迭代训练,直至所述图像转换模型的总优化损失函数值低于设定阈值或达到设定训练次数,获得训练好的图像转换模型。
采用了生成器和判别器的图像转换模型用于X类别图像序列向Y类别图像序列进行图像映射。
通过编码器、转换器和解码器构建生成器的网络结构,改进的CycleGAN网络(即图像转换模型)在转换模块方面,对原来CycleGAN网络结构中转换器部分的ResNe Block模块添加空间注意力机制,更好地促进源类别到目标类别的非对齐目标特征的推理。
将原网络的循环一致损失函数的L1范式替换为区域直方图余弦度量,通过卷积神经网络和激活函数构建循环一致损失函数判别器的网络结构。
训练集样本数量设置:将图像对数据增强后的样本随机抽取一定比例(60%-80%)作为训练集,其余作为测试集,通过图像转换网络不断迭代调整权重参数得到图像转换的网络模型,即获得训练好的CycleGAN图像转换神经网络。
图像转换模型的总优化损失函数如式(1)所示:
其中,为总优化损失函数,和分别为呈现对偶关系的生成器和的
损失函数,和分别为判别器和的损失函数,生成器用于将类别图像转换为类别图像,生成器用于将类别图像转换为类别图像,判别器用于判别生成器
基于类别图像转换的类别图像属于类别的概率,判别器用于判别生成器基于
类别图像转换的类别图像属于类别的概率,分别为总优化损失函数中损失函数的重要性权重参数。
其中,代表当前给定样本,代表转换的目标样本集,代表当前给定样本被判定为类图像的概率,代表生成器将当前给定样本由类图像转换为类
图像,代表生成器将生成器转换的图像转换为类图像,代表
预设的权重参数,代表图余弦度量函数, (.)表示区域直方图分布函数,代表选
定区域的像素集合。
测试集上测试网络模型:在测试集上进行测试,经过上述步骤获取最后的训练模型,在测试集上X类别图像作为输入进行前向推导,可以获取经过转换网络模型后的Y类别图像。根据网络模型生成出来的假的Y类别图像和真实的Y类别图像对比以验证训练模型的好坏,最后经过上述步骤最终获取X类别图像映射后的Y类别图像。
上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。
本发明第二实施例的非严格对齐的小样本不同源图像转换系统,所述图像转换系统包括图像获取模块、图像转换模块、模型构建模块、图像对齐模块、图像尺寸调整模块、图像增强模块和模型训练模块;
所述图像获取模块,用于获取待转换的一个或少量X类别图像;还用于获取模型训练的不同场景目标的X类别和Y类别图像对序列;
所述图像转换模块,通过训练好的图像转换模型进行所述X类别图像的非对齐转换,获得Y类别图像;所述非对齐代表所述图像转换模型在训练阶段,图像中的场景和内容不同;
所述模型构建模块,基于CycleGAN网络构建图像转换模型,所述图像转换模型包括两个呈现对偶关系的生成器和两个判别器,并在所述CycleGAN网络判别器对应的转换器的ResNe Block模块中添加空间注意力机制,所述生成器基于编码器、转换器和解码器构建,所述判别器基于卷积神经网络和激活函数构建;
所述图像对齐模块,进行所述X类别和Y类别图像对序列中各图像对的非严格对齐,获得第一X类别和Y类别图像对序列;
所述图像尺寸调整模块,将所述第一X类别和Y类别图像对序列中各图像的尺寸调整为设定大小,获得第二X类别和Y类别图像对序列;
所述图像增强模块,分别进行所述第二X类别和Y类别图像对序列中各图像的平移、缩放、裁剪的几何变换以及亮度调整、添加高斯噪声操作,获得增强X类别和Y类别图像对序列;
所述模型训练模块,通过所述增强X类别和Y类别图像对序列进行所述图像转换模型的迭代训练,直至所述图像转换模型的总优化损失函数值低于设定阈值或达到设定训练次数,获得训练好的图像转换模型。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的非严格对齐的小样本不同源图像转换系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种电子设备,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述的非严格对齐的小样本不同源图像转换方法。
本发明第四实施例的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现上述的非严格对齐的小样本不同源图像转换方法。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
下面参考图2,其示出了用于实现本申请方法、系统、设备实施例的服务器的计算机系统的结构示意图。图2示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统包括中央处理单元(CPU,Central Processing Unit)201,其可以根据存储在只读存储器(ROM,Read Only Memory)202中的程序或者从存储部分208加载到随机访问存储器(RAM,Random Access Memory)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU 201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O,Input/Output)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD,Liquid Crystal Display)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如LAN(局域网,Local AreaNetwork)卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (5)
1.一种非严格对齐的小样本不同源图像转换方法,其特征在于,所述图像转换方法包括:
步骤S10,获取一个或少量X类别图像;
步骤S20,通过训练好的图像转换模型进行所述X类别图像的非对齐转换,获得Y类别图像;所述非对齐代表所述图像转换模型在训练阶段,图像中的场景和内容不同;
其中,所述图像转换模型基于CycleGAN网络构建,所述图像转换模型包括两个呈现对偶关系的生成器和两个判别器,所述生成器基于编码器、转换器和解码器构建,所述判别器基于卷积神经网络和激活函数构建,在所述转换器的ResNe Block模块中添加空间注意力机制;
所述图像转换模型,其训练方法为:
步骤B10,获取不同场景目标的X类别和Y类别图像对序列;
步骤B20,以各图像对中的目标为基准,将所述X类别和Y类别图像对序列中各图像对的成像范围的偏差调整至设定阈值范围内,完成图像的非严格对齐,获得第一X类别和Y类别图像对序列;
步骤B30,将所述第一X类别和Y类别图像对序列中各图像的尺寸调整为设定大小,获得第二X类别和Y类别图像对序列;
步骤B40,分别进行所述第二X类别和Y类别图像对序列中各图像的平移、缩放、裁剪的几何变换以及亮度调整、添加高斯噪声操作,获得增强X类别和Y类别图像对序列;
步骤B50,通过所述增强X类别和Y类别图像对序列进行所述图像转换模型的迭代训练,直至所述图像转换模型的总优化损失函数值低于设定阈值或达到设定训练次数,获得训练好的图像转换模型;
所述总优化损失函数,其表示为:
其中,为总优化损失函数,和分别为呈现对偶关系的生成器和的损失函数,和分别为判别器和的损失函数,生成器 用于将类别图像转换为类别图像,生成器用于将类别图像转换为类别图像,用于判别生成器基于类别图像转换的类别图像属于类别的概率,判别器用于判别生成器基于类别图像转换的类别图像属于类别的概率,分别为总优化损失函数中损失函数的重要性权重参数;
3.一种非严格对齐的小样本不同源图像转换系统,其特征在于,所述图像转换系统包括图像获取模块、图像转换模块、模型构建模块、图像对齐模块、图像尺寸调整模块、图像增强模块和模型训练模块;
所述图像获取模块,用于获取待转换的一个或少量X类别图像;还用于获取模型训练的不同场景目标的X类别和Y类别图像对序列;
所述图像转换模块,通过训练好的图像转换模型进行所述X类别图像的非对齐转换,获得Y类别图像;所述非对齐代表所述图像转换模型在训练阶段,图像中的场景和内容不同;
所述模型构建模块,基于CycleGAN网络构建图像转换模型,所述图像转换模型包括两个呈现对偶关系的生成器和两个判别器,并在所述CycleGAN网络判别器对应的转换器的ResNe Block模块中添加空间注意力机制,所述生成器基于编码器、转换器和解码器构建,所述判别器基于卷积神经网络和激活函数构建;
所述图像对齐模块,进行所述X类别和Y类别图像对序列中各图像对的非严格对齐,获得第一X类别和Y类别图像对序列;
所述图像尺寸调整模块,将所述第一X类别和Y类别图像对序列中各图像的尺寸调整为设定大小,获得第二X类别和Y类别图像对序列;
所述图像增强模块,分别进行所述第二X类别和Y类别图像对序列中各图像的平移、缩放、裁剪的几何变换以及亮度调整、添加高斯噪声操作,获得增强X类别和Y类别图像对序列;
所述模型训练模块,获取不同场景目标的X类别和Y类别图像对序列,以各图像对中的目标为基准,将所述X类别和Y类别图像对序列中各图像对的成像范围的偏差调整至设定阈值范围内,完成图像的非严格对齐,获得第一X类别和Y类别图像对序列,将所述第一X类别和Y类别图像对序列中各图像的尺寸调整为设定大小,获得第二X类别和Y类别图像对序列,分别进行所述第二X类别和Y类别图像对序列中各图像的平移、缩放、裁剪的几何变换以及亮度调整、添加高斯噪声操作,获得增强X类别和Y类别图像对序列,通过所述增强X类别和Y类别图像对序列进行所述图像转换模型的迭代训练,直至所述图像转换模型的总优化损失函数值低于设定阈值或达到设定训练次数,获得训练好的图像转换模型;
所述总优化损失函数,其表示为:
其中,为总优化损失函数,和分别为呈现对偶关系的生成器和的损失函数,和分别为判别器和的损失函数,生成器 用于将类别图像转换为类别图像,生成器用于将类别图像转换为类别图像,用于判别生成器基于类别图像转换的类别图像属于类别的概率,判别器用于判别生成器基于类别图像转换的类别图像属于类别的概率,分别为总优化损失函数中损失函数的重要性权重参数;
4.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求1-2任一项所述的非严格对齐的小样本不同源图像转换方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现权利要求1-2任一项所述的非严格对齐的小样本不同源图像转换方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210857769.XA CN115082299B (zh) | 2022-07-21 | 2022-07-21 | 非严格对齐的小样本不同源图像转换方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210857769.XA CN115082299B (zh) | 2022-07-21 | 2022-07-21 | 非严格对齐的小样本不同源图像转换方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115082299A CN115082299A (zh) | 2022-09-20 |
CN115082299B true CN115082299B (zh) | 2022-11-25 |
Family
ID=83260063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210857769.XA Active CN115082299B (zh) | 2022-07-21 | 2022-07-21 | 非严格对齐的小样本不同源图像转换方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115082299B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116484905B (zh) * | 2023-06-20 | 2023-08-29 | 合肥高维数据技术有限公司 | 针对非对齐样本的深度神经网络模型训练方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112001427A (zh) * | 2020-08-04 | 2020-11-27 | 中国科学院信息工程研究所 | 一种基于类比学习的图像转化方法和装置 |
CN112991358A (zh) * | 2020-09-30 | 2021-06-18 | 北京字节跳动网络技术有限公司 | 风格图像生成方法、模型训练方法、装置、设备和介质 |
CN113723535A (zh) * | 2021-09-02 | 2021-11-30 | 北京大学 | 基于CycleGAN深度学习的细胞微核组学图像处理方法及存储介质 |
CN114119351A (zh) * | 2021-11-08 | 2022-03-01 | 清华大学 | 图像处理方法、装置、电子设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3572822B1 (en) * | 2018-05-23 | 2022-03-09 | RaySearch Laboratories AB | Medical image conversion |
EP3834141A4 (en) * | 2018-08-10 | 2022-04-20 | Visa International Service Association | PROCEDURE FOR MATCHING DIFFERENT INPUT DATA |
CN109919251B (zh) * | 2019-03-21 | 2024-08-09 | 腾讯科技(深圳)有限公司 | 一种基于图像的目标检测方法、模型训练的方法及装置 |
CN113966522A (zh) * | 2019-11-25 | 2022-01-21 | Essenlix 公司 | 基于成像的测定的有效训练和准确度改进 |
CN111881884B (zh) * | 2020-08-11 | 2021-05-28 | 中国科学院自动化研究所 | 基于跨模态转化辅助的人脸防伪检测方法、系统及装置 |
CN112258381B (zh) * | 2020-09-29 | 2024-02-09 | 北京达佳互联信息技术有限公司 | 模型训练方法、图像处理方法、装置、设备及存储介质 |
CN112347850B (zh) * | 2020-09-30 | 2024-04-23 | 新大陆数字技术股份有限公司 | 红外图像转换方法、活体检测方法、装置、可读存储介质 |
CN112967178B (zh) * | 2021-03-08 | 2023-04-07 | 烟台艾睿光电科技有限公司 | 一种图像转换方法、装置、设备及存储介质 |
CN113076927B (zh) * | 2021-04-25 | 2023-02-14 | 华南理工大学 | 基于多源域迁移的指静脉识别方法及系统 |
CN113936138A (zh) * | 2021-09-15 | 2022-01-14 | 中国航天科工集团第二研究院 | 基于多源图像融合的目标检测方法、系统、设备、介质 |
CN113763288A (zh) * | 2021-09-28 | 2021-12-07 | 宁波慈溪生物医学工程研究所 | 一种医学图像增强方法 |
-
2022
- 2022-07-21 CN CN202210857769.XA patent/CN115082299B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112001427A (zh) * | 2020-08-04 | 2020-11-27 | 中国科学院信息工程研究所 | 一种基于类比学习的图像转化方法和装置 |
CN112991358A (zh) * | 2020-09-30 | 2021-06-18 | 北京字节跳动网络技术有限公司 | 风格图像生成方法、模型训练方法、装置、设备和介质 |
CN113723535A (zh) * | 2021-09-02 | 2021-11-30 | 北京大学 | 基于CycleGAN深度学习的细胞微核组学图像处理方法及存储介质 |
CN114119351A (zh) * | 2021-11-08 | 2022-03-01 | 清华大学 | 图像处理方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
基于CycleGAN的图像风格迁移;马赫等;《电脑知识与技术》;20200925(第27期);第18-20页 * |
基于改进的CycleGAN模型非配对的图像到图像转换;何剑华等;《玉林师范学院学报》;20180401(第02期);第122-126页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115082299A (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112560876B (zh) | 解耦度量的单阶段小样本目标检测方法 | |
CN108732550B (zh) | 用于预测雷达回波的方法和装置 | |
JP7449869B2 (ja) | 高度な機械学習手法を用いた記述岩石薄片の画像の自動分析 | |
CN111602138B (zh) | 基于人工神经网络的物体检测的系统及方法 | |
CN110335330B (zh) | 图像模拟生成方法及其系统、深度学习算法训练方法及电子设备 | |
CN115546630A (zh) | 基于遥感影像特征目标检测的工地提取方法和系统 | |
CN111385640B (zh) | 视频封面的确定方法、装置、设备及存储介质 | |
CN112364843A (zh) | 插拔式航拍图像目标定位检测方法、系统、设备 | |
KR20200018411A (ko) | 전극편의 버를 검출하기 위한 방법 및 장치 | |
CN115019187B (zh) | 针对sar图像船舶目标的检测方法、装置、设备及介质 | |
CN115082299B (zh) | 非严格对齐的小样本不同源图像转换方法、系统及设备 | |
US20230401691A1 (en) | Image defect detection method, electronic device and readable storage medium | |
CN113781478B (zh) | 油罐图像检测方法、装置、电子设备和计算机可读介质 | |
CN115861255A (zh) | 用于图像处理的模型训练方法、装置、设备、介质及产品 | |
CN113469167B (zh) | 仪表读数识别方法、装置、设备及存储介质 | |
CN116930192B (zh) | 一种高精度铜管缺陷检测方法及系统 | |
US20210374480A1 (en) | Arithmetic device, arithmetic method, program, and discrimination system | |
CN116524070A (zh) | 一种基于文本的场景图片编辑方法及系统 | |
CN114782822A (zh) | 电力设备的状态检测方法、装置、电子设备及存储介质 | |
CN108447107B (zh) | 用于生成视频的方法和装置 | |
CN112750124A (zh) | 模型生成、图像分割方法、装置、电子设备及存储介质 | |
CN111612770A (zh) | 基于主动筛选的半监督病灶检测网络的病灶检测系统 | |
CN116721143B (zh) | 3d医学图像的深度信息处理装置及方法 | |
CN114723746B (zh) | 基于知识蒸馏的病灶区域深度组学特征提取方法及装置 | |
CN109559343B (zh) | 用于容器的图像处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |