CN116664456B - 一种基于梯度信息的图片重建方法、系统及电子设备 - Google Patents

一种基于梯度信息的图片重建方法、系统及电子设备 Download PDF

Info

Publication number
CN116664456B
CN116664456B CN202310960223.1A CN202310960223A CN116664456B CN 116664456 B CN116664456 B CN 116664456B CN 202310960223 A CN202310960223 A CN 202310960223A CN 116664456 B CN116664456 B CN 116664456B
Authority
CN
China
Prior art keywords
picture
virtual
gradient information
gradient
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310960223.1A
Other languages
English (en)
Other versions
CN116664456A (zh
Inventor
魏凯敏
钱进
吴永东
翁健
冯丙文
鲍焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN202310960223.1A priority Critical patent/CN116664456B/zh
Publication of CN116664456A publication Critical patent/CN116664456A/zh
Application granted granted Critical
Publication of CN116664456B publication Critical patent/CN116664456B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/098Distributed learning, e.g. federated learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提出一种基于梯度信息的图片重建方法、系统及电子设备,包括:获取联邦学习中的图片分类模型,及其原始真实图片的真实梯度信息;基于所述真实梯度信息和图片分类模型,获取虚拟图片、标签信息和虚拟梯度信息;获取所述真实梯度信息与所述虚拟梯度信息之间的损失值;基于所述损失值对虚拟图片进行迭代优化,获取重建的图像。本发明基于梯度信息可重建出高质量的图片,重建的虚拟图片与原始真实图片之间的PSNR值达到25.6至33.8之间。

Description

一种基于梯度信息的图片重建方法、系统及电子设备
技术领域
本发明属于人工智能技术领域和联邦学习数据隐私保护领域,尤其涉及一种基于梯度信息的图片重建方法、系统及电子设备。
背景技术
随着深度学习技术的不断发展,越来越多的应用场景需要使用大量高质量的数据进行训练。然而,现实中很少有单一实体单位拥有大量数据,数据量少或是质量低都难以支撑深度学习模型的构建和应用。若将各个实体单位所拥有的相关数据收集在一起,又涉及到数据版权、隐私保护等问题。因此,以聚集形成规模数据效应、保护数据版权和隐私为初衷的联邦学习模型被设计出来并逐步得到应用。
联邦学习是一个多参与方或多计算结点之间共享聚合机器学习模型梯度参数而不直接交换数据的分布式深度学习框架,以解决数据共享与隐私保护的矛盾问题。在联邦学习中,参数服务器作为一个中央节点,用于收集和聚合参与方的本地模型计算好的梯度信息,并更新全局模型参数。在训练初始阶段,参数服务器向每一个参与者发送一个全局模型,参与者在本地设备上进行部分训练,然后将更新的梯度信息发送回参数服务器进行聚合,从而训练全局模型。联邦学习已经成为不传输原始数据情况下训练模型网络的常见方法。
然而最近一些研究发现梯度信息会带来数据隐私的泄露。例如对于图片数据而言,可以通过梯度信息还重建出图片的属性、标签甚至是能够对图片数据实现像素级上的详细重建。这种重建的方法基于一个朴素的观点,当两个图片对应的梯度越相近,这两个图片也就越相似。重建的过程中只需要将原始图片的梯度信息与虚拟图片的之间的梯度信息作为误差,通过最小化误差值进行优化迭代至收敛,原始训练图片就能被成功地重建。
尽管原始训练图片在一些研究中被证实能够实现重建,但是普遍存在着以下几个方面的不足。一方面对于信息的获取假设过强,一些方法假设重建者有主动能力需要去改变联邦学习下模型的参数或者改变网络结构,这种行为在现实中容易被检测出来,所以并不现实;另一方面需要较多的额外信息辅助,在目前根据梯度信息重建图片并不容易,有些研究发现如果可以利用图片的批量统计信息和真实的标签能够帮助图片的重建,但是这些信息在真实的联邦学习中,由于各节点只传递梯度信息,并不传递上述信息,所以这些信息的获取是不符合实际的。最后这些工作重建的图片普遍分辨率较低,普遍在64*64分辨率下,且效果不佳。
发明内容
为解决上述技术问题,本发明做了以下的创新,假设重建者为诚实且好奇的参数服务器,它能够记录模型和梯度信息,但是没有主动能力,解决了获取信息假设过强的问题。对于标签信息利用获取到的梯度信息进行重建,无需真实的图片标签。对于真实图片的批量信息利用相似分布图像数据集的均值与方差进行替代,例如当重建CIAFR10数据集的图片时候,可以利用ImageNet数据集的均值与方差代替真实图片批量信息中的均值与方差。对于重建的图片分辨率低,效果较差的问题,采取了两个措施,一方面在损失函数中除了常用的批量正则化,还加入了总变正则化和组正则化,另一方面引入StyleGAN XL生成模型对虚拟图片的潜在空间进行搜索,相比于直接优化虚拟图片,大大降低了需要搜索的空间,这使得重建高分辨率的图片变得可能。这两个措施在前文两个条件的限制下,依然提升了重建图片的效果,使得能够重建分辨率128*128像素以上的图片。本发明的意义在于打破了联邦学习核心的安全前提,即只传递梯度信息而不传递原始数据能够保护隐私。本方法可以作为联邦学习的风险评估工具,帮助加强数据隐私的保护。
为实现上述目的本发明提出了一种基于梯度信息的图片重建方法,包括:
获取联邦学习中的图片分类模型,及其原始真实图片对应的真实梯度信息;
基于所述真实梯度信息和图片分类模型,获取虚拟图片、标签信息和虚拟梯度信息;
获取所述真实梯度信息与所述虚拟梯度信息之间的损失值;
基于所述损失值对虚拟图片进行迭代优化,获取重建的图像。
可选地,获取所述虚拟图片包括:
获取符合该数据集均值与方差正态分布的随机空间向量;
利用预设的StyleGAN XL生成模型,对随机空间向量进行搜索,获取所述虚拟图片。
可选地,获取所述虚拟梯度信息包括:
基于所述真实梯度信息,重建原始真实图片的所述标签信息;
将所述标签信息和所述虚拟图片,输入所述图片分类模型,获取虚拟梯度信息。
可选地,所述StyleGAN XL生成模型包括:Mapping子网络和Synthesis子网络;
对所述随机空间向量进行搜索包括:
将所述随机空间向量输入所述Mapping子网络,转换为用于控制生成图像的特征向量w;
将所述特征向量w输入所述Synthesis子网络,依次通过网络的预设特征层,对特征向量进行重组,映射到图像空间,生成所述的虚拟图片。
可选地,所述预设特征层包括:一系列卷积操作和非线性激活函数,其中所述StyleGAN XL生成模的每一层网络层都对应于不同的空间分辨率和通道数。
可选地,获取所述真实梯度信息与所述虚拟梯度信息之间的损失值的方式为:采用交叉熵损失函数。
可选地,所述重建的图像为:
其中,表示重建的虚拟图片,/>表示使得后面式子取最小值时的/>取值,/>分别表示真实图片对应的梯度与虚拟图片对应的梯度,/>,/> , />分别为正则项的平衡因子,用于平衡各正则项的数值大小,/>为批量正则项,/>为总变差正则项,/>为组正则项。
可选地,基于所述损失值对虚拟图片进行迭代优化包括:
设置迭代参数;其中所述参数包括:总迭代周期、优化器Adam和学习率;
将所述损失值和批量正则项、总变差正则项、组正则项构成总损失值;
将所述总损失值,输入优化器对所述虚拟图片进行迭代更新;
当迭代周期达到预设周期数时,获得最终重建的原始图片。
为实现上述目的本发明还提出了一种基于梯度信息的图片重建系统,包括:模型、梯度获取模块、标签重建模块、虚拟图片生成模块、虚拟梯度获取模块、损失值计算模块和迭代优化模块;
所述模型、梯度获取模块,用于获取联邦学习中的图片分类模型,及其原始真实图片对应的参数的真实梯度信息;
所述标签重建模块,用于基于所述真实梯度信息,重建原始训练图片的标签信息;
所述虚拟图片生成模块,用于获取符合该数据集均值与方差正态分布的随机向量,对所述随机向量的潜在空间向量进行搜索,生成虚拟图片;
所述虚拟梯度获取模块,用于处理所述虚拟图片和标签信息,获取虚拟梯度信息;
所述损失值计算模块,用于计算所述真实梯度信息和虚拟梯度信息质检的误差值,并加上正则项值;
所述迭代优化模块,用于根据所述误差值,迭代优化所述虚拟图片,直到达到预设周期数时,获得最终的重建图片。
为实现上述目的本发明还提出了一种电子设备,包括:
存储器,用于存储计算机程序和数据;所述的计算机程序用于实施所述的图片重建方法;所述的数据为包括模型和图片等计算机程序执行图片重建方法所需的数据。
处理器,与所述的存储器连接,用于调取并执行所述的计算机程序和处理数据。
与现有技术相比,本发明具有如下优点和技术效果:
1.该基于梯度信息的图像重建方法,假设重建者为诚实且好奇的参数服务器,解决了获取信息假设过强的能力。
2.该基于梯度信息的图像重建方法,通过重建标签和采用数据集均值方差代替批量信息,无需真实的标签和批量信息辅助。
3.该基于梯度信息的图像重建方法,通过在损失函数中加入批量正则化、总变差正则化和组正则化项,能够提升图片的质量,使得重建的虚拟图片与原始真实图片之间的PSNR值达到25.6至33.8之间。
4.该基于梯度信息的图像重建方法,引入StyleGAN XL生成模型对虚拟图片的潜在空间进行搜索,能够减少优化图片所需要搜索的空间,重建分辨率128*128像素以上的图片。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明实施例的图片重建的整体架构示意图;
图2为本发明实施例的图片重建系统的结构意图;
图3为本发明实施例的图片重建电子设备的结构示意图;
其中,200、模型、梯度获取模块;201、标签重建模块;202、虚拟图片生成模块;203、虚拟梯度获取模块;204、损失值计算模块;205、迭代优化模块;301、存储器;302、处理器。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例提出了一种基于梯度信息的图片重建方法,包括以下步骤:
S1:获取联邦学习中的模型及其原始真实图片对应的参数的真实梯度;
S2:使用梯度信息重建原始训练图片的标签;
S3:生成一组符合预设数据集均值与方差正态分布的随机空间向量;其中,预设数据集指与原始真实图片所在数据集相似分布的数据集;
S4:利用StyleGAN XL生成模型对潜在的随机空间向量进行解耦和重组得到虚拟图片;
S5:将S2与S4获得的标签和虚拟图片输入S1中的模型获取虚拟梯度;
S6:根据损失函数计算真实梯度与虚拟梯度之间的损失值;
S7:根据损失值对虚拟图片进行N次迭代优化后获得重建的图像。
S1中获取联邦学习中的模型同时还包括模型的参数,原始真实图片与对应的梯度信息均为一个批量组。
S2中重建原始训练图片的标签,具体的做法是观察模型网络的最后一个全连接层的梯度信息来解析计算。
S4中利用StyleGAN XL生成模型对虚拟图片的潜在空间进行搜索主要有两个步骤。首先将S3中生成的随机空间向量输入StyleGAN XL的子网络Mapping,将随机向量解耦为可以用于控制生成图像的特征向量W。随后将特征向量W输入到StyleGAN XL的子网络Synthesis,将特征向量W进行重组,映射到图像空间。
S6中的损失函数为交叉熵损失函数,完整的图片重建公式可以表述为:
式子中,表示重建的虚拟图片,/>表示使得后面式子取最小值时的/>取值。/>分别表示真实图片与虚拟图片对应的梯度,/>表示交叉熵损失函数。/>, , />分别为正则项的平衡因子。/>为批量正则项,该正则项并不使用真实图片批量中的均值与方差,而是使用其它同分布数据集的均值与方差进行替代,/>为总变差正则项,/>为组正则项。
S7中根据损失值对虚拟图片进行N次迭代优化具体步骤如下:
确定总迭代周期N,优化器Adam,学习率LR;
损失函数计算真实图片与虚拟图片对应的梯度的误差,再加上批量正则项、总变差正则项和组正则项构成总损失值;
将损失值输入优化器对虚拟图片进行迭代更新;
当迭代周期达到设定周期数N时,得到最终重建的原始图片。
如图1所示,本实施例提供的图片重建方法,具体包括:
获取联邦学习中的模型及其原始真实图片对应的参数的真实梯度。本发明中,将获取到的模型记为M,M为一个图片分类模型,真实梯度记为。具体的步骤是首先将真实图片组与对应的标签输入到模型M,模型根据预测标签与真实标签之间的误差计算损失,从而可以计算得到M各层参数的梯度/>
通过梯度信息重建原始训练图片的标签。主要是通过获取到的模型中最后全连接层的梯度信息特征来重建虚拟标签L。
生成一组符合该数据集均值与方差正态分布的随机向量。该随机向量利用数据集的均值与方差进行约束,相比于纯随机向量,能够有益于后续的迭代优化。
利用StyleGAN XL生成模型对潜在空间向量进行搜索得到虚拟图片。这其中主要分为两个步骤。第一步Mapping Network接收一个随机向量作为输入,并将其解耦生成代表图像特征的向量W。这个过程通常由多个全连接层和非线性激活函数组成,其中每个全连接层都将输入向量变换到更高维的向量空间中,而非线性激活函数则有助于增强模型的表达能力。通过Mapping Network,将随机噪声向量转换为具有可控图像特征的特征向量W。第二步Synthesis Network接收一个潜在特征向量W作为输入,依次输入网络的一系列特定的特征层。这些特征层由一系列卷积操作和非线性激活函数组成,其中每一层都对应于不同的空间分辨率和通道数。通过特征层的合成,Synthesis Network可以生成高分辨率的虚拟图片。以上两个步骤无需自行设定,只需要使用StyleGAN XL预训练模型即可。
将重建的虚拟标签L和虚拟图片输入模型M获取虚拟梯度,该步骤虚拟梯度获取方式和步骤100类似,求解公式可以表述为:
根据损失函数计算真实梯度与虚拟梯度之间的损失值,该损失函数为交叉熵损失函数,用以衡量真是梯度于虚拟梯度之间的相似度。整体的重建图片公式可以表述如下:
表示重建的虚拟图片,/>表示使得后面式子取最小值时的/>取值。分别表示真实图片对应的梯度与虚拟图片对应的梯度。/>,/> , />分别为正则项的平衡因子,用于平衡各正则项的数值大小。/>为批量正则项,该正则项并不使用真实图片批量中的均值与方差,而是使用其它同分布数据集的均值与方差进行替代,/>为总变差正则项,/>为组正则项。该三项正则项能够提升重建图片的平顺性和保真性。
根据损失值对虚拟图片进行N次迭代优化后获得重建的图像,该步骤具体实施的过程为:
确定参数,总迭代周期N为5000,这对于绝大部分时候都能够达到收敛;优化器Adam,学习率LR=0.1,同时设置scheduler在训练周期进行到3/8、5/8、7/8时候进行衰减,衰减率gamma=0.1,使得训练前期能以较快学习率迭代,后期缩小学习率,缓解梯度震荡的问题;
根据交叉熵损失函数计算真实图片与虚拟图片对应的梯度之间的误差,再加上批量正则项、总变差正则项和组正则项构成总损失值。批量正则项使用ImageNet数据集的均值与方差,具体数值为mean=(0.485, 0.456, 0.406),std=(0.229, 0.224, 0.225),各个正则项的平衡因子均设置为0.0001。
将损失值输入adam优化器对虚拟图片进行迭代更新;
当迭代周期达到设定周期数N时,得到最终重建的原始图片。
上述的实施例解决了获取信息假设过强的能力。通过重建标签和采用数据集均值方差代替批量信息,无需真实的标签和批量信息辅助。通过在损失函数中加入批量正则化、总变差正则化和组正则化项,能够提升图片的质量,使得重建的虚拟图片与原始真实图片之间的PSNR值达到25.6至33.8之间。引入StyleGAN XL生成模型对虚拟图片的潜在空间进行搜索,能够减少优化图片所需要搜索的空间,重建分辨率128*128像素以上的图片。
此外,对于上述提供的图片重建方法,本实施例还提供了以下实施结构:
如图2所示,一种基于梯度信息的图片重建系统,包括:
模型、梯度获取模块200,用于获取联邦学习中的模型以及真实图片对应的真是梯度;
标签重建模块201,用于基于上个模块获取到的真是梯度的信息,重建标签信息;
虚拟图片生成模块202,用于处理随机向量,对其潜在空间进行搜索,生成虚拟图片;
虚拟梯度获取模块203,用于处理虚拟图片和标签信息,获取虚拟梯度;
损失值计算模块204,用于计算真实梯度和虚拟梯度之间的误差值,并加上正则项值;
迭代优化模块205,用于根据误差值迭代优化虚拟图片,直到设定的周期N,获得最终的重建图片。
如图3所示,本实施例还提供了一种电子设备,该电子设备包括:
存储器301,用于存储计算机程序和数据;所述的计算机程序用于实施所述的图片重建方法;所述的数据为包括模型和图片等计算机程序执行图片重建方法所需的数据。
处理器302,与所述的存储器连接,用于调取并执行所述的计算机程序和处理数据。
以上,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (6)

1.一种基于梯度信息的图片重建方法,其特征在于,包括:
获取联邦学习中的图片分类模型,及其原始真实图片对应的真实梯度信息;
基于所述真实梯度信息和图片分类模型,获取虚拟图片、标签信息和虚拟梯度信息;
获取所述真实梯度信息与所述虚拟梯度信息之间的损失值;
基于所述损失值对虚拟图片进行迭代优化,获取重建的图像;
获取所述虚拟图片包括:
获取符合预设数据集均值与方差正态分布的随机空间向量;
利用预设的StyleGAN XL生成模型,对随机空间向量进行搜索,获取所述虚拟图片;
获取所述虚拟梯度信息包括:
基于所述真实梯度信息,重建原始真实图片的所述标签信息;
将所述标签信息和所述虚拟图片,输入所述图片分类模型,获取虚拟梯度信息;
所述StyleGAN XL生成模型包括:Mapping子网络和Synthesis子网络;
对所述随机空间向量进行搜索包括:
将所述随机空间向量输入所述Mapping子网络,转换为用于控制生成图像的特征向量w;
将所述特征向量w输入所述Synthesis子网络,依次通过网络的预设特征层,对特征向量进行重组,映射到图像空间,生成所述的虚拟图片;
所述预设特征层包括:一系列卷积操作和非线性激活函数,其中所述StyleGAN XL生成模的每一层网络层都对应于不同的空间分辨率和通道数。
2.根据权利要求1所述的基于梯度信息的图片重建方法,其特征在于,获取所述真实梯度信息与所述虚拟梯度信息之间的损失值过程中采用交叉熵损失函数。
3.根据权利要求1所述的基于梯度信息的图片重建方法,其特征在于,所述重建的图像为:
其中,/>表示重建的虚拟图片,/>表示使得后面式子取最小值时的/>取值,/>表示交叉熵损失函数,/>分别表示真实图片对应的梯度与虚拟图片对应的梯度,/>、/>、/>均为正则项的平衡因子,/>为批量正则项,/>为总变差正则项,/>为组正则项。
4.根据权利要求1所述的基于梯度信息的图片重建方法,其特征在于,基于所述损失值对虚拟图片进行迭代优化包括:
设置迭代参数;其中所述参数包括:总迭代周期、优化器Adam和学习率;
将所述损失值和批量正则项、总变差正则项、组正则项构成总损失值;
将所述总损失值,输入优化器对所述虚拟图片进行迭代更新;
当迭代周期达到预设周期数时,获得最终重建的原始图片。
5.一种基于梯度信息的图片重建系统,应用如权利要求1-4任一所述的方法,其特征在于,包括:模型、梯度获取模块、标签重建模块、虚拟图片生成模块、虚拟梯度获取模块、损失值计算模块和迭代优化模块;
所述模型、梯度获取模块,用于获取联邦学习中的图片分类模型,及其原始真实图片对应的参数的真实梯度信息;
所述标签重建模块,用于基于所述真实梯度信息,重建原始训练图片的标签信息;
所述虚拟图片生成模块,用于获取符合预设数据集均值与方差正态分布的随机向量,对所述随机向量的潜在空间向量进行搜索,生成虚拟图片;
所述虚拟梯度获取模块,用于处理所述虚拟图片和标签信息,获取虚拟梯度信息;
所述损失值计算模块,用于计算所述真实梯度信息和虚拟梯度信息质检的误差值,并加上正则项值;
所述迭代优化模块,用于根据所述误差值,迭代优化所述虚拟图片,直到达到预设周期数时,获得最终的重建图片。
6.一种电子设备,应用如权利要求1-4任一所述的方法,其特征在于,包括:
存储器,用于存储计算机程序和数据;所述的计算机程序用于实施所述的图片重建方法;所述的数据为包括模型和图片的计算机程序执行图片重建方法所需的数据;
处理器,与所述的存储器连接,用于调取并执行所述的计算机程序和处理数据。
CN202310960223.1A 2023-08-02 2023-08-02 一种基于梯度信息的图片重建方法、系统及电子设备 Active CN116664456B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310960223.1A CN116664456B (zh) 2023-08-02 2023-08-02 一种基于梯度信息的图片重建方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310960223.1A CN116664456B (zh) 2023-08-02 2023-08-02 一种基于梯度信息的图片重建方法、系统及电子设备

Publications (2)

Publication Number Publication Date
CN116664456A CN116664456A (zh) 2023-08-29
CN116664456B true CN116664456B (zh) 2023-11-17

Family

ID=87713998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310960223.1A Active CN116664456B (zh) 2023-08-02 2023-08-02 一种基于梯度信息的图片重建方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN116664456B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114330514A (zh) * 2021-12-14 2022-04-12 深圳大学 一种基于深度特征与梯度信息的数据重建方法及系统
CN114581992A (zh) * 2022-03-07 2022-06-03 山东大学 一种基于预训练StyleGAN的人脸表情合成方法及系统
CN114627202A (zh) * 2022-03-04 2022-06-14 哈尔滨工业大学(深圳) 一种基于特异性联邦学习的模型训练方法及装置
CN114677312A (zh) * 2022-03-11 2022-06-28 苏州市职业大学 基于深度学习的脸部视频合成方法
CN115908600A (zh) * 2022-09-07 2023-04-04 北京工业大学 基于先验正则化的大批量图像重建方法
WO2023059699A1 (en) * 2021-10-05 2023-04-13 Google Llc Vector-quantized image modeling
CN116416376A (zh) * 2023-03-02 2023-07-11 南京大学 一种三维头发的重建方法、系统、电子设备及存储介质
CN116468114A (zh) * 2023-03-31 2023-07-21 华为技术有限公司 一种联邦学习方法及相关装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023059699A1 (en) * 2021-10-05 2023-04-13 Google Llc Vector-quantized image modeling
CN114330514A (zh) * 2021-12-14 2022-04-12 深圳大学 一种基于深度特征与梯度信息的数据重建方法及系统
CN114627202A (zh) * 2022-03-04 2022-06-14 哈尔滨工业大学(深圳) 一种基于特异性联邦学习的模型训练方法及装置
CN114581992A (zh) * 2022-03-07 2022-06-03 山东大学 一种基于预训练StyleGAN的人脸表情合成方法及系统
CN114677312A (zh) * 2022-03-11 2022-06-28 苏州市职业大学 基于深度学习的脸部视频合成方法
CN115908600A (zh) * 2022-09-07 2023-04-04 北京工业大学 基于先验正则化的大批量图像重建方法
CN116416376A (zh) * 2023-03-02 2023-07-11 南京大学 一种三维头发的重建方法、系统、电子设备及存储介质
CN116468114A (zh) * 2023-03-31 2023-07-21 华为技术有限公司 一种联邦学习方法及相关装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
attention-based modality-gated networks for image-text sentiment analysis;魏凯敏 等;ACM;1-19 *

Also Published As

Publication number Publication date
CN116664456A (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
CN111311685B (zh) 一种基于imu与单目图像的运动场景重构无监督方法
CN111178542B (zh) 基于机器学习建模的系统和方法
Zhao et al. Dd-cyclegan: Unpaired image dehazing via double-discriminator cycle-consistent generative adversarial network
WO2020134826A1 (zh) 磁共振并行成像方法及相关设备
JP7386370B1 (ja) 連合学習に基づくマルチタスクハイブリッド教師あり医用画像分割方法及びシステム
CN111986105A (zh) 基于时域去噪掩码的视频时序一致性增强方法
CN111383742A (zh) 一种医学成像模型的建立方法、装置、设备及存储介质
CN111047512A (zh) 图像增强方法、装置及终端设备
US20230079353A1 (en) Image correction using an invertable network
Zhou et al. A superior image inpainting scheme using Transformer-based self-supervised attention GAN model
Xia et al. Pluralistic image completion with gaussian mixture models
CN111714124B (zh) 磁共振电影成像方法、装置、成像设备及存储介质
CN116664456B (zh) 一种基于梯度信息的图片重建方法、系统及电子设备
CN115115723A (zh) 图像重建模型生成及图像重建方法、装置、设备和介质
US20230162487A1 (en) System and method for deep learning techniques utilizing continuous federated learning with a distributed data generative model
CN116243680A (zh) 一种黑盒域适应的工业设备诊断方法、系统及存储介质
US20230004872A1 (en) System and method for deep learning techniques utilizing continuous federated learning with a distributed data generative model
WO2022193378A1 (zh) 图像重建模型生成方法及装置、图像重建方法及装置、设备、介质
Zhang et al. Distributed compressive sensing via LSTM-Aided sparse Bayesian learning
CN114494484A (zh) 数据识别模型的训练方法、数据识别方法、装置及设备
Shahid et al. Batch renormalization accumulated residual U-network for artifacts removal in photoacoustic imaging
JP2022102319A (ja) ベクトル推定プログラム、ベクトル推定装置、及び、ベクトル推定方法
Lee et al. Unsupervised motion artifact correction of turbo spin‐echo MRI using deep image prior
Niu et al. A Survey on Domain Generalization for Medical Image Analysis
Luo et al. A graph neural network-based digital assessment method for vocational education level of specific regions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant