CN115131214A - 基于自注意力的室内老人图像超分辨率重构方法及系统 - Google Patents
基于自注意力的室内老人图像超分辨率重构方法及系统 Download PDFInfo
- Publication number
- CN115131214A CN115131214A CN202211050463.XA CN202211050463A CN115131214A CN 115131214 A CN115131214 A CN 115131214A CN 202211050463 A CN202211050463 A CN 202211050463A CN 115131214 A CN115131214 A CN 115131214A
- Authority
- CN
- China
- Prior art keywords
- image
- attention
- resolution
- matrix
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000007246 mechanism Effects 0.000 claims abstract description 22
- 239000011159 matrix material Substances 0.000 claims description 102
- 238000012549 training Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 33
- 238000013507 mapping Methods 0.000 claims description 24
- 238000010586 diagram Methods 0.000 claims description 23
- 238000009826 distribution Methods 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 16
- 239000000126 substance Substances 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 230000006798 recombination Effects 0.000 claims description 9
- 238000005215 recombination Methods 0.000 claims description 9
- 230000008447 perception Effects 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 239000012530 fluid Substances 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims description 3
- 238000007634 remodeling Methods 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 230000008707 rearrangement Effects 0.000 claims description 2
- 230000008521 reorganization Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 8
- 230000002159 abnormal effect Effects 0.000 abstract description 4
- 238000004590 computer program Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 229910000831 Steel Inorganic materials 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000474 nursing effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000010959 steel Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000013256 Gubra-Amylin NASH model Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
Abstract
本发明公开了图像处理技术领域的一种基于自注意力的室内老人图像超分辨率重构方法及系统。方法包括:获取室内场景下含有老人的低分辨率图像;将室内场景下含有老人的低分辨率图像输入构建的基于自注意力机制的图像超分辨率重构模型,生成并输出对应的超分辨率图像。本发明通过构建的基于自注意力机制的图像超分辨率重构模型能够捕捉图像远程特征依赖关系,获得纹理细节质量更高的超分辨率图像,为后续居家独居老人异常发现提供基础保障。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种基于自注意力的室内老人图像超分辨率重构方法及系统。
背景技术
根据国新办公布的2021年中国人口数据,60岁以上人口占18.9%,中国正在步入中度老龄化社会,同时,养老看护领域面临的社会需求日益增长。随着人工智能技术不断发展,中国老人日常看护模式,以“医院”为核心逐渐向“医院+家庭”的智慧型模式进行转变。基于视觉技术的智能家用摄像头得到广泛使用,保障居家独居老年人的生命健康和财产安全。然而,监控设备由于硬件型号、焦距,以及图像传输过程中带宽受限、信道噪声等诸多因素影响,产生了大量纹理细节丢失的低分辨率图像帧,尤其不能满足室内独居老人监护中身份识别、跌倒检测等下游任务的需求。为此,需要让低质量图像恢复原有的丰富细节纹理,尽可能重构图像信息。
传统的图像重构方法包括基于插值的最近邻插值法、双线性插值法及双三次插值法,这些传统方法计算简单,且插值过程造成严重伪影。基于重构的图像超分算法分为频域法和空域法。频域法采用递归最小二乘法、离散DCT 变换和小波变换;空域法常用方法包括非均匀采样内插法、基于最大后验概率法等,但无法获取更多纹理细节。
发明内容
为解决现有技术中的不足,本发明提供一种基于自注意力的室内老人图像超分辨率重构方法及系统,能够捕捉图像远程特征依赖关系,获得纹理细节质量更高的超分辨率图像,为后续居家独居老人异常发现提供基础保障。
为达到上述目的,本发明所采用的技术方案是:
第一方面,提供一种基于自注意力的室内老人图像超分辨率重构方法,包括:获取室内场景下含有老人的低分辨率图像;将室内场景下含有老人的低分辨率图像输入构建的基于自注意力机制的图像超分辨率重构模型,生成并输出对应的超分辨率图像。
进一步地,所述基于自注意力机制的图像超分辨率重构模型的构建方法,包括:构建多头自注意力特征编码网络E,用于提取图像远程依赖的特征编码;构建多头自注意力解码器作为GAN网络的生成器G,用于解码生成得到虚假超分辨率图像;构建GAN网络的鉴别器D,用于判别生成图像为真实图像的概率;定义损失函数,将多头自注意力特征编码网络E与生成器G、鉴别器D交替训练,直至鉴别器D无法区分超分辨率图像和真实图像,即纳什平衡。
进一步地,所述多头自注意力特征编码网络E包括嵌入模块,所述嵌入模块用于将低分辨率图像从三维映射到二维矩阵,包括:
进一步地,所述多头自注意力特征编码网络E还包括编码器模块,所述编码器模块包括B个重复堆叠的多头自注意力编码模块,每个多头自注意力编码模块包括:层归一化模块、多头自注意力模块和前馈全连接模块;所述多头自注意力编码模块用于提取输入图像的特征编码,包括:
S1:层归一化模块,按照公式(5)将层归一化模块的输入数据分布转换为标准正态分布:
进一步地,构建多头自注意力解码器作为GAN网络的生成器,具体为:选用基于Transformer的多头自注意力解码器作为生成器G,分阶段逐步提高特征图分辨率,直至达到设定的分辨率,每一阶段包括M个多头自注意力解码模块堆叠结构和一个像素重组上采样模块,具体为:采样noise_dim个先验的标准正态分布随机数向量z,通过多层感知机,将z映射为长度的向量,重塑的尺寸到,与尺寸为的特征编码Z级联,得到尺度为的特征矩阵I;第一阶段,特征矩阵经过M层多头自注意力解码模块,所述多头自注意力解码模块与所述多头自注意力编码模块的结构相同,输出大小为,接着使用像素重组上采样模块,进行尺度因子为2的上采样,得到大小为的输出特征矩阵;与第一阶段操作一致,每一阶段将多头自注意力解码模块的输出特征图分辨率提高2倍,通道数减小到1/4,经过r/2个阶段,最终得到大小为的特征图,其中r为超分比例因子,最后进行线性映射操作,把通道维度映射为3,得到RGB超分辨率图像。
进一步地,所述像素重组上采样模块采用多通道间的补偿重排方式,将低分辨率的特征图在宽、高方向提升分辨率,减少通道数;具体包括:
进一步地,所述鉴别器D,包括一个包含普通卷积和Leaky ReLU激活函数的第一卷积层,七个包含普通卷积、BN层和Leaky ReLU激活函数的第二卷积层,一个自适应平均池化层,两个全连接层,一个Sigmoid归一化层;所述鉴别器输出0~1之间的值,表示输入图像为真实图像的概率;Leaky ReLU激活函数如公式(13)所示;
进一步地,基于自注意力机制的图像超分辨率重构模型的训练方法,包括:收集高分辨率的室内场景下含有老人的图像,构建数据集并分为训练集和测试集;分别对训练集和测试集内的高分辨率图像进行预处理及降采样操作,得到与高分辨率图像对应的低分辨率图像;使用训练集对基于自注意力机制的图像超分辨率重构模型进行训练,包括:制定网络训练方式,多头自注意力特征编码网络E、生成器G与鉴别器D按照各自的损失函数进行交替训练,先固定多头自注意力特征编码网络E、生成器G的网络参数,训练优化k次鉴别器D,再固定鉴别器D的网络参数,训练优化1次多头自注意力特征编码网络E、生成器G,如此反复交替进行训练,通过零和博弈解决极大极小值问题,直至网络达到纳什平衡,即生成器G生成的超分辨率图像分布接近于真实图像,鉴别器D无法判别出真假;使用测试集对训练好的基于自注意力机制的编-解码器进行测试,将测试集中的低分辨率图像输入训练好的基于自注意力机制的图像超分辨率重构模型,获得对应的超分辨率图像。
第二方面,提供一种基于自注意力的室内老人图像超分辨率重构系统,包括:图像采集模块,用于获取室内场景下含有老人的低分辨率图像;图像重构模块,用于将室内场景下含有老人的低分辨率图像输入构建的基于自注意力机制的图像超分辨率重构模型,生成并输出对应的超分辨率图像。
与现有技术相比,本发明所达到的有益效果:本发明通过将室内场景下含有老人的低分辨率图像输入构建的基于自注意力机制的编-解码器,生成并输出对应的超分辨率图像,能够捕捉图像远程特征依赖关系,从而获得纹理细节质量更高的超分辨率图像,为后续居家独居老人异常发现提供基础保障。
附图说明
图1是本发明实施例中SRTGAN超分辨率重建的流程示意图;
图2是本发明实施例中SRTGAN超分辨率重建网络结构示意图;
图3是本发明实施例中多头自注意力特征提取网络结构示意图;
图4是本发明实施例中生成器G的网络结构示意图;
图5是本发明实施例中像素重组上采样模块的结构示意图;
图6是本发明实施例中判别器D的网络结构示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例一:
一种基于自注意力的室内老人图像超分辨率重构方法,包括:获取室内复杂场景下含有老人的低分辨率图像;将室内场景下含有老人的低分辨率图像输入构建的基于自注意力机制的图像超分辨率重构模型,生成并输出对应的超分辨率图像。
本发明的主要步骤如下:
构建数据集,包括:
(1)收集制作高分辨率的室内场景下含老人的数据集,分为训练集和测试集;
构建基于自注意力机制的图像超分辨率重构模型并训练,包括:
(3)构建多头自注意力特征编码网络E,提取图像远程依赖的特征编码Z;
(5)定义损失函数,将多头自注意力特征编码网络E与多头自注意力解码器(生成器G)一起,和鉴别器交替训练,直至鉴别器无法区分超分辨率图像和真实图像,即纳什平衡;
(6)测试阶段,将测试集中低分辨率图像输入训练好的基于自注意力机制的图像超分辨率重构模型,生成最终超分辨率图像。
步骤1:收集制作高分辨率的室内场景下含有老人的数据集,分为训练集和测试集。
采用网站提取真实室内含有老人的高清图像、摄像机拍摄室内场景、影视剧室内场景抓取等方式,构建有500张高分辨率(尺寸至少1000×1000)的室内含老人的图像数据集,通过调整亮度、调整对比度、图像随机方向旋转等方式,将数据集进行扩充到4000张,分为80%的训练集(图像编号0001~3200)和20%的测试集(图像编号3201~4000)。
对数据集的每一张图像以左上角为原点,按照公式(1)(2)进行裁剪,得到大小为的高分辨率图像集合,其中r是超分比例因子,是通道数,、是的宽和高,对使用r的降采样因子进行Bicubic降采样操作,得到的低分辨率图像集合;
步骤3:多头自注意力特征编码网络,用于提取图像远程依赖的特征编码。
步骤3.1.1:将的输入图像均匀切割成N个Patches,H为输入图像的高,W为输入图像的宽,N为Patch的个数,其中C为图像通道数每个Patch的宽高均为patch_ size,如公式(3)所示;
步骤3.2:如图3所示,编码器模块由B个重复堆叠的多头自注意力编码模块构成,每个多头自注意力编码模块的组成为:层归一化模块、多头注意力模块和前馈全连接模块,编码器模块提取输入图像的特征编码Z。
步骤3.2.1:层归一化模块,按照公式(5)将此模块的输入数据x分布转换为标准正态分布,使得输入数据的分布相对稳定,减少梯度消失的问题。
步骤3.2.2:多头自注意力编码模块,设头数为n ,将多头自注意力编码模块的输入二维矩阵X,分别与n路初始值相同的可学习线性映射矩阵、、相乘,,并行计算得到查询矩阵、关键词矩阵和价值矩阵,如公式(6)~(8)所示:
步骤4:构建GAN网络。
步骤4.1:构建GAN的生成器G,选用基于Transformer的多头自注意力解码器,如图4所示,分段逐步提高特征图的分辨率,直到达到目标分辨率,每一阶段由M个多头自注意解码模块堆叠结构和一个像素重组上采样模块构成。
步骤4.1.1:如图2所示,采样noise_dim个先验的标准正态分布随机数z,通过多层感知机(MLP),将z映射为长度的向量,重塑(reshape)的尺寸到,与尺寸为的特征编码Z级联,得到尺度为的特征矩阵I。
步骤4.1.2:第一阶段,该特征矩阵经过M层多头自注意解码模块,输出大小为,接着使用如图5所示的像素重组上采样模块,进行尺度因子为2的上采样,将大小重塑到大小的特征图,每4个通道对应位置像素按照各自可学习的通道权重优先级进行重组,使得1个像素扩充到2×2个像素,同时每4个通道变为1个通道,得到尺寸为,最后将输出特征图大小从重塑得到大小为的输出特征矩阵。
步骤4.1.3:与第一阶段操作一致,每一阶段将多头自注意解码模块的输出特征图分辨率提高2倍,通道数减小到1/4,经过r/2个阶段,最终得到大小的特征图,最后把通道维度线性映射为3,得到RGB超分辨率图像。
步骤4.2:构建GAN的判别器D。
判别器D的构成如图6所示,包括1个包含普通卷积和Leaky ReLU激活函数的卷积层,7个同样包含普通卷积、BN层和Leaky ReLU激活函数的卷积层,1个自适应平均池化层,2个全连接层,1个Sigmoid归一化层,输出0-1之间的值,表示输入图像为真实图像的概率;Leaky ReLU激活函数如公式(13)所示,其非零斜率设为0.01:
步骤5:制定网络的训练方式。
步骤5.1:进行模型迭代训练,迭代次数为epoch = 200,构建优化器,使用Adam作为梯度下降策略;每一个epoch分批次处理训练数据集图像,每一批处理batch_size = 16个图像,更新网络参数,直至所有批次图像处理完成。
D与编-解码网络(E, G)按照各自的损失函数,先固定(E, G)网络参数,训练优化1次判别器D,再固定鉴别器D的网络参数,训练优化1次(E, G),如此反复交替进行训练,通过零和博弈解决极大极小值问题,直至网络达到纳什均衡。即G生成的超分辨率图像分布接近于真实图像,D无法判别出真假, GAN模型为:
步骤5.2:定义网络训练的损失函数。
最小化MSE,则图像像素间的差值越小,图像重构质量越高,MSE损失函数如公式(16)所示;
由于MSE总是在像素点上取平均,所以生成的超分辨率图像纹理过于平滑;本发明基于预训练的VGG-19网络的高层特征映射的内容感知损失,如公式(17)所示,将损失函数转换到特征空间中,是更接近感知相似性的损失函数,其中表示VGG-19网络中第i个最大池化层之前通过第j个卷积层的特征映射,、表示该特征图的宽和高,逐像素计算和特征映射后两者的欧氏距离:
对抗损失如公式(18)所示,目的是将判别器D的输出的判别概率p馈送到生成器G中,促使G进一步生成欺骗判别器的图像;
步骤5.2.2:定义判别器D的损失函数。
步骤6:将测试集中低分辨率图像输入训练好的基于自注意力机制的图像超分辨率重构模型,生成最终超分辨率图像。
本发明针对室内含有老人的场景下,将Transformer编-解码器和GAN相结合,捕捉图像远程特征依赖关系,构建纹理细节恢复质量更高的图像超分网络,获得纹理细节质量更高的超分辨率图像,为后续居家独居老人异常发现提供基础保障。
实施例二:
基于实施例一所述的基于自注意力的室内老人图像超分辨率重构方法,本实施例提供一种基于自注意力的室内老人图像超分辨率重构系统,包括:
图像采集模块,用于获取室内场景下含有老人的低分辨率图像;
图像重构模块,用于将室内场景下含有老人的低分辨率图像输入构建的基于自注意力机制的图像超分辨率重构模型,生成并输出对应的超分辨率图像。
本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (8)
1.一种基于自注意力的室内老人图像超分辨率重构方法,其特征是,包括:
获取室内场景下含有老人的低分辨率图像;
将室内场景下含有老人的低分辨率图像输入构建的基于自注意力机制的图像超分辨率重构模型,生成并输出对应的超分辨率图像;
其中,所述基于自注意力机制的图像超分辨率重构模型的构建方法,包括:
构建多头自注意力特征编码网络E,用于提取图像远程依赖的特征编码;
构建多头自注意力解码器作为GAN网络的生成器G,用于解码生成得到虚假超分辨率图像;
构建GAN网络的鉴别器D,用于判别生成图像为真实图像的概率;
定义损失函数,将多头自注意力特征编码网络E与生成器G、鉴别器D交替训练,直至鉴别器D无法区分超分辨率图像和真实图像,即纳什平衡;
所述多头自注意力特征编码网络E包括嵌入模块,所述嵌入模块用于将低分辨率图像从三维映射到二维矩阵,包括:
2.根据权利要求1所述的基于自注意力的室内老人图像超分辨率重构方法,其特征是,所述多头自注意力特征编码网络E还包括编码器模块,所述编码器模块包括B个重复堆叠的多头自注意力编码模块,每个多头自注意力编码模块包括:层归一化模块、多头自注意力模块和前馈全连接模块;所述多头自注意力编码模块用于提取输入图像的特征编码,包括:
S1:层归一化模块,按照公式(5)将层归一化模块的输入数据分布转换为标准正态分布:
3.根据权利要求2所述的基于自注意力的室内老人图像超分辨率重构方法,其特征是,构建多头自注意力解码器作为GAN网络的生成器,具体为:
选用基于Transformer的多头自注意力解码器作为生成器G,分阶段逐步提高特征图分辨率,直至达到设定的分辨率,每一阶段包括M个多头自注意力解码模块堆叠结构和一个像素重组上采样模块,具体为:
第一阶段,特征矩阵经过M层多头自注意力解码模块,所述多头自注意力解码模块与所述多头自注意力编码模块的结构相同,输出大小为,接着使用像素重组上采样模块,进行尺度因子为2的上采样,得到大小为的输出特征矩阵;
6.根据权利要求5所述的基于自注意力的室内老人图像超分辨率重构方法,其特征是,基于自注意力机制的图像超分辨率重构模型的训练方法,包括:
收集高分辨率的室内场景下含有老人的图像,构建数据集并分为训练集和测试集;
分别对训练集和测试集内的高分辨率图像进行预处理及降采样操作,得到与高分辨率图像对应的低分辨率图像;
使用训练集对基于自注意力机制的图像超分辨率重构模型进行训练,包括:制定网络训练方式,多头自注意力特征编码网络E、生成器G与鉴别器D按照各自的损失函数进行交替训练,先固定多头自注意力特征编码网络E、生成器G的网络参数,训练优化k次鉴别器D,再固定鉴别器D的网络参数,训练优化1次多头自注意力特征编码网络E、生成器G,如此反复交替进行训练,通过零和博弈解决极大极小值问题,直至网络达到纳什平衡,即生成器G生成的超分辨率图像分布接近于真实图像,鉴别器D无法判别出真假;
使用测试集对训练好的基于自注意力机制的编-解码器进行测试,将测试集中的低分辨率图像输入训练好的基于自注意力机制的图像超分辨率重构模型,获得对应的超分辨率图像。
8.一种基于自注意力的室内老人图像超分辨率重构系统,其特征是,包括:
图像采集模块,用于获取室内场景下含有老人的低分辨率图像;
图像重构模块,用于将室内场景下含有老人的低分辨率图像输入构建的基于自注意力机制的图像超分辨率重构模型,生成并输出对应的超分辨率图像;
其中,所述基于自注意力机制的图像超分辨率重构模型的构建方法,包括:
构建多头自注意力特征编码网络E,用于提取图像远程依赖的特征编码;
构建多头自注意力解码器作为GAN网络的生成器G,用于解码生成得到虚假超分辨率图像;
构建GAN网络的鉴别器D,用于判别生成图像为真实图像的概率;
定义损失函数,将多头自注意力特征编码网络E与生成器G、鉴别器D交替训练,直至鉴别器D无法区分超分辨率图像和真实图像,即纳什平衡;
所述多头自注意力特征编码网络E包括嵌入模块,所述嵌入模块用于将低分辨率图像从三维映射到二维矩阵,包括:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211050463.XA CN115131214B (zh) | 2022-08-31 | 2022-08-31 | 基于自注意力的室内老人图像超分辨率重构方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211050463.XA CN115131214B (zh) | 2022-08-31 | 2022-08-31 | 基于自注意力的室内老人图像超分辨率重构方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115131214A true CN115131214A (zh) | 2022-09-30 |
CN115131214B CN115131214B (zh) | 2022-11-29 |
Family
ID=83387334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211050463.XA Active CN115131214B (zh) | 2022-08-31 | 2022-08-31 | 基于自注意力的室内老人图像超分辨率重构方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115131214B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309924A (zh) * | 2023-05-25 | 2023-06-23 | 之江实验室 | 一种模型训练的方法、图像展示的方法及装置 |
CN116402679A (zh) * | 2022-12-28 | 2023-07-07 | 长春理工大学 | 一种轻量级红外超分辨率自适应重建方法 |
CN117062002A (zh) * | 2023-08-01 | 2023-11-14 | 哈尔滨工程大学 | 一种基于轻量级transformer的5g nr室内定位方法及系统 |
CN117078510A (zh) * | 2022-11-16 | 2023-11-17 | 电子科技大学 | 一种潜在特征的单幅图像超分辨重建方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111192200A (zh) * | 2020-01-02 | 2020-05-22 | 南京邮电大学 | 基于融合注意力机制残差网络的图像超分辨率重建方法 |
US20200357096A1 (en) * | 2018-01-25 | 2020-11-12 | King Abdullah University Of Science And Technology | Deep-learning based structure reconstruction method and apparatus |
CN114943646A (zh) * | 2022-06-07 | 2022-08-26 | 山东师范大学 | 基于纹理导向的梯度权重损失和注意力机制超分辨方法 |
-
2022
- 2022-08-31 CN CN202211050463.XA patent/CN115131214B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200357096A1 (en) * | 2018-01-25 | 2020-11-12 | King Abdullah University Of Science And Technology | Deep-learning based structure reconstruction method and apparatus |
CN111192200A (zh) * | 2020-01-02 | 2020-05-22 | 南京邮电大学 | 基于融合注意力机制残差网络的图像超分辨率重建方法 |
CN114943646A (zh) * | 2022-06-07 | 2022-08-26 | 山东师范大学 | 基于纹理导向的梯度权重损失和注意力机制超分辨方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117078510A (zh) * | 2022-11-16 | 2023-11-17 | 电子科技大学 | 一种潜在特征的单幅图像超分辨重建方法 |
CN117078510B (zh) * | 2022-11-16 | 2024-04-30 | 电子科技大学 | 一种潜在特征的单幅图像超分辨重建方法 |
CN116402679A (zh) * | 2022-12-28 | 2023-07-07 | 长春理工大学 | 一种轻量级红外超分辨率自适应重建方法 |
CN116402679B (zh) * | 2022-12-28 | 2024-05-28 | 长春理工大学 | 一种轻量级红外超分辨率自适应重建方法 |
CN116309924A (zh) * | 2023-05-25 | 2023-06-23 | 之江实验室 | 一种模型训练的方法、图像展示的方法及装置 |
CN116309924B (zh) * | 2023-05-25 | 2023-08-18 | 之江实验室 | 一种模型训练的方法、图像展示的方法及装置 |
CN117062002A (zh) * | 2023-08-01 | 2023-11-14 | 哈尔滨工程大学 | 一种基于轻量级transformer的5g nr室内定位方法及系统 |
CN117062002B (zh) * | 2023-08-01 | 2024-04-30 | 哈尔滨工程大学 | 一种基于轻量级transformer的5g nr室内定位方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115131214B (zh) | 2022-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115131214B (zh) | 基于自注意力的室内老人图像超分辨率重构方法及系统 | |
CN111798400B (zh) | 基于生成对抗网络的无参考低光照图像增强方法及系统 | |
CN112750082B (zh) | 基于融合注意力机制的人脸超分辨率方法及系统 | |
CN111915484A (zh) | 基于密集匹配与自适应融合的参考图引导超分辨率方法 | |
CN109949217B (zh) | 基于残差学习和隐式运动补偿的视频超分辨率重建方法 | |
CN115484410B (zh) | 基于深度学习的事件相机视频重建方法 | |
CN115131675A (zh) | 一种基于参考影像纹理迁移的遥感影像压缩方法及系统 | |
CN115578262A (zh) | 基于afan模型的偏振图像超分辨率重建方法 | |
CN115222998A (zh) | 一种图像分类方法 | |
CN116091916A (zh) | 一种多尺度从rgb图像重建对应的高光谱图像算法及系统 | |
CN117593187A (zh) | 基于元学习和Transformer的遥感图像任意尺度超分辨率重建方法 | |
TW202409963A (zh) | 生成高分辨率圖像的方法、裝置及計算機可讀介質 | |
CN115439849B (zh) | 基于动态多策略gan网络的仪表数字识别方法及系统 | |
Jeevan et al. | WaveMixSR: Resource-efficient neural network for image super-resolution | |
CN116137043A (zh) | 一种基于卷积和Transformer的红外图像彩色化方法 | |
CN113838104B (zh) | 基于多光谱与多模态图像一致性增强网络的配准方法 | |
CN116128722A (zh) | 基于频域-纹理特征融合的图像超分辨率重建方法及系统 | |
CN115100599A (zh) | 基于掩码transformer的半监督人群场景异常检测方法 | |
CN114782995A (zh) | 一种基于自注意力机制的人交互行为检测方法 | |
CN112634126A (zh) | 人像减龄处理方法、训练方法、装置、设备及存储介质 | |
Wen et al. | Mrft: Multiscale recurrent fusion transformer based prior knowledge for bit-depth enhancement | |
TWI836972B (zh) | 水下影像增強方法及使用該方法的影像處理系統 | |
CN113298075B (zh) | 一种基于注意力机制的启发式图像尺度归一化方法 | |
TWI771250B (zh) | 用於降低資料維度的裝置及方法、用於轉換資料維度的裝置的操作方法 | |
CN118052712A (zh) | 一种基于多阶段空频联合的遥感图像超分辨率重建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |