CN114819109A - 双目图像的超分辨率处理方法、装置、设备及介质 - Google Patents
双目图像的超分辨率处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114819109A CN114819109A CN202210712157.1A CN202210712157A CN114819109A CN 114819109 A CN114819109 A CN 114819109A CN 202210712157 A CN202210712157 A CN 202210712157A CN 114819109 A CN114819109 A CN 114819109A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- hierarchy
- resolution
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 245
- 238000000034 method Methods 0.000 claims abstract description 91
- 230000004927 fusion Effects 0.000 claims abstract description 79
- 238000000605 extraction Methods 0.000 claims abstract description 58
- 238000007499 fusion processing Methods 0.000 claims abstract description 49
- 238000003062 neural network model Methods 0.000 claims description 57
- 238000012952 Resampling Methods 0.000 claims description 38
- 238000005070 sampling Methods 0.000 claims description 37
- 238000012549 training Methods 0.000 claims description 32
- 238000010606 normalization Methods 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 27
- 238000010586 diagram Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 23
- 230000004913 activation Effects 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 10
- 230000017105 transposition Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 description 43
- 230000002457 bidirectional effect Effects 0.000 description 16
- 230000003993 interaction Effects 0.000 description 10
- 230000007423 decrease Effects 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 239000002253 acid Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010030 laminating Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种双目图像的超分辨率处理方法、装置、设备及介质;其中,方法包括:按照尺度逐层减小的第一层次顺序,基于第一分辨率的双目图像进行级联的多个层次的特征提取处理,得到多个层次特征;按照尺度逐层增加的第二层次顺序,执行以下处理:基于层次对应的层次特征进行特征融合处理,得到层次对应的特征偏移,以及基于层次对应的特征偏移进行特征对齐处理,得到层次对应的对齐特征;基于最大尺度的层次对应的对齐特征进行注意力融合处理,得到双目图像的融合图像特征;基于融合图像特征进行特征重建处理,得到第二分辨率的双目图像;第二分辨率大于第一分辨率。通过本申请能够基于不同低分辨率的图像生成质量稳定的高分辨率图像。
Description
技术领域
本申请涉及人工智能技术,尤其涉及一种双目图像的超分辨率处理方法、装置、设备及介质。
背景技术
人工智能(Artificial Intelligence,AI)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
随着人工智能的飞速发展,人工智能在图像处理领域的应用日渐增多。相关技术中,基于人工智能的双目图像的超分辨率处理方法,通常是针对单一尺度下的低分辨率左右视图的视差进行匹配融合,从而得到高分辨率图像,申请人发现,由于不同尺度下的低分辨率左右视图的视差的不一致性,导致相关技术基于不同低分辨率的图像进行超分辨率处理时,所生成的高分辨率图像的质量不稳定。
发明内容
本申请实施例提供一种双目视图的超分辨率处理方法、装置、电子设备及计算机可读存储介质,能够基于不同低分辨率的图像生成质量稳定的高分辨率图像。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种双目图像的超分辨率处理方法,包括:
按照尺度逐层减小的第一层次顺序,基于第一分辨率的双目图像进行级联的多个层次的特征提取处理,得到所述尺度逐层减小的多个层次特征;
按照所述尺度逐层增加的第二层次顺序,依次在每个所述层次执行以下处理:基于所述层次对应的所述层次特征进行特征融合处理,得到所述层次对应的特征偏移,以及
基于所述层次对应的所述特征偏移进行特征对齐处理,得到所述层次对应的对齐特征;
基于最大尺度的所述层次对应的所述对齐特征进行注意力融合处理,得到所述双目图像的融合图像特征;
基于所述融合图像特征进行特征重建处理,得到第二分辨率的双目图像;其中,所述第二分辨率大于所述第一分辨率。
本申请实施例提供一种双目图像的超分辨率处理装置,包括:
特征提取处理模块,用于按照尺度逐层减小的第一层次顺序,基于第一分辨率的双目图像进行级联的多个层次的特征提取处理,得到所述尺度逐层减小的多个层次特征;
特征融合处理模块,用于按照所述尺度逐层增加的第二层次顺序,依次在每个所述层次执行以下处理:基于所述层次对应的所述层次特征进行特征融合处理,得到所述层次对应的特征偏移;
特征对齐处理模块,用于基于所述层次对应的所述特征偏移进行特征对齐处理,得到所述层次对应的对齐特征;
注意力融合处理模块,用于基于最大尺度的所述层次对应的所述对齐特征进行注意力融合处理,得到所述双目图像的融合图像特征;
特征重建处理模块,用于基于所述融合图像特征进行特征重建处理,得到第二分辨率的双目图像;其中,所述第二分辨率大于所述第一分辨率。
本申请实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的双目图像的超分辨率处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,所述可执行指令用于被处理器执行时,实现本申请实施例提供的双目图像的超分辨率处理方法。
本申请实施例具有以下有益效果:
通过在不同尺度下对低分辨率的双目图像的层次特征进行融合以及特征对齐,从而能够逐步消除不同尺度下的双目图像的左右视图之间的视差,借助注意力机制来融合对齐特征,由于注意力机制能够实现左右视图之间跨视图的信息交互,因而使得得到的融合图像特征能够充分融合来自另一视图的信息,并能够充分学习左右视图在全局范围内的对应关系,从而基于融合图像特征进行特征重建处理,能够得到质量较高且稳定的高分辨率的双目图像。
附图说明
图1是本申请实施例提供的双目图像的超分辨处理系统100的架构示意图;
图2是本申请实施例提供的电子设备的结构示意图;
图3A是本申请实施例提供的神经网络模型的训练过程的流程示意图;
图3B是本申请实施例提供的双目图像的超分辨率处理方法中步骤101-105的流程示意图;
图3C是本申请实施例提供的双目图像的超分辨率处理方法中步骤1011-1012的流程示意图;
图3D是本申请实施例提供的双目图像的超分辨率处理方法中步骤1021A和步骤1021B-1023B的流程示意图;
图3E是本申请实施例提供的双目图像的超分辨率处理方法中步骤1031A和步骤1031B的流程示意图;
图3F是本申请实施例提供的双目图像的超分辨率处理方法中步骤10311A和步骤10312A-10314A的流程示意图;
图3G是本申请实施例提供的双目图像的超分辨率处理方法中步骤10311B和步骤10312B-10314B的流程示意图;
图3H是本申请实施例提供的双目图像的超分辨率处理方法中步骤1041-1044的流程示意图;
图4A是本申请实施例提供的神经网络模型的结构示意图;
图4B是本申请实施例提供的双向金字塔对齐模块的结构示意图;
图5是本申请实施例提供的神经网络模型的原理示意图;
图6A是本申请实施例提供的双向金字塔对齐模块的原理示意图;
图6B是本申请实施例提供的双向视差注意力模块的原理示意图;
图7是本申请实施例提供的神经网络模型的训练以及应用过程的流程示意图;
图8是本申请实施例提供的神经网络模型的处理结果与其他模型的处理结果的对比示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
可以理解的是,在本申请实施例中,涉及到用户信息等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)双目立体图像:即双目图像,通过两个相机同时同步对同一场景进行采集,获取左右两个相机对一个场景的成像图,这些成像图称之为左视图和右视图。
2)可变形卷积(Deformable Convolutional Network):指二维卷积核在每一个元素上额外增加了方向参数,这样同一个卷积核能在训练过程中扩展到很大的范围。
3)亚像素:面阵摄像机的成像面以像素为最小单位。摄像机拍摄时,将物理世界中连续的图像进行了离散化处理,像素之间存在5.2微米的距离。在宏观上可以看作像素是连在一起的,但是在微观上,像素之间还有无限的更小的东西存在。这个更小的东西称之为“亚像素”。
4)残差密集模块:为密集残差超分辨网络(Residual Dense Network for ImageSuper-Resolution,RDN)中的骨干网络模型,RDN除了包含残差密集模块之外,还包含隐藏特征提取网络、密集特征融合网络、上采样网络。
5)双线性插值:即,双线性内插,在数学上,双线性插值是有两个变量的插值函数的线性插值扩展,其核心思想是在两个方向分别进行一次线性插值。
6)双三次插值(Bicubic):是一种线性插值方法,某一点的值可以通过以该点为中心的矩形网格中最近的十六个采样点的加权平均得到。
7)峰值信噪比(Peak Signal to Noise Ratio,PSNR):是一个度量信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的图像质量指标。
8)结构相似性(Structural Similarity,SSIM):是一种衡量两幅图像相似度的指标。用于计算SSIM的两张图像中,一张为未经压缩的无失真图像,另一张为失真后的图像。SSIM的取值范围为[-1,1]。当两张图像一模一样时,SSIM的值等于1。
9)尺度,即空间维度,由图像特征的高度(例如用高度方向的像素数量表示)和宽度(例如用宽度方向的像素数量表示)决定,图像特征的高度和宽度越大,则尺度越大;图像特征的高度和宽度越小,则尺度越小。
申请人发现,相关技术中,在第一种双目图像的超分辨率处理方式中,主要是通过双向视差注意力模块来实现左右视图的信息交互,进而提升高分辨率的图片的质量。然而,这种方式是针对单一尺度下的左右视图的遮挡区域计算视差注意力图,未考虑不同尺度下左右视图的特征表征的差异性,导致生成的高分辨率图像的质量不稳定。
在相关技术的第二种双目图像的超分辨率处理方式中,主要是通过计算左右视图的视差注意力,将对应的视差注意力分别与左右视图的特征向量融合,从而学习左右视图的全局范围内的对应关系。然而,这种方式只计算了单一映射方向的视差注意力(即,从左视图到右视图),并未考虑左右视图的不一致性;此外,这种方式针对的是单一尺度下的左右视图的视差注意力图,未考虑不同尺度下左右视图的特征表征的差异性,导致生成的高分辨率图像的质量不稳定。
在相关技术的第三种双目图像的超分辨率处理方式中,主要通过提取尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)特征,对左右灰度图进行位置匹配,然后利用拉普拉斯算子对两个图片进行超分辨率融合。然而,这种方式的计算复杂较大,通用性较差,在实际应用场景中的易用性较差;此外,这种方式未考虑低分辨率图像与高分辨率图像的左右视图的映射关系是否一致的问题,从而无法保证高分辨率的双目图像不改变原始双目图像的映射关系。
本申请实施例提供一种双目图像的超分辨率处理方法、装置、电子设备以及计算机可读存储介质,能够基于不同低分辨率的图像生成质量稳定的高分辨率图像。
下面说明本申请实施例提供的用于进行双目图像的超分辨率处理的电子设备的示例性应用,本申请实施例提供的进行双目图像的超分辨率处理的电子设备可以实施为终端,也可以实施为服务器。下面,将说明电子设备实施为服务器时的示例性应用。
本申请实施例提供的双目图像的超分辨率处理方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行,参见图1,图1是本申请实施例提供的双目图像的超分辨率处理系统100的架构示意图,包括服务器200、终端400。终端400通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
在一些实施例中,用户通过操作终端400的人机交互界面,选择低分辨率的双目图像,终端400通过网络300将用户选中的低分辨率的双目图像上传至服务器200,服务器200根据终端400上传的低分辨率的双目图像,对低分辨率的双目图像进行超分辨率处理,得到高分辨率的双目图像。接着,服务器200通过网络300,将低分辨率的双目图像对应的高分辨率的双目图像返回给终端400,终端400可以在人机交互界面显示高分辨率的双目图像,以供用户使用或保存。
在另一些实施例中,用户通过操作终端400的人机交互界面,选择低分辨率的双目视频,终端400通过网络300将用户选中的低分辨率的双目视频上传至服务器200,服务器200根据终端400上传的低分辨率的双目视频,按照双目视频的视频帧的时间轴,对低分辨率的双目视频中的每一帧对应的双目图像进行超分辨率处理,得到高分辨率的双目图像,然后,服务器对得到的高分辨率的双目图像按照视频帧的时间轴进行组合,得到高分辨率的双目视频。最后,服务器200通过网络300,将低分辨率的双目视频对应的高分辨率的双目视频返回给终端400,终端400可以在人机交互界面显示高分辨率的双目视频,以供用户播放或保存。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能电视、车载终端等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
下面,参见图2,图2是本申请实施例提供的电子设备的结构示意图,该电子设备可以是终端或服务器,在本申请实施例中,以该电子设备是服务器为例进行说明。图2所示的电子设备包括:至少一个处理器210、存储器230、至少一个网络接口220。服务器200中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
存储器230可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器230可选地包括在物理位置上远离处理器 210的一个或多个存储设备。
存储器230包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器230旨在包括任意适合类型的存储器。
在一些实施例中,存储器230能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统231,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。
网络通信模块232,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等。
在一些实施例中,本申请实施例提供的双目图像的超分辨率处理装置可以采用软件方式实现,图2示出了存储在存储器230中的双目图像的超分辨率处理装置233,其可以是程序和插件等形式的软件,包括以下软件模块:特征提取处理模块2331、特征融合处理模块2332、特征对齐处理模块2333、注意力融合处理模块2334和特征重建处理模块2334,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。
下面将结合本申请实施例提供的电子设备的示例性应用和实施,说明本申请实施例提供的双目图像的超分辨率处理方法。可以理解地,下述的方法可以由上文所述的终端或服务器单独执行或协同执行。
在说明本申请实施例提供的双目图像的超分辨率处理方法之前,首先说明本申请实施例涉及的用于进行超分辨率处理的神经网络模型的结构。作为示例,参见图4A,图4A是本申请实施例提供的神经网络模型的结构示意图,神经网络模型包括特征提取模块、双向金字塔对齐模块、双向视差注意力模块以及特征重建模块四个部分。在使用神经网络模型进行超分辨率处理之前,需要先对神经网络模型进行训练,下面将结合附图说明神经网络模型的训练方法。
参见图3A,图3A是本申请实施例提供的神经网络模型的训练过程的流程示意图,将结合图3A示出的步骤201-步骤204进行说明。该训练过程可以由终端或服务器单独执行,也可以由终端和服务器协同执行,下面将以该训练过程由服务器执行为例进行说明。
在步骤201中,确定第一分辨率的第一样本双目图像、以及第二分辨率的第一真实双目图像。
作为示例,通过以下方式确定第一分辨率的第一样本双目图像、以及第二分辨率的第一真实双目图像:获取多个第二分辨率的第二样本双目图像;其中,每个第二样本双目图像包括一个第二样本左视图和一个第二样本右视图;对每个第二分辨率的第二样本双目图像进行下采样处理,得到第一分辨率的第二样本双目图像;对第一分辨率的第二样本双目图像、以及第二分辨率的第二样本双目图像进行裁剪处理,分别得到第一分辨率的第二样本双目图像块、以及第二分辨率的第二样本双目图像块;将第一分辨率的第二样本双目图像块确定为第一分辨率的第一样本双目图像,并将第二分辨率的第二样本双目图像块确定为第二分辨率的第一真实双目图像。
作为示例,为了得到用于训练初始化的神经网络模型的训练数据以及标签数据,首先,获取多个第二分辨率的第二样本双目图像,其中,每个第二样本双目图像中包括一个第二样本左视图和一个第二样本右视图。
其次,对每个第二分辨率的第二样本双目图像进行下采样处理(即,降采样处理),例如,采用双三次插值法实现下采样处理,双三次插值法利用待采样点周围16个点的灰度值作三次插值,不仅考虑到待采样点周围4个直接相邻点的灰度影响,而且考虑到各相邻点间灰度值的变化率的影响,进行下采样处理后,得到第一分辨率的第二样本双目图像。
最后,随机对第一分辨率的第二样本双目图像、以及第二分辨率的第二样本双目图像进行裁剪处理,将得到第一分辨率的第二样本双目图像块,作为第一分辨率的第一样本双目图像,即,训练数据;并将得到的第二分辨率的第二样本双目图像块,作为第二分辨率的第一真实双目图像,即,训练数据对应的标签数据。其中,针对同一场景的第二样本左右视图的分辨率是相同的,针对不同场景的第二样本左右视图的分辨率可能不同。这里进行随机裁剪处理,得到的第二样本左右视图的图像块的分辨率是一样的。
通过上述方式,可以快速获得有效、准确的训练数据和标签数据,便于基于准确的训练数据和标签数据,提高训练得到的神经网络模型的精度。
在步骤202中,基于第一分辨率的第一样本双目图像,调用初始化的神经网络模型进行超分辨率处理,得到第二分辨率的第一预测双目图像。
作为示例,基于第一分辨率的第一样本双目图像,调用初始化的神经网络模型进行超分辨率处理,从而得到第二分辨率的第一预测双目图像。其中,第二分辨率大于第一分辨率。
作为示例,参见图4A,初始化的神经网络模型的超分辨率处理过程如下:通过特征提取模块对第一分辨率的双目图像包括的左视图进行特征提取处理,得到左视图的整体图像特征,通过特征提取模块对第一分辨率的双目图像包括的右视图进行特征提取处理,得到右视图的整体图像特征;通过双向金字塔对齐模块对左视图和右视图进行对齐处理,分别得到左视图对应的对齐特征、右视图对应的对齐特征;通过双向视差注意力模块,基于左视图的整体图像特征和对齐特征、以及右视图的整体图像特征和对齐特征进行注意力融合处理,得到左视图对应的融合图像特征、右视图对应的融合图像特征;通过特征重建模块基于左视图对应的融合图像特征进行特征重建处理,得到左视图对应的第二分辨率的左视图,通过特征重建模块基于右视图对应的融合图像特征进行特征重建处理,得到右视图对应的第二分辨率的右视图。
在步骤203中,将第二分辨率的第一预测双目图像以及对应的第二分辨率的第一真实双目图像分别对应的特征向量,代入损失函数进行计算,得到损失值。
作为示例,在得到第二分辨率的第一预测双目图像之后,对第一预测双目图像中的第一预测左视图和第一预测右视图分别进行特征提取处理,获得第一预测左视图和第一预测右视图分别对应的特征向量。并且,获得第一样本双目图像对应的第一真实双目图像,并对第一真实双目图像中的第一真实左视图和第一真实右视图分别进行特征提取处理,获得第一真实左视图和第一真实右视图分别对应的特征向量。
在得到这4个特征向量之后,将这4个特征向量代入损失函数进行计算,得到损失值。作为示例,损失函数可以为均方绝对误差(Mean Absolute Error,MAE)损失函数,用于计算神经网络模型的预测值和真实值之间的距离的均值。MAE损失函数的计算公式如下:
在步骤204中,在反向传播过程中,基于损失值更新神经网络模型的参数。
作为示例,在通过上述公式1计算得出损失值之后,在神经网络模型的反向传播过程中,基于损失值更新神经网络模型的参数。
迭代执行上述步骤201-步骤204,当损失值小于特定阈值,或者达到设定的迭代次数后停止训练,得到训练后的神经网络模型。
通过上述方式对神经网络模型进行训练,可以提高训练得到的神经网络模型的预测精度,从而提高基于训练得到的神经网络模型确定出的第二分辨率的双目图像的准确性。在得到训练后的神经网络模型之后,可以使用训练后的神经网络模型进行超分辨率处理,以得到第二分辨率的双目图像。
下面将结合附图说明本申请实施例提供的双目图像的超分辨率处理方法。
参见图3B,图3B是本申请实施例提供的双目图像的超分辨率处理方法中步骤101-105的流程示意图,将结合图3B示出的步骤进行说明。
在步骤101中,按照尺度逐层减小的第一层次顺序,基于第一分辨率的双目图像进行级联的多个层次的特征提取处理,得到尺度逐层减小的多个层次特征。
作为示例,参见图4B,图4B是本申请实施例提供的双向金字塔对齐模块的结构示意图。如图4B所示,第一层次顺序为从层到层的层次顺序,从层对应的层次特征和至层对应的层次特征和,层次特征对应的高度和宽度逐层减小,也即是层次特征的尺度逐层减小。
参见图3C,图3C是本申请实施例提供的双目图像的超分辨率处理方法中步骤1011-1012的流程示意图。基于图3B,图3C示出的步骤101可以通过步骤1011-步骤1012实现。下面将结合图3C示出的步骤1011-步骤1012进行说明。
在步骤1011中,依次将双目图像中的一个视图作为待对齐图像,将另一个视图作为参考图像,针对待对齐图像和参考图像的每种组合,执行以下处理:通过第一层次顺序中的第一层次,对待对齐图像以及参考图像进行特征提取处理,得到第一层次对应的待对齐图像层次特征以及参考图像层次特征。
作为示例,双目图像包括左视图和右视图,依次将双目图像中的一个视图作为待对齐图像,将另一个视图作为参考图像,可以得到左视图为待对齐图像、右视图为参考图像的第一种组合,也可以得到右视图为待对齐图像、左视图为参考图像的第二种组合。
这里,特征提取处理可以通过两个二维卷积层Conv1_nbh和Conv1_ref实现,也就是说,通过二维卷积层Conv1_nbh对待对齐图像进行特征提取处理,从而得到层对应的待对齐图像层次特征;对应地,通过二维卷积层Conv1_ref对参考图像进行特征提取处理,从而得到层对应的参考图像层次特征。
在步骤1012中,将第一层次对应的待对齐图像层次特征、以及参考图像层次特征输出到后续层次,以在后续层次中继续进行特征提取处理,并输出后续层次对应的待对齐图像层次特征以及参考图像层次特征。
作为示例,在得到层对应的待对齐图像层次特征、参考图像层次特征之后,将层对应的待对齐图像层次特征、参考图像层次特征输出到层,通过层的二维卷积层Conv2_nbh对进行特征提取处理,从而得到层对应的待对齐图像层次特征;对应地,通过层的二维卷积层Conv2_ref对进行特征提取处理,从而得到层对应的参考图像层次特征。
类似地,在得到层对应的待对齐图像层次特征、参考图像层次特征之后,将层对应的待对齐图像层次特征、参考图像层次特征输出到第一层次顺序中的最后一个层次,即层,通过层的二维卷积层Conv3_nbh对进行特征提取处理,从而得到层对应的待对齐图像层次特征;对应地,通过层的二维卷积层Conv3_ref对进行特征提取处理,从而得到层对应的参考图像层次特征。
需要说明的是,在通过每一层的二维卷积层进行特征提取处理得到特征后,需要先对得到的特征中的所有偶数行以及偶数列进行去除,将去除掉所有偶数行和偶数列的特征确定为二维卷积层输出的层次特征。由于每一层的二维卷积层都会进行上述处理,所以,从层到层,每一层输出的层次特征的行和列逐渐减小,即层次特征对应的高度和宽度逐渐减小,从而层次特征对应的尺度逐渐减小。
需要说明的是,二维卷积层输出的层次特征的通道数量,与二维卷积层使用的卷积核的数量相同。由于按照从层到层的第一层次顺序,从Conv1_nbh-Conv3_nbh,每个二维卷积层使用的卷积核的个数逐层增加,因此,Conv1_nbh-Conv3_nbh分别输出的 - 的通道数量也逐层增加;同样的,由于从Conv1_ref-Conv3_ref,每个二维卷积层使用的卷积核的个数逐层增加,因此,Conv1_ref-Conv3_ref分别输出的 - 的通道数量也逐层增加,由于同一层次的二维卷积层使用的卷积核的个数相同,因此,同一层次对应的待对齐图像层次特征和参考图像层次特征的通道数量相同。所以,按照第一层次顺序,多个层次分别输出的待对齐图像层次特征以及参考图像层次特征具有以下特性:所对应的通道数量逐层增加。
通过上述方式,可以从较大尺度到较小尺度,逐层获取每个层次的待对齐图像层次特征和参考图像层次特征,从而可以全面、准确获得不同尺度下的双目图像的层次特征。
在步骤102中,按照尺度逐层增加的第二层次顺序,依次在每个层次执行以下处理:基于层次对应的层次特征进行特征融合处理,得到层次对应的特征偏移。
作为示例,参见图4B,第二层次顺序为从层到层的层次顺序,从层对应的特征偏移和对齐特征至层对应的特征偏移和对齐特征,特征偏移和对齐特征对应的高度和宽度逐层增加,也即是特征偏移和对齐特征的尺度逐层增加。按照从层到层的层次顺序,依次在每个层次执行以下处理:基于该层次对应的层次特征进行特征融合处理,得到该层次对应的特征偏移。
参见图3D,图3D是本申请实施例提供的双目图像的超分辨率处理方法中步骤1021A和步骤1021B-1023B的流程示意图。基于图3B,图3D示出的步骤102可以通过步骤1021A实现,或通过步骤1021B-步骤1023B实现。下面将结合图3D示出的步骤1021A、步骤1021B-步骤1023B进行说明。
在步骤1021A中,在当前待处理的层次是第二层次顺序中的第一层次的情况下,对层次对应的待对齐图像层次特征与参考图像层次特征按照所包括的通道进行合并,得到层次对应的特征偏移。
通过上述方式,可以准确确定第二层次顺序中的第一层次对应的特征偏移,便于根据准确的特征偏移准确确定出第一层次对应的对齐特征。
在步骤1021B中,在当前待处理的层次不是第二层次顺序中的第一层次的情况下,对层次的上一层次对应的特征偏移进行上采样处理,得到第一上采样特征。
例如,在当前待处理的层次为层时,在第二层次顺序中,层的上一层次为层,因此,对层对应的特征偏移进行上采样处理,得到第一上采样特征。这里,可以通过双线性插值法实现上采样处理,双线性插值法需要在两个方向分别进行一次线性插值处理。
在步骤1022B中,对层次对应的待对齐图像层次特征与参考图像层次特征按照所包括的通道进行合并,得到第一融合特征。
作为示例,在得到层对应的待对齐图像层次特征与参考图像层次特征之后,对与按照所包括的通道进行合并,得到第一融合特征。其中,第一融合特征的通道数量为以下两者的加和:待对齐图像层次特征的通道数量,参考图像层次特征的通道数量。
在步骤1023B中,对第一上采样特征与第一融合特征按照所包括的通道进行合并,得到层次对应的特征偏移。
作为示例,在得到第一上采样特征和第一融合特征之后,对和第一融合特征按照所包括的通道进行合并,得到层对应的特征偏移。其中,层对应的特征偏移的通道数量为以下两者的加和:第一上采样特征的通道数量,第一融合特征的通道数量。
通过上述方式,可以准确确定第二层次顺序中除第一层次之外的其他层次对应的特征偏移,便于根据准确的特征偏移准确确定出其他层次分别对应的对齐特征。
在步骤103中,基于层次对应的特征偏移进行特征对齐处理,得到层次对应的对齐特征。
参见图3E,图3E是本申请实施例提供的双目图像的超分辨率处理方法中步骤1031A和步骤1031B的流程示意图。基于图3B,图3E示出的步骤103可以通过步骤1031A实现,或通过步骤1031B实现。下面将结合图3E示出的步骤1031A与步骤1031B进行说明。
在步骤1031A中,在特征对齐处理的待对齐图像为左视图的情况下,基于层次对应的特征偏移、以及层次对应的左视图层次特征进行特征对齐处理,得到左视图在层次对应的对齐特征。
作为示例,双目图像包括左视图和右视图,在特征对齐处理的待对齐图像为左视图的情况下,特征对齐处理对应的待对齐图像层次特征为左视图层次特征,所以,基于该层次对应的特征偏移、以及该层次对应的待对齐图像层次特征(即,左视图层次特征),进行特征对齐处理,得到左视图在该层次对应的对齐特征。
参见图3F,图3F是本申请实施例提供的双目图像的超分辨率处理方法中步骤10311A和步骤10312A-10314A的流程示意图。基于图3E,图3F示出的步骤1031A可以通过步骤10311A实现,或通过步骤10312A-步骤10314A实现。下面将结合图3F示出的步骤10311A、步骤10312A-步骤10314A进行说明。
在步骤10311A中,在当前待处理的层次是第二层次顺序中的第一层次的情况下,通过层次对应的特征偏移,对层次对应的左视图层次特征进行重采样处理,得到左视图在层次对应的对齐特征。
作为示例,如果当前待处理的层次是第二层次顺序中的第一层次,即为层时,通过层对应的特征偏移,对层对应的待对齐图像层次特征(即,左视图层次特征)进行重采样处理,将重采样结果确定为左视图在层对应的对齐特征。
这里,重采样处理可以通过可变形卷积层DConv3实现,其中,可变形卷积层的二维卷积核在每一个元素上额外增加了方向参数,使得二维卷积核可以变更为任意形状,这样,二维卷积核能在训练过程中扩展到较大的范围。当然,重采样处理还可以通过其他的卷积形式实现,本申请实施例对此不做限定。在重采样处理是通过可变形卷积层DConv3实现的情况下,左视图在层对应的对齐特征的计算公式如下:
在步骤10312A中,在当前待处理的层次不是第二层次顺序中的第一层次的情况下,对左视图在上一层次对应的对齐特征进行上采样处理,得到第二上采样特征。
作为示例,如果当前待处理的层次不是第二层次顺序中的第一层次,即该层次为层或层时,对左视图在上一层次的对齐特征进行上采样处理,得到第二上采样特征。例如,在该层次为层时,在第二层次顺序中,层的上一层次为层,因此,对左视图在层对应的对齐特征进行上采样处理,得到第二上采样特征。
在步骤10313A中,通过层次对应的特征偏移,对层次对应的左视图层次特征进行重采样处理,得到第一重采样特征。
在步骤10313A中,对第二上采样特征与第一重采样特征按照所包括的通道进行合并,得到左视图在层次对应的对齐特征。
作为示例,在得到第二上采样特征和第一重采样特征之后,对第二上采样特征与第一重采样特征按照所包括的通道进行合并,得到左视图在层对应的对齐特征。其中,左视图在层对应的对齐特征的通道数量为以下两者的加和:第二上采样特征的通道数量,第一重采样特征的通道数量。
通过上述方式,可以针对不同层次采用不同的计算方式来确定左视图对应的对齐特征,从而可以准确确定左视图在第二层次顺序中的每个层次分别对应的对齐特征。
在步骤1031B中,在特征对齐处理的待对齐图像为右视图的情况下,基于层次对应的特征偏移、以及层次对应的右视图层次特征进行特征对齐处理,得到右视图在层次对应的对齐特征。
作为示例,在特征对齐处理的待对齐图像为右视图的情况下,特征对齐处理对应的待对齐图像层次特征为右视图层次特征。所以,基于该层次对应的特征偏移、以及该层次对应的待对齐图像层次特征(即,右视图层次特征),进行特征对齐处理,得到右视图在该层次对应的对齐特征。
参见图3G,图3G是本申请实施例提供的双目图像的超分辨率处理方法中步骤10311B和步骤10312B-10314B的流程示意图。基于图3E,图3G示出的步骤1031B可以通过步骤10311B实现,或通过步骤10312B-步骤10314B实现。下面将结合图3G示出的步骤10311B、步骤10312B-步骤10314B进行说明。
在步骤10311B中,在当前待处理的层次是第二层次顺序中的第一层次的情况下,通过层次对应的特征偏移,对层次对应的右视图层次特征进行重采样处理,得到右视图在层次对应的对齐特征。
作为示例,如果当前待处理的层次是第二层次顺序中的第一层次,即为层时,通过层对应的特征偏移,对层对应的待对齐图像层次特征(即,右视图层次特征)进行重采样处理,将重采样结果确定为右视图在层对应的对齐特征。
在步骤10312B中,在当前待处理的层次不是第二层次顺序中的第一层次的情况下,对右视图在上一层次对应的对齐特征进行上采样处理,得到第三上采样特征。
作为示例,如果当前待处理的层次不是第二层次顺序中的第一层次,即该层次为层或层时,对右视图在上一层次的对齐特征进行上采样处理,得到第三上采样特征。例如,在该层次为层时,在第二层次顺序中,层的上一层次为层,因此,对右视图在层对应的对齐特征进行上采样处理,得到第三上采样特征。
在步骤10313B中,通过层次对应的特征偏移,对层次对应的右视图层次特征进行重采样处理,得到第二重采样特征。
在步骤10314B中,对第三上采样特征与第二重采样特征按照所包括的通道进行合并,得到右视图在层次对应的对齐特征。
作为示例,在得到第三上采样特征和第二重采样特征之后,对第三上采样特征与第二重采样特征按照所包括的通道进行合并,得到右视图在层对应的对齐特征。其中,右视图在层对应的对齐特征的通道数量为以下两者的加和:第三上采样特征的通道数量,第二重采样特征的通道数量。
通过上述方式,可以针对不同层次采用不同的计算方式来确定右视图对应的对齐特征,从而准确确定右视图在第二层次顺序中的每个层次分别对应的对齐特征。
在步骤104中,基于最大尺度的层次对应的对齐特征进行注意力融合处理,得到双目图像的融合图像特征。
这里,由于待对齐图像可以为左视图,也可以为右视图,所以待对齐图像在层对应的对齐特征包括左视图在层对应的对齐特征、以及右视图在层对应的对齐特征,基于左视图在层对应的对齐特征、以及右视图在层对应的对齐特征,进行注意力融合处理,得到左视图的融合图像特征以及右视图的融合图像特征。
参见图3H,图3H是本申请实施例提供的双目图像的超分辨率处理方法中步骤1041-1044的流程示意图。基于图3B,图3H示出的步骤104可以通过步骤1041-步骤1044实现。下面将结合图3H示出的步骤1041-步骤1044进行说明。
在步骤1041中,对双目图像进行特征提取处理,得到双目图像中的左视图和右视图分别对应的整体图像特征。
作为示例,在进行注意力融合处理时,首先对双目图像中的左视图和右视图分别进行特征提取处理,以得到左视图对应的整体图像特征、以及右视图对应的整体图像特征。这里,作为示例,特征提取处理可以通过超分辨模型的骨干网络模型如残差密集模块实现,其中,残差密集模块包括密集卷积层和带有局部残差学习的局部特征融合层,残差密集模块通过密集卷积层可以充分提取图像的局部特征,通过局部特征融合层可以自适应地学习来自先前和当前的局部特征的更有效特征,最后通过特征融合处理得到更为准确的整体图像特征。为了减少模型的参数数量,使用相同的权重参数分别对左视图和右视图进行特征提取处理。
在步骤1042中,对左视图对应的整体图像特征、以及左视图在最大尺度的层次对应的对齐特征进行求和处理,得到第一求和结果。
在步骤1043中,对右视图对应的整体图像特征、以及右视图在最大尺度的层次对应的对齐特征进行求和处理,得到第二求和结果。
在一些实施例中,通过以下方式确定左视图和右视图分别对应的注意力权重:对第一求和结果进行归一化处理,得到第一归一化处理结果;对第二求和结果进行归一化处理,得到第二归一化处理结果;对第一归一化处理结果和第二归一化处理结果进行相乘处理,得到注意力图;基于注意力图确定左视图和右视图分别对应的注意力权重。
作为示例,在得到第一求和结果和第二求和结果之后,对第一求和结果进行归一化处理,由于第一求和结果是对左视图的整体图像特征、以及左视图在层对应的对齐特征进行求和处理得到的,所以第一求和结果本身为一个特征,因此,按照第一求和结果的宽度进行归一化处理,得到第一归一化处理结果。第一归一化处理结果的计算公式如下:
类似地,对第二求和结果进行归一化处理,由于第二求和结果是对右视图的整体图像特征、以及右视图在层对应的对齐特征进行求和处理得到的,所以第二求和结果本身为一个特征,因此,按照第二求和结果的宽度进行归一化处理,得到第二归一化处理结果。第二归一化处理结果的计算公式如下:
在得到注意力图M之后,基于注意力图M分别确定左视图对应的注意力权重、以及右视图对应的注意力权重。
在上述方式中,由于注意力图是基于左视图对应的第一归一化处理结果和右视图对应的第二归一化处理结果确定出的,所以注意力图融合了左视图和右视图的信息,基于注意力图确定出注意力权重,基于注意力权重确定左视图的融合图像特征和右视图的融合图像特征,使得确定出的融合图像特征享有跨视图的交互信息,从而使得确定出的融合图像特征更加准确。
在一些实施例中,基于注意力图确定左视图和右视图分别对应的注意力权重,通过以下方式实现:对注意力图进行转置运算,通过激活函数对得到的转置运算结果进行激活计算处理,得到左视图对应的注意力权重;通过激活函数对注意力图进行激活计算处理,得到右视图对应的注意力权重。
作为示例,在得到注意力图M之后,对注意力图M进行转置运算,并通过激活函数(例如,softmax函数)对得到的转置运算结果进行激活计算处理,得到左视图对应的注意力权重。左视图对应的注意力权重的计算公式如下:
通过上述方式,可以对应确定出左视图和右视图分别对应的注意力权重,便于基于准确的注意力权重,准确确定出左视图的融合图像特征和右视图的融合图像特征。
在步骤1044中,基于第一求和结果、第二求和结果以及分别对应的注意力权重进行注意力融合处理,得到左视图和右视图分别对应的融合图像特征。
作为示例,在得到第一求和结果、第二求和结果以及分别对应的注意力权重、之后,基于第一求和结果以及对应的注意力权重进行注意力融合处理,得到左视图对应的融合图像特征。基于第二求和结果以及对应的注意力权重进行注意力融合处理,得到右视图的对应的融合图像特征。
通过上述方式,可以基于注意力权重加强特征融合效果,从而可以准确确定出左视图的融合图像特征和右视图的融合图像特征。
在一些实施例中,基于第一求和结果、第二求和结果以及分别对应的注意力权重进行注意力融合处理,得到左视图和右视图分别对应的融合图像特征,通过以下方式实现:对第一求和结果与左视图对应的注意力权重进行相乘处理,得到第一相乘结果,对第一求和结果与第一相乘结果进行求和处理,得到左视图对应的融合图像特征;对第二求和结果与右视图对应的注意力权重进行相乘处理,得到第二相乘结果,对第二求和结果与第二相乘结果进行求和处理,得到右视图对应的融合图像特征。
作为示例,对第一求和结果与左视图对应的注意力权重进行相乘处理,得到第一相乘结果,即*;对第一求和结果与第一相乘结果*进行求和处理,得到左视图对应的融合图像特征。左视图对应的融合图像特征的计算公式如下:
作为示例,对第二求和结果与右视图对应的注意力权重进行相乘处理,得到第二相乘结果,即*;对第二求和结果与第二相乘结果*进行求和处理,得到右视图对应的融合图像特征。右视图对应的融合图像特征的计算公式如下:
通过上述方式,可以准确确定出左视图的融合图像特征和右视图的融合图像特征。
在步骤105中,基于融合图像特征进行特征重建处理,得到第二分辨率的双目图像。
作为示例,在得到左视图对应的融合图像特征和右视图对应的融合图像特征之后,基于左视图对应的融合图像特征和右视图对应的融合图像特征分别进行特征重建处理,分别得到第二分辨率的左视图和右视图。其中,第二分辨率大于第一分辨率。
作为示例,第二分辨率的双目图像,可以基于第一分辨率的双目图像调用训练后的神经网络模型进行超分辨处理得到。
在一些实施例中,基于融合图像特征进行特征重建处理,得到第二分辨率的双目图像,通过以下方式实现:对双目图像的融合图像特征进行特征重建处理,将得到的重建处理结果直接作为第二分辨率的双目图像。在另一些实施例中,可以对双目图像的融合图像特征进行特征重建处理,对得到的重建处理结果进行卷积处理,得到双目图像的卷积特征;对双目图像进行上采样处理,得到双目图像的第四上采样特征;对卷积特征与第四上采样特征进行求和处理,得到第二分辨率的双目图像。
作为示例,在另一些情况下,可以对左视图对应的融合图像特征进行特征重建处理,对得到的重建处理结果进行卷积处理,得到左视图的卷积特征,这里,可以通过二维卷积层来实现卷积处理,其中二维卷积层的卷积核数可以为3,卷积核大小为3*3,步长为1。对左视图进行上采样处理,得到左视图的第四上采样特征,这里,可以通过亚像素层来实现上采样处理;对卷积特征与第四上采样特征进行求和处理,得到第二分辨率的左视图。
类似地,可以对右视图对应的融合图像特征进行特征重建处理,对得到的重建处理结果进行卷积处理,得到右视图的卷积特征,这里,可以通过二维卷积层来实现卷积处理,其中二维卷积层的卷积核数可以为3,卷积核大小为3*3,步长为1。对右视图进行上采样处理,得到右视图的第四上采样特征,这里,可以通过亚像素层来实现上采样处理;对卷积特征与第四上采样特征进行求和处理,得到第二分辨率的右视图。
在本申请实施例中,通过在不同尺度下对低分辨率的双目图像的层次特征进行融合以及特征对齐,从而能够逐步消除不同尺度下的双目图像的左右视图之间的视差,借助注意力机制来融合对齐特征,由于注意力机制能够实现左右视图之间跨视图的信息交互,因而使得得到的融合图像特征能够充分融合来自另一视图的信息,并能够充分学习左右视图在全局范围内的对应关系,从而基于融合图像特征进行特征重建处理,能够得到质量较高且稳定的高分辨率的双目图像。
下面,将说明本申请实施例在一个实际的双目图像的超分辨率处理的应用场景中的示例性应用。
本申请实施例提供的双目图像的超分辨率处理方法可以通过神经网络模型来实现。下面将结合附图说明本申请实施例提供的神经网络模型。
参见图5,图5是本申请实施例提供的神经网络模型的原理示意图。
如图5所示,神经网络模型主要包括特征提取模块、双向金字塔对齐模块、双向视差注意力模块以及特征重建模块、二维卷积层、亚像素层6个部分。
下面将结合附图说明神经网络模型的每个部分的数据处理过程。
1)特征提取模块
基于第一分辨率的双目图像中的左视图和右视图,分别调用特征提取模块进行特征提取处理,分别得到左视图对应的整体图像特征、右视图对应的整体图像特征。其中,特征提取模块可为超分辨模型的骨干网络模型,比如残差密集模块等。为了减少模型的参数量,在对左视图和右视图分别进行特征提取处理时,特征提取模块使用的是相同的权重参数。
2)双向金字塔对齐模块
参见图6A,图6A是本申请实施例提供的双向金字塔对齐模块的原理示意图。
提取层对应的层次特征。分别基于层对应的参考图像层次特征和待对齐图像层次特征,分别调用二维卷积层Conv2_ref和Conv2_nbh进行特征提取处理,得到层对应的参考图像层次特征和待对齐图像层次特征。
提取层对应的层次特征。分别基于层对应的参考图像层次特征和待对齐图像层次特征,分别调用二维卷积层Conv3_ref和Conv3_nbh进行特征提取处理,得到层对应的参考图像层次特征和待对齐图像层次特征。
接着,按照金字塔顺序逐层生成特征偏移以及对齐特征。
确定层对应的特征偏移。首先,通过双线性插值法对层对应的特征偏移进行上采样处理,例如上采样2倍,得到上采样特征。接着,将层的层次特征和按通道进行拼接融合,得到拼接特征。最后,将拼接特征与上采样特征进行拼接融合,得到层对应的特征偏移。
确定层对应的对齐特征。首先,基于层对应的特征偏移和,调用可变形卷积层DConv2,通过可变形卷积层DConv2实现根据特征偏移对待对齐图像层次特征进行特征重采样处理,得到重采样特征。其次,对层对应的对齐特征进行上采样处理,将得到的上采样特征与重采样处理特征进行特征融合处理,得到层对应的对齐特征。
确定层对应的特征偏移。首先,通过双线性插值法对层对应的特征偏移进行上采样处理,例如上采样2倍,得到上采样特征。接着,将层的层次特征和按通道进行拼接融合,得到拼接特征。最后,将拼接特征与上采样特征进行拼接融合,得到层对应的特征偏移。
确定层对应的对齐特征。首先,基于层对应的特征偏移和,调用可变形卷积层DConv1,通过可变形卷积层DConv1实现根据特征偏移对待对齐图像层次特征进行特征重采样处理,得到重采样特征。其次,对层对齐特征向量进行上采样处理,将得到的上采样特征与重采样处理特征进行特征融合处理,得到层对应的对齐特征,即左视图在层对应的对齐特征。
3)双向视差注意力模块
参见图6B,图6B是本申请实施例提供的双向视差注意力模块的原理示意图。
在得到左视图对应的对齐特征和右视图对应的对齐特征之后,将与1)中得到的进行逐像素相加融合,得到融合特征;将与1)中得到的进行逐像素相加融合,得到融合特征。接着,基于融合特征和,调用双向视差注意力模块进行注意力特征融合处理,实现跨视图的信息交互,从而得到左视图和右视图分别对应的融合图像特征和。
作为示例,左视图和右视图分别对应的融合图像特征和可以通过以下方式得到:首先,进行特征归一化处理。对融合特征和分别按照对应的特征宽度进行归一化处理,得到归一化特征和。其次,计算注意力图M。对归一化特征和进行逐像素相乘处理,得到注意力图M。接着,计算左视图和右视图分别对应的注意力权重。对注意力图M进行转置运算,基于转置运算结果调用softmax层进行计算处理,得到左视图注意力权重;基于注意力图M调用softmax层进行计算处理,得到右视图注意力权重。其中,和的取值范围为(0,1)。最后,进行残差融合处理。对于左视图,将与融合特征相乘,得到相乘结果,为了进一步加强特征融合效果,将相乘结果与融合特征进行逐项素相加处理,得到左视图的融合图像特征(即,)。通过类似的方式确定右视图的融合图像特征(即,)。
4)特征重建模块
基于3)中得到的左视图的融合图像特征、以及右视图的融合图像特征,分别调用特征重建模块进行特征重建处理,得到左视图对应的重建特征、右视图对应的重建特征。这里,特征重建模块可以为超分辨模型的骨干网络模型,如残差密集模块。
5)二维卷积层
基于4)中的得到的左视图对应的重建特征、右视图对应的重建特征,分别调用对应的二维卷积层进行卷积处理,得到左视图对应的卷积特征、右视图对应的卷积特征。其中,每个二维卷积层的卷积核的数量可以为3,卷积核大小为3*3,步长为1。
6)亚像素层
基于左视图和右视图分别调用对应的亚像素层进行上采样处理,分别得到左视图对应的上采样特征和右视图对应的上采样特征。将左视图对应的卷积特征与左视图对应的上采样特征进行求和处理,得到第二分辨率的左视图;将右视图对应的卷积特征与右视图对应的上采样特征进行求和处理,得到第二分辨率的右视图。其中,第二分辨率大于第一分辨率。
在使用神经网络模型进行超分辨率处理之前,需要先对神经网络模型进行训练,下面将结合附图说明神经网络模型的训练方法。
参见图7,图7是本申请实施例提供的神经网络模型的训练以及应用过程的流程示意图,将结合图7示出的步骤701-步骤704进行说明。该训练以及应用过程可以由终端或服务器单独执行,也可以由终端和服务器协同执行,下面将以该训练以及应用过程由服务器执行为例进行说明。
在步骤701中,获取多个第二分辨率的双目图像。
在步骤702中,对第二分辨率的双目图像进行下采样处理,得到第一分辨率的双目图像,随机在图像中裁剪图像块,得到训练数据和标签数据。
作为示例,可以采用双三次插值法实现下采样处理。将对第一分辨率的双目图像进行裁剪得到的图像块,作为训练数据;将对第二分辨率的双目图像进行裁剪得到的图像块,作为训练数据对应的标签数据。其中,第二分辨率大于第一分辨率。
在步骤703中,基于第一分辨率的双目图像调用神经网络网络模型进行迭代训练,当损失值小于特定阈值,或者达到设定的迭代次数后停止训练,得到训练后的模型。
需要说明的是,神经网络模型的训练过程与上文所述的步骤201-步骤204类似,在此不再赘述。
在得到训练后的神经网络模型之后,对训练后的神经网络模型进行性能评估。
下面的表1记录了本申请提供的训练后的神经网络模型与相关技术中的模型分别在KITTI2015数据集和Flickr1024数据集上的PSNR指标和SSIM指标。
表1 不同模型在不同数据集上的PSNR指标和SSIM指标
如表1所示,对于KITTI2015数据集,本申请提供的模型在PSNR和SSIM指标上,相较于相关技术中的模型C有0.36和0.008的提升。对于Flickr1024数据集,本申请提供的模型在PSNR和SSIM指标上,相较于相关技术的模型C有1.0和0.0129的提升。
参见图8,图8是本申请实施例提供的神经网络模型的处理结果与其他模型的处理结果的对比示意图。
可见,相较于相关技术中的其他模型处理得到的高分辨率的双目图像,本申请提供的神经网络模型处理得到的高分辨率的双目图像,具有更高的清晰度,如车轮胎和条纹纹理处的清晰度,显著高于其它模型得到的图像的车轮胎和条纹纹理处的清晰度。
在步骤704中,基于第一分辨率的双目图像,调用训练后的神经网络模型进行超分辨率处理,得到第二分辨率的双目图像。
作为示例,在对训练后的神经网络模型进行测试之后,可以使用训练后的神经网络模型进行超分辨率处理,以得到第二分辨率的双目图像。
需要说明的是,训练后的神经网络模型的超分辨率处理过程与上文所述的6个部分的数据处理过程相同,在此不再赘述。
在本申请实施例中,与相关技术中基于深度学习的双目图像的超分辨率处理模型相比,本申请实施例提供的基于可变形卷积的神经网络模型,可以从粗到精进行多尺度的特征对齐处理,能够处理复杂的左右视图不一致的情况,也能够使得得到的高分辨率的左右视图的质量更加稳定。
下面继续说明本申请实施例提供的双目图像的超分辨率处理装置233的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器230的双目图像的超分辨率处理装置233中的软件模块可以包括:特征提取处理模块2331,用于按照尺度逐层减小的第一层次顺序,基于第一分辨率的双目图像进行级联的多个层次的特征提取处理,得到尺度逐层减小的多个层次特征;特征融合处理模块2332,用于按照尺度逐层增加的第二层次顺序,依次在每个层次执行以下处理:基于层次对应的层次特征进行特征融合处理,得到层次对应的特征偏移;特征对齐处理模块2333,用于基于层次对应的特征偏移进行特征对齐处理,得到层次对应的对齐特征;注意力融合处理模块2334,用于基于最大尺度的层次对应的对齐特征进行注意力融合处理,得到双目图像的融合图像特征;特征重建处理模块2335,用于基于融合图像特征进行特征重建处理,得到第二分辨率的双目图像;其中,第二分辨率大于第一分辨率。
上述方案中,双目图像包括左视图和右视图;特征提取处理模块2331,用于依次将双目图像中的一个视图作为待对齐图像,将另一个视图作为参考图像,针对待对齐图像和参考图像的每种组合,执行以下处理:通过第一层次顺序中的第一层次,对待对齐图像以及参考图像进行特征提取处理,得到第一层次对应的待对齐图像层次特征以及参考图像层次特征;将第一层次对应的待对齐图像层次特征、以及参考图像层次特征输出到后续层次,以在后续层次中继续进行特征提取处理,并输出后续层次对应的待对齐图像层次特征以及参考图像层次特征;其中,按照第一层次顺序,多个层次分别输出的待对齐图像层次特征以及参考图像层次特征具有以下特性:所对应的通道数量逐层增加。
上述方案中,在当前待处理的层次是第二层次顺序中的第一层次的情况下,特征融合处理模块2332,用于对层次对应的待对齐图像层次特征与参考图像层次特征按照所包括的通道进行合并,得到层次对应的特征偏移;其中,层次对应的特征偏移的通道数量为以下两者的加和:待对齐图像层次特征的通道数量,参考图像层次特征对应的通道数量。
上述方案中,在当前待处理的层次不是第二层次顺序中的第一层次的情况下,特征融合处理模块2332,用于对层次的上一层次对应的特征偏移进行上采样处理,得到第一上采样特征;对层次对应的待对齐图像层次特征与参考图像层次特征按照所包括的通道进行合并,得到第一融合特征;对第一上采样特征与第一融合特征按照所包括的通道进行合并,得到层次对应的特征偏移;其中,层次对应的特征偏移的通道数量为以下两者的加和:第一上采样特征的通道数量,第一融合特征的通道数量。
上述方案中,双目图像包括左视图和右视图,在特征对齐处理的待对齐图像为左视图的情况下,特征对齐处理对应的待对齐图像层次特征为左视图层次特征,在特征对齐处理的待对齐图像为右视图的情况下,特征对齐处理对应的待对齐图像层次特征为右视图层次特征;特征对齐处理模块2333,用于在特征对齐处理的待对齐图像为左视图的情况下,基于层次对应的特征偏移、以及层次对应的左视图层次特征进行特征对齐处理,得到左视图在层次对应的对齐特征;在特征对齐处理的待对齐图像为右视图的情况下,基于层次对应的特征偏移、以及层次对应的右视图层次特征进行特征对齐处理,得到右视图在层次对应的对齐特征。
上述方案中,特征对齐处理模块2333,用于在当前待处理的层次是第二层次顺序中的第一层次的情况下,通过层次对应的特征偏移,对层次对应的左视图层次特征进行重采样处理,得到左视图在层次对应的对齐特征;在当前待处理的层次不是第二层次顺序中的第一层次的情况下,对左视图在上一层次对应的对齐特征进行上采样处理,得到第二上采样特征;通过层次对应的特征偏移,对层次对应的左视图层次特征进行重采样处理,得到第一重采样特征;对第二上采样特征与第一重采样特征按照所包括的通道进行合并,得到左视图在层次对应的对齐特征;其中,左视图在层次对应的对齐特征的通道数量为以下两者的加和:第二上采样特征的通道数量,第一重采样特征的通道数量。
上述方案中,特征对齐处理模块2333,用于在当前待处理的层次是第二层次顺序中的第一层次的情况下,通过层次对应的特征偏移,对层次对应的右视图层次特征进行重采样处理,得到右视图在层次对应的对齐特征;在当前待处理的层次不是第二层次顺序中的第一层次的情况下,对右视图在上一层次对应的对齐特征进行上采样处理,得到第三上采样特征;通过层次对应的特征偏移,对层次对应的右视图层次特征进行重采样处理,得到第二重采样特征;对第三上采样特征与第二重采样特征按照所包括的通道进行合并,得到右视图在层次对应的对齐特征;其中,右视图在层次对应的对齐特征的通道数量为以下两者的加和:第三上采样特征的通道数量,第二重采样特征的通道数量。
上述方案中,注意力融合处理模块2334,用于对双目图像进行特征提取处理,得到双目图像中的左视图和右视图分别对应的整体图像特征;对左视图对应的整体图像特征、以及左视图在最大尺度的层次对应的对齐特征进行求和处理,得到第一求和结果;对右视图对应的整体图像特征、以及右视图在最大尺度的层次对应的对齐特征进行求和处理,得到第二求和结果;基于第一求和结果、第二求和结果以及分别对应的注意力权重进行注意力融合处理,得到左视图和右视图分别对应的融合图像特征。
上述方案中,注意力融合处理模块2334,用于对第一求和结果进行归一化处理,得到第一归一化处理结果;对第二求和结果进行归一化处理,得到第二归一化处理结果;对第一归一化处理结果和第二归一化处理结果进行相乘处理,得到注意力图;基于注意力图确定左视图和右视图分别对应的注意力权重。
上述方案中,注意力融合处理模块2334,用于对注意力图进行转置运算,通过激活函数对得到的转置运算结果进行激活计算处理,得到左视图对应的注意力权重;通过激活函数对注意力图进行激活计算处理,得到右视图对应的注意力权重。
上述方案中,注意力融合处理模块2334,用于对第一求和结果与左视图对应的注意力权重进行相乘处理,得到第一相乘结果,对第一求和结果与第一相乘结果进行求和处理,得到左视图对应的融合图像特征;对第二求和结果与右视图对应的注意力权重进行相乘处理,得到第二相乘结果,对第二求和结果与第二相乘结果进行求和处理,得到右视图对应的融合图像特征。
上述方案中,特征重建处理模块2335,用于对双目图像的融合图像特征进行特征重建处理,将得到的重建处理结果直接作为第二分辨率的双目图像;或者,对双目图像的融合图像特征进行特征重建处理,对得到的重建处理结果进行卷积处理,得到双目图像的卷积特征;对双目图像进行上采样处理,得到双目图像的第四上采样特征;对卷积特征与第四上采样特征进行求和处理,得到第二分辨率的双目图像。
上述方案中,第二分辨率的双目图像是基于第一分辨率的双目图像调用训练后的神经网络模型进行超分辨率处理得到的;上述装置还包括训练模块,用于基于第一分辨率的第一样本双目图像,调用初始化的神经网络模型进行超分辨率处理,得到第二分辨率的第一预测双目图像;将第二分辨率的第一预测双目图像以及对应的第二分辨率的第一真实双目图像分别对应的特征向量,代入损失函数进行计算,得到损失值;在反向传播过程中,基于损失值更新神经网络模型的参数。
上述方案中,通过以下方式确定第一分辨率的第一样本双目图像、以及第二分辨率的第一真实双目图像:获取多个第二分辨率的第二样本双目图像;其中,每个第二样本双目图像包括一个第二样本左视图和一个第二样本右视图;对每个第二分辨率的第二样本双目图像进行下采样处理,得到对应的第一分辨率的第二样本双目图像;对第一分辨率的第二样本双目图像、以及第二分辨率的第二样本双目图像进行裁剪处理,分别得到第一分辨率的第二样本双目图像块、以及第二分辨率的第二样本双目图像块;将第一分辨率的第二样本双目图像块确定为第一分辨率的第一样本双目图像,并将第二分辨率的第二样本双目图像块确定为第二分辨率的第一真实双目图像。
本申请实施例提供了一种计算机程序产品,该计算机程序产品包括可执行指令,该可执行指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该可执行指令,处理器执行该可执行指令,使得该电子设备执行本申请实施例上述的双目图像的超分辨率处理方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的双目图像的超分辨率处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可被部署为在一个电子设备上执行,或者在位于一个地点的多个电子设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行。
综上所述,本申请实施例通过在不同尺度下对低分辨率的双目图像的层次特征进行融合以及特征对齐,从而能够逐步消除不同尺度下的双目图像的左右视图之间的视差,借助注意力机制来融合对齐特征,由于注意力机制能够实现左右视图之间跨视图的信息交互,因而使得得到的融合图像特征能够充分融合来自另一视图的信息,并能够充分学习左右视图在全局范围内的对应关系,从而基于融合图像特征进行特征重建处理,能够得到质量较高且稳定的高分辨率的双目图像。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (17)
1.一种双目图像的超分辨率处理方法,其特征在于,所述方法包括:
按照尺度逐层减小的第一层次顺序,基于第一分辨率的双目图像进行级联的多个层次的特征提取处理,得到所述尺度逐层减小的多个层次特征;
按照所述尺度逐层增加的第二层次顺序,依次在每个所述层次执行以下处理:基于所述层次对应的所述层次特征进行特征融合处理,得到所述层次对应的特征偏移,以及
基于所述层次对应的所述特征偏移进行特征对齐处理,得到所述层次对应的对齐特征;
基于最大尺度的所述层次对应的所述对齐特征进行注意力融合处理,得到所述双目图像的融合图像特征;
基于所述融合图像特征进行特征重建处理,得到第二分辨率的双目图像;其中,所述第二分辨率大于所述第一分辨率。
2.根据权利要求1所述的方法,其特征在于,
所述双目图像包括左视图和右视图;
所述基于第一分辨率的双目图像进行级联的多个层次的特征提取处理,得到所述尺度逐层减小的多个层次特征,包括:
依次将所述双目图像中的一个视图作为待对齐图像,将另一个视图作为参考图像,针对所述待对齐图像和所述参考图像的每种组合,执行以下处理:
通过所述第一层次顺序中的第一层次,对所述待对齐图像以及所述参考图像进行特征提取处理,得到所述第一层次对应的待对齐图像层次特征以及参考图像层次特征;
将所述第一层次对应的所述待对齐图像层次特征、以及所述参考图像层次特征输出到后续层次,以在所述后续层次中继续进行特征提取处理,并输出所述后续层次对应的待对齐图像层次特征以及参考图像层次特征;
其中,按照所述第一层次顺序,所述多个层次分别输出的所述待对齐图像层次特征以及所述参考图像层次特征具有以下特性:所对应的通道数量逐层增加。
3.根据权利要求2所述的方法,其特征在于,
在当前待处理的所述层次是所述第二层次顺序中的第一层次的情况下,所述基于所述层次对应的所述层次特征进行特征融合处理,得到所述层次对应的特征偏移,包括:
对所述层次对应的所述待对齐图像层次特征与所述参考图像层次特征按照所包括的通道进行合并,得到所述层次对应的特征偏移;
其中,所述层次对应的特征偏移的通道数量为以下两者的加和:所述待对齐图像层次特征的通道数量,所述参考图像层次特征对应的通道数量。
4.根据权利要求2所述的方法,其特征在于,
在当前待处理的所述层次不是所述第二层次顺序中的第一层次的情况下,所述基于所述层次对应的所述层次特征进行特征融合处理,得到所述层次对应的特征偏移,包括:
对所述层次的上一层次对应的特征偏移进行上采样处理,得到第一上采样特征;
对所述层次对应的所述待对齐图像层次特征与所述参考图像层次特征按照所包括的通道进行合并,得到第一融合特征;
对所述第一上采样特征与所述第一融合特征按照所包括的通道进行合并,得到所述层次对应的特征偏移;其中,所述层次对应的特征偏移的通道数量为以下两者的加和:所述第一上采样特征的通道数量,所述第一融合特征的通道数量。
5.根据权利要求1所述的方法,其特征在于,
所述双目图像包括左视图和右视图,在所述特征对齐处理的待对齐图像为所述左视图的情况下,所述特征对齐处理对应的待对齐图像层次特征为左视图层次特征,在所述特征对齐处理的待对齐图像为所述右视图的情况下,所述特征对齐处理对应的所述待对齐图像层次特征为右视图层次特征;
所述基于所述层次对应的所述特征偏移进行特征对齐处理,得到所述层次对应的对齐特征,包括:
在所述特征对齐处理的待对齐图像为所述左视图的情况下,基于所述层次对应的特征偏移、以及所述层次对应的所述左视图层次特征进行特征对齐处理,得到所述左视图在所述层次对应的对齐特征;
在所述特征对齐处理的待对齐图像为所述右视图的情况下,基于所述层次对应的特征偏移、以及所述层次对应的所述右视图层次特征进行特征对齐处理,得到所述右视图在所述层次对应的对齐特征。
6.根据权利要求5所述的方法,其特征在于,
所述基于所述层次对应的特征偏移、以及所述层次对应的所述左视图层次特征进行特征对齐处理,得到所述左视图在所述层次对应的对齐特征,包括:
在当前待处理的所述层次是所述第二层次顺序中的第一层次的情况下,通过所述层次对应的所述特征偏移,对所述层次对应的所述左视图层次特征进行重采样处理,得到所述左视图在所述层次对应的对齐特征;
在当前待处理的所述层次不是所述第二层次顺序中的第一层次的情况下,对所述左视图在上一层次对应的所述对齐特征进行上采样处理,得到第二上采样特征;
通过所述层次对应的所述特征偏移,对所述层次对应的所述左视图层次特征进行重采样处理,得到第一重采样特征;
对所述第二上采样特征与所述第一重采样特征按照所包括的通道进行合并,得到所述左视图在所述层次对应的对齐特征;其中,所述左视图在所述层次对应的对齐特征的通道数量为以下两者的加和:所述第二上采样特征的通道数量,所述第一重采样特征的通道数量。
7.根据权利要求5所述的方法,其特征在于,
所述基于所述层次对应的特征偏移、以及所述层次对应的所述右视图层次特征进行特征对齐处理,得到所述右视图在所述层次对应的对齐特征,包括:
在当前待处理的所述层次是所述第二层次顺序中的第一层次的情况下,通过所述层次对应的所述特征偏移,对所述层次对应的所述右视图层次特征进行重采样处理,得到所述右视图在所述层次对应的对齐特征;
在当前待处理的所述层次不是所述第二层次顺序中的第一层次的情况下,对所述右视图在上一层次对应的所述对齐特征进行上采样处理,得到第三上采样特征;
通过所述层次对应的所述特征偏移,对所述层次对应的所述右视图层次特征进行重采样处理,得到第二重采样特征;
对所述第三上采样特征与所述第二重采样特征按照所包括的通道进行合并,得到所述右视图在所述层次对应的对齐特征;其中,所述右视图在所述层次对应的对齐特征的通道数量为以下两者的加和:所述第三上采样特征的通道数量,所述第二重采样特征的通道数量。
8.根据权利要求1所述的方法,其特征在于,
所述基于最大尺度的所述层次对应的所述对齐特征进行注意力融合处理,得到所述双目图像的融合图像特征,包括:
对所述双目图像进行特征提取处理,得到所述双目图像中的左视图和右视图分别对应的整体图像特征;
对所述左视图对应的整体图像特征、以及所述左视图在最大尺度的所述层次对应的所述对齐特征进行求和处理,得到第一求和结果;
对所述右视图对应的整体图像特征、以及所述右视图在最大尺度的所述层次对应的所述对齐特征进行求和处理,得到第二求和结果;
基于所述第一求和结果、所述第二求和结果以及分别对应的注意力权重进行注意力融合处理,得到所述左视图和所述右视图分别对应的融合图像特征。
9.根据权利要求8所述的方法,其特征在于,
在所述基于所述第一求和结果、所述第二求和结果以及分别对应的注意力权重进行注意力融合处理,得到所述左视图和所述右视图分别对应的融合图像特征之前,所述方法还包括:
对所述第一求和结果进行归一化处理,得到第一归一化处理结果;
对所述第二求和结果进行归一化处理,得到第二归一化处理结果;
对所述第一归一化处理结果和所述第二归一化处理结果进行相乘处理,得到注意力图;
基于所述注意力图确定所述左视图和所述右视图分别对应的注意力权重。
10.根据权利要求9所述的方法,其特征在于,
所述基于所述注意力图确定所述左视图和所述右视图分别对应的注意力权重,包括:
对所述注意力图进行转置运算,通过激活函数对得到的转置运算结果进行激活计算处理,得到所述左视图对应的注意力权重;
通过所述激活函数对所述注意力图进行激活计算处理,得到所述右视图对应的注意力权重。
11.根据权利要求8所述的方法,其特征在于,
所述基于所述第一求和结果、所述第二求和结果以及分别对应的注意力权重进行注意力融合处理,得到所述左视图和所述右视图分别对应的融合图像特征,包括:
对所述第一求和结果与所述左视图对应的注意力权重进行相乘处理,得到第一相乘结果,对所述第一求和结果与所述第一相乘结果进行求和处理,得到所述左视图对应的融合图像特征;
对所述第二求和结果与所述右视图对应的注意力权重进行相乘处理,得到第二相乘结果,对所述第二求和结果与所述第二相乘结果进行求和处理,得到所述右视图对应的融合图像特征。
12.根据权利要求1所述的方法,其特征在于,
所述基于所述融合图像特征进行特征重建处理,得到第二分辨率的双目图像,包括:
对所述双目图像的融合图像特征进行特征重建处理,将得到的重建处理结果直接作为所述第二分辨率的双目图像;或者,
对所述双目图像的融合图像特征进行特征重建处理,对得到的重建处理结果进行卷积处理,得到所述双目图像的卷积特征;对所述双目图像进行上采样处理,得到所述双目图像的第四上采样特征;对所述卷积特征与所述第四上采样特征进行求和处理,得到所述第二分辨率的双目图像。
13.根据权利要求1至12任一项所述的方法,其特征在于,
所述第二分辨率的双目图像是基于所述第一分辨率的双目图像调用训练后的神经网络模型进行超分辨率处理得到的;
在所述基于所述第一分辨率的双目图像调用训练后的神经网络模型进行超分辨率处理之前,所述方法还包括:
通过以下方式训练所述神经网络模型:
基于所述第一分辨率的第一样本双目图像,调用初始化的所述神经网络模型进行超分辨率处理,得到所述第二分辨率的第一预测双目图像;
将所述第二分辨率的第一预测双目图像以及所述第二分辨率的第一真实双目图像分别对应的特征向量,代入损失函数进行计算,得到损失值;
在反向传播过程中,基于所述损失值更新所述神经网络模型的参数。
14.根据权利要求13所述的方法,其特征在于,所述方法还包括:
通过以下方式确定所述第一分辨率的第一样本双目图像、以及所述第二分辨率的第一真实双目图像:
获取多个所述第二分辨率的第二样本双目图像;其中,每个所述第二样本双目图像包括一个第二样本左视图和一个第二样本右视图;
对每个所述第二分辨率的第二样本双目图像进行下采样处理,得到所述第一分辨率的第二样本双目图像;
对所述第一分辨率的第二样本双目图像、以及所述第二分辨率的第二样本双目图像进行裁剪处理,分别得到所述第一分辨率的第二样本双目图像块、以及所述第二分辨率的第二样本双目图像块;
将所述第一分辨率的第二样本双目图像块确定为所述第一分辨率的第一样本双目图像,并将所述第二分辨率的第二样本双目图像块确定为所述第二分辨率的第一真实双目图像。
15.一种双目图像的超分辨率处理装置,其特征在于,所述装置包括:
特征提取处理模块,用于按照尺度逐层减小的第一层次顺序,基于第一分辨率的双目图像进行级联的多个层次的特征提取处理,得到所述尺度逐层减小的多个层次特征;
特征融合处理模块,用于按照所述尺度逐层增加的第二层次顺序,依次在每个所述层次执行以下处理:基于所述层次对应的所述层次特征进行特征融合处理,得到所述层次对应的特征偏移;
特征对齐处理模块,用于基于所述层次对应的所述特征偏移进行特征对齐处理,得到所述层次对应的对齐特征;
注意力融合处理模块,用于基于最大尺度的所述层次对应的所述对齐特征进行注意力融合处理,得到所述双目图像的融合图像特征;
特征重建处理模块,用于基于所述融合图像特征进行特征重建处理,得到第二分辨率的双目图像;其中,所述第二分辨率大于所述第一分辨率。
16.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至14任一项所述的双目图像的超分辨率处理方法。
17.一种计算机可读存储介质,其特征在于,存储有可执行指令,所述可执行指令用于被处理器执行时实现权利要求1至14任一项所述的双目图像的超分辨率处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210712157.1A CN114819109B (zh) | 2022-06-22 | 2022-06-22 | 双目图像的超分辨率处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210712157.1A CN114819109B (zh) | 2022-06-22 | 2022-06-22 | 双目图像的超分辨率处理方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114819109A true CN114819109A (zh) | 2022-07-29 |
CN114819109B CN114819109B (zh) | 2022-09-16 |
Family
ID=82520951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210712157.1A Active CN114819109B (zh) | 2022-06-22 | 2022-06-22 | 双目图像的超分辨率处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114819109B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019051464A1 (en) * | 2017-09-11 | 2019-03-14 | Lang Philipp K | INCREASED REALITY DISPLAY FOR VASCULAR AND OTHER INTERVENTIONS, COMPENSATION FOR CARDIAC AND RESPIRATORY MOVEMENT |
WO2019148154A1 (en) * | 2018-01-29 | 2019-08-01 | Lang Philipp K | Augmented reality guidance for orthopedic and other surgical procedures |
CN110689061A (zh) * | 2019-09-19 | 2020-01-14 | 深动科技(北京)有限公司 | 一种基于对齐特征金字塔网络的图像处理方法、装置及系统 |
US20200025931A1 (en) * | 2018-03-14 | 2020-01-23 | Uber Technologies, Inc. | Three-Dimensional Object Detection |
US20200160559A1 (en) * | 2018-11-16 | 2020-05-21 | Uatc, Llc | Multi-Task Multi-Sensor Fusion for Three-Dimensional Object Detection |
CN111524068A (zh) * | 2020-04-14 | 2020-08-11 | 长安大学 | 一种基于深度学习的变长输入超分辨率视频重建方法 |
CN111861888A (zh) * | 2020-07-27 | 2020-10-30 | 上海商汤智能科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
WO2020220517A1 (zh) * | 2019-04-30 | 2020-11-05 | 北京市商汤科技开发有限公司 | 图像处理方法和装置、电子设备及存储介质 |
WO2021043273A1 (zh) * | 2019-09-04 | 2021-03-11 | 华为技术有限公司 | 图像增强方法和装置 |
CN112700392A (zh) * | 2020-12-01 | 2021-04-23 | 华南理工大学 | 一种视频超分辨率处理方法、设备及存储介质 |
CN113052210A (zh) * | 2021-03-11 | 2021-06-29 | 北京工业大学 | 一种基于卷积神经网络的快速低光照目标检测方法 |
US20210326656A1 (en) * | 2020-04-15 | 2021-10-21 | Adobe Inc. | Panoptic segmentation |
CN113902623A (zh) * | 2021-11-22 | 2022-01-07 | 天津大学 | 引入尺度信息的任意倍视频超分辨率方法 |
CN114202457A (zh) * | 2021-09-18 | 2022-03-18 | 北京旷视科技有限公司 | 低分辨率图像的处理方法、电子设备及计算机程序产品 |
-
2022
- 2022-06-22 CN CN202210712157.1A patent/CN114819109B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019051464A1 (en) * | 2017-09-11 | 2019-03-14 | Lang Philipp K | INCREASED REALITY DISPLAY FOR VASCULAR AND OTHER INTERVENTIONS, COMPENSATION FOR CARDIAC AND RESPIRATORY MOVEMENT |
WO2019148154A1 (en) * | 2018-01-29 | 2019-08-01 | Lang Philipp K | Augmented reality guidance for orthopedic and other surgical procedures |
US20200025931A1 (en) * | 2018-03-14 | 2020-01-23 | Uber Technologies, Inc. | Three-Dimensional Object Detection |
US20200160559A1 (en) * | 2018-11-16 | 2020-05-21 | Uatc, Llc | Multi-Task Multi-Sensor Fusion for Three-Dimensional Object Detection |
WO2020220517A1 (zh) * | 2019-04-30 | 2020-11-05 | 北京市商汤科技开发有限公司 | 图像处理方法和装置、电子设备及存储介质 |
WO2021043273A1 (zh) * | 2019-09-04 | 2021-03-11 | 华为技术有限公司 | 图像增强方法和装置 |
CN110689061A (zh) * | 2019-09-19 | 2020-01-14 | 深动科技(北京)有限公司 | 一种基于对齐特征金字塔网络的图像处理方法、装置及系统 |
CN111524068A (zh) * | 2020-04-14 | 2020-08-11 | 长安大学 | 一种基于深度学习的变长输入超分辨率视频重建方法 |
US20210326656A1 (en) * | 2020-04-15 | 2021-10-21 | Adobe Inc. | Panoptic segmentation |
CN111861888A (zh) * | 2020-07-27 | 2020-10-30 | 上海商汤智能科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN112700392A (zh) * | 2020-12-01 | 2021-04-23 | 华南理工大学 | 一种视频超分辨率处理方法、设备及存储介质 |
CN113052210A (zh) * | 2021-03-11 | 2021-06-29 | 北京工业大学 | 一种基于卷积神经网络的快速低光照目标检测方法 |
CN114202457A (zh) * | 2021-09-18 | 2022-03-18 | 北京旷视科技有限公司 | 低分辨率图像的处理方法、电子设备及计算机程序产品 |
CN113902623A (zh) * | 2021-11-22 | 2022-01-07 | 天津大学 | 引入尺度信息的任意倍视频超分辨率方法 |
Non-Patent Citations (2)
Title |
---|
YING X等: "A Stereo Attention Module for Stereo Image Super-Resolution", 《IEEE SIGNAL PROCESSING LETTERS》 * |
吴宇峰: "基于特征处理的视频超分辨率关键技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114819109B (zh) | 2022-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Learned image downscaling for upscaling using content adaptive resampler | |
CN111047516B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
Cheng et al. | Zero-shot image super-resolution with depth guided internal degradation learning | |
Wang et al. | Enhanced deep blind hyperspectral image fusion | |
CN108960345A (zh) | 一种遥感图像的融合方法、系统及相关组件 | |
CN111683269A (zh) | 视频处理方法、装置、计算机设备和存储介质 | |
CN110717851A (zh) | 图像处理方法及装置、神经网络的训练方法、存储介质 | |
Ghassab et al. | Light field super-resolution using edge-preserved graph-based regularization | |
CN110517352B (zh) | 一种物体的三维重建方法、存储介质、终端及系统 | |
CN112750201B (zh) | 三维重建方法及相关装置、设备 | |
CN115082322B (zh) | 图像处理方法和装置、图像重建模型的训练方法和装置 | |
CN110880162A (zh) | 基于深度学习的快照光谱深度联合成像方法及系统 | |
Jin et al. | Light field super-resolution via attention-guided fusion of hybrid lenses | |
CN116071279A (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN115496654A (zh) | 基于自注意力机制的图像超分辨率重建方法、设备及介质 | |
CN110335228B (zh) | 一种图像视差的确定方法、装置及系统 | |
Deng et al. | Multiple frame splicing and degradation learning for hyperspectral imagery super-resolution | |
CN116912148B (zh) | 图像增强方法、装置、计算机设备及计算机可读存储介质 | |
CN114219900A (zh) | 基于混合现实眼镜的三维场景重建方法、重建系统和应用 | |
CN114359041A (zh) | 一种光场图像空间超分辨率重建方法 | |
CN117576292A (zh) | 三维场景渲染方法及装置、电子设备、存储介质 | |
Lu et al. | Low-rank constrained super-resolution for mixed-resolution multiview video | |
CN116630152A (zh) | 图像分辨率重建方法、装置、存储介质及电子设备 | |
CN114819109B (zh) | 双目图像的超分辨率处理方法、装置、设备及介质 | |
CN115205112A (zh) | 一种真实复杂场景图像超分辨率的模型训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40070801 Country of ref document: HK |