WO2023102724A1

WO2023102724A1 - 图像的处理方法和系统

Info

Publication number: WO2023102724A1
Application number: PCT/CN2021/136054
Authority: WO
Inventors: 王智玉; 黄强威; 黄伯雄
Original assignee: 宁德时代新能源科技股份有限公司
Priority date: 2021-12-07
Filing date: 2021-12-07
Publication date: 2023-06-15
Also published as: EP4220543A1; US11948287B2; EP4220543A4; CN116848547A; US20230267586A1

Abstract

本申请涉及图像的处理方法和系统。该方法，包括：采集包含目标对象的输入图像序列；以及对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。

Description

图像的处理方法和系统

技术领域

本申请涉及计算机技术，尤其涉及图像的处理技术。

背景技术

利用计算机进行图像处理在各个领域被广泛应用。图像处理可以被用于提升图像的视觉质量、提取图像中的特定目标的特征、图像的存储和传输、图像序列的融合等。在拍摄目标对象时，往往需要拍摄一系列的焦点不同的图像来捕获目标对象。在此类情形中，将所拍摄的图像序列进行融合以供后续图像处理是合乎需要的。

因此，需要一种用于图像融合的改进的技术。

发明内容

鉴于上述问题，本申请提供了能够提供目标对象的每一像素均聚焦的融合图像的图像处理方法和系统。

第一方面，本申请提供了一种图像的处理方法，包括：采集包含目标对象的输入图像序列；以及对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。

在本申请实施例的技术方案中，学习针对目标对象的每个聚焦像素点的输入图像序列的索引，提取输入图像序列中对应于最清晰的部分以对其执行像素级融合以将同一场景下聚焦区域不同的图像序列融合成单张目标对象全清晰的图像，实现像素级精度的全清晰且保留目标对象细节信息的融合图像，有效提高图像的信息利用率。

在一些实施例中，采集输入图像序列进一步包括：基于所述输入图像序列的帧数和所述输入图像序列中的所述目标对象的尺寸来设置用于采集所述输入图像序列的相机的步长。基于目标对象的尺寸和输入图像序列的帧数来设置相机步长能够确保所采集的输入图像序列能够覆盖目标对象的所有聚焦区域，从而保证融合图像中的目标对象的每一像素均包括聚焦部分。

在一些实施例中，所述输入图像序列包含索引，对所述输入图像序列执行多分辨率融合以生成融合图像进一步包括：对所述输入图像序列执行特征提取；对所提取的特征执行多分辨率融合，得到融合后的多分辨率特征；基于融合后的多分辨率特征生成预测掩码图，其中所述预测掩码图的每一像素指示输入图像的索引，所述索引指示所述融合图像的每一像素源自的输入图像；以及根据所述预测掩码图和所述输入图像序列生成所述融合图像。通过语义分割的方式寻找到多帧图像序列中目标对象最清晰的部分进行融合，可以使得深度学习语义分割神经网络内部卷积学习每个清晰像素点的相对位置信息(即输入图像序列的索引)，提取输入图像序列中对应于最清晰的部分以对其执行像素级融合以将同一场景下聚焦区域不同的图像序列融合成单张目标对象全清晰的图像，实现像素级精度的全清晰且保留目标对象细节信息的融合图像，有效提高图像的信息利用率。

在一些实施例中，所述方法进一步包括：将2D融合算法应用于所述输入图像序列以生成初始融合图像；以及接收对所述初始融合图像的真值标注以生成经标注掩码图，其中所述经标注掩码图指示所述初始融合图像中的所述目标对象的一个或多个像素是否聚焦。以半自动标注方式对初始融合图像中目标对象依旧模糊(非聚焦)的部分标注掩码，将其剔除出训练样本集，获取仅包含聚焦像素的真值标注的真实训练数据集，能够快速产生大量与任务相关的训练数据，并且能够通过真实有效的产线数据来进行语义分割模型训练。本申请的方案针对不同的产线只需要搜集部分真实有效数据进行微调训练，就能够批量复制并推广到这些不同的产线，能够覆盖实际需求，将该技术真正落实到各产线的实际应用中。

在一些实施例中，所述方法进一步包括：计算所述预测掩码图与所述经标注掩码图之间的损失率；将计算所得的所述损失率反馈至用于执行所述多分辨率融合的多分辨率融合算法。多分辨率融合算法输出的预测掩码图和/或融合图像与经真值标注的掩码图之间的损失率反应了多分辨率融合算法输出的预测掩码图和/或融合图像与原始输入图像之间的相似性。将该损失率反馈至多分辨率融合算法，与经真值标注的掩码图一起对多分辨率融合算法输出执行有监督学习训练，在达到训练拟合回归性的同时通过不断的训练和学习提升多分辨率融合算法的生成目标对象全清晰的融合图像方面的准确性。

在一些实施例中，所述方法进一步包括：基于所述损失率或所述经标注掩码图或这两者的组合来更新用于执行所述多分辨率融合的多分辨率融合算法。将计算所得的损失率与经真值标注的掩码图一起反馈至多分辨率融合算法，对多分辨率融合算法输出执行有监督学习训练，在达到训练拟合回归性的同时通过不断的训练和学习提升多分辨率融合算法的生成目标对象全清晰的融合图像方面的准确性。

第二方面，本申请提供了图像的处理系统，包括：采集模块，其被配置成采集包含目标对象的输入图像序列；以及融合模块，其被配置成对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。

在一些实施例中，所述采集模块被进一步配置成基于所述输入图像序列的帧数和所述输入图像序列中的所述目标对象的尺寸来设置用于采集所述输入图像序列的相机的步长。基于目标对象的尺寸和输入图像序列的帧数来设置相机步长能够确保所采集的输入图像序列能够覆盖目标对象的所有聚焦区域，从而保证融合图像中的目标对象的每一像素均包括聚焦部分。

在一些实施例中，所述输入图像序列包含索引，所述融合模块进一步包括：编码器，其被配置成：对所述输入图像序列执行特征提取；对所提取的特征执行多分辨率融合，得到融合后的多分辨率特征；以及解码器，其被配置成：基于融合后的多分辨率特征生成预测掩码图，其中所述预测掩码图的每一像素指示输入图像的索引，所述索引指示所述融合图像的每一像素源自的输入图像。本申请的多分辨率融合方法从语义分割神经网络的结构入手，提出端到端的基于深度学习的自适应多聚焦融合方案。在本申请中，使图像序列通过模型编码器部分以提取深度特征，对特征进行融合，利用解码器生成融合图像，从而使得深度学习语义分割神经网络能够通过内部卷积学习到每个清晰像素点的相对位置信息(即输入图像序列的索引)，通过深度模型减少传统算法对阈值的依赖性，增强融合鲁棒性。

在一些实施例中，所述融合模块被进一步配置成根据所述预测掩码图和所述输入图像序列生成所述融合图像。通过语义分割的方式寻找到多帧图像序列中目标对象最清晰的部分进行融合，可以使得深度学习语义分割神经网络内部卷积学习每个清晰像素点的相对位置信息(即输入图像序列的索引)，提取输入图像序列中对应于最清晰的部分以对其执行像素级融合以将同一场景下聚焦区域不同的图像序列融合成单张目标对象全清晰的图像，实现像素级精度的全清晰且保留目标对象细节信息的融合图像，有效提高图像的信息利用率。

在一些实施例中，所述系统进一步包括：初始融合模块，其被配置成将2D融合算法应用于所述输入图像序列以生成初始融合图像；以及标注接收模块，其被配置成接收对所述初始融合图像的真值标注以生成经标注掩码图，其中所述经标注掩码图指示所述初始融合图像中的所述目标对象的一个或多个像素是否聚焦。以半自动标注方式对初始融合图像中目标对象依旧模糊(非聚焦)的部分标注掩码，将其剔除出训练样本集，获取仅包含聚焦像素的真值标注的真实训练数据集，能够快速产生大量与任务相关的训练数据，并且能够通过真实有效的产线数据来进行语义分割模型训练。本申请的方案针对不同的产线只需要搜集部分真实有效数据进行微调训练，就能够批量复制并推广到这些不同的产线，能够覆盖实际需求，将该技术真正落实到各产线的实际应用中。

在一些实施例中，所述系统进一步包括：损失率模块，其被配置成：计算所述预测掩码图与所述经标注掩码图之间的损失率；将计算所得的所述损失率反馈至所述融合模块。多分辨率融合算法输出的预测掩码图和/或融合图像与经真值标注的掩码图之间的损失率反应了多分辨率融合算法输出的预测掩码图和/或融合图像与原始输入图像之间的相似性。将该损失率反馈至多分辨率融合算法，与经真值标注的掩码图一起对多分辨率融合算法输出执行有监督学习训练，在达到训练拟合回归性的同时通过不断的训练和学习提升多分辨率融合算法的生成目标对象全清晰的融合图像方面的准确性。

在一些实施例中，所述融合模块被进一步配置成基于所述损失率或所述经标注掩码图或这两者的组合来更新所述融合模块。将计算所得的损失率与经真值标注的掩码图一起反馈至多分辨率融合算法，对多分辨率融合算法输出执行有监督学习训练，在达到训练拟合回归性的同时通过不断的训练和学习提升多分辨率融合算法的生成目标对象全清晰的融合图像方面的准确性。

第三方面，本申请提供了一种图像的处理系统，包括：其上存储有计算机可执行指令存储器；以及与所述存储器耦合的处理器，其中所述计算机可执行指令在由所述处理器执行时致使所述系统执行如下操作：采集包含目标对象的输入图像序列；以及对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

通过阅读对下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在全部附图中，用相同的附图标号表示相同的部件。在附图中：

图1是根据本申请的一些实施例的图像的处理方法的流程图；

图2是根据本申请的一些实施例的图像处理系统的功能框图；

图3是根据本申请的一些实施例的融合模块的结构框图；

图4是根据本申请的一些实施例的融合模块的具体实现示意图；

图5是适于实现根据本申请的一些实施例的图像的处理系统的计算机系统的结构框图。

具体实施方式

下面将结合附图对本申请技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本申请的技术方案，因此只作为示例，而不能以此来限制本申请的保护范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。

在本申请实施例的描述中，技术术语“第一”“第二”等仅用于区别不同对象，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量、特定顺序或主次关系。在本申请实施例的描述中，“多个”的含义是两个以上，除非另有明确具体的限定。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

在本申请实施例的描述中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

在动力锂电池生产过程中，由于工艺及设备原因，缺陷不可避免。贯穿产线的各个环节，检测锂电池的极耳是否存在翻折是至关重要的一环，其检测结果有效性确保了电池出厂的安全性。例如，在通过拍摄生产线上产出的锂电池的图像并且对图像中诸如极耳之类的目标对象执行缺陷检测的情形中，由于摄像机镜头受景深的限制，无法同时聚焦所有极片，因此拍摄的照片中往往部分极片清晰而部分极片模糊。因而，通常无法通过仅拍摄单张照片来获得其中极耳的所有极片都清晰的图像。在实践中，往往通过在同一场景下拍摄多张聚焦区域不同的图像并且将该多张图像融合成一张图像以供后续的缺陷检测。

一些融合图像的方法包括例如利用低通和高通滤波器的反卷积网络来提取源图像的低频和高频信息以融合图像。该方法由于未能充分利用网络中间层信息，因此根据推断的融合特征图与卷积求和而得到的融合图像往往丢失源图像序列中的部分不同清晰聚焦的原始信息。另一些融合图像的方法包括通过对标签图像的不同区域执行高斯模糊处理来作为训练数据。该方法由于训练数据并非来自真实产线，因而难以模拟和覆盖实际需求，实用性较差。

针对上述问题，本申请提供了能够提供目标对象的每一像素均聚焦的融合图像的图像处理技术。本申请的图像处理的方法包括：采集包含目标对象的输入图像序列；以及对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。

本申请的方案从语义分割神经网络的结构入手，提出端到端的基于深度学习的自适应多聚焦融合方案。在本申请中，使图像序列通过模型编码器部分以提取深度特征，对特征进行融合，利用解码器生成融合图像，从而使得深度学习语义分割神经网络能够通过内部卷积学习到每个清晰像素点的相对位置信息(即输入图像序列的索引)，提取输入图像序列中对应于最清晰的部分以对其执行像素级融合以将同一场景下聚焦区域不同的图像序列融合成单张目标对象全清晰的图像，实现像素级精度的全清晰且保留目标对象细节信息的融合图像，有效提高图像的信息利用率，并且通过深度模型减少传统算法对阈值的依赖性，增强融合鲁棒性。

本申请的实施例的技术方案适用于对输入图像序列进行融合并且要求融合图像中的目标对象的每一像素均具有高分辨率的情形，包括但不限于，锂电池中诸如极耳等部件的全清晰融合图像的获取，医学领域中病毒细胞的全清晰融合图像的获取、军事领域中目标设施或点位的全清晰融合图像的获取、以及任何其他适用的场景下对输入图像序列进行融合并且要求融合图像中的目标对象的每一像素均具有高分辨率的情形。

参照图1，其示出了根据本申请的一些实施例的图像的处理方法的流程图，本申请提供了一种图像的处理方法。如图1所示，该方法包括：在步骤105，采集包含目标对象的输入图像序列；以及在步骤110，对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。

在一些示例中，输入图像序列可包括在同一场景对目标对象的不同部分进行聚焦所拍摄的一系列图像，诸如在同一场景下对极耳的不同极片进行聚焦的图像序列，该图像序列中的每一图像具有对应的索引，诸如图像1、图像2、……、图像k。在一些示例中，对所述输入图像序列执行多分辨率融合以生成融合图像可包括将输入图像序列(诸如图像1、图像2、……、图像k)输入到执行多分辨率融合算法的融合模块中以生成包含单张的融合图像(诸如图像k+1)。在一些示例中，该多分辨率融合算法是可由深度学习语义分割神经网络实现的算法，其学习输入图像序列中目标对象的每一个像素在其中聚焦的图像序列索引，提取对应于该图像序列索引的像素中的值并执行多分辨率像素级融合，从而生成目标对象的每一像素均聚焦的融合图像。例如，该多分辨率融合算法学习输入图像的第i行第j列像素(呈现目标对象的像素)在图像序列1-k之中在图像2中聚焦，输入图像的第i行第j+1列像素在图像序列1-k之中在图像k中聚焦，则可获得针对第i行第j列像素的图像索引值为2，针对第i行第j+1列像素的图像索引值为k，以此类推来获取输入图像中的目标对象的每一像素在其中聚焦的图像序列索引的集合，提取图像序列1-k中每一像素在其中聚焦的输入图像的像素(即针对第i行第j列像素从图像序列1-k中的图像2中提取对应像素的像素值，针对第i行第j+1列像素从图像序列1- k中的图像k中提取对应像素的像素值)并将这些像素融合在一起，从而生成其中目标对象的每一像素是聚焦的融合图像。

根据本申请的一些实施例，可选地，步骤105进一步包括：基于所述输入图像序列的帧数和所述输入图像序列中的所述目标对象的尺寸来设置用于采集所述输入图像序列的相机的步长。

在一些示例中，例如在使用CCD相机来采集图像序列的情形中，首先可根据测量(例如，经由机械设备进行物理测量)得到目标对象(诸如极耳)的宽度L，接着可基于连续拍摄输入图像序列的帧数k来设置CCD相机所采用的步长，例如m＝L/step。

基于目标对象的尺寸和输入图像序列的帧数来设置相机步长能够确保所采集的输入图像序列能够覆盖目标对象的所有聚焦区域，从而保证融合图像中的目标对象的每一像素均包括聚焦部分。

根据本申请的一些实施例，可选地，进一步参考图2-图3，图2是根据本申请的一些实施例的融合模块的结构框图并且图3是根据本申请的一些实施例的融合模块的具体实现示意图，所述输入图像序列包含索引，步骤110进一步包括：对所述输入图像序列执行特征提取；对所提取的特征执行多分辨率融合，得到融合后的多分辨率特征；基于融合后的多分辨率特征生成预测掩码图，其中所述预测掩码图的每一像素指示输入图像的索引，所述索引指示所述融合图像的每一像素源自的输入图像；以及根据所述预测掩码图和所述输入图像序列生成所述融合图像。

在一些示例中，假设输入图像序列为分辨率为5120*5120*1的灰度图像序列(包括图像1、图像2、……、图像k)，对所述输入图像序列执行特征提取可包括在将每一输入图像分别输入到用于执行多分辨率融合算法的融合模块中的编码器，以得到该图像的多分辨率特征，如图2所示。在一些示例中，该编码器的基本结构可包括卷积(convolution)层、批量归一化(batch normalization)层、以及非线性激活(rectified linear unit，RLU)层，如图3所示。在一些示例中，对所提取的特征执行多分辨率融合可包括将输入图像序列1-k的每一图像的多分辨率特征输入用于执行多分辨率融合算法的融合模块中编码器模块中的融合层以对其执行拼接式(concatenation，或concat)融合，如图2所示。在一些示例中，基于融合后的多分辨率特征生成预测掩码图可包括将融合后的多分辨率特征输入用于执行多分辨率融合算法的融合模块中的解码器模块以输出预测掩码图，其中该预测掩码图的每一像素指示该像素在其中聚焦的输入图像的索引，例如预测掩码图中的每个像素点值为0、1、……k(0表示背景(非目标对象)，而1、2、……k表示图像序列索引)，如图2所示。在一些示例中，该解码器的基本结构可包括卷积层、批量归一化层、非线性激活层、双线性上采样(bilinear upsample)层，如图3所示。在一些示例中，根据所述预测掩码图和所述输入图像序列生成所述融合图像可包括根据其中每个像素点指示目标对象的每一像素在其中聚焦的图像序列索引和输入图像序列1-k，可得到目标对象的每一像素均聚焦的融合图像，例如，融合图像的第i行第j列像素包括来自图2的对应像素的值，融合图像的第i行第j+1列像素包括来自图k的对应像素的值，以此类推。

通过语义分割的方式寻找到多帧图像序列中目标对象最清晰的部分进行融合，可以使得深度学习语义分割神经网络内部卷积学习每个清晰像素点的相对位置信息(即输入图像序列的索引)，提取输入图像序列中对应于最清晰的部分以对其执行像素级融合以将同一场景下聚焦区域不同的图像序列融合成单张目标对象全清晰的图像，实现像素级精度的全清晰且保留目标对象细节信息的融合图像，有效提高图像的信息利用率。

根据本申请的一些实施例，可选地，所述方法进一步包括：将2D融合算法应用于所述输入图像序列以生成初始融合图像；以及接收对所述初始融合图像的真值标注以生成经标注掩码图，其中所述经标注掩码图指示所述初始融合图像中的所述目标对象的一个或多个像素是否聚焦。

在一些示例中，将2D融合算法应用于所述输入图像序列以生成初始融合图像可包括利用现有技术中的图像融合算法来获得输入图像序列(诸如图像1、图像2、……图像k)的初始融合图像(诸如图像k+1’)。在一些示例中，接收对所述初始融合图像的真值标注以生成经标注掩码图可包括接收对初始融合图像(诸如图像k+1’)的真(ground truth，GT)值标注以生成经标注掩码器，其中该经标注掩码图指示初始融合图像中的所述目标对象的每一像素是否聚焦。在一些示例中，经标注掩码图的每一像素的值可为0或1，其中1指示该像素聚焦而0指示该像素不聚焦。在一些示例中，该经标注掩码图将不聚焦的目标对象的一个或多个像素通过掩码方式剔除出数据样本，从而使得被反馈至用于执行多分辨率融合的多分辨率融合算法的数据仅包含聚焦像素的真值标注。

以半自动标注方式对初始融合图像中目标对象依旧模糊(非聚焦)的部分标注掩码，将其剔除出训练样本集，获取仅包含聚焦像素的真值标注的真实训练数据集，能够快速产生大量与任务相关的训练数据，并且能够通过真实有效的产线数据来进行语义分割模型训练。本申请的方案针对不同的产线只需要搜集部分真实有效数据进行微调训练，就能够批量复制并推广到这些不同的产线，能够覆盖实际需求，将该技术真正落实到各产线的实际应用中。

根据本申请的一些实施例，可选地，所述方法进一步包括：计算所述预测掩码图与所述经标注掩码图之间的损失率；将计算所得的所述损失率反馈至用于执行所述多分辨率融合的多分辨率融合算法。

在一些示例中，计算所述预测掩码图与所述经标注掩码图之间的损失率可包括如下利用MSE(平均平方误差损失函数)和SSIM(图像质量损失函数)中的一者或多者：

其中

表示图像中第i行第j列像素值对应的真实标签值(经标注掩码图中的GT值)，

表示图像中第i行第j列像素值对应的预测标签值(预测掩码图中的值)，m*n表示图像分辨率。

其中u表示图像块(patch)的所有像素的平均值，σ表示图像块内的像素方差。在在一些示例中，校正系数C ₁＝(K ₁×R) ²，C ₂＝(K ₂×R) ²，其中R为根据图像数据类型所确定的动态范围，K为加权因子。在一些示例中，在图像数据类型为unit8的情形中，R的值为0到255，在数据图像类型为浮点的情形中，R的值为-1到1。在一些示例中，K ₁和K ₂的值可根据试探法得出。在一些示例中，K ₁可取 0.01，而K ₂可取0.03。在一些示例中，图像块(patch)的选择可利用划窗方式来实现，诸如采用11×11的划窗大小来选择图像块，只要划窗边长为奇数即可(保证存在中心像素)。SSIM关注图像三个方面的相似性：图像照明度(诸如图像块均值、灰度值)、图像对比度(诸如图像块方差)以及图像结构比(诸如归一化后的像素向量)。在一些示例中，可以利用MSE和SSIM损失函数中的任何一者或两者来衡量融合图像(预测掩码图)与输入图像序列(经标注掩码图)的相似性，从而达成训练拟合回归性。

多分辨率融合算法输出的预测掩码图和/或融合图像与经真值标注的掩码图之间的损失率反应了多分辨率融合算法输出的预测掩码图和/或融合图像与原始输入图像之间的相似性。将该损失率反馈至多分辨率融合算法，与经真值标注的掩码图一起对多分辨率融合算法输出执行有监督学习训练，在达到训练拟合回归性的同时通过不断的训练和学习提升多分辨率融合算法的生成目标对象全清晰的融合图像方面的准确性。

根据本申请的一些实施例，可选地，所述方法进一步包括：基于所述损失率或所述经标注掩码图或这两者的组合来更新用于执行所述多分辨率融合的多分辨率融合算法。

将计算所得的损失率与经真值标注的掩码图一起反馈至多分辨率融合算法，对多分辨率融合算法输出执行有监督学习训练，在达到训练拟合回归性的同时通过不断的训练和学习提升多分辨率融合算法的生成目标对象全清晰的融合图像方面的准确性。

根据本申请的一些实施例，参考图1-图3，本申请提供了一种图像的处理方法，包括：采集包含极耳的输入图像序列，所述输入图像序列包含索引1……k，其中根据测量得到的极耳的宽度L和连续拍摄输入图像序列的帧数k来设置用于采集输入图像序列的CCD相机所采用的步长，即m＝L/step；将2D融合算法应用于所述输入图像序列以生成初始融合图像；接收对所述初始融合图像的真值标注以生成经标注掩码图，其中所述经标注掩码图指示所述初始融合图像中的极耳的一个或多个像素是否聚焦；对所述输入图像序列执行深度特征提取；对所提取的深度特征执行多分辨率融合，得到融合后的多分辨率特征；基于融合后的多分辨率特征生成预测掩码图，其中所述预测掩码图的每一像素指示输入图像的索引，所述索引指示所述融合图像的每一像素源自的输入图像；根据所述预测掩码图和所述输入图像序列生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含极耳的每一像素包括所述输入图像序列中极耳的一部分在其中聚焦的一个输入图像的对应位置的像素；利用MSE和SSIM损失函数来计算所述预测掩码图与所述经标注掩码图之间的损失率，其中

其中

表示图像中第i行第j列像素值对应的预测标签值(预测掩码图中的值)，m*n表示图像分辨率，

其中以11×11的划窗大小来选择图像块，u表示图像块(patch)的所有像素的平均值，σ表示图像块内的像素方差，C ₁＝(K ₁×R) ²，C ₂＝(K ₂×R) ²，R的值为0到255，K ₁＝0.01，而K ₂＝0.03；将计算所得的所述损失率反馈至用于执行所述多分辨率融合的多分辨率融合算法；以及基于所述损失率或所述经标注掩码图或这两者的组合来更新用于执行所述多分辨率融合的多分辨率融合算法。

参照图4，其示出了根据本申请的一些实施例的图像的处理系统的功能框图，本申请提供了一种图像的处理系统。在图4中，加粗矩形框表示被配置成执行参考上文所描述的各操作的逻辑模块，而旗帜形框表示在前的逻辑模块的输出。在图4中，箭头表示参考上文所描述的各操作的逻辑顺序和方向。如图4所示，该系统包括：采集模块405，其被配置成采集包含目标对象的输入图像序列；以及融合模块410，其被配置成对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。

根据本申请的一些实施例，可选地，所述采集模块405被进一步配置成基于所述输入图像序列的帧数和所述输入图像序列中的所述目标对象的尺寸来设置用于采集所述输入图像序列的相机的步长。

根据本申请的一些实施例，可选地，进一步参考图2-图3，图2是根据本申请的一些实施例的融合模块的结构框图并且图3是根据本申请的一些实施例的融合模块的具体实现示意图，所述输入图像序列包含索引，所述融合模块410进一步包括：编码器，其被配置成：对所述输入图像序列执行特征提取；对所提取的特征执行多分辨率融合，得到融合后的多分辨率特征；以及解码器，其被配置成：基于融合后的多分辨率特征生成预测掩码图，其中所述预测掩码图的每一像素指示输入图像的索引，所述索引指示所述融合图像的每一像素源自的输入图像。

根据本申请的一些实施例，可选地，所述融合模块410被进一步配置成根据所述预测掩码图和所述输入图像序列生成所述融合图像。

根据本申请的一些实施例，可选地，所述系统进一步包括：初始融合模块415，其被配置成将2D融合算法应用于所述输入图像序列以生成初始融合图像；以及标注接收模块420，其被配置成接收对所述初始融合图像的真值标注以生成经标注掩码图，其中所述经标注掩码图指示所述初始融合图像中的所述目标对象的一个或多个像素是否聚焦。

根据本申请的一些实施例，可选地，所述系统进一步包括：损失率模块425，其被配置成：计算所述预测掩码图与所述经标注掩码图之间的损失率；将计算所得的所述损失率反馈至所述融合模块。

根据本申请的一些实施例，可选地，所述融合模块410被进一步配置成基于所述损失率或所述经标注掩码图或这两者的组合来更新所述融合模块。

根据本申请的一些实施例，参考图2-图4，本申请提供了一种图像的处理系统，包括：

采集模块405，其被配置成采集包含极耳的输入图像序列，所述输入图像序列包含索引1……k，其中根据测量得到的极耳的宽度L和连续拍摄输入图像序列的帧数k来设置用于采集输入图像序列的CCD相机所采用的步长，即m＝L/step；

融合模块410，所述融合模块包括：

编码器，其被配置对所述输入图像序列执行深度特征提取；对所提取的深度特征执行多分辨率融合，得到融合后的多分辨率特征；

解码器，其被配置成基于融合后的多分辨率特征生成预测掩码图，其中所述预测掩码图的每一像素指示输入图像的索引，所述索引指示所述融合图像的每一像素源自的输入图像；

所述融合模块410被进一步配置成根据所述预测掩码图和所述输入图像序列生成所述融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含极耳的每一像素包括所述输入图像序列中极耳的一部分在其中聚焦的一个输入图像的对应位置的像素；以及基于所述损失率或所述经标注掩码图或这两者的组合来更新用于执行所述多分辨率融合的多分辨率融合算法；

初始融合模块415，其被配置成将2D融合算法应用于所述输入图像序列以生成初始融合图像；

标注接收模块420，其被配置成接收对所述初始融合图像的真值标注以生成经标注掩码图，其中所述经标注掩码图指示所述初始融合图像中的极耳的一个或多个像素是否聚焦；

损失率模块425，其被配置成利用MSE和SSIM损失函数来计算所述预测掩码图与所述经标注掩码图之间的损失率，其中

其中

其中以11×11的划窗大小来选择图像块，u表示图像块(patch)的所有像素的平均值，σ表示图像块内的像素方差，C ₁＝(K ₁×R) ²，C ₂＝(K ₂×R) ²，R的值为0到255，K ₁＝0.01，而K ₂＝0.03；将计算所得的所述损失率反馈至所述融合模块。

参照图5，其是适于实现根据本申请的一些实施例的图像的处理系统的计算机系统的结构框图。如图5所示，该系统包括：其上存储有计算机可执行指令存储器028；以及与所述存储器028耦合的处理器016，其中所述计算机可执行指令在由所述处理器016执行时致使所述系统执行如下操作：采集包含目标对象的输入图像序列；以及对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。

在一些示例中，图5示出了适于用来实现本发明实施方式的示例性计算机系统012的框图。图5显示的计算机系统012仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，计算机系统012以通用计算设备的形式表现。计算机系统012的组件可以包括但不限于：一个或者多个处理器或者处理单元016，系统存储器028，连接不同系统组件(包括系统存储器028和处理单元016)的总线018。

总线018表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

计算机系统012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统012访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器028可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统034可以用于读写不可移动的、非易失性磁介质(图5未显示，通常称为“硬盘驱动器”)。尽管图5中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM、DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块042的程序/实用工具040，可以存储在例如存储器028中，这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。

计算机系统012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信，在本发明中，计算机系统012与外部雷达设备进行通信，还可与一个或者多个使得用户能与该计算机系统012交互的设备通信，和/或与使得该计算机系统012能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且，计算机系统012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器020通过总线018与计算机系统012的其它模块通信。应当明白，尽管图7中未示出，可以结合计算机系统012使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元016通过运行存储在系统存储器028中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的方法流程。

上述的计算机程序可以设置于计算机存储介质中，即该计算机存储介质被编码有计算机程序，该程序在被一个或多个计算机执行时，使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。例如，被上述一个或多个处理器执行本发明实施例所提供的方法流程。

随着时间、技术的发展，介质含义越来越广泛，计算机程序的传播途径不再受限于有形介质，还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。

计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围，其均应涵盖在本申请的权利要求和说明书的范围当中。尤其是，只要不存在结构冲突，各个实施例中所提到的各项技术特征均可以任意方式组合起来。本申请并不局限于文中公开的特定实施例，而是包括落入权利要求的范围内的所有技术方案。

Claims

一种图像的处理方法，包括：

采集包含目标对象的输入图像序列；以及

对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。
如权利要求1所述的方法，其特征在于，采集输入图像序列进一步包括：

基于所述输入图像序列的帧数和所述输入图像序列中的所述目标对象的尺寸来设置用于采集所述输入图像序列的相机的步长。
如权利要求1-2中任一项所述的方法，其特征在于，所述输入图像序列包含索引，对所述输入图像序列执行多分辨率融合以生成融合图像进一步包括：

对所述输入图像序列执行特征提取；

对所提取的特征执行多分辨率融合，得到融合后的多分辨率特征；

基于融合后的多分辨率特征生成预测掩码图，其中所述预测掩码图的每一像素指示输入图像的索引，所述索引指示所述融合图像的每一像素源自的输入图像；以及

根据所述预测掩码图和所述输入图像序列，生成所述融合图像。
如权利要求1-3中任一项所述的方法，其特征在于，所述方法进一步包括：

将2D融合算法应用于所述输入图像序列以生成初始融合图像；以及

接收对所述初始融合图像的真值标注以生成经标注掩码图，其中所述经标注掩码图指示所述初始融合图像中的所述目标对象的一个或多个像素是否聚焦。
如权利要求4所述的方法，其特征在于，所述方法进一步包括：

计算所述预测掩码图与所述经标注掩码图之间的损失率；

将计算所得的所述损失率反馈至用于执行所述多分辨率融合的多分辨率融合算法。
如权利要求5所述的方法，其特征在于，所述方法进一步包括：

基于所述损失率或所述经标注掩码图或这两者的组合来更新用于执行所述多分辨率融合的多分辨率融合算法。
一种图像的处理系统，包括：

采集模块，其被配置成采集包含目标对象的输入图像序列；以及

融合模块，其被配置成对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。
如权利要求7所述的系统，其特征在于，所述采集模块被进一步配置成基于所述输入图像序列的帧数和所述输入图像序列中的所述目标对象的尺寸来设置用于采集所述输入图像序列的相机的步长。
如权利要求7-8中任一项所述的系统，其特征在于，所述输入图像序列包含索引，所述融合模块进一步包括：

编码器，其被配置成：

对所述输入图像序列执行特征提取；

对所提取的特征执行多分辨率融合，得到融合后的多分辨率特征；以及

解码器，其被配置成：

基于融合后的多分辨率特征生成预测掩码图，其中所述预测掩码图的每一像素指示输入图像的索引，所述索引指示所述融合图像的每一像素源自的输入图像。
如权利要求9所述的系统，其特征在于，所述融合模块被进一步配置成根据所述预测掩码图和所述输入图像序列生成所述融合图像。
如权利要求7-10中任一项所述的系统，其特征在于，所述系统进一步包括：

初始融合模块，其被配置成将2D融合算法应用于所述输入图像序列以生成初始融合图像；以及

标注接收模块，其被配置成接收对所述初始融合图像的真值标注以生成经标注掩码图，其中所述经标注掩码图指示所述初始融合图像中的所述目标对象的一个或多个像素是否聚焦。
如权利要求11所述的系统，其特征在于，所述系统进一步包括：

损失率模块，其被配置成：

计算所述预测掩码图与所述经标注掩码图之间的损失率；

将计算所得的所述损失率反馈至所述融合模块。
如权利要求12所述的系统，其特征在于，所述融合模块被进一步配置成基于所述损失率或所述经标注掩码图或这两者的组合来更新用于执行所述多分辨率融合的多分辨率融合算法。
一种图像的处理系统，包括：

其上存储有计算机可执行指令存储器；以及

与所述存储器耦合的处理器，其中所述计算机可执行指令在由所述处理器执行时致使所述系统执行如下操作：

采集包含目标对象的输入图像序列；以及

对所述输入图像序列执行多分辨率融合以生成单个融合图像，其中所述融合图像的像素包括所述输入图像序列中的一个输入图像的对应位置的像素，所述融合图像中包含所述目标对象的每一像素包括所述输入图像序列中所述目标对象的一部分在其中聚焦的一个输入图像的对应位置的像素。