CN116152079A - 图像处理方法及图像处理模型训练方法 - Google Patents
图像处理方法及图像处理模型训练方法 Download PDFInfo
- Publication number
- CN116152079A CN116152079A CN202211085698.2A CN202211085698A CN116152079A CN 116152079 A CN116152079 A CN 116152079A CN 202211085698 A CN202211085698 A CN 202211085698A CN 116152079 A CN116152079 A CN 116152079A
- Authority
- CN
- China
- Prior art keywords
- image
- layer
- feature map
- initial
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 229
- 238000012549 training Methods 0.000 title claims abstract description 135
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 238000000605 extraction Methods 0.000 claims abstract description 231
- 238000010606 normalization Methods 0.000 claims description 36
- 238000013507 mapping Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 26
- 238000011176 pooling Methods 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 16
- 238000002372 labelling Methods 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 15
- 238000013519 translation Methods 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 18
- 238000010586 diagram Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 3
- 238000001303 quality assessment method Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供一种图像处理方法及图像处理模型训练方法,所述图像处理方法包括:获取待处理图像,将待处理图像输入至图像处理模型中,得到去噪后的图像,其中,图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,第一特征提取层用于对待处理图像进行特征提取,得到初始特征图,至少一注意力特征提取层用于对初始特征图进行特征加权处理,得到加权特征图,第二特征提取层用于对初始特征图以及加权特征图进行残差处理,得到去噪后的图像,加权特征图用于指示初始特征图中各区域是否属于添加噪声的区域。本申请提高了局部模糊的图像去噪效果,进而提高了图像去噪的准确性。
Description
技术领域
本申请实施例涉及图像处理技术领域,尤其涉及一种图像处理方法及图像处理模型训练方法。
背景技术
随着网络技术的发展,图像已成为用户间最常用的信息载体,成为用户获取外界信息的主要途径。
现有技术中,图像在获取以及传输等过程中常常会受到各种噪声的干扰,而使图像质量下降,因此,为了获取高质量图像,一般需要对图像进行降噪处理,在保持原始信息完整性的同时,又能去除图像中无用的信息。
然而,常用的降噪处理方式一般是针对图像整体进行去噪的,对于局部模糊的图像去噪效果较差,降低了图像去燥的准确性。
发明内容
本申请实施例提供一种图像处理方法及图像处理模型训练方法,以提高图像去燥的准确性。
第一方面,本申请实施例提供一种图像处理方法,包括:
获取待处理图像;
将所述待处理图像输入至图像处理模型中,得到去噪后的图像,其中,所述图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,所述第一特征提取层用于对所述待处理图像进行特征提取,得到初始特征图;所述至少一注意力特征提取层用于对所述初始特征图进行特征加权处理,得到加权特征图;所述第二特征提取层用于对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的图像,所述加权特征图用于指示所述初始特征图中各区域是否属于添加噪声的区域。
可选的,每个所述注意力特征提取层包括:第一输入层、映射层以及子特征提取层,则所述至少一注意力特征提取层用于对所述初始特征图进行特征加权处理,得到加权特征图,包括:
针对每个所述注意力特征提取层,通过所述第一输入层对所述初始特征图进行预处理,得到预设尺寸的初始特征图;
通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,其中,所述权重图中每个像素点的像素值表示像素点的清晰程度,像素值越小,表示像素点的清晰程度越高,且所述权重图中像素点的像素值在第一预设区间范围内;
通过所述子特征提取层对所述权重图与所述初始特征图进行加权处理,得到加权特征图。
可选的,所述映射层包括通道池化层以及归一化层,则所述通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,包括:
通过所述通道池化层对所述预设尺寸的初始特征图进行通道降维处理,得到单一通道的特征图;
通过所述归一化层对所述单一通道的特征图进行归一化处理,得到权重图。
可选的,所述子特征提取层包括残差网络层以及拓展卷积层,则所述通过所述子特征提取层对所述权重图与所述初始特征图进行加权处理,得到加权特征图,包括:
通过所述残差网络层对所述权重图与所述初始特征图进行残差处理,得到初始加权特征图;
通过所述拓展卷积层对所述初始加权特征图进行特征提取,得到加权特征图。
可选的,所述拓展卷积层包括第二输入层、第一子卷积层、激活函数层、第二子卷积层、子残差网络层以及输出层,
则所述通过所述拓展卷积层对所述初始加权特征图进行特征提取,得到加权特征图,包括:
通过所述第二输入层以及所述第一子卷积层对所述初始加权特征图进行平移变换处理,得到平移变换后的初始加权特征图;
通过所述激活函数层对所述平移变换后的初始加权特征图进行激活处理,得到非线性的初始加权特征图;
通过所述第二子卷积层对所述非线性的初始加权特征图进行特征集中提取处理,得到集中加权特征图;
通过所述子残差网络层对所述初始加权特征图与所述集中加权特征图进行残差处理,得到加权特征图,并通过所述输出层输出所述加权特征图。
可选的,所述注意力特征提取层为至少两个,且所述注意力特征提取层包含第一子注意力特征提取层和第二子注意力特征提取层,所述第一子注意力层对应至少一第二子注意力层,
则所述通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,包括:
针对每个所述第一子注意力特征提取层,通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图;
针对每个与所述第一子注意力特征提取层对应的第二子注意力特征提取层,直接获取对应的第一子注意力特征提取层确定的权重图。
可选的,在所述将所述待处理图像输入至图像处理模型中,得到去噪后的图像之后,还包括:
识别所述去噪后的图像中包含的目标对象,其中,所述目标对象为人、动物、植物、交通标牌以及车牌号中的至少一种;
若所述目标对象与预设对象相匹配,则确定所述目标对象验证通过。
第二方面,本申请实施例提供一种图像处理模型训练方法,图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,所述方法包括:
获取图像训练样本集,其中,所述图像训练样本集中包含至少一图像训练样本;
将所述图像训练样本集输入所述图像处理模型进行模型训练,得到训练后的图像处理模型;
其中,通过所述第一特征提取层对每个所述图像训练样本进行特征提取,得到初始特征图;通过所述至少一注意力特征提取层对所述初始特征图进行特征加权处理,得到加权特征图,其中,所述加权特征图用于指示所述初始特征图中各区域是否属于添加噪声的区域;通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理。
可选的,所述图像训练样本中包含添加噪声的训练图像以及所述训练图像对应的标注标签,所述标注标签为所述训练图像对应的未添加噪声的清晰图像,
则所述通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理,得到训练后的图像处理模型,包括:
通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的训练图像;
根据去噪后的训练图像以及所述训练图像对应的未添加噪声的清晰图像确定第一损失值,并根据所述第一损失值得到训练后的图像处理模型。
可选的,所述标注标签还包括分数值,所述分数值表示所述添加噪声的训练图像的整体清晰程度,
则在所述根据去噪后的训练图像以及所述训练图像对应的未添加噪声的清晰图像确定第一损失值之后,还包括:
根据所述去噪后的训练图像以及所述分数值确定第二损失值;
对应的,所述根据所述第一损失值得到训练后的图像处理模型,包括:
根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型。
可选的,在所述根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型之前,还包括:
根据去噪后的训练图像、所述训练图像对应的未添加噪声的清晰图像以及预设阈值函数确定初始差值特征图,其中,所述初始差值特征图中每个像素点的像素值表示所述去噪后的训练图像中的像素值与所述清晰图像中对应的像素点的像素值的差值,且所述初始差值特征图中像素点的像素值第二预设区间范围内;
将所述差值特征图中每个像素点的像素值减去预设像素阈值,得到差值特征图,其中,所述预设像素阈值与所述第二预设区间范围内较小的区间端点接近;
根据所述差值特征图确定第三损失值;
对应的,所述根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型,包括:
根据所述第一损失值、所述第二损失值以及所述第三损失值得到训练后的图像处理模型。
第三方面,本申请实施例提供一种图像处理装置,包括:
第一获取层,用于获取待处理图像;
第一处理层,用于将所述待处理图像输入至图像处理模型中,得到去噪后的图像,其中,所述图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,所述第一特征提取层用于对所述待处理图像进行特征提取,得到初始特征图;所述至少一注意力特征提取层用于对所述初始特征图进行特征加权处理,得到加权特征图;所述第二特征提取层用于对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的图像,所述加权特征图用于指示所述初始特征图中各区域是否属于添加噪声的区域。
第四方面,本申请实施例提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面以及第二方面任一项所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,以实现如第一方面以及第二方面任一项所述的方法。
本申请实施例提供了一种图像处理方法及图像处理模型训练方法,采用上述方案后,可以先获取待处理图像,然后可以将待处理图像输入至训练好的图像处理模型中,得到去噪后的图像,其中,该图像处理模型可以包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,第一特征提取层用于对待处理图像进行特征提取,得到初始特征图,至少一注意力特征提取层用于对初始特征图进行特征加权处理,得到加权特征图,第二特征提取层用于对初始特征图以及用于指示初始特征图中各区域是否属于添加噪声的区域的加权特征图进行残差处理,得到去噪后的图像,通过对图像处理模型的结构进行改进,增加了注意力特征提取层,且通过该注意力特征提取层可以确定图像中添加噪声的区域,并增加图像中添加噪声的区域的权重,使得图像处理模型在训练过程中可以更加关注图像中添加噪声的区域,提高了局部模糊的图像去噪效果,进而提高了图像去燥的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的图像处理模型训练方法的应用系统的架构示意图;
图2为本申请实施例提供的图像处理模型训练方法的流程示意图;
图3为本申请实施例提供的注意力特征提取层的应用示意图;
图4为本申请另一实施例提供的注意力特征提取层的应用示意图;
图5为本申请实施例提供的图像处理模型的结构示意图;
图6为本申请实施例提供的图像处理模型应用方法的流程示意图;
图7为本申请实施例提供的图像处理模型应用装置的结构示意图;
图8为本申请实施例提供的图像处理模型训练装置的结构示意图;
图9为本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例还能够包括除了图示或描述的那些实例以外的其他顺序实例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
相关技术中,图像在获取以及传输等过程中常常会受到各种噪声的干扰,而使图像质量下降,示例性的,由于传输介质和记录设备等的不完善,数字图像在其传输记录过程中往往会受到多种噪声的污染。此外,还可以通过图像预处理算法(如图像分割算法、目标识别算法、边缘提取算法等)对图像进行处理,得到处理后的图像,然后再应用处理后的图像实现相关的功能,然而,图像预处理算法也会影响图像的质量。因此,为了获取高质量图像,一般需要对图像进行降噪处理,在保持原始信息完整性的同时,又能去除图像中无用的信息。然而,常用的降噪处理方式一般是针对图像整体进行去噪的,对于整体模糊的图像去噪效果较好,但是对于局部模糊的图像去噪效果较差,例如只对人脸添加噪声的图像去噪效果较差,进而降低了图像去燥的准确性。
基于上述技术问题,本申请通过对图像处理模型的结构进行改进,增加了注意力特征提取层,且通过该注意力特征提取层可以确定图像中添加噪声的区域,并增加图像中添加噪声的区域的权重,使得图像处理模型在训练过程中可以更加关注图像中添加噪声的区域,达到了提高了局部模糊的图像去噪效果,进而提高了图像去燥的准确性的技术效果。
图1为本申请实施例提供的图像处理模型训练方法的应用系统的架构示意图,如图1所示,该应用系统可以包括:服务器以及数据库,数据库中存储有图像训练样本集,服务器中部署有图像处理模型。服务器可以从数据库中获取图像训练样本集,并根据获取到的图像训练样本集对图像处理模型进行训练,得到训练后的图像处理模型。其中,图像处理模型可以包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层。服务器在获取到图像训练样本集之后,可以将图像训练样本集输入至图像处理模型中进行模型训练,得到训练后的图像处理模型。其中,可以通过第一特征提取层对每个图像训练样本进行特征提取,得到初始特征图。通过至少一注意力特征提取层对初始特征图进行特征加权处理,得到用于指示初始特征图中各区域是否属于添加噪声的区域的加权特征图。通过第二特征提取层对初始特征图以及加权特征图进行残差处理。
可选的,图像训练样本集也可以为实时标注生成的。其中,图像训练样本集中可以包含一个或多个图像训练样本,每个图像训练样本中可以包含一添加噪声的图像以及对应的标注标签,且该标注标签为添加噪声的图像对应的未添加噪声的清晰图像。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请实施例提供的图像处理方法的流程示意图,如图2所示,在该实施例中,可以包括:
S201:获取待处理图像。
在本实施例中,待处理图像可能为添加了噪声的图像,为了更好的识别图像中的对象,可以先对图像进行去噪处理,然后可以识别去燥后的图像,并根据识别结果执行后续操作。示例性,去噪后的图像中包含的对象为植物或动物,可以在对图像进行去噪处理后,识别去噪后的图像,进而确定植物或动物种类。
S202:将待处理图像输入至图像处理模型中,得到去噪后的图像,其中,图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,第一特征提取层用于对待处理图像进行特征提取,得到初始特征图;至少一注意力特征提取层用于对初始特征图进行特征加权处理,得到加权特征图;第二特征提取层用于对初始特征图以及加权特征图进行残差处理,得到去噪后的图像,加权特征图用于指示初始特征图中各区域是否属于添加噪声的区域。
在本实施例中,在对待处理图像进行去噪处理时,可以通过模型的方式来实现,所述图像处理模型为预先训练的模型,即先训练一图像处理模型,然后可以通过该图像处理模型对待处理图像进行去噪处理,示例性地,具体的图像处理模型训练方法在后续说明书中有说明。
此外,为了提高模型对局部添加噪声的图像的去噪准确性,可以对图像处理模型的结构进行改进,改进后的图像处理模型可以包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,第一特征提取层用于对待处理图像进行特征提取,得到初始特征图,至少一注意力特征提取层用于对初始特征图进行特征加权处理,得到加权特征图;第二特征提取层用于对初始特征图以及加权特征图进行残差处理,得到去噪后的图像,加权特征图用于指示初始特征图中各区域是否属于添加噪声的区域。
采用上述方案后,通过对图像处理模型的结构进行改进,增加了注意力特征提取层,且通过该注意力特征提取层可以确定图像中添加噪声的区域,并增加图像中添加噪声的区域的权重,使得图像处理模型在训练过程中可以更加关注图像中添加噪声的区域,提高了局部模糊的图像去噪效果,进而提高了图像去噪的准确性。
基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
在另一实施例中,每个所述注意力特征提取层包括:第一输入层、映射层以及子特征提取层,则所述至少一注意力特征提取层用于对所述初始特征图进行特征加权处理,得到加权特征图,具体可以包括:
针对每个所述注意力特征提取层,通过所述第一输入层对所述初始特征图进行预处理,得到预设尺寸的初始特征图。
通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,其中,所述权重图中每个像素点的像素值表示像素点的清晰程度,像素值越小,表示像素点的清晰程度越高,所述权重图中像素点的像素值在第一预设区间范围内。
通过所述子特征提取层对所述权重图与所述初始特征图进行加权处理,得到加权特征图。
在本实施例中,注意力特征提取层可以有一个或多个,且具体数量可以根据实际需求以及应用场景的不同自定义进行设置。
可选的,注意力特征提取层可以包括:第一输入层、映射层以及子特征提取层。在得到初始特征图之后,可以先通过第一输入层对初始特征图的格式进行预处理,得到预设尺寸的初始特征图(其中,该预设尺寸可以根据实际应用场景自定义进行设置,在此不再详细进行限定)。然后可以通过映射层对预设尺寸的初始特征图进行归一化处理,得到权重图。该权重图中每个像素点的像素值可以表示像素点的清晰程度,像素值越小,表示像素点的清晰程度越高,像素值越大,表示像素点的清晰程度越低。另外,权重图中像素点的像素值在第一预设区间范围内。示例性的,第一预设区间范围可以为[0,1]。
综上,通过权重图,可以将图像中添加噪声区域的权重增大,进而提高后续的去噪效果。
进一步的,所述映射层包括通道池化层以及归一化层,则所述通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,具体可以包括:
通过所述通道池化层对所述预设尺寸的初始特征图进行通道降维处理,得到单一通道的特征图。
通过所述归一化层对单一通道的特征图进行归一化处理,得到权重图。
具体的,映射层可以包括通道池化层以及归一化层,在得到初始特征图之后,初始特征图可能为多个通道的,为了便于后续的归一化处理,可以通过通道池化层对预设尺寸的初始特征图进行通道降维处理,得到单一通道的特征图。然后可以通过归一化层对单一通道的特征图进行归一化处理,得到权重图。其中,通道池化层以及归一化层可以采用现有的方式实现。示例性的,通道池化层可以为Channel-Wise Pooling层。归一化层可以为sigmoid函数层。
示例性的,图3为本申请实施例提供的注意力特征提取层的应用示意图,如图3所示,在该实施例中,注意力特征提取层可以包含第一输入层、映射层以及子特征提取层,映射层可以包括通道池化层以及归一化层。对应的,可以通过第一输入层对初始特征图进行预处理,得到预设尺寸的初始特征图,然后可以通过通道池化层对预设尺寸的初始特征图进行通道降维处理,得到单一通道的特征图,再通过归一化层对单一通道的特征图进行归一化处理,得到权重图。再通过子特征提取层对权重图与初始特征图进行加权处理,得到加权特征图。
此外,所述子特征提取层可以包括残差网络层以及拓展卷积层,则所述通过所述子特征提取层对所述权重图与所述初始特征图进行加权处理,得到加权特征图,具体可以包括:
通过所述残差网络层对所述权重图与所述初始特征图进行残差处理,得到初始加权特征图。
通过所述拓展卷积层对所述初始加权特征图进行特征提取,得到加权特征图。
具体的,子特征提取层可以包括残差网络层以及拓展卷积层,在得到权重图以及初始特征图之后,可以通过残差网络层对权重图以及初始特征图进行残差处理,得到初始加权特征图,然后可以通过拓展卷积层对初始加权特征图进行进一步的特征提取,使得提取的特征更加具体化,得到加权特征图。
可选的,残差网络层可以将权重图中各像素点的像素值与初始特征图中对应的像素点的像素值相乘,得到初始加权特征图。通过该初始加权特征图,可以将参数权重集中到图像中添加噪声的区域,进而可以提高后续图像去噪的准确性。
更进一步的,所述拓展卷积层包括第二输入层、第一子卷积层、激活函数层、第二子卷积层、子残差网络层以及输出层。所述通过所述拓展卷积层对所述初始加权特征图进行特征提取,得到加权特征图,可以包括:
通过所述第二输入层以及所述第一子卷积层对所述初始加权特征图进行平移变换处理,得到平移变换后的初始加权特征图。
通过所述激活函数层对所述平移变换后的初始加权特征图进行激活处理,得到非线性的初始加权特征图。
通过所述第二子卷积层对所述非线性的初始加权特征图进行特征集中提取处理,得到集中加权特征图。
通过所述子残差网络层对所述初始加权特征图与所述集中加权特征图进行残差处理,得到加权特征图,并通过所述输出层输出所述加权特征图。
具体的,拓展卷积层可以使得提取到的特征更加具体化,拓展卷积层具体可以包括第二输入层、第一子卷积层、激活函数层、第二子卷积层、子残差网络层以及输出层。在得到初始加权特征图之后,可以通过拓展卷积层中的第二输入层以及第一子卷积层对初始加权特征图进行平移变换处理,得到平移变换后的初始加权特征图。其中,第一子卷积层可以包含shift算子与卷积层(示例性的,可以为1*1卷积层),通过设置不同方向的shift算子,可以将输入张量不同的通道进行平移,随后配合1*1卷积层可以实现跨通道的信息融合,进而得到平移变换后的初始加权特征图,该平移变换后的初始加权特征图可以表示模糊空间特征,由于每张模糊的图像模糊特征在整张图的位置是不固定的,通过第一子卷积层可以使得特征更加集中,还可以增加网络的鲁棒性。
另外,在得到平移变换后的初始加权特征图之后,可以通过激活函数层对平移变换后的初始加权特征图进行激活处理,得到非线性的初始加权特征图。示例性的,激活函数层可以为Prelu激活函数,通过该激活函数可以增加神经元的非线性,增加了网络模型的鲁棒性。
另外,在得到非线性的初始加权特征图之后,可以通过第二子卷积层对非线性的初始加权特征图进行特征集中提取处理,得到集中加权特征图。其中,第二子卷积层也可以包含shift算子与卷积层(示例性的,可以为1*1卷积层),通过该第二子卷积层可以得到更加集中的模糊表示的空间特征,即集中加权特征图。
示例性的,图4为本申请另一实施例提供的注意力特征提取层的应用示意图,如图4所示,在该实施例中,注意力特征提取层可以包含第一输入层、映射层以及子特征提取层,映射层可以包括通道池化层以及归一化层。子特征提取层可以包括残差网络层以及拓展卷积层,拓展卷积层可以包括第二输入层、第一子卷积层、激活函数层、第二子卷积层、子残差网络层以及输出层。对应的,可以通过第一输入层对初始特征图进行预处理,得到预设尺寸的初始特征图,然后可以通过通道池化层对预设尺寸的初始特征图进行通道降维处理,得到单一通道的特征图,再通过归一化层对单一通道的特征图进行归一化处理,得到权重图。然后可以通过残差网络层对权重图与初始特征图进行残差处理,得到初始加权特征图。然后可以通过第二输入层以及第一子卷积层对初始加权特征图进行平移变换处理,得到平移变换后的初始加权特征图,再通过激活函数层对平移变换后的初始加权特征图进行激活处理,得到非线性的初始加权特征图,并通过第二子卷积层对非线性的初始加权特征图进行特征集中提取处理,得到集中加权特征图。再通过子残差网络层对初始加权特征图与集中加权特征图进行残差处理,得到加权特征图,并通过输出层输出加权特征图。
综上,通过采用中间有激活函数的两个子卷积层(每个子卷积层包含shift算子与卷积层),可以在不增加计算量的同时增加感受野,进而可以提高局部特征提取的有效性。
在另一实施例中,所述注意力特征提取层为至少两个,且所述注意力特征提取层包含第一子注意力特征提取层和第二子注意力特征提取层,所述第一子注意力层对应至少一第二子注意力层。所述通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,具体可以包括:
针对每个所述第一子注意力特征提取层,通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图。
针对每个与所述第一子注意力特征提取层对应的第二子注意力特征提取层,直接获取对应的第一子注意力特征提取层确定的权重图。
在本实施例中,子注意力特征提取层可以有两种,一种为第一子注意力特征提取层,另一种为第二子注意力特征提取层,第一子注意力特征提取层的数量为一个或多个,且每个第一子注意力特征提取层对应一个或多个第二子注意力特征提取层。另外,第一子注意力特征提取层可以通过映射层确定初始特征图对应的权重图,而与第一子注意力特征提取层对应的一个或多个第二子注意力特征提取层可以直接获取第一子注意力特征提取层确定的权重图,进而根据确定的权重图来确定加权特征图,通过采用将子注意力特征提取层分为两种,且第二子注意力特征提取层直接采用与其对应的第一子注意力特征提取层确定的权重图的方式,即两个子注意力特征提取层的处理对象的权重值是一致的,采用权值共享的方式,减少了模型的计算量,进而提高了模型的训练效率。
此外,第一子注意力特征提取层可以采用上采样的方式提取特征,第二子注意力特征提取层可以采用下采样的方式提取特征。对应的,每个第一子注意力特征提取层可以对应一个第二子注意力特征提取层。
示例性的,图5为本申请实施例提供的图像处理模型的结构示意图,如图5所示,在该实施例中,可以包括第一特征提取层、第一自注意力特征提取层、第二自注意力特征提取层以及第二特征提取层,且第一自注意力特征提取层与第二自注意力特征提取层采用权值共享的方式,即每个第一自注意力特征提取层对应一第二自注意力特征提取层。示例性的,第一自注意力特征提取层有四个,则第二自注意力特征提取层也为4个。
在另一实施例中,在所述将所述待处理图像输入至图像处理模型中,得到去噪后的图像之后,所述方法还可以包括:
识别所述去噪后的图像中包含的目标对象,其中,所述目标对象为人、动物、植物、交通标牌以及车牌号中的至少一种。
若所述目标对象与预设对象相匹配,则确定所述目标对象验证通过。
在本实施例中,在得到去噪后的图像之后,可以先识别去噪后的图像中包含的目标对象,然后根据识别到的目标对象实现相关的功能。
可选的,可以在识别到目标对象之后,将目标对象与预存的对象进行比对,若一致,则可以确定目标对象验证通过。其中,目标对象可以为人、动物、植物、交通标牌或车牌号等。示例性的,若目标对象为人,则可以通过将目标对象与预存的对象进行比对的方式,来实现用户验证等功能。此外,若目标对象与预存的对象不一致,则可以生成不一致提示,进而体现相关人员验证未通过,提高了用户的应用体验。
可选的,还可以在识别到目标对象之后,直接显示目标对象的相关信息。示例性的,目标对象可以为动物或植物,在识别到目标对象之后,可以显示该动物或植物的名称以及相关介绍等信息,便于用户了解该植物或动物等。
图6为本申请实施例提供的图像处理模型训练方法的流程示意图,本实施例的方法可以由服务器执行,所述图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层。如图6所示,本实施例的方法,可以包括:
S601:获取图像训练样本集,其中,图像训练样本集中包含至少一图像训练样本。
在本实施例中,在对图像处理模型进行训练之前,可以先获取图像训练样本集,然后可以根据图像训练样本集对图像处理模型进行训练,得到训练后的图像处理模型。
可选的,图像训练样本集中可以包含至少一图像训练样本,每个图像训练样本中可以包含添加噪声的图像以及对应的标注标签,该标注标签可以为添加噪声的图像对应的未添加噪声的清晰图像(即去噪图像)。其中,图像训练样本可以为自定义标注的数据,也可以为从公共数据集(例如,LIVE2、CSIQ等)中获取的数据,且图像训练样本中图像的尺寸可以自定义进行设置,示例性的,可以为480*640的图像。
此外,不同的图像训练样本对应的噪声添加方式可以不同,示例性的,噪声添加方式可以为高斯噪声、泊松噪声、乘性噪声或椒盐噪声等。
S602:将图像训练样本集输入图像处理模型进行模型训练,得到训练后的图像处理模型。
其中,通过第一特征提取层对每个图像训练样本进行特征提取,得到初始特征图;通过至少一注意力特征提取层对初始特征图进行特征加权处理,得到加权特征图,其中,加权特征图用于指示初始特征图中各区域是否属于添加噪声的区域;通过第二特征提取层对初始特征图以及加权特征图进行残差处理。
在本实施例中,第一特征提取层可以为卷积层,示例性的,第一特征提取层可以包含两个3*3的卷积层,通过该卷积层,可以对图像训练样本中的特征进行浅层提取,得到初始特征图。例如,若图像训练样本中包含的对象为人脸,则初始特征图中主要可以包含人脸的轮廓信息。
此外,图像处理模型中还可以包含一个或多个注意力特征提取层。在得到初始特征图之后,可以通过一个或多个注意力特征提取层对初始特征图进行特征加权处理,得到加权特征图。该加权特征图可以用于指示初始特征图中各区域是否添加了噪声。可选的,可以通过加权特征图中各像素点的像素值来表示初始特征图中各区域是否添加了噪声。
在一种实现方式中,若像素点的像素值高于预设像素阈值,则表明该像素点对应的初始特征图中的区域为添加了噪声的区域;若像素点的像素值低于或等于预设像素阈值,则表明该像素点对应的初始特征图中的区域为未添加噪声的区域。
在另一种实现方式中,可以以像素点的像素坐标为中心,确定预设范围的目标区域,然后确定该目标区域中像素点的像素平均值,再判断该像素平均值与像素阈值的关系。若像素平均值高于预设像素阈值,则表明该像素点对应的初始特征图中的区域为添加了噪声的区域;若像素平均值低于或等于预设像素阈值,则表明该像素点对应的初始特征图中的区域为未添加噪声的区域,通过先确定像素平均值,再根据像素平均值来确定是否为添加了噪声的区域的方式,提高了噪声区域确定的准确性。
此外,本申请仅是列举了几种确定添加噪声区域的几种情况,通过其他方式来确定初始特征图中各区域是否添加噪声的过程也在本申请的保护范围内,在此不再详细进行限定。
此外,在得到初始特征图以及加权特征图之后,还可以通过第二特征提取层对初始特征图以及加权特征图进行残差处理,以补充模型训练过程中图像中丢失的高频信息,进而提高模型训练的准确性。其中,第二特征提取层可以为现有的残差网络,在此不再详细进行限定。
采用上述方案后,通过对图像处理模型的结构进行改进,增加了注意力特征提取层,且通过该注意力特征提取层可以确定图像中添加噪声的区域,并增加图像中添加噪声的区域的权重,使得图像处理模型在训练过程中可以更加关注图像中添加噪声的区域,提高了局部模糊的图像去噪效果,进而提高了图像去噪的准确性。
在另一实施例中,所述图像训练样本中包含添加噪声的训练图像以及所述训练图像对应的标注标签,所述标注标签为所述训练图像对应的未添加噪声的清晰图像。所述通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理,得到训练后的图像处理模型,具体可以包括:
通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的训练图像。
根据去噪后的训练图像以及所述训练图像对应的未添加噪声的清晰图像确定第一损失值,并根据所述第一损失值得到训练后的图像处理模型。
在本实施例中,在图像处理模型训练过程中,可以根据去噪后的训练图像以及训练图像对应的未添加噪声的清晰图像确定第一损失值,并根据第一损失值得到训练后的图像处理模型。示例性的,可以通过损失函数MSE来确定第一损失值,还可以通过表达式Loss1=||HR-unet(LR)||1来确定第一损失值,其中,HR为训练图像对应的未添加噪声的清晰图像,LR为图像处理模型处理得到的去噪图像。
此外,所述标注标签还包括分数值,所述分数值表示所述添加噪声的训练图像的整体清晰程度,则在所述根据去噪后的训练图像以及所述训练图像对应的未添加噪声的清晰图像确定第一损失值之后,还可以包括:
根据所述去噪后的训练图像以及所述分数值确定第二损失值。
对应的,所述根据所述第一损失值得到训练后的图像处理模型,包括:
根据第一损失值以及所述第二损失值得到训练后的图像处理模型。
具体的,标注标签中还可以包括分数值,该分数值可以表示添加噪声的训练图像的整体清晰程度。示例性的,分数值可以为0到100之间的数值,分数值越小,表示训练图像的整体清晰程度越差;分数值越大,表示训练图像的整体清晰程度越好。通过分数值可以确定第二损失值,该第二损失值可以表示图像的整体去噪效果。
可选的,可以通过质量评估模型来确定第二损失值,即将去噪后的训练图像以及分数值输入至训练好的质量评估模型中,即可确定第二损失值。对应的,质量评估模型可以由5组残差网络组成,每组残差网络可以由2个3*3的卷积组成,且通道数均为64,第一个3*3的卷积可以用于增加通道数,第二个3*3的卷积可以对特征进行进一步提取,并对特征进行平滑处理。此外,每组残差网络后连接一个Maxpool(最大池化层)进行降维,可以将任意维度的特征图降到1*1,最后一个残差网络后为一个全局池化,可以保证将所有的特征图的维度降为1*1。此外,全局残差后紧跟2层全连接层,通过全连接层可以得到第二损失值,其中,第一全连接层有64个神经元,第二全连接层有2个神经元。
综上,通过表示局部去噪效果的第一损失值以及表示整体去噪效果的第二损失值相结合的方式,提高了图像去噪的准确性。
此外,在所述根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型之前,还可以包括:
根据去噪后的训练图像、所述训练图像对应的未添加噪声的清晰图像以及预设阈值函数确定初始差值特征图,其中,所述初始差值特征图中每个像素点的像素值表示所述去噪后的训练图像中的像素值与所述清晰图像中对应的像素点的像素值的差值,且所述初始差值特征图中像素点的像素值第二预设区间范围内。
将所述差值特征图中每个像素点的像素值减去预设像素阈值,得到差值特征图,其中,所述预设像素阈值与所述第二预设区间范围内较小的区间端点接近。
根据所述差值特征图确定第三损失值。
对应的,所述根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型,包括:
根据所述第一损失值、所述第二损失值以及所述第三损失值得到训练后的图像处理模型。
具体的,在对图像处理模型进行训练时,除了可以结合第一损失值与第二损失值来进行训练之外,还可以综合第三损失值来实现图像处理模型的训练。
对应的,第三损失值可以根据去噪后的训练图像、训练图像对应的未添加噪声的清晰图像以及预设阈值函数来确定。可选的,可以通过表达式:
M=sigmoid||DR–HR||来确定初始差值特征图,其中,M中像素点的像素值在0-1之间。考虑到可以将损失靠近模糊,因此可以舍去M中像素值小于0.2的像素点,然后可以根据表达式:Lm=MSE(M-0.2)来确定第三损失值,其中,MSE为均方误差函数。
综上,通过采用第三损失值,可以使得确定的损失偏向添加噪声的特征,进而提高模型的去噪效果。
此外,还可以根据实际应用场景为第一损失值、第二损失值以及第三损失值设置不同的权重,进而提高模型的训练效果。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置,图7为本申请实施例提供的图像处理装置的结构示意图,如图7所示,本实施例提供的装置,可以包括:
第一获取层701,用于获取待处理图像。
第一处理层702,用于将所述待处理图像输入至图像处理模型中,得到去噪后的图像,其中,所述图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,所述第一特征提取层用于对所述待处理图像进行特征提取,得到初始特征图;所述至少一注意力特征提取层用于对所述初始特征图进行特征加权处理,得到加权特征图;所述第二特征提取层用于对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的图像,所述加权特征图用于指示所述初始特征图中各区域是否属于添加噪声的区域。
在另一实施例中,每个所述注意力特征提取层包括:第一输入层、映射层以及子特征提取层,则所述第一处理层702,还用于:
针对每个所述注意力特征提取层,通过所述第一输入层对所述初始特征图进行预处理,得到预设尺寸的初始特征图。
通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,其中,所述权重图中每个像素点的像素值表示像素点的清晰程度,像素值越小,表示像素点的清晰程度越高,且所述权重图中像素点的像素值在第一预设区间范围内。
通过所述子特征提取层对所述权重图与所述初始特征图进行加权处理,得到加权特征图。
进一步的,所述映射层包括通道池化层以及归一化层,则所述第一处理层702,还用于:
通过所述通道池化层对所述预设尺寸的初始特征图进行通道降维处理,得到单一通道的特征图。
通过所述归一化层对所述单一通道的特征图进行归一化处理,得到权重图。
进一步的,所述子特征提取层包括残差网络层以及拓展卷积层,则所述第一处理层702,还用于:
通过所述残差网络层对所述权重图与所述初始特征图进行残差处理,得到初始加权特征图。
通过所述拓展卷积层对所述初始加权特征图进行特征提取,得到加权特征图。
更进一步的,所述拓展卷积层包括第二输入层、第一子卷积层、激活函数层、第二子卷积层、子残差网络层以及输出层,则所述第一处理层702,还用于:
通过所述第二输入层以及所述第一子卷积层对所述初始加权特征图进行平移变换处理,得到平移变换后的初始加权特征图。
通过所述激活函数层对所述平移变换后的初始加权特征图进行激活处理,得到非线性的初始加权特征图。
通过所述第二子卷积层对所述非线性的初始加权特征图进行特征集中提取处理,得到集中加权特征图。
通过所述子残差网络层对所述初始加权特征图与所述集中加权特征图进行残差处理,得到加权特征图,并通过所述输出层输出所述加权特征图。
在另一实施例中,所述注意力特征提取层为至少两个,且所述注意力特征提取层包含第一子注意力特征提取层和第二子注意力特征提取层,所述第一子注意力层对应至少一第二子注意力层,则所述第一处理层702,还用于:
针对每个所述第一子注意力特征提取层,通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图。
针对每个与所述第一子注意力特征提取层对应的第二子注意力特征提取层,直接获取对应的第一子注意力特征提取层确定的权重图。
在另一实施例中,所述第一处理层702,还用于:
识别所述去噪后的图像中包含的目标对象,其中,所述目标对象为人、动物、植物、交通标牌以及车牌号中的至少一种。
若所述目标对象与预设对象相匹配,则确定所述目标对象验证通过。
图8为本申请实施例提供的图像处理模型训练装置的结构示意图,图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,如图8所示,本实施例提供的装置,可以包括:
第二获取层801,用于获取图像训练样本集,其中,所述图像训练样本集中包含至少一图像训练样本。
第二处理层802,用于将所述图像训练样本集输入所述图像处理模型进行模型训练,得到训练后的图像处理模型。
其中,通过所述第一特征提取层对每个所述图像训练样本进行特征提取,得到初始特征图;通过所述至少一注意力特征提取层对所述初始特征图进行特征加权处理,得到加权特征图,其中,所述加权特征图用于指示所述初始特征图中各区域是否属于添加噪声的区域;通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理。
在另一实施例中,所述图像训练样本中包含添加噪声的训练图像以及所述训练图像对应的标注标签,所述标注标签为所述训练图像对应的未添加噪声的清晰图像,则所述第二处理层802,还用于:
通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的训练图像。
根据去噪后的训练图像以及所述训练图像对应的未添加噪声的清晰图像确定第一损失值,并根据所述第一损失值得到训练后的图像处理模型。
此外,所述标注标签还包括分数值,所述分数值表示所述添加噪声的训练图像的整体清晰程度,则所述第二处理层802,还用于:
根据所述去噪后的训练图像以及所述分数值确定第二损失值。
根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型。
此外,所述第二处理层802,还用于:
根据去噪后的训练图像、所述训练图像对应的未添加噪声的清晰图像以及预设阈值函数确定初始差值特征图,其中,所述初始差值特征图中每个像素点的像素值表示所述去噪后的训练图像中的像素值与所述清晰图像中对应的像素点的像素值的差值,且所述初始差值特征图中像素点的像素值第二预设区间范围内。
将所述差值特征图中每个像素点的像素值减去预设像素阈值,得到差值特征图,其中,所述预设像素阈值与所述第二预设区间范围内较小的区间端点接近。
根据所述差值特征图确定第三损失值。
根据所述第一损失值、所述第二损失值以及所述第三损失值得到训练后的图像处理模型。
本申请实施例提供的装置,可以实现上述如图2所示的实施例的方法,其实现原理和技术效果类似,此处不再赘述。
图9为本申请实施例提供的电子设备的硬件结构示意图,如图9所示,本实施例提供的设备900包括:处理器901,以及与所述处理器通信连接的存储器。其中,处理器901、存储器902通过总线903连接。
在具体实现过程中,处理器901执行所述存储器902存储的计算机执行指令,使得处理器901执行上述方法实施例中的方法。
处理器901的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图9所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件层组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现上述方法实施例的方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上所述的方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (14)
1.一种图像处理方法,其特征在于,包括:
获取待处理图像;
将所述待处理图像输入至图像处理模型中,得到去噪后的图像,其中,所述图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,所述第一特征提取层用于对所述待处理图像进行特征提取,得到初始特征图;所述至少一注意力特征提取层用于对所述初始特征图进行特征加权处理,得到加权特征图;所述第二特征提取层用于对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的图像,所述加权特征图用于指示所述初始特征图中各区域是否属于添加噪声的区域。
2.根据权利要求1所述的方法,其特征在于,每个所述注意力特征提取层包括:第一输入层、映射层以及子特征提取层,所述至少一注意力特征提取层用于对所述初始特征图进行特征加权处理,得到加权特征图,包括:
针对每个所述注意力特征提取层,通过所述第一输入层对所述初始特征图进行预处理,得到预设尺寸的初始特征图;
通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,其中,所述权重图中每个像素点的像素值表示像素点的清晰程度,像素值越小,表示像素点的清晰程度越高,所述权重图中像素点的像素值在第一预设区间范围内;
通过所述子特征提取层对所述权重图与所述初始特征图进行加权处理,得到加权特征图。
3.根据权利要求2所述的方法,其特征在于,所述映射层包括通道池化层以及归一化层,则所述通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,包括:
通过所述通道池化层对所述预设尺寸的初始特征图进行通道降维处理,得到单一通道的特征图;
通过所述归一化层对所述单一通道的特征图进行归一化处理,得到权重图。
4.根据权利要求2所述的方法,其特征在于,所述子特征提取层包括残差网络层以及拓展卷积层,所述通过所述子特征提取层对所述权重图与所述初始特征图进行加权处理,得到加权特征图,包括:
通过所述残差网络层对所述权重图与所述初始特征图进行残差处理,得到初始加权特征图;
通过所述拓展卷积层对所述初始加权特征图进行特征提取,得到加权特征图。
5.根据权利要求4所述的方法,其特征在于,所述拓展卷积层包括第二输入层、第一子卷积层、激活函数层、第二子卷积层、子残差网络层以及输出层,
所述通过所述拓展卷积层对所述初始加权特征图进行特征提取,得到加权特征图,包括:
通过所述第二输入层以及所述第一子卷积层对所述初始加权特征图进行平移变换处理,得到平移变换后的初始加权特征图;
通过所述激活函数层对所述平移变换后的初始加权特征图进行激活处理,得到非线性的初始加权特征图;
通过所述第二子卷积层对所述非线性的初始加权特征图进行特征集中提取处理,得到集中加权特征图;
通过所述子残差网络层对所述初始加权特征图与所述集中加权特征图进行残差处理,得到加权特征图;
通过所述输出层输出所述加权特征图。
6.根据权利要求2所述的方法,其特征在于,所述注意力特征提取层为至少两个,每个所述注意力特征提取层包含第一子注意力特征提取层和第二子注意力特征提取层,所述第一子注意力层对应至少一第二子注意力层,
所述通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图,包括:
针对每个所述第一子注意力特征提取层,通过所述映射层对所述预设尺寸的初始特征图进行归一化处理,得到权重图;
针对每个与所述第一子注意力特征提取层对应的第二子注意力特征提取层,获取对应的第一子注意力特征提取层确定的权重图。
7.根据权利要求1-6任一项所述的方法,其特征在于,在所述将所述待处理图像输入至图像处理模型中,得到去噪后的图像之后,还包括:
识别所述去噪后的图像中包含的目标对象,其中,所述目标对象为人、动物、植物、交通标牌以及车牌号中的至少一种;
若所述目标对象与预设对象相匹配,则确定所述目标对象验证通过。
8.一种图像处理模型训练方法,其特征在于,图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,所述方法包括:
获取图像训练样本集,其中,所述图像训练样本集中包含至少一图像训练样本;
将所述图像训练样本集输入所述图像处理模型进行模型训练,得到训练后的图像处理模型;
其中,通过所述第一特征提取层对每个所述图像训练样本进行特征提取,得到初始特征图;通过所述至少一注意力特征提取层对所述初始特征图进行特征加权处理,得到加权特征图,其中,所述加权特征图用于指示所述初始特征图中各区域是否属于添加噪声的区域;通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理。
9.根据权利要求8所述的方法,其特征在于,所述图像训练样本中包含添加噪声的训练图像以及所述训练图像对应的标注标签,所述标注标签为所述训练图像对应的未添加噪声的清晰图像,
所述通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理,得到训练后的图像处理模型,包括:
通过所述第二特征提取层对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的训练图像;
根据去噪后的训练图像以及所述训练图像对应的未添加噪声的清晰图像确定第一损失值,并根据所述第一损失值得到训练后的图像处理模型。
10.根据权利要求9所述的方法,其特征在于,所述标注标签还包括分数值,所述分数值表示所述添加噪声的训练图像的整体清晰程度,
在所述根据去噪后的训练图像以及所述训练图像对应的未添加噪声的清晰图像确定第一损失值之后,还包括:
根据所述去噪后的训练图像以及所述分数值确定第二损失值;
所述根据所述第一损失值得到训练后的图像处理模型,包括:
根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型。
11.根据权利要求10所述的方法,其特征在于,在所述根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型之前,还包括:
根据去噪后的训练图像、所述训练图像对应的未添加噪声的清晰图像以及预设阈值函数确定初始差值特征图,其中,所述初始差值特征图中每个像素点的像素值表示所述去噪后的训练图像中的像素值与所述清晰图像中对应的像素点的像素值的差值,且所述初始差值特征图中像素点的像素值第二预设区间范围内;
将所述差值特征图中每个像素点的像素值减去预设像素阈值,得到差值特征图,其中,所述预设像素阈值与所述第二预设区间范围内较小的区间端点接近;
根据所述差值特征图确定第三损失值;
所述根据所述第一损失值以及所述第二损失值得到训练后的图像处理模型,包括:
根据所述第一损失值、所述第二损失值以及所述第三损失值得到训练后的图像处理模型。
12.一种图像处理装置,其特征在于,包括:
第一获取层,用于获取待处理图像;
第一处理层,用于将所述待处理图像输入至图像处理模型中,得到去噪后的图像,其中,所述图像处理模型包括第一特征提取层、至少一注意力特征提取层以及第二特征提取层,所述第一特征提取层用于对所述待处理图像进行特征提取,得到初始特征图;所述至少一注意力特征提取层用于对所述初始特征图进行特征加权处理,得到加权特征图;所述第二特征提取层用于对所述初始特征图以及所述加权特征图进行残差处理,得到去噪后的图像,所述加权特征图用于指示所述初始特征图中各区域是否属于添加噪声的区域。
13.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-11中任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至11任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211085698.2A CN116152079A (zh) | 2022-09-06 | 2022-09-06 | 图像处理方法及图像处理模型训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211085698.2A CN116152079A (zh) | 2022-09-06 | 2022-09-06 | 图像处理方法及图像处理模型训练方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116152079A true CN116152079A (zh) | 2023-05-23 |
Family
ID=86355013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211085698.2A Pending CN116152079A (zh) | 2022-09-06 | 2022-09-06 | 图像处理方法及图像处理模型训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116152079A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094909A (zh) * | 2023-08-31 | 2023-11-21 | 青岛天仁微纳科技有限责任公司 | 一种纳米压印晶圆图像采集处理方法 |
-
2022
- 2022-09-06 CN CN202211085698.2A patent/CN116152079A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094909A (zh) * | 2023-08-31 | 2023-11-21 | 青岛天仁微纳科技有限责任公司 | 一种纳米压印晶圆图像采集处理方法 |
CN117094909B (zh) * | 2023-08-31 | 2024-04-02 | 青岛天仁微纳科技有限责任公司 | 一种纳米压印晶圆图像采集处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110570358A (zh) | 基于gan网络的车损图像增强方法和装置 | |
CN111639653B (zh) | 一种误检图像确定方法、装置、设备和介质 | |
CN110378254B (zh) | 车损图像修改痕迹的识别方法、系统、电子设备及存储介质 | |
CN110287936B (zh) | 图像检测方法、装置、设备及存储介质 | |
CN114387591A (zh) | 车牌识别方法、系统、设备及存储介质 | |
CN111415336A (zh) | 一种图像篡改识别方法、装置、服务器及存储介质 | |
CN111445058A (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN112634246A (zh) | 一种口腔图像识别方法及相关设备 | |
CN112541394A (zh) | 黑眼圈及鼻炎识别方法、系统及计算机介质 | |
CN116152079A (zh) | 图像处理方法及图像处理模型训练方法 | |
CN111985537A (zh) | 一种目标图像识别方法、终端、系统和存储介质 | |
US10657369B1 (en) | Unsupervised removal of text from images using linear programming for optimal filter design | |
CN116912604B (zh) | 模型训练方法、图像识别方法、装置以及计算机存储介质 | |
CN111353514A (zh) | 模型训练方法、图像识别方法、装置及终端设备 | |
CN111179245B (zh) | 图像质量检测方法、装置、电子设备和存储介质 | |
CN109145918B (zh) | 图像分割标注方法及设备 | |
CN110751163B (zh) | 目标定位方法及其装置、计算机可读存储介质和电子设备 | |
CN111178200A (zh) | 一种仪表盘指示灯的识别方法及计算设备 | |
CN116205802A (zh) | 图像去噪方法、装置、存储介质及电子设备 | |
CN115984178A (zh) | 伪造图像检测方法、电子设备和计算机可读存储介质 | |
CN111986176B (zh) | 一种裂纹图像识别方法、系统、终端及可读存储介质 | |
CN111753723B (zh) | 一种基于密度校准的指纹识别方法及装置 | |
CN114241463A (zh) | 签名验证方法、装置、计算机设备和存储介质 | |
CN111753722B (zh) | 一种基于特征点类型的指纹识别方法及装置 | |
CN109558878B (zh) | 图像识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |