CN118154436A - 基于多粒度特征聚合的图片增强方法及装置 - Google Patents

基于多粒度特征聚合的图片增强方法及装置 Download PDF

Info

Publication number
CN118154436A
CN118154436A CN202410157155.XA CN202410157155A CN118154436A CN 118154436 A CN118154436 A CN 118154436A CN 202410157155 A CN202410157155 A CN 202410157155A CN 118154436 A CN118154436 A CN 118154436A
Authority
CN
China
Prior art keywords
picture
training
granularity
processing
aggregation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410157155.XA
Other languages
English (en)
Inventor
王洪洪
刘洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xumi Yuntu Space Technology Co Ltd
Original Assignee
Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xumi Yuntu Space Technology Co Ltd filed Critical Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority to CN202410157155.XA priority Critical patent/CN118154436A/zh
Publication of CN118154436A publication Critical patent/CN118154436A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)

Abstract

本公开提供了一种基于多粒度特征聚合的图片增强方法及装置。该方法包括:构建多粒度特征聚合网络,利用多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;获取待增强的目标图片,将目标图片输入图片增强模型:通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;通过残差单元处理多粒度聚合特征,得到残差特征;通过上采样层处理残差特征,得到上采样特征;通过卷积层处理上采样特征,得到目标增强图片。采用上述技术手段,解决现有技术复杂场景中图片增强效果差的问题。

Description

基于多粒度特征聚合的图片增强方法及装置
技术领域
本公开涉及表情识别技术领域,尤其涉及一种基于多粒度特征聚合的图片增强方法及装置。
背景技术
图片增强算法可以将模糊图片变清晰,将亮度较低的图片变为亮度适中,使得图片中的光线更加均匀等,所以图片增强算法在图片处理中发挥着越来越重要的作用。随着图片增强算法的广泛应用,人们对图片增强算法的精度也有了越来越高的要求。但是现有的图片增强算法在场景比较复杂时,比如说图片中存在模糊和暗光等情况下,图片增强的效果并不能让人满意。
发明内容
有鉴于此,本公开实施例提供了一种基于多粒度特征聚合的图片增强方法、装置、电子设备及计算机可读存储介质,以解决现有技术复杂场景中图片增强效果差的问题。
本公开实施例第一方面,提供了一种基于多粒度特征聚合的图片增强方法,包括:构建多粒度特征聚合网络,利用多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;获取待增强的目标图片,将目标图片输入图片增强模型:通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;通过残差单元处理多粒度聚合特征,得到残差特征;通过上采样层处理残差特征,得到上采样特征;通过卷积层处理上采样特征,得到目标增强图片。
本公开实施例第二方面,提供了一种基于多粒度特征聚合的图片增强装置,包括:构建模块,被配置为构建多粒度特征聚合网络,利用多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;获取模块,被配置为获取待增强的目标图片,将目标图片输入图片增强模型:第一处理模块,被配置为通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;第二处理模块,被配置为通过残差单元处理多粒度聚合特征,得到残差特征;第三处理模块,被配置为通过上采样层处理残差特征,得到上采样特征;第四处理模块,被配置为通过卷积层处理上采样特征,得到目标增强图片。
本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本公开实施例与现有技术相比存在有益效果是:构建多粒度特征聚合网络,利用多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;获取待增强的目标图片,将目标图片输入图片增强模型:通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;通过残差单元处理多粒度聚合特征,得到残差特征;通过上采样层处理残差特征,得到上采样特征;通过卷积层处理上采样特征,得到目标增强图片。采用上述技术手段,可以解决现有技术复杂场景中图片增强效果差的问题,进而提升图片增强的效果。
附图说明
为了更清楚地说明本公开实施例中技术方案,下面将对实施例或现有技术描述中所需要使用附图作简单地介绍,显而易见地,下面描述中附图仅仅是本公开一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其它附图。
图1是本公开实施例提供一种基于多粒度特征聚合的图片增强方法的流程示意图;
图2是本公开实施例提供一种图片增强模型训练方法的流程示意图;
图3是本公开实施例提供一种基于多粒度特征聚合的图片增强装置结构示意图;
图4是本公开实施例提供一种电子设备结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类具体细节,以便透彻理解本公开实施例。然而,本领域技术人员应当清楚,在没有这些具体细节其它实施例中也可以实现本公开。在其它情况中,省略对众所周知系统、装置、电路以及方法详细说明,以免不必要细节妨碍本公开描述。
下面将结合附图详细说明根据本公开实施例一种基于多粒度特征聚合的图片增强方法和装置。
图1是本公开实施例提供一种基于多粒度特征聚合的图片增强方法的流程示意图。图1基于多粒度特征聚合的图片增强方法可以由计算机或服务器,或者计算机或服务器上软件执行。如图1所示,该基于多粒度特征聚合的图片增强方法包括:
S101,构建多粒度特征聚合网络,利用多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;
S102,获取待增强的目标图片,将目标图片输入图片增强模型:
S103,通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;
S104,通过残差单元处理多粒度聚合特征,得到残差特征;
S105,通过上采样层处理残差特征,得到上采样特征;
S106,通过卷积层处理上采样特征,得到目标增强图片。
多粒度特征聚合网络用于提取不同尺度的特征,并且可以提取出局部特征和全局特征。残差单元是现有的网络结构,包括多个卷积层和一个快捷连接。快捷连接将残差单元的输入直接传递到残差单元的最后一层,使得该输入和经过卷积层处理后的输出可以相加,作为残差单元的输出。上采样层使用反卷积实现上采样操作。卷积层是对上采样层输出的特征进行变换。
依次连接多粒度特征聚合网络、残差单元、上采样层和卷积层,得到图片增强模型。需要说明的是,在图片增强模型中,多粒度特征聚合网络、残差单元、上采样层和卷积层均可以是多个,以此来增强图片增强模型的效果。
目标增强图片是目标图片增强后的图片,目标增强图片比目标图片拥有更高的清晰度和亮度以及更均匀的光照等,也就是说目标增强图片比目标图片质量更高。
图片增强模型中,依次通过多粒度特征聚合网络、残差单元、上采样层和卷积层处理目标图片,得到目标增强图片。
根据本申请实施例提供技术方案,构建多粒度特征聚合网络,利用多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;获取待增强的目标图片,将目标图片输入图片增强模型:通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;通过残差单元处理多粒度聚合特征,得到残差特征;通过上采样层处理残差特征,得到上采样特征;通过卷积层处理上采样特征,得到目标增强图片。采用上述技术手段,可以解决现有技术复杂场景中图片增强效果差的问题,进而提升图片增强的效果。
进一步地,构建多粒度特征聚合网络,包括:利用图片切分层、特征拉平层和Transformer编码网络构建全局分支;利用第一预设卷积层、第二预设卷积层、第三预设卷积层、聚合层和第四预设卷积层构建局部分支;利用全局分支、局部分支和聚合层构建多粒度特征聚合网络。
图片切分层是Patch层,用于将一个大图片切分为多个小图片,特征拉平层是Flatten层,用于将特征矩阵转换为特征向量。Transformer中的编码网络是指Transformerencoder。依次连接图片切分层、特征拉平层和Transformer编码网络,得到全局分支。
第一预设卷积层可以是卷积核为3x3的普通卷积,第二预设卷积层可以是空洞率为1的卷积核为3x3卷积层,第三预设卷积层可以是空洞率为2的卷积核为3x3卷积层,第四预设卷积层可以是卷积核为1x1的普通卷积。第一预设卷积层、第二预设卷积层、第三预设卷积层分别用于提取图片不同尺度的特征,聚合层用于融合第一预设卷积层、第二预设卷积层、第三预设卷积层提取到的特征(聚合层可以采用相加的方法融合特征),第四预设卷积层用于跨通道融合聚合层输出的特征。需要说明的是,在局部分支中,第一预设卷积层、第二预设卷积层、第三预设卷积层和第四预设卷积层均可以是多个,以此来增强局部分支的效果。
将全局分支和局部分支并行连接到聚合层,得到多粒度特征聚合网络,该聚合层用于融合全局分支和局部分支输出的特征。
进一步地,通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征,包括:将目标图片输入多粒度特征聚合网络,在多粒度特征聚合网络内部:通过全局分支处理目标图片,得到全局特征;通过局部分支处理目标图片,得到局部特征;通过聚合层处理全局特征和局部特征,得到多粒度聚合特征。
多粒度特征聚合网络内部:全局分支提取目标图片的全局特征,局部分支提取目标图片的局部特征,聚合层融合全局特征和局部特征得到多粒度聚合特征。
更进一步地,通过全局分支处理目标图片,得到全局特征,包括:将目标图片输入全局分支,在全局分支内部:通过图片切分层处理目标图片,得到多个小目标图片;通过特征拉平层处理各个小目标图片的像素矩阵,得到各个小目标图片的拉平特征;通过Transformer编码网络处理各条拉平特征,得到全局特征。
因为图片可以被视为一个多维数据点,图片中每个像素的值代表了图片在该位置的颜色或强度信息,所以图片可以看作构成该图片的所有像素的像素矩阵(也就是说图片可以直接等价于一个像素矩阵)。
图片切分层将目标图片切分为多个小目标图片。特征拉平层将小目标图片的像素矩阵变换为拉平特征,拉平特征是向量。Transformer编码网络对各条拉平特征进行各种向量运算,得到全局特征。向量运算包括向量相加、相减、相乘。
比如图片切分层将目标图片切分为九个小目标图片,特征拉平层处理九个小目标图片的像素矩阵,得到九个拉平特征。九个拉平特征经过Transformer编码网络,得到全局特征。
进一步地,通过局部分支处理目标图片,得到局部特征,包括:通过第一预设卷积层处理目标图片,得到第一卷积特征;通过第二预设卷积层处理目标图片,得到第二卷积特征;通过第三预设卷积层处理目标图片,得到第三卷积特征;通过聚合层处理第一卷积特征、第二卷积特征和第三卷积特征,得到聚合特征;通过第四预设卷积层处理聚合特征,得到局部特征。
第一预设卷积层提取目标图片的第一卷积特征,第二预设卷积层提取目标图片的第二卷积特征,第三预设卷积层提取目标图片的第三卷积特征。聚合层融合第一卷积特征、第二卷积特征和第三卷积特征,得到聚合特征。第四预设卷积层跨通道融合聚合特征,得到局部特征。
在一个可选实施例中,图片增强模型是两个多粒度特征聚合网络、一个残差单元、一个上采样层和一个卷积层组成的。将目标图片输入图片增强模型:第一个多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;第二个多粒度特征聚合网络处理多粒度聚合特征,以更新多粒度聚合特征;残差单元处理更新后的多粒度聚合特征,得到更新后的残差特征;上采样层处理更新后的残差特征,得到更新后的上采样特征;通过卷积层处理更新后的上采样特征,得到更新后的目标增强图片。
其中,第二个多粒度特征聚合网络处理多粒度聚合特征,以更新多粒度聚合特征,包括:将多粒度聚合特征输入第二个多粒度特征聚合网络,在第二个多粒度特征聚合网络内部:通过全局分支处理多粒度聚合特征,得到更新后的全局特征;通过局部分支处理多粒度聚合特征,得到更新后的局部特征;通过聚合层处理更新后的全局特征和局部特征,得到更新后的多粒度聚合特征。
在一个可选实施例中,局部分支是由多个第一预设卷积层、多个第二预设卷积层、多个第三预设卷积层、一个聚合层和多个第四预设卷积层组成的。局部分支处理多粒度聚合特征,得到更新后的局部特征,包括:多个第一预设卷积层处理目标图片,得到更新后的第一卷积特征;多个第二预设卷积层处理目标图片,得到更新后的第二卷积特征;多个第三预设卷积层处理目标图片,得到更新后的第三卷积特征;聚合层处理更新后的第一卷积特征、第二卷积特征和第三卷积特征,得到更新后的聚合特征;多个第四预设卷积层处理更新后的聚合特征,得到局部特征。
图2是本公开实施例提供一种图片增强模型训练方法的流程示意图,如图2所示,该方法包括:
S201,获取训练图片,将训练图片输入图片增强模型:
S202,通过多粒度特征聚合网络处理训练图片,得到训练多粒度聚合特征;
S203,通过残差单元处理训练多粒度聚合特征,得到训练残差特征;
S204,通过上采样层处理训练残差特征,得到训练上采样特征;
S205,通过卷积层处理训练上采样特征,得到训练增强图片;
S206,通过散度损失函数计算训练增强图片和训练图片的标签之间的损失,依据损失优化图片增强模型的模型参数,以完成对图片增强模型的训练。
本申请实施例是训练阶段,训练阶段和上文正式使用阶段类似。训练图片输入图片增强模型,在图片增强模型内部:多粒度特征聚合网络提取训练图片的训练多粒度聚合特征;残差单元处理训练多粒度聚合特征得到训练残差特征;上采样层对训练残差特征进行上采样处理,得到训练上采样特征;卷积层处理训练上采样特征,得到训练增强图片。最后计算训练增强图片和训练图片的标签之间的损失,依据损失优化图片增强模型。散度损失函数可以是KL(Kullback–Leibler divergence)散度。
在一个可选实施例中,将目标图片输入图片增强模型之前,方法还包括:获取多个训练组,其中每个训练组包含一张训练图片和该训练图片对应的参照图片,参照图片比其对应的训练图片拥有更高的清晰度和亮度以及更均匀的光照;将各个训练组中的训练图片输入图片增强模型:通过多粒度特征聚合网络处理各个训练组中的训练图片,得到各个训练组对应的训练多粒度聚合特征;通过残差单元处理各个训练组对应的训练多粒度聚合特征,得到各个训练组对应的训练残差特征;通过上采样层处理各个训练组对应的训练残差特征,得到各个训练组对应的训练上采样特征;通过卷积层处理各个训练组对应的训练上采样特征,得到各个训练组中的训练增强图片;提取各个训练组中的训练增强图片和参照图片的图片特征,通过欧氏距离损失函数计算各个训练组中的训练增强图片和参照图片的图片特征之间的损失,依据损失优化图片增强模型的模型参数,以完成对图片增强模型的训练。
本申请实施例是训练阶段,采用另一个训练方法。一个训练组中的参照图片是提前对训练图片进行各种图像处理方法得到的。参照图片比其对应的训练图片拥有更高的清晰度和亮度以及更均匀的光照。参照图片实际上是作为训练图片的标签。图片增强模型处理各个训练组中的训练图片,得到各个训练组中的训练增强图片。计算各个训练组中的训练增强图片和参照图片的图片特征之间的损失,则每个训练组都会计算得到一个损失,依据各个训练组的损失优化图片增强模型。
上述所有可选技术方案,可以采用任意结合形成本申请可选实施例,在此不再一一赘述。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露细节,请参照本公开方法实施例。
图3是本公开实施例提供一种基于多粒度特征聚合的图片增强装置示意图。如图3所示,该基于多粒度特征聚合的图片增强装置包括:
构建模块301,被配置为构建多粒度特征聚合网络,利用多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;
获取模块302,被配置为获取待增强的目标图片,将目标图片输入图片增强模型:
第一处理模块303,被配置为通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;
第二处理模块304,被配置为通过残差单元处理多粒度聚合特征,得到残差特征;
第三处理模块305,被配置为通过上采样层处理残差特征,得到上采样特征;
第四处理模块306,被配置为通过卷积层处理上采样特征,得到目标增强图片。
根据本申请实施例提供技术方案,构建多粒度特征聚合网络,利用多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;获取待增强的目标图片,将目标图片输入图片增强模型:通过多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;通过残差单元处理多粒度聚合特征,得到残差特征;通过上采样层处理残差特征,得到上采样特征;通过卷积层处理上采样特征,得到目标增强图片。采用上述技术手段,可以解决现有技术复杂场景中图片增强效果差的问题,进而提升图片增强的效果。
在一些实施例中,构建模块301还被配置为利用图片切分层、特征拉平层和Transformer编码网络构建全局分支;利用第一预设卷积层、第二预设卷积层、第三预设卷积层、聚合层和第四预设卷积层构建局部分支;利用全局分支、局部分支和聚合层构建多粒度特征聚合网络。
图片切分层是Patch层,用于将一个大图片切分为多个小图片,特征拉平层是Flatten层,用于将特征矩阵转换为特征向量。Transformer中的编码网络是指Transformerencoder。依次连接图片切分层、特征拉平层和Transformer编码网络,得到全局分支。
将全局分支和局部分支并行连接到聚合层,得到多粒度特征聚合网络,该聚合层用于融合全局分支和局部分支输出的特征。
在一些实施例中,第一处理模块303还被配置为将目标图片输入多粒度特征聚合网络,在多粒度特征聚合网络内部:通过全局分支处理目标图片,得到全局特征;通过局部分支处理目标图片,得到局部特征;通过聚合层处理全局特征和局部特征,得到多粒度聚合特征。
在一些实施例中,第一处理模块303还被配置为将目标图片输入全局分支,在全局分支内部:通过图片切分层处理目标图片,得到多个小目标图片;通过特征拉平层处理各个小目标图片的像素矩阵,得到各个小目标图片的拉平特征;通过Transformer编码网络处理各条拉平特征,得到全局特征。
在一些实施例中,第一处理模块303还被配置为通过第一预设卷积层处理目标图片,得到第一卷积特征;通过第二预设卷积层处理目标图片,得到第二卷积特征;通过第三预设卷积层处理目标图片,得到第三卷积特征;通过聚合层处理第一卷积特征、第二卷积特征和第三卷积特征,得到聚合特征;通过第四预设卷积层处理聚合特征,得到局部特征。
在一些实施例中,构建模块301还被配置为用两个多粒度特征聚合网络、一个残差单元、一个上采样层和一个卷积层组成图片增强模型。将目标图片输入图片增强模型:第一个多粒度特征聚合网络处理目标图片,得到多粒度聚合特征;第二个多粒度特征聚合网络处理多粒度聚合特征,以更新多粒度聚合特征;残差单元处理更新后的多粒度聚合特征,得到更新后的残差特征;上采样层处理更新后的残差特征,得到更新后的上采样特征;通过卷积层处理更新后的上采样特征,得到更新后的目标增强图片。
在一些实施例中,第一处理模块303还被配置为将多粒度聚合特征输入第二个多粒度特征聚合网络,在第二个多粒度特征聚合网络内部:通过全局分支处理多粒度聚合特征,得到更新后的全局特征;通过局部分支处理多粒度聚合特征,得到更新后的局部特征;通过聚合层处理更新后的全局特征和局部特征,得到更新后的多粒度聚合特征。
在一些实施例中,构建模块301还被配置为用多个第一预设卷积层、多个第二预设卷积层、多个第三预设卷积层、一个聚合层和多个第四预设卷积层组成局部分支。局部分支处理多粒度聚合特征,得到更新后的局部特征,包括:多个第一预设卷积层处理目标图片,得到更新后的第一卷积特征;多个第二预设卷积层处理目标图片,得到更新后的第二卷积特征;多个第三预设卷积层处理目标图片,得到更新后的第三卷积特征;聚合层处理更新后的第一卷积特征、第二卷积特征和第三卷积特征,得到更新后的聚合特征;多个第四预设卷积层处理更新后的聚合特征,得到局部特征。
在一些实施例中,第四处理模块306还被配置为获取训练图片,将训练图片输入图片增强模型:通过多粒度特征聚合网络处理训练图片,得到训练多粒度聚合特征;通过残差单元处理训练多粒度聚合特征,得到训练残差特征;通过上采样层处理训练残差特征,得到训练上采样特征;通过卷积层处理训练上采样特征,得到训练增强图片;通过散度损失函数计算训练增强图片和训练图片的标签之间的损失,依据损失优化图片增强模型的模型参数,以完成对图片增强模型的训练。
在一些实施例中,第四处理模块306还被配置为获取多个训练组,其中每个训练组包含一张训练图片和该训练图片对应的参照图片,参照图片比其对应的训练图片拥有更高的清晰度和亮度以及更均匀的光照;将各个训练组中的训练图片输入图片增强模型:通过多粒度特征聚合网络处理各个训练组中的训练图片,得到各个训练组对应的训练多粒度聚合特征;通过残差单元处理各个训练组对应的训练多粒度聚合特征,得到各个训练组对应的训练残差特征;通过上采样层处理各个训练组对应的训练残差特征,得到各个训练组对应的训练上采样特征;通过卷积层处理各个训练组对应的训练上采样特征,得到各个训练组中的训练增强图片;提取各个训练组中的训练增强图片和参照图片的图片特征,通过欧氏距离损失函数计算各个训练组中的训练增强图片和参照图片的图片特征之间的损失,依据损失优化图片增强模型的模型参数,以完成对图片增强模型的训练。
应理解,上述实施例中各步骤序号大小并不意味着执行顺序先后,各过程执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例实施过程构成任何限定。
图4是本公开实施例提供电子设备4示意图。如图4所示,该实施例电子设备4包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元功能。
电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备4示例,并不构成对电子设备4限定,可以包括比图示更多或更少部件,或者不同部件。
处理器401可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器402可以是电子设备4内部存储单元,例如,电子设备4硬盘或内存。存储器402也可以是电子设备4外部存储设备,例如,电子设备4上配备插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器402还可以既包括电子设备4内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需其它程序和数据。
所属领域技术人员可以清楚地了解到,为了描述方便和简洁,仅以上述各功能单元、模块划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同功能单元、模块完成,即将装置内部结构划分成不同功能单元或模块,以完成以上描述全部或者部分功能。实施例中各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成单元既可以采用硬件形式实现,也可以采用软件功能单元形式实现。
集成模块/单元如果以软件功能单元形式实现并作为独立产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样理解,本公开实现上述实施例方法中全部或部分流程,也可以通过计算机程序来指令相关硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明是,计算机可读介质包含内容可以根据司法管辖区内立法和专利实践要求进行适当增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本公开技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细说明,本领域普通技术人员应当理解:其依然可以对前述各实施例所记载技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案本质脱离本公开各实施例技术方案精神和范围,均应包含在本公开保护范围之内。

Claims (10)

1.一种基于多粒度特征聚合的图片增强方法,其特征在于,包括:
构建多粒度特征聚合网络,利用所述多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;
获取待增强的目标图片,将所述目标图片输入所述图片增强模型:
通过所述多粒度特征聚合网络处理所述目标图片,得到多粒度聚合特征;
通过所述残差单元处理所述多粒度聚合特征,得到残差特征;
通过所述上采样层处理所述残差特征,得到上采样特征;
通过所述卷积层处理所述上采样特征,得到目标增强图片。
2.根据权利要求1所述的方法,其特征在于,构建多粒度特征聚合网络,包括:
利用图片切分层、特征拉平层和Transformer编码网络构建全局分支;
利用第一预设卷积层、第二预设卷积层、第三预设卷积层、聚合层和第四预设卷积层构建局部分支;
利用所述全局分支、所述局部分支和所述聚合层构建多粒度特征聚合网络。
3.根据权利要求2所述方法,其特征在于,通过所述多粒度特征聚合网络处理所述目标图片,得到多粒度聚合特征,包括:
将所述目标图片输入所述多粒度特征聚合网络,在所述多粒度特征聚合网络内部:
通过所述全局分支处理所述目标图片,得到全局特征;
通过所述局部分支处理所述目标图片,得到局部特征;
通过所述聚合层处理所述全局特征和所述局部特征,得到多粒度聚合特征。
4.根据权利要求3所述方法,其特征在于,通过所述全局分支处理所述目标图片,得到全局特征,包括:
将所述目标图片输入所述全局分支,在所述全局分支内部:
通过所述图片切分层处理所述目标图片,得到多个小目标图片;
通过所述特征拉平层处理各个小目标图片的像素矩阵,得到各个小目标图片的拉平特征;
通过所述Transformer编码网络处理各条拉平特征,得到所述全局特征。
5.根据权利要求3所述方法,其特征在于,通过所述局部分支处理所述目标图片,得到局部特征,包括:
通过所述第一预设卷积层处理所述目标图片,得到第一卷积特征;
通过所述第二预设卷积层处理所述目标图片,得到第二卷积特征;
通过所述第三预设卷积层处理所述目标图片,得到第三卷积特征;
通过所述聚合层处理所述第一卷积特征、所述第二卷积特征和所述第三卷积特征,得到聚合特征;
通过所述第四预设卷积层处理所述聚合特征,得到所述局部特征。
6.根据权利要求1所述方法,其特征在于,将所述目标图片输入所述图片增强模型之前,所述方法还包括:
获取训练图片,将所述训练图片输入所述图片增强模型:
通过所述多粒度特征聚合网络处理所述训练图片,得到训练多粒度聚合特征;
通过所述残差单元处理所述训练多粒度聚合特征,得到训练残差特征;
通过所述上采样层处理所述训练残差特征,得到训练上采样特征;
通过所述卷积层处理所述训练上采样特征,得到训练增强图片;
通过散度损失函数计算所述训练增强图片和所述训练图片的标签之间的损失,依据所述损失优化所述图片增强模型的模型参数,以完成对所述图片增强模型的训练。
7.根据权利要求1所述方法,其特征在于,将所述目标图片输入所述图片增强模型之前,所述方法还包括:
获取多个训练组,其中每个训练组包含一张训练图片和该训练图片对应的参照图片,参照图片比其对应的训练图片拥有更高的清晰度和亮度以及更均匀的光照;
将各个训练组中的训练图片输入所述图片增强模型:
通过所述多粒度特征聚合网络处理各个训练组中的训练图片,得到各个训练组对应的训练多粒度聚合特征;
通过所述残差单元处理各个训练组对应的训练多粒度聚合特征,得到各个训练组对应的训练残差特征;
通过所述上采样层处理各个训练组对应的训练残差特征,得到各个训练组对应的训练上采样特征;
通过所述卷积层处理各个训练组对应的训练上采样特征,得到各个训练组中的训练增强图片;
提取各个训练组中的训练增强图片和参照图片的图片特征,通过欧氏距离损失函数计算各个训练组中的训练增强图片和参照图片的图片特征之间的损失,依据所述损失优化所述图片增强模型的模型参数,以完成对所述图片增强模型的训练。
8.一种基于多粒度特征聚合的图片增强装置,其特征在于,包括:
构建模块,被配置为构建多粒度特征聚合网络,利用所述多粒度特征聚合网络、残差单元、上采样层和卷积层构建图片增强模型;
获取模块,被配置为获取待增强的目标图片,将所述目标图片输入所述图片增强模型:
第一处理模块,被配置为通过所述多粒度特征聚合网络处理所述目标图片,得到多粒度聚合特征;
第二处理模块,被配置为通过所述残差单元处理所述多粒度聚合特征,得到残差特征;
第三处理模块,被配置为通过所述上采样层处理所述残差特征,得到上采样特征;
第四处理模块,被配置为通过所述卷积层处理所述上采样特征,得到目标增强图片。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
CN202410157155.XA 2024-02-02 2024-02-02 基于多粒度特征聚合的图片增强方法及装置 Pending CN118154436A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410157155.XA CN118154436A (zh) 2024-02-02 2024-02-02 基于多粒度特征聚合的图片增强方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410157155.XA CN118154436A (zh) 2024-02-02 2024-02-02 基于多粒度特征聚合的图片增强方法及装置

Publications (1)

Publication Number Publication Date
CN118154436A true CN118154436A (zh) 2024-06-07

Family

ID=91289736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410157155.XA Pending CN118154436A (zh) 2024-02-02 2024-02-02 基于多粒度特征聚合的图片增强方法及装置

Country Status (1)

Country Link
CN (1) CN118154436A (zh)

Similar Documents

Publication Publication Date Title
CN110136066B (zh) 面向视频的超分辨率方法、装置、设备和存储介质
CN111476719A (zh) 图像处理方法、装置、计算机设备及存储介质
WO2022166258A1 (zh) 行为识别方法、装置、终端设备及计算机可读存储介质
CN110830808A (zh) 一种视频帧重构方法、装置及终端设备
CN110838085B (zh) 一种图像的超分辨率重建方法、装置及电子设备
CN115082306A (zh) 一种基于蓝图可分离残差网络的图像超分辨率方法
CN110782398B (zh) 图像处理方法、生成式对抗网络系统和电子设备
CN110717864A (zh) 一种图像增强方法、装置、终端设备及计算机可读介质
CN110971837B (zh) 基于ConvNets的暗光图像处理方法及终端设备
CN111083479A (zh) 一种视频帧预测方法、装置及终端设备
CN118154436A (zh) 基于多粒度特征聚合的图片增强方法及装置
CN111083494A (zh) 一种视频编码方法、装置及终端设备
CN114782256B (zh) 图像重建方法、装置、计算机设备和存储介质
CN110944212A (zh) 一种视频帧重构方法、装置及终端设备
US20240185570A1 (en) Undecimated image processing method and device
CN114693919A (zh) 一种目标检测方法、终端设备及存储介质
CN118195887B (zh) 图片前景保持模型的训练方法及装置
CN116912889B (zh) 行人重识别方法及装置
CN111083500A (zh) 一种视频帧重构方法、装置及终端设备
CN110913220A (zh) 一种视频帧编码方法、装置及终端设备
CN118038517A (zh) 基于细粒度增强特征的表情识别模型的训练方法及装置
CN111383171A (zh) 一种图片处理方法、系统及终端设备
CN115631115B (zh) 基于递归Transformer的动态图像复原方法
US12094084B2 (en) Multi-channel feature map fusion
CN117456562B (zh) 姿态估计方法及装置

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination