CN112419158A - 图像视频超分辨率与超清晰度重建系统及方法 - Google Patents

图像视频超分辨率与超清晰度重建系统及方法 Download PDF

Info

Publication number
CN112419158A
CN112419158A CN202011417285.0A CN202011417285A CN112419158A CN 112419158 A CN112419158 A CN 112419158A CN 202011417285 A CN202011417285 A CN 202011417285A CN 112419158 A CN112419158 A CN 112419158A
Authority
CN
China
Prior art keywords
super
loss function
resolution
image video
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011417285.0A
Other languages
English (en)
Inventor
张晓东
张月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Internet Software Group Co ltd
Original Assignee
Shanghai Internet Software Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Internet Software Group Co ltd filed Critical Shanghai Internet Software Group Co ltd
Priority to CN202011417285.0A priority Critical patent/CN112419158A/zh
Publication of CN112419158A publication Critical patent/CN112419158A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明揭示了一种图像视频超分辨率与超清晰度重建系统及方法,所述重建系统包括特征提取模块、超分辨率与超清晰度重建模块及至少一特征处理模块;特征提取模块用以提取待处理图像、视频的设定特征层;超分辨率与超清晰度重建模块用以进行特征采样和特征提取,获得重建后的超分辨率、超清晰度图像视频;各特定特征处理模块用以根据不同的计算机视觉任务设定获得待处理图像视频对应的特征信息输出。本发明可根据不同的计算机视觉任务的并行执行多个特定特征处理模块以获取多种特定的特征信息输出,最终结合超分辨率与超清晰度重建模块形成准确的高分辨率、高清晰度图像,从而有效的提升后续计算机视觉任务的性能。

Description

图像视频超分辨率与超清晰度重建系统及方法
技术领域
本发明属于图像、视频处理技术领域,涉及一种图像、视频处理系统,尤其涉及一种应用于特定计算机视觉任务的图像视频超分辨率与超清晰度重建系统及方法。
背景技术
深度神经网络是一种复杂的数学模型,输入数据通过深度神经网络获得相应的输出数据,通过输出数据与标记数据的差异构建损失函数,损失函数对深度神经网络中的参数计算梯度,通过梯度反向传播,更新深度神经网络中的参数,通过不断更新参数,致使输出数据与标记数据间的差异不断减小。其中输入数据与标记数据构成深度神经网络训练所需要的训练数据,深度神经网络的性能跟神经网络的结构和训练数据有关。深度神经网络在图像、语音、自然语言处理等领域都已取得优于传统方法的性能,得到广泛应用。
图像、视频超分辨率重建是指从观测到的低分辨率图像中重建出对应的高分辨率图像、视频。随着深度学习技术的快速发展,基于深度神经网络的图像、视频超分辨率重建方法是目前性能最优的图像、视频超分辨率重建方法。
现有的基于深度神经网络的图像、视频超分辨率重建系统通常包含两大模块:特征提取模块21和超分辨率图像重建模块31,获得重建的超分辨率图像视频41,在训练时,计算重建的超分辨率图像视频41与待处理图像视频11对应高分辨率图像视频间的图像视频损失函数51,基于图像视频损失函数51进行图像视频训练梯度反向传播,更新特征提取模块21和超分辨率图像重建模块31的参数,使特征提取模块21能够提取到待处理图像视频11的图像视频信息,整体如图1所示。现有基于深度神经网络的图像视频超分辨率重建方法在图像视频重建后获得了良好的视觉效果,但存在着重建后的图像视频可信度低的问题。
上述现有的图像视频超分辨率重建从本质上是一个不适定问题,即对于原始的低分辨率和低清晰度图像视频,使用现有方法存在多个高分辨率、高清晰图像与之对应,该不适定问题会导致重建后的超分辨率图像视频信息的改变,致使重建后的超分辨率图像视频可信度较低,无法被用于计算机视觉任务(文字识别、人脸识别,ADAS、姿态识别等等)中。
有鉴于此,如今迫切需要设计一种新的图像、视频的重建方式,以便克服现有图像视频重建方式存在的上述至少部分缺陷。
发明内容
本发明提供一种图像视频超分辨率与超清晰度重建系统及方法,可围绕不同的计算机视觉任务,并可配置并融合多个特征,最终在确保重建图像、视频的可信度的前提下提高图像、视频分辨率和清晰度,进而能被计算机视觉任务所使用,提高现有计算机视觉任务的实际使用性能。
为解决上述技术问题,根据本发明的一个方面,采用如下技术方案:
一种图像视频超分辨率与超清晰度重建系统,所述重建系统包括:
特征提取模块,用以提取待处理图像视频对应的设定特征层;
超分辨率与超清晰度重建模块,连接所述特征提取模块,用以进行特征采样及特征提取,获得重建后的超分辨率图像;以及
至少一特定特征处理模块,各特定特征处理模块分别连接所述特征提取模块,用以对所述特征层进行特征处理,根据不同的计算机视觉任务设定获得待处理图像视频对应的特征信息输出。
作为本发明的一种实施方式,所述系统进一步包括:
图像视频损失函数获取模块,用以根据所述超分辨率与超清晰度重建模块获取的超分辨率、超清晰度图像视频计算图像视频损失函数;
至少一特征信息损失函数获取模块,各特征信息损失函数获取模块连接对应的特定特征处理模块,用以根据所述特定特征处理模块获取的特征信息输出计算对应的特征信息损失函数;
损失函数融合模块,用以将所述图像视频损失函数获取模块获取的图像视频损失函数、各特征信息损失函数获取模块获取的特征信息损失函数进行融合,获取融合损失函数;利用融合损失函数进行反向传播,以进行图像视频超分辨率与超清晰度重建网络的训练。
作为本发明的一种实施方式,根据不同的计算机视觉任务需求进行设计对应的至少一特定特征处理模块,以对所述特征层进行特定特征处理,获得与计算机视觉任务需求相关的待处理图像视频的特定特征信息。
作为本发明的一种实施方式,各特征信息损失函数获取模块用以通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数。
作为本发明的一种实施方式,所述特征提取模块用以获取待处理图像视频的高级特征层,所述高级特征层包含待处理图像视频的深层特征信息;
所述超分辨率与超清晰度重建模块用以将所述高级特征层进行深度神经网络的特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率、超清晰度图像视频;
所述特定特征处理模块用以将所述高级特征层进行深度神经网络的特征处理,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为特征信息输出;
所述图像视频损失函数获取模块用以计算图像损失函数,具体包含:将重建后的超分辨率、超清晰度图像视频与待处理图像视频对应的高分辨率、高清晰度图像视频计算L1损失,使重建后的超分辨率、超清晰度图像视频具有相应高分辨率、高清晰度图像视频的像素值;
所述图像视频损失函数获取模块还用以将计算得到的图像视频损失函数通过反向传播至所述特征提取模块;使所述特征提取模块提取的高级特征层含有丰富的图像视频信息,从而使得超分辨率与超清晰度重建模块重建后的超分辨率、超清晰图像视频具有更好的视觉效果;
所述特征信息损失函数获取模块用以计算特征信息的损失函数,通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数;
所述特征信息损失函数获取模块还用以将计算得到的特征信息损失函数反向传播至所述特征提取模块,使所述特征提取模块提取的特征层含有丰富的特定特征信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率、超清晰度图像视频具有更高的可信度;
所述损失函数融合模块将所述图像视频损失函数、特征信息损失函数进行加权求和,获得融合损失函数;所述损失函数融合模块还用以将融合损失函数反向传播至图像视频损失函数获取模块、特征信息损失函数获取模块。
根据本发明的一个方面,采用如下技术方案:一种图像视频超分辨率与超清晰度重建方法,所述重建方法包括:
特征提取模块提取待处理图像视频对应的设定特征层;
超分辨率与超清晰度重建模块进行特征采样及特征提取,获得重建后的超分辨率图像;以及
至少一特定特征处理模块对所述特征层进行特征处理,根据不同的计算机视觉任务设定获得待处理图像视频对应的特征信息输出。
作为本发明的一种实施方式,所述重建方法进一步包括:
图像视频损失函数获取模块根据所述超分辨率与超清晰度重建模块获取的超分辨率、超清晰度图像视频计算图像视频损失函数;
至少一特征信息损失函数获取模块根据所述特定特征处理模块获取的特征信息输出计算对应的特征信息损失函数;
损失函数融合模块将所述图像视频损失函数获取模块获取的图像视频损失函数、各特征信息损失函数获取模块获取的特征信息损失函数进行融合,获取融合损失函数;利用融合损失函数进行反向传播,以进行图像视频超分辨率与超清晰度重建网络的训练。
作为本发明的一种实施方式,根据不同的计算机视觉任务需求进行设计对应的至少一特定特征处理模块,以对所述特征层进行特定特征处理,获得与计算机视觉任务需求相关的待处理图像视频的特定特征信息。
作为本发明的一种实施方式,各特征信息损失函数获取模块通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数。
作为本发明的一种实施方式,所述特征提取模块获取待处理图像视频的高级特征层,所述高级特征层包含待处理图像视频的深层特征信息;
所述超分辨率与超清晰度重建模块将所述高级特征层进行深度神经网络的特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率、超清晰度图像视频;
所述特定特征处理模块将所述高级特征层进行深度神经网络的特征处理,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为特征信息输出;
所述图像视频损失函数获取模块计算图像损失函数,具体包含:将重建后的超分辨率、超清晰度图像视频与待处理图像视频对应的高分辨率、高清晰度图像视频计算L1损失,使重建后的超分辨率、超清晰度图像视频具有相应高分辨率、高清晰度图像视频的像素值;
所述图像视频损失函数获取模块还将计算得到的图像视频损失函数通过反向传播至所述特征提取模块;使所述特征提取模块提取的高级特征层含有丰富的图像视频信息,从而使得超分辨率与超清晰度重建模块重建后的超分辨率、超清晰图像视频具有更好的视觉效果;
所述特征信息损失函数获取模块计算特征信息的损失函数,通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数;
所述特征信息损失函数获取模块还将计算得到的特征信息损失函数反向传播至所述特征提取模块,使所述特征提取模块提取的特征层含有丰富的特定特征信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率、超清晰度图像视频具有更高的可信度;
所述损失函数融合模块将所述图像视频损失函数、特征信息损失函数进行加权求和,获得融合损失函数;所述损失函数融合模块还用以将融合损失函数反向传播至图像视频损失函数获取模块、特征信息损失函数获取模块。
本发明的有益效果在于:本发明提出的图像视频超分辨率与超清晰度重建系统及方法,可围绕不同的计算机视觉任务,并可配置并融合多个特征,最终在确保重建图像视频的可信度的前提下提高图像视频分辨率和清晰度,进而能被计算机视觉任务所使用,提高现有计算机视觉任务的实际使用性能。
附图说明
图1为现有图像视频超分辨率重建系统的组成示意图。
图2为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图。
图3为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图。
图4为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图。
图5为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图。
图6为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。
该部分的描述只针对几个典型的实施例,本发明并不仅局限于实施例描述的范围。相同或相近的现有技术手段与实施例中的一些技术特征进行相互替换也在本发明描述和保护的范围内。
说明书中各个实施例中的步骤的表述只是为了方便说明,本申请的实现方式不受步骤实现的顺序限制。说明书中的“连接”既包含直接连接,也包含间接连接。
说明书中,“图像视频”指图像,或者视频,或者图像及视频。
本发明揭示了一种图像视频超分辨率与超清晰度重建系统,图2、图3为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图;请参阅图2、图3,所述重建系统可以为可配置的多特征融合的重建系统。所述重建系统包括:特征提取模块100、超分辨率与超清晰度重建模块200及至少一特定特征处理模块300。
特征提取模块100用以提取待处理图像视频对应的设定特征层;超分辨率与超清晰度重建模块200连接所述特征提取模块100,用以进行特征采样及特征提取,获得重建后的超分辨率、超清晰度图像视频;各特定特征处理模块300分别连接所述特征提取模块100,用以对所述特征层进行特征处理,根据不同的计算机视觉任务设定获得待处理图像视频对应的特征信息输出。
图4为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图;请参阅图4,在本发明的一实施例中,所述系统进一步包括:图像视频损失函数获取模块400、至少一特征信息损失函数获取模块500及损失函数融合模块600。
图像视频损失函数获取模块400用以根据所述超分辨率与超清晰度图像重建模块200获取的超分辨率、超清晰度图像视频计算图像视频损失函数;各特征信息损失函数获取模块500连接对应的特定特征处理模块300,用以根据所述特定特征处理模块获取的特征信息输出计算对应的特征信息损失函数。损失函数融合模块600用以将所述图像视频损失函数获取模块400获取的图像视频损失函数、各特征信息损失函数获取模块500获取的特征信息损失函数进行融合,获取融合损失函数;利用融合损失函数进行反向传播,以进行图像视频超分辨率与超清晰度重建网络的训练。
在本发明的一实施例中,本发明重建系统可以根据不同的计算机视觉任务需求进行设计对应的至少一特定特征处理模块300,以对所述特征层进行特定特征处理,获得与计算机视觉任务需求相关的待处理图像视频的特定特征信息。各特征信息损失函数获取模块500用以通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数。
根据不同的计算机任务,本发明重建系统的特征处理模块、特征信息输出、特征信息损失函数获取模块的设定是不同的;其特征处理的个数也是不一样的。本发明重建系统应用多特征来确保超分辨率、超清晰度重建后的准确性;对于不同的计算机视觉任务的要求,选取的特征不同,特征的个数也不同。但无论有多少特征,其对单个特征的处理方式是类似的。同时,无论有多少个特征,每个特征都会产生一个特征信息损失函数,所有的特征信息损失函数与图像视频损失函数进行融合可以得到一个“总的”损失函数。“总的”损失函数在算法训练的过程中进行反向传播,最终影响、优化特征提取模块,继而大幅度提高超分辨率、超清晰度重建模块的重建效果可信度。
在本发明的一实施例中,所述特征提取模块100用以获取待处理图像视频的高级特征层,所述高级特征层包含待处理图像视频的深层特征信息。所述超分辨率与超清晰度重建模块200用以将所述高级特征层进行深度神经网络的特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率、超清晰度图像视频。所述特定特征处理模块300用以将所述高级特征层进行深度神经网络的特征处理,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为特征信息输出。
所述图像视频损失函数获取模块400用以计算图像损失函数,具体包含:将重建后的超分辨率、超清晰度图像视频与待处理图像视频对应的高分辨率、高清晰度图像视频计算L1损失,使重建后的超分辨率、超清晰度图像视频具有相应高分辨率、高清晰度图像视频的像素值。所述图像视频损失函数获取模块400还用以将计算得到的图像视频损失函数通过反向传播至所述特征提取模块;使所述特征提取模块提取的高级特征层含有丰富的图像视频信息,从而使得超分辨率与超清晰度重建模块重建后的超分辨率、超清晰图像视频具有更好的视觉效果。
所述特征信息损失函数获取模块500用以计算特征信息的损失函数,通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数。所述特征信息损失函数获取模块500还用以将计算得到的特征信息损失函数反向传播至所述特征提取模块,使所述特征提取模块提取的特征层含有丰富的特定特征信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率、超清晰度图像视频具有更高的可信度。
所述损失函数融合模块600将所述图像视频损失函数、特征信息损失函数进行加权求和,获得融合损失函数;所述损失函数融合模块还用以将融合损失函数反向传播至图像视频损失函数获取模块、特征信息损失函数获取模块。
图5为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图;请参阅图5,在本发明的一实施例中,至少一特征处理模块300包括语义分割模块310,所述语义分割模块310用以对所述特征层进行特征提取,获得待处理图像对应的语义分割图。至少一特定信息损失函数获取模块500包括语义分割损失函数获取模块510,所述语义分割损失函数获取模块510用以根据所述语义分割模块310获取的语义分割图计算语义分割损失函数。所述损失函数融合模块600用以将所述图像视频损失函数获取模块400获取的图像损失函数、所述语义分割损失函数获取模块510获取的语义分割损失函数进行融合,获取融合损失函数;利用融合损失函数进行多任务图像超分辨率重建网络的训练。
在一实施例中,所述特征提取模块100用以获取待处理图像视频的高级特征层,所述高级特征层包含待处理图像视频的深层特征信息。所述超分辨率与超清晰度重建模块200用以将所述高级特征层进行深度神经网络的特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率、超清晰度图像视频。所述语义分割模块310用以将所述高级特征层进行深度神经网络的特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为待处理图像的语义分割图。
所述图像视频损失函数获取模块400用以计算图像损失函数,具体包含:将重建后的超分辨率、超清晰度图像视频与待处理图像视频对应的高分辨率、高清晰度图像视频计算L1损失,使重建后的超分辨率、超清晰度图像视频具有相应高分辨率、高清晰度图像视频的像素值。所述图像视频损失函数获取模块400还用以将计算得到的图像视频损失函数通过反向传播至所述特征提取模块;使所述特征提取模块提取的高级特征层含有丰富的图像视频信息,从而使得超分辨率与超清晰度重建模块重建后的超分辨率、超清晰图像视频具有更好的视觉效果。
所述语义分割损失函数获取模块510用以计算语义分割损失函数,具体包括:将利用语义分割模块获取的待处理图像的语义分割图与对应的语义分割标注图计算多类别交叉熵损失函数,使语义分割模块获取的语义分割图更加准确。所述语义分割损失函数获取模块510用以将计算得到的语义分割损失函数通过语义分割训练梯度反向传播至所述特征提取模块,使所述特征提取模块提取的特征层含有丰富的语义信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率图像像素值更加准确,提高重建后的超分辨率图像的清晰度。
所述损失函数融合模块600将所述图像损失函数、语义分割损失函数进行加权求和,获得融合损失函数;所述损失函数融合模块600还用以将融合损失函数反向传播至图像视频损失函数获取模块400、语义分割损失函数获取模块510。
图6为本发明一实施例中图像视频超分辨率与超清晰度重建系统的组成示意图;请参阅图6,在本发明的一实施例中,至少一特征处理模块300包括文字识别模块320,所述文字识别模块320对所述特征层进行下采样,对下采样后的特征层进行时序特征提取,对提取的时序特征进行文字识别,获得待处理文字图像中的文字内容。至少一特定信息损失函数获取模块500包括文字损失函数获取模块520,所述文字损失函数获取模块520根据所述文字识别模块320获取的文字内容计算文字损失函数。损失函数融合模块600将所述图像视频损失函数获取模块400获取的图像损失函数、所述文字损失函数获取模块520获取的文字损失函数进行融合,获取融合损失函数;利用融合损失函数进行多任务文字图像超分辨率重建网络的训练。在一实施例中,所述重建系统还可以包括超分辨率梯度图重建模块700。
具体地,在本发明的一实施例中,特征提取模块100用以提取待处理图像对应的设定特征层;超分辨率与超清晰度重建模块200用以将所述特征层进行上采样,对上采样后的特征层进行特征提取,获得重建后的超分辨率文字图像;文字识别模块320用以对所述特征层进行下采样,对下采样后的特征层进行时序特征提取,对提取的时序特征进行文字识别,获得待处理文字图像中的文字内容;超分辨率梯度图重建模块700用以对所述特征层进行上采样,对上采样后的特征层进行特征提取,获得重建后的超分辨率梯度图。
在本发明的一实施例中,所述特征提取模块100用以获取待处理文字图像的高级特征层,所述高级特征层包含待处理文字图像的深层特征信息。在一实施例中,可将待处理文字图像输入ESRGAN生成网络中的特征提取模块,从而获取高级特征层。
所述超分辨率与超清晰度重建模块200用以将所述特征层进行深度神经网络的上采样,对上采样后的特征层进行特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率文字图像。
所述文字识别模块320用以将所述高级特征层进行包含池化层的深度神经网络的下采样,使得下采样后的特征层高度为设定值1;将下采样后的特征层送入双向LSTM网络进行时序特征的提取,获得待处理文字图像时序特征的输出;将时序特征通过全连接层和softmax函数进一步提出特征,最后一层的特征确定为待处理文字图像的文字内容。
所述超分辨率梯度图重建模块700用以将所述高级特征层进行深度神经网络的上采样,对上采样后的特征层进行特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率梯度图。
如图6所示,在本发明的一实施例中,所述重建系统包括图像视频损失函数获取模块400、文字损失函数获取模块520、梯度损失函数获取模块800及损失函数融合模块600。
所述图像视频损失函数获取模块400用以根据所述超分辨率与超清晰度重建模块获取的超分辨率文字图像计算图像损失函数;文字损失函数获取模块520用以根据所述文字识别模块获取的文字内容计算文字损失函数;梯度损失函数获取模块800用以根据所述超分辨率梯度图重建模块获取的超分辨率梯度图计算梯度损失函数。损失函数融合模块600用以将所述图像视频损失函数获取模块400获取的图像损失函数、所述文字损失函数获取模块520获取的文字损失函数、所述梯度损失函数获取模块800获取的梯度损失函数三种损失函数进行融合,获取融合损失函数;利用融合损失函数进行多任务文字图像超分辨率重建网络的训练。
在本发明的一实施例中,所述图像视频损失函数获取模块400用以计算图像损失函数,具体包含:将重建后的超分辨率文字图像与待处理文字图像对应的高分辨率文字图像计算L1损失,使重建后的超分辨率文字图像具有相应高分辨率文字图像的像素值。
所述文字损失函数获取模块520用以计算文字损失函数,具体包括:将利用文字识别模块获取的待处理文字图像的文字内容与对应的标注文字内容计算CTC损失,使文字识别模块识别的文字内容更加正确。
所述梯度损失函数获取模块800用以计算梯度损失函数,具体包括:将所述待处理文字图像对应的高分辨率文字图像通过Sobel算子计算梯度图,获取目标梯度图;将所述的目标梯度图与重建后的超分辨率梯度图计算L1损失,使重建后超分辨率梯度图具有目标梯度图的像素值。
所述损失函数融合模块600将所述图像损失函数、文字损失函数、梯度损失函数三种损失函数进行加权求和,获得融合损失函数。
所述图像视频损失函数获取模块400用以将计算得到的图像损失函数通过图像训练梯度反向传播至所述特征提取模块;使所述特征特征提取模块提取的高级特征层含有丰富的图像信息,从而使得超分辨率重建模块重建后的超分辨率文字图像更加逼真。
所述文字损失函数获取模块520用以将计算得到的文字损失函数通过文字训练梯度反向传播至所述特征提取模块,使所述特征提取模块提取的特征层含有丰富的文字信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率文字图像文字内容更加准备,提高重建后的超分辨率文字图像的可信度。
所述梯度损失函数获取模块800用以将计算得到的梯度损失函数通过梯度训练梯度反向传播至所述特征提取模块,使所述特征提取模块提取的高级特征层含有丰富的梯度信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率文字图像、文字边缘更加清晰,提高重建后的超分辨率文字图像的清晰度。
所述损失函数融合模块600还用以将融合损失函数反向传播至图像视频损失函数获取模块400、文字损失函数获取模块520及梯度损失函数获取模块800。
在本发明的一种使用场景中,本发明可以降低分辨率的文字图像重建为超分辨率的文字图像,解决现有基于深度神经网络的图像超分辨率重建方法应用于文字图像重建时,重建后的超分辨率文字图像文字边缘模糊、文字内容可信度低的问题,为文字图像的语义分析等高层任务提供清晰可信的图像。
在本发明用于文字图像识别场景中,本发明与现有的基于深度神经网络的图像超分辨率重建方法相比,具有以下两个优势:
(1)重建后的超分辨率文字图像文字边缘清晰:
本发明提供的多任务文字图像超分辨率重建方法,在超分辨率与超清晰度重建模块的基础上并行添加超分辨率梯度图重建模块,计算梯度损失函数,在网络参数更新时,通过梯度训练梯度反向传播,使特征提取模块提取的高级特征层含有丰富的梯度信息,从而使超分辨率与超清晰度重建模块重建的超分辨率文字图像文字边缘更加清晰。
(2)重建后的超分辨率文字图像文字内容可信度高:
本发明提出的多任务文字图像超分辨率重建方法,在超分辨率与超清晰度重建模块的基础上并行添加文字识别模块,计算文字损失函数,在网络参数更新时,通过文字训练梯度反向传播,使特征提取模块提取的高级特征层含有丰富的文字信息,从而使超分辨率与超清晰度重建模块重建的超分辨率文字图像文字内容正确、可信度高。
本发明还揭示一种图像视频超分辨率与超清晰度重建方法,所述重建方法包括:
特征提取模块提取待处理图像视频对应的设定特征层;
超分辨率与超清晰度重建模块进行特征采样及特征提取,获得重建后的超分辨率、超清晰度图像视频;
至少一特定特征处理模块对所述特征层进行特征处理,根据不同的计算机视觉任务设定获得待处理图像视频对应的特征信息输出。
在本发明的一实施例中,所述重建方法进一步包括:
图像视频损失函数获取模块根据所述超分辨率与超清晰度重建模块获取的超分辨率、超清晰度图像视频计算图像视频损失函数;
至少一特征信息损失函数获取模块根据所述特定特征处理模块获取的特征信息输出计算对应的特征信息损失函数;
损失函数融合模块将所述图像视频损失函数获取模块获取的图像视频损失函数、各特征信息损失函数获取模块获取的特征信息损失函数进行融合,获取融合损失函数;利用融合损失函数进行反向传播,以进行图像视频超分辨率与超清晰度重建网络的训练。
在本发明的一实施例中,根据不同的计算机视觉任务需求进行设计对应的至少一特定特征处理模块,以对所述特征层进行特定特征处理,获得与计算机视觉任务需求相关的待处理图像视频的特定特征信息。各特征信息损失函数获取模块通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数。
在本发明的一实施例中,所述特征提取模块获取待处理图像视频的高级特征层,所述高级特征层包含待处理图像视频的深层特征信息。所述超分辨率与超清晰度重建模块将所述高级特征层进行深度神经网络的特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率、超清晰度图像视频。所述特定特征处理模块将所述高级特征层进行深度神经网络的特征处理,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为特征信息输出。
所述图像视频损失函数获取模块计算图像损失函数,具体包含:将重建后的超分辨率、超清晰度图像视频与待处理图像视频对应的高分辨率、高清晰度图像视频计算L1损失,使重建后的超分辨率、超清晰度图像视频具有相应高分辨率、高清晰度图像视频的像素值。所述图像视频损失函数获取模块还将计算得到的图像视频损失函数通过反向传播至所述特征提取模块;使所述特征提取模块提取的高级特征层含有丰富的图像视频信息,从而使得超分辨率与超清晰度重建模块重建后的超分辨率、超清晰图像视频具有更好的视觉效果。
所述特征信息损失函数获取模块计算特征信息的损失函数,通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数。所述特征信息损失函数获取模块还将计算得到的特征信息损失函数反向传播至所述特征提取模块,使所述特征提取模块提取的特征层含有丰富的特定特征信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率、超清晰度图像视频具有更高的可信度。
所述损失函数融合模块将所述图像视频损失函数、特征信息损失函数进行加权求和,获得融合损失函数;所述损失函数融合模块还用以将融合损失函数反向传播至图像视频损失函数获取模块、特征信息损失函数获取模块。
在本发明的一实施例中,至少一特征处理模块300包括语义分割模块310,语义分割模块310可以用来完成语义分割;语义分割模块310可以与语义分割损失函数获取模块510配合工作。在本发明的另一实施例中,至少一特征处理模块300包括文字识别模块320,文字识别模块320可以用来完成文字识别;文字识别模块320可以与文字损失函数获取模块520配合工作。此外,至少一特征处理模块300还可以包括超分辨率梯度图重建模块700,超分辨率梯度图重建模块700可以与梯度损失函数获取模块800配合工作。
当然,在本发明的一实施例中,至少一特征处理模块300可以同时包括语义分割模块310、文字识别模块320(还可以是其他模块,如用于完成人脸识别、高级驾驶辅助系统ADAS、姿态识别等处理过程的模块),各过程可以并行处理。
综上所述,本发明提出的图像视频超分辨率与超清晰度重建系统及方法,可围绕不同的计算机视觉任务,并可配置并融合多个特征,最终在确保重建图像、视频的可信度的前提下提高图像、视频分辨率和清晰度,进而能被计算机视觉任务所使用,提高现有计算机视觉任务的实际使用性能。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施;例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一些实施例中,本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中;例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现;例如,作为与处理器配合从而执行各个步骤或功能的电路。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。实施例中所涉及的效果或优点可因多种因素干扰而可能不能在实施例中体现,对于效果或优点的描述不用于对实施例进行限制。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

Claims (10)

1.一种图像视频超分辨率与超清晰度重建系统,其特征在于,所述重建系统包括:
特征提取模块,用以提取待处理图像视频对应的设定特征层;
超分辨率与超清晰度重建模块,连接所述特征提取模块,用以进行特征采样及特征提取,获得重建后的超分辨率、超清晰度图像视频;以及
至少一特定特征处理模块,各特定特征处理模块分别连接所述特征提取模块,用以对所述特征层进行特征处理,根据不同的计算机视觉任务设定获得待处理图像视频对应的特征信息输出。
2.根据权利要求1所述的图像视频超分辨率与超清晰度重建系统,其特征在于:
所述系统进一步包括:
图像视频损失函数获取模块,用以根据所述超分辨率与超清晰度重建模块获取的超分辨率图像计算图像视频损失函数;
至少一特征信息损失函数获取模块,各特征信息损失函数获取模块连接对应的特定特征处理模块,用以根据所述特定特征处理模块获取的特征信息输出计算对应的特征信息损失函数;以及
损失函数融合模块,用以将所述图像视频损失函数获取模块获取的图像视频损失函数、各特征信息损失函数获取模块获取的特征信息损失函数进行融合,获取融合损失函数;利用融合损失函数进行反向传播,以进行图像视频超分辨率与超清晰度重建网络的训练。
3.根据权利要求1或2所述的图像视频超分辨率与超清晰度重建系统,其特征在于:
根据不同的计算机视觉任务需求进行设计对应的至少一特定特征处理模块,以对所述特征层进行特定特征处理,获得与计算机视觉任务需求相关的待处理图像视频的特征信息输出。
4.根据权利要求2所述的图像视频超分辨率与超清晰度重建系统,其特征在于:
各特征信息损失函数获取模块用以通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数。
5.根据权利要求2所述的图像视频超分辨率与超清晰度重建系统,其特征在于:
所述特征提取模块用以获取待处理图像视频的高级特征层,所述高级特征层包含待处理图像视频的深层特征信息;
所述超分辨率与超清晰度重建模块用以将所述高级特征层进行深度神经网络的特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率、超清晰度图像视频;
所述特定特征处理模块用以将所述高级特征层进行深度神经网络的特征处理,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为特征信息输出;
所述图像视频损失函数获取模块用以计算图像损失函数,具体包含:将重建后的超分辨率、超清晰度图像视频与待处理图像视频对应的高分辨率、高清晰度图像视频计算L1损失,使重建后的超分辨率、超清晰度图像视频具有相应高分辨率、高清晰度图像视频的像素值;
所述图像视频损失函数获取模块还用以将计算得到的图像视频损失函数通过反向传播至所述特征提取模块;使所述特征提取模块提取的高级特征层含有丰富的图像视频信息,从而使得超分辨率与超清晰度重建模块重建后的超分辨率、超清晰图像视频具有更好的视觉效果;
所述特征信息损失函数获取模块用以计算特征信息的损失函数,通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数;
所述特征信息损失函数获取模块还用以将计算得到的特征信息损失函数反向传播至所述特征提取模块,使所述特征提取模块提取的特征层含有丰富的特定特征信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率、超清晰度图像视频具有更高的可信度;
所述损失函数融合模块将所述图像视频损失函数、特征信息损失函数进行加权求和,获得融合损失函数;所述损失函数融合模块还用以将融合损失函数反向传播至图像视频损失函数获取模块、特征信息损失函数获取模块。
6.一种图像视频超分辨率与超清晰度重建方法,其特征在于,所述重建方法包括:
特征提取模块提取待处理图像视频对应的设定特征层;
超分辨率与超清晰度重建模块进行特征采样及特征提取,获得重建后的超分辨率、超清晰度图像视频;以及
至少一特定特征处理模块对所述特征层进行特征处理,根据不同的计算机视觉任务设定获得待处理图像视频对应的特征信息输出。
7.根据权利要求6所述的图像视频超分辨率与超清晰度重建方法,其特征在于:
所述重建方法进一步包括:
图像视频损失函数获取模块根据所述超分辨率与超清晰度重建模块获取的超分辨率、超清晰度图像视频计算图像视频损失函数;
至少一特征信息损失函数获取模块根据所述特定特征处理模块获取的特征信息输出计算对应的特征信息损失函数;以及
损失函数融合模块将所述图像视频损失函数获取模块获取的图像视频损失函数、各特征信息损失函数获取模块获取的特征信息损失函数进行融合,获取融合损失函数;利用融合损失函数进行反向传播,以进行图像视频超分辨率与超清晰度重建网络的训练。
8.根据权利要求6或7所述的图像视频超分辨率与超清晰度重建方法,其特征在于:
根据不同的计算机视觉任务需求进行设计对应的至少一特定特征处理模块,以对所述特征层进行特定特征处理,获得与计算机视觉任务需求相关的待处理图像视频的特定特征信息。
9.根据权利要求7所述的图像视频超分辨率与超清晰度重建方法,其特征在于:
各特征信息损失函数获取模块通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数。
10.根据权利要求7所述的图像视频超分辨率与超清晰度重建方法,其特征在于:
所述特征提取模块获取待处理图像视频的高级特征层,所述高级特征层包含待处理图像视频的深层特征信息;
所述超分辨率与超清晰度重建模块将所述高级特征层进行深度神经网络的特征提取,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为重建后的超分辨率、超清晰度图像视频;
所述特定特征处理模块将所述高级特征层进行深度神经网络的特征处理,获得各层深度神经网络输出的特征;将最后一层深度神经网络输出的特征确定为特征信息输出;
所述图像视频损失函数获取模块计算图像损失函数,具体包含:将重建后的超分辨率、超清晰度图像视频与待处理图像视频对应的高分辨率、高清晰度图像视频计算L1损失,使重建后的超分辨率、超清晰度图像视频具有相应高分辨率、高清晰度图像视频的像素值;
所述图像视频损失函数获取模块还将计算得到的图像视频损失函数通过反向传播至所述特征提取模块;使所述特征提取模块提取的高级特征层含有丰富的图像视频信息,从而使得超分辨率与超清晰度重建模块重建后的超分辨率、超清晰图像视频具有更好的视觉效果;
所述特征信息损失函数获取模块计算特征信息的损失函数,通过计算特征信息输出与期望特征信息的差异获取特征信息损失函数;
所述特征信息损失函数获取模块还将计算得到的特征信息损失函数反向传播至所述特征提取模块,使所述特征提取模块提取的特征层含有丰富的特定特征信息,从而帮助超分辨率与超清晰度重建模块重建后的超分辨率、超清晰度图像视频具有更高的可信度;
所述损失函数融合模块将所述图像视频损失函数、特征信息损失函数进行加权求和,获得融合损失函数;所述损失函数融合模块还用以将融合损失函数反向传播至图像视频损失函数获取模块、特征信息损失函数获取模块。
CN202011417285.0A 2020-12-07 2020-12-07 图像视频超分辨率与超清晰度重建系统及方法 Pending CN112419158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011417285.0A CN112419158A (zh) 2020-12-07 2020-12-07 图像视频超分辨率与超清晰度重建系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011417285.0A CN112419158A (zh) 2020-12-07 2020-12-07 图像视频超分辨率与超清晰度重建系统及方法

Publications (1)

Publication Number Publication Date
CN112419158A true CN112419158A (zh) 2021-02-26

Family

ID=74776653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011417285.0A Pending CN112419158A (zh) 2020-12-07 2020-12-07 图像视频超分辨率与超清晰度重建系统及方法

Country Status (1)

Country Link
CN (1) CN112419158A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191392A (zh) * 2018-08-09 2019-01-11 复旦大学 一种语义分割驱动的图像超分辨率重构方法
CN109671022A (zh) * 2019-01-22 2019-04-23 北京理工大学 一种基于深度特征翻译网络的图片纹理增强超分辨率方法
CN110263756A (zh) * 2019-06-28 2019-09-20 东北大学 一种基于联合多任务学习的人脸超分辨率重建系统
CN110633755A (zh) * 2019-09-19 2019-12-31 北京市商汤科技开发有限公司 网络训练方法、图像处理方法及装置、电子设备
CN110766610A (zh) * 2019-10-28 2020-02-07 维沃移动通信有限公司 一种超分辨率图像的重建方法及电子设备
CN111062872A (zh) * 2019-12-17 2020-04-24 暨南大学 一种基于边缘检测的图像超分辨率重建方法及系统
US20200364500A1 (en) * 2019-05-13 2020-11-19 Shanghai Neusoft Medical Technology Co., Ltd. Training image enhancement model and enhancing image

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191392A (zh) * 2018-08-09 2019-01-11 复旦大学 一种语义分割驱动的图像超分辨率重构方法
CN109671022A (zh) * 2019-01-22 2019-04-23 北京理工大学 一种基于深度特征翻译网络的图片纹理增强超分辨率方法
US20200364500A1 (en) * 2019-05-13 2020-11-19 Shanghai Neusoft Medical Technology Co., Ltd. Training image enhancement model and enhancing image
CN110263756A (zh) * 2019-06-28 2019-09-20 东北大学 一种基于联合多任务学习的人脸超分辨率重建系统
CN110633755A (zh) * 2019-09-19 2019-12-31 北京市商汤科技开发有限公司 网络训练方法、图像处理方法及装置、电子设备
CN110766610A (zh) * 2019-10-28 2020-02-07 维沃移动通信有限公司 一种超分辨率图像的重建方法及电子设备
CN111062872A (zh) * 2019-12-17 2020-04-24 暨南大学 一种基于边缘检测的图像超分辨率重建方法及系统

Similar Documents

Publication Publication Date Title
US10825142B2 (en) Human face resolution re-establishing method and re-establishing system, and readable medium
CN111784762B (zh) X光造影图像血管中心线提取方法及装置
CN110163801A (zh) 一种图像超分辨和着色方法、系统及电子设备
Huang et al. Pyramid-structured depth map super-resolution based on deep dense-residual network
CN116258652B (zh) 基于结构注意和文本感知的文本图像修复模型及方法
WO2023212997A1 (zh) 基于知识蒸馏的神经网络训练方法、设备及存储介质
CN111881768B (zh) 一种文档版面分析方法
CN113486890A (zh) 基于注意力特征融合和空洞残差特征增强的文本检测方法
CN109034198B (zh) 基于特征图恢复的场景分割方法和系统
CN112419159B (zh) 文字图像超分辨率重建系统及方法
CN117078930A (zh) 基于边界感知和注意力机制的医学图像分割方法
CN112700460B (zh) 图像分割方法及系统
CN112446292B (zh) 一种2d图像显著目标检测方法及系统
CN111914654A (zh) 一种文本版面分析方法、装置、设备和介质
CN117710215A (zh) 一种基于极线分窗口注意力的双目图像超分辨率方法
Mu et al. Integration of gradient guidance and edge enhancement into super‐resolution for small object detection in aerial images
CN116402692B (zh) 基于非对称交叉注意力的深度图超分辨率重建方法与系统
CN113505796A (zh) 一种实时的高精度全景分割方法
CN112419158A (zh) 图像视频超分辨率与超清晰度重建系统及方法
CN116188273A (zh) 一种基于不确定性导向的双模态可分离图像超分辨率方法
US20230325985A1 (en) Systems and methods for inpainting images at increased resolution
CN115115577A (zh) 一种基于混合感知的多阶段器官分割方法及装置
CN115393868A (zh) 文本检测方法、装置、电子设备和存储介质
CN112488115B (zh) 一种基于two-stream架构的语义分割方法
CN110111254B (zh) 一种基于多级递归引导和渐进监督的深度图超分辨率方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination