CN112967188A

CN112967188A - 结合结构化语义码流的空间自适应图像超分辨重建方法

Info

Publication number: CN112967188A
Application number: CN202110240723.9A
Authority: CN
Inventors: 陈志波; 金鑫; 孙思萌; 冯若愚
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2021-03-04
Filing date: 2021-03-04
Publication date: 2021-06-15
Anticipated expiration: 2041-03-04
Also published as: CN112967188B

Abstract

本发明公开了一种结合结构化语义码流的空间自适应图像超分辨重建方法，针对现有的基于参考的图像超分辨任务，利用支持机器智能的编码框架中包含的语义结构化码流，为LR低分辨率图像中不同区域、不同语义部分的信息提供准确的高分辨参考指导，从而提高图像超分辨的重建效果，支持有针对性的、特定区域/特定物体超分辨等未来可能的需求。

Description

结合结构化语义码流的空间自适应图像超分辨重建方法

技术领域

本发明涉及图像超分辨技术领域，尤其涉及一种结合结构化语义码流的空间自适应图像超分辨重建方法。

背景技术

目前在工业界中，除了利用SISR(Single image super resolution，单图超分辨)技术进行图像超分辨重建之外，还出现了基于参考的图像超分辨重建RefSR(Reference-based super-resolution)。

SISR主要是利用了LR-HR(low-resolution--high-resolution，低分辨率图像-高分辨率图像)训练对，但当需要重建的高分辨率图像高于输入的低分辨率图像达到8倍或者以上时，效果往往差强人意Zheng H,Ji M,Wang H,et al.Crossnet:An end-to-endreference-based super resolution network using cross-scale warping[C]//Proceedings of the European Conference on Computer Vision(ECCV).2018:88-104.)。

因此，基于参考的图像超分辨RefSR被提出，它除了LR-HR训练对之外，还通过数据检索，从大数据库中引入了和低分辨率图像(LR)相似的高分辨率参考图像。引入高分辨率参考图像的目的在于，在对低分辨率图像进行超分重建时，能够利用高分辨率参考图像的细节进行重建指导，如何实现语义级别的匹配，成为做好基于参考的图像超分辨的关键；但是，目前语义级别的匹配方案过程较为复杂，匹配结果的准确度也有待提升。

发明内容

本发明的目的是提供一种结合结构化语义码流的空间自适应图像超分辨重建方法，利用面向智能的结构化码流编码方案，将会得到方便检索的结构化语义码流，能够为超分辨提供更加可靠、更加多元的高分辨率参考指导。

本发明的目的是通过以下技术方案实现的：

一种结合结构化语义码流的空间自适应图像超分辨重建方法，包括：

利用支持机器智能的编码框架将低分辨率图像进行压缩编码，得到语义结构化码流；

根据语义结构化码流中不同物体或者区域的语义，在云端数据库上进行图像检索，得到相同语义的高分辨率图像；

基于检索到的高分辨率图像提供的参考指导，为语义结构化码流中相同语义的物体或者区域进行自适应超分辨重建。

由上述本发明提供的技术方案可以看出，针对现有的基于参考的图像超分辨任务，利用支持机器智能的编码框架中包含的语义结构化码流，为LR低分辨率图像中不同区域、不同语义部分的信息提供准确的高分辨参考指导，从而提高图像超分辨的重建效果，支持有针对性的、特定区域/特定物体超分辨等未来可能的需求。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种结合结构化语义码流的空间自适应图像超分辨重建方法的示意图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。

随着边缘计算和终端智能技术的发展，更多的机器智能分析期望能够直接在边缘服务器或者终端设备上对视频/图像进行处理分析，因此面向机器的编码方法正在被广泛研究。此编码框架编码后码流中包含对机器智能分析有用的结构化语义内容，可以直接用于机器智能分析的任务中，不必恢复压缩的视频/图像，因此可以减少计算时延，提高处理效率(例如：一种任务驱动的码流结构化图像编码方法，支持机器智能的通用视频压缩编码方法)。受此启发，本发明实施例提供一种结合结构化语义码流的空间自适应图像超分辨重建方法，基于参考的图像超分辨技术直接利用支持机器智能的编码框架中包含的结构化语义码流，来提供准确且高效的语义匹配指导，从而实现高性能、高通用性的、具有空间自适性的参考图像超分辨。

下面介绍如何利用支持机器智能的编码框架中包含的结构化语义码流，为待超分的低分辨率图像LR提供有针对性的、空间自适应的、准确的高分辨参考信息指导。如图1所示，该方法主要包括：

首先，利用支持机器智能的编码框架将低分辨率图像进行压缩编码，得到语义结构化码流。

区别于传统基于参考的图像超分辨技术，本发明利用支持机器智能的编码框架所包含的结构化语义码流，进行基于参考的空间自适应图像超分辨。其中，支持机器智能的编码框架可以采用常规技术实现，例如：1)一种任务驱动的码流结构化图像编码方法；2)支持机器智能的通用视频压缩编码方法；3)He T,Sun S,Guo Z,et al.Beyond coding:Detection-driven image compression with semantically structured bit-stream[C]//2019 Picture Coding Symposium(PCS).IEEE,2019:1-5.

同时，区别于传统视频编码框架的编码模式，本发明利用支持机器智能的编码框架将低分辨率图像进行压缩编码。例如，支持主流的基于变分自编码器(BalléJ,Minnen D,Singh S,et al.Variational image compression with a scale hyperprior[J].ICLR,2018.)和循环递归网络(Toderici G,Vincent D,Johnston N,et al.Full resolutionimage compression with recurrent neural networks[C]//Proceedings of the IEEEConference on Computer Vision and Pattern Recognition.2017:5306-5314.)的深度神经网络压缩模型。

本发明实施例中，压缩编码时，编码处理单元的划分在像素域进行，或者在隐变量域进行，从而得到图1所示的语义结构化码流。

然后，根据语义结构化码流中不同物体或者区域的语义，在云端数据库上进行图像检索，得到相同语义的高分辨率图像，为待超分图像提供参考指导。

考虑到语义结构化码流中可能包含多个不同语义的物体或者区域(如图1中的人、车、数等物体或者区域)，用户可以根据需求，指定一个或多个物体/区域作为超分辨率重建对象来进行检索，进而对指定的物体或者区域进行后续超分辨率重建。

最后，基于检索到的高分辨率图像提供的参考指导，为语义结构化码流中相同语义的物体或者区域进行自适应超分辨重建，从而提升整体图像的超分辨重建质量。

本发明实施例中，特征的压缩编码过程可以在边缘针对某些特定任务实现，也可以选择在云端针对多样的任务进行实现；此外，对于低分辨率的待增强图片可以选择采用基于深度学习的方法实现，也可以采用传统方法实现。

本领域技术人员可以理解，高分辨率图像与低分辨率图像是本领域通用术语，可通过图像的分辨率大小来界定的。此处，高低分辨率为相对概念，即低分辨图像的图像分辨率大小的整数倍(例如，二倍、四倍、八倍等)，均可称之为高分辨率图像；本发明不做固定的分辨率数值限定。

高分辨率图像与低分辨率图像属于相对概念，即两个图像中，分辨率较高则称为高分辨率图像，分辨率较低则称为低分辨率图像。

本发明实施例上述方案主要优点和积极效果体现在以下四个方面：

1)能够支持多种现有甚至未来可能出现的智能超分辨任务，例如，对特定区域/物体进行超分辨增强，应用范围广泛，具有较强的实际应用价值。

2)利用面向智能的结构化码流编码方案，将会得到方便检索的语义结构化码流，便于后续进行语义级别的匹配，能够为超分辨提供更加可靠、更加多元的高分辨率参考指导。

3)针对结构化码流进行高分辨图像检索，不需要额外解码和处理，减少计算量，加速了参考高分辨图像的搜索。

4)该空间/物体自适应的超分辨，不仅可以提高整体图像的超分辨效果，还可对特定区域/物体进行超分辨，支持后续更多的智能分析任务。

综上所述，本发明实施例上述方案能够使得基于参考的图像超分辨这一过程更加的通用、灵活、高效。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，上述实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.一种结合结构化语义码流的空间自适应图像超分辨重建方法，其特征在于，包括：

2.根据权利要求1所述的一种结合结构化语义码流的空间自适应图像超分辨重建方法，其特征在于，利用支持机器智能的编码框架将低分辨率图像进行压缩编码时，编码处理单元的划分在像素域进行，或者在隐变量域进行。