CN111598776B

CN111598776B - 图像处理方法、图像处理装置、存储介质与电子设备

Info

Publication number: CN111598776B
Application number: CN202010356816.3A
Authority: CN
Inventors: 张弓
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2020-04-29
Filing date: 2020-04-29
Publication date: 2023-06-30
Anticipated expiration: 2040-04-29
Also published as: CN111598776A

Abstract

本公开提供了一种图像处理方法、图像处理装置、计算机可读存储介质与电子设备，涉及图像处理技术领域。该图像处理方法包括：将待处理图像分割为多个待处理子图像；确定各所述待处理子图像的类别；基于所述待处理子图像的类别，采用对应的处理方式对所述待处理子图像进行处理，得到所述待处理子图像对应的目标子图像；其中，至少一个所述待处理子图像的处理方式包括超分辨率重建处理；合成各所述目标子图像，得到所述待处理图像对应的目标图像。本公开降低了图像超分辨率重建的计算量，适合于移动终端等轻量化设备，提高了实用性。

Description

图像处理方法、图像处理装置、存储介质与电子设备

技术领域

本公开涉及图像处理技术领域，尤其涉及一种图像处理方法、图像处理装置、计算机可读存储介质与电子设备。

背景技术

超分辨率重建(Super-Resolution)是指提高原图像的分辨率，将低分辨率图像重建为高分辨率图像的方法。

相关技术中，超分辨率重建过程通常需要较高的计算量，特别是在一些要求图像精细化的场景中，为了实现像素级别的处理，需要引入复杂度很高的算法，从而导致超分辨率重建对于硬件的要求过高，难以应用到移动终端等轻量化设备上，并且响应时间过长，难以应用到视频重建等实时性场景中，因此实用性较低。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开提供了一种图像处理方法、图像处理装置、计算机可读存储介质与电子设备，进而一定程度上解决相关技术中图像超分辨率重建实用性较低的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的第一方面，提供一种图像处理方法，包括：将待处理图像分割为多个待处理子图像；确定各所述待处理子图像的类别；基于所述待处理子图像的类别，采用对应的处理方式对所述待处理子图像进行处理，得到所述待处理子图像对应的目标子图像；其中，至少一个所述待处理子图像的处理方式包括超分辨率重建处理；合成各所述目标子图像，得到所述待处理图像对应的目标图像。

根据本公开的第二方面，提供一种图像处理装置，包括：图像分割模块，用于将待处理图像分割为多个待处理子图像；类别确定模块，用于确定各所述待处理子图像的类别；子图像处理模块，用于基于所述待处理子图像的类别，采用对应的处理方式对所述待处理子图像进行处理，得到所述待处理子图像对应的目标子图像；其中，至少一个所述待处理子图像的处理方式包括超分辨率重建处理；图像合成模块，用于合成各所述目标子图像，得到所述待处理图像对应的目标图像。

根据本公开的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面的图像处理方法及其可能的实施方式。

根据本公开的第四方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述第一方面的图像处理方法及其可能的实施方式。

本公开的技术方案具有以下有益效果：

根据上述图像处理方法、图像处理装置、计算机可读存储介质和电子设备，将待处理图像分割为多个待处理子图像，确定各待处理子图像的类别，基于与其类别对应的处理方式对待处理子图像进行处理，得到对应的目标子图像，最后合成各目标子图像，得到待处理图像对应的目标图像。一方面，本公开对于图像中的不同部分采用不同的方式进行处理，仅对图像中的部分区域进行精细的超分辨率重建，无需对整张图像进行复杂计算，从而降低了图像超分辨率重建的计算量，适合于移动终端等轻量化设备，提高了实用性。另一方面，对各待处理子图像采用的处理方式与其类别相对应，可以根据每个待处理子图像的特点采取合适的处理方式，灵活性较高，且处理效果较好。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施方式，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本示例性实施方式中移动终端的示意图；

图2示出本示例性实施方式中一种图像处理方法的流程图；

图3示出本示例性实施方式中一种图像处理方法的子流程图；

图4示出本示例性实施方式中一种图像处理的示意图；

图5示出本示例性实施方式中另一种图像处理的示意图；

图6示出本示例性实施方式中一种图像处理装置的结构框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

本公开的示例性实施方式提供一种图像处理方法。该图像处理方法可以运行于电子设备，该电子设备一般包括处理器和存储器，存储器用于存储处理器的可执行指令，也可以存储如图像等应用数据，处理器用于执行可执行指令，以实现图像处理。该电子设备包括但不限于：智能手机、平板电脑、游戏机、台式电脑、笔记本电脑、电视、电子相框、个人数字助理(Personal Digital Assistant，PDA)、导航设备、可穿戴设备、无人机等。

下面以图1中的移动终端100为例，对上述电子设备的构造进行示例性说明。本领域技术人员应当理解，除了特别用于移动目的的部件之外，图1中的构造也能够应用于固定类型的设备。在另一些实施方式中，移动终端100可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。各部件间的接口连接关系只是示意性示出，并不构成对移动终端100的结构限定。在另一些实施方式中，移动终端100也可以采用与图1不同的接口连接方式，或多种接口连接方式的组合。

如图1所示，移动终端100具体可以包括：处理器110、内部存储器121、外部存储器接口122、USB接口130、充电管理模块140、电源管理模块141、电池142、天线1、天线2、移动通信模块150、无线通信模块160、音频模块170、扬声器171、受话器172、麦克风173、耳机接口174、传感器模块180、显示屏190、摄像模组191、指示器192、马达193、按键194以及用户标识模块(Subscriber Identification Module，SIM)卡接口195等。

处理器110可以包括一个或多个处理单元，例如：处理器110可以包括应用处理器(Application Processor，AP)、调制解调处理器、图形处理器(Graphics ProcessingUnit，GPU)、图像信号处理器(Image Signal Processor，ISP)、控制器、编码器、解码器、数字信号处理器(Digital Signal Processor，DSP)、基带处理器和/或神经网络处理器(Neural-Network Processing Unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

编码器可以对图像或视频数据进行编码(即压缩)，形成码流数据；解码器可以对图像或视频的码流数据进行解码(即解压缩)，以还原出图像或视频数据。移动终端100可以支持一种或多种编码器和解码器。这样，移动终端100可以处理多种编码格式的图像或视频，例如：JPEG(Joint Photographic Experts Group，联合图像专家组)、PNG(PortableNetwork Graphics，便携式网络图形)、BMP(Bitmap，位图)等图像格式，MPEG(MovingPicture Experts Group，动态图像专家组)1、MPEG2、MPEG3、MPEG4、H.263、H.264、H.265、HEVC(High Efficiency Video Coding，高效率视频编码)等视频格式。

NPU通过部署神经网络，利用神经网络处理图像特征提取、图像分类、图像识别等计算工作。在一些实施方式中，神经网络也可以部署于AP中。

在一些实施方式中，处理器110可以包括一个或多个接口。接口可以包括集成电路(Inter-Integrated Circuit，I2C)接口、集成电路内置音频(Inter-Integrated CircuitSound，I2S)接口、脉冲编码调制(Pulse Code Modulation，PCM)接口、通用异步收发传输器(Universal Asynchronous Receiver/Transmitter，UART)接口、移动产业处理器接口(Mobile Industry Processor Interface，MIPI)、通用输入输出(General-PurposeInput/Output，GPIO)接口、用户标识模块(Subscriber Identity Module，SIM)接口和/或通用串行总线(Universal Serial Bus，USB)接口等。通过不同的接口和移动终端100的其他部件形成连接。

USB接口130是符合USB标准规范的接口，具体可以是MiniUSB接口，MicroUSB接口，USBTypeC接口等。USB接口130可以用于连接充电器为移动终端100充电，也可以连接耳机，通过耳机播放音频，还可以用于移动终端100连接其他电子设备，例如连接电脑、外围设备等。

充电管理模块140用于从充电器接收充电输入。充电管理模块140为电池142充电的同时，还可以通过电源管理模块141为设备供电。

电源管理模块141用于连接电池142、充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入，为移动终端100的各个部分供电，还可以用于监测电池的状态。

移动终端100的无线通信功能可以通过天线1、天线2、移动通信模块150、无线通信模块160、调制解调处理器以及基带处理器等实现。

天线1和天线2用于发射和接收电磁波信号。移动终端100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用，以提高天线的利用率。移动通信模块150可以提供应用在移动终端100上的包括2G/3G/4G/5G等无线通信的解决方案。

无线通信模块160可以提供应用在移动终端100上的包括WLAN、BT、GNSS、FM、NFC、IR技术等无线通信解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波，将电磁波信号调频以及滤波处理，将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号，对其进行调频，放大，经天线2转为电磁波辐射出去。

在一些实施方式中，移动终端100的天线1和移动通信模块150耦合，天线2和无线通信模块160耦合，使得移动终端100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(Global System for Mobilecommunications，GSM)，通用分组无线服务(General Packet Radio Service，GPRS)，码分多址接入(Code Division Multiple Access，CDMA)，宽带码分多址(Wideband CodeDivision Multiple Access，WCDMA)，时分码分多址(Time Division-Synchronous CodeDivision Multiple Access，TD-SCDMA)，长期演进(Long Term Evolution，LTE)，新空口(New Radio，NR)，BT，GNSS，WLAN，NFC，FM，和/或IR技术等。

移动终端100通过GPU、显示屏190及应用处理器等实现显示功能。GPU用于执行数学和几何计算，以实现图形渲染，并连接显示屏190和应用处理器。处理器110可包括一个或多个GPU，其执行程序指令以生成或改变显示信息。移动终端100可以包括一个或多个显示屏190，用于显示图像，视频等。

移动终端100可以通过ISP、摄像模组191、编码器、解码器、GPU、显示屏190及应用处理器等实现拍摄功能。

摄像模组191用于捕获静态图像或视频，通过感光元件采集光信号，转换为电信号。ISP用于处理摄像模组191反馈的数据，将电信号转换成数字图像信号。

外部存储器接口122可以用于连接外部存储卡，例如Micro SD卡，实现扩展移动终端100的存储能力。

内部存储器121可以用于存储计算机可执行程序代码，所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中，存储程序区可存储操作系统，至少一个功能所需的应用程序(比如声音播放功能，图像播放功能等)等。存储数据区可存储移动终端100使用过程中所创建的数据(比如图像，视频)等。处理器110通过运行存储在内部存储器121的指令和/或存储在设置于处理器中的存储器的指令，执行移动终端100的各种功能应用以及数据处理。

移动终端100可以通过音频模块170、扬声器171、受话器172、麦克风173、耳机接口174及应用处理器等实现音频功能。例如音乐播放、录音等。音频模块170用于将数字音频信息转换成模拟音频信号输出，也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。扬声器171，用于将音频电信号转换为声音信号。受话器172，用于将音频电信号转换成声音信号。麦克风173，用于将声音信号转换为电信号。耳机接口174用于连接有线耳机。

传感器模块180可以包括深度传感器1801、压力传感器1802、陀螺仪传感器1803、气压传感器1804等。深度传感器1801用于获取景物的深度信息。压力传感器1802用于感受压力信号，可以将压力信号转换成电信号，用于实现压力触控等功能。陀螺仪传感器1803可以用于确定移动终端100的运动姿态，可用于拍摄防抖、导航、体感游戏等场景。气压传感器1804用于测量气压，可通过计算海拔高度，辅助定位和导航。此外，根据实际需要，还可以在传感器模块180中设置其他功能的传感器，例如磁传感器、加速度传感器、距离传感器等。

指示器192可以是指示灯，可以用于指示充电状态，电量变化，也可以用于指示消息，未接来电，通知等。

马达193可以产生振动提示，例如来电、闹钟、接收信息等的振动提示，也可以用于触摸振动反馈等。

按键194包括开机键，音量键等。按键194可以是机械按键。也可以是触摸式按键。移动终端100可以接收按键输入，产生与移动终端100的用户设置以及功能控制有关的键信号输入。

移动终端100可以支持一个或多个SIM卡接口195，用于连接SIM卡，使移动终端100通过SIM卡和网络交互，实现通话以及数据通信等功能。

下面对本公开示例性实施方式的图像处理方法进行具体说明。

图2示出了该图像处理方法的示意性流程，可以包括以下步骤S210至S240：

步骤S210，将待处理图像分割为多个待处理子图像。

其中，待处理图像包括但不限于：电子设备本地存储的图像，实时采集的图像，从网络或其他设备获取的图像，用户界面截图得到的图像，视频中提取的任一帧图像。

在获取待处理图像后，可以根据待处理图像的图像内容或颜色分布等信息进行图像分割，得到至少两个待处理子图像，使各待处理子图像具有不同的主题、目标、颜色特征等。本示例性实施方式对于待处理子图像的尺寸或形状不做限定，例如可以通过抠图从待处理图像中得到形状不规则的待处理子图像，也可以通过矩形检测框从待处理图像中提取形状为矩形、但尺寸不一致的待处理子图像，等等。

下面提供几种分割待处理图像的具体方式：

方式一、将待处理图像分割为多个图层，以每个图层为一个待处理子图像。

这种方式一般适用于待处理图像包含图层信息时。不同图层具有不同类型的内容，例如图层一为背景，图层二为剪贴画，图层三为装饰效果，图层四为文字。将待处理图像中的不同图层分别分割出来，以每个图层为一个待处理子图像，相当于对待处理图像进行了元素拆解。

需要说明的是，某些图层可能存在不连续的像素点，例如对于上述图层二、三、四，其可能分布于待处理图像中不连续的多个区域。为了保证每个待处理子图像是一张完整图像，可以使待处理子图像与待处理图像的尺寸相同，对于未覆盖的像素点，可以记为空值或0等。

方式二、将待处理图像分割为多个区域，以每个区域为一个待处理子图像。

通常，每个区域内的像素点应当具有一定的相似性。可以统计待处理图像的全部像素点，并进行像素聚类，例如通过K-means(K均值)、谱聚类等算法等进行聚类，以得到的每个类别为一个区域。也可以通过语义分割模型，如CRF-RNN(Condition Random Field-Recurrent Neural Network条件随机场-循环神经网络)、PSPNet(Pyramid Scene ParsingNetwork，金字塔场景解析网络)等对待处理图像进行处理，以分割出不同区域。

方式三、从待处理图像中检测目标，以检测出的每个目标为一个待处理子图像。

其中，待处理图像中的目标是指可识别的独立对象，包括人、动物、建筑等。本示例性实施方式可以采用目标检测模型，如RetinaNet(一种目标检测的神经网络)、YOLO(YouOnly Look Once，一种实时目标检测的算法框架，包括v1、v2、v3等多个版本，本公开可以采用其中任一个版本)、R-CNN(Region-Convolutional Neural Network，区域卷积神经网络，或Fast R-CNN、Faster R-CNN等改进版本)、SSD(Single Shot MultiBox Detector，单步多框目标检测)等对待处理图像进行检测，识别出其中的每个目标，分别形成对应的待处理子图像。需要补充的是，在检测出待处理图像中的所有目标后，可以将剩余部分形成一个待处理子图像。

需要说明的是，实际应用中可以任意结合上述三种方式，例如在分割图层的基础上，再进一步对每个图层划分区域或检测目标，或者先检测目标，对剩余部分划分区域等等。由此，每个待处理子图像中可以包括多个图层，或多个区域，或多个目标等等，本公开对此不做限定。

步骤S220，确定各待处理子图像的类别。

即对待处理子图像进行分类，确定分类结果，例如待处理子图像为人像、动物、车辆、人工景物、非人工景物等。

在一种可选的实施方式中，参考图3所示，可以通过以下步骤S310至S330确定任一待处理子图像的类别：

步骤S310，按照预设格式将待处理子图像转换为第一输入数据；

步骤S320，根据待处理图像中其他待处理子图像的类别信息生成第二输入数据；

步骤S330，将第一输入数据和第二输入数据输入预先训练的分类模型，得到上述待处理子图像的类别信息。

其中，分类模型可以是预先训练的用于图像分类的卷积神经网络。第一输入数据一般是图像数据，预设格式是分类模型所需的图像输入格式，可以包括预设的图像尺寸与颜色模式。例如预设格式为400*300的RGB图像格式，则待处理子图像的尺寸大于400*300时可以进行压缩，小于400*300时可以进行填充，颜色模式非RGB时可以转换为RGB格式。

第二输入数据来源于待处理图像中其他待处理子图像的类别信息。例如，步骤S210中将待处理图像划分为6个待处理子图像，将其他5个待处理子图像的类别生成为一个向量，即第二输入数据。一般的，第二输入数据具有固定的维度，如可以是10，将其他待处理子图像的类别信息对应的数值依次写入这10个维度中，当其他待处理子图像未全部确定类别，或者其他待处理子图像的总数小于10时，可以在剩余的维度中填入预设值，如0或1等。

在一种实施方式中，可以将第一输入数据和第二输入数据拼接为一个完整的输入数据，输入到分类模型中进行处理。

在另一种实施方式中，分类模型可以设置双通道，一个通道用于输入第一输入数据，另一通道用于输入第二输入数据。第一输入数据一般为图像，经过分类模型内部的卷积、池化等处理后，在某一中间层和第二输入数据进行拼接，再经过后续的特征提取、全连接等操作，输出分类结果。

在图像分类中，由于待处理子图像来源于同一张待处理图像，其他待处理子图像的类别信息可以作为当前待分类的待处理子图像的特征的一部分，为机器识别图像提供了重要的参考信息，从而提高了待处理子图像的分类准确度。

步骤S230，基于待处理子图像的类别，采用对应的处理方式对待处理子图像进行处理，得到待处理子图像对应的目标子图像。

其中，至少一个待处理子图像的处理方式包括超分辨率重建处理。超分辨率重建可以采用插值或神经网络实现。例如，对待图像处理子图像计算像素值梯度，根据像素值梯度在原有的像素点之间插入新的像素点，从而得到像素数更高(即分辨率更高)的目标图像。本示例性实施方式中，无需对每个待处理子图像都进行超分辨率重建处理。具体来说，上述处理方式可以包括以下任意一种或多种：

第一处理方式，通过预先训练的神经网络对待处理子图像进行超分辨率重建处理。

其中，神经网络包括但不限于：SRCNN(Super-Resolution Convolutional NeuralNetwork，超分辨率卷积神经网络)或其FSRCNN(Fast SRCNN，加速超分辨率卷积神经网络)；GAN(Generative Adversarial Networks，生成对抗网络)，如DeblurGAN(去模糊生成对抗网络)；DRN(Deep Residual Network，深度残差网络)，如EDSR(Enhanced Deep ResidualNetworks for Single Image Super-Resolution，用于单张图像超分辨率的加强深度残差网络)；DCNN(Deep Convolutional Neural Network，深度卷积神经网络)，如VDSR(Super-Resolution Using Very Deep Convolutional Networks，超分辨率深度卷积神经网络)。

以SRCNN为例，可以通过大量的样本图像对进行训练，每个样本图像对包括一张样本图像(sample)和对应的一张高清图像(ground truth)，从而通过调整网络参数，直到达到一定的准确率；在应用时将待处理子图像输入经过训练的网络，输出经过超分辨率重建的图像。

需要说明的是，在进行超分辨率重建时，可以根据所需的图像分辨率进行处理。

第二处理方式，对待处理子图像进行对比度拉伸，包括局部对比度拉伸、全局对比度拉伸等，属于图像灰度增强的手段。例如，某一待处理子图像的像素灰度值大部分集中在20-60之间，整个图像的色调暗淡，不同区域的区分度也不高。通过对比度拉伸，将像素灰度值拉伸到0-255的区间，这样整个图像的色调变亮，且不同区域之间的区分度增加，更易于识别。

第三处理方式，对待处理子图像进行滤波与去噪处理。其中，滤波包括高斯滤波、中值滤波、方向性插值滤波(如金字塔方向性滤波或其他方向性滤波)等；去噪包括均值去噪、非均值去噪等。滤波本质上也是去噪的一种手段，将滤波与去噪相结合，可以实现较好的去噪效果。

第四处理方式，对所处待处理子图像中的平坦区域与非平坦区域采用不同的滤波方式进行滤波。其中，平坦区域指图像纹理不丰富的区域，非平坦区域指图像纹理丰富的区域；可以计算待处理子图像中各个区域的图像频率，通过一频率阈值进行区分，频率高于频率阈值的区域为非平坦区域，反之为平坦区域。对于平坦区域和非平坦区域，其所包含的图像信息密度是不同的，一般非平坦区域的信息密度更高。因此可以采用不同的滤波方式，例如平坦区域采用线性滤波，如高斯滤波，非平坦区域采用非线性滤波，如中值滤波。

本示例性实施方式中，可以对不同类别的待处理子图像采用不同的处理方式，从而具有更强的针对性。以下举例说明。

(一)当待处理子图像的类别为人像时，采用上述第一处理方式和/或上述第三处理方式处理待处理子图像，得到对应的目标子图像。人像一般是待处理图像中需要重点呈现的内容，因此采用上述第一处理方式进行超分辨率重建，提高人像部分的清晰度，例如可以采用SRCNN或DeblurGAN实现超分辨率重建。当然，在自拍等一些场景中，人像部分本身的清晰度较高，则可以仅采用上述第三处理方式进行滤波与去噪处理，例如可以先进行高斯滤波再进行非局部均值去噪。

(二)当待处理子图像的类别为人工景物时，采用上述第一处理方式处理待处理子图像，或者依次采用上述第二处理方式和第三处理方式处理待处理子图像，得到对应的目标子图像。人工景物包括建筑、楼宇等，通常也是待处理图像中需要重点呈现的内容，因此采用上述第一处理方式进行超分辨率重建，例如可以采用EDSR或VDSR实现超分辨率重建。此外，人工景物通常存在对比度低的问题，可以采用第二处理方式进行对比度拉伸，再采用第三处理方式进行滤波与去噪，例如先进行局部对比度拉伸和全局对比度拉伸，再进行高斯滤波和方向性插值滤波。

(三)当待处理子图像的类别为非人工景物时，采用上述第一处理方式处理待处理子图像，或者依次采用上述第二处理方式和第四处理方式处理待处理子图像，得到对应的目标子图像。非人工景物包括自然景观、植被等，在一些旅行照片的场景中是重点部分，可以通过第一处理方式进行超分辨率重建，例如可以采用FSRCNN实现超分辨率重建。此外，也可以先采用第二处理方式进行对比度拉伸，再采用第四处理方式进行针对性滤波，例如先进行局部对比度拉伸和全局对比度拉伸，再对平坦区域进行高斯滤波，对非平台区域进行中值滤波。

(四)当待处理子图像的类别为未知类别时，可以仅进行修复，采用上述第二处理方式处理待处理子图像，例如采用金字塔方向性滤波或其他方向性滤波等，再进行去噪，由此得到对应的目标子图像。

上述四种情况仅是举例说明，实际应用中可以结合具体场景与需求采用具体的处理方式。

在一种可选的实施方式中，如果待处理图像为视频中的某一帧图像，对其中包含视频主要目标的待处理子图像(如一段运行视频，包含运动主体的待处理子图像)进行处理时，可以采用以下方式进行超分辨率重建处理：

在视频中选取待处理图像的参考帧图像，并确定参考帧图像中与待处理子图像对应的参考子图像；

对待处理子图像和参考子图像进行匹配，根据匹配结果确定插值参数；

采用上述插值参数对待处理子图像进行插值，以实现超分辨率重建处理。

其中，参考帧图像可以是待处理图像的相邻帧，或者与待处理图像之间间隔了两帧、三帧等，保证参考帧图像与待处理图像的内容基本相同，同时存在微小的差异。参考子图像可以通过对参考帧图像进行分割得到，分割方法可以参考上述步骤S210。

匹配是指对待处理子图像中的像素点，在参考子图像中找到对应的像素点，例如可以采用梯度图像的模板匹配对齐算法、运动估计中的块匹配算法、基于特征算子的对齐算法等实现；然后将待处理子图像与参考子图像之间的互补非冗余信息进行处理，确定插值参数。插值参数可以是待插入的新像素值，也可以是新像素值与当前帧像素点的差值，最终得到的插值参数可以是与待处理子图像对应的矩阵。由于两图像之间存在细节方面的差异，通过上述匹配像素点与计算差值参数，可以提取并综合两图像的细节信息。

采用插值参数，可以在待处理子图像的像素点之间插入新的像素点，属于像素级别的插值，由此增加了待处理子图像的像素数量，实现分辨率的提高。

步骤S240，合成各目标子图像，得到待处理图像对应的目标图像。

可以按照各待处理子图像在待处理图像中的位置，将对应的各目标子图像进行拼接，从而合成一张目标图像。目标图像与待处理图像的内容基本一致，但分辨率更高，图像内容更清晰。

下面通过两个实施例对上述图像处理方法做进一步说明。

如图4所示，待处理图像中前景物体1为广告牌人脸，前景物体2为真实人脸，前景物体3为树木，将待处理图像分割为一个背景图层和三个物体，得到待处理子图像1至4。然后分别采用处理方式1至4进行处理，其中处理方式1为采用DeblurGAN进行处理，处理方式2为采用FSRCNN进行处理，处理方式3为采用金字塔方向性滤波进行处理，处理方式4为仅增加像素数。得到具有相同像素数的目标子图像1至4，再根据待处理子图像在待处理图像中的位置合并目标子图像，得到目标图像。

如图5所示，待处理图像中区域1为楼宇，前景物体2和前景物体3为植被，背景包括两种不同的纹理图层。先将待处理图像分割为2个背景图层和1个前景图层，再从前景图层中分割出前景物体2和3，从而得到待处理子图像1至5。然后分别采用处理方式1至5进行处理，其中处理方式1为先进行轻度的基于直方图的全局对比度拉伸，再进行较强的高斯滤波，处理方式2为采用FSRCNN进行处理，处理方式3对平坦区域和非平台区域采用不同强度的系数进行方向性滤波，处理方式4和5均为仅增加像素数。得到具有相同像素数的目标子图像1至5，再根据待处理子图像在待处理图像中的位置合并目标子图像，得到目标图像。

综上所述，本示例性实施方式中，将待处理图像分割为多个待处理子图像，确定各待处理子图像的类别，基于与其类别对应的处理方式对待处理子图像进行处理，得到对应的目标子图像，最后合成各目标子图像，得到待处理图像对应的目标图像。一方面，本公开对于图像中的不同部分采用不同的方式进行处理，仅对图像中的部分区域进行精细的超分辨率重建，无需对整张图像进行复杂计算，从而降低了图像超分辨率重建的计算量，适合于移动终端等轻量化设备，提高了实用性。另一方面，对各待处理子图像采用的处理方式与其类别相对应，可以根据每个待处理子图像的特点采取合适的处理方式，灵活性较高，且处理效果较好。

本公开的示例性实施方式还提供一种图像处理装置。如图6所示，该图像处理装置600可以包括：

图像分割模块610，用于将待处理图像分割为多个待处理子图像；

类别确定模块620，用于确定各待处理子图像的类别；

子图像处理模块630，用于基于待处理子图像的类别，采用对应的处理方式对待处理子图像进行处理，得到待处理子图像对应的目标子图像；其中，至少一个待处理子图像的处理方式包括超分辨率重建处理；

图像合成模块640，用于合成各目标子图像，得到待处理图像对应的目标图像。

在一种可选的实施方式中，图像分割模块610，用于通过以下任意一种或多种方式分割待处理图像：

将待处理图像分割为多个图层，以每个图层为一个待处理子图像；

将待处理图像分割为多个区域，以每个区域为一个待处理子图像；

从待处理图像中检测目标，以检测出的每个目标为一个待处理子图像。

在一种可选的实施方式中，上述处理方式包括以下任意一种或多种：

第一处理方式，通过预先训练的神经网络对待处理子图像进行超分辨率重建处理；神经网络包括超分辨率卷积神经网络、生成对抗网络、深度残差网络或深度卷积神经网络；

第二处理方式，对待处理子图像进行对比度拉伸；

第三处理方式，对待处理子图像进行滤波与去噪处理；

第四处理方式，对所处待处理子图像中的平坦区域与非平坦区域采用不同的滤波方式进行滤波。

在一种可选的实施方式中，子图像处理模块630，被配置为：

当待处理子图像的类别为人像时，采用第一处理方式和/或第三处理方式处理待处理子图像，得到对应的目标子图像。

在一种可选的实施方式中，子图像处理模块630，被配置为：

当待处理子图像的类别为人工景物时，采用第一处理方式处理待处理子图像，或者依次采用第二处理方式和第三处理方式处理待处理子图像，得到对应的目标子图像。

在一种可选的实施方式中，子图像处理模块630，被配置为：

当待处理子图像的类别为非人工景物时，采用第一处理方式处理待处理子图像，或者依次采用第二处理方式和第四处理方式处理待处理子图像，得到对应的目标子图像。

在一种可选的实施方式中，类别确定模块620，被配置为：

按照预设格式将任一待处理子图像转换为第一输入数据；

根据待处理图像中其他待处理子图像的类别信息生成第二输入数据；

将第一输入数据和第二输入数据输入预先训练的分类模型，得到任一待处理子图像的类别信息。

上述装置中各模块的具体细节在方法部分实施方式中已经详细说明，未披露的细节内容可以参见方法部分的实施方式内容，因而不再赘述。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

本公开的示例性实施方式还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在终端设备上运行时，程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤，例如可以执行图2或图3中任意一个或多个步骤。该程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施方式。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims

1.一种图像处理方法，其特征在于，包括：

将待处理图像分割为多个待处理子图像；

确定各所述待处理子图像的类别；

基于所述待处理子图像的类别，采用对应的处理方式对所述待处理子图像进行处理，得到所述待处理子图像对应的目标子图像；其中，至少一个所述待处理子图像的处理方式包括超分辨率重建处理；

合成各所述目标子图像，得到所述待处理图像对应的目标图像；

其中，任一所述待处理子图像的类别，通过以下方式确定：

按照预设格式将所述任一待处理子图像转换为第一输入数据；

根据所述待处理图像中其他所述待处理子图像的类别信息生成第二输入数据；

将所述第一输入数据和所述第二输入数据输入预先训练的分类模型，得到所述任一待处理子图像的类别信息。

2.根据权利要求1所述的方法，其特征在于，所述将待处理图像分割为多个待处理子图像，包括以下任意一种或多种方式：

将所述待处理图像分割为多个图层，以每个所述图层为一个所述待处理子图像；

将所述待处理图像分割为多个区域，以每个所述区域为一个所述待处理子图像；

从所述待处理图像中检测目标，以检测出的每个所述目标为一个所述待处理子图像。

3.根据权利要求1所述的方法，其特征在于，所述处理方式包括以下任意一种或多种：

第一处理方式，通过预先训练的神经网络对所述待处理子图像进行超分辨率重建处理；所述神经网络包括超分辨率卷积神经网络、生成对抗网络、深度残差网络或深度卷积神经网络；

第二处理方式，对所述待处理子图像进行对比度拉伸；

第三处理方式，对所述待处理子图像进行滤波与去噪处理；

4.根据权利要求3所述的方法，其特征在于，所述基于所述待处理子图像的类别，采用对应的处理方式对所述待处理子图像进行处理，得到所述待处理子图像对应的目标子图像，包括：

当所述待处理子图像的类别为人像时，采用所述第一处理方式和/或所述第三处理方式处理所述待处理子图像，得到对应的目标子图像。

5.根据权利要求3所述的方法，其特征在于，所述基于所述待处理子图像的类别，采用对应的处理方式对所述待处理子图像进行处理，得到所述待处理子图像对应的目标子图像，包括：

当所述待处理子图像的类别为人工景物时，采用所述第一处理方式处理所述待处理子图像，或者依次采用所述第二处理方式和所述第三处理方式处理所述待处理子图像，得到对应的目标子图像。

6.根据权利要求3所述的方法，其特征在于，所述基于所述待处理子图像的类别，采用对应的处理方式对所述待处理子图像进行处理，得到所述待处理子图像对应的目标子图像，包括：

当所述待处理子图像的类别为非人工景物时，采用所述第一处理方式处理所述待处理子图像，或者依次采用所述第二处理方式和所述第四处理方式处理所述待处理子图像，得到对应的目标子图像。

7.根据权利要求1所述的方法，其特征在于，所述第二输入数据具有固定的维度；所述根据所述待处理图像中其他所述待处理子图像的类别信息生成第二输入数据，包括：

若未完全确定其他所述待处理子图像的类别信息，或其他所述待处理子图像的总数小于所述第二输入数据的维度数，则将已确定的其他所述待处理子图像的类别信息填入所述第二输入数据中对应的维度，在所述第二输入数据中剩余的维度填入预设值。

8.一种图像处理装置，其特征在于，包括：

图像分割模块，用于将待处理图像分割为多个待处理子图像；

类别确定模块，用于确定各所述待处理子图像的类别；

子图像处理模块，用于基于所述待处理子图像的类别，采用对应的处理方式对所述待处理子图像进行处理，得到所述待处理子图像对应的目标子图像；其中，至少一个所述待处理子图像的处理方式包括超分辨率重建处理；

图像合成模块，用于合成各所述目标子图像，得到所述待处理图像对应的目标图像；

其中，所述类别确定模块，被配置为：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。

10.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的方法。