CN113706647A

CN113706647A - 一种图像上色方法及相关装置

Info

Publication number: CN113706647A
Application number: CN202110873360.2A
Authority: CN
Inventors: 阚宏伟; 仝培霖; 朱克峰; 赵谦谦
Original assignee: Inspur Electronic Information Industry Co Ltd
Current assignee: Inspur Electronic Information Industry Co Ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2021-11-26
Anticipated expiration: 2041-07-30
Also published as: CN113706647B

Abstract

本申请公开了一种图像上色方法，包括：将原始图像输入分类模型进行处理，并获取所述处理的过程中每一层与BN层间的差值；根据损失函数对所有所述差值进行计算，得到总体损失值；通过反向传播算法根据所述总体损失值对所述原始图像进行反向求导，得到导数；采用优化算法根据所述导数对原始图像进行更新，得到上色图像，以便降低图像上色过程投入的人力成本，提高处理效率。本申请还公开了一种图像上色装置、服务器以及计算机可读存储介质，具有以上有益效果。

Description

一种图像上色方法及相关装置

技术领域

本申请涉及图像数据处理技术领域，特别涉及一种图像上色方法、图像上色装置、服务器以及计算机可读存储介质。

背景技术

随着图像处理技术不断发展，为了加快对于图像的处理速度，可以对没有色彩的图像或色彩单一的图像进行上色处理，以便加快图像的处理效率。

相关技术中，一般使用GAN(Generative Adversarial Networks，生成式对抗网络)网络作为素描上色的技术，首先根据任务内容创建一个素描和彩色图相互映射的训练数据集，然后根据任务需求搭建一个对应的GAN网络，最后对其进行训练，最终可以得到一个可以用于该任务的GAN网络。用户使用时，只需要将素描图输入模型，模型进行正向推理，就能得到对应的上色图像。但是，根据任务制作素描图和彩色图的训练数据集，需要大量的人力劳动，不利于快速进行上色处理，降低了上色处理的效率。

因此，如何降低上色过程投入的大量人力是本领域技术人员关注的重点问题。

发明内容

本申请的目的是提供一种图像上色方法、图像上色装置、服务器以及计算机可读存储介质，以便降低图像上色过程投入的人力成本，提高处理效率。

为解决上述技术问题，本申请提供一种图像上色方法，包括：

将原始图像输入分类模型进行处理，并获取所述处理的过程中每一层与BN层间的差值；

根据损失函数对所有所述差值进行计算，得到总体损失值；

通过反向传播算法根据所述总体损失值对所述原始图像进行反向求导，得到导数；

采用优化算法根据所述导数对原始图像进行更新，得到上色图像。

可选的，采用优化算法根据所述导数对原始图像进行更新，得到上色图像，包括：

采用optimize优化算法根据所述导数对原始图像进行更新，得到所述上色图像。

可选的，根据损失函数对所有所述差值进行计算，得到总体损失值，包括：

根据欧式距离损失函数或KL散度损失函数对所有所述差值进行计算，得到所述总体损失值。

获取每一层的权重值；

根据所述损失函数和每一层的权重值对所有所述差值进行计算，得到所述总体损失值。

可选的，将原始图像输入分类模型进行处理，并获取所述处理的过程中每一层与BN层间的差值，包括：

将所述原始图像输入DNN分类模型进行处理，并获取所述处理的过程中每一层与BN层间的差值。

可选的，还包括：

判断所述上色图像是否符合上色标准；

若否，则将所述上色图像作为所述原始数据，并执行所述将原始图像输入分类模型进行处理以及后续的步骤，得到新的上色图像。

本申请还提供一种图像上色装置，包括：

差值记录模块，用于将原始图像输入分类模型进行处理，并获取所述处理的过程中每一层与BN层间的差值；

损失计算模块，用于根据损失函数对所有所述差值进行计算，得到总体损失值；

反向求导模块，用于通过反向传播算法根据所述总体损失值对所述原始图像进行反向求导，得到导数；

图像更新模块，用于采用优化算法根据所述导数对原始图像进行更新，得到上色图像。

可选的，所述图像更新模块，具体用于采用optimize优化算法根据所述导数对原始图像进行更新，得到所述上色图像。

本申请还提供一种服务器，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上所述的图像上色方法的步骤。

本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的图像上色方法的步骤。

本申请所提供的一种图像上色方法，包括：将原始图像输入分类模型进行处理，并获取所述处理的过程中每一层与BN层间的差值；根据损失函数对所有所述差值进行计算，得到总体损失值；通过反向传播算法根据所述总体损失值对所述原始图像进行反向求导，得到导数；采用优化算法根据所述导数对原始图像进行更新，得到上色图像。

通过将原始图像输入到分类模型，并获取所述处理的过程中每一层与BN层间的差值，根据损失函数对所有所述差值进行计算，得到总体损失值，也就是确定原始图像与标准图像之间的差距，最后通过该差距对原始图像进行更新，实现对原始图像进行上色，也就是采用分类模型对原始图像进行分类的过程确定原始图像中的色彩信息，而不是采用大量的训练数据训练上色模型，避免加入大量的人力成本，提高了上色处理过程的效率。

本申请还提供一种图像上色装置、服务器以及计算机可读存储介质，具有以上有益效果，在此不做赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种图像上色方法的流程图；

图2为本申请实施例所提供的一种图像上色方法的执行结构示意图；

图3为本申请实施例所提供的一种图像上色装置的结构示意图。

具体实施方式

本申请的核心是提供一种图像上色方法、图像上色装置、服务器以及计算机可读存储介质，以便降低图像上色过程投入的人力成本，提高处理效率。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

相关技术中，一般使用GAN网络作为素描上色的技术，首先根据任务内容创建一个素描和彩色图相互映射的训练数据集，然后根据任务需求搭建一个对应的GAN网络，最后对其进行训练，最终可以得到一个可以用于该任务的GAN网络。用户使用时，只需要将素描图输入模型，模型进行正向推理，就能得到对应的上色图像。但是，根据任务制作素描图和彩色图的训练数据集，需要大量的人力劳动，不利于快速进行上色处理，降低了上色处理的效率。

因此，本申请提供一种图像上色方法，通过将原始图像输入到分类模型，并获取所述处理的过程中每一层与BN层间的差值，根据损失函数对所有所述差值进行计算，得到总体损失值，也就是确定原始图像与标准图像之间的差距，最后通过该差距对原始图像进行更新，实现对原始图像进行上色，也就是采用分类模型对原始图像进行分类的过程确定原始图像中的色彩信息，而不是采用大量的训练数据训练上色模型，避免加入大量的人力成本，提高了上色处理过程的效率。

以下通过一个实施例，对本申请提供的一种图像上色方法进行说明。

请参考图1，图1为本申请实施例所提供的一种图像上色方法的流程图。

本实施例中，该方法可以包括：

S101，将原始图像输入分类模型进行处理，并获取处理的过程中每一层与BN层间的差值；

本步骤旨在将原始图像输入分类模型进行处理，并获取处理的过程中每一层与BN层间的差值。也就是，记录每一次计算结果与BN层之间的差距。

其中，BN(Batch Normalization，批量归一化)层主要是解决在训练过程中，中间层数据分布发生改变的问题，以防止梯度消失或爆炸、加快训练速度。由于，训练好模型中的BN层含有数据集的均值和方差信息，该信息和训练集有很高的相关性。因此，可以提取出该信息，实现素描图上色。

据此，本实施例中将原始图像输入到分类模型进行处理，并非是需要获取到最后的识别结果。而是获取处理的过程中每一层与BN层间的差值。也就是，记录每一层处理结果的均值和方差与BN层的均值和方差的差值，以便确定原始图像与训练集中的标准图像的距离。

其中，原始图像即为需要进行上色的素描图。

相应的，本实施例中的分类模型包含有该BN层。

其中，本实施例中的分类模型为基本的分类模型。例如，原始图像是牛的素描图，该分类模型可以对该原始图像识别为牛即可，而不需要通过模型对该原始图像进行上色。因此，该分类模型可以是基于imagenet2012的预训练模型，该模型包含了1000种类别，满足了大部分需求，直接使用即可。还可以使用预训练得到的模型。例如，可以在网上找一些该类别的图像，然后在预训练模型基础上进行训练，此过程所需要的计算量很少，最后得到满足需求的预训练DNN(Deep Neural Networks，深度神经网络)分类模型。

进一步的，本步骤可以包括：

将原始图像输入DNN分类模型进行处理，并获取处理的过程中每一层与BN层间的差值。

可见，本可选方案中主要是说明采用DNN分类模型进行处理，以便提高对于原始图像进行分类准确性。

S102，根据损失函数对所有差值进行计算，得到总体损失值；

在S101的基础上，本步骤旨在通过所有的差值确定出总体损失值。也就是，确定所有层结果与BN层的标准值之间的差距，而不是仅仅获取其中某一层的结果与BN层之间的差距，或者是最后结果与BN层之间的差距，以便提高本实施例中获取损失值的准确性。

其中，损失函数是用来估量输出与真实值之间的差距，给模型的优化指引方向。由于，本实施例中的真实值为BN层，因此可以确定原始图像中与标准图像之间的色彩差距，以便通过该差距对原始图像进行上色。

进一步的，本步骤可以包括：

根据欧式距离损失函数或KL散度损失函数对所有差值进行计算，得到总体损失值。

可见，本可选方案中主要是对如何进行损失计算进行说明。本可选方案中选择的损失计算方式可以是欧式距离损失函数或KL散度损失函数。其中，KL散度(Kullback-Leibler)散度或称为信息散度，是两个概率分布间差异的非对称性度量。在信息理论中，相对熵等价于两个概率分布的信息熵的差值，表示使用理论分布拟合真实分布时产生的信息损耗，可见可以确定两者之间的差距。

进一步的，本步骤可以包括：

步骤1，获取每一层的权重值；

步骤2，根据损失函数和每一层的权重值对所有差值进行计算，得到总体损失值。

可见，本可选方案中主要是对如何进行损失计算进行说明。本可选方案中，获取每一层的权重值，根据损失函数和每一层的权重值对所有差值进行计算，得到总体损失值。

由于，分类模型中各层的深度不同，不同层所提取的信息不同，提取信息能力也不同。因此，可以对每层得到的差值设置一定的权重值，甚至有的层的权重值可以设置为0，以便实现上色效果可控，提高对图像进行上色的效果。

S103，通过反向传播算法根据总体损失值对原始图像进行反向求导，得到导数；

在S104的基础上，本步骤旨在通过反向传播算法将总体损失值对原始图像进行反向求导，得到导数。

其中，反向传播算法由信号的正向传播和误差的反向传播两个过程组成。正向传播时，输入样本从输入层进入网络，经隐层逐层传递至输出层，如果输出层的实际输出与期望输出不同，则转至误差反向传播；如果输出层的实际输出与期望输出相同，结束学习算法。反向传播时，将输出误差按原通路反传计算，通过隐层反向，直至输入层，在反传过程中将误差分摊给各层的各个单元，获得各层各单元的误差信号，并将其作为修正各单元权值的根据。这一计算过程使用梯度下降法完成，在不停地调整各层神经元的权值和阈值后，使误差信号减小到最低限度。

S104，采用优化算法根据导数对原始图像进行更新，得到上色图像。

在S103的基础上，本步骤旨在采用优化算法根据导数对原始图像进行更新，得到上色图像。

其中，优化算法可以采用现有技术提供的任意一种优化算法，在此不做具体限定。

本实施例中，基于导数对原始图像进行更新，可以实现对输入素描图进行一次上色，单次的上色会是一些细节方面的上色。因此，可以进行不断地循环迭代更新输入上色后的原始图像，也就是不断输入上色图像，得到新的上色图像，会使上色从点到面，而且整个循环迭代过程，可以观察，可以进行控制各层权值、控制总的循环次数，实现上色步骤可控，上色可解释。

进一步的，本步骤可以包括：

采用optimize优化算法根据导数对原始图像进行更新，得到上色图像。

进一步的，本实施例还可以包括：

步骤1，判断上色图像是否符合上色标准；

步骤2，若否，则将上色图像作为原始数据，并执行将原始图像输入分类模型进行处理以及后续的步骤，得到新的上色图像。

可见，本可选方案主要是说明本实施例可以循环执行，直至上色图像符合上色标准。

综上，本实施例通过将原始图像输入到分类模型，并获取处理的过程中每一层与BN层间的差值，根据损失函数对所有差值进行计算，得到总体损失值，也就是确定原始图像与标准图像之间的差距，最后通过该差距对原始图像进行更新，实现对原始图像进行上色，也就是采用分类模型对原始图像进行分类的过程确定原始图像中的色彩信息，而不是采用大量的训练数据训练上色模型，避免加入大量的人力成本，提高了上色处理过程的效率。

以下通过一个具体的实施例，对本申请提供的一种图像上色方法做进一步说明。

请参考图2，图2为本申请实施例所提供的一种图像上色方法的执行结构示意图。

本实施例中，首先获取到一个含有目标图像类别的分类模型，如想对一幅牛素描图上色，只需要获得一个分类模型，其中的类别含有牛即可，若无法直接找到该种模型，直接使用官方给定的ImageNet预训练模型，然后进行微调即可，此步骤很快，所需的计算量也很少。

也就是说，本实施例所需的分类模型的结构很简单，只要模型的类别中含有目标类别即可。可以从两个途径获取该分裂模型。一种可以找到预训练的模型，比如基于imagenet2012的预训练模型已包含了1000种类别，满足了大部分需求，直接使用即可。另一种无法找到预训练模型时，可以在网上找一些该类别的图像，然后在官方给定的预训练模型基础上进行训练，此过程所需要的计算量很少，最后得到满足需求的预训练DNN分类模型。

然后，将目标素描图输入到分类模型中，进行循环更新，首先进行正向推理，在该图经过模型每层时记录下与BN层间的差距，等传输到最后一层后即可得到所有的损失值，然后根据该损失值使用反向传播算法对目标素描图进行更新，接着再使用更新后的图像进行正向推理，进入下一个循环更新素描图。经过不断更新后目标素描图即可实现上色，可以根据此时的上色效果决定是否停止更新，或者循环到一定的步骤后即可停止更新。

具体的，首先将目标素描图输入到模型中，做为初始的输入图像input，然后模型进行前向计算，在前向计算中根据输入图像到达每层得到的均值、方差与BN层训练得到的均值和方差之间的差值根据一定的损失函数得到总体损失值。

其中，该损失函数可以是欧式距离或者是KL散度等，可充分描述两组数据间差值的函数即可。

同时，因为模型中各层的深度不同，不同层所提取的信息不同，提取信息能力也不同，所以可以对每层得到的损失值设置一定的权重，可以实现上色效果可控。

得到总损失值之后，就可以使用反向传播算法对总损失值进行反向求导，然后使用optimize优化算法，基于导数对输入图像input进行更新。实现对输入素描图进行一次上色，单次的上色会是一些细节方面的上色。可以进行不断地循环迭代更新输入素描图，使得上色从点到面，而且整个循环迭代过程可以观察到，可以进行控制各层权值、控制总的循环次数，实现上色步骤可控，上色可解释。

可见，本实施例通过将原始图像输入到分类模型，并获取处理的过程中每一层与BN层间的差值，根据损失函数对所有差值进行计算，得到总体损失值，也就是确定原始图像与标准图像之间的差距，最后通过该差距对原始图像进行更新，实现对原始图像进行上色，也就是采用分类模型对原始图像进行分类的过程确定原始图像中的色彩信息，而不是采用大量的训练数据训练上色模型，避免加入大量的人力成本，提高了上色处理过程的效率。

下面对本申请实施例提供的图像上色装置进行介绍，下文描述的图像上色装置与上文描述的图像上色方法可相互对应参照。

请参考图3，图3为本申请实施例所提供的一种图像上色装置的结构示意图。

本实施例中，该装置可以包括：

差值记录模块100，用于将原始图像输入分类模型进行处理，并获取处理的过程中每一层与BN层间的差值；

损失计算模块200，用于根据损失函数对所有差值进行计算，得到总体损失值；

反向求导模块300，用于通过反向传播算法根据总体损失值对原始图像进行反向求导，得到导数；

图像更新模块400，用于采用优化算法根据导数对原始图像进行更新，得到上色图像。

可选的，该图像更新模块400，具体用于采用optimize优化算法根据导数对原始图像进行更新，得到上色图像。

可选的，该损失计算模块200，具体用于根据欧式距离损失函数或KL散度损失函数对所有差值进行计算，得到总体损失值。

可选的，该损失计算模块200，具体用于获取每一层的权重值；根据损失函数和每一层的权重值对所有差值进行计算，得到总体损失值。

可选的，该差值记录模块100，具体用于将原始图像输入DNN分类模型进行处理，并获取处理的过程中每一层与BN层间的差值。

可选的，该装置还可以包括：

循环执行模块，用于判断上色图像是否符合上色标准；若否，则将上色图像作为原始数据，并执行将原始图像输入分类模型进行处理以及后续的步骤，得到新的上色图像。

本申请实施例还提供一种服务器，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如以上实施例所述的图像上色方法的步骤。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如以上实施例所述的图像上色方法的步骤。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的一种图像上色方法、图像上色装置、服务器以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

Claims

1.一种图像上色方法，其特征在于，包括：

根据损失函数对所有所述差值进行计算，得到总体损失值；

2.根据权利要求1所述的图像上色方法，其特征在于，采用优化算法根据所述导数对原始图像进行更新，得到上色图像，包括：

3.根据权利要求1所述的图像上色方法，其特征在于，根据损失函数对所有所述差值进行计算，得到总体损失值，包括：

4.根据权利要求1所述的图像上色方法，其特征在于，根据损失函数对所有所述差值进行计算，得到总体损失值，包括：

获取每一层的权重值；

5.根据权利要求1所述的图像上色方法，其特征在于，将原始图像输入分类模型进行处理，并获取所述处理的过程中每一层与BN层间的差值，包括：

6.根据权利要求1所述的图像上色方法，其特征在于，还包括：

判断所述上色图像是否符合上色标准；

7.一种图像上色装置，其特征在于，包括：

8.根据权利要求7所述的图像上色装置，其特征在于，所述图像更新模块，具体用于采用optimize优化算法根据所述导数对原始图像进行更新，得到所述上色图像。

9.一种服务器，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至6任一项所述的图像上色方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的图像上色方法的步骤。