CN115564646A

CN115564646A - 一种图像缩放方法、装置以及介质

Info

Publication number: CN115564646A
Application number: CN202211156907.8A
Authority: CN
Inventors: 欧阳志锐
Original assignee: Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Current assignee: Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Priority date: 2022-09-22
Filing date: 2022-09-22
Publication date: 2023-01-03

Abstract

本申请涉及图像处理技术领域，公开了一种图像缩放方法、装置以及介质，通过先获取原图像的数据集，对数据集中的原图像进行双线性插值得到第一目标图像集；将第一目标图像集放入神经网络以得到第二目标图像集；其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。采用本技术方案，图像经过双线性插值运算后，再放入神经网络再次进行运算。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络，使后续图像在通过双线性插值进行缩放时，经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果，并且相较于直接进行双立方插值运算，避免了复杂的插值运算。

Description

一种图像缩放方法、装置以及介质

技术领域

本申请涉及图像处理技术领域，特别是涉及一种图像缩放方法、装置以及介质。

背景技术

双线性插值，又称为双线性内插。在数学上，双线性插值是有两个变量的插值函数的线性插值扩展，其核心思想是在两个方向分别进行一次线性插值。双线性插值作为数值分析中的一种插值算法，在图像处理方面被广泛使用。

但是，虽然双线性插值算法克服了最近邻插值算法的灰度不连续性，但它未考虑各邻点的灰度值的相互影响，故具有低通滤波的性质，从而导致缩放后的图像的高频分量受到损失，图像边缘在一定程度上变得较为模糊。

因此，如何解决双线性插值未考虑各邻点的灰度值的相互影响这一缺点，提高双线性插值在图像处理中的效果是本领域技术人员亟待解决的问题。

发明内容

本申请的目的是提供一种图像缩放方法、装置以及介质，用于解决双线性插值未考虑各邻点的灰度值的相互影响这一缺点，提高双线性插值在图像处理中的效果。

为解决上述技术问题，本申请提供一种图像缩放方法，包括：

获取原图像的数据集；

对所述数据集中的原图像进行双线性插值得到第一目标图像集；

将所述第一目标图像集放入神经网络以得到第二目标图像集；所述神经网络为根据所述原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。

优选的，所述神经网络的训练方法为：

确认训练图像数据集；

对所述训练图像数据集中的图像进行双线性插值得到第一训练图像集；

对所述训练图像数据集中的图像进行双立方插值得到第三训练图像集；

计算所述第三训练图像集与所述第一训练图像集的差值以得到损失函数；

根据所述损失函数确认所述神经网络。

优选的，还包括：

利用梯度下降法以得到收敛状态下的所述损失函数；

进一步的，所述根据所述损失函数确认所述神经网络为：根据收敛状态下的所述损失函数确认所述神经网络。

优选的，在得到所述神经网络的情况下，还包括：

利用所述训练图像数据集中的图像对所述神经网络进行测试；

若测试得到的损失函数与训练时得到的损失函数的差值超出阈值，则确认神经网络训练失败；若未超出阈值，则确认神经网络训练完成。

优选的，在确认神经网络训练失败的情况下，还包括：

增大所述训练图像数据集中图像的数量，再次进行所述神经网络的训练，直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。

优选的，在确认训练失败的情况下，还包括：通过正则化处理所述损失函数，直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。

优选的，所述损失函数为：

其中，L为损失函数，θ₁为常数，N为数据集中图像的个数，x为经过双线性插值运算后的图像的像素点值，x′为经过双立方插值运算后的图像的像素点值，Net为神经网络。

为解决上述技术问题，本申请还提供一种图像缩放装置，包括：

获取模块，用于获取原图像的数据集；

第一运算模块，用于对所述数据集中的原图像进行双线性插值得到第一目标图像集；

第二运算模块，用于将所述第一目标图像集放入神经网络以得到第二目标图像集；所述神经网络为根据所述原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。

为解决上述技术问题，本申请还提供另一种图像缩放装置，包括存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上述的图像缩放方法的步骤。

为解决上述技术问题，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述的图像缩放方法的步骤。

本申请所提供的图像缩放方法，先获取原图像的数据集；对数据集中的原图像进行双线性插值得到第一目标图像集；将第一目标图像集放入神经网络以得到第二目标图像集；神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中，图像经过双线性插值运算后由于各邻点的灰度值的相互影响，导致缩放后的图像边缘模糊，采用本技术方案，在图像经过双线性插值运算后，再放入神经网络再次进行运算，该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是，双立方插值运算是对双线性插值的改进，是一种比较复杂的插值方式，它不仅考虑到周围4个像素点灰度值的影像，还考虑到它们灰度值变化率的影响，较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络，使后续图像在通过双线性插值进行缩放时，经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果，并且相较于直接进行双立方插值运算，避免了复杂的插值运算，提高了双线性插值的效果。

此外，本申请所提供的图像缩放装置以及介质，与上述的图像缩放方法相对应，效果同上。

附图说明

为了更清楚地说明本申请实施例，下面将对实施例中所需要使用的附图做简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种图像缩放方法的流程图；

图2为本申请实施例提供的一种图像缩放装置的结构图；

图3为本申请实施例提供的另一种图像缩放装置的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下，所获得的所有其他实施例，都属于本申请保护范围。

假设源图像大小为m*n，目标图像为a*b。那么两幅图像的边长比分别为：m/a和n/b。注意，通常这个比例不是整数，编程存储的时候要用浮点型。目标图像的第(i，j)个像素点(i行j列)可以通过边长比对应回源图像。其对应坐标为(i*m/a，j*n/b)。显然，这个对应坐标一般来说不是整数，而非整数的坐标是无法在图像这种离散数据上使用的。双线性插值通过寻找距离这个对应坐标最近的四个像素点，来计算该点的值(灰度值或者RGB值)。例如你的对应坐标是(2.5，4.5)，那么最近的四个像素是(2，4)、(2，5)、(3，4)，(3，5)；

已知Q₁₁(x₁，y₁)，Q₁₂(x₁，y₂)，Q₂₁(x₂，y₁)，Q₂₂(x₂，y₂)，未知点P(x，y)，函数f为点的像素值。

双线性插值的算法为：

第一步：利用单线性插值在x方向求f(R₁)：

第二步：利用单线性插值在x方向求f(R₂)：

第三步：利用单线性插值在y方向求f(P)；

结合上列三式可求得：

f(P)＝(x₂-x)(y₂-y)f(Q₁₁)+(x₂-x)(y-y₁)f(Q₁₂)+(x-x₁)(y₂-y))f(Q₂₁)+(x-x₁)(y-y₁)f(Q₂₂)

本申请的核心是提供一种图像缩放方法、装置以及介质，用于解决双线性插值未考虑各邻点的灰度值的相互影响这一缺点，提高双线性插值在图像处理中的效果。

为了使本技术领域的人员更好地理解本申请方案，下面结合附图和具体实施方式对本申请作进一步的详细说明。

图1为本申请实施例提供的一种图像缩放方法的流程图，如图1所示，该方法包括：

S10：获取原图像的数据集；

S11：对数据集中的原图像进行双线性插值得到第一目标图像集；

S12：将第一目标图像集放入神经网络以得到第二目标图像集；神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。

双三次插值又叫双立方插值，用于在图像中“插值”或增加“像素”数量/密度的一种方法。通常利用插值技术增加图形数据，以便在它打印或其他形式输出的时候，能够增大打印面积以及(或者)分辨率。双三次插值是一种更加复杂的插值方式，它能创造出比双线性插值更平滑的图像边缘。在数值分析这个数学分支中，双三次插值是二维空间中最常用的插值方法。在这种方法中，函数f在点(x，y)的值可以通过矩形网格中最近的十六个采样点的加权平均得到，在这里需要使用两个多项式插值三次函数，每个方向使用一个。

在本实施例中，在进行图像缩放时，先获取原图像的数据集，对该数据集中的图像进行双线性插值得到第一目标图像集，该第一目标图像集未考虑各邻点的灰度值的相互影响这一缺点，使得图像边缘模糊。因此本实施例通过将第一目标图像集放入神经网络，经过卷积运算后得到第二目标图像集，由于该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到，所以经过神经网络的运算后，使得第二目标图像集中的图像效果靠近原图像经过双立方插值后的图像效果，从而提高双线性插值在图像处理中的效果，并且相较于双立方插值，减少了运算量。

本申请实施例提供的图像缩放方法，先获取原图像的数据集，对数据集中的原图像进行双线性插值得到第一目标图像集；将第一目标图像集放入神经网络以得到第二目标图像集；其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中，图像经过双线性插值运算后由于各邻点的灰度值的相互影响，导致缩放后的图像边缘模糊，采用本技术方案，在图像经过双线性插值运算后，再放入神经网络再次进行运算，该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是，双立方插值运算是对双线性插值的改进，是一种比较复杂的插值方式，它不仅考虑到周围4个像素点灰度值的影像，还考虑到它们灰度值变化率的影响，较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络，使后续图像在通过双线性插值进行缩放时，经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果，并且相较于直接进行双立方插值运算，避免了复杂的插值运算，提高了双线性插值的图像处理效果。

可以理解的是，本实施例中提高图像缩放效果的关键在于图像经过双线性插值运算后，再经过神经网络的处理，通过神经网络使双线性插值后的图像效果靠近双立方插值后的图像效果。本实施例提供一种神经网络的训练方法，具体为：

确认训练图像数据集；

对训练图像数据集中的图像进行双线性插值得到第一训练图像集；

对训练图像数据集中的图像进行双立方插值得到第三训练图像集；

计算第三训练图像集与第一训练图像集的差值以得到损失函数；

根据损失函数确认神经网络。

在具体实施中，先通过大量的训练图像进行神经网络的训练，通过对训练图像数据集中的图像进行双线性插值得到第一训练图像集，再进行双立方插值得到第三训练图像集，通过第三训练图像集与第一训练图像集的差值的对应关系，即可得到一个损失函数，从而根据该损失函数可以确认出神经网络，使得图像进行双线性插值后，经过神经网络的处理后达到图像进行双立方插值后的图像处理效果。

具体的，损失函数为：

表1为神经网络的结构图，在神经网络中，图像经过双线性插值后的数据，经过三次的卷积运算即可得到靠近图像经过双立方插值后的效果。

表1

在具体实施中，为了得到更好的图像缩放效果，需要对神经网络进行优化，具体的，还包括：

利用梯度下降法以得到收敛状态下的损失函数；

进一步的，根据损失函数确认神经网络为：根据收敛状态下的损失函数确认神经网络。

梯度下降法是一阶最优化算法。要使用梯度下降法找到一个函数的局部极小值，必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。梯度下降法是迭代法的一种，可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降法和最小二乘法是最常采用的方法。在求解损失函数的最小值时，可以通过梯度下降法来迭代求解，得到最小化的损失函数和模型参数值。

本实施例利用梯度下降法得到收敛状态下的损失函数，以优化神经网络模型。

当神经网络训练完成后，为了更好的投入使用，还需要先对神经网络进行测试，验证图像缩放的效果。在本实施例中，在得到神经网络的情况下，还包括：

利用训练图像数据集中的图像对神经网络进行测试；

本实施例中对于神经网络的测试是利用训练时所用的图像进行测试，具体的，如果该图像在测试时的损失函数与训练时的损失函数的差值超出阈值，说明神经网络模型出现了过拟合现象，该神经网络不能够投入使用，而如果没有超出阈值则可以继续使用。

在具体实施中，在确认神经网络训练失败的情况下，还包括：

增大训练图像数据集中图像的数量，再次进行神经网络的训练，直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。

或者，还可以通过正则化处理损失函数，直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。

在上述实施例中，对于图像缩放方法进行了详细描述，本申请还提供图像缩放装置对应的实施例。需要说明的是，本申请从两个角度对装置部分的实施例进行描述，一种是基于功能模块的角度，另一种是基于硬件的角度。

图2为本申请实施例提供的一种图像缩放装置的结构图，如图2所示，该装置包括：

获取模块10，用于获取原图像的数据集；

第一运算模块11，用于对所述数据集中的原图像进行双线性插值得到第一目标图像集；

第二运算模块12，用于将所述第一目标图像集放入神经网络以得到第二目标图像集；所述神经网络为根据所述原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。

由于装置部分的实施例与方法部分的实施例相互对应，因此装置部分的实施例请参见方法部分的实施例的描述，这里暂不赘述。

本申请实施例提供的图像缩放装置，先获取原图像的数据集，对数据集中的原图像进行双线性插值得到第一目标图像集；将第一目标图像集放入神经网络以得到第二目标图像集；其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中，图像经过双线性插值运算后由于各邻点的灰度值的相互影响，导致缩放后的图像边缘模糊，采用本技术方案，在图像经过双线性插值运算后，再放入神经网络再次进行运算，该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是，双立方插值运算是对双线性插值的改进，是一种比较复杂的插值方式，它不仅考虑到周围4个像素点灰度值的影像，还考虑到它们灰度值变化率的影响，较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络，使后续图像在通过双线性插值进行缩放时，经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果，并且相较于直接进行双立方插值运算，避免了复杂的插值运算，提高了双线性插值的图像处理效果。

图3为本申请实施例提供的另一种图像缩放装置的结构图，如图3所示，该装置包括：存储器20，用于存储计算机程序；

处理器21，用于执行计算机程序时实现如上述实施例图像缩放方法的步骤。

本实施例提供的图像缩放装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。

其中，处理器21可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理器(Digital Signal Processor，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable LogicArray，PLA)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称中央处理器(CentralProcessing Unit，CPU)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器21可以集成有图像处理器(Graphics Processing Unit，GPU)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器21还可以包括人工智能(Artificial Intelligence，AI)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器20可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器20还可以包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。本实施例中，存储器20至少用于存储以下计算机程序201，其中，该计算机程序被处理器21加载并执行之后，能够实现前述任一实施例公开的图像缩放方法的相关步骤。另外，存储器20所存储的资源还可以包括操作系统202和数据203等，存储方式可以是短暂存储或者永久存储。其中，操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于阈值、第一目标图像集等。

在一些实施例中，图像缩放装置还可以包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。

本领域技术人员可以理解，图3中示出的结构并不构成对图像缩放装置的限定，可以包括比图示更多或更少的组件。

本申请实施例提供的图像缩放装置，包括存储器和处理器，处理器在执行存储器存储的程序时，能够实现如下方法：获取原图像的数据集；对数据集中的原图像进行双线性插值得到第一目标图像集；将第一目标图像集放入神经网络以得到第二目标图像集；神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。

最后，本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。

可以理解的是，如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请实施例提供的计算机可读存储介质，先获取原图像的数据集，对数据集中的原图像进行双线性插值得到第一目标图像集；将第一目标图像集放入神经网络以得到第二目标图像集；其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中，图像经过双线性插值运算后由于各邻点的灰度值的相互影响，导致缩放后的图像边缘模糊，采用本技术方案，在图像经过双线性插值运算后，再放入神经网络再次进行运算，该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是，双立方插值运算是对双线性插值的改进，是一种比较复杂的插值方式，它不仅考虑到周围4个像素点灰度值的影像，还考虑到它们灰度值变化率的影响，较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络，使后续图像在通过双线性插值进行缩放时，经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果，并且相较于直接进行双立方插值运算，避免了复杂的插值运算，提高了双线性插值的图像处理效果。

以上对本申请所提供的图像缩放方法、装置以及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种图像缩放方法，其特征在于，包括：

获取原图像的数据集；

2.根据权利要求1所述的图像缩放方法，其特征在于，所述神经网络的训练方法为：

确认训练图像数据集；

根据所述损失函数确认所述神经网络。

3.根据权利要求2所述的图像缩放方法，其特征在于，还包括：

利用梯度下降法以得到收敛状态下的所述损失函数；

4.根据权利要求3所述的图像缩放方法，其特征在于，在得到所述神经网络的情况下，还包括：

5.根据权利要求4所述的图像缩放方法，其特征在于，在确认神经网络训练失败的情况下，还包括：

6.根据权利要求4所述的图像缩放方法，其特征在于，在确认训练失败的情况下，还包括：通过正则化处理所述损失函数，直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。

7.根据权利要求2所述的图像缩放方法，其特征在于，所述损失函数为：

8.一种图像缩放装置，其特征在于，包括：

获取模块，用于获取原图像的数据集；

9.一种图像缩放装置，其特征在于，包括存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任意一项所述的图像缩放方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的图像缩放方法的步骤。