CN115564646A - 一种图像缩放方法、装置以及介质 - Google Patents

一种图像缩放方法、装置以及介质 Download PDF

Info

Publication number
CN115564646A
CN115564646A CN202211156907.8A CN202211156907A CN115564646A CN 115564646 A CN115564646 A CN 115564646A CN 202211156907 A CN202211156907 A CN 202211156907A CN 115564646 A CN115564646 A CN 115564646A
Authority
CN
China
Prior art keywords
image
neural network
training
loss function
bilinear interpolation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211156907.8A
Other languages
English (en)
Inventor
欧阳志锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Original Assignee
Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd filed Critical Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Priority to CN202211156907.8A priority Critical patent/CN115564646A/zh
Publication of CN115564646A publication Critical patent/CN115564646A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4007Interpolation-based scaling, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4046Scaling the whole image or part thereof using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本申请涉及图像处理技术领域,公开了一种图像缩放方法、装置以及介质,通过先获取原图像的数据集,对数据集中的原图像进行双线性插值得到第一目标图像集;将第一目标图像集放入神经网络以得到第二目标图像集;其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。采用本技术方案,图像经过双线性插值运算后,再放入神经网络再次进行运算。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络,使后续图像在通过双线性插值进行缩放时,经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果,并且相较于直接进行双立方插值运算,避免了复杂的插值运算。

Description

一种图像缩放方法、装置以及介质
技术领域
本申请涉及图像处理技术领域,特别是涉及一种图像缩放方法、装置以及介质。
背景技术
双线性插值,又称为双线性内插。在数学上,双线性插值是有两个变量的插值函数的线性插值扩展,其核心思想是在两个方向分别进行一次线性插值。双线性插值作为数值分析中的一种插值算法,在图像处理方面被广泛使用。
但是,虽然双线性插值算法克服了最近邻插值算法的灰度不连续性,但它未考虑各邻点的灰度值的相互影响,故具有低通滤波的性质,从而导致缩放后的图像的高频分量受到损失,图像边缘在一定程度上变得较为模糊。
因此,如何解决双线性插值未考虑各邻点的灰度值的相互影响这一缺点,提高双线性插值在图像处理中的效果是本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种图像缩放方法、装置以及介质,用于解决双线性插值未考虑各邻点的灰度值的相互影响这一缺点,提高双线性插值在图像处理中的效果。
为解决上述技术问题,本申请提供一种图像缩放方法,包括:
获取原图像的数据集;
对所述数据集中的原图像进行双线性插值得到第一目标图像集;
将所述第一目标图像集放入神经网络以得到第二目标图像集;所述神经网络为根据所述原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。
优选的,所述神经网络的训练方法为:
确认训练图像数据集;
对所述训练图像数据集中的图像进行双线性插值得到第一训练图像集;
对所述训练图像数据集中的图像进行双立方插值得到第三训练图像集;
计算所述第三训练图像集与所述第一训练图像集的差值以得到损失函数;
根据所述损失函数确认所述神经网络。
优选的,还包括:
利用梯度下降法以得到收敛状态下的所述损失函数;
进一步的,所述根据所述损失函数确认所述神经网络为:根据收敛状态下的所述损失函数确认所述神经网络。
优选的,在得到所述神经网络的情况下,还包括:
利用所述训练图像数据集中的图像对所述神经网络进行测试;
若测试得到的损失函数与训练时得到的损失函数的差值超出阈值,则确认神经网络训练失败;若未超出阈值,则确认神经网络训练完成。
优选的,在确认神经网络训练失败的情况下,还包括:
增大所述训练图像数据集中图像的数量,再次进行所述神经网络的训练,直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。
优选的,在确认训练失败的情况下,还包括:通过正则化处理所述损失函数,直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。
优选的,所述损失函数为:
Figure BDA0003859161800000021
其中,L为损失函数,θ1为常数,N为数据集中图像的个数,x为经过双线性插值运算后的图像的像素点值,x′为经过双立方插值运算后的图像的像素点值,Net为神经网络。
为解决上述技术问题,本申请还提供一种图像缩放装置,包括:
获取模块,用于获取原图像的数据集;
第一运算模块,用于对所述数据集中的原图像进行双线性插值得到第一目标图像集;
第二运算模块,用于将所述第一目标图像集放入神经网络以得到第二目标图像集;所述神经网络为根据所述原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。
为解决上述技术问题,本申请还提供另一种图像缩放装置,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述的图像缩放方法的步骤。
为解决上述技术问题,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的图像缩放方法的步骤。
本申请所提供的图像缩放方法,先获取原图像的数据集;对数据集中的原图像进行双线性插值得到第一目标图像集;将第一目标图像集放入神经网络以得到第二目标图像集;神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中,图像经过双线性插值运算后由于各邻点的灰度值的相互影响,导致缩放后的图像边缘模糊,采用本技术方案,在图像经过双线性插值运算后,再放入神经网络再次进行运算,该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是,双立方插值运算是对双线性插值的改进,是一种比较复杂的插值方式,它不仅考虑到周围4个像素点灰度值的影像,还考虑到它们灰度值变化率的影响,较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络,使后续图像在通过双线性插值进行缩放时,经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果,并且相较于直接进行双立方插值运算,避免了复杂的插值运算,提高了双线性插值的效果。
此外,本申请所提供的图像缩放装置以及介质,与上述的图像缩放方法相对应,效果同上。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种图像缩放方法的流程图;
图2为本申请实施例提供的一种图像缩放装置的结构图;
图3为本申请实施例提供的另一种图像缩放装置的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
双线性插值,又称为双线性内插。在数学上,双线性插值是有两个变量的插值函数的线性插值扩展,其核心思想是在两个方向分别进行一次线性插值。双线性插值作为数值分析中的一种插值算法,在图像处理方面被广泛使用。
假设源图像大小为m*n,目标图像为a*b。那么两幅图像的边长比分别为:m/a和n/b。注意,通常这个比例不是整数,编程存储的时候要用浮点型。目标图像的第(i,j)个像素点(i行j列)可以通过边长比对应回源图像。其对应坐标为(i*m/a,j*n/b)。显然,这个对应坐标一般来说不是整数,而非整数的坐标是无法在图像这种离散数据上使用的。双线性插值通过寻找距离这个对应坐标最近的四个像素点,来计算该点的值(灰度值或者RGB值)。例如你的对应坐标是(2.5,4.5),那么最近的四个像素是(2,4)、(2,5)、(3,4),(3,5);
已知Q11(x1,y1),Q12(x1,y2),Q21(x2,y1),Q22(x2,y2),未知点P(x,y),函数f为点的像素值。
双线性插值的算法为:
第一步:利用单线性插值在x方向求f(R1):
Figure BDA0003859161800000041
第二步:利用单线性插值在x方向求f(R2):
Figure BDA0003859161800000042
第三步:利用单线性插值在y方向求f(P);
Figure BDA0003859161800000043
结合上列三式可求得:
f(P)=(x2-x)(y2-y)f(Q11)+(x2-x)(y-y1)f(Q12)+(x-x1)(y2-y))f(Q21)+(x-x1)(y-y1)f(Q22)
但是,虽然双线性插值算法克服了最近邻插值算法的灰度不连续性,但它未考虑各邻点的灰度值的相互影响,故具有低通滤波的性质,从而导致缩放后的图像的高频分量受到损失,图像边缘在一定程度上变得较为模糊。
因此,如何解决双线性插值未考虑各邻点的灰度值的相互影响这一缺点,提高双线性插值在图像处理中的效果是本领域技术人员亟待解决的问题。
本申请的核心是提供一种图像缩放方法、装置以及介质,用于解决双线性插值未考虑各邻点的灰度值的相互影响这一缺点,提高双线性插值在图像处理中的效果。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
图1为本申请实施例提供的一种图像缩放方法的流程图,如图1所示,该方法包括:
S10:获取原图像的数据集;
S11:对数据集中的原图像进行双线性插值得到第一目标图像集;
S12:将第一目标图像集放入神经网络以得到第二目标图像集;神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。
双三次插值又叫双立方插值,用于在图像中“插值”或增加“像素”数量/密度的一种方法。通常利用插值技术增加图形数据,以便在它打印或其他形式输出的时候,能够增大打印面积以及(或者)分辨率。双三次插值是一种更加复杂的插值方式,它能创造出比双线性插值更平滑的图像边缘。在数值分析这个数学分支中,双三次插值是二维空间中最常用的插值方法。在这种方法中,函数f在点(x,y)的值可以通过矩形网格中最近的十六个采样点的加权平均得到,在这里需要使用两个多项式插值三次函数,每个方向使用一个。
在本实施例中,在进行图像缩放时,先获取原图像的数据集,对该数据集中的图像进行双线性插值得到第一目标图像集,该第一目标图像集未考虑各邻点的灰度值的相互影响这一缺点,使得图像边缘模糊。因此本实施例通过将第一目标图像集放入神经网络,经过卷积运算后得到第二目标图像集,由于该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到,所以经过神经网络的运算后,使得第二目标图像集中的图像效果靠近原图像经过双立方插值后的图像效果,从而提高双线性插值在图像处理中的效果,并且相较于双立方插值,减少了运算量。
本申请实施例提供的图像缩放方法,先获取原图像的数据集,对数据集中的原图像进行双线性插值得到第一目标图像集;将第一目标图像集放入神经网络以得到第二目标图像集;其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中,图像经过双线性插值运算后由于各邻点的灰度值的相互影响,导致缩放后的图像边缘模糊,采用本技术方案,在图像经过双线性插值运算后,再放入神经网络再次进行运算,该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是,双立方插值运算是对双线性插值的改进,是一种比较复杂的插值方式,它不仅考虑到周围4个像素点灰度值的影像,还考虑到它们灰度值变化率的影响,较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络,使后续图像在通过双线性插值进行缩放时,经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果,并且相较于直接进行双立方插值运算,避免了复杂的插值运算,提高了双线性插值的图像处理效果。
可以理解的是,本实施例中提高图像缩放效果的关键在于图像经过双线性插值运算后,再经过神经网络的处理,通过神经网络使双线性插值后的图像效果靠近双立方插值后的图像效果。本实施例提供一种神经网络的训练方法,具体为:
确认训练图像数据集;
对训练图像数据集中的图像进行双线性插值得到第一训练图像集;
对训练图像数据集中的图像进行双立方插值得到第三训练图像集;
计算第三训练图像集与第一训练图像集的差值以得到损失函数;
根据损失函数确认神经网络。
在具体实施中,先通过大量的训练图像进行神经网络的训练,通过对训练图像数据集中的图像进行双线性插值得到第一训练图像集,再进行双立方插值得到第三训练图像集,通过第三训练图像集与第一训练图像集的差值的对应关系,即可得到一个损失函数,从而根据该损失函数可以确认出神经网络,使得图像进行双线性插值后,经过神经网络的处理后达到图像进行双立方插值后的图像处理效果。
具体的,损失函数为:
Figure BDA0003859161800000071
其中,L为损失函数,θ1为常数,N为数据集中图像的个数,x为经过双线性插值运算后的图像的像素点值,x′为经过双立方插值运算后的图像的像素点值,Net为神经网络。
表1为神经网络的结构图,在神经网络中,图像经过双线性插值后的数据,经过三次的卷积运算即可得到靠近图像经过双立方插值后的效果。
Figure BDA0003859161800000072
表1
在具体实施中,为了得到更好的图像缩放效果,需要对神经网络进行优化,具体的,还包括:
利用梯度下降法以得到收敛状态下的损失函数;
进一步的,根据损失函数确认神经网络为:根据收敛状态下的损失函数确认神经网络。
梯度下降法是一阶最优化算法。要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。梯度下降法是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降法和最小二乘法是最常采用的方法。在求解损失函数的最小值时,可以通过梯度下降法来迭代求解,得到最小化的损失函数和模型参数值。
本实施例利用梯度下降法得到收敛状态下的损失函数,以优化神经网络模型。
当神经网络训练完成后,为了更好的投入使用,还需要先对神经网络进行测试,验证图像缩放的效果。在本实施例中,在得到神经网络的情况下,还包括:
利用训练图像数据集中的图像对神经网络进行测试;
若测试得到的损失函数与训练时得到的损失函数的差值超出阈值,则确认神经网络训练失败;若未超出阈值,则确认神经网络训练完成。
本实施例中对于神经网络的测试是利用训练时所用的图像进行测试,具体的,如果该图像在测试时的损失函数与训练时的损失函数的差值超出阈值,说明神经网络模型出现了过拟合现象,该神经网络不能够投入使用,而如果没有超出阈值则可以继续使用。
在具体实施中,在确认神经网络训练失败的情况下,还包括:
增大训练图像数据集中图像的数量,再次进行神经网络的训练,直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。
或者,还可以通过正则化处理损失函数,直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。
在上述实施例中,对于图像缩放方法进行了详细描述,本申请还提供图像缩放装置对应的实施例。需要说明的是,本申请从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。
图2为本申请实施例提供的一种图像缩放装置的结构图,如图2所示,该装置包括:
获取模块10,用于获取原图像的数据集;
第一运算模块11,用于对所述数据集中的原图像进行双线性插值得到第一目标图像集;
第二运算模块12,用于将所述第一目标图像集放入神经网络以得到第二目标图像集;所述神经网络为根据所述原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请实施例提供的图像缩放装置,先获取原图像的数据集,对数据集中的原图像进行双线性插值得到第一目标图像集;将第一目标图像集放入神经网络以得到第二目标图像集;其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中,图像经过双线性插值运算后由于各邻点的灰度值的相互影响,导致缩放后的图像边缘模糊,采用本技术方案,在图像经过双线性插值运算后,再放入神经网络再次进行运算,该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是,双立方插值运算是对双线性插值的改进,是一种比较复杂的插值方式,它不仅考虑到周围4个像素点灰度值的影像,还考虑到它们灰度值变化率的影响,较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络,使后续图像在通过双线性插值进行缩放时,经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果,并且相较于直接进行双立方插值运算,避免了复杂的插值运算,提高了双线性插值的图像处理效果。
图3为本申请实施例提供的另一种图像缩放装置的结构图,如图3所示,该装置包括:存储器20,用于存储计算机程序;
处理器21,用于执行计算机程序时实现如上述实施例图像缩放方法的步骤。
本实施例提供的图像缩放装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可以包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的图像缩放方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于阈值、第一目标图像集等。
在一些实施例中,图像缩放装置还可以包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。
本领域技术人员可以理解,图3中示出的结构并不构成对图像缩放装置的限定,可以包括比图示更多或更少的组件。
本申请实施例提供的图像缩放装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:获取原图像的数据集;对数据集中的原图像进行双线性插值得到第一目标图像集;将第一目标图像集放入神经网络以得到第二目标图像集;神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。
本申请实施例提供的图像缩放装置,先获取原图像的数据集,对数据集中的原图像进行双线性插值得到第一目标图像集;将第一目标图像集放入神经网络以得到第二目标图像集;其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中,图像经过双线性插值运算后由于各邻点的灰度值的相互影响,导致缩放后的图像边缘模糊,采用本技术方案,在图像经过双线性插值运算后,再放入神经网络再次进行运算,该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是,双立方插值运算是对双线性插值的改进,是一种比较复杂的插值方式,它不仅考虑到周围4个像素点灰度值的影像,还考虑到它们灰度值变化率的影响,较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络,使后续图像在通过双线性插值进行缩放时,经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果,并且相较于直接进行双立方插值运算,避免了复杂的插值运算,提高了双线性插值的图像处理效果。
最后,本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的计算机可读存储介质,先获取原图像的数据集,对数据集中的原图像进行双线性插值得到第一目标图像集;将第一目标图像集放入神经网络以得到第二目标图像集;其中神经网络为根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。相对于当前技术中,图像经过双线性插值运算后由于各邻点的灰度值的相互影响,导致缩放后的图像边缘模糊,采用本技术方案,在图像经过双线性插值运算后,再放入神经网络再次进行运算,该神经网络是根据原图像在经过双线性插值与双立方插值运算后的对应关系训练得到的。可以理解的是,双立方插值运算是对双线性插值的改进,是一种比较复杂的插值方式,它不仅考虑到周围4个像素点灰度值的影像,还考虑到它们灰度值变化率的影响,较双线性插值有更好的图像缩放效果。本申请通过图像在经过双线性插值与双立方插值运算后的对应关系训练出神经网络,使后续图像在通过双线性插值进行缩放时,经过神经网络处理后的图像缩放效果接近原图像经过双立方插值运算后的缩放效果,并且相较于直接进行双立方插值运算,避免了复杂的插值运算,提高了双线性插值的图像处理效果。
以上对本申请所提供的图像缩放方法、装置以及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种图像缩放方法,其特征在于,包括:
获取原图像的数据集;
对所述数据集中的原图像进行双线性插值得到第一目标图像集;
将所述第一目标图像集放入神经网络以得到第二目标图像集;所述神经网络为根据所述原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。
2.根据权利要求1所述的图像缩放方法,其特征在于,所述神经网络的训练方法为:
确认训练图像数据集;
对所述训练图像数据集中的图像进行双线性插值得到第一训练图像集;
对所述训练图像数据集中的图像进行双立方插值得到第三训练图像集;
计算所述第三训练图像集与所述第一训练图像集的差值以得到损失函数;
根据所述损失函数确认所述神经网络。
3.根据权利要求2所述的图像缩放方法,其特征在于,还包括:
利用梯度下降法以得到收敛状态下的所述损失函数;
进一步的,所述根据所述损失函数确认所述神经网络为:根据收敛状态下的所述损失函数确认所述神经网络。
4.根据权利要求3所述的图像缩放方法,其特征在于,在得到所述神经网络的情况下,还包括:
利用所述训练图像数据集中的图像对所述神经网络进行测试;
若测试得到的损失函数与训练时得到的损失函数的差值超出阈值,则确认神经网络训练失败;若未超出阈值,则确认神经网络训练完成。
5.根据权利要求4所述的图像缩放方法,其特征在于,在确认神经网络训练失败的情况下,还包括:
增大所述训练图像数据集中图像的数量,再次进行所述神经网络的训练,直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。
6.根据权利要求4所述的图像缩放方法,其特征在于,在确认训练失败的情况下,还包括:通过正则化处理所述损失函数,直至测试得到的损失函数与训练时得到的损失函数的差值不超出阈值。
7.根据权利要求2所述的图像缩放方法,其特征在于,所述损失函数为:
Figure FDA0003859161790000021
其中,L为损失函数,θ1为常数,N为数据集中图像的个数,x为经过双线性插值运算后的图像的像素点值,x′为经过双立方插值运算后的图像的像素点值,Net为神经网络。
8.一种图像缩放装置,其特征在于,包括:
获取模块,用于获取原图像的数据集;
第一运算模块,用于对所述数据集中的原图像进行双线性插值得到第一目标图像集;
第二运算模块,用于将所述第一目标图像集放入神经网络以得到第二目标图像集;所述神经网络为根据所述原图像在经过双线性插值与双立方插值运算后的对应关系训练得到。
9.一种图像缩放装置,其特征在于,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任意一项所述的图像缩放方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的图像缩放方法的步骤。
CN202211156907.8A 2022-09-22 2022-09-22 一种图像缩放方法、装置以及介质 Pending CN115564646A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211156907.8A CN115564646A (zh) 2022-09-22 2022-09-22 一种图像缩放方法、装置以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211156907.8A CN115564646A (zh) 2022-09-22 2022-09-22 一种图像缩放方法、装置以及介质

Publications (1)

Publication Number Publication Date
CN115564646A true CN115564646A (zh) 2023-01-03

Family

ID=84741234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211156907.8A Pending CN115564646A (zh) 2022-09-22 2022-09-22 一种图像缩放方法、装置以及介质

Country Status (1)

Country Link
CN (1) CN115564646A (zh)

Similar Documents

Publication Publication Date Title
Yang et al. BM3D-Net: A convolutional neural network for transform-domain collaborative filtering
EP1347410B1 (en) Edge-based enlargement and interpolation of images
CN108765343A (zh) 图像处理的方法、装置、终端及计算机可读存储介质
CN110570440A (zh) 一种基于深度学习边缘检测的图像自动分割方法及装置
CN109785246B (zh) 一种非局部均值滤波的降噪方法、装置及设备
EP2038845A2 (en) Image processing system, image processing program, and image processing method
CN111539238B (zh) 二维码图像修复方法、装置、计算机设备和存储介质
Kawasaki et al. An image processing approach to feature-preserving B-spline surface fairing
Patel et al. Accelerated seam carving for image retargeting
CN105578070A (zh) 一种图像处理的方法及终端
CN111681165A (zh) 图像处理方法、装置、计算机设备和计算机可读存储介质
CN112967381A (zh) 三维重建方法、设备和介质
Kim et al. A study on the effect of Canny edge detection on downscaled images
CN111260564A (zh) 一种图像处理方法和装置及计算机存储介质
CN109712075B (zh) 一种数字图像数据原图识别方法及装置
Xiao et al. Detail enhancement of image super-resolution based on detail synthesis
CN113077477B (zh) 图像矢量化方法、装置及终端设备
CN113506305A (zh) 三维点云数据的图像增强方法、语义分割方法及装置
Çığla et al. An efficient recursive edge-aware filter
CN115564646A (zh) 一种图像缩放方法、装置以及介质
CN113971738A (zh) 图像检测方法、装置、电子设备及存储介质
Xu et al. Discarding jagged artefacts in image upscaling with total variation regularisation
Zhan The nonlocal-laplacian evolution for image interpolation
Wang et al. Analysis and improvement of image segmentation algorithm based on fuzzy edge compensation
CN111626935B (zh) 像素图缩放方法、游戏内容生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination