CN109978768B - 一种基于视觉显著性检测的图像非线性缩放方法 - Google Patents

一种基于视觉显著性检测的图像非线性缩放方法 Download PDF

Info

Publication number
CN109978768B
CN109978768B CN201910245860.4A CN201910245860A CN109978768B CN 109978768 B CN109978768 B CN 109978768B CN 201910245860 A CN201910245860 A CN 201910245860A CN 109978768 B CN109978768 B CN 109978768B
Authority
CN
China
Prior art keywords
image
cutting line
value
function
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910245860.4A
Other languages
English (en)
Other versions
CN109978768A (zh
Inventor
张佩迎
陈志�
岳文静
周传
陈璐
李争彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201910245860.4A priority Critical patent/CN109978768B/zh
Publication of CN109978768A publication Critical patent/CN109978768A/zh
Application granted granted Critical
Publication of CN109978768B publication Critical patent/CN109978768B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于视觉显著性检测的图像非线性缩放方法,该方法首先读入一张大小为n*m的图像,输入待缩放图像大小p*q;接着通过FCN全卷积神经网络生成显著图g(I),并计算出图像的能量函数e(I),得到总能量函数E(I);然后利用动态规划的方法计算出累计最小能量图,找出一条最佳裁剪线;最后从图像中不断删去得到的最佳裁剪线,直至图像大小与待缩放图像大小相等,得到缩放完成的新图像。本发明可以有效地保持图像重要内容,具有良好的缩放效果。

Description

一种基于视觉显著性检测的图像非线性缩放方法
技术领域
本发明涉及一种基于视觉显著性检测的图像非线性缩放方法,属于图像内容分析、显著性检测等交叉技术领域。
背景技术
图像内容分析是计算机视觉领域中的一个重要研究课题,具有重要的理论意义与实际应用价值,而显著性检测是其中不可或缺的一部分。
一幅固定大小的图片如何在不同长宽比的设备上显示,而不引起图像的变形或失真,是必须要解决的问题。这就要求将待显示的图像进行缩放处理,满足显示设备的长宽比。
目前,图像缩放算法主要分为两大类:几何变换缩放算法和保持图像内容缩放算法。其中前者主要包括均值法、最近邻域法、双线性插值法及双三次插值法。几何图像缩放算法只能对图像中所有内容进行等比例的放大或缩小,缩放后的图像失真比较严重,不能满足现在电子设备的要求。保持图像内容缩放算法主要包括基于图像裁剪或变形缩放算法和基于线裁剪(Seam carving)的缩放算法。
Seam carving算法保持图像中的显著性区域尽量不发生形变,让待删除的裁剪线发生在显著性区域以外的部分,从而保证图像中的重要区域的完整性。与几何变换缩放方法相比,它取得了很好的缩放效果。但是,由于这种方法只采用图像的梯度图定义能量函数,缩放时可能会造成图像中的视觉主体的变形。
由上可见,如何选取更有效的能量函数,使其具有更好的缩放效果,是图像缩放中的重点和难点。
发明内容
发明目的:本发明所要解决的技术问题是图像的非线性缩放,提供一种基于视觉显著性检测的图像非线性缩放方法,以有效地保持图像中的重要内容。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于视觉显著性检测的图像非线性缩放方法,包括以下步骤:
步骤1)输入1张大小为n*m的图像I,所述图像I为n*m的像素值矩阵,其中,n为图像I纵向每列像素数,m为图像I横向每行像素数;输入待缩放图像大小p*q,p<=n,q<=m,其中,p为待缩放图像纵向每列像素数,q为待缩放图像横向每行像素数;
步骤2)在合适的显著性检测数据集上训练一个全卷积神经网络,即FCN神经网络,所述FCN神经网络包括16层卷积层和一个归一化指数模型即softmax模型的输出层,线性整流函数即ReLU函数作为激活函数;
步骤3)将此FCN神经网络应用到步骤1)所输入的图像I,从中检索到显著性特征后从FCN中的softmax层输出显著度值;输出的显著度图表示为g(I),即为一个表示每个像素点的显著度值的矩阵;
步骤4)计算步骤1)所述图像I的能量函数e(I),其中,
Figure GDA0003756620520000021
即根据索贝尔算子即sobel算子提取x和y轴的梯度,然后将绝对值相加;图像中像素点的能量值越大,表明该像素点的重要程度越大,反之则越小;
步骤5)计算总能量函数E(I)=max(g(I),e(I));
步骤6)定义图像I的一条竖直裁剪线为sx,其中,
Figure GDA0003756620520000022
Figure GDA0003756620520000023
所述i表示图像I的第i行,x(i)表示第i行中的某个像素的横坐标值,n表示图像I纵向每列像素数;定义图像I的一条水平裁剪线为sy,其中,
Figure GDA0003756620520000024
所述j表示图像I的第j列,y(j)表示第j列中的某个像素的纵坐标值,m表示图像I横向每行像素数;
步骤7)定义图像I的一条竖直裁剪线sx的代价函数为Cost(sx),其中,
Figure GDA0003756620520000025
所述
Figure GDA0003756620520000026
为图像I的一条竖直裁剪线sx的第i行中的某个像素的横坐标值,
Figure GDA0003756620520000027
为图像I的一条竖直裁剪线;定义图像I的一条水平裁剪线sy的代价函数为Cost(sy),其中,
Figure GDA0003756620520000028
所述
Figure GDA0003756620520000029
为图像I的一条水平裁剪线sy的第i列中的某个像素的纵坐标值,
Figure GDA00037566205200000210
为图像I的一条水平裁剪线;
步骤8)判断m与q的大小关系,若m=q,则跳至步骤9);若m>q,则计算当前状态下最优的竖直裁剪线s*,其中
Figure GDA00037566205200000211
将该条裁剪线s*从图像I中删去,更新m的值为m-1;判断n与p的大小关系,若n=p,则跳至步骤9);若n>p,则计算当前状态下最优的水平裁剪线s',其中
Figure GDA00037566205200000212
将该条裁剪线s'从图像I中删去,更新n的值为n-1;重复步骤3)~步骤8);
步骤9)输出最终缩放完成的大小为p*q的图像I'。
其中所述步骤2)具体如下:
步骤21)全卷积神经网络模型包括多组用于提取图像显著性特征的卷积层,每个卷积核都使用3×3的大小,然后为批量归一化和ReLU激活函数;在每3次卷积之后将特征图下采样2倍,进行最大化池化处理;
步骤22)使用转置卷积将在不同比例学习的特征图上采样到原始分辨率,然后将所有多尺度的特征图按照权重进行相加连接;最后三个内核大小为1×1的卷积层,以及softmax函数,用于预测显著图,经过3次卷积后利用softmax函数得到所有像素点的预测结果。
所述步骤8)具体如下:
步骤81)将步骤5)计算所得总能量函数E(I)=max(g(I),e(I))存入矩阵M中,其中M(i,j)表示图像I中坐标为(i,j)的像素点的总能量值。
步骤82)使用动态规划法找出当前状态下最优的竖直裁剪线s*,遍历矩阵M的第2行到第n行,并计算所有可能连接裁剪线的每一点(i,j)的累积最小能量值Mmin(i,j)=M(i,j)+min(M(i-1,j-1),M(i-1,j),M(i-1,j+1));M(i,j)表示图像I中坐标为(i,j)的像素点的总能量值,在M的第n行的最小值意味着最优竖直裁剪线的结束,从M的第n行回溯找到最佳裁剪线s*,将该条裁剪线s*从图像I中删去,更新m的值为m-1;
步骤83)使用动态规划法找出当前状态下最优的水平裁剪线s',遍历矩阵M的第2列到第m列,并计算所有可能连接裁剪线的每一点(i,j)的累积最小能量值Mmin(i,j)=M(i,j)+min(M(i-1,j-1),M(i-1,j),M(i-1,j+1));在M的第m列的最小值意味着最优水平裁剪线的结束,从M的第m列回溯找到最佳裁剪线s',将该条裁剪线s'从图像I中删去,更新n的值为n-1。
本发明相比现有技术,具有以下有益效果:
本发明训练了一个全卷积神经网络,将此神经网络应用到所输入的图像,计算出图像的显著图,得到总能量函数。然后利用动态规划的方法计算出累计最小能量图,找出一条最佳裁剪线;从图像中不断删去得到的最佳裁剪线,直至图像大小与待缩放图像大小相等,得到缩放完成的新图像。通过这些方法的应用能够有效地保持图像重要内容,具有良好的缩放效果,具体来说:
(1)本发明通过使用全卷积神经网络进行视觉显著性检测,与传统显著性检测方法相比,能更准确识别用户感兴趣的视觉主体区域。
(2)本发明采用新的能量函数,使得这些视觉主体显著区域的能量值相比其它非重要区域更大,能够保证在移除裁剪线时,裁剪线无法穿过这些高能量值区域。
(3)本发明对于主体区域与背景颜色对比不明显或者视觉主体区域较大的图像时,计算出的图像像素的平均能量值更大,缩放后的图像整体视觉效果更好。
附图说明
图1是基于视觉显著性检测的图像非线性缩放的方法流程。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
在具体实施中,一种基于视觉显著性检测的图像非线性缩放方法,该方法首先读入一张大小为n*m的图像,输入待缩放图像大小p*q;接着通过FCN全卷积神经网络生成显著图g(I),并计算出图像的能量函数e(I),得到总能量函数E(I);然后利用动态规划的方法计算出累计最小能量图,找出一条最佳裁剪线;最后从图像中不断删去得到的最佳裁剪线,直至图像大小与待缩放图像大小相等,得到缩放完成的新图像。本发明可以有效地保持图像重要内容,具有良好的缩放效果,具体如下:
首先输入1张大小为n*m的图像I,输入待缩放图像大小p*q,p<=n,q<=m。
接着在合适的显著性检测数据集上训练一个全卷积神经网络即FCN神经网络,该FCN神经网络包括16层卷积层和一个归一化指数模型即softmax模型的输出层,线性整流函数即ReLU函数作为激活函数;将此FCN神经网络应用到所输入的图像I,从中检索到显著性特征后从FCN中的softmax层输出显著度值;输出的显著度图表示为g(I),即为一个表示每个像素点的显著度值的矩阵。
计算图像I的能量函数e(I),其中,
Figure GDA0003756620520000041
即根据索贝尔算子即sobel算子提取x和y轴的梯度,然后将绝对值相加;计算总能量函数E(I)=max(g(I),e(I))。
接着定义图像I的一条竖直裁剪线为sx,其中,
Figure GDA0003756620520000042
所述i表示图像I的第i行,x(i)表示第i行中的某个像素的横坐标值,n表示图像I纵向每列像素数;定义图像I的一条水平裁剪线为sy,其中,
Figure GDA0003756620520000051
Figure GDA0003756620520000052
所述j表示图像I的第j列,y(j)表示第j列中的某个像素的纵坐标值,m表示图像I横向每行像素数。
定义图像I的一条竖直裁剪线sx的代价函数为Cost(sx),其中,
Figure GDA0003756620520000053
所述
Figure GDA0003756620520000054
为图像I的一条竖直裁剪线sx的第i行中的某个像素的横坐标值,
Figure GDA0003756620520000055
为图像I的一条竖直裁剪线;定义图像I的一条水平裁剪线sy的代价函数为Cost(sy),其中,
Figure GDA0003756620520000056
所述
Figure GDA0003756620520000057
为图像I的一条水平裁剪线sy的第i列中的某个像素的纵坐标值,
Figure GDA0003756620520000058
为图像I的一条水平裁剪线。
然后判断m与q的大小关系,若m=q,则跳至下一步;若m>q,则计算当前状态下最优的竖直裁剪线s*,其中
Figure GDA0003756620520000059
将该条裁剪线s*从图像I中删去,更新m的值为m-1;判断n与p的大小关系,若n=p,则跳至下一步;若n>p,则计算当前状态下最优的水平裁剪线s',其中
Figure GDA00037566205200000510
将该条裁剪线s'从图像I中删去,更新n的值为n-1。
最后输出最终缩放完成的大小为p*q的图像I'。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (3)

1.一种基于视觉显著性检测的图像非线性缩放方法,其特征在于,包括以下步骤:
步骤1),输入大小为n*m的图像I,所述图像I为n*m的像素值矩阵,其中,n为图像I纵向每列像素数,m为图像I横向每行像素数;输入待缩放图像大小p*q,p<=n,q<=m,其中,p为待缩放图像纵向每列像素数,q为待缩放图像横向每行像素数;
步骤2),在显著性检测数据集上训练一个全卷积神经网络模型,该全卷积神经网络模型为FCN神经网络模型,所述FCN神经网络包括16层卷积层和一个归一化指数模型即softmax模型的输出层,线性整流函数即ReLU函数作为激活函数;
步骤3),将此FCN神经网络模型应用到步骤1)所输入的图像I,从中检索到显著性特征后从FCN神经网络模型中的softmax层输出显著度值;输出的显著度图表示为g(I),作为一个表示每个像素点的显著度值的矩阵;
步骤4),计算步骤1)所述图像I的能量函数e(I),其中,
Figure FDA0003756620510000011
即根据索贝尔算子即sobel算子提取x和y轴的梯度,然后将绝对值相加;图像中像素点的能量值越大,表明该像素点的重要程度越大,反之则越小;
步骤5),计算总能量函数E(I)=max(g(I),e(I));
步骤6),图像I的一条竖直裁剪线为sx,其中,
Figure FDA0003756620510000012
i表示图像I的第i行,x(i)表示第i行中的某个像素的横坐标值,n表示图像I纵向每列像素数;图像I的一条水平裁剪线为sy,其中,
Figure FDA0003756620510000013
j表示图像I的第j列,y(j)表示第j列中的某个像素的纵坐标值,m表示图像I横向每行像素数;
步骤7),图像I的一条竖直裁剪线sx的代价函数为Cost(sx),其中,
Figure FDA0003756620510000014
Figure FDA0003756620510000015
为图像I的一条竖直裁剪线sx的第i行中的某个像素的横坐标值,
Figure FDA0003756620510000016
为图像I的一条竖直裁剪线;图像I的一条水平裁剪线sy的代价函数为Cost(sy),其中,
Figure FDA0003756620510000017
Figure FDA0003756620510000018
为图像I的一条水平裁剪线sy的第i列中的某个像素的纵坐标值,
Figure FDA0003756620510000019
为图像I的一条水平裁剪线;
步骤8),判断m与q的大小关系,若m=q,则跳至步骤9);若m>q,则计算当前状态下最优的竖直裁剪线s*,其中
Figure FDA0003756620510000021
将该条裁剪线s*从图像I中删去,更新m的值为m-1;判断n与p的大小关系,若n=p,则跳至步骤9);若n>p,则计算当前状态下最优的水平裁剪线s',其中
Figure FDA0003756620510000022
将该条裁剪线s'从图像I中删去,更新n的值为n-1;重复步骤3)~步骤8);
步骤9)输出最终缩放完成的大小为p*q的图像I'。
2.根据权利要求1所述基于视觉显著性检测的图像非线性缩放方法,其特征在于:所述步骤2)具体如下:
步骤21),全卷积神经网络模型包括多组用于提取图像显著性特征的卷积层,每个卷积核都使用3×3的大小,然后为批量归一化和ReLU激活函数;在每3次卷积之后将特征图下采样2倍,进行最大化池化处理;
步骤22),使用转置卷积将在不同比例学习的特征图上采样到原始分辨率,然后将所有多尺度的特征图按照权重进行相加连接;最后三个内核大小为1×1的卷积层,以及softmax函数,用于预测显著图,经过3次卷积后利用softmax函数得到所有像素点的预测结果。
3.根据权利要求1所述基于视觉显著性检测的图像非线性缩放方法,其特征在于:所述步骤8)具体如下:
步骤81),将步骤5)计算所得总能量函数E(I)=max(g(I),e(I))存入矩阵M中,其中M(i,j)表示图像I中坐标为(i,j)的像素点的总能量值;
步骤82),使用动态规划法找出当前状态下最优的竖直裁剪线s*,遍历矩阵M的第2行到第n行,并计算所有可能连接裁剪线的每一点(i,j)的累积最小能量值Mmin(i,j)=M(i,j)+min(M(i-1,j-1),M(i-1,j),M(i-1,j+1));M(i,j)表示图像I中坐标为(i,j)的像素点的总能量值,在M的第n行的最小值意味着最优竖直裁剪线的结束,从M的第n行回溯找到最佳裁剪线s*,将该条裁剪线s*从图像I中删去,更新m的值为m-1;
步骤83),使用动态规划法找出当前状态下最优的水平裁剪线s',遍历矩阵M的第2列到第m列,并计算所有可能连接裁剪线的每一点(i,j)的累积最小能量值Mmin(i,j)=M(i,j)+min(M(i-1,j-1),M(i-1,j),M(i-1,j+1));在M的第m列的最小值意味着最优水平裁剪线的结束,从M的第m列回溯找到最佳裁剪线s',将该条裁剪线s'从图像I中删去,更新n的值为n-1。
CN201910245860.4A 2019-03-28 2019-03-28 一种基于视觉显著性检测的图像非线性缩放方法 Active CN109978768B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910245860.4A CN109978768B (zh) 2019-03-28 2019-03-28 一种基于视觉显著性检测的图像非线性缩放方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910245860.4A CN109978768B (zh) 2019-03-28 2019-03-28 一种基于视觉显著性检测的图像非线性缩放方法

Publications (2)

Publication Number Publication Date
CN109978768A CN109978768A (zh) 2019-07-05
CN109978768B true CN109978768B (zh) 2022-10-11

Family

ID=67081422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910245860.4A Active CN109978768B (zh) 2019-03-28 2019-03-28 一种基于视觉显著性检测的图像非线性缩放方法

Country Status (1)

Country Link
CN (1) CN109978768B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862673B (zh) * 2019-11-12 2024-06-14 上海途擎微电子有限公司 自适应图像缩放方法及自适应图像缩放装置、存储装置
CN112184558B (zh) * 2020-11-09 2024-03-08 辽宁工程技术大学 一种基于显著性检测的rgb-d图像非规则缩放方法
CN113506221B (zh) * 2021-07-16 2024-07-26 深圳市爱协生科技股份有限公司 图像缩放方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665413A (zh) * 2018-04-28 2018-10-16 中国科学院上海高等研究院 一种图像自适应放大方法、可读存储介质及终端

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665413A (zh) * 2018-04-28 2018-10-16 中国科学院上海高等研究院 一种图像自适应放大方法、可读存储介质及终端

Also Published As

Publication number Publication date
CN109978768A (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
CN109978768B (zh) 一种基于视觉显著性检测的图像非线性缩放方法
CN109389556B (zh) 一种多尺度空洞卷积神经网络超分辨率重构方法及装置
CN109118432B (zh) 一种基于快速循环卷积网络的图像超分辨率重建方法
CN106127688B (zh) 一种超分辨率图像重建方法及其系统
CN109949224B (zh) 一种基于深度学习的联级超分辨率重建的方法及装置
US20100166334A1 (en) Method for magnifying images and videos
CN112990219B (zh) 用于图像语义分割的方法和装置
CN109325589A (zh) 卷积计算方法及装置
CN106650615B (zh) 一种图像处理方法及终端
EP2927864A1 (en) Image processing device and image processing method
CN110942071A (zh) 一种基于车牌分类和lstm的车牌识别方法
WO2019047655A1 (zh) 用于确定无人车的驾驶行为的方法和装置
CN113724136B (zh) 一种视频修复方法、设备及介质
CN112329808A (zh) 一种Deeplab语义分割算法的优化方法及系统
CN114387289B (zh) 输配电架空线路三维点云语义分割方法和装置
CN114170231A (zh) 基于卷积神经网络的图像语义分割方法、装置及电子设备
CN113963009A (zh) 基于可形变划块的局部自注意力的图像处理方法和模型
CN112669426B (zh) 基于生成对抗网络的三维地理信息模型渲染方法及系统
CN108550111A (zh) 一种基于多级字典学习的残差实例回归超分辨重建方法
CN109996085B (zh) 模型训练方法、图像处理方法、装置及电子设备
CN113971763A (zh) 一种基于目标检测和超分重建的小目标分割方法和装置
CN114897702A (zh) 图像重构方法、装置、计算机设备和存储介质
CN113139490A (zh) 一种图像特征匹配方法、装置、计算机设备及存储介质
CN113313238A (zh) 一种基于深度学习的视觉slam方法
CN112348744B (zh) 一种基于缩略图的数据增强方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant