CN111047508B - 图像处理方法、装置、计算机设备和存储介质 - Google Patents
图像处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111047508B CN111047508B CN201911293119.1A CN201911293119A CN111047508B CN 111047508 B CN111047508 B CN 111047508B CN 201911293119 A CN201911293119 A CN 201911293119A CN 111047508 B CN111047508 B CN 111047508B
- Authority
- CN
- China
- Prior art keywords
- image
- network
- target
- generation
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 238000003860 storage Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000004590 computer program Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种图像处理方法、装置、计算机设备和存储介质。所述方法包括:获取原始图像和目标生成尺寸;按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像;根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。通过训练好的图像生成网络对原始图像特征提取和重构,得到与展示设备相适应的图像,使得生成的图像具备更完整的图像信息,播放该图像,可以提升用户体验。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像处理方法、装置、计算机设备和存储介质。
背景技术
视频作为娱乐媒体的重要载体,其承载着重要信息。随着自媒体以及UGC的兴起,越来越多的用户使用自己的拍摄设备记录生活并上传至互联网。
拍摄设备拍摄视频时,其中大量的视频时是竖屏拍摄的,用户将视频上传到互联网,播放视频时,经常是横屏播放。目前将视频从竖转横,通常采用显著性检测方法检测视频主体,对视频进行裁剪出主体目标,裁剪视频主体部分,造成信息丢失,影响观感。
发明内容
为了解决上述技术问题,本申请提供了一种图像处理方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种图像处理方法,包括:
获取原始图像和目标生成尺寸;
按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,拓展图像包括拓展区域和原始图像对应的原始区域;
根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;
将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
第二方面,本申请提供了一种图像处理装置,包括:
数据获取模块,用于获取原始图像和目标生成尺寸;
图像拓展模块,用于按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,拓展图像包括拓展区域和原始图像对应的原始区域;
掩码图像生成模块,用于根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;
图像生成模块,用于将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取原始图像和目标生成尺寸;
按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,拓展图像包括拓展区域和原始图像对应的原始区域;
根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;
将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取原始图像和目标生成尺寸;
按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,拓展图像包括拓展区域和原始图像对应的原始区域;
根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;
将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
上述图像处理方法、装置、计算机设备和存储介质,所述方法包括:获取原始图像和目标生成尺寸;按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,拓展图像包括拓展区域和原始图像对应的原始区域,根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像尺寸相同;将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。通过训练好的图像生成网络对原始图像特征提取和重构,得到与展示设备相适应的图像,使得生成的图像具备更完整的图像信息,播放该图像,可以提升用户体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为一个实施例中图像处理方法的应用环境图;
图2为一个实施例中图像处理方法的流程示意图;
图3为一个实施例中训练图像对的示意图;
图4为一个实施例中目标对抗网络的网络结构示意图;
图5为一个实施例中图像处理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
图1为一个实施例中图像处理方法的应用环境图。参照图1,该图像处理方法应用于图像处理系统。该图像处理系统包括终端110和服务器120。终端110和服务器120通过网络连接。服务器120或终端110获取原始图像和目标生成尺寸;按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像;根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。通过训练好的图像生成网络对原始图像特征提取和重构,得到与展示设备相适应的图像,使得生成的图像具备更完整的图像信息,播放该图像,可以提升用户体验。
终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种图像处理方法。本实施例主要以该方法应用于上述图1中的终端110(或服务器120)来举例说明。参照图2,该图像处理方法具体包括如下步骤:
步骤S201,获取原始图像和目标生成尺寸。
具体地,原始图像是指拍摄设备的图像,展示设备与拍摄终端可以为相同的终端也可以为不同的终端。目标生成尺寸是指期望生成的图像的尺寸信息,其中目标生成尺寸可以为各个展示设备的展示界面的尺寸,还可以是自定义的展示区域的展示尺寸等。当拍摄设备与展示设备为相同的终端时,拍摄终端的展示界面的宽度和高度不相等。如以拍摄设备为手机为例,原始图像为竖屏图像,采用横屏的方式进行展示,即。当拍摄设备和展示设备为不同的设备时,如手机拍摄图像,采用笔记本电脑或台式机等等计算机设备进行展示。
步骤S202,按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像。
在本具体实施例中,拓展图像包括拓展区域和原始图像对应的原始区域。
具体地,目标生成尺寸对应的高度和宽度是指按照预设的展示方式,以同一个手机为例,竖屏图像为原始图像,竖屏图像的高度和宽度,和横屏图像的高度和宽度刚好相反,即竖屏图像的高度为横屏图像的宽度,竖屏图像的宽度为横屏图像的高度。按照目标生成尺寸的高度和宽度比值调整原始图像,使得拓展后的原始图像的高度和宽度比值与目标生成尺寸的高度和宽度的比值为相同。其中扩展图像是指增加原始图像的像素点,并对增加的像素点进行填充,填充像素值时可以填充相同的值,也可以填充不同的值,具体填充方式可以自定义,如增加的像素点的像素值都0或1等等。其中扩充时,可以向原始图像的四周进行拓展,也可以指向其中一个边或两边进行扩展,如仅扩展宽度,向图像的左边和/或右边进行拓展。将拓展得到的区域作为拓展区域,原始图像对应的区域作为原始区域。
步骤S203,根据拓展图像的拓展区域和原始区域生成掩码图像。
在本具体实施例中,掩码图像与拓展图像尺寸相同。
步骤S204,将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像。
在本具体实施例中,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
具体地,掩码图像是指仅包含0和1两种元素的图像。即将拓展图像中与原始图像对应的区域的像素值设置为1,将拓展图像中与原始区域不对应的区域的像素值设置为0,得到掩码图像。图像生成网络是指目标对抗网络中的子网络。其中目标对抗网络包括图像生成网络和图像判别网络,目标对抗网络是通过大量的携带标签的训练图像对图像生成网络和图像判别网络的参数进行学习和更新,得到的网络。图像生成网络的输入数据包括原始图像、掩码图像和目标生成尺寸,输出为生成图像。输出的生成图像是用于在展示设备上展示的图像。图像生成网络包括特征提取和重构部分,特征提取部分用于提取图像中的特征,重构部分用于根据提取到的图像进行图像重构,最后重构得到与目标生成尺寸相同大小的图像,即生成图像。
上述图像处理方法,包括:获取原始图像和目标生成尺寸;按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像;根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。通过训练好的图像生成网络对原始图像特征提取和重构,得到与展示设备相适应的图像,使得生成的图像具备更完整的图像信息,播放该图像,可以提升用户体验。
在一个实施例中,步骤S202,包括:在原始图像中的两侧增加像素值为零的像素点,得到拓展图像,以使拓展图像的高度与宽度比值与目标生成尺寸的高度和宽度的比值相同。
在本具体实施例中,步骤S203包括:将拓展图像中的原始区域的区域元素设置为1,得到掩码图像。
具体地,原始区域是指拓展图像中与原始图像对应的区域,拓展区域是指拓展图像中除原始区域以外的区域。拓展图像时,原始图像的高度不变,在原始图像的两侧补零,其中补零时,两侧补的数量可以一致,也可以不一致。在原始图像两侧进行补零,增加原始图像的宽度,以使得拓展图像的宽高比和目标生成尺寸的宽高比一致。将拓展图像中原始图像对应的区域的像素点的像素值设置为1,得到一个仅包含0和1的掩码图像。
在一个实施例中,目标对抗网络包括图像生成网络和图像判别网络,生成目标对抗网络的步骤,包括:
步骤S301,获取多个训练图像对,训练图像对包括训练图像和对应的目标生成图像。
步骤S302,输入各个训练图像对至初始对抗网络的图像生成网络,输出各个训练图像对应的第一生成图像。
步骤S303,根据各个训练图像的第一生成图像和对应的目标生成图像的差异度,计算初始对抗网络的图像生成网络的第一损失值。
步骤S304,将各个训练图像的第一生成图像和目标生成图像输入初始对抗网络中的图像判别网络,输出训练图像的第一生成图像的识别结果和目标生成图像的识别结果。
步骤S305,根据第一生成图像的识别结果和目标生成图像的识别结果的识别差异度,计算初始对抗网络的图像判别网络的第二损失值,根据识别差异度计算识别准确率。
步骤S306,当第一损失值小于或等于第一预设损失值,且识别准确率大于或等于预设准确率时,得到目标对抗网络。
具体地,训练图像对是指用于训练图像的图像对,图像对包括训练图像和对应的目标生成图像。初始对抗网络是指未训练完成的神经网络模型,常见的对抗网络模型包括DCGAN、GAN等等。初始对抗网络中的图像生成网络和图像判别网络中的参数根据模型的更新规则更新,直至图像生成网络和图像判别网络都收敛,得到目标对抗网络。将各个训练图像对输入初始对抗网络,输出各个训练图像对对应的第一生成图像和对应的判别结果,和目标生成图像的判别结果,根据第一生成图像和对应的目标生成图像的差异度计算第一损失值,根据第一生成图像和对应的目标生成图像判别结果计算识别差异度对应的第二损失值和识别准确率。判断第一损失值是否小于或等于第一预设损失值,判断识别准确率是否位于预设准确率区间,其中预设准确率区间为预先设定的邻接区间,位于该临界区间内表示判别网络可以较为准确的实现图像的判别,当第一损失值小于或等于第一预设损失值,且识别准确率位于预设准确率区间时,初始对抗网络收敛得到目标对抗网络。
在一个实施例中,当第一损失值大于第一预设损失值时,根据第一损失值和第二损失值更新初始对抗网络的网络参数,得到中间对抗网络,输入各个训练图像对至中间对抗网络,直至中间对抗网络对应的第一损失值小于或等于第一预设损失值,且识别准率位于预设准率区间时,得到目标对抗网络。
具体地,第一损失值大于第一预设损失值,表示第一生成图像和目标生成图像之间的差距过大,初始对抗网络的网络参数需要更新,更新的网络参数的方法可以采用常见的机器学习模型的网络参数的更新方法,得到中间对抗网络,将各个训练图像对输入至中间对抗网络,通过中间对抗网络进行特征提取和图像重构、图像判别,再次输出各个训练图像对对应的第一生成图像和对应的判别结果,和目标生成图像的判别结果,得到对应的第一损失值、第二损失值和识别准确率,若第一损失值小于或等于第一预设损失值,且识别准率位于预设准率区间时,得到目标对抗网络。反之,则继续采用第一损失值和第二损失值更新中间对网络的网络参数,直至第一损失值小于或等于第一预设损失值,且识别准率位于预设准率区间,得到目标对抗网络。
在一个实施例中,根据第一损失值和第二损失值更新初始对抗网络的网络参数,得到中间对抗网络,包括:根据预设回传算法回传第二损失值,并更新初始对抗网络中的图像判别网络的网络参数,得到中间图像判别模型和对应的回传误差;根据回传误差和第一损失值更新初始对抗网络中的图像生成网络的网络参数,得到中间图像生成网络,中间图像生成网络和中间图像判别网络组成中间对抗网络。
具体地,预设回传算法为预先设置的用于回传损失值的算法。采用回传算法对第二损失值进行回传,各个网络层根据回传到该网络层的损失值更新网络参数,直至遍历整个图像判别网络,更新完整个图像判别网络的参数,得到回传误差和中间图像判别模型。回传误差和第一损失值按照预设的图像生成网络的回传算法回传生成误差,其中生成误差由第一损失值和回传误差计算得到,计算方法可以自定义,如计算第一损失值和回传误差的加权值,得到生成误差。根据生成误差更新图像生成网络的网络参数,得到中间图像生成网络,中间图像生成网络和中间图像判别模型组成中间对抗网络。
在一个实施例中,通过依次训练图像生成网络和图像判别网络,使得生成的图像与真实图像(目标生成图像)之间的差异度更小,即采用训练好的对抗网络(目标对抗网络)中的图像生成网络生成需要展示的图像,得到的图像信息更为完整和丰富。
在一个实施例中,获取多个训练图像对,包括:获取多个目标生成图像,各个目标生成图像为横屏图像,从各个目标生成图像中截取部分图像区域,得到各个目标生成图像对应的训练图像,目标生成图像和目标生成图像对应的训练图像组成训练图像对。
具体地,训练图像是从目标生成图像中截取部分图像区域得到的图像如图3所示,图像310为目标生成图像,区域320为训练图像。采用横屏图像作为目标生成图像,从横屏图像中截取部分区域作为目标生成图像,得到训练数据,训练数据的采集方便简单。
在一个具体地实施例中,上述图像处理方法,包括:
将原始竖屏图片(原始图像)Iori往两侧拓展,拓展后宽高比例与目标横屏图片的宽高比一致。拓展区域两侧像素值置0,拓展后图片记为Iextend。根据Iextend生成一个掩模Imask,即将Iextend非拓展区域(原始区域)置为1即得到Imask。Imask是一个由0和1值组成的矩阵。1表示原图区域(始终保持不变),0表示待填充区域。掩模mask(Imask)之后,将Imask和原始图像Iori送入到生成对抗网络(其他任何具备图像补全功能的模块均可)当中进行图像补全。得到修复后的图片(生成图像)。
在本具体实施例中,参见图4,常见的目标对抗网络结构包括图像生成网络410和图像判别网络420两个子网络。其中图像生成网络用于生成图像,图像判别网络用于判断生成的图像所属的类型是真的图像还是生成的图像。图像生成网络410包括多个特征提取层411,和多个图像重构层412,图中的箭头指向的方法为提取的特征的输出方向,图像重构层可以接收来自多个特征提取层提取的图像特征,根据多个特征提取层中提取的特征进行图像重构。
输入图像包括Iori和Imask。各个网络层执行卷积,池化,归一化等操作。图像生成网络中的不同的网络层的输出数流向同一个网络层连接,即将底层和高层特征进行融合,不同网络层的特征进行融合,得到融合特征,采用融合特征进行图像重构,得到生成图像。经过一系列卷积,池化等操作进行特征提取和重构,最终得到补全后的图像(生成图像),补全后的图像被送入到图像判别网络中提取特征,输出该图像是否为真实图像的概率。当概率大于预设概率时表示该图像为真实图像,反之表示为生成图像。
生成图像Iresult=F(Iori,Imask),Iresult即为最终的横屏图片。式中F表示图像生成网络,网络训练过程的损失函数Loss可以根据需求自定义,模型不同,loss可能不同。如Loss=(Iresult-Itarget)2,Itarget为目标生成图像。
训练数据构造方法:可以对正常横屏图像(目标生成图像)进行截取得到竖屏图像(原始图像)。采用图像生成网络生成横屏图片的过程当中没有对图片进行裁剪,因此没有丢失图像信息,原有图片内容被完好的保留下来,从而提升了图像视频的观感和用户体验。
图2为一个实施例中图像处理方法的流程示意图。应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种图像处理装置200,包括:
数据获取模块201,用于获取原始图像和目标生成尺寸。
图像拓展模块202,用于按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,拓展图像包括拓展区域和原始图像对应的原始区域。
掩码图像生成模块203,用于根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像尺寸相同。
图像生成模块204,用于将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
在一个实施例中,图像拓展模块202具体用于在原始图像中的两侧增加像素值为零的像素点,得到拓展图像,以使拓展图像的高度与宽度比值与目标生成尺寸的高度和宽度的比值相同,其中,拓展图像包括拓展区域和原始区域。
掩码图像生成模块203具体用于将拓展图像中的原始区域的区域元素设置为1,得到掩码图像。
在一个实施例中,上述图像处理装置200,还包括:
模型生成模块,用于生成目标对抗网络,目标对抗网络包括图像生成网络和图像判别网络,其中模型生成模块,包括:
训练数据获取单元,用于获取多个训练图像对,训练图像对包括训练图像和对应的目标生成图像;
图像生成单元,用于输入各个训练图像对至初始对抗网络的图像生成网络,输出各个训练图像对应的第一生成图像;
第一损失值计算单元,用于根据各个训练图像的第一生成图像和对应的目标生成图像的差异度,计算初始对抗网络的图像生成网络的第一损失值;
判别单元,用于将各个训练图像的第一生成图像和目标生成图像输入所述初始对抗网络中的图像判别网络,输出训练图像的第一生成图像的识别结果和目标生成图像的识别结果;
识别准确率统计单元,用于根据第一生成图像的识别结果和目标生成图像的识别结果的识别差异度,计算初始对抗网络的图像判别网络的第二损失值,根据识别差异度计算识别准确率;
模型生成单元,用于当第一损失值小于或等于第一预设损失值,且识别准确率位于预设准确率区间时,得到目标对抗网络。
在一个实施例中,上述模型生成模块,还包括:
图像生成网络确定单元,用于当第一损失值大于第一预设损失值时,根据第一损失值和第二损失值更新初始对抗网络的网络参数,得到中间对抗网络,输入各个训练图像对至中间对抗网络,直至中间对抗网络对应的第一损失值小于或等于第一预设损失值,且识别准率位于预设准率区间时,得到目标对抗网络。
在一个实施例中,图像生成网络确定单元还用于根据预设回传算法回传第二损失值,并更新初始对抗网络中的图像判别网络的网络参数,得到中间图像判别模型和对应的回传误差;根据回传误差和第一损失值更新初始对抗网络中的图像生成网络的网络参数,得到中间图像生成网络,中间图像生成网络和中间图像判别网络组成中间对抗网络。
在一个实施例中,数据获取模块201具体用于获取多个目标生成图像,各个目标生成图像为横屏图像,从各个目标生成图像中截取部分图像区域,得到各个目标生成图像对应的训练图像,目标生成图像和目标生成图像对应的训练图像组成训练图像对。
图6示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110(或服务器120)。如图6所示,该计算机设备通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现图像处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行图像处理方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的图像处理装置可以实现为一种计算机程序的形式,计算机程序可在如图6所示的计算机设备上运行。计算机设备的存储器中可存储组成该图像处理装置的各个程序模块,比如,图5所示的数据获取模块201、图像拓展模块202、掩码图像生成模块203和图像生成模块204。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的图像处理方法中的步骤。
例如,图6所示的计算机设备可以通过如图5所示的图像处理装置中数据获取模块201执行获取原始图像和目标生成尺寸。计算机设备可以通过图像拓展模块202执行按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像。计算机设备可以通过掩码图像生成模块203执行根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像尺寸相同。计算机设备可以通过图像生成模块204执行将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取原始图像和目标生成尺寸;按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像;根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
在一个实施例中,拓展图像包括拓展区域和原始区域,按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,包括:在原始图像中的两侧增加像素值为零的像素点,得到拓展图像,以使拓展图像的高度与宽度比值与目标生成尺寸的高度和宽度的比值相同;根据拓展图像的拓展区域和原始区域生成掩码图像,包括:将拓展图像中的原始区域的区域元素设置为1,得到掩码图像。
在一个实施例中,目标对抗网络包括图像生成网络和图像判别网络,处理器执行计算机程序时还实现以下步骤:生成目标对抗网络的步骤,包括:获取多个训练图像对,训练图像对包括训练图像和对应的目标生成图像;输入各个训练图像对至初始对抗网络的图像生成网络,输出各个训练图像对应的第一生成图像;根据各个训练图像的第一生成图像和对应的目标生成图像的差异度,计算初始对抗网络的图像生成网络的第一损失值;将各个训练图像的第一生成图像和目标生成图像输入初始对抗网络中的图像判别网络,输出训练图像的第一生成图像的识别结果和目标生成图像的识别结果;根据第一生成图像的识别结果和目标生成图像的识别结果的识别差异度,计算初始对抗网络的图像判别网络的第二损失值,根据识别差异度计算识别准确率;当第一损失值小于或等于第一预设损失值,且识别准确率位于预设准确率区间时,得到目标对抗网络。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当第一损失值大于第一预设损失值时,根据第一损失值和第二损失值更新初始对抗网络的网络参数,得到中间对抗网络,输入各个训练图像对至中间对抗网络,直至中间对抗网络对应的第一损失值小于或等于第一预设损失值,且识别准率位于预设准率区间时,得到目标对抗网络。
在一个实施例中,根据第一损失值和所述第二损失值更新初始对抗网络的网络参数,得到中间对抗网络,包括:根据预设回传算法回传第二损失值,并更新初始对抗网络中的图像判别网络的网络参数,得到中间图像判别模型和对应的回传误差;根据回传误差和第一损失值更新初始对抗网络中的图像生成网络的网络参数,得到中间图像生成网络,中间图像生成网络和中间图像判别网络组成中间对抗网络。
在一个实施例中,获取多个训练图像对,包括:获取多个目标生成图像,各个目标生成图像为横屏图像;从各个目标生成图像中截取部分图像区域,得到各个目标生成图像对应的训练图像,目标生成图像和目标生成图像对应的训练图像组成训练图像对。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取原始图像和目标生成尺寸;按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,拓展图像包括拓展区域和原始图像对应的原始区域;根据拓展图像的拓展区域和原始区域生成掩码图像,掩码图像与拓展图像维度相同;将掩码图像、目标生成尺寸和原始图像输入图像生成网络,输出生成图像,生成图像的尺寸与目标生成尺寸相同,图像生成网络为目标对抗网络的子网络。
在一个实施例中,按照目标生成尺寸的高度和宽度的比值对原始图像进行拓展,得到拓展图像,包括:在原始图像中的两侧增加像素值为零的像素点,得到拓展图像,以使拓展图像的高度与宽度比值与目标生成尺寸的高度和宽度的比值相同;根据拓展图像的拓展区域和原始区域生成掩码图像,包括:将拓展图像中的原始区域的区域元素设置为1,得到掩码图像。
在一个实施例中,目标对抗网络包括图像生成网络和图像判别网络,计算机程序被处理器执行时还实现以下步骤:生成目标对抗网络的步骤,包括:获取多个训练图像对,训练图像对包括训练图像和对应的目标生成图像;输入各个训练图像对至初始对抗网络的图像生成网络,输出各个训练图像对应的第一生成图像;根据各个训练图像的第一生成图像和对应的目标生成图像的差异度,计算初始对抗网络的图像生成网络的第一损失值;将各个训练图像的第一生成图像和目标生成图像输入初始对抗网络中的图像判别网络,输出训练图像的第一生成图像的识别结果和目标生成图像的识别结果;根据第一生成图像的识别结果和目标生成图像的识别结果的识别差异度,计算初始对抗网络的图像判别网络的第二损失值,根据识别差异度计算识别准确率;当第一损失值小于或等于第一预设损失值,且识别准确率位于预设准确率区间时,得到目标对抗网络。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当第一损失值大于第一预设损失值时,根据第一损失值和第二损失值更新初始对抗网络的网络参数,得到中间对抗网络,输入各个训练图像对至中间对抗网络,直至中间对抗网络对应的第一损失值小于或等于第一预设损失值,且识别准率位于预设准率区间时,得到目标对抗网络。
在一个实施例中,根据第一损失值和第二损失值更新所述初始对抗网络的网络参数,得到中间对抗网络,包括:根据预设回传算法回传第二损失值,并更新初始对抗网络中的图像判别网络的网络参数,得到中间图像判别模型和对应的回传误差;根据回传误差和第一损失值更新初始对抗网络中的图像生成网络的网络参数,得到中间图像生成网络,中间图像生成网络和中间图像判别网络组成中间对抗网络。
在一个实施例中,获取多个训练图像对,包括:获取多个目标生成图像,各个目标生成图像为横屏图像;从各个目标生成图像中截取部分图像区域,得到各个目标生成图像对应的训练图像,目标生成图像和目标生成图像对应的训练图像组成训练图像对。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种图像处理方法,其特征在于,所述方法包括:
获取原始图像和目标生成尺寸;
按照所述目标生成尺寸的高度和宽度的比值对所述原始图像进行拓展,得到拓展图像,所述拓展图像包括拓展区域和原始图像对应的原始区域,所述拓展图像的高度与宽度的比值与所述目标生成尺寸的高度与宽度的比值相同;
根据所述拓展图像的拓展区域和原始区域生成掩码图像,所述掩码图像与所述拓展图像尺寸相同;
将所述掩码图像、所述目标生成尺寸和所述原始图像输入图像生成网络,输出生成图像,所述生成图像的尺寸与所述目标生成尺寸相同,所述图像生成网络为目标对抗网络的子网络,所述目标对抗网络包括图像生成网络和图像判别网络,所述目标对抗网络通过获取到的多个训练图像对以对所述图像生成网络和所述图像判别网络的参数进行学习和更新所得到;多个训练图像对通过如下方式获取:获取多个目标生成图像,各个所述目标生成图像为横屏图像;从各个所述目标生成图像中截取部分图像区域,得到各个所述目标生成图像对应的训练图像,所述目标生成图像和所述目标生成图像对应的训练图像组成所述训练图像对。
2.根据权利要求1所述的方法,其特征在于,包括:
所述按照所述目标生成尺寸的高度和宽度的比值对所述原始图像进行拓展,得到拓展图像,包括:在所述原始图像中的两侧增加像素值为零的像素点,得到所述拓展图像,以使所述拓展图像的高度与宽度比值与所述目标生成尺寸的高度和宽度的比值相同;
所述根据所述拓展图像的拓展区域和原始区域生成掩码图像,包括:将所述拓展图像中的所述原始区域的区域元素设置为1,得到所述掩码图像。
3.根据权利要求1所述的方法,其特征在于,生成所述目标对抗网络的步骤,包括:
获取多个训练图像对,所述训练图像对包括训练图像和对应的目标生成图像;
输入各个所述训练图像对至初始对抗网络的图像生成网络,输出各个所述训练图像对应的第一生成图像;
根据各个所述训练图像的第一生成图像和对应的目标生成图像的差异度,计算所述初始对抗网络的图像生成网络的第一损失值;
将各个所述训练图像的第一生成图像和目标生成图像输入所述初始对抗网络中的图像判别网络,输出所述训练图像的第一生成图像的识别结果和所述目标生成图像的识别结果;
根据所述第一生成图像的识别结果和所述目标生成图像的识别结果的识别差异度,计算所述初始对抗网络的图像判别网络的第二损失值,根据所述识别差异度计算识别准确率;
当所述第一损失值小于或等于第一预设损失值,且所述识别准确率位于预设准确率区间时,得到所述目标对抗网络。
4.根据权利要求3所述的方法,其特征在于,所述方法包括:
当所述第一损失值大于所述第一预设损失值时,根据所述第一损失值和所述第二损失值更新所述初始对抗网络的网络参数,得到中间对抗网络,输入各个所述训练图像对至所述中间对抗网络,直至当所述第一损失值小于或等于所述第一预设损失值,且所述识别准确率位于所述预设准确率区间时,得到所述目标对抗网络。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一损失值和所述第二损失值更新所述初始对抗网络的网络参数,得到中间对抗网络,包括:
根据预设回传算法回传所述第二损失值,并更新所述初始对抗网络中的图像判别网络的网络参数,得到中间图像判别模型和对应的回传误差;
根据所述回传误差和所述第一损失值更新所述初始对抗网络中的图像生成网络的网络参数,得到中间图像生成网络,所述中间图像生成网络和中间图像判别网络组成所述中间对抗网络。
6.一种图像处理装置,其特征在于,所述装置包括:
数据获取模块,用于获取原始图像和目标生成尺寸;
图像拓展模块,用于按照所述目标生成尺寸的高度和宽度的比值对所述原始图像进行拓展,得到拓展图像,所述拓展图像包括拓展区域和原始图像对应的原始区域,所述拓展图像的高度与宽度的比值与所述目标生成尺寸的高度与宽度的比值相同;
掩码图像生成模块,用于根据所述拓展图像的拓展区域和原始区域生成掩码图像,所述掩码图像与所述拓展图像尺寸相同;
图像生成模块,用于将所述掩码图像、所述目标生成尺寸和所述原始图像输入图像生成网络,输出生成图像,所述生成图像的尺寸与所述目标生成尺寸相同,所述图像生成网络为目标对抗网络的子网络,所述目标对抗网络包括图像生成网络和图像判别网络,所述目标对抗网络通过获取到的多个训练图像对以对所述图像生成网络和所述图像判别网络的参数进行学习和更新所得到;多个训练图像对通过如下方式获取:获取多个目标生成图像,各个所述目标生成图像为横屏图像;从各个所述目标生成图像中截取部分图像区域,得到各个所述目标生成图像对应的训练图像,所述目标生成图像和所述目标生成图像对应的训练图像组成所述训练图像对。
7.根据权利要求6所述的装置,其特征在于,所述装置包括:
模型生成模块,用于生成所述对抗网络,所述目标对抗网络包括所述图像生成网络和图像判别网络,其中所述模型生成模块,包括:
训练数据获取单元,用于获取多个训练图像对,所述训练图像对包括训练图像和对应的目标生成图像;
图像生成单元,用于输入各个所述训练图像对至初始对抗网络的图像生成网络,输出各个所述训练图像对应的第一生成图像;
第一损失值计算单元,用于根据各个所述训练图像的第一生成图像和对应的目标生成图像的差异度,计算所述初始对抗网络的图像生成网络的第一损失值;
判别单元,用于将各个所述训练图像的第一生成图像和目标生成图像输入所述初始对抗网络中的图像判别网络,输出所述训练图像的第一生成图像的识别结果和所述目标生成图像的识别结果;
识别准确率统计单元,用于根据所述第一生成图像的识别结果和所述目标生成图像的识别结果的识别差异度,计算所述初始对抗网络的图像判别网络的第二损失值,根据所述识别差异度计算识别准确率;
模型生成单元,用于当所述第一损失值小于或等于第一预设损失值,且所述识别准确率位于预设准确率区间时,得到所述目标对抗网络。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911293119.1A CN111047508B (zh) | 2019-12-16 | 2019-12-16 | 图像处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911293119.1A CN111047508B (zh) | 2019-12-16 | 2019-12-16 | 图像处理方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111047508A CN111047508A (zh) | 2020-04-21 |
CN111047508B true CN111047508B (zh) | 2024-04-26 |
Family
ID=70236712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911293119.1A Active CN111047508B (zh) | 2019-12-16 | 2019-12-16 | 图像处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111047508B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529814B (zh) * | 2020-12-21 | 2024-02-02 | 杭州海康威视数字技术股份有限公司 | 一种全景图的天空背景填补方法、装置及存储介质 |
CN112785599B (zh) * | 2020-12-25 | 2024-05-28 | 深兰工业智能创新研究院(宁波)有限公司 | 图像扩展方法及装置 |
CN113034348A (zh) * | 2021-03-24 | 2021-06-25 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、存储介质及设备 |
CN113177891B (zh) * | 2021-04-28 | 2023-09-26 | 北京达佳互联信息技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN114387168B (zh) * | 2022-01-17 | 2024-07-12 | 腾讯科技(深圳)有限公司 | 图像处理方法、相关设备、存储介质及程序产品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104679466A (zh) * | 2013-11-29 | 2015-06-03 | 腾讯科技(深圳)有限公司 | 一种图像显示方法、装置及电子设备 |
CN105554549A (zh) * | 2015-12-03 | 2016-05-04 | 青岛海信移动通信技术股份有限公司 | 一种VoLTE网络视频显示方法及装置 |
CN106530232A (zh) * | 2016-11-10 | 2017-03-22 | 河北工业大学 | 一种图像缩放方法 |
CN108182669A (zh) * | 2018-01-02 | 2018-06-19 | 华南理工大学 | 一种基于多个图片尺寸的生成对抗网络的超分辨率复原方法 |
CN108650542A (zh) * | 2018-05-09 | 2018-10-12 | 腾讯科技(深圳)有限公司 | 生成竖屏视频流、图像处理的方法、电子设备和视频系统 |
CN109089157A (zh) * | 2018-06-15 | 2018-12-25 | 广州华多网络科技有限公司 | 视频画面的裁剪方法、显示设备以及装置 |
CN110070124A (zh) * | 2019-04-15 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 一种基于生成式对抗网络的图像扩增方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6476631B2 (ja) * | 2013-09-19 | 2019-03-06 | 株式会社リコー | 情報処理装置、データ表示方法、プログラム |
-
2019
- 2019-12-16 CN CN201911293119.1A patent/CN111047508B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104679466A (zh) * | 2013-11-29 | 2015-06-03 | 腾讯科技(深圳)有限公司 | 一种图像显示方法、装置及电子设备 |
CN105554549A (zh) * | 2015-12-03 | 2016-05-04 | 青岛海信移动通信技术股份有限公司 | 一种VoLTE网络视频显示方法及装置 |
CN106530232A (zh) * | 2016-11-10 | 2017-03-22 | 河北工业大学 | 一种图像缩放方法 |
CN108182669A (zh) * | 2018-01-02 | 2018-06-19 | 华南理工大学 | 一种基于多个图片尺寸的生成对抗网络的超分辨率复原方法 |
CN108650542A (zh) * | 2018-05-09 | 2018-10-12 | 腾讯科技(深圳)有限公司 | 生成竖屏视频流、图像处理的方法、电子设备和视频系统 |
CN109089157A (zh) * | 2018-06-15 | 2018-12-25 | 广州华多网络科技有限公司 | 视频画面的裁剪方法、显示设备以及装置 |
CN110070124A (zh) * | 2019-04-15 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 一种基于生成式对抗网络的图像扩增方法及系统 |
Non-Patent Citations (1)
Title |
---|
胡敏 等.基于生成式对抗网络的裂缝图像修复方法.计算机应用与软件.2019,第36卷(第06期),摘要,第0-3节. * |
Also Published As
Publication number | Publication date |
---|---|
CN111047508A (zh) | 2020-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111047508B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
KR102635987B1 (ko) | 이미지 시맨틱 세그멘테이션 네트워크를 트레이닝하기 위한 방법, 장치, 디바이스 및 저장 매체 | |
CN111221981B (zh) | 知识图谱嵌入模型的训练方法、装置和计算机存储介质 | |
CN107886082B (zh) | 图像中数学公式检测方法、装置、计算机设备及存储介质 | |
CN112183296B (zh) | 模拟票据图像生成、票据图像识别方法和装置 | |
JPWO2020240809A1 (ja) | 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム | |
CN110377218B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN113536856A (zh) | 图像识别方法和系统、数据处理方法 | |
KR20180117619A (ko) | 컴퓨팅 장치를 이용한 객체 관리 및 시각화 | |
CN112667910B (zh) | 一种视频模板合成和推荐系统、方法、装置及存储介质 | |
CN117332766A (zh) | 流程图生成方法、装置、计算机设备和存储介质 | |
CN117037244A (zh) | 人脸安全检测方法、装置、计算机设备和存储介质 | |
CN113297308B (zh) | 表格结构化信息提取方法、装置及电子设备 | |
CN116612474B (zh) | 对象检测方法、装置、计算机设备及计算机可读存储介质 | |
CN114510592A (zh) | 图像分类方法、装置、电子设备及存储介质 | |
CN111754518A (zh) | 图像集合的扩充方法、装置及电子设备 | |
CN116049009A (zh) | 测试方法、装置、计算机设备及计算机可读存储介质 | |
CN115880249B (zh) | 基于图像的对象分割方法、装置、设备和介质 | |
CN114067063A (zh) | 生成场景地图的方法、系统、电子装置和存储介质 | |
CN116861123A (zh) | 网页生成方法、装置、计算机设备和存储介质 | |
CN117238017A (zh) | 人脸识别方法、装置、计算机设备和存储介质 | |
CN115984092A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN118585339A (zh) | 文件渲染方法、装置、计算机设备、存储介质和计算机程序产品 | |
CN116994276A (zh) | 表格识别方法、装置和计算机设备 | |
CN118332214A (zh) | 页面异常处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |