CN110163237A - 模型训练及图像处理方法、装置、介质、电子设备 - Google Patents
模型训练及图像处理方法、装置、介质、电子设备 Download PDFInfo
- Publication number
- CN110163237A CN110163237A CN201811325357.1A CN201811325357A CN110163237A CN 110163237 A CN110163237 A CN 110163237A CN 201811325357 A CN201811325357 A CN 201811325357A CN 110163237 A CN110163237 A CN 110163237A
- Authority
- CN
- China
- Prior art keywords
- image
- clarity
- training
- channel
- restoration model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 129
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims description 40
- 238000011084 recovery Methods 0.000 claims description 36
- 230000003321 amplification Effects 0.000 claims description 31
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 31
- 239000011248 coating agent Substances 0.000 claims description 19
- 238000000576 coating method Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 26
- 230000000694 effects Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 7
- 230000006854 communication Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Processing (AREA)
Abstract
本发明涉及计算机技术领域,提供了一种模型训练及图像处理方法、装置、计算机可读介质及电子设备,该模型训练方法包括:获取具有第一清晰度的多个原始图像;根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,所述训练图像具有第二清晰度,且所述第二清晰度低于所述第一清晰度;根据所述原始图像和对应的训练图像对清晰度恢复模型进行训练。图像处理方法为基于上述训练方法训练的模型对待处理图像进行处理,生成目标图像。本发明一方面能够通过一个模型对不同清晰度、分辨率的图像进行处理,提升清晰度、分辨率;另一方面能够进一步提升用户体验。
Description
技术领域
本发明涉及计算机领域,特别涉及一种模型训练及图像处理方法、模型训练及图像处理装置、计算机可读存储介质及电子设备。
背景技术
随着科学技术的发展,为了提高观感,人们对视频、图像的画面质量的要求越来越高,以视频为例,清晰度通常设置有标清、高清、超高清选项,其中超高清视频因其优质的画面质量得到越来越多的关注。在电子成像应用中,具有较高清晰度的图像更合乎需要。具有较高清晰度的图像具有更大的像素密度,且因此示出比同一场景的较低清晰度图像的更多细节。较高清晰度图像具有许多应用,例如包括医疗成像、卫星成像、计算机视觉、视频监视、面部识别、汽车车牌号码提取与识别以及将数字通用盘视频转换为高密度电视等。
在恢复图像、视频的清晰度时,通常采用模型对低清晰度的图像、视频进行处理,以获得高清晰度的图像、视频,但是现有的模型只能处理一种清晰度(放大倍数)的图像,无法通过一个模型对不同放大倍数的图像进行清晰度恢复,并且模型对图像中的噪声敏感,经模型处理后的图像中的噪声更严重;另外在处理之前,需要预知待处理图像的清晰度(放大倍数),否则会导致清晰度提升效果微弱。
鉴于此,本领域亟需开发一种新的模型训练及图像处理方法。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的目的在于提供一种模型训练及图像处理方法、模型训练及图像处理装置、计算机可读存储介质及电子设备,能够提高视频、图像的清晰度及有效分辨率。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的一个方面,提供一种清晰度恢复模型的训练方法,其特征在于,包括:获取具有第一清晰度的多个原始图像;根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,所述训练图像具有第二清晰度,且所述第二清晰度低于所述第一清晰度;根据所述原始图像和对应的训练图像对清晰度恢复模型进行训练。
根据本发明实施例的一个方面,提供了一种清晰度恢复模型的训练装置,其特征在于,包括:图像获取模块,用于获取具有第一清晰度的多个原始图像;图像处理模块,用于根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,所述训练图像具有第二清晰度,且所述第二清晰度低于所述第一清晰度;模型训练模块,用于根据所述原始图像和对应的训练图像输入对清晰度恢复模型进行训练。
在本发明的一些实施例,所述多个原始图像具有第一分辨率,基于前述方案,所述图像处理模块包括:图像缩小单元,用于将具有第一分辨率的所述原始图像按照所述随机缩小倍数缩小,以获得第二分辨率图像,其中所述第二分辨率低于所述第一分辨率;第一图像放大单元,用于将所述第二分辨率图像按照一放大倍数放大,以获得一插值放大图像,所述放大倍数与所述随机缩小倍数相同;噪声添加单元,用于向所述插值放大图像中添加所述随机噪声强度,以获得所述训练图像。
在本发明的一些实施例,所述清晰度恢复模型包括输出卷积层和一个或多个清晰度恢复模块,基于前述方案,所述模型训练模块包括:图像处理单元,用于将所述训练图像作为输入图像输入至所述清晰度恢复模型,依次经过所述清晰度恢复模块和所述输出卷积层处理,以输出与所述训练图像对应的原始图像。
在本发明的一些实施例,所述清晰度恢复模块包括第一卷积层、第二卷积层、第三卷积层、拼接层、第一激活层和第二激活层;当所述清晰度恢复模型包括多个所述清晰度恢复模块时,多个所述清晰度恢复模块依次连接;基于前述方案,所述图像处理单元包括:特征图像生成单元,用于通过各所述清晰度恢复模块中的所述第一卷积层和所述第二卷积层对接收到的输入图像进行特征提取,以分别生成第一特征图像和第二特征图像;拼接单元,用于通过所述拼接层将所述第一特征图像和所述第二特征图像进行拼接,以获得拼接图像;输出图像生成单元,用于通过所述第一激活层、所述第三卷积层和所述第二激活层依次对所述拼接图像进行处理,以生成一输出图像,所述输出图像为下一级清晰度恢复模块或所述输出卷积层的输入图像,且所述训练图像为第一级清晰度恢复模块的输入图像。
在本发明的一些实施例,基于前述方案,所述第一特征图像和所述第二特征图像具有相同的宽和高。
在本发明的一些实施例,基于前述方案,所述拼接单元包括:通道拼接单元,用于通过所述拼接层将所述第一特征图像和所述第二特征图像在通道的维度上进行拼接,以获得所述拼接图像。
根据本发明实施例的一个方面,提供了一种图像处理方法,其特征在于,包括:获取待处理图像;将所述待处理图像输入至根据上述的清晰度恢复模型的训练方法训练的清晰度恢复模型,以获取与所述待处理图像对应的目标图像。
根据本发明实施例的一个方面,提供了一种图像处理装置,其特征在于,包括:待处理图像获取模块,用于获取待处理图像;目标图像获取模块,用于将所述待处理图像输入至根据上述的清晰度恢复模型的训练方法训练的清晰度恢复模型,以获取与所述待处理图像对应的目标图像。
在本发明的一些实施例,所述待处理图像的图像格式为RGB格式,基于前述方案,所述目标图像获取模块包括:格式转换单元,用于将所述待处理图像的图像格式由RGB格式转换为YUV格式,所述YUV格式的待处理图像包括Y通道图像、U通道图像和V通道图像;Y通道图像处理单元,用于将所述Y通道图像输入至所述清晰度恢复模型,以获取Y通道恢复图像;目标图像生成单元,用于根据所述Y通道恢复图像、所述U通道图像和所述V通道图像获取所述目标图像。
在本发明的一些实施例,基于前述方案,所述目标图像生成单元包括:第一图像色彩空间转换单元,用于将所述Y通道恢复图像、所述U通道图像和所述V通道图像转换到RGB色彩空间下,以获取所述目标图像,所述目标图像的清晰度高于所述待处理图像的清晰度。
在本发明的一些实施例,基于前述方案,所述Y通道图像处理单元包括:预处理单元,用于将所述Y通道图像输入至所述清晰度恢复模型,以提升所述Y通道图像的分辨率,得到预处理Y通道图像;第二图像放大单元,用于对所述预处理Y通道图像进行第一插值运算,以获得Y通道放大图像;分辨率提升单元,用于将所述Y通道放大图像输入至所述清晰度恢复模型,以获得所述Y通道恢复图像,所述Y通道恢复图像的有效分辨率大于所述Y通道图像的有效分辨率。
在本发明的一些实施例,基于前述方案,所述目标图像生成单元包括:第三图像放大单元,用于将所述U通道图像和所述V通道图像分别进行第二插值运算,以获得U通道放大图像和V通道放大图像,其中所述第二插值运算与所述第一插值运算相同;第二图像色彩空间转换单元,用于将所述Y通道恢复图像、所述U通道放大图像和所述V通道放大图像转换到RGB色彩空间下,以获取所述目标图像,所述目标图像的有效分辨率高于所述待处理图像的有效分辨率。
根据本发明实施例的一方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的清晰度恢复模型的训练方法和图像处理方法。
根据本发明实施例的一方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的清晰度恢复模型的训练方法和图像处理方法。
由上述技术方案可知,本发明示例性实施例中的清晰度恢复模型的训练方法和图像处理方法及装置、计算机可读存储介质、电子设备至少具备以下优点和积极效果:
本发明通过根据随机数产生器生成的随机缩小倍数和随机噪声强度将具有高分辨率、高清晰度的图像转换为低分辨率、低清晰度的图像,进而由低清晰度图像和高清晰度图像构成训练集;然后将训练集输入一清晰度恢复模型以对其进行训练,获得稳定的清晰度恢复模型;最后采用训练好的清晰度恢复模型将低清晰度的图像转换为高清晰度的图像,将低分辨率的图像进行超分辨率,进而获得高分辨率的图像。本发明中一方面能够通过一个模型对不同清晰度、分辨率的图像进行处理,生成高清晰度、高分辨率的图像;另一方面能够提高清晰度的提升效果,进一步提升用户体验。
本发明应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本发明实施例的模型训练及图像处理方法及装置的示例性系统架构的示意图;
图2示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图;
图3示意性示出了根据本发明的一实施例的清晰度恢复模型的训练方法的流程示意图;
图4示意性示出了根据本发明的一实施例的生成训练图像的流程示意图;
图5示意性示出了根据本发明的一实施例的清晰度恢复模型的结构示意图;
图6示意性示出了根据本发明的一实施例的清晰度恢复模块的结构示意图;
图7示意性示出了根据本发明的一实施例的图像处理方法的流程示意图;
图8示意性示出了根据本发明的一实施例的采用清晰度恢复模型提升清晰度的流程示意图;
图9示意性示出了根据本发明的一实施例的采用清晰度恢复模型进行超分辨率处理的流程示意图;
图10示意性示出了根据本发明的一实施例的清晰度恢复模型处理后的图像与采用传统方法处理后的图像的效果对比图;
图11示意性示出了根据本发明的一实施例的清晰度恢复模型处理后的图像与采用传统方法处理后的图像的效果对比图
图12示意性示出了根据本发明的一实施例的清晰度恢复模型的训练装置的框图;
图13示意性示出了根据本发明的一实施例的图像处理装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本发明实施例的模型训练及图像处理方法、模型训练及图像处理装置的示例性系统架构100的示意图。
如图1所示,系统架构100可以包括终端设备101、网络102和服务器103。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的终端设备101、网络102和服务器103的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备或服务器。比如服务器103可以单独设置,也可以集成在一起。
用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送信息等。终端设备101可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。
服务器103可以是提供各种服务的代理服务器。例如服务器103可以接收用户输入至终端设备101中的图像或视频,该图像或视频可以具有任意的清晰度和分辨率。视频可以看作是一系列的图像帧,对于接收到的图像或视频,服务器103会对其清晰度、分辨率进行判断,对于清晰度低于预设值或有效分辨率低于实际分辨率的图像通过清晰度恢复模型进行清晰度恢复或超分辨率处理。该清晰度恢复模型所采用的训练样本包括多种清晰度、分辨率的图像,因此该清晰度恢复模型可以对不同清晰度、分辨率的图像进行处理,其中训练样本的生成方法是采用随机数产生器生成随机缩小倍数和随机噪声强度,通过对高清晰度的图像按照随机缩小倍数进行缩小,然后按照相同的倍数进行放大生成放大图像;接着将随机噪声强度添加到放大图像中以生成低清晰度的图像,进而由该低清晰度图像与高清晰度图像构成训练样本。本发明实现了通过一个模型处理不同清晰度、低分辨率的图像,实用性强,能够取得有效的清晰度提升效果,进而提高用户体验。
图2示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。
特别地,根据本发明的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本发明的系统中限定的各种功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。例如,所述的电子设备可以实现如图3至图11所示的各个步骤。
在本领域的相关技术中,通常采用卷积超分辨率网络SRCNN或残差超分辨率网络SRResNet等,以卷积超分辨率网络为例,其本身是一种超分辨率模型,能够对固定放大倍数的图片进行超分辨率处理。例如,当需要卷积超分辨率网络进行2倍超分辨率时,需要先把待超分辨率的图像进行2倍三次插值,然后训练一个处理2倍三次插值的卷积超分辨率网络模型,把插值后的结果输入到2倍超分辨率卷积超分辨率网络模型中,得到超分辨率后的结果。在训练的过程中,利用已有的高分辨率图像进行人工降采样,得到固定倍数的低分辨率图像,然后把低分辨率图像进行插值,得到三次插值后的超分辨率图像,通过训练三次插值后的超分辨率图像到高分辨率图像的映射关系,得到超分辨率模型。因此一个卷积超分辨率网络模型只能处理一种放大倍数的图片。
相应地,相关技术中通过深度学习网络模型提升清晰度的方法存在以下问题:(1)需要预先知道待处理图像清晰度(即放大倍数),否则会导致清晰度提升效果微弱;(2)模型对图片中存在的噪声敏感,会增强图像中的噪声;(3)一个模型只能处理一种清晰度(即放大倍数)的图片,对于不同的放大倍数的图片,需要准备不同的模型(即,2倍的模型只能处理经过2倍放大的图片,且图片放大前有效分辨率与实际分辨率相同)。之所以会存在上述问题,是因为模型学到的映射与实际使用时所需的映射是不同的,导致模型考虑不到实际使用中会遇到的各种情况,表1示出了实际使用与传统训练集构造时模型的输入输出的区别,如下所示:
表1
由于训练集中输入的低分辨率图像是具有已知放缩倍数或模糊程度的,而实际使用时,用户输入的图像的放缩倍数或模糊程度是不可知的,因此模型无法对图像进行处理,以提高其清晰度。通常导致图像模糊程度不可知的原因有很多,以老电影、动画画质提升的应用为例,图像模糊程度不可知的原因主要有以下几点:(1)储存、传输过程中存在的图像放缩,由于年代久远已无法得到放缩倍数(即模糊程度);(2)胶片成像的实际分辨率较低,在转为数字格式时扫描的分辨率高导致数字格式的视频存在模糊;(3)图像成像器材质量差,或拍摄水平有限,导致程度不可知的模糊。
另外,对于训练集中的低分辨率图像来说,在降采样的时候需要对图片进行均值滤波,所以会大大降低噪声强度,噪声强度会变为原先高分辨率图像噪声强度的1/(N2),其中N是缩放倍数。但是模型会学习到“减少噪声的逆向过程”,即增强噪声,导致模型对噪声非常敏感。同时,对于用户输入的待超分辨率的低分辨率图像而言,由于暗环境、手机摄像头感光度较高,往往会导致图像中存在着各种强度不同的随机噪声。
基于相关技术中存在的问题,在本发明的一个实施例中提出了一种模型训练及图像处理方法,以对上述问题进行优化处理。
本发明实施例中的图像处理方法基于训练得到的清晰度恢复模型,因此本发明实施例首先对清晰度恢复模型的训练方法进行说明,具体参照图3所示,该清晰度恢复模型的训练方法可由服务器执行,至少包括以下步骤:
步骤S310:获取具有第一清晰度的多个原始图像;
步骤S320:根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,所述训练图像具有第二清晰度,且所述第二清晰度低于所述第一清晰度;
步骤S330:根据所述原始图像和对应的训练图像对清晰度恢复模型进行训练。
本发明实施例中通过将高清晰度、高分辨率的图像(高质量图像)根据随机缩小倍数和随机噪声强度转换为低清晰度、低分辨率的图像(低质量图像),然后将低质量图像和高质量图像组成的训练集输入清晰度恢复模型对其进行训练。本发明实施例中清晰度恢复模型采用的训练集是对高质量图像根据随机缩小倍数和随机噪声强度进行的处理,因此训练得到的清晰度恢复模型可以用于对不同清晰度的图像进行处理,实用性强,便于使用;另外也可以取得有效地清晰度提升效果,获得清晰度、分辨率高的图像,进一步提高用户体验。
为了使本发明的技术方案更清晰,接下来对清晰度恢复模型的训练方法的各步骤进行说明。
在步骤S310中,获取具有第一清晰度的多个原始图像。
在本发明的示例性实施例中,服务器103可以通过具有图像采集功能的终端设备101获取具有第一清晰度的多个原始图像,该具有图像采集功能的终端设备101具体的可以是摄像机、照相机、具有摄像头的装置等等,本发明实施例对此不做具体限定。该第一清晰度的多个原始图像为具有高清晰度的图像,即图像达到或接近在当前图像实际分辨率下最高的清晰度,其中图像实际分辨率指图像的分辨率,其只与图像的宽和高有关,与图像的内容无关。
在步骤S320中,根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,所述训练图像具有第二清晰度,且所述第二清晰度低于所述第一清晰度。
在本发明的示例性实施例中,为了使训练后的清晰度恢复模型能够适应并恢复不同清晰度的图像,可以对步骤S310中获取的具有第一清晰度的多个原始图像进行不同程度的缩放形成低分辨率的图像,并添加不同的噪声强度,使图像的清晰度降低。在本发明实施例中,可以通过随机数产生器生成不同的随机缩小倍数和随机噪声强度,根据该随机缩小倍数和随机噪声强度将高清晰度图像转换为低清晰度图像。该随机数产生器可以是真随机数产生器,也可以是伪随机数产生器,当然也可以是其它本领域常用的随机数产生器,以伪随机数产生器为例,通过向该伪随机数产生器中输入一个随机数种子,即可得到对应的数据序列,该数据序列中的数据可作为随机缩小倍数和随机噪声强度。
在本发明的示例性实施例中,图4示出了生成训练图像的流程示意图,如图4所示,在步骤S401中,将具有第一分辨率的所述原始图像按照所述随机缩小倍数缩小,以获得第二分辨率图像,其中第二分辨率低于第一分辨率;在步骤S402中,将所述第二分辨率图像按照一放大倍数放大,以获得一插值放大图像,所述放大倍数与所述随机缩小倍数相同;在步骤S403中,向所述插值放大图像中添加所述随机噪声强度,以获得所述训练图像。步骤S401中所采用的随机缩小倍数可以是服从某一数值区间上均匀分布的数值,该数值区间可以是大于等于1的数值构成的区间,也可以是由小于1和大于1的数值构成的数值区间,当图像按照随机缩小倍数缩小后再放大相同倍数,会导致略微的模糊,因此为了提高模型的效果,本发明中该小于1的数值最小可达到0.9,即放大了约1.11倍。具体地,在本发明实施例中,该随机缩小倍数可以是服从[0.9,3]区间均匀分布的数值,也可以是其它的数值区间,本发明对此不做具体限定。随机噪声强度可以是随机数产生器随机生成的一个服从某一数值区间均匀分布的高斯噪声标准差,具体地,该数值区间可以是[0,3],也可以是其它数值,本发明实施例对此不作具体限定。获取高斯噪声标准差后,可以将其添加到步骤S402获得的放大图像中,以得到具有第二清晰度的训练图像。另外,本发明实施例中将原始图像按照随机缩小倍数进行缩小可以采用使用像素区域关系进行重采样(Inter-Area)法,将低分辨率图像按照放大倍数进行放大可以采用双三次插值(Inter-Cubic)法,也就是说该放大图像也是一插值放大图像。当然本发明实施例中对图像进行缩放所采用的插值方法还可以是其它插值法,本发明实施例在此不再赘述。
值得注意的是,本发明实施例中的训练图像所具有的第二清晰度低于原始图像所具有的第一清晰度,这样由两种不同清晰度图像组成的训练集可以对清晰度恢复模型进行有效的训练。进一步的,由于随机缩小倍数和随机噪声强度可以有多个,因此对应同一原始图像,可能存在多个与之对应的训练图像,这就使得训练集的图像信息更丰富,训练生成的清晰度恢复模型具有更强的实用性和适用性。
在步骤S330中,根据所述原始图像和对应的训练图像对清晰度恢复模型进行训练。
在本发明的示例性实施例中,由于该清晰度恢复模型是将低分辨率、低清晰度的图像转变为高分辨率、高清晰度的图像,因此可以将训练图像作为输入向量输入至清晰度恢复模型,通过不断调整模型参数和超参数,使经清晰度恢复模型处理后输出的图像和与训练图像对应的原始图像相似或一致,以实现对清晰度恢复模型的训练。
在本发明的示例性实施例中,图5示出了清晰度恢复模型的结构示意图,如图5所示,清晰度恢复模型500可以包括一清晰度恢复模块组501和一输出卷积层502,该清晰度恢复模块组501可以包括多个结构相同且依次连接的清晰度恢复模块501-i(0<i≤N,N为正数),如图5所示,清晰度恢复模型500包括4个清晰度恢复模块501-1、501-2、501-3和501-4,训练图像被输入至清晰度恢复模型,经过该清晰度恢复模块组501和输出卷积层502处理得到与该训练图像对应的原始图像,以对清晰度恢复模型进行训练。同时,图6示出了清晰度恢复模块的结构示意图,如图6所示,清晰度恢复模块501-i包括第一卷积层601、第二卷积层602、拼接层603、第一激活层604、第三卷积层605和第二激活层606,其中,第一卷积层601和第二卷积层602同时对接收到的输入图像进行特征提取,分别生成第一特征图像和第二特征图像;拼接层将第一特征图像和第二特征图像进行拼接,形成拼接图像,具体地,拼接层在通道的维度上将第一特征图像和第二特征图像进行拼接,其中该第一特征图像和该第二特征图像具有相同的宽和高,拼接后的图像宽高不变,通道数为第一特征图像和第二特征图像的通道之和;接着第一激活层604、第三卷积层605和第二激活层606依次对拼接图像进行处理,生成一输出图像,该输出图像即为下一级清晰度恢复模块/输出卷积层的输入图像,另外需要说明的是,第一级清晰度恢复模块的输入图像为获取的训练图像。值得注意的是,清晰度恢复模型500中也可以只包含一个清晰度恢复模块和输出卷积层,该清晰度恢复模型的工作流程与上述实施例中的图像处理流程相同,因此本发明在此不再赘述。
在本发明的示例性实施例中,清晰度恢复模块的结构与squeezeNet的结构类似,在保证网络性能的情况下,大大提高了计算速度。表2示出了清晰度恢复模块的具体参数设置,如表2所示:
模块说明 | 卷积核大小 | 输出通道数 | Padding | 步长 |
第一卷积层 | 3x3 | 24 | 1 | 1 |
第二卷积层 | 1x1 | 24 | 0 | 1 |
第三卷积层 | 1x1 | 8 | 0 | 1 |
第一激活层 | - | 48 | - | - |
第二激活层 | - | 48 | - | - |
输出卷积层 | 3x3 | 1 | 1 | 1 |
表2
其中,为了保证第一卷积层生成的第一特征图像和第二卷积层生成的第二特征图像生成的第二特征图像具有相同的宽和高,可以在第一卷积层对输入图像进行卷积操作时,对输入图像进行扩充。
值得说明的是,清晰度恢复模块的结构还可以参照其它的神经网络模型,对其内部的结构进行改进,如只设置卷积层和激活层对输入图像进行处理等等,本发明实施例对此不再赘述。
接下来,对本发明中的图像处理方法进行解释说明,具体参照图7所示,该图像处理方法可由服务器执行,至少包括以下步骤:
步骤S710:获取待处理图像;
步骤S720:将所述待处理图像输入至根据本发明实施例所述的清晰度恢复模型的训练方法训练的清晰度恢复模型,以获取与所述待处理图像对应的目标图像。
本发明实施例中通过采用训练后的清晰度恢复模型对待处理图像进行处理,获得对应的目标图像,提高了图像清晰度的提升效果,并且能够对老电影、动画想超分辨率处理,获得有效分辨率更高的视频。
为了使本发明的技术方案更清晰,接下来对图像处理方法的各步骤进行说明。
在步骤S710中,获取待处理图像。
在本发明的示例性实施例中,可以通过图像采集设备获得待处理图像,该待处理图像具有低分辨率、低清晰度;同时还可以将待恢复清晰度、分辨率的老电影、动画等作为待处理图像,通过训练好的清晰度恢复模型对待处理图像进行处理,以恢复其清晰度、分辨率。
在步骤S720中,将所述待处理图像输入至根据本发明实施例所述的清晰度恢复模型的训练方法训练的清晰度恢复模型,以获取与所述待处理图像对应的目标图像。
在本发明的示例性实施例中,将待处理图像输入至训练好的清晰度恢复模型,以对待处理图像进行处理,生成目标图像。图像的清晰度和分辨率是相互关联的,清晰度是分辨率和锐度的结合,其中锐度是指黑白色调的边界的锋利或锐利程度,即黑白边界处的对比度;分辨率描述的是对空间细节分辨的能力,例如相机或镜头能把相邻非常近的线条分开,则说明相机或镜头分辨率高。如果一幅图像有高的分辨率和高的锐度,那么这幅图像就具有高清晰度,分辨率和锐度任何一个不够高,那图像的清晰度都不够高。通过本发明实施例中的清晰度恢复模型,可以对图像的分辨率、清晰度进行提升。
图8示出了采用清晰度恢复模型提升清晰度的流程示意图,如图8所示,在步骤S801中,将待处理图像的图像格式由RGB格式转换为YUV格式,所述YUV格式的待处理图像包括Y通道图像、U通道图像和V通道图像;通常看到的图像格式为RGB格式,而视频、图像中所有清晰度上的细节都保存在其Y通道上,所有将RGB格式转换为YUV格式,只对Y通道图像进行处理,可以减少信息处理量,提高处理效率;在步骤S802中,将所述Y通道图像输入至所述清晰度恢复模型,以获取Y通道恢复图像;清晰度恢复模型对Y通道图像进行处理,对其中的清晰度细节进行恢复,形成清晰度提升的Y通道恢复图像;在步骤S803中,根据所述Y通道恢复图像、所述U通道图像和所述V通道图像获取所述目标图像;由于U通道图像和V通道图像中几乎不存在清晰度的细节,因此可以对U通道图像和V通道图像不做任何处理,仅将Y通道恢复图像、U通道图像和V通道图像直接转换到RGB色彩空间下,即可获得清晰度提升的图像、视频。由于无需对U、V通道图像进行处理,因此进一步提高了清晰度恢复模型的处理效率。
在本发明的示例性实施例中,超分辨率是通过硬件或软件的方法提高原有图像的分辨率,使低分辨率图像的有效分辨率达到或逼近图像的实际分辨率。图9示出了采用清晰度恢复模型进行超分辨率处理的流程示意图,如图9所示,在步骤S901中,将待处理图像的图像格式由RGB格式转换为YUV格式,所述YUV格式的待处理图像包括Y通道图像、U通道图像和V通道图像;对图像进行格式转换的理由同步骤S801中的解释,此处不再赘述;在步骤S902中,将所述Y通道图像输入至所述清晰度恢复模型,以提升所述Y通道图像的分辨率,得到预处理Y通道图像;该步骤中,主要是通过清晰度恢复模型去除原始分辨率下Y通道存在的模糊,提高Y通道图像的清晰度,并且由于U、V通道中存在的细节和高频纹理极少,所以也仅需对Y通道进行处理;在步骤S903中,对所述预处理Y通道图像进行第一插值运算,以获得Y通道放大图像;通过对Y通道图像进行插值运算,可以将Y通道图像放大;在步骤S904中,将所述Y通道放大图像输入至所述清晰度恢复模型,以获得所述Y通道恢复图像,所述Y通道恢复图像的有效分辨率大于所述Y通道图像的有效分辨率;该步骤中,通过清晰度恢复模型处理Y通道放大图像可以去除放大导致的模糊,得到超分辨率后的图像;在步骤S905中,将所述U通道图像和所述V通道图像分别进行第二插值运算,以获得U通道放大图像和V通道放大图像,其中所述第二插值运算与所述第一插值运算相同;由于对Y通道图像进行了放大操作,为了保证图像信息的完整,所以也需要对U通道图像和V通道图像进行插值运算,并且第一插值运算和第二插值运算采用的插值法相同,对应的参数也相同,这样可以保证Y、U、V通道图像的信息量一致;在步骤S906中,将所述Y通道恢复图像、所述U通道放大图像和所述V通道放大图像转换到RGB色彩空间下,以获取所述目标图像,所述目标图像的有效分辨率高于所述待处理图像的有效分辨率。
虽然上述实施例是对图像的清晰度、分辨率进行恢复提升,但是视频可以看作是一系列连续的图像帧,所以基于上述方法,可以对视频进行处理,提升其清晰度、分辨率,在处理视频时,可以逐一输入各个图像帧,通过清晰度恢复模型对每一图像帧进行处理,进而获得清晰度、分辨率提升的视频。
图10示出了清晰度恢复模型处理后的图像与采用传统方法处理后的图像的效果对比图,如图10所示,左侧的图像为采用本发明实施例中的清晰度恢复模型提升清晰度的图像,中间的图像为采用卷积超分辨率网络提升清晰度后的图像,右侧的图像为采用Lanczos插值法提升清晰度后的图像,通过对比发现,左侧图像的清晰度远远高于中间图像和右侧图像的清晰度,也就是说,本发明实施例中的清晰度恢复模型能够有效提升图像、视频的清晰度。
图11示出了清晰度恢复模型处理后的图像与采用传统方法处理后的图像的效果对比图,如图11所示,左侧为采用本发明实施例中的清晰度恢复模型提升分辨率的图像,右侧为采用传统方法提升分辨率后的图像,通过对比发现,左侧的图像的画面质量优于右侧图像的画面质量,也就是说,本发明实施例中的清晰度恢复模型能够有效提升图像、视频的分辨率。
本发明实施例中的清晰度恢复模型通过多组由低清晰度图像和高清晰度图像组成的训练样本训练而成,该低清晰度图像是由高清晰度图像根据随机缩小倍数和随机噪声强度生成的,因此该清晰度恢复模型可以适用于不同清晰度的图像,并且无需获知视频、图像是否存在放缩,即可通过清晰度恢复模型获得有效的清晰度、分辨率提升效果,进一步提升用户体验。
以下介绍本发明的装置实施例,可以用于执行本发明上述的模型训练及图像处理方法。对于本发明装置实施例中未披露的细节,请参照本发明上述的模型训练及图像处理方法的实施例。
图12示意性示出了根据本发明的一个实施例的清晰度恢复模型的训练装置的框图。
参照图12所示,根据本发明的一个实施例的清晰度恢复模型的训练装置1200,包括:图像获取模块1201、图像处理模块1202和模型训练模块1203。
具体地,图像获取模块1201,用于获取具有第一清晰度的多个原始图像;图像处理模块1202,用于根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,所述训练图像具有第二清晰度,且所述第二清晰度低于所述第一清晰度;模型训练模块1203,用于根据所述原始图像和对应的训练图像对清晰度恢复模型进行训练。
在本发明的一个实施例中,所述多个原始图像具有第一分辨率;图像处理模块1202包括图像缩小单元、第一图像放大单元和噪声添加单元。
具体地,图像缩小单元,用于将具有第一分辨率的所述原始图像按照所述随机缩小倍数缩小,以获得第二分辨率图像;第一图像放大单元,用于将所述第二分辨率图像按照一放大倍数放大,以获得一插值放大图像,所述放大倍数与所述随机缩小倍数相同;噪声添加单元,用于向所述插值放大图像中添加所述随机噪声强度,以获得所述训练图像。
在本发明的一个实施例中,所述清晰度恢复模型包括输出卷积层和一个或多个清晰度恢复模块;所述模型训练模块1203包括:图像处理单元,用于将所述训练图像作为输入图像输入至所述清晰度恢复模型,依次经过所述清晰度恢复模块和所述输出卷积层处理,以输出与所述训练图像对应的原始图像。
在本发明的一个实施例中,所述清晰度恢复模块包括第一卷积层、第二卷积层、第三卷积层、拼接层、第一激活层和第二激活层;当所述清晰度恢复模型包括多个所述清晰度恢复模块时,多个所述清晰度恢复模块依次连接;所述图像处理单元包括特征图像生成单元、拼接单元和输出图像生成单元。
具体地,特征图像生成单元,用于通过各所述清晰度恢复模块中的所述第一卷积层和所述第二卷积层同时对接收到的输入图像进行特征提取,以分别生成第一特征图像和第二特征图像;拼接单元,用于通过所述拼接层将所述第一特征图像和所述第二特征图像进行拼接,以获得拼接图像;输出图像生成单元,用于通过所述第一激活层、所述第三卷积层和所述第二激活层依次对所述拼接图像进行处理,以生成输出图像,所述输出图像为下一级清晰度恢复模块或所述输出卷积层的输入图像,且所述训练图像为第一级清晰度恢复模块的输入图像。
在本发明的一个实施例中,所述第一特征图像和所述第二特征图像具有相同的宽和高。
在本发明的一个实施例中,所述拼接单元包括:通道拼接单元,用于通过所述拼接层将所述第一特征图像和所述第二特征图像在通道的维度上进行拼接,以获得所述拼接图像。
图13示意性示出了根据本发明的一个实施例的图像处理装置的框图。
参照图13所示,根据本发明的一个实施例的图像处理装置1300,包括:待处理图像获取模块1301和目标图像获取模块1302。
具体地,待处理图像获取模块,用于获取待处理图像;目标图像获取模块,用于将所述待处理图像输入至根据上述的清晰度恢复模型的训练方法训练的清晰度恢复模型,以获取与所述待处理图像对应的目标图像。
在本发明的一个实施例中,所述待处理图像的图像格式为RGB格式;所述目标图像获取模块1302包括格式转换单元、Y通道图像处理单元和目标图像生成单元。
具体地,格式转换单元,用于将所述待处理图像的图像格式由RGB格式转换为YUV格式,所述YUV格式的待处理图像包括Y通道图像、U通道图像和V通道图像;Y通道图像处理单元,用于将所述Y通道图像输入至所述清晰度恢复模型,以获取Y通道恢复图像;目标图像生成单元,用于根据所述Y通道恢复图像、所述U通道图像和所述V通道图像获取所述目标图像。
在本发明的一个实施例中,所述目标图像生成单元包括:第一图像色彩空间转换单元,用于将所述Y通道恢复图像、所述U通道图像和所述V通道图像转换到RGB色彩空间下,以获取所述目标图像,所述目标图像的清晰度高于所述待处理图像的清晰度。
在本发明的一个实施例中,所述Y通道图像处理单元包括预处理单元、第二图像放大单元和分辨率提升单元。
具体地,预处理单元,用于将所述Y通道图像输入至所述清晰度恢复模型,以提升所述Y通道图像的分辨率,得到预处理Y通道图像;第二图像放大单元,用于对所述预处理Y通道图像进行第一插值运算,以获得Y通道放大图像;分辨率提升单元,用于将所述Y通道放大图像输入至所述清晰度恢复模型,以获得所述Y通道恢复图像,所述Y通道恢复图像的有效分辨率大于所述Y通道图像的有效分辨率。
在本发明的一个实施例中,所述目标图像生成单元包括第三图像放大单元和第二图像色彩空间转换单元。
具体地,第三图像放大单元,用于将所述U通道图像和所述V通道图像分别进行第二插值运算,以获得U通道放大图像和V通道放大图像,其中所述第二插值运算与所述第一插值运算相同;第二图像色彩空间转换单元,用于将所述Y通道恢复图像、所述U通道放大图像和所述V通道放大图像转换到RGB色彩空间下,以获取所述目标图像,所述目标图像的有效分辨率高于所述待处理图像的有效分辨率。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (15)
1.一种清晰度恢复模型的训练方法,其特征在于,包括:
获取具有第一清晰度的多个原始图像;
根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,所述训练图像具有第二清晰度,且所述第二清晰度低于所述第一清晰度;
根据所述原始图像和对应的训练图像对清晰度恢复模型进行训练。
2.根据权利要求1所述的清晰度恢复模型的训练方法,其特征在于,所述多个原始图像具有第一分辨率;
根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,包括:
将具有第一分辨率的所述原始图像按照所述随机缩小倍数缩小,以获得第二分辨率图像,其中所述第二分辨率低于所述第一分辨率;
将所述第二分辨率图像按照放大倍数放大,以获得一插值放大图像,所述放大倍数与所述随机缩小倍数相同;
向所述插值放大图像中添加所述随机噪声强度,以获得所述训练图像。
3.根据权利要求1所述的清晰度恢复模型的训练方法,其特征在于,所述清晰度恢复模型包括输出卷积层和一个或多个清晰度恢复模块;
根据所述原始图像和对应的训练图像对清晰度恢复模型进行训练,包括:
将所述训练图像作为输入图像输入至所述清晰度恢复模型,依次经过所述清晰度恢复模块和所述输出卷积层处理,以输出与所述训练图像对应的原始图像。
4.根据权利要求3所述的清晰度恢复模型的训练方法,其特征在于,所述清晰度恢复模块包括第一卷积层、第二卷积层、第三卷积层、拼接层、第一激活层和第二激活层;当所述清晰度恢复模型包括多个所述清晰度恢复模块时,多个所述清晰度恢复模块依次连接;
将所述训练图像作为输入图像输入至所述清晰度恢复模型,依次经过所述清晰度恢复模块和所述输出卷积层处理,以输出与所述训练图像对应的原始图像,包括:
通过各所述清晰度恢复模块中的所述第一卷积层和所述第二卷积层对接收到的输入图像进行特征提取,以分别生成第一特征图像和第二特征图像;
通过所述拼接层将所述第一特征图像和所述第二特征图像进行拼接,以获得拼接图像;
通过所述第一激活层、所述第三卷积层和所述第二激活层依次对所述拼接图像进行处理,以生成输出图像,所述输出图像为下一级清晰度恢复模块或所述输出卷积层的输入图像,且所述训练图像为第一级清晰度恢复模块的输入图像。
5.根据权利要求4所述的清晰度恢复模型的训练方法,其特征在于,所述第一特征图像和所述第二特征图像具有相同的宽和高。
6.根据权利要求4或5所述的清晰度恢复模型的训练方法,其特征在于,通过所述拼接层将所述第一特征图像和所述第二特征图像进行拼接,以获得拼接图像,包括:
通过所述拼接层将所述第一特征图像和所述第二特征图像在通道的维度上进行拼接,以获得所述拼接图像。
7.一种图像处理方法,其特征在于,包括:
获取待处理图像;
将所述待处理图像输入至根据权利要求1-6任一项所述的清晰度恢复模型的训练方法训练的清晰度恢复模型,以获取与所述待处理图像对应的目标图像。
8.根据权利要求7所述的图像处理方法,其特征在于,所述待处理图像的图像格式为RGB格式;
将所述待处理图像输入至根据权利要求1-6任一项所述的清晰度恢复模型的训练方法训练的清晰度恢复模型,以获取与所述待处理图像对应的目标图像,包括:
将所述待处理图像的图像格式由RGB格式转换为YUV格式,所述YUV格式的待处理图像包括Y通道图像、U通道图像和V通道图像;
将所述Y通道图像输入至所述清晰度恢复模型,以获取Y通道恢复图像;
根据所述Y通道恢复图像、所述U通道图像和所述V通道图像获取所述目标图像。
9.根据权利要求8所述的图像处理方法,其特征在于,根据所述Y通道恢复图像、所述U通道图像和所述V通道图像获取所述目标图像,包括:
将所述Y通道恢复图像、所述U通道图像和所述V通道图像转换到RGB色彩空间下,以获取所述目标图像,所述目标图像的清晰度高于所述待处理图像的清晰度。
10.根据权利要求8所述的图像处理方法,其特征在于,将所述Y通道图像输入至所述清晰度恢复模型,以获取Y通道恢复图像,包括:
将所述Y通道图像输入至所述清晰度恢复模型,以提升所述Y通道图像的分辨率,得到预处理Y通道图像;
对所述预处理Y通道图像进行第一插值运算,以获得Y通道放大图像;
将所述Y通道放大图像输入至所述清晰度恢复模型,以获得所述Y通道恢复图像,所述Y通道恢复图像的有效分辨率大于所述Y通道图像的有效分辨率。
11.根据权利要求10所述的图像处理方法,其特征在于,根据所述Y通道恢复图像、所述U通道图像和所述V通道图像获取所述目标图像,包括:
将所述U通道图像和所述V通道图像分别进行第二插值运算,以获得U通道放大图像和V通道放大图像,其中所述第二插值运算与所述第一插值运算相同;
将所述Y通道恢复图像、所述U通道放大图像和所述V通道放大图像转换到RGB颜色空间下,以获取所述目标图像,所述目标图像的有效分辨率高于所述待处理图像的有效分辨率。
12.一种清晰度恢复模型的训练装置,其特征在于,包括:
图像获取模块,用于获取具有第一清晰度的多个原始图像;
图像处理模块,用于根据随机数产生器生成的随机缩小倍数和随机噪声强度对所述原始图像进行处理,以得到与所述原始图像对应的训练图像,所述训练图像具有第二清晰度,且所述第二清晰度低于所述第一清晰度;
模型训练模块,用于将所述原始图像和对应的训练图像输入至所述清晰度恢复模型,以对所述清晰度恢复模型进行训练。
13.一种图像处理装置,其特征在于,包括:
待处理图像获取模块,用于获取待处理图像;
目标图像获取模块,用于将所述待处理图像输入至根据权利要求1-6任一项所述的清晰度恢复模型的训练方法训练的清晰度恢复模型,以获取与所述待处理图像对应的目标图像。
14.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~6中任意一项所述的清晰度恢复模型的训练方法和权利要求7~11中任意一项所述的图像处理方法。
15.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~6中任意一项所述的清晰度恢复模型的训练方法和权利要求7~11中任意一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811325357.1A CN110163237B (zh) | 2018-11-08 | 2018-11-08 | 模型训练及图像处理方法、装置、介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811325357.1A CN110163237B (zh) | 2018-11-08 | 2018-11-08 | 模型训练及图像处理方法、装置、介质、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110163237A true CN110163237A (zh) | 2019-08-23 |
CN110163237B CN110163237B (zh) | 2023-03-14 |
Family
ID=67645211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811325357.1A Active CN110163237B (zh) | 2018-11-08 | 2018-11-08 | 模型训练及图像处理方法、装置、介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110163237B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110533097A (zh) * | 2019-08-27 | 2019-12-03 | 腾讯科技(深圳)有限公司 | 一种图像清晰度识别方法、装置、电子设备及存储介质 |
CN111080515A (zh) * | 2019-11-08 | 2020-04-28 | 北京迈格威科技有限公司 | 图像处理方法、神经网络训练方法及装置 |
CN111105375A (zh) * | 2019-12-17 | 2020-05-05 | 北京金山云网络技术有限公司 | 图像生成方法及其模型训练方法、装置及电子设备 |
CN111553840A (zh) * | 2020-04-10 | 2020-08-18 | 北京百度网讯科技有限公司 | 图像超分辨的模型训练和处理方法、装置、设备和介质 |
CN112233112A (zh) * | 2020-12-07 | 2021-01-15 | 深圳大学 | 一种基于深度学习分析的肝细胞癌的ck19的预测方法 |
WO2021042774A1 (zh) * | 2019-09-04 | 2021-03-11 | 华为技术有限公司 | 图像恢复方法、图像恢复网络训练方法、装置和存储介质 |
CN112492312A (zh) * | 2020-11-19 | 2021-03-12 | 平安普惠企业管理有限公司 | 基于小波变换的图像压缩恢复方法、装置、设备和介质 |
CN112822474A (zh) * | 2019-11-15 | 2021-05-18 | 北京金山云网络技术有限公司 | 视频的处理方法、视频修复方法、装置及电子设备 |
CN112887788A (zh) * | 2019-11-29 | 2021-06-01 | 三星电子株式会社 | 电子装置及其控制方法 |
WO2021159633A1 (zh) * | 2020-02-13 | 2021-08-19 | 平安科技(深圳)有限公司 | 图像识别模型训练方法及系统和图像识别方法 |
CN114173137A (zh) * | 2020-09-10 | 2022-03-11 | 北京金山云网络技术有限公司 | 视频编码方法、装置及电子设备 |
CN114845152A (zh) * | 2021-02-01 | 2022-08-02 | 腾讯科技(深圳)有限公司 | 播放控件的显示方法、装置、电子设备及存储介质 |
CN116912604A (zh) * | 2023-09-12 | 2023-10-20 | 浙江大华技术股份有限公司 | 模型训练方法、图像识别方法、装置以及计算机存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1804657A (zh) * | 2006-01-23 | 2006-07-19 | 武汉大学 | 遥感图像小目标超分辨率重建方法 |
WO2015180053A1 (zh) * | 2014-05-28 | 2015-12-03 | 北京大学深圳研究生院 | 一种快速超分辨率图像重建方法和装置 |
CN107122826A (zh) * | 2017-05-08 | 2017-09-01 | 京东方科技集团股份有限公司 | 用于卷积神经网络的处理方法和系统、和存储介质 |
CN107492070A (zh) * | 2017-07-10 | 2017-12-19 | 华北电力大学 | 一种双通道卷积神经网络的单图像超分辨率计算方法 |
WO2017219263A1 (zh) * | 2016-06-22 | 2017-12-28 | 中国科学院自动化研究所 | 基于双向递归卷积神经网络的图像超分辨率增强方法 |
US20180137603A1 (en) * | 2016-11-07 | 2018-05-17 | Umbo Cv Inc. | Method and system for providing high resolution image through super-resolution reconstruction |
-
2018
- 2018-11-08 CN CN201811325357.1A patent/CN110163237B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1804657A (zh) * | 2006-01-23 | 2006-07-19 | 武汉大学 | 遥感图像小目标超分辨率重建方法 |
WO2015180053A1 (zh) * | 2014-05-28 | 2015-12-03 | 北京大学深圳研究生院 | 一种快速超分辨率图像重建方法和装置 |
WO2017219263A1 (zh) * | 2016-06-22 | 2017-12-28 | 中国科学院自动化研究所 | 基于双向递归卷积神经网络的图像超分辨率增强方法 |
US20180137603A1 (en) * | 2016-11-07 | 2018-05-17 | Umbo Cv Inc. | Method and system for providing high resolution image through super-resolution reconstruction |
CN107122826A (zh) * | 2017-05-08 | 2017-09-01 | 京东方科技集团股份有限公司 | 用于卷积神经网络的处理方法和系统、和存储介质 |
CN107492070A (zh) * | 2017-07-10 | 2017-12-19 | 华北电力大学 | 一种双通道卷积神经网络的单图像超分辨率计算方法 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110533097B (zh) * | 2019-08-27 | 2023-01-06 | 腾讯科技(深圳)有限公司 | 一种图像清晰度识别方法、装置、电子设备及存储介质 |
CN110533097A (zh) * | 2019-08-27 | 2019-12-03 | 腾讯科技(深圳)有限公司 | 一种图像清晰度识别方法、装置、电子设备及存储介质 |
WO2021042774A1 (zh) * | 2019-09-04 | 2021-03-11 | 华为技术有限公司 | 图像恢复方法、图像恢复网络训练方法、装置和存储介质 |
CN111080515A (zh) * | 2019-11-08 | 2020-04-28 | 北京迈格威科技有限公司 | 图像处理方法、神经网络训练方法及装置 |
CN112822474A (zh) * | 2019-11-15 | 2021-05-18 | 北京金山云网络技术有限公司 | 视频的处理方法、视频修复方法、装置及电子设备 |
CN112887788B (zh) * | 2019-11-29 | 2024-04-09 | 三星电子株式会社 | 电子装置及其控制方法 |
CN112887788A (zh) * | 2019-11-29 | 2021-06-01 | 三星电子株式会社 | 电子装置及其控制方法 |
CN111105375A (zh) * | 2019-12-17 | 2020-05-05 | 北京金山云网络技术有限公司 | 图像生成方法及其模型训练方法、装置及电子设备 |
CN111105375B (zh) * | 2019-12-17 | 2023-08-22 | 北京金山云网络技术有限公司 | 图像生成方法及其模型训练方法、装置及电子设备 |
WO2021159633A1 (zh) * | 2020-02-13 | 2021-08-19 | 平安科技(深圳)有限公司 | 图像识别模型训练方法及系统和图像识别方法 |
CN111553840A (zh) * | 2020-04-10 | 2020-08-18 | 北京百度网讯科技有限公司 | 图像超分辨的模型训练和处理方法、装置、设备和介质 |
CN111553840B (zh) * | 2020-04-10 | 2023-06-27 | 北京百度网讯科技有限公司 | 图像超分辨的模型训练和处理方法、装置、设备和介质 |
CN114173137A (zh) * | 2020-09-10 | 2022-03-11 | 北京金山云网络技术有限公司 | 视频编码方法、装置及电子设备 |
CN112492312B (zh) * | 2020-11-19 | 2022-11-08 | 平安普惠企业管理有限公司 | 基于小波变换的图像压缩恢复方法、装置、设备和介质 |
CN112492312A (zh) * | 2020-11-19 | 2021-03-12 | 平安普惠企业管理有限公司 | 基于小波变换的图像压缩恢复方法、装置、设备和介质 |
CN112233112A (zh) * | 2020-12-07 | 2021-01-15 | 深圳大学 | 一种基于深度学习分析的肝细胞癌的ck19的预测方法 |
CN114845152A (zh) * | 2021-02-01 | 2022-08-02 | 腾讯科技(深圳)有限公司 | 播放控件的显示方法、装置、电子设备及存储介质 |
CN114845152B (zh) * | 2021-02-01 | 2023-06-30 | 腾讯科技(深圳)有限公司 | 播放控件的显示方法、装置、电子设备及存储介质 |
CN116912604A (zh) * | 2023-09-12 | 2023-10-20 | 浙江大华技术股份有限公司 | 模型训练方法、图像识别方法、装置以及计算机存储介质 |
CN116912604B (zh) * | 2023-09-12 | 2024-01-16 | 浙江大华技术股份有限公司 | 模型训练方法、图像识别方法、装置以及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110163237B (zh) | 2023-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163237A (zh) | 模型训练及图像处理方法、装置、介质、电子设备 | |
Sun et al. | Learned image downscaling for upscaling using content adaptive resampler | |
CN110136066B (zh) | 面向视频的超分辨率方法、装置、设备和存储介质 | |
CN111275626B (zh) | 一种基于模糊度的视频去模糊方法、装置及设备 | |
Shan et al. | Fast image/video upsampling | |
Yu et al. | A unified learning framework for single image super-resolution | |
JP6961139B2 (ja) | 知覚的な縮小方法を用いて画像を縮小するための画像処理システム | |
CN112419151B (zh) | 图像退化处理方法、装置、存储介质及电子设备 | |
CN111681177B (zh) | 视频处理方法及装置、计算机可读存储介质、电子设备 | |
CN111667410B (zh) | 图像分辨率提升方法、装置及电子设备 | |
Zeng et al. | A generalized DAMRF image modeling for superresolution of license plates | |
CN112602088B (zh) | 提高弱光图像的质量的方法、系统和计算机可读介质 | |
CN111460876B (zh) | 用于识别视频的方法和装置 | |
CN110047122A (zh) | 渲染图像的方法、装置、电子设备和计算机可读存储介质 | |
Guan et al. | Srdgan: learning the noise prior for super resolution with dual generative adversarial networks | |
US7116836B2 (en) | Method and apparatus for enhancing an image using a wavelet-based retinex algorithm | |
CN116051428A (zh) | 一种基于深度学习的联合去噪与超分的低光照图像增强方法 | |
CN110310293B (zh) | 人体图像分割方法及设备 | |
CN114399814A (zh) | 一种基于深度学习的遮挡物移除和三维重建方法 | |
CN109840890A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110689478B (zh) | 图像风格化处理方法、装置、电子设备及可读介质 | |
CN114640796B (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN111784726A (zh) | 人像抠图方法和装置 | |
CN115937358A (zh) | 图像处理方法及其装置、电子设备和存储介质 | |
CN115115538A (zh) | 视频处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |