CN113538304A - 图像增强模型的训练方法及装置、图像增强方法及装置 - Google Patents
图像增强模型的训练方法及装置、图像增强方法及装置 Download PDFInfo
- Publication number
- CN113538304A CN113538304A CN202011475833.5A CN202011475833A CN113538304A CN 113538304 A CN113538304 A CN 113538304A CN 202011475833 A CN202011475833 A CN 202011475833A CN 113538304 A CN113538304 A CN 113538304A
- Authority
- CN
- China
- Prior art keywords
- channel
- image
- clipping
- color
- pixel points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 121
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000005520 cutting process Methods 0.000 claims description 150
- 238000003860 storage Methods 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 abstract description 6
- 238000013473 artificial intelligence Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20208—High dynamic range [HDR] image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Abstract
本申请提供了一种图像增强模型的训练方法及装置、图像增强方法及装置,能够在进行颜色增强时,同时维持增强图像的细节纹理,让图像的局部和整体均有很好的增强效果。图像增强模型的训练方法,包括:获取训练图像集,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,其中,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像;根据训练图像集对初始图像增强模型进行模型训练,得到目标图像增强模型。
Description
技术领域
本申请实施例涉及图像处理领域,并且更具体地,涉及一种图像增强模型的训练方法及装置、图像增强方法及装置。
背景技术
随着多媒体技术的普及,人们在日常生活和生产活动中对图像的使用越来越频繁。图像的形式多样,有自然的图像,例如照片;也有人工图像,例如那些在计算机上通过数字技术创造出来的测试图像。
目前,图像增强可以通过对图像的像素点或亮度进行处理进而实现颜色增强。但无法处理局部的细节,因为过暗和过亮的部分的细节在增强后,由于颜色的增强使得细节会更微弱。
发明内容
本申请提供了一种图像增强模型的训练方法及装置、图像增强方法及装置、电子设备、芯片和计算机可读存储介质,模型训练中的目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像,从而目标图像可以将HDR图像中的细节与增强图像中的色彩和对比度优势共同保留,也即,在图像增强中,能够在进行颜色增强时,同时维持增强图像的细节纹理,让图像的局部和整体均有很好的增强效果。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请的一方面,提供了一种图像增强模型的训练方法,包括:
获取训练图像集,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,其中,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像;
根据训练图像集对初始图像增强模型进行模型训练,得到目标图像增强模型。
根据本申请的一方面,提供了一种图像增强方法,包括:
获取待处理图像;
将待处理图像输入目标图像增强模型中,其中,目标图像增强模型通过训练图像集对初始图像增强模型进行模型训练得到,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像;
获取目标图像增强模型输出的目标增强图像。
根据本申请的一方面,提供了一种图像增强模型的训练装置,包括:
训练图像集获取模块,用于获取训练图像集,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,其中,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像;
训练模块,用于根据训练图像集对初始图像增强模型进行模型训练,得到目标图像增强模型。
根据本申请的一方面,提供了一种图像增强装置,包括:
待处理图像获取模块,用于获取待处理图像;
输入模块,用于将待处理图像输入目标图像增强模型中,其中,目标图像增强模型通过训练图像集对初始图像增强模型进行模型训练得到,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像;
目标增强图像获取模块,用于获取目标图像增强模型输出的目标增强图像。
根据本申请的一方面,提供了一种电子设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,执行上述图像增强模型的训练方法的步骤,或者,执行上述图像增强的方法的步骤。
根据本申请的一方面,提供了一种芯片,包括:处理器,用于从存储器中调用并运行计算机程序,使得该处理器执行上述图像增强模型的训练方法的步骤,或者,执行上述图像增强的方法的步骤。
根据本申请的一方面,提供了一种计算机可读存储介质,用于存储计算机程序,该计算机程序使得计算机执行上述图像增强模型的训练方法的步骤,或者,执行上述图像增强的方法的步骤。
基于上述技术方案,模型训练中的目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像,从而目标图像可以将HDR图像中的细节与增强图像中的色彩和对比度优势共同保留,也即,在图像增强中,能够在进行颜色增强时,同时维持增强图像的细节纹理,让图像的局部和整体均有很好的增强效果。
本申请实施例的其他特性和优点将通过下面的详细描述变得显然,或者部分通过本申请的实践而习得。
应理解,以上的一般描述和后文的细节描述仅是示例性的,并不对本申请构成限定。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出了根据本申请的一个实施例中提供的图像增强方法以及图像增强模型的训练方法的应用场景图;
图2示意性示出了根据本申请的一实施例的图像增强模型的训练方法的流程图;
图3示意性示出了根据本申请的一个实施例中初始图像增强模型的示意性图;
图4示意性示出了根据本申请的一个实施例中输入图像经色彩增强处理得到的增强图像的流程图;
图5示意性示出了根据本申请的一个实施例中根据R通道、G通道和B通道中每个颜色通道的颜色直方图和目标裁剪步长,分别确定每个颜色通道的最大色差阈值和最小色差阈值的流程图;
图6示意性示出了根据本申请的一个实施例中根据每个颜色通道的最大色差阈值和最小色差阈值,分别对R通道、G通道和B通道中每个颜色通道的像素值进行修正,得到增强图像的流程图;
图7示意性示出了根据本申请的一个实施例中确定目标裁剪步长的流程图;
图8示意性示出了根据本申请的一个实施例中根据裁剪像素点的数量n0和第一裁剪顺序,对R通道、G通道和B通道中每个颜色通道的颜色直方图进行裁剪,分别得到R通道的下边界R下、G通道的下边界G下和B通道的下边界B下的流程图;
图9示意性示出了根据本申请的一个实施例中根据裁剪像素点的数量n0和第二裁剪顺序,对R通道、G通道和B通道中每个颜色通道的颜色直方图进行裁剪,分别得到R通道的上边界R上、G通道的上边界G上和B通道的上边界B上的流程图;
图10示意性示出了根据本申请的一个实施例中增强图像与HDR图像融合得到的目标图像的流程图;
图11示意性示出了根据本申请的一个实施例中增强图像与HDR图像融合得到的目标图像的示意图;
图12示意性示出了根据本申请的一实施例的图像增强方法的示意性流程图;
图13示意性示出了根据本申请的一个实施例中待处理图像和目标增强图像的示意性图;
图14示意性示出了根据本申请的一实施例的图像增强模型的训练装置的框图;
图15示意性示出了根据本申请的一实施例的图像增强装置的框图;
图16示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些示例实施方式使得本申请的描述将更加全面的完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的示例实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略特定细节中的一个或更多,或者可以采用其他的方法、组元、步骤等。在其它情况下,不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本申请的各方面变得模糊。
附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络、处理器装置或者微控制装置中现实这些功能实体。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。本申请可以基于人工智能技术进行图像增强模型训练和图像增强。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能,也即使机器具有学习能力。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门科学。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络(如卷积神经网络)、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
人工智能结合云服务,也可以实现人工智能云服务,一般也被称作是AI即服务(AIas a Service,AIaaS)。这是目前主流的一种人工智能平台的服务方式,具体来说AIaaS平台会把几类常见的AI服务进行拆分,并在云端提供独立或者打包的服务。这种服务模式类似于开了一个AI主题商城:所有的开发者都可以通过应用程序接口(ApplicationProgramming Interface,API)接口的方式来接入使用平台提供的一种或者是多种人工智能服务,部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运维自已专属的云人工智能服务。
高动态范围图像(High-Dynamic Range,HDR),相比普通的图像,可以提供更多的动态范围和图像细节,根据不同的曝光时间的低动态范围图像(Low-Dynamic Range,LDR),并利用每个曝光时间相对应最佳细节的LDR图像来合成最终HDR图像。它能够更好的反映出真实环境中的视觉效果。
小波变换(wavelet transform,WT)是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的“时间-频率”窗口,是进行信号时频分析和处理的理想工具。它的主要特点是通过变换能够充分突出问题某些方面的特征,能对时间(空间)频率的局部化分析,通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节。
可以理解,本申请所使用的术语“第一”、“第二”等可在本申请中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一裁剪顺序称为第二裁剪顺序,且类似地,可将第二裁剪顺序称为第一裁剪顺序。
图1为一个实施例中提供的图像增强方法以及图像增强模型的训练方法的应用场景图,如图1所示,在该应用场景中,包括终端110和服务器120。
在一些实现方式中,可以通过服务器120对初始图像增强模型进行训练,得到目标图像增强模型。服务器120获取到目标图像增强模型后,可以将目标图像增强模型部署在图像增强应用中,终端110可以安装该图像增强应用,当终端110拍摄得到图片或图像之后,或者,当终端110通过网络获取图片或图像之后,用户可以通过相应的操作发出图像增强指令,终端110可以接收图像增强指令,将拍摄的图片或图像作为待处理图像进行图像增强,或者将通过网络获取的图片或图像作为待处理图像进行图像增强,得到增强后的目标增强图像。
在另一些实现方式中,可以通过终端110对初始图像增强模型进行训练,得到目标图像增强模型。当终端110拍摄得到图片或图像之后,或者,当终端110通过网络获取图片或图像之后,用户可以通过相应的操作发出图像增强指令,终端110可以接收图像增强指令,将拍摄的图片或图像作为待处理图像进行图像增强,或者将通过网络获取的图片或图像作为待处理图像进行图像增强,得到增强后的目标增强图像。
可以理解,上述应用场景仅是一个示例,并不能构成对本申请实施例提供的图像增强模型的训练方法以及图像增强方法的限制。例如,目标图像增强模型可以存储在服务器120中,服务器120可以接收终端110发送的待处理图像,对待处理图像进行图像增强得到目标增强图像后返回到终端110中。
服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、以及智能手表等,但并不局限于此。终端110和服务器120可以通过有线或者无线通信方式进行直接或间接地连接,本申请对此并不限定。
下面对本申请实施例的具体实施过程进行详细的描述。
图2示出了根据本申请的一个实施例的图像增强模型的训练方法200的示意性流程图,该图像增强模型的训练方法200可以由具有计算处理能力的设备来执行,例如,上述终端110或服务器120。参照图2所示,该图像增强模型的训练方法200至少可以包括S210至S220,详细介绍如下:
在S210中,获取训练图像集,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,其中,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像。
具体地,训练图像集中包括多个训练样本,训练样本包括相互配对的输入图像和目标图像。训练图像集中训练样本的数量可以根据需求设置。例如,若模型训练时需要训练30次,每次利用1万个训练样本进行训练,则训练图像集中可以包括1万个训练样本,每次模型训练时利用这1万个训练样本进行训练。输入图像和目标图像配对是指:输入图像是需要进行图像增强的图像,而目标图像是利用图像增强模型对输入图像进行图像增强之后所期望得到的图像。
输入图像以及配对的目标图像的图像内容相同,但目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像,因此,目标图像中同时保留了HDR图像中的细节优势与增强图像中的色彩和对比度优势。可以理解,输入图像以及配对的目标图像的图像内容相同是指同一训练样本的图像内容相同,但是不同的训练样本的图像内容可以是不同的。
在一些实施例中,可以收集公开的HDR数据库,HDR数据库包括输入图像集以及对应的HDR图像集,以及基于HDR数据库确定训练图像集。
在S220中,根据训练图像集对初始图像增强模型进行模型训练,得到目标图像增强模型。
具体地,图像增强是指对需要增强的图像数据进行数据变换,有选择地突出图像中感兴趣的特征以及抑制图像中某些不需要的特征,使增强后的图像质量的视觉效果得到改善。
在本申请实施例中,初始图像增强模型的输入对象为训练样本中的输入图像,期望的输出为配对的目标图像。初始图像增强模型需要进一步进行模型训练,以调整模型参数的图像增强模型。初始图像增强模型的类型可以根据需要进行设置,例如可以是超分辨率卷积神经网络(Super Resolution Convolutional Neural Networks,SRCNN)。当然,初始图像增强模型也可以是其他图像生成的卷积神经网络模型,本申请对此并不限定。
模型训练的目标是得到更好的模型参数,以提高图像增强的效果。在进行训练时,将输入图像输入到初始图像增强模型中,得到输出的模型增强图像,然后根据模型增强图像与配对的目标图像的差异调整模型参数,使得根据调整后的模型参数进行图像增强得到的模型增强图像越来越接近配对的目标图像,直至满足模型收敛条件,并最终得到目标图像增强模型。
在一些实施例中,将输入图像的红(R)绿(G)蓝(B)三通道参数输入到初始图像增强模型中,得到输出的模型增强图像的红(R)绿(G)蓝(B)三通道参数。具体例如,初始图像增强模型为三层卷积神经网络,如图3所示,第一层卷积为特征提取层:卷积核尺寸9×9(f1×f1),卷积核数目64,输出64张特征图;第二层卷积为非线性映射层:卷积核尺寸1×1(f2×f2),卷积核数目32,输出32张特征图;第三层卷积为重建层:卷积核尺寸5×5(f3×f3),卷积核数目3,输出的3张特征图即为RGB三通道增强图。
本申请实施例可以应用在图像增强、图像修复、视频增强、视频修复的服务器及终端。
图4示意性示出了根据本申请的一个实施例的输入图像经色彩增强处理得到的增强图像的流程图。也即,在上述图2实施例中的S210中,输入图像经色彩增强处理得到的增强图像,可以包括以下步骤S310-S330。
S310,将输入图像的RGB三通道分离,得到R通道、G通道和B通道;
S320,根据R通道、G通道和B通道中每个颜色通道的颜色直方图和目标裁剪步长,分别确定每个颜色通道的最大色差阈值和最小色差阈值;
S330,根据每个颜色通道的最大色差阈值和最小色差阈值,分别对R通道、G通道和B通道中每个颜色通道的像素值进行修正,得到增强图像。
具体地,可以获取输入图像中每个像素点的像素值,以及将输入图像中的这些像素点的像素值在R、G、B通道上进行分离,以得到这些像素点在R通道、G通道和B通道中每个颜色通道上的初始分量。然后,可以根据像素点的像素值在颜色通道上的初始分量,统计得到每个颜色通道的颜色直方图,从而根据R通道、G通道和B通道中每个颜色通道的颜色直方图和目标裁剪步长,分别确定每个颜色通道的最大色差阈值和最小色差阈值。
可以理解的是,R通道上的初始分量(即R通道上的每个颜色分量)所对应的颜色等级可以为256个颜色等级中的任意一个,其中,颜色等级越高则表示输入图像中红色分量所占比重越大。R通道的颜色直方图的高度可以用于表征该R通道上的颜色分量(即初始分量)为某个颜色等级时的像素点的统计数量。G通道上的初始分量(即G通道上的每个颜色分量)所对应的颜色等级可以为256个颜色等级中的任意一个,其中,颜色等级越高则表示输入图像中绿色分量所占比重越大。G通道的颜色直方图的高度可以用于表征该G通道上的颜色分量(即初始分量)为某个颜色等级时的像素点的统计数量。B通道上的初始分量(即B通道上的每个颜色分量)所对应的颜色等级可以为256个颜色等级中的任意一个,其中,颜色等级越高则表示输入图像中蓝色分量所占比重越大。B通道的颜色直方图的高度可以用于表征该B通道上的颜色分量(即初始分量)为某个颜色等级时的像素点的统计数量。
在一些实施例中,如图5所示,S320可以进一步包括以下步骤S321-S328。
S321,根据输入图像的宽度和高度、目标裁剪步长,确定裁剪像素点的数量n;
S322,将R通道、G通道和B通道中每个颜色通道上初始分量由小到大的顺序确定为第一裁剪顺序,以及将R通道、G通道和B通道中每个颜色通道上初始分量由大到小的顺序确定为第二裁剪顺序;
S323,在R通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的最小色差阈值Rmin;
S324,在G通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的最小色差阈值Gmin;
S325,在B通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的最小色差阈值Bmin;
S326,在R通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的最大色差阈值Rmax;
S327,在G通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的最大色差阈值Gmax;
S328,在B通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的最大色差阈值Bmax。
可以理解的是,以目标裁剪步长为裁剪比例系数进行裁剪,其裁剪范围合理,不会出现无效裁剪或过度裁剪的问题。
为了便于理解,本申请实施例中,输入图像的宽度可以表示为M,以及输入图像的高度可以表示为N。M为单位像素i的整数倍,N为单位像素j的整数倍,所以,在本申请实施例中,该输入图像中的像素点的总数量可以表示为M×N。M和N均可以为正整数。本申请实施例将不对M和N的具体数量进行限制。
其中,n=s×M×N,s表示目标裁剪步长,M表示输入图像的宽度,N表示输入图像的高度。可以理解的是,裁剪像素点的数量可以为小于总数量(即M×N)的正整数。
例如,目标裁剪步长s=0.002,输入图像的宽度M=500,输入图像的高度N=50,裁剪像素点的数量n=50。
在一些实施例中,如图6所示,S330可以进一步包括以下步骤S331-S333。
S331,将R通道中像素值大于R通道的最大色差阈值Rmax的像素点的像素值修正为255,将R通道中像素值小于R通道的最小色差阈值Rmin的像素点的像素值修正为0,以及将R通道中满足Rmin≤R(x,y)≤Rmax的像素值R(x,y)修正为Rr(x,y);
S332,将G通道中像素值大于G通道的最大色差阈值Gmax的像素点的像素值修正为255,将G通道中像素值小于G通道的最小色差阈值Gmin的像素点的像素值修正为0,以及将G通道中满足Gmin≤G(x,y)≤Gmax的像素值G(x,y)修正为Gr(x,y);
S333,将B通道中像素值大于B通道的最大色差阈值Bmax的像素点的像素值修正为255,将B通道中像素值小于B通道的最小色差阈值Bmin的像素点的像素值修正为0,以及将B通道中满足Bmin≤B(x,y)≤Bmax的像素值B(x,y)修正为Br(x,y)。
MinRGB=min(Rmin,Gmin,Bmin),MaxRGB=max(Rmax,Gmax,Bmax)。
图7示意性示出了根据本申请的一个实施例的确定目标裁剪步长的流程图。也即,在上述图5实施例中,确定S321中的目标裁剪步长,可以包括以下步骤S410-S470。
S410,获取输入图像的初始裁剪步长;
S420,根据输入图像的宽度和高度、初始裁剪步长,确定裁剪像素点的数量n0;
S430,将R通道、G通道和B通道中每个颜色通道上初始分量由小到大的顺序确定为第一裁剪顺序,以及将R通道、G通道和B通道中每个颜色通道上初始分量由大到小的顺序确定为第二裁剪顺序;
S440,根据裁剪像素点的数量n0和第一裁剪顺序,对R通道、G通道和B通道中每个颜色通道的颜色直方图进行裁剪,分别得到R通道的下边界R下、G通道的下边界G下和B通道的下边界B下;
S450,根据裁剪像素点的数量n0和第二裁剪顺序,对R通道、G通道和B通道中每个颜色通道的颜色直方图进行裁剪,分别得到R通道的上边界R上、G通道的上边界G上和B通道的上边界B上;
S460,根据R通道的下边界R下和上边界R上、G通道的下边界G下和上边界G上、B通道的下边界B下和上边界B上,分别确定RGB三通道中的最小距离Dismin和RGB三通道裁剪的总范围Disall;
S470,若最小距离Dismin小于第一阈值且总范围Disall大于第二阈值,将初始裁剪步长确定为目标裁剪步长;否则,调整初始裁剪步长的大小,直至最小距离Dismin小于第一阈值且总范围Disall大于第二阈值。
其中,n0=s0×M×N,s0表示初始裁剪步长,M表示输入图像的宽度,N表示输入图像的高度。可以理解的是,裁剪像素点的数量可以为小于总数量(即M×N)的正整数。
其中,RGB三通道中的最小距离Dismin的具体实现方式可以参见下述公式(1)。
Dismin=min((R上-R下),(G上-G下),(B上-B下)) 公式(1)
在RGB颜色空间中,最小距离Dismin可以表征对上述3个通道(即R通道、G通道和B通道)的颜色直方图进行像素裁剪之后所确定的各颜色通道的边界距离中的最小距离值。例如,R上=205,R下=205,R上-R下=150;G上=155,G下=60,G上-G下=95;B上=160,B下=60,B上-B下=100;基于上述公式(1)可以确定Dismin=min(150,95,100)=95。
其中,RGB三通道裁剪的总范围Disall的具体实现方式可以参见下述公式(2)。
Disall=255×3-(R上+G上+B上-R下-G下-B下) 公式(2)
可以理解的是,公式(2)中的Disall可以用于描述上述3个通道(即R通道、G通道和B通道)的总裁剪距离,即3个通道的总裁剪距离可以为每个颜色通道的裁剪距离之和。其中,每个颜色通道的裁剪距离可以为最大颜色等级(即255)与相应颜色通道的边界距离之间的差值。
根据上述最小距离Dismin与第一阈值之间的关联关系,以及总范围Disall与第二阈值之间的关联关系,可以尽可能合理地确定目标裁剪步长。换言之,本申请实施例中,在根据裁剪步长进行像素点裁剪的过程中,可以确定出合理的裁剪像素点的数量,进而可以避免裁剪掉过多的像素点,或者裁剪了过少的像素点,从而确保确定的每个颜色通道的最小色差阈值和最大色差阈值的合理性。
若最小距离Dismin大于或等于第一阈值且总范围Disall小于或等于第二阈值,则可以判断此时3个通道(即R通道、G通道和B通道)的上边界和下边界裁剪的不合理。例如,初始裁剪步长设置过小,导致确定出的所需裁剪的像素点的裁剪数量过少。此种情况下,可以增大初始裁剪步长,直至最小距离Dismin小于第一阈值且总范围Disall大于第二阈值,并将此时的初始裁剪步长确定为目标裁剪步长。
在一些实施例中,如图8所示,S440可以进一步包括以下步骤S441-S443。
S441,在R通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的下边界R下;
S442,在G通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的下边界G下;
S443,在B通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的下边界B下。
在一些实施例中,如图9所示,S450可以进一步包括以下步骤S451-S453。
S451,在R通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的上边界R上;
S452,在G通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的上边界G上;
S453,在B通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的上边界B上。
图10示意性示出了根据本申请的一个实施例的增强图像与HDR图像融合得到的目标图像的流程图。也即,在上述图2实施例中的S210中,增强图像与HDR图像融合得到的目标图像,可以包括以下步骤S510-S550。
S510,对增强图像进行小波变换,分解为第一低频分量和第一高频分量;
S520,对HDR图像进行小波变换,分解为第二低频分量和第二高频分量;
S530,将第一低频分量和第二低频分量加权平均,得到第一平均分量;
S540,将第一高频分量和第二高频分量加权平均,得到第二平均分量;
S550,对第一平均分量和第二平均分量进行小波逆变换,融合得到目标图像。
具体地,增强图像与HDR图像融合得到的目标图像,其目的是将HDR图像中的细节与增强图像中的色彩和对比度的优势共同保留。此外,增强图像与HDR图像融合得到的目标图像的流程具体可以如图11所示。
图12示出了根据本申请的一个实施例的图像增强方法600的示意性流程图,该图像增强方法600可以由具有计算处理能力的设备来执行,例如,上述图1中的终端110或服务器120。参照图12所示,该图像增强方法600至少可以包括S610至S630,详细介绍如下:
在S610中,获取待处理图像。
具体地,待处理图像是指需要进行图像增强的图像。待处理图像可以是根据图像增强指令获取的。图像增强指令可以携带待处理图像以及待处理图像对应的标识中的一个或多个。如果携带待处理图像,则从该指令中提取得到待处理图像,如果携带的是待处理图像对应的标识,则根据待处理图像对应的标识获取待处理图像。例如,可以获取终端例如手机的摄像头拍摄的图像作为待处理图像,也可以接收用户对终端相册中的照片的选择操作,根据选择操作展示对应的图像,并在图像上方展示“图像增强”功能控件,当接收到对“图像增强”功能控件的点击操作时,则将该照片作为待处理图像。服务器也可以接收终端发送的图像增强指令,图像增强指令中携带待处理图像对应的标识,服务器根据待处理图像对应的标识获取服务器中存储的待处理图像。
在S620中,将待处理图像输入目标图像增强模型中,其中,目标图像增强模型通过训练图像集对初始图像增强模型进行模型训练得到,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像。
具体地,目标图像增强模型通过训练图像集对初始图像增强模型进行模型训练得到,目标图像增强模型的模型训练方法可以根据上述实施例提供的图像增强模型的训练方法得到,在此不再赘述。
在S630中,获取目标图像增强模型输出的目标增强图像。
具体地,目标图像增强模型根据模型参数对待处理图像进行处理,得到目标增强图像并输出。当需要进行图像增强时,获取待处理图像的图片数据,输入到目标图像增强模型中,得到增强结果,即目标增强图像。例如,待处理图像,以及经目标图像增强模型增强之后目标增强图像,可以如图13所示。
在一些实施例中,可以获取待处理图像对应的增强参数类型,增强参数类型包括颜色。当然,增强参数类型也可以包括诸如平滑度或纹理。目标图像增强模型可以根据增强参数类型对待处理图像进行图像增强,得到对应的目标增强图像。具体地,待处理图像对应的增强参数类型可以是根据用户的输入得到的,也可以是自动对图像进行识别得到的,可以在图像显示界面上展示各个增强参数类型对应的功能控件,根据用户对增强参数类型对应的功能控件的选择确定对应的增强参数类型。也可以根据待处理图像的质量确定需要增强的参数类型。
因此,在本申请实施例中,模型训练中的目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像,从而目标图像可以将HDR图像中的细节与增强图像中的色彩和对比度优势共同保留,也即,在图像增强中,能够在进行颜色增强时,同时维持增强图像的细节纹理,让图像的局部和整体均有很好的增强效果。
上文结合图2至图13,详细描述了本申请的方法实施例,下文结合图14至图15,详细描述本申请的装置实施例,应理解,装置实施例与方法实施例相互对应,类似的描述可以参照方法实施例。
图14示意性示出了根据本申请的一实施例的图像增强模型的训练装置的框图。该图像增强模型的训练装置可以采用软件单元或硬件单元,或者是二者的结合成为计算机设备的一部分。如图14所示,本申请实施例提供的图像增强模型的训练装置700具体可以包括:
训练图像集获取模块710,用于获取训练图像集,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,其中,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像;
训练模块720,用于根据训练图像集对初始图像增强模型进行模型训练,得到目标图像增强模型。
在一个实施例中,图像增强模型的训练装置700还可以包括:
图像分离模块,用于将输入图像的RGB三通道分离,得到R通道、G通道和B通道;确定模块,用于根据R通道、G通道和B通道中每个颜色通道的颜色直方图和目标裁剪步长,分别确定每个颜色通道的最大色差阈值和最小色差阈值;修正模块,用于根据每个颜色通道的最大色差阈值和最小色差阈值,分别对R通道、G通道和B通道中每个颜色通道的像素值进行修正,得到增强图像。
在一个实施例中,修正模块具体用于:
将R通道中像素值大于R通道的最大色差阈值Rmax的像素点的像素值修正为255,将R通道中像素值小于R通道的最小色差阈值Rmin的像素点的像素值修正为0,以及将R通道中满足Rmin≤R(x,y)≤Rmax的像素值R(x,y)修正为Rr(x,y);将G通道中像素值大于G通道的最大色差阈值Gmax的像素点的像素值修正为255,将G通道中像素值小于G通道的最小色差阈值Gmin的像素点的像素值修正为0,以及将G通道中满足Gmin≤G(x,y)≤Gmax的像素值G(x,y)修正为Gr(x,y);将B通道中像素值大于B通道的最大色差阈值Bmax的像素点的像素值修正为255,将B通道中像素值小于B通道的最小色差阈值Bmin的像素点的像素值修正为0,以及将B通道中满足Bmin≤B(x,y)≤Bmax的像素值B(x,y)修正为Br(x,y);
MinRGB=min(Rmin,Gmin,Bmin),MaxRGB=max(Rmax,Gmax,Bmax)。
在一个实施例中,图像增强模型的训练装置700还可以包括:
获取模块,用于获取输入图像的初始裁剪步长;确定模块,用于根据输入图像的宽度和高度、初始裁剪步长,确定裁剪像素点的数量n0;确定模块,用于将R通道、G通道和B通道中每个颜色通道上初始分量由小到大的顺序确定为第一裁剪顺序,以及将R通道、G通道和B通道中每个颜色通道上初始分量由大到小的顺序确定为第二裁剪顺序;裁剪模块,用于根据裁剪像素点的数量n0和第一裁剪顺序,对R通道、G通道和B通道中每个颜色通道的颜色直方图进行裁剪,分别得到R通道的下边界R下、G通道的下边界G下和B通道的下边界B下;裁剪模块,用于根据裁剪像素点的数量n0和第二裁剪顺序,对R通道、G通道和B通道中每个颜色通道的颜色直方图进行裁剪,分别得到R通道的上边界R上、G通道的上边界G上和B通道的上边界B上;确定模块,用于根据R通道的下边界R下和上边界R上、G通道的下边界G下和上边界G上、B通道的下边界B下和上边界B上,分别确定RGB三通道中的最小距离Dismin和RGB三通道裁剪的总范围Disall;确定模块,用于若最小距离Dismin小于第一阈值且总范围Disall大于第二阈值,将初始裁剪步长确定为目标裁剪步长;否则,调整模块,用于调整初始裁剪步长的大小,直至最小距离Dismin小于第一阈值且总范围Disall大于第二阈值。
在一个实施例中,裁剪模块具体用于:
在R通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的下边界R下;在G通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的下边界G下;在B通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的下边界B下。
在一个实施例中,裁剪模块具体用于:
在R通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的上边界R上;在G通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的上边界G上;在B通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的上边界B上。
在一个实施例中,确定模块具体用于:
Dismin=min((R上-R下),(G上-G下),(B上-B下));
Disall=255×3-(R上+G上+B上-R下-G下-B下)。
在一个实施例中,确定模块,用于根据输入图像的宽度和高度、目标裁剪步长,确定裁剪像素点的数量n;确定模块,用于将R通道、G通道和B通道中每个颜色通道上初始分量由小到大的顺序确定为第一裁剪顺序,以及将R通道、G通道和B通道中每个颜色通道上初始分量由大到小的顺序确定为第二裁剪顺序;裁剪模块,用于在R通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的最小色差阈值Rmin;裁剪模块,用于在G通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的最小色差阈值Gmin;裁剪模块,用于在B通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的最小色差阈值Bmin;裁剪模块,用于在R通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的最大色差阈值Rmax;裁剪模块,用于在G通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的最大色差阈值Gmax;裁剪模块,用于在B通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的最大色差阈值Bmax。
在一个实施例中,图像增强模型的训练装置700还可以包括:
小波变换模块,用于对增强图像进行小波变换,分解为第一低频分量和第一高频分量;小波变换模块,用于对HDR图像进行小波变换,分解为第二低频分量和第二高频分量;加权平均模块,用于将第一低频分量和第二低频分量加权平均,得到第一平均分量;加权平均模块,用于将第一高频分量和第二高频分量加权平均,得到第二平均分量;小波逆变换模块,用于对第一平均分量和第二平均分量进行小波逆变换,融合得到目标图像。
本申请实施例提供的图像增强模型的训练装置中的各个单元的具体实现可以参照上述图像增强模型的训练方法中的内容,在此不再赘述。
图15示意性示出了根据本申请的一实施例的图像增强装置的框图。该图像增强装置可以采用软件单元或硬件单元,或者是二者的结合成为计算机设备的一部分。如图15所示,本申请实施例提供的图像增强装置800具体可以包括:
待处理图像获取模块810,用于获取待处理图像;
输入模块820,用于将待处理图像输入目标图像增强模型中,其中,目标图像增强模型通过训练图像集对初始图像增强模型进行模型训练得到,训练图像集中的各个训练样本包括输入图像以及配对的目标图像,目标图像是由输入图像经色彩增强处理得到的增强图像与输入图像对应的HDR图像融合后得到的图像;
目标增强图像获取模块830,用于获取目标图像增强模型输出的目标增强图像。
在一个实施例中,图像增强装置800还可以包括:
图像分离模块,用于将输入图像的RGB三通道分离,得到R通道、G通道和B通道;确定模块,用于根据R通道、G通道和B通道中每个颜色通道的颜色直方图和目标裁剪步长,分别确定每个颜色通道的最大色差阈值和最小色差阈值;修正模块,用于根据每个颜色通道的最大色差阈值和最小色差阈值,分别对R通道、G通道和B通道中每个颜色通道的像素值进行修正,得到增强图像。
在一个实施例中,修正模块具体用于:
将R通道中像素值大于R通道的最大色差阈值Rmax的像素点的像素值修正为255,将R通道中像素值小于R通道的最小色差阈值Rmin的像素点的像素值修正为0,以及将R通道中满足Rmin≤R(x,y)≤Rmax的像素值R(x,y)修正为Rr(x,y);将G通道中像素值大于G通道的最大色差阈值Gmax的像素点的像素值修正为255,将G通道中像素值小于G通道的最小色差阈值Gmin的像素点的像素值修正为0,以及将G通道中满足Gmin≤G(x,y)≤Gmax的像素值G(x,y)修正为Gr(x,y);将B通道中像素值大于B通道的最大色差阈值Bmax的像素点的像素值修正为255,将B通道中像素值小于B通道的最小色差阈值Bmin的像素点的像素值修正为0,以及将B通道中满足Bmin≤B(x,y)≤Bmax的像素值B(x,y)修正为Br(x,y);
MinRGB=min(Rmin,Gmin,Bmin),MaxRGB=max(Rmax,Gmax,Bmax)。
在一个实施例中,图像增强装置800还可以包括:
获取模块,用于获取输入图像的初始裁剪步长;确定模块,用于根据输入图像的宽度和高度、初始裁剪步长,确定裁剪像素点的数量n0;确定模块,用于将R通道、G通道和B通道中每个颜色通道上初始分量由小到大的顺序确定为第一裁剪顺序,以及将R通道、G通道和B通道中每个颜色通道上初始分量由大到小的顺序确定为第二裁剪顺序;裁剪模块,用于根据裁剪像素点的数量n0和第一裁剪顺序,对R通道、G通道和B通道中每个颜色通道的颜色直方图进行裁剪,分别得到R通道的下边界R下、G通道的下边界G下和B通道的下边界B下;裁剪模块,用于根据裁剪像素点的数量n0和第二裁剪顺序,对R通道、G通道和B通道中每个颜色通道的颜色直方图进行裁剪,分别得到R通道的上边界R上、G通道的上边界G上和B通道的上边界B上;确定模块,用于根据R通道的下边界R下和上边界R上、G通道的下边界G下和上边界G上、B通道的下边界B下和上边界B上,分别确定RGB三通道中的最小距离Dismin和RGB三通道裁剪的总范围Disall;确定模块,用于若最小距离Dismin小于第一阈值且总范围Disall大于第二阈值,将初始裁剪步长确定为目标裁剪步长;否则,调整模块,用于调整初始裁剪步长的大小,直至最小距离Dismin小于第一阈值且总范围Disall大于第二阈值。
在一个实施例中,裁剪模块具体用于:
在R通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的下边界R下;在G通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的下边界G下;在B通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的下边界B下。
在一个实施例中,裁剪模块具体用于:
在R通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的上边界R上;在G通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的上边界G上;在B通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的上边界B上。
在一个实施例中,确定模块具体用于:
Dismin=min((R上-R下),(G上-G下),(B上-B下));
Disall=255×3-(R上+G上+B上-R下-G下-B下)。
在一个实施例中,确定模块,用于根据输入图像的宽度和高度、目标裁剪步长,确定裁剪像素点的数量n;确定模块,用于将R通道、G通道和B通道中每个颜色通道上初始分量由小到大的顺序确定为第一裁剪顺序,以及将R通道、G通道和B通道中每个颜色通道上初始分量由大到小的顺序确定为第二裁剪顺序;裁剪模块,用于在R通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的最小色差阈值Rmin;裁剪模块,用于在G通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的最小色差阈值Gmin;裁剪模块,用于在B通道的颜色直方图中,根据第一裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的最小色差阈值Bmin;裁剪模块,用于在R通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对R通道的颜色直方图进行裁剪,得到R通道的最大色差阈值Rmax;裁剪模块,用于在G通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对G通道的颜色直方图进行裁剪,得到G通道的最大色差阈值Gmax;裁剪模块,用于在B通道的颜色直方图中,根据第二裁剪顺序搜索与裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对B通道的颜色直方图进行裁剪,得到B通道的最大色差阈值Bmax。
在一个实施例中,图像增强装置800还可以包括:
小波变换模块,用于对增强图像进行小波变换,分解为第一低频分量和第一高频分量;小波变换模块,用于对HDR图像进行小波变换,分解为第二低频分量和第二高频分量;加权平均模块,用于将第一低频分量和第二低频分量加权平均,得到第一平均分量;加权平均模块,用于将第一高频分量和第二高频分量加权平均,得到第二平均分量;小波逆变换模块,用于对第一平均分量和第二平均分量进行小波逆变换,融合得到目标图像。
本申请实施例提供的图像增强装置中的各个单元的具体实现可以参照上述图像增强方法中的内容,在此不再赘述。
上述图像增强模型的训练装置和图像增强装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各个模块可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行上述各个模块对于的操作。
图16示出了实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是,图16示出的电子设备的计算机系统900仅是一个示例,不应该对本申请实施例的功能和使用范围带来任何限制。
如图16所示,计算机系统900包括中央处理单元(Central Processing Unit,CPU)901,其可以根据存储在只读存储器(Read-Only Memory,ROM)902中的程序或者从存储部分908加载到随机访问存储器(Random Access Memory,RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM903通过总线904彼此相连。输入/输出(Input/Output,I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分909;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如局域网(Local AreaNetwork,LAN)卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读取的计算机程序根据需要被安装入存储部分908。
特别地,根据本申请实施例,上文流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行上述流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理器(CPU)901执行时,执行本申请的装置中限定的各种功能。
在一个实施例中,还提供了一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,处理器配置为经由执行可执行指令来执行上述各方法实施例中的步骤。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所述的计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或者器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或者多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁盘存储器件、或者上述任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或者存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或者上述的任何合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何恰当的介质传输,包括但不限于:无线、电线、光缆、射频等等,或者上述的任意合适的组合。
本实施例仅用于说明本申请,本实施例的软硬件平台架构、开发环境、开发语言、消息获取源头等的选取都是可以变化的,在本申请技术方案的基础上,凡根据本申请原理对某个部分进行的改进和等同变换,均不应排除在本申请的保护范围之外。
需要说明的是,在本申请实施例和所附权利要求书中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请实施例。
所属领域的技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请提供的几个实施例中,应该理解到,所揭露的电子设备、装置和方法,可以通过其它的方式实现。
例如,以上所描述的装置实施例中单元或模块或组件的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或模块或组件可以结合或者可以集成到另一个系统,或一些单元或模块或组件可以忽略,或不执行。
又例如,上述作为分离/显示部件说明的单元/模块/组件可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元/模块/组件来实现本申请实施例的目的。
最后,需要说明的是,上文中显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
以上内容,仅为本申请实施例的具体实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。因此,本申请实施例的保护范围应以权利要求的保护范围为准。
Claims (14)
1.一种图像增强模型的训练方法,其特征在于,包括:
获取训练图像集,所述训练图像集中的各个训练样本包括输入图像以及配对的目标图像,其中,所述目标图像是由所述输入图像经色彩增强处理得到的增强图像与所述输入图像对应的HDR图像融合后得到的图像;
根据所述训练图像集对初始图像增强模型进行模型训练,得到目标图像增强模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述输入图像的RGB三通道分离,得到R通道、G通道和B通道;
根据所述R通道、所述G通道和所述B通道中每个颜色通道的颜色直方图和目标裁剪步长,分别确定每个颜色通道的最大色差阈值和最小色差阈值;
根据所述每个颜色通道的最大色差阈值和最小色差阈值,分别对所述R通道、所述G通道和所述B通道中每个颜色通道的像素值进行修正,得到所述增强图像。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每个颜色通道的最大色差阈值和最小色差阈值,分别对所述R通道、所述G通道和所述B通道中每个颜色通道的像素值进行修正,得到所述增强图像,包括:
将所述R通道中像素值大于所述R通道的最大色差阈值Rmax的像素点的像素值修正为255,将所述R通道中像素值小于所述R通道的最小色差阈值Rmin的像素点的像素值修正为0,以及将所述R通道中满足Rmin≤R(x,y)≤Rmax的像素值R(x,y)修正为Rr(x,y);
将所述G通道中像素值大于所述G通道的最大色差阈值Gmax的像素点的像素值修正为255,将所述G通道中像素值小于所述G通道的最小色差阈值Gmin的像素点的像素值修正为0,以及将所述G通道中满足Gmin≤G(x,y)≤Gmax的像素值G(x,y)修正为Gr(x,y);
将所述B通道中像素值大于所述B通道的最大色差阈值Bmax的像素点的像素值修正为255,将所述B通道中像素值小于所述B通道的最小色差阈值Bmin的像素点的像素值修正为0,以及将所述B通道中满足Bmin≤B(x,y)≤Bmax的像素值B(x,y)修正为Br(x,y);
MinRGB=min(Rmin,Gmin,Bmin),MaxRGB=max(Rmax,Gmax,Bmax)。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取所述输入图像的初始裁剪步长;
根据所述输入图像的宽度和高度、所述初始裁剪步长,确定裁剪像素点的数量n0;
将所述R通道、所述G通道和所述B通道中每个颜色通道上初始分量由小到大的顺序确定为第一裁剪顺序,以及将所述R通道、所述G通道和所述B通道中每个颜色通道上初始分量由大到小的顺序确定为第二裁剪顺序;
根据所述裁剪像素点的数量n0和所述第一裁剪顺序,对所述R通道、所述G通道和所述B通道中每个颜色通道的颜色直方图进行裁剪,分别得到所述R通道的下边界R下、所述G通道的下边界G下和所述B通道的下边界B下;
根据所述裁剪像素点的数量n0和所述第二裁剪顺序,对所述R通道、所述G通道和所述B通道中每个颜色通道的颜色直方图进行裁剪,分别得到所述R通道的上边界R上、所述G通道的上边界G上和所述B通道的上边界B上;
根据所述R通道的下边界R下和上边界R上、所述G通道的下边界G下和上边界G上、所述B通道的下边界B下和上边界B上,分别确定RGB三通道中的最小距离Dismin和RGB三通道裁剪的总范围Disall;
若所述最小距离Dismin小于第一阈值且所述总范围Disall大于第二阈值,将所述初始裁剪步长确定为所述目标裁剪步长;否则,调整所述初始裁剪步长的大小,直至所述最小距离Dismin小于所述第一阈值且所述总范围Disall大于所述第二阈值。
5.根据权利要求4所述的方法,其特征在于,所述根据所述裁剪像素点的数量n0和所述第一裁剪顺序,对所述R通道、所述G通道和所述B通道中每个颜色通道的颜色直方图进行裁剪,分别得到所述R通道的下边界R下、所述G通道的下边界G下和所述B通道的下边界B下,包括:
在所述R通道的颜色直方图中,根据所述第一裁剪顺序搜索与所述裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对所述R通道的颜色直方图进行裁剪,得到所述R通道的下边界R下;
在所述G通道的颜色直方图中,根据所述第一裁剪顺序搜索与所述裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对所述G通道的颜色直方图进行裁剪,得到所述G通道的下边界G下;
在所述B通道的颜色直方图中,根据所述第一裁剪顺序搜索与所述裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对所述B通道的颜色直方图进行裁剪,得到所述B通道的下边界B下。
6.根据权利要求4所述的方法,其特征在于,所述根据所述裁剪像素点的数量n0和所述第二裁剪顺序,对所述R通道、所述G通道和所述B通道中每个颜色通道的颜色直方图进行裁剪,分别得到所述R通道的上边界R上、所述G通道的上边界G上和所述B通道的上边界B上,包括:
在所述R通道的颜色直方图中,根据所述第二裁剪顺序搜索与所述裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对所述R通道的颜色直方图进行裁剪,得到所述R通道的上边界R上;
在所述G通道的颜色直方图中,根据所述第二裁剪顺序搜索与所述裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对所述G通道的颜色直方图进行裁剪,得到所述G通道的上边界G上;
在所述B通道的颜色直方图中,根据所述第二裁剪顺序搜索与所述裁剪像素点的数量n0匹配的n0个像素点,将搜索到的n0个像素点作为裁剪像素点对所述B通道的颜色直方图进行裁剪,得到所述B通道的上边界B上。
7.根据权利要求4所述的方法,其特征在于,所述根据所述R通道的下边界R下和上边界R上、所述G通道的下边界G下和上边界G上、所述B通道的下边界B下和上边界B上,分别确定RGB三通道中的最小距离Dismin和RGB三通道裁剪的总范围Disall,包括:
Dismin=min((R上-R下),(G上-G下),(B上-B下));
Disall=255×3-(R上+G上+B上-R下-G下-B下)。
8.根据权利要求2所述的方法,其特征在于,所述根据所述R通道、所述G通道和所述B通道中每个颜色通道的颜色直方图和目标裁剪步长,分别确定每个颜色通道的最大色差阈值和最小色差阈值,包括:
根据所述输入图像的宽度和高度、所述目标裁剪步长,确定裁剪像素点的数量n;
将所述R通道、所述G通道和所述B通道中每个颜色通道上初始分量由小到大的顺序确定为第一裁剪顺序,以及将所述R通道、所述G通道和所述B通道中每个颜色通道上初始分量由大到小的顺序确定为第二裁剪顺序;
在所述R通道的颜色直方图中,根据所述第一裁剪顺序搜索与所述裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对所述R通道的颜色直方图进行裁剪,得到所述R通道的最小色差阈值Rmin;
在所述G通道的颜色直方图中,根据所述第一裁剪顺序搜索与所述裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对所述G通道的颜色直方图进行裁剪,得到所述G通道的最小色差阈值Gmin;
在所述B通道的颜色直方图中,根据所述第一裁剪顺序搜索与所述裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对所述B通道的颜色直方图进行裁剪,得到所述B通道的最小色差阈值Bmin;
在所述R通道的颜色直方图中,根据所述第二裁剪顺序搜索与所述裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对所述R通道的颜色直方图进行裁剪,得到所述R通道的最大色差阈值Rmax;
在所述G通道的颜色直方图中,根据所述第二裁剪顺序搜索与所述裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对所述G通道的颜色直方图进行裁剪,得到所述G通道的最大色差阈值Gmax;
在所述B通道的颜色直方图中,根据所述第二裁剪顺序搜索与所述裁剪像素点的数量n匹配的n个像素点,将搜索到的n个像素点作为裁剪像素点对所述B通道的颜色直方图进行裁剪,得到所述B通道的最大色差阈值Bmax。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:
对所述增强图像进行小波变换,分解为第一低频分量和第一高频分量;
对所述HDR图像进行小波变换,分解为第二低频分量和第二高频分量;
将所述第一低频分量和所述第二低频分量加权平均,得到第一平均分量;
将所述第一高频分量和所述第二高频分量加权平均,得到第二平均分量;
对所述第一平均分量和所述第二平均分量进行小波逆变换,融合得到所述目标图像。
10.一种图像增强方法,其特征在于,包括:
获取待处理图像;
将所述待处理图像输入目标图像增强模型中,其中,所述目标图像增强模型通过训练图像集对初始图像增强模型进行模型训练得到,所述训练图像集中的各个训练样本包括输入图像以及配对的目标图像,所述目标图像是由所述输入图像经色彩增强处理得到的增强图像与所述输入图像对应的HDR图像融合后得到的图像;
获取所述目标图像增强模型输出的目标增强图像。
11.一种图像增强模型的训练装置,其特征在于,包括:
训练图像集获取模块,用于获取训练图像集,所述训练图像集中的各个训练样本包括输入图像以及配对的目标图像,其中,所述目标图像是由所述输入图像经色彩增强处理得到的增强图像与所述输入图像对应的HDR图像融合后得到的图像;
训练模块,用于根据所述训练图像集对初始图像增强模型进行模型训练,得到目标图像增强模型。
12.一种图像增强装置,其特征在于,包括:
待处理图像获取模块,用于获取待处理图像;
输入模块,用于将所述待处理图像输入目标图像增强模型中,其中,所述目标图像增强模型通过训练图像集对初始图像增强模型进行模型训练得到,所述训练图像集中的各个训练样本包括输入图像以及配对的目标图像,所述目标图像是由所述输入图像经色彩增强处理得到的增强图像与所述输入图像对应的HDR图像融合后得到的图像;
目标增强图像获取模块,用于获取所述目标图像增强模型输出的目标增强图像。
13.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至10中任一项所述的方法。
14.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011475833.5A CN113538304B (zh) | 2020-12-14 | 2020-12-14 | 图像增强模型的训练方法及装置、图像增强方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011475833.5A CN113538304B (zh) | 2020-12-14 | 2020-12-14 | 图像增强模型的训练方法及装置、图像增强方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113538304A true CN113538304A (zh) | 2021-10-22 |
CN113538304B CN113538304B (zh) | 2023-08-18 |
Family
ID=78124205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011475833.5A Active CN113538304B (zh) | 2020-12-14 | 2020-12-14 | 图像增强模型的训练方法及装置、图像增强方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113538304B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114463584A (zh) * | 2022-01-29 | 2022-05-10 | 北京百度网讯科技有限公司 | 图像处理、模型训练方法、装置、设备、存储介质及程序 |
CN114781601A (zh) * | 2022-04-06 | 2022-07-22 | 北京科技大学 | 图像超分辨率方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100183071A1 (en) * | 2009-01-19 | 2010-07-22 | Segall Christopher A | Methods and Systems for Enhanced Dynamic Range Images and Video from Multiple Exposures |
CN101833754A (zh) * | 2010-04-15 | 2010-09-15 | 青岛海信网络科技股份有限公司 | 图像增强方法及系统 |
US20160050354A1 (en) * | 2014-08-12 | 2016-02-18 | Google Technology Holdings LLC | High Dynamic Range Array Camera |
WO2017140182A1 (zh) * | 2016-02-15 | 2017-08-24 | 努比亚技术有限公司 | 一种图像合成方法及装置、存储介质 |
CN108830816A (zh) * | 2018-06-27 | 2018-11-16 | 厦门美图之家科技有限公司 | 图像增强方法及装置 |
CN110503617A (zh) * | 2019-08-29 | 2019-11-26 | 大连海事大学 | 一种基于高、低频信息融合的水下图像增强方法 |
CN110517327A (zh) * | 2019-08-30 | 2019-11-29 | 大连海事大学 | 一种基于颜色校正和对比度拉伸的水下图像增强方法 |
CN111161191A (zh) * | 2019-12-31 | 2020-05-15 | 华南理工大学 | 一种图像增强方法 |
CN111223061A (zh) * | 2020-01-07 | 2020-06-02 | Oppo广东移动通信有限公司 | 图像修正方法、修正装置、终端设备及可读存储介质 |
CN111402135A (zh) * | 2020-03-17 | 2020-07-10 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN111669514A (zh) * | 2020-06-08 | 2020-09-15 | 北京大学 | 高动态范围成像方法和装置 |
-
2020
- 2020-12-14 CN CN202011475833.5A patent/CN113538304B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100183071A1 (en) * | 2009-01-19 | 2010-07-22 | Segall Christopher A | Methods and Systems for Enhanced Dynamic Range Images and Video from Multiple Exposures |
CN101833754A (zh) * | 2010-04-15 | 2010-09-15 | 青岛海信网络科技股份有限公司 | 图像增强方法及系统 |
US20160050354A1 (en) * | 2014-08-12 | 2016-02-18 | Google Technology Holdings LLC | High Dynamic Range Array Camera |
WO2017140182A1 (zh) * | 2016-02-15 | 2017-08-24 | 努比亚技术有限公司 | 一种图像合成方法及装置、存储介质 |
CN108830816A (zh) * | 2018-06-27 | 2018-11-16 | 厦门美图之家科技有限公司 | 图像增强方法及装置 |
CN110503617A (zh) * | 2019-08-29 | 2019-11-26 | 大连海事大学 | 一种基于高、低频信息融合的水下图像增强方法 |
CN110517327A (zh) * | 2019-08-30 | 2019-11-29 | 大连海事大学 | 一种基于颜色校正和对比度拉伸的水下图像增强方法 |
CN111161191A (zh) * | 2019-12-31 | 2020-05-15 | 华南理工大学 | 一种图像增强方法 |
CN111223061A (zh) * | 2020-01-07 | 2020-06-02 | Oppo广东移动通信有限公司 | 图像修正方法、修正装置、终端设备及可读存储介质 |
CN111402135A (zh) * | 2020-03-17 | 2020-07-10 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN111669514A (zh) * | 2020-06-08 | 2020-09-15 | 北京大学 | 高动态范围成像方法和装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114463584A (zh) * | 2022-01-29 | 2022-05-10 | 北京百度网讯科技有限公司 | 图像处理、模型训练方法、装置、设备、存储介质及程序 |
CN114781601A (zh) * | 2022-04-06 | 2022-07-22 | 北京科技大学 | 图像超分辨率方法及装置 |
CN114781601B (zh) * | 2022-04-06 | 2022-12-23 | 北京科技大学 | 图像超分辨率方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113538304B (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229277B (zh) | 手势识别、手势控制及多层神经网络训练方法、装置及电子设备 | |
CN106682632B (zh) | 用于处理人脸图像的方法和装置 | |
CN112419151B (zh) | 图像退化处理方法、装置、存储介质及电子设备 | |
US20220319077A1 (en) | Image-text fusion method and apparatus, and electronic device | |
CN111985281B (zh) | 图像生成模型的生成方法、装置及图像生成方法、装置 | |
US20240013359A1 (en) | Image processing method, model training method, apparatus, medium and device | |
CN113538304B (zh) | 图像增强模型的训练方法及装置、图像增强方法及装置 | |
CN110599554A (zh) | 人脸肤色的识别方法和装置、存储介质及电子装置 | |
CN111079864A (zh) | 一种基于优化视频关键帧提取的短视频分类方法及系统 | |
CN113449851A (zh) | 数据处理方法及设备 | |
CN114037053A (zh) | 基于gan的车辆视觉感知数据增强方法及相关设备 | |
CN112950640A (zh) | 视频人像分割方法、装置、电子设备及存储介质 | |
CN114627269A (zh) | 一种基于深度学习目标检测的虚拟现实安防监控平台 | |
CN115482529A (zh) | 近景色水果图像识别方法、设备、存储介质及装置 | |
CN110473176B (zh) | 图像处理方法及装置、眼底图像处理方法、电子设备 | |
CN113610720A (zh) | 视频去噪方法及装置、计算机可读介质和电子设备 | |
CN113658065A (zh) | 图像降噪方法及装置、计算机可读介质和电子设备 | |
CN113658122A (zh) | 图像质量评价方法、装置、存储介质与电子设备 | |
CN112565887A (zh) | 一种视频处理方法、装置、终端及存储介质 | |
US20230063201A1 (en) | Image processing device and super-resolution processing method | |
CN116229188A (zh) | 图像处理显示方法、分类模型的生成方法及其设备 | |
CN114283087A (zh) | 一种图像去噪方法及相关设备 | |
Huang et al. | An efficient single image enhancement approach using luminance perception transformation | |
CN114119413A (zh) | 图像处理方法及装置、可读介质和移动终端 | |
CN108596893B (zh) | 一种图像处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40053186 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |