CN116579945B - 一种基于扩散模型的夜间图像复原方法 - Google Patents

一种基于扩散模型的夜间图像复原方法 Download PDF

Info

Publication number
CN116579945B
CN116579945B CN202310534169.4A CN202310534169A CN116579945B CN 116579945 B CN116579945 B CN 116579945B CN 202310534169 A CN202310534169 A CN 202310534169A CN 116579945 B CN116579945 B CN 116579945B
Authority
CN
China
Prior art keywords
image
noise
night
diffusion
gaussian
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310534169.4A
Other languages
English (en)
Other versions
CN116579945A (zh
Inventor
杨燕
刘言
江永全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202310534169.4A priority Critical patent/CN116579945B/zh
Publication of CN116579945A publication Critical patent/CN116579945A/zh
Application granted granted Critical
Publication of CN116579945B publication Critical patent/CN116579945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种基于扩散模型的夜间图像复原方法,属于计算机视觉技术领域,采用对白天正常光图像正向加噪、反向去噪扩散处理:为了同时恢复夜间图像的清晰度,而且还能够减小高频噪声,进行端到端的夜间图像复原,本发明采用了基于扩散模型深度神经网络的夜间图像复原框架,以此最大程度地利用其去噪特性;同时,在极其黑暗、嘈杂的条件下始终如一地保留高频细节,所提出的框架不仅可应用于交通领域,也能延伸到其他真实夜间场景的图像复原领域中,提高了方法的普适性。

Description

一种基于扩散模型的夜间图像复原方法
技术领域
本发明属于计算机视觉技术领域,具体属于RGB真彩色图像复原技术。
背景技术
图像复原技术一直是计算机视觉领域的一大热点研究课题。真实世界中的夜间视频图像成像会受到噪声条件、低照度的光学模糊和其他像差的影响,从而导致视觉监测系统的准确率和精度下降,引发安全隐患和增加轨道维护运行成本。目前,夜间图像复原技术研究课题尚不成熟,且大多数夜间图像复原的研究课题,都采用了Retinex及其改进的方法,将低照度图像分解为反射光和照度,进一步利用反射光复原增强后的图像。但是这种方法容易引入大量的噪声,通常还需要复杂的后处理操作以防止复原后的图像出现重影伪影。因此,研究如何在弱光下对极端噪声进行消除和提高图像的清晰度,对夜间图像复原是十分必要的工作。
近几年,深度学习推进了计算机视觉技术的发展。其中,扩散模型在图像生成领域取得了巨大的成功。并且与传统的深度学习方法相比,扩散模型往往会取得比较优秀的成绩。类似OpenAI的DALL-E2,Google的Image,StabilityAI的Stable Diffusion等人工智能绘画技术,都是基于扩散模型来进行图像生成的。在深度学习中,去噪扩散模型定义了一个正向扩散过程,通过逐渐扰动输入数据将数据映射到噪声。然后,又通过一个可学习的、参数化的反向过程执行迭代去噪生成数据,该过程从纯随机噪声开始不断去除噪声。由于其原理就是通过去噪采样生成图像,从而也非常适合在弱光下对极端噪声的进行消除,最终达到对夜间图像复原目的。
通过对现有的专利及相关技术的检索发现,现有的与夜间图像复原有关的方法有:
(1)凌泽乐;高明;金长新.一种基于Retinex的暗图像增强方法,CN113344798A[P].2021.提出了一种基于Retinex的暗图像增强方法。该方法设计了神经网络的新型架构,解决了训练过程中梯度消失问题。同时采用双线性插值上采样方法,可以将增强后的暗图像显示更加清晰。
(2)李昊伶;朱锐;徐天怡;殷嫦藜;吴林芮.基于改进图像增强算法与生成对抗网络的夜景复原方法,CN112669242A[P].2021.提出了一种基于改进图像增强算法与生成对抗网络的夜景复原方法。该方法采集夜间图像,并利用MSRCP算法对夜间图像进行增强处理,同时判断增强处理后的夜间图像是否需要进行风格迁移。再对增强处理后的夜间图像依次进行暗通道先验去雾和清晰度处理,完成夜景复原。
(3)贾平;蒋春华;赵健;连磊;管才路;赵佳佳;杨王伟.轨道交通视频监控图像增强算法,CN112581404A[P].2021.提出了一种轨道交通视频监控图像增强算法。该方法通过一种高、低频分离的亮度调整算法,对于低频和高频图像采用各自合适的不同方法进行分别增强。
可以看出现有的夜间图像增强方法有其优点,但是也存在着不足,同时面向夜间图像复原方法较少。通过对现有文献的查阅发现,目前存在的方法存在着以下不足:(1)通过Retinex及其改进方法进行夜间图像增强,虽然提高了图像的清晰度,但是复原的图像容易引入伪影,质量较差。(2)使用亮度调整的方法,能够增加图像的细节纹理,但是同样容易引入大量高频噪声。(3)基于生成式对抗网络的图像复原方法,容易出现训练不稳定的情况,且会出现生成的图像不真实的问题。在实际情况中,由于视觉系统采集的夜间图像清晰度会对图像目标识别、安全检测等工作产生重要的影响,因此我们需要寻求一种不仅可以恢复光线充足的图像,而且可以重建对高级任务(如目标识别)有用的高频细节的方法。
发明内容
本发明的目的是提供一种基于扩散模型的夜间图像复原方法,它能有效地解决夜间图像复原的技术问题。
本发明的目的是通过以下技术方案来实现的:一种基于扩散模型的夜间图像复原方法,包括以下步骤:
步骤一、对白天正常光图像正向加噪、反向去噪扩散处理:
(1)给定分辨率为720×480像素的i对夜间弱光和白天正常光的图像,其中,白天正常光的图像定义为yi,夜间弱光的图像定义为xi,i的取值范围为[1000,5000];在正向扩散过程中,通过方差取值范围为[0,1]的方差表{β123,...,βt}对白天正常光的图像yi重复添加高斯噪声;在yi中取一帧图像定义为y0,y0将在T个时间步长内逐渐退化成高斯噪声图像yt,其中t定义为时间,t∈[1,T],T=1000;此正向扩散过程q公式化为:
其中αt=1-βt,δt=α1α2α3...αt,N表示高斯正态分布;通过小方差的高斯噪声αt重复叠加步骤,y0逐渐变成类似于标准高斯形式的高斯噪声图像yt
(2)在反向扩散过程中,通过逐渐去噪,从高斯噪声图像yt中重建一帧白天正常光的图像y0,经过中间T个时间步长恢复白天正常光的图像y0;每个反向扩散步骤使用均值为μθ的神经网络pθ写成:
其中均值μθ公式化为:
其中εθ是U-net型的神经网络pθ估计输出的噪声;神经网络pθ的作用是学习每个时间步长对高斯正态分布N的建模;同时,该神经网络pθ以夜间弱光图像x0做为条件连接到yt,建立学习目标L如下:
L=Et~[1,T],ε~N(||εθθ(x0,yt,t)||2) (4)
通过不断训练,减小学习目标L的值;
步骤二、优化以夜间弱光的图像为条件的反向去噪扩散过程:
首先分别将白天正常光的图像yi和夜间弱光的图像xi的分辨率调整为16的倍数,再按照图像维度对图像yi和图像xi进行网络单元格划分,每个网格单元格的像素为16×16;并通过在水平和垂直维度上以16的步长在该网格上移动,来提取所有像素为64×64的图像补丁块;最后将D定义为提取的补丁块的总数,d定义为重叠补丁位置的字典;
(1)对于反向去噪扩散采样的每个时间t的步长,使用神经网络估计输出的噪声εθ(x0 d,yt d,t)来估计所有重叠补丁块位置d∈{1,...,D}的加性高斯噪声;
(2)补丁块区域位置对应重叠的噪声εθ(x0,yt,t)进行求和后,除以重叠的次数M,得到更新后的噪声估计Ωt
(3)通过更新后的噪声估计Ωt,执行反向去噪扩散过程;
步骤三、扩散模型网络的输出:
将分辨率为720×480像素的夜间弱光的图像输入已训练好的扩散模型,扩散模型网络自动输出细节清晰、低噪声和亮度提升后的复原图像。
与现有技术相比,本发明的优点和效果:
(1)该发明提出了一个基于扩散模型的夜间图像复原框架。该框架简单,高效,使用者仅需输入夜间图像,通过框架处理,自动得到亮度和细节提升的图像复原输出结果。
(2)该发明使用的扩散模型网络能够将夜间弱光图像复原为白天正常光图像,同时去噪性能较强。
(3)该发明提出的框架,能够扩展到其他相关的夜间图像增强领域,解决类似问题,具有普适性。
附图说明
图1为本发明白天正常光图像正向加噪扩散、反向去噪扩散的效果示意图。
图2为本发明夜间图像复原框架示意图。
图3为本发明中扩散模型的网络的结构图。
具体实施方式
以下结合附图实施对本发明作进一步详细描述。
一种基于扩散模型的夜间图像复原方法,包括以下步骤:
步骤一、对白天正常光图像正向加噪、反向去噪扩散处理:
(1)给定分辨率为720×480像素的i对夜间弱光和白天正常光的图像,其中,白天正常光的图像定义为yi,夜间弱光的图像定义为xi,i的取值范围为[1000,5000];在正向扩散过程中,通过方差取值范围为[0,1]的方差表{β123,...,βt}对白天正常光的图像yi重复添加高斯噪声;在yi中取一帧图像定义为y0,y0将在T个时间步长内逐渐退化成高斯噪声图像yt,其中t定义为时间,t∈[1,T],T=1000;此正向扩散过程q公式化为:
其中αt=1-βt,δt=α1α2α3...αt,N表示高斯正态分布;通过小方差的高斯噪声αt重复叠加步骤,y0逐渐变成类似于标准高斯形式的高斯噪声图像yt
(2)在反向扩散过程中,通过逐渐去噪,从高斯噪声图像yt中重建一帧白天正常光的图像y0,经过中间T个时间步长恢复白天正常光的图像y0;每个反向扩散步骤使用均值为μθ的神经网络pθ写成:
其中均值μθ公式化为:
其中εθ是U-net型的神经网络pθ估计输出的噪声;神经网络pθ的作用是学习每个时间步长对高斯正态分布N的建模;同时,该神经网络pθ以夜间弱光图像x0做为条件连接到yt,建立学习目标L如下:
L=Et~[1,T],ε~N(||εθθ(x0,yt,t)||2) (4)
通过不断训练,减小学习目标L的值;
步骤二、优化以夜间弱光的图像为条件的反向去噪扩散过程:
首先分别将白天正常光的图像yi和夜间弱光的图像xi的分辨率调整为16的倍数,再按照图像维度对图像yi和图像xi进行网络单元格划分,每个网格单元格的像素为16×16;并通过在水平和垂直维度上以16的步长在该网格上移动,来提取所有像素为64×64的图像补丁块;最后将D定义为提取的补丁块的总数,d定义为重叠补丁位置的字典;
(1)对于反向去噪扩散采样的每个时间t的步长,使用神经网络估计输出的噪声εθ(x0 d,yt d,t)来估计所有重叠补丁块位置d∈{1,...,D}的加性高斯噪声;
(2)补丁块区域位置对应重叠的噪声εθ(x0,yt,t)进行求和后,除以重叠的次数M,得到更新后的噪声估计Ωt
(3)通过更新后的噪声估计Ωt,执行反向去噪扩散过程;
步骤三、扩散模型网络的输出:
将分辨率为720×480像素的夜间弱光的图像输入已训练好的扩散模型,扩散模型网络自动输出细节清晰、低噪声和亮度提升后的复原图像。
对本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。

Claims (1)

1.一种基于扩散模型的夜间图像复原方法,其特征包括以下步骤:
步骤一、对白天正常光图像正向加噪、反向去噪扩散处理:
(1)给定分辨率为720×480像素的i对夜间弱光和白天正常光的图像,其中,白天正常光的图像定义为yi,夜间弱光的图像定义为xi,i的取值范围为[1000,5000];在正向扩散过程中,通过方差取值范围为[0,1]的方差表{β123,...,βt}对白天正常光的图像yi重复添加高斯噪声;在yi中取一帧图像定义为y0,y0将在T个时间步长内逐渐退化成高斯噪声图像yt,其中t定义为时间,t∈[1,T],T=1000;此正向扩散过程q公式化为:
其中αt=1-βt,δt=α1α2α3...αt,N表示高斯正态分布;通过小方差的高斯噪声αt重复叠加步骤,y0逐渐变成类似于标准高斯形式的高斯噪声图像yt
(2)在反向扩散过程中,通过逐渐去噪,从高斯噪声图像yt中重建一帧白天正常光的图像y0,经过中间T个时间步长恢复白天正常光的图像y0;每个反向扩散步骤使用均值为μθ的神经网络pθ写成:
其中均值μθ公式化为:
其中εθ是U-net型的神经网络pθ估计输出的噪声;神经网络pθ的作用是学习每个时间步长对高斯正态分布N的建模;同时,该神经网络pθ以夜间弱光图像x0做为条件连接到yt,建立学习目标L如下:
L=Et~[1,T],ε~N(||εθθ(x0,yt,t)||2) (4)
通过不断训练,减小学习目标L的值;
步骤二、优化以夜间弱光的图像为条件的反向去噪扩散过程:
首先分别将白天正常光的图像yi和夜间弱光的图像xi的分辨率调整为16的倍数,再按照图像维度对图像yi和图像xi进行网络单元格划分,每个网格单元格的像素为16×16;并通过在水平和垂直维度上以16的步长在该网格上移动,来提取所有像素为64×64的图像补丁块;最后将D定义为提取的补丁块的总数,d定义为重叠补丁位置的字典;
(1)对于反向去噪扩散采样的每个时间t的步长,使用神经网络估计输出的噪声εθ(x0 d,yt d,t)来估计所有重叠补丁块位置d∈{1,...,D}的加性高斯噪声;
(2)补丁块区域位置对应重叠的噪声εθ(x0,yt,t)进行求和后,除以重叠的次数M,得到更新后的噪声估计Ωt
(3)通过更新后的噪声估计Ωt,执行反向去噪扩散过程;
步骤三、扩散模型网络的输出:
将分辨率为720×480像素的夜间弱光的图像输入已训练好的扩散模型,扩散模型网络自动输出细节清晰、低噪声和亮度提升后的复原图像。
CN202310534169.4A 2023-05-12 2023-05-12 一种基于扩散模型的夜间图像复原方法 Active CN116579945B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310534169.4A CN116579945B (zh) 2023-05-12 2023-05-12 一种基于扩散模型的夜间图像复原方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310534169.4A CN116579945B (zh) 2023-05-12 2023-05-12 一种基于扩散模型的夜间图像复原方法

Publications (2)

Publication Number Publication Date
CN116579945A CN116579945A (zh) 2023-08-11
CN116579945B true CN116579945B (zh) 2024-02-27

Family

ID=87535308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310534169.4A Active CN116579945B (zh) 2023-05-12 2023-05-12 一种基于扩散模型的夜间图像复原方法

Country Status (1)

Country Link
CN (1) CN116579945B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117197002B (zh) * 2023-11-07 2024-02-02 松立控股集团股份有限公司 一种基于感知扩散的图像复原方法
CN117557589A (zh) * 2023-11-08 2024-02-13 深圳市闪剪智能科技有限公司 基于神经网络的线条图上色方法、设备及存储介质
CN118096583B (zh) * 2024-04-28 2024-08-13 武汉纺织大学 一种基于补丁的去噪扩散模型的高光去除方法
CN118279178B (zh) * 2024-05-29 2024-09-13 华侨大学 一种基于扩散生成模型的快速人脸图像复原方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859147A (zh) * 2019-03-01 2019-06-07 武汉大学 一种基于生成对抗网络噪声建模的真实图像去噪方法
CN112669242A (zh) * 2021-03-16 2021-04-16 四川大学 基于改进图像增强算法与生成对抗网络的夜景复原方法
CN115239593A (zh) * 2022-07-29 2022-10-25 平安科技(深圳)有限公司 图像复原方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859147A (zh) * 2019-03-01 2019-06-07 武汉大学 一种基于生成对抗网络噪声建模的真实图像去噪方法
CN112669242A (zh) * 2021-03-16 2021-04-16 四川大学 基于改进图像增强算法与生成对抗网络的夜景复原方法
CN115239593A (zh) * 2022-07-29 2022-10-25 平安科技(深圳)有限公司 图像复原方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN116579945A (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN116579945B (zh) 一种基于扩散模型的夜间图像复原方法
CN109859147B (zh) 一种基于生成对抗网络噪声建模的真实图像去噪方法
CN111915530B (zh) 一种基于端到端的雾霾浓度自适应神经网络图像去雾方法
Wang et al. Dehazing for images with large sky region
CN110517203B (zh) 一种基于参考图像重建的去雾方法
CN111028163A (zh) 一种基于卷积神经网络的联合图像去噪与弱光增强方法
CN113052814B (zh) 基于Retinex和注意力机制的暗光图像增强方法
Wang et al. MAGAN: Unsupervised low-light image enhancement guided by mixed-attention
CN108492270B (zh) 一种基于模糊核估计和变分重构的超分辨率方法
CN110211070B (zh) 一种基于局部极值的低照度彩色图像增强方法
CN112070688A (zh) 一种基于上下文引导生成对抗网络的单幅图像去雾方法
CN113052776A (zh) 基于多尺度深度图像先验的无监督图像去雾方法
CN116228550A (zh) 一种基于生成对抗网络的图像自增强去雾算法
CN115526779A (zh) 一种基于动态注意力机制的红外图像超分辨率重建方法
CN117994167B (zh) 融合并行多卷积注意力的扩散模型去雾方法
CN117974459A (zh) 一种融合物理模型和先验的低照度图像增强方法
CN111626944B (zh) 一种基于时空金字塔网络和对抗自然先验的视频去模糊方法
CN116128768B (zh) 一种带有去噪模块的无监督图像低照度增强方法
CN117196940A (zh) 一种基于卷积神经网络的适用于真实场景图像的超分辨率重构方法
CN111489302A (zh) 一种雾气环境下海事图像增强方法
CN116152107A (zh) 一种基于细节恢复的单幅图像去雾方法
CN115760640A (zh) 基于含噪Retinex模型的煤矿低光照图像增强方法
CN115619674A (zh) 一种低照度视频增强方法、系统及存储介质
Cheng et al. Two-stage image dehazing with depth information and cross-scale non-local attention
Wang et al. Three-channel cascade network for underwater image enhancement

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant