CN113379635A - 图像处理方法及装置,模型训练方法、装置及存储介质 - Google Patents
图像处理方法及装置,模型训练方法、装置及存储介质 Download PDFInfo
- Publication number
- CN113379635A CN113379635A CN202110679122.8A CN202110679122A CN113379635A CN 113379635 A CN113379635 A CN 113379635A CN 202110679122 A CN202110679122 A CN 202110679122A CN 113379635 A CN113379635 A CN 113379635A
- Authority
- CN
- China
- Prior art keywords
- image
- processed
- chrominance
- color difference
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 127
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 167
- 230000007246 mechanism Effects 0.000 claims description 83
- 230000004075 alteration Effects 0.000 claims description 61
- 230000006870 function Effects 0.000 claims description 27
- 238000003702 image correction Methods 0.000 claims description 24
- 238000013527 convolutional neural network Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 16
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 230000002194 synthesizing effect Effects 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 230000004048 modification Effects 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims description 5
- 238000004532 chromating Methods 0.000 claims 1
- 238000013136 deep learning model Methods 0.000 description 13
- 230000003287 optical effect Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000003708 edge detection Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241001326510 Phacelia sericea Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000007888 film coating Substances 0.000 description 1
- 238000009501 film coating Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Processing (AREA)
- Geometry (AREA)
Abstract
本公开涉及一种图像处理方法及装置,模型训练方法、装置及存储介质。该图像处理方法包括:获取待处理图像;将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像;其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。采用本公开的这种方法,能够快速去除图像中的色差得到干净无色差的目标图像。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法及装置,模型训练方法、装置及存储介质。
背景技术
众所周知,摄像机的镜头色差会导致拍摄得到的图像中物体边缘出现不属于物体的颜色,我们将物体边缘出现的该颜色称为色差色边(即一种光学色差现象)。例如,使用数码相机、监控摄像头等数字成像设备在逆光、大光圈条件下拍摄高动态(HDR)场景图像时,得到的图像中高反差区域的边缘容易出现紫边、蓝边、红边、绿边等色差色边。色差色边的形成原因可以认为是相机镜头只能准确地聚焦一种波长的光线,而无法将其它波长的光线准确地聚焦。
相关技术中,可以通过改进光学镜头的材质或者对光学镜头进行覆膜工艺等手段来减弱色差色边现象,但是这会极大地增加摄像机的硬件成本,且对色差色边的抑制效果较差。近些年,通过图像处理算法来去除图像中的色差色边的方式因成本低效果好而受到了越来越多的关注。具体地,使用图像处理算法去除图像中的色差色边的方式可以分为三个步骤:第一步,对图像进行高反差区域边缘检测(物体边缘检测),由于色差色边通常出现在高反差区域的边缘,因此通过检测高反差区域边缘就可以确定色差色边可能出现的位置。第二步,对物体边缘的像素点进行色差判断,即在找到高反差区域边缘后,需要对边缘的颜色进行色差判断,以排除非色差边缘。第三步,对物体边缘的存在色差的像素点进行色差抑制或色彩还原处理,以恢复边缘原有的颜色。
然而,上述使用图像处理算法去除图像中的色差色边的方式中的每一步骤,都有可能发生误判,从而影响去除色差色边的最终效果。比如,在物体边缘检测错误时,可能导致原本存在色差色边的物体边缘,因未被确定为物体边缘而导致未对该色差色边进行色差抑制和色彩还原处理,从而导致去除色差色边的效果较差。又如,对色差色边进行色差抑制时有可能造成色彩丢失,对色差色边进行色彩还原时有可能引入新的错误色彩形成新的色差色边,这也会导致去除色差色边的效果较差。
发明内容
为克服相关技术中存在的问题,本公开提供一种图像处理方法及装置,模型训练方法、装置及存储介质,以提供一种与相关技术不同的方式来去除图像中的色差色边,并提升去除图像中色差色边的效果。
根据本公开实施例的第一方面,提供一种图像处理方法,所述方法包括:
获取待处理图像;
将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像;
其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。
可选地,与所述无色差图像对应的有色差图像通过如下方式得到:
将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;
根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;
将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
可选地,所述去色差处理模型通过以下训练方式得到:
根据所述训练数据集以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y_)=c×|y-y_|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y_与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
可选地,所述去色差处理模型包括预处理模块,注视机制模块,合成模块;所述将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像,包括:
将所述待处理图像输入所述预处理模块,所述预处理模块将所述待处理图像中的亮度信号与色度信号进行分离,得到与所述待处理图像的亮度信号对应的待处理亮度图像,以及得到与所述待处理图像的色度信号对应的待处理色度图像,并将所述待处理亮度图像、所述待处理色度图像输入所述注视机制模块;
所述注视机制模块根据所述待处理亮度图像中的物体边缘特征信息和所述待处理色度图像进行色差修正值计算,得到待处理色度图像修正信息,并将所述待处理色度图像、所述待处理亮度图像、所述待处理色度图像修正信息输入所述合成模块;
所述合成模块根据所述待处理色度图像修正信息修正所述待处理色度图像,得到修正后的待处理色度图像,并将所述修正后的待处理色度图像与所述待处理亮度图像合成所述目标图像,并输出所述目标图像。
可选地,所述注视机制模块包括依次串联的色度信息卷积层、色度信息激活层、色度信息乘法层以及色度信息合并处理层;
所述色度信息卷积层用于,对所述注视机制模块的输入数据进行卷积处理,得到第一色度图像特征;
所述色度信息激活层用于,对所述第一色度图像特征进行激活操作,得到第二色度图像特征;
所述色度信息乘法层用于,对所述注视机制模块的输入数据和所述第二色度图像特征进行同位点乘处理,得到所述第三色度图像特征;
所述色度信息合并处理层用于,将所述第三色度图像特征与所述待处理亮度图像中的物体边缘特征信息进行合并处理,得到所述待处理色度图像修正信息。
可选地,所述注视机制模块为串联的多个注视机制模块,所述多个注视机制模块中的首个注视机制模块的输入数据为所述待处理色度图像,所述多个注视机制模块中的非首个注视机制模块的输入数据为上一注视机制模块的输出数据,所述待处理色度图像修正信息为所述多个注视机制模块中的最后一个注视机制模块的输出数据。
可选地,在所述获取待处理图像之前,包括:
响应于用户的输入操作,获取用户输入的图像;
在所述用户输入的图像的图像格式为RGB格式的情况下,对所述用户输入的图像进行格式转换,得到YUV格式的所述待处理图像。
可选地,所述目标图像的图像格式为所述YUV格式,在得到所述去色差处理模型输出的目标图像之后,包括:
对所述目标图像进行格式转换,得到图像格式为所述RGB格式的目标图像;
向所述用户的终端反馈所述RGB格式的目标图像。
根据本公开实施例的第二方面,提供一种去色差处理模型的训练方法,所述方法包括:
获取一个或多个无色差图像,并根据所述无色差图像构造对应的有色差图像;
根据一个或多个所述无色差图像和对应的所述有色差图像生成训练数据集;
根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型。
可选地,所述根据所述无色差图像构造对应的有色差图像,包括:
将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;
根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;
将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
可选地,所述根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型,包括:
根据所述训练数据集以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y_)=c×|y-y_|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y_与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
根据本公开实施例的第三方面,提供一种图像处理装置,所述装置包括:
获取模块,被配置为获取待处理图像;
输入模块,被配置为将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像;
其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。
可选地,与所述无色差图像对应的有色差图像通过如下方式得到:
将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;
根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;
将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
可选地,所述装置还包括训练模块,被配置为通过以下方式训练得到所述去色差处理模型:
根据所述训练数据集以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y_)=c×|y-y_|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y_与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
可选地,所述去色差处理模型包括预处理模块,注视机制模块,合成模块;所述输入模块用于:
将所述待处理图像输入所述预处理模块,所述预处理模块将所述待处理图像中的亮度信号与色度信号进行分离,得到与所述待处理图像的亮度信号对应的待处理亮度图像,以及得到与所述待处理图像的色度信号对应的待处理色度图像,并将所述待处理亮度图像、所述待处理色度图像输入所述注视机制模块;所述注视机制模块根据所述待处理亮度图像中的物体边缘特征信息和所述待处理色度图像进行色差修正值计算,得到待处理色度图像修正信息,并将所述待处理色度图像、所述待处理亮度图像、所述待处理色度图像修正信息输入所述合成模块;所述合成模块根据所述待处理色度图像修正信息修正所述待处理色度图像,得到修正后的待处理色度图像,并将所述修正后的待处理色度图像与所述待处理亮度图像合成所述目标图像,并输出所述目标图像。
可选地,所述注视机制模块包括依次串联的色度信息卷积层、色度信息激活层、色度信息乘法层以及色度信息合并处理层;
所述色度信息卷积层用于,对所述注视机制模块的输入数据进行卷积处理,得到第一色度图像特征;
所述色度信息激活层用于,对所述第一色度图像特征进行激活操作,得到第二色度图像特征;
所述色度信息乘法层用于,对所述注视机制模块的输入数据和所述第二色度图像特征进行同位点乘处理,得到所述第三色度图像特征;
所述色度信息合并处理层用于,将所述第三色度图像特征与所述待处理亮度图像中的物体边缘特征信息进行合并处理,得到所述待处理色度图像修正信息。
可选地,所述注视机制模块为串联的多个注视机制模块,所述多个注视机制模块中的首个注视机制模块的输入数据为所述待处理色度图像,所述多个注视机制模块中的非首个注视机制模块的输入数据为上一注视机制模块的输出数据,所述待处理色度图像修正信息为所述多个注视机制模块中的最后一个注视机制模块的输出数据。
可选地,所述装置还包括:
响应模块,被配置为在所述获取待处理图像之前,响应于用户的输入操作,获取用户输入的图像;
第一转换模块,被配置为在所述用户输入的图像的图像格式为RGB格式的情况下,对所述用户输入的图像进行格式转换,得到YUV格式的所述待处理图像。
可选地,所述目标图像的图像格式为所述YUV格式,所述装置还包括:
第二转换模块,被配置为在得到所述去色差处理模型输出的目标图像之后,对所述目标图像进行格式转换,得到图像格式为所述RGB格式的目标图像;
反馈模块,被配置为向所述用户的终端反馈所述RGB格式的目标图像。
根据本公开实施例的第四方面,提供一种去色差处理模型的训练装置,所述装置包括:
构造模块,用于获取无色差图像,并根据所述无色差图像构造对应的有色差图像;
执行模块,用于将所述无色差图像和所述有色差图像作为训练数据集;
训练模块,用于根据所述训练数据集训练得到所述去色差处理模型。
根据本公开实施例的第五方面,提供一种图像处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待处理图像;
将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像;
其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。
根据本公开实施例的第六方面,提供一种去色差处理模型的训练装置,所述装置包括:
获取模块,被配置为获取一个或多个无色差图像,并根据所述无色差图像构造对应的有色差图像;
生成模块,被配置为根据一个或多个所述无色差图像和对应的所述有色差图像生成训练数据集;
训练模块,被配置为根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型。
可选地,所述获取模块,包括:
分离子模块,被配置为将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;
添加子模块,被配置为根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;
合成子模块,被配置为将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
可选地,所述训练模块,被配置为:
根据所述训练数据集以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y_)=c×|y-y_|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y_与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
根据本公开实施例的第七方面,提供一种去色差处理模型的训练装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取一个或多个无色差图像,并根据所述无色差图像构造对应的有色差图像;
根据一个或多个所述无色差图像和对应的所述有色差图像生成训练数据集;
根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型。
根据本公开实施例的第八方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面、第二方面所提供的任一种方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过获取待处理图像,并将该待处理图像输入去色差处理模型,得到去色差处理模型输出的目标图像。这种使用模型处理的方式相较于相关技术中的方式可以提升对图像进行去色差处理的速度和准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种图像处理方法的流程图。
图2是根据一示例性实施例示出的一种构造训练数据集的方法的流程图。
图3是根据一示例性实施例示出的一种去色差处理模型架构图。
图4是根据一示例性实施例示出的一种图像处理装置的框图。
图5是根据一示例性实施例示出的一种装置的框图。
图6是根据一示例性实施例示出的另一种装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
为了使本领域普通技术人员更加容易理解本公开的技术方案,下面首先对本公开中涉及到的相关专业术语进行简单解释。
YUV是视频、图片、相机等应用中使用的一类图像格式,实际上是所有“YUV”像素格式共有的颜色空间的名称。YUV格式与RGB格式(红、绿、蓝)不同,YUV是用一个称为Y(相当于灰度)的“亮度”分量和两个“色度”分量表示,分别称为U即R-Y(蓝色投影)和V即B-Y(红色投影),这种色彩的表示方法就是所谓的YUV色彩空间表示。采用YUV色彩空间的重要性是它的亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V信号分量,那么这样表示的图像就是黑白灰度图像。
图像中出现色差色边的原理为,由于自然界大多数光源都是由不同波长的光线混合而成的,而相机光学镜头对于不同波长的光线的折射率是不同的,因此在设计光学镜头时,常常选择将绿色光线正确对焦,由此导致其他颜色的光线就会出现对焦不准的问题。由于多种颜色的光线未能正确对焦,所以使用光学镜头成像时会产生色差色边现象。色差色边中的色差紫边是最常见的色边。一种可能的情况,在使用数码相机拍摄照片的过程中因被拍摄物体的边缘明暗反差较大,在高光和低光边缘交界处,可能会因为蓝色和红色通道不能完全准确对焦而出现本不存在的紫红色边缘。
在对本公开的技术方案进行详细地实施例说明之前,需声明的是,本公开实施例中所使用的与用户相关的信息,如从用户侧获取的待处理图像、以及从用户侧获取到的用于训练去色差处理模型的训练数据,均为在获得用户授权或同意的情况下采集/使用的。
下面对本公开的技术方案进行详细的实施例说明。
图1是根据一示例性实施例示出的一种图像处理方法的流程图,如图1所示,该图像处理方法可用于终端,也可用于摄像机中,如用在相机成像后对得到的图像进行后处理的算法中,还可用于服务器中。该图像处理方法可以包括以下步骤。
在步骤S11中,获取待处理图像。
其中,所述待处理图像中的物体边缘存在色差色边。
值得说明的是,在本公开中物体边缘的其他说法为物体轮廓、高反差区域边缘。其中高反差(High Contrast)是指黑白影像的反差范围,由一个从黑到白等间隔灰的(标度)色阶上的技术(英调)来描述的。物体边缘可理解为高光和低光边缘交界位置。
在本公开的图像处理方法应用于用户终端或服务器的场景下,一种可实现的实施方式,在所述获取待处理图像之前,所述图像处理方法还可以包括以下步骤:
响应于用户的输入操作,获取用户输入的图像;在所述用户输入的图像的图像格式为RGB格式的情况下,对所述用户输入的图像进行格式转换,得到YUV格式的所述待处理图像;在所述用户输入的图像的图像格式为YUV格式的情况下,将所述用户输入的图像直接作为所述待处理图像。
本领域普通技术人员应当理解的是,图像格式RGB与YUV之间可以相互进行转换。
采用这种方式,可以适应于用户的需求,对用户上传或选择的图像(该图像可以是用户从任意渠道获取的图像)进行去除色差色边处理。
在步骤S12中,将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像。
所述待处理图像和所述目标图像的图像格式为YUV格式。
其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。
无色差图像可以是由高质量光学镜头拍摄的无色差色边的干净图像。或者,无色差图像可以是从网络上收集的无色差色边的干净图像。本公开对无色差图像的获取方式不作具体地限制。
可选地,所述训练数据集包括有色差图像以及与有色差图像对应的无色差图像,与所述无色差图像对应的有色差图像通过如下方式得到:
将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
示例地,所述根据所述无色差图像构造训练数据集的方式如图2所示,包括以下步骤:
在步骤S21中,将所述无色差图像中的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像。
具体地,将无色差图像中的亮度信号Y与色度信号UV进行分离,得到与无色差图像的亮度信号Y对应的亮度图像,以及得到与无色差图像的色度信号UV对应的色度图像。其中,无色差图像的亮度信号Y对应的亮度图像为黑白灰度图。
在步骤S22中,对所述亮度图像进行物体边缘检测,得到与所述亮度图像对应的物体边缘图像。
一种可能的实施方式,可以使用与Canny边缘检测算法相类似的边缘检测算法对无色差图像的亮度图像进行边缘检测,得到与无色差图像对应的物体边缘图像。物体边缘图像可以为二值图像。
在步骤S23中,根据所述物体边缘图像中表征物体边缘的像素点的位置,确定所述色度图像中的物体边缘位置信息。
具体地,在步骤S22中得到物体边缘图像之后,可根据物体边缘图像中表征物体边缘的像素点的位置,确定色度图像中的物体边缘位置信息。
在步骤S24中,根据所述物体边缘位置信息,在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像。
示例地,假设预设宽度为3个像素宽度,根据物体边缘位置信息,在色度图像中的物体边缘向物体之外的方向添加3个像素宽度的色差色边,得到新的色度图像。其中,添加的色差色边不覆盖物体边缘所在的像素点。再示例地,假设预设宽度为2个像素宽度,色度图像中的物体边缘的宽度为1个像素点(亦或为2、3个像素点)。在色度图像中的该1个像素点的目标侧添加2个像素宽度的预设颜色的色差色边,得到新的色度图像。其中,目标侧为物体外侧。
在步骤S25中,将所述亮度图像和所述新的色度图像进行合成处理,得到有色差图像,其中,所述有色差图像和所述无色差图像的图像格式为所述YUV格式。
将亮度图像(即Y分量信息)和新的色度图像(即UV分量信息)进行合成处理,得到YUV格式的有色差图像。
在步骤S26中,将所述有色差图像和所述无色差图像作为所述训练数据集。
采用这种根据无色差图像构造训练数据集的方式,能够根据无色差色边的无色差图像反向构造出具有色差色边的有色差图像。本公开的这种构造训练数据集的方式,相较于根据具有色差色边的有色差图像正向构造无色差色边的无色差图像的方式更加简便容易。原因在于,采用相关技术中的任一去色差色边方法来对具有色差色边的有色差图像进行去色差色边的处理,均不能快速得到完全干净无色差色边的无色差图像。
在构造训练数据集之后,根据训练数据集训练去色差处理模型时,使用通过本公开上述方式反向构造的有色差图像和干净无色差色边的无色差图像能够训练出鲁棒性更好、效果更优的去色差处理模型。
此处值得说明的是,在构造训练数据集中的有色差图像时,本公开对添加到图像中的色差色边的颜色不作具体地限制,色边颜色可以为紫色、红色、蓝色、黄色、绿色等等。
由于YUV格式的图像主要用于优化彩色视频信号的传输,使其向后相容老式黑白电视。与RGB视频信号传输相比,它最大的优点仅在于只需占用极少的频宽(RGB要求三个独立的视频信号同时传输)。因此,在不考虑频宽的情况下,用户一般需求的图像为RGB格式的图像。因此,在一种可实现的实施方式中,在得到所述去色差处理模型输出的目标图像之后,若所述目标图像的图像格式为所述YUV格式,那么所述图像处理方法还可以包括以下步骤:
对所述目标图像进行格式转换,得到图像格式为所述RGB格式的目标图像;向所述用户的终端反馈图像格式为所述RGB格式的目标图像。如此以适应于用户使用RGB格式的目标图像的需求。
采用本公开的上述方法,通过获取待处理图像,该待处理图像中的物体边缘存在色差色边,并将该待处理图像输入去色差处理模型,得到去色差处理模型输出的目标图像。由于待处理图像的图像格式为YUV格式,因而去色差处理模型对待处理图像进行去色差色边处理时,可只针对待处理图像的色差色边位置上的UV色度信号进行色差修正,而不改变整个待处理图像的Y亮度信号。因而本公开的这一种采用去色差处理模型对待处理图像进行去色差色边处理的方式,可以避免待处理图像中的亮度信息损失,得到效果更优的目标图像。因此本公开的这种方式提升了去除图像中色差色边的效果。
可选地,所述去色差处理模型为深度卷积神经网络模型。
在本申请中,去色差处理模型的架构优选深度学习模型中的深度卷积神经网络模型架构,当然也可以为其它的深度学习模型架构,对此本公开不作具体的限制。
值得解释的是,深度学习是指基于人工神经网络的机器学习。区别于传统的机器学习,深度学习模型需要使用大量的人工标注样本进行训练,以训练得到准确率更高的深度学习模型。深度学习模型通常包括一个多层的人工神经网络,通过增加人工神经网络的深度和广度,均能提高人工神经网络的拟合能力,得到鲁棒性更好的深度学习模型。深度学习模型的本质是学习一个映射关系f(x)=y,比如x是输入的手写数字图片,那么y就是输出的0~9数字中的一个数字。而在本公开的应用场景中,去色差处理模型的输入x是指有色差色边的待处理图像,输出y是指去除色差色边后的目标图像。
应当说明的是,训练一个深度学习模型的过程通常如下:先准备训练数据集,训练数据集的形式通常是成对的(x,y)形式。其中x是输入数据,y是对应的输出数据。在准备好训练数据集之后,将x输入到深度学习模型进行正向传播,得到深度学习模型输出的y_。进一步地,将(y,y_)输入到误差函数loss function,经过误差判断模型的收敛程度(损失值越小越好)计算后,通过反向传播(反向求导)来确定梯度向量。进一步地,通过梯度向量来调整深度学习模型每一个模型参数。然后重新根据输入深度学习模型的x计算得到新的y_,直到迭代到设定次数或损失误差的平均值不再下降时为止,得到训练完成的深度学习模型。本公开中的去色差处理模型的训练原理如上所示。
示例地,所述通过训练数据集训练得到所述去色差处理模型包括:根据所述训练数据集中的所述有色差图像、所述无色差图像以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y_)=c×|y-y_|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y_与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
由于色差色边总是出现在高反差区域边缘,所以在本公开的技术方案中,为了提升去色差处理模型的训练效果,将预设损失函数loss function设计为自适应权重的损失函数。自适应权重信息对应上述预设损失函数中的参数c,c表征物体边缘图像中各像素点为物体边缘像素点的概率值集合。其中容易理解的是像素点的概率值越大,表征该像素点为物体边缘像素点的可能性就越大。将这种自适应权重信息c应用于预设损失函数中,可以使去色差处理模型更多的关注权重大的高反差区域边缘即更关注色差色边,更少的关注权重小的非高反差区域即更少的关注非色差色边。而在去色差处理模型更多的关注权重大的高反差区域边缘即更关注色差色边,并更少的关注权重小的非高反差区域即更少的关注非色差色边的情况下,能够有效降低去色差处理模型的数据计算量,提升色差识别精准度。
容易理解的是,在一幅图像中,存在色差色边的像素占所有像素的比例通常很小,一般在5%左右。通过将自适应权重信息c应用于预设损失函数中,实现了只对存在色差色边的像素区域进行修正的目的,避免了大量的无用计算(即避免了计算非色差色边区域的像素是否存在色差现象),提升了去色差处理模型去色差色边的处理速度。
因此,采用本公开的这种预设损失函数训练得到的去色差处理模型,因去色差处理模型的数据计算量低而能够快速的对待处理图像进行去色差色边处理从而得到目标图像。这使得本公开的图像处理方法能够满足用户的实时性需求。
可选地,本公开中去色差处理模型的架构如图3所示,所述去色差处理模型包括预处理模块,注视机制模块,合成模块;所述将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像,包括:
将所述待处理图像输入所述预处理模块,所述预处理模块将所述待处理图像中的亮度信号与色度信号进行分离,得到与所述待处理图像的亮度信号对应的待处理亮度图像,以及得到与所述待处理图像的色度信号对应的待处理色度图像,并将所述待处理亮度图像、所述待处理色度图像输入所述注视机制模块;
所述注视机制模块根据所述待处理亮度图像中的物体边缘特征信息和所述待处理色度图像进行色差修正值计算,得到待处理色度图像修正信息,并将所述待处理色度图像、所述待处理亮度图像、所述待处理色度图像修正信息输入所述合成模块;
所述合成模块根据所述待处理色度图像修正信息修正所述待处理色度图像,得到修正后的待处理色度图像,并将所述修正后的待处理色度图像与所述待处理亮度图像合成所述目标图像,并输出所述目标图像。
相应地,所述预处理模块用于,将所述待处理图像中的亮度信号与色度信号进行分离,得到与所述待处理图像的亮度信号对应的待处理亮度图像,以及得到与所述待处理图像的色度信号对应的待处理色度图像;
所述注视机制模块用于,根据所述待处理亮度图像中的物体边缘特征信息和所述待处理色度图像进行色差修正值计算,得到待处理色度图像修正信息;
所述合成模块用于,根据所述待处理色度图像修正信息修正所述待处理色度图像,得到修正后的待处理色度图像,并将所述修正后的待处理色度图像与所述待处理亮度图像合成所述目标图像。
其中,所述注视机制模块包括依次串联的色度信息卷积层conv、色度信息激活层sigmoid、色度信息乘法层以及色度信息合并处理层elt-prod;所述色度信息卷积层用于,对所述注视机制模块的输入数据进行卷积处理,得到第一色度图像特征;所述色度信息激活层用于,对所述第一色度图像特征进行激活操作,得到第二色度图像特征;所述色度信息乘法层用于,基于跨层skip connection对所述注视机制模块的输入数据和所述第二色度图像特征进行同位点乘处理,得到所述第三色度图像特征;所述色度信息合并处理层concat用于,将所述第三色度图像特征与所述待处理亮度图像中的物体边缘特征信息进行合并处理,得到所述待处理色度图像修正信息。
可选地,所述注视机制模块为串联的多个注视机制模块,所述多个注视机制模块中的首个注视机制模块的输入数据为所述待处理色度图像,所述多个注视机制模块中的非首个注视机制模块的输入数据为上一注视机制模块的输出数据,所述待处理色度图像修正信息为所述多个注视机制模块中的最后一个注视机制模块的输出数据。
其中,在去色差处理模型包括多个串联和/或并联的多个注视机制模块的情况下,多个注视机制模块中的首个注视机制模块的输入数据为待处理色度图像,多个注视机制模块中的非首个注视机制模块的输入数据为上一注视机制模块的输出数据,上一注视机制模块的输出数据可称为中间层色度图像修正信息,最后一个注视机制模块的输出数据为待处理色度图像修正信息。
其中值得说明的是,由于注视机制模块的输出数据是待处理色度图像修正信息,所以可以把待处理色度图像修正信息中各个像素点的修正值的大小作为各个像素点的色差值(色差值用于衡量色差大小)。如果某像素点对应的修正值的绝对值小于某一个值,就可以认为该像素点不存在色差,合成模块可以省去修正该像素点的操作。如果某像素点的修正值的绝对值大于某一个值,就可以认为该像素点存在色差,合成模块执行修正该像素点的操作。
采用本公开的这一种去色差处理模型架构,通过使去色差处理模型根据预设损失函数进行训练,使得去色差处理模型学习到一种类似于注意力机制的方式,实现对色差色边的高度关注,从而增强去色差处理模型对图像色差色边去除性能。
本公开实施例还提供一种去色差处理模型的训练方法,所述方法包括:
获取一个或多个无色差图像,并根据所述无色差图像构造对应的有色差图像;根据一个或多个所述无色差图像和对应的所述有色差图像生成训练数据集;根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型。
一种可能的实施方式,所述根据所述无色差图像构造对应的有色差图像,具体包括以下实施步骤:
将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
针对任一张无色差图像通过上述图像构造方法,均能得到对应的有色差图像。
其中,色差色边的颜色为红色、绿色、蓝色、黄色、紫色等颜色中的至少一种。
一种可能的实施方式,所述根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型,具体可以包括以下步骤:
根据所述训练数据集以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y_)=c×|y-y_|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y_与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
关于上述去色差处理模型的训练方法的实施例,其中各个步骤的具体执行方式已经在有关该方法的前述图像处理方法实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种图像处理装置的框图。参照图4,该装置100包括获取模块121,输入模块122。
该获取模块121被配置为获取待处理图像。
该输入模块122被配置为将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像。
其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。
采用这种装置,通过获取待处理图像,并将该待处理图像输入去色差处理模型,得到去色差处理模型输出的目标图像。这种使用模型处理的方式相较于相关技术中的方式可以提升对图像进行去色差处理的速度和准确率。
可选地,与所述无色差图像对应的有色差图像通过如下方式得到:
将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;
根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;
将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
可选地,所述装置还包括训练模块,被配置为根据所述训练数据集以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y_)=c×|y-y_|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y_与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
可选地,所述去色差处理模型包括预处理模块,注视机制模块,合成模块;所述输入模块用于:
将所述待处理图像输入所述预处理模块,所述预处理模块将所述待处理图像中的亮度信号与色度信号进行分离,得到与所述待处理图像的亮度信号对应的待处理亮度图像,以及得到与所述待处理图像的色度信号对应的待处理色度图像,并将所述待处理亮度图像、所述待处理色度图像输入所述注视机制模块;所述注视机制模块根据所述待处理亮度图像中的物体边缘特征信息和所述待处理色度图像进行色差修正值计算,得到待处理色度图像修正信息,并将所述待处理色度图像、所述待处理亮度图像、所述待处理色度图像修正信息输入所述合成模块;所述合成模块根据所述待处理色度图像修正信息修正所述待处理色度图像,得到修正后的待处理色度图像,并将所述修正后的待处理色度图像与所述待处理亮度图像合成所述目标图像,并输出所述目标图像。
可选地,所述注视机制模块包括依次串联的色度信息卷积层、色度信息激活层、色度信息乘法层以及色度信息合并处理层;
所述色度信息卷积层用于,对所述注视机制模块的输入数据进行卷积处理,得到第一色度图像特征;
所述色度信息激活层用于,对所述第一色度图像特征进行激活操作,得到第二色度图像特征;
所述色度信息乘法层用于,对所述注视机制模块的输入数据和所述第二色度图像特征进行同位点乘处理,得到所述第三色度图像特征;
所述色度信息合并处理层用于,将所述第三色度图像特征与所述待处理亮度图像中的物体边缘特征信息进行合并处理,得到所述待处理色度图像修正信息。
可选地,所述注视机制模块为串联的多个注视机制模块,所述多个注视机制模块中的首个注视机制模块的输入数据为所述待处理色度图像,所述多个注视机制模块中的非首个注视机制模块的输入数据为上一注视机制模块的输出数据,所述待处理色度图像修正信息为所述多个注视机制模块中的最后一个注视机制模块的输出数据。
可选地,所述装置还包括:
响应模块,被配置为在所述获取待处理图像之前,响应于用户的输入操作,获取用户输入的图像;
第一转换模块,被配置为在所述用户输入的图像的图像格式为RGB格式的情况下,对所述用户输入的图像进行格式转换,得到YUV格式的所述待处理图像。
可选地,所述目标图像的图像格式为所述YUV格式,所述装置还包括:
第二转换模块,被配置为在得到所述去色差处理模型输出的目标图像之后,对所述目标图像进行格式转换,得到图像格式为所述RGB格式的目标图像;
反馈模块,被配置为向所述用户的终端反馈所述RGB格式的目标图像。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于同一发明构思,本公开实施例提供一种去色差处理模型的训练装置,所述装置包括:
获取模块,被配置为获取一个或多个无色差图像,并根据所述无色差图像构造对应的有色差图像;
生成模块,被配置为根据一个或多个所述无色差图像和对应的所述有色差图像生成训练数据集;
训练模块,被配置为根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型。
可选地,所述获取模块,包括:
分离子模块,被配置为将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;
添加子模块,被配置为根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;
合成子模块,被配置为将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
可选地,所述训练模块,被配置为:
根据所述训练数据集以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y_)=c×|y-y_|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y_与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的图像处理方法或去色差处理模型的训练方法的步骤。
图5是根据一示例性实施例示出的一种用于图像处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的图像处理方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像处理方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述图像处理方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的图像处理方法的代码部分。
图6是根据一示例性实施例示出的一种用于图像处理的装置1900的框图。例如,装置1900可以被提供为一服务器。参照图6,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述图像处理方法的步骤。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (14)
1.一种图像处理方法,其特征在于,所述方法包括:
获取待处理图像;
将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像;
其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。
2.根据权利要求1所述的方法,其特征在于,与所述无色差图像对应的有色差图像通过如下方式得到:
将所述无色差图像的亮度信号与色度信号进行分离,得到与所述无色差图像的亮度信号对应的亮度图像,以及得到与所述无色差图像的色度信号对应的色度图像;
根据所述亮度图像确定物体边缘图像,并基于所述物体边缘图像表征的物体边缘位置信息在所述色度图像中的物体边缘添加预设宽度的色差色边,得到新的色度图像;
将所述亮度图像和所述新的色度图像进行合成处理,得到与所述无色差图像对应的所述有色差图像。
3.根据权利要求1所述的方法,其特征在于,所述去色差处理模型通过以下方式训练得到:
根据所述训练数据集以及预设损失函数,对深度卷积神经网络模型训练,得到所述去色差处理模型,所述预设损失函数为:
g=loss(y,y-)=c×|y-y-|;
其中,所述g表征在所述去色差处理模型的训练过程中,所述去色差处理模型根据所述有色差图像生成的第一目标图像y-与所述有色差图像对应的所述无色差图像y之间的损失信息,所述c表征所述物体边缘图像中各像素点为物体边缘像素点的概率值集合。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述去色差处理模型包括预处理模块,注视机制模块,合成模块;所述将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像,包括:
将所述待处理图像输入所述预处理模块,所述预处理模块将所述待处理图像中的亮度信号与色度信号进行分离,得到与所述待处理图像的亮度信号对应的待处理亮度图像,以及得到与所述待处理图像的色度信号对应的待处理色度图像,并将所述待处理亮度图像、所述待处理色度图像输入所述注视机制模块;
所述注视机制模块根据所述待处理亮度图像中的物体边缘特征信息和所述待处理色度图像进行色差修正值计算,得到待处理色度图像修正信息,并将所述待处理色度图像、所述待处理亮度图像、所述待处理色度图像修正信息输入所述合成模块;
所述合成模块根据所述待处理色度图像修正信息修正所述待处理色度图像,得到修正后的待处理色度图像,并将所述修正后的待处理色度图像与所述待处理亮度图像合成所述目标图像,并输出所述目标图像。
5.根据权利要求4所述的方法,其特征在于,所述注视机制模块包括依次串联的色度信息卷积层、色度信息激活层、色度信息乘法层以及色度信息合并处理层;
所述色度信息卷积层用于,对输入至所述注视机制模块的输入数据进行卷积处理,得到第一色度图像特征;
所述色度信息激活层用于,对所述第一色度图像特征进行激活操作,得到第二色度图像特征;
所述色度信息乘法层用于,对所述注视机制模块的输入数据和所述第二色度图像特征进行同位点乘处理,得到所述第三色度图像特征;
所述色度信息合并处理层用于,将所述第三色度图像特征与所述待处理亮度图像中的物体边缘特征信息进行合并处理,得到所述待处理色度图像修正信息。
6.根据权利要求5所述的方法,其特征在于,所述注视机制模块为串联的多个注视机制模块,所述多个注视机制模块中的首个注视机制模块的输入数据为所述待处理色度图像,所述多个注视机制模块中的非首个注视机制模块的输入数据为上一注视机制模块的输出数据,所述待处理色度图像修正信息为所述多个注视机制模块中的最后一个注视机制模块的输出数据。
7.根据权利要求1所述的方法,其特征在于,在所述获取待处理图像之前,包括:
响应于用户的输入操作,获取用户输入的图像;
在所述用户输入的图像的图像格式为RGB格式的情况下,对所述用户输入的图像进行格式转换,得到YUV格式的所述待处理图像。
8.根据权利要求7所述的方法,其特征在于,所述目标图像的图像格式为所述YUV格式,在得到所述去色差处理模型输出的目标图像之后,包括:
对所述目标图像进行格式转换,得到图像格式为所述RGB格式的目标图像;
向所述用户的终端反馈所述RGB格式的目标图像。
9.一种去色差处理模型的训练方法,其特征在于,所述方法包括:
获取一个或多个无色差图像,并根据所述无色差图像构造对应的有色差图像;
根据一个或多个所述无色差图像和对应的所述有色差图像生成训练数据集;
根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型。
10.一种图像处理装置,其特征在于,所述装置包括:
获取模块,被配置为获取待处理图像;
输入模块,被配置为将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像;
其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。
11.一种图像处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待处理图像;
将所述待处理图像输入去色差处理模型,得到所述去色差处理模型输出的目标图像;
其中,所述去色差处理模型是通过训练数据集训练得到的,所述训练数据集包括多组样本数据,每组样本数据包括无色差图像和与所述无色差图像对应的有色差图像。
12.一种去色差处理模型的训练装置,其特征在于,所述装置包括:
获取模块,被配置为获取一个或多个无色差图像,并根据所述无色差图像构造对应的有色差图像;
生成模块,被配置为根据一个或多个所述无色差图像和对应的所述有色差图像生成训练数据集;
训练模块,被配置为根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型。
13.一种去色差处理模型的训练装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取一个或多个无色差图像,并根据所述无色差图像构造对应的有色差图像;
根据一个或多个所述无色差图像和对应的所述有色差图像生成训练数据集;
根据所述训练数据集对深度卷积神经网络模型训练,得到所述去色差处理模型。
14.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~9中任一项所述方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110679122.8A CN113379635A (zh) | 2021-06-18 | 2021-06-18 | 图像处理方法及装置,模型训练方法、装置及存储介质 |
US17/646,221 US20220405896A1 (en) | 2021-06-18 | 2021-12-28 | Image processing method and apparatus, model training method and apparatus, and storage medium |
EP21218127.5A EP4106321A1 (en) | 2021-06-18 | 2021-12-29 | Image processing method and apparatus, model training method and apparatus, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110679122.8A CN113379635A (zh) | 2021-06-18 | 2021-06-18 | 图像处理方法及装置,模型训练方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113379635A true CN113379635A (zh) | 2021-09-10 |
Family
ID=77577842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110679122.8A Pending CN113379635A (zh) | 2021-06-18 | 2021-06-18 | 图像处理方法及装置,模型训练方法、装置及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220405896A1 (zh) |
EP (1) | EP4106321A1 (zh) |
CN (1) | CN113379635A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113947179A (zh) * | 2020-07-16 | 2022-01-18 | 浙江宇视科技有限公司 | 白平衡校正方法、装置、设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018222147A1 (de) * | 2018-12-18 | 2020-06-18 | Leica Microsystems Cms Gmbh | Optikkorrektur durch Maschinenlernen |
-
2021
- 2021-06-18 CN CN202110679122.8A patent/CN113379635A/zh active Pending
- 2021-12-28 US US17/646,221 patent/US20220405896A1/en active Pending
- 2021-12-29 EP EP21218127.5A patent/EP4106321A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220405896A1 (en) | 2022-12-22 |
EP4106321A1 (en) | 2022-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020093837A1 (zh) | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 | |
CN109345485B (zh) | 一种图像增强方法、装置、电子设备及存储介质 | |
CN109379572B (zh) | 图像转换方法、装置、电子设备及存储介质 | |
CN111275653B (zh) | 图像去噪方法及装置 | |
CN111709890B (zh) | 一种图像增强模型的训练方法、装置及存储介质 | |
CN110958401B (zh) | 一种超级夜景图像颜色校正方法、装置和电子设备 | |
CN109859144B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN106131441B (zh) | 拍照方法及装置、电子设备 | |
CN111953904B (zh) | 拍摄方法、装置、电子设备及存储介质 | |
CN105528765A (zh) | 处理图像的方法及装置 | |
CN105791790B (zh) | 图像处理方法及装置 | |
CN112634160A (zh) | 拍照方法及装置、终端、存储介质 | |
CN111953903A (zh) | 拍摄方法、装置、电子设备及存储介质 | |
US20220405896A1 (en) | Image processing method and apparatus, model training method and apparatus, and storage medium | |
US20210405384A1 (en) | Optical processing apparatus, camera module, electronic device and capturing method | |
CN115835034A (zh) | 白平衡处理方法与电子设备 | |
CN106384356A (zh) | 分离视频序列的前景与背景的方法及装置 | |
CN107564073B (zh) | 肤色识别方法及装置、存储介质 | |
JPWO2019155757A1 (ja) | 画像処理装置、画像処理方法及び画像処理システム | |
CN114066784A (zh) | 一种图像处理方法、装置和存储介质 | |
CN113472997A (zh) | 图像处理方法及装置、移动终端及存储介质 | |
CN115953339A (zh) | 图像融合处理方法、装置、设备、存储介质及芯片 | |
CN113592733A (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN107025638B (zh) | 图像处理的方法及装置 | |
CN109447925A (zh) | 图像处理方法和装置、存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |