CN116128739A - 下采样模型的训练方法、图像处理方法及装置 - Google Patents

下采样模型的训练方法、图像处理方法及装置 Download PDF

Info

Publication number
CN116128739A
CN116128739A CN202111326744.9A CN202111326744A CN116128739A CN 116128739 A CN116128739 A CN 116128739A CN 202111326744 A CN202111326744 A CN 202111326744A CN 116128739 A CN116128739 A CN 116128739A
Authority
CN
China
Prior art keywords
image
downsampling
model
sample
demosaicing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111326744.9A
Other languages
English (en)
Inventor
陈彬
曾祥睿
王宁
王宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202111326744.9A priority Critical patent/CN116128739A/zh
Publication of CN116128739A publication Critical patent/CN116128739A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Processing (AREA)

Abstract

一种下采样模型的训练方法、图像处理方法及装置,该训练方法包括:获取训练数据,训练数据包括第一样本图像与第二样本图像;将第一样本图像输入下采样模型,得到第一预测图像,第一预测图像为第一颜色空间的图像;基于第三样本图像与第二预测图像训练下采样模型,得到训练后的下采样模型,所述第三样本图像是指对第二样本图像进行下采样处理后得到的图像,第二预测是指对第一预测图像进行去马赛克处理得到的第二颜色空间的图像。基于本申请的技术方案,在通过下采样模型对第一颜色空间的图像进行下采样处理时,能够提高图像的清晰度。

Description

下采样模型的训练方法、图像处理方法及装置
技术领域
本申请涉及图像处理领域,具体地,涉及一种下采样模型的训练方法、图像处理方法及装置。
背景技术
在暗光环境下拍照(或者视频)时,比如,在夜景环境下拍照,由于电子设备的进光量较少导致图像的噪声较大;为了减小图像中的噪声,提升图像质量,通常对图像进行Raw域降噪;但是,由于受限于电子设备的运算性能与功耗,在进行Raw域降噪时需要减小Raw域图像的尺寸;目前减小Raw域图像的尺寸方法会使得图像的清晰度明显降低。
因此,在对Raw域图像进行下采样处理时,如何提高图像的清晰度成为一个亟需解决的问题。
发明内容
本申请提供了一种下采样模型的训练方法、图像处理方法及装置,对Raw域图像进行下采样处理时,能够避免清晰度的损失,提高图像的清晰度。
第一方面,提供了一种下采样模型的训练方法,包括:
获取训练数据,其中,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像;
将所述第一样本图像输入下采样模型,得到第一预测图像,所述第一预测图像为所述第一颜色空间的图像,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理;
基于第三样本图像与第二预测图像训练所述下采样模型,得到训练后的下采样模型,其中,所述第三样本图像是指对所述第二样本图像进行所述下采样处理后得到的图像,所述第二预测是指对所述第一预测图像进行去马赛克处理得到的所述第二颜色空间的图像。
在本申请的实施例中,在训练下采样模型时是以低分辨率的RGB域图像作为目标值,而低分辨率的RGB域图像是通过对高分辨率的RGB域图像进行下采样得到的;因此,低分辨率的RGB域图像高分辨率的RGB域图像的清晰度是相同的;因此,通过下采样模型得到的下采样处理后的Raw域图像不会存在清晰度损失的问题;换而言之,在训练下采样模型时,是以与高分辨率的RGB域图像相同清晰度的低分辨率的RGB域图像作为目标值;因此,通过本申请实施例中的下采样模型对Raw域图像进行下采样处理时,能够避免清晰度的损失,提高图像的清晰度。
应理解,Raw域图像可以是指Raw颜色空间的图像;Raw域图像是指图像在Raw颜色空间;同理,RGB域图像是指RGB颜色空间的图像,即图像在RGB颜色空间。
在一种可能的实现方式中,第一颜色空间是指Raw颜色空间;第二颜色空间是指RGB颜色空间,或者其他颜色空间。
在一种可能的实现方式中,下采样模型可以是深度神经网络、卷积神经网络或者其他神经网络结构,本申请对此不作任何限定。
结合第一方面,在第一方面的某些实现方式中,还包括:
获取去马赛克算法,所述去马赛克算法用于进行所述去马赛克处理。
在本申请的实施例中,在去马赛克算法已知的情况下,可以获取去马赛克算法;根据训练数据与去马赛克算法得到下采样模型,因此,下采样模型可以是适配该已知去马赛克算法的神经网络;对于不同的去马赛克算法可以得到不同的预先训练的下采样神经网络。
结合第一方面,在第一方面的某些实现方式中,还包括:
将所述第一样本图像输入去马赛克模型,得到第三预测图像,所述第三预测图像为所述第二颜色空间的图像;
基于所述第三预测图像与所述第二样本图像训练所述去马赛克模型,得到训练后的去马赛克模型。
在本申请的实施例中,在去马赛克算法未知的情况下,可以通过获取大量的样本数据进行训练,得到学习样本数据对应的去马赛克模型,即得到预先训练的去马赛克神经网络;在本申请的实施例中,下采样模型可以是适配该去马赛克模型;对于不同的去马赛克模型可以得到不同的预先训练的下采样模型。
在一种可能的实现方式中,去马赛克模型可以是深度神经网络、卷积神经网络或者其他神经网络结构,本申请对此不作任何限定。
结合第一方面,在第一方面的某些实现方式中,所述下采样模型的参数是根据所述第三样本图像与所述第二预测图像之间的差异通过反向传播算进行迭代得到的。
结合第一方面,在第一方面的某些实现方式中,所述去马赛克模型的参数是根据所述第三预测图像与所述第一样本图像之间的差异通过反向传播算进行迭代得到的。
第二方面,提供了一种图像处理方法,其特征在于,应用于电子设备,包括:
显示第一界面,所述第一界面包括第一控件;
检测到对所述第一控件的第一操作;
响应于所述第一操作,获取第一图像,所述第一图像为第一颜色空间的图像;
根据下采样模型对所述第一图像进行处理,得到第二图像,其中,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理,所述下采样模型是根据训练数据与目标数据训练得到的,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指所述第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像,所述目标数据是指对所述第二样本图像进行所述下采样处理后的图像;
对所述第二图像进行图像处理,得到第三图像。
在本申请的实施例中,在训练下采样模型时是以低分辨率的RGB域图像作为目标值,而低分辨率的RGB域图像是通过对高分辨率的RGB域图像进行下采样得到的;因此,低分辨率的RGB域图像高分辨率的RGB域图像的清晰度是相同的;因此,通过下采样模型得到的下采样处理后的Raw域图像不会存在清晰度损失的问题;换而言之,在训练下采样模型时,是以与高分辨率的RGB域图像相同清晰度的低分辨率的RGB域图像作为目标值;因此,通过本申请实施例中的下采样模型对Raw域图像进行下采样处理时,能够避免清晰度的损失,提高图像的清晰度。
应理解,Raw域图像可以是指Raw颜色空间的图像;Raw域图像是指图像在Raw颜色空间;同理,RGB域图像是指RGB颜色空间的图像,即图像在RGB颜色空间。
在一种可能的实现方式中,第一颜色空间是指Raw颜色空间;第二颜色空间是指RGB颜色空间,或者其他颜色空间。
在一种可能的实现方式中,下采样模型可以是深度神经网络、卷积神经网络或者其他神经网络结构,本申请对此不作任何限定。
结合第二方面,在第二方面的某些实现方式中,所述第一界面是指所述电子设备的主屏界面,所述主屏界面包括相机应用程序,所述第一控件是指所述相机应用程序对应的控件。
在一种可能的实现方式中,所述第一操作是指点击所述相机应用程序的操作。
结合第二方面,在第二方面的某些实现方式中,所述第一界面是指拍照界面,所述第一控件是指用于指示拍照的控件。
在一种可能的实现方式中,所述第一操作是指点击所述用于指示录制视频的控件的操作。
结合第二方面,在第二方面的某些实现方式中,所述第一界面是指视频通话界面,所述第一控件是指用于指示视频通话的控件。
在一种可能的实现方式中,所述第一操作是指点击所述用于指示视频通话的控件的操作。
上述以第一操作为点击操作为例进行举例说明;第一操作还可以包括语音指示操作,或者其它的指示电子设备进行拍照或者视频通话的操作;上述为举例说明,并不对本申请作任何限定。
在一种可能的实现方式中,所述图像处理包括以下至少一项处理:
降噪处理、超分辨率处理或者去模糊处理。
可选地,上述图像处理可以包括第一颜色空间的算法处理;或者图像处理可以包括第一颜色空间与第二颜色空间的算法处理。
结合第二方面,在第二方面的某些实现方式中,所述下采样模型的参数是根据第二预测图像与所述目标数据之间的差异通过反向传播算进行迭代得到的,所述第二预测是指对第一预测图像进行所述去马赛克处理得到的所述第二颜色空间的图像,所述第一预测图像是对指将所述第一样本图像输入所述下采样模型得到的图像。
结合第二方面,在第二方面的某些实现方式中,通过去马赛克算法执行所述去马赛克处理。
在本申请的实施例中,在去马赛克算法已知的情况下,可以获取去马赛克算法;根据训练数据与去马赛克算法得到下采样模型,因此,下采样模型可以是适配该已知去马赛克算法的神经网络;对于不同的去马赛克算法可以得到不同的预先训练的下采样神经网络。
结合第二方面,在第二方面的某些实现方式中,通过去马赛克模型执行所述去马赛克处理,所述去马赛克模型是通过以所述第一样本图像为输入数据,以所述第二样本图像为目标值训练得到的。
在本申请的实施例中,在去马赛克算法未知的情况下,可以通过获取大量的样本数据进行训练,得到学习样本数据对应的去马赛克模型,即得到预先训练的去马赛克神经网络;在本申请的实施例中,下采样模型可以是适配该去马赛克模型;对于不同的去马赛克模型可以得到不同的预先训练的下采样模型。
结合第二方面,在第二方面的某些实现方式中,所述去马赛克模型的参数是根据第三预测图像与所述第一样本图像之间的差异通过反向传播算进行迭代得到的,所述第三预测图像是指将所述第一样本图像输入去马赛克模型得到的图像。
结合第二方面,在第二方面的某些实现方式中,还包括:
检测到第二操作,所述第二操作用于指示开启所述电子设备的夜景模式,所述夜景模式是指所述电子设备的进光量小于预设阈值的拍摄模式。
在本申请的实施例中,当电子设备在暗光场景下录制视频时,用户可以开启电子设备的夜景模式,从而运行本申请实施例提供的图像处理方法,提升图像的清晰度,提高图像质量。
第三方面,提供一种下采样模型的训练装置,所述训练装置包括一个或多个处理器和存储器;所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述一个或多个处理器调用所述计算机指令以使得所述训练装置执行:获取训练数据,其中,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像;
将所述第一样本图像输入下采样模型,得到第一预测图像,所述第一预测图像为所述第一颜色空间的图像,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理;
基于第三样本图像与第二预测图像训练所述下采样模型,得到训练后的下采样模型,其中,所述第三样本图像是指对所述第二样本图像进行所述下采样处理后得到的图像,所述第二预测是指对所述第一预测图像进行去马赛克处理得到的所述第二颜色空间的图像。
结合第三方面,在第三方面的某些实现方式中,所述一个或多个处理器调用所述计算机指令以使得所述训练装置执行:
获取去马赛克算法,所述去马赛克算法用于进行所述去马赛克处理。
结合第三方面,在第三方面的某些实现方式中,所述一个或多个处理器调用所述计算机指令以使得所述训练装置执行:
将所述第一样本图像输入去马赛克模型,得到第三预测图像,所述第三预测图像为所述第二颜色空间的图像;
基于所述第三预测图像与所述第二样本图像训练所述去马赛克模型,得到训练后的去马赛克模型。
结合第三方面,在第三方面的某些实现方式中,所述下采样模型的参数是根据所述第三样本图像与所述第二预测图像之间的差异通过反向传播算进行迭代得到的。
结合第三方面,在第三方面的某些实现方式中,所述去马赛克模型的参数是根据所述第三预测图像与所述第一样本图像之间的差异通过反向传播算进行迭代得到的。
第四方面,提供一种图像处理装置,所述图像处理装置包括一个或多个处理器和存储器;所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述一个或多个处理器调用所述计算机指令以使得所述图像处理装置执行:显示第一界面,所述第一界面包括第一控件;
检测到对所述第一控件的第一操作;
响应于所述第一操作,获取第一图像,所述第一图像为第一颜色空间的图像;
根据下采样模型对所述第一图像进行处理,得到第二图像,其中,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理,所述下采样模型是根据训练数据与目标数据训练得到的,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指所述第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像,所述目标数据是指对所述第二样本图像进行所述下采样处理后的图像;
对所述第二图像进行图像处理,得到第三图像。
结合第四方面,在第四方面的某些实现方式中,所述下采样模型的参数是根据第二预测图像与所述目标数据之间的差异通过反向传播算进行迭代得到的,所述第二预测是指对第一预测图像进行所述去马赛克处理得到的所述第二颜色空间的图像,所述第一预测图像是对指将所述第一样本图像输入所述下采样模型得到的图像。
结合第四方面,在第四方面的某些实现方式中,通过去马赛克算法执行所述去马赛克处理。
结合第四方面,在第四方面的某些实现方式中,通过去马赛克模型执行所述去马赛克处理,所述去马赛克模型是通过以所述第一样本图像为输入数据,以所述第二样本图像为目标值训练得到的。
结合第四方面,在第四方面的某些实现方式中,所述去马赛克模型的参数是根据第三预测图像与所述第一样本图像之间的差异通过反向传播算进行迭代得到的,所述第三预测图像是指将所述第一样本图像输入去马赛克模型得到的图像。
结合第四方面,在第四方面的某些实现方式中,所述计算机程序代码包括计算机指令,所述一个或多个处理器调用所述计算机指令以使得所述图像处理装置执行:
检测到第二操作,所述第二操作用于指示开启所述电子设备的夜景模式,所述夜景模式是指所述电子设备的进光量小于预设阈值的拍摄模式。
结合第四方面,在第四方面的某些实现方式中,所述第一界面是指所述电子设备的主屏界面,所述主屏界面包括相机应用程序,所述第一控件是指所述相机应用程序对应的控件。
结合第四方面,在第四方面的某些实现方式中,所述第一界面是指拍照界面,所述第一控件是指用于指示拍照的控件。
结合第四方面,在第四方面的某些实现方式中,所述第一界面是指视频通话界面,所述第一控件是指用于指示视频通话的控件。
第五方面,提供了一种下采样模型的训练装置,包括用于执行第一方面或第一方面中任一种方法的模块/单元。
第六方面,提供了一种图像处理装置,包括用于执行第二方面或第二方面中任一种方法的模块/单元。
第七方面,提供了一种下采样模型的训练装置,所述训练装置包括:一个或多个处理器和存储器;所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述一个或多个处理器调用所述计算机指令以使得所述训练装置执行第一方面中的任一种训练方法。
第八方面,提供了一种图像处理装置,所述图像处理装置包括:一个或多个处理器和存储器;所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述一个或多个处理器调用所述计算机指令以使得所述图像处理装置执行第二方面中的任一种图像处理方法。
第九方面,提供了一种芯片系统,所述芯片系统应用于电子设备,所述芯片系统包括一个或多个处理器,所述处理器用于调用计算机指令以使得所述电子设备执行第一方面或第二方面中的任一种方法。
第十方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序代码,当所述计算机程序代码被电子设备运行时,使得该电子设备执行第一方面或第二方面中的任一种方法。
第十一方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码被电子设备运行时,使得该电子设备执行第一方面或第二方面中的任一种方法。
在本申请的实施例中,在训练下采样模型时是以低分辨率的RGB域图像作为目标值,而低分辨率的RGB域图像是通过对高分辨率的RGB域图像进行下采样得到的;因此,低分辨率的RGB域图像高分辨率的RGB域图像的清晰度是相同的;因此,通过下采样模型得到的下采样处理后的Raw域图像不会存在清晰度损失的问题;换而言之,在训练下采样模型时,是以与高分辨率的RGB域图像相同清晰度的低分辨率的RGB域图像作为目标值;因此,通过本申请实施例中的下采样模型对Raw域图像进行下采样处理时,能够避免清晰度的损失,提高图像的清晰度。
附图说明
图1是一种适用于本申请的电子设备的硬件系统的示意图;
图2是一种适用于本申请的电子设备的软件系统的示意图;
图3是一种适用于本申请实施例的应用场景的示意图;
图4是一种适用于本申请实施例的应用场景的示意图;
图5是一种适用于本申请的下采样模型的训练方法的示意图;
图6是一种适用于本申请的下采样模型的训练方法的示意图;
图7是一种适用于本申请的图像处理方法的示意图;
图8是本申请实施提供的图像处理方法的效果示意图;
图9是本申请实施例提供的一种电子设备的显示界面的示意图;
图10是本申请实施例提供的一种电子设备的显示界面的示意图;
图11是本申请实施例提供的一种电子设备的显示界面的示意图;
图12是本申请实施例提供的一种下采样模型的训练装置的结构示意图;
图13是本申请实施例提供的一种图像处理装置的结构示意图;
图14是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
由于本申请实施例涉及大量神经网络的应用,为了便于理解,下面先对本申请实施例可能涉及的神经网络的相关术语和概念进行介绍。
1.神经网络
神经网络是指将多个单一的神经单元联结在一起形成的网络,即一个神经单元的输出可以是另一个神经单元的输入;每个神经单元的输入可以与前一层的局部接受域相连,来提取局部接受域的特征,局部接受域可以是由若干个神经单元组成的区域。
2.深度神经网络
深度神经网络(deep neural network,DNN),也称为多层神经网络,可以理解为具有多层隐含层的神经网络。按照不同层的位置对DNN进行划分,DNN内部的神经网络可以分为三类:输入层,隐含层,输出层。一般来说第一层是输入层,最后一层是输出层,中间的层数都是隐含层;层与层之间可以是全连接的,也就是说,第i层的任意一个神经元可以与第i+1层的任意一个神经元相连。
3.卷积神经网络
卷积神经网络(convolutional neuron network,CNN)是一种带有卷积结构的深度神经网络。卷积神经网络包含了一个由卷积层和子采样层构成的特征抽取器,该特征抽取器可以看作是滤波器;卷积层是指卷积神经网络中对输入信号进行卷积处理的神经元层。在卷积神经网络的卷积层中,一个神经元可以只与部分邻层神经元连接。一个卷积层中,通常包含若干个特征平面,每个特征平面可以由一些矩形排列的神经单元组成。
4.反向传播算法
神经网络可以采用误差反向传播(back propagation,BP)算法在训练过程中修正初始的神经网络模型中参数的大小,使得神经网络模型的重建误差损失越来越小。具体地,前向传递输入信号直至输出会产生误差损失,通过反向传播误差损失信息来更新初始的神经网络模型中参数,从而使误差损失收敛。反向传播算法是以误差损失为主导的反向传播运动,用于得到最优的神经网络模型的参数;例如,权重矩阵。
下面将结合附图,对本申请实施例中的技术方案进行描述。
图1示出了一种适用于本申请的电子设备的硬件系统。
电子设备100可以是手机、智慧屏、平板电脑、可穿戴电子设备、车载电子设备、增强现实(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)、投影仪等等,本申请实施例对电子设备100的具体类型不作任何限制。
电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
需要说明的是,图1所示的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图1所示的部件更多或更少的部件,或者,电子设备100可以包括图1所示的部件中某些部件的组合,或者,电子设备100可以包括图1所示的部件中某些部件的子部件。图1示的部件可以以硬件、软件、或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元。例如,处理器110可以包括以下处理单元中的至少一个:应用处理器(application processor,AP)、调制解调处理器、图形处理器(graphics processing unit,GPU)、图像信号处理器(image signal processor,ISP)、控制器、视频编解码器、数字信号处理器(digital signal processor,DSP)、基带处理器、神经网络处理器(neural-network processing unit,NPU)。其中,不同的处理单元可以是独立的器件,也可以是集成的器件。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
图1所示的各模块间的连接关系只是示意性说明,并不构成对电子设备100的各模块间的连接关系的限定。可选地,电子设备100的各模块也可以采用上述实施例中多种连接方式的组合。
电子设备100的无线通信功能可以通过天线1、天线2、移动通信模块150、无线通信模块160、调制解调处理器以及基带处理器等器件实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
电子设备100可以通过GPU、显示屏194以及应用处理器实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194可以用于显示图像或视频。
电子设备100可以通过ISP、摄像头193、视频编解码器、GPU、显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP可以对图像的噪点、亮度和色彩进行算法优化,ISP还可以优化拍摄场景的曝光和色温等参数。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的红绿蓝(red green blue,RGB),YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1、MPEG2、MPEG3和MPEG4。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x轴、y轴和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。例如,当快门被按下时,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航和体感游戏等场景。
示例性地,在本申请的实施例中陀螺仪传感器180B可以用于采集的抖动信息,抖动信息可以用于表示电子设备在拍摄过程中的位姿变化。
加速度传感器180E可检测电子设备100在各个方向上(一般为x轴、y轴和z轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。加速度传感器180E还可以用于识别电子设备100的姿态,作为横竖屏切换和计步器等应用程序的输入参数。
距离传感器180F用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,例如在拍摄场景中,电子设备100可以利用距离传感器180F测距以实现快速对焦。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现解锁、访问应用锁、拍照和接听来电等功能。
触摸传感器180K,也称为触控器件。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,触摸屏也称为触控屏。触摸传感器180K用于检测作用于其上或其附近的触摸操作。触摸传感器180K可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,并且与显示屏194设置于不同的位置。
上文详细描述了电子设备100的硬件系统,下面介绍图像电子设备100的软件系统。
图2是本申请实施例提供的电子设备的软件系统的示意图。
如图2所示,系统架构中可以包括应用层210、应用框架层220、硬件抽象层230、驱动层240以及硬件层250。
应用层210可以包括相机应用程序、图库、日历、通话、地图、导航、WLAN、蓝牙、音乐、视频、短信息等应用程序。
应用框架层220为应用层的应用程序提供应用程序编程接口(applicationprogramming interface,API)和编程框架;应用框架层可以包括一些预定义的函数。
例如,应用框架层220可以包括相机访问接口;相机访问接口中可以包括相机管理与相机设备。其中,相机管理可以用于提供管理相机的访问接口;相机设备可以用于提供访问相机的接口。
硬件抽象层230用于将硬件抽象化。比如,硬件抽象层可以包相机抽象层以及其他硬件设备抽象层;相机硬件抽象层可以调用相机算法库中的算法。
例如,相机算法库中可以包括用于图像处理的软件算法。
驱动层240用于为不同硬件设备提供驱动。例如,驱动层可以包括相机设备驱动;数字信号处理器驱动、图形处理器驱动或者中央处理器驱动。
硬件层250可以包括相机设备以及其他硬件设备。
例如,硬件层250包括相机设备、数字信号处理器、图形处理器或者中央处理器;示例性地,相机设备中可以包括图像信号处理器,图像信号处理器可以用于图像处理。
示例性地,本申请实施例提供的下采样模型的训练方法可以在数字信号处理器、图形处理器或者中央处理器中执行;或者电子设备的其他算例硬件中执行。
目前,在暗光环境下拍摄;比如,在夜景环境下拍摄图像或者录制视频时,由于电子设备的进光量较少导致图像的噪声较大;为了减小图像中的噪声,提升图像质量,通常对图像进行Raw域降噪处理;由于受限于电子设备的运算性能与功耗,在进行Raw域降噪时需要减小图像的尺寸;但是,对Raw域进行下采样处理后会存在图像的清晰度受损的问题。
有鉴于此,本申请实施例提供了一种下采样模型的训练方法与图像处理方法,通过本申请实施例中的下采样模型对Raw域图像进行下采样处理时,能够避免清晰度的损失,提高图像的清晰度。
下面结合图3与图4对本申请实施例提供的图像处理方法的应用场景进行举例说明。
应用场景一:拍照领域
本申请的图像处理方法可以应用于拍照领域;例如,可以应用于暗光场景的拍摄图像或者录制视频;如图3所示,在暗光场景下(例如,夜晚)拍照时,电子设备的进光量少导致获取的图像噪声较大;图3中的(a)是采样现有方案进行图像处理,得到拍摄对象261的预览图像;图3中的(b)是通过本申请实施例提供的图像处理方法,得到拍摄对象261的预览图像;图3中的(b)所示的预览图像与图3中的(a)所示的预览图像相比,清晰度得到提升;因此,通过本申请实施例的图像处理方法,能够提升图像的清晰度,提高图像质量。
应用场景二:视频通话
本申请的图像处理方法可以应用于视频通话领域;比如,在暗光场景下视频通话时,由于电子设备的进光量少导致视频通话的图像噪声较大;如图4所示,图4中的(a)是采样现有方案进行图像处理,得到拍摄对象262的预览图像;图4中的(b)是通过本申请实施例提供的图像处理方法,得到拍摄对象262的预览图像;图4中的(b)所示的预览图像与图4中的(a)所示的预览图像相比,清晰度得到提升;因此,通过本申请实施例的图像处理方法,能够提升图像的清晰度,提高图像质量。
应理解,上述为对应用场景的举例说明,并不对本申请的应用场景作任何限定。
下面结合图5与图11对本申请实施例提供的下采样模型的训练方法与图像处理方法进行详细描述。
首先,对本申请实施例提供的下采样模型的训练方法进行详细描述;通过本申请实施例的训练方法得到的下采样模型可以用于对Raw域图像进行下采样处理;从而能够在满足电子设备的运行性能的情况下,提高图像的清晰度。
实现方式一
在一个示例中,在可以获取去马赛克算法的情况下,即去马赛克算法已知时,可以通过图5所示的训练方法得到下采样模型。
图5是本申请实施例提供的一种下采样模型的训练方法的示意图。
应理解,图5所示的下采样模型的训练方法可以由训练装置执行,该训练装置具体可以是图1中的电子设备,也可以是图2所示的数字信号处理器、图形处理器或者中央处理器执行;图5所示的训练方法300包括步骤S310至步骤S360,下面分别对步骤S310至步骤S360进行详细的描述。
步骤S310、获取样本Raw域图像(第一样本图像的一个示例)与去马赛克算法。
应理解,样本Raw域图像是指Raw颜色空间的样本图像;样本Raw域图像是指样本图像在Raw颜色空间。
步骤S320、根据去马赛克算法对样本Raw域图像进行处理,得到第一样本RGB域图像(第二样本图像的一个示例)。
应理解,第一样本RGB域图像是指RGB颜色空间的样本图像;第一样本RGB域图像是指样本图像在RGB颜色空间。
还应理解,第一样本RGB域图像与样本Raw域图像的分辨率大小相同。
步骤S330、对第一样本RGB域图像进行下采样处理,得到第二样本RGB域图像(第三样本图像的一个示例)。
示例性地,第一样本RGB域图像可以为第一分辨率的RGB域图像,第二样本RGB域图像可以为第二分辨率的RGB域图像,第一分辨率大于第二分辨率;比如,第一分辨率可以是指高分辨率,第二分辨率可以是指低分辨率。
在一个示例中,样本Raw域图像可以为4K图像;第一样本RGB域图像可以为4K图像,第二样本RGB域图像可以为2K图像。
步骤S340、以样本Raw域图像为输入数据输入下采样模型,得到预测Raw域图像(第一预测图像的一个示例)。
示例性地,预测Raw域图像的分辨率大小与样本Raw域图像的分辨率大小可以满足一定的比例关系;比如,样本Raw域图像的分辨率为A,预测Raw域图像的分辨率可以为A/2,或者A/3等。
步骤S350、根据去马赛克算法对预测Raw域图像进行处理,得到预测RGB域图像(第二预测图像的一个示例)。
需要说明的是,预测Raw域图像与预测RGB域图像的分辨率大小可以是相同的。
步骤S360、以第二样本RGB域图像为目标值,根据预测RGB域图像与第二样本RGB域图像之间的差异训练下采样模型。
例如,将预测RGB域图像与第二样本RGB域图像进行比较,并通过反向传播算法对下采样模型的参数进行迭代,直至待训练的下采样模型收敛,得到训练后的下采样模型,即得到预先训练的下采样神经网络。
示例性地,在本申请的实施例中,下采样模型可以是深度神经网络、卷积神经网络或者其他神经网络结构,本申请对此不作任何限定。
应理解,上述以训练数据为样本Raw域图像与样本RGB域图像进行举例说明;样本RGB域图像还可以是其他颜色空间的图像,本申请对此不作任何限定。
还应理解,下采样模型是通过训练数据与已知去马赛克算法训练得到的;因此,下采样模型可以是适配该已知去马赛克算法的神经网络;对于不同的去马赛克算法可以得到不同的预先训练的下采样神经网络。
在本申请的实施例中,在训练下采样模型时是以第二样本RGB域图像(例如,低分辨率的RGB域图像)作为目标值,而第二样本RGB域图像是通过对第一样本RGB域图像(例如,高分辨率的RGB域图像)进行下采样得到的;因此,第二样本RGB域图像与第一样本RGB域图像的清晰度是相同的;因此,通过下采样模型得到的下采样处理后的Raw域图像不会存在清晰度损失的问题;换而言之,在训练下采样模型时,是以与高分辨率的RGB域图像相同清晰度的低分辨率的RGB域图像作为目标值;因此,通过本申请实施例中的下采样模型对Raw域图像进行下采样处理时,能够避免清晰度的损失,提高图像的清晰度。
实现方式二
在一个示例中,在无法获取去马赛克算法的情况下,即在去马赛克算法未知时,可以先通过训练得到去马赛克模型;根据去马赛克模型与样本数据,得到下采样模型,如图6所示。
需要说明的是,实现方式二与实现方式一的区别在于,在实现方式二中无法直接获取去马赛克算法,需要通过获取大量的样本数据进行训练,得到学习样本数据对应的去马赛克算法的去马赛克模型,即得到预先训练的去马赛克神经网络。
图6是本申请实施例提供的一种下采样模型的训练方法的示意图。
应理解,图6所示的下采样模型的训练方法可以由训练装置执行,该训练装置具体可以是图1中的电子设备,也可以是图2所示的数字信号处理器、图形处理器或者中央处理器执行;图6所示的训练方法400包括步骤S410至步骤S460,下面分别对步骤S410至步骤S460进行详细的描述。
步骤S410、获取样本Raw域图像(第一样本图像的一个示例)与样本RGB域图像(第二样本图像的一个示例)。
应理解,样本Raw域图像是指Raw颜色空间的样本图像;样本Raw域图像是指样本图像在Raw颜色空间;同理,样本RGB域图像是指RGB颜色空间的样本图像;样本RGB域图像是指样本图像在RGB颜色空间。
需要说明的是,样本RGB域图像是指对样本Raw域图像通过未知的去马赛克算法处理得到的图像。
步骤S420、以样本Raw域图像为输入数据,以样本RGB域图像为目标值,训练去马赛克模型进行,得到训练后的去马赛克模型。
示例性地,将样本Raw域图像输入至去马赛克模型,得到预测RGB域图像(第三预测图像的一个示例);根据预测RGB域图像与样本RGB域图像进行比较;通过反向传播算法对待训练的去马赛克模型的参数进行迭代,直至待训练的去马赛克模型收敛,得到训练后的去马赛克模型,即得到预先训练的去马赛克神经网络。
示例性地,在本申请的实施例中,去马赛克模型可以是深度神经网络、卷积神经网络或者其他神经网络结构,本申请对此不作任何限定。
步骤S430、对样本RGB域图像进行下采样处理,得到第三样本RGB域图像(第三样本图像的一个示例)。
示例性地,样本RGB域图像可以为第一分辨率的RGB域图像,第三样本RGB域图像可以为第二分辨率的RGB域图像,第一分辨率大于第二分辨率;比如,第一分辨率可以是指高分辨率,第二分辨率可以是指低分辨率。
在一个示例中,样本Raw域图像可以为4K图像,样本RGB域图像可以为4K图像,第三样本RGB域图像可以为2K图像。
步骤S440、以样本Raw域图像为输入数据输入待训练的下采样模型,得到预测Raw域图像(第一预测图像的一个示例)。
示例性地,预测Raw域图像的分辨率大小与样本Raw域图像的分辨率大小可以满足一定的比例关系;比如,样本Raw域图像的分辨率为A,预测Raw域图像的分辨率可以为A/2,或者A/3等。
步骤S450、将预测Raw域图像(第一预测图像的一个示例)输入去马赛克模型,得到预测RGB域图像(第二预测图像的一个示例)。
需要说明的是,预测Raw域图像与预测RGB域图像的分辨率大小可以是相同的。
步骤S460、以第二样本RGB域图像为目标值,根据预测RGB域图像与第二样本RGB域图像之间的差异训练下采样模型。
例如,将预测RGB域图像与第三样本RGB域图像进行比较,并通过反向传播算法对下采样模型的参数进行迭代,直至待训练的下采样模型收敛,得到训练后的下采样模型,即得到预先训练的下采样神经网络。
示例性地,在本申请的实施例中,下采样模型可以是深度神经网络、卷积神经网络或者其他神经网络结构,本申请对此不作任何限定。
应理解,上述以训练数据为样本Raw域图像与样本RGB域图像进行举例说明;样本RGB域图像还可以是其他颜色空间的图像,本申请对此不作任何限定。
还应理解,下采样模型是通过训练数据与去马赛克模型训练得到的;因此,下采样模型可以是适配该去马赛克模型的神经网络;对于不同的去马赛克模型可以得到不同的预先训练的下采样神经网络。
在本申请的实施例中,在训练下采样模型时是以第三样本RGB域图像(例如,低分辨率的RGB域图像)作为目标值,而第三样本RGB域图像是通过对样本RGB域图像(例如,高分辨率的RGB域图像)进行下采样得到的;因此,第三样本RGB域图像与样本RGB域图像的清晰度是相同的;因此,通过下采样模型得到的下采样处理后的Raw域图像不会存在清晰度损失的问题;换而言之,在训练下采样模型时,是以与高分辨率的RGB域图像相同清晰度的低分辨率的RGB域图像作为目标值;因此,通过本申请实施例中的下采样模型对Raw域图像进行下采样处理时,能够避免清晰度的损失,提高图像的清晰度。
通过图5与图6所示的训练方法得到的下采样模型可以应用于图像处理方法;下面集合图7对本申请实施例提供的图像处理方法进行描述。
图7是本申请实施例提供的一种图像处理方法的示意图。图7所示的图像处理方法可以由图1中所示的电子设备执行,或者,由配置于图1所示的电子设备中的芯片执行;图7所示的图像处理方法500包括步骤S510至步骤S530,下面分别对步骤S510至步骤S530进行详细的描述。
步骤S510、获取Raw域图像(第一图像的一个示例)。
示例性地,可以获取电子设备的传感器采集的Raw域图像。
应理解,Raw域图像可以是指在Raw颜色空间获取的图像;即Raw域图像可以是指图像在Raw颜色空间。
步骤S520、将Raw域图像输入至下采样模型,得到下采样后的Raw域图像(第二图像的一个示例)。
示例性地,获取的Raw域图像为第一分辨率,下采样后的Raw域图像为第二分辨率,其中,第一分辨率大于第二分辨率。
例如,获取的Raw域图像可以是指传感器采集的4K全尺寸图像,下采样后的Raw域图像可以是指2K的Raw域图像。
应理解,下采样模型可以是根据如图5或图6所示的训练方法得到的,此处不再赘述。
步骤S530、对下采样后的Raw域图像进行图像处理,得到处理后的图像(第三图像的一个示例)。
示例性地,图像处理可以包括但不限于:
降噪处理、超分辨率处理或者去模糊处理等。
可选地,图7所示的图像处理方法可以是独立于ISP的图像处理方法;比如,如图7所示的图像处理方法可以在如图2所示的相机算法库中执行。
可选地,图7所示的图像处理方法可以在ISP中执行;比如,ISP中可以包括第一模块,第一模块用于执行如图7所示的图像处理方法;比如,可以在NPU中执行下采样模型的训练方法,得到下采样模型的参数;ISP中的第一模块可以获取下采样模型的参数得到下采样模型,通过下采样模型对第一图像进行下采样处理。
在本申请的实施例中,在训练下采样模型时是以低分辨率的RGB域图像作为目标值,而低分辨率的RGB域图像是通过对高分辨率的RGB域图像进行下采样得到的;因此,低分辨率的RGB域图像高分辨率的RGB域图像的清晰度是相同的;因此,通过下采样模型得到的下采样处理后的Raw域图像不会存在清晰度损失的问题;换而言之,在训练下采样模型时,是以与高分辨率的RGB域图像相同清晰度的低分辨率的RGB域图像作为目标值;因此,通过本申请实施例中的下采样模型对Raw域图像进行下采样处理时,能够避免清晰度的损失,提高图像的清晰度。
图8是本申请实施例提供的图像处理方法的效果示意图。
如图8所示,图8中的(a)是通过本申请实施例的图像处理方法得到的输出图像;图8中的(b)是通过现有的Raw域图像进行降噪处理后采用V2H2的binning方式得到输出图像;与图8中的(a)所示的输出图像相比,图8中的(b)所示的输出图像清晰度较低;因此,通过本申请实施例提供的图像处理方法在对图像进行降噪处理时与现有的方案相比,能够提升图像的清晰度。
在一个示例中,可以在电子设备的相机应用程序中开启夜景模式,则在电子设备识别到当前的拍摄环境处于进光量较少的场景下,通过本申请实施例提供的图像处理方法对传感器采集的Raw域图像进行降噪处理,从而输出处理后的图像或者视频。
图9示出了电子设备的一种图形用户界面(graphical user interface,GUI)。
如图9中的(a)所示的GUI可以是相机应用程序在拍照模式下的显示界面,该显示界面中可以包括拍摄界面610;拍摄界面610上可以包括取景框611与控件;比如,取景框611中可以包括用于指示拍照的控件612与用于指示设置的控件613;检测到用户点击控件613的操作,响应于用户操作显示设置界面,如图9中的(b)所示;在设置界面上包括夜景模式614,检测到用户开启夜景模式;在电子设备开启夜景模式后,可以通过本申请实施例提供的图像处理方法对电子设备采集的图像进行图像处理。
在一个示例中,如图10中的(a)所示的拍摄界面610中可以包括用于指示设置的控件613;检测到用户点击控件613的操作,响应于用户操作显示设置界面,如图10中的(b)所示;在设置界面上包括人工智能(artificial intelligence,AI)夜景模式615,检测到用户开启AI夜景模式;在用户开启AI夜景模式后,用户可以无需手动选择开启夜景模式;即电子设备可以根据拍摄场景的进光量自动识别暗光场景,在暗光场景中自动开启夜景模式;开启夜景模式后可以采用本申请实施例提供的图像处理方法对获取的图像进行处理,得到处理后的图像。
在一个示例中,如图11所示在拍照模式下,拍摄界面610中还可以包括控件616,控件616用于指示开启/关闭夜景模式;在电子设备检测到用户点击控件616的操作后,电子设备可以开启夜景模式,通过本申请实施例提供的图像处理方法对电子设备采集的图像进行图像处理。
在本申请的实施例中,通过预先训练的下采样神经网络输出的低分辨率Raw域图像与去马赛克算法(或者预先训练的去马赛克神经网络)可以得到低分辨率的RGB域图像;在训练下采样神经网络时,是以低分辨率样本RGB域图像作为目标值,而低分辨率样本RGB域图像是通过对高分辨率样本的RGB域图像进行下采样得到的;因此,低分辨率的样本RGB域图像与高分辨率的样本RGB域图像的清晰度是相同的;因此,通过下采样模型得到的低分辨率的Raw域图像不会存在清晰度损失的问题因此,能够避免图像清晰度的损失,提高图像的清晰度。
上文结合图1至图11详细描述了本申请实施例提供的下采样模型的训练方法与图像处理方法;下面将结合图12与图14详细描述本申请的装置实施例。应理解,本申请实施例中的装置可以执行前述本申请实施例的各种方法,即以下各种产品的具体工作过程,可以参考前述方法实施例中的对应过程。
图12是本申请实施例提供的一种下采样模型的训练装置的结构示意图。该训练装置700包括获取模块710与处理模块720。
其中,所述获取模块710用于获取训练数据,其中,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像;所述处理模块720用于将所述第一样本图像输入下采样模型,得到第一预测图像,所述第一预测图像为所述第一颜色空间的图像,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理;基于第三样本图像与第二预测图像训练所述下采样模型,得到训练后的下采样模型,其中,所述第三样本图像是指对所述第二样本图像进行所述下采样处理后得到的图像,所述第二预测是指对所述第一预测图像进行去马赛克处理得到的所述第二颜色空间的图像。
可选地,作为一个实施例,所述处理模块720还用于:
获取去马赛克算法,所述去马赛克算法用于进行所述去马赛克处理。
可选地,作为一个实施例,所述处理模块720还用于:
将所述第一样本图像输入去马赛克模型,得到第三预测图像,所述第三预测图像为所述第二颜色空间的图像;
基于所述第三预测图像与所述第二样本图像训练所述去马赛克模型,得到训练后的去马赛克模型。
可选地,作为一个实施例,所述下采样模型的参数是根据所述第三样本图像与所述第二预测图像之间的差异通过反向传播算进行迭代得到的。
可选地,作为一个实施例,所述去马赛克模型的参数是根据所述第三预测图像与所述第一样本图像之间的差异通过反向传播算进行迭代得到的。
需要说明的是,上述训练装置700以功能模块的形式体现。这里的术语“模块”可以通过软件和/或硬件形式实现,对此不作具体限定。
图13是本申请实施例提供的一种图像处理装置的结构示意图。该图像处理装置800包括显示模块810与处理模块820。
其中,所述显示模块810用于显示第一界面,所述第一界面包括第一控件;所述处理模块820用于检测到对所述第一控件的第一操作;响应于所述第一操作,获取第一图像,所述第一图像为第一颜色空间的图像;根据下采样模型对所述第一图像进行处理,得到第二图像,其中,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理,所述下采样模型是根据训练数据与目标数据训练得到的,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指所述第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像,所述目标数据是指对所述第二样本图像进行所述下采样处理后的图像;对所述第二图像进行图像处理,得到第三图像。
可选地,作为一个实施例,所述下采样模型的参数是根据第二预测图像与所述目标数据之间的差异通过反向传播算进行迭代得到的,所述第二预测是指对第一预测图像进行所述去马赛克处理得到的所述第二颜色空间的图像,所述第一预测图像是对指将所述第一样本图像输入所述下采样模型得到的图像。
可选地,作为一个实施例,通过去马赛克算法执行所述去马赛克处理。
可选地,作为一个实施例,通过去马赛克模型执行所述去马赛克处理,所述去马赛克模型是通过以所述第一样本图像为输入数据,以所述第二样本图像为目标值训练得到的。
可选地,作为一个实施例,所述去马赛克模型的参数是根据第三预测图像与所述第一样本图像之间的差异通过反向传播算进行迭代得到的,所述第三预测图像是指将所述第一样本图像输入去马赛克模型得到的图像。
可选地,作为一个实施例,所述处理模块820还用于:
检测到第二操作,所述第二操作用于指示开启所述图像处理装置的夜景模式,所述夜景模式是指所述图像处理装置的进光量小于预设阈值的拍摄模式。
可选地,作为一个实施例,所述第一界面是指所述图像处理装置的主屏界面,所述主屏界面包括相机应用程序,所述第一控件是指所述相机应用程序对应的控件。
可选地,作为一个实施例,所述第一界面是指拍照界面,所述第一控件是指用于指示拍照的控件。
可选地,作为一个实施例,所述第一界面是指视频通话界面,所述第一控件是指用于指示视频通话的控件。
需要说明的是,上述图像处理装置800以功能模块的形式体现。这里的术语“模块”可以通过软件和/或硬件形式实现,对此不作具体限定。
例如,“模块”可以是实现上述功能的软件程序、硬件电路或二者结合。所述硬件电路可能包括应用特有集成电路(application specific integrated circuit,ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。
因此,在本申请的实施例中描述的各示例的单元,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
图14示出了本申请提供的一种电子设备的结构示意图。图14中的虚线表示该单元或该模块为可选的;电子设备900可以用于实现上述方法实施例中描述的方法。
电子设备900包括一个或多个处理器901,该一个或多个处理器901可支持电子设备900实现方法实施例中的下采样模型的训练方法,或者图像处理方法。处理器901可以是通用处理器或者专用处理器。例如,处理器901可以是中央处理器(central processingunit,CPU)、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammable gate array,FPGA)或者其它可编程逻辑器件,如分立门、晶体管逻辑器件或分立硬件组件。
处理器901可以用于对电子设备900进行控制,执行软件程序,处理软件程序的数据。电子设备900还可以包括通信单元905,用以实现信号的输入(接收)和输出(发送)。
例如,电子设备900可以是芯片,通信单元905可以是该芯片的输入和/或输出电路,或者,通信单元905可以是该芯片的通信接口,该芯片可以作为终端设备或其它电子设备的组成部分。
又例如,电子设备900可以是终端设备,通信单元905可以是该终端设备的收发器,或者,通信单元905可以是该终端设备的收发电路。
电子设备900中可以包括一个或多个存储器902,其上存有程序904,程序904可被处理器901运行,生成指令903,使得处理器901根据指令903执行上述方法实施例中描述的训练方法,或者图像处理方法。
可选地,存储器902中还可以存储有数据。可选地,处理器901还可以读取存储器902中存储的数据,该数据可以与程序904存储在相同的存储地址,该数据也可以与程序904存储在不同的存储地址。
处理器901和存储器902可以单独设置,也可以集成在一起,例如,集成在终端设备的系统级芯片(system on chip,SOC)上。
示例性地,存储器902可以用于存储本申请实施例中提供的下采样模型的训练方法的相关程序904,处理器901可以用于在执行训练下采样模型时调用存储器902中存储的下采样模型的训练方法的相关程序904,执行本申请实施例的下采样模型的训练方法;例如,获取训练数据,其中,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像;将所述第一样本图像输入下采样模型,得到第一预测图像,所述第一预测图像为所述第一颜色空间的图像,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理;基于第三样本图像与第二预测图像训练所述下采样模型,得到训练后的下采样模型,其中,所述第三样本图像是指对所述第二样本图像进行所述下采样处理后得到的图像,所述第二预测是指对所述第一预测图像进行去马赛克处理得到的所述第二颜色空间的图像。
示例性地,存储器902可以用于存储本申请实施例中提供的图像处理方法的相关程序904,处理器901可以用于在执行图像处理时调用存储器902中存储的图像处理方法的相关程序904,执行本申请实施例的图像处理方法;例如,显示第一界面,所述第一界面包括第一控件;检测到对所述第一控件的第一操作;响应于所述第一操作,获取第一图像,所述第一图像为第一颜色空间的图像;根据下采样模型对所述第一图像进行处理,得到第二图像,其中,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理,所述下采样模型是根据训练数据与目标数据训练得到的,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指所述第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像,所述目标数据是指对所述第二样本图像进行所述下采样处理后的图像;对所述第二图像进行图像处理,得到第三图像。
本申请还提供了一种计算机程序产品,该计算机程序产品被处理器901执行时实现本申请中任一方法实施例所述的训练方法或者图像处理方法。
该计算机程序产品可以存储在存储器902中,例如是程序904,程序904经过预处理、编译、汇编和链接等处理过程最终被转换为能够被处理器901执行的可执行目标文件。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机执行时实现本申请中任一方法实施例所述的图像处理方法。该计算机程序可以是高级语言程序,也可以是可执行目标程序。
该计算机可读存储介质例如是存储器902。存储器902可以是易失性存储器或非易失性存储器,或者,存储器902可以同时包括易失性存储器和非易失性存储器。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmableROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(randomaccess memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamicRAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
本领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和设备的具体工作过程以及产生的技术效果,可以参考前述方法实施例中对应的过程和技术效果,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的方法实施例的一些特征可以忽略,或不执行。以上所描述的装置实施例仅仅是示意性的,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元或组件可以结合或者可以集成到另一个系统。另外,各单元之间的耦合或各个组件之间的耦合可以是直接耦合,也可以是间接耦合,上述耦合包括电的、机械的或其它形式的连接。
应理解,在本申请的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
另外,本文中术语“系统”和“网络”在本文中常被可互换使用。本文中的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
总之,以上所述仅为本申请技术方案的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (19)

1.一种下采样模型的训练方法,其特征在于,包括:
获取训练数据,其中,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像;
将所述第一样本图像输入下采样模型,得到第一预测图像,所述第一预测图像为所述第一颜色空间的图像,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理;
基于第三样本图像与第二预测图像训练所述下采样模型,得到训练后的下采样模型,其中,所述第三样本图像是指对所述第二样本图像进行所述下采样处理后得到的图像,所述第二预测是指对所述第一预测图像进行去马赛克处理得到的所述第二颜色空间的图像。
2.如权利要求1所述的训练方法,其特征在于,还包括:
获取去马赛克算法,所述去马赛克算法用于进行所述去马赛克处理。
3.如权利要求1所述的训练方法,其特征在于,还包括:
将所述第一样本图像输入去马赛克模型,得到第三预测图像,所述第三预测图像为所述第二颜色空间的图像;
基于所述第三预测图像与所述第二样本图像训练所述去马赛克模型,得到训练后的去马赛克模型。
4.如权利要求1至3中任一项所述的训练方法,其特征在于,所述下采样模型的参数是根据所述第三样本图像与所述第二预测图像之间的差异通过反向传播算进行迭代得到的。
5.如权利要求3所述的训练方法,其特征在于,所述去马赛克模型的参数是根据所述第三预测图像与所述第一样本图像之间的差异通过反向传播算进行迭代得到的。
6.一种图像处理方法,其特征在于,应用于电子设备,包括:
显示第一界面,所述第一界面包括第一控件;
检测到对所述第一控件的第一操作;
响应于所述第一操作,获取第一图像,所述第一图像为第一颜色空间的图像;
根据下采样模型对所述第一图像进行处理,得到第二图像,其中,所述下采样模型用于对所述第一颜色空间的图像进行下采样处理,所述下采样模型是根据训练数据与目标数据训练得到的,所述训练数据包括第一样本图像与第二样本图像,所述第一样本图像是指所述第一颜色空间的图像,所述第二样本图像是指对所述第一样本图像进行去马赛克处理得到的第二颜色空间的图像,所述目标数据是指对所述第二样本图像进行所述下采样处理后的图像;
对所述第二图像进行图像处理,得到第三图像。
7.如权利要求6所述的图像处理方法,其特征在于,所述下采样模型的参数是根据第二预测图像与所述目标数据之间的差异通过反向传播算进行迭代得到的,所述第二预测是指对第一预测图像进行所述去马赛克处理得到的所述第二颜色空间的图像,所述第一预测图像是对指将所述第一样本图像输入所述下采样模型得到的图像。
8.如权利要求6或7所述的图像处理方法,其特征在于,通过去马赛克算法执行所述去马赛克处理。
9.如权利要求6或7所述的图像处理方法,其特征在于,通过去马赛克模型执行所述去马赛克处理,所述去马赛克模型是通过以所述第一样本图像为输入数据,以所述第二样本图像为目标值训练得到的。
10.如权利要求9所述的图像处理方法,其特征在于,所述去马赛克模型的参数是根据第三预测图像与所述第一样本图像之间的差异通过反向传播算进行迭代得到的,所述第三预测图像是指将所述第一样本图像输入去马赛克模型得到的图像。
11.如权利要求6至10中任一项所述的图像处理方法,其特征在于,还包括:
检测到第二操作,所述第二操作用于指示开启所述电子设备的夜景模式,所述夜景模式是指所述电子设备的进光量小于预设阈值的拍摄模式。
12.如权利要求6至11中任一项所述的图像处理方法,其特征在于,所述第一界面是指所述电子设备的主屏界面,所述主屏界面包括相机应用程序,所述第一控件是指所述相机应用程序对应的控件。
13.如权利要求6至11中任一项所述的图像处理方法,其特征在于,所述第一界面是指拍照界面,所述第一控件是指用于指示拍照的控件。
14.如权利要求6至11中任一项所述的图像处理方法,其特征在于,所述第一界面是指视频通话界面,所述第一控件是指用于指示视频通话的控件。
15.一种下采样模型的训练装置,其特征在于,所述训练装置包括:
一个或多个处理器和存储器;
所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述一个或多个处理器调用所述计算机指令以使得所述训练装置执行如权利要求1至5中任一项所述的训练方法。
16.一种图像处理装置,其特征在于,所述训练装置包括:
一个或多个处理器和存储器;
所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述一个或多个处理器调用所述计算机指令以使得所述电子设备执行如权利要求6至14中任一项所述的图像处理方法。
17.一种芯片系统,其特征在于,所述芯片系统应用于电子设备,所述芯片系统包括一个或多个处理器,所述处理器用于调用计算机指令以使得所述电子设备执行如权利要求1至5,或者6至14中任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储了计算机程序,当所述计算机程序被处理器执行时,使得处理器执行权利要求1至5,或者6至14中任一项所述的方法。
19.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序代码,当所述计算机程序代码被处理器执行时,使得处理器执行权利要求1至5,或者6至14中任一项所述的方法。
CN202111326744.9A 2021-11-10 2021-11-10 下采样模型的训练方法、图像处理方法及装置 Pending CN116128739A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111326744.9A CN116128739A (zh) 2021-11-10 2021-11-10 下采样模型的训练方法、图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111326744.9A CN116128739A (zh) 2021-11-10 2021-11-10 下采样模型的训练方法、图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN116128739A true CN116128739A (zh) 2023-05-16

Family

ID=86306699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111326744.9A Pending CN116128739A (zh) 2021-11-10 2021-11-10 下采样模型的训练方法、图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN116128739A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117422646A (zh) * 2023-12-19 2024-01-19 荣耀终端有限公司 去反光模型的训练方法、去反光模型和去反光方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117422646A (zh) * 2023-12-19 2024-01-19 荣耀终端有限公司 去反光模型的训练方法、去反光模型和去反光方法
CN117422646B (zh) * 2023-12-19 2024-05-10 荣耀终端有限公司 去反光模型的训练方法、去反光模型和去反光方法

Similar Documents

Publication Publication Date Title
CN115633262B (zh) 图像处理方法和电子设备
CN115061770B (zh) 显示动态壁纸的方法和电子设备
WO2023040725A1 (zh) 白平衡处理方法与电子设备
CN116546316B (zh) 切换摄像头的方法与电子设备
CN116055895B (zh) 图像处理方法及其装置、芯片系统和存储介质
CN116128739A (zh) 下采样模型的训练方法、图像处理方法及装置
WO2023124202A1 (zh) 图像处理方法与电子设备
CN115908120B (zh) 图像处理方法和电子设备
CN115767290B (zh) 图像处理方法和电子设备
US20240251180A1 (en) Image processing method and electronic device
CN116258633A (zh) 图像去反光的方法、图像去反光模型的训练方法与装置
CN116437198B (zh) 图像处理方法与电子设备
CN115988311A (zh) 图像处理方法与电子设备
CN115767287B (zh) 图像处理方法与电子设备
CN116740777B (zh) 人脸质量检测模型的训练方法及其相关设备
CN116029951B (zh) 图像处理方法与电子设备
CN116723417B (zh) 一种图像处理方法和电子设备
CN116012262B (zh) 一种图像处理方法、模型训练方法及电子设备
CN116029914B (zh) 图像处理方法与电子设备
CN116051386B (zh) 图像处理方法及其相关设备
CN116993620B (zh) 一种去模糊方法和电子设备
CN116668836B (zh) 拍照处理方法和电子设备
CN115955611B (zh) 图像处理方法与电子设备
CN116939363A (zh) 图像处理方法与电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination