CN117499797A - 图像处理方法及相关设备 - Google Patents
图像处理方法及相关设备 Download PDFInfo
- Publication number
- CN117499797A CN117499797A CN202311851564.1A CN202311851564A CN117499797A CN 117499797 A CN117499797 A CN 117499797A CN 202311851564 A CN202311851564 A CN 202311851564A CN 117499797 A CN117499797 A CN 117499797A
- Authority
- CN
- China
- Prior art keywords
- visible light
- image
- images
- near infrared
- image sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000015654 memory Effects 0.000 claims description 44
- 239000013598 vector Substances 0.000 claims description 32
- 230000004927 fusion Effects 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 24
- 230000003287 optical effect Effects 0.000 claims description 20
- 230000009467 reduction Effects 0.000 claims description 19
- 238000012216 screening Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 15
- 238000009877 rendering Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 36
- 230000006854 communication Effects 0.000 description 36
- 230000006870 function Effects 0.000 description 35
- 238000007726 management method Methods 0.000 description 22
- 238000004422 calculation algorithm Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 13
- 238000010295 mobile communication Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 241001156002 Anthonomus pomorum Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/95—Computational photography systems, e.g. light-field imaging systems
- H04N23/951—Computational photography systems, e.g. light-field imaging systems by using two or more images to influence resolution, frame rate or aspect ratio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3876—Recombination of partial images to recreate the original image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/10—Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from different wavelengths
- H04N23/11—Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from different wavelengths for generating image signals from visible and infrared light wavelengths
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
- H04N23/81—Camera processing pipelines; Components thereof for suppressing or minimising disturbance in the image signal generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/265—Mixing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Studio Devices (AREA)
Abstract
本申请实施例提供一种图像处理方法及相关设备,所述方法包括:采集多个可见光图像及多个近红外图像;获取第一可见光图像序列及第一近红外图像序列;根据图像清晰度生成第二可见光图像序列;根据第二可见光图像序列生成第二近红外图像序列;分别计算第二近红外图像序列中的每个近红外图像相对于第二可见光图像序列中可见光图像的运动幅度;根据运动幅度生成第三近红外图像序列;对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行融合,得到目标图像。本申请实施例可以筛选出差异较小的多个可见光图像和多个近红外图像,并对多个可见光图像和多个近红外图像融合得到目标图像,从而提升电子设备的出图质量。
Description
技术领域
本申请涉及智能终端技术领域,尤其涉及一种图像处理方法及相关设备。
背景技术
随着终端技术的发展,智能手机、平板电脑等智能终端设备都具有拍摄功能,使得用户可以通过拍摄照片或拍摄视频的方式记录各类场景,并且用户对于拍摄的体验要求和拍摄的图像画质要求也越来越高。相关技术中,智能终端设备通常采用可见光摄像头进行拍摄,然而,在远距离拍摄场景或暗光拍摄场景下,可见光摄像头的成像质量较差,导致拍摄得到的图像画质不佳,影响用户的使用体验。
发明内容
鉴于以上内容,有必要提供一种图像处理方法及相关设备,解决上述在远距离拍摄场景或暗光拍摄场景下,可见光摄像头的成像质量较差,导致拍摄得到的图像画质不佳,影响用户的使用体验的问题。
第一方面,本申请提供一种图像处理方法,应用于电子设备,所述方法包括:响应用户开启相机应用程序的操作,控制所述电子设备的可见光摄像头采集多个可见光图像及控制所述电子设备的近红外摄像头采集多个近红外图像;响应用户的拍摄操作,从所述多个可见光图像中获取第一可见光图像序列,及从所述多个近红外图像中获取第一近红外图像序列;根据图像清晰度从所述第一可见光图像序列中筛选出多个可见光图像,生成第二可见光图像序列;根据所述第二可见光图像序列从所述第一近红外图像序列中筛选出多个近红外图像,生成第二近红外图像序列;分别计算所述第二近红外图像序列中的每个近红外图像相对于所述第二可见光图像序列中的可见光图像的运动幅度;根据所述运动幅度从所述第二近红外图像序列中筛选出多个近红外图像,生成第三近红外图像序列;对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行融合,得到目标图像。
通过上述技术方案,在拍照过程中,通过可见光摄像头和近红外摄像头分别采集图像,从可见光摄像头和近红外摄像头采集的多个图像中筛选出差异较小的可见光图像和近红外图像,从而尽可能对差异较小的可见光图像和近红外图像进行融合,得到画质更佳的目标图像。
在一种可能的实现方式中,所述响应用户开启相机应用程序的操作,控制所述电子设备的可见光摄像头采集多个可见光图像及控制所述电子设备的近红外摄像头采集多个近红外图像,包括:响应用户开启相机应用程序的操作,判断环境光亮度指数是否大于或等于环境光亮度指数阈值;若所述环境光亮度指数大于或等于所述环境光亮度指数阈值,控制所述可见光摄像头采集所述多个可见光图像及控制所述近红外摄像头采集所述多个近红外图像。
通过上述技术方案,在环境光亮度较暗的情况下,同时控制可见光摄像头和近红外摄像头采集图像,以便于后续对采集的可见光图像和近红外图像进行融合,提升电子设备的出图质量。
在一种可能的实现方式中,所述从所述多个可见光图像中获取第一可见光图像序列,包括:获取所述可见光摄像头响应所述拍摄操作得到的第一可见光图像,获取拍摄所述第一可见光图像之前第一预设数量的第二可见光图像及拍摄第一可见光图像之后第一预设数量的第三可见光图像;基于所述第一可见光图像、所述第一预设数量的第二可见光图像及所述第一预设数量的第三可见光图像,生成所述第一可见光图像序列。
通过上述技术方案,可以根据用户的拍摄操作从多个可见光图像中筛选出用于选帧的第一可见光图像序列,从而提高选帧效率。
在一种可能的实现方式中,所述从所述多个近红外图像中获取第一近红外图像序列,包括:获取所述近红外摄像头响应所述拍摄操作得到的第一近红外图像,从所述第二预览流中获取拍摄第一近红外图像之前第一预设数量的第二近红外图像及拍摄第一近红外图像之后第一预设数量的第三近红外图像;基于所述第一近红外图像、所述第一预设数量的第二近红外图像及所述第一预设数量的第三近红外图像,生成所述第一近红外图像序列。
通过上述技术方案,可以根据用户的拍摄操作从多个近红外图像中筛选出用于选帧的第一近红外图像序列,从而提高选帧效率。
在一种可能的实现方式中,所述第二可见光图像、所述第三可见光图像、所述第二近红外图像、所述第三近红外图像的快门延时小于或等于快门延时阈值。
通过上述技术方案,可以保证第一可见光图像序列中的可见光图像和第一近红外图像序列中的近红外图像的快门延时较低,从而保证选帧质量。
在一种可能的实现方式中,所述根据图像清晰度从所述第一可见光图像序列中筛选出多个可见光图像,生成第二可见光图像序列,包括:计算所述第一可见光图像序列中每个可见光图像的清晰度因子,将最大的清晰度因子对应的可见光图像确定为基础可见光图像,将所述基础可见光图像和所述基础可见光图像之前第二预设数量的可见光图像确定为所述第二可见光序列。
通过上述技术方案,可以筛选出清晰度较高的可见光图像,作为待融合的可见光图像,从而提升融合图像的质量,进而提升出图质量。
在一种可能的实现方式中,所述根据所述第二可见光图像序列从所述第一近红外图像序列中筛选出多个近红外图像,生成第二近红外图像序列,包括:确定所述基础可见光图像的拍摄时间戳;从所述第一近红外图像序列中选择具有相同的拍摄时间戳的第四近红外图像;将所述第二可见光图像序列中所述第四近红外图像、所述第四近红外图像之前第三预设数量的近红外图像以及所述第四近红外图像之后第三预设数量的近红外图像作为所述第二近红外图像序列。
通过上述技术方案,可以筛选出清晰度较高的近红外图像,作为待融合的近红外图像,从而提升融合图像的质量,进而提升出图质量。
在一种可能的实现方式中,所述分别计算所述第二近红外图像序列中的每个近红外图像相对于所述第二可见光图像序列中的可见光图像的运动幅度,包括:提取所述基础可见光图像的Y通道图像;采用光流法分别计算所述第二近红外图像序列中的每个近红外图像相对于所述Y通道图像的运动矢量;根据所述运动矢量计算所述第二近红外图像序列中的每个近红外图像相对于所述Y通道图像的运动幅度。
通过上述技术方案,可以精确地计算得到近红外图像相对于可见光图像的运动幅度。
在一种可能的实现方式中,所述根据所述运动矢量计算所述第二近红外图像序列中的每个近红外图像相对于所述Y通道图像的运动幅度,包括:识别所述近红外图像中的主体;采用预设尺寸的像素窗口搜索所述近红外图像中的主体及主体邻域的所有像素点的运动矢量;计算所述主体及所述主体邻域的所有像素点的运动矢量的均值,得到所述近红外图像中所述主体的运动幅度,并将所述主体的运动幅度确定为所述近红外图像相对于所述Y通道图像的运动幅度。
通过上述技术方案,将近红外图像中的主体及其邻域的像素点的运动幅度作为近红外图像相对于可见光图像的运动幅度,可以避免近红外图像中非主体区域的运动幅度对近红外图像的选帧造成影响,提升选帧效率。
在一种可能的实现方式中,所述根据所述运动幅度从所述第二近红外图像序列中筛选出多个近红外图像,生成第三近红外图像序列,包括:根据所述运动幅度,对所述第二近红外图像序列中的多个近红外图像进行升序排序;选择排序在前第四预设数量的近红外图像作为所述第三近红外图像序列。
通过上述技术方案,可以筛选出与选帧得到的可见光图像差异较小的近红外图像,作为最终待融合的近红外图像,从而提升融合图像的质量,进而提升出图质量。
在一种可能的实现方式中,所述对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行融合,得到目标图像,包括:对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行预处理;对所述第二可见光图像序列中的多个可见光图像进行融合,得到融合可见光图像;对所述第三近红外图像序列中的多个近红外图像进行融合,得到融合近红外图像;对所述融合可见光图像和所述融合近红外图像进行融合,得到所述目标图像。
通过上述技术方案,对可见光图像和近红外图像进行预处理后再进行融合,可以提升融合图像的质量,先分别对多个可见光图像和多个近红外图像进行融合得到中间融合图像,再对可见光图像对应的中间融合图像和近红外图像对应的中间融合图像进行融合,得到最终的目标图像,有效提升了图像融合效率。
在一种可能的实现方式中,所述对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行预处理,包括:对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行配准;对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行降噪处理。
通过上述技术方案,在图像融合之前进行配准和降噪的预处理,可以提升图像融合质量。
在一种可能的实现方式中,所述对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行融合,得到目标图像,包括:对降噪处理后的所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行特征提取;对降噪处理后的所述第二可见光图像序列中的多个可见光图像进行语义分割,得到每个可见光图像中的感兴趣语义的先验分布;根据所述感兴趣语义的先验分布对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像中的特征进行排序;根据所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像中的特征排序筛选出多个待融合特征,并对所述多个待融合特征进行特征融合,得到目标图像。
通过上述技术方案,通过提取第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像的关键特征,并根据关键特征进行图像融合,从而在融合得到的目标图像中突出关键特征,使得目标图像呈现出虚化效果。
在一种可能的实现方式中,所述方法还包括:在对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行融合后,对融合图像进行风格化调整,得到目标图像。
通过上述技术方案,对图像进行风格化调整可以进一步优化图像的显示效果。
在一种可能的实现方式中,所述对融合图像进行风格化调整,包括:对所述融合图像进行颜色风格化调整和亮度风格化调整,得到所述目标图像。
通过上述技术方案,对图像进行颜色风格化和亮度风格化调整可以在颜色维度和亮度维度优化图像的显示效果。
在一种可能的实现方式中,所述方法还包括:响应用户查看目标图像的操作,对所述目标图像进行绘制渲染和显示。
通过上述技术方案,响应用户对目标图像的查看操作对目标图像进行绘制渲染和送显,使得绘制渲染流程符合用户需求。
第二方面,本申请提供一种电子设备,所述电子设备包括存储器和处理器:其中,所述存储器,用于存储程序指令;所述处理器,用于读取并执行所述存储器中存储的所述程序指令,当所述程序指令被所述处理器执行时,使得所述电子设备执行上述的图像处理方法。
第三方面,本申请提供一种芯片,与电子设备中的存储器耦合,所述芯片用于控制所述电子设备的处理器执行上述的图像处理方法。
第四方面,本申请提供一种计算机存储介质,所述计算机存储介质存储有程序指令,当所述程序指令在电子设备上运行时,使得所述电子设备的处理器执行上述的图像处理方法。
另外,第二方面至第四方面所带来的技术效果可参见上述方法部分各设计的方法相关的描述,此处不再赘述。
附图说明
图1是本申请一实施例提供的可见光图像的示意图。
图2是本申请一实施例提供的近红外图像的示意图。
图3是本申请一实施例提供的电子设备的软件架构图。
图4是本申请一实施例提供的图像处理方法的流程图。
图5是本申请一实施例提供的电子设备的立体示意图。
图6是本申请一实施例提供的图像处理系统的架构示意图。
图7是本申请一实施例提供的选帧流程的示意图。
图8是本申请一实施例提供的图像融合流程的框架示意图。
图9是本申请一实施例提供的计算运动幅度的流程图。
图10是本申请一实施例提供的图像融合的流程图。
图11是本申请一实施例提供的电子设备的硬件架构图。
具体实施方式
在本申请的实施例中所涉及的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个特征。在本申请实施例的描述中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。在本申请的实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请中的技术领域的技术人员通常理解的含义相同。本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。应理解,本申请中除非另有说明,“/”表示或的意思。例如,A/B可以表示A或B。本申请中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B三种情况。“至少一个”是指一个或者多个。“多个”是指两个或多于两个。例如,a、b或c中的至少一个,可以表示:a,b,c,a和b,a和c,b和c,a、b和c七种情况。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
随着终端技术的发展,智能手机、平板电脑等智能终端设备都具有拍摄功能,使得用户可以通过拍摄照片或拍摄视频的方式记录各类场景,并且用户对于拍摄的体验要求和拍摄的图像画质要求也越来越高。目前智能终端设备通常采用可见光摄像头进行拍摄,然而,在远距离拍摄场景下,可见光容易受到雾气或大气效应的影响,导致可见光摄像头拍摄得到的可见光图像产生模糊或丢失细节,导致成像质量较差,从而影响用户的使用体验。或者,在暗光拍摄场景下,由于环境光亮度较小,可见光摄像头的进光量不足,拍摄得到的图像的噪点较多,信噪比较低,导致成像质量较差,从而影响用户的使用体验。
参阅图1所示,为本申请实施例提供的可见光图像的示意图。图1中的可见光图像由可见光摄像头拍摄,由于拍摄场景所处环境的环境光亮度较小,可见光图像较为模糊,且噪点较多,可见光图像也可称为RGB图像。参阅图2所示,为本申请实施例提供的近红外(Near Infrared,NIR)图像的示意图。图2中的近红外图像由红外摄像头拍摄,图2中的拍摄场景和图1中的拍摄场景相同,相较于可见光图像,近红外图像具有更清晰的场景轮廓和细节纹理,噪点较少,信噪比较高。然而,近红外图像为黑白图像,无法作为成片使用。
为解决远摄或暗光场景下可见光摄像头拍摄的图像质量较低,以及近红外摄像头虽然在远摄或暗光场景下拍摄的近红外图像质量较高,但由于近红外图像是黑白图像,无法作为成片的问题,本申请实施例提供一种图像处理方法,可以在拍照过程中,筛选出差异较小的多个可见光图像和多个近红外图像,并将筛选得到的多个可见光图像和多个近红外图像融合,得到最终成像,从而提高摄像头的成像质量,有效优化图像的视觉效果,从而提升用户的使用体验。
参阅图3所示,为本申请实施例提供的电子设备的软件架构图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。例如,将安卓系统分为四层,从上至下分别为应用程序层101,框架层102,安卓运行时(Androidruntime)和系统库103,硬件抽象层104,内核层105,硬件层106。
应用程序层101可以包括一系列应用程序包。例如,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息,设备控制服务等应用程序。
框架层102为应用程序层的应用程序提供应用编程接口(ApplicationProgramming Interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。例如,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
其中,窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。电话管理器用于提供电子设备的通信功能。例如通话状态的管理(包括接通,挂断等)。资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等。通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层101和框架层102运行在虚拟机中。虚拟机将应用程序层和框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库103可以包括多个功能模块。例如,表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如SGL)等。
其中,表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如: MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。2D图形引擎是2D绘图的绘图引擎。
硬件抽象层104运行于用户空间,对内核层驱动进行封装,向上层提供调用接口。
内核层105是硬件和软件之间的层。内核层105至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
内核层105是电子设备的操作系统的核心,是基于硬件的第一层软件扩充,提供操作系统最基本的功能,是操作系统工作的基础,负责管理系统的进程、内存、设备驱动程序、文件和网络系统,决定了系统的性能和稳定性。例如,内核可以决定一个应用程序对某部分硬件的操作时间。
内核层105包括与硬件紧密相关的程序,例如中断处理程序、设备驱动程序等,还包括基本的、公共的、运行频率较高的模块,例如时钟管理模块、进程调度模块等,还包括关键性的数据结构。内核层可以设置于处理器中,或固化在内部存储器。
硬件层106包括电子设备的硬件,例如显示屏、按键、摄像头等。
参阅图4所示,为本申请一实施例提供的图像处理方法的流程图。所述方法应用于电子设备中,所述图像处理方法包括:
S101,响应用户开启相机应用程序的操作,控制可见光摄像头采集多个可见光图像及控制近红外摄像头采集多个近红外图像。
参阅图5所示,本申请实施例提供的电子设备的立体示意图。电子设备100包括可见光摄像头1931和近红外摄像头1932,可见光摄像头1931可以是电子设备100的前置摄像头或后置摄像头,作为电子设备100的主摄像头,近红外摄像头1932靠近可见光摄像头1931设置,作为电子设备100的辅摄像头,可见光摄像头1931和近红外摄像头1932可以拍摄相同或相近的场景的图像。
在本申请的一实施例中,用户可以点击电子设备的主界面上的相机应用程序图标,或者点击电子设备的锁屏界面上的相机开启控件,执行开启相机应用程序的操作,电子设备响应用户开启相机应用程序的操作,控制可见光摄像头拍摄前方场景的图像,采集可见光图像,以及控制近红外摄像头拍摄相同场景的图像,采集近红外图像。其中,可见光摄像头和近红外摄像头都根据相同的预设采样频率同步进行图像采集,例如,采样频率为30Hz或60Hz。
在本申请的一实施例中,相机应用程序开启之后,框架层的相机服务(CameraService)和硬件抽象层的相机提供器(CameraProvider)进行初始化,在初始化完成之后,相机应用程序下发预览拍摄请求至相机服务,相机服务下发预览拍摄请求至相机提供器,相机提供器下发预览拍摄请求至内核层的可见光摄像头和近红外摄像头的摄像头驱动。通过相应的摄像头驱动可驱动可见光摄像头采集可见光图像,以及驱动近红外摄像头采集近红外图像,并将采集到的多个可见光图像和多个近红外图像返回至相机提供器。相机提供器将多个可见光图像返回至相机服务,相机服务将多个可见光图像发送至框架层的绘制渲染服务,通过绘制渲染服务对多个可见光图像进行送显,生成相机应用程序的预览流。
在本申请的一实施例中,响应用户开启相机应用程序的操作,判断电子设备所处环境的环境光亮度指数(luxindex)是否大于或等于环境光亮度指数阈值,若环境光亮度指数(luxindex)大于或等于环境光亮度指数阈值,控制可见光摄像头采集多个可见光图像及控制近红外摄像头采集多个近红外图像。若环境光亮度指数(luxindex)小于环境光亮度指数阈值,控制可见光摄像头采集多个可见光图像。其中,环境光亮度指数由环境光传感器进行侦测,是用于指示环境光亮度的物理量,与环境光亮度成反比。例如,环境光亮度指数阈值为0.8、0.9或其他数值。
在本申请的一实施例中,响应用户开启相机应用程序的操作,判断电子设备所处环境的环境光亮度是否小于或等于环境光亮度阈值,若环境光亮度小于或等于环境光亮度阈值,控制可见光摄像头采集多个可见光图像及控制近红外摄像头采集多个近红外图像。若环境光亮度大于环境光亮度阈值,控制可见光摄像头采集多个可见光图像。其中,环境光亮度由环境光传感器进行侦测。例如,环境光亮度阈值为50lux(勒克斯)、60lux或其他数值。
在本申请的另一实施例中,响应用户开启相机应用程序的操作,判断电子设备当前进行图像拍摄的可见光摄像头是否为远摄镜头,若电子设备当前进行图像拍摄的可见光摄像头为远摄镜头,控制可见光摄像头采集多个可见光图像及控制近红外摄像头采集多个近红外图像。若电子设备当前进行图像拍摄的可见光摄像头不是远摄镜头,控制可见光摄像头采集多个可见光图像。
在本申请的另一实施例中,响应用户开启相机应用程序的操作,计算可见光摄像头的拍摄范围内的拍摄目标与可见光摄像头之间的距离,若摄目标与可见光摄像头之间的距离大于或等于距离阈值,控制可见光摄像头采集多个可见光图像及控制近红外摄像头采集多个近红外图像。若摄目标与可见光摄像头之间的距离小于距离阈值,控制可见光摄像头采集多个可见光图像。例如,距离阈值为10米、12米或其他数值。
S102,响应用户的拍摄操作,从多个可见光图像中获取第一可见光图像序列,及从多个近红外图像中获取第一近红外图像序列。
参阅图6所示,为本申请一实施例提供的图像处理系统的架构示意图。在本申请的一实施例中,在相机应用程序开启之后,用户可以通过点击相机应用程序界面上的拍摄控件,执行拍摄操作,触发拍照,相机应用程序响应用户的拍摄操作,生成并下发拍摄请求至相机服务,相机服务将拍摄请求下发至相机提供器,相机提供器下发拍摄请求至可见光摄像头和近红外摄像头的摄像头驱动,通过相应的摄像头驱动驱动可见光摄像头采集可见光图像,以及驱动近红外摄像头采集近红外图像,并将采集到的可见光图像和近红外图像返回至相机提供器。
在本申请的一实施例中,可见光摄像头响应拍摄操作,拍摄得到一个可见光图像,近红外摄像头响应拍摄操作,拍摄得到一个近红外图像,然后,相机应用程序继续下发预览拍摄请求,可见光摄像头继续采集可见光图像,并根据采集的可见光图像生成相机应用程序预览界面的预览流,近红外摄像头继续采集近红外图像。
在本申请的一实施例中,获取可见光摄像头响应拍摄操作得到的第一可见光图像、在拍摄第一可见光图像之前第一预设数量的第二可见光图像及在拍摄第一可见光图像之后第一预设数量的第三可见光图像,得到第一可见光图像序列。获取近红外摄像头响应拍摄操作得到的第一近红外图像、在拍摄第一近红外图像之前第一预设数量的第二近红外图像及在拍摄第一近红外图像之后第一预设数量的第三近红外图像,得到第一近红外图像序列。其中,第一预设数量可以是5、10、15或其他数值。例如,在第一预设数量为5时,获取的第一可见光图像序列包括11个可见光图像,获取的第一近红外图像序列包括11个近红外图像。在第一预设数量为2时,获取的第一可见光图像序列包括5个可见光图像,获取的第一近红外图像序列包括5个近红外图像。例如,第一可见光图像序列为图6的多个可见光图像中序号为4-8的图像,第一近红外图像序列为图6的多个近红外图像中序号为4-8的图像。
可以理解,本申请实施例中图像的前后根据图像拍摄时间进行区分,拍摄时间较早的图像在前,拍摄时间较晚的图像在后。
在本申请的另一实施例中,根据快门延时从多个可见光图像中获取第一可见光图像序列,及根据快门延时从多个近红外图像中获取第一近红外图像序列。将可见光摄像头拍摄第一可见光图像之前第一预设数量的快门延时小于或等于快门延时阈值的可见光图像,作为第一预设数量的第二可见光图像,将可见光摄像头拍摄第一可见光图像之后第一预设数量的快门延时小于或等于快门延时阈值的可见光图像,作为第一预设数量的第三可见光图像,然后将第一可见光图像、第一预设数量的第二可见光图像以及第一预设数量的第三可见光图像作为第一可见光图像序列。将近红外摄像头拍摄第一近红外图像之前第一预设数量的快门延时小于或等于快门延时阈值的近红外图像,作为第一预设数量的第二近红外图像,将近红外摄像头拍摄第一近红外图像之后第一预设数量的快门延时小于或等于快门延时阈值的近红外图像,作为第一预设数量的第三近红外图像,然后将第一近红外图像、第一预设数量的第二近红外图像以及第一预设数量的第三近红外图像作为第一近红外图像序列。例如,快门延时阈值可以是3ms、5ms、8ms或其他时间。由于摄像头拍照时的快门延时越高,拍摄得到的图像越不清晰,通过上述实施例,可以保证第一可见光图像序列中的可见光图像和第一近红外图像序列中的近红外图像的快门延时较小,进而保证待选帧的可见光图像和近红外图像的清晰度较高。
S103,根据图像清晰度从第一可见光图像序列中筛选出多个可见光图像,生成第二可见光图像序列。
参阅图7所示,为本申请一实施例提供的选帧流程的示意图。首先对待融合的可见光图像进行选帧,在本申请的一实施例中,计算第一可见光图像序列中每个可见光图像的清晰度因子,将第一可见光图像序列中清晰度因子最大的可见光图像确定为基础可见光图像(即基础帧),将基础可见光图像和基础可见光图像之前第二预设数量的可见光图像确定为第二可见光图像序列。例如,第二预设数量可以是3、4、5或其他数值,仅为举例说明,实际应用中不局限于此。例如,图7中的基础帧为可见光图像7,第二可见光图像序列包括序号4-7的可见光图像。
在本申请的一实施例中,在实际的拍摄过程中,可见光摄像头具有HDR拍摄功能,并且为实现HDR拍摄功能,通常需要在拍摄标准曝光图像之后进一步拍摄欠曝光图像,通过融合标准曝光图像和欠曝光图像,得到HDR图像,从而扩展图像的动态范围。欠曝光图像由于曝光不足,清晰度通常较低,为了避免第二可见光图像序列中的可见光图形的清晰度较低,将基础帧和基础帧之前拍摄的第二预设数量的可见光图像组成第二可见光图像序列,从而尽可能避免第二可见光图像序列中包含欠曝光图像。
在本申请的一实施例中,可以基于Brenner梯度函数计算可见光图像的清晰度因子,其中,Brenner梯度函数的计算公式为:
(1)。
在计算公式(1)中,(x, y)为可见光图像中每个像素点的像素值,f(x, y)为每个像素点的灰度值,D(f)为可见光图像的清晰度因子。
在本申请的其他实施例中,也可以通过Tenengrad梯度函数、拉普拉斯算子梯度函数、灰度方差函数、灰度方差乘积函数、能量梯度函数计算可见光图像的清晰度因子。上述函数为现有技术,在此不作具体描述。
S104,根据第二可见光图像序列从第一近红外图像序列中筛选出多个近红外图像,生成第二近红外图像序列。
然后根据基础可见光图像对待融合的近红外图像进行选帧。在本申请的一实施例中,确定第一近红外图像序列中拍摄时间戳与基础可见光图像的拍摄时间戳相同的第四近红外图像,将第四近红外图像、第四近红外图像之前第三预设数量的近红外图像以及第四近红外图像之后第三预设数量的近红外图像作为第二近红外图像序列。其中,第三预设数量可以是1、2、3或其他数值。例如,如图7所示,若基础可见光图像为可见光图像7,与可见光图像7的拍摄时间戳相同的近红外图像为近红外图像7,若第三预设数量为1,则第二近红外图像序列包括序号为6-8的近红外图像。
S105,分别计算第二近红外图像序列中的每个近红外图像相对于第二可见光图像序列中的可见光图像的运动幅度。
在本申请的一实施例中,提取基础可见光图像的Y通道图像,通过光流法计算近红外图像相对于基础可见光图像的Y通道图像的运动矢量,运动矢量可以是位移矢量。其中,光流法可以是Lucas–Kanade光流算法、KLT光流算法、Farneback光流算法、基于深度学习的光流算法等。
在本申请的一实施例中,在计算得到近红外图像相当于基础可见光图像的Y通道图像的运动矢量后,根据实例分割算法对近红外图像进行主体识别,确定近红外图像中的主体,根据预设尺寸的像素窗口获取主体及主体邻域的所有像素点的运动矢量,计算主体及主体邻域的所有像素点的运动矢量的均值,得到近红外图像相对于基础可见光图像的运动幅度。例如,预设尺寸可以为3*3、5*5或其他尺寸。
S106,根据运动幅度从第二近红外图像序列中筛选出多个近红外图像,生成第三近红外图像序列。
在本申请的一实施例中,根据多个近红外图像相对于第二可见光图像序列中的基础可见光图像的运动幅度对第二近红外图像序列中的多个近红外图像进行升序排序,例如,按照运动幅度从小到大的顺序对第二近红外图像序列中的多个近红外图像进行排序,并确定排在前第四预设数量的近红外图像为第三近红外图像序列。其中,第四预设数量小于第三预设数量,例如,第四预设数量可以是1、2或其他数值。
S107,对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行融合,得到目标图像。
参阅图8所示,为本申请实施例提供的图像融合流程的框架示意图。在筛选得到第二可见光图像序列和第三近红外图像序列后,对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行预处理和融合,得到目标图像,该目标图像为响应用户的拍摄操作生成的优化图像。其中,预处理包括配准、降噪、特征提取等。
在本申请的一实施例中,对第二可见光图像序列中的多个可见光图像进行融合,得到融合可见光图像,对第三近红外图像序列中的多个近红外图像进行融合,得到融合近红外图像,对融合可见光图像和融合近红外图像进行融合,得到目标图像。
通过本申请的上述实施例,在拍照过程中,通过可见光摄像头和近红外摄像头分别采集图像,从可见光摄像头和近红外摄像头采集的多个图像中筛选出差异较小的可见光图像和近红外图像,从而尽可能对差异较小的可见光图像和近红外图像进行融合,得到画质更佳的目标图像,避免图像出现鬼影缺陷,从而提高电子设备的出图质量。
参阅图9所示,为本申请一实施例提供的计算运动幅度的流程图。
S1051,提取基础可见光图像的Y通道图像。
在本申请的一实施例中,基础可见光图像为RGB图像,将基础可见光图像的色彩空间从RGB色彩空间转换为YUV色彩空间,从而将RGB图像转换为YUV图像,提取YUV图像中每个像素点的像素值的Y分量,将每个像素点的像素值替换为Y分量,得到YUV图像的Y通道图像,从而提取到基础可见光图像的Y通道图像。
S1052,采用光流法计算第二近红外图像序列中的近红外图像相对于基础可见光图像的Y通道图像的运动矢量。
在本申请的一实施例中,近红外图像相对于Y通道图像的运动矢量为近红外图像中每个像素点相对于Y通道图像中对应像素点的位移矢量。其中,光流法可以是Lucas–Kanade光流算法、KLT光流算法、Farneback光流算法、基于深度学习的光流算法等。通过光流法计算图像中像素点的位移矢量为现有技术,在此不作具体描述。
S1053,识别近红外图像中的主体。
在本申请的一实施例中,可以采用基于神经网络的实例分割模型识别近红外图像中的主体。将近红外图像输入基于神经网络的实例分割模型,实例分割模型提取近红外图像的特征,根据提取的特征对近红外图像进行目标检测,确定近红外图像中的多个目标区域,并从多个目标区域中确定近红外图像中的主体。
S1054,根据近红外图像相对于基础可见光图像的Y通道图像的运动矢量确定近红外图像中主体的运动幅度。
在本申请的一实施例中,采用预设尺寸的像素窗口搜索近红外图像中的主体及主体邻域的所有像素点的运动矢量,计算主体及主体邻域的所有像素点的运动矢量的均值,得到近红外图像中主体的运动幅度,并将主体的运动幅度确定为近红外图像相对于第二可见光图像序列中的可见光图像的运动幅度。
通过本申请的上述实施例,可以精确地计算出近红外图像相对于可见光图像的运动幅度,确定每个近红外图像与基础可见光图像之间的差异,便于筛选出与清晰度最高的基础可见光图像差异较小的近红外图像,从而提高最终融合得到的图像的画质。
参阅图10所示,为本申请一实施例提供的图像融合的流程图。
S1071,对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行配准。
在本申请的一实施例中,采用尺度不变特征转换(Scale-Invariant FeatureTransform,SIFT)算法对第二可见光图像序列中的多个可见光图像序列和第三近红外图像序列中的多个近红外图像进行配准。首先,进行尺度空间极值检测,对第二可见光图像序列中的多个可见光图像序列和第三近红外图像序列中的多个近红外图像中的每个图像采用高斯滤波器构建尺度空间金字塔,通过不同尺度下的高斯差分来检测关键点,以提取稳定的尺度不变特征。然后进行关键点定位,在每个尺度空间中,通过比较像素与其周围像素的梯度和曲率来筛选关键点,并利用图像局部极值点,进行精确定位和抑制边缘响应。接下来进行方向分配,为每个关键点分配主方向,使得描述子具有旋转不变性,并计算梯度方向直方图,选择主导方向或多个方向作为关键点的方向。然后进行描述子生成,利用关键点的尺度和方向信息,在关键点附近的邻域内构建描述子,描述子提取过程中,结合图像的局部梯度和梯度方向,生成一个多维(例如128维)的特征向量。然后进行特征匹配,对每两个图像的特征描述子进行匹配。例如基于欧氏距离或余弦相似度来度量特征向量之间的相似性,选择最佳匹配。最后进行配准,根据匹配到的特征点对,使用相应的配准算法(例如随机抽样一致算法RANSAC)来计算图像之间的变换矩阵,以实现图像的对齐和配准。
S1072,对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行降噪处理。
在本申请的一实施例中,采用基于拉普拉斯的金字塔算法对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行降噪。首先,通过对原始图像进行多次下采样和高斯滤波,生成不同尺度的图像,从高斯金字塔中的每个层级,通过上采样和差值操作,构建相应的拉普拉斯金字塔,其中,拉普拉斯金字塔包含图像各个尺度上的细节信息。采用均值滤波或其他滤波器对每个金字塔层级的像素值进行平滑处理,从而在拉普拉斯金字塔的每个层级上执行降噪。将经过降噪处理的拉普拉斯金字塔与高斯金字塔结合,通过逐层上采样和加权求和的方式重建出降噪后的图像。
S1073,对第二可见光图像序列中的多个可见光图像进行融合,得到融合可见光图像。
在本申请的一实施例中,采用图像融合算法对第二可见光图像序列中降噪处理后的多个可见光图像进行融合,得到融合可见光图像。例如,图像融合算法可以是拉普拉斯金字塔融合算法、小波变换融合算法、区域分割和加权平均融合算法、基于神经网络的图像融合算法等。
S1074,对第三可见光图像序列中的多个近红外图像进行融合,得到融合近红外图像。
在本申请的一实施例中,采用图像融合算法对第三可见光图像序列中降噪处理后的多个近红外图像进行融合,得到融合近红外图像。
S1075,对融合可见光图像和融合近红外图像进行融合,得到目标图像。
在本申请的一实施例中,采用图像融合算法对融合可见光图像和融合近红外图像进行融合,得到目标图像。
通过本申请的上述实施例,在图像融合之前进行配准和降噪的预处理,可以提升融合图像的质量。通过分别对可将光图像进行融合得到融合可见光图像,对近红外图像进行融合得到融合近红外图像,再对融合可见光图像和融合近红外图像进行融合得到最终的目标对象,可以提高图像融合效率。
在本申请的另一实施例中,可以提取第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像的关键特征,并根据关键特征进行图像融合,从而在融合得到的目标图像中突出关键特征,使得目标图像呈现出虚化效果。
在本申请的所述另一实施例中,对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行融合,得到目标图像包括:对降噪处理后的第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行特征提取。
在本申请的所述一实施例中,通过基于transformer(转换器)单元的孪生密集网络对降噪处理后的可见光图像和近红外图像进行特征提取。基于transformer单元的孪生密集网络结合了transformer模型的注意力机制和孪生网络,包括两个基于transformer单元的特征提取网络,可以处理不同的输入,即,可以同时提取两个图像的特征。基于transformer单元的孪生密集网络包括,但不限于:输入层、编码器块、分类网络及输出层,编码器块包括至少一个编码器,编码器包括注意力模块、归一化模块及多层感知机,注意力模块包括多头注意力模块和多个自注意力模块。输入层用于接收输入的原始图像(即第二可见光图像序列中的可见光图像和第三近红外图像序列中的近红外图像),并提取原始图像的多个特征向量,将多个特征向量发送至注意力模块,其中,多个特征向量包括所述原始图像的每个图像块的颜色特征向量和位置特征向量。通过每个自注意力模块权重矩阵WQ、WK、WV以及每个图像块的颜色特征向量和位置特征向量分别计算每个图像块对应的查询矩阵、键值矩阵及值矩阵,并根据激活函数、每个图像块的查询矩阵、键值矩阵及值矩阵计算每个图像块的特征矩阵,通过多头注意力模块根据每个图像块对应的特征矩阵计算得到原始图像的输出矩阵,通过归一化模块对原始图像的输出矩阵进行归一化处理,通过多层感知机对输出矩阵进行线性变换,得到原始图像的多个特征矩阵,将多个特征矩阵作为提取得到的原始图像的特征。
在本申请的所述另一实施例中,对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行融合,得到目标图像还包括:对降噪处理后的第二可见光图像序列中的多个可见光图像进行语义分割,得到每个可见光图像中的感兴趣语义的先验分布。在本申请的其他实施例中,也可以对电子设备图库中的多个可见光图像分别进行语义分割,确定电子设备用户的感兴趣语义,并将感兴趣语义作为先验分布,对第二可见光图像序列中的可见光图像和第三近红外图像序列中的近红外图像的特征进行排序。
在本申请的所述另一实施例中,通过基于深度学习的语义分割模型对可见光图像中的每个像素点进行分类。语义分割模型提取可见光图像的特征,对提取的特征进行上采样,输出可见光图像中每个像素点的类别和每个类别的像素点数量,作为感兴趣语义的先验分布。其中,语义分割模型可以是卷积神经网络模型、全卷积神经网络模型等。
在本申请的所述另一实施例中,对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行融合,得到目标图像还包括:根据感兴趣语义的先验分布对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像中的特征进行排序。
在本申请的所述另一实施例中,在感兴趣语义的先验分布的引导下,通过transformer模型对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像中的特征进行排序。根据可见光图像中每个像素点的类别确定第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像中的每个特征所属的类别,将每个特征的位置和类别输入transformer模型,通过transformer模型输出每个特征相对于其他特征的权重,得到每个特征对应的多个权重,并计算得到每个特征的权重和,根据权重和对多个特征进行排序,例如,按照权重和从大到小的顺序对多个特征进行排序。
在本申请的所述另一实施例中,对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行融合,得到目标图像还包括:根据第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像中的特征排序筛选出多个待融合特征,并对多个待融合特征进行特征融合,得到目标图像。
在本申请的所述另一实施例中,从第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像中的多个特征中筛选出排在前第五预设数量的特征,采用加权平均、特征串联、特征平均、特征拼接、多层融合等方式进行特征融合,得到目标图像。其中,第五预设数量可以为2、3或其他数值。
通过本申请的上述实施例,可以从待融合图像中筛选出关键特征,并通过对关键特征进行融合,从而实现图像融合,有效提高图像融合效率,优化图像融合效果。
在本申请的另一实施例中,所述方法还包括:在对第二可见光图像序列中的多个可见光图像和第三近红外图像序列中的多个近红外图像进行融合后,对融合图像进行风格化调整,得到目标图像。
在本申请的所述另一实施例中,风格化调整包括颜色风格化调整和亮度风格化调整。例如,通过预设的3DLUT曲线对融合图像进行空间插值运算,从而进行颜色风格化调整。例如,通过预设的色调映射曲线对颜色风格化调整后的图像进行动态范围扩展,得到高动态范围图像,从而进行亮度风格化调整。
在本申请的一实施例中,所述方法还包括:响应用户查看目标图像的操作,对目标图像进行绘制渲染和显示。在生成目标图像后,将目标图像存储至电子设备的图库,用户可以在图库应用程序中或在相机应用程序中点击目标图像的缩略图,输入查看目标图像的操作,图库应用程序响应用户查看目标图像的操作,下发绘制渲染请求至相机提供器,相机提供器将目标图像发送至相机服务,相机服务将目标图像发送绘制渲染服务,通过绘制渲染服务对目标图像进行绘制渲染和送显。
本申请实施例还提供一种电子设备100,参阅图11所示,所述电子设备100可以是手机、平板电脑、桌面型计算机、膝上型计算机、手持计算机、笔记本电脑、超级移动个人计算机(Ultra-mobile Personal Computer,UMPC)、上网本,以及蜂窝电话、个人数字助理(Personal Digital Assistant,PDA)、增强现实(Augmented Reality,AR)设备、虚拟现实(Virtual Reality,VR)设备、人工智能(Artificial Intelligence, AI)设备、可穿戴式设备、车载设备、智能家居设备和/或智慧城市设备,本申请实施例对电子设备100的具体类型不作特殊限制。
电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(Universal Serial Bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(Subscriber Identification Module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(Application Processor,AP),调制解调处理器,图形处理器(Graphics ProcessingUnit,GPU),图像信号处理器(Image Signal Processor,ISP),控制器,视频编解码器,数字信号处理器(Digital Signal Processor,DSP),基带处理器,和/或神经网络处理器(Neural-network Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在本申请的一实施例中,处理器110中的存储器为高速缓冲存储器。存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在本申请的一实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(Inter-integrated Circuit,I2C)接口,集成电路内置音频(Inter-integratedCircuit Sound,I2S)接口,脉冲编码调制(Pulse Code Modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(Mobile Industry Processor Interface,MIPI),通用输入输出(General-PurposeInput/Output,GPIO)接口,用户标识模块(Subscriber Identity Module,SIM)接口,和/或通用串行总线(Universal Serial Bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(Serial Data Line,SDA)和一根串行时钟线(Derail Clock Line,SCL)。在本申请的一实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在本申请的一实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在本申请的一实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在本申请的一实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在本申请的一实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在本申请的一实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在本申请的一实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(Camera Serial Interface,CSI),显示屏串行接口(DisplaySerial Interface,DSI)等。在本申请的一实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在本申请的一实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。接口还可以用于连接其他电子设备100,例如AR设备等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备100供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(Low Noise Amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在本申请的一实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在本申请的一实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在本申请的一实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(WirelessLocal Area Networks,WLAN)(如无线保真(Wireless Fidelity,Wi-Fi)网络),蓝牙(Bluetooth,BT),全球导航卫星系统(Global Navigation Satellite System,GNSS),调频(Frequency Modulation,FM),近距离无线通信技术(Near Field Communication,NFC),红外技术(Infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在本申请的一实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(Global System For MobileCommunications,GSM),通用分组无线服务(General Packet Radio Service,GPRS),码分多址接入(Code Division Multiple Access,CDMA),宽带码分多址(Wideband CodeDivision Multiple Access,WCDMA),时分码分多址(Time-Division Code DivisionMultiple Access,TD-SCDMA),长期演进(Long Term Evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(Global Positioning System,GPS),全球导航卫星系统(Global Navigation Satellite System,GLONASS),北斗卫星导航系统(Beidou Navigation Satellite System,BDS),准天顶卫星系统(Quasi-ZenithSatellite System,QZSS)和/或星基增强系统(Satellite Based Augmentation Systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(Liquid Crystal Display,LCD),有机发光二极管(Organic Light-EmittingDiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(Active-MatrixOrganic Light Emitting Diode的,AMOLED),柔性发光二极管(Flex Light-EmittingDiode,FLED),Miniled,Microled,Micro-OLED,量子点发光二极管(Quantum Dot LightEmitting Diodes,QLED)等。在本申请的一实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在本申请的一实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(Charge Coupled Device,CCD)或互补金属氧化物半导体(Complementary Metal-Oxide-Semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在本申请的一实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(Moving Picture Experts Group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(Neural-Network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
内部存储器121可以包括一个或多个随机存取存储器(Random Access Memory,RAM)和一个或多个非易失性存储器(Non-Volatile Memory,NVM)。
随机存取存储器可以包括静态随机存储器(Static Random-Access Memory,SRAM)、动态随机存储器(Dynamic Random Access Memory,DRAM)、同步动态随机存储器(Synchronous Dynamic Random Access Memory, SDRAM)、双倍资料率同步动态随机存取存储器(Double Data Rate Synchronous Dynamic Random Access Memory, DDR SDRAM,例如第五代DDR SDRAM一般称为DDR5 SDRAM)等;
非易失性存储器可以包括磁盘存储器件、快闪存储器(flash memory)。
快闪存储器按照运作原理划分可以包括NOR FLASH、NAND FLASH、3D NAND FLASH等,按照存储单元电位阶数划分可以包括单阶存储单元(Single-Level Cell, SLC)、多阶存储单元(Multi-Level Cell, MLC)、三阶储存单元(Triple-Level Cell, TLC)、四阶储存单元(Quad-Level Cell,QLC)等,按照存储规范划分可以包括通用闪存存储(UniversalFlash Storage,UFS)、嵌入式多媒体存储卡(embedded Multi Media Card,eMMC)等。
随机存取存储器可以由处理器110直接进行读写,可以用于存储操作系统或其他正在运行中的程序的可执行程序(例如机器指令),还可以用于存储用户及应用程序的数据等。
非易失性存储器也可以存储可执行程序和存储用户及应用程序的数据等,可以提前加载到随机存取存储器中,用于处理器110直接进行读写。
外部存储器接口120可以用于连接外部的非易失性存储器,实现扩展电子设备100的存储能力。外部的非易失性存储器通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部的非易失性存储器中。
内部存储器121或外部存储器接口120用于存储一个或多个计算机程序。一个或多个计算机程序被配置为被处理器110执行。一个或多个计算机程序包括多个指令,多个指令被处理器110执行时,可实现上述实施例中在电子设备100上执行的屏幕显示检测方法,以实现电子设备100的屏幕显示检测功能。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在本申请的一实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备100平台(Open Mobile Terminal Platform,OMTP)标准接口,美国蜂窝电信工业协会(Cellular Telecommunications Industry Association of theUSA,CTIA)标准接口。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在本申请的一实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。本申请实施例还提供一种计算机存储介质,计算机存储介质中存储有计算机指令,当计算机指令在电子设备100上运行时,使得电子设备100执行上述相关方法步骤实现上述实施例中的图像处理方法。
本申请实施例还提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的图像处理方法。
另外,本申请的实施例还提供一种装置,这个装置具体可以是芯片,组件或模块,装置可包括相连的处理器和存储器;其中,存储器用于存储计算机执行指令,当装置运行时,处理器可执行存储器存储的计算机执行指令,以使芯片执行上述各方法实施例中的图像处理方法。
其中,本实施例提供的电子设备、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者技术方案的全部或部分可以以软件产品的形式体现出来,软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。
Claims (19)
1.一种图像处理方法,应用于电子设备,其特征在于,所述方法包括:
响应用户开启相机应用程序的操作,控制所述电子设备的可见光摄像头采集多个可见光图像及控制所述电子设备的近红外摄像头采集多个近红外图像;
响应用户的拍摄操作,从所述多个可见光图像中获取第一可见光图像序列,及从所述多个近红外图像中获取第一近红外图像序列;
根据图像清晰度从所述第一可见光图像序列中筛选出多个可见光图像,生成第二可见光图像序列;
根据所述第二可见光图像序列从所述第一近红外图像序列中筛选出多个近红外图像,生成第二近红外图像序列;
分别计算所述第二近红外图像序列中的每个近红外图像相对于所述第二可见光图像序列中的可见光图像的运动幅度;
根据所述运动幅度从所述第二近红外图像序列中筛选出多个近红外图像,生成第三近红外图像序列;
对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行融合,得到目标图像。
2.如权利要求1所述的图像处理方法,其特征在于,所述响应用户开启相机应用程序的操作,控制所述电子设备的可见光摄像头采集多个可见光图像及控制所述电子设备的近红外摄像头采集多个近红外图像,包括:
响应用户开启相机应用程序的操作,判断环境光亮度指数是否大于或等于环境光亮度指数阈值;
若所述环境光亮度指数大于或等于所述环境光亮度指数阈值,控制所述可见光摄像头采集所述多个可见光图像及控制所述近红外摄像头采集所述多个近红外图像。
3.如权利要求1所述的图像处理方法,其特征在于,所述从所述多个可见光图像中获取第一可见光图像序列,包括:
获取所述可见光摄像头响应所述拍摄操作得到的第一可见光图像,获取拍摄所述第一可见光图像之前第一预设数量的第二可见光图像及拍摄所述第一可见光图像之后第一预设数量的第三可见光图像;
基于所述第一可见光图像、所述第一预设数量的第二可见光图像及所述第一预设数量的第三可见光图像,生成所述第一可见光图像序列。
4.如权利要求1所述的图像处理方法,其特征在于,所述从所述多个近红外图像中获取第一近红外图像序列,包括:
获取所述近红外摄像头响应所述拍摄操作得到的第一近红外图像,从所述多个近红外图像中获取拍摄第一近红外图像之前第一预设数量的第二近红外图像及拍摄所述第一近红外图像之后第一预设数量的第三近红外图像;
基于所述第一近红外图像、所述第一预设数量的第二近红外图像及所述第一预设数量的第三近红外图像,生成所述第一近红外图像序列。
5.如权利要求3或4所述的图像处理方法,其特征在于,所述第二可见光图像、所述第三可见光图像、所述第二近红外图像、所述第三近红外图像的快门延时小于或等于快门延时阈值。
6.如权利要求1所述的图像处理方法,其特征在于,所述根据图像清晰度从所述第一可见光图像序列中筛选出多个可见光图像,生成第二可见光图像序列,包括:
计算所述第一可见光图像序列中每个可见光图像的清晰度因子,将最大的清晰度因子对应的可见光图像确定为基础可见光图像,将所述基础可见光图像和所述基础可见光图像之前第二预设数量的可见光图像确定为所述第二可见光序列。
7.如权利要求6所述的图像处理方法,其特征在于,所述根据所述第二可见光图像序列从所述第一近红外图像序列中筛选出多个近红外图像,生成第二近红外图像序列,包括:
确定所述基础可见光图像的拍摄时间戳;
从所述第一近红外图像序列中选择具有相同的拍摄时间戳的第四近红外图像;
将所述第二可见光图像序列中所述第四近红外图像、所述第四近红外图像之前第三预设数量的近红外图像以及所述第四近红外图像之后第三预设数量的近红外图像作为所述第二近红外图像序列。
8.如权利要求7所述的图像处理方法,其特征在于,所述分别计算所述第二近红外图像序列中的每个近红外图像相对于所述第二可见光图像序列中的可见光图像的运动幅度,包括:
提取所述基础可见光图像的Y通道图像;
采用光流法分别计算所述第二近红外图像序列中的每个近红外图像相对于所述Y通道图像的运动矢量;
根据所述运动矢量计算所述第二近红外图像序列中的每个近红外图像相对于所述Y通道图像的运动幅度。
9.如权利要求8所述的图像处理方法,其特征在于,所述根据所述运动矢量计算所述第二近红外图像序列中的每个近红外图像相对于所述Y通道图像的运动幅度,包括:
识别所述近红外图像中的主体;
采用预设尺寸的像素窗口搜索所述近红外图像中的主体及主体邻域的所有像素点的运动矢量;
计算所述主体及所述主体邻域的所有像素点的运动矢量的均值,得到所述近红外图像中所述主体的运动幅度,并将所述主体的运动幅度确定为所述近红外图像相对于所述Y通道图像的运动幅度。
10.如权利要求1所述的图像处理方法,其特征在于,所述根据所述运动幅度从所述第二近红外图像序列中筛选出多个近红外图像,生成第三近红外图像序列,包括:
根据所述运动幅度,对所述第二近红外图像序列中的多个近红外图像进行升序排序;
选择排序在前第四预设数量的近红外图像作为所述第三近红外图像序列。
11.如权利要求1所述的图像处理方法,其特征在于,所述对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行融合,得到目标图像,包括:
对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行预处理;
对所述第二可见光图像序列中的多个可见光图像进行融合,得到融合可见光图像;
对所述第三近红外图像序列中的多个近红外图像进行融合,得到融合近红外图像;
对所述融合可见光图像和所述融合近红外图像进行融合,得到所述目标图像。
12.如权利要求11所述的图像处理方法,其特征在于,所述对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行预处理,包括:
对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行配准;
对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行降噪处理。
13.如权利要求12所述的图像处理方法,其特征在于,所述对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行融合,得到目标图像,包括:
对降噪处理后的所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行特征提取;
对降噪处理后的所述第二可见光图像序列中的多个可见光图像进行语义分割,得到每个可见光图像中的感兴趣语义的先验分布;
根据所述感兴趣语义的先验分布对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像中的特征进行排序;
根据所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像中的特征排序筛选出多个待融合特征,并对所述多个待融合特征进行特征融合,得到所述目标图像。
14.如权利要求1所述的图像处理方法,其特征在于,所述方法还包括:
在对所述第二可见光图像序列中的多个可见光图像和所述第三近红外图像序列中的多个近红外图像进行融合后,对融合图像进行风格化调整,得到所述目标图像。
15.如权利要求14所述的图像处理方法,其特征在于,所述对融合图像进行风格化调整,包括:
对所述融合图像进行颜色风格化调整和亮度风格化调整,得到所述目标图像。
16.如权利要求1所述的图像处理方法,其特征在于,所述方法还包括:
响应用户查看目标图像的操作,对所述目标图像进行绘制渲染和显示。
17.一种电子设备,其特征在于,所述电子设备包括存储器和处理器:
其中,所述存储器,用于存储程序指令;
所述处理器,用于读取并执行所述存储器中存储的所述程序指令,当所述程序指令被所述处理器执行时,使得所述电子设备执行如权利要求1至16中任一项所述的图像处理方法。
18.一种芯片,与电子设备中的存储器耦合,其特征在于,所述芯片用于控制所述电子设备执行如权利要求1至16中任一项所述的图像处理方法。
19.一种计算机存储介质,其特征在于,所述计算机存储介质存储有程序指令,当所述程序指令在电子设备上运行时,使得所述电子设备的处理器执行如权利要求1至16中任一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311851564.1A CN117499797B (zh) | 2023-12-29 | 2023-12-29 | 图像处理方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311851564.1A CN117499797B (zh) | 2023-12-29 | 2023-12-29 | 图像处理方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117499797A true CN117499797A (zh) | 2024-02-02 |
CN117499797B CN117499797B (zh) | 2024-05-14 |
Family
ID=89676901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311851564.1A Active CN117499797B (zh) | 2023-12-29 | 2023-12-29 | 图像处理方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117499797B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110047059A (zh) * | 2019-04-10 | 2019-07-23 | 北京旷视科技有限公司 | 图像处理方法、装置、电子设备及可读存储介质 |
CN112613568A (zh) * | 2020-12-29 | 2021-04-06 | 清华大学 | 基于可见光及红外多光谱图像序列的目标识别方法和装置 |
KR20210094482A (ko) * | 2020-01-20 | 2021-07-29 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 근적외선 이미지 생성 방법, 생성 네트워크의 트레이닝 방법 및 장치 |
CN115604572A (zh) * | 2022-09-02 | 2023-01-13 | 荣耀终端有限公司(Cn) | 图像的获取方法及装置 |
WO2023056795A1 (zh) * | 2021-10-09 | 2023-04-13 | 华为技术有限公司 | 快速拍照方法、电子设备及计算机可读存储介质 |
CN116437198A (zh) * | 2021-12-29 | 2023-07-14 | 荣耀终端有限公司 | 图像处理方法与电子设备 |
-
2023
- 2023-12-29 CN CN202311851564.1A patent/CN117499797B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110047059A (zh) * | 2019-04-10 | 2019-07-23 | 北京旷视科技有限公司 | 图像处理方法、装置、电子设备及可读存储介质 |
KR20210094482A (ko) * | 2020-01-20 | 2021-07-29 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 근적외선 이미지 생성 방법, 생성 네트워크의 트레이닝 방법 및 장치 |
CN112613568A (zh) * | 2020-12-29 | 2021-04-06 | 清华大学 | 基于可见光及红外多光谱图像序列的目标识别方法和装置 |
WO2023056795A1 (zh) * | 2021-10-09 | 2023-04-13 | 华为技术有限公司 | 快速拍照方法、电子设备及计算机可读存储介质 |
CN116437198A (zh) * | 2021-12-29 | 2023-07-14 | 荣耀终端有限公司 | 图像处理方法与电子设备 |
CN115604572A (zh) * | 2022-09-02 | 2023-01-13 | 荣耀终端有限公司(Cn) | 图像的获取方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117499797B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021078001A1 (zh) | 一种图像增强方法及装置 | |
CN114650363B (zh) | 一种图像显示的方法及电子设备 | |
CN113542580B (zh) | 去除眼镜光斑的方法、装置及电子设备 | |
CN114140365B (zh) | 基于事件帧的特征点匹配方法及电子设备 | |
CN114866860B (zh) | 一种播放视频的方法及电子设备 | |
CN117078509B (zh) | 模型训练方法、照片生成方法及相关设备 | |
CN113452969A (zh) | 图像处理方法和装置 | |
CN115115679A (zh) | 一种图像配准方法及相关设备 | |
CN115686182B (zh) | 增强现实视频的处理方法与电子设备 | |
CN117499797B (zh) | 图像处理方法及相关设备 | |
CN114945019B (zh) | 数据传输方法、装置及存储介质 | |
CN114527903A (zh) | 一种按键映射方法、电子设备及系统 | |
CN113518172A (zh) | 图像处理方法和装置 | |
CN116193275B (zh) | 视频处理方法及相关设备 | |
CN114942741B (zh) | 数据传输方法及电子设备 | |
CN117131213B (zh) | 图像处理方法及相关设备 | |
CN116993619B (zh) | 图像处理方法及相关设备 | |
CN115437601B (zh) | 图像排序方法、电子设备、程序产品及介质 | |
CN117635466B (zh) | 图像增强方法、装置、电子设备及可读存储介质 | |
CN115802144B (zh) | 视频拍摄方法及相关设备 | |
CN117274109B (zh) | 图像处理方法、降噪模型训练方法及电子设备 | |
CN117764853B (zh) | 人脸图像增强方法和电子设备 | |
CN114363482B (zh) | 一种标定图像的确定方法及电子设备 | |
CN116703741B (zh) | 一种图像对比度的生成方法、装置和电子设备 | |
CN116095512B (zh) | 终端设备的拍照方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |