CN115880198B - 图像处理方法和装置 - Google Patents

图像处理方法和装置 Download PDF

Info

Publication number
CN115880198B
CN115880198B CN202310048898.9A CN202310048898A CN115880198B CN 115880198 B CN115880198 B CN 115880198B CN 202310048898 A CN202310048898 A CN 202310048898A CN 115880198 B CN115880198 B CN 115880198B
Authority
CN
China
Prior art keywords
image
sample
images
magnification
reference image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310048898.9A
Other languages
English (en)
Other versions
CN115880198A (zh
Inventor
应国豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202310048898.9A priority Critical patent/CN115880198B/zh
Publication of CN115880198A publication Critical patent/CN115880198A/zh
Application granted granted Critical
Publication of CN115880198B publication Critical patent/CN115880198B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

本申请提供了一种图像处理方法和装置,不仅能够按照任意放大倍率放大图像,提升图像处理的灵活性,还能够提高图像的清晰度,从而提升用户体验。该方法包括:获取多张待处理图像,多张待处理图像中放大倍率最高的QUAD图像为参考图像;基于参考图像,对多张待处理图像中除参考图像之外的剩余图像进行处理,得到至少一个第一图像;基于至少一个第一图像和参考图像,确定至少一个第一图像中每个第一图像的锐化卷积核;基于目标放大倍率对参考图像进行处理,得到第二图像;基于至少一个第一图像中每个第一图像的锐化卷积核和第二图像,得到至少一个第三图像;对第二图像和至少一个第三图像进行图像融合,得到目标图像。

Description

图像处理方法和装置
技术领域
本申请涉及终端技术领域,尤其涉及一种图像处理方法和装置。
背景技术
用户通过终端设备拍摄图像时可以选择不同的放大倍率进行拍摄,用户选择的放大倍率越大,终端设备拍摄的图像的视场角(field of view,FOV)越小。然而,终端设备的镜头的放大倍率通常难以满足用户需求。因此,在终端设备拍摄图像后,终端设备可以对拍摄图像进行超分辨率处理。通过超分辨处理后的图像对应的放大倍率大于终端设备的镜头的放大倍率。目前常用的超分辨率处理方法包括插值方法和神经网络超分辨率方法。
插值方法基于相邻像素填充图像相邻像素之间的空隙,通过插值方法,能够得到任意放大倍率的图像。神经网络超分辨率方法对图像进行超分辨率处理的过程如下:首先,终端设备采用最大焦段的镜头拍摄多张FOV相同的图像;然后将该多张FOV相同的图像输入至神经网络;神经网络对该多张FOV相同的图像进行处理,输出一张分辨率更高、放大倍率更大的图像。
然而,图像在经过插值方法处理时,随着放大倍率的提高,处理后的图像的清晰度会变差;图像通过神经网络超分辨率方法处理后的放大倍率通常为固定比例,使得图像处理的灵活性较差。
发明内容
本申请提供一种图像处理方法和装置,不仅能够按照任意放大倍率放大图像,提升图像处理的灵活性,还能够提高图像的清晰度,从而提升用户体验。
第一方面,提供了一种图像处理方法,该方法包括:获取多张待处理图像,所述多张待处理图像中放大倍率最高的QUAD图像为参考图像;基于所述参考图像,对所述多张待处理图像中除所述参考图像之外的剩余图像进行处理,得到至少一个第一图像,所述至少一个第一图像的放大倍率与所述参考图像的放大倍率相同,所述至少一个第一图像的视场角FOV与所述参考图像的FOV相同;基于所述至少一个第一图像和所述参考图像,确定所述至少一个第一图像中每个第一图像的锐化卷积核;基于目标放大倍率对所述参考图像进行处理,得到第二图像;基于所述至少一个第一图像中每个第一图像的锐化卷积核和所述第二图像,得到至少一个第三图像;对所述第二图像和所述至少一个第三图像进行图像融合,得到目标图像。
本申请提供的图像处理方法,以多张待处理图像中放大倍率最大、分辨率最高的图像作为参考图像,将多张待处理图像中除参考图像之外的其余图像中的每个图像进行处理,得到与参考图像放大倍率和FOV均相同的至少一个处理后的剩余图像;然后分别根据至少一个处理后的剩余图像中的每个图像和参考图像确定至少一个锐化卷积核;将参考图像进行处理,以得到放大倍率为目标放大倍率的处理后的参考图像;基于至少一个锐化卷积核中的每个锐化卷积核,对处理后的参考图像进行处理,得到至少一个处理后的锐化图像;通过将至少一个处理后的锐化图像和处理后的参考图像进行图像融合,能够得到清晰度较高、放大倍率为目标放大倍率的目标图像。目标放大倍率可以为任意放大倍率,将至少一个处理后的锐化图像和任意放大倍率的参考图像进行图像融合,能够提高任意放大倍率的参考图像的清晰度,这样,使得本申请的图像处理方法不仅能够按照任意放大倍率放大图像,提升图像处理的灵活性,还能够提高图像的清晰度,从而提升用户体验。
应理解,多张待处理图像均包含有相同的目标物,该目标物可以为用户想要拍摄的任意人或物。例如,多张待处理图像中均包含同一个纽扣。多张待理处理图像的数量可以为大于2的任意正整数,例如4、6等。至少一个第一图像中的每个第一图像的清晰度均低于参考图像。这样,基于至少一个第一图像中每个第一图像的清晰度和参考图像的清晰度,可以确定至少一个第一图像中每个第一图像的锐化卷积核。
在第一方面的某些实现方式中,所述基于所述参考图像,对所述多张待处理图像中除所述参考图像之外的剩余图像进行处理,得到至少一个第一图像,包括:按照所述参考图像的放大倍率,对所述剩余图像中的每张图像进行上采样处理,得到至少一个上采样图像,所述至少一个上采样图像中的每个图像的放大倍率与所述参考图像的放大倍率相同;对所述至少一个上采样图像中的每个图像分别和所述参考图像进行配准处理,得到至少一个配准后的上采样图像;基于所述参考图像的FOV,对所述至少一个配准后的上采样图像中的每个图像进行图像剪裁,得到所述至少一个第一图像。
应理解,剩余图像中每张图像的放大倍率小于参考图像的放大倍率,通过对剩余图像中的每张图像进行上采样处理,能够得到放大倍率与参考图像的放大倍率相同的至少一个上采样图像。至少一个上采用图像包括的上采样图像的数量与剩余图像的数量是相同的。至少一个上采样图像中的每个上采样图像的FOV均大于参考图像的FOV。通过将至少一个上采样图像中的每个上采样图像与参考图像进行配准处理,能够将参考图像中包括的内容映射于至少一个上采样图像中的每个上采样图像上,得到至少一个配准后的上采样图像。通过对至少一个配准后的上采样图像中每个配准后的上采样图像中相比于参考图像多余的内容进行剪裁处理,能够得到与参考图像FOV相同的至少一个第一图像。
在第一方面的某些实现方式中,所述基于目标放大倍率对所述参考图像进行处理,得到第二图像,包括:按照所述目标放大倍率,对所述参考图像进行上采样处理,得到所述第二图像。
应理解,第二图像为上采样处理后的参考图像。通过上采样处理可以将参考图像的放大倍率放大至任意倍率,这样,能够得到任意倍率的目标图像。
在第一方面的某些实现方式中,所述基于所述至少一个第一图像中每个第一图像的锐化卷积核和所述第二图像,得到至少一个第三图像,包括:基于所述至少一个第一图像中每个第一图像的锐化卷积核,对所述第二图像进行锐化处理,得到所述至少一个第三图像。
应理解,第二图像是参考图像经过处理后得到的放大倍率为目标放大倍率的图像,第二图像的清晰度较低,通过对第二图像进行锐化处理能够提高第二图像的清晰度。至少一个第一图像中每个第一图像的清晰度均低于参考图像,并且至少一个第一图像中每个第一图像的FOV和参考图像的FOV相同。通过基于至少一个第一图像中每个第一图像的锐化卷积核,对第二图像进行锐化处理,得到的至少一个第三图像中存在清晰度高于第二图像的第三图像,这样,通过将至少一个第三图像和第二图像进行图像融合,能够提高第二图像的清晰度。
在第一方面的某些实现方式中,所述将所述第二图像和所述至少一个第三图像进行图像融合,得到目标图像,包括:将所述第二图像和所述至少一个第三图像输入至训练好的卷积神经网络模型,得到所述目标图像。
应理解,训练好的卷积神经网络模型能够提取至少一个第三图像中每个第三图像的特征信息,并将特征信息中的有利信息叠加于第二图像,这样,能够提高第二图像的清晰度。
在第一方面的某些实现方式中,在所述将所述第二图像和所述至少一个第三图像输入至训练好的卷积神经网络模型之前,所述方法还包括:获取多张样本图像和标准图像,所述多张样本图像中放大倍率最高的QUAD图像为样本参考图像,所述标准图像与所述样本参考图像的FOV相同,所述标准图像的放大倍率高于所述样本参考图像的放大倍率;基于所述样本参考图像,对所述多张样本图像中除所述样本参考图像之外的剩余样本图像进行处理,得到至少一个第一样本图像,所述至少一个第一样本图像的放大倍率与所述样本参考图像的放大倍率相同,所述至少一个第一样本图像的FOV与所述样本参考图像的FOV相同;基于所述至少一个第一样本图像和所述样本参考图像,确定所述至少一个第一样本图像中每个第一样本图像的锐化卷积核;基于目标放大倍率对所述样本参考图像进行处理,得到第二样本图像,所述第二样本图像的放大倍率与所述标准图像的放大倍率相同;基于所述至少一个第一样本图像中每个第一样本图像的锐化卷积核和所述第二样本图像,得到至少一个第三样本图像;将所述第二样本图像和至少一个第三样本图像输入卷积神经网络模型,输出目标样本图像;基于所述标准图像和所述目标样本图像,确定所述卷积神经网络模型的误差;基于所述误差训练所述卷积神经网络模型,得到所述训练好的卷积神经网络模型。
应理解,多张样本图像的图像数量大于等于2,并且多张样本图像中包括相同的图像内容,例如,该多张样本图像可以为终端设备的镜头对准同一个纽扣拍摄得到的。标准图像为与样本图像包括相同内容的图像。
在第一方面的某些实现方式中,所述方法应用于设有至少一个镜头的终端设备,所述至少一个镜头中每个镜头的焦段不同;所述获取多张待处理图像,包括:通过所述至少一个镜头,获取所述多张待处理图像。
应理解,终端设备可以设置一个或者多个镜头,在终端设备设置的镜头的数量为多个时,该多个镜头中每个镜头的焦段不同。镜头的焦段越大,拍摄的得到的图像的放大倍率越大。每个镜头拍摄至少两张图像,该两张图像的分辨率可以不同。
第二方面,提供了一种图像处理装置,用于执行上述第一方面中任一种可能的实现方式中的方法。具体地,该装置包括用于执行上述第一方面中任一种可能的实现方式中的方法的模块。
第三方面,本申请提供了又一种图像处理装置,包括处理器,该处理器与存储器耦合,可用于执行存储器中的指令,以实现上述第一方面中任一种可能实现方式中的方法。可选地,该装置还包括存储器。可选地,该装置还包括通信接口,处理器与通信接口耦合。
在一种实现方式中,该装置为终端设备。当该装置为终端设备时,上述通信接口可以是收发器,或,输入/输出接口。
在另一种实现方式中,该装置为配置于终端设备中的芯片。当该装置为配置于终端设备中的芯片时,上述通信接口可以是输入/输出接口。
第四方面,提供了一种处理器,包括:输入电路、输出电路和处理电路。所述处理电路用于通过所述输入电路接收信号,并通过所述输出电路发射信号,使得所述处理器执行上述第一方面中任一种可能实现方式中的方法。
在具体实现流程中,上述处理器可以为芯片,输入电路可以为输入管脚,输出电路可以为输出管脚,处理电路可以为晶体管、门电路、触发器和各种逻辑电路等。输入电路所接收的输入的信号可以是由例如但不限于接收器接收并输入的,输出电路所输出的信号可以是例如但不限于输出给发射器并由发射器发射的,且输入电路和输出电路可以是同一电路,该电路在不同的时刻分别用作输入电路和输出电路。本申请实施例对处理器及各种电路的具体实现方式不做限定。
第五方面,提供了一种处理装置,包括处理器和存储器。该处理器用于读取存储器中存储的指令,并可通过接收器接收信号,通过发射器发射信号,以执行上述第一方面中任一种可能实现方式中的方法。
可选地,所述处理器为一个或多个,所述存储器为一个或多个。
可选地,所述存储器可以与所述处理器集成在一起,或者所述存储器与处理器分离设置。
在具体实现流程中,存储器可以为非瞬时性(non-transitory)存储器,例如只读存储器(read only memory,ROM),其可以与处理器集成在同一块芯片上,也可以分别设置在不同的芯片上,本申请对存储器的类型以及存储器与处理器的设置方式不做限定。
应理解,相关的数据交互流程例如发送指示信息可以为从处理器输出指示信息的流程,接收能力信息可以为处理器接收输入能力信息的流程。具体地,处理输出的数据可以输出给发射器,处理器接收的输入数据可以来自接收器。其中,发射器和接收器可以统称为收发器。
上述第五方面中的处理装置可以是一个芯片,该处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于该处理器之外,独立存在。
第六方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序(也可以称为代码,或指令),当所述计算机程序被运行时,使得计算机执行上述第一方面中任一种可能实现方式中的方法。
第七方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序(也可以称为代码,或指令)当其在计算机上运行时,使得计算机执行上述第一方面中任一种可能实现方式中的方法。
附图说明
图1为本申请实施例提供的终端设备的结构示意图;
图2为本申请实施例的终端设备的软件结构框图;
图3为本申请实施例提供的图像处理方法的流程示意图;
图4为本申请实施例提供的一种参考图像和剩余图像的示意图;
图5为本申请实施例提供的不同目标放大倍率对应的目标图像的示意图;
图6为本申请实施例提供的一种通过卷积神经网络模型进行图像融合的过程示意图;
图7为本申请实施例提供的又一种通过卷积神经网络模型进行图像融合的过程示意图;
图8为本申请实施例提供的又一种图像处理方法的流程示意图;
图9为本申请实施例提供的一种图像处理装置的结构示意图;
图10为本申请实施例提供的又一种图像处理装置的结构示意图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。
在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一数值和第二数值仅仅是为了区分不同的数值,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本申请实施例中,“示例性地”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性地”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性地”或者“例如”等词旨在以具体方式呈现相关概念。
本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a--c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
本申请实施例中的终端设备也可以称为:用户设备(user equipment,UE)、移动台(mobile station,MS)、移动终端(mobile terminal,MT)、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置等。
终端设备可以是一种向用户提供语音/数据连通性的设备,例如,具有无线连接功能的手持式设备、车载设备等。目前,一些终端设备的举例包括:手机(mobile phone)、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internetdevice,MID)、可穿戴设备,虚拟现实(virtual reality,VR)设备、增强现实(augmentedreality,AR)设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smartgrid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端、蜂窝电话、无绳电话、会话启动协议(sessioninitiationprotocol,SIP)电话、无线本地环路(wireless local loop,WLL)站、个人数字助理(personal digital assistant,PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、可穿戴设备,5G网络中的终端设备或者未来演进的公用陆地移动通信网络(public land mobile network,PLMN)中的终端设备等,本申请对此并不限定。
作为示例而非限定,在本申请中,终端设备可以是物联网(internet of things,IoT)系统中的终端设备。物联网是未来信息技术发展的重要组成部分,其主要技术特点是将物品通过通信技术与网络连接,从而实现人机互连,物物互连的智能化网络。示例性地,本申请实施例中的终端设备可以是可穿戴设备。可穿戴设备也可以称为穿戴式智能设备,是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称,如眼镜、手套、手表、服饰及鞋等。可穿戴设备是可以直接穿在身上,或是整合到用户的衣服或配件的一种便携式设备。可穿戴设备不仅仅是一种硬件设备,更可以通过软件支持以及数据交互、云端交互来实现强大的功能。广义穿戴式智能设备包括功能全、尺寸大、可不依赖智能手机实现完整或者部分的功能,例如:智能手表或智能眼镜等,以及只专注于某一类应用功能,需要和其它设备如智能手机配合使用,如各类进行体征监测的智能手环、智能首饰等。
作为示例而非限定,在本申请实施例中,终端设备还可以是机器类型通信(machine type communication,MTC)中的终端设备。此外,终端设备还可以是作为一个或多个部件或者单元而内置于车辆的车载模块、车载模组、车载部件、车载芯片或者车载单元等,车辆通过内置的所述车载模块、车载模组、车载部件、车载芯片或者车载单元等可以实施本申请提供的方法。因此,本申请实施例也可以应用于车联网,例如车辆外联(vehicleto everything,V2X)、车间通信长期演进技术(longterm evolution-vehicle,LTE-V)、车到车(vehicle-to-vehicle,V2V)技术等。
为了更好的理解本申请实施例中的终端设备,下面结合图1对本申请实施例的终端设备的硬件结构进行详细说明。
图1为本申请实施例提供的终端设备100的结构示意图。如图1所示,终端设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universalserial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对终端设备100的具体限定。在本申请另一些实施例中,终端设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signalprocessor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-networkprocessing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integratedcircuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industryprocessor interface,MIPI),通用输入输出(general-purpose input/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serialbus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现终端设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现终端设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现终端设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为终端设备100充电,也可以用于终端设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他终端设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对终端设备100的结构限定。在本申请另一些实施例中,终端设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过终端设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为终端设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
终端设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。终端设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在终端设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在终端设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigationsatellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,终端设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得终端设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivisionmultiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC ,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system ,GPS),全球导航卫星系统(globalnavigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite basedaugmentation systems,SBAS)。
终端设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emittingdiode,AMOLED),柔性发光二极管(flex light-emitting diode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantumdot light emittingdiodes,QLED)等。在一些实施例中,终端设备100可以包括1个或N个显示屏194,N为大于1的正整数。
终端设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP 用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementarymetal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的红绿蓝(red-green-blue,RGB),明亮度-色度-浓度(luminance-chrominance-chroma,YUV)等格式的图像信号。在一些实施例中,终端设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当终端设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。终端设备100可以支持一种或多种视频编解码器。这样,终端设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network ,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现终端设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储终端设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行终端设备100的各种功能应用以及数据处理。
终端设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。终端设备100可以设置至少一个麦克风170C。在另一些实施例中,终端设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,终端设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动终端设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industryassociation of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。终端设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,终端设备100根据压力传感器180A检测所述触摸操作强度。终端设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定终端设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定终端设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性地,当按下快门,陀螺仪传感器180B检测终端设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消终端设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,终端设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。终端设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当终端设备100是翻盖机时,终端设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测终端设备100在各个方向上(一般为三轴)加速度的大小。当终端设备100静止时可检测出重力的大小及方向。还可以用于识别终端设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。终端设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,终端设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。终端设备100通过发光二极管向外发射红外光。终端设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定终端设备100附近有物体。当检测到不充分的反射光时,终端设备100可以确定终端设备100附近没有物体。终端设备100可以利用接近光传感器180G检测用户手持终端设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。终端设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测终端设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。终端设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,终端设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,终端设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,终端设备100对电池142加热,以避免低温导致终端设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,终端设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于终端设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。终端设备100可以接收按键输入,产生与终端设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。马达191具体还可以为驱动马达,用于在终端设备100拍摄视频时,根据终端设备100的防抖参数,例如驱动马达于X轴和Y轴方向的补偿零漂,控制终端设备100的镜头的位置和角度,从而使得终端设备100拍摄的视频的抖动较小。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和终端设备100的接触和分离。终端设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。终端设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,终端设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在终端设备100中,不能和终端设备100分离。终端设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明终端设备100的软件结构。
图2为本申请实施例的终端设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供终端设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,终端设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如: MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图、图像渲染、合成和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层用于驱动硬件,使得硬件工作。内核层至少包含显示驱动,屏幕驱动、图像处理器(graphics processing unit,GPU)驱动、摄像头、以及传感器驱动等,本申请实施例对此不做限制。例如,屏幕驱动可以驱动屏幕亮屏或息屏。
为了满足不同的需求,用户在采用终端设备拍摄图像时,可以对终端设备进行参数设置。例如,用户可以选择不同的放大倍率拍摄图像,在不同的放大倍率下,拍摄的图像FOV不同。放大倍率是用于标记拍摄时底片上的成像长度的数值。示例性地,假设终端设备为手机,用户通过手机的相机应用软件拍摄图像,在终端设备的显示界面为相机打开后对应的界面时,用户可以在该界面中选择不同的放大倍率。在用户选择“1x”时,对应的放大倍率为1倍,此时被拍摄的物体能够被终端设备的图像感应器以实际大小拍摄下来。在用户选择“0.5x”时,对应的放大倍率为0.5倍,此时被拍摄的物体能够被终端设备的图像感应器以实际大小的0.5倍拍摄下来。
由此可见,终端设备在不同的放大倍率下拍摄的图像的FOV不同。在终端设备拍摄图像时,放大倍率越大,拍摄的图像的FOV越小,图像中显示的物体的尺寸越大;放大倍率越小,拍摄的图像的FOV越大,图像中显示的物体的尺寸越小。
终端设备的镜头的最大放大倍率通常是确定的,这样使得终端设备拍摄的图像的放大倍率受到限制,难以满足用户需求。因此,目前通常通过插值方法和神经网络超分辨率方法对终端设备拍摄的图像进行超分辨率处理,这样,使得处理后的图像的放大倍率能够按照一定比例放大。
然而,图像在经过插值方法处理时,在放大倍率较大的情况下,得到的处理后的图像的清晰度会变差,使得用户体验感较差;图像通过神经网络超分辨率方法处理后的放大倍率通常为2的倍数,使得图像处理的灵活性较差。
为了解决上述技术问题,本申请提供一种图像处理方法,以终端设备拍摄的多张图像中放大倍率和分辨率最高的图像作为参考图像,首先对多张图像中除参考图像外的其余图像进行处理,得到与参考图像放大倍率和FOV相同的其余图像,并确定与参考图像放大倍率和FOV相同的其余图像中每个图像的清晰度达到参考图像清晰度时所需要的至少一个锐化卷积核;对参考图像进行处理,得到目标放大倍率的参考图像;然后通过至少一个锐化卷积核分别对目标放大倍率的参考图像进行锐化处理,得到至少一张图像;通过将至少一张图像和目标放大倍率的参考图像进行图像融合,得到目标图像。其中,目标放大倍率可以为用户设置的任意放大倍率,这样,通过对参考图像进行处理,能够得到任意放大倍率的参考图像;再通过将任意放大倍率的参考图像和锐化处理后的至少一张图像进行图像融合,能够增强任意放大倍率的参考图像的清晰度。这样,通过图像处理方法能够得到任意放大倍率,且清晰度高的目标图像,能够提高图像处理的灵活性,提高用户体验感。
图像处理方法可以应用于以下两个应用场景。
应用场景一、用户采用终端设备拍摄目标物后,且终端设备未显示包含目标物的图像之前。
应理解,目标物可以为用户想要拍摄的任意人或物。当用户通控制终端设备的镜头对准目标物,按下快门后,终端设备拍摄到包含目标物的至少两张图像,该至少两张图像为多张待处理图像。此时,终端设备可以通过本申请实施例提供的图像处理方法处理该至少两张图像,最后将处理后得到的目标图像显示于用户。
应用场景二、终端设备以第一放大倍率显示包含目标物的图像,同时终端设备存储了与该包含目标物的图像对应的多张原始图像,该多张原始图像为用户拍摄该目标物时,终端设备拍摄到的包含目标物的至少两张图像。该多张原始图像为多张待处理图像。
应理解,第一放大倍率可以为任意的放大倍率。目标物可以为任意的人或物。当用户想要将包含目标物的图像的放大倍率由第一放大倍率改变为第二放大倍率时,可以向终端设备输入指令,该指令用于指示终端设备显示第二放大倍率的包含目标物的图像。此时终端设备基于该指令,采用图像处理方法处理上述的多张原始图像,得到第二放大倍率的包含目标物的图像。然后终端设备向用户显示第二放大倍率的包含目标物的图像。
应理解,应用场景一和应用场景二仅是示例,本申请实施例提供的图像处理方法还可以应用于除应用场景一和应用场景二之外的场景,本申请对此不做具体限制。
为了更好地理解本申请实施例,下面对本申请实施例涉及到的几个术语进行说明。
1、上采样(upsampling)处理:也可以称为图像插值,是一种提高原始图像分辨率的方法。通过上采样处理,能够增大原始图像的放大倍率,提高原始图像的分辨率。长采样处理可以通过插值法、反卷积法以及反池化法等方法实现。
2、锐化处理:也可以称为图像锐化或边缘增强,是一种通过补偿图像的轮廓,增强图像边缘和灰度跳变,以提高图像清晰度的方法。
3、锐化卷积核:也可以称为锐化滤波器核,是对图像进行锐化处理时采用的卷积矩阵。
4、图像融合(image fusion):是一种将关于同一目标的多个图像数据经过图像处理和计算机技术等,最大限度的提取各自图像中的有利信息,最后综合成一个高质量的图像的方法。通过图像融合,能够将多张图像中的信息融合至一张图像中,从而提高该一张图像的清晰度。
5、配准处理:将多张图像进行匹配、叠加的过程。
6、卷积神经网络(convolutional neuron network,CNN)模型:是在多层神经网络的基础上发展起来的能够应用于图像处理的一种深度学习方法。
7、QUAD出图:是一种传感器采用四个同色像素排列顺序,四个同色像素同时采样,得到一张四倍感光的照片。
8、Binning:是一种图像读出模式,将相邻像元感应的电荷加在一起,以一个像素的模式读出。QUAD出图通过四像素合一技术,即通过算法重新排列像素,恢复初始尺寸单个像素的过程,能够转换为Binning出图。
下文结合附图所示出的实施例示出了本申请提供的图像处理方法。本申请实施例的图像处理方法可以由具有拍照功能的终端设备执行,例如平板电脑、笔记本电脑、台式电脑、手机等,也可以是支持该终端设备实现该方法的芯片、芯片系统、或处理器,还可以是能实现全部或部分终端设备功能的逻辑模块或软件。下面以终端设备为执行主体对本申请实施例的图像处理方法进行详细说明。该终端设备的硬件结构如图1所示,软件结构如图2所示。
图3为本申请实施例提供的图像处理方法300的流程示意图。方法300适用于应用场景一和应用场景二。方法300包括以下步骤:
S301、获取多张待处理图像,多张待处理图像中放大倍率最高的QUAD图像为参考图像。
应理解,多张待处理图像均包含有相同的目标物,例如,当用户采用终端设备拍摄纽扣时,拍摄得到多张待处理图像时,多张待处理图像中均包含该纽扣。多张待理处理图像的数量可以为大于2的任意正整数,例如4、6等。多张待处理图像的放大倍率可以不同,其中,放大倍率最大最高的QUAD图像为目标图像。QUAD图像也可以称为QUAD出图。
可选地,多张待处理图像可以为用户在当前时刻通过终端设备拍摄得到的图像。例如,用户打开终端设备中的相机应用软件,镜头对准一个纽扣,点击快门,此时终端设备拍摄得到该多张待处理图像,该多张待处理图像可以显示或者不显示于用户。
可选地,多张待处理图像也可以为终端设备在历史时刻拍摄的存储于终端设备中的图像。例如,用户在2020年2月01日12:00,打开终端设备中的相机应用软件,镜头对准一个纽扣,点击快门,终端设备拍摄得到多张待处理图像,将该多张待处理图像进行处理后,向用户显示一张处理后的图像。终端设备在存储该处理后的图像时,也存储了该多张待处理图像。
S302、基于参考图像,对多张待处理图像中除参考图像之外的剩余图像进行处理,得到至少一个第一图像,至少一个第一图像的放大倍率与参考图像的放大倍率相同,至少一个第一图像的FOV与参考图像的FOV相同。
应理解,剩余图像的数量可以为任意正整数,例如1、3、4等。至少一个第一图像与剩余图像是一一对应的,即剩余图像中的每个图像经过处理后,均得到一个第一图像。示例性地,假设剩余图像包括图像1、图像2和图像3。基于参考图像,对剩余图像进行处理后,得到3个第一图像,该3个第一图像分别为:图像1经处理后得到的第一图像1,图像2经处理后得到的第一图像2,图像3经处理后得到的第一图像3。
本领域的技术人员可以理解,剩余图像的放大倍率低于参考图像,使得参考图像的FOV小于剩余图像的FOV,参考图像中显示的目标物的尺寸大于剩余图像中显示的该目标物的尺寸。终端设备通过对剩余图像进行处理,能够将剩余图像中的每个图像的放大倍率均放大至与参考图像相同的放大倍率。并且,终端设备通过对剩余图像进行处理,能够将剩余图像中相比于参考图像多显示的部分内容进行裁剪,以使参考图像和第一图像的FOV相同。
下面结合图4,以终端设备为手机为例,对参考图像和剩余图像进行详细说明。
图4为本申请实施例提供的一种参考图像和剩余图像的示意图。剩余图像如图4的界面(a)所示,该图像的放大倍率为1倍。参考图像如图4的界面(b)所示,参考图像的放大倍率为2倍。
终端设备通过对剩余图像进行处理,能够得到第一图像,第一图像的放大倍率为2倍。第一图像的FOV与参考图像相同,即第一图像的显示内容与参考图像相同。
S303、基于至少一个第一图像和参考图像,确定至少一个第一图像中每个第一图像的锐化卷积核。
应理解,至少一个第一图像中的每个第一图像的清晰度均低于参考图像,这样,基于至少一个第一图像中每个第一图像的清晰度和参考图像的清晰度,可以确定至少一个第一图像中每个第一图像的锐化卷积核。通过以与每个第一图像对应的锐化卷积核对该图像进行锐化处理,能够使该第一图像的清晰度与参考图像的清晰度相同或接近。示例性地,假设至少一个第一图像包括图像1和图像2,根据图像1和参考图像,确定图像1对应的锐化卷积核;根据图像2和参考图像,确定图像2对应的锐化卷积核。其中,基于图像1对应的锐化卷积核对图像1进行锐化处理,得到的锐化处理后的图像1的清晰度与参考图像的清晰度相同或接近;基于图像2对应的锐化卷积核对图像2进行锐化处理,得到的锐化处理后的图像2的清晰度与参考图像的清晰度相同或接近。
在一种可能的实施方式中,基于至少一个第一图像和参考图像,通过傅里叶变换法确定至少一个第一图像中每个第一图像的锐化卷积核。可选地,终端设备通过神经网络模型确定至少一个第一图像中每个第一图像的锐化卷积核。
S304、基于目标放大倍率对参考图像进行处理,得到第二图像。
应理解,目标放大倍率为用户对终端设备输入的放大倍率。可选地,终端设备可以显示第一界面,第一界面为终端设备的拍照界面,第一界面中包括至少一个按钮,该至少一个按钮中每个按钮分别对应一个放大倍率。用户点击至少一个按钮中的第一按钮,则第一按钮对应的放大倍率为目标放大倍率。示例性地,假设参考图像的放大倍率为2倍,目标放大倍率为10倍,则对参考图像进行处理后,得到的第二图像的放大倍率为10倍。
S305、基于至少一个第一图像中每个第一图像的锐化卷积核和第二图像,得到至少一个第三图像。
应理解,至少一个第三图像包括的第三图像的数量和至少一个第一图像包括的第一图像的数量相同。示例性地,假设至少一个第一图像为第一图像1、第一图像2和第一图像3,该三个第一图像对应的锐化卷积核依次分别为第一锐化卷积核、第二锐化卷积核和第三锐化卷积核。终端设备基于第一锐化卷积核处理第二图像,得到第三图像1;基于第二锐化卷积核处理第二图像,得到第三图像2;基于第三锐化卷积核处理第二图像,得到第三图像3。对应地,至少一个第三图像包括第三图像1、第三图像2和第三图像3。
S306、对第二图像和至少一个第三图像进行图像融合,得到目标图像。
应理解,终端设备对第二图像和至少一个第三图像进行图像融合的过程,是提取至少一个第三图像中每个第三图像的有利信息,并将这些有利信息融合、叠加于第二图像的过程,该有利信息可以为第二图像中未包括的信息等。通过图像融合,能够得到清晰度高于第二图像的目标图像。目标图像为用户想要获取的图像,目标图像的放大倍率为目标放大倍率。
用户选择不同的目标放大倍率,得到的目标图像不同。在一个具体的示例中,终端设备为手机,用户选择的目标放大倍率为10倍时,目标图像如图5的界面(a)所示;用户选择的目标放大倍率为20倍时,目标图像如图5的界面(b)所示。
本申请的图像处理方法,以多张待处理图像中放大倍率最大、分辨率最高的图像作为参考图像,将多张待处理图像中除参考图像之外的其余图像中的每个图像进行处理,得到与参考图像放大倍率和FOV均相同的至少一个处理后的剩余图像;然后分别根据至少一个处理后的剩余图像中的每个图像和参考图像确定至少一个锐化卷积核;将参考图像进行处理,以得到放大倍率为目标放大倍率的处理后的参考图像;基于至少一个锐化卷积核中的每个锐化卷积核,对处理后的参考图像进行处理,得到至少一个处理后的锐化图像;通过将至少一个处理后的锐化图像和处理后的参考图像进行图像融合,能够得到清晰度较高、放大倍率为目标放大倍率的目标图像。目标放大倍率可以为任意放大倍率,将至少一个处理后的锐化图像和任意放大倍率的参考图像进行图像融合,能够提高任意放大倍率的参考图像的清晰度,这样,使得本申请的图像处理方法不仅能够按照任意放大倍率放大图像,提升图像处理的灵活性,还能够提高图像的清晰度,从而提升用户体验。
作为一个可选的实施例,终端设备设有至少一个镜头,至少一个镜头中每个镜头的焦段不同;上述的S301可以通过如下方式实现:通过至少一个镜头,获取多张待处理图像。
应理解,终端设备可以设置一个或者多个镜头,在终端设备设置的镜头的数量为多个时,该多个镜头中每个镜头的焦段不同。镜头的焦段越大,拍摄的得到的图像的放大倍率越大,FOV越小。每个镜头拍摄至少两张图像,该两张图像的分辨率可以不同。
在一种可能的实施方式中,终端设备的至少一个镜头中,每个镜头分别拍摄得到一张QUAD出图,QUAD出图经终端设备处理后会再得到一张Binning出图,即每个镜头均能够得到一张QUAD出图和一张Binning出图。在终端设备设置的镜头数量为N的情况下,N为正整数,多张待处理图像包括N张QUAD出图和N张Binning出图。其中,焦段最大的镜头拍摄的QUAD出图为参考图像。
作为一个可选的实施例,上述的S302可以通过如下方式实现:按照参考图像的放大倍率,对剩余图像中的每张图像进行上采样处理,得到至少一个上采样图像,至少一个上采样图像中的每个图像的放大倍率与参考图像的放大倍率相同;对至少一个上采样图像中的每个图像分别和参考图像进行配准处理,得到至少一个配准后的上采样图像;基于参考图像的FOV,对至少一个配准后的上采样图像中的每个图像进行图像剪裁,得到至少一个第一图像。
应理解,剩余图像中每张图像的放大倍率小于参考图像的放大倍率,通过对剩余图像中的每张图像进行上采样处理,能够得到放大倍率与参考图像的放大倍率相同的至少一个上采样图像。至少一个上采用图像包括的上采样图像的数量与剩余图像的数量是相同的。至少一个上采样图像中的每个上采样图像的FOV均大于参考图像的FOV。通过将至少一个上采样图像中的每个上采样图像与参考图像进行配准处理,能够将参考图像映射于至少一个上采样图像中的每个上采样图像上,得到至少一个配准后的上采样图像。通过对至少一个配准后的上采样图像中的每个配准后的上采样图像中相比于参考图像多余的内容进行剪裁处理,能够得到与参考图像FOV相同的至少一个第一图像。至少一个第一图像包括的第一图像的数量、至少一个配准后的上采样图像包括的配准后的上采样图像的数量、至少一个上采样图像包括的上采样图像的数量以及剩余图像的数量均是相同的。
示例性地,假设剩余图像包括图像1和图像2,图像1和图像2的放大倍率依次分别为1倍和2倍。参考图像的放大倍率为10倍。通过对图像1和图像2进行上采样处理,得到放大倍率均为10倍的上采样图像1和上采样图像2。然后分别将上采样图像1与参考图像进行配准处理,得到配准后的上采样图像1;将上采样图像2与参考图像进行配准处理,得到配准后的上采样图像2。将配准后的上采样图像1中相比于参考图像包括的内容多余的部分进行图像剪裁,得到第一图像1;将配准后的上采样图像2中相比于参考图像包括的内容多余的部分进行图像剪裁,得到第一图像2。终端设备得到的第一图像1和第一图像2的FOV与参考图像的FOV相同。
作为一个可选的实施例,上述的S304可以通过如下方式实现:按照目标放大倍率,对参考图像进行上采样处理,得到第二图像。
应理解,第二图像为上采样处理后的参考图像。通过上采样处理可以将参考图像的放大倍率放大至任意倍率,这样,能够得到任意倍率的目标图像。
作为一个可选的实施例,上述的S305可以通过如下方式实现:基于至少一个第一图像中每个第一图像的锐化卷积核,对第二图像进行锐化处理,得到至少一个第三图像。
应理解,第二图像是参考图像经过处理后得到的放大倍率为目标放大倍率的图像,第二图像的清晰度较低,通过对第二图像进行锐化处理能够提高第二图像的清晰度。至少一个第一图像中每个第一图像的清晰度均低于参考图像,并且至少一个第一图像中每个第一图像的FOV和参考图像的FOV相同。终端设备通过基于至少一个第一图像中每个第一图像的锐化卷积核,对第二图像进行锐化处理,得到的至少一个第三图像中存在清晰度高于第二图像的第三图像,这样,通过将至少一个第三图像和第二图像进行图像融合,能够提高第二图像的清晰度。
作为一个可选的实施例,上述的S306可以通过如下方式实现:将第二图像和至少一个第三图像输入至训练好的卷积神经网络模型,得到目标图像。
应理解,训练好的卷积神经网络模型能够提取至少一个第三图像中每个第三图像的特征信息,并将特征信息中的有利信息叠加于第二图像,这样,能够提高第二图像的清晰度。
作为一个可选的实施例,在将第二图像和至少一个第三图像输入至训练好的卷积神经网络模型之前,方法300还包括:
获取多张样本图像和标准图像,多张样本图像中放大倍率最且时分辨率最高的图像为样本参考图像,标准图像与样本参考图像的FOV相同,标准图像的放大倍率高于样本参考图像的放大倍率;基于样本参考图像,对多张样本图像中除样本参考图像之外的剩余样本图像进行处理,得到至少一个第一样本图像,至少一个第一样本图像的放大倍率与样本参考图像的放大倍率相同,至少一个第一样本图像的FOV与样本参考图像的FOV相同;基于至少一个第一样本图像和样本参考图像,确定至少一个第一样本图像中每个第一样本图像的锐化卷积核;基于目标放大倍率对样本参考图像进行处理,得到第二样本图像,第二样本图像的放大倍率与标准图像的放大倍率相同;基于至少一个第一样本图像中每个第一样本图像的锐化卷积核和第二样本图像,得到至少一个第三样本图像;将第二样本图像和至少一个第三样本图像输入卷积神经网络模型,输出目标样本图像;基于标准图像和目标样本图像,确定卷积神经网络模型的误差;基于误差训练卷积神经网络模型,得到训练好的卷积神经网络模型。
可以理解,多张样本图像的图像数量大于等于2,并且多张样本图像中包括相同的目标物,例如,该多张样本图像可以为用户通过终端设备拍摄同一个纽扣时拍摄得到的,该多张样本图像中的每张图像均包括该纽扣。标准图像为与样本图像包括相同的目标物的图像。
应理解,上述通过多张样本图像得到目标样本图像的过程,与S301至S306类似,在此不再赘述。
在一种可能的实施方式中,标准图像可以通过设有高倍率镜头的终端设备拍摄得到,例如,标准图像可以为通过高倍率单反拍摄得到的图像。可选地,标准图像的颜色亮度和样本参考图像的颜色亮度相同。
在一种可能的实施方式中,卷积神经网络模型的误差为标准图像和目标样本图像的平均绝对值误差(mean absolute error,MAE)。
在一个具体的示例中,假设至少一个第三图像中包括的第三图像的数量为M,M为正整数。终端设备通过训练好的卷积神经网络模型对第二图像和至少一个第三图像进行图像融合的过程如图6所示。
图6为本申请实施例提供的一种通过卷积神经网络模型进行图像融合的过程示意图。其中,601为对卷积神经网络的输入,H为目标图像的高度;W为目标图像的宽度;M+1指第二图像和M张第三图像经过图像拼接后得到的拼接图像。602至605指卷积神经网络的卷积层;606至608指卷积神经网络的拼接层;609至611指卷积神经网络的反卷积层。在卷积层和反卷积层中,包含64张映射图像;在拼接层中,包含128张映射图像。601经过卷积层、反卷积层和拼接层的处理,得到612,612为卷积神经网络的输出,输出的为宽度为W,高度为H的3通道(RGB)图像。
拼接图像输入卷积神经网络后,经过卷积层、反卷积层和拼接层的交叉处理,得到目标图像,即卷积层和反卷积层以及拼接层是一一对应的,例如,图6中的卷积层602与拼接层608和反卷积层611对应。如图6所示,拼接图像首先经过卷积层602的卷积操作,得到第一卷积图像;第一卷积图像再经过卷积层603的卷积操作,得到第二卷积图像,同时,第一卷积图像还输入至拼接层608和反卷积层611;第二卷积图像输入至卷积层604,经卷积层604的卷积操作,得到第三卷积图像,同时,第二卷积图像还输入至拼接层607和反卷积层610,经过拼接层607和反卷积层610的处理,得到第一融合图像;第一融合图像输入至拼接层608和反卷积层611;第三卷积图像输入至卷积层605,经卷积层605的卷积操作,得到第四卷积图像;第四卷积图像和第三卷积图像均会输入至拼接层606和反卷积层609,经过拼接层606和反卷积层609的处理,得到第二融合图像;第二融合图像输入至拼接层607和反卷积层610,经过拼接层607和反卷积层610的处理,得到第三融合图像;最终,第二融合图像和第三融合图像也输入至拼接层608和反卷积层611,经过拼接层608和反卷积层611对第一卷积图像、第一融合图像、第二融合图像和第三融合图像的处理,输出目标图像。
作为另一个可选的实施例,上述的S306可以通过如下方式实现:将第二图像和至少一个第三图像输入至训练好的卷积神经网络模型,得到权重矩阵;基于权重矩阵、第二图像以及至少一个第三图像,得到目标图像。
应理解,权重矩阵是用于形容至少一个第三图像和第二图像在进行图像融合时,至少一个第三图像和第二图像中每个图像的权重的矩阵。
在一个具体的示例中,当训练好的卷积神经网络的输出为权重矩阵时,通过第二图像和至少一个第三图像得到权重矩阵的过程如图7所示。
图7为本申请实施例提供的又一种通过卷积神经网络模型进行图像融合的过程示意图。其中,701为对卷积神经网络的输入,H为目标图像的高度;W为目标图像的宽度;M+1指第二图像和M张第三图像经过图像拼接后得到的拼接图像。702至705指卷积神经网络的卷积层;706至708指卷积神经网络的拼接层;709至711指卷积神经网络的反卷积层。在卷积层和反卷积层中,包含64张映射;在拼接层中,包含128张映射。712指卷积神经网络的输出,输出的权重矩阵。
应理解,图7所示的训练好的卷积神经网络进行图像融合的过程与图6所示的训练好的卷积神经网络进行图像融合的过程类似,可参看上文,在此不再赘述。
下面结合图8对图像处理方法进行详细的说明。
图8为本申请实施例提供的一种图像处理方法800的流程示意图。方法800适用于应用场景一和应用场景二。方法800由设有至少一个镜头的终端设备执行,至少一个镜头中每个镜头的焦段不同,该终端设备的硬件结构如图1所示,软件结构如图2所示。如图8所示,方法800包括:
S801、通过至少一个镜头,获取多张待处理图像,多张待处理图像包括来自至少一个镜头中每个镜头的QUAD出图和Binning出图,多张待处理图像中来自至少一个镜头中最大焦段的镜头的QUAD出图为参考图像。
S802、按照参考图像的放大倍率,对多张待处理图像中除参考图像之外的剩余图像中的每个图像进行上采样处理,得到至少一个上采样图像,至少一个上采样图像中每个上采样图像的放大倍率与参考图像的放大倍率相同。
S803、对至少一个上采样图像中的每个图像分别和参考图像进行配准处理,得到至少一个配准后的上采样图像。
S804、基于参考图像的FOV,对至少一个配准后的上采样图像中的每个图像进行图像剪裁,得到至少一个第一图像,至少一个第一图像中每个第一图像的FOV与参考图像的FOV相同。
S805、基于至少一个第一图像和参考图像,采用傅里叶变换法确定至少一个第一图像中每个第一图像的锐化卷积核。
S806、按照目标放大倍率,对参考图像进行上采样处理,得到第二图像。
S807、基于至少一个第一图像中每个第一图像的锐化卷积核,对第二图像进行锐化处理,得到至少一个第三图像。
S808、将第二图像和至少一个第三图像输入至训练好的卷积神经网络模型,得到目标图像。
应理解,上述各方法的序号的大小并不意味着执行顺序的先后,各方法的执行顺序应以其功能和内在逻辑确定。
上文结合图3至图8,详细描述了本申请实施例的图像处理方法,下面结合图9和图10,详细描述本申请实施例的图像处理装置。
图9为本申请实施例提供的一种图像处理装置900的结构示意图。如图9所示,装置900包括:获取模块901和处理模块902。
装置900用于实现上述方法实施例中终端设备对应的步骤。
获取模块901,用于获取多张待处理图像,多张待处理图像中放大倍率最高的QUAD图像为参考图像;
处理模块902,用于基于参考图像,对多张待处理图像中除参考图像之外的剩余图像进行处理,得到至少一个第一图像,至少一个第一图像的放大倍率与参考图像的放大倍率相同,至少一个第一图像的视场角FOV与参考图像的FOV相同;基于至少一个第一图像和参考图像,确定至少一个第一图像中每个第一图像的锐化卷积核;基于目标放大倍率对参考图像进行处理,得到第二图像;基于至少一个第一图像中每个第一图像的锐化卷积核和第二图像,得到至少一个第三图像;对第二图像和至少一个第三图像进行图像融合,得到目标图像。
可选地,处理模块902具体用于:按照参考图像的放大倍率,对剩余图像中的每张图像进行上采样处理,得到至少一个上采样图像,至少一个上采样图像中的每个图像的放大倍率与参考图像的放大倍率相同;对至少一个上采样图像中的每个图像分别和参考图像进行配准处理,得到至少一个配准后的上采样图像;基于参考图像的FOV,对至少一个配准后的上采样图像中的每个图像进行图像剪裁,得到至少一个第一图像。
可选地,处理模块902具体用于:按照目标放大倍率,对参考图像进行上采样处理,得到第二图像。
可选地,处理模块902具体用于:基于至少一个第一图像中每个第一图像的锐化卷积核,对第二图像进行锐化处理,得到至少一个第三图像。
可选地,处理模块902具体用于:将第二图像和至少一个第三图像输入至训练好的卷积神经网络模型,得到目标图像。
可选地,获取模块901还用于:获取多张样本图像和标准图像,多张样本图像中放大倍率最高的QUAD图像为样本参考图像,标准图像与样本参考图像的FOV相同,标准图像的放大倍率高于样本参考图像的放大倍率;
处理模块902还用于:基于样本参考图像,对多张样本图像中除样本参考图像之外的剩余样本图像进行处理,得到至少一个第一样本图像,至少一个第一样本图像的放大倍率与样本参考图像的放大倍率相同,至少一个第一样本图像的FOV与样本参考图像的FOV相同;基于至少一个第一样本图像和样本参考图像,确定至少一个第一样本图像中每个第一样本图像的锐化卷积核;基于目标放大倍率对样本参考图像进行处理,得到第二样本图像,第二样本图像的放大倍率与标准图像的放大倍率相同;基于至少一个第一样本图像中每个第一样本图像的锐化卷积核和第二样本图像,得到至少一个第三样本图像;将第二样本图像和至少一个第三样本图像输入卷积神经网络模型,输出目标样本图像;基于标准图像和目标样本图像,确定卷积神经网络模型的误差;基于误差训练卷积神经网络模型,得到训练好的卷积神经网络模型。
可选地,装置900设有至少一个镜头,至少一个镜头中每个镜头的焦段不同;获取模块901具体用于:通过至少一个镜头,获取多张待处理图像。
应理解,这里的装置900以功能模块的形式体现。这里的术语“模块”可以指应用特有集成电路(application specific integrated circuit,ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。在一个可选的例子中,本领域技术人员可以理解,装置900可以具体为上述实施例中的终端设备,装置900可以用于执行上述方法实施例中与终端设备对应的各个流程和/或步骤,为避免重复,在此不再赘述。
上述装置900具有实现上述方法中终端设备执行的相应步骤的功能;上述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。例如,上述处理模块902可以包括确定模块,该确定模块可以用于实现上述处理模块902对应的用于执行确定动作的各个步骤和/或流程。
在本申请的实施例,图9中的装置900也可以是芯片,例如:SOC。对应地,处理模块902可以是该芯片的收发电路,在此不做限定。
图10为本申请实施例提供的一种图像处理装置1000的结构示意图。该装置1000包括处理器1001、收发器1002和存储器1003。其中,处理器1001、收发器1002和存储器1003通过内部连接通路互相通信,该存储器1003用于存储指令,该处理器1001用于执行该存储器1003存储的指令,以控制该收发器1002发送信号和/或接收信号。
应理解,装置1000可以具体为上述实施例中的终端设备,并且可以用于执行上述方法实施例中与终端设备对应的各个步骤和/或流程。可选地,该存储器1003可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。该处理器1001可以用于执行存储器中存储的指令,并且当该处理器1001执行存储器中存储的指令时,该处理器1001用于执行上述方法实施例的各个步骤和/或流程。该收发器1002可以包括发射器和接收器,该发射器可以用于实现上述收发器对应的用于执行发送动作的各个步骤和/或流程,该接收器可以用于实现上述收发器对应的用于执行接收动作的各个步骤和/或流程。
应理解,在本申请实施例中,该处理器可以是中央处理单元(central processingunit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器执行存储器中的指令,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,该计算机程序用于实现上述方法实施例中所示的方法。
本申请还提供了一种计算机程序产品,该计算机程序产品包括计算机程序(也可以称为代码,或指令),当该计算机程序在计算机上运行时,该计算机可以执行上述方法实施例所示的方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。因此,本申请实施例的保护范围应所述以权利要求的保护范围为准。

Claims (17)

1.一种图像处理方法,其特征在于,包括:
获取多张待处理图像,所述多张待处理图像中放大倍率最高的QUAD图像为参考图像;
基于所述参考图像,对所述多张待处理图像中除所述参考图像之外的剩余图像进行处理,得到至少一个第一图像,所述至少一个第一图像的放大倍率与所述参考图像的放大倍率相同,所述至少一个第一图像的视场角FOV与所述参考图像的FOV相同;
基于所述至少一个第一图像和所述参考图像,确定所述至少一个第一图像中每个第一图像的锐化卷积核;
基于目标放大倍率对所述参考图像进行处理,得到第二图像;
基于所述至少一个第一图像中每个第一图像的锐化卷积核和所述第二图像,得到至少一个第三图像;
对所述第二图像和所述至少一个第三图像进行图像融合,得到目标图像。
2.根据权利要求1所述的方法,其特征在于,所述基于所述参考图像,对所述多张待处理图像中除所述参考图像之外的剩余图像进行处理,得到至少一个第一图像,包括:
按照所述参考图像的放大倍率,对所述剩余图像中的每张图像进行上采样处理,得到至少一个上采样图像,所述至少一个上采样图像中的每个图像的放大倍率与所述参考图像的放大倍率相同;
对所述至少一个上采样图像中的每个图像分别和所述参考图像进行配准处理,得到至少一个配准后的上采样图像;
基于所述参考图像的FOV,对所述至少一个配准后的上采样图像中的每个图像进行图像剪裁,得到所述至少一个第一图像。
3.根据权利要求1所述的方法,其特征在于,所述基于目标放大倍率对所述参考图像进行处理,得到第二图像,包括:
按照所述目标放大倍率,对所述参考图像进行上采样处理,得到所述第二图像。
4.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个第一图像中每个第一图像的锐化卷积核和所述第二图像,得到至少一个第三图像,包括:
基于所述至少一个第一图像中每个第一图像的锐化卷积核,对所述第二图像进行锐化处理,得到所述至少一个第三图像。
5.根据权利要求1所述的方法,其特征在于,所述对所述第二图像和所述至少一个第三图像进行图像融合,得到目标图像,包括:
将所述第二图像和所述至少一个第三图像输入至训练好的卷积神经网络模型,得到所述目标图像。
6.根据权利要求5所述的方法,其特征在于,在所述将所述第二图像和所述至少一个第三图像输入至训练好的卷积神经网络模型之前,所述方法还包括:
获取多张样本图像和标准图像,所述多张样本图像中放大倍率最高的QUAD图像为样本参考图像,所述标准图像与所述样本参考图像的FOV相同,所述标准图像的放大倍率高于所述样本参考图像的放大倍率;
基于所述样本参考图像,对所述多张样本图像中除所述样本参考图像之外的剩余样本图像进行处理,得到至少一个第一样本图像,所述至少一个第一样本图像的放大倍率与所述样本参考图像的放大倍率相同,所述至少一个第一样本图像的FOV与所述样本参考图像的FOV相同;
基于所述至少一个第一样本图像和所述样本参考图像,确定所述至少一个第一样本图像中每个第一样本图像的锐化卷积核;
基于目标放大倍率对所述样本参考图像进行处理,得到第二样本图像,所述第二样本图像的放大倍率与所述标准图像的放大倍率相同;
基于所述至少一个第一样本图像中每个第一样本图像的锐化卷积核和所述第二样本图像,得到至少一个第三样本图像;
将所述第二样本图像和至少一个第三样本图像输入卷积神经网络模型,输出目标样本图像;
基于所述标准图像和所述目标样本图像,确定所述卷积神经网络模型的误差;
基于所述误差训练所述卷积神经网络模型,得到所述训练好的卷积神经网络模型。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法应用于设有至少一个镜头的终端设备,所述至少一个镜头中每个镜头的焦段不同;
所述获取多张待处理图像,包括:
通过所述至少一个镜头,获取所述多张待处理图像。
8.一种图像处理装置,其特征在于,包括:
获取模块,用于获取多张待处理图像,所述多张待处理图像中放大倍率最高的QUAD图像为参考图像;
处理模块,用于基于所述参考图像,对所述多张待处理图像中除所述参考图像之外的剩余图像进行处理,得到至少一个第一图像,所述至少一个第一图像的放大倍率与所述参考图像的放大倍率相同,所述至少一个第一图像的视场角FOV与所述参考图像的FOV相同;基于所述至少一个第一图像和所述参考图像,确定所述至少一个第一图像中每个第一图像的锐化卷积核;基于目标放大倍率对所述参考图像进行处理,得到第二图像;基于所述至少一个第一图像中每个第一图像的锐化卷积核和所述第二图像,得到至少一个第三图像;对所述第二图像和所述至少一个第三图像进行图像融合,得到目标图像。
9.根据权利要求8所述的装置,其特征在于,所述处理模块具体用于:
按照所述参考图像的放大倍率,对所述剩余图像中的每张图像进行上采样处理,得到至少一个上采样图像,所述至少一个上采样图像中的每个图像的放大倍率与所述参考图像的放大倍率相同;
对所述至少一个上采样图像中的每个图像分别和所述参考图像进行配准处理,得到至少一个配准后的上采样图像;
基于所述参考图像的FOV,对所述至少一个配准后的上采样图像中的每个图像进行图像剪裁,得到所述至少一个第一图像。
10.根据权利要求8所述的装置,其特征在于,所述处理模块具体用于:
按照所述目标放大倍率,对所述参考图像进行上采样处理,得到所述第二图像。
11.根据权利要求8所述的装置,其特征在于,所述处理模块具体用于:
基于所述至少一个第一图像中每个第一图像的锐化卷积核,对所述第二图像进行锐化处理,得到所述至少一个第三图像。
12.根据权利要求8所述的装置,其特征在于,所述处理模块具体用于:
将所述第二图像和所述至少一个第三图像输入至训练好的卷积神经网络模型,得到所述目标图像。
13.根据权利要求12所述的装置,其特征在于,所述获取模块还用于:
获取多张样本图像和标准图像,所述多张样本图像中放大倍率最高的QUAD图像为样本参考图像,所述标准图像与所述样本参考图像的FOV相同,所述标准图像的放大倍率高于所述样本参考图像的放大倍率;
所述处理模块还用于:
基于所述样本参考图像,对所述多张样本图像中除所述样本参考图像之外的剩余样本图像进行处理,得到至少一个第一样本图像,所述至少一个第一样本图像的放大倍率与所述样本参考图像的放大倍率相同,所述至少一个第一样本图像的FOV与所述样本参考图像的FOV相同;基于所述至少一个第一样本图像和所述样本参考图像,确定所述至少一个第一样本图像中每个第一样本图像的锐化卷积核;基于目标放大倍率对所述样本参考图像进行处理,得到第二样本图像,所述第二样本图像的放大倍率与所述标准图像的放大倍率相同;基于所述至少一个第一样本图像中每个第一样本图像的锐化卷积核和所述第二样本图像,得到至少一个第三样本图像;将所述第二样本图像和至少一个第三样本图像输入卷积神经网络模型,输出目标样本图像;基于所述标准图像和所述目标样本图像,确定所述卷积神经网络模型的误差;基于所述误差训练所述卷积神经网络模型,得到所述训练好的卷积神经网络模型。
14.根据权利要求8至13中任一项所述的装置,其特征在于,所述装置设有至少一个镜头,所述至少一个镜头中每个镜头的焦段不同;
所述获取模块具体用于:
通过所述至少一个镜头,获取所述多张待处理图像。
15.一种图像处理装置,其特征在于,包括:处理器,所述处理器与存储器耦合,所述存储器用于存储计算机程序,当所述处理器调用所述计算机程序时,使得所述装置执行如权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序包括用于实现如权利要求1至7中任一项所述的方法的指令。
17.一种计算机程序产品,其特征在于,所述计算机程序产品中包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得所述计算机实现如权利要求1至7中任一项所述的方法。
CN202310048898.9A 2023-02-01 2023-02-01 图像处理方法和装置 Active CN115880198B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310048898.9A CN115880198B (zh) 2023-02-01 2023-02-01 图像处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310048898.9A CN115880198B (zh) 2023-02-01 2023-02-01 图像处理方法和装置

Publications (2)

Publication Number Publication Date
CN115880198A CN115880198A (zh) 2023-03-31
CN115880198B true CN115880198B (zh) 2023-07-07

Family

ID=85758556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310048898.9A Active CN115880198B (zh) 2023-02-01 2023-02-01 图像处理方法和装置

Country Status (1)

Country Link
CN (1) CN115880198B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105556944A (zh) * 2012-11-28 2016-05-04 核心光电有限公司 高分辨率薄多孔径成像系统
CN106999024A (zh) * 2015-09-01 2017-08-01 奥林巴斯株式会社 摄像系统、处理装置、处理方法以及处理程序
WO2021231042A1 (en) * 2020-05-15 2021-11-18 Microsoft Technology Licensing, Llc Image super-resolution
WO2022007851A1 (zh) * 2020-07-08 2022-01-13 杭州萤石软件有限公司 图像重建方法及装置
CN114449174A (zh) * 2022-02-28 2022-05-06 维沃移动通信有限公司 拍摄方法、装置和电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10297034B2 (en) * 2016-09-30 2019-05-21 Qualcomm Incorporated Systems and methods for fusing images

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105556944A (zh) * 2012-11-28 2016-05-04 核心光电有限公司 高分辨率薄多孔径成像系统
CN106999024A (zh) * 2015-09-01 2017-08-01 奥林巴斯株式会社 摄像系统、处理装置、处理方法以及处理程序
WO2021231042A1 (en) * 2020-05-15 2021-11-18 Microsoft Technology Licensing, Llc Image super-resolution
WO2022007851A1 (zh) * 2020-07-08 2022-01-13 杭州萤石软件有限公司 图像重建方法及装置
CN114449174A (zh) * 2022-02-28 2022-05-06 维沃移动通信有限公司 拍摄方法、装置和电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于深度学习的无源成像超分辨算法研究";赵旭阳;《中国优秀硕士学位论文全文数据库》;全文 *
Huiwen Chang等."Panning and Zooming High-Resolution Panoramas in Virtual Reality Devices".《UIST'17:The 30th Annual ACM Symposium on User Interface Software and Technology》.2017,279-288. *

Also Published As

Publication number Publication date
CN115880198A (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
WO2021136050A1 (zh) 一种图像拍摄方法及相关装置
CN113905179B (zh) 一种终端切换摄像头的方法及终端
CN115866121B (zh) 应用界面交互方法、电子设备和计算机可读存储介质
CN111095723B (zh) 无线充电方法及电子设备
CN114650363B (zh) 一种图像显示的方法及电子设备
CN113448382B (zh) 多屏幕显示电子设备和电子设备的多屏幕显示方法
CN110138999B (zh) 一种用于移动终端的证件扫描方法及装置
CN113641271B (zh) 应用窗口的管理方法、终端设备及计算机可读存储介质
CN114089932B (zh) 多屏显示方法、装置、终端设备及存储介质
CN113542580B (zh) 去除眼镜光斑的方法、装置及电子设备
CN115798390B (zh) 屏幕显示方法和终端设备
CN116048358B (zh) 悬浮球的控制方法和相关装置
WO2020233593A1 (zh) 一种前景元素的显示方法和电子设备
CN114880251B (zh) 存储单元的访问方法、访问装置和终端设备
CN114727220A (zh) 一种设备搜寻方法以及电子设备
CN116389884B (zh) 缩略图显示方法及终端设备
CN116048831B (zh) 一种目标信号处理方法和电子设备
CN115150542B (zh) 一种视频防抖方法及相关设备
CN117009005A (zh) 一种显示方法、汽车和电子设备
CN115880198B (zh) 图像处理方法和装置
CN116663587A (zh) 二维码的识别方法和识别装置
CN116703741B (zh) 一种图像对比度的生成方法、装置和电子设备
CN116233599B (zh) 一种录像模式推荐方法和电子设备
CN116709023B (zh) 视频处理方法和装置
CN116232959B (zh) 网络质量检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant