CN115115679A - 一种图像配准方法及相关设备 - Google Patents

一种图像配准方法及相关设备 Download PDF

Info

Publication number
CN115115679A
CN115115679A CN202210623588.0A CN202210623588A CN115115679A CN 115115679 A CN115115679 A CN 115115679A CN 202210623588 A CN202210623588 A CN 202210623588A CN 115115679 A CN115115679 A CN 115115679A
Authority
CN
China
Prior art keywords
image
depth
electronic device
images
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210623588.0A
Other languages
English (en)
Inventor
李政
陈刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202210623588.0A priority Critical patent/CN115115679A/zh
Publication of CN115115679A publication Critical patent/CN115115679A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Abstract

本申请实施例公开了一种图像配准方法及相关设备,其特征在于,所述方法包括:确定第一图像的深度信息,深度信息包括第一图像上的M个像素点,及所述M个像素点中每个像素点的深度值;基于所述深度信息从所述第一图像中提取N张第一深度图像,其中,所述N张第一深度图像中的每张第一深度图像中包括对应的第一像素点集合,所述第一像素点集合中包括所述第一图像中的多个目标像素点,所述多个目标像素点之间的深度值的差值在预设范围内;从目标图库中为每张所述第一深度图像匹配一张第二图像,得到N张第二图像;将所述N张第二图像进行融合得到目标图像。

Description

一种图像配准方法及相关设备
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图像配准方法及相关设备。
背景技术
在手机拍摄领域,由于受到手机成像设备的限制,在高倍率场景下,如拍摄较远处的景物时,手机拍摄出的图像存在分辨率低,细节模糊等问题。目前,为改善图像清晰度,会借助一张与用户拍摄内容和拍摄角度高度一致的高清参考帧,通过提取该高清参考帧上的高频信息来恢复手机图像的细节,从而提升手机图像的清晰度。
在该过程中,会基于图像配准技术(即将两幅图像进行空间匹配)来确定高清参考帧,在现有技术中,通过提取手机拍摄的低清图像中的平面特征点来与高清图库中的高清图像进行配准,以从高清图库中找到一张与低清图像的平面特征点最匹配的高清图像并将其作为高清参考帧,进而能够基于该高清参考帧来对低清图像进行细节恢复。但在实际应用过程中发现,由于仅基于低清图像的平面特征点来进行配准忽略了不同物体之间的视觉差异,因此很难直接在高清图库中匹配到一张与用户随机拍摄的低清图像拍摄角度和拍摄内容高度一致的高清图像,即一般情况下从高清图库中匹配的高清图像与低清图像之间会存在较大的像素偏差,进而在现有技术中只能基于像素偏差较大的高清图像来对低清图像进行细节恢复,导致图像部分区域出现形变等问题。
发明内容
本申请实施例所要解决的技术问题在于,提供一种图像配准方法及相关设备,为低清图像匹配到一张像素偏差较小的高清图像。
第一方面,本申请实施例提供一种图像配准方法,该方法应用于电子设备,所述方法包括:确定第一图像的深度信息,所述深度信息包括所述第一图像上的M个像素点,及所述M个像素点中每个像素点的深度值,M为大于1的整数;基于所述深度信息从所述第一图像中提取N张第一深度图像,其中,所述N张第一深度图像中的每张第一深度图像中包括对应的第一像素点集合,所述第一像素点集合中包括所述第一图像中的多个目标像素点,所述多个目标像素点之间的深度值的差值在预设范围内,N为大于1的整数;从目标图库中为每张所述第一深度图像匹配一张第二图像,得到N张第二图像;将所述N张第二图像进行融合得到目标图像。
在本申请实施例中,考虑到不同深度层次的图像内容存在视觉偏差,因此可基于第一图像的深度信息提取出不同深度层次的图像内容,并对每个深度层次的图像内容都进行图像配准(即根据拍摄内容和拍摄角度从图库中为每个深度层次的图像内容都匹配一张高清图像),以获得与每个深度层次的图像内容像素偏差最小的高清图像,最后将多张高清图像进行融合后得到与第一图像所匹配的目标图像(即将该目标图像作为第一图像的配准结果),从而降低配准结果与第一图像之间的像素偏差。
在一些实施例中,所述方法还包括:获取所述第一图像,并通过预设算法对所述第一图像上的所述M个像素点进行深度值估计得到所述深度信息,或者通过传感器获取所述第一图像的所述深度信息。
在本申请实施例中,可通过预设算法对第一图像的每个像素点的深度值都进行估计,以得到第一图像的深度信息,或是当拍摄第一图像的设备上具有深度传感器时,则可通过该传感器直接获取所述第一图像的深度信息,基于第一图像的深度信息提取出不同深度层次的图像内容,并对每个深度层次的图像内容都进行图像配准,以获得与每个深度层次的图像内容像素偏差最小的高清图像,最后将多张高清图像进行融合后得到与第一图像所匹配的目标图像,从而降低配准结果与第一图像之间的像素偏差。
在一些实施例中,所述电子设备包括显示屏和摄像模组,所述方法还包括:启动所述摄像模组,并在所述显示屏上显示第一用户界面,所述第一用户界面上显示有被拍摄画面;检测到第一用户操作,响应于所述第一用户操作,将当前所述第一用户界面中的被拍摄画面确定为所述第一图像。
在本申请实施例中,可将电子设备当前拍摄的图像作为第一图像(即低清图像),然后可为该图像匹配一张拍摄内容和拍摄角度尽量一致的目标图像(也可以理解为像素偏差最小的图像),进一步地,可以基于该目标图像对低清图像进行细节恢复,从而提升电子设备所拍摄图像的清晰度。
在一些实施例中,所述基于所述深度信息从所述第一图像中提取N张第一深度图像,包括:基于所述M个像素点各自的深度值,将任意两个像素点的深度值的差值在预设范围内的多个目标像素点划分到一个第一像素点集合中,得到N个第一像素点集合;基于所述N个第一像素点集合,得到所述N张第一深度图像。
在本申请实施例中,第一图像可包括N个深度层次的图像内容,一个深度层次的图像内容包括多个目标像素点,因此可先尽量将同一个深度层次上的像素点划分到一个集合中,进而可基于N个像素点集合得到N张不同深度层次的图像内容。进一步地,可对每个深度层次的图像内容都进行图像配准(即根据拍摄内容和拍摄角度从图库中为每个深度层次的图像内容都匹配一张高清图像),以获得与每个深度层次的图像内容像素偏差最小的高清图像,最后可将多张高清图像进行融合后得到与第一图像所匹配的目标图像(即可将目标图像作为第一图像的配准结果),从而降低配准结果与第一图像之间的像素偏差。
在一些实施例中,所述将任意两个像素点的深度值的差值在预设范围内的多个目标像素点划分到一个第一像素点集合中,包括:通过聚类算法将所述M个像素点各自的深度值进行聚类,得到N个聚类中心;针对所述N个聚类中的每个聚类中心,将与所述聚类中心的深度值的差值在预设范围内的多个像素点划分到一个第一像素点集合中。
在本申请实施例中,可将深度信息中所有像素点的深度值作为样本集合;然后可设定聚类中心个数为N(如N=2),并初始化随机生成N个聚类中心(即选取N个像素点的深度值,且这N个像素点的深度值之间的差值较大);接下来,可设定最大迭代次数K,在K次迭代中,找到N个最佳聚类中心,继而对每个像素点的深度值与N个最佳聚类中心分别进行差值比较,实现将同一个深度层次的像素点都划分到一个像素点集合中;最终可基于每个像素点集合中的像素点的色彩信息可以得到不同深度层次的图像内容。
在一些实施例中,所述根据拍摄角度和拍摄内容从目标图库中为每张所述第一深度图像匹配一张第二图像,得到N张第二图像,包括:提取所述N张第一深度图像中每张第一深度图像的特征点,分别与所述目标图库中的多张图像进行比较;将所述目标图库中与每张所述第一深度图像的特征点匹配度最高的图像确定为所匹配的第二图像,得到N张第二图像。
在本申请实施例中,可以基于不同深度层次下对应的图像内容和多张高清图像(由目标图库提供),分别对不同深度层次下的图像内容与多张高清图像进行图像配准,可以采用传统的特征提取算法(Oriented FAST and Rotated BRIEF,ORB),尺度不变特征转换(Scale Invariant Feature Transform,SIFT),关键点检测结合单应性矩阵(homography)的传统图像配准方法,也可采用superpoint结合superglue等的深度学习配准算法,以此得到不同深度层次下配准效果最优的高清配准结果。从而降低配准结果与第一图像之间的像素偏差。
在一些实施例中,所述方法还包括:将所述目标图像作为参考帧,对所述第一图像进行细节恢复。
在本申请实施例中,可以将与第一图像所匹配的目标图像作为高清参考帧,对第一图像进行细节恢复,从而能够提升第一图像的图片清晰度。
在一些实施例中,所述方法还包括:在所述显示屏上显示第二用户界面,所述第二用户界面上显示有第三图像,所述第三图像为基于所述目标图像对所述第一图像进行细节恢复后的图像。
在本申请实施例中,为给用户呈现清晰度更高的图像,可以在电子设备的显示屏上显示细节恢复后的图像,从而提升用户体验。
第二方面,本申请实施例提供一种电子设备,所述电子设备包括第一处理单元,所述第一处理单元用于:确定第一图像的深度信息,所述深度信息包括所述第一图像上的M个像素点,及所述M个像素点中每个像素点的深度值,M为大于1的整数;基于所述深度信息从所述第一图像中提取N张第一深度图像,其中,所述N张第一深度图像中的每张第一深度图像中包括对应的第一像素点集合,所述第一像素点集合中包括所述第一图像中的多个目标像素点,所述多个目标像素点之间的深度值的差值在预设范围内,N为大于1的整数;根据拍摄角度和拍摄内容从目标图库中为每张所述第一深度图像匹配一张第二图像,得到N张第二图像;将所述N张第二图像进行融合得到目标图像。
在一些实施例中,所述设备还包括:第一获取单元,用于获取所述第一图像,并通过预设算法对所述第一图像上的所述M个像素点进行深度值估计得到所述深度信息,或者通过传感器获取所述第一图像的所述深度信息。
在一些实施例中,所述设备还包括:第二处理单元,用于启动所述电子设备的摄像模组,并在所述显示屏上显示第一用户界面,所述第一用户界面上显示有被拍摄画面;检测到第一用户操作,响应于所述第一用户操作,将当前所述第一用户界面中的被拍摄画面确定为所述第一图像。
在一些实施例中,所述第一处理单元具体用于:基于所述M个像素点各自的深度值,将任意两个像素点的深度值的差值在预设范围内的多个目标像素点划分到一个第一像素点集合中,得到N个第一像素点集合;基于所述N个第一像素点集合,得到所述N张第一深度图像。
在一些实施例中,所述第一处理单元具体用于:通过聚类算法将所述M个像素点各自的深度值进行聚类,得到N个聚类中心;针对所述N个聚类中的每个聚类中心,将与所述聚类中心的深度值的差值在预设范围内的多个像素点划分到一个第一像素点集合中。
在一些实施例中,所述第一处理单元具体用于:提取所述N张第一深度图像中每张第一深度图像的特征点,分别与所述目标图库中的多张图像进行比较;将所述目标图库中与每张所述第一深度图像的特征点匹配度最高的图像确定为所匹配的第二图像,得到N张第二图像。
在一些实施例中,所述设备还包括:第三处理单元,用于将所述目标图像作为参考帧,对所述第一图像进行细节恢复。
在一些实施例中,所述设备还包括:第四处理单元,用于在所述显示屏上显示第二用户界面,所述第二用户界面上显示有第三图像,所述第三图像为基于所述目标图像对所述第一图像进行细节恢复后的图像。
第三方面,本申请实施例提供一种电子设备,该电子设备包括触控屏,存储器,一个或多个处理器,多个应用程序,以及一个或多个程序;其中,上述一个或多个程序被存储在上述存储器中,上述一个或多个处理器在执行上述一个或多个程序时,使得上述电子设备实现如第一方面中任一可能的实现方式。
第四方面,还提供一种拍照预览装置,该装置具有实现上述方法实际中电子设备行为的功能。上述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。上述硬件或软件包括一个或多个与上述功能相对应的模块。
第五方面,提供一种计算机设备,包括存储器,处理器以及存储在上述存储器上并可在上述处理器上运行的计算机程序,其特征在于,上述处理器执行上述计算机程序时使得上述计算机设备实现如第一方面中任一可能的实现方式。
第六方面,一种包含指令的计算机程序产品,其特征在于,当上述计算机程序产品在电子设备上运行时,使得上述电子设备执行如第一方面中任一可能的实现方式。
第七方面,提供一种计算机可读存储介质,包括指令,其特征在于,当上述指令在电子设备上运行时,使得上述电子设备执行如第一方面中任一可能的实现方式。
附图说明
图1A为本申请实施例提供的一种电子设备100的结构示意图。
图1B为本申请实施例提供的一种电子设备100的软件结构框图。
图2A为本申请实施例提供的一种电子设备100上的用于应用程序菜单的示例性用户界面21示意图。
图2B为本申请实施例提供的一种电子设备100背面结构示意图。
图3A为本申请实施例提供的一种电子设备100上的启动图像拍摄的示例性示意图。
图3B为本申请实施例提供的一种电子设备100上的图像拍摄的示例性用户界面31示意图。
图3C为本申请实施例提供的一种电子设备100上的图像拍摄的示例性示意图。
图4为本申请实施例提供的一种深度图的示意图。
图5为本申请实施例提供的一种生成不同深度层次的图像内容的示意图。
图6A为本申请实施例提供的一种图像配准过程示意图。
图6B为本申请实施例提供的另一种图像配准过程示意图。
图7A为本申请实施例提供的一种图像融合的示意图。
图7B为本申请实施例提供的另一种图像融合的示意图。
图8为本申请实施例提供的一种图像配准方法的流程示意图。
图9为本申请实施例提供的另一种图像配准方法的流程示意图。
图10为本申请实施例提供的一种电子设备示意图。
具体实施方式
本申请以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括复数表达形式,除非其上下文中明确地有相反指示。还应当理解,本申请中使用的术语“和/或”是指并包含一个或多个所列出项目的任何或所有可能组合。
以下介绍了电子设备、用于这样的电子设备的用户界面、和用于使用这样的电子设备的实施例。在一些实施例中,电子设备可以是还包含其他功能诸如个人数字助理和/或音乐播放器功能的便携式电子设备,诸如手机、平板电脑、具备无线通讯功能的可穿戴电子设备(如智能手表)等。便携式电子设备的示例性实施例包括但不限于搭载
Figure BDA0003677828040000051
Figure BDA0003677828040000052
或者其他操作系统的便携式电子设备。上述便携式电子设备也可以是其他便携式电子设备,诸如具有触敏表面或触控面板的膝上型计算机(Laptop)等。还应当理解的是,在其他一些实施例中,上述电子设备也可以不是便携式电子设备,而是具有触敏表面或触控面板的台式计算机。
本申请的说明书和权利要求书及附图中的术语“用户界面(user interface,UI)”,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。应用程序的用户界面是通过java、可扩展标记语言(extensible markup language,XML)等特定计算机语言编写的源代码,界面源代码在终端设备上经过解析,渲染,最终呈现为用户可以识别的内容,比如图片、文字、按钮等控件。控件(control)也称为部件(widget),是用户界面的基本元素,典型的控件有工具栏(toolbar)、菜单栏(menu bar)、文本框(text box)、按钮(button)、滚动条(scrollbar)、图片和文本。界面中的控件的属性和内容是通过标签或者节点来定义的,比如XML通过<Textview>、<ImgView>、<VideoView>等节点来规定界面所包含的控件。一个节点对应界面中一个控件或属性,节点经过解析和渲染之后呈现为用户可视的内容。此外,很多应用程序,比如混合应用(hybrid application)的界面中通常还包含有网页。网页,也称为页面,可以理解为内嵌在应用程序界面中的一个特殊的控件,网页是通过特定计算机语言编写的源代码,例如超文本标记语言(hyper text markup language,GTML),层叠样式表(cascading style sheets,CSS),java脚本(JavaScript,JS)等,网页源代码可以由浏览器或与浏览器功能类似的网页显示组件加载和显示为用户可识别的内容。网页所包含的具体内容也是通过网页源代码中的标签或者节点来定义的,比如GTML通过<p>、<img>、<video>、<canvas>来定义网页的元素和属性。
用户界面常用的表现形式是图形用户界面(graphic user interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。
首先介绍本申请以下实施例中提供的示例性电子设备100。
图1A示出了电子设备100的结构示意图。
电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,3D摄像头模组193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),中央处理器(central processing unit,CPU),图形处理器(graphics processing unit,GPU),神经网络处理器(neural-network processing unit,NPU),调制解调处理器,图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。在一些实施例中,电子设备100也可以包括一个或多个处理器110。
其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了电子设备100的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,3D摄像头模组193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,3D摄像头模组193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(display serial interface,DSI)等。在一些实施例中,处理器110和3D摄像头模组193通过CSI接口通信,实现电子设备100的摄像功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与3D摄像头模组193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,3D摄像头模组193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。示例性地,无线通信模块160可以包括蓝牙模块、Wi-Fi模块等。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等可以实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过3D摄像头模组193,ISP,视频编解码器,GPU,显示屏194以及应用处理器AP、神经网络处理器NPU等实现摄像功能。
3D摄像头模组193,可用于采集拍摄对象的彩色图像数据以及深度数据。ISP可用于处理3D摄像头模组193采集的彩色图像数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在3D摄像头模组193中。
在一些实施例中,3D摄像头模组193可以由彩色摄像模组和3D感测模组组成。
在一些实施例中,彩色摄像模组的摄像头的感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。
在一些实施例中,3D感测模组可以是(time of flight,TOF)3D感测模块或结构光(structured light)3D感测模块。其中,结构光3D感测是一种主动式深度感测技术,结构光3D感测模组的基本零组件可包括红外线(Infrared)发射器、IR相机模等。结构光3D感测模组的工作原理是先对被拍摄物体发射特定图案的光斑(pattern),再接收该物体表面上的光斑图案编码(light coding),进而比对与原始投射光斑的异同,并利用三角原理计算出物体的三维坐标。该三维坐标中就包括电子设备100距离被拍摄物体的距离。其中,TOF 3D感测也是主动式深度感测技术,TOF 3D感测模组的基本组件可包括红外线(Infrared)发射器、IR相机模等。TOF 3D感测模组的工作原理是通过红外线折返的时间去计算TOF 3D感测模组跟被拍摄物体之间的距离(即深度),以得到3D景深图。
结构光3D感测模组还可应用于人脸识别、体感游戏机、工业用机器视觉检测等领域。TOF 3D感测模组还可应用于游戏机、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)等领域。
在另一些实施例中,3D摄像头模组193还可以由两个或更多个摄像头构成。这两个或更多个摄像头可包括彩色摄像头,彩色摄像头可用于采集被拍摄物体的彩色图像数据。这两个或更多个摄像头可采用立体视觉(stereo vision)技术来采集被拍摄物体的深度数据。立体视觉技术是基于人眼视差的原理,在自然光源下,透过两个或两个以上的摄像头从不同的角度对同一物体拍摄影像,再进行三角测量法等运算来得到电子设备100与被拍摄物之间的距离信息,即深度信息。
在一些实施例中,电子设备100可以包括1个或N个3D摄像头模组193,N为大于1的正整数。具体的,电子设备100可以包括1个前置3D摄像头模组193以及1个后置3D摄像头模组193。其中,前置3D摄像头模组193通常可用于采集面对显示屏194的拍摄者自己的彩色图像数据以及深度数据,后置3D摄像头模组可用于采集拍摄者所面对的拍摄对象(如人物、风景等)的彩色图像数据以及深度数据。
在一些实施例中,处理器110中的CPU或GPU或NPU可以对3D摄像头模组193所采集的深度数据进行处理。在一些实施例中,NPU可以通过物体识别技术所基于的神经网络算法,例如卷积神经网络算法(CNN),来识别3D摄像头模组193(具体可以是彩色摄像模组)所采集的彩色图像数据,以确定被拍摄的目标物体。CPU或GPU也可用来运行神经网络算法以实现根据彩色图像数据确定被拍摄目标物体。在一些实施例中,CPU或GPU或NPU还可用于对3D摄像头模组193(具体可以是3D感测模组)所采集的深度数据进行分析处理,以得到不同深度层次的图像内容,进一步地可针对不同深度层次的图像内容分别进行图像配准,以实现针对每个深度层次的图像内容都能从高清图库中匹配到一张高清图像,然后可将这多张高清图像进行融合得到一张与3D摄像头模组193拍摄的图像像素偏差更小的目标图像,进而将该目标图像作为高清参考帧对3D摄像头模组193所拍摄的图像进行细节恢复,从而能够更加准确地修复3D摄像头模组193所拍摄的图像。后续实施例中会详细介绍如何基于图像的深度数据进行图像配准,这里先不赘述。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)-1,MPEG-2,MPEG-3,MPEG-4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐、照片、视频等数据保存在外部存储卡中。
内部存储器121可以用于存储一个或多个计算机程序,该一个或多个计算机程序包括指令。处理器110可以通过运行存储在内部存储器121的上述指令,从而使得电子设备100执行本申请一些实施例中所提供的电子设备的图像配准方法,以及各种功能应用以及数据处理等。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统;该存储程序区还可以存储一个或多个应用程序(比如图库、联系人等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如照片,联系人等)。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也可称触控面板或触敏表面。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
图1A示例性所示的电子设备100可以通过显示屏194显示以下各个实施例中所描述的各个用户界面。电子设备100可以通过触摸传感器180K在各个用户界面中检测触控操作,例如在各个用户界面中的点击操作(如在图标上的触摸操作、双击操作),又例如在各个用户界面中的向上或向下的滑动操作,或执行画圆圈手势的操作,等等。在一些实施例中,电子设备100可以通过陀螺仪传感器180B、加速度传感器180E等检测用户手持电子设备100执行的运动手势,例如晃动电子设备。在一些实施例中,电子设备100可以通过3D摄像头模组193(如3D摄像头、深度摄像头)检测非触控的手势操作。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图1B是本申请实施例的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图1B所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图1B所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,G.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
图1B所示的软件系统涉及到使用分享能力的应用呈现(如图库,文件管理器),提供分享能力的即时分享模块,提供打印能力的打印服务(print service)和打印后台服务(print spooler),以及应用框架层提供打印框架、WLAN服务、蓝牙服务,以及内核和底层提供WLAN蓝牙能力和基本通信协议。
下面结合捕获拍照场景,示例性说明电子设备100软件以及硬件的工作流程。
当触摸传感器180K接收到触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸操作,该触摸操作所对应的控件为相机应用图标的控件为例,相机应用调用应用框架层的接口,启动相机应用,进而通过调用内核层启动摄像头驱动,通过3D摄像头模组193捕获静态图像或视频。
下面介绍电子设备100上的用于应用程序菜单的示例性用户界面。
图2A示例性示出了电子设备100上的用于应用程序菜单的示例性用户界面21。如图2A所示,电子设备100可以配置有3D摄像头模组193。在一些实施例中,193-1可以是彩色摄像头,193-2可以是结构光3D摄像头模组。在另一些实施例中,193-1可以是彩色摄像头,193-2可以是TOF 3D摄像头模组。在一些实施例中,193-1、193-2可以是两个彩色摄像头。如图2A所示,3D摄像头模组193可设置于电子设备100的顶端,如电子设备100的“刘海”位置(即图2A中示出的区域AA)。可以知道,区域AA中除了包括3D摄像头模组193之外,还可以包括照明器197(未在图1A中示出)、扬声器170A、接近光传感器180G、环境光传感器180L等。在一些实施例中,如图2B所示,电子设备100的背面也可以配置有3D摄像头模组193,以及照明器197。
如图2A所示,用户界面21可包括:状态栏201,具有常用应用程序图标的托盘,日历指示符,天气指示符,导航栏,以及其他应用程序图标等。其中:
状态栏201可包括:移动通信信号(又可称为蜂窝信号)的一个或多个信号强度指示符201-1、移动通信信号的运营商的指示符201-2、时间指示符201-3、电池状态指示符201-4等。
日历指示符可用于指示当前时间,例如日期、星期几、时分信息等。
天气指示符可用于指示天气类型,例如多云转晴、小雨等,还可以用于指示气温等信息。
具有常用应用程序图标的托盘可展示:相机的图标218、通讯录的图标219、电话的图标220、短消息的图标221等。
导航栏可包括:返回按键、主界面(Gome screen)按键、呼出任务历史按键等系统导航键。当检测到用户点击返回按键时,电子设备100可显示当前页面的上一个页面。当检测到用户点击主界面按键时,电子设备100可显示主界面。当检测到用户点击呼出任务历史按键时,电子设备100可显示用户最近打开的任务。各导航键的命名还可以为其他,本申请对此不做限制。不限于虚拟按键,导航栏中的各导航键也可以实现为物理按键。
其他应用程序图标可例如:闹钟的图标202、日历的图标203、图库的图标204、备忘录的图标205、文件管理的图标206、电子邮件的图标207、音乐的图标208、计算器的图标209、华为视频的图标210、运动健康的图标211、天气的图标212、浏览器的图标213、智慧生活的图标214、设置的图标215、录音机的图标216、应用商城的图标217。用户界面21还可包括页面指示符222。其他应用程序图标可分布在多个页面,页面指示符222可用于指示用户当前浏览的是哪一个页面中的应用程序。用户可以左右滑动其他应用程序图标的区域,来浏览其他页面中的应用程序图标。
在一些实施例中,图2A示例性所示的用户界面21可以为主界面(Gome screen)。
在其他一些实施例中,电子设备100还可以包括主屏幕键。该主屏幕键可以是实体按键,也可以是虚拟按键。该主屏幕键可用于接收用户的指令,将当前显示的UI返回到主界面,这样可以方便用户随时查看主屏幕。上述指令具体可以是用户单次按下主屏幕键的操作指令,也可以是用户在短时间内连续两次按下主屏幕键的操作指令,还可以是用户在预定时间内长按主屏幕键的操作指令。在本申请其他一些实施例中,主屏幕键还可以集成指纹识别器,以便用于在按下主屏幕键的时候,随之进行指纹采集和识别。
可以理解的是,图2A仅仅示例性示出了电子设备100上的用户界面,不应构成对本申请实施例的限定。
下面将描述本申请涉及的一种应用场景:图像拍摄场景。
如图3A所示,电子设备100可以检测到作用于相机的图标218的触控操作(如在图标218上的点击操作),响应于该操作,可以显示图3B示例性所示的用户界面31。用户界面31可以是“相机”应用程序的用户界面,可用于用户进行摄像,例如拍照片、录像。“相机”是智能手机、平板电脑等电子设备上的一款图像拍摄的应用程序,本申请对该应用程序的名称不做限制。也即是说,用户可以在图3A所示的用户界面21上点击图标218来打开“相机”的用户界面31。不限于此,用户还可以在其他应用程序中打开用户界面31,例如用户在“微信”中点击拍摄控件来打开用户界面31。“微信”是一款社交类应用程序,可支持用户向他人分享所拍摄的照片等。
图3B示例性示出了智能手机等电子设备上的“相机”应用程序的一个用户界面31。如图3B所示,用户界面31可包括:区域301、拍摄模式列表302、控件303、控件304及控件305。其中:
区域301可以称为预览框301。预览框301可用于显示3D摄像头模组193实时采集的彩色图像。电子设备可以实时刷新其中的显示内容,以便于用户预览3D摄像头模组193当前采集的彩色图像。这里,3D摄像头模组193可以是后置摄像头,或者是前置摄像头。
拍摄模式列表302中可以显示有一个或多个拍摄模式选项。这一个或多个摄像选项可以包括:夜景模式选项302A、人像模式选项302B、拍照模式选项302C、录像模式选项302D以及更多拍摄模式选项302E。这一个或多个摄像选项在界面上可以表现为文字信息,例如夜景模式选项302A、人像模式选项302B、拍照模式选项302C、录像模式选项302D以及更多拍摄模式选项302E可以分别对应文字“夜景”、“人像”、“拍照”、“录像”、“更多”。不限于此,这一个或多个摄像选项在界面上还可以表现为图标或者其他形式的交互元素(interactive element,IE)。在一些实施例中,电子设备100可以默认选定拍照模式选项302C,拍照模式选项302C的显示状态(如拍照模式选项302C被高亮)可表示拍照模式选项302C已被选定。
电子设备100可以检测到作用于拍摄模式选项的用户操作,该用户操作可用于选择拍摄模式,响应该操作,电子设备100可以开启用户选择的拍摄模式。特别的,当该用户操作作用于更多拍摄模式选项302E时,电子设备100可以进一步显示更多的其他拍摄模式选项,如大光圈拍摄模式选项、慢动作拍摄模式选项等等,可以向用户展示更丰富的摄像功能。不限于图3B所示,拍摄模式列表302中可以不显示更多拍摄模式选项302E,用户可以通过在拍摄模式列表302中向左/右滑动来浏览其他拍摄模式选项。
控件303可用于监听触发拍摄(拍照或录像)的用户操作。如图3C所示,当电子设备检测到作用于控件303的用户操作(如在控件303上的点击操作),响应于该操作,电子设备100可以保存预览框301中的图像。保存的图像可以是图片或视频。另外,电子设备100还可以在控件304中显示所保存的图像的缩略图。也即是说,用户可以点击控件303来触发拍摄。其中,控件303可以是按钮或者其他形式的控件。本申请中,可以将控件303称为拍摄控件。需要说明的是,可通过本申请实施例提供的一种图像配准方法,为电子设备100拍摄的图像匹配到一张像素偏差较小的高清图像,进而可基于该像素偏差较小的高清图像对电子设备100拍摄的图像进行细节恢复,以提升电子设备所拍摄图像的清晰度。后续实施例中会详细介绍本申请提供的一种图像配准方法,这里先不详细赘述。
控件305可用于监听触发切换摄像头的用户操作。电子设备100可以检测到作用于控件305的用户操作(如在控件305上的点击操作),响应于该操作,电子设备100可以切换摄像头(如将后置摄像头切换为前置摄像头,或者将前置摄像头切换为后置摄像头)。
控件304可用于监听触发打开“图库”的用户操作。电子设备100可以检测到作用于控件304的用户操作(如在控件304上的点击操作),响应于该操作,电子设备100可以显示“图库”的用户界面,该用户界面中可显示有电子设备100保存的图片。需要说明的是,在本申请实施例中,“图库”中的图像可以为基于高清图像进行细节恢复后的图像,相较于原始电子设备100拍摄的图像清晰度更高。这里,“图库”是智能手机、平板电脑等电子设备上的一款图片管理的应用程序,又可以称为“相册”,本实施例对该应用程序的名称不做限制。“图库”可以支持用户对存储于电子设备上的图片进行各种操作,例如浏览、编辑、删除、选择等操作。
在现有技术中,仅基于低清图像的平面特征点来进行配准,以从高清图库中选择出一张与低清图像的平面特征点匹配度最高的图像作为配准结果,但在此过程中忽略了低清图像中的不同物体之间的视觉差异,导致配准结果与低清图像之间存在较大的像素偏差。而在本申请实施例中,由于考虑到低清图像的不同深度层次的图像内容之间存在视觉差异,因此针对低清图像的每个深度层次的图像内容都进行了图像配准,并且将多个配准结果进行融合后才得到与低清图像所匹配的高清图像(即将融合得到的高清图像作为第一图像的配准结果),从而降低配准结果与第一图像之间的像素偏差。
下面将结合图1A所示出的电子设备100的结构,以及应用场景,从以下几点描述本申请提供的图像配准方法:如何确定第一图像(可以理解为待配准的图像);如何基于第一图像得到不同深度层次的图像内容;如何为不同深度层次的图像内容匹配高清图像;如何确定第一图像的配准结果(即目标图像)。
方面一、如何确定第一图像。
结合上述图3A-图3C所描述的图像拍摄场景,如图3A所示,在电子设备上显示用户界面21,当检测到用户作用于相机的图标218的触控操作后,可以启动电子设备的摄像模组(如上述图1A中的3D摄像头模组193),并在电子设备的显示屏上显示如图3B所示的用户界面31(可以称为第一用户界面),在第一用户界面上显示有被拍摄画面;当电子设备检测到触发拍摄的用户操作(如在控件303上的点击操作,该操作可以称为第一用户操作),响应于第一用户操作,电子设备可以将当前第一用户界面中的被拍摄画面确定为第一图像,示例性的,第一图像可以为一张RGB图。需要说明的是,由于受到摄像模组的成像限制,电子设备在高倍率拍摄场景下,如电子设备在拍摄远处景物时,所拍摄的第一图像会出现细节模糊等问题,进而可通过软件对第一图像进行细节恢复,以提升第一图像的清晰图。
方面二、如何基于第一图像得到不同深度层次的图像内容。
要点1、确定第一图像的深度信息。
具体的,第一图像的深度信息可以包括第一图像上的M个像素点,及M个像素点中每个像素点的深度值,M为大于1的整数。深度值可以表示场景中某点与摄像模组的距离,可以为0-255之间的数值。可选的,可以基于第一图像的深度信息生成第一图像的深度图,假设第一图像包括M个像素点,基于每个像素点的深度值能够生成第一图像的深度图,由于像素点的深度值可以表示场景中某点与摄像模组的距离,因此该第一图像的深度图中包含与场景对象的表面到视点的距离有关的信息,反映了物体到摄像模组平面的距离,也反映了物体可见表面的几何形状。例如,如图4所示,图4为本申请实施例提供的一种深度图的示意图,在深度图中离摄像头距离越远的物体颜色越深,图中第一图像的深度图中包括两个目标物体,分别为植物和建筑物,通过该深度图可看出植物与建筑物在不同的深度层次,且植物离摄像头距离更近,建筑物离摄像头距离更远。
在一些实施例中,获取第一图像后,可以通过预设算法对第一图像上的M个像素点进行深度值估计得到深度信息。具体的,预设算法可以包括但不限于深度估计网络,卷积神经网络(Convolutional Neural Networks,CNN),循环神经网络(Recurrent NeuralNetwork,RNN),对抗神经网络等。示例性的,以预设算法为深度估计网络进行说明,深度估计网络的输入可以为用户拍摄的低清手机图像(即第一图像),深度估计网络可以对图像上的每个像素点都进行深度值估计,得到该图像的深度信息(即得到每个像素点的深度值)。可选的,可以基于估计得到的深度信息生成第一图像的深度图。
在一些实施例中,拍摄第一图像时,若拍摄装置中具有深度传感器,则可通过深度传感器获取第一图像的深度信息。可选的,可以基于测量得到的深度信息生成第一图像的深度图。
要点2、基于深度信息,确定不同深度层次的图像内容。
(1)确定N个第一像素点集合(N为大于1的整数)。
具体的,第一图像可包括N个深度层次的图像内容,一个深度层次的图像内容可以包括多个目标像素点,因此可先尽量将同一个深度层次上的像素点划分到一个集合中,进而可基于N个像素点集合得到N张不同深度层次的图像内容。
在一些实施例中,基于M个像素点各自的深度值,将任意两个像素点的深度值的差值在预设范围内的多个目标像素点划分到一个第一像素点集合中,得到N个第一像素点集合。具体的,假设每个像素点的深度值都在0-255之间,进一步可根据实际情况,先确定第一像素点集合的数量N,接下来可以计算任意两个像素点之间的深度值的差值,然后可以将任意两个像素点的深度值的差值在预设范围内的多个目标像素点划分到一个第一像素点集合中,最终实现将同一个深度层次的像素点都划分到一个第一像素点集合中。
在一些实施例中,通过聚类算法将M个像素点各自的深度值进行聚类,得到N个聚类中心;针对N个聚类中的每个聚类中心,将与聚类中心的深度值的差值在预设范围内的多个像素点划分到一个第一像素点集合中。具体的,假设深度信息中的每个像素点的深度值都在0-255之间,可将深度信息中所有像素点的深度值作为样本集合;可设定聚类中心个数为N(如N=2),初始化随机生成N个聚类中心(即选取N个像素点的深度值,且这N个像素点的深度值之间的差值较大);设定最大迭代次数K;在K次迭代中,找到N个最佳聚类中心,满足每个像素点的深度值到所属聚类中心的差值累加最小;对每个像素点的深度值与N个最佳聚类中心分别进行差值比较,得到每个像素点所属的聚类中心,该聚类中心下的所有像素点被划分到同一个像素点集合中,最终实现将同一个深度层次的像素点都划分到一个第一像素点集合中。
(2)基于N个第一像素点集合得到N张第一深度图像。
具体的,每张第一深度图像中可以包括对应的第一像素点集合;N个第一像素点集合中的每个第一像素点集合中可以包括在同一深度层次上的多个目标像素点,基于每个集合中的目标像素点的色彩信息,可以得到该集合对应的第一深度图像。需要说明的是,每张第一深度图像与第一图像具有相同的图像尺寸(即长宽相同),且第一深度图像上的像素点位置与第一图像上的像素点的位置一一对应,第一图像的每个像素点的深度层次与对应深度图像在该位置像素点的深度层次相同,故可以得到不同深度层次下对应的第一图像内容。第一深度图像上除了目标像素点以外的其他像素点可用三通道黑色像素点(0,0,0)进行填充,最终得到N张第一深度图像。
例如,如图5所示为本申请实施例提供的一种生成不同深度层次的图像内容的示意图,图中可基于第一图像的深度信息生成第一图像的深度图,从深度图中看出可将第一图像划分为两个深度层次,分别为植物所在的深度层次和建筑物所在的深度层次,进一步地,可以基于第一图像深度信息可得到两个像素点集合,分别对应着植物和建筑物,然后可基于这两个像素点集合生成两张层次深度图,然后获取层次深度图中的目标像素点的色彩信息得到第一深度图像,如图5中基于第一图像生成了两张第一深度图像,分别为植物所在的深度的图像和建筑物所在的深度的图像。
方面三、如何为不同深度层次的图像内容匹配高清图像。
要点1、确定目标图库。
具体的,目标图库可以为存储在电子设备本地的高清图库,也可以为存储在云端数据库中的高清图库。可选的,电子设备可以获取第一图像的拍摄位置信息,基于拍摄位置信息确定目标图库中的多张高清图像,多张高清图像可以为与第一图像拍摄环境相同但拍摄视角可能不同的图像。
要点2、从目标图库中为每张第一深度图像匹配一张第二图像。
具体的,第二图像可以理解为根据第一图像的拍摄内容和拍摄角度从目标图库中选择的像素偏差较小的高清图像。
在一些实施例中,可以提取N张第一深度图像中每张第一深度图像的特征点,分别与目标图库中的多张图像进行比较;将目标图库中与每张第一深度图像的特征点匹配度最高的图像确定为所匹配的第二图像,得到N张第二图像。具体的,可以根据不同深度层次下对应的手机图像内容(即第一深度图像)和多张高清图像(由目标图库提供),分别对不同深度层次下的手机图像内容与多张高清图像进行图像配准,可以采用传统的特征提取算法(Oriented FAST and Rotated BRIEF,ORB),尺度不变特征转换(Scale InvariantFeature Transform,SIFT),关键点检测结合单应性矩阵(homography)的传统图像配准方法,也可采用superpoint结合superglue等的深度学习配准算法,以此得到不同深度层次下配准效果最优的高清配准结果。
例如,如图6A所示,图6A为本申请实施例提供的一种图像配准过程示意图,在为植物的第一深度图像进行配准时,首先可以提取第一深度图像中植物的多个特征点,然后基于多个特征点与高清图库中的多张高清图(图6A中仅举例示出6张高清图像)进行比较,进而从高清图库中匹配到高清图像(b),并将高清图像(b)作为植物的第一深度图像的配准结果。通过比较第一深度图像和配准结果(即第二图像),可以发现通过电子设备拍摄的图像存在细节丢失的现象,如植物中的树枝等细节。
接下来,如图6B所示,图6B为本申请实施例提供的另一种图像配准过程示意图,在为建筑物的第一深度图像进行配准时,首先可以提取第一深度图像中建筑物的多个特征点,然后基于多个特征点与高清图库中的多张高清图(图6B中仅举例示出6张高清图像)进行比较,进而从高清图库中匹配到高清图像(e),并将高清图像(e)作为建筑物的第一深度图像的配准结果。通过比较第一深度图像和配准结果(即第二图像),可以发现通过电子设备拍摄的图像存在细节丢失的现象,如建筑物上的窗户等细节。
最终,实现从目标图库中为每张第一深度图像都匹配一张第二图像。
方面四、如何确定第一图像的配准结果(即目标图像)。
具体的,可以将多张第二图像(即为不同深度层次的图像内容所匹配的高清图像)进行融合得到目标图像,由于每张第二图像的内容与角度与对应的第一深度图像像素偏差较小,因此将不同深度图像的配准结果进行融合后所得到的目标图像与第一图像之间的像素偏差也相对较小。
可选的,基于N个不同深度层次下的高清配准图像,高清配准图像与手机图像尺寸一致,可以对N个高清配准图像结果的每个相同位置的像素点进行相加操作,实现N个高清配准图像结果的融合,得到最终的配准结果(即目标图像)。例如,如图7A所示,图7A为本申请实施例提供的一种图像融合的示意图,对高清图像(b)和高清图像(e)的每个相同位置的像素点进行相加操作,得到目标图像。
可选的,可以先提取每张第二目标中的目标物体,然后再将多个目标物体进行融合,得到目标图像。例如,如图7B所示为本申请实施例提供的另一种图像融合的示意图,可先提取每张第二图像中的目标物体,然后对多张目标物体图像的每个相同位置的像素点进行相加操作,实现将多张目标物体图像进行融合,得到目标图像。
方面五、基于目标图像对第一图像进行细节恢复。
具体的,可以将目标图像作为高清参考帧,对第一图像进行细节恢复,得到第三图像,如基于目标图像对建筑物的细节进行恢复,对植物的细节进行恢复,从而能够提升第一图像的图片清晰度。
方面六、在电子设备上显示第三图像。
具体的,在电子设备的显示屏上显示第二用户界面,第二用户界面上显示有第三图像,第三图像为基于目标图像对第一图像进行细节恢复后的图像,第三图像与第一图像相比清晰度更高。
在本申请实施例中,考虑到不同深度层次的图像内容存在视觉偏差,因此可基于第一图像提取出不同深度层次的图像内容,并对每个深度层次的图像内容都进行图像配准(即根据拍摄内容和拍摄角度从图库中为每个深度层次的图像内容都匹配一张高清图像),以获得与每个深度层次的图像内容像素偏差最小的高清图像,最后将多张高清图像进行融合后得到与第一图像所匹配的目标图像(即将目标图像作为第一图像的配准结果),从而降低配准结果与第一图像之间的像素偏差。
以下以电子设备为智能手机为例,并结合实际应用场景对本申请中的图像配准方法进行描述。
S401:智能手机确定第一图像。
其中,关于智能手机的相关描述可以参见对上述图1A和图1B中的电子设备100的描述,此处不再赘述。
其中,智能手机确定第一图像的具体实施方式可以参见上述方面一中的相关描述,此处不再赘述。
S402:智能手机确定第一图像的配准结果(目标图像)。
具体的,智能手机确定第一图像的深度信息;智能手机基于深度信息从第一图像中提取N张第一深度图像;智能手机根据拍摄角度和拍摄内容从目标图库中为每张第一深度图像匹配一张第二图像,得到N张第二图像;智能手机将N张第二图像进行融合得到目标图像。需要说明的是,目标图库可以存储在智能手机本地,也可以存储在云端数据库。
其中,关于智能手机确定第一图像的深度信息和基于深度信息从第一图像中提取N张第一深度图像的具体实施方式可以参见上述方面二中的相关描述,此处不再赘述。
其中,关于智能手机根据拍摄角度和拍摄内容从目标图库中为每张第一深度图像匹配一张第二图像,得到N张第二图像的具体实施方式可以参见上述方面三中的相关描述,此处不再赘述。
其中,关于智能手机将N张第二图像进行融合得到目标图像的具体实施方式可以参见上述方面四中的相关描述,此处不再赘述。
S403:智能手机基于目标图像对第一图像进行细节恢复。
其中,智能手机对第一图像进行细节恢复的具体实施方式可以参见上述方面五中的相关描述,此处不再赘述。
在一些实施例中,智能手机可以在显示屏上显示第三图像,具体可以参见上述方面六中的相关描述,此处不再赘述。
以下以电子设备为云端服务器为例,并结合实际应用场景对本申请中的图像配准方法进行描述。
S501:云端服务器确定第一图像。
在一些实施例中,云端服务器可以接收目标设备(如智能手机)所拍摄的图像,并将其作为第一图像。
S502:云端服务器确定第一图像的配准结果(目标图像)。
其中,云端服务器确定第一图像的配准结果的方法可以与上述智能手机确定第一图像的配准结果的方法一致,此处不再赘述。
S503:云端服务器基于目标图像对第一图像进行细节恢复。
其中,云端服务器基于目标图像对第一图像进行细节恢复的方法可以与上述智能手机基于目标图像对第一图像进行细节恢复的方法一致,此处不再赘述。
接下来,对本申请实施例所基于的具体方法架构进行描述。
参见图8,图8是本申请实施例中的一种图像配准方法的流程示意图,下面将结合附图8并基于上述图像拍摄场景对本申请实施例中的图像配准方法进行描述。需要说明的是,为了更详细的描述本申请实施例中的图像配准方法,本申请在各个流程步骤中描述了相应的执行主体可为上述图1A中的电子设备100,但不代表本申请实施例只能通过所描述的执行主体进行对应的方法流程。
步骤S601:电子设备100确定第一图像的深度信息。
其中,关于电子设备100的相关描述可以参见对上述图1A和图1B中的电子设备100的描述,此处不再赘述。
其中,电子设备100确定上述第一图像的具体实施方式可以参见上述方面一中的相关描述,此处不再赘述。
其中,电子设备100确定上述第一图像的深度信息的具体实施方式可以参见上述方面二中的要点1的相关描述,此处不再赘述。
步骤S602:电子设备100基于深度信息从第一图像中提取N张第一深度图像。
其中,电子设备100基于上述深度信息从上述第一图像中提取N张第一深度图像的具体实施方式可以参见上述方面二中要点2的相关描述,此处不再赘述。
步骤S602中,结合图9,对步骤S602的一种可能的实施方式进行详细阐述。示例性的,如图9所示,图9为本申请实施例提供的另一种图像配准方法的流程示意图,图中将手机拍摄的图像作为第一图像输入到深度估计网络得到可手机深度图;然后,基于聚类算法得到不同深度层次的图像内容;进一步地,基于不同深度层次的图像内容和多帧高清图像(由检索提供),得到不同深度层次的最优配准结果;最后将不同深度层次的最优配准结果进行融合得到与第一图像所匹配的高清图像。
步骤S603:电子设备100从目标图库中为每张第一深度图像匹配一张第二图像,得到N张第二图像。
其中,电子设备100从上述目标图库中为上述第一深度图像匹配第二图像的具体实施方式可以参见上述方面三中的相关描述,在此不再赘述。
步骤S604:电子设备100将N张第二图像进行融合得到目标图像。
其中,电子设备100基于上述N张第二图像得到目标图像的具体实施方式可以参见上述方面四中的相关描述,此处不再赘述。
在一些实施例中,电子设备100将目标图像作为参考帧,对第一图像进行细节恢复。
其中,电子设备100对上述第一图像进行细节恢复的具体实施方式可以参见上述方面五中的相关描述,此处不再赘述。
在一些实施例中,在电子设备100的显示屏上显示第二用户界面,第二用户界面上显示有第三图像,第三图像为基于目标图像对第一图像进行细节恢复后的图像。
其中,电子设备100可以在显示屏上显示第三图像,具体可以参见上述方面六中的相关描述,此处不再赘述。
在本申请实施例中,考虑到不同深度层次的图像内容存在视觉偏差,因此可基于第一图像提取出不同深度层次的图像内容,并对每个深度层次的图像内容都进行图像配准(即根据拍摄内容和拍摄角度从图库中为每个深度层次的图像内容都匹配一张高清图像),以获得与每个深度层次的图像内容像素偏差最小的高清图像,最后将多张高清图像进行融合后得到与第一图像所匹配的目标图像(即将目标图像作为第一图像的配准结果),从而降低配准结果与第一图像之间的像素偏差。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的相关设备。
请参见图10,图10为本申请实施例提供的一种电子设备示意图,该电子设备70,该设备可以包括第一处理单元701、第一获取单元702、第二处理单元703、第三处理单元704、第四处理单元705。其中,
第一处理单元701用于:确定第一图像的深度信息,深度信息包括第一图像上的M个像素点,及M个像素点中每个像素点的深度值,M为大于1的整数;基于深度信息从第一图像中提取N张第一深度图像,其中,N张第一深度图像中的每张第一深度图像中包括对应的第一像素点集合,第一像素点集合中包括第一图像中的多个目标像素点,多个目标像素点之间的深度值的差值在预设范围内,N为大于1的整数;从目标图库中为每张第一深度图像匹配一张第二图像,得到N张第二图像;将N张第二图像进行融合得到目标图像。
其中,关于第一处理单元701确定第一图像的深度信息和基于深度信息从第一图像中提取N张第一深度图像的具体实施方式可以参见上述方面二中的相关描述,此处不再赘述。
其中,关于第一处理单元701从目标图库中为每张第一深度图像匹配一张第二图像的具体实施方式可以参见上述方面三中的相关描述,此处不再赘述。
其中,关于第一处理单元701将N张第二图像进行融合得到目标图像的具体实施方式可以参见上述方面四中的相关描述,此处不再赘述。
其中,第一处理单元701可以为图1A中的电子设备100中的处理器110中的一个处理单元。
在一些实施例中,第一获取单元702,用于获取第一图像,并通过预设算法对第一图像上的M个像素点进行深度值估计得到深度信息,或者通过传感器获取第一图像的深度信息。
其中,第一获取单元702确定上述第一图像的深度信息的具体实施方式可以参见上述方面二中要点1的相关描述,此处不再赘述。
其中,第一获取单元702可以为图1A中的电子设备100中的处理器110中的一个获取单元。
在一些实施例中,第二处理单元703,用于启动电子设备的摄像模组,并在显示屏上显示第一用户界面,第一用户界面上显示有被拍摄画面;当第二处理单元703检测到第一用户操作,响应于第一用户操作,将当前第一用户界面中的被拍摄画面确定为第一图像。
其中,第二处理单元703确定第一图像的具体实施方式可以参见上述对方面一中的相关描述,此处不再赘述。
其中,第二处理单元703可以为图1A中的电子设备100中的处理器110中的一个处理单元;摄像模组可以为图1A中的电子设备100中的3D摄像头模组193;显示屏可以为图1A中的电子设备100中的显示屏194。
在一些实施例中,第三处理单元704,用于将目标图像作为参考帧,对第一图像进行细节恢复。
其中,第三处理单元704对上述第一图像进行细节恢复的具体实施方式可以参见上述方面五中的相关描述,此处不再赘述。
在一些实施例中,第四处理单元705,用于在显示屏上显示第二用户界面,第二用户界面上显示有第三图像,第三图像为基于目标图像对第一图像进行细节恢复后的图像。
其中,第四处理单元705可以在显示屏上显示第三图像,具体可以参见上述方面六中的相关描述,此处不再赘述。
本申请实施例提供一种电子设备,该电子设备中包括处理器,处理器被配置为支持该电子设备实现一种图像配准方法中相应的功能。该电子设备还可以包括存储器,存储器用于与处理器耦合,其保存该电子设备必要的程序指令和数据。该电子设备还可以包括通信接口,用于该电子设备与其他设备或通信网络通信。
本申请实施例提供一种拍照预览装置,该装置具有实现上述一种图像配准方法实际中电子设备行为的功能。上述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。上述硬件或软件包括一个或多个与上述功能相对应的模块。
本申请实施例提供一种计算机设备,包括存储器,处理器以及存储在上述存储器上并可在上述处理器上运行的计算机程序,其特征在于,上述处理器执行上述计算机程序时使得上述计算机设备实现如上述一种图像配准方法中任一可能的实现方式。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述一种图像配准方法中的任一项可能的实现方式中的图像配准方法的任一项可能的实现方式。
本申请提供了一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述一种图像配准方法中的任意一项所述的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本申请各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:U盘、移动硬盘、磁碟、光盘、只读存储器(Read-Only Memory,缩写:ROM)或者随机存取存储器(Random Access Memory,缩写:RAM)等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (18)

1.一种图像配准方法,其特征在于,应用于电子设备,所述方法包括:
确定第一图像的深度信息,所述深度信息包括所述第一图像上的M个像素点,及所述M个像素点中每个像素点的深度值,M为大于1的整数;
基于所述深度信息从所述第一图像中提取N张第一深度图像,其中,所述N张第一深度图像中的每张第一深度图像中包括对应的第一像素点集合,所述第一像素点集合中包括所述第一图像中的多个目标像素点,所述多个目标像素点之间的深度值的差值在预设范围内,N为大于1的整数;
从目标图库中为每张所述第一深度图像匹配一张第二图像,得到N张第二图像;
将所述N张第二图像进行融合得到目标图像。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述第一图像,并通过预设算法对所述第一图像上的所述M个像素点进行深度值估计得到所述深度信息,或者通过传感器获取所述第一图像的所述深度信息。
3.如权利要求1或2所述的方法,其特征在于,所述电子设备包括显示屏和摄像模组,所述方法还包括:
启动所述摄像模组,并在所述显示屏上显示第一用户界面,所述第一用户界面上显示有被拍摄画面;
检测到第一用户操作,响应于所述第一用户操作,将当前所述第一用户界面中的被拍摄画面确定为所述第一图像。
4.如权利要求1-3任意一项所述的方法,其特征在于,所述基于所述深度信息从所述第一图像中提取N张第一深度图像,包括:
基于所述M个像素点各自的深度值,将任意两个像素点的深度值的差值在预设范围内的多个目标像素点划分到一个第一像素点集合中,得到N个第一像素点集合;
基于所述N个第一像素点集合,得到所述N张第一深度图像。
5.如权利要求4所述的方法,其特征在于,所述将任意两个像素点的深度值的差值在预设范围内的多个目标像素点划分到一个第一像素点集合中,包括:
通过聚类算法将所述M个像素点各自的深度值进行聚类,得到N个聚类中心;
针对所述N个聚类中的每个聚类中心,将与所述聚类中心的深度值的差值在预设范围内的多个像素点划分到一个第一像素点集合中。
6.如权利要求1-5任意一项所述的方法,其特征在于,所述根据拍摄角度和拍摄内容从目标图库中为每张所述第一深度图像匹配一张第二图像,得到N张第二图像,包括:
提取所述N张第一深度图像中每张第一深度图像的特征点,分别与所述目标图库中的多张图像进行比较;
将所述目标图库中与每张所述第一深度图像的特征点匹配度最高的图像确定为所匹配的第二图像,得到N张第二图像。
7.如权利要求1-6任意一项所述的方法,其特征在于,所述方法还包括:
将所述目标图像作为参考帧,对所述第一图像进行细节恢复。
8.如权利要求3所述的方法,其特征在于,所述方法还包括:
在所述显示屏上显示第二用户界面,所述第二用户界面上显示有第三图像,所述第三图像为基于所述目标图像对所述第一图像进行细节恢复后的图像。
9.一种电子设备,其特征在于,所述电子设备包括第一处理单元,所述第一处理单元用于:
确定第一图像的深度信息,所述深度信息包括所述第一图像上的M个像素点,及所述M个像素点中每个像素点的深度值,M为大于1的整数;
基于所述深度信息从所述第一图像中提取N张第一深度图像,其中,所述N张第一深度图像中的每张第一深度图像中包括对应的第一像素点集合,所述第一像素点集合中包括所述第一图像中的多个目标像素点,所述多个目标像素点之间的深度值的差值在预设范围内,N为大于1的整数;
从目标图库中为每张所述第一深度图像匹配一张第二图像,得到N张第二图像;
将所述N张第二图像进行融合得到目标图像。
10.如权利要求9所述的设备,其特征在于,所述设备还包括:
第一获取单元,用于获取所述第一图像,并通过预设算法对所述第一图像上的所述M个像素点进行深度值估计得到所述深度信息,或者通过传感器获取所述第一图像的所述深度信息。
11.如权利要求9或10所述的设备,其特征在于,所述设备还包括:
第二处理单元,用于启动所述电子设备的摄像模组,并在所述显示屏上显示第一用户界面,所述第一用户界面上显示有被拍摄画面;
检测到第一用户操作,响应于所述第一用户操作,将当前所述第一用户界面中的被拍摄画面确定为所述第一图像。
12.如权利要求9-11任意一项所述的设备,其特征在于,所述第一处理单元具体用于:
基于所述M个像素点各自的深度值,将任意两个像素点的深度值的差值在预设范围内的多个目标像素点划分到一个第一像素点集合中,得到N个第一像素点集合;
基于所述N个第一像素点集合,得到所述N张第一深度图像。
13.如权利要求12所述的设备,其特征在于,所述第一处理单元具体用于:
通过聚类算法将所述M个像素点各自的深度值进行聚类,得到N个聚类中心;
针对所述N个聚类中的每个聚类中心,将与所述聚类中心的深度值的差值在预设范围内的多个像素点划分到一个第一像素点集合中。
14.如权利要求9-13任意一项所述的设备,其特征在于,所述第一处理单元具体用于:
提取所述N张第一深度图像中每张第一深度图像的特征点,分别与所述目标图库中的多张图像进行比较;
将所述目标图库中与每张所述第一深度图像的特征点匹配度最高的图像确定为所匹配的第二图像,得到N张第二图像。
15.如权利要求9-14任意一项所述的设备,其特征在于,所述设备还包括:
第三处理单元,用于将所述目标图像作为参考帧,对所述第一图像进行细节恢复。
16.如权利要求11所述的设备,其特征在于,所述设备还包括:
第四处理单元,用于在所述显示屏上显示第二用户界面,所述第二用户界面上显示有第三图像,所述第三图像为基于所述目标图像对所述第一图像进行细节恢复后的图像。
17.一种电子设备,包括触控屏,存储器,一个或多个处理器,多个应用程序,以及一个或多个程序;其中,所述一个或多个程序被存储在所述存储器中;其特征在于,所述一个或多个处理器在执行所述一个或多个程序时,使得所述电子设备实现如权利要求1至8任一项的方法。
18.一种计算机存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1至8任一项所述的方法。
CN202210623588.0A 2022-06-02 2022-06-02 一种图像配准方法及相关设备 Pending CN115115679A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210623588.0A CN115115679A (zh) 2022-06-02 2022-06-02 一种图像配准方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210623588.0A CN115115679A (zh) 2022-06-02 2022-06-02 一种图像配准方法及相关设备

Publications (1)

Publication Number Publication Date
CN115115679A true CN115115679A (zh) 2022-09-27

Family

ID=83327226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210623588.0A Pending CN115115679A (zh) 2022-06-02 2022-06-02 一种图像配准方法及相关设备

Country Status (1)

Country Link
CN (1) CN115115679A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115623318A (zh) * 2022-12-20 2023-01-17 荣耀终端有限公司 对焦方法及相关装置
CN117152022A (zh) * 2023-10-25 2023-12-01 荣耀终端有限公司 图像处理方法及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115623318A (zh) * 2022-12-20 2023-01-17 荣耀终端有限公司 对焦方法及相关装置
CN115623318B (zh) * 2022-12-20 2024-04-19 荣耀终端有限公司 对焦方法及相关装置
CN117152022A (zh) * 2023-10-25 2023-12-01 荣耀终端有限公司 图像处理方法及电子设备

Similar Documents

Publication Publication Date Title
CN114679537B (zh) 一种拍摄方法及终端
CN112130742B (zh) 一种移动终端的全屏显示方法及设备
CN109814766B (zh) 一种应用显示方法及电子设备
CN115866121B (zh) 应用界面交互方法、电子设备和计算机可读存储介质
CN111669459B (zh) 键盘显示方法、电子设备和计算机可读存储介质
CN111443884A (zh) 投屏方法、装置和电子设备
CN112887583B (zh) 一种拍摄方法及电子设备
CN111078091A (zh) 分屏显示的处理方法、装置及电子设备
WO2020029306A1 (zh) 一种图像拍摄方法及电子设备
CN110471606B (zh) 输入方法及电子设备
CN113994317A (zh) 一种用户界面布局方法及电子设备
CN109857401B (zh) 电子设备的显示方法、图形用户界面及电子设备
CN113949803B (zh) 拍照方法及电子设备
CN115115679A (zh) 一种图像配准方法及相关设备
CN113961157A (zh) 显示交互系统、显示方法及设备
CN113986070B (zh) 一种应用卡片的快速查看方法及电子设备
CN115619858A (zh) 一种物体重建方法以及相关设备
CN114089932A (zh) 多屏显示方法、装置、终端设备及存储介质
WO2022262475A1 (zh) 拍摄方法、图形用户界面及电子设备
CN112150499A (zh) 图像处理方法及相关装置
CN115967851A (zh) 快速拍照方法、电子设备及计算机可读存储介质
CN116048358B (zh) 悬浮球的控制方法和相关装置
CN114283195B (zh) 生成动态图像的方法、电子设备及可读存储介质
CN114911400A (zh) 分享图片的方法和电子设备
CN113542574A (zh) 变焦下的拍摄预览方法、终端、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination