CN109690557A - 基于景深估计的图像调节 - Google Patents

基于景深估计的图像调节 Download PDF

Info

Publication number
CN109690557A
CN109690557A CN201780054493.9A CN201780054493A CN109690557A CN 109690557 A CN109690557 A CN 109690557A CN 201780054493 A CN201780054493 A CN 201780054493A CN 109690557 A CN109690557 A CN 109690557A
Authority
CN
China
Prior art keywords
depth
interest
area
content
foundation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780054493.9A
Other languages
English (en)
Other versions
CN109690557B (zh
Inventor
C·莫尔加德
P·M·胡渤
Z·阿塔尔
I·沃芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Computer Inc filed Critical Apple Computer Inc
Publication of CN109690557A publication Critical patent/CN109690557A/zh
Application granted granted Critical
Publication of CN109690557B publication Critical patent/CN109690557B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Geometry (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明描述了用于图像数据的自动分析和滤波的技术。分析图像数据以识别图像内容内的感兴趣区域(ROI)。图像数据还可具有应用于其中的内容的深度估计。可将ROI中的一个或多个指定为具有基础深度,该基础深度表示可与其他内容的深度进行比较的图像内容的深度。此外,在ROI的空间区域内的图像内容的深度可被设置为一致的值,而与可能已从其他来源分配的深度估计无关。然后,基于图像内容中的与基础深度相比的相对深度以及任选地基于它们与指定ROI的空间距离,图像内容的其他元素可为梯度中的分配的内容调节值。可基于内容调节值来调节图像内容。

Description

基于景深估计的图像调节
相关申请的交叉引用
本专利申请得益于2016年9月6日提交的、名称为“Use of Facial Landmarks inDepth of Field Applications”的申请No.62/384,029的优先权,其公开内容全文以引用方式并入本文。
背景技术
许多现代消费电子产品具有捕获和处理图像数据的能力。例如,膝上型计算机,平板电脑,智能电话和个人媒体设备可具有捕获图像数据的相机和处理图像数据的图像编辑应用程序。图像编辑应用程序可提供用于修剪和/或旋转图像内容并且还例如通过改变图像亮度,颜色内容,锐度等来改变图像内容的工具。
一些图像编辑应用程序试图自主改变图像特征,从而减轻人类操作员选择和应用图像编辑工具的负担。一种此类自动化操作涉及滤波。图像编辑应用程序可尝试基于对部分特征的评估来识别要滤波的部分。然而,自动分析工具有时会产生“正误识”。例如,分析工具可分配图像的第一部分用于相对负担重的滤波但是分配图像的第二部分用于极少或无滤波。当这些滤波和未滤波部分实际上属于图像的公共元素诸如人脸时,滤波中的这些差异导致不期望的伪影。
附图说明
图1是根据本公开的实施方案的成像系统的框图。
图2示出了根据本公开的实施方案的一种方法。
图3(A)示出了可实现本公开的实施方案的示例性输入图像。
图3(B)示出了根据本公开的实施方案的ROI识别的操作。
图3(C)示出了根据本公开的实施方案的深度映射。
图3(D)示出了根据本公开的实施方案的参数强度的映射。
图3(E)为示出根据本公开的实施方案的示例性参数强度的曲线图。
图4示出了根据本公开的另一实施方案的一种方法。
图5(A),图5(B)和图5(C)中的每一个示出了可实现本公开的实施方案的示例性输入图像。
图6示出了根据本公开的另一实施方案的方法600。
图7(A)示出了可实现本公开的实施方案的示例性输入图像。
图7(B)为示出沿图7(A)中的线b-b的内容的理想化深度估计的曲线图。
图7(C)为示出可根据本公开的实施方案应用的示例性滤波器强度的曲线图。
图7(D)示出了根据本公开的实施方案生成的示例性感兴趣区域。
图7(E)为示出可根据本公开的实施方案应用的示例性滤波器强度的曲线图。
图8(A)和图8(B)各自示出了可由本公开的实施方案处理的示例性感兴趣区域。
图9示出了适合与本公开的实施方案一起使用的示例性计算机系统。
具体实施方式
本公开的实施方案提供用于图像数据的自动分析和滤波的技术。根据实施方案,分析图像数据以识别图像内容内的ROI。图像数据还可具有应用于其中的内容的深度估计。可将ROI中的一个或多个指定为具有基础深度,该基础深度代表可与其他内容的深度进行比较的图像内容的深度。此外,在ROI的空间区域内的图像内容的深度可被设置为一致的值,而与可能已从其他来源分配的深度估计无关。然后,可基于图像内容中的与基础深度相比的相对深度以及任选地基于它们与指定ROI的空间距离,图像内容的其他元素可为梯度中的分配的内容调节值。
上述技术预期降低正误识的可能性,如果常见面部的不同元素例如一只眼睛或两个眼睛或鼻子被分配与相同面部的其他元素不同的深度并且根据不同参数进行调节,则可能发生这种可能性。
在一个实施方案中,可对具有比基础深度较浅深度的图像内容和具有比基础深度较大的深度的图像内容两者应用参数调节。
在另一实施方案中,可从图像数据检测多个ROI,并且每个ROI的深度可被指定为相应的基础深度。内容调节参数可基于它们的深度和基础深度之间的差异而被分配给其他图像内容。
图1是根据本公开的实施方案的成像系统100的框图。系统100可包括捕获表示本地环境的图像数据的一个或多个相机110;以及对由一个或多个相机110提供的图像数据执行处理的图像处理器120。
一个或多个相机110可输出图像数据作为帧序列。图像处理器120可接收识别图像捕获的时刻的用户输入以及可响应于用户输入选择用作要捕获的图像的一个或多个帧。用户输入还可识别要使用的图像捕获模式,例如静态图像捕获,时间流逝捕获,立体镜图像捕获,视频捕获,慢运动视频捕获等,其中一些可能需要图像处理器120选择从一个或多个相机110输出的多个帧作为捕获图像。
图像处理器120可将帧输出至设备内的其他“图像接收器”部件130。例如,帧可输出至显示器132或存储在存储器134中。帧可输出至编码器136以进行压缩,并且最终传输至另一设备(未示出)。帧还可由在设备上执行的应用程序138(诸如图像编辑器或游戏应用程序)消耗。
图像处理器120可对所选图像执行内容调节操作,如下文所述。例如,与图像捕获相关联的帧可被滤波,它们可具有调节的亮度,它们可具有调整的颜色饱和度和/或色调,和/或它们可与来自一个或多个其他图像的内容混合。它并不需要图像处理器120向接收的所有帧或者输入到图像接收器130的所有帧应用此类滤波。例如,在图像捕获之前执行的图像组合操作期间,避免对输出到显示器132的帧执行滤波操作可能是方便的。当图像被组成并且用户命令设备执行图像捕获时,图像处理器120可对与图像捕获事件相关联的一个或多个图像执行其调节操作。
在一个实施方案中,一个或多个相机110和图像处理器120可被提供在处理设备140内,诸如智能电话,平板电脑,膝上型计算机,台式计算机,便携式媒体播放器等。处理设备140可具有其他部件,诸如用户输入设备150,其可为触摸屏控制器,控制按钮等。
图2示出了根据本公开的一个实施方案的方法200。该方法可从待处理的帧的图像内容识别感兴趣区域(ROI)(框210)。方法200可将深度分配给帧内的图像内容(框220)。方法200可将基础深度设置在与所识别的ROI相关联的深度(框230)。方法200可基于其各自深度与分配给ROI的基础深度之间的差异来对图像内容的其他区域施加参数梯度(框240)。最后,方法200可根据参数调节执行图像调节(框250)。
ROI识别(框210)可以多种方式发生。在第一实施方案中,可基于应用于图像内容的面部识别过程或身体识别过程执行ROI识别。ROI识别可通过具有预先确定的着色的图像的识别来执行,例如先前已注册为对应于皮肤色调的颜色。另选地,ROI识别可基于图像内容在图像的时间连续序列上的相对移动来执行。例如,图像的前景中的内容往往在图像内容中表现出比相同图像的背景内容更大的总体运动,无论由于在图像捕获期间对象本身的移动或由于执行图像捕获的相机的移动。
深度分配(框220)可以多种方式发生。在一些实施方案中,深度分配可由图像内容本身的分析来进行。例如,深度估计可基于图像内容在图像的时间连续序列上的相对移动来执行。例如,图像的前景中的内容往往在图像内容中表现出比相同图像的背景内容更大的总体运动,无论由于在图像捕获期间对象本身的移动或由于执行图像捕获的相机的移动。深度估计还可通过对图像内容中模糊量的评估来执行。例如,可将焦点中的图像内容识别为位于对应于执行图像捕获的相机的焦点范围的深度处,而不在焦点中的图像内容可被识别为位于其他深度处。
在涉及立体相机的另一个实施方案中,可基于由立体相机输出的图像生成的视差图来进行深度分配。例如,右眼图像的图像内容可与左眼图像的内容进行比较,并且可针对相应图像中的每个像素位置计算视差。视差可表示用于估计深度值的映射。
在其他实施方案中,可从图像内容外部的数据源进行深度分配。当与具有可移动透镜系统的相机一起使用时,深度分配可来源于在自动对焦操作期间施加的透镜位置,这趋于对应于来自相机的前景图像的深度。深度分配可源自深度相机160(图1),例如,结构光或飞行时间相机。
基础深度可以设置(框230)在与所选ROI相关联的深度处。基础深度可表示将被赋予基础水平的图像调节(可能无)的图像内容的深度。因此,当应用模糊滤波时,可选择ROI以具有滤波后由方法200输出的图像内容中的任何图像内容的最清晰内容,而与以另外方式可能已应用于框220中的ROI内的内容的深度估计无关。类似地,当应用亮度调节时,可选择ROI以具有滤波后由方法200输出的任何图像内容的最亮内容,并且可使其他图像内容变暗。此外,当施加色彩饱和度调节时,可以选择ROI以具有滤波后由方法200输出的任何图像内容的最强颜色内容,并且可使得其他图像内容较不饱和(例如,更黑和更白)。当施加色彩色调调节时,可基于图像的深度来改变图像的颜色内容(例如,蓝色可在各种深度处转换为红色)。此外,当应用混合调节时,可基于内容与基础深度比较的深度,将混合权重分配给内容;混合权重可确定来自另一图像的内容可与正在调节的图像的内容混合的相对强度。当图像内容中存在多个ROI时,可以多种方式来执行对其施加基础深度的ROI的选择,诸如通过用户选择,基于对象类型的ROI的优先级划分(例如,面部可优先于其他类型的对象),如框220中确定的ROI的深度估计等。
可以采用ROI的基础水平的调节作为参考,以渐进方式为图像内容的其他区域定义参数调节(框240)。在其中ROI没有模糊的示例中,可限定模糊梯度,该模糊梯度基于其与ROI的距离而对图像内容的区域施加较重水平的模糊。因此,落在ROI之外但与ROI相邻的图像内容可被赋予比与ROI相距更远的图像内容更浅的模糊水平。因此,方法200可开发将各种水平的模糊分配给图像的整个空间区域的映射。
还可基于与基础深度相比较的那些区域的相关深度来为其他区域定义参数调节。例如,当ROI选自前台内容时,可基于其相对深度为空间上邻近ROI的背景内容分配调节参数。如果图像包含处于浅深度处的前台内容(ROI),中间深度处的“中间层”内容和大深度处的背景内容,则即使中间层内容在空间上距ROI比背景内容更远,也可基于其深度为中间层内容分配参数调节。
并且,当然,可基于区域与ROI的空间距离的混合及其与ROI的基础深度相比较的深度来将参数调节分配给其他区域。
另外,可以在ROI的边缘区域处分配梯度水平,在该边缘区域中,梯度水平与其他图像元素交界。
可基于分配的调节参数水平将图像调节应用于图像(框250)。例如,可使用基于框240中分配的参数所分配的设置,由模糊滤波器执行模糊。类似地,可基于在框240中分配的参数水平来应用亮度调节,色彩饱和度/色调调节,混合调节等。
图3示出了图2的方法200对示例性图像数据的操作。在该示例中,图3(A)示出了方法200可在其上操作的示例性输入图像。图3(B)示出了ROI识别的操作,在该示例中,该操作通过执行面部检测来进行。图3(C)示出了表示应用于输入图像数据的深度估计的深度图。图3(D)示出了表示要应用于图像数据的图像调节参数的映射。图3(E)为示出可沿图3(D)中的线e-e分配给图像数据的示例性权重的曲线图。
如图3(B)中所示,面部检测可从代表人脸特征的图像内容内检测预先确定的面部“界标”。例如,面部检测可识别图像数据内代表眼睛(由数据点310,315表示),鼻子320,嘴325,眉毛330,335和头部的轮廓的内容。面部检测还可测量这些面部特征的特征以确定它们在图像数据中的尺寸。该方法可从图像内容识别ROI,如图3(A)所示。
如图3(C)所示,深度估计可将前景与图像数据中的背景元素区分开。然而,深度估计可为深度图中的不同前景元素分配不同深度。例如,分别对应于围绕受试者的眼睛,鼻子,嘴和脸颊的结构的元素311,312,313和314显示具有不同深度。如果仅基于深度分配来施加滤波参数,则可为这些元素311-314分配与面部数据的其他部分不同的滤波强度,这可在所得图像数据中引入滤波伪影。
如所讨论的,图3(D)示出了可应用于图像数据的图像调节参数。在图3(C)中,暗色表示要应用于数据的最小调节水平,较浅的颜色表示要应用于图像数据的较重调节量。在实施方案中,与ROI相关联的图像内容可被赋予较轻的调节设置(在一个实施方案中,不进行调节),而与其中对内容进行的深度分配无关。然后,可分配参数梯度,其在深度不同于ROI内容的深度的情况下提供对图像内容的增大水平的调节。示例性重量的曲线图在图3(E)示出。
图4示出了根据本公开的另一实施方案的方法400。根据该实施方案,方法400可将深度分配给输入内容(框410)。方法400可从输入图像识别一个或多个ROI(框420)。方法400可确定是否接收到用户选择(框430)。如果接收到用户选择,则方法400可确定ROI是否存在于与用户输入相关联的图像数据的区域内(框440)。如果在与用户输入相关联的图像数据的区域内存在ROI,则方法400可根据用户评论的区域中的ROI内的图像内容的深度来为所选择的ROI分配基础深度(框450)。所选ROI内的全部内容可以被分配共同深度值作为基础深度。
如果未接收到用户选择(框430),或者如果在用户选择的区域内不存在ROI(框440),则方法400可根据由默认技术诸如通过内容深度,对象类型分类等所选择的ROI来设置基础深度(框460)。然后,方法400可在除基础深度之外的深度处对图像内容应用参数调节(框470),并且其可根据框470中的参数分配来执行图像调节(框480)。
在一个实施方案中,未选择的ROI可具有分配给它们的受约束深度(框490)。即,未选择的ROI的图像内容可具有分配给它们的共同深度,而与在框410处可分配给ROI内容的深度无关。这样,在框470处分配参数调节时,未选择的ROI的图像内容可在ROI内容上应用均匀水平的调节。并且,因为ROI未被选择,所以在框470的操作期间,基于未选择ROI的深度和ROI的基础深度之间的差异,它们可具有分配给它们的图像调节水平。
深度分配(框410),ROI识别(框420),基础深度分配(框450,460),参数梯度分配(框470)和图像调节(框480)可根据上文结合图2所述的任何技术来执行。
图5示出了根据图4的方法的示例性图像数据的处理。图5(A)示出了从其识别两个ROI,ROI1和ROI2的示例性输入图像。图5(A)示出输入到屏幕上邻近ROI2的区域中的用户输入(触摸焦点命令,或“TTF”)。因此,该方法可将ROI2识别为具有要分配给基础深度的数据(图5(B))。
当图像数据的相应深度不同于ROI2的基础深度(图5(C))时,可将参数调节分配给图像数据的其余部分。这样,可对ROI1的图像内容和其他图像内容进行各种程度的图像调节。
注意到ROI1的图像内容可能比ROI2的图像内容具有较浅深度。在不存在触摸焦点命令的情况下,如果默认选择过程将内容深度优先于其他因素,则基础深度可设置在ROI1的图像内容的深度处。在这种情况下,其他图像内容(包括ROI2的图像内容)将由于其深度不同于ROI1的深度而被调整。因此,图4的实施方案提供对图像内容内的基础深度的分配的用户控制。
框490的操作(图4)可使得未选择的ROI—在这里,ROI1—被分配在ROI所占用的空间区域上的共同深度。以这种方式,如果框410中的深度分配(图4)使得ROI1的不同部分分配给显著不同的深度,例如,一些部分具有相对较浅深度,而其它部分具有接近深度ROI2的深度以及另外的其它部分具有超过ROI2的深度,则可在ROI1上分配不同水平的图像调节。当将共同深度分配给ROI1的图像数据时,其可基于ROI1和所选择的ROI(ROI2)之间的深度差异而导致对ROI1施加均匀水平的滤波。
图6示出了根据本公开的另一实施方案的方法600。根据该实施方案,方法600可将深度分配给图像数据(框610)。方法600可从输入图像识别一个或多个ROI(框615),并且可确定是否检测到多个ROI(框620)。如果检测到多个ROI,则方法600可设置多个基础深度,每个基础深度在分别分配给ROI的深度处(框625)。如果未检测到多个ROI,则方法600可根据ROI的深度来设置基础深度(框630)。方法600可基于在框625或框630中分配的其他内容和一个或多个基础深度之间的深度差异来对其他图像内容应用参数调节。然后,方法600可根据框635中分配的参数来执行图像调节(框640)。
在另一个实施方案中,当分配多个基础深度(框625)时,方法600可在ROI周围生长边界区域(框645)。然后,方法600可在边界区域内以第一速率施加参数调节(框655),并且其可在边界区域外以第二速率施加参数调节(框655)。方法600可前进到框640并根据分配的参数水平执行图像调节。
深度分配(框610),ROI识别(框615),基础深度分配(框625,630),和图像调节(框640)可根据上文结合图2所述的任何技术来执行。
图7示出了根据图6的方法的示例性图像数据的处理。图7(A)示出了从其识别两个ROI,ROI1和ROI2的示例性输入图像。图7(B)为示出沿图7(A)中的线b-b的内容的理想化深度估计的曲线图。在实际中,深度估计数据可能将包括来自上述正误识的明显噪音伪影;此类伪影未在图7(B)中示出。
图7(C)示出可沿图7(A)中的b-b线分配给图像内容的一组示例性模糊滤波器设置。如图所示,框625和630的操作(ROI1和ROI2的数据可分配图像中所有数据的最小调整水平,并且其他图像区域的数据可根据它们的深度和ROI的深度之间的差值分配调节参数设置。尽管其深度差异,ROI的数据仍可被分配共同调节水平,如图7(B)所示。
图7(D)示出了生成的连接ROI的示例性边界区域BR。在框645-655的操作期间,边界区域BR内的图像数据可根据其深度被分配第一水平的参数调节,而边界区域外的图像数据可被分配第二水平的参数调节。在图像数据深度偏离分配给ROI的基础深度SD1,SD2时,可施加梯度。这样,即使背景图像数据具有与边界区域内的图像数据类似的深度值,ROI1与ROI2之间的空间区域中的图像数据的区域可比从任一ROI进一步移除的背景图像数据更低的调节水平。
在另一个实施方案中(未示出),可将多个ROI的深度设置为单个共同基础深度,而与从图像分析中分配给ROI的图像内容的深度无关。考虑图7(A)的ROI,例如,其具有从图像分析中如图7(B)所示分配的深度估计。ROI1和ROI2可被分配单一的,共同的深度,该深度被设置为图像的基础深度。例如,虽然ROI2的图像分析可导致其图像数据被分配大于ROI1的深度的深度,但是ROI2的深度可被重置为等于ROI1的深度并且该共同深度值可被分配为基础深度。然后,可基于图像数据和图像的单个基础深度之间的深度差异来将参数调节分配给其他图像数据。这样,可参考单个基础深度而不是多个基础深度来分配梯度,如前述实施方案中的一些所述。
前述讨论已将图像调节描述为在不同于基础深度的深度处以增大水平应用于图像内容的技术。例如,讨论已假定基础深度处的图像内容不会发生滤波,亮度改变,颜色改变和/或混合,但此类调节将在不同于基础深度的位置和/或深度处以增大水平应用。这种讨论仅是示例性的。其他实施方案允许在基础深度处的图像内容的最强水平上应用图像调节,然后降低其他深度和/或其他位置处的水平。例如,亮度増强可以最强水平以基础深度施加,然后可在其他深度和/或其他位置降低増强水平。另选地,可对ROI的内容施加最强水平的混合,以实现“掩模”效应;ROI数据可替换为来自外部源的另选内容来将ROI内容从图像屏蔽,以及可基于其估计深度以一个或多个减小水平来应用与其他内容的混合。
本公开的原理不限于上述具体示例。除了模糊,亮度改变,色彩调节和/或混合之外,图像调节技术可包括空间上采样或下采样等。并且,当然,本公开的原理允许在单个图像上应用多个滤波器,每个滤波器具有基于相对于ROI的内容深度和/或位置及其基础深度分配的参数梯度的它们自己的选择。
在一个实施方案中,可基于ROI的一个或多个特征来分配参数梯度。例如,在基于面部检测执行ROI检测的情况下,如果面部被检测为完全存在于图像内容中(例如,面部面向相机),或者如果面部被检测为部分存在于图像内容中(例如,面部为完全或部分轮廓),则可分配不同的梯度。在另一种情况下,可基于所检测的ROI的选定特征(例如,眼睛-鼻子分开距离,面部尺寸等)来施加参数梯度。
在一些情况下,可基于ROI的取向以不同方式施加梯度。例如,如图8所示,当ROI识别基于面部检测时,ROI识别过程也可检测ROI在图像内容中的取向。在图8(A)的示例中,检测出的面部被识别为具有与图像内容的竖直方向对齐的长轴。然而,在图8(B)中,检测出的面部具有相对于竖直方向旋转角度θ的长轴。梯度可基于其取向沿ROI以定向特定方式施加,以改变将施加的图像调节的量。
在图8(A)和图8(B)所示的示例中,梯度可沿ROI的长轴以不同的方式施加。例如,可沿对应于面部的下部的轴的部分施加梯度以减小图像调节的量。在该示例中,当ROI表示例如具有胡须的面部时,梯度的这种管理可提供更好的调节结果。
在实施方案中,本文所述的技术可由计算机系统的中央处理器执行。图9示出了可执行此类技术的示例性计算机系统900。计算机系统900可包括中央处理器910,一个或多个相机920,以及以彼此通信地提供的存储器930。相机920可执行图像捕获,并且可将捕获的图像数据存储在存储器930中。可选地,设备还可根据需要包括接收器部件,诸如显示器940和编码器950。
中央处理器910可读取并执行存储在存储器930中的各种程序指令,该程序指令定义系统900的操作系统912和各种应用914.1-914.N。程序指令可根据本文所述的技术执行图像滤波。在执行这些程序指令时,中央处理器910可从存储器930读取由相机920产生的图像数据,并且其可执行如上文所述的ROI检测,深度估计和滤波。
如图所示,存储器930可存储程序指令,该程序指令当被执行时使得处理器执行上文所述的技术。存储器930可在基于电、磁和/或光学的存储介质上存储程序指令。
可以多种具体实施提供图像处理器120(图1)和中央处理器910(图9)。它们可实施在集成电路,诸如专用集成电路、现场可编程门阵列和/或数字信号处理器和/或通用处理器中。
本文具体示出和/或描述了本公开的若干实施方案。然而,应当理解,在不脱离本公开的实质和预期范围的情况下,本公开的教导内容可在其他具体实施中找到。

Claims (34)

1.一种方法,包括:
对图像执行深度估计,
识别所述图像内的感兴趣区域,
将基础深度分配给所述感兴趣区域内的图像内容,
基于该内容和所述基础深度之间的深度比较来将调节参数强度分配给所述图像内容;以及
根据所分配的参数强度调节所述图像。
2.根据权利要求1所述的方法,其中基于每个内容元素的位置与所述感兴趣区域的位置的比较来进一步分配调节参数强度。
3.根据权利要求1所述的方法,其中所述调节为模糊滤波,并且所述基础深度处的内容对所述图像具有最低强度滤波。
4.根据权利要求1所述的方法,还包括,在所述调节之前,将如下参数强度分配给所述感兴趣区域的边缘部分,该参数强度不同于分配给所述感兴趣区域的其他部分的参数强度。
5.根据权利要求1所述的方法,还包括,
检测所述感兴趣区域的取向,以及
在所述调节之前,基于所述感兴趣区域的所检测到的图像内容内取向来将不同参数强度分配给所述感兴趣区域的不同部分。
6.根据权利要求1所述的方法,其中所述调节为亮度调节。
7.根据权利要求1所述的方法,其中所述调节为颜色饱和度调节。
8.根据权利要求1所述的方法,其中所述调节为颜色色调调节。
9.根据权利要求1所述的方法,其中所述调节为另一图像与所述图像的混合。
10.根据权利要求1所述的方法,其中所述深度估计从图像内容的分析得出。
11.根据权利要求1所述的方法,其中当识别多个感兴趣区域时,将共同基础深度分配给所述多个感兴趣区域。
12.根据权利要求1所述的方法,其中当识别多个感兴趣区域时,将基础深度分别分配给感兴趣区域中的每一个,并且基于所述图像内容的深度与多个基础深度的比较来分配滤波强度。
13.根据权利要求1所述的方法,其中当识别多个感兴趣区域时,根据选择协议将基础深度分配给感兴趣区域中的一个。
14.根据权利要求13所述的方法,其中所述选择协议响应于用户输入来选择所述一个感兴趣区域。
15.根据权利要求13所述的方法,其中所述选择协议基于感兴趣区域的类型中的优先级来选择所述一个感兴趣区域。
16.根据权利要求13所述的方法,其中所述选择协议基于由所述深度估计确定的所述感兴趣区域内的内容深度中的优先级来选择所述一个感兴趣区域。
17.根据权利要求1所述的方法,其中所述感兴趣区域由面部检测识别。
18.根据权利要求17所述的方法,其中所述参数强度被分配为沿所检测的面部的轴线的梯度。
19.一种设备,包括:
相机,和
图像处理器,所述图像处理器:
对由所述相机输出的图像执行深度估计,
识别所述图像内的感兴趣区域;
将基础深度分配给所述感兴趣区域内的图像内容,
基于所述内容和所述基础深度之间的深度比较来将参数强度分配给所述图像内容;以及
根据所分配的参数强度调节所述图像。
20.根据权利要求17所述的设备,其中所述图像处理器基于每个内容元素的位置与所述感兴趣区域的位置的比较来分配调节参数强度。
21.根据权利要求1所述的方法,其中所述调节为模糊滤波。
22.根据权利要求17所述的设备,其中,在所述调节之前,所述图像处理器将如下参数强度分配给所述感兴趣区域的边缘部分,该参数强度不同于分配给所述感兴趣区域的其他部分的参数强度。
23.根据权利要求17所述的设备,其中所述图像处理器还:
检测所述感兴趣区域的取向,以及
在所述调节之前,基于所述感兴趣区域的所检测到的图像内容内取向来将不同参数强度分配给所述感兴趣区域的不同部分。
24.根据权利要求17所述的设备,其中,当识别多个感兴趣区域时,所述图像处理器将共同基础深度分配给所述多个感兴趣区域。
25.根据权利要求17所述的设备,其中,当识别多个感兴趣区域时,所述图像处理器:
将相应的基础深度分配给所述图像的感兴趣区域,以及
基于所述图像的其他内容的深度与多个基础深度的比较来将参数强度分配给所述其他内容。
26.根据权利要求17所述的设备,其中,当识别多个感兴趣区域时,所述图像处理器根据选择协议将基础深度分配给感兴趣区域中的一个。
27.根据权利要求26所述的设备,还包括用户输入设备,其中所述选择协议响应于用户输入来选择所述一个感兴趣区域。
28.根据权利要求26所述的设备,其中所述选择协议基于感兴趣区域的类型中的优先级来选择所述一个感兴趣区域。
29.根据权利要求26所述的设备,其中所述选择协议基于由所述深度估计确定的感兴趣区域内的内容深度中的优先级来选择所述一个感兴趣区域。
30.一种存储程序指令的计算机可读存储介质,所述程序指令当由处理设备执行时,使得该设备:
对图像执行深度估计,
识别所述图像内的感兴趣区域,
将基础深度分配给所述感兴趣区域内的图像内容,
基于该内容和所述基础深度之间的深度比较来将调节参数强度分配给所述图像内容;以及
根据所分配的参数强度对所述图像进行滤波。
31.根据权利要求30所述的存储介质,其中所述程序指令还使得所述处理设备,在调节之前,将如下参数强度分配给所述感兴趣区域的边缘部分,该参数强度不同于分配给所述感兴趣区域的其他部分的参数强度。
32.根据权利要求30所述的存储介质,其中,当识别多个感兴趣区域时,所述程序指令使得所述处理设备将共同基础深度分配给所述多个感兴趣区域。
33.根据权利要求30所述的存储介质,其中,当识别多个感兴趣区域时,所述程序指令使得所述处理设备:
将相应的基础深度分配给感兴趣区域,以及
基于所述图像的其他内容的深度与多个基础深度的比较来将参数强度分配给所述其他内容。
34.根据权利要求30所述的存储介质,其中,当识别多个感兴趣区域时,所述程序指令使得所述处理设备根据选择协议将基础深度分配给感兴趣区域中的一个。
CN201780054493.9A 2016-09-06 2017-09-06 基于景深估计的图像调节 Active CN109690557B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662384029P 2016-09-06 2016-09-06
US62/384,029 2016-09-06
PCT/US2017/050269 WO2018048895A1 (en) 2016-09-06 2017-09-06 Image adjustments based on depth of field estimations

Publications (2)

Publication Number Publication Date
CN109690557A true CN109690557A (zh) 2019-04-26
CN109690557B CN109690557B (zh) 2023-06-13

Family

ID=59966829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780054493.9A Active CN109690557B (zh) 2016-09-06 2017-09-06 基于景深估计的图像调节

Country Status (3)

Country Link
US (1) US10616471B2 (zh)
CN (1) CN109690557B (zh)
WO (1) WO2018048895A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102390184B1 (ko) * 2017-04-26 2022-04-25 삼성전자주식회사 전자 장치 및 전자 장치의 영상 표시 방법
US11412194B2 (en) * 2018-08-17 2022-08-09 Dana Comradd Method and system for employing depth perception to alter projected images on various surfaces
US11120528B1 (en) 2018-09-11 2021-09-14 Apple Inc. Artificial aperture adjustment for synthetic depth of field rendering

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100021064A1 (en) * 2008-07-23 2010-01-28 Samsung Digital Imaging Co., Ltd. Image processing method and apparatus, and digital photographing apparatus using the same
CN102509074A (zh) * 2011-10-18 2012-06-20 Tcl集团股份有限公司 一种目标识别方法和设备
CN103208006A (zh) * 2012-01-17 2013-07-17 株式会社理光 基于深度图像序列的对象运动模式识别方法和设备
US20140211045A1 (en) * 2013-01-31 2014-07-31 Canon Kabushiki Kaisha Image processing apparatus and image pickup apparatus
EP2768213A1 (en) * 2013-02-19 2014-08-20 BlackBerry Limited Method and system for generating shallow depth of field effect
US20150016693A1 (en) * 2013-07-11 2015-01-15 Motorola Mobility Llc Method and Apparatus for Prioritizing Image Quality of a Particular Subject within an Image
US20160110623A1 (en) * 2014-10-20 2016-04-21 Samsung Sds Co., Ltd. Method and apparatus for setting region of interest
AU2014280872A1 (en) * 2014-12-22 2016-07-07 Canon Kabushiki Kaisha Multiscale depth estimation using depth from defocus

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8098904B2 (en) * 2008-03-31 2012-01-17 Google Inc. Automatic face detection and identity masking in images, and applications thereof
EP2485495A3 (en) 2011-02-03 2013-08-28 Broadcom Corporation Method and system for creating a 3D video from a monoscopic 2D video and corresponding depth information
US8824821B2 (en) 2011-03-28 2014-09-02 Sony Corporation Method and apparatus for performing user inspired visual effects rendering on an image
US20140176745A1 (en) * 2012-12-21 2014-06-26 Nvidia Corporation Approach for camera control
US9497448B2 (en) * 2012-12-31 2016-11-15 Lg Display Co., Ltd. Image processing method of transparent display apparatus and apparatus thereof
WO2014165244A1 (en) * 2013-03-13 2014-10-09 Pelican Imaging Corporation Systems and methods for synthesizing images from image data captured by an array camera using restricted depth of field depth maps in which depth estimation precision varies
US9445073B2 (en) 2013-08-06 2016-09-13 Htc Corporation Image processing methods and systems in accordance with depth information
US9876964B2 (en) 2014-05-29 2018-01-23 Apple Inc. Video coding with composition and quality adaptation based on depth derivations
US20170127039A1 (en) * 2015-11-02 2017-05-04 Mediatek Inc. Ultrasonic proximity detection system
US10003732B2 (en) * 2016-02-25 2018-06-19 Foodim Ltd Depth of field processing

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100021064A1 (en) * 2008-07-23 2010-01-28 Samsung Digital Imaging Co., Ltd. Image processing method and apparatus, and digital photographing apparatus using the same
CN102509074A (zh) * 2011-10-18 2012-06-20 Tcl集团股份有限公司 一种目标识别方法和设备
CN103208006A (zh) * 2012-01-17 2013-07-17 株式会社理光 基于深度图像序列的对象运动模式识别方法和设备
US20140211045A1 (en) * 2013-01-31 2014-07-31 Canon Kabushiki Kaisha Image processing apparatus and image pickup apparatus
EP2768213A1 (en) * 2013-02-19 2014-08-20 BlackBerry Limited Method and system for generating shallow depth of field effect
US20150016693A1 (en) * 2013-07-11 2015-01-15 Motorola Mobility Llc Method and Apparatus for Prioritizing Image Quality of a Particular Subject within an Image
US20160110623A1 (en) * 2014-10-20 2016-04-21 Samsung Sds Co., Ltd. Method and apparatus for setting region of interest
AU2014280872A1 (en) * 2014-12-22 2016-07-07 Canon Kabushiki Kaisha Multiscale depth estimation using depth from defocus

Also Published As

Publication number Publication date
US10616471B2 (en) 2020-04-07
CN109690557B (zh) 2023-06-13
US20180070007A1 (en) 2018-03-08
WO2018048895A1 (en) 2018-03-15

Similar Documents

Publication Publication Date Title
CN105323425B (zh) 融合图像系统中的场景运动校正
US9332190B2 (en) Image processing apparatus and image processing method
US9036072B2 (en) Image processing apparatus and image processing method
CN106971165B (zh) 一种滤镜的实现方法及装置
JP4396430B2 (ja) 視線誘導情報生成システムおよび視線誘導情報生成プログラム、並びに視線誘導情報生成方法
CN104486537B (zh) 光场采集控制方法和装置
US10182185B2 (en) Image generation device, image generation method, recording medium, and method for generating an in-focus image based on feature points
CN104205801A (zh) 用于使成像装置自动聚焦的方法和设备
KR20160021607A (ko) 배경 화면을 디스플레이하는 방법 및 장치
CN106598257A (zh) 基于移动终端的阅读控制方法及装置
KR20160144971A (ko) 정보 처리 장치, 정보 처리 방법 및 프로그램
US8787666B2 (en) Color analytics for a digital image
CN109690557A (zh) 基于景深估计的图像调节
KR20060031638A (ko) 대상 결정 장치 및 촬상 장치
US10295525B2 (en) Image generation device, image generation method, recording medium, and processing method
CN107077596A (zh) 用于产生针对所选择识别文档的符合的面部图像的系统
US8249342B1 (en) Color analytics for a digital image
EP2787735A1 (en) Image processing device, image processing method and program
CN105976326B (zh) 图像处理装置以及图像处理方法
CN109644235A (zh) 在混合现实应用中设置焦点的技术
CN104915919B (zh) 图像处理装置以及图像处理方法
US20140347512A1 (en) Imaging sensor and method for biometric mapping of facial skin
JP2017060010A (ja) 撮像装置、撮像装置の制御方法、およびプログラム
CN100538498C (zh) 对象决定装置和摄像装置
US11721063B1 (en) Systems and methods for dynamic image rendering using a depth map

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant