CN104853080A

CN104853080A - 图像处理装置

Info

Publication number: CN104853080A
Application number: CN201410050745.9A
Authority: CN
Inventors: 白金洲; 吴恒谦
Original assignee: High Tech Computer Corp
Current assignee: HTC Corp
Priority date: 2014-02-13
Filing date: 2014-02-13
Publication date: 2015-08-19
Anticipated expiration: 2034-02-13
Also published as: CN104853080B

Abstract

一种图像处理装置，包括图像感应阵列、图像前置处理单元、深度产生器、以及聚焦单元。图像感应阵列用以针对两对象(第一对象和第二对象)撷取多个图像。图像前置处理单元用以对上述多个图像进行处理，以产生相关于上述两对象的两张位移图像。深度产生器用以根据上述两张位移图像产生深度信息。深度信息包括相关于第一对象的距离信息。聚焦单元用以根据深度信息与上述两张位移图像产生对焦于第一对象的一对对焦图像。

Description

图像处理装置

技术领域

本发明是有关于一种图像处理装置，且特别是有关于可产生图像的深度信息，而且可根据深度信息产生大尺寸二维(2D)图像与适合人眼观看的立体三维图像(stereoscopic3D video)的一种图像处理装置。

背景技术

传统摄影机使用单一镜头与单一图像感应器，并使用音圈马达(VCM:voice coil motor)驱动镜头前后移动，以实现自动对焦和取得深度信息(depthinformation)，以为二维(2D)图像与三维(3D)图像的产生做准备。但是音圈马达动作缓慢、耗电、而且会发出噪音。这些缺陷使得产生深度信息的功能需要更多时间与电力来完成。而使用多个相机或图像矩阵的图像输入则无法克服同时取得大尺寸二维图像、如何处理多张复杂的图像输入、与如何实时产生适合人眼观看的立体三维图像的问题。

相机使用者多希望可以拍摄大尺寸二维图像，例如一千万像素(10megapixels)的图像。来自多个相机或图像矩阵的图像虽然可以让深度信息的取得更容易，但是多个相机或图像矩阵的图像输出尺寸通常多是小尺寸，例如每一张都只有一百万像素，并且这些多张小尺寸图像需具有相同对焦平面。如何产生清楚的大尺寸二维图像将是一大挑战。

当多张输入图像有不同的成像平面并结合光学变焦(optical zoom)功能时，如何实时产生适合人眼观看的立体三维图像的问题会引发更多复杂挑战，尤其是当使用者感兴趣的对象四处移动时，将使多个相机或图像矩阵的图像输入摄影机更不易使用。

发明内容

本发明提供一种图像处理装置，搭配多个图像感应器或图像矩阵输入不同对焦平面的图像，并使用数字图像处理技术实现同时且实时产生大尺寸二维图像与产生适合人眼观看的立体三维图像，具有快速与省电的功效。上述的图像处理装置也包括多种深度信息的应用功能。

本发明的图像处理装置包括图像感应阵列、图像前置处理单元、深度产生器以及聚焦单元。图像感应阵列包括多个图像感应器，用以针对第一对象与第二对象撷取多个图像。图像前置处理单元耦接图像感应阵列，用以接收上述多个图像，并对上述多个图像进行处理，以产生相关于第一对象与第二对象的第一位移图像与第二位移图像。深度产生器耦接图像前置处理单元，用以根据第一位移图像与第二位移图像产生深度信息。深度信息包括相关于第一对象的第一距离信息。聚焦单元耦接图像前置处理单元与深度产生器，用以根据深度信息、第一位移图像与第二位移图像产生第一对对焦图像，其中第一对对焦图像对焦于第一对象。

为让本发明的上述特征和优点能更明显易懂，下文特举实施例，并配合所附图式作详细说明如下。

附图说明

图1是依照本发明一实施例的一种图像处理装置的示意图。

图2与图3是依照本发明一实施例的一种图像处理管线的示意图。

图4是依照本发明一实施例的视差校正的示意图。

图5是依照本发明一实施例的一种深度产生器的示意图。

图6A与图6B是依照本发明一实施例的深度信息的示意图。

图7是依照本发明另一实施例的一种深度产生器的示意图。

图8是依照本发明一实施例的红外线反射光点的示意图。

图9A至图9D是依照本发明一实施例的对焦图像的示意图。

图10是依照本发明另一实施例的一种图像处理装置的示意图。

图11是依照本发明一实施例的遮蔽点的示意图。

图12是依照本发明另一实施例的一种图像处理装置的示意图。

[标号说明]

100：图像处理装置 105：图像感应阵列

110：镜头阵列 120：感应器阵列

125：图像前置处理单元 130：图像处理管线

140：图像分析器 150：二维图像合成器

160：聚焦单元 170：储存单元

180：深度产生器 310：镜头扭曲修正单元

320：同步处理单元 330：去噪声单元

340：视差校正单元 350：图像校正单元

415、425：裁切方框 510：色彩空间转换器

520：背景模型单元 530：对象轮廓单元

540：偏移估算器 550：后处理器

560：偏移深度转换器 570：红外线收发器

610～650：深度信息区域 810：图像背景

815、825：红外线反射光点 820：图像前景

910～930：对象 1000：图像处理装置

1020：三维图像合成器 1030：遮蔽点检测器

1040：显示单元 1130、1140：对象

1135、1137、1145、1147：遮蔽点 1200：图像处理装置

M1、M2：遮蔽点位置信息 R1、L1、R2、L2：位移图像

R3、L3：对焦图像

具体实施方式

图1是依照本发明一实施例的一种图像处理装置100的示意图。图像处理装置100可以是数字相机、数字摄影机、或具有相机和/或摄影机功能的电子装置，如个人数字助理(PDA)、智能型手机或平板计算机。图像处理装置100包括图像感应阵列105、图像前置处理单元125、多个图像处理管线130、图像分析器140、聚焦单元160、深度产生器180、二维(2D)图像合成器150、以及储存单元170。其中图像感应阵列105包括镜头阵列110与感应器阵列120。感应器阵列120耦接镜头阵列110，图像前置处理单元125耦接感应器阵列120，图像处理管线130耦接前置处理单元125，图像分析器140、聚焦单元160和深度产生器180各自耦接图像处理管线130，二维图像合成器150耦接聚焦单元160，储存单元170耦接二维图像合成器150。

感应器阵列120可包括多个图像感应器(例如多个摄影机)，用以针对同一场景中的一个或多个对象撷取多个图像，并将该多个图像输出至图像前置处理单元125。在感应器阵列120之中，每一个图像感应器的焦点距离(focallength)可以是固定不变的或是可变的，而且每一个图像感应器可使用固定镜头(fixed lens)、液态镜头(liquid lens)、晶体镜头(crystal lens)、或微镜头阵列(micro-lens array)。感应器阵列120之中的图像感应器的焦点距离可以相同也可以不同。换句话说，感应器阵列120所撷取的上述多个图像可具有同一对焦平面(focal plane)。或者，感应器阵列120所撷取的上述多个图像可具有多个不同的对焦平面。

镜头阵列110可包括多个光学变焦镜头(optical zoom lens)，这些光学变焦镜头和感应器阵列120的多个图像感应器一一对应。每一个光学变焦镜头配置于对应的感应器的前方。这些光学变焦镜头可在上述图像中拉近远方的对象，提高远方对象的层次感。

图像前置处理单元125可接收感应器阵列120撷取的多个图像，并对上述多个图像进行处理，以产生相关于上述一个或多个对象的两个位移图像R1与L1。位移图像R1与L1可假设为分别对应使用者的右眼与左眼所看到的图像。

更详细地说，图像前置处理单元125可矫正感应器阵列120所撷取的上述多个图像的图像几何平面，并根据上述多个图像的实体相对位置与对焦平面将上述多个图像分类为对应右眼与左眼的两个图像群。然后图像前置处理单元125可根据第一个图像群中每一图像的光学特性将第一个图像群中的多个图像合成单一图像放大输出(multi-frame super resolution)，以产生对应右眼的位移图像R1。同理，图像前置处理单元125可根据第二个图像群中每一图像的光学特性将第二个图像群中的多个图像，合成单一图像放大输出，以产生对应左眼的位移图像L1。

上述的单一图像放大输出是将多个较小的图像合成一个较大的图像，例如将两个五百万像素(pixel)的图像合成一个一千万像素的图像。感应器阵列120的多个图像感应器可在同一时间(即同步)拍摄多个图像，然后图像前置处理单元125可使用单一图像放大输出技术和上述多个图像产生具有更高分辨率的位移图像R1和L1。

此外，图像前置处理单元125还可以支持高动态范围(HDR:high dynamicrange)技术。传统的高动态范围技术是对同一场景，在不同时间，使用不同曝光值拍摄多个图像，然后合成一个图像，其目的是在单一图像中呈现更广的明暗范围。感应器阵列120的多个图像感应器可在同一时间各使用不同曝光值撷取多个图像，然后图像前置处理单元125可使用高动态范围技术，根据上述多个图像产生明暗范围更广的位移图像R1和L1。上述的多个图像是在同一时间拍摄，不仅效率更高，效果也更佳，例如可将使用者的手震的影响最小化。

图像处理管线130如图2所示。于此实施例中，图像处理装置100可包括至少两个图像处理管线130，其中一图像处理管线130可由图像前置处理单元125接收位移图像R1，而另一图像处理管线130可由图像前置处理单元125接收位移图像L1。每一个图像处理管线130包括呈串行耦接的多个图像处理单元，可依序对其所接收的位移图像R1(或L1)进行多阶段图像处理，并输出对应于位移图像R1(或L1)的位移图像R2(或L2)。进一步而言，每一个图像处理管线130中的第一个图像处理单元接收位移图像R1(或L1)作为输入，其余每一个图像处理单元接收上一个图像处理单元的输出作为输入。这些图像处理单元对位移图像R1(和L1)进行一连串图像处理。在以下说明中，两个图像处理管线130个别接收的两个位移图像以R1和L1表示，两个图像处理管线130个别输出的两个位移图像则以R2和L2表示。上述两个图像处理管线130输出位移图像R2和L2至图像分析器140、聚焦单元160、以及深度产生器180。

举例而言，每一个图像处理管线130可以如图3所示，其中的图像处理单元可包括呈串行耦接的镜头扭曲修正单元(lens distortion correctionunit)310、同步处理单元(synchronization processing unit)320、去噪声单元(de-noise unit)330、视差校正单元(parallax calibration unit)340、以及图像校正单元(image rectification unit)350。以下说明以图2上方的图像处理管线130为范例。对于图2下方的图像处理管线130的说明，只需将位移图像R1与R2分别置换为位移图像L1与L2。

镜头扭曲修正单元310修正位移图像R1中的鱼眼现象，也就是直线经过拍摄后会略微弯曲的现象。

同步处理单元320修正并缩减位移图像R1和L1之间的差异，上述差异可包括感应器阵列120其中的图像感应器的拍摄时间、曝光(exposure)、色彩、白平衡(white balance)、以及对焦平面其中的一项或多项差异。

去噪声单元330可滤除位移图像R1中的噪声，包括亮度噪声与色彩噪声。

对应于位移图像R1的视差校正单元340会在位移图像R1中决定一个裁切方框(cropping frame)及其位置，并在位移图像R1上裁去裁切方框以外的部分及保留裁切方框以内的部分。同样地，对应于位移图像L1的视差校正单元340会在位移图像L1中决定另一个裁切方框(cropping frame)及其位置，并在位移图像L1上裁去裁切方框以外的部分及保留裁切方框以内的部分。为了营造两个位移图像L1与R1间所需的视差(parallax)效果，视差校正单元340会将裁切方框安排在位移图像R1与位移图像L1中的不同位置，使每个位移图像的视界(view)有少许差别。

例如图4所示，在此范例中，两个图像处理管线130其中的两个视差校正单元340分别在位移图像L1与R1上决定裁切方框415与425以及这两个裁切方框的位置。两个裁切方框415、425的位置不同，如果放在同一个图像中，两个裁切方框415、425之间会有一小段距离，这个间距是根据感应器阵列120的多个图像感应器的多个镜头之间的距离而决定。因此，每一个视差校正单元340会根据上述的多个镜头之间的距离，在位移图像中决定其裁切方框及裁切方框的位置，以营造视差效果。

感应器阵列120的多个图像感应器的多个镜头应该安装在同一个平面上，而且上述多个镜头的安装角度应该一致。例如每个镜头的视界中的上方必须指向同一方向，不应有旋转角度上的偏差。但是在制造过程中，每个镜头的安装位置不一定在同一平面上，安装角度的偏差也在所难免。图像校正单元350可校正上述的安装位置和/或安装角度的偏差对于位移图像R1所造成的扭曲(distortion)。例如可使用仿射转换(affine transform)以校正上述扭曲。

图5绘示深度产生器180的进一步细节。深度产生器180包括色彩空间转换器510、背景模型单元(background modeling unit)520、对象轮廓单元530、偏移估算器540、后处理器550、以及偏移深度转换器560。色彩空间转换器510耦接每一个图像处理管线130，背景模型单元520和偏移估算器540各自耦接色彩空间转换器510，对象轮廓单元530耦接背景模型单元520，后处理器550耦接对象轮廓单元530和偏移估算器540，偏移深度转换器560耦接于后处理器550和聚焦单元160之间。

深度产生器180根据位移图像R2和L2产生深度信息(例如depth map)。此深度信息包括相关于感应器阵列120所拍摄的每一个对象的距离信息。例如，上述距离信息可以是对应的对象和图像感应器的镜头之间的距离，此距离也可称为深度或深度值。

图6A与图6B是依照本发明一实施例的深度信息的示意图。图6A是感应器阵列120所拍摄的场景，其中有多个对象(例如多个玩偶)，深度产生器180对应此场景产生的深度信息如图6B所示。深度信息可以是由深度值构成的二维矩阵，其中每一个深度值是位移图像R2和L2之中同一位置的对象的深度值。图6B的深度值已转换为对应的灰阶以方便显示。图6A的对象可分为五个层次，分别对应图6B的五个区域610～650，其中灰色越深的区域表示距离越远。

以下说明深度产生器180的每一单元。色彩空间转换器510可将位移图像R2和L2自第一色彩空间转换至第二色彩空间。上述的第一色彩空间不包括亮度分量，例如RGB或CMYK；而第二色彩空间包括亮度分量和至少一个色彩分量，例如YUV或YCbCr。本实施例的感应器阵列120使用RGB色彩空间拍摄图像，如果感应器阵列120可用YUV之类的包含亮度分量的色彩空间拍摄图像，则可省略色彩空间转换器510。

偏移估算器540可根据位移图像R2和L2的亮度分量(例如YUV色彩空间的Y分量)产生偏移信息(例如disparity map)，此偏移信息包括每一个对象在位移图像R2和L2之间的偏移量。所谓偏移量是指同一个对象的同一点在不同图像中的不同位置之间的差距。越靠近镜头的对象会有越大的偏移量，因此用偏移量加上图像感应器的镜头的间距，可以推导出深度信息。偏移估算器540可检测并估算上述对象的偏移量，以产生偏移信息。偏移信息可以是类似图6B的二维矩阵，只是其中的深度值换成偏移量。

背景模型单元520可根据位移图像R2或L2的至少一个色彩分量(例如YUV色彩空间的U分量与V分量)，区分该位移图像的前景与背景。上述前景是指使用者比较可能感兴趣的部分，而背景是比较不重要的部分。因为感应器阵列120的每一个图像感应器的视界相差不大，所以背景模型单元520可以只将位移图像R2和L2其中之一图像的前景或背景的信息取出即可。

在图5的实施例中，背景模型单元520亦耦接偏移估算器540。背景模型单元520可根据偏移估算器540产生的偏移信息推算对象深度，然后根据深度来区分前景与背景。

对象轮廓单元530可抽取上述前景之中的一对象轮廓(object contour)，且后处理器550可根据上述对象轮廓修饰偏移信息，特别是修饰偏移信息中的对象轮廓信息。

后处理器550负责修饰偏移估算器540所产生的偏移信息。后处理器550可根据对象轮廓单元530在上述前景中抽取的对象轮廓，修饰偏移信息中的前景对象轮廓，也就是修饰偏移信息中的前景对象轮廓的突出与粗糙之处，让偏移信息中的前景对象轮廓平滑化。

此外，后处理器550可修补偏移信息中的前景与背景的异常点。偏移信息可以是类似二维图像的二维矩阵，例如其中矩阵边缘的每一个点周围有三或五个紧邻的点，矩阵内部的每一个点周围有八个紧邻的点。若有某一个点和周围任何一个紧邻点的偏移量的差异值大于一个门坎值，该点就会被视为异常点，后处理器550会用该点全部的紧邻点的偏移量平均值取代该点的偏移量。

偏移深度转换器560可将经过后处理器550修饰的偏移信息转换为深度信息，以供聚焦单元160使用。

图7绘示依照本发明另一实施例的深度产生器180的进一步细节。此实施例的深度产生器180还包括耦接背景模型单元520的红外线收发器570。红外线收发器570可发射红外线，并感应该红外线的反射光点。例如图8所示，图8绘示此实施例的红外线收发器570感应到的红外线图像，其中的背景810有多个反射光点815，前景820另有多个反射光点825。因为前景的距离比较近，所以前景820的反射光点825会比较大、比较明亮，而背景810的反射光点815会比较小、比较阴暗。背景模型单元520可根据反射光点的上述差异来区分上述的前景与背景。

聚焦单元160可根据上述深度信息、位移图像R2与L2、以及/或每一上述图像感应器的镜头参数产生两个使用者所指定或所感兴趣的对象的对焦图像R3与L3，上述的对焦图像R3与L3是同时对焦于同一个对象上。上述的镜头参数包括对应的该图像感应器的镜头的焦点距离(focal length)和点散函数(point spread function)。每一个图像感应器的镜头参数可以相同，也可以不相同。

图9A至图9D是上述的对焦图像的一个范例。图9A是图像处理装置100拍摄的场景，其中有三个对象910～930。在此范例中，聚焦单元160根据深度产生器180所产生的深度信息来产生三对对焦图像R3与L3，分别对焦于对象910～930。对焦于对象910的对焦图像R3与L3，就如图9B所示，对象910最清晰，对象920、930比较模糊。对焦于对象920的对焦图像R3与L3，就如图9C所示，对象920最清晰，对象910和930比较模糊。对焦于对象930的对焦图像R3与L3，就如图9D所示，对象930最清晰，对象910、920比较模糊。

聚焦单元160可产生对任意对象对焦的对焦图像的理论基础是A.P.Pentland在IEEE Transactions on Pattern Analysis and Machine Intelligence,9(4):523-531,1987发表的论文"A New Sense for Depth of Field"。此论文阐述了图像的深度信息、对焦平面深度、以及镜头参数之间的关系。对焦平面深度和镜头参数在图像处理装置100的硬件设计时已经得知，深度信息则来自深度产生器180。

图像分析器140可提供智能型自动聚焦功能。更详细地说，图像分析器140可在位移图像R2和/或L2中识别一个或多个对象的位置，例如人脸，或具有特征的区域，以产生相对于上述一个或多个对象的位置信息，其中聚焦单元160根据上述的位置信息产生相对于上述一个或多个对象的一对或多对对焦图像。除了由图像分析器140自动识别之外，上述的对焦对象也可以由使用者指定。

例如在图9A至图9D的范例中，图像分析器140可在位移图像R2与L2中识别对象910～930，并将对象910～930的位置信息传送给聚焦单元160。因此聚焦单元160可根据所接收到的位置信息分别对焦于对象910～930，以产生如图9B至图9D所示的三对对焦图像R3与L3。

图像处理装置100可拍摄静态图像或动态影片，其中动态影片就是连续拍摄的静态图像的组合。在本发明的一实施例中，图像感应阵列105可连续拍摄多个图像，图像分析器140可在位移图像R2与L2中连续追踪一个或多个对象，例如人脸或正在移动的对象，并提供这些对象的位置信息，以供聚焦单元160产生对焦图像。除了由图像分析器140自动识别之外，上述的对焦对象也可以由使用者指定。举例而言，如果有一个行人从拍摄场景的后方走到前方，使用者可以指定此行人作为对焦对象，聚焦单元160可以连续追踪对焦，让这个行人无论走到哪里，焦点都随之移动。

回到图1，二维图像合成器150可由聚焦单元160接收对焦图像R3与L3，并根据对焦图像R3与L3做二维图像补点(image interpolation)以产生一个二维合成图像。上述合成图像的分辨率可大于或等于对焦图像R3与L3的分辨率。储存单元170可接收并储存上述的合成图像，亦可储存上述的深度图、聚焦深度、以及镜头参数其中的一项或多项数据。如果图像处理装置100拍摄的是动态影片，储存单元170可将连续的合成图像编码为影片储存。

图10是依照本发明另一实施例的一种图像处理装置1000的示意图。图像处理装置1000包括图像感应阵列105、图像前置处理单元125、多个图像处理管线130、图像分析器140、聚焦单元160、深度产生器180、三维(3D)图像合成器1020、遮蔽点(occlusion)检测器1030、显示单元1040、以及储存单元170。其中图像感应阵列105、图像前置处理单元125、多个图像处理管线130、图像分析器140、聚焦单元160、以及深度产生器180分别与图1的对应元件相同，不再赘述。遮蔽点检测器1030耦接图像分析器140、聚焦单元160与深度产生器180，三维图像合成器1020耦接遮蔽点检测器1030与聚焦单元160，显示单元1040与储存单元170皆耦接三维图像合成器1020。

遮蔽点检测器1030可自聚焦单元160接收对焦图像R3与L3，并接收由图像分析器140所输出的相对于对象的位置信息及由深度产生器180所输出的深度信息，并根据所接收的对焦图像R3与L3、位置信息与深度信息来产生对应于对焦图像R3与L3的遮蔽点位置信息M1与M2。所谓遮蔽点就是立体三维图像中被对象遮蔽而只被人类的双眼其中一眼看到的部分，也就是感应器阵列120所拍摄的场景中只被一部分图像感应器撷取的部分。例如图11所示的范例，对焦图像R3和L3其中有两个对象1130和1140。对焦图像L3包括遮蔽点1135和1145，对焦图像R3则包括遮蔽点1137和1147。因为感应器阵列120的图像感应器的安装位置各不相同，所以遮蔽点也出现在不同位置。越靠近图像感应器镜头的遮蔽点会越明显。

修正遮蔽点可让使用者看到更真实舒适的三维图像。三维图像合成器1020可根据遮蔽点位置信息M1或M2将对焦图像R3或L3中的对象移动(shift)一距离，用以修饰对象的边缘，以修正对象的遮蔽点。

如上所述，三维图像合成器1020可以根据对象的遮敝点位置信息M1与M2修正对焦图像R3与L3中的遮蔽点，而且三维图像合成器1020可根据对焦图像R3与L3及至少一遮敝点位置信息M1或M2来产生一个三维合成图像。透过图像分析器140的图像内容分析与对象追踪，可减少遮蔽点检测与处理的时间，可实时改变遮蔽点修正的运算量，以实时产生适合人眼观看的立体三维图像。

显示单元1040由三维图像合成器1020接收三维合成图像，并以立体三维方式显示上述三维合成图像。立体三维图像的立体感是指使用者看起来凸出屏幕或凹入屏幕的程度。图像处理装置1000可提供设定选项以设定上述立体感的凸出或凹入程度，三维图像合成器1020可根据此设定选项，以及显示单元1040的屏幕大小和分辨率，调整显示单元1040所呈现的立体感。储存单元170可接收并储存由三维图像合成器1020所输出的三维合成图像。

图12是依照本发明另一实施例的一种图像处理装置1200的示意图。图像处理装置1200就是图1的图像处理装置100与图10的图像处理装置1000的组合。因此，图像处理装置1200具有图像处理装置100与图像处理装置1000的全部功能。再者，于图像处理装置1200中，三维图像合成器1020与二维图像合成器150可同时由聚焦单元160接收对焦图像R3与L3，藉以分别对所拍摄的对象同时产生一个具有深度信息与高分辨率的二维合成图像与一个三维合成图像，储存单元170可接收并储存该二维合成图像与该三维合成图像。

综上所述，上述实施例中的图像处理装置100、1000、1200在拍摄图像时使用图像处理技术聚焦，而不使用音圈马达，所以比使用音圈马达的传统方案更安静、更快速而且更省电。图像处理装置100、1000、1200在图像已经拍摄后可以通过对焦图像对图像中的每一对象重新聚焦，可避免人为拍摄的聚焦或追踪失误。图像处理装置100、1000、1200可用高动态范围技术合成感应器阵列同时拍摄的多个图像，以延展图像的明暗范围，并可用单一图像放大输出技术合成感应器阵列同时拍摄的多个图像，以产生大尺寸的二维图像。图像处理装置1000、1200可检测并修正图像中的遮蔽点，可调整显示单元所呈现的三维立体感。总之，本发明实施例中的图像处理装置100、1000、1200可提供更适合人眼观看的二维图像与立体三维图像。

虽然本发明已以实施例揭露如上，然其并非用以限定本发明，任何所属技术领域中具有通常知识者，在不脱离本发明的精神和范围内，当可作些许的更动与润饰，故本发明的保护范围当视所附的权利要求范围所界定者为准。

Claims

1.一种图像处理装置，包括：

一图像感应阵列，包括多个图像感应器，用以针对一第一对象与一第二对象撷取多个图像；

一图像前置处理单元，耦接该图像感应阵列，用以接收上述多个图像，并对上述多个图像进行处理，以产生相关于该第一对象与该第二对象的一第一位移图像与一第二位移图像；

一深度产生器，耦接该图像前置处理单元，用以根据该第一位移图像与该第二位移图像产生一深度信息，其中该深度信息包括相关于该第一对象的一第一距离信息；以及

一聚焦单元，耦接该图像前置处理单元与该深度产生器，用以根据该深度信息、该第一位移图像与该第二位移图像产生一第一对对焦图像，其中该第一对对焦图像对焦于该第一对象。

2.根据权利要求1所述的图像处理装置，其中该深度信息还包括相关于该第二对象的一第二距离信息，且该聚焦单元还用以根据该深度信息、该第一位移图像与该第二位移图像产生一第二对对焦图像，其中该第二对对焦图像对焦于该第二对象。

3.根据权利要求1所述的图像处理装置，其中该聚焦单元还根据每一上述图像感应器的镜头参数产生该第一对对焦图像，每一上述图像感应器的镜头参数包括该图像感应器的镜头的焦点距离和点散函数。

4.根据权利要求1所述的图像处理装置，其中该图像感应阵列还包括：

一镜头阵列，包括多个光学变焦镜头，上述多个光学变焦镜头配置于上述多个图像感应器的前方。

5.根据权利要求1所述的图像处理装置，其中该深度产生器包括：

一偏移估算器，耦接该图像前置处理单元，用以根据该第一位移图像与该第二位移图像产生一偏移信息，该偏移信息包括该第一对象与该第二对象在该第一位移图像与该第二位移图像之间的偏移量；以及

一偏移深度转换器，耦接该偏移估算器，用以将该偏移信息转换为该深度信息。

6.根据权利要求5所述的图像处理装置，其中该深度产生器还包括：

一后处理器，耦接于该偏移估算器与该偏移深度转换器之间，用以修补该偏移信息中的异常点。

7.根据权利要求5所述的图像处理装置，其中该深度产生器还包括：

一背景模型单元，耦接该图像前置处理单元，用以区分该第一位移图像或该第二位移图像的一前景与一背景；以及

一对象轮廓单元，耦接该背景模型单元，用以抽取该前景中的一对象轮廓。

8.根据权利要求7所述的图像处理装置，其中该背景模型单元亦耦接该偏移估算器，并根据该偏移信息区分该前景与该背景。

9.根据权利要求7所述的图像处理装置，其中该深度产生器还包括：

一红外线收发器，耦接该背景模型单元，用以发射一红外线，感应该红外线的反射光点，其中该背景模型单元根据上述反射光点区分该前景与该背景。

10.根据权利要求7所述的图像处理装置，其中该深度产生器还包括：

一色彩空间转换器，耦接该图像前置处理单元、该偏移估算器以及该背景模型单元，用以将该第一位移图像与该第二位移图像自一第一色彩空间转换至一第二色彩空间，其中该第一色彩空间不包括亮度分量，而该第二色彩空间包括一亮度分量和至少一色彩分量，该偏移估算器根据该第一位移图像与该第二位移图像的该亮度分量产生该偏移信息，该背景模型单元根据该第一位移图像或该第二位移图像的该至少一色彩分量区分该前景与该背景。

11.根据权利要求1所述的图像处理装置，其中该图像前置处理单元用以将上述多个图像分类为一第一图像群与一第二图像群，并根据该第一图像群中每一图像的光学特性集合该第一图像群中的多个图像以产生该第一位移图像，及根据该第二图像群中每一图像的光学特性集合该第二图像群中的多个图像以产生该第二位移图像。

12.根据权利要求1所述的图像处理装置，其中该图像感应阵列所撷取的上述多个图像是由上述多个图像感应器在同一时间各使用不同曝光值而撷取，而且该图像前置处理单元使用高动态范围技术根据上述多个图像产生该第一位移图像与该第二位移图像。

13.根据权利要求1所述的图像处理装置，还包括：

一图像分析器，耦接该图像前置处理单元和该聚焦单元，用以在该第一位移图像或该第二位移图像中识别该第一对象的位置，以产生相对于该第一对象的位置信息，其中该聚焦单元还根据该位置信息产生该第一对对焦图像。

14.根据权利要求1所述的图像处理装置，还包括：

至少两个图像处理管线，耦接于该图像前置处理单元、该聚焦单元以及该深度产生器之间，用以分别接收该第一位移图像与该第二位移图像，其中每一上述图像处理管线包括：

一同步处理单元，修正该第一位移图像与该第二位移图像之间的差异，上述差异至少包括拍摄时间、曝光、色彩、白平衡以及对焦平面的差异其中之一。

15.根据权利要求1所述的图像处理装置，还包括：

一图像合成器，耦接该聚焦单元，用以根据该第一对对焦图像产生一合成图像。

16.根据权利要求15所述的图像处理装置，其中该合成图像为二维图像，该图像合成器根据该第一对对焦图像做二维图像补点以产生该合成图像，而且该合成图像的分辨率大于该第一对对焦图像的分辨率。

17.根据权利要求15所述的图像处理装置，其中该合成图像为三维图像，而且该图像处理装置还包括：

一遮蔽点检测器，耦接该深度产生器、该聚焦单元与该图像合成器，用以根据该深度信息与该第一对对焦图像来产生对应于该第一对对焦图像的遮蔽点位置信息，其中该图像合成器根据该第一对对焦图像与该遮蔽点位置信息来产生该三维图像；以及

一显示单元，耦接该图像合成器，以立体三维方式显示该三维图像。