TW201724026A

TW201724026A - 基於場景之拍攝圖像而產生合併、融合三維點雲

Info

Publication number: TW201724026A
Application number: TW105125038A
Authority: TW
Inventors: 張祈; 劉欣; 芙蘿音庫圖
Original assignee: 海特根微光學公司
Priority date: 2015-08-06
Filing date: 2016-08-05
Publication date: 2017-07-01
Also published as: TWI729995B; US20180225866A1; US10699476B2; WO2017023210A1

Abstract

呈現一合併、融合三維點雲包含：自不同優勢點獲取一場景之多組圖像，各組圖像包含各自立體匹配圖像及一彩色圖像。針對各個圖像組，獲得基於該複數個立體圖像之一視差圖，將來自該彩色圖像之資料融合至該視差圖上以產生一融合視差圖，且自該融合視差圖產生三維融合點雲。將該等各自三維融合點雲合併在一起以獲得一合併、融合三維點雲。該等技術可甚至在稀疏度及低深度解析度受約束時為有利的，且在一些情況中適用於其中需要減少運算時間之即時或近即時應用。

Description

基於場景之拍攝圖像而產生合併、融合三維點雲

本發明係關於圖像處理，且特定言之，本發明係關於用於基於一場景之拍攝圖像而產生一合併、融合三維點雲之系統及技術。

一圖像可被視為自三維(3D)場景至二維(2D)平面上之一投影。儘管一2D圖像未提供深度資訊，但若可自不同優勢點得到相同場景之兩個圖像，則可使用已知技術來找到一3D點之位置(其包含深度)。

例如，立體匹配係一程序，其中自略微不同視點取得之一場景之兩個圖像(一立體圖像對)經匹配以找到描繪相同場景元素之圖像元素之視差(位置差)。視差提供關於來自攝影機之場景元素之相對距離之資訊。立體匹配能夠運算視差(即，距離資料)，其允許判定一場景之物件之表面之深度。一立體攝影機(其包含(例如)彼此隔開達一已知距離(其可指稱基線距離)之兩個圖像拍攝裝置)可用於拍攝立體圖像對。

一些圖像拍攝模組包含兩個灰階深度立體攝影機及一RGB攝影機。此類型之模組可用於(例如)一行動應用(例如一智慧型電話)中，因此，模組之佔用面積趨向於較小。當模組之佔用面積較小時，兩個深度攝影機之間之基線距離亦將為較小的。然而，立體系統中之小基線導致低深度或低z解析度。此外，源自兩個深度攝影機之視差圖趨向於較為稀疏。稀疏視差圖可為具有小紋理之場景之一結果(例如一單色壁)。此外，即使一光投影機用於將紋理投影至場景上，但若投影圖案不是非常稠密，則所得視差圖會較為稀疏。

本發明描述甚至在稀疏度及低z解析度受約束時用於產生一合併且融合3D點雲之系統及技術。在一些情況中，該等技術適用於其中需要減少運算時間之即時或近即時應用。

可自(例如)在一第一位置處由兩個深度攝影機拍攝之一場景之一視差圖及深度攝影機系統之幾何資訊(例如基線距離及焦距)之一組合產生一單一3D點雲。因此，3D點雲含有視差資料(即，物件特徵點之座標(x,y,z))。一融合3D點雲係其中亦包含物件特徵點之色彩資料之點雲(x,y,z,c)。一合併3D點雲係合併自多個模組位置產生之點雲(即，自不同優勢點拍攝之場景之圖像)之點雲。由於深度攝影機具有一固有有限視場(FOV)，所以將深度攝影機移動至不同點(例如，位於一物件或其他場景周圍)以自場景之不同視角獲得視差圖且最終獲得3D點雲。因此，合併3D點雲係場景之一3D表示。可經由指稱對位之一程序而自多個3D點雲產生合併3D點雲。對位使一第一3D點雲中之關鍵點(例如共同關注點)與一第二3D點雲中之關鍵點相關。由轉譯資料使不同3D點雲之間之關鍵點相關。因此，轉譯資料能夠將3D點雲合併在一起。

如下文將更詳細描述，一種設備包含一光電模組，其包含兩個(或兩個以上)深度通道(其等之各者具有一各自圖像拍攝裝置(例如攝影機))及一彩色圖像拍攝裝置(例如一RGB攝影機)。該設備經配置以產生可顯示於(例如)一運算裝置(例如一智慧型電話或其他小裝置)之螢幕上之一合併、融合3D點雲。

一使用者應用之一實例係：使用(例如)一游標來使顯示於一電腦螢幕上之合併、融合3D點雲旋轉，使得可在使點雲旋轉時看見場景之合併、融合3D點雲之不同視角。因此，回應於收到使用者輸入(例如，透過一電子滑鼠、軌跡球或其他使用者輸入裝置)，顯示裝置使顯示於一顯示裝置(例如一CRT(陰極射線管)或LCD(液晶顯示器)監視器)上之合併、融合3D點雲旋轉。在一些情況中，合併、融合3D點雲可經顯示為電腦螢幕上之一CAD模型或可用作為至(例如)一3D印表機之輸入。

如上文所提及，本發明甚至可有利地用於以下情形中：視差資訊相對較稀疏(例如，起因於較低品質感測器或圖案投影單元)，基線相對較小(即，導致較差z解析度)，且可使用較少運算容量及/或存在對運算時間之更多嚴格限制。

在一些實施方案中，一多通道光電模組可用於產生一融合、合併3D點雲。該模組包含至少兩個深度通道(例如IR敏感、低解析度)、一RGB通道(例如高解析度)，且在一些情況中亦包含一IR投影機。在一些實施方案中，此一方法可克服稀疏視差圖、低z解析度及運算需求(例如，需要高速)之挑戰。如下文將更詳細描述，RGB資料可用於擴充或依其他方式增強對位程序且藉此將個別3D點雲合併成一合併3D點雲。

將易於自[實施方式]、附圖及申請專利範圍明白其他態樣、特徵及優點。

110‧‧‧設備

112‧‧‧光電模組

114A‧‧‧圖像拍攝裝置/立體成像器/深度攝影機

114B‧‧‧圖像拍攝裝置/立體成像器/深度攝影機

116‧‧‧彩色圖像拍攝裝置/RGB攝影機

118‧‧‧照明源

120‧‧‧顯示裝置/運算裝置

122‧‧‧場景

130‧‧‧立體匹配引擎

132‧‧‧子像素像素插值引擎

134‧‧‧融合引擎

136‧‧‧插值引擎

138‧‧‧三維(3D)點雲重建引擎

140‧‧‧對位引擎

144‧‧‧記憶體

146A‧‧‧第一三維(3D)彩色點雲

146B‧‧‧第二三維(3D)彩色點雲

148‧‧‧合併、融合三維(3D)點雲

150‧‧‧平行處理單元

202‧‧‧初始校準步驟

204‧‧‧自第一位置獲取場景之圖像

204A‧‧‧自第二位置獲取場景之圖像

206‧‧‧程序/執行圖像校正且將立體匹配演算法應用於圖像

208‧‧‧程序/對視差圖執行子像素視差插值

210‧‧‧融合程序/將彩色圖像資料融合至視差圖上

212‧‧‧第二插值程序/應用第二插值程序來填寫視差圖中之視差值

214‧‧‧3D點雲重建程序/自先前獲得之視差圖產生3D點雲

215‧‧‧程序206至214

216‧‧‧對位程序

302‧‧‧處理視差圖之初始區塊且判定某些特定值

304‧‧‧若當前視差值係無效的，則更新區塊之中心像素之視差值

306‧‧‧檢查是否到達像素行之末端

308‧‧‧使區塊之位置向下移位

308A‧‧‧在區塊之底部處新增特定數目個列且更新特定值

308B‧‧‧自區塊之頂部減去特定數目個列且更新特定值

310‧‧‧更新區塊之中心像素之視差值

312‧‧‧檢查是否已到達像素列之末端

314‧‧‧使區塊向右水平移位

314A‧‧‧在區塊之右手側處新增特定數目個行且更新特定值

314B‧‧‧自區塊之左手側減去特定數目個行且更新特定值

316‧‧‧更新區塊之中心像素之視差值

318‧‧‧完成視差圖之掃描

352‧‧‧處理視差圖之初始區塊且運算某些特定值

354‧‧‧比較有效視差值之數目與先前判定之第一最小臨限值且判定有效視差值之數目是否小於第一最小臨限值

356‧‧‧將0值指派給區塊中之指定像素

358‧‧‧使區塊移位一行或一列且對新區塊重複程序

360‧‧‧運算區塊之平均視差值及區塊中之視差值之標準差

362‧‧‧比較運算標準差與先前判定之第二最小臨限值且判定運算標準差是否小於第二最小臨限值

364‧‧‧將先前計算之平均視差值指派給區塊中之指定像素

366‧‧‧判定區塊之像素中之最頻繁出現之視差值且將最頻繁出現之視差值指派給區塊中之指定像素

400‧‧‧場景

402‧‧‧物件

403‧‧‧物件

404‧‧‧幾何邊緣

405‧‧‧點

406‧‧‧點

410‧‧‧區塊

412‧‧‧中心像素

414‧‧‧區塊

416‧‧‧中心像素

418‧‧‧區塊

420‧‧‧中心像素

504‧‧‧識別且分離離散融合3D點雲之各者之前景區域及背景區域

506‧‧‧步驟/擷取且平滑化各點雲之前景及/或減去各點雲之背景

508‧‧‧步驟/擷取各點雲之前景之2D關鍵點

510‧‧‧識別各種離散3D點雲之間之對應性

512‧‧‧將識別關鍵點投影至3D關鍵點上

514‧‧‧對位3D特徵且消除離群值

516‧‧‧將對位變換應用於各3D點雲以獲得合併3D點雲

518‧‧‧將3D平滑濾波應用於合併3D點雲以消除對位誤差及/或量測誤差

圖1繪示根據本發明之用於基於一場景之拍攝圖像而產生一合併、融合3D點雲之一設備之一實例。

圖2係繪示根據本發明之用於基於一場景之拍攝圖像而產生一合併、融合3D點雲之一方法之一實例的一流程圖。

圖3係繪示用於填寫一視差圖中之視差值之一插值程序之一實例的一流程圖。

圖3A係繪示用於填寫一視差圖中之視差值之一插值程序之另一實例的一流程圖。

圖4A至圖4D繪示用於更新一區塊之一中心像素之視差值之情境之實例。

圖5係繪示用於合併兩個或兩個以上3D點雲之一對位程序之一實例的一流程圖。

如圖1中所展示，一設備110包含一光電模組112，其包含：兩個(或兩個以上)深度通道，其等之各者具有一各自圖像拍攝裝置(例如攝影機)114A、114B；及第三通道，其具有一彩色圖像拍攝裝置(例如一RGB攝影機)116。設備110經配置以基於由攝影機114A、114B、116拍攝之圖像而產生一合併、融合3D點雲且將該合併、融合3D點雲顯示於(例如)一運算裝置(例如一智慧型電話或其他小裝置)120之螢幕上。可在運算裝置之螢幕上將不同深度(或深度範圍)顯示為(例如)不同色彩或使用其他視覺指標來顯示不同深度(或深度範圍)。

攝影機114A、114B經配置以拍攝一場景122之立體圖像資料，且攝影機116經配置以拍攝場景122之一彩色圖像。圖像拍攝裝置114A、114B之各者可經實施為(例如)一紅外線(IR)CMOS圖像感測器或CCD圖像感測器。同樣地，圖像拍攝裝置116可經實施為(例如)一RGB CMOS圖像感測器或CCD圖像感測器。在一些例項中，深度攝影機114A、114B係低解析度攝影機(例如QQVGA)，而第三通道之攝影機116係一高解析度攝影機(例如VRA或更高)。此外，由於深度攝影機114A、114B具有一固有有限視場(FOV)，所以模組112可移動至不同點，使得攝影機可自場景122周圍之不同視角獲得資訊。可使模組(或攝影機)之移動自動化。可使模組(例如，位於一智慧型電話或其他裝置內)之移動自動化。在其他例項中，物件可圍繞保持固定之模組移動，同時自多個視角獲取物件之圖像。

在一些情況中，模組112亦可包含經配置以將照明之一圖案投影至場景122上之一相關聯照明源118。當存在照明源118時，照明源118可包含(例如)可操作以將一圖案(例如一點或線圖案)投影至場景122中之物件上之一紅外線(IR)投影機。照明源118可經實施為(例如)一發光二極體(LED)、一紅外線(IR)LED、一有機LED(OLED)、一紅外線(IR)雷射或一垂直腔面射型雷射(VCSEL)。光學特徵之投影圖案可用於將紋理提供至場景以促進由裝置114A、114B獲取之立體圖像之間之立體匹配程序。

設備110進一步包含用於處理由攝影機114A、114B、116獲取之圖像之各種引擎。特定言之，設備110包含一立體匹配引擎130、一子像素視差插值引擎132、一融合引擎134、一插值引擎136、一3D點雲重建引擎138及一對位引擎140。下文將描述關於由此等引擎實施之功能或演算法之細節。

設備110亦包含記憶體144，其可儲存由攝影機114A、114B、116獲取之圖像及由引擎130至140處理或輸出之各種資料。例如，如圖1中所繪示，記憶體144可儲存由3D點雲重建引擎138產生之兩個或兩個以上3D彩色點雲146A、146B。

前述引擎130、132、134、136、138、140之各者可(例如)使用一電腦來實施且包含一各自平行處理單元150(例如一專用積體電路(ASIC)或一場可程式化閘陣列(FPGA))。此外，在其他例項中，可在軟體中實施前述引擎130、132、134、136、138、140(例如，使用行動裝置(例如智慧型電話)之一處理器)。儘管圖1中將各種引擎130至140及記憶體144展示成與模組112分離，但在一些實施方案中，其等可整合為模組112之部分。例如，引擎130至140及記憶體144可經實施為與圖像拍攝裝置114A、114B、116一起安裝於模組112內之一印刷電路板(PCB)上之一或多個積體電路晶片。在一些情況中，照明源118(若存在)可與收容圖像拍攝裝置114A、114B、116之模組112分離。此外，模組112亦可包含其他處理及控制電路。亦可在(例如)安裝於相同於圖像拍攝裝置之PCB上之一或多個積體電路晶片中實施此電路。

現參考圖2之流程圖，可相對於通道(即，全部三個攝影機114A、114B、116)之各者執行校準且可在模組112到達終端使用者之前由(例如)製造商執行校準(參閱202)。在一些情況中，可由終端使用者週期性地執行校準。校準操作產生可在圖像處理之一或多個階段期間使用之校準資料。

如圖2所指示(204)，圖像拍攝裝置114A、114B、116之各者自一第一位置獲取場景122之一圖像。將由立體攝影機114A、114B獲取之深度圖像提供至立體匹配引擎130，立體匹配引擎130執行圖像校正且將一立體匹配演算法應用於圖像(206)。區塊匹配係立體匹配之一實例。下一段中描述一區塊匹配技術之一實例。然而，亦可取決於實施方案而使用其他類型之匹配演算法。例如，可使用基於邊緣、粗至細、自適應窗、動態程式規劃、馬可夫(Markov)隨機場、圖形切割或多基線立體匹配技術。

一區塊匹配演算法允許藉由首先運算一圖像中之一特徵之位置與另一圖像中之相同或實質上相同特徵之位置之間之像素距離來自立體圖像對運算視差資訊。在此情況中，將由立體成像器114A之一第一者獲取之一圖像用作一參考圖像；將由立體成像器114B之一第二者獲取之一圖像用作一搜尋圖像。因此，第二圖像經搜尋以識別第一圖像中之一小區域(即，像素之區塊)之最接近匹配。

各種技術可用於判定兩個圖像中之區域之類似程度且識別最接近匹配。一此類已知技術係「絕對差總和」，有時指稱「SAD」。為運算一模板與一區塊之間之絕對差總和，自該區塊中之對應像素之灰階值減去該模板中之各像素之一灰階值，且運算該等差之絕對值。接著，全部差經加總以提供大致衡量兩個圖像區域之間之類似性之一單一值。一較低值指示斑塊較類似。為找到「最類似」於模板之區塊，運算模板與搜尋區域中之各區塊之間之SAD值，且選擇具有最低SAD值之區塊。視差係指兩個圖像中之匹配區域之中心之間之距離。在一視差圖中，具有較大視差之像素較接近攝影機，且具有較小視差之像素較遠離攝影機。

立體匹配引擎130之輸出係一視差圖，在一些情況中，該視差圖可相對較稀疏且可具有相對較低深度解析度。在此背景下，一稀疏視差圖歸咎於該視差圖中之諸多像素無法被指派一視差值之事實。稀疏度可(例如)歸因於諸多原因，其包含低解析度深度通道、低品質光學器件、無法收集全部圖像特徵之像素值(例如IR)、投影至場景上之圖案之低密度及/或場景之低紋理。前述因數可導致圖像中之較少可識別點可用於計算視差。此外，若兩個立體成像器114A、114B之間之基線距離較小，則視差圖將趨向於具有低深度解析度。

將由立體匹配引擎130產生之視差圖提供至子像素視差插值引擎132，子像素視差插值引擎132對視差圖執行子像素視差插值(208)。此子像素插值在(例如)立體視覺之長程應用(其需要精確子像素位準視差估計值)中可為尤其有利的。諸如表面插值演算法、半全域匹配(SGM)立體演算法或使用一線性函數之已知子像素插值技術可被使用且改良視差圖之深度解析度。

將由子像素視差插值引擎132產生之視差圖及由第三攝影機116獲取之彩色圖像提供至融合引擎134，融合引擎134將彩色圖像資料融合至視差圖上(210)。融合程序有時指稱扭曲。一般而言，融合可涵蓋像素值(例如，色彩值至灰階值)之轉換且亦可涵蓋一高解析度圖像至一低解析度圖像之轉換。即，融合程序可將一比例因數應用於不同解析度之圖像之間之轉換。亦對融合程序提供來自初始校準步驟(202)之校準資料。即，需要明確定義圖像之間之關係(例如空間關係)，此係因為由攝影機116獲取之RGB圖像係使用相對於其他深度攝影機114A、114B之一特定基線距離來自一不同視角拍攝的。在此實施方案中，融合引擎134之輸出係具有改良解析度之一融合視差圖(即，具有色彩資料)。然而，視差仍可相對較稀疏。

圖像處理技術亦包含一第二插值程序(212)、一3D點雲重建程序(214)及對位程序(216)。下文將描述此等程序。在一些實施方案中，只要在對位程序216之前執行融合程序，則可在插值程序212之後執行融合(即，扭曲)程序210。在該情況中，將相應地重新配置圖1中之各種引擎之輸入及輸出。

為改良視差圖之稀疏度，插值引擎136應用一第二插值程序來填寫視差圖中之視差值(212)。如上文所提及，若已執行融合程序，則插值引擎136接收由融合引擎134產生之融合視差圖且相對於融合視差圖而執行第二插值程序。替代地，若將在整體程序之一稍後階段中執行融合程序，則插值程序136將接收由子像素視差插值引擎132產生之視差圖且將相對於該視差圖而執行第二插值程序。

儘管可由插值引擎136應用各種插值程序之任何者來改良稀疏度，圖3中闡明且下文將描述用於一些實施方案之一較佳技術。此插值技術促進快速實現稀疏度改良以藉此容許其用於(例如)即時或近即時應用中。插值引擎136之輸出係具有相對較低稀疏度之一視差圖。在其中在融合程序210之後執行插值程序212之實施方案中，插值引擎136之輸出係具有相對較低稀疏度之一融合視差圖。

如由圖2進一步所繪示，圖像處理包含：將視差圖轉換成一3D深度圖。程序之此階段可由3D點雲重建引擎138實施，3D點雲重建引擎 138自先前獲得之視差圖產生一3D點雲(214)。在此實例中，重建引擎138之輸出係一第一3D彩色點雲146A，其包含空間中之各點(即，(x,y,z))之色彩資料(例如R、G、B)。可將3D彩色點雲146A儲存於(例如)記憶體144中。

如由圖2進一步所指示，由圖像拍攝裝置114A、114B、116自模組112之一第二位置獲取場景122之圖像(204A)。接著，相對於由圖像拍攝裝置在第二位置處獲取之場景122之圖像而執行程序206至214。由215共同指示執行此等程序，其提供一第二3D彩色點雲146B作為輸出，第二3D彩色點雲146B包含空間中之各點(即，(x,y,z))之色彩資料(例如R、G、B)。亦可將3D彩色點雲146B儲存於記憶體144中。

在一些實施方案中，可依除紅色(R)、綠色(G)及藍色(B)之外之組合表達色彩資料(v₁、v₂、v₃)。此外，在一些情況中，可基於由圖像拍攝裝置114A、114B、116自其他優勢點獲取之場景122之圖像而獲得額外3D彩色點雲。無論如何，將各種3D點雲146A、146B提供至對位引擎140，對位引擎140亦自第三圖像拍攝裝置116接收圖像資料作為輸入。如上文所提及，來自圖像拍攝裝置116之資料包含場景122之彩色(例如RGB)圖像資料。對位引擎140使用2D色彩資訊來增強合併個別3D點雲146A、146B之對位程序。第三(彩色)圖像可促進將難以使用一稀疏、低z解析度輸入來實現之對位程序。圖4中繪示在一些例項中由引擎140實施之對位程序之細節。

對位引擎140藉由執行對位程序(216)來產生且輸出一合併、融合3D點雲。下文將描述根據一些實施方案之對位程序216之進一步細節。可將合併、融合3D點雲提供至(例如)包含一圖形使用者介面之一顯示裝置120。因此，可將合併、融合3D點雲顯示於顯示裝置120之一觀看螢幕上。一使用者可使用(例如)一游標來旋轉顯示於螢幕上之合併、融合3D點雲，使得當旋轉3D點雲時，可在顯示器螢幕上看見場景122之不同視角。因此，回應於使用者輸入而旋轉顯示器螢幕上之點雲。

圖3繪示根據一些實施方案之插值程序(圖2中之212)之進一步細節。一般而言，使用一區塊處理技術來減小視差圖之稀疏度且增大視差圖之密度。可使用運算快速且保留幾何邊緣之一邊緣保留技術，藉此避免密度圖之幾何邊緣之模糊。在此背景下，「幾何邊緣」係指由視差值劃界之邊緣(與「對比邊緣」相反，「對比邊緣」係指由像素值或梯度值(諸如密度梯度、RGB梯度或灰階梯度)劃界之邊緣)。

如圖3中所展示，在302中，插值引擎136處理視差圖(其可儲存於(例如)一輸入緩衝器中)之一初始區塊(或核心)且判定某些特定值。初始區塊可定位於(例如)視差圖之左上角中且表示涵蓋預判定數目個像素之一窗。區塊之大小可取決於(例如)諸如視差圖之稀疏度及雜訊位準之各種因數。例如，在一些例項中，稀疏度越高，區塊大小越大。典型區塊大小係5×5個像素、7×7個像素或11×11個像素。其他區塊大小可適用於一些應用。例如，在一些實施方案中，區塊可包含偶數個像素列及像素行(例如6×6、10×10或12×12)。在此等例項中，應(例如)藉由根據區塊內之分佈將一不同加權數指派給複數個中心像素(或其他指定像素)來相應地修改插值程序212。無論如何，在所繪示之實例中，插值引擎136運算區塊之以下值：(i)區塊內之像素之有效(即、，非零)視差值之總和；(ii)區塊內之有效像素之數目；(iii)區塊內之最大視差值及其出現頻率；(iv)區塊內之第二最大視差值及其出現頻率；(v)區塊內之最小視差值及其出現頻率；(vi)區塊內之第二最小視差值及其出現頻率。亦可運算區塊內之像素之有效視差值之平方之總和。可將前述值儲存於(例如)與插值引擎136相關聯之臨時緩衝器中以供後續處理步驟使用。

接著，如由304所指示，若當前視差值係無效的(即，若區塊之中心像素先前被指派一0值或未被指派值)，則插值引擎136更新區塊之中心像素之視差值。特定言之，插值引擎136基於若干情境之何者可適用而更新中心像素之視差值。若區塊中之有效像素之數目小於一第一預定義值(其可係指有效數目臨限值)，則一第一情境係可適用的。在該情況中，區塊之中心像素保持無效且其值保持為0。若區塊具有足夠數目個有效像素使得區塊中之最大視差值與最小視差值之間之視差差值小於一第二預定義臨限值(其可指稱視差差值臨限值)，則一第二情境係可適用的。在該情況中，將視差值之平均數(即，總和/有效計數)指派給區塊中之中心像素。若區塊具有足夠數目個有效像素使得區塊中之最大視差值與最小視差值之間之差值大於視差差值臨限值，則一第三情境係可適用的。在該情況中，將來自最大值、第二最大值、最小值、第二最小值中之最頻繁出現之視差值指派給區塊之中心像素。下文將參考圖4A至圖4D來描述前述情境之實例。

圖4A繪示包含兩個物件402、403之一場景400之一圖像之一實例。該圖亦指示兩個物件402、403之間之幾何邊緣404。點(例如405、406)指示已被指派一各自視差值之視差圖中之位置。在所繪示之實例中，假定視差圖相對較稀疏。儘管可(例如)僅藉由使用既有視差值之平均值來填充額外視差值，但此一方法會使幾何邊緣404模糊且放大物件402、403，此係非所要的。

圖4B繪示上文所提及之第一情境之一實例。在此情況中，區塊(即，核心)410具有一中心像素412。區塊410內存在已具有一指派視差值之非常少像素(即，兩個像素)。若如同此實例般已被指派一視差值之區塊中之像素之數目小於有效數目臨限值(即，第一預定義臨限值)，則中心像素412未被指派一視差值(或其值保持為0以指示值係無效的)。

圖4C繪示上文所提及之第二情境之一實例。在此情況中，區塊 414具有一中心像素416且包含具有有效視差值之多個像素。若區塊414中之各種視差值之間之差較小(即，最大值-最小值<視差差臨限值)，則將等於區塊414中之其他像素之視差值之平均數的一視差值指派給中心像素416。

圖4D繪示上文所提及之第三情境之一實例。在此情況中，區塊418具有一中心像素420且包含具有有效視差值之多個像素。特定言之，在圖4D之實例中，區塊418涵蓋幾何邊緣404。若區塊418中之各種視差值之間之差較大(即，最大值-最小值視差差臨限值)，則將等於區塊418中之其他像素之最頻繁出現之視差值的一視差值指派給中心像素420。在一些情況中，不是自區塊之全部視差值中選擇最頻繁出現之值，而是自指派給區塊中之像素之值之一預定義子集選擇最頻繁出現之值(例如區塊中之最大視差值、區塊中之第二最大視差值、區塊中之最小視差值及區塊中之第二最小視差值)。使用來自其之一視差值將被指派給區塊之中心像素420之視差值之此一子集可有助於保留幾何邊緣404。針對一給定實施方案而預定義子集內之視差值之數目，但一般在運算速率與效能之間進行權衡。

應自結合圖4B至圖4D所描述之前述情境明白，更新區塊之中心像素之視差值可導致一特定視差值被指派給中心像素，或在一些情況中，可導致中心像素繼續具有一無效視差值(即，一0值)。

返回至圖3，在更新區塊之中心像素(304)之後，程序檢查是否到達像素行之末端(306)。若已到達像素行之末端，則完成由插值引擎136掃描視差圖(318)。否則，如上文所描述，程序繼續掃描像素之區塊，直至已掃描全部列及行。因此，若未完成當前行之掃描，則程序使區塊之位置向下移位(308)。例如，在區塊之底部處新增特定數目個(例如1個)列，且插值引擎136計算當前區塊之以下值(308A)：(i)區塊內之像素之有效視差值之總和；(ii)區塊內之有效像素之數目；(iii)區塊內之最大視差值及其出現頻率；(iv)區塊內之第二最大視差值及其出現頻率；(v)區塊內之最小視差值及其出現頻率；(vi)區塊內之第二最小視差值及其出現頻率。接著，自區塊之頂部減去特定數目個(例如1個)列，且插值引擎136重新計算當前區塊之以下值(308B)：(i)區塊內之像素之有效視差值之總和；(ii)區塊內之有效像素之數目；(iii)區塊內之最大視差值及其出現頻率；(iv)區塊內之第二最大視差值及其出現頻率；(v)區塊內之最小視差值及其出現頻率；(vi)區塊內之第二最小視差值及其出現頻率。接著，插值引擎136依相同於上文304中所描述之方式的方式更新區塊之中心像素之視差值(310)。因此，若區塊之中心像素之當前視差值係無效的(即，若區塊之中心像素先前被指派一0值或未被指派值)，則插值引擎136基於第一情境、第二情境或第三情境之何者可適用而更新區塊之中心像素之視差值。

在310之後，程序檢查是否已到達像素列之末端(312)。若已達到像素列之末端，則程序返回至306。否則，程序藉由使區塊向右水平移位(314)來繼續掃描當前列。例如，在區塊之右手側處新增特定數目個(例如1個)行，且插值引擎136計算當前區塊之以下值(314A)：(i)區塊內之像素之有效視差值之總和；(ii)區塊內之有效像素之數目；(iii)區塊內之最大視差值及其出現頻率；(iv)區塊內之第二最大視差值及其出現頻率；(v)區塊內之最小視差值及其出現頻率；(vi)區塊內之第二最小視差值及其出現頻率。接著，自區塊之左手側減去特定數目個(例如1個)行，且插值引擎136重新計算當前區塊之以下值(314B)：(i)區塊內之像素之有效視差值之總和；(ii)區塊內之有效像素之數目；(iii)區塊內之最大視差值及其出現頻率；(iv)區塊內之第二最大視差值及其出現頻率；(v)區塊內之最小視差值及其出現頻率；(vi)區塊內之第二最小視差值及其出現頻率。接著，插值引擎136依相同於上文304中所描述之方式的方式更新區塊之中心像素之視差值(316)。因此，若區塊之中心像素之當前視差值係無效的(即，若區塊之中心像素先前被指派一0值或未被指派值)，則插值引擎136基於第一情境、第二情境或第三情境之何者可適用而更新區塊之中心像素之視差值。接著，程序返回至312且繼續使區塊移位通過各種列及行，直至由視差圖表示之整個像素陣列被掃描。

在圖3及圖4A至圖4D之以上描述中，參考區塊之中心像素。然而，在其他實施方案中，不是相對於中心像素而採取各種動作，而是可相對於並非為中心像素之一指定像素而採取各種動作。

圖3A繪示根據一些實施方案之插值程序(圖2中之212)之另一方案。如同圖3之實例，至插值引擎136之輸入係可儲存於(例如)一輸入緩衝器中之一稀疏視差圖。在一些情況中，少於10%之像素可具有與其相關聯之一視差值。例如，基於視差圖之稀疏度及/或雜訊位準而選擇一區塊大小。如圖3A中所展示，在352中，插值引擎136處理視差圖之一初始區塊(或核心)且運算某些特定值。初始區塊可定位於(例如)視差圖之左上角中且表示涵蓋預判定數目個像素之一窗。在此情況中，插值引擎136運算區塊之以下值：(i)區塊內之有效(即，非零)視差值之數目(「n」)；(ii)區塊內之有效視差值之總和；及(iii)區塊內之有效視差值之平方之總和。可將此等值儲存於(例如)與插值引擎136相關聯之臨時緩衝器中以供後續處理步驟使用。

接著，如由354所指示，引擎136比較有效視差值之數目(「n」)與一先前判定之第一最小臨限值且判定有效視差值之數目是否小於第一最小臨限值(或等效地，數目n是否等於或大於第一最小臨限值)。第一最小臨限值可用實驗方法來判定且可取決於(例如)區塊大小。在一些例項中，第一最小臨限值等於區塊中之像素之數目之8%。

若區塊中之有效視差值之數目(n)小於第一最小臨限值，則假定區塊可能具有拍攝雜訊。因此，在此情況中，將一0值指派給區塊中之一指定像素(例如右下像素)(356)。可將指派值儲存於(例如)一輸出緩衝器中。接著，程序藉由(例如)使區塊移位一行或一列且對新區塊重複程序(358)來繼續。

另一方面，若在354中插值引擎136判定區塊中之有效視差值之數目(n)等於或大於第一最小臨限值，則插值引擎136運算區塊之平均視差值及區塊中之視差值之一標準差(360)。可將此等值儲存於(例如)臨時緩衝器中。對於不看重快速運算之非即時應用，可將標準差(例如)計算如下：其中x係一特定像素之視差值，x係區塊之視差值之平均值，且n係具有一有效(即，非零)視差值之區塊中之像素之數目。對於很看重快速運算之即時應用，可將一修改標準差(例如)計算如下：

接著，如由362所指示，插值引擎136比較運算標準差與一先前判定之第二最小臨限值且判定運算標準差是否小於第二最小臨限值(或等效地，運算標準差是否等於或大於第二最小臨限值)。第二最小臨限值可取決於(例如)預期應用(例如待拍攝於由攝影機獲取之圖像中之一場景之背景與前景之間之距離差)。若運算標準差小於第二臨限值，則插值引擎136將先前計算之平均視差值指派給區塊中之一指定像素(例如右下像素)(364)。可指派視差值儲存於輸出緩衝器中。當運算標準差小於第二臨限值時，此指示：像素之區塊涵蓋具有與攝影機之一近乎恆定距離之一表面。

另一方面，若在362中插值引擎136判定運算標準差等於或大於第二臨限值，則此指示：區塊落於一邊緣上。在該情況中，插值引擎136判定區塊之像素中之最頻繁出現之視差值且將該最頻繁出現之視差值指派給區塊中之指定像素(例如右下像素)(366)。在此情況中，指派視差值係一實際值而非僅為一平均值。此步驟允許程序保留邊緣而非將邊緣平均化。可將指派值儲存於(例如)輸出緩衝器中。接著，程序藉由使區塊移位(例如)一行或一列且對新區塊重複程序(358)來繼續。

可對各區塊重複圖3A之前述程序，直至處理完整個圖像。使用前述程序，且若(i)一區塊大小係S×S個像素，(ii)在圖3A中之步驟之各反覆期間一次移位一行或一列，且(iii)待在各反覆期間被指派一視差值之指定像素係區塊之右下角中之像素，則在圖3A之前述程序期間不會給最上S列及最左S行指派一視差值。然而，此等像素可僅被指派(例如)一0視差值。

圖5繪示根據一些實施方案之由對位引擎140執行之對位程序(圖2中之216)之進一步細節。如上文所解釋，對位程序216接收兩個或兩個以上融合(即，彩色)3D點雲146A、146B作為輸入。對位程序216使用由第三圖像拍攝裝置116獲取之2D色彩資訊來增強對位程序，其合併個別離散3D點雲146A、146B以產生且輸出一合併、融合3D點雲148。

作為對位程序216之部分，對位引擎140識別且分離離散融合3D點雲146A、146B之各者之前景區域及背景區域(圖5中之504)。可使用各種已知前景分離技術(有時指稱前景偵測)之任何者。在一些例項中，一預定義臨限深度值可用於劃分屬於前景或背景之像素。預定義臨限值可取決於(例如)圖像拍攝裝置114A、114B中之感測器之敏感度及其他因數。

對位程序216包含：擷取且平滑化各點雲之前景及/或減去(即，消除)各點雲之背景(圖5中之506)。可使用各種已知平滑技術之任何者。此等技術之實例包含高斯(Gaussian)濾波器、雙向濾波器及低通濾波器。接著，擷取各點雲之前景之2D關鍵點(508)。在此背景下，2D關鍵點由點雲之色彩及/或灰階之梯度定義且對應於對比邊緣(而非幾何邊緣)。可用於擷取前景之2D關鍵點之演算法之實例係尺度不變特徵變換(SIFT)演算法及SIFT之加速型(SURF)演算法。亦可使用其他演算法。對離散融合3D點雲146A、146B之各者分別執行圖5中之步驟506及508。

在2D關鍵點擷取(508)之後，對位引擎140識別各種離散3D點雲之間之對應性(510)。基於使用2D關鍵點來識別兩個或兩個以上3D點雲之間之匹配區域而判定兩個或兩個以上3D點雲之間之對應性。因此，對位程序216之此部分係對比邊緣(例如來自第三圖像拍攝裝置116之RGB色彩資料)如何用於增強對位程序且識別兩個或兩個以上3D點雲之間之對應點之一實例。使用對比邊緣(而非幾何邊緣)來判定此對應性可為有利的，此係因為：如上文所解釋，深度通道最初僅提供低z解析度及稀疏視差。

在判定各種3D點雲之間之對應性之後，程序216將識別關鍵點投影至3D關鍵點上(512)。因此，程序216使2D關鍵點之座標與3D關鍵點關聯。特定言之，將一2D關鍵點之與一特定像素或像素組相關聯之視差值反投影為對應3D點雲之一深度值。接著，程序216對位3D特徵且可消除離群值(514)。可自對應3D關鍵點獲得對位矩陣。程序216將一對位變換應用於各3D點雲以獲得一合併3D點雲(即，與兩個或兩個以上離散3D點雲對比)(516)。在一些例項中，程序216將一3D平滑濾波應用於合併3D點雲以消除對位誤差及/或量測誤差(518)。如先前所解釋，起因於程序216之對位引擎140之輸出係一合併、融合3D點雲148。

本文所描述之技術在(例如)手持式行動裝置及其他應用中可為尤其有利的，在該等其他應用中，基線(深度通道之間之距離)趨向於較小，深度通道之圖像及光學器件趨向於具有相對較差品質，且運算時間需要相對較快(例如即時或近即時)。當然，該等技術亦可用於其他應用。

在一些情況中，可在電腦螢幕上將合併、融合3D點雲顯示為一電腦輔助設計(CAD)模型。此外，在一些情況中，可將合併、融合三維點雲提供為至一3D印表機之輸入，該3D印表機可操作以藉由鋪設一材料之諸多連續薄層來自三維數位模型製造一實體物件。例如，可將3D掃描器整合至一智慧型電話或其他手持式運算裝置中。

在一些例項中，一或多個處理器可執行合併、融合三維點雲之降低取樣以減少資料量。此外，在一些情況中，所得資料可經平滑化以消除冗餘資訊。例如，可將空間及色彩資訊(x,y,z,c)平均化，其可有助於減小檔案大小且使處置更容易。接著，可使用平滑化資料來(例如)形成一網格模型，接著可將該網格模型用作為至一顯示器、3D印表機或其他裝置之輸入。

可在數位電子電路、積體電路、特殊設計之ASIC(專用積體電路)、電腦硬體、韌體、軟體及/或其等之組合中實現本文所描述之各種實施方案。此等各種實施方案可包含可在包含至少一可程式化處理器之一可程式化系統上執行及/或解譯之一或多個電腦程式中之實施方案，該至少一可程式化處理器可為專用或通用的，經耦合以自一儲存系統、至少一輸入裝置及至少一輸出裝置接收資料及指令及將資料及指令傳輸至一儲存系統、至少一輸入裝置及至少一輸出裝置。

此等電腦程式(亦稱為程式、軟體、軟體應用程式或程式碼)包含用於一可程式化處理器之機器指令，且可用一高階程序及/或物件導向程式設計語言及/或組合/機器語言來實施。如本文所使用，術語「機器可讀媒體」、「電腦可讀媒體」係指用於將機器指令及/或資料提供至一可程式化處理器之任何電腦程式產品、設備及/或裝置(例如磁碟、光碟、記憶體、可程式化邏輯裝置(PLD))，其包含將機器指令接收為一機器可讀信號之一機器可讀媒體。術語「機器可讀信號」係指用於將機器指令及/或資料提供至一可程式化處理器之任何信號。

應易於明白，可在本發明之精神內對前述實例作出各種修改。例如，在一些例項中，可省略一些程序或步驟。此外，在一些情況中，可執行額外程序或步驟。亦可作出其他修改。因此，其他實施方案係在申請專利範圍之範疇內。