TWI507020B

TWI507020B - 基於深度的三維影像處理方法

Info

Publication number: TWI507020B
Application number: TW102131453A
Authority: TW
Inventors: shou-ke Ma
Original assignee: Hon Hai Prec Ind Co Ltd
Priority date: 2013-08-23
Filing date: 2013-08-30
Publication date: 2015-11-01
Also published as: US20150055700A1; CN104427323A; TW201509173A; CN104427323B; US9525887B2

Description

基於深度的三維影像處理方法

本發明係有關於一種影像處理方法，且特別有關於一種基於深度的三維影像處理方法。

三維視訊顯示主要是在傳統的二維影像上增加深度影像，以增強視覺的現實感和逼真感。影像的深度指的是場景到成像平面的距離信息，以000~255的灰階值(即，亮度值)來表示。距離成像平面愈近，深度影像的亮度越高(灰階值越大)，反之，距離成像平面愈遠，深度影像的亮度越低(灰階值越小)。

三維視訊的影像數據量很大，因此需要對三維視訊進行壓縮，以避免儲存空間不足和傳輸延遲的問題。已知的影像演算法(例如，MPEG和H.264)僅能對二維視訊進行壓縮，而不能直接對三維視訊進行壓縮。

因此，需要一種可有效壓縮深度信息的影像處理方法。

有鑒於此，本發明實施例提供一種基於深度的三維影像處理方法，適用於一電子裝置，在保持顏色視訊之畫質的情況下能再進一步降低碼率(Bit Rate)，從而減少視訊資料量以利儲存與傳輸。

本發明實施例提供一種基於深度的三維影像處理方法，該方法包括下列步驟：自一視訊源取得三維視訊串流，並自該三維視訊串流擷取其中一個視訊幀；自該視訊幀分離出一第一顏色巨集區塊與對應該些顏色巨集區塊之一第一深度巨集區塊；對該第一深度巨集區塊執行一下採樣操作以產生一第二深度巨集區塊；對該第一顏色巨集區塊執行一深度信息嵌入操作，其中，將該第二深度巨集區塊的深度信息嵌入到該第一顏色巨集區塊中以產生一第二顏色巨集區塊；對該第二顏色巨集區塊執行影像處理以產生一第三顏色巨集區塊；對該第三顏色巨集區塊執行一深度視訊擷取操作，其中，擷取該第三顏色巨集區塊中的深度信息以產生一當前視角之第四顏色巨集區塊，並根據該深度信息產生一第三深度巨集區塊；對該第三深度巨集區塊執行一上採樣操作；合成該上採樣後之第三深度巨集區塊與該第四顏色巨集區塊以產生一另一視角之第五顏色巨集區塊；以及將該第四顏色巨集區塊與該第五顏色巨集區塊合成為三維視訊。

較佳地，在本發明實施例之基於深度的三維影像處理方法中，該深度信息嵌入操作更包括下列步驟：將該第一顏色巨集區塊劃分為複數個子顏色巨集區塊；對該第一深度巨集區塊進行下採樣以產生該第二深度巨集區塊，其中該第二深度巨集區塊之總像素數為該第一深度巨集區塊的1/N；以及自該第二深度巨集區塊擷取任意複數個深度像素中的深度信息，並且嵌入至該些子顏色巨集區塊中，以得到具有深度信息之該第二顏色巨集區塊。

較佳地，在本發明實施例之基於深度的三維影像處理方法中，該些子顏色巨集區塊包括4個亮度巨集區塊與2個色度巨集區塊。

較佳地，本發明實施例之基於深度的三維影像處理方法更包括下列步驟：將該些亮度巨集區塊之每一個亮度巨集區塊的任意2個像素，以該第二深度巨集區塊的任意2個像素置換；以及將該些色度巨集區塊之每一個色度巨集區塊的任意4個像素，以該第二深度巨集區塊的任意4個像素置換。

較佳地，在本發明實施例之基於深度的三維影像處理方法中，該第二深度巨集區塊之總像素數為該第一深度巨集區塊的1/16。

較佳地，在本發明實施例之基於深度的三維影像處理方法中，該深度視訊擷取操作更包括下列步驟：將該些亮度巨集區塊之每一個亮度巨集區塊的2個像素以及該些色度巨集區塊之每一個色度巨集區塊的4個像素中之該深度信息擷取出來，並根據該深度信息產生該第三深度巨集區塊。

210、340‧‧‧顏色巨集區塊

220‧‧‧亮度巨集區塊

230‧‧‧色度巨集區塊

310‧‧‧深度巨集區塊

320‧‧‧亮度信息

210、340‧‧‧顏色巨集區塊

220‧‧‧亮度巨集區塊

330‧‧‧色度信息

圖1係顯示本發明實施例之基於深度的三維影像處理方法的步驟流程圖。

圖2係顯示本發明實施例之深度信息嵌入方法的步驟流程圖。

圖3係顯示本發明實施例之深度信息擷取方法的步驟流程圖。

本發明實施例之基於深度的三維影像處理方法將深度視訊進行下採樣後，以隱寫的方式嵌入至顏色視訊之亮度和色度巨集區塊中，然後再進行視訊壓縮。因此，在保持顏色視訊之畫質的情況下能再進一步降低碼率(Bit Rate)，從而減少視訊資料量以利儲存與傳輸。

自一視訊源取得三維視訊串流，自該三維視訊串流擷取複數個視訊幀，並依序對每一個視訊幀進行處理。首先，自第一個視訊幀分離出至少一個顏色巨集區塊(Macroblock(MB))與對應該些顏色巨集區塊之至少一個深度巨集區塊(步驟S102、S104)，其中該顏色巨集區塊之總像素數為16*16，採樣格式為Y：Cb：Cr=4：4：4。該深度巨集區塊之總像素數為16*16，採樣格式為Y：Cb：Cr=4：0：0。

對該(第一)顏色巨集區塊進行殘差處理，並且執行一深度視訊下採樣操作，即，對該(第一)深度巨集區塊進行下採樣(步驟S106)。對該(第一)顏色巨集區塊執行一深度信息嵌入操作，即，將該(第一)深度巨集區塊的深度信息嵌入(隱寫)到對應之該(第一)顏色巨集區塊中(步驟S108)。

圖2係顯示本發明實施例之深度信息嵌入方法(步驟S108)的步驟流程圖。

對該(第一)顏色巨集區塊的Cb像素和Cr像素進行下採樣，其中採樣格式為Y：Cb：Cr=4：2：0。將該(第一)顏色巨集區塊劃分為6個子顏色巨集區塊(步驟S202)，其中包括4個亮度巨集區塊與2個色度巨集區塊(總像素數分別為8*8)。將該(第一)深度巨集區塊按1/16比例進行下採樣後，形成總像素數為4*4的深度巨集區塊(步驟S204)，以下稱為第二深度巨集區塊。

自該第二深度巨集區塊擷取任意複數個深度像素中的深度信息，並且嵌入至每一個亮度巨集區塊與每一個色度巨集區塊中(步驟S206、S208)。上述深度信息嵌入操作包括將4個亮度巨集區塊中之每一個亮度巨集區塊的任意2個像素(例如，在位置(1,1)與(8,8)的像素)，以該第二深度巨集區塊的任意2個像素置換，以及將2個色度巨集區塊中之每一個色度巨集區塊的任意4個像素(例如，在位置(1,1)、(1,8)、(8,1)與(8,8)的像素)以該第二深度巨集區塊的任意4個像素置換。如此，可得到具有深度信息之顏色巨集區塊210(第二顏色巨集區塊)，其包括4個亮度巨集區塊與2個色度巨集區塊。

需注意到，可使用該第二深度巨集區塊中與該亮度或色度巨集區塊中對應位置的像素來置換。

回到圖1，深度信息被嵌入後，對(第二)顏色巨集區塊210進行離散餘弦轉換(Discrete Cosine Transform，DCT)與量化(Quantization)操作(步驟S110)。對包含(第二)顏色巨集區塊210的視訊串流進行熵編碼(Entropy Encoding)以得到視訊編碼流(步驟S112)，接著進行熵解碼(Entropy Decoding)以得到視訊解碼流(步驟S114)，然後傳送到網路層115以傳送到遠端或儲存。

另一方面，對已完成變換與量化操作後之(第二)顏色巨集區塊210進行反離散餘弦轉換(Inverse DCT)與反量化(Inverse Quantization)(步驟S116)操作，以解碼恢復含深度信息之顏色巨集區塊210(以下稱為第三顏色巨集區塊)。對該第三顏色巨集區塊執行一深度視訊擷取操作，即，擷取該第三顏色巨集區塊中的深度信息，以及恢復該第三顏色巨集區塊中的色度與亮度信息以作為下一個視訊幀之編碼參考(步驟S118)。

圖3係顯示本發明實施例之深度信息擷取方法(步驟S118)的步驟流程圖。

該第三顏色巨集區塊包括4個亮度巨集區塊220與2個色度巨集區塊230。將在步驟S206與S208中嵌入的深度信息擷取出來。也就是說，將4個亮度巨集區塊220中之每一個亮度巨集區塊的2個像素(例如，在位置(1,1)與(8,8)的像素)以及2個色度巨集區塊230中之每一個色度巨集區塊的4個像素(例如，在位置(1,1)、(1,8)、(8,1)與(8,8)的像素)中的深度信息擷取出來(步驟S302與S306)，以取得顏色巨集區塊210之深度信息，並據以產生深度巨集區塊310(第三深度巨集區塊)。

對亮度巨集區塊220與色度巨集區塊230進行信息估計和預測(步驟S304與S308)，以取得該第三顏色巨集區塊之亮度信息320與色度信息330。經由上述處理，可得到已去除深度信息之顏色巨集區塊340(第四顏色巨集區塊)。

將顏色巨集區塊340之前已經解碼完成的畫面作為參考幀(Reference Frame)，並且依據該參考幀對下一個視訊幀進行幀內預測和運動估計(步驟S120)，進而得到一個預測巨集區塊。根據該預測巨集區塊與下一個視訊幀之顏色巨集區塊相減得到一個最優殘差值，以作為下一個視訊幀編碼的原始數據。

另一方面，在接收端對深度巨集區塊310執行一深度視顏上採樣(Up-Sampling)操作(步驟S122)。將上採樣後的深度巨集區塊310和當前視角的顏色巨集區塊340合成以得到另一視角的巨集區塊。根據深度巨集區塊310的深度信息來調整該另一視角的(第五)顏色巨集區塊對兩眼的偏移距離，並且將該第四與第五顏色巨集區塊合成為三維視訊(步驟S124)。將合成後的三維視訊傳送到接收端(未顯示)的顯示設備(步驟S126)。

當處理完第一個視訊幀後，即重複上述步驟，對下一個視訊幀進行處理。需注意到，步驟S122、S124與S126都是在接收端(未顯示)完成。

本發明實施例之基於深度的影像處理方法對深度信息進行下採樣後嵌入顏色視訊，從壓縮的碼流中擷取深度信息並進行上採樣，然後對顏色視訊的丟失信息進行估計和重建。如此一來，可以在視訊較少失真的情況下進一步壓縮碼流，以減少壓縮視訊傳輸資料量。

S102..S126‧‧‧操作步驟

Claims

一種基於深度的三維影像處理方法，該方法包括下列步驟：自一視訊源取得三維視訊串流，並自該三維視訊串流擷取其中一個視訊幀；自該視訊幀分離出一第一顏色巨集區塊與對應該些顏色巨集區塊之一第一深度巨集區塊；對該第一深度巨集區塊執行一下採樣操作以產生一第二深度巨集區塊；對該第一顏色巨集區塊執行一深度信息嵌入操作，其中，將該第二深度巨集區塊的深度信息嵌入到該第一顏色巨集區塊中以產生一第二顏色巨集區塊；對該第二顏色巨集區塊執行影像處理以產生一第三顏色巨集區塊；對該第三顏色巨集區塊執行一深度視訊擷取操作，其中，擷取該第三顏色巨集區塊中的深度信息以產生一當前視角之第四顏色巨集區塊，並根據該深度信息產生一第三深度巨集區塊；對該第三深度巨集區塊執行一上採樣操作；合成該上採樣後之第三深度巨集區塊與該第四顏色巨集區塊以產生一另一視角之第五顏色巨集區塊；以及將該第四顏色巨集區塊與該第五顏色巨集區塊合成為三維視訊。
如申請專利範圍第1項所述之基於深度的三維影像處理方法，其中，該深度信息嵌入操作更包括下列步驟：將該第一顏色巨集區塊劃分為複數個子顏色巨集區塊；對該第一深度巨集區塊進行下採樣以產生該第二深度巨集區塊，其中該第二深度巨集區塊之總像素數為該第一深度巨集區塊的1/N；以及自該第二深度巨集區塊擷取任意複數個深度像素中的深度信息，並且嵌入至該些子顏色巨集區塊中，以得到具有深度信息之該第二顏色巨集區塊。
如申請專利範圍第2項所述之基於深度的三維影像處理方法，其中，該些子顏色巨集區塊包括4個亮度巨集區塊與2個色度巨集區塊。
如申請專利範圍第3項所述之基於深度的三維影像處理方法，其更包括下列步驟：將該些亮度巨集區塊之每一個亮度巨集區塊的任意2個像素，以該第二深度巨集區塊的任意2個像素置換；以及將該些色度巨集區塊之每一個色度巨集區塊的任意4個像素，以該第二深度巨集區塊的任意4個像素置換。
如申請專利範圍第3項所述之基於深度的三維影像處理方法，其更包括下列步驟：將該些亮度巨集區塊之每一個亮度巨集區塊的任意2個像素，以該第二深度巨集區塊中相應位置之2個像素置換；以及將該些色度巨集區塊之每一個色度巨集區塊的任意4個像素，以該第二深度巨集區塊中相應位置之任意4個像素置換。
如申請專利範圍第2項所述之基於深度的三維影像處理方法，其中，該第二深度巨集區塊之總像素數為該第一深度巨集區塊的1/16。
如申請專利範圍第3項所述之基於深度的三維影像處理方法，其中，該深度視訊擷取操作更包括下列步驟：將該些亮度巨集區塊之每一個亮度巨集區塊的2個像素以及該些色度巨集區塊之每一個色度巨集區塊的4個像素中之該深度信息擷取出來，並根據該深度信息產生該第三深度巨集區塊。