TWI568271B

TWI568271B - 用於視訊編碼之延伸空間可縮放性之改良式層間預測技術

Info

Publication number: TWI568271B
Application number: TW097100557A
Authority: TW
Inventors: 王香玲; 賈斯汀萊德吉
Original assignee: 諾基亞科技公司
Priority date: 2007-01-08
Filing date: 2008-01-07
Publication date: 2017-01-21
Also published as: WO2008084423A1; RU2009130154A; EP2106666A1; US20080165855A1; CA2674438C; US9049456B2; EP2106666A4; AR064782A1; CN104822062A; TW200840369A; CN104822062B; CA2674438A1; CN101617538A; EP2106666B1; RU2426267C2

Description

用於視訊編碼之延伸空間可縮放性之改良式層間預測技術

發明領域

本發明一般係有關視訊編碼之領域。更明確地說，本發明係有關一種可支援延伸空間可縮放性之可縮放性視訊編碼。

發明背景

此章節預計係提供申請專利範圍中所列舉本發明之背景或背景環境。本說明書之說明內容，可能包括一些可被追求之觀念，但非必然為先前已被構思或追求者。所以，除非本說明書另有指示，此章節中所描述者，對此申請案中之說明內容和申請專利範圍，並非屬習知技術，以及係不因納入此章節內而被親為屬習知技術。

不同之科技已明訂有不同之標準。視訊編碼標準係包括：ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual和ITU-T H.264(亦知名為ISO/IEC MPEG-4 Advanced Video Coding(AVC)或簡稱H.264/AVC)。此外，目前仍在努力進行開發新式視訊編碼標準。有一個發展中之標準，為可縮放性視訊編碼標準(SVC)，其將會變為H.264/AVC標準之可縮放性擴增(scalable extension)。該SVC之最新草案，係H.264/Advanced Video Coding(AVC)(新一代視頻編碼)標準之附錄F(今為在附錄G)。特言之，附錄F係包括一種知名為延伸式空間可縮放性(ESS)之特徵，其係在基層巨區塊(MB)與強化層巨區塊之邊緣對準不能維持的情況中，被備用來使信號編碼及解碼。當空間縮放比例係以1或2之比率來執行，以及巨區塊邊緣橫跨不同層係呈對齊狀時，其係被視為一個特殊情況之空間可縮放性。

舉例而言，當利用二進解析度尺度(dyadic resolution scaling)(亦即，2冪方尺度解析度)時，巨區塊之邊緣對準係可被維持。此一現象係例示在第1圖中，其中，一個在左邊(該基層畫格1000)上面之半解析度，係被上取樣而產生一個在右邊(一個強化層畫格1100)上面之全解析度。考慮該基層畫格1000中的巨區塊MB₀ ，此巨區塊在上取樣後之邊界，係顯示為該強化層畫格1100中之外部邊界。在此一情形中，值得注意的是，該上取樣之巨區塊恰恰涵蓋住該強化層處的四個全解析度巨區塊-MB₁ 、MB₂ 、MB₃ 、和MB₄ 。此四個強化層巨區塊MB₁ 、MB₂ 、MB₃ 、和MB₄ 之邊緣，恰恰對應於上述巨區塊MB₀ 之上取樣的邊界。重要的是，上述被識別之基層巨區塊，係涵蓋每個強化層巨區塊MB₁ 、MB₂ 、MB₃ 、和MB₄ 的唯一基層巨區塊。換言之，形成MB₁ 、MB₂ 、MB₃ 、和MB₄ 有關之預測，並不需要其他之基層巨區塊。

另一方面，在非二進可縮放性之情況中，該情形便炯然不同。此係就一個1.5之縮放比例因素而例示在第2圖中。在此一情況中，該基層畫格1000中之基層巨區塊MB₁₀ 和MB₂₀ ，係自16x16上取樣至該較高解析度之強化層畫格110中的24x24。然而，考慮該強化層巨區塊MB₃₀ ，可清楚觀察到的是，此巨區塊係被兩個不同上取樣之巨區塊-MB₁₀ 和MB₂₀ 所涵蓋。因此，為形成該強化層巨區塊MB₃₀ 有關之預測。將需要兩個基層巨區塊，MB₁₀ 和MB₂₀ 。事實上，取決於所使用之縮放比例因素，一個單一強化層巨區塊，可能會被多達四個之基層巨區塊所涵蓋。

在H.264/AVC標準之附錄F的當前草案中，一個強化層巨區塊，有可能要相對於一個相關聯之基層畫格而被編碼，即使是形成該預測可能需要幾個基層巨區塊。由於編碼效率與預測準確性係密切相關，該強化層巨區塊係希望形成準確之預測，以便提昇編碼之效率。

依據該H.264/AVC標準之附錄F的當前草案，一個當前之強化層巨區塊的許多屬性，係可自其對應之基層巨區塊被預測出。舉例而言，一些來自該基層之內編碼的巨區塊(亦被稱作內巨區塊或內MB)，係完全被解碼及重建，而使彼等可能被上取樣及被用來直接預測一個對應之強化層的亮度和色訊像素值。此外，彼等出自該基層之間編碼的巨區塊(亦被稱作做間巨區塊或間MB)並未完全被重建。取而代之的是，唯有每個基層間MB之預測殘差會被解碼，以及可能被用來預測一個強化層預測殘差，但針對該基層間MB，並無移動補償被執行。此係被稱作”殘差預測”。此外，就間MB而言，彼等基層移動向量亦會被上取樣，以及會被用來預測彼等強化層移動向量。

除上文所述者外，在H.264/AVC標準之附錄F中，就每個強化層巨區塊，係有一個名為base_mode_flag之旗標被界定。當此旗標等於1時，該強化層巨區塊之類型、模態、和移動向量，則應自其基層MB被完全預測出(或推論出)。由於上述用以自基層MB取得一個強化層巨區塊之巨區塊類型、模態、和移動向量的同一方法，係為該等編碼器和解碼器兩者所知曉，在此種情況中，便沒必要進一步將巨區塊類型和模態加上其移動向量等資訊編碼成位元流。若base_mode_flag等於0，則一個強化層巨區塊之巨區塊類型和模態等資訊便不做推論。

依據上文之討論，一個強化層巨區塊之巨區塊類型和模態等資訊在某些情形中，係可自其基層MB被完全預測出。依據H.264/AVC標準之附錄F的當前草案，當彼等強化層巨區塊，並未與彼等基層巨區塊形成邊緣對齊時，就每個強化層巨區塊而言，基於涵蓋該強化層巨區塊之基層巨區塊，會有一個虛擬基層巨區塊被推導出。該虛擬基層巨區塊之類型、模態、和移動向量，全係基於該(等)基層MB來決定。該虛擬基層巨區塊，接著將會被視為來自完全涵蓋此強化層巨區塊之基層的唯一巨區塊。若該base_mode_flag就當前之強化層巨區塊而言係等於1，則其類型、模態、和移動向量，便被設定為等同於該虛擬基層巨區塊者。

H.264/AVC標準之附錄F的當前草案中所界定用以決定該虛擬基層巨區塊之類型、模態、和移動向量的方法，係一種由下而上之程序。首先，就該虛擬基層巨區塊的每個4x4區塊而言，一個位於該區塊之第二列和第二行中的像素，係被用作該區塊有關之代表性點，其係顯示在第3圖中。在第3圖中，該巨區塊係表示在300處。該巨區塊內部的4x4區塊，係表示在310處，以及每個4x4區塊內部之代表性像素，係表示在320處。當虛擬基層巨區塊之當前4x4區塊，被來自基層的唯一4x4區塊涵蓋時，使用該虛擬基層巨區塊之每個4x4區塊中的一個像素，係具有單純性之優點。但當其被來自基層之多重4x4區塊涵蓋時，此種方法可能是不夠精確。

第4(a)和4(b)圖係顯示該等虛擬基層巨區塊300與對應基層巨區塊之間的關係。上述基層在上取樣之後會完全覆蓋該當前之強化層巨區塊的區域，係表示在第4(b)圖中之410處。此亦為對應於該虛擬基層巨區塊300之區域。該虛擬基層巨區塊300中的一個4x4區塊的一個代表性像素，係被標記為p_e 。其在該基層處之對應像素為p_b 。依據H.264/AVC標準之附錄F的當前草案，該基層處在第4(b)圖中之420處所指為p_b 所在的4x4區塊之巨區塊分區資訊，係被用作p_e 所在之強化層處的4x4區塊有關之分區資訊。換言之，上述覆蓋像素p_e 之基層的4x4區塊的分區資訊，係被用作p_e 所在之4x4區塊有關的分區資訊。在此種方式中，該虛擬基層巨區塊300內的每個4x4區塊，便可具有分區資訊。一些與此分區資訊有關之移動向量，亦被用作該強化層移動向量有關之預測值。

在該虛擬基層巨區塊內的每四個8x8區塊內，一個區塊合併程序係在4x4區塊層次下被激勵。誠如第5圖中所示，若區塊1、2、3、和4，全係由來自該基層之同一單一分區導得彼等之分區，則該8x8區塊之模態便被設定為8x8。否則，若區塊1和區塊2，係由來自該基層之同一單一分區導得彼等之分區，以及區塊3和區塊4，係由來自該基層之另一相同的分區導得彼等之分區，則該8x8區塊之模態便被決定為8x4。同理，若區塊1和區塊3具有相同之分區，以及區塊2和區塊4亦具有來自該基層之相同的分區，則該8x8區塊之模態，便被決定為4x8。否則，該8x8區塊之模態，便被決定為4x4。此程序將會在所有其他三個8x8區塊內部，分別一再被重複。

若所有四個8x8區塊，係在8x8模態中，一個區塊合併程序，亦在如第6圖中所顯示之8x8區塊層次下被執行。在第6圖中，區塊1、2、3、和4全係代表一個8x8區塊。若區塊1、2、3、和4，全係由來自該基層之同一單一分區導得彼等之分區，則該虛擬基層巨區塊之模態，係被決定應為16x16。若區塊1和區塊2具有相同之分區，以及區塊3和區塊4，亦具有來自該基層的相同之分區，則該虛擬基層巨區塊之模態，便被決定為16x8。若區塊1和區塊3具有相同之分區，以及區塊2和區塊4亦具有相同之分區，則該虛擬基層巨區塊之模態，便被設定為8x16。否則，該虛擬基層巨區塊之模態，便被設定為8x8。

依據H.264/AVC標準之附錄F的當前草案，該巨區塊模態之預測，係獨獨基於來自該基層之分區資訊。在此一安排中，彼等區塊唯有在該等區塊共用來自該基層之同一分區資訊時方可被合併。然而，在延伸式空間可縮放性之情況中，十分常見的是，來自該基層之不同分區，係具有相同之參考畫格指數和移動向量。舉例而言，兩個來自該基層之鄰位巨區塊，可具有相同之參考畫格指數和移動向量。此外，在延伸式空間可縮放性之情況中，極為常見的是，一個強化層巨區塊，應被來自該基層之多重巨區塊覆蓋。所以，僅使用分區資訊來決定兩個區塊是否應被合併，經常無必要在一個巨區塊內部建立小的分區。此種小分區將會增加移動補償中之樣本內插程序期間的計算複雜性。

有鑒於上文所述，提供一種可改善巨區塊模態有關之層間預測加上延伸式空間可縮放性之情況有關的移動向量，或將會是有利的。

發明概要

本發明之各種實施例，提供了一種用以改善上文所描述之延伸式空間可縮放性的情況有關之巨區塊模態的層間預測有關的系統和方法。該等各種實施例，亦提供了一種用以改善該延伸式空間可縮放性之情況中的移動向量有關之層間預測有關的系統和方法。一些用以預測巨區塊模態之傳統式系統，係單獨基於來自該基層之分區資訊；唯有當區塊共用來自該基層之同一分區資訊時，彼等方可被合併。另一方面，在本發明之實施例中，該合併程序係包括仰賴參考畫格指數和移動向量資訊。當區塊共用來自該基層之同一參考畫格指數和移動向量資訊時，此等區塊在可行時係可能被合併。所以，即使當兩個區塊具有來自該基層之不同分區時，彼等係有可能被合併在一起。此種系統和方法，係可避免不必要建立小的區塊分區，其復可降低移動補償之內插程序中的計算複雜性。

各種實施例可提供一種方法、電腦程式產品、和裝置，其可用以編碼一個代表一個可縮放性位元流內的至少一部分之視訊畫格的強化層區塊，藉此，可導出一個至少部份基於多個對應於多數參考層區塊之參考畫格指數值來指明上述強化層區塊之分區的編碼模態指示符，其中，該等具有同一參考畫格指數之參考層區塊會被合併，藉以導出該劃分之尺寸。該強化層區塊，係利用該編碼模態指示符來編碼。彼等實施例亦可提供一種方法、電腦程式產品、和裝置，其可用以解碼一個代表一個可縮放性位元流內的至少一部分之視訊畫格的強化層區塊，藉此，可導出一個至少部份基於多個對應於多數參考層區塊之參考畫格指數值來指明上述強化層區塊之分區的編碼模態指示符，其中，該等具有同一參考畫格指數之參考層區塊會被合併，藉以導出該分區之尺寸。該強化層區塊，係利用該編碼模態指示符來解碼。

其他之實施例可提供一種方法、電腦程式產品、和裝置，其可用以編碼一個代表一個可縮放性位元流內的至少一部分之視訊畫格的強化層區塊，藉此，可基於來自該等多數參考區塊中的至少一個之分區和移動向量資訊，就該強化層區塊，導出分區和移動向量資訊。該強化層區塊，係利用該分區和移動向量資訊來編碼。再有之其他實施例，可提供一種方法、電腦程式產品、和裝置，其可用以解碼一個代表一個可縮放性位元流內的至少一部分之視訊畫格的強化層區塊，藉此，可基於來自該等多數參考區塊中的至少一個之分區和移動向量資訊，就該強化層區塊，導出分區和移動向量資訊。該強化層區塊，係利用該分區和移動向量資訊來解碼。

在本發明的另一個實施例中，上述區塊合併有關之條件係可被放寬。在此實施例中，只要該等區塊共用同一參考畫格指數和類似之移動向量，彼等鄰位區塊便可使合併在一起。該合併之較大區塊有關的移動向量，係導自該等要使合併(預合併)之區塊的移動向量。

此外，一個虛擬基層巨區塊內的每個4x4區塊，照慣例基本上一直是以一個位於該區塊之第二列和第二行處的單一像素來表示，以及當前區塊有關之區分資訊，業已藉由使該代表性像素映射至基層並接著找出基層處的一個4x4區塊而取得。相形之下，在本發明之各種實施例中，一個4x4區塊之多重代表性像素，係可被用來表示該區段。當就該虛擬基層巨區塊內的一個當前區塊而言，在該基層處有多重之4x4區塊可用時，該虛擬基層巨區塊內的當前之區塊有關的分區和移動向量資訊，係可導自該等4x4區塊之所有分區資訊和移動向量。當使用一個4x4區塊內超過一個的代表性像素來導得來自該基層之分區加上移動向量資訊時，在該強化層處之移動向量，係有可能得到較正確之預測。移動向量之此種改良式預測，可藉此改良編碼效率。

本發明之各種實施例，可直接在使用以C/C++或組合語言為例等任何常見程式語言之軟體來實現。本發明之實施例，亦可在硬體中來實現，以及可被使用在消費性裝置中。

本發明之此等和其他優點和特徵，連同其之組織和運作方式，將可在配合所附諸圖之以下詳細說明而臻明確，其中，相似之元件遍及諸圖，在以下之說明中係具有相似之數字。

圖式簡單說明

第1圖係顯示二進解析度尺度中之巨區塊邊界的定位；第2圖係顯示非二進解析度中之巨區塊邊界的定位；第3圖係一個虛擬基層巨區塊之代表，而使每十六個4x4區塊有一個代表性像素；第4(a)圖係一個虛擬基層巨區塊之代表，以及第4(b)圖係顯示第4(a)圖之虛擬基層巨區塊與多個基層巨區塊之間的關係；第5圖係顯示依據H.264/AVC標準之附錄F，該區塊如何可能在一個虛擬基層巨區塊中之4x4區塊層次下被合併；第6圖係顯示依據H.264/AVC標準之附錄F，該區塊如何可能在一個虛擬基層巨區塊中之8x8區塊層次下被合併；第7圖係一個可顯示在依據H.264/AVC標準之附錄F使用一個單一代表性像素時被來自一個基層的多重4x4區塊覆蓋之4x4區塊的代表圖；第8圖係一個可顯示依據本發明的一個實施例在一個 4x4區塊中使用多重之代表性像素的代表圖；第9圖係顯示一個供本發明之各種實施例使用之一般性多媒體通訊系統；第10圖係一個可被使用在本發明之實現體中的通訊裝置之透視圖；而第11圖則係第10圖之通訊裝置的電話電路之示意圖。

較佳實施例之詳細說明

本發明之各種實施例，提供了一種用以改善上文所描述之延伸式空間可縮放性的情況有關之巨區塊模態的層間預測有關的系統和方法。該等各種實施例，亦提供了一種用以改善該延伸式空間可縮放性之情況中的移動向量有關之層間預測有關的系統和方法。一些用以預測巨區塊模態之傳統式系統，係單獨基於來自該基層之分區資訊；唯有當區塊共用來自該基層之同一分區資訊時，彼等方可被合併。另一方面，在本發明之實施例中，該合併程序係包括仰賴參考畫格指數和移動向量資訊。當區塊共用來自該基層之同一參考畫格指數和移動向量資訊時，此等區塊在可行時係可能被合併。所以，即使當兩個區塊具有來自該基層之不同分區時，彼等係有可能被合併在一起。

此外，一個虛擬基層巨區塊內的每個4x4區塊，照慣例基本上一直是以一個位於該區塊之第二列和第二行處的單一像素來表示，以及當前區塊有關之區分資訊，業已藉由使該代表性像素映射至基層並接著找出基層處的一個4x4區塊而取得。相形之下，在本發明之各種實施例中，一個4x4區塊之多重代表性像素，係可被用來表示該區段。當就該虛擬基層巨區塊內的一個當前區塊而言，在該基層處有多重之4x4區塊可用時，該虛擬基層巨區塊內的當前之區塊有關的分區和移動向量資訊，係可導自該等4x4區塊之所有分區資訊和移動向量。當使用一個4x4區塊內超過一個的代表性像素來導得來自該基層之分區加上移動向量資訊時，在該強化層處之移動向量，係有可能得到較正確之預測。

依據本發明之各種實施例，上述用以決定該虛擬基層巨區塊之類型、模態、和移動向量的方法，仍為一個由下而上之程序。然而，有許多改變被實現來達成上文所討論之改良。

根據區塊合併，若兩個區塊具有來自該基層之同一參考畫格指數和相似的或同一的移動向量，彼等便會被合併。誠如第4(b)圖中所示，其為範例計可假定，基層MB1和基層MB2，兩者均具有一個中間16x16模態，以及加上具有同一參考畫格指數和移動向量。依據第4(a)和4(b)圖中所顯示之關係，該虛擬基層巨區塊內之4x4區塊M和P，可自該基層MB1取得分區資訊，而4x4區塊N和Q可自該基層 MB2取得分區資訊。依據本發明的一個實施例，區塊M、N、P、和Q係有可能使合併，因為彼等全係具有來自該基層之同一參考畫格指數和移動向量資訊。在合併之後，該8x8區塊有關之模態係8x8。然而，依據H.264/AVC標準之附錄F當前所界定的方法，此種合併將不被允許，因為彼等係來自不同之基層巨區塊，以及因而係隸屬不同之分區。在使用該等傳統規則來合併之後，8x8區塊有關之模態將會是4x8，縱使此種子分區非屬必要。此外，由於此種不必要之子分區所致，進一步之區塊合併亦可能係屬不可能。舉例而言，若假定在第4圖中，該等基層巨區塊MB₃ 和MB₄ ，亦具有一個中間16x16模態，以及係具有與MB₁ 和MB₂ 相同之參考畫格指數和移動向量，則依據本發明之實施例，該虛擬基層巨區塊300內之區塊，最終將會全部合併在一起，以及一個中間16x16之模態，將被指定給該虛擬基層。然而，以H.264/AVC標準之附錄F當前所界定的方法，該虛擬基層巨區塊300有關之模態將會是8x8，而有某些8x8區塊，會具有進一步之子分區。

雖然使用不必要之小分區，可能不會影響到編碼效率，但其可能會影響到計算之複雜性。在該移動補償程序期間，樣本內插在執行上，通常係以一種分區或子分區為基礎。針對較大分區之內插，比起針對許多具有與該較大分區相同之總尺寸的較小分區，係具有較小之複雜性。此主要係由於在針對一個較大之分區執行內插時，會有更多之中間資料，可被共用及利用來降低計算之複雜性。

在本發明的另一個實施例中，上述區塊合併有關之條件，係可被放寬至某一定之程度。只要彼等共用同一參考畫格指數和類似之移動向量，彼等鄰位區塊便可使合併在一起。彼等移動向量之類似性，係透過一個預定之臨界值T_mv 來測量。假定兩個移動向量分別為(Δx₁ , Δy₁ )、(Δx₂ , Δy₂ )，該兩移動向量間之差異，係可表示為：D((Δx₁ , Δy₁ ),(Δx₂ , Δy₂ ))。在此一實例中，D為某一定之扭曲度量。舉例而言，該扭曲度量可被界定為該兩向量間之平方差的總和。該扭曲度量亦可被界定為該兩向量間之絕對差的總和。只要D((Δx₁ , Δy₁ ),(Δx₂ , Δy₂ ))不大於該臨界值T_mv ，則該兩移動向量係被視為相類似。

該臨界值T_mv 可被界定為一個數字，舉例而言T_mv =0、1、或2、等等。T_mv 亦可被界定為一個百分比數，諸如在(Δx₁ , Δy₁ )或(Δx₂ , Δy₂ )等之1%的範圍內。T_mv 之某些其他形式的定義亦被允許。當T_mv 等於0時，(Δx₁ , Δy₁ )和(Δx₂ , Δy₂ )便需要完全相同，其係先前所討論本發明之實施例中所描述的條件。

上述合併之較大區塊的移動向量，係導自該等區塊在合併前之移動向量。此種導出方法可使基於不同之準則。舉例而言，上述導得之移動向量，可為該等區塊在合併前之移動向量的平均值或加權之平均值。其亦可為該等移動向量之中間值。

下文係說明一個4x4區塊有關之分區資訊和移動向量的導出。誠如先前所討論，在該延伸式空間可縮放性之情況中，一個強化層巨區塊(加上一個虛擬基層MB)的一個4x4區塊，係有可能被多達四個之基層4x4區塊覆蓋。若在該4x4區塊中，係使用一個單一像素作為該區塊的一個代表，則該基層之4x4區塊中的一個會被選定，以及此被選定區塊之分區和移動向量資訊，係被用來預測該當前之4x4區塊。此種方法如第7圖中所示範，可能係不正確。在第7圖中，該等來自上述基層之上取樣的4x4區塊之邊界，係表示在700處。可見到的是，該虛擬基層巨區塊中的第一個4x4區塊710，實際上係被來自該基層的四個4x4區塊720、722、724、和726所覆蓋。該等來自上述基層的四個4x4區塊中的一個(第7圖中之720)便會被選定，以及其之分區和移動向量資訊，會被用來預測該第一4x4區塊710，即使其他三個4x4區塊，可能具有不同之分區和移動向量資訊。

在本發明的一個實施例中，與其使用一個像素作為該4x4區塊有關之代表，可使用若干之像素作為代表，來就當前之4x4區塊，導出來自該基層之分區和移動向量資訊。舉例而言，誠如第8圖中所指出，就一個4x4區塊840，可使用四個樣本800、810、820、和830作為代表性像素。就每個代表性樣本而言，有一個對應之基層4x4區塊可被找出，而具有第8圖中之基層4x4區塊840、850、860、和870。總的來說，來自該基層可有多達四個的4x4區塊。該當前之4x4區塊有關的分區和移動向量資訊，接著可自該基層的四個4x4區塊者導出。

為由來自該基層之多重4x4區塊導出分區和移動向量資訊，下列之規則係應用在一個實施例中。首先，當來自該基層之4x4區塊，具有不同之參考畫格指數時，則應被選定的係具有較小之參考畫格指數值的區塊。其次，當來自該基層有超過一個的4x4區塊，具有該最小之參考畫格指數值時，該等4x4區塊之移動向量的平均值或加權平均值，應被計算及被用來預測當前之4x4區塊中的移動向量。第三，當使用的為上文所述之加權平均值運算時，每個來自該基層之移動向量有關的加權係數，可基於許多之因素來加以決定。此等因素包括但不受限：該移動向量在該當前之4x4區塊內表示之區域的尺寸、其變量移動向量(亦即，一個移動向量與其鄰位移動向量間的差分移動向量)、該移動向量之分區尺寸、該移動向量之巨區塊類型和模態、等等。

第9圖係顯示一個供本發明使用之一般性多媒體通訊系統。誠如第4圖中所示，有一個資訊來源100，可提供一個成類比格式、未經壓縮之數位格式、或壓縮之數位格式、或任何此等格式之組合的來源信號。有一個編碼器110，可將該來源信號，編碼成一個經編碼之媒體位元流。該編碼器110可能有能力編碼超過一種的媒體類型，諸如聲頻和視訊，或者為編碼不同媒體類型之來源信號，可能需要超過一個的編碼器110。該編碼器110亦可能得到合成產生之輸入，諸如圖形和本文，或者其可能有能力產生合成媒體之編碼式位元流。在下文中，僅處理一個媒體類型之編碼式媒體位元流，係被考慮來簡化此說明內容。然而，理應注意的是，通常，即時廣播服務係包含有數種串流(通常，至少有一個聲頻、視訊、和本文字幕串流)。亦應注意的是，該系統可能包含有許多編碼器，但在下文中唯有一個編碼器110被考慮，藉以簡化此說明內容而不失一般性。

該編碼式媒體位元流，係被轉移給一個儲存器120。該儲存器120可能包括任何類型之大容量記憶體，藉以儲存該編碼式媒體位元流。該儲存器120中之編碼式媒體位元流的格式，可能是一個基本完備式位元流格式，或者一個或多個編碼式媒體位元流，可能被封裝成一個容器檔案。某些系統係以“直播”方式運作，亦即，省略儲存器以及使編碼式媒體位元流自該編碼器110直接轉移至發送器130。該編碼式媒體位元流，接著係依據需要使轉移至該發送器130，其亦被稱作伺服器。該傳輸中所用之格式，可能是一個基本完備式位元流格式，一種封包串流格式，或者一個或多個編碼式媒體位元流，可能被封裝成一個容器檔案。該等編碼器110、儲存器120、和發送器130，可能存在於同一實體裝置內，或者彼等可能包含在分開之裝置中。該等編碼器110和發送器130，可能以直播即時內容來運作，在該情況中，該編碼式媒體位元流，通常不會被永久儲存，而是有一段短時期被緩衝儲存在該內容編碼器110和/或發送器130中，藉以平順化處理延遲、移動延遲、和編碼式媒體位元率中之變動。

該發送器130可使用一個通訊協定堆疊器，來傳送該編碼式媒體位元流。該堆疊器可能包括但不受限：即時傳輸協定(RTP)、使用者資料流協定(UDP)、和網際網路協定 (IP)。當該通訊協定堆疊器為封包取向式時，該發送器130可將該編碼式媒體位元流，封裝成一些封包。舉例而言，當使用的是RTP時，該發送器130可依據一個RTP酬載(payload)格式，將該編碼式媒體位元流，封裝成RTP封包。通常，每個媒體類型係具有一個專屬性RTP酬載格式。再次應注意的是，一個系統可能包含有超過一個的發送器130，但為單純計，以下之說明僅考慮一個發送器130。

該發送器130可能或可能不透過一個通訊網路，使連接至一個閘道器140。此閘道器140可能執行不同類型之功能，諸如依據一個通訊協定堆疊器，使一個封包串流轉移至另一個通訊協定堆疊器；使資料流合併及岔分；依據下行鏈路和/或接收器能力來操控資料流，諸如依據盛行之下行鏈路網路條件，來控制轉發之串流的位元率。一些閘道器140之範例係包括：多點視訊會議控制伺服器(MCU)、電路交換式和封包交換式影像多媒體電話技術(video telephony)、即按即說蜂巢式網路(PoC)伺服器、手持式數位視訊廣播(DVB-H)系統中之IP封裝器、或家用無線網路局域地轉發廣播傳輸之數位視訊轉換器。當使用的是RTP時，該閘道器140係名為一個RTP混合器，以及係作用為一個RTP連線的一個端點。

該系統係包含有一個或多個接收器150，其通常係有能力接收該傳輸之信號、使其解調、以及使其解封裝成一個編碼式媒體位元流。此編碼式媒體位元流，通常會被一個解碼器160進一步處理，其輸出係一個或多個未經壓縮之媒體串流。理應注意的是，上述要被解碼之位元流，係可接收自一個事實上位於任何類型之網路內的遠程裝置。此外，該位元流係可接收自本地硬體或軟體。最後，一個播放器170舉例而言，可能使用一個擴音器或一個顯示器，來重現上述未經壓縮之媒體串流。該等接收器150、解碼器160、和播放器170，可能存在於同一實體裝置中，或者彼等可能被包含在分開之裝置中。

第10和11圖係顯示一個可在其中實現本發明之代表性通訊裝置12。然而，理應瞭解的是，本發明並非意使受限於一個特定類型之通訊裝置12或其他之電子裝置。第10和11圖之通訊裝置12係包含有：一個殼架30、一個成液晶顯示器之形式的顯示器32、一個按鍵區34、一個麥克風36、一個耳機38、一個電池40、一個紅外線接口42、一個天線44、一片依據本發明的一個實施例而成之UICC的形式之智慧卡46、一個讀卡機48、一個無線電界面電路52、一個編碼解碼器(codec)電路54、一個控制器56、一個記憶體58、和一個電池80。彼等個別之電路和元件，全屬本技藝中習見之類型，舉例而言，在行動電話之諾基亞系列中。

彼等通訊裝置可使用各種傳輸技術來通訊，彼等可能包括但不受限：碼分多址系統(CDMA)、全球行動通訊系統(GSM)、全球行動電話系統(UMTS)、時分多址系統(TDMA)、頻分多址系統(FDMA)、傳輸控制協定/網際網路協定(TCP/IP)、簡訊服務(SMS)、多媒體訊息服務(MMS)、電子郵件、即時訊息服務(IMS)、籃芽、IEEE 802.11、等等。一個通訊裝置可使用各種媒體來通訊，彼等可能包括但不受限：無線電、紅外線、雷射、電纜連線、和等等。

本發明係在一般方法步驟之背景環境中加以說明，彼等在一個實施例中之實現，可能藉由一種程式產品，彼等包括電腦可執行式指令，諸如網路化環境中由電腦執行之程式碼。一個電腦可讀取式媒體，可能包括可移除式和不可移除式儲存裝置，彼等包括但不受限：唯讀記憶體(ROM)、隨機存取記憶體(RAM)、光碟(CD)、數位影像光碟(DVD)、等等。通常，一些程式模組係包括：公用常式、程式、物件、組件、資料結構、等等，彼等可執行一些特別之任務，或者可實現一些特別之抽象資料類型。彼等電腦可執行式指令、相關聯之資料結構、和程式模組，係表示一些用以執行本說明書所揭示之方法步驟的程式碼之範例。此種可執行式指令或相關聯之資料結構的特定序列，係表示一些用以實現該等步驟中所描述之功能的對應動作之範例。

本發明之軟體和環球網實現體在完成上，可使用一些具有規則式邏輯和其他邏輯之標準程式規劃技術，來完成各種資料庫搜索步驟、關聯步驟、比較步驟、和判定步驟。亦應注意的是，該等如本說明書和申請專利範圍中所用之語詞“組件”和“模組”，係意使涵蓋使用一行或多行軟體程式碼之實現體、和/或硬體實現體、和/或用以接收人工輸入之設備實現體。

本發明之實施例的前文說明在呈現上，係為例示和說明之目的。其並非意使詳盡無遺或限制本發明至所揭示之精確形式，以及依據上文之揭示說明，係可能有修飾體和變更形式，或者可能由本發明之實務而獲致。該等實施例在選擇及說明上，係為解釋本發明之原理和其實際應用，而使本技藝之專業人員，能夠利用本發明至各種實施例中，以及具有各種適用於所預期之特定用途的修飾體。本說明書所說明之實施例的特徵，係可結合在所有可能組合之方法、裝置、電腦程式產品、和系統中。

12‧‧‧通訊裝置

30‧‧‧殼架

32‧‧‧顯示器

34‧‧‧按鍵區

36‧‧‧麥克風

38‧‧‧耳機

40‧‧‧電池

42‧‧‧紅外線接口

44‧‧‧天線

46‧‧‧智慧卡

48‧‧‧讀卡機

52‧‧‧無線電界面電路

54‧‧‧編碼解碼器(codec)電路

56‧‧‧控制器

58‧‧‧記憶體

80‧‧‧電池

100‧‧‧來源

110‧‧‧編碼器

120‧‧‧儲存器

130‧‧‧發送器

140‧‧‧閘道器

150‧‧‧接收器

160‧‧‧解碼器

170‧‧‧播放器

300,310,320‧‧‧巨區塊

410‧‧‧覆蓋區域

420‧‧‧分區

710‧‧‧4x4區塊

720、722、724、726‧‧‧4x4區塊

800、810、820、830‧‧‧樣本

840、850、860、870‧‧‧4x4區塊

1000‧‧‧基層畫格

1100‧‧‧強化層畫格

MB₀ -MB₄ ,MB₁₀ ,MB₂₀ ,MB₃₀ ‧‧‧巨

區塊

M,N,P,Q‧‧‧區塊

p_b ,p_e ‧‧‧像素

第1圖係顯示二進解析度尺度中之巨區塊邊界的定位；第2圖係顯示非二進解析度中之巨區塊邊界的定位；第3圖係一個虛擬基層巨區塊之代表，而使每十六個4x4區塊有一個代表性像素；第4(a)圖係一個虛擬基層巨區塊之代表，以及第4(b)圖係顯示第4(a)圖之虛擬基層巨區塊與多個基層巨區塊之間的關係；第5圖係顯示依據H.264/AVC標準之附錄F，該區塊如何可能在一個虛擬基層巨區塊中之4x4區塊層次下被合併；第6圖係顯示依據H.264/AVC標準之附錄F，該區塊如何可能在一個虛擬基層巨區塊中之8x8區塊層次下被合併；第7圖係一個可顯示在依據H.264/AVC標準之附錄F使用一個單一代表性像素時被來自一個基層的多重4x4區塊覆蓋之4x4區塊的代表圖；第8圖係一個可顯示依據本發明的一個實施例在一個4x4區塊中使用多重之代表性像素的代表圖；第9圖係顯示一個供本發明之各種實施例使用之一般性多媒體通訊系統；第10圖係一個可被使用在本發明之實現體中的通訊裝置之透視圖；而第11圖則係第10圖之通訊裝置的電話電路之示意圖。

800、810、820、830‧‧‧樣本

840、850、860、870‧‧‧4x4區塊

Claims

一種用以編碼代表可縮放性位元串流內的一視訊畫格之至少一部分的強化層區塊之方法，其包含之步驟有：導出一個至少部份基於多個對應於多數參考層區塊之參考畫格指數值來指明上述強化層區塊之一分區的編碼模態指示符，該等參考層區塊代表一基層中之一區域，其在上升取樣後涵蓋該強化層區塊，其中該分區之尺寸係藉合併具有相同參考畫格指數值並具有擁有少於一預定臨界值的一差異度量之移動向量的參考層區塊而決定，其中該差異度量係藉移動向量分量之一絕對差的總和而導出；導出與該強化層區塊之該分區相關的一移動向量，其中該導出之移動向量包含該等合併參考層區塊在合併前之移動向量的一加權平均值，其中用於該加權平均值之權重係基於在合併前之該等參考層區塊的移動向量間之差分、與在合併前之該等參考層區塊相關之分區尺寸、或與在合併前之該等參考層區塊相關之一或更多巨區塊類型；以及利用該編碼模態指示符以及該導出之移動向量，來編碼該強化層區塊；其中該預定臨界值係等於1。
如申請專利範圍第1項之方法，其中，用於定位對應之參考層區塊之多個代表性像素係用來為每個個別之參考層區塊選擇分區和移動向量資訊。
如申請專利範圍第1項之方法，其中，若該等多個參考區塊具有不同之參考畫格指數，則來自具有最小參考畫格指數之參考區塊的上述移動向量資訊即被選定。
一種電腦可讀取式媒體，其係包含有用以執行如申請專利範圍第1至3項中任一項之方法的電腦程式碼。
一種裝置，其係包含有：一個處理器；和一個通訊式連接至該處理器之記憶體單元，且該裝置係組配來：導出一個至少部份基於多個對應於多數參考層區塊之參考畫格指數值來指明一個強化層區塊之一分區的編碼模態指示符，該等參考層區塊代表一基層中之一區域，其在上升取樣後涵蓋該強化層區塊，其中該分區之尺寸係藉合併具有相同參考畫格指數值並具有擁有少於一預定臨界值的一差異度量之移動向量的參考層區塊而決定，其中該差異度量係藉移動向量分量之一絕對差的總和而導出；導出與該強化層區塊之該分區相關的一移動向量，其中該導出之移動向量包含該等合併參考層區塊在合併前之移動向量的一加權平均值，其中用於該加權平均值之權重係基於在合併前之該等參考層區塊的移動向量間之差分、與在合併前之該等參考層區塊相關之分區尺寸、或與在合併前之該等參考層區塊相關之一或更多巨區塊類型；以及利用該編碼模態指示符以及該導出之移動向量來編碼該強化層區塊；其中該預定臨界值係等於1。
如申請專利範圍第5項之裝置，其中，用多個代表性像素，來為每個個別之參考層區塊選擇分區和移動向量資訊。
如申請專利範圍第5項之裝置，其中，若該等多個參考區塊具有不同之參考畫格指數，則來自具有最小參考畫格指數之參考區塊的上述移動向量資訊即被選定。
一種裝置，其係包含有：一個用以導出一個至少部份基於多個對應於多數參考層區塊之參考畫格指數值來指明一個強化層區塊之一分區的編碼模態指示符之構件，該等參考層區塊代表一基層中之一區域，其在上升取樣後涵蓋該強化層區塊，其中該分區之尺寸係藉合併具有相同參考畫格指數值並具有擁有少於一預定臨界值的一差異度量之移動向量的參考層區塊而決定，其中該差異度量係藉移動向量分量之一絕對差的總和而導出；用以導出與該強化層區塊之該分區相關的一移動向量之構件，其中該導出之移動向量包含該等合併參考層區塊在合併前之移動向量的一加權平均值，其中用於該加權平均值之權重係基於在合併前之該等參考層區塊的移動向量間之差分、與在合併前之該等參考層區塊相關之分區尺寸、或與在合併前之該等參考層區塊相關之一或更多巨區塊類型；以及一個用以利用該編碼模態指示符以及該導出之移動向量來編碼該強化層區塊之構件；其中該預定臨界值係等於1。
一種用以解碼代表可縮放性位元串流內的一視訊畫格之至少一部分的強化層區塊之方法，其包含之步驟有：導出一個至少部份基於多個對應於多數參考層區塊之參考畫格指數值來指明上述強化層區塊之一分區的編碼模態指示符，該等參考層區塊代表一基層中之一區域，其在上升取樣後涵蓋該強化層區塊，其中該分區之尺寸係藉合併具有相同參考畫格指數值並具有擁有少於一預定臨界值的一差異度量之移動向量的參考層區塊而決定，其中該差異度量係藉移動向量分量之一絕對差的總和而導出；導出與該強化層區塊之該分區相關的一移動向量，其中該導出之移動向量包含該等合併參考層區塊在合併前之移動向量的一加權平均值，其中用於該加權平均值之權重係基於在合併前之該等參考層區塊的移動向量間之差分、與在合併前之該等參考層區塊相關之分區尺寸、或與在合併前之該等參考層區塊相關之一或更多巨區塊類型；以及利用該編碼模態指示符以及該導出之移動向量，來解碼該強化層區塊；其中該預定臨界值係等於1。
如申請專利範圍第9項之方法，其中，用多個代表性像素，來為個別之參考層區塊選擇分區和移動向量資訊。
如申請專利範圍第9項之方法，其中，若該等多個參考區塊具有不同之參考畫格指數，則來自具有最小參考畫格指數之區塊的上述移動向量資訊即被選定。
一種電腦可讀取式媒體，其係包含有用以執行如申請專利範圍第9至11項中任一項之方法的電腦程式碼。
一種裝置，其係包含有：一個處理器；和一個通訊式連接至該處理器之記憶體單元，且該裝置係組配來：導出一個至少部份基於多個對應於多數參考層區塊之參考畫格指數值來指明一個強化層區塊之一分區的編碼模態指示符，該等參考層區塊代表一基層中之一區域，其在上升取樣後涵蓋該強化層區塊，其中該分區之尺寸係藉合併具有相同參考畫格指數值並具有擁有少於一預定臨界值的一差異度量之移動向量的參考層區塊而決定，其中該差異度量係藉移動向量分量之一絕對差的總和而導出；導出與該強化層區塊之該分區相關的一移動向量，其中該導出之移動向量包含該等合併參考層區塊在合併前之移動向量的一加權平均值，其中用於該加權平均值之權重係基於在合併前之該等參考層區塊的移動向量間之差分、與在合併前之該等參考層區塊相關之分區尺寸、或與在合併前之該等參考層區塊相關之一或更多巨區塊類型；以及利用該編碼模態指示符以及該導出之移動向量來解碼該強化層區塊；其中該預定臨界值係等於1。
如申請專利範圍第13項之裝置，其中，用多個代表性像素，來為個別之參考層區塊選擇分區和移動向量資訊。
如申請專利範圍第13項之裝置，其中，若該等多個參考區塊具有不同之參考畫格指數，則來自具有最小參考畫格指數之區塊的上述移動向量資訊即被選定。
一種裝置，其係包含有：一個用以導出一個至少部份基於多個對應於多數參考層區塊之參考畫格指數值來指明一個強化層區塊之一分區的編碼模態指示符之構件，該等參考層區塊代表一基層中之一區域，其在上升取樣後涵蓋該強化層區塊，其中該分區之尺寸係藉合併具有相同參考畫格指數值並具有擁有少於一預定臨界值的一差異度量之移動向量的參考層區塊而決定，其中該差異度量係藉移動向量分量之一絕對差的總和而導出；用以導出與該強化層區塊之該分區相關的一移動向量之構件，其中該導出之移動向量包含該等合併參考層區塊在合併前之移動向量的一加權平均值，其中用於該加權平均值之權重係基於在合併前之該等參考層區塊的移動向量間之差分、與在合併前之該等參考層區塊相關之分區尺寸、或與在合併前之該等參考層區塊相關之一或更多巨區塊類型；以及一個用以利用該編碼模態指示符以及該導出之移動向量來解碼該強化層區塊之構件；其中該預定臨界值係等於1。