TW201728173A

TW201728173A - 用於在顯示串流壓縮(dsc)中計算失真之系統及方法

Info

Publication number: TW201728173A
Application number: TW106100342A
Authority: TW
Inventors: 維賈伊拉加哈萬提拉魯馬萊; 納坦海姆雅各布森; 瑞珍雷克斯曼喬許
Original assignee: 高通公司
Priority date: 2016-01-11
Filing date: 2017-01-05
Publication date: 2017-08-01
Also published as: KR102175662B1; CN108432249A; BR112018013964A2; JP6772275B2; CN108432249B; JP2019507530A; KR20180102565A; US20170201753A1; HK1254970A1; EP3403408B1; SG11201804403TA; EP3403408A1; US10448024B2; TWI686078B; WO2017123451A1

Abstract

本發明揭示用於計算數個色彩空間中之一圖框或區塊的一失真值，及基於該等所計算失真值而判定一最佳寫碼模式的系統及方法。一個實施例包括一種具有一視訊源及一處理器之系統，該視訊源包括含有先前所儲存之視訊內容的一視訊攝影機或一視訊封存檔，該處理器經組態以對該所儲存視訊內容進行編碼。

Description

用於在顯示串流壓縮(DSC)中計算失真之系統及方法

本發明係關於視訊寫碼及壓縮的領域，且特定而言，係關於用於經由顯示連結之傳輸的視訊壓縮，諸如顯示串流壓縮(DSC)。

數位視訊能力可併入至廣泛範圍之顯示器中，包括數位電視、個人數位助理(PDA)、膝上型電腦、桌上型監測器、數位攝影機、數位記錄裝置、數位媒體播放器、視訊遊戲裝置、視訊遊戲控制台、蜂巢式或衛星無線電電話、視訊電話會議裝置及其類似者。顯示連結用以將顯示器連接至適當源裝置。顯示連結之頻寬要求與顯示器的解析度成比例，且因此，高解析度顯示器要求大頻寬顯示連結。一些顯示連結不具有支援高解析度顯示器的頻寬。視訊壓縮可用以減小頻寬要求以使得較低頻寬顯示連結可用以將數位視訊提供至高解析度顯示器。其他技術已經嘗試利用對像素資料之影像壓縮。然而，此類方案有時在視覺上並非無損的或在習知顯示裝置中實施可為困難且昂貴的。視訊電子元件標準協會(VESA)已開發顯示串流壓縮(DSC)作為顯示連結視訊壓縮之標準。顯示連結視訊壓縮技術(諸如DSC)在除其他以外應提供視覺上無損之圖像品質(亦即，圖像具有使得使用者無法區分壓縮正在作用中之品質位準)。顯示連結視訊壓縮技術亦應提供與習知硬體即時實施起來簡易且便宜之方案。

本發明之系統、方法及裝置各具有若干創新態樣，其中無單一者僅負責本文中所揭示之合乎需要的屬性。一個創新包括一種用於對視訊資料進行寫碼之設備。該設備可包括一記憶體，其用於儲存該視訊資料及關於複數個寫碼模式之資訊，該視訊資料包含複數個視訊區塊。該設備亦可包括以操作方式耦接至該記憶體之一硬體處理器。該處理器可經組態以:針對該複數個視訊區塊中之一視訊區塊選擇複數個色彩空間中之一者，將一色彩變換應用於該複數個視訊區塊中之不在該所選色彩空間中的每一視訊區塊，且驗證該複數個視訊區塊中之所有該等視訊區塊皆在該所選色彩空間中，及基於該所選色彩空間而判定該複數個視訊區塊中之每一者的一失真值。對於一些實施例，該設備可經組態以：判定該複數個視訊區塊中之各視訊區塊的一初始色彩空間，該初始色彩空間為在應用該色彩變換之前各視訊區塊之該色彩空間；判定該複數個寫碼模式中之哪些寫碼模式與該初始色彩空間相容；及藉由該等相容寫碼模式對該複數個視訊區塊中之該視訊區塊進行編碼以提供一經編碼區塊。對於一些實施例，該設備可經組態以：判定該複數個寫碼模式中之哪些寫碼模式不與該初始色彩空間相容，該初始色彩空間為在應用該色彩變換之前各視訊區塊之該色彩空間；將該色彩變換應用於該初始色彩空間以提供一相容色彩區塊；及藉由不與該初始色彩空間相容之該等寫碼模式對該相容色彩區塊進行編碼以提供一經編碼區塊。在一些實施例中，該設備可經組態以計算來自該視訊區塊及該經編碼區塊之一殘餘區塊，該殘餘區塊指示該視訊區塊與該經編碼區塊之間的一差。在一些實施例中，判定該失真值包含判定該殘餘區塊之失真值。在一些實施例中，該所選色彩空間包含一明度-色度色彩空間且其中判定該失真值包含標準化該明度-色度色彩空間之各色度分量。在一些實施例中，該視訊區塊包含數個色彩平面，且其中判定該視訊區塊之該失真值包含以下各者中之至少一者：該數個色彩平面中之各色彩平面的絕對差之一總和，及該數個色彩平面中之各色彩平面的平方誤差之一總和。在一些實施例中，該色彩變換係基於一變換矩陣，該變換矩陣由指示該所選色彩空間之數個色彩平面的數個行界定，且其中該硬體處理器經進一步組態以基於該數個行中之一行的一歐幾里得(Euclidean)範數而判定一權重值。在一些實施例中，該經變換視訊區塊之該失真值係基於以下各者中之至少一者：該數個色彩平面中之各色彩平面的絕對差之一總和，其中各色彩平面乘以該數個權重值中之一相對應權重值；及該數個色彩平面中之各色彩平面的平方誤差之一總和，其中各色彩平面乘以該數個權重中之該相對應權重。在一些實施例中，該所選色彩空間在一明度-色度色彩空間及一RGB色彩空間中之至少一者中。在一些實施例中，判定一失真值進一步包含基於以下各者而判定該複數個寫碼模式中之一寫碼模式：(i)該複數個視訊區塊中之每一者的該失真值、(ii)一λ值、及(iii)傳達該視訊區塊之一位元串流速率。在一些實施例中，該複數個視訊區塊中之各視訊區塊指示已使用該複數個寫碼模式中之每一寫碼模式進行編碼的一單個視訊區塊。

在本文中揭示提供固定速率及視覺上無損之壓縮的DSC寫碼器。寫碼器以基於區塊或圖塊之方法進行設計(例如，其中區塊大小為P×Q)，且可藉由眾多寫碼模式中之一或多者加以實施。舉例而言，各區塊之可用寫碼選項包括變換模式(例如，DCT、哈達馬德)、區塊預測模式、微分脈碼調變(DPCM)模式、圖案模式、中點預測(MPP)模式及/或中點預測後降(MPPF)模式。若干寫碼模式可在寫碼器中用以壓縮不同類型之內容或影像。舉例而言，文本影像可係經由圖案模式壓縮，而自然影像可係經由變換模式俘獲。儘管本文在DSC標準之上下文中描述某些實施例，但一般熟習此項技術者將瞭解本文所揭示之系統及方法可適用於任何適合之視訊寫碼標準。舉例而言，本文中所揭示之實施例可適用於以下標準中之一或多者：國際電信聯盟(ITU)電信標準化分會(ITU-T) H.261、國際標準化組織/國際電工委員會(ISO/IEC)移動圖像專家組-1 (MPEG-1) Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual、ITU-T H.264 (亦稱為ISO/IEC MPEG-4 AVC)、高效率視訊寫碼(HEVC)及此類標準之任何擴展。又，本發明中描述之技術可變為將來開發的標準之一部分。換言之，本發明中所描述之技術可適用於先前開發之視訊寫碼標準、當前正在開發之視訊寫碼標準及即將出現的視訊寫碼標準。在根據某些態樣之DSC寫碼器中，可在多種色彩空間(例如，任何明度-色度表示，諸如YCoCg或YCbCr)中或在RGB或CMYK色彩空間中評估各模式之速率失真(「RD」)效能。根據某些態樣，本發明中所描述之技術可提供用以(例如)在於不同色彩空間中評估各模式之情況下計算寫碼模式之失真的各種方法。舉例而言，可在相同色彩空間中(例如)藉由應用適當色彩變換來計算所有寫碼模式之失真。可將色彩變換應用於殘餘區塊，其中殘餘區塊表示原始視訊區塊與經重建之視訊區塊(在本文中亦被稱作經編碼區塊或誤差區塊)之間的差，或可在計算殘餘之前將色彩變換應用於原始區塊及經重建區塊兩者。視訊寫碼標準 諸如視訊影像、TV影像、靜態影像或由視訊記錄器或電腦產生之影像的數位影像可包括按水平線及垂直線排列之像素或樣本。單一影像中的像素之數目通常有數萬個。各像素通常含有明度及色度資訊。在不壓縮之情況下，待自影像編碼器傳達至影像解碼器的資訊之絕對數量將致使即時影像傳輸不切實際。為了減少待傳輸的資訊之量，已開發數個不同壓縮方法，諸如，JPEG、MPEG及H.263標準。視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual、ITU-T H.264 (亦稱為ISO/IEC MPEG-4 AVC)及HEVC，包括此類標準之擴展。另外，視訊寫碼標準(即DSC)已由VESA開發。DSC標準為可壓縮經由顯示連結傳輸之視訊的視訊壓縮標準。隨著顯示器之解析度增大，視訊資料驅動顯示器所需要的頻寬相應地增大。一些顯示連結可不具有將所有視訊資料傳輸至此類解析度之顯示器的頻寬。因此，DSC標準指定為可互操作的、經由顯示連結之視覺上無損壓縮的壓縮標準。 DSC標準與其他視訊寫碼標準(諸如，H.264及HEVC)不同。DSC包括框內壓縮，但不包括框間壓縮，此意味著時間資訊可不由DSC標準用於寫碼視訊資料。對比而言，其他視訊寫碼標準可在其視訊寫碼技術中採用框間壓縮。正在開發進階DSC (例如)以便提供4:1或更高之壓縮比。4:1或更高之壓縮比可用於行動裝置，例如，用於諸如4K之高解析度顯示器。DSC 中之圖塊 如上文所提及，圖塊通常指可不使用來自影像或圖框中之剩餘區域之資訊而獨立解碼的影像或圖框中之空間上分開的區域。各影像或視訊圖框可在單個圖塊中經編碼或各影像或視訊圖框可在若干圖塊中經編碼。在DSC中，經分配以編碼各圖塊之目標位元可基本固定。此對於部分圖塊可不同，在影像高度無法被圖塊高度除盡的情況下可出現此情況。舉例而言，圖塊高度為108之大小為1280×720之影像將具有6個高度為108之圖塊及一個高度為72(= 720 - (6×108))之部分圖塊。可使用變數或參數圖塊寬度×圖塊高度來指定進階DSC圖塊尺寸，其中圖塊寬度及圖塊高度可組態。圖塊高度可經組態為所要值，例如，16、32、108等。可使用參數N對圖塊寬度進行組態，參數N判定線中之圖塊的數目，且假定各圖塊中之每個線的像素數目相等，例如，圖塊寬度=影像寬度/N。影像寬度可為表示影像之寬度的變數或參數。視訊寫碼系統 下文參考隨附圖式更充分地描述新穎系統、設備及方法之各種態樣。然而，本發明可以許多不同形式來體現，且不應將其解釋為限於貫穿本發明所呈現之任何具體結構或功能。實情為，提供此等態樣以使得本發明將為透徹且完整的，且將向熟習此項技術者充分傳達本發明之範疇。基於本文中之教示，熟習此項技術者應瞭解本發明之範疇意欲涵蓋本文中揭示的新穎系統、設備及方法之任何態樣，不管其是獨立於本發明之任何其他態樣實施還是與本發明之任何其他態樣組合地實施。舉例而言，可使用本文中所闡述之任何數目個態樣來實施一設備或可使用本文中所闡述之任何數目個態樣來實踐一方法。另外，本發明之範疇意欲涵蓋使用除了本文中所闡明的本發明之各種態樣之外或不同於本文中所闡明的本發明之各種態樣的其他結構、功能性或結構與功能性來實踐的此設備或方法。應理解，可藉由申請專利範圍之一或多個要素來體現本文所揭示之任何態樣。儘管本文中描述特定態樣，但此等態樣之許多變化及排列屬於本發明之範疇內。儘管提及較佳態樣之一些益處及優點，但本發明之範疇不意欲限於特定益處、用途或目標。實情為，本發明之態樣意欲可廣泛適用於不同無線技術、系統組態、網路及傳輸協定，其中一些藉由實例在諸圖中且在較佳態樣之以下描述中加以說明。實施方式及圖式僅對本發明進行說明而非限制，本發明之範疇由附加申請專利範圍及其等效物界定。隨附圖式說明實例。由隨附圖式中之參考數字指示之元件對應於在以下描述中由相同參考數字指示之元件。在本發明中，具有以序數詞(例如，「第一」、「第二」、「第三」等等)開始之名稱的元件未必暗示該等元件具有特定次序。實情為，此等序數詞僅用以指相同或類似類型之不同元件。圖 1A 為說明可利用根據本發明中描述之態樣的技術之實例視訊寫碼系統10之方塊圖。如本文所使用，術語「視訊寫碼器」或「寫碼器」一般指視訊編碼器及視訊解碼器兩者。在本發明中，術語「視訊寫碼」或「寫碼」可一般指視訊編碼及視訊解碼。除了視訊編碼器及視訊解碼器之外，本申請案中所描述之態樣可擴展至其他相關裝置，諸如，轉碼器(例如，可解碼位元串流且重新編碼另一位元串流之裝置)及中間框(例如，可修改、變換及/或另外操縱位元串流之裝置)。如圖 1A 中所展示，視訊寫碼系統10包括產生源視訊資料13及稍後待由目的地裝置14解碼之經編碼視訊資料16的源裝置12。在圖 1A 之實例中，源裝置12及目的地裝置14構成單獨裝置。然而，應注意，源裝置12與目的地裝置14可在同一裝置上或為同一裝置之部分，如在圖 1B 之實例中所展示。再次參考圖 1A ，源裝置12及目的地裝置14可分別包含廣泛範圍的裝置中之任一者，包括桌上型電腦、筆記型(例如，膝上型)電腦、平板電腦、機上盒、電話手機(諸如所謂的「智慧型」電話、所謂的「智慧型」板)、電視、攝影機、顯示裝置、數位媒體播放器、視訊遊戲控制台、車載電腦、視訊串流裝置、可由實體(例如，人類、動物及/或另一控制裝置)佩戴(或可以可移除方式附接)之視訊裝置(諸如護目鏡及/或可佩戴電腦)、可消耗、攝入或置放於實體內之裝置或設備、及/或類似者。在各種實施例中，源裝置12及目的地裝置14可經裝備以供用於無線通信。目的地裝置14可經由連結17接收待解碼之經編碼視訊資料16。連結17可包含能夠將經編碼視訊資料16自源裝置12移動至目的地裝置14之任何類型的媒體或裝置。在圖 1A 之實例中，連結17可包含使得源裝置12能夠即時將經編碼視訊資料16傳輸至目的地裝置14之通信媒體。可根據通信標準(諸如，無線通信協定)調變經編碼視訊資料16，且將其傳輸至目的地裝置14。通信媒體可包含任何無線或有線通信媒體，諸如，射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如區域網路、廣域網路或全球網路，諸如網際網路)的一部分。通信媒體可包括路由器、交換器、基地台或任何其他可用於有助於自源裝置12至目的地裝置14的通信之裝備。在圖 1A 之實例中，源裝置12包括視訊源18、視訊編碼器20及輸出介面22。在一些情況下，輸出介面22可包括調變器/解調器(數據機)及/或傳輸器。在源裝置12中，視訊源18可包括諸如視訊俘獲裝置(例如，視訊攝影機)、含有先前所俘獲視訊之視訊封存檔、用以自視訊內容提供者接收視訊的視訊饋入介面，及/或用於將電腦圖形資料產生為源視訊的電腦圖形系統之源，或此等源之一組合。作為一個實例，若視訊源18為視訊攝影機，則源裝置12及目的地裝置14可形成所謂的「攝影機電話」或「視訊電話」，如在圖 1B 之實例中所說明。視訊源18可輸出所俘獲、預先俘獲或電腦產生之視訊作為至視訊編碼器20之源視訊資料13位元串流。然而，本發明中所描述之技術可大體上適用於視訊寫碼，且可應用於無線及/或有線應用。舉例而言，視訊源18可產生源視訊資料13且經由視訊源18與視訊編碼器20之間的連接輸出源視訊資料13。連接可包括任何適合之有線連接(例如，通用串列匯流排(USB)、FireWire、Thunderbolt、光峰(Light Peak)、數位視訊介面(DVI)、高清晰度多媒體介面(HDMI)、視訊圖形陣列(VGA)等)。連接亦可包括任何適合之無線連接(例如，藍芽、Wi-Fi、3G、4G、LTE、LTE進階、5G等)。源視訊資料13可由視訊編碼器20接收且編碼。經編碼視訊資料16可經由源裝置12之輸出介面22傳輸至目的地裝置14。經編碼視訊資料16亦可(或替代地)儲存至儲存裝置(未圖示)上以供稍後由目的地裝置14或其他裝置存取用於解碼及/或播放。圖 1A 及圖 1B 中說明之視訊編碼器20可包含圖 2 中說明之視訊編碼器20或本文所描述之任何其他視訊編碼器。在圖 1A 之實例中，目的地裝置14包括輸入介面28、視訊解碼器30及顯示裝置32。在一些情況下，輸入介面28可包括接收器及/或數據機。目的地裝置14之輸入介面28可經由連結17及/或自儲存裝置接收經編碼視訊資料16。經由連結17所傳達或在儲存裝置上所提供之經編碼視訊資料16可包括由視訊編碼器20產生以由視訊解碼器(諸如視訊解碼器30)用於對視訊資料16進行解碼的多種語法元素。此等語法元素可與在通信媒體上傳輸、儲存於儲存媒體上或儲存於檔案伺服器中之經編碼視訊資料16包括在一起。圖 1A 及圖 1B 中說明的視訊解碼器30可包含圖 5 中說明之視訊解碼器30或本文所描述之任何其他視訊解碼器。顯示裝置32可與目的地裝置14整合在一起或在目的地裝置14之外部。在一些實例中，目的地裝置14可包括整合式顯示裝置且亦經組態以與外部顯示裝置介接。在其他實例中，目的地裝置14可為顯示裝置。一般而言，顯示裝置32向使用者顯示經解碼視訊資料，且可包含多種顯示裝置中的任一者，諸如，液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示裝置。在相關態樣中，圖 1B 展示實例視訊寫碼系統10'，其中源裝置12及目的地裝置14在裝置11上或為裝置11之部分。裝置11可為電話手機，諸如「智慧型」電話或類似者。裝置11可包括與源裝置12及目的地裝置14以操作性方式通信之處理器/控制器裝置13 (視情況存在)。圖 1B 之視訊寫碼系統10'及其組件另外類似於圖 1A 之視訊寫碼系統10及其組件。視訊編碼器20及視訊解碼器30可根據視訊壓縮標準(諸如，DSC)來操作。替代地，視訊編碼器20及視訊解碼器30可根據其他專屬或行業標準(諸如，ITU-T H.264標準(替代地被稱作MPEG-4 第10部分)、AVC、HEVC或此等標準之擴展)而操作。然而，本發明之技術不限於任何特定寫碼標準。視訊壓縮標準之其他實例包括MPEG-2及ITU-T H.263。儘管未在圖 1A 及圖 1B 之實例中展示，但視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合且可包括適當MUX-DEMUX單元或其他硬體及軟體，以處置在共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。在一些實例中，適用時，MUX-DEMUX單元可符合ITU H.223多工器協定或其他協定(諸如，使用者資料報協定(UDP))。視訊編碼器20及視訊解碼器30各自可實施為多種適合編碼器電路中的任一者，諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分以軟體實施時，裝置可將用於軟體之指令儲存於適合之非暫時性電腦可讀媒體中，且在硬體中使用一或多個處理器執行指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括在一或多個編碼器或解碼器中，編碼器或解碼器中的任一者可整合為各別裝置中之組合式編碼器/解碼器的部分。視訊寫碼程序 如上文所簡要地提及，視訊編碼器20對源視訊資料13進行編碼。源視訊資料13可包含一或多個圖像。圖像中之每一者為形成視訊之部分的靜態影像。在一些情況下，圖像可被稱作視訊「圖框」。當視訊編碼器20對源視訊資料13進行編碼時，視訊編碼器20可產生位元串流。位元串流可包括形成視訊資料16之經寫碼表示的一連串位元。位元串流可包括經寫碼圖像及相關聯資料。經寫碼圖像為圖像之經寫碼表示。為了產生位元串流，視訊編碼器20可對視訊資料中之各圖像執行編碼操作。當視訊編碼器20對圖像執行編碼操作時，視訊編碼器20可產生一系列經寫碼圖像及相關聯資料。相關聯資料可包括寫碼參數之集合，諸如量化參數(QP)。量化可將損耗引入至信號中且損耗量可藉由由速率控制器120判定之QP控制。在圖 2 中更詳細地論述速率控制器120。可依據QP指定縮放矩陣，而非儲存各QP之量化步長。可自縮放矩陣推導出各QP之量化步長，且所導出值可不必為二之冪，亦即，導出值亦可為非二之冪。為了產生經寫碼圖像，視訊編碼器20可將圖像分割成相等大小之視訊區塊。視訊區塊可為樣本之二維陣列。寫碼參數可界定視訊資料之每一區塊的寫碼選項(例如，寫碼模式)。可選擇寫碼選項以便實現所要速率-失真效能。在一些實例中，視訊編碼器20可將圖像分割成複數個圖塊。圖塊中之每一者可包括可在並無來自影像或圖框中之剩餘區域之資訊的情況下經獨立解碼的影像(例如，圖框)中之空間不同區域。各影像或視訊圖框可在單個圖塊中編碼或各影像或視訊圖框可在若干圖塊中編碼。在DSC中，經分配以編碼各圖塊之目標位元可基本固定。作為對圖像執行編碼操作之部分，視訊編碼器20可對圖像之各圖塊執行編碼操作。當視訊編碼器20對圖塊執行編碼操作時，視訊編碼器20可產生與圖塊相關聯之經編碼資料。與圖塊相關聯之經編碼資料可被稱作「經寫碼圖塊」。DSC 視訊編碼器 圖 2 為說明可實施根據本發明中描述之態樣的技術的視訊編碼器20之實例的方塊圖。視訊編碼器20可經組態以執行本發明之技術中的一些或全部。在一些實例中，本發明中描述之技術可在視訊編碼器20之各種組件當中共用。在一些實例中，另外或替代地，處理器(未展示)可經組態以執行本發明中描述的技術中之一些或全部。出於解釋之目的，本發明在DSC寫碼的上下文中描述視訊編碼器20。然而，本發明之技術可適用於其他寫碼標準或方法。在圖 2 之實例中，視訊編碼器20包括複數個功能組件。視訊編碼器20之功能組件包括色彩空間轉換器105、緩衝器110、平度偵測器115、速率控制器120、預測器、量化器及重建器(PQR)組件125、失真電路188、線緩衝器130、索引式色彩歷史135、熵編碼器140、子串流多工器145及速率緩衝器150。在其他實例中，視訊編碼器20可包括更多、更少或不同功能組件。色彩空間轉換器105可將源視訊資料13之輸入色彩空間轉換成用於特定寫碼實施中之色彩空間。舉例而言，源視訊資料13之色彩空間可在紅綠藍(RGB)色彩空間中，而可在亮度Y、色度綠Cg及色度橙Co (YCgCo)色彩空間中實施寫碼。色彩空間轉換可由包括對視訊資料之移位及添加的方法執行。應注意，可處理其他色彩空間中之輸入視訊資料，且亦可執行對其他色彩空間的轉換。在一些實施中，視訊資料可在輸入視訊資料之色彩空間已針對特定寫碼模式在正確格式下的情況下繞過色彩空間轉換器105。舉例而言，若輸入色彩空間為RGB，則視訊資料可繞過色彩空間轉換器105以供藉由中點預測模式進行寫碼，中點預測模式可對呈RGB抑或明度-色度表示之視訊資料進行編碼。在相關態樣中，視訊編碼器20可包括緩衝器110、線緩衝器130及/或速率緩衝器150。舉例而言，緩衝器110可在視訊編碼器20之其他部分使用經色彩空間轉換視訊資料之前保存該視訊資料。在另一實例中，視訊資料可儲存於RGB色彩空間中且可視需要執行色彩空間轉換，此係因為經色彩空間轉換資料可需要較多位元。速率緩衝器150可充當視訊編碼器20中之速率控制機制的一部分，下文將結合速率控制器120更詳細地描述該速率緩衝器。編碼各區塊所耗費之位元可大體上基於區塊之性質而高度變化。速率緩衝器150可平緩經壓縮視訊中之速率變化。在一些實施例中，使用恆定位元速率(CBR)緩衝器模型，其中以恆定位元速率自該緩衝器取得位元。在CBR緩衝器模型中，若視訊編碼器20添加過多位元到位元串流，則速率緩衝器150可上溢。另一方面，視訊編碼器20必須添加足夠位元以便防止速率緩衝器150之下溢。在視訊解碼器側上，可按恆定位元速率將位元添加至視訊解碼器30之速率緩衝器155 (見下文更詳細地描述之圖 5 )，且視訊解碼器30可移除用於各區塊之可變數目個位元。為了確保恰當的解碼，視訊解碼器30之速率緩衝器155不應在經壓縮位元串流之解碼期間「下溢」或「上溢」。在一些實施例中，緩衝器充滿度(BF)可基於表示當前在緩衝器中之位元數目之值BufferCurrentSize及表示速率緩衝器150之大小之BufferMaxSize (亦即，可在任何時間點處儲存於速率緩衝器150中之最大位元數目)來界定。下文之等式1可用以計算BF：平度偵測器115可偵測自視訊資料中之複雜(亦即，非平坦)區域至視訊資料中之平面(亦即，簡單或均一)區域之變化。術語「複雜」及「平坦」將在本文中用以大體上指代視訊編碼器20編碼視訊資料之各別區域的難度。因此，如本文所使用之術語複雜大體上描述對視訊編碼器20編碼而言複雜的視訊資料區域，且可(例如)包括紋理式視訊資料、高空間頻率及/或對編碼而言複雜之其他特徵。如本文所使用之術語平坦大體上描述對視訊編碼器20編碼而言簡單的視訊資料區域，且可(例如)包括視訊資料中之平緩梯度、低空間頻率及/或對編碼而言簡單的其他特徵。複雜區域與平坦區域之間的轉變可由視訊編碼器20使用以減少經編碼視訊資料16中之量化偽影。特定言之，速率控制器120及PQR組件125可在識別到自複雜區域至平坦區域之轉變時減少此類量化偽影。速率控制器120判定寫碼參數(例如QP)之集合。QP可由速率控制器120基於速率緩衝器150之緩衝器充滿度及視訊資料之影像活動來加以調節，以便將目標位元速率之圖像品質最大化，此情況確保速率緩衝器150不上溢或下溢。速率控制器120亦針對視訊資料之各區塊選擇特定寫碼選項(例如，特定模式)以便實現最優速率-失真效能。速率控制器120最小化經重建影像之失真以使得其滿足位元速率約束(亦即，整體實際寫碼速率符合目標位元速率中)。因此，速率控制器120之一個目的為判定寫碼參數(諸如，QP)之集合、寫碼模式等以滿足對速率的瞬時及平均約束同時最大化速率-失真效能。PQR組件125可基於速率控制技術而自複數個候選寫碼模式當中選擇各區塊之寫碼模式。速率控制技術可涉及利用緩衝器模型，且編解碼器之設計考量可包括確保速率緩衝器150不處於下溢(例如，在緩衝器中少於零個位元)或上溢(例如，緩衝器大小已增加超過所設定/界定之最大大小)的狀態中。在一個實施例中，速率控制器120可經設計以基於速率與失真之間的取捨而選擇各區塊之最佳寫碼模式(例如，就成本D+λ·R而言之低成本寫碼選項)。在此處，參數R指代當前區塊之位元速率，其可為在編碼器20與解碼器30之間傳輸的當前區塊之位元的總數目；參數D指代當前區塊之失真，其可為原始區塊與經重建區塊(或經編碼區塊)之間的差。可以數個不同方式計算參數D，例如，作為原始區塊與經重建區塊之間的絕對差(SAD)之總和 (例如，等式4、6、8、10及12)、平方誤差之總和(例如，等式5、7、9、11及13)等加以計算。參數λ或λ值為可為參數R與D之間的取捨之拉格朗日參數。應注意，可以各種方式計算拉格朗日參數λ，且計算λ之所選方法可取決於上下文及應用而變化。舉例而言，可基於數個因素(諸如速率緩衝器(150、155)狀態(亦即，緩衝器充滿度)、區塊之第一線或非第一線條件等)而計算拉格朗日參數λ。甚至對於圖塊之非第一線條件，可針對影像內容之多個類型而選擇空間預測模式。 PQR組件125可執行視訊編碼器20之至少三個編碼操作。PQR組件125可在數個不同模式中執行預測。一個實例預測模式為經修改的中位適應性預測版本。中位適應性預測可由無損JPEG標準(JPEG-LS)實施。可由PQR組件125執行之經修改的中位適應性預測版本可允許對三個連續樣本值之平行預測。另一實例預測模式為區塊預測。在區塊預測中，自線中之經先前重建像素上方或至相同線中之左邊而預測樣本。在一些實施例中，視訊編碼器20及視訊解碼器30可都在經重建像素上執行相同的檢索以判定區塊預測使用，且因此不需要在區塊預測模式中發送位元。在其他實施例中，視訊編碼器20可在位元串流中執行檢索及信號區塊預測向量，使得視訊解碼器30不必執行單獨檢索。亦可實施中點預測模式，其中使用組件範圍之中點來預測樣本。中點預測模式可實現對即使最差狀況樣本中之經壓縮視訊所需要的位元數目之限定。PQR組件125可經組態以藉由執行本發明之方法及技術來預測(例如，編碼或解碼)視訊資料區塊數據塊(或任何其他預測單元)。 PQR組件125亦執行量化。舉例而言，可經由可使用移位器實施之2之冪量化器執行量化。應注意，可代替2之冪量化器實施其他量化技術。由PQR組件125執行之量化可基於由速率控制器120判定之QP。最後，PQR組件125亦執行重建，重建包括將經反量化殘餘添加至預測值及確保結果不屬於樣本值之有效範圍外。在本文中，術語「殘餘(residual)」可與「殘餘(residue)」互換地使用。應注意，由PQR組件125執行之預測、量化及重建的上述實例方法僅為說明性的，且可實施其他方法。亦應注意，PQR組件125可包括用於執行預測、量化及/或重建之子組件。應進一步注意，預測、量化及/或重建可由若干單獨編碼器組件代替PQR組件125執行。仍參考圖 2 ，PQR組件125可包括失真電路188。失真電路可對應於用於執行與下文所描述之功能相關的指令之計算裝置。失真電路188可包括處理器(例如，視訊處理單元或通用處理單元)及記憶體，其集合地經組態以管理任務之傳達及執行。失真電路188可接收視訊資料之輸入，視訊資料具有多種色彩空間。舉例而言，輸入視訊資料之色彩空間可為RGB或RCT色彩空間，或明度-色度表示，諸如YCbCr、YCoCg或無損YCoCg-R。失真電路188可計算數個寫碼模式在應用於輸入視訊資料時的失真。失真電路188可根據所計算失真及成本函數判定待用於輸入視訊資料之特定圖塊或區塊上的最佳寫碼模式，且向PQR組件125提供此資訊。成本函數控制解碼器處之速率-失真效能。舉例而言，產生相對最少失真之寫碼模式可在速率過高時使得緩衝器上溢。替代地，相對高速率可為可接受的，但此以影像之品質為代價。因此，失真電路188提供使用速率控制技術判定所接收之影像資料的每一區塊或圖塊的最佳寫碼模式之優點，使得將影像品質及緩衝器速率維持在可接受位準處。線緩衝器130保存來自PQR組件125之輸出，使得PQR組件125及索引式色彩歷史135可使用經緩衝視訊資料。索引式色彩歷史135儲存最近使用的像素值。此等最近使用之像素值可直接由視訊編碼器20經由專用語法參考。熵編碼器140基於索引式色彩歷史135及由平度偵測器115識別之平度轉變而對預測殘餘及自PQR組件125接收之任何其他資料(例如，由PQR組件125識別之索引)進行編碼。在一些實例中，熵編碼器140可每時脈每子串流編碼器編碼三個樣本。子串流多工器145可基於無標頭封包多工方案而對位元串流進行多工。此允許視訊解碼器30並行運行三個熵解碼器，從而促進每時脈之三個像素解碼。子串流多工器145可最佳化封包次序以使得封包可由視訊解碼器30有效地解碼。應注意，可實施可有助於每時脈進行2之冪個像素(例如，2像素/時脈或4像素/時脈)的解碼的不同熵寫碼方法。失真之計算 在某些實施例中，視訊編碼器20之失真電路188可計算相同色彩空間中之所有寫碼模式的失真。舉例而言，失真電路可藉由應用適當之色彩變換來計算相同色彩空間中之所有寫碼模式的失真。適當色彩變換可指代上文所揭示之各種色彩變換。色彩變換之實例包括將輸入RGB信號轉換成明度-色度表示及將明度-色度表示轉換成RGB信號。在一個實施中，失真電路188可對一組殘餘區塊340a至340n 執行色彩變換，其中殘餘區塊340a至340n 表示原始區塊(310、315)與經重建區塊330 (或經編碼區塊)之間的差。舉例而言，原始區塊(310、315)可為已在編碼之前分割成數個區塊或圖塊之輸入圖框的經分割表示。經重建區塊330可表示使用複數個寫碼模式325經編碼的數個不同色彩空間中之原始區塊中的一者。在另一實施中，失真電路188可在計算殘餘區塊340a至340n 之前對原始區塊(310、315)及經重建區塊330兩者執行色彩變換。圖 3 說明圖 2 之失真電路188的實例實施。失真電路包括複數個功能組件。失真電路之功能組件包括區塊編碼器320、差計算335a至335n 組件及失真計算345a至345n 組件。在其他實例中，失真電路188可包括更多、更少或不同功能組件。仍參考圖 3 ，失真電路188可自緩衝器110接收源視訊資料13，以及自色彩空間轉換器105輸出之視訊資料。當源視訊資料13之格式呈RGB色彩空間時，色彩空間轉換器105可使用線性色彩變換對資料進行去相關。色彩空間轉換器105可使用各種色彩變換。例如，將RGB轉換成明度-色度表示(例如，用於JPEG中之YCbCr、YCoCg或RCT)的變換。又，使用RGB至YCoCg之有損(YCoCg)及無損(YCoCg-R)版本的色彩變換。在一個實施中，色彩空間轉換器105與源視訊資料13色彩空間(例如，YCoCg-R)之可逆版本相容，使得色彩變換不引入任何損耗。可逆變換可能需要用於色度分量之額外資料位元。舉例而言，對於8位元RGB，明度分量或頻道需要8個位元，且色度分量(Co及Cg)中之每一者需要9個位元。 YCoCg-R之前向色彩變換可給定為：YCoCg-R之反向色彩變換可給定為：在上述實例等式中，RGB及YCoCg色彩空間各自包括三個色彩平面(亦即R、G及B；或Y、Co及Cg)。在視訊編碼器20中，可在YCoCg抑或在RGB色彩空間中評估各模式之速率失真(「RD」)效能。舉例而言，視訊編碼器20可使用圖案、MPP及MPP後降模式評估RGB色彩空間中之RD效能，而明度-色度色彩空間中之RD效能可使用其他模式。自視訊編碼器20接收之源視訊資料13及自色彩空間轉換器105接收之經色彩變換資料可皆分割成區塊或圖塊。在一個實施例中，可在由失真電路188接收之前在任何點處(例如，在視訊源18處)分割源視訊資料13。在另一實施例中，失真電路188可分割源視訊資料13以產生RGB區塊310及YCoCg區塊315。仍參考圖 3 ，失真電路188亦可包括區塊編碼器320。區塊編碼器320可包括處理器(例如，視訊處理單元或通用處理單元)及記憶體，其集合地經組態以儲存指令及執行任務。區塊編碼器320可基於各區塊之色彩空間將數個寫碼模式325 (在本文中亦被稱作「模式1」、「模式2」或「模式n 」)應用於各區塊。舉例而言，各區塊(310、315)之寫碼模式325可包括變換模式(例如，DCT、哈達馬德)、區塊預測模式、微分脈碼調變(DPCM)模式、圖案模式、中點預測(MPP)模式及/或中點預測後降(MPPF)模式。區塊編碼器320可接收RGB區塊310及YCoCg區塊315，且藉由數個寫碼模式325中之任一者對各區塊進行編碼。在一個實施例中，區塊編碼器320藉由適合於與各所接收區塊相關聯之色彩空間的所有寫碼模式來對各所接收區塊進行編碼。區塊編碼器320可輸出數個經重建區塊330，經重建區塊330表示使用數個模式所編碼之所接收區塊(310、315)中的一者。舉例而言，可使用來自寫碼模式325之中點預測模式及變換模式來對RGB區塊310中之區塊1進行編碼。區塊編碼器320可輸出對應於區塊1之兩個區塊，該等區塊各自藉由中點預測模式抑或變換模式進行編碼，各經編碼區塊為RGB區塊310中之區塊1的經編碼表示。區塊編碼器320產生數個經重建區塊330，使得失真電路188可針對各模式計算如所接收之RGB區塊310及YCoCg區塊315兩者與經重建區塊330之間的差。仍參考圖 3 ，失真電路188可進一步包括差計算335a至335n 組件。差計算335a至335n 組件可包括處理器(例如，視訊處理單元或通用處理單元)及記憶體，其集合地經組態以儲存指令及執行任務。差計算335a至335n 組件可計算經重建區塊330與其相對應原始區塊(310、315)之間的差。舉例而言，區塊編碼器320可使用來自寫碼模式325之中點預測模式及變換模式來對RGB區塊310中之區塊1進行編碼。區塊編碼器320可輸出對應於區塊1之兩個區塊，該等區塊各自藉由中點預測模式抑或變換模式進行編碼，各經編碼區塊為RGB區塊310中之區塊1的經編碼表示。差計算335a模組可計算RGB區塊310中之區塊1與經重建區塊330之相對應經編碼區塊模式1(亦即，藉由中點預測模式所編碼)之間的差。差計算335b模組可計算RGB區塊310中之區塊1與經重建區塊330之相對應經編碼區塊模式2(亦即，藉由變換模式所編碼)之間的差。差計算335a至335n 可產生殘餘區塊340a至340n ，其中殘餘區塊340a至340n 表示RGB區塊310及YCoCg區塊315與其相對應經重建區塊330之間的差。仍參考圖 3 ，失真電路188可執行失真計算345a至345n 。失真計算345a至345n 可計算各殘餘區塊340a至340n 之失真。失真計算345a至345n 可包括在計算殘餘區塊340a至340n 之失真之前將所接收殘餘區塊340a至340n 轉換成均一色彩空間的色彩空間變換函數。失真電路188可基於所計算失真而判定特定區塊之最佳模式，且將藉由最佳模式所編碼之區塊輸出至PQR組件125。舉例而言，若輸入至失真電路188中之源視訊資料13在RGB色彩空間中，則區塊編碼器320可使用中點預測模式兩者對RGB色彩空間310中之區塊1進行編碼，藉此產生RGB色彩空間中之區塊1的一個經編碼版本。然而，複數個寫碼模式325中之某些寫碼模式僅可對在明度-色度色彩空間中之視訊區塊進行編碼。因此，色彩空間轉換器105可將源視訊資料13之色彩空間自RGB色彩空間轉換成明度-色度表示(諸如YCoCg)。區塊編碼器320可藉由變換模式及圖案模式兩者對YCoCg色彩空間315中之區塊1進行編碼，藉此產生YCoCg色彩空間中之區塊1的兩個經編碼版本。差計算335a至335n 可在各模式中產生區塊1之殘餘區塊340a至340n 。失真計算345a至345n 可對RGB色彩空間中之殘餘區塊340a至340n 或YCoCg色彩空間中之殘餘區塊340a至340n 執行色彩空間變換函數，使得可在相同色彩空間中計算在區塊1上所使用之各模式的失真。在一個實例中，對於所有模式，失真電路188可在RGB色彩空間抑或明度-色度色彩空間中執行失真計算345a至345n ，其中失真計算包括SAD (絕對差之總和)或SSE (平方誤差之總和)。舉例而言，當YCoCg-R變換用作色彩空間以計算失真時，可將色度分量之失真標準化為考慮一個額外位元。舉例而言，YCoCg-R可每明度分量使用8個位元，且針對色度分量中之每一者使用9個位元。可如下在等式4中計算YCoCg色彩空間中之SAD：其中：SAD(Y) ：區塊之明度分量的絕對差總和，SAD(Co) ：區塊之Co色度分量的絕對差總和，SAD(Cg) ：區塊之Cg色度分量的絕對差總和，且offset ：可用以捨入為最近整數之可選值，例如，偏移可為值0或1。應注意，明度分量(Y)或明度平面及色度分量(Co、Cg)或色度平面表示正分析之區塊或圖塊中的每一像素之明度及色度值。舉例而言，將等式4應用於含有16個像素之區塊將導致計算16個樣本之明度值、16個樣本之Co值及16個樣本之Cg值中的每一者之SAD。所得值向右移位1以有效地將色度分量標準化為在各分量中考慮一個額外位元。當SSE用作用以計算失真之度量時，可使用等式5：其中：SSE(Y) ：區塊之明度分量的平方誤差總和，SSE(Co) ：區塊之Co色度分量的平方誤差總和SSE(Cg) ：區塊之Cg色度分量的平方誤差總和，且offset ：可用以捨入為最近整數之可選值，例如，偏移可為值0或1。應注意，明度分量(Y)或明度平面及色度分量(Co、Cg)或色度平面表示正分析之區塊或圖塊中的每一像素之明度及色度值。舉例而言，將等式5應用於含有16個像素之區塊將導致計算16個樣本之明度值、16個樣本之Co值及16個樣本之Cg值中的每一者之SSE。所得值向右移位1以有效地將色度分量標準化為在各分量中考慮一個額外位元。替代地，失真電路188可將權重應用於YCoCg色彩空間中之各色彩平面，以有效地考慮人類對比視覺敏感度。因為人類視覺可能相比色度更敏感於明度，所以失真電路188可將較大權重應用於明度分量，且相對於明度分量將較小權重應用於色度分量。舉例而言，SAD之計算如下：其中、及為應用於各別明度及色度分量之權重。可在SSE用作失真度量時使用類似視覺權重：舉例而言，失真電路188可自等式2及3之色彩變換矩陣推導出權重，而非在失真計算345a至345n 中將色彩變換應用於殘餘區塊340a至340n ，且各明度及色度分量中之失真可經加權以計算失真。此方法避免在失真計算345a至345n 中所執行之色彩變換的計算，藉此簡化程序。失真電路188可基於變換矩陣中之三行值中之每一者的行範數(例如，範數(歐幾里得範數))而計算各分量之權重。舉例而言，當在RGB色彩空間中計算寫碼模式之失真時，如下在等式8及9中之任一者中使用等式3之變換矩陣來計算在YCoCg色彩空間中操作之寫碼模式的失真：在此處，權重表示反向變換矩陣(YCoCg至RGB)中之行的範數。在此處，權重表示反向變換矩陣(YCoCg至RGB)中之各別行的範數之平方。此外，可使用固定點計算以計算失真，而非使用浮點計算。舉例而言，權重可藉由8位元分率精確度表示為。替代地，當YCoCg色彩空間設定為用於計算失真之色彩空間時，可基於前向變換矩陣之行而推導出權重以便為R、G及B失真加權。舉例而言，SAD可計算為：其中、及為應用於各別明度及色度分量之權重。可在SSE用作失真度量時使用類似視覺權重：應注意，R分量(R)、G分量(G)及B分量(B)表示正分析之區塊或圖塊中的每一像素之紅、綠及藍值。舉例而言，將等式10及11應用於含有16個像素之區塊將導致計算16個樣本之紅色值、16個樣本之綠色值及16個樣本之藍色值中的每一者之SAD及SSE。可基於前向變換矩陣中之三行值中之每一者的行範數(例如，範數(歐幾里得範數))而計算各分量之權重。舉例而言，當在YCoCg色彩空間中計算寫碼模式之失真時，可如下在等式12及13中之任一者中使用等式2之前向變換矩陣來計算在RGB色彩空間中操作之寫碼模式的失真：在此處，權重表示前向變換矩陣(RGB至YCoCg)中之行的範數。在此處，權重表示反向變換矩陣(RGB至YCoCg)中之各別行的範數之平方。此外，可使用固定點計算以計算失真，而非使用浮點計算。上文所描述之技術及方法並非僅限於RGB至YCoCg無損色彩變換，且其可應用於任何線性色彩變換，例如，YCbCr、YCoCg有損變換。以此方式，該等技術可使用相同色彩空間以便針對各種寫碼模式(例如，所有寫碼模式)計算失真。使用相同色彩空間可使計算更具有效率且提高效能。取決於實施例，本發明中所描述之實例及實施例可單獨地或以組合實施。取決於實施例，可省略或改變實例及實施例之某些特徵，且可將其他特徵添加至該等實例及實施例。圖 4 說明實質上類似於圖3之失真電路188的替代性實施例。在此實施例中，可在差計算335a至335n 及殘餘區塊340a至340n 之產生之前將色彩變換及失真計算345a至345n 應用於原始區塊及經重建區塊兩者。圖 3 中之失真電路188的所有其他功能區塊以類似於圖 4 之失真電路188的功能區塊之方式起作用。應注意，儘管圖4說明基於失真計算345a至345n 所進行之差計算335a至335n ，但替代性實施例可包括以類似於圖 3 之方式進行的差計算。DSC 視訊解碼器 圖 5 為說明可實施根據本發明中描述之態樣的技術之視訊解碼器30之實例的方塊圖。視訊解碼器30可經組態以執行本發明之技術中的一些或全部。在一些實例中，本發明中描述之技術可在視訊解碼器30之各種組件當中共用。在一些實例中，另外或替代地，處理器(未展示)可經組態以執行本發明中描述的技術中之一些或全部。出於解釋之目的，本發明在DSC寫碼的上下文中描述視訊解碼器30。然而，本發明之技術可適用於其他寫碼標準或方法。在圖 5 之實例中，視訊解碼器30包括複數個功能組件。視訊解碼器30之功能組件包括速率緩衝器155、子串流解多工器160、熵解碼器165、速率控制器170、預測器、量化器及重建器(PQR)組件175、索引式色彩歷史180、線緩衝器185及色彩空間轉換器190。視訊解碼器30之所說明組件類似於上文結合圖 2A 中之視訊編碼器20所描述的相對應組件。由此，視訊解碼器30之組件中之每一者可以與上文所描述之視訊編碼器20之相對應組件類似的方式操作。仍參考圖 5 ，視訊解碼器30之速率緩衝器155可為用以儲存自圖1B之輸入介面28接收的經壓縮視訊資料之實體記憶體的一部分。速率緩衝器155可按某一位元速率接收經壓縮視訊資料，且按某一恆定位元速率輸出經壓縮視訊串流。為了確保恰當的解碼，視訊解碼器30之速率緩衝器155不應在經壓縮位元串流之解碼期間「下溢」或「上溢」。在一些實施例中，可基於表示當前在緩衝器中的位元之數目的值BufferCurrentSize及表示速率緩衝器150之大小的(亦即，在任何時間點處可儲存於速率緩衝器150中之最大位元數目，如上文之等式1所提及) BufferMaxSize而界定緩衝器充滿度(BF)。速率緩衝器155可平緩經壓縮視訊中之速率變化。速率緩衝器155可充當視訊解碼器30中之速率控制機制的一部分，將在下文結合速率控制器170更詳細地描述該速率緩衝器。可以其他方式計算BF，且BF計算之所選方法可取決於上下文及應用而變化。在另一實例中，可藉由將BF除以100來將BF標準化為自0至1。標準化BF值可用以計算λ值。可基於以下等式而計算基於緩衝器充滿度之λ值：其中為可調諧參數。x ∈ [0,1]及x被計算為，其中BF在此處表示為百分比(例如，緩衝器中所佔用之位元的百分比)。仍參考圖 5 ，子串流解多工器160可包括自速率緩衝器155接收經壓縮視訊資料且使用連接至熵解碼器165之數個輸出線輸出資料的積體電路裝置，輸出線由選擇輸入判定。子串流解多工器160可經配置以將所接收經壓縮視訊資料劃分成一或多個解多工器位元串流以供經由一或多個頻道傳輸。一或多個位元串流可輸出至一或多個熵解碼器165以供解碼。子串流解多工器160可用作用於對來自視訊編碼器20之子串流多工器145的經多工資料輸出進行解多工的互補裝置。仍參考圖 5 ，熵解碼器165可包括電子電路，例如，視訊處理單元或通用處理單元。熵解碼器165可自子串流解多工器160接收經壓縮視訊資料。熵解碼單元165可解析經壓縮視訊資料以自位元串流獲得語法元素。熵解碼單元165可對經熵編碼語法元素進行熵解碼。所接收經壓縮視訊資料可包括經寫碼圖塊資料。作為解碼位元串流之部分，熵解碼單元165可自經寫碼圖塊資料提取語法元素並對其進行熵解碼。經寫碼圖塊中之每一者可包括圖塊標頭及圖塊資料。圖塊標頭可含有涉及圖塊之語法元素。熵解碼器165可將運動向量及其他語法元素遞送至PQR組件175。視訊解碼器30可在視訊圖塊層級及/或視訊區塊層級處接收語法元素。熵解碼器165可用作用於對由視訊編碼器20之熵編碼器140編碼的資料進行解碼的互補裝置。PQR組件175可基於自位元串流提取之語法元素而產生經解碼視訊資料。仍參考圖 5 ，速率控制器170可包括電子電路，例如，視訊處理單元或通用處理單元。速率控制器170可自熵解碼器165接收經熵解碼位元串流作為輸入。速率控制器170判定寫碼參數(例如，QP)之集合。 QP可由速率控制器170基於速率緩衝器155之緩衝器充滿度及視訊資料之影像活動來加以調節，以便將目標位元速率之圖像品質最大化，此情況確保速率緩衝器155不上溢或下溢。速率控制器170亦針對視訊資料之各區塊選擇特定寫碼選項(例如，特定模式)以便實現最優速率-失真效能。速率控制器170最小化經重建影像之失真以使得其滿足位元速率約束(亦即，整體實際寫碼速率符合目標位元速率中)。換言之，速率控制器藉由防止區塊速率壓垮可用資源來防止緩衝器故障。仍參考圖 5 ，索引式色彩歷史180可包括電子電路，例如視訊處理單元或通用處理單元，該等處理單元中之任一者包括記憶體。索引式色彩歷史180可自一或多個熵解碼器165接收經壓縮視訊之位元串流，且亦可自PQR組件175接收資料。索引式色彩歷史180可儲存最近使用之像素值。此等最近使用之像素值可直接由PQR組件175經由專用語法參考。使用索引式色彩歷史180之優點包括管理數位影像之色彩以加速顯示再新及資料傳送。仍參考圖 5 ，線緩衝器185可包括電子電路，例如，實施於積體電路上之儲存裝置。線緩衝器185保存來自PQR組件175之輸出，使得PQR組件175及索引式色彩歷史180可使用經緩衝視訊資料。索引式色彩歷史180儲存最近使用之像素值。此等最近使用之像素值可直接由視訊解碼器30經由專用語法參考。仍參考圖 5 ，PQR組件175可包括電子電路，例如，視訊處理單元或通用處理單元。PQR組件175可執行視訊解碼器30之至少三個編碼操作。舉例而言，PQR組件175可在數個不同模式中執行預測。舉例而言，若視訊圖塊經寫碼為經框內寫碼圖塊，則PQR組件175可基於所傳信框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料而產生當前視訊圖塊之視訊區塊的預測資料。在另一實例中，若視訊圖框經寫碼為經框間寫碼圖塊，則PQR組件175可基於運動向量及自熵解碼器165接收之其他語法元素而產生當前視訊圖塊之視訊區塊的預測性區塊。預測處理可將所得經框內或框間寫碼區塊提供至求和器或重建器以產生殘餘區塊資料並重建經解碼區塊。 PQR組件175亦執行量化。可經由反量化判定殘餘區塊。舉例而言，反量化處理量化(亦即，解量化)位元串流中所提供且由熵解碼器165解碼之經量化變換係數。反量化程序可包括將由視訊編碼器20計算之量化參數用於視訊圖塊中之各視訊區塊以判定量化程度，且同樣地判定應應用之反量化的程度。PQR組件175可包括將反變換(例如，反DCT、反整數變換或概念上類似之反變換程序)應用於變換係數以便在像素域中產生殘餘區塊的反變換程序。PQR組件175可用作用於反量化來自視訊編碼器20之PQR組件125的資料輸出之互補裝置。 PQR組件175亦執行重建。PQR組件175可重建像素域中之殘餘區塊以供稍後用作參考區塊。舉例而言，在明度-色度表示中，重建器可使用來自與寫碼單元(CU)之變換單元(TU)相關聯的明度、Cb及Cr變換區塊，及CU之PU的預測單元(PU)明度、Cb及Cr區塊之殘餘值(亦即，在適用時，框內預測資料抑或框間預測資料)以重建CU之明度、Cb及Cr寫碼區塊。舉例而言，PQR組件175之重建器可將明度、Cb及Cr變換區塊之樣本添加至預測性明度、Cb及Cr區塊之相對應樣本以重建CU之明度、Cb及Cr寫碼區塊。再次參考圖 5 ，色彩空間轉換器190可包括電子電路，例如，視訊處理單元或通用處理單元。色彩空間轉換器190可將用於寫碼實施中之色彩空間轉換成用於顯示實施中之色彩空間。舉例而言，由色彩空間轉換器190接收之色彩空間可在由寫碼實施使用之明度Y、色度綠Cg及色度橙Co (YCgCo)色彩空間中，且顯示實施可包括紅綠藍(RGB)色彩空間。色彩空間轉換可藉由各種方法予以執行，包括上文之等式2及3中所提及的對視訊資料進行移位及添加。應注意，可處理其他色彩空間中之輸入視訊資料，且亦可執行對其他色彩空間的轉換。在相關態樣中，視訊解碼器30可包括速率緩衝器155及/或線緩衝器185。舉例而言，速率緩衝器155可在視訊解碼器30之其他部分使用經色彩空間轉換視訊資料之前保存該視訊資料。在另一實例中，視訊資料可儲存於明度-色度色彩空間中且可視需要執行色彩空間轉換，此係因為經色彩空間轉換資料可需要較多位元。圖 6 為說明用於判定第一視訊區塊(310、315)之寫碼模式的程序400之一實例的流程圖。在區塊405處，視訊編碼器20之失真電路188在至少一個色彩空間中接收第一視訊區塊(310、315)。在一些實施中，可在數個不同色彩空間中接收第一視訊區塊(310、315)。舉例而言，可在RGB色彩空間及明度-色度色彩空間中接收第一視訊區塊(310、315)。仍參考圖 6 ，在區塊410處，失真電路188之區塊編碼器320產生複數個經重建視訊區塊330。複數個經重建視訊區塊330指示使用複數個寫碼模式325所編碼之第一視訊區塊(310、315)。換言之，複數個經重建視訊區塊330中之每一者為已使用數個寫碼模式中之一者所重建的第一視訊區塊(310、315)之複本。在一些實施中，區塊編碼器320可使用與第一視訊區塊(310、315)之色彩空間相容的數個寫碼模式來對第一視訊區塊(310、315)進行編碼。舉例而言，區塊編碼器320可使用中點預測模式對RGB色彩空間310中之第一視訊區塊進行編碼。區塊編碼器320亦可使用變換模式對YCoCg色彩空間315中之第一視訊區塊進行編碼。在此實例中，區塊編碼器320產生複數個經重建視訊區塊330，其中複數個經重建視訊區塊330在不同色彩空間中加以表示，且指示第一視訊區塊(310、315)。仍參考圖 6 ，在區塊415處，失真電路188選擇複數個色彩空間中之一個色彩空間。在一個實施中，失真電路188可自複數個經重建視訊區塊330判定RGB色彩空間中之數個經重建區塊及明度-色度表示中之數個經重建區塊。失真電路188可在區塊420處藉由選擇表示經重建視訊區塊330之大部分的色彩空間來減少計算。在另一實施中，使用者可選擇色彩空間，或失真電路188可經預程式化以選擇特定色彩空間。仍參考圖 6 ，在區塊420處，失真電路188將色彩變換應用於複數個經重建視訊區塊330中之不在所選色彩空間中的每一經編碼視訊區塊。色彩變換可包括等式2及3之色彩變換矩陣，其中色彩變換矩陣包括等於色彩空間中之色彩平面數目的行數目。在一個實施中，失真電路188將色彩變換應用於數個殘餘區塊340a至340n ，其中各殘餘區塊表示第一視訊區塊(310、315)與複數個經重建視訊區塊330中之每一者之間的差。在另一實施中，失真電路188在計算殘餘區塊340a至340n 之前將色彩變換應用於第一視訊區塊(310、315)及複數個經重建視訊區塊330中之每一者兩者。仍參考圖 6 ，在區塊425處，失真電路188判定複數個殘餘區塊340a至340n 中之每一者的失真值。在另一實施中，失真電路188判定複數個經重建視訊區塊330中之每一者的失真值。在任一實施中，失真電路188可計算RGB色彩空間抑或明度-色度色彩空間中之失真值，其中失真值可為(i)經重建區塊330中之每一者抑或(ii)殘餘區塊340a至340n 中之每一者之SAD或SSE。在另一實施中，當所選色彩空間為明度-色度色彩空間時，失真電路188可將經計算失真值標準化為考慮色度分量中之額外位元。舉例而言，失真電路188可使由SAD或SEE計算之失真值向右移位1。在又一實施中，失真電路188可在明度-色度色彩空間中應用SAD及SSE計算的加權值。舉例而言，失真電路188可基於色彩變換矩陣中之各行的行範數或歐幾里得範數而計算明度-色度色彩空間中之各色彩平面的權重。仍參考圖 6 ，在區塊430處，失真電路188基於考慮位元速率及失真值兩者之成本函數而判定複數個寫碼模式325中之最佳寫碼模式。在一個實施中，失真電路188使用成本值函數判定寫碼模式。舉例而言，失真電路188可依據成本函數：D+λ×R而基於位元速率與失真之間的取捨來判定最佳寫碼模式。在此處，參數R指代第一視訊區塊(310、315)之位元速率，位元速率可為在編碼器20與解碼器30之間傳輸的第一視訊區塊(310、315)之總位元數目。參數D指代第一視訊區塊(310、315)之失真。參數λ為可為參數R與D之間的取捨之拉格朗日參數。應注意，可以各種方式計算拉格朗日參數λ，且λ計算之所選方法可取決於上下文及應用而變化。舉例而言，視訊編碼器可基於數個因素(諸如速率緩衝器(150、155)狀態、第一視訊區塊(310、315)之條件等)而計算拉格朗日參數λ。仍參考圖 6 ，在區塊435處，視訊編碼器20將第一經編碼視訊區塊傳達至目的地裝置，第一經編碼視訊區塊指示使用經判定最佳寫碼模式所編碼之第一視訊區塊(310、315)。其他考慮因素 應注意，已經自編碼器(諸如，圖 2 中之視訊編碼器20)之視角描述了本發明之態樣。然而，熟習此項技術者將瞭解，與彼等上文所描述之操作相反的操作可經應用以解碼由(例如)圖 5 中之視訊解碼器30產生的位元串流。可使用多種不同技術及技藝中之任一者來表示本文中揭示之資訊及信號。舉例而言，可由電壓、電流、電磁波、磁場或磁性粒子、光場或光學粒子或其任何組合表示遍及以上描述可能參考的資料、指令、命令、資訊、信號、位元、符號及晶片。結合本文中所揭示之實施例而描述之各種說明性邏輯區塊、模組、電路及演算法步驟可被實施為電子硬體、電腦軟體或兩者之組合。為了清楚地說明硬體與軟體之此可互換性，上文已大體在其功能性方面描述了各種說明性組件、區塊及步驟。將此功能性實施為硬體還是軟體取決於特定應用及強加於整個系統上之設計約束。對於每一特定應用而言，熟習此項技術者可以變化之方式實施所描述之功能性，但不應將該等實施決策解釋為導致脫離本發明之範疇。因此，本文中描述之技術可以硬體、軟體、韌體或其任何組合實施。可以諸如通用電腦、無線通信裝置手機或具有多種用途之積體電路裝置的多種裝置中之任一者實施此類技術。可將描述為裝置或組件之任何特徵一起實施於整合式邏輯裝置中或分開來實施為離散但可互操作之邏輯裝置。若以軟體實施，則該等技術可至少部分由包含包括當經執行時執行以上描述方法中之一或多者之指令之程式碼的電腦可讀資料儲存媒體實現。電腦可讀資料儲存媒體可形成電腦程式產品之部分，電腦程式產品可包括包裝材料。電腦可讀媒體可包含記憶體或資料儲存媒體，諸如隨機存取記憶體(RAM)，諸如同步動態隨機存取記憶體(SDRAM)、唯讀記憶體(ROM)、非揮發性隨機存取記憶體(NVRAM)、電可抹除可程式化唯讀記憶體(EEPROM)、快閃記憶體、磁性或光學資料儲存媒體及類似者。該等技術另外或替代地可至少部分由電腦可讀通信媒體實現，該電腦可讀通信媒體攜載或傳達呈指令或資料結構之形式且可由電腦存取、讀取及/或執行的程式碼，諸如，傳播之信號或波。程式碼可由可包括一或多個處理器之處理器執行，諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合式或離散邏輯電路。此處理器可經組態以執行本發明中所描述的技術中之任一者。通用處理器可為微處理器；但在替代例中，處理器可為任何習知處理器、控制器、微控制器或狀態機。處理器亦可實施為計算裝置之組合，例如DSP與微處理器之組合、複數個微處理器、結合DSP核心之一或多個微處理器，或任何其他此組態。因此，如本文中所使用之術語「處理器」可指前述結構、前述結構之任何組合或適合於實施本文中描述之技術的任何其他結構或設備中之任一者。另外，在一些態樣中，本文中描述之功能性可提供於經組態用於編碼及解碼之專用軟體或硬體內，或併入於組合之視訊編碼器-解碼器(編解碼器)中。又，該等技術可完全實施於一或多個電路或邏輯元件中。本發明之技術可在廣泛多種裝置或設備中予以實施，包括無線手機、積體電路(IC)或一組IC (例如，晶片組)。在本發明中描述各種組件或單元以強調經組態以執行所揭示技術之裝置的功能態樣，但未必需要藉由不同硬體單元實現。實情為，如上所述，各種單元可與適合的軟體及/或韌體一起組合在編碼解碼器硬體單元中或由互操作硬體單元之集合提供，硬體單元包括如上文所描述之一或多個處理器。雖然已經結合各種不同實施例描述了前文，但可在不脫離本發明之教示的情況下將自一項實施例之特徵或元件與其他實施例組合。然而，各別實施例之間的特徵之組合未必限於此。已描述了本發明之各種實施例。此等及其他實施例在以下申請專利範圍之範疇內。

10‧‧‧視訊寫碼系統
11‧‧‧裝置
12‧‧‧源裝置
13‧‧‧處理器/控制器裝置/源視訊資料
14‧‧‧目的地裝置
16‧‧‧視訊資料
17‧‧‧連結
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示裝置
105‧‧‧色彩空間轉換器
110‧‧‧緩衝器
115‧‧‧平度偵測器
120‧‧‧速率控制器
125‧‧‧預測器、量化器及重建器(PQR)組件
130‧‧‧線緩衝器
135‧‧‧索引式色彩歷史
140‧‧‧熵編碼器
145‧‧‧子串流多工器
150‧‧‧速率緩衝器
155‧‧‧速率緩衝器
160‧‧‧子串流解多工器
165‧‧‧熵解碼器
170‧‧‧速率控制器
175‧‧‧預測器、量化器及重建器(PQR)組件
180‧‧‧索引式色彩歷史
185‧‧‧線緩衝器
188‧‧‧失真電路
190‧‧‧色彩空間轉換器
310‧‧‧第一視訊區塊
315‧‧‧第一視訊區塊
320‧‧‧區塊編碼器
325‧‧‧寫碼模式
330‧‧‧經重建視訊區塊
335a‧‧‧差計算
335b‧‧‧差計算
335n‧‧‧差計算
340a‧‧‧殘餘區塊
340b‧‧‧殘餘區塊
340n‧‧‧ 殘餘區塊
345a‧‧‧失真計算
345b‧‧‧失真計算
345n‧‧‧失真計算
400‧‧‧程序
405‧‧‧區塊
410‧‧‧區塊
415‧‧‧區塊
420‧‧‧區塊
425‧‧‧區塊
430‧‧‧區塊
435‧‧‧區塊

圖 1A 為說明可利用根據本發明中所描述之態樣的技術之實例視訊編碼及解碼系統的方塊圖。圖 1B 為說明可執行根據本發明中所描述之態樣的技術之另一實例視訊編碼及解碼系統的方塊圖。圖 2 為說明可實施根據本發明中說描述之態樣的技術之視訊編碼器的一實例之方塊圖。圖 3 為說明失真電路之實例實施的方塊圖。圖 4 為說明失真電路之替代性實施的方塊圖。圖 5 為說明可實施根據本發明中所描述之態樣的技術之視訊解碼器的一實例之方塊圖。圖 6 為說明用於判定編碼模式之例示性方法的流程圖。

13‧‧‧源視訊資料

105‧‧‧色彩空間轉換器

125‧‧‧預測器、量化器及重建器(PQR)組件

188‧‧‧失真電路

310‧‧‧第一視訊區塊

315‧‧‧第一視訊區塊

320‧‧‧區塊編碼器

325‧‧‧寫碼模式

330‧‧‧經重建視訊區塊

335a‧‧‧差計算

335b‧‧‧差計算

335n‧‧‧差計算

340a‧‧‧殘餘區塊

340b‧‧‧殘餘區塊

340n‧‧‧殘餘區塊

345a‧‧‧失真計算

345b‧‧‧失真計算

345n‧‧‧失真計算

Claims

一種用於對視訊資料進行寫碼之設備，其包含：一記憶體，其用於儲存該視訊資料及關於複數個寫碼模式之資訊，該視訊資料包含複數個視訊區塊；及一硬體處理器，其以操作方式耦接至該記憶體且經組態以：針對該複數個視訊區塊中之一視訊區塊選擇複數個色彩空間中之一者，將一色彩變換應用於該複數個視訊區塊中之不在該所選色彩空間中的每一視訊區塊，且驗證該複數個視訊區塊中之所有該等視訊區塊在該所選色彩空間中，及基於該所選色彩空間而判定該複數個視訊區塊中之每一者的一失真值。
如請求項1之設備，其中該硬體處理器經進一步組態以：判定該複數個視訊區塊中之各視訊區塊的一初始色彩空間，該初始色彩空間為在應用該色彩變換之前各視訊區塊之色彩空間；判定該複數個寫碼模式中之哪些寫碼模式與該初始色彩空間相容；及藉由該等相容寫碼模式對該複數個視訊區塊中之該視訊區塊進行編碼以提供一經編碼區塊。
如請求項1之設備，其中該硬體處理器經進一步組態以：判定該複數個寫碼模式中之哪些寫碼模式不與該初始色彩空間相容，該初始色彩空間為在應用該色彩變換之前各視訊區塊之該色彩空間；將該色彩變換應用於該初始色彩空間以提供一相容色彩區塊；及藉由不與該初始色彩空間相容之該等寫碼模式對該相容色彩區塊進行編碼以提供一經編碼區塊。
如請求項2之設備，其中該硬體處理器經進一步組態以計算來自該視訊區塊及該經編碼區塊之一殘餘區塊，該殘餘區塊指示該視訊區塊與該經編碼區塊之間的一差。
如請求項4之設備，其中判定該失真值包含判定該殘餘區塊之該失真值。
如請求項1之設備，其中該所選色彩空間包含一明度-色度色彩空間且其中判定該失真值包含標準化該明度-色度色彩空間之各色度分量。
如請求項1之設備，其中該視訊區塊包含數個色彩平面，且其中判定該視訊區塊之該失真值包含以下各者中之至少一者：該數個色彩平面中之各色彩平面的絕對差之一總和，及該數個色彩平面中之各色彩平面的平方誤差之一總和。
如請求項1之設備，其中該色彩變換係基於一變換矩陣，該變換矩陣由指示該所選色彩空間之數個色彩平面的數個行界定，且其中該硬體處理器經進一步組態以基於該數個行中之一行的一歐幾里得範數而判定一權重值。
如請求項8之設備，其中該經變換視訊區塊之該失真值係基於以下各者中之至少一者：該數個色彩平面中之各色彩平面的絕對差之一總和，其中各色彩平面乘以該數個權重值中之一相對應權重值，及該數個色彩平面中之各色彩平面的平方誤差之一總和，其中各色彩平面乘以該數個權重值中之該相對應權重值。
如請求項1之設備，其中該所選色彩空間在一明度-色度色彩空間及一RGB色彩空間中之至少一者中。
如請求項1之設備，其中判定一失真值進一步包含基於以下各者而判定該複數個寫碼模式中之一寫碼模式：(i)該複數個視訊區塊中之每一者的該失真值、(ii)一λ值、及(iii)傳達該視訊區塊之一位元串流速率。
如請求項1之設備，其中該複數個視訊區塊中之各視訊區塊指示已使用該複數個寫碼模式中之每一寫碼模式進行編碼的一單個視訊區塊。
一種對視訊資料進行寫碼之方法，其包含：針對複數個視訊區塊中之一視訊區塊選擇複數個色彩空間中之一者；將一色彩變換應用於該複數個視訊區塊中之不在該所選色彩空間中的每一視訊區塊，且驗證該複數個視訊區塊中之所有該等視訊區塊在該所選色彩空間中，及基於該所選色彩空間而判定該複數個視訊區塊中之每一者的一失真值。
如請求項13之方法，其進一步包含：判定該複數個視訊區塊中之各視訊區塊的一初始色彩空間，該初始色彩空間為在應用該色彩變換之前各視訊區塊之色彩空間；判定複數個寫碼模式中之哪些寫碼模式與該初始色彩空間相容；及藉由相容寫碼模式對該複數個視訊區塊中之該視訊區塊進行編碼以提供一經編碼區塊。
如請求項13之方法，其進一步包含：判定複數個寫碼模式中之哪些寫碼模式不與該初始色彩空間相容，該初始色彩空間為在應用該色彩變換之前各視訊區塊之該色彩空間；將該色彩變換應用於該初始色彩空間以提供一相容色彩區塊；及藉由不與該初始色彩空間相容之寫碼模式對該相容色彩區塊進行編碼以提供一經編碼區塊。
如請求項14之方法，其進一步包含計算來自該視訊區塊及該經編碼區塊之一殘餘區塊，該殘餘區塊指示該視訊區塊與該經編碼區塊之間的一差。
如請求項13之方法，其中判定一失真值進一步包含基於以下各者而判定該複數個寫碼模式中之一寫碼模式：(i)該複數個視訊區塊中之每一者的該失真值、(ii)一λ值、及(iii)傳達該視訊區塊之一位元串流速率。
一種非暫時性電腦可讀媒體，其包含在由一裝置執行時使得該裝置執行以下操作之指令：針對複數個視訊區塊中之一視訊區塊選擇複數個色彩空間中之一者，將一色彩變換應用於該複數個視訊區塊中之不在該所選色彩空間中的每一視訊區塊，且驗證該複數個視訊區塊中之所有該等視訊區塊在該所選色彩空間中，及基於該所選色彩空間而判定該複數個視訊區塊中之每一者的一失真值。
如請求項18之非暫時性電腦可讀媒體，其進一步包含：判定該複數個視訊區塊中之各視訊區塊的一初始色彩空間，該初始色彩空間為在應用該色彩變換之前各視訊區塊之色彩空間；判定複數個寫碼模式中之哪些寫碼模式與該初始色彩空間相容；及藉由相容寫碼模式對該複數個視訊區塊中之該視訊區塊進行編碼以提供一經編碼區塊。
如請求項18之非暫時性電腦可讀媒體，其進一步包含：判定複數個寫碼模式中之哪些寫碼模式不與一初始色彩空間相容，該初始色彩空間為在應用該色彩變換之前各視訊區塊之該色彩空間；將該色彩變換應用於該初始色彩空間以提供一相容色彩區塊；及藉由不與該初始色彩空間相容之寫碼模式對該相容色彩區塊進行編碼以提供一經編碼區塊。