TW201347549A

TW201347549A - 經物體偵測所告知的編碼

Info

Publication number: TW201347549A
Application number: TW102103019A
Authority: TW
Inventors: Douglas Scott Price; Hsi-Jung Wu; Xiao-Song Zhou; da-zhong Zhang
Original assignee: Apple Inc
Priority date: 2012-01-26
Filing date: 2013-01-25
Publication date: 2013-11-16
Also published as: KR20140110008A; US20130195178A1; US10205953B2; AU2013212013A1; JP2015508954A; CN104160703A; EP2807822A1; WO2013112814A1

Abstract

本發明之實施例提供用於基於對視訊序列內之物體的偵測而有效率地編碼視訊資料的技術。一視訊編碼器可對圖框執行物體偵測，且在偵測到一物體時，產生該物體所位於的該圖框之一區域的統計。該視訊編碼器可比較鄰近於該物體位置之像素與該物體之統計，且可界定一物體區以包括對應於該物體位置之像素區塊及對應於具有類似於該經偵測物體之統計的鄰近像素的像素區塊。該編碼器可根據一基於區塊之壓縮演算法來編碼視訊圖框，其中根據產生相對較高品質編碼之編碼參數來編碼該物體區之像素區塊，且根據產生相對較低品質編碼之編碼參數來編碼在該物體區外之像素區塊。

Description

經物體偵測所告知的編碼

本發明係關於視訊編碼，且更特定而言，係關於節省頻寬同時保持影像品質之視訊編碼技術。

視訊編碼/解碼系統部署於多種不斷增加之消費型器件中。舉例而言，視訊編碼解碼器可見於現代智慧型手機及平板電腦中，其中通信頻寬由無線網路或提供相對較低且不可預測之頻寬的其他基礎設施來供應。此等應用明顯不同於大得多之頻寬可用於經編碼視訊資料的其他編碼解碼器應用(諸如，DVD播放器)。因此，此等編碼解碼器之現代應用對編碼解碼器設計者強加較高效能要求，以儘可能減小經編碼視訊之位元速率同時仍提供良好影像品質。

本發明者感知到此項技術中對如下視訊編碼器之需要：識別視訊圖框內之所關注物體且選擇編碼參數以提供包括該等物體之區的高品質編碼，節省圖框之其他區處的頻寬，且提供各種區之間的平滑編碼轉變。

本發明之實施例提供用於基於對視訊序列內之物體的偵測而有效率地編碼視訊資料的技術。根據該等實施例，視訊編碼器可對圖框執行物體偵測，且在偵測到物體時，產生該物體所位於的圖框之區域的統計。視訊編碼器可比較鄰近於物體位置之像素與該物體之統計，且可界定物體區以包括對應於物體位置之像素區塊及對應於具有類似於經偵測物體之統計的鄰近像素的像素區塊。編碼器可根據基於區塊之壓縮演算法而編碼視訊圖框，其中根據產生相對較高品質編碼之編碼參數來編碼物體區之像素區塊，且根據產生相對較低品質編碼之編碼參數來編碼在物體區外之像素區塊。

其他實施例提供更複雜編碼技術。舉例而言，視訊編碼器可自個別像素區塊內區分為經偵測物體之部分的像素區塊之部分與並非經偵測物體之部分的像素區塊之其他部分。此等實施例進一步可將預處理操作應用於像素區塊之不同部分，以保持屬於經偵測物體之部分的高品質編碼且提供對非物體部分之高壓縮編碼。舉例而言，編碼器可在編碼之前將模糊濾波器應用於像素區塊之非物體部分。

100‧‧‧視訊編碼系統

110‧‧‧終端機

120‧‧‧第二終端機

130‧‧‧通信網路

131‧‧‧頻道

140‧‧‧視訊編碼器

142‧‧‧預處理器

143‧‧‧編碼引擎

144‧‧‧本端解碼器

145‧‧‧參考圖像快取記憶體

146‧‧‧物體偵測器

147‧‧‧控制器

150‧‧‧視訊解碼器

152‧‧‧解碼引擎

154‧‧‧參考圖像快取記憶體

156‧‧‧後處理器

158‧‧‧控制器

160‧‧‧攝影機

170‧‧‧傳輸器

180‧‧‧接收器

190‧‧‧顯示器

200‧‧‧圖框

300‧‧‧編碼視訊資料之圖框之像素區塊的方法

410‧‧‧區

420‧‧‧區

430‧‧‧子區

440‧‧‧子區

450‧‧‧子區

460‧‧‧子區

470‧‧‧子區

520‧‧‧物體區

530‧‧‧第一子區

540‧‧‧背景區

620‧‧‧物體區

630‧‧‧子區

640‧‧‧子區

700‧‧‧視訊編碼器

710‧‧‧圖框緩衝器

720‧‧‧像素區塊編碼器

721‧‧‧減法器

722‧‧‧變換單元

723‧‧‧量化器

724‧‧‧熵編碼器

725‧‧‧運動估計器

726‧‧‧像素區塊編碼器之控制器

730‧‧‧解碼器

740‧‧‧參考圖像快取記憶體

750‧‧‧物體偵測器

760‧‧‧控制器

圖1說明根據本發明之一實施例的視訊編碼系統之簡化方塊圖。

圖2說明根據本發明之一實施例的可由視訊編碼器處理之視訊資料的例示性圖框。

圖3說明根據本發明之一實施例的編碼視訊資料之圖框之像素區塊的方法。

圖4至圖6說明如應用於圖2中所說明之圖框資料的本發明之各種實施例的實例。

圖7說明根據本發明之一實施例的像素區塊編碼系統之簡化方塊圖。

圖1(a)說明根據本發明之一實施例的視訊編碼系統100之簡化方塊圖。系統100可包括經由網路130互連之複數個終端機110、120。終端機110、120各自可在本端位置處俘獲視訊資料且編碼該視訊資料以供經由網路130傳輸至另一終端機。每一終端機110、120可自網路130 接收另一終端機之經編碼視訊資料，解碼經編碼資料並顯示經恢復視訊資料。

在圖1(a)中，將終端機110、120說明為智慧型手機，但本發明之原理不限於此。本發明之實施例應用於個人電腦(桌上型電腦與膝上型電腦兩者)、平板電腦、電腦伺服器、媒體播放器及/或專用視訊會議設備。網路130表示在終端機110與120之間傳送經編碼視訊資料的任何數目個網路，包括(例如)有線及/或無線通信網路。通信網路130可在電路交換式及/或封包交換式頻道中交換資料。代表性網路包括電信網路、區域網路、廣域網路及/或網際網路。為達成本發明論述之目的，除非在下文中作出解釋，否則網路130之架構及拓撲對本發明之操作無關緊要。

圖1(b)進一步說明可在系統100內操作之視訊編碼器140及視訊解碼器150的功能方塊圖。終端機110可包括攝影機160、視訊編碼器140及傳輸器170。視訊編碼器140可編碼在攝影機160處俘獲之視訊資料且可將經編碼資料遞送至由網路130提供之頻道131。視訊編碼器140可基於視訊資料之內容而選擇編碼參數。傳輸器170可合併由視訊編碼器140提供之經編碼視訊資料與由音訊編碼解碼器或其他資料源(未圖示)提供之其他資料串流，且可調節資料以供傳輸至另一終端機120。

第二終端機120可包括接收器180、視訊解碼器150及顯示器190。接收器180可自頻道131接收資料且將頻道資料剖析成各種資料串流，包括經編碼視訊之串流。視訊解碼器150可解碼經編碼視訊資料，使由視訊編碼器140執行之編碼程序反轉，以自其恢復視訊資料。可藉由顯示器190呈現視訊資料或可儲存視訊資料以供稍後使用。

如所說明，視訊編碼器140可包括預處理器142、編碼引擎143、本端解碼器144、參考圖像快取記憶體145、物體偵測器146及控制器147。預處理器142可接受來自攝影機160之來源視訊，且可對來源視訊執行各種處理操作以調節其以用於編碼。編碼引擎143可對經預處理視訊執行壓縮操作以減小經預處理視訊中之空間及/或時間冗餘。編碼引擎143可將經編碼視訊資料輸出至傳輸器170。解碼器144可解碼參考圖框之經編碼視訊資料且可將經解碼參考圖框儲存於參考圖像快取記憶體145中以用於在編碼稍後接收之視訊中使用。

如名稱所隱含的，物體偵測器146可識別來源視訊內之物體，例如，人臉或其他預定類型之物體。物體偵測器146可產生至控制器147之資料，該資料指示是否在圖框內偵測到物體且若偵測到物體，則指示物體在何處找到。作為回應，控制器147可界定圖框內之一或多個編碼區，且可將對編碼區中之每一者的編碼調整提供至編碼引擎143。

預處理器142可對自攝影機輸出之來源視訊執行多種視訊處理操作以調節來源視訊以用於編碼。預處理器142可包括濾波器陣列(未圖示)，諸如去雜訊濾波器、清晰化濾波器、平滑濾波器、雙向濾波器及其類似者，可基於在視訊內觀測到之特性而將該等濾波器動態地應用於來源視訊。預處理器142可包括其自身之控制器(未圖示)以查核來自攝影機之來源視訊資料且選擇濾波器中之一或多者來應用。通常，預處理器142調節來源視訊資料以更有效率地呈現壓縮，或依據可能在編碼引擎143操作時招致之資料損失而保持影像品質。

編碼引擎143可根據多種不同編碼技術編碼輸入視訊資料以達成壓縮。編碼引擎143可藉由經運動補償預測來壓縮影像。可向輸入視訊之圖框指派編碼類型，諸如圖框內編碼(I編碼)、單向預測性編碼(P編碼)或雙向預測性編碼(B編碼)。可進一步將該等圖框剖析成複數個像素區塊，且可藉由變換編碼、量化及熵編碼來編碼該等圖框。編碼引擎143可協同截斷低能變換係數之控制器147而選擇量化參數。可預測性地編碼經P編碼圖框及經B編碼圖框之像素區塊，在此狀況下，編碼引擎可計算識別儲存於參考圖像快取記憶體145中之經解碼圖框之像素區塊的運動向量(該等運動向量充當正經編碼之像素區塊之預測)，且可在進行變換編碼之前產生預測殘餘。在一實施例中，視訊編碼器可根據由ITU H.263、H.264及其類似者定義之編碼協定來操作。

編碼引擎143進一步可指定某些經編碼圖框可用作參考圖框以用於在編碼稍後接收之輸入圖框中使用。解碼器144可解碼參考圖框之經編碼視訊資料且將自其恢復之視訊資料儲存於參考圖像快取記憶體145中。以此方式，視訊編碼器140具有如將在視訊解碼器150處解碼之參考圖框之經解碼複本。

如所註釋，物體偵測器146可偵測來源視訊圖框中之預定類型之物體的存在。通常，物體偵測器146可輸出表示來源視訊圖框內之經偵測物體之像素座標的資料。控制器147可使經偵測物體之座標與來源圖框之像素區塊相關且可自其界定預定數目個編碼區。控制器147可提供編碼參數以供編碼引擎143在編碼圖框之像素區塊時使用。大體而言，可設定編碼參數以提供最接近於經偵測物體之區中的像素區塊之高品質編碼，且提供遠離經偵測物體之像素區塊之相對較低品質編碼。

傳輸器170可將經編碼視訊資料傳輸至頻道131。在進行此操作中，傳輸器170可多工經編碼視訊資料與諸如經編碼音訊資料及控制資料(藉由在圖1中未說明之處理源提供)之待傳輸之其他資料。傳輸器170可執行頻道編碼操作(諸如，錯誤校正編碼、交錯、封包化及其類似者)，且可調變資料並將資料傳輸至網路130。

視訊解碼器150可包括解碼引擎152、參考圖像快取記憶體154、後處理器156及控制器158。解碼引擎152可參考儲存於參考圖像快取記憶體154中之參考圖像來解碼經由頻道131接收之經編碼視訊資料。解碼引擎152可將經解碼視訊資料輸出至後處理器156，後處理器156可對經解碼視訊資料執行額外操作以調節其以用於顯示。參考圖框之經解碼視訊資料亦可儲存至參考圖像快取記憶體154以供在隨後接收之經編碼視訊資料之解碼期間使用。

解碼引擎152可執行使由編碼引擎143執行之編碼操作反轉的解碼操作。解碼引擎152可執行熵解碼、解量化及變換解碼以產生經恢復之像素區塊資料。量化/解量化操作為有損程序，且因此經恢復之像素區塊資料可能將為由視訊編碼器140編碼之來源像素區塊的複製品但將包括某一錯誤。對於經預測性編碼之像素區塊，變換解碼可產生殘餘資料；解碼引擎152可使用與像素區塊(其在一些狀況下可為隱含的)相關聯之運動向量自參考圖像快取記憶體154擷取經預測像素區塊以與預測殘餘組合。可將經解碼像素區塊重新組譯為圖框且輸出至後處理器156。

在解碼引擎152解碼新參考圖框時，其可將經解碼參考圖框儲存於參考圖像快取記憶體154中以用於在解碼隨後接收之經編碼視訊資料中使用。

後處理器156可執行額外視訊處理以調節經恢復視訊資料以用於通常在顯示器件處呈現。典型後處理操作可包括應用解區塊濾波器、邊緣偵測濾波器、振鈴濾波器及其類似者。後處理器156可輸出經恢復視訊序列以用於在顯示器190上呈現或視情況將經恢復視訊序列儲存至記憶體以供稍後擷取及顯示。

圖1(b)中所說明之功能區塊僅支援一個方向上之視訊編碼及解碼。對於雙向通信，終端機120可包括用於視訊編碼本端俘獲之視訊的功能區塊(未圖示)，且終端機110可包括用於解碼經由網路130自終端機120接收之經編碼視訊資料的功能區塊(亦未圖示)。儘管預見到可在駐留於任一終端機110、120處之編碼器處應用本發明之原理，但僅為了簡化本發明而自圖1省略針對終端機120至終端機110編碼方向而提供之功能區塊。

圖2說明根據本發明之一實施例的可由視訊編碼器處理之視訊資料的例示性圖框。圖2說明已剖析成像素區塊陣列之圖框200。每一像素區塊可含有預定數目個像素，通常為正方形像素陣列(例如，8×8像素或16×16像素)或矩形像素陣列(例如，4×8像素、4×16像素、16×8像素等)。因此，圖框可含有像素區塊陣列。N×M像素區塊之例示性陣列說明於圖2中。

圖2亦說明如應用於圖框200之例示性物體偵測的操作。在此實例中，物體偵測為臉部偵測。臉部偵測演算法可識別影像資料內之人臉的存在，且產生識別圖框200內偵測到臉部之位置的一對座標(X1,Y1)、(X2,Y2)。該等座標可界定(例如)表示臉部之矩形的相對轉角。

圖3說明根據本發明之一實施例的編碼視訊資料之圖框之像素區塊的方法300。方法300可開始使用表示經偵測物體之位置的座標資料。方法300可識別對應於經偵測物體之位置的圖框之像素區塊(方框310)。方法300可對物體位置內之像素的資料進行取樣以判定物體之統計(方框320)。相關統計可包括色彩、明度/亮度、空間複雜度以及像素區塊內之像素值之方差及像素區塊之間的像素值之相對方差。此後，方法300可在鄰近於經偵測物體之像素區塊中搜尋統計類似於在經偵測物體之像素區塊內得到之統計的像素區塊。對於每一鄰近像素區塊，方法300可判定鄰近像素區塊是否具有類似於物體之統計的統計，且若鄰近像素區塊具有類似於物體之統計的統計，則該方法可將該鄰近像素區塊添加至物體區(方框330至340)。物體可遍及鄰近於經偵測物體之所有像素區塊而反覆，直至已將具有類似統計之所有相鄰像素區塊添加至物體區為止。

一旦界定物體區，方法300即可建置遠離物體區而延伸預定距離之複數個子區(方框350)。此後，方法300可根據運動補償預測編碼圖框之像素區塊。可選擇物體區及每一子區之編碼參數，以強調物體區內之高編碼品質及距物體區之距離逐漸加大之子區中的愈來愈低之等級之編碼品質(方框360)。

如上文所描述，可基於已包括於物體區中之像素區塊之統計與鄰近於物體區中之像素區塊中之一者的候選像素區塊之統計的比較而執行是否將像素區塊包括至物體區中之決策(方框330)。在一實施例中，該比較可涉及相似性臨限值--若候選像素區塊與物體區之像素區塊的統計之間的差小於相似性臨限值，則可准許該候選像素區塊進入物體區(方框340)。根據觀測到之統計，反覆操作可使物體區在不同方向上擴展。在一些情形下，給定像素區塊可能未能被准許進入物體區，但可由被准許進入物體區之像素區塊環繞(部分地或完全地)。在一實施例中，方法300可修正鄰近於物體區之多個像素區塊或或者完全由物體區之像素區塊環繞的像素區塊的相似性臨限值。在此等情形下，可降低臨限值。在實務應用中，當一像素區塊在所有側上由亦屬於一物體之像素區塊環繞時，該像素區塊之影像內容傾向於屬於該經偵測物體。降低此等像素區塊之相似性臨限值可促進准許環繞之像素區塊進入物體區，尤其在環繞之像素區塊之統計大體上與物體區之像素區塊之統計一致但並非足夠接近以通過預設相似性臨限值時如此。

圖4說明圖3之方法至圖2之例示性圖框的應用。在圖4(a)中，將區410中所展示之像素區塊指派給物體區，此係因為彼等像素區塊涵蓋藉由圖3中之物體辨識(方框310)輸出的矩形。此後，在方法300搜尋具有與區410內之像素區塊類似的統計之鄰近像素區塊時，方法300可將彼等像素區塊包括於區420中。出於編碼目的，可將區420視為物體區。

一旦識別物體區，方法即可界定其他區430至470以環繞物體區。在圖4(a)之實例中，可界定每一連續區以包括在任何方向上鄰近於先前區之像素區塊。因此，區430包括在任何方向上鄰近於區420之所有像素區塊，且區440包括鄰近於區430之所有像素區塊。此程序可繼續，直至圖框之所有像素區塊經指派給區為止。在此實例中，每一區有效地表示環繞前一區之一「暈圈」。

在將像素區塊指派給區之後，方法300(圖3)可將編碼參數調整指派給該等區。在圖4中所說明之實施例中，可將量化參數調整(△Q_p)應用於每一區之像素區塊。如所論述，量化參數截斷在像素區塊編碼期間獲得之變換係數，且對於低能係數，可將其完全刪除。量化可引起資料損失，此係因為無法在解碼器處之解量化期間完全恢復經截斷資料。因此，在解碼器處獲得之經恢復視訊可能為來源視訊之複製品，但可由於編碼而具有顯著影像假影。

根據本發明之實施例，可將量化參數調整指派給圖框之各種區以在物體區處提供較低量化參數且在遠離物體區之區處提供愈來愈高之量化參數。圖4(b)說明可指派給圖4(a)之列5中所展示之像素區塊的例示性量化參數調整。如圖4(b)中所說明，量化參數調整可自對應於區470之像素區塊位置處的最大值經區460至430之中間值而變化至對應於區420之像素區塊位置處的最小值。儘管圖4(b)說明量化參數調整之均勻步長，但圖4(c)說明量化參數調整以非均勻方式變化之另一實施例。

本發明之實施例適應界定編碼區之方式的變化。圖5說明僅界定兩個子區530、540以環繞物體區520的實施例。在此實施例中，第一子區530環繞物體區520，且圖框之所有其他像素區塊經指派給背景區540。此實例中之子區530在每個方向上自區520延伸達兩個像素區塊之距離。可針對物體區520將量化參數調整設定至最小等級，針對子區530將量化參數調整設定至中間等級，且針對背景子區540將量化參數調整設定至最大等級。

在圖6之實施例中，由每一子區消耗之區域可變化。舉例而言，子區630在每個方向上自物體區620延伸達單一像素區塊之距離，但子區640在每個方向上自子區630延伸達兩個像素區塊之距離。

圖3之方法在許多即時編碼環境(諸如，視訊編碼系統及其類似者)中為有效的，以準確地估計所要物體之位置。在許多此等應用中，物體偵測器146(圖1)之輸出與正由編碼引擎143編碼之圖框之間存在潛時。換言之，編碼引擎143可能正使用來自圖框X-偏移(Off)之位置資料編碼圖框X。圖3之方法減少否則可由於精細調整由物體偵測器146識別之物體矩形之位置而出現的可見假影。若臉部之部分係以高品質編碼但同一臉部之其他部分係以低品質編碼，則此等假影在臉部偵測系統之情境下將尤其成問題。

在本發明之其他實施例中，預處理操作可跨越圖框之不同空間區域根據其距經偵測物體之距離而變化。舉例而言，預處理器142(圖1)可將模糊濾波器應用於圖框，以減小遠離螢幕之區域處的清晰度。在此實施例中，預處理器142可基於距經偵測物體之距離而使模糊濾波器之強度變化。進行此操作可降低圖框之背景元素(不存在於經偵測物體之區中的彼等元素)之品質，但可提高壓縮效率，此係因為背景元素之較高頻率分量可能將得以減少。

在另一實施例中，預處理器142可基於圖框之經估計運動而使模糊濾波器之強度變化。可由預處理器142自視訊序列之分析來估計運動或或者可自提供於終端機110內之運動感測器(未圖示)來估計運動。模糊濾波器之強度可隨經估計運動增加而增加。

圖7說明根據本發明之另一實施例的視訊編碼器700。此處，將視訊編碼器說明為包括圖框緩衝器710、像素區塊編碼器720、解碼器730、參考圖像快取記憶體740、物體偵測器750及控制器760。圖框緩衝器710可儲存來源視訊之圖框，且可將像素區塊自其供應至像素區塊編碼器720。像素區塊編碼器720可根據下文所論述之經運動補償編碼技術來編碼像素區塊。自像素區塊編碼器720輸出之經編碼像素區塊資料可儲存於輸出緩衝器(未圖示)中，直至其已準備好經傳輸為止。解碼器730可解碼參考圖框之經編碼視訊資料且將藉此恢復之視訊資料儲存於參考圖像快取記憶體740中。物體偵測器750及控制器760可合作以辨識每一視訊圖框內之物體，且自其界定物體區及子區。

如所註釋，像素區塊編碼器720可根據經運動補償預測技術來編碼像素區塊，其中可基於圖框內(I區塊)或圖框間(P區塊或B區塊)而編碼輸入像素區塊。另外，可將給定像素區塊編碼為SKIP區塊，其中根本不編碼像素區塊之內容而是自某一先前經編碼/經解碼圖框之共同定位像素區塊複製像素區塊之內容。

像素區塊編碼器720可包括減法器721、變換單元722、量化器723、熵編碼器724、運動估計器725及控制器726。給定輸入像素區塊，運動估計器725可在經快取之參考圖像圖框中執行對充當該輸入像素區塊之預測參考的像素區塊之搜尋。若找到適當匹配，則像素區塊編碼器720可將來源像素區塊編碼為P區塊或B區塊。若未找到適當匹配，則像素區塊編碼器720可將來源像素區塊編碼為I區塊。在適當情形下，像素區塊編碼器720亦可以SKIP模式編碼像素區塊。一旦選擇編碼模式，運動估計器725(或在適當情形下，控制器726)即可產生表示應用於來源像素區塊之編碼模式的後設資料。在許多狀況下，對於經圖框間編碼區塊，運動估計器725可產生識別經選擇之參考像素區塊的運動向量。

為了預測性地編碼輸入像素區塊，參考圖像快取記憶體740可將經預測之像素區塊資料輸出至減法器721。減法器721可產生表示來源像素區塊與經預測像素區塊之間的差異之資料。減法器721可在逐像素基礎上操作，在像素區塊上之每一像素位置處產生殘餘。若將非預測性地編碼給定像素區塊，則不將經預測像素區塊提供至減法器721；減法器721可輸出與來源像素資料相同之像素殘餘。

變換單元722可(諸如)藉由離散餘弦變換(DCT)程序或小波變換將由減法器721輸出之像素區塊資料轉換成變換係數陣列。通常，自變換產生之變換係數的數目將與提供至變換單元722之像素的數目相同。因此，可將8×8、8×16或16×16像素資料區塊變換至8×8、8×16或16×16係數資料區塊。量化器單元723可藉由量化參數Qp量化區塊之每一變換係數(對每一變換係數進行除法運算)。熵編碼器724可藉由變動值(run-value)編碼、變動長度(run-length)編碼或其類似者來編碼經量化係數資料。可將來自熵編碼器724之資料作為像素區塊之經編碼視訊資料輸出至頻道。

像素區塊編碼器之控制器726可根據編碼原則來選擇用於像素區塊之編碼模式，編碼原則表示經編碼視訊資料之預期位元速率、預期編碼品質及對抗編碼錯誤之穩建性間的平衡。因此，甚至在可找到給定來源像素區塊之適當預測匹配時，控制器726仍可強制實行將像素區塊編碼為I區塊之模式選擇。儘管I區塊大體上消耗比P區塊或B區塊高之位元速率，但I區塊可減輕傳輸錯誤及其類似者。類似地，控制器726可選擇用於像素區塊之量化參數以滿足位元速率目標。

根據本發明之一實施例，控制器760可將可影響對用於給定來源像素區塊之編碼參數之選擇的編碼參數調整提供至像素區塊編碼器之控制器726。因此，在像素區塊編碼器720正對屬於物體區(即，圖4(a)之區420)之像素區塊操作時，控制器760可使像素區塊編碼器720將相對較低之量化參數用於圖框，且在像素區塊編碼器720正對屬於子區(圖4(a)之區430至470)之像素區塊操作時，控制器760可使像素區塊編碼器720使用適用於彼等區之量化參數。

在另一實施例中，控制器760可對子區中之某些子區強制實行編碼模式。使用圖5作為實例，控制器760可使像素區塊編碼器720以SKIP模式編碼區540之像素區塊，且分別對區520(最低Qp)及530(較高Qp)強制實行量化參數調整。

在其他實施例中，亦可基於經偵測物體之其他觀測到之特性而選擇編碼參數。舉例而言，在使用臉部偵測時，臉部偵測器可偵測臉部是否展現特定特性(例如，臉部正在眨眼抑或微笑，臉部旋轉多少度，為場景之百分比形式的臉部大小)。編碼器可基於此等特徵而選擇編碼參數。以實例說明，可能向旋轉之臉部指派較低優先權(相比往前看之臉部而言)，且因此，指派相對較低品質之編碼參數。又，物體偵測器可指示在視訊序列中識別之物體之數目(例如，臉部之數目)。在僅具有兩個臉部之場景中，例如，編碼器可向該等臉部指派較高優先權(相比具有五十個臉部之場景中之臉部而言)。再次，較高優先權指派可導致選擇產生相對較高品質編碼之編碼參數。

在其他實施例中，可向物體之特定子區指派不同品質之編碼等級。舉例而言，經偵測臉部之眼部及口部可由臉部偵測器來偵測，且經給定較高編碼優先權(相比臉部之其他經偵測元素而言)。在此實施例中，系統可產生一對物體區--對應於經偵測物體之高優先權元素的第一物體區(例如，由眼部及口部佔據之區)、對應於經偵測物體之其他元素的第二物體區(例如，臉部之剩餘部分)；及佔據圖框之剩餘部分的子區。

前文論述已在編碼器及解碼器之情境下描述了本發明之實施例的操作。通常，將視訊編碼器提供為電子器件。視訊編碼器可以諸如特殊應用積體電路、場可程式化閘陣列及/或數位信號處理器之積體電路體現。或者，視訊編碼器可以在個人電腦、筆記型電腦或平板電腦或電腦伺服器上執行之電腦程式體現。類似地，解碼器可以諸如特殊應用積體電路、場可程式化閘陣列及/或數位信號處理器之積體電路體現，或解碼器可以在個人電腦、筆記型電腦或電腦伺服器上執行之電腦程式體現。解碼器通常封裝於諸如遊戲系統、智慧型手機、DVD播放器、攜帶型媒體播放器及其類似者之消費型電子器件中，且解碼器亦可封裝於諸如視訊遊戲、基於瀏覽器之媒體播放器及其類似者之消費型軟體應用程式中。

本文中特定說明及/或描述了本發明之若干實施例。然而，將瞭解，在不脫離本發明之精神及預期範疇的情況下，本發明之修改及變化由上述教示涵蓋且在所附申請專利範圍之範圍內。