TWI511531B

TWI511531B - 影像編碼裝置、影像編碼方法及影像編碼程式

Info

Publication number: TWI511531B
Application number: TW101107425A
Authority: TW
Inventors: Naoki Ono; Atsushi Shimizu; Masaki Kitahara; Seisuke KYOCHI
Original assignee: Nippon Telegraph & Telephone
Priority date: 2011-03-09
Filing date: 2012-03-06
Publication date: 2015-12-01
Also published as: US9445089B2; EP2670143B1; CN103430546B; WO2012121234A1; EP2670143A1; RU2551473C2; CN103430546A; TW201244498A; EP2670143A4; RU2013140686A; KR101623064B1; CA2828695A1; ES2609303T3; JPWO2012121234A1; KR20130126698A; US20130336387A1; BR112013022577A2; JP5613319B2

Description

影像編碼裝置、影像編碼方法及影像編碼程式

本發明係關於使編碼器的畫質提升之影像編碼技術，尤其，關於一種影像編碼裝置、影像編碼方法及影像編碼程式，係抑止動作搜尋以及編碼模式(mode)選擇之演算量者。

本發明係依據2011年3月9日，於日本申請之日本國特願2011-051354號主張優先權，並在此引用該內容。

在以H.264/AVC(ISO/IEC 14496-10“MPEG-4 Part 10 Advanced Video Coding”)為代表之影像編碼中，因應屬於編碼對象的圖像的性質，而適切地切換使用利用空間方向的相關而關閉於訊框(frame)內的資訊來進行編碼之畫面內(intra)編碼、及利用時間方向的相關而使用訊框間的資訊來進行編碼之畫面間(inter)編碼，藉此圖謀壓縮效率之提升。於畫面間編碼中係使用有動作補償技術，並搜尋顯示成為編碼對象之區域係存在於稱為參照訊框之過去或未來的訊框的哪個位置，亦即，搜尋顯示在參照訊框及編碼對象訊框之間的動作程度之動作向量(vector)。此時，在參照訊框中，在離開該動作向量份之位置存在有相似之區域，且可期待與該區域之差分值非常的小。利用該者，可不對編碼對象區域的訊號本身，而對與參照訊框之差分訊號進行編碼，藉此提高編碼效率。

在求取動作向量之動作搜尋處理中，稱為區塊匹配 (block matching)之手法係廣為運用。就H.264/AVC而言，係使用將畫面予以分割之矩形區塊區域作為編碼單位。在以參照訊框之編碼對象區塊位置為中心之搜尋範圍中，係算出與編碼對象區塊的畫素值之差分絕對值和等評估值，並將與取得最小值之區塊圖形位置、及與編碼對象區塊位置之距離設為動作向量。在區塊匹配中，對於參照訊框的搜尋範圍內全部的區塊圖形，一面偏移1畫素一面算出評估值之所謂全搜尋之手法係為一般手法。

然而，區塊匹配所需之演算量與其他編碼處理相比係較為大量。尤其，在將區塊匹配適用於即時(real time)的播放實況(live)影像等編碼裝置時，係必須減少動作搜尋之演算量。動作搜尋之演算量係因應搜尋範圍的寬廣度而增加。然而，為了減低演算量而將搜尋範圍單純且一樣地予以窄化，則在存在有動作較大之區域時無法檢測適合的動作向量，而有編碼效率下降之問題。

再者，在H.264/AVC的畫面間編碼中，係許可有變更區塊大小(size)之複數個編碼模式。予以編碼之區塊的單位係稱為巨區塊(macro block)之16×16畫素之矩形區塊。巨區塊係被許可分割為下述之區塊。

(1)於16×16區塊使用一個動作向量。

(2)分割為二個16×8區塊而使用二個動作向量。

(3)分割為二個8×16區塊而使用二個動作向量。

(4)分割為四個8×8區塊，並對於各個8×8區塊許可下述之(4-1)至(4-4)之分割。

(4-1)於一個8×8區塊使用一個動作向量。

(4-2)分割為二個8×4區塊而使用二個動作向量。

(4-3)分割為二個4×8區塊而使用二個動作向量。

(4-4)分割為四個4×4區塊而使用四個動作向量。

為了實施最適當之編碼模式選擇，必須對於所許可之全部的區塊分割將動作向量予以檢測。再者，如前述，H.264/AVC除了畫面間編碼以外亦有畫面內編碼，為了決定使用哪個編碼係必須實施畫面內編碼算出編碼量，並與畫面間編碼之編碼量進行比較。該等模式選擇所需之負荷亦成為影像編碼之演算量增加之要因。

在以往，為了減輕動作搜尋之負荷，係進行按每個區域推測動作量，而藉由對於動作較小之區域適當的窄化搜尋範圍來刪減演算量。該方法係在例如TV會議等將攝影機(camera)予以固定之影像中，由於背景等靜止區域與動區域被明顯的區分開，故係為有效。就按每個區域推測動作量，並對搜尋範圍進行控制之先前技術而言，係有例如專利文獻1所述之技術。就專利文獻1而言，係依據編碼對象訊框及參照訊框之相關評估結果，而藉由縮小動作搜尋範圍來抑制動作搜尋的演算量。

然而，就專利文獻1而言，係有可能由於未考慮相對於動作向量之資訊量來限制搜尋範圍而導致畫質劣化。再者，由於未提及畫面間模式的選擇方法及關於畫面內/畫面間編碼的判定，故並未減輕實施編碼模式判定之演算負荷。

(先前技術文獻) (專利文獻)

專利文獻1：日本特開平8-32969號公報

刪減動作搜尋之演算量對於編碼裝置的高速化而言雖為必要，惟若將搜尋範圍一樣地予以窄化，則有編碼效率下降之問題。再者，如H.264/AVC之編碼模式較多之方式中，亦必須考慮刪減伴隨模式選擇之演算量。

就專利文獻1所述之技術而言，係依據編碼對象訊框及參照訊況之相關評估結果，而藉由針對相關較高之區域縮小動作搜尋範圍來抑制動作搜尋之演算量，惟在搜尋範圍之決定中並未考慮動作向量之資訊量。編碼對象係於編碼對象區塊的畫素值以外亦包含有動作向量。就H.264/AVC而言，係使用在編碼對象區塊的周圍區塊所算出之動作向量的中央值來算出稱為PMV之預測向量，並對在編碼對象區塊所檢測出之動作向量與PMV之差分值進行編碼。

在無關於PMV為較大之值而僅使用相關評估之結果將搜尋範圍窄化時，由於動作向量之資訊量變大而編碼效率下降。再者，由於未提及關於畫面間模式之選擇方法及畫面內/畫面間編碼之判定，故為了編碼模式判定係必須分別對編碼方式所許可之模式實施編碼，且伴隨於該編碼之演算負荷不會減輕。如上述，在先前技術上，係有動作向量的編碼量有可能增加、及伴隨編碼模式判定的演算量之減輕未能實現之問題。

本發明為有鑑於該等之情事所研創者，目的在於提供一種影像編碼裝置、影像編碼方法及影像編碼程式，係可比先前技術更能有效果地抑制伴隨於動作搜尋及編碼模式判定之影像編碼之演算量。

本發明係為對於輸入影像訊號使用畫面內編碼以及伴隨動作補償之畫面間編碼之影像編碼裝置，其特徵在於具備：判定部，係對於屬於編碼對象之輸入影像訊號判定靜止區域、伴隨著微小動作之區域、或伴隨著一般動作之區域；第一編碼部，對於由前述判定部所判定為靜止區域之區域進行動作向量(0，0)的畫面間編碼；第二編碼部，對於由前述判定部所判定為伴隨著微小動作的區域之區域，在所限制之搜尋範圍內，進行動作搜尋及畫面間編碼；以及第三編碼部，對於由前述判定部所判斷為伴隨著一般動作的區域之區域，以一般的搜尋範圍進行動作搜尋及畫面間編碼。

本發明之特徵在於，前述判定部係使用參照訊框與編碼對象訊框之類似度、及周圍區域之動作向量來進行前述區域判定。

本發明之特徵在於，對於判定為前述靜止區域之區域係限定畫面間編碼模式來進行編碼。

本發明之特徵在於，對於判定為前述伴隨著微小動作的區域之區域係限定畫面間編碼模式來進行編碼。

本發明之特徵在於，復具備決定部，係決定對於判定為前述靜止區域或前述伴隨微小動作的區域之區域是否實施畫面內編碼。

本發明係為對於輸入影像訊號使用畫面內編碼以及伴隨動作補償之畫面間編碼之影像編碼方法，其特徵在於包含：判定步驟(step)，係對於屬於編碼對象之輸入影像訊號判定靜止區域、伴隨著微小動作之區域、或伴隨著一般動作之區域；第一編碼步驟，對於由前述判定步驟所判定為靜止區域之區域進行動作向量(0，0)的畫面間編碼；第二編碼步驟，對於由前述判定步驟所判定為伴隨著微小動作的區域之區域在所限制之搜尋範圍內，進行動作搜尋及畫面間編碼；以及第三編碼步驟，對於由前述判定步驟所判斷為伴隨著一般動作的區域之區域，以一般的搜尋範圍進行動作搜尋及畫面間編碼。

本發明之特徵在於，前述判定步驟係使用參照訊框與編碼對象訊框之類似度、及周圍區域之動作向量來進行前述區域判定。

本發明之特徵在於，復具備決定步驟，係決定對於判定為前述靜止區域或前述伴隨微小動作的區域之區域是否實施畫面內編碼。

本發明係為使對於輸入影像訊號使用畫面內編碼以及伴隨動作補償之畫面間編碼之影像編碼裝置上的電腦執行影像編碼處理之影像編碼程式，該程式係使前述電腦執行下述步驟：判定步驟，係對於屬於編碼對象之輸入影像訊號判定靜止區域、伴隨著微小動作之區域、或伴隨著一般動作之區域；第一編碼步驟，對於由前述判定步驟所判定為靜止區域之區域進行動作向量(0，0)的畫面間編碼；第二編碼步驟，對於由前述判定步驟所判定為伴隨著微小動作的區域之區域在所限制之搜尋範圍內，進行動作搜尋及畫面間編碼；以及第三編碼步驟，對於由前述判定步驟所判斷為伴隨著一般動作的區域之區域，以一般的搜尋範圍進行動作搜尋及畫面間編碼。

依據本發明，藉由在區域判定上利用周圍向量之值，可得到能一面抑制動作向量編碼量的增加所導致之編碼效率下降，一面抑制伴隨著動作搜尋之演算量之功效。再者，亦可得到伴隨著編碼模式選擇之演算量亦能夠同樣的予以抑制之功效。

於下述係參照圖式說明本發明一實施形態之影像編碼方法、影像編碼裝置及影像編碼程式。第1圖係顯示該實施形態的構成方塊圖。在該圖中符號100係進行影像編碼之編碼部，編碼部100之編碼處理係除了與區域判定部102、動作向量記憶體103、及編碼模式決定部114之資訊的交換以外，與先前的MPEG-2 H.264之其他執行影像編碼之裝置相同。並且，在參照第1圖來說明編碼部100之構成時，關於編碼部100從以往以來所通常具有之習知功能/構成，係只要未與本發明的說明有直接關聯，則簡單地進行其說明。

儲存於訊框記憶體100之輸入影像訊號係輸入至預測殘差訊號產生部120，且在變更為屬於與由畫面內/畫面間模式決定部119所輸出的預測訊號之殘差之預測殘差訊號之後，輸入至正交變換部104，並輸出由正交變換而來之變換係數。變換係數係輸入至量子化部105，且於量子化部105中依據由編碼控制部109所設定之量子化步驟大小進行量子化。該經過量子化之變換係數係輸入至可變長編碼部106，並於可變長編碼部106中進行可變長編碼。由可變長編碼部106所輸出之編碼資料(data)係於多工化部107中進行多工化，並儲存於緩衝(buffer)部108。從緩衝部108係輸出作為編碼訊流(stream)。

編碼控制部109係依據儲存於緩衝部108之編碼資料量來對量子化部105之產生編碼量進行控制。

另一方面，經過量子化之變換係數係於逆量子化部110中進行逆量子化，且於逆正交變換部111中進行逆正交變換，藉此產生解碼預測殘差訊號。該解碼預測殘差訊號係藉由加算器121而與由畫面內或畫面間編碼而來之預測訊號加算，而產生解碼訊號。由於解碼訊號係用於作為接著之訊框的預測編碼之參照圖像，故儲存於局部解碼(local decode)圖像記憶體112。

再者，儲存於訊框記憶體101之輸入影像訊號係除了前述編碼處理以外亦輸入於區域判定部102，且區域判定部102係依據輸入影像及由動作向量記憶部103所輸入之周圍區域的動作向量資訊，來執行靜止區域、伴隨著微小動作之區域或伴隨著一般動作之區域的判定，並依據判定結果將選擇搜尋範圍及畫面間編碼模式之動作搜尋控制訊號輸入至動作搜尋部113。

動作搜尋部113係使用來自訊框記憶體101之輸入影像訊號及儲存於局部解碼圖像記憶體112之局部解碼圖像，且依照依據由區域判定部102所輸入之動作搜尋控制訊號所決定之搜尋範圍及編碼模式來實施動作搜尋處理。動作補償部115係依據檢測出之動作向量，而參照局部解碼圖像記憶體112來產生由畫面間編碼而來之預測訊號。畫面間模式決定部116係依據動作補償部115的處理結果來決定畫面間編碼模式。

雖除了畫面間編碼以外亦實施畫面內編碼，惟編碼模式決定部114係先行於此使用來自區域判定部102的區域判定結果及由動作搜尋所求得之差分絕對值和等評估值，來決定是否實施畫面內編碼。畫面內編碼部117係因應屬於編碼模式決定部114的處理結果之模式控制訊號來實施畫面內編碼，或不實施畫面內編碼。在實施畫面內編碼時，係使用由訊框記憶體101所輸入之輸入影像訊號來實施畫面內編碼，且畫面內模式決定部118係依據該結果決定畫面內編碼模式。

畫面內/畫面間模式決定部119係依據畫面內模式與畫面間模式的結果而決定使用哪個模式，並輸出所決定之模式的預測訊號。然而，於編碼模式決定部114中決定為不實施畫面內模式時，則依據來自編碼模式決定部114之控制訊號而必定選擇畫面間模式。

接著參照第2圖，針對動作搜尋的搜尋範圍及編碼模式決定的處理動作進行說明。第2圖係顯示動作搜尋的搜尋範圍及編碼模式決定的處理動作之流程圖(flowchart)。首先，計算參照訊框與編碼對象訊框的同位置之類似度△DC(步驟S1)。並且，雖類似度△DC一般係使用參照訊框及編碼對象訊框的畫素間之差分絕對值和，惟為了減少演算量係可將計算差分絕對值之對象畫素跳過1畫素或2畫素。接著判定△DC的值是否為0(步驟S2)，且在△DC=0時，則判斷為靜止區域且不實施動作搜尋而將動作向量決定為(0，0)，並固定為畫面間編碼模式(步驟S3)。靜止區域之情形時，由於即便將區塊大小予以分割，在全部的區塊動作向量皆成為(0，0)，故無變更編碼模式之意義，在H.264/AVC中使用動作向量數最少之區塊大小16×16係有效率。

另一方面，△DC比0更大時，係判定△DC是否比臨限值Th_DC更小(步驟S8)。該判定結果在△DC比臨限值Th_DC更小時，算出依據周圍向量的中央值所算出之｜PMV｜(步驟S9)，並判定｜PMV｜之值是否為0(步驟S10)。該判定之結果若｜PMV｜為0，則與△DC為0之情形相同，判斷為靜止區域且不實施動作搜尋而將動作向量決定為(0，0)，並固定為畫面間編碼模式(步驟S3)。

在｜PMV｜之值比0更大時，判定｜PMV｜是否比臨限值Th_PMV更小(步驟S11)。該判定之結果在｜PMV｜比臨限值Th_PMV更小時，判斷為具有微小動作之區域，並將搜尋範圍設定為較狹小來實施動作搜尋處理(步驟S12)。就所設定之搜尋範圍而言，係考量例如包含有與PMV相同動作向量之最小的搜尋範圍等。於第2圖中雖對於畫面間編碼模式未特別加以限制，惟在微小動作時由於可預測即便分割區塊大小，在各區塊所求得之動作向量亦幾乎不會有差別，故為了更加抑制演算量係固定為動作向量數最少之區塊大小16×16，且可不實施在其他畫面間編碼模式上之動作搜尋。

在實施步驟S3或步驟S12之後，係算出由動作搜尋所求得之評估值Cost(步驟S4)。一般而言，在區塊匹配手法中，評估值Cost係使用差分絕對值和。並且，係判定Cost是否比臨限值Th_Cost更小(步驟S5)，於更小時係藉由將編碼模式作為畫面間編碼模式固定而不實施畫面內編碼來刪減伴隨模式選擇之演算量(步驟S6)。在Cost不小於臨限值Th_Cost時，係實施畫面內編碼，並比較畫面內模式與畫面間模式之效率來進行模式判定(步驟S7)。再者，在△DC比臨限值Th_DC更大時，或｜PMV｜之值比Th_PMV更大時，則以一般的搜尋範圍進行動作搜尋，亦不限定編碼模式(步驟S13)。

如上述，對於編碼對象區域係使用與參照訊框之類似度及周圍向量之值，判定靜止區域、伴隨著微小動作之區域或伴隨著一般動作之區域，而對判定為靜止區域之區域係一面限制畫面間之編碼模式，一面不進行動作搜尋而將動作向量決定為(0，0)。再者，對判定為具有微小動作的區域之區域係限制搜尋範圍來進行動作搜尋。再者，針對該等區域，係藉由以動作搜尋所算出之評估值與臨限值之比較來決定是否實施畫面內編碼。對於判斷為伴隨著一般動作的區域之區域，則以一般的搜尋範圍進行動作搜尋。

藉由使用如此之手法，在靜止區域、伴隨著微小動作之區域、或伴隨著一般動作之區域之判定上，係除了與參照訊框之類似度以外亦利用周圍向量之值，藉此一面抑制動作向量的資訊量變大，一面對於靜止區域及伴隨著微小動作之區域，藉著限定為在狹小範圍之動作搜尋來抑制動作搜尋之演算量。再者，針對靜止區域，藉由抑制畫面間之編碼模式而抑制伴隨著畫面間模式選擇之演算量。再者，針對該等區域，係不實施畫面內編碼而僅以動作搜尋所算出之評估值與臨限值之比較來決定畫面內編碼之實施/不實施，藉此抑制伴隨著畫面內/畫面間模式選擇之演算量。

並且，亦可將用以實現第1圖之處理部的功能之程式紀錄於電腦(computer)可讀取之記錄媒體，並使電腦系統讀取並執行記錄於該記錄媒體之程式，藉此執行影像編碼處理。並且，在此所謂「電腦系統」係設為包含OS及周邊機器等硬體(hardware)。再者，「電腦可讀取之記錄媒體」係指軟式磁碟(flexible disk)、磁光碟(magneto-optical disk)、ROM、CD-ROM等可攜媒體、電腦系統所內藏之硬碟(hard disk)等記憶裝置。且所謂「電腦可讀取之記憶媒體」亦包含以經由網際網路(internet)等網路(network)或電話線路等通訊線路來傳送程式時之伺服器(server)、或成為用戶端(client)之電腦系統畫面內的揮發性記憶體(RAM)之方式，在一定時間內保持程式者。

再者，上述程式亦可從將該程式儲存於記憶裝置等之電腦系統中，經由傳送媒體或傳送媒體中之傳送波，而藉此傳送至其他電腦系統。在此，所謂傳送程式之「傳送媒體」係指具有以網際網路等網路(通訊網)、或電話線路等通訊線路(通訊線)之方式對資訊進行傳送之功能之媒體者。再者，上述程式係可為用以實現前述功能的一部分者。再者，亦可為將前述之功能藉由與已由電腦系統記錄之程式組合來實現者，亦即所謂差分檔案(file)(差分程式)。

可提供一種影像編碼裝置，係可有效的抑止伴隨著動作搜尋及編碼模式判定之演算量。

(產業上之可利用性)

在影像編碼處理中，可適用於必須抑制動作搜尋及編碼模式選擇的演算量之用途。

100‧‧‧編碼部

101‧‧‧訊框記憶體

102‧‧‧區域判定部

103‧‧‧動作向量記憶體

104‧‧‧正交變換部

105‧‧‧量子化部

106‧‧‧可變長編碼部

107‧‧‧多工化部

108‧‧‧緩衝部

109‧‧‧編碼控制部

110‧‧‧逆量子化部

111‧‧‧逆正交變換部

112‧‧‧局部解碼圖像記憶體

113‧‧‧動作搜尋部

114‧‧‧編碼模式決定部

115‧‧‧動作補償部

116‧‧‧畫面間模式決定部

117‧‧‧畫面內編碼部

118‧‧‧畫面內模式決定部

119‧‧‧畫面內/畫面間模式決定部

120‧‧‧預測殘差訊號產生部

121‧‧‧加算器

S1至S13‧‧‧步驟

第1圖係為顯示本發明第一實施形態的構成之方塊圖。

第2圖係為顯示本發明第一實施形態之動作搜尋的搜尋範圍及編碼模式決定的處理動作之流程圖。