TWI660623B - 運動向量之預測解碼方法、預測解碼裝置 - Google Patents

運動向量之預測解碼方法、預測解碼裝置 Download PDF

Info

Publication number
TWI660623B
TWI660623B TW107102973A TW107102973A TWI660623B TW I660623 B TWI660623 B TW I660623B TW 107102973 A TW107102973 A TW 107102973A TW 107102973 A TW107102973 A TW 107102973A TW I660623 B TWI660623 B TW I660623B
Authority
TW
Taiwan
Prior art keywords
motion vector
cell
vector candidate
prediction
predicted motion
Prior art date
Application number
TW107102973A
Other languages
English (en)
Other versions
TW201818725A (zh
Inventor
藤林曉
鈴木芳典
文仲丞
Original Assignee
日商Ntt都科摩股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日商Ntt都科摩股份有限公司 filed Critical 日商Ntt都科摩股份有限公司
Publication of TW201818725A publication Critical patent/TW201818725A/zh
Application granted granted Critical
Publication of TWI660623B publication Critical patent/TWI660623B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一實施形態的運動向量之預測編碼方法,係含有:(a)將編碼對象之畫格影像內的對象區格的運動向量予以求出之步驟;和(b)從對象區格之左相鄰領域中所屬之一個以上之區格的運動向量中,決定出一個第1預測運動向量候補之步驟;和(c)從對象區格之上相鄰領域中所屬之一個以上之區格的運動向量中,決定出一個第2預測運動向量候補之步驟;和(d)根據含有第1預測運動向量候補與第2預測運動向量候補之一個以上之預測運動向量候補與對象區格之運動向量的比較,選擇最佳預測運動向量,將用來特定已選擇之最佳預測運動向量所需的預測運動向量指示資訊予以輸出之步驟;和(e)將預測運動向量指示資訊予以編碼之步驟。

Description

運動向量之預測解碼方法、預測解碼裝置
本發明的實施形態,係有關於運動向量之預測編碼方法、預測編碼裝置、及預測編碼程式、以及運動向量之預測解碼方法、預測解碼裝置、及預測解碼程式。
於動態影像編碼及動態影像解碼中,會使用到運動補償預測技術。運動補償技術中,動態影像的處理對象之畫格會被分割成複數區格。這些複數區格係被依序選擇成為處理對象之區格(對象區格)。然後,會求出對象區格之運動向量。又,於運動補償預測技術中,對象區格之相鄰區格的運動向量而求出預測運動向量,將該當對象區格的運動向量,進行預測編碼或預測解碼。
圖1A及圖1B係為例示運動補償預測中所被使用的相鄰矩形區格的圖。在圖1A中,對象區格BT的形狀與相鄰區格BL,BA,BRA的形狀係為相同。左相鄰區格BL係含有相對於對象區格BT內之左上像素而存在於左側的相鄰像素,上相鄰區格BA係含有相對於對象區格BT內之左上像素而存在於上側的相鄰像素,右相鄰區格BRA 係含有相對於對象區格BT內之右上像素而存在於右上側的相鄰像素。於先前技術的H.264/AVC中,係使用具有左相鄰區格BL、上相鄰區格BA、及右相鄰區格BRA的運動向量之水平成分及垂直成分之中間值(median value)的預測運動向量。
另一方面,圖1B係例示了具有與對象區格BT形狀不同形狀的複數相鄰區格存在時的情形。圖1B的複數相鄰區格,係除了含有左相鄰區格BL、上相鄰區格BA、右相鄰區格BRA以外,還含有相鄰區格BL1,BL2,BA1,BA2,BD,BE。若依據專利文獻1所記載之技術,則複數相鄰區格是以預定之空間順序而被探索,將相對於對象區格之像素訊號具有最佳空間類似度的相鄰區格予以特定,所被特定之相鄰區格的運動向量係被當成預測運動向量而利用。在專利文獻1的技術中,作為空間類似度,係使用對象區格之像素訊號與相鄰區格之像素訊號的絕對值差分和(SAD)。
〔先前技術文獻〕 〔專利文獻〕
〔專利文獻1〕日本特表2010-515399號公報
上述專利文獻1的技術,係一面將複數相鄰區格以所 定順序進行探索,一面計算空間類似度,因此預測運動向量的決定會需要較多的演算。
因此,於本技術領域中,降低預測運動向量之決定時所需要的演算量,是個課題。
本發明的一側面,係有關於運動向量之預測編碼技術。
本發明之一側面所述之運動向量之預測編碼方法,係屬於將複數畫格影像之時間序列所構成之動態影像的運動補償預測中所使用的運動向量,進行預測編碼的方法,其特徵為,含有:(a)將上記動態影像之編碼對象之畫格影像內的對象區格的運動向量予以求出之步驟;和(b)從相對於上記對象區格而位於左方之左相鄰領域中所屬之一個以上之區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第1預測運動向量候補之步驟;和(c)從相對於上記對象區格而位於上方之上相鄰領域中所屬之一個以上之區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第2預測運動向量候補之步驟;和(d)根據含有上記第1預測運動向量候補與上記第2預測運動向量候補之一個以上之預測運動向量候補與上記對象區格之上記運動向量的比較,選擇最佳預測運動向量,將用來特定已選擇之最佳預測運動向量所需的預測運動向量指示資訊予以輸出之步驟;和(e) 將上記預測運動向量指示資訊予以編碼之步驟。
又,本發明之一側面所述之運動向量之預測編碼裝置,係屬於將複數畫格影像之時間序列所構成之動態影像的運動補償預測中所使用的運動向量,進行預測編碼的裝置,其特徵為,具備:運動偵測手段,係用以將上記動態影像之編碼對象之畫格影像內的對象區格的運動向量予以求出;和第1預測運動向量候補決定手段,係用以從相對於上記對象區格而位於左方之左相鄰領域中所屬之一個以上之區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第1預測運動向量候補;和第2預測運動向量候補決定手段,係用以從相對於上記對象區格而位於上方之上相鄰領域中所屬之一個以上之區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第2預測運動向量候補;和預測運動向量決定手段,係用以根據含有上記第1預測運動向量候補與上記第2預測運動向量候補之一個以上之預測運動向量候補與上記對象區格之上記運動向量的比較,選擇最佳預測運動向量,將用來特定已選擇之最佳預測運動向量所需的預測運動向量指示資訊予以輸出;和編碼手段,係用以將上記預測運動向量指示資訊予以編碼。
又,本發明之一側面所述之運動向量之預測編碼程式,係屬於令電腦動作成為,將複數畫格影像之時間序列所構成之動態影像的運動補償預測中所使用的運動向量,進行預測編碼的裝置,該程式的特徵為,用來令該電腦發 揮機能而成為:上述之運動偵測手段、第1預測運動向量候補決定手段、第2預測運動向量候補決定手段、預測運動向量決定手段、及編碼手段。
若依據上述的本發明之一側面所述之運動向量之預測編碼技術,則是在縮減了預測運動向量候補之後,基於對象區格之運動向量與預測運動向量候補的比較,來決定預測運動向量。因此,可削減預測運動向量之決定時所需要的演算量。
於一實施形態中,亦可為,對象區格之像素訊號的預測訊號,係藉由參照了參照畫格而被生成,該參照畫格係具有,被參照畫面清單識別編號及參照畫面編號所特定之畫格編號;從左相鄰領域之區格的運動向量中,決定出第1預測運動向量候補,該左相鄰領域係具有,與對象區格用之參照畫面清單識別編號及/或參照畫面編號一致的參照畫面清單識別編號及/或參照畫面編號;從上相鄰領域之區格的運動向量中,決定出第2預測運動向量候補,該上相鄰領域係具有,與對象區格用之參照畫面清單識別編號及/或參照畫面編號一致的參照畫面清單識別編號及/或參照畫面編號。
於一實施形態中,亦可為,預測運動向量指示資訊,係被編碼成相應於預測運動向量候補數目之位元數的編碼資料。例如,亦可為,預測運動向量指示資訊,係被編碼成相應於預測運動向量候補數目之最小位元數的編碼資料。若依據此形態,則可降低預測運動向量指示資訊的編 碼資料的代碼量。
於一實施形態中,亦可為,左相鄰領域係含有對象區格之左下的相鄰區格。該左下的相鄰區格,係為一區格,其中含有,相對於對象區格內之左下像素而存在於左下側之相鄰像素。此形態係不把左下之相鄰區格的運動向量視為獨立之預測運動向量候補,而是將左下之相鄰區格包含在左相鄰領域中,然後從該當左相鄰領域裡,決定出第1預測運動向量候補。藉此,就可降低預測運動向量候補的數目。其結果為,可降低預測運動向量指示資訊的編碼資料的代碼量。
於一實施形態中,亦可為,上相鄰領域係含有對象區格之右上的相鄰區格。該右上的相鄰區格,係為一區格,其中含有,相對於對象區格內之右上像素而存在於右上側之相鄰像素。此形態係不把右上之相鄰區格的運動向量視為獨立之預測運動向量候補,而是將右上之相鄰區格包含在上相鄰領域中,然後從該當上相鄰領域裡,決定出第2預測運動向量候補。藉此,就可降低預測運動向量候補的數目。其結果為,可降低預測運動向量指示資訊的編碼資料的代碼量。
於一實施形態中,亦可為,左相鄰領域或上相鄰領域之任一方,係含有對象區格之左上的相鄰區格。該左上的相鄰區格,係為一區格,其中含有,相對於對象區格內之左上像素而存在於左上側之相鄰像素。此形態係不把左上之相鄰區格的運動向量視為獨立之預測運動向量候補,而 是將左上之相鄰區格包含在左相鄰領域或上相鄰領域中,然後決定預測運動向量候補。藉此,就可降低預測運動向量候補的數目。其結果為,可降低預測運動向量指示資訊的編碼資料的代碼量。
於一實施形態中,亦可為,藉由將左相鄰領域內所含之一個以上之區格從下往上方進行掃描,以從該當一個以上之區格的運動向量中,將滿足所定之預測運動向量候補決定基準的運動向量,決定成為第1預測運動向量候補。又,亦可在偵測出滿足所定之預測運動向量候補決定基準的運動向量時,停止以後的左相鄰領域之掃描。若依據本案發明人對多數動態影像進行調查所發現的事實,左相鄰領域之區格當中具有與對象區格之運動向量之誤差較少之運動向量的區格,係有在左相鄰領域內存在於下側之傾向。因此,藉由以所述之掃描順序來掃描左相鄰區格,就可有效率地求出,與對象區格之運動向量之誤差較少的第1預測運動向量候補。
於一實施形態中,亦可為,藉由將上相鄰領域內所含之一個以上之區格從右往左方進行掃描,以從該當一個以上之區格的運動向量中,將滿足所定之預測運動向量候補決定基準的運動向量,決定成為第2預測運動向量候補。又,亦可在偵測出滿足所定之預測運動向量候補決定基準的運動向量時,停止以後的上相鄰領域之掃描。若依據本案發明人對多數動態影像進行調查所發現的事實,上相鄰領域之區格當中具有與對象區格之運動向量之誤差較少之 運動向量的區格,係有在上相鄰領域內存在於右側之傾向。因此,藉由以所述之掃描順序來掃描上相鄰領域,就可有效率地求出,與對象區格之運動向量之誤差較少的第2預測運動向量候補。
於一實施形態中,亦可為,將為了決定第1預測運動向量候補而將左相鄰領域內所含之一個以上之區格進行掃描之方向加以表示的第1掃描方向指示資訊,加以決定;將為了決定第2預測運動向量候補而將上相鄰領域內所含之一個以上之區格進行掃描之方向加以表示的第2掃描方向指示資訊,加以決定;然後還將第1掃描方向指示資訊及第2掃描方向指示資訊予以編碼。於此形態中,是在左相鄰領域內進行上下兩方向的掃描,選擇出滿足所定之預測運動向量候補決定基準的運動向量。在上下兩方向上所被選擇的運動向量當中,最佳之運動向量係被視為第1預測運動向量候補,表示該當第1預測運動向量候補所被探索到之掃描方向的資訊,係成為第1掃描方向指示資訊。又,於上相鄰領域內在左右兩方向進行掃描,將滿足所定之預測運動向量候補決定基準的運動向量,予以選擇。在左右兩方向上所被選擇的運動向量當中,最佳之運動向量係被視為第2預測運動向量候補,表示該當第2預測運動向量候補所被探索到之方向的資訊,係成為第2掃描方向指示資訊。若依據所述形態,則可決定出能夠更加提升編碼效率的第1預測運動向量候補及第2預測運動向量候補。
於一實施形態中,亦可為,一個以上之預測運動向量候補的數目,係為3以下。若依據此形態,則可更加降低預測運動向量指示資訊的編碼資料的代碼量。
於一實施形態中,亦可為,不將對象區格之運動向量與最佳預測運動向量之間的殘差訊號進行編碼,就將最佳預測運動向量當作對象區格之運動向量來使用。在所述形態中,由於運動向量的殘差訊號未被編碼,因此可更加提升編碼效率。
本發明的另一側面,係有關於運動向量之預測解碼技術。
本發明之一側面所述之運動向量之預測解碼方法,係屬於將複數畫格影像之時間序列所構成之動態影像予以復原的運動補償預測中所使用的運動向量之預測解碼方法,其特徵為,含有:(a)從相對解碼對象之畫格影像內之對象區格而位於左方之左相鄰領域中所屬之一個以上之區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第1預測運動向量候補之步驟;和(b)從相對於上記對象區格而位於上方之上相鄰領域中所屬之一個以上之區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第2預測運動向量候補之步驟;和(c)將編碼資料予以解碼,以復原出用來特定上記對象區格用之最佳預測運動向量所需的預測運動向量指示資訊之步驟;和(d)從至少含有上記第1預測運動向量候補與上記第2預測運動向量候補的一個以上之預測運動向 量候補中,選擇出被上記預測運動向量指示資訊所特定之最佳預測運動向量之步驟。
又,本發明之一側面所述之運動向量之預測解碼裝置,係屬於將複數畫格影像之時間序列所構成之動態影像予以復原的運動補償預測中所使用的運動向量,進行預測解碼的裝置,其特徵為,具備:第1預測運動向量候補決定手段,係用以從相對於解碼對象之畫格影像內之對象區格而位於左方之左相鄰領域中所屬之一個以上之區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第1預測運動向量候補;和第2預測運動向量候補決定手段,係用以從相對於上記對象區格而位於上方之上相鄰領域中所屬之一個以上之區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第2預測運動向量候補;和解碼手段,係用以將編碼資料予以解碼,以復原出用來特定上記對象區格用之最佳預測運動向量所需的預測運動向量指示資訊;和最佳預測向量決定手段,係用以從至少含有上記第1預測運動向量候補與上記第2預測運動向量候補的一個以上之預測運動向量候補中,選擇出被上記預測運動向量指示資訊所特定之最佳預測運動向量。
又,本發明之一側面所述之運動向量之預測解碼的程式,係屬於令電腦動作成為,將複數畫格影像之時間序列所構成之動態影像予以復原的運動補償預測中所使用的運動向量,進行預測解碼的裝置,該程式的特徵為,用來令 該當電腦發揮機能而成為:上述之第1預測運動向量候補決定手段、第2預測運動向量候補決定手段、解碼手段、及最佳預測向量決定手段。
若依據上述的本發明之一側面所述之運動向量之預測解碼技術,則是在縮減了預測運動向量候補之後,基於對象區格之運動向量與預測運動向量候補的比較,來決定預測運動向量。因此,可削減預測運動向量之決定時所需要的演算量。
於一實施形態中,亦可為,對象區格之影像訊號的預測訊號,係藉由參照了參照畫格而被生成,該參照畫格係具有,被參照畫面清單識別編號及參照畫面編號所特定之畫格編號;從左相鄰領域之區格的運動向量中,決定出第1預測運動向量候補,該左相鄰領域係具有,與對象區格用之參照畫面清單識別編號及/或參照畫面編號一致的參照畫面清單識別編號及/或參照畫面編號;從上相鄰領域之區格的運動向量中,決定出第2預測運動向量候補,該上相鄰領域係具有,與對象區格用之參照畫面清單識別編號及/或參照畫面編號一致的參照畫面清單識別編號及/或參照畫面編號。
於一實施形態中,亦可為,預測運動向量指示資訊的編碼資料之位元數,係為相應於預測運動向量候補數目的位元數。例如,亦可為,預測運動向量指示資訊的編碼資料之位元數,係為相應於預測運動向量候補數目的最小位元數。若依據此形態,則可降低預測運動向量指示資訊的 編碼資料的代碼量。
於一實施形態中,亦可為,左相鄰領域係含有對象區格之左下的相鄰區格。此形態係不把左下之相鄰區格的運動向量視為獨立之預測運動向量候補,而是將左下之相鄰區格包含在左相鄰領域中,然後從該當左相鄰領域裡,決定出第1預測運動向量候補。藉此,就可降低預測運動向量候補的數目。其結果為,可降低預測運動向量指示資訊的編碼資料的代碼量,可以削減從編碼資料復原出預測運動向量指示資訊的解碼處理的演算量。
於一實施形態中,亦可為,上相鄰領域係含有對象區格之右上的相鄰區格。此形態係不把右上之相鄰區格的運動向量視為獨立之預測運動向量候補,而是將右上之相鄰區格包含在上相鄰領域中,然後從該當上相鄰領域裡,決定出第2預測運動向量候補。藉此,就可降低預測運動向量候補的數目。其結果為,可降低預測運動向量指示資訊的編碼資料的代碼量,可以削減從編碼資料復原出預測運動向量指示資訊的解碼處理的演算量。
於一實施形態中,亦可為,左相鄰領域或上相鄰領域之任一方,係含有對象區格之左上的相鄰區格。此形態係不把左上之相鄰區格的運動向量視為獨立之預測運動向量候補,而是將左上之相鄰區格包含在左相鄰領域或上相鄰領域中,然後決定預測運動向量候補。藉此,就可降低預測運動向量候補的數目。其結果為,可降低預測運動向量指示資訊的編碼資料的代碼量,可以削減從編碼資料復原 出預測運動向量指示資訊的解碼處理的演算量。
於一實施形態中,亦可為,藉由將左相鄰領域內所含之一個以上之區格從下往上方進行掃描,以從該當一個以上之區格的運動向量中,將滿足所定之預測運動向量候補決定基準的運動向量,決定成為第1預測運動向量候補。又,亦可在偵測出滿足所定之預測運動向量候補決定基準的運動向量時,停止以後的左相鄰領域之掃描。藉由以所述之掃描順序來掃描左相鄰區格,就可有效率地求出,與對象區格之運動向量之誤差較少的第1預測運動向量候補。
於一實施形態中,亦可為,藉由將上相鄰領域內所含之一個以上之區格從右往左方進行掃描,以從該當一個以上之區格的運動向量中,將滿足所定之預測運動向量候補決定基準的運動向量,決定成為第2預測運動向量候補。又,亦可在偵測出滿足所定之預測運動向量候補決定基準的運動向量時,停止以後的上相鄰領域之掃描。藉由以所述之掃描順序來掃描上相鄰區格,就可有效率地求出,與對象區格之運動向量之誤差較少的第2預測運動向量候補。
於一實施形態中,亦可為,將編碼資料予以解碼,復原出將左相鄰領域內所含之一個以上之區格進行掃描之方向予以特定所需的第1掃描方向指示資訊、及將上相鄰領域內所含之一個以上之區格進行掃描之方向予以特定所需的第2掃描方向指示資訊,在第1掃描方向指示資訊所特 定的方向上,掃描左相鄰領域中所含之一個以上之區格,決定第1預測運動向量候補,在第2掃描方向指示資訊所特定的方向上,掃描上相鄰領域中所含之一個以上之區格,決定第2預測運動向量候補。若依據所述形態,則可決定出對對象區格之運動向量之誤差較少的第1預測運動向量候補及第2預測運動向量候補。
於一實施形態中,亦可為,一個以上之預測運動向量候補的數目,係為3以下。若依據此形態,則可更加降低預測運動向量指示資訊的代碼量。
於一實施形態中,亦可為,將最佳預測運動向量當作對象區格之運動向量來使用。在所述形態中,由於運動向量的殘差訊號未被編碼,因此可降低編碼資料的資料量。
如以上說明,若依據本發明的各種側面及實施形態,則可提供一種,可以降低預測運動向量之決定時所需要的演算量的運動向量之預測編碼方法、預測編碼裝置、及預測編碼程式、以及運動向量之預測解碼方法、預測解碼裝置、及預測解碼程式。
20‧‧‧動態影像編碼裝置
30‧‧‧動態影像解碼裝置
201‧‧‧輸入器
202‧‧‧運動偵測器
203‧‧‧預測運動向量候補決定器
204‧‧‧預測運動向量決定器
205‧‧‧運動向量差分器
206‧‧‧運動補償器
207‧‧‧記憶體
208‧‧‧空間預測器
209‧‧‧預測方法決定器
210‧‧‧減算器
211‧‧‧轉換器
212‧‧‧量化器
213‧‧‧熵編碼器
214‧‧‧逆量化器
215‧‧‧逆轉換器
216‧‧‧加算器
301‧‧‧熵解碼器
302‧‧‧預測運動向量候補決定器
303‧‧‧預測運動向量決定器
304‧‧‧運動向量加算器
305‧‧‧運動補償器
306‧‧‧記憶體
307‧‧‧空間預測器
308‧‧‧預測方法決定器
309‧‧‧逆量化器
310‧‧‧逆正交轉換器
311‧‧‧加算器
〔圖1A〕例示運動補償預測中所被使用的相鄰矩形區格的圖。
〔圖1B〕例示運動補償預測中所被使用的相鄰矩形 區格的圖。
〔圖2〕一實施形態所述之動態影像編碼裝置之構成的圖示。
〔圖3〕運動向量之預測編碼方法的一實施形態的流程圖。
〔圖4〕例示運動補償預測中所被使用的相鄰矩形區格的圖。
〔圖5〕圖3的步驟S302之處理的第1實施形態詳細表示之流程圖。
〔圖6〕圖3的步驟S303之處理的第1實施形態詳細表示之流程圖。
〔圖7〕一實施形態所述之動態影像解碼裝置之構成的圖示。
〔圖8〕運動向量之預測解碼方法的一實施形態的流程圖。
〔圖9〕第2實施形態之運動向量之預測編碼方法中的預測運動向量候補之決定處理的流程圖。
〔圖10〕第2實施形態之運動向量之預測解碼方法的流程圖。
〔圖11〕一實施形態所述之動態影像編碼程式之構成的圖示。
〔圖12〕一實施形態所述之動態影像解碼程式之構成的圖示。
〔圖13〕一實施形態所述之電腦的硬體構成之圖 示。
〔圖14〕一實施形態所述之電腦的斜視圖。
以下,參照圖面而詳細說明各種實施形態。此外,對於各圖面中同一或相當之部分係標示同一符號。
圖2係一實施形態所述之動態影像編碼裝置之構成的圖示。圖2所示的動態影像編碼裝置20,係為本發明之一側面所述之將運動向量進行預測編碼之裝置的一例。
被輸入至動態影像編碼裝置20的動態影像,係由畫格影像的時間序列所構成。以下,將編碼處理對象的畫格影像訊號,稱作「目前畫格」。在動態影像編碼裝置20中,目前畫格係被分割成可變尺寸之矩形的區格,以區格單位,進行以下說明的處理。
動態影像編碼裝置20,作為預測模式,是可將畫面間預測模式與複數畫面內預測模式,對每一區格進行切換而使用。例如,在動態影像編碼裝置20中,對每一區格,在畫面間預測模式及複數畫面內預測模式當中,選擇出編碼效率最佳的預測模式。此處,所謂「畫面間預測模式」,係參照在時間上與畫格影像訊號不同之複數已編碼畫格影像訊號(參照畫格影像訊號)來偵測出運動向量,以進行運動補償畫格間預測的模式。又,所謂「畫面內預測模式」,係使用同一空間上已經編碼的亦即近旁領域的像素值來進行空間預測的模式。此外,於「畫面間預測模 式」中,係可對例如N×N像素之區格再分割成任意尺寸(例如N/2像素×N掃描線或N/4像素×N/4掃描線)之每一小區格,進行運動偵測、運動預測、及運動補償之各處理。
如圖2所示,動態影像編碼裝置20係可具備:輸入器201、運動偵測器202、預測運動向量候補決定器203、預測運動向量決定器204、運動向量差分器205、運動補償器206、記憶體207、空間預測器208、預測方法決定器209、減算器210、轉換器211、量化器212、熵編碼器213、逆量化器214、逆轉換器215、及、加算器216。
輸入器201,係將從外部輸入之動態影像訊號方式的輸入映像訊號予以收訊,將該當動態影像訊號,分解成畫格影像訊號。輸入器201,係將畫格影像訊號,透過訊號線L201a及L201b,輸出至減算器210及運動偵測器202。
記憶體207,係將過去已編碼之畫格影像訊號及其預測時所使用過的資訊(運動向量、參照畫面清單識別編號、參照畫面編號)等,加以記憶的部分。
運動偵測器202,係進行運動向量之偵測。更具體而言,運動偵測器202係使用經由線L207a而從記憶體207所輸入之參照畫格影像訊號,而在該當參照畫格內的所定之探索範圍內,探索出與經由線L201a所輸入之目前畫格內的對象區格的影像訊號模態類似的影像訊號模態。運動 偵測器202係將對象區格與已探索之影像訊號模態之間的空間性位移量亦即運動向量、以及用來特定已利用過之參照畫格之畫格編號所需的參照畫面清單識別編號及參照畫面編號,予以偵測出來。已被測出之運動向量、參照畫面清單識別編號、及參照畫面編號,係經由線L202a而向運動補償器206、或經由線L202c而向運動向量差分器205輸出。又,運動偵測器202,係將已測出之參照畫面清單識別編號及參照畫面編號,經由線L202b,輸出至預測運動向量候補決定器203。此外,在動態影像編碼裝置20中,可將用來特定參照畫格影像訊號的畫格編號,以清單形式加以管理。為了特定出畫格編號,會使用到用來特定清單所需之參照畫面清單識別編號(Reference Picutre List)、及作為清單內的畫格編號之索引的參照畫面編號(Reference Index)。所述之技術,係在H.264/AVC等中為公知的技術。
預測運動向量候補決定器203,係使用經由線L207b所輸入之已編碼之複數相鄰區格的運動向量,來決定預測運動向量候補。關於該預測運動向量候補之決定的細節,將於後述。預測運動向量候補決定器203,係將已決定之預測運動向量候補,經由線L203而輸出至預測運動向量決定器204。
預測運動向量決定器204,係從經由線L203所輸入之預測運動向量候補中,決定出最佳預測運動向量(預測運動向量值)。更具體而言,預測運動向量決定器204, 係在預測運動向量候補當中,將對於經由線L202c所輸入之對象區格之運動向量的差分呈最小的預測運動向量候補,決定成為最佳預測運動向量PMVopt。已被決定之最佳預測運動向量PMVopt係經由線L204a而被送往運動向量差分器205。又,預測運動向量候補的數目,及從預測運動向量候補特定出最佳預測運動向量PMVopt所需的預測運動向量指示資訊,係經由線L204b而被送往熵編碼器213。
此外,在本實施形態中,雖然對於對象區格之運動向量之差分呈最小的預測運動向量候補,是被選擇成為最佳預測運動向量PMVopt,但預測運動向量決定器204係亦可將對所被算出之運動向量差分所分配之代碼量呈最小的預測運動向量候補,選擇成為最佳預測運動向量PMVopt。
又,在本實施形態中,雖然是在對象區格之運動偵測之後才決定最佳預測運動向量,但亦可在運動偵測前就測出最佳預測運動向量。具體而言,亦可如下式所示,使用實際算出之各預測運動向量候補來進行運動補償之際的預測影像訊號與對象影像訊號的絕對值差分和(SADpmv)、及將該預測運動向量候補進行編碼時的代碼量Rpmv與對代碼量之加權λ,基於使用上述的成本函數,來算出最佳預測運動向量。此時,只要對圖2的預測運動向量決定器204從線L201a輸入著對象區格的影像訊號,從訊號線L207a輸入著參照畫格影像訊號即可。
[數1]Cost pmv =SAD pmv +λR pmv
運動向量差分器205,係將經由線L202c所輸入之運動向量與經由線L204a所輸入之最佳預測運動向量的差分資訊亦即運動向量差分值,予以算出。運動向量差分器205,係將含有所算出之運動向量差分值與參照畫面清單識別編號及參照畫面編號的訊號,當作預測資訊而經由線L205a送往熵編碼器213。又,運動向量差分器205係經由線L205b而將含有運動向量與參照畫面清單識別編號及參照畫面編號的訊號,發送至記憶體207。
運動補償器206,係參照從運動偵測器202所收取到的參照畫面清單識別編號及參照畫面編號所特定之畫格編號的參照畫格影像訊號,使用從運動偵測器202所收取到的運動向量,生成對象區格的預測影像訊號。該預測影像訊號,係被輸出至預測方法決定器209。
空間預測器208,係參照經由線L207a所輸入之已編碼之附近領域的影像訊號(參照畫格影像訊號),生成預測影像訊號。空間預測器208,係將已生成之預測影像訊號,輸出至預測方法決定器209。
預測方法決定器209,係將從運動補償器206及空間預測器208所接收到的預測影像訊號進行比較,選擇其中任一方之預測影像訊號,將已選擇之預測影像訊號,輸出至減算器210。又,預測方法決定器209,係將表示生成所選擇之預測影像訊號之預測方法的預測模式資訊,經由 線L209b而輸出至熵編碼器213。
減算器210,係生成經由線L201b所輸入之畫格影像訊號和經由線L209a所輸入之預測影像訊號的差分值(預測殘差訊號),將該當預測殘差訊號,輸出至轉換器211。
轉換器211,係將經由線L210所輸入之預測殘差訊號,進行正交轉換,以生成正交轉換係數,將該當正交轉換係數,輸出至量化器212。量化器212係藉由將經由線L211所輸入之正交轉換係數進行量化,以生成量化正交轉換係數,將量化正交轉換係數送往熵編碼器213及逆量化器212。
熵編碼器213,係對經由線L212所輸入之量化正交轉換係數、從預測方法決定器209所收到之預測模式資訊、從運動向量差分器205所發送之預測資訊、從預測運動向量決定器204所輸出之預測運動向量指示資訊,係進行熵編碼,將所生成之編碼資料多工化成壓縮串流,將該當壓縮串流傳輸至外部。
逆量化器214,係將經由線L212所輸入之量化正交轉換係數進行逆量化,以生成正交轉換係數,將該當正交轉換係數送往逆正交轉換器215。然後,逆正交轉換器215,係藉由對經由線L214所輸入之正交轉換係數適用逆正交轉換,以生成預測殘差訊號,將該當預測殘差訊號送往加算器216。
加算器216係將經由線L215所輸入之預測殘差訊號 與經由線L209a所輸入之預測影像訊號進行加算而生成畫格影像訊號,將該當畫格影像訊號送往記憶體207。該畫格影像訊號,係被儲存在記憶體207中,在以後的編碼處理中,被當成參照畫格影像訊號來使用。又,在記憶體207中,經由線L205b所輸入之運動向量或參照畫面清單識別編號及參照畫面編號等,也是被建立關連至參照畫格影像訊號而被儲存。
以下,說明動態影像編碼裝置20上所能使用之運動向量之預測編碼方法的一實施形態。
首先,參照圖1B,說明對象區格所相鄰之區格。區格BL,BL1,BL2,係為銜接對象區格BT之左邊界的區格。區格BD,係為一區格,含有相對於對象區格BT內之左下像素而存在於左下方的相鄰像素。又,區格BE,係為一區格,含有相對於對象區格BT內之左上像素而存在於左上方的相鄰像素。區格BA,BA1,BA2,係為銜接對象區格BT之上邊界的區格。區格BRA,係為一區格,含有相對於對象區格BT內之右上像素而存在於右上方的相鄰像素。此外,相鄰於對象區格之區格,係如圖1A所示,亦可為和對象區格BT相同尺寸的區格。
接著,參照圖3。圖3係運動向量之預測編碼方法的一實施形態的流程圖。如圖3所示,於一實施形態的運動向量之預測編碼方法中,首先,對預測運動向量候補決定器203,輸入參照畫面清單識別編號及參照畫面編號(步驟S301)。
接著,預測運動向量候補決定器203,係從對象區格BT之左相鄰領域中所含之一個以上之區格的運動向量中,決定出預測運動向量候補PMV1(步驟S302)。關於預測運動向量候補PMV1的決定方法之細節,將於後述。
接著,預測運動向量候補決定器203,係從對象區格BT之上相鄰領域中所含之一個以上之區格的運動向量中,決定出預測運動向量候補PMV2(步驟S303)。關於預測運動向量候補PMV2的決定方法之細節,將於後述。
接下來,預測運動向量候補決定器203係決定預測運動向量候補PMV3(步驟S304)。在本實施形態中,參照畫格內之區格且與對象區格在空間上相同位置之區格的運動向量,是被決定成為預測運動向量候補PMV3。
此外,作為預測運動向量候補PMV3,係亦可不是使用參照畫格內與對象區格相同位置之區格的運動向量,而是改用其他空間上相鄰之區格的運動向量。又,根據預測運動向量候補PMV1與預測運動向量候補PMV2所計算的平均值等,亦可被當成預測運動向量候補PMV3來使用。
又,預測運動向量候補的數目,係亦可為3以上。此時,亦可從左相鄰領域及上相鄰區格分別以不同的方法來決定複數預測運動向量候補。更具體而言,亦可在左相鄰領域及上相鄰區格之各者中,藉由朝複數不同掃描方向來探索各領域內之區格,以決定複數預測運動向量候補。又,其他相鄰領域之運動向量,亦可被當成預測運動向量候補來使用。
回到圖3,接著,預測運動向量候補決定器203,係在預測運動向量候補PMV1、預測運動向量候補PMV2、及預測運動向量候補PMV3當中,僅將非同一之預測運動向量候補,決定成為最終的預測運動向量候補(步驟S305)。若揭示具體例,則預測運動向量候補PMV1與預測運動向量候補PMV3為相同時,作為預測運動向量候補係僅選擇PMV1與PMV2。又,從步驟S302至S304中滿足條件之預測運動向量候補位並未被決定時,則零運動向量就會成為預測運動向量候補。
接著,預測運動向量決定器204係從藉由預測運動向量候補決定器203所決定之預測運動向量候補中,如上述般地決定出最佳預測運動向量(步驟S306)。
接著,編碼器213係將用來特定最佳預測運動向量是在預測運動向量候補當中之何者所需的預測運動向量指示資訊,予以編碼(步驟S307)。
於一實施形態中,亦可為,預測運動向量指示資訊,係可被編碼成,相應於預測運動向量決定器204所選擇之預測運動向量候補之數目的位元數的編碼資料。例如,預測運動向量候補的數目是0或1時,預測運動向量指示資訊係不被編碼且不被傳輸。又,預測運動向量候補的數目是2或3時,預測運動向量指示資訊被編碼成最大2位元。
此外,亦可基於與預測運動向量候補的數目無關的固定之編碼表來將預測運動向量指示資訊予以編碼。此時, 係可使用以下的編碼表,來將預測運動向量指示資訊予以編碼。
於一實施形態中,亦可為,預測運動向量候補PMV1、預測運動向量候補PMV2、預測運動向量候補PMV3的決定順序是可變更。例如,將對象區格分割成複數小區格而對每一小區格進行編碼處理之際,可以利用此形態。具體而言,把對象區格做上下2分割時的下側小區格及對象區格做左右2分割時的左側小區格視為對象區格的情況下,係可按照左相鄰領域、上相鄰領域、其他領域(例如與對象區格同位置的參照畫格內之區格)的順序,來決定預測運動向量候補。另一方面,把對象區格做上下2分割時的上側小區格及對象區格做左右2分割時的右側小區格視為對象區格的情況下,對這些對象區格,係可按照上相鄰領域、左相鄰領域、其他領域(例如與對象區格同位置的參照畫格內之區格)的順序,來決定預測運動向量候補。
以下詳細說明,關於一實施形態所述之預測運動向量 候補之決定處理的第1實施形態。首先,參照圖1B、圖4、及圖5,說明圖3的步驟S302之處理的第1實施形態。如圖1B所示,此處係假設,相對於對象區格而位於左下之相鄰區格BD及相對於對象區格而相鄰於左方之區格BL,BL1,BL2是構成了左相鄰領域。又,假設是以圖4的(a)所示之索引i由小而大之順序,來掃描左相鄰領域內的區格。亦即,假設左相鄰領域內之區格是由下往上的順序而被掃描。
此外,左下之相鄰區格BD,係亦可不被包含在左相鄰領域中。又,亦可把比左下相鄰區格BD更為下方的區格,也包含在左相鄰領域中。甚至,亦可把區格BE或比區格BE位於更上方之區格,包含在左相鄰領域中。甚至,亦可把位於對象區格的左方並且與該當對象區格遠離一定距離之區格,也包含在左相鄰領域中。
回到圖4的(a)及圖5,在步驟S302之處理中,首先,預測運動向量候補決定器203,係將索引i設定成0(步驟S501)。預測運動向量候補決定器203,係於後續之步驟S502,將索引i增加1。
接著,預測運動向量候補決定器203係判定,在掃描順序上的第i個區格是否存在於左相鄰區格,且,該當區格是否帶有運動向量(步驟S503)。若第i個區格存在於左相鄰領域,且該當區格帶有運動向量時,則於後續的步驟S504中,預測運動向量候補決定器203,係判定第i個區格與對象區格是否帶有相同的參照畫面清單識別編號及 參照畫面編號。若滿足步驟S504之判定條件時,則於後續的步驟S505中,預測運動向量候補決定器203係將第i個區格的運動向量,決定成為預測運動向量候補PMV1,於後續的步驟S506中,將預測運動向量候補PMV1予以輸出,結束處理。
另一方面,若不滿足步驟S503之判定條件時,或不滿足步驟S504之判定條件時,則處理係前進至步驟S507。於步驟S507中,預測運動向量候補決定器203係判定索引i是否超過了左相鄰領域之區格的個數N。若不滿足步驟S507之判定條件時,則預測運動向量候補決定器203係繼續進行步驟S502之後的處理。另一方面,若滿足步驟S507之判定條件時,則預測運動向量候補決定器203係結束處理。
此外,在圖4的(a)所示的形態中,雖然左相鄰領域之區格是從下起依序被掃描,但於一實施形態中,亦可如圖4的(c)所示,是從上起依序被掃描。
又,於一實施形態中,亦可適應性地選擇圖4的(a)所示之掃描順序與圖4的(c)所示之掃描順序。例如,亦可基於相鄰區格的運動向量之關係,來決定掃描順序。具體而言,將圖1B的區格BL之運動向量與區格BA之運動向量的絕對值差分α、與區格BRA之運動向量與區格BD之運動向量的絕對值差分β,進行比較,當絕對值差分α小於絕對值差分β時,則選擇圖4的(c)的掃描順序。另一方面,若相反時,則選擇圖4的(a)的掃 描順序。
又,於一實施形態中,亦可在步驟S502中,將索引i增加2以上之數值,來將掃描之區格做抽略。
以下,參照圖1B、圖4、及圖6,詳細說明圖3的步驟S303之處理的第1實施形態。如圖1B所示,此處係假設,相對於對象區格而位於左上之相鄰區格BE及相對於對象區格而相鄰於上方之區格BA,BA1,BA2是構成了上相鄰領域。又,假設是以圖4的(a)所示之索引j由小而大之順序,來掃描上相鄰領域內的區格。亦即,假設上相鄰領域內之區格是由右往左的順序而被掃描。
此外,左上之相鄰區格BE,係亦可不被包含在上相鄰領域中。又,亦可把比左上相鄰區格BE更為左方的區格,也包含在上相鄰領域中。甚至,亦可把位於對象區格的上方並且與該當對象區格遠離一定距離之區格,也包含在上相鄰領域中。
回到圖4的(a)及圖6,在步驟S303之處理中,首先,預測運動向量候補決定器203,係將索引j設定成0(步驟S601)。預測運動向量候補決定器203,係於後續之步驟S602,將索引j增加1。
接著,預測運動向量候補決定器203係判定,在掃描順序上的第j個區格是否存在於上相鄰領域,且,該當區格是否帶有運動向量(步驟S603)。若第j個區格存在於上相鄰領域,且該當區格帶有運動向量時,則於後續的步驟S604中,預測運動向量候補決定器203,係判定第j個 區格與對象區格是否帶有相同的參照畫面清單識別編號及參照畫面編號。若滿足步驟S604之判定條件時,則於後續的步驟S605中,預測運動向量候補決定器203係判定第j個區格的運動向量是否與預測運動向量候補PMV1相同。若第j個區格的運動向量是與預測運動向量候補PMV1不同,則於後續的步驟S606中,預測運動向量候補決定器203係將第j個區格的運動向量,決定成為預測運動向量候補PMV2,於後續的步驟S607中,將預測運動向量候補PMV2予以輸出,結束處理。
另一方面,若不滿足步驟S603之判定條件時,若不滿足步驟S604之判定條件時,或若滿足步驟S605之判定條件時,則處理係前進至步驟S608。
於步驟S608中,預測運動向量候補決定器203係判定索引j是否超過了上相鄰領域之區格的個數M。若不滿足步驟S608之判定條件時,則預測運動向量候補決定器203係繼續進行步驟S602之後的處理。另一方面,若滿足步驟S608之判定條件時,則預測運動向量候補決定器203係結束處理。
此外,在圖4的(a)所示的形態中,雖然上相鄰領域之區格是從右起依序被掃描,但於一實施形態中,亦可如圖4的(c)所示,是從左起依序被掃描。
又,於一實施形態中,亦可適應性地選擇圖4的(a)所示之掃描順序與圖4的(c)所示之掃描順序。例如,亦可基於相鄰區格的運動向量之關係,來決定掃描順 序。具體而言,將圖1B的區格BL之運動向量與區格BA之運動向量的絕對值差分α、與區格BRA之運動向量與區格BD之運動向量的絕對值差分β,進行比較,當絕對值差分α小於絕對值差分β時,則選擇圖4的(c)的掃描順序。另一方面,若相反時,則選擇圖4的(a)的掃描順序。
又,在上述的實施形態中,雖然將區格BE包含在上相鄰領域中,但亦可將區格BE包含在左相鄰領域中。又,亦可將區格BE視為與上相鄰領域及左相鄰領域獨立之領域,將區格BE之運動向量視為個別的預測運動向量候補來看待。
又,在上述的實施形態中,雖然在把相鄰領域之區格的運動向量選擇成為預測運動向量候補所需的判定條件裡,使用了參照畫面清單識別編號及參照畫面編號之雙方,但並非限定於此。例如,該當判定條件中,亦可使用參照畫面清單識別編號及參照畫面編號之一方。又,在未使用參照畫面編號的情況下,係亦可隨著參照畫格與對象畫格間的距離,進行相鄰領域之區格之運動向量的比例換算。又,亦可使用其他畫面內預測的資訊。具體而言,對象區格的大小與相鄰區格的大小,係亦可作為上述判定條件之1。具體而言,若對象區格之尺寸為N×N像素時,亦可把相鄰領域內的區格之尺寸是N×N像素這件事當作判定條件,或可把是否為N/2×N/2像素至2N×2N像素之尺寸的區格當作判定條件。
又,在上述的實施形態中,是在左相鄰領域之預測運動向量候補PMV1被算出後,才進行上相鄰領域之預測運動向量候補PMV2的算出,但並非限定於此。亦可早於左相鄰領域的預測運動向量候補PMV1的決定之前,先決定上相鄰領域的預測運動向量候補PMV2。此情況下,在左相鄰領域之預測運動向量候補PMV1的決定處理中,可進行判定左相鄰領域中所含之區格的運動向量是否與上相鄰領域的預測運動向量候補PMV2相同之處理。
又,在上述的實施形態中,雖然是在步驟S605中會判定,上相鄰領域的第j個區格的運動向量是否與左相鄰領域的預測運動向量候補PMV1相同,但亦可不實施此判定。此時,只要若滿足步驟S604之判定條件,就直接進行步驟S606之處理即可。
又,於一實施形態中,亦可在步驟S602中,將索引j增加2以上之數值,來將掃描之區格做抽略。
以下,說明將動態影像編碼裝置20所生成之壓縮串流予以解碼而復原出動態影像的動態影像解碼裝置。圖7係一實施形態所述之動態影像解碼裝置之構成的圖示。圖7所示的動態影像解碼裝置30,係為本發明之一側面所述之將運動向量進行預測解碼之裝置的一例。
如圖7所示,動態影像解碼裝置30係可具備:熵解碼器301、預測運動向量候補決定器302、預測運動向量決定器303、運動向量加算器304、運動補償器305、畫格記憶體306、空間預測器307、預測方法決定器308、 逆量化器309、逆正交轉換器310、加算器311。
熵解碼器301,係在接收了壓縮串流後,於該當壓縮串流中偵測出表示各畫格之開頭的同步字組後,以分割區格單位,從該當壓縮串流內的編碼資料,復原出預測模式資訊與量化正交轉換係數。又,若被預測模式資訊所特定之預測模式是「畫面間預測模式」,則熵解碼器301,係將壓縮串流內的編碼資料予以解碼,也進行運動向量差分值、參照畫面清單識別編號、及參照畫面編號之復原。
熵解碼器301,係將已復原之量化正交轉換係數,經由線L301a而送往逆量化器309。又,熵解碼器301係將預測模式資訊、參照畫面清單識別編號、及參照畫面編號,經由線L301b而送往預測運動向量候補決定器302。然後,熵解碼器301,係將已復原之運動向量差分值,經由線L301d而送往運動向量加算器304。又,熵解碼器301,係將已復原之預測模式資訊,經由線L301e而送往預測方法決定器308。
預測運動向量候補決定器302係若被所收取到之預測模式資訊所特定之預測模式是「畫面間預測模式」,則從已解碼之相鄰區格之運動向量,決定出預測運動向量候補。預測運動向量候補決定器302所進行之預測運動向量候補之決定的相關處理,係和針對預測運動向量候補決定器203而上述過的處理相同,因此這裡省略其說明。該預測運動向量候補決定器302,係將已決定之預測運動向量候補,經由線L302b而輸出至預測運動向量決定器303。 然後,預測運動向量候補決定器302,係將預測運動向量候補之數目,經由線L302a而輸出至熵解碼器301。
熵解碼器301,係一旦經由線L302a而收取預測運動向量候補之數目,則相應於該當數目而將壓縮串流內的編碼資料予以解碼,復原出預測運動向量指示資訊。熵解碼器301,係將已復原之預測向量指示資訊,送往預測運動向量決定器303。更具體而言,當預測運動向量候補的數目是0或1時,預測運動向量指示資訊係不會被傳輸過來,因此不進行復原處理。又,預測運動向量候補的數目是2或3時,藉由將最大2位元的編碼資料進行熵解碼,以復原出預測運動向量指示資訊。
此外,雖然熵解碼器301係隨應於預測運動向量候補決定器302所選擇的預測運動向量候補之數目而將編碼資料進行解碼以進行預測運動向量指示資訊之復原,但並非限定於此。例如,亦可與預測運動向量候補之數目無關地使用上述表1之固定的編碼表來將預測運動向量指示資訊予以復原。此外,固定編碼表的設定並非限定於此。又,亦可在預測運動向量候補的算出之前,先復原出預測運動向量指示資訊。
預測運動向量決定器303係從經由線L302b所輸入之預測運動向量候補之中,基於經由線L301c所輸入之預測運動向量指示資訊,來決定最佳預測運動向量PMVopt。已被決定之最佳預測運動向量PMVopt,係經由線L303而被送往運動向量加算器304。
運動向量加算器304,係將從熵解碼器301所發送過來的運動向量差分值與從預測運動向量決定器303所發送過來的最佳預測運動向量PMVopt,進行加算,以復原出運動向量。運動向量加算器304,係將含有已復原之運動向量的訊號,經由線L304而送往運動補償器305。
運動補償器305,係基於從運動向量加算器304所送來之運動向量與經由線L301d從熵解碼器301所發送過來的預測模式資訊、參照畫面清單識別編號、及參照畫面編號來選擇記憶體306內的參照畫格影像訊號,使用已選擇之參照畫格影像訊號,來生成預測影像訊號。運動補償器305,係經由線L305a而將預測影像訊號送往預測方法決定器308。又,運動補償器305,係將預測影像訊號之生成時所曾利用過的預測模式資訊、參照畫面清單識別編號、及參照畫面編號,經由線L305b而輸出至記憶體306。此外,在記憶體306中係儲存有,過去已解碼之畫格影像訊號、預測模式資訊、參照畫面清單識別編號、及參照畫面編號。
又,空間預測器307係若被經由線L301e所輸入之預測模式資訊所特定之預測模式是「畫面內預測模式」,則參照已解碼之近旁區塊之影像訊號(參照畫格影像訊號)而生成預測影像訊號,將該當預測影像訊號送往預測方法決定器308。
預測方法決定器308,係基於從熵解碼器301所發送之預測模式資訊,選擇藉由畫面間預測所生成之預測影像 訊號及藉由畫面內預測所生成之預測影像訊號之任一者,將已選擇之預測影像訊號,經由線L308而送往加算器311。
逆量化器309,係將已被熵解碼器301所發送之量化正交轉換係數而進行逆量化,將正交轉換係數予以復原。逆量化器309,係將已復原之正交轉換係數,經由線L309而送往逆正交轉換器310。
逆正交轉換器310,係對已收取到的正交轉換係數,適用逆正交轉換,而復原出預測殘差訊號。逆正交轉換器310,係將已復原之預測殘差訊號,經由線L310而送往加算器311。
加算器311係將從預測方法決定器308所發送之預測影像訊號、和從逆正交轉換器310所發送之預測殘差訊號,進行加算,以復原出畫格影像訊號。
已被復原之畫格影像訊號係以所定之顯示時序而被輸出至顯示裝置(未圖示),輸入映像訊號(動態影像訊號)就會被再生。又,由於畫格影像訊號係會被以後的解碼處理所使用,因此是被當成參照畫格影像訊號而儲存在記憶體306中。此處,畫格影像訊號,係可以取和動態影像編碼裝置20中的同一編號之畫格影像訊號相同的值。又,關於運動向量或參照畫格號碼的資訊也是,被同時建立關連至參照畫格影像訊號而儲存。
以下,關於動態影像解碼裝置30上所使用的運動向量之預測解碼方法的一實施形態,參照圖8來說明。圖8 係運動向量之預測解碼方法的一實施形態的流程圖。
如圖8所示,於一實施形態所述的預測運動向量之預測解碼方法中,首先,對預測運動向量候補決定器302,輸入參照畫面清單識別編號及參照畫面編號(步驟S801)。
接著,預測運動向量候補決定器302,係從對象區格BT之左相鄰領域中所含之一個以上之區格的運動向量中,決定出預測運動向量候補PMV1(步驟S302)。
接著,預測運動向量候補決定器302,係從對象區格BT之上相鄰領域中所含之一個以上之區格的運動向量中,決定出預測運動向量候補PMV2(步驟S303)。
接下來,預測運動向量候補決定器302係決定預測運動向量候補PMV3(步驟S304)。此外,圖8中的步驟S302~步驟S304之處理,係和圖3中的步驟S302~步驟S304之處理相同。
接著,於步驟S805中,預測運動向量候補決定器302係在預測運動向量候補PMV1、預測運動向量候補PMV2、預測運動向量候補PMV3當中,僅將非同一之預測運動向量候補,視為預測運動向量候補。若揭示具體例,則預測運動向量候補PMV1與預測運動向量候補PMV3為相同時,作為預測運動向量候補係僅選擇預測運動向量候補PMV1與預測運動向量候補PMV2。又,至步驟S805為止之處理都沒有決定預測運動向量候補時,則零運動向量就會成為預測運動向量候補。
於步驟S806中,如上述,解碼器301係基於預測運動向量候補之數目而將預測運動向量指示資訊予以復原。接著,於步驟S807中,預測運動向量決定器303係基於預測運動向量指示資訊,從預測運動向量候補中選擇出最佳預測運動向量。
以下,說明運動向量之預測編碼方法的第2實施形態。圖9係第2實施形態之運動向量之預測編碼方法中的預測運動向量候補之決定處理的流程圖。在第2實施形態之運動向量之預測編碼方法中,取代圖3的步驟S302~步驟S304,改用圖9所示的流程。
首先,在本實施形態中,於步驟S901中,預測運動向量候補決定器203係將對象區格之左相鄰領域中所含之區格朝下方進行掃描,以從這些區格的運動向量中,決定出預測運動向量候補PMVa。於步驟S901中,預測運動向量候補決定器203係按照圖4的(c)所示之左相鄰領域的掃描順序而實施第1實施形態所說明過的預測運動向量候補PMV1之決定方法(步驟S302),就可偵測出預測運動向量候補PMVa。此外,為了預測運動向量候補PMVa之決定,預測運動向量候補決定器203係和第1實施形態同樣地,可使用所被輸入的參照畫面清單識別編號及參照畫面編號。
接著,於步驟S902中,預測運動向量候補決定器203係將對象區格之左相鄰領域中所含之區格朝上方進行掃描,以從這些區格的運動向量中,決定出預測運動向量 候補PMVb。於步驟S902中,預測運動向量候補決定器203係按照圖4的(a)所示之左相鄰領域的掃描順序而實施第1實施形態所說明過的預測運動向量候補PMV1之決定方法(步驟S302),就可偵測出預測運動向量候補PMVb。此外,預測運動向量候補PMVb之決定也是,預測運動向量候補決定器203係可使用所被輸入的參照畫面清單識別編號及參照畫面編號。
接著,於步驟S903中,預測運動向量候補決定器203係從預測運動向量候補PMVa及預測運動向量候補PMVb,選擇出左相鄰領域的預測運動向量候補PMVX。又,預測運動向量候補決定器203,係生成表示為了求出已選擇之預測運動向量候補而曾用過之掃描方向X的掃描方向指示資訊。具體而言,預測運動向量候補決定器203係在預測運動向量候補PMVa及預測運動向量候補PMVb當中,將對於對象區格之預測運動向量的誤差呈最小的預測運動向量候補,決定成為預測運動向量候補PMVX。又,預測運動向量候補決定器203係若作為預測運動向量候補PMVX是選擇了預測運動向量候補PMVa時,則生成表示下方向的掃描方向指示資訊,若選擇了預測運動向量候補PMVb時,則生成表示上方向的掃描方向指示資訊。
接著,於步驟S904中,預測運動向量候補決定器203係將對象區格之上相鄰領域中所含之區格朝右方進行掃描,以從這些區格的運動向量中,決定出預測運動向量候補PMVc。於步驟S904中,預測運動向量候補決定器 203係按照圖4的(c)所示之上相鄰領域的掃描順序而實施第1實施形態所說明過的預測運動向量候補PMV2之決定方法(步驟S303),就可偵測出預測運動向量候補PMVc。此外,為了預測運動向量候補PMVc之決定,預測運動向量候補決定器203係和第1實施形態同樣地,可使用所被輸入的參照畫面清單識別編號及參照畫面編號。
接著,於步驟S905中,預測運動向量候補決定器203係將對象區格之上相鄰領域中所含之區格朝左方進行掃描,以從這些區格的運動向量中,決定出預測運動向量候補PMVd。於步驟S905中,預測運動向量候補決定器203係按照圖4的(a)所示之上相鄰領域的掃描順序而實施第1實施形態所說明過的預測運動向量候補PMV2之決定方法(步驟S303),就可偵測出預測運動向量候補PMVd。此外,預測運動向量候補PMVd之決定也是,預測運動向量候補決定器203係可使用所被輸入的參照畫面清單識別編號及參照畫面編號。
接著,於步驟S906中,預測運動向量候補決定器203係從預測運動向量候補PMVc及預測運動向量候補PMVd,選擇出上相鄰領域的預測運動向量候補PMVY。又,預測運動向量候補決定器203,係生成表示為了求出已選擇之預測運動向量候補而曾用過之掃描方向Y的掃描方向指示資訊。具體而言,預測運動向量候補決定器203係在預測運動向量候補PMVc及預測運動向量候補PMVd當中,將對於對象區格之預測運動向量的誤差呈最小的預 測運動向量候補,決定成為預測運動向量候補PMVY。又,預測運動向量候補決定器203係若作為預測運動向量候補PMVY是選擇了預測運動向量候補PMVc時,則生成表示右方向的掃描方向指示資訊,若選擇了預測運動向量候補PMVd時,則生成表示左方向的掃描方向指示資訊。
接著,於步驟S907中,預測運動向量候補決定器203係和步驟S304之處理同樣地,取得與對象區格在空間上相同位置之參照畫格內之區格的預測運動向量候補PMVZ。此步驟S907中的處理,係亦可和第1實施形態的步驟S304之處理的上述變形形態相同。
接著,於步驟S908中,預測運動向量候補決定器203係在預測運動向量候補PMVX、預測運動向量候補PMVY、預測運動向量候補PMVZ當中,僅將非同一之預測運動向量候補,視為預測運動向量候補。然後,預測運動向量候補決定器203,係將預測運動向量候補、預測運動向量候補之數目、及掃描方向指示資訊,予以輸出。若揭示具體例,則預測運動向量候補PMVX與預測運動向量候補PMVZ為相同時,作為預測運動向量候補係僅選擇預測運動向量候補PMVX與預測運動向量候補PMVY。又,步驟S901~步驟S907中都沒有決定預測運動向量候補時,則零運動向量就會成為預測運動向量候補。
接著,在第2實施形態中,會進行與第1實施形態的步驟S306相同的處理。最後,於步驟S307中,編碼器213係將用來特定最佳預測運動向量是在預測運動向量候 補當中之何者所需的預測運動向量指示資訊,予以編碼。此外,於第2實施形態中,係於步驟S307中,編碼器213也將掃描方向指示資訊予以編碼。
此外,於第2實施形態中也是,構成左相鄰領域的區格、及構成上相鄰領域的區格,係亦可如上述第1實施形態般地做變更。又,關於預測運動向量的個數,也是可如上述第1實施形態般地做變更。又,亦可如上述第1實施形態般地,將預測運動向量候補PMVX、PMVY、PMVZ的決定順序,基於對象區格分割成小區格之樣態及該當小區格的位置來做變更。
以下,說明第2實施形態的運動向量之預測解碼方法。圖10係第2實施形態之運動向量之預測解碼方法的流程圖。圖10所示的預測解碼方法,係為根據第2實施形態之運動向量之預測編碼方法所生成之編碼資料,來預測運動向量。
如圖10所示,在本實施形態中,首先,於步驟S1001中,對預測運動向量候補決定器302,輸入已被復原之參照畫面清單識別編號、參照畫面編號、掃描方向指示資訊(掃描方向X、掃描方向Y)。
接著,於步驟S1002中,預測運動向量候補決定器302,係隨應於參照畫面清單識別編號、參照畫面編號、及用來特定掃描方向X所需之掃描方向指示資訊,而決定左相鄰領域的預測運動向量候補PMVX。預測運動向量候補PMVX,係藉由在掃描方向指示資訊所特定之掃描方向 X上,依序掃描左相鄰領域內之區格,以相同於第1實施形態之預測運動向量候補PMV1之決定的處理,而被決定。
接著,於步驟S1003中,預測運動向量候補決定器302,係隨應於參照畫面清單識別編號、參照畫面編號、及用來特定掃描方向Y所需之掃描方向指示資訊,而決定上相鄰領域的預測運動向量候補PMVY。預測運動向量候補PMVY,係藉由在掃描方向指示資訊所特定之掃描方向Y上,依序掃描上相鄰領域內之區格,以相同於第1實施形態之預測運動向量候補PMV2之決定的處理,而被決定。
接著,於步驟S1004中,預測運動向量候補決定器302係決定與對象區格在空間上相同參照畫格內之區格的預測運動向量候補PMVZ。步驟S1004之處理,係和步驟S304之處理相同。
接著,於步驟S1005中,預測運動向量候補決定器302係在預測運動向量候補PMVX、預測運動向量候補PMVY、預測運動向量候補PMVZ之中,僅將非同一之預測運動向量候補,視為預測運動向量候補。若揭示具體例,則預測運動向量候補PMVX與預測運動向量候補PMVZ為相同時,作為預測運動向量候補係僅選擇預測運動向量候補PMVX與預測運動向量候補PMVY。又,至步驟S1005為止之處理都沒有決定預測運動向量候補時,則零運動向量就會成為預測運動向量候補。
接著,於步驟S1006中,解碼器301係基於預測運動向量候補之數目而將預測運動向量指示資訊予以復原。接著,於步驟S1007中,預測運動向量決定器303係基於預測運動向量指示資訊,從預測運動向量候補中選擇出最佳預測運動向量。
此外,於第2實施形態中也是,如上述第1實施形態般地,將預測運動向量候補PMVX、PMVY、PMVZ的決定順序,基於對象區格分割成小區格之樣態及該當小區格的位置來做變更。
以上,若依據所說明之動態影像編碼裝置20及動態影像解碼裝置30,則是在縮減了預測運動向量之候補後,從這些預測運動向量候補中,偵測出最佳預測運動向量。因此,可削減最佳預測運動向量之決定時所需要的演算量。又,可將用來特定最佳預測運動向量所需的預測運動向量指示資訊,以較少的位元數來加以編碼。
又,若依據第2實施形態的使用預測編碼及預測解碼之動態影像編碼裝置20及動態影像解碼裝置30,則可求出與對象區格之運動向量的誤差更少的預測運動向量候補。
以下說明,使電腦成為動態影像編碼裝置20而發揮機能所需的動態影像編碼程式1000、及使電腦成為上述動態影像解碼裝置30而發揮機能所需的動態影像解碼程式1100。
圖11係一實施形態所述之動態影像編碼程式之構成 的圖示。圖12係一實施形態所述之動態影像解碼程式之構成的圖示。圖13係一實施形態所述之電腦的硬體構成之圖示。圖14係一實施形態所述之電腦的斜視圖。
圖11所示的動態影像編碼程式1000,係可被儲存在記錄媒體SM中來提供。又,圖12所示的動態影像解碼程式1100也是,可被儲存在記錄媒體SM中來提供。此外,作為記錄媒體SM則例如有,軟碟片、CD-ROM、DVD、或ROM等記錄媒體,或是半導體記憶體等。
如圖13所示,電腦C10係可具備:軟碟片驅動裝置、CD-ROM驅動裝置、DVD驅動裝置等讀取裝置C12、讓作業系統常駐的作業用記憶體(RAM)C14、用來記憶記錄媒體SM中所記憶之程式的記憶體C16、顯示器這類顯示裝置C18、屬於輸入裝置的滑鼠C20及鍵盤C22、進行資料收送用的通訊裝置C24、控制著程式之執行的CPU C26。
電腦C10,係一旦把記錄媒體SM插入至讀取裝置C12,則從讀取裝置C12就可向記錄媒體SM中所儲存的動態影像編碼程式1000進行存取,藉由該當程式1000,就可成為動態影像編碼裝置20而動作。
又,電腦C10,係一旦記錄媒體SM被插入至讀取裝置C12,則從讀取裝置C12就可向記錄媒體SM中所儲存的動態影像解碼程式1100進行存取,藉由該當程式1100,就可成為動態影像解碼裝置30而動作。
如圖11所示,動態影像編碼程式1000係具備有:將 處理予以統籌的主要模組1001、輸入模組1002、運動偵測模組1003、預測運動向量候補決定模組1004、預測運動向量決定模組1005、運動向量差分模組1006、運動補償模組1007、空間預測模組1008、預測方法決定模組1009、減算模組1010、正交轉換模組1011、量化模組1012、熵編碼模組1013、逆量化模組1014、逆正交轉換模組1015、及、加算模組1016。輸入模組1002、運動偵測模組1003、預測運動向量候補決定模組1004、預測運動向量決定模組1005、運動向量差分模組1006、運動補償模組1007、空間預測模組1008、預測方法決定模組1009、減算模組1010、正交轉換模組1011、量化模組1012、熵編碼模組1013、逆量化模組1014、逆正交轉換模組1015、加算模組1016令電腦所執行的機能,係分別和上述的輸入器201、運動偵測器202、預測運動向量候補決定器203、預測運動向量決定器204、運動向量差分器205、運動補償器206、空間預測器208、預測方法決定器209、減算器210、正交轉換器211、量化器212、熵編碼器213、逆量化器214、逆正交轉換器215、加算器216的機能相同。
如圖12所示,動態影像解碼程式1100係具備有:將處理予以統籌的主要模組1101、熵解碼模組1102、預測運動向量候補決定模組1103、預測運動向量決定模組1104、運動向量加算模組1105、運動補償模組1106、空間預測模組1107、預測方法決定模組1108、逆量化模組 1109、逆正交轉換模組1110、及、加算模組1111。熵解碼模組1102、預測運動向量候補決定模組1103、預測運動向量決定模組1104、運動向量加算模組1105、運動補償模組1106、空間預測模組1107、預測方法決定模組1108、逆量化模組1109、逆正交轉換模組1110、加算模組1111令電腦所實現的機能,係分別和上述的熵解碼器301、預測運動向量候補決定器302、預測運動向量決定器303、運動向量加算器304、運動補償器305、空間預測器307、預測方法決定器308、逆量化器309、逆正交轉換器310、加算器311的機能相同。
以上雖然說明了各種實施形態,但本發明係不限定於上述的實施形態,而可做各種變形。例如,在上述的實施形態中,雖然對象區格之運動向量與預測運動向量(最佳預測運動向量)之間的差分亦即運動向量差分值的編碼資料是從編碼裝置被送往解碼裝置,但亦可不從編碼裝置往解碼裝置發送運動向量差分值的編碼資料,而是把最佳預測運動向量當作對象區格之運動向量來採用。
又,於預測運動向量候補PMVX的決定時,亦可使用預測運動向量候補PMVa及PMVb來作成預測影像訊號,在預測運動向量候補PMVa及PMVb當中,將使得預測影像訊號與對象區格之影像訊號之間的絕對值差分和(SAD)變得較小的預測運動向量候補,當作預測運動向量候補PMVX來採用。又,於預測運動向量候補PMVY的決定時,亦可使用預測運動向量候補PMVc及PMVd來 作成預測影像訊號,在預測運動向量候補PMVc及PMVd當中,將使得預測影像訊號與對象區格之影像訊號之間的絕對值差分和(SAD)變得較小的預測運動向量候補,當作預測運動向量候補PMVY來採用。又,亦可取代SAD,改成使用差分絕對值和(SATD)或差分平方和(SSD)。

Claims (2)

  1. 一種預測解碼方法,係屬於將複數畫格影像之時間序列所構成之動態影像予以復原之運動補償預測中所使用的運動向量,進行預測解碼的方法,其係具備:從相對解碼對象之畫格影像內之對象區格而位於左方之左相鄰領域中所屬之複數區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第1預測運動向量候補之步驟;和從相對於前記對象區格而位於上方之上相鄰領域中所屬之複數區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第2預測運動向量候補之步驟;和將編碼資料予以解碼,以復原出用來特定前記對象區格用之預測運動向量所需的預測運動向量指示資訊之步驟;和從至少含有前記第1預測運動向量候補與前記第2預測運動向量候補的複數預測運動向量候補中,選擇出被前記預測運動向量指示資訊所特定之預測運動向量之步驟;於決定前記第1預測運動向量候補之步驟中,藉由將前記左相鄰領域內所含之複數區格從下往上方進行掃描,以從該複數區格的運動向量中,將滿足前記所定之預測運動向量候補決定基準的運動向量,決定成為前記第1預測運動向量候補;於掃描方向上第i個區格(其中,i為自然數,i<N,N係為左相鄰領域之區格的個數,以i由小而大之順序做掃描)是存在於左相鄰區格,且該當區格是具有運動向量的情況下,則判定前記第i個區格與對象區格是否帶有相同的參照畫面清單識別編號及參照畫面編號,若為滿足的情況下,則將前記第i個區格的運動向量,決定成為第1預測運動向量候補。
  2. 一種預測解碼裝置,係屬於將複數畫格影像之時間序列所構成之動態影像予以復原之運動補償預測中所使用的運動向量,進行預測解碼的預測解碼裝置,其係具備:從相對解碼對象之畫格影像內之對象區格而位於左方之左相鄰領域中所屬之複數區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第1預測運動向量候補之手段;和從相對於前記對象區格而位於上方之上相鄰領域中所屬之複數區格的運動向量中,決定出滿足所定之預測運動向量候補決定基準的一個第2預測運動向量候補之手段;和將編碼資料予以解碼,以復原出用來特定前記對象區格用之預測運動向量所需的預測運動向量指示資訊之手段;和從至少含有前記第1預測運動向量候補與前記第2預測運動向量候補的複數預測運動向量候補中,選擇出被前記預測運動向量指示資訊所特定之預測運動向量之手段;於決定前記第1預測運動向量候補之手段中,藉由將前記左相鄰領域內所含之複數區格從下往上方進行掃描,以從該複數區格的運動向量中,將滿足前記所定之預測運動向量候補決定基準的運動向量,決定成為前記第1預測運動向量候補;於掃描方向上第i個區格(其中,i為自然數,i<N,N係為左相鄰領域之區格的個數,以i由小而大之順序做掃描)是存在於左相鄰區格,且該當區格是具有運動向量的情況下,則判定前記第i個區格與對象區格是否帶有相同的參照畫面清單識別編號及參照畫面編號,若為滿足的情況下,則將前記第i個區格的運動向量,決定成為第1預測運動向量候補。
TW107102973A 2011-01-07 2012-01-02 運動向量之預測解碼方法、預測解碼裝置 TWI660623B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-002205 2011-01-07
JP2011002205 2011-01-07

Publications (2)

Publication Number Publication Date
TW201818725A TW201818725A (zh) 2018-05-16
TWI660623B true TWI660623B (zh) 2019-05-21

Family

ID=46457445

Family Applications (3)

Application Number Title Priority Date Filing Date
TW101100049A TW201244499A (en) 2011-01-07 2012-01-02 Prediction encoding method, prediction encoding device, and prediction encoding program for motion vector, as well as prediction decoding method, prediction decoding device, and prediction decoding program for motion vector
TW105129816A TWI621352B (zh) 2011-01-07 2012-01-02 運動向量之預測解碼方法、預測解碼裝置
TW107102973A TWI660623B (zh) 2011-01-07 2012-01-02 運動向量之預測解碼方法、預測解碼裝置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
TW101100049A TW201244499A (en) 2011-01-07 2012-01-02 Prediction encoding method, prediction encoding device, and prediction encoding program for motion vector, as well as prediction decoding method, prediction decoding device, and prediction decoding program for motion vector
TW105129816A TWI621352B (zh) 2011-01-07 2012-01-02 運動向量之預測解碼方法、預測解碼裝置

Country Status (19)

Country Link
US (5) US9693052B2 (zh)
EP (6) EP4120685A1 (zh)
JP (5) JP5698767B2 (zh)
KR (6) KR20140011475A (zh)
CN (5) CN105812820B (zh)
AU (1) AU2011353904B2 (zh)
BR (1) BR112013017208B1 (zh)
CA (4) CA2933341C (zh)
DK (2) DK4120686T3 (zh)
ES (4) ES2936314T3 (zh)
FI (2) FI3826306T3 (zh)
HU (2) HUE063372T2 (zh)
MX (4) MX2013007540A (zh)
PL (4) PL4120686T3 (zh)
PT (4) PT2938082T (zh)
RU (7) RU2649770C1 (zh)
SG (1) SG191232A1 (zh)
TW (3) TW201244499A (zh)
WO (1) WO2012093585A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101456499B1 (ko) * 2010-07-09 2014-11-03 삼성전자주식회사 움직임 벡터의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9300970B2 (en) 2010-07-09 2016-03-29 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding motion vector
CA2933341C (en) 2011-01-07 2020-06-30 Ntt Docomo, Inc. Predictive encoding method, predictive encoding device, and predictive encoding program of motion vector, and, predictive decoding method, predictive decoding device, and predictive decoding program of motion vector
US9319716B2 (en) * 2011-01-27 2016-04-19 Qualcomm Incorporated Performing motion vector prediction for video coding
US9374598B2 (en) 2011-03-21 2016-06-21 Lg Electronics Inc. Method for selecting motion vector predictor and device using same
CN107181961A (zh) 2011-05-31 2017-09-19 Jvc 建伍株式会社 动图像编码装置、动图像编码方法以及记录介质
MX2013013029A (es) * 2011-06-30 2013-12-02 Panasonic Corp Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, dispositivo de decodificacion de imagenes, dispositivo de codificacion de imagenes y dispositivo de codificacion/decodifi cacion de imagenes.
JP2013098711A (ja) * 2011-10-31 2013-05-20 Mitsubishi Electric Corp 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
CN103079067B (zh) * 2013-01-09 2016-03-09 华为技术有限公司 运动矢量预测值列表构建方法和视频编解码方法及装置
US9300906B2 (en) * 2013-03-29 2016-03-29 Google Inc. Pull frame interpolation
TWI536811B (zh) * 2013-12-27 2016-06-01 財團法人工業技術研究院 影像處理方法與系統、解碼方法、編碼器與解碼器
KR101944683B1 (ko) 2017-02-21 2019-04-17 (주)제이하우스 아틀리에 클러스터 건물구조
CN108810531B (zh) * 2017-05-03 2019-11-19 腾讯科技(深圳)有限公司 视频编码处理方法、装置及电子设备
US10356439B2 (en) * 2017-06-29 2019-07-16 Intel Corporation Flexible frame referencing for display transport
WO2019049912A1 (ja) * 2017-09-08 2019-03-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
CN109963155B (zh) 2017-12-23 2023-06-06 华为技术有限公司 图像块的运动信息的预测方法、装置及编解码器
MX2021002557A (es) 2018-09-07 2021-04-29 Panasonic Ip Corp America Sistema y metodo para codificacion de video.
JP7288964B2 (ja) 2018-12-28 2023-06-08 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 動きベクトル予測因子リストを生成すること
SG11202108101SA (en) * 2019-01-28 2021-08-30 Op Solutions Llc Inter prediction in exponential partitioning
US11375243B2 (en) * 2019-07-17 2022-06-28 Tencent America LLC Method and apparatus for video coding
KR20210039553A (ko) 2019-10-02 2021-04-12 주식회사 디맥스 치과용 지르코니아 소재의 표면 처리방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200843519A (en) * 2006-12-22 2008-11-01 Qualcomm Inc Systems and methods for efficient spatial intra predictabilty determination (or assessment)
TW200948086A (en) * 2008-02-13 2009-11-16 Qualcomm Inc Shared block comparison architecture for image registration and video coding
CN101622877A (zh) * 2006-12-22 2010-01-06 高通股份有限公司 用于有效空间帧内可预测性确定(或评估)的系统和方法
WO2010030732A2 (en) * 2008-09-11 2010-03-18 On2 Technologies, Inc. System and method for video encoding using constructed reference frame
CN101911707A (zh) * 2008-01-23 2010-12-08 索尼公司 编码设备、编码方法、解码设备和解码方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2703802A1 (fr) * 1993-04-07 1994-10-14 Philips Electronique Lab Dispositif d'estimation de mouvement entre des images successives d'une séquence d'images animées subdivisées en blocs bidimensionnels d'éléments d'image.
EP0892561B1 (en) 1993-04-09 2002-06-26 Sony Corporation Picture encoding method and apparatus
KR100523908B1 (ko) * 1997-12-12 2006-01-27 주식회사 팬택앤큐리텔 격행주사 영상에 대한 영상신호 부호화 장치 및 그 방법
US20040001546A1 (en) * 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
JP2005223631A (ja) 2004-02-05 2005-08-18 Sony Corp データ処理装置およびその方法と符号化装置および復号装置
JP4543971B2 (ja) * 2005-03-07 2010-09-15 ソニー株式会社 符号化方法、符号化装置、符号化処理のプログラム及び符号化処理のプログラムを記録した記録媒体
JP4712643B2 (ja) * 2006-08-17 2011-06-29 富士通セミコンダクター株式会社 フレーム間予測処理装置、フレーム間予測方法、画像符号化装置及び画像復号装置
KR101365567B1 (ko) * 2007-01-04 2014-02-20 삼성전자주식회사 영상의 예측 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101383540B1 (ko) 2007-01-03 2014-04-09 삼성전자주식회사 복수의 움직임 벡터 프리딕터들을 사용하여 움직임 벡터를추정하는 방법, 장치, 인코더, 디코더 및 복호화 방법
KR101365574B1 (ko) * 2007-01-29 2014-02-20 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US8908765B2 (en) * 2007-11-15 2014-12-09 General Instrument Corporation Method and apparatus for performing motion estimation
JP5401071B2 (ja) * 2008-10-09 2014-01-29 株式会社Nttドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法
CN102498718B (zh) 2009-07-03 2016-01-20 法国电信公司 具有与至少一个相邻参考图像分区的几何形状或尺寸不同的几何形状或尺寸的当前图像分区的移动向量的预测以及使用一个这种预测的编码和解码
KR20120016991A (ko) * 2010-08-17 2012-02-27 오수미 인터 프리딕션 방법
US9137544B2 (en) * 2010-11-29 2015-09-15 Mediatek Inc. Method and apparatus for derivation of mv/mvp candidate for inter/skip/merge modes
CA2933341C (en) 2011-01-07 2020-06-30 Ntt Docomo, Inc. Predictive encoding method, predictive encoding device, and predictive encoding program of motion vector, and, predictive decoding method, predictive decoding device, and predictive decoding program of motion vector

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200843519A (en) * 2006-12-22 2008-11-01 Qualcomm Inc Systems and methods for efficient spatial intra predictabilty determination (or assessment)
CN101622877A (zh) * 2006-12-22 2010-01-06 高通股份有限公司 用于有效空间帧内可预测性确定(或评估)的系统和方法
CN101911707A (zh) * 2008-01-23 2010-12-08 索尼公司 编码设备、编码方法、解码设备和解码方法
TW200948086A (en) * 2008-02-13 2009-11-16 Qualcomm Inc Shared block comparison architecture for image registration and video coding
WO2010030732A2 (en) * 2008-09-11 2010-03-18 On2 Technologies, Inc. System and method for video encoding using constructed reference frame

Also Published As

Publication number Publication date
PT2938082T (pt) 2017-04-07
ES2936314T3 (es) 2023-03-16
US20130294517A1 (en) 2013-11-07
RU2697738C1 (ru) 2019-08-19
JP6099729B2 (ja) 2017-03-22
CN103283235A (zh) 2013-09-04
US20190110065A1 (en) 2019-04-11
JP2018026879A (ja) 2018-02-15
PL3826306T3 (pl) 2023-03-20
CN105812821A (zh) 2016-07-27
US9693052B2 (en) 2017-06-27
RU2744696C1 (ru) 2021-03-15
WO2012093585A1 (ja) 2012-07-12
CA3167001A1 (en) 2012-07-12
RU2580090C2 (ru) 2016-04-10
PT4120686T (pt) 2023-09-07
EP2663077B1 (en) 2017-01-11
PT3826306T (pt) 2023-01-16
RU2676245C1 (ru) 2018-12-26
TW201701669A (zh) 2017-01-01
KR101931276B1 (ko) 2018-12-20
HUE063372T2 (hu) 2024-01-28
US10511856B2 (en) 2019-12-17
MX352533B (es) 2017-11-29
CN105791857B (zh) 2018-12-07
RU2699404C1 (ru) 2019-09-05
EP2938081A1 (en) 2015-10-28
CA2933341A1 (en) 2012-07-12
CN105791857A (zh) 2016-07-20
RU2731026C1 (ru) 2020-08-28
TWI562611B (zh) 2016-12-11
JP5698767B2 (ja) 2015-04-08
EP2663077A4 (en) 2015-11-04
CA3079646A1 (en) 2012-07-12
JP6246962B2 (ja) 2017-12-13
TWI621352B (zh) 2018-04-11
JP6411615B2 (ja) 2018-10-24
KR20160036671A (ko) 2016-04-04
FI4120686T3 (fi) 2023-09-12
JP2016036186A (ja) 2016-03-17
AU2011353904B2 (en) 2015-09-10
CA3079646C (en) 2022-09-13
MX2020001492A (es) 2020-03-20
EP4120685A1 (en) 2023-01-18
KR20170132361A (ko) 2017-12-01
US20170150169A1 (en) 2017-05-25
US10511855B2 (en) 2019-12-17
MX339663B (es) 2016-06-03
RU2649770C1 (ru) 2018-04-04
ES2957772T3 (es) 2024-01-25
US9877040B2 (en) 2018-01-23
EP2938082B1 (en) 2017-03-22
CN105812820A (zh) 2016-07-27
EP3826306A1 (en) 2021-05-26
JP2015092781A (ja) 2015-05-14
US20190075316A1 (en) 2019-03-07
KR20160087402A (ko) 2016-07-21
MX2013007540A (es) 2013-08-21
CA2823880C (en) 2016-08-16
EP4120686B1 (en) 2023-08-23
US20170155898A9 (en) 2017-06-01
TW201244499A (en) 2012-11-01
US20180146209A1 (en) 2018-05-24
DK4120686T3 (da) 2023-09-25
CN105812820B (zh) 2019-03-15
CA2823880A1 (en) 2012-07-12
KR20140011475A (ko) 2014-01-28
US10154280B2 (en) 2018-12-11
EP3826306B1 (en) 2022-12-28
EP2663077A1 (en) 2013-11-13
CN103283235B (zh) 2016-10-26
RU2013136900A (ru) 2015-02-20
JP5859691B2 (ja) 2016-02-10
JP2017108433A (ja) 2017-06-15
SG191232A1 (en) 2013-07-31
KR101672790B1 (ko) 2016-11-04
PL2938082T3 (pl) 2017-09-29
PL2663077T3 (pl) 2017-04-28
BR112013017208A2 (pt) 2016-09-20
KR101803886B1 (ko) 2017-12-04
HUE061239T2 (hu) 2023-06-28
JPWO2012093585A1 (ja) 2014-06-09
CN106878741B (zh) 2019-08-06
CA2933341C (en) 2020-06-30
EP4120686A1 (en) 2023-01-18
CN106878741A (zh) 2017-06-20
AU2011353904A1 (en) 2013-07-11
TW201818725A (zh) 2018-05-16
PL4120686T3 (pl) 2023-12-11
KR20200006194A (ko) 2020-01-17
KR102066543B1 (ko) 2020-01-15
BR112013017208B1 (pt) 2019-01-29
PT2663077T (pt) 2017-02-13
EP2938082A1 (en) 2015-10-28
ES2614821T3 (es) 2017-06-02
DK3826306T3 (da) 2023-01-23
ES2622732T3 (es) 2017-07-07
FI3826306T3 (fi) 2023-01-31
KR20180128098A (ko) 2018-11-30
KR102165666B1 (ko) 2020-10-14
CN105812821B (zh) 2017-10-27

Similar Documents

Publication Publication Date Title
TWI660623B (zh) 運動向量之預測解碼方法、預測解碼裝置