TW201507445A - 影像預測編碼裝置、影像預測編碼方法、影像預測編碼程式、影像預測解碼裝置、影像預測解碼方法、及影像預測解碼程式 - Google Patents

影像預測編碼裝置、影像預測編碼方法、影像預測編碼程式、影像預測解碼裝置、影像預測解碼方法、及影像預測解碼程式 Download PDF

Info

Publication number
TW201507445A
TW201507445A TW103137226A TW103137226A TW201507445A TW 201507445 A TW201507445 A TW 201507445A TW 103137226 A TW103137226 A TW 103137226A TW 103137226 A TW103137226 A TW 103137226A TW 201507445 A TW201507445 A TW 201507445A
Authority
TW
Taiwan
Prior art keywords
prediction
information
signal
block
motion information
Prior art date
Application number
TW103137226A
Other languages
English (en)
Other versions
TWI519140B (zh
Inventor
Yoshinori Suzuki
Junya Takiue
Choong Seng Boon
Thiow Keng Tan
Original Assignee
Ntt Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=45496857&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TW201507445(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Ntt Docomo Inc filed Critical Ntt Docomo Inc
Publication of TW201507445A publication Critical patent/TW201507445A/zh
Application granted granted Critical
Publication of TWI519140B publication Critical patent/TWI519140B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

於一實施形態中,影像內的編碼對象領域係被分割成複數個預測領域。基於對象領域所相鄰之相鄰領域的預測資訊、該當對象領域內的已編碼預測領域之數目、該當對象領域的已編碼預測資訊,而將屬於下個預測領域的對象預測領域之預測訊號之生成時所使用的運動資訊之候補,從該當對象預測領域所相鄰之領域的已編碼運動資訊中,予以選出。隨應於已選擇之運動資訊之候補的數目,用來指示使用了已選出之運動資訊之候補的對象預測領域之預測訊號之生成的合併區塊資訊及由預測資訊推定手段所偵測出的運動資訊、或是該當合併區塊資訊與該當運動資訊之任意一方會被編碼,對象預測領域之預測訊號之生成時所使用的運動資訊,會被保存至預測資訊保存手段中。

Description

影像預測編碼裝置、影像預測編碼方法、影像預測編碼程式、影像預測解碼裝置、影像預測解碼方法、及影像預測解碼程式
本發明的一側面,係有關於影像預測編碼裝置、影像預測編碼方法、及影像預測編碼程式。又,本發明的另一側面,係有關於影像預測解碼裝置、影像預測解碼方法及影像預測解碼程式。亦即,這些側面係有關於,使用周圍區塊的運動資訊來生成對象區塊之預測訊號的影像預測編碼裝置、影像預測編碼方法、影像預測編碼程式、影像預測解碼裝置、影像預測解碼方法及影像預測解碼程式。又,本發明的再另一側面係有關於,藉由運動向量所致之運動補償來進行預測訊號之生成的動態影像編碼裝置、動態影像編碼方法、動態影像編碼程式、動態影像解碼裝置、動態影像解碼方法、及動態影像解碼程式。
為了有效率地進行靜止影像或動態影像資料的傳送,採用了壓縮編碼技術。在動態影像的情況下,廣泛地採用MPEG-1~4或ITU(International Telecommunication Union)H.261~H.264之方式。
在這些編碼方式中,是將身為編碼對象的影像,分割成複數區塊,然後才進行編碼處理或解碼處理。在畫面內的預測編碼時,是使用位於與對象區塊相同畫面內的相鄰之已再生的影像訊號(壓縮影像資料所復原而成者)來生成預測訊號,然後將該預測訊號,從對象區塊之訊號中加以扣除而得到的差分訊號,進行編碼。在畫面間的預測編碼時,是參照位於與對象區塊不同畫面內的相鄰之已再生的影像訊號來進行運動的補正,生成預測訊號,將該預測訊號從對象區塊之訊號中加以扣除而得到之差分訊號,進行編碼。
例如在H.264的畫面內預測編碼時,係採用將身為編碼對象之區塊所相鄰的已再生之像素值,往所定之方向進行外插,以生成預測訊號之方法。圖22係ITU H.264中所採用的畫面內預測方法的說明用模式圖。於圖22(A)中,對象區塊802係身為編碼對象之區塊該對象區塊802的交界處所相鄰的像素PA~PM所成的像素群801係為相鄰領域,是於過去處理中已經被再生的影像訊號。
在圖22的(A)所示的情況下,是將位於對象區塊802正上方的相鄰像素亦即像素群801往下方拉長,而生成預測訊號。又,在圖22的(B)所示之情況下,係將位於對象區塊804的左方的已再生像素(PI~PL)往右拉長以生成預測訊號。生成預測訊號的具體方法,係例如記載於專利文獻1中。求取如此以圖22的(A)~(I)所示 的方法所生成的9個預測訊號之每一者、與對象區塊之像素訊號的差分,將差分值最小者視為最佳之預測訊號。如以上,藉由將像素進行外插,就可生成預測訊號。關於以上的內容,係被記載於下記專利文獻1。
在通常的畫面間預測編碼時,關於身為編碼對象之區塊,是以從已再生之畫面中探索出類似於該像素訊號之訊號的方法,來生成預測訊號。然後,將對象區塊與探索到的訊號所構成之領域之間的空間性位移量亦即運動向量,和對象區塊的像素訊號與預測訊號之間的殘差訊號,進行編碼。如此對每一區塊,進行運動向量之探索的手法,稱作區塊比對(block matching)。
圖21係區塊比對處理的說明用模式圖。以下,以在編碼對象之畫面701上的對象區塊702為例,來說明預測訊號的生成程序。畫面703係為已經再生完畢,領域704係與對象區塊702在空間上為同一位置的領域。在區塊比對時,設定圍繞領域704的探索範圍705,從該探索範圍之像素訊號中,偵測出與對象區塊702之像素訊號的絕對值誤差和呈最小的領域706。該領域706的訊號係成為預測訊號,從領域704往領域706的位移量,係被偵測成為運動向量707。又,亦可準備複數個參照畫面703,就每一對象區塊,選擇要實施區塊比對的參照畫面,偵測出參照畫面選擇資訊。在H.264中,為了對應於影像的局部性特徵變化,備有將運動向量進行編碼之區塊尺寸是互異的複數種預測形式。關於H.264的預測形式,例如記載於專 利文獻2。
在動態影像資料的壓縮編碼時,各畫面(畫格、圖場)的編碼順序係可為任意。因此,參照已再生畫面來生成預測訊號的畫面間預測中,關於編碼順序係有3種手法。第1手法係參照再生順序上為過去已再生之畫面來生成預測訊號的前方預測,第2手法係參照再生順序上為未來再生之畫面而生成預測訊號的後方預測,第3手法係前方預測和後方預測都會進行,將2個預測訊號予以平均化的雙向預測。關於畫面間預測的種類,例如記載於專利文獻3。
作為次世代編碼映像編碼方式而開始標準化的HEVC(High efficiency video coding)中,作為預測區塊的分割類型,除了和圖20的(B)與(C)所示的矩形2分割、圖20的(D)所示的正方4分割以外,還有如圖20的(E)~(F)所示的非對稱分割之導入,也正在檢討中。然後,在HEVC中,在生成被如此分割之預測區塊的預測訊號之際,將身為預測對象之對象預測區塊所相鄰之區塊的運動資訊(運動向量或參照影像資訊以及識別前方/後方/雙向的畫面間預測模式)加以利用的手法,正被檢討中。該預測手法係被稱作區塊合併法,其特徵為可高效率地將運動資訊加以編碼。圖2的(A)係為將編碼區塊400做縱分割所生成的預測區塊T1進行區塊合併之際的相鄰區塊的模式性說明圖。預測區塊T1的預測訊號,係使用1)相鄰區塊A的運動資訊、2)相鄰區塊B的運動 資訊、或3)區塊比對中所偵測到的運動資訊之任一者而被生成。例如,當編碼器選擇了相鄰區塊A的運動資訊時,第1步是,編碼器係將用來表示要利用相鄰區塊之運動資訊此事的合併識別資訊(merge_flag)設成“merge_flag=1”,將該當合併識別資訊(merge_flag)送往解碼器。第2步是,編碼器係將用來表示在相鄰區塊A與相鄰區塊B中要利用相鄰區塊A此事的合併區塊選擇資訊(merge_flag_left)設成“merge_flag_left=1”,將該當合併區塊選擇資訊(merge_flag_left)送往解碼器。解碼器係藉由接收這2個資訊,就可識別應該要使用相鄰區塊A的運動資訊來生成對象預測區塊的預測訊號。同樣地,解碼器係當接收到“merge_flag=1”、“merge_flag_left=0”(選擇相鄰區塊B)時,就可識別出要使用相鄰區塊B的運動資訊來生成對象預測區塊的預測訊號;當接收到“merge_flag=0”時,還會從編碼器接收運動資訊而將對象預測區塊的運動資訊予以復原。關於此處所示的區塊合併,係記載於非專利文獻1。
又,在MPEG-1,2或MPEG-4等之規格的畫格間預測中,各個圖像是被分割成彼此不重疊之矩形的區塊之集合,對區塊之每一者係關連有運動向量。運動向量,係藉由每一區塊的運動探索而獲得,是表示著為了將目前的區塊的影像訊號加以預測而使用的第2區塊起算到目前區塊之水平位移及垂直位移。
下記專利文獻4中係記載著,當區塊內存在有朝傾斜 方向運動之交界時,用來進行更高精度之運動補償預測所需的方法。該方法係將區塊再分切成非矩形的小區格,對每一該當小區格進行運動補償預測。
又,下記專利文獻5中係記載著,將區塊分切成更小的矩形之小區格,對每一該當小區格進行運動補償預測的方法。此方法係在將處理對象之小區格的運動向量加以編碼之際,根據銜接著處理對象之小區格的區塊且為處理順序在該當小區格之前的區塊的運動向量,生成預測運動向量,僅將處理對象的小區格的運動向量與預測運動向量之差分、亦即差分運動向量,加以編碼。此方法中,係當處理對象之小區格並未銜接於處理順序較前的區塊時,則根據含有該當處理對象之小區格的區塊內的處理順序較前面之其他小區格的運動向量,來生成該當處理對象之小區格的預測運動向量。
〔先前技術文獻〕 〔專利文獻〕
[專利文獻1]美國專利公報第6765964號
[專利文獻2]美國專利公報第7003035號
[專利文獻3]美國專利公報第6259739號
[專利文獻4]日本特開2005-277968號公報
[專利文獻5]日本特開2009-246972號公報
〔非專利文獻〕
[非專利文獻1]Test Model under Consideration, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 1st Meeting: Dresden, DE, 15-23 April, 2010, Document: JCTVC-A205
在上記的專利文獻1中,編碼對象之對象編碼區塊所分割而成的複數預測區塊的區塊合併中所利用的運動資訊候補之選出,是無關於預測區塊與其周圍的狀況都以相同的方法來實施。因此,例如,如圖2的(B)所示,預測區塊T2的預測訊號生成之際的運動資訊之候補中,含有同一編碼區塊中所含之預測區塊T1的運動資訊。該預測區塊T1與預測區塊T2所成之預測區塊分割類型,係想定為2個區塊的預測訊號是用不同的運動資訊所生成,而準備的。因此,預測區塊T2的運動資訊之候補中含有預測區塊T1的運動資訊,此事並不理想。亦即,編碼會變得沒有效率。
於是,本發明係在數個側面中,目的在於提供一種,將對象預測區塊的預測訊號之生成時所使用的運動資訊之候補,基於對象編碼區塊或周圍的編碼區塊之已編碼或已解碼預測資訊(運動資訊或預測區塊分割類型)而加以選出,以抑制非效率之編碼的產生的此種影像預測編碼裝置、影像預測編碼方法、影像預測編碼程式、影像預測解碼裝置、影像預測解碼方法及影像預測解碼程式。亦即,在這些側面中,本發明的目的在於提供一種可提昇編碼效 率的影像預測編碼裝置、影像預測編碼方法、影像預測編碼程式、影像預測解碼裝置、影像預測解碼方法及影像預測解碼程式。
又,如專利文獻4或專利文獻5所記載,是對將處理對象之區塊予以分切所得之每一小區格,進行運動補償預測的方法。於此種運動補償預測中,係基於處理順序比處理對象之小區格還前面之區塊的運動向量而生成小區格用的預測運動向量,僅將該當小區格的運動向量與該當預測運動向量之間的差分運動向量加以編碼,在代碼量的觀點來看是較為理想。
圖23係用來說明運動補償預測的圖。如圖23所示,在處理對象的區塊P中,係有可能存在與處理順序是在該當區塊P之前的一個以上之區塊CP銜接的小區格SP1和未與區塊CP銜接的小區格SP2。此種小區格SP2的運動向量V2,在專利文獻4所記載的方法中,係不使用預測運動向量,就直接被編碼。此方法係等價於,將預測運動向量視為零向量的方法。
另一方面,在專利文獻5所記載的方法中,是根據屬於區塊P內的其他小區格且處理順序是比小區格SP2還前面的小區格SP1的運動向量V1,而生成小區格SP2的預測運動向量。然而,小區格SP1的運動向量與小區格SP2的運動向量,本來就被認為是彼此互異。因此,在專利文獻5所記載的方法中,無法將小區格SP2的運動向量有效率地加以編碼。
於是,本發明係在別的幾個側面中,目的也是提供一種可提升編碼效率的動態影像編碼裝置、動態影像編碼方法、及動態影像編碼程式、以及對應該當動態影像編碼的動態影像解碼裝置、動態影像解碼方法、及動態影像解碼程式。
本發明的第1側面,係有關於影像預測編碼。
本發明之第1側面所述之影像預測編碼裝置,係具備:領域分割手段,係將輸入影像分割成複數領域;和預測資訊推定手段,係將已被上記領域分割手段所分割之作為編碼對象之對象領域,分割成複數個小的預測領域,將表示適合於上記對象領域的預測領域之數目與領域形狀的預測區塊分割類型,加以決定,將用來從已再生訊號中取得與該複數預測領域相關較高之訊號所需之運動資訊,分別加以預測,求出含有上記預測區塊分割類型與上記運動資訊的預測資訊;和預測資訊編碼手段,係將附隨於上記對象領域之預測資訊,加以編碼;和預測訊號生成手段,係基於附隨於上記對象領域之預測資訊,而生成上記對象領域之預測訊號;和殘差訊號生成手段,係基於上記對象領域之預測訊號與上記對象領域之像素訊號,生成殘差訊號;和殘差訊號編碼手段,係將上記殘差訊號生成手段所生成的殘差訊號,加以編碼;和殘差訊號復原手段,係藉由將上記殘差訊號之編碼資料加以解碼,以生成再生殘差 訊號;和記錄手段,係藉由將上記預測訊號與上記再生殘差訊號予以加算,以生成上記對象領域的復原像素訊號,將該復原像素訊號當作上記已再生訊號而加以保存。上記預測資訊編碼手段,係具有:預測資訊保存手段,係將已編碼之預測資訊,加以保存;將上記對象領域的預測區塊分割類型加以編碼,將該預測區塊分割類型保存至上記預測資訊保存手段中;基於上記對象領域所相鄰之相鄰領域的預測資訊、上記對象領域內的已編碼預測領域之數目、上記對象領域的已編碼預測資訊,而將屬於下個預測領域的對象預測領域之預測訊號之生成時所使用的運動資訊之候補,從該對象預測領域所相鄰之領域的已編碼運動資訊中,加以選出;隨應於上記已選出之運動資訊之候補的數目,將用來指示使用了已選出之運動資訊之候補的上記對象預測領域之預測訊號之生成的合併區塊資訊及由上記預測資訊推定手段所偵測出的運動資訊、或是該合併區塊資訊與該運動資訊之任意一方予以編碼,將上記對象預測領域之預測訊號之生成時所使用的運動資訊,保存至上記預測資訊保存手段中。
本發明之第1側面所述之影像預測編碼方法,係含有:領域分割步驟,係將輸入影像分割成複數領域;和預測資訊推定步驟,係將已被上記領域分割步驟所分割之作為編碼對象之對象領域,分割成複數個小的預測領域,將表示適合於上記對象領域的預測領域之數目與領域形狀的預測區塊分割類型,加以決定,將用來從已再生訊號中取 得與該複數預測領域相關較高之訊號所需之運動資訊,分別加以預測,求出含有上記預測區塊分割類型與上記運動資訊的預測資訊;和預測資訊編碼步驟,係將附隨於上記對象領域之預測資訊,加以編碼;和預測訊號生成步驟,係基於附隨於上記對象領域之預測資訊,而生成上記對象領域之預測訊號;和殘差訊號生成步驟,係基於上記對象領域之預測訊號與上記對象領域之像素訊號,生成殘差訊號;和殘差訊號編碼步驟,係將已被上記殘差訊號生成步驟所生成的殘差訊號,加以編碼;和殘差訊號復原步驟,係藉由將上記殘差訊號之編碼資料加以解碼,以生成再生殘差訊號;和記錄步驟,係藉由將上記預測訊號與上記再生殘差訊號予以加算,以生成上記對象領域的復原像素訊號,將該復原像素訊號當作上記已再生訊號而加以保存。在預測資訊編碼步驟中,係將上記對象領域的預測區塊分割類型加以編碼,將該預測區塊分割類型保存至,用來保存已編碼之預測資訊的預測資訊保存手段中;基於上記對象領域所相鄰之相鄰領域的預測資訊、上記對象領域內的已編碼預測領域之數目、上記對象領域的已編碼預測資訊,而將屬於下個預測領域的對象預測領域之預測訊號之生成時所使用的運動資訊之候補,從該對象預測領域所相鄰之領域的已編碼運動資訊中,加以選出;隨應於上記已選出之運動資訊之候補的數目,將用來指示使用了已選出之運動資訊之候補的上記對象預測領域之預測訊號之生成的合併區塊資訊及由上記預測資訊推定步驟所偵測出的運 動資訊、或是該合併區塊資訊與該運動資訊之任意一方予以編碼,將上記對象預測領域之預測訊號之生成時所使用的運動資訊,保存至上記預測資訊保存手段中。
又,本發明的第1側面所述之影像預測編碼程式,係使電腦發揮機能而成為上述影像預測編碼裝置之各手段。
若依照本發明的第1側面,則對象預測區塊的預測訊號之生成時所使用的運動資訊之候補,是基於對象編碼區塊或周圍的編碼區塊之已編碼之預測資訊(運動資訊或預測區塊分割類型)而被選出,因此可抑制非效率之編碼的產生。
於一實施形態中,係基於上記對象領域內的已編碼預測領域之數目與上記對象領域的預測區塊分割類型與上記對象領域所相鄰之相鄰領域的預測區塊分割類型,而可將屬於下個預測領域的對象預測領域的運動資訊之候補,從對象預測領域所相鄰之領域的已編碼運動資訊中,予以選出。
於一實施形態中,係基於上記對象領域內的已編碼預測領域之數目與上記對象領域的預測區塊分割類型,而將屬於下個預測領域的對象預測領域的運動資訊之候補,從該對象預測領域所相鄰之領域的已編碼運動資訊中予以選出;上記對象領域係被分割成2個預測領域,當上記對象預測領域是在上記對象領域內第2個被編碼的預測領域時,上記對象預測領域所相鄰、並不被包含在上記對象領域中的領域的運動資訊,可被當成該對象預測領域之預測 訊號之生成時所使用的運動資訊之候補而加以選出。
又,於一實施形態中,係基於上記對象領域內的已編碼預測領域之數目與上記對象領域的預測區塊分割類型與上記對象領域內的已編碼運動資訊與上記對象領域所相鄰之相鄰領域的運動資訊,而將屬於下個預測領域的對象預測領域之預測訊號之生成時所使用的運動資訊之候補,從該對象預測領域所相鄰之領域的已編碼運動資訊中予以選出,上記對象領域係被分割成2個預測領域,上記對象預測領域是在上記對象領域內第2個被編碼的預測領域,上記對象領域的第1個被編碼之預測領域的運動資訊,是與上記對象預測領域所相鄰、並不被包含在上記對象領域中的領域的運動資訊相同時,可判斷不將上記對象預測領域所相鄰之領域的運動資訊利用於上記對象預測領域的預測訊號之生成,而將運動資訊予以編碼。
本發明的第2側面,係有關於影像預測解碼。
本發明之第2側面所述之影像預測解碼裝置,係具備:資料解析手段,係從被分割成複數領域而編碼的影像的壓縮資料之中,抽出用來指示在解碼對象之對象領域之訊號之預測時所使用之預測方法用的預測資訊的編碼資料、上記對象領域之預測訊號的編碼資料、殘差訊號的編碼資料;和預測資訊解碼手段,係將上記預測資訊的編碼資料予以解碼,將上記對象領域之小分割領域亦即複數預測領域的數目與領域形狀加以表示的預測區塊分割類型、和用來從已再生訊號中取得各預測領域之預測訊號所需的 運動資訊,加以復原;和預測訊號生成手段,係基於附隨於上記對象領域之預測資訊,而生成上記對象領域之預測訊號;和殘差訊號復原手段,係從上記殘差訊號之編碼資料,復原出上記對象領域的再生殘差訊號;和記錄手段,係藉由將上記預測訊號與上記再生殘差訊號予以加算,以復原上記對象領域的像素訊號,將該像素訊號當作上記已再生訊號而加以保存。預測資訊解碼手段,係具有:預測資訊保存手段,係將已解碼之預測資訊,加以保存;將上記對象領域的預測區塊分割類型予以解碼並保存至上記預測資訊保存手段中;基於上記對象領域所相鄰之相鄰領域的預測資訊、上記對象領域內的已解碼預測領域之數目、上記對象領域的已解碼預測資訊,而將屬於下個預測領域的對象預測領域之預測訊號之生成時所使用的運動資訊之候補,從該對象預測領域所相鄰之領域的已解碼運動資訊中,加以選出;隨應於上記已選出之運動資訊之候補的數目,將用來指示使用了已選出之運動資訊之候補的上記對象預測領域之預測訊號之生成的合併區塊資訊及運動資訊、或是該合併區塊資訊與該運動資訊之任意一方予以解碼,將上記對象預測領域之預測訊號之生成時所使用的運動資訊,保存至上記預測資訊保存手段中。
本發明之第2側面所述之影像預測解碼方法,係含有:資料解析步驟,係從被分割成複數領域而編碼的影像的壓縮資料之中,抽出用來指示在解碼對象之對象領域之訊號之預測時所使用之預測方法用的預測資訊的編碼資 料、上記對象領域之預測訊號的編碼資料、殘差訊號的編碼資料;和預測資訊解碼步驟,係將上記預測資訊的編碼資料予以解碼,將上記對象領域之小分割領域亦即複數預測領域的數目與領域形狀加以表示的預測區塊分割類型、和用來從已再生訊號中取得各預測領域之預測訊號所需的運動資訊,加以復原;和預測訊號生成步驟,係基於附隨於上記對象領域之預測資訊,而生成上記對象領域之預測訊號;和殘差訊號復原步驟,係從上記殘差訊號之編碼資料,復原出上記對象領域的再生殘差訊號;和記錄步驟,係藉由將上記預測訊號與上記再生殘差訊號予以加算,以復原上記對象領域的像素訊號,將該像素訊號當作上記已再生訊號而加以保存。在預測資訊解碼步驟中,係將上記對象領域的預測區塊分割類型加以解碼,將該預測區塊分割類型保存至,用來保存已解碼之預測資訊的預測資訊保存手段中;基於上記對象領域所相鄰之相鄰領域的預測資訊、上記對象領域內的已解碼預測領域之數目、上記對象領域的已解碼預測資訊,而將屬於下個預測領域的對象預測領域之預測訊號之生成時所使用的運動資訊之候補,從該對象預測領域所相鄰之領域的已解碼運動資訊中,加以選出;隨應於上記已選出之運動資訊之候補的數目,將用來指示使用了已選出之運動資訊之候補的上記對象預測領域之預測訊號之生成的合併區塊資訊及運動資訊、或是該合併區塊資訊與該運動資訊之任意一方予以解碼,將上記對象預測領域之預測訊號之生成時所使用的運動資訊,保 存至上記預測資訊保存手段中。
又,本發明的第2側面所述之影像預測解碼程式,係使電腦發揮機能而成為上述影像預測解碼裝置之各手段。
若依據本發明的第2側面,則可從上述影像預測編碼所生成之壓縮資料中,解碼出影像。
於一實施形態中,係基於上記對象領域內的已解碼預測領域之數目與上記對象領域的預測區塊分割類型與上記對象領域所相鄰之相鄰領域的預測區塊分割類型,而可將屬於下個預測領域的對象預測領域的運動資訊之候補,從該對象預測領域所相鄰之領域的已解碼運動資訊中,予以選出。
於一實施形態中,係基於上記對象領域內的已解碼預測領域之數目與上記對象領域的預測區塊分割類型,而將屬於下個預測領域的對象預測領域之預測訊號之生成時所使用的運動資訊之候補,從該對象預測領域所相鄰之領域的已解碼運動資訊中予以選出,上記對象領域係被分割成2個預測領域,當上記對象預測領域是在上記對象領域內第2個被解碼的預測領域時,上記對象預測領域所相鄰、並不被包含在上記對象領域中的領域的運動資訊,可被當成對象預測領域的運動資訊之候補而加以選出。
又,於一實施形態中,係基於上記對象領域內的已解碼預測領域之數目與上記對象領域的預測區塊分割類型與上記對象領域內的已解碼運動領域與上記對象領域所相鄰之相鄰領域的運動資訊,而將屬於下個預測領域的對象預 測領域之預測訊號之生成時所使用的運動資訊之候補,從該對象預測領域所相鄰之領域的已解碼運動資訊中予以選出,上記對象領域係被分割成2個預測領域,上記對象預測領域是在上記對象領域內第2個被解碼的預測領域,上記對象領域的第1個被解碼之預測領域的運動資訊,是與上記對象預測領域所相鄰、並不被包含在上記對象領域中的領域的運動資訊相同時,可判斷不將上記對象預測領域所相鄰之領域的運動資訊利用於上記對象預測領域的預測訊號之生成,而解碼出運動資訊。
又,本發明的第3側面,係有關於動態影像編碼。
第3側面所述之動態影像編碼裝置,係具備:分割手段、小區格生成手段、運動偵測手段、預測訊號生成手段、運動預測手段、差分運動向量生成手段、殘差訊號生成手段、加算手段、記憶手段、及編碼手段。分割手段,係將動態影像中的輸入影像,分割成複數區格。小區格生成手段,係將已被分割手段所生成之處理對象之區格予以分切成複數個小區格,並生成用來特定該小區格之形狀的形狀資訊。運動偵測手段,係將處理對象之區格的運動向量,加以偵測。預測訊號生成手段,係使用已被運動偵測手段所測出之運動向量,根據已再生之影像訊號,生成處理對象之區格的預測訊號。運動預測手段,係基於已被小區格生成手段所生成的形狀資訊、和處理順序比處理對象之區格還要前面之區格或小區格亦即已處理之部分領域的運動向量,而生成處理對象之區格的預測運動向量。差分 運動向量生成手段,係基於處理對象之區格的預測訊號之生成時所使用過的運動向量、與預測運動向量之差分,而生成差分運動向量。殘差訊號生成手段,係基於預測訊號與處理對象之區格的像素訊號之差分,而生成殘差訊號。加算手段,係將殘差訊號與預測訊號進行加算而生成再生影像訊號。記憶手段,係將再生影像訊號當作已再生之影像訊號而加以記憶。編碼手段,係將已被殘差訊號生成手段所生成之殘差訊號、已被差分向量生成手段所生成之差分運動向量、已被小區格生成手段所生成之形狀資訊予以編碼,而生成壓縮資料。運動預測手段,係當處理對象之區格內的處理對象之小區格並沒有銜接著處理順序比該當處理對象之小區格還要前面之區格的情況下,基於相對於該當處理對象之小區格與該當處理對象區格內之其他小區格之間的交界之延長線而在一方側之領域與另一方側之領域當中含有處理對象之小區格之領域中所屬之已處理之部分領域的運動向量,生成該當處理對象之小區格的預測運動向量。
第3側面所述之動態影像編碼方法,係含有:(a)分割步驟,係將動態影像中的輸入影像,分割成複數區格;和(b)小區格生成步驟,係將已在分割步驟中所生成之處理對象之區格予以分切成複數個小區格,並生成用來特定該當小區格之形狀的形狀資訊;和(c)運動偵測步驟,係將處理對象之區格的運動向量,加以偵測;和(d)預測訊號生成步驟,係使用已在運動偵測步驟中所 測出之運動向量,根據已再生之影像訊號,生成處理對象之區格的預測訊號;和(e)運動預測步驟,係基於已在小區格生成步驟中所生成的形狀資訊、和處理順序比處理對象之區格還要前面之區格或小區格亦即已處理之部分領域的運動向量,而生成處理對象之區格的預測運動向量;和(f)差分運動向量生成步驟,係基於處理對象之區格的預測訊號之生成時所使用過的運動向量、與預測運動向量之差分,而生成差分運動向量;和(g)殘差訊號生成步驟,係基於預測訊號與處理對象之區格的像素訊號之差分,而生成殘差訊號;和(h)加算步驟,係將殘差訊號與預測訊號進行加算而生成再生影像訊號;和(i)記憶步驟,係將再生影像訊號當作已再生之影像訊號而加以記憶;和(j)編碼步驟,係將在殘差訊號生成步驟中所生成之殘差訊號、在差分運動向量生成步驟中所生成之差分運動向量、在小區格生成步驟中所生成之形狀資訊予以編碼而生成壓縮資料。在運動預測步驟中,係當處理對象之區格內的處理對象之小區格並沒有銜接著處理順序比該當處理對象之小區格還要前面之區格的情況下,基於相對於處理對象之小區格與處理對象區格內之其他小區格之間的交界之延長線而在一方側之領域與另一方側之領域當中含有處理對象之小區格之領域中所屬之已處理之部分領域的運動向量,生成處理對象之小區格的預測運動向量。
又,第3側面所述之動態影像編碼程式,係使電腦發揮機能而成為上述動態影像編碼裝置之各手段。
在上述被交界之延長線所劃分的二個領域當中,含有未銜接於處理順序較前之區格的小區格的領域,係很有可能具有和該當小區格之運動類似的運動。因此,若依據第3側面,則可提升預測運動向量的精度,可縮小差分運動向量的值,以較少的代碼量來編碼運動向量。因此,可提升編碼效率。
本發明的第4側面,係有關於動態影像解碼。
第4側面所述之動態影像解碼裝置,係具備:解碼手段、運動預測手段、向量加算手段、預測訊號生成手段、加算手段、及記憶手段。解碼手段,係將壓縮資料予以解碼,以生成影像內之處理對象之區格的再生殘差訊號、處理對象之區格的差分運動向量、將處理對象之區格內的複數小區格之形狀予以特定的形狀資訊。運動預測手段,係基於形狀資訊、和處理順序比處理對象之區格還要前面之區格或小區格亦即已處理之部分領域的運動向量,而生成處理對象之區格的預測運動向量。向量加算手段,係將已被運動預測手段所生成之預測運動向量、和已被解碼手段所生成之差分運動向量,進行加算,而生成處理對象之區格的運動向量。預測訊號生成手段,係基於處理對象之區格的運動向量,而根據已再生之影像訊號,生成處理對象之區格的預測訊號。加算手段,係將預測訊號、和已被解碼手段所生成之再生殘差訊號進行加算,而生成再生影像訊號。記憶手段,係將再生影像訊號當作已再生之影像訊號而加以記憶。運動預測手段,係當處理對象之區格內的 處理對象之小區格並沒有銜接著處理順序比該當處理對象之小區格還要前面之區格的情況下,基於相對於處理對象之小區格與處理對象區格內之其他小區格之間的交界之延長線而在一方側之領域與另一方側之領域當中含有處理對象之小區格之領域中所屬之已處理之部分領域的運動向量,生成處理對象之小區格的預測運動向量。
第4側面所述之動態影像解碼方法,係屬於將壓縮資料予以解碼而生成動態影像的方法,其特徵為,含有:(a)解碼步驟,係將壓縮資料予以解碼,以生成影像內之處理對象之區格的再生殘差訊號、處理對象之區格的差分運動向量、將處理對象之區格內的複數小區格之形狀予以特定的形狀資訊;和(b)運動預測步驟,係基於形狀資訊、和處理順序比處理對象之區格還要前面之區格或小區格亦即已處理之部分領域的運動向量,而生成處理對象之區格的預測運動向量;和(c)向量加算步驟,係將已在運動預測步驟中所生成之預測運動向量、和已在解碼步驟中所生成之差分運動向量,進行加算,而生成處理對象之區格的運動向量;和(d)預測訊號生成步驟,係基於處理對象之區格的運動向量,而根據已再生之影像訊號,生成處理對象之區格的預測訊號;和(e)加算步驟,係將預測訊號、和已在解碼步驟所生成之再生殘差訊號進行加算,而生成再生影像訊號;和(f)記憶步驟,係將再生影像訊號當作已再生之影像訊號而加以記憶。在運動預測步驟中,係當處理對象之區格內的處理對象之小區格並 沒有銜接著處理順序比該當處理對象之小區格還要前面之區格的情況下,基於相對於處理對象之小區格與處理對象區格內之其他小區格之間的交界之延長線而在一方側之領域與另一方側之領域當中含有處理對象之小區格之領域中所屬之已處理之部分領域的運動向量,生成處理對象之小區格的預測運動向量。
第4側面所述之動態影像解碼程式,係使電腦發揮機能而成為上述動態影像解碼裝置之各手段。
若依據第4側面,則可根據將未銜接於處理順序較前之區格的小區格加以包含之領域的已解碼運動向量,生成該當小區格的預測運動向量。該預測運動向量,係很可能類似於該當小區格的運動向量。因此,若依據上述實施形態,則可提升預測運動向量的精度,可縮小差分運動向量的值,可從較少位元量的壓縮資料進行解碼。因此,可實現效率良好的解碼。
若依據本發明的數個側面所述之影像預測編碼裝置、影像預測編碼方法、影像預測編碼程式、影像預測解碼裝置、影像預測解碼方法及影像預測解碼程式,則由於可對象預測區塊之預測訊號生成時所利用的運動資訊之候補是可基於周圍的已編碼或已解碼之資訊而選出,因此具有可效率更佳地進行編碼之效果。
又,若依據本發明的另幾個側面,則可提供一種可提 升編碼效率的動態影像編碼裝置、動態影像編碼方法、及動態影像編碼程式。又,可提供對應這些動態影像編碼的動態影像解碼裝置、動態影像解碼方法、及動態影像解碼程式。
100‧‧‧影像預測編碼裝置
101‧‧‧輸入端子
102‧‧‧區塊分割器
103‧‧‧預測訊號生成器
104‧‧‧畫格記憶體
105‧‧‧減算器
106‧‧‧轉換器
107‧‧‧量化器
108‧‧‧逆量化器
109‧‧‧逆轉換器
110‧‧‧加算器
111‧‧‧量化轉換係數編碼器
112‧‧‧輸出端子
113‧‧‧預測區塊分割類型選擇器
114‧‧‧運動資訊推定器
115‧‧‧預測資訊用記憶體
116‧‧‧預測資訊編碼器
201‧‧‧輸入端子
202‧‧‧資料解析器
203‧‧‧逆量化器
204‧‧‧逆轉換器
205‧‧‧加算器
206‧‧‧輸出端子
207‧‧‧量化轉換係數解碼器
208‧‧‧預測資訊解碼器
10‧‧‧動態影像編碼裝置
20‧‧‧動態影像解碼裝置
501‧‧‧區塊分割器
502‧‧‧小區塊生成器
503‧‧‧畫格記憶體
504‧‧‧運動偵測器
505‧‧‧預測訊號生成器
506‧‧‧運動預測器
507‧‧‧減算器
508‧‧‧殘差訊號生成器
509‧‧‧轉換器
510‧‧‧量化器
511‧‧‧逆量化器
512‧‧‧逆轉換器
513‧‧‧加算器
514‧‧‧熵編碼器
601‧‧‧資料解碼器
602‧‧‧運動預測器
603‧‧‧加算器
604‧‧‧逆量化器
605‧‧‧逆轉換器
606‧‧‧畫格記憶體
607‧‧‧預測訊號生成器
608‧‧‧加算器
5061‧‧‧運動向量記憶體
5062‧‧‧運動參照候補生成器
5063‧‧‧預測運動向量生成器
6021‧‧‧運動向量記憶體
6022‧‧‧運動參照候補生成器
6023‧‧‧預測運動向量生成器
P10‧‧‧動態影像編碼程式
P100‧‧‧影像預測編碼程式
P101‧‧‧區塊分割模組
P102‧‧‧運動資訊推定模組
P103‧‧‧預測訊號生成模組
P104‧‧‧記憶模組
P105‧‧‧減算模組
P106‧‧‧轉換模組
P107‧‧‧量化模組
P108‧‧‧逆量化模組
P109‧‧‧逆轉換模組
P110‧‧‧加算模組
P111‧‧‧量化轉換係數編碼模組
P112‧‧‧預測分割類型選擇模組
P113‧‧‧預測資訊記憶模組
P114‧‧‧預測資訊編碼模組
P20‧‧‧動態影像解碼程式
P200‧‧‧影像預測解碼程式
P201‧‧‧量化轉換係數解碼模組
P202‧‧‧預測資訊解碼模組
P206‧‧‧逆量化模組
P207‧‧‧逆轉換模組
P208‧‧‧加算模組
C10‧‧‧電腦
C12‧‧‧讀取裝置
C14‧‧‧作業用記憶體
C16‧‧‧記憶體
C18‧‧‧顯示裝置
C20‧‧‧滑鼠
C22‧‧‧鍵盤
C24‧‧‧通訊裝置
C26‧‧‧CPU
SM‧‧‧記錄媒體
M101‧‧‧區塊分割模組
M102‧‧‧小區格生成器模組
M103‧‧‧記憶模組
M104‧‧‧運動偵測模組
M105‧‧‧預測訊號生成模組
M106‧‧‧運動預測模組
M107‧‧‧減算模組
M108‧‧‧殘差訊號生成模組
M109‧‧‧轉換模組
M110‧‧‧量化模組
M111‧‧‧逆量化模組
M112‧‧‧逆轉換模組
M113‧‧‧加算模組
M114‧‧‧熵編碼模組
M201‧‧‧資料解碼模組
M202‧‧‧運動預測模組
M203‧‧‧加算模組
M204‧‧‧逆量化模組
M205‧‧‧逆轉換模組
M206‧‧‧記憶模組
M207‧‧‧預測訊號生成模組
M208‧‧‧加算模組
PMV‧‧‧預測運動向量
SP1‧‧‧第1小區格
SP2‧‧‧第2小區格
SP3‧‧‧第3小區格
SP4‧‧‧第4小區格
U1‧‧‧部分領域
U2‧‧‧部分領域
T1‧‧‧預測區塊
T2‧‧‧預測區塊
CP‧‧‧區塊
[圖1]一實施形態所述之影像預測編碼裝置的區塊圖。
[圖2]先前之區塊合併中的運動資訊之候補的說明用模式圖。
[圖3]一實施形態所述之區塊合併中的運動資訊之候補的說明用模式圖。
[圖4]說明圖1係所示的預測資訊編碼器之處理的流程圖。
[圖5]圖1係所示的影像預測編碼裝置的影像預測編碼方法之程序的流程圖。
[圖6]一實施形態所述之影像預測解碼裝置的區塊圖。
[圖7]圖6係所示的預測資訊解碼器之處理的說明用流程圖。
[圖8]圖6係所示的影像預測解碼裝置之影像預測解碼方法的流程圖。
[圖9]將相鄰於對象預測區塊的複數相鄰區塊的運動資訊當作對象預測區塊的運動資訊而利用之處理的說明用 第1模式圖。
[圖10]將相鄰於對象預測區塊的複數相鄰區塊的運動資訊當作對象預測區塊的運動資訊而利用之處理的說明用第2模式圖。
[圖11]將相鄰於對象預測區塊的複數相鄰區塊的運動資訊當作對象預測區塊的運動資訊而利用之處理的說明用流程圖。
[圖12]將相鄰於對象預測區塊的複數相鄰區塊的運動資訊當作對象預測區塊的運動資訊而利用之處理的說明用第3模式圖。
[圖13]將相鄰於對象預測區塊的複數相鄰區塊的運動資訊當作對象預測區塊的運動資訊而利用之處理的說明用流程圖的第2例。
[圖14]一實施形態所述之區塊合併中的運動資訊之候補的說明用模式圖的第2例。
[圖15]一實施形態所述之區塊合併中的運動資訊之候補的說明用模式圖的第3例。
[圖16]可執行一實施形態所述之影像預測編碼方法之程式的區塊圖。
[圖17]可執行一實施形態所述之影像預測解碼方法之程式的區塊圖。
[圖18]將記錄媒體中所記錄之程式加以執行所需之電腦的硬體構成之圖示。
[圖19]將記錄媒體中所記憶之程式加以執行所需之電 腦的斜視圖。
[圖20]編碼區塊的預測區塊分割類型的說明用模式圖。
[圖21]關於畫面間預測時的運動推定處理(A)與樣版比對處理(B)之模式圖。
[圖22]先前之畫面內預測方法的說明用模式圖。
[圖23]用來說明運動補償預測的圖。
[圖24]一實施形態所述之動態影像編碼裝置之構成的概略圖示。
[圖25]用來說明小區格之生成的圖。
[圖26]一實施形態的運動預測器之構成的圖示。
[圖27]一實施形態所述之動態影像編碼方法的流程圖。
[圖28]一實施形態所述之運動預測器之處理的流程圖。
[圖29]對象區塊的小區格與周圍的部分領域之一例的圖示。
[圖30]對象區塊的小區格與周圍的部分領域之另一例的圖示。
[圖31]對象區塊的小區格與周圍的部分領域之再另一例的圖示。
[圖32]對象區塊的小區格與周圍的部分領域之再另一例的圖示。
[圖33]對象區塊的小區格與周圍的部分領域之再另一 例的圖示。
[圖34]一實施形態所述之動態影像解碼裝置之構成的概略圖示。
[圖35]一實施形態所述之運動預測器之構成的圖示。
[圖36]一實施形態所述之動態影像解碼方法的流程圖。
[圖37]一實施形態所述之運動預測器之處理的流程圖。
[圖38]一實施形態所述之動態影像編碼程式之構成的圖示。
[圖39]一實施形態所述之動態影像解碼程式之構成的圖示。
以下,一面參照添附圖面,一面詳細說明各種實施形態。此外,於圖面的說明中,相同或同等要素係標示同一符號,並省略重複說明。
圖1係一實施形態所述之影像預測編碼裝置100的區塊圖。該影像預測編碼裝置100係具備:輸入端子101、區塊分割器102、預測訊號生成器103、畫格記憶體104、減算器105、轉換器106、量化器107、逆量化器108、逆轉換器109、加算器110、量化轉換係數編碼器111、輸出端子112、預測區塊分割類型選擇器113、運動資訊推定器114、預測資訊用記憶體115、預測資訊編碼 器116。
轉換器106、量化器107及量化轉換係數編碼器111,係成為殘差訊號編碼手段而發揮機能,逆量化器及逆轉換器係成為殘差訊號復原手段而發揮機能。又,預測區塊分割類型選擇器113與運動資訊推定器114,係成為預測資訊推定手段而發揮機能,預測資訊用記憶體115與預測資訊編碼器116係成為預測資訊編碼手段而發揮機能。
輸入端子101,係用來輸入複數張影像所成之動態影像之訊號的端子。
區塊分割器102,係將從輸入端子101所輸入之訊號所表示之編碼處理對象的影像,分割成複數領域(編碼區塊)。在本實施形態中,雖然是將編碼對象影像分割成由16x16像素所成的區塊,但亦可分割成其以外之大小或形狀的區塊。又,亦可在畫面內混合有尺寸不同的區塊。
預測區塊分割類型選擇器113,係將身為編碼處理對象的對象領域(對象編碼區塊),分割成會被進行預測處理的預測領域。例如,對每一編碼區塊,選擇圖20的(A)~(H)之任一者而將該當編碼區塊進行小分割。將已被分割之領域稱作預測領域(預測區塊),將圖20的(A)~(H)之各分割方法稱作預測區塊分割類型。預測區塊分割類型的選擇方法係沒有限定。例如可以利用,對經由訊號線L102而被輸入的對象編碼區塊的訊號,實施各小分割,實際實施後述的預測處理或編碼處 理,將編碼區塊的原訊號與再生訊號之間的編碼誤差訊號電力、與根據編碼區塊之編碼所需代碼量所算出的速率失真值呈最小的分割類型,加以選擇的方法等。對象編碼區塊的預測區塊分割類型係經由訊號線L113a、訊號線L113b、訊號線L113c而分別被輸出至預測資訊用記憶體115、運動資訊推定器114、預測訊號生成器103。
運動資訊推定器114,係將對象編碼區塊內的各預測區塊之預測訊號生成所必須的運動資訊,予以測出。關於預測訊號之生成方法(預測方法)係沒有限定,但可以適用如先前技術所說明的畫面間預測或畫面內預測(畫面內預測係未圖示)。此處,考量以圖21所示之之區塊比對來偵測運動資訊。預測對象之對象預測區塊的原訊號,係可根據經由訊號線L102a所輸入之編碼區塊的原訊號和經由訊號線L113b所輸入之對象編碼區塊的預測區塊分割類型而生成。將對於該對象預測區塊之原訊號的絕對值誤差和呈最小的預測訊號,從經由訊號線L104所取得之影像訊號偵測出來。此時,運動資訊中係含有:運動向量、畫面間預測模式(前方/後方/雙向)、參照畫面編號等。已被測出之運動資訊係經由訊號線L114,而分別被輸入至預測資訊用記憶體115和預測資訊編碼器116。
預測資訊用記憶體115,係將所被輸入之運動資訊與預測區塊分割類型,加以保存。
預測資訊編碼器116,係除了將各預測區塊的區塊合併時所使用的運動資訊之候補加以選出,並且還將對象編 碼區塊的預測資訊進行熵編碼,將編碼資料經由訊號線L116而輸出至輸出端子112。熵編碼之方法係沒有限定,但可適用算術編碼或可變長度編碼等。此外,在預測資訊中,係除了含有對象編碼區塊的預測區塊分割類型、預測區塊的運動資訊以外,還含有使用相鄰於預測區塊之區塊的運動資訊而實施區塊合併所需的區塊合併資訊。關於預測資訊編碼器116的處理將於後述。
在預測訊號生成器103中,是基於經由訊號線L114所輸入之對象編碼區塊內的各預測區塊的運動資訊和經由訊號線L113c所輸入之預測區塊分割類型,而從畫格記憶體104取得已再生訊號,生成對象編碼區塊內的各預測區塊的預測訊號。
已被預測訊號生成器103所生成的預測訊號,係經由訊號線L103而被輸出至減算器105與加算器110。
減算器105,係從被區塊分割器102所分割而經由訊號線L102b所輸入之對象編碼區塊的像素訊號中,減去經由訊號線L103而輸入之針對對象編碼區塊的預測訊號,而生成殘差訊號。減算器105,係將減算所得的殘差訊號,經由訊號線L105而輸出至轉換器106。
轉換器106,係將已被輸入之殘差訊號進行離散餘弦轉換的部分。又,量化器107,係將經過轉換器106進行離散餘弦轉換的轉換係數,予以量化的部分。量化轉換係數編碼器111,係將已被量化器107所量化之轉換係數,進行熵編碼。編碼資料係經由訊號線L111而輸出至端子 112。熵編碼之方法係沒有限定,但可適用算術編碼或可變長度編碼等。
輸出端子112,係將從預測資訊編碼器116及量化轉換係數編碼器111所輸入之資訊加以整合而輸出至外部。
逆量化器108,係將已被量化之轉換係數,予以逆量化。逆轉換器109,係藉由逆離散餘弦轉換,而將殘差訊號予以復原。加算器110,係將已被復原的殘差訊號與經由訊號線L103所輸入之預測訊號進行加算,生成對象編碼區塊的訊號,將已被再生之訊號,儲存至畫格記憶體104。在本實施形態中雖然使用轉換器106與逆轉換器109,但亦可不使用這些轉換器而改用其他的轉換處理。又,轉換器106及逆轉換器109係並非必須。如此,為了使用在後續的對象編碼區塊的預測訊號生成中,已被編碼過的對象編碼區塊的再生訊號,係藉由逆處理而被復原並被記憶在畫格記憶體104中。
接著說明預測資訊編碼器116的處理。預測資訊編碼器116,係首先將各預測區塊的區塊合併時所使用的運動資訊之候補(對象預測領域的預測訊號生成時所使用的運動資訊之候補),從相鄰於對象預測區塊之區塊的運動資訊中,加以選出。所謂區塊合併,係表示使用相鄰區塊之運動資訊來生成對象預測區塊的預測訊號這件事。接著,預測資訊編碼器116係比較被運動資訊推定器114所測出之運動資訊與所被選出的運動資訊之候補,判斷可否實施區塊合併。然後,預測資訊編碼器116,係隨應於區塊合 併時所使用的運動資訊之候補的數目與區塊合併實施可否,而將區塊合併資訊與運動資訊之任一者或雙方,與預測區塊分割類型一起進行熵編碼。區塊合併資訊,係由合併區塊選擇資訊(merge_flag_left)所構成,其係用來表示,要在用來指示是否利用相鄰區塊之運動資訊而生成對象預測區塊預測訊號、亦即指示區塊合併實施可否的合併識別資訊(merge_flag),與對象預測區塊所相鄰之2個區塊的運動資訊當中,使用哪一者來生成對象預測區塊的預測訊號。
各預測區塊之區塊合併時所使用的運動資訊之候補為0個時,則這2個資訊,亦即合併識別資訊及合併區塊選擇資訊,就沒有必要進行編碼。當運動資訊之候補是1個時,則將合併識別資訊予以編碼,當運動資訊之候補是2個以上時,若要實施區塊合併,則將2個資訊、亦即合併識別資訊及合併區塊選擇資訊予以編碼。即使運動資訊之候補是2個以上,若不實施區塊合併,就不需要合併區塊選擇資訊的編碼。
圖3係一實施形態的預測區塊的區塊合併時所使用的運動資訊之候補的選出處理的說明用模式圖。圖3係和圖20的(B)所示之區塊301同樣地,圖示了將編碼區塊進行縱向2分割(分割成左右二個區塊)的預測區塊分割類型之例子。以下雖然以此區塊301為例子來說明,但以區塊302、304、305、306、307也可同樣地說明。
運動資訊之候補的選出,係基於以下資訊而實施。
1)對象編碼區塊內的已編碼/已解碼預測區塊之數目
2)對象編碼區塊的預測區塊分割類型
3)對象預測區塊所相鄰之區塊的預測區塊分割類型
4)對象編碼區塊內的已編碼/已解碼預測區塊的運動資訊
5)對象預測區塊所相鄰之區塊的運動資訊與預測模式(畫面內預測/畫面間預測)
在圖3的例子中,是使用1)、2)、4)、5)之資訊,來選出區塊合併時所使用的運動資訊之候補。
首先,根據2)之資訊,得知對象編碼區塊400內的已編碼/已解碼預測區塊的總數係為預測區塊T1與T2共2個,編碼區塊是被縱向做2分割。下個預測區塊是預測區塊T1還是預測區塊T2,是可根據1)之資訊而得知。
下個預測區塊是預測區塊T1(對象編碼區塊內的已編碼/已解碼預測區塊之數目為0)時,則相鄰區塊A與相鄰區塊B的運動資訊就成為區塊合併的運動資訊之候補(圖面內的箭頭係表示,相鄰區塊A與B的運動資訊係為預測區塊T1的預測訊號之生成時所使用的運動資訊之候補)。此時,若相鄰區塊A或B是藉由畫面內預測所生成之區塊或畫面外之區塊時,則亦可將該區塊的運動資訊從區塊合併的運動資訊之候補中排除(亦可將假想的運動資訊當作預設值。例如,將運動向量設成0,將參照畫面編號設成0)。又,當2個相鄰區塊A與B的運動資訊是一致時,則亦可將其中一方的相鄰區塊的運動資訊,從 候補中排除。
當下個預測區塊是預測區塊T2(對象編碼區塊內的已編碼/已解碼預測區塊之數目為1個)時,則如圖3的(A)所示,相鄰區塊亦即T1的運動資訊係被從區塊合併的運動資訊之候補中排除。這是因為,預測區塊T1與預測區塊T2,本來就被想定是由不同的運動資訊而生成預測訊號而被分割成2個。亦即,這是為了避免預測區塊T1的運動資訊與預測區塊T2的運動資訊變成相同運動資訊。藉由該處理,預測區塊T2的區塊合併的運動資訊就變成1個,因此可削減合併區塊選擇資訊之編碼所需的成本(圖面內的箭頭係表示,相鄰區塊D的運動資訊係可利用於預測區塊T2的預測訊號之生成)。
然後,基於上記4)和5)之資訊,將預測區塊T1與相鄰區塊D的運動資訊進行比較,若預測區塊T1與相鄰區塊D的運動資訊是一致時,則如圖3的(B)所示,相鄰區塊D的運動資訊也被從區塊合併的運動資訊之候補中排除。其理由是,若使用相鄰區塊D的運動資訊來生成預測區塊T2的預測訊號,則預測區塊T1與T2的運動資訊會變成相同。藉由該處理,預測區塊T2的區塊合併之運動資訊就變成0個,可削減合併識別資訊與合併區塊選擇資訊的編碼所需之成本。
圖4係實現圖3之處理的預測資訊編碼器116的流程圖。
首先,預測資訊編碼器116,係將對象編碼區塊的預 測區塊分割類型予以編碼,將該當預測區塊分割類型,保存至預測資訊用記憶體115中。同時,預測資訊編碼器116,係基於已編碼之預測區塊分割類型而設定對象編碼區塊內的預測區塊數N,將對象預測區塊編號i重置成0(步驟S151)。接著,預測資訊編碼器116,係判斷對象預測區塊是否為對象編碼區塊內最後被編碼的預測區塊,且對象編碼區塊內的預測區塊數是否為2以上(步驟S152)。例如,若N=2,則i=1時,判定為可,處理係前進至步驟S157。若N=4(圖20的(D)),則i=3時,判定為可。若判定為否,則處理係前進至步驟S153。在圖3的情況下,當對象預測區塊是預測區塊T1時則處理係前進至步驟S153,是預測區塊T2則處理係前進至步驟S157。
在步驟S153中,合併識別資訊會被編碼。合併識別資訊,係若對象預測區塊的運動資訊與區塊合併的運動資訊之候補是一致時,則判別為可(merge_flag=1,使用運動資訊之候補來生成對象預測區塊的預測訊號),若不一致則判別為否(merge_flag=0,使用已編碼之運動資訊來生成對象預測區塊的預測訊號)。接著,若對象預測區塊的運動資訊與區塊合併的運動資訊之候補是一致時,則處理係前進至步驟S164。在步驟S164中,預測資訊編碼器116係判定運動資訊之候補是否為2個,若運動資訊之候補的數目是2個時,則將合併區塊選擇資訊予以編碼,處理係前進至步驟S155。若運動資訊之候補的數目是1個 時,則處理係前進至步驟S165。另一方面,若對象預測區塊的運動資訊與區塊合併的運動資訊之候補不一致時,則處理係前進至步驟S156,預測資訊編碼器116係將運動資訊推定器114所測出的運動資訊予以編碼,前進至步驟S165。
在步驟S157中,預測資訊編碼器116係判定,對象編碼區塊的所有已編碼運動資訊與不屬於對象編碼區塊的相鄰區塊的運動資訊,是否一致。該步驟S157之說明係意味著,若N=2,則將圖3所示的預測區塊T1與相鄰區塊D的運動資訊,進行比較。又,步驟S157之說明係意味著,若N=4(圖20的(D)),則對象預測區塊係為右下的分割區塊,而將其以外的3個預測區塊(左上、右上、左下)的運動資訊,進行比較。當判定為可(所比較之運動資訊為一致)時,則如圖3的(B)所示,由於對象預測區塊的區塊合併時所使用的運動資訊之候補的數目為0個,因此預測資訊編碼器116係不送出區塊合併資訊,將運動資訊推定器114所測出的運動資訊予以編碼,處理係前進至步驟S165(步驟S160)。另一方面,若判定為否(所比較之資訊為不一致)時,則處理係前進至步驟S163。此外,當N=4時,則對象編碼區塊內的右上與左下之區塊的運動資訊,就成為對象預測區塊的相鄰區塊。因此,3個預測區塊(左上、右上、左下)的運動資訊一致時就對對象預測區塊(右下)適用區塊合併,這就意味著對象編碼區塊內的4個預測區塊的運動資訊是全部 以同樣之運動資訊而被生成。因此,N=4且3個預測區塊(左上、右上、左下)的運動資訊為相同時,則將對象預測區塊(右下)的運動資訊之候補視為0個。
在步驟S163中,預測資訊編碼器116係判定對象編碼區塊的預測區塊分割類型是否為2分割之類型,若判定為否則處理係前進至步驟S153(之後的說明係省略)。若步驟S163之判定為可時,則處理係前進至步驟S158,預測資訊編碼器116係將合併識別資訊予以編碼。此情況下,如圖3的(A)之例子所示,由於對象預測區塊之區塊合併時所使用的運動資訊之候補之數目為1個,因此不需要編碼合併區塊選擇資訊。接著,若對象預測區塊的運動資訊與區塊合併的運動資訊之候補是一致時,則處理係前進至步驟S165。若對象預測區塊的運動資訊與區塊合併的運動資訊之候補不一致時,則處理係前進至步驟S160,預測資訊編碼器116係將運動資訊推定器114所測出的運動資訊予以編碼,處理係前進至步驟S165。
在步驟S165中,係將對象區塊的運動資訊,保存至預測資訊用記憶體115中。接下來,預測資訊編碼器116係在步驟S161中判定對象編碼區塊內的所有預測區塊之編碼是否結束(是否為(i=N-1),若i=N-1時,則結束該對象編碼區塊的預測資訊編碼處理,若i<N-1時,則在步驟S162中將i予以更新(i=i+1),為了下個預測區塊的運動資訊編碼處理而返回步驟S152。
如此,由於可使用下記的資訊而事前選出預測區塊之 區塊合併時所使用的運動資訊之候補,因此可效率良好地傳輸區塊合併資訊。
1)對象編碼區塊內的已編碼/已解碼預測區塊之數目
2)對象編碼區塊的預測區塊分割類型
4)對象編碼區塊內的已編碼/已解碼預測區塊的運動資訊
5)對象預測區塊所相鄰之區塊的運動資訊與預測模式(畫面內預測/畫面間預測)
圖5係本實施形態所述之影像預測編碼裝置100中的影像預測編碼方法的流程圖。首先,在區塊分割器102中,將輸入影像分割成16x16的編碼區塊(亦可分割成其他大小或形狀之區塊。又,亦可在畫面內混合有尺寸不同的區塊)。然後,預測區塊分割類型選擇器113與運動資訊推定器114,係決定要作為編碼對象之對象編碼區塊的預測區塊分割類型與各預測區塊的運動資訊(步驟S101)。接著,預測資訊編碼器116係將預測資訊予以編碼(步驟S102、圖4)。
接著,在預測訊號生成器103中,基於對象編碼區塊的預測區塊分割類型與各預測區塊的運動資訊,生成對象編碼區塊的預測訊號,表示對象編碼區塊的像素訊號與預測訊號之差分的殘差訊號,係被轉換器106、量化器107及量化轉換係數編碼器111進行轉換編碼(步驟S103)。然後,預測資訊與量化轉換係數的編碼資料,係透過輸出端子112而被輸出(步驟S104)。
為了將後續的對象編碼區塊進行預測編碼,在這些處理之後或平行於這些處理而被編碼之殘差訊號,係被逆量化器108及逆轉換器109所解碼。然後,在加算器110中,已被解碼之殘差訊號與預測訊號會被加算,對象編碼區塊之訊號會被再生。再生訊號係被當成參照影像而記憶在畫格記憶體104中(步驟S105)。然後,當所有的對象編碼區塊之處理尚未完成時,處理係返回步驟S101,對下一對象編碼區塊進行處理。若所有的對象編碼區塊之處理都完成時,則結束處理(步驟S106)。
接著說明一實施形態所述之影像預測解碼。圖6係一實施形態所述之影像預測解碼裝置200的區塊圖。該影像預測解碼裝置200係具備:輸入端子201、資料解析器202、逆量化器203、逆轉換器204、加算器205、輸出端子206、量化轉換係數解碼器207、預測資訊解碼器208、畫格記憶體104、預測訊號生成器103、預測資訊用記憶體115。
逆量化器203、逆轉換器204、及量化轉換係數解碼器207,係成為殘差訊號解碼手段而發揮機能。逆量化器203及逆轉換器204所構成之解碼手段,係亦可採用這些東西以外的構成來為之。又,亦可沒有逆轉換器204。又,預測資訊用記憶體115與預測資訊解碼器208,係成為預測資訊解碼手段而發揮機能。
輸入端子201,係將已被上述影像預測編碼方法所壓縮編碼過的壓縮資料,進行輸入。該壓縮資料中係含有, 針對已被複數分割之編碼區塊,將誤差訊號予以轉換量化而進行熵編碼所生成之量化轉換係數之資訊、用來生成區塊之預測訊號所需之預測資訊的編碼資料。此處,在預測資訊中,係除了含有對象編碼區塊的預測區塊分割類型、預測區塊的運動資訊以外,還含有為了使用區塊合併之候補的運動資訊來實施區塊合併所需的區塊合併資訊。又,運動資訊中係含有:運動向量、畫面間預測模式(前方/後方/雙向)、參照畫面編號等。
資料解析器202,係將已被輸入至輸入端子201的壓縮資料加以解析,關於解碼對象的對象編碼區塊,分離成量化轉換係數的編碼資料、預測資訊的編碼資料,經由訊號線L202a、訊號線L202b,而分別輸出至量化轉換係數解碼器207、預測資訊解碼器208。
預測資訊解碼器208,係將各預測區塊的區塊合併時所使用的運動資訊之候補加以選出,並且還將附隨於對象編碼區塊的預測資訊的編碼資料,進行熵解碼。已被解碼之預測資訊係經由訊號線L208a、訊號線L208b,而分別被輸出至預測資訊用記憶體115與預測訊號生成器103。預測資訊用記憶體115,係將所被輸入之預測資訊,加以保存。關於預測資訊解碼器208的處理將於後述。
在預測訊號生成器103中,係基於經由線L208a所輸入的對象編碼區塊的預測資訊,而從畫格記憶體104取得已再生訊號,生成對象編碼區塊內的各預測區塊的預測訊號。所被生成之預測訊號,係經由訊號線L103而被輸出 至加算器205。
量化轉換係數解碼器207,係將對象編碼區塊中的殘差訊號之量化轉換係數的編碼資料進行熵解碼,經由訊號線L207而輸出至逆量化器203。
逆量化器203,係將經由訊號線L207所輸入之對象編碼區塊的殘差訊號資訊,進行逆量化。逆轉換器204,係將逆量化後的資料,進行逆離散餘弦轉換。
加算器205,係將預測訊號生成器103所生成的預測訊號,加算至逆量化器203及逆轉換器204所復原出來的殘差訊號,將對象編碼區塊的再生像素訊號,經由訊號線L205而輸出至輸出端子206及畫格記憶體104。輸出端子206,係往外部(例如顯示器)進行輸出。
畫格記憶體104,作為下個解碼處理所需的參照用再生影像,而將從加算器205所輸出的再生影像,當作參照畫面而加以記憶。
圖7係實現圖3之處理的預測資訊解碼器208的流程圖。
首先,預測資訊解碼器208,係將對象編碼區塊的預測區塊分割類型予以解碼,保存至預測資訊用記憶體115中。同時,預測資訊解碼器208係基於已解碼之預測區塊分割類型而設定對象編碼區塊內的預測區塊數N,將對象預測區塊編號i重置成0(步驟S251)。接著,預測資訊解碼器208,係判斷對象預測區塊是否為對象編碼區塊內最後被解碼的預測區塊,且對象編碼區塊內的預測區塊數 是否為2以上(步驟S252)。例如,若N=2,則i=1時,判定為可,處理係前進至步驟S258。若N=4(圖20的(D)),則i=3時,判定為可。若判定為否,則處理係前進至步驟S253。在圖3中,當對象預測區塊是預測區塊T1時則處理係前進至步驟S253,當對象預測區塊是預測區塊T2時則處理係前進至步驟S258。
在步驟S253中,合併識別資訊會被解碼。此處,若合併識別資訊是可(merge_flag=1)時,則合併識別資訊係表示,使用運動資訊之候補來生成對象預測區塊的預測訊號。另一方面,若合併識別資訊是否(merge_flag=0)時,則表示使用已解碼之運動資訊來生成對象預測區塊的預測訊號。在之後的步驟S254中,預測資訊解碼器208係判定合併識別資訊是否指示運動資訊之解碼,亦即merge_flag的值是否為0。若已解碼之merge_flag的值是0,則預測資訊解碼器208係將用來生成對象預測區塊的預測訊號所需的運動資訊予以解碼(步驟S257),處理係前進至步驟S267。若merge_flag的值是1,則預測資訊解碼器208係於步驟S266中,判定區塊合併時所使用之運動資訊之候補的數目是否為2個,若候補之數目為2個時,則將合併區塊選擇資訊予以解碼,處理係前進至步驟S256(步驟S255)。若對象預測區塊的區塊合併時所用的運動資訊之候補之數目為1個時,則處理係前進至步驟S256。在步驟S256中,若運動資訊之候補之數目為1個時,則預測資訊解碼器208係將該運動資訊決定成對象預 測區塊的運動資訊。若運動資訊之候補之數目為2個時,則預測資訊解碼器208係將合併區塊選擇資訊所指示的相鄰區塊的運動資訊,決定成對象預測區塊的運動資訊。
在步驟S258中,預測資訊解碼器208係判定,對象編碼區塊的所有已解碼運動資訊與不屬於對象編碼區塊的相鄰區塊的運動資訊,是否一致。該步驟S258之說明係意味著,若N=2,則將圖3所示的預測區塊T1與相鄰區塊D的運動資訊,進行比較。又,此步驟S258之說明係意味著,若N=4(圖20的(D)),則對象預測區塊係為右下的分割區塊,而將其以外的3個預測區塊(左上、右上、左下)的運動資訊,進行比較。當判定為可(所比較之運動資訊為一致)時,則如圖3的(B)之例子所示,由於對象預測區塊的區塊合併時所使用的運動資訊之候補的數目為0個,因此預測資訊解碼器208係不解碼區塊合併資訊,而將對象預測區塊的預測訊號生成時所用的運動資訊予以解碼,處理係前進至步驟S267(步驟S262)。另一方面,若判定為否(所比較之資訊為不一致)時,則處理係前進至步驟S265。此外,當N=4時,則對象編碼區塊內的右上與左下之區塊的運動資訊,就成為對象預測區塊的相鄰區塊。因此,3個預測區塊(左上、右上、左下)的運動資訊一致時就對對象預測區塊(右下)適用區塊合併,這就意味著對象編碼區塊內的4個預測區塊的運動資訊是全部以同樣之運動資訊而被生成。因此,N=4且3個預測區塊(左上、右上、左下)的運動資訊為相同 時,則將對象預測區塊(右下)的運動資訊之候補視為0個。
在步驟S265中,預測資訊解碼器208係判定對象編碼區塊的預測區塊分割類型是否為2分割之類型,若判定為否則處理係前進至步驟S253(之後的說明係省略)。若步驟S265之判定為可時,則處理係前進至步驟S259,預測資訊解碼器208係將合併識別資訊予以解碼。此情況下,如圖3的(A)之例子所示,由於對象預測區塊之區塊合併時所使用的運動資訊之候補之數目為1個,因此不需要解碼合併區塊選擇資訊。
在之後的步驟S260中,預測資訊解碼器208係判定合併識別資訊是否指示運動資訊之解碼,亦即merge_flag的值是否為0。若已解碼之merge_flag的值是0,則預測資訊解碼器208係將用來生成對象預測區塊的預測訊號所需的運動資訊予以解碼(步驟S262),處理係前進至步驟S267。若merge_flag的值為1,則處理係前進至步驟S261。在步驟S261中,由於運動資訊之候補係為1個,因此如圖3的(A)所示,預測資訊解碼器208係將相鄰區塊D的運動資訊決定成對象預測區塊的運動資訊,處理係前進至步驟S267。
在步驟S267中,係將已復原之預測區塊的運動資訊,保存至預測資訊用記憶體115中。接下來,在步驟S263中,預測資訊解碼器208係判定對象編碼區塊內的所有預測區塊之解碼是否結束(是否為(i=N-1),若 i=N-1時,則結束該對象編碼區塊的預測資訊解碼處理,若i<N-1時,則在步驟S264中將i予以更新(i=i+1),為了下個預測區塊的運動資訊解碼處理而返回步驟S252。
接著,使用圖8來說明圖6所示之影像預測解碼裝置200中的影像預測解碼方法。首先,透過輸入端子201,壓縮資料係被輸入(步驟S201)。然後,在資料解析器202中進行壓縮資料的資料解析,將關於解碼對象之對象領域的預測資訊與量化轉換係數的編碼資料,予以抽出。預測資訊係在預測資訊解碼器208中被解碼(S203)。
其後,基於已復原之預測資訊,預測訊號生成器103係生成對象編碼區塊的預測訊號(S204)。
已被量化轉換係數解碼器207所解碼之量化轉換係數,係於逆量化器203中被逆量化,於逆轉換器204中進行逆轉換,生成再生殘差訊號(S205)。然後,所生成的預測訊號和再生殘差訊號會被加算而生成再生訊號,該再生訊號係為了用來再生下一對象編碼區塊,而被儲存在畫格記憶體104中(步驟S206)。當有下一筆壓縮資料時,則重複S204~S206之處理程序(S207),直到所有資料都被處理到最後為止。
目前為止雖然是以預測區塊所相鄰之相鄰區塊的數目是2個以下的例子來說明,但接下來是針對預測區塊的上面與左邊之區塊交界所銜接之相鄰區塊的數目為3個以上的情況。
在圖3的例子中,雖然銜接於預測區塊的相鄰區塊係為2個,但隨著編碼區塊與其相鄰區塊之預測區塊分割類型的組合,也會發生預測區塊是與2個以上相鄰區塊銜接之情形。圖9係圖示了,預測區塊有3個相鄰區塊銜接時的例子。此處雖然以圖20的區塊301為例子來說明,但以區塊302、304、305、306、307也可同樣地說明。
在圖9的(A)與(B)中,對象編碼區塊400是具有將該當區塊400縱向2分割而成的2個預測區塊,相對於此,預測區塊T1的左邊所銜接之區塊401係被橫向2分割(分割成上下二個區塊)。因此,預測區塊T1係與3個相鄰區塊A與B與C銜接。此時,若能在編碼側與解碼側中預先決定好,以對象預測區塊之左上頂點所銜接的2個相鄰區塊A與B為代表,則相鄰區塊之數目可限定成必為2個,因此可以利用上記所說明的手法。
另一方面,如圖9的(B)所示,亦可利用,將預測區塊T1配合著相鄰區塊401之預測區塊分割類型而假想地進行橫向2分割之手法。此時,將對象預測區塊T1分割成T1a與T1b,使用屬於相鄰區塊A與區塊C的2個運動資訊而分別生成區塊T1a的預測訊號與T1b的預測訊號。
此時,若將合併區塊選擇資訊的選擇候補,設成圖9的(A)的相鄰區塊B的運動資訊、和圖9的(B)的相鄰區塊A與C的運動資訊之組合的2個,則不必變更區塊合併資訊的構成,合併區塊選擇資訊就能被高效率地進 行編碼。
另一方面,以合併區塊選擇資訊來識別圖9的(A)和圖9的(B)之哪一者,在選擇了圖9的(B)時,亦可還每一假想區塊地傳輸第2合併識別資訊,以相鄰區塊的運動資訊來生成假想區塊的預測訊號,或識別是否將運動資訊進行編碼/解碼。
此外,亦可不分割預測區塊T1,將預測區塊T1中的合併區塊選擇資訊的選擇候補設成相鄰區塊A與B與C之3個運動資訊,從3個之中選擇出T1的預測訊號之生成時所使用的運動資訊,但此情況下需要下記的變更。
1.在圖4的步驟S164與圖7的步驟S266之前,追加「取得相鄰區塊的預測區塊分割類型,導出預測區塊所相鄰的區塊數」之流程。
2.將圖4的步驟S164與圖7的步驟S266變更成「選擇候補的運動資訊是2個以上」。
3.合併區塊選擇資訊係擴充成從3個以上之候補選擇出1個的資訊。
該圖9的(A)與(B)所示的區塊合併的處理,係可藉由將圖7之步驟S256擴充成圖11所示之處理,而實現之。首先,在步驟S256a中,取得對象預測區塊所銜接之編碼區塊的預測區塊分割類型。接著在步驟S256b中,已被解碼之合併區塊選擇資訊所指示的區塊交界所相鄰的預測區塊之數目M,係根據已取得之預測區塊分割類型而導出。例如,在圖9的(B)中,M=2。然後在步驟 S256c中,係判斷M的值是否大於1(M>1)。若M>1,則將對象預測區塊分割成M個假想區塊,設定成將M個相鄰區塊之運動資訊予以分割而成的M個假想區塊(亦可追加,每一假想區塊地送出合併識別資訊,判定是否要解碼運動資訊)。若M=1,則在對象預測區塊的運動資訊中,設定會成為區塊合併之候補的相鄰區塊的運動資訊。
若如此依據圖7和圖11,則圖9之例子中的運動資訊之候補的選出,是基於以下的資訊而實施。
1)對象編碼區塊內的已編碼/已解碼預測區塊之數目
2)對象編碼區塊的預測區塊分割類型
3)對象預測區塊所相鄰之區塊的預測區塊分割類型
如此,在運動資訊之候補為3個以上的案例中,圖3之例子所致之運動資訊之候補的選出之際所未用到的3)之資訊,會被利用。
圖9的(C)係圖示了,在預測區塊400的左邊所相鄰的區塊是被非對稱地2分割之例子。此時也是可以利用,將預測區塊T1配合著相鄰區塊401之預測區塊分割類型而假想地進行橫向2分割(分割成區塊T1a及T1b)之手法。亦即,可將圖9的(C)的相鄰區塊A與C的運動資訊之組合,當成預測區塊T1的區塊合併的運動資訊之候補,而生成對象預測區塊T1的預測訊號。
又,即使如圖9的(D)~(F)所示般地編碼區塊之預測區塊分割類型是如圖20的區塊300所示般地預測區塊數是1個的類型的情況下,仍可利用配合著相鄰區塊 401的預測區塊分割類型而將預測區塊T1(區塊400)假想地橫分割(分割成縱向並排的複數區塊)而生成預測訊號之手法。甚至雖然未圖示,但當相鄰區塊402是被縱分割(分割成橫向並排的複數區塊)的情況下,係可利用配合著相鄰區塊402的預測區塊分割類型而將預測區塊T1(區塊400)假想地縱分割而生成預測訊號之手法。
此外,即使當預測區塊所相鄰之區塊中含有畫面內預測區塊(intra)時,仍可藉由事先制定規則,而利用將預測區塊進行假想分割以生成預測訊號的手法。圖10的(A)~(F)係圖示了,預測區塊之左邊所銜接的複數相鄰區塊A與C與E與G中,含有畫面內預測區塊(intra)時的例子。基於相鄰區塊的預測區塊分割類型與預測資訊中所含之預測模式(畫面間/畫面內),將相鄰區塊的畫面內預測區塊假想地整合成伴隨運動資訊的畫面間預測區塊(圖面的粗線)。在此例中,畫面內預測區塊係被假想地整合至靠近相鄰區塊之左上頂點且距離最近的畫面間預測區塊。其結果為,預測區塊T1,係如圖10的(A)~(F)所示,隨著相鄰區塊內的畫面間預測區塊的數目而被假想地分割。如此,即使在相鄰區塊中含有畫面內預測區塊(intra)的情況下,仍可使用相鄰區塊內的畫面間預測區塊之運動資訊來實施區塊合併所致之預測訊號的生成。
此外,將相鄰區塊的畫面內預測區塊整合至畫面間預測區塊的規則並沒有被限定。亦可準備此種複數的規則, 對每一畫格或每一切片地選擇規則來進行編碼。
此時,運動資訊之候補的選出,係基於以下資訊而實施。
1)對象編碼區塊內的已編碼/已解碼預測區塊之數目
2)對象編碼區塊的預測區塊分割類型
3)對象預測區塊所相鄰之區塊的預測區塊分割類型
5)對象預測區塊所相鄰之區塊的預測模式(畫面內預測/畫面間預測)
圖12係圖示了,編碼區塊400與相鄰區塊402是同樣被縱向2分割,但分割形狀不同的例子。在此例中也是,圖12的(A)的預測區塊T1(含有區塊T1a及T1b的區塊)與圖12的(B)的預測區塊T2(含有區塊T2a及T2b的區塊),是具有3個相鄰區塊。關於圖12的(A)的T1,係藉由將圖11的處理流程適用於圖7的步驟S256中,就可對於將預測區塊T1假想縱向2分割的T1a與T1b,分別實施已設定區塊Ba與Bb之運動資訊的區塊合併。又,關於圖12的(B)的T2,係藉由將以下說明之圖13的處理流程適用於圖7的步驟S261中,就可對於將預測區塊T2假想縱向2分割的T2a與T2b,分別實施已設定區塊Ba與Bb之運動資訊的區塊合併。此時,亦可識別是否每一假想區塊地傳輸第2合併識別資訊並以相鄰區塊的運動資訊來生成假想區塊的預測訊號,是否將運動資訊予以編碼/解碼。
此外,雖然亦可不分割預測區塊T2,將預測區塊T2的區塊合併時所使用的運動資訊之候補設為區塊Ba之運 動資訊與區塊Bb之運動資訊這2個,將區塊Ba之運動資訊及區塊Bb之運動資訊當中之一者選擇成為T2的預測訊號生成時所使用的運動資訊,但該情況下,圖7的流程必須要擴充如下。
1.在圖4的步驟S158與圖7的步驟S259之後,追加「取得相鄰區塊的預測區塊分割類型,導出預測區塊所相鄰的區塊數」之流程。
2.將圖4的步驟S159與圖7的步驟S260變更成「選擇候補的運動資訊是2個以上」。
3.在圖4的步驟S159與圖7的步驟S260之後,追加進行區塊選擇資訊之編碼/解碼步驟。
以下,說明圖13的流程。在圖13中,首先,在步驟S261a中,取得對象預測區塊所銜接之編碼區塊的預測區塊分割類型。接下來在步驟S261b中,將不屬於對象編碼區塊的相鄰區塊所銜接之區塊交界所相鄰之預測區塊的數目M,根據已取得之預測區塊分割類型而予以導出。例如,在圖12的(B)所示的情況下,M=2。然後在步驟S261c中,係判斷M的值是否大於1(M>1)。若M>1,則將對象預測區塊分割成M個假想區塊,設定成將M個相鄰區塊之運動資訊予以分割而成的M個假想區塊(亦可追加,每一假想區塊地送出合併識別資訊,判定是否要解碼運動資訊)。若M=1,則作為對象預測區塊的運動資訊,係設定會成為區塊合併之候補的相鄰區塊的運動資訊。
若如此依據圖12和圖13,則圖11之例子中的運動資訊之候補的選出,是基於以下的資訊而實施。
1)對象編碼區塊內的已編碼/已解碼預測區塊之數目
2)對象編碼區塊的預測區塊分割類型
3)對象預測區塊所相鄰之區塊的預測區塊分割類型
此外,在圖11中雖然說明了縱分割的例子,但在如圖20的區塊306與307那樣橫分割(分割成縱向並排之複數區塊)的例子中,也可適用同樣的處理。
甚至可作下記的變形。
(運動資訊之候補)
在上述說明中,雖然是將預測區塊的上邊和左邊所銜接之區塊的運動資訊當成區塊合併的候補,但亦可如圖14的(A)及(B)以及圖15的(A)所示,基於對象編碼區塊與相鄰區塊的預測區塊分割類型,而設下限制。圖14的(A)與(B)係圖示了,當有2個相鄰區塊存在時,將預測區塊的上邊與左邊當中有2個以上相鄰區塊銜接的邊的相鄰區塊的運動資訊,從區塊合併之候補中排除的例子。此情況下,由於不需要合併區塊選擇資訊的編碼,因此可削減附加資訊。圖14的(A)的預測區塊T1與圖14的(B)的預測區塊T1的區塊合併時所使用的運動資訊之候補,係分別確定為區塊B與區塊A的運動資訊。
圖15的(A)係圖示了,根據對象編碼區塊的預測區 塊分割類型,自動地選出預測區塊T1與T2的區塊合併時所使用之運動資訊之候補的手法。
圖15的(B)係圖示了,隨著對象編碼區塊的預測區塊分割類型與對象編碼區塊內的已編碼/已解碼區塊之數目,而將適用區塊合併的預測區塊加以限制的例子。在圖3所示的例子中,當區塊T1與區塊D的運動資訊一致時,從區塊T2的區塊合併時所使用的運動資訊之候補中將區塊D的運動資訊予以排除,但在圖15的(A)所示的例子中,係沒有比較區塊T1與區塊D的運動資訊,根據對象編碼區塊內的已編碼/解碼預測區塊之數目,將區塊D從區塊合併的候補中排除。如此,亦可根據在對象編碼區塊中進行編碼的運動向量之數目,來限制適用區塊合併的預測區塊。
甚至,亦可隨著預測區塊之左上端所銜接的2個相鄰區塊的區塊尺寸與預測區塊的區塊尺寸,來施加限制。例如,亦可當對象預測區塊的左邊所銜接之相鄰區塊的右邊的尺寸,是小於預先設定之大小(例如預測區塊的左邊之幅度的一半或1/4)時,則將該相鄰區塊的運動資訊從對象預測區塊的區塊合併之候補中予以排除。
如此,藉由限制運動資訊之候補,就可削減區塊合併資訊的代碼量。
(運動資訊之候補的選出)
運動資訊之候補的選出,係基於以下資訊而實施,但 其利用方法係不限定於上記所說明的方法。使用這些資訊來選出運動資訊之候補的手段,係可藉由圖1以及圖6的構成而實施。
1)對象編碼區塊內的已編碼/已解碼預測區塊之數目
2)對象編碼區塊的預測區塊分割類型
3)對象預測區塊所相鄰之區塊的預測區塊分割類型
4)對象編碼區塊內的已編碼/已解碼預測區塊的運動資訊
5)對象預測區塊所相鄰之區塊的運動資訊與預測模式(畫面內預測/畫面間預測)
(預測區塊的編碼)
在上述的說明中,編碼區塊內的預測區塊之編碼/解碼,係依照逐線掃描順序而實施,但上面所說明的區塊合併時所利用之運動資訊之候補的選出,係亦可適用於預測區塊是以任意順序而被編碼/解碼時。例如,在圖3的例子中,當對象編碼區塊400的預測區塊T2是先進行編碼/解碼時,預測區塊T2的運動向量,係不會被包含在預測區塊T1的區塊合併時所使用之運動資訊之候補中。
(區塊之形狀)
在上述說明中,雖然編碼區塊內的部分領域都是矩形,但亦可為任意形狀。此時,在編碼區塊的預測資訊中亦可含有形狀資訊。
(轉換器、逆轉換器)
殘差訊號的轉換處理,係可用固定的區塊尺寸來進行,也可配合部分領域而將對象領域予以再分割而進行轉換處理。
(預測資訊)
在上述的說明中,雖然以畫面間預測(利用運動向量與參照畫面編號的預測)來說明預測訊號之生成方法,但預測訊號之生成方法係不限定於此。包含畫面內預測、亮度補償等預測方法,也可適用於上述的預測訊號生成處理。此時,模式資訊或亮度補償參數等,係被包含在預測資訊中。
在圖10中,雖然將相鄰區塊內的畫面內預測區塊假想地整合至畫面間預測區塊,但亦可無關於相鄰區塊的預測模式,都將預測區塊予以假想地分割,以畫面內預測來預測預測區塊內的部分訊號。
(色彩訊號)
在上述的說明中,雖然沒有特別描述色彩格式,但關於色彩訊號或色差訊號,也是可和亮度訊號分開來個別進行預測訊號之生成處理。又,亦可與亮度訊號之處理連動而進行預測訊號之生成處理。
(區塊雜訊去除處理)
雖然上述說明中並未描述,但對再生影像進行區塊雜訊去除處理時,只要對部分領域的交界部分進行雜訊去除處理即可。在圖9、圖10、圖12所示的例子中,當將預測區塊予以假想地分割時,亦可對假想地分割的區塊的交界也適用區塊雜訊去除處理。
本實施形態所述之影像預測編碼方法及影像預測解碼方法,也可以程式的方式儲存在記錄媒體中來提供。作為記錄媒體則例如有,軟碟片(註冊商標)、CD-ROM、DVD、或ROM等記錄媒體,或是半導體記憶體等。
圖16係能夠執行影像預測編碼方法的程式之模組的區塊圖。影像預測編碼程式P100,係具備:區塊分割模組P101、運動資訊推定模組P102、預測訊號生成模組P103、記憶模組P104、減算模組P105、轉換模組P106、量化模組P107、逆量化模組P108、逆轉換模組P109、加算模組P110、量化轉換係數編碼模組P111、預測分割類型選擇模組P112、預測資訊記憶模組P113、及預測資訊編碼模組P114。藉由電腦執行上記各模組所實現的機能,係和上述影像預測編碼裝置100的機能相同。亦即,區塊分割模組P101、運動資訊推定模組P102、預測訊號生成模組P103、記憶模組P104、減算模組P105、轉換模組P106、量化模組P107、逆量化模組P108、逆轉換模組P109、加算模組P110、量化轉換係數編碼模組P111、預測分割類型選擇模組P112、預測資訊記憶模組P113、預 測資訊編碼模組P114,係令電腦執行分別與區塊分割器102、運動資訊推定器114、預測訊號生成器103、畫格記憶體104、減算器105、轉換器106、量化器107、逆量化器108、逆轉換器109、加算器110、量化轉換係數編碼器111、預測區塊分割類型選擇器113、預測資訊用記憶體115、預測資訊編碼器116相同的機能。
又,圖17係能夠執行影像預測解碼方法的程式之模組的區塊圖。影像預測解碼程式P200,係具備:量化轉換係數解碼模組P201、預測資訊解碼模組P202、預測資訊記憶模組P113、逆量化模組P206、逆轉換模組P207、加算模組P208、預測訊號生成模組P103及記憶模組P104。
藉由執行上記各模組所實現的機能,係和上述影像預測解碼裝置200的各構成要素相同。亦即,量化轉換係數解碼模組P201、預測資訊解碼模組P202、預測資訊記憶模組P113、逆量化模組P206、逆轉換模組P207、加算模組P208、預測訊號生成模組P103、記憶模組P104,係令電腦執行分別與量化轉換係數解碼器207、預測資訊解碼器208、預測資訊用記憶體115、逆量化器203、逆轉換器204、加算器205、預測訊號生成器103、畫格記憶體104相同的機能。
如此構成的影像預測編碼程式P100或影像預測解碼程式P200,係被記憶在記錄媒體SM,在後述的電腦上執行。
圖18係將記錄媒體中所記錄之程式加以執行所需之電腦的硬體構成之圖示,圖19係將記錄媒體中所記憶之程式加以執行所需之電腦的斜視圖。此外,執行記錄媒體中所記憶之程式者係不限定於電腦,亦可為具備CPU而可進行軟體所致之處理或控制的DVD播放器、機上盒、行動電話等。
如圖19所示,電腦C10係具備:軟碟片驅動裝置、CD-ROM驅動裝置、DVD驅動裝置等讀取裝置C12、讓作業系統常駐的作業用記憶體(RAM)C14、用來記憶記錄媒體SM中所記憶之程式的記憶體C16、顯示器這類顯示裝置C18、屬於輸入裝置的滑鼠C20及鍵盤C22、進行資料收送用的通訊裝置C24、控制著程式之執行的CPUC26。電腦C10,係一旦記錄媒體SM被插入至讀取裝置C12,則從讀取裝置C12就可向記錄媒體SM中所儲存的影像預測編碼.解碼程式進行存取,藉由該當影像編碼或解碼程式,就可成為本實施形態所述之影像編碼裝置或影像解碼裝置而動作。
如圖18所示,影像預測編碼程式及影像解碼程式,係可以被重疊於載波之電腦資料訊號CW的方式,透過網路而提供。此時,電腦C10,係將通訊裝置C24所接收到的影像預測編碼程式或影像解碼程式,記憶在記憶體C16,就可執行該當影像預測編碼程式或影像預測解碼程式。
以下,再說明另一實施形態。圖24係一實施形態所 述之動態影像編碼裝置之構成的概略圖示。圖24所示的動態影像編碼裝置10,係具備:區塊分割器501、小區格生成器502、畫格記憶體503、運動偵測器504、預測訊號生成器505、運動預測器506、減算器507、殘差訊號生成器508、轉換器509、量化器510、逆量化器511、逆轉換器512、加算器513、及熵編碼器514。被輸入至該動態影像編碼裝置10的輸入映像訊號(動態影像訊號),係由畫格單位的影像訊號(以下稱作畫格影像訊號)的時間序列所構成。
區塊分割器501,係從經由訊號線L501所輸入之輸入映像訊號中,逐次選擇出要作為編碼處理之對象的畫格影像訊號、亦即輸入影像。區塊分割器501,係將輸入影像分割成複數區格、亦即區塊。區塊分割器501,係將複數區塊,逐次選擇成為編碼處理之對象區塊,將該當對象區塊的像素訊號(以下稱作對象區塊訊號),經由訊號線L502而予以輸出。
在動態影像編碼裝置10中,係以區塊單位來進行以下的編碼處理。此外,區塊分割器501係例如可將輸入影像分割成8×8像素的複數區塊。然而,區塊的大小及形狀係亦可為任意。區塊係亦可為例如32×16像素的區塊、16×64像素的區塊。
小區格生成器502,係將經由訊號線L502所輸入之對象區塊,分切成複數小區格。圖25係用來說明小區格之生成的圖。如圖25所示,小區格生成器502,係藉由 式(1)的1次式所記載的直線Ln,而將對象區塊P分切成二個小區格SP1及SP2。
y=mx+k...(1)
例如,小區格生成器502,係可一面變更參數m及k,一面求出小區格SP1的預測訊號及小區格SP2的預測訊號,將使得小區格SP1的預測訊號與小區格SP1的影像訊號之間的誤差、及小區格SP2的預測訊號與小區格SP2的影像訊號之間的誤差呈最小的m及k,決定成為直線Ln的參數。
小區格生成器502,係將已決定的式(1)中的參數m及k,當作用來特定對象區塊P內的小區格之形狀所需的形狀資訊、亦即用來特定第1小區格SP1與第2小區格SP2之形狀所需的形狀資訊,而經由訊號線L504予以輸出。
此外,表示直線Ln的1次式係亦可為任意。例如,直線Ln係亦可表現如式(2)。
y=-x/tanθ+ρ/sinθ...(2)此情況下,形狀資訊係為θ與ρ。
又,形狀資訊係亦可為通過直線Ln的任意2點,例如亦可為表示直線與區塊P之交界的交點的資訊。又,區塊係不一定需要被直線所分切,亦可基於事先準備的複數圖案之中所選擇出來的圖案,來生成小區格。此情況下,可將用來特定所被選擇之圖案用的索引之類的資訊,當作形狀資訊來利用。
以下的說明中,是以對象區塊的最左上位置為原點的方式來設定座標,將包含有對象區塊P內的最左上像素之小區格稱作第1小區格,另一方稱作第2小區格。然而,亦可以任意的方法,例如將不包含對象區塊內之中心位置的小區格稱作第1小區格,另一方稱作第2小區格。此情況下,形狀資訊係亦可為區塊交界的焦點資訊或圖案的識別資訊。
畫格記憶體503,係將經由訊號線L505所輸入之已再生之影像訊號、亦即過去已編碼之畫格影像訊號(以下稱作參照畫格影像訊號),加以儲存。又,畫格記憶體503係經由訊號線L506而輸出參照畫格影像訊號。
運動偵測器504係將透過訊號線L502而輸入的對象區塊訊號、透過訊號線L504而輸入的區塊的形狀資訊、透過訊號線L506而輸入的參照畫格影像訊號,加以收取。運動偵測器504,係從參照畫格影像訊號的所定範圍內的影像訊號,探索出與處理對象之小區格之影像訊號類似的訊號,算出運動向量。該運動向量係為,具有與處理對象之小區格之影像訊號類似之像素訊號的參照畫格影像訊號內的領域、與對象區塊之間的空間性位移量。運動偵測器504,係將所算出的運動向量,經由訊號線L507而輸出。
此外,運動偵測器504係亦可同時偵測出關於對象區塊的運動向量,判斷是否將對象區塊分切成二個小區格而生成預測訊號。此判斷係亦可為,當對象區塊的預測訊號 與對象區塊的影像訊號之間的誤差,是小於該當對象區塊分切成二個小區格而生成之預測訊號與二個小區格的影像訊號之間的誤差時,則判斷為不將對象區塊分切成小區格。在進行如此判斷的情況下,可將表示判斷結果的資訊,編碼成區格可否資訊而加以編碼,只有當區格可否資訊是表示要將對象區塊分切成小區格時,才將形狀資訊加以編碼。
預測訊號生成器505,係從經由訊號線L506而被輸入之參照畫格影像訊號的所定範圍內的影像訊號,基於經由訊號線L507而被被輸入之運動向量與經由訊號線L504而被輸入之區塊的形狀資訊,生成出處理對象之小區格之影像訊號的預測訊號。
預測訊號生成器505,係藉由將對象區塊內的各小區格的預測訊號加以合成,以生成該當對象區塊的預測訊號。預測訊號生成器505,係將已生成的預測訊號,經由訊號線L508而輸出。此外,預測訊號係亦可取代畫面間預測而由畫面內預測來生成之。
運動預測器506,係基於經由訊號線L504所輸入之區塊之形狀資訊、經由訊號線L507所輸入之運動向量、及比處理對象之小區格之順序前面的區塊或小區格亦即已處理之部分領域的運動向量,而生成對象區塊內的處理對象之小區格的預測運動向量。運動預測器506,係將已生成之預測運動向量,經由訊號線L509而輸出。
運動預測器506,係可從複數預測運動向量之候補 中,選擇出一個預測運動向量。此情況下,運動預測器506係亦將用來特定已選擇之一個預測運動向量用的指示資訊,經由訊號線L510而輸出。此外,亦可藉由依照與解碼側共有的所定規則而將處理對象之小區格的預測運動向量之候補鎖定成一個,而省略指示資訊的輸出。
減算器507係從經由訊號線L507所輸入之處理對象之小區格的運動向量,減去經由訊號線L509所輸入之預測運動向量,以生成差分運動向量。減算器507,係將已生成之差分運動向量,經由訊號線L511而輸出。
殘差訊號生成器508,係從經由訊號線L502所輸入之對象區塊的訊號,減去經由訊號線L508所輸入之對象區塊之預測訊號,以生成殘差訊號。殘差訊號生成器508,係將已生成之殘差訊號,經由訊號線L512而輸出。
轉換器509,係將經由訊號線L512所輸入之殘差訊號,進行正交轉換,以生成轉換係數。轉換器509,係將已生成之轉換係數,經由訊號線L513而輸出。該正交轉換係可採用例如DCT。然而,被轉換器509所採用的轉換,係可採用任意之轉換。
量化器510,係將經由訊號線L513所輸入之轉換係數進行量化,以生成量化轉換係數。量化器510,係將已生成之量化轉換係數,經由訊號線L514而輸出。
逆量化器511,係將經由訊號線L514所輸入之量化轉換係數進行逆量化,以生成逆量化轉換係數。逆量化器511,係將已生成之逆量化轉換係數,經由訊號線L515而 輸出。
逆轉換器512,係將經由訊號線L515所輸入之逆量化轉換係數進行逆正交轉換,以生成再生殘差訊號。逆轉換器512,係將已生成之再生殘差訊號,經由訊號線L516而輸出。被逆轉換器512所採用的逆轉換,係為與轉換器509之轉換對稱的處理。
此外,轉換係並非必須,動態影像編碼裝置係亦可不具備轉換器509及逆轉換器512。同樣地,量化也並非必須,動態影像編碼裝置係亦可不具備量化器510及逆量化器511。
加算器513係藉由將經由訊號線L516所輸入之再生殘差訊號和經由訊號線L508所輸入之對象區塊之預測訊號,進行加算,以生成出再生影像訊號。加算器513,係將再生影像訊號當作已再生之影像訊號,經由訊號線L505而輸出。
熵編碼器514係將經由訊號線L514所輸入之量化轉換係數、經由訊號線L504所輸入之對象區塊之形狀資訊、經由訊號線L510所輸入之預測運動向量的指示資訊、經由訊號線L511所輸入之差分運動向量,予以編碼。又,熵編碼器514係將編碼所生成之代碼進行多工化以生成壓縮串流,並將該當壓縮串流予以輸出至訊號線L517。
熵編碼器514,係可使用算術編碼、行程長度編碼之類的任意編碼方法。又,熵編碼器514係可基於經由訊號 線L504而輸入的對象區塊的形狀資訊,將經由訊號線L510所輸入之預測運動向量的指示資訊進行算術編碼之際,適應性地決定其產生機率。例如,熵編碼器514係可將用來指示與處理對象之小區格銜接之部分領域之運動向量用的指示資訊的產生機率,設定得較高。
圖26係一實施形態的運動預測器之構成的圖示。如圖26所示,運動預測器506係具有:運動向量記憶體5061、運動參照候補生成器5062、及預測運動向量生成器5063。
運動向量記憶體5061,係為了將已處理之部分領域之運動向量加以儲存,並導出處理對象之小區格的預測運動向量,而將該當已編碼之運動向量,經由訊號線L5061而輸出。
運動參照候補生成器5062,係基於經由訊號線L504所輸入之形狀資訊,藉由後述的方法,根據經由訊號線L5061所輸入之部分領域的運動向量,而生成預測運動向量之候補。運動參照候補生成器5062,係將已生成之預測運動向量之候補,經由訊號線L5062而輸出。
預測運動向量生成器5063,係從經由訊號線L5062所輸入之預測運動向量之候補中,選擇出與處理對象之小區格之運動向量之差分呈最小的候補。預測運動向量生成器5063係將已選擇之候補當作預測運動向量,經由訊號線L509而輸出。又,將用來特定已選擇之候補用的指示資訊,經由訊號線L510而輸出。
此外,藉由將運動參照候補生成器中所生成之候補之數目限定成一個,就可省略指示資訊的輸出。雖然將候補之數目限定成一個的方法並沒有限制,但可利用例如使用三個候補之中間值的方法、使用二個候補之平均值的方法、預先決定好從複數候補中選擇一個所需之優先順位的方法這類任意的方法。
以下,說明動態影像編碼裝置10的動作,又,說明一實施形態所述之動態影像編碼方法。圖27係一實施形態所述之動態影像編碼方法的流程圖。
如圖27所示,在一實施形態中,首先,於步驟S501中,區塊分割器501係將輸入影像,分割成複數區塊。於後續的步驟S502中,小區格生成器502係如上述,將對象區塊分切成複數小區格。又,小區格生成器502,係如上述般地生成形狀資訊。
接下來,於步驟S503中,運動偵測器504係如上述,求出處理對象之小區格的運動向量。於後續的步驟S504中,預測訊號生成器505,係如上述,使用對象區塊內的各小區格的運動向量與參照畫格影像訊號,生成該當對象區塊的預測訊號。
接下來,於步驟S505中,運動預測器506係求出預測運動向量。又,運動預測器506係生成,用來特定從預測運動向量的複數候補中所選擇之候補所需的指示資訊。該步驟S505之處理細節,將於後述。於後續的步驟S506中,減算器507係如上述,求出各小區格的運動向量與預 測運動向量的差,而生成差分運動向量。
接著,於步驟S507中,殘差訊號生成器508係求出對象區塊的影像訊號與預測訊號的差,而生成殘差訊號。於後續的步驟S508中,轉換器509係將殘差訊號進行正交轉換,以生成轉換係數。於後續的步驟S509中,量化器510係將轉換係數予以量化,以生成量化轉換係數。於後續的步驟S510中,逆量化器511係將量化轉換係數予以逆量化,以生成逆量化轉換係數。於後續的步驟S511中,逆轉換器512係將逆量化轉換係數進行逆轉換,以生成再生殘差訊號。
接著,於步驟S512中,加算器513係將對象區塊的預測訊號和再生殘差訊號進行加算,以生成再生影像訊號。於後續的步驟S513中,再生影像訊號係被畫格記憶體503記憶成為已再生之影像訊號。
接著,於步驟S514中,熵編碼器514係將量化轉換係數、對象區塊的形狀資訊、預測運動向量的指示資訊、差分運動向量,予以編碼。
接著,於步驟S515中,判定所有的區塊是否都已處理。若並非所有區塊都已處理,則將未處理之區塊當作對象而繼續從步驟S502起之處理。另一方面,若全部的區塊之處理已經完成,則結束處理。
以下更詳細說明運動預測器506之動作。圖28係一實施形態所述之運動預測器之處理的流程圖。運動預測器506,係依照圖28所示的流程圖,將預測運動向量(以下 稱作PMV)、及用來特定PMV所需的指示資訊,予以輸出。
如圖28所示,在運動預測器506的處理中,首先,於步驟S505-1中,將計數器i的值設定成0。以下係為,當i=0時則進行針對第1小區格的處理,當i=1時則進行針對第2小區格的處理。
接著,於步驟S505-2中,從已處理之部分領域之運動向量,依照後述的方法,生成處理對象之小區格的PMV之候補。PMV之候補的數目,在本例中係為二個。亦即,作為PMV之候補,處理對象之小區格之左側的已處理之部分領域的運動向量及上側的已處理之部分領域的運動向量,是可被設定來作為處理對象之小區格的預測運動向量之候補。在步驟S505-2中,已被生成之候補的數目,係被設定成NCand。
接著,於步驟S505-3中,判定NCand是否為「0」。若NCand為「0」(Yes),則處理係前進至步驟S505-4。若NCand並非「0」(No),則處理係前進至步驟S505-5。
於步驟S505-4中,PMV係被設定成零向量,處理係前進至步驟S505-10。此時,PMV係亦可不是設定成零向量,而是被設定成預先決定之區塊的運動向量、或處理對象之小區格的前一個被處理之部分領域的運動向量等。
於步驟S505-5中,判定NCand是否為「1」。若NCand為「1」(Yes),則處理係前進至步驟S505-10。 若NCand並非「1」(No),則處理係前進至步驟S505-6。
在步驟S505-6中,從步驟S505-2所生成的PMV之候補中,選擇出PMV。作為PMV係可選擇,對處理對象之小區格之運動向量的差分呈最小的候補。
接著,於S505-7中係判定,步驟S505-6所選擇的PMV是否為左側的候補,亦即,是否為左側之部分領域的運動向量。若步驟S505-6中所選擇的PMV是左側的候補時(Yes),則處理係前進至步驟S505-8。若步驟S505-6中所選擇的PMV不是左側的候補時(No),則處理係前進至步驟S505-9。
於步驟S505-8中,用來指示把處理對象之小區格之左側部分領域的運動向量當成PMV用的指示資訊pmv_left_flag=1,係被輸出。另一方面,於步驟S505-9中,用來指示把處理對象之小區格之上側部分領域的運動向量當成PMV用的指示資訊pmv_left_flag=0,係被輸出。
接著,於步驟S505-10中,作為候補而剩下的PMV,係被輸出。於後續的步驟S505-11中,係對計數器i的值加算「1」。
接著,於步驟S505-12中,判定計數器i的值是否小於「2」。當計數器i的值小於「2」(Yes),則處理係前進至步驟S505-2。當計數器i的值並非小於「2」(No),則處理係結束。
此外,於步驟S505-2中,藉由將所生成之候補之數目限定成一個,就可省略步驟S505-5、S505-6、S505-7、S505-8、S505-9。該限定之方法雖然沒有限制,但可如上述預測運動向量生成器5063之說明,例如,可利用使用三個候補之中間值的方法、使用二個候補之平均值的方法、預先決定好從複數候補中選擇一個候補所需之優先順位的方法這類方法。在步驟S505-2中所生成之候補之數目被限定成一個的形態中,若步驟S505-3中NCand並非「0」(No),則處理係前進至步驟S505-10。
以下更詳細說明,於步驟S505-2中,處理對象之小區格的預測運動向量之候補之生成方法。圖29係對象區塊的小區格與周圍的部分領域之一例的圖示。
運動參照候補生成器5062,係如圖29所示,對第1小區格SP1參照部分領域U1及部分領域L1,當各個部分領域都是已經用畫格間預測而處理的情況下,則將該部分領域的運動向量,當作第1小區格SP1的預測運動向量之候補。同樣地,運動參照候補生成器5062,係對第2小區格參照部分領域U2或部分領域L2,生成第2小區格的預測運動向量之候補。此處,部分領域U1、L1、U2、L2,係為對象區塊P周圍的區塊或小區格,且是作為生成預測訊號之單位的領域。又,部分領域係亦可和生成預測訊號之單位無關地,是為了預測運動向量之候補生成所準備的區塊(例如藉由分切成單一形狀而被生成者)。
部分領域U1係為包含有,對第1小區格SP1之最左 上像素F(0、0)於上側相鄰的像素Pi1(0、-1)的部分領域,是銜接於小區格SP1的已處理之部分領域。又,部分領域L1係為包含有,對第1小區格SP1之最左上像素F(0、0)於左側相鄰的像素Pi2(-1、0)的部分領域,是銜接於第1小區格SP1的部分領域。部分領域U2係為對含有像素Pi3(x1、-1)之部分領域於右側銜接的部分領域,是銜接於x軸的部分領域。部分領域L2係為對含有像素Pi4(-1、y1)之部分領域於下側銜接的部分領域,是銜接於y軸的部分領域。
像素Pi3的x座標x1及像素Pi4的y座標y1,係可由式(3)及式(4)所算出。
x1=ceil(-k/m)...(3)
y1=ceil(k)...(4)式(3)及式(4)係對表示將第1小區格SP1與第2小區格SP2分切之交界的延長線Ln的1次式(1),分別代入y=0、x=0而成的值,適用ceil(z)函數而成。ceil(z)係被稱作天花板函數,是對實數z,導出z以上之最小整數用的函數。
此外,亦可取代ceil改用floor函數。floor(z)係被稱作地板函數,是對實數z,導出z以下之最大整數用的函數。
又,亦可藉由式(5)及(6)而算出x1及y1。
x1=ceil((-1-k)/m)...(5)
y1=ceil(-m+k)...(6) 式(5)及式(6),係對式(1)分別代入y=-1、x=-1而得到的值,適用ceil(z)函數而成。
部分領域U2及L2是否存在,係如以下說明來做判定。部分領域U2存在所需的條件係為位於畫面內,且滿足式(7)。又,部分領域L2存在所需的條件係為位於畫面內,且滿足式(8)。
0<x1...(7)
0<y1...(8)
若不滿足式(7)之條件,則第2小區格SP2與部分領域U2之間就會有部分領域L2存在。此情況下,相較於接近第2小區格SP2的部分領域L2,離第2小區格SP2較遠的部分領域U2具有接近於第2小區格SP2之運動向量的運動向量的可能性係較小。此種情況下,可藉由式(7)之條件,而將部分領域U2的運動向量,從預測運動向量之候補中排除。
同樣地,若不滿足式(8)之條件,則第2小區格SP2與部分領域L2之間就會有部分領域U2存在。此情況下,相較於接近第2小區格SP2的部分領域U2,離第2小區格SP2較遠的部分領域L2具有接近於第2小區格SP2之運動向量的運動向量的可能性係較小。此種情況下,可藉由式(8)之條件,而將部分領域U2的運動向量,從預測運動向量之候補中排除。
此外,在一例子中,亦可取代式(7)及式(8)之條件,改用以下的式(9)及式(10)所規定之條件。
0<x1<blocksizeX...(9)
0<y1<blocksizeY...(10)此處,blocksizeX及blocksizeY,係為對象區塊P的水平方向的像素數、垂直方向的像素數。例如,當對象區塊P是8×8像素的區塊時,則blocksizeX=8、blocksizeY=8。
藉由使用式(9)或式(10)之條件,就可在部分領域U2、部分領域L2當中,將未銜接第2小區格SP2的部分領域的運動向量,從預測運動向量之候補中排除。藉此,就會只剩下被認為預測精度較高的預測運動向量之候補。
藉由如此設定部分領域U1、L1、U2、L2,各小區格的預測運動向量之候補,係可根據相對於小區格間之交界延長線位於同側的已處理部分領域的運動向量,而被生成。
此外,小區格SP2的預測運動向量之候補,係只要能夠根據相對於含有小區格SP2與小區格SP2之對象區塊的與其他小區格之交界之延長線Ln而位於與小區格SP2同側之領域的部分領域之運動向量而被生成,則不限定於上述實施形態的預測運動向量的生成方法。例如,部分領域U2係亦可為含有像素Pi3的部分領域,部分領域L2係亦可為含有像素Pi4的部分領域。
又,亦可將部分領域之全體是位在相對於線Ln而與小區格SP2同側之領域這件事,當成將該當部分領域之運動向量加入小區格SP2之預測運動向量之候補的條件。此 情況下係可採用,例如,檢查部分領域之所有頂點位置之類的方法。
又,即使部分領域是相對於延長線而未被完全包含在與小區格同側之領域,亦可將該當部分領域之運動向量當作該當小區格之預測運動向量之候補來使用。圖30係對象區塊的小區格與周圍的部分領域之另一例的圖示。如圖30之一例所示,作為第1小區格SP1的預測運動向量之候補,係亦可使用部分領域RA、RB、RG、及RE的運動向量。又,亦可在第2小區格SP2的預測運動向量之候補中,追加部分領域RE的預測運動向量。
又,在關於圖28及圖29的說明中,雖然將成為預測運動向量之候補的運動向量之數目設成最大為二個,但亦可從藉由上述任一條件所求出的運動向量中,選擇出二個。例如,亦可將圖29所示的部分領域U2的運動向量、和相鄰於部分領域U2之部分領域的運動向量,當作預測運動向量之候補。同樣地,亦可將部分領域L2的運動向量、和相鄰於部分領域U2之部分領域的運動向量,當作預測運動向量之候補。甚至,亦可從藉由上述任一條件所特定之運動向量中,把三個以上的運動向量,當作預測運動向量之候補。甚至,亦可將複數預測運動向量之候補的平均值或中央值,加入預測運動向量之候補。
又,作為將圖28的步驟S505-2中所生成之預測運動向量之候補的數目限定為最大一個的方法,係可採用區格的形狀資訊。例如,在處理對象之小區格所銜接的編碼部 之部分領域當中,亦可將與該當小區格銜接之部分的長度為最大的部分領域的運動向量,當作預測運動向量之候補。又,亦可將距離處理對象之小區格的最小距離為最短的已編碼之部分領域的運動向量,當作該當小區格的預測運動向量之候補。
又,上述的預測運動向量之候補的生成方法,係可適用於任意形狀的小區格。圖31係對象區塊的小區格與周圍的部分領域之再另一例的圖示。圖31的(A)係圖示了,與圖29所示之線Ln係為y軸交叉之座標及斜率為不同的線Ln所劃分而成的小區格。圖31的(B)係圖示了,與圖29所示之線Ln係為斜率相對於y軸是略對稱且y軸交叉之座標為不同的線Ln所劃分而成的小區格。圖31的(C)係圖示了,藉由二條線Ln1及Ln2所劃分而成的小區格。又,圖31的(D)係圖示了,藉由彼此交叉的二條線Ln1及Ln2所劃分而成的小區格。即使以圖31的(A)~(D)所示的交界之延長線為基準,仍可將具有可能成為小區格SP2之預測運動向量之候補之運動向量的部分領域L2及U2,藉由上述預測運動向量之候補的生成方法,而加以特定。
又,小區格係並不僅限定於被直線分切的小區格。例如,在從預先決定之圖案之中選擇出小區格之形狀的情況下,仍可將相對於小區格間之交界延長線位於與處理對象之小區格同側之領域中所屬的已編碼之部分領域的運動向量,當作預測運動向量之候補而使用。此外,當小區格之 形狀的圖案是有被預先決定時,則亦可對各形狀圖案,預先決定帶有會成為預測運動向量之候補之此種運動向量的部分領域。該圖案中亦可包含有,將對象區塊分切成矩形的圖案。
又,上述的預測運動向量之選擇方法,係作為在使用已編碼之部分領域之運動向量而生成處理對象之小區格之預測訊號之際的運動向量之選擇方法來適用。亦即,亦可使用圖28的步驟S505-2中所選擇的預測運動向量,來生成處理對象之小區格的預測訊號。此情況下,由於不需要將差分運動向量進行編碼,因此從運動預測器506所輸出的預測運動向量,係不是輸出至減算器507而是輸出至預測訊號生成器505。
甚至,動態影像編碼裝置10係亦可判斷是否將差分運動向量進行編碼,將用來特定其判斷結果用的適用資訊,加以編碼。在此變形樣態中,運動預測器506係亦可含有,根據適用資訊,來切換是否將預測運動向量輸出至減算器507,還是輸出至預測訊號生成器505之機能。
此外,在此變形樣態中,由於對象區塊內的所有小區格的運動向量全部一樣,則對象區塊的分切就沒有意義,因此並非理想。亦即,在圖28的步驟S505-2中生成處理對象之小區格的運動向量之候補時,亦可將對象區塊中所包含之已編碼的小區格的運動向量,從候補中排除。例如,對象區塊是被分切成二個小區格,第1小區格之運動向量先被編碼的情況下,則第1小區格的運動向量係被從 第2小區格的預測運動向量之候補中排除。又,當第1小區格的運動向量、與部分領域U2的運動向量相同時,則亦可不將部分領域U2的運動向量,使用於第2小區格的預測運動向量之生成。
當有指示是否將差分運動向量進行編碼的情況下,則亦可將上記適用資訊進行算術編碼之際的產生機率,隨著小區格的形狀資訊而做適應性決定。例如,相較於表示不將第2小區格的差分運動向量進行編碼的適用資訊用之產生機率,可將表示不將第1小區格的差分運動向量進行編碼的適用資訊用之產生機率,設定得較高。這是因為,第2小區格有可能不與已編碼之部分領域銜接,另一方面,第1小區格係總是與已編碼之部分領域銜接,因此藉由如此設定產生機率,就可削減適用資訊的代碼量。
此處,為了簡化,參照將對象區塊分割成矩形之例子的圖32,說明一實施形態之效果。在此例中,對象區塊P係被直線Ln分切成左側的小區格SP1與右側的小區格SP2。在此例中,第1小區格SP1的運動向量與部分領域RB的運動向量,是成為第2小區格SP2的預測運動向量之候補。
在圖32所示的例子中,若使用第1小區格SP1的運動向量來生成第2小區格SP2的預測訊號,則第1小區格SP1的預測訊號與第2小區格SP2的預測訊號會是由同樣的運動向量所生成,將對象區塊分成二個小區格就沒有意義。因此,第2小區格SP2的預測訊號,係可使用該當小 區格SP2上側的部分領域RB的運動向量,而被生成。因此,編碼裝置與解碼裝置,在圖32所示的例子中,藉由預先決定好使用部分領域RB之運動向量來生成第2小區格SP2的預測訊號,就可減少預測運動向量之候補,就沒有必要發送出,用來從複數預測運動向量之候補中指示一個預測運動向量所需的指示資訊。
再來探討,動態影像編碼裝置10判斷差分運動向量可否編碼的方法(運動預測器506會基於適用資訊而切換將預測運動向量輸出至減算器507或輸出至預測訊號生成器505)。此時,若部分領域RB的運動向量是和第1小區格SP1的運動向量相同,則無論選擇二個預測運動向量之候補之哪一者,第2小區格SP2的預測運動向量都會和第1小區格SP1的運動向量相同。因此,編碼裝置與解碼裝置係當二個預測運動向量之候補為相同的情況下,則事前決定要以差分運動向量與預測運動向量進行加算而成的運動向量來生成第2小區格SP2的預測訊號,藉此,不只上記指示資訊,就連指示是否編碼差分運動向量的適用資訊,也變成沒有必要發送。
此外,如圖33所示,當對象區塊是被分切成3個以上時,若第1小區格SP1、第2小區格SP2、及第3小區格SP3是具有相同的運動向量,僅第4小區格SP4具有不同的運動向量,則對象區塊的分切就有意義。因此,此情況下,第2小區格SP2的預測訊號與第3小區格SP3的預測訊號,係亦可不是分別使用部分領域RB、部分領域RE 的運動向量,而是使用第1小區格SP1的運動向量來生成。但是,針對第4小區格SP4,係若第2小區格SP2的運動向量與第3小區格SP3的運動向量是相同,則二個預測運動向量之候補就變成相同,因此藉由預先在編碼裝置與解碼裝置上決定好規則,就不需要發送用來指示一個預測運動向量所需的指示資訊。甚至,當第1小區格SP1、第2小區格SP2、及第3小區格SP3是具有相同的運動向量時,若使用第2小區格SP2或第3小區格SP3的運動向量來生成第4小區格SP4的預測訊號,則由於四個區格全部具有相同的運動向量,因此藉由在編碼裝置與解碼裝置上預先決定好規則,就不只上記只是資訊,就連指示是否編碼差分運動向量的適用資訊,也變成沒有必要發送。
以下說明,一實施形態所述之動態影像解碼裝置。圖34係一實施形態所述之動態影像解碼裝置之構成的概略圖示。圖34所示的動態影像解碼裝置20,係可將已被動態影像編碼裝置10所生成之壓縮串流予以解碼而生成動態影像的裝置。
如圖34所示,動態影像解碼裝置20係具備:資料解碼器601、運動預測器602、加算器603、逆量化器604、逆轉換器605、畫格記憶體606、預測訊號生成器607、及加算器608。
資料解碼器601,係將經由訊號線L601所輸入之壓縮串流,加以解析。資料解碼器601,係關於解碼對象的區塊(以下稱作對象區塊),依序進行以下的處理。
資料解碼器601,係將壓縮串流內的對象區塊所關連之編碼資料予以解碼,將對象區塊的量化轉換係數予以復原,將該當量化轉換係數經由訊號線L602而輸出。又,資料解碼器601係將編碼資料予以解碼,將對象區塊的形狀資訊予以復原,將該當形狀資訊經由訊號線L603予以輸出。此時,用來指示是否分切對象區塊的區格可否資訊係被復原,當該當區格可否資訊是表示不分切對象區塊時,則形狀資訊係亦可不被復原。
又,資料解碼器601係藉由將編碼資料予以解碼,以復原對象區塊內的各小區格用的指示資訊、亦即在複數預測運動向量之候補當中指示一個的資訊,將該當指示資訊經由訊號線L604而輸出。又,資料解碼器601係藉由將編碼資料予以解碼,以復原對象區塊的差分運動向量,將該當差分運動向量經由訊號線L605予以輸出。又,資料解碼器601係可基於對象區塊的形狀資訊,而適應性地決定預測運動向量之指示資訊復原之際的編碼資料之解碼時的產生機率。作為該方法係例如,可提高把處理對象之小區格所銜接之部分領域之運動向量指示成為預測運動向量用的指示資訊的產生機率。
運動預測器602,係基於經由訊號線L603所輸入之形狀資訊、經由訊號線L606所輸入之處理順序較前之部分領域的運動向量、基於經由訊號線L604所輸入之指示資訊,而生成處理對象之小區格的預測運動向量,將該當預測運動向量經由訊號線L607而輸出。此外,亦可藉由 所定方法而將預測運動向量之候補鎖定成一個,而省略指示資訊的輸入。
加算器603係將經由L607所輸入之預測運動向量、與經由L605所輸入之差分運動向量,進行加算,生成對象區塊或該當對象區塊內的小區格之運動向量,將該當運動向量透過訊號線L606而輸出。
逆量化器604,係將經由訊號線L602所輸入之量化轉換係數進行逆量化,以生成逆量化轉換係數。逆量化器604,係將已生成之逆量化轉換係數,經由訊號線L608而輸出。
逆轉換器605,係將經由訊號線L608所輸入之逆量化轉換係數進行逆正交轉換,以生成再生殘差訊號。逆轉換器605,係將已生成之再生殘差訊號,經由訊號線L609而輸出。
此外,當已被生成之再生殘差訊號是未被量化時,則動態影像解碼裝置20係亦可不具備逆量化器604。同樣地,當已被生成之再生殘差訊號是未被轉換時,則動態影像解碼裝置20係亦可不具備逆轉換器605。
畫格記憶體606,係將經由訊號線L610所輸入之已再生之影像訊號、亦即處理順序比處理對象之輸入影像還要前面之畫格影像訊號(以下稱作參照畫格影像訊號),加以儲存。又,畫格記憶體606係經由訊號線L611,而輸出參照畫格影像訊號。
預測訊號生成器607,係從經由訊號線L611而被輸 入之參照畫格影像訊號的所定範圍內的影像訊號,基於經由訊號線L606而被被輸入之運動向量與經由訊號線L603而被輸入之區塊的形狀資訊,生成對象區塊內的各小區格的影像的預測訊號。預測訊號生成器607,係經由訊號線L612而輸出已生成之預測訊號。此外,雖然在本說明書中省略說明,但預測訊號係除了畫面間預測以外,亦可藉由畫面內預測來生成之。
加算器608係藉由將經由訊號線L609所輸入之再生殘差訊號、和經由訊號線L612所輸入之對象區塊之預測訊號,進行加算,以生成出再生影像訊號。加算器608係將再生影像訊號,經由訊號線L610而輸出。
圖35係一實施形態所述之運動預測器之構成的圖示。如圖35所示,運動預測器602係具有:運動向量記憶體6021、運動參照候補生成器6022、及預測運動向量生成器6023。
運動向量記憶體6021,係將經由訊號線L606所輸入之運動向量,予以儲存。被儲存在運動向量記憶體6021中的運動向量,係為處理順序比對象區塊或處理對象之小區格還要前面的已處理之部分領域的運動向量。運動向量記憶體6021,係將已儲存之運動向量,為了處理對象之小區格用的預測運動向量之導出,而經由訊號線L6021予以輸出。
運動參照候補生成器6022,係基於經由訊號線L603所輸入之形狀資訊,藉由後述的方法,根據經由訊號線 L6021所輸入之運動向量,而生成預測運動向量之候補,經由訊號線L6022而輸出。
預測運動向量生成器6023,係從經由訊號線L6022所輸入之預測運動向量之候補,基於經由訊號線L604所輸入之預測運動向量的指示資訊,決定預測運動向量,將已決定之預測運動向量,經由訊號線L607而輸出。此外,藉由將運動參照候補生成器中所生成之候補之數目限定成一個,就可省略用來特定所應選擇之候補用的指示資訊之輸入。
以下,說明動態影像解碼裝置20之動作,和一實施形態所述之動態影像解碼方法。圖36係一實施形態所述之動態影像解碼方法的流程圖。如圖36所示,於一實施形態中,係首先,於步驟S621中,資料解碼器601係如上述,關於對象區塊,將壓縮資料內的編碼資料予以解碼,將對象區塊的量化轉換係數、形狀資訊、及差分運動向量予以復原。又,步驟S621中,區格可否資訊及指示資訊可被復原。然後,於步驟S621中,逆量化器604係可根據已被復原之量化轉換係數而生成逆量化轉換係數,逆轉換器605係可根據逆量化轉換係數而生成再生殘差訊號。
接下來,於步驟S622中,運動預測器602係將對象區塊內的各小區格當作處理對象,求出處理對象之小區格的預測運動向量。於後續的步驟S623中,加算器603係藉由將處理對象之小區格的預測運動向量與差分運動向量 進行加算,以生成運動向量。
接著,於步驟S624中,預測訊號生成器607係使用對象區塊之運動向量,根據畫格記憶體606內的參照畫格影像訊號,而生成預測訊號。於後續的步驟S625中,加算器608係將對象區塊的預測訊號和再生殘差訊號進行加算,以生成再生影像訊號。
接著,於步驟S626中,已被步驟S625所生成之再生影像訊號,是被當成已再生之影像訊號而儲存至畫格記憶體606中。於後續的步驟S627中,判定是否對所有的區塊都已進行處理。若對所有區塊的處理尚未結束,則將未處理之區塊當作對象區塊而繼續從步驟S621起之處理。另一方面,若全部的區塊之處理已經完成,則結束處理。
以下詳細說明運動預測器602之動作。圖37係一實施形態所述之運動預測器之處理的流程圖。運動預測器602,係依照圖37所示的流程圖,而生成預測運動向量。
於一實施形態中,是在步驟S615-1中,計數器i的值被設定成「0」。以下係為,當i=0時則進行針對第1小區格的處理,當i=1時則進行針對第2小區格的處理。
接著,於步驟S615-2中,在處理順序比處理對象之小區格還前面之部分領域的運動向量當中,可能成為處理對象之小區格的預測運動向量的2個候補(左側之候補及上側之候補),是使用圖29、圖30、圖31、圖32、及圖33而依照上述方法而求出。
接著,於步驟S615-3中,判定步驟S615-2所生成之 候補的數NCand是否為「0」。若NCand為「0」(Yes),則處理係前進至步驟S615-4。若NCand並非「0」(No),則處理係前進至步驟S615-5。
於步驟S615-4中,預測運動向量PMV係被設定成零向量,處理係前進至步驟S615-11。此時,PMV係亦可不是設定成零向量,而是把預先決定之區塊的運動向量、或對於處理對象之小區格的處理順序為前一個之部分領域的運動向量,設定成為預測運動向量PMV。
於步驟S615-5中,判定步驟S615-2所生成之候補的數NCand是否為「1」。若NCand為「1」(Yes),則處理係前進至步驟S615-6。若NCand並非「1」(No),則處理係前進至步驟S615-7。
在步驟S615-6中,從步驟S615-2所生成的一個候補,係被設定成PMV。然後,處理係前進至步驟S615-11。
在步驟S615-7中係取得,用來指示從步驟S615-2所生成的候補中所應選擇之PMV所需之資訊pmv_left_flag。然後,處理係前進至步驟S615-8。
於步驟S615-8中,判定pmv_left_flag的值是否為「1」。若pmv_left_flag的值為「1」(Yes),則處理係前進至步驟S615-9。若pmv_left_flag的值不是「1」(No),則處理係前進至步驟S615-10。
於步驟S615-9中,處理對象之小區格之左側部分領域的運動向量,係被設定成PMV。然後,處理係前進至 步驟S615-11。
於步驟S615-10中,處理對象之小區格之左側部分領域的運動向量,係被設定成PMV。然後,處理係前進至步驟S615-11。
於步驟S615-11中,已被設定之PMV係被輸出。然後,處理係前進至步驟S615-12。
接著,於步驟S615-12中,係對計數器i的值加算「1」。然後,處理係前進至步驟S615-13。
接著,於步驟S615-13中,判定計數器i的值是否小於「2」。當計數器i的值小於「2」(Yes),則處理係前進至步驟S615-2。另一方面,當計數器i的值並非小於2(No),則處理係結束。
此外,於步驟S615-2中,藉由將所生成之預測運動向量之候補之數目限定成一個,就可省略步驟S615-5、S615-6、S615-7、S615-8、S615-9、S615-10之處理。該限定所需之方法係如上述預測運動向量生成器6023般地沒有限定,例如,可利用使用三個候補之中間值的方法、使用二個候補之平均值的方法、預先決定好從複數預測運動向量候補中選擇一個預測運動向量所需之優先順位的方法這類方法。此情況下,於步驟S615-03中,若NCand並非「0」(No),則處理係前進至步驟S615-6。
又,上述的方法係亦可當作在使用已編碼之運動向量而生成處理對象之小區格之預測訊號時的運動向量選擇方法來適用。亦即,亦可使用圖37的步驟S615-2中所選擇 的預測運動向量,來生成處理對象之小區格的預測訊號。此情況下,由於不需要將差分運動向量進行解碼,因此從運動預測器602所輸出的預測運動向量,係不是輸出至加算器603而是輸出至預測訊號生成器607。
甚至,亦可將用來特定是否解碼差分運動向量的適用資訊,在資料解碼器601中加以解碼。在此變形樣態中係可含有,運動預測器602是基於適用資訊來切換是否將預測運動向量輸出至加算器603,還是輸出至預測訊號生成器607之機能。
此外,在此變形樣態中,由於對象區塊內的所有小區格的運動向量全部一樣,則對象區塊的分切就沒有意義,因此並非理想。因此,在此變形樣態中,於圖37的步驟S615-2中生成處理對象之小區格的預測運動向量之候補之際,亦可為,對象區塊中所包含之小區格且處理順序比處理對象之小區格前面的小區格之運動向量,係從預測運動向量之候補中排除。例如,對象區塊是被分切成二個小區格,第1小區格之運動向量先被復原的情況下,則第1小區格的運動向量係被從第2小區格的預測運動向量之候補中排除。又,當第1小區格的運動向量、與部分領域U2的運動向量相同時,則亦可不將部分領域U2的運動向量,使用於第2小區格的預測運動向量之生成。
又,於此變形樣態中,可將指示是否解碼差分運動向量的適用資訊進行算術解碼之際的產生機率,按照形狀資訊而做適應性決定。作為該方法係例如,相較於未與已解 碼部分領域銜接之第2小區格,可以把總是與已編碼領域銜接的第1區格,將不編碼差分運動向量的機率設定得較高。此外,關於此變形樣態的效果,由於已經使用圖34與圖35說明過了,因此這裡省略之。
以下說明,使電腦成為動態影像編碼裝置10而動作所需的動態影像編碼程式、及使電腦成為動態影像解碼裝置20而動作所需的動態影像解碼程式。
圖38係一實施形態所述之動態影像編碼程式之構成的圖示。圖39係一實施形態所述之動態影像解碼程式之構成的圖示。以下,與圖38及圖39一起參照表示一實施形態所述之電腦之硬體構成的圖18、及表示一實施形態所述之電腦之斜視圖的圖19。
圖38所示的動態影像編碼程式P10,係可被儲存在記錄媒體SM中來提供。又,圖38所示的動態影像解碼程式P20也是,可被儲存在記錄媒體SM中來提供。此外,作為記錄媒體SM則例如有,軟碟片、CD-ROM、DVD、或ROM等記錄媒體,或是半導體記憶體等。
如上述,電腦C10係可具備:軟碟片驅動裝置、CD-ROM驅動裝置、DVD驅動裝置等讀取裝置C12、讓作業系統常駐的作業用記憶體(RAM)C14、用來記憶記錄媒體SM中所記憶之程式的記憶體C16、顯示器這類顯示裝置C18、屬於輸入裝置的滑鼠C20及鍵盤C22、進行資料收送用的通訊裝置C24、控制著程式之執行的CPU C26。
電腦C10,係一旦把記錄媒體SM插入至讀取裝置 C12,則從讀取裝置C12就可向記錄媒體SM中所儲存的動態影像編碼程式P10進行存取,藉由該當程式P10,就可成為動態影像編碼裝置10而動作。
又,電腦C10,係一旦記錄媒體SM被插入至讀取裝置C12,則從讀取裝置C12就可向記錄媒體SM中所儲存的動態影像解碼程式P20進行存取,藉由該當程式P20,就可成為動態影像解碼裝置20而動作。
如圖19所示,動態影像編碼程式P10及動態影像解碼程式P20,係可以被重疊於載波之電腦資料訊號CW的方式,透過網路而提供。此時,電腦C10,係將通訊裝置C24所接收到的動態影像編碼程式P10或動態影像解碼程式P20,儲存在記憶體C16,就可執行程式P10或P20。
如圖38所示,動態影像編碼程式P10係含有:區塊分割模組M101、小區格生成器模組M102、記憶模組M103、運動偵測模組M104、預測訊號生成模組M105、運動預測模組M106、減算模組M107、殘差訊號生成模組M108、轉換模組M109、量化模組M110、逆量化模組M111、逆轉換模組M112、加算模組M113、及熵編碼模組M114。
於一實施形態中,區塊分割模組M101、小區格生成器模組M102、記憶模組M103、運動偵測模組M104、預測訊號生成模組M105、運動預測模組M106、減算模組M107、殘差訊號生成模組M108、轉換模組M109、量化模組M110、逆量化模組M111、逆轉換模組M112、加算 模組M113、熵編碼模組M114,係令電腦C10執行分別與動態影像編碼裝置10的區塊分割器501、小區格生成器502、畫格記憶體503、運動偵測器504、預測訊號生成器505、運動預測器506、減算器507、殘差訊號生成器508、轉換器509、量化器510、逆量化器511、逆轉換器512、加算器513、熵編碼器514相同的機能。若依據所述之動態影像編碼程式P10,則電腦C10係可成為動態影像編碼裝置10而動作。
如圖39所示,動態影像解碼程式P20係含有:資料解碼模組M201、運動預測模組M202、加算模組M203、逆量化模組M204、逆轉換模組M205、記憶模組M206、預測訊號生成模組M207、及加算模組M208。
於一實施形態中,資料解碼模組M201、運動預測模組M202、加算模組M203、逆量化模組M204、逆轉換模組M205、記憶模組M206、預測訊號生成模組M207、加算模組M208,係令電腦C10執行分別與動態影像解碼裝置20的資料解碼器601、運動預測器602、加算器603、逆量化器604、逆轉換器605、畫格記憶體606、預測訊號生成器607、加算器608相同的機能。若依據所述之動態影像解碼程式P20,則電腦C10係可成為動態影像解碼裝置20而動作。
以上詳細說明了各種實施形態。可是,本發明係並非限定於上記實施施形態。本發明在不脫離其宗旨的範圍內,可作各種變形。
100‧‧‧影像預測編碼裝置
101‧‧‧輸入端子
102‧‧‧區塊分割器
103‧‧‧預測訊號生成器
104‧‧‧畫格記憶體
105‧‧‧減算器
106‧‧‧轉換器
107‧‧‧量化器
108‧‧‧逆量化器
109‧‧‧逆轉換器
110‧‧‧加算器
111‧‧‧量化轉換係數編碼器
112‧‧‧輸出端子
113‧‧‧預測區塊分割類型選擇器
114‧‧‧運動資訊推定器
115‧‧‧預測資訊用記憶體
116‧‧‧預測資訊編碼器
L101~L116‧‧‧訊號線

Claims (6)

  1. 一種影像預測編碼裝置,其特徵為,具備:領域分割手段,係將輸入影像分割成複數領域;和預測資訊推定手段,係將已被前記領域分割手段所分割之作為編碼對象之對象領域,小分割成第1預測領域和第2預測領域,將表示適合於前記對象領域的預測領域之數目與領域形狀的預測區塊分割類型,加以決定,將用來從已再生訊號中取得與前記第1、第2預測領域相關較高之訊號所需之第1、第2運動資訊,分別加以預測,並求出預測資訊其中含有:前記預測區塊分割類型、和前記第1、第2運動資訊、和第1合併識別資訊,其係用來表示,前記第1預測領域之預測訊號之生成時,是否利用該第1預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊、和第2合併識別資訊,其係用來表示,前記第2預測領域之預測訊號之生成時,是否利用該第2預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊之中的,前記第1預測領域之運動資訊除外之已解碼運動資訊;和預測資訊編碼手段,係將附隨於前記對象領域之預測資訊,加以編碼;和預測訊號生成手段,係基於前記第1運動資訊和前記第2運動資訊,而生成前記第1預測領域與第2預測領域之各自的預測訊號;和殘差訊號生成手段,係基於前記第1預測領域與第2 預測領域之各自的預測訊號與像素訊號,生成殘差訊號;和殘差訊號編碼手段,係將前記殘差訊號生成手段所生成的殘差訊號,加以編碼;和殘差訊號復原手段,係藉由將前記殘差訊號之編碼資料加以解碼,以生成再生殘差訊號;和記錄手段,係基於前記預測訊號與前記再生殘差訊號,以生成前記對象領域的復原像素訊號,將該復原像素訊號當作前記已再生訊號而加以保存。
  2. 一種影像預測編碼方法,係屬於被影像預測編碼裝置所執行之影像預測編碼方法,其特徵為,含有:領域分割步驟,係將輸入影像分割成複數領域;和預測資訊推定步驟,係將已被前記領域分割步驟所分割之作為編碼對象之對象領域,小分割成第1預測領域和第2預測領域,將表示適合於前記對象領域的預測領域之數目與領域形狀的預測區塊分割類型,加以決定,將用來從已再生訊號中取得與前記第1、第2預測領域相關較高之訊號所需之第1、第2運動資訊,分別加以預測,並求出預測資訊其中含有:前記預測區塊分割類型、和前記第1、第2運動資訊、和第1合併識別資訊,其係用來表示,前記第1預測領域之預測訊號之生成時,是否利用該第1預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊、和第2合併識別資訊,其係用來表示,前記第2預測領域之預測訊號之生成時,是否利用該第2預測領域所相 鄰之相鄰領域所附隨之已解碼運動資訊之中的,前記第1預測領域之運動資訊除外之已解碼運動資訊;和預測資訊編碼步驟,係將附隨於前記對象領域之預測資訊,加以編碼;和預測訊號生成步驟,係基於前記第1運動資訊和前記第2運動資訊,而生成前記第1預測領域與第2預測領域之各自的預測訊號;和殘差訊號生成步驟,係基於前記第1預測領域與第2預測領域之各自的預測訊號與像素訊號,生成殘差訊號;和殘差訊號編碼步驟,係將已被前記殘差訊號生成步驟所生成的殘差訊號,加以編碼;和殘差訊號復原步驟,係藉由將前記殘差訊號之編碼資料加以解碼,以生成再生殘差訊號;和記錄步驟,係基於前記預測訊號與前記再生殘差訊號,以生成前記對象領域的復原像素訊號,將該復原像素訊號當作前記已再生訊號而加以保存。
  3. 一種影像預測編碼程式,其特徵為,係用來使電腦發揮功能成為:領域分割手段,係將輸入影像分割成複數領域;和預測資訊推定手段,係將已被前記領域分割手段所分割之作為編碼對象之對象領域,小分割成第1預測領域和第2預測領域,將表示適合於前記對象領域的預測領域之數目與領域形狀的預測區塊分割類型,加以決定,將用來 從已再生訊號中取得與前記第1、第2預測領域相關較高之訊號所需之第1、第2運動資訊,分別加以預測,並求出預測資訊其中含有:前記預測區塊分割類型、和前記第1、第2運動資訊、和第1合併識別資訊,其係用來表示,前記第1預測領域之預測訊號之生成時,是否利用該第1預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊、和第2合併識別資訊,其係用來表示,前記第2預測領域之預測訊號之生成時,是否利用該第2預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊之中的,前記第1預測領域之運動資訊除外之已解碼運動資訊;和預測資訊編碼手段,係將附隨於前記對象領域之預測資訊,加以編碼;和預測訊號生成手段,係基於前記第1運動資訊和前記第2運動資訊,而生成前記第1預測領域與第2預測領域之各自的預測訊號;和殘差訊號生成手段,係基於前記第1預測領域與第2預測領域之各自的預測訊號與像素訊號,生成殘差訊號;和殘差訊號編碼手段,係將前記殘差訊號生成手段所生成的殘差訊號,加以編碼;和殘差訊號復原手段,係藉由將前記殘差訊號之編碼資料加以解碼,以生成再生殘差訊號;和記錄手段,係基於前記預測訊號與前記再生殘差訊號,以生成前記對象領域的復原像素訊號,將該復原像素 訊號當作前記已再生訊號而加以保存。
  4. 一種影像預測解碼裝置,其特徵為,具備:資料解析手段,係從被分割成複數領域而編碼的影像的壓縮資料之中,抽出用來指示在解碼對象之對象領域之訊號之預測時所使用之預測方法用的預測資訊的編碼資料、殘差訊號的編碼資料;和預測資訊解碼手段,係從前記預測資訊的編碼資料,復原出運動資訊,其中,該預測資訊解碼手段係:從前記預測資訊的編碼資料中,復原出表示將前記對象領域進行小分割之預測領域之數目的預測區塊分割類型;若前記預測區塊分割類型是表示,前記對象領域是含有第1預測領域與第2預測領域時,則再將前記預測資訊的編碼資料予以解碼,以復原第1合併識別資訊,其係用來表示,前記第1預測領域之預測訊號之生成時,是否利用該第1預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊;若前記第1合併識別資訊是表示不利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原前記第1預測領域之預測訊號之生成時所使用的第1運動資訊;若前記第1合併識別資訊是表示要利用已解碼運 動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原第1選擇資訊,其係用來從前記第1預測領域所相鄰之複數相鄰領域所附隨之已解碼運動資訊中,特定出前記第1預測領域之預測訊號之生成時所使用的第1運動資訊,並基於該第1選擇資訊而將前記第1運動資訊予以復原;再將前記預測資訊的編碼資料予以解碼,以復原第2合併識別資訊,其係用來表示,前記第2預測領域之預測訊號之生成時,是否利用該第2預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊;若前記第2合併識別資訊是表示不利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原第2預測領域之預測訊號之生成時所使用的第2運動資訊;若前記第2合併識別資訊是表示要利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原第2選擇資訊,其係用來在前記第2預測領域所相鄰之複數相鄰領域所附隨之已解碼運動資訊之中,從前記第1預測領域之運動資訊除外的已解碼運動資訊之候補中,特定出前記第2預測領域之預測訊號之生成時所使用的第2運動資訊,並基於該第2選擇資訊而將前記第2運動資訊予以復原;和保存手段,係將已復原之預測資訊中所含之運動資訊,加以保存;和 預測訊號生成手段,係基於已被復原之前記第1運動資訊和前記第2運動資訊,而生成前記對象領域中所含之前記第1預測領域與第2預測領域之各自的預測訊號;和殘差訊號復原手段,係從前記殘差訊號之編碼資料,復原出前記對象領域的再生殘差訊號;和記錄手段,係基於前記預測訊號與前記再生殘差訊號,以復原前記對象領域的像素訊號,並將該像素訊號當作前記已再生訊號而加以保存。
  5. 一種影像預測解碼方法,係屬於被影像預測解碼裝置所執行之影像預測解碼方法,其特徵為,含有:資料解析步驟,係從被分割成複數領域而編碼的影像的壓縮資料之中,抽出用來指示在解碼對象之對象領域之訊號之預測時所使用之預測方法用的預測資訊的編碼資料、殘差訊號的編碼資料;和預測資訊解碼步驟,係從前記預測資訊的編碼資料,復原出運動資訊,其中,該預測資訊解碼步驟係:從前記預測資訊的編碼資料中,復原出表示將前記對象領域進行小分割之預測領域之數目的預測區塊分割類型;若前記預測區塊分割類型是表示,前記對象領域是含有第1預測領域與第2預測領域時,則再將前記預測資訊的編碼資料予以解碼,以復原 第1合併識別資訊,其係用來表示,前記第1預測領域之預測訊號之生成時,是否利用該第1預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊;若前記第1合併識別資訊是表示不利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原前記第1預測領域之預測訊號之生成時所使用的第1運動資訊;若前記第1合併識別資訊是表示要利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原第1選擇資訊,其係用來從前記第1預測領域所相鄰之複數相鄰領域所附隨之已解碼運動資訊中,特定出前記第1預測領域之預測訊號之生成時所使用的第1運動資訊,並基於該第1選擇資訊而將前記第1運動資訊予以復原;再將前記預測資訊的編碼資料予以解碼,以復原第2合併識別資訊,其係用來表示,前記第2預測領域之預測訊號之生成時,是否利用該第2預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊;若前記第2合併識別資訊是表示不利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原第2預測領域之預測訊號之生成時所使用的第2運動資訊;若前記第2合併識別資訊是表示要利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以 復原第2選擇資訊,其係用來在前記第2預測領域所相鄰之複數相鄰領域所附隨之已解碼運動資訊之中,從前記第1預測領域之運動資訊除外的已解碼運動資訊之候補中,特定出前記第2預測領域之預測訊號之生成時所使用的第2運動資訊,並基於該第2選擇資訊而將前記第2運動資訊予以復原;和保存步驟,係將已復原之預測資訊中所含之運動資訊,加以保存;和預測訊號生成步驟,係基於已被復原之前記第1運動資訊和前記第2運動資訊,而生成前記對象領域中所含之前記第1預測領域與第2預測領域之各自的預測訊號;和殘差訊號復原步驟,係從前記殘差訊號之編碼資料,復原出前記對象領域的再生殘差訊號;和記錄步驟,係基於前記預測訊號與前記再生殘差訊號,以復原前記對象領域的像素訊號,並將該像素訊號當作前記已再生訊號而加以保存。
  6. 一種影像預測解碼程式,其特徵為,係用來使電腦發揮機能成為:資料解析手段,係從被分割成複數領域而編碼的影像的壓縮資料之中,抽出用來指示在解碼對象之對象領域之訊號之預測時所使用之預測方法用的預測資訊的編碼資料、殘差訊號的編碼資料;和預測資訊解碼手段,係從前記預測資訊的編碼資料,復原出運動資訊,其中, 該預測資訊解碼手段係:從前記預測資訊的編碼資料中,復原出表示將前記對象領域進行小分割之預測領域之數目的預測區塊分割類型;若前記預測區塊分割類型是表示,前記對象領域是含有第1預測領域與第2預測領域時,則再將前記預測資訊的編碼資料予以解碼,以復原第1合併識別資訊,其係用來表示,前記第1預測領域之預測訊號之生成時,是否利用該第1預測領域所相鄰之相鄰領域所附隨之已解碼運動資訊;若前記第1合併識別資訊是表示不利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原前記第1預測領域之預測訊號之生成時所使用的第1運動資訊;若前記第1合併識別資訊是表示要利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原第1選擇資訊,其係用來從前記第1預測領域所相鄰之複數相鄰領域所附隨之已解碼運動資訊中,特定出前記第1預測領域之預測訊號之生成時所使用的第1運動資訊,並基於該第1選擇資訊而將前記第1運動資訊予以復原;再將前記預測資訊的編碼資料予以解碼,以復原第2合併識別資訊,其係用來表示,前記第2預測領域之預測訊號之生成時,是否利用該第2預測領域所相鄰之相 鄰領域所附隨之已解碼運動資訊;若前記第2合併識別資訊是表示不利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原第2預測領域之預測訊號之生成時所使用的第2運動資訊;若前記第2合併識別資訊是表示要利用已解碼運動資訊時,則再將前記預測資訊的編碼資料予以解碼,以復原第2選擇資訊,其係用來在前記第2預測領域所相鄰之複數相鄰領域所附隨之已解碼運動資訊之中,從前記第1預測領域之運動資訊除外的已解碼運動資訊之候補中,特定出前記第2預測領域之預測訊號之生成時所使用的第2運動資訊,並基於該第2選擇資訊而將前記第2運動資訊予以復原;和保存手段,係將已復原之預測資訊中所含之運動資訊,加以保存;和預測訊號生成手段,係基於已被復原之前記第1運動資訊和前記第2運動資訊,而生成前記對象領域中所含之前記第1預測領域與第2預測領域之各自的預測訊號;和殘差訊號復原手段,係從前記殘差訊號之編碼資料,復原出前記對象領域的再生殘差訊號;和記錄手段,係基於前記預測訊號與前記再生殘差訊號,以復原前記對象領域的像素訊號,並將該像素訊號當作前記已再生訊號而加以保存。
TW103137226A 2010-07-20 2011-07-19 Image predictive coding apparatus, image predictive coding method, image predictive coding program, image predictive decoding apparatus, image predictive decoding method, and image predictive decoding program TWI519140B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010163245 2010-07-20
JP2010174869 2010-08-03

Publications (2)

Publication Number Publication Date
TW201507445A true TW201507445A (zh) 2015-02-16
TWI519140B TWI519140B (zh) 2016-01-21

Family

ID=45496857

Family Applications (2)

Application Number Title Priority Date Filing Date
TW100125447A TWI469646B (zh) 2010-07-20 2011-07-19 Image predictive coding apparatus, image predictive coding method, image predictive coding program, image predictive decoding apparatus, image predictive decoding method, and image predictive decoding program
TW103137226A TWI519140B (zh) 2010-07-20 2011-07-19 Image predictive coding apparatus, image predictive coding method, image predictive coding program, image predictive decoding apparatus, image predictive decoding method, and image predictive decoding program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW100125447A TWI469646B (zh) 2010-07-20 2011-07-19 Image predictive coding apparatus, image predictive coding method, image predictive coding program, image predictive decoding apparatus, image predictive decoding method, and image predictive decoding program

Country Status (19)

Country Link
US (8) US9185409B2 (zh)
EP (6) EP3661204B8 (zh)
JP (8) JP5661114B2 (zh)
KR (7) KR101695170B1 (zh)
CN (7) CN105898326B (zh)
AU (1) AU2011280629B2 (zh)
BR (1) BR112013001351B1 (zh)
CA (8) CA2805735C (zh)
DK (6) DK3070945T3 (zh)
ES (6) ES2887236T3 (zh)
FI (1) FI3661210T3 (zh)
HU (4) HUE056566T2 (zh)
MX (5) MX367864B (zh)
PL (3) PL3661211T3 (zh)
PT (6) PT3661210T (zh)
RU (8) RU2573208C2 (zh)
SG (1) SG187094A1 (zh)
TW (2) TWI469646B (zh)
WO (1) WO2012011432A1 (zh)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI1011698B1 (pt) 2009-03-23 2019-04-02 Ntt Docomo, Inc. Método de decodificação preditiva de imagem, dispositivo de decodificação preditiva de imagem, método de codificação preditiva de imagem, e dispositivo de codificação preditiva de imagem
WO2012077928A1 (ko) * 2010-12-07 2012-06-14 한국전자통신연구원 초고해상도 영상을 부호화하는 장치 및 방법, 그리고 복호화 장치 및 방법
SG187094A1 (en) 2010-07-20 2013-03-28 Ntt Docomo Inc Image prediction encoding device, image prediction encoding method, image prediction encoding program, image prediction decoding device, image prediction decoding method, and image prediction decoding program
JP5698541B2 (ja) * 2011-01-12 2015-04-08 株式会社Nttドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
CN102884794B (zh) * 2011-03-07 2016-08-10 松下知识产权经营株式会社 运动补偿装置、运动图像编码装置、运动图像解码装置、运动补偿方法、以及集成电路
JP2013207402A (ja) * 2012-03-27 2013-10-07 Nippon Hoso Kyokai <Nhk> 画像符号化装置及びプログラム
TWI666915B (zh) * 2012-04-06 2019-07-21 日商Jvc建伍股份有限公司 Image coding device, image coding method, and recording medium storing image coding program
TWI597976B (zh) * 2012-04-16 2017-09-01 Jvc Kenwood Corp Motion picture encoding apparatus, motion picture encoding method, and recording medium for moving picture encoding program
GB2501535A (en) 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
JP5972687B2 (ja) * 2012-07-02 2016-08-17 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
JP5798539B2 (ja) * 2012-09-24 2015-10-21 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法
JP5719401B2 (ja) * 2013-04-02 2015-05-20 日本電信電話株式会社 ブロックサイズ決定方法、映像符号化装置、及びプログラム
CN103702127B (zh) * 2013-12-30 2016-10-12 清华大学 基于运动向量相关性的运动估计搜索范围预测方法和系统
WO2015100729A1 (en) * 2014-01-03 2015-07-09 Mediatek Singapore Pte. Ltd. Improved merging candidate list construction in 3dvc
CN103841405B (zh) * 2014-03-21 2016-07-06 华为技术有限公司 深度图像的编解码方法和编解码装置
WO2016044979A1 (en) * 2014-09-22 2016-03-31 Mediatek Singapore Pte. Ltd. Segmental prediction for video coding
WO2015196966A1 (en) * 2014-06-23 2015-12-30 Mediatek Singapore Pte. Ltd. Method of segmental prediction for depth and texture data in 3d and multi-view coding systems
WO2015196333A1 (en) * 2014-06-23 2015-12-30 Mediatek Singapore Pte. Ltd. Segmental prediction for video coding
KR20180006411A (ko) 2015-06-07 2018-01-17 엘지전자 주식회사 디블록킹 필터링을 수행하는 방법 및 장치
KR20180040517A (ko) * 2015-09-10 2018-04-20 삼성전자주식회사 비디오 부호화, 복호화 방법 및 장치
US10602157B2 (en) 2015-09-11 2020-03-24 Facebook, Inc. Variable bitrate control for distributed video encoding
US10506235B2 (en) 2015-09-11 2019-12-10 Facebook, Inc. Distributed control of video encoding speeds
US10499070B2 (en) 2015-09-11 2019-12-03 Facebook, Inc. Key frame placement for distributed video encoding
US10063872B2 (en) 2015-09-11 2018-08-28 Facebook, Inc. Segment based encoding of video
US10602153B2 (en) 2015-09-11 2020-03-24 Facebook, Inc. Ultra-high video compression
US10341561B2 (en) * 2015-09-11 2019-07-02 Facebook, Inc. Distributed image stabilization
US10375156B2 (en) 2015-09-11 2019-08-06 Facebook, Inc. Using worker nodes in a distributed video encoding system
FR3047379A1 (fr) * 2016-01-29 2017-08-04 Orange Procede de codage et decodage de donnees, dispositif de codage et decodage de donnees et programmes d'ordinateur correspondants
CN109565595B (zh) * 2016-06-24 2021-06-22 华为技术有限公司 一种使用基于分割的视频编码块划分的视频编码设备和方法
US20190253624A1 (en) * 2017-07-17 2019-08-15 Ki Baek Kim Image data encoding/decoding method and apparatus
US10957068B2 (en) * 2017-01-06 2021-03-23 Canon Kabushiki Kaisha Information processing apparatus and method of controlling the same
JP6894707B2 (ja) * 2017-01-06 2021-06-30 キヤノン株式会社 情報処理装置およびその制御方法、プログラム
US10218448B2 (en) * 2017-02-02 2019-02-26 Osram Sylvania Inc. System and method for determining vehicle position based upon light-based communication and time-of-flight measurements
US10531085B2 (en) * 2017-05-09 2020-01-07 Futurewei Technologies, Inc. Coding chroma samples in video compression
KR20200038943A (ko) * 2017-08-22 2020-04-14 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 이미지 인코더, 이미지 디코더, 이미지 인코딩 방법 및 이미지 디코딩 방법
CN116320470A (zh) * 2017-10-20 2023-06-23 富士通株式会社 动态图像解码装置、动态图像解码方法和存储介质
CN107659804B (zh) * 2017-10-30 2019-03-12 河海大学 一种针对虚拟现实头戴式显示设备的屏幕内容视频编码算法
US11025904B2 (en) * 2018-06-08 2021-06-01 Tencent America LLC Method and apparatus for temporal motion vector prediction
CN110662076B (zh) * 2018-06-29 2022-10-04 北京字节跳动网络技术有限公司 子块的边界增强
CN110677678B (zh) * 2018-07-01 2022-09-23 北京字节跳动网络技术有限公司 依赖形状的帧间编码
CN117834908A (zh) * 2018-07-02 2024-04-05 英迪股份有限公司 对视频进行解码的方法和对视频进行编码的方法
US10404980B1 (en) * 2018-07-10 2019-09-03 Tencent America LLC Intra prediction with wide angle mode in video coding
EP3855739A4 (en) * 2018-09-19 2021-07-28 Fujitsu Limited VIDEO CODING DEVICE, VIDEO CODING METHOD, VIDEO CODING PROGRAM, VIDEO DECODING DEVICE, VIDEO DECODING METHOD AND VIDEO DECODING PROGRAM
CN109547781B (zh) * 2018-10-26 2020-12-22 嘉兴奥恒进出口有限公司 基于图像预测的压缩方法及设备
FR3088511B1 (fr) * 2018-11-09 2021-05-28 Fond B Com Procede de decodage d’au moins une image, procede de codage, dispositifs, signal et programmes d’ordinateur correspondants.
CN115348443A (zh) * 2018-11-30 2022-11-15 杭州海康威视数字技术股份有限公司 一种运动信息确定方法、装置及其设备
US11102513B2 (en) 2018-12-06 2021-08-24 Tencent America LLC One-level transform split and adaptive sub-block transform
US11533506B2 (en) * 2019-02-08 2022-12-20 Tencent America LLC Method and apparatus for video coding
CN116800960A (zh) * 2019-03-12 2023-09-22 北京达佳互联信息技术有限公司 用于视频解码的方法、装置和存储介质
US11877010B2 (en) * 2019-06-23 2024-01-16 Lg Electronics Inc. Signaling method and device for merge data syntax in video/image coding system

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3869672A (en) 1972-05-13 1975-03-04 Int Standard Electric Corp Method and arrangements for the digital control of operating functions, radio and television receivers
KR0166716B1 (ko) 1992-06-18 1999-03-20 강진구 블럭 dpcm을 이용한 부호화/복호화방법 및 장치
JPH07264598A (ja) 1994-03-23 1995-10-13 Nippon Telegr & Teleph Corp <Ntt> 動き補償方法、動きベクトル検出回路および動き補償回路
US5608458A (en) 1994-10-13 1997-03-04 Lucent Technologies Inc. Method and apparatus for a region-based approach to coding a sequence of video images
US5682204A (en) 1995-12-26 1997-10-28 C Cube Microsystems, Inc. Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level
EP1229740A3 (en) 1996-01-22 2005-02-09 Matsushita Electric Industrial Co., Ltd. Method and device for digital image encoding and decoding
KR100371130B1 (ko) 1996-05-28 2003-02-07 마쯔시다덴기산교 가부시키가이샤 화상예측 복호화 장치 및 그 방법과 화상예측 부호화 장치및 그 방법
EP0817499A3 (en) 1996-06-28 2002-05-22 Matsushita Electric Industrial Co., Ltd. Image coding method using extrapolated pixels in insignificant areas of blocks
JP2004343788A (ja) 1996-10-31 2004-12-02 Toshiba Corp 画像符号化装置および画像復号化装置および画像符号化データを記録した記録媒体
US6687405B1 (en) 1996-11-13 2004-02-03 Koninklijke Philips Electronics N.V. Image segmentation
CN1155259C (zh) * 1996-11-26 2004-06-23 松下电器产业株式会社 运动图象可变比特率编码装置和编码方法
US6359929B1 (en) 1997-07-04 2002-03-19 Matsushita Electric Industrial Co., Ltd. Image predictive decoding method, image predictive decoding apparatus, image predictive coding apparatus, and data storage medium
EP1788815A3 (en) * 1997-11-05 2008-10-15 Sony Corporation Rate control for video transcoding with resolution conversion
US6483521B1 (en) 1998-02-02 2002-11-19 Matsushita Electric Industrial Co., Ltd. Image composition method, image composition apparatus, and data recording media
US7184482B2 (en) * 1999-04-17 2007-02-27 Altera Corporation Encoding system using motion vectors to represent frame-to-frame changes, wherein a decoder uses predictions of motion vectors in decoding
US6765964B1 (en) 2000-12-06 2004-07-20 Realnetworks, Inc. System and method for intracoding video data
US7643559B2 (en) 2001-09-14 2010-01-05 Ntt Docomo, Inc. Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program
US7336711B2 (en) 2001-11-16 2008-02-26 Ntt Docomo, Inc. Image encoding method, image decoding method, image encoder, image decode, program, computer data signal, and image transmission system
JP3861698B2 (ja) * 2002-01-23 2006-12-20 ソニー株式会社 画像情報符号化装置及び方法、画像情報復号装置及び方法、並びにプログラム
US7003035B2 (en) * 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
HUE045566T2 (hu) 2002-04-19 2020-01-28 Panasonic Ip Corp America Mozgásvektor-számítási eljárás
CN1312927C (zh) 2002-07-15 2007-04-25 株式会社日立制作所 动态图像编码方法及解码方法
JP3504256B1 (ja) 2002-12-10 2004-03-08 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化方法、動画像復号方法、動画像符号化装置、及び動画像復号装置
KR100560843B1 (ko) 2003-04-10 2006-03-13 에스케이 텔레콤주식회사 비디오 부호기에서 적응 움직임 벡터의 탐색 영역을결정하는 방법 및 장치
JP4373702B2 (ja) 2003-05-07 2009-11-25 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム
JP2005005844A (ja) 2003-06-10 2005-01-06 Hitachi Ltd 計算装置及び符号化処理プログラム
US9210441B2 (en) 2003-06-25 2015-12-08 Thomson Licensing Fast mode-decision encoding for interframes
US7646815B2 (en) * 2003-07-15 2010-01-12 Lsi Corporation Intra estimation chroma mode 0 sub-block dependent prediction
US20050013498A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
US8064520B2 (en) 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
US7400681B2 (en) 2003-11-28 2008-07-15 Scientific-Atlanta, Inc. Low-complexity motion vector prediction for video codec with two lists of reference pictures
JP4213646B2 (ja) 2003-12-26 2009-01-21 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。
JP4313710B2 (ja) 2004-03-25 2009-08-12 パナソニック株式会社 画像符号化方法および画像復号化方法
JP4414904B2 (ja) 2004-04-16 2010-02-17 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
CN101023672A (zh) * 2004-07-12 2007-08-22 诺基亚公司 在可调整视频编码中用于运动预测的系统和方法
AR049593A1 (es) * 2004-07-20 2006-08-16 Qualcomm Inc Metodo y aparato para predecir el vector de movimiento en compresion de video temporal.
US8085846B2 (en) 2004-08-24 2011-12-27 Thomson Licensing Method and apparatus for decoding hybrid intra-inter coded blocks
CN100471280C (zh) * 2005-01-07 2009-03-18 株式会社Ntt都科摩 运动图像编码及译码装置、方法
KR101108681B1 (ko) 2005-01-19 2012-01-25 삼성전자주식회사 동영상 코덱에서의 주파수 변환 계수 예측 방법 및 장치,이를 구비한 부호화 및 복호화 장치와 방법
US7580456B2 (en) * 2005-03-01 2009-08-25 Microsoft Corporation Prediction-based directional fractional pixel motion estimation for video coding
US20070025444A1 (en) 2005-07-28 2007-02-01 Shigeyuki Okada Coding Method
US8446954B2 (en) 2005-09-27 2013-05-21 Qualcomm Incorporated Mode selection techniques for multimedia coding
RU2369038C1 (ru) 2005-11-30 2009-09-27 Кабусики Кайся Тосиба Способ кодирования изображения/декодирования изображения, устройство кодирования изображения/декодирования изображения
US8446956B2 (en) * 2006-01-05 2013-05-21 Thomson Licensing Inter-layer motion prediction method using resampling
TW200806040A (en) * 2006-01-05 2008-01-16 Nippon Telegraph & Telephone Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
CN102611892B (zh) 2006-03-16 2014-10-08 华为技术有限公司 在编码过程中实现自适应量化的方法及装置
JP5002286B2 (ja) 2006-04-27 2012-08-15 キヤノン株式会社 画像符号化装置、画像符号化方法、プログラム及び記憶媒体
JPWO2007136088A1 (ja) * 2006-05-24 2009-10-01 パナソニック株式会社 画像符号化装置、画像符号化方法、及び画像符号化用集積回路
US20080026729A1 (en) 2006-07-31 2008-01-31 Research In Motion Limited Method and apparatus for configuring unique profile settings for multiple services
EP2047687B1 (en) 2006-08-02 2018-05-16 Thomson Licensing DTV Adaptive geometric partitioning for video encoding
BRPI0715770B1 (pt) * 2006-08-25 2020-03-10 Interdigital Vc Holdings, Inc. Método, aparelho e mídia de armazenamento para particionamento com menor resolução
JP4999859B2 (ja) * 2006-10-30 2012-08-15 日本電信電話株式会社 予測参照情報生成方法、動画像符号化及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
KR101383540B1 (ko) 2007-01-03 2014-04-09 삼성전자주식회사 복수의 움직임 벡터 프리딕터들을 사용하여 움직임 벡터를추정하는 방법, 장치, 인코더, 디코더 및 복호화 방법
DE602007010835D1 (de) * 2007-01-18 2011-01-05 Fraunhofer Ges Forschung Qualitätsskalierbarer videodatenstrom
US20080240242A1 (en) 2007-03-27 2008-10-02 Nokia Corporation Method and system for motion vector predictions
KR20090132629A (ko) 2007-04-09 2009-12-30 가부시키가이샤 엔.티.티.도코모 화상 예측 부호화 장치, 화상 예측 부호화 방법, 화상 예측 부호화 프로그램, 화상 예측 복호 장치, 화상 예측 복호 방법 및 화상 예측 복호 프로그램
BRPI0809512A2 (pt) 2007-04-12 2016-03-15 Thomson Licensing método e aparelho para mesclagem dependente de contexto para modos salto-direto para codificação e decodificação de vídeo
JP4788649B2 (ja) 2007-04-27 2011-10-05 株式会社日立製作所 動画像記録方法及びその装置
JP5188875B2 (ja) * 2007-06-04 2013-04-24 株式会社エヌ・ティ・ティ・ドコモ 画像予測符号化装置、画像予測復号装置、画像予測符号化方法、画像予測復号方法、画像予測符号化プログラム、及び画像予測復号プログラム
JP2008311781A (ja) 2007-06-12 2008-12-25 Ntt Docomo Inc 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム
JP4947364B2 (ja) 2007-06-22 2012-06-06 ソニー株式会社 情報処理システムおよび方法、情報処理装置および方法、並びにプログラム
KR100901874B1 (ko) 2007-07-11 2009-06-09 한국전자통신연구원 비디오 인코딩을 위한 인터 모드 결정 방법
JP4678015B2 (ja) * 2007-07-13 2011-04-27 富士通株式会社 動画像符号化装置及び動画像符号化方法
KR101408698B1 (ko) 2007-07-31 2014-06-18 삼성전자주식회사 가중치 예측을 이용한 영상 부호화, 복호화 방법 및 장치
JP2009111691A (ja) 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
US20090168871A1 (en) * 2007-12-31 2009-07-02 Ning Lu Video motion estimation
JP4990927B2 (ja) 2008-03-28 2012-08-01 三星電子株式会社 動きベクトル情報の符号化/復号化方法及び装置
JP5406465B2 (ja) * 2008-04-24 2014-02-05 株式会社Nttドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
US8548041B2 (en) * 2008-09-25 2013-10-01 Mediatek Inc. Adaptive filter
JP5240530B2 (ja) 2008-10-02 2013-07-17 ソニー株式会社 画像処理装置および方法
KR20110091000A (ko) 2008-11-07 2011-08-10 미쓰비시덴키 가부시키가이샤 화상 부호화 장치 및 화상 복호 장치
CN103647972B (zh) * 2008-12-03 2017-04-12 日立麦克赛尔株式会社 运动图像解码方法和运动图像编码方法
BRPI1011698B1 (pt) 2009-03-23 2019-04-02 Ntt Docomo, Inc. Método de decodificação preditiva de imagem, dispositivo de decodificação preditiva de imagem, método de codificação preditiva de imagem, e dispositivo de codificação preditiva de imagem
US9626769B2 (en) * 2009-09-04 2017-04-18 Stmicroelectronics International N.V. Digital video encoder system, method, and non-transitory computer-readable medium for tracking object regions
KR101447796B1 (ko) * 2010-04-13 2014-10-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 평면 간 예측
JP5701291B2 (ja) * 2010-04-13 2015-04-15 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 動き補償方法、画像復号方法、画像符号化方法、動き補償装置、プログラム、及び集積回路
KR101484281B1 (ko) * 2010-07-09 2015-01-21 삼성전자주식회사 블록 병합을 이용한 비디오 부호화 방법 및 그 장치, 블록 병합을 이용한 비디오 복호화 방법 및 그 장치
SI2924995T1 (sl) 2010-07-09 2018-10-30 Samsung Electronics Co., Ltd. Postopek za dekodiranje videa z uporabo združevanja blokov
SG187094A1 (en) 2010-07-20 2013-03-28 Ntt Docomo Inc Image prediction encoding device, image prediction encoding method, image prediction encoding program, image prediction decoding device, image prediction decoding method, and image prediction decoding program
ES2773774T3 (es) * 2010-10-06 2020-07-14 Ntt Docomo Inc Dispositivo, método y programa de codificación bipredictiva de imágenes, y dispositivo, método y programa de decodificación bipredictiva de imágenes
KR20120140181A (ko) * 2011-06-20 2012-12-28 한국전자통신연구원 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치
CA2824755C (en) * 2011-09-23 2018-01-16 Kt Corporation Method for deriving a merge candidate block and device using same

Also Published As

Publication number Publication date
TW201215161A (en) 2012-04-01
RU2667716C1 (ru) 2018-09-24
MX338236B (es) 2016-04-08
KR101729051B1 (ko) 2017-04-21
KR20130041146A (ko) 2013-04-24
US10230987B2 (en) 2019-03-12
JP2015065690A (ja) 2015-04-09
JP2019140703A (ja) 2019-08-22
RU2685390C1 (ru) 2019-04-17
WO2012011432A1 (ja) 2012-01-26
EP2597874A1 (en) 2013-05-29
JP2016165135A (ja) 2016-09-08
TWI519140B (zh) 2016-01-21
ES2887307T3 (es) 2021-12-22
DK2597874T3 (da) 2020-09-28
ES2785606T3 (es) 2020-10-07
CN105120280A (zh) 2015-12-02
CA3011241C (en) 2019-09-10
AU2011280629B2 (en) 2015-08-06
US20180014032A1 (en) 2018-01-11
PT3664453T (pt) 2022-09-20
CN105847837B (zh) 2019-01-04
BR112013001351A2 (pt) 2016-05-17
CN105120278A (zh) 2015-12-02
US20180249180A1 (en) 2018-08-30
EP3661204A1 (en) 2020-06-03
RU2685389C1 (ru) 2019-04-17
CA2805735C (en) 2016-02-09
US20160021389A1 (en) 2016-01-21
MX350471B (es) 2017-09-07
CN105898327A (zh) 2016-08-24
MX2019010472A (es) 2019-10-15
US10542287B2 (en) 2020-01-21
US10225580B2 (en) 2019-03-05
RU2013107368A (ru) 2014-10-20
JP5951063B2 (ja) 2016-07-13
CN105847837A (zh) 2016-08-10
CA3011236A1 (en) 2012-01-26
CA3102661A1 (en) 2012-01-26
CN105898327B (zh) 2019-03-01
US20130136184A1 (en) 2013-05-30
ES2887236T3 (es) 2021-12-22
US9185409B2 (en) 2015-11-10
DK3661210T3 (da) 2023-09-11
KR101903643B1 (ko) 2018-10-02
KR20170003736A (ko) 2017-01-09
DK3664453T3 (da) 2022-09-12
CA2903530C (en) 2018-08-28
SG187094A1 (en) 2013-03-28
RU2573208C2 (ru) 2016-01-20
KR20170137962A (ko) 2017-12-13
EP3664453A2 (en) 2020-06-10
PL3664453T3 (pl) 2022-11-21
CN105120280B (zh) 2018-04-20
KR20170045368A (ko) 2017-04-26
CN103004206A (zh) 2013-03-27
EP3661210A1 (en) 2020-06-03
US9794592B2 (en) 2017-10-17
PT3661204T (pt) 2021-09-22
JP5661114B2 (ja) 2015-01-28
KR101772183B1 (ko) 2017-08-28
PL3661210T3 (pl) 2023-11-06
US20180249181A1 (en) 2018-08-30
EP3661211A1 (en) 2020-06-03
US20180278959A1 (en) 2018-09-27
BR112013001351B1 (pt) 2019-01-29
EP2597874B1 (en) 2020-08-26
ES2820437T3 (es) 2021-04-21
JP6535780B2 (ja) 2019-06-26
EP3664453A3 (en) 2020-07-29
MX367864B (es) 2019-09-05
MX2013000666A (es) 2013-02-26
PT3661211T (pt) 2021-09-24
EP3661210B1 (en) 2023-08-09
CA3011221C (en) 2019-09-03
RU2685393C1 (ru) 2019-04-17
ES2955687T3 (es) 2023-12-05
KR20170098990A (ko) 2017-08-30
EP3664453B1 (en) 2022-08-24
JPWO2012011432A1 (ja) 2013-09-09
CA3011236C (en) 2019-09-03
TWI469646B (zh) 2015-01-11
CA2805735A1 (en) 2012-01-26
RU2685388C1 (ru) 2019-04-17
CN105898326A (zh) 2016-08-24
HUE056566T2 (hu) 2022-02-28
US20170034531A1 (en) 2017-02-02
CN105120279A (zh) 2015-12-02
US10063888B1 (en) 2018-08-28
RU2658798C1 (ru) 2018-06-22
AU2011280629A1 (en) 2013-02-21
US9986261B2 (en) 2018-05-29
JP2019165499A (ja) 2019-09-26
EP2597874A4 (en) 2016-03-09
FI3661210T3 (fi) 2023-08-31
KR101770662B1 (ko) 2017-08-23
HUE056567T2 (hu) 2022-02-28
PL3661211T3 (pl) 2021-12-13
CN105120278B (zh) 2016-11-30
EP3070945A1 (en) 2016-09-21
JP2015130692A (ja) 2015-07-16
KR101600919B1 (ko) 2016-03-21
KR20160030322A (ko) 2016-03-16
PT3070945T (pt) 2020-04-22
US9497480B2 (en) 2016-11-15
CA3011217C (en) 2021-08-03
JP2019140704A (ja) 2019-08-22
US20180332307A1 (en) 2018-11-15
CA3011221A1 (en) 2012-01-26
CN105120279B (zh) 2018-05-29
PT2597874T (pt) 2020-09-25
CA2903530A1 (en) 2012-01-26
KR20170044764A (ko) 2017-04-25
CA3102661C (en) 2022-05-17
CN103004206B (zh) 2016-06-01
HUE063032T2 (hu) 2023-12-28
RU2619202C1 (ru) 2017-05-12
CN105898326B (zh) 2019-01-29
HUE059918T2 (hu) 2023-01-28
JP5712330B2 (ja) 2015-05-07
PT3661210T (pt) 2023-09-04
KR101695170B1 (ko) 2017-01-11
CA3011241A1 (en) 2012-01-26
JP2018121354A (ja) 2018-08-02
EP3661211B1 (en) 2021-08-25
EP3661204B1 (en) 2021-08-18
CA3050052A1 (en) 2012-01-26
DK3661204T3 (da) 2021-09-20
DK3070945T3 (da) 2020-04-06
EP3661204B8 (en) 2021-09-22
DK3661211T3 (da) 2021-09-27
CA3011217A1 (en) 2012-01-26
ES2926898T3 (es) 2022-10-31
EP3070945B1 (en) 2020-03-11
KR101809187B1 (ko) 2017-12-14

Similar Documents

Publication Publication Date Title
TWI519140B (zh) Image predictive coding apparatus, image predictive coding method, image predictive coding program, image predictive decoding apparatus, image predictive decoding method, and image predictive decoding program