TWI626844B - 動態影像預測解碼裝置、動態影像預測解碼方法 - Google Patents
動態影像預測解碼裝置、動態影像預測解碼方法 Download PDFInfo
- Publication number
- TWI626844B TWI626844B TW106101881A TW106101881A TWI626844B TW I626844 B TWI626844 B TW I626844B TW 106101881 A TW106101881 A TW 106101881A TW 106101881 A TW106101881 A TW 106101881A TW I626844 B TWI626844 B TW I626844B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- picture
- random access
- decoding
- images
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 109
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 18
- 238000011084 recovery Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 238000001454 recorded image Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供一種,藉由判別可解碼之圖像,而可將
可解碼之圖像當作後續圖像的參照圖像來利用的動態影像預測解碼裝置。
動態影像預測解碼裝置,係具備:輸入
手段,係用以輸入含有壓縮影像資料的位元串流(201),其中,該壓縮影像資料係為,每一圖像地具有:用來將該當圖像識別成為,包含隨機存取圖像、隨機存取略過(RAS)領導圖像、non-RAS領導圖像之複數圖像類型之其中一種的NAL(Network Abstraction Layer)單元類型之資訊;和復原手段,係用以基於圖像類型,而將壓縮影像資料進行解碼,以復原出再生影像;和輸出手段,係用以輸出再生影像。若關連之隨機存取圖像是在解碼順序上為位元串流之最初圖像,則RAS領導圖像係不被輸出。
Description
本發明係有關於動態影像預測編碼裝置、方法及程式、以及動態影像預測解碼裝置、方法及程式,換言之,是有關於涉及對隨機存取有效之畫面間預測的動態影像預測編碼裝置、方法及程式、以及動態影像預測解碼裝置、方法及程式。
為了有效率地進行動態影像資料的傳送,採用了壓縮編碼技術。在動態影像的情況下,廣泛地採用MPEG1~4或H.261~H.264之方式。
在這些編碼方式中,是將身為編碼對象的影像,分割成複數區塊,然後才進行編碼、解碼處理。為了提高編碼效率,採用如下記之預測編碼方法。在畫面內的預測編碼時,是使用位於與對象區塊相同畫面內的相鄰之已再生的影像訊號(過去已被壓縮之影像資料所復原而成者)來生成預測訊號,然後將其從對象區塊之訊號中加以扣除而成的差分訊號,進行編碼。在畫面間的預測編碼時,係參照位於與對象區塊不同畫面內的已再生之影像訊
號,檢索出訊號的位移,將該移動量加以補償而生成預測訊號,將其從對象區塊之訊號中扣除後的差分訊號,進行編碼。為了進行運動之檢索、補償而被參照的已再生之影像,稱作參照影像。
又,在雙向畫面間預測中,不只輸出時間順序位於過去的影像,有時候就連對象影像之後所被輸出的未來之影像也會參照(但是,該未來影像必須比對象影像更早編碼、預先進行再生)。藉由將從過去之影像與未來之影像所取得之預測訊號進行平均化,對於被隱藏而新出現之物體的訊號預測是有效的,同時,具有減輕雙預測訊號中所含之雜訊的效果。
甚至,在H.264的畫面間預測編碼中,針對對象區塊之預測訊號,係參照過去先被編碼而再生之複數參照影像,一面進行運動檢索一面將誤差最少之影像訊號選擇成為最佳的預測訊號。求取對象區塊之像素訊號與該最佳預測訊號的差分,實施離散餘弦轉換及量化之後,進行熵編碼。同時,關於是從哪個參照影像的哪個領域取得針對對象區塊之最佳預測訊號的資訊(分別稱作參照索引與運動向量)也會一起進行編碼。在H.264中,將已被再生的4張乃至5張影像係當作參照影像而儲存在畫格記憶體或再生影像緩衝區(decoded picture buffer)中。
畫面間預測編碼,係可活用像素間之相關而高效率地進行壓縮編碼,但為了電視頻道的切換而可中途收看映像節目,必須要打斷畫面間的依存性。在動態影像
的壓縮位元串流之中,不存在畫面間之依存性的地點,以下稱作隨機存取點。除了頻道的切換以外,在編輯動態影像、或將不同動態影像的壓縮資料予以連接起來的情況下,也需要隨機存取點,但在先前技術中,作為隨機存取點是設置「乾淨隨機存取點」。乾淨隨機存取點係藉由NAL unit type的乾淨隨機存取圖像(以下稱作「CRA圖像」)而被特定。一個位元串流中,係可能含有複數CRA圖像,動態影像預測解碼裝置係亦可從任意乾淨隨機存取點起開始解碼。
為了揭露發明,關連於CRA圖像的圖像的圖像類型係定義如下(參照圖10)。
a)過去圖像:比CRA圖像先解碼,且比CRA圖像先輸出的圖像
b)遲滯圖像:比CRA圖像先解碼,但比CRA圖像後輸出的圖像
c)領先圖像:比CRA圖像後解碼,但比CRA圖像先輸出的圖像
d)通常圖像:比CRA圖像後解碼,且比CRA圖像後輸出的圖像
CRA圖像係被定義成僅畫面內預測之圖像,因此解碼上所必須之資訊係為完備,可不必往其他圖像做參照就能正確地解碼。CRA圖像之後所接續的所有通常圖像係被定義成,不可以根據過去圖像、遲滯圖像、或領先圖像來進行畫面間預測。
從CRA圖像來解碼位元串流之際,CRA圖像及通常圖像係被保證不會有畫面間預測之錯誤而可被正確地解碼。然而,領先圖像,係在CRA圖像之後被解碼,不能保證沒有畫面間預測之錯誤而被正確地解碼。亦即,會有能被正確解碼的領先圖像存在,同時也會有無法被正確解碼的領先圖像存在。
此外,此處所謂「被正確地解碼」,係意味著已被解碼之圖像,並不是和從CRA圖像而是和從位元串流的開頭起被解碼時所獲得的圖像相同的意思。從CRA圖像開始解碼之際,解碼順序上比該當CRA圖像前面的圖像(例如遲滯圖像)係不被解碼,不存在於再生影像緩衝區中。因此,將解碼順序比比該當CRA圖像前面的圖像直接或間接地使用於畫面間預測的後續之圖像,係有可能含有解碼錯誤。
[非專利文獻1]Benjamin Bross et. al., "High efficiency video coding (HEVC) text specification draft 7", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 9th Meeting: Geneva, CH, 27 April - 7 May 2012
動態影像預測解碼裝置如上述般地從隨機存取點開始解碼之際,有可能會存在有無法正確解碼的圖像,該當無法正確解碼之圖像係無法利用於以後的解碼。反之,也有可正確解碼之圖像,該當可正確解碼之圖像係可利用於以後的解碼。於先前技術中,由於並沒有特定出解碼順序上接續於隨機存取點之後之圖像是否被丟棄的方法,因此領先圖像全部都被視為無法正確解碼之圖像而被丟棄。然而,這些圖像的一部分實際上是可解碼的,可對後續圖像的預測性能改善有所貢獻,因此把領先圖像全部都視為無法正確解碼之圖像而丟棄的方法,並不是理想的方法。
於是,本發明係之目的在於,藉由設計成能夠判別出可解碼之圖像,可將可解碼之圖像當作後續圖像的參照圖像來利用以對預測性能改善有所貢獻。
本發明之一側面所述之動態影像預測編碼裝置,其特徵為,具備:輸入手段,係用以將構成動態影像的複數影像,進行輸入;和編碼手段,係用以將前記影像藉由畫面內預測或畫面間預測之任一方法來進行編碼,以生成含有身為隨機存取點之影像的壓縮影像資料,並且將各影像的輸出順序資訊與各影像的圖像類型之相關資訊予以編碼;和復原手段,係用以將前記壓縮影像資料進行解碼,以復原出再生影像;和影像儲存手段,係用以將前記
再生影像,當作後續影像進行編碼所需使用之參照影像而儲存1個以上;和控制手段,係用以判定前記圖像類型,基於判定結果來控制前記影像儲存手段;前記控制手段,係以1)CRA圖像:該圖像的特徵為,接續於CRA圖像之後的類型2圖像,是在解碼是從前記CRA圖像被開始的情況下能夠正確地解碼;2)類型1圖像:係為在該當圖像所關連到之CRA圖像之後被解碼,比前記CRA圖像先輸出的圖像,且該圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,被貼標籤成為類型1圖像的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)類型2圖像:係為為了進行畫面間預測而持有參照圖像之清單的圖像,該當圖像的特徵為,該當參照圖像之清單裡頭的所有參照圖像,是被貼標籤成為類型2圖像或CRA圖像,且在該當圖像所關連到之CRA圖像以後被解碼的共計3個類型的其中之一,來將前記影像貼標籤。
本發明之一側面所述之動態影像預測編碼方法,係屬於被動態影像預測編碼裝置所執行的動態影像預測編碼方法,其特徵為,具備:輸入步驟,係用以將構成動態影像的複數影像,進行輸入;和編碼步驟,係用以將前記影像藉由畫面內預測或畫面間預測之任一方法來進行
編碼,以生成含有身為隨機存取點之影像的壓縮影像資料,並且將各影像的輸出順序資訊與各影像的圖像類型之相關資訊予以編碼;和復原步驟,係用以將前記壓縮影像資料進行解碼,以復原出再生影像;和影像儲存步驟,係用以將前記再生影像,當作後續影像進行編碼所需使用之參照影像而儲存1個以上;和控制步驟,係用以判定前記圖像類型,基於判定結果來控制前記影像儲存步驟;在前記控制步驟中,前記動態影像預測編碼裝置,係以1)CRA圖像:該圖像的特徵為,接續於CRA圖像之後的類型2圖像,是在解碼是從前記CRA圖像被開始的情況下能夠正確地解碼;2)類型1圖像:係為在該當圖像所關連到之CRA圖像之後被解碼,比前記CRA圖像先輸出的圖像,且該圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,被貼標籤成為類型1圖像的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)類型2圖像:係為為了進行畫面間預測而持有參照圖像之清單的圖像,該當圖像的特徵為,該當參照圖像之清單裡頭的所有參照圖像,是被貼標籤成為類型2圖像或CRA圖像,且在該當圖像所關連到之CRA圖像以後被解碼的共計3個類型的其中之一,來將前記影像貼標籤。
本發明之一側面所述之動態影像預測編碼程
式,其特徵為,令電腦發揮機能而成為:輸入手段,係用以將構成動態影像的複數影像,進行輸入;和編碼手段,係用以將前記影像藉由畫面內預測或畫面間預測之任一方法來進行編碼,以生成含有身為隨機存取點之影像的壓縮影像資料,並且將各影像的輸出順序資訊與各影像的圖像類型之相關資訊予以編碼;和復原手段,係用以將前記壓縮影像資料進行解碼,以復原出再生影像;和影像儲存手段,係用以將前記再生影像,當作後續影像進行編碼所需使用之參照影像而儲存1個以上;和控制手段,係用以判定前記圖像類型,基於判定結果來控制前記影像儲存手段;前記控制手段,係以1)CRA圖像:該圖像的特徵為,接續於CRA圖像之後的類型2圖像,是在解碼是從前記CRA圖像被開始的情況下能夠正確地解碼;2)類型1圖像:係為在該當圖像所關連到之CRA圖像之後被解碼,比前記CRA圖像先輸出的圖像,且該圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,被貼標籤成為類型1圖像的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)類型2圖像:係為為了進行畫面間預測而持有參照圖像之清單的圖像,該當圖像的特徵為,該當參照圖像之清單裡頭的所有參照圖像,是被貼標籤成為類型2圖像或CRA圖像,且在該當圖像所關連到之CRA圖像以後被
解碼的共計3個類型的其中之一,來將前記影像貼標籤。
本發明之一側面所述之動態影像預測解碼裝置,其特徵為,具備:輸入手段,係用以將藉由對構成動態影像之複數影像進行畫面內預測或是畫面間預測之任一者所致之編碼而得到的含有隨機存取影像的壓縮影像資料、和表示各影像之輸出順序及各影像之圖像類型的編碼資料,予以輸入;和復原手段,係用以將前記壓縮影像資料與前記編碼資料進行解碼,復原成再生影像與輸出順序資訊與圖像類型資訊;和影像儲存手段,係用以將前記再生影像,當作後續影像進行解碼所需使用之參照影像而儲存1個以上;和控制手段,係用以基於前記圖像類型,來控制前記復原手段;前記圖像類型係以1)CRA圖像:該圖像的特徵為,接續於CRA圖像之後的類型2圖像,是在解碼是從該當CRA圖像被開始的情況下能夠正確地解碼;2)類型1圖像:係為在該當圖像所關連到之CRA圖像之後被解碼,比前記CRA圖像先輸出的圖像,且該圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,被貼標籤成為類型1圖像的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)類型2圖像:係為為了進行畫面間預測而持有參照圖像之清單的圖像,該當圖像的特徵為,該當參照圖像
之清單裡頭的所有參照圖像,是被貼標籤成為類型2圖像或CRA圖像,且在該當圖像所關連到之CRA圖像以後被解碼的共計3個類型的其中之一,而被貼標籤至各影像;前記復原手段,係當編碼資料之解碼是從CRA圖像被開始時,則持續進行將被貼標籤成為類型2圖像之影像予以解碼,並略過被貼標籤成為類型1圖像之影像之解碼的此種解碼處理,直到下個CRA圖像的處理之前為止的期間。
本發明之一側面所述之動態影像預測解碼方法,係屬於被動態影像預測解碼裝置所執行的動態影像預測解碼方法,其特徵為,具備:輸入步驟,係用以將藉由對構成動態影像之複數影像進行畫面內預測或是畫面間預測之任一者所致之編碼而得到的含有隨機存取影像的壓縮影像資料、和表示各影像之輸出順序及各影像之圖像類型的編碼資料,予以輸入;和復原步驟,係用以將前記壓縮影像資料與前記編碼資料進行解碼,復原成再生影像與輸出順序資訊與圖像類型資訊;和影像儲存步驟,係用以將前記再生影像,當作後續影像進行解碼所需使用之參照影像而儲存1個以上;和控制步驟,係用以基於前記圖像類型,來控制前記復原步驟;前記圖像類型係以1)CRA圖像:該圖像的特徵為,接續於CRA圖像之後的類型2圖像,是在解碼是從該當CRA圖像被開始的情況下能夠正確地解碼;
2)類型1圖像:係為在該當圖像所關連到之CRA圖像之後被解碼,比前記CRA圖像先輸出的圖像,且該圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,被貼標籤成為類型1圖像的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)類型2圖像:係為為了進行畫面間預測而持有參照圖像之清單的圖像,該當圖像的特徵為,該當參照圖像之清單裡頭的所有參照圖像,是被貼標籤成為類型2圖像或CRA圖像,且在該當圖像所關連到之CRA圖像以後被解碼的共計3個類型的其中之一,而被貼標籤至各影像;在前記復原步驟中,前記動態影像預測解碼裝置係當編碼資料之解碼是從CRA圖像被開始時,則持續進行將被貼標籤成為類型2圖像之影像予以解碼,並略過被貼標籤成為類型1圖像之影像之解碼的此種解碼處理,直到下個CRA圖像的處理之前為止的期間。
本發明之一側面所述之動態影像預測解碼程式,其特徵為,令電腦發揮機能而成為:輸入手段,係用以將藉由對構成動態影像之複數影像進行畫面內預測或是畫面間預測之任一者所致之編碼而得到的含有隨機存取影像的壓縮影像資料、和表示各影像之輸出順序及各影像之圖像類型的編碼資料,予以輸入;和復原手段,係用以將前記壓縮影像資料與前記編碼資料進行解碼,復原成再生
影像與輸出順序資訊與圖像類型資訊;和影像儲存手段,係用以將前記再生影像,當作後續影像進行解碼所需使用之參照影像而儲存1個以上;和控制手段,係用以基於前記圖像類型,來控制前記復原手段;前記圖像類型係以1)CRA圖像:該圖像的特徵為,接續於CRA圖像之後的類型2圖像,是在解碼是從該當CRA圖像被開始的情況下能夠正確地解碼;2)類型1圖像:係為在該當圖像所關連到之CRA圖像之後被解碼,比前記CRA圖像先輸出的圖像,且該圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,被貼標籤成為類型1圖像的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)類型2圖像:係為為了進行畫面間預測而持有參照圖像之清單的圖像,該當圖像的特徵為,該當參照圖像之清單裡頭的所有參照圖像,是被貼標籤成為類型2圖像或CRA圖像,且在該當圖像所關連到之CRA圖像以後被解碼的共計3個類型的其中之一,而被貼標籤至各影像;前記復原手段,係當編碼資料之解碼是從CRA圖像被開始時,則持續進行將被貼標籤成為類型2圖像之影像予以解碼,並略過被貼標籤成為類型1圖像之影像之解碼的此種解碼處理,直到下個CRA圖像的處理之前為止的期間。
所以,本發明所述之動態影像預測編碼裝置、方法及程式,以及動態影像預測解碼裝置、方法及程式,係亦可採用以下態樣。
本發明之另一側面所述之動態影像預測編碼裝置,其特徵為,具備:輸入手段,係用以將構成動態影像的複數影像,進行輸入;和編碼手段,係用以將前記影像藉由畫面內預測或畫面間預測之任一方法來進行編碼,以生成含有身為隨機存取點之影像的壓縮影像資料,並且將各影像的輸出順序資訊予以編碼;和復原手段,係用以將前記壓縮影像資料進行解碼,以復原出再生影像;和影像儲存手段,係用以將前記再生影像,當作後續影像進行編碼所需使用之參照影像而儲存1個以上;和控制手段,係用以控制前記影像儲存手段;前記控制手段係進行控制,將前記影像分類成:1)編碼資料之解碼被開始的CRA圖像;2)比該當圖像所關連到之CRA圖像之後被解碼,比前記關連到之CRA圖像先輸出,前記復原手段所做的解碼處理會被略過,不被儲存在前記影像儲存手段中且不被輸出的圖像,該當圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,前記復原手段所做的解碼處理會被略過的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)被前記復原手段所解碼,因應需要而為了參照而被儲存在前記影像儲存手段中的圖像,該當圖像的特徵
為,該當圖像係為了進行畫面間預測而持有參照圖像之清單,該當參照圖像之清單裡頭的所有參照圖像是被前記復原手段所解碼,且是在該當圖像所關連到之CRA圖像以後被解碼之共計3種。
本發明之另一側面所述之動態影像預測編碼方法,係屬於被動態影像預測編碼裝置所執行的動態影像預測編碼方法,其特徵為,具備:輸入步驟,係用以將構成動態影像的複數影像,進行輸入;和編碼步驟,係用以將前記影像藉由畫面內預測或畫面間預測之任一方法來進行編碼,以生成含有身為隨機存取點之影像的壓縮影像資料,並且將各影像的輸出順序資訊予以編碼;和復原步驟,係用以將前記壓縮影像資料進行解碼,以復原出再生影像;和影像儲存步驟,係用以將前記再生影像,當作後續影像進行編碼所需使用之參照影像而儲存1個以上;和控制步驟,係用以控制前記影像儲存步驟;在前記控制步驟中,前記動態影像預測編碼裝置係進行控制,將前記影像分類成:1)編碼資料之解碼被開始的CRA圖像;2)比該當圖像所關連到之CRA圖像之後被解碼,比前記關連到之CRA圖像先輸出,前記復原步驟所做的解碼處理會被略過,在前記影像儲存步驟中不被儲存且不被輸出的圖像,該當圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,前記復原步驟所做的解碼處理會
被略過的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)被前記復原步驟所解碼,因應需要而為了參照而在前記影像儲存步驟中被儲存的圖像,該當圖像的特徵為,該當圖像係為了進行畫面間預測而持有參照圖像之清單,該當參照圖像之清單裡頭的所有參照圖像是被前記復原步驟所解碼,且是在該當圖像所關連到之CRA圖像以後被解碼之共計3種。
本發明之另一側面所述之動態影像預測編碼程式,其特徵為,令電腦發揮機能而成為:輸入手段,係用以將構成動態影像的複數影像,進行輸入;和編碼手段,係用以將前記影像藉由畫面內預測或畫面間預測之任一方法來進行編碼,以生成含有身為隨機存取點之影像的壓縮影像資料,並且將各影像的輸出順序資訊予以編碼;和復原手段,係用以將前記壓縮影像資料進行解碼,以復原出再生影像;和影像儲存手段,係用以將前記再生影像,當作後續影像進行編碼所需使用之參照影像而儲存1個以上;和控制手段,係用以控制前記影像儲存手段;前記控制手段係進行控制,將前記影像分類成:1)編碼資料之解碼被開始的CRA圖像;2)比該當圖像所關連到之CRA圖像之後被解碼,比前記關連到之CRA圖像先輸出,前記復原手段所做的解碼處理會被略過,不被儲存在前記影像儲存手段中且不被
輸出的圖像,該當圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,前記復原手段所做的解碼處理會被略過的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)被前記復原手段所解碼,因應需要而為了參照而被儲存在前記影像儲存手段中的圖像,該當圖像的特徵為,該當圖像係為了進行畫面間預測而持有參照圖像之清單,該當參照圖像之清單裡頭的所有參照圖像是被前記復原手段所解碼,且是在該當圖像所關連到之CRA圖像以後被解碼之共計3種。
本發明之另一側面所述之動態影像預測解碼裝置,其特徵為,具備:輸入手段,係用以將藉由對構成動態影像之複數影像進行畫面內預測或是畫面間預測之任一者所致之編碼而得到的含有隨機存取影像的壓縮影像資料、和表示各影像之輸出順序的編碼資料,予以輸入;和復原手段,係用以將前記壓縮影像資料與前記編碼資料進行解碼,復原成再生影像與輸出順序資訊;和影像儲存手段,係用以將前記再生影像,當作後續影像進行解碼所需使用之參照影像而儲存1個以上;和控制手段,係用以控制前記復原手段;前記控制手段係進行控制而將前記影像分類成:1)編碼資料之解碼被開始的CRA圖像;2)比該當圖像所關連到之CRA圖像之後被解碼,比
前記關連到之CRA圖像先輸出,前記復原手段所做的解碼處理會被略過,不被儲存在前記影像儲存手段中且不被輸出的圖像,該當圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,前記復原手段所做的解碼處理會被略過的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)被前記復原手段所解碼,因應需要而為了參照而被儲存在前記影像儲存手段中的圖像,該當圖像的特徵為,該當圖像係為了進行畫面間預測而持有參照圖像之清單,該當參照圖像之清單裡頭的所有參照圖像是被前記復原手段所解碼,且是在該當圖像所關連到之CRA圖像以後被解碼之共計3種;前記復原手段,係當編碼資料之解碼是從該當圖像所關連到之CRA圖像被開始時,則持續進行判定存在於該當圖像所相關之參照圖像之清單裡頭所有的參照圖像是否有被儲存在前記影像儲存手段中,若位於參照圖像之清單裡頭所有的參照圖像都有被儲存則將該當圖像予以解碼,若位於參照圖像之清單裡頭的1個以上之參照圖像未被儲存則略過該當圖像之解碼的此種解碼處理,直到下個CRA圖像的處理之前為止的期間。
本發明之另一側面所述之動態影像預測解碼方法,係屬於被動態影像預測解碼裝置所執行的動態影像預測解碼方法,其特徵為,具備:輸入步驟,係用以將藉由對構成動態影像之複數影像進行畫面內預測或是畫面間
預測之任一者所致之編碼而得到的含有隨機存取影像的壓縮影像資料、和表示各影像之輸出順序的編碼資料,予以輸入;和復原步驟,係用以將前記壓縮影像資料與前記編碼資料進行解碼,復原成再生影像與輸出順序資訊;和影像儲存步驟,係用以將前記再生影像,當作後續影像進行解碼所需使用之參照影像而儲存1個以上;和控制步驟,係用以控制前記復原步驟;在前記控制步驟中,前記動態影像預測解碼裝置係進行控制而將前記影像分類成:1)編碼資料之解碼被開始的CRA圖像;2)比該當圖像所關連到之CRA圖像之後被解碼,比前記關連到之CRA圖像先輸出,前記復原步驟所做的解碼處理會被略過,在前記影像儲存步驟中不被儲存且不被輸出的圖像,該當圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,前記復原步驟所做的解碼處理會被略過的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)被前記復原步驟所解碼,因應需要而為了參照而在前記影像儲存步驟中被儲存的圖像,該當圖像的特徵為,該當圖像係為了進行畫面間預測而持有參照圖像之清單,該當參照圖像之清單裡頭的所有參照圖像是被前記復原步驟所解碼,且是在該當圖像所關連到之CRA圖像以後被解碼之共計3種;在前記復原步驟中,前記動態影像預測解碼裝置係當編碼資料之解碼是從該當圖像所關連到之
CRA圖像被開始時,則持續進行判定存在於該當圖像所相關之參照圖像之清單裡頭所有的參照圖像是否在前記影像儲存步驟中有被儲存,若位於參照圖像之清單裡頭所有的參照圖像都有被儲存則將該當圖像予以解碼,若位於參照圖像之清單裡頭的1個以上之參照圖像未被儲存則略過該當圖像之解碼的此種解碼處理,直到下個CRA圖像的處理之前為止的期間。
本發明之另一側面所述之動態影像預測解碼程式,其特徵為,令電腦發揮機能而成為:輸入手段,係用以將藉由對構成動態影像之複數影像進行畫面內預測或是畫面間預測之任一者所致之編碼而得到的含有隨機存取影像的壓縮影像資料、和表示各影像之輸出順序的編碼資料,予以輸入;和復原手段,係用以將前記壓縮影像資料與前記編碼資料進行解碼,復原成再生影像與輸出順序資訊;和影像儲存手段,係用以將前記再生影像,當作後續影像進行解碼所需使用之參照影像而儲存1個以上;和控制手段,係用以控制前記復原手段;前記控制手段係進行控制而將前記影像分類成:1)編碼資料之解碼被開始的CRA圖像;2)比該當圖像所關連到之CRA圖像之後被解碼,比前記關連到之CRA圖像先輸出,前記復原手段所做的解碼處理會被略過,不被儲存在前記影像儲存手段中且不被輸出的圖像,該當圖像係為了進行畫面間預測而持有參照圖像之清單,其中含有,前記復原手段所做的解碼處理會
被略過的至少1個參照圖像、或對前記關連到之CRA圖像在解碼順序上較為前面的至少1個參照圖像;3)被前記復原手段所解碼,因應需要而為了參照而被儲存在前記影像儲存手段中的圖像,該當圖像的特徵為,該當圖像係為了進行畫面間預測而持有參照圖像之清單,該當參照圖像之清單裡頭的所有參照圖像是被前記復原手段所解碼,且是在該當圖像所關連到之CRA圖像以後被解碼之共計3種;前記復原手段,係當編碼資料之解碼是從該當圖像所關連到之CRA圖像被開始時,則持續進行判定存在於該當圖像所相關之參照圖像之清單裡頭所有的參照圖像是否有被儲存在前記影像儲存手段中,若位於參照圖像之清單裡頭所有的參照圖像都有被儲存則將該當圖像予以解碼,若位於參照圖像之清單裡頭的1個以上之參照圖像未被儲存則略過該當圖像之解碼的此種解碼處理,直到下個CRA圖像的處理之前為止的期間。
若依據本發明,則藉由設計成能夠判別出可解碼之圖像,可將可解碼之圖像當作後續圖像的參照圖像來利用,可對預測性能改善有所貢獻。更詳言之,動態影像預測解碼裝置,係當從位元串流之開頭的CRA圖像起開始解碼時,(藉由標籤之利用或與參照圖像集之比對)可偵測出某圖像是否正確地解碼。因此,動態影像預測解
碼裝置,係可不是把所有的領先圖像都丟棄,改為僅選擇無法解碼之圖像而丟棄,可將可解碼之圖像當作後續圖像的參照圖像來利用,可對預測性能改善有所貢獻。
10‧‧‧記錄媒體
30‧‧‧電腦
100‧‧‧動態影像預測編碼裝置
101‧‧‧輸入端子
102‧‧‧區塊分割器
103‧‧‧預測訊號生成器
104‧‧‧畫格記憶體
105‧‧‧減算器
106‧‧‧轉換器
107‧‧‧量化器
108‧‧‧逆量化器
109‧‧‧逆轉換器
110‧‧‧加算器
111‧‧‧熵編碼器
112‧‧‧輸出端子
113‧‧‧輸入端子
114‧‧‧畫格記憶體管理器
200‧‧‧動態影像預測解碼裝置
201‧‧‧輸入端子
202‧‧‧資料解析器
203‧‧‧逆量化器
204‧‧‧逆轉換器
205‧‧‧加算器
206‧‧‧輸出端子
207‧‧‧畫格記憶體
208‧‧‧預測訊號生成器
209‧‧‧畫格記憶體管理器
210‧‧‧控制器
P100‧‧‧動態影像預測編碼程式
P101‧‧‧輸入模組
P102‧‧‧編碼模組
P103‧‧‧復原模組
P104‧‧‧影像儲存模組
P105‧‧‧控制模組
P200‧‧‧動態影像預測解碼程式
P201‧‧‧輸入模組
P202‧‧‧復原模組
P203‧‧‧影像儲存模組
P204‧‧‧控制模組
[圖1]本發明的實施形態所述之動態影像預測編碼裝置的區塊圖。
[圖2]本發明的實施形態所述之動態影像預測解碼裝置的區塊圖。
[圖3]本發明的實施形態所述之語法元素的說明圖。
[圖4]本發明的實施形態所述之動態影像預測編碼方法的流程圖。
[圖5]本發明的實施形態所述之動態影像預測解碼方法的流程圖。
[圖6]將記錄媒體中所記錄之程式加以執行所需之電腦的硬體構成之圖示。
[圖7]將記錄媒體中所記憶之程式加以執行所需之電腦的概觀圖。
[圖8]動態影像預測編碼程式之構成例的區塊圖。
[圖9]動態影像預測解碼程式之構成例的區塊圖。
[圖10]本發明之背景的說明圖。
以下,針對本發明的實施形態,使用圖1~圖9來說明。
圖1係本實施形態所述之動態影像預測編碼裝置100之構成的機能區塊圖。如圖1所示,動態影像預測編碼裝置100,作為其功能性構成,係具備:輸入端子101、區塊分割器102、預測訊號生成器103、畫格記憶體104、減算器105、轉換器106、量化器107、逆量化器108、逆轉換器109、加算器110、熵編碼器111、輸出端子112、輸入端子113、及畫格記憶體管理器(或稱緩衝區管理器)114。各功能區塊的動作,係在後述的動態影像預測編碼裝置100之動作中說明。此外,轉換器106及量化器107係對應於編碼手段,逆量化器108、逆轉換器109及加算器110係對應於解碼手段。
關於如以上所構成的動態影像預測編碼裝置100之動作,說明如下。由複數張影像所成之動態影像的訊號,係被輸入至輸入端子101。身為編碼處理對象之影像,係於區塊分割器102中,被分割成複數領域。在本實施形態中,係被分割成8×8像素所成的區塊,但亦可分割成其以外之區塊大小或形狀。接著,對於編碼處理對象之領域(以下稱作「對象區塊」),生成預測訊號。在本實施形態中,係使用2種預測方法。亦即,畫面間預測和畫面內預測。
在畫面間預測時,係將過去曾被編碼之後又被復原的再生影像當作參照影像,從該參照影像,求出能夠對於對象區塊給予最小誤差之預測訊號的運動資訊。該處理係被稱作運動偵測。又,因應情況,亦可將對象區塊作再分割,對已被再分割之小領域,決定畫面間預測方法。此情況下,從各種分割方法之中,決定出對對象區塊全體為效率最佳的分割方法及各自的運動資訊。在本發明所述的實施形態中,是於預測訊號生成器103中進行之,對象區塊係經由線L102,參照影像係經由L104而輸入。作為參照影像,係將過去曾被編碼而被復原過的複數影像,當作參照影像而使用。細節是和先前技術的MPEG-2、4、H.264之任一方法相同。如此所被決定的運動資訊及小領域之分割方法,係經由線L112而被送往熵編碼器111而被編碼後,從輸出端子112送出。又,在複數參照影像之中,關於預測訊號是從哪個參照影像所取得的資訊(參照索引),也是經由線L112而被送往熵編碼器111。此外,在本發明所述之實施形態中,係將4張至5張的再生影像儲存在畫格記憶體104中,當作參照影像來使用。在預測訊號生成器103中,根據小領域之分割方法及各個小領域所對應之參照影像與運動資訊,而從畫格記憶體104中取得參照影像訊號,生成預測訊號。如此所被生成的畫面間預測訊號,係經由線L103而被送至減算器105。
在畫面內預測時,在對象區塊中使用空間上
相鄰的已再生之像素值,來生成畫面內預測訊號。具體而言,在預測訊號生成器103中,係從畫格記憶體104取得位在相同畫面內的已再生之像素訊號,將這些訊號進行外插以生成畫面內預測訊號。關於外插之方法的資訊,係經由線L112而被送往熵編碼器111而被編碼後,從輸出端子112送出。如此所被生成的畫面內預測訊號,係被送至減算器105。預測訊號生成器103中的畫面內之預測訊號生成方法,係和先前技術的H.264的方法相同。對於如上述所求出的畫面間預測訊號和畫面內預測訊號,選擇出誤差最小者,送往減算器105。
關於第一張影像,由於沒有比其還前面的影像,因此全部的對象區塊係用畫面內預測而處理之。又,為了電視頻道之切換,而被定期地視為隨機存取點的對象區塊,係以畫面內預測而被處理。此種影像係稱作Intra Frame,在H.264中稱作IDR圖像。
在減算器105中,從對象區塊的訊號(經由線L102)中扣除預測訊號(經由線L103),生成殘差訊號。該殘差訊號係於轉換器106中進行離散餘弦轉換,其各係數係於量化器107中被量化。最後於熵編碼器111中將已被量化之轉換係數加以編碼,連同關於預測方法之資訊一起被輸出端子112送出。
為了進行後續的對於對象區塊的畫面內預測或是畫面間預測,壓縮過的對象區塊的訊號,係被逆處理而復原。亦即,已被量化之轉換係數,係於逆量化器108
中被逆量化之後,於逆轉換器109中被進行逆離散餘弦轉換,將殘差訊號予以復原。於加算器110中,將已被復原的殘差訊號與從線L103所送來的預測訊號進行加算,再生出對象區塊的訊號,儲存至畫格記憶體104。在本實施形態中雖然是使用轉換器106與逆轉換器109,但亦可不使用這些轉換器而改用其他的轉換處理。亦可因應情況,而沒有轉換器106和逆轉換器109。
畫格記憶體104係為有限,要儲存所有的再生影像是不可能的。只有後述的影像編碼所用的再生影像,會被儲存在畫格記憶體104中。控制該畫格記憶體104的係為畫格記憶體管理器114。畫格記憶體管理器114,係經由線L115來進行控制,從位於畫格記憶體104內的N張(此處N=4,但亦可為預先決定之整數)的再生影像之中,刪除多餘者(例如最舊者)而可儲存被作為參照影像所使用的最近之再生影像。由輸入端子113而輸入各影像之輸出順序資訊或影像編碼類型(畫面內預測編碼、畫面間預測編碼、雙向預測編碼),且參照索引也經由線L112而被輸入,畫格記憶體管理器114係基於這些資訊而動作。
同時,各影像之輸出順序資訊、或後述的NAL單元類型之資訊係因應需要而經由線L114而被送往熵編碼器111,被編碼後連同已被壓縮之影像資料一起被輸出。輸出順序資訊,係附隨於各影像,可為表示影像之順序或亦可為影像的輸出時刻,也可為影像的輸出參照時
間(時間性參照)。在本實施形態中,係將輸出順序資訊之值直接轉換成二值編碼。本實施形態的畫格記憶體管理器114之動作,將於後述。
接著,說明本發明所述之動態影像預測解碼裝置。圖2係本實施形態所述之動態影像預測解碼裝置200之構成的機能區塊圖。如圖2所示,動態影像預測解碼裝置200,作為其功能性構成,係具備:輸入端子201、資料解析器202、逆量化器203、逆轉換器204、加算器205、預測訊號生成器208、畫格記憶體207、輸出端子206、畫格記憶體管理器209、控制器210、及切換器211。各功能區塊的動作,係在後述的動態影像預測解碼裝置200之動作中說明。逆量化器203及逆轉換器204係對應於解碼手段。此外,作為涉及解碼的手段,係不限定於逆量化器203及逆轉換器204,亦可使用這些以外者。又,涉及解碼的手段,亦可沒有逆轉換器204而僅以逆量化器203來構成。
以下,說明動態影像預測解碼裝置200之動作。於動態影像預測編碼裝置100中,被上述方法所壓縮編碼過的壓縮資料,係從輸入端子201輸入。該壓縮資料中係含有,將影像分割成複數區塊而成的對象區塊進行了預測編碼而成的殘差訊號及預測訊號之生成的關連資訊。作為預測訊號之生成的關連資訊,係若為畫面間預測時則
是包含有關於區塊分割之資訊(區塊的尺寸)、運動資訊和上述的參照索引或NAL單元類型的相關資訊,若為畫面內預測時則含有關於從周邊之已再生之像素進行外插方法的資訊。
在資料解析器202上,從壓縮資料抽出對象區塊的殘差訊號、預測訊號之生成的關連資訊、量化參數、影像的輸出順序資訊。對象區塊的殘差訊號係在逆量化器203中根據量化參數(經由線L202及L211)而被逆量化。其結果係於逆轉換器204中進行逆離散餘弦轉換。
接著,經由線L206b,預測訊號之生成的關連資訊係被送往預測訊號生成器208。在預測訊號生成器208中,係根據預測訊號之生成的關連資訊,向畫格記憶體207進行存取,從複數複數參照影像之中(經由線L207)取得參照訊號以生成預測訊號。此預測訊號係經由線L208而被送往加算器205,被加算至已被復原的殘差訊號,再生出對象區塊訊號,經由線L205而從輸出端子206輸出的同時,被儲存至畫格記憶體207中。
在畫格記憶體207中係儲存有,後續之影像的解碼、再生時所使用的再生影像。畫格記憶體管理器209係透過線L209a來控制畫格記憶體207。畫格記憶體207係被控制成,從所儲存的N張(此處N=4,但亦可為預先決定之整數)的再生影像之中,刪除多餘者(例如最舊者)而可儲存被作為參照影像所使用的最近之再生影像。
控制器210,係基於經由線L206a所送來的對象影像之輸出順序資訊和影像之編碼類型及NAL單元類型之相關資訊而動作。或是基於經由線L206a而被送來的參照索引和經由線L209b而被送來的畫格記憶體中所儲存之畫格之資訊而動作。本發明所致之控制器210之動作,將於後述。
切換器211係被控制器210透過線L210所控制,因應條件略過特定之畫格之解碼而動作。本發明所致之切換器211之動作,將於後述。
圖3中係圖示了位元串流的語法元素500。位元串流的語法元素500係由一個圖像(510、520等)之解碼上所必須之複數語法元素所構成。在圖像的語法中係要注意以下3個元素。
1)網路適配層單元類型(NUT)或NAL單元類型(530)
2)圖像輸出計數(POC)(540)
3)參照圖像集(RPS)(550)
1)NUT係含有關於圖像類型之資訊。本發明中係亦可使用將圖像類型予以傳訊的其他手段,這點請留意。在本實施形態中,各圖像係被視為3種類之NAL單元類型當中之一者,而被貼標籤。所謂NAL單元類型,係為以下所述的RAS、CRA、non-RAS。
被貼標籤成為RAS(隨機存取略過)圖像的圖像,係在從該RAS圖像所關連到之CRA圖像開始解碼
之際,會被略過而不被輸出。另一方面,若前記CRA圖像不是位元串流的最初之圖像(或解碼不是從前記CRA圖像開始時),則動態影像預測解碼裝置200係將RAS圖像視為non-RAS圖像,依照該圖像之輸出指示而進行解碼,當作輸出。
被貼標籤成為CRA(乾淨隨機存取)圖像的圖像係表示,若位元串流之解碼是從該CRA圖像開始解碼,則前記CRA圖像所關連到之RAS圖像以外之圖像是可無錯誤地解碼。
被貼標籤成為non-RAS圖像的圖像,係被動態影像預測解碼裝置200所解碼,依照圖像之輸出指示而被輸出。CRA圖像若無特別聲明,則被視為non-RAS圖像。
2)POC係含有所被輸出之圖像之順序的資訊。
3)RPS係含有,目前圖像的畫面間預測所需使用的參照圖像之資訊。不存在於RPS的再生影像緩衝區(DPB)中的參照圖像,係無法作為被目前圖像或任一圖像做預測解碼所需之參照圖像來利用。
於本實施形態中,係當位元串流之解碼是從CRA圖像開始解碼時,則保證所有的non-RAS圖像都能正確解碼,因此關於RPS係具有以下特徵。
特徵1:關於被領先圖像所利用的RPS,若一個以上之參照圖像(或至少一個參照圖像)是RAS圖像,或
是,若在解碼順序上比所關連到之CRA圖像還前面時,則該領先圖像係視為RAS圖像。
特徵2:被non-RAS圖像所利用的RPS中所存在的所有參照圖像係視為屬於non-RAS圖像之參照圖像、且係為所關連到之CRA圖像以後被解碼的參照圖像。
於本實施形態中,係通常圖像係被視為non-RAS圖像,因此不滿足特徵1和2的圖像,係在位元串流中不被容許。然而,本發明係不限定於特徵1所述之領先圖像,亦可對所有的圖像同等地適用。關於特徵2,本發明係義可適用於限制成參照圖像僅為領先圖像的情形。
使用圖4來說明,本發明之重點的具有前述特徵之位元串流生成所需的動態影像預測編碼裝置100之動作。動態影像預測編碼裝置100係為了實現隨機存取,而以一定週期插入至CRA圖像。該被插入之CRA圖像的編碼順序上後續的所有圖像,係直到下個CRA圖像被插入為止的期間,是依照該當所被插入之CRA圖像所關連到的以軋之步驟,而被編碼。
於步驟620中,判定該當圖像之RPS中所含之參照圖像的1張以上,是否為RAS圖像。若該當圖像之RPS中所含之參照圖像的1張以上是RAS圖像(YES)則前進至步驟650,若非如此時(NO)則前進至步驟630。
於步驟630中,判定該當圖像之RPS中所含之參照圖像的1張以上,是否編碼順序上比該當圖像所關連到之CRA圖像還前面。若該當圖像之RPS中所含之參照圖像的1張以上,是在編碼順序上比該當圖像所關連到之CRA圖像還前面(YES)則前進至步驟650,若非如此時(NO)則前進至步驟640。
於步驟650中,藉由將該當圖像之POC與該當圖像所關連到之CRA圖像之POC進行比較,以檢查該當圖像是否為領先圖像。若將該當圖像之POC小於該當圖像所關連到之CRA圖像之POC,則判定該當圖像是領先圖像(YES),前進至步驟670。若非如此,則判定為該當圖像不是領先圖像(NO),但步驟620及步驟630之判定係僅針對領先圖像(YES),該當圖像不是領先圖像(NO)的判定結果係為異常,因此前進至步驟660而輸出錯誤訊息而前進至步驟680。此外,亦可在步驟660中輸出了錯誤訊息之後,將圖4的處理予以異常結束。
於步驟670中,該當圖像係被視為RAS圖像而編碼,該當圖像係為RAS圖像的此一資訊(NAL單元類型:RAS)會被編碼。其後,前進至步驟680。
於步驟640中,將該當圖像被視為non-RAS而編碼,該當圖像係為non-RAS的此一資訊(NAL單元類型:non-RAS)會被編碼。其後,前進至步驟680。此處,若無特別聲明,則CRA圖像係被包含在non-RAS圖像中。
於步驟640與670中,該當圖像是否為RAS圖像還是non-RAS圖像的此一資訊係並不一定要編碼,亦可不編碼該當資訊,藉由比對各圖像之參照圖像清單與畫格記憶體104中所儲存之圖像,來判定該當圖像是否為RAS圖像還是non-RAS圖像。
於步驟680中,動態影像預測編碼裝置100係判定是否還有要編碼的圖像,若有(YES)則返回步驟620而重複處理,反之若無(NO)則結束圖4之處理。
上述的一連串處理,雖然該當於圖1的動態影像預測編碼裝置100全體之處理,但尤其是步驟620、630、650之判定處理是由畫格記憶體管理器114所進行。
本實施形態所述之動態影像預測解碼裝置200中,解碼處理是從作為位元串流之最初圖像的CRA圖像開始的時候,和位元串流之最初圖像不是CRA圖像的時候,動作不同。此解碼處理,係在下個CRA圖像之解碼時,回到通常的解碼處理。
使用圖5來說明,本發明之重點的具有前述特徵之位元串流解碼所需的動態影像預測解碼裝置200之動作。
於步驟710中,動態影像預測解碼裝置200係基於NAL單元類型來判定位元串流之最初圖像(亦即
位元串流之解碼開始的最初圖像)是否為CRA圖像。若最初圖像不是CRA圖像(NO),則前進至步驟780,動態影像預測解碼裝置200係將各圖像以通常方式進行解碼。亦即,在該步驟780中,RAS圖像係被視為non-RAS圖像,和通常一樣依照圖像內之指示而被解碼、輸出。另一方面,步驟710中若位元串流之最初圖像是CRA圖像(YES),則前進至步驟720。
步驟720至步驟770為止的處理,係直到下個CRA圖像之解碼被開始為止的期間,對所有的圖像重複執行之,其後在步驟780中回到通常的解碼處理。以下係說明步驟720至步驟770為止之處理。
於步驟720中,動態影像預測解碼裝置200係在該當圖像的解碼開始時,判定該當圖像是否被正確地解碼。本實施形態中的位元串流係具有前述特徵1、2,因此動態影像預測解碼裝置200係使用以下2個方法的其中至少1者,就可判定該當圖像是否正確地解碼。第1方法係為,觀看該當圖像的NAL單元類型之標籤的方法。若該當圖像是被貼標籤成為RAS圖像,則可判定該當圖像無法正確解碼。第2方法係為,動態影像預測解碼裝置200比對存在於DPB中的參照圖像、和該當圖像的RPS之參照圖像清單。若該當圖像之RPS中所存在的參照圖像的其中任一者係不存在於DPB中,則可判定該當圖像無法正確解碼。使用如以上的第1、第2方法之至少1者,若動態影像預測解碼裝置200判定該當圖像係可正確
解碼(YES),則前進至步驟730,若判定該當圖像係無法正確解碼(NO),則前進至步驟750。
於步驟730中,動態影像預測解碼裝置200係依照該當圖像內之指示,而將該當圖像予以解碼並輸出。這也適用於CRA圖像。其後,前進至步驟740。
於步驟750中,藉由將該當圖像之POC與該當圖像所關連到之CRA圖像之POC進行比較,以判定該當圖像是否為領先圖像。若將該當圖像之POC小於該當圖像所關連到之CRA圖像之POC(YES),則判定該當圖像係為領先圖像,前進至後述的步驟770。若非如此(NO)則該當圖像係不是領先圖像,會發生錯誤,因此前進至步驟760,動態影像預測解碼裝置200係輸出錯誤訊息而前進至步驟740。此外,亦可在步驟760中輸出了錯誤訊息之後,將圖5的處理予以異常結束。又,如前述,步驟750之判定,係只有在被限定成特徵1是僅為領先圖像的情形,這點需要留意。
於步驟770中,動態影像預測解碼裝置200係略過該當圖像之解碼,進行如下的必須之內務處理。此處,作為必要之內務處理,係可舉例如,對於被略過之該當圖像,進行表示「不可作為參照圖像來利用而不被輸出」之貼標籤的處理等。其後,前進至步驟740。
於步驟740中,動態影像預測解碼裝置200係判定下個被解碼之圖像是否為CRA圖像,若下個圖像不是CRA圖像(NO)則回到步驟720而重複處理。另一
方面,若下個圖像是CRA圖像(YES),則下個CRA圖像以後就不需要本發明所述之解碼處理(隨機存取解碼處理),因此前進至步驟780,進入通常的解碼處理(所有的圖像都被解碼而按照輸出指示資訊而被輸出之處理)。
上述一連串處理,係該當於圖2的動態影像預測解碼裝置200全體之處理,但尤其是步驟720、750之判定及步驟730、770之控制,係由控制器210所進行。
若依據如以上之本實施形態,則動態影像預測解碼裝置200係當從位元串流之開頭的CRA圖像起開始解碼時,(藉由標籤之利用或與參照圖像集之比對)可偵測出某圖像是否正確地解碼。因此,動態影像預測解碼裝置200係可不是把所有的領先圖像都丟棄,改為僅選擇無法解碼之圖像而丟棄,可將可解碼之圖像當作後續圖像的參照圖像來利用,可對預測性能改善有所貢獻。
此外,對圖像分配有RAS此種NAL單元類型之際,動態影像預測編碼裝置100係會生成可正確解碼之圖像和無法正確解碼之圖像。另一方面,動態影像預測解碼裝置200係不會輸出無法正確解碼之圖像。藉此,所被輸出之圖像中會產生時間性間隙,有可能影響到畫格的輸出速率。隨著系統不同,有時候在輸出中帶有間隙,並不理想。於本實施形態中,動態影像預測編碼裝置100係將這些RAS圖像中是否有間隙,作為追加資訊,藉由CRA圖像標頭或視訊可用性語法(YUI)之中的旗標,來對動
態影像預測解碼裝置200進行指示。收取到該旗標的動態影像預測解碼裝置200,係可選擇是否將能正確解碼但有間隙之領先圖像予以輸出。
又,作為與上述不同的手段,亦可對位元串流設定更多限制,來使得輸出順序早於CRA圖像的RAS圖像中不會產生間隙。亦即,亦可使位元串流被連續輸出以使其不會產生RAS圖像之間隙。
作為又再另一個手段,亦可設計成,動態影像預測解碼裝置200不依存於來自動態影像預測編碼裝置100的其他追加資訊、或圖像之輸出指示資訊,都決定會將non-RAS之領先圖像予以解碼但不輸出。
於本實施形態中,係NAL單元類型(RAS、CRA、non-RAS)的標籤,係被動態影像預測解碼裝置200所偵測並使用,但NAL單元類型之標籤係亦可再網路內的其他裝置(例如伺服器、適切之網路成員等)中,在從隨機存取點開始解碼之際,也可為了執行丟棄RAS圖像之處理而被偵測並使用。藉此,就可節省網路的頻寬。
於本實施形態中,位元串流係可含有多數的CRA圖像,存在有各個CRA圖像所關連到之RAS圖像。若解碼順序第2個CRA圖像是接續在第1個CRA圖像之後,則不容許前述第2個CRA圖像的RPS含有比第1個CRA圖像更前面被解碼的參照圖像。藉此,若第1個CRA圖像是位元串流之最初圖像,則第2個CRA圖像的RAS圖像係被保證可以解碼。
涉及動態影像預測編碼裝置100之發明,係可視為涉及令電腦成為動態影像預測編碼裝置100而發揮機能的動態影像預測編碼程式之發明。同樣地,涉及動態影像預測解碼裝置200之發明,係可視為涉及令電腦成為動態影像預測解碼裝置200而發揮機能的動態影像預測解碼程式之發明。
動態影像預測編碼程式及動態影像預測解碼程式,係例如被儲存在記錄媒體中來提供。此外,作為記錄媒體則例如有,軟碟片、CD-ROM、USB等記憶體、DVD、半導體記憶體等。
圖8中係圖示了,用來使電腦成為動態影像預測編碼裝置100而發揮機能所需的動態影像預測編碼程式之模組。如圖8所示,動態影像預測編碼程式P100,係具備:輸入模組P101、編碼模組P102、復原模組P103、影像儲存模組P104、及控制模組P105。
又,圖9中係圖示了,用來使電腦成為動態影像預測解碼裝置200而發揮機能所需的動態影像預測解碼程式之模組。如圖9所示,動態影像預測解碼程式P200,係具備:輸入模組P201、復原模組P202、影像儲存模組P203、及控制模組P204。
如上記所被構成的動態影像預測編碼程式P100及動態影像預測解碼程式P200,係可記憶在圖6及
圖7所示的記錄媒體10中,被後述的電腦30所執行。
圖6係將記錄媒體中所記錄之程式加以執行所需之電腦的硬體構成之圖示,圖7係將記錄媒體中所記憶之程式加以執行所需之電腦的概觀圖。作為電腦,亦包含具備CPU而可進行軟體所致之處理及控制的DVD播放器、機上盒、行動電話等。
如圖6所示,電腦30係具備:軟碟片驅動裝置、CD-ROM驅動裝置、DVD驅動裝置等之讀取裝置12、讓作業系統常駐的作業用記憶體(RAM)14、用來記憶記錄媒體10中所記憶之程式的記憶體16、顯示器這類顯示裝置18、屬於輸入裝置的滑鼠20及鍵盤22、進行資料等之收送訊用的通訊裝置24、控制著程式之執行的CPU26。電腦30,係一旦記錄媒體10被插入至讀取裝置12,則可從讀取裝置12存取記錄媒體10中所儲存的動態影像預測編碼程式,藉由執行該當動態影像預測編碼程式,就可成為本發明所述之動態影像預測編碼裝置而作動。同樣地,電腦30,係一旦記錄媒體10被插入至讀取裝置12,則可從讀取裝置12存取記錄媒體10中所儲存的動態影像預測解碼程式,藉由執行該當動態影像預測解碼程式,就可成為本發明所述之動態影像預測解碼裝置而作動。
如圖7所示,動態影像預測編碼程式或動態影像預測解碼程式,係可以被重疊於載波之電腦資料訊號40的方式,透過網路而提供。此時,電腦30,係將通訊
裝置24所接收到的動態影像預測編碼程式或動態影像預測解碼程式儲存在記憶體16,就可執行該當動態影像預測編碼程式或該當動態影像預測解碼程式。
Claims (2)
- 一種動態影像預測解碼裝置,其特徵為,具備:輸入手段,係用以輸入含有壓縮影像資料的位元串流,其中,該壓縮影像資料係為,構成動態影像的複數圖像所需之壓縮影像資料,且每一圖像地具有:用來將該當圖像識別成為,包含隨機存取圖像、隨機存取略過(RAS)領導圖像、non-RAS領導圖像之複數圖像類型之其中一種的NAL(Network Abstraction Layer)單元類型之資訊;和復原手段,係用以基於前記圖像類型,而將前記壓縮影像資料進行解碼,以復原出再生影像;和輸出手段,係用以輸出前記再生影像;其中,1)隨機存取圖像係為,從前記位元串流的任意隨機存取圖像所被開始的解碼處理是從該當隨機存取圖像被開始的情況下,在解碼順序上為前記位元串流之最初圖像;2)RAS領導圖像係為,在輸出順序上早於關連之隨機存取圖像的圖像,且在關連之隨機存取圖像是在解碼順序上為前記位元串流之最初圖像的情況下係為無法解碼的圖像;3)non-RAS領導圖像係為,在輸出順序上早於關連之隨機存取圖像的圖像,且為可以解碼的圖像;第2隨機存取圖像是在第1隨機存取圖像之後被解碼的情況下,前記第2隨機存取圖像的參照圖像集係不包含:在解碼順序上比前記第1隨機存取圖像前面的任一圖像;若關連之隨機存取圖像是在解碼順序上為前記位元串流之最初圖像,則RAS領導圖像係不被輸出。
- 一種動態影像預測解碼方法,係屬於被動態影像預測解碼裝置所執行的動態影像預測解碼方法,其特徵為,具備:輸入步驟,係用以輸入含有壓縮影像資料的位元串流,其中,該壓縮影像資料係為,構成動態影像的複數圖像所需之壓縮影像資料,且每一圖像地具有:用來將該當圖像識別成為,包含隨機存取圖像、隨機存取略過(RAS)領導圖像、non-RAS領導圖像之複數圖像類型之其中一種的NAL(Network Abstraction Layer)單元類型之資訊;和復原步驟,係用以基於前記圖像類型,而將前記壓縮影像資料進行解碼,以復原出再生影像;和輸出步驟,係用以輸出前記再生影像;其中,1)隨機存取圖像係為,從前記位元串流的任意隨機存取圖像所被開始的解碼處理是從該當隨機存取圖像被開始的情況下,在解碼順序上為前記位元串流之最初圖像;2)RAS領導圖像係為,在輸出順序上早於關連之隨機存取圖像的圖像,且在關連之隨機存取圖像是在解碼順序上為前記位元串流之最初圖像的情況下係為無法解碼的圖像;3)non-RAS領導圖像係為,在輸出順序上早於關連之隨機存取圖像的圖像,且為可以解碼的圖像;第2隨機存取圖像是在第1隨機存取圖像之後被解碼的情況下,前記第2隨機存取圖像的參照圖像集係不包含:在解碼順序上比前記第1隨機存取圖像前面的任一圖像;若關連之隨機存取圖像是在解碼順序上為前記位元串流之最初圖像,則RAS領導圖像係不被輸出。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012-145832 | 2012-06-28 | ||
JP2012145832A JP6045222B2 (ja) | 2012-06-28 | 2012-06-28 | 動画像予測復号装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201720161A TW201720161A (zh) | 2017-06-01 |
TWI626844B true TWI626844B (zh) | 2018-06-11 |
Family
ID=49782746
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104126101A TWI558175B (zh) | 2012-06-28 | 2013-04-25 | Motion picture prediction decoding device, method and program |
TW109108624A TWI737217B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼方法 |
TW102114845A TWI533673B (zh) | 2012-06-28 | 2013-04-25 | Motion picture prediction coding apparatus, method and program, and motion picture prediction decoding apparatus, method and program |
TW110125923A TWI790684B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼方法 |
TW106101881A TWI626844B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼裝置、動態影像預測解碼方法 |
TW105126233A TWI577180B (zh) | 2012-06-28 | 2013-04-25 | Dynamic image prediction decoding device, dynamic image prediction decoding method |
TW109108625A TWI735182B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼方法 |
TW107110113A TWI691201B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼方法 |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104126101A TWI558175B (zh) | 2012-06-28 | 2013-04-25 | Motion picture prediction decoding device, method and program |
TW109108624A TWI737217B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼方法 |
TW102114845A TWI533673B (zh) | 2012-06-28 | 2013-04-25 | Motion picture prediction coding apparatus, method and program, and motion picture prediction decoding apparatus, method and program |
TW110125923A TWI790684B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105126233A TWI577180B (zh) | 2012-06-28 | 2013-04-25 | Dynamic image prediction decoding device, dynamic image prediction decoding method |
TW109108625A TWI735182B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼方法 |
TW107110113A TWI691201B (zh) | 2012-06-28 | 2013-04-25 | 動態影像預測解碼方法 |
Country Status (21)
Country | Link |
---|---|
US (2) | US10075724B2 (zh) |
EP (2) | EP2869577B1 (zh) |
JP (1) | JP6045222B2 (zh) |
KR (7) | KR101970742B1 (zh) |
CN (5) | CN107257468B (zh) |
AU (1) | AU2013282452B8 (zh) |
BR (2) | BR112014029982B1 (zh) |
CA (6) | CA3118863C (zh) |
DK (1) | DK2869577T3 (zh) |
ES (1) | ES2949165T3 (zh) |
FI (1) | FI2869577T3 (zh) |
HU (1) | HUE062378T2 (zh) |
MX (3) | MX2020011525A (zh) |
MY (1) | MY166292A (zh) |
PH (3) | PH12018500651A1 (zh) |
PL (1) | PL2869577T3 (zh) |
PT (1) | PT2869577T (zh) |
RU (8) | RU2595534C1 (zh) |
SG (1) | SG11201407722UA (zh) |
TW (8) | TWI558175B (zh) |
WO (1) | WO2014002568A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6045222B2 (ja) | 2012-06-28 | 2016-12-14 | 株式会社Nttドコモ | 動画像予測復号装置、方法及びプログラム |
WO2014010300A1 (ja) | 2012-07-10 | 2014-01-16 | ソニー株式会社 | 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法 |
CN106993189B (zh) * | 2017-04-06 | 2019-10-15 | 北京工业大学 | 一种基于优化排序的屏幕内容视频编码方法 |
WO2019227491A1 (zh) * | 2018-06-01 | 2019-12-05 | 深圳市大疆创新科技有限公司 | 编码、解码方法及编码、解码设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008061164A2 (en) * | 2006-11-14 | 2008-05-22 | Qualcomm Incorporated | Systems and methods for channel switching |
WO2009090868A1 (ja) * | 2008-01-17 | 2009-07-23 | Panasonic Corporation | 3d映像が記録された記録媒体、3d映像を記録する記録装置、並びに3d映像を再生する再生装置及び再生方法 |
TW201206202A (en) * | 2010-03-17 | 2012-02-01 | Ntt Docomo Inc | Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6765963B2 (en) * | 2001-01-03 | 2004-07-20 | Nokia Corporation | Video decoder architecture and method for using same |
FI114679B (fi) * | 2002-04-29 | 2004-11-30 | Nokia Corp | Satunnaisaloituspisteet videokoodauksessa |
KR20050013050A (ko) * | 2002-05-28 | 2005-02-02 | 마쯔시다덴기산교 가부시키가이샤 | 동화상 데이터 재생 장치 |
CA2492751C (en) * | 2002-07-16 | 2012-06-12 | Nokia Corporation | A method for random access and gradual picture refresh in video coding |
US20040260827A1 (en) * | 2003-06-19 | 2004-12-23 | Nokia Corporation | Stream switching based on gradual decoder refresh |
US7991053B2 (en) * | 2004-05-04 | 2011-08-02 | Qualcomm Incorporated | Method and apparatus to enable acquisition of media in streaming applications |
TW200845724A (en) * | 2004-06-02 | 2008-11-16 | Matsushita Electric Ind Co Ltd | Multiplexing apparatus and demultiplexing apparatus |
ES2339587T3 (es) * | 2005-01-10 | 2010-05-21 | Panasonic Corporation | Aparato de codificacion de imagenes y aparato de decodificacion de imagenes. |
US8036281B2 (en) * | 2005-06-01 | 2011-10-11 | Canon Kabushiki Kaisha | Image coding apparatus and image coding method |
JP4642655B2 (ja) * | 2005-12-28 | 2011-03-02 | ソニー株式会社 | 再生装置および再生方法、プログラム、記録媒体、データ構造、記録媒体の製造方法および記録装置、並びに、データ構造の生成方法および生成装置 |
US8416859B2 (en) * | 2006-11-13 | 2013-04-09 | Cisco Technology, Inc. | Signalling and extraction in compressed video of pictures belonging to interdependency tiers |
US20090180546A1 (en) * | 2008-01-09 | 2009-07-16 | Rodriguez Arturo A | Assistance for processing pictures in concatenated video streams |
CN101198052B (zh) * | 2006-12-04 | 2010-05-19 | 华为技术有限公司 | 一种视频编码方法、解码方法及其装置 |
JP5023739B2 (ja) * | 2007-02-28 | 2012-09-12 | ソニー株式会社 | 画像情報符号化装置及び符号化方法 |
CN101389034B (zh) * | 2007-09-14 | 2010-06-09 | 华为技术有限公司 | 一种图像编/解码方法、装置及一种图像处理方法、系统 |
JPWO2009110160A1 (ja) * | 2008-03-07 | 2011-07-14 | 株式会社東芝 | 動画像符号化/復号化方法及び装置 |
DK3567852T3 (da) * | 2009-03-23 | 2023-01-16 | Ntt Docomo Inc | Billedforudsigelsesafkodningsindretning og billedforudsigelsesafkodningsfremgangsmåde |
EP2262267A1 (en) * | 2009-06-10 | 2010-12-15 | Panasonic Corporation | Filter coefficient coding scheme for video coding |
JP2011082683A (ja) * | 2009-10-05 | 2011-04-21 | Sony Corp | 画像処理装置、画像処理方法、及び、プログラム |
US9485546B2 (en) * | 2010-06-29 | 2016-11-01 | Qualcomm Incorporated | Signaling video samples for trick mode video representations |
MX337078B (es) * | 2011-07-02 | 2016-02-11 | Samsung Electronics Co Ltd | Metodo y aparato para multiplexar y desmultiplexar datos de video para identificar el estado de reproduccion de los datos de video. |
US9532055B2 (en) * | 2012-04-16 | 2016-12-27 | Microsoft Technology Licensing, Llc | Constraints and unit types to simplify video random access |
US9979958B2 (en) * | 2012-04-20 | 2018-05-22 | Qualcomm Incorporated | Decoded picture buffer processing for random access point pictures in video sequences |
US9591303B2 (en) * | 2012-06-28 | 2017-03-07 | Qualcomm Incorporated | Random access and signaling of long-term reference pictures in video coding |
JP6045222B2 (ja) | 2012-06-28 | 2016-12-14 | 株式会社Nttドコモ | 動画像予測復号装置、方法及びプログラム |
US9402076B2 (en) * | 2013-01-07 | 2016-07-26 | Qualcomm Incorporated | Video buffering operations for random access in video coding |
-
2012
- 2012-06-28 JP JP2012145832A patent/JP6045222B2/ja active Active
-
2013
- 2013-04-09 KR KR1020187031282A patent/KR101970742B1/ko active IP Right Grant
- 2013-04-09 CN CN201710270137.2A patent/CN107257468B/zh active Active
- 2013-04-09 WO PCT/JP2013/060730 patent/WO2014002568A1/ja active Application Filing
- 2013-04-09 PH PH12018500651A patent/PH12018500651A1/en unknown
- 2013-04-09 KR KR1020157002236A patent/KR101713692B1/ko active IP Right Grant
- 2013-04-09 PL PL13810810.5T patent/PL2869577T3/pl unknown
- 2013-04-09 EP EP13810810.5A patent/EP2869577B1/en active Active
- 2013-04-09 CA CA3118863A patent/CA3118863C/en active Active
- 2013-04-09 RU RU2015102302/08A patent/RU2595534C1/ru active
- 2013-04-09 CA CA2877916A patent/CA2877916C/en active Active
- 2013-04-09 MX MX2020011525A patent/MX2020011525A/es unknown
- 2013-04-09 RU RU2016125739A patent/RU2635885C1/ru active
- 2013-04-09 PT PT138108105T patent/PT2869577T/pt unknown
- 2013-04-09 CA CA3182737A patent/CA3182737A1/en active Pending
- 2013-04-09 SG SG11201407722UA patent/SG11201407722UA/en unknown
- 2013-04-09 CA CA3118862A patent/CA3118862C/en active Active
- 2013-04-09 PH PH12018501446A patent/PH12018501446A1/en unknown
- 2013-04-09 KR KR1020177004786A patent/KR101788732B1/ko active IP Right Grant
- 2013-04-09 MY MYPI2014703745A patent/MY166292A/en unknown
- 2013-04-09 CN CN201710270231.8A patent/CN107257469B/zh active Active
- 2013-04-09 KR KR1020197010560A patent/KR102076625B1/ko active IP Right Grant
- 2013-04-09 FI FIEP13810810.5T patent/FI2869577T3/fi active
- 2013-04-09 DK DK13810810.5T patent/DK2869577T3/da active
- 2013-04-09 CA CA3118999A patent/CA3118999C/en active Active
- 2013-04-09 KR KR1020177036875A patent/KR101915079B1/ko active IP Right Grant
- 2013-04-09 EP EP23166494.7A patent/EP4221216A1/en active Pending
- 2013-04-09 AU AU2013282452A patent/AU2013282452B8/en active Active
- 2013-04-09 HU HUE13810810A patent/HUE062378T2/hu unknown
- 2013-04-09 CA CA3001601A patent/CA3001601C/en active Active
- 2013-04-09 MX MX2014015526A patent/MX337791B/es active IP Right Grant
- 2013-04-09 KR KR1020177029581A patent/KR101817272B1/ko active IP Right Grant
- 2013-04-09 CN CN201380033192.XA patent/CN104380735B/zh active Active
- 2013-04-09 CN CN201710961954.2A patent/CN107743230B/zh active Active
- 2013-04-09 CN CN201710270232.2A patent/CN107257470B/zh active Active
- 2013-04-09 ES ES13810810T patent/ES2949165T3/es active Active
- 2013-04-09 BR BR112014029982-0A patent/BR112014029982B1/pt active IP Right Grant
- 2013-04-09 BR BR122015023446-8A patent/BR122015023446B1/pt active IP Right Grant
- 2013-04-09 KR KR1020207003485A patent/KR102123961B1/ko active IP Right Grant
- 2013-04-25 TW TW104126101A patent/TWI558175B/zh active
- 2013-04-25 TW TW109108624A patent/TWI737217B/zh active
- 2013-04-25 TW TW102114845A patent/TWI533673B/zh active
- 2013-04-25 TW TW110125923A patent/TWI790684B/zh active
- 2013-04-25 TW TW106101881A patent/TWI626844B/zh active
- 2013-04-25 TW TW105126233A patent/TWI577180B/zh active
- 2013-04-25 TW TW109108625A patent/TWI735182B/zh active
- 2013-04-25 TW TW107110113A patent/TWI691201B/zh active
-
2014
- 2014-11-17 PH PH12014502553A patent/PH12014502553A1/en unknown
- 2014-12-16 MX MX2016003461A patent/MX347649B/es unknown
- 2014-12-26 US US14/583,242 patent/US10075724B2/en active Active
-
2017
- 2017-11-02 RU RU2017138238A patent/RU2668719C1/ru active
-
2018
- 2018-08-20 US US15/999,508 patent/US10477228B2/en active Active
- 2018-09-18 RU RU2018132997A patent/RU2694010C1/ru active
- 2018-09-18 RU RU2018132994A patent/RU2693641C1/ru active
-
2019
- 2019-06-25 RU RU2019119722A patent/RU2714107C1/ru active
-
2020
- 2020-01-23 RU RU2020102706A patent/RU2723085C1/ru active
- 2020-05-25 RU RU2020117056A patent/RU2736546C1/ru active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008061164A2 (en) * | 2006-11-14 | 2008-05-22 | Qualcomm Incorporated | Systems and methods for channel switching |
WO2009090868A1 (ja) * | 2008-01-17 | 2009-07-23 | Panasonic Corporation | 3d映像が記録された記録媒体、3d映像を記録する記録装置、並びに3d映像を再生する再生装置及び再生方法 |
TW201206202A (en) * | 2010-03-17 | 2012-02-01 | Ntt Docomo Inc | Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program |
Non-Patent Citations (3)
Title |
---|
<Benjamin Bross>,<Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11>,<7th Meeting: Geneva >,<2011/11/30>,< JCTVC-G1103_d9 Page 1~213> |
<Gary J. Sullivan>,< Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11>,<9th Meeting: Geneva >,<2012/05/07>,< JCTVC-I0404 Page 1~3> |
<Gary J. Sullivan>,< Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11>,<9th Meeting: Geneva >,<2012/05/07>,< JCTVC-I0404 Page 1~3> <Benjamin Bross>,<Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11>,<7th Meeting: Geneva >,<2011/11/30>,< JCTVC-G1103_d9 Page 1~213> * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2714107C1 (ru) | Устройство, способ и программа кодирования и декодирования динамических изображений с предсказанием | |
JP6637151B2 (ja) | 動画像予測復号方法 | |
AU2019284150B2 (en) | Dynamic image predictive encoding and decoding device, method, and program | |
JP2020043613A (ja) | 動画像予測復号方法 | |
JP2017073798A (ja) | 動画像予測復号装置及び動画像予測復号方法 |