JP6541274B2 - 動画像シーケンスの動画像フレームを復号する復号方法および装置 - Google Patents
動画像シーケンスの動画像フレームを復号する復号方法および装置 Download PDFInfo
- Publication number
- JP6541274B2 JP6541274B2 JP2017138980A JP2017138980A JP6541274B2 JP 6541274 B2 JP6541274 B2 JP 6541274B2 JP 2017138980 A JP2017138980 A JP 2017138980A JP 2017138980 A JP2017138980 A JP 2017138980A JP 6541274 B2 JP6541274 B2 JP 6541274B2
- Authority
- JP
- Japan
- Prior art keywords
- slice
- entropy
- entropy slice
- context
- bins
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 120
- 230000008569 process Effects 0.000 claims description 54
- 238000011423 initialization method Methods 0.000 claims description 41
- 230000003044 adaptive effect Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 230000006978 adaptation Effects 0.000 description 66
- 238000012545 processing Methods 0.000 description 60
- 230000011218 segmentation Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 238000013139 quantization Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000001174 ascending effect Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000000153 supplemental effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 101100314144 Mus musculus Tnip1 gene Proteins 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000011229 interlayer Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 101150047856 Cav2 gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- KNHUKKLJHYUCFP-UHFFFAOYSA-N clofibrate Chemical compound CCOC(=O)C(C)(C)OC1=CC=C(Cl)C=C1 KNHUKKLJHYUCFP-UHFFFAOYSA-N 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
Consideration)は、複雑度が増加することを代償として、旧来の方法および規格に比べて、より高い符号化効率を提供する。動画像符号化法および規格において画質および解像度に関する要求が増していることも、複雑度を増大させる要因である。並列復号処理をサポートしているデコーダにおいては、復号速度が向上し、必要メモリが削減される。加えて、マルチコアプロセッサの進歩は、並列復号処理をサポートしているエンコーダおよびデコーダを望ましいものにしている。
びISO/IEC 14496−10(MPEG4−Part10),2007年11月]は、圧縮効率のために動画像シーケンスにおける時間方向および空間方向の冗長性を低減すべくマクロブロック予測およびそれに続く残差符号化を使用する動画像コーデック(コーダ/デコーダ)仕様書である。
JCT−VCの初期テストモデルである。TMuCは、符号化ツリーブロック(CTB:coding tree block)と呼ばれる、可変サイズを有する基本符号化ユニットを用いて、H
.264/AVCより多くの融通性を提供する。
(a)ビデオデコーダにおいてスライスを受信する工程と、
(b)少なくとも第1の予測スライスおよび第2の予測スライスを含む前記スライスのタイプを識別する工程と、
(c)前記スライスのタイプに対応するコンテキストの初期化方法を用いて、前記スライスに関連するコンテキストを初期化する工程とを有し、
識別されたスライスの前記タイプが、前記第2の予測スライスの場合、前記コンテキストの初期化方法は、前記第1の予測スライスに対応する異なるコンテキスト初期化方法に置き換えられる。
法を開示し、この方法は、
(a)ビデオデコーダにおいてスライスを受信する工程と、
(b)前記スライスが予測されたB−スライスであるかどうかを識別する工程と、
(c)B−スライスに使用されるのとは異なった技術を用いて、前記スライスに関連するコンテキストを初期化する工程とを有する。
クロブロックに関して記述されている。これは、説明のためであり、限定するものではない。
列復号処理をサポートしているデコーダにおいては、復号速度が向上し、必要なメモリ量が削減される。加えて、マルチコアプロセッサの進歩は、並列復号処理をサポートしているエンコーダおよびデコーダを望ましいものにしている。
対象として存在している。予測信号(predicted signal)6、および、残差信号(residual signal)8が生成される。ここで、予測信号6は、フレーム間予測(inter-frame prediction)10またはフレーム内予測(intra-frame prediction)12の何れかに基づく
ものである。フレーム間予測10は、蓄積された参照画像16(参照フレームともいう)、および、入力フレーム(入力画像)4と参照フレーム(参照画像)16との間の、動き検出処理を実行する動き検出18の処理によって決定された動き情報19、を用いる動き補償部14によって決定される。フレーム内予測12は、フレーム内予測部20により復号信号22を用いて決定される。残差信号8は、予測信号6から入力画像4を減算することによって決定される。残差信号8は、変換/スケール/量子化部24により変換・スケール・量子化され、これにより、量子化された変換係数26が生成される。復号信号22は、量子化された変換係数26を用いる逆(変換/スケール/量子化)部30により生成される信号28に、予測信号6を加算することによって生成される。動き情報19、および、量子化された変換係数26は、エントロピー符号化部32によりエントロピー符号化され、圧縮された動画像ビットストリーム34に書き込まれる。出力画像領域38(例えば、参照フレームの一部)は、再構成されかつ予めフィルタリングされた信号22を用いるデブロッキングフィルタ部36によりエンコーダ2にて生成される。
ト、例えば符号化ツリーブロック(Coding Tree Block)を用いてもよい。H.264/
AVC規格における復号処理は、マクロブロックを単位として処理を行う仕様である。エントロピーデコーダ54は、圧縮された動画像ビットストリーム52のシンタックス要素を構文解析し、それらを逆多重化する。H.264/AVCは、エントロピー復号として、異なる2つの方法を用いる仕様である。その1つは、CAVLCと呼ばれる、コンテキストを適応的に切り替える可変長符号のセットを利用することに基づく複雑性の低い技術であり、もう1つは、CABACと呼ばれる、コンテキストに基づく適応的なバイナリー算術符号化を行う、より多くの計算量を要するアルゴリズムである。双方のエントロピー復号方法において、現シンボルの復号処理は、前に正しく復号されたシンボル、および、適応的にアップデートされるコンテキストモデルに依存する。加えて、例えば、予測データ情報、残差データ情報、および、異なる色平面(color planes)等の異なるデータ情報が共に多重化される。逆多重化は、各要素がエントロピー復号されるまで終了しない。
および、再構成に用いられない。一方で、“スライス#1”内のマクロブロック、例えば、95の番号が付されたマクロブロックに対して、“スライス#1”内の他のマクロブロック(例えば、93および94の番号が付されたマクロブロック)は、コンテキストモデルの選択、および、再構成に用いられる。従って、エントロピー復号、および、マクロブロックの再構成は、スライス内で、逐次的(serially)に行われる必要がある。スライスがフレキシブルなマクロブロック順序付け(flexible macroblock ordering(FMO))を用
いて定義されているものでない限り、スライス内のマクロブロックは、ラスタスキャン順に処理される。
ブロックは、マクロブロックからスライスグループへのマップ(macroblock-to-slice-group map)によって定義される。ここで、マクロブロックからスライスグループへのマッ
プは、スライスヘッダにおけるピクチャパラメータセットおよび追加情報の内容によって示される。マクロブロックからスライスグループへのマップは、ピクチャ内の各マクロブロックについてのスライスグループ識別番号(slice-group identification number)に
より構成されている。スライスグループ識別番号は、各マクロブロックがどのスライスに属するものであるかを特定する。各スライスグループは、1または複数のスライスに分割が可能である。ここで、スライスは、あるスライスグループのマクロブロックのセットにおいてラスタスキャン順に処理される同じスライスグループ内の一連のマクロブロックよりなる。エントロピー復号、および、マクロブロックの再構成は、スライス内で、逐次的に行われる必要がある。
該ピクチャ上の該エントロピースライスによって表される領域におけるシンボルの値が他のエントロピースライスからのデータを用いることなく正しくエントロピー復号されるという点で、自己完結的である。本発明のいくつかの実施の形態においては、各エントロピースライスの復号開始において、エントロピー符号化の状態はリセットされる。本発明のいくつかの実施の形態において、他のエントロピースライスのデータは、エントロピー復号のための近傍の利用可能性を定義するときに、利用不可能とマークされる。本発明のいくつかの実施の形態においては、他のエントロピースライスにおけるマクロブロックは、現ブロックのコンテキストモデルの選択において用いられることはない。本発明のいくつかの実施の形態において、コンテキストモデルは、エントロピースライス内においてのみアップデートされる。本発明のこれらの実施の形態において、1枚のエントロピースライ
スに用いられる各エントロピーデコーダは、コンテキストモデルについての、自身のセットを保持する。
最初のステップは省略されてもよい。2進値のシンタックス要素、または、2値化シンボルの要素が、ビンと見なされ得る。
ム110は、水平方向に11個、垂直方向に9個のマクロブロックを含んでいる(9個の例示的なマクロブロックに115〜123の番号を付している)。図5には、3枚の例示的な再構成スライス:“R_スライス#0”111と示されている第1の再構成スライス、“R_スライス#1”112と示されている第2の再構成スライス、および、“R_スライス#2”113と示されている第3の再構成スライス、が示されている。図5には、
さらに、第2の再構成スライス“R_スライス#1”112の、3枚のエントロピースライス:クロスハッチで表されており“E_スライス#0”と示されている第1のエントロピースライス114、垂直ハッチで表されており“E_スライス#1”と示されている第2のエントロピースライス115、および、斜めハッチで表されており“E_スライス#2”と示されている第3のエントロピースライス116、への分割が示されている。各エントロピースライス114、115、116は、並列的にエントロピー復号される。
ップ130)、もし、該エントロピースライスフラグが、ピクチャまたは再構成スライスに関連付けられたエントロピースライスが存在しないことを示していれば(分岐132)、ヘッダは、標準的スライスヘッダ(regular slice header)として構文解析(parse)
される(ステップ134)。エントロピーデコーダの状態はリセットされ(ステップ136)、エントロピー復号および再構成のための近傍情報(neighbor information)が定義される(ステップ138)。そして、スライスのデータがエントロピー復号され(ステップ140)、スライスが再構成される(ステップ142)。もし、該エントロピースライスフラグが、ピクチャに関連付けられたエントロピースライスが存在していることを示していれば(分岐146)、ヘッダは、エントロピースライスヘッダ(entropy-slice header)として構文解析される(ステップ148)。エントロピーデコーダの状態はリセットされ(ステップ150)、エントロピー復号のための近傍情報が定義され(ステップ152)、エントロピースライスのデータがエントロピー復号される(ステップ154)。そして、再構成のための近傍情報が定義され(ステップ156)、スライスが再構成される(ステップ142)。ステップ142におけるスライスの再構成の後に、次のスライスまたはピクチャが分析される(矢印158)。
ースライスを復号することが可能なデコーダを考える。該デコーダは、N枚のエントロピースライスを識別する(ステップ170)。本発明のいくつかの実施の形態においては、現ピクチャ若しくは再構成スライスにおいて、N枚よりも少ないエントロピースライスが利用可能なとき、該デコーダは、次のピクチャ若しくは再構成スライスが利用可能であれば、それらからのエントロピースライスを復号する。他の実施の形態においては、デコーダは、次のピクチャ若しくは再構成スライスの一部を復号する前に、現ピクチャ若しくは
再構成スライスが完全に処理されるまで待機する。N枚までのエントロピースライスを識別した後(ステップ170)、識別されたエントロピースライスの各々は、独立にエントロピー復号される。第1のエントロピースライスが復号される(ステップ172〜ステップ176)。第1のエントロピースライスの復号(ステップ172〜ステップ176)は、該デコーダの状態をリセットすることを含んでいる(ステップ172)。CABACエントロピー復号を含むいくつかの実施の形態においては、CABACの状態がリセットされる。第1のエントロピースライスのエントロピー復号のための近傍情報が定義され(ステップ174)、第1のエントロピースライスのデータが復号される(ステップ176)。N枚までのエントロピースライスの各々に対して、これらのステップが行われる(N番目のエントロピースライスに対してのステップ178〜ステップ182)。本発明のいくつかの実施の形態において、デコーダは、すべてのエントロピースライスがエントロピー復号されたときに、該エントロピースライスを再構成する(ステップ184)。本発明の他の実施の形態においては、デコーダは、1またはそれ以上のエントロピースライスが復号された後に、再構成(ステップ184)を開始する。
ピー復号が終了次第、次のエントロピースライスのエントロピー復号を開始する。従って、スレッドが複雑性の低いエントロピースライスのエントロピー復号を完了したとき、該スレッドは、他のスレッドが復号を完了するのを待つことなく、さらなるエントロピースライスの復号を開始する。
スライス特性(slice attributes)の多くを共有している。したがって、エントロピースライスは、小さなヘッダを必要とする。本発明のいくつかの実施の形態においては、エントロピースライスヘッダは、デコーダがエントロピースライスの始まりを識別し、エントロピー復号を開始することを許可する。いくつかの実施の形態においては、ピクチャ若しくは再構成スライスの始まりにおいて、エントロピースライスヘッダは、標準的ヘッダ(regular header)若しくは再構成スライスヘッダ(reconstruction slice header)であ
る。
ースライスにおける最初のマクロブロックのアドレスを特定する。いくつかの実施の形態においては、エントロピースライスは、一連のマクロブロックを含んでいる。
プが割り当てられる。これらの実施の形態においては、デコーダは、標準的スライスと、エントロピースライスとを、NALユニットタイプに基づいて識別することができる。これらの実施の形態においては、ビットフィールド(bit field)“entropy_slice_flag”
は必要とされない。
0、および、残差データ(residual data)192は、予測エンコーダ(prediction encoder)194、および、残差エンコーダ(residual encoder)196によって個別にエン
トロピー符号化され、符号化された予測データ、および、符号化された残差データは、ピクチャレベルマルチプレクサ(picture-level multiplexer)198によって、ピクチャ
レベルで多重化される。本発明のいくつかの実施の形態においては、ピクチャについての予測データ190は、第1のエントロピースライスに関連付けられており、ピクチャについての残差データ192は、第2のエントロピースライスに関連付けられている。符号化された予測データ、および、符号化されたエントロピーデータは、並列的に復号される。本発明のいくつかの実施の形態においては、予測データまたは残差データを含む各パーティションは、並列的に復号される複数のエントロピースライスに分割される。
リームにおいて通知される。他の実施の形態においては、エンコーダが各エントロピースライスのサイズを制限し、ビンの最大数が該エンコーダのプロファイルおよびレベルコンフォーマンスポイントにより規定される。例えば、H.264/AVC動画像符号化用仕様書の付録Aは、エントロピースライスにおいて許されるビンの最大数の規定を有するように拡張される。
0ビン、M1.2=2,000ビン、...、およびM5.1=40,000ビンが挙げられる。エントロピースライスにおいて許されるビンの最大数の他の例としては、M1.1=2,
500ビン、M1.2=4,200ビン、...、およびM5.1=150,000ビンが挙げられる。
場合の数を示す。いくつかの実施の形態においては、マクロブロックは、ラスタスキャン順に選択される。他の実施の形態においては、マクロブロックは、所定の他の順に選択される。いくつかの実施の形態においては、マクロブロックに関連したビンの最悪の場合の数は、固定的な数である。他の実施の形態においては、エンコーダは、予め処理されたマクロブロックのサイズの計測に基づいて、最悪の場合の数をアップデートする。
たカウンタを0に初期化する(ステップ240)。カウンタ値は、図11に関連して記述される本発明の実施の形態に係る以下の記述において、説明のためにAと表記される。次のマクロブロックのシンタックス要素が得られる(ステップ242)。次のマクロブロックは、所定のマクロブロックの処理順に従って決定される。いくつかの実施の形態においては、マクロブロックの処理順は、ラスタスキャン順に対応するものである。マクロブロックにおける2進値でないシンタックス要素は、ビンストリングに変換される(ステップ244)。2進値のシンタックス要素は、変換を必要としない。マクロブロックに関連したビンの数が決定される(ステップ246)。マクロブロックに関連したビンの数には、2進値のシンタックス要素のビンと、2進値でないシンタックス要素に関連したビンストリングにおけるビンとが含まれる。マクロブロックに関連したビンの数は、図11に関連して記述される本発明の実施の形態に関する以下の記述において、説明のためにnumと示される。
あるとすると、閾値は、エントロピースライスにおいて許されるビンの最大数の90%である。他の例示的な実施の形態においては、閾値は、エントロピースライスにおいて許されるビンの最大数の割合である。該割合は、マクロブロックにおいて予想されるビンの最多数に基づくものである。これらの実施の形態においては、エントロピースライスのサイズが閾値サイズを超過すると、他のエントロピースライスが生成される。閾値サイズは、エントロピースライスがエントロピースライスにおいて許されるビンの最大数を超過しな
いことを保証するように選択される。いくつかの実施の形態においては、閾値サイズは、エントロピースライスにおいて許されるビンの最大数、および、マクロブロックに対し予想されるビンの最大数の推測値の関数である。
3)、次のマクロブロックのシンタックス要素が得られる(ステップ314)。次のマクロブロックは、所定のマクロブロックの処理順に従って決定される。いくつかの実施の形態においては、マクロブロックの処理順は、ラスタスキャン順に対応するものである。マクロブロックにおける2進値でないシンタックス要素が、ビンストリングに変換される(ステップ316)。2進値のシンタックス要素は、変換の必要がない。マクロブロックに関連したビンの数が決定される(ステップ318)。マクロブロックに関連したビンの数には、2進値のシンタックス要素のビンと、2進値でないシンタックス要素に関連したビンストリングにおけるビンとが含まれる。マクロブロックに関連したビンの数は、図13に関連して記述される本発明の実施の形態に係る以下の記述において、説明のためにnumと表記される。
かの実施の形態においては、閾値サイズは、エントロピースライスにおいて許されるビンの最大数、および、マクロブロックに対し予想されるビンの最大数の推測値の関数である。
数に関連したカウンタを0に初期化する(ステップ400)。カウンタ値は、図15に関連して記述される本発明の実施の形態に係る以下の記述において、説明のためにAと表記される。次のマクロブロックのシンタックス要素が得られる(ステップ402)。次のマクロブロックは、マクロブロックの所定の処理順に従って決定される。いくつかの実施の形態においては、マクロブロックの処理順は、ラスタスキャン順に対応するものである。マクロブロックにおける2進値でないシンタックス要素が、ビンストリングに変換される(ステップ404)。2進値のシンタックス要素は、変換の必要がない。変換された2進値でない要素および2進値の要素である、マクロブロックに関連したビンが、エントロピーエンコーダに提供され、ビンがエントロピー符号化される(ステップ406)。マクロブロックに関連したビットの数が決定される(ステップ408)。マクロブロックに関連したビットの数は、図15に関連して記述される本発明の実施の形態に係る以下の記述において、説明のためにnumと表記される。
ースライスにおいて許されるビットの最大数の10%未満であるとすると、閾値は、エントロピースライスにおいて許されるビットの最大数の90%である。他の例示的な実施の形態においては、該閾値は、エントロピースライスにおいて許されるビットの最大数の割合である。該割合は、マクロブロックにおいて予想されるビットの最多数に基づくものである。これらの実施の形態においては、エントロピースライスのサイズが閾値サイズを超過すると、他のエントロピースライスが生成される。閾値サイズは、エントロピースライスがエントロピースライスにおいて許されるビットの最大数を超過しないことを保証するように選択される。いくつかの実施の形態においては、閾値サイズは、エントロピースラ
イスにおいて許されるビットの最大数、および、マクロブロックに対し予想されるビット最大数の推測値の関数である。
のビン符号化(bin coding)は、並列化され、1以上のビンの並列符号化が許される。これは、符号化時間を短縮する。本発明のこれらの実施の形態は、図17に示されたエントロピーコーダとの関係において理解される。これらの実施の形態において、エントロピーコーダ480は、コンテキスト適応ユニット(context-adaptation unit)482、状態
に基づくビンコーダセレクタ(bin-coder selector)484、および複数(3つ図示)の
ビンコーダ(bin coder)486、488、500を備えている。複数のビンコーダ48
6、488、500は、ビンコーダユニット(bi-coder unit)とも呼ばれ、並列的に動
作する。ビン502は、入力シンボル506からビン502を生成する二値化器(binarizer)504によって、エントロピーコーダ480が利用可能である。ビン502は、コ
ンテキスト適応ユニット482、および、状態に基づくビンコーダセレクタ484が利用可能である。コンテキスト適応ユニット482は、コンテキストの適応処理を実行し、モデル状態(単に状態とも呼ぶ)508を生成する。モデル状態508は、ビン502が、ビンコーダ486、488、500のうち、いずれに入力されるのかを選択するために用いられる。状態に基づくビンコーダセレクタ484は、ビン502を符号化するために、ビンコーダ486、488、500のうち、生成されたモデル状態508に関連したビンコーダを選択する。いくつかの実施の形態(不図示)においては、生成された状態508は、選択されたビンコーダが利用可能になる。出力ビット510、512、514は、ビンコーダ486、488、500により生成され、ビットストリームに含められる。本発明のいくつかの実施の形態においては、出力ビット510、512、514は、バッファされ、連結されてビットストリームに含められる。他の実施の形態においては、出力ビット510、512、514は、バッファされ、インターリーブ法に従ってビットストリームに含められる。
コンテキスト適応ユニットセレクタ(context-adaptation unit selector)538、状態セレクタ(state selector)540、および、ビンコーダ(bin coder)542を備えて
いる。ビン544は、入力シンボル548からビン544を生成する二値化器(binarizer)546によって、エントロピーコーダ530が利用可能である。ビン544は、コン
テキスト適応ユニットセレクタ538、状態セレクタ540、および、ビンコーダ542が利用可能である。コンテキスト適応ユニットセレクタ538は、ビン544が入力され、状態値(state value)550、552、554を生成するコンテキスト適応ユニット
532、534、536を選択またはスケジューリングするために用いられる。いくつかの例示的な実施の形態においては、コンテキスト適応ユニットセレクタ538は、ビンに関連したシンタックスに基づいて、コンテキスト適応ユニット532、534、536のうち、1つのコンテキスト適応ユニットを選択する。例えば、コンテキスト適応ユニット識別子(context-adaptation unit identifier)は、処理のためにビンが入力されるコンテキスト適応ユニットを識別するビンに関連付けられる。他の例示的な実施の形態においては、コンテキスト適応ユニットセレクタ538は、スケジューリング手順(schedulingprotocol)または、コンテキスト適応ユニット532、534、536に関連した負荷バランシング制約(load-balancing constraint)に基づいて、コンテキスト適応ユニット
532、534、536のうち、1つのコンテキスト適応ユニットを選択する。いくつかの実施の形態において、生成された状態値は、ビンコーダ542に渡される適切なタイミ
ングにおいて、コンテキスト適応ユニットセレクタ538に用いられる判断基準に従って、状態セレクタ540により選択される。ビンコーダ542は、ビン544の符号化において、状態セレクタ540によって渡された状態値556を用いる。本発明の他の実施の形態(不図示)において、状態値は、ビンコーダにより要求されない。したがって、状態値は、ビンコーダが利用可能ではない。出力ビット558は、ビンコーダ542により生成され、ビットストリームに含められる。本発明のいくつかの実施の形態においては、出力ビット558は、バッファされ、連結されてビットストリームに含められる。他の実施の形態においては、出力ビット558は、バッファされ、インターリーブ法に従ってビットストリームに含められる。
72、574、576、コンテキスト適応ユニットセレクタ(context-adaptation unit selector)578、状態セレクタ(state selector)580、状態に基づくビンコーダセレクタ(bin coder selector)582、および、複数の(3つ図示)ビンコーダ(bin coder)584、586、588を備えている。ビン590は、入力シンボル594からビ
ン590を生成する二値化器(binarizer)592によって、エントロピーコーダ570
が利用可能である。ビン590は、コンテキスト適応ユニットセレクタ578、状態セレクタ580、および、ビンコーダセレクタ582が利用可能である。コンテキスト適応ユニットセレクタ578は、ビン590が入力され、状態値(state value)596、59
8、600を生成するコンテキスト適応ユニット572、574、576を選択またはスケジューリングするために用いられる。生成された状態値は、状態に基づくビンコーダセレクタ582に渡される適切なタイミングにおいて、状態セレクタ580により選択される。状態に基づくビンコーダセレクタ582は、ビンコーダ584、586、588の中からビン590が入力されるビンコーダを選択するために、状態セレクタ580により渡された状態値602を用いる。他の実施の形態(不図示)においては、状態値602は、選択されたビンコーダが利用可能になる。ビン590の符号化において、選択されたビンコーダは、状態値602を用いる。本発明の他の実施の形態(不図示)においては、状態値は、ビンコーダにより要求されない。したがって、状態値はビンコーダが利用可能である。出力ビット604、606、608は、ビンコーダ584、586、558により生成され、ビットストリームに含められる。本発明のいくつかの実施の形態においては、出力ビット604、606、608は、バッファされ、連結されてビットストリームに含められる。他の実施の形態においては、出力ビット604、606、608は、バッファされ、インターリーブ法に従ってビットストリームに含められる。
可変長符号化(variable length coding)を備えている。さらに、本発明の他の実施の形態においては、ビンコーダは、固定長符号化(fixed length coding)を備えている。
ントロピースライスに分割する。エントロピースライスの処理中に、Nca個のコンテキスト適応ユニット、およびNbc個のビンコーダユニットのうちの1つまたはそれ以上のユニットの各々が処理するビンの数が制限数を越えないように、各エントロピースライスのサイズは制限される。そのように制限されたコンテキスト適応ユニット、およびビンコーダユニットは、制限されたエントロピーコーダユニット(restricted entropy-coder unit
)と呼称してもよい。
グナル化される。
テキスト適応ユニットがBca(i)個を超えるビンを処理しないように、そして、1からNbcまでの各iについてNbc個のビンコーダユニットのうちNbc (i)で示されるi番目のビンコーダユニットがBbc(i)個を超えるビンを処理しないように、各エントロピースライス
のサイズは制限される。本発明のいくつかの実施の形態においては、Bbc(i)の値、およ
びBca(i)の値は例えば、ビットストリームにおいて、プロファイル制約(profile constraint)、レベル制約(level constraint)、または、他の標準メカニズム(normative mechanism)などにシグナル化される。
連して記述される本発明の実施の形態に係る記述において、説明のためにAと表記される。Aは、現エントロピースライスについて、制限されたエントロピーユニットによって処理されたビンの累積数に応じた各ベクトル成分を含むベクトルを表す。次のマクロブロックのシンタックス要素が得られる(ステップ652)。次のマクロブロックは、所定のマクロブロックの処理順に従って決定される。いくつかの実施の形態においては、マクロブロックの処理順は、ラスタスキャン順に対応するものである。マクロブロックにおける2進値でないシンタックス要素は、ビンストリングに変換される(ステップ654)。2進値のシンタックス要素は、変換を必要としない。各制限されたエントロピーコーダユニットにより処理される、マクロブロックに関連したビンの数が決定される(ステップ656)。マクロブロックに関連したビンの数には、2進値のシンタックス要素のビンと、2進値でないシンタックス要素に関連したビンストリングにおけるビンとが含まれる。各制限されたエントロピーコーダユニットにより処理されたマクロブロックに関連したビンの数は、図20に関連して記述される本発明の実施の形態に関する以降の記述において、説明のためにnumと表記される。numは、現マクロブロックについて、制限されたエントロピーコーダユニットにより処理されたビンの数に対応する各ベクトル成分を含むベクトルを表す。
制限されたエントロピーコーダユニットにより処理されることを許されるビンの既定の最大数に関連した閾値に到達するまで、エンコーダは、マクロブロックのシンタックス要素をエントロピースライスに関連付ける。いくつかの実施の形態においては、該閾値は、エントロピースライスにおいて、制限されたエントロピーコーダユニットにより処理されることを許されるビンの最大数(the maximum number of bins)の割合である。1つの例示的な実施の形態においては、マクロブロックにおいて、制限されたエントロピーコーダユニットにより処理されることが予想されるビンの最多数(the greatest number of bins
)が、エントロピースライスにおいて、制限されたエントロピーコーダユニットにより処理されることを許されるビンの最大数の10%未満であるとすると、閾値は、エントロピースライスにおいて、制限されたエントロピーコーダユニットにより処理されることを許されるビンの最大数の90%である。他の例示的な実施の形態においては、閾値は、エントロピースライスにおいて、制限されたエントロピーコーダユニットにより処理されることを許されるビンの最大数の割合である。該割合は、マクロブロックにおいて、制限されたエントロピーコーダユニットにより処理されることが予想されるビンの最多数に基づくものである。これらの実施の形態においては、エントロピースライスのサイズが閾値サイズを超過すると、他のエントロピースライスが生成される。エントロピースライスが、そのエントロピースライスにおいて制限されたエントロピーコーダユニットのいずれか1つにより処理されることを許されるビンの最大数を超過しないことを保証するように、閾値サイズは選択される。いくつかの実施の形態においては、閾値サイズは、エントロピースライスにおいて許されるビンの最大数と、マクロブロックに対し予想されるビンの最大数の推測値との関数である。
ロピーデコーダ750は、複数(3つ図示)のビンデコーダ(bin decoder)762、7
64、766を備えている。エントロピースライス内のビット752、および既に復号されたシンボル754は、エントロピーデコーダ750が利用可能である。コンテキスト適応ユニット(context-adaptation unit)760から生成されるコンテキスト状態(context state)758に基づいて、ビンデコーダ762、764、766のうち、いずれかを選択するビンデコーダセレクタ(bin-decoder selector)756は、ビット752を利用可能である。コンテキスト適応ユニット760は、コンテキスト適応ユニット760が利用可能なように予め復号されたシンボル754に基づいて、コンテキスト状態758を生成する。ビンデコーダセレクタ756は、コンテキスト状態758に基づいて、ビンデコーダ762、764、766のうち1つを割り当てる。復号されるビット752は、ビンデコーダセレクタ756により選択されたビンデコーダに渡される。ビンデコーダ762、764、766は復号されたビン768、770、772を生成する。復号されたビン768、770、772は、マルチプレクサ(multiplexer)774により多重化され、
多重化されたビン776は、記号化器(symbolizer)778に送られる。記号化器778は、ビン776に対応するシンボル754を生成する。
態セレクタ826は、コンテキスト適応ユニットセレクタ812と同様の手順に従って、N番目のビットを受信する毎に、N番目のコンテキスト適応ユニットを選択する。選択された状態828は、ビンデコーダ804が利用可能になる。ビンデコーダ804は、ビット802を復号し、復号されたビン806を記号化器808に送る。記号化器808は、復号されたビン806に対応するシンボル810を生成する。
キスト適応ユニット(context-adaptation unit)852、854、856、および複数
(3つ図示)のビンデコーダ(bin decoder)858、860、862を備えている。エ
ントロピースライス内のビット864、および既に復号されたシンボル866は、エントロピーデコーダ850が利用可能になっている。ビット864は、複数のコンテキスト適応ユニット852、854、856から、入力ビットの復号処理のための1つのコンテキスト適応ユニットを選択するコンテキスト適応ユニットセレクタ(context-adaptation unit selector)868が利用可能になっている。本発明のいくつかの実施の形態においては、コンテキスト適応ユニットセレクタ868は、N番目のビットを受信する毎に、N番目のコンテキスト適応ユニットを選択する。選択されたコンテキスト適応ユニットは、選択されたコンテキスト適応ユニットが利用可能な既に復号されたシンボル866に基づいて、コンテキスト状態870、872、874を生成する。状態セレクタ876は、適切なタイミングで、入力ビットに関連して生成されたコンテキスト状態を選択する。本発明のいくつかの実施の形態においては、状態セレクタ876は、コンテキスト適応ユニットセレクタ868と同様の手順に従って、N番目のビットを受信する毎に、N番目のコンテキスト適応ユニットを選択する。選択された状態878は、ビンデコーダセレクタ(bin-decoder selector)880が利用可能になっている。ビンデコーダセレクタ880は、選択されたコンテキスト状態878に基づいて、ビンデコーダ858、860、862のうち1つを選択する。ビンデコーダセレクタ880は、コンテキスト状態878に基づいて、ビンデコーダ858、860、862のうち1つを割り当てる。復号されるビット864は、ビンデコーダセレクタ880により選択されたビンデコーダに渡される。ビンデコーダ858、860、862は、復号されたビン882、884、886を生成する。復号されたビン882、884、886は、マルチプレクサ888により多重化され、多重化されたビン890は、記号化器892へ送られる。記号化器892は、復号されたビン890に対応するシンボル866を生成する。
イス960を示す。この例示的な再構成スライス960においては、エントロピースライス962、964、966内のマクロブロック群は切れ目なく連続してはいない。エントロピースライス内のマクロブロック群が切れ目なく連続していない再構成スライスの分割は、インターリーブ分割(interleaved partition)と呼称してもよい。
トリームの非常に多くの部分に前処理を施す必要がない。
ロピースライスに許されるビンの固定数、任意のエントロピースライスに許されるビットの固定数、および他のエントロピースライス変数である。本発明のさらなる他の実施の形態においては、エントロピースライスロケーション情報は、他の標準の手段(normative means)により定義される。例えば、該情報は、プロファイル制約(profile constraint
)、レベル制約(level constraint)、アプリケーション制約(application constraint)またはその他の制約において規定される。あるいは、該情報は、補足情報として通知されるか、または他の範囲外(out-of-bound)の手段によって通知される。
)に“entropy_slice_offset”パラメータ、および、“entropy_slice_range”を追加す
ることにより、シーケンスパラメータセットのローバイトシーケンスペイロード(RBSP:Raw Byte Sequence Payload)において通知される。表3は、本発明の実施の形態に
よる、例示的なシーケンスパラメータセットのRBSPのシンタックスを示している。
は、本発明の実施の形態による、例示的なピクチャパラメータセットのRBSPのシンタックスを示している。
を追加することにより、スライスヘッダにおいて通知される。表5は、本発明の実施の形態による、例示的なスライスヘッダのシンタックスを示している。
ルm.nのコンフォーマンスポイントのエントロピースライスオフセットを表しており、Rm.nは、m.nのコンフォーマンスポイントのエントロピースライス範囲を表している
。
間の偏差(deviation)またはオフセットとしても参照される範囲の値(range value)を含んでいる。エントロピースライスヘッダロケーションは、オフセット値および範囲値に基づいて制約される。
実施の形態においては、オフセット値および範囲値は、ルックアップツリー(look-up tree)に基づくオフセットを用いることにより定義される。いくつかの実施の形態においては、オフセット値および範囲値は、費用最小化インデックス法(cost-minimizing indexing)を用いることにより定義される。当業者であれば、範囲値およびオフセット値を非明示的に定義し、エンコーダおよびデコーダが既定のオフセット値および範囲値と同じ値により動作することを保障するための方法が対象分野において多数知られていることがわかるであろう。
を表し、pは範囲を表す。Nk−pビット後のロケーションは測定され、参照ロケーション(reference location)として参照される。他の実施の形態においては、参照ロケーションは、特定の再構成スライスに対応しておらず、ビットストリーム内における、全てのエントロピースライスに対して同一の固定ロケーションである。他の実施の形態においては、エントロピースライスヘッダは、バイトアラインされて(byte aligned)おり、制約は、バイト数に関連する。図29に関連して示された例は、ビットに関して記述されているが、当業者は他のバイトアラインの実施の形態を理解するであろう。
である。ビットストリームの一部1000は、黒色で塗りつぶされた長方形で表された1つの再構成スライスヘッダ1002と、灰色で塗りつぶされた長方形で表された4つのエントロピースライスヘッダと、白と黒との薄い縞で表されたエントロピースライスの残りの部分とを含んでいる。第0番目のエントロピースライス1003に対応するエントロピースライスヘッダは、第0番目のエントロピースライスヘッダとして参照され、第1番目のエントロピースライス1004に対応するエントロピースライスヘッダは、第1番目のエントロピースライスヘッダとして参照され、第2番目のエントロピースライス1005に対応するエントロピースライスヘッダは、第2番目のエントロピースライスヘッダとして参照され、第3番目のエントロピースライス1006に対応するエントロピースライスヘッダは、第3番目のエントロピースライスヘッダとして参照される。この例において、参照ロケーションは、再構成スライスヘッダ1002の先頭1001である。本発明のいくつかの実施の形態においては、第0番目のエントロピースライス1003に対応するエントロピースライスヘッダは、再構成スライスヘッダ1002の直後に位置するように制約される。本発明のいくつかの実施の形態においては、第0番目のエントロピースライスに対応するエントロピースライスヘッダは、再構成スライスヘッダの一部である。すなわち、再構成スライスヘッダは、第0番目のエントロピースライスに対応するエントロピースライスヘッダとしての役目を果たすこともできる。これらの実施の形態においては、再構成スライスヘッダは、1つの再構成部(reconstruction portion)と、1つのエントロピー部(entropy portion)とを含んでいる。図29に示された本発明のいくつかの実施
の形態においては、第1のエントロピースライスヘッダ1004は、参照ロケーション1001からk−pビット目1007の後に位置するように制約され、第2のエントロピースライスヘッダ1005は、参照ロケーション1001から2k−pビット目1008の後に位置するように制約され、第2のエントロピースライスヘッダ1006は、参照ロケーション1001から3k−pビット目1009の後に位置するように制約される。これらの実施の形態においては、エントロピースライスNの復号処理を割り当てられたエントロピーデコーダは、参照ロケーション1001からNk−pビット目の後に位置する対応するエントロピースライスヘッダのサーチを開始する。
トロピーデコーダは、参照ロケーションからNkビット目の後にあるN番目のエントロピースライスヘッダのサーチを開始する。
に制約される。Nk−pビット後のロケーションは測定され、参照ロケーション(reference location)として参照される。他の実施の形態においては、参照ロケーションは、特
定の再構成スライスに対応しておらず、ビットストリーム内の全てのエントロピースライスに対して同一の固定ロケーションである。他の実施の形態においては、エントロピースライスヘッダは、バイトアラインされ(byte aligned)おり、制約は、バイト数に関連する。図30に関連して示された例は、ビットに関して記述されているが、当業者は他のバイトアラインの実施の形態を理解するであろう。
いくつかの実施の形態においては、第1のエントロピースライスヘッダ1024は、参照ロケーション1021から数えてk−pビット目1027からの2pビット1031の範囲内に位置するように制約され、第2のエントロピースライスヘッダ1025は、参照ロケーション1021から数えて2k−pビット目1028からの2pビット1032の範囲内に位置するように制約され、第2のエントロピースライスヘッダ1026は、参照ロケーション1021から数えて3k−pビット目1029からの2pビット1033の範囲内に位置するように制約される。これらの実施の形態においては、エントロピースライスNの復号処理を割り当てられたエントロピーデコーダは、参照ロケーション1001からNk−pビット目より後ろにある対応するエントロピースライスヘッダのサーチを開始する。エントロピーデコーダは、エントロピースライスヘッダを特定するか、または、2pビット分をサーチした後にサーチを終了する。
ive means)により定義され、特定される(ステップ1052)。例えば、該情報は、プ
ロファイル制約(profile constraint)、レベル制約(level constraint)、アプリケーション制約(application constraint)、または他の制約において規定される。あるいは、該情報は、補足情報として通知されるか、または他の範囲外(out-of-bound)の手段によって通知される。
ァイル制約(profile constraint)、レベル制約(level constraint)、アプリケーション制約(application constraint)、または他の制約において規定される。あるいは、該情報は、補足情報として通知されるか、または他の範囲外(out-of-bound)の手段によって通知される。
は、スタートコード(start code)により示される。
ァイル制約(profile constraint)、レベル制約(level constraint)、アプリケーション制約(application constraint)、またはその他の制約において規定される。あるいは、該情報は、補足情報として通知されるか、または他の範囲外(out-of-bound)の手段によって通知される。
スライスヘッダが特定されない場合(分岐1113)であって、ステップ1114においてサーチ基準を満足した場合(分岐1115)、エントロピーデコーダは終了する(ステップ1116)。サーチ基準は、エントロピースライスヘッダの先頭にサーチすべき妥当なロケーション(valid locations)が残っているか否かを判定するための基準となる。
図示しないいくつかの実施の形態においては、サーチ基準は、妥当なロケーションがまだ分析されていない場合に満足される。他の実施の形態においては、サーチ基準は、まだ分析(分岐1115)されていない妥当なロケーションが存在しない場合に満足され、サーチは終了する(ステップ1116)。いくつかの実施の形態においては、エントロピースライスヘッダが1つも特定されない場合(ステップ1115)、エントロピーデコーダはエラーを示す。ステップ1114において、サーチ基準を満足しない場合(分岐1117)、ビットストリームにおいて次のサーチロケーションに進んだ(ステップ1118)後に、ビットストリームの分析(ステップ1108)は継続する。
)を施す。
イスを終了する。
ラグの値は、エントロピースライスヘッダに対応するエントロピースライスが、再構成スライスにおける最後のエントロピースライスであるか否かを示している。いくつかの実施の形態においては、0のラストエントロピースライスフラグ値は、最後のエントロピースライスに対応する。他の実施の形態においては、1のラストエントロピースライスフラグ値が、最後のエントロピースライスに対応する。いくつかの実施の形態においては、エントロピースライスが再構成スライスにおける最後のエントロピースライスであることをラストエントロピースライスフラグの値が示している場合、続くエントロピースライスヘッダは、パディング処理が行われていない現エントロピースライスのすぐ後に位置される。
フラグを通知するための例示的なシンタックスおよびセマンティックスを示している。表7に示された例示的なシンタックスおよびセマンティックスを含む例示的な実施の形態においては、“next_entropy_slice_flag”フラグは、現再構成スライスに対する追加のエ
ントロピースライスが存在するか否かを示している。現再構成スライスに対する追加のエントロピースライスが存在しないことを“next_entropy_slice_flag”フラグが示してい
る場合、ビットストリームにおける次のエントロピースライスヘッダのロケーションは、エントロピースライスロケーションパラメータにより制約されない。
を含むツリー形式にまとめられる。いくつかの実施の形態においては、ルートノードによって指し示されたエントロピースライスヘッダロケーションは、相対値(relative)である。他の実施の形態においては、ルートノードによって指し示されたエントロピースライスヘッダロケーションは、絶対値(absolute)である。ツリーの残りのノードは、親ノードに対するオフセット距離(offset distance)を含んでいる。ツリーは設計制約(design constraint)に従って、設計される。設計制約は、例えば、エントロピースライスヘッダロケーションを特定する平均時間を短縮するための制約、エントロピースライスヘッダロケーションを特定するために要する最長の時間を抑制するための制約、エントロピースライスの復号の好ましい順序を通知するための制約、ツリーの記憶コスト(ストレージコスト、storage cost)を最小化するための制約、および他の設計制約である。いくつかの実施の形態においては、ツリーにおける各ノードの子ノードの数は、エントロピースライスヘッダロケーションを特定する上で望ましい並列レベルに基づいて制御される。
トモデルはリセットされる。これらの実施の形態のいくつかにおいては、コンテキストモデルのリセット後の値は、エントロピースライス内の近傍の基本ユニットのコンテキストモデルに基づく。近傍の基本ユニットが該エントロピースライス内に存在しない場合、デフォルト値が用いられる。他の実施の形態においては、コンテキストモデルはデフォルト値にリセットされる。さらなる他の実施の形態においては、コンテキストモデルは、識別子がビットストリーム内で通知されるコンテキストモデルに基づいてリセットされる。上記識別子は、複数の既定のコンテキストモデルのうちのいずれかを示している。既定のコ
ンテキストモデルは、ビットストリームにおける1または複数のパラメータに依存する。例示的な実施の形態においては、コンテキストモデルは、複数の既定のコンテキストモデルのいずれかを示す、ビットストリーム内の通知された“cabac_init_idc”の値に基づいてリセットされる。
例示的な再構成スライス1200におけるエントロピースライス1202、104、1206に対応するスライス開始基本ユニットは、それぞれ、1208、1223、および、1240である。エントロピースライスの行における最初の基本ユニットは、行先頭基本ユニット(row-start elementary unit)と呼称される。行先頭基本ユニットは、例えば
、図34におけるマクロブロック1208、1216、1224、1232、1240、および1248である。
ライス内で処理されるビンの数、スライス内で処理されるビットの数、現基本ユニットの空間的なロケーション、および、その他の基準に基づく。
、コンテキストモデルリセットフラグは、コンテキストモデルリセット条件をさらに示す多値のフラグである。
CAV2V符号化、および、他のコンテキスト適応符号化を含む1つの例示的な実施の形態においては、“lcu_row_cabac_init_flag”フラグは、エントロピー復号が最大符号化
ユニット(LCU:largest coding unit)行の先頭において初期化されるか否かを示している。いくつかの実施の形態においては、LCUは、H.264において用いられるマクロブロックの概念をHigh Efficiency Video Coding(HEVC)のために一般化したものであり、画像は、LCUのシーケンスで構成される複数のスライスに分割される。他の実施の形態においては、LCUは、単一の伝送されるモード値(transmitted mode value)で表される、複数の画素ロケーションからなる最大ブロックである。他の実施の形態においては、LCUは、単一の伝送される予測モード値(transmitted prediction mode value)で表される複数の画素ロケーションからなる最大ブロ
ックである。本発明のいくつかの実施の形態においては、“1”という“lcu_row_cabac_init_flag”フラグの値は、エントロピー符号化コンテキスト(entropy coding context
)をリセットすることを示す。エントロピー符号化コンテキストは、エントロピーコーダに関連するすべてのコンテキストモデルのセットを表す。本発明のいくつかの実施の形態においては、“1”という “lcu_row_cabac_init_flag”フラグの値は、エントロピー符号化コンテキストをリセットし、適応スキャニング(adaptive scanning)をリセットす
ることを示す。適応スキャニングとは、既に伝送された変換係数(transform coefficient)の値に基づいて、コーデックが変換係数のスキャン順を適応させる処理を指す。参照
によりその全体が本明細書に組み込まれる、JCTVC−B205_draft005における第7.6.1節は、近隣する有意係数(significant coefficients)に基づいて、2つの異なるスキャン順のうち適応スキャニングを選択する例が記載されている。1つの実施の形態においては、既定のスキャン順を選ぶことによって、各LCU行の始まりにおいて適応スキャニングがリセットされる。1つの実施の形態においては、スキャン順は、係数重要度マップ(coefficient significance map)を生成することにより決定され、既定の値より大きい係数重要度(coefficient significance values)の値に対応する変換
係数の値は、既定の値以下の係数重要度の値に対応する変換係数の値に先んじて伝送される。1つの実施の形態においては、既定の値より大きい変換係数の値に対応する係数重要度の値は、次第に増加する。他の実施の形態においては、既定の値以下の変換係数の値に対応する係数重要度の値は、次第に減少する。適応スキャニング処理は、係数重要度マップを既定の値に設定することによりリセットされる。いくつかの実施の形態においては、フラグが送られない場合における“lcu_row_cabac_init_flag”フラグのデフォルト値は
、は“0”である。“lcu_row_cabac_init_idc_flag”フラグは、cabac_init_idcの値が
各LCU行の始まりにおいて伝送されるか否かを示している。いくつかの実施の形態においては、“lcu_row_cabac_init_idc_flag”フラグの値が“1”の場合に、cabac_init_idcの値は、各LCU行の先頭において伝送される。いくつかの実施の形態においては、フ
ラグが送られない場合における“lcu_row_cabac_init_idc_flag”フラグのデフォルト値
は“0”である。いくつかの実施の形態においては、“cabac_init_idc_present_flag”
フラグは、LCUに関するcabac_init_idcの値が伝送されるか否かを示している。いくつかの実施の形態においては、LCUに関するcabac_init_idcの値が伝送されない場合に、エントロピー符号化コンテキストは、ビットストリームにおけるcabac_init_idcに関する以前の値を用いることによりリセットされる。本発明のいくつかの実施の形態においては、“lcu_row_cabac_init_flag”、および、“lcu_row_cabac_init_idc_flag”は、通常のスライスヘッダにおいて、例えば、“entropy_slice_flag”の値が“0”の場合に通知される。表8および表9は、これらの実施の形態のための例示的なシンタックスを示している。本発明のいくつかの実施の形態においては、“lcu_row_cabac_init_flag”、および
、“lcu_row_cabac_init_idc_flag”は、エントロピースライスヘッダにおいて、例えば
、“entropy_slice_flag”の値が“1”の場合に通知される。表8は、例示的なスライスヘッダのシンタックスを示し、表9は、例示的なスライスデータのシンタックス(coding_unit)を示す。
マクロブロック行の始まりにおいて伝送される。いくつかの実施の形態においては、フラグが送られない場合における“mb_row_cabac_init_idc_flag”フラグのデフォルト値は“0”である。いくつかの実施の形態においては、“cabac_init_idc_present_flag”フラ
グは、マクロブロックに関するcabac_init_idcの値が伝送されるか否かを示している。いくつかの実施の形態においては、マクロブロックに関するcabac_init_idcの値が伝送されない場合に、エントロピー符号化コンテキストは、ビットストリームにおけるcabac_init_idcに関する以前の値を用いることによりリセットされる。本発明のいくつかの実施の形態においては、“mb_row_cabac_init_flag”フラグ、および、“mb_row_cabac_init_idc_flag”フラグは、通常のスライスヘッダにおいて、例えば、“entropy_slice_flag”の値が“0”の場合に通知される。本発明のいくつかの実施の形態においては、“mb_row_cabac_init_flag”フラグ、および、“mb_row_cabac_init_idc_flag”フラグは、エントロピースライスヘッダにおいて、例えば、“entropy_slice_flag”の値が“1”の場合に通知される。表10および表11は、これらの実施の形態のための例示的なシンタックスを示している。表10は、例示的なスライスヘッダのシンタックスを示し、表11は、例示的なスライスデータのシンタックス(coding_unit)を示す。
ンデータは、各再構成スライスにおいて送られる。他の実施の形態においては、ロケーションデータは、画像ごとに1度送られる。
数より1小さい値を示す。
ースライスからのオフセットを示している。
・“num_of_lcu_rows_minus1”は、エントロピースライス内のLCU行の数より1小さい値を示す。
・“lcu_row_offset[i]”は、i番目のLCU行の前のLCU行からのオフセットを示し
ている。
”に置き換えられる。例えば、表12における“first_lcu_in_slice”、“lcu_row_cabac_init_flag”、“lcu_row_cabac_init_idc_flag”、“lcu_row_locations_flag”、“lcu_row_locations()”、“num_of_lcu_rows_minus1”、および、“lcu_row_offset[i]”は、それぞれ、“first_mb_in_slice”、“mb_row_cabac_init_flag”、“mb_row_cabac_init_idc_flag”、“mb_row_locations_flag”、“mb_row_locations()”、“num_of_mb_rows_minus1”、および、“mb_row_offset[i]”に置き換えられる。
クロブロックに関して、変換係数の値がゼロの位置と非ゼロ変換係数のレベル値とを通知することによって達成される。多くの符号化システムは、基本ユニットに関して、残差データの終端に、変換係数の値がゼロの位置を割り当てるので、残りの変換係数の値がゼロであることを効率的に通知するために、最後の有意変換係数(significant transform coefficient)の後に“end-of-block”符号が使用可能である。
iは第i番目の変換係数である。次に変換係数coeff10を符号化するために、coeff10に対応するコンテキストctxt10を取得する必要がある。このように、前の基本ユニットが符号化されるまで取得できない走査順S={coeff0,coeff10,coeff1,...}を知る必要があるため、基本ユニットの符号化に関する時間的な順序付けが強制される。
された変換係数をエントロピー符号化し(ステップ1284)、符号化すべき有意変換係数が残っているか否かについて判定を下す(ステップ1286)。符号化すべき有意変換係数が残っている場合(分岐1287)、次の有意変換係数を取得し(ステップ1280)、処理を継続する。もしなければ(分岐1289)、処理を終了する(ステップ1290)。いくつかのデコーダの実施の形態は、図37との関係において記述される。デコーダは、次のコンテキストを取得し(ステップ1300)、取得されたコンテキストを用いて、ビットストリームからの次の有意変換係数を復号する(ステップ1302)。復号された変換係数を蓄積し(ステップ1304)、復号すべき有意変換係数が残っているか否かについて判定を下す(ステップ1306)。もし残っていれば(分岐1307)、次のコンテキストを取得し(ステップ1300)、処理を継続する。もしなければ(分岐1309)、処理を終了する(ステップ1310)。
より高い圧縮効率がもたらされる。順方向予測されたB−スライスに用いられる参照スライスは、参照を時間的に将来および/または過去のフレーム/ピクチャから選ぶ通常のB−スライスと区別される時間的により早いフレーム/ピクチャからのものである。このように、順方向予測されたB−スライスは、通常のB−スライスのものとは異なった統計的特性をもつ残差データを有する。図43に示されるように、本技術は、B−スライス、P−スライス、およびI−スライスを受信し、受信したスライスのタイプに基づいて、コンテキストの初期化技術を選択する。加えて、順方向予測されたB−スライスの場合には、P−スライスのためのコンテキストの初期化技術が用いられる。より具体的には、以下のステップが行われる。
ステップ4301:ビットストリームからスライスタイプを復号する。
ステップ4302:スライスタイプがB−スライスか否かを判定する。
ステップ4303:スライスタイプがB−スライスである(ステップ4302においてY
es)場合、スライスが順方向予測されているか否かを判定する。スライスが順方向予測されていれば、第2の初期化技術を用いてコンテキストの初期化を行う。スライスが順方向予測されていなければ、第1の初期化技術を用いてコンテキストの初期化を行う。
ステップ4304:スライスタイプがB−スライスでない(ステップ4302においてNo)場合、スライスタイプがP−スライスか否かを判定する。スライスタイプがP−スライスであれば、第2の初期化技術を用いてコンテキストの初期化を行う。
ステップ4305:スライスタイプがP−スライスでない(ステップ4304においてNo)場合、スライスタイプがI−スライスか否かを判定する。スライスタイプがI−スライスであれば、第3の初期化技術を用いてコンテキストの初期化を行う。
ステップ4101:ビットストリームからスライスタイプを復号する。
ステップ4102:スライスタイプがB−スライスか否かを判定する。
ステップ4103:スライスタイプがB−スライスである(ステップ4102においてYes)場合、スライスが順方向または逆方向のいずれか一方の方向に予測されたかどうかを判定する。スライスが順方向または逆方向のいずれか一方の方向に予測されていれば、第2の初期化技術を用いてコンテキストの初期化を行う。スライスが順方向または逆方向のいずれか一方の方向に予測されていなければ第1の初期化技術を用いてコンテキストの初期化を行う。
ステップ4104:スライスタイプがB−スライスでない(ステップ4102においてNo)場合、スライスタイプがP−スライスか否かを判定する。スライスタイプがP−スライスであれば、第2の初期化技術を用いてコンテキストの初期化を行う。
ステップ4105:スライスタイプがP−スライスでない(ステップ4104においてるNo)場合、スライスタイプがI−スライスか否かを判定する。スライスタイプがI−スライスであれば、第3の初期化技術を用いてコンテキストの初期化を行う。
ステップ4201:ビットストリームからスライスタイプを復号する。
ステップ4202:スライスタイプがB−スライスか否かを判定する。
ステップ4203:スライスタイプがB−スライスである(ステップ4202においてYes)場合、スライスが順方向予測されているか否かを判定する。スライスが順方向予測されていれば、第4の初期化技術を用いてコンテキストの初期化を行う。スライスが順方向予測されていなければ、第1の初期化技術を用いてコンテキストの初期化を行う。
ステップ4204:スライスタイプがB−スライスでない(ステップ4202においてNo)場合、スライスタイプがP−スライスか否かを判定する。スライスタイプがP−スライスであれば、第2の初期化技術を用いてコンテキストの初期化を行う。
ステップ4205:スライスタイプがP−スライスでない(ステップ4204においてNo)場合、スライスタイプがI−スライスか否かを判定する。スライスタイプがI−スライスであれば、第3の初期化技術を用いてコンテキストの初期化を行う。
態において、PicOrderCntは、復号されたフレームの表示順を示す。この実施の形態では、復号されたフレームが現フレームの表示の前か、あるいは現フレームの表示の後にすべて表示されるので、上記の条件(3)は、単方向B−スライスに関して真である。
efPicList1[1]が入れ替え(switch)られる。Nは、参照ピクチャリストにおける全フレーム/ピクチャの数よりも少ない数を指す。PicOrderCntは、デコーダピクチャバッファにおける相対的な表示順も指す。
ンコーダを初期化するために、B−スライスの方法か、P−スライスの方法のいずれか一方を示すフラグである。いくつかの実施の形態において、“cabac_init_P_flag”の値が
“0”である場合、初期化方法としてB−スライスの方法が選択され、“cabac_init_P_flag”の値が“1”である場合、初期化方法としてP−スライスの方法が選択される。
期化の予測精度が高いほど、より良好な圧縮効率をもたらす。処理されたビンの推定数が閾値より大きい場合(分岐1324)、単一のコンテキストの初期化値を選択する(ステップ1326)。処理されたビンの推定数が閾値より小さい場合(分岐1328)、QPに基づいてコンテキストを適応的に初期化する(ステップ1330)。単一のコンテキストの初期化値は、選択されたメトリック、例えば、2乗誤差、相対エントロピー、および他の距離メトリックのトレーニングおよび最適化に基づいて選択する。適応的なQPに基づく初期化は、CA*QP+CB形式のアフィン適応(affine adaptation)である。こ
こでCAおよびCBは定数である。いくつかの実施の形態では、前のスライスにおいて処理されたビンの数に基づいて、ビンの数を推定する。他の実施の形態では、前のフレームにおけるビン処理の数に基づいて、ビンの数を推定する。
リティが平均的に−0.0860dB低下する。同一のクオリティレベルに対しては、スライスを用いない符号化よりも複数のエントロピースライスを伴う1つの再構成スライスを用いて符号化することにより、ビットレートが平均的に1.83%増加する。
OM、EPROM、EEPROM(登録商標)、RAM、VRAM、DRAM、および、指令および/またはデータを記録するために適した媒体または装置などが挙げられるが、
これらに限定されない。
(a)ビデオデコーダにおいてスライスを受信するステップと、
(b)スライスが順方向予測B−スライス、あるいは逆方向予測B−スライスのいずれであるか、および順方向および逆両方向に予測されたB−スライスではないことを識別するステップと、
(c)P−スライスの技術を用いて、スライスに関連するコンテキストを初期化するステップとを有する。
(a)ビデオデコーダにおいてスライスを受信する工程と、
(b)スライスが順方向予測されたBスライスかどうかを識別する工程と、
(c)B−スライス、P−スライス、およびI−スライスのいずれかに用いる技術とは異なる技術を用いて、スライスに関連するコンテキストを初期化する工程とを有する。
Claims (2)
- 動画像シーケンスの動画像フレームを復号する復号方法であって
前記動画像フレームに含まれる現スライスのスライスタイプを指示する第1のシンタックス要素を復号する第1の復号ステップと、
前記第1のシンタックス要素によって指示される前記現スライスの前記スライスタイプに応じてCABAC(Context Adaptive Binary Arithmetic Coding)コンテキストの初期化方法を3種類の初期化方法から選択する選択ステップと、
前記選択ステップで選択した前記初期化方法に応じて前記CABACコンテキストを初期化する初期化ステップと、
前記初期化方法を入れ替えることを通知するためのフラグを復号する第2の復号ステップと、を有し、
前記3種類の初期化方法は、前記スライスタイプがIである場合に用いる第1の初期化方法、前記スライスタイプがPである場合に用いる第2の初期化方法、および、前記スライスタイプがBである場合に用いる第3の初期化方法であり、
前記選択ステップは、前記スライスタイプがBである場合に、
前記フラグの値が、前記初期化方法を入れ替えないことを示す第1の値である場合には、前記第3の初期化方法を選択し、
前記フラグの値が、前記初期化方法を入れ替えることを示す第2の値である場合には、前記第2の初期化方法を選択することを特徴とする、復号方法。 - 少なくとも1つのプロセッサと、
コンピュータプログラムコードを有する少なくとも1つのメモリと、
を備える装置であって、
前記コンピュータプログラムコードは、前記プロセッサおよび前記メモリと協働して、前記装置に、少なくとも、
動画像フレームに含まれる現スライスのスライスタイプを指示する第1のシンタックス要素を復号することと、
前記第1のシンタックス要素によって指示される前記現スライスの前記スライスタイプに応じてCABAC(Context Adaptive Binary Arithmetic Coding)コンテキストの初期化方法を3種類の初期化方法から選択することと、
前記選択することにおいて選択した前記初期化方法に応じて前記CABACコンテキストを初期化することと、
前記初期化方法を入れ替えることを通知するためのフラグを復号することと、
を実施させるように構成され、
前記3種類の初期化方法は、前記スライスタイプがIである場合に用いる第1の初期化方法、前記スライスタイプがPである場合に用いる第2の初期化方法、および、前記スライスタイプがBである場合に用いる第3の初期化方法であり、
前記選択することは、前記スライスタイプがBである場合に、
前記フラグの値が、前記初期化方法を入れ替えないことを示す第1の値である場合には、前記第3の初期化方法を選択し、
前記フラグの値が、前記初期化方法を入れ替えることを示す第2の値である場合には、前記第2の初期化方法を選択することを特徴とする、装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/174,564 | 2011-06-30 | ||
US13/174,564 US9060173B2 (en) | 2011-06-30 | 2011-06-30 | Context initialization based on decoder picture buffer |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016144082A Division JP6182649B2 (ja) | 2011-06-30 | 2016-07-22 | デコーダピクチャバッファに基づくコンテキスト初期化 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019108204A Division JP6789351B2 (ja) | 2011-06-30 | 2019-06-10 | 動画像シーケンスの動画像フレームを復号する復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017216714A JP2017216714A (ja) | 2017-12-07 |
JP6541274B2 true JP6541274B2 (ja) | 2019-07-10 |
Family
ID=47390658
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013558266A Active JP5978233B2 (ja) | 2011-06-30 | 2012-06-27 | 初期化方法、復号方法、復号装置および初期化プログラム |
JP2016144082A Active JP6182649B2 (ja) | 2011-06-30 | 2016-07-22 | デコーダピクチャバッファに基づくコンテキスト初期化 |
JP2017138980A Active JP6541274B2 (ja) | 2011-06-30 | 2017-07-18 | 動画像シーケンスの動画像フレームを復号する復号方法および装置 |
JP2019108204A Active JP6789351B2 (ja) | 2011-06-30 | 2019-06-10 | 動画像シーケンスの動画像フレームを復号する復号方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013558266A Active JP5978233B2 (ja) | 2011-06-30 | 2012-06-27 | 初期化方法、復号方法、復号装置および初期化プログラム |
JP2016144082A Active JP6182649B2 (ja) | 2011-06-30 | 2016-07-22 | デコーダピクチャバッファに基づくコンテキスト初期化 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019108204A Active JP6789351B2 (ja) | 2011-06-30 | 2019-06-10 | 動画像シーケンスの動画像フレームを復号する復号方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US9060173B2 (ja) |
EP (1) | EP2727361B1 (ja) |
JP (4) | JP5978233B2 (ja) |
CN (3) | CN107087177B (ja) |
ES (1) | ES2687945T3 (ja) |
RU (4) | RU2597523C2 (ja) |
WO (1) | WO2013002412A1 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9313514B2 (en) | 2010-10-01 | 2016-04-12 | Sharp Kabushiki Kaisha | Methods and systems for entropy coder initialization |
US9338465B2 (en) * | 2011-06-30 | 2016-05-10 | Sharp Kabushiki Kaisha | Context initialization based on decoder picture buffer |
US9060173B2 (en) * | 2011-06-30 | 2015-06-16 | Sharp Kabushiki Kaisha | Context initialization based on decoder picture buffer |
US11647197B2 (en) | 2011-06-30 | 2023-05-09 | Velos Media, Llc | Context initialization based on slice header flag and slice type |
CN107257490B (zh) | 2012-01-27 | 2019-12-17 | 太阳专利托管公司 | 图像编码方法及图像编码装置 |
US9369710B2 (en) | 2012-02-06 | 2016-06-14 | Qualcomm Incorporated | Reference picture list modification for video coding |
JP6008237B2 (ja) * | 2012-06-28 | 2016-10-19 | パナソニックIpマネジメント株式会社 | 携帯端末 |
EP2868094A1 (en) * | 2012-06-29 | 2015-05-06 | Telefonaktiebolaget LM Ericsson (PUBL) | Apparatus and methods thereof for video processing |
US9485506B2 (en) * | 2012-09-11 | 2016-11-01 | Texas Instruments Incorporated | Method and system for constraining slice header processing overhead in video coding |
US20140072027A1 (en) * | 2012-09-12 | 2014-03-13 | Ati Technologies Ulc | System for video compression |
US10785482B2 (en) | 2012-09-24 | 2020-09-22 | Texas Instruments Incorporated | Method and system for constraining tile processing overhead in video coding |
JP5979309B2 (ja) * | 2013-03-29 | 2016-08-24 | 日産自動車株式会社 | 非接触給電システム |
GB2516224A (en) | 2013-07-11 | 2015-01-21 | Nokia Corp | An apparatus, a method and a computer program for video coding and decoding |
GB2516824A (en) | 2013-07-23 | 2015-02-11 | Nokia Corp | An apparatus, a method and a computer program for video coding and decoding |
WO2015054811A1 (en) * | 2013-10-14 | 2015-04-23 | Microsoft Corporation | Features of intra block copy prediction mode for video and image coding and decoding |
JP6336058B2 (ja) | 2013-10-14 | 2018-06-06 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ビデオ及び画像符号化及び復号のためのベースカラーインデックスマップモードの機能 |
WO2015054813A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Technology Licensing, Llc | Encoder-side options for intra block copy prediction mode for video and image coding |
BR112016015080A2 (pt) | 2014-01-03 | 2017-08-08 | Microsoft Technology Licensing Llc | Predição de vetor de bloco em codificação / decodificação de vídeo e imagem |
US10390034B2 (en) | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
US10542274B2 (en) | 2014-02-21 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dictionary encoding and decoding of screen content |
MX361228B (es) | 2014-03-04 | 2018-11-29 | Microsoft Technology Licensing Llc | Inversión de bloque y modo de omisión en predicción de intracopia de bloque. |
EP3158734A1 (en) | 2014-06-19 | 2017-04-26 | Microsoft Technology Licensing, LLC | Unified intra block copy and inter prediction modes |
EP3917146A1 (en) | 2014-09-30 | 2021-12-01 | Microsoft Technology Licensing, LLC | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
US9591325B2 (en) | 2015-01-27 | 2017-03-07 | Microsoft Technology Licensing, Llc | Special case handling for merged chroma blocks in intra block copy prediction mode |
US10334248B2 (en) * | 2015-05-29 | 2019-06-25 | Qualcomm Incorporated | Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design |
US10659783B2 (en) | 2015-06-09 | 2020-05-19 | Microsoft Technology Licensing, Llc | Robust encoding/decoding of escape-coded pixels in palette mode |
US10264264B2 (en) * | 2016-09-24 | 2019-04-16 | Apple Inc. | Multi-bin decoding systems and methods |
RU2648581C1 (ru) * | 2016-12-08 | 2018-03-26 | федеральное государственное бюджетное образовательное учреждение высшего образования "Национальный исследовательский университет "МЭИ" (ФГБОУ ВО "НИУ "МЭИ") | Способ кодирования и декодирования видеоинформации пониженной, стандартной и высокой четкости |
TWI597912B (zh) * | 2016-12-14 | 2017-09-01 | 財團法人工業技術研究院 | 能量採集系統與能量採集系統的控制方法 |
US11215156B2 (en) | 2017-03-03 | 2022-01-04 | Gentherm Incorporated | Dual voltage battery system for a vehicle |
US11082721B2 (en) | 2017-09-07 | 2021-08-03 | Lg Electronics Inc. | Method and apparatus for entropy-encoding and entropy-decoding video signal |
US11039143B2 (en) * | 2017-11-20 | 2021-06-15 | Qualcomm Incorporated | Memory reduction for context initialization with temporal prediction |
US10986349B2 (en) | 2017-12-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Constraints on locations of reference blocks for intra block copy prediction |
WO2020085953A1 (en) * | 2018-10-25 | 2020-04-30 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods for inter prediction |
US11109041B2 (en) * | 2019-05-16 | 2021-08-31 | Tencent America LLC | Method and apparatus for video coding |
WO2021160168A1 (en) * | 2020-02-14 | 2021-08-19 | Beijing Bytedance Network Technology Co., Ltd. | Reference picture resampling activation in video coding |
WO2023182673A1 (ko) * | 2022-03-21 | 2023-09-28 | 현대자동차주식회사 | 컨텍스트 모델 초기화를 사용하는 비디오 코딩을 위한 방법 및 장치 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7369612B2 (en) * | 2000-12-11 | 2008-05-06 | Sony Corporation | Video decoder and method for using the same |
JP4240283B2 (ja) * | 2002-10-10 | 2009-03-18 | ソニー株式会社 | 復号装置及び復号方法 |
US6894628B2 (en) * | 2003-07-17 | 2005-05-17 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and methods for entropy-encoding or entropy-decoding using an initialization of context variables |
EP1551185A1 (en) * | 2004-01-05 | 2005-07-06 | Thomson Licensing S.A. | Encoding method, decoding method, and encoding apparatus for a digital picture sequence |
JP4241417B2 (ja) * | 2004-02-04 | 2009-03-18 | 日本ビクター株式会社 | 算術復号化装置、および算術復号化プログラム |
US7463781B2 (en) * | 2004-04-14 | 2008-12-09 | Lsi Corporation | Low overhead context intializations for arithmetic video codecs |
KR100664936B1 (ko) * | 2005-04-13 | 2007-01-04 | 삼성전자주식회사 | 코딩 효율이 향상된 컨텍스트 기반 적응적 산술 코딩 및디코딩 방법과 이를 위한 장치, 이를 포함하는 비디오 코딩및 디코딩 방법과 이를 위한 장치 |
KR100703776B1 (ko) * | 2005-04-19 | 2007-04-06 | 삼성전자주식회사 | 향상된 코딩 효율을 갖는 컨텍스트 기반 적응적 산술 코딩및 디코딩 방법과 이를 위한 장치, 이를 포함하는 비디오코딩 및 디코딩 방법과 이를 위한 장치 |
KR100763181B1 (ko) * | 2005-04-19 | 2007-10-05 | 삼성전자주식회사 | 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치 |
CN100461863C (zh) * | 2005-08-05 | 2009-02-11 | 上海富瀚微电子有限公司 | 基于上下文自适应二进制算术解码器 |
EP1775954A1 (en) * | 2005-10-14 | 2007-04-18 | Thomson Licensing | Method and apparatus for reconstructing a video frame for spatial multi-layer video sequence |
EP1806930A1 (en) * | 2006-01-10 | 2007-07-11 | Thomson Licensing | Method and apparatus for constructing reference picture lists for scalable video |
FR2898754B1 (fr) * | 2006-03-17 | 2008-06-13 | Thales Sa | Procede de protection de donnees multimedia au moyen de couches d'abstraction reseau (nal) supplementaires |
US8848789B2 (en) * | 2006-03-27 | 2014-09-30 | Qualcomm Incorporated | Method and system for coding and decoding information associated with video compression |
US20100091845A1 (en) * | 2006-03-30 | 2010-04-15 | Byeong Moon Jeon | Method and apparatus for decoding/encoding a video signal |
PL2008460T3 (pl) * | 2006-03-30 | 2017-10-31 | Lg Electronics Inc | Sposób i urządzenie do dekodowania/kodowania sygnału wideo |
US7626521B2 (en) * | 2006-06-08 | 2009-12-01 | Via Technologies, Inc. | Decoding control of computational core of programmable graphics processing unit |
KR100817021B1 (ko) * | 2006-06-21 | 2008-03-26 | 한국전자통신연구원 | H.264/avc 멀티미디어 콘텐츠의 선택적 암호화기능을 갖는 부호화 및 복호화 장치 및 그 방법 |
US8532178B2 (en) * | 2006-08-25 | 2013-09-10 | Lg Electronics Inc. | Method and apparatus for decoding/encoding a video signal with inter-view reference picture list construction |
US7365659B1 (en) * | 2006-12-06 | 2008-04-29 | Silicon Image Gmbh | Method of context adaptive binary arithmetic coding and coding apparatus using the same |
CN101198051B (zh) * | 2006-12-07 | 2011-10-05 | 深圳艾科创新微电子有限公司 | 基于h.264的熵解码器的实现方法及装置 |
CN100527842C (zh) * | 2007-01-26 | 2009-08-12 | 清华大学 | 基于背景的运动估计编码方法 |
US7443318B2 (en) * | 2007-03-30 | 2008-10-28 | Hong Kong Applied Science And Technology Research Institute Co. Ltd. | High speed context memory implementation for H.264 |
US20080247459A1 (en) * | 2007-04-04 | 2008-10-09 | General Instrument Corporation | Method and System for Providing Content Adaptive Binary Arithmetic Coder Output Bit Counting |
US9648325B2 (en) * | 2007-06-30 | 2017-05-09 | Microsoft Technology Licensing, Llc | Video decoding implementations for a graphics processing unit |
CN101389021B (zh) * | 2007-09-14 | 2010-12-22 | 华为技术有限公司 | 视频编解码方法及装置 |
EP2227020B1 (en) * | 2007-09-28 | 2014-08-13 | Dolby Laboratories Licensing Corporation | Video compression and transmission techniques |
EP2215844A2 (en) * | 2007-10-15 | 2010-08-11 | Nokia Corporation | Motion skip and single-loop encoding for multi-view video content |
US8542748B2 (en) * | 2008-03-28 | 2013-09-24 | Sharp Laboratories Of America, Inc. | Methods and systems for parallel video encoding and decoding |
JP4962400B2 (ja) * | 2008-04-30 | 2012-06-27 | ソニー株式会社 | 算術復号装置 |
US7932843B2 (en) * | 2008-10-17 | 2011-04-26 | Texas Instruments Incorporated | Parallel CABAC decoding for video decompression |
JP4962476B2 (ja) * | 2008-11-28 | 2012-06-27 | ソニー株式会社 | 算術復号装置 |
US8693539B2 (en) * | 2009-03-26 | 2014-04-08 | Panasonic Corporation | Coding method, error detecting method, decoding method, coding apparatus, error detecting apparatus, and decoding apparatus |
US9179161B2 (en) * | 2009-05-20 | 2015-11-03 | Nissim Nissimyan | Video encoding |
WO2011064673A1 (en) * | 2009-11-30 | 2011-06-03 | France Telecom | Method of and apparatus for encoding video frames, method of and apparatus for decoding video frames |
KR101348613B1 (ko) * | 2009-12-23 | 2014-01-10 | 한국전자통신연구원 | 영상의 부호화/복호화 장치 및 그 방법 |
CN103119849B (zh) | 2010-04-13 | 2017-06-16 | 弗劳恩霍夫应用研究促进协会 | 概率区间分割编码器和译码器 |
US9313514B2 (en) * | 2010-10-01 | 2016-04-12 | Sharp Kabushiki Kaisha | Methods and systems for entropy coder initialization |
US9215473B2 (en) * | 2011-01-26 | 2015-12-15 | Qualcomm Incorporated | Sub-slices in video coding |
US9060173B2 (en) * | 2011-06-30 | 2015-06-16 | Sharp Kabushiki Kaisha | Context initialization based on decoder picture buffer |
US9838685B2 (en) | 2012-06-15 | 2017-12-05 | Google Technology Holdings LLC | Method and apparatus for efficient slice header processing |
-
2011
- 2011-06-30 US US13/174,564 patent/US9060173B2/en active Active
-
2012
- 2012-06-27 EP EP12804051.6A patent/EP2727361B1/en active Active
- 2012-06-27 RU RU2013152805/08A patent/RU2597523C2/ru active
- 2012-06-27 RU RU2016133488A patent/RU2645270C1/ru active
- 2012-06-27 CN CN201710066098.4A patent/CN107087177B/zh active Active
- 2012-06-27 CN CN201710066086.1A patent/CN107105253B/zh active Active
- 2012-06-27 WO PCT/JP2012/067023 patent/WO2013002412A1/en active Application Filing
- 2012-06-27 ES ES12804051.6T patent/ES2687945T3/es active Active
- 2012-06-27 JP JP2013558266A patent/JP5978233B2/ja active Active
- 2012-06-27 CN CN201280032068.7A patent/CN103875247B/zh active Active
-
2015
- 2015-02-25 US US14/630,860 patent/US9338472B2/en active Active
-
2016
- 2016-07-22 JP JP2016144082A patent/JP6182649B2/ja active Active
-
2017
- 2017-07-18 JP JP2017138980A patent/JP6541274B2/ja active Active
- 2017-12-21 RU RU2017145078A patent/RU2017145078A/ru not_active Application Discontinuation
-
2019
- 2019-05-15 RU RU2019114693A patent/RU2019114693A/ru unknown
- 2019-06-10 JP JP2019108204A patent/JP6789351B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2013002412A1 (en) | 2013-01-03 |
CN107105253B (zh) | 2020-01-07 |
US20150172709A1 (en) | 2015-06-18 |
JP5978233B2 (ja) | 2016-08-24 |
JP6789351B2 (ja) | 2020-11-25 |
CN107087177A (zh) | 2017-08-22 |
JP2014523150A (ja) | 2014-09-08 |
JP2016226003A (ja) | 2016-12-28 |
US20130003827A1 (en) | 2013-01-03 |
CN107105253A (zh) | 2017-08-29 |
RU2019114693A (ru) | 2020-11-16 |
RU2017145078A3 (ja) | 2019-06-24 |
JP2017216714A (ja) | 2017-12-07 |
CN107087177B (zh) | 2020-02-18 |
CN103875247B (zh) | 2017-03-22 |
CN103875247A (zh) | 2014-06-18 |
RU2597523C2 (ru) | 2016-09-10 |
JP2019169980A (ja) | 2019-10-03 |
WO2013002412A8 (en) | 2013-02-28 |
EP2727361A1 (en) | 2014-05-07 |
US9338472B2 (en) | 2016-05-10 |
JP6182649B2 (ja) | 2017-08-16 |
US9060173B2 (en) | 2015-06-16 |
ES2687945T3 (es) | 2018-10-30 |
EP2727361A4 (en) | 2015-01-07 |
RU2017145078A (ru) | 2019-06-24 |
RU2645270C1 (ru) | 2018-02-19 |
RU2013152805A (ru) | 2015-08-10 |
EP2727361B1 (en) | 2018-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6541274B2 (ja) | 動画像シーケンスの動画像フレームを復号する復号方法および装置 | |
JP6147320B2 (ja) | 復号方法、復号装置および符号化方法 | |
JP6263249B2 (ja) | 動画像復号装置、動画像復号方法、動画像符号化装置および動画像符号化方法 | |
JP7525711B2 (ja) | 装置 | |
JP6162113B2 (ja) | コンテキストを初期化するための初期化方法を選択するための選択方法及び復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20171211 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20171218 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20171205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20180717 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6541274 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |