JP2013009195A - 動画像符号化装置 - Google Patents
動画像符号化装置 Download PDFInfo
- Publication number
- JP2013009195A JP2013009195A JP2011141008A JP2011141008A JP2013009195A JP 2013009195 A JP2013009195 A JP 2013009195A JP 2011141008 A JP2011141008 A JP 2011141008A JP 2011141008 A JP2011141008 A JP 2011141008A JP 2013009195 A JP2013009195 A JP 2013009195A
- Authority
- JP
- Japan
- Prior art keywords
- coding
- unit
- encoding
- prediction
- binary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】
二値算術符号化を使用するH.264の動画符号化方式で二値算術符号化での符号化効率を反映した符号化モードを選択する。
【解決手段】
CABAC符号化部(110)は、量子化部(109)の出力を含むシンタックスエレメントを二値シンボルに符号化する。符号化部(110)は、二値シンボルごとのシンボル値とその発生頻度を記憶し、符号化モード選択部(113)からの要求信号に従いモード選択部(113)に供給する。選択部(113)は、符号化部(110)からの情報を参照して、インター予測部(106)及びイントラ予測部(107)による予測信号の一方を選択し、加算器(103)に供給する。加算器(103)は符号化対象マクロブロックの画像信号の予測誤差信号を算出する。直交変換部(108)は加算器(103)の出力を直交変換し、量子化部(109)は直交変換部(108)の出力を量子化する。
【選択図】 図1
二値算術符号化を使用するH.264の動画符号化方式で二値算術符号化での符号化効率を反映した符号化モードを選択する。
【解決手段】
CABAC符号化部(110)は、量子化部(109)の出力を含むシンタックスエレメントを二値シンボルに符号化する。符号化部(110)は、二値シンボルごとのシンボル値とその発生頻度を記憶し、符号化モード選択部(113)からの要求信号に従いモード選択部(113)に供給する。選択部(113)は、符号化部(110)からの情報を参照して、インター予測部(106)及びイントラ予測部(107)による予測信号の一方を選択し、加算器(103)に供給する。加算器(103)は符号化対象マクロブロックの画像信号の予測誤差信号を算出する。直交変換部(108)は加算器(103)の出力を直交変換し、量子化部(109)は直交変換部(108)の出力を量子化する。
【選択図】 図1
Description
本発明は、動画像符号化装置に関する。
動画圧縮技術として、デジタル放送やDVD(Digital Versatile Disk)でのMPEG−2や、第3世代携帯電話のインターネット・ストリーミングや移動体通信などの分野でのMPEG−4が知られている。これらの背景には,蓄積メディアの大容量化、ネットワークの高速化、プロセッサの高性能化及びシステムLSIの大規模・低価格化などがある。このように、デジタル圧縮を必要とする映像応用システムを支える環境が着々と整ってきている。
これと並行して、さらなる高解像度・高画質化、多チャネル化、録画時間の延長などを目的として、より高圧縮率を目指す方式開発が国際標準化団体を中心に行われてきた。例えば、符号化方式H.264/AVC(Advanced Video Coding)が標準化され、この符号化方式はMPEG−4 part10(AVC)としても知られている。
MPEG−2やH.264等の符号化方式では、様々な符号化モードが用意され、マクロブロック単位で適用すべき符号化モードを選択可能となっている。例えば、イントラ予測モード/インター予測モード、参照画像の選択、動き探索時のブロックサイズ、及び予測信号の生成方法などである。符号化効率が高い符号化、すなわち符号化歪みが少なく、かつ発生符号量の少ない符号化を行うには、最適な符号モードを選択することが重要となる。特許文献1には、各符号化モードでの予測誤差が小さい符号化モードを選択する方法、および、各符号化モードで仮符号化を行って符号量の少ない符号化モードを選択する方法が記載されている。
H.264方式では、CABAC(Context−Adaptive Binary Arithmetic Coding)と呼ばれるエントロピー符号化方式が採用されている。
CABACは、符号化対象である変換係数、動きベクトル情報、符号化モード情報などの構文要素(Syntax Element)を、それぞれ所定の方法で二値シンボルに符号化し、二値算術符号化を行う。二値算術符号化は、所定の方法で分類された二値シンボルごとの発生頻度を符号化の過程で更新し、冗長性を最大限に圧縮する符号化方式である。また、二値算術符号化は、二値シンボルごとの1シンボルずつ更新しながら算術符号化を行う必要があるので、並列処理が困難であり、膨大な処理量を必要とする。
ところが、H.264において特許文献1に記載の方法で予測誤差の小さい符号化モードを選択しようとしても、CABACでの符号化効率が反映されないので、最適な符号化モードを選択できない。
また、各符号化モードで仮符号化を行って符号量の少ない符号モードを選択する特許文献1に記載の方法では、適切な符号化モードを選択できるものの、処理量の多い二値算術符号化を複数回実行する必要がある。この結果、処理時間が増大し、符号化のためのハードウェア規模の増大を招く。
本発明は、このような状況に鑑みてなされたものであり、エントロピー符号化に二値算術符号化を用いた符号化方式において、処理時間や符号化装置のハードウェア規模の増大を防止できる動画像符号化装置を提示することを目的とする。
本発明に係る動画像符号化装置は、直交変換及び量子化により動画像を符号化する符号化手段と、前記符号化手段の出力を含むシンタックスエレメントを二値シンボルに符号化する二値算術符号化手段であって、前記二値シンボルごとのシンボル値とその発生頻度を格納するメモリ手段、前記メモリ手段に格納された前記シンボル値とその発生頻度の値を用いて算術符号化を行う算術符号化手段、及び前記メモリ手段に格納された前記シンボル値とその発生頻度を読み出すメモリ読み出し手段を具備する二値算術符号化手段と、複数のモードから前記符号化手段で適用すべき符号化モードを選択する符号化モード選択手段であって、前記メモリ手段から読み出された前記シンボル値とその発生頻度の値から前記シンタックスエレメントごとの符号化コストを算出するコスト算出手段を具備し、前記符号化コストを参照して、前記適用すべき符号化モードを選択する符号化モード選択手段とを有することを特徴とする。
本発明によれば、エントロピー符号化に二値算術符号化を用いた動画像符号化において、大幅な処理時間の増大と符号化装置のハードウェア規模の増大を招く事なく、適切な符号化モードを選択でき、高い符号化効率を実現できる。
以下、図面を参照して、本発明の実施例を詳細に説明する。
図1は、本発明に係る動画像符号化装置の一実施例の概略構成ブロック図を示す。本実施例は、H.264と同様に、様々な符号化モードが存在しマクロブロック単位で選択が可能な符号化方式で動画像を符号化する。選択可能な符号化モードは例えば、イントラ予測モード/インター予測モード、参照画像の選択、動き探索時のブロックサイズ及び予測信号の生成方法などである。
外部から入力される動画像の各画像信号(原画像信号)は、符号化ピクチャタイプに依存した符号化フレーム順の入れ替えのためにフレームバッファ101に一旦保持される。フレームバッファ101に保持される原画像信号は、後段の処理のためにマクロブロック単位(水平16画素×垂直16ライン)で読み出され、加算器103、インター予測部106及びイントラ予測部107に供給される。
インター予測部106は、フレーム間動き補償予測を行なって予測信号を生成し、符号化モード選択部113に出力する。イントラ予測部107は、同フレーム上の符号化済みである近傍のブロックの画素値を用いて予測信号を生成し、符号化モード選択部113に出力する。符号化モード選択部113は、インター予測部106からの予測データとイントラ予測部107からの予測信号の一方を選択し、選択した予測信号を加算器103,104に供給する。インター予測部106、イントラ予測部107及び符号化モード選択部113の詳細な動作は、後述する。
加算器103は、フレームバッファ101からの符号化対象マクロブロックの画像信号から符号化モード選択部113からの予測信号を減算し、得られた差分値、即ち予測誤差信号を直交変換部108に出力する。
直交変換部108は、加算器103からの予測誤差信号を直交変換し、得られた直交変換係数を量子化部109に出力する。量子化部109は、直交変換部108からの直交変換係数を所定の量子化ステップに従って量子化し、得られた量子化直交変換係数をCABAC符号化部110及び逆量子化部111に出力する。
逆量子化部111は、量子化部109から出力される量子化直交変換係数を逆量子化して直交変換係数に戻し、逆直交変換部112に出力する。逆直交変換部112は、逆量子化部111からの復元された直交変換係数を逆直交変換して予測誤差信号を復元し、加算器104に出力する。加算器104は、逆直交変換部112からの予測誤差信号と符号化モード選択部から113かの予測画像信号とを加算して復号化画像信号を生成する。生成された復号化画像信号は、イントラ予測部107と、参照フレームバッファ114に供給される。
参照フレームバッファ114は、加算器104からの復号化画像信号を必要期間、保持する。参照フレームバッファ114に保持される復号化画像信号は、以降の符号化処理で参照フレーム画像信号として用いられる。
CABAC符号化部110は、量子化部109から出力される量子化直交変換係数と符号化情報からなる構文要素、いわゆるシンタックスエレメント(SE:Syntax Element)を、CABACによる二値算術符号化で符号化する。CABAC符号化部110は、シンタックスエレメントを、それぞれ所定の方法で二値シンボルに符号化し、二値算術符号化を行う。二値算術符号化は、所定の方法で分類された二値シンボルごとの発生頻度を符号化の過程で更新し、冗長性を最大限に圧縮する符号化方法である。符号化情報は、具体的には、イントラ予測モード情報、インター予測モード情報、動きベクトル情報、及びマクロブロックモード情報などからなる。CABAC符号化部110は、シンタックスエレメントを二値算術符号化する二値算術符号化手段の一例である。
図2は、CABAC符号化部110の概略構成ブロック図を示す。図2を参照して、CABAC符号化部110の構成と動作を説明する。
CABAC符号化部110は、二値化部201、コンテキスト計算部202、コンテキストメモリ203、二値算術符号化部204、及びコンテキストメモリ読み出し部205からなる。
二値化部201には、SE20が入力される。二値化部201は、SE20に応じた二値化方法でSE20を二値化して二値化データ列21を生成し、二値算術符号化部204に出力する。二値化データ列21を構成する1ビットずつが二値算術符号化の符号化対象である。ここでは、二値算術符号化の符号化対象1ビット分をシンボルと呼ぶことにする。
また、二値化部201は、二値化データ列21とともにコンテキスト計算処理を行うのに必要な信号22を生成し、コンテキスト計算部202に出力する。この信号22は、H.264方式の規格書では、binIdx、maxBinIdxCtx又はctxIdxOffsetと呼ばれている信号であり、その内容については規格書に記載されている。図3は、H.264規格のCABACにおけるctxIdxを示す表である。
コンテキスト計算部202には、SE20と、二値化部201からの信号22が入力される。コンテキスト計算部202は、SE20及び信号22に基づいて各シンボルの出現確率を決定するコンテキストインデックス(以下、ctxIdxと呼ぶ)23を生成し、コンテキストメモリ203に出力する。
コンテキストメモリ203には、コンテキスト計算部202からのctxIdx23と、二値算術符号化部204からの更新データ25が入力される。コンテキストメモリ203には、値pStateIdxとシンボル値valMpsが格納されている。値pStateIdxは、ctxIdxで分類される二値シンボル値の発生頻度を示す。シンボル値valMpsは、その遷移状態番号に対応した次に入力される二値算術符号化の符号化対象であるシンボルを予測した値である。コンテキストメモリ203に格納されているこれらの値は、二値算術符号化部204にデータ24として出力される。なお、二値算術符号化部204からコンテキストメモリ203に供給される更新データ25は、pStateIdxとvalMpsからなる。値pStateIdxと値valMPSの内容自体は、H.264方式の規格書に記載されている。
二値算術符号化部204は、二値化部201からの二値化データ列21と、コンテキストメモリ203からのデータ24(StateIdxとvalMps)とを受け取り、二値算術符号化を行う。そして、二値算術符号化部204は、二値算術符号化して得られたストリームデータ26を出力する。
コンテキストメモリ読み出し部205には、図示しない外部からの読み出し要求27が入力する。この読み出し要求27は、任意のctxIdxに対してコンテキストメモリ203に格納されたpStateIdxとvalMpsを読み出すための要求信号である。コンテキストメモリ読み出し部205は、読み出し要求27を受けると、要求されたctxIdx対するpStateIdxとvalMpsをコンテキストメモリ203から読み出し、外部に出力する。
本実施例の符号化モード選択動作を説明する。符号化モード選択部113は、符号化モードを選択するために、マクロブロックごとに以下のように動作する。
第1に、発生頻度情報を取得する。まず、符号化モード選択部113は、これからCABAC符号化部110で符号化されるSEのコストを算出するために、SEを構成するctxIdxごとの発生頻度をコンテキストメモリ203から取得する。SEを構成するctxIdxとは、二値化した二値シンボルに対応するctxIdxである。例えば、マクロブロックタイプがI_16x16_0_0_0の場合、マクロブロックタイプを表すmb_typeというSEのIピクチャにおける二値シンボル値は、H.264方式の規格により「100000」の6ビットとなる。これに対応するctxIdxは、H.264方式の規格により、3、4、5、6、7及び8の6つとなる。図4は、H.264規格のCABACにおけるIピクチャのmb_typeの二値シンボルを示す表である。
ctxIdxの3、4、5、6、7及び8の発生頻度を取得する場合、前述したように、ctxIdxの3、4、5、6、7及び8の番号とともに読み出し要求をコンテキストメモリ読み出し部205に送る。こうすると、コンテキストメモリ読み出し部205は、それぞれに対応する発生頻度情報、すなわちpStateIdxとValMPSを符号化モード選択部113に供給する。ここでは、mb_typeでの例を説明したが、他のSEでも同様に行う。
第2に、符号化コストを算出する。すなわち、符号化モード選択部113は、上記のように取得したpStateIdxとValMPSを使って、算出を必要とするSEに対して符号化コストを算出する。符号化コストCは、
で算出できる。ここで、二値シンボル長をL、二値シンボルをbinval(i)、それに対応するpStateIdxとValMPSを、それぞれpStateIdx(i)、ValMPS(i)とした。iは0〜L−1である。これにより、CABAC符号化部110においての各SEの発生頻度に基づく符号化コストが算出される。すなわち、符号化モード選択部113は、符号化コストを算出するコスト算出手段として機能する。
3番目に、符号化モード選択部113は、インター予測部106及びイントラ予測部107から予測モード情報を取得する。即ち、インター予測部106は、インター予測の複数の予測モードでの予測データを生成し、インター予測で符号化効率の高い予測モードの候補を選択する。例えば予測誤差の二乗和を使って、符号化効率を算出する。選択する予測モードは1つでもよいし、複数でも構わない。インター予測部106は、選択した予測モードを示す情報を符号化モード選択部113に出力する。
イントラ予測部107は、イントラ予測の複数の予測モードでの予測データを生成し、イントラ予測で符号化効率の高い予測モードの候補を選択する。例えば予測誤差の二乗和を使って、符号化効率を算出する。選択する予測モードは1つでもよいし、複数でも構わない。イントラ予測部107は、選択した予測モードを示す情報を符号化モード選択部113に出力する。
最終的に、符号化モード選択部113は、上記のように取得されたインター予測部106及びイントラ予測部107からの予測モード情報に対して符号化コストCを加味した判定を行い、最終的な適用すべき符号化モードを選択する。
本実施例では、このような処理により、二値算術符号化での符号化効率を加味した符号化モードの選択を実現でき、従って、最適な符号化モードを選択できる。
Claims (2)
- 直交変換及び量子化により動画像を符号化する符号化手段と、
前記符号化手段の出力を含むシンタックスエレメントを二値シンボルに符号化する二値算術符号化手段であって、前記二値シンボルごとのシンボル値とその発生頻度を格納するメモリ手段、前記メモリ手段に格納された前記シンボル値とその発生頻度の値を用いて算術符号化を行う算術符号化手段、及び前記メモリ手段に格納された前記シンボル値とその発生頻度を読み出すメモリ読み出し手段を具備する二値算術符号化手段と、
複数のモードから前記符号化手段で適用すべき符号化モードを選択する符号化モード選択手段であって、前記メモリ手段から読み出された前記シンボル値とその発生頻度の値から前記シンタックスエレメントごとの符号化コストを算出するコスト算出手段を具備し、前記符号化コストを参照して、前記適用すべき符号化モードを選択する符号化モード選択手段
とを有することを特徴とする動画像符号化装置。 - 前記二値算術符号化手段は、CABAC符号化手段であることを特徴とする請求項1に記載の動画像符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011141008A JP2013009195A (ja) | 2011-06-24 | 2011-06-24 | 動画像符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011141008A JP2013009195A (ja) | 2011-06-24 | 2011-06-24 | 動画像符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013009195A true JP2013009195A (ja) | 2013-01-10 |
Family
ID=47676183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011141008A Withdrawn JP2013009195A (ja) | 2011-06-24 | 2011-06-24 | 動画像符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013009195A (ja) |
-
2011
- 2011-06-24 JP JP2011141008A patent/JP2013009195A/ja not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI759389B (zh) | 用於視訊寫碼之低複雜度符號預測 | |
JP6193446B2 (ja) | ビデオコード化における係数の走査 | |
JP6231109B2 (ja) | コンテキスト適応型、マルチレベル有意性コーディングに関するコンテキスト導出 | |
TWI657692B (zh) | 於視訊寫碼程序中用於係數層級寫碼之萊斯(rice)參數初始化 | |
JP5902307B2 (ja) | イントラモードビデオコーディング | |
JP5823623B2 (ja) | ビデオコーディングのための動きベクトル予測子候補クリッピング削除 | |
TWI520619B (zh) | 用於在視訊寫碼中之參考索引寫碼的旁路位元子 | |
JP5937206B2 (ja) | ビデオデータをコンテキスト適応型コーディングすること | |
US9736489B2 (en) | Motion vector determination for video coding | |
JP5869108B2 (ja) | メモリ効率的コンテキストモデリング | |
JP6162150B2 (ja) | ビデオコーディング用の残差4分木(rqt)コーディング | |
JP6081499B2 (ja) | 変換係数コーディングのためのコンテキスト導出における走査ベーススライディングウィンドウ | |
JP5886308B2 (ja) | ビデオコーディングにおける並列コンテキスト計算 | |
JP5746363B2 (ja) | ビデオコーディングにおいてブロックの走査順序に基づいてビデオブロック内の最後有効係数の位置をコーディングすること | |
JP5852133B2 (ja) | ビデオコーディングにおいてビデオブロックについての走査順序情報を効率的にコーディングするために最確走査順序を使用すること | |
TWI827606B (zh) | 網格寫碼之量化係數寫碼 | |
JP2017519447A (ja) | ビデオコーディングのためのイントラブロックコピーブロックベクトルシグナリング | |
JP2018530246A (ja) | ビデオコーディングのために位置依存の予測組合せを使用する改善されたビデオイントラ予測 | |
TWI558179B (zh) | 對視訊寫碼發信長期參考圖像 | |
TW201937926A (zh) | 在視訊寫碼中用於適應性算術寫碼之機率初始化及發信號 | |
JP2017513342A (ja) | ゼロアウトされた係数を使用した低複雑な順変換のためのシステムおよび方法 | |
US9420285B2 (en) | Inter-layer mode derivation for prediction in scalable video coding | |
JP2015510358A (ja) | Bスライス中の予測単位の単方向インター予測への制限 | |
JP2015516761A (ja) | レートひずみ最適量子化におけるレベル決定 | |
TW201921938A (zh) | 具有在用於視訊寫碼之隨機存取組態中之未來參考訊框之可調適圖像群組結構 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140902 |