JP2012050067A - 動画像の予測符号化装置及びその制御方法、コンピュータプログラム - Google Patents

動画像の予測符号化装置及びその制御方法、コンピュータプログラム Download PDF

Info

Publication number
JP2012050067A
JP2012050067A JP2011141221A JP2011141221A JP2012050067A JP 2012050067 A JP2012050067 A JP 2012050067A JP 2011141221 A JP2011141221 A JP 2011141221A JP 2011141221 A JP2011141221 A JP 2011141221A JP 2012050067 A JP2012050067 A JP 2012050067A
Authority
JP
Japan
Prior art keywords
data
amount
unit
encoding
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011141221A
Other languages
English (en)
Other versions
JP5706771B2 (ja
Inventor
Shigeki Mochizuki
成記 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011141221A priority Critical patent/JP5706771B2/ja
Priority to US13/179,616 priority patent/US9113174B2/en
Priority to CN201110216359.9A priority patent/CN102348119B/zh
Publication of JP2012050067A publication Critical patent/JP2012050067A/ja
Application granted granted Critical
Publication of JP5706771B2 publication Critical patent/JP5706771B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化時に画質を低下させず、かつ、復号化装置側で算術復号化前に最適な2値化メモリ領域を配置して冗長なメモリ領域を不要とし、2値化メモリ領域のオーバーフローによる復号化処理の破綻を未然に防止可能な技術を提供する。
【解決手段】動画像を構成する各ピクチャを予測符号化する予測符号化装置であって、符号化対象画像に対して所定のブロック単位毎に予測処理を行う予測処理手段と、前記予測処理手段における予測処理の結果を直交変換し、量子化して多値データを生成する変換手段と、前記多値データを、2値化データに変換する2値化手段と、前記2値化データの量を検出する検出手段と、前記2値化データを算術符号化して符号化データを生成する符号化手段と、前記符号化データに、前記検出手段によって検出された2値化データの量を示す情報を多重化して符号化データストリームを生成する多重化処理手段とを備える。
【選択図】図1

Description

本発明は、動画像の予測符号化装置及びその制御方法、コンピュータプログラムに関する。
動画像の符号化方式の1つにMPEG−4 AVC:ISO/IEC 14496−10、別称H.264(以下、MPEG−4 AVCと称す。)があり、ディジタル・テレビ放送や映像記録メディアへ採用されている。MPEG−4 AVCでは、以下の2つのようなコンテキスト適応型のエントロピー符号化方式を採用することで、従来のエントロピー符号化方式に対して符号化効率を高めている。
・コンテキスト適応型可変長符号化(CAVLC:Context−based Adaptive Varibale Length Coding)
・コンテキスト適応型2値算術符号化(CABAC:Context−based Adaptive Binary Arithmetic Coding)
このうち、CABACでは、符号化対象データに対し2値化処理(バイナライゼーション)を行い、その2値化データ(bin)の発生確率をコンテキスト(現在の符号化対象や周囲の状況)に応じて演算する。そして、当該演算結果を符号化データとすることで算術符号化を行う。2値化処理で出力される2値化データ長は、符号化装置に入力される映像信号や符号化条件によって変動する。よって、特性上、膨大な2値化データが発生する可能性が認識されており、2値化データに対する算術符号化処理のリアルタイム性保証への懸念や、発生した2値化データを格納するメモリ領域が事前に確定できないといった問題がある。
これに対して、符号化時に2値化データ量を抑えるための方法が提案されている。特許文献1は、2値化処理によるバイナリデータのデータ量が本来の2値化処理により発生するバイナリデータ量より少なくなるように、直交変換後の値からオフセット値を減算し、量子化を行う方法を提案している。また、動きベクトル検出において最小の評価値が得られる動きベクトルで符号化した場合よりも、2値化データ量が小さくなる動きベクトルを選択する方法も提案している。
特開2007−020141号公報
しかしながら、提案方法では、以下の2つの点に起因して、本来の符号化条件に対して画質低下が懸念される。
1)本来適用したい符号化条件で符号化した直交変換後の変換係数値に対して加工を行う点
2)評価値が最小となる動きベクトルで符号化した場合より、2値化データ量が少なくなるような動きベクトルを適用する点
また復号処理を考えた場合、2値化データ量は算術復号処理後に得られる情報であるため、ワーストケースを想定して実際に発生する2値化データ量よりも大きい、冗長なメモリ領域を用意しなければならない状況が想定される。一方、ワーストケースを想定せずに限定的サイズのメモリ領域を構成した場合、メモリ領域がオーバーフローして復号化処理が破綻してしまうおそれがある。
よって、符号化時に画質を低下させず、かつ、復号化装置側で算術復号化前に最適な2値化メモリ領域を配置して冗長なメモリ領域を不要とし、2値化メモリ領域のオーバーフローによる復号化処理の破綻を未然に防止可能な技術が望まれる。
上記課題を解決するための本発明は、動画像を構成する各ピクチャを予測符号化する予測符号化装置であって、
符号化対象画像に対して所定のブロック単位毎に予測処理を行う予測処理手段と、
前記予測処理手段における予測処理の結果を直交変換し、量子化して多値データを生成する変換手段と、
前記多値データを、2値化データに変換する2値化手段と、
前記2値化データの量を検出する検出手段と、
前記2値化データを算術符号化して符号化データを生成する符号化手段と、
前記符号化データに、前記検出手段によって検出された2値化データの量を示す情報を多重化して符号化データストリームを生成する多重化処理手段と
を備える。
本発明では、符号化時に画質を低下させず、かつ、復号化装置側で算術復号化前に最適な2値化メモリ領域を配置して冗長なメモリ領域を不要とし、2値化メモリ領域のオーバーフローによる復号化処理の破綻を未然に防止可能な技術を提供できる。
本実施形態に係る予測符号化装置の構成例を示すブロック図。 NALユニット及びアクセス・ユニットの構成を示す図。 "bin_info SEI"のシンタクスを説明するための図。 "bin_info SEI"を多重化した符号化データの例を示す図。 "bin_info SEI"を利用した復号化処理例を示した図。 "bin_info SEI"復号化処理の他の例を示した図。 実施形態2に係る"bin_info SEI"の生成方法を示すフローチャート。 "bin_info SEI"を利用した復号化処理の更に他の例を示した図。 本実施形態に係る復号化装置の構成例を示すブロック図。
以下、図面を参照しながら本発明の実施の形態を説明する。
[実施形態1]
例えばMPEG−4 AVC(ISO/IEC 14496−10)方式によって、動画像を構成する各ピクチャを予測符号化する本発明の実施形態に係る予測符号化装置の構成及び処理の流れについて、図1のブロック図を参照しながら説明を行う。本実施形態に係る予測符号化装置100は、符号化対象画像を例えば8×8画素や16×16画素のブロックに分割した所定のブロック単位毎(例えばマクロブロック単位毎)に処理する。図1の予測符号化装置100において、各ブロックは専用ロジック回路やメモリを用いてハードウェア的に構成されてもよい。或いは、メモリに記憶されている処理プログラムをCPUが実行することにより、ソフトウェア的に構成されてもよい。
まず予測方法決定部101は、符号化対象画像内の各マクロブロックに対する予測方法を決定する処理部である。入力される符号化対象画像と、符号化済み画像を格納するメモリ103から読み出した符号化済み画像から、簡易的な画面内予測又は動き検出を含む画面間予測処理を行って符号化効率を示す評価値を算出する。そして、算出した符号化効率が最適となる予測方式を決定する。このとき、符号化対象マクロブロックがIスライスの場合は、予測画素ブロックサイズ及び予測モードを決定する。また、Pスライス又はBスライスの場合、画面内予測又は画面間予測のうち、符号化効率の高い方を選択する。画面内予測の場合、画面内予測画素ブロックサイズ及び画面内予測モード等の画面内予測符号化用パラメータを決定する。一方の画面間予測の場合、参照画像フレーム、マクロブロック分割パターン、動きベクトル等の画面間予測符号化用パラメータを決定する。
予測処理部102は、予測方法決定部101により指定された予測符号化用パラメータに応じて、メモリ103から読み出した符号化済み画像から予測画像を生成する。予測画像は局所復号化部105へ出力されると共に、符号化対象のマクロブロックと予測画像との差分となる予測残差信号を生成し、直交変換・量子化部104へ出力する。
直交変換・量子化部104は、指定された画素ブロック単位(8×8画素、4×4画素等のブロック単位)に整数精度離散コサイン変換及び、離散アダマール変換による直交変換処理を行う。離散アダマール変換は、16×16画素ブロック単位で画面内予測処理が行われた輝度信号又は、色差信号に対して各画素ブロックを整数精度離散コサイン変換した結果のDC(直流)成分に対してのみ行われる。直交変換された変換係数は、後述する符号量制御部106により、指定された量子化パラメータに応じた量子化ステップで量子化される。得られた量子化データは、エントロピー符号化部107へ出力される。
量子化データは同時に、局所復号化部105へ入力され、局所復号化部105で量子化データに対して逆量子化処理、逆直交変換処理(逆離散アダマール変換及び逆整数精度離散コサイン変換)を行う。そして、得られたデータに対して予測処理部102から入力される予測画像を加算して復号化処理を行う。こうして復号化されたデータは、メモリ103で保持する。メモリ103で保持された復号化データは、以降の画面内予測処理に利用される。更にデブロッキングフィルタ処理が施された復号化データをメモリ103へ保持する。メモリ103が保持したデブロッキングフィルタ処理後の復号化データは、以降の画面間予測処理で利用される。
エントロピー符号化部107は、入力データに対してスライス単位にCABAC(コンテキスト適応型2値算術符号化)によるエントロピー符号化処理を行う処理部である。エントロピー符号化部107において、2値化部107aは入力される多値データを2値化データへ変換する。2値化データ・メモリ107bは、2値化部107aが生成した2値化データを格納する。コンテキスト計算部107cは、2値化データの発生確率をコンテキストに応じて計算し、保持する。算術符号化部107dは、コンテキスト計算部107cにより供給される発生確率に応じて算術符号化を行う。なお、2値化データ量検出部107eは、2値化部107aが生成して、2値化データ・メモリ107bに格納された2値化データをカウントすることによって、スライス単位に発生した2値化データの量を検出する。
算術符号化部107dで符号化されたデータと、2値化データ量検出部107eで検出された2値化データの量を示す情報(2値化データ情報)は、ピクチャ単位毎に多重化処理部108へ供給される。なお2値化データ情報は、ピクチャのシーケンス先頭からの符号化順でのピクチャ・カウント数、参照画像であるかどうかを示す情報("ref_pic_flag")、及びピクチャを構成するスライス数とスライス単位での2値化データ量を示す情報で構成される。なお、参照画像であるかどうかとは、他の符号化対象画像を動き補償予測符号化する際に用いられたかどうか、を意味し、係る情報は、予測方法決定部101から得られる。
符号量制御部106は、符号化ピクチャバッファ(CPB)をオーバーフロー、又はアンダーフローさせないように符号化データの符号量を制御する処理部である。エントロピー符号化部107から供給されるエントロピー符号化後の発生符号量を元に量子化パラメータを生成し、直交変換・量子化部104へ供給する。
多重化処理部108は、生成した符号化ストリームを符号化データとして出力する。多重化処理部108において、システム情報生成部108aは符号化データに関するシステム情報を生成する。復号化補助情報生成部108bは、符号化データに対する付加情報となる復号化補助情報を生成する。ストリーム生成部108cは、生成されたシステム情報、復号化補助情報、及び、符号化データを所定の単位でパケット化し、符号化データストリームとして出力する。以上の処理部により予測符号化装置100が構成されている。
上記構成において、エントロピー符号化部107の2値化部107aが生成する2値化データは、エントロピー符号化過程で発生する中間的な符号化データであり、そのデータを格納するための2値化データ・メモリ107bを必要とする。一方、復号化装置側を考えた場合も同様に算術復号化後の中間的な符号化データとなる2値化データが発生するため、2値化データ・メモリが必要となる。
しかしながら、この中間的に発生する2値化データ量は、最終的な符号化データからは得ることができないため、復号化装置側では、符号化単位(スライス)の算術復号化が完了した時点で初めて2値化データの発生量を知ることになる。よって、算術復号化前に実際に発生する2値化データ量となる最適な2値化データ・メモリを確保することが極めて困難である。そのため、予めワーストケースを想定した2値化データ・メモリを確保しておく必要がある。
本実施形態では、復号化装置側で復号化前に2値化データ量を得られるようにするために、多重化処理部108は、エントロピー符号化部107から供給される2値化データに関する情報を復号化補助情報として符号化データに多重化する。
以下に復号化補助情報生成部(108b)で生成される復号化補助情報について説明を行う。まず、MPEG−4 AVCでは、様々なネットワークでの利用が考慮されているため、以下の2つの階層が規定されている。
・映像符号化処理を扱うビデオ符号化層(VCL:Video Coding Layer)
・実際の伝送・蓄積のシステムとの間にネットワーク抽象化層(NAL:Network Abstraction Layer)
このうちNALは、図2(A)に示すように、NALヘッダとRBSP(Row Byte Sequence Payload)から構成されるNALユニットと呼ばれる単位でパケット化される。NALヘッダは、NALユニットの種類(nal_unit_type)と参照画像かどうかを識別する(nal_ref_idc)のに用いられる。nal_ref_idcの値が"00"であれば参照画像ではなく、それ以外の場合、参照画像であることを示す。RBSPは、符号化データの実体を格納する。NALユニットの種類は、図2(B)に示す通りであり、識別番号(nal_unit_type)に基づいて識別され、以下のようなものが含まれる。
・映像符号化データ(スライス)
・映像符号化データのシーケンスに関する情報であるSPS(Sequence Parameter Set)
・映像符号化データのピクチャに関する情報であるPPS(Picture Parameter Set)
・映像符号化データの付加情報であるSEI(Supplemental Enhancement Information)
これらのNALユニットをピクチャ単位にまとめた単位をアクセス・ユニットと呼ぶ。図2(C)に示すようにアクセス・ユニットの先頭には、アクセス・ユニット内のピクチャタイプを識別可能な情報を含むAUD(アクセス・ユニット・デリミター、Access unit delimiter)と呼ばれるNALユニットが位置する。それに続いて、SPS、PPS、スライスデータなどのピクチャに必要なNALユニット群で構成される。上記のNALユニットのうち、SPS、PPSは、システム情報生成部108a、SEIは、復号化補助情報生成部108bで生成される。アクセス・ユニットの構成は、ストリーム生成部108cで行われる。
ここで、多重化処理部108は、まずエントロピー符号化部107からピクチャ単位に入力される2値化データ情報から、復号化補助情報をSEIとして生成する。SEIには、ユーザー定義のシンタクスを使用可能な"user data SEI"が用意されている。"user data SEI"には更に、"user data unregistered SEI"と"user registered by ITU-T Recomendation T.35 SEI"の2種類が定義されている。ここでは"user data unregistered SEI"を利用して復号化補助情報を多重化するものとし、図3(A)に"user data unregistered SEI"のシンタクスを示す。
図3(A)におけるシンタクス要素のうち、"user_data_payload_byte"領域に2値化データ情報を格納することが可能である。また、"user data unregistered SEI"に2値化データ情報が格納されていることを、"uuid_iso_iec_11578"領域によりUUIDで識別できるようにしておく。"user_data_payload_byte"領域に格納するための2値化データ情報を"bin_info"、そのSEIを"bin_info SEI"と呼ぶものとし、そのシンタクスの定義を図3(B)に示す。
pic_posは、"bin_info"に対応するピクチャ位置を示す情報であり、シーケンス先頭からの符号化順(復号化装置側では復号化順、即ちデコーディング・オーダ)でのピクチャ・カウント数が格納される。num_sliceは、ピクチャを構成するスライス数を示す。続いてnum_sliceで示されるスライス数に対応するスライス毎の2値化データ量(キロビット)がbin_sizeとして格納される。なお、2値化データ量は、ピクチャ単位のデータ量として格納されていてもよい。
以上のシンタクスに従って、復号化補助情報生成部108bは、エントロピー符号化部107から入力される2値化データ情報を元に上記の"bin_info SEI"を生成し、ストリーム生成部108cにてアクセス・ユニットに多重化される。
上記のように"bin_info SEI"を多重化した1ピクチャ4スライスで符号化した符号化データの例を図4(A)及び図4(B)に示す。図4(A)は、ピクチャ単位に"bin_info SEI"を多重化した例であり、代表してI0及びB6の各ピクチャに付加されたSEIの内容を示している。ピクチャI0は、符号化順で先頭となるため、pic_pos=0であり、1ピクチャ4スライスで符号化されているため、num_slice=4となる。続いてピクチャに含まれている各スライスの2値化データ量がbin_size[0]からbin_size[3]まで、4スライス分格納されている。
ピクチャB6は、符号化順で11ピクチャ目となるため、pic_pos=10であり、ピクチャI0と同様に4スライスで符号化されているため、num_slice=4となる。また、スライス毎の2値化データ量が、bin_size[0]からbin_size[3]まで4スライス分格納されている。図4(A)は、アクセス・ユニット毎に"bin_info SEI"を多重化している例を示しているが、図4(B)に示すように符号化データストリームの先頭の所定ピクチャのアクセス・ユニットに、その符号化データストリームの各ピクチャのSEIをまとめて多重化するようにしても良い。例えば、符号化データストリームの先頭のIピクチャのアクセス・ユニットに複数ピクチャ(例えば、1GOP分、1動画ファイル分)の"bin_info SEI"を纏めて多重化しても良い。このように多重化することで、復号化装置側で先行して複数ピクチャ分の"bin_info SEI"を取得することが容易になる。
以上のように多重化した"bin_info SEI"は、復号化装置側で以下に示すような場合に有効となる。
共有メモリ内に2値化データ・メモリ領域を動的に配置可能な機構を持つ復号化装置を考えた場合、MPEG−4 AVC規格で規定された上限となる2値化データ発生量を考慮して2値化データ・メモリ領域を配置することが想定される。しかしながら2値化データ量が規格で規定された上限近くまで発生する頻度は低く、多くの場合は、復号化処理に対して冗長なメモリ領域を2値化データ・メモリ領域に割り当てていると考えられる。例えば、符号化データにおける各ピクチャの2値化データ量が図5(A)に示すグラフのように遷移していたとし、復号化装置側では、グラフの破線で示すメモリサイズの領域を配置していたとする。この場合、復号化装置側では復号化の過程でグラフの斜線で示される領域501は未使用な冗長なメモリ領域となる。そこで、"bin_info SEI"を利用することによりグラフに示す2値化データ量の遷移も把握できるため、図5(B)に示すように各ピクチャに対応した最適な2値化メモリ領域を配置することが可能となる。結果として、冗長なメモリ領域を配置することなく空き領域を有効活用することが可能となる。
また、符号化データにおける各ピクチャの2値化データが図6(A)に示すグラフのように遷移していたとし、復号化装置側では、グラフの破線601で示すように規格で規定された上限を格納できないようなサイズのメモリ領域を配置していたとする。この場合、13枚目のピクチャで膨大な2値化データが発生し、算術復号化を実行中に2値化メモリ領域のオーバーフローさせる可能性がある。このような場合でも、"bin_info SEI"により得られた値から、図6(B)に示すように13枚目のピクチャの2値化データ量を格納可能なメモリ領域を事前に割り当てることができる。結果として、2値化データ・メモリ領域のオーバーフローを未然に防ぐことが可能となる。
もちろん図5(B)に示す例のようにピクチャ単位に最適値でメモリ領域を配置しても良い。また、仮にメモリ領域が拡張して配置できない場合には、13枚目のピクチャの復号化を事前にキャンセルし、他のピクチャへ置き換えるなどのエラー補間処理を実行してもよい。これにより、未然に2値化メモリ・オーバーフローを回避することにより復号化処理のリアルタイム性を保証することが容易になる。
一方、2値化データ量はメモリ領域だけでなく算術復号化処理性能への影響も考えられる。一般にCABACにおける算術復号化は、最低でも2値化データの1binを処理するのにクロックの1サイクルを必要とすることが知られている。このためCABAC復号化処理の性能は、算術復号化処理部を駆動するクロック周波数に依存する。
例えば、算術復号化処理部の駆動クロック周波数を動的に可変可能な復号化装置を考えた場合、通常は規格の上限となる2値化データ量の復号化を所定時間内に処理可能なクロック周波数で駆動させる必要が生じる。そこで、本発明による復号化補助情報を用いて復号化を行うことで、算術復号化を開始する前に2値化データ発生量を得ることができるため、算術復号化処理に必要な性能を予め算出することが可能となる。結果として、符号化データ毎に最適なクロック周波数で算術復号化処理部を駆動すれば良く、消費電力を抑えることが期待できる。
また、算術復号化処理部の駆動クロック周波数が固定である復号化装置を考えると、膨大な2値化データが発生する符号化データに対しては、算術復号化処理性能を満たすことが困難な場合がある。その場合、算術復号化処理性能を超える2値化データが発生した時点で何らかのリカバリー処理が実行されるよう設計されることが想定される。しかしながら、この場合も同様に処理性能を超えたかどうかは算術復号化後に得られるため、算術復号化処理に要した時間をロスし、復号化処理のリアルタイム性を保証することが困難になる可能性が高い。このような場合でも、本発明による復号化補助情報を用れば、算術復号化を開始する前に2値化データ発生量を得ることができる。よって、算術復号化を開始する前に、算術復号化処理負荷の高いピクチャをスキップするなどの対応が可能となり、復号化処理のリアルタイム性を保証することが容易となる。
図9に上述した予測符号化装置100で生成された符号化データを復号化可能な、本実施形態に係わる復号化装置900のブロック図を示す。図9において、CPU901は、復号化処理に必要とされる画像データ格納用バッファ及び符号化データ格納用バッファ等のワークメモリ領域をメモリ906上へ配置し、復号化装置900を構成する後述の各処理部を制御する。
クロック生成部902は、復号化装置を構成する各処理部を駆動するためのクロック信号を生成し、各処理部へ供給する。尚、クロック生成部902で生成するクロック信号のクロック周波数は、CPU901によりプログラマブルに制御可能となっている。
符号化データ入力部903は、入力された符号化データストリームに対してスタート・コード(0x000001)によりNALユニットの先頭を検出し、NALユニットの種別を判定する。NALユニットは、入力された符号化データのシーケンスに関する情報であるSPS(Sequence Parameter Set)、符号化データのピクチャに関する情報であるPPS(Picture Parameter Set)、符号化データの付加情報であるSEI(Supplemental Enhancement Information)、そして映像符号化データ(スライス)等が含まれる。種別を判定したNALユニットの内、SPS,PPS,SEI及びスライスヘッダからビットストリーム情報(以下、SPS,PPS,SEI及びスライスヘッダを合わせてビットストリーム情報と呼ぶ)をCPU901へ通知し、スライスデータをエントロピー復号化処理部904へ送信する。
エントロピー復号化処理部904は、CPU901から設定されたビットストリーム情報に基づき、エントロピー復号化を行い中間データとなる2値化データをメモリ906へ書き込む。メモリI/F部905は、各処理部からのメモリ・アクセス要求を調停し、メモリ906に対する読み出し・書き込み制御を行う。メモリ906は、エントロピー復号化処理部904により復号化された2値化データと予測復号化処理部907により復元された画像データを格納するメモリであり、メモリI/F部905を介して各処理部により共有して使用される。
予測復号化処理部907は、16×16画素ブロックから成るマクロブロック単位に予測復号化処理を行う処理部である。予測復号化処理部907は、2値化データを復号化する2値化データ復号化処理部と、画面内予測又は画面間予測による予測画像を生成する予測画像生成部と、逆量子化・逆直交変換により残差信号を復元する逆変換処理部と、予測画像と残差信号を加算して画像データを復元する画像復号化処理部と、復号化された画像データへデブロッキングフィルタ処理を行うデブロッキングフィルタ処理部から構成されている。
予測復号化処理部907は、まず始めに、CPU901から設定されたビットストリーム情報に基づき、メモリ906から2値化データを読み出す。そして、予測復号化に必要な画面内予測画像又は画面間予測画像の生成に必要な予測モード及び動きベクトル情報等を復元し、メモリ906から読み出した参照画像を元に予測画像を生成する。続いて、逆量子化・逆直交変換処理により残差信号を復元し、予測画像と残差信号を加算して画像データを復元する。復元された画像データに必要に応じてデブロッキングフィルタ処理を施した画像データをメモリ906へ書き込む。
映像データ出力部908は、予測復号化処理部907により復元された画像データをCPU901から指定された表示順でメモリ906から読み出し、垂直・水平同期信号を付加して映像信号として出力する。
以上のように構成される復号化装置900に対して、予測符号化装置100により生成した符号化データを入力した場合でも、CPU901では、2値化データ情報を含むSEI、即ち"bin_info SEI"を取得することで、2値化データの発生量を得ることが可能である。よって、前述したように映像復号化処理を実行する前に最適な2値化データ用バッファ領域をメモリ906へ配置することも、クロック生成部902に対して最適な周波数のクロック信号を生成することも可能である。
[実施形態2]
実施形態2の予測符号化装置は、実施形態1で示した予測符号化装置100と構成は同様であるので図1を流用するものとし、差分となる復号化補助情報生成部108bにおける復号化補助情報の生成方法について説明する。
実施形態1では、ピクチャ毎に"bin_info SEI"を多重化する場合の例を示した。しかしながら、復号化装置側で想定している2値化メモリ領域よりも実際に発生する2値化データ量が少ない場合には、"bin_info SEI"は不要であると考えられる。また、一般に非参照画像よりも参照画像に対してより多くの符号量が割り当てられるため、参照画像でより多くの2値化データが発生する可能性が高く、非参照画像では、2値化データ量が少ないと考えられる。
このことから、2値化データ量が所定閾値以上の場合、及び、符号化対象ピクチャが参照画像である場合の少なくともいずれかの場合に"bin_info SEI"を生成し多重化することが符号量の観点からも効率的である。そこで、2値化データ量に対する閾値を予め"bin_thr"として設定しておく。その上で、エントロピー符号化部107から多重化処理部108へ入力される2値化データ情報について、符号化対象画像が参照画像であるかどうかを示す情報が"ref_pic_flag"で示される。また、2値化データ量を示す情報を"bin_cur"として、2値化データ量が所定閾値以上の場合で、かつ、符号化対象ピクチャが参照画像である場合に"bin_info SEI"を生成する。
以下、本実施形態における"bin_info SEI"の生成方法を図7のフローチャートを参照して説明する。当該フローチャートに対応する処理は、例えば、多重化処理部108として機能するCPUが対応するプログラム(ROM等に格納)を実行することにより実現できる。
まず、エントロピー符号化部107から多重化処理部108へ2値化データ情報が入力されると、S701において復号化補助情報生成部108bは、"ref_pic_flag"の値から符号化対象画像が参照画像であるかどうかを判定する。もし、"ref_pic_flag"の値が1であり、符号化対象画像が参照画像である場合(S701で「YES」)、S702に移行する。S702では、復号化補助情報生成部108bが閾値"bin_thr"と入力2値化データ量"bin_cur"とを比較する。もし"bin_cur"が"bin_thr"以上の場合(S702で「YES」)、S703で復号化補助情報生成部108bが入力2値化データ情報から"bin_info SEI"を生成する。また、ストリーム生成部108cは、当該"bin_info SEI"をアクセス・ユニットに多重化する。一方、符号化対象画像が参照画像でない場合(S701で「NO」)や、"bin_cur"が"bin_thr"より小さい場合(S702で「NO」)、復号化補助情報生成部108bは復号化補助情報を生成しない。
なお、上記では入力2値化データ量を符号化対象画像1ピクチャ分のデータ量として考えるが、スライス毎に比較を行ってもよい。その場合、いずれかのスライスのデータ量が閾値を超えた場合に復号化補助情報生成部108bが復号化補助情報を生成する。
このように本実施形態では、復号化補助情報生成部108bが、符号化対象画像が参照画像であるかどうかの判定と、2値化データ量の判定とを行う。よって、参照画像で、かつ、2値化データ量が閾値以上の符号化対象画像についてのみ"bin_info SEI"が生成される。これにより、冗長な"bin_info SEI"によるデータ量の増大を回避可能となる。なお、本実施形態では、符号化対象画像が参照画像であり、かつ、2値化データ量が閾値以上の場合を生成条件としたが、どちらか一方を満たせば"bin_info SEI"生成してもよい。
また、本実施形態によれば、復号化装置側でも、多重化されている"bin_info SEI"がクリティカルな2値化データ量が発生するものとして判断し、復号化処理を行うことが可能となる。例えば、符号化データにおける各ピクチャの2値化データ量が図8(A)に示すグラフのように遷移していたとする。斜線で示されたピクチャは参照画像であり、グラフの破線が2値化データ量に対して設定された閾値"bin_thr"とする。この場合、図7のフローチャートで示した方法により、参照画像且つ、"bin_thr"以上の2値化データが発生しているI0、P0及びP3ピクチャに対して"bin_info SEI"が多重化される。復号化装置側では、図8(B)に示すようにI0、P0及びP3で受信した"bin_info SEI"に従ってメモリを配置することで容易に2値化データ領域を破綻させることなく復号化を行うことが可能となる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (7)

  1. 動画像を構成する各ピクチャを予測符号化する予測符号化装置であって、
    符号化対象画像に対して所定のブロック単位毎に予測処理を行う予測処理手段と、
    前記予測処理手段における予測処理の結果を直交変換し、量子化して多値データを生成する変換手段と、
    前記多値データを、2値化データに変換する2値化手段と、
    前記2値化データの量を検出する検出手段と、
    前記2値化データを算術符号化して符号化データを生成する符号化手段と、
    前記符号化データに、前記検出手段によって検出された2値化データの量を示す情報を多重化して符号化データストリームを生成する多重化処理手段と
    を備えることを特徴とする予測符号化装置。
  2. 前記2値化データの量は、前記符号化対象画像を構成するスライス毎のデータ量であることを特徴とする請求項1に記載の予測符号化装置。
  3. 前記多重化処理手段は、前記2値化データの量を、閾値と比較して前記2値化データの量が前記閾値よりも大きい場合に、当該2値化データの量を示す情報を多重化することを特徴とする請求項1又は2に記載の予測符号化装置。
  4. 前記多重化処理手段は、前記符号化対象画像が、前記予測処理手段により他の符号化対象画像の予測処理において参照画像として用いられた場合に、前記符号化対象画像についての前記2値化データの量を示す情報を多重化することを特徴とする請求項1乃至3のいずれか1項に記載の予測符号化装置。
  5. 前記多重化処理手段は、前記2値化データの量を示す情報を、複数ピクチャ分まとめて、符号化データストリームの先頭の所定ピクチャのアクセス・ユニットに多重化することを特徴とする請求項1乃至4のいずれか1項に記載の予測符号化装置。
  6. 動画像を構成する各ピクチャを予測符号化する予測符号化装置の制御方法であって、
    予測処理手段が、符号化対象画像に対して所定のブロック単位毎に予測処理を行う予測処理工程と、
    前記予測処理工程における予測処理の結果を、変換手段が直交変換し、量子化して多値データを生成する変換工程と、
    2値化手段が、前記多値データを2値化データに変換する2値化工程と、
    検出手段が、前記2値化データの量を検出する検出工程と、
    符号化手段が、前記2値化データを算術符号化して符号化データを生成する符号化工程と、
    多重化処理手段が、前記符号化データに、前記検出工程において検出された2値化データの量を示す情報を多重化して符号化データストリームを生成する多重化処理工程と
    を備えることを特徴とする予測符号化装置の制御方法。
  7. コンピュータを請求項1乃至5のいずれか1項に記載の予測符号化装置の各手段として機能させることを特徴とするプログラム。
JP2011141221A 2010-07-30 2011-06-24 動画像の予測符号化装置及びその制御方法、コンピュータプログラム Expired - Fee Related JP5706771B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011141221A JP5706771B2 (ja) 2010-07-30 2011-06-24 動画像の予測符号化装置及びその制御方法、コンピュータプログラム
US13/179,616 US9113174B2 (en) 2010-07-30 2011-07-11 Predictive coding apparatus, control method thereof, and computer program
CN201110216359.9A CN102348119B (zh) 2010-07-30 2011-07-28 预测编码装置及其控制方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010172727 2010-07-30
JP2010172727 2010-07-30
JP2011141221A JP5706771B2 (ja) 2010-07-30 2011-06-24 動画像の予測符号化装置及びその制御方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2012050067A true JP2012050067A (ja) 2012-03-08
JP5706771B2 JP5706771B2 (ja) 2015-04-22

Family

ID=45526690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011141221A Expired - Fee Related JP5706771B2 (ja) 2010-07-30 2011-06-24 動画像の予測符号化装置及びその制御方法、コンピュータプログラム

Country Status (3)

Country Link
US (1) US9113174B2 (ja)
JP (1) JP5706771B2 (ja)
CN (1) CN102348119B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014007469A (ja) * 2012-06-21 2014-01-16 Canon Inc 画像符号化装置及び画像符号化方法
WO2017169722A1 (ja) * 2016-03-28 2017-10-05 ソニー株式会社 画像処理装置および方法
JP2018078633A (ja) * 2018-01-04 2018-05-17 株式会社Nttドコモ 動画像予測符号化方法及び動画像予測復号方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9083976B2 (en) * 2008-09-05 2015-07-14 Freescale Semiconductor, Inc. Processing a video stream in real time based on binary information of the video stream
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
DE102015100727A1 (de) 2015-01-20 2016-07-21 Leica Mikrosysteme Gmbh Probentransfereinrichtung
CN110446047A (zh) * 2019-08-16 2019-11-12 苏州浪潮智能科技有限公司 视频码流的解码方法及装置
CA3163402A1 (en) * 2019-11-27 2021-06-03 Lg Electronics Inc. Method and device for signaling slice-related information
JP7375198B2 (ja) * 2019-11-27 2023-11-07 エルジー エレクトロニクス インコーポレイティド ピクチャ分割情報をシグナリングする方法及び装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007020141A (ja) * 2005-06-08 2007-01-25 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2007116436A (ja) * 2005-10-20 2007-05-10 Matsushita Electric Ind Co Ltd 符号化装置及び復号化装置
JP2008022383A (ja) * 2006-07-13 2008-01-31 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2009055384A (ja) * 2007-08-28 2009-03-12 Sony Corp 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
US20090079602A1 (en) * 2007-09-19 2009-03-26 Vivienne Sze N-BIN Arithmetic Coding for Context Adaptive Binary Arithmetic Coding
JP2009111625A (ja) * 2007-10-29 2009-05-21 Panasonic Corp 映像符号化装置及び映像符号化方法
JP2009171188A (ja) * 2008-01-16 2009-07-30 Nec Corp エントロピ符号化器、映像符号化装置、映像符号化方法および映像符号化プログラム
JP2009272712A (ja) * 2008-04-30 2009-11-19 Canon Inc 画像符号化装置及び画像符号化方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
US6141053A (en) 1997-01-03 2000-10-31 Saukkonen; Jukka I. Method of optimizing bandwidth for transmitting compressed video data streams
US7646816B2 (en) 2001-09-19 2010-01-12 Microsoft Corporation Generalized reference decoder for image or video processing
US7228001B2 (en) 2001-11-16 2007-06-05 Ntt Docomo, Inc. Image encoding method, image decoding method, image encoder, image decode, program, computer data signal, and image transmission system
JP3764458B2 (ja) 2001-11-16 2006-04-05 株式会社エヌ・ティ・ティ・ドコモ 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム
EP2222083A2 (en) 2001-11-16 2010-08-25 NTT DoCoMo, Inc. Image coding and decoding method
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
US7894597B2 (en) * 2005-10-12 2011-02-22 Cisco Technology, Inc. Categorization of telephone calls
US20070171977A1 (en) 2006-01-25 2007-07-26 Shintaro Kudo Moving picture coding method and moving picture coding device
JP4555257B2 (ja) 2006-06-06 2010-09-29 パナソニック株式会社 画像符号化装置
US8699583B2 (en) * 2006-07-11 2014-04-15 Nokia Corporation Scalable video coding and decoding
WO2008125900A1 (en) * 2007-04-13 2008-10-23 Nokia Corporation A video coder

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007020141A (ja) * 2005-06-08 2007-01-25 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2007116436A (ja) * 2005-10-20 2007-05-10 Matsushita Electric Ind Co Ltd 符号化装置及び復号化装置
JP2008022383A (ja) * 2006-07-13 2008-01-31 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2009055384A (ja) * 2007-08-28 2009-03-12 Sony Corp 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
US20090079602A1 (en) * 2007-09-19 2009-03-26 Vivienne Sze N-BIN Arithmetic Coding for Context Adaptive Binary Arithmetic Coding
JP2009111625A (ja) * 2007-10-29 2009-05-21 Panasonic Corp 映像符号化装置及び映像符号化方法
JP2009171188A (ja) * 2008-01-16 2009-07-30 Nec Corp エントロピ符号化器、映像符号化装置、映像符号化方法および映像符号化プログラム
JP2009272712A (ja) * 2008-04-30 2009-11-19 Canon Inc 画像符号化装置及び画像符号化方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014007469A (ja) * 2012-06-21 2014-01-16 Canon Inc 画像符号化装置及び画像符号化方法
WO2017169722A1 (ja) * 2016-03-28 2017-10-05 ソニー株式会社 画像処理装置および方法
US10630989B2 (en) 2016-03-28 2020-04-21 Sony Corporation Image processing apparatus and image processing method
JP2018078633A (ja) * 2018-01-04 2018-05-17 株式会社Nttドコモ 動画像予測符号化方法及び動画像予測復号方法

Also Published As

Publication number Publication date
US9113174B2 (en) 2015-08-18
CN102348119B (zh) 2016-06-08
CN102348119A (zh) 2012-02-08
US20120027086A1 (en) 2012-02-02
JP5706771B2 (ja) 2015-04-22

Similar Documents

Publication Publication Date Title
JP5706771B2 (ja) 動画像の予測符号化装置及びその制御方法、コンピュータプログラム
US10911758B2 (en) Multi-level significance maps for encoding and decoding
US9467713B2 (en) Apparatus for decoding a moving picture
US9609349B2 (en) Apparatus for decoding a moving picture
EP2756675B1 (en) Deriving reference mode values and encoding and decoding information representing prediction modes
EP2618572B1 (en) Multiple sign bit hiding within a transform unit
EP2637409B1 (en) Motion vector sign bit hiding
US11330297B2 (en) Methods incorporating extensions to copy-above mode for palette mode coding
TW201603562A (zh) 決定在視訊寫碼中之調色板寫碼區塊的調色板大小、調色板單元及過濾
WO2013096671A1 (en) Method and apparatus for efficient transform unit encoding
CN109644273B (zh) 用于视频编码的设备和方法
WO2015051459A1 (en) Sign coding for blocks with transform skipped
US20130022108A1 (en) Quantization parameter derivation from qp predictor
CN114223206A (zh) 采用不同分割结构的调色板模式
US9473789B2 (en) Apparatus for decoding a moving picture
US10097844B2 (en) Data encoding and decoding
EP3056000A1 (en) Sign coding for blocks with transform skipped
GB2501125A (en) Providing adaptation parameters to a decoder by including an identifier to a relevant characteristic set in a bit stream portion.
EP3499892B1 (en) Multi-level significance maps for encoding and decoding
CN114424545A (zh) 用于调色板模式的量化参数推导
JP5197428B2 (ja) 画像符号化装置及び画像符号化方法
JP4708821B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム及び記憶媒体
GB2585067A (en) Image data encoding and decoding
JP5147546B2 (ja) 映像符号化装置及び映像復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150227

R151 Written notification of patent or utility model registration

Ref document number: 5706771

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees