JP2014103429A - 動画像符号化装置および動画像符号化方法 - Google Patents

動画像符号化装置および動画像符号化方法 Download PDF

Info

Publication number
JP2014103429A
JP2014103429A JP2011053080A JP2011053080A JP2014103429A JP 2014103429 A JP2014103429 A JP 2014103429A JP 2011053080 A JP2011053080 A JP 2011053080A JP 2011053080 A JP2011053080 A JP 2011053080A JP 2014103429 A JP2014103429 A JP 2014103429A
Authority
JP
Japan
Prior art keywords
code string
image
coefficient
residual
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011053080A
Other languages
English (en)
Inventor
Seishi Abe
清史 安倍
Kazuhito Kimura
一仁 木村
Hideyuki Okose
秀之 大古瀬
Hiroshi Arakawa
博 荒川
Koji Arimura
耕治 有村
Tatsuro Shigesato
達郎 重里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2011053080A priority Critical patent/JP2014103429A/ja
Priority to PCT/JP2012/001671 priority patent/WO2012120910A1/ja
Publication of JP2014103429A publication Critical patent/JP2014103429A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】パイプライン構造を持つ動画像符号化装置において、発生符号量を制限値以下に納めるためにパイプラインを遡る処理を単純化することを可能し、また対応する動画像復号化装置において、パイプラインの処理遅延の発生を回避することを可能とする。
【解決手段】本発明に係る動画像符号化装置100は、2値化符号化部107において生成される中間符号列の符号量が特定の符号量以下になるように、通常符号化によって生成された残差係数情報を可変長符号化する機能と、入力画像を可変長符号化せずにそのまま符号列に記述する機能とを切替えて処理することを可能とする。
【選択図】図1

Description

本発明は、入力された動画像をブロックに分割して符号化する画像符号化装置、および前記符号化された符号列を復号化する画像復号化装置に関するものである。
近年、マルチメディアアプリケーションの発展に伴い、画像、音声及びテキストなど、あらゆるメディアの情報を統一的に扱うことが一般的になってきた。また、ディジタル化された画像は膨大なデータ量を持つため、蓄積及び伝送のためには、画像の情報圧縮技術が不可欠である。一方で、圧縮した画像データを相互運用するためには、圧縮技術の標準化も重要である。例えば、画像圧縮技術の標準規格としては、ITU−T(国際電気通信連合 電気通信標準化部門)のH.261、H.263、H.264、ISO/IEC(国際標準化機構)のMPEG−1、MPEG−3、MPEG−4、MPEG−4AVCなどがある。また、現在は、ITU−TとISO/IECとの共同によるHEVCと呼ばれる次世代画面符号化方式の標準化活動が進んでいる。
このような動画像の符号化では、符号化対象の各ピクチャを符号化単位ブロックに分割し、ブロック毎に時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象のブロックとの差分画像を取得する。また空間的な冗長性の削減を目的とする画面内予測符号化では、周辺の符号化済みブロックの画素情報をから予測画像の生成を行い、得られた予測画像と符号化対象のブロックとの差分画像を取得する。さらに得られた差分画像に対して離散コサイン変換等の直交変換および量子化を行い、可変長符号化を用いて符号列を生成することで情報量が圧縮される。このとき、可変長符号化のみで符号列を生成するCAVLCと呼ばれるモードと、まず可変長符号化によって中間符号列を生成し(2値化)、さらに前記中間符号列に対して算術符号化を行うことで符号列を生成するCABACと呼ばれるモードとがある。
また復号化では、前記符号化処理によって生成された符号列を解析して予測情報および残差係数情報を取得し、予測情報を用いて画面間予測復号化および画面内予測復号化を行って予測画像を生成し、残差係数情報に対して逆量子化および逆直交変換を行って差分画像を生成し、得られた予測画像と差分画像を加算することで最終的な出力画像を復元する。
H.264(非特許文献1)では、ブロック単位の処理量の上限を制約するために、ブロック単位の発生符号量の最大値が定義されている(具体的には3200ビット)。前述の通常の符号化処理を行うと、入力画像の性質や量子化処理の条件によって前記発生符号量の最大値を超過した符号列を生成してしまう可能性があるため、IPCMと呼ばれる特別な符号化モードを使用することによって常に最大値内に納めることを可能としている。
IPCMは通常の符号化モードとは異なり、画面内・画面間予測による差分画像の生成や直交変換・量子化を行うことなく、入力画像の画素値をそのままのビット列として符号列に記述するモードである。このモードを使用すると、例えば入力画像のフォーマットが各画素8ビットのYUV4:2:0であった場合、輝度成分のブロックが16×16画素、2つの色差成分のブロックがそれぞれ8×8画素であるため、合計で384バイトとなり、ヘッダに必要な情報を含めても前記最大値の3200ビット以下に必ず納めることが可能となる。
ITU-T H.264 : Advanced video coding for generic audiovisual services (03/2010)
多くの動画像符号化・復号化装置はLSIと呼ばれる集積回路によって符号化・復号化処理を実現している。このような符号化・復号化装置では処理高速化のためにパイプラインと呼ばれる並列動作を可能とする構成を取っている。具体的には1つのブロックの処理が完了する前に次のブロックの処理を開始することで同時に処理が進行する。
図3(a)にCABACを用いた符号化におけるパイプラインの例を示す。ブロック1に対して、画素読込み、モード判定、画面間/内予測、変換/量子化、2値化符号化、の各処理が順に適用され、ブロック2に対しても同様の処理が適用されている。このとき、ブロック2はブロック1の画素読込みが完了した時点で直ぐに処理を開始することで、処理タイミングを1ステップずつ遅らせながら並行して処理を行う。また、算術符号化は前記パイプラインとは別の独立したタイミングで処理が行われる。H.264やHEVCの符号化・復号化処理では過去に符号化・復号化したブロックの情報を参照しながら処理が行われるため、図にあるようにブロック1で確定した予測情報、画素情報、符号化情報等をブロック2が参照しながら処理を行う必要がある。
しかし、前述のブロック単位の発生符号量が最大値以下に納められているかどうかは、算術符号化が完了した時点での符号量を調べないと判断できないため、もし最大値を超過すると判定された場合はその時点でIPCMに切替えて符号列を生成し直さなくてはならない。
図3(b)にIPCMへの切替えが発生した場合のパイプラインの例を示す。ブロック1の算術符号化処理においてIPCMへ切替えることが確定しているが、既にブロック2はブロック1が通常の符号化を行った場合の予測情報、画素情報等を参照しながら符号化処理が進行してしまっているため、ブロック1のモード判定まで戻って、ブロック1がIPCMで符号化した前提に置き直して参照する情報を更新してブロック2の処理をやり直さなくてはならない。しかも、算術符号化処理は、他の処理が行われているパイプラインとは別の独立したタイミングで処理が行われるため、ブロック1の算術符号化を行う時点で既に後続する多数のブロックの符号化処理が進行してしまい、膨大な量の処理を遡らなくてはならない場合がある。
また、参考として、図4(a)および図4(b)にCAVLCを用いた符号化におけるパイプラインの例を示す。CAVLCでは算術符号化処理がないため、たとえIPCMへの切替えが発生した場合でも、パイプラインを遡る処理の量は一定であり、CABACと比較すると制御が単純になっている。
このようにCABACを用いた符号化においてIPCMが発生したときのパイプラインを遡る制御は非常に複雑な処理制御が必要となり、また対象ピクチャ内でIPCMが多数発生して遡る回数が増加するとそれだけ処理速度遅延の原因となり、要求時間内に対象ピクチャの符号化処理を完了できなくなってしまう。
一方、図5(a)にCABACを用いた復号化におけるパイプラインの例を示す。ブロック1に対して、符号列解析、逆変換/量子化、画面間/内予測、出力画像生成、の各処理が順に適用され、ブロック2に対しても同様の処理が適用されている。このとき、ブロック2はブロック1の符号列解析が完了した時点で直ぐに処理を開始することで、処理タイミングを1ステップずつ遅らせながら並行して処理を行う。また、算術復号化は前記パイプラインとは別の独立したタイミングで処理が行われる。
H.264では、前述の通りブロック単位の符号列の最大符号量が定義されている。しかし、制限されているのは算術復号化前の符号列の符号量のみであり、算術復号化の結果生成される中間符号列の符号量に関しては定義されていない。そのため、条件によっては中間符号列の符号量が極端に大きくなってしまう可能性がある。
図5(b)にブロック2において中間符号列の符号量が極端に大きくなった場合のパイプラインの例を示す。ブロック2の符号列解析処理において、多くの中間符号列を読み込んで処理を行わなくてはならないため、他の処理よりも処理に必要な時間が増加してしまっている。このとき並列に動作している他のブロックの処理も、ブロック2の符号列解析の処理が完了するまで次の処理に進めなくなる。
このようにCABACを用いた復号化において中間符号列の符号量が大きくなってしまうと、符号列解析処理の処理時間が増加してしまい、復号化処理全体の処理速度遅延の原因となり、要求時間内に対象ピクチャの復号化処理を完了できなくなってしまう。
本発明は上記課題を解決するものであり、パイプライン構造を持つ算術符号化に対応した符号化装置において、発生符号量を制限値以下に納めるためにパイプラインを遡る処理を単純化することを可能とし、同時にパイプライン構造を持つ算術復号化に対応した復号化装置において、パイプラインの処理遅延の発生を回避することを可能とする、従来の方法に代わる新しい制御方法を提供することを目的とする。
本発明における動画像符号化装置は、入力される符号化対象画像をブロック単位で符号化する動画像符号化装置であって、前記符号化対象画像に対応する予測画像を生成する予測画像生成部と、前記符号化対象画像と前記生成された予測画像との差分画像を生成する減算器と、前記減算器の出力に対して直交変換処理および量子化処理を行い、残差係数を生成する予測残差符号化部と、前記残差係数に対して逆量子化処理および逆直交変換処理を行い、残差復号化画像を生成する予測残差復号化部と、前記予測画像生成部で生成された予測画像と前記予測残差復号化部で生成された残差復号化画像とを加算することで再構成画像を生成する加算器と、第1モードにおいて、前記予測残差符号化部で生成された残差係数を可変長符号化して係数符号列を生成し、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および、前記ヘッダ符号列から構成される中間符号列を出力する一方、第2モードにおいて、前期残差係数の代わりに前記符号化対象画像の信号処理過程において得られる中間画像信号を可変長符号化せずにそのまま係数符号列とし、当該係数符号列および当該係数符号列が中間画像信号であることを示す識別子を少なくとも含むヘッダ符号列から構成される中間符号列を出力する2値化符号化部と、前記第1モードにおいて出力された中間符号列に対して算術符号化し、出力符号列を生成する一方、前記第2モードにおいて出力された中間符号列のうち前記ヘッダ符号列に対してのみ算術符号化し、算術符号化後のヘッダ符号列と前記係数符号列から構成される出力符号列を生成する算術符号化部と、を備え、前記2値化符号化部は、予め定義された特定の符号量以下である中間符号列を出力する。
また本発明における動画像符号化装置は、入力される符号化対象画像をブロック単位で符号化する動画像符号化装置であって、前記符号化対象画像に対応する予測画像を生成する予測画像生成部と、前記符号化対象画像と前記生成された予測画像との差分画像を生成する減算器と、前記減算器の出力に対して直交変換処理および量子化処理を行い、残差係数を生成する予測残差符号化部と、前記残差係数に対して逆量子化処理および逆直交変換処理を行い、残差復号化画像を生成する予測残差復号化部と、前記予測画像生成部で生成された予測画像と前記予測残差復号化部で生成された残差復号化画像とを加算することで再構成画像を生成する加算器と、第1モードにおいて、前記予測残差符号化部で生成された残差係数を可変長符号化して係数符号列を生成し、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および、前記ヘッダ符号列から構成される中間符号列を出力する一方、第2モードにおいて、前期残差係数の代わりに前記符号化対象画像の信号処理過程において得られる中間画像信号を可変長符号化せずにそのまま係数符号列とし、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および前記ヘッダ符号列から構成される中間符号列を出力する2値化符号化部と、前記第1モードにおいて出力された中間符号列に対して算術符号化し、出力符号列を生成する一方、前記第2モードにおいて出力された中間符号列のうち前記ヘッダ符号列に対してのみ算術符号化し、算術符号化後のヘッダ符号列と前記係数符号列から構成される出力符号列を生成する算術符号化部と、を備え、前記2値化符号化部は、予め定義された特定の符号量以下である中間符号列を出力する。
また好ましくは、前記予め定義された特定の符号量は、前記中間画像信号の画素値をそのまま符号列として記述する際に必要となる符号量と、前記ヘッダ符号列に記述される可能性のある全ての情報を符号化する際に必要となる最大の符号量と、余裕量とを合わせた符号量である。
また好ましくは、前記2値化符号化部は、出力する中間符号列の符号量が、前記予め定義された特定の符号量を超過する可能性がある場合、前記第2モードを用いて中間符号列を出力する。
また好ましくは、前記2値化符号化部は、前記第1モードで中間符号列を出力した結果、当該中間符号列の符号量が前記予め定義された特定の符号量を超過した場合、当該第1モードで生成した中間符号列に代えて、前記第2モードを用いて生成した中間符号列を出力する。
なお、本発明は、このような動画像符号化・復号化装置として実現することができるだけでなく、このような動画像符号化・復号化装置に含まれる各手段と同等の処理をプログラムや集積回路としても実現することもできる。
以上より、本発明における動画像符号化装置は、パイプライン構造を用いて算術符号化を含む符号化方法を実現した場合でも、中間符号列を生成する時点で予め定義された特定の符号量以下になるように制御することができる。そのため、発生符号量を制限値以下に納めるためにパイプラインを遡る処理を単純化することが可能となり、また対応する動画像復号化装置において、パイプラインの処理遅延の発生を回避することが可能となる。
本発明の実施の形態1に係る動画像符号化装置を示すブロック図である。 本発明の実施の形態3に係る動画像復号化装置を示すブロック図である。 従来の動画像符号化装置のパイプライン制御を説明するための概念図である。 従来の動画像符号化装置の別のパイプライン制御を説明するための概念図である。 従来の動画像復号化装置のパイプライン制御を説明するための概念図である。 本発明の実施の形態1に係る符号列生成処理のフローチャートである。 本発明の実施の形態1によって生成される符号列のシンタックスの一例を説明するための概念図である。 本発明の実施の形態1に係る動画像符号化装置のパイプライン制御を説明するための概念図である。 本発明の実施の形態2に係る動画像符号化装置を示すブロック図である。 本発明の実施の形態2に係る符号列生成処理のフローチャートである。 本発明の実施の形態2によって生成される符号列のシンタックスの一例を説明するための概念図である。 本発明の実施の形態2に係る動画像符号化装置のパイプライン制御を説明するための概念図である。 本発明の実施の形態3に係る符号列解析処理のフローチャートである。 本発明の実施の形態3に係る符号列解析処理の別フローチャートである。
(実施の形態1)
以下、本発明の実施の形態1について、図面を参照しながら説明する。
図1は、本発明の実施の形態に係る動画像符号化装置100のブロック図である。動画像符号化装置100は、ピクチャ単位で入力された動画像をブロックに分割し、ブロック単位で符号化処理を行い符号列を生成する。
この動画像符号化装置100は、ピクチャメモリ101と、予測残差符号化部102と、予測残差復号化部103と、ローカルバッファ104と、予測符号化部105と、量子化値決定部106と、2値化符号化部107と、ヘッダ符号列生成部108と、係数符号列生成部109と、算術符号化部110とを備えている。
ピクチャメモリ101は、表示を行う順にピクチャ単位で入力される入力画像信号151を、符号化を行う順にピクチャの並び替えを行って蓄積する。次に、ピクチャメモリ101は、差分演算部111または予測符号化部105からの読出し命令を受け付けると当該読出し命令に係る入力画像信号をそれぞれ出力する。このとき、各々のピクチャはコーディングユニット(以下、CUと称す)と呼ばれる複数の画素から構成される符号化単位に分割される。このCUは、例えば水平64×垂直64画素のブロック、水平32×垂直32画素のブロック、水平16×垂直16画素のブロック等から成る。なお、本実施形態における動画像符号化装置100では、CU単位で以降の処理が行われる。
予測残差符号化部102は、差分演算部111から出力される差分画像信号152に対して直交変換を行う。さらに得られた各周波数成分の直交変換係数に対し量子化を行うことで画像情報の圧縮を行い、残差符号化信号153を生成する。そして、生成した残差符号化信号153を予測残差復号化部103および係数符号列生成部109に出力する。このとき予測残差符号化部102は、量子化値決定部106において決定された量子化値信号158を用いて、直交変換係数を量子化する。
予測残差復号化部103は、予測残差符号化部102から出力される残差符号化信号153に対して、逆量子化および逆直交変換することで残差復号化信号154を生成する。そして、生成した残差復号化信号154を加算演算部112に出力する。
ローカルバッファ104は、加算演算部112から出力される再構成画像信号155を格納する。この再構成画像信号155は、現在符号化対象となっているピクチャ以降のピクチャの符号化における予測符号化処理に用いられる。つまり、再構成画像信号155は、現状符号化対象となっているピクチャ以降のピクチャを符号化する際、画素データとして参照される。ローカルバッファ104は、予測符号化部105からの読出し命令に応じて、格納する再構成画像信号155を画素データとして予測符号化部105出力する。
予測符号化部105は、ピクチャメモリ101から出力される入力画像信号を基に、画面内予測、または画面間予測を用いて予測画像信号156を生成する。そして、生成した予測画像信号156を差分演算部111および加算演算部112に出力する。なお、予測符号化部105は、画面間予測を用いる際は、ローカルバッファ104に蓄積される既に符号化済みの過去のピクチャの再構成画像信号155を用いる。また、画面内予測を用いる際は、符号化対象CUに隣接する既に符号化済みのCUの現在のピクチャの再構成画像信号155を用いる。画面内予測を用いるか画面間予測を用いるかのモード判定方法については、どちらの予測方法がより残差信号の情報量を少なくすることができるかを予測して行われる。
量子化値決定部106は、ピクチャメモリ101に格納されるピクチャに基づいて、予測残差符号化部102において差分画像信号152を量子化する際の量子化値を設定する。そして、設定した量子化値を予測残差符号化部102およびヘッダ符号列生成部107に出力する。なお、量子化値決定部106における量子化値の設定方法は、符号列信号160のビットレートが目標とするするビットレートに近づくように量子化値を設定する、いわゆるレート制御に基づく量子化値の設定方法等を利用しても構わない。
2値化符号化部107は、ヘッダ符号列生成部108と係数符号列生成部109とを含み、各々の処理を適用して生成された2値化情報を中間符号列159として算術符号化部110に出力する。
ヘッダ符号列生成部108は、予測符号化部105が出力する予測情報信号157と、量子化値決定部106が出力する量子化値信号158と、その他の符号化制御に関する制御情報を可変長符号化することでヘッダ中間符号列を生成する。なお、予測情報には、例えば画面内予測モード、画面間予測モード、動きベクトル、参照ピクチャを示す情報等が含まれる。また、制御情報は係数符号列生成部109における処理前までに取得可能な情報であって、CUの符号化時に適用した符号化条件を示す情報であり、例えばブロック符号化タイプ、ブロック分割情報等が含まれる。
係数符号列生成部109は、予測残差符号化部102が出力する残差符号化信号153を可変長符号化して係数中間符号列を生成する。そして、係数符号列生成部109は、生成した係数中間符号列をヘッダ符号列生成部108が生成したヘッダ中間符号列に続けて追記することで中間符号列信号159を生成する(以下、第1モードと称す)。
一方、係数符号列生成部109は、ピクチャメモリ101から出力される入力画像信号を可変長符号化せずに得られる係数中間符号列を、ヘッダ符号列生成部108が生成したヘッダ中間符号列に続けて追記することで中間符号列信号159を生成する(以下、第2モードと称す)。
算術符号化部110は、2値化符号化部107から出力される中間符号列159のうち一部の符号列に対して算術符号化を行い、当該動画像符号化装置100の出力となる符号列信号160を生成する。
差分演算部111は、ピクチャメモリ101から読み出された入力画像信号と、予測符号化部105の出力である予測画像信号156との差分値である差分画像信号152を生成し、予測残差符号化部102に出力する。
加算演算部112は、予測残差復号化部103から出力される残差復号化信号154と、予測符号化部105から出力される予測画像信号156とを加算することにより再構成画像信号155を生成し、ローカルバッファ104に出力する。
ここで、2値化符号化部107および算術符号化部110において符号列信号160を生成する方法について、図6のフローチャートを用いて具体的に説明する。
まず、2値化符号化部107は、ステップS601において、入力された残差符号化信号153を用いて、符号化対象CUの2値化後の中間符号量が規定値を超過する可能性があるかどうかを判定する。
ステップS601において、超過する可能性がないと判断された場合は、前述の通常の符号化処理を行った結果生成された予測情報信号157、量子化値信号158、その他の符号化制御情報を入力として可変長符号化を行うことによってヘッダ中間符号列を生成する(S602)。さらに、従来の符号化と同様に入力された残差符号化信号153を可変長符号化する(Residualモード)ことで係数中間符号列を生成する(S603)。
一方、ステップS601において、超過する可能性があると判断された場合は、PCMモードとして符号化したことを示すPCMモード情報のみを可変長符号化することによってヘッダ中間符号列を生成する(S605)。さらに、入力された入力画像信号を可変長符号化せずに画素のビットをそのまま符号列に記述する(PCMモード)ことで係数中間符号列を生成する(S606)。
つづいて、算術符号化部110は、入力された中間符号列がResidualモードによって生成されている場合は、前記ヘッダ中間符号列および前記係数中間符号列に対して算術符号化を行うことによって最終的な符号列を生成する(S604)。また、入力された中間符号列がPCMモードによって生成されている場合は、前記PCMモード情報のみのヘッダ中間符号列に対して算術符号化を行い、前記係数中間符号列に対しては算術符号化を行うことなくそのまま符号列に追記することで最終的な符号列を生成する(S607)。
なお、ここではステップS601において、入力された残差符号化信号153を用いて符号化対象CUの中間符号量が規定値を超過する可能性があるかどうかを判定しているが、それ以外の方法を用いて中間符号量が規定値を超過する可能性があるかどうかを判定してもよい。例えば、生成した中間符号列信号159に基づいて符号量が既定値を超過しているか判定する方法がある。この場合、ステップS602およびステップS603の処理が完了した時点で判定を行うことになり、既にResidualモードで中間符号列が生成されてしまっている。そのため、もし超過していると判定された場合は、生成済みの当該中間符号列に代えて、ステップS605およびステップS606の処理を行ってPCMモードで再生成された中間符号列に置き換えることで処理がなされる。
なお、ここではステップS606において入力画像信号を入力としてPCMモードで係数中間符号列を生成しているが、入力画像信号の代わりに、再構成画像信号155を入力としてPCMモードで係数中間符号列を生成してもよい。もしくは、差分画像信号152または残差復号化信号154を入力としてPCMモードで係数中間符号列を生成してもよい。
なお、ここではステップS601においてCU単位で判定を行っているが、複数のCU単位、CUよりも小さなブロック単位、もしくはその他のブロック単位で判定を行ってもよい。
図7は本実施の形態によって生成される中間符号列および符号列のCU単位のシンタックス:coding_unit()の一例を示した図である。
図7(a)は図6で説明したResidualモードで中間符号列を生成した場合のシンタックスである。シンタックスの先頭には、ヘッダ符号列生成部108によって生成された、予測モード:pred_mode、予測情報:prediction_unit()、量子化値:qp_value等の情報を可変長符号化した符号列が記述されている。つづいて、residual_data()として残差符号化信号153を可変長符号化した符号列が記述されている。
図7(b)は図6で説明したPCMモードで中間符号列を生成した場合のシンタックスである。シンタックスの先頭には、PCMモードとして符号化したことを示すPCMモード情報であるpred_modeを可変長符号化した符号列が記述されている。つづいて、pcm_data()として、入力画像信号もしくは再構成画像信号155を可変長符号化ぜず、画素のビット列そのままである符号列が記述されている。
このとき、発生する中間符号列の符号量は、Residualモードについては可変長符号化の条件によって符号長が変わるため一意に特定できない。しかし、PCMモードについてはpred_mode以外はCUのサイズによって一意に特定できる。例えば、画像のフォーマットが各画素8ビットのYUV4:2:0であり、符号化対象CUのサイズが32×32画素であった場合、入力画像信号もしくは再構成画像信号155の画素値をそのまま符号列として記述する際に必要となる符号量は1536バイトとなる。よって、pred_modeを可変長符号化したときに発生しうる最大の符号量および余裕量を加えても、CU全体で12500ビットを超過することはない。
つまり、図6のステップS601で説明した規定値として、符号化対象CUの入力画像信号もしくは成画像信号155の画素値をそのまま符号列として記述する際に必要となる符号量と、PCMモードとして符号化したことを示す情報を可変長符号化したときに発生しうる最大の符号量と、余裕量とを加算した値(前述の例では12500ビット)とすることで、生成される中間符号量が常に前記規定値を超過しないことが保証される。
なお、図7で説明したシンタックス、および前記規定値の説明に使用した数値は、本実施の形態を説明するための一例であり、ここに記載されているものと異なるシンタックス、および数値を用いて同様の機能を実現してもよい。
ここで、図8を用いて本実施の形態に係る動画像符号化装置100のパイプラインの例を示す。
図8(a)は図6のステップS601の判定の結果、Residualモードで中間符号列を生成した場合のパイプラインの制御である。図3(a)で説明した従来の制御と全く同様の流れで処理が行われている。
一方、図8(b)は図6のステップS601の判定の結果、PCMモードで中間符号列を生成した場合のパイプラインの制御である。図3(b)で説明した従来の制御と異なり、2値化符号化処理の時点でPCMモードが確定できる。そのため、パイプライン処理と算術符号化処理のタイミングのずれを考慮する必要がない。よって、常にパイプラインを遡る処理の量は一定にすることが可能となり、PCMモード発生時の処理制御を単純化することができる。
また、図8(a)および図8(b)のパイプライン処理の制御は、図4(a)および図4(b)で説明したCAVLCを用いて符号化した場合のパイプライン処理の制御と全く同様である。つまり、本実施の形態に係る動画像符号化装置100は、CABACを用いて符号化を行った場合も、CAVLCを用いて符号化を行った場合も、全く同様のパイプラインの制御方法で処理することが可能となる。
このように、本実施の形態に係る動画像符号化装置100は、パイプライン構造を用いて算術符号化による符号化方法を実現した場合でも、中間符号列を生成する時点で予め定義された特定の符号量以下になるように制御することができる。そのため、発生符号量を制限値以下に納めるためにパイプラインを遡る処理を単純化することが可能となる。
(まとめ)
本実施形態における動画像符号化装置は、入力される符号化対象画像をブロック単位で符号化する動画像符号化装置であって、前記符号化対象画像に対応する予測画像を生成する予測符号化部105と、前記符号化対象画像と前記生成された予測画像との差分画像を生成する減算器と、前記減算器の出力に対して直交変換処理および量子化処理を行い、残差係数を生成する予測残差符号化部102と、前記残差係数に対して逆量子化処理および逆直交変換処理を行い、残差復号化画像を生成する予測残差復号化部103と、前記予測符号化部105で生成された予測画像と前記予測残差復号化部103で生成された残差復号化画像とを加算することで再構成画像を生成する加算演算部112と、第1モードにおいて、前記予測残差符号化部102で生成された残差係数を可変長符号化して係数符号列を生成し、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および、前記ヘッダ符号列から構成される中間符号列を出力する一方、第2モードにおいて、前期残差係数の代わりに前記符号化対象画像の信号処理過程において得られる中間画像信号を可変長符号化せずにそのまま係数符号列とし、当該係数符号列および当該係数符号列が中間画像信号であることを示す識別子を少なくとも含むヘッダ符号列から構成される中間符号列を出力する2値化符号化部107と、前記第1モードにおいて出力された中間符号列に対して算術符号化し、出力符号列を生成する一方、前記第2モードにおいて出力された中間符号列のうち前記ヘッダ符号列に対してのみ算術符号化し、算術符号化後のヘッダ符号列と前記係数符号列から構成される出力符号列を生成する算術符号化部110と、を備え、前記2値化符号化部107は、予め定義された特定の符号量以下である中間符号列を出力する。
また好ましくは、前記予め定義された特定の符号量は、前記中間画像信号の画素値をそのまま符号列として記述する際に必要となる符号量と、前記ヘッダ符号列に記述される可能性のある全ての情報を符号化する際に必要となる最大の符号量と、余裕量とを合わせた符号量である。
また好ましくは、前記2値化符号化部107は、出力する中間符号列の符号量が、前記予め定義された特定の符号量を超過する可能性がある場合、前記第2モードを用いて中間符号列を出力する。
また好ましくは、前記2値化符号化部107は、前記第1モードで中間符号列を出力した結果、当該中間符号列の符号量が前記予め定義された特定の符号量を超過した場合、当該第1モードで生成した中間符号列に代えて、前記第2モードを用いて生成した中間符号列を出力する。
(実施の形態2)
次に、本発明の実施の形態2について、図面を参照しながら説明する。
図9は、本発明の実施の形態に係る動画像符号化装置100−1のブロック図である。動画像符号化装置100−1は、ピクチャ単位で入力された動画像をブロックに分割し、ブロック単位で符号化処理を行い符号列を生成する。
この動画像符号化装置100−1は、実施の形態1で図1を用いて説明した動画像符号化装置100とほぼ同様であるが、2値化符号化部107、ヘッダ符号列生成部108、係数符号列生成部109、算術符号化部110の代わりに、2値化符号化部107−1、ヘッダ符号列生成部108−1、係数符号列生成部109−1、算術符号化部110−1を備えている点のみが異なっている。
以下、説明の便宜上、本実施形態1と同様の構成についてはその詳細な説明を省略する。さらに、図9では、図1と同様の機能を有するブロックについては同じ番号を付す。
2値化符号化部107−1は、ヘッダ符号列生成部108−1と係数符号列生成部109−1とを含み、各々の処理を適用して生成された2値化情報を中間符号列159−1として算術符号化部110−1に出力する。
ヘッダ符号列生成部108−1は、予測符号化部105が出力する予測情報信号157と、量子化値決定部106が出力する量子化値信号158と、その他の符号化制御に関する制御情報を可変長符号化することでヘッダ中間符号列を生成する。なお、予測情報には、例えば画面内予測モード、画面間予測モード、動きベクトル、参照ピクチャを示す情報等が含まれる。また、制御情報は係数符号列生成部109−1における処理前までに取得可能な情報であって、CUの符号化時に適用した符号化条件を示す情報であり、例えばブロック符号化タイプ、ブロック分割情報等が含まれる。
係数符号列生成部109−1は、予測残差符号化部102が出力する残差符号化信号153を可変長符号化して係数中間符号列を生成する。そして、係数符号列生成部109−1は、生成した係数中間符号列をヘッダ符号列生成部108−1が生成したヘッダ中間符号列に続けて追記することで中間符号列信号159−1を生成する(以下、第1モードと称す)。
一方、係数符号列生成部109は、加算演算部112から出力される再構成画像信号155を可変長符号化せずに得られる係数中間符号列を可変長符号化せずに得られる係数中間符号列を、ヘッダ符号列生成部108が生成したヘッダ中間符号列に続けて追記し、中間符号列信号159を生成する(以下、第2モードと称す)。
算術符号化部110−1は、2値化符号化部107−1から出力される中間符号列159−1に対して算術符号化を行い、当該動画像符号化装置100−1の出力となる符号列信号160−1を生成する。
ここで、2値化符号化部107−1および算術符号化部110−1において符号列信号160−1を生成する方法について、図10のフローチャートを用いて具体的に説明する。
まず、2値化符号化部107−1は、前述の通常の符号化処理を行った結果生成された予測情報信号157、量子化値信号158、その他の符号化制御情報を入力として可変長符号化を行うことによってヘッダ中間符号列を生成する(S1001)。
次に、ステップS1002において、入力された残差符号化信号153を用いて、符号化対象CUの中間符号量が規定値を超過する可能性があるかどうかを判定する。
ステップS1002において、超過する可能性がないと判断された場合は、従来の符号化と同様に入力された残差符号化信号153を可変長符号化する(Residualモード)ことで係数中間符号列を生成する(S1003)。
一方、ステップS1002において、超過する可能性があると判断された場合は、入力された再構成画像信号155を可変長符号化せずに画素のビットをそのまま符号列に記述する(PCMモード)ことで係数中間符号列を生成する(S1005)。
つづいて、算術符号化部110−1は、入力された中間符号列がResidualモードによって生成されている場合は、前記ヘッダ中間符号列および前記係数中間符号列に対して算術符号化を行うことによって最終的な符号列を生成する(S1004)。また、入力された中間符号列がPCMモードによって生成されている場合は、前記ヘッダ中間符号列のみに対して算術符号化を行い、前記係数中間符号列に対しては算術符号化を行うことなくそのまま符号列に追記することで最終的な符号列を生成する(S1006)。
なお、ここではステップS1002において、入力された残差符号化信号153を用いて符号化対象CUの中間符号量が規定値を超過する可能性があるかどうかを判定しているが、それ以外の方法を用いて中間符号量が規定値を超過する可能性があるかどうかを判定してもよい。例えば、生成した中間符号列信号159−1に基づいて符号量が既定値を超過しているか判定する方法がある。この場合、ステップS1003の処理が完了した時点で判定を行うことになり、既にResidualモードで係数中間符号列が生成されてしまっている。そのため、もし超過していると判定された場合は、生成済みの当該係数中間符号列に代えて、ステップS1005の処理を行ってPCMモードで再生成された係数中間符号列に置き換えることで処理がなされる。
なお、ここではステップS1005において再構成画像信号155を入力としてPCMモードで係数中間符号列を生成しているが、再構成画像信号155の代わりに、入力画像信号を入力としてPCMモードで係数中間符号列を生成してもよい。もしくは、差分画像信号152または残差復号化信号154を入力としてPCMモードで係数中間符号列を生成してもよい。
なお、ここではステップS1002においてCU単位で判定を行っているが、複数のCU単位、CUよりも小さなブロック単位、もしくはその他のブロック単位で判定を行ってもよい。
図11は本実施の形態によって生成される中間符号列および符号列のCU単位のシンタックス:coding_unit()の一例を示した図である。
図11(a)は図10で説明したResidualモードで中間符号列を生成した場合のシンタックスである。シンタックスの先頭には、ヘッダ符号列生成部108−1によって生成された、予測モード:pred_mode、予測情報:prediction_unit()、量子化値:qp_value等の情報を可変長符号化した符号列が記述されている。つづいて、係数情報をResidualモードで符号化したかPCMモードで符号化したかを示すpcm_flagが記述され、さらに、residual_data()として残差符号化信号153を可変長符号化した符号列が記述されている。
図11(b)は図10で説明したPCMモードで中間符号列を生成した場合のシンタックスである。図11(a)と同様に、シンタックスの先頭には、ヘッダ符号列生成部108−1によって生成された、予測モード:pred_mode、予測情報:prediction_unit()、量子化値:qp_value等の情報を可変長符号化した符号列が記述されている。つづいて、Residualモードで符号化したかPCMモードで符号化したかを示すpcm_flagが記述され、さらに、pcm_data()として、再構成画像信号155もしくは入力画像信号を可変長符号化ぜず画素のビット列そのままである符号列が記述されている。
このとき、発生する中間符号列の符号量は、Residualモードについては全ての情報が可変長符号化される。そのため、可変長符号化の条件によって符号長が変わるため一意に特定できない。しかし、PCMモードについてはpcm_data()は可変長符号化されないためCUのサイズによって一意に特定できる。例えば、画像のフォーマットが各画素8ビットのYUV4:2:0であり、符号化対象CUのサイズが32×32画素であった場合、入力画像信号もしくは再構成画像信号の画素値をそのまま符号列として記述する際に必要となる符号量は1536バイトとなる。pcm_data()以外は可変長符号化されるため符号長を一意に特定することはできないが、可変長符号化を用いて符号化する情報の個数は限られており、発生しうる最大の符号量はそれほど大きくはない。つまり、pcm_data()の符号量に、pcm_data()以外を可変長符号化したときに発生しうる最大の符号量および余裕量を加えても、CU全体で13000ビットを超過することはない。
つまり、図10のステップS1002で説明した規定値として、符号化対象CUの再構成画像信号155もしくは入力画像信号の画素値をそのまま符号列として記述する際に必要となる符号量と、ヘッダ情報を可変長符号化したときに発生しうる最大の符号量と、余裕量とを加算した値(前述の例では13000ビット)とすることで、生成される中間符号量が常に前記規定値を超過しないことが保証される。
なお、図11で説明したシンタックス、および前記規定値の説明に使用した数値は、本実施の形態を説明するための一例であり、ここに記載されているものと異なるシンタックス、および数値を用いて同様の機能を実現してもよい。
ここで、図12を用いて本実施の形態に係る動画像符号化装置100−1のパイプラインの例を示す。
図12(a)は図10のステップS1002の判定の結果、Residualモードで中間符号列を生成した場合のパイプラインの制御である。図3(a)で説明した従来の制御と全く同様の流れで処理が行われている。
一方、図12(b)は図10のステップS1002の判定の結果、PCMモードで再構成画像信号155を用いて中間符号列を生成した場合のパイプラインの制御である。図3(b)で説明した従来の制御と異なり、2値化符号化処理の時点でPCMモードが確定できる。そのため、パイプライン処理と算術符号化処理のタイミングのずれを考慮する必要がない。さらに、ブロック1がPCMモードに切り替わっても、ヘッダ符号列に記述されている予測情報や最終的に生成される再構成画像の画素情報は変更されない。そのため、それらを参照しながら符号化処理が進行しているブロック2の処理には全く影響を与えない。よって、パイプラインを遡ることなくそのままPCMモードで中間符号列を生成することが可能となる。
なお、図10のステップS1005において、再構成画像信号155の代わりに入力画像信号を用いて処理した場合、ブロック1がPCMモードに切り替わったときに、ヘッダ符号列に記述されている予測情報は変更されない。しかし、最終的に生成される画素情報が再構成画像ではなく入力画像に変更される。そのため、ブロック1の画素情報を参照しながら既に進行しているブロック2の符号化処理について、画素情報を置き換えて処理をやり直さなくてはならない。結果、ブロック1の画面間/内予測の処理まで遡る必要がある。しかし、実施の形態1において図8(b)を用いて説明したパイプラインよりも遡る処理の量が少なくなり、さらに処理速度の遅延を抑制することが可能となる。
このように、本実施の形態に係る動画像符号化装置100−1は、パイプライン構造を用いて算術符号化による符号化方法を実現した場合でも、パイプラインを遡ることなくPCMモードに切替えて符号化を行うことができる。そのため、処理速度の遅延もしくは処理量を増加させることなく、発生符号量を制限値以下に納めることが可能となる。
(まとめ)
また本発明における動画像符号化装置は、入力される符号化対象画像をブロック単位で符号化する動画像符号化装置であって、前記符号化対象画像に対応する予測画像を生成する予測符号化部105と、前記符号化対象画像と前記生成された予測画像との差分画像を生成する減算器と、前記減算器の出力に対して直交変換処理および量子化処理を行い、残差係数を生成する予測残差符号化部102と、前記残差係数に対して逆量子化処理および逆直交変換処理を行い、残差復号化画像を生成する予測残差復号化部103と、前記予測符号化部105で生成された予測画像と前記予測残差復号化部103で生成された残差復号化画像とを加算することで再構成画像を生成する加算演算部112と、第1モードにおいて、前記予測残差符号化部102で生成された残差係数を可変長符号化して係数符号列を生成し、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および、前記ヘッダ符号列から構成される中間符号列を出力する一方、第2モードにおいて、前期残差係数の代わりに前記符号化対象画像の信号処理過程において得られる中間画像信号を可変長符号化せずにそのまま係数符号列とし、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および前記ヘッダ符号列から構成される中間符号列を出力する2値化符号化部107−1と、前記第1モードにおいて出力された中間符号列に対して算術符号化し、出力符号列を生成する一方、前記第2モードにおいて出力された中間符号列のうち前記ヘッダ符号列に対してのみ算術符号化し、算術符号化後のヘッダ符号列と前記係数符号列から構成される出力符号列を生成する算術符号化部110−1と、を備え、前記2値化符号化部107−1は、予め定義された特定の符号量以下である中間符号列を出力する。
また好ましくは、前記予め定義された特定の符号量は、前記中間画像信号の画素値をそのまま符号列として記述する際に必要となる符号量と、前記ヘッダ符号列に記述される可能性のある全ての情報を符号化する際に必要となる最大の符号量と、余裕量とを合わせた符号量である。
また好ましくは、前記2値化符号化部107−1は、出力する中間符号列の符号量が、前記予め定義された特定の符号量を超過する可能性がある場合、前記第2モードを用いて中間符号列を出力する。
また好ましくは、前記2値化符号化部107−1は、前記第1モードで中間符号列を出力した結果、当該中間符号列の符号量が前記予め定義された特定の符号量を超過した場合、当該第1モードで生成した中間符号列に代えて、前記第2モードを用いて生成した中間符号列を出力する。
(実施の形態3)
以下、本発明の実施の形態3について、図面を参照しながら説明する。
図2は、本発明の実施の形態に係る動画像復号化装置200のブロック図である。動画像復号化装置200は、実施の形態1または実施の形態2で説明した動画像符号化装置によって生成された符号列に対し、コーディングユニット(CU)と呼ばれるブロック単位で復号化処理し、出力画像を生成する。
この動画像復号化装置200は、算術復号化部201と、2値化復号化部202と、ヘッダ符号列解析部203と、係数符号列解析部204と、予測残差復化部205と、ピクチャメモリ206と、予測復号化部207と、量子化値決定部208とを備えている。
算術復号化部201は、入力されたブロック単位の符号列信号251に対して算術復号化を行い、生成された中間符号列252を2値化復号化部202へ出力する。
2値化復号化部202は、ヘッダ符号列解析部203と係数符号列解析部204とを含み、入力された中間符号列252に対して各々の処理を適用することで符号列の解析を行う。
ヘッダ符号列解析部203は、入力された中間符号列信号252のヘッダ中間符号列に対して可変長復号化を施すことによりヘッダ情報の解析を行う。そして、ヘッダ符号列解析部203は、解析して得られる予測情報信号257を予測復号化部207へ出力する。さらに、ヘッダ符号列解析部203は、解析して得られる量子化値情報を量子化値決定部208へ出力する。
係数符号列解析部204は、ヘッダ符号列解析部203によって解析されたヘッダ中間符号列に続いて符号化されている係数中間符号列に対して可変長復号化を施すことにより残差符号化信号253を取得する。そして、係数符号列解析部204は、当該残差符号化信号253を予測残差復号化部205へ出力する第1モードを有する。さらに、係数符号列解析部204は、ヘッダ符号列解析部203によって解析されたヘッダ中間符号列に続いて符号化されている係数中間符号列に対して可変長復号化せずに再構成画像信号を取得し、当該再構成画像信号を加算演算部209の出力である再構成画像信号255に置き換える第2モードを有する。このとき第2モードを用いて処理した場合は、以降で説明する予測残差復号化部205による残差復号化信号254の生成処理、および予測復号化部207による予測画像信号255の生成処理は行なわなくても構わない。
予測残差復号化部205は、係数符号列解析部204から入力された残差符号化信号253に対して、逆量子化および逆直交変換することで残差復号化信号254を生成する。そして、生成した残差復号化信号254を加算演算部209に出力する。このとき予測残差復号化部205は、量子化値決定部208において決定された量子化値信号258を用いて残差符号化信号253を逆量子化する。
予測復号化部207は、ヘッダ符号列解析部203から出力された予測情報信号257を基に、画面内予測、または画面間予測を用いて予測画像信号255を生成し加算演算部209に出力する。なお、予測復号化部207は、画面間予測を用いる際は、ピクチャメモリ206に蓄積される既に復号化済みの過去のピクチャの再構成画像信号256を用いる。また、画面内予測を用いる際は、復号化対象CUに隣接する既に復号化済みのCUの現在のピクチャの再構成画像信号256を用いる。画面内予測を用いるか画面間予測を用いるかの判定については、入力される予測情報信号257に従って行われる。
ピクチャメモリ206は、加算演算部209または係数符号列解析部204から順に入力される再構成画像信号256をピクチャ単位で蓄積し、ピクチャ単位で出力する順番に並び替えて出力画像信号259として表示装置に出力する。
加算演算部209では、予測残差復号化部205から出力される残差復号化信号254と、予測復号化部207から出力される予測画像信号255とを加算することによって再構成画像信号256を生成し、ピクチャメモリ206に出力する。
ここで、算術復号化部201および2値化復号化部202において符号列信号251の解析を行う方法について、図13および図14のフローチャートを用いて具体的に説明する。
図13は本発明の実施の形態1に係わる動画像符号化装置100によって生成された符号列信号に対して解析を行うときのフローチャートである。
まず、算術復号化部201は、入力された符号列の先頭に記述されているPCMモード情報の解析を行う(S1301)。つづいて、得られたPCMモード情報に従って、対象のCUがResidualモードで符号化されているか、もしくはPCMモードで符号化されているかの判定を行う(S1302)。
ステップS1302において、Residualモードで符号化されていると判断された場合は、入力された符号列に属するヘッダ符号列および係数符号列に対して算術復号化を行い中間符号列を生成する(S1303)。
一方、ステップS1302において、PCMモードで符号化されていると判断された場合は、入力された符号列に属する係数符号列に対して算術復号化を行わずに取得したビット列をそのままの符号列として、先に解析されたPCMモード情報の符号列に続けて記述することで中間符号列を生成する(S1306)。
次に、2値化復号化部202は、入力された中間符号列がResidualモードによって生成されている場合は、ヘッダ中間符号列に対して可変長復号化を施すことによりヘッダ情報の解析を行い、生成された予測情報信号257、量子化値情報、その他の復号化制御情報を図2を用いて説明した各処理ブロックへ出力する(S1304)。
つづいて、係数中間符号列に対して可変長復号化を施すことによって取得した残差符号化信号253を予測残差復号化部205に出力する(S1305)。
一方、2値化復号化部202は、入力された中間符号列がPCMモードによって生成されている場合は、係数中間符号列に対して可変長復号化を施すこととなく取得したビット列をそのまま再構成画像信号として出力し、加算演算部209から出力される再構成画像信号256に置き換えて以降の処理を行う(S1307)。このとき、当該中間符号列にはPCMモード情報以外のヘッダ情報を含まないためヘッダ中間符号列の解析は必要ない。
なお、実施の形態1で説明した動画像符号化装置100において、図6のステップS606で、入力画像信号の代わりに再構成画像信号155を用いて符号列を生成した場合においても、当該符号列に対する復号化処理としては全く区別する必要はなく、常にステップS1307において再構成画像信号として出力し以降の処理を行うことが可能である。
また、実施の形態1では図7を用いて、生成される符号列のCU単位のシンタックスの一例および生成される中間符号列の最大符号量の一例を説明したが、本実施の形態において復号化処理を行う符号列のシンタックスおよび生成される中間符号列の最大符号量も全く同様である。
図14は本発明の実施の形態2に係わる動画像符号化装置100−1によって生成された符号列信号に対して解析を行うときのフローチャートである。このフローチャートは図13を用いて説明したフローチャートとほぼ同様であるが、ステップS1301、ステップS1303の代わりに、ステップS1401、ステップS1403が用いられ、またステップS1404が新たに追加されている点のみが異なっている。
まず、算術復号化部201は、入力された符号列に属するヘッダ符号列に対して算術復号化を行いヘッダ中間符号列を生成する(S1401)。このときヘッダ符号列に記述されている情報である、対象のCUがResidualモードで符号化されているか、もしくはPCMモードで符号化されているかの信号をステップS1302に送り判定処理に用いる。
ステップS1302において、Residualモードで符号化されていると判断された場合は、入力された符号列に属する係数符号列に対して算術復号化を行う。そして、先に生成されたヘッダ中間符号列に続けて記述することで中間符号列を生成する(S1403)。
一方、ステップS1302において、PCMモードで符号化されていると判断された場合は、入力された符号列に属する係数符号列に対して算術復号化を行わずに取得したビット列をそのままの符号列として、先に生成されたヘッダ中間符号列に続けて記述することで中間符号列を生成する(S1306)。
次に、2値化復号化部202は、入力された中間符号列がResidualモードによって生成されている場合もPCMモードによって生成される場合も全く同様に、ヘッダ符号列に対して可変長復号化を施すことによりヘッダ情報の解析を行う。そして、生成された予測情報信号257、量子化値情報、その他の復号化制御情報を図2を用いて説明した各処理ブロックへ出力する(S1304およびS1404)。
つづいて、入力された中間符号列がResidualモードによって生成されている場合は、係数中間符号列に対して可変長復号化を施すことによって取得した残差符号化信号253を予測残差復号化部205に出力する(S1305)。
一方、入力された中間符号列がPCMモードによって生成されている場合は、係数中間符号列に対して可変長復号化を施すことなく取得したビット列をそのまま再構成画像信号として出力する。そして、加算演算部209から出力される再構成画像信号256に置き換えて以降の処理を行う(S1307)。
なお、実施の形態2で説明した動画像符号化装置100−1において、図10のステップS1005で、再構成画像信号155の代わりに入力画像信号を用いて符号列を生成した場合においても、当該符号列に対する復号化処理としては全く区別する必要はなく、常にステップS1307において再構成画像信号として出力し以降の処理を行うことが可能である。
また、実施の形態2では図11を用いて、生成される符号列のCU単位のシンタックスの一例および生成される中間符号列の最大符号量の一例を説明したが、本実施の形態において復号化処理を行う符号列のシンタックスおよび生成される中間符号列の最大符号量も全く同様である。
このように、本実施の形態による動画像復号化装置200を用いることにより、これに対応する符号列を生成する動画像符号化装置は、実施の形態1で説明したような構成をとることが可能となり、図8(b)のように、2値化符号化処理の時点でPCMモードが確定できる。そのため、パイプライン処理と算術符号化処理のタイミングのずれを考慮する必要がなく、常にパイプラインを遡る処理の量を一定にすることが可能となる。よって、PCMモード発生時の処理制御を単純化することができる。さらに、生成される符号列は中間符号列の発生符号量が特定の符号量以下になることが保証されている。そのため、図5を用いて説明した復号化におけるパイプラインにおいて、常に図5(a)のように符号列解析処理の処理時間を規定値内に納めることが可能となり、復号化処理の遅延の発生を回避することが可能となる。
また同様に、本実施の形態による動画像復号化装置200を用いることにより、これに対応する符号列を生成する動画像符号化装置は、実施の形態2で説明したような構成をとることが可能となり、図12(b)のように、2値化符号化処理の時点でPCMモードが確定できる。そのため、パイプライン処理と算術符号化処理のタイミングのずれを考慮する必要がなく、また、ヘッダ符号列に記述されている予測情報や最終的に生成される再構成画像の画素情報は変更されない。よって、パイプラインを遡ることなくPCMモード発生時の処理制御を行うことができる。さらに、生成される符号列は中間符号列の発生符号量が特定の符号量以下になることが保証されている。そのため、図5を用いて説明した復号化におけるパイプラインにおいて、常に図5(a)のように符号列解析処理の処理時間を規定値内に納めることが可能となり、復号化処理の遅延の発生を回避することが可能となる。
(その他の実施形態)
さらに、上記実施の形態で示した動画像符号化装置および動画像復号化装置に含まれる各手段と同等の機能を備えるプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。なお、記録媒体としてはフレキシブルディスクに限らず、光ディスク、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
また、上記実施の形態で示した動画像符号化装置および動画像復号化装置に含まれる各手段と同等の機能を集積回路であるLSIとして実現してもよい。これらは一部または全てを含むように1チップ化されてもよい。またLSIは集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩または派生する別技術によりLSIなどに置き換わる集積回路の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
また、本発明は、上述した動画像符号化装置および動画像復号化装置を含む、放送局から放送される放送波を圧縮し、記録を行うDVDレコーダー、BDレコーダー等の放送波記録装置に適用しても構わない。
また、上記実施の形態に係る、動画像符号化装置および動画像復号化装置、またはその変形例の機能のうち少なくとも一部を組み合わせてもよい。
本発明は、例えば、ビデオカメラ、デジタルカメラ、ビデオレコーダ、携帯電話、及びパーソナルコンピューター等における、入力画像を構成する各ピクチャを符号化して動画像符号化データとして出力する動画像符号化装置や、前記動画像符号化データを復号化して復号化画像を生成する動画像復号化装置として有用である。
100 動画像符号化装置
101 ピクチャメモリ
102 予測残差符号化部
103 予測残差復号化部
104 ローカルバッファ
105 予測符号化部
106 量子化値決定部
107 2値化符号化部
108 ヘッダ符号列生成部
109 係数符号列生成部
110 算術符号化部
111 差分演算部
112 加算演算部
151 入力画像信号
152 差分画像信号
153 残差符号化信号
154 残差復号化信号
155 再構成画像信号
156 予測画像信号
157 予測情報信号
158 量子化値信号
159 中間符号列信号
160 符号列信号
200 動画像復号化装置
201 算術復号化部
202 2値化復号化部
203 ヘッダ符号列解析部
204 係数符号列解析部
205 予測残差復号化部
206 ピクチャメモリ
207 予測復号化部
208 量子化値決定部
209 加算演算部
251 符号列信号
252 中間符号列信号
253 残差符号化信号
254 残差復号化信号
255 予測画像信号
256 再構成画像信号
257 予測情報信号
258 量子化値信号
259 出力画像信号

Claims (7)

  1. 入力される符号化対象画像をブロック単位で符号化する動画像符号化装置であって、
    前記符号化対象画像に対応する予測画像を生成する予測画像生成部と、
    前記符号化対象画像と前記生成された予測画像との差分画像を生成する減算器と、
    前記減算器の出力に対して直交変換処理および量子化処理を行い、残差係数を生成する予測残差符号化部と、
    前記残差係数に対して逆量子化処理および逆直交変換処理を行い、残差復号化画像を生成する予測残差復号化部と、
    前記予測画像生成部で生成された予測画像と前記予測残差復号化部で生成された残差復号化画像とを加算することで再構成画像を生成する加算器と、
    第1モードにおいて、前記予測残差符号化部で生成された残差係数を可変長符号化して係数符号列を生成し、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および、前記ヘッダ符号列から構成される中間符号列を出力する一方、第2モードにおいて、前期残差係数の代わりに前記符号化対象画像の信号処理過程において得られる中間画像信号を可変長符号化せずにそのまま係数符号列とし、当該係数符号列および当該係数符号列が中間画像信号であることを示す識別子を少なくとも含むヘッダ符号列から構成される中間符号列を出力する2値化符号化部と、
    前記第1モードにおいて出力された中間符号列に対して算術符号化し、出力符号列を生成する一方、前記第2モードにおいて出力された中間符号列のうち前記ヘッダ符号列に対してのみ算術符号化し、算術符号化後のヘッダ符号列と前記係数符号列から構成される出力符号列を生成する算術符号化部と、を備え、
    前記2値化符号化部は、予め定義された特定の符号量以下である中間符号列を出力する動画像符号化装置。
  2. 入力される符号化対象画像をブロック単位で符号化する動画像符号化装置であって、
    前記符号化対象画像に対応する予測画像を生成する予測画像生成部と、
    前記符号化対象画像と前記生成された予測画像との差分画像を生成する減算器と、
    前記減算器の出力に対して直交変換処理および量子化処理を行い、残差係数を生成する予測残差符号化部と、
    前記残差係数に対して逆量子化処理および逆直交変換処理を行い、残差復号化画像を生成する予測残差復号化部と、
    前記予測画像生成部で生成された予測画像と前記予測残差復号化部で生成された残差復号化画像とを加算することで再構成画像を生成する加算器と、
    第1モードにおいて、前記予測残差符号化部で生成された残差係数を可変長符号化して係数符号列を生成し、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および、前記ヘッダ符号列から構成される中間符号列を出力する一方、第2モードにおいて、前期残差係数の代わりに前記符号化対象画像の信号処理過程において得られる中間画像信号を可変長符号化せずにそのまま係数符号列とし、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および前記ヘッダ符号列から構成される中間符号列を出力する2値化符号化部と、
    前記第1モードにおいて出力された中間符号列に対して算術符号化し、出力符号列を生成する一方、前記第2モードにおいて出力された中間符号列のうち前記ヘッダ符号列に対してのみ算術符号化し、算術符号化後のヘッダ符号列と前記係数符号列から構成される出力符号列を生成する算術符号化部と、を備え、
    前記2値化符号化部は、予め定義された特定の符号量以下である中間符号列を出力する動画像符号化装置。
  3. 前記予め定義された特定の符号量は、前記中間画像信号の画素値をそのまま符号列として記述する際に必要となる符号量と、前記ヘッダ符号列に記述される可能性のある全ての情報を符号化する際に必要となる最大の符号量と、余裕量とを合わせた符号量である請求項1または請求項2に記載の動画像符号化装置。
  4. 前記2値化符号化部は、出力する中間符号列の符号量が、前記予め定義された特定の符号量を超過する可能性がある場合、前記第2モードを用いて中間符号列を出力する請求項1または請求項2に記載の動画像符号化装置。
  5. 前記2値化符号化部は、前記第1モードで中間符号列を出力した結果、当該中間符号列の符号量が前記予め定義された特定の符号量を超過した場合、当該第1モードで生成した中間符号列に代えて、前記第2モードを用いて生成した中間符号列を出力する請求項1または請求項2に記載の動画像符号化装置。
  6. 入力される符号化対象画像をブロック単位で符号化する動画像符号化方法であって、
    前記符号化対象画像に対応する予測画像を生成し、
    前記符号化対象画像と前記生成された予測画像との差分画像を生成し、
    前記差分画像に対して直交変換処理および量子化処理を行い、残差係数を生成し、
    前記残差係数に対して逆量子化処理および逆直交変換処理を行い、残差復号化画像を生成し、
    前記生成された予測画像と前記生成された残差復号化画像とを加算することで再構成画像を生成し、
    第1モードにおいて、前記生成された残差係数を可変長符号化して係数符号列を生成し、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および、前記ヘッダ符号列から構成される中間符号列を出力する一方、第2モードにおいて、前期残差係数の代わりに前記符号化対象画像の信号処理過程において得られる中間画像信号を可変長符号化せずにそのまま係数符号列とし、当該係数符号列および当該係数符号列が中間画像信号であることを示す識別子を少なくとも含むヘッダ符号列から構成される中間符号列を出力し、
    前記第1モードにおいて出力された中間符号列に対して算術符号化し、出力符号列を生成する一方、前記第2モードにおいて出力された中間符号列のうち前記ヘッダ符号列に対してのみ算術符号化し、算術符号化後のヘッダ符号列と前記係数符号列から構成される出力符号列を生成し、を備え、
    前記中間符号列を出力する際、予め定義された特定の符号量以下である中間符号列を出力する動画像符号化方法。
  7. 入力される符号化対象画像をブロック単位で符号化する動画像符号化装置であって、
    前記符号化対象画像に対応する予測画像を生成し、
    前記符号化対象画像と前記生成された予測画像との差分画像を生成し、
    前記差分画像に対して直交変換処理および量子化処理を行い、残差係数を生成し、
    前記残差係数に対して逆量子化処理および逆直交変換処理を行い、残差復号化画像を生成し、
    前記生成された予測画像と前記生成された残差復号化画像とを加算することで再構成画像を生成し、
    第1モードにおいて、前記生成された残差係数を可変長符号化して係数符号列を生成し、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および、前記ヘッダ符号列から構成される中間符号列を出力する一方、第2モードにおいて、前期残差係数の代わりに前記符号化対象画像の信号処理過程において得られる中間画像信号を可変長符号化せずにそのまま係数符号列とし、前記予測画像を生成する際に利用した予測情報を少なくとも含むヘッダ符号列を生成し、前記係数符号列および前記ヘッダ符号列から構成される中間符号列を出力し、
    前記第1モードにおいて出力された中間符号列に対して算術符号化し、出力符号列を生成する一方、前記第2モードにおいて出力された中間符号列のうち前記ヘッダ符号列に対してのみ算術符号化し、算術符号化後のヘッダ符号列と前記係数符号列から構成される出力符号列を生成し、
    前記中間符号列を出力する際、予め定義された特定の符号量以下である中間符号列を出力する動画像符号化方法。
JP2011053080A 2011-03-10 2011-03-10 動画像符号化装置および動画像符号化方法 Withdrawn JP2014103429A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011053080A JP2014103429A (ja) 2011-03-10 2011-03-10 動画像符号化装置および動画像符号化方法
PCT/JP2012/001671 WO2012120910A1 (ja) 2011-03-10 2012-03-09 動画像符号化装置および動画像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011053080A JP2014103429A (ja) 2011-03-10 2011-03-10 動画像符号化装置および動画像符号化方法

Publications (1)

Publication Number Publication Date
JP2014103429A true JP2014103429A (ja) 2014-06-05

Family

ID=46797881

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011053080A Withdrawn JP2014103429A (ja) 2011-03-10 2011-03-10 動画像符号化装置および動画像符号化方法

Country Status (2)

Country Link
JP (1) JP2014103429A (ja)
WO (1) WO2012120910A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017535142A (ja) * 2014-10-01 2017-11-24 クアルコム,インコーポレイテッド ビデオコーディングのためのパイプライン型イントラ予測ハードウェアアーキテクチャ

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101410249B1 (ko) * 2013-05-09 2014-06-20 주식회사 이노와이어리스 Cran에서 du와 ru간 i/q 데이터 압축 및 그 해제 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4240283B2 (ja) * 2002-10-10 2009-03-18 ソニー株式会社 復号装置及び復号方法
JP2009100125A (ja) * 2007-10-15 2009-05-07 Toshiba Corp 符号化装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017535142A (ja) * 2014-10-01 2017-11-24 クアルコム,インコーポレイテッド ビデオコーディングのためのパイプライン型イントラ予測ハードウェアアーキテクチャ

Also Published As

Publication number Publication date
WO2012120910A1 (ja) 2012-09-13

Similar Documents

Publication Publication Date Title
JP5395307B2 (ja) 動画像復号化装置および動画像復号化方法
JP5909305B2 (ja) 符号化方法および符号化装置
US11303910B2 (en) Device and method of video encoding with first and second encoding code
JP5909306B2 (ja) 復号方法および復号装置
JP2014103429A (ja) 動画像符号化装置および動画像符号化方法
JP2012191491A (ja) 動画像復号化装置および動画像復号化方法
JP2012191397A (ja) 動画像復号化装置および動画像復号化方法
JP2012191247A (ja) 動画像符号化装置および動画像符号化方法
JP2012249221A (ja) 動画像符号化装置および動画像符号化方法
JP2012249222A (ja) 動画像符号化装置および動画像符号化方法
JP2012235294A (ja) 動画像復号化装置
JP2012235293A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140603