JP4847423B2 - 動画像符号化装置、および、コンピュータプログラム - Google Patents

動画像符号化装置、および、コンピュータプログラム Download PDF

Info

Publication number
JP4847423B2
JP4847423B2 JP2007244451A JP2007244451A JP4847423B2 JP 4847423 B2 JP4847423 B2 JP 4847423B2 JP 2007244451 A JP2007244451 A JP 2007244451A JP 2007244451 A JP2007244451 A JP 2007244451A JP 4847423 B2 JP4847423 B2 JP 4847423B2
Authority
JP
Japan
Prior art keywords
macroblock
code amount
unit
encoding
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007244451A
Other languages
English (en)
Other versions
JP2009077179A5 (ja
JP2009077179A (ja
Inventor
文貴 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007244451A priority Critical patent/JP4847423B2/ja
Publication of JP2009077179A publication Critical patent/JP2009077179A/ja
Publication of JP2009077179A5 publication Critical patent/JP2009077179A5/ja
Application granted granted Critical
Publication of JP4847423B2 publication Critical patent/JP4847423B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像符号化装置および、コンピュータプログラムに関する。
デジタルビデオカメラの符号化方式やDVDレコーダのデータ符号化方式には、符号化効率の高いMPEG2(Moving Picture Expert Group)が一般的に利用されている。これに対し近年、映像信号のハイビジョン化に伴い、更なる高圧縮・高能率符号化方式としてITU−TRec.H.264|ISO/IEC 14496−10 AVC(JVT、以下H.264と呼ぶ)と呼ばれる標準の規格化が行われている。H.264は、MPEG2やMPEG4といった従来の符号化方式に比べ、より高い符号化効率が実現されることが知られている。
ここで、H.264の動画像符号化装置の構成について図4を用いて説明する。図4のように動画像符号化装置は順番並べ替えを終えたカレントピクチャ(処理対象の現画像)401と、加算器402と、整数変換部403と、量子化部404と、エントロピー符号化部405と、逆量子化部406と、逆整数変換部407と、加算器408を含む。また、ループフィルタ409と、ローカルデコードピクチャ410と、動き予測に使用する参照ピクチャ411と、動き予測部412と、動き補償部413と、イントラ予測部414と、スイッチ415と、量子化制御部416とを含む。
図4を参照して、動画像符号化装置におけるイントラ符号化の処理を説明する。イントラ符号化の場合、画面並べ替えを終えたカレントピクチャ401から画像データをマクロブロック単位で読み出し、イントラ予測部414に供給する。イントラ予測部414では、後述する復号画像情報からイントラ予測画像を生成する。生成されたイントラ予測画像はスイッチ415を通過して加算器402に入力される。加算器402は、カレントピクチャとの差分画像を生成し、該差分画像を整数変換部403に供給する。整数変換部403は、差分画像に対して離散コサイン変換等の整数変換処理を施し、変換係数を量子化部404に供給する。量子化部404は、整数変換部403から供給された変換係数に対して量子化処理を施す。エントロピー符号化部405は、量子化部404で算出された量子化変換係数や量子化スケール等から符号化モードを決定し、この符号化モードに対してエントロピー符号化等の可逆符号化を施し、画像符号化単位のヘッダ情報を形成する。この符号化された符号化モードは、画像圧縮情報として出力される。
量子化部404は、量子化制御部416によって制御される。また、量子化部404は、量子化後の変換係数を逆量子化部406に供給し、逆量子化部406で、その変換係数を逆量子化する。逆整数変換部407は、逆量子化された変換係数に対して逆整数変換処理を施して差分画像を復号し、加算器408に供給する。加算器408は、スイッチ415から出力されたイントラ予測画像と復号された差分画像とを加算して復号画像情報を生成し、ループフィルタ409とイントラ予測部414へ供給する。ループフィルタ409では、復号画像情報からマクロブロック境界ならびに整数変換ブロック境界のブロック歪を除去した後、ローカルデコードピクチャ410として蓄積する。ローカルデコードピクチャ410は、後述するインター符号化時に使用する参照ピクチャ411として利用される。
次にインター符号化の処理を説明する。インター符号化の場合、画像並べ替えを終えたカレントピクチャ401から画像データをマクロブロック単位で読み出し、動き予測部412と動き補償部413とに供給する。動き予測部412と動き補償部413とは、参照用の画像データを参照ピクチャ411から読み出し、動き予測処理と動き補償処理とを施してインター予測画像を生成する。
生成されたインター予測画像はスイッチ415を通過して、加算器402に入力される。加算器402は、カレントピクチャとの差分画像を生成し、該差分画像を整数変換部403に供給する。その後の整数変換、量子化、逆量子化、逆整数変換の流れはイントラ符号化の場合と同じなので省略する。なお、エントロピー符号化部405は、動き予測部412で算出された動きベクトル情報に対してエントロピー符号化等の可逆符号化処理を施し、画像符号化単位のヘッダ部に挿入される情報を形成する。
ここで、エントロピー符号化部405について詳細に説明する。H.264のエントロピー符号化部405では、量子化部404、動き予測部412或いはイントラ予測部414等から入力された量子化係数情報、動き情報或いはモード情報等のシンボルに対し、以下のいずれかのエントロピー符号化が適用される。エントロピー符号化の1つは、CABAC(Context−based Adaptive Binary Arithmetic Coding)と呼ばれるエントロピー符号化(以下、CABAC)である。もう1つは、CAVLC(Context−based Adaptive Variable Length Coding)と呼ばれる可変長符号化(以下、CAVLC)である。このいずれかのエントロピー符号化により、符号化信号(ビットストリーム)が出力される。
どちらのエントロピー符号化方式が適用されるかは、CABAC/CAVLC選択情報により決定される。CABAC/CAVLC選択情報は、PPS(Picture Parameter Set)で決定され、スライス単位に切り替えて使用することが可能である。またCABAC/CAVLC選択情報を含んだPPSは、図7に示すようにビットストリームに埋め込まれて出力される。
上述の2つのエントロピー符号化のうち、CABACについて図5を参照して説明する。
量子化部404、動き予測部412、或いは、イントラ予測部414から入力された量子化変換係数情報、動き情報、或いは、モード情報が多値シンボルとして2値化部501に入力される。2値化部501では、入力された多値シンボルを、予め定められた一定規則にもとづき任意の長さの2値シンボル列に変換する。この2値シンボル列は2値算術符号化部502に入力され、2値算術符号化部502では、入力された2値シンボルに対して2値算術符号化を適用し、その結果をビットストリームとして出力する。
なお、コンテキスト計算部503では、2値化部501に入力されたシンボル情報と2値化部501からの出力である2値信号をもとに、2値信号発生確率を示すコンテキストの計算を行い、2値算術符号化部502に入力する。コンテキスト計算部503では、符号化処理中に随時更新されるコンテキストとリセット時などに用いられるコンテキストの初期状態が保存される。
次に、上述した2つのエントロピー符号化のうちCAVLCについて図6を参照して説明する。
まず、量子化部404や動き予測部412から入力されたモード情報や動き情報、量子化変換係数が多値シンボルとしてとしてVLC算出部601に入力される。VLC算出部601では、従来のMPEGなどで採用されている可変長符号化のように、入力された多値シンボルに対して可変長符号テーブルを適用して、ビットストリームを出力する。
コンテキスト保存部602には、既にVLC算出部601で符号化された情報、例えば、処理中のブロックだけでなく既に処理されたブロックにおける各ブロック内の非0係数の個数(ゼロラン)や直前に符号化された係数の値などが保存される。VLC算出部601は、コンテキスト保存部602からの情報をもとにシンボルに適用する可変長符号テーブルを切り替えることができる。なお、コンテキスト保存部602にはリセット時などに用いられるコンテキストの初期状態も保存される。
CABAC及びCAVLCに着目した先行例として、特許文献1がある。特許文献1に記載された「画像情報符号化方法及び画像情報復号方法」によると、CABACへの入出力データ量を制限し、復号化器の処理時間を保証することを目的とした発明が開示されている。具体的には、CABAC符号化器に入力される2値データの個数のカウンタと、出力されるビットデータの個数のカウンタをそれぞれ独立に有している。そして、制限監視器によって、これらカウンタのうちのどちらか一方でも、あらかじめ設定された閾値を超えてしまった場合、その符号化データは無効であることを示す信号を出力して、再符号化処理する構成が開示されている。
特開2004―135251号公報(図1)
しかしながら、上述したエントロピー符号化にCABACを用いた場合、2値シンボル列1ビットごとに複雑な処理が必要となる。また発生確率をコンテキストの状況に応じて切り替える必要があるため現ビットの符号化が終わらないと次のビットの符号化が行えない。例えば、ピクチャの符号化を行う際に、画面の中央からCABACを行おうとすると、画面上部のCABAC結果から算出された発生確率が分からなければCABACを行うことができない。
よって、CABAC自体の並列化も困難となる。そのため、マクロブロック単位の発生符号量を基に量子化スケールコードを決定する量子化制御部416では、量子化対象マクロブロック直前までのCABAC発生符号量が分からないため、適切な量子化制御を行うことができない。
また、量子化対象マクロブロック直前までのCABAC発生符号量を算出するには、CABACの処理クロックを高めて処理速度を上げることが考えられるが、そのような構成にすると回路規模や消費電力を犠牲にしなければならない。
さらに、従来のCAVLCを用いて上記の問題を解決することも考えられるが、CAVLCは符号化の効率がCABACよりも低く、画質を損ねてしまう。
したがって、前述した従来の特許文献1の提案技術によっても、上記に列挙したような問題点を解決することはできない。
そこで本発明は、上記問題に鑑み、2値化と算術符号化を行うエントロピー符号化手段を用いた構成において、適切な量子化制御が行える動画像符号化技術を提供することを目的とする。
上記課題を解決するための本発明は、
マクロブロックを単位として動画像データの符号化処理を行う動画像符号化装置において、
処理対象の画像の第1のマクロブロックのデータの直交変換を行い直交変換データを生成する直交変換手段と、
前記直交変換データを量子化処理するための量子化パラメータを生成する生成手段と、
生成された前記量子化パラメータに基づき、前記直交変換データの量子化処理を行い、量子化データを生成する量子化手段と、
前記量子化データに対して2値化と算術符号化とを含むCABAC符号化を行って、符号列を出力するエントロピー符号化手段と
を備え、
前記生成手段は、
前記2値化により生成される第1の符号列の、前記処理対象の画像の先頭マクロブロックから前記第1のマクロブロックの直前に処理された第2のマクロブロックまでの第1の累積発生符号量を保持する第1の保持手段と、
前記算術符号化により生成される第2の符号列の、前記先頭マクロブロックから前記処理対象の画像のうち前記算術符号化が完了している第3のマクロブロックまでの第3の累積発生符号量を保持する第2の保持手段と、
前記第3の累積発生符号量と、前記第1の保持手段における前記第1の符号列の前記先頭マクロブロックから前記第3のマクロブロックまでの第4の累積発生符号量との比率を、前記第1の累積発生符号量に乗算することによって、前記算術符号化によって生成される前記第2の符号列の、前記先頭マクロブロックから前記第2のマクロブロックまでの第2の累積発生符号量を予測する予測手段と
を備え、前記第2の累積発生符号量に基づいて前記量子化パラメータを生成する
ことを特徴とする。
本発明によれば、2値化と算術符号化を行うエントロピー符号化手段を用いた構成において、適切な量子化制御が行える動画像符号化技術を提供することができる。
以下、添付する図面を参照して発明の実施形態を説明する。
[第1の実施形態]
発明の第1の実施形態を図1に基づき説明する。本実施形態は、エントロピー符号化であるCABACの中で2値化部と算術符号化部それぞれの累積発生符号量を用いて量子化制御ならびに符号化を行う形態である。
第1の実施形態を図1から図3bに基づき説明する。第1の実施形態における動画像符号化装置は、図1に示すようにカレントピクチャ101と、加算器102と、整数変換部(直交変換部)103と、量子化部104と、エントロピー符号化部(CABAC部)105とを含む。さらに、逆量子化部106と、逆整数変換部(逆直交変換部)107と、加算器108と、ループフィルタ109と、ローカルデコードピクチャ110と、動き予測に使用する参照ピクチャ111と、動き予測部112と、動き補償部113とを含む。さらに、イントラ予測部114と、スイッチ115と、量子化制御部116、符号量予測部117とを含んで構成される。
次に、動画像符号化装置の動作を説明する。なお、基本的な構成は背景技術の欄で説明した図4と同じである。図1において、イントラ符号化の処理を説明する。
イントラ符号化の場合、画面並べ替えを終えたカレントピクチャ101から画像データをマクロブロック単位で読み出し、イントラ予測部114に供給する。イントラ予測部114で後述するローカルデコードピクチャから予測画像を生成する。イントラ予測画像はスイッチ115を通過し、加算器102に入力される。加算器102では、イントラ予測画像とカレントピクチャとの差分画像を生成し、整数変換部103に供給する。整数変換部103は、マクロブロック毎の差分画像に対して直交変換(離散コサイン変換)処理を施し、変換係数(直交変換データ)を量子化部104に供給する。量子化部104は、整数変換部103から供給された変換係数に対して量子化処理を施し、量子化データを生成する。エントロピー符号化部105は、量子化部104で算出された量子化変換係数や量子化スケール等から符号化モードを決定し、この符号化モードに対してエントロピー符号化等の可逆符号化を施し、画像符号化単位のヘッダ情報を形成する。この符号化された符号化モードは、画像圧縮情報として出力される。
量子化部104は、量子化制御部116によって制御される。また、量子化部104は、量子化後の変換係数を逆量子化部106に供給し、逆量子化部106で、その変換係数を逆量子化する。逆整数変換部107は、逆量子化された変換係数に対して逆直交変換処理を施して復号画像情報を生成する。その後、ループフィルタ109でマクロブロック境界ならびに整数変換ブロック境界のブロック歪を除去した後、ローカルデコードピクチャ110として蓄積して、後述するインター符号化時に使用する参照ピクチャ111として利用される。
次にインター符号化の処理を説明する。インター符号化の場合、画像並べ替えを終えたカレントピクチャ101から画像データをマクロブロック単位で読み出し、動き予測部112ならびに動き補償部113に供給する。動き予測部112ならびに動き補償部113は、参照される画像データを参照ピクチャ111から読み出し、動き予測ならびに補償処理を施して参照画像を生成する。スイッチ115はインター予測画像を通過させ、加算器102においてカレントピクチャとの差分を生成し、整数変換部103に供給される。その後の整数変換、量子化、整数逆変換、逆量子化の流れはイントラ符号化を同じなので省略する。
なお、エントロピー符号化部105は、動き予測部112で算出された動きベクトル情報に対してエントロピー符号化等の可逆符号化処理を施し、画像符号化単位のヘッダ部に挿入される情報を形成する。ここで、エントロピー符号化部105においてCABAC/CAVLC選択情報はPPS(Picture Parameter Set)で決められ、スライス単位に切り替えて使用することが可能である。またCABAC/CAVLC選択情報を含んだPPSは図7に示すようにビットストリームに埋め込まれて出力される。本実施形態ではCABACを用いた場合を想定しているので、PPSにはCABACを選択したことを明示するフラグを挿入する。
量子化制御部116は、図示しない符号量制御部で算出されたピクチャやスライスの目標符号量と、マクロブロック毎にエントロピー符号化部105から算出された発生符号量の積算値との関係から目標となる符号量になるように量子化パラメータを決定する。なお、このような量子化制御方式はMPEG2テストモデル(TM5)のステップ2で利用されているものと同等のものでありここでの説明は省略する。また、量子化パラメータの計算式はTM5ベース以外のものでも構わない。
この時、量子化制御部116には直前のマクロブロックまでのエントロピー符号化部105が算出した発生符号量が必要となる。しかし、CABACでは発生確率をコンテキストの状況に応じて切り替える必要があるため、量子化対象マクロブロック直前までの発生符号量が算出されていない可能性がある。
そこで本実施形態では、量子化対象マクロブロック直前までの算術符号列の累積発生符号量を、符号量予測部117において予測して用いる。符号量予測部117における符号量の予測処理について、図2と図3aおよび図3bとを参照してより詳細に説明する。
図2は符号化処理対象画像であるカレントピクチャ101をマクロブロックごとに分割して、マクロブロック間の関係を説明するための図である。図2において、マクロブロック201は、量子化対象マクロブロックであって、画像の先頭マクロブロック204からラスタスキャン順で数えてN番目(Nは0以上の整数)のマクロブロック(第1のマクロブロック)とする。マクロブロック202は、量子化対象マクロブロック201の(ラスタスキャン順で)直前のマクロブロックであり、画像の先頭マクロブロック204から数えて(N−1)番目のマクロブロック(第2のマクロブロック)とする。
また、マクロブロック203は、量子化対象マクロブロック201に対して整数変換、量子化を行っている際に、エントロピー符号化部105の算術符号化が終了したマクロブロック(第3のマクロブロック)である。マクロブロック203は、画像の先頭マクロブロック204から数えてラスタスキャン順でM番目(Mは0以上の整数でかつM≦N)のマクロブロックとする。
図3aは2値符号列の累積発生符号量と算術符号列の累積発生符号量との関係を示す図である。横軸にマクロブロックナンバー、縦軸にエントロピー符号化部105で発生した2値符号列の累積発生符号量ならびに算術符号列の累積発生符号量を表している。
横軸のマクロブロックナンバーにおいて、N番目は、図2の量子化対象マクロブロック201に対応する。同様に、(N−1)番目は、量子化対象マクロブロック201の直前のマクロブロック202に対応する。M番目も同様に、エントロピー符号化部105の算術符号化が終了したマクロブロック203に対応する。
累積発生符号量301は、1番目のマクロブロック204から(N−1)番目のマクロブロック202までに発生した2値符号列(第1の符号列)の累積発生符号量(第1の累積発生符号量)を示す。この2値符号列の累積発生符号量は、符号量予測部117が有する2値符号列用の符号量保持部(第1の保持手段)に保持されている符号量から求めることができる。符号量予測部117は、エントロピー符号化部105において、2値化処理が行われる度に、エントロピー符号化部105から2値符号列の発生符号量を取得して保持していく。2値符号列用の符号量保持部は、先頭マクロブロック204から2値化処理済みの最新のマクロブロックまでの符号量を、マクロブロックナンバーと関連づけて保持することができる。なお、本実施形態では、処理対象のマクロブロック201の直前のマクロブロック202が2値化処理済みの最新のマクロブロックとなる。よって、累積発生符号量301は、先頭マクロブロック204から(N−1)番目のマクロブロック202までの符号量を積算して求めることができる。
次に、累積発生符号量302は、1番目のマクロブロック204から(N−1)番目のマクロブロック202までに発生する算術符号列(第2の符号列)の累積発生符号量(第2の累積発生符号量)の予測値を示す。なお、ここでの予測方法の詳細は、後述する。
累積発生符号量303は、1番目のマクロブロック204からM番目のマクロブロック203までに発生した2値符号列(第1の符号列)の累積発生符号量(第4の累積発生符号量)を示す。この累積発生符号量303は、上述の2値符号列用の符号量保持部に保持されている情報を利用して、先頭マクロブロック204からM番目のマクロブロック203までの符号量を積算して求めることができる。
また、累積発生符号量304は、1番目のマクロブロック204からM番目のマクロブロック203までに発生した算術符号列(第2の符号列)の累積発生符号量(第3の累積発生符号量)である。この算術符号列の累積発生符号量は、符号量予測部117が有する算術符号列用の符号量保持部(第2の保持手段)に保持されている符号量から求めることができる。符号量予測部117は、エントロピー符号化部105において、算術符号化が行われる度に、エントロピー符号化部105から算術符号列の発生符号量を取得して保持していく。算術符号列用の符号量保持部は、先頭マクロブロック204から算術符号化済みの最新のマクロブロックまでの符号量を、マクロブロックナンバーと関連づけて保持することができる。なお、本実施形態ではM番目のマクロブロック203が算術符号化処理済みの最新のマクロブロックとなる。よって、累積発生符号量304は、先頭マクロブロック204からM番目のマクロブロック202までの符号量を積算して求めることができる。
本実施形態では、エントロピー符号化部105としてCABACを用いる場合を説明するが、背景技術の欄で図5を参照して説明したように、CABACは大きく2値化部と算術符号化部とで構成される。
2値化部では、入力される信号列に対して所定のルールの下で2値化を行うだけなので、先頭マクロブロックから(N−1)番目のマクロブロックまでの2値符号列の累積発生符号量301は、N番目のマクロブロックの処理段階で確定している。一方、算術符号化部では、上述のように(N−1)番目のマクロブロックまでの算術符号列の累積発生符号量302が、N番目のマクロブロック処理時点で算出されていない可能性がある。ただし、M番目のマクロブロックまでの算術符号化が終了しているとすると、M番目のマクロブロックにおける2値符号列の累積発生符号量303と算術符号列の累積発生符号量304とは確定している。
そこで、量子化対象マクロブロック201の量子化パラメータを算出するのに必要な(N−1)番目までに発生した算術符号列の累積発生符号量302を、以下のようにして符号量予測部117において予測する。まず、M番目のマクロブロックまでに発生した2値符号列の累積発生符号量303と、算術符号列の累積発生符号量304とを用いて比率の算出を行う。次に、(N−1)番目までに発生した2値符号列の累積発生符号量301と、算出した比率との乗算を行って、算術符号列の累積発生符号量302を予測する。
ここで、累積発生符号量301をC2n-1、累積発生符号量302をCan-1、累積発生符号量303をC2m、累積発生符号量304をCamとする。このとき、累積発生符号量302Can-1は、次の式1で求まる。
an-1=(Cam/C2m)×C2n-1・・・式1
このようにして予測された累積発生符号量302を用いて、量子化制御部116は量子化対象マクロブロックであるN番目のマクロブロック201の量子化パラメータを算出する。該量子化パラメータに基づき量子化部104で行われた量子化により生成される量子化信号列は、エントロピー符号化部105へ入力され、エントロピー符号化を行った後に、所定のヘッダ等を付加してストリームとして本動画像符号化装置から出力される。
また、N番目のマクロブロックで発生した2値符号列の発生符号量は2値符号列の累積発生符号量に加算されて、(N+1)番目以降のマクロブロックにおける算術符号列の累積発生符号量の予測に使用される。
図3bは、本実施形態に対応する累積発生符号量の予測処理の一例を示すフローチャートである。
当該処理は、符号量予測部117において実現される。該符号量予測部117は、対応する処理プログラムをプロセッサにより実行することにより、フローチャートに対応する予測処理を実現することができる。
まず、ステップS301では、算術符号列用の符号量保持部(第2の保持手段)に保持されている符号量に基づき、算術符号化が終了しているマクロブロックナンバー:Mを特定する。本実施形態では、図2を参照して説明したように、先頭からM番目のマクロブロックまで算術符号化が完了している場合を想定して説明する。
次に、ステップS302では、先頭マクロブロックから上記M番目のマクロブロックまでの、2値符号列の累積発生符号量:C2mを2値符号列用の符号量保持部に保持されている符号量に基づいて算出する。それと同時に、先頭マクロブロックからM番目のマクロブロックまでの算術符号列の累積発生符号量Camを算術符号列用の符号量保持部に保持されている符号量に基づいて算出する。
続く、ステップS303では、先頭マクロブロックから、(N−1)番目のマクロブロックまでの2値符号列の累積発生符号量:C2n-1を2値符号列用の符号量保持部に保持されている符号量に基づいて算出する。
続くステップS304では、ステップS302およびS303で算出した各符号量の値を用いて、先頭マクロブロックから(N−1)番目のマクロブロックまでの、算術符号列の累積発生符号量Can-1を算出する。その後、処理を終了する。
本実施形態によれば、量子化パラメータを算出するために必要な累積発生符号量を、既に確定された2値符号列の累積発生符号量と算術符号列の累積発生符号量とに基づいて予測することができる。
[第2の実施形態]
次に、発明の第2の実施形態について説明する。本実施形態は、エントロピー符号化であるCABACの中で2値化部と算術符号化部それぞれの累積発生符号量を用いて量子化制御ならびに符号化を行う点で第1の実施形態と共通する。しかし、本実施形態では、処理対象マクロブロックと算術符号化が終了しているマクロブロックとの関係に応じて算術符号列の累積発生符号量の予測方法を変更する点が異なる。
本実施形態に対応する動画像符号化装置は、第1の実施形態における図1の動画像符号化装置と同様の構成を有するので、詳細な説明は省略する。
第1の実施形態では、N番目のマクロブロック201と、M番目のマクロブロック203が同一の画像に属する場合に、(N−1)番目のマクロブロック202までに発生した算術符号列の累積発生符号量を予測した。この場合、同一画像内でN番目とM番目とで遅延があったとしても、同一ピクチャ(同一画像)内であるのでピクチャタイプが同じことや、CABACに使用する発生確率の状態に連続性があるために予測が正確に行える。
しかしながら、量子化対象マクロブロックと算術符号化が終了したマクロブロックが同一ピクチャでない場合、即ち1つ以上前のピクチャのマクロブロックに対して算術符号化を行っていた場合には、状況が異なってくる。この場合、算術符号化を行っているピクチャのピクチャタイプは処理対象ピクチャのピクチャタイプと一致するとは限らない。よって、ピクチャタイプや発生確率の状態に連続性がなくなるために、算術符号化が終了しているマクロブロックまでの2値符号列の累積発生符号量と、算術符号列の累積発生符号量とを利用しても、精度良く予測を行うことは難しい。
そこで、本実施形態では、エントロピー符号化を行う際にピクチャタイプ別に比率を学習していき、符号量予測部117が、ピクチャタイプ毎の比率データとして、比率データ保持部(第3の保持手段)に保持しておく。そして、該比率データ保持部に保持された比率データの中から、処理対象の画像のピクチャタイプに応じたデータを選択して、算術符号列の累積発生符号量の予測を行う。なお、各ピクチャタイプに対応する比率データは、学習により得られたものではなく、予め与えられたものであっても良い(第4の保持手段)。
なお、ピクチャタイプには、I(イントラ)ピクチャ、P(順方向予測)ピクチャ、B(双予測)ピクチャがある。
より具体的に図2、図3aおよび図3cを参照して説明する。エントロピー符号化部105の算術符号化が終了したマクロブロック203が、処理対象の現画像(カレントピクチャ)には含まれず、より以前に処理された画像に含まれる場合を考える。この場合、符号量予測部117はマクロブロック202の2値符号列の累積発生符号量301は保持していても、処理対象の現画像の算術符号列の累積発生符号量304は有しない。そこで、現画像のピクチャタイプに基づき、符号量予測部117が保持する該ピクチャタイプの比率データを選択して、選択した比率データと累積発生符号量301とに基づいて、算術符号列の累積発生符号量304を予測する。
また、符号量予測部117は、処理対象の画像の直前に処理された画像の比率データについてピクチャタイプ毎に保持しておくことができる。即ち、既に符号化されたIピクチャ、Pピクチャ、Bピクチャの画像について、それぞれの比率データを、比率データ保持部(第3の保持手段)に保持しておく。そして、処理対象の現画像のピクチャタイプに応じて、保持している各比率データのいずれかを選択して、算術符号列の累積発生符号量304を予測することができる。
図3cは、本実施形態に対応する累積発生符号量の予測処理の一例を示すフローチャートである。
当該処理は、符号量予測部117において実現される。該符号量予測部117は、対応する処理プログラムをプロセッサにより実行することにより、フローチャートに対応する予測処理を実現することができる。
まず、ステップS311では、算術符号列用の符号量保持部(第2の保持手段)に保持されている符号量に基づき、算術符号化が終了しているマクロブロックを特定する。本実施形態では、処理対象のマクロブロック201が属するカレントピクチャ以前のピクチャに該算術符号化が終了しているマクロブロックが存在している場合を想定して説明する。
次に、ステップS312では、該算術符号化が終了しているマクロブロックがカレントピクチャ外に存在するか否かを判定する。もし、カレントピクチャ外に存在する場合は(ステップS312において「YES」)、ステップS313に移行する。一方、カレントピクチャ内に存在する場合には図3bのステップS301に移行する。
次に、ステップS313では、カレントピクチャのピクチャタイプを判定する。さらに、ステップS314では、判定されたピクチャタイプに応じた比率データRpを取得する。なお、比率データは、I(イントラ)ピクチャ、P(順方向予測)ピクチャ、B(双予測)ピクチャのそれぞれのピクチャタイプに応じたものが、符号量予測部117の比率データ保持部(第3の保持手段)に保持されている。
続く、ステップS315では、先頭マクロブロックから、(N−1)番目のマクロブロックまでの2値符号列の累積発生符号量:C2n-1を2値符号列用の符号量保持部に保持されている符号量に基づいて算出する。
続くステップS316では、先頭マクロブロックから(N−1)番目のマクロブロックまでの、算術符号列の累積発生符号量Can-1を算出する。ここでは、ステップS314で取得したピクチャタイプに対応する比率データRpと、ステップS315で算出した符号量C2n-1とを利用する。その後、処理を終了する。
以上によれば、算術符号化が終了したマクロブロックが現画像内に存在しない場合であっても、直前のマクロブロックまでの累積発生符号量を予測して、量子化パラメータを算出することができる。
[その他の実施形態]
本発明の目的は、前述した機能を実現するコンピュータプログラムのコードを記録した記憶媒体を、システムに供給し、そのシステムがコンピュータプログラムのコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたコンピュータプログラムのコード自体が前述した実施形態の機能を実現し、そのコンピュータプログラムのコードを記憶した記憶媒体は本発明を構成する。また、そのプログラムのコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した機能が実現される場合も含まれる。
さらに、以下の形態で実現しても構わない。すなわち、記憶媒体から読み出されたコンピュータプログラムコードを、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込む。そして、そのコンピュータプログラムのコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行って、前述した機能が実現される場合も含まれる。
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するコンピュータプログラムのコードが格納されることになる。
発明の実施形態に対応する動画像符号化装置の構成の一例を示す図である。 発明の実施形態に対応する、マクロブロックの関係を説明するための図である。 発明の実施形態に対応する、2値符号列の累積発生符号量と算術符号列の累積発生符号量との関係の一例を示すグラフである。 発明の第1の実施形態に対応する算術符号列の累積発生符号量の予測処理の一例を示すフローチャートである。 発明の第2の実施形態に対応する算術符号列の累積発生符号量の予測処理の一例を示すフローチャートである。 従来の動画像符号化装置の構成を示す図である。 エントロピー符号化器であるCABACの構成を示す図である。 エントロピー符号化器であるCAVLCの構成を示す図である。 符号化ストリームを説明するための図である。
符号の説明
101 カレントピクチャ
102 加算器
103 整数変換部
104 量子化部
105 エントロピー符号化部
106 逆量子化部
107 逆整数変換部
108 加算器
109 ループフィルタ
110 ローカルデコードピクチャ
111 参照ピクチャ
112 動き予測部
113 動き補償部
114 イントラ予測部
115 スイッチ
116 量子化制御部
117 符号量予測部

Claims (3)

  1. マクロブロックを単位として動画像データの符号化処理を行う動画像符号化装置において、
    処理対象の画像の第1のマクロブロックのデータの直交変換を行い直交変換データを生成する直交変換手段と、
    前記直交変換データを量子化処理するための量子化パラメータを生成する生成手段と、
    生成された前記量子化パラメータに基づき、前記直交変換データの量子化処理を行い、量子化データを生成する量子化手段と、
    前記量子化データに対して2値化と算術符号化とを含むCABAC符号化を行って、符号列を出力するエントロピー符号化手段と
    を備え、
    前記生成手段は、
    前記2値化により生成される第1の符号列の、前記処理対象の画像の先頭マクロブロックから前記第1のマクロブロックの直前に処理された第2のマクロブロックまでの第1の累積発生符号量を保持する第1の保持手段と、
    前記算術符号化により生成される第2の符号列の、前記先頭マクロブロックから前記処理対象の画像のうち前記算術符号化が完了している第3のマクロブロックまでの第3の累積発生符号量を保持する第2の保持手段と、
    前記第3の累積発生符号量と、前記第1の保持手段における前記第1の符号列の前記先頭マクロブロックから前記第3のマクロブロックまでの第4の累積発生符号量との比率を、前記第1の累積発生符号量に乗算することによって、前記算術符号化によって生成される前記第2の符号列の、前記先頭マクロブロックから前記第2のマクロブロックまでの第2の累積発生符号量を予測する予測手段と
    を備え、前記第2の累積発生符号量に基づいて前記量子化パラメータを生成する
    ことを特徴とする動画像符号化装置。
  2. 前記第2の保持手段により保持される前記第3の累積発生符号量は、マクロブロックの前記算術符号化が行われる度に更新されるものであって、前記第3のマクロブロックは、前記第1のマクロブロックが前記量子化処理される時点で前記算術符号化が完了している最新のマクロブロックであることを特徴とする請求項1に記載の動画像符号化装置。
  3. コンピュータを、請求項1又は2に記載の動画像符号化装置として動作させるための、コンピュータプログラム。
JP2007244451A 2007-09-20 2007-09-20 動画像符号化装置、および、コンピュータプログラム Expired - Fee Related JP4847423B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007244451A JP4847423B2 (ja) 2007-09-20 2007-09-20 動画像符号化装置、および、コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007244451A JP4847423B2 (ja) 2007-09-20 2007-09-20 動画像符号化装置、および、コンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2009077179A JP2009077179A (ja) 2009-04-09
JP2009077179A5 JP2009077179A5 (ja) 2010-08-26
JP4847423B2 true JP4847423B2 (ja) 2011-12-28

Family

ID=40611731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007244451A Expired - Fee Related JP4847423B2 (ja) 2007-09-20 2007-09-20 動画像符号化装置、および、コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP4847423B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8755615B2 (en) * 2009-09-04 2014-06-17 Koninklijke Philips N.V. Scalable image coding and decoding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4240283B2 (ja) * 2002-10-10 2009-03-18 ソニー株式会社 復号装置及び復号方法
JP4622804B2 (ja) * 2005-10-26 2011-02-02 ソニー株式会社 符号化装置、符号化方法およびプログラム
JP4828925B2 (ja) * 2005-11-30 2011-11-30 パナソニック株式会社 符号化装置

Also Published As

Publication number Publication date
JP2009077179A (ja) 2009-04-09

Similar Documents

Publication Publication Date Title
US10750177B2 (en) Image coding apparatus, image coding method, and program, and image decoding apparatus, image decoding method, and program
KR101031561B1 (ko) 부호화 장치 및 부호화 방법
CN100495931C (zh) 信号编码及译码方法、信号编码及译码装置
KR101538837B1 (ko) 변환 유닛 내의 다수 부호 비트 은폐
JP5983704B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2007300455A (ja) 算術符号化装置、および算術符号化装置におけるコンテキストテーブル初期化方法
JP6708211B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP4847423B2 (ja) 動画像符号化装置、および、コンピュータプログラム
JP2008289105A (ja) 画像処理装置およびそれを搭載した撮像装置
JP2008160402A (ja) 符号化装置及び方法並びに画像符号化装置
RU2782400C2 (ru) Способ кодирования и декодирования изображений, устройство кодирования и декодирования и соответствующие компьютерные программы
JP4561701B2 (ja) 動画像符号化装置
JP2009081728A (ja) 動画像符号化装置、動画像符号化装置の制御方法、および、コンピュータプログラム
JP2008153802A (ja) 動画像符号化装置及び動画像符号化プログラム
JP2025102933A (ja) 画像データの符号化及び復号化
CN116998151A (zh) 一种编码方法、解码方法、编码器、解码器以及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100709

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100709

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110916

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111013

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4847423

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees