JP4537186B2 - 符号化モード判定装置及び方法 - Google Patents

符号化モード判定装置及び方法 Download PDF

Info

Publication number
JP4537186B2
JP4537186B2 JP2004351520A JP2004351520A JP4537186B2 JP 4537186 B2 JP4537186 B2 JP 4537186B2 JP 2004351520 A JP2004351520 A JP 2004351520A JP 2004351520 A JP2004351520 A JP 2004351520A JP 4537186 B2 JP4537186 B2 JP 4537186B2
Authority
JP
Japan
Prior art keywords
spatial
mode determination
statistic
coding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004351520A
Other languages
English (en)
Other versions
JP2006165799A (ja
Inventor
正樹 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004351520A priority Critical patent/JP4537186B2/ja
Publication of JP2006165799A publication Critical patent/JP2006165799A/ja
Application granted granted Critical
Publication of JP4537186B2 publication Critical patent/JP4537186B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像信号を圧縮符号化する動画像符号化装置に好適に用いることのできる符号化モード判定装置及び方法に関する。
動画像は情報量が多いため、記録・伝送するにあたり、情報を圧縮する技術が必要になる。動画像圧縮技術の代表例として“ITU勧告H.261 オーディオビジュアル・サービス用ビデオ符号化”などのハイブリッド符号化方式が挙げられ、これらの方式はフレーム間冗長情報を削減する(以下、インタ符号化)ことにより高圧縮を達成している。しかし、常にフレーム間冗長情報を削減する事が最適な圧縮を促すものでなく、フレーム間の冗長情報を削減するより、フレーム内の冗長情報を削減(以下、イントラ符号化)した方が、高圧縮につながる場合がある。そのため、インタ符号化とイントラ符号化のどちらを用いた方がよいかを判定する符号化モード判定には、高精度であることが望まれている。
図8は、従来の動画像符号化装置の構成例を示すブロック図である。
動画像入力部100には、時間方向に連続する複数フレームで構成されるデジタル動画像が入力される。動画像入力部100から入力された動画像は小さな矩形領域(例えば8x8画素,16x16画素など)に分割され、カラー動画像の場合はマクロブロックと呼ばれる矩形領域単位で符号化を行う(マクロブロックは一つ以上の矩形領域で構成される)。
以下では、入力動画像がカラー画像である事を想定し、マクロブロック単位で処理を行う。動きベクトル検出部109では、画像入力部100からの現フレームの画像データと、フレームメモリ108に記憶された前フレームの局所復号化画像を参照して、マクロブロック単位で動きベクトル検出を行う。この際、符号化対象ブロックの周囲±15画素の範囲で、ブロックマッチングを行い、各輝度の予測誤差の平均絶対値が最小のブロックを予測ブロックとして、動きベクトルを検出する。
フレームメモリ108には、予測画像保持部111の画像情報と、減算部101、セレクタ1(116)、直交変換部103、量子化部104、逆量子化部105、逆直交変換部106を経た差分信号の局所復号化情報とを加算部107で加算した再生フレーム(参照フレーム)を蓄積する領域がある。動き補償部110は、動きベクトル検出部109により検出された動きベクトルを用いて、フレームメモリ108に蓄積された参照フレームから予測ブロックを検出し、予測画像保持部111に出力する。予測画像保持部111は、蓄積している予測画像を減算部101とセレクタ2(117)に出力する。セレクタ2(117)は、符号化モード判定部102から送られるモード判定情報に基づき、予測画像保持部111の画像データを加算部107へ送る。
減算部101は、動画像入力部100から入力される符号化対象ブロックと、予測画像保持部111からの予測画像ブロックから予測誤差を算出し、セレクタ1(116)へ予測誤差を送る。セレクタ1(116)では、符号化モード判定部102の制御により、減算部101から出力された予測誤差か、動画像入力部100から減算部101を通らずに供給される原画像のいずれかを、符号化単位であるマクロブロック単位で直交変換部103に出力する。直交変換部103では、DCT変換によって直交変換が行われる。量子化部104では、レート制御部112(後述)から出力される量子化制御信号に基づき、スカラー量子化が行われ、量子化後の値を可変長符号化部113と逆量子化部105に出力する。可変長符号化部113では、量子化部104で量子化された値を可変長符号化し、バッファ114へ出力する。バッファ114では、バッファ内の符号量などの情報をレート制御部112へ出力するとともに、符号データを符号出力部115へ出力する。
レート制御部112では、バッファ114から出力される符号量などの情報に基づき、量子化部104に量子化制御信号を送る。逆量子化部105では、量子化部104で量子化された値を逆量子化し、逆量子化された値を逆直交変換部106へ出力する。逆直交変換部106では、直交化された予測誤差信号を逆直交化し、加算部107に出力する。加算部107は、逆直交変換部106の出力と、予測画像保持部111の出力を加算し符号化対象ブロックを再生し、フレームメモリ108に出力する
上述のように、符号化モード判定部102の判定精度は符号化結果の画質に影響を及ぼす。そこで、図9に符号化モード判定部102の構成例を示し、その具体的な処理についてさらに説明する。符号化モード判定部102には、フレーム単位で、フレーム内符号化とフレーム間符号化の選択を行う処理部と、マクロブロック単位でフレーム内符号化とフレーム間符号化の選択(以下、イントラインタ判定)を行う処理部が存在するが、フレーム単位の選択はIPPIPP....(I=フレーム内符号化、P=フレーム間符号化)という固定パターンで繰り返すものとして、フレーム単位の判定を行う処理部は図9では省略している。従って、図9にはマクロブロック単位の符号化方法選択に関する構成が示されている。
統計量第一算出部150と統計量第二算出部151はそれぞれ、原画像と差分画像に関する、輝度もしくは周波数空間上の統計量をマクロブロック単位で算出し、算出結果は統計量比較部152にて比較される。符号化モードセレクタ153は、統計量比較部152での比較結果に基づき、イントラ符号化、インタ符号化のいずれかを選択して、選択された符号化モードをセレクタ1(116)及びセレクタ2(117)へ送信する。セレクタ1(116)は、符号化モード判定部102から判定結果が通知されるまで原画像と差分画像を保持し、通知された符号化モードに応じ、イントラ符号化では原画像を、インタ符号化では差分画像を直交変換部103へ出力する。
図10はこのような符号化モード判定部102のより具体的な処理の流れの例を示すフローチャートである。
符号化モード判定が開始されると(ステップS1000)、符号化対象のマクロブロックをイントラ符号化した時の発生符号量とインタ符号化した時の発生符号量を予測するために、統計量第一算出部150では、原画像のマクロブロックIMbに関する空間統計量Istatを、統計量第二算出部151では予測誤差のマクロブロックPMbに関する統計量Pstatを算出し(ステップS1001)する。統計量比較部152ではIstatとPstatの大小を比較する(ステップS1002)。
Pstatと”PMbの発生符号量”、Istatと”Imbの発生符号量”は比例関係であると仮定すると、Pstat<Istatの場合には仮定より予測誤差の方が発生符号量は少ないことになり、符号化モードセレクタ153では、インタ符号化が選択され(ステップS1003)、逆にIstatの方が小さい場合、符号化モードセレクタ153では、イントラ符号化が選択される(ステップS1004)。インタ符号化、イントラ符号化いずれかが選択されるとモード判定は終了する(ステップS1005)。
IMbとPMbを実際に符号化し、発生した符号量Icode,PcodeをそれぞれIstat,Pstatとし、発生符号量の小さい方を選択すると、符号量の観点から最適なモード判定となるが、実際に符号化すると処理能力を大きく費やすことになるため、簡単な近似式で発生符号量を予測する事が多い。
例えば、ISOで標準化されているMPEG2 Test Model 5では、IstatとPstatを輝度の分散や絶対和として発生符号量を見積もり、モード判定を行っている。また、特許文献1には、IMbとPMbを直交変換し、周波数空間上の係数の統計量をIstat,Pstatとして符号量を予測することが記載されている。
特開2000−341697号公報(段落0033)
しかしながら、輝度の分散や絶対和などでモード判定する場合、計算コスト(計算負荷もしくは計算に必要な能力資源)は少ないが、シーンチェンジのように極端な輝度の変化がなければ正確なモード判定は困難である。また、周波数空間上の係数の統計量でモード判定する場合、精度良くモード判定できるが、計算コストが上昇する。
本発明はこのような従来技術の課題を解決し、計算コストを抑えながら良好な判定精度を得ることが可能な符号化モード判定装置及び方法を実現することにある。
上述の目的は、フレーム内符号化、フレーム内符号化、フレーム間符号化のいずれを行うかを判定する符号化モード判定装置であって、原画像信号のフレーム内信号の空間統計量を算出する第1の空間統計量算出手段と、フレーム内信号の周波数統計量を算出する第1の周波数統計量算出手段と、原画像信号と予測画像信号との差分信号の空間統計量を算出する第2の空間統計量算出手段と、差分信号の周波数統計量を算出する第2の周波数統計量算出手段と、第1及び第2の空間統計量算出手段が算出した空間統計量の差の絶対値と所定の閾値との大少関係を判定する判定手段と、判定手段によって、第1及び第2の空間統計量算出手段が算出した空間統計量の差の絶対値が所定の閾値以上と判定された原画像信号については、第1及び第2の空間統計量算出手段が算出した空間統計量の大小関係に応じてフレーム内符号化及びフレーム間符号化の一方を選択し、判定手段によって第1及び第2の空間統計量算出手段が算出した空間統計量の差の絶対値が所定の閾値よりも小さいと判定された原画像信号については、第1及び第2の周波数統計量算出手段が算出した周波数統計量の大小関係に応じてフレーム内符号化及びフレーム間符号化の一方を選択するモード判定手段とを有することを特徴とする符号化モード判定装置によって達成される。
また、上述の目的は、フレーム内符号化、フレーム間符号化のいずれを行うかを判定する符号化モード判定方法であって、原画像信号のフレーム内信号の空間統計量を算出する第1の空間統計量算出工程と、フレーム内信号の周波数統計量を算出する第1の周波数統計量算出工程と、原画像信号と予測画像信号との差分信号の空間統計量を算出する第2の空間統計量算出工程と、差分信号の周波数統計量を算出する第2の周波数統計量算出工程と、第1及び第2の空間統計量算出工程が算出した空間統計量の差の絶対値と所定の閾値との大少関係を判定する判定工程と、判定工程によって、第1及び第2の空間統計量算出工程が算出した空間統計量の差の絶対値が所定の閾値以上と判定された原画像信号については、第1及び第2の空間統計量算出工程が算出した空間統計量の大小関係に応じてフレーム内符号化及びフレーム間符号化の一方を選択し、判定工程によって、第1及び第2の空間統計量算出工程が算出した空間統計量の差の絶対値が所定の閾値よりも小さいと判定された原画像信号については、第1及び第2の周波数統計量算出工程が算出した周波数統計量の大小関係に応じてフレーム内符号化及びフレーム間符号化の一方を選択するモード判定工程とを有することを特徴とする符号化モード判定方法によっても達成される。
さらに、上述の目的は、本発明の符号化モード判定方法をコンピュータに実行させるプログラム及びこのプログラムを格納したコンピュータ読み取り可能な記録媒体によっても達成される。
このような構成により、本発明によれば、計算コストを抑えながら良好な判定精度を得ることが可能となる。
以下、図面を参照して本発明の好適な実施形態について説明する。
<第1の実施形態>
本発明の第1の実施形態に係る動画像符号化装置の基本的な構成は、符号化モード判定部以外は図8を用いて説明した従来構成と同等でよい。従って、以下の説明においては本実施形態における符号化モード判定部についてのみ説明する。
また、本実施形態において用いるフレーム間符号化方式は、説明及び理解を容易にするため、動きベクトルを用いた簡単な方式を例にとって説明する。しかし、これに限定されることなく、例えば、MPEG2、MPEG4符号化で用いられるようなフレーム間符号化方式に適用することも可能である。
図1は、本実施形態における符号化モード判定部の構成例を示すブロック図である。
符号化モード判定部は、原画像をマクロブロック毎に入力する原画像入力部209、差分画像をマクロブロック毎に入力する差分画像入力部210、原画像のマクロブロックの輝度絶対和を算出する空間統計量第一算出部201、差分画像のマクロブロックの輝度絶対和を算出する空間統計量第二算出部202、絶対和の比較を行う空間統計量比較部203、モード判定が不安定になるマクロブロックを判定する不安定性検出部204、原画像のマクロブロックに直交変換を施し、係数の統計量を算出する周波数統計量第一算出部205、差分画像のマクロブロックに直交変換を施し、係数の統計量を算出する周波数統計量第二算出部206、係数の統計量を比較する周波数統計量比較部207、空間統計量比較部203と周波数統計量比較部207の結果から最終的にイントラ符号化、インタ符号化のいずれかを選択する符号化モードセレクタ208、選択した符号化方式をセレクタ1(116)、及びセレクタ2(117)に出力するデータ出力部211とを備える。
次に、このような構成を有する符号化モード判定部の動作を、図2のフローチャートに基づき説明する。
まず、空間統計量第一算出部201では、原画像入力部209から入力されたマクロブロック単位の原画像データから、輝度の絶対和SMAEintraを算出する。同様に、空間統計量第二算出部202では、差分画像入力部210から入力されたマクロブロック単位の差分画像データから、輝度の絶対和SMAEinterを算出する(ステップS2001)。
不安定性検出部204では、空間統計量算出部201、202の出力の差の絶対値ABS(SMAEinter-SMAEintra)と、AxSMAEintra+B(A,Bは正の実数)を求め、その値を比較する(ステップS2002)。そして、大小関係に応じて以下の処理を行う。
1.ABS(SMAEinter-SMAEintra)>=AxSMAEintra+B(ステップS2002、No)の場合
これは、SMAEinterを縦軸に、SMAEintraを横軸とした図3において、太線で囲まれていない領域に対応する。この場合、不安定性検出部204は、モード判定が安定する(符号化対象のマクロブロックが、低精度なモード判定方法でも精度の良いモード判定ができるマクロブロック)と予測し、空間統計量比較部203を起動し、周波数統計量第一算出部205、周波数統計量第二算出部206、周波数統計量比較部207を停止させる。
ここでABS(SMAEinter-SMAEintra)>=AxSMAEintra+Bの意味を説明する。実際に比較したい量は発生符号量であり、理想的にはinterの発生符号量とintraの発生符号量を比較すべきである。しかし、計算量が増えるため、本実施形態では計算が容易なSMAEinterとSMAEintraの比較を行う事によって発生符号量を予測している。具体的にはABS(SMAEinter-SMAEintra)を計算し、結果が正の値ならSMAEintraの方が小さいのでintra符号化の方が、負の値ならinter符号化の発生符号量が小さいと判定することができる。しかし、やはり予測式であるため、実際には大小関係に誤差が含まれる。
この誤差はSMAEinterとSMAEintraの値によって変動する。
どちらかが極端に小さい場合、もしくは大きい場合は、空間統計量同士の比較をすれば符号量同士の比較をした事になる。例えばSMAEinter、SMAEintraが輝度の絶対和の平均なら、それは画像信号のDC成分の概算であるため、極端にお互いの値が異なるなら、発生符号量にも極端な差が生じる。
一方、お互いの値が近い場合、DC成分の値が近いということになるので、大小関係はAC成分から発生する符号量により決定される必要がある。本明細書における不安定領域とはこのような領域であり、具体的にはABS(SMAEinter-SMAEintra)AxSMAEintra+Bを満たす領域である。
そこで、ABS(SMAEinter-SMAEintra)の値と予め決めた誤差THerrorと比較するABS(SMAEinter-SMAEintra)>=THerrorという比較式が考えられる。しかし、SMAEinter、SMAEintraの絶対値によって誤差は変動するので、さらに高精度化することが好ましい。そこで、本実施形態では、絶対値が大きいほど誤差が大きくなるように閾値をSMAEintraに連動させたAxSMAEintra+Bという誤差を用いている。
ここで、誤差の算出に用いるAとBのとりうる値は符号化時の設定レートによって変動するが、A、Bの値が極端に大きいと、不安定領域と検出される領域が拡大し計算量が増えるため、あまり大きな値を使わないことが好ましい。具体的には設定レートによって変更することが好ましいが、例えばA=1、B=0.1という微小な数値でも、効果を得ることができる。
次に、空間統計量比較部203は、SMAEinterとSMAEintraを比較し、SMAEinter<SMAEintraの場合(ステップS2003,Yes)、FLAG=0を、SMAEintra≦SMAEinterの場合(ステップS2003,No)、FLAG=1を符号化モードセレクタ208に送信する。
2.ABS(SMAEinter-SMAEintra)<AxSMAEintra+B(ステップS2002,Yes)の場合
これは、図3において太線で囲まれている領域に対応する。この場合、不安定性検出部204は、モード判定が不安定になる(符号化対象のマクロブロックが、高精度なモード判定方法でないと精度の良いモード判定ができないマクロブロック)と予測し、周波数統計量第一算出部205、周波数統計量第二算出部206及び周波数統計量比較部207を起動させ、空間統計量比較部203を停止させる。
周波数統計量第一算出部205では、原画像入力部209から入力されたマクロブロック単位の画像データの輝度を直交変換し、その係数の絶対和TMAEintraを算出し、周波数統計量第二算出部206では、差分画像入力部210から入力されたマクロブロック単位の差分画像データの輝度を直交変換し、その係数の絶対和TMAEinterを算出する(ステップS2005)。
周波数統計量比較部207では、TMAEinterとTMAEintraを比較し、TMAEinter<TMAEintraの場合(ステップS2006,Yes)、FLAG=0を、TMAEinter≧TMAEintraの場合(ステップS2006,No)、FLAG=1を符号化モードセレクタ208に送信する。
符号化モードセレクタ208では、空間統計量比較部203、周波数統計量比較部207のいずれかから出力されるFLAGの値により、符号化方法を以下(ステップS2004)のように決定し、モード判定を終了する。なお空間統計量比較部203と周波数統計量比較部207は不安定性検出部204に制御されているため、同時に起動されない。
1.FLAG=1の時 イントラ符号化と決定し、原画像入力部209からの情報を直交変換部へ出力するようセレクタ1(116)へ通知する。
2.FLAG=0の時 インタ符号化と決定し、差分画像入力部210からの情報を直交変換部へ出力するようセレクタ1(116)へ通知する。
また、決定した符号化方式はセレクタ2(117)へも通知する。
以上説明したように、本実施形態では、高精度なモード判定方法でなければ精度の良いモード判定ができないマクロブロック群と、低精度モード判定方法でも精度の良いモード判定ができるマクロブロック群を分離し、それぞれのモード判定方法で判定しているため、高精度なモード判定方法だけでモード判定した時よりも高速に判定処理が可能で、低精度モード判定方法だけでモード判定した時よりも高精度な判定処理が可能になるという効果がある。換言すれば、計算コストを抑制しながら、効率の良い符号化方式の判定を行うことが可能である。
なお、本実施形態では、空間統計量として輝度の絶対和を用いたが、輝度の分散や平均値などの統計量を用いてもよい。同様に、周波数統計量として、直交変換の係数の絶対和を用いたが、係数の分散や平均値を用いたり、係数を任意の順番にスキャンして求めた差分の分散を用いたりしてもよい。また、不安定領域判定にAxSMAEintra+Bという閾値を用いたが、SMAEintraの変わりにSMAEinterを用いたAxSMAEinter+Bという閾値を用いても良い。
<第2の実施形態>
次に、第2の実施形態に係る動画像符号化装置について説明する。本発明の第2の実施形態に係る動画像符号化装置の基本的な構成は、符号化モード判定部以外は図8を用いて説明した従来構成と同等でよい。従って、以下の説明においては本実施形態における符号化モード判定部についてのみ説明する。
また、本実施形態において用いるフレーム間符号化方式は、説明及び理解を容易にするため、動きベクトルを用いた簡単な方式を例にとって説明する。しかし、これに限定されることなく、例えば、MPEG2、MPEG4符号化で用いられるようなフレーム間符号化方式に適用することも可能である。
図4は、本実施形態における符号化モード判定部の構成例を示すブロック図であり、図1に示した第1の実施形態に係る符号化モード判定部と同じ構成には同じ参照数字を付した。
符号化モード判定部は、原画像をマクロブロック毎に入力する原画像入力部209、差分画像をマクロブロック毎に入力する差分画像入力部210、原画像のマクロブロックの輝度絶対和を算出する空間統計量第一算出部201、差分画像のマクロブロックの輝度絶対和を算出する空間統計量第二算出部202、絶対和の比較を行う空間統計量比較部203、モード判定が不安定になるマクロブロックを判定する不安定性検出部204、原画像のマクロブロックに直交変換を施し、係数の統計量を算出する周波数統計量第一算出部205、差分画像のマクロブロックに直交変換を施し、係数の統計量を算出する周波数統計量第二算出部206、係数の統計量を比較する周波数統計量比較部207、空間統計量比較部203及び周波数統計量比較部207の比較の結果から、再比較の制御を行う再判定制御部600、再判定制御部600から出力される信号に基づき、閾値を再設定する閾値再設定部601、空間統計量比較部203、周波数統計量比較部207及び再判定制御部600の出力に基づき最終的にインタ符号化とイントラ符号化のいずれかを選択する符号化モードセレクタ208、選択した符号化方式をセレクタ1(116)、及びセレクタ2(117)に出力するデータ出力部211とを備える。
次に、このような構成を有する符号化モード判定部の動作を、図5のフローチャートに基づき説明する。
まず、第1の実施形態と同様、ステップS2001において、SMAEintra及びSMAEinterを算出し、ステップS2002で、ABS(SMAEinter-SMAEintra)とAxSMAEintra+B(A、Bは正の実数)の比較を行う。そして、大小関係に応じて以下の処理を行う。
1.ABS(SMAEinter-SMAEintra)>=AxSMAEintra+Bの場合
この場合、第1の実施形態と同様、不安定性検出部204は、モード判定が安定であると予測し、空間統計量比較部203を起動し、周波数統計量第一算出部205、周波数統計量第二算出部206、周波数統計量比較部207を停止する。
次に、空間統計量比較部203は、SMAEinterとSMAEintraを比較し、SMAEinter<SMAEintraの場合(ステップS2003,Yes)、FLAG=0としインタ符号化を(ステップS5007)、SMAEintra≦SMAEinterの場合(ステップS2003,No)、FLAG=1としイントラ符号化(ステップS5008)をそれぞれ仮決定し、モードセレクタ208に送信する。
2.ABS(SMAEinter-SMAEintra)<AxSMAEintra+Bの場合
この場合、不安定性検出部204は、モード判定が不安定になると予測し、周波数統計量第一算出部205、周波数統計量第二算出部206及び周波数統計量比較部207を起動させ、空間統計量比較部203を停止させる。
周波数統計量第一算出部205では、原画像入力部209から入力されたマクロブロック単位の画像データの輝度を直交変換し、その係数の絶対和TMAEintraを算出し、周波数統計量第二算出部206では、差分画像入力部210から入力されたマクロブロック単位の差分画像データの輝度を直交変換し、その係数の絶対和TMAEinterを算出する。
周波数統計量比較部207では、TMAEinterとTMAEintraを比較し(ステップS2006)、TMAEinter<TMAEintraの場合、FLAG=0としインタ符号化を、TMAEinter≧TMAEintraの場合、FLAG=1としイントラ符号化をそれぞれ決定し、モードセレクタ208に送信する。
ここまで説明した、フレーム内のマクロブロック毎に行う符号化モード決定方法は基本的に第1の実施形態で述べた方法と同じであるが、モード判定が安定であると判定されたマクロブロックに対する符号化モードが仮決定である点で異なる。
次に、再判定制御部600は、フレーム内のイントラ符号化されたマクロブロックの数U[intra]をカウントし、閾値Thと比較する(ステップS5009)。閾値以上(U[intra]≧Th)の場合、現在仮決定している符号化モードが確定する(ステップS5010)。
閾値未満(U[intra]<Th)の場合、ステップS5011において、閾値再設定部601が実数Aを所定の小さな数αだけ増加させる(A=A+α)。この定数Aの更新は、図6のグラフにおいて、不安定さの判定基準を、点線から実線に変更すること(すなわち、より厳しく安定性を判定すること)を意味する。
なお、本実施形態ではA=A+αとして、判定基準の直線を変更したが、Bに所定の小さな値βを加え、B=B+βとする更新方法でもかまわない。また、AとBを同時に変更してもかまわない。
不安定性検出器204では、更新された閾値を用い、不安定性部204で不安定ではないと判定されたマクロブロック(U[Sintra]+U[Sinter])に対して、ステップS2002と同様の不安定性検出処置を再度行う(ステップS5012)。
そして、不安定と判断された(ABS(SMAEinter-SMAEintra)<AxSMAEintra+Bである)マクロブロックに対し、ステップS2006と同様に周波数空間上でのTMAEintraとTMAEinterの比較を行う(ステップS5013)。その結果TMAEinter<TMAEintraの場合、FLAG=0としインタ符号化(ステップS5014)を、TMAEinter≧TMAEintraの場合、FLAG=1としイントラ符号化(ステップS5015)をそれぞれ決定し、モードセレクタ208に送信する。
その後、イントラ符号化が仮決定されるマクロブロックの数が閾値Thを下回るまで(ステップS5017)、閾値Aの再設定、周波数統計量の最比較を繰り返す。
なお、本実施形態においても、第1の実施形態と同様、空間統計量や周波数統計量として他の値を用いても良い。
また、不安定領域判定にAxSMAEintra+Bという閾値を用いたが、SMAEintraの変わりにSMAEinterを用いたAxSMAEinter+Bという閾値を用いても良い。
さらに、変数Aの更新は、イントラ符号化が仮決定されるマクロブロックの数が閾値Thを下回るまでではなく、変数Aの更新回数が所定の回数を超えたらAの更新を終了してもかまわない。
以上説明したように、本実施形態では、符号化モード判定の精度を動的に調整する事が可能であるため、フレーム単位で符号化モード判定の精度を制御できる。よって、符号化モード判定する時間が足りない場合などは精度を落とし、発生符号量を落としたい場合などは精度を上げる等の処理が可能になる。
<第3の実施形態>
図7は、上述の第1又は第2の実施形態に係る動画像符号化装置を例えばパーソナルコンピュータ等の汎用情報処理装置で実現する場合の構成例を示すブロック図である。
図において、動画像符号化装置としての情報処理装置は、装置全体の制御を司るCPU301と、ブートプログラム及びBIOS等を記憶するROM302と、CPU301のワークエリアとして使用されるRAM303を有している。ハードディスク装置等の外部記憶装置304は、OS、画像圧縮処理に係るアプリケーションプログラム(MPEGアプリケーション)等を格納する。画像入力部305は、例えばUSB、IEEE1394などの汎用インタフェースを介して接続されたイメージスキャナ等であるが、画像データが既に記憶媒体に記憶されている場合には、その記憶媒体をアクセスする装置(例えばメモリカードリーダや、光ディスクドライブなど)であってもよいし、画像データがネットワーク上のサーバに存在する場合にはネットワークインタフェースであってもよい。動画像符号化装置はさらに、キーボード(KB)やポインティングデバイス(PD)等の入力デバイス306、ビデオRAMを搭載すると共にそのビデオRAMへの描画処理及びビデオRAMからデータを読出しビデオ信号として出力する表示制御部307、表示制御部307よりのビデオ信号に基づき表示する表示装置308を有する。
上記構成において、電源を投入すると、CPU301はROM302に格納されたブートプログラムに従って外部記憶装置304よりOSをRAM303にロードし、しかる後、上述の実施形態で説明した符号化モード判定処理を含む画像圧縮符号化プログラムをロード、実行することで、画像入力部305より入力した画像データの圧縮符号化データを生成し、外部記憶装置304に格納することになる。なお、最終的に生成された圧縮符号化画像データの出力先は外部記憶装置304ではなく、ネットワークを介して出力しても構わないし、その出力先は問わない。
<他の実施形態>
上述の実施形態においては、符号化モード判定部によって決定した符号化モードをセレクタ1が受信し、直交変換部へ出力するデータを選択していたが、セレクタ1の機能を符号化モード判定部に持たせても良い。この場合、画像入力部100と差分器101からの画像データを直接符号化モードセレクタ208に入力する経路を追加し、符号化モードセレクタ208にバッファを設けて判定処理が終了するまで画像データを記憶しておき、判定結果に応じて原画像データもしくは差分画像データを直交変換部103へ出力するようにすればよい。なお、セレクタ2に対して判定結果を通知する点については変更の必要はない。
また、本実施形態の目的は、上述の実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
尚、第1及び第2の実施形態は、複数の機器(例えば、ホストコンピュータ、インタフェース機器、カメラ、ディスプレイ等)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、カムコーダ、遠隔監視装置等)に適用してもよい。
第1の実施形態に係る動画像符号化装置における符号化モード判定部の構成例を示すブロック図である。 図1の符号化モード判定部の動作を説明するフローチャートである。 第1の実施形態における不安定性検出部の検出域を説明する図である。 第2の実施形態に係る動画像符号化装置における符号化モード判定部の構成例を示すブロック図である。 図4の符号化モード判定部の動作を説明するフローチャートである。 第2の実施形態における不安定性検出部が用いる閾値を説明する図である。 第3の実施形態に係る動画像符号化装置の構成例を示すブロック図である。 従来の動画像符号化装置の構成例を示すブロック図である。 図8の符号化モード判定部の構成例を示すブロック図である。 従来のモード判定部の動作を説明するフローチャートである。

Claims (8)

  1. フレーム内符号化、フレーム間符号化のいずれを行うかを判定する符号化モード判定装置であって、
    原画像信号のフレーム内信号の空間統計量を算出する第1の空間統計量算出手段と、
    前記フレーム内信号の周波数統計量を算出する第1の周波数統計量算出手段と、
    前記原画像信号と予測画像信号との差分信号の前記空間統計量を算出する第2の空間統計量算出手段と、
    前記差分信号の前記周波数統計量を算出する第2の周波数統計量算出手段と、
    前記第1及び第2の空間統計量算出手段が算出した空間統計量の差の絶対値と所定の閾値との大少関係を判定する判定手段と、
    前記判定手段によって、前記第1及び第2の空間統計量算出手段が算出した空間統計量の差の絶対値が前記所定の閾値以上と判定された原画像信号については、前記第1及び第2の空間統計量算出手段が算出した空間統計量の大小関係に応じてフレーム内符号化及びフレーム間符号化の一方を選択し、前記判定手段によって前記第1及び第2の空間統計量算出手段が算出した空間統計量の差の絶対値が前記所定の閾値よりも小さいと判定された原画像信号については、前記第1及び第2の周波数統計量算出手段が算出した周波数統計量の大小関係に応じてフレーム内符号化及びフレーム間符号化の一方を選択するモード判定手段とを有することを特徴とする符号化モード判定装置。
  2. さらに、前記所定の閾値を更新する閾値更新手段と、
    前記判定手段に、前記第1及び第2の空間統計量算出手段が算出した空間統計量の差の絶対値が更新前の前記所定の閾値以上と判定された原画像信号について、更新された前記所定の閾値を用いて再度前記判定を行わせるとともに、前記モード判定手段に、前記判定手段による再判定に基づいて前記選択を行わせる制御手段を更に有することを特徴とする請求項1記載の符号化モード判定装置。
  3. 前記符号化モード判定装置が、マクロブロック単位で処理を行い、前記制御手段が、前記モード判定手段によってフレーム内符号化を選択されたマクロブロックの数が所定数未満となるまで前記所定の閾値の更新と前記再判定並びに前記選択を繰り返し行うように前記閾値更新手段、前記判定手段及び前記モード判定手段を制御することを特徴とする請求項2記載の符号化モード判定装置。
  4. 前記所定の閾値が、前記第1の空間統計量算出手段が算出した空間統計量に基づいて定められることを特徴とする請求項記載の符号化モード判定装置。
  5. 請求項1乃至請求項のいずれか1項に記載の符号化モード判定装置を用いた動画像符号化装置。
  6. フレーム内符号化、フレーム間符号化のいずれを行うかを判定する符号化モード判定方法であって、
    原画像信号のフレーム内信号の空間統計量を算出する第1の空間統計量算出工程と、
    前記フレーム内信号の周波数統計量を算出する第1の周波数統計量算出工程と、
    前記原画像信号と予測画像信号との差分信号の前記空間統計量を算出する第2の空間統計量算出工程と、
    前記差分信号の前記周波数統計量を算出する第2の周波数統計量算出工程と、
    前記第1及び第2の空間統計量算出工程が算出した空間統計量の差の絶対値と所定の閾値との大少関係を判定する判定工程と、
    前記判定工程によって、前記第1及び第2の空間統計量算出工程が算出した空間統計量の差の絶対値が前記所定の閾値以上と判定された原画像信号については、前記第1及び第2の空間統計量算出工程が算出した空間統計量の大小関係に応じてフレーム内符号化及びフレーム間符号化の一方を選択し、前記判定工程によって、前記第1及び第2の空間統計量算出工程が算出した空間統計量の差の絶対値が前記所定の閾値よりも小さいと判定された原画像信号については、前記第1及び第2の周波数統計量算出工程が算出した周波数統計量の大小関係に応じてフレーム内符号化及びフレーム間符号化の一方を選択するモード判定工程とを有することを特徴とする符号化モード判定方法。
  7. 請求項記載の符号化モード判定方法をコンピュータに実行させるプログラム。
  8. 請求項記載のプログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2004351520A 2004-12-03 2004-12-03 符号化モード判定装置及び方法 Expired - Fee Related JP4537186B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004351520A JP4537186B2 (ja) 2004-12-03 2004-12-03 符号化モード判定装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004351520A JP4537186B2 (ja) 2004-12-03 2004-12-03 符号化モード判定装置及び方法

Publications (2)

Publication Number Publication Date
JP2006165799A JP2006165799A (ja) 2006-06-22
JP4537186B2 true JP4537186B2 (ja) 2010-09-01

Family

ID=36667339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004351520A Expired - Fee Related JP4537186B2 (ja) 2004-12-03 2004-12-03 符号化モード判定装置及び方法

Country Status (1)

Country Link
JP (1) JP4537186B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06133301A (ja) * 1992-10-19 1994-05-13 Ricoh Co Ltd 動画像圧縮符号化方法
JPH09322176A (ja) * 1995-12-20 1997-12-12 Sanyo Electric Co Ltd 符号化モード選択方法、動画像符号化装置、符号化方法、記録方法、及び伝送方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06133301A (ja) * 1992-10-19 1994-05-13 Ricoh Co Ltd 動画像圧縮符号化方法
JPH09322176A (ja) * 1995-12-20 1997-12-12 Sanyo Electric Co Ltd 符号化モード選択方法、動画像符号化装置、符号化方法、記録方法、及び伝送方法

Also Published As

Publication number Publication date
JP2006165799A (ja) 2006-06-22

Similar Documents

Publication Publication Date Title
JP3876392B2 (ja) 動きベクトル探索方法
US7792193B2 (en) Image encoding/decoding method and apparatus therefor
KR100987765B1 (ko) 동영상 부호화기에서의 예측 수행 방법 및 장치
JP4007594B2 (ja) 動画像符号化装置及び方法、動画像符号化方式変換装置及び方法
JP4536325B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP5173409B2 (ja) 符号化装置および符号化装置を備えた動画像記録システム
JP4519933B2 (ja) 動画像符号化装置および動画像符号化方法
US20090060045A1 (en) Moving picture encoding apparatus and moving picture encoding method
JP5195032B2 (ja) 符号化装置/復号化装置、符号化方法/復号化方法及びプログラム
CN1589576A (zh) 使用较大像素格栅运动补偿的降低复杂性视频解码
JP2008227670A (ja) 画像符号化装置
JPH10336672A (ja) 符号化方式変換装置およびその動きベクトル検出方法
JP4257789B2 (ja) 動画像符号化装置
KR100771640B1 (ko) 고속 모드 결정 기능을 구비한 h.264 인코더
JP4537186B2 (ja) 符号化モード判定装置及び方法
JP5390794B2 (ja) 動きベクトル探索装置および動きベクトル探索方法
JP5760950B2 (ja) 動画像再符号化装置、動画像再符号化方法及び動画像再符号化用コンピュータプログラム
JP3888533B2 (ja) 画像特徴に応じた画像符号化装置
JP4429996B2 (ja) 動画像符号化プログラム、動画像符号化方法および動画像符号化装置
JP4857243B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP2006165801A (ja) 符号化モード判定装置及び方法
JP3690259B2 (ja) 動画像高速符号化装置及び動画像高速符号化方法
JP4823150B2 (ja) 符号化装置並びに符号化方法
JP4243286B2 (ja) 符号化方法
JP2006165796A (ja) 符号化モード判定装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071129

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100326

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100617

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees