JP4451833B2 - 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体 - Google Patents

映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP4451833B2
JP4451833B2 JP2005292155A JP2005292155A JP4451833B2 JP 4451833 B2 JP4451833 B2 JP 4451833B2 JP 2005292155 A JP2005292155 A JP 2005292155A JP 2005292155 A JP2005292155 A JP 2005292155A JP 4451833 B2 JP4451833 B2 JP 4451833B2
Authority
JP
Japan
Prior art keywords
block
frame
video
encoding
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005292155A
Other languages
English (en)
Other versions
JP2007104372A (ja
Inventor
信哉 志水
幸浩 坂東
一人 上倉
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005292155A priority Critical patent/JP4451833B2/ja
Publication of JP2007104372A publication Critical patent/JP2007104372A/ja
Application granted granted Critical
Publication of JP4451833B2 publication Critical patent/JP4451833B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は,人間の主観的な品質を考慮して効率的に符号化するための映像符号化技術に関するものである。
映像を符号化する主な目的は,映像の品質をできるだけ劣化させずにデータ量を少なくすることである。その際に,実際に映像を見るという観点から考えると,信号としての品質(PSNR:Peak to Signal Noise Ratio)ではなく,映像を見る人間の主観的な品質を向上させることが重要である。
主観品質を向上させる方法として,観測者が注目する領域を元の映像に対して忠実に符号化し,一方,観測者が注目しない領域はそれほど忠実に符号化しないという手法が存在する。映像の符号化において,映像の品質はその領域を符号化するのに利用する符号量で制御することが可能である。したがって,映像全体で均一に符号量を割り当てるよりも,観測者の注目する領域により多くの符号量を割り当てることで,全体としては同じ符号量でも主観品質を向上させることができる。
例えば非特許文献1などがこれに当たる。この手法では時間的に動きのある領域(以下では動き領域,動きオブジェクトと呼ぶ)を注視領域であると考えて,その領域には他の領域より多くの符号量を割り当てることで主観品質の向上を実現している。これは動いている物体に注目するという人間の特性を利用しているため,同じ符号量の符号化映像でも,映像全体の画質の向上を図って符号化したものより,主観的な品質が向上することになる。
しかしながら,動き領域の少ない映像を符号化する場合,非特許文献1のような動き領域とそれ以外の領域とで符号量の割り当てを変える方式では,符号量を保ったまま主観品質を十分に向上させることができない。例えば,風景を撮影した映像の場合,映像の変化の大部分がカメラワーク(映像を撮影した際のカメラの動き)に依存したものとなるため,大半の領域が動き領域以外の領域(以下,背景領域と呼ぶ)と判定され,主観品質を向上させるための符号量の割り当てを行うことができない。
なお,下記の非特許文献2には,本発明の実施例で利用するカメラワークを推定する方法の一例が記載されている。また,下記の非特許文献3には,本発明の実施例で利用するピクセル毎のオプティカルフローを求める方法の一例が記載されている。非特許文献4には,H.264動画像符号化方式の詳細が示されている。
安藤輝,半谷精一郎,杉山賢二,"汎用動画像からの動きオブジェクト検出と符号化への応用",画像符号化シンポジウム2004(PCSJ2004),pp.41-42. M.Pollefeys ,R.Koch and L.Van Gool,"Self-Calibration and Metric Reconstruction in spite of Varying and Unknown Internal Camera Parameters ",International Journal of Computer Vision,32(1) ,7-25,1999. Jean-Yves Bouguet ,"Pyramidal Implementation of the Lucas Kanade Feature Tracker Description of the algorithm ",Intel Corporation,Microprocess or Research Labs ,Open CV Documents ,1999. ITU-T H.264 ITU-T Rec. H.264,"Advanced video coding for generic audiovisual services",2003.
非特許文献1に記載されているような従来の技術では,背景領域に対して主観品質を向上させるための適切な符号量の割り当てを行うことができない。このため,背景領域内でも主観品質を向上できるように符号量の割り当てを変化させることができるようにする必要がある。
背景領域内で主観品質への影響を考慮して符号量の割り当てを変化させる方法として,画面の中心に多くの符号量を割り当て,画面の端に少ない符号量を割り当てるという方法が考えられる。この方法は映像を見る際に映像の中央に注目している人が多いという性質を利用している。
しかしながら,このように空間情報のみを考慮した方法では,致命的な画質劣化を招く可能性がある。例えば,特徴的な風景が映像の端に現れている場合や,そのような風景が映像の中央から端へとゆっくりと移動していくような場合,この方法では主観品質を向上させるどころか,悪化させてしまうことになってしまう。
また,カメラワークが比較的大きな場合,前フレームには存在しなかったものが多く映像に表れることになる。この領域は非特許文献1ではアンカバード領域と呼ばれ,より多くの符号量の割り当てが必要な領域であるとされている。そのため,映像の大部分で多くの符号量が必要とされ,十分な符号量の制御をすることができない。
本発明は,かかる事情に鑑みてなされたものであって,カメラワークの存在する映像において,符号量を抑えつつ,観測者の主観的な品質を向上させることが可能な映像符号化手法の設計法を確立することを目的とする。
上記の課題を解決するために,第1の発明においては,画像を小ブロックに分割して符号化を行い,さらに少なくともそのブロック毎に量子化の度合い(以後,量子化ステップサイズの例で説明する)を自由に選択して符号化する映像符号化方法であって,映像を撮影した際のカメラの動き(以後,カメラワークと呼ぶ)カメラワークを推定するカメラワーク推定ステップと,小ブロック毎にそのブロックに映っている映像の動きを推定する動き探索ステップと,推定したカメラワークと小ブロック毎の動きから,各小ブロックを,その小ブロックの映像の変化がカメラワークに依存する背景ブロックと,カメラワーク以外の動きを含む動きオブジェクトブロックに分類する背景ブロック判定ステップと,背景ブロックに含まれる小ブロックであって次の時刻のフレームにおいて一部でもフレームアウトするブロックを抽出するフレームアウト背景ブロック判定ステップと,動きオブジェクトブロック・フレームアウト背景ブロックでない背景ブロック・フレームアウト背景ブロックの順に相対的に多い符号量を割り当てるように,その小ブロックを符号化するための量子化ステップサイズを設定する量子化ステップサイズ設定ステップを持つような映像符号化方法を考案した。
これによれば,動き領域が少ない映像において,同じ背景領域に含まれる領域であっても,映像の時間的な変化を考慮して設定される重要度に従って,符号量を割り当てることにより,主観品質の向上が可能となる。
この方法では,最初に符号化対象フレームとそのフレームの直後のフレームとの間でカメラワークを求める。ここでいうカメラワークは,符号化対象フレームから直後のフレームへのピクセル単位の写像を表すもののことを指す。つまり,単純なパン(横移動)・チルド(縦移動)・ロール(回転)・ズーム(拡大縮小)だけでなく,被写体の構造による移動距離の違いも含まれ,ピクセルごとのオプティカルフローと同じものである。
次に,符号化対象フレームを小ブロックに分割して,ブロック毎にフレーム間動き予測を行い,ブロックごとの動きベクトルを得る。ピクセルごとのオプティカルフローと各ブロックの動きベクトルから,そのブロックがカメラワーク以外の被写体の動きによって生じる映像の変化を含んだブロック(以後,動きオブジェクトブロックと呼ぶ)と,主にカメラワークによって生じる映像の変化のみをもつブロック(以後,背景ブロックと呼ぶ)に分類する。
さらに,背景ブロックを次フレームで一部でもフレームアウトしてしまうブロック(以後,フレームアウト背景ブロックと呼ぶ)と,次フレームにおいても全てがフレーム内に残るブロック(以後,フレームステイ背景ブロックと呼ぶ)に分類する。そして,このブロックの種類に従って設定される量子化ステップサイズを用いて符号化を行う。
背景ブロックの中でも次のフレームにおいて画面から見えなくなってしまう領域は,次のフレームにおいても画面内に残る領域よりも,観測者の目に映る時間が短いため,主観品質への寄与は少ないと言える。すなわち,フレームアウト背景ブロックよりもフレームステイ背景ブロックに多くの符号量を割り当てることで主観品質を向上させたり,フレームアウト背景ブロックに割り当てる符号量を削減することで主観品質を保ちつつ映像全体に必要な符号量を削減させたりすることができる。
さらに,この第1の発明は,量子化ステップサイズ設定ステップが,フレームアウト背景ブロックに含まれるブロックの画素毎に,次フレームにおいてフレームアウトする距離を求め,ブロック毎にブロック内の全画素の距離の合計値を求め,その値が大きいほど,大きな量子化ステップサイズを割り当てる処理を有することを特徴とする。
量子化ステップサイズが隣り合うブロックで大きく異なると,その部分で信号的な画質の違いが明確になるため,主観品質を低下させてしまう。つまり,主観品質を低下させずに符号量を削減するためには,隣り合うブロックにおける量子化ステップサイズの差を小さくする必要がある。そのため,フレームアウト背景ブロックの量子化ステップサイズとしては,他のブロックで使用される量しかステップサイズと大きな差のない値を使用することになり,フレームアウト背景ブロックが多くなったとしても削減できる符号量はそれほど大きくならない。
一方,第1の発明によると,次の時刻のフレームにおいても存在する映像が表示される領域から離れるにつれて,より少ない符号量を割り当てるように量子化ステップサイズを徐々に変化させて設定することになるため,均一の量子化ステップサイズを用いるより多くの符号量を削減することが可能となる。
第2の発明は,上記発明において,フレーム間動き補償技術を用いて映像を符号化する場合に,他のフレームを符号化するときに参照される可能性のあるフレームに対しては,量子化ステップサイズ設定ステップが,フレームアウト背景ブロックとフレームステイ背景ブロックに同程度の量子化ステップサイズを設定することを特徴とする映像符号化方法である。
他のフレームを符号化するときに参照されるフレームにおいても,フレームアウト背景ブロックを大きな量子化ステップサイズを用いて符号化すると,そのブロックを参照した際の予測残差が大きくなることにより,そのフレームを符号化するときの符号量が増してしまい,映像全体の符号化に必要な符号量を十分に削減することができない。
一方,第2の発明によると,参照される可能性のあるフレームを符号化するときには,量子化ステップサイズを大きくしないようにするため,フレームアウト背景ブロックが参照されたとしても予測残差が大きくなることはなく,映像全体としても符号量を削減することが可能となる。
第3の発明は,フレーム間動き補償技術を用いて映像を符号化する場合に,他のフレームを符号化するときに参照される可能性のあるフレームに対しては,最初に,フレームアウト背景ブロックとフレームステイ背景ブロックに対して同程度の量子化ステップサイズを設定して符号化を行い,次に,そのフレームが他のフレームから今後参照されないことが確定した後で,フレームアウト背景ブロックに含まれる小ブロックであって,一度も他のフレームから参照されなかった小ブロックに対して,フレームステイ背景ブロックよりも相対的に大きな量子化ステップサイズを新たに設定して再度符号化をすることを特徴とする映像符号化方法である。
参照に一度も使われないフレームアウト背景ブロックは,動き補償による予測残差の量に影響を与えないため,大きな量子化ステップサイズで符号化を行うことによって,符号量を削減することができる。したがって,第3の発明によると,フレーム間動き予測の効率を考慮して,符号量の制御ができるため,主観品質を保ちつつ,映像全体を符号化するのに必要な符号量をより多く削減することが可能となる。
第4の発明は,上記発明において,フレーム間動き補償技術を用いて符号化を行い,さらに,ある閾値以上の量子化ステップサイズを用いて,フレームアウト背景ブロックを符号化する際に,カメラワーク推定ステップで推定されたカメラワークに基づいた動きベクトルを用いてフレーム間動き補償を行って符号化することを特徴とする映像符号化方法である。
フレーム間動き補償をするときの動きベクトルは,一般的にそのベクトルを表現するのに必要な符号量と,動き補償をした後の残差信号を符号化するのに必要な符号量の合計値が小さくなるように決定される。このとき,残差信号を符号化するときの量子化ステップサイズが大きな場合,どのような動きベクトルでも,動き補償後の残差信号の符号化に必要な符号量が大きく変わらなくなる。そのため,表現するのに少ない符号量で済む動きベクトルが選択されることになる。しかし,残差信号の符号化に必要な符号量が大きく変わらなくても,実際の動きと大きく異なる動きベクトルを用いたブロックの映像は,オリジナルの映像と大きく異なる映像となり,主観品質を著しく悪化させてしまう。
一方,第4の発明によると,他のブロックより比較的大きな量子化ステップサイズの設定されるフレームアウト背景ブロックにおいて,実際の映像に対応する動きを利用することになるため,細かい部分の正確性は失われるものの映像の大まかな変化を保ち,自然な変化を再現でき,同じ符号量でも主観品質を向上させることが可能となる。
本発明によれば,直後のフレームにおいて画面に残らない領域という人間が主観的に映像を評価する際に比較的影響を与えない部分を特定して,その部分に割り当てる符号量を他の部分に割り当てる符号量よりも相対的に少なくすることで,風景のような動きのある被写体がないような映像においても,主観品質を保ったまま映像全体の符号量を削減することや,映像全体で同じ符号量でも主観品質の良くなるような映像符号化を実現することができる。
本発明の具体的な実施例を以下に示す。図1に,本実施例において利用する映像符号化装置の構成を示す。
映像符号化装置10は,映像を時間軸に沿った順序でフレーム毎に入力する画像入力部11と,自身の時刻より前の時刻のフレームが全て符号化されるまでフレームを蓄積する入力画像メモリ12と,時間的に連続する2つのフレーム間の動きをブロック毎に探索するブロック単位動き探索部13と,時間的に連続する2つのフレーム間のカメラワークを推定するカメラワーク推定部14と,小ブロック毎に動きオブジェクトブロック,フレームステイ背景ブロック,フレームアウト背景ブロックのいずれであるかを判定するブロック判定部15と,画像を小ブロックに分割してフレーム間動き予測を用いながら符号化する画像符号化部16と,符号化結果である映像の符号を出力する符号出力部17とを備える。
図2は,入力映像の例を示す。以下の実施例の説明では,図2に示した映像を符号化する場合を例にして説明する。この映像をフレーム1,フレーム3,フレーム2の順序で,先に符号化されたフレームを用いてフレーム間動き予測を行いながら符号化を行うこととする。
図3は,映像符号化装置10における画像符号化部16の構成の詳細を示す図である。画像符号化部16は,カメラワーク情報を蓄積するカメラワークメモリ161と,ブロックの種類の情報を蓄積するブロックプロパティマップメモリ162と,カメラワークとブロックの種類と他のフレームからの参照の有無に関する情報からブロック毎に符号化する際の量子化ステップを決定する量子化ステップ設定部163と,量子化ステップ設定部163で設定された量子化ステップを用いて,画像を小ブロックに分割して,フレーム間動き予測が利用可能な符号化方法で動画像符号化を行う動画像符号化部164と,フレーム間動き予測によってブロックが参照されたかどうかを示す情報を蓄積する被参照マップメモリ165と,符号化結果である映像の符号をバッファリングする出力符号メモリ166とを備える。
図4に,映像符号化装置10の処理フローを示す。この実施例では,図2で示したフレームが,フレーム1,フレーム2,フレーム3の順番で,次々と画像入力部11に入力される[ステップA1]。入力された画像は符号化対象フレームとその時間的に直後のフレームが入力されるか,最後のフレームが入力されるまで入力画像メモリ12に蓄積される[ステップA2,A3]。つまり,この実施例の場合,フレーム1の符号化を開始するのはフレーム2の入力が終了した後であり,フレーム2の符号化を開始するのはフレーム3の入力が終了した後であり,フレーム3の符号化を開始するのはフレーム3の入力が終了した後となる。また,画像メモリからある画像が削除される条件は,自身と自身より前の時刻のフレームが全て符号化済みとなったときである。つまり,本実施例の場合,入力画像メモリ12には少なくとも2フレーム分のメモリがあることになる。
次に,符号化対象フレームが最終フレームであれば,符号化対象フレームを画像符号化部16で符号化する[ステップA4,A5]。一方,符号化対象フレームが最終フレームでなければ,符号化対象フレームとその直後のフレームを用いて,ブロック単位動き探索部13において,符号化対象フレームをある単位で分割した小ブロック毎に,そのブロックが直後のフレームにおいて存在する位置を推定する[ステップA4,A6]。
また,符号化対象フレームとその直後のフレームにおけるカメラワークをカメラワーク推定部14で推定する[ステップA7]。カメラワークを推定する方法として,例えば非特許文献2にあるような既知の手法を用いることができる。なお本手法では,ある点が次の時刻においてカメラワークによってどの点に移動したかを知ることができれば十分であり,カメラワークの種類を特定する必要はない。つまり,以下の式で表されるような,符号化対象フレームの座標Xからその直後のフレームのある座標X* への射影Pを求めることが,このステップで行われる処理である。また,このことはカメラワークの推定プロセスはピクセル毎のオプティカルフローが求まればよいことを示しているため,例えば非特許文献3にあるようなピクセルごとのオプティカルフローを求める技術を利用することもできる。
* =P(X)
次に,求められたブロック単位の動きとカメラワークを用いて,ブロック判定部15で,各ブロックを動きオブジェクトブロック,フレームステイ背景ブロック,フレームアウト背景ブロックのいずれかに分類する[ステップA8]。そして,ブロック情報とカメラワークを用いて,画像符号化部16が符号化対象フレームを符号化する[ステップA5]。符号化されたフレームは,符号出力部17から符号化された順,つまりフレーム1,フレーム3,フレーム2の順で出力される[ステップA9]。全フレームの符号化が終了すると,処理を終了する[ステップA10]。
図5に,ブロック判定部15で行われるブロック判別の詳細フローを示す。まず,ブロック単位動き探索部13によって求められたブロック単位の動きベクトルの信頼度を,ブロック毎に以下の式で求める[ステップB0,B1]。
信頼度=−Σp |Ys (p)−Yd (p−MVk )|
ここで,Σp は,p∈Sk についての総和を表す。pはピクセル座標,Sk は符号化対象フレームにおけるブロックkに含まれるピクセル座標の集合を表し,MVk はブロック単位動き探索で求まったブロックkの動きベクトルを表す。符号化対象フレームにおけるピクセル座標pの画素値はYs (p)と表し,符号化対象フレームの次の時刻のフレームにおけるピクセル座標pの画素値はYd (p)と表している。
次に,この信頼度がある一定の閾値以上かどうかを調べる[ステップB2]。信頼度がある一定の閾値を超えなかった場合,カメラワーク推定部14で推定したカメラワークによる射影Pを用いて,ブロック内の各ピクセルが次時刻のフレームにおいてフレーム内に含まれるかどうかを調べる[ステップB3]。そして,フレームアウトするピクセルの数が一定数を超えるかどうかを調べる[ステップB4]。
一定数のピクセルが次時刻のフレームにおいてフレーム内に含まれる場合,そのブロックをフレームステイ背景ブロックと判定する[ステップB5]。一方,一定数以上のピクセルがフレームアウトする場合には,そのブロックをフレームアウト背景ブロックと判定する[ステップB6]。
ステップB2の判定において,上記の信頼度がある一定の閾値以上であった場合,カメラワーク推定部14で推定したカメラワークによる射影Pより,そのブロックのカメラワークによる動きベクトルCMVk を次の式により求める[ステップB7]。Nはそのブロックに含まれるピクセル数を表す。
CMVk =Σq (P(q)−q)/N
ここで,Σq は,q∈Sk についての総和を表す。
その後,CMVk とMVk の差分ベクトルの大きさについてチェックを行う[ステップB8]。その大きさが一定の閾値以上ならばそのブロックを動きオブジェクトブロックと判定する[ステップB9]。一方,差分ベクトルの大きさが閾値を超えなかった場合,ブロック内の各ピクセルが次時刻のフレームにおいてフレーム内に含まれるかどうかを調べ[ステップB3],一定数のピクセルが次時刻のフレームにおいてフレーム内に含まれるならば,そのブロックをフレームステイ背景ブロックと判定し[ステップB4,B5],そうでなければフレームアウト背景ブロックと判定する[ステップB4,B6]。
図6に,画像符号化部16で行われる画像の符号化処理の詳細フローを示す。まず,カメラワーク推定部14で推定されたカメラワークと,ブロック判定部15で決定された符号化対象フレームの各ブロックの種類を表す情報(以後,ブロックプロパティマップと呼ぶ)と,入力画像メモリ12に蓄えられていた符号化対象の画像が入力される[ステップC1]。カメラワークはカメラワークメモリ161に蓄えられ,ブロックプロパティマップはブロックプロパティマップメモリ162に蓄えられる[ステップC2]。メモリからは対応するフレーム及びそのフレームより前の時刻のフレームの符号化が終了して,それらの符号が画像符号化部16から出力された段階で削除される。つまり,本実施例の場合,2組のカメラワークとブロックプロパティマップを格納できることが必要となる。
符号化対象フレームに対応するカメラワークとブロックプロパティマップの入力が完了すると,カメラワークとブロックプロパティマップを用いて,量子化ステップ設定部163で,ブロック毎に最初の量子化ステップが決定される[ステップC3]。
決定された量子化ステップとカメラワークを用いて動画像符号化部164が実際に画像を符号化する[ステップC4]。ここで用いられる動画像符号化手法は,H.264(例えば,非特許文献4参照)に代表されるような,画像を小ブロックに分割してブロック単位で符号化を行う手法であり,さらにブロック毎のフレーム間動き予測を用いて符号化を行う手法であり,さらに量子化ステップを変更することで符号量と画質を調節できるような方法であれば,どのような方法でも用いることが可能である。ただし,ある閾値以上の量子化ステップが設定されているフレームアウト背景ブロックを動き予測を用いて符号化する場合,その動きベクトルはカメラワークから求まるCMVk を使うこととする。また,符号化の際にフレーム間動き予測を用いた場合,参照フレーム毎にどのピクセルを参照したかを記録して,その情報(以後,被参照マップと呼ぶ)を被参照マップメモリ165に格納する[ステップC5]。
動画像符号化部164から出力される符号は出力符号メモリ166に蓄えられる[ステップC6]。そして,出力符号メモリ166は,メモリに格納されている符号の中で最も早くメモリに格納されたフレームの符号が,被参照フレームの候補リストに載っているかどうかをチェックする[ステップC7]。被参照フレームの候補リストとは,フレーム間動き予測をする際に,参照フレームとして利用する可能性が一度でもあるフレームのリストとする。この候補リストの管理は,符号化する際のパラメータとして与えられる参照構造によって決められる。例えば,再生時刻順に5フレームさかのぼって参照を可能とするようなパラメータが与えられた場合,N番目の被参照フレームはそのフレーム自身の符号化が終了した後に候補リストに追加され,N+5番目のフレームの符号化が終了した時点で候補リストから削除される。候補リストに載っている場合には,何も出力しないで終了する。
一方,候補リストに載っていない場合,そのフレームに対応する被参照マップを用いて量子化ステップ設定部163で量子化ステップを再計算し[ステップC8],動画像符号化部164で新たな量子化ステップを用いて再度符号化を行い[ステップC9],その結果を出力する[ステップC10]。その後,対応する符号が出力されたら出力符号メモリ166からその符号を削除する[ステップC11]。つまり本実施例の場合,出力符号メモリ166には,少なくとも被参照フレームの候補数+1フレーム分の符号を蓄えられる必要がある。また,符号の出力が行われた場合,出力に関する処理[ステップC7−C11]を再度繰り返す。なお,ステップC8における量子化ステップの再計算の結果,以前にステップC3で決定した量子化ステップと変わらなかった場合には,次のステップC9の符号化処理を省略してもよい。
図7に量子化ステップ設定部163で行われる処理の詳細なフローを示す。まず,量子化ステップ決定対象のフレームが始めて量子化ステップを決定するフレームかどうかを調べる[ステップD1]。初めて量子化ステップを決定するフレームの場合,他のフレームを符号化するときに被参照フレームとして利用可能なフレームかどうかを調べる[ステップD2]。被参照フレームとして利用不可能なフレームの場合,フレームアウト背景ブロックごとに以下の式を用いて評価値を計算する[ステップD3]。
Σq Distance(P(q)) ・・・式(1)
Distance(x)はxとフレームの端までの最短距離を与える関数を表す。ただし,Distance(x)>0ならばxはフレームの外側にあり,Distance(x)=0ならばxはフレームの枠上にあり,Distance(x)<0ならばxはフレームの内側にあるとする。
そして,動きオブジェクトブロック,フレームステイ背景ブロック,フレームアウト背景ブロックの順に小さな量子化ステップを設定する[ステップD4]。このとき,フレームアウト背景ブロックは前もって求めた評価値が小さいほど小さな量子化ステップを設定する。ただし,ここで量子化ステップは小さいほど,相対的により多くの符号量を割り当てるようなものとする。
一方,被参照フレームとして利用可能なフレームの場合,フレームステイ背景ブロックとフレームアウト背景ブロックには同等の量子化ステップを設定し,動きオブジェクトブロックにはそれより小さな量子化ステップを設定する[ステップD5]。また,量子化ステップ決定対象のフレームが初めて量子化ステップを決定するフレームではない場合,被参照マップメモリ165に蓄えられている情報から,フレームアウト背景ブロックであり,かつそのブロック内のいずれかのピクセルが少なくとも一度は参照されたブロックを求め,そのブロックに対して式(1)で求まる評価値を計算する[ステップD6]。そして,以下の分類で順序が若い順に小さな量子化ステップを設定する[ステップD7]。
1.動きオブジェクトブロック
2.フレームステイ背景ブロック,もしくは,フレームアウト背景ブロックかつそのブロック内のいずれかのピクセルが少なくとも一度は参照されたブロック
3.フレームアウト背景ブロックかつそのブロック内の全てのピクセルが一度も参照されなかったブロック
ただし,3に含まれるブロックの量子化ステップは上記の式(1)で求まる値が小さいほど,小さな量子化ステップを設定する。
以上の実施例において,図3の動画像符号化部164では,量子化ステップ設定部163で設定された量子化ステップサイズを用いてフレームアウト背景ブロックを符号化する際に,その量子化ステップサイズがある閾値を超えた場合,カメラワーク推定部14で推定されたカメラワークに基づいた動きベクトルを用いてフレーム間動き補償を行って符号化する。この処理も,限られた符号量で主観品質を向上させるうえで好適である。
符号量の割り当てを制御する代表例として量子化ステップサイズの例を説明したが,量子化の度合いを制御することができるものであれば,これに限らず他の符号化のパラメータを用いることもできる。
以上の映像符号化の処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
映像符号化装置の構成を示す図である。 入力される映像の具体例を示す図である。 画像符号化部の構成を示す図である。 映像符号化装置の処理フローを示す図である。 ブロックの種類を判定するプロセスの詳細処理フローを示す図である。 画像符号化を行うプロセスの詳細処理フローを示す図である。 量子化ステップの決定プロセスの詳細処理フローを示す図である。
符号の説明
10 映像符号化装置
11 画像入力部
12 入力画像メモリ
13 ブロック単位動き探索部
14 カメラワーク推定部
15 ブロック判定部
16 画像符号化部
17 符号出力部

Claims (8)

  1. 画像を小ブロックに分割して符号化を行い,さらに少なくともそのブロック毎に量子化の度合いを選択して符号化する映像符号化方法であって,
    映像を撮影した際のカメラワークを推定するカメラワーク推定ステップと,
    小ブロック毎に,そのブロックに映っている映像の動きを推定する動き探索ステップと,
    推定したカメラワークと小ブロック毎の動きから,各小ブロックが,その小ブロックの映像の変化がカメラワークに依存する背景ブロックであるか,映像の変化がカメラワーク以外に被写体の動きを含む動きオブジェクトブロックであるかを判定する背景ブロック判定ステップと,
    背景ブロックに含まれる小ブロックであって,次の時刻のフレームにおいて一部でもフレームアウトするブロックを抽出するフレームアウト背景ブロック判定ステップと,
    動きオブジェクトブロック,フレームアウト背景ブロックでない背景ブロック,フレームアウト背景ブロックの順に相対的に多い符号量が割り当てられるように量子化の度合いを設定する量子化の度合い設定ステップとを有し,
    前記量子化の度合い設定ステップでは,フレームアウト背景ブロックに含まれる小ブロック内の画素毎に,前記カメラワーク推定ステップで推定したカメラワークを用いて,次フレームにおける推定位置を求め,その推定位置がフレーム端から離れた距離を,符号化対象ブロック毎に合計し,その合計値が大きいほど,相対的に少ない符号量が割り当てられるように量子化の度合いを設定する,
    ことを特徴とする映像符号化方法。
  2. 請求項1に記載の映像符号化方法において,さらに小ブロック毎にフレーム間動き補償を用いて符号化を行う映像符号化方法であって,
    前記量子化の度合い設定ステップにおいて,動き補償における参照フレームとして利用可能なフレームを符号化する際には,フレームアウト背景ブロックでない背景ブロックと,フレームアウト背景ブロックとで同程度の量子化の度合いを設定する,
    ことを特徴とする映像符号化方法。
  3. 画像を小ブロックに分割して符号化を行い,さらに少なくともそのブロック毎に量子化の度合いを選択して符号化する映像符号化方法であって,
    映像を撮影した際のカメラワークを推定するカメラワーク推定ステップと,
    小ブロック毎に,そのブロックに映っている映像の動きを推定する動き探索ステップと,
    推定したカメラワークと小ブロック毎の動きから,各小ブロックが,その小ブロックの映像の変化がカメラワークに依存する背景ブロックであるか,映像の変化がカメラワーク以外に被写体の動きを含む動きオブジェクトブロックであるかを判定する背景ブロック判定ステップと,
    背景ブロックに含まれる小ブロックであって,次の時刻のフレームにおいて一部でもフレームアウトするブロックを抽出するフレームアウト背景ブロック判定ステップと,
    動きオブジェクトブロック,フレームアウト背景ブロックでない背景ブロック,フレームアウト背景ブロックの順に相対的に多い符号量が割り当てられるように量子化の度合いを設定する量子化の度合い設定ステップとを有し,
    動き補償における参照フレームとして利用可能なフレームを符号化する際に,まず,前記量子化の度合い設定ステップにおいて,フレームアウト背景ブロックでない背景ブロックと,フレームアウト背景ブロックとで同程度の量子化の度合いを設定して符号化を行い,次にそのフレームが参照フレームの候補から外される際に,フレームアウト背景ブロックに含まれる小ブロックであって,一度も他のフレームから参照されなかった小ブロックに対して,フレームアウト背景ブロックでない背景ブロックよりも相対的に少ない符号量が割り当てられるように量子化の度合いを新たに設定して再度符号化をする,
    ことを特徴とする映像符号化方法。
  4. 請求項1,請求項2または請求項3に記載の映像符号化方法において,さらに小ブロック毎にフレーム間動き補償を用いて符号化を行う映像符号化方法であって,
    前記量子化の度合い設定ステップで設定された量子化の度合いを用いて,フレームアウト背景ブロックを符号化する際に,その量子化の度合いがある閾値を超えた場合,前記カメラワーク推定ステップで推定されたカメラワークに基づいた動きベクトルを用いてフレーム間動き補償を行って符号化する
    ことを特徴とする映像符号化方法。
  5. 画像を小ブロックに分割して符号化を行い,さらに少なくともそのブロック毎に量子化の度合いを選択して符号化する映像符号化装置であって,
    映像をフレーム毎に入力する画像入力手段と,
    入力したフレームを蓄積する入力画像記憶手段と,
    前記入力画像記憶手段に蓄積されたフレームから,映像を撮影した際のカメラワークを推定するカメラワーク推定手段と,
    前記入力画像記憶手段に蓄積されたフレームの小ブロック毎に,そのブロックに映っている映像の動きを推定する動き探索手段と,
    推定したカメラワークと小ブロック毎の動きから,各小ブロックを,映像の変化がカメラワーク以外に被写体の動きを含む動きオブジェクトブロックと,それ以外のブロックである背景ブロックのうち,次の時刻のフレームにおいて一部でもフレームアウトするフレームアウト背景ブロックと,フレームアウト背景ブロックでない背景ブロックとに分類するブロック判定手段と,
    動きオブジェクトブロック,フレームアウト背景ブロックでない背景ブロック,フレームアウト背景ブロックの順に相対的に多い符号量が割り当てられるように量子化の度合いを設定し,映像を符号化する符号化手段とを備え,
    前記符号化手段は,フレームアウト背景ブロックに含まれる小ブロック内の画素毎に,前記カメラワーク推定ステップで推定したカメラワークを用いて,次フレームにおける推定位置を求め,その推定位置がフレーム端から離れた距離を,符号化対象ブロック毎に合計し,その合計値が大きいほど,相対的に少ない符号量が割り当てられるように量子化の度合いを設定する,
    ことを特徴とする映像符号化装置。
  6. 画像を小ブロックに分割して符号化を行い,さらに少なくともそのブロック毎に量子化の度合いを選択して符号化する映像符号化装置であって,
    映像をフレーム毎に入力する画像入力手段と,
    入力したフレームを蓄積する入力画像記憶手段と,
    前記入力画像記憶手段に蓄積されたフレームから,映像を撮影した際のカメラワークを推定するカメラワーク推定手段と,
    前記入力画像記憶手段に蓄積されたフレームの小ブロック毎に,そのブロックに映っている映像の動きを推定する動き探索手段と,
    推定したカメラワークと小ブロック毎の動きから,各小ブロックを,映像の変化がカメラワーク以外に被写体の動きを含む動きオブジェクトブロックと,それ以外のブロックである背景ブロックのうち,次の時刻のフレームにおいて一部でもフレームアウトするフレームアウト背景ブロックと,フレームアウト背景ブロックでない背景ブロックとに分類するブロック判定手段と,
    動きオブジェクトブロック,フレームアウト背景ブロックでない背景ブロック,フレームアウト背景ブロックの順に相対的に多い符号量が割り当てられるように量子化の度合いを設定し,映像を符号化する符号化手段とを備え,
    前記符号化手段は,動き補償における参照フレームとして利用可能なフレームを符号化する際に,まず,フレームアウト背景ブロックでない背景ブロックと,フレームアウト背景ブロックとで同程度の量子化の度合いを設定して符号化を行い,次にそのフレームが参照フレームの候補から外される際に,フレームアウト背景ブロックに含まれる小ブロックであって,一度も他のフレームから参照されなかった小ブロックに対して,フレームアウト背景ブロックでない背景ブロックよりも相対的に少ない符号量が割り当てられるように量子化の度合いを新たに設定して再度符号化をする,
    ことを特徴とする映像符号化装置。
  7. 請求項1から請求項までのいずれか1項に記載の映像符号化方法を,コンピュータに実行させるせための映像符号化プログラム。
  8. 請求項1から請求項までのいずれか1項に記載の映像符号化方法を,コンピュータに実行させるせための映像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005292155A 2005-10-05 2005-10-05 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体 Expired - Fee Related JP4451833B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005292155A JP4451833B2 (ja) 2005-10-05 2005-10-05 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005292155A JP4451833B2 (ja) 2005-10-05 2005-10-05 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体

Publications (2)

Publication Number Publication Date
JP2007104372A JP2007104372A (ja) 2007-04-19
JP4451833B2 true JP4451833B2 (ja) 2010-04-14

Family

ID=38030856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005292155A Expired - Fee Related JP4451833B2 (ja) 2005-10-05 2005-10-05 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体

Country Status (1)

Country Link
JP (1) JP4451833B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5049386B2 (ja) * 2008-04-21 2012-10-17 シャープ株式会社 動画像符号化装置および動画像復号装置

Also Published As

Publication number Publication date
JP2007104372A (ja) 2007-04-19

Similar Documents

Publication Publication Date Title
US11736701B2 (en) Hash-based encoder decisions for video coding
KR100987365B1 (ko) 비디오 프레임들로부터 키 프레임들의 선택
JP6286718B2 (ja) 高効率な次世代ビデオコーディングのためのフレーム階層応答型量子化を使用する、コンテンツ適応ビットレートおよび品質管理
JP5362831B2 (ja) 構成参照フレームを用いた動画符号化システムおよび方法
JP4732982B2 (ja) 向上した動き推定方法、該方法を利用したビデオエンコーディング方法及び装置
JP5791618B2 (ja) ビデオ・シーケンスを処理する方法及び装置
JP4799438B2 (ja) 画像記録装置、画像記録方法、画像符号化装置、及びプログラム
JP5766877B2 (ja) 類似度、視覚的品質、および関心に基づくフレーム符号化選択
JP6016332B2 (ja) 画像処理装置、画像処理方法
JP2009147911A (ja) 映像データ圧縮前処理方法およびこれを用いた映像データ圧縮方法と映像データ圧縮システム
WO2020188401A1 (en) Quantization step parameter for point cloud compression
JP5441812B2 (ja) 動画像符号化装置、及びその制御方法
JP2003032688A (ja) 動画像の前景背景領域分離方法、及びその方法を用いた条件付画素補填による動画像符号化方法
US10666970B2 (en) Encoding apparatus, encoding method, and storage medium
JP2003264840A (ja) 符号化動画像データの方式変換装置
JP4451833B2 (ja) 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体
JP5165084B2 (ja) 画像符号化装置
JP2008301270A (ja) 動画像符号化装置及び動画像符号化方法
JP6728870B2 (ja) 画像圧縮装置、画像圧縮方法、及び画像圧縮プログラム
KR102049644B1 (ko) 노이즈 동영상의 효율적인 부호화를 위한 계층적 노이즈 제거 방법
Belyaev et al. Drone HDR infrared video coding via aerial map prediction
JP6942504B2 (ja) 符号化装置、撮像装置、符号化方法、及びプログラム
JP2003309850A (ja) 動画符号化制御装置および符号化制御データベース生成装置
JP2007104515A (ja) 映像符号化プレフィルタリング方法、映像符号化プレフィルタリング装置、映像符号化プレフィルタリングプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2021044706A (ja) 画像符号化装置及びその制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080205

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080529

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100128

R150 Certificate of patent or registration of utility model

Ref document number: 4451833

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130205

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees