JPWO2010007719A1 - 画像符号化装置、画像符号化方法、画像復号装置、及び画像復号方法 - Google Patents
画像符号化装置、画像符号化方法、画像復号装置、及び画像復号方法 Download PDFInfo
- Publication number
- JPWO2010007719A1 JPWO2010007719A1 JP2010520739A JP2010520739A JPWO2010007719A1 JP WO2010007719 A1 JPWO2010007719 A1 JP WO2010007719A1 JP 2010520739 A JP2010520739 A JP 2010520739A JP 2010520739 A JP2010520739 A JP 2010520739A JP WO2010007719 A1 JPWO2010007719 A1 JP WO2010007719A1
- Authority
- JP
- Japan
- Prior art keywords
- image data
- image
- decimal pixel
- frame
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 194
- 230000033001 locomotion Effects 0.000 claims abstract description 169
- 238000001514 detection method Methods 0.000 claims abstract description 50
- 230000008569 process Effects 0.000 claims description 84
- 238000013139 quantization Methods 0.000 claims description 50
- 238000006243 chemical reaction Methods 0.000 claims description 41
- 230000010363 phase shift Effects 0.000 claims description 12
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 230000006872 improvement Effects 0.000 abstract description 4
- 238000005070 sampling Methods 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012615 high-resolution technique Methods 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
より高解像度の参照画像を生成し、符号化の観点より動き予測精度の改善に資する。原画像データと動き予測画像データとの差分を符号化すると共に符号化データを復号して得られるローカルデコード画像データに基づいて前記動き予測画像データを生成することが可能な画像符号化装置は、前記ローカルデコード画像データを複数フレーム分に亘り保持するフレームメモリ(109)と、前記フレームメモリが保持する、符号化対象フレームのローカルデコード画像データとそれよりも前のフレームのローカルデコード画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理部(110,111)と、を有する。画像符号化装置は前記小数画素画像データ処理部で生成された小数画素精度画像データを参照画像データとして動き検出を行って動き予測画像データを生成する。
Description
本発明は、補償技術を用いた動画像の圧縮及び伸長技術に関し、特に補償技術に小数画素精度画像を用いる画像符号化又は復号のための装置と方法に関するものである。
MPEG-2,MPEG-,H.264等の画像符号化、復号処理では、非特許文献1に記載されるように、小数画素画像精度の動き検出・動き補償を行うために隣接画素からのフィルタ補間により参照画像を生成する。フィルタ補間によって生成される小数画素画像精度の参照画像は、整数精度の動き探索で探索された最小のコスト関数の画素の周囲に対して小数画素画像精度の画素値をフィルタ補間によって得るものである。参照画像として整数画素精度の画像データを用いる場合に比べて復号による再生画像の画質を向上させることができる。
I.Richardson,"H.264 and MPEG-4 Video Compression: Video Coding for Next-generation Multimedia", John Wiley & Sons, Ltd. (2003)
MPEG-2、MPEG-4、H.264等の既存の画像符号化規格では、符号化、復号処理において、小数画素画像精度の動き補償を行うための参照画像を得るためのフィルタ補間処理において、MPEG-2の場合には2タップのフィルタが適用されているが単純な画素補間のため高周波成分がカットされてしまい、動き予測精度が低下する。また、MPEG-4 ASPやH.264においても各々8タップ、6タップのフィルタ処理が適用されているが、高周波成分の調整が十分とはいえず、予測精度の向上による符号化効率の改善が課題であった。何れにおいても、小数画素画像精度の動き補償を行うための従来の参照画像は、処理対象とされるマクロブロックが所属するフレーム内の画像データだけで生成される。
本発明は、上記課題に鑑みてなされたものであり、その目的は、画像符号化、画像復号のための装置及び方法において、より高解像度の参照画像を生成することにある。別の目的は、動き予測精度を改善することである。更に別の目的は、高画質に資することである。
本発明の前記並びにその他の目的と新規な特徴は本明細書の記述及び添付図面から明らかになるであろう。
本願において開示される発明のうち代表的なものの概要を簡単に説明すれば下記の通りである。
すなわち、画像データの符号化技術において、原画像データと動き予測画像データとの差分を符号化すると共に符号化データを復号して得られるローカルデコード画像データに基づいて前記動き予測画像データを生成するとき、ローカルデコード画像データを複数フレーム分に亘り保持するフレームメモリから、符号化対象フレームのローカルデコード画像データとそれよりも前のフレームのローカルデコード画像データとを用いて小数画素精度画像データを生成し、前記小数画素精度画像データを参照画像データとして動き検出を行って動き予測画像データを生成する。
また、画像データの復号技術において、動き予測によって符号化された符号化データから分離された符号化画像データを復号して得られる動き予測誤差に動き予測画像データを加算して画像データを再生し、再生された再生画像データに基づいて前記動き予測画像データを生成するとき、前記再生画像データを複数フレーム分に亘り保持するフレームメモリから、復号対象フレームの再生画像データとそれよりも前のフレームの再生画像データとを用いて小数画素精度画像データを生成し、生成された小数画素精度画像データを参照画像データとして動き検出を行って動き予測画像データを生成する。
符号化、復号の何れにおいても、参照画像データとしての小数画素精度画像データは、処理対象フレームの画像データと当該フレームから離れた別のフレームの画像データとの双方のデータを用いて生成することが可能であるから、補間だけで生成する場合に比べてより高精度な小数画素精度画像データを生成することができる。
本願において開示される発明のうち代表的なものによって得られる効果を簡単に説明すれば下記のとおりである。
すなわち、より高解像度の参照画像を生成することができる。それによって動き予測精度の改善に資することができる。更に、高画質に資することができる。
101…原画像メモリ
102…減算器
103…周波数変換部
104…量子化部
105…可変長符号化部
106,1503…逆量子化部
107、1504…逆周波数変換部
108、1505…加算器
109、113、1506、1510…フレームメモリ
110、1507…小数画素精度画像生成方法決定部
111、1508…小数画素精度画像生成部
112、1509…動き検出・動き補償部
114、1512…画面内予測部
401…位置推定部
403、404…アップレート器
406、407…位相シフト器
410、411、412、413…乗算器
409…係数決定部
1501…可変長復号部
1502…構文解析部
1511…映像表示装置
102…減算器
103…周波数変換部
104…量子化部
105…可変長符号化部
106,1503…逆量子化部
107、1504…逆周波数変換部
108、1505…加算器
109、113、1506、1510…フレームメモリ
110、1507…小数画素精度画像生成方法決定部
111、1508…小数画素精度画像生成部
112、1509…動き検出・動き補償部
114、1512…画面内予測部
401…位置推定部
403、404…アップレート器
406、407…位相シフト器
410、411、412、413…乗算器
409…係数決定部
1501…可変長復号部
1502…構文解析部
1511…映像表示装置
1.実施の形態の概要
先ず、本願において開示される発明の代表的な実施の形態について概要を説明する。代表的な実施の形態についての概要説明で括弧を付して参照する図面中の参照符号はそれが付された構成要素の概念に含まれるものを例示するに過ぎない。
先ず、本願において開示される発明の代表的な実施の形態について概要を説明する。代表的な実施の形態についての概要説明で括弧を付して参照する図面中の参照符号はそれが付された構成要素の概念に含まれるものを例示するに過ぎない。
〔1〕《画像符号化装置》原画像データと動き予測画像データとの差分を符号化すると共に符号化データを復号して得られるローカルデコード画像データに基づいて前記動き予測画像データを生成することが可能な画像符号化装置は、前記ローカルデコード画像データを複数フレーム分に亘り保持するフレームメモリ(109)と、前記フレームメモリが保持する、符号化対象フレームのローカルデコード画像データとそれよりも前のフレームのローカルデコード画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理部(110、111)と、を有する。画像符号化装置は前記小数画素画像データ処理部で生成された小数画素精度画像データを参照画像データとして動き検出を行って動き予測画像データを生成する。
上記より、参照画像データとしての小数画素精度画像データは、符号化対象フレームのローカルデコード画像データと当該フレームから離れた別のフレームのローカルデコード画像データとの双方のデータを用いて生成することが可能であるから、補間だけで生成する場合に比べてより高精度な小数画素精度画像データを生成することができる。
これにより、符号化の観点より動き予測精度の改善に資することができ、更に、符号化復号を経て得られる画像の高画質に資することができる。
〔2〕項2の画像符号化装置において、前記小数画素画像データ処理部は、フレームメモリに格納された符号化対象フレームのローカルデコード画像データとそれより前の所定範囲の前フレームのローカルデコード画像データとの間の動き量が小数画素精度であるか否かを判定し、小数画素精度の判定結果が得られたときは、その前フレームのローカルデコード画像データと前記符号化対象フレームのローカルデコード画像データとを用いて小数画素精度画像データを生成し、小数画素精度の判定結果が得られないときは符号化対象フレームのローカルデコード画像データに対する補間演算によって小数画素精度画像データを生成する。
上記より、動き量が整数画素精度である場合(例えば静止画像の場合)には小数画素精度画像データを生成するのに前者の処理を行なっても結果は後者と実質的に同じになるから、その場合に後者の補間による処理を選択することにより、無駄なデータ処理が減って処理量と処理時間が縮小される。また、前者の処理対象フレームが離れるに従って小数画素精度画像データの高精度若しくは高画質を期待できなくなる。この点を考慮して、符号化対象フレームから所定フレーム数だけ離れたフレームの範囲で小数画素精度画像データがなければそれ以降のフレームに対する画素精度の判定を行わずに、補間による処理を選択するようにして、無駄な処理を極力低減する。
〔3〕項2の画像符号化装置において、前記小数画素画像データ処理部は、前記小数画素精度であるか否かの判定の対象を、時間方向の動き予測を行うことなく画面内の情報を用いて符号化されて得られる画面であるIピクチャ(Intra-Picture)又は画面間の順方向予測符号化によって得られる画面であるPピクチャ(Predictive-Picture)のフレームに限定する。過去と未来の双方向からの予測符号化によって得られるが面であるBピクチャ(Bi-directional Predictive-Picture)を除外する。これにより、より高精度若しくは高画質な小数画素精度画像データを生成することができる。
〔4〕項3の像符号化装置において、前記小数画素画像データ処理部は、前記所定範囲の前フレームに対して最も符号化対象フレームに近い前フレームから順次前記フレーム形態の判定と前記小数画素精度であるか否かの判定を行う。符号化対象フレームにより近いフレームのローカルデコード画像データを用いるほど、より高画質(高精度)の小数画素精度画像データを生成することができるからである。
〔5〕項1の画像符号化装置において、前記小数画素画像生成部は、例えば画像データの複数の画像信号のそれぞれの信号に対して位相シフト処理を行って新たな複数の画像信号を生成し、前記複数の画像信号と新たな複数の画像信号とに係数を乗じて合成することにより、小数画素精度画像データを生成する。
〔6〕《画像符号化方法》画像符号化方法は以下の(a)乃至(l)の処理を含む。(a)予測画像メモリから動き予測画像データを読出す読出し処理、(b)読み出された動き予測画像データと入力画像データとの差分を予測誤差データとして算出する差分処理、(c)前記差分処理で算出した予測誤差データを周波数変換する周波数変換処理、(d)前記周波数変換処理で周波数変換されたデータを量子化する量子化処理、(e)前記量子化処理で量子化されたデータを可変長符号化し、符号化ストリームを生成する可変長符号化処理、(f)前記量子化処理で量子化されたデータを逆量子化する逆量子化処理と、(g)前記逆量化処理で逆量子化されたデータを逆周波数変換して予測誤差データを再生するする逆周波数変換処理と、(h)前記逆周波数変換処理で再生された予測誤差データと前記動き予測画像データとを加算してローカルデコード画像データを出力する加算処理、(i)前記加算処理で算出されたローカルデコード画像データをフレームメモリに格納する処理、(j)前記フレームメモリが保持する、符号化対象フレームのローカルデコード画像データとそれよりも前のフレームのローカルデコード画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理、(k)前記小数画素画像データ処理で生成された小数画素精度画像データを参照画像データとして動き検出を行って予測画像を生成する動き検出・動き補償処理、及び(l)前記動き検出・動き補償処理で生成された動き予測画像データを前記予測画像メモリに書き込む書き込み処理。
〔7〕《画像復号装置》動き予測によって符号化された符号化データを入力して符号化画像データと付加情報に分離し、分離された符号化画像データを復号して得られる動き予測誤差に動き予測画像データを加算して画像データを再生し、再生された再生画像データに基づいて前記動き予測画像データを生成することが可能な画像復号装置は、前記再生画像データを複数フレーム分に亘り保持するフレームメモリ(1506)と、前記フレームメモリが保持する、復号対象フレームの再生画像データとそれよりも前のフレームの再生画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理部(1507,1508)と、を有する。画像復号装置は、前記小数画素画像データ処理部で生成された小数画素精度画像データを参照画像データとして動き検出を行って動き予測画像データを生成する。
上記より、参照画像データとしての小数画素精度画像データは、復号対象フレームの再生画像データと当該フレームから離れた別のフレームの再生画像データとの双方のデータを用いて生成することが可能であるから、補間だけで生成する場合に比べてより高精度な小数画素精度画像データを生成することができる。
これにより、復号の観点より動き予測精度の改善に資することができ、更に、符号化復号を経て得られる画像の高画質に資することができる。
〔8〕項7の画像復号装置において、前記小数画素画像データ処理部は、フレームメモリに格納された復号対象フレームの再生画像データとそれより前の所定範囲の前フレームの再生画像データとの間の動き量が小数画素精度であるか否かを判定し、小数画素精度の判定結果が得られたときは、その前フレームの再生画像データと前記復号対象フレームの再生画像データとを用いて小数画素精度画像データを生成し、小数画素精度の判定結果が得られないときは復号対象フレームの再生画像データに対する補間演算によって小数画素精度画像データを生成する。これにより、無駄なデータ処理が減って処理量と処理時間の縮小に寄与することができる。
〔9〕項8の画像復号装置において、前記小数画素画像データ処理部は、前記小数画素精度であるか否かの判定の対象をIピクチャ又はPピクチャのフレーム形態に限定する。より高精度若しくは高画質な小数画素精度画像データを生成することができる。
〔10〕項9の画像復号装置において、前記小数画素画像データ処理部は、前記所定範囲の前フレームに対して最も復号対象フレームに近い前フレームから順次前記フレーム形態の判定と前記小数画素精度であるか否かの判定を行う。復号対象フレームにより近いフレームの再生画像データを用いるほど、より高画質(高精度)の小数画素精度画像データを生成することができるからである。
〔11〕項7の画像復号装置において、前記小数画素画像生成部は、例えば画像データの複数の画像信号のそれぞれの信号に対して位相シフト処理を行って新たな複数の画像信号を生成し、前記複数の画像信号と新たな複数の画像信号とに係数を乗じて合成することにより、小数画素精度画像データを生成する。
〔12〕《復号方法》画像復号方法は以下の(a)乃至(l)の処理を含む。(a)動き予測によって符号化された符号化データから成る符号化ストリームを入力して可変長復号する可変長復号処理、(b)可変長復号された符号化データを符号化画像データと付加情報に分離する構文解析処理、(c)分離された符号化画像データを逆量子化する逆量子化処理、(d)前記逆量化処理で逆量子化されたデータを逆周波数変換して動き予測誤差を再生するする逆周波数変換処理、(e)逆周波数変換処理で再生された動き予測誤差に予測画像メモリの動き予測画像データを加算して画像データを再生する加算処理、(f)前記加算処理で再生された再生画像データをフレームメモリに書き込む再生画像データ書き込み処理と、(g)前記フレームメモリが保持する、復号対象フレームの再生画像データとそれよりも前のフレームの再生画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理、(h)前記小数画素画像データ処理で生成された小数画素精度画像データと前記付加情報を用いて動き予測画像データを生成する動き補償処理、及び(i)前記動き補償処理で生成された動き予測画像データを前記予測画像メモリに書き込む書き込み処理。
〔13〕項12の画像復号方法において、前記小数画素画像データ処理は、前記小数画素精度であるか否かの判定の対象をIピクチャ又はPピクチャのフレーム形態に限定する。
〔14〕項13の画像復号方法において、前記小数画素画像データ処理は、前記所定範囲の前フレームに対して最も復号対象フレームに近い前フレームから順次前記フレーム形態の判定と前記小数画素精度であるか否かの判定を行う。
〔15〕項12の画像復号方法において、前記小数画素画像データ処理は、画像データの複数の画像信号のそれぞれの信号に対して位相シフト処理を行って新たな複数の画像信号を生成し、前記複数の画像信号と新たな複数の画像信号とに係数を乗じて合成することにより、小数画素精度画像データを生成する。
2.実施の形態の詳細
実施の形態について更に詳述する。以下、本発明を実施するための形態を図面に基づいて詳細に説明する。なお、発明を実施するための形態を説明するための全図において、同一の機能を有する要素には同一の符号を付して、その繰り返しの説明を省略する。
実施の形態について更に詳述する。以下、本発明を実施するための形態を図面に基づいて詳細に説明する。なお、発明を実施するための形態を説明するための全図において、同一の機能を有する要素には同一の符号を付して、その繰り返しの説明を省略する。
《画像符号化装置及び画像符号化方法》
図1には本発明に係る画像符号化装置の一例が示される。101は入力画像データを記憶する原画像メモリである。102は原画像メモリから出力された入力画像データとフレームメモリ113から出力された予測画像データとの差分を取る減算器である。103は、減算器102で演算した原画像データと予測画像でー他との差分画像を空間周波数領域に変換する周波数変換部である。104は、周波数変換部103で周波数変換したデータを量子化する量子化部である。105は量子化部104で量子化したデータを可変長符号化する可変長符号化部である。106は量子化部104で量子化したデータを逆量子化する逆量子化部である。107は、逆量子化部106にて逆量子化したデータを逆周波数変換する逆周波数変換部である。108は、逆周波数変換部107にて逆周波数変換したデータにフレームメモリ113に格納されている予測画像データを加算する加算器である。109は、加算器108にて加算して得られるデータ(ローカルデコード画像データ)を格納するフレームメモリである。110は小数画素精度画像生成方法決定部、111は小数画素精度画像生成部である。
図1には本発明に係る画像符号化装置の一例が示される。101は入力画像データを記憶する原画像メモリである。102は原画像メモリから出力された入力画像データとフレームメモリ113から出力された予測画像データとの差分を取る減算器である。103は、減算器102で演算した原画像データと予測画像でー他との差分画像を空間周波数領域に変換する周波数変換部である。104は、周波数変換部103で周波数変換したデータを量子化する量子化部である。105は量子化部104で量子化したデータを可変長符号化する可変長符号化部である。106は量子化部104で量子化したデータを逆量子化する逆量子化部である。107は、逆量子化部106にて逆量子化したデータを逆周波数変換する逆周波数変換部である。108は、逆周波数変換部107にて逆周波数変換したデータにフレームメモリ113に格納されている予測画像データを加算する加算器である。109は、加算器108にて加算して得られるデータ(ローカルデコード画像データ)を格納するフレームメモリである。110は小数画素精度画像生成方法決定部、111は小数画素精度画像生成部である。
小数画素精度画像生成方法決定部110及び小数画素精度画像生成部111は、前記フレームメモリ109が保持する、符号化対象フレームのローカルデコード画像データとそれよりも前のフレームのローカルデコード画像データとを用いて小数画素精度画像データを生成することを可能にする小数画素画像データ処理部を構成するものである。小数画素精度画像生成方法決定部110はその生成方向を決定し、小数画素精度画像生成部111は決定された生成方法に従ってローカルデコード画像データから小数画素精度画像データを生成する。その詳細については後述する。
112は小数画素精度画像生成部111にて生成した小数画素精度画像を参照画像として動き検出により原画像に近い画像を検出し、予測画像データを生成する動き検出・補償部である。113は動き検出・補償部112にて生成した画像(予測画像データ)を格納するフレームメモリである。114は、フレームメモリ109に格納したローカルデコード画像データからフレーム内のデータを用いて予測画像を生成する画面内予測部である。
前記小数画素精度画像生成方法決定部110が決定する小数画素精度画像の生成方法は図2のAとBに大別される。Aに示される第1の方法は、符号化対象フレームとその前のフレームとの異なる2枚のフレームのローカルデコード画像データを用いて小数画素精度画像データを生成する。その生成には、2枚のフレームの画像ブロック(例えばマクロブロック)に対して後述する超解像処理を用いて高解像度化を行う。Bに示される第2の方法は、符号化対象フレームの1枚のフレームのローカルデコード画像データを用いて小数画素精度画像データを生成する。その生成には、1枚のフレームの画像ブロック(例えばマクロブロック)に対して補間演算を用いて高解像度化する。第1の方法で生成される小数画素精度画像データは、符号化対象フレームのローカルデコード画像データと当該フレームから離れた別のフレームのローカルデコード画像データとの双方のデータを用いて生成することが可能であるから、第1の方法は、補間だけで生成する第2の方法に比べてより高精度な小数画素精度画像データを生成することができる。第2の方法を採用すれば第1の方法に比べて演算処理データが少ないから小数画素精度画像データを生成するための演算処理負担が軽減される。
第1の方法又は第2の方法のいずれかを用いるかは、例えば、フレームメモリに格納された符号化対象フレームのローカルデコード画像データとそれより前の所定範囲の前フレームのローカルデコード画像データとの間の動き量が小数画素精度であるか否かを判定し、小数画素精度の判定結果が得られたときは第1の方法、小数画素精度の判定結果が得られないときは第2の方法を選択する。
前記前フレームの候補は以下のように選択する。
(1)選択候補フレームは、時間方向の動き予測を行うことなく画面内の情報を用いて符号化されて得られる画面であるIピクチャ(Intra-Picture)又は画面間の順方向予測符号化によって得られる画面であるPピクチャ(Predictive-Picture)のフレームに限定する。過去と未来の双方向からの予測符号化によって得られるが面であるBピクチャ(Bi-directional Predictive-Picture)を除外する。これにより、より高精度若しくは高画質な小数画素精度画像データを生成することができる。
(2)上記第1の条件を満足するフレームの内、最も符号化対象フレームに近いピクチャを候補フレームとする。これにより、より高画質(高精度)な小数画素精度画像生成可能になる。符号化対象フレームにより近いフレームのローカルデコード画像データを用いるほど、より高画質(高精度)の小数画素精度画像データを生成することができるからである。
(3)上記第1及び第2条件を満足するフレームと符号化対象フレームとの動き検出結果が縦方向及び横方向の双方で整数画素精度の動き量である場合、次に符号化対象フレームに近い別のフレームであって、IまたはPピクチャであるフレームを候補とする。これにより、整数画素精度の動き量では超解像処理ができないという問題を解決できる。
(4)所定の範囲の過去フレームを遡っても、上記(3)を満たすフレームが無い場合は候補の選択を打ち切る。この場合に、通常の補間拡大処理による第2の方法を選択する。また、第1の方法による前フレームが符号化対象フレームから離れるに従って小数画素精度画像データの高精度若しくは高画質を期待できなくなる。この点を考慮して、符号化対象フレームから所定フレーム数だけ離れたフレームの範囲で小数画素精度画像データがなければそれ以降のフレームに対する画素精度の判定を行わずに、補間による処理を選択するから、無駄な処理を極力低減することができる。また、このようにフレーム数の範囲を制限することで、フレームメモリに格納しておくフレーム数を低減することができ、フレームメモリを構成するハードウェア資源が小さくて済む。これにより、低コスト化を図ることが可能である。
(1)選択候補フレームは、時間方向の動き予測を行うことなく画面内の情報を用いて符号化されて得られる画面であるIピクチャ(Intra-Picture)又は画面間の順方向予測符号化によって得られる画面であるPピクチャ(Predictive-Picture)のフレームに限定する。過去と未来の双方向からの予測符号化によって得られるが面であるBピクチャ(Bi-directional Predictive-Picture)を除外する。これにより、より高精度若しくは高画質な小数画素精度画像データを生成することができる。
(2)上記第1の条件を満足するフレームの内、最も符号化対象フレームに近いピクチャを候補フレームとする。これにより、より高画質(高精度)な小数画素精度画像生成可能になる。符号化対象フレームにより近いフレームのローカルデコード画像データを用いるほど、より高画質(高精度)の小数画素精度画像データを生成することができるからである。
(3)上記第1及び第2条件を満足するフレームと符号化対象フレームとの動き検出結果が縦方向及び横方向の双方で整数画素精度の動き量である場合、次に符号化対象フレームに近い別のフレームであって、IまたはPピクチャであるフレームを候補とする。これにより、整数画素精度の動き量では超解像処理ができないという問題を解決できる。
(4)所定の範囲の過去フレームを遡っても、上記(3)を満たすフレームが無い場合は候補の選択を打ち切る。この場合に、通常の補間拡大処理による第2の方法を選択する。また、第1の方法による前フレームが符号化対象フレームから離れるに従って小数画素精度画像データの高精度若しくは高画質を期待できなくなる。この点を考慮して、符号化対象フレームから所定フレーム数だけ離れたフレームの範囲で小数画素精度画像データがなければそれ以降のフレームに対する画素精度の判定を行わずに、補間による処理を選択するから、無駄な処理を極力低減することができる。また、このようにフレーム数の範囲を制限することで、フレームメモリに格納しておくフレーム数を低減することができ、フレームメモリを構成するハードウェア資源が小さくて済む。これにより、低コスト化を図ることが可能である。
図1において、前記小数画素精度画像生成方法決定部110は、フレーム選択部120、動き検出部121、及び判定部122によって上記第1の方法又は第2の方法を決定する。フレーム選択部120は所定の手順に従ってフレームメモリ109から所定のフレームのローカルデコード画像データをリードする。動き検出部121はフレーム選択部でリードされた2枚のフレームのローカルデコード画像データに関する動き検出を行う。判定部122はその動き検出結果等に従って、上記のように第1の方法又は第2の方法を選択する。
図3には前記小数画素精度画像生成方法決定部110における決定処理のフローチャートが例示される。前フレームの選択は符号化対象フレームの直前のフレームから開始される(130)。選択された前フレームが符号化対象フレームから所定フレーム数分だけ離れたフレームであるか否かが判別され(131)、離れていれば、第2方法が選択され、第2方法による小数画素精度画像データの生成の指示と必要なデータが小数画素精度画像生成部111に与えられる(132)。
所定フレーム数離れていなければ、当該前フレームはBピクチャであるかが判別され、Bピクチャであればステップ131の処理も戻り、Bピクチャでなければ、当該前フレームと符号化対象フレームとの間の動き検出が行われる(134)。動き検出の結果、動き量が整数画素精度であるときはステップ131の処理も戻る。動き量が整数画素精度でなければ、第1方法による小数画素精度画像データの生成の指示と、必要なデータ(符号化対象フレームのローカルデコード画像データ、選択された前フレームのローカルデコード画像データ、動き検出結果の画像データ、および動きベクトルの情報)が小数画素精度画像生成部111に与えられる(136)。
図4には符号化処理の全体的な処理フローが示される。図4を参照しながら、符号化処理の流れを全体的に説明する。まず本、符号化装置は入力画像データを原画像メモリ101に格納する(201)。入力画像データとしては、例えばRGB信号、Y,Cb,Cr信号などのディジタル信号がある。符号化装置において、原画像メモリ101には、入力画像を1フレーム分格納しても良いし、複数の画素ブロックに分割してその画素ブロック単位で格納しても良い。次に原画像メモリ101から読み出した原画像データと予測画像データとの差分を取る(202)。原画像データと予測画像データとの差分がない場合には、符号化処理を終了する(203)。このとき、差分情報なしの情報をストリームに付加すれば復号側での処理も簡略化できる。原画像データと予測画像データとの差分がある場合には、減算器102にて演算した差分画像を周波数変換部103にて離散コサイン変換(DCT)等の周波数変換を用いて周波数領域に変換する。周波数変換はDCT以外にもアダマール変換やフーリエ変換などその他の変換を用いても良い。複数の周波数変換を使用する場合には、ストリームに周波数変換の種類を識別するための情報を付加すればよい。また、周波数変換のブロックサイズは、例えば8×8画素単位のような縦、横のサイズが同じでも16×8画素のように、縦と横のサイズが異なってもよく、その際には、ストリームに周波数変換のブロックサイズ情報を付加すればよい。
周波数変換部103にて周波数変換したデータは、量子化部106にて量子化される(205)。量子化処理は、従来の動画像符号化規格に基づく手法を用いても、新たに量子化ステップを決定しても良い。新たに量子化ステップを決定する際には、ストリームに量子化ステップ情報を付加すれば良い。量子化部106にて量子化したデータは、可変長符号化部105にて符号化される。可変長符号化の方法として、従来の符号化規格で採用されているCABAC(Context-Adaptive Binary Arithmetic Coding)やCAVLC(Context-Adaptive Variable Length Coding)等の手法を用いても良いし、コードテーブルを新たに作成しても良い。その際には、コードテーブル情報を符号化ストリームに付加する。
次に、逆量子化部106にて、逆量子化を実施する(206)。逆量子化の手法も従来の動画像符号化規格に基づく手法を用いればよい。逆量子化部106にて演算したデータは、逆周波数変換部107にて逆周波数変換される(207)。逆周波数変換部107では、周波数変換部103にて実施した周波数変換ブロックサイズや周波数変換の種類を用いて、周波数領域から空間領域への逆変換を行う。逆周波数変換したデータとフレームメモリ113に格納したデータを加算し、フレームメモリ109に格納する。次に、前述の如く、フレームメモリ109に格納したデータをフレーム選択部120が選択し、選択されたフレームのデータと符号化対象フレームのデータとに対して動き検出部110が画素単位での動き検出処理を行なって、小数画素精度画像生成方法を決定する(208)。動き検出処理は従来の符号化処理で用いられてきたブロックマッチング法を用いても良いし、小数画素画像の精度を向上させるため、1画素単位に行っても良い。その際、動きベクトル情報を符号化ストリームに付加するとデータ量が膨大となるため、復号側で符号化側と同じ動き検出処理を実施することでデータ量を削減することができる。その際には、符号化側で動き検出方法を決めたテーブルを用意し、そのテーブル番号をストリームに付加すればよい。一方、動きベクトル情報を送る場合には、復号側で動き検出を実施する必要がなく、また動き検出方法を付加せずに済む。したがって、ユーザ側で動き検出方法を付加してデータ量を削減するか否かを決定し、その決定情報をストリームに付加することでより、ハードウェア等の処理性能に応じた適切な符号化処理を行うことができる。小数画素精度画像生成部111では、小数画素精度画像生成方法決定部110で検出した動きベクトルとフレームメモリ109に格納されている複数の画像データを用いて小数画素精度の画像データを生成する(209)。第1方法による小数画素精度の画像データの生成方法についてはその詳細を後述する。補間演算による第2方法はMPEG-4、H.264/AVC等において公知の小数画素精度による動き探索処理で用いられる演算手法と同様であるからその詳細な説明は省略する。
次に、小数画素画像生成部111にて生成した小数画素画像データと原画像データとを用いて動き検出・動き補償処理を実施して予測画像を生成する(210)。動き検出・動き補償処理(210)は従来の符号化処理で用いるブロックマッチング法を用いて小数画素精度の動きベクトルを算出すればよい。その際、小数画素精度の動きベクトル情報を符号化ストリームに付加するとデータ量が膨大となるため、復号側で符号化側と同じ動き検出処理を実施することでデータ量を削減することができる。以上の処理を入力映像のフレーム内すべてのブロックの処理が終了するまで繰り返し行う(211)。
ここで、第1方法による小数画素精度の画像データの生成方法として例えば特開2007-324789号公報に記載の方法を適用した場合についてその概要を説明する。
図5には小数画素精度画像の生成処理の概要が示される。小数画素精度画像生成部111は、フレームメモリ109に格納されている複数の画像データ301と、動き検出部110が検出した当該複数の画像データ301間の動きベクトルを用いて、複数の画像データ301の各画素の位置あわせをおこない、位置あわせ後の複数の画像の各画素に画素値に所定の係数を乗じて合成することにより、小数画素精度画像(高解像度画像とも記す)302を生成する。
図16は小数画素精度画像生成部111の処理の流れを示すフロー図である。小数画素精度画像生成部111では、例えば、(1)位置推定、(2)広帯域補間、(3)加重和、の3つの処理により高解像度画像生成を行う。ここで、(1)位置推定は、入力した複数の画像フレームの各画像データを用いて、各画像データのサンプリング位相(標本化位置)の差を推定するものである(1401、1402)。(2)広帯域補間は、各画像データを折返し成分も含め、原信号の高周波成分をすべて透過する帯域の広いローパスフィルタを用いて画素数(サンプリング点)を補間して増やし、画像データを高密度化するものである(1403)。(3)加重和は、各高密度化データのサンプリング位相に応じた重み係数により加重和をとることによって、画素サンプリングの際に生じた折返し成分を打ち消して除去するとともに、同時に原信号の高周波成分を復元するものである(1404)。
図7に、この高解像度画像生成技術の概要を示す。同図Aに示すように、異なる時間軸上のフレーム#1(501)、フレーム#2(502)、フレーム#3(503)が入力され、これらを合成して出力フレーム(506)を得ることを想定する。簡単のため、まず被写体が水平方向に移動(504)した場合を考え、水平線(505)の上の1次元の信号処理によって小数画素画像生成することを考える。このとき、同図Bと同図Dに示すように、フレーム#2(502)とフレーム#1(501)では、被写体の移動(504)の量に応じて信号波形の位置ずれが生じる。上記(1)位置推定によってこの位置ずれ量を求め、同図Cに示すように、位置ずれが無くなるようにフレーム#2(502)を動き補償(507)するとともに、各フレームの画素(508)のサンプリング位相(509)(510)の間の位相差θ(511)を求める。この位相差θ(511)に基づき、上記(2)広帯域補間および(3)加重和を行うことにより、同図Eに示すように、元の画素(508)のちょうど中間(位相差θ=π)の位置に新規画素(512)を生成することにより、小数画素画像生成を実現する。 (3)加重和については後述する。なお、実際には被写体の動きが平行移動だけでなく、回転や拡大・縮小などの動きを伴うことも考えられるが、フレーム間の時間間隔が微小な場合や被写体の動きが遅い場合には、これらの動きも局所的な平行移動に近似して考えることができる。
小数画素精度画像生成部111の第1の構成例は、参考文献1(特開平8−336046号)、参考文献2(特開平9−69755号)、参考文献3(青木伸 “複数のデジタル画像データによる超解像処理”, Ricoh Technical Report pp.19-25, No.24, NOVEMBER, 1998)に記載の高解像度処理を行う構成とすることである。小数画素画像生成部111の第一の構成例は、上記(3)の加重和を行う際に、図8に示すように、少なくとも3枚のフレーム画像の信号を用いれば、1次元方向の2倍の高解像度画像生成が可能である。
ここで、図8を用いて、小数画素精度画像生成部111の第1の構成例における小数画素精度画像生成処理ついて説明する。図8は、1次元の周波数領域で、各成分の周波数スペクトルを示した図である。同図において、周波数軸からの距離が信号強度を表し、周波数軸を中心とした回転角が位相を表す。上記(3)の加重和について、以下に詳しく説明する。
上記(2)の広帯域補間にて、ナイキスト周波数の2倍の帯域(周波数0〜サンプリング周波数fsまでの帯域)を透過する広帯域ローパスフィルタによって画素補間すると、原信号と同じ成分(以下、原成分)と、サンプリング位相に応じた折返し成分の和が得られる。このとき、3枚のフレーム画像の信号に対して上記(2)広帯域補間の処理を行うと、図8Aに示すように、各フレームの原成分(601)、(602)、(603)の位相はすべて一致し、折返し成分(604)、(605)、(606)の位相は各フレームのサンプリング位相の差に応じて回転することがよく知られている。それぞれの位相関係をわかりやすくするために、各フレームの原成分の位相関係を同図Bに示し、各フレームの折返し成分の位相関係を同図Cに示す。
ここで、3枚のフレーム画像の信号に対して、乗算する係数を適切に選択して上記(3)加重和を行うことにより、各フレームの折返し成分(604)、(605)、(606)を互いに打ち消して除去することができ、原成分だけを抽出できる。このとき、各フレームの折返し成分(604)、(605)、(606)のベクトル和を0にする、すなわち、Re軸(実軸)の成分とIm軸(虚軸)の成分を両方ともに0とするためには、少なくとも3つの折返し成分が必要となる。従って、少なくとも3枚のフレーム画像の信号を用いることにより、2倍の小数画素画像生成を実現すること、すなわち1個の折返し成分を除去することができる。
以上述べたように、第一の構成例では、3枚のフレームの画像信号を用いて高精度の小数画素を生成することができる。
次に、小数画素精度画像生成部111の第2の構成例を図6に示す。小数画素精度画像生成部111の第2の構成例では、少なくとも2枚のフレーム画像の信号を用いれば、1次元方向の2倍の小数画素画像生成が可能である。以下に詳細を説明する。
まず、フレームメモリ109から入力部400に符号化対象フレームと過去に符号化済みのフレームの複数のフレームが入力される。
まず位置推定部401により、入力部400に入力したフレーム#1上の処理対象の画素のサンプリング位相(標本化位置)を基準として、フレーム#2上の対応する画素の位置を推定し、サンプリング位相差θ402を求める。次に、動き補償・アップレート部415のアップレート器403,404により、位相差θ402の情報を用いてフレーム#2を動き補償してフレーム#1と位置を合わせるとともに、フレーム#1とフレーム#2の画素数をそれぞれ2倍に増して高密度化する。位相シフト部416では、この高密度化したデータの位相を一定量だけシフトする。ここで、データの位相を一定量だけシフトする手段として、π/2位相シフト器406、408を用いることができる。また、π/2位相シフト器406,408で生じる遅延を補償するために、遅延器405,407により高密度化したフレーム#1とフレーム#2の信号を遅延させる。折返し成分除去部417では、遅延器405、407とヒルベルト変換器406、408の各出力信号に対して、係数決定器409にて位相差θ402をもとに生成した係数C0、C2、C1、C3を乗算器410、411、412、413にてそれぞれ乗算し、加算器(414)にてこれらの信号を加算して出力を得る。この出力は、出力部418から出力される。
なお、位置推定部401は、上記従来技術をそのまま用いて実現することができる。アップレート器403、404、π/2位相シフト器406,408、折返し成分除去部417の各詳細については後述する。
図9に、小数画素精度画像生成部111の第2の構成例における動作を示す。同図は、図6に示した遅延器405、407とπ/2位相シフト器406、408の各出力を1次元の周波数領域で示したものである。同図Aにおいて、遅延器405、407から出力したアップレート後のフレーム#1とフレーム#2の信号はそれぞれ、原成分701、702と、元のサンプリング周波数(fs)から折り返した折返し成分705、706を加えた信号となる。このとき、折返し成分706は上述の位相差θ402だけ位相が回転している。一方、π/2位相シフト器406、408から出力したアップレート後のフレーム#1とフレーム#2の信号はそれぞれ、π/2位相シフト後の原成分703、704と、π/2位相シフト後の折返し成分707、708を加えた信号となる。同図Bおよび同図C、同図Aに示した各成分の位相関係をわかりやすくするために、原成分と折返し成分をそれぞれ抜き出して示したものである。ここで、同図Bに示す4つの成分のベクトル和を取ったときに、Re軸の成分を1とし、Im軸の成分を0とするとともに、同図Cに示す4つの成分のベクトル和を取ったときに、Re軸とIm軸の両方の成分を0とするように、各成分に乗算する係数を決定して加重和をとれば、折返し成分を打ち消してキャンセルし、原成分だけを抽出することができる。すなわち、2枚のフレーム画像だけを用いて、1次元方向の2倍の高解像度画像生成を行うことができる。この係数決定方法の詳細については後述する。
図10、図11、を用いて小数画素精度画像生成部111の第2の構成例に用いるアップレート器403、404の動作を説明する。図10は、横軸は周波数を、縦軸は利得(入力信号振幅に対する出力信号振幅の比の値)を表し、アップレート器403、404の「周波数-利得」特性を示している。ここで、アップレート器403、404では、もとの信号のサンプリング周波数(fs)に対して2倍の周波数(2fs)を新しいサンプリング周波数とし、もとの画素間隔のちょうど中間の位置に新しい画素のサンリング点(=ゼロ点)を挿入することによって画素数を2倍にして高密度化するとともに、-fs〜+fsの間の周波数をすべて利得2.0の通過帯域とするフィルタをかける。このとき、同図に示すように、周波数-利得特性はデジタル信号の対称性により、2fsの整数倍の周波数ごとに繰り返す特性となる。
図11は、図10に示した周波数特性を逆フーリエ変換して得られるフィルタのタップ係数を示している。このとき、各タップ係数Ck(ただし、kは整数)は一般的に知られているsinc関数となり、サンプリングの位相差θ402を補償するために(-θ)だけシフトし、Ck=2sin(πk+θ)/(πk+θ)とすればよい。なお、アップレート器403では、位相差θ402を0とおき、Ck=2sin(πk)/(πk)とすればよい。また、位相差θ(402)を、整数画素単位(2π)の位相差+小数画素画像単位の位相差で表すことにより、整数画素単位の位相差の補償については単純な画素シフトにより実現し、小数画素画像単位の位相差の補償については上記アップレート器403、404のフィルタを用いてもよい。
図12は、小数画素画像生成部111の第2の構成例に用いるπ/2位相シフト器406、408の周波数-利得特性を示している。π/2位相シフト器406、408として、一般に知られているヒルベルト変換器を用いることができる。同図Aにおいて、横軸は周波数を、縦軸は利得(入力信号振幅に対する出力信号振幅の比の値)を表し、ヒルベルト変換器の「周波数-利得」特性を示している。ここで、ヒルベルト変換器では、もとの信号のサンプリング周波数(fs)に対して2倍の周波数(2fs)を新しいサンプリング周波数として、-fs〜+fsの間の0を除く周波数成分をすべて利得1.0の通過帯域とする。また、同図Bにおいて、横軸は周波数を、縦軸は位相差(入力信号位相に対する出力信号位相の差)を表し、ヒルベルト変換器の「周波数-位相差」特性を示している。ここで、0〜fsの間の周波数成分についてはπ/2だけ位相を遅らせ、0〜-fsの間の周波数成分についてはπ/2だけ位相を進ませる。このとき、同図に示すように、デジタル信号の対称性により、2fsの整数倍の周波数ごとに繰り返す特性となる。
図13は、図12に示した周波数特性を逆フーリエ変換して得られるフィルタのタップ係数を示している。このとき、各タップ係数Ckは、k=2m(ただしmは整数)のときはCk=0とし、k=2m+1のときはCk=-2/(πk)とすればよい。
なお、小数画素精度画像データの生成に用いるπ/2位相シフト器406、408は、微分器を用いることも可能である。この場合、正弦波を表す一般式cos(ωt+α)をtで微分して1/ωを乗じると、d(cos(ωt+α))/dt*(1/ω)=-sin(ωt+α)=cos(ωt+α+π/2)となり、π/2位相シフトの機能を実現できる。すなわち、対象とする画素の値と隣接画素の値との差分を取ったのちに、1/ωの「周波数-振幅」特性を持ったフィルタを掛けることによってπ/2位相シフトの機能を実現してもよい。
図14を用いて小数画素精度画像生成部111の第2の構成例に用いる係数決定器(409)の動作と具体例を説明する。同図Aに示すように、図9Bに示した4つの成分のベクトル和を取ったときに、Re軸の成分を1とし、Im軸の成分を0とするとともに、図9C示した4つの成分のベクトル和を取ったときに、Re軸とIm軸の両方の成分を0とするように、各成分に乗算する係数を決定すれば、2枚のフレーム画像だけを用いて、1次元方向の2倍の小数画素画像生成行う画像信号処理装置を実現できる。図6に示すように、遅延器(405)の出力(アップレート後のフレーム#1の原成分と折返し成分の和)に対する係数をC0、π/2位相シフト器406の出力(アップレート後のフレーム#1の原成分と折返し成分のそれぞれのπ/2位相シフト結果の和)に対する係数をC1、遅延器407の出力(アップレート後のフレーム#2の原成分と折返し成分の和)に対する係数をC2、ヒルベルト変換器406の出力(アップレート後のフレーム#2の原成分と折返し成分のそれぞれのπ/2位相シフト結果の和)に対する係数をC3、として図14Aの条件を満たすと仮定すると、図9Bおよび図9Cに示した各成分の位相関係から、図14Bに示す連立方程式を得ることができ、これを解くと図14Cに示す結果を導くことができる。係数決定器409は、このようにして得た係数C0、C1、C2、C3を出力すればよい。一例として、位相差θ402をπ/8ごとに0〜2πまで変化させたときの係数C0、C1、C2、C3の値を、図14Dに示す。これは、もとのフレーム#2の信号を、1/16画素の精度で位置推定し、フレーム#1に対して動き補償した場合に相当する。
なお、アップレート器403、404およびπ/2位相シフト器406、407は、理想的な特性を得るためには無限大のタップ数を必要とするが、タップ数を有限個で打ち切って簡略化しても実用上問題ない。このとき、一般的な窓関数(例えばハニング窓関数やハミング窓関数など)を用いてもよい。簡略化したヒルベルト変換器の各タップの係数を、C0を中心として左右点対象の値、すなわちC(-k)=-Ck(kは整数)とすれば、位相を一定量だけシフトすることができる。
以上説明したように、図1の小数画素精度画像生成部111の構成を図6乃至図14において説明した構成とすることにより、複数のフレームから高精度の小数画素精度画像データを生成することが可能となる。
特に、小数画素精度画像生成部111の第2の構成によれば、2枚のフレームから1枚の高精度の小数画素精度画像データを生成することが可能となり、第1の構成例よりも少ないでメモリ量で符号化できる。
次に画面内予測フレームを参照フレームとする際の小数画素精度画像生成処理について説明する。画面内予測フレームでは、過去のフレームを参照することができないため、図15に示すように符号化対象ブロックと最も近いブロックを探索し画面内の動きベクトルを求める。このとき、探索ブロックサイズはブロック単位ではなく1画素単位でも良い。動きベクトル算出後の小数画素生成処理においては、上記フレーム間にて実施する方法と同様である。
なお、上記の小数画素精度画像生成処理においては、動きベクトルが示す位置が整数画素精度の場合には小数画素画像を生成できない。そこで、小数画素精度画像生成方法決定部110での結果に基づいて、動き量が整数画素精度か否かを判定する。動き検出位置が整数画素精度位置の場合には、前記第2の方法として、従来の符号化規格で用いるフィルタ補間によって小数画素精度画像を生成する。このとき、従来からの第2の方法を用いるか、前記第1の方法を用いるかを否かの情報をストリームに付加することで、復号側で小数画素精度画像を再生することが可能となる。どちらの方法で切り替えるかの処理単位は、画素ブロック単位でもフレーム単位でも良い。その際には、ストリームに画素ブロック単位で符号化するのか、またはフレーム単位で符号化するかの情報を付加すればよい。
以上説明した画像符号化装置およびその画像符号化方法によれば、より高精度の小数画素精度の参照画像を生成することができるので、動き予測精度が向上し、より少ないデータ量で効率よく映像信号を圧縮することが可能となる。
また、原画像と予測画像の差分を判定し、差分がない場合に、周波数変換処理、量子化処理、逆量子化処理、逆周波数変換処理、動き検出処理、動き補償処理を省略するから、符号化側の処理量を削減することが可能となる。
また、複数のフレームを参照可能である動画像符号化規格においては、より多くの画像データから小数画素画像を生成することができるので、より高精度の小数画素画像を生成することでき、動き予測精度が改善して少ないデータ量での符号化が可能となる。
《画像復号装置及び画像復号方法》
図17に本発明に係る画像復号装置のブロックダイヤグラムが例示される。画像復号装置において、1501は、符号化側から送られた符号化データを復号する可変長復号部である。1502は、可変長復号部1501にて復号したデータの構文を解析する構文解析部であり、符号化データを符号化画像データと付加情報に分離する。1503は、構文解析部1502より送られるデータを逆量子化する逆量子化部である。1504は逆量子化部1530にて逆量子化したデータを逆周波数変換して動き予測誤差データを生成する逆周波数変換部である。1505は、逆周波数変換部1504にて逆周波数変換した動き予測誤差とフレームメモリ1510に格納した動き予測画像データを加算して画像データを生成する加算器である。1506は、加算器1505で加算されて得られる再生画像データを格納するフレームメモリである。1507は小数画素精度画像生成方法決定部、1508は小数画素精度画像生成部である。
図17に本発明に係る画像復号装置のブロックダイヤグラムが例示される。画像復号装置において、1501は、符号化側から送られた符号化データを復号する可変長復号部である。1502は、可変長復号部1501にて復号したデータの構文を解析する構文解析部であり、符号化データを符号化画像データと付加情報に分離する。1503は、構文解析部1502より送られるデータを逆量子化する逆量子化部である。1504は逆量子化部1530にて逆量子化したデータを逆周波数変換して動き予測誤差データを生成する逆周波数変換部である。1505は、逆周波数変換部1504にて逆周波数変換した動き予測誤差とフレームメモリ1510に格納した動き予測画像データを加算して画像データを生成する加算器である。1506は、加算器1505で加算されて得られる再生画像データを格納するフレームメモリである。1507は小数画素精度画像生成方法決定部、1508は小数画素精度画像生成部である。
ここで、小数画素精度画像生成方法決定部1507の動作は、図1に示す画像符号化装置の小数画素精度画像生成方法決定部110の動作と同様である。すなわち、前記小数画素精度画像生成方法決定部1507は、フレーム選択部1520、動き検出部1521、及び判定部1522によって小数画素精度画像生成方法を決定する。フレーム選択部1520は所定の手順に従ってフレームメモリ1506から所定のフレームの再生画像データをリードする。動き検出部1521はフレーム選択部1520でリードされた2枚のフレームの再生画像データに関する動き検出を行う。判定部1522はその動き検出結果等に従って、小数画素精度画像生成方法を選択する。
ここで、小数画素精度画像生成方法決定部1507の動作の詳細も図1に示す画像符号化装置の小数画素精度画像生成方法決定部110の動作と同様である。すなわち、例えば、図3に示す決定処理のフローチャートに従い、図2に示す第1の方法又は第2の方法の何れかの小数画素精度画像生成方法を決定する。当該動作の詳細については、図1に示す画像符号化装置の小数画素精度画像生成方法決定部110の説明と同様であるため、説明を省略する。
また小数画素精度画像生成部1508の動作も図1に示す画像符号化装置の小数画素精度画像生成部111の動作と同様であるため、説明を省略する。
以上のように、小数画素精度画像生成方法決定部1507、小数画素精度画像生成部1508が、図1に示す画像符号化装置の小数画素精度画像生成方法決定部110、小数画素精度画像生成部111と同様の処理により小数画素精度画像を生成することにより、図17に示す画像復号装置においては、画像符号化装置で想定した高精度の復号画像を生成することが可能となる。
次に、1509は、構文解析部1502から送られる動きベクトルと小数画素精度画像生成部1508にて生成された画像データから復号画像を生成する動き補償部である。1510は、動き補償部1509にて生成した復号画像データを格納するフレームメモリである。1511は、フレームメモリ1510に格納されている復号データを読み出し、出力する映像表示装置である。
図17の画像復号装置は、図1の画像符号化装置によって符号化されたストリームを復号することができる。以下に当該画像復号装置における詳細な画像復号方法を説明する。図18は画像復号処理を全体的に示すフローチャートである。
図18において、まず、符号化側で符号化したデータを可変長復号部1501にて復号する(1601)。次に、可変長復号部1501にて復号したデータを構文解析部1502にて構文分けを行う(1602)。ここで、画像復号装置に記録される符号化ストリームの構造について図19を用いて説明する。図19に示す符号化ストリームは、例えば、画像符号化装置によって符号化される。図19においてデータ領域1701には、例えば、差分があるか否かの判定フラグが格納される。また、例えば、データ領域1702には、動き検出を行うか否かの判定フラグ(1707)、小数画素精度画像生成部1508にて生成される動き情報ベクトル情報(1708)や整数画素位置の判定を行うフラグ(1709)が格納される。データ領域1703には、量子化パラメータ、量子化ステップもしくはこれらに乗ずる係数または符号化処理で用いたマトリクスの番号の情報が格納される。データ領域1704には、周波数変換の種類、ブロックサイズが格納される。データ領域1705には、小数画素画像生成部111にて生成される高解像度化手法の種類の情報、データ領域1706には原画像と予測画像の差分画像を周波数変換および量子化した後の係数が格納される。
次に、図19に示す符号化ストリームの各データ領域のデータの種類を判別し、各フラグや各データ情報が、それぞれ逆量子化部1503、逆周波数変換部1504、動き補償部1509、動き検出部1507、フレームメモリ1510、小数画素精度画像生成部1508の各処理部へ送られる。
次に、逆量子化部1503では、構文解析部1502から送られたデータを用いて逆量子化処理を行う(1603)。ここで、符号化ストリームが図1の画像符号化装置において符号化した符号化ストリームである場合は、逆量子化部1503における逆量子化処理は、図1の量子化部104の処理と逆処理を行えばよい(1604)。これは、図1の逆量子化部106の処理と同様の処理であり、従来の復号技術に用いる逆量子化技術であってもよいし、データ領域1703に格納された量子化ステップを乗算しても良い。
次に、逆量子化部1503において逆量子化したデータに対して、逆周波数変換部1504にて逆周波数変換処理を実施する(1604)。このとき、逆周波数変換部1604は、構文解析部1502から送られる周波数変換の種類や周波数変換ブロックサイズ情報を用いて逆周波数変換処理を行う。当該逆周波数変換処理は、従来の画像復号技術における技術を用いても良い。次に、加算器1505にて逆周波数変換部1504にて逆周波数変換したデータとフレームメモリ1509に格納したデータを用いて動き検出を行う(1605)動き検出の方法は、予め符号化部にて決定した動き探索方法を構文解析部1502から取得すればよい。
次に、フレームメモリ1506に格納されている画像データと構文解析部1502から取得する動きベクトルを用いて小数画素画像を生成する(1606)。このとき小数画素精度画像生成部1508は、図1の小数画素画像生成部111と同様に動きベクトルと複数の画像データを用いて小数画素精度画像を生成する。当該小数画素精度画像の生成処理の内容は、図1の小数画素精度画像生成部111について説明した内容と同様であるため説明を省略する。
図17の小数画素精度画像生成部1508は、図1の小数画素精度画像生成部111について説明したと同様に、動きベクトルと複数の画像とこれらの折返しひずみを用いた高解像度処理を行う。これにより、動き補償部1509にて参照する小数画素精度画像データの高精細化が可能となる。
構文解析部1502から送られる差分がない場合には、逆量子化、逆周波数変換、動き検出、小数画素画像生成、動き補償の処理を実施せずに処理を終了する。また、図18の小数画素精度画像生成方法決定処理1605において、検出結果が整数画素位置と判定した場合や構文解析部にて符号化側で従来の動画像符号化方式で用いられている画素フィルタ補間により小数画素画像が生成されていると判定した場合には、従来の動画像符号化方式で用いられている画素フィルタ補間により小数画素画像を生成する。
次に、小数画素精度画像生成部1508にて生成した画像データと構文解析部1502から送られた動きベクトル情報に基づいて動き補償を行う(1607)。画面内予測画像の場合には、画面内予測部1511にて予測画像を生成し、フレームメモリ1506にデータを格納する。上記復号画像は、例えば、TV、PCモニタ、プロジェクタなどの映像表示装置1511などに出力される。
以上説明した画像復装置及び画像復号方法によれば、画像復装置およびその画像復号方法において、動き探索処理の際に参照する小数画素精度画像データを高解像度化して復元することが可能となる。そのため、より高精細な復号画像を生成することができる。
また、以上説明した画像復装置及び画像復号方法によれば、符号化ストリームに格納される原画像と予測画像の差分情報により、周波数変換処理、量子化処理、逆量子化処理、逆周波数変換処理、動き検出処理、動き補償処理を省略することが可能となり復号側のデータ処理量を削減することが可能となる。
上記画像符号化装置(画像符号化装置)による上記符号化処理、及び上記画像復号装置(画像復号装置)による上記復号処理は、コンピュータ装置を利用して行う。上記処理を制御するプログラムを記録媒体(ハードディスク、光ディスク、光磁気ディスク等)にて、あるいは伝送線路若しくは適宜のネットワークを介して提供して、PC(Personal Computer)又はEWS(Engineering Work Station)等のコンピュータ装置で実行可能にすることにより、上記画像符号化処理、画像復号処理を容易に行うことができる。
以上本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明はそれに限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは言うまでもない。
本発明の画像符号化装置、画像符号化方法、画像復号装置、及び画像復号方法は、様々な規格をベースとする画像符号化処理、画像復号処理等にも用いることができる。また、第1方法及び第3方法に用いる超解像度処理、第2方法及び第4方法に用いるフィルタ補間演算処理は、適宜変更可能である。
Claims (15)
- 原画像データと動き予測画像データとの差分を符号化すると共に符号化データを復号して得られるローカルデコード画像データに基づいて前記動き予測画像データを生成することが可能な画像符号化装置であって、
前記ローカルデコード画像データを複数フレーム分に亘り保持するフレームメモリと、
前記フレームメモリが保持する、符号化対象フレームのローカルデコード画像データとそれよりも前のフレームのローカルデコード画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理部と、を有し、
前記小数画素画像データ処理部で生成された小数画素精度画像データを参照画像データとして動き検出を行って動き予測画像データを生成する、画像符号化装置。 - 前記小数画素画像データ処理部は、フレームメモリに格納された符号化対象フレームのローカルデコード画像データとそれより前の所定範囲の前フレームのローカルデコード画像データとの間の動き量が小数画素精度であるか否かを判定し、小数画素精度の判定結果が得られたときは、その前フレームのローカルデコード画像データと前記符号化対象フレームのローカルデコード画像データとを用いて小数画素精度画像データを生成し、小数画素精度の判定結果が得られないときは符号化対象フレームのローカルデコード画像データに対する補間演算によって小数画素精度画像データを生成する、請求項1記載の画像符号化装置。
- 前記小数画素画像データ処理部は、前記小数画素精度であるか否かの判定の対象をIピクチャ又はPピクチャのフレーム形態に限定する、請求項2記載の画像符号化装置。
- 前記小数画素画像データ処理部は、前記所定範囲の前フレームに対して最も符号化対象フレームに近い前フレームから順次前記フレーム形態の判定と前記小数画素精度であるか否かの判定を行う、請求項3記載の画像符号化装置。
- 前記小数画素画像生成部は、画像データの複数の画像信号のそれぞれの信号に対して位相シフト処理を行って新たな複数の画像信号を生成し、前記複数の画像信号と新たな複数の画像信号とに係数を乗じて合成することにより、小数画素精度画像データを生成する、請求項1記載の画像符号化装置。
- 予測画像メモリから動き予測画像データを読出す読出し処理と、
読み出された動き予測画像データと入力画像データとの差分を予測誤差データとして算出する差分処理と、
前記差分処理で算出した予測誤差データを周波数変換する周波数変換処理と、
前記周波数変換処理で周波数変換されたデータを量子化する量子化処理と、
前記量子化処理で量子化されたデータを可変長符号化し、符号化ストリームを生成する可変長符号化処理と、
前記量子化処理で量子化されたデータを逆量子化する逆量子化処理と、
前記逆量化処理で逆量子化されたデータを逆周波数変換して予測誤差データを再生する逆周波数変換処理と、
前記逆周波数変換処理で再生された予測誤差データと前記動き予測画像データとを加算してローカルデコード画像データを出力する加算処理と、
前記加算処理で算出されえたローカルデコード画像データをフレームメモリに格納する処理と、
前記フレームメモリが保持する、符号化対象フレームのローカルデコード画像データとそれよりも前のフレームのローカルデコード画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理と、
前記小数画素画像データ処理で生成された小数画素精度画像データを参照画像データとして動き検出を行って予測画像を生成する動き検出・動き補償処理と、
前記動き検出・動き補償処理で生成された動き予測画像データを前記予測画像メモリに書き込む書き込み処理と、を含む画像符号化方法。 - 動き予測によって符号化された符号化データを入力して符号化画像データと付加情報に分離し、分離された符号化画像データを復号して得られる動き予測誤差に動き予測画像データを加算して画像データを再生し、再生された再生画像データに基づいて前記動き予測画像データを生成することが可能な画像復号装置であって、
前記再生画像データを複数フレーム分に亘り保持するフレームメモリと、
前記フレームメモリが保持する、復号対象フレームの再生画像データとそれよりも前のフレームの再生画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理部と、を有し、
前記小数画素画像データ処理部で生成された小数画素精度画像データを参照画像データとして動き検出を行って動き予測画像データを生成する、画像復号装置。 - 前記小数画素画像データ処理部は、フレームメモリに格納された復号対象フレームの再生画像データとそれより前の所定範囲の前フレームの再生画像データとの間の動き量が小数画素精度であるか否かを判定し、小数画素精度の判定結果が得られたときは、その前フレームの再生画像データと前記復号対象フレームの再生画像データとを用いて小数画素精度画像データを生成し、小数画素精度の判定結果が得られないときは復号対象フレームの再生画像データに対する補間演算によって小数画素精度画像データを生成する、請求項7記載の画像復号装置。
- 前記小数画素画像データ処理部は、前記小数画素精度であるか否かの判定の対象をIピクチャ又はPピクチャのフレーム形態に限定する、請求項8記載の画像復号装置。
- 前記小数画素画像データ処理部は、前記所定範囲の前フレームに対して最も復号対象フレームに近い前フレームから順次前記フレーム形態の判定と前記小数画素精度であるか否かの判定を行う、請求項9記載の画像復号装置。
- 前記小数画素画像生成部は、画像データの複数の画像信号のそれぞれの信号に対して位相シフト処理を行って新たな複数の画像信号を生成し、前記複数の画像信号と新たな複数の画像信号とに係数を乗じて合成することにより、小数画素精度画像データを生成する、請求項7記載の画像復号装置。
- 動き予測によって符号化された符号化データから成る符号化ストリームを入力して可変長復号する可変長復号処理と、
可変長復号された符号化データを符号化画像データと付加情報に分離する構文解析処理と、
分離された符号化画像データを逆量子化する逆量子化処理と、
前記逆量化処理で逆量子化されたデータを逆周波数変換して動き予測誤差を再生する逆周波数変換処理と、
逆周波数変換処理で再生された動き予測誤差に予測画像メモリの動き予測画像データを加算して画像データを再生する加算処理と、
前記加算処理で再生された再生画像データをフレームメモリに書き込む再生画像データ書き込み処理と、
前記フレームメモリが保持する、復号対象フレームの再生画像データとそれよりも前のフレームの再生画像データとを用いて小数画素精度画像データを生成する小数画素画像データ処理と、
前記小数画素画像データ処理で生成された小数画素精度画像データと前記付加情報を用いて動き予測画像データを生成する動き補償処理と、
前記動き補償処理で生成された動き予測画像データを前記予測画像メモリに書き込む書き込み処理と、を含む画像復号方法。 - 前記小数画素画像データ処理は、前記小数画素精度であるか否かの判定の対象をIピクチャ又はPピクチャのフレーム形態に限定する、請求項12記載の画像復号方法。
- 前記小数画素画像データ処理は、前記所定範囲の前フレームに対して最も復号対象フレームに近い前フレームから順次前記フレーム形態の判定と前記小数画素精度であるか否かの判定を行う、請求項13記載の画像復号方法。
- 前記小数画素画像データ処理は、画像データの複数の画像信号のそれぞれの信号に対して位相シフト処理を行って新たな複数の画像信号を生成し、前記複数の画像信号と新たな複数の画像信号とに係数を乗じて合成することにより、小数画素精度画像データを生成する、請求項12記載の画像復号方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008184777 | 2008-07-16 | ||
JP2008184777 | 2008-07-16 | ||
PCT/JP2009/002453 WO2010007719A1 (ja) | 2008-07-16 | 2009-06-02 | 画像符号化装置、画像符号化方法、画像復号装置、及び画像復号方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2010007719A1 true JPWO2010007719A1 (ja) | 2012-01-05 |
Family
ID=41550131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010520739A Pending JPWO2010007719A1 (ja) | 2008-07-16 | 2009-06-02 | 画像符号化装置、画像符号化方法、画像復号装置、及び画像復号方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2010007719A1 (ja) |
WO (1) | WO2010007719A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011223293A (ja) * | 2010-04-09 | 2011-11-04 | Hitachi Ltd | 画像符号化方法、画像符号化装置、画像復号化方法及び画像復号化装置 |
EP2410746A1 (en) * | 2010-07-20 | 2012-01-25 | Siemens Aktiengesellschaft | Video coding with reference frames of high resolution |
KR101956284B1 (ko) | 2011-06-30 | 2019-03-08 | 엘지전자 주식회사 | 보간 방법 및 이를 이용한 예측 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001186531A (ja) * | 1999-10-25 | 2001-07-06 | Robert Bosch Gmbh | 内挿を使用する動画像の動き補償予測のための方法及び装置 |
JP2007324789A (ja) * | 2006-05-31 | 2007-12-13 | Hitachi Ltd | 画像信号処理装置、及び画像信号を高解像度化するための方法、及びそれを実行するためのプログラム |
JP2008017241A (ja) * | 2006-07-07 | 2008-01-24 | Hitachi Ltd | 高解像度画像処理装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006174415A (ja) * | 2004-11-19 | 2006-06-29 | Ntt Docomo Inc | 画像復号装置、画像復号プログラム、画像復号方法、画像符号化装置、画像符号化プログラム及び画像符号化方法 |
-
2009
- 2009-06-02 JP JP2010520739A patent/JPWO2010007719A1/ja active Pending
- 2009-06-02 WO PCT/JP2009/002453 patent/WO2010007719A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001186531A (ja) * | 1999-10-25 | 2001-07-06 | Robert Bosch Gmbh | 内挿を使用する動画像の動き補償予測のための方法及び装置 |
JP2007324789A (ja) * | 2006-05-31 | 2007-12-13 | Hitachi Ltd | 画像信号処理装置、及び画像信号を高解像度化するための方法、及びそれを実行するためのプログラム |
JP2008017241A (ja) * | 2006-07-07 | 2008-01-24 | Hitachi Ltd | 高解像度画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2010007719A1 (ja) | 2010-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2456761C1 (ru) | Операции повторной дискретизации и изменения размера изображения для кодирования и декодирования видео с переменной разрешающей способностью | |
DK2996336T3 (en) | Device for interpolating images using a smoothing interpolation filter | |
JP2006246474A (ja) | カラー成分間の単一符号化モードを利用して予測映像を生成する方法、およびその装置と、該単一符号化モードを利用して映像およびビデオを符号化/復号化する方法およびその装置 | |
TW201309035A (zh) | 使用非對稱內插濾波器的內插影像用的方法與裝置 | |
KR101648058B1 (ko) | 고정밀 필터를 이용한 영상 부호화/복호화 방법 및 장치 | |
KR101090586B1 (ko) | 부호화 장치/복호화 장치, 부호화 방법/복호화 방법 및 기록 매체 | |
KR101362755B1 (ko) | 센서영상 부호화 및 복호화장치와 그 방법 | |
CN103503453A (zh) | 编码装置和编码方法、以及解码装置和解码方法 | |
KR20090085956A (ko) | 영상을 효율적으로 부호화/복호화하는 방법 및 장치 | |
KR20230145064A (ko) | 인트라 블록 카피 스크래치 프레임 버퍼 | |
JP2005318297A (ja) | 動画像符号化・復号方法及び装置 | |
WO2010007719A1 (ja) | 画像符号化装置、画像符号化方法、画像復号装置、及び画像復号方法 | |
KR101690253B1 (ko) | 영상 처리 장치 및 그 방법 | |
JP5011138B2 (ja) | 画像符号化装置、画像符号化方法、画像復号化装置、画像復号化方法 | |
JP5113479B2 (ja) | 画像信号処理装置及び画像信号処理方法 | |
JP2008125002A (ja) | 画像符号化装置、画像復号装置及び画像処理プログラム | |
KR20090012957A (ko) | 블록변환 영역에서 영상 이미지의 영상 특성에 따라 선택한보간 필터를 사용하여 영상 이미지의 크기를 변경하는방법 | |
JP2004357313A (ja) | 画像情報処理装置及び画像情報処理方法 | |
JP2011223293A (ja) | 画像符号化方法、画像符号化装置、画像復号化方法及び画像復号化装置 | |
JP3591025B2 (ja) | 画像情報処理装置 | |
JP2022548521A (ja) | 参照ダウンサンプリングありの動き補償補間のためのフィルタ | |
JP2009278473A (ja) | 画像処理装置、それを搭載した撮像装置、および画像再生装置 | |
JP4526529B2 (ja) | 階層画像を用いる映像信号変換装置 | |
JP2009105689A (ja) | 映像表示装置、映像表示方法及び画像高解像度化方法 | |
Pantoja et al. | Coefficient conversion for transform domain VC-1 to H. 264 transcoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130124 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130523 |