JP2004135107A - 画像処理装置及びその方法 - Google Patents
画像処理装置及びその方法 Download PDFInfo
- Publication number
- JP2004135107A JP2004135107A JP2002298230A JP2002298230A JP2004135107A JP 2004135107 A JP2004135107 A JP 2004135107A JP 2002298230 A JP2002298230 A JP 2002298230A JP 2002298230 A JP2002298230 A JP 2002298230A JP 2004135107 A JP2004135107 A JP 2004135107A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- unit
- predetermined
- image
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】Motion−JPEGやMotion−JPEG2000及びDV等の、フレーム間の予測符号化を行わない規格において、高い圧縮率と高画質を両立する画像符号化・復号化を実現する。
【解決手段】符号化においては、入力動画像の所定数あるいは可変数の連続するフレーム毎に、該連続フレームの各画素を組み合わせて、単一の合成フレームを生成し、該合成フレームに対して、所定の符号化規格に従って符号化を行い、符号化情報を出力する。また、復号化においては、上記合成フレームを符号化して生成された符号化情報が入力され、該符号化情報に対して、所定の符号化規格にしたがって復号化を行い、さらに復号化された合成フレームの各画素の分離及び再構成を行い、所定数あるいは可変数の連続するフレーム画像を生成し、順次出力する。
【選択図】 図1
【解決手段】符号化においては、入力動画像の所定数あるいは可変数の連続するフレーム毎に、該連続フレームの各画素を組み合わせて、単一の合成フレームを生成し、該合成フレームに対して、所定の符号化規格に従って符号化を行い、符号化情報を出力する。また、復号化においては、上記合成フレームを符号化して生成された符号化情報が入力され、該符号化情報に対して、所定の符号化規格にしたがって復号化を行い、さらに復号化された合成フレームの各画素の分離及び再構成を行い、所定数あるいは可変数の連続するフレーム画像を生成し、順次出力する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、画像の効率的な圧縮符号化/復号化装置及び方法に関する。
【0002】
【従来の技術】
放送・通信・蓄積メディア等において、ディジタル画像データを取り扱うための画像圧縮符号化方式が、数多く考案されている。これらの画像圧縮符号化方式には、様々な技術が採用されているが、DCT(Discrete Cosine Transform)等の直交変換、直交変換係数の量子化、及び可変長符号を組み合わせた変換符号化方式が、特に広く用いられている。例えば、主に静止画像を対象とした変換符号化方式の規格として、JPEG規格がある。このJPEG規格では、DCT、DCT係数の量子化、及び可変長符号を組み合わせた画像圧縮符号化方式を用い、主観的に良好な画質を保ちながら、画像データ情報量を十分の一程度まで圧縮することが可能であり、さらに符号化効率を上げることができる。
【0003】
次に、動画像を対象とした代表的な規格として、MPEG規格が挙げられる。このMPEG規格は、JPEGと同様に、DCT・DCT係数の量子化・可変長符号を用いる変換符号化方式を基本とした上で、さらに双方向の動き補償予測方式を併用することにより、数十分の一程度の高い圧縮率を達成している。
【0004】
このように、DCT等を用いる変換符号化方式は、効率的に画像を圧縮することができるが、圧縮率を比較的高くした場合には、ブロック歪やモスキート・ノイズと呼ばれる画質劣化が発生することが知られている。DCT等の直交変換における演算量は、画素数に対して指数関数的に増大する為、直交変換を用いる画像圧縮符号化方式では、一般に、画面全体をブロックと呼ばれる8×8画素程度の小領域に分割して、ブロック単位で変換符号化を行う。この為、圧縮率を高めて、変換係数の量子化誤差が大きくなると、各ブロックの直流成分が不連続になり、ブロックの境界でギャップが発生する。このブロック間のギャップが、ブロック歪として視認される。
また、直交変換の基底関数が周期的である為、入力画像のブロック内に局所的なエッジが存在すると、変換係数の高周波成分が多くなる。その量子化誤差によって、再生画像のエッジ近傍に高周波の偽信号が発生する。この偽信号がモスキート・ノイズとして視認される。
【0005】
これらの画質劣化は、主観的画質を著しく損なうものであり、改善が望まれてきた。
【0006】
こうした要求から、最近では、DWT(Discrete Wavelet Transform)等の帯域分割フィルタ、量子化、エントロピー符号を用いたサブバンド階層符号化方式も普及しつつある。このDWTを用いた符号化では、ブロック歪を抑えやすく、モスキート・ノイズが発生しにくいという特徴がある。
【0007】
JPEGの次世代の規格であるJPEG2000(ITU−T T.800|ISO/IEC15444−1)は、DWTを採用したサブバンド階層符号化方式である。JPEG2000では、ブロックの代わりに、タイルと呼ばれる画面領域毎に処理を行う。タイルは任意の大きさの矩形領域であり、画面全体を多数の小さいタイルに分割して、タイル毎に細かくビット制御することが可能である。また、タイルを細かく分割せずに、画面全体とすることも可能である。JPEG2000は、低圧縮率から高圧縮率に至るまで、概ねJPEGより優れた画質を得られている。
【0008】
ところで、JPEGやJPEG2000は、主に静止画を対象とした規格であるが、動画に適用することも可能である。動画は連続する静止画の集合とみなせるので、各画像を順番に符号化すればよい。JPEGを用いて動画像を符号化する方式は、Motion−JPEGと呼ばれ、ディジタル・カメラ等に、広く普及している。また、JPEG2000を用いて動画像を符号化する方式は、通称Motion−JPEG2000と呼ばれている。
【0009】
以上に述べた画像圧縮の各規格によれば、比較的良好な圧縮率が得られるが、これらの規格に加えて、さらに独自に画像の冗長性を利用して画像情報の圧縮符号化を行う画像符号化・復号化装置も考案されている。
【0010】
例えば、画像符号化・復号化装置は、右目用画像及び左目用画像からなる立体動画像に対して符号化・復号化を行う装置であるが、右目用画像と左目用画像との間の相関性に着目し、右目用画像と左目用画像を合成し、生成した合成画像に対して、MPEGを用いて符号化・復号化を行うことにより、符号化の効率を向上している(特許文献1参照)。
【0011】
【特許文献1】
特開平8−70475号公報(第4−6頁、第1図)
【0012】
【発明が解決しようとする課題】
しかし、上記したMotion−JPEG2000による画像符号化装置では、静止画用の圧縮符号化の規格であるJPEG2000を活用して、概ね良好な圧縮率を得られるが、動画像における時間的冗長性を残しているという問題がある。すなわち、動画像の各フレーム間の相関性に基づく情報の圧縮が全く為されていないという問題点が挙げられる。
【0013】
つまり、Motion−JPEGやMotion−JPEG2000では、フレーム間の予測符号化を行わない。すなわち、これらの画像圧縮符号化方式は、画像の空間的相関性のみを利用し、時間的相関性を利用しない為に、MPEG等の空間的相関性と時間的相関性の双方を利用する規格に比べると、圧縮率を上げにくいという問題がある。ここで、空間的相関性とは、フレーム内の画素の相似性であり、時間的相関性とは、フレーム間の画素の相似性である。
【0014】
特に、Motion−JPEG2000は、サブバンド階層符号化方式であり、DCT等の変換符号化を用いる他の方式に対して、ブロック歪やモスキート・ノイズの発生を抑えやすいという利点がある為に、時間的相関性の活用による圧縮率のさらなる向上が望まれている。
【0015】
また、動画像の各フレームのコードストリームが独立して生成される為に、各フレームに共通な情報が重複して符号化されるため圧縮率の向上が図れないという問題点も挙げられる。各フレームに共通な情報とは、例えば画像のサイズ情報や、どのように符号化されているのかを表す情報を含むヘッダ等が挙げられる。
【0016】
さらに、特許文献1のように、従来の規格に加えて、さらに符号化効率を向上できる手法には、例えば、右目用画像及び左目用画像からなる立体動画像にしか適用できないという問題点があり、連続したフレームの時間的相関性に注目した合成については言及されていない。
【0017】
本発明は、この問題点に鑑み、動画像の圧縮符号化において、既存の画像圧縮符号化規格を活用しながらも、さらに高い圧縮率と高画質を実現する画像符号化装置、画像符号化方法、画像復号化装置、及び画像復号化方法を提供する。
【0018】
【課題を解決するための手段】
本願では、従来の画像符号化部の前段に、フレーム合成部を追加することにより、これらの問題点を解決する。
【0019】
本発明の画像符号化装置及び画像符号化方法は、入力動画像の所定数あるいは可変数の連続するフレーム毎に、該連続フレームの各画素を組み合わせて、単一の合成フレームを生成し、該合成フレームに対して、所定の符号化規格に従って符号化を行い、符号化情報を出力することを特徴とする。
【0020】
また、本発明の画像復号化装置及び画像復号化方法は、前記合成フレームを符号化して生成された符号化情報が入力され、該符号化情報に対して、所定の復号化規格にしたがって復号化を行い、さらに復号化された合成フレームの各画素の分離及び再構成を行い、所定数あるいは可変数の連続するフレーム画像を生成し、順次出力することを特徴とする。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態を図面を用いて説明する。なお、以下の説明では、画像圧縮符号化の規格としてMotion−JPEG2000を用いているが、これに限るものではない。例えばMotion−JPEGやDV規格などの他、動画像の空間的相関性を利用し、時間的相関性を利用しない符号化方式に適用することができる。
また、以下に説明する本発明の実施の形態の画像符号化装置及び画像復号化装置の動作は、専用のハードウェアのみならず、汎用のプロセッサ・システムによっても、実現可能である。
【0022】
図1は、本発明の第1の実施の形態となる画像符号化装置のブロック図である。本実施の形態の画像符号化装置10は、画像符号化部11、フレーム合成部12から構成されている。
図14は、本発明の第1の実施の形態の画像符号化装置の動作フローチャートである。
【0023】
図1において、入力画像の各フレームは、順次、フレーム合成部12に入力される(ステップ141)。フレーム合成部12は、フレームが入力される毎に、フレーム数をカウントし(ステップ142)、フレーム数のカウントを所定数と比較する(ステップ143)。フレーム数のカウントが所定数に等しくなるまで、ステップ141からステップ143が繰り返される。フレーム数のカウントが所定数に等しくなったとき、すなわち、所定数のフレームが入力される毎に、カウントをリセットし(ステップ144)、後述のように入力された各フレームの画素を組み合わせて、入力画像より大きい単一のフレーム画像を合成し、出力する(ステップ145)。ここで、合成とは、原フレームを分割した要素を組み合わせることである。ここで、該要素とは、画素単位やその他の任意に決定しうる複数個の画素の集合単位であってもよい。画像符号化部11は、フレーム合成部12から出力される合成画像に対して、フレーム毎にJPEG2000規格にしたがって符号化を行い(ステップ146)、生成した符号化情報を出力する(ステップ147)。以上のステップが、入力画像の終わりまで繰り返される。
【0024】
本実施の形態における画像符号化部11の動作について説明する。図2は、画像符号化部11のブロック図である。画像符号化部11は、DWT部21、量子化部22、エントロピー符号化部23から構成されている。画像は、DWT部21に入力される。DWT部21において、入力画像は所定の大きさのタイルに分割され、タイル毎に離散ウェーブレット変換が行われ、DWT係数が量子化部22に出力される。量子化部22では、DWT係数が所定の量子化テーブルにしたがって量子化され、量子化係数がエントロピー符号化部23及に出力される。エントロピー符号化部23では、量子化係数が所定の符号化テーブルによって符号化され、生成される符号化情報にヘッダ等の付帯情報を付加して順次出力する。
【0025】
この構成によって、前述のように画像の空間的相関性を利用した画像情報の圧縮が可能である。すなわち、入力画像は、DWTによって、いくつかのサブバンドに分割されるが、各サブバンドのDWT係数のうち、低域のDWT係数にエネルギーが集中し、高域のDWT係数には、エネルギーが少ない。そこで、低域のDWT係数については、量子化ステップを小さくし、高域のDWT係数については、量子化ステップを大きくすることで、それほど視覚的画質を損なわずに、情報量を削減することができる。また、エントロピー符号化により、DWT係数の統計的な偏りを利用して、可逆的に符号量を圧縮することができる。
【0026】
なお、DWT部21において、入力画像は、必ずしもタイルに分割する必要はなく、タイルの大きさも任意に設定できる。入力画像をタイルに分割する目的は、前述のように、ハードウェア上のメモリ容量の制約への対処や、画像の各部分において性質が大きく異なる場合等に、各部分毎の画質制御を行うことにある。
【0027】
次に、画像符号化部11により生成される符号化情報について、例として、JPEG2000を用いて動画像を符号化するMotion−JPEG2000について説明する。符号化情報であるMotion−JPEG2000は、JPEG2000のファイル・フォーマットの一種として規定されている。JPEG2000のファイル・フォーマットとは、コードストリームと呼ばれる画像自体の符号化情報の他に、例えば、画像の色空間情報などといった多種の付帯情報とを包含するファイルの構造である。これらの情報は、それぞれがボックスと呼ばれる構造により区分格納され、これらのボックスによりファイルを構成している。Motion−JPEG2000は、動画像を構成する各フレームのコードストリームの実体あるいは参照情報のボックスと、時刻情報などの付帯情報のボックスから成るファイル・フォーマットである。
【0028】
図3は、Motion−JPEG2000のファイルの構造の一例を示している。jp2は、シグネチャ・ボックスと呼ばれ、JPEG2000のファイル・フォーマットであることを識別する。ftypは、ファイル・タイプ互換ボックスと呼ばれ、ファイル・フォーマットの種類を識別する。ftyp内では、Motion−JPEG2000を表す”mjp2”が記述される。moovは、ムービー・ボックスと呼ばれ、付帯情報全般を格納する。詳細は省略するが、moovは、時刻情報などの各付帯情報を格納するサブ・ボックスを包含している。mdatは、メディア・データ・ボックスと呼ばれ、動画像のコードストリームを包含している。動画像のコードストリームは、動画像の各フレームのコードストリームから構成されている。ここで、各フレームのコードストリームは、静止画のJPEG2000規格によるものと同一である。すなわち、各フレームのコードストリームは、符号化情報のヘッダ、タイル・パート・ヘッダとタイル・パートの複数組、及びマーカーEOC(End of codestream)から構成されている。メイン・ヘッダは、画像のサイズ情報やウェーブレット変換に関する情報等を有している。タイル・パートは、各タイルに対応するコードストリームの一部分であり、タイル・パートの数は任意に設定できる。タイル・パート・ヘッダは、対応するタイル・パートの属するタイルの番号等の情報を有している。EOCはコードストリームの終わりを示すマーカーである。図3に示すように、フレーム0、フレーム1、フレーム2、フレーム3、・・・の各フレームのコードストリームが、順次連結され、動画像のコードストリームを構成している。
【0029】
本実施の形態においては、従来の符号化部11の前段に、フレーム合成部12を追加したことにより、これらの問題点を解決している。図21は、フレーム合成部12の一例のブロック図である。フレーム合成部12は、フレームバッファ211・212・213・214、CPU215、メモリ216、セレクタ217から構成されている。以下、本発明におけるフレーム合成部12の動作について図4を参照して説明する。
【0030】
図4は、フレーム合成部12において、動画の複数の連続フレームを合成し、合成フレームを生成する動作の一例を示している。この例では、連続する4フレーム毎に、1枚の合成フレームを生成しているが、これに限らず、合成に要するフレーム数は任意に決めることができる。ここで、合成に要するフレーム数とは、ひとつの合成フレームを作成するのに要する原フレームの数である。図21において、入力画像の各フレームは、4つのフレームバッファに順次格納される。CPU215は、入力フレームをカウントし、入力画像の各フレームバッファへの書き込みを制御する。すなわち、連続して入力されたフレーム0、フレーム1、フレーム2、フレーム3がそれぞれ、フレームバッファ211・212・213・214に順番に格納され、以後4フレームごとに繰り返される。次に、フレームバッファに格納された各フレームの画素を、セレクタ217により選択して、所定の順序で読み出し、合成フレームを出力する。CPU215は、フレームバッファ211・212・213・214に格納された各フレームの画素の読み出しとセレクタ217の切り換え出力を制御する。図4に示すように、フレーム0、フレーム1、フレーム2、フレーム3の左上端の画素を、この順に水平方向に並べる。このように、水平方向に順に配列していく順序をラスター順という。以下、同様にして、ラスター順で、各フレームの画素を順に並べていく。この結果、元のフレームの水平サイズの4倍の水平サイズを持つ合成フレームが生成され、この合成フレームが、画像符号化部11に入力される。メモリ216には、予め合成に要するフレーム数及び合成方法の情報が記録されており、CPU215は、メモリ216に記録された合成に要するフレーム数の情報を参照して、上記のフレーム合成動作の制御を行う。フレーム合成部12は、少なくとも、合成に要するフレーム数と同数のフレームバッファを備えていなければならない。処理速度向上のために、フレームバッファへの入力フレームの書き込みと、画素の読み出しをパイプライン動作させることもできるが、その場合、追加のフレームバッファが必要である。該フレーム合成部の構成は、ハードウェア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウェア的にはメモリにロードされたプログラムなどをCPUが実行することによって実現される。尚、これらの構成が、ハードウェアのみ、ソフトウェアのみ、またそれらの組み合わせによって実現できることは当業者に理解されるところである。
【0031】
このような合成によって、合成フレーム内では水平方向に時間的に近接した同一位置の画素が4つずつ並べられることになる。すなわち、各画素における時間方向の相関性が、水平方向の相関性に置き換えられることになる。これにより、前述のDWT係数のエネルギーの低域への集中がさらに促進され、符号化効率が向上する効果が得られる。
【0032】
なお、符号化の対象となる動画像の総フレーム数が、合成に要するフレーム数で割り切れない場合が考えられるが、最後のフレームを繰り返すか、あるいは中間階調のフレームを追加することによって、総フレーム数を合成に要するフレーム数の倍数になるようにしてやれば、なんら問題はない。例えば、4つの原フレームからひとつの合成フレームを作成する場合であって、原フレームが6つしかない場合には、上述の最後のフレームを繰り返す方法を採用すれば、1フレーム目から4フレーム目までを1つ目の合成フレームとし、5フレーム目と6フレーム目に6フレーム目のフレームを2フレーム分追加することで2つ目の合成フレームを生成することができる。この場合の上記のフレーム合成部12の動作は、CPU215が、セレクタ217において、フレームバッファ213・214から読み出した画素の代わりに、フレームバッファ212から読み出した画素を選択するように制御を行う。
【0033】
また、本実施の形態によれば、動画像の各フレームに共通な情報が重複して符号化されるという問題点も改善される。
【0034】
図5は、本実施の形態によるMotion−JPEG2000のファイルの構造を示している。jP2、ftyp、moovについては、図3で示した通常のMotion−JPEG2000のファイルと同様であり、本実施の形態によるMotion−JPEG2000のファイルの場合にも変わりはない。図3との相違では、mdat内のコードストリームについては、4つの連続フレーム毎に、フレーム合成部12によって生成する合成フレームに対して符号化を行う為に、通常のMotion−JPEG2000のファイルの場合と比較して、本実施の形態によるMotion−JPEG2000のファイルの場合には、メイン・ヘッダとEOCの総数が4分の1に減少し、その分の符号量を削減できることになる。また、タイル・パートについても、前述のように、符号量が概ね減少している。
【0035】
ここで、フレーム合成部12における合成動作については、図4の合成方法に限らず、様々な方法が適用可能である。図6は、フレーム合成部12における合成動作の別の例を示している。この例では、各フレームの画素を、垂直方向に並べる。入力動画像の時間方向の相関性は、垂直方向の相関性に置き換えられ、前述の図4の場合とほぼ同じ効果が得られる。また、図7は、フレーム合成部12における合成動作のさらに別の例を示している。この例では、各フレームの画素を、水平垂直方向に格子状に並べる。入力動画像の時間方向の相関性は、水平及び垂直方向双方の相関性に置き換えられ、やはり、前述の例と同様の効果が得られる。さらに、図8は、フレーム合成部12における合成動作のもう一つの別の例を示している。この例では、各フレームは、そのまま格子状に並べられる。この例は、入力動画像にシーン・チェンジや、かなり動きがある場合等、時間方向の相関性がほとんど無い場合に有効である。すなわち、前述の例のように合成した場合に、時間方向の相関性がほとんど無い為に、かえって空間領域の相関性が損なわれ、符号化効率が悪化するのを防ぐことができる。この場合にも、符号化情報におけるメイン・ヘッダとEOCの重複を緩和し、符号量を削減できる利点がある為、通常のMotion−JPEG2000に比べて有利である。また、ここに挙げた以外の合成方法も種種考えられる。これらの例においても、合成に要するフレーム数を任意に設定できることは明らかである。また、合成に要するフレーム数及び合成方法の情報は、予めメモリ216に記録され、CPU215により参照されることは、図4の例と同じである。
【0036】
以上のように、本実施の形態の画像符号化装置においては、従来のMotion−JPEG2000の画像符号化装置に比較して、符号化効率が向上し、少ない符号量で動画像を圧縮符号化することができる。
【0037】
次に本発明の第2の実施の形態となる画像符号化装置について説明する。本実施の形態の画像符号化装置は、前述の本発明の第1の実施の形態の画像符号化装置に改良を加えたものである。
【0038】
すなわち、前述のように、フレーム合成部12における合成動作については、図4に示したような合成方法に限らず、様々な合成方法が考えられるが、これらの合成方法は、符号化の対象となる動画像の性質によって、その効果が異なってくる。例えば、シーン・チェンジや動きの多い画像に対しては、図8に示したような合成方法のほうが、図4、図6、図7に示した合成方法よりも符号化効率がよいと考えられる。動きの少ない画像に対しては、図4、図6、図7に示した合成方法が有利であるが、特に画像の空間スペクトルにおいて、縦縞が多い画像等の水平方向の高周波成分が多い場合には、時間軸の相関性を水平方向に展開することで、見かけ上、水平方向の高周波成分を落とすことができる為、図4に示した合成方法が有利である。ここで、空間スペクトルとは、簡単には、水平方向あるいは垂直方向の画像の変化を表す周波数成分である。同様の理由から画像の空間スペクトルにおいて垂直方向の高周波成分が多い場合には、図6に示した合成方法が有利であり、画像の空間スペクトルにおいて水平方向と垂直方向で、ほぼ高周波成分が変わらない場合には、図7に示した合成方法が有利である。また、合成に要するフレーム数に関しても、符号化の対象となる動画像の性質によって、その効果が異なってくる。例えば、動きの少ない画像ほど、時間的相関性が高いので、合成に要するフレーム数を多くするほうが有利である。以上のことから、符号化対象となる画像、あるいはタイル等の部分画像毎に、その画像の動きや空間スペクトル等の性質によって、フレーム合成方法及び合成に要するフレーム数を切り換えることにより、さらに符号化効率を向上することができる。
【0039】
図9は、本実施の形態の画像符号化装置のブロック図である。なお、本実施の形態の画像符号化装置において、本発明の第1の実施の形態の画像符号化装置と重複する部分については、同じ符号を付し、その詳細な説明を省略する。図1に示される第1の実施例との相違は、第1の実施例では合成フレームの合成方法が予め定められている場合に有効であるのに対し、本実施例は合成フレームの合成方法が選択可能である場合に有効である。本実施の形態の画像符号化装置は、フレーム合成部91、画像符号化部11、フレーム合成情報埋込部92、フレーム合成制御部93とから構成されている。本実施の形態の画像符号化装置の動作を、図16に示すフローチャートを用いて説明する。図9において、入力画像の各フレームは、順次、フレーム合成部91及びフレーム合成制御部93に入力される(ステップ161)。フレーム合成制御部93は、入力画像の動きや空間スペクトルを検出し、その結果からフレーム合成部91におけるフレーム合成方法と、合成に要するフレーム数を設定し(ステップ162)、フレーム合成部91及びフレーム合成情報埋込部92に出力する。フレーム合成部91は、フレームが入力される毎に、フレーム数をカウントし(ステップ163)、フレーム数のカウントを所定数と比較する(ステップ164)。フレーム数のカウントが所定数に等しくなるまで、ステップ161からステップ164が繰り返される。フレーム数のカウントが所定数に等しくなったとき、すなわち、フレーム合成制御部93により設定された合成に要するフレーム数のフレームが入力される毎に、カウントをリセットし(ステップ165)、フレーム合成制御部93により設定されたフレーム合成方法にしたがって、入力された各フレームの画素を組み合わせて、入力画像より大きい単一のフレーム画像を合成し(ステップ166)、画像符号化部11に出力する。フレーム合成部91は、本発明の第1の実施の形態におけるフレーム合成部12と同様の構成である。但し、フレーム合成制御部93により設定された合成に要するフレーム数及びフレーム合成方法の情報は、メモリ216に格納され、CPU215により毎回参照される。また、合成に要するフレーム数の取り得る最大値に見合った数のフレームバッファが必要である。すなわち、少なくとも合成に要するフレーム数の取り得る最大値と同数のフレームバッファが必要である。画像符号化部11により生成される符号化情報について、例として、JPEG2000を用いて動画像を符号化するMotion−JPEG2000について説明する。画像符号化部11は、フレーム合成部91から出力される合成画像に対して、フレーム毎にJPEG2000規格にしたがって符号化を行い(ステップ167)、生成したMotion−JPEG2000符号化情報を、フレーム合成情報埋込部92に出力する。フレーム合成情報埋込部92は、フレーム合成制御部93により設定されたフレーム合成方法及び合成に要するフレーム数の情報を、画像符号化部11からのMotion−JPEG2000符号化情報に埋め込み(ステップ168)、出力する(ステップ169)。なお、Motion−JPEG2000符号化情報内で、フレーム合成方法及び合成に要するフレーム数の情報を埋め込む方法としては、例えば、フレーム合成方法をフレーム単位で切り換える場合には、各合成フレームのコードストリームのメインヘッダ中に、マーカ・セグメントCME(Comment and Extension)として挿入し、フレーム合成方法をタイル単位で切り換える場合には、同様に各タイル・パート・ヘッダ中に、マーカ・セグメントCMEとして挿入すればよい。CMEは、JPEG2000規格においてユーザの拡張用に用意されたオプションで、CMEによりJPEG2000規格で規定されない情報ビットを、メインヘッダまたはタイル・パート・ヘッダに挿入することができる。本願において、ヘッダ中のCMEには、画面情報や、何フレーム分をひとつの合成フレームとしたかや、図4あるいは図6〜図7のうちのいずれの合成フレームの合成方法を採用したか等の情報を書き込むことができる。例えば、画面の大きさに関する情報では、4つの原フレームをひとつの合成フレームとした場合には、合成フレームの画面情報は原フレームの4倍となる。
【0040】
以上のように、本実施の形態の画像符号化装置においては、本発明の第1の実施の形態である画像符号化装置に比較して、さらに符号化効率が向上し、より少ない符号量で動画像を圧縮符号化することができる。
【0041】
次に本発明の第3の実施の形態となる画像復号化装置について説明する。本実施の形態の画像復号化装置は、前述の本発明の第1の実施の形態の画像符号化装置により符号化された画像符号化情報の復号化を行うものである。
【0042】
図10は、本実施の形態の画像復号化装置のブロック図である。本実施の形態の画像復号化装置100は、画像復号化部101、フレーム分離部102から構成されている。復号化を行う符号化情報について、例として、JPEG2000を用いて符号化されたMotion−JPEG2000符号化情報について説明する。
図15は、本実施の形態の画像復号化装置の動作のフローチャートである。図10において、入力符号化ストリームが、画像復号化部101に入力される(ステップ151)。画像復号化部101は、復号化を行い(ステップ152)、復号化された合成フレームを、フレーム分離部102に順次出力する。フレーム分離部102は、合成フレームが入力される毎に、前述の合成手法と逆の操作により、入力された合成フレームの各画素を組み換えて、所定数のフレーム画像を分離し(ステップ153)、順次出力する(ステップ154)。 本実施の形態における画像復号化部101の動作について説明する。図11は、画像復号化部101のブロック図である。画像復号化部101は、エントロピー復号化部111、逆量子化部112、IDWT部113から構成されている。入力された符号化ストリームは、エントロピー復号化部111に入力される。エントロピー復号化部111において、ヘッダ情報などの付帯情報が抽出された後、量子化DWT係数の符号化情報が復号され、量子化DWT係数が順次、逆量子化部112に出力される。逆量子化部112では、エントロピー復号化部111からの量子化DWT係数が、所定の量子化テーブルにしたがって逆量子化され、DWT係数がIDWT部113に出力される。IDWT部113では、逆量子化部112からのDWT係数に対して、逆離散ウェーブレット変換が行われ、順次生成されるタイル画像が組み合わされて、フレーム画像が再構成され、出力される。
【0043】
図10に示す本実施の形態において、画像復号化部101により出力される画像は、合成フレームである。本実施の形態では、画像復号化部101の後段に、フレーム分離部102を接続することにより、本発明の第1の実施の形態の画像符号化装置により符号化された画像を復号化することができる。
【0044】
図22は、フレーム分離部102のブロック図である。フレーム分離部102は、合成フレームバッファ221、CPU225、メモリ226から構成されている。画像復号化部101から入力される復号化された合成画像のフレームは、合成フレームバッファ221に格納される。合成フレームバッファ221は、1つの合成フレームを格納できるだけの容量を持っている。メモリ226には、予め合成に要するフレーム数及び合成方法の情報が記録されている。この合成に要するフレーム数及び合成方法の情報は、本発明の第1の実施の形態の画像符号化装置において用いられたものと同じである。CPU225は、メモリ226に記録された合成に要するフレーム数及び合成方法の情報を参照し、合成フレームバッファ221からの画素の読み出し制御を行う。例えば、合成に要するフレーム数が4であった場合、まず最初に、合成フレームを構成する各画素のうち、フレーム0に相当する部分の画素を順次読み出し、出力する。同様に、フレーム1、フレーム2、フレーム3の順に読み出していく。以上の動作を、画像復号化部101から合成フレームが入力される毎に繰り返す。このようにして、復号化された合成フレームを分離することができる。なお、処理速度向上のために、合成フレームバッファへの合成フレームの書き込みと、画素の読み出しをパイプライン動作させることもできるが、その場合、追加の合成フレームバッファが必要である。該フレーム分離部の構成も、ハードウェア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウェア的にはメモリにロードされたプログラムなどをCPUが実行することによって実現できる。また、これらの構成が、ハードウェアのみ、ソフトウェアのみ、またはそれらの組み合わせによって実現できることは当業者に理解されるところである。
【0045】
なお、上述のように、本実施の形態の画像復号化装置は、本発明の第1の実施の形態の画像符号化装置と組み合わせて使用されるべきものであるので、フレーム分離部102は、本発明の第1の実施の形態の画像符号化装置におけるフレーム合成部12に対応したものである。また、本実施の形態の画像復号化装置と、本発明の第1の実施の形態の画像符号化装置とで用いられる合成手法は、予め決められたものである。
【0046】
次に本発明の第4の実施の形態となる画像復号化装置について説明する。本実施の形態の画像復号化装置は、前述の本発明の第2の実施の形態の画像符号化装置により符号化された画像符号化情報の復号化を行うものである。
【0047】
図12は、本実施の形態の画像復号化装置のブロック図である。なお、本実施の形態の画像復号化装置において、本発明の第3の実施の形態の画像復号化装置と重複する部分については、同じ符号を付し、その詳細な説明を省略する。本実施の形態の画像復号化装置は、フレーム合成情報抽出部121、画像復号化部101、フレーム分離部122、フレーム分離制御部123とから構成されている。
図17は、本実施の形態の画像復号化装置の動作のフローチャートである。図12において、入力符号化ストリームが、フレーム合成情報抽出部121に入力される(ステップ171)。フレーム合成情報抽出部121は、入力符号化ストリームからフレーム合成方法及び合成に要するフレーム数の情報を抽出し、残りの画像符号化情報を画像復号化部101に出力するとともに、フレーム合成方法及び合成に要するフレーム数の情報をフレーム分離制御部123に出力する(ステップ172)。復号化を行う符号化情報について、例として、JPEG2000を用いて符号化されたMotion−JPEG2000符号化情報について説明する。画像復号化部101は、Motion−JPEG2000規格にしたがって、フレーム合成情報抽出部121からの画像符号化情報の復号化を行い、復号化された合成フレームを、フレーム分離部122に順次出力する(ステップ173)。フレーム分離制御部123は、フレーム合成情報抽出部121により抽出されたフレーム合成方法及び合成に要するフレーム数の情報を、フレーム分離部122に入力される合成フレームとタイミングを合わせて、フレーム分離部122に出力する。フレーム分離部122は、画像復号化部101から合成フレームが入力される毎に、フレーム分離制御部123から入力される合成方法の情報にしたがって、当該合成方法と逆の操作により、入力された合成フレームの各画素を組み換え、フレーム分離制御部123から入力される合成に要するフレーム数のフレーム画像を分離し(ステップ174)、順次出力する(ステップ175)。フレーム分離部122は、本発明の第3の実施の形態におけるフレーム分離部102と同様の構成である。但し、フレーム分離制御部123から入力された合成に要するフレーム数及びフレーム合成方法の情報は、メモリ226に格納され、CPU225により毎回参照される。また、合成フレームの取り得る最大容量に見合った容量の合成フレームバッファが必要である。合成フレームの取り得る最大容量は、原フレームの容量に合成に要するフレーム数の取り得る最大数を乗じたものである。
【0048】
以上のように、本実施の形態の画像復号化装置は、本発明の第2の実施の形態の画像符号化装置により符号化された画像を復号化することができる。
【0049】
次に本発明の第5の実施の形態について説明する。本実施の形態は、本発明による画像符号化装置と画像復号化装置を応用したシステムの一具体例であるところの遠隔映像伝送システムであり、遠隔地にある映像送信端末より、映像を、ネットワーク経由で送信を行い、映像受信端末において、受信した映像を、記録・モニタリングするものである。
【0050】
図13は、本実施の形態の遠隔映像伝送システムのブロック図である。本実施の形態の遠隔映像伝送システムは、映像送信端末131と映像受信端末132から構成されており、さらに映像送信端末131は、映像入力装置133、A/Dコンバータ134、画像符号化装置10、ネットワークI/F135から構成され、映像受信端末132は、ネットワークI/F136、画像復号化装置100、D/Aコンバータ137、映像出力装置138とから構成されている。まず、映像送信端末131の動作について説明する。映像送信端末131において、映像入力装置133は、伝送するアナログ映像信号をA/Dコンバータ134に出力する。A/Dコンバータ134は、映像入力装置133からのアナログ映像信号をディジタル画像信号に変換し、画像符号化装置10に供給する。画像符号化装置10は、A/Dコンバータ134からのディジタル画像信号を圧縮符号化し、生成した画像符号化情報をネットワークI/F135に出力する。ネットワークI/F135は、画像符号化装置10からの画像符号化情報をパケット化し、順次ネットワーク経由で、映像受信端末132に送出する。次に、映像受信端末132の動作について説明する。映像受信端末132において、ネットワークI/F136は、映像送信端末131により送出された画像符号化情報のパケットを受信し、画像符号化情報を抽出して、画像復号化装置100に出力する。画像復号化装置100は、ネットワークI/F136からの画像符号化情報を復号化し、生成したディジタル画像信号をD/Aコンバータ137に出力する。D/Aコンバータ137は、画像復号化装置100からのディジタル画像信号を、アナログ映像信号に変換し、映像出力装置138に出力する。
【0051】
ここで、画像符号化装置10は、本発明による画像符号化装置であって、前述のように、従来の画像符号化装置よりも符号化効率がよく、画像符号化情報の符号量が少ない為、ネットワークの負荷を低減でき、また、記録媒体の容量を節約できるという利点がある。また、画像復号化装置100は、本発明による画像復号化装置であって、本発明による画像符号化装置により符号化された画像符号化情報を復号化することができる。
【0052】
本実施の形態の画像伝送システムは、様々な用途に利用することが可能である。例えば、映像入力装置133を監視カメラとして、映像出力装置138を監視モニタとすることにより、遠隔監視装置システムとして利用できる。また、映像入力装置133を、配信映像再生装置として、映像出力装置138をモニタ等とすることにより、ストリーミング映像配信システムとしても利用可能である。
【0053】
次に本発明の第六の実施の形態について説明する。本実施の形態は、本発明による画像符号化装置と画像復号化装置を応用したシステムの別の一具体例であるところのビデオ録画再生システムであり、動画像を圧縮記録、あるいは圧縮記録された動画像を伸長再生するものである。
【0054】
図18は、本実施の形態のビデオ録画再生システムのブロック図である。本実施の形態のビデオ録画再生システムは、映像入力端子181、A/Dコンバータ182、画像符号化装置10、メモリ184、記録媒体185、画像復号化装置100、D/Aコンバータ187、映像出力端子188、CPU189とから構成されている。本システムにおいて、CPU189は、動画像圧縮記録・伸長再生の制御を行い、必要に応じて記録媒体への読み書き制御も行う。
まず、映像記録時の動作について説明する。映像入力端子181からアナログ映像信号がA/Dコンバータ134に入力される。A/Dコンバータ182は、映像入力端子181からのアナログ映像信号をディジタル画像信号に変換し、画像符号化装置10に供給する。画像符号化装置10は、A/Dコンバータ182からのディジタル画像信号を圧縮符号化し、生成した画像符号化情報をメモリ184に記録する。CPU189は、必要に応じて、メモリ184に記録された符号化情報の記録媒体185への書き込みを行う。なお、記録媒体としては、磁気テープや、磁気ディスク及び光ディスクなど、一般に広く使われている媒体を使用できる。
次に、映像再生時の動作について説明する。CPU189は、記録媒体185に書き込まれた画像符号化情報のメモリ184への読み出しを行う。メモリ184は、記録された画像符号化情報を、画像復号化装置100に出力する。画像復号化装置100は、メモリ184からの画像符号化情報を復号化し、生成したディジタル画像信号をD/Aコンバータ187に出力する。D/Aコンバータ187は、画像復号化装置100からのディジタル画像信号を、アナログ映像信号に変換し、映像出力端子188に出力する。
【0055】
ここで、画像符号化装置10は、本発明による画像符号化装置であって、前述のように、従来の画像符号化装置よりも符号化効率がよく、画像符号化情報の符号量が少ない為、メモリ184の容量を節約でき、また、記録媒体185の容量を節約できるという利点がある。また、画像復号化装置100は、本発明による画像復号化装置であって、本発明による画像符号化装置により符号化された画像符号化情報を復号化することができるのは、本発明の第五の実施の形態と同様である。
【0056】
本実施の形態では、ビデオ録画システムとビデオ再生システムの各々別のシステムに分離することも可能である。すなわち、ビデオ録画システムは、映像入力端子181、A/Dコンバータ182、画像符号化装置10、メモリ184、記録媒体185、CPU189とで構成でき、ビデオ再生システムは、メモリ184、記録媒体185、画像復号化装置100、D/Aコンバータ187、映像出力端子188、CPU189とで構成できる。
【0057】
また、本実施の形態の映像入力端子181にカメラを、映像出力端子188にモニタを接続することにより、ディジタル・ビデオ・カメラ・システムとすることもできる。
【0058】
次に本発明の第7の実施の形態について説明する。本実施の形態は、本発明の第1の実施の形態の画像符号化装置と本発明の第2の実施の形態の画像復号化装置の双方の機能を備えた画像符号化復号化装置である。すなわち、一般に、画像符号化装置及び画像復号化装置をシステムLSI等のハードウェアで構成する場合に、各々独立したハードウェアとする場合もあるが、画像符号化装置及び画像復号化装置の機能を統合した画像符号化復号化装置とすることができる。この場合、画像符号化と画像復号化とにおいて比較的似通った処理を共通化することで回路規模を削減することができ、画像符号化と画像復号化の両方の機能を持つシステムの部品数を削減し、コストを下げることができる。
【0059】
図20は、本発明の第7の実施の形態となる画像符号化復号化装置のブロック図である。本実施の形態の画像符号化復号化装置193は、画像符号化復号化部201、フレーム合成部12、フレーム分離部102から構成されている。
本実施の形態の画像符号化復号化装置は、画像符号化を行う場合には、フレーム合成部12と画像符号化復号化部201により、本発明の第1の実施の形態の画像符号化装置と同じ動作をする。また、本実施の形態の画像符号化復号化装置は、画像復号化を行う場合には、画像符号化復号化部201とフレーム分離部102とにより、本発明の第3の実施の形態の画像復号化装置と同じ動作をする。したがって本発明の第1の実施の形態の画像符号化装置と本発明の第3の実施の形態の画像復号化装置の両方の機能を、よりコンパクトな構成で実現可能である。なお、詳細な説明は省略するが、本実施の形態と同様に、画像符号化復号化部201を用いることにより、本発明の第1の実施の形態の画像符号化装置と本発明の第3の実施の形態の画像復号化装置の両方の機能を備える画像符号化復号化装置を構成することができる。
【0060】
次に本発明の第8の実施の形態について説明する。本実施の形態は、本発明による画像符号化装置と画像復号化装置を応用したシステムの別の一具体例であるところのビデオ録画再生システムであり、本発明の第6の実施の形態のビデオ録画再生システムに、本発明の第7の実施の形態の画像符号化復号化装置を適用し、改良を施したものである。
本実施の形態のビデオ録画再生システムにおいて、本発明の第6の実施の形態のビデオ録画再生システムと重複する部分については、同じ符号を付し、その詳細な説明を省略する。本実施の形態のビデオ録画再生システムは、本発明の第6の実施の形態のビデオ録画再生システムにおける画像符号化装置10と画像復号化装置100の代わりに、画像符号化装置10と画像復号化装置100の双方の機能を兼ね備えた画像符号化復号化装置191を備える。これにより、本実施の形態のビデオ録画再生システムは、本発明の第6の実施の形態のビデオ録画再生システムに比べて、コンパクトな構成となり、低コストで安価なビデオ録画再生システムである。
【0061】
なお、本発明の第5、第6、第8の実施の形態は、本発明による画像符号化装置と画像復号化装置の応用システムの例であって、本発明による画像符号化装置と画像復号化装置は、動画像の効率的な伝送及び蓄積を必要とする様々な応用システムに適用することができる。 本発明の画像符号化装置及び画像符号化方法によれば、入力動画像の所定数あるいは可変数の連続するフレーム毎に、該連続フレームの各画素を組み合わせて、単一の合成フレームを生成し、該合成フレームに対して、所定の符号化規格に従って符号化を行い、符号化情報を出力することにより、動画像の時間軸方向の相関性を、空間領域の相関性に変換して、符号化の効率を向上することができる。さらに、動画像の動きや空間スペクトルを検出して、フレームの合成方法及び合成に要するフレーム数を可変とすることにより、一層符号化の効率を向上することができ、高圧縮率と高画質を両立することが可能である。
また、本発明の画像復号化装置及び画像符号化方法は、上述の合成フレームを符号化して生成された符号化情報が入力され、該符号化情報に対して、所定の符号化規格にしたがって復号化を行い、さらに復号化された合成フレームの各画素の分離及び再構成を行い、所定数あるいは可変数の連続するフレーム画像を生成し、順次出力することにより、上述の合成フレームを符号化して生成された符号化情報を復号化できる。
【0062】
また、上述した実施例では従来の符号化/復号化規格を用いることが可能であるため、新たな規格を生成する必要がないという利点に加え、従来の符号化/復号化規格を用いた上で、更に、圧縮率の高い符号化を実現することができる。
【0063】
【発明の効果】
本発明の画像符号化装置及び画像符号化方法によれば、画像の符号化効率を向上することができ、高圧縮率と高画質を実現することが可能である。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態となる画像符号化装置のブロック図。
【図2】従来のMotion−JPEG2000符号化装置のブロック図。
【図3】通常のMotion−JPEG2000規格のファイル・フォーマットの構造の一例を示す図。
【図4】フレーム合成方法の第一の例を説明する為の図。
【図5】本発明によるMotion−JPEG2000規格のファイル・フォーマットの構造の一例を示す図。
【図6】フレーム合成方法の第二の例を説明する為の図。
【図7】フレーム合成方法の第三の例を説明する為の図。
【図8】フレーム合成方法の第四の例を説明する為の図。
【図9】本発明の第二の実施の形態となる画像符号化装置のブロック図。
【図10】本発明の第三の実施の形態となる画像復号化装置のブロック図。
【図11】従来のMotion−JPEG2000復号化装置のブロック図。
【図12】本発明の第四の実施の形態となる画像復号化装置のブロック図。
【図13】本発明の第五の実施の形態となる遠隔画像伝送システムのブロック図。
【図14】本発明の第1の実施の形態の動作フロー図。
【図15】本発明の第3の実施の形態の動作フロー図。
【図16】本発明の第2の実施の形態の動作フロー図。
【図17】本発明の第4の実施の形態の動作フロー図。
【図18】本発明の第6の実施の形態となるビデオ記録再生システムのブロック図。
【図19】本発明の第8の実施の形態となるビデオ記録再生システムのブロック図。
【図20】本発明の第7の実施の形態となる画像符号化復号化装置のブロック図。
【図21】本発明のフレーム合成部のブロック図。
【図22】本発明のフレーム分離部のブロック図。
【符号の説明】
10…画像符号化装置
11…画像符号化部
12…フレーム合成部
21…DWT部
22…量子化部
23…エントロピー符号化部
91…フレーム合成部
92…フレーム合成情報埋込部
93…フレーム合成制御部
100…画像復号化装置
101…画像復号化部
102…フレーム分離部
111…エントロピー復号化部
112…逆量子化部
113…IDWT部
121…フレーム合成情報抽出部
122…フレーム分離部
123…フレーム分離制御部
131…映像送信端末
132…映像受信端末
133…映像入力装置
134…A/Dコンバータ
135・136…ネットワークI/F
137…D/Aコンバータ
138…映像出力装置
141…画像入力ステップ
142…フレーム数をカウントするステップ
143…カウントを比較するステップ
144…カウントをリセットするステップ
145…フレーム合成ステップ
146…画像符号化ステップ
147…符号化情報出力ステップ
151…符号化情報入力ステップ
152…画像復号化ステップ
153…フレーム分離ステップ
154…画像出力ステップ
161…画像入力ステップ
161…フレーム合成方法決定ステップ
163…フレーム数をカウントするステップ
164…カウントを比較するステップ
165…カウントをリセットするステップ
166…フレーム合成ステップ
167…画像符号化ステップ
168…フレーム合成情報埋め込みステップ
169…符号化情報出力ステップ
171…符号化情報入力ステップ
172…画像合成情報抽出ステップ
173…画像復号化ステップ
174…フレーム分離ステップ
175…画像出力ステップ
181…画像入力端子
182…A/Dコンバータ
184…メモリ
185…記録媒体
187…D/Aコンバータ
188…画像出力端子
189…CPU
191…画像符号化復号化装置
211…フレームバッファ
212…フレームバッファ
213…フレームバッファ
214…フレームバッファ
215…CPU
216…メモリ
217…セレクタ
221…合成フレームバッファ
225…CPU
226…メモリ
【発明の属する技術分野】
本発明は、画像の効率的な圧縮符号化/復号化装置及び方法に関する。
【0002】
【従来の技術】
放送・通信・蓄積メディア等において、ディジタル画像データを取り扱うための画像圧縮符号化方式が、数多く考案されている。これらの画像圧縮符号化方式には、様々な技術が採用されているが、DCT(Discrete Cosine Transform)等の直交変換、直交変換係数の量子化、及び可変長符号を組み合わせた変換符号化方式が、特に広く用いられている。例えば、主に静止画像を対象とした変換符号化方式の規格として、JPEG規格がある。このJPEG規格では、DCT、DCT係数の量子化、及び可変長符号を組み合わせた画像圧縮符号化方式を用い、主観的に良好な画質を保ちながら、画像データ情報量を十分の一程度まで圧縮することが可能であり、さらに符号化効率を上げることができる。
【0003】
次に、動画像を対象とした代表的な規格として、MPEG規格が挙げられる。このMPEG規格は、JPEGと同様に、DCT・DCT係数の量子化・可変長符号を用いる変換符号化方式を基本とした上で、さらに双方向の動き補償予測方式を併用することにより、数十分の一程度の高い圧縮率を達成している。
【0004】
このように、DCT等を用いる変換符号化方式は、効率的に画像を圧縮することができるが、圧縮率を比較的高くした場合には、ブロック歪やモスキート・ノイズと呼ばれる画質劣化が発生することが知られている。DCT等の直交変換における演算量は、画素数に対して指数関数的に増大する為、直交変換を用いる画像圧縮符号化方式では、一般に、画面全体をブロックと呼ばれる8×8画素程度の小領域に分割して、ブロック単位で変換符号化を行う。この為、圧縮率を高めて、変換係数の量子化誤差が大きくなると、各ブロックの直流成分が不連続になり、ブロックの境界でギャップが発生する。このブロック間のギャップが、ブロック歪として視認される。
また、直交変換の基底関数が周期的である為、入力画像のブロック内に局所的なエッジが存在すると、変換係数の高周波成分が多くなる。その量子化誤差によって、再生画像のエッジ近傍に高周波の偽信号が発生する。この偽信号がモスキート・ノイズとして視認される。
【0005】
これらの画質劣化は、主観的画質を著しく損なうものであり、改善が望まれてきた。
【0006】
こうした要求から、最近では、DWT(Discrete Wavelet Transform)等の帯域分割フィルタ、量子化、エントロピー符号を用いたサブバンド階層符号化方式も普及しつつある。このDWTを用いた符号化では、ブロック歪を抑えやすく、モスキート・ノイズが発生しにくいという特徴がある。
【0007】
JPEGの次世代の規格であるJPEG2000(ITU−T T.800|ISO/IEC15444−1)は、DWTを採用したサブバンド階層符号化方式である。JPEG2000では、ブロックの代わりに、タイルと呼ばれる画面領域毎に処理を行う。タイルは任意の大きさの矩形領域であり、画面全体を多数の小さいタイルに分割して、タイル毎に細かくビット制御することが可能である。また、タイルを細かく分割せずに、画面全体とすることも可能である。JPEG2000は、低圧縮率から高圧縮率に至るまで、概ねJPEGより優れた画質を得られている。
【0008】
ところで、JPEGやJPEG2000は、主に静止画を対象とした規格であるが、動画に適用することも可能である。動画は連続する静止画の集合とみなせるので、各画像を順番に符号化すればよい。JPEGを用いて動画像を符号化する方式は、Motion−JPEGと呼ばれ、ディジタル・カメラ等に、広く普及している。また、JPEG2000を用いて動画像を符号化する方式は、通称Motion−JPEG2000と呼ばれている。
【0009】
以上に述べた画像圧縮の各規格によれば、比較的良好な圧縮率が得られるが、これらの規格に加えて、さらに独自に画像の冗長性を利用して画像情報の圧縮符号化を行う画像符号化・復号化装置も考案されている。
【0010】
例えば、画像符号化・復号化装置は、右目用画像及び左目用画像からなる立体動画像に対して符号化・復号化を行う装置であるが、右目用画像と左目用画像との間の相関性に着目し、右目用画像と左目用画像を合成し、生成した合成画像に対して、MPEGを用いて符号化・復号化を行うことにより、符号化の効率を向上している(特許文献1参照)。
【0011】
【特許文献1】
特開平8−70475号公報(第4−6頁、第1図)
【0012】
【発明が解決しようとする課題】
しかし、上記したMotion−JPEG2000による画像符号化装置では、静止画用の圧縮符号化の規格であるJPEG2000を活用して、概ね良好な圧縮率を得られるが、動画像における時間的冗長性を残しているという問題がある。すなわち、動画像の各フレーム間の相関性に基づく情報の圧縮が全く為されていないという問題点が挙げられる。
【0013】
つまり、Motion−JPEGやMotion−JPEG2000では、フレーム間の予測符号化を行わない。すなわち、これらの画像圧縮符号化方式は、画像の空間的相関性のみを利用し、時間的相関性を利用しない為に、MPEG等の空間的相関性と時間的相関性の双方を利用する規格に比べると、圧縮率を上げにくいという問題がある。ここで、空間的相関性とは、フレーム内の画素の相似性であり、時間的相関性とは、フレーム間の画素の相似性である。
【0014】
特に、Motion−JPEG2000は、サブバンド階層符号化方式であり、DCT等の変換符号化を用いる他の方式に対して、ブロック歪やモスキート・ノイズの発生を抑えやすいという利点がある為に、時間的相関性の活用による圧縮率のさらなる向上が望まれている。
【0015】
また、動画像の各フレームのコードストリームが独立して生成される為に、各フレームに共通な情報が重複して符号化されるため圧縮率の向上が図れないという問題点も挙げられる。各フレームに共通な情報とは、例えば画像のサイズ情報や、どのように符号化されているのかを表す情報を含むヘッダ等が挙げられる。
【0016】
さらに、特許文献1のように、従来の規格に加えて、さらに符号化効率を向上できる手法には、例えば、右目用画像及び左目用画像からなる立体動画像にしか適用できないという問題点があり、連続したフレームの時間的相関性に注目した合成については言及されていない。
【0017】
本発明は、この問題点に鑑み、動画像の圧縮符号化において、既存の画像圧縮符号化規格を活用しながらも、さらに高い圧縮率と高画質を実現する画像符号化装置、画像符号化方法、画像復号化装置、及び画像復号化方法を提供する。
【0018】
【課題を解決するための手段】
本願では、従来の画像符号化部の前段に、フレーム合成部を追加することにより、これらの問題点を解決する。
【0019】
本発明の画像符号化装置及び画像符号化方法は、入力動画像の所定数あるいは可変数の連続するフレーム毎に、該連続フレームの各画素を組み合わせて、単一の合成フレームを生成し、該合成フレームに対して、所定の符号化規格に従って符号化を行い、符号化情報を出力することを特徴とする。
【0020】
また、本発明の画像復号化装置及び画像復号化方法は、前記合成フレームを符号化して生成された符号化情報が入力され、該符号化情報に対して、所定の復号化規格にしたがって復号化を行い、さらに復号化された合成フレームの各画素の分離及び再構成を行い、所定数あるいは可変数の連続するフレーム画像を生成し、順次出力することを特徴とする。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態を図面を用いて説明する。なお、以下の説明では、画像圧縮符号化の規格としてMotion−JPEG2000を用いているが、これに限るものではない。例えばMotion−JPEGやDV規格などの他、動画像の空間的相関性を利用し、時間的相関性を利用しない符号化方式に適用することができる。
また、以下に説明する本発明の実施の形態の画像符号化装置及び画像復号化装置の動作は、専用のハードウェアのみならず、汎用のプロセッサ・システムによっても、実現可能である。
【0022】
図1は、本発明の第1の実施の形態となる画像符号化装置のブロック図である。本実施の形態の画像符号化装置10は、画像符号化部11、フレーム合成部12から構成されている。
図14は、本発明の第1の実施の形態の画像符号化装置の動作フローチャートである。
【0023】
図1において、入力画像の各フレームは、順次、フレーム合成部12に入力される(ステップ141)。フレーム合成部12は、フレームが入力される毎に、フレーム数をカウントし(ステップ142)、フレーム数のカウントを所定数と比較する(ステップ143)。フレーム数のカウントが所定数に等しくなるまで、ステップ141からステップ143が繰り返される。フレーム数のカウントが所定数に等しくなったとき、すなわち、所定数のフレームが入力される毎に、カウントをリセットし(ステップ144)、後述のように入力された各フレームの画素を組み合わせて、入力画像より大きい単一のフレーム画像を合成し、出力する(ステップ145)。ここで、合成とは、原フレームを分割した要素を組み合わせることである。ここで、該要素とは、画素単位やその他の任意に決定しうる複数個の画素の集合単位であってもよい。画像符号化部11は、フレーム合成部12から出力される合成画像に対して、フレーム毎にJPEG2000規格にしたがって符号化を行い(ステップ146)、生成した符号化情報を出力する(ステップ147)。以上のステップが、入力画像の終わりまで繰り返される。
【0024】
本実施の形態における画像符号化部11の動作について説明する。図2は、画像符号化部11のブロック図である。画像符号化部11は、DWT部21、量子化部22、エントロピー符号化部23から構成されている。画像は、DWT部21に入力される。DWT部21において、入力画像は所定の大きさのタイルに分割され、タイル毎に離散ウェーブレット変換が行われ、DWT係数が量子化部22に出力される。量子化部22では、DWT係数が所定の量子化テーブルにしたがって量子化され、量子化係数がエントロピー符号化部23及に出力される。エントロピー符号化部23では、量子化係数が所定の符号化テーブルによって符号化され、生成される符号化情報にヘッダ等の付帯情報を付加して順次出力する。
【0025】
この構成によって、前述のように画像の空間的相関性を利用した画像情報の圧縮が可能である。すなわち、入力画像は、DWTによって、いくつかのサブバンドに分割されるが、各サブバンドのDWT係数のうち、低域のDWT係数にエネルギーが集中し、高域のDWT係数には、エネルギーが少ない。そこで、低域のDWT係数については、量子化ステップを小さくし、高域のDWT係数については、量子化ステップを大きくすることで、それほど視覚的画質を損なわずに、情報量を削減することができる。また、エントロピー符号化により、DWT係数の統計的な偏りを利用して、可逆的に符号量を圧縮することができる。
【0026】
なお、DWT部21において、入力画像は、必ずしもタイルに分割する必要はなく、タイルの大きさも任意に設定できる。入力画像をタイルに分割する目的は、前述のように、ハードウェア上のメモリ容量の制約への対処や、画像の各部分において性質が大きく異なる場合等に、各部分毎の画質制御を行うことにある。
【0027】
次に、画像符号化部11により生成される符号化情報について、例として、JPEG2000を用いて動画像を符号化するMotion−JPEG2000について説明する。符号化情報であるMotion−JPEG2000は、JPEG2000のファイル・フォーマットの一種として規定されている。JPEG2000のファイル・フォーマットとは、コードストリームと呼ばれる画像自体の符号化情報の他に、例えば、画像の色空間情報などといった多種の付帯情報とを包含するファイルの構造である。これらの情報は、それぞれがボックスと呼ばれる構造により区分格納され、これらのボックスによりファイルを構成している。Motion−JPEG2000は、動画像を構成する各フレームのコードストリームの実体あるいは参照情報のボックスと、時刻情報などの付帯情報のボックスから成るファイル・フォーマットである。
【0028】
図3は、Motion−JPEG2000のファイルの構造の一例を示している。jp2は、シグネチャ・ボックスと呼ばれ、JPEG2000のファイル・フォーマットであることを識別する。ftypは、ファイル・タイプ互換ボックスと呼ばれ、ファイル・フォーマットの種類を識別する。ftyp内では、Motion−JPEG2000を表す”mjp2”が記述される。moovは、ムービー・ボックスと呼ばれ、付帯情報全般を格納する。詳細は省略するが、moovは、時刻情報などの各付帯情報を格納するサブ・ボックスを包含している。mdatは、メディア・データ・ボックスと呼ばれ、動画像のコードストリームを包含している。動画像のコードストリームは、動画像の各フレームのコードストリームから構成されている。ここで、各フレームのコードストリームは、静止画のJPEG2000規格によるものと同一である。すなわち、各フレームのコードストリームは、符号化情報のヘッダ、タイル・パート・ヘッダとタイル・パートの複数組、及びマーカーEOC(End of codestream)から構成されている。メイン・ヘッダは、画像のサイズ情報やウェーブレット変換に関する情報等を有している。タイル・パートは、各タイルに対応するコードストリームの一部分であり、タイル・パートの数は任意に設定できる。タイル・パート・ヘッダは、対応するタイル・パートの属するタイルの番号等の情報を有している。EOCはコードストリームの終わりを示すマーカーである。図3に示すように、フレーム0、フレーム1、フレーム2、フレーム3、・・・の各フレームのコードストリームが、順次連結され、動画像のコードストリームを構成している。
【0029】
本実施の形態においては、従来の符号化部11の前段に、フレーム合成部12を追加したことにより、これらの問題点を解決している。図21は、フレーム合成部12の一例のブロック図である。フレーム合成部12は、フレームバッファ211・212・213・214、CPU215、メモリ216、セレクタ217から構成されている。以下、本発明におけるフレーム合成部12の動作について図4を参照して説明する。
【0030】
図4は、フレーム合成部12において、動画の複数の連続フレームを合成し、合成フレームを生成する動作の一例を示している。この例では、連続する4フレーム毎に、1枚の合成フレームを生成しているが、これに限らず、合成に要するフレーム数は任意に決めることができる。ここで、合成に要するフレーム数とは、ひとつの合成フレームを作成するのに要する原フレームの数である。図21において、入力画像の各フレームは、4つのフレームバッファに順次格納される。CPU215は、入力フレームをカウントし、入力画像の各フレームバッファへの書き込みを制御する。すなわち、連続して入力されたフレーム0、フレーム1、フレーム2、フレーム3がそれぞれ、フレームバッファ211・212・213・214に順番に格納され、以後4フレームごとに繰り返される。次に、フレームバッファに格納された各フレームの画素を、セレクタ217により選択して、所定の順序で読み出し、合成フレームを出力する。CPU215は、フレームバッファ211・212・213・214に格納された各フレームの画素の読み出しとセレクタ217の切り換え出力を制御する。図4に示すように、フレーム0、フレーム1、フレーム2、フレーム3の左上端の画素を、この順に水平方向に並べる。このように、水平方向に順に配列していく順序をラスター順という。以下、同様にして、ラスター順で、各フレームの画素を順に並べていく。この結果、元のフレームの水平サイズの4倍の水平サイズを持つ合成フレームが生成され、この合成フレームが、画像符号化部11に入力される。メモリ216には、予め合成に要するフレーム数及び合成方法の情報が記録されており、CPU215は、メモリ216に記録された合成に要するフレーム数の情報を参照して、上記のフレーム合成動作の制御を行う。フレーム合成部12は、少なくとも、合成に要するフレーム数と同数のフレームバッファを備えていなければならない。処理速度向上のために、フレームバッファへの入力フレームの書き込みと、画素の読み出しをパイプライン動作させることもできるが、その場合、追加のフレームバッファが必要である。該フレーム合成部の構成は、ハードウェア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウェア的にはメモリにロードされたプログラムなどをCPUが実行することによって実現される。尚、これらの構成が、ハードウェアのみ、ソフトウェアのみ、またそれらの組み合わせによって実現できることは当業者に理解されるところである。
【0031】
このような合成によって、合成フレーム内では水平方向に時間的に近接した同一位置の画素が4つずつ並べられることになる。すなわち、各画素における時間方向の相関性が、水平方向の相関性に置き換えられることになる。これにより、前述のDWT係数のエネルギーの低域への集中がさらに促進され、符号化効率が向上する効果が得られる。
【0032】
なお、符号化の対象となる動画像の総フレーム数が、合成に要するフレーム数で割り切れない場合が考えられるが、最後のフレームを繰り返すか、あるいは中間階調のフレームを追加することによって、総フレーム数を合成に要するフレーム数の倍数になるようにしてやれば、なんら問題はない。例えば、4つの原フレームからひとつの合成フレームを作成する場合であって、原フレームが6つしかない場合には、上述の最後のフレームを繰り返す方法を採用すれば、1フレーム目から4フレーム目までを1つ目の合成フレームとし、5フレーム目と6フレーム目に6フレーム目のフレームを2フレーム分追加することで2つ目の合成フレームを生成することができる。この場合の上記のフレーム合成部12の動作は、CPU215が、セレクタ217において、フレームバッファ213・214から読み出した画素の代わりに、フレームバッファ212から読み出した画素を選択するように制御を行う。
【0033】
また、本実施の形態によれば、動画像の各フレームに共通な情報が重複して符号化されるという問題点も改善される。
【0034】
図5は、本実施の形態によるMotion−JPEG2000のファイルの構造を示している。jP2、ftyp、moovについては、図3で示した通常のMotion−JPEG2000のファイルと同様であり、本実施の形態によるMotion−JPEG2000のファイルの場合にも変わりはない。図3との相違では、mdat内のコードストリームについては、4つの連続フレーム毎に、フレーム合成部12によって生成する合成フレームに対して符号化を行う為に、通常のMotion−JPEG2000のファイルの場合と比較して、本実施の形態によるMotion−JPEG2000のファイルの場合には、メイン・ヘッダとEOCの総数が4分の1に減少し、その分の符号量を削減できることになる。また、タイル・パートについても、前述のように、符号量が概ね減少している。
【0035】
ここで、フレーム合成部12における合成動作については、図4の合成方法に限らず、様々な方法が適用可能である。図6は、フレーム合成部12における合成動作の別の例を示している。この例では、各フレームの画素を、垂直方向に並べる。入力動画像の時間方向の相関性は、垂直方向の相関性に置き換えられ、前述の図4の場合とほぼ同じ効果が得られる。また、図7は、フレーム合成部12における合成動作のさらに別の例を示している。この例では、各フレームの画素を、水平垂直方向に格子状に並べる。入力動画像の時間方向の相関性は、水平及び垂直方向双方の相関性に置き換えられ、やはり、前述の例と同様の効果が得られる。さらに、図8は、フレーム合成部12における合成動作のもう一つの別の例を示している。この例では、各フレームは、そのまま格子状に並べられる。この例は、入力動画像にシーン・チェンジや、かなり動きがある場合等、時間方向の相関性がほとんど無い場合に有効である。すなわち、前述の例のように合成した場合に、時間方向の相関性がほとんど無い為に、かえって空間領域の相関性が損なわれ、符号化効率が悪化するのを防ぐことができる。この場合にも、符号化情報におけるメイン・ヘッダとEOCの重複を緩和し、符号量を削減できる利点がある為、通常のMotion−JPEG2000に比べて有利である。また、ここに挙げた以外の合成方法も種種考えられる。これらの例においても、合成に要するフレーム数を任意に設定できることは明らかである。また、合成に要するフレーム数及び合成方法の情報は、予めメモリ216に記録され、CPU215により参照されることは、図4の例と同じである。
【0036】
以上のように、本実施の形態の画像符号化装置においては、従来のMotion−JPEG2000の画像符号化装置に比較して、符号化効率が向上し、少ない符号量で動画像を圧縮符号化することができる。
【0037】
次に本発明の第2の実施の形態となる画像符号化装置について説明する。本実施の形態の画像符号化装置は、前述の本発明の第1の実施の形態の画像符号化装置に改良を加えたものである。
【0038】
すなわち、前述のように、フレーム合成部12における合成動作については、図4に示したような合成方法に限らず、様々な合成方法が考えられるが、これらの合成方法は、符号化の対象となる動画像の性質によって、その効果が異なってくる。例えば、シーン・チェンジや動きの多い画像に対しては、図8に示したような合成方法のほうが、図4、図6、図7に示した合成方法よりも符号化効率がよいと考えられる。動きの少ない画像に対しては、図4、図6、図7に示した合成方法が有利であるが、特に画像の空間スペクトルにおいて、縦縞が多い画像等の水平方向の高周波成分が多い場合には、時間軸の相関性を水平方向に展開することで、見かけ上、水平方向の高周波成分を落とすことができる為、図4に示した合成方法が有利である。ここで、空間スペクトルとは、簡単には、水平方向あるいは垂直方向の画像の変化を表す周波数成分である。同様の理由から画像の空間スペクトルにおいて垂直方向の高周波成分が多い場合には、図6に示した合成方法が有利であり、画像の空間スペクトルにおいて水平方向と垂直方向で、ほぼ高周波成分が変わらない場合には、図7に示した合成方法が有利である。また、合成に要するフレーム数に関しても、符号化の対象となる動画像の性質によって、その効果が異なってくる。例えば、動きの少ない画像ほど、時間的相関性が高いので、合成に要するフレーム数を多くするほうが有利である。以上のことから、符号化対象となる画像、あるいはタイル等の部分画像毎に、その画像の動きや空間スペクトル等の性質によって、フレーム合成方法及び合成に要するフレーム数を切り換えることにより、さらに符号化効率を向上することができる。
【0039】
図9は、本実施の形態の画像符号化装置のブロック図である。なお、本実施の形態の画像符号化装置において、本発明の第1の実施の形態の画像符号化装置と重複する部分については、同じ符号を付し、その詳細な説明を省略する。図1に示される第1の実施例との相違は、第1の実施例では合成フレームの合成方法が予め定められている場合に有効であるのに対し、本実施例は合成フレームの合成方法が選択可能である場合に有効である。本実施の形態の画像符号化装置は、フレーム合成部91、画像符号化部11、フレーム合成情報埋込部92、フレーム合成制御部93とから構成されている。本実施の形態の画像符号化装置の動作を、図16に示すフローチャートを用いて説明する。図9において、入力画像の各フレームは、順次、フレーム合成部91及びフレーム合成制御部93に入力される(ステップ161)。フレーム合成制御部93は、入力画像の動きや空間スペクトルを検出し、その結果からフレーム合成部91におけるフレーム合成方法と、合成に要するフレーム数を設定し(ステップ162)、フレーム合成部91及びフレーム合成情報埋込部92に出力する。フレーム合成部91は、フレームが入力される毎に、フレーム数をカウントし(ステップ163)、フレーム数のカウントを所定数と比較する(ステップ164)。フレーム数のカウントが所定数に等しくなるまで、ステップ161からステップ164が繰り返される。フレーム数のカウントが所定数に等しくなったとき、すなわち、フレーム合成制御部93により設定された合成に要するフレーム数のフレームが入力される毎に、カウントをリセットし(ステップ165)、フレーム合成制御部93により設定されたフレーム合成方法にしたがって、入力された各フレームの画素を組み合わせて、入力画像より大きい単一のフレーム画像を合成し(ステップ166)、画像符号化部11に出力する。フレーム合成部91は、本発明の第1の実施の形態におけるフレーム合成部12と同様の構成である。但し、フレーム合成制御部93により設定された合成に要するフレーム数及びフレーム合成方法の情報は、メモリ216に格納され、CPU215により毎回参照される。また、合成に要するフレーム数の取り得る最大値に見合った数のフレームバッファが必要である。すなわち、少なくとも合成に要するフレーム数の取り得る最大値と同数のフレームバッファが必要である。画像符号化部11により生成される符号化情報について、例として、JPEG2000を用いて動画像を符号化するMotion−JPEG2000について説明する。画像符号化部11は、フレーム合成部91から出力される合成画像に対して、フレーム毎にJPEG2000規格にしたがって符号化を行い(ステップ167)、生成したMotion−JPEG2000符号化情報を、フレーム合成情報埋込部92に出力する。フレーム合成情報埋込部92は、フレーム合成制御部93により設定されたフレーム合成方法及び合成に要するフレーム数の情報を、画像符号化部11からのMotion−JPEG2000符号化情報に埋め込み(ステップ168)、出力する(ステップ169)。なお、Motion−JPEG2000符号化情報内で、フレーム合成方法及び合成に要するフレーム数の情報を埋め込む方法としては、例えば、フレーム合成方法をフレーム単位で切り換える場合には、各合成フレームのコードストリームのメインヘッダ中に、マーカ・セグメントCME(Comment and Extension)として挿入し、フレーム合成方法をタイル単位で切り換える場合には、同様に各タイル・パート・ヘッダ中に、マーカ・セグメントCMEとして挿入すればよい。CMEは、JPEG2000規格においてユーザの拡張用に用意されたオプションで、CMEによりJPEG2000規格で規定されない情報ビットを、メインヘッダまたはタイル・パート・ヘッダに挿入することができる。本願において、ヘッダ中のCMEには、画面情報や、何フレーム分をひとつの合成フレームとしたかや、図4あるいは図6〜図7のうちのいずれの合成フレームの合成方法を採用したか等の情報を書き込むことができる。例えば、画面の大きさに関する情報では、4つの原フレームをひとつの合成フレームとした場合には、合成フレームの画面情報は原フレームの4倍となる。
【0040】
以上のように、本実施の形態の画像符号化装置においては、本発明の第1の実施の形態である画像符号化装置に比較して、さらに符号化効率が向上し、より少ない符号量で動画像を圧縮符号化することができる。
【0041】
次に本発明の第3の実施の形態となる画像復号化装置について説明する。本実施の形態の画像復号化装置は、前述の本発明の第1の実施の形態の画像符号化装置により符号化された画像符号化情報の復号化を行うものである。
【0042】
図10は、本実施の形態の画像復号化装置のブロック図である。本実施の形態の画像復号化装置100は、画像復号化部101、フレーム分離部102から構成されている。復号化を行う符号化情報について、例として、JPEG2000を用いて符号化されたMotion−JPEG2000符号化情報について説明する。
図15は、本実施の形態の画像復号化装置の動作のフローチャートである。図10において、入力符号化ストリームが、画像復号化部101に入力される(ステップ151)。画像復号化部101は、復号化を行い(ステップ152)、復号化された合成フレームを、フレーム分離部102に順次出力する。フレーム分離部102は、合成フレームが入力される毎に、前述の合成手法と逆の操作により、入力された合成フレームの各画素を組み換えて、所定数のフレーム画像を分離し(ステップ153)、順次出力する(ステップ154)。 本実施の形態における画像復号化部101の動作について説明する。図11は、画像復号化部101のブロック図である。画像復号化部101は、エントロピー復号化部111、逆量子化部112、IDWT部113から構成されている。入力された符号化ストリームは、エントロピー復号化部111に入力される。エントロピー復号化部111において、ヘッダ情報などの付帯情報が抽出された後、量子化DWT係数の符号化情報が復号され、量子化DWT係数が順次、逆量子化部112に出力される。逆量子化部112では、エントロピー復号化部111からの量子化DWT係数が、所定の量子化テーブルにしたがって逆量子化され、DWT係数がIDWT部113に出力される。IDWT部113では、逆量子化部112からのDWT係数に対して、逆離散ウェーブレット変換が行われ、順次生成されるタイル画像が組み合わされて、フレーム画像が再構成され、出力される。
【0043】
図10に示す本実施の形態において、画像復号化部101により出力される画像は、合成フレームである。本実施の形態では、画像復号化部101の後段に、フレーム分離部102を接続することにより、本発明の第1の実施の形態の画像符号化装置により符号化された画像を復号化することができる。
【0044】
図22は、フレーム分離部102のブロック図である。フレーム分離部102は、合成フレームバッファ221、CPU225、メモリ226から構成されている。画像復号化部101から入力される復号化された合成画像のフレームは、合成フレームバッファ221に格納される。合成フレームバッファ221は、1つの合成フレームを格納できるだけの容量を持っている。メモリ226には、予め合成に要するフレーム数及び合成方法の情報が記録されている。この合成に要するフレーム数及び合成方法の情報は、本発明の第1の実施の形態の画像符号化装置において用いられたものと同じである。CPU225は、メモリ226に記録された合成に要するフレーム数及び合成方法の情報を参照し、合成フレームバッファ221からの画素の読み出し制御を行う。例えば、合成に要するフレーム数が4であった場合、まず最初に、合成フレームを構成する各画素のうち、フレーム0に相当する部分の画素を順次読み出し、出力する。同様に、フレーム1、フレーム2、フレーム3の順に読み出していく。以上の動作を、画像復号化部101から合成フレームが入力される毎に繰り返す。このようにして、復号化された合成フレームを分離することができる。なお、処理速度向上のために、合成フレームバッファへの合成フレームの書き込みと、画素の読み出しをパイプライン動作させることもできるが、その場合、追加の合成フレームバッファが必要である。該フレーム分離部の構成も、ハードウェア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウェア的にはメモリにロードされたプログラムなどをCPUが実行することによって実現できる。また、これらの構成が、ハードウェアのみ、ソフトウェアのみ、またはそれらの組み合わせによって実現できることは当業者に理解されるところである。
【0045】
なお、上述のように、本実施の形態の画像復号化装置は、本発明の第1の実施の形態の画像符号化装置と組み合わせて使用されるべきものであるので、フレーム分離部102は、本発明の第1の実施の形態の画像符号化装置におけるフレーム合成部12に対応したものである。また、本実施の形態の画像復号化装置と、本発明の第1の実施の形態の画像符号化装置とで用いられる合成手法は、予め決められたものである。
【0046】
次に本発明の第4の実施の形態となる画像復号化装置について説明する。本実施の形態の画像復号化装置は、前述の本発明の第2の実施の形態の画像符号化装置により符号化された画像符号化情報の復号化を行うものである。
【0047】
図12は、本実施の形態の画像復号化装置のブロック図である。なお、本実施の形態の画像復号化装置において、本発明の第3の実施の形態の画像復号化装置と重複する部分については、同じ符号を付し、その詳細な説明を省略する。本実施の形態の画像復号化装置は、フレーム合成情報抽出部121、画像復号化部101、フレーム分離部122、フレーム分離制御部123とから構成されている。
図17は、本実施の形態の画像復号化装置の動作のフローチャートである。図12において、入力符号化ストリームが、フレーム合成情報抽出部121に入力される(ステップ171)。フレーム合成情報抽出部121は、入力符号化ストリームからフレーム合成方法及び合成に要するフレーム数の情報を抽出し、残りの画像符号化情報を画像復号化部101に出力するとともに、フレーム合成方法及び合成に要するフレーム数の情報をフレーム分離制御部123に出力する(ステップ172)。復号化を行う符号化情報について、例として、JPEG2000を用いて符号化されたMotion−JPEG2000符号化情報について説明する。画像復号化部101は、Motion−JPEG2000規格にしたがって、フレーム合成情報抽出部121からの画像符号化情報の復号化を行い、復号化された合成フレームを、フレーム分離部122に順次出力する(ステップ173)。フレーム分離制御部123は、フレーム合成情報抽出部121により抽出されたフレーム合成方法及び合成に要するフレーム数の情報を、フレーム分離部122に入力される合成フレームとタイミングを合わせて、フレーム分離部122に出力する。フレーム分離部122は、画像復号化部101から合成フレームが入力される毎に、フレーム分離制御部123から入力される合成方法の情報にしたがって、当該合成方法と逆の操作により、入力された合成フレームの各画素を組み換え、フレーム分離制御部123から入力される合成に要するフレーム数のフレーム画像を分離し(ステップ174)、順次出力する(ステップ175)。フレーム分離部122は、本発明の第3の実施の形態におけるフレーム分離部102と同様の構成である。但し、フレーム分離制御部123から入力された合成に要するフレーム数及びフレーム合成方法の情報は、メモリ226に格納され、CPU225により毎回参照される。また、合成フレームの取り得る最大容量に見合った容量の合成フレームバッファが必要である。合成フレームの取り得る最大容量は、原フレームの容量に合成に要するフレーム数の取り得る最大数を乗じたものである。
【0048】
以上のように、本実施の形態の画像復号化装置は、本発明の第2の実施の形態の画像符号化装置により符号化された画像を復号化することができる。
【0049】
次に本発明の第5の実施の形態について説明する。本実施の形態は、本発明による画像符号化装置と画像復号化装置を応用したシステムの一具体例であるところの遠隔映像伝送システムであり、遠隔地にある映像送信端末より、映像を、ネットワーク経由で送信を行い、映像受信端末において、受信した映像を、記録・モニタリングするものである。
【0050】
図13は、本実施の形態の遠隔映像伝送システムのブロック図である。本実施の形態の遠隔映像伝送システムは、映像送信端末131と映像受信端末132から構成されており、さらに映像送信端末131は、映像入力装置133、A/Dコンバータ134、画像符号化装置10、ネットワークI/F135から構成され、映像受信端末132は、ネットワークI/F136、画像復号化装置100、D/Aコンバータ137、映像出力装置138とから構成されている。まず、映像送信端末131の動作について説明する。映像送信端末131において、映像入力装置133は、伝送するアナログ映像信号をA/Dコンバータ134に出力する。A/Dコンバータ134は、映像入力装置133からのアナログ映像信号をディジタル画像信号に変換し、画像符号化装置10に供給する。画像符号化装置10は、A/Dコンバータ134からのディジタル画像信号を圧縮符号化し、生成した画像符号化情報をネットワークI/F135に出力する。ネットワークI/F135は、画像符号化装置10からの画像符号化情報をパケット化し、順次ネットワーク経由で、映像受信端末132に送出する。次に、映像受信端末132の動作について説明する。映像受信端末132において、ネットワークI/F136は、映像送信端末131により送出された画像符号化情報のパケットを受信し、画像符号化情報を抽出して、画像復号化装置100に出力する。画像復号化装置100は、ネットワークI/F136からの画像符号化情報を復号化し、生成したディジタル画像信号をD/Aコンバータ137に出力する。D/Aコンバータ137は、画像復号化装置100からのディジタル画像信号を、アナログ映像信号に変換し、映像出力装置138に出力する。
【0051】
ここで、画像符号化装置10は、本発明による画像符号化装置であって、前述のように、従来の画像符号化装置よりも符号化効率がよく、画像符号化情報の符号量が少ない為、ネットワークの負荷を低減でき、また、記録媒体の容量を節約できるという利点がある。また、画像復号化装置100は、本発明による画像復号化装置であって、本発明による画像符号化装置により符号化された画像符号化情報を復号化することができる。
【0052】
本実施の形態の画像伝送システムは、様々な用途に利用することが可能である。例えば、映像入力装置133を監視カメラとして、映像出力装置138を監視モニタとすることにより、遠隔監視装置システムとして利用できる。また、映像入力装置133を、配信映像再生装置として、映像出力装置138をモニタ等とすることにより、ストリーミング映像配信システムとしても利用可能である。
【0053】
次に本発明の第六の実施の形態について説明する。本実施の形態は、本発明による画像符号化装置と画像復号化装置を応用したシステムの別の一具体例であるところのビデオ録画再生システムであり、動画像を圧縮記録、あるいは圧縮記録された動画像を伸長再生するものである。
【0054】
図18は、本実施の形態のビデオ録画再生システムのブロック図である。本実施の形態のビデオ録画再生システムは、映像入力端子181、A/Dコンバータ182、画像符号化装置10、メモリ184、記録媒体185、画像復号化装置100、D/Aコンバータ187、映像出力端子188、CPU189とから構成されている。本システムにおいて、CPU189は、動画像圧縮記録・伸長再生の制御を行い、必要に応じて記録媒体への読み書き制御も行う。
まず、映像記録時の動作について説明する。映像入力端子181からアナログ映像信号がA/Dコンバータ134に入力される。A/Dコンバータ182は、映像入力端子181からのアナログ映像信号をディジタル画像信号に変換し、画像符号化装置10に供給する。画像符号化装置10は、A/Dコンバータ182からのディジタル画像信号を圧縮符号化し、生成した画像符号化情報をメモリ184に記録する。CPU189は、必要に応じて、メモリ184に記録された符号化情報の記録媒体185への書き込みを行う。なお、記録媒体としては、磁気テープや、磁気ディスク及び光ディスクなど、一般に広く使われている媒体を使用できる。
次に、映像再生時の動作について説明する。CPU189は、記録媒体185に書き込まれた画像符号化情報のメモリ184への読み出しを行う。メモリ184は、記録された画像符号化情報を、画像復号化装置100に出力する。画像復号化装置100は、メモリ184からの画像符号化情報を復号化し、生成したディジタル画像信号をD/Aコンバータ187に出力する。D/Aコンバータ187は、画像復号化装置100からのディジタル画像信号を、アナログ映像信号に変換し、映像出力端子188に出力する。
【0055】
ここで、画像符号化装置10は、本発明による画像符号化装置であって、前述のように、従来の画像符号化装置よりも符号化効率がよく、画像符号化情報の符号量が少ない為、メモリ184の容量を節約でき、また、記録媒体185の容量を節約できるという利点がある。また、画像復号化装置100は、本発明による画像復号化装置であって、本発明による画像符号化装置により符号化された画像符号化情報を復号化することができるのは、本発明の第五の実施の形態と同様である。
【0056】
本実施の形態では、ビデオ録画システムとビデオ再生システムの各々別のシステムに分離することも可能である。すなわち、ビデオ録画システムは、映像入力端子181、A/Dコンバータ182、画像符号化装置10、メモリ184、記録媒体185、CPU189とで構成でき、ビデオ再生システムは、メモリ184、記録媒体185、画像復号化装置100、D/Aコンバータ187、映像出力端子188、CPU189とで構成できる。
【0057】
また、本実施の形態の映像入力端子181にカメラを、映像出力端子188にモニタを接続することにより、ディジタル・ビデオ・カメラ・システムとすることもできる。
【0058】
次に本発明の第7の実施の形態について説明する。本実施の形態は、本発明の第1の実施の形態の画像符号化装置と本発明の第2の実施の形態の画像復号化装置の双方の機能を備えた画像符号化復号化装置である。すなわち、一般に、画像符号化装置及び画像復号化装置をシステムLSI等のハードウェアで構成する場合に、各々独立したハードウェアとする場合もあるが、画像符号化装置及び画像復号化装置の機能を統合した画像符号化復号化装置とすることができる。この場合、画像符号化と画像復号化とにおいて比較的似通った処理を共通化することで回路規模を削減することができ、画像符号化と画像復号化の両方の機能を持つシステムの部品数を削減し、コストを下げることができる。
【0059】
図20は、本発明の第7の実施の形態となる画像符号化復号化装置のブロック図である。本実施の形態の画像符号化復号化装置193は、画像符号化復号化部201、フレーム合成部12、フレーム分離部102から構成されている。
本実施の形態の画像符号化復号化装置は、画像符号化を行う場合には、フレーム合成部12と画像符号化復号化部201により、本発明の第1の実施の形態の画像符号化装置と同じ動作をする。また、本実施の形態の画像符号化復号化装置は、画像復号化を行う場合には、画像符号化復号化部201とフレーム分離部102とにより、本発明の第3の実施の形態の画像復号化装置と同じ動作をする。したがって本発明の第1の実施の形態の画像符号化装置と本発明の第3の実施の形態の画像復号化装置の両方の機能を、よりコンパクトな構成で実現可能である。なお、詳細な説明は省略するが、本実施の形態と同様に、画像符号化復号化部201を用いることにより、本発明の第1の実施の形態の画像符号化装置と本発明の第3の実施の形態の画像復号化装置の両方の機能を備える画像符号化復号化装置を構成することができる。
【0060】
次に本発明の第8の実施の形態について説明する。本実施の形態は、本発明による画像符号化装置と画像復号化装置を応用したシステムの別の一具体例であるところのビデオ録画再生システムであり、本発明の第6の実施の形態のビデオ録画再生システムに、本発明の第7の実施の形態の画像符号化復号化装置を適用し、改良を施したものである。
本実施の形態のビデオ録画再生システムにおいて、本発明の第6の実施の形態のビデオ録画再生システムと重複する部分については、同じ符号を付し、その詳細な説明を省略する。本実施の形態のビデオ録画再生システムは、本発明の第6の実施の形態のビデオ録画再生システムにおける画像符号化装置10と画像復号化装置100の代わりに、画像符号化装置10と画像復号化装置100の双方の機能を兼ね備えた画像符号化復号化装置191を備える。これにより、本実施の形態のビデオ録画再生システムは、本発明の第6の実施の形態のビデオ録画再生システムに比べて、コンパクトな構成となり、低コストで安価なビデオ録画再生システムである。
【0061】
なお、本発明の第5、第6、第8の実施の形態は、本発明による画像符号化装置と画像復号化装置の応用システムの例であって、本発明による画像符号化装置と画像復号化装置は、動画像の効率的な伝送及び蓄積を必要とする様々な応用システムに適用することができる。 本発明の画像符号化装置及び画像符号化方法によれば、入力動画像の所定数あるいは可変数の連続するフレーム毎に、該連続フレームの各画素を組み合わせて、単一の合成フレームを生成し、該合成フレームに対して、所定の符号化規格に従って符号化を行い、符号化情報を出力することにより、動画像の時間軸方向の相関性を、空間領域の相関性に変換して、符号化の効率を向上することができる。さらに、動画像の動きや空間スペクトルを検出して、フレームの合成方法及び合成に要するフレーム数を可変とすることにより、一層符号化の効率を向上することができ、高圧縮率と高画質を両立することが可能である。
また、本発明の画像復号化装置及び画像符号化方法は、上述の合成フレームを符号化して生成された符号化情報が入力され、該符号化情報に対して、所定の符号化規格にしたがって復号化を行い、さらに復号化された合成フレームの各画素の分離及び再構成を行い、所定数あるいは可変数の連続するフレーム画像を生成し、順次出力することにより、上述の合成フレームを符号化して生成された符号化情報を復号化できる。
【0062】
また、上述した実施例では従来の符号化/復号化規格を用いることが可能であるため、新たな規格を生成する必要がないという利点に加え、従来の符号化/復号化規格を用いた上で、更に、圧縮率の高い符号化を実現することができる。
【0063】
【発明の効果】
本発明の画像符号化装置及び画像符号化方法によれば、画像の符号化効率を向上することができ、高圧縮率と高画質を実現することが可能である。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態となる画像符号化装置のブロック図。
【図2】従来のMotion−JPEG2000符号化装置のブロック図。
【図3】通常のMotion−JPEG2000規格のファイル・フォーマットの構造の一例を示す図。
【図4】フレーム合成方法の第一の例を説明する為の図。
【図5】本発明によるMotion−JPEG2000規格のファイル・フォーマットの構造の一例を示す図。
【図6】フレーム合成方法の第二の例を説明する為の図。
【図7】フレーム合成方法の第三の例を説明する為の図。
【図8】フレーム合成方法の第四の例を説明する為の図。
【図9】本発明の第二の実施の形態となる画像符号化装置のブロック図。
【図10】本発明の第三の実施の形態となる画像復号化装置のブロック図。
【図11】従来のMotion−JPEG2000復号化装置のブロック図。
【図12】本発明の第四の実施の形態となる画像復号化装置のブロック図。
【図13】本発明の第五の実施の形態となる遠隔画像伝送システムのブロック図。
【図14】本発明の第1の実施の形態の動作フロー図。
【図15】本発明の第3の実施の形態の動作フロー図。
【図16】本発明の第2の実施の形態の動作フロー図。
【図17】本発明の第4の実施の形態の動作フロー図。
【図18】本発明の第6の実施の形態となるビデオ記録再生システムのブロック図。
【図19】本発明の第8の実施の形態となるビデオ記録再生システムのブロック図。
【図20】本発明の第7の実施の形態となる画像符号化復号化装置のブロック図。
【図21】本発明のフレーム合成部のブロック図。
【図22】本発明のフレーム分離部のブロック図。
【符号の説明】
10…画像符号化装置
11…画像符号化部
12…フレーム合成部
21…DWT部
22…量子化部
23…エントロピー符号化部
91…フレーム合成部
92…フレーム合成情報埋込部
93…フレーム合成制御部
100…画像復号化装置
101…画像復号化部
102…フレーム分離部
111…エントロピー復号化部
112…逆量子化部
113…IDWT部
121…フレーム合成情報抽出部
122…フレーム分離部
123…フレーム分離制御部
131…映像送信端末
132…映像受信端末
133…映像入力装置
134…A/Dコンバータ
135・136…ネットワークI/F
137…D/Aコンバータ
138…映像出力装置
141…画像入力ステップ
142…フレーム数をカウントするステップ
143…カウントを比較するステップ
144…カウントをリセットするステップ
145…フレーム合成ステップ
146…画像符号化ステップ
147…符号化情報出力ステップ
151…符号化情報入力ステップ
152…画像復号化ステップ
153…フレーム分離ステップ
154…画像出力ステップ
161…画像入力ステップ
161…フレーム合成方法決定ステップ
163…フレーム数をカウントするステップ
164…カウントを比較するステップ
165…カウントをリセットするステップ
166…フレーム合成ステップ
167…画像符号化ステップ
168…フレーム合成情報埋め込みステップ
169…符号化情報出力ステップ
171…符号化情報入力ステップ
172…画像合成情報抽出ステップ
173…画像復号化ステップ
174…フレーム分離ステップ
175…画像出力ステップ
181…画像入力端子
182…A/Dコンバータ
184…メモリ
185…記録媒体
187…D/Aコンバータ
188…画像出力端子
189…CPU
191…画像符号化復号化装置
211…フレームバッファ
212…フレームバッファ
213…フレームバッファ
214…フレームバッファ
215…CPU
216…メモリ
217…セレクタ
221…合成フレームバッファ
225…CPU
226…メモリ
Claims (27)
- 画像処理装置であって、
複数のフレームで構成される画像が入力される入力部と、
前記入力部から出力される前記画像を、所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎に組み合わせ、ひとつの合成フレームを生成するフレーム合成部と、
前記フレーム合成部から出力される合成フレームを所定の符号化規格に基づき符号化する符号化部と、
前記符号化部から出力される符号化情報を記録する記録部と、
前記記録部に格納した前記符号化情報が入力され、前記符号化情報を前記所定の符号化規格に基づき復号化する復号化部と、
前記復号化部から出力される復号化された前記合成フレームが入力され、当該合成フレームの前記所定の領域毎に分離し前記所定数の連続するフレームを再構成するフレーム分離部とを有することを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記フレーム合成部は、前記所定数の連続するフレームが得られない場合に、前記画像の最終フレームの所定の領域毎を重複して組み合わせて前記合成フレームを生成することを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記符号化情報中の前記合成フレームの符号化情報のヘッダには、前記合成フレームの画像のサイズの情報が書き込まれてあり、当該画像のサイズは、合成に要したフレーム分の大きさであることを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記所定の符号化規格は、JPEG2000規格であることを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記フレーム合成部と、前記符号化部と、前記復号化部と、前記フレーム分離部のうち、少なくとも2つは1チップで構成されることを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記フレーム合成部は、前記連続するフレームの同一位置の所定の領域を、水平方向、垂直方向、あるいは格子状のいずれかに順次並べて、前記合成フレームを生成することを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記フレーム合成部は、前記連続するフレームを、水平方向、垂直方向、あるいは格子状のいずれかに順次並べて、前記合成フレームを生成することを特徴とする画像処理装置。 - 画像処理装置であって、
複数のフレームで構成される画像が入力される入力部と、
前記入力部から出力される前記画像を、所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎を組み合わせ、ひとつの合成フレームを生成するフレーム合成部と、
前記フレーム合成部から出力される合成フレームを所定の符号化規格に基づき符号化する符号化部とを有することを特徴とする画像処理装置。 - 請求項8記載の画像処理装置であって、
前記符号化部から出力される符号化情報を記録する記録部とを有することを特徴とする画像処理装置。 - 請求項8記載の画像処理装置であって、
前記フレーム合成部と前記入力部とに接続されたフレーム合成制御部と、前記符号化部と前記フレーム合成制御部とに接続されたフレーム合成情報埋込部とを、さらに有してなり、
前記フレーム合成制御部は、前記画像の各フレームが入力され、当該入力画像の空間スペクトルを検出し、その結果から前記フレーム合成部におけるフレーム合成方法と、合成に要するフレーム数を設定し、フレーム合成部及びフレーム合成情報埋込部に出力し、
前記フレーム合成部は、前記フレーム合成制御部により設定された合成に要するフレーム数のフレームが入力される毎に、前記フレーム合成制御部により設定されたフレーム合成方法に従って、前記入力された各フレームの所定の領域毎に組み合わせて、合成フレームを作成し前記符号化部に出力し、
前記符号化部は、前記フレーム合成部から出力される前記合成フレームに対して、フレーム毎に所定の符号化規格にしたがって符号化を行い、生成した符号化情報を、前記フレーム合成情報埋込部に出力し、
前記フレーム合成情報埋込部は、前記フレーム合成制御部により設定されたフレーム合成方法及び合成に要するフレーム数の情報を、前記符号化部から出力された前記符号化情報に埋め込むことを特徴とする画像処理装置。 - 請求項8記載の画像処理装置であって、
前記フレーム合成部と、前記符号化部、前記フレーム合成制御部と、前記フレーム合成情報埋込部のうち、少なくとも2つは1チップで構成されることを特徴とする画像処理装置。 - 画像処理装置であって、
所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎を組み合わせ作成したひとつの合成フレームを、所定の符号化規格に基づき符号化して生成した符号化情報が入力される入力部と、
前記符号化情報を前記所定の符号化規格に基づき復号化する復号化部と、
前記復号化部が出力する復号化された前記合成フレームを入力され、当該合成フレームを前記所定の領域毎に分離し前記所定数の連続するフレームを再構成するフレーム分離部とを有することを特徴とする画像処理装置。 - 請求項12記載の画像処理装置であって、
前記符号化部から出力される符号化情報を記録する記録部とを有することを特徴とする画像処理装置。 - 請求項12記載の画像処理装置であって、
前記復号化部に接続されたフレーム合成情報抽出部と、当該フレーム合成情報抽出部とフレーム分離部とに接続されたフレーム分離制御部とを、さらに有してなり、
前記フレーム合成情報抽出部は、前記符号化情報を入力され、当該符号化情報からフレーム合成方法及び合成に要するフレーム数の情報を抽出し、残りの符号化情報を前記復号化部に出力するとともに、該フレーム合成方法及び合成に要するフレーム数の情報を前記フレーム分離制御部に出力し、
前記復号化部は、所定の規格にしたがって、前記フレーム合成情報抽出部から出力された符号化情報の復号化を行い、復号化された合成フレームを、前記フレーム分離部に出力し、
前記フレーム分離制御部は、前記フレーム合成情報抽出部により抽出されたフレーム合成方法及び合成に要するフレーム数の情報を、前記フレーム分離部に出力し、
前記フレーム分離部は、前記復号化部から復号化された前記合成フレームが入力される毎に、前記フレーム分離制御部から入力される合成方法の情報にしたがって、入力された合成フレームを前記所定の領域毎に分離することを特徴とする画像処理装置。 - 請求項12記載の画像処理装置であって、
前記復号化部、前記フレーム合成情報抽出部、前記フレーム分離部、前記フレーム分離制御部のうち、少なくとも2つは1チップで構成されることを特徴とする画像処理装置。 - 第1の端末と第2の端末と前記第1の端末と前記第2の端末とを接続するネットワークとを有する情報処理システムであって、
前記第1の端末は、
複数のフレームで構成される画像が入力される入力部と、
前記入力部から出力される前記画像を、所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎に組み合わせ、ひとつの合成フレームを生成するフレーム合成部と、
前記フレーム合成部から出力される合成フレームを所定の符号化規格に基づき符号化する符号化部と、
前記符号化部から出力される符号化情報を前記ネットワークに出力する第1のネットワークI/Fとを有し、
前記第2の通信端末は、
前記第1の端末が出力した前記符号化情報を前記ネットワークから入力される第2のネットワークI/Fと、
前記第2のネットワークI/Fに接続され、前記符号化情報を前記所定の符号化規格に基づき復号化する復号化部と、
前記復号化部が出力する復号化された前記合成フレームを入力され、当該合成フレームを前記所定の領域毎に分離し前記所定数の連続するフレームを再構成するフレーム分離部とを有することを特徴とする情報処理システム。 - 半導体集積回路であって、
複数のフレームで構成される画像が入力される入力部と、
前記入力部から出力される前記画像を、所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎に組み合わせ、ひとつの合成フレームを生成するフレーム合成部と、
前記フレーム合成部から出力される合成フレームを所定の符号化規格に基づき符号化する符号化部とを有することを特徴とする半導体集積回路。 - 請求項17記載の半導体集積回路であって、
前記符号化部から出力される符号化情報を記録する記録部とを有することを特徴とする半導体集積回路。 - 半導体集積回路であって、
所定数の連続するフレーム毎に、当該連続するフレームを所定の領域毎に組み合わせ作成したひとつの合成フレームを、所定の符号化規格に基づき符号化して生成した符号化情報が入力される入力部と、
前記符号化情報を前記所定の符号化規格に基づき復号化する復号化部と、
前記復号化部が出力する復号化された前記合成フレームを入力され、当該合成フレームを前記所定の領域毎に分離し前記所定数の連続するフレームを再構成するフレーム分離部とを有することを特徴とする半導体集積回路。 - 請求項19記載の半導体集積回路であって、
前記符号化部から出力される符号化情報を記録する記録部とを有することを特徴とする半導体集積回路。 - コンピュータを、
複数のフレームで構成される画像のフレーム数が所定数に達するか否か測定する部と、
前記フレーム数が所定数に達した場合、前記所定数の連続するフレーム毎に、当該連続するフレームを所定の領域毎に組み合わせて、ひとつの合成フレームを生成する部と、
前記合成フレームを所定の符号化規格に基づき符号化する部として機能させるためのプログラム。 - コンピュータを、
複数のフレームで構成される画像のフレームの空間スペクトルを検出し、該フレームの合成方法を決定する部と、
合成に要する前記フレーム数を設定する部と、
前記フレーム数が所定数に達するか否か測定する部と、
前記フレーム数が所定数に達した場合、前記所定数の連続するフレーム毎に、前記フレーム合成方法にしたがって、当該連続するフレームを所定の領域毎に組み合わせて、ひとつの合成フレームを生成する部と、
前記合成フレームを所定の符号化規格に基づき符号化する部と、
前記合成フレームの符号化情報のヘッダに前記フレーム合成方法及び前記合成に要するフレーム数の情報を書き込む部として機能させるためのプログラム。 - コンピュータを、
所定数の連続するフレーム毎に、当該連続するフレームを所定の領域毎に組み合わせ作成したひとつの合成フレームを、所定の符号化規格に基づき符号化した符号化情報を前記所定の規格に基づき復号化する部と、
復号化された前記合成フレームが入力される毎に、当該合成フレームの前記所定の領域毎に分離し、前記連続するフレームを再構成する部として機能させるためのプログラム。 - コンピュータを、
所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎を組み合わせ作成したひとつの合成フレームの符号化情報のヘッダから前記フレームの合成方法及び前記合成に要するフレーム数の情報を読み出す部と、
前記所定の符号化規格に基づき符号化された合成フレームを前記所定の規格に基づき復号化する部と、
前記フレームの合成方法及び前記合成に要するフレーム数の情報に基づき、復号化された前記合成フレームが入力される毎に、当該合成フレームの前記所定の領域毎に分離し、前記フレームを再構成する部として機能させるためのプログラム。 - 画像処理方法であって、
複数のフレームで構成される画像を入力され、
前記入力された画像を、所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎を組み合わせ、ひとつの合成フレームを生成し、
前記合成フレームを所定の符号化規格に基づき符号化し生成した符号化情報を記録し、
前記記録した前記符号化情報を前記所定の符号化規格に基づき復号化し、
前記復号化した前記合成フレームを前記所定の領域毎に分離し前記所定数の連続するフレームを再構成することを特徴とする画像処理方法。 - 画像処理方法であって、
複数のフレームで構成される画像を入力され、
前記入力された画像を、所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎を組み合わせ、ひとつの合成フレームを生成し、
前記合成フレームを所定の符号化規格に基づき符号化することを特徴とする画像処理方法。 - 画像処理方法であって、
所定数の連続するフレーム毎に、当該連続するフレームの所定の領域毎を組み合わせ作成したひとつの合成フレームを、所定の符号化規格に基づき符号化して生成した符号化情報を入力され、
前記符号化情報を前記所定の符号化規格に基づき復号化し、
前記復号化した前記合成フレームを入力され、当該合成フレームを前記所定の領域毎に分離し前記所定数の連続するフレームを再構成することを特徴とする画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002298230A JP2004135107A (ja) | 2002-10-11 | 2002-10-11 | 画像処理装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002298230A JP2004135107A (ja) | 2002-10-11 | 2002-10-11 | 画像処理装置及びその方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004135107A true JP2004135107A (ja) | 2004-04-30 |
Family
ID=32287707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002298230A Pending JP2004135107A (ja) | 2002-10-11 | 2002-10-11 | 画像処理装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004135107A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006310955A (ja) * | 2005-04-26 | 2006-11-09 | Sony Corp | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP2007036368A (ja) * | 2005-07-22 | 2007-02-08 | Ricoh Co Ltd | 符号化処理装置及び方法 |
JP2013081170A (ja) * | 2011-10-04 | 2013-05-02 | Thomson Licensing | Hdr画像をエンコードする方法および装置、hdr画像を再構成する方法および装置ならびに非一時的記憶媒体 |
-
2002
- 2002-10-11 JP JP2002298230A patent/JP2004135107A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006310955A (ja) * | 2005-04-26 | 2006-11-09 | Sony Corp | 符号化装置および方法、復号装置および方法、並びにプログラム |
US8086056B2 (en) | 2005-04-26 | 2011-12-27 | Kenji Yamane | Encoding device and method, decoding device and method, and program |
JP2007036368A (ja) * | 2005-07-22 | 2007-02-08 | Ricoh Co Ltd | 符号化処理装置及び方法 |
JP4637672B2 (ja) * | 2005-07-22 | 2011-02-23 | 株式会社リコー | 符号化処理装置及び方法 |
JP2013081170A (ja) * | 2011-10-04 | 2013-05-02 | Thomson Licensing | Hdr画像をエンコードする方法および装置、hdr画像を再構成する方法および装置ならびに非一時的記憶媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100664928B1 (ko) | 비디오 코딩 방법 및 장치 | |
KR100703724B1 (ko) | 다 계층 기반으로 코딩된 스케일러블 비트스트림의비트율을 조절하는 장치 및 방법 | |
US6862402B2 (en) | Digital recording and playback apparatus having MPEG CODEC and method therefor | |
JP3548136B2 (ja) | 画像処理装置 | |
EP0827344A2 (en) | Video decoder | |
JP2007174568A (ja) | 符号化方法 | |
JP2006304329A (ja) | 符号化方法及び復号化方法及び符号化装置及び復号化装置 | |
JP2006521039A (ja) | オーバコンプリートウェーブレット展開での動き補償時間フィルタリングを使用した3次元ウェーブレットビデオ符号化 | |
KR20060043051A (ko) | 영상 신호의 인코딩 및 디코딩 방법 | |
JP2008079326A (ja) | スケーラブルビデオコーディング及びデコーディング方法、並びにその装置 | |
JP2001258031A (ja) | 信号処理方法、画像符号化装置及び画像復号装置 | |
WO2012120909A1 (ja) | 動画像復号化装置および動画像復号化方法 | |
JP2001346165A (ja) | 画像処理方法とこの方法を利用可能な画像処理装置およびテレビジョン受像機 | |
JP3850015B2 (ja) | ディジタルビデオ信号記録再生装置および伝送装置 | |
WO2012120908A1 (ja) | 動画像符号化装置および動画像符号化方法 | |
JP2004135107A (ja) | 画像処理装置及びその方法 | |
KR20020065908A (ko) | 화상 재생 방법과 화상 처리 방법, 및 이들 방법을 이용가능한 화상 재생 장치, 화상 처리 장치, 텔레비전 수상기 | |
KR100714071B1 (ko) | 적응적으로 세분화된 gop 구조를 이용한 mctf-기반동영상 부호화 및복호화 방법 | |
JP2003115765A (ja) | 符号化装置及び符号化方法、復号装置及び復号方法、並びに編集装置及び編集方法 | |
JP3403169B2 (ja) | 画像再生方法とこの方法を利用可能な画像再生装置およびテレビジョン受像機 | |
JP3501521B2 (ja) | ディジタル映像信号再生装置および再生方法 | |
JP3403166B2 (ja) | 画像再生方法とこの方法を利用可能な画像再生装置およびテレビジョン受像機 | |
JP3403167B2 (ja) | 画像処理方法とこの方法を利用可能な画像処理装置およびテレビジョン受像機 | |
JP2004349939A (ja) | 画像符号化方法、画像符号化装置及び記録装置 | |
JP3374128B2 (ja) | 画像処理方法とこの方法を利用可能な画像処理装置およびテレビジョン受像機 |