JP2012135033A

JP2012135033A - αチャンネル映像復号化装置、αチャンネル復号化方法及び記録媒体

Info

Publication number: JP2012135033A
Application number: JP2012045807A
Authority: JP
Inventors: Woo-Shik Kim; 祐 ▲堤▼ 金; Hyun-Mun Kim; 鉉文金; Daisei Cho; 大星趙; Jinhyung Park; 鎭瑩朴
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2003-11-21
Filing date: 2012-03-01
Publication date: 2012-07-12
Anticipated expiration: 2024-11-22
Also published as: KR100695133B1; US20100177975A1; KR20050049419A; US8170357B2; DE602004017689D1; EP1534018A3; JP4995417B2; EP1534018B1; US20050117789A1; JP5421408B2; EP1534018A2; US7711196B2; JP2005160089A

Abstract

【課題】αチャンネル映像向けＣＢＰ生成装置及び方法、αチャンネル映像向け符号化又は復号化装置及び方法を提供する。
【解決手段】αチャンネル映像復号化装置は、αチャンネル映像を符号化したビット列を解析して、符号化単位である第１ブロック別に復号化するビット列解析部１０１０、復号化されたデータから第１ブロックに含まれる第２ブロック別に符号化ブロックパターンを抽出して解析する符号化ブロックパターン解析部１０３０、第２ブロックの符号化ブロックパターンによって、解析された符号化ブロックパターンと復号化された画素値とを利用して、現在αチャンネル映像を復元する映像復元部１０５０を含む。
【選択図】図１０

Description

本発明は映像符号化及び復号化に係り、特にαチャンネル映像のための符号化ブロックパターン（Coded Block Pattern：ＣＢＰ）を生成する装置及び方法とそれを利用してαチャンネル映像を符号化または復号化するための装置及び方法に関する。

αチャンネル映像は、一般映像で特定領域を選択するマスクの役割を行う。ＩＳＯ／ＩＥＣ
ＭＰＥＧ−４ビデオ符号化国際標準では、映像内のオブジェクト単位で符号化できる方法を提供するが、このとき、オブジェクト単位で区分するために形状情報を別途に符号化する。この形状情報は、αチャンネル映像と同一に使用することができる。しかし、ＭＰＥＧ−４では、一般映像を符号化する方法とは異なる方法で形状情報を符号化するため、αチャンネル映像の符号化装置を具現することが容易ではなく、その計算量が多くなるためリアルタイムでの処理が難しい。

最近、標準化が進められているＩＳＯ／ＩＥＣＭＰＥＧ及びＩＴＵ−ＴＶＣＥＧのＪＶＴ（Joint Video Team）のＨ.２６４／ＭＰＥＧ−４ｐｔ.１０ＡＶＣ標準化技術（非特許文献１）では、多様な方法で空間及び時間予測符号化を行って、一般的な映像の符号化効率を大きく向上させた。また、整数変換符号化という改善された機能を使用し、エントロピー符号化もＣＡＢＡＣ（Context Adaptive Binary Arithmetic Coding）を使用して符号化効率を向上させた。

しかしながら、αチャンネル映像を処理する方法については提供していない。
"ＴｅｘｔｏｆＩＳＯ／ＩＥＣＦＤＩＳ１４４９６−１０：ＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ−Ｃｏｄｉｎｇｏｆａｕｄｉｏ−ｖｉｓｕａｌｏｂｊｅｃｔｓ−Ｐａｒｔ１０：ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ"、ＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１，Ｎ５５５５，Ｍａｒｃｈ，２００３

本発明が解決しようとする技術的課題は、αチャンネル映像のためのＣＢＰを生成するための装置及び方法を提供することである。
また、本発明が解決しようとする他の技術的課題は、αチャンネル映像を符号化または復号化するための装置及び方法を提供することである。

前記した課題を達成するためになされた本発明によるαチャンネルのための符号化ブロックパターン生成装置は、αチャンネル映像で符号化単位に当る第１ブロックを複数の第２ブロックに分割するブロック分割部と、前記複数の第２ブロックに対してそれぞれ符号化ブロックパターンを割当て、第２ブロックに対する符号化ブロックパターンを組み合わせて前記第１ブロックに対する符号化ブロックパターンを生成する符号化ブロックパターン割当部と、を含む。

前記した課題を達成するためになされた本発明によるαチャンネルのための符号化ブロックパターン生成方法は、αチャンネル映像で符号化単位に当る第１ブロックを複数の第２ブロックに分割する段階と、前記複数の第２ブロックに対してそれぞれ符号化ブロックパターンを割当て、第２ブロックに対する符号化ブロックパターンを組み合わせて前記第１ブロックに対する符号化ブロックパターンを生成する段階と、を含む。

前記した他の課題を達成するためになされた本発明によるαチャンネル映像符号化装置は、αチャンネル映像で符号化単位に当る第１ブロックを構成する複数の第２ブロックに対してそれぞれ符号化ブロックパターンを割当てて前記第１ブロックに対する符号化ブロックパターンを生成する符号化ブロックパターン生成部と、前記第２ブロックの符号化ブロックパターンによって前記符号化ブロックパターン、または、前記符号化ブロックパターン及び前記第２ブロックの画素値を符号化するエントロピー符号化部と、を含む。

前記した他の課題を達成するためになされた本発明によるαチャンネル映像符号化方法は、αチャンネル映像で符号化単位に当る第１ブロックを構成する複数の第２ブロックに対してそれぞれ符号化ブロックパターンを割当てて前記第１ブロックに対する符号化ブロックパターンを生成する段階と、前記第２ブロックの符号化ブロックパターンによって前記符号化ブロックパターン、または、前記符号化ブロックパターン及び前記第２ブロックの画素値を符号化する段階と、を含む。

前記した他の課題を達成するためになされた本発明によるαチャンネル映像復号化装置は、αチャンネル映像を符号化したビット列を解析して符号化単位である第１ブロック別に復号化するビット列解析部と、前記復号化されたデータから前記第１ブロックに含まれる第２ブロック別に符号化ブロックパターンを抽出して解析する符号化ブロックパターン解析部と、前記第２ブロックの符号化ブロックパターンによって、前記解析された符号化ブロックパターンと復号化された画素値とを利用して現在αチャンネル映像を復元する映像復元部と、を含む。

前記した他の課題を達成するためになされた本発明によるαチャンネル映像復号化方法は、αチャンネル映像を符号化したビット列を解析して符号化単位の第１ブロック別に復号化する段階と、前記復号化されたデータから前記第１ブロックに含まれる第２ブロック別に符号化ブロックパターンを抽出して解析する段階と、前記第２ブロックの符号化ブロックパターンによって、前記解析された符号化ブロックパターンと復号化された画素値とを利用して現在αチャンネル映像を復元する段階と、を含む。

また、本発明では前記αチャンネル映像のための符号化ブロックパターン生成方法と前記αチャンネル映像符号化／復号化方法とをコンピュータに実行させるプログラムを記録したコンピュータ可読記録媒体を提供する。

本発明によるαチャンネル映像符号化／復号化装置及び方法は、一般映像信号とは独立してαチャンネル映像の符号化及び復号化が可能であるだけでなく、その構成が、一般的な映像符号化／復号化装置及び方法、例えば、Ｈ.２６４標準技術の構造と互換性があるため、共に具現して使用することが容易であり、少ない計算量で高い圧縮率を実現できる。

また、各ブロック別符号化ブロックパターンを組み合わせて、符号化単位で符号化ブロックパターンを生成することによって符号化ブロックパターンの符号化効率を向上させ、時空間予測符号化時に排他論理和演算を使用することによって画素値の符号化効率を向上させることができる。

αチャンネル映像のためのＣＢＰ生成装置の構成を示すブロック図である。一実施例によるＣＢＰ割当部の動作を説明するフローチャートである。他の実施例によるＣＢＰ割当部の動作を説明するフローチャートである。 αチャンネル映像符号化装置の基本的な構成を示すブロック図である。図４に示したαチャンネル映像符号化装置の第１実施例による構成を示すブロック図である。図４に示したαチャンネル映像符号化装置の第２実施例による構成を示すブロック図である。図４に示したαチャンネル映像符号化装置の第３実施例による構成を示すブロック図である。図４に示したαチャンネル映像符号化装置の第４実施例による構成を示すブロック図である。 αチャンネル映像符号化方法を説明するフローチャートである。 αチャンネル映像復号化装置の基本的な構成を示すブロック図である。図１０に示したαチャンネル映像復号化装置の第１実施例による構成を示すブロック図である。図１０に示したαチャンネル映像復号化装置の第２実施例による構成を示すブロック図である。図１０に示したαチャンネル映像復号化装置の第３実施例による構成を示すブロック図である。図１０に示したαチャンネル映像復号化装置の第４実施例による構成を示すブロック図である。 αチャンネル映像復号化方法を説明するフローチャートである。元映像およびαチャンネル映像を示す図面である。 αチャンネル映像を一定サイズのブロックに分割したことを示す図面である。図１６Ｂの一定サイズのブロックにＣＢＰ情報を割り当てたことを示す図面である。予測符号化により、図１６Ｂの一定サイズのブロックにＣＢＰ情報を割当てたことを示す図面である。ブロックの画素値を符号化するためのジグザグスキャンの順序を示す図面である。ブロックの画素値を符号化するための水平スキャンの順序を示す図面である。ブロックの画素値を符号化するための垂直スキャンの順序を示す図面である。映像の時間上、予測のために映像を一定サイズのブロックに分割する方法の一例を示す図面である。映像の空間予測のために隣接画素の位置を示す図面である。予測する現在ブロックの画素の位置及び予測方向を示す図面である。

以下、添付した図面を参照して、本発明の実施の形態によるαチャンネル映像符号化／復号化装置及び方法について詳細に説明する。
図１は、本実施の形態によるαチャンネル映像のための符号化ブロックパターン（以下、ＣＢＰと省略する）生成装置の構成を示すブロック図である。ＣＢＰ生成装置は、ブロック分割部１１０及びＣＢＰ割当部１３０より構成される。

ブロック分割部１１０では、０または１の画素値を有するαチャンネル映像を、符号化単位に当る第１ブロックに分割した後、第１ブロックを所定サイズの第２ブロックに分割する。符号化単位が、例えば１６×１６マクロブロックである場合、αチャンネル映像をマクロブロックに分割し、各マクロブロックを、例えば、４個の８×８ブロックに分割する。

ＣＢＰ割当部１３０では、ブロック分割部１１０で分割された第１ブロックに含まれる各第２ブロックに対してＣＢＰを割当て、かつ組み合わせて第１ブロックの最終的なＣＢＰを生成する。

図２は、図１に示したＣＢＰ割当部１３０による、元のαチャンネル映像に対してＣＢＰを割当てる動作の例を説明するフローチャートである。
図２を参照すれば、第１ブロックを１６×１６画素ブロックとし、第１ブロックを４分割して４個の８×８画素ブロックとし、これを第２ブロックとしたときの、第２ブロックのＣＢＰ値を割当てる（２１０段階）。このとき、ＣＢＰ値は｛ｔｒａｎｓｐａｒｅｎｔ，ｏｐａｑｕｅ，ｍｉｘｅｄ｝の値のうち一つを有する。一般的に、ｔｒａｎｓｐａｒｅｎｔ（透明）は背景領域を、ｏｐａｑｕｅ（不透明）は選択された領域を意味するが、ここでは、第２ブロックの画素値全体がｔｒａｎｓｐａｒｅｎｔであるときに、このブロックのＣＢＰ値をｔｒａｎｓｐａｒｅｎｔ（例えば、０）とし、第２ブロックの画素値全体がｏｐａｑｕｅである時にこのブロックのＣＢＰ値をｏｐａｑｕｅ（例えば、１）とし、第２ブロックの画素値が、一部はｔｒａｎｓｐａｒｅｎｔ、残りはｏｐａｑｕｅの値を有する場合、ＣＢＰ値をｍｉｘｅｄ（例えば、２）とする。

２３０段階では、第１ブロックに対するＣＢＰ値を決定する。このとき、４個の第２ブロックのＣＢＰ値を組み合わせて一つのＣＢＰ値を構成する。４個のブロックの有しうる値の数が３個であるので、第１ブロックのＣＢＰの有しうる値の最大数は３⁴＝８１個になる。このような第２ブロックのＣＢＰ値の８１個の組み合わせから、第１ブロックのＣＢＰ値を決定する。８１個の値が発生するので、固定長符号化をする場合、７ビットの符号が必要であるが、一般的に８１個の組み合わせが発生する頻度が相異なるので、頻繁に発生する組み合わせの順序によって第１ブロックのＣＢＰ値を付与して可変長符号化することが効果的である。

または、８１個の組み合わせのうち、発生頻度の低い組み合わせを統合して組み合わせの数を減らして符号化効率を向上させることもできる。例えば、いずれも０の画素値を有する８×８ブロックでマクロブロックが構成されるか、いずれも１の画素値を有する８×８ブロックでマクロブロックが構成されるか、いずれも０の画素値を有する８×８ブロックといずれも１の画素値を有する８×８ブロックとよりなる場合、１６×１６マクロブロックの構成形態（the configuration form）を‘００’に設定する。いずれも０の画素値を有する８×８ブロック及び０の画素値と１の画素値とが混在した８×８ブロックよりマクロブロックが構成される場合、マクロブロックの構成形態を‘０１’に設定する。いずれも１の画素値を有する８×８ブロック及び０の画素値と１の画素値とが混在した８×８ブロックよりマクロブロックが構成される場合、マクロブロックの構成形態を‘１０’に設定する。いずれも０の画素値を有する８×８ブロック、いずれも１の画素値を有する８×８ブロック及び０の画素値と１の画素値とが混在した８×８ブロックよりマクロブロックが構成される場合、マクロブロックの構成形態を‘０１’に設定する。

次に、マクロブロックに含まれる４個の８×８ブロックのＣＢＰ情報をマクロブロックの構成形態によって４ビットに設定する。すなわち、各８×８ブロックのＣＢＰ情報は１ビットに設定されうる。例えば、マクロブロックの構成形態が‘１０’に設定される場合、いずれも１の画素値を有する８×８ブロックのＣＢＰ情報は０、０の画素値と１の画素値とが混在した８×８ブロックのＣＢＰ情報は１に設定する。

次に、マクロブロックの構成形態を表す２ビットとマクロブロックに含まれたブロックのＣＢＰ情報を表す４ビットとを組み合わせて一つのマクロブロックに対するＣＢＰを生成する。このようにマクロブロックに対するＣＢＰを生成すれば、一つのマクロブロックの有しうるＣＢＰの種類は６ビットで表現できる４８個になる。このとき、４個の８×８ブロックの構成によって一つのマクロブロックが有しうる場合の数は、３⁴（＝８１）個存在するが、符号化実験を通じて８１個の場合の数のうち確率的な統計によって確率の高い４８個の場合の数を選択したものである。表現しない３１個の場合の数は、実験結果、ほぼ０％に近い確率分布を示した。

前記した２１０段階を図表化すれば、次に示す表１のように表せる。

表１を参照すれば、いずれも０の画素値を有する２個の８×８ブロックと、０の画素値および１の画素値が混在した２個の８×８ブロックとから、マクロブロックが構成される場合には、マクロブロックの構成形態は‘０１’に設定され、４個の８×８ブロックのＣＢＰ情報は‘００１１’に設定される。すなわち、一つのマクロブロックに対するＣＢＰは‘０１００１１’（＝１９）になる。

図３は、図１に示したＣＢＰ割当部１３０による、予測符号化されたαチャンネル映像に対してＣＢＰを割当てる動作の例を説明するフローチャートである。

図３を参照すれば、３１０段階では、予測符号化されたαチャンネル映像のマクロブロックを構成する各８×８ブロックに含まれる画素値が調べられる。予測符号化されたαチャンネル映像は、現在のαチャンネル映像と、空間予測映像（a spatial prediction image）または時間予測映像（a temporal prediction image）との間の排他論理和演算を行うことによって得られる。このとき、現在のαチャンネル映像と空間予測映像または時間予測映像との２つの画素値が同じであれば０、異なれば１の値が算出される。予測符号化されたα映像で任意のブロックがいずれも０の画素値を有する場合にＣＢＰ情報を０、任意のブロックがいずれも１の画素値を有するか、または０の画素値と１の画素値とが混在した場合にＣＢＰ情報を１に割当てる。

３３０段階では、４個の８×８ブロックに対する４個のＣＢＰ情報を組み合わせて一つの１６×１６マクロブロックに対するＣＢＰを生成する。このようにマクロブロックのＣＢＰを生成すれば、一つのマクロブロックの有することができるＣＢＰの種類は、一つの８×８ブロックが｛０,１｝のうち一つの値を有することができるため、２⁴＝１６個になる。

図４は、本実施の形態によるαチャンネル映像符号化装置の基本的な構成を示すブロック図である。αチャンネル映像符号化装置は、ＣＢＰ生成部４１０及びビット列生成部４５０を含んで構成される。ここで符号化部（図５ないし図８の４３０）は、オプションとして含まれる構成要素であり、ＣＢＰ生成部４１０の前段側または後段側に配置することができる。

図４を参照すれば、ＣＢＰ生成部４１０では、αチャンネル映像の各符号化単位に対してＣＢＰを生成する。元のαチャンネル映像または予測符号化されたαチャンネル映像で各符号化単位別にＣＢＰを生成する方法は、図２または図３に示した方法による。各符号化単位別にＣＢＰ情報が生成された元のαチャンネル映像または予測符号化されたαチャンネル映像は、ビット列生成部４５０に提供される。

ビット列生成部４５０では、元のαチャンネル映像または予測符号化されたαチャンネル映像の各符号化単位に対してＣＢＰ生成部４１０で生成されたＣＢＰによって符号化を行ってビット列を生成する。ここで、符号化単位に含まれる各ブロックの画素値が符号化されるか否かは、各ブロックに割当てられたＣＢＰによって決定される。望ましくは、ビット列生成部４５０にエントロピー符号化を適用する。

ビット列生成部４５０が元のαチャンネル映像を受信した場合は、一部のマクロブロックはＣＢＰのみから、その他のマクロブロックはＣＢＰと画素値とから構成されるビット列が出力される。

また、ＣＢＰを生成した後に、予測符号化したαチャンネル映像を受信した場合、ビット列生成部４５０で生成されるビット列は、一部のマクロブロックはＣＢＰのみから、その他のマクロブロックはＣＢＰ、予測モード及び予測符号化された画素値から構成される。
また、ＣＢＰを生成した後に、予測符号化、変換及び量子化したαチャンネル映像を受信した場合、ビット列生成部４５０で生成されるビット列は、一部のマクロブロックはＣＢＰのみ、その他のマクロブロックはＣＢＰ、予測モード及び量子化された変換係数値から構成される。

また、ＣＢＰを生成する前に、予測符号化されたαチャンネル映像を受信した場合、ビット列生成部４５０で生成されるビット列は、一部のマクロブロックは予測モードとＣＢＰとから、その他のマクロブロックは予測モード、ＣＢＰ及び予測符号化された画素値から構成される。

また、ＣＢＰを生成する前に、予測符号化、変換および量子化されたαチャンネル映像を受信した場合、ビット列生成部４５０で生成されるビット列は、一部のマクロブロックは予測モードとＣＢＰとから、その他のマクロブロックは予測モード、ＣＢＰ及び量子化された変換係数値から構成される。

図２に示した方法によって、各符号化単位のＣＢＰを４８個のうちから生成する場合において、各符号化単位のＣＢＰで先頭の２ビットが‘０１’または‘１０’に設定すると、最後の４ビットに設定されたＣＢＰの１つのマクロブロックである８×８ブロックは、０の画素値と１の画素値とが混在するので、当該８×８ブロックのＣＢＰ及びブロック内部の画素値を符号化してビット列に含め、それ以外の場合は、０の画素値と１の画素値とが混在していない場合であるため、各８×８ブロックのＣＢＰのみを符号化してビット列に含める。また、図２に示した方法によって、各符号化単位のＣＢＰを８１個のうちから生成する場合において、各符号化単位でＣＢＰ情報が０または１である８×８ブロックは、ＣＢＰ情報のみをエントロピー符号化してビット列に含め、ＣＢＰ情報が２である８×８ブロックは、ＣＢＰ情報及びブロック内部の画素値を符号化してビット列に含める。

一方、図３に示した方法によって、各符号化単位のＣＢＰを１６個のうちから生成する場合において、各符号化単位でＣＢＰ情報が０である８×８ブロック、すなわち、０の画素値のみからなるブロックの場合は、ＣＢＰ情報のみをエントロピー符号化してビット列に含め、ＣＢＰ情報が１である８×８ブロック、すなわち、１の画素値のみからなる、または０及び１の画素値が混在して構成される場合は、ＣＢＰ情報及びブロック内部の画素値を符号化してビット列に含める。

一方、通常のＨ.２６４では、ＣＡＶＬＣ（Context based Adaptive Variable Length Coding）及びＣＡＢＡＣという２つのエントロピー符号化方法をサポートする。図２に示したＣＢＰ生成方法を使用する場合、Ｈ.２６４で使用するＣＡＶＬＣ及びＣＡＢＡＣ用ＶＬＣテーブルを利用することができる。但し、αチャンネル映像の特性によってＣＢＰの確率分布が一般映像のＶＬＣテーブル上の確率分布と異なるので、αチャンネル映像のＣＢＰの確率分布によってＶＬＣテーブルを再構成する必要がある。また、ＣＡＢＡＣエントロピー符号化を使用する場合には、αチャンネル映像の特性上、イントラモードまたはインターモードに関係なく画素値が０である場合が多いので、ＣＡＢＡＣのための初期モデルをインターモードで使用するモデルとして適用して使用することによって、エントロピー符号化の効率を向上させることができる。

一方、時空間予測符号化を行った後にＣＢＰを設定する場合、一つのマクロブロックは、１６個のうちから一つのＣＢＰを有することができる。この場合、一つのマクロブロックのＣＢＰ値によって割当てられるエントロピー符号化値の例は、次に示す表２の通りであり、このテーブルはイントラモード及びインターモードに対して区分せずに同一に適用することができる。

表２を参照すれば、任意のマクロブロックのＣＢＰが８である場合、４の値に符号化されることがわかる。

図５は、図４に示したαチャンネル映像符号化装置の第１実施例による構成を示すブロック図であって、符号化部４３０は、ＣＢＰ生成部４１０とビット列生成部４５０との間に位置し、時空間予測部５１０及び時空間予測補償部５３０を含んで構成される。これにより、エントロピー符号化以前に時空間予測符号化を行い、予測符号化されたデータに対してエントロピー符号化を行う。

図５を参照すれば、ＣＢＰ生成部４１０は、図２に示した方法に基づいてマクロブロックに対するＣＢＰを生成する。ＣＢＰの生成結果、現在αチャンネル映像ＦｎでＣＢＰが‘ｔｒａｎｓｐａｒｅｎｔ’または‘ｏｐａｑｕｅ’である８×８ブロックは、ビット列生成部４５０に提供されると同時に、そのまま復元された現在αチャンネル映像Ｆ’ｎとなり、ＣＢＰがｍｉｘｅｄである８×８ブロックは時空間予測部５１０に提供される。

時空間予測部５１０では、イントラモードの場合、復元された現在αチャンネル映像Ｆ’ｎを参照する空間予測を行って空間予測映像を生成し、現在αチャンネル映像Ｆｎと空間予測映像との間の排他論理和演算を行い、その結果値を時空間予測補償部５３０に提供すると同時に、ビット列生成部４５０に提供する。一方、時空間予測部５１０では、インターモードの場合、復元された以前αチャンネル映像Ｆ’ｎ−１を参照する時間予測を行って時間予測映像を生成し、現在αチャンネル映像Ｆｎと時間予測映像との間の排他論理和演算による符号化を行い、その結果値を時空間予測補償部５３０に提供すると同時に、ビット列生成部４５０に提供する。このように現在のαチャンネル映像と空間予測映像または時間予測映像との間の排他論理和演算による符号化を行えば、現在のαチャンネル映像と空間予測映像または時間予測映像との２つの画素値が同じであれば０、異なれば１の値が出る。すなわち、時空間予測によって｛０,１｝の２つの画素値のみ出るので、画素値の符号化効率を向上させることができる。復号化時にも同様に排他論理和演算を行って元のαチャンネル映像を復元することができる。

時空間予測補償部５３０では、時空間予測部５１０から提供される時間予測符号化されたデータまたは空間予測符号化されたデータを補償して復元された現在αチャンネル映像Ｆ’ｎを生成する。一方、ＣＢＰ生成部４１０での生成されたＣＢＰのすべての画素値が‘ｏｐａｑｕｅ’である８×８ブロックを表す場合及びすべての画素値が‘ｔｒａｎｓｐａｒｅｎｔ’である８×８ブロックを表す場合、各８×８ブロックはＣＢＰに合せて現在αチャンネル映像Ｆｎを復元する。

図６は、図４に示したαチャンネル映像符号化装置の第２実施例による構成を示すブロック図であって、図５に示したαチャンネル映像符号化装置に、変換／量子化部６３０及び逆量子化／逆変換部６５０をさらに含んで構成される。これにより、エントロピー符号化以前に時空間予測符号化を行い、時空間予測符号化されたデータに対して変換及び量子化を行い、変換及び量子化されたデータをエントロピー符号化する。

図６に示す時空間予測部６１０には、現在αチャンネル映像Ｆｎの０の画素値と１の画素値とが混在するブロックが入力される。時空間予測部６１０では、イントラモードの場合、復元された現在αチャンネル映像Ｆ’ｎを参照する空間予測を行って空間予測映像を生成し、現在のαチャンネル映像と空間予測映像間の排他論理和演算による符号化を行い、その結果値を変換／量子化部６３０に提供する。そして、時空間予測部６１０では、インターモードで復元された以前αチャンネル映像Ｆ’ｎ−１を参照して時間予測符号化を行って時間予測映像を生成し、現在のαチャンネル映像と空間予測映像間の排他論理和演算による符号化を行い、その結果値を符号化して変換／量子化部６３０に提供する。

変換／量子化部６３０では、時空間予測部６１０から提供される時空間予測符号化されたデータを、例えば、ＤＣＴ変換のような変換及び量子化を行い、変換及び量子化されたデータをビット列生成部４５０に提供すると同時に、逆量子化／逆変換部６５０に提供する。

逆量子化／逆変換部６５０では、変換／量子化部６３０で変換及び量子化されたデータを逆量子化及び逆変換し、逆量子化及び逆変換されたデータを時空間予測補償部６７０に提供する。

時空間予測補償部６７０では、逆量子化／逆変換部６５０で逆量子化及び逆変換されたデータを補償して、復元された現在αチャンネル映像Ｆ’ｎを生成する。一方、ＣＢＰ生成部４１０での生成されたＣＢＰのすべての画素値が‘ｏｐａｑｕｅ’である８×８ブロックを表す場合及びすべての画素値が‘ｔｒａｎｓｐａｒｅｎｔ’である８×８ブロックを表す場合、各８×８ブロックはＣＢＰに合せて現在αチャンネル映像Ｆ’ｎを復元する。

図７は、図４に示したαチャンネル映像符号化装置の第３実施例による構成を示すブロック図であって、符号化部４３０はＣＢＰ生成部４１０の前段側に位置し、時空間予測部７１０及び時空間予測補償部７３０を含んで構成される。これにより、復元された以前αチャンネル映像または復元された現在αチャンネル映像を参照して現在αチャンネル映像に対して時空間予測符号化を行い、予測符号化されたデータに対してＣＢＰを生成する。

図７に示した時空間予測部７１０では、現在αチャンネル映像Ｆｎを入力として、イントラモードの場合、復元された現在αチャンネル映像Ｆ’ｎを参照する空間予測を行って空間予測映像を生成し、現在αチャンネル映像Ｆｎと空間予測映像間の排他論理和演算による符号化を行い、その結果値をＣＢＰ生成部４１０に提供する。一方、インターモードの場合、時空間予測部７１０では、復元された以前αチャンネル映像Ｆ’ｎ−１を参照して時間予測を行って時間予測映像を生成し、現在αチャンネル映像Ｆｎと時間予測映像間の排他論理和演算による符号化を行い、その結果値をＣＢＰ生成部４１０に提供する。

このように現在のαチャンネル映像と空間予測映像または時間予測映像との間の排他論理和演算を行えば、現在のαチャンネル映像と空間予測映像または時間予測映像との２つの画素値が同じであれば０、異なれば１の値が出る。すなわち、時空間予測によって｛０,１｝の２つの画素値のみ出るので、画素値の符号化効率を向上させることができる。復号化時にも同様に、排他論理和演算を行って元のαチャンネル映像を復元することができる。

ＣＢＰ生成部４１０は、図３に示した方法に基づいてマクロブロックに対するＣＢＰを生成する。ＣＢＰ生成部４１０では、時空間予測部７１０で時空間予測符号化されたデータに対してＣＢＰを生成し、時空間予測符号化されたデータは、ＣＢＰと共にビット列生成部４５０及び時空間予測補償部７３０に提供される。時空間予測符号化されたデータは‘ｏｐａｑｕｅ’と‘ｔｒａｎｓｐａｒｅｎｔ’に関係なく現在αチャンネル映像と時間予測映像または空間予測映像との２つの画素値が同じである場合は０、異なる場合は１の値を有するので、すべての画素値が０であるブロックのＣＢＰ情報は０を、それ以外のブロックのＣＢＰ情報は１に設定することができる。これにより、一つのマクロブロックに対するＣＢＰの種類を２⁴（＝１６）個に減らせるので、ＣＢＰの符号化効率を向上させることができる。

ビット列生成部４５０では、ＣＢＰ生成部４１０から提供される各ブロックのＣＢＰを参照して、ＣＢＰが０であるブロックは、ブロック内部の画素値をエントロピー符号化せずにＣＢＰのみをエントロピー符号化し、ＣＢＰが１であるブロックは、ＣＢＰ及びブロック内部の画素値をエントロピー符号化してビット列を生成する。

時空間予測補償部７３０では、ＣＢＰ生成部４１０から提供されるＣＢＰに関係なく時空間予測符号化されたデータを補償して復元された現在αチャンネル映像Ｆ’ｎを生成する。

図８は、図４に示したαチャンネル映像符号化装置の第４実施例による構成を示すブロック図であって、図７に示したαチャンネル映像符号化装置に、変換／量子化部８３０及び逆量子化／逆変換部８５０をさらに含んで構成される。これにより、復元された以前αチャンネル映像または復元された現在αチャンネル映像を参照して現在αチャンネル映像に対して時空間予測符号化を行い、予測符号化されたデータに対して変換及び量子化を行った後、各ブロックに対してＣＢＰを生成する。

図８に示した時空間予測部８１０では、イントラモードの場合、復元された現在αチャンネル映像Ｆ’ｎを参照する空間予測を行って空間予測映像を生成し、現在αチャンネル映像Ｆｎと空間予測映像間の排他論理和演算による符号化を行い、その結果値を変換／量子化部８３０に提供する。一方、時空間予測部８１０では、インターモードの場合、復元された以前αチャンネル映像Ｆ’ｎ−１を参照する時間予測を行って時間予測映像を生成し、現在αチャンネル映像Ｆｎと時間予測映像間の排他論理和演算による符号化を行い、その結果値を変換／量子化部８３０に提供する。

変換／量子化部８３０では、時空間予測部８１０で時空間予測符号化されたデータに対して変換及び量子化し、変換及び量子化されたデータをＣＢＰ生成部４１０に提供する。時空間予測符号化されたデータで画素値がいずれも０であるブロックに対しては変換及び量子化を行わずにＣＢＰ生成部４１０に提供される。

ＣＢＰ生成部４１０では、変換／量子化部８３０から提供されるデータに対してＣＢＰを生成し、変換及び量子化されたデータは、ＣＢＰと共にビット列生成部４５０及び逆量子化／逆変換部８５０に提供され、変換及び量子化されていないデータは、ＣＢＰと共にビット列生成部４５０及び時空間予測補償部８７０に提供される。

ビット列生成部４５０では、ＣＢＰ生成部４１０から提供される各ブロックのＣＢＰ情報を参照して、ＣＢＰ情報が０であるブロックは、ブロック内部の画素値をエントロピー符号化せずにＣＢＰ情報のみをエントロピー符号化し、ＣＢＰ情報が１であるブロックは、ＣＢＰ情報をエントロピー符号化した後、ブロック内部の画素値をエントロピー符号化してビット列を生成する。

逆量子化／逆変換部８５０では、ＣＢＰ生成部４１０から提供される変換及び量子化されたデータを逆量子化及び逆変換し、この逆量子化及び逆変換されたデータを時空間予測補償部８７０に提供する。

時空間予測補償部８７０では、逆量子化／逆変換部８５０で逆量子化及び逆変換されたデータまたは時空間予測部８１０で予測符号化されたデータを補償して復元された現在αチャンネル映像Ｆ’ｎを生成する。一方、ＣＢＰ生成部４１０で生成されたＣＢＰのすべての画素値が０である８×８ブロックを表す場合、当該８×８ブロックは時空間予測補償された後に、復元された現在αチャンネル映像Ｆ’ｎを生成する。

図９は、本実施の形態によるαチャンネル映像符号化方法を説明するフローチャートである。図９を参照すれば、９１０段階では、αチャンネル映像の各符号化単位に対してＣＢＰを生成する。このとき、αチャンネル映像の各ブロック別にＣＢＰを生成する方法は、図２に示した方法による。

９３０段階では、αチャンネル映像の各ブロック別に生成されたＣＢＰによってエントロピー符号化を行ってビット列を生成する。ここで、９１０段階以後に時空間予測符号化を行うか、または時空間予測符号化と変換及び量子化とを行うことができる。

一方、９１０段階以前に時空間予測符号化を行うか、または時空間予測符号化と変換及び量子化とを行うこともできる。この場合、９１０段階でαチャンネル映像の時空間予測符号化されたデータに対して各ブロック別にＣＢＰを生成する方法は、前記したように図３に示した方法による。これにより、９３０段階でエントロピー符号化を行う方法も前記したように変更することができる。

図１０は、本実施の形態によるαチャンネル映像復号化装置の基本的な構成を示すブロック図である。αチャンネル映像復号化装置は、ビット列解析部１０１０、ＣＢＰ解析部１０３０及び映像復元部１０５０を含んで構成される。αチャンネル映像符号化装置で時空間予測符号化が行われたか否かによって映像復元部１０５０の構成が変更される。

図１０に示したビット列解析部１０１０では、入力されるビット列を解析する。望ましくは、エントロピー復号化を適用する。
ＣＢＰ解析部１０３０では、ビット列解析部１０１０で解析されたデータについて、ＣＢＰ情報を各マクロブロック別に解析する。

映像復元部１０５０は、ＣＢＰ解析部１０３０で解析されたＣＢＰ情報を参照して任意のマクロブロックでいずれも‘ｏｐａｑｕｅ’または、いずれも‘ｔｒａｎｓｐａｒｅｎｔ’である８×８ブロックの場合に、ＣＢＰに合せてαチャンネル映像を復元し、２つの場合が混在する８×８ブロックの場合に、当該ブロックのエントロピー復号化された画素値を利用してαチャンネル映像を復元する。

図１１は、図１０に示したαチャンネル映像復号化装置の第１実施例による構成を示すブロック図である。αチャンネル映像復号化装置の映像復元部１０５０は、時空間予測補償部１１１０を含んで構成される。図１１のαチャンネル映像復号化装置は、図５に示したαチャンネル映像符号化装置に対応する装置である。

図１１に示した時空間予測補償部１１１０では、ＣＢＰ解析部１０３０で解析されたＣＢＰ情報を参照し‘ｏｐａｑｕｅ’と‘ｔｒａｎｓｐａｒｅｎｔ’とが混在する８×８ブロックの場合、当該ブロックの画素値をエントロピー復号化した後、時空間予測補償を行って現在αチャンネル映像Ｆ’ｎを復元する。このとき、イントラモードの場合、復元された現在αチャンネル映像Ｆ’ｎを参照する空間予測補償を行い、インターモードの場合、復元された以前αチャンネル映像Ｆ’ｎ−１を参照する時間予測補償を行う。

一方、ＣＢＰ解析部１０３０で解析されたＣＢＰ情報を参照していずれも‘ｏｐａｑｕｅ’であるブロックと、いずれも‘ｔｒａｎｓｐａｒｅｎｔ’である８×８ブロックとは、ＣＢＰに合せて現在αチャンネル映像Ｆ’ｎを復元する。

図１２は、図１０に示したαチャンネル映像復号化装置の第２実施例による構成を示すブロック図であって、映像復元部１０５０は、図１１に示したαチャンネル映像復号化装置に対して、逆量子化／逆変換部１２１０をさらに含んで構成される。図１２のαチャンネル映像復号化装置は、図６のαチャンネル映像符号化装置に対応する装置である。

図１２に示した逆量子化／逆変換部１２１０では、ＣＢＰ解析部１０３０で解析されたＣＢＰ情報を参照して‘ｏｐａｑｕｅ’と‘ｔｒａｎｓｐａｒｅｎｔ’とが混在する８×８ブロックの場合、当該ブロックの画素値を逆量子化及び逆変換し、逆量子化及び逆変換されたデータを時空間予測補償部１２３０に提供する。

時空間予測補償部１２３０では、逆量子化及び逆変換されたデータに対して時空間予測補償を行って現在αチャンネル映像Ｆ’ｎを復元する。このとき、イントラモードの場合、復元された現在αチャンネル映像Ｆ’ｎを参照する空間予測補償を行い、インターモードの場合、復元された以前αチャンネル映像Ｆ’ｎ−１を参照する時間予測補償を行う。

一方、ＣＢＰ解析部１０３０で解析されたＣＢＰ情報を参照して、いずれも‘ｏｐａｑｕｅ’であるブロックといずれも‘ｔｒａｎｓｐａｒｅｎｔ’である８×８ブロックとは、ＣＢＰに合せて現在αチャンネル映像Ｆ’ｎを復元する。

図１３は、図１０に示したαチャンネル映像復号化装置の第３実施例による構成を示すブロック図である。αチャンネル映像復号化装置は、時空間予測補償部１３１０を含んで構成される。図１３のαチャンネル映像復号化装置は、図７のαチャンネル映像符号化装置に対応する装置である。

図１３に示した、時空間予測補償部１３１０では、ＣＢＰ解析部１０３０で解析されたＣＢＰ情報に関係なく、すべての８×８ブロックに対して時空間予測補償を行って現在αチャンネル映像Ｆ’ｎを復元する。このとき、イントラモードの場合、復元された現在αチャンネル映像Ｆ’ｎを参照する空間予測補償を行い、インターモードの場合、復元された以前αチャンネル映像Ｆ’ｎ−１を参照する時間予測補償を行う。

図１４は、図１０に示したαチャンネル映像復号化装置の第４実施例による構成を示すブロック図である。αチャンネル映像復号化装置は、逆量子化／逆変換部１４１０と時空間予測補償部１４３０とを含んで構成される。図１４のαチャンネル映像復号化装置は、図８のαチャンネル映像符号化装置に対応する装置である。

図１４に示した逆量子化／逆変換部１４１０では、ＣＢＰ解析部１０３０で解析されたＣＢＰ情報を参照して、ＣＢＰが１である８×８ブロックに対して逆量子化及び逆変換を行い、逆量子化及び逆変換されたデータを時空間予測補償部１４３０に提供する。

時空間予測補償部１４３０では、ＣＢＰが１である８×８ブロックの逆量子化及び逆変換されたデータ及びＣＢＰが０である８×８ブロックのエントロピー復号化されたデータに対して時空間予測補償を行って現在αチャンネル映像Ｆ’ｎを復元する。この時、イントラモードの場合、復元された現在αチャンネル映像Ｆ’ｎを参照する空間予測補償を行い、インターモードの場合、復元された以前αチャンネル映像Ｆ’ｎ−１を参照する時間予測補償を行う。

図１５は、本実施の形態によるαチャンネル映像復号化方法を説明するフローチャートである。図１５を参照すれば、１５１０段階では、入力されるビット列をエントロピー復号化する。

１５３０段階では、エントロピー復号化されたデータから各マクロブロック別にＣＢＰ情報を抽出し、各マクロブロックに含まれるブロックのＣＢＰを解析する。１５５０段階では、各ブロックの解析されたＣＢＰを参照して、いずれも‘ｏｐａｑｕｅ’または、いずれも‘ｔｒａｎｓｐａｒｅｎｔ’であるブロックの場合、これに合せて映像を復元し、２つの場合が混在したブロックの場合、当該ブロックの画素値を復号化してαチャンネル映像を復元する。

図１６Ａないし図１６Ｄは、本実施の形態によるαチャンネル映像を符号化する過程を説明する図面である。図１６Ａで、参照符号１６１０は元映像であり、参照符号１６３０は原映像でマスキングしようとする部分を示すαチャンネル映像である。αチャンネル映像で、黒い部分は‘ｔｒａｎｓｐａｒｅｎｔ’部分であって０の画素値を有し、白い部分は‘ｏｐａｑｕｅ’部分であって１の画素値を有する。図１６Ｂは、αチャンネル映像１６３０を一定サイズのブロック、例えば、８×８ブロック単位で分割した例を示す。図１６Ｃは、８×８ブロックに含まれた画素値がいずれも‘ｔｒａｎｓｐａｒｅｎｔ’であれば、ＣＢＰ情報を‘０’に、いずれも‘ｏｐａｑｕｅ’であれば、ＣＢＰ情報を‘１’に、２つが混在する‘ｍｉｘｅｄ’であれば、ＣＢＰ情報を‘２’に設定したものを表す。

図１６Ｃにおいて、ＣＢＰ情報が０または１である場合には、８×８ブロックの画素値を符号化せずにＣＢＰ情報のみ符号化しても復号化時にＣＢＰ情報のみ復号化してαチャンネル映像を復元することができる。一方、ＣＢＰ情報が２である場合には、ＣＢＰ情報だけでなく、８×８ブロックの画素値を符号化しなければならない。各画素値を符号化する方法としては、各ブロックの画素値を一定の順序でスキャニングした後、エントロピー符号化、すなわち、ランレベル符号化を行い、このとき、一般的なＭＰＥＧ−４及びＨ.２６４の方法を適用することができる。ＭＰＥＧ−４では、８×８ブロック単位で（Ｌａｓｔ，Ｒｕｎ，Ｌｅｖｅｌ）を符号化する３Ｄランレベル符号化方法を使用する。ここで、‘Ｌａｓｔ’は、現在ブロックの内部に０ではない符号化する値の有無を表す。Ｈ.２６４では、４×４ブロック単位でランとレベルとを符号化する方法を使用する。それぞれの場合において、各レベルの符号は別々に符号化されるが、αチャンネル映像を符号化する場合には、各レベルの符号を符号化する必要がない。

また、ランレベル符号化以前に時空間予測符号化を行い、予測符号化された値をランレベル符号化することもできる。また、時空間予測符号化以後に変換及び量子化を行い、量子化された値をランレベル符号化することもできる。αチャンネル映像のような２値映像で予測符号化を行う場合には、予測された画素値と現在ブロックの画素値との間の減算演算の代わりに排他的論理和演算を行う。減算演算を行えば、予測された画素値と現在ブロックの画素値とが同じである場合に０、異なる場合に１または−１の値を有する。しかし、本実施の形態のように排他的論理和演算を行えば、予測された画素値と現在ブロックの画素値とが同じである場合に０、異なる場合に１の値を得られるので、ブロックの画素値を符号化する時に各レベルの符号ビットを符号化する必要がなくなる。

図１６Ｄは、予測符号化を行った結果によって各８×８ブロックにＣＢＰ情報を割当てた例を示す。予測符号化を行えない場合には、ＣＢＰ情報は｛０,１,２｝の３つの値を有する。しかし、予測符号化を行った場合には、排他的論理和演算の結果によって‘ｔａｎｓｐａｒｅｎｔ’と‘ｏｐａｑｕｅ’との区分なしにいずれも０である場合とそうでない場合との２つに区分することができるので、ＣＢＰ情報は｛０,１｝の２つの値を有する。このように予測符号化を行えば、いずれも０の画素値を有するブロックの数が増加するため、ＣＢＰ情報の符号化効率は向上する一方、各ブロック別に予測方法によってイントラ方式の場合に予測モードを、インター方式の場合に動きベクトルを符号化しなければならないため、全体符号化効率は低下する恐れがある。

図１７Ａないし図１７Ｃは、ブロックの画素値を符号化するためのスキャニング順序の例を示す図面であって、Ｈ.２６４での方法のように、４×４ブロック単位で画素値を符号化することを仮定したものである。図１７Ａはジグザグスキャン、図１７Ｂは水平スキャン、図１７Ｃは垂直スキャンをそれぞれ表す。スキャニング順序は、前記の３つの方法のうち特定の方法を固定して使用することもでき、幾つかの方法を混合して使用することもできる。後者の場合、スキャニング順序を決定するために、各ブロック別に符号化されて伝送されスキャニングタイプを利用するか、またはスキャニングタイプの代わりに周辺の情報を使用して決定することができる。例えば、変換符号化を行えない場合、イントラ予測モードによって水平予測を行う場合には水平スキャンを、垂直予測を行う場合には垂直スキャンを使用することができる。また、隣接したブロックの画素値を利用して水平方向に対する勾配及び垂直方向に対する勾配を測定して２つの値が一定範囲内で類似する場合にはジグザグスキャンを使用し、そうでない場合には水平方向に対する勾配が垂直方向に対する勾配より大きければ垂直スキャンを、その逆の場合には水平スキャンを使用する。

図１８は、映像の時間予測のために映像を一定サイズのブロックに分割する方法の一例を示す図面である。この方法は、ＩＳＯ／ＩＥＣ１４４９６−１０及びＩＴＵ−Ｔ
Ｒｅｃ．Ｈ．２６４標準技術で使用する方法である。この方法では、基本的に縦／横１６画素サイズのマクロブロックを１６×１６、１６×８、８×１６、８×８の多様なサイズに分割し、それぞれ動きベクトルを求めて時間映像値を予測する。特に、８×８サイズのブロックは、８×８、８×４、４×８、４×４サイズに分割して精細な動きも正確に感知可能にする。

また、時間予測を使用する場合、マクロブロック（ＭＢ：ＭａｃｒｏＢｌｏｃｋ）スキップという方法を適用することも可能である。これは予測された映像と現在映像との間の差映像で任意のマクロブロックに対する画素値の絶対値の和が所定の閾値以下である場合、当該マクロブロックの画素値を符号化せずに、省略するという表示のみを符号化するものである。これにより、ＣＢＰ情報、動きベクトル、画素値などすべての情報に対する符号化が省略され、現在マクロブロックの画素値は対応する以前映像の画素値をそのまま使用する。例えば、以前映像で現在映像と同じ位置にあるマクロブロックの画素値をそのまま使用するか、または現在マクロブロックの周辺にあるマクロブロックの動きベクトルを利用して以前映像の特定位置を計算し、その位置にあるマクロブロックの画素値をそのまま使用する。

また、時間予測を使用する場合、１／２画素または１／４画素動き予測方法を使用するために、以前映像を２倍または４倍に拡大した後に動き予測を行うこともできる。このような映像の拡大のために、ＭＰＥＧ−４では双線形補間を行い、Ｈ.２６４では６タップフィルターを使用した補間を行う。しかし、αチャンネル映像では計算量を簡単にするためにこのような動き予測過程を省略し、このような動き予測過程を適用するためには前記補間方法だけでなく、計算量を簡単にする別途の補間方法を使用することができる。

図１９Ａは、空間予測のための隣接画素の位置と予測する現在ブロックの画素の位置とを示す図面である。図１８に示した方法と同様に、この方法はＩＳＯ／ＩＥＣ１４４９６−１０及びＩＴＵ−Ｔ
Ｒｅｃ.Ｈ.２６４標準技術で使用する方法である。この方法では４×４サイズのブロックデータＰ_a，Ｐ_b，．．，Ｐ_qを予測するために以前に符号化されて復元された空間上の隣接したデータＰ₀，Ｐ₁，．．．，Ｐ₁₂を利用する。

図１９Ｂは、空間上隣接した画素から投影して現在ブロックを予測するための０から８までの９つの予測方向を示す。例えば、０の方向の場合は、隣接した画素値Ｐ₁、Ｐ₂、Ｐ₃及びＰ₄を垂直方向に投影してＰ_a、Ｐ_e、Ｐ_i及びＰ_mはＰ₁の値、Ｐ_b、Ｐ_f、Ｐ_j及びＰ_nはＰ₂の値、Ｐ_c、Ｐ_g、Ｐ_k及びＰ_oはＰ₃の値、Ｐ_d、Ｐ_h、Ｐ_l及びＰ_qはＰ₄の値に予測する。他の方向の場合も同様に、投影を通じて予測する。
図１８及び図１９に示した時空間予測方法は、既存の標準技術を一例として説明したものであって、他の方法を使用することも可能である。

本発明は、コンピュータ可読記録媒体にコンピュータ可読コードとして具現することも可能である。このコンピュータ可読記録媒体には、コンピュータシステムによって読出されるデータが保存されるすべての種類の記録装置を含む。コンピュータ可読記録媒体の例としては、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、ＣＤ−ＲＯＭ（Compact Disc-ROM）、磁気テープ、フロッピー（登録商標）ディスク、光データ保存装置などがあり、またキャリアウェーブ（例えば、インターネットを通じた伝送）の形で具現されるものも含む。また、コンピュータ可読記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータ可読コードが保存されかつ実行することもできる。そして、本発明を具現するための機能的なプログラム、コード及びコードセグメントは、本発明が属する技術分野のプログラマーであれば容易に推論することができる。

本発明を、図面を参照しつつ実施の形態を参考として説明したが、これは例示的なものに過ぎず、当業者ならば、これから多様な変形及び均等な他の実施例を実施可能であると考えられる。したがって、本発明の真の技術的保護範囲は、特許請求の範囲に記載された技術的思想によって決定されなければならない。

本発明によるαチャンネル映像符号化／複合化装置及び方法は、送信側では元のαチャンネル映像、予測符号化されたαチャンネル映像または予測符号化及び変換／量子化されたαチャンネル映像を符号化して伝送し、受信側では受信されたビット列からαチャンネル映像を復元可能にすることによって動映像コンテンツ製作及び編集に広く使用されるαチャンネル映像の処理／伝送及び保管を容易にする。

１１０：ブロック分割部
１３０：ＣＢＰ割当部
４１０：ＣＢＰ生成部
４５０：ビット列生成部
４３０：符号化部
５１０，６１０，７１０，８１０：時空間予測部
５３０，６７０，７３０，８７０，１１１０，１２３０，１３１０，１４３０：時空間予測補償部
６３０，８３０：変換／量子化部
６５０，８５０，１２１０，１４１０：逆量子化／逆変換部
１０１０：ビット列解析部
１０３０：ＣＢＰ解析部
１０５０：映像復元部

Claims

αチャンネル映像を符号化したビット列を解析して、符号化単位である第１ブロック別に復号化するビット列解析部と、
前記復号化されたデータから前記第１ブロックに含まれる第２ブロック別に符号化ブロックパターンを抽出して解析する符号化ブロックパターン解析部と、
前記第２ブロックの符号化ブロックパターンによって、前記解析された符号化ブロックパターンと復号化された画素値とを利用して、現在αチャンネル映像を復元する映像復元部と、
を含むことを特徴とするαチャンネル映像復号化装置。
前記映像復元部は、
前記第２ブロックの画素値が透明である場合、いずれも不透明である場合、または、透明と不透明とが混在する混合の場合に分けて前記第２ブロックの符号化ブロックパターンが割当れられる場合、
前記復号化された画素値が‘透明’の画素値と‘不透明’の画素値とをいずれも有していることを表す‘混合’符号化ブロックパターンが割当てられた第２ブロックに対して時空間予測補償を行って現在αチャンネル映像を復元すること、
を特徴とする請求項１記載のαチャンネル映像復号化装置。
前記映像復元部は、
前記第２ブロックの画素値が透明である場合、いずれも不透明である場合、または、透明と不透明とが混在する混合の場合に分けて前記第２ブロックの符号化ブロックパターンを割当てる場合、
前記エントロピー復号化された画素値が‘透明’の画素値と‘不透明’の画素値とをいずれも有していることを表す‘混合’符号化ブロックパターンが割当てられた第２ブロックに対して時空間予測補償と逆量子化及び逆変換とを行って現在αチャンネル映像を復元すること、
を特徴とする請求項１記載のαチャンネル映像復号化装置。
前記映像復元部は、
前記第１ブロックを構成する複数の第２ブロックの構成形態を分類し、分類された構成形態によって前記第２ブロックの符号化ブロックパターンが割当てられる場合、
前記復号化された画素値が‘透明’の画素値と‘不透明’の画素値とをいずれも有していることを表す‘混合’符号化ブロックパターンが割当てられた第２ブロックに対して時空間予測補償を行って現在αチャンネル映像を復元すること、
を特徴とする請求項１記載のαチャンネル映像復号化装置。
前記映像復元部は、
前記第１ブロックを構成する複数の第２ブロックの構成形態を分類し、分類された構成形態によって前記第２ブロックの符号化ブロックパターンが割当てられる場合、
前記復号化された画素値が‘透明’の画素値と‘不透明’の画素値とをいずれも有していることを表す‘混合’符号化ブロックパターンが割当てられた第２ブロックに対して時空間予測補償と逆量子化及び逆変換とを行って現在αチャンネル映像を復元すること、
を特徴とする請求項１記載のαチャンネル映像復号化装置。
前記映像復元部は、
時空間予測符号化されたαチャンネル映像で、前記第２ブロックの画素値がいずれも０である場合とそうではない場合とに分けて前記第２ブロックの符号化ブロックパターンを割当てる場合、
前記復号化された第２ブロックの符号化ブロックパターンに関係なく、すべての第２ブロックに対して時空間予測補償を行って現在αチャンネル映像を復元すること、
を特徴とする請求項１記載のαチャンネル映像復号化装置。
前記映像復元部は、
時空間予測符号化されたαチャンネル映像で前記第２ブロックの画素値がいずれも０である場合とそうではない場合とに分けて前記第２ブロックの符号化ブロックパターンを割当てる場合、
前記復号化された第２ブロックの符号化ブロックパターンに関係なく、すべての第２ブロックに対して時空間予測補償と逆量子化及び逆変換とを行って現在αチャンネル映像を復元すること、
を特徴とする請求項１記載のαチャンネル映像復号化装置。
前記映像復元部は、
前記復号化された第２ブロックの画素値と、前記第２ブロックの画素値に対して復元された以前映像または復元された現在映像を参照して、予測された画素値間の排他論理和演算を行って時空間予測補償された第２ブロックを生成すること、
を特徴とする請求項２乃至７の何れか記載のαチャンネル映像復号化装置。
前記ビット列解析部では、前記ブロックの画素値を復号化するために使用するスキャニング順序が、隣接ブロックの画素値を使用して計算した垂直方向に対する勾配及び水平方向に対する勾配によって変わること、
を特徴とする請求項１記載のαチャンネル映像復号化装置。
前記ビット列解析部では、前記ブロックの画素値を復号化するために使用するスキャニング順序が、隣接ブロックの画素値を使用して計算した垂直方向に対する勾配及び水平方向に対する勾配によって変わること、
を特徴とする請求項２乃至７の何れか記載のαチャンネル映像復号化装置。
前記ビット列解析部では、前記ブロックの画素値を復号化するために使用するスキャニング順序が、予測モードによって変わること、
を特徴とする請求項２乃至７の何れか記載のαチャンネル映像復号化装置。
αチャンネル映像を符号化したビット列を解析して、符号化単位の第１ブロック別に復号化する段階と、
前記復号化されたデータから前記第１ブロックに含まれる第２ブロック別に符号化ブロックパターンを抽出して解析する段階と、
前記第２ブロックの符号化ブロックパターンによって、前記解析された符号化ブロックパターンと復号化された画素値とを利用して現在αチャンネル映像を復元する段階と、
を含むことを特徴とするαチャンネル映像復号化方法。
前記映像復元段階は、
前記第２ブロックの画素値がいずれも透明である場合、いずれも不透明である場合、または透明と不透明とが混在する場合に分けて前記第２ブロックの符号化ブロックパターンが割当てられる場合、
前記復号化された画素値が‘透明’の画素値と‘不透明’の画素値とをいずれも有していることを表す‘混合’符号化ブロックパターンが割当てられた第２ブロックに対して時空間予測補償を行って現在αチャンネル映像を復元すること、
を特徴とする請求項１２記載のαチャンネル映像復号化方法。
前記映像復元段階は、
前記第２ブロックの画素値がいずれも透明である場合、いずれも不透明である場合、または透明と不透明とが混在する場合に分けて前記第２ブロックの符号化ブロックパターンを割当てる場合、
前記復号化された画素値が‘透明’の画素値と‘不透明’の画素値とをいずれも有していることを表す‘混合’符号化ブロックパターンが割当てられた第２ブロックに対して時空間予測補償と逆量子化及び逆変換とを行って現在αチャンネル映像を復元すること、
を特徴とする請求項１２記載のαチャンネル映像復号化方法。
前記映像復元段階は、
前記第１ブロックを構成する複数の第２ブロックの構成形態を分類し、分類された構成形態によって前記第２ブロックの符号化ブロックパターンが割当てられる場合、
前記復号化された画素値が‘透明’の画素値と‘不透明’の画素値とをいずれも有していることを表す‘混合’符号化ブロックパターンが割当てられた第２ブロックに対して時空間予測補償を行って現在αチャンネル映像を復元すること、
を特徴とする請求項１２記載のαチャンネル映像復号化方法。
前記映像復元段階は、
前記第１ブロックを構成する複数の第２ブロックの構成形態を分類し、分類された構成形態によって前記第２ブロックの符号化ブロックパターンが割当てられる場合、
前記復号化された画素値が‘透明’の画素値と‘不透明’の画素値とをいずれも有していることを表す‘混合’符号化ブロックパターンが割当てられた第２ブロックに対して時空間予測補償と逆量子化及び逆変換とを行って現在αチャンネル映像を復元すること、
を特徴とする請求項１２記載のαチャンネル映像復号化方法。
前記映像復元段階は、
時空間予測符号化されたαチャンネル映像で前記第２ブロックの画素値がいずれも０である場合とそうではない場合とに分けて前記第２ブロックの符号化ブロックパターンを割当てる場合、
前記復号化された第２ブロックの符号化ブロックパターンに関係なく、すべての第２ブロックに対して時空間予測補償を行って現在αチャンネル映像を復元すること、
を特徴とする請求項１２記載のαチャンネル映像復号化方法。
前記映像復元段階は、
時空間予測符号化されたαチャンネル映像で前記第２ブロックの画素値がいずれも０である場合とそうではない場合とに分けて前記第２ブロックの符号化ブロックパターンを割当てる場合、
前記復号化された第２ブロックの符号化ブロックパターンに関係なく、すべての第２ブロックに対して時空間予測補償と逆量子化及び逆変換とを行って現在αチャンネル映像を復元すること、
を特徴とする請求項１２記載のαチャンネル映像復号化方法。
前記復号化された第２ブロックの画素値と、前記第２ブロックの画素値に対して復元された以前映像または復元された現在映像を参照して予測された画素値との間の排他論理和演算を行って時空間予測補償された第２ブロックを生成すること、
を特徴とする請求項１３乃至１８の何れか記載のαチャンネル映像復号化方法。
コンピュータに、
αチャンネル映像を符号化したビット列を解析して符号化単位の第１ブロック別に復号化する段階と、
前記復号化されたデータから前記第１ブロックに含まれる第２ブロック別に符号化ブロックパターンを抽出して解析する段階と、
前記第２ブロックの符号化ブロックパターンによって、前記解析された符号化ブロックパターンと復号化された画素値とを利用して現在αチャンネル映像を復元する段階と、
を含むαチャンネル映像復号化方法を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。