JP2006013754A - 動画像符号化装置及び動画像復号化装置 - Google Patents
動画像符号化装置及び動画像復号化装置 Download PDFInfo
- Publication number
- JP2006013754A JP2006013754A JP2004186046A JP2004186046A JP2006013754A JP 2006013754 A JP2006013754 A JP 2006013754A JP 2004186046 A JP2004186046 A JP 2004186046A JP 2004186046 A JP2004186046 A JP 2004186046A JP 2006013754 A JP2006013754 A JP 2006013754A
- Authority
- JP
- Japan
- Prior art keywords
- code data
- frame
- motion
- region
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】 シーンチェンジのないテレビ電話システム等の動画像において、伝送情報量に一定の制限が付されている場合でも、符号化効率を向上させることにより画質の劣化が生じるのを防止すること。
【解決手段】 符号量の小さな背景領域S11,S12,S13,S14の符号データを各フレームの動き領域M1〜M4の符号データに付加することにより合計符号量を小さくする。この背景領域S11,S12,S13,S14の符号データは背景領域S1の符号データを単純に符号量を基準として4分割したものである。復号化を行う際は、4フレーム目でS11,S12,S13,S14の全てが揃うので、5フレーム目でこれらの合計符号データを背景領域S1と等価な符号データとして復号化を行う。
【選択図】 図2
【解決手段】 符号量の小さな背景領域S11,S12,S13,S14の符号データを各フレームの動き領域M1〜M4の符号データに付加することにより合計符号量を小さくする。この背景領域S11,S12,S13,S14の符号データは背景領域S1の符号データを単純に符号量を基準として4分割したものである。復号化を行う際は、4フレーム目でS11,S12,S13,S14の全てが揃うので、5フレーム目でこれらの合計符号データを背景領域S1と等価な符号データとして復号化を行う。
【選択図】 図2
Description
本発明は、テレビ電話システム、テレビ会議システム、遠隔監視装置などのディジタル映像通信機器に用いられる動画像符号化装置及び動画像復号化装置に関するものである。
映像信号の高能率符号化方式の規格として、国際電気通信連合電気通信標準化部門(International Telecommunication Union-Telecommunication Standardzation Sector,ITU-T)により、テレビ電話システム、又はテレビ会議システムを用途として標準化された「H.261」、「H.263]がある。これらの規格に係る方式はいずれも、画像の時間軸方向の相関性を利用して動き推定を行い、予測誤差を用いるものであるため、画像の持つパワーを小さくして情報量を圧縮することができる。また、画像を動き領域と背景領域とに分け、動き領域に注力して符号化することで符号化効率を上げたり(例えば、特許文献1参照)、背景領域として予め用意した画像を用い動き領域のみを符号化することで符号化効率を上げたりすることができる。
しかし、これらの符号化方式は、時間軸方向の情報を記憶する多くのメモリを持つ必要があるため高コストとなり、また符号化装置及び復号化装置の構成が複雑となる。更に、これらの方式では、データ伝送時に欠損した符号データが発生した場合、参照フレームを参照できなくなるために符号化することができず、画質が大きく損なわれてしまう虞がある。
一方、時間軸方向の相関性を用いずに、動画像の1枚1枚のフレームに対して独立した符号化処理(フレーム内符号化)を行う符号化方式として、DV(Digital Video)規格に係る方式、事実上の標準規格(デファクトスタンダード)となっているMotion-JPEGに係る方式、あるいはMotion-JPEG2000に係る方式などがある。
これらの方式のうち、Motion-JPEG2000は、DV規格やMotion-JPEGに比べて符号化効率が良く、また、注目領域(ROI:Region of Interest)のみを高画質化する機能を持つため(例えば、特許文献2参照)、オブジェクト領域等を注目領域として符号化することにより、画面上の重要な部分の画質をある程度のレベルに保持することが可能になっている。
特開平5−316465号公報
特開2001−86506号公報
上記のように、Motion-JPEG2000をはじめとするフレーム内符号化方式は、全てのフレームにおいて独立した符号化処理を行うため、データ伝送中に欠損符号データが発生しても画質が著しく劣化することはない。
ところが、テレビ電話システムやテレビ会議システムなどで生成される画像は、固定された背景の前で人物の表情や手のみが動く画像であり、シーンチェンジも殆どない画像であるのが通常である。また、監視システムにおいて監視カメラで生成される画像も、動き領域が少なく且つシーンチェンジも殆どない画像であるのが通常である。したがって、これらのシステムにおける入力画像を符号化する場合は、動きのない背景領域に対しては前フレームの符号データを用いると共に一定のフレーム数間隔で新たな符号化処理を行うこととし、動き領域のみに対して全てのフレームで通常の符号化処理を行うようにしても実用上は何ら問題はないはずである。
それにもかかわらず、Motion-JPEG2000等のフレーム内符号化方式では、動き領域と背景領域とを区別することなく、全てのフレームにおいて独立した符号化処理を行っており、符号化効率の観点からは改善の余地を有するものであった。特に、伝送路容量の関係から伝送情報量に一定の制限が付されているような環境下では、少ない符号量で符号化処理を行わなければならないため、画質の劣化が生じるのを防ぐことが困難であった。
本発明は、上記事情に鑑みてなされたものであり、シーンチェンジのないテレビ電話システム等の動画像において、伝送情報量に一定の制限が付されている場合でも、符号化効率を向上させることにより画質の劣化が生じるのを防止することが可能な動画像符号化装置及び動画像復号化装置を提供することを目的としている。
上記課題を解決するための手段として、請求項1記載の発明は、動画像データを構成する複数フレームの静止画像データを順次入力し、この静止画像データについて動き領域を各フレーム毎に検出する動き領域検出手段と、前記動き領域検出手段が検出した動き領域を各フレーム毎に符号化する動き領域符号化手段と、前記動き領域検出手段が検出した動き領域を除いた領域を背景領域とし、この背景領域をN(Nは2以上の整数)フレーム毎に符号化する背景領域符号化手段と、前記背景領域符号化手段からの背景領域符号データを、符号量を基準としてN分割しN個の分割符号データを生成する背景領域符号データ分割手段と、前記背景領域符号データ分割手段からの各分割符号データを記憶する分割符号データ記憶手段と、前記動き領域符号化手段からの各フレーム毎の動き領域符号データに対して、前記分割符号データ記憶手段からの分割符号データをそれぞれ1つずつ付加する分割符号データ付加手段と、を備えたことを特徴とする。
請求項2記載の発明は、請求項1記載の発明において、前記動き領域には、オブジェクトの領域とオブジェクトの移動により現れた新たな背景領域とを合わせた領域、又は前記動画像データの撮像手段のパンニング若しくはズーミングにより現れた新たな背景領域が含まれる、ことを特徴とする。
請求項3記載の発明は、動画像データを構成する複数フレームの静止画像データについて動き領域と背景領域とを各フレーム毎に区分して、動き領域については各フレーム毎に符号化を行い動き領域符号データを得、背景領域についてはN(Nは2以上の整数)フレーム毎に符号化を行い背景領域符号データを得、更にこの背景領域符号データを符号量を基準としてN分割することによりN個の分割符号データを生成し、各フレーム毎の前記動き領域符号データに対して、前記分割符号データをそれぞれ1つずつ付加して得た符号データを順次入力する符号データ入力手段と、前記符号データ入力手段に入来した符号データを各フレーム毎に前記動き領域符号データと前記分割符号データとに分離する符号データ分離手段と、前記符号データ分離手段により分離された前記動き領域符号データを各フレーム毎に復号化する動き領域復号化手段と、前記動き領域復号化手段により復号化された動き領域画像を記憶する動き領域画像記憶手段と、前記符号データ分離手段により分離された各フレーム毎の前記分割符号データをN個蓄積する度に、これらN個の分割符号データを出力する分割符号データ蓄積手段と、前記分割符号データ蓄積手段からのN個の分割符号データを背景領域符号データとしてNフレーム毎に復号化する背景領域復号化手段と、前記背景領域復号化手段により復号化された背景領域画像をNフレーム毎に更新しながら記憶する背景領域画像記憶手段と、前記背景領域画像記憶手段に記憶されている背景領域画像、前記分割符号データがN個蓄積される期間中に前記動き領域画像記憶手段に記憶されたNフレームの動き領域画像、及び前記Nフレームのうちの最新のフレームの次のフレーム以降の動き領域画像であって前記動き領域復号化手段により復号化された動き領域画像を、時系列順に順次上書き合成する画像合成手段と、を備えたことを特徴とする。
本発明によれば、画像領域を動き領域と背景領域とに分けて符号化すると共に、背景領域を複数に分割し、各フレームにおいては、動き領域符号データに背景領域の分割符号データを付加するようにしているので、符号化の際には1フレーム当たりの符号量を低減することができる。そして、復号化の際には、全ての分割符号データが揃ったときのフレームで背景領域の復号化処理を行い、その他のフレームではそれ以前に得られている背景領域を用いているので、シーンチェンジがほとんどなく且つ固定された背景領域を有する動画像については実用上問題のない程度に画質劣化を防止した復号化を行うことができる。
図1は、本発明の実施形態に係る動画像符号化装置の構成を示すブロック図である。この図に示すように、本装置は、図示を省略しているビデオカメラ等の画像データ出力手段又は伝送回路上から送られてくる動画像データを入力してこの動画像データを構成する複数フレームの静止画像データを順次出力する動画像入力手段1と、動画像入力手段1からの静止画像データを各フレーム毎に記憶する画像データ記憶手段2と、動画像入力手段1からの静止画像データを順次入力し、この静止画像データについて動き領域を各フレーム毎に検出する動き領域検出手段3と、動き領域検出手段3が検出した動き領域を各フレーム毎に符号化する動き領域符号化手段4と、記動き領域検出手段3が検出した動き領域を除いた領域を背景領域とし、この背景領域をN(Nは2以上の整数)フレーム毎に符号化する背景領域符号化手段5と、背景領域符号化手段5からの背景領域符号データを、符号量を基準としてN分割N個の分割符号データを生成する背景領域符号データ分割手段6と、背景領域符号データ分割手段6からの各分割符号データを記憶する分割符号データ記憶手段7と、動き領域符号化手段4からの各フレーム毎の動き領域符号データに対して、分割符号データ記憶手段7からの分割符号データをそれぞれ1つずつ付加する分割符号データ付加手段8と、分割符号データ付加手段8からの符号データを各フレーム毎に入力し、これを図示を省略している復号化装置などの外部装置に出力する符号データ出力手段9と、を備えている。
図2は、本発明の技術と従来技術とを対比して示した説明図であり、(a)は従来技術の内容、(b)は本発明の基本的な考え方を示している。
例えば、図2(a)は動画像データを構成する静止画像データの1〜5フレーム目までを示しているが、従来のフレーム内符号化方式では、各フレームにおいて動き領域及び背景領域の全てについて独立した符号化を行っており、復号化の際も独立した復号化処理を行っている。そのため、各フレームの符号データの符号量が伝送情報量の制限値をオーバーし、このオーバー分の情報はカットされてしまうため、その分画質劣化が生じていた。
ここで、「背景領域」とは、テレビ電話システムやテレビ会議システムの場合は、壁、カーテン、あるいはガラス窓などの背景が写っている領域を指し、「動き領域」とは背景の前に座っている人物(オブジェクト)が写っている領域を指している。したがって、動き領域M1〜M5は人物の表情や体について多少の動きに基づく相違が見られるのが通常であり、背景領域S1〜S5はどれも殆ど同じであるのが通常である。
これに対し、本発明では、図2(b)に示すように、符号量の小さな背景領域S11,S12,S13,S14の符号データを各フレームの動き領域M1〜M4の符号データに付加することにより、動き領域及び背景領域の合計符号量が伝送情報量の制限値をオーバーしないようにしている。この背景領域S11,S12,S13,S14の符号データは、図2(a)における背景領域S1の符号データを単純に符号量を基準として4分割したものである。そして、復号化を行う際は、4フレーム目でS11,S12,S13,S14の全てが揃うので、5フレーム目でこれらの合計符号データを背景領域S1と等価な符号データとして復号化を行うようにしている。
つまり、本発明は、図2(a)における各背景領域S1〜S5はどれも同一であると見なしても実用上は差し支えないのだから、復号化の際は1〜4フレーム目まではそれ以前に得られている背景領域を用いるようにし、5フレーム目で初めて背景領域S1と等価な背景領域S11,S12,S13,S14が得られるようにしても良いではないかという考えに基づいている。
なお、テレビ電話システムやテレビ会議システムでは、背景が固定されていることが多いが、背景にある程度の変化が観察されることもあり得る。しかし、上記の例では、背景領域を全くの固定領域として扱っているわけではなく、4フレーム毎に実際の入力画像データに基づく更新を行っているので、このような背景領域の変化に対しても実用上問題のない程度に対処することが可能になっている。
次に、図1の動作を図3のフローチャートに基づき説明する。ここで、本発明では、背景領域の分割数をN個(Nは2以上の整数)とすると、この背景領域の符号化はNフレーム毎に行われることになるが、本実施形態ではN=4の場合、すなわち背景領域を4つに分割し、この背景領域を4フレーム毎に符号化する場合を例に取り説明する。
まず、動画像入力手段1が動画像データを構成する複数フレームのうちの初回フレームを今回フレームとして静止画像データを入力すると共に、画像データ記憶手段2がこの静止画像データを記憶する(ステップ1)。
動き領域検出手段3は、動画像入力手段1からの静止画像データを今回フレームのデータとして入力すると共に、画像データ記憶手段2に記憶されている静止画像データを前回フレームのデータとして入力し、両者の差に基づき動き領域を検出するものである。しかし、初回フレームの場合は前回フレームが存在しないため動き領域を検出することができないので、動き領域検出手段3は入力した静止画像データが初回フレームのものであるか否かを判別する(ステップ2)。この場合は第1回目のフレームであるから、動き領域検出手段3は初回フレームすなわち「YES」であると判別する。
背景領域符号化手段5は、動き領域検出手段3が初回フレームと判別したことを受けて今回フレームの全領域を背景領域と判別し(ステップ3)、背景領域の符号化を行う(ステップ4)。そして、背景領域符号データ分割手段6は、背景領域符号化手段5の符号化により生成された符号データを4分割し(ステップ5)、分割符号データ記憶手段7は、その4つの分割符号データを記憶する(ステップ6)。
なお、本実施形態では、符号化方式がMotion-JPEG2000であることを想定しており、レイヤー構造を用いて符号化するようにしている。したがって、本実施形態では4個のレイヤーを用いて符号化を行い、分割時も容易に4分割を行えるようにしている。
次いで、分割符号データ付加手段8も、今回フレームが初回フレームであることを判別するが(ステップ7)、初回フレームであれば動き領域がまだ存在しないので、分割符号データ記憶手段7に記憶されている4つの分割符号データのうちの1つのみを符号データ出力手段9に送出する。符号データ出力手段9は、分割符号データ付加手段8からの1つの分割符号データを復号化装置などの外部装置に出力する(ステップ8)。符号データ出力手段9は、今回フレームの出力を行った後、全フレームの出力を終了したか否かを判別するが(ステップ9)、この場合はまだ終了していないのでステップ1の処理に戻ることになる。
したがって、動画像入力手段1は今回フレームとして今度は第2フレーム目の静止画像データを入力し、画像データ記憶手段2はこれを記憶する(ステップ1)。そして、動き領域検出手段3は、ステップ2において今度は「NO」と判別し、動画像入力手段1からの今回フレームのデータと画像データ記憶手段2からの前回フレームのデータとの比較に基づき動き領域を検出する(ステップ10,11)。
ここで、動き領域の検出の仕方について説明すると、例えば、前回フレームとの間で、予め設定してある閾値よりも差の大きな画素値が今回フレームの中に有れば、そのような画素の集合領域を動き領域とする。この場合、この領域の中に「非動き画素」が有ればこの画素も動き領域の中に含めてよい。また、符号化方式の特性を考慮し、安全を見て得られた動き領域を数画素分広げるようにしてもよい。更に、動き領域は1フレーム中に複数領域現れても差し支えない。
次いで、背景領域符号化手段5は、今回フレームが所定フレーム目のものであるか否かを判別する(ステップ12)。「所定フレーム目」とは、第1フレーム目を除いた第5フレーム目、第9フレーム目、第13フレーム目、…等の4つ毎のフレームを指している。この場合は、今回フレームは第2フレーム目であるため、ステップ12の判別結果は「NO」であり、背景領域の符号化は行わない。
そして、動き領域符号化手段4は、動き領域符号化手段4が検出した動き領域に対して符号化を行う。(ステップ13)。この場合、既述したように、本実施形態ではMotion-JPEG2000に基づき符号化を行うことを想定しており、動き領域を注目領域(ROI領域)として符号化する。Motion-JPEG2000以外の符号化方式では、検出した動き領域以外の領域については、動き領域の符号化に影響を及ぼさないように、画素の値を「128」(ダイナミックレンジの半分の値)や「0」で置き換えるようにすると良い。
分割符号データ付加手段8は、分割符号データ記憶手段7から前回取り出したデータ以外の分割符号データを取り出し、これを動き領域符号化手段4からの動き領域符号データに付加して符号データ出力手段9に送出する(ステップ14)。この場合、分割符号データは動き領域符号データの最終識別子(EOC:End of Codestream)の後に付加される。したがって、復号化の際には、動き領域符号データとを分割符号データとを識別し、動き領域符号データのみに対して復号化を行うことが可能になっている。符号データ出力手段9は、このような動き領域符号データ及び分割符号データを外部装置に出力する(ステップ8)。
符号データ出力手段9は、また、前回と同様に今回フレームの出力を行った後、全フレームの出力を終了したか否かを判別するが(ステップ9)、この場合もまだ終了していないのでステップ1の処理に戻ることになる。
この後、第3フレーム目及び第4フレーム目については、上記の第2フレーム目と同様の処理が行われ、背景領域の符号化は行われない。しかし、第5フレーム目になると、ステップ1,2,10,11の各処理が行われた後、ステップ12の判別結果が「YES」となるので、背景領域の符号化(ステップ4)、背景領域符号データの分割(ステップ5)、分割符号データの記憶(ステップ6)等の処理が行われる。なお、ステップ7の判別結果は、これ以降常に「NO」となる。したがって、この後は第2〜第4フレーム目と同様の処理が行われる(ステップ13,14,8,9)。
このようにして、これ以降のフレームの処理も同様にして順次繰り返し行われる。そして、最後のフレームに係る動き領域符号データ及び分割符号データを符号データ出力手段9が外部装置に出力すると、ステップ9における判別結果が「YES」となり、全てのフレームのデータに対する処理が終了する。
上述した符号化においては、符号データ出力手段9から出力される符号データのデータ量が従来に比べて大きく低減されたものとなっている。これは、動き領域符号データに付加される分割符号データが全体の背景領域の符号データの4分の1のデータ量となっているためである。したがって、従来のように伝送情報量の制限値をオーバーすることがなく、復号化の際の画質劣化が生じるのを防止できる符号化が可能になっている。
図4は、本発明の実施形態に係る動画像復号化装置の構成を示すブロック図である。この図に示すように、本装置は、例えば、図1に示した符号データ出力手段9から符号データを順次入力する符号データ入力手段41と、符号データ入力手段41に入来した符号データを各フレーム毎に動き領域符号データと分割符号データとに分離する符号データ分離手段42と、符号データ分離手段42により分離された動き領域符号データを各フレーム毎に復号化する動き領域復号化手段43と、動き領域復号化手段43により復号化された動き領域画像を記憶する動き領域画像記憶手段44と、符号データ分離手段42により分離された各フレーム毎の分割符号データをN個蓄積する度に、これらN個の分割符号データを出力する分割符号データ蓄積手段45と、分割符号データ蓄積手段45からのN個の分割符号データを背景領域符号データとしてNフレーム毎に復号化する背景領域復号化手段46と、背景領域復号化手段46により復号化された背景領域画像をNフレーム毎に更新しながら記憶する背景領域画像記憶手段47と、背景領域画像記憶手段47に記憶されている背景領域画像、分割符号データがN個蓄積される期間中に動き領域画像記憶手段44に記憶されたNフレームの動き領域画像、及びNフレームのうちの最新のフレームの次のフレーム以降の動き領域画像であって動き領域復号化手段43により復号化された動き領域画像を、時系列順に順次上書き合成する画像合成手段48と、画像合成手段48により合成された合成画像を各フレーム毎に順次入力し、これを動画像データとして外部に出力する動画像データ出力手段49と、を備えている。
上記の符号データ入力手段41が入力する符号データは、図1に示した符号化装置が、動画像データを構成する複数フレームの静止画像データについて動き領域と背景領域とを各フレーム毎に区分して、動き領域については各フレーム毎に符号化を行い動き領域符号データを得、背景領域についてはN(Nは2以上の整数)フレーム毎に符号化を行い背景領域符号データを得、更にこの背景領域符号データを符号量を基準としてN分割することによりN個の分割符号データを生成し、各フレーム毎の前記動き領域符号データに対して、前記分割符号データをそれぞれ1つずつ付加して得たものである。
次に、図4の動作を図5のフローチャートに基づき説明する。まず、符号データ入力手段41が図1の符号データ出力手段9から初回フレームを入力したとする(ステップ51)。符号データ分離手段42は、入力フレームが初回フレームであるか否かを判別し(ステップ52)、初回フレームであれば符号化の説明において既述したように、符号データ中に動き領域が含まれていないので分割符号データのみを分割符号データ蓄積手段45に送出する。分割符号データ蓄積手段45は、この送られてきた分割符号データを蓄積する(ステップ53)。初回フレームの場合は、この分割符号データの蓄積のみが行われ、動画像データ出力手段49は再生装置などの外部装置へ動画像データの出力を行わない(このフローチャートの例では、初回フレームの分割符号データについては蓄積のみ行い、復号化をしない例について説明しているが、初回フレームの分割符号データであっても復号化することは技術的には可能である。)。
そして、動画像データ出力手段49は全ての入力符号データに対する復号化処理が終了したか否かを判別する(ステップ54)。この場合は、勿論まだ終了していないのでステップ51に戻ることになる。
次いで、符号データ入力手段41は第2フレーム目の符号データを入力し(ステップ51)、符号データ分離手段42は初回フレームではない旨を判別する(ステップ52)。この第2フレーム目の符号データは、動き領域符号データ及び分割符号データである。したがって、符号データ分離手段42は、符号データ入力手段41からの符号データを動き領域符号データと分割符号データとに分離する(ステップ55)。なお、当然のことながら、ステップ52の判別結果が「YES」となるのは第1フレーム目の場合のみであり、第2フレーム目以降は常にステップ52の判別結果は「NO」となる。
動き領域復号化手段43は、符号データ分離手段42が分離した動き領域符号データに対して復号化を行い(ステップ56)、動き領域画像記憶手段44はこの動き領域復号化手段43の復号化により得られた動き領域画像を記憶する(ステップ57)。一方、分割符号データ蓄積手段45は、符号データ分離手段42により分離された分割符号データを蓄積する(ステップ58)。
次いで、背景領域復号化手段46は、今回フレームが所定フレーム目のものであるか否かを判別する(ステップ59)。この判別は、図3のステップ12における背景領域符号化手段5の判別と同様のものである。つまり、「所定フレーム目」とは、第1フレーム目を除いた第5フレーム目、第9フレーム目、第13フレーム目、…等の4つ毎のフレームを指している。この場合は、今回フレームは第2フレーム目であるため、ステップ59の判別結果は「NO」であり、背景領域の復号化は行わず、その復号化画像の記憶処理も行われない。
この後、画像合成手段48は、今回フレームより前のフレームに係る記憶画像が存在するかどうかを判別する(ステップ60)。記憶画像とは、動き領域画像記憶手段44に記憶されている動き領域画像又は背景領域画像記憶手段47に記憶されている背景領域画像である。この場合は、前回フレームが初回フレームであり、動き領域画像記憶手段44にも背景領域画像記憶手段47のいずれにも記憶画像は存在していないので、ステップ60の判別結果は「NO」である。したがって、画像合成手段48は画像合成を行わず、動き領域復号化手段43が復号化した動き領域画像をそのまま動画像データ出力手段49に送出する。動画像データ出力手段49は、この動き領域画像のみの出力を行い(ステップ63)、ステップ54で「NO」の判別を行う。そして、再びステップ51に戻る。なお、ステップ60の判別結果が「NO」となるのは第2フレーム目だけであり、第3フレーム目以降は常にステップ60の判別結果は「YES」となる。
第3フレーム目の場合も、第2フレーム目の場合と同様に、ステップ51,52,55,56,57,58の処理が行われるが、ステップ59で「NO」の判別が行われた後のステップ60での判別は「YES」となる。第2フレーム目では、まだ背景領域画像記憶手段47に背景領域記憶画像は存在しないものの、動き領域画像記憶手段44には既に第2フレーム目の動き領域画像が記憶されているからである。したがって、画像合成手段48は第3フレーム目の動き領域画像と第2フレーム目の動き領域記憶画像との合成を行う(ステップ64)。つまり、画像合成手段48は、動き領域画像記憶手段44から取り出した第2フレーム目の動き領域画像に対して、動き領域復号化手段43からの第3フレーム目の動き領域画像を上書き合成する。動画像データ出力手段49は、この合成画像の出力を行い(ステップ65)、ステップ54で「NO」の判別を行う。そして、再びステップ51に戻る。
第4フレーム目の場合も、第3フレーム目の場合と同様に、ステップ51,52,55,56,57,58、59,60,64,65,54の処理が行われ、再びステップ51に戻る。但し、ステップ64で画像合成手段48が行う処理は、第4フレーム目の動き領域画像と第3フレーム目及び第2フレーム目の動き領域記憶画像との合成である。つまり、画像合成手段48は、時系列順に動き領域画像記憶手段44から最初に第2フレーム目の動き領域記憶画像を取り出した後、これに第3フレーム目の動き領域記憶画像を上書き合成し、更に、その後これに動き領域復号化手段43からの第4フレーム目の動き領域画像を上書き合成する。動画像データ出力手段49は、この合成画像の出力を行い(ステップ65)、ステップ54で「NO」の判別を行う。そして、再びステップ51に戻る。
第5フレーム目の場合は、ステップ51,52,55,56,57,58までは第2フレーム目乃至第4フレーム目と同様の処理が行われるが、ステップ59での判別結果が「YES」となる。つまり、第4フレーム目で既に背景領域全体を構成し得る4つの分割符号データが揃っているので、分割符号データ蓄積手段45はこの4つの分割符号データを背景領域復号化手段46に出力する。背景領域復号化手段46は、この4つの分割符号データの復号化を行い(ステップ61)、背景領域画像記憶手段47はその復号化された背景領域画像を記憶する(ステップ62)。この後、画像合成手段48は、再度ステップ60の判別を行い、その判別結果を「YES」とする。
次いで、画像合成手段48は、動き領域復号化手段43からの第5フレーム目の動き領域画像と、背景領域画像記憶手段47及び動き領域画像記憶手段44からの前の記憶画像との合成を行う(ステップ64)。つまり、画像合成手段48は、背景領域画像記憶手段47から背景領域記憶画像を取り出した後、これに動き領域画像記憶手段44から取り出した第2乃至第4フレーム目の動き領域記憶画像を時系列順に順次上書き合成し、更に、その後これに動き領域復号化手段43からの第5フレーム目の動き領域画像(動き領域画像記憶手段44に記憶された4つのフレームのうちの最新のフレームである第4フレーム目の次のフレーム以降の動き領域画像である)を上書き合成する。動画像データ出力手段49は、この合成画像の出力を行い(ステップ65)、ステップ54で「NO」の判別を行う。そして、再びステップ51に戻る。
以下、同様にして、第6乃至第8フレーム目の場合は、第3及び第4フレーム目の場合と同様に、ステップ51,52,55,56,57,58、59,60,64,65,54の処理が行われた後、再びステップ51に戻る。第9フレーム目の場合は、第5フレーム目の場合と同様に、ステップ51,52,55,56,57,58、59,61,62,60,64,65,54の処理が行われた後、再びステップ51に戻る。そして、最終フレーム目において、ステップ54での判別結果が「YES」となって全ての処理が終了する。
上述した復号化においては、伝送情報量の制限値をオーバーしないように、符号データ入力手段41が各フレーム毎に入力する符号データは、動き領域符号データ及びこれに付加される分割符号データの符号量の小さなものである。そして、背景領域画像が復号化されるのは第5フレーム目、第9フレーム目、第13フレーム目等の4フレーム毎の所定フレームだけである。しかし、テレビ電話システムやテレビ会議システム、あるいは監視システムなどでは、背景領域は固定されたものであり、また、シーンチェンジも殆どないのが通常であるため、このような一定のフレーム数間隔での復号化でも実用上は何ら問題が生じることがない。
図6は、上述した図3及び図5のフローチャートに係る処理内容をイメージ化した説明図であり、(a)は動画像データを構成する各フレームの静止画像データの入力タイミングを示し、(b)は各フレームにおける符号化のタイミング及びその内容を示し、(c)は各フレームについて伝送される符号データを示し、(d)は各フレームにおける復号化のタイミング及びその内容をレイヤー構造を用いて示している。なお、これらの図において、大文字のアルファベットA,B,C,D,…は各フレームの動き領域画像(例えば、人物の画像)を示し、小文字のアルファベットa,b,c,d,…は所定フレームにおける背景(例えば、人物の後ろ側の壁等)領域を分割して得られる分割符号データを示している。この図6を用いて、各フレームにおける処理内容を簡単に説明する。
第1フレーム目の静止画像データが符号化装置に入力されると、符号化装置は全領域を背景領域として符号化を行い、分割符号データa,b,c,dを生成する。この第1フレーム目の分割符号データa,b,c,dは、本来は動き領域となる人物も背景領域に含めて分割したものであり、動き領域Aを囲む点線は実際にはこの動き領域Aが存在しないことを示している。そして、伝送路上には分割符号データaのみが送られる。復号化装置では、この分割符号データaの蓄積のみが行われ、復号化は行わない(この復号化装置の例では分割符号データaの復号化は行っていないが、技術的には行うことは可能である)。
第2フレーム目の静止画像データが符号化装置に入力されると、今度は前回フレームの画像データが存在するので、符号化装置は動き領域Bを符号化する。伝送路上には、動き領域B及びこれに付加された分割符号データbが送られる。復号化装置では、動き領域Bを第1レイヤーを用いて復号化すると共に、分割符号データbを蓄積する。
第3フレーム目の静止画像データが符号化装置に入力されると、符号化装置は動き領域Cを符号化する。伝送路上には、動き領域C及びこれに付加された分割符号データcが送られる。復号化装置では、第1レイヤーの動き領域Bに対して第2レイヤーの動き領域Cを上書き合成して復号化すると共に、分割符号データcを蓄積する。
第4フレーム目の静止画像データが符号化装置に入力されると、符号化装置は動き領域Dを符号化する。伝送路上には、動き領域D及びこれに付加された分割符号データdが送られる。復号化装置では、第1及び第2レイヤーの動き領域B,Cに対して第3レイヤーの動き領域Dを上書き合成して復号化すると共に、分割符号データdを蓄積する。
第5フレーム目の静止画像データが符号化装置に入力されると、符号化装置は、背景領域を符号化した後、これを4分割して分割符号データe,f,g,hを生成すると共に、動き領域Eを符号化する。伝送路上には、動き領域E及びこれに付加された分割符号データeが送られる。復号化装置では、記憶されている分割符号データa,b,c,dを背景領域Z1として復号化を行うと共に、この第1レイヤーの背景領域Z1に対して動き領域B,C,Dを時系列順に上書き合成して得られる第2レイヤーの画像Y1を上書き合成する。そして、この第2レイヤーの画像Y1に対して更に第3レイヤーの動き領域Eを上書き合成して復号化すると共に、分割符号データeを蓄積する。このように、第1〜第4フレームの分割符号データa,b,c,dは、第5フレーム目で初めて背景領域として復号化され顕在化する。
第6フレーム目の静止画像データが符号化装置に入力されると、符号化装置は動き領域Fを符号化する。伝送路上には、動き領域F及びこれに付加された分割符号データfが送られる。復号化装置では、第1レイヤーの背景領域Z1、第2レイヤーの画像Y1、第3レイヤーの動き領域E、第4レイヤーの動き領域Fを時系列順に順次上書き合成して復号化すると共に、分割符号データfを蓄積する。
第7フレーム目の静止画像データが符号化装置に入力されると、符号化装置は動き領域Gを符号化する。伝送路上には、動き領域G及びこれに付加された分割符号データgが送られる。復号化装置では、第1レイヤーの背景領域Z1、第2レイヤーの画像Y1、第3レイヤーの動き領域E、第4レイヤーの動き領域F、第5レイヤーの動き領域Gを時系列順に順次上書き合成して復号化すると共に、分割符号データgを蓄積する。
第8フレーム目の静止画像データが符号化装置に入力されると、符号化装置は動き領域Hを符号化する。伝送路上には、動き領域H及びこれに付加された分割符号データhが送られる。復号化装置では、第1レイヤーの背景領域Z1、第2レイヤーの画像Y1、第3レイヤーの動き領域E、第4レイヤーの動き領域F、第5レイヤーの動き領域G、第6レイヤーの動き領域Hを時系列順に順次上書き合成して復号化すると共に、分割符号データhを蓄積する。
第9フレーム目の静止画像データが符号化装置に入力されると、符号化装置は、背景領域を符号化した後、これを4分割して分割符号データi,j,k,lを生成すると共に、動き領域Iを符号化する。伝送路上には、動き領域I及びこれに付加された分割符号データiが送られる。復号化装置では、記憶されている分割符号データe,f,g,hを背景領域Z2として復号化を行うと共に、この第1レイヤーの背景領域Z2に対して動き領域E,F,G,Hを時系列順に上書き合成して得られる第2レイヤーの画像Y2を上書き合成する。そして、この第2レイヤーの画像Y2に対して更に第3レイヤーの動き領域Iを上書き合成して復号化すると共に、分割符号データiを蓄積する。このように、第5〜第8フレームの分割符号データe,f,g,hは、第9フレーム目で初めて背景領域として復号化され顕在化する。
以下同様にして、第10フレーム目以降の静止画像データについて符号化及び復号化が行われる。ここで、上記の復号化の内容につき振り返ってみると、1フレーム目では全く復号化が行われておらず、2〜4フレーム目では動き領域のみにつき復号化が行われて背景領域は復号化されていないため画質が劣化したものである。また、5〜8フレーム目において、背景領域Z1は分割符号データa,b,c,dに基づき得られたものであるが、これらの分割符号データは、本来であれば動き領域となるべき人物をも含めてしまったものになっている。
したがって、1〜8フレーム目までの復号化により得られる画像は、正確には正規の処理に基づくものとは言えないものである。しかし、これらの画像が現れるのは当初の短時間のみであり、第9フレーム目以降は常に正規の処理に基づく画像が得られるので実用的には支障ないものと言える。
次に、上記実施形態における動き領域について図7及び図8を参照しつつ補足説明を加える。いま、図7(a)に示すように、あるフレームにおける画像が、壁W(背景領域)の前に人物M(動き領域)が立っているものであるとする。この後、この人物Mがやや右に移動したとし、そのときの画像を得ようとした場合に、右に移動した人物Mだけを動き領域とし、これを前のフレームの壁Wと合成したのでは、図7(b)に示すように、前のフレームにおいてのみ人物Mとなっていた領域Rのデータが抜け落ちてしまいその部分の画質が劣化することになる。そこで、このような場合には、図7(c)に示すように、今回フレームでは移動後の人物Mの領域と移動前の人物Mの領域との双方を合わせた領域を動き領域とすることにする。これにより、図7(d)に示すように、領域Rについても壁Wの部分が補充された、画質劣化の生じない自然な画像を得ることができる。
図7の場合は、画面中の人物M(オブジェクト)が移動した場合を例に取り説明したが、同様のことはカメラがパンニングやズーミングを行った場合についても言えることである。例えば、図8(a)に示すように、あるフレームにおける画像が、風景Qをバックにして建物Pが立っているものであるとし、この後、カメラが左にパンしたとする。すると、画面中には、前のフレームでは写っていなかった風景領域Q1が新たに現れることになる。したがって、この場合もこの新たな領域Q1を動き領域として符号化することにすれば、画質劣化の生じない自然な画像を得ることができる。
以上説明したように、本発明に係る動画像符号化装置及び動画像復号化装置によれば、シーンチェンジのないテレビ電話システム等の動画像において、伝送情報量に一定の制限が付されている場合でも、符号化効率を向上させることにより画質の劣化が生じるのを極力防止することが可能となる。
なお、上記した動画像符号化装置及び動画像復号化装置の各機能は、プログラムによりコンピュータで実現させることができる。このプログラムは、記録媒体の読取によりコンピュータに取り込まれてもよいし、通信ネットワークを介した伝送によりコンピュータに取り込まれてもよい。
1 動画像入力手段
2 画像データ記憶手段
3 動き領域検出手段
4 動き領域符号化手段
5 背景領域符号化手段
6 背景領域符号データ分割手段
7 分割符号データ記憶手段
8 分割符号データ付加手段
9 符号データ出力手段
41 符号データ入力手段
42 符号データ分離手段
43 動き領域復号化手段
44 動き領域画像記憶手段
45 分割符号データ蓄積手段
46 背景領域復号化手段
47 背景領域画像記憶手段
48 画像合成手段
49 動画像データ出力手段
2 画像データ記憶手段
3 動き領域検出手段
4 動き領域符号化手段
5 背景領域符号化手段
6 背景領域符号データ分割手段
7 分割符号データ記憶手段
8 分割符号データ付加手段
9 符号データ出力手段
41 符号データ入力手段
42 符号データ分離手段
43 動き領域復号化手段
44 動き領域画像記憶手段
45 分割符号データ蓄積手段
46 背景領域復号化手段
47 背景領域画像記憶手段
48 画像合成手段
49 動画像データ出力手段
Claims (3)
- 動画像データを構成する複数フレームの静止画像データを順次入力し、この静止画像データについて動き領域を各フレーム毎に検出する動き領域検出手段と、
前記動き領域検出手段が検出した動き領域を各フレーム毎に符号化する動き領域符号化手段と、
前記動き領域検出手段が検出した動き領域を除いた領域を背景領域とし、この背景領域をN(Nは2以上の整数)フレーム毎に符号化する背景領域符号化手段と、
前記背景領域符号化手段からの背景領域符号データを、符号量を基準としてN分割しN個の分割符号データを生成する背景領域符号データ分割手段と、
前記背景領域符号データ分割手段からの各分割符号データを記憶する分割符号データ記憶手段と、
前記動き領域符号化手段からの各フレーム毎の動き領域符号データに対して、前記分割符号データ記憶手段からの分割符号データをそれぞれ1つずつ付加する分割符号データ付加手段と、
を備えたことを特徴とする動画像符号化装置。 - 前記動き領域には、オブジェクトの領域とオブジェクトの移動により現れた新たな背景領域とを合わせた領域、又は前記動画像データの撮像手段のパンニング若しくはズーミングにより現れた新たな背景領域が含まれる、
ことを特徴とする請求項1記載の動画像符号化装置。 - 動画像データを構成する複数フレームの静止画像データについて動き領域と背景領域とを各フレーム毎に区分して、動き領域については各フレーム毎に符号化を行い動き領域符号データを得、背景領域についてはN(Nは2以上の整数)フレーム毎に符号化を行い背景領域符号データを得、更にこの背景領域符号データを符号量を基準としてN分割することによりN個の分割符号データを生成し、各フレーム毎の前記動き領域符号データに対して、前記分割符号データをそれぞれ1つずつ付加して得た符号データを順次入力する符号データ入力手段と、
前記符号データ入力手段に入来した符号データを各フレーム毎に前記動き領域符号データと前記分割符号データとに分離する符号データ分離手段と、
前記符号データ分離手段により分離された前記動き領域符号データを各フレーム毎に復号化する動き領域復号化手段と、
前記動き領域復号化手段により復号化された動き領域画像を記憶する動き領域画像記憶手段と、
前記符号データ分離手段により分離された各フレーム毎の前記分割符号データをN個蓄積する度に、これらN個の分割符号データを出力する分割符号データ蓄積手段と、
前記分割符号データ蓄積手段からのN個の分割符号データを背景領域符号データとしてNフレーム毎に復号化する背景領域復号化手段と、
前記背景領域復号化手段により復号化された背景領域画像をNフレーム毎に更新しながら記憶する背景領域画像記憶手段と、
前記背景領域画像記憶手段に記憶されている背景領域画像、前記分割符号データがN個蓄積される期間中に前記動き領域画像記憶手段に記憶されたNフレームの動き領域画像、及び前記Nフレームのうちの最新のフレームの次のフレーム以降の動き領域画像であって前記動き領域復号化手段により復号化された動き領域画像を、時系列順に順次上書き合成する画像合成手段と、
を備えたことを特徴とする動画像復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004186046A JP2006013754A (ja) | 2004-06-24 | 2004-06-24 | 動画像符号化装置及び動画像復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004186046A JP2006013754A (ja) | 2004-06-24 | 2004-06-24 | 動画像符号化装置及び動画像復号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006013754A true JP2006013754A (ja) | 2006-01-12 |
Family
ID=35780480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004186046A Pending JP2006013754A (ja) | 2004-06-24 | 2004-06-24 | 動画像符号化装置及び動画像復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006013754A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008099033A (ja) * | 2006-10-12 | 2008-04-24 | Nagaoka Univ Of Technology | 画像通信装置及び画像通信方法 |
WO2009014230A1 (en) * | 2007-07-20 | 2009-01-29 | Fujifilm Corporation | Image processing apparatus, image processing method, image processing system and program |
JP2010278968A (ja) * | 2009-06-01 | 2010-12-09 | Panasonic Corp | 画像符号化伝送表示装置及び画像符号化伝送表示方法 |
WO2016024547A1 (ja) * | 2014-08-11 | 2016-02-18 | 株式会社チャオ | ヒートマップ画像生成装置、ヒートマップ画像生成方法およびヒートマップ画像生成プログラム |
JP2016110385A (ja) * | 2014-12-05 | 2016-06-20 | 株式会社チャオ | ヒートマップ画像生成装置、ヒートマップ画像生成方法およびヒートマップ画像生成プログラム |
JP2018509113A (ja) * | 2015-01-22 | 2018-03-29 | ハドリー インコーポレイテッド | 独立符号化バックグラウンド更新に基づく映像伝送 |
US10171822B2 (en) | 2014-08-11 | 2019-01-01 | Ciao, Inc. | Image transmission device, image transmission method, and image transmission program |
-
2004
- 2004-06-24 JP JP2004186046A patent/JP2006013754A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008099033A (ja) * | 2006-10-12 | 2008-04-24 | Nagaoka Univ Of Technology | 画像通信装置及び画像通信方法 |
WO2009014230A1 (en) * | 2007-07-20 | 2009-01-29 | Fujifilm Corporation | Image processing apparatus, image processing method, image processing system and program |
JP2009049979A (ja) * | 2007-07-20 | 2009-03-05 | Fujifilm Corp | 画像処理装置、画像処理方法、画像処理システム、及びプログラム |
US8345983B2 (en) | 2007-07-20 | 2013-01-01 | Fujifilm Corporation | Image processing apparatus, image processing method, image processing system and computer readable medium |
JP2010278968A (ja) * | 2009-06-01 | 2010-12-09 | Panasonic Corp | 画像符号化伝送表示装置及び画像符号化伝送表示方法 |
WO2016024547A1 (ja) * | 2014-08-11 | 2016-02-18 | 株式会社チャオ | ヒートマップ画像生成装置、ヒートマップ画像生成方法およびヒートマップ画像生成プログラム |
US10171822B2 (en) | 2014-08-11 | 2019-01-01 | Ciao, Inc. | Image transmission device, image transmission method, and image transmission program |
JP2016110385A (ja) * | 2014-12-05 | 2016-06-20 | 株式会社チャオ | ヒートマップ画像生成装置、ヒートマップ画像生成方法およびヒートマップ画像生成プログラム |
JP2018509113A (ja) * | 2015-01-22 | 2018-03-29 | ハドリー インコーポレイテッド | 独立符号化バックグラウンド更新に基づく映像伝送 |
JP7045856B2 (ja) | 2015-01-22 | 2022-04-01 | ハドリー インコーポレイテッド | 独立符号化バックグラウンド更新に基づく映像伝送 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5521202B2 (ja) | 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム | |
KR102058759B1 (ko) | 디코딩된 픽쳐 버퍼 및 참조 픽쳐 목록들에 관한 상태 정보의 시그널링 기법 | |
JP5436458B2 (ja) | 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム | |
KR102343700B1 (ko) | 독립적으로 인코딩된 배경 업데이트들에 기초한 비디오 송신 | |
JP2020025251A (ja) | オーバーレイを伴うビデオを符号化するための方法およびシステム | |
JP2002514866A (ja) | ビデオ・フレーム・レートを増加させる方法および装置 | |
JP4708263B2 (ja) | 画像復号化装置および画像復号化方法 | |
KR20060109247A (ko) | 베이스 레이어 픽처를 이용하는 영상신호의 엔코딩/디코딩방법 및 장치 | |
JP4875007B2 (ja) | 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置 | |
KR20060027778A (ko) | 베이스 레이어를 이용하는 영상신호의 엔코딩/디코딩 방법및 장치 | |
JP2006279917A (ja) | 動画像符号化装置、動画像復号装置及び動画像伝送システム | |
JP4411220B2 (ja) | 映像信号処理装置、及びその映像信号処理方法 | |
US20060133677A1 (en) | Method and apparatus for performing residual prediction of image block when encoding/decoding video signal | |
JP2007036888A (ja) | 符号化方法 | |
KR101763921B1 (ko) | 컨텐츠 스트리밍 시스템 및 방법 | |
JP2006013754A (ja) | 動画像符号化装置及び動画像復号化装置 | |
JP2006080832A (ja) | 画像トランスコーダ | |
JP4795141B2 (ja) | 映像符号化合成装置、映像符号化合成方法及び映像伝送システム | |
JP4133581B2 (ja) | テロップ合成装置、テロップ合成方法及びテロップ合成プログラム | |
KR20160002712A (ko) | 비디오 신호 처리 방법 및 장치 | |
JPWO2008129648A1 (ja) | フレームレート変換装置、フレームレート変換方法及び動画像符号化装置 | |
JP4239894B2 (ja) | 画像符号化装置及び画像復号化装置 | |
JP5049386B2 (ja) | 動画像符号化装置および動画像復号装置 | |
JP6767299B2 (ja) | 映像符号化装置 | |
JP2007013398A (ja) | ポストフィルタ、ポストフィルタリングプログラムおよび電子情報機器 |