JP2006074130A - 画像復号方法、画像復号装置および撮像装置 - Google Patents

画像復号方法、画像復号装置および撮像装置 Download PDF

Info

Publication number
JP2006074130A
JP2006074130A JP2004251939A JP2004251939A JP2006074130A JP 2006074130 A JP2006074130 A JP 2006074130A JP 2004251939 A JP2004251939 A JP 2004251939A JP 2004251939 A JP2004251939 A JP 2004251939A JP 2006074130 A JP2006074130 A JP 2006074130A
Authority
JP
Japan
Prior art keywords
image
roi
region
transform coefficient
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004251939A
Other languages
English (en)
Inventor
Takeshi Watanabe
剛 渡邉
Shigeyuki Okada
茂之 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2004251939A priority Critical patent/JP2006074130A/ja
Priority to US11/168,671 priority patent/US7720295B2/en
Publication of JP2006074130A publication Critical patent/JP2006074130A/ja
Priority to US12/621,952 priority patent/US20100135587A1/en
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 注目するオブジェクトを容易に際立たせる。
【解決手段】 符号化データ抽出部10は、入力された符号化画像から符号化データを抽出する。エントロピー復号部12は、符号化データをビットプレーン毎に復号し、量子化されたウェーブレット変換係数を得る。動き検出部18は、指定されたオブジェクトの位置およびその動きベクトルを検出する。ROI設定部20は、それらに対応させてROI領域を移動させる。逆量子化部14は、非ROI領域に対するROI領域の相対的な優先度に応じて、非ROI領域に対応する上記ウェーブレット変換係数のビット列において零値に置換する下位ビット数を調整して、逆量子化する。ウェーブレット逆変換部16は、逆量子化されたウェーブレット変換係数を逆変換し、得られた復号画像を出力する。
【選択図】 図1

Description

この発明は、画像復号方法、画像復号装置および撮像装置に関し、特に画質を調整して復号可能な画像復号方法、画像復号装置および撮像装置に関する。
ISO/ITU−Tにおいて、静止画像の圧縮符号化の標準技術であるJPEG(Joint Photographic Expert Group)の後継として、離散ウェーブレット変換(DWT)を用いたJPEG2000の標準化が行われている。JPEG2000では、低ビットレート符号化からロスレス圧縮まで広範囲の画質を高性能で符号化することができ、画質を徐々に高めるスケーラビリティ機能も実現が容易である。また、JPEG2000には、従来のJPEG標準にはなかった多様な機能が用意されている。
特許文献1は、このような圧縮をされた符号化画像を復号する際、画質を改善するために、ノイズ除去やエッジ強調などの画像処理を行う技術を開示する。具体的には、LLサブバンド以外のサブバンドに含まれる変換係数を0として、参照画像を形成する。当該サブバンド内の変換係数に対する参照画像上の領域を求め、この領域内の画素値の平均値などを求める。この平均値などが所定の閾値より小さければ、この変換係数に対して閾値処理を行う。
特開2002−135593号公報
上記特許文献1は、LLサブバンド以外のサブバンド内の変換係数に対して上述した処理を行うため、演算量が大きく増加してしまう。また、あるオブジェクトを際立たせる程度にまで、画像内の領域間に画質の差を作ることは難しい。
本発明はこうした課題に鑑みてなされたものであり、その目的は、注目するオブジェクトを容易に際立たせることができる画像復号方法、画像復号装置および撮像装置を提供することにある。
上記課題を解決するために、本発明のある態様の画像復号方法は、画像内に注目領域を設定し、画像内の注目するオブジェクトの動きに注目領域を追従せしめ、注目領域とそれ以外の領域とで異なる画質で動画像を復号する。この態様によると、注目するオブジェクトを容易に際立たせることができる。
本発明の別の態様は、画像復号装置である。この装置は、画像内に注目領域を設定する注目領域設定部と、画像内の注目するオブジェクトの動きを検出する動き検出部と、注目領域とそれ以外の領域とで異なる画質で動画像を復号する復号部と、を有する。注目領域設定部は、オブジェクトの動きに注目領域を追従せしめる。「注目領域」の初期設定は、ユーザ操作により行ってもよい。この態様によると、注目するオブジェクトを容易に際立たせることができる。また、復号の際の演算量を低減することができる。
注目領域および該注目領域以外の領域の少なくとも一方の画質を、本装置の状態を参照して設定する画質設定部をさらに有してもよい。「本装置の状態」には、装置の電池残量、または再生速度を含んでもよい。この態様によれば、装置の状態に適応して画像を復号することができる。
本発明のさらに別の態様は、撮像装置である。この装置は、画像を取得する撮像部を有する。画像内に注目領域を設定し、画像内の注目するオブジェクトの動きに注目領域を追従せしめ、注目領域とそれ以外の領域とで異なる画質で動画像を表示する。この態様によると、撮影した画像内の注目するオブジェクトを容易に際立たせることができる。
本発明のさらに別の態様もまた、撮像装置である。この装置は、画像を取得する撮像部と、画像内に注目領域を設定する注目領域設定部と、画像内の注目するオブジェクトの動きを検出する動き検出部と、注目領域とそれ以外の領域とで異なる画質で動画像を符号化する符号化部と、符号化部により符号化された画像データを復号する復号部と、を有する。注目領域設定部は、オブジェクトの動きに注目領域を追従せしめる。
この態様によると、撮影した画像内の注目するオブジェクトを容易に際立たせることができる。また、符号化画像の符号量を低減することができる。
注目領域および該注目領域以外の領域の少なくとも一方の画質を、本装置の状態を参照して設定する画質設定部をさらに有してもよい。「本装置の状態」には、装置の電池残量、または再生速度を含んでもよい。装置の状態に適応して画像を表示することができる。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、記録媒体などの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、注目するオブジェクトを容易に際立たせることができる。
実施の形態1
図1は、実施の形態1に係る画像復号装置100の構成図である。画像復号装置100の構成は、ハードウエア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウエア的にはメモリのロードされた復号機能のあるプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
実施の形態1では、画像復号装置100は、一例としてJPEG2000方式により圧縮符号化された符号化画像を復号する。画像復号装置100に入力される符号化画像は、画像の注目領域(Region of Interest;ROI)を他の領域よりも優先して符号化したROI符号化がなされていない通常の符号化画像である。画像復号装置100は、復号の際に注目領域(以下、ROI領域という。)を指定し、ROI領域を優先的に復号する。
画像復号装置100に入力される符号化画像は、動画像の符号化フレームであってもよい。符号化ストリームとして入力される動画像の各符号化フレームを連続的に復号することにより動画を再生することができる。
符号化データ抽出部10は、入力された符号化画像から符号化データを抽出する。エントロピー復号部12は、符号化データをビットプレーン毎に復号し、復号の結果得られる量子化されたウェーブレット変換係数を図示しないメモリに格納する。
動き検出部18は、指定されたオブジェクトの位置を検出し、ROI設定部20に出力する。オブジェクトの指定は、ユーザがしてもよいし、ユーザが指定したROI領域の中から動き検出部18が自動で認識してもよい。また、画像の全体から自動で認識してもよい。このオブジェクトの指定は、複数であってもよい。
動画像の場合、オブジェクトの位置は、動きベクトルで表すことができる。以下、動きベクトル検出方法の具体例を説明する。第1に、動き検出部18は、SRAMやSDRAMなどのメモリを備え、オブジェクトの指定時にそのフレーム内にて指定されたオブジェクトの画像を、参照画像として当該メモリに保存する。参照画像として、指定位置を含む所定の大きさのブロックを保存するとよい。動き検出部18は、当該参照画像と現フレームの画像とを比較することにより、動きベクトルを検出する。動きベクトルの算出には、ウェーブレット変換係数の高周波成分を用いて、オブジェクトの輪郭成分を特定して行うことができる。また、量子化後のウェーブレット変換係数のMSB(Most Significant Bit)ビットプレーン、もしくはMSB側から複数のビットプレーンを用いてもよい。
第2に、動き検出部18は、現フレームと、前の、たとえば直前のフレームとを比較して、オブジェクトの動きベクトルを検出する。第3に、フレーム画像ではなく、ウェーブレット変換後のウェーブレット変換係数を比較して、動きベクトルを検出する。ウェーブレット変換係数は、LLサブバンド、HLサブバンド、LHサブバンド、およびHHサブバンドのいずれを用いてもよい。また、現フレームとの比較対象は、指定時に登録された参照画像でもよいし、前の、たとえば直前のフレームから登録された参照画像であってもよい。
第4に、動き検出部18は、複数のウェーブレット変換係数を用いて、オブジェクトの動きベクトルを検出する。たとえば、HLサブバンド、LHサブバンド、およびHHサブバンドごとに動きベクトルを検出し、それら3つの動きベクトルの平均を取ったり、その中から前フレームの動きベクトルに最も近いものを選択したりすることができる。これにより、オブジェクトの動き検出精度を高めることができる。
また、ユーザは、画像内においてこのような動きベクトルを検出する範囲を予め動き検出部18に指定してもよい。たとえば、コンビニエンスストアなどの店舗の監視カメラで撮影した画像を復号する場合、レジから一定の範囲に入った人物などのオブジェクトを注目し、そこから出たオブジェクトの動きを注目しないといった処理も可能になる。
ROI設定部20は、動き検出部18からオブジェクトの動きベクトルなどの位置情報を取得し、それに対応させてROI領域を移動させる。動き検出部18の検出方法により、初期設定のROI領域の位置からの移動量、または直前のフレームからの移動量を算出し、現フレームのROI領域の位置を決定する。
ユーザは、ROI領域の位置、大きさ、および画質などを、初期値としてROI設定部20に設定する。ROI領域の位置情報は、ROI領域が矩形で選択される場合、矩形領域の左上隅の画素の座標値と矩形領域の縦横の画素数で与えられてもよい。なお、ユーザがオブジェクトを指定した場合、もしくは動き検出部18が自動認識した場合、ROI設定部20がそのオブジェクトを含む所定の範囲をROI領域に自動設定してもよい。
ROI領域の形は、矩形、丸、その他の複雑な形であってもよい。ROI領域自体の形は、固定が原則であるが、画像の中心部分と周辺部分とで領域の形を可変させてもよいし、ユーザ操作により動的に可変してもよい。また、ROI領域は複数設定されてもよい。
ROI設定部20は、ROI設定情報をもとに、ROI領域に対応するウェーブレット変換係数すなわちROI変換係数を特定するためのROIマスクを生成する。逆量子化部14は、非注目領域(以下、非ROI領域という。)に対するROI領域の相対的な優先度に応じて、非ROI領域に対応する上記ウェーブレット変換係数のビット列において零値に置換する下位ビット数を調整する。次に、上記ROIマスクを参照して、エントロピー復号部12により復号されたウェーブレット変換係数の内、非ROI変換係数のLSB(Least Significant Bit)側から所定ビット数分を零に置換する処理を行う。
ここで、零に置換するビット数は、非ROI領域における量子化値の最大ビット数を上限とする任意の自然数である。このビット数を変化させることにより、ROI領域に対する非ROI領域の再生画質の劣化度合いを連続的に調整することができる。そして、逆量子化部14は、ROI変換係数と下位ビットが零置換された非ROI変換係数を含むウェーブレット変換係数を逆量子化する。ウェーブレット逆変換部16は、逆量子化されたウェーブレット変換係数を逆変換し、得られた復号画像を出力する。
図2(a)〜(c)は、ROI設定部20により生成されるROIマスクを説明する図である。図2(a)のように、ROI設定部20により原画像80上にROI領域90が選択されたとする。ROI設定部20は、原画像80上に選択されたROI領域90を復元するために必要なウェーブレット変換係数を各サブバンドにおいて特定する。
図2(b)は、画像80を1回だけウェーブレット変換することにより得られる第1階層の変換画像82を示す。第1階層の変換画像82は、第1レベルの4つのサブバンドLL1、HL1、LH1、HH1から構成される。ROI設定部20は、原画像80のROI領域90を復元するために必要な第1階層の変換画像82上のウェーブレット変換係数、すなわちROI変換係数91〜94を第1レベルの各サブバンドLL1、HL1、LH1、HH1において特定する。
図2(c)は、図2(b)の変換画像82の最低周波数成分のサブバンドLL1をさらにウェーブレット変換することにより得られる第2階層の変換画像84を示す。第2階層の変換画像84は、同図のように、第1レベルの3つのサブバンドHL1、LH1、HH1の他、第2レベルの4つのサブバンドLL2、HL2、LH2、HH2を含む。ROI設定部20は、第1階層の変換画像82のサブバンドLL1におけるROI変換係数91を復元するために必要な第2階層の変換画像84上のウェーブレット変換係数、すなわちROI変換係数95〜98を第2レベルの各サブバンドLL2、HL2、LH2、HH2において特定する。
同様にして、ウェーブレット変換の回数だけROI領域90に対応するROI変換係数を各階層において再帰的に特定していくことにより、最終階層の変換画像において、ROI領域90を復元するために必要なROI変換係数をすべて特定することができる。ROI設定部20は、この最終的に特定されたROI変換係数の位置を最終階層の変換画像上で特定するためのROIマスクを生成する。たとえば、ウェーブレット変換を2回だけ行う場合には、図2(c)において斜線で示した7個のROI変換係数92〜98の位置を特定することのできるROIマスクが生成される。
図3(a)〜(c)は、符号化画像の復号後におけるウェーブレット変換係数の下位ビットが零置換される様子を示す。図3(a)は、エントロピー復号された画像のウェーブレット変換係数74であり、5ビットプレーンを含む。図3(b)において、ROI設定部20により指定されたROI領域に対応するROI変換係数を斜線で示す。逆量子化部14は、図3(c)のように、非ROI変換係数の下位2ビットを零に置換したウェーブレット変換係数76を生成する。
なお、ROI設定部20はROI領域を選択する代わりに、非ROI領域を選択してもよい。たとえば、人物の顔や車のナンバープレートなどの個人情報が写っている領域にぼかしを入れたい場合はその領域を非ROI領域として選択する。この場合、非ROI変換係数を特定するマスクを反転させて、ROI変換係数を特定するマスクを生成することができる。あるいは、非ROI変換係数を特定するマスクを逆量子化部14に与えてもよい。
画像復号装置100に動画像の符号化フレームが連続的に入力される場合、画像復号装置100に次のような動作をさせることもできる。画像復号装置100は、通常時は処理負荷を減らすために、ウェーブレット変換係数の下位のビットプレーンを適宜破棄して再生する簡易再生を行う。これにより、画像復号装置100の処理性能に制約がある場合でも、下位ビットプレーンを破棄しているため、たとえば30フレーム/秒で簡易再生が可能である。
簡易再生中に、画像上のROI領域が選択された場合、画像復号装置100は、非ROI領域の下位ビットが零置換された状態のウェーブレット変換係数に対して、最下位のビットプレーンまで復号して画像を再生する。このとき、処理負荷が高くなるため、15フレーム/秒などにコマ落ちさせた状態か、スロー再生の状態になることもあるが、ROI領域を高画質で再生することができる。
このようにして、ROI領域が選択されたときは、非ROI領域は簡易再生と同程度の品質のまま、ROI領域だけをより高い品質で再生することができる。監視映像のように、平常時には高い品質を求めず、異常時にのみ注目箇所を高い品質で再生したい場合に有用である。また、モバイル端末で動画像を再生する場合には、電池寿命の観点から、節電モードでは動画を低品質で再生し、必要に応じてROI領域だけを高画質で再生するといった使い方もできる。
本実施の形態の画像復号装置100によれば、ROI符号化されていない通常の符号化画像に対して、非ROI領域に対応するウェーブレット変換係数の下位ビットを零置換することにより、相対的にROI領域の画質を非ROI領域よりも高くして復号することができ、ユーザの注目するオブジェクトを容易に際立たせることができる。また、ROI領域だけを優先的に復号するため、通常の復号処理より処理量を減らすことができる。したがって、処理を高速化することができ、また、消費電力を削減することもできる。
実施の形態2
図4は、実施の形態2に係る画像復号装置200の構成図である。この画像復号装置200は、実施の形態1に係る画像復号装置100に画質設定部22が付加された構成である。実施の形態1と同じ構成については同符号を付し、実施の形態1とは異なる構成と動作を説明する。
ユーザは、ROI領域および非ROI領域の画質の初期値を、画質設定部22からROI設定部20に設定することができる。また、動画再生中にも、ROI領域および非ROI領域の少なくとも一方の画質を所望のレベルに変更することができる。逆量子化部14は、この変更に応じて、ROI領域および非ROI領域の少なくとも一方に対応するウェーブレット変換係数のビット列において零値に置換する下位ビット数を調整する。これによれば、ROI領域と非ROI領域との間にユーザが意図するレベルの画質差を作ることができる。
また、画質設定部22は、再生速度に応じて、ROI領域および非ROI領域の少なくとも一方の画質を低下させることができる。すなわち、2倍速再生などがユーザにより選択された場合、符号化画像の完全な復号処理が間に合わない場合がある。そのような場合、たとえば、非ROI領域の画質を低下させて、処理量を軽減させる。これによれば、再生速度に関わらず、コマ落ちせずに動画像を再生することができる。
さらに、画質設定部22は、画像復号装置200が携帯電話機、PDA(Personal Digital Assistant)、携帯型DVD(Digital Video Disk)プレーヤ、および取り外し可能なカーナビゲーション装置などの携帯機器に搭載される場合、その機器の電池残量に応じて、ROI領域および非ROI領域の少なくとも一方の画質を低下させることができる。すなわち、電池残量が少なくなってきた場合、たとえば、非ROI領域の画質を低下させて、消費電力を低減させる。これによれば、電池残量が少なくなってからの画像再生可能時間を長くすることができる。
実施の形態3
図5は、実施の形態3に係る撮像装置300の構成図である。撮像装置300の例として、デジタルカメラ、デジタルビデオカメラ、監視カメラなどが挙げられる。
撮像部310は、たとえばCCD(Charge Coupled Device)などを備え、被写体からの光を取り込んで電気信号に変換し、符号化ブロック320に出力する。符号化ブロック320は、撮像部310から入力された原画像を符号化し、符号化された画像を記憶部330に格納する。符号化ブロック320に入力される原画像は、動画像フレームであってもよく、動画像フレームが連続的に符号化され、記憶部330に格納されてもよい。
復号ブロック340は、符号化画像を記憶部330から読み出し、復号して表示部350に与える。記憶部330から読み出される符号化画像は、動画像の符号化フレームであってもよい。復号ブロック340は、実施の形態1または2の画像復号装置100、200の構成をもち、記憶部330に格納された符号化画像を復号する。操作部360から画面上に設定されたROI領域の情報を受け取り、ROI領域を優先的に復号し、ROI領域と非ROI領域の画質が異なる復号画像を生成する。
表示部350は、液晶ディスプレイまたは有機ELディスプレイなどを備え、復号ブロック340により復号された画像をそこに表示する。操作部360は、ユーザ操作により、表示部350の画像内においてROI領域や注目するオブジェクトを指定することができる。たとえば、ユーザは、画像内のカーソルや枠を十字キーなどで移動させたり、タッチパネル方式のディスプレイを採用して、スタイラスペンなどで指定してもよい。操作部360は、その他、シャッターボタンや各種の操作ボタンを搭載してもよい。
この態様によれば、ユーザの注目するオブジェクトを容易に際立たせることができる撮像装置を提供することができる。また、ROI領域だけを優先的に復号するため、通常の復号処理より処理量を減らすことができる。したがって、処理を高速化することができ、また、消費電力を削減することもできる。特に、デジタルカメラ、デジタルビデオカメラなどは、消費電力を削減することにより、撮影可能時間を延ばすことができる。
次に、実施の形態3の変形例を説明する。この例は、符号化ブロック320でROI領域を優先的に符号化し、ROI領域と非ROI領域の画質が異なる符号化画像を生成し、復号ブロック340でその符号化画像を復号する例である。
図6は、実施の形態3の変更例に係る符号化ブロック320の構成図である。符号化ブロック320は、入力された原画像を一例としてJPEG2000方式により圧縮符号化する。
ウェーブレット変換部30は、撮像部310から入力された原画像をサブバンド分割して、各サブバンド画像のウェーブレット変換係数を計算し、階層化されたウェーブレット変換係数を生成する。具体的には、ウェーブレット変換部30は、原画像のx、yそれぞれの方向においてローパスフィルタおよびハイパスフィルタを適用し、4つの周波数サブバンドへ分割してウェーブレット変換する。これらのサブバンドは、x、yの両方向において低周波成分を有するLLサブバンドと、x、yのいずれかひとつの方向において低周波成分を有し、かつもう一方の方向において高周波成分を有するHLおよびLHサブバンドと、x、yの両方向において高周波成分を有するHHサブバンドである。各サブバンドの縦横の画素数は処理前の画像のそれぞれ1/2であり、一回のフィルタリングで解像度、すなわち画像サイズが1/4のサブバンド画像が得られる。
ウェーブレット変換部30は、こうして得られたサブバンドのうち、LLサブバンドに対して再度フィルタリング処理を行って、これをさらにLL、HL、LH、HHの4つのサブバンドに分割してウェーブレット変換する。ウェーブレット変換部30は、このフィルタリングを所定の回数行って、原画像をサブバンド画像に階層化し、各サブバンドのウェーブレット変換係数を出力する。量子化部32は、ウェーブレット変換部30から出力されたウェーブレット変換係数を所定の量子化幅で量子化する。
動き検出部38およびROI設定部40の構成と動作は、実施の形態1、2の画像復号装置100、200のものと基本的に同様である。以下、相違点を述べる。ROI設定部40は、ROI設定情報を量子化部32および符号化データ生成部36に出力して、ROI符号化を行う。ROI符号化には、画像のROI領域に対応するROI変換係数のビットプレーンを非ROI変換係数のビットプレーンの最大ビット数だけスケールアップするマックスシフト法がある。この手法によれば、ROI変換係数の全ビットプレーンがどの非ROI変換係数のビットプレーンよりも先に符号化される。
まず、マックスシフト法によりROI符号化を行う例を説明する。図7(a)は、量子化後のウェーブレット変換係数50を示し、MSBからLSBで5ビットの各ビットプレーンを含む。
ROI設定部40は、ROI領域の位置情報をもとに、原画像上のROI領域を設定し、ROI変換係数を特定するためのROIマスクを生成する。ROI変換係数は、図7(a)のウェーブレット変換係数50において斜線で示されている。
量子化部32は、上記ROIマスクを用いて、量子化後のROI変換係数をSビットだけスケールアップする。すなわち、ROI変換係数の値をSビットだけ左シフトする。ここで、スケールアップ量Sは、非ROI変換係数の量子化値の最大値のビット数よりも大きい自然数である。図7(b)は、ROI変換係数が5ビットだけスケールアップされた状態のウェーブレット変換係数52を示す。スケールアップ後のウェーブレット変換係数52において、スケールアップにより新たに生じた桁には零値が充当される。
エントロピー符号化部34は、図7(c)の矢印に示すように、スケールアップされたウェーブレット変換係数52の量子化値を上位ビットブレーンから順にスキャンしながらエントロピー符号化する。
符号化データ生成部36は、位置やスケールアップ量などのROI設定情報をROI設定部40から得て、および量子化幅などのヘッダ生成のための情報をエントロピー符号化部34から得て、ヘッダを生成する。また、エントロピー符号化されたデータをストリーム化して、符号化画像を記憶部330に出力する。その後、記憶部330の符号化画像は、記録媒体やネットワークに出力可能となる。ここで、記録媒体に、SDRAMやフラッシュハードディスクドライブなどを用いることができる。
以上説明したようにマックスシフト法によりROI符号化すると、符号量を削減するために符号化を途中までしか行わなくても、ROI領域のビットプレーンが優先的に符号化されるため、ROI領域の画質を非ROI領域の画質より高画質にすることができる。
次に、ビットプレーンを削減してROI符号化を行う例を説明する。ROI設定部40は、図2で説明した手法により、ROIマスク生成する。量子化部32は、量子化後に、画質設定の優先度に応じて、非ROI領域に対応する上記ウェーブレット変換係数のビット列において零値に置換する下位ビット数を調整する。ROI設定部40により生成されたROIマスクを参照して、ROIマスクによってマスクされない非ROI変換係数のビット列において最下位ビットから数えてSビットだけを零に置換する。ここで、零置換ビット数Sは、非ROI領域における量子化値の最大ビット数を上限とする任意の自然数である。この零置換ビット数Sを変化させることにより、ROI領域に対する非ROI領域の再生画質の劣化度合いを連続的に調整することができる。
図8(a)〜(c)は、量子化部32により原画像のウェーブレット変換係数60の下位ビットが零置換される様子を説明する図である。図8(a)は、量子化後のウェーブレット変換係数60を示し、5ビットプレーンを含み、ROI変換係数は斜線で示されている。
図8(b)に示すように、量子化部32は、ROIマスクによりマスクされていない非ROI変換係数のLSB側のSビットを零に置換する。この例では、S=2であり、符号64で示すように、非ROI変換係数のLSB側の2ビットが零に置換されたウェーブレット変換係数62が得られる。なお、下位2ビットプレーンを零置換する代わりに、単に下位2ビットプレーンを破棄してもよい。
エントロピー符号化部34は、図8(c)の矢印に示すように、ROI変換係数と零置換された非ROI変換係数を含むウェーブレット変換係数62を上位ビットプレーンから順にスキャンしながらエントロピー符号化する。
符号化データ生成部36は、量子化幅などの符号化パラメータをもとにヘッダを生成する。また、エントロピー符号化されたデータをストリーム化して、記憶部330に出力する。
一般に、記憶容量や伝送レートの制限などにより最終的な符号化画像のデータサイズに上限が設定されている場合、エントロピー符号化部34は、量子化されたウェーブレット変換係数を上位ビットプレーンから順に符号化する際、データサイズの上限を守るべく途中のビットプレーンで符号化を打ち切ることがある。あるいは、符号化データ生成部36が、上位ビットプレーンから順にストリーム化された符号化データを出力する際、伝送レートの制限を守るべく途中のビットプレーンでストリーム出力を打ち切ることがある。
このように符号化画像のデータサイズに制約がある場合でも、下位のビットプレーンにおいては、非ROI領域に対応するウェーブレット変換係数は零置換されており、ROI領域に対応するウェーブレット変換係数だけが有意な情報として符号化の対象とされているため、下位のビットプレーンの圧縮効率は高く、最下位ビットプレーンまで符号化してもデータサイズが大きく増えることがない。
以上説明したように、ビットプレーンを削減する符号化手法は、ROI変換係数のスケールアップ処理をしないため、効率的に符号化の演算を行うことができる。また、符号化すべきビットプレーン数は増えないため、記憶領域を余分に設ける必要がなく、ハードウエアコストを削減することができる。
また、復号時のスケールダウン処理が不要であるため、符号化画像データのヘッダにROI位置情報とスケールアップ量を符号化データに付加する必要がない。さらに、この手法でROI符号化された画像は、通常の符号化画像とフォーマット上は区別がないため、通常の符号化画像の復号処理と全く同一の処理で復号することができ、復号処理の互換性を保つことができる。
以上説明したように、実施の形態3の変形例によれば、復号ブロック340がROI領域を優先的に復号し、ROI領域と非ROI領域の画質が異なる復号画像を生成する場合の効果に加えて、符号化画像の符号量を低減することができる。
図9は、以上に説明してきたROI領域の追従処理の第1例を示す図である。図9(a)は、画像内においてユーザが注目するオブジェクトを指定している様子を示す。十字のカーソルでユーザが注目する人物Aを指定している。図9(b)は、画像内においてROI領域を設定している様子を示す。枠に囲まれている領域がROI領域である。ROI領域は、ユーザ操作により初期設定されてもよいし、指定されたオブジェクトを含む所定の領域に自動で初期設定されてもよい。図9(c)は、人物Aが移動し、ROI領域から外れた様子を示す。図9(d)は、人物Aの動きにROI領域も追従している様子を示す。人物Aの動きベクトルを検出して、それに対応させてROI領域も移動させる。
図10は、ROI領域の追従処理の第2例を示す図である。図10(a)は、第1例の手順と異なり、画像内においてユーザがROI領域を設定している様子を示す。人物Aおよび人物Bの内、人物Aをユーザが注目するオブジェクトに設定している。なお、ROI領域は複数設定してもよい。図10(b)は、ROI領域内においてユーザが注目するオブジェクトを指定している様子を示す。ユーザが指定してもよいし、自動で認識してもよい。図10(c)は、人物Aが移動し、その動きにROI領域が追従している様子を示す。人物Bの動きはユーザが注目するオブジェクトに指定していないのでROI領域の移動に影響しない。
図11は、ROI領域の追従処理の第3例を示す図である。図11(a)は、ROI領域が追従する範囲を設定している様子を示す。図中の大枠がその範囲を示す。図11(b)は、ROI領域を設定している様子を示す。このROI領域は、設定した大枠の中でしか移動しない。図11(c)は、人物Aが移動し、大枠の外に出てしまった様子を示す。ROI領域は、大枠の範囲で人物Aの追従を行うため、途中で追従終了となる。なお、ユーザの注目するオブジェクトが大枠を出たら、撮影などを終了する処理にしてもよい。たとえば、監視カメラの場合、一定範囲の領域に侵入した人物を特に記録することが必要であり、その範囲内で人物などのオブジェクトの画質が維持されていればよい。第3例はこのような場合に適用でき、第1例および第2例より処理量をさらに削減することができる。
なお、実施の形態3に係る撮像装置300は、指定されたオブジェクトにROI領域を追従させる処理をしながら、動画像を撮影して記録媒体に記録などできることはいうまでもない。また、その最中にユーザが操作部360から操作して、ROI領域の設定解除、再設定を行ってもよい。ROI領域が解除されると、画像内のすべての領域が同じビットレートで符号化される。なお、ユーザのその操作により動画像撮影が一時停止、再開してもよい。さらに、指定されたオブジェクトにROI領域を追従させる処理中に、ユーザが操作部360のシャッターボタンを押下などすることにより、静止画を撮影できてもよい。その静止画は、ROI領域が高画質で、非ROI領域が低画質のものとなる。
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。そのような変形例を以下に示す。
上記の実施の形態では、JPEG2000方式で連続的に符号化した動画像の符号化ストリームを復号しているが、JPEG2000方式に限らず、要は、動画像の符号化ストリームを復号する方式であればよい。
上記の実施の形態において、ユーザがROI設定部20、40に複数のROI領域を設定する場合、ROI領域ごとに異なる画質を設定してもよい。非ROI変換係数の下位ビットの零置換数を調整することにより、種々のレベルの画質を実現することができる。
上記の実施の形態では、符号化画像の復号後におけるウェーブレット変換係数の下位ビットを零置換することにより、ROI領域と非ROI領域とを異なる画質にした。この点、パス毎に独立して符号化されている場合には、可変長の復号を途中で打ち切る手法を用いることができる。JPEG2000方式では、ビットプレーン内の各係数ビットとして、Sパス(significance propagation pass)、Rパス(magnitude refinement pass)、Cパス(cleanup pass)の3種類の処理パスが使用される。Sパスでは、有意である係数が周囲に存在する有意でない係数の復号が行われ、Rパスでは、有意である係数の復号が行われ、Cパスでは、残りの係数の復号が行われる。Sパス、Rパス、Cパスの各処理パスはこの順に画像の画質への寄与度が大きい。各処理パスはこの順に実行され、各係数のコンテクストが近傍係数の情報を考慮して決定される。この手法によれば、零置換する必要もないため、処理量をさらに少なくすることができる。
上記の実施の形態において、画像の符号化のための空間フィルタリングとしてウェーブレット変換を説明したが、他の空間周波数変換を用いてもよい。たとえば、JPEG標準で用いられる離散コサイン変換の場合でも、同様の方法で非ROI領域の変換係数の下位ビットを零置換することで、非ROI領域の画質を犠牲にして画像全体の圧縮効率を高め、同時にROI領域の画質を相対的に高めることができる。
実施の形態1に係る画像復号装置の構成を示す図である。 (a)は原画像上にROI領域を選択した状態を示し、(b)は原画像を1回だけウェーブレット変換することにより得られる第1階層の変換画像を示し、(c)は(b)の変換画像のサブバンドLL1をさらにウェーブレット変換することにより得られる第2階層の変換画像を示す。 (a)は復号画像のウェーブレット変換係数を示し、(b)はROI変換係数および非ROI変換係数を示し、(c)は非ROI変換係数の下位2ビットを零に置換している様子を示す。 実施の形態2に係る画像復号装置の構成を示す図である。 実施の形態3に係る撮像装置の構成を示す図である。 実施の形態3に係る符号化ブロックの構成を示す図である。 (a)はウェーブレット変換係数を示し、(b)はROI変換係数が5ビットだけスケールアップされた状態を示し、(c)はスケールアップされたウェーブレット変換係数の量子化値を上位ビットブレーンから順にスキャンしている様子を示す。 (a)はウェーブレット変換係数を示し、(b)は非ROI変換係数のLSB側のSビットを零に置換する様子を示し、(c)はROI変換係数と零置換された非ROI変換係数を含むウェーブレット変換係数を上位ビットプレーンから順にスキャンしている様子を示す。 (a)は画像内においてユーザが注目するオブジェクトを指定している様子を示し、(b)は画像内においてROI領域を設定している様子を示し、(c)はオブジェクトがROI領域から外れた様子を示し、(d)はオブジェクトの動きにROI領域が追従している様子を示す。 (a)は画像内においてユーザがROI領域を設定している様子を示し、(b)はROI領域内においてユーザが注目するオブジェクトを指定している様子を示し、(c)はオブジェクトの動きにROI領域が追従している様子を示す。 (a)はROI領域が追従する範囲を設定している様子を示し、(b)はROI領域を設定している様子を示し、(c)はオブジェクトが移動し大枠の外に出てしまった様子を示す。
符号の説明
10 符号化データ抽出部、 12 エントロピー復号部、 14 逆量子化部、 16 ウェーブレット逆変換部、 18 動き検出部、 20 ROI設定部、 22 画質設定部、 30 ウェーブレット変換部、 32 量子化部、 34 エントロピー符号化部、 36 符号化データ生成部、 38 動き検出部、 40 ROI設定部、 100 画像復号装置、 200 画像復号装置、 300 撮像装置、 300 撮像部、 320 符号化ブロック、 330 記憶部、 340 復号ブロック、 350 表示部、 360 操作部。

Claims (6)

  1. 画像内に注目領域を設定し、前記画像内の注目するオブジェクトの動きに前記注目領域を追従せしめ、前記注目領域とそれ以外の領域とで異なる画質で動画像を復号することを特徴とする画像復号方法。
  2. 画像内に注目領域を設定する注目領域設定部と、
    前記画像内の注目するオブジェクトの動きを検出する動き検出部と、
    前記注目領域とそれ以外の領域とで異なる画質で動画像を復号する復号部と、を有し、
    前記注目領域設定部は、前記オブジェクトの動きに前記注目領域を追従せしめることを特徴とする画像復号装置。
  3. 前記注目領域および該注目領域以外の領域の少なくとも一方の画質を、本装置の状態を参照して設定する画質設定部をさらに有することを特徴とする請求項2に記載の画像復号装置。
  4. 画像を取得する撮像部を有し、
    前記画像内に注目領域を設定し、前記画像内の注目するオブジェクトの動きに前記注目領域を追従せしめ、前記注目領域とそれ以外の領域とで異なる画質で動画像を表示することを特徴とする撮像装置。
  5. 画像を取得する撮像部と、
    前記画像内に注目領域を設定する注目領域設定部と、
    前記画像内の注目するオブジェクトの動きを検出する動き検出部と、
    前記注目領域とそれ以外の領域とで異なる画質で動画像を符号化する符号化部と、
    前記符号化部により符号化された画像データを復号する復号部と、を有し、
    前記注目領域設定部は、前記オブジェクトの動きに前記注目領域を追従せしめることを特徴とする撮像装置。
  6. 前記注目領域および該注目領域以外の領域の少なくとも一方の画質を、本装置の状態を参照して設定する画質設定部をさらに有することを特徴とする請求項4または5に記載の撮像装置。
JP2004251939A 2004-06-29 2004-08-31 画像復号方法、画像復号装置および撮像装置 Pending JP2006074130A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004251939A JP2006074130A (ja) 2004-08-31 2004-08-31 画像復号方法、画像復号装置および撮像装置
US11/168,671 US7720295B2 (en) 2004-06-29 2005-06-29 Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality
US12/621,952 US20100135587A1 (en) 2004-06-29 2009-11-19 Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004251939A JP2006074130A (ja) 2004-08-31 2004-08-31 画像復号方法、画像復号装置および撮像装置

Publications (1)

Publication Number Publication Date
JP2006074130A true JP2006074130A (ja) 2006-03-16

Family

ID=36154320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004251939A Pending JP2006074130A (ja) 2004-06-29 2004-08-31 画像復号方法、画像復号装置および撮像装置

Country Status (1)

Country Link
JP (1) JP2006074130A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008187260A (ja) * 2007-01-26 2008-08-14 Nikon Corp 撮像装置
JP2008245033A (ja) * 2007-03-28 2008-10-09 Institute Of National Colleges Of Technology Japan 被写界深度制御方法、画像処理装置及びプログラムと記録媒体
JP2009260892A (ja) * 2008-04-21 2009-11-05 Canon Inc 画像処理装置及びその制御方法及びプログラム
JP2010256536A (ja) * 2009-04-23 2010-11-11 Sharp Corp 画像処理装置及び画像表示装置
JP2011502385A (ja) * 2007-10-19 2011-01-20 クゥアルコム・インコーポレイテッド 動き支援されたイメージセンサコンフィギュレーション
CN103618910B (zh) * 2013-12-02 2017-01-18 广东威创视讯科技股份有限公司 图像转换方法及装置
CN107820086A (zh) * 2016-09-12 2018-03-20 瑞萨电子株式会社 半导体装置、移动图像处理系统、控制半导体装置的方法
CN113473138A (zh) * 2021-06-30 2021-10-01 杭州海康威视数字技术股份有限公司 视频帧编码方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288806A (ja) * 1994-04-20 1995-10-31 Hitachi Ltd 動画像通信システム
JPH10327409A (ja) * 1997-03-26 1998-12-08 Fujitsu Ltd 画像表示装置およびそのプログラム記憶媒体
WO2003034740A1 (en) * 2001-10-16 2003-04-24 Koninklijke Philips Electronics N.V. Selective decoding of enhance video stream
JP2003299033A (ja) * 2002-04-05 2003-10-17 Canon Inc 画像再生装置及び画像再生方法
JP2004240844A (ja) * 2003-02-07 2004-08-26 Ricoh Co Ltd 画像処理装置、roi領域制御方法、プログラム、及び、記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288806A (ja) * 1994-04-20 1995-10-31 Hitachi Ltd 動画像通信システム
JPH10327409A (ja) * 1997-03-26 1998-12-08 Fujitsu Ltd 画像表示装置およびそのプログラム記憶媒体
WO2003034740A1 (en) * 2001-10-16 2003-04-24 Koninklijke Philips Electronics N.V. Selective decoding of enhance video stream
JP2003299033A (ja) * 2002-04-05 2003-10-17 Canon Inc 画像再生装置及び画像再生方法
JP2004240844A (ja) * 2003-02-07 2004-08-26 Ricoh Co Ltd 画像処理装置、roi領域制御方法、プログラム、及び、記録媒体

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008187260A (ja) * 2007-01-26 2008-08-14 Nikon Corp 撮像装置
JP2008245033A (ja) * 2007-03-28 2008-10-09 Institute Of National Colleges Of Technology Japan 被写界深度制御方法、画像処理装置及びプログラムと記録媒体
JP2011502385A (ja) * 2007-10-19 2011-01-20 クゥアルコム・インコーポレイテッド 動き支援されたイメージセンサコンフィギュレーション
JP2009260892A (ja) * 2008-04-21 2009-11-05 Canon Inc 画像処理装置及びその制御方法及びプログラム
JP2010256536A (ja) * 2009-04-23 2010-11-11 Sharp Corp 画像処理装置及び画像表示装置
CN103618910B (zh) * 2013-12-02 2017-01-18 广东威创视讯科技股份有限公司 图像转换方法及装置
CN107820086A (zh) * 2016-09-12 2018-03-20 瑞萨电子株式会社 半导体装置、移动图像处理系统、控制半导体装置的方法
JP2018046332A (ja) * 2016-09-12 2018-03-22 ルネサスエレクトロニクス株式会社 半導体装置、動画像処理システム、半導体装置の制御方法
CN107820086B (zh) * 2016-09-12 2023-08-18 瑞萨电子株式会社 半导体装置、移动图像处理系统、控制半导体装置的方法
CN113473138A (zh) * 2021-06-30 2021-10-01 杭州海康威视数字技术股份有限公司 视频帧编码方法、装置、电子设备及存储介质
CN113473138B (zh) * 2021-06-30 2024-04-05 杭州海康威视数字技术股份有限公司 视频帧编码方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US7720295B2 (en) Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality
JP4578197B2 (ja) 画像表示装置
JP4656912B2 (ja) 画像符号化装置
US20060045381A1 (en) Image processing apparatus, shooting apparatus and image display apparatus
US8665943B2 (en) Encoding device, encoding method, encoding program, decoding device, decoding method, and decoding program
JP2006014121A (ja) 画像符号化方法、画像符号化装置および撮像装置
JPWO2007066710A1 (ja) 符号化装置、符号化方法および符号化プログラム、ならびに、復号装置、復号方法および復号プログラム
US10032252B2 (en) Image processing apparatus, image capturing apparatus, image processing method, and non-transitory computer readable storage medium
WO2006046550A1 (ja) 画像符号化方法および装置、ならびに画像復号方法および装置
US7542611B2 (en) Image processing apparatus and method for converting first code data sets into second code data for JPEG 2000 and motion JPEG 2000
JP2006074130A (ja) 画像復号方法、画像復号装置および撮像装置
JP4841504B2 (ja) 画像符号化装置および方法
JP2006074114A (ja) 画像処理装置及び撮像装置
JP2005223852A (ja) 画像符号化装置および方法、ならびに画像復号装置および方法
JP4749508B2 (ja) 画像復号方法
JP4514464B2 (ja) 画像符号化装置および画像復号装置、ならびにそれらを利用可能な画像表示装置および方法
JP4241463B2 (ja) 画像処理装置
JP2002252759A (ja) 画像量子化方法と装置、およびそれらを利用可能な画像符号化装置
JP4667424B2 (ja) 画像復号装置
JP4667423B2 (ja) 画像復号装置
JP3897253B2 (ja) 画像処理方法、画像処理装置、撮像装置、プログラム及び記録媒体
JP2004214983A (ja) 画像処理方法
JP4280613B2 (ja) 動画像再生装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4136680B2 (ja) 撮像装置、撮像方法、コンピュータプログラム及び記録媒体
JP2004056575A (ja) 動画像符号化装置及び動画像復号装置並びにそれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061012

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090924

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100309