JP4651103B2 - 画像処理装置、画像処理方法 - Google Patents

画像処理装置、画像処理方法 Download PDF

Info

Publication number
JP4651103B2
JP4651103B2 JP2005339213A JP2005339213A JP4651103B2 JP 4651103 B2 JP4651103 B2 JP 4651103B2 JP 2005339213 A JP2005339213 A JP 2005339213A JP 2005339213 A JP2005339213 A JP 2005339213A JP 4651103 B2 JP4651103 B2 JP 4651103B2
Authority
JP
Japan
Prior art keywords
encoding
frame
image
imaging
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005339213A
Other languages
English (en)
Other versions
JP2007150458A (ja
JP2007150458A5 (ja
Inventor
雅彦 高久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005339213A priority Critical patent/JP4651103B2/ja
Publication of JP2007150458A publication Critical patent/JP2007150458A/ja
Publication of JP2007150458A5 publication Critical patent/JP2007150458A5/ja
Application granted granted Critical
Publication of JP4651103B2 publication Critical patent/JP4651103B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、撮像した画像を符号化して取得するための技術に関するものである。
近年、ネットワークの広帯域化や記録メディアの大容量化が進み、広く一般的に動画像が扱われるようになってきている。このような動画を取り扱う機器の普及の背景のひとつが、映像の圧縮符号化技術の進歩である。圧縮符号化技術は日々進歩しており、MPEG(Moving Picture Expert Group)に代表される、画像フレーム(ピクチャ)間の参照を用いた予測符号化方式などにより、極めて高圧縮で高品位な動画符号化が可能となった。
しかしながら、高圧縮で高品位な動画符号化は、たとえそれが厳格に定義された標準規格であったとしても、決められた方法によって常に一定の品質で符号化を行えるものではない。その規格化されたアルゴリズムに対して、符号化を適切に制御する事によって、より高圧縮で高品位な符号化された動画を得ることができる。このような符号化の制御方法を符号化制御や符号量制御と呼んでいる。
最も典型的な符号化制御の考え方のひとつが、VBR(Variable Bit-rate)やCBR(Constant Bit-rate)と呼ばれる圧縮符号化時に生成される符号データの量を制御する考え方である。この生成される符号データの量を制御するアルゴリズムには、例えばTM5などの名称で呼ばれるMPEGの手法など様々なものがある。こうした広く知られた方法の目的は、ある画像の符号データ量を、目標とするデータ量により正確に近づけることを主眼としたものであることが一般的である。
一方で、映像データの重要な領域に着目し、その重要な領域の画質を高めながら全体としての圧縮率を高めることも符号化制御の考え方のひとつとなっている。例えば、人物を撮影した映像において、背景よりも重要となる人物の部分により多くの符号量を割り当てるといった考え方である。
従来、このような着目領域を用いて符号化制御を実行するものには、例えば、画表示部を観察する観察者の視線を追跡し、その視線データに基づいて、観察者の視線近傍である中心視線の画像を低圧縮とするものがあった(特許文献1参照)。
あるいはまた、入力された音声信号を用いて音源方向を検出することにより、この音源方向を着目領域としてより多くの符号量を割り当てる技術も知られている(特許文献2参照)。
更に、MPEG(Moving Picture Expert Group)に代表される、画像フレーム(ピクチャ)間の参照を用いた予測符号化方式において特長的な動きベクトル探索に関して、対応する動き補償や符号化モードの決定を効率的に行うために、撮像手段の動き情報を用いる技術もある(特許文献3参照)。
特許第3263278号 特開2002−27455号公報 特開2000−92499号公報
しかしながら、従来の着目領域を用いて符号化制御を実行するものでは、この着目領域に割り当てる符号量を多くすることにより、着目領域自体の画質を向上させることはできるものの、動画像全体の総合的な画質を向上させることが必ずしも容易でないという問題があった。
例えば、より具体的には、着目領域を観察者の視線により決定する場合においては、複数の観察者には十分に対応することが出来ない。また、音源の方向を着目領域とする場合においても、ランダムに発生する音源に対して十分に対応することが出来ない。
すなわち、こうした方法は、特に着目している瞬間ごとの領域の画質を向上させることには適しているが、広く一般的に参照される画像に対して、均質な画質の向上を図る目的においては十分ではないという課題があった。
また、動画像は連続した画像フレームであり、予測符号化方式では、前後の画像フレーム間の相関により効果的な圧縮符号化を行うが、このような瞬間毎の着目領域による符号化の制御の場合、着目領域自体の相関は必ずしも高いとは言えない。そのため、符号化効率を高めることは困難であるという問題もあった。このことは、結果として、動画像の総合的な画質を劣化させてしまう可能性を意味している。
本発明は以上の問題に鑑みてなされたものであり、撮像する装置の動き情報に基づいて、動画像の圧縮符号化効率を向上させるための技術を提供することを目的とする。
本発明の目的を達成するために、例えば、本発明の画像処理装置は以下の構成を備える。
即ち、動画像を撮像する撮像手段と、
前記撮像手段の動き量を取得する取得手段と、
前記撮像手段より得られた各フレームの画像を符号化する符号化手段とを備え、
前記符号化手段は、
前記撮像手段が第1フレームを撮像してから、当該第1フレームと隣接している第2フレームを撮像するまでに動いた動き量に基づいて、当該第1フレーム内の各部を符号化するために用いる符号化パラメータを制御する制御手段と、
前記第1フレーム内の各部を、当該各部毎に制御された符号化パラメータを用いて符号化する符号化制御手段と
を備え
前記制御手段は、
前記撮像手段の回転角、画角、撮像幅に基づいて、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域を特定する特定手段と、
前記特定手段が特定した領域に割り当てる符号量を、当該領域以外の領域に割り当てる符号量よりも相対的に小さくするように符号化パラメータを制御する符号化パラメータ制御手段と
を備え、
前記特定手段は、
画角=θ、回転角=Φ、撮像幅=L、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域の幅=dとおくと、以下の式
d/L=(1−(sin((θ/2)−Φ)/sin(θ/2)))/2
を計算する手段と、
前記回転角、及び前記計算により求めたdに基づいて、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域を特定する手段と
を備えることを特徴とする。
本発明の目的を達成するために、例えば、本発明の画像処理方法は以下の構成を備える。
即ち、動画像を撮像する撮像手段の動き量を取得する取得工程と、
前記撮像手段より得られた各フレームの画像を符号化する符号化工程とを備え、
前記符号化工程は、
前記撮像手段が第1フレームを撮像してから、当該第1フレームと隣接している第2フレームを撮像するまでに動いた動き量に基づいて、当該第1フレーム内の各部を符号化するために用いる符号化パラメータを制御する制御工程と、
前記第1フレーム内の各部を、当該各部毎に制御された符号化パラメータを用いて符号化する符号化制御工程と
を備え
前記制御工程は、
前記撮像手段の回転角、画角、撮像幅に基づいて、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域を特定する特定工程と、
前記特定工程で特定した領域に割り当てる符号量を、当該領域以外の領域に割り当てる符号量よりも相対的に小さくするように符号化パラメータを制御する符号化パラメータ制御工程と
を備え、
前記特定工程は、
画角=θ、回転角=Φ、撮像幅=L、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域の幅=dとおくと、以下の式
d/L=(1−(sin((θ/2)−Φ)/sin(θ/2)))/2
を計算する工程と、
前記回転角、及び前記計算により求めたdに基づいて、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域を特定する工程と
を備えることを特徴とする。
本発明の構成により、撮像する装置の動き情報に基づいて、動画像の圧縮符号化効率を向上させることができる。
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
[第1の実施形態]
図1は、本実施形態に係る画像処理装置を適用したディジタルカメラの機能構成を示すブロック図である。同図に示す如く、本実施形態に係るディジタルカメラは、撮像ユニット101、アクチュエータユニット102、符号圧縮回路103、符号データ出力ユニット104により構成されている。
撮像ユニット101は、現実空間の動画像を撮像するものであり、撮像した各フレームの画像は符号圧縮回路103に出力する。アクチュエータユニット102は、撮像ユニット101を移動させたり、回転させたりためのものである。符号圧縮回路103は、撮像ユニット101から入力した各フレームの画像を圧縮符号化し、圧縮符号化した結果を順次符号データ出力ユニット104に出力する。符号データ出力ユニット104は、圧縮符号化結果を所定の出力先に出力する。
以下、上記各部についてより詳細に説明する。
撮像ユニット101は、一般的には、光学レンズやCCD等の光学センサ等から構成されるカメラの基本部分をなすものである。撮像ユニット101により撮像された各フレームの画像は、画像信号として符号圧縮回路103に出力する。
アクチュエータユニット102は、撮像ユニット101を回転させたり、移動させたりすることによって、撮像方向を制御する。このような機構は、所謂通常のディジタルカメラでは一般的ではないが、例えば監視用や遠隔地の確認用などの目的で、設置場所を固定して利用する形態として広く普及しつつある。また、個人用のカメラとしても、三脚などに固定してカメラを回転させる機構をもつものが実際に商品化されている。回転する機構の場合、たとえば、水平方向に回転するパン機構や、垂直方向に回転するチルト機構などが、その最も典型的な例である。
符号圧縮回路103は、撮像ユニット101から入力した画像信号に対してA/D変換を行い、この画像信号を画像データとして得る。そして、この得た画像データに対して圧縮符号化処理を行う。連続した映像である動画の圧縮符号化方式としては、MPEG-4などの方式が広く知られている。
符号データ出力ユニット104は、符号圧縮回路103による圧縮符号化結果を所定の出力先に出力するのであるが、典型的には、ディジタルカメラの記録媒体としてのメモリカードに記録・保管したり、通信回路を有する場合には、ネットワーク上に出力する。
図2は、図1に示した構成を有するディジタルカメラの、より詳細な構成を示すブロック図である。
撮像対象の像は、光学系からなる撮影レンズユニット211、絞りユニット212を通って光学センサ213に結像する。撮影レンズユニット211は、例えば焦点を合わせるためにモータ等でもって構成されており、レンズ群を移動する構成を有する。絞りユニット212は、絞りが制御可能な機構を有している。そして、これらの撮影レンズユニット211、絞りユニット212の動作制御は、駆動回路216が行う。
従って駆動回路216が撮影レンズユニット211、絞りユニット212を適切に制御することで、光学センサ213に到達(結像)する光は適切に光量調整されたものとなる。光学センサ213は、固体撮像素子(CCDやCMOSセンサなど)によって構成され、入射した光を光量に応じて電荷に変換、蓄積する。そして光学センサ213は、この蓄積された電荷を読み出し、画像信号としてA/Dコンバータ214に送出する。
ここで、光学センサ213の動作は、駆動回路217が出力するパルス信号などによって適切に制御されている。即ち、指示されたタイミングで指示された時間の間に蓄積された電荷を読み出す一連の動作を連続する。これにより、連続した画像が得られることになる。このようにして取得された連続画像は、言うまでもなく動画像である。
次に、A/Dコンバータ214は、光学センサ213から受けた画像信号に対してA/D変換を行い、ディジタルデータ(画像データ)として画像信号処理回路215に送出する。画像信号処理回路215は、A/Dコンバータ214から受けた画像データを用いて、ホワイトバランス補正やガンマ補正といった画像補正を行う。このようにして処理され、適切な形式となった画像は、符号圧縮回路103に送出される。
なお、このような処理間の画像データの受け渡しは、たとえばDMA(Direct Memory Access)回路を利用した高速なメモリ251を用いたアクセスにより行われることで、リアルタイムでの大量のデータ処理を可能ならしめる工夫がなされていてもよい。
符号圧縮回路103は、画像信号処理回路215から入力した画像データに対して圧縮符号化処理を行う。これを各フレームの画像について行うので、結果として動画像に対する圧縮符号化処理を行うことになる。この圧縮符号化方式には様々なものを用いることができる。
例えば、連続したJPEG(ISO/IEC 10918)符号化による、所謂モーションJPEG画像では、画像信号処理回路215からの入力画像データがRGB画像データである場合、輝度信号Yとクロマ信号CbCrからなるYC信号化する。そして、これらを8x8画素のブロックに分割したのち、離散コサイン変換、量子化、ハフマン符号化といった処理を行い、最終的な圧縮画像を出力する。
或いは、圧縮符号化方式がMPEG-2(ISO/IEC 13818)やMPEG-4(ISO/IEC 14496)などのフレーム間予測を行う形式である場合、圧縮しようとする特定の1枚の画像(フレーム)に対し、前後のフレームを参照しながら、動き補償予測、マクロブロック処理等を行い、前後が相互に依存した圧縮画像(ビットストリーム)を出力する。
符号圧縮回路103による符号化処理について詳しくは後述する。符号圧縮回路103は、圧縮符号化処理の結果を圧縮符号化データとしてメモリ251に送出するので、メモリ251には圧縮符号化されたフレームの画像データが保持されていることになる。そしてこの圧縮符号化データは適宜CPU252による制御に従って適宜符号データ出力ユニット104内の符号データ出力回路241に送出される。
符号データ出力回路241は、受けた圧縮符号化データを記憶装置243や通信回路242に送出する。記憶装置243は、CD-RやDVD-Rといった記録型光学ディスク、光磁気ディスク等の記録媒体に記録された情報を読み取る記録媒体ドライブ装置や、ハードディスク等により構成されており、符号データ出力回路241から受けた圧縮符号化データを保存する。
一方、通信回路242は、受けた圧縮符号化データを通信に最適なRTPパケット等の通信パケット形式に変換し、ネットワーク上に送出するためのものである。なお、このネットアークについては様々なものが考えられ、特に限定するものではない。
なお、ここでは圧縮符号化データの出力先として、記憶装置243、若しくは通信回路242(ネットワーク)としたが、出力先には様々なものが考えられ、特に限定するものではない。
次に、アクチュエータユニット102について説明する。アクチュエータユニット102は同図に示す如く、サーボ・モーターや超音波モーター等により撮像ユニット101を回転・移動させる為のアクチュエータ221とその駆動回路223、アクチュエータ221の動き量を検出する為の動き検出回路222により構成されている。
係る構成により、ネットワーク上の機器から、若しくは本装置に実装されたボタンから、撮像ユニット101を移動・回転させる要求が本装置に入力された場合、CPU252はこれを検知し、指示された移動・回転を行うよう駆動回路223に指示を送出する。駆動回路223はこの指示に基づいてアクチュエータ221を制御するので、アクチュエータ221は自身に接続されている撮像ユニット101を、要求された移動分、回転角分だけ移動・回転させる。また、動き検出回路222は、アクチュエータ221の動き量(ここでは移動・回転量)を検知し、所定タイミング毎に検知した動き量をメモリ251に記録する。
このように、アクチュエータユニット102による動作により、所定タイミング毎の撮像ユニット101の動き量をメモリ251に記録することができるので、適宜これを参照することができる。本実施形態では、このメモリ251に記録された動き量を用いて、符号圧縮回路103が行う圧縮符号化処理を制御する。
なお、以上説明した各部の動作制御はCPU252が管理している。更に、CPU252の動作則を記したプログラムは、ROM253に格納されている。従ってCPU252はこのROM253に格納されているプログラムやデータを用いて処理を実行することで、本装置全体の制御を行うと共に、本装置を構成する各部が行う上記各処理を実行することになる。
次に、符号圧縮回路103が行う圧縮符号化処理と、動き検出回路222が検出した撮像ユニット101の動き量との関係について説明する。図3は、撮像ユニット101の回転と、撮像画像との関係を示す図である。図3(a)は、撮像ユニット101を真上から見た場合の図で、撮像ユニット101は回転軸302を中心として回転可能であるとする。
305a、306aはそれぞれ撮像ユニット101の視軸で、視軸が305aである場合に、撮像ユニット101を304で示す分だけ回転させると、撮像ユニット101の視軸は306aで示すものとなる。因みにこの回転角304は動き検出回路222により検知対象となるものである。303は撮像ユニット101の画角である。従って、画角303を有し、視軸が305aである場合には、撮像ユニット101の画像面は305となり、視軸が306aである場合には、撮像ユニット101の画像面は306となる。
図3(b)は、画像面が305,306のそれぞれにおける撮像画像を説明する図である。図3(b)では左から2つの風船、家、木が配置された風景を、画像面305において撮像した画像311と、画像面306において撮像した画像312とを示している。更に、図3(b)の場合には、紙面横方向だけではく、縦方向にも撮像ユニット101の姿勢が変わっている。従って、画像311と画像312とでは縦方向、横方向共に撮像した風景がずれている。このように、撮像した風景がずれるのは、画角303や回転角304といったものが変化することに他ならない。
また画像311と画像312とを見比べると、左側の風船は画像311では写っていたものの、画像312では写っていない。更に、木は画像311では写ってはいなかったが、画像312では写っている。このように、撮像ユニット101の回転角304や画角303等が変化すると、写るものも異なってしまう場合がある。
このような画像の変化は、所謂MPEGのような動画の予測符号化方式においては、重要な影響を与えることになる。即ち、予測符号化方式による画像圧縮においては、たとえば先のフレーム画像から次のフレーム画像を予測するといったことが行われるため、先のフレームと次のフレームとで写っているものが異なれば、次のフレームにおける被写体が予測できない。
図4は、画像311と画像312とを示す図である。同図では画像311、312は共にマクロブロック(MB)405毎に分割されている(同図では点線で分割されている)。
ここで、画像311、画像312を連続したフレームとしてこの順に撮像する場合、画像311を撮像した後に、撮像ユニット101を下方向、且つ右方向に回転させると、画像面上では同図403,404に示す如く、下方向、右方向に移動したところに画像312の枠が位置することになる。これにより、画像311において同図斜線で示すマクロブロック部分は、画像312には含まれなくなっている。
ここで、MPEG-4の動画符号化方式(ISO/IEC 14496)では、圧縮符号化を行う符号化対象のフレームと先のフレームとで、類似する部分同士の差分を符号化することにより高圧縮を実現している。従って、画像312を符号化する場合には、画像312を構成する各マクロブロックと、画像311を構成する各マクロブロックとで類似するマクロブロック同士の差分を符号化することになるのであるが、上述の通り、同図斜線で示したマクロブロックは画像312には含まれていない。即ち、画像311を構成する各マクロブロックのうち、斜線で示したマクロブロックは、画像312を符号化する際には参照されない領域、斜線で示していないマクロブロックは、画像312を符号化する際に参照するマクロブロックである。
そこで本実施形態では、画像311を構成している各マクロブロックにおいて、斜線で示したマクロブロックに割り当てる符号量を、斜線で示していないマクロブロックに割り当てる符号量よりも相対的に小さくするような符号量制御を行う。これにより、より圧縮率の高い符号化を実現することができる。
このことは別の観点から見れば、画像311を構成している各マクロブロックにおいて、斜線で示していないマクロブロックに割り当てる符号量を、斜線で示したマクロブロックに割り当てる符号量よりも相対的に大きくしているので、画像312を符号化する際に参照する領域の画像品質を向上させることが可能となる。
マクロブロックごとの符号量の割り当てを制御する符号化制御の方法には様々な方法が知られているが、例えば典型的には、圧縮率に直接関わるQスケール値を変更する。またその他には、符号化直前に画像の特定部分に対してローパスフィルタを適用することにより、符号化対象とする画像の高周波成分を領域毎に変化させてもよい。
なお、以上の説明では、圧縮符号化方式としてMPEG-4を例示したが、同様の予測符号化方式であればこのような領域による符号量の割り当てを変更することが有効であることは明らかである。この図4の例ではマクロブロックが同一サイズで示しているが、MPEG-4 AVC(ITU H.264)においては、マクロブロックサイズが選択的に変更可能となっている。しかし、そのような場合であっても、符号化時に参照されない領域に対して相対的に符号量の割り当てを小さくするような符号化制御は問題なく適用可能である。
こうした、符号化方式による差異や様々な符号量割り当ての方法の差異は、本実施形態に係る技術に何等影響を与えるものではない。むしろ、本実施形態の本質は、撮像ユニット101の回転・移動の量(動き量)に基づいて、フレーム内で、次のフレーム符号化に参照されない部分を特定することの方が重要である。
図5は、撮像ユニット101が撮像した各フレームの画像を符号化する処理のフローチャートである。なお、同図のフローチャートに従った処理は、図2に示した各部によって行うのであるが、これら各部を制御するためにCPU252が実行するプログラムやデータはROM253に格納されており、これをCPU252が読み出して実行することで、本実施形態に係るディジタルカメラは、以下説明する各処理を実行することになる。
なお、以下の説明では、符号化制御に関して、例えばCBR(Constant Bit-rate)といった符号量のポリシーや特定の符号量制御アルゴリズムを想定した記述をしていない。しかしながら、そのような一般化では十分な例示が出来ない場合については、その都度若干の具体的な例を示すものとする。また、予測符号化方式の符号化のアルゴリズムは、一連のフローとして説明するには複雑であるため、ここでは、動きベクトル探索など、その詳細を略している。
先ず、本実施形態に係るディジタルカメラを起動すると、ステップS501では、CPU252が、以下の各処理を行うための各種の初期化処理を行う。例えば、複数フレームを符号化する際の符号レートや、量子化方式の設定などを行う。
初期化が完了すると、次にステップS502では、撮像ユニット101によって撮像された符号化対象フレームの画像580をデータとしてメモリ251に取得する。メモリ251へのデータの転送は上述の通り、撮像ユニット101を構成している画像信号処理回路215によって行われる。
次にステップS503では、動き検出回路222は、アクチュエータ221の動き量を検知することで撮像ユニット101の動き量を計測し、データとしてメモリ251に取得する。ここで検知している動き量は、符号化対象フレームを撮像後、この符号化対象フレームの次のフレームを撮像するまでに撮像ユニット101が動いた動き量である。
ステップS504では、ステップS503で取得した動き量を用いて、符号化対象フレームの次のフレームを符号化する際に、符号化対象フレームの画像において参照される領域と、参照されない領域とを特定する処理をCPU252によって行う。ステップS504における処理の詳細については後述する。
次にステップS505では、符号圧縮回路103が符号化処理を行うために用いる符号化パラメータ(デフォルト値)をCPU252によって設定する。この符号化パラメータとしては、例えば、目標符号量に対応するQスケールパラメータが適用可能である。
そして以降の処理では、各マクロブロックを順次符号化するのであるが、ステップS506では、符号化対象マクロブロックが、符号化対象フレームの次のフレームを符号化する際に符号化対象フレームの画像において参照されるマクロブロック(参照マクロブロック)であるか、参照されないマクロブロック(非参照マクロブロック)であるのかをCPU252が判断する。
そして、符号化対象マクロブロックが参照マクロブロックである場合には処理をステップS508に進めるのであるが、非参照マクロブロックである場合には処理をステップS507に進める。
ステップS507では、符号化対象マクロブロックが非参照マクロブロックと判断されたので、CPU252は、圧縮率を高めるようにステップS505で設定した符号化パラメータを変更する。例えば、Qスケール値を大きくする。
そして、ステップS508では、符号圧縮回路103が、ステップS505で設定された符号化パラメータ、若しくはステップS507で設定された符号化パラメータを用いて符号化対象マクロブロックを符号化する処理を行う。これにより、参照マクロブロックに対してはステップS505で設定された符号化パラメータに従った符号化処理を行い、非参照マクロブロックに対してはステップS507で設定された符号化パラメータに従った符号化処理を行うことになる。なお、符号化結果は符号化対象マクロブロックの符号化データとしてメモリ251に保持される。
次に、ステップS509では、未だ符号化されていないマクロブロックがあるのかをチェックし、未だ符号化されていないマクロブロックがある場合には処理をステップS505に戻し、符号化パラメータをデフォルト値に再設定し、未だ符号化されていないマクロブロックについて符号化処理を行う。
一方、全てのマクロブロックについて符号化を行ったのであれば、処理をステップS510に進め、符号化対象フレームを構成している全てのマクロブロックの符号化データがメモリ251に保持されているのであるから、これを符号化データ509として符号データ出力回路241に転送する。また同ステップでは、符号データ出力回路241は、この符号化データを通信回路242、若しくは記憶装置243に送出する。
そして、本処理を終了する旨の指示が入力された、若しくは終了する条件が満たされた場合には本処理を終了するのであるが、そうでない場合には処理をステップS511を介してステップS502に処理を戻し、次のフレームについて以降の処理を繰り返す。
次に、上記ステップS504における処理、即ち、符号化対象フレームを構成している各マクロブロックが、参照マクロブロックであるのか、非参照マクロブロックであるのかを特定するための処理について説明する。
図6は、図3に示した状況において、画像面305上における画像において非参照マクロブロックの領域を求める処理を説明する図である。従って図6において図3と同じ部分については同じ番号を付けている。
ここでは、撮像ユニット101が水平面内で回転した場合に、画像面305上における画像において非参照マクロブロックの領域を求める場合について説明する。
同図において601は、画像面305の幅(視軸305aを法線とする平面において、視軸305aと直交する方向の長さ=L)を示す。画像面305の幅は即ち画像面305上における画像の幅である。ここで、撮像ユニット101が水平面内で回転角304(=Φ)だけ回転した場合、画像面305は、画像面306となるのであるが、その際、画像面305上の画像において、画像面306内には含まれなくなった部分は、602で示す如く、画像面305の左端から幅dの領域である。即ち、この領域に含まれているマクロブロックが、非参照マクロブロックとなる。
ここで、画角303=θ、回転角304=Φ、撮像幅601=L、画像面305上の画像において、画像面306内には含まれなくなった部分の幅=dとおくと、以下の式が成り立つ。
((L/2)−d)/(L/2)=sin((θ/2)−φ)/sin(θ/2)
これを整理すれば、次の式が成立する。
d/L=(1−(sin((θ/2)−φ)/sin(θ/2)))/2
ここで、画角303は、撮像ユニット101の画角が所望の画角となるべく、CPU252による制御により決定し、駆動回路216,217に指示するので、CPU252にとっては既知の値となる。また、回転角304は動き検出回路222より検出される動き量の1つであるので、これもまたCPU252にとっては既知の値となる。また、撮像幅は、撮像画素数の設定などにより予め既知の値である。従って、これら既知の値、及び上記式を用いれば、幅dを求めることができる。
例えば、画角303が30度(π/6[rad])、回転角304が2度(π/90[rad])、撮像幅601が320画素であれば、上記式よりd=21画素と計算することができる。
しかし、上記計算だけでは、非参照マクロブロックで構成された領域の幅は分かるものの、この領域が符号化対象フレームにおけるどの部分であるのかについては分からない。そこで、アクチュエータ221は回転角304が時計回り、反時計回りの何れの方向の回転角であるのかを計測する。そして、例えば図6において、回転角304が時計回りの回転角である場合には、画像面305において左端から幅dの領域が非参照マクロブロックの領域であり、回転角304が反時計回りの回転角である場合には、画像面305において右端から幅dの領域が非参照マクロブロックの領域である。これは、回転角304として鉛直方向の回転も加わったとしても同様にして行う。即ち、回転した方向とは逆の側から求めた幅の部分が、非参照マクロブロックの領域となる。
従って、ステップS504では、このような計算処理を行うことで、符号化対象フレームにおいて非参照マクロブロックの領域を特定することができる。
なお、上記式において、回転角304が比較的小さい値である場合には、所謂テイラー展開などの近似によって、より計算負荷の小さな式へと変換することが可能である。テイラー展開の一次項までを用いると、上記計算式は、次の単純な式へと変換することが出来る。
d/L=φ/θ
この式を用いて、画角303が30度(π/6[rad])、回転角304が2度(π/90[rad])、撮像幅601が320画素である場合に、dの値を計算してみてもd=21画素と求めることができるので、計算負荷の高い三角関数を用いなくても、同様の結果を得ることができる。
ここで、回転角304の代わりに、回転の角速度を用いるほうが都合が良い場合もある。一般に、圧縮符号化には一定の時間を要するため、圧縮符号化を行う瞬間の時間は、画像を取得した瞬間ではなく、一定の遅延を持たすように実装される場合が多い。従って、厳密に画像フレームとその瞬間の角度とを対で取得保持することが困難である場合には、角速度を利用するほうが処理上優位となる。
今、アクチュエータ221により求めた動き量の1つとして、回転の角速度がψ[rad/sec]である時、フレームレートがN[1/sec]であれば、フレーム画像間の回転角304は、明らかに次の式で表現される。
φ=ψ/N
これを上で示した近似式に当てはめた場合、次の式が成立する。
d/L=ψ/θN
すなわち、角速度とフレームレートが明らかである場合、回転角304を用いた場合と同様に計算処理を行うことが出来る。
ここで、以上では、撮像ユニット101が回転した場合に、非参照マクロブロックの領域、参照マクロブロックの領域を求め、それぞれに応じた符号化パラメータを用いてそれぞれの領域を符号化する処理について説明したが、以上の説明は、撮像ユニット101が平行移動した場合についてもほぼ適用することができる。
即ち、撮像ユニット101が平行移動した場合には、動き検出回路222は動き量の1つとして、その平行移動量を求めることになる。また、非参照マクロブロックの領域の幅を求める処理においては、平行移動を水平方向のみとした場合を例にとると、光学センサ213の有効幅をλミリ、撮像ユニット101の水平移動幅をδミリとすると、光学センサ213と画像フレームとの関係は相似であるから、撮像幅601=L、非参照マクロブロックの領域の幅=dとした時、次の式が成り立つ。
d/L=δ/λ
これは、撮像ユニットが回転した場合の近似式とまったく同様の形となっている。また、これは、撮像ユニット101が鉛直方向に移動した場合にも同様に適用することができる。
そして、求めた幅の領域が、符号化対象フレームのどの部分に位置するものであるかを特定する処理については、上記説明と同様、符号化対象フレームにおいて移動方向とは逆の側から、求めた幅の分が、非参照マクロブロックの領域となる。
このように、撮像ユニット101が回転する場合に加え、平行移動する場合においても、非参照マクロブロックの領域を特定することができる。非参照マクロブロックの領域を特定すれば、後は図5のフローチャートに従った処理を行えばよい。従って、撮像ユニット101が如何なる動きを行ったとしても(回転と平行移動を組み合わせても)、非参照マクロブロックの領域を特定することができれば、後は上記ステップS505以降の処理を上述の通り行えばよい。
ここで最後に、圧縮符号化の制御に関して、画像フレームの変化に応じて圧縮率を変更するのではなく、圧縮符号化における符号化方式を変更する場合について、付加的な説明を行う。
MPEGなどの予測符号化においては、マクロブロック単位で、その符号化モードをマクロブロックの情報のみによる面内符号化を行うか、参照マクロブロックを用いた予測符号化を行うかを選択することが出来るようになっている。一般に、面内符号化は他の画像を参照しないため、より高画質であることが期待されるが、一方で圧縮率を低下させることになり、圧縮符号化においては、その選択を最適に行うことが重要である。
面内符号化を選択するか参照マクロブロックを選択するかの判断は、符号化時において、必ずしも一意に決定されるものではない。画質を優先するか圧縮率を優先するかの判断によって、圧縮符号化の制御を設計、実装する者によって決められるべき性質のものである。
また、あるマクロブロックが後のフレームから参照される可能性が低い場合、そのマクロブロックの画質の低下は後のフレームの画質に影響を与えないが、後のフレームから参照される可能性が高い場合、画質の悪いマクロブロックは、後のフレームの画質をも低下させる可能性がある。
すなわち、撮像ユニット101の動きによって参照されることがないと判断されるマクロブロックについては、相対的に予測符号化を選択する割合を高め、参照マクロブロックについては、相対的に面内符号化を選択する割合を高めるよう制御することにより、全体としての画質を高める制御を行うことが出来る。
このように、非参照マクロブロック、参照マクロブロックに対して符号化を行う際に、符号化方式を切り替えるようにしても良い。
以上の説明により、本実施形態によれば、撮像ユニットが撮像する各フレームの画像を符号化する場合に、撮像ユニットの動き量に基づいて非参照マクロブロックを特定し、特定した非参照マクロブロックについては参照マクロブロックよりも符号量を下げるべく、符号化パラメータ、若しくは符号化方式を制御することで、非参照マクロブロックの圧縮率を相対的に高めるといった圧縮符号化制御を行うことができる。
これにより、符号化対象フレームの次のフレームを符号化する際に参照される可能性があるため相対的に高画質化すべき(符号化対象フレームにおける)参照マクロブロックの圧縮率を高めることが可能となり、結果として、符号化対象フレームの画質をも高めることも期待される。
なお、本実施形態では、符号データ出力回路241による符号化データの形式変換処理などはあたかもハードウェアによって行われるが如く説明したが、適切なハードウエアとともに動作するソフトウエアがこれを行っても良いことは言うまでもない。
また、画角303は予め決めておき、メモリ251にデータとして保持しておくようにしても良い。何れにせよ、画角303はCPU252によって常時参照可能なものとなる。
[第2の実施形態]
第1の実施形態に係るディジタルカメラは、撮像ユニット101がアクチュエータユニット102に固定され、決められたひとつの地点で回転や平行移動を行うような構成を有していたが、移動可能な一体型の装置としても良い。より具体的には、動画撮影機能を備えたディジタルカメラやビデオ・カムコーダがその好適な例である。
本実施形態では、図2に示した各部を一体化した構成を有するディジタルカメラについて説明する。
図7は、本実施形態に係るディジタルカメラのハードウェア構成を示すブロック図である。同図において図2と同じ部分については同じ番号を付けており、その説明は省略する。図7に示す如く、本実施形態に係るディジタルカメラが図2に示したディジタルカメラと異なる点は、アクチュエータユニット102の代わりに、ジャイロ701、A/Dコンバータ702を用いている点にある。
ジャイロ701は、外部からの応力の大きさと方向を電気信号に変換するものであり、A/Dコンバータ702は、ジャイロ701により変換された電気信号に対してA/D変換を行い、ディジタルデータとして出力するものである。
従って、光学センサ213の回転や移動等の動き量はジャイロ701により計測され、電気信号としてA/Dコンバータ702に入力される。A/Dコンバータ702は受けた電気信号をディジタルデータに変換し、動き量を示すデータとしてメモリ251に送出する。これ以外については第1の実施形態に係るディジタルカメラ同様の動作を行う。
なお、画像信号処理回路215を撮像ユニット101内に設けず、符号圧縮回路103にデータを供給する為に、符号圧縮回路103と近接した位置に設けるようにしても良い。
[その他の実施形態]
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行う。その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
本発明の第1の実施形態に係る画像処理装置を適用したディジタルカメラの機能構成を示すブロック図である。 図1に示した構成を有するディジタルカメラの、より詳細な構成を示すブロック図である。 撮像ユニット101の回転と、撮像画像との関係を示す図である。 画像311と画像312とを示す図である。 撮像ユニット101が撮像した各フレームの画像を符号化する処理のフローチャートである。 図3に示した状況において、画像面305上における画像において非参照マクロブロックの領域を求める処理を説明する図である。 本発明の第2の実施形態に係るディジタルカメラのハードウェア構成を示すブロック図である。

Claims (4)

  1. 動画像を撮像する撮像手段と、
    前記撮像手段の動き量を取得する取得手段と、
    前記撮像手段より得られた各フレームの画像を符号化する符号化手段とを備え、
    前記符号化手段は、
    前記撮像手段が第1フレームを撮像してから、当該第1フレームと隣接している第2フレームを撮像するまでに動いた動き量に基づいて、当該第1フレーム内の各部を符号化するために用いる符号化パラメータを制御する制御手段と、
    前記第1フレーム内の各部を、当該各部毎に制御された符号化パラメータを用いて符号化する符号化制御手段と
    を備え
    前記制御手段は、
    前記撮像手段の回転角、画角、撮像幅に基づいて、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域を特定する特定手段と、
    前記特定手段が特定した領域に割り当てる符号量を、当該領域以外の領域に割り当てる符号量よりも相対的に小さくするように符号化パラメータを制御する符号化パラメータ制御手段と
    を備え、
    前記特定手段は、
    画角=θ、回転角=Φ、撮像幅=L、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域の幅=dとおくと、以下の式
    d/L=(1−(sin((θ/2)−Φ)/sin(θ/2)))/2
    を計算する手段と、
    前記回転角、及び前記計算により求めたdに基づいて、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域を特定する手段と
    を備えることを特徴とする画像処理装置。
  2. 動画像を撮像する撮像手段の動き量を取得する取得工程と、
    前記撮像手段より得られた各フレームの画像を符号化する符号化工程とを備え、
    前記符号化工程は、
    前記撮像手段が第1フレームを撮像してから、当該第1フレームと隣接している第2フレームを撮像するまでに動いた動き量に基づいて、当該第1フレーム内の各部を符号化するために用いる符号化パラメータを制御する制御工程と、
    前記第1フレーム内の各部を、当該各部毎に制御された符号化パラメータを用いて符号化する符号化制御工程と
    を備え
    前記制御工程は、
    前記撮像手段の回転角、画角、撮像幅に基づいて、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域を特定する特定工程と、
    前記特定工程で特定した領域に割り当てる符号量を、当該領域以外の領域に割り当てる符号量よりも相対的に小さくするように符号化パラメータを制御する符号化パラメータ制御工程と
    を備え、
    前記特定工程は、
    画角=θ、回転角=Φ、撮像幅=L、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域の幅=dとおくと、以下の式
    d/L=(1−(sin((θ/2)−Φ)/sin(θ/2)))/2
    を計算する工程と、
    前記回転角、及び前記計算により求めたdに基づいて、前記第2フレームを符号化する際に前記第1フレーム内で参照しない領域を特定する工程と
    を備えることを特徴とする画像処理方法。
  3. コンピュータに請求項に記載の画像処理方法を実行させる為のプログラム。
  4. 請求項に記載のプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2005339213A 2005-11-24 2005-11-24 画像処理装置、画像処理方法 Expired - Fee Related JP4651103B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005339213A JP4651103B2 (ja) 2005-11-24 2005-11-24 画像処理装置、画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005339213A JP4651103B2 (ja) 2005-11-24 2005-11-24 画像処理装置、画像処理方法

Publications (3)

Publication Number Publication Date
JP2007150458A JP2007150458A (ja) 2007-06-14
JP2007150458A5 JP2007150458A5 (ja) 2009-01-15
JP4651103B2 true JP4651103B2 (ja) 2011-03-16

Family

ID=38211365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005339213A Expired - Fee Related JP4651103B2 (ja) 2005-11-24 2005-11-24 画像処理装置、画像処理方法

Country Status (1)

Country Link
JP (1) JP4651103B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107852491B (zh) * 2015-07-31 2021-09-14 深圳市大疆创新科技有限公司 传感器辅助的码率控制方法
CN107852508A (zh) * 2015-07-31 2018-03-27 深圳市大疆创新科技有限公司 修改搜索区域的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005175891A (ja) * 2003-12-11 2005-06-30 Canon Inc 記録装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005175891A (ja) * 2003-12-11 2005-06-30 Canon Inc 記録装置

Also Published As

Publication number Publication date
JP2007150458A (ja) 2007-06-14

Similar Documents

Publication Publication Date Title
KR101027353B1 (ko) 전자 비디오 이미지 안정화
JP4799438B2 (ja) 画像記録装置、画像記録方法、画像符号化装置、及びプログラム
JP4926533B2 (ja) 動画像処理装置、動画像処理方法及びプログラム
JP4687807B2 (ja) 動画記録装置、及び動画像の傾き補正方法、プログラム
US8237815B2 (en) Image processing apparatus, control method therefor, for suppressing deterioration of image quality caused by a foreign substance
JP4844305B2 (ja) 撮像装置
US20070165716A1 (en) Signal processing device, image capturing device, network camera system and video system
US8983217B2 (en) Stereo image encoding apparatus, its method, and image pickup apparatus having stereo image encoding apparatus
JP5056370B2 (ja) 撮像装置、撮像装置の制御方法および撮像装置の制御プログラム、ならびに、データ処理装置、データ処理方法およびデータ処理プログラム
JP4682990B2 (ja) カメラ画像圧縮処理装置及び圧縮処理方法
JP2006253768A (ja) デジタルカメラ
WO2017060951A1 (ja) 画像圧縮装置、画像復号装置、および画像処理方法
US10674110B2 (en) Image encoding apparatus, and control method thereof
US8503855B2 (en) Image processing apparatus, control method therefor, and program
US20230247292A1 (en) Methods and apparatus for electronic image stabilization based on a lens polynomial
JP4483483B2 (ja) 撮像装置
JP4771986B2 (ja) 画像符号化装置およびそれを用いた撮像装置
EP3989530A1 (en) Generating substitute image frames based on camera motion
US8405745B2 (en) Image processing apparatus, image processing method, and program
JP4651103B2 (ja) 画像処理装置、画像処理方法
JP4850111B2 (ja) 画像表示装置およびそれを搭載した撮像装置
KR20100061311A (ko) 촬상장치 및 촬상장치의 제어 방법
JP2008113112A (ja) 撮像装置
JP5869839B2 (ja) 画像処理装置およびその制御方法
JP4154178B2 (ja) ビデオカメラ

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081119

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101213

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees