JP7041494B2 - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
JP7041494B2
JP7041494B2 JP2017214186A JP2017214186A JP7041494B2 JP 7041494 B2 JP7041494 B2 JP 7041494B2 JP 2017214186 A JP2017214186 A JP 2017214186A JP 2017214186 A JP2017214186 A JP 2017214186A JP 7041494 B2 JP7041494 B2 JP 7041494B2
Authority
JP
Japan
Prior art keywords
image
images
unit
image processing
coded data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017214186A
Other languages
English (en)
Other versions
JP2019087859A (ja
JP2019087859A5 (ja
Inventor
正明 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017214186A priority Critical patent/JP7041494B2/ja
Priority to US16/178,808 priority patent/US10750193B2/en
Publication of JP2019087859A publication Critical patent/JP2019087859A/ja
Publication of JP2019087859A5 publication Critical patent/JP2019087859A5/ja
Application granted granted Critical
Publication of JP7041494B2 publication Critical patent/JP7041494B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/207Image signal generators using stereoscopic image cameras using a single 2D image sensor
    • H04N13/218Image signal generators using stereoscopic image cameras using a single 2D image sensor using spatial multiplexing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/282Image signal generators for generating image signals corresponding to three or more geometrical viewpoints, e.g. multi-view systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は画像処理装置および画像処理方法に関し、特には複数視点の画像に関する画像処理技術に関する。
ステレオ撮影やマルチアングル撮影など、被写体を複数の視点位置から撮影することで得られる画像(多視点画像)は、立体視の提供や、視点や合焦距離を変更した画像の生成などに用いられている。多視点画像は視点の数に等しいフレーム数の画像群であるため、データ量も視点の数とともに増加する。
特許文献1では、多視点画像を構成する複数の画像(サブイメージ)のデータをすべて送信する代わりに、サブイメージを加算平均した画像のデータと、各サブイメージ内の関心領域(ROI)のデータを送信することが開示されている。
特開2015-171097号公報
特許文献1に開示された技術によれば、送信データ量を削減しつつ、ROIに関するリフォーカスを実現できる。しかしながら、リフォーカス可能な画像領域がROIに制限されるという課題がある。
本発明の目的は、多視点画像を用いた画像処理の自由度を確保しつつ、多視点画像のデータ量を削減する技術を提供することにある。
上述の目的は、視点が異なる複数の第1の画像に対応する基本画像と、それぞれが複数の第1の画像の1つまたは2つ以上に対応する複数の第2の画像とを、高帯域成分を含むサブバンドと高帯域成分を含まないサブバンドとを含む、複数のサブバンドに分割する分割手段と、複数の第2の画像と基本画像とを符号化する符号化手段と、を有し、符号化手段は、複数の第2の画像と基本画像とで符号化するサブバンドを異ならせ、複数の第2の画像については高帯域成分を含むサブバンドについて符号化し、基本画像については高帯域成分を含まないサブバンドについて符号化する、ことを特徴とする画像処理装置によって達成される。
本発明によれば、多視点画像を用いた画像処理の自由度を確保しつつ、多視点画像のデータ量を削減する技術を提供することができる。
実施形態に係る画像処理装置の一例としてのデジタルカメラの機能構成を示したブロック図 実施形態に係るデジタルカメラの撮像部に関する図 実施形態に係る撮像部の画像圧縮部の機能構成に関する図 実施形態に係る画像圧縮部が実行するサブバンド分割に関する図 実施形態に係る画像圧縮部が有するウェーブレット変換部に関する図 実施形態に係る画像処理部の機能構成に関する図 実施形態に係る画像処理部の別の機能構成に関する図 実施形態に係る画像圧縮部の別の機能構成に関する図 実施形態に係る画像処理部の別の機能構成に関する図 実施形態に係る画像圧縮部の別の機能構成に関する図 図10の詳細に関する図 実施形態に係る画像処理部の別の機能構成に関する図 図12の詳細に関する図 第2実施形態に係るデジタルカメラの撮像部および画像圧縮部に関する図 第2実施形態における撮影動作およびリフォーカス動作に関するフローチャート 第2実施形態に係るデジタルカメラの画像処理部の機能構成に関する図 第3実施形態に係るデジタルカメラの画像圧縮部の機能構成に関する図 第3実施形態における撮影動作およびリフォーカス動作に関するフローチャート 第3実施形態に係る画像処理部の機能構成に関する図 第3実施形態における撮影動作に関するフローチャート 第4実施形態に係るデジタルカメラの撮像部および画像圧縮部の機能構成に関する図 第4実施形態における予測画像更新処理に関するフローチャート 第4実施形態に係るデジタルカメラの画像処理部の機能構成に関する図 第5実施形態に係るデジタルカメラの撮像部の機能構成および動作に関する図 第5実施形態に係るデジタルカメラの画像処理部の機能構成および動作に関する図 第6実施形態に係るデジタルカメラの撮像部の機能構成に関する図 第6実施形態に係るデジタルカメラの画像処理部の機能構成に関する図
以下、添付図面を参照して、本発明の例示的な実施形態を詳細に説明する。なお、本発明は説明する実施形態に限定されない。また、実施形態で説明される構成要素の全てが本発明に必須とは限らない。実施形態における個々の機能ブロックは、プログラマブルロジックや回路部品といったハードウェア、プログラマブルプロセッサが実行可能なソフトウェア、またはそれらハードウェアとソフトウェアとの組み合わせによって実現することができる。また、1つの機能ブロックは複数のハードウェアで実現されてもよい。また、1つのハードウェアが複数の機能ブロックを実現してもよい。また、1つ以上の機能ブロックは、1つ以上のプログラマブルプロセッサ(CPU、MPUなど)がメモリに読み込まれたコンピュータプログラムを実行することにより実現されてもよい。
以下では、画像処理装置の一例としてのデジタルカメラに本発明を適用した実施形態を説明する。しかし、本発明は多視点画像を取り扱い可能な任意の電子機器に適用することが可能である。このような電子機器には、撮像装置をはじめ、コンピュータ、スマートフォン、タブレット端末、ゲーム機などの情報処理装置、家電製品、ロボットなどが含まれるが、これらに限定されない。
●(第1実施形態)
図1は、本実施形態に係るデジタルカメラ100の機能構成例を示すブロック図である。制御部101は、例えば1つ以上のプログラマブルプロセッサ(CPU、MPU)である。制御部101は、例えばROM102に記憶されたプログラムをRAM103に読み込んで実行することにより、デジタルカメラ100の各機能ブロックの動作を制御し、デジタルカメラ100の機能を実現する。
ROM102は、書き換え可能な不揮発性メモリであり、制御部101が実行可能なプログラムのほか、各種の設定値、GUIデータなどを記憶する。
RAM103は、書き換え可能な揮発性メモリであり、プログラムを実行するためにシステムメモリとして用いられたり、データの一時的な記憶領域(バッファメモリ)として用いられたりする。
光学系104は、複数のレンズや絞りなどを有し、被写体の光学像を撮像部105の撮像面上に形成する。光学系104は着脱可能であってもなくてもよい。光学系104は、フォーカスレンズ、変倍レンズ、手振れ補正レンズなどの可動レンズと、可動レンズを駆動する機構を有する。
撮像部105は、画素部やその周辺回路(例えば、読み出し回路、A/Dコンバータ、符号化回路など)を有する。後述するように、本実施形態の撮像部105は画像データを2次元サブバンド符号化してRAM103に一次記憶する。
画像処理部107は、RAM103に記憶されている符号化データを復号したり、復号で得られた画像データに対してホワイトバランス調整、色補間、縮小/拡大、フィルタリングなど、様々な画像処理を適用したりする。画像処理部107は一般にASICによって実装されるが、一部の処理を制御部101がプログラムを実行して実現してもよい。画像処理部107は処理を適用した画像データをRAM103に再度記憶する。なお、画像処理部107は、自動焦点検出(AF)や自動露出制御(AE)に用いる情報を画像データから取得する処理を実施してもよい。
制御部101は、撮像部105が出力する符号化データや、画像処理部107によって処理された画像データから画像ファイルを生成し、記録媒体108に記録する。画像処理部107が画像データに適用する処理と、制御部101が生成する画像ファイルの構成は、記録形式に応じて予め定められている。記録媒体108は例えば着脱可能なメモリカードである。
操作部109はユーザがデジタルカメラ100に指示を与えるための入力デバイスの総称である。シャッターボタン、動画撮影・一時停止ボタン、電源ボタン、メニューボタン、方向キー、決定ボタンなどが操作部109に含まれる。制御部101は操作部109に対する操作を監視し、検出された操作に応じた動作を実行する。
表示部110は例えばLCDやOLEDであり、デジタルカメラ100の各種情報、撮像画像、GUI(メニュー画面など)を表示する。表示部110はタッチパネルディスプレイであってもよく、この場合タッチパネルは操作部109に含まれる。
図2(a)は、撮像部105の機能構成例を示すブロック図である。画素部201は光学像をアナログ画像信号に変換し、A/D変換部202に出力する。A/D変換部202は、アナログ画像信号をA/D変換し、画像データとして画像圧縮部203に出力する。画像圧縮部203のラインバッファを節約するため、画像データは図2(b)に示すようなタイル(T1、T2、T3、・・・)単位で出力される。画像圧縮部203は、画像を2次元サブバンド分割し、特定の帯域成分を符号化する。
本実施形態では、撮像部105は、画素部201を第1層(第1半導体基板)、画像圧縮部203を第2層(第2半導体基板)として積層配置され、少なくとも1以上の貫通電極により互いに電気的に接続されて1つのチップで構成されているものとする。このように、本実施形態において画像圧縮部203がチップ内に組み込まれているのは、省電力と高速処理、低コスト設計のためである。画素部201がチップ内の基板に、画像圧縮部203がチップ外の基板に配置されると、配線の抵抗成分や容量成分が多くなる。そのため、同一チップ内の配線による通信に比べて低速になる。通信を高速にするには、信号波形品質を保つためアンプで駆動する必要があり、駆動電力を上げなければならない。一方、画素部201と画像圧縮部203とがいずれも同一チップ内の半導体基板に配置されることにより、出力配線が短く済み、アンプも省くことができる。加えて、撮像部105から出力される符号化データ量が少ないため、撮像部105と、制御部101や画像処理部107との通信時間が短くなり、処理速度の増加や処理負荷の低減、消費電力の低下を図ることができる。
図2(c)は、画素部201の画素構成および配列の例を示す模式図である。画素部201には複数の画素406が水平および垂直方向に2次元配置されている。個々の画素406は、1つのマイクロレンズ405と4つの光電変換部401、402、403、404を有する。1つのマイクロレンズ405を共有する4つの光電変換部401~404は、光学系104の射出瞳のうち、互いに異なる部分瞳領域を通過した光束を受光する。従って、複数の画素406について、光電変換部401群、光電変換部402群、光電変換部403群、光電変換部404群から独立してアナログ画像信号を得ることにより、1回の露光または撮影により4つの視差画像(第1の画像)を得ることができる。4つの視差画像は、互いに視点が異なる複数の画像であるため、多視点画像と呼ぶことができる。
本実施形態においては、多視点画像を構成する視差画像のうち、光電変換部401群で得られる画像をA像、光電変換部402群で得られる画像をB像、光電変換部403群で得られる画像をC像、光電変換部404群で得られる画像をD像、と呼ぶ。
図3は、図2(a)の画像圧縮部203の機能構成例を示すブロック図である。加算部501は、A像~D像をシフト量0で加算し、各画素値を平均(1/4)することにより、光学系104の射出瞳の中心を通過する光束を含む基本画像(A+B+C+D)を生成する。ここでは、基本画像を多視点画像の平均画像としたが、平均画像でなくてもよい。例えば、画素値を単純加算して基本画像を生成し、多視点画像を構成する複数の視差画像の画素値の範囲を基本画像の画素値の範囲に整合するように補正してもよい。本明細書において、画像A+Bは、A像とB像との加算に基づく画像、もしくはそれと同等の画像を意味する。つまり、光電変換部401から得られる信号群と光電変換部402から得られる信号群の加算に基づく画像であっても、光電変換部401と402とを合わせたものと同等の1つの光電変換部から得られる信号群からなる画像であってもよい。ウェーブレット変換部502、512、522、532、542は、基本画像とA~D像にそれぞれ2次元サブバンド分割の一例としての2次元ウェーブレット変換(以下、単にウェーブレット変換と呼ぶ)を適用する。なお、本実施形態において、ウェーブレット変換部5n2(n=0~4)は分解レベル1までのウェーブレット変換を適用するものとする。
なお、本実施形態では基本画像として多視点画像を構成する視差画像(A像~D像)全ての加算に基づいて得られる画像を用いた。しかし、A像~D像の一部の加算に基づく画像を基本画像としてもよい。後述するリフォーカス処理では、基本画像の視点位置に基づいてリフォーカス処理を行う。例えば、A+B+Cを基本画像とする場合、A+B+Cの視点を基準にしてA像、B像、C像からリフォーカス画像を生成すればよい。さらに、例えばA+Bと同じ視点のE像が別途設けられた光電変換素子群から得られる場合、E像を基本画像、E像を生成することができるA像およびB像を視差画像として用いてもよい。
つまり、本発明において、基本画像とは、複数の視差画像の2つ以上に対応した画像、つまり、2つ以上の視差画像に基づいて生成可能な画像であればよい。また、符号化対象とする視差画像(第2の画像)は、基本画像を生成可能な複数の視差画像(第1の画像)を最終的に得ることが可能であれば、第1の画像の2つ以上に対応した画像であってもよい。例えば、A+B+Cに相当する画像を基本画像とした場合、(1)A、B、C、(2)A+B、A、(3)A+C、A、(4)B+C、C、(5)A-B、Cなどのいずれかの組み合わせを視差画像として符号化することができる。なお、基本画像を構成しない視差画像(上述の例ではD)については、符号化してもしなくてもよい。このように、本発明では、基本画像を生成可能な複数の視差画像(第1の画像)をそのまま符号化する(1)の場合と、第1の画像の1つまたは2つ以上に対応した複数の画像を符号化する(2)~(5)の場合とがある。そのため、符号化対象とする視差画像を第2の画像と呼ぶ。ただし、本実施形態では第2の画像が第1の画像と等しい場合について説明する。
図4は、分解レベル0から3までのウェーブレット変換により得られる複数のサブバンド信号の配置を模式的に示した図である。701で示す分解レベル0は原画像である。また702~704はそれぞれ分解レベル1~3のウェーブレット変換後のサブバンドの配置を示している。サブバンドnLL、nHL、nLH、nHHのnは分解レベル(1~3)を示し、LL,HL,LH,HHはそれぞれ水平および垂直方向で適用された帯域通過フィルタ処理の種類(ハイパスフィルタまたはローパスフィルタ)を示す。なお、ウェーブレット係数のうち、高帯域成分を含まないサブバンドnLLの係数をスケーリング係数、残りの、高帯域成分を含んだ3つのサブバンドnHL、nLH、nHHの係数をウェーブレット展開係数と呼ぶ。
エンコード部503、513、523、533、543は、ウェーブレット変換により分割された各サブバンドの係数に対して量子化、算術符号化などの符号化処理を適用する。エンコード部5n3(n=0~4)が実行する符号化の方式に特に制限はなく、可逆符号化方式であっても非可逆符号化方式であってもよい。
図5(a)は、ウェーブレット変換部5n2(n=0~4)機能構成例を示すブロック図である。本実施形態では、一例として、式1および式2に示す、正規直交するウェーブレットを用いたウェーブレット変換を行うものとする。
H0(z)=b0+Σbn・(z^n+z^-n) (式1)
H1(z)=c0+Σcn・(z^n+z^-n) (式2)
ここで、nは0~3の整数であり、係数bnおよびcnの値は以下のとおりである。
b0=0.602949
b1=0.266864
b2=-0.078223
b3=-0.016864
b4=0.026748
c0=1.115087
c1=-0.591271
c2=-0.057543
c3=0.091271
係数bnはウェーブレットのスケーリング関数を表わす数列で、係数cnはウェーブレットを表わす数列である。図5(b)に、伝達関数H0(z)の振幅周波数特性631および伝達関数H1(z)の振幅周波数特性633を示す。振幅周波数特性の縦軸は振幅、横軸はサンプリング周波数で正規化された正規化周波数で、ナイキスト周波数が0.5に対応する。
低域フィルタ部601の伝達関数はH0(z)であり、垂直方向のスケーリング係数を生成する。高域フィルタ部603の伝達関数はH1(z)であり、垂直方向のウェーブレット展開係数を生成する。ダウンサンプリング部602、604は垂直方向のダウンサンプリングにより画素数を1/2にする。
低域フィルタ部611、621の伝達関数はH0(z)であり、水平方向のスケーリング係数を生成する。高域フィルタ部613、623の伝達関数はH1(z)であり、水平方向のウェーブレット展開係数を生成する。ダウンサンプリング部612、622、614、624は水平方向のダウンサンプリングにより画素数を1/2にする。
基本画像に対応するエンコード部503はスケーリング係数(1LL)の符号化データのみを出力する。また、4つの視差画像(A像~D像)に対応するエンコード部513、523、533、543は、ウェーブレット展開係数(1LH、1HL、1HH)の符号化データのみを出力する。これは、ウェーブレット変換部から対応するエンコード部へ、符号化すべき係数のみを出力することによっても、エンコード部が符号化すべき係数以外を無視することによっても実現できる。
ウェーブレット係数LL,HL,LH,HHはいずれも、生成時に水平方向と垂直方向の両方で1/2にダウンサンプリングされているため、符号化後の係数の数は符号化前の1/4になる。従って、原画像の画素数を1とした場合、符号化データの数は1/4+3/4×4=(3+1/4)となり、A像~D像をそれぞれ独立して符号化する場合(1×4=4)よりも符号化データ量を削減することができる。
撮像部105から出力する符号化データ量が削減されるため、多視点画像を扱う場合でも動画のフレームレートや静止画の連写可能枚数の低下を抑制することができる。また、RAM103に確保するバッファ容量を変更せずに静止画の連写可能枚数を増加させることができる。
制御部101は、撮像部105が出力する、基本画像と4つの視差画像(A像~D像)の符号化データを記録媒体108に記録する。なお、制御部101は、符号化データを記録媒体108に記録する際に、データファイルのヘッダなどに、ウェーブレット変換の分解レベルや、基本画像および視差画像について記録されているサブバンドに関する情報を含めておく。記録媒体108から読み出した符号化データをRAM103に読み込み、画像処理部107で復号およびリフォーカス処理を実行することができる。
図6(a)は、画像処理部107が符号化データを復号する際の動作を機能ブロックとして記載した図である。ここで説明する復号およびリフォーカス処理は画像処理部107が実行可能な多様な画像処理の一部に過ぎない。また、データファイルから符号化データを抽出し、各デコード部に符号化データを分配する処理も画像処理部107の内部で実行される。デコード部801、811、821、831、841は、分解レベル1のスケーリング係数(1LL)およびウェーブレット展開係数(1LH、1HL、1HH)を復号する。なお、デコード部は、全ての係数を復号し、特定の係数だけをウェーブレット逆変換部に供給してもよいし、ウェーブレット逆変換部に供給する係数だけを復号してもよい。デコード部801は基本画像の1LL、デコード部811、821、831、841はそれぞれA像~D像の1LH、1HL、1HHを復号する。デコード部8n4(n=0~4)は符号化方式に対応した復号を行う。
ウェーブレット逆変換部802、812、822、832、842は、復号された各サブバンドに対して2次元ウェーブレット逆変換を施すことにより、サブバンド分割された画像を復元する(サブバンド復元)。基本画像の符号化データはスケーリング係数(1LL)だけが記録されている。そのため、ウェーブレット逆変換部802は、ウェーブレット展開係数(1LH、1HL、1HH)については0としてウェーブレット逆変換する。一方、A像~D像の符号化データはスケーリング係数(1LL)が記録されていない。そのため、ウェーブレット逆変換部812、822、832、842は、スケーリング係数(1LL)を0としてウェーブレット逆変換する。
シフト加算部803は、ウェーブレット逆変換されたA像~D像に対し、リフォーカスのためのシフト加算を行う。シフト加算によるリフォーカスは例えば特許文献1に記載されるように公知である。制御部101は例えば基本画像を表示部110に表示し、合焦させたい位置をユーザに選択させる。例えば操作部109を通じて指定された画像内の位置が合焦するように制御部101はシフト加算の量および方向を決定し、シフト加算部803に通知する。シフト加算部803は通知されたシフト方向および量に従ってA像~D像をシフト加算することにより、リフォーカス画像を生成する。シフト加算部803は、リフォーカス処理した画像を加算部804に出力する。加算部804は、スケーリング係数(1LL)だけでウェーブレット逆変換された基本画像と、ウェーブレット展開係数(1LH、1HL、1HH)だけでウェーブレット逆変換されたA像~D像をリフォーカス処理した画像とを加算する。加算部804により、リフォーカスされた基本画像が得られる。
図6(b)は、図6(a)のウェーブレット逆変換部8n2(n=0~4)の機能構成例を説明するためのブロック図である。
アップサンプリング部901、903、911、913は水平方向のアップサンプリングにより画素数を2倍にする。低域フィルタ部902、912は水平方向に低域フィルタ処理を適用する。高域フィルタ部904、914は水平方向に高域フィルタ処理を適用する。アップサンプリング部921、923は垂直方向のアップサンプリングにより画素数を2倍にする。低域フィルタ部922は垂直方向に低域フィルタ処理を適用する。高域フィルタ部924は垂直方向に高域フィルタ処理を適用する。加算部905、915、925はウェーブレット逆変換の中間画像を加算する。
ウェーブレット逆変換部においても、式3および式4に示す、正規直交するウェーブレットを用いたウェーブレット逆変換を行うものとする。
G0(z)=d0+Σdn・(z^n+z^-n) (式3)
G1(z)=e0+Σen・(z^n+z^-n) (式4)
ただし、各係数の値は以下のとおりである。
ここで、nは0~3の整数であり、係数dnおよびenの値は以下のとおりである。
d0=1.115087
d1=0.591271
d2=-0.057543
d3=-0.091271
e0=0.602949
e1=-0.266864
e2=-0.078223
e3=0.016864
e4=0.026748
低域フィルタ部の伝達関数はG0(z)、高域フィルタ部の伝達関数はG1(z)である。
本実施形態では、画像の低域成分(スケーリング係数(1LL))にはシフト加算を行わずにリフォーカス画像を生成している。しかし、シフト量が1~2画素程度のリフォーカス処理の場合、低域成分のピントはほとんど変化しない。そのため、すべてのサブバンド成分に対してシフト加算を行う従来技術と同等のピント調整効果を得ることができる。
また、本実施形態においては、ウェーブレット逆変換した画像をシフト加算する構成について説明した。しかし、各サブバンド成分をシフト加算してからウェーブレット逆変換するように構成してもよい。この場合の画像処理部107’の機能構成例を図7に示す。図6(a)と同じ構成要素には同じ参照数字を付してある。
シフト加算部1001、1002、1003はそれぞれ、A像~D像のHH、LH、およびHLサブバンド成分をシフト加算する。水平および垂直方向で画素数が1/2にダウンサンプリングされた分解レベル1のサブバンド成分のシフト加算であるため、シフト量は2n画素単位に限定される。しかし、ウェーブレット逆変換の演算回数を減らすことができるため、演算コストを削減することができる。
また、本実施形態においては、4つの視差画像(A像~D像)に射出瞳の中心を視点とした基本画像(A+B+C+D)を含めない構成を説明した。しかし、例えばA像~D像の1つを(A+B+C+D)像に置き換えてもよい。
図8は、4つの視差画像として、(A+B+C+D)像とB像~D像を用いる場合の画像圧縮部203’の構成例を示すブロック図である。図3と同じ構成要素には同じ参照数字を付してある。
この場合、基本画像かつ視差画像の一つとして用いられる(A+B+C+D)像に対応するエンコード部503は、ウェーブレット変換部502からのスケーリング係数(1LL)およびウェーブレット展開係数(1LH、1HL、1HH)を符号化する。一方、B像~D像を符号化するエンコード部523、533、543のそれぞれは、ウェーブレット展開係数(1LH、1HL、1HH)のみを符号化する。
図8の構成においても、符号化データの数は1/4+3/4×4=(3+1/4)となり、A像~D像をそれぞれ独立して符号化する場合(1×4=4)よりも符号化データ量を削減することができる。
図9は、画像圧縮部203’でエンコードされた画像データを復号する画像処理部107”の機能構成例を示すブロック図である。図6(a)と同じ構成要素には同じ参照数字を付してある。
デコード部801’は、視差画像の1つとしても用いられる基本画像(A+B+C+D)について、分解レベル1のスケーリング係数(1LL)およびウェーブレット展開係数(1LH、1HL、1HH)を復号する。
デコード部821、831、841は、B像~D像について、分解レベル1のウェーブレット展開係数(1LH、1HL、1HH)を復号する。
デコード部801’は、図6(a)におけるデコード部801および811と同様の処理を行う。すなわち、デコード部801’は、基本画像については復号したスケーリング係数(1LL)と、0のウェーブレット展開係数(1LH、1HL、1HH)をウェーブレット逆変換部802に供給する。また、デコード部801’は、0のスケーリング係数(1LL)と、復号したウェーブレット展開係数(1LH、1HL、1HH)とをウェーブレット逆変換部812に出力する。ウェーブレット逆変換部812の構成は図6(b)で説明したものと同じである。ウェーブレット逆変換部812は、ウェーブレット逆変換によって得られた画像を減算部1201に出力する。
デコード部821、831、841およびウェーブレット逆変換部802、822、832、842の動作は図6(a)および図6(b)を用いて説明した通りである。
減算部1201は、ウェーブレット逆変換部822、832、842の出力をウェーブレット逆変換部812の出力から減じて、A像のウェーブレット逆変換結果に相当する画像を生成し、シフト加算部803に出力する。シフト加算部803および加算部804の動作は図6(a)を用いて説明した通りである。
このように、基本画像(A+B+C+D)を視差画像の1つとして利用することによっても演算コストを削減することができる。
本実施形態においては、ウェーブレット変換の分解レベルを1とし、基本画像についてはスケーリング係数(LL)を、視差画像についてはウェーブレット展開係数(HL,LH,HH)を記録する構成について説明した。しかし、図4に703、704として示した分解レベル2や分解レベル3までのウェーブレット変換を行う場合にも同様にして適用可能である。
図10(a)は、ウェーブレット変換を分解レベル2まで行う場合の画像圧縮部203”の機能構成例を示すブロック図である。加算部501は、A像~D像を加算して、光学系104の瞳中心を通過する光束を含む基本画像(A+B+C+D)を生成し、ウェーブレット変換・エンコード部1901に供給する。また、ウェーブレット変換・エンコード部1902~1905にはA像~D像がそれぞれ供給される。
図11(a)は、ウェーブレット変換・エンコード部1901の機能構成例を示すブロック図である。ウェーブレット変換部502および5021によりスケーリング係数(LL)に分解レベル2のウェーブレット変換を行い、エンコード部503で分解レベル2のスケーリング係数(2LL)の符号化データを出力する。
図11(b)は、ウェーブレット変換・エンコード部1902~1905の機能構成例を示すブロック図である。ウェーブレット変換部512および5121によりウェーブレット展開係数(LH,HL,HH)に分解レベル1および2のウェーブレット変換を行う。エンコード部513および5131により、分解レベル1のウェーブレット展開係数(1LH,1HL,1HH)の符号化データおよび分解レベル2のウェーブレット展開係数(2LH,2HL,2HH)の符号化データをそれぞれ出力する。
図12は、ウェーブレット変換を分解レベル2まで行う場合の画像処理部107’’’の機能構成例を示すブロック図である。図6(a)と同じ機能ブロックには同じ参照数字を付してある。画像処理部107’’’はデコード・ウェーブレット逆変換部2501~2505、シフト加算部803および加算部804を有する。
図13(a)は、基本画像(A+B+C+D)の符号化データを処理するデコード・ウェーブレット逆変換部2501の機能構成例を示すブロック図である。デコード部801は、分解レベル2のスケーリング係数(2LL)の符号化データを復号し、ウェーブレット逆変換部8021に供給する。ウェーブレット逆変換部8021は、分解レベル2のウェーブレット展開係数(2LH、2HL、2HH)を0としてウェーブレット逆変換を行い、分解レベル1のスケーリング係数(1LL)を生成してウェーブレット逆変換部802に供給する。ウェーブレット逆変換部802は、分解レベル1のウェーブレット展開係数(1LH、1HL、1HH)を0としてウェーブレット逆変換を行い、基本画像を得る。
図13(b)は、視差画像(A像~D像)の符号化データを処理するデコード・ウェーブレット逆変換部250n(n=2~5)の機能構成例を示すブロック図である。分解レベルが2以上であっても、分解レベル1のウェーブレット展開係数(1LH、1HL、1HH)には影響がないため、デコード部801およびウェーブレット逆変換部802の動作は分解レベル1のときと同じである。
ウェーブレット変換を分解レベル2まで行うと、演算量が増加するが、視差画像のデータがカバーする空間周波数帯域が低域方向に拡がるため、シフト加算部803におけるシフト量を増やすことができる。すなわち、リフォーカス可能な範囲を拡大できる。なお、分解レベルを3以上に増やしてよい。
以上、様々な変形例を含めて第1実施形態を説明した。本実施形態では、複数の視差画像について、複数の視差画像を合成した基本画像と視差画像とをそれぞれ2次元サブバンド分割し、基本画像については最も低域のサブバンドの係数を、視差画像については残りのサブバンドの係数を符号化するようにした。これにより、視差画像の利用を制限することなく、複数の視差画像を符号化するよりも符号量を削減することができる。
そのため、例えば複数の視差画像をリフォーカス画像の生成に用いる場合、画像内の任意の領域をリフォーカス対象とすることができる。また、撮像装置の構成を変更することなく、撮像時のフレームレートや連写可能枚数を高めることができる。なお、本発明が対象とする視差画像の用途はリフォーカス画像の生成に限定されない。例えば、自動焦点検出に用いられる視差画像に対しても本発明を適用することができる。この場合、本発明の適用による視差画像の撮影フレームレートの増加は、自動焦点検出に要する時間の短縮につながる。
●(第2実施形態)
次に、本発明の第2実施形態について説明する。なお、本実施形態は第1実施形態で説明したデジタルカメラ100と同じ機能構成によって実施可能である。そのため、第1実施形態と同様の参照数字を用いて説明する。本実施形態では第1の画像の2つに対応する第2の画像を符号化する構成として、符号化対象の視差画像の数を減らす。
図14(a)は、本実施形態における撮像部105’の機能構成例を示すブロック図であり、図2(a)と同じ構成については同じ参照数字を付してある。本実施形態の撮像部105’は、2つめの画像圧縮部1301が追加されている点で第1実施形態と異なる。
図14(b)は、追加された画像圧縮部1301の機能構成例を示すブロック図であり、画像圧縮部203が有する機能ブロックと同様の機能ブロックには図3と同じ参照数字を付してある。
画像圧縮部1301におけるウェーブレット変換部502は、基本画像に対して分解レベル1のウェーブレット変換を行い、分解レベル1のスケーリング係数(1LL)に加え、分解レベル1の展開係数の1つ(1LH)をエンコード部503に供給する。エンコード部503は、残りの展開係数(1HL、1HH)を0としてエンコードする
加算部1401、1402は、それぞれ2つの視差画像を加算する。具体的には加算部1401はA像とC像とを加算し、加算部1402はB像とD像とを加算する。加算部1401および1402はそれぞれ、第1の画像の2つに対応する符号化対象の視差画像(第2の画像)を生成する。この加算により、水平方向にだけ瞳分割した1対の視差画像が得られる。この加算により、垂直方向の視差の情報が失われるため、リフォーカス処理におけるシフト方向が水平方向に制限されるが、符号化データの削減効果は大きくなる。したがって、画像圧縮部203と1301とを選択的に用いることにより、リフォーカスの自由度を優先するか、符号化データの削減(フレームレートまたは連写可能枚数の向上)を優先するかを選択することができる。なお、加算部1401でA像とB像を加算し、加算部1402でC像とD像を加算するなど、他の加算を行ってもよい。
加算部1401、1402の加算により、視差画像について必要なウェーブレット展開係数は水平方向に関する係数のみとなる。そのため、基本画像を処理するウェーブレット変換部502は水平スケーリング係数に対応するサブバンドLH、LLを出力する。また、視差画像を処理するウェーブレット変換部512、522のそれぞれは、水平ウェーブレット展開係数に対応するサブバンドHL、HHを出力する。なお、制御部101は、符号化データを記録媒体108に記録する際に、データファイルのヘッダなどに、ウェーブレット変換の分解レベルや、基本画像および視差画像について記録されているサブバンドに関する情報を含めておく。
この場合、符号化データの数は、原画像の画素数を1とした場合、1/2+1/2×2=(1+1/2)となり、2つの視差画像をそのまま符号化した場合に対して、(1+1/2)/2=75%の符号化データ数に削減することができる。
水平方向と垂直方向の両方で瞳分割した第1実施形態では(3+1/4)/4=81%の符号化データ数に削減することができたが、本実施形態ではより高い削減率が実現できる。
図15(a)は、一例として、ユーザによるモード選択に応じて画像圧縮部203と1301とを選択的に用いる場合の制御部101の動作に関するフローチャートである。制御部101は、この動作を、操作部109に対する撮影指示(例えば静止画または動画の撮影開始指示)の入力操作が検出された際に実行することができる。
S1701で制御部101は、データレート優先モードが選択されているか否かを判定し、選択されていると判定されればS1703に、選択されていると判定されなければS1702に処理を進める。
S1702で制御部101は画像圧縮部203を選択する旨を撮像部105’に通知する。また、S1703で制御部101は、画像圧縮部1301を選択する旨を撮像部105’に通知する。その後、制御部101は撮影処理を開始する。撮影処理において撮像部105’は、制御部101が選択した画像圧縮部が生成した符号化データを出力する。なお、撮像部105’は、選択されなかった画像圧縮部の動作を停止させても良い。
なお、データレート優先モードが選択されているか否かは、例えばROM102を参照することによって判定することができる。また、制御部101は、データレートを優先すべき撮影モードが設定されているか否かによって同様の制御を行ってもよい。
図16(a)は、本実施形態における画像処理部107-4の機能構成例を示すブロック図である。本実施形態の画像処理部170-4は2つの画像伸長部1501、1502を有する。ここで、画像伸長部1501は図6(a)に示した画像処理部107と同じ構成を有する。
図16(b)は、画像伸長部1502の機能構成例を示すブロック図である。画像伸長部1502は、データレート優先モードで記録された(画像圧縮部1301が生成した)符号化データを伸長する。
デコード部801は基本画像の符号化データを復号し、1LLおよび1LHのウェーブレット係数をウェーブレット逆変換部802に供給する。ウェーブレット逆変換部802は、1HLおよび1HHのウェーブレット係数を0としてウェーブレット逆変換を実行し、得られた基本画像を加算部804に出力する。
デコード部8111はA+C像の符号化データを、デコード部8211はB+D像の符号化データを、それぞれ復号し、1HHおよび1HLのウェーブレット係数をウェーブレット逆変換部8121および8221にそれぞれ出力する。ウェーブレット逆変換部8121および8221は、1LLおよび1LHのウェーブレット係数を0としてウェーブレット逆変換を実行し、得られたA+C像およびB+D像をシフト加算部1601に出力する。シフト加算部1601は、水平方向のシフト加算により、リフォーカス画像を生成する。
加算部804は、水平スケーリング係数だけでウェーブレット逆変換された基本画像と、水平ウェーブレット展開係数だけでウェーブレット逆変換された視差画像から生成されたリフォーカス画像とを加算し、リフォーカスされた基本画像を生成する。
図15(b)は、リフォーカス処理時の制御部101の動作に関するフローチャートである。制御部101は、視差画像を用いた処理の一例であるリフォーカス処理の開始が操作部109を通じて指示された際にこの処理を実行することができる。S1801で制御部101は読み出したデータファイルのヘッダ情報から、符号化データがデータレート優先モードで記録されているか否かを判定する。制御部101は、データレート優先モードで記録されていると判定されればS1803に、判定されなければS1802に処理を進める。S1802で制御部101は画像伸長部1501を選択し、画像処理部107-4に通知する。S1803で制御部101は画像伸長部1502を選択し、画像処理部107-4に通知する。その後、制御部101はリフォーカス処理を開始する。画像処理部107-4は、通知された画像伸長部が出力する画像を出力する。なお、画像処理部107ー4は、選択されなかった画像伸長部の動作を停止させてもよい。また、制御部101は、図15(b)の処理を、符号化データをRAM103に読み込んだ際に実行するなど、他のタイミングで実行してもよい。
本実施形態によれば、視差画像の数を減らして符号化するか、減らさずに符号化するかを選択可能にした。そのため、例えば、動きが速い被写体を撮影する場合には視差画像の数を減らし、動きが遅い被写体を撮影する場合には視差画像の数を減らさないといった制御が可能になる。換言すれば、視差画像の活用範囲を優先するか、フレームレートまたは連写可能枚数を優先するかを動的に切り替えることができる。なお、この切り替えはユーザによる明示的な指示に基づいて実行してもよいし、撮像画像から検出される被写体情報などに応じて撮像装置が自動的に実行してもよい。
●(第3実施形態)
次に、本発明の第3実施形態について説明する。なお、本実施形態は第1実施形態で説明したデジタルカメラ100と同じ機能構成によって実施可能である。そのため、第1実施形態と同様の参照数字を用いて説明する。
第2実施形態は、符号化する視差画像の数を減らすか否かを動的に選択可能とするものであった。本実施形態は、ウェーブレット変換の分解レベルを動的に変更可能とするものである。
図17(a)は、図10に示した画像圧縮部203”が有するウェーブレット変換・エンコード部1901~1905のそれぞれを、分解レベル3のウェーブレット変換および符号化を選択的に実行可能に構成した場合の機能構成例を示すブロック図である。
ウェーブレット変換・エンコード部190n(n=0~5)のそれぞれは、直接に接続された3つのウェーブレット変換部502、5021、5022と、それぞれの出力を符号化するエンコード部503’、5031、5032とを有する。エンコード部503’、5031、5032はそれぞれ分解レベル1~3のウェーブレット係数の符号化データを出力する。エンコード部、ウェーブレット変換部はいずれも同一構成である。
このような構成のウェーブレット変換・エンコード部1901~1905を用いて、分解レベル1、2、3の選択的なウェーブレット変換と符号化データの生成を実現する。以下、分解レベルm(m=1~3)のウェーブレット変換と符号化データの生成を行う動作を、分解レベルmの伝送モードと呼ぶ。
図17(b)は、ウェーブレット変換・エンコード部1901の分解レベル1伝送モードの動作を示す図である。ウェーブレット変換部502は、基本画像について分解レベル1のウェーブレット変換を行い、分解レベル1のスケーリング係数(1LL)だけをエンコード部503’に供給する。エンコード部503’は分解レベル1のスケーリング係数(1LL)の符号化データを出力する。これは、図3に示した画像圧縮部203におけるウェーブレット変換部502およびエンコード部503の動作に等しい。
図17(c)は、ウェーブレット変換・エンコード部190n(n=2~5)の分解レベル1伝送モードの動作を示す図である。ウェーブレット変換部502は、視差画像(A像~D像)の1つについて分解レベル1のウェーブレット変換を行い、分解レベル1のウェーブレット展開係数(1HL、1LH、1HH)だけをエンコード部503’に供給する。エンコード部503’は分解レベル1のウェーブレット展開係数(1HL、1LH、1HH)の符号化データを出力する。これは、図3に示した画像圧縮部203におけるウェーブレット変換部5n2およびエンコード部5n3(n=1~4)の動作に等しい。
ウェーブレット変換・エンコード部1901の分解レベル2伝送モードの動作は図11(a)に、ウェーブレット変換・エンコード部190n(n=2~5)の分解レベル2伝送モードの動作は図11(b)に示した通りである。
ウェーブレット変換・エンコード部1901の分解レベル3伝送モードの動作は図17(a)のエンコード部5032から分解レベル3のスケーリング係数(3LL)の符号化データだけを出力する動作に相当する。また、ウェーブレット変換・エンコード部190n(n=2~5)の分解レベル3伝送モードの動作は、図17(a)のエンコード部503’、5031、5032から1LL、2LLを除く全ての符号化データを出力する動作に相当する。
画像圧縮部203”は、制御部101から指定された分解レベルに応じて、ウェーブレット変換部502、5021、5022と、エンコード部503’、5031、5032の動作を切り替える。また、ウェーブレット変換・エンコード部1901のエンコード部はスケーリング係数のみを出力し、ウェーブレット変換・エンコード部1902~5のエンコード部はウェーブレット展開係数のみを出力する。
図18(a)は、一例として、リフォーカス範囲の設定に応じて分解レベルまたは伝送モードレベルを切り替える、制御部101の動作に関するフローチャートである。制御部101は、この動作を、操作部109に対する撮影指示(例えば静止画または動画の撮影開始指示)の入力操作が検出された際に実行することができる。リフォーカス範囲の設定はROM102に記憶しておくことができる。本実施形態では、リフォーカス範囲はシフト量として記憶されているものとするが、切り替え可能な分解レベルの数に等しい数の任意の設定値を記憶してもよい。また、リフォーカス範囲の設定方法に特に制限はなく、例えばメニュー画面を通じてユーザに設定させることができる。この場合、シフト量を直接設定させてもよいし、リフォーカス範囲を大、中、小から選択させてもよい。
S3101で制御部101は、シフト量が閾値TH1以下であるか否かを判定し、閾値TH1以下と判定されればS3103に、閾値TH1以下と判定されなければS3102に処理を進める。
S3102で制御部101は、シフト量が閾値TH2以下(TH2>TH1)であるか否かを判定し、閾値TH2以下と判定されればS3104に、閾値TH2以下と判定されなければS3105に処理を進める。
閾値TH1、TH2は、ウェーブレット変換の分解レベルと、リフォーカス可能範囲との関係に応じて予め決定し、ROM102に記憶しておくことができる。シフト量が小さい、リフォーカス範囲が狭くてよい場合は、視差画像のウェーブレット展開係数の分解レベルを低くすることができる。このように構成することで、必要なリフォーカス量に応じて効率的に符号化データを削減することができる。
S3103で制御部101はレベル1伝送モード(ウェーブレット分解レベル1)を選択し、撮像部105に通知する。同様に制御部101はS3104でレベル2伝送モード(ウェーブレット分解レベル2)を、S3105でレベル3伝送モード(ウェーブレット分解レベル3)を選択し、撮像部105に通知する。その後、制御部101は撮影処理を開始する。撮影処理において撮像部105は、制御部101が選択した伝送モード(分解レベル)に応じた符号化データを出力する。
図19(a)は、図12に示した画像処理部107’’’が有するデコード・ウェーブレット逆変換部2501~2505のそれぞれを、分解レベル3のウェーブレット逆変換および復号を選択的に実行可能に構成した場合の機能構成例を示すブロック図である。
デコード・ウェーブレット逆変換部250n(n=0~5)のそれぞれは、分解レベル1~3の係数の符号化データをそれぞれ復号するデコード部801、8011、8012と、ウェーブレット逆変換部802、8021、8022とを有する。デコード部801、8011、8012はそれぞれ、記録時の分解レベルに応じたウェーブレット係数を出力する。デコード部、ウェーブレット逆変換部はいずれも同一構成である。
このような構成のデコード・ウェーブレット逆変換部2501~2505を用いて、分解レベル1、2、3の係数の符号化データを復号およびウェーブレット逆変換する。
図19(b)は、デコード・ウェーブレット逆変換部2501の分解レベル1伝送モード時の動作を示す図である。デコード部801は、分解レベル1の係数の符号化データを復号し、スケーリング係数(1LL)のみをウェーブレット逆変換部802に供給する。これは、図6(a)に示した画像処理部107におけるウェーブレット逆変換部802およびデコード部801の動作に等しい。ウェーブレット逆変換部802は、分解レベル1のスケーリング係数(1LL)を、ウェーブレット展開係数(1HL、1LH、1HH)を0として、ウェーブレット逆変換する。
図19(c)は、デコード・ウェーブレット逆変換部250n(n=2~5)の分解レベル1伝送モードの動作を示す図である。デコード部801は、視差画像(A像~D像)の1つについての符号化データのうち、分解レベル1のウェーブレット展開係数(1HL、1LH、1HH)の符号化データのデコード結果のみをウェーブレット逆変換部802に供給する。これは、図6(a)に示した画像処理部107におけるデコード部8n1(n=1~4)の動作に等しい。ウェーブレット逆変換部802は、分解レベル1のウェーブレット展開係数(1HL、1LH、1HH)を、スケーリング係数(1LL)を0としてウェーブレット逆変換する。
デコード・ウェーブレット逆変換部2501の分解レベル2伝送モードの動作は図13(a)に、デコード・ウェーブレット逆変換部250n(n=2~5)の分解レベル2伝送モードの動作は図13(b)に示した通りである。
デコード・ウェーブレット逆変換部2501の分解レベル3伝送モードの動作は、次の通りである。図19(a)のウェーブレット逆変換部802が、ウェーブレット逆変換部8021から得られる分解レベル1のスケーリング係数(1LL)を、ウェーブレット展開係数(1HL、1LH、1HH)を0としてウェーブレット逆変換する。
また、デコード・ウェーブレット逆変換部250n(n=2~5)の分解レベル3伝送モードの動作は、分解レベル1伝送モードのときと同一である。
図18(b)は、リフォーカス処理時の制御部101の動作に関するフローチャートである。制御部101は、視差画像を用いた処理の一例であるリフォーカス処理の開始が操作部109を通じて指示された際にこの処理を実行することができる。S3201で制御部101は読み出したデータファイルのヘッダ情報から、符号化されている係数の分解レベルが1か否かを判定する。制御部101は、分解レベルが1と判定されればS3203に、判定されなければS3202に処理を進める。
S3202で制御部101は符号化されている係数の分解レベルが2か否かを判定する。制御部101は、分解レベルが2と判定されればS3204に、判定されなければS3205に処理を進める。
S3203~S3205で制御部101は、リフォーカスモードをレベル1~レベル3にそれぞれ設定し、リフォーカスモードに応じたリフォーカス処理を開始する(例えばリフォーカスする位置を指定するためのGUI表示する)。ここで、リフォーカスモードは、リフォーカス量の上限に相当し、レベル1がリフォーカス量の上限が最も小さい。つまり、フォーカスを変更可能な距離範囲が狭い。
以降のリフォーカス処理において制御部101は、例えば、設定されたリフォーカスモードに応じた範囲でユーザからのリフォーカス指示を受け付けることができる。例えば表示部110に表示した基本画像に対して位置が指定された際、制御部101は現在のリフォーカスモードに対応したシフト量の範囲内で、指定された位置に合焦したリフォーカス画像を生成可能か否かを判定することができる。もし、フォーカスモードに対応したシフト量の範囲では指定された位置にリフォーカスできないと判定された場合、制御部101は、表示部110にメッセージを表示するなどしてユーザに警告することができる。
なお、シフト量以外の条件に基づいて伝送モードを選択するように構成することもできる。例えば、F値、撮影倍率などから被写界深度を算出し、被写界深度が大きいほど低い(または小さいほど高い)分解レベルの伝送モードを選択するように構成することができる。
この場合、上述した図18(a)の動作を図20に示すように変更すればよい。
すなわち、S3301で制御部101は、被写界深度Dが閾値THd1以上であるか否かを判定し、閾値THd1以上と判定されればS3103に、閾値THd1以上と判定されなければS3302に処理を進める。
S3302で制御部101は、被写界深度Dが閾値THd2以上(THd2<THd1)であるか否かを判定し、閾値THd2以上と判定されればS3104に、閾値TH2以上と判定されなければS3105に処理を進める。
閾値THd1、THd2は、ウェーブレット変換の分解レベルと、リフォーカス可能範囲との関係に応じて予め決定し、ROM102に記憶しておくことができる。被写界深度が大きい場合、視差画像間の視差が小さく、リフォーカス可能範囲は狭いため、視差画像のウェーブレット展開係数の分解レベルを低くすることができる。このように構成することで、必要なリフォーカス量に応じて効率的に符号化データを削減することができる。S3103~S3105の処理は図18(a)と同様であるため説明を省略する。このように構成することで、被写界深度に応じて効率的に符号化データを削減することができる。
本実施形態によれば、サブバンド分割の分解レベルを動的に変更可能とした。そのため、必要以上に分解レベルが高くなることを抑制でき、演算コストや符号データ量を適切に削減することができる。
●(第4実施形態)
次に、本発明の第4実施形態について説明する。なお、本実施形態は第1実施形態で説明したデジタルカメラ100と同じ機能構成によって実施可能である。そのため、第1実施形態と同様の参照数字を用いて説明する。
図21(a)は、本実施形態における撮像部105”の機能構成例を示すブロック図である。第1実施形態と同様の構成については図2(a)と同じ参照数字を付してある。本実施形態の撮像部105”は、直前に撮影された画像(動画フレームまたは静止画)を記憶するRAM3401を有する。以下ではRAM3401に記憶された画像を直前フレーム(n-1)の画像、今回撮影された画像を現フレームnの画像と呼ぶ。直前フレーム(-1)の画像は、現フレームnの画像に対して過去の画像に相当する。
図21(b)は、図21(a)の画像圧縮部203’’’の機能構成例を示すブロック図である。ウェーブレット変換部5n1(n=0~4)およびエンコード部5n3(n=0~4)は第1実施形態で図3を用いて説明した構成である。図3と図21(b)との比較から明らかなように、本実施形態の画像圧縮部203’’’は加算部3501を有している。
制御部101は、RAM3401に記憶されている直前フレーム(n-1)の基本画像BASE(n-1)を読み出し、画像圧縮部203’’の加算部3501に供給する。加算部3501は、現フレームnの基本画像BASE(n)から基本画像BASE(n-1)を減じて差分画像ΔBASE(n)を生成し、ウェーブレット変換部502に供給する。換言すれば、加算部3501は、基本画像BASE(n-1)を予測画像として、フレーム間予測の誤差として差分画像ΔBASE(n)を生成する。したがって、以下では、基本画像BASE(n-1)を基本画像BASE(n)の予測画像PREV(n)と呼ぶ。制御部101は、現フレームnの基本画像BASE(n)は、次フレームの基本画像の予測画像として用いるためにRAM3401に記憶する。このように、本実施形態においては、基本画像について、フレーム間予測誤差(差分画像)をウェーブレット変換および符号化するように構成することで、符号データ量を削減する。
図22(a)は、本実施形態において、制御部101が実施する予測画像の更新処理に関するフローチャートである。この処理は、例えば記録用の撮影処理と並行して実行することができる。ここでは直前フレームと現フレームとの相関が高いと考えられる動画撮影もしくは静止画の連写時に実行するものとするが、静止画の単写時に実行してもよい。
S3701で制御部101は初期化処理を実行する。ここで、初期化処理は、変数nを1にすることと、初期の予測画像PREV(1)を用意することを含む。PREV(1)は例えば全画素の色成分が一定の値を有する画像であってよい。ここでは一定の値を0とする。
S3702で制御部101は、撮影が終了したか否かを判定し、終了したと判定されれば予測画像更新処理を終了し、終了したと判定されなければ処理をS3703に進める。撮影の終了は例えば動画記録の終了指示や、レリーズボタンの押下終了など、予め定められた状態が検出されたか否かによって判定することができる。
S3703で制御部101は、変数nを1増やすとともに、現在の基本画像BASE(n-1)を新たな予測画像PREV(n)とし、処理をS3702に戻す。なお、ここでは予測画像の更新よりも前に変数nを1増やしているため、現在の基本画像のフレーム番号が(n-1)となっている。
基本画像はスケーリング係数(LL)のみが符号化される。スケーリング係数は最も低い帯域の画像に相当するため、手振れや被写体ぶれの影響が少なく、差分画像の画素値が小さくなる傾向がある。したがって、フレーム間予測符号化によって符号化データ量を効率よく削減できる。逆に、画像の高周波成分を含むウェーブレット展開係数(LH、HL、HH)を符号化する視差画像では、手振れや被写体ぶれの影響によって差分画像の画素値が大きくなる傾向がある。したがって、フレーム間予測符号化の効果は小さく、本実施形態では視差画像についてはフレーム間予測符号化は行わない。このように構成することで、RAM容量や演算コストを抑制しながら符号化データ量の削減効率を高めることができる。
図23は、本実施形態における画像処理部107-5の機能構成例を示すブロック図である。画像処理部107-5は、加算部3601を有することを除き、図6(a)に示した第1実施形態の画像処理部107と同じ構成を有するため、デコード部およびウェーブレット逆変換部に関する説明は省略する。本実施形態では基本画像の符号化データが差分画像の符号化データである。そのため、符号化時に用いた予測画像(直前フレームの基本画像)を加算部3601でウェーブレット逆変換部802の出力に加算し、基本画像を復元する。画像処理部107-5は、復元した基本画像を、次フレームの復号に用いるためにRAM103に記憶する。
このように、本実施形態では、基本画像を予測符号化することにより、第1~第3実施形態の効果に加えて、多視点画像の符号化データ量を削減することができる。なお、本実施形態の構成は、第1~第3実施形態の構成と組み合わせることができる。
●(第5実施形態)
次に、本発明の第5実施形態について説明する。なお、本実施形態は第1実施形態で説明したデジタルカメラ100と同じ機能構成によって実施可能である。そのため、第1実施形態と同様の参照数字を用いて説明する。
図24(a)は、本実施形態における撮像部105’’’の機能構成例を示すブロック図である。第1実施形態と同様の構成については図2(a)と同じ参照数字を付してある。本実施形態の撮像部105’’’は、第1実施形態における撮像部105に対し、基本画像圧縮部3901を追加した構成を有する。
図24(b)は、基本画像圧縮部3901の機能構成例を示すブロック図である。基本画像圧縮部3901は図3に示した画像圧縮部203の構成のうち、基本画像に関する構成だけを有する。ただし、ウェーブレット変換部502はスケーリング係数(LL)だけでなく、ウェーブレット展開係数(LH,HL,HH)についてもエンコード部503に供給する。そして、エンコード部503は、すべての係数を符号化する。
光学系104に含まれる撮像レンズの光学収差の影響により、像高が大きい画面周辺部では、像高の小さい画面中央部よりも解像度が低下する。そのため、画面周辺部はリフォーカスの効果も低くなる。このような特性を利用し、本実施形態では画面周辺部については視差画像の符号化データを含めず、基本画像の符号化データのみとすることにより、符号化データ量を削減する。
具体的には、各フレームの符号化中、制御部101は、撮像部105’’’から出力する符号化データを、図24(c)のフローチャートに示すように選択する。すなわち、S2401で制御部101は、符号化対象のタイルが、画面中央部のタイルであるか否かを判定する。ここで、タイルは、図2(b)に示した部分画像であり、符号化を行う単位である。符号化対象のタイルが画面中央部のタイルであると判定されれば、S2403で制御部101は、画像圧縮部203が生成する符号化データを出力するように撮像部105’’’に指示する。これにより、符号化対象のタイルの符号化データとして、基本画像と視差画像の両方の符号化データが撮像部105’’’から出力される。一方、符号化対象のタイルが画面中央部のタイルであると判定されなければ(画像周辺部のタイルであると判定されれば)、S2402で制御部101は、基本画像圧縮部3901が生成する符号化データを出力するように撮像部105’’’に指示する。これにより、符号化対象のタイルの符号化データとして、基本画像のみの符号化データが撮像部105’’’から出力される。なお、出力する符号化データの切り替えは、制御部101の指示に従って撮像部105’’’が行ってもよいし、制御部101が撮像部105’’’のスイッチを直接制御することによって行ってもよい。
S2404で制御部101は、現フレームのすべてのタイルについて符号化が終了したか否かを判定し、終了したと判定されれば選択処理を終了し、終了したと判定されなければ処理をS2401に戻す。
なお、どのタイルを画面周辺部(または画面中央部)のタイルとするかは、光学系104の特性に応じて予めROM102に記憶しておくことができる。また、光学系104が交換可能な場合は、交換レンズの種類ごとに画面周辺部とするタイルの情報をROM102に記憶しておくことができる。また、制御部101は、符号化データを記録する際、例えばファイルのヘッダ情報に、どのタイルが画面周辺部に該当するか(基本画像の符号化データしか記録されていないか)を復号時に特定できる情報を含めておく。
図25(a)は、本実施形態における画像処理部107-6の機能構成例を示すブロック図である。第2実施形態と同様の構成については図16(a)と同じ参照数字を付してある。本実施形態の画像処理部107-6は、第2実施形態における画像処理部107-4が画像伸長部1502の代わりに基本画像伸長部4101を有する。
図25(b)は、基本画像伸長部4101の機能構成例を示すブロック図である。基本画像伸長部4101は図6(a)に示した画像処理部107の構成のうち、基本画像に関する構成だけを有する。ただし、基本画像の符号化データはスケーリング係数(LL)だけでなく、ウェーブレット展開係数(LH,HL,HH)も含んでいるため、デコード部801はすべての係数をデコードしてウェーブレット逆変換部802に供給する。そして、ウェーブレット逆変換部802は、デコード部801から供給された係数に対してウェーブレット逆変換を行う。
各フレームの復号中、制御部101は、画像処理部107-6で用いる画像伸長部を、図25(c)のフローチャートに示すように選択する。すなわち、S2501で制御部101は、復号対象のタイルが、画面中央部のタイルであるか否かを判定する。例えば制御部101は、符号化データを含んだファイルのヘッダ情報を参照し、復号対象のタイルが画面中央部のタイルである(または画像周辺部のタイルでない)ことを判定できる。復号対象のタイルが画面中央部のタイルであると判定されれば、S2503で制御部101は、画像伸長部1501で得られるデータを出力するように画像処理部107-6に指示する。これにより、復号対象のタイルの復号結果として、基本画像と視差画像の両方のデータが画像処理部107-6から出力される。一方、復号対象のタイルが画面中央部のタイルであると判定されなければ(画像周辺部のタイルであると判定されれば)、S2502で制御部101は、基本画像伸長部4101で得られる復号データを出力するように画像処理部107-6に指示する。これにより、復号対象のタイルのデータとして、基本画像のデータのみが画像処理部107-6から出力される。なお、画像伸長部の切り替えは、制御部101の指示に従って画像処理部107-6が行ってもよいし、制御部101が画像処理部107-6のスイッチを直接制御することによって行ってもよい。
本実施形態によれば、視差画像の周辺部分については符号化を行わない(あるいは符号化を行っても符号化データを記録しない)ようにした。そのため、第1~第3実施形態の効果に加えて、多視点画像の符号化データ量を削減することができる。なお、本実施形態の構成は、第1~第3実施形態の構成と組み合わせることができる。
●(第6実施形態)
次に、本発明の第6実施形態について説明する。なお、本実施形態は第1実施形態で説明したデジタルカメラ100と同じ機能構成によって実施可能である。そのため、第1実施形態と同様の参照数字を用いて説明する。
図26(a)は、本実施形態における撮像部105-4の機能構成例を示すブロック図である。第1実施形態と同様の構成については図2(a)と同じ参照数字を付してある。本実施形態の撮像部105-4は、第5実施形態における撮像部105’’’に対し、色変換部4301と、基本画像圧縮部3902を追加した構成を有する。ここで、基本画像圧縮部3902は基本画像圧縮部3901と同じ構成を有する。
色変換部4301は、A/D変換部202が出力するA像~D像の画像データの形式をRGB形式からYUV形式に変換する。本実施形態において、画素部201は、図26(b)示す画素配列を有する。具体的には、画素部201には原色ベイヤー配列のカラーフィルタが設けられており、カラーフィルタの1コマが1つのマイクロレンズ4405に対応している。これにより、1つのマイクロレンズ4405を共有する4つの光電変換部4401、4402、4403、4404は同じ色のカラーフィルタを透過した光を光電変換する。これにより、A像~D像は、原色ベイヤー配列に等しい配列の画素配置を有する画像となる。
色変換部4301は、A像~D像のそれぞれに対してデベイヤー(デモザイク)処理を行い、各画素がRGB成分を有するようにした後、公知のRGB→YUV変換を適用することにより、A像~D像をYUV形式の画像データに変換する。そして、色変換部4301は、A像~D像のY成分を画像圧縮部203に、U成分を基本画像圧縮部3901に、V成分を基本画像圧縮部3902に、それぞれ分配する。
人間の視覚は輝度成分(Y成分)に対して色差成分(UおよびV成分)に対して鈍感である。したがって、輝度成分については画像圧縮部203で基本画像(YA+YB+YC+YD)および視差画像(YA像~YD像)について、第1実施形態と同様にウェーブレット変換および符号化を行う。つまり、輝度成分については、基本画像はスケーリング係数(LL)のみを、視差画像についてはウェーブレット展開係数(HL,LH,HH)を符号化する。一方、色差成分については基本画像圧縮部3901および3902でそれぞれU成分およびV成分の基本画像(UA+UB+UC+UDおよびVA+VB+VC+VD)のみについて、第5実施形態と同様にウェーブレット変換および符号化を行う。つまり、色差成分については基本画像についてのみ、かつ全ての係数を符号化する。このように、微少なリフォーカスの効果が視認しやすい輝度成分についてのみ視差画像を符号化することにより、符号化データを削減することができる。
図27は、本実施形態における画像処理部107-7の機能構成例を示すブロック図である。画像処理部107-7は、図25(a)に示した画像処理部107-6が有する画像伸長部1501、基本画像伸長部4101に加え、基本画像伸長部4102を有する。基本画像伸長部4102は基本画像伸長部4101と同一構成である。画像伸長部1501は輝度成分画像(基本画像および視差画像)の符号化データを復号およびウェーブレット逆変換する。基本画像伸長部4101および4102はそれぞれU成分とV成分の基本画像の符号化データを復号およびウェーブレット逆変換する。
画像伸長部1501で得られる輝度成分の視差画像(YA像~YD像)はシフト加算部803”においてリフォーカス処理(シフト加算)され、リフォーカス画像として加算部804”に供給される。加算部804”は、リフォーカス画像と、画像伸長部1501で得られる輝度成分の基本画像(YA+YB+YC+YD)とを加算し、色変換部4501に供給する。色変換部4501は、加算部804”からの輝度成分画像と、基本画像伸長部4101および4102で得られるU成分およびV成分の基本画像(UA+UB+UC+UDおよびVA+VB+VC+VD)とを色変換し、RGB成分を有する基本画像を生成する。
本実施形態によれば、複数の視差画像(視点画像)については輝度成分だけ符号化し、基本画像については輝度成分と色差成分とを符号化するようにしたので、符号化データ量を効率的に削減することができる。
(その他の実施形態)
上述した第1~第6実施形態は、その一部または全部を適宜組み合わせることが可能である。また、第1~第6実施形態は撮像部においてサブバンド分割、符号化、また色変換などを行う構成について説明した。しかし、撮像部はA/D変換までを行い、サブバンド分割、符号化、また色変換などは制御部または画像処理部が実行するように構成してもよい。また、第1~第6実施形態におけるサブバンド分割、符号化、また色変換などは、必ずしも撮影時に実行しなくてもよい。例えば記録済みのRAWに対してこれらの処理を実行することによっても、記録サイズを削減するという効果は得られる。また、第1~第6実施形態においては、符号化処理と復号処理とを同じ装置で行う構成であったが、符号化処理と復号処理とは異なる装置で行ってもよい。本発明は説明した実施形態の構成に限定されない。実施形態の構成は特許請求の範囲に記載された範囲で様々な変形および変更が可能であり、それらは全て本発明に含まれる。
また、上述した実施形態では、画像圧縮部が画素部と同一半導体チップ内にある構成とした。しかし、画素部を有する撮像用のチップと、画像圧縮部を含むFPGA(field-programmable gate array)などの回路とが独立して設けられ、配線で電気的に接続されていてもよい。このとき、画像圧縮部からの出力は、さらに別のチップに搭載された画像処理部などに出力される。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100…デジタルカメラ、101…制御部、102…ROM、103…RAM、104…光学系、105…撮像部、107…画像処理部、108…記録媒体

Claims (24)

  1. 視点が異なる複数の第1の画像に対応する基本画像と、それぞれが前記複数の第1の画像の1つまたは2つ以上に対応する複数の第2の画像とを、高帯域成分を含むサブバンドと高帯域成分を含まないサブバンドとを含む、複数のサブバンドに分割する分割手段と、
    前記複数の第2の画像と前記基本画像とを符号化する符号化手段と、を有し、
    前記符号化手段は、前記複数の第2の画像と前記基本画像とで符号化するサブバンドを異ならせ、前記複数の第2の画像については前記高帯域成分を含むサブバンドについて符号化し、前記基本画像については前記高帯域成分を含まないサブバンドについて符号化する、
    ことを特徴とする画像処理装置。
  2. 前記符号化手段は、前記複数の第2の画像の1つについて符号化を行わず、前記基本画像について、前記高帯域成分を含まないサブバンドと、前記高帯域成分を含むサブバンドについて符号化することを特徴とする請求項1に記載の画像処理装置。
  3. 前記符号化手段は、前記複数の第2の画像の数を前記複数の第1の画像の数よりも減らして符号化するか、減らさずに符号化するかを切り替え可能であることを特徴とする請求項1に記載の画像処理装置。
  4. 前記符号化手段は、前記複数の第1の画像から、垂直方向または水平方向における視差の情報を持たない複数の第2の画像を生成することにより、前記複数の第2の画像の数を前記複数の第1の画像の数よりも減らすことを特徴とする請求項3に記載の画像処理装置。
  5. 前記符号化手段は、前記基本画像について、符号化対象の基本画像と過去の基本画像との差分を符号化することを特徴とする請求項1から請求項4のいずれか1項に記載の画像処理装置。
  6. 前記符号化手段は、前記複数の第2の画像について、予め定められた画面周辺部については符号化しないことを特徴とする請求項1から請求項5のいずれか1項に記載の画像処理装置。
  7. 視点が異なる複数の第1の画像に対応する基本画像と、それぞれが前記複数の第1の画像の1つまたは2つ以上に対応する複数の第2の画像とを、輝度成分と色差成分とに変換する変換手段と、
    前記輝度成分と前記色差成分とを、高帯域成分を含むサブバンドと高帯域成分を含まないサブバンドとを含む、複数のサブバンドに分割する分割手段と、
    前記複数の第2の画像と前記基本画像とを符号化する符号化手段と、を有し、
    前記符号化手段は、
    前記複数の第2の画像と前記基本画像とで符号化するサブバンドを異ならせ、
    前記基本画像について、前記色差成分は前記複数のサブバンドについて符号化し、前記輝度成分は前記高帯域成分を含まないサブバンドについて符号化し、
    前記複数の第2の画像について、前記色差成分は符号化せず、前記輝度成分は前記高帯域成分を含むサブバンドについて符号化する、
    ことを特徴とする画像処理装置。
  8. 前記分割手段は、前記分割のレベルを選択可能であることを特徴とする請求項1から請求項7のいずれか1項に記載の画像処理装置。
  9. 前記分割手段における前記分割のレベルを選択する制御手段をさらに有し、
    前記制御手段は、リフォーカス範囲として設定された前記複数の第1の画像のシフト量が第1のシフト量である場合に第1のレベルを選択し、前記複数の第1の画像のシフト量が前記第1のシフト量より大きい第2のシフト量である場合に、前記第1のレベルより高い第2のレベルを選択することを特徴とする請求項8に記載の画像処理装置。
  10. 光学系をさらに有し、
    前記制御手段は、前記光学系の被写界深度が第1の被写界深度である場合に第1のレベルを選択し、前記光学系の被写界深度が前記第1の被写界深度より小さい第2の被写界深度である場合に、前記第1のレベルより高い第2のレベルを選択することを特徴とする請求項9に記載の画像処理装置。
  11. 前記基本画像は、前記複数の第1の画像の少なくとも2つを加算して生成されることを特徴とする請求項1から請求項10のいずれか1項に記載の画像処理装置。
  12. 視点が異なる複数の第1の画像に対応する基本画像についての高帯域成分を含まないサブバンドの符号化データと、それぞれが前記複数の第1の画像の1つまたは2つ以上に対応する複数の第2の画像についての前記高帯域成分を含むサブバンドの符号化データとを取得する取得手段と、ここで、前記基本画像についての符号化データと、前記複数の第2の画像についての符号化データとは、異なるサブバンドについての符号化データであり、
    前記複数の第2の画像についての符号化データを用いて復元した前記複数の第1の画像を用いてリフォーカス画像を生成する生成手段と、
    前記基本画像についての符号化データから復号した前記基本画像に前記リフォーカス画像を加算する加算手段と、
    を有することを特徴とする画像処理装置。
  13. 前記取得手段は、前記基本画像について、さらに前記高帯域成分を含むサブバンドの符号化データを取得し、該符号化データを、前記複数の第2の画像の1つについての符号化データとして用いることを特徴とする請求項12に記載の画像処理装置。
  14. 前記生成手段は、前記複数の第1の画像の前記サブバンドを復元してから前記複数の第1の画像をシフト加算して前記リフォーカス画像を生成することを特徴とする請求項12または請求項13に記載の画像処理装置。
  15. 前記複数の第2の画像が前記複数の第1の画像と等しく、
    前記生成手段は、前記複数の第2の画についての符号化データをシフト加算してから前記サブバンドを復元することにより、前記リフォーカス画像を生成することを特徴とする請求項12または請求項13に記載の画像処理装置。
  16. 前記基本画像は、前記複数の第1の画像の少なくとも2つを加算して生成されることを特徴とする請求項1から請求項15のいずれか1項に記載の画像処理装置。
  17. 光学系からの光束を受光し、視点の異なる複数のアナログ画像信号を出力する複数の光電変換部を有する撮像素子と、
    前記撮像素子から出力される前記複数の第1の画像に基づいて前記基本画像および前記複数の第2の画像を符号化する請求項1から請求項11のいずれか1項に記載の画像処理装置と、
    前記画像処理装置で符号化された符号化データをメモリに記録する記録手段と、
    を有することを特徴とする撮像装置。
  18. 前記符号化手段で符号化され、前記メモリに記録された符号化データを復号し、前記複数の第1の画像の視差を利用した画像処理を施す画像処理回路を有することを特徴とする請求項17に記載の撮像装置。
  19. 光学系からの光束を受光し、視点の異なる複数のアナログ画像信号を出力する複数の光電変換部を有する第1半導体基板と、
    前記複数のアナログ画像信号に基づいて生成された前記基本画像および前記複数の第2の画像を符号化する請求項1から請求項11のいずれか1項に記載の画像処理装置を有する第2半導体基板と、
    が積層状に重ねて配置されて構成されることを特徴とする撮像素子。
  20. 画像処理装置が実行する画像処理方法であって、
    視点が異なる複数の第1の画像に対応する基本画像と、それぞれが前記複数の第1の画像の1つまたは2つ以上に対応する複数の第2の画像とを、高帯域成分を含むサブバンドと高帯域成分を含まないサブバンドとを含む、複数のサブバンドに分割する分割工程と、
    前記複数の第2の画像と前記基本画像とを符号化する符号化工程と、を有し、
    前記符号化工程では、前記複数の第2の画像と前記基本画像とで符号化するサブバンドを異ならせ、前記複数の第2の画像については前記高帯域成分を含むサブバンドについて符号化し、前記基本画像については前記高帯域成分を含まないサブバンドについて符号化する、
    ことを特徴とする画像処理方法。
  21. 画像処理装置が実行する画像処理方法であって、
    視点が異なる複数の第1の画像に対応する基本画像と、それぞれが前記複数の第1の画像の1つまたは2つ以上に対応する複数の第2の画像とを、輝度成分と色差成分とに変換する変換工程と、
    前記輝度成分と前記色差成分とを、高帯域成分を含むサブバンドと高帯域成分を含まないサブバンドとを含む、複数のサブバンドに分割する分割工程と、
    前記複数の第2の画像と前記基本画像とを符号化する符号化工程と、を有し、
    前記符号化工程では、
    前記複数の第2の画像と前記基本画像とで符号化するサブバンドを異ならせ、
    前記基本画像について、前記色差成分は前記複数のサブバンドについて符号化し、前記輝度成分は前記高帯域成分を含まないサブバンドについて符号化し、
    前記複数の第2の画像について、前記色差成分は符号化せず、前記輝度成分は前記高帯域成分を含むサブバンドについて符号化する、
    ことを特徴とする画像処理方法。
  22. 画像処理装置が実行する画像処理方法であって、
    視点が異なる複数の第1の画像に対応する基本画像についての高帯域成分を含まないサブバンドの符号化データと、それぞれが前記複数の第1の画像の1つまたは2つ以上に対応する複数の第2の画像についての前記高帯域成分を含むサブバンドの符号化データとを取得する取得工程と、ここで、前記基本画像についての符号化データと、前記複数の第2の画像についての符号化データとは、異なるサブバンドについての符号化データであり、
    前記複数の第2の画像についての符号化データを用いて復元した前記複数の第1の画像を用いてリフォーカス画像を生成する生成工程と、
    前記基本画像についての符号化データから復号した前記基本画像に前記リフォーカス画像を加算する加算工程と、
    を有することを特徴とする画像処理方法。
  23. コンピュータを、請求項1から請求項11のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
  24. コンピュータを、請求項12から請求項16のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
JP2017214186A 2017-11-06 2017-11-06 画像処理装置および画像処理方法 Active JP7041494B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017214186A JP7041494B2 (ja) 2017-11-06 2017-11-06 画像処理装置および画像処理方法
US16/178,808 US10750193B2 (en) 2017-11-06 2018-11-02 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017214186A JP7041494B2 (ja) 2017-11-06 2017-11-06 画像処理装置および画像処理方法

Publications (3)

Publication Number Publication Date
JP2019087859A JP2019087859A (ja) 2019-06-06
JP2019087859A5 JP2019087859A5 (ja) 2020-12-17
JP7041494B2 true JP7041494B2 (ja) 2022-03-24

Family

ID=66327893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017214186A Active JP7041494B2 (ja) 2017-11-06 2017-11-06 画像処理装置および画像処理方法

Country Status (2)

Country Link
US (1) US10750193B2 (ja)
JP (1) JP7041494B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015082757A (ja) 2013-10-23 2015-04-27 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP2015171097A (ja) 2014-03-10 2015-09-28 キヤノン株式会社 画像処理装置及びその制御方法
JP2015207831A (ja) 2014-04-17 2015-11-19 キヤノン株式会社 画像符号化装置及びその制御方法
JP2017143355A (ja) 2016-02-08 2017-08-17 キヤノン株式会社 画像符号化装置及び方法及び撮像装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002345551A1 (en) * 2001-06-29 2003-03-03 Oki Electric Industry Co., Ltd. Method and system for watermarking an electrically depicted image
US7418144B2 (en) * 2004-03-03 2008-08-26 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communications Research Centre Canada Curved wavelet transform for image and video compression
US7292257B2 (en) * 2004-06-28 2007-11-06 Microsoft Corporation Interactive viewpoint video system and process
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015082757A (ja) 2013-10-23 2015-04-27 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP2015171097A (ja) 2014-03-10 2015-09-28 キヤノン株式会社 画像処理装置及びその制御方法
JP2015207831A (ja) 2014-04-17 2015-11-19 キヤノン株式会社 画像符号化装置及びその制御方法
JP2017143355A (ja) 2016-02-08 2017-08-17 キヤノン株式会社 画像符号化装置及び方法及び撮像装置

Also Published As

Publication number Publication date
JP2019087859A (ja) 2019-06-06
US10750193B2 (en) 2020-08-18
US20190141341A1 (en) 2019-05-09

Similar Documents

Publication Publication Date Title
JP6139713B2 (ja) デュアルアパーチャズームデジタルカメラ
KR101027353B1 (ko) 전자 비디오 이미지 안정화
US20070188619A1 (en) Method for correcting distortion of captured image, device for correcting distortion of captured image, and imaging device
US10051276B2 (en) Image encoding apparatus, method and imaging apparatus
US8948503B2 (en) Image processing device, image processing method, and image pickup device
KR20120074960A (ko) 노이즈 변화와 움직임 감지를 고려한 영상 노이즈 필터링 방법 및 장치
US8994788B2 (en) Image coding apparatus, method, program, and circuit using blurred images based on disparity
WO2014010224A1 (ja) 動画像圧縮装置、動画像復号装置、画像圧縮装置、画像復号装置、撮像装置およびプログラム
CA3048382A1 (en) Image processing apparatus and image processing method
JP2009253667A (ja) 動画処理装置及び動画処理方法、動画処理プログラム
JP7181759B2 (ja) 画像処理装置および画像処理方法
JP7041494B2 (ja) 画像処理装置および画像処理方法
JP5959194B2 (ja) 撮像装置
JP2018046324A (ja) 撮像センサ及びその制御方法、撮像装置
JP7079080B2 (ja) 画像処理装置および画像処理方法
JP2017220828A (ja) 符号化装置、撮像装置、符号化方法及びプログラム
US10791334B2 (en) Image processing apparatus and image processing method
JP4375662B2 (ja) 画像処理装置、画像処理方法、プログラム、情報記録媒体及び撮像装置
JP6907004B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6467455B2 (ja) 撮像装置、その制御方法、プログラム及び記録媒体
JP2015162709A (ja) 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
WO2012026122A1 (ja) 撮像装置
JP2020031336A (ja) 撮像装置
CN112135130B (zh) 视频编译码方法及其图像处理装置
US20220256127A1 (en) Image encoding apparatus, method for controlling the same, and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201106

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201106

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220311

R151 Written notification of patent or utility model registration

Ref document number: 7041494

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151