JP2015521394A - 適応的カーネルを利用することにより深度推定を実行するためのシステム及び方法 - Google Patents

適応的カーネルを利用することにより深度推定を実行するためのシステム及び方法 Download PDF

Info

Publication number
JP2015521394A
JP2015521394A JP2015503228A JP2015503228A JP2015521394A JP 2015521394 A JP2015521394 A JP 2015521394A JP 2015503228 A JP2015503228 A JP 2015503228A JP 2015503228 A JP2015503228 A JP 2015503228A JP 2015521394 A JP2015521394 A JP 2015521394A
Authority
JP
Japan
Prior art keywords
kernel
aperture
depth
procedure
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015503228A
Other languages
English (en)
Other versions
JP5988068B2 (ja
Inventor
ガジ アリ
ガジ アリ
ピンシャン リ
ピンシャン リ
松井 啓
啓 松井
貴美 水倉
貴美 水倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2015521394A publication Critical patent/JP2015521394A/ja
Application granted granted Critical
Publication of JP5988068B2 publication Critical patent/JP5988068B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/571Depth or shape recovery from multiple images from focus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/95Computational photography systems, e.g. light-field imaging systems
    • H04N23/958Computational photography systems, e.g. light-field imaging systems for extended depth of field imaging
    • H04N23/959Computational photography systems, e.g. light-field imaging systems for extended depth of field imaging by adjusting depth of field during image capture, e.g. maximising or setting range based on scene characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10141Special mode during image acquisition
    • G06T2207/10148Varying focus

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)
  • Focusing (AREA)
  • Automatic Focus Adjustment (AREA)
  • Measurement Of Optical Distance (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

適応的カーネルを利用することにより深度推定手順を支援するためのシステム及び方法が、写真ターゲットの画像を取り込むための取り込みサブシステムを含む。この取り込みサブシステムは、写真ターゲットからの反射光をセンサ装置に入れることについて調整可能な絞りを含む。適応的カーネルは、絞りの対称特性に基づきカーネル設計手順で設計される。適応的カーネルは、周波数領域カーネル設計手順又は空間領域カーネル設計手順のいずれかで設計することができる。この適応的カーネルを深度推定器が利用して深度推定手順を実行する。【選択図】図1

Description

本発明は、一般に画像データを解析するための技術に関し、具体的には、適応的カーネルを利用することにより深度推定手順を実行するためのシステム及び方法に関する。
画像データを解析するための効率的な方法を実装することは、現代の電子装置の設計者及び製造者にとって重要な検討課題である。しかしながら、電子装置を用いて画像データを効率的に解析することにより、システム設計者にとっては多くの課題が生じる可能性がある。例えば、装置の機能及び性能を高める要求が増えることにより、より高いシステム処理能力、及び追加のハードウェアリソースが必要になる可能性がある。処理要件又はハードウェア要件が高まることにより、生産コスト及び経営の非効率性の増加に起因して、対応する不利益な経済的影響がもたらされる可能性もある。
さらに、様々な高度な動作を行うように装置の能力を高めると、システムユーザにさらなる利点がもたらされることもあるが、様々な装置の構成要素の制御及び管理にかかる負担が増える可能性もある。例えば、デジタル画像データを効果的に解析する高度な電子装置は、関連するデジタルデータの量の多さと複雑性により、効果的な実装から恩恵を受けることができる。
米国特許第8045046号明細書
システムリソースに対する需要の伸び、及びデータの大きさの大幅な増加により、画像データを解析するための新たな技術を開発することが、関連する電子技術にとっての懸案事項であることは明らかである。従って、上述した全ての理由から、画像データを解析するための効果的なシステムを開発することは、現代の電子装置の設計者、製造者及びユーザにとって依然として重要な検討課題のままとなっている。
本発明では、適応的カーネルを利用することにより深度推定手順を実行するためのシステム及び方法を開示する。深度推定手順を利用して、対応する写真ターゲット又はシーンの深度マップを作成することができる。カメラの非対称的な絞り形状により、深度マップの非一様性を引き起こすことができる。1つの代表的な深度マップ生成技術に、畳み込みカーネルを用いて2つの画像の焦点ずれしたボケを整合させて深度の間接的推定値を求めるdepth−from−defocus技術がある。従って、畳み込みカーネルは、正確な深度値を得る上で重要な役割を果たす。
本発明の一実施形態では、いずれかの効果的な方法でカメラ絞りデータを取得する。カメラ絞りデータは、以下に限定されるわけではないが、絞りの形状、絞りの寸法、及び絞りの対称特性を含むいずれかの適切な情報を含むことができる。このカメラ絞りデータを、いずれかの効果的な技術を利用して解析することができる。例えば、絞り情報解析は、1又はそれ以上の設計者が手動で行うことも、或いは1又はそれ以上のコンピュータ装置が自動的に行うこともできる。
この結果、絞りが対称又は非対称のいずれであるかを判定する。絞りが対称である場合、カメラのローカルメモリに対称カーネル係数を記憶することができる。一方、絞りが非対称である場合、いずれかの効果的な方法で適切な非対称畳み込みカーネルを設計することができる。例えば、非対称畳み込みカーネルは、1又はそれ以上の設計者が手動で作成することも、或いは1又はそれ以上のコンピュータ装置が自動的に作成することもできる。いくつかの実施形態では、周波数領域カーネル設計法を利用して非対称畳み込みカーネルを設計することができる。他の実施形態では、空間領域カーネル設計法を利用して非対称畳み込みカーネルを設計することができる。結果として得られた非対称カーネル係数を、カメラのローカルメモリに記憶することができる。
カメラは、その後の動作時に、特定の現在のカメラ絞り特性に応じて、メモリから適切な畳み込みカーネルを選択することができる。最後に、カメラは、選択した畳み込みカーネルを利用して畳み込み手順を実行し、確実に深度推定手順を支援することができる。従って、本発明は、適応的畳み込みカーネルを利用することにより深度推定手順を実行するための改善されたシステム及び方法を提供する。
本発明による、カメラ装置の一実施形態のブロック図である。 本発明による、図1の取り込みサブシステムの一実施形態のブロック図である。 本発明による、図1の制御モジュールの一実施形態のブロック図である。 本発明による、図3のメモリの一実施形態のブロック図である。 本発明による、焦点ずれしたボケ画像を取り込むための1つの例示的な実施形態を示す図である。 本発明の一実施形態による、カーネル畳み込み手順を示す図である。 本発明の一実施形態による、例示的な整合曲線のグラフである。 本発明の一実施形態による、適応的カーネルを用いて深度推定手順を実行する方法ステップのフローチャートである。 本発明の一実施形態による、適応的カーネルを用いて深度推定手順を実行する方法ステップのフローチャートである。 本発明の一実施形態による、周波数領域カーネル設計手順を示す図である。 本発明の一実施形態による、周波数領域カーネル設計手順を示す図である。 本発明の一実施形態による、空間領域カーネル設計手順を示す図である。 本発明の一実施形態による、空間領域カーネル設計手順を示す図である。 本発明の一実施形態による、空間領域カーネル設計手順を示す図である。
本発明は、画像データ解析技術の改善に関する。以下の説明は、当業者が本発明を実施して使用できるようにするために提供し、特許出願及びその要件との関連で行うものである。当業者には、開示する実施形態の様々な修正例が容易に明らかになるであろうし、本明細書における一般的な原理を他の実施形態に適用することもできる。従って、本発明は、図示の実施形態に限定されることは意図されておらず、本明細書で説明する原理及び特徴に従う最も広い範囲を許容すべきものである。
本発明は、適応的カーネルを利用することにより深度推定手順を支援するためのシステム及び方法を含み、写真ターゲットの画像を取り込むための取り込みサブシステムを含む。この取り込みサブシステムは、写真ターゲットからの反射光をセンサ装置に入れることについて調整可能な絞りを含む。適応的カーネルは、絞りの対称特性に基づきカーネル設計手順で設計される。適応的カーネルは、周波数領域カーネル設計手順又は空間領域カーネル設計手順のいずれかで設計することができる。この適応的カーネルを深度推定器が利用して深度推定手順を実行する。
ここで図1を参照すると、本発明によるカメラ装置110の一実施形態のブロック図を示している。図1の実施形態では、カメラ装置110が、以下に限定されるわけではないが、取り込みサブシステム114、システムバス116、及び制御モジュール118を含むことができる。図1の実施形態では、取り込みサブシステム114を写真ターゲット112に光学的に結合することができ、またシステムバス116を介して制御モジュール118に電気的に結合することもできる。
別の実施形態では、カメラ装置110が、図1の実施形態に関連して説明する構成要素に加え又はこれらの代わりに、他の様々な構成要素を容易に含むことができる。また、いくつかの実施形態では、図1のカメラ装置110以外のいずれかの適当なタイプの電子装置内で本発明を具体化することもできる。例えば、カメラ装置110を、イメージング装置、コンピュータ装置又は消費者電子装置として実装することもできる。
図1の実施形態では、カメラ装置110の取り込みサブシステム114がターゲット112に自動的に焦点を合わせると、カメラユーザは、ターゲット112に対応する画像データを取り込むようにカメラ装置110に要求することができる。この時、制御モジュール118が、システムバス116を介して取り込みサブシステム114に、ターゲット112を表す画像データを取り込むように指示できることが好ましい。その後、この取り込んだ画像データを、システムバス116を介して制御モジュール118に送信し、これに応答して、制御モジュール118は、この画像データを用いて様々な処理及び機能を実行することができる。システムバス116は、取り込みサブシステム114と制御モジュール118の間で様々な状態信号及び制御信号を双方向に受け渡すこともできる。
図2を参照すると、本発明による図1の取り込みサブシステム114の一実施形態のブロック図を示している。図2の実施形態では、取り込みサブシステム114が、以下に限定されるわけではないが、絞り218、レンズ220、画像センサ224、赤色、緑色及び青色(R/G/B)増幅器228、アナログ−デジタル(A/D)変換器230、及びインターフェイス232を含むことが好ましい。別の実施形態では、取り込みサブシステム114が、図2の実施形態に関連して説明するこれらの構成要素に加え又はこれらの代わりに、他の様々な構成要素を容易に含むことができる。
図2の実施形態では、取り込みサブシステム114が、光路236に沿って画像センサ224に衝突する反射光を介して、ターゲット112に対応する画像データを取り込むことができる。いくつかの実施形態では、絞り218が、画像センサ224に到達する反射光の量を調整するように制御可能なシャッター機構を含む。画像センサ224は、電荷結合素子(CCD)を含むことが好ましく、これに応答して、ターゲット112を表す画像データの組を生成することができる。
その後、この画像データは、増幅器228、A/D変換器230及びインターフェイス232を経由することができる。画像データは、インターフェイス232からシステムバス116を介して制御モジュール118に受け渡され、適切に処理されて記憶される。本発明との関連では、画像データを取り込むために、CMOS又は線形アレイなどの他のタイプの画像取り込みセンサも企図される。カメラ110の利用及び機能については、図3〜図8Cに関連してさらに後述する。
ここで図3を参照すると、本発明による図1の制御モジュール118の一実施形態のブロック図を示している。図3の実施形態では、制御モジュール118が、以下に限定されるわけではないが、ファインダ308、中央処理装置(CPU)344、メモリ346、及び1又はそれ以上の入力/出力インターフェイス(I/O)348を含むことが好ましい。ファインダ308、CPU344、メモリ346及びI/O348の各々は、取り込みサブシステム114と通信する共通システムバス116を介してやはり取り込みサブシステム114に結合され、これと通信することが好ましい。別の実施形態では、制御モジュール118が、図3の実施形態に関連して説明するこれらの構成要素に加え又はこれらの代わりに、他の様々な構成要素を容易に含むことができる。
図3の実施形態では、CPU344を、いずれかの適当なマイクロプロセッサ装置を含むように実装することができる。或いは、他の適当な技術を用いてCPU344を実装することもできる。例えば、特定用途向け集積回路(ASIC)又はその他の適当な電子装置を含むようにCPU344を実装することができる。メモリ346は、以下に限定されるわけではないが、リードオンリメモリ、ランダムアクセスメモリ、及びフロッピー(登録商標)ディスク装置、ハードディスク装置又はフラッシュメモリなどの様々なタイプの不揮発性メモリを含む1又はそれ以上の適当な記憶装置として実装することができる。I/O348は、カメラ装置110と、システムユーザ又は別の電子装置を含むいずれかの外部エンティティとの間の双方向通信を容易にするための1又はそれ以上の効果的なインターフェイスを提供することができる。I/O348は、いずれかの適当な入力装置及び/又は出力装置を用いて実装することもできる。制御モジュールの動作及び利用については、図4〜図8Cに関連してさらに後述する。
ここで図4を参照すると、本発明による図3のメモリ346の一実施形態のブロック図を示している。図4の実施形態では、メモリ346が、以下に限定されるわけではないが、カメラアプリケーション412、オペレーティングシステム414、深度推定器416、画像データ418、推定データ420、オートフォーカスモジュール422、及び雑情報424を含むことができる。別の実施形態では、メモリ346が、図4の実施形態に関連して説明するこれらの構成要素に加え又はこれらの代わりに、他の様々な構成要素を容易に含むことができる。
図4の実施形態では、カメラアプリケーション412が、好ましくはCPU344(図3)により実行されてカメラ装置110の様々な機能及び動作を実行するプログラム命令を含むことができる。カメラアプリケーション412の特定の性質及び機能は、対応するカメラ装置110のタイプ及び特定の使用法などの因子によって異なることが好ましい。
図4の実施形態では、オペレーティングシステム414がカメラ装置110の低レベル機能を制御し、調整することが好ましい。本発明によれば、深度推定器416は、深度推定手順を制御し、調整して、カメラ装置110のオートフォーカス機能を容易にすることができる。図4の実施形態では、画像データ418が、カメラ装置110が取り込んだ写真ターゲット112の1又はそれ以上の画像を含むことができる。推定データ420は、深度推定手順を実行するためのあらゆるタイプの情報又はデータを含むことができる。例えば、推定データ420は、後述する1又はそれ以上の対称又は非対称畳み込みカーネルを含むことができる。図4の実施形態では、オートフォーカスモジュール422が、深度推定手順の結果を利用してカメラ装置110のオートフォーカス手順を実行することができる。雑情報424は、カメラ装置110の動作に関する他のあらゆる適当な情報を含む。深度推定器416の動作に関するさらなる詳細については、図5A〜図8Cに関連してさらに後述する。
ここで図5Aを参照すると、本発明による、焦点ずれしたボケ画像518を取り込むための1つの例示的な実施形態の図を示している。図5Aの実施形態は例示目的で示すものであり、別の実施形態では、本発明は、他の様々な構成及び要素を利用して、焦点ずれしたボケ画像518を取り込むことができる。
図5Aの実施形態では、カメラ装置110のセンサ224(図2を参照)が、深度推定手順を実行するための写真ターゲット又はシーン112の焦点ずれしたボケ画像518を取り込むことができる。焦点ずれしたボケ画像518は、レンズ220を、ターゲット112、レンズ220及びセンサ224の相対的な位置に依存する焦点が合った正しいレンズ位置以外の位置に調整することによって生成することができる。
一実施形態では、2つの異なる焦点ずれしたボケ画像518を比較して深度推定を得ることができる。互いに1被写界深度だけ離れた2つのボケ画像518のボケ差を計算することができる。既知の整合曲線の傾き及びボケ差を利用して、所与のターゲット112の深度を求めることができる。深度推定のための焦点ずれしたボケ画像の生成及び利用については、図6〜図8Cに関連してさらに後述する。
ここで図5Bを参照すると、この図には、本発明の一実施形態によるカーネル畳み込み手順を示している。図5Bの実施形態は例示目的で示すものであり、別の実施形態では、本発明は、他の様々な構成及び技術を利用してカーネル畳み込み手順を実行することができる。
図5Bの実施形態では、いずれかの効果的な形で実装されるガウス畳み込みカーネル522でオリジナル画像520を畳み込んで、畳み込み画像526を作成することができる。いくつかの実施形態では、カーネル522を、オリジナル画像520の様々な対応するそれぞれの画素値に各々適用される個々のカーネル係数を有するフィルタ行列として実装することができる。次に、結果として得られた値を組み合わせて、畳み込み画像526の畳み込み中心画素値を生成することができる。その後、オリジナル画像520の画素毎に畳み込み手順を繰り返して、畳み込み画像526を完全に読み込むことができる。深度推定のための畳み込みカーネルの生成及び利用については、図5C〜図8Cに関連してさらに後述する。
ここで図5Cを参照すると、本発明の一実施形態による例示的な整合曲線714のグラフを示している。図5Cの実施形態は例示目的で示すものであり、別の実施形態では、図5Cの実施形態に関連して説明するこれらの構成及びパラメータの一部に加え又はこれらの代わりに、様々な構成及びパラメータの整合曲線を利用するように本発明を実装することができる。
いくつかの実施形態では、ボケ画像1と、より焦点ずれの大きなボケ画像2とを取り込み、鮮明な方の画像1をガウス畳み込みカーネル(例えば、分散の少ない3×3のガウス行列)で畳み込んで、畳み込み画像1を生成することができる。この畳み込み画像1をボケ画像2と比較する。この処理を、2つのボケ画像が一致するまで繰り返す。次に、この繰り返し回数を被写界深度(すなわち、1DOFきざみの画像番号)に対してグラフ化してボケの整合曲線を生成し、これを用いていずれかの焦点ずれした位置から焦点が合った位置までの距離を推定することができる。畳み込みカーネル及び上述した深度推定技術に関するさらなる詳細は、Li他に付与された米国特許第8,045,046号にさらに記載されており、この特許は引用により本明細書に組み入れられる。
ここで図6A〜図6Bを参照すると、本発明の一実施形態による、適応的カーネルを用いて深度推定手順を実行する方法ステップのフローチャートを示している。図6の実施形態は例示目的で示すものであり、別の実施形態では、本発明は、図6の実施形態に関連して説明するステップ及びシーケンス以外の様々なステップ及びシーケンスを容易に利用することができる。
深度推定手順を利用して、対応する写真ターゲット又はシーンの深度マップを作成することができる。カメラの非対称的な絞り形状により、深度マップの非一様性を頻繁に引き起こすことができる。ほとんどの場合、非対称的な絞り形状は、カメラの点像分布関数(PSF)も非対称にする。この結果、これらのカメラを使用して得られる深度マップは、画像方向依存性を示す。本発明を有利に利用して、様々なカメラ絞りの非対称特性を適切に処理できる深度マップアルゴリズムを設計することができる。
実際には、様々な異なる技術を用いて単一の又は複数の画像から深度マップを生成することができる。例えば、depth from defocus、立体撮像、depth from shadingなどから深度情報を回復することができる。1つの代表的な受動的深度マップ生成技術に、depth from defocus技術(DFD)がある。DFDでは、畳み込みカーネルを用いて2つの画像領域のボケを整合させ、深度の間接的推定値を求める。従って、畳み込みカーネルは、深度値を得る上で重要な役割を果たす。
従来は、カメラ設定に関わらず、対称的かつ一様な畳み込みカーネルが画像全体に適用されていた。カメラのPSFは、例えば絞り設定などのカメラパラメータに依存するので、通常はこれにより問題が生じる。非対称的な絞り形状はPSFを非対称にし、また対称的な畳み込みカーネルは正しい深度を取り込むことができない。本発明は、カメラ絞り情報などの因子に基づく適応的カーネルの設計及び利用を効果的に支援し、従って一様な、整合性のある、信頼性の高い深度マップが得られるようになる。
図6Aの実施形態では、ステップ614において、いずれかの効果的な方法でカメラ絞りデータを取得する。カメラ絞りデータは、以下に限定されるわけではないが、絞りの形状、絞りの寸法、及び絞りの対称特性を含むいずれかの適切な情報を含むことができる。ステップ618において、いずれかの効果的な技術を用いてカメラ絞りデータを解析することができる。例えば、絞り情報の解析は、1又はそれ以上の設計者が手動で行うことも、或いは1又はそれ以上のコンピュータ装置が自動的に行うこともできる。
ステップ622において、絞りが対称又は非対称のいずれであるかを判定する。絞りが対称である場合、カメラ装置110のメモリ346(図3)に対称カーネル係数を記憶し、図6Aの処理は、接続文字「B」を通じて図6Bのステップ642に進む。一方、絞りが非対称である場合、図6Aの処理は、接続文字「A」を通じて図6Bのステップ630に進む。
ステップ630において、いずれかの効果的な方法で適切な非対称畳み込みカーネルを設計することができる。例えば、非対称畳み込みカーネルは、1又はそれ以上の設計者が手動で作成することも、或いは1又はそれ以上のコンピュータ装置が自動的に作成することもできる。いくつかの実施形態では、周波数領域カーネル設計法を利用して非対称畳み込みカーネルを設計することができる。また、他の実施形態では、空間領域カーネル設計法を利用して非対称畳み込みカーネルを設計することもできる。ステップ634において、結果として得られた非対称カーネル係数をカメラ装置110のメモリ346(図3)に記憶することができる。
次に、ステップ638において、カメラ装置110は、特定の現在のカメラ絞り特性に応じて、メモリ346から適切な畳み込みカーネルを選択することができる。最後に、ステップ642において、カメラ装置110は、選択した畳み込みカーネルを利用して適切な畳み込み手順を実行し、深度推定手順を支援することができる。図6の処理は終了することができる。従って、本発明は、適応的畳み込みカーネルを利用することにより深度推定手順を実行するための改善されたシステム及び方法を提供する。
ここで図7A〜図7Bを参照すると、これらの図には、本発明の一実施形態による周波数領域カーネル設計手順を示している。図7の実施形態は例示目的で示すものであり、別の実施形態では、本発明は、図7の実施形態に関連して説明する要素及び構成以外の要素及び構成を用いてカーネル設計手順を実行することができる。
図7Aの実施形態では、非対称的な絞り712のグラフを空間領域で示している。図7Aの実施形態では、垂直軸Y上に第1の絞り寸法を示し、水平軸X上に第2の絞り寸法を示す。図7Aの実施形態では、絞り712が、水平寸法「a」718及び垂直寸法「b」714を含む。図7Aに示すように、水平寸法「a」718と垂直寸法「b」714は等しくなく、絞り712を非対称にしている。
図7Bの実施形態では、図7Aの非対称絞り712の周波数領域における表現722を示している。いくつかの実施形態では、図7Aの空間領域絞り712に適切な高速フーリエ変換(FFT)を適用することにより、図7Bの表現722を生成することができる。図7Aの実施形態では、垂直軸Fv上に垂直周波数を示し、水平軸Fu上に水平周波数を示す。図7Bの実施形態では、表現722が、水平帯域幅「Bu」730及び垂直帯域幅「Bv」726を含む。
図7Bの実施形態では、水平帯域幅「Bu」730が図7Aの水平寸法「a」718に対応し、垂直帯域幅「Bv」726が図7Aの垂直寸法「b」714に対応する。図7Bの実施形態では、水平帯域幅「Bu」730が水平遮断周波数738により制限され、垂直帯域幅「Bv」726は垂直遮断周波数734により制限される。周波数変数「Bu」及び「Bv」は、帯域幅特性(絞りがどれほどの周波数をサポートできるか)を表す。これらの遮断周波数を利用して、これら2つの帯域幅に合わせたフィルタカーネルを設計することができる。あらゆる標準的な又は高度なフィルタ設計技術を利用することができる。次に、これらの情報を組み合わせて、非対称畳み込みカーネルを生成しなければならない。
実際には、最初に絞り712(図7A)の点像分布関数(PSF)にFFTを適用する。次に、水平遮断周波数及び垂直遮断周波数に基づいて水平フィルタ及び垂直フィルタを設計することができる。その後、水平フィルタと垂直フィルタを組み合わせて組み合わせフィルタを生成する。組み合わせフィルタに逆FFTを実行して非対称畳み込みカーネルを生成する。いくつかの実施形態では、元々のカーネルが一定のカーネルサイズを超える場合、縮小サイズのカーネルを用いて畳み込みカーネルを近似させることが必要となり得る。
ここで図8A〜図8Cを参照すると、これらの図には、本発明の一実施形態による空間領域カーネル設計手順を示している。図8の実施形態は例示目的で示すものであり、別の実施形態では、本発明は、図8の実施形態に関連して説明する要素及び技術以外の要素及び技術を利用してカーネル設計手順を実行することができる。
図8Aの実施形態には、水平テストページ画像816を示している。また、画像816に対応する空間領域の非対称絞り812のグラフも示している。同様に、図8Bの実施形態には、垂直テストページ画像824を示している。また、画像826に対応する空間領域の非対称絞り820のグラフも示している。垂直テストページ画像824は、水平テストページ画像816を90度回転させたものである。
水平テストページ画像816を使用する場合、焦点ずれしたボケは垂直方向(Y)に存在し、繰り返し回数は垂直方向のPSF分散に比例する。垂直テストページ画像824を使用する場合、焦点ずれしたボケは水平方向(X)に存在し、繰り返し回数は水平方向のPSF分散に比例する。本発明によれば、図8Cに関連してさらに後述するように、図8A及び図8Bの実施形態の空間解析を行って非対称畳み込みカーネルを生成することができる。
図8Cの実施形態は例示目的示すものであり、別の実施形態では、本発明は、図8の実施形態に関連して説明する要素及び技術以外の要素及び技術を利用してカーネル設計手順を実行することができる。例えば、図8Cの例に示す様々な特定の計算値又は実装値は、他のいずれかの効果的な又は適切な計算値又は実装値に置き換えることができる。
図8Cの例は、水平フィルタカーネル828、垂直フィルタカーネル832、水平−垂直フィルタ組み合わせ処理836、及び最終的非対称畳み込みカーネル840を含む。本発明の一実施形態によれば、上述した図8A及び図8Bの実施形態に対して空間領域解析を行い、以下の変数に従って非対称畳み込みカーネル840を定義するための表現式(以下の式1を参照)を生成することができる。
Figure 2015521394

Figure 2015521394
式中、
Figure 2015521394
=水平テストページ及び[161]カーネルを用いた繰り返し回数
Figure 2015521394
=垂直テストページ及び[161]カーネルを用いた繰り返し回数
Figure 2015521394
=[161]カーネルの分散
Figure 2015521394
=水平(X)方向に沿ったボケのガウス近似
Figure 2015521394
=垂直(Y)方向に沿ったボケのガウス近似
Figure 2015521394
[式1]
従って、図8の例では、式1により、垂直分散値と水平分散値の間にほぼ2対1の関係が存在すべきであることが示される。従って、本発明の一実施形態によれば、図8Cの例では、水平−垂直フィルタ組み合わせ処理836において水平フィルタカーネル828と垂直フィルタカーネル832を組み合わせて、最終的非対称畳み込みカーネル840が生成される。
以上、いくつかの実施形態を参照しながら本発明を説明した。当業者には、本開示に照らして他の実施形態が明らかであろう。例えば、上記の実施形態で説明した構成及び技術以外の構成及び技術を用いて本発明を容易に実装することもできる。また、上記に説明したシステム以外のシステムと共に本発明を効果的に使用することもできる。従って、添付の特許請求の範囲によってのみ限定される本発明には、説明した実施形態に対するこれらの及びその他の変形形態も含まれることが意図されている。
110 カメラ装置
112 ターゲット
114 取り込みサブシステム
116 システムバス
118 制御モジュール

Claims (20)

  1. 深度推定手順を支援するためのシステムであって、
    写真ターゲットからの反射光をセンサ装置に入れることについて調整可能な絞りを含む、前記写真ターゲットの画像を取り込むための取り込みサブシステムと、
    前記絞りの対称特性に基づきカーネル設計手順で設計される適応的カーネルと、
    前記適応的カーネルを用いて前記深度推定手順を実行する深度推定器と、
    を備えることを特徴とするシステム。
  2. 前記深度推定器及び前記取り込みサブシステムは、デジタルカメラ装置に実装される、
    ことを特徴とする請求項1に記載のシステム。
  3. 前記深度推定手順から得られる深度値は、前記デジタルカメラのオートフォーカス手順で利用される、
    ことを特徴とする請求項2に記載のシステム。
  4. 前記画像は、前記写真ターゲットの焦点ずれしたボケ画像を含む、
    ことを特徴とする請求項1に記載のシステム。
  5. 前記深度推定器は、前記深度推定手順の実行中に、前記適応的カーネルを利用して1又はそれ以上の畳み込み手順を実行する、
    ことを特徴とする請求項4に記載のシステム。
  6. 前記適応的カーネルは、周波数領域カーネル設計手順で設計される、
    ことを特徴とする請求項1に記載のシステム。
  7. 前記適応的カーネルは、空間領域カーネル設計手順で設計される、
    ことを特徴とする請求項1に記載のシステム。
  8. 前記絞りの対称特性は絞りの形状を含む、
    ことを特徴とする請求項1に記載のシステム。
  9. 前記絞りの対称特性は絞りの寸法を含む、
    ことを特徴とする請求項1に記載のシステム。
  10. 前記絞りの対称特性は、前記絞りの水平特性を前記絞りの垂直特性と比較することにより解析される、
    ことを特徴とする請求項1に記載のシステム。
  11. 前記カーネル設計手順は、絞りの形状及び絞りの寸法を含むカメラ絞りデータを取得するステップと、該カメラ絞りデータを解析して前記対称特性を判定するステップとを含む、
    ことを特徴とする請求項1に記載のシステム。
  12. 前記対称特性が、前記絞りが対称であることを示す場合、ローカル記憶装置に対称カーネル係数が記憶される、
    ことを特徴とする請求項11に記載のシステム。
  13. 前記カーネル設計手順において非対称カーネル係数が設計され、前記対称特性が、前記絞りが非対称であることを示す場合、前記ローカル記憶装置に前記非対称カーネル係数が記憶される、
    ことを特徴とする請求項12に記載のシステム。
  14. 前記非対称カーネル係数は、周波数領域カーネル設計手順で設計される、
    ことを特徴とする請求項13に記載のシステム。
  15. 前記周波数領域カーネル設計手順は、
    前記絞りの点像分布関数に高速フーリエ変換を適用するステップと、
    前記高速フーリエ変換の水平遮断周波数及び垂直遮断周波数に基づいて水平フィルタ及び垂直フィルタを設計するステップと、
    を含み、その後、前記水平フィルタと前記垂直フィルタとを組み合わせて組み合わせフィルタが生成され、該組み合わせフィルタに逆高速フーリエ変換を行って前記適応的カーネルが生成される、
    ことを特徴とする請求項14に記載のシステム。
  16. 前記非対称カーネル係数は、空間領域カーネル設計手順で設計される、
    ことを特徴とする請求項13に記載のシステム。
  17. 前記空間領域カーネル設計手順は、
    前記絞りの水平点像分布関数及び垂直点像分布関数に対し空間領域解析を行って、前記絞りの垂直分散値と水平分散値の間の数学的関係を定めるステップと、
    前記数学的関係に基づいて、水平フィルタカーネル及び垂直フィルタカーネルを生成するステップと、
    を含み、前記水平フィルタカーネルと前記垂直フィルタカーネルをフィルタ組み合わせ処理で組み合わせて前記適応的カーネルが生成される、
    ことを特徴とする請求項16に記載のシステム。
  18. 前記深度推定器は、前記絞りの前記対称特性に応じて前記ローカル記憶装置から最適なカーネルを選択する、
    ことを特徴とする請求項13に記載のシステム。
  19. 前記深度推定器は、前記最適なカーネルを利用して前記深度推定手順を実行する、
    ことを特徴とする請求項18に記載のシステム。
  20. 写真ターゲットからの反射光をセンサ装置に入れることについて調整可能な絞りを含む、前記写真ターゲットの画像を取り込むための取り込みサブシステムを利用するステップと、
    前記絞りの対称特性に基づきカーネル設計手順で適応的カーネルを設計するステップと、
    前記適応的カーネルを利用して前記深度推定手順を実行する深度推定器を用意するステップと、
    を実行することにより深度推定手順を実行する方法。
JP2015503228A 2012-03-28 2013-03-06 適応的カーネルを利用することにより深度推定を実行するためのシステム及び方法 Active JP5988068B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/432,065 US9208570B2 (en) 2012-03-28 2012-03-28 System and method for performing depth estimation by utilizing an adaptive kernel
US13/432,065 2012-03-28
PCT/US2013/029279 WO2013148089A2 (en) 2012-03-28 2013-03-06 System and method for performing depth estimation by utilizing an adaptive kernel

Publications (2)

Publication Number Publication Date
JP2015521394A true JP2015521394A (ja) 2015-07-27
JP5988068B2 JP5988068B2 (ja) 2016-09-07

Family

ID=48047815

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015503228A Active JP5988068B2 (ja) 2012-03-28 2013-03-06 適応的カーネルを利用することにより深度推定を実行するためのシステム及び方法

Country Status (5)

Country Link
US (1) US9208570B2 (ja)
EP (1) EP2645334B1 (ja)
JP (1) JP5988068B2 (ja)
CN (1) CN103369233B (ja)
WO (1) WO2013148089A2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6245885B2 (ja) * 2013-08-02 2017-12-13 キヤノン株式会社 撮像装置およびその制御方法
US9519956B2 (en) * 2014-02-28 2016-12-13 Nokia Technologies Oy Processing stereo images
US9292926B1 (en) * 2014-11-24 2016-03-22 Adobe Systems Incorporated Depth map generation
US9530214B2 (en) 2014-12-04 2016-12-27 Sony Corporation Image processing system with depth map determination based on iteration count of blur difference and method of operation thereof
US9639946B2 (en) 2015-03-11 2017-05-02 Sony Corporation Image processing system with hybrid depth estimation and method of operation thereof
US9723197B2 (en) * 2015-03-31 2017-08-01 Sony Corporation Depth estimation from image defocus using multiple resolution Gaussian difference
US10382684B2 (en) * 2015-08-20 2019-08-13 Kabushiki Kaisha Toshiba Image processing apparatus and image capturing apparatus
JP6608763B2 (ja) 2015-08-20 2019-11-20 株式会社東芝 画像処理装置及び撮影装置
US9646225B2 (en) * 2015-08-21 2017-05-09 Sony Corporation Defocus estimation from single image based on Laplacian of Gaussian approximation
WO2017034046A1 (ko) * 2015-08-24 2017-03-02 재단법인 다차원 스마트 아이티 융합시스템 연구단 멀티 애퍼처 카메라에서의 깊이 추출 방법 및 장치
US10282623B1 (en) * 2015-09-25 2019-05-07 Apple Inc. Depth perception sensor data processing
US10097777B2 (en) 2016-06-03 2018-10-09 Recognition Robotics, Inc. Depth map from multi-focal plane images

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000152064A (ja) * 1998-11-16 2000-05-30 Ricoh Co Ltd 自動焦点制御装置
JP2011221535A (ja) * 2010-04-13 2011-11-04 Sony Corp 2写真照合に基づく奥行き推定のための4次元多項式モデル

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996041304A1 (en) 1995-06-07 1996-12-19 The Trustees Of Columbia University In The City Of New York Apparatus and methods for determining the three-dimensional shape of an object using active illumination and relative blurring in two images due to defocus
US6012458A (en) * 1998-03-20 2000-01-11 Mo; Larry Y. L. Method and apparatus for tracking scan plane motion in free-hand three-dimensional ultrasound scanning using adaptive speckle correlation
JP4288461B2 (ja) 2002-12-17 2009-07-01 日本電気株式会社 対称型画像フィルタ処理装置、プログラム、及びその方法
US20130190736A1 (en) * 2003-04-18 2013-07-25 Amo Manufacturing Usa, Llc Systems and methods for correcting high order aberrations in laser refractive surgery
US7221793B2 (en) * 2003-05-27 2007-05-22 Hewlett-Packard Development Company, L.P. Systems and methods for providing spatially-varied demosaicing
US7773111B2 (en) 2005-03-16 2010-08-10 Lc Technologies, Inc. System and method for perceived image processing in a gaze tracking system
CN1862358B (zh) 2005-05-11 2012-03-21 华移联科(沈阳)技术有限公司 一种自动调焦装置
EP1892666A1 (en) 2006-08-16 2008-02-27 Toyota Motor Europe NV A method, an apparatus and a computer-readable medium for processing an image dataset
US8417759B2 (en) * 2007-04-09 2013-04-09 DigitalOptics Corporation Europe Limited Efficient implementations of kernel computations
US8306348B2 (en) * 2007-04-24 2012-11-06 DigitalOptics Corporation Europe Limited Techniques for adjusting the effect of applying kernels to signals to achieve desired effect on signal
US8310587B2 (en) * 2007-12-04 2012-11-13 DigitalOptics Corporation International Compact camera optics
JPWO2009119838A1 (ja) 2008-03-27 2011-07-28 京セラ株式会社 光学系、撮像装置および情報コード読取装置
WO2009124276A1 (en) 2008-04-03 2009-10-08 Omnivision Cdm Optics, Inc. Imaging systems including distributed phase modification and associated methods
JP5361546B2 (ja) 2009-06-03 2013-12-04 キヤノン株式会社 レンズ装置、及びその制御方法
US8502864B1 (en) * 2009-07-28 2013-08-06 Robert Watkins Systems, devices, and/or methods for viewing images
DE102010023344A1 (de) * 2010-06-10 2012-01-19 Arnold & Richter Cine Technik Gmbh & Co. Betriebs Kg Kameraobjektiv und Kamerasystem
CN102314683B (zh) * 2011-07-15 2013-01-16 清华大学 一种非平面图像传感器的计算成像方法和成像装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000152064A (ja) * 1998-11-16 2000-05-30 Ricoh Co Ltd 自動焦点制御装置
JP2011221535A (ja) * 2010-04-13 2011-11-04 Sony Corp 2写真照合に基づく奥行き推定のための4次元多項式モデル

Also Published As

Publication number Publication date
US20130258096A1 (en) 2013-10-03
EP2645334B1 (en) 2016-05-18
WO2013148089A2 (en) 2013-10-03
CN103369233B (zh) 2016-12-28
EP2645334A1 (en) 2013-10-02
CN103369233A (zh) 2013-10-23
JP5988068B2 (ja) 2016-09-07
US9208570B2 (en) 2015-12-08
WO2013148089A3 (en) 2015-06-18

Similar Documents

Publication Publication Date Title
JP5988068B2 (ja) 適応的カーネルを利用することにより深度推定を実行するためのシステム及び方法
JP5454821B2 (ja) 多重解像度手順を利用してロバストな深度マップを生成するためのシステム及び方法
US20170256036A1 (en) Automatic microlens array artifact correction for light-field images
US9066002B2 (en) System and method for utilizing enhanced scene detection in a depth estimation procedure
JP6711396B2 (ja) 画像処理装置、撮像装置、および画像処理方法、並びにプログラム
JP2009239908A (ja) マルチフレーム再構築を行う方法、システム及びソフトウエア
JP2014150498A (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび撮像装置
JP5459523B2 (ja) 焦点ずれしたピルボックス画像を利用して深度推定を行うためのシステム及び方法
WO2016160093A1 (en) Depth estimation from image defocus using multiple resolution gaussian difference
US9262833B2 (en) Methodology for performing depth estimation with defocused images under extreme lighting conditions
JP5843599B2 (ja) 画像処理装置および撮像装置並びにその方法
JP6239985B2 (ja) 画像処理装置、画像処理プログラム及び撮像装置
US9020280B2 (en) System and method for evaluating focus direction under various lighting conditions
JP2015109681A (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび撮像装置
KR20150032764A (ko) 인위적으로 디포커스된 블러 이미지를 생성하는 방법 및 이미지 캡쳐링 디바이스
JP2014110624A (ja) 画像処理装置、画像処理方法及びプログラム
JP2017182668A (ja) データ処理装置、撮像装置、及びデータ処理方法
AU2015202282A1 (en) Camera parameter optimisation for depth from defocus

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160726

R151 Written notification of patent or utility model registration

Ref document number: 5988068

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250