JP2021196951A - 画像処理装置、画像処理方法、プログラム、学習済みモデルの製造方法、および画像処理システム - Google Patents

画像処理装置、画像処理方法、プログラム、学習済みモデルの製造方法、および画像処理システム Download PDF

Info

Publication number
JP2021196951A
JP2021196951A JP2020103809A JP2020103809A JP2021196951A JP 2021196951 A JP2021196951 A JP 2021196951A JP 2020103809 A JP2020103809 A JP 2020103809A JP 2020103809 A JP2020103809 A JP 2020103809A JP 2021196951 A JP2021196951 A JP 2021196951A
Authority
JP
Japan
Prior art keywords
image
image processing
viewpoints
unit
viewpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020103809A
Other languages
English (en)
Other versions
JP2021196951A5 (ja
Inventor
良範 木村
Yoshinori Kimura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2020103809A priority Critical patent/JP2021196951A/ja
Priority to US17/342,715 priority patent/US20210392313A1/en
Priority to CN202110665990.0A priority patent/CN113810676A/zh
Publication of JP2021196951A publication Critical patent/JP2021196951A/ja
Publication of JP2021196951A5 publication Critical patent/JP2021196951A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • G06T15/205Image-based rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/282Image signal generators for generating image signals corresponding to three or more geometrical viewpoints, e.g. multi-view systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】2視点画像から他視点画像を高精度に推定することが可能な画像処理装置を提供する。【解決手段】画像処理装置(103)は、同一被写体を異なる2つの視点で撮影した2つの第1の画像を取得する取得部(103b)と、2つの第1の画像を機械学習モデルに入力し、2つの視点とは異なる1つ以上の視点の第2の画像を推定する画像処理部(103c)とを有する。【選択図】図4

Description

本発明は、機械学習DL(Deep Learning)を用いて2視点画像から他視点画像を推定する画像処理装置に関する。
非特許文献1には、DLを用いて4視点画像から他視点画像を推定する方法が開示されている。ここで、4視点画像は同一被写体を異なる4つの視点で撮影した画像であり、他視点画像は4視点とは異なる1つ以上の視点で同一被写体を撮影した相当の画像である。
N.K.Kalantari、T−C.Wang、R.Ramamoorthi、 "Learning−Based View Synthesis for Light Field Camera"、 SIGGRAPH Asia (2016年).
非特許文献1に開示された方法を用いて、横方向に視差がついた2視点画像から他視点画像を推定する場合、2視点画像中に存在する横長(rectangular−shaped)被写体の推定精度が低下する。これは、2視点画像中に存在する横長被写体の対応点を見つけることが困難であり、カメラから横長被写体までの距離(デプス)が定まらないためである。
そこで本発明は、2視点画像から他視点画像を高精度に推定することが可能な画像処理装置を提供することを目的とする。
本発明の一側面としての画像処理装置は、同一被写体を異なる2つの視点で撮影した2つの第1の画像を取得する取得部と、前記2つの第1の画像を機械学習モデルに入力し、前記2つの視点とは異なる1つ以上の視点の第2の画像を推定する画像処理部とを有する。
本発明の他の目的及び特徴は、以下の実施例において説明される。
本発明によれば、2視点画像から他視点画像を高精度に推定することが可能な画像処理装置を提供することができる。
各実施例における機械学習モデルの学習の流れを示す図である。 実施例1における画像処理システムのブロック図である。 実施例1における画像処理システムの外観図である。 各実施例におけるウエイトの学習に関するフローチャートである。 各実施例における他視点画像の推定に関するフローチャートである。 実施例2における画像処理システムのブロック図である。 実施例2における画像処理システムの外観図である。 実施例3における画像処理システムのブロック図である。 実施例3における他視点画像の推定に関するフローチャートである。 各実施例における概要の説明図である。 各実施例の変形例としての機械学習モデルの学習の流れを示す図である。 各実施例の別の変形例としての機械学習モデルの学習の流れを示す図である。
以下、本発明の実施例について、図面を参照しながら詳細に説明する。各図において、同一の部材については同一の参照符号を付し、重複する説明は省略する。
まず、具体的な説明を行う前に、各実施例の要旨を説明する。各実施例は、DLを用いて横方向に視差がついた2視点画像から他視点画像を推定する際、2視点画像中の横長被写体に頑健に、他視点画像を推定する。
DLによる画像処理では、ニューラルネットワークを用いる。ニューラルネットワークでは、画像に対して畳み込むフィルタと足し合わせるバイアス、および非線形変換を行う活性化関数を用いる。フィルタおよびバイアスはウエイトと呼ばれ、訓練画像から学習により生成される。本発明では、訓練画像として、2視点画像と対応する他視点画像とを用いる。また、パラメトリックな活性化関数を用いて、そのパラメータを学習で同時に生成してもよい。
画像に対してフィルタを畳み込み、バイアスを足し合わせ、非線形変換を行うことを繰り返した結果、ニューラルネットワークの中間層で得られる多次元配列は、特徴マップ(feature map)と呼ばれる。なお、画像に対して複数のフィルタを何度も畳み込むことで、得られる特徴マップの1点には画像中の対応する広い領域(受容野)に関する情報が含まれる。
次に、図10を参照して、各実施例の概要に関して説明する。各実施例では、まず2視点画像(第1の画像)から、第1のニューラルネットワークにより、2視点画像のそれぞれの2つの特徴マップ(第1の特徴量)を生成する。次に、生成された2つの特徴マップを比較し、2視点画像の対応点に関する情報(第2の特徴量)を抽出する。ここで、2視点画像の対応点に関する情報とは、2視点画像中の同一被写体のデプス(距離)に応じたずれ量を求めるための情報である。最後に、2視点画像の対応点に関する情報(第2の特徴量)から、第2のニューラルネットワークにより、他視点画像(第2の画像)を推定する。
各実施例は、2視点画像からそれぞれ得られる2つの特徴マップを比較して対応点を見つけることを特徴とする。これにより、2視点画像を画素毎に比較する従来技術よりも、横長被写体の対応点を見つけることが容易になる。これは、横長被写体であっても、広い領域で見れば対応点の手掛かり(横長被写体の端や横長被写体表面のテクスチャ)が見つかるためである。その結果、各実施例によれば、2視点画像中の横長被写体に頑健に、他視点画像を推定することが可能となる。
ここで、2視点画像の対応点をテンプレートマッチングにより見つける場合について説明する。この場合、テンプレートを大きくすれば、2視点画像中の横長被写体の対応点を見つけることができるかもしれない。しかし、テンプレートが大きくなるほど計算負荷が増大するため、それは現実的ではない。一方、各実施例では、特徴マップを用いるため、ネットワークを深くするだけで受容野が広がり、2視点画像のより広い領域で対応点を探すことができる。その結果、2視点画像中の横長被写体の対応点を見つけやすくなる。
また、一般に横方向に視差がついた2視点画像は、縦方向の視差情報がない。このため、2視点画像から、2つの視点で決まる横方向(所定の方向)から縦方向(所定の方向と直交する方向、または所定の方向とは異なる方向)にずれた視点における画像の推定は難しい。しかし、各実施例では、2視点画像の各々から得られる2つの特徴マップを比較して対応点を見つけることで、カメラから被写体までの距離を高精度に推定することができる。そこから縦方向の視差情報を推定することで、各実施例によれば、2視点画像からその2つの視点で決まる横方向から縦方向にずれた視点における画像の推定も可能となる。
なお、前述の画像処理方法は、一例であり、各実施例はこれに限定されるものではない。その他の画像処理方法などの詳細については、以下の各実施例で説明する。また各実施例は、2視点画像の2つの視点は横方向にずれている場合に限定されるものではなく、任意の方向(所定の方向)に視点がずれた画像にも適用可能である。
まず、本発明の実施例1における画像処理システムに関して説明する。本実施例では、ニューラルネットワークを用いて2視点画像から他視点画像を推定する画像処理を学習、実行させる。
図2は、本実施例における画像処理システム100のブロック図である。図3は、画像処理システム100の外観図である。画像処理システム100は、学習装置101、撮像装置102、画像推定装置103、表示装置104、記録媒体105、出力装置106b、および、ネットワーク107を有する。
学習装置(画像処理装置)101は、記憶部101a、画像生成部101b、特徴量生成部101c、特徴量比較部101d、画像再構成部101e、および、学習部101fを有する。
撮像装置102は、光学系(撮像光学系)102aおよび撮像素子102bを有する。光学系102aは、被写体空間から撮像装置102へ入射した光を集光する。光学系102aを介して形成された被写体の光学像を受光して撮像画像(2視点画像)を取得する。撮像素子102bは、撮像面位相差センサである。ここで、撮像面位相差センサとは、1画素が左右に独立した2個のフォトダイオードで構成されているイメージセンサである。これにより、右目と左目で同一被写体を見た2視点画像が同時に取得することができる。なお、撮像面位相差センサを備えた撮像装置102は、被写体までの距離を算出して、被写体に自動で焦点を合わせる目的(オートフォーカス)で主に用いられている。なお本実施例の撮像装置102は、このような構成に限定されるものではなく、2視点画像が取得可能であれば、例えばステレオカメラでもよい。その場合、撮像素子102bは、CCD(Charge Coupled Device)センサやCMOS(Complementary Metal−Oxide Semiconductor)センサなどである。また、取得した2視点画像を記憶する記憶部や表示する表示部、外部に送信する送信部、外部の記憶媒体に記憶させる出力部、撮像装置102の各部を制御する制御部などは、図2および図3にそれぞれ示されていない。
画像推定装置(画像処理装置)103は、記憶部103a、取得部103b、および、画像処理部(推定部)103cを有する。画像推定装置103は、取得した2視点画像から、他視点画像を推定する画像処理を行う。画像処理にはニューラルネットワークが用いられ、ニューラルネットワークのウエイトの情報は記憶部103aから読み出される。ウエイトは学習装置101で学習されたものであり、画像推定装置103は、事前にネットワーク107を介して記憶部101aからウエイトの情報を読み出し、記憶部103aに保存している。保存されるウエイトの情報は、ウエイトの数値そのものでもよいし、符号化された形式でもよい。なお、ウエイトの学習、およびウエイトを用いた画像処理に関する詳細については、後述する。
推定された他視点画像は、表示装置104、記録媒体105、および、出力装置106bの少なくとも1つに出力される。表示装置104は、例えば液晶ディスプレイやプロジェクタなどである。ユーザは、表示装置104を介して、処理途中の画像を確認しながら編集作業などを行うことができる。記録媒体105は、例えば半導体メモリ、ハードディスク、ネットワーク上のサーバなどである。出力装置106bは、プリンタなどである。画像推定装置103は、必要に応じて、現像処理やリフォーカスなどの画像処理を行う機能を有する。リフォーカスとは、多視点画像の対応点を重ね合わせて合焦位置(ピント位置)を可変にする画像処理である。すなわち画像処理部103cは、推定した他視点画像から合焦位置を変化させた第3の画像(リフォーカス画像)を生成することができる。
次に、図1および図4を参照して、本実施例における学習装置101により実行されるウエイトの学習方法(学習済みモデルの製造方法)に関して説明する。図1は、ニューラルネットワークのウエイトの学習の流れ(機械学習モデル)を示す図である。図4は、ウエイトの学習に関するフローチャートである。図4の各ステップは、主に、画像生成部101b、特徴量生成部101c、特徴量比較部101d、画像再構成部101e、または、学習部101fにより実行される。
まず、図4のステップS101において、画像生成部101bは、2視点パッチ(2つの第1の画像)と対応する他視点パッチ(少なくとも1つの第2の画像)とを生成する。本実施例において、2視点パッチは同一被写体を異なる2つの視点で撮影した画像(第1の画像)であり、他視点パッチは2つの視点とは異なる1つ以上の視点で同一被写体を撮影した画像(第2の画像)である。なお、パッチとは、既定の画素数(例えば、120×120画素など)を有する画像を指す。また本実施例において、2つの視点とは異なる1つ以上の視点は、2つの視点で決まる方向と直交する方向にずれた視点を含むが、これに限定されるものではなく、2つの視点で決まる方向からずれた視点を含んでいればよい。
本実施例では、ライトフィールドカメラで多視点画像を取得し、そこから2視点パッチおよび他視点パッチを生成する。例えば、ライトフィールドカメラで4視点画像を取得し、取得した4視点画像から撮像面位相差センサを備えたカメラで取得される相当の2視点画像を生成してもよい。なお、4視点画像から2視点画像は、視点間の関係から視点画像を補間して生成すればよい。また、視点間の関係は、ライトフィールドカメラのセンサと撮像面位相差センサの構成で決定される。
ただし本実施例は、これに限定されるものではなく、数値計算で2視点パッチと対応する他視点パッチとを生成してもよい。例えば、3DCGの3次元空間上に被写体とカメラを配置し、カメラで撮影した相当の画像をレンダリングすることで、2視点パッチと対応する他視点パッチとを生成してもよい。
続いてステップS102において、特徴量生成部101cは、2視点パッチ(2つの第1の画像)から、第1のニューラルネットワークにより、2視点パッチのそれぞれの特徴マップ(2つの第1の特徴量)を生成する。なお第1のニューラルネットワークは、2視点パッチのそれぞれに1つ用意される(2視点パッチのそれぞれに対して存在する)。また本実施例において、2視点パッチが入力されるそれぞれの第1のニューラルネットワークは互いに同じネットワーク構造とウエイトとを有する。ただし本実施例は、これに限定されるものではなく、2視点パッチが入力されるそれぞれの第1のニューラルネットワークが異なるネットワーク構造またはウエイトを有していてもよい。
また本実施例において、2視点パッチのそれぞれを第1のニューラルネットワークへ入力するが、これに限定されるものではない。例えば、撮影条件や推定する他視点パッチの視点に関する情報を、2視点パッチと共に第1のニューラルネットワークへ入力してもよい。ここで、撮影条件とは、2視点パッチを撮影したレンズの絞り値(F値)、焦点距離、カメラから合焦被写体までの距離、カメラ側のセンサのISO感度やシャッタースピード、画素ピッチ、各種フィルタ特性などである。
撮影条件や推定する他視点画像の視点に関する情報をニューラルネットワークへ入力する方法として、例えばレンズの絞り値に対して割り当てた値を画素値として有する絞り画像を2視点パッチと連結して第1のニューラルネットワークへ入力する方法が用いられる。または、レンズの絞り値に対して割り当てた値を第3のニューラルネットワークへ入力し、得られる値を画素値として有する絞り画像を2視点パッチと連結して第1のニューラルネットワークへ入力する方法を用いてもよい。すなわち、レンズの絞り値に対して割り当てた値を、第1のニューラルネットワークへそのまま入力するのではなく、別途用意した第3のニューラルネットワークで非線形変換した後に入力してもよい。また、2視点パッチそのものを第1のニューラルネットワークへ入力するのではなく、例えば2視点パッチを補間で横方向にサブ画素シフトした画像を入力してもよい。
続いてステップS103において、特徴量比較部101dは、2視点パッチ(2つの第1の画像)からそれぞれ生成される2つの特徴マップ(2つの第1の特徴量)を比較することで、2視点パッチの対応点に関する情報(第2の特徴量)を抽出する。本実施例において、特徴量比較部101dは、2つの特徴マップの対応点(2つの特徴マップの類似度)を算出して比較を行う。より具体的には、特徴量比較部101dは、2つの特徴マップの行列積に基づく処理を行って2つの特徴マップの対応点を算出する。ただし本実施例は、特徴マップの行列積に基づく処理を用いた比較方法に限定されるものではない。例えば、SIFTやSURF、HoGなど位置合わせに用いられてきた古典的な特徴量を用いてもよい。または、特徴マップを横方向にサブ画素シフトさせたのち画素毎に減算して比較してもよい。または、特徴マップを並置して第4のニューラルネットワークで処理することで比較してもよい。
続いてステップS104において、画像再構成部101eは、2視点パッチの対応点に関する情報(第2の特徴量)から、第2のニューラルネットワークにより、推定パッチ(出力画像)202を生成する。なお、推定パッチ202は、2視点パッチ(2つの第1の画像)201から得られる他視点パッチ(第2の画像)200の推定(推定画像)である。
本実施例において、2視点パッチの対応点に関する情報(第2の特徴量)を第2のニューラルネットワークへ入力するが、これに限定されるものではない。例えば、撮影条件や推定する他視点画像の視点に関する情報を、2視点パッチの対応点に関する情報と共に第2のニューラルネットワークへ入力してもよい。ここで、撮影条件はステップS102と同様である。また、撮影条件や推定する他視点画像の視点に関する情報を第2のニューラルネットワークへ入力する方法も、ステップS102と同様である。また、2視点画像の対応点に関する情報を用いて、2視点パッチをワープさせた後に第2のニューラルネットワークへ入力してもよい。
本実施例において、図1に示されるように、前半の分岐したネットワークが第1のニューラルネットワーク、後半のネットワークが第2のニューラルネットワークを表す。図1中のCNは畳み込み層を表す。畳み込み層CNは、入力とフィルタの畳み込み、およびバイアスとの和が算出され、その結果を活性化関数によって非線形変換する。フィルタの各成分とバイアスの初期値は任意であり、本実施例では乱数によって決定する。活性化関数は、例えばReLU(Rectified Linear Unit)やシグモイド関数などを用いることができる。最終層を除く各層で出力される多次元配列は、特徴マップと呼ばれる。スキップコネクション203は、連続していない層から出力された特徴マップを合成するショートカットの経路である。特徴マップの合成は、要素ごとの和をとってもよいし、チャンネル方向に連結(concatenation)してもよい。本実施例では要素ごとの和を採用する。
図1中の204は、2視点パッチ(2つの第1の画像)201からそれぞれ生成される2つの特徴マップ(2つの第1の特徴量)を比較する比較部であり、図2中の特徴量比較部101dの機能に相当する。前述したように、本実施例では特徴マップの比較方法は行列積であるが、これに限定されるものではない。
図1中の点線枠205内の要素は、残差ブロック(Residual Block)を表す。なお、点線で括ってはいないが、第1のニューラルネットワークにおいて、残差ブロックの前後の要素もまた残差ブロックである。同様に、第2のニューラルネットワークも残差ブロックで構成されている。このように、残差ブロックを多層化したニューラルネットワークは残差ネットワークと呼ばれており、DLによる画像処理において広く用いられている。ただし本実施例は、これに限定されるものではなく、その他の要素を多層化しニューラルネットワークを構成してもよい。例えば、互いに異なる畳み込みフィルタサイズを有する畳み込み層を並置し、得られる複数の特徴マップを統合して最終的な特徴マップとするインセプションモジュール(Inception Module)を用いることができる。また、密にスキップコネクションを有するデンスブロック(Dense Block)を用いてもよい。
また、入力に近い層で特徴マップをダウンサンプリング、出力に近い層で特徴マップをアップサンプリングし、中間層での特徴マップのサイズを小さくすることで処理負荷(畳み込み回数)を軽減させてもよい。ここで、特徴マップのダウンサンプリングには、プーリング(Pooling)やストライド(Stride)、逆ピクセルシャッフル(De―Pixel Shuffle)などを用いることができる。また、特徴マップのアップサンプリングには、逆畳み込み(DeconvolutionまたはTransposed Convolution)、ピクセルシャッフル(Pixel Shuffle)、補間などを用いることができる。
続いて、図4のステップS105において、学習部101fは、他視点パッチ(第2の画像)200とその推定パッチ(出力画像または推定画像)202との誤差から、図1に示されるニューラルネットワークのウエイトを更新する。ここで、ウエイトは、各層のフィルタの成分とバイアスを含む。ウエイトの更新には誤差逆伝搬法(Backpropagation)を用いるが、本実施例はこれに限定されるものではない。ミニバッチ学習では、複数の他視点パッチ200とそれらに対応する推定パッチ202との誤差を求め、ウエイトを更新する。誤差関数(Loss function)には、例えばL2ノルムやL1ノルムなどを用いればよい。ウエイト更新方法(学習方法)はミニバッチ学習に限らず、バッチ学習でもオンライン学習でもよい。なお、以前に学習した第1のニューラルネットワークのウエイトを用いて、第2のニューラルネットワークだけ学習してもよい。すなわち、第1のニューラルネットワークのウエイトは学習せずに固定し、第2のニューラルネットワークだけ学習してもよい。または、第1のニューラルネットワークだけ学習してもよい。また、図1には示されていないが、ステップS102にて第3のニューラルネットワークを使う場合、そのウエイトも同時に更新する。ステップS103にて第4のニューラルネットワークを使う場合も同様である。
続いてステップS106において、学習部101fは、ウエイトの学習が完了したか否かを判定する。完了は、学習(ウエイトの更新)の反復回数が規定値に達したか、または、更新時のウエイトの変化量が規定値より小さいかなどにより判定することができる。学習が完了していないと判定された場合、ステップS101へ戻り、新たな2視点パッチ(第1の画像)201と他視点パッチ(第2の画像)200とを複数取得する。一方、学習が完了と判定された場合、学習装置101(学習部101f)は学習を終了し、ウエイトの情報を記憶部101aに保存する。
なお本実施例では、機械学習モデルとして図1に示される構成を用いるが、これに限定されるものではない。例えば、図11または図12に示される構成を用いてもよい。図11は、本実施例の変形例としての機械学習モデルの学習の流れを示す図である。図11に示されるように、2視点パッチ(2つの第1の画像)201を共通のニューラルネットワークに入力して推定パッチ(出力画像)202を生成する機械学習モデルを用いてもよい。すなわち本実施例の機械学習モデルは、第1のニューラルネットワークおよび第2のニューラルネットワークのように2つのニューラルネットワークに分離されていなくてもよい。図12は、本実施例の別の変形例としての機械学習モデルの学習の流れを示す図である。図12に示されるように、2視点パッチ(2つの第1の画像)201のそれぞれの第1のニューラルネットワークからの2つの出力を直接、第2のニューラルネットワークに入力して推定パッチ(出力画像)202を生成する機械学習モデルを用いることができる。すなわち本実施例の機械学習モデルは、第1のニューラルネットワークのそれぞれの出力を比較する比較部204を用いなくてもよい。
次に、図5を参照して、本実施例における画像推定装置103で実行される他視点画像の推定に関して説明する。図5は、他視点画像の推定に関するフローチャートである。図5の各ステップは、主に、画像推定装置103の取得部103bおよび画像処理部103cにより実行される。
まずステップS201において、取得部103bは、撮像画像とウエイトの情報を取得する。撮像画像は、学習の場合と同様に2視点画像であり、本実施例では撮像装置102から送信された画像である。ウエイトの情報は、学習装置101から送信されて記憶部103aに記憶される。また、図4のステップS102にて撮影条件や推定する他視点画像の視点に関する情報を、第1の画像と共に第1のニューラルネットワークへ入力する場合、それらの情報も取得する。なお、撮像条件は、撮像画像と共に撮像装置102から送信されて記憶部103aに記憶される。また、推定する他視点画像の視点に関する情報は、例えば入力装置106aからユーザにより入力され、記憶部103aに記憶される。
続いてステップS202において、画像処理部103cは、取得したウエイトの情報を適用したニューラルネットワークに撮像画像を入力し、他視点画像を推定する。ここで他視点画像は、撮像画像とは異なる1つ以上の視点で撮影した画像の推定である。他視点画像の推定には、図1に示される構成と同様のニューラルネットワークを用いることができる。なお、ニューラルネットワークへ撮像画像を入力する際は、学習時に使用した2視点パッチと同サイズに切り出す必要はないが、処理の高速化のため、撮影画像を互いに重複した複数枚のパッチに分解したのち処理してもよい。この場合、処理後に得られるパッチを融合して他視点画像とすればよい。
以上のように、本実施例の画像推定装置103は、取得部103bおよび画像処理部103cを有する。取得部103bは、同一被写体を異なる2つの視点で撮影した2つの第1の画像を取得する。画像処理部103cは、2つの第1の画像を機械学習モデルに入力し、2つの視点とは異なる1つ以上の視点の第2の画像を推定する。また、本実施例の学習装置101は、画像生成部101bおよび学習部101fを有する。画像生成部101bは、同一被写体を異なる2つの視点で撮影した2つの第1の画像、および、2つの視点とは異なる1つ以上の視点の第2の画像を生成する。学習部101fは、2つの第1の画像を機械学習モデルに入力し、出力画像と第2の画像とを比較して機械学習モデルを学習する。
なお本実施例において、学習装置101と画像推定装置103とが別体である場合を例に説明したが、これに限定されるものではなく、学習装置101と画像推定装置103とが一体的に構成されていてもよい。すなわち、一体の装置内で学習(図4に示される処理)と推定(図5に示される処理)を行ってもよい。
以上の構成により、本実施例によれば、横方向に視差がついた2視点画像中の横長被写体に頑健に、他視点画像を推定する画像処理装置を提供することができる。
次に、本発明の実施例2における画像処理システムに関して説明する。本実施例は、実施例1と同様に、ニューラルネットワークを用いて2視点画像から他視点画像を推定するDL画像処理を学習、実行させる。本実施例の画像処理システムは、撮像装置が撮像画像(2視点画像)を取得して画像処理を行う点で、実施例1と異なる。
図6は、本実施例における画像処理システム300のブロック図である。図7は、画像処理システム300の外観図である。画像処理システム300は、ネットワーク303を介して接続された学習装置(画像処理装置)301と撮像装置302とを含む。なお、学習装置301と撮像装置302は、ネットワーク303を介して常に接続されている必要はない。
学習装置301は、実施例1の学習装置101と同様な構成を有する。すなわち学習装置301は、記憶部311、画像生成部312、特徴量生成部313、特徴量比較部314、画像再構成部315、および学習部316を有する。このような構成において、学習装置301は、ニューラルネットワークを用いて2視点画像から他視点画像を推定する画像処理を行うためのウエイトを学習する。
撮像装置302は、被写体空間を撮像して撮像画像(2視点画像)を取得し、読み出した前記ウエイトの情報を用いて、2視点画像から他視点画像を推定する。撮像装置302で実行される画像処理に関する詳細は、後述する。撮像装置302は、光学系(撮像光学系)321および撮像素子322を有する。画像推定部323は、取得部323aおよび画像処理部323bを有し、記憶部324に保存されたウエイトの情報を用いて、2視点画像から他視点画像を推定する。なお、学習装置301で実行されるニューラルネットワークのウエイトの学習は、実施例1と同様であるため、その説明は省略し、撮像装置302で実行される画像処理に関する詳細のみ後述する。
ウエイトの情報は、学習装置301で事前に学習され、記憶部311に保存されている。撮像装置302は、記憶部311からネットワーク303を介してウエイトの情報を読み出し、記憶部324に保存する。推定された他視点画像は、記録媒体325aに保存される。推定された他視点画像の表示に関する指示がユーザから出された場合、保存された画像(推定された他視点画像)が読み出され、表示部325bに表示される。なお、記録媒体325aに既に保存された撮像画像(2視点画像)を読み出し、画像推定部323で他視点画像の推定を行ってもよい。また、ユーザから指示が出された場合、推定された他視点画像からリフォーカス画像を生成してもよい。以上の一連の制御は、システムコントローラ327によって行われる。
次に、本実施例における画像推定部323で実行される他視点画像の推定に関して説明する。画像処理の手順は、実施例1の図5と同様である。画像処理の各ステップは、主に、画像推定部323の取得部323aまたは画像処理部323bにより実行される。
まず、ステップS201において、取得部323aは、撮像画像(2視点画像)とウエイトの情報を取得する。2視点画像は、撮像装置302で取得され、記憶部324に記憶されたものである。ウエイトの情報は、学習装置301から送信されて記憶部324に記憶されたものである。
続いてステップS202において、画像処理部323bは、取得したウエイトを適用したニューラルネットワークに撮像画像(2視点画像)を入力し、他視点画像を推定する。他視点画像の推定には、図1に示される構成と同様のニューラルネットワークを用いることができる。
以上の構成により、本実施例によれば、横方向に視差がついた2視点画像中の横長被写体に頑健に、他視点画像を推定する画像処理システムを提供することができる。
次に、本発明の実施例3における画像処理システムに関して説明する。本実施例の画像処理システムは、画像推定装置に対して画像処理の対象である撮像画像(2視点画像)を送信し、2視点画像から推定された他視点画像を画像推定装置から受信する処理装置(コンピュータ)を有する点で、実施例1および実施例2と異なる。
図8は、本実施例における画像処理システム400のブロック図である。画像処理システム400は、学習装置401、撮像装置402、画像推定装置(第2の装置)403、および、コンピュータ(処理装置、第1の装置)404を有する。学習装置401および画像推定装置403は、例えばサーバである。コンピュータ404は、例えばユーザ端末(パーソナルコンピュータまたはスマートフォン)である。コンピュータ404は、ネットワーク405を介して画像推定装置403に接続されている。画像推定装置403は、ネットワーク406を介して学習装置401に接続されている。
すなわち、コンピュータ404と画像推定装置403は通信可能に構成され、画像推定装置403と学習装置401は通信可能に構成されている。なお、学習装置401および撮像装置402の構成は、実施例1の学習装置101および撮像装置102とそれぞれ同様であるため、それらの説明を省略する。
画像推定装置403は、記憶部403a、取得部403b、通信部(受信部)403c、および、画像処理部403dを有する。記憶部403a、取得部403b、および、画像処理部403dは、実施例1の画像推定装置103の記憶部103a、取得部103b、および、画像処理部103cとそれぞれ同様である。通信部403cは、コンピュータ404から送信される要求を受信する機能、および、画像推定装置403により推定された他視点画像をコンピュータ404に送信する機能を有する。
コンピュータ404は、通信部(送信部)404a、表示部404b、入力部404c、画像処理部404d、記録部404eを有する。通信部404aは、撮像画像(2つの第1の画像、2視点画像)に対する処理を画像推定装置403に実行させるための要求を画像推定装置403に送信する機能、および、画像推定装置403により推定された出力画像(他視点画像)を受信する機能を有する。表示部404bは、種々の情報を表示する機能を有する。表示部404bによって表示される情報は、例えば画像推定装置403に送信する撮像画像(2視点画像)と、画像推定装置403から受信した他視点画像、他視点画像から生成されるリフォーカス画像(第3の画像)を含む。入力部404cは、ユーザからの指示を入力する。画像処理部404dは、画像推定装置403により推定された他視点画像を受信し、さらにそれに対して画像処理を施す機能を有する。ここで、推定された他視点画像に施す画像処理として、リフォーカス処理などが含まれる。記録部404eは、撮像装置402から取得した撮像画像、画像推定装置403から受信した出力画像などを記録する。
次に、図9を参照して、本実施例における画像処理について説明する。図9は、本実施例における他視点画像の推定に関するフローチャートである。なお本実施例における画像処理は、実施例1にて説明した画像処理(図5)と同等である。図9に示される画像処理は、コンピュータ404を介してユーザにより画像処理開始の指示が成されたことを契機として開始される。
最初に、コンピュータ404における動作について説明する。まずステップS401において、コンピュータ404は、撮像画像(2視点画像)に対する処理の要求を画像推定装置403へ送信する。なお、処理対象である2視点画像を画像推定装置403に送信する方法は問わない。例えば、2視点画像はステップS401と同時に画像推定装置403にアップロードされてもよいし、ステップS401以前に画像推定装置403にアップロードされていてもよい。また、2視点画像は画像推定装置403とは異なるサーバ上に記憶された画像でもよい。なお、ステップS401において、コンピュータ404は2視点画像に対する処理の要求と共に、ユーザを認証するIDや、撮像条件、推定する他視点画像の視点に関する情報などを送信してもよい。続いてステップS402において、コンピュータ404は、画像推定装置403により推定された他視点画像を受信する。
次に、画像推定装置403の動作について説明する。まずステップS501において、画像推定装置403は、コンピュータ404から送信された撮像画像(2視点画像)に対する処理の要求を受信する。画像推定装置403は、2視点画像に対する処理が指示されたと判定し、ステップS502以降の処理を実行する。
続いてステップS502において、画像推定装置403は、ウエイトの情報を取得する。ウエイトの情報は、実施例1と同様の方法(図4)で学習された情報(学習済みモデル)である。画像推定装置403は、学習装置401からウエイト情報を取得してもよいし、予め学習装置401から取得され記憶部403aに記憶されたウエイト情報を取得してもよい。続くステップS503は、実施例1のステップS202と同様である。続いてステップS504において、画像推定装置403は、推定した他視点画像をコンピュータ404へ送信する。
以上のように、本実施例のように、画像推定装置403を、画像推定装置403と通信可能に接続されたコンピュータ404を用いて制御するように構成してもよい。
(その他の実施例)
本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
各実施例によれば、機械学習DLを用いて横方向に視差を有する2視点画像から他視点画像を推定する際、2視点画像中の横長被写体に頑健に、他視点画像を推定することができる。このため各実施例によれば、2視点画像から他視点画像を高精度に推定することが可能な画像処理装置、画像処理方法、プログラム、学習済みモデルの製造方法、および画像処理システムを提供することができる。
以上、本発明の好ましい実施例について説明したが、本発明はこれらの実施例に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
103 画像推定装置(画像処理装置)
103b 取得部
103c 画像処理部

Claims (17)

  1. 同一被写体を異なる2つの視点で撮影した2つの第1の画像を取得する取得部と、
    前記2つの第1の画像を機械学習モデルに入力し、前記2つの視点とは異なる1つ以上の視点の第2の画像を推定する画像処理部と、を有することを特徴とする画像処理装置。
  2. 前記機械学習モデルは、
    第1のニューラルネットワークにより、前記2つの第1の画像にそれぞれ対応する2つの第1の特徴量を生成する特徴量生成部と、
    前記2つの第1の特徴量に基づき第2のニューラルネットワークにより前記第2の画像を推定する画像再構成部と、を有することを特徴とする請求項1に記載の画像処理装置。
  3. 前記機械学習モデルは、前記特徴量生成部により生成された前記2つの第1の特徴量を比較して第2の特徴量を生成する比較部を更に有することを特徴とする請求項2に記載の画像処理装置。
  4. 前記2つの第1の特徴量は、2つの特徴マップであり、
    前記比較部は、前記2つの特徴マップの対応点を算出することを特徴とする請求項3に記載の画像処理装置。
  5. 前記比較部は、前記2つの特徴マップの行列積に基づく処理を行って前記2つの特徴マップの対応点を算出することを特徴とする請求項4に記載の画像処理装置。
  6. 前記第1のニューラルネットワークは、前記2つの第1の画像のそれぞれに対して存在し、互いに同じネットワーク構造とウエイトとを有することを特徴とする請求項2乃至5のいずれか一項に記載の画像処理装置。
  7. 前記2つの視点とは異なる1つ以上の視点は、前記2つの視点で決まる方向からずれた視点を含むことを特徴とする請求項1乃至6のいずれか一項に記載の画像処理装置。
  8. 前記2つの視点とは異なる1つ以上の視点は、前記2つの視点で決まる方向と直交する方向にずれた視点を含むことを特徴とする請求項7に記載の画像処理装置。
  9. 前記画像処理部は、前記第2の画像から合焦位置を変化させた第3の画像を生成することを特徴とする請求項1乃至8のいずれか一項に記載の画像処理装置。
  10. 同一被写体を異なる2つの視点で撮影した2つの第1の画像を取得する取得ステップと、
    前記2つの第1の画像を機械学習モデルに入力し、前記2つの視点とは異なる1つ以上の視点の第2の画像を推定する推定ステップと、を有することを特徴とする画像処理方法。
  11. 請求項10に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
  12. 同一被写体を異なる2つの視点で撮影した2つの第1の画像、および、前記2つの視点とは異なる1つ以上の視点の第2の画像を生成する画像生成部と、
    前記2つの第1の画像を機械学習モデルに入力し、出力画像と前記第2の画像とを比較して前記機械学習モデルを学習する学習部と、を有することを特徴とする画像処理装置。
  13. 前記機械学習モデルは、
    第1のニューラルネットワークにより、前記2つの第1の画像にそれぞれ対応する2つの特徴量を生成する特徴量生成部と、
    前記2つの特徴量に基づき第2のニューラルネットワークにより前記第2の画像を推定する画像再構成部と、を有し、
    前記学習部は、前記第1のニューラルネットワークと前記第2のニューラルネットワークの少なくとも一方を学習することを特徴とする請求項12に記載の画像処理装置。
  14. 同一被写体を異なる2つの視点で撮影した2つの第1の画像、および、前記2つの視点とは異なる1つ以上の視点の第2の画像を生成する画像生成工程と、
    前記2つの第1の画像を機械学習モデルに入力し、出力画像と前記第2の画像とを比較して前記機械学習モデルを学習する学習工程と、を有することを特徴とする画像処理方法。
  15. 請求項14に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
  16. 同一被写体を異なる2つの視点で撮影した2つの第1の画像、および、前記2つの視点とは異なる1つ以上の視点の第2の画像を生成する画像生成工程と、
    前記2つの第1の画像を機械学習モデルに入力し、出力画像と前記第2の画像とを比較して前記機械学習モデルを学習する学習工程と、を有することを特徴とする学習済みモデルの製造方法。
  17. 第1の装置と、前記第1の装置と通信可能な第2の装置と、を有する画像処理システムであって、
    前記第1の装置は、同一被写体を異なる2つの視点で撮影した2つの第1の画像に対する処理を前記第2の装置に実行させるための要求を送信する送信部を有し、
    前記第2の装置は、
    前記送信部により送信された前記要求を受信する受信部と、
    前記2つの第1の画像を機械学習モデルに入力し、前記2つの視点とは異なる1つ以上の視点の第2の画像を推定する画像処理部と、を有することを特徴とする画像処理システム。
JP2020103809A 2020-06-16 2020-06-16 画像処理装置、画像処理方法、プログラム、学習済みモデルの製造方法、および画像処理システム Pending JP2021196951A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020103809A JP2021196951A (ja) 2020-06-16 2020-06-16 画像処理装置、画像処理方法、プログラム、学習済みモデルの製造方法、および画像処理システム
US17/342,715 US20210392313A1 (en) 2020-06-16 2021-06-09 Image processing apparatus, image processing method, storage medium, manufacturing method of learned model, and image processing system
CN202110665990.0A CN113810676A (zh) 2020-06-16 2021-06-16 图像处理设备、方法、系统、介质和学习模型的制造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020103809A JP2021196951A (ja) 2020-06-16 2020-06-16 画像処理装置、画像処理方法、プログラム、学習済みモデルの製造方法、および画像処理システム

Publications (2)

Publication Number Publication Date
JP2021196951A true JP2021196951A (ja) 2021-12-27
JP2021196951A5 JP2021196951A5 (ja) 2023-06-20

Family

ID=78826213

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020103809A Pending JP2021196951A (ja) 2020-06-16 2020-06-16 画像処理装置、画像処理方法、プログラム、学習済みモデルの製造方法、および画像処理システム

Country Status (3)

Country Link
US (1) US20210392313A1 (ja)
JP (1) JP2021196951A (ja)
CN (1) CN113810676A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11663728B2 (en) * 2020-01-16 2023-05-30 Samsung Electronics Co., Ltd. Depth estimation method and apparatus
US11721064B1 (en) 2020-12-11 2023-08-08 Meta Platforms Technologies, Llc Adaptive rate shading using texture atlas
US11544894B2 (en) * 2021-02-26 2023-01-03 Meta Platforms Technologies, Llc Latency-resilient cloud rendering
US11676324B2 (en) 2021-03-30 2023-06-13 Meta Platforms Technologies, Llc Cloud rendering of texture map
US11303800B1 (en) * 2021-07-13 2022-04-12 Shenzhen GOODIX Technology Co., Ltd. Real-time disparity upsampling for phase detection autofocus in digital imaging systems
CN114079779B (zh) * 2022-01-12 2022-05-17 深圳传音控股股份有限公司 图像处理方法、智能终端及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873813B2 (en) * 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
CN104012088B (zh) * 2012-11-19 2016-09-28 松下知识产权经营株式会社 图像处理装置以及图像处理方法
KR20180087994A (ko) * 2017-01-26 2018-08-03 삼성전자주식회사 스테레오 매칭 방법 및 영상 처리 장치
JP2018124939A (ja) * 2017-02-03 2018-08-09 日本電信電話株式会社 画像合成装置、画像合成方法、及び画像合成プログラム
CN109145927A (zh) * 2017-06-16 2019-01-04 杭州海康威视数字技术股份有限公司 一种对形变图像的目标识别方法及装置
JP6948175B2 (ja) * 2017-07-06 2021-10-13 キヤノン株式会社 画像処理装置およびその制御方法
JP6425780B1 (ja) * 2017-09-22 2018-11-21 キヤノン株式会社 画像処理システム、画像処理装置、画像処理方法及びプログラム
WO2019076467A1 (en) * 2017-10-20 2019-04-25 Toyota Motor Europe METHOD AND SYSTEM FOR PROCESSING IMAGE AND DETERMINING POINTS OF VIEW OF OBJECTS
CN107729948A (zh) * 2017-10-31 2018-02-23 京东方科技集团股份有限公司 图像处理方法及装置、计算机产品和存储介质
KR101939349B1 (ko) * 2018-07-09 2019-04-11 장현민 기계학습모델을 이용하여 자동차용 어라운드 뷰 영상을 제공하는 방법
CN109978936B (zh) * 2019-03-28 2022-12-30 腾讯科技(深圳)有限公司 视差图获取方法、装置、存储介质及设备
CN110351548B (zh) * 2019-06-27 2020-12-11 天津大学 一种深度学习及视差图加权指导的立体图像质量评价方法
CN110443874B (zh) * 2019-07-17 2021-07-30 清华大学 基于卷积神经网络的视点数据生成方法和装置

Also Published As

Publication number Publication date
CN113810676A (zh) 2021-12-17
US20210392313A1 (en) 2021-12-16

Similar Documents

Publication Publication Date Title
JP2021196951A (ja) 画像処理装置、画像処理方法、プログラム、学習済みモデルの製造方法、および画像処理システム
JP6112824B2 (ja) 画像処理方法および装置、プログラム。
JP5968107B2 (ja) 画像処理方法、画像処理装置およびプログラム
CN102737406B (zh) 三维建模装置及方法
KR101233013B1 (ko) 화상 촬영 장치 및 그 거리 연산 방법과 합초 화상 취득 방법
JP6305053B2 (ja) 画像処理装置、撮像装置、画像処理方法、及びプログラム
JP2022175419A (ja) 画像処理方法、画像処理装置、プログラム、学習済みモデルの製造方法、および画像処理システム
JP7227969B2 (ja) 三次元再構成方法および三次元再構成装置
US11533464B2 (en) Method for synthesizing intermediate view of light field, system for synthesizing intermediate view of light field, and method for compressing light field
CN102638693A (zh) 摄像装置、摄像装置控制方法以及程序
JP7378219B2 (ja) 撮像装置、画像処理装置、制御方法、及びプログラム
JP2020036310A (ja) 画像処理方法、画像処理装置、撮像装置、レンズ装置、プログラム、記憶媒体、および、画像処理システム
CN112862897A (zh) 一种基于相位移编码圆的相机离焦状态下的快速标定方法
US11967096B2 (en) Methods and apparatuses of depth estimation from focus information
JP7195801B2 (ja) 画像処理装置およびその制御方法、距離検出装置、撮像装置、プログラム
US20090316994A1 (en) Method and filter for recovery of disparities in a video stream
JP6702755B2 (ja) 画像処理装置、撮像装置、画像処理方法、プログラム
WO2019216229A1 (ja) データ処理装置、データ処理方法、及び、プログラム
CN111292380B (zh) 图像处理方法及装置
CN112950698B (zh) 基于双目散焦图像的深度估计方法、装置、介质和设备
JP6648916B2 (ja) 撮像装置
JP7009219B2 (ja) 画像処理方法、画像処理装置、撮像装置、画像処理プログラム、および、記憶媒体
JP7013205B2 (ja) 像振れ補正装置およびその制御方法、撮像装置
WO2022014148A1 (ja) 画像処理方法、プログラム、画像処理装置、学習済みモデルの製造方法、および、画像処理システム
JP7455574B2 (ja) 画像処理方法、プログラム、学習済みモデルの製造方法、画像処理装置、および、画像処理システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230612

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230612

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240618