JP2022515517A - 画像深度推定方法および装置、電子機器、ならびに記憶媒体 - Google Patents

画像深度推定方法および装置、電子機器、ならびに記憶媒体 Download PDF

Info

Publication number
JP2022515517A
JP2022515517A JP2021537988A JP2021537988A JP2022515517A JP 2022515517 A JP2022515517 A JP 2022515517A JP 2021537988 A JP2021537988 A JP 2021537988A JP 2021537988 A JP2021537988 A JP 2021537988A JP 2022515517 A JP2022515517 A JP 2022515517A
Authority
JP
Japan
Prior art keywords
layer
sampling point
reverse
image
depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021537988A
Other languages
English (en)
Other versions
JP7116262B2 (ja
Inventor
▲齊▼勇
▲項▼▲驍▼▲駿▼
姜翰青
章国▲鋒▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Sensetime Technology Development Co Ltd
Original Assignee
Zhejiang Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Sensetime Technology Development Co Ltd filed Critical Zhejiang Sensetime Technology Development Co Ltd
Publication of JP2022515517A publication Critical patent/JP2022515517A/ja
Application granted granted Critical
Publication of JP7116262B2 publication Critical patent/JP7116262B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Studio Devices (AREA)

Abstract

本開示の実施例は、現在フレームに対応する基準フレームおよび現在フレームの逆深度空間範囲を取得するステップと、現在フレームおよび基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、現在フレームに対応するk層の現在画像、および基準フレームに対応するk層の基準画像を得るステップであって、kは2以上の自然数であるステップと、k層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行い、現在フレームの逆深度推定結果を得るステップと、を含む画像深度推定方法を開示する。上記解決手段を実施することで、画像の深度推定結果をリアルタイムに得ることができ、かつ深度推定結果の正確度が高い。

Description

(関連出願の相互参照)
本願は、出願番号が201910621318.4であり、出願日が2019年07月10日であり、出願の名称が「画像深度推定方法および装置、電子機器、ならびに記憶媒体」である中国特許出願に基づいて提出され、該中国特許出願の優先権を主張し、その開示の全てが参照によって本願に組み込まれる。
本開示はコンピュータビジョンの技術分野に関し、特に画像深度推定方法および装置、電子機器、ならびに記憶媒体に関する。
画像の深度推定はコンピュータビジョン分野の重要な課題である。画像の深度情報を直接取得することができない場合には、深度推定方法で、シーンの三次元再構築を達成し、さらに拡張現実およびゲームなどのアプリケーションにサービスを提供するしかない。
現在、コンピュータビジョンに基づく深度推定方法は、アクティブビジョン方法およびパッシブビジョン方法の二種類に分けられる。ここで、アクティブビジョン方法とは、被検物体に制御可能な光ビームを照射し、そして光ビームが物体の表面上で形成する画像を撮影し、幾何学的関係によって被検物体の距離を算出する方法であり、パッシブビジョン方法は、立体視、デプスフロムフォーカス法、およびデプスフロムデフォーカス法などを含み、主に一つ以上の撮影装置により取得された二次元画像情報に基づいて深度情報を特定している。
本開示の実施例は画像深度推定方法および装置、電子機器、ならびに記憶媒体を提供しようとする。
本開示の実施例の技術的解決手段は以下のように実現される。
本開示の実施例は、画像深度推定方法を提供し、
現在フレームに対応する基準フレームおよび前記現在フレームの逆深度空間範囲を取得するステップと、
前記現在フレームおよび前記基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、前記現在フレームに対応するk層の現在画像、および前記基準フレームに対応するk層の基準画像を得るステップであって、kは2以上の自然数であるステップと、
前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得るステップと、を含む。
理解すべきこととして、本開示の実施例では、現在フレームおよび現在フレームに対応する基準フレームに対してダウンサンプリング処理を行い、得られた複数層の現在画像と複数層の基準画像とを組み合わせて逆深度推定の反復処理を行い、それによって現在フレームの逆深度推定結果を特定する。逆深度推定結果を特定するプロセスにおいて、層ずつに逆深度探索空間を減少させるため、逆深度推定の計算量が低減され、推定速度が向上し、逆深度推定結果をリアルタイムに得ることができる。
上記画像深度推定方法において、現在フレームに対応する基準フレームを取得する前記ステップは、
少なくとも二つの選別対象フレームを取得するステップと、
前記少なくとも二つの選別対象フレームから、前記現在フレームと所定角度拘束条件を満たす少なくとも一つのフレームを、前記基準フレームとして選択するステップと、を含む。
理解すべきこととして、本開示の実施例では、所定角度の所定条件に応じて少なくとも二つの選別対象フレームから基準フレームを選択しており、一定程度、品質が高く、現在フレームとのマッチングに適するフレームを選択し、それによって後続の深度推定プロセスにおいて推定の正確性を向上させることができる。
上記画像深度推定方法において、前記所定角度拘束条件は、
前記現在フレームに対応する姿勢中心および前記基準フレームに対応する姿勢中心と、目標点との接続線により形成された夾角が、第一の所定角度範囲にあることであって、前記目標点は前記現在フレームに対応する平均深度点と前記基準フレームに対応する平均深度点との接続線の中点であることと、
前記現在フレームおよび前記基準フレームに対応する光軸夾角が、第二の所定角度範囲にあることと、
前記現在フレームおよび前記基準フレームに対応する縦軸夾角が、第三の所定角度範囲にあることと、を含む。
理解すべきこととして、本開示の実施例では、一つ目の角度条件は現在シールから二つのカメラまでの距離を限定しており、角度が大きくなりすぎると、シーンが近すぎることを示し、二つのフレームの重なり度合いが低くなり、角度が小さくなりすぎると、シーンが遠すぎることを示し、視差が小さくなり、誤差が大きくなり、カメラが非常に近い場合でも角度が小さくなりすぎる場合があり、この場合、誤差が同様に大きくなる。二つ目の角度条件は二つのカメラの十分な共通視野領域を確保するために設定される。三つ目の角度条件は、カメラが光軸回りに回転して後続の深度推定計算プロセスが影響を受けることを回避するために設定される。上記三つの角度条件を同時に満たすフレームは基準フレームとして、現在フレーム深度推定の精度の向上に寄与する。
上記画像深度推定方法において、前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得る前記ステップは、
前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップであって、前記第i層のサンプリング点は前記k層の現在画像のうちの第i層の現在画像をサンプリングして得られた画素点であり、iは1以上、且つk以下の自然数であるステップと、
前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップと、
i=kになるまで、i=i+1にして、前記k層の現在画像内の、解像度が前記第i層の現在画像より高い第i+1層の現在画像に対して逆深度推定を継続して行い、第k層の逆深度値を得るステップと、
前記第k層の逆深度値を前記逆深度推定結果として特定するステップと、を含む。
理解すべきこととして、本開示の実施例では、k層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行う際に、例えば最上層(第1層)の現在画像(画素が最も少ない画像)から、順に最下層へ逆深度推定の反復を行い、層ずつに逆深度探索空間を縮小し、それにより逆深度推定の計算量を効果的に低減するようにしてもよい。
上記画像深度推定方法において、前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定する前記ステップは、
前記逆深度空間範囲に対して区間分割を行い、各分割区間から一つの逆深度値を選択し、複数の初期逆深度値を得るステップと、
前記複数の初期逆深度値を第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定するステップと、
iが1に等しくない場合、前記k層の現在画像から、第i-1層のサンプリング点、および第i-1層の逆深度値を取得するステップと、
前記第i-1層の逆深度値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップと、を含む。
理解すべきこととして、本開示の実施例では、逆深度空間範囲に対して区間分割を行い、それにより異なる区間内から逆深度値を選択することで、区間毎に、逆深度候補値とする一つの逆深度値が存在するようになる。つまり、各サンプリング点は、異なる逆深度範囲内に一つの逆深度候補値が存在し、後続でサンプリング点の逆深度値を特定する時に、異なる逆深度範囲の逆深度値でも逆深度値の推定および特定を行うことができ、推定プロセスが全逆深度空間範囲をカバーするようになり、さらに最終的に逆深度値を正確に推定することができる。
上記画像深度推定方法において、前記第i-1層の逆深度推定値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定する前記ステップは、
前記第i-1層のサンプリング点から、第一サンプリング点との距離が最も近い第二サンプリング点、および前記第二サンプリング点と隣接する少なくとも二つの第三サンプリング点を特定するステップであって、前記第一サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、
前記第i-1層の逆深度値に基づき、前記少なくとも二つの第三サンプリング点の各々の逆深度値、および前記第二サンプリング点の逆深度値を取得し、少なくとも三つの逆深度値を得るステップと、
前記少なくとも三つの逆深度値から、最大逆深度値および最小逆深度値を特定するステップと、
前記複数の初期逆深度値から、前記最大逆深度値と前記最小逆深度値の範囲内にある逆深度値を選択し、前記複数の逆深度等分値を選択し、選択された逆深度値を前記第一サンプリング点に対応する逆深度候補値として特定するステップと、
前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値が特定されるまで、前記第i層のサンプリング点内の前記第一サンプリング点ではないサンプリング点に対応する逆深度候補値を継続して特定するステップと、を含む。
理解すべきこととして、本開示の実施例では、i-1層のサンプリング点に対応する逆深度値により、複数の初期逆深度値から第i層のサンプリング点の逆深度候補値を特定しており、第i層のサンプリング点のより正確な逆深度候補値を得ることができ、かつ、逆深度候補値の数が低減され、対応的に、逆深度推定の計算量が低減される。
上記画像深度推定方法において、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得る前記ステップは、
前記第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、前記第i層のサンプリング点内の各サンプリング点を前記第i層の基準画像に投影し、前記第i層のサンプリング点内の各サンプリング点に対応する第i層の投影点を得るステップと、
前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップと、
前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得るステップと、を含む。
理解すべきこととして、本開示の実施例では、第i層のサンプリング点に対して、対応する第i層の投影点とそれぞれマッチングし、それにより異なる逆深度値を利用して投影した投影点との相違度を特定し、それによって、第i層のサンプリング点の逆深度値を正確に選択することができる。
上記画像深度推定方法において、前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得る前記ステップは、
予め設定されたウィンドウにより、前記第i層の現在画像から、マッチング対象サンプリング点を中心とした第一画像ブロックを選択し、前記第i層の基準画像から、前記マッチング対象サンプリング点に対応する第i層の投影点内の各投影点をそれぞれ中心とした複数の第二画像ブロックを選択するステップであって、前記マッチング対象サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、
前記第一画像ブロックを前記複数の第二画像ブロック内の各画像ブロックとそれぞれ比較し、複数のマッチング結果を得て、前記複数のマッチング結果を前記マッチング対象サンプリング点に対応する第i層のマッチング結果として特定するステップと、
前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果が得られるまで、前記第i層のサンプリング点内の前記マッチング対象サンプリング点と異なるサンプリング点に対応する第i層のマッチング結果を継続して特定するステップと、を含む。
理解すべきこととして、本開示の実施例では、ブロックマッチングの方式でサンプリング点と投影点をマッチングし、得られたマッチング結果は実際に、マッチングのペナルティ値であり、それは該投影点とサンプリング点との相違度を表し、対応的に、該投影点を投影する逆深度値がサンプリング点の逆深度値として使用できる程度を示しており、したがって、その結果を使用して後続でサンプリング点の逆深度値を正確に選択することができる。
上記画像深度推定方法において、前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得る前記ステップは、
前記第i層のサンプリング点のうちのいずれか一つである目標サンプリング点に対応する第i層のマッチング結果から、目標マッチング結果を選択するステップと、
前記目標サンプリング点に対応する第i層の投影点内の、前記目標マッチング結果に対応する投影点を目標投影点として特定するステップと、
前記逆深度候補値の内、前記目標投影点に対応する逆深度値を前記目標サンプリング点の逆深度値として特定するステップと、
前記第i層のサンプリング点内の各サンプリング点の逆深度値が特定されるまで、前記第i層のサンプリング点内の、前記目標サンプリング点と異なるサンプリング点の逆深度値を継続して特定し、前記第i層の逆深度値を得るステップと、を含む。
理解すべきこととして、本開示の実施例では、上記のサンプリング点のマッチングプロセスは、実際に、一つのサンプリング点に対して、異なる逆深度値を利用して投影する投影点との相違度をそれぞれ特定することである。選択されたマッチング結果値が最小である結果は、対応する投影点とサンプリング点との相違度が最小であることを示し、したがって、該投影点で採用される逆深度値をサンプリング点の逆深度値として特定し、それによりサンプリング点の正確な逆深度値を得ることができる。
上記画像深度推定方法において、第k層の逆深度値を得る前記ステップの後に、前記方法は、
前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップと、
前記最適化後の第k層の逆深度値を前記逆深度推定結果として特定するステップと、をさらに含む。
理解すべきこととして、本開示の実施例では、上記プロセスにおいて推定された深度は離散値であるため、二次補間を行い、各サンプリング点の逆深度を調整することで、より正確な逆深度値を得るようにしてもよい。
上記画像深度推定方法において、前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得る前記ステップは、
前記第k層の逆深度値内の各逆深度値に対して、それぞれ第k層のサンプリング点内の対応するサンプリング点の候補逆深度値から、隣接逆深度値を選択するステップであって、前記第k層のサンプリング点は前記k層の現在画像のうちの第k層の現在画像をサンプリングして得られた画素点であるステップと、
前記隣接逆深度値に対応するマッチング結果を取得するステップと、
前記隣接逆深度値および前記隣接逆深度値に対応するマッチング結果に基づき、前記第k層の逆深度値内の各逆深度値に対して補間最適化を行い、前記最適化後の第k層の逆深度値を得るステップと、を含む。
理解すべきこととして、本開示の実施例では、特定されたサンプリング点の逆深度値、その隣接逆深度値および隣接逆深度値に対応するマッチング結果により、サンプリング点の逆深度値の補間調整をより正確に行うことができ、かつ調整方式が簡単で高速である。
本開示の実施例は、
現在フレームに対応する基準フレームおよび前記現在フレームの逆深度空間範囲を取得するように構成された取得部と、
前記現在フレームおよび前記基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、前記現在フレームに対応するk層の現在画像、および前記基準フレームに対応するk層の基準画像を得るステップであって、kは2以上の自然数であるステップを実行するように構成されたダウンサンプリング部と、
前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得るように構成された推定部と、を含む画像深度推定装置を提供する。
上記画像深度推定装置において、前記取得部は、具体的に、少なくとも二つの選別対象フレームを取得するステップと、前記少なくとも二つの選別対象フレームから、前記現在フレームと所定角度拘束条件を満たす少なくとも一つのフレームを、前記基準フレームとして選択するステップと、を実行するように構成される。
上記画像深度推定装置において、前記所定角度拘束条件は、
前記現在フレームに対応する姿勢中心および前記基準フレームに対応する姿勢中心と、目標点との接続線により形成された夾角が、第一の所定角度範囲にあることであって、前記目標点は前記現在フレームに対応する平均深度点と前記基準フレームに対応する平均深度点との接続線の中点であることと、
前記現在フレームおよび前記基準フレームに対応する光軸夾角が、第二の所定角度範囲にあることと、
前記現在フレームおよび前記基準フレームに対応する縦軸夾角が、第三の所定角度範囲にあることと、を含む。
上記画像深度推定装置において、前記推定部は、具体的に、前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップであって、前記第i層のサンプリング点は前記k層の現在画像のうちの第i層の現在画像をサンプリングして得られた画素点であり、iは1以上、且つk以下の自然数であるステップと、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップと、i=kになるまで、i=i+1にして、前記k層の現在画像内の、解像度が前記第i層の現在画像より高い第i+1層の現在画像に対して逆深度推定を継続して行い、第k層の逆深度値を得るステップと、前記第k層の逆深度値を前記逆深度推定結果として特定するステップと、を実行するように構成される。
上記画像深度推定装置において、前記推定部は、具体的に、前記逆深度空間範囲に対して区間分割を行い、各分割区間から一つの逆深度値を選択し、複数の初期逆深度値を得るステップと、前記複数の初期逆深度値を第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定するステップと、iが1に等しくない場合、前記k層の現在画像から、第i-1層のサンプリング点、および第i-1層の逆深度値を取得するステップと、前記第i-1層の逆深度推定値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップと、を実行するように構成される。
上記画像深度推定装置において、前記推定部は、具体的に、前記第i-1層のサンプリング点から、第一サンプリング点との距離が最も近い第二サンプリング点、および前記第二サンプリング点と隣接する少なくとも二つの第三サンプリング点を特定するステップであって、前記第一サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、前記第i-1層の逆深度値に基づき、前記少なくとも二つの第三サンプリング点の各々の逆深度値、および前記第二サンプリング点の逆深度値を取得し、少なくとも三つの逆深度値を得るステップと、前記少なくとも三つの逆深度値から、最大逆深度値および最小逆深度値を特定するステップと、前記複数の初期逆深度値から、前記最大逆深度値と前記最小逆深度値の範囲内にある逆深度値を選択し、選択された逆深度値を前記第一サンプリング点に対応する逆深度候補値として特定するステップと、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値が特定されるまで、前記第i層のサンプリング点内の前記第一サンプリング点ではないサンプリング点に対応する逆深度候補値を継続して特定するステップと、を実行するように構成される。
上記画像深度推定装置において、前記推定部は、具体的に、前記第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、前記第i層のサンプリング点内の各サンプリング点を前記第i層の基準画像に投影し、前記第i層のサンプリング点内の各サンプリング点に対応する第i層の投影点を得るステップと、前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップと、前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得るステップと、を実行するように構成される。
上記画像深度推定装置において、前記推定部は、具体的に、予め設定されたウィンドウにより、前記第i層の現在画像から、マッチング対象サンプリング点を中心とした第一画像ブロックを選択し、前記第i層の基準画像から、前記マッチング対象サンプリング点に対応する第i層の投影点内の各投影点をそれぞれ中心とした複数の第二画像ブロックを選択するステップであって、前記マッチング対象サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、前記第一画像ブロックを前記複数の第二画像ブロック内の各画像ブロックとそれぞれ比較し、複数のマッチング結果を得て、前記複数のマッチング結果を前記マッチング対象サンプリング点に対応する第i層のマッチング結果として特定するステップと、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果が得られるまで、前記第i層のサンプリング点内の前記マッチング対象サンプリング点と異なるサンプリング点に対応する第i層のマッチング結果を継続して特定するステップと、を実行するように構成される。
上記画像深度推定装置において、前記推定部は、具体的に、前記第i層のサンプリング点のうちのいずれか一つである目標サンプリング点に対応する第i層のマッチング結果から、目標マッチング結果を選択するステップと、前記目標サンプリング点に対応する第i層の投影点内の、前記目標マッチング結果に対応する投影点を目標投影点として特定するステップと、前記逆深度候補値の内、前記目標投影点に対応する逆深度値を前記目標サンプリング点の逆深度値として特定するステップと、前記第i層のサンプリング点内の各サンプリング点の逆深度値が特定されるまで、前記第i層のサンプリング点内の、前記目標サンプリング点と異なるサンプリング点の逆深度値を継続して特定し、前記第i層の逆深度値を得るステップと、を実行するように構成される。
上記画像深度推定装置において、前記推定部はさらに、前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップと、前記最適化後の第k層の逆深度値を前記逆深度推定結果として特定するステップと、を実行するように構成される。
上記画像深度推定装置において、前記推定部は、具体的に、前記第k層の逆深度値内の各逆深度値に対して、それぞれ第k層のサンプリング点内の対応するサンプリング点の候補逆深度値から、隣接逆深度値を選択するステップであって、前記第k層のサンプリング点は前記k層の現在画像のうちの第k層の現在画像をサンプリングして得られた画素点であるステップと、前記隣接逆深度値に対応するマッチング結果を取得するステップと、前記隣接逆深度値および前記隣接逆深度値に対応するマッチング結果に基づき、前記第k層の逆深度値内の各逆深度値に対して補間最適化を行い、前記最適化後の第k層の逆深度値を得るステップと、を実行するように構成される。
本開示の実施例は、プロセッサ、メモリおよび通信バスを含む電子機器であって、
前記通信バスは、前記プロセッサと前記メモリの間の接続通信を実現するように構成され、
前記プロセッサは、前記メモリに記憶される画像深度推定プログラムを実行して、上記画像深度推定方法を実現するように構成される、電子機器を提供する。
上記電子機器において、前記電子機器は携帯電話またはタブレット型コンピュータである。
本開示の実施例は、一つ以上のプロセッサにより実行されて上記画像深度推定方法を実現可能な一つ以上のプログラムが記憶されている、コンピュータ可読記憶媒体を提供する。
本開示の実施例は、プロセッサにより実行される時に上記画像深度推定方法の対応するステップを実現するコンピュータ可読コードを含む、コンピュータプログラムを提供する。
以上のことから、本開示の実施例の技術的解決手段では、現在フレームに対応する基準フレームおよび現在フレームの逆深度空間範囲を取得し、現在フレームおよび基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、現在フレームに対応するk(kは2以上の自然数)層の現在画像、および基準フレームに対応するk層の基準画像を得て、そしてk層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行い、現在フレームの逆深度推定結果を得る。つまり、本開示が提供する技術的解決手段は、複数層の現在画像を、複数層の基準画像と組み合わせて逆深度推定の反復処理を行い、それによって層ずつに逆深度探索空間を減少させ、現在フレームの逆深度推定結果を特定しており、該逆深度推定結果は現在フレームの画素点の、カメラ座標系でのz軸座標値の逆数であり、座標変換を別途行う必要がなく、かつ層ずつに逆深度探索空間を減少させることは逆深度推定の計算量の低減、および推定速度の向上に寄与し、その結果、画像の深度推定結果をリアルタイムに得ることができ、かつ深度推定結果の正確度が高い。
本開示の実施例が提供する画像深度推定方法のフローチャートである。 本開示の実施例が提供する例示的なカメラ姿勢夾角の模式図である。 本開示の実施例が提供する逆深度推定の反復処理の第一のフローチャートである。 本開示の実施例が提供する例示的な3層の現在画像の模式図である。 本開示の実施例が提供する逆深度候補値特定のフローチャートである。 本開示の実施例が提供する例示的なサンプリング点投影の模式図である。 本開示の実施例が提供する逆深度推定の反復処理の第二のフローチャートである。 本開示の実施例が提供する画像深度推定装置の構成模式図である。 本開示の実施例が提供する電子機器の構成模式図である。
以下に本開示の実施例における図面と関連付けて、本開示の実施例における技術的解決手段を明確に、完全に説明する。
本開示の実施例は画像深度推定方法を提供し、その実行主体は画像深度推定装置であってもよく、例えば、画像深度推定方法は端末機器またはサーバまたは他の電子機器によって実行されてもよく、そのうち、端末機器はユーザ機器(User Equipment、UE)、モバイル機器、ユーザ端末、端末、セルラー電話、コードレス電話機、携帯情報端末(Personal Digital Assistant、PDA)、ハンドヘルド機器、計算機器、車載機器、ウェアラブル機器などであってもよい。いくつかの可能な実施形態では、該画像深度推定方法はプロセッサによってメモリに記憶されるコンピュータ可読命令を呼び出すように実現してもよい。図1は本開示の実施例が提供する画像深度推定方法のフローチャートである。図1に示すように、主に以下のステップを含む。
S101で、現在フレームに対応する基準フレームおよび現在フレームの逆深度空間範囲を取得する。
本開示の実施例では、画像深度推定装置を例にして実行主体を説明する。まず、画像深度推定装置は現在フレームの深度を推定する際に、現在フレームに対応する基準フレームおよび現在フレームの逆深度空間範囲を取得する必要がある。
説明すべきこととして、本開示の実施例では、現在フレームは深度推定を必要とする画像であり、基準フレームは現在フレームの深度推定を行う時の、参照およびマッチング用の画像であり、基準フレームの数は複数であってもよく、深度推定の速度とロバスト性のバランスを考慮し、5つ程度の基準フレームを選択することが望ましく、本開示の実施例は具体的な現在フレームの基準フレームを限定しない点である。
具体的には、本開示の実施例では、画像深度推定装置が現在フレームに対応する基準フレームを取得するステップは、少なくとも二つの選別対象フレームを取得するステップと、少なくとも二つの選別対象フレームから、現在フレームと所定角度拘束条件を満たす少なくとも一つのフレームを選択し、該少なくとも一つのフレームを基準フレームとするステップと、を含む。
説明すべきこととして、本開示の実施例では、画像深度推定装置は、他の方式、例えば、ユーザから送信された少なくとも二つの選別対象フレームへの選択命令を受信し、選択命令に指示された少なくとも一つのフレームを基準フレームとするように、基準フレームを取得してもよい点である。本願の実施例は基準フレームを取得する具体的な方式を限定しない。
説明すべきこととして、本開示の実施例では、画像深度推定装置が少なくとも二つの選別対象フレームから選択した現在フレームに対応する基準フレームは複数であってもよく、かついずれの基準フレームも現在フレームと所定角度拘束条件を満たす点である。選別対象フレームは現在フレームと同一のシーンにおいて、異なる角度で取得された画像である。画像深度推定装置には撮影モジュールが配備されてもよく、該撮影モジュールによって選別対象フレームを取得してもよいが、当然ながら、他の独立した撮影機器によって選別対象フレームを取得してから、画像深度推定装置によって撮影機器から選別対象フレームをさらに取得するようにしてもよい。具体的な所定角度拘束条件は実際の深度推定のニーズに応じて事前に画像深度推定装置に設定してもよく、他の装置に記憶して、深度推定が必要な時に他の装置から取得するようにしてもよく、またはユーザにより入力される角度拘束条件を受信することで取得するなどのようにしてもよく、本開示の実施例はこれを限定しない。
具体的には、本開示の実施例では、所定角度拘束条件は、現在フレームに対応する姿勢中心および基準フレームに対応する姿勢中心と、目標点との接続線により形成された夾角が第一所定角度範囲にあることであって、目標点は現在フレームに対応する平均深度点と基準フレームに対応する平均深度点との接続線の中点であることと、現在フレームおよび基準フレームに対応する光軸夾角が第二の所定角度範囲にあることと、現在フレームおよび基準フレームに対応する縦軸夾角が、第三の所定角度範囲にあることと、を含む。ここで、縦軸は三次元空間におけるカメラ座標系のY軸である。
本開示のいくつかの実施例では、現在フレームに対応する姿勢中心は、実際に、現在フレームを取得する時のカメラの位置および姿勢における、カメラの中心(光心)である。基準フレームに対応する姿勢中心は、実際に、基準フレームを取得する時のカメラの位置および姿勢における、カメラの中心(光心)である。
例示的に、本開示の実施例では、図2に示すように、現在フレーム取得時のカメラの姿勢を姿勢1として、基準フレーム取得時のカメラの姿勢を姿勢2として定義し、姿勢1時にカメラの中心(光心)から対応するシーンまでの平均深度点は点P1であり、姿勢2時にカメラの中心(光心)から対応するシーンまでの平均深度点は点P2であり、P1とP2の間の接続線の中点は点Pであり、所定角度条件は具体的に以下の三つの角度条件を含む。1番目の角度条件としては、姿勢1と姿勢2の時のカメラの中心と点Pとの接続線により形成された画角αが[5,45]の間である。2番目の角度条件としては、カメラの姿勢1と姿勢2の時の光軸夾角が[0,45]の間である。三つ目は、カメラの姿勢1および姿勢2の時のY軸の夾角が[0,30]の間である。この三つの角度条件を同時に満たすフレームしか基準フレームとすることができない。以上の角度区間はいずれも実施時に調整することができる。
説明すべきこととして、本開示の実施例では、現在フレームおよび基準フレームを取得するカメラは、位置特定装置を配備し、それにより現在フレームおよび基準フレームを取得する時に、対応する姿勢を直接取得することができ、画像深度推定装置は位置特定装置において取得された関連姿勢を取得してもよいが、当然ながら、画像深度推定装置は姿勢推定アルゴリズムに従って、得られた現在フレームおよび基準フレームにおけるいくつかの特徴点と組み合わせて、対応する姿勢を算出してもよい点である。
理解すべきこととして、本開示の実施例では、一つ目の角度条件は現在シールから二つのカメラまでの距離を限定しており、角度が大きくなりすぎると、シーンが近すぎることを示し、二つのフレームの重なり度合いが低くなり、角度が小さくなりすぎると、シーンが遠すぎることを示し、視差が小さくなり、誤差が大きくなり、カメラが非常に近い場合でも角度が小さくなりすぎる場合があり、この場合、誤差が同様に大きくなる。二つ目の角度条件は二つのカメラの十分な共通視野領域を確保するために設定される。三つ目の角度条件は、カメラが光軸回りに回転して後続の深度推定計算プロセスが影響を受けることを回避するために設定される。上記三つの角度条件を同時に満たすフレームは基準フレームとして、現在フレーム深度推定の精度の向上に寄与する。
説明すべきこととして、本開示の実施例では、画像深度推定装置は現在フレームに基づいて対応する逆深度空間範囲を直接取得してもよく、ここで、逆深度空間範囲は現在フレームにおける画素点の逆深度値の取り得る空間範囲であり、当然ながら、画像深度推定装置はユーザの設定命令を受信し、設定命令に応じてユーザにより指示された逆深度空間範囲を取得するようにしてもよい点である。本開示の実施例は具体的な逆深度空間範囲を限定しない。例えば、逆深度空間範囲は[dmin,dmax]であり、dminは逆深度空間範囲内の最小の逆深度値であり、dmaxは逆深度空間範囲内の最大の逆深度値である。
S102で、現在フレームおよび基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、現在フレームに対応するk層の現在画像、および基準フレームに対応するk層の基準画像を得て、ここで、kは2以上の自然数である。
本開示の実施例では、画像深度推定装置は現在フレームに対応する基準フレームを取得した後、現在フレームおよび基準フレームに対してピラミッドダウンサンプリング処理をそれぞれ行い、それにより現在フレームに対応するk層の現在画像、および基準フレームに対応するk層の基準画像を得ることができる。
説明すべきこととして、本開示の実施例では、基準フレームは複数であってもよいため、画像深度推定装置が各基準フレーム画像に対してピラミッドダウンサンプリング処理をそれぞれ行うことで、得られたk層の基準画像は実際に複数のグループであり、本開示の実施例はk層の基準画像の具体的な数を限定しない点である。
説明すべきこととして、本開示の実施例では、画像深度推定装置が現在フレームおよび基準フレームに対してピラミッドダウンサンプリング処理をそれぞれ行うことで、得られた現在画像ピラミッドおよび基準画像ピラミッドは層の数が同じであり、採用するスケール因子も同じである点である。例えば、画像深度推定装置が現在フレームおよび基準フレームに対してスケール因子が2のダウンサンプリングをそれぞれ行うことで、三層の現在画像および三層の基準画像が形成され、それぞれ三層であるこの二グループの画像のうち、最上層画像の解像度は最も低く、中間層画像の解像度は最上層画像の解像度より高く、最下層画像の解像度は最も高く、実際に、最下層画像は元画像、即ち対応する現在フレームおよび基準フレームである。具体的な画像の層の数k、およびダウンサンプリングのスケール因子は実際のニーズに応じて予め設定してもよく、本開示の実施例はそれを限定しない。
例示的に、本開示の実施例では、画像深度推定装置は現在フレームItに対応する5つの基準フレームを取得しており、それぞれ、基準フレームI1、基準フレームI2、基準フレームI3、基準フレームI4、および基準フレームI5であり、画像深度推定装置は、これらのフレームに対してスケール因子が2であるダウンサンプリングをそれぞれ行い、それにより現在フレームItに対応する3層の現在画像、および基準フレームI1、基準フレームI2、基準フレームI3、基準フレームI4および基準フレームI5のそれぞれに対応する三層の基準画像を取得する。
S103で、k層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行い、現在フレームに対応する逆深度推定結果を得る。
本開示の実施例では、画像深度推定装置はk層の現在画像およびk層の基準画像を取得した後、k層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して、例えば、最上層(第1層)の現在画像(画素が最も少ない画像)から、最下層へ順に逆深度推定の反復を行い、最下の第k層まで、層ずつに逆深度探索空間を縮小するように、逆深度推定の反復処理を行い、現在フレームに対応する逆深度推定結果を得ることができる。
図3は本開示の実施例が提供する逆深度推定の反復処理の第一のフローチャートである。図3に示すように、画像深度推定装置がk層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行い、現在フレームに対応する逆深度推定結果を得るステップは、以下のステップを含む。
S301で、k層の現在画像および逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定し、ここで、第i層のサンプリング点はk層の現在画像のうちの第i層の現在画像をサンプリングして得られた画素点であり、iは1以上、且つk以下の自然数である。
本開示の実施例では、k層の現在画像は解像度の低い順に、第1層の現在画像、第2層の現在画像、第3層の現在画像、……、第k層の現在画像を含み、第1層の現在画像はk層の現在画像のうちの最上層画像であり、第k層の現在画像は現在画像ピラミッドにおける最下層画像であり、同様に、k層の基準画像は解像度の低い順に、第1層の基準画像、第2層の基準画像、第3層の基準画像、……、第k層の基準画像を含み、第1層の基準画像は基準画像ピラミッドにおける最上層画像であり、第k層の基準画像は基準画像ピラミッドにおける最下層画像である。
説明すべきこととして、本開示の実施例では、画像深度推定装置はk層の現在画像のうちの第i層の現在画像に対して画素点をサンプリングしてもよく、ここで、サンプリングによって得られた画素点は第i層のサンプリング点であり、iの具体的な値は1より大きくかつk以下の自然数であり、本開示の実施例はそれを限定しない点である。
説明すべきこととして、本開示の実施例では、画像深度推定装置は第i層の現在画像に対して画素点をサンプリングする時、所定のサンプリングステップサイズで実現してもよい点である。具体的なサンプリングステップサイズは実際のニーズに応じて決定してもよく、本開示の実施例はこれを限定しない。
図4は本開示の実施例が提供する例示的な3層の現在画像の模式図である。図4に示すように、画像深度推定装置は事前に現在フレームに対して、x軸およびy軸座標でサンプリングステップサイズを2とするように画素点をサンプリングし、合計3層の現在画像を得るようにしてもよく、そのうち、第1層の現在画像の解像度が最も低く、第2層の現在画像の解像度が第1層の現在画像より高く、第3層の現在画像の解像度が第2層の現在画像より高く、第3層の現在画像は実際に現在フレームの元画像である。
具体的には、本開示の実施例では、画像深度推定装置がk層の現在画像および逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する第i層の逆深度候補値を特定するステップは、iが1に等しい場合、逆深度空間範囲の区間等分割を行い、分割区間の複数の逆深度等分値を得るステップと、複数の逆深度等分値を第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定するステップと、iが1に等しくない場合、k層の現在画像から第i-1層のサンプリング点、および第i-1層の逆深度推定値を取得するステップと、第i-1層の逆深度推定値、第i-1層のサンプリング点、および複数の逆深度等分値に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップと、を含む。
理解すべきこととして、本開示の実施例では、画像深度推定装置は逆深度空間範囲に対して区間分割を行い、それによりそれぞれの区間内から逆深度値を選択することで、いずれの区間内にも逆深度候補値となる一つの逆深度値が存在するようになる。つまり、いずれのサンプリング点も異なる逆深度範囲内に一つの逆深度候補値が存在し、後続でサンプリング点の逆深度値を特定すれば、異なる逆深度範囲の逆深度値でも逆深度値の推定および特定を行うことができ、推定プロセスが全逆深度空間範囲をカバーするようになり、さらに最終的に逆深度値を正確に推定することができる。
理解すべきこととして、本開示の実施例では、iが1に等しい場合、画像深度推定装置は第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定する必要があり、ここで、第1層のサンプリング点はk層の現在画像のうち解像度が最も低い第1層の現在画像におけるサンプリング点であり、画像深度推定装置が取得する現在フレームに対応する逆深度空間範囲は[dmin,dmax]であり、それを等分して、分割区間のq個の逆深度等分値d1、d2、……、dqを得ることができ、このq個の逆深度等分値を全て初期逆深度値、即ち第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定することができ、当然ながら、逆深度候補値はdminおよびdmaxを含んでもよい。つまり、第1層のサンプリング点の各々について言えば、それらに対応する逆深度候補値は完全に同じである。画像深度推定装置による逆深度空間範囲の等分割区間は実際のニーズに応じて設定してもよく、本開示の実施例はそれを限定しない。
説明すべきこととして、本開示の実施例では、画像深度推定装置が上記等分割方式で逆深度空間範囲に対して区間分割を行い、分割区間の逆深度値を逆深度候補値とすれば、逆深度候補値が全逆深度空間範囲を均一にカバーし、後続で逆深度候補値から特定された逆深度値がより正確になるように保証できる点である。
説明すべきこととして、本開示の実施例では、iが1に等しい場合、逆深度空間範囲を等分割の方式で分割する以外、非等分割の方式で分割してもよい点である。例えば、予め設定された複数の異なる間隔で逆深度空間範囲を順に分割するか、または、予め設定された初期分割間隔で、間隔の変化ルール従って、毎回分割するたびに間隔を調整し、さらに調整後の間隔で次の区間を分割する。当然ながら、初期逆深度値の選択は分割された区間から一つの逆深度値を直接ランダムに選択してもよく、各分割区間の中間の逆深度値を選択してもよい。本開示の実施例は具体的な区間分割方式および初期逆深度値の選択方式を限定しない。
説明すべきこととして、本開示の実施例では、iが1に等しくない場合、画像深度推定装置はk層の現在画像から第i-1層のサンプリング点、即ちk層の現在画像のうちの第i-1層のサンプリング点をサンプリングして得られた画素点を取得する必要があり、かつ、第i-1層の逆深度値を取得する必要もある点である。各層の現在画像はいずれも異なるサンプリングステップサイズでサンプリング可能である。そのうち、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定する前に、i=i-1となった場合には、画像深度推定装置は既に上記逆深度推定ステップに従って第i層の逆深度値、即ち第i-1層のサンプリング点内の各サンプリング点の逆深度値を得ていた。したがって、画像深度推定装置は第i-1層の逆深度値を直接取得し、さらに第i-1層の逆深度値、第i-1層のサンプリング点、および複数の逆深度等分値に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定することができる。
図5は本開示の実施例が提供する逆深度候補値特定のフローチャートである。図5に示すように、画像深度推定装置が第i-1層の逆深度推定値、第i-1層のサンプリング点、および複数の初期逆深度値に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップは、
第i-1層のサンプリング点から、第一サンプリング点との距離が最も近い第二サンプリング点、および第二サンプリング点と隣接する少なくとも二つの第三サンプリング点を特定するステップであって、第一サンプリング点は第i層のサンプリング点のうちのいずれか一つであるステップS501と、
第i-1層の逆深度値に基づき、少なくとも二つの第三サンプリング点の各々の逆深度値、および第二サンプリング点の深度値を取得し、少なくとも三つの逆深度値を得るステップS502と、
少なくとも三つの逆深度値から、最大逆深度値および最小逆深度値を特定するステップS503と、
複数の初期逆深度値から、最大逆深度値と最小逆深度値の範囲内にある逆深度値を選択し、選択された逆深度値を第一サンプリング点に対応する逆深度候補値として特定するステップS504と、
第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値が特定されるまで、第i層のサンプリング点のうち第一サンプリング点ではないサンプリング点に対応する逆深度候補値を継続して特定するステップS505と、を含む。
説明すべきこととして、本開示の実施例では、iが1に等しい場合、第i層のサンプリング点、即ち第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値は、全て同じであり、iが1に等しくない場合、第i層のサンプリング点内の各サンプリング点に対応する第i層の逆深度候補値は、第i-1層のサンプリング点および第i-1層の逆深度値に基づき、複数の初期逆深度値から選択し、範囲が小さい逆深度候補値を特定することができ、かつ第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値は全て異なることがある。
例示的に、本開示の実施例では、
Figure 2022515517000002
は第i層のサンプリング点のうちのいずれか一つであり、画像深度推定装置は第i-1層のサンプリング点から
Figure 2022515517000003
との距離が最も近いサンプリング点
Figure 2022515517000004
を探し出し、それにより第i-1層のサンプリング点から、
Figure 2022515517000005
を中心として、その隣接の複数の(例えば8つ)サンプリング点を特定し、その後、第i-1層の逆深度値に基づき、
Figure 2022515517000006
、およびそれと隣接する8つのサンプリング点内の各サンプリング点の逆深度値を取得し、つまり9つの逆深度値を得て、さらに、9つの逆深度値のうち最大の逆深度値d1と最小の逆深度値d2を限界とし、複数の初期逆深度値のうちd1とd2の間の深度値を選び出し、d1およびd2を含めて、全て
Figure 2022515517000007
に対応する候補逆深度値として特定することができる。
説明すべきこととして、本開示の実施例では、画像深度推定装置は第i-1層のサンプリング点から第二サンプリング点と隣接する第三サンプリング点を特定する際に、その周囲の8つのサンプリング点を全て第三サンプリング点として特定してもよいが、当然ながら、それと左右に隣接する2つのサンプリング点、または上下に隣接する2つのサンプリング点を第三サンプリング点として特定してもよく、またそれと上下左右に隣接する4つのサンプリング点を全て第三サンプリング点として特定してもよく、本開示の実施例は第三サンプリング点の具体的な数を限定しない点である。
説明すべきこととして、本開示の実施例では、画像深度推定装置はさらに、他のルールに従って第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定してもよい点である。例えば、ユーザにより設定された異なる層のサンプリング点に対する異なる逆深度候補値を受信し、ここで、同一層のサンプリング点内の各サンプリング点に対応する逆深度候補値は同じである。本開示の実施例は逆深度候補値を特定する具体的な方式を限定しない。
S302で、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値およびk層の基準画像のうちの第i層の基準画像に基づき、第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得る。
具体的には、本開示の実施例では、画像深度推定装置が第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値およびk層の基準画像のうちの第i層の基準画像に基づき、第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップは、第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、第i層のサンプリング点内の各サンプリング点を第i層の基準画像に投影し、第i層のサンプリング点内の各サンプリング点に対応する第i層の投影点を得るステップと、第i層のサンプリング点および第i層の投影点に基づいてブロックマッチングを行い、第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップと、第i層のマッチング結果に基づき、第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップと、を含む。
説明すべきこととして、本開示の実施例では、画像深度推定装置は、第i層のサンプリング点内の各サンプリング点に対して、いずれも対応する逆深度候補値内の各逆深度値に従って第i層の基準画像に投影する。当然ながら、基準フレームが複数あり、対応的に、第i層の基準画像が複数ある場合、画像深度推定装置は第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、第k層の各基準画像にそれぞれ投影する。
具体的には、本開示の実施例では、現在フレームtおよび基準フレームrに対して、画像深度推定装置は、第i層のサンプリング点のうちのいずれか一つである
Figure 2022515517000008
(uおよびvは該サンプリング点のx軸およびy軸座標)、および
Figure 2022515517000009
に対応する逆深度候補値のうちのいずれか一つである
Figure 2022515517000010
を、下式(1)および下式(2)に従って第k層の基準画像に投影する。
Figure 2022515517000011
Figure 2022515517000012
説明すべきこととして、Kは現在フレームtおよび基準フレームrを取得するカメラに対応するカメラ内部パラメータ行列であり、
Figure 2022515517000013
は第i層の現在画像に対応する焦点距離の、x軸およびy軸での画素に基づいて測定するスケール因子であり、
Figure 2022515517000014
は画素を使用して記述されるx軸方向の焦点距離の長さであり、
Figure 2022515517000015
は画素を使用して記述されるy軸方向の焦点距離の長さである点である。
Figure 2022515517000016
は第i層の現在画像の主点位置であり、
Figure 2022515517000017
の回転行列であり、
Figure 2022515517000018
の並進ベクトルである。式(1)から最終的に得られた
Figure 2022515517000019
の行列であり、ここで、1行目の要素は
Figure 2022515517000020
であり、2行目の要素は
Figure 2022515517000021
であり、3行目の要素は
Figure 2022515517000022
であり、式(2)に従ってさらに計算すれば、サンプリング点
Figure 2022515517000023
を対応する逆深度候補値のうちの逆深度値
Figure 2022515517000024
に応じて、基準フレームrのうちの第i層の基準画像に投影した投影点
Figure 2022515517000025
を得ることができる。
理解すべきこととして、本開示の実施例では、第i層のサンプリング点内の各サンプリング点に対して、いずれも式(2)および式(3)によって、対応する逆深度候補値内の各逆深度値に従って第i層の基準画像に投影することができ、第i層の基準画像が複数ある場合、繰り返し実行すればよい。
説明すべきこととして、本開示の実施例では、画像深度推定装置は第i層の投影点を得た後、第i層のサンプリング点および第i層の投影点に基づいてブロックマッチングを行うことができる点であり、具体的には、第i層のサンプリング点内の各サンプリング点に対して、対応する第i層の投影点内の各投影点とのブロックマッチングをそれぞれ行い、それにより各サンプリング点に対応する第i層のマッチング結果を得る。
具体的には、本開示の実施例では、画像深度推定装置が第i層のサンプリング点および第i層の投影点に基づいてブロックマッチングを行い、第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップは、予め設定されたウィンドウにより、第i層の現在画像からマッチング対象サンプリング点を中心とした第一画像ブロックを選択し、第i層の基準画像からマッチング対象サンプリング点に対応する第i層の投影点内の各投影点をそれぞれ中心とした複数の第二画像ブロックを選択するステップであって、マッチング対象サンプリング点は第i層のサンプリング点のうちのいずれか一つであるステップと、第一画像ブロックを複数の第二画像ブロック内の各画像ブロックとそれぞれ比較し、複数のマッチング結果を得て、複数のマッチング結果をマッチング対象サンプリング点に対応する第i層のマッチング結果として特定するステップと、第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果が得られるまで、第i層のサンプリング点のうちマッチング対象サンプリング点と異なるサンプリング点に対応する第i層のマッチング結果を継続して特定するステップと、を含む。例えば、一つの
Figure 2022515517000026
のウィンドウを用いて、第i層の現在画像および第i層の基準画像から、第i層のサンプリング点内の各サンプリング点およびそれに対応する投影点をそれぞれ中心とし、サンプリング点および投影点の領域点を取得し、二つの画像ブロックを得て、続いて取得された画像ブロックにおける対応する位置の画素点の画素値を比較し、二つの画像ブロックのマッチングのペナルティ値(例えば、画素差の絶対値の和)を得る。同一の逆深度値に対して、第i層の基準画像毎に、一つのペナルティ値を得ることができる。複数の第i層の基準画像が存在する場合、得られた複数のペナルティ値を融合(例えば複数のペナルティ値を平均)すれば、各サンプリング点がそれぞれ一つの逆深度値に対応する第i層のマッチング結果を得ることができる。各サンプリング点の複数の逆深度値に対して、いずれも、各逆深度値に対応する一つのペナルティ値、即ち各サンプリング点に対応する第i層のマッチング結果を得ることができる。
具体的には、本開示の実施例では、図6に示すように、現在フレームtおよびm個(mは1以上の自然数)の基準フレームに対して、画像深度推定装置は第i層のサンプリング点のうちのいずれか一つである
Figure 2022515517000027
を、下式(3)に示すように、対応する第i層の投影点のうち逆深度値を
Figure 2022515517000028
として投影して得られた投影点
Figure 2022515517000029
とのブロックマッチングを行い、それにより第i層のマッチング結果のうち逆深度値が
Figure 2022515517000030
であるマッチング結果を得る。
Figure 2022515517000031
ここで、
Figure 2022515517000032
を、それに対応する候補逆深度値のうちの逆深度値
Figure 2022515517000033
に応じて、m個の基準フレームの各々がそれぞれ対応する第i層の基準画像にそれぞれ投影した投影点であり、合計m個である。
Figure 2022515517000034
の近傍画素値の比較関数であり、該比較関数は
Figure 2022515517000035
の近傍グレースケール値のゼロ平均正規化相互相関(Zero-mean Normalized Cross Correlation、ZNCC)としてもよく、差分絶対値和(Sum of absolute differences、SAD)または差分二乗和(Sum of Squared Differences、SSD)の二つの方法を使用してもよい。
Figure 2022515517000036
に対応する第i層のマッチング結果のうち、逆深度値が
Figure 2022515517000037
であるマッチング結果である。
説明すべきこととして、本開示の実施例では、第i層のサンプリング点のうち、各サンプリング点に対応する第i層のマッチング結果は、いずれもそれ自体に対応する逆深度候補値のうちのそれぞれの逆深度値のマッチング結果を含み、例えば、第i層のサンプリング点のうちのいずれか一つである
Figure 2022515517000038
に対して、対応する逆深度候補値はd1、d2、……、dqを含み、得られた第i層のマッチング結果は各逆深度値のマッチング結果を含み、本開示の実施例は具体的な第i層のマッチング結果を限定しない点である。
例示的に、本開示の実施例では、現在フレームに対応する基準フレームは2つのフレームを含み、各フレームには2層である一群の基準画像がそれぞれ対応付けられており、つまり二つの第1層の基準画像を有し、画像深度推定装置は現在フレームにおける第1層の現在画像の一つのサンプリング点
Figure 2022515517000039
を、それに対応する逆深度候補値
Figure 2022515517000040
に応じて二つの第1層の基準画像にそれぞれ投影し、それぞれ二つの第1層の基準画像から三つの投影点、合計6つの投影点を得て、それに対応する第1層の投影点とする。そのうち、
Figure 2022515517000041
に応じて一つの第1層の基準画像に投影した投影点は
Figure 2022515517000042
であり、
Figure 2022515517000043
に応じて別の第1層の基準画像に投影した投影点は
Figure 2022515517000044
であり、したがって、
Figure 2022515517000045
を式(3)に代入し、つまりmを2とするように、
Figure 2022515517000046
に対応する逆深度値が
Figure 2022515517000047
であるマッチング結果を得ることができ、同様に、逆深度候補値
Figure 2022515517000048
であるマッチング結果を得て、
Figure 2022515517000049
に対応する第i層のマッチング結果として組み合わせることもできる。
具体的には、本開示の実施例では、画像深度推定装置が第i層のマッチング結果に基づき、第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップは、目標サンプリング点に対応する第i層のマッチング結果から、目標マッチング結果を選択するステップであって、目標サンプリング点は第i層のサンプリング点のうちのいずれか一つであるステップと、目標サンプリング点に対応する第i層の投影点内の、目標マッチング結果に対応する投影点を目標投影点として特定するステップと、逆深度候補値の内、目標投影点に対応する逆深度値を目標サンプリング点の逆深度値として特定するステップと、第i層のサンプリング点内の各サンプリング点の逆深度値が特定されるまで、第i層のサンプリング点内の、目標サンプリング点と異なるサンプリング点の逆深度値を継続して特定し、第i層の逆深度値を得るステップと、を含む。
説明すべきこととして、本開示の実施例では、画像深度推定装置は第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得た後、下式(4)に従って第i層のサンプリング点のうちのいずれか一つである
Figure 2022515517000050
の逆深度値を特定することができる点である。
Figure 2022515517000051
ここで、
Figure 2022515517000052
に対応する第i層のマッチング結果のうち逆深度値が
Figure 2022515517000053
であるマッチング結果
Figure 2022515517000054
は、他の逆深度値とのマッチング結果値と比べて最小となるため、対応する逆深度値
Figure 2022515517000055
の逆深度値として特定される。
理解すべきこととして、本開示の実施例では、サンプリング点を対象とした上記マッチングプロセスは、実際に、一つのサンプリング点に対して、異なる逆深度値で投影した投影点との相違度をそれぞれ特定することであり、式(4)を用いて逆深度値を特定することは、実際に、マッチング結果値が最小である結果を選び出すことであり、それは対応する投影点とサンプリング点との相違度が最小であることを示しているため、該投影点で採用される逆深度値をサンプリング点の逆深度値として特定し、それによりサンプリング点の正確な逆深度値を得ることができる。
説明すべきこととして、本開示の実施例では、画像深度推定方法は他の方式で第i層のサンプリング点内の各サンプリング点の逆深度値を特定してもよい点である。例えば、各サンプリング点に対応するマッチング結果から特定の範囲にある部分の結果を選択し、その後、該部分の結果から一つのマッチング結果をランダムに選択し、ランダムに選択されたマッチング結果に対応する投影点で採用される逆深度値をサンプリング点の逆深度値として特定する。
S303で、i=kになるまで、i=i+1にして、k層の現在画像内の、解像度が第i層の現在画像より高い第i+1層の現在画像に対して逆深度推定を継続して行い、第k層の逆深度値を得る。
本開示の実施例では、画像深度推定装置は、第i層の逆深度値を得た後、i=i+1にし、そして第i層の現在画像の第i+1層の現在画像に対して逆深度推定を継続して行い、このプロセスは第i層の逆深度値の取得と同じであるため、ここでは説明を省略する。継続的な反復推定プロセスにおいて、i=kになるまで、画像深度推定装置は、第k層の逆深度値、つまりk層の現在画像内の、解像度が最も高い画像、即ち、実際に現在フレームの元画像における各サンプリング点の逆深度値を得ってから、i=i+1にする操作を停止する。
S304で、第k層の逆深度値を逆深度推定結果として特定する。
本開示の実施例では、画像深度推定装置は第k層の逆深度値を得た後、第k層の逆深度値を逆深度推定結果として特定することができる。
任意選択的に、上記プロセスにおいて推定された深度は離散値であり、より正確な逆深度を得るためには、二次補間を行い、各サンプリング点の逆深度を調整するようにしてもよい。具体的には、図7に示すように、ステップS303の後にさらにS305~S306を含んでもよい。
S305で、第k層の逆深度値に対して補間最適化を行い、逆深度推定結果を得る。
本開示の実施例では、画像深度推定装置は、第k層のサンプリング点の各々に対応する逆深度値を含む第k層の逆深度値を得た後、より正確な第k層の逆深度値を得るために、第k層の逆深度値に対して補間最適化を行い、つまり第k層のサンプリング点内の各サンプリング点の逆深度値をそれぞれ調整して最適化し、それにより最適化後の第k層の逆深度値を得るようにしてもよい。
具体的には、本開示の実施例では、画像深度推定装置が第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップは、第k層の逆深度値内の各逆深度値に対して、それぞれ第k層のサンプリング点内の対応するサンプリング点の候補逆深度値から、逆深度値の隣接逆深度値を選択するステップであって、第k層のサンプリング点はk層の現在画像のうちの第k層の現在画像をサンプリングして得られた画素点であるステップと、隣接逆深度値に対応するマッチング結果を取得するステップと、隣接逆深度値および隣接逆深度値に対応するマッチング結果に基づき、第k層の逆深度値内の各逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップと、を含む。
具体的には、本開示の実施例では、第k層の逆深度値は第k層のサンプリング点の各々に対応する逆深度値を含み、画像深度推定装置は第k層のサンプリング点の各々に対応する逆深度値に対して補間最適化を行い、それにより補間最適化結果を、現在フレームの逆深度推定結果として得る必要がある。ここで、第k層のサンプリング点のうちのいずれか一つである
Figure 2022515517000056
は、それに対応する逆深度値が
Figure 2022515517000057
である場合、式(5)に従って補間最適化を行うことができる。
Figure 2022515517000058
式中、
Figure 2022515517000059
はサンプリング点
Figure 2022515517000060
に対応する逆深度候補値のうち、
Figure 2022515517000061
と隣接する前の逆深度値である。
Figure 2022515517000062
Figure 2022515517000063
であり、いずれも
Figure 2022515517000064
の逆深度値を計算する時に、式(3)によって算出可能であり、
Figure 2022515517000065
に対応する候補逆深度値のうち
Figure 2022515517000066
と隣接する二つの逆深度値であり、ここでは説明を省略する。
理解すべきこととして、本開示の実施例では、画像深度推定装置は式(5)に従って第k層の逆深度値に対して補間最適化を行っており、k層の現在画像のうち、第k層の現在画像は実際に現在フレームであるため、実際に、現在フレームにおける各サンプリング点の逆深度値が得られた後、それがさらに最適化され、それにより現在フレームにおける各サンプリング点のより正確な逆深度値が得られ、つまり現在フレームの逆深度推定結果が得られる。本開示の実施例では、画像深度推定装置は三つ以上の隣接逆深度値およびそれに対応するマッチング結果を取得し、式(5)に類似する多項式により補間最適化を行うようにしてもよい。また、画像深度推定装置は第k層のサンプリング点の各々の逆深度値に対して、それに対応する逆深度候補値のうち特定された逆深度値と隣接する二つの深度値を取得し、この三つの逆深度値の平均値をサンプリング点の最終的な逆深度値とし、逆深度値の最適化を実現するようにしてもよい。
S306で、最適化後の第k層の逆深度値を逆深度推定結果として特定する。
本開示の実施例では、画像深度推定装置は最適化後の第k層の逆深度値を得た後、最適化後の第k層の逆深度値を逆深度推定結果として特定することができる。
任意選択的に、本開示の実施例では、画像深度推定装置は逆深度推定結果を特定した後、即ちステップS103の後に、以下のステップを実行してもよい。
S104で、逆深度推定結果に基づき、現在フレームの深度推定結果を特定する。
本開示の実施例では、画像深度推定装置は現在フレームの逆深度推定結果を得た後、逆深度推定結果に基づき、現在フレームの深度推定結果を特定することができ、該深度推定結果は現在フレームに基づく三次元シーン構築に用いることができる。
説明すべきこととして、本開示の実施例では、一つのサンプリング点について、その逆深度値と深度値は互いに逆数であるため、画像深度推定装置は現在フレームの逆深度推定結果、即ち現在フレームにおける各サンプリング点の補間最適化後の逆深度値を得た後、その逆数をそれぞれ取れば対応する深度値を得て、さらに現在フレームの深度推定結果を得ることができる点である。例えば、現在フレームにおける或るサンプリング点の補間最適化後の逆深度値が
Figure 2022515517000067
である場合、その深度値は
Figure 2022515517000068
となる。
説明すべきこととして、本開示の実施例では、三角化や逆求解などの計算を行わなければカメラ座標系でのz軸座標値を得ることができない従来技術と比べ、上記画像深度推定方法により特定された最終の深度推定結果が現在フレームのサンプリング点の、カメラ座標系でのz軸座標値であり、座標変換を別途行う必要がない点である。
説明すべきこととして、本開示の実施例では、上記画像深度推定方法は現在フレームに基づく三次元シーンの構築プロセスの実現に用いることができる。例えば、ユーザがモバイル機器のカメラを用いて或るシーンを撮影する時、上記画像深度推定方法により現在フレームの深度推定結果を得て、さらにビデオシーンの3D構造を再構築することができる。ユーザがモバイル機器におけるビデオの現在フレーム内の或る位置をクリックする時、上記画像深度推定方法により特定された現在フレームの深度推定結果に基づき、クリック位置での視線の交点を求めてアンカーを見出して仮想物体を配置し、さらに仮想物体と現実シーンが幾何学的整合性をもって融合された拡張現実効果を実現することができる。単眼ビデオにおいて上記画像深度推定方法により三次元シーン構造を復元し、現実シーンと仮想物体との遮蔽関係を計算することで、仮想物体と現実シーンが遮蔽関係の整合性をもって融合された拡張現実効果を実現することができる。単眼ビデオにおいて上記画像深度推定方法によりシーンの三次元構造を復元し、現実感を有する陰影効果を得て、それにより仮想物体と現実シーンが光学的整合性をもって融合された拡張現実効果を実現することができる。単眼ビデオにおいて上記画像深度推定方法によりシーンの三次元構造、および仮想のカートゥーンキャラクターとの物理的衝突を復元し、それにより仮想のカートゥーンキャラクターと現実シーンが物理的整合性をもって融合された現実感を有する動画効果を実現することができる。
また、本開示の実施例では、上記ステップS104を実行しなくてもよく、該逆深度推定結果は三次元シーン作成でない他の画像処理に用いられてもよい。例えば、目標認識または三次元点距離計算などのデータ処理を行うために、画像サンプリング点の深度情報変化値が他の機器に直接出力される。
本開示の実施例は画像深度推定方法を提供し、現在フレームに対応する基準フレームおよび現在フレームの逆深度空間範囲を取得し、現在フレームおよび基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、現在フレームに対応するk(kは2以上の自然数)層の現在画像、および基準フレームに対応するk層の基準画像を得て、そしてk層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行い、現在フレームの逆深度推定結果を得る。つまり、本開示が提供する技術的解決手段は、複数層の現在画像を複数層の基準画像と組み合わせて逆深度推定の反復処理を行うことで、層ずつに逆深度探索空間を減少させ、現在フレームの深度推定結果を特定し、かつ最終の深度推定結果が現在フレームの画素点の、カメラ座標系でのz軸座標値であり、座標変換を別途行う必要がなく、画像の深度推定結果をリアルタイムに得ることができ、かつ深度推定結果の正確度が高い。
本開示の実施例は画像深度推定装置をさらに提供し、図8は本開示の実施例が提供する画像深度推定装置の構成模式図である。図8に示すように、それは、
現在フレームに対応する基準フレームおよび前記現在フレームの逆深度空間範囲を取得するように構成された取得部801と、
前記現在フレームおよび前記基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、前記現在フレームに対応するk層の現在画像、および前記基準フレームに対応するk層の基準画像を得るステップであって、kは2以上の自然数であるステップを実行するように構成されたダウンサンプリング部802と、
前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得るように構成された推定部803と、を含み、
任意選択的に、本開示の実施例の画像深度推定装置は、前記逆深度推定結果に基づき、前記現在フレームの深度推定結果を特定するように構成された特定部804をさらに含んでもよく、前記深度推定結果は前記現在フレームに基づく三次元シーン構築の実現に用いることができる。
任意選択的に、前記取得部801は、具体的に、少なくとも二つの選別対象フレームを取得するステップと、前記少なくとも二つの選別対象フレームから、前記現在フレームと所定角度拘束条件を満たす少なくとも一つのフレームを、前記基準フレームとして選択するステップと、を実行するように構成される。
任意選択的に、前記所定角度拘束条件は、
前記現在フレームに対応する姿勢中心および前記基準フレームに対応する姿勢中心と、目標点との接続線により形成された夾角が、第一の所定角度範囲にあることであって、前記目標点は前記現在フレームに対応する平均深度点と前記基準フレームに対応する平均深度点との接続線の中点であることと、
前記現在フレームおよび前記基準フレームに対応する光軸夾角が、第二の所定角度範囲にあることと、
前記現在フレームおよび前記基準フレームに対応する縦軸夾角が、第三の所定角度範囲にあることと、を含む。
任意選択的に、前記推定部803は、具体的に、前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップであって、前記第i層のサンプリング点は前記k層の現在画像のうちの第i層の現在画像をサンプリングして得られた画素点であり、iは1以上、且つk以下の自然数であるステップと、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップと、i=kになるまで、i=i+1にして、前記k層の現在画像内の、解像度が前記第i層の現在画像より高い第i+1層の現在画像に対して逆深度推定を継続して行い、第k層の逆深度値を得るステップと、前記第k層の逆深度値を前記逆深度推定結果として特定するステップと、を実行するように構成される。
任意選択的に、前記推定部803は、具体的に、前記逆深度空間範囲に対して区間分割を行い、各分割区間から一つの逆深度値を選択し、複数の初期逆深度値を得るステップと、前記複数の初期逆深度値を第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定するステップと、iが1に等しくない場合、前記k層の現在画像から、第i-1層のサンプリング点、および第i-1層の逆深度値を取得するステップと、前記第i-1層の逆深度推定値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップと、を実行するように構成される。
任意選択的に、前記推定部803は、具体的に、前記第i-1層のサンプリング点から、第一サンプリング点との距離が最も近い第二サンプリング点、および前記第二サンプリング点と隣接する少なくとも二つの第三サンプリング点を特定するステップであって、前記第一サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、前記第i-1層の逆深度値に基づき、前記少なくとも二つの第三サンプリング点の各々の逆深度値、および前記第二サンプリング点の逆深度値を取得し、少なくとも三つの逆深度値を得るステップと、前記少なくとも三つの逆深度値から、最大逆深度値および最小逆深度値を特定するステップと、前記複数の初期逆深度値から、前記最大逆深度値と前記最小逆深度値の範囲内にある逆深度値を選択し、選択された逆深度値を前記第一サンプリング点に対応する逆深度候補値として特定するステップと、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値が特定されるまで、前記第i層のサンプリング点内の前記第一サンプリング点ではないサンプリング点に対応する逆深度候補値を継続して特定するステップと、を実行するように構成される。
任意選択的に、前記推定部803は、具体的に、前記第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、前記第i層のサンプリング点内の各サンプリング点を前記第i層の基準画像に投影し、前記第i層のサンプリング点内の各サンプリング点に対応する第i層の投影点を得るステップと、前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップと、前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得るステップと、を実行するように構成される。
任意選択的に、前記推定部803は、具体的に、予め設定されたウィンドウにより、前記第i層の現在画像から、マッチング対象サンプリング点を中心とした第一画像ブロックを選択し、前記第i層の基準画像から、前記マッチング対象サンプリング点に対応する第i層の投影点内の各投影点をそれぞれ中心とした複数の第二画像ブロックを選択するステップであって、前記マッチング対象サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、前記第一画像ブロックを前記複数の第二画像ブロック内の各画像ブロックとそれぞれ比較し、複数のマッチング結果を得て、前記複数のマッチング結果を前記マッチング対象サンプリング点に対応する第i層のマッチング結果として特定するステップと、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果が得られるまで、前記第i層のサンプリング点内の前記マッチング対象サンプリング点と異なるサンプリング点に対応する第i層のマッチング結果を継続して特定するステップと、を実行するように構成される。
任意選択的に、前記推定部803は、具体的に、前記第i層のサンプリング点のうちのいずれか一つである目標サンプリング点に対応する第i層のマッチング結果から、目標マッチング結果を選択するステップと、前記目標サンプリング点に対応する第i層の投影点内の、前記目標マッチング結果に対応する投影点を目標投影点として特定するステップと、前記逆深度候補値の内、前記目標投影点に対応する逆深度値を前記目標サンプリング点の逆深度値として特定するステップと、前記第i層のサンプリング点内の各サンプリング点の逆深度値が特定されるまで、前記第i層のサンプリング点内の、前記目標サンプリング点と異なるサンプリング点の逆深度値を継続して特定し、前記第i層の逆深度値を得るステップと、を実行するように構成される。
任意選択的に、前記推定部803はさらに、前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップと、前記最適化後の第k層の逆深度値を前記逆深度推定結果として特定するステップと、を実行するように構成される。
任意選択的に、前記推定部803は、具体的に、前記第k層の逆深度値内の各逆深度値に対して、それぞれ第k層のサンプリング点内の対応するサンプリング点の候補逆深度値から、隣接逆深度値を選択するステップであって、前記第k層のサンプリング点は前記k層の現在画像のうちの第k層の現在画像をサンプリングして得られた画素点であるステップと、前記隣接逆深度値に対応するマッチング結果を取得するステップと、前記隣接逆深度値および前記隣接逆深度値に対応するマッチング結果に基づき、前記第k層の逆深度値内の各逆深度値に対して補間最適化を行い、前記最適化後の第k層の逆深度値を得るステップと、を実行するように構成される。
本開示の実施例は画像深度推定装置を提供し、現在フレームに対応する基準フレームおよび現在フレームの逆深度空間範囲を取得し、現在フレームおよび基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、現在フレームに対応するk(kは2以上の自然数)層の現在画像、および基準フレームに対応するk層の基準画像を得て、そしてk層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行い、現在フレームの逆深度推定結果を得る。つまり、本開示が提供する画像深度推定装置は、複数層の現在画像を複数層の基準画像と組み合わせて逆深度推定の反復処理を行うことで、層ずつに逆深度探索空間を減少させ、現在フレームの深度推定結果を特定し、かつ最終の深度推定結果が現在フレームの画素点の、カメラ座標系でのz軸座標値であり、座標変換を別途行う必要がなく、画像の深度推定結果をリアルタイムに得ることができ、かつ深度推定結果の正確度が高い。
本開示の実施例は電子機器をさらに提供し、図9は本開示の実施例が提供する電子機器の構成模式図である。図9に示すように、前記電子機器は、プロセッサ901、メモリ902および通信バス903を含み、そのうち、
前記通信バス903は、前記プロセッサ901と前記メモリ902の間の接続通信を実現するように構成され、
前記プロセッサ901は、前記メモリ902に記憶された画像深度推定プログラムを実行して、上記画像深度推定方法を実現するように構成される。
説明すべきこととして、本開示の実施例では、前記電子機器は携帯電話またはタブレット型コンピュータであるが、当然ながら、他のタイプの機器であってもよく、本開示の実施例はこれを限定しない点である。
本開示の実施例は、一つ以上のプロセッサにより実行して上記画像深度推定方法を実現可能な一つ以上のプログラムが記憶されている、コンピュータ可読記憶媒体をさらに提供する。コンピュータ可読記憶媒体は、例えばランダムアクセスメモリ(Random-Access Memory、RAM)のような揮発性メモリ(volatile memory)であってもよく、または、例えば読み取り専用メモリ(Read-Only Memory、ROM)、フラッシュメモリ(flash memory)、ハードディスクドライブ(Hard Disk Drive、HDD)もしくはソリッドステートディスク(Solid-State Drive、SSD)のような非揮発性メモリ(non-volatile memory)であってもよく、または、携帯電話、コンピュータ、タブレットデバイス、携帯情報端末など、上記メモリの一つまたは任意の組み合わせを含む様々な機器であってもよい。
本開示の実施例は、プロセッサにより実行される時に上記画像深度推定方法の対応するステップを実現するコンピュータ可読コードを含む、コンピュータプログラムをさらに提供する。
当業者であれば、本開示の実施例が方法、システムまたはコンピュータプログラム製品として提供されてもよいことを理解すべきである。したがって、本開示は、ハードウェア実施例、ソフトウェア実施例またはソフトウェアとハードウェアを組み合わせた実施例の形態を採用してもよい。また、本開示は、コンピュータ利用可能プログラムコードを含む一つ以上のコンピュータ利用可能記憶媒体(ディスクメモリや光学的メモリ等を含むが、それらに限定されない)で実施されるコンピュータプログラム製品の形態を採用してもよい。
本開示は本開示の実施例に係る方法、機器(システム)、およびコンピュータプログラム製品のフローチャートおよび/またはブロック図を参照して説明している。なお、フローチャートおよび/またはブロック図におけるそれぞれのフローおよび/またはブロック、ならびにフローチャートおよび/またはブロック図におけるフローおよび/またはブロックの組み合わせはコンピュータプログラム命令によって実現できることを理解すべきである。これらのコンピュータプログラム命令は、機械を製造するために、共通コンピュータ、専用コンピュータ、組み込みプロセッサまたは他のプログラマブル信号処理装置のプロセッサへ提供されてもよく、それにより、コンピュータまたは他のプログラマブル信号処理装置のプロセッサによって実行される命令は、フローチャートの一つ以上のフローおよび/またはブロック図の一つ以上のブロックにおいて指定された機能を実現する手段を創出する。
これらのコンピュータプログラム命令は、コンピュータまたは他のプログラマブル信号処理装置を特定の方式で動作させることができるコンピュータ可読メモリに記憶されてもよく、そのようにして、このコンピュータ可読メモリに記憶される命令は、フローチャートの一つ以上のフローおよび/またはブロック図の一つ以上のブロックに指定された機能を実現する命令装置を含む製造品を生成する。
これらのコンピュータプログラム命令はコンピュータまたは他のプログラマブル信号処理装置にロードすることにより、コンピュータ実行処理を生成するように、コンピュータまたは他のプログラマブル信号処理装置において一連の動作ステップを実行させるようにしてもよく、それにより、コンピュータまたは他のプログラマブルデータ信号装置において実行される命令はフローチャートの一つ以上のフローおよび/またはブロック図の一つ以上のブロックにおいて指定された機能を実現するためのステップを提供する。
以上は本開示の実施例の一部にすぎず、本開示の保護範囲を限定するものではない。論理に違反しない限り、本開示のそれぞれの実施例は相互に組み合わせることができ、異なる実施例において重点として説明されるものが異なって、重点として説明されていない部分については他の実施例の記載を参照すればよい。
本開示の実施例の技術的解決手段では、現在フレームに対応する基準フレームおよび現在フレームの逆深度空間範囲を取得し、現在フレームおよび基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、現在フレームに対応するk(kは2以上の自然数)層の現在画像、および基準フレームに対応するk層の基準画像を得て、そしてk層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行い、現在フレームの逆深度推定結果を得る。つまり、本開示が提供する技術的解決手段は、複数層の現在画像を複数層の基準画像と組み合わせて逆深度推定の反復処理を行い、それによって層ずつに逆深度探索空間を減少させ、現在フレームの逆深度推定結果を特定しており、該逆深度推定結果は現在フレームの画素点の、カメラ座標系でのz軸座標値の逆数であり、座標変換を別途行う必要がなく、かつ層ずつに逆深度探索空間を減少させることは逆深度推定の計算量の低減、および推定速度の向上に寄与し、その結果、画像の深度推定結果をリアルタイムに得ることができ、かつ深度推定結果の正確度が高い。
以上のことから、本開示の実施例の技術的解決手段では、現在フレームに対応する基準フレームおよび現在フレームの逆深度空間範囲を取得し、現在フレームおよび基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、現在フレームに対応するk(kは2以上の自然数)層の現在画像、および基準フレームに対応するk層の基準画像を得て、そしてk層の基準画像および逆深度空間範囲に基づき、k層の現在画像に対して逆深度推定の反復処理を行い、現在フレームの逆深度推定結果を得る。つまり、本開示が提供する技術的解決手段は、複数層の現在画像を、複数層の基準画像と組み合わせて逆深度推定の反復処理を行い、それによって層ずつに逆深度探索空間を減少させ、現在フレームの逆深度推定結果を特定しており、該逆深度推定結果は現在フレームの画素点の、カメラ座標系でのz軸座標値の逆数であり、座標変換を別途行う必要がなく、かつ層ずつに逆深度探索空間を減少させることは逆深度推定の計算量の低減、および推定速度の向上に寄与し、その結果、画像の深度推定結果をリアルタイムに得ることができ、かつ深度推定結果の正確度が高い。
例えば、本願は以下の項目を提供する。
(項目1)
現在フレームに対応する基準フレームおよび前記現在フレームの逆深度空間範囲を取得するステップと、
前記現在フレームおよび前記基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、前記現在フレームに対応するk層の現在画像、および前記基準フレームに対応するk層の基準画像を得るステップであって、kは2以上の自然数であるステップと、
前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得るステップと、を含む、画像深度推定方法。
(項目2)
現在フレームに対応する基準フレームを取得する前記ステップは、
少なくとも二つの選別対象フレームを取得するステップと、
前記少なくとも二つの選別対象フレームから、前記現在フレームと所定角度拘束条件を満たす少なくとも一つのフレームを、前記基準フレームとして選択するステップと、を含む、項目1に記載の画像深度推定方法。
(項目3)
前記所定角度拘束条件は、
前記現在フレームに対応する姿勢中心および前記基準フレームに対応する姿勢中心と、目標点との接続線により形成された夾角が、第一の所定角度範囲にあることであって、前記目標点は前記現在フレームに対応する平均深度点と前記基準フレームに対応する平均深度点との接続線の中点であることと、
前記現在フレームおよび前記基準フレームに対応する光軸夾角が、第二の所定角度範囲にあることと、
前記現在フレームおよび前記基準フレームに対応する縦軸夾角が、第三の所定角度範囲にあることと、を含む、項目2に記載の画像深度推定方法。
(項目4)
前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得る前記ステップは、
前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップであって、前記第i層のサンプリング点は前記k層の現在画像のうちの第i層の現在画像をサンプリングして得られた画素点であり、iは1以上、且つk以下の自然数であるステップと、
前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップと、
i=kになるまで、i=i+1にして、前記k層の現在画像内の、解像度が前記第i層の現在画像より高い第i+1層の現在画像に対して逆深度推定を継続して行い、第k層の逆深度値を得るステップと、
前記第k層の逆深度値を前記逆深度推定結果として特定するステップと、を含む、項目1から3のいずれか一項に記載の画像深度推定方法。
(項目5)
前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定する前記ステップは、
前記逆深度空間範囲に対して区間分割を行い、各分割区間から一つの逆深度値を選択し、複数の初期逆深度値を得るステップと、
前記複数の初期逆深度値を第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定するステップと、
iが1に等しくない場合、前記k層の現在画像から、第i-1層のサンプリング点、および第i-1層の逆深度値を取得するステップと、
前記第i-1層の逆深度値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップと、を含む、項目4に記載の画像深度推定方法。
(項目6)
前記第i-1層の逆深度値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定する前記ステップは、
前記第i-1層のサンプリング点から、第一サンプリング点との距離が最も近い第二サンプリング点、および前記第二サンプリング点と隣接する少なくとも二つの第三サンプリング点を特定するステップであって、前記第一サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、
前記第i-1層の逆深度値に基づき、前記少なくとも二つの第三サンプリング点の各々の逆深度値、および前記第二サンプリング点の逆深度値を取得し、少なくとも三つの逆深度値を得るステップと、
前記少なくとも三つの逆深度値から、最大逆深度値および最小逆深度値を特定するステップと、
前記複数の初期逆深度値から、前記最大逆深度値と前記最小逆深度値の範囲内にある逆深度値を選択し、選択された逆深度値を前記第一サンプリング点に対応する逆深度候補値として特定するステップと、
前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値が特定されるまで、前記第i層のサンプリング点内の前記第一サンプリング点ではないサンプリング点に対応する逆深度候補値を継続して特定するステップと、を含む、項目5に記載の画像深度推定方法。
(項目7)
前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得る前記ステップは、
前記第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、前記第i層のサンプリング点内の各サンプリング点を前記第i層の基準画像に投影し、前記第i層のサンプリング点内の各サンプリング点に対応する第i層の投影点を得るステップと、
前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップと、
前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得るステップと、を含む、項目4に記載の画像深度推定方法。
(項目8)
前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得る前記ステップは、
予め設定されたウィンドウにより、前記第i層の現在画像から、マッチング対象サンプリング点を中心とした第一画像ブロックを選択し、前記第i層の基準画像から、前記マッチング対象サンプリング点に対応する第i層の投影点内の各投影点をそれぞれ中心とした複数の第二画像ブロックを選択するステップであって、前記マッチング対象サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、
前記第一画像ブロックを前記複数の第二画像ブロック内の各画像ブロックとそれぞれ比較し、複数のマッチング結果を得て、前記複数のマッチング結果を前記マッチング対象サンプリング点に対応する第i層のマッチング結果として特定するステップと、
前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果が得られるまで、前記第i層のサンプリング点内の前記マッチング対象サンプリング点と異なるサンプリング点に対応する第i層のマッチング結果を継続して特定するステップと、を含む、項目7に記載の画像深度推定方法。
(項目9)
前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得る前記ステップは、
前記第i層のサンプリング点のうちのいずれか一つである目標サンプリング点に対応する第i層のマッチング結果から、目標マッチング結果を選択するステップと、
前記目標サンプリング点に対応する第i層の投影点内の、前記目標マッチング結果に対応する投影点を目標投影点として特定するステップと、
前記逆深度候補値の内、前記目標投影点に対応する逆深度値を前記目標サンプリング点の逆深度値として特定するステップと、
前記第i層のサンプリング点内の各サンプリング点の逆深度値が特定されるまで、前記第i層のサンプリング点内の、前記目標サンプリング点と異なるサンプリング点の逆深度値を継続して特定し、前記第i層の逆深度値を得るステップと、を含む、項目7に記載の画像深度推定方法。
(項目10)
第k層の逆深度値を得る前記ステップの後に、さらに、
前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップと、
前記最適化後の第k層の逆深度値を前記逆深度推定結果として特定するステップと、を含む、項目4から9のいずれか一項に記載の画像深度推定方法。
(項目11)
前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得る前記ステップは、
前記第k層の逆深度値内の各逆深度値に対して、それぞれ第k層のサンプリング点内の対応するサンプリング点の候補逆深度値から、前記逆深度値の隣接逆深度値を選択するステップであって、前記第k層のサンプリング点は前記k層の現在画像のうちの第k層の現在画像をサンプリングして得られた画素点であるステップと、
前記隣接逆深度値に対応するマッチング結果を取得するステップと、
前記隣接逆深度値および前記隣接逆深度値に対応するマッチング結果に基づき、前記第k層の逆深度値内の各逆深度値に対して補間最適化を行い、前記最適化後の第k層の逆深度値を得るステップと、を含む、項目10に記載の画像深度推定方法。
(項目12)
現在フレームに対応する基準フレームおよび前記現在フレームの逆深度空間範囲を取得するように構成された取得部と、
前記現在フレームおよび前記基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、前記現在フレームに対応するk層の現在画像、および前記基準フレームに対応するk層の基準画像を得るように構成されたダウンサンプリング部であって、kは2以上の自然数であるダウンサンプリング部と、
前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得るように構成された推定部と、を含む、画像深度推定装置。
(項目13)
前記取得部は、具体的に、少なくとも二つの選別対象フレームを取得するステップと、前記少なくとも二つの選別対象フレームから、前記現在フレームと所定角度拘束条件を満たす少なくとも一つのフレームを、前記基準フレームとして選択するステップと、を実行するように構成される、項目12に記載の画像深度推定装置。
(項目14)
前記所定角度拘束条件は、
前記現在フレームに対応する姿勢中心および前記基準フレームに対応する姿勢中心と、目標点との接続線により形成された夾角が、第一の所定角度範囲にあることであって、前記目標点は前記現在フレームに対応する平均深度点と前記基準フレームに対応する平均深度点との接続線の中点であることと、
前記現在フレームおよび前記基準フレームに対応する光軸夾角が、第二の所定角度範囲にあることと、
前記現在フレームおよび前記基準フレームに対応する縦軸夾角が、第三の所定角度範囲にあることと、を含む、項目13に記載の画像深度推定装置。
(項目15)
前記推定部は、具体的に、前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップであって、前記第i層のサンプリング点は前記k層の現在画像のうちの第i層の現在画像をサンプリングして得られた画素点であり、iは1以上、且つk以下の自然数であるステップと、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップと、i=kになるまで、i=i+1にして、前記k層の現在画像内の、解像度が前記第i層の現在画像より高い第i+1層の現在画像に対して逆深度推定を継続して行い、第k層の逆深度値を得るステップと、前記第k層の逆深度値を前記逆深度推定結果として特定するステップと、を実行するように構成される、項目12から14のいずれか一項に記載の画像深度推定装置。
(項目16)
前記推定部は、具体的に、前記逆深度空間範囲に対して区間分割を行い、各分割区間から一つの逆深度値を選択し、複数の初期逆深度値を得るステップと、前記複数の初期逆深度値を第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定するステップと、iが1に等しくない場合、前記k層の現在画像から、第i-1層のサンプリング点、および第i-1層の逆深度値を取得するステップと、前記第i-1層の逆深度値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップと、を実行するように構成される、項目15に記載の画像深度推定装置。
(項目17)
前記推定部は、具体的に、前記第i-1層のサンプリング点から、第一サンプリング点との距離が最も近い第二サンプリング点、および前記第二サンプリング点と隣接する少なくとも二つの第三サンプリング点を特定するステップであって、前記第一サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、前記第i-1層の逆深度値に基づき、前記少なくとも二つの第三サンプリング点の各々の逆深度値、および前記第二サンプリング点の逆深度値を取得し、少なくとも三つの逆深度値を得るステップと、前記少なくとも三つの逆深度値から、最大逆深度値および最小逆深度値を特定するステップと、前記複数の初期逆深度値から、前記最大逆深度値と前記最小逆深度値の範囲内にある逆深度値を選択し、選択された逆深度値を前記第一サンプリング点に対応する逆深度候補値として特定するステップと、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値が特定されるまで、前記第i層のサンプリング点内の前記第一サンプリング点ではないサンプリング点に対応する逆深度候補値を継続して特定するステップと、を実行するように構成される、項目16に記載の画像深度推定装置。
(項目18)
前記推定部は、具体的に、前記第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、前記第i層のサンプリング点内の各サンプリング点を前記第i層の基準画像に投影し、前記第i層のサンプリング点内の各サンプリング点に対応する第i層の投影点を得るステップと、前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップと、前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得るステップと、を実行するように構成される、項目15に記載の画像深度推定装置。
(項目19)
前記推定部は、具体的に、予め設定されたウィンドウにより、前記第i層の現在画像から、マッチング対象サンプリング点を中心とした第一画像ブロックを選択し、前記第i層の基準画像から、前記マッチング対象サンプリング点に対応する第i層の投影点内の各投影点をそれぞれ中心とした複数の第二画像ブロックを選択するステップであって、前記マッチング対象サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、前記第一画像ブロックを前記複数の第二画像ブロック内の各画像ブロックとそれぞれ比較し、複数のマッチング結果を得て、前記複数のマッチング結果を前記マッチング対象サンプリング点に対応する第i層のマッチング結果として特定するステップと、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果が得られるまで、前記第i層のサンプリング点内の前記マッチング対象サンプリング点と異なるサンプリング点に対応する第i層のマッチング結果を継続して特定するステップと、を実行するように構成される、項目18前記の画像深度推定方法。
(項目20)
前記推定部は、具体的に、前記第i層のサンプリング点のうちのいずれか一つである目標サンプリング点に対応する第i層のマッチング結果から、目標マッチング結果を選択するステップと、前記目標サンプリング点に対応する第i層の投影点内の、前記目標マッチング結果に対応する投影点を目標投影点として特定するステップと、前記逆深度候補値の内、前記目標投影点に対応する逆深度値を前記目標サンプリング点の逆深度値として特定するステップと、前記第i層のサンプリング点内の各サンプリング点の逆深度値が特定されるまで、前記第i層のサンプリング点内の、前記目標サンプリング点と異なるサンプリング点の逆深度値を継続して特定し、前記第i層の逆深度値を得るステップと、を実行するように構成される、項目18に記載の画像深度推定装置。
(項目21)
前記推定部はさらに、前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップと、前記最適化後の第k層の逆深度値を前記逆深度推定結果として特定するステップと、を実行するように構成される、項目15から20のいずれか一項に記載の画像深度推定装置。
(項目22)
前記推定部は、具体的に、前記第k層の逆深度値内の各逆深度値に対して、それぞれ第k層のサンプリング点内の対応するサンプリング点の候補逆深度値から、隣接逆深度値を選択するステップであって、前記第k層のサンプリング点は前記k層の現在画像のうちの第k層の現在画像をサンプリングして得られた画素点であるステップと、前記隣接逆深度値に対応するマッチング結果を取得するステップと、前記隣接逆深度値および前記隣接逆深度値に対応するマッチング結果に基づき、前記第k層の逆深度値内の各逆深度値に対して補間最適化を行い、前記最適化後の第k層の逆深度値を得るステップと、を実行するように構成される、項目21に記載の画像深度推定装置。
(項目23)
プロセッサ、メモリおよび通信バスを含む電子機器であって、
前記通信バスは、前記プロセッサと前記メモリとの間の接続通信を実現するように構成され、
前記プロセッサは、前記メモリに記憶される画像深度推定プログラムを実行して、項目1から11のいずれか一項に記載の画像深度推定方法を実現するように構成される、電子機器。
(項目24)
携帯電話またはタブレット型コンピュータである、項目23に記載の電子機器。
(項目25)
一つ以上のプロセッサにより実行されて項目1から11のいずれか一項に記載の画像深度推定方法を実現可能な一つ以上のプログラムが記憶されている、コンピュータ可読記憶媒体。
(項目26)
プロセッサにより実行される時に項目1から11のいずれか一項に記載の画像深度推定方法の対応するステップを実現するコンピュータ可読コードを含む、コンピュータプログラム。

Claims (26)

  1. 現在フレームに対応する基準フレームおよび前記現在フレームの逆深度空間範囲を取得するステップと、
    前記現在フレームおよび前記基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、前記現在フレームに対応するk層の現在画像、および前記基準フレームに対応するk層の基準画像を得るステップであって、kは2以上の自然数であるステップと、
    前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得るステップと、を含む、画像深度推定方法。
  2. 現在フレームに対応する基準フレームを取得する前記ステップは、
    少なくとも二つの選別対象フレームを取得するステップと、
    前記少なくとも二つの選別対象フレームから、前記現在フレームと所定角度拘束条件を満たす少なくとも一つのフレームを、前記基準フレームとして選択するステップと、を含む、請求項1に記載の画像深度推定方法。
  3. 前記所定角度拘束条件は、
    前記現在フレームに対応する姿勢中心および前記基準フレームに対応する姿勢中心と、目標点との接続線により形成された夾角が、第一の所定角度範囲にあることであって、前記目標点は前記現在フレームに対応する平均深度点と前記基準フレームに対応する平均深度点との接続線の中点であることと、
    前記現在フレームおよび前記基準フレームに対応する光軸夾角が、第二の所定角度範囲にあることと、
    前記現在フレームおよび前記基準フレームに対応する縦軸夾角が、第三の所定角度範囲にあることと、を含む、請求項2に記載の画像深度推定方法。
  4. 前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得る前記ステップは、
    前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップであって、前記第i層のサンプリング点は前記k層の現在画像のうちの第i層の現在画像をサンプリングして得られた画素点であり、iは1以上、且つk以下の自然数であるステップと、
    前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップと、
    i=kになるまで、i=i+1にして、前記k層の現在画像内の、解像度が前記第i層の現在画像より高い第i+1層の現在画像に対して逆深度推定を継続して行い、第k層の逆深度値を得るステップと、
    前記第k層の逆深度値を前記逆深度推定結果として特定するステップと、を含む、請求項1から3のいずれか一項に記載の画像深度推定方法。
  5. 前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定する前記ステップは、
    前記逆深度空間範囲に対して区間分割を行い、各分割区間から一つの逆深度値を選択し、複数の初期逆深度値を得るステップと、
    前記複数の初期逆深度値を第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定するステップと、
    iが1に等しくない場合、前記k層の現在画像から、第i-1層のサンプリング点、および第i-1層の逆深度値を取得するステップと、
    前記第i-1層の逆深度値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップと、を含む、請求項4に記載の画像深度推定方法。
  6. 前記第i-1層の逆深度値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定する前記ステップは、
    前記第i-1層のサンプリング点から、第一サンプリング点との距離が最も近い第二サンプリング点、および前記第二サンプリング点と隣接する少なくとも二つの第三サンプリング点を特定するステップであって、前記第一サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、
    前記第i-1層の逆深度値に基づき、前記少なくとも二つの第三サンプリング点の各々の逆深度値、および前記第二サンプリング点の逆深度値を取得し、少なくとも三つの逆深度値を得るステップと、
    前記少なくとも三つの逆深度値から、最大逆深度値および最小逆深度値を特定するステップと、
    前記複数の初期逆深度値から、前記最大逆深度値と前記最小逆深度値の範囲内にある逆深度値を選択し、選択された逆深度値を前記第一サンプリング点に対応する逆深度候補値として特定するステップと、
    前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値が特定されるまで、前記第i層のサンプリング点内の前記第一サンプリング点ではないサンプリング点に対応する逆深度候補値を継続して特定するステップと、を含む、請求項5に記載の画像深度推定方法。
  7. 前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得る前記ステップは、
    前記第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、前記第i層のサンプリング点内の各サンプリング点を前記第i層の基準画像に投影し、前記第i層のサンプリング点内の各サンプリング点に対応する第i層の投影点を得るステップと、
    前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップと、
    前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得るステップと、を含む、請求項4に記載の画像深度推定方法。
  8. 前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得る前記ステップは、
    予め設定されたウィンドウにより、前記第i層の現在画像から、マッチング対象サンプリング点を中心とした第一画像ブロックを選択し、前記第i層の基準画像から、前記マッチング対象サンプリング点に対応する第i層の投影点内の各投影点をそれぞれ中心とした複数の第二画像ブロックを選択するステップであって、前記マッチング対象サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、
    前記第一画像ブロックを前記複数の第二画像ブロック内の各画像ブロックとそれぞれ比較し、複数のマッチング結果を得て、前記複数のマッチング結果を前記マッチング対象サンプリング点に対応する第i層のマッチング結果として特定するステップと、
    前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果が得られるまで、前記第i層のサンプリング点内の前記マッチング対象サンプリング点と異なるサンプリング点に対応する第i層のマッチング結果を継続して特定するステップと、を含む、請求項7に記載の画像深度推定方法。
  9. 前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得る前記ステップは、
    前記第i層のサンプリング点のうちのいずれか一つである目標サンプリング点に対応する第i層のマッチング結果から、目標マッチング結果を選択するステップと、
    前記目標サンプリング点に対応する第i層の投影点内の、前記目標マッチング結果に対応する投影点を目標投影点として特定するステップと、
    前記逆深度候補値の内、前記目標投影点に対応する逆深度値を前記目標サンプリング点の逆深度値として特定するステップと、
    前記第i層のサンプリング点内の各サンプリング点の逆深度値が特定されるまで、前記第i層のサンプリング点内の、前記目標サンプリング点と異なるサンプリング点の逆深度値を継続して特定し、前記第i層の逆深度値を得るステップと、を含む、請求項7に記載の画像深度推定方法。
  10. 第k層の逆深度値を得る前記ステップの後に、さらに、
    前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップと、
    前記最適化後の第k層の逆深度値を前記逆深度推定結果として特定するステップと、を含む、請求項4から9のいずれか一項に記載の画像深度推定方法。
  11. 前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得る前記ステップは、
    前記第k層の逆深度値内の各逆深度値に対して、それぞれ第k層のサンプリング点内の対応するサンプリング点の候補逆深度値から、前記逆深度値の隣接逆深度値を選択するステップであって、前記第k層のサンプリング点は前記k層の現在画像のうちの第k層の現在画像をサンプリングして得られた画素点であるステップと、
    前記隣接逆深度値に対応するマッチング結果を取得するステップと、
    前記隣接逆深度値および前記隣接逆深度値に対応するマッチング結果に基づき、前記第k層の逆深度値内の各逆深度値に対して補間最適化を行い、前記最適化後の第k層の逆深度値を得るステップと、を含む、請求項10に記載の画像深度推定方法。
  12. 現在フレームに対応する基準フレームおよび前記現在フレームの逆深度空間範囲を取得するように構成された取得部と、
    前記現在フレームおよび前記基準フレームに対してそれぞれピラミッドダウンサンプリング処理を行い、前記現在フレームに対応するk層の現在画像、および前記基準フレームに対応するk層の基準画像を得るように構成されたダウンサンプリング部であって、kは2以上の自然数であるダウンサンプリング部と、
    前記k層の基準画像および前記逆深度空間範囲に基づき、前記k層の現在画像に対して逆深度推定の反復処理を行い、前記現在フレームの逆深度推定結果を得るように構成された推定部と、を含む、画像深度推定装置。
  13. 前記取得部は、具体的に、少なくとも二つの選別対象フレームを取得するステップと、前記少なくとも二つの選別対象フレームから、前記現在フレームと所定角度拘束条件を満たす少なくとも一つのフレームを、前記基準フレームとして選択するステップと、を実行するように構成される、請求項12に記載の画像深度推定装置。
  14. 前記所定角度拘束条件は、
    前記現在フレームに対応する姿勢中心および前記基準フレームに対応する姿勢中心と、目標点との接続線により形成された夾角が、第一の所定角度範囲にあることであって、前記目標点は前記現在フレームに対応する平均深度点と前記基準フレームに対応する平均深度点との接続線の中点であることと、
    前記現在フレームおよび前記基準フレームに対応する光軸夾角が、第二の所定角度範囲にあることと、
    前記現在フレームおよび前記基準フレームに対応する縦軸夾角が、第三の所定角度範囲にあることと、を含む、請求項13に記載の画像深度推定装置。
  15. 前記推定部は、具体的に、前記k層の現在画像および前記逆深度空間範囲に基づき、第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップであって、前記第i層のサンプリング点は前記k層の現在画像のうちの第i層の現在画像をサンプリングして得られた画素点であり、iは1以上、且つk以下の自然数であるステップと、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値および前記k層の基準画像のうちの第i層の基準画像に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、第i層の逆深度値を得るステップと、i=kになるまで、i=i+1にして、前記k層の現在画像内の、解像度が前記第i層の現在画像より高い第i+1層の現在画像に対して逆深度推定を継続して行い、第k層の逆深度値を得るステップと、前記第k層の逆深度値を前記逆深度推定結果として特定するステップと、を実行するように構成される、請求項12から14のいずれか一項に記載の画像深度推定装置。
  16. 前記推定部は、具体的に、前記逆深度空間範囲に対して区間分割を行い、各分割区間から一つの逆深度値を選択し、複数の初期逆深度値を得るステップと、前記複数の初期逆深度値を第1層のサンプリング点内の各サンプリング点に対応する逆深度候補値として特定するステップと、iが1に等しくない場合、前記k層の現在画像から、第i-1層のサンプリング点、および第i-1層の逆深度値を取得するステップと、前記第i-1層の逆深度値、第i-1層のサンプリング点、および前記複数の初期逆深度値に基づき、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値を特定するステップと、を実行するように構成される、請求項15に記載の画像深度推定装置。
  17. 前記推定部は、具体的に、前記第i-1層のサンプリング点から、第一サンプリング点との距離が最も近い第二サンプリング点、および前記第二サンプリング点と隣接する少なくとも二つの第三サンプリング点を特定するステップであって、前記第一サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、前記第i-1層の逆深度値に基づき、前記少なくとも二つの第三サンプリング点の各々の逆深度値、および前記第二サンプリング点の逆深度値を取得し、少なくとも三つの逆深度値を得るステップと、前記少なくとも三つの逆深度値から、最大逆深度値および最小逆深度値を特定するステップと、前記複数の初期逆深度値から、前記最大逆深度値と前記最小逆深度値の範囲内にある逆深度値を選択し、選択された逆深度値を前記第一サンプリング点に対応する逆深度候補値として特定するステップと、前記第i層のサンプリング点内の各サンプリング点に対応する逆深度候補値が特定されるまで、前記第i層のサンプリング点内の前記第一サンプリング点ではないサンプリング点に対応する逆深度候補値を継続して特定するステップと、を実行するように構成される、請求項16に記載の画像深度推定装置。
  18. 前記推定部は、具体的に、前記第i層のサンプリング点内の各サンプリング点に対して、それぞれ対応する逆深度候補値内の各逆深度値に従って、前記第i層のサンプリング点内の各サンプリング点を前記第i層の基準画像に投影し、前記第i層のサンプリング点内の各サンプリング点に対応する第i層の投影点を得るステップと、前記第i層のサンプリング点および前記第i層の投影点に基づいてブロックマッチングを行い、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果を得るステップと、前記第i層のマッチング結果に基づき、前記第i層のサンプリング点内の各サンプリング点の逆深度値を特定し、前記第i層の逆深度値を得るステップと、を実行するように構成される、請求項15に記載の画像深度推定装置。
  19. 前記推定部は、具体的に、予め設定されたウィンドウにより、前記第i層の現在画像から、マッチング対象サンプリング点を中心とした第一画像ブロックを選択し、前記第i層の基準画像から、前記マッチング対象サンプリング点に対応する第i層の投影点内の各投影点をそれぞれ中心とした複数の第二画像ブロックを選択するステップであって、前記マッチング対象サンプリング点は前記第i層のサンプリング点のうちのいずれか一つであるステップと、前記第一画像ブロックを前記複数の第二画像ブロック内の各画像ブロックとそれぞれ比較し、複数のマッチング結果を得て、前記複数のマッチング結果を前記マッチング対象サンプリング点に対応する第i層のマッチング結果として特定するステップと、前記第i層のサンプリング点内の各サンプリング点に対応する第i層のマッチング結果が得られるまで、前記第i層のサンプリング点内の前記マッチング対象サンプリング点と異なるサンプリング点に対応する第i層のマッチング結果を継続して特定するステップと、を実行するように構成される、請求項18前記の画像深度推定方法。
  20. 前記推定部は、具体的に、前記第i層のサンプリング点のうちのいずれか一つである目標サンプリング点に対応する第i層のマッチング結果から、目標マッチング結果を選択するステップと、前記目標サンプリング点に対応する第i層の投影点内の、前記目標マッチング結果に対応する投影点を目標投影点として特定するステップと、前記逆深度候補値の内、前記目標投影点に対応する逆深度値を前記目標サンプリング点の逆深度値として特定するステップと、前記第i層のサンプリング点内の各サンプリング点の逆深度値が特定されるまで、前記第i層のサンプリング点内の、前記目標サンプリング点と異なるサンプリング点の逆深度値を継続して特定し、前記第i層の逆深度値を得るステップと、を実行するように構成される、請求項18に記載の画像深度推定装置。
  21. 前記推定部はさらに、前記第k層の逆深度値に対して補間最適化を行い、最適化後の第k層の逆深度値を得るステップと、前記最適化後の第k層の逆深度値を前記逆深度推定結果として特定するステップと、を実行するように構成される、請求項15から20のいずれか一項に記載の画像深度推定装置。
  22. 前記推定部は、具体的に、前記第k層の逆深度値内の各逆深度値に対して、それぞれ第k層のサンプリング点内の対応するサンプリング点の候補逆深度値から、隣接逆深度値を選択するステップであって、前記第k層のサンプリング点は前記k層の現在画像のうちの第k層の現在画像をサンプリングして得られた画素点であるステップと、前記隣接逆深度値に対応するマッチング結果を取得するステップと、前記隣接逆深度値および前記隣接逆深度値に対応するマッチング結果に基づき、前記第k層の逆深度値内の各逆深度値に対して補間最適化を行い、前記最適化後の第k層の逆深度値を得るステップと、を実行するように構成される、請求項21に記載の画像深度推定装置。
  23. プロセッサ、メモリおよび通信バスを含む電子機器であって、
    前記通信バスは、前記プロセッサと前記メモリとの間の接続通信を実現するように構成され、
    前記プロセッサは、前記メモリに記憶される画像深度推定プログラムを実行して、請求項1から11のいずれか一項に記載の画像深度推定方法を実現するように構成される、電子機器。
  24. 携帯電話またはタブレット型コンピュータである、請求項23に記載の電子機器。
  25. 一つ以上のプロセッサにより実行されて請求項1から11のいずれか一項に記載の画像深度推定方法を実現可能な一つ以上のプログラムが記憶されている、コンピュータ可読記憶媒体。
  26. プロセッサにより実行される時に請求項1から11のいずれか一項に記載の画像深度推定方法の対応するステップを実現するコンピュータ可読コードを含む、コンピュータプログラム。
JP2021537988A 2019-07-10 2019-08-21 画像深度推定方法および装置、電子機器、ならびに記憶媒体 Active JP7116262B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910621318.4 2019-07-10
CN201910621318.4A CN112215880B (zh) 2019-07-10 2019-07-10 一种图像深度估计方法及装置、电子设备、存储介质
PCT/CN2019/101778 WO2021003807A1 (zh) 2019-07-10 2019-08-21 一种图像深度估计方法及装置、电子设备、存储介质

Publications (2)

Publication Number Publication Date
JP2022515517A true JP2022515517A (ja) 2022-02-18
JP7116262B2 JP7116262B2 (ja) 2022-08-09

Family

ID=74047542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021537988A Active JP7116262B2 (ja) 2019-07-10 2019-08-21 画像深度推定方法および装置、電子機器、ならびに記憶媒体

Country Status (7)

Country Link
US (1) US20210350559A1 (ja)
JP (1) JP7116262B2 (ja)
KR (1) KR20210089737A (ja)
CN (1) CN112215880B (ja)
SG (1) SG11202108201RA (ja)
TW (1) TWI738196B (ja)
WO (1) WO2021003807A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2603947A (en) * 2021-02-22 2022-08-24 Nokia Technologies Oy Method and apparatus for depth estimation relative to a mobile terminal
US11688090B2 (en) 2021-03-16 2023-06-27 Toyota Research Institute, Inc. Shared median-scaling metric for multi-camera self-supervised depth evaluation
CN113313742A (zh) * 2021-05-06 2021-08-27 Oppo广东移动通信有限公司 图像深度估计方法、装置、电子设备及计算机存储介质
TWI817594B (zh) * 2022-07-04 2023-10-01 鴻海精密工業股份有限公司 圖像深度識別方法、電腦設備及儲存介質
CN116129036B (zh) * 2022-12-02 2023-08-29 中国传媒大学 一种深度信息引导的全方向图像三维结构自动恢复方法
CN117880630B (zh) * 2024-03-13 2024-06-07 杭州星犀科技有限公司 对焦深度获取方法、对焦深度获取系统及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6487304B1 (en) * 1999-06-16 2002-11-26 Microsoft Corporation Multi-view approach to motion and stereo
CN105007495A (zh) * 2015-08-20 2015-10-28 上海玮舟微电子科技有限公司 一种基于多层3drs的差异估计方法及装置
CN108520554A (zh) * 2018-04-12 2018-09-11 无锡信捷电气股份有限公司 一种基于orb-slam2的双目三维稠密建图方法
CN108648274A (zh) * 2018-05-10 2018-10-12 华南理工大学 一种视觉slam的认知点云地图创建系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7889905B2 (en) * 2005-05-23 2011-02-15 The Penn State Research Foundation Fast 3D-2D image registration method with application to continuously guided endoscopy
GB2506338A (en) * 2012-07-30 2014-04-02 Sony Comp Entertainment Europe A method of localisation and mapping
US9576183B2 (en) * 2012-11-02 2017-02-21 Qualcomm Incorporated Fast initialization for monocular visual SLAM
WO2014165244A1 (en) * 2013-03-13 2014-10-09 Pelican Imaging Corporation Systems and methods for synthesizing images from image data captured by an array camera using restricted depth of field depth maps in which depth estimation precision varies
KR102546996B1 (ko) * 2016-08-19 2023-06-26 모비디어스 리미티드 희소 볼륨 데이터를 사용한 연산들
TWI756365B (zh) * 2017-02-15 2022-03-01 美商脫其泰有限責任公司 圖像分析系統及相關方法
CN108010081B (zh) * 2017-12-01 2021-12-17 中山大学 一种基于Census变换和局部图优化的RGB-D视觉里程计方法
CN109993113B (zh) * 2019-03-29 2023-05-02 东北大学 一种基于rgb-d和imu信息融合的位姿估计方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6487304B1 (en) * 1999-06-16 2002-11-26 Microsoft Corporation Multi-view approach to motion and stereo
CN105007495A (zh) * 2015-08-20 2015-10-28 上海玮舟微电子科技有限公司 一种基于多层3drs的差异估计方法及装置
CN108520554A (zh) * 2018-04-12 2018-09-11 无锡信捷电气股份有限公司 一种基于orb-slam2的双目三维稠密建图方法
CN108648274A (zh) * 2018-05-10 2018-10-12 华南理工大学 一种视觉slam的认知点云地图创建系统

Also Published As

Publication number Publication date
JP7116262B2 (ja) 2022-08-09
CN112215880B (zh) 2022-05-06
KR20210089737A (ko) 2021-07-16
CN112215880A (zh) 2021-01-12
TWI738196B (zh) 2021-09-01
WO2021003807A1 (zh) 2021-01-14
TW202103106A (zh) 2021-01-16
US20210350559A1 (en) 2021-11-11
SG11202108201RA (en) 2021-09-29

Similar Documents

Publication Publication Date Title
JP2022515517A (ja) 画像深度推定方法および装置、電子機器、ならびに記憶媒体
US10368062B2 (en) Panoramic camera systems
CN107566688B (zh) 一种基于卷积神经网络的视频防抖方法、装置及图像对齐装置
CN107689035B (zh) 一种基于卷积神经网络的单应性矩阵确定方法及装置
US9338437B2 (en) Apparatus and method for reconstructing high density three-dimensional image
CN111598993A (zh) 基于多视角成像技术的三维数据重建方法、装置
CN113689578B (zh) 一种人体数据集生成方法及装置
CN107564063B (zh) 一种基于卷积神经网络的虚拟物显示方法及装置
CN111080776B (zh) 人体动作三维数据采集和复现的处理方法及系统
US20200349754A1 (en) Methods, devices and computer program products for generating 3d models
CN109495733B (zh) 三维影像重建方法、装置及其非暂态电脑可读取储存媒体
WO2021035627A1 (zh) 获取深度图的方法、装置及计算机存储介质
US10154241B2 (en) Depth map based perspective correction in digital photos
CN114332125A (zh) 点云重建方法、装置、电子设备和存储介质
JP5178538B2 (ja) 深度マップを画像から決定する方法、深度マップを決定する装置
CN115564639A (zh) 背景虚化方法、装置、计算机设备和存储介质
JP2009530701A5 (ja)
JP2009186287A (ja) 平面パラメータ推定装置、平面パラメータ推定方法及び平面パラメータ推定プログラム
KR102310789B1 (ko) 다양한 시점에서 연속적으로 획득된 영상을 활용한 카메라 자세 및 깊이 추정 장치 및 방법
US20120038785A1 (en) Method for producing high resolution image
CN110176035A (zh) 标志点的定位方法、装置、计算机设备和存储介质
CN115086625A (zh) 投影画面的校正方法、装置、系统、校正设备和投影设备
CN117456124B (zh) 一种基于背靠背双目鱼眼相机的稠密slam的方法
KR102492163B1 (ko) 가변적 다층 깊이 영상을 이용한 라이트필드 합성 방법 및 장치
US9531943B2 (en) Block-based digital refocusing system and method thereof

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210628

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220728

R150 Certificate of patent or registration of utility model

Ref document number: 7116262

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150