JP2023529787A

JP2023529787A - ３ｄジオメトリを構築するための方法、装置及びプログラム

Info

Publication number: JP2023529787A
Application number: JP2022565905A
Authority: JP
Inventors: シャン・ジャン; ビン・ジアン; ル・ヘ; ハイチャオ・ジュ; シャン・リュウ; ケリン・リュウ; ウェイウェイ・フェン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2021-05-07
Filing date: 2021-10-18
Publication date: 2023-07-12
Anticipated expiration: 2041-10-18
Also published as: EP4107661A4; CN115516517A; US20220358716A1; US11670045B2; KR20220161445A; JP7518196B2; WO2022235291A1; EP4107661A1

Abstract

本開示の態様は、部屋のパノラマ画像から部屋の三次元（３Ｄ）ジオメトリを生成するための方法、装置、および非一時コンピュータ可読記憶媒体装置を含む。装置は、ユーザ入力に基づいて、パノラマ画像における部屋の壁のコーナポイントの二次元（２Ｄ）位置を決定する処理回路を含む。各壁のコーナポイントは、部屋の床面または天井面のいずれか一方である。処理回路は、壁のコーナポイントの２Ｄ位置、パノラマ画像のサイズ、および床面と部屋のパノラマ画像の捕捉デバイスの捕捉位置との間の距離に基づいて壁のコーナポイントの３Ｄ位置を算出し、壁のコーナポイントの順序に基づいて部屋のレイアウトを決定し、部屋のレイアウトと壁のコーナポイントの３Ｄ位置とに基づいて３Ｄジオメトリを生成する。

Description

関連出願の相互参照
本出願は、２０２１年１０月１５日に出願された米国特許出願第１７／５０２，９７３号「ＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＣＯＮＳＴＲＵＣＴＩＮＧＡ３ＤＧＥＯＭＥＴＲＹ」に対する優先権の利益を主張し、２０２１年５月７日に出願された米国仮出願第６３／１８５，９４６号「ＭＥＴＨＯＤＳＯＦＣＯＮＳＴＲＵＣＴＩＮＧ３ＤＧＥＯＭＥＴＲＹＦＲＯＭＰＡＮＯＲＡＭＡＩＭＡＧＥＳＷＩＴＨＭＡＲＫＥＤＣＯＲＮＥＲＳＦＯＲＩＮＤＯＯＲＳＣＥＮＥＳ」に対する優先権の利益を主張するものである。先行する出願の開示が完全な状態で本出願で参照により援用される。

本開示は、一般的に、様々な仮想現実および／または拡張現実アプリケーション用途を含む三次元空間の再構築に関連する実施形態を説明する。

本明細書において提供される背景技術の説明は、本開示の文脈をおおまかに提示することを目的としている。本明細書に記載された発明者の業績は、その業績がこの背景技術セクションに記載されている限りにおいて、さもなければ出願時に従来技術として適格ではない可能性がある説明の態様は、本開示に対する従来技術として、明示的にも黙示的にも認められない。

屋内建物の三次元（３Ｄ）再構築は、活発な研究テーマであり、不動産、建物構築、建物修復、エンターテイメントなどを含む様々な産業で使用されている。３Ｄ再構築は、単一の画像（例えば、ＲＧＢ画像）または異なるビューからの画像グループを入力として取り込み、シーン内の建物の３Ｄジオメトリ表現を生成することによって、コンピュータビジョンや機械学習などの技術を活用することができる。深度センサの進歩により、シーンから直接深度情報を測定する、より簡単で正確な手段が使用可能になった。例えば、広く使用されている深度カメラとしては、Ｌｉｄａｒ、立体照明などが挙げられる。

本開示の態様は、部屋のパノラマ画像から部屋の三次元（３Ｄ）ジオメトリを生成するための装置を提供する。装置は、ユーザ入力に基づいて、部屋のパノラマ画像における部屋の壁のコーナポイントの二次元（２Ｄ）位置を決定する処理回路を含む。壁のコーナポイントのそれぞれは、部屋の床面または天井面のいずれか一方である。処理回路は、壁のコーナポイントの２Ｄ位置、パノラマ画像のサイズ、および部屋の床面と部屋のパノラマ画像を捕捉するように構成されたデバイスの捕捉位置との間の距離に基づいて壁のコーナポイントの３Ｄ位置を算出する。処理回路は、壁のコーナポイントの順序に基づいて部屋のレイアウトを決定する。処理回路は、部屋のレイアウトと壁のコーナポイントの３Ｄ位置とに基づいて部屋の３Ｄジオメトリを生成する。

一実施形態において、ユーザ入力は、部屋の壁のコーナポイントおよび壁のコーナポイントの順序をユーザが選択することを含む。

一実施形態において、壁のコーナポイントの少なくとも１つは、第１のタイプの壁のコーナポイントである。第１のタイプの壁のコーナポイントは、３Ｄジオメトリの壁面を示す。

一実施形態において、壁のコーナポイントのうちの少なくとも１つは、第２タイプの壁のコーナポイントである。第２のタイプの壁のコーナポイントは、３Ｄジオメトリのオープンエリア平面を示す。

一実施形態において、処理回路は、２つの近接する壁のコーナポイントのうちの所定の１つのタイプに基づいて、３Ｄジオメトリの平面を生成する。

一実施形態において、処理回路は、３Ｄジオメトリの平面内の各３Ｄ位置に対して、それぞれの３Ｄ位置に対応する部屋のパノラマ画像内の２Ｄ位置における色情報に基づいて、それぞれの３Ｄ位置の色情報を決定する。

一実施形態において、３Ｄジオメトリの各壁面は、３Ｄジオメトリの少なくとも１つの他の壁面に対して平行または垂直であり、処理回路は、ユーザが壁のコーナポイントのうちの１つを選択することを支援するガイドラインを生成する。

一実施形態において、３Ｄジオメトリの各壁面は、３Ｄジオメトリの少なくとも１つの他の壁面に対して平行または垂直であり、処理回路は、ユーザによって選択された壁のコーナポイントのうちの１つを調整する。

一実施形態において、処理回路は、部屋のパノラマ画像における２つのポイントの２Ｄ位置を決定する。処理回路は、２つのポイントの２Ｄ位置、パノラマ画像のサイズ、および部屋の床面とデバイスの捕捉位置との間の距離に基づいて、２つのポイントの３Ｄ位置を算出する。処理回路は、２つのポイントの３Ｄ位置の間の距離を算出する。

本開示の態様は、部屋のパノラマ画像から部屋の３Ｄジオメトリを生成するための方法を提供する。方法は、部屋のパノラマ画像から部屋の３Ｄジオメトリを生成するための装置によって実行される処理のいずれか、またはその組合せを実行できる。方法では、部屋のパノラマ画像における部屋の壁のコーナポイントの２Ｄ位置が、ユーザ入力に基づいて決定される。壁のコーナポイントのそれぞれは、部屋の床面または天井面のいずれか一方である。壁のコーナポイントの３Ｄ位置は、壁のコーナポイントの２Ｄ位置、パノラマ画像のサイズ、および部屋の床面と部屋のパノラマ画像を捕捉するように構成されたデバイスの捕捉位置との間の距離に基づいて算出される。部屋のレイアウトは、壁のコーナポイントの順序に基づいて生成される。部屋の３Ｄジオメトリは、部屋のレイアウトと壁のコーナポイントの３Ｄ位置とに基づいて生成される。

本開示の態様は、少なくとも１つのプロセッサによって実行されると、少なくとも１つのプロセッサに、部屋のパノラマ画像から部屋の三次元（３Ｄ）ジオメトリを生成するための方法のいずれか、またはその組合せを実行させる命令を格納する非一時コンピュータ可読記メディアを提供する。

以下の詳細な説明と添付の図面とから、開示されている保護対象のさらなる特徴、性質および様々な利点がより明らかになる。

本開示の一実施形態による部屋の例示的なパノラマ画像を示す図である。本開示の一実施形態による部屋の例示的な３Ｄジオメトリを示す図である。本開示の一実施形態による、別の部屋のパノラマ画像におけるホワイトボードの高さを測定する例を示す図である。本開示の一実施形態による、他の部屋のパノラマ画像における遮られたポイントを決定する例を示す図である。本開示のいくつかの実施形態による、クロージャポイントおよび制御ポイントによって定義される部屋のレイアウトの様々な例を示す図である。本開示のいくつかの実施形態による、クロージャポイントおよび制御ポイントによって定義される部屋のレイアウトの様々な例を示す図である。本開示のいくつかの実施形態による、クロージャポイントおよび制御ポイントによって定義される部屋のレイアウトの様々な例を示す図である。本開示のいくつかの実施形態による、クロージャポイントおよび制御ポイントによって定義される部屋のレイアウトの様々な例を示す図である。本開示の一実施形態によるマーキング処理で使用される例示的なガイドラインを示す図である。本開示の一実施形態による例示的なフローチャート図である。本開示の一実施形態によるコンピュータシステムの概略図である。

Ｉ．三次元ジオメトリ構築
本開示は、部屋などの三次元（３Ｄ）空間の再構築に関する。部屋は、例えば、建物内であり得る。さらに、３Ｄ再構築は、仮想ツアー、デジタル博物館、仮想住宅販売などの様々な仮想現実（ＶＲ）および／または拡張現実（ＡＲ）アプリケーションで使用することができる。本開示では、屋内シーンのためのハンドメイドのコーナを有するパノラマ画像から部屋の３Ｄジオメトリを構築する方法を例として記述する。しかし、この方法は他の３Ｄ空間にも適用できることを理解されたい。

オブジェクトの３Ｄジオメトリ表現は、通常、ポイントクラウドの形態であり、これは、空間内の３Ｄポイントのセットを含む。各３Ｄポイントは、３Ｄ位置情報と、色情報や反射率情報などの追加属性とを含むことができる。別の一般的な３Ｄフォーマットはテクスチャメッシュであり、これには、３Ｄポイント情報に加えて、隣接するポイント間の接続情報が含まれる。接続情報に基づいて、テクスチャメッシュのファセット（例えば、三角形）の集合を形成できる。テクスチャメッシュのテクスチャ情報も、各ファセットに添付できる。

いくつかの屋内シーンアプリケーションでは、いくつかの事前知識を利用することによって、いくつかの学習ベースの方法（例えば、ＬａｙｏｕｔＮｅｔアルゴリズム、ＨｏｒｉｚｏｎＮｅｔアルゴリズム、およびＤｕｌａ－Ｎｅｔアルゴリズム）を使用して、部屋の単一のパノラマ画像からレイアウト境界およびコーナ位置などの部屋のいくつかのレイアウト要素を予測できる。しかし、これらのアルゴリズムは、典型的にデータ駆動型であり、高品質の訓練データを必要とする。アルゴリズムは、実世界のシーンの複雑さのために、実際のシナリオにおいて失敗する可能性がある。

本開示は、パノラマ画像内の部屋の、手でマークされた（例えば、ユーザによって手動でマークされた）、壁のコーナを有する部屋の単一のパノラマ画像から、部屋の３Ｄジオメトリを再構築する方法を含む。これらの方法は、半自動パイプラインで適用できることに留意されたい。例えば、自動アルゴリズム（例えば、ＬａｙｏｕｔＮｅｔアルゴリズム、ＨｏｒｉｚｏｎＮｅｔアルゴリズム、またはＤｕｌａ－Ｎｅｔアルゴリズム）を最初に使用して、レイアウトコーナのおおまかな推定を生成し、次に、本開示の方法を使用してレイアウトコーナを精緻化させることができる。別の例では、レイアウトコーナは、本開示の方法を使用して手でマークしてもよく、次に、自動精緻化アルゴリズムを、手でマークされたコーナに適用してもよい。

図１Ａは、本開示の一実施形態による部屋の例示的なパノラマ画像を示す。パノラマ画像において、ユーザは、部屋の１つまたは複数の壁のコーナに手動でマークを付けることができる。マークされた壁のコーナに基づいて、図１Ｂに示されるような、部屋の３Ｄジオメトリを生成できる。部屋の３Ｄジオメトリは、ポイントクラウドまたはテクスチャメッシュの形態で表現できる。

本開示の方法において、部屋のパノラマ画像（Ｉ）を入力として使用できる。パノラマ画像（Ｉ）のサイズは画素で、Ｗ×Ｈであり、ここでＷ＝２Ｈと仮定する。また、カメラの高さ（例えば、カメラの中心位置から基平面までの垂直距離）の正確な値を提供できる。カメラの高さは、ユーザによって提供されるか、アルゴリズムによって推定されるか、測定されるか、またはデフォルト値として設定することができる（例えば、１．５メートル）。カメラの高さは、Ｈ_ｃａｍで表す。

本開示の方法において、３Ｄ空間の表面に関して特定の仮定を行うことができる。例えば、部屋の床は、平坦であり、基平面に対して水平であると仮定できる。部屋の天井は、平坦であり、基平面に対して水平であると仮定できる。部屋の壁は垂直であり、したがって床に対して垂直であると仮定できる。さらに、カメラ光線は、基平面に対して平行であると仮定できる。

本開示の方法において、カメラ座標系において、カメラの中心位置は、直交座標系におけるワールド座標の原点として使用することができる。つまり、カメラの座標は（０，０，０）である。また、カメラはｘ軸の正の方向を向いており、ｚ軸の負の方向は床面方向であり、床面と天井面とはｘ－ｙ平面に対して平行であると仮定できる。基平面の水平消尽線は、部屋のパノラマ画像の中央の高さにある。したがって、床面のｚ軸位置は－Ｈ_ｃａｍである。

以上の仮定により、室内の３Ｄ位置の座標は、３Ｄ位置に対応するパノラマ画像中の画素の画像座標と、カメラ座標系における３Ｄ位置の直交座標との間で変換できる。仮定が異なる場合、変換式は異なる可能性があることに留意されたい。

本開示の態様によれば、パノラマ画像内の画素の画像座標は、該画素に対応するカメラ座標系における３Ｄ位置の直交座標に変換できる。

一実施形態において、パノラマ画像内の画素の画像座標は（ｕ，ｖ）であり、ｕ∈［０，Ｗ）、ｖ∈［０，Ｈ）である。カメラ座標系における対応する３Ｄ位置のｚ軸座標は既知であると仮定する。したがって、画素の画像座標は、対応する３Ｄ位置の直交座標に以下のように変換できる。

次に、対応する３Ｄ位置と実世界のカメラとの距離は、

で推定できる。

したがって、画素が床面上にある場合、カメラ座標系における対応する３Ｄ位置の直交座標は、以下のように表現できる。

ｚ＝－Ｈ_ｃａｍ（式５）

画素が天井面上にあり、天井高、つまり、天井面から床面までの垂直距離がＨ_ｃｅｉｌとして既知の場合、カメラ座標系における対応する３Ｄ位置の直交座標は、以下のように表現できる。

ｚ＝Ｈ_ｃｅｉｌ－Ｈ_ｃａｍ（式８）

本開示の態様によれば、カメラ座標系における３Ｄ位置の直交座標は、３Ｄ位置に対応するパノラマ画像内の画素の画像座標に変換できる。

カメラ座標系における３Ｄ位置の直交座標を（ｘ，ｙ，ｚ）とすると、パノラマ画像における対応する画素の画像座標は、以下のように表現できる。

ここで、ａｒｃｔａｎ２（）は以下のように定義される関数である。

本開示の態様によれば、室内のオブジェクトの高さは、部屋のパノラマ画像に基づいて推定できる。パノラマ画像内の同じ列の２つの画素が与えられ、パノラマ画像内の２つの画素の座標が（ｕ，ｖ_１）および（ｕ，ｖ_２）として表され、（ｕ，ｖ_１）内の１つの画素に対応するカメラ座標系内の第１の３Ｄ位置のｚ軸座標が既知であり、ｚ_１に等しい場合、（ｕ，ｖ_２）内の他の画素に対応するカメラ座標系内の第２の３Ｄ位置のｚ軸座標は、以下のように表現できる。

１つの例示的なアプリケーションは、パノラマ画像における床面に対するオブジェクトの関心点の高さを推定することである。（ｕ，ｖ_１）の画素が床面にあることが既知の場合、つまり、ｚ_１＝－Ｈ_ｃａｍの場合、（ｕ，ｖ_２）の他の画素に対応するカメラ座標系における第２の３Ｄ位置のｚ軸座標は、以下のように表現できる。

オブジェクト内の関心点が（ｕ，ｖ_２）の画素である場合、オブジェクト内の関心点の床面に対する高さは、Ｈ_ｏｂｊ＝ｚ_２－ｚ_１である。

図２は、本開示の一実施形態による、部屋のパノラマ画像におけるホワイトボードの高さを測定する例を示す。図２は、部屋のパノラマ画像の一部を示すことを留意されたい。図２において、部屋の床面からホワイトボードの下側まで垂直線（２０１）が手動で引かれているので、ホワイトボードの高さを自動的に推定できる。これにより、天井高や机の高さなどのオブジェクトの高さも推定できる。例えば、垂直線（２０２）は、部屋の天井高を示している。

また、部屋の天井高は、いくつかの実施形態では、ユーザによって設定され得ることに留意されたい。したがって、天井高、つまり、Ｈ_ｃｅｉｌが決定されると、床面（または天井面）のポイントは、対応するポイントがユーザによってマークされている場合、天井面（または床面）の対応するポイントに基づいて自動的に決定することができる。両方のポイントは、部屋のパノラマ画像において、同じ垂直線または列にある。

一実施形態において、天井高が決定され、部屋の床面のポイントが決定される（例えば、ユーザによってマークされる）場合、部屋の天井面の対応するポイントは自動的に決定され得る。両方のポイントは、部屋のパノラマ画像において、同じ垂直線にある。

例えば、部屋のパノラマ画像のポイント（ｕ_１，ｖ_１）が部屋の床面にある場合、カメラ座標系におけるそのポイントの直交座標、つまり、（ｘ_１，ｙ_１，ｚ_１）は、（式１）－（式２）によって算出できる。ここで、ｚ_１＝－Ｈ_ｃａｍである。次に、部屋の天井面における対応するポイントの直交座標は、（ｘ_２，ｙ_２，ｚ_２）＝（ｘ_１，ｙ_１，ｚ_１＋Ｈ_ｃｅｉｌ）として算出できる。次に、天井面におけるポイントに対応する画素の画像座標は、（式９）～（式１０）により算出できる。

一実施形態において、天井高が決定され、部屋の天井面のポイントが決定される（例えば、ユーザによってマークされる）場合、部屋の床面の対応するポイントは自動的に決定され得る。両方のポイントは、部屋のパノラマ画像において、同じ垂直線にある。

例えば、部屋のパノラマ画像のポイント（ｕ_１，ｖ_１）が天井面にある場合、カメラ座標系におけるそのポイントの直交座標、つまり、（ｘ_１，ｙ_１，ｚ_１）は、（式１）－（式２）によって算出できる。ここで、ｚ_１＝Ｈ_ｃｅｉｌ－Ｈ_ｃａｍである。次に、床面における対応するポイントの直交座標は、（ｘ_２，ｙ_２，ｚ_２）＝（ｘ_１，ｙ_１，ｚ_１－Ｈ_ｃｅｉｌ）として算出できる。次に、床面におけるポイントの画像座標は、（式９）～（式１０）により算出できる。

実際のシーンでは、床面のポイントまたは天井面のポイントのいずれかは、オブジェクトによって遮られることが一般的であるため、上記の方法は重要であり得る。この場合、ユーザは、床面または天井面のいずれかの認識可能なポイントをクリックすることができ、パノラマ画像において、遮蔽された相当物を自動的に推定できる。すなわち、床面のポイントまたは天井面のポイントの少なくとも１つが手動でマークされている場合、壁のコーナを決定することができる。

図３は、部屋のパノラマ画像の遮られたポイントを決定する例を示す。例えば、番号「０１」、「０２」および「０３」でマークされたコーナポイントペアについて、部屋の床面におけるコーナポイントが、室内のいくつかの椅子および机によって遮られている。しかし、これらのコーナポイントは、部屋の天井面の対応するポイントをクリックすることによって推定できる。

部屋のパノラマ画像の同じ垂直線上にある天井および床のコーナポイントのペアは、３Ｄ空間において垂直な直線を定義できる。２つのペアのコーナポイントは、３Ｄ空間における垂直な壁面を定義できる。例えば、図３において、コーナポイントペア「００」および「０１」はホワイトボードのある壁面を定義し、コーナポイントペア「０１」および「０２」は窓のある壁面を定義し、コーナポイントペア「０２」および「０３」はＴＶのある壁面を定義し、コーナポイントペア「０３」および「０４」はガラスドアのある壁面を定義している。コーナポイントペア「０４」および「００」は、がんじょうな壁面ではなく、開いたドアを定義していることに留意されたい。

本開示の態様によれば、部屋のレイアウトは、制御ポイントによって定義することができる。部屋のレイアウトは、多角形形状のエリアであって、複数のコーナポイントを含み得る。近接するいくつかのコーナポイントは壁面を形成することができ、他のものは開口エリアを形成することができる。したがって、クロージャの概念および２つのタイプの制御ポイントは、以下のように記述することができる。

クロージャは、特定の順序を有する制御ポイントのセットとして定義できる。図３では、「００」～「０４」のコーナポイントペアはクロージャを形成する。図４Ａは、本開示の一実施形態によるクロージャの別の例を示す。図４Ａにおいて、「００」～「０３」の制御ポイントは、クロージャを形成する。図４の制御ポイントは、カメラ座標系におけるｘ－ｙ平面の鳥瞰図を用いて二次元（２Ｄ）で示されていることに留意されたい。図４Ａの制御ポイントは、実際のシーンにおけるコーナポイントペア（例えば、一方のコーナポイントが天井面にあり、他方のコーナポイントが床面にある）に対応する。これら２つのコーナポイントは、カメラ座標系において同じｘおよびｙ座標を有するので、図４Ａにおいて同じ制御ポイントによって表現される。制御ポイントの２Ｄ位置を決定するために、ユーザは、部屋のパノラマ画像の床面または天井面のいずれかにおける対応するコーナポイントをマークできる。クロージャはループであり、制御ポイントの順序に基づいて決定されることに留意されたい。１つの制御ポイントは、順序にしたがってその隣接する制御ポイントと接続され、最後の制御ポイントは第１の制御ポイントと接続される。例えば、図３のクロージャでは「００」と「０４」とが接続されている。

いくつかの実施形態では、異なるタイプの壁面は、異なるタイプの制御ポイントを用いて区別できる。例えば、がんじょうな壁面と開口エリアとを区別するために、２つのタイプの制御ポイントを定義できる。図４Ａ～図４Ｄに示すように、２つのタイプの制御ポイントは、それぞれ、黒ベタの円およびパターン付きの円によって表現することができる。黒ベタ制御ポイントは、その前の制御ポイントと共にがんじょうな壁面を形成することができ、一方、パターン付き制御ポイントは、その前の制御ポイントと共に開口エリアを形成できる。例えば、図４Ａの４つの制御ポイントはすべて黒ベタ制御ポイントであり、したがって、このクロージャは、空間内に４つのがんじょうな壁を有する。しかし、図４Ｂでは、「００」がパターン付き制御ポイントであるため、「０４」～「００」のセグメントは、開口エリア（例えば、開いたドアまたは窓）を示す。図４Ｃと図４Ｄでは、２つのパターン付き制御ポイントおよび２つの黒ベタ制御ポイントがあり、したがって、２つのがんじょうな壁および２つの開口エリア（例えば、バルコニや廊下）が存在する。

クロージャは、黒ベタ制御ポイントに基づいてがんじょうな壁面を構築することに限定されず、床面および／または天井面を構築することも可能であることに留意されたい。すべての制御ポイントによって定義される多角形は、床面および／または天井面の形状を識別できる。したがって、パターン付き制御ポイントは、黒ベタ制御ポイントと同様に重要であり得る。

一実施形態では、コンピュータソフトウェア（またはプログラム）は、コンピュータマウスの左クリックまたは右クリックなどの異なる入力タイプによって、２つのタイプの制御ポイントを区別できる。

一実施形態では、コンピュータソフトウェア（またはプログラム）は、異なるキーボード入力などのキーボードの助けによって、２つのタイプの制御ポイントを区別できる。

いくつかの実施形態では、複数のクロージャを使用して、単一のパノラマ画像におけるシーンの部屋のレイアウトを記述することができる。複数のクロージャは、互いに独立しており、異なる天井高を有し得る。したがって、複数のクロージャを使用し、異なる天井高を有する複数の部屋のシーンを表現することができる。

部屋のレイアウトがクロージャおよび制御ポイントによって定義されると、壁面、床面、および天井面を構築することによって、シーンの３Ｄジオメトリを復元できる。制御ポイントの３Ｄジオメトリ位置は、（式１）～（式８）に基づいて算出できる。次に、各平面（例えば、壁面、天井面、床面、または別の平面）における３Ｄ位置を、制御ポイントから補間することによって算出できる。各補間位置の画像座標は、（式９）～（式１０）に基づいて算出することができ、パノラマ画像における各補間位置の画像座標における色情報を、３Ｄジオメトリのそれぞれの補間位置の色情報として適用することができる。したがって、シーンの色付きのポイントクラウドおよびテクスチャメッシュを構築することができる。

いくつかの実施形態では、壁の配置に関して特定の仮定を行うことができる。例えば、マンハッタンワールド仮説を３Ｄ空間の３Ｄジオメトリを生成する際に使用して、生成された３Ｄジオメトリの品質を向上させることができる。マンハッタンワールド仮説では、壁は互いに平行または垂直であると仮定される。

一実施形態では、マンハッタンワールド仮説を使用して、ユーザのマーキング処理をガイドすることができる。図５は、本開示の一実施形態によるマーキング処理で使用することができるガイドラインの例示的な表示を示す。図５において、制御ポイント「００」および「０１」がマークされた後にがんじょうな壁面が形成されるので、マンハッタンワールドにおける主要な方向を決定することができる。次に、ユーザが次の制御ポイント「０２」を見つけるためにカーソルを移動させると、ユーザがそれを迅速に見つけられるように、１つのセットのガイドラインを生成することができる。図５において、次の制御ポイント「０２」から伸びる曲線（５０１）～（５０４）がプレビューガイドラインである。これらの曲線は、パノラマ画像中の「０２」の位置で交差する２つの垂直な壁面を図示している。これにより、床および天井のコーナポイントが両方とも遮られている場合でも、制御ポイント「０２」のマークの利便性と精度とを向上させることができる。

一実施形態では、マンハッタンワールド仮説は、ユーザがマークした位置を精緻化するために使用することができる。例えば、パノラマ画像内のユーザがマークした位置がガイドラインに近いが、正確ではない場合、ユーザがマークした位置は、マンハッタンワールド仮説と一致するようにわずかに調整することができる。これにより、生成された３Ｄジオメトリはマンハッタンワールド仮説を満たすことができ、したがって、より正確な構築が保証される。

本開示の態様によれば、３Ｄジオメトリ（例えば、ポイントクラウドまたはテクスチャメッシュ）は、部屋のパノラマ画像内の天井面および／または床面における１つのセットの壁のコーナポイントをマークすることによって構築することができる。壁のコーナポイントは、一実施形態において、ユーザによって手動でマークされ得る。別の実施形態では、壁のコーナポイントは、自動アルゴリズム（例えば、ＬａｙｏｕｔＮｅｔアルゴリズム、ＨｏｒｉｚｏｎＮｅｔアルゴリズム、またはＤｕｌａ－Ｎｅｔアルゴリズム）などによって最初に推定され、次に、ユーザによって修正されてもよい。別の実施形態では、壁のコーナポイントは、最初にユーザによってマークされ、次に、自動アルゴリズムなどによって、精緻化されてもよい。

いくつかの実施形態では、実世界における距離（または寸法）は、部屋のパノラマ画像でマークされたポイントに基づいて測定または推定できる。実世界における距離は、パノラマ画像内のマークされたポイントに対応する実世界における位置から、画像を捕捉するように構成されたカメラデバイスまでの距離である。実世界における位置の３Ｄ座標は、例えばカメラデバイスが（０，０，０）に配置され得るカメラ座標系に配置することができる。

一実施形態では、オブジェクトの高さ（例えば、オブジェクトから部屋の床面までの垂直距離）は、部屋のパノラマ画像内のオブジェクトのポイントをマークすることによって推定できる。オブジェクトの高さが既知である（または推定された）もしくは決定された場合、パノラマ画像内の任意のポイントに対応する実世界におけるポイントの３Ｄ座標は推定可能である。実世界における位置の３Ｄ座標は、例えばカメラが（０，０，０）に配置されたカメラ座標系に配置することができる。また、オブジェクトの高さが既知である（または推定された）もしくは決定された場合、実世界における２つの位置の間の距離を推定できる。２つの位置は、部屋のパノラマ画像の２つの任意のポイントに対応し得る。

いくつかの実施形態では、部屋のレイアウトは、パノラマ画像のマークされたポイント（制御ポイントとも呼ばれる）のグループによって定義できる。特定の順序でマークされたポイントは、部屋のレイアウトに対応するクロージャを定義できる。２つのタイプのマークされたポイントを使用することができ、その場合、第１のタイプのマークされたポイントは、部屋のがんじょうな壁面を形成することができ、第２のタイプのマークされたポイントは、部屋の開口エリアを形成できる。

上述のように、一実施形態では、コンピュータソフトウェア（またはプログラム）は、コンピュータマウスの左クリックまたは右クリックによって、２つのタイプの制御ポイントを区別できる。一実施形態では、コンピュータソフトウェア（またはプログラム）は、キーボードの助けによって、２つのタイプの制御ポイントを区別できる。

単一のパノラマ画像に対して、シーンの部屋のレイアウトを記述するために、複数のクロージャを使用できる。複数のクロージャは、互いに独立しており、異なる天井高を有し得る。したがって、複数のクロージャを使用し、異なる天井高を有する複数の部屋のシーンを表現することができる。

部屋のレイアウトに基づいて、シーンの３Ｄジオメトリ表現を構築することができる。３Ｄジオメトリは、色および法線ベクトル情報を有するポイントクラウド、またはテクスチャ情報を有するメッシュのいずれかであり得る。色情報およびテクスチャ情報は、パノラマ画像から補間することによって取得できる。

いくつかの実施形態では、マンハッタンワールド仮説などの特定の仮定を、シーンの３Ｄジオメトリの構築に適用することができる。

一実施形態では、マンハッタンワールド仮説を、マーキング処理をガイドするために使用できる。例えば、１つのセットのガイドラインを、マンハッタンワールド仮説に基づいてパノラマ画像に生成することができる。マーキング処理において、ユーザはガイドラインのセットにしたがって、パノラマ画像内のポイントをマークすることができる。

一実施形態では、マンハッタンワールド仮説は、ユーザがマークした位置を精緻化するために使用することができる。例えば、ユーザがマークした位置がガイドラインのセットのいずれにもない場合、ユーザがマークした位置は、１つの最も近いガイドライン上になるように自動的に調整され得る。

ＩＩ．フローチャート
図６は、本開示の一実施形態による例示的な処理（６００）を概説するフローチャートである。様々な実施形態において、処理（６００）は、図７に示される処理回路などの処理回路によって実行される。いくつかの実施形態では、処理（６００）はソフトウェア命令で実装され、したがって、処理回路がソフトウェア命令を実行すると、処理回路は処理（６００）を実行する。

処理（６００）は、一般に、ステップ（Ｓ６１０）で開始することができ、処理（６００）は、ユーザ入力に基づいて、部屋のパノラマ画像の部屋の壁のコーナポイントの２Ｄ位置を決定する。壁のコーナポイントのそれぞれは、部屋の床面または天井面のいずれか一方である。次に、処理（６００）は、ステップ（Ｓ６２０）に進む。

ステップ（Ｓ６２０）において、処理（６００）は、壁のコーナポイントの２Ｄ位置、パノラマ画像のサイズ、および部屋の床面と部屋のパノラマ画像を捕捉するように構成されたデバイスの捕捉位置との間の距離に基づいて、壁のコーナポイントの３Ｄ位置を算出する。次に、処理（６００）は、ステップ（Ｓ６３０）に進む。

ステップ（Ｓ６３０）において、処理（６００）は、壁のコーナポイントの順序に基づいて、部屋のレイアウトを決定する。次に、処理（６００）は、ステップ（Ｓ６４０）に進む。

ステップ（Ｓ６４０）において、処理（６００）は、部屋のレイアウトと壁のコーナポイントの３Ｄ位置とに基づいて、部屋の３Ｄジオメトリを生成する。次に、処理（６００）は終了する。

一実施形態において、処理（６００）は、３Ｄジオメトリの平面内の各３Ｄ位置に対して、それぞれの３Ｄ位置に対応する部屋のパノラマ画像内の２Ｄ位置における色情報に基づいて、それぞれの３Ｄ位置の色情報を決定する。

一実施形態において、３Ｄジオメトリの各壁面は、３Ｄジオメトリの少なくとも１つの他の壁面に対して平行または垂直であり、処理（６００）は、ユーザが壁のコーナポイントのうちの１つを選択することを支援するガイドラインを生成する。

一実施形態において、３Ｄジオメトリの各壁面は、３Ｄジオメトリの少なくとも１つの他の壁面に対して平行または垂直であり、処理（６００）は、ユーザによって選択された壁のコーナポイントのうちの１つを調整する。

一実施形態において、処理（６００）は、部屋のパノラマ画像における２つのポイントの２Ｄ位置を決定する。処理（６００）は、２つのポイントの２Ｄ位置、パノラマ画像のサイズ、および部屋の床面とデバイスの捕捉位置との間の距離に基づいて、２つのポイントの３Ｄ位置を算出する。処理（６００）は、２つのポイントの３Ｄ位置の間の距離を算出する。

ＩＩＩ．コンピュータシステム
上述の技術は、１つまたは複数のコンピュータ可読媒体に物理的に記憶された、コンピュータ可読命令を使用するコンピュータソフトウェアとして実装することができる。例えば、図７は、開示された主題の特定の実施形態を実装するのに適したコンピュータシステム７００を示す。

コンピュータソフトウェアは、１つまたは複数のコンピュータ中央処理装置（ＣＰＵ）およびグラフィックス処理装置（ＧＰＵ）などによって直接的に、または解釈およびマイクロコードの実行などを通して実行され得る命令を含むコードを生成するために、アセンブリ、コンパイル、リンキング、または同様のメカニズムを受け得る任意の適切な機械コードまたはコンピュータ言語を使用してコーディングされ得る。

命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーミングデバイス、およびモノのインターネットデバイスなどを含む様々なタイプのコンピュータまたはその構成要素上で実行され得る。

図７に示されたコンピュータシステム（７００）のコンポーネントは、本質的に例示であり、本開示の実施形態を実装するためのコンピュータソフトウェアの使用範囲または機能にいかなる制限を加えることを意図するものではない。コンポーネントの構成は、コンピュータシステム（７００）の例示的な実施形態に示されているコンポーネントのいずれかまたは組合せに関する依存関係または要件を有すると解釈されるべきではない。

コンピュータシステム（７００）は、特定のヒューマン・インタフェース入力デバイスを含むことができる。そのようなヒューマン・インタフェース入力デバイスは、例えば、触知入力（例えば、キーストローク、スワイプ、データグローブの動き）、音声入力（例えば、声、拍手）、視覚入力（例えば、ジェスチャ）、嗅覚入力（図示せず）を介した１つまたは複数の人間のユーザによる入力に応答することができる。ヒューマン・インタフェース・デバイスを用いて、音声（発話、音楽、周囲音など）、画像（スキャン画像、静止画像カメラから取得される写真画像など）、ビデオ（二次元ビデオ、立体ビデオを含む三次元ビデオなど）など、人間による意識的な入力に必ずしも直接関係ない特定の媒体を取り込むこともできる。

入力ヒューマン・インタフェース・デバイスは、キーボード（７０１）、マウス（７０２）、トラックパッド（７０３）、タッチスクリーン（７１０）、データグローブ（図示せず）、ジョイスティック（７０５）、マイクロフォン（７０６）、スキャナ（７０７）、およびカメラ（７０８）のうちの１つまたは複数（図示された各々のうちの１つのみ）を含むことができる。

コンピュータシステム（７００）はまた、特定のヒューマン・インタフェース出力デバイスを含んでもよい。そのようなヒューマン・インタフェース出力デバイスは、例えば、触知出力、音、光、および匂い／味によって１人または複数の人間のユーザの感覚を刺激することができる。そのようなヒューマン・インタフェース出力デバイスは、触知出力デバイス（例えば、タッチスクリーン（７１０）、データグローブ（図示せず）、またはジョイスティック（７０５）による触覚フィードバックがあるが、入力デバイスとして機能しない触覚フィードバックデバイスもあり得る）、オーディオ出力デバイス（スピーカー（７０９）、ヘッドフォン（図示せず）など）、視覚出力デバイス（ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含むスクリーン（７１０）などであって、それぞれタッチスクリーン入力能力を有するもの、有さないもの、それぞれ触知フィードバック機能を有するもの、有さないもの、そのうちのいくつかは、二次元視覚出力、または立体写真出力などの手段による三次元を越える出力を出力することができるもの、バーチャルリアリティグラス（図示せず）、ホログラフィックディスプレイ、スモークタンク（図示せず）など）、およびプリンタ（図示せず）を含み得る。これらの視覚出力デバイス（スクリーン（７１０）など）は、グラフィックスアダプタ（７５０）を介してシステムバス（７４８）に接続することができる。

コンピュータシステム（７００）はまた、人がアクセス可能なストレージデバイスおよびそれらの関連媒体、例えば、ＣＤ／ＤＶＤなどの媒体（７２１）を有するＣＤ／ＤＶＤＲＯＭ／ＲＷ（７２０）を含む光学メディア、サムドライブ（７２２）、リムーバブル・ハードドライブまたはソリッドステート・ドライブ（７２３）、テープおよびフロッピーディスク（図示せず）などの従来の磁気メディア、セキュリティドングル（図示せず）などの専用ＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイスなどを含むことができる。

当業者はまた、現在開示された主題に関連して使用される「コンピュータ可読媒体」という用語が、伝送媒体、搬送波、または他の一時的な信号を包含しないことを理解するべきである。

コンピュータシステム（７００）はまた、１つまたは複数の通信ネットワーク（７５５）へのネットワークインタフェース（７５４）を含むことができる。１つまたは複数の通信ネットワーク（７５５）は、例えば、無線、有線、光であり得る。さらに、１つまたは複数の通信ネットワーク（７５５）は、ローカル、広域、都市、車両および産業、リアルタイム、遅延耐性などであり得る。１つまたは複数の通信ネットワーク（７５５）は、例えば、イーサネット、無線ＬＡＮ等のローカルエリアネットワーク、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラ・ネットワーク、ケーブルＴＶ、衛星ＴＶ、地上波ＴＶ等を含むテレビ有線もしくは無線広域デジタルネットワーク、ＣＡＮＢｕｓ等を含む車載用もしくは産業用等を含む。特定のネットワークは、一般的に、特定の汎用データポートまたは周辺バス（７４９）に取り付けられた外部ネットワークインタフェース・アダプタ（例えば、コンピュータシステム（７００）のＵＳＢポートなど）を必要とし、他のものは、一般に、以下に説明するようなシステムバスへの取り付け（例えば、ＰＣコンピュータシステムへのイーサネットインタフェースまたはスマートフォン・コンピュータ・システムへのセルラ・ネットワーク・インタフェース）によってコンピュータシステム（７００）のコアに統合される。これらのネットワークのいずれかを使用して、コンピュータシステム（７００）は、他のエンティティと通信することができる。そのような通信は、例えば、ローカルまたは広域デジタルネットワークを使用して、他のコンピュータシステムに対して、単方向、受信のみ（例えば、放送ＴＶ）、単方向送信のみ（例えば、特定のＣＡＮｂｕｓデバイスへのＣＡＮｂｕｓ）、または双方向であり得る。特定のプロトコルおよびプロトコルスタックは、上述のように、それらのネットワークおよびネットワークインタフェースのそれぞれで使用することができる。

前述のヒューマン・インタフェース・デバイス、ヒューマンアクセス可能なストレージデバイス、およびネットワークインタフェースは、コンピュータシステム（７００）のコア（７４０）に取り付けることができる。

コア（７４０）は１つまたは複数の中央処理ユニット（ＣＰＵ）（７４１）、グラフィックス処理装置（ＧＰＵ）（７４２）、フィールドプログラム可能ゲートエリア（ＦＰＧＡ）（７４３）の形態の専用プログラム可能処理ユニット、特定のタスクのためのハードウェアアクセラレータ（７４４）、グラフィックスアダプタ（７５０）等を含む。これらのデバイスは、読み出し専用メモリ（ＲＯＭ）（７４５）、ランダムアクセスメモリ（７４６）、ユーザがアクセスできない内部ハードドライブなどの内部大容量ストレージ（７４７）、ＳＳＤなどと共に、システムバス（７４８）を介して接続することができる。いくつかのコンピュータシステムでは、システムバス（７４８）は、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にするために、１つまたは複数の物理プラグの形態でアクセス可能であり得る。周辺デバイスは、コアのシステムバス（７４８）に直接取り付けることも、周辺バス（７４９）を介して取り付けることもできる。一例として、スクリーン（７１０）は、グラフィックスアダプタ（７５０）に接続できる。周辺バスのアーキテクチャは、ＰＣＩ、ＵＳＢなどを含む。

ＣＰＵ（７４１）、ＧＰＵ（７４２）、ＦＰＧＡ（７４３）、およびアクセラレータ（７４４）は、組み合わせて前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（７４５）またはＲＡＭ（７４６）に記憶することができる。一時的なデータはまた、ＲＡＭ（７４６）に記憶することができ、一方、永続的なデータは、例えば内部大容量ストレージ（７４７）に記憶することができる。メモリデバイスのいずれかへの高速記憶および取得は、１つまたは複数のＣＰＵ（７４１）、ＧＰＵ（７４２）、大容量ストレージ（７４７）、ＲＯＭ（７４５）、ＲＡＭ（７４６）などと密接に関連付けることができるキャッシュメモリの使用によって可能にすることができる。

コンピュータ可読媒体は、様々なコンピュータ実装動作を行うためのコンピュータコードを有することができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであってもよいし、またはコンピュータソフトウェア技術の当業者に公知の利用可能な種類のものであってもよい。

限定ではなく一例として、アーキテクチャ（７００）、特にコア（７４０）を有するコンピュータシステムは、１つまたは複数の有形のコンピュータ可読媒体で具現化されたソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）の結果として機能を提供することができる。そのようなコンピュータ可読媒体は、上述のようなユーザアクセス可能な大容量ストレージ、ならびにコア内部大容量ストレージ（７４７）またはＲＯＭ（７４５）などの非一時的な性質のコア（７４０）の特定のストレージに関連付けられた媒体とすることができる。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア（７４０）によって実行することができる。コンピュータ可読メディアは、特定のニーズに応じて、１つまたは複数のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア（７４０）、具体的にはその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ等を含む）に、ＲＡＭ（７４６）に記憶されたデータ構造を定義すること、およびソフトウェアによって定義された処理にしたがってそのようなデータ構造を修正することを含む、本明細書に記載の特定の処理または特定の処理の特定の部分を実行させることができる。加えて、または代替として、コンピュータシステムは、ハードワイヤードまたは他の方法で回路（例えば、アクセラレータ（７４４））に具現化された論理の結果として機能を提供することができ、ソフトウェアの代わりに、またはソフトウェアと共に動作して、本明細書に記載の特定の処理または特定の処理の特定の部分を実行することができる。ソフトウェアへの参照は、論理を包含することができ、適切な場合には逆もまた同様である。必要に応じて、コンピュータ可読媒体への言及は、実行のためのソフトウェアを格納する回路（集積回路（ＩＣ）など）、実行のためのロジックを具現化する回路、またはこれらの両方を包含することができる。本開示は、ハードウェアとソフトウェアの任意の適切な組合せを包含する。

本開示はいくつかの例示的な実施形態を説明してきたが、本開示の範囲内にある修正例、置換例、および様々な代替均等例がある。したがって、当業者は、本明細書に明示的に示されていないまたは記載されていないが、本開示の原理を具現化し、したがってその趣旨および範囲内にある多数のシステムおよび方法を考案することができることが理解されよう。

６００処理
７００コンピュータシステム
７０１キーボード
７０２マウス
７０３トラックパッド
７０５ジョイスティック
７０６マイクロフォン
７０７スキャナ
７０８カメラ
７０９スピーカー
７１０スクリーン
７２１媒体
７２２サムドライブ
７２３ドライブ
７４０コア
７４１中央処理ユニット（ＣＰＵ）
７４２グラフィックス処理装置（ＧＰＵ）
７４３フィールドプログラム可能ゲートエリア（ＦＰＧＡ）
７４４ハードウェアアクセラレータ
７４５読み出し専用メモリ（ＲＯＭ）
７４６ランダムアクセスメモリ（ＲＡＭ）
７４７内部大容量ストレージ
７４８システムバス
７４９周辺バス
７５０グラフィックスアダプタ
７５４ネットワークインタフェース
７５５通信ネットワーク

Claims

部屋のパノラマ画像から前記部屋の三次元（３Ｄ）ジオメトリを生成する方法であって、前記方法は、
ユーザ入力に基づいて、前記部屋の前記パノラマ画像の前記部屋の壁のコーナポイントの二次元（２Ｄ）位置を決定するステップであって、前記壁のコーナポイントのそれぞれが、前記部屋の床面または天井面のうちの１つに存在する、ステップと、
前記壁のコーナポイントの前記２Ｄ位置、前記パノラマ画像のサイズ、および前記部屋の前記床面と前記部屋の前記パノラマ画像を捕捉するように構成されたデバイスの捕捉位置との間の距離に基づいて、前記壁のコーナポイントの３Ｄ位置を算出するステップと、
前記壁のコーナポイントの順序に基づいて前記部屋のレイアウトを決定するステップと、
前記部屋の前記レイアウトと前記壁のコーナポイントの前記３Ｄ位置に基づいて前記部屋の前記３Ｄジオメトリを生成するステップと、
を含む、方法。
前記ユーザ入力が、前記部屋の前記壁のコーナポイントおよび前記壁のコーナポイントの前記順序をユーザが選択することを含む、請求項１に記載の方法。
前記壁のコーナポイントの少なくとも１つが、第１のタイプの壁のコーナポイントであり、前記第１のタイプの壁のコーナポイントが、前記３Ｄジオメトリの壁面を示す、請求項１に記載の方法。
前記壁のコーナポイントの少なくとも１つが、第２のタイプの壁のコーナポイントであり、前記第２のタイプの壁のコーナポイントが、前記３Ｄジオメトリのオープンエリア平面を示す、請求項１に記載の方法。
生成する前記ステップが、
２つの近接する壁のコーナポイントのうちの所定の１つのタイプに基づいて、前記３Ｄジオメトリの平面を生成するステップを含む、請求項１に記載の方法。
前記３Ｄジオメトリの平面内の各３Ｄ位置に対して、それぞれの前記３Ｄ位置に対応する前記部屋の前記パノラマ画像内の２Ｄ位置における色情報に基づいて、それぞれの前記３Ｄ位置の色情報を決定するステップ
をさらに含む、請求項１に記載の方法。
前記３Ｄジオメトリの各壁面が、前記３Ｄジオメトリの少なくとも１つの他の壁面に対して平行または垂直であり、
前記方法が、ユーザが前記壁のコーナポイントのうちの１つを選択することを支援するガイドラインを生成するステップをさらに含む、
請求項１に記載の方法。
前記３Ｄジオメトリの各壁面が、前記３Ｄジオメトリの少なくとも１つの他の壁面に対して平行または垂直であり、
前記方法が、前記ユーザによって選択された前記壁のコーナポイントのうちの１つを調整するステップをさらに含む、
請求項１に記載の方法。
前記部屋の前記パノラマ画像における２つのポイントの２Ｄ位置を決定するステップと、
前記２つのポイントの前記２Ｄ位置、前記パノラマ画像の前記サイズ、および前記部屋の前記床面と前記デバイスの前記捕捉位置との間の前記距離に基づいて、前記２つのポイントの３Ｄ位置を算出するステップと、
前記２つのポイントの前記３Ｄ位置の間の距離を算出するステップと、
をさらに含む、請求項１に記載の方法。
ユーザ入力に基づいて、部屋のパノラマ画像の前記部屋の壁のコーナポイントの二次元（２Ｄ）位置を決定し、前記壁のコーナポイントのそれぞれが、前記部屋の床面または天井面のうちの１つに存在し、
前記壁のコーナポイントの前記２Ｄ位置、前記パノラマ画像のサイズ、および前記部屋の前記床面と前記部屋の前記パノラマ画像を捕捉するように構成されたデバイスの捕捉位置との間の距離に基づいて、前記壁のコーナポイントの三次元（３Ｄ）位置を算出し、
前記壁のコーナポイントの順序に基づいて前記部屋のレイアウトを決定し、
前記部屋の前記レイアウトと前記壁のコーナポイントの前記３Ｄ位置に基づいて前記部屋の３Ｄジオメトリを生成する、
ように構成された処理回路
を備える、装置。
前記ユーザ入力が、前記部屋の前記壁のコーナポイントおよび前記壁のコーナポイントの前記順序をユーザが選択することを含む、請求項１０に記載の装置。
前記壁のコーナポイントの少なくとも１つが、第１のタイプの壁のコーナポイントであり、前記第１のタイプの壁のコーナポイントが、前記３Ｄジオメトリの壁面を示す、請求項１０に記載の装置。
前記壁のコーナポイントの少なくとも１つが、第２のタイプの壁のコーナポイントであり、前記第２のタイプの壁のコーナポイントが、前記３Ｄジオメトリのオープンエリア平面を示す、請求項１０に記載の装置。
前記処理回路が、
２つの近接する壁のコーナポイントのうちの所定の１つのタイプに基づいて、前記３Ｄジオメトリの平面を生成するようにさらに構成されている、請求項１０に記載の装置。
前記処理回路が、
前記３Ｄジオメトリの平面内の各３Ｄ位置に対して、それぞれの前記３Ｄ位置に対応する前記部屋の前記パノラマ画像内の２Ｄ位置における色情報に基づいて、それぞれの前記３Ｄ位置の色情報を決定するようにさらに構成されている、請求項１０に記載の装置。
前記３Ｄジオメトリの各壁面が、前記３Ｄジオメトリの少なくとも１つの他の壁面に対して平行または垂直であり、
前記処理回路が、
ユーザが前記壁のコーナポイントのうちの１つを選択することを支援するガイドラインを生成するようにさらに構成されている、請求項１０に記載の装置。
前記３Ｄジオメトリの各壁面が、前記３Ｄジオメトリの少なくとも１つの他の壁面に対して平行または垂直であり、
前記処理回路が、
前記ユーザによって選択された前記壁のコーナポイントのうちの１つを調整するようにさらに構成されている、請求項１０に記載の装置。
前記処理回路が、
前記部屋の前記パノラマ画像における２つのポイントの２Ｄ位置を決定し、
前記２つのポイントの前記２Ｄ位置、前記パノラマ画像の前記サイズ、および前記部屋の前記床面と前記デバイスの前記捕捉位置との間の前記距離に基づいて、前記２つのポイントの３Ｄ位置を算出し、
前記２つのポイントの前記３Ｄ位置の間の距離を算出する、
ようにさらに構成されている、請求項１０に記載の装置。
少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサに、
ユーザ入力に基づいて、部屋のパノラマ画像の前記部屋の壁のコーナポイントの二次元（２Ｄ）位置を決定するステップであって、前記壁のコーナポイントのそれぞれが、前記部屋の床面または天井面のうちの１つに存在する、ステップと、
前記壁のコーナポイントの前記２Ｄ位置、前記パノラマ画像のサイズ、および前記部屋の前記床面と前記部屋の前記パノラマ画像を捕捉するように構成されたデバイスの捕捉位置との間の距離に基づいて、前記壁のコーナポイントの三次元（３Ｄ）位置を算出するステップと、
前記壁のコーナポイントの順序に基づいて前記部屋のレイアウトを決定するステップと、
前記部屋の前記レイアウトと前記壁のコーナポイントの前記３Ｄ位置に基づいて前記部屋の３Ｄジオメトリを生成するステップと、
を実行させる命令を格納する非一時コンピュータ可読記憶媒体。
前記ユーザ入力が、前記部屋の前記壁のコーナポイントおよび前記壁のコーナポイントの前記順序をユーザが選択することを含む、請求項１９に記載の非一時コンピュータ可読記憶媒体。