JP2022545141A - 三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体 - Google Patents

三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体 Download PDF

Info

Publication number
JP2022545141A
JP2022545141A JP2021568963A JP2021568963A JP2022545141A JP 2022545141 A JP2022545141 A JP 2022545141A JP 2021568963 A JP2021568963 A JP 2021568963A JP 2021568963 A JP2021568963 A JP 2021568963A JP 2022545141 A JP2022545141 A JP 2022545141A
Authority
JP
Japan
Prior art keywords
mesh model
dimensional mesh
model
target
feature information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021568963A
Other languages
English (en)
Other versions
JP7395617B2 (ja
Inventor
ハイ リー
グオフォン ジャン
フージュン バオ
ナン ワン
ウェイジエン シエ
Original Assignee
チョーチアン センスタイム テクノロジー デベロップメント カンパニー,リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by チョーチアン センスタイム テクノロジー デベロップメント カンパニー,リミテッド filed Critical チョーチアン センスタイム テクノロジー デベロップメント カンパニー,リミテッド
Publication of JP2022545141A publication Critical patent/JP2022545141A/ja
Application granted granted Critical
Publication of JP7395617B2 publication Critical patent/JP7395617B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • G06T17/205Re-meshing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本実施例は、三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体を開示する。当該方法は、ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得することであって、ここで、前記ターゲット画像は、再構築される対象を含む、ことと、前記ターゲット特徴情報に基づいて、前記再構築される対象の顕著性領域を決定することと、前記顕著性領域に基づいて、前記再構築される対象の最終的な三次元メッシュモデルを構築することと、を含む。このようにして、再構築される対象のより多くの詳細を反映する顕著性領域を使用して、再構築される対象の最終的な三次元メッシュモデルを構築して、明らかな詳細の三次元メッシュモデルを柔軟に再構築することができる。

Description

(関連出願の相互参照)
本願は、2020年7月20日に中国特許局に提出された、出願番号が202010699880.1である、中国特許出願に基づいて提出されるものであり、当該中国特許出願の優先権を主張し、当該中国特許出願の全ての内容が参照によって本願に組み込まれる。
本発明は、人工知能技術分野に関し、特に、三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体に関する。
コンピュータ技術の発展に伴い、物体に対する三次元再構築は、各分野に適用される。三次元再構築は、通常、三次元空間の物体またはシナリオを復元し再構成する技術を指し、再構築されたモデルは、コンピュータで便利に表示、処理、ディスプレイできる。関連技術において、物体のマルチ視点画像を使用して復元された三次元物体の三次元モデルで具現された物体の詳細は、比較的に明らかではない。
本発明は、少なくとも、三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体を提供する。
本発明の第1態様は、三次元メッシュモデルの再構築方法を提供し、ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得することであって、ここで、前記ターゲット画像は、再構築される対象を含む、ことと、前記ターゲット特徴情報に基づいて、前記再構築される対象の顕著性領域を決定することと、前記顕著性領域に基づいて、前記再構築される対象の最終的な三次元メッシュモデルを構築することと、を含む。
したがって、ターゲット画像のターゲット特徴情報を使用して、再構築される対象の顕著性領域を決定した後、再構築される対象のより多くの詳細を反映する顕著性領域を使用して、再構築される対象の最終的な三次元メッシュモデルを構築して、明らかな詳細の三次元メッシュモデルを柔軟に再構築することができる。
ここで、前記ターゲット特徴情報に基づいて、前記再構築される対象の顕著性領域を決定することは、前記ターゲット特徴情報を使用して、基礎点群モデルを前記再構築される対象に対応するターゲット点群モデルに変形することと、前記ターゲット点群モデルの顕著性領域を決定することと、を含む。
したがって、ターゲット特徴情報を使用して、再構築される対象詳細領域に対応する顕著性領域を取得して、点群モデルを変形して顕著性領域を取得することができる。
ここで、前記特徴情報を使用して、基礎点群モデルを前記再構築される対象に対応するターゲット点群モデルに変形することは、前記基礎点群モデルを前記ターゲット画像が位置する平面に投影して、前記基礎点群モデル内の各点に対応する前記ターゲット特徴情報を決定することと、第1ニューラルネットワークを使用して、前記基礎点群モデル内の各点に対応するターゲット特徴情報を処理し、前記基礎点群モデルを前記ターゲット点群モデルに変形した後の各点の位置情報を取得することと、を含み、前記ターゲット点群モデルの顕著性領域を決定することは、前記ターゲット点群モデルの点分布状況を取得することと、前記ターゲット点群モデル内の、前記点分布状況が顕著性分布要求を満たす点群領域を検索して、前記顕著性領域として使用することと、を含む。
したがって、第1ニューラルネットワークにより群モデルの変形を実現し、ターゲット点群モデルの点分布状況を使用して、顕著性領域を決定する。
ここで、前記基礎点群モデルを前記ターゲット画像が位置する平面に投影する前に、前記方法は、単位球内で点を均一にサンプリングして、前記基礎点群モデルを取得することをさらに含み、前記基礎点群モデルを前記ターゲット点群モデルに変形した後の各点の位置情報は、前記基礎点群モデルを前記ターゲット点群モデルに変形した後の各点の位置オフセットであり、前記顕著性分布要求は、点分布密度が、プリセットの密度値より大きいことを含む。
したがって、単位球に対して点を均一にサンプリングして基礎点群モデルを取得することができ、第1ニューラルネットワークによって出力される点位置情報はオフセットであり、均一にサンプリングされた点および位置オフセットを使用して、ターゲット点群モデルの各点の位置情報を取得することができ、点分布密度がプリセットの密度値より大きいことを介して顕著性領域を決定して、顕著性領域内の点分布が密集されることができるがこれに限定されなく、再構築される対象の詳細を具現できる。
ここで、前記方法は、トレーニングして前記第1ニューラルネットワークを取得するために、サンプル画像およびサンプル対象の実の三次元メッシュモデルを取得することであって、ここで、前記サンプル画像は、前記サンプル対象を含む、ことと、前記サンプル画像に対して特徴抽出を実行し、サンプル特徴情報を取得することと、前記基礎点群モデルを前記サンプル画像が位置する平面に投影して、前記基礎点群モデル内の各点に対応する前記サンプル特徴情報を決定することと、第1ニューラルネットワークを使用して、前記基礎点群モデル内の各点に対応するサンプル特徴情報を処理し、前記基礎点群モデルが前記サンプル点群モデルに変形された後の各点の位置情報を取得することと、前記実の三次元メッシュモデルに対してメッシュ簡略化を実行し、簡略化三次元メッシュモデルを取得することと、前記予測点群モデル内の、前記簡略化三次元メッシュモデルの各頂点にマッチングする点を検索して、いくつかのグループのマッチング点ペアを取得することと、各グループのマッチング点ペアの位置差異を使用して、前記第1ニューラルネットワークのパラメータを調整することと、をさらに含む。
したがって、実の三次元メッシュモデルを監視して、平坦な領域のパッチが少ないように保証し、簡略化された実の三次元メッシュモデルの頂点を監督信号としてトレーニングし、トレーニングして得られた第1ニューラルネットワークは、ターゲット点群モデルの各点の位置情報を出力することができる。
ここで、前記顕著性領域に基づいて、前記再構築される対象の最終的な三次元メッシュモデルを構築することは、前記ターゲット特徴情報を使用して、前記再構築される対象の初期三次元メッシュモデルを構築することと、前記初期三次元メッシュモデルに対してメッシュ細分化を実行し、前記再構築される対象の前記最終的な三次元メッシュモデルを取得することと、を含み、ここで、前記メッシュ細分化は、対応する前記顕著性領域に対してローカルメッシュ細分化を実行することを含む。
したがって、三次元メッシュモデルを再構築するとき、顕著性領域に対してメッシュ細分化を実行し、メッシュモデルの頂点数を減らし、顕著性領域におけるメッシュモデルの詳細が、一定の豊富さを有するようにする。即ち、対応する顕著性領域でローカルメッシュ細分化を実行するとき、顕著性領域は、再構築される対象のより多くの詳細を反映する領域であるため、顕著性領域に対してメッシュ細分化を実行することは、メッシュモデルの頂点数を減らすだけでなく、さらに、三次元メッシュモデルのデータに必要な記憶空間を減らし、再構築して得られた三次元メッシュモデルが、顕著性領域に対応して過度に平滑しないようにすることができ、詳細をよりよく具現することができ、それにより、より多くの詳細の三次元メッシュモデルを再構築し、三次元メッシュモデルのデータに必要な記憶空間を減らすことができる。
ここで、前記初期三次元メッシュモデルに対してメッシュ細分化を実行し、前記再構築される対象の最終的な三次元メッシュモデルを取得することは、本回のメッシュ細分化を実行する前の三次元メッシュモデルを第1三次元メッシュモデルとすることと、前記第1三次元メッシュモデルを前記ターゲット画像が位置する平面に投影して、前記第1三次元メッシュモデル内の各頂点に対応する前記ターゲット特徴情報を決定することと、前記第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加することであって、ここで、前記ターゲット領域は、前記顕著性領域を少なくとも含む、ことと、前記第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、前記細分化エッジに対応する新しい頂点のターゲット特徴情報を取得することと、前記第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得することと、を含む。
したがって、まず、第1三次元メッシュモデルを投影してターゲット特徴情報を取得し、その後、新しい頂点を追加し、第1三次元メッシュモデルの元頂点および新しい頂点を使用して細分化された第2三次元メッシュモデルを取得して、メッシュ細分化を実現し、再構築される対象の詳細を具現することができる。
ここで、本回のメッシュ細分化が、前記ローカルメッシュ細分化である場合、前記第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加することは、前記第1三次元メッシュモデルで、前記顕著性領域に位置する少なくとも1つのエッジを細分化エッジとして使用することと、前記細分化エッジで少なくとも1つの新しい頂点を決定することと、を含む。
したがって、顕著性領域の少なくとも1つのエッジを細分化エッジとして使用して、細分化エッジで新しい頂点を取得し、それにより、ローカルメッシュ細分化するとき、新しい頂点を決定する。
ここで、前記顕著性領域は、いくつかの顕著点を含み、前記第1三次元メッシュモデルで、前記顕著性領域に位置する少なくとも1つのエッジを細分化エッジとして使用することは、前記第1三次元メッシュモデルで、各前記顕著点に、プリセットの位置条件を満たすエッジを検索して細分化されるエッジとして使用することと、前記第1三次元メッシュモデルで、各エッジが前記細分化されるエッジとして決定される回数を統計することと、前記細分化されるエッジの回数がプリセットの細分化条件を満たすエッジを前記細分化エッジとして使用することと、を含む。
したがって、顕著性領域内の各顕著点に細分化されるエッジを検索し、顕著点が一定の位置関係を満たすエッジに投票し、票数が一定の細分化条件を満たすエッジを細分化エッジとして使用して、新しい頂点の数をさらに減らし、メッシュモデルの変形に必要なストレージを減らす。
ここで、前記プリセットの位置条件は、前記顕著点の位置と最も近いことであり、前記プリセットの細分化条件は、前記細分化されるエッジの回数が、プリセットの回数より大きいもの、または、前記第1三次元メッシュモデルのすべてのエッジの回数が、大きいものから小さいものの順のソートにおいて、前記細分化されるエッジの回数が前のプリセットの数または前のプリセットの比率内にあるものである。
したがって、顕著点と最も近いエッジに投票し、票数の前の一定の比率または前の一定の数のエッジを細分化エッジとして使用し、それにより、最終的な細分化エッジは顕著点と近く、新しい頂点は、再構築される対象の詳細位置により近接する。
ここで、前記メッシュ細分化は、さらに、対応する前記すべての三次元メッシュモデルに対してグローバルメッシュ細分化を実行することを含み、本回のメッシュ細分化が、前記グローバルメッシュ細分化である場合、前記第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加することは、前記第1三次元メッシュモデル内の各エッジをそれぞれ細分化エッジとして使用することと、前記細分化エッジで少なくとも1つの新しい頂点を決定することと、を含む。
したがって、メッシュ細分化は、さらに、すべての三次元メッシュモデルに対応してグローバルメッシュ細分化を実行することを含み、グローバルメッシュ細分化して得られたメッシュモデルは、全体として詳細化される。
ここで、前記細分化エッジで少なくとも1つの新しい頂点を決定することは、前記細分化エッジの中点を前記新しい頂点として使用することを含み、前記第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、前記細分化エッジに対応する新しい頂点のターゲット特徴情報を取得することは、前記細分化エッジに対応する2つの前記元頂点のターゲット特徴情報を使用して、前記細分化エッジに対応する新しい頂点のターゲット特徴情報を取得することを含む。
したがって、細分化エッジの中点を新しい頂点として使用して、細分化エッジに対応する2つの元頂点のターゲット特徴情報を使用して、新しい頂点のターゲット特徴情報を取得することを容易にする。
ここで、前記第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得することは、第2ニューラルネットワークを使用して、前記第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報を処理し、前記第1三次元メッシュモデルを前記第1三次元メッシュモデルに変形した後の各頂点の位置情報を取得することを含む。
したがって、第2ニューラルネットワークを使用して、第1三次元メッシュモデルを第2三次元メッシュモデルに変形する。
ここで、前記ターゲット特徴情報を使用して、前記再構築される対象の初期三次元メッシュモデルを構築することは、基礎三次元メッシュモデルを前記ターゲット画像が位置する平面に投影して、前記基礎三次元メッシュモデル内の各頂点に対応する前記ターゲット特徴情報を決定することと、第2ニューラルネットワークを使用して、前記基礎三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を処理し、前記基礎三次元メッシュモデルを前記初期三次元メッシュモデルに変形した後の各頂点の位置情報を取得することと、を含み、ここで、前記各頂点の位置情報は、位置オフセットである。
したがって、第2ニューラルネットワークを使用して、基礎三次元メッシュモデルを初期三次元メッシュモデルに変形して、再構築される対象を初期化し、再構築される対象の初期形状を具現することができる。
ここで、前記ターゲット画像は、二次元画像であり、および/または、前記ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得することは、第3ニューラルネットワークを使用して、ターゲット画像に対して特徴抽出を実行し、いくつかの次元の特徴情報を取得することと、前記いくつかの次元の特徴情報を融合してターゲット特徴情報を取得することと、を含み、ここで、前記ターゲット特徴情報は、特徴テンソルである。
したがって、第3ニューラルネットワークを使用して二次元のターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を指示する特徴テンソルを取得する。
本発明の第2態様は、三次元メッシュモデルの再構築装置を提供し、ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得するように構成される、特徴抽出モジュールであって、ここで、前記ターゲット画像は、再構築される対象を含む、特徴抽出モジュールと、前記ターゲット特徴情報に基づいて、前記再構築される対象の顕著性領域を決定するように構成される、顕著性領域決定モジュールと、前記顕著性領域に基づいて、前記再構築される対象の最終的な三次元メッシュモデルを構築するように構成される、モデル構築モジュールと、を備える。
本発明の第3態様は、互いに結合されるメモリとプロセッサとを備える、電子機器を提供し、プロセッサは、メモリに記憶されるプログラム命令を実行し、上記の第1態様における三次元メッシュモデルの再構築方法を実現するように構成される。
本発明の第4態様は、プログラム命令を記憶する、コンピュータ可読記憶媒体を提供し、プログラム命令は、プロセッサによって実行されるとき、上記の第1態様における三次元メッシュモデルの再構築方法を実現する。
上記の技術案は、ターゲット画像のターゲット特徴情報を使用して、再構築される対象の顕著性領域を決定し、三次元メッシュモデルを再構築するとき、顕著性領域に対してメッシュ細分化を実行し、メッシュモデルの頂点数を減らし、顕著性領域におけるメッシュモデルの詳細が、一定の豊富さを有するようにする。即ち、対応する顕著性領域でローカルメッシュ細分化を実行するとき、顕著性領域は、再構築される対象のより多くの詳細を反映する領域であるため、顕著性領域に対してメッシュ細分化を実行することは、メッシュモデルの頂点数を減らすだけでなく、さらに、三次元メッシュモデルのデータに必要な記憶空間を減らし、再構築して得られた三次元メッシュモデルが、顕著性領域に対応して過度に平滑しないようにすることができ、詳細をよりよく具現することができ、それにより、より多くの詳細の三次元メッシュモデルを再構築し、三次元メッシュモデルのデータに必要な記憶空間を減らすことができる。
上記した一般的な説明及び後述する詳細な説明は、単なる例示及び説明に過ぎず、本発明を限定するものではないことを理解されたい。
ここでの図面は、本明細書に組み込まれてその一部を構成し、これらの図面は、本発明と一致する実施例を示すものであり、明細書とともに本発明の実施例の技術的解決策を説明するために使用される。
本発明の三次元メッシュモデルの再構築方法の一実施例の例示的なフローチャートである。 本願実施例の三次元メッシュモデルの再構築方法のネットワークのアーキテクチャの概略図である。 本発明の三次元メッシュモデルの再構築方法の一実施例のステップS12の例示的なフローチャートである。 本発明の三次元メッシュモデルの再構築方法の別の一実施例の例示的なフローチャートである。 本発明の三次元メッシュモデルの再構築方法の別の一実施例のステップS24の例示的なフローチャートである。 本発明の三次元メッシュモデルの再構築方法の別の一実施例のステップS24の別の例示的なフローチャートである。 本発明の三次元メッシュモデルの再構築装置の実施例のフレームワークの概略図である。 本発明の三次元メッシュモデルの再構築装置の別の実施例のフレームワークの概略図である。 本発明の電子機器の実施例のフレームワークの概略図である。 本発明のコンピュータ可読記憶媒体の実施例のフレームワークの概略図である。
以下は、図面を参照して、本発明の実施例の技術案を詳細に説明する。
以下の説明において、限定するためにではなく説明するためであり、本発明を完全に理解するために、特定のシステム構造、インターフェース、技術などの具体的な詳細を提案する。
本明細書における「及び/または」という用語は、関連付けられた対象を説明する単なる関連付けであり、3種類の関係が存在し得ることを表示し、例えば、A及び/またはBは、Aが独立で存在する場合、AとBが同時に存在する場合、Bが独立で存在する場合などの3つの場合を表示する。さらに、本明細書における記号「/」は、一般的に、前後の関連付けられるオブジェクトが、「または」という関係であることを示す。なお、本明細書における「複数」は、2つまたは2つ以上を表す。さらに、本明細書における「少なくとも1つ」という用語は、複数のうちの1つまたは複数のうちの少なくとも2つの任意の組み合わせを示し、例えば、A、B、Cのうちの少なくとも1つを含むことは、A、B及びCで構成されるセットから選択された任意の1つまたは複数の要素を含むことを示す。
図1Aを参照すると、図1Aは、本発明の三次元メッシュモデルの再構築方法の一実施例の例示的なフローチャートである。具体的には、以下のステップを含み得る。
ステップS11において、前記ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得する。
本発明の実施例において、ターゲット画像は、再構築される対象を含む。三次元メッシュモデルの再構築方法の実行主体は、三次元メッシュモデルの再構築装置であり得、例えば、三次元メッシュモデルの再構築方法は、端末機器またはサーバまたは他の処理機器によって実行されることができ、ここで、端末機器は、ユーザ機器(UE:User Equipment)、モバイル機器、ユーザ端末、端末、携帯電話、コードレス電話、パーソナルデジタル処理(PDA:Personal Digital Assistant)、ハンドヘルド機器、コンピューティング機器、車載機器、ウェアラブル機器などであり得る。いくつかの可能な実施形態において、当該三次元メッシュモデルの再構築方法は、プロセッサによって、メモリに記憶されるコンピュータ可読命令を呼び出す方式を介して実現することができる。
再構築される対象は、飛行機、建築、人、動物などであり得、本発明の実施例では、特に限定されない。ターゲット画像は、二次元画像であり得、例えば、単一の視点から撮影された単一な単視図などであり、再構築される対象の特徴情報を含むことができれば、ターゲット画像の具体的な形に対して特に限定しない。ターゲット画像が、再構築される対象を含むため、ターゲット画像に対して特徴抽出を実行し、再構築される対象に対応するターゲット特徴情報を取得する。ターゲット特徴情報は、再構築される対象の特徴を指示し、即ち、ターゲット特徴情報は、再構築される対象の全体的な特徴情報およびローカル特徴情報を含み得、一実際の適用シナリオでは、特徴情報の一部をカスタマイズで選択してターゲット特徴情報として使用することができ、再構築される対象の特徴情報を含めば、ターゲット特徴情報の表現の形に対して特に限定しない。
一開示された実施例において、ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得するとき、第3ニューラルネットワークを使用して、ターゲット画像に対して特徴抽出を実行し、いくつかの次元の特徴情報を取得し、いくつかの次元の特徴情報を融合してターゲット特徴情報を取得する。第3ニューラルネットワークは、画像特徴抽出を実行することができる任意のニューラルネットワークであり得、畳み込みニューラルネットワークを含むがこれに限定されない。したがって、第3ニューラルネットワークを使用して、ターゲット画像に対して特徴抽出を実行し、特徴情報を具現するターゲット特徴情報を取得する。
一開示された実施例において、第3ニューラルネットワークは、畳み込みニューラルネットワークであり、畳み込みニューラルネットワークは、いくつかの畳み込み層およびプーリング層を含み、各プリセットの数の畳み込み層の後プーリング層を使用して、特徴抽出のとき特徴次元削減を実現する。ターゲット画像を畳み込みニューラルネットワークに入力し、畳み込みニューラルネットワークの最初の畳み込み層は、ターゲット画像と同じサイズの特徴情報を取得し、第2層の畳み込み層は、ターゲット画像の半分サイズの特徴情報を取得し、これによって類推し、次の層の畳み込み層によってえられる特徴情報のサイズは、前の層の畳み込み層によって得られた特徴情報のサイズの半分に近く、それにより、いくつかの次元の特徴情報を取得する。ターゲット特徴情報は、すべての次元の特徴情報を融合して得られることができ、次元の一部の特徴情報を融合して得られることもでき、特徴融合の実施形態は特に限定されない。いくつかの次元の特徴情報は、異なるサイズに対応する場合、特徴情報の融合を容易にするために、いくつかの次元の特徴情報をターゲット画像と同じサイズの特徴情報に正規化し、正規化された特徴情報を融合してターゲット特徴情報を取得する。
ターゲット特徴情報が特徴テンソルであり、ターゲット画像が二次元画像である場合、後続で特徴テンソルを使用して特徴情報の融合を容易にするために、特徴テンソルは、二次元画像のサイズと同じである。同様に、いくつかの次元の特徴情報を、ターゲット画像と同じサイズの特徴情報に正規化し、正規化された特徴情報を融合して特徴テンソルを取得して、異なるサイズの特徴情報を、二次元画像と同じサイズの特徴テンソルに融合する。
ステップS12において、ターゲット特徴情報に基づいて、再構築される対象の顕著性領域を決定する。
顕著性領域は、再構築される対象の曲率の変化が大きく、詳細が比較的に多いい領域を指示し、例えば、再構築される対象が飛行機である場合、顕著性領域は、プロペラに対応する領域、翼と機体との接続領域、曲げ曲率の変化が大きい領域などであり得、機体などの平滑な領域は、非顕著性領域であり、再構築される対象が車両である場合、顕著性領域は、タイヤ、車のライト、バックミラーなどの対応する領域である。ターゲット特徴情報は、再構築される対象の特徴情報を含み、後続で特徴情報の融合を実現するために使用される。顕著性領域は、二次元座標情報、三次元座標情報および色識別子情報などを介して具現できる。例えば、顕著性領域が座標情報である場合、座標密集領域を顕著性領域として使用することができ、顕著性領域が色識別子情報である場合、色の深さを介して詳細の数を指示し、深い色識別子情報が位置する領域を顕著性領域として使用することができる。
ターゲット特徴情報を使用して、再構築される対象詳細領域に対応する顕著性領域を取得して、点群モデルを変形して顕著性領域を取得することができるようにするために、一開示された実施例において、顕著性領域は点群を介して表現され、点群を使用して、再構築される対象の詳細特徴分布を予測し、点群モデルの点を、顕著性領域に集合させる。図2は、本発明の三次元メッシュモデルの再構築方法の一実施例のステップS12の例示的なフローチャートである。具体的には、ステップS12は以下のステップを含み得る。
ステップS121において、ターゲット特徴情報を使用して、基礎点群モデルを、再構築される対象に対応するターゲット点群モデルに変形する。
基礎点群モデルは、事前に取得または設定されたモデルであり、且つ、基礎点群モデル上の点は均一に分布され、すべてのターゲット画像に対応する基礎点群モデルは一致する。基礎点群モデルは、単位球、楕円三次元メッシュなどの均一にサンプリングされた点によって得られ、接続関係のない1つの点によって構成される。基礎点群モデルの均一に分布される点は、ターゲット特徴情報を使用して特徴情報を融合した後、点の位置はオフセットされ、基礎点群モデルをターゲット点群モデルに変形させる。ターゲット点群モデルにおける点の分布状況は、再構築される対象に対応し、再構築される対象の特徴を反映し、それにより、ターゲット点群モデルは、再構築される対象の整体形状と詳細を指示することができる。いくつかの可能な実施形態において、基礎点群モデルをターゲット画像が位置する平面に投影して、基礎点群モデル内の各点に対応するターゲット特徴情報を決定し、第1ニューラルネットワークを使用して、基礎点群モデル内の各点に対応するターゲット特徴情報を処理し、基礎点群モデルをターゲット点群モデルに変形した後の各点の位置情報を取得し、それにより、第1ニューラルネットワークを介して点群モデルの変形を実現する。ここで、第1ニューラルネットワークは、点群モデルの変形を実現できれば、深層学習を介してターゲット点群モデルの各点の位置情報を取得する任意のニューラルネットワークであり、本発明の実施例において、第1ニューラルネットワークは、畳み込みニューラルネットワークを含むがこれに限定されない。
基礎点群モデルをターゲット点群モデルに変形した後の各点の位置情報は、各点の位置オフセット、位置オフセット経路などの点位置を更新するためのデータであり得るがこれに限定されない。一開示された実施例において、基礎点群モデルをターゲット点群モデルに変形した後の各点の位置情報は、各点の位置オフセットであり得、基礎点群モデルの点の位置情報および位置オフセットを使用して、計算してターゲット点群モデル上の点の位置情報を取得し、別の開示された実施例において、基礎点群モデルをターゲット点群モデルに変形した後の各点の位置情報は、各点の位置オフセット経路であり得、例えば、位置オフセット経路は、方向と長さを有するベクトル値であるがこれに限定されなく、基礎点群モデルの点は、位置オフセット経路からターゲット点群モデル上の各点の位置情報に沿う。
ここで、第1ニューラルネットワークは、サンプル画像およびサンプル対象の実の三次元メッシュモデルなどのデータセットを使用してトレーニングして得られるものである。いくつかの可能な実施形態において、サンプル画像およびサンプル対象の実の三次元メッシュモデルを取得し、ここで、サンプル画像は、サンプル対象を含み、サンプル画像に対して特徴抽出を実行し、サンプル特徴情報を取得し、基礎点群モデルをサンプル画像が位置する平面に投影して、基礎点群モデル内の各点に対応するサンプル特徴情報を決定し、第1ニューラルネットワークを使用して、基礎点群モデル内の各点に対応するサンプル特徴情報を処理し、基礎点群モデルを予測点群モデルに変形した後の各点の位置情報を取得し、上記のステップの関連する説明は、ステップS11およびステップS12と類似し、ここでは繰り返して説明しない。予測点群モデルの各点の位置情報を取得した後、実の三次元メッシュモデルに対してメッシュ簡略化を実行し、簡略化三次元メッシュモデルを取得し、予測点群モデルのうち、簡略化三次元メッシュモデルの各頂点にマッチングする点を検索して、いくつかのグループのマッチング点ペアを取得し、各グループのマッチング点ペアの位置差異を使用して、第1ニューラルネットワークのパラメータを調整する。
実の三次元メッシュモデルは、サンプル対象の三次元メッシュモデルを指示し、実際のサンプル画像は、ターゲット画像として使用され、本発明の三次元メッシュモデルの再構築方法によって取得される再構築される対象の最終的な三次元メッシュモデルが、実の三次元メッシュモデルに近接するほど、三次元メッシュモデルの再構築方法の復元度が高いことを表す。上記の第1ニューラルネットワークのトレーニングプロセスにおいて、実の三次元メッシュモデルを監視して、平坦な領域のパッチが少ないように保証し、簡略化された実の三次元メッシュモデルの頂点を監督信号としてトレーニングし、トレーニングして得られた第1ニューラルネットワークは、ターゲット点群モデルの各点の位置情報を出力することができる。
ステップS122において、ターゲット点群モデルの顕著性領域を決定する。
ターゲット点群モデルには、異なる密度の点が分布され、点の分布状況に従って、顕著性領域を決定することができる。いくつかの可能な実施形態において、ターゲット点群モデルの点分布状況を取得し、ターゲット点群モデル内の、点分布状況が顕著性分布要求を満たす点群領域を検索して、顕著性領域として使用し、それにより、点群によって表現される点分布状況を介して、点群を使用して、再構築される対象の詳細特徴分布を予測し、顕著性分布要求を満たす点群領域を顕著性領域として使用するとよい。顕著性分布要求は、必要に応じで設定することができ、点分布密度が、プリセットの密度値より大きい領域を顕著性領域として使用することを含むがこれに限定されなく、ここで、プリセットの密度値は、カスタマイズに設定することができる。
一適用実施例において、単位球で点を均一にサンプリングして、基礎点群モデルを取得した後、基礎点群モデルをターゲット画像が位置する平面に投影して、基礎点群モデル内の各点に対応するターゲット特徴情報を決定し、畳み込みニューラルネットワークを使用して、基礎点群モデル内の各点に対応するターゲット特徴情報を処理し、基礎点群モデルをターゲット点群モデルに変形した後の各点の位置オフセットを取得し、基礎点群モデルの点の位置情報および位置オフセットを使用して、ターゲット点群モデル上の点の位置情報を計算して、ターゲット点群モデルの点分布状況を取得し、ターゲット点群モデル内の、点分布密度がプリセットの密度値より大きい領域を検索して顕著性領域として使用し、それにより、顕著性領域内の点分布が密集され、再構築される対象の詳細を具現することができる。
したがって、ターゲット特徴情報を使用して、基礎点群モデルを再構築される対象に対応するターゲット点群モデルに変形し、その後、ターゲット点群モデルの顕著性領域を決定して、ターゲット特徴情報を使用して、再構築される対象詳細領域に対応する顕著性領域を取得して、点群モデルを変形して顕著性領域を取得することができる。
ステップS13において、顕著性領域に従って、再構築される対象の最終的な三次元メッシュモデルを構築する。
最終的な三次元メッシュモデルは、メッシュ細分化、顕著点群などの単一または組み合わせた三次元メッシュモデルを構築する方法で実現でき、ここでは限定しない。顕著性領域は、再構築される対象のより多い詳細を反映する領域であるため、顕著性領域に従って最終的な三次元メッシュモデルを柔軟に構築することができ、顕著性領域のみに対してメッシュ細分化を実行し、または、まず、ターゲット特徴情報を使用して、再構築される対象の初期三次元メッシュモデルを構築し、その後、初期三次元メッシュモデルに対してメッシュ細分化を実行することができるがこれに限定されない。
上記の方式を介して、再構築される対象を含むターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得し、それにより、ターゲット特徴情報を使用して、再構築される対象の顕著性領域を決定し、さらに、顕著性領域を取得した後、顕著性領域を使用して、再構築される対象の最終的な三次元メッシュモデルを構築することができ、顕著性領域を柔軟に使用して、明らかな詳細の三次元メッシュモデルを再構築することができる。
本発明の実施例において、図1Bに示されたネットワークアーキテクチャを介して、再構築される対象に対する三次元再構築を実現することができ、図1Bは、本願実施例の三次元メッシュモデルの再構築方法のネットワークのアーキテクチャの概略図であり、当該ネットワークアーキテクチャは、ユーザ端末201、ネットワーク202および三次元メッシュモデルの再構築端末203を備える。1つの例示的な適用を支持するために、ユーザ端末201と三次元メッシュモデルの再構築端末203は、ネットワーク202を介して通信接続が確立され、ユーザ端末201は、再構築される対象を含むターゲット画像に対して三次元再構築を実行するとき、まず、ターゲット画像を、ネットワーク202を介して三次元メッシュモデルの再構築端末203に送信する必要があり、その後、三次元メッシュモデルの再構築端末203が、当該ターゲット画像に対して特徴抽出を実行することにより、ターゲット特徴情報を取得し、当該ターゲット特徴情報に基づいて、再構築される対象の顕著性領域を決定し、最後に、三次元メッシュモデルの再構築端末203が、当該顕著性領域を介して、再構築される対象に対する三次元再構築を実現して、再構築される対象の最終的な三次元メッシュモデルを取得する。このようにして、ターゲット画像で再構築される対象の顕著性領域を決定した後、より多くに詳細の顕著性領域に基づいて、再構築される対象の最終的な三次元メッシュモデルを構築して、比較的に明らかな詳細の最終的な三次元メッシュモデルを取得することができる。
顕著性領域に対してメッシュ細分化を実行するとき、メッシュモデルの頂点数を減らし、顕著性領域におけるメッシュモデルの詳細が、一定の豊富さを有するようにする。顕著性領域に従って、再構築される対象の最終的な三次元メッシュモデルを構築するとき、ターゲット特徴情報を使用して、再構築される対象の初期三次元メッシュモデルを構築し、初期三次元メッシュモデルに対してメッシュ細分化を実行し、再構築される対象の最終的な三次元メッシュモデルを取得し、ここで、メッシュ細分化は、対応する顕著性領域に対してローカルメッシュ細分化を実行することを含む。図3を参照すると、図3は、本発明の三次元メッシュモデルの再構築方法の別の一実施例の例示的なフローチャートである。具体的には、以下のステップを含み得る。
ステップS21において、ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得する。
上記のステップS21において、ターゲット画像は、再構築される対象を含む。
ステップS22において、ターゲット特徴情報に基づいて、再構築される対象の顕著性領域を決定する。
上記のステップS21とステップS22の説明は、図1Aに示されたステップS11およびステップS12の具体的な説明を参照でき、ここでは繰り返して説明しない。
ステップS23において、ターゲット特徴情報を使用して、再構築される対象の初期三次元メッシュモデルを構築する。
初期三次元メッシュモデルは、メッシュ変形を実行する前の単純な三次元メッシュモデルであり、再構築される対象の初期整体形状と詳細を具現する。初期三次元メッシュモデルは、すべて、頂点、エッジおよび面によって構成される。理解され得るように、ステップS22におけるターゲット特徴情報に基づいて顕著性領域を決定する場合、いくつかの接続関係のない点分布によって、再構築される対象の初期整体形状と詳細を反映し、ステップS23におけるターゲット特徴情報を使用して再構築される対象の初期三次元メッシュモデルを構築する場合、頂点、エッジおよび面によって、再構築される対象の初期整体形状と詳細を共同に反映する。
深層学習を使用してメッシュモデルの変形を実現するために、一開示された実施例において、基礎三次元メッシュモデルをターゲット画像が位置する平面に投影して、基礎三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を決定し、第2ニューラルネットワークを使用して、基礎三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を処理し、基礎三次元メッシュモデルを初期三次元メッシュモデルに変形した後の各頂点の位置情報を取得する。ここで、各頂点の位置情報は、位置オフセットであり得、それにより、第2ニューラルネットワークを使用して、基礎三次元メッシュモデルを初期三次元メッシュモデルに変形して、再構築される対象を初期化し、再構築される対象の初期形状を具現することができる。
基礎三次元メッシュモデルおよび初期三次元メッシュモデルは、すべて、頂点、エッジおよび面によって構成され、且つ、基礎三次元メッシュモデルにおける頂点の位置は、オフセットの後、初期三次元メッシュモデルにおける頂点の位置を形成し、元均一に分布された頂点が、再構築される対象の全体的な形状と詳細に近接する位置にオフセットされるようにする。第2ニューラルネットワークは、メッシュモデルの変形を実現できれば、深層学習を介して三次元メッシュモデルの各頂点の位置情報を取得する任意のニューラルネットワークであり、具体的には、第2ニューラルネットワークは、グラフ畳み込みニューラルネットワークを含むがこれに限定されない。グラフ畳み込みニューラルネットワークに含まれる入力層、暗黙層、出力層の次元数は、カスタマイズに設定することができ、ここでは特に限定しない。第2ニューラルネットワークは、各頂点位置情報を取得することができるニューラルネットワークであり、本ステップでは、ターゲット特徴情報に従って、基礎三次元メッシュモデルに対して複数回の変形を実行し、初期三次元メッシュモデルの頂点位置を、再構築される対象実の頂点の位置に近いようにすることができる。
一実施シナリオにおいて、上記のステップS22およびステップS23は、優先順位に従って実行することができ、例えば、まず、ステップS22を実行した後、ステップS23を実行するか、まず、ステップS23を実行し他後、ステップS22を実行することができる。別の一実施シナリオにおいて、上記のステップS22およびステップS23は、同時に実行することができ、具体的には、実際の適用に応じて設定することができ、ここでは限定しない。
ステップS24において、初期三次元メッシュモデルに対してメッシュ細分化を実行し、再構築される対象の最終的な三次元メッシュモデルを取得する。
上記のステップS24において、メッシュ細分化は、対応する顕著性領域に対してローカルメッシュ細分化を実行することを含む。
ステップS22およびステップS23の後、初期三次元メッシュモデルおよび顕著性領域を取得し、それにより、顕著性領域を使用して、初期三次元メッシュモデルのメッシュ細分化をガイドし、顕著性領域が、再構築される対象の領域の一部に対応するために、顕著性領域に対応する領域のみをメッシュ細分化の対象として使用することができ、顕著性領域に対応する詳細情報を好ましく反映することができ、比較的に平坦な領域は、より大きいメッシュで表示して、ストレージの消費を減らすことができ、ローカルメッシュ細分化を実行するとき、多い詳細を指示する顕著性領域のみでメッシュ細分化を導入し、再構築される対象固有の特徴をより効果的に反映し、過度の平滑を引き起こさない。モデルに、よりリアルな幾何学的詳細を表示させるために、一開示された実施例において、顕著性領域は、ターゲット特徴情報を使用して得られた点群分布であり、初期三次元メッシュモデルは、ターゲット特徴情報を使用して得られたメッシュ分布であり、顕著性領域を総合的に使用して、初期三次元メッシュモデルに対するメッシュ細分化をガイドすることは、点群表現およびメッシュテーブルの2つのモデル表現方式を組み合わせる。
理解され得るように、一開示された実施例において、初期三次元メッシュモデルに対してメッシュ細分化を実行するとき、グローバルメッシュ細分化およびローカルメッシュ細分化を実行することができ、ここで、グローバルメッシュ細分化は、すべての三次元メッシュモデルに対応し、ローカルメッシュ細分化は、顕著性領域に対応し、グローバルメッシュ細分化およびローカルメッシュ細分化の順序と、各メッシュ細分化の回数は、すべて特に限定されない。
上記の技術案は、ターゲット画像のターゲット特徴情報を使用して、再構築される対象の顕著性領域を決定し、三次元メッシュモデルを再構築するとき、顕著性領域に対してメッシュ細分化を実行し、メッシュモデルの頂点数を減らし、顕著性領域におけるメッシュモデルの詳細が、一定の豊富さを有するようにする。即ち、対応する顕著性領域でローカルメッシュ細分化を実行するとき、顕著性領域は、再構築される対象のより多くの詳細を反映する領域であるため、顕著性領域に対してメッシュ細分化を実行することは、メッシュモデルの頂点数を減らすだけでなく、さらに、三次元メッシュモデルのデータに必要な記憶空間を減らし、再構築して得られた三次元メッシュモデルが、顕著性領域に対応して過度に平滑しないようにすることができ、詳細をよりよく具現することができ、それにより、より多くの詳細の三次元メッシュモデルを再構築し、三次元メッシュモデルのデータに必要な記憶空間を減らすことができる。
一開示された実施例において、メッシュ細分化は、グローバルメッシュ細分化および/またはローカルメッシュ細分化であり得、本発明の最終的な三次元メッシュモデルのメッシュ細分化プロセスをより詳細に説明するために、図4は、本発明の三次元メッシュモデルの再構築方法の別の一実施例のステップS24の例示的なフローチャートであり、図5は、本発明の三次元メッシュモデルの再構築方法の別の一実施例のステップS24の別の例示的なフローチャートであり、且つ、図4は、ローカルメッシュ細分化に対応し、図5は、グローバルメッシュ細分化に対応する。
図4に示されたように、本発明は、ターゲット画像の特徴情報を使用して、再構築される対象の顕著性領域を決定した後、三次元メッシュモデルを再構築するとき、顕著性領域に対してローカルメッシュ細分化を実行することにおいて、ステップS24は、以下のステップを含む。
ステップS241aにおいて、本回のメッシュ細分化を実行する前の三次元メッシュモデルを第1三次元メッシュモデルとする。
最初にメッシュ細分化するとき、第1三次元メッシュモデルは、初期三次元メッシュモデルであり、後続で毎回メッシュ細分化するとき、本回のメッシュ細分化する前の三次元メッシュモデルを、第1三次元メッシュモデルとして使用するとよい。理解され得るように、本回のメッシュ細分化する前の三次元メッシュモデルは、ローカルメッシュ細分化の結果であってもよいし、グローバルメッシュ細分化の結果であってもよい。
ステップS242aにおいて、第1三次元メッシュモデルをターゲット画像が位置する平面に投影して、第1三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を決定する。
ターゲット画像が位置する平面は、投影された各頂点与に対応するターゲット特徴情報に対してマッチング融合を実行し、各頂点に対応するターゲット特徴情報を取得するように構成される。
ステップS243aにおいて、第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加する。
第1三次元メッシュモデルは、頂点、エッジおよび面によって構成される。本回のメッシュ細分化が、ローカルメッシュ細分化である場合、ターゲット領域は、再構築される対象の詳細領域を反映する顕著性領域に対応する。第1三次元メッシュモデルのターゲット領域を決定した後、第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加する。新しい頂点の数および新しい頂点の具体的な位置に対して特に限定しなく、且つ、新しい頂点は、接続した後新しいエッジと面を形成するように構成される。そのため、本発明のローカルメッシュ細分化は、再構築される対象の詳細領域に対して選択的にメッシュ細分化を実行し、メッシュモデルが変形するときの新しい頂点数を減らすことができる。
一開示された実施例において、第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加するとき、第1三次元メッシュモデルで、顕著性領域に位置する少なくとも1つのエッジを細分化エッジとして使用し、細分化エッジで少なくとも1つの新しい頂点を決定して、ローカルメッシュ細分化された新しい頂点を取得する。顕著性領域内のいくつかのエッジから、少なくとも1つのエッジを選択して細分化エッジとして使用し、各細分化エッジで少なくとも1つの新しい頂点を決定し、最終的に、新しい頂点を接続した後新しいエッジおよび面を形成して、メッシュ細分化に使用されることができれば、異なる細分化エッジで決定される新しい頂点数は、同じであってもよいし異なってもよい。一適用シナリオにおいて、細分化エッジは、顕著性領域のすべての細分化エッジであり得、顕著性領域内の細分化エッジの一部であり得る。
本回のメッシュ細分化によって形成された新しい頂点を、再構築される対象の実際の頂点位置により近接させ、最終的な三次元メッシュモデルの詳細を改善させるために、一開示された実施例において、第1三次元メッシュモデルでは、顕著性領域に位置する少なくとも1つのエッジを細分化エッジとして使用するとき、第1三次元メッシュモデルで、各顕著点に位置がプリセットの位置条件を満たすエッジを検索して細分化されるエッジとして使用し、顕著性領域は、いくつかの顕著点を含み、それにより、いくつかの細分化されるエッジを取得する。第1三次元メッシュモデルのうち、各エッジが細分化されるエッジとして決定された回数を統計し、細分化されるエッジの回数が、プリセットの細分化条件を満たすエッジを細分化エッジとして使用して、顕著性領域内の各顕著点に細分化されるエッジを検索し、顕著点が特定の位置関係を満たすエッジに投票して、票数が特定の細分化条件を満たすエッジを細分化エッジとして使用し、それにより、新しい頂点の数をさらに減らし、メッシュモデルの変形に必要なストレージ使用量を削減する。
プリセットの位置条件は、顕著点の位置と最も近いこと、即ち、顕著点の位置と最も近いエッジを細分化されるエッジとして使用することと、顕著点に対応する位置と重複すること、即ち、顕著点に対応する位置のエッジを細分化されるエッジとして使用することとを含むがこれに限定されない。したがって、顕著点と最も近いエッジに投票し、票数の前の一定の比率または前の一定の数のエッジを細分化エッジとして使用し、それにより、最終的な細分化エッジは顕著点と近く、新しい頂点は、再構築される対象の詳細位置により近接する。
顕著性領域は、いくつかの顕著点を含むため、各顕著点は、プリセットの位置条件に従って、細分化されるエッジを取得した後、異なる顕著点によって決定される細分化されるエッジは、同じであってもよいし異なってもよい。すべての細分化されるエッジを決定した後、すべての細分化されるエッジを細分化エッジとして使用することができ、細分化されるエッジの一部を選択して細分化エッジとして使用することもでき、ここでは限定しない。一開示された実施例において、プリセットの細分化条件は、細分化されるエッジの回数が、プリセットの回数より大きいもの、または、第1三次元メッシュモデルのすべてのエッジの回数が、大きいものから小さいものの順のソートにおいて、細分化されるエッジの回数が前のプリセットの数または前のプリセットの比率内にあるものである。
ステップS244aにおいて、第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、細分化エッジに対応する新しい頂点のターゲット特徴情報を取得する。
細分化エッジを決定した後、プリセットのルールに応じて新しい頂点を決定することができ、プリセットのルールは、細分化エッジの中点を新しい頂点として使用すること、左側の頂点から3分の1の位置を新しい頂点として使用することなどを含むがこれに限定されなく、それにより、第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、細分化エッジに対応する新しい頂点のターゲット特徴情報を取得するとき、具体的には、細分化エッジに対応する2つの元頂点のターゲット特徴情報を使用して、細分化エッジに対応する新しい頂点のターゲット特徴情報を取得する。
一開示された実施例において、細分化エッジの中点を新しい頂点として使用するとき、2つの元頂点のターゲット特徴情報の平均値を新しい頂点のターゲット特徴情報として使用する。したがって、細分化エッジの中点を新しい頂点として使用して、細分化エッジに対応する2つの元頂点のターゲット特徴情報を使用して、新しい頂点のターゲット特徴情報を取得することを容易にする。
ステップS245aにおいて、第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得する。
メッシュ細分化のとき、第1三次元メッシュモデルを第2三次元メッシュモデルに変形し、いくつかの可能な実施形態において、第2三次元メッシュモデルの頂点数は、第1三次元メッシュモデルより大きく、即ち、第2三次元メッシュモデルは、新しい頂点および第1三次元メッシュモデルの元頂点を含み、より多い頂点を介して、再構築される対象の特徴を反映して、粗いものから細かいものへの変形を実現する。理解され得るように、メッシュモデルの変形は、本回のメッシュ細分化前の三次元メッシュモデルを第1三次元メッシュモデルとして使用し続けて、第1三次元メッシュモデルを第2三次元メッシュモデルに変形し、反復にメッシュ細分化を実行して詳細を具現することができる。
第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得することができる。いくつかの可能な実施形態において、第2ニューラルネットワークを使用して、第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報を処理し、第1三次元メッシュモデルを第1三次元メッシュモデルに変形した後の各頂点の位置情報を取得し、それにより、第2ニューラルネットワークを使用して、第1三次元メッシュモデルを第2三次元メッシュモデルに変形することができる。ここで、位置情報は、位置オフセットを含むがこれに限定されない。第2ニューラルネットワークは、メッシュモデルの変形を実現できれば、深層学習を介して三次元メッシュモデルの各頂点の位置情報を取得する任意のニューラルネットワークであり、具体的には、第2ニューラルネットワークは、グラフ畳み込みニューラルネットワークを含むがこれに限定されない。グラフ畳み込みニューラルネットワークに含まれる入力層、暗黙層、出力層の次元数は、カスタマイズに設定することができ、ここでは特に限定しない。第2ニューラルネットワークは、各頂点位置情報を取得することができるニューラルネットワークであり、本ステップでは、ターゲット特徴情報に従って、第1三次元メッシュモデルに対して複数回の変形を実行し、第2三次元メッシュモデルの頂点位置を、再構築される対象実の頂点の位置に近いようにすることができる。
したがって、まず、第1三次元メッシュモデルを投影してターゲット特徴情報を取得し、その後、新しい頂点を追加し、第1三次元メッシュモデルの元頂点および新しい頂点を使用して細分化された第2三次元メッシュモデルを取得して、メッシュ細分化を実現し、再構築される対象の詳細を具現することができる。
一開示された実施例において、ローカルメッシュ細分化以外に、メッシュ細分化は、さらに、すべての三次元メッシュモデルに対応してグローバルメッシュ細分化を実行することを含む。図5に示されたように、本発明は、ターゲット画像の特徴情報を使用して、再構築される対象の顕著性領域を決定した後、三次元メッシュモデルを再構築するとき、顕著性領域に対してグローバルメッシュ細分化を実行することにおいて、ステップS24は、以下のステップを含む。
ステップS241bにおいて、本回のメッシュ細分化を実行する前の三次元メッシュモデルを第1三次元メッシュモデルとする。
ステップS242bにおいて、第1三次元メッシュモデルをターゲット画像が位置する平面に投影して、第1三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を決定する。
ステップS243bにおいて、第1三次元メッシュモデル内の各エッジをそれぞれ細分化エッジとして使用し、細分化エッジで少なくとも1つの新しい頂点を決定する。
第1三次元メッシュモデルに対してローカルメッシュ細分化を実行するとき、ターゲット領域が、少なくとも顕著性領域を含むことと異なり、本回のメッシュ細分化は、グローバルメッシュ細分化であり、ターゲット領域は、すべての第1三次元メッシュモデルに対応する。したがって、第1三次元メッシュモデル内の各エッジをそれぞれ細分化エッジとして使用し、細分化エッジで少なくとも1つの新しい頂点を決定するとよい。
ステップS244bにおいて、第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、細分化エッジに対応する新しい頂点のターゲット特徴情報を取得する。
ステップS245bにおいて、第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得する。
理解され得るように、グローバルメッシュ細分化は、ローカルメッシュ細分化のターゲット領域と異なり、ターゲット領域は、メッシュ細分化を実行する領域を指示する。本回のメッシュ細分化が、グローバルメッシュ細分化である場合、ターゲット領域は、すべての第1三次元メッシュモデルに対応し、本回のメッシュ細分化が、ローカルメッシュ細分化である場合、ターゲット領域は、少なくとも顕著性領域を含む。ステップS243bにおける第1三次元メッシュモデル内の各エッジをそれぞれ細分化エッジとして使用して、細分化エッジで少なくとも1つの新しい頂点を決定する以外に、グローバルメッシュ細分化の残りのステップS241b、ステップS242b、ステップS244bおよびステップS245bは、ローカルメッシュ細分化の関連する説明を参照でき、ここでは繰り返して説明しない。
グローバルメッシュ細分化に基づいて、粗いものから細かいものへの三次元メッシュ変形をするとき、すべての三次元メッシュモデルを均一に細分化して、三次元メッシュモデルの詳細精度を全体的に向上させることができる。ローカルメッシュ細分化に基づいて、三次元メッシュ変形をするとき、顕著性領域のみに対して、粗いものから細かいものへのメッシュ細分化を実行し、メッシュモデル変形に必要なストレージ消費を削減し、均一に細分化による最終的な三次元メッシュモデル過度平滑の問題をよりよく解决して、顕著性領域の詳細が、一定の豊富さを有するようにすることができる。
初期三次元メッシュモデルに対してメッシュ細分化を実行するとき、グローバルメッシュ細分化および/またはローカルメッシュ細分化を実行することができ、ここで、グローバルメッシュ細分化は、すべての三次元メッシュモデルに対応し、ローカルメッシュ細分化は、顕著性領域に対応し、グローバルメッシュ細分化およびローカルメッシュ細分化を実行する場合、グローバルメッシュ細分化およびローカルメッシュ細分化の順序と、各メッシュ細分化の回数は、すべて特に限定されない。
当業者は、具体的な実施形態の上記方法において、ステップの書き込み順序は、厳密な実行順序で、実装過程の制限となることではなく、各ステップの特定の実行順序は、その機能と可能性に基づくべきであることを理解することができる。
図6を参照すると、図6は、本発明の三次元メッシュモデルの再構築装置60の実施例のフレームワークの概略図である。三次元メッシュモデルの再構築装置60は、特徴抽出モジュール61、顕著性領域決定モジュール62、モデル構築モジュール63を備える。特徴抽出モジュール61は、ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得するように構成され、ここで、ターゲット画像は、再構築される対象を含み、顕著性領域決定モジュール62は、ターゲット特徴情報に基づいて、再構築される対象の顕著性領域を決定するように構成され、モデル構築モジュール63は、顕著性領域に従って、再構築される対象の最終的な三次元メッシュモデルを構築するように構成される。
上記の技術案において、特徴抽出モジュール61は、再構築される対象を含むターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得し、それにより、顕著性領域決定モジュール62は、ターゲット特徴情報を使用して、再構築される対象の顕著性領域を決定し、さらに、モデル構築モジュール63は、顕著性領域を取得した後、顕著性領域を使用して、再構築される対象の最終的な三次元メッシュモデルを構築することができる。
いくつかの実施例において、当該モデル構築モジュール63は、さらに、顕著性領域を使用して、再構築される対象の最終的な三次元メッシュモデルを構築するために、初期三次元メッシュモデル構築モジュールおよびモデル取得モジュールを備えることができる。例えば、図7を参照すると、図7は、本発明の三次元メッシュモデルの再構築装置70の別の実施例のフレームワークの概略図である。三次元メッシュモデルの再構築装置70は、特徴抽出モジュール71、顕著性領域決定モジュール72、初期三次元メッシュモデル構築モジュール73およびモデル取得モジュール74を備え、特徴抽出モジュール71は、ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得するように構成され、顕著性領域決定モジュール72は、ターゲット特徴情報に基づいて、再構築される対象の顕著性領域を決定するように構成され、初期三次元メッシュモデル構築モジュール73は、ターゲット特徴情報を使用して、再構築される対象の初期三次元メッシュモデルを構築するように構成され、モデル取得モジュール74は、初期三次元メッシュモデルに対してメッシュ細分化を実行し、再構築される対象の最終的な三次元メッシュモデルを取得するように構成され、ここで、メッシュ細分化は、対応する顕著性領域に対してローカルメッシュ細分化を実行することを含む。
上記の技術案において、顕著性領域決定モジュール72は、ターゲット画像のターゲット特徴情報を使用して、再構築される対象の顕著性領域を決定し、モデル取得モジュール74は、三次元メッシュモデルを再構築するとき、顕著性領域に対してメッシュ細分化を実行し、メッシュモデルの頂点数を減らし、顕著性領域におけるメッシュモデルの詳細が、一定の豊富さを有するようにする。即ち、対応する顕著性領域でローカルメッシュ細分化を実行するとき、顕著性領域は、再構築される対象のより多くの詳細を反映する領域であるため、顕著性領域に対してメッシュ細分化を実行することは、メッシュモデルの頂点数を減らすだけでなく、さらに、三次元メッシュモデルのデータに必要な記憶空間を減らし、再構築して得られた三次元メッシュモデルが、顕著性領域に対応して過度に平滑しないようにすることができ、詳細をよりよく具現することができ、それにより、より多くの詳細の三次元メッシュモデルを再構築することができる。
続けて図6を参照すると、一開示された実施例において、顕著性領域決定モジュール62は、変形ユニットおよび決定ユニットを備え、変形ユニットは、ターゲット特徴情報を使用して、基礎点群モデルを再構築される対象に対応するターゲット点群モデルに変形するように構成され、決定ユニットは、ターゲット点群モデルの顕著性領域を決定するように構成される。したがって、ターゲット特徴情報を使用して、再構築される対象詳細領域に対応する顕著性領域を取得して、点群モデルを変形して顕著性領域を取得することができる。
一開示された実施例において、変形ユニットは、ターゲット特徴情報を使用して、基礎点群モデルを再構築される対象に対応するターゲット点群モデルに変形するように構成されるとき、変形ユニットは、さらに、基礎点群モデルをターゲット画像が位置する平面に投影して、基礎点群モデル内の各点に対応するターゲット特徴情報を決定し、第1ニューラルネットワークを使用して、基礎点群モデル内の各点に対応するターゲット特徴情報を処理し、基礎点群モデルをターゲット点群モデルに変形した後の各点の位置情報を取得するように構成される。決定ユニットは、ターゲット点群モデルの顕著性領域を決定するように構成されるとき、さらに、ターゲット点群モデルの点分布状況を取得し、ターゲット点群モデルのうち、点分布状況が顕著性分布要求を満たす点群領域を検索して、顕著性領域として使用するように構成される。したがって、第1ニューラルネットワークにより群モデルの変形を実現し、ターゲット点群モデルの点分布状況を使用して、顕著性領域を決定する。
一開示された実施例において、変形ユニットは、さらに、基礎点群モデルをターゲット画像が位置する平面に投影するように構成される前に、さらに、単位球内で点を均一にサンプリングして、基礎点群モデルを取得するように構成され、基礎点群モデルをターゲット点群モデルに変形した後の各点の位置情報は、基礎点群モデルをターゲット点群モデルに変形した後の各点の位置オフセットであり、顕著性分布要求は、点分布密度がプリセットの密度値より大きいことを含み、顕著性領域内の点分布を密集させ、再構築される対象の詳細を具現できるようにする。
一開示された実施例において、顕著性領域決定モジュール62は、さらに、トレーニングして第1ニューラルネットワークを取得するように構成される、トレーニングユニットを備える。いくつかの可能な実施形態において、トレーニングユニットは、サンプル画像およびサンプル対象の実の三次元メッシュモデルを取得し、ここで、サンプル画像は、サンプル対象を含み、サンプル画像に対して特徴抽出を実行し、サンプル特徴情報を取得し、基礎点群モデルをサンプル画像が位置する平面に投影して、基礎点群モデル内の各点に対応するサンプル特徴情報を決定し、第1ニューラルネットワークを使用して、基礎点群モデル内の各点に対応するサンプル特徴情報を処理し、基礎点群モデルがサンプル点群モデルに変形された後の各点の位置情報を取得し、実の三次元メッシュモデルに対してメッシュ簡略化を実行し、簡略化三次元メッシュモデルを取得し、予測点群モデル内の、簡略化三次元メッシュモデルの各頂点にマッチングする点を検索して、いくつかのグループのマッチング点ペアを取得し、各グループのマッチング点ペアの位置差異を使用して、第1ニューラルネットワークのパラメータを調整するように構成される。したがって、実の三次元メッシュモデルを監視して、平坦な領域のパッチが少ないように保証し、簡略化された実の三次元メッシュモデルの頂点を監督信号としてトレーニングし、トレーニングして得られた第1ニューラルネットワークは、ターゲット点群モデルの各点の位置情報を出力することができる。
一開示された実施例において、モデル取得モジュール64は、決定ユニット、追加ユニット、取得ユニットを備える。モデル取得モジュール64は、初期三次元メッシュモデルに対してメッシュ細分化を実行し、再構築される対象の最終的な三次元メッシュモデルを取得するように構成されるとき、決定ユニットは、本回のメッシュ細分化の前の三次元メッシュモデルを第1三次元メッシュモデルとして使用するように構成され、さらに、第1三次元メッシュモデルをターゲット画像が位置する平面に投影して、第1三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を決定するように構成され、追加ユニットは、第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加するように構成され、ここで、本回のメッシュ細分化が、ローカルメッシュ細分化である場合、ターゲット領域は、少なくとも、顕著性領域を含み、取得ユニットは、第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、細分化エッジに対応する新しい頂点のターゲット特徴情報を取得するように構成され、取得ユニットは、さらに、第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得するように構成される。したがって、まず、第1三次元メッシュモデルを投影してターゲット特徴情報を取得し、次に新しい頂点を追加し、第1三次元メッシュモデルの元頂点及び新しい頂点を使用して、細分化された後の第2三次元メッシュモデルを取得し、これによって、メッシュ細分化を実現し、再構築される対象の詳細を具現する。
一開示された実施例において、本回のメッシュ細分化が、ローカルメッシュ細分化である場合、追加ユニットは、第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加するように構成されるとき、さらに、第1三次元メッシュモデルで、顕著性領域に位置する少なくとも1つのエッジを細分化エッジとして使用し、細分化エッジで少なくとも1つの新しい頂点を決定するように構成される。したがって、顕著性領域の少なくとも1つのエッジを細分化エッジとして使用して、細分化エッジで新しい頂点を取得し、それにより、ローカルメッシュ細分化するとき、新しい頂点を決定する。
一開示された実施例において、顕著性領域は、いくつかの顕著点を含み、追加ユニットは、第1三次元メッシュモデルで、顕著性領域に位置する少なくとも1つのエッジを細分化エッジとして使用するように構成されるとき、さらに、第1三次元メッシュモデルで、各顕著点に位置がプリセットの位置条件を満たすエッジを検索して、細分化されるエッジとして使用し、第1三次元メッシュモデルのうち、各エッジが細分化されるエッジとして決定される回数を統計し、細分化されるエッジの回数がプリセットの細分化条件を満たすエッジを細分化エッジとして使用するように構成される。プリセットの位置条件は、顕著点の位置と最も近いことであり、プリセットの細分化条件は、細分化されるエッジの回数が、プリセットの回数より大きいもの、または、第1三次元メッシュモデルのすべてのエッジの回数が、大きいものから小さいものの順のソートにおいて、細分化されるエッジの回数が前のプリセットの数または前のプリセットの比率内にあるものである。したがって、顕著性領域内の各顕著点に細分化されるエッジを検索し、顕著点が一定の位置関係を満たすエッジに投票し、票数が一定の細分化条件を満たすエッジを細分化エッジとして使用して、新しい頂点の数をさらに減らし、ストレージを減らし、さらに、顕著点と最も近いエッジに投票し、票数の前の一定の比率または前の一定の数のエッジを細分化エッジとして使用し、それにより、最終的な細分化エッジは顕著点と近くすることができ、新しい頂点は、再構築される対象の詳細位置により近接する。
一開示された実施例において、メッシュ細分化は、さらに、すべての三次元メッシュモデルに対応してグローバルメッシュ細分化を実行することを含み、本回のメッシュ細分化が、グローバルメッシュ細分化である場合、追加ユニットは、第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加するように構成されるとき、さらに、第1三次元メッシュモデル内の各エッジをそれぞれ細分化エッジとして使用し、細分化エッジで少なくとも1つの新しい頂点を決定するように構成される。したがって、メッシュ細分化は、さらに、すべての三次元メッシュモデルに対応してグローバルメッシュ細分化を実行することを含み、グローバルメッシュ細分化して得られたメッシュモデルは、全体として詳細化される。
一開示された実施例において、追加ユニットは、さらに、細分化エッジの中点を新しい頂点として使用するように構成され、取得ユニットは、第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、細分化エッジに対応する新しい頂点のターゲット特徴情報を取得するように構成されるとき、さらに、細分化エッジに対応する2つの元頂点のターゲット特徴情報を使用して、細分化エッジに対応する新しい頂点のターゲット特徴情報を取得するように構成される。したがって、細分化エッジの中点を新しい頂点として使用して、細分化エッジに対応する2つの元頂点のターゲット特徴情報を使用して、新しい頂点のターゲット特徴情報を取得することを容易にする。
一開示された実施例において、取得ユニットは、第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得するように構成されるとき、取得ユニットは、さらに、第2ニューラルネットワークを使用して、第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報を処理し、第1三次元メッシュモデルを第1三次元メッシュモデルに変形した後の各頂点の位置情報を取得するように構成される。したがって、第2ニューラルネットワークを使用して、第1三次元メッシュモデルを第2三次元メッシュモデルに変形する。
一開示された実施例において、初期三次元メッシュモデル構築モジュール63は、ターゲット特徴情報を使用して、再構築される対象の初期三次元メッシュモデルを構築するように構成されるとき、さらに、基礎三次元メッシュモデルをターゲット画像が位置する平面に投影して、基礎三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を決定し、第2ニューラルネットワークを使用して、基礎三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を処理し、基礎三次元メッシュモデルを初期三次元メッシュモデルに変形した後の各頂点の位置情報を取得するように構成され、ここで、各頂点の位置情報は、位置オフセットである。したがって、第2ニューラルネットワークを使用して、基礎三次元メッシュモデルを初期三次元メッシュモデルに変形して、再構築される対象を初期化し、再構築される対象の初期形状を具現することができる。
一開示された実施例において、ターゲット画像は、二次元画像であり、特徴抽出モジュール61は、第3ニューラルネットワークを使用して、ターゲット画像に対して特徴抽出を実行し、いくつかの次元の特徴情報を取得し、いくつかの次元の特徴情報を融合してターゲット特徴情報を取得するように構成され、ここで、ターゲット特徴情報は、特徴テンソルである。したがって、第3ニューラルネットワークを使用して二次元のターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を指示する特徴テンソルを取得する。
図8を参照すると、図8は、本発明の電子機器80の実施例のフレームワークの概略図である。電子機器80は、互いに結合されるメモリ81とプロセッサ82を備え、プロセッサ82は、メモリ81に記憶されるプログラム命令を実行し、上記の任意の1つの三次元メッシュモデルの再構築方法実施例のステップを実現するように構成される。一具体的な実施シナリオにおいて、電子機器80は、マイクロコンピュータ、サーバを含むがこれに限定されなく、なお、電子機器80は、さらに、ラップトップ、タブレットなどのモバイル機器を含み得、ここでは限定しない。
具体的には、プロセッサ82は、その自体およびメモリ81を制御して、上記の任意の1つの三次元メッシュモデルの再構築方法実施例のステップを実現し、または、上記の任意の1つの画像検出方法実施例におけるステップを実現するように構成される。プロセッサ82は、中央処理ユニット(CPU:Central Processing Unit)とも称し得る。プロセッサ82は、信号の処理能力を有する集積回路チップであり得る。プロセッサ82は、さらに、汎用プロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)、フィールドプログラマブルゲートアレイ(FPGA:Field-Programmable Gate Array)、または他のプログラマブルロジックデバイス、ディスクリートゲート、またはトランジスタロジックデバイス、ディスクリートハードウェアコンポーネントなどであってもよい。汎用プロセッサは、マイクロプロセッサであり得、または当該プロセッサは、任意の従来のプロセッサなどであり得る。さらに、プロセッサ82は、集積回路チップによって一緒に実現されることができる。
上記の技術案は、ターゲット画像のターゲット特徴情報を使用して、再構築される対象の顕著性領域を決定し、三次元メッシュモデルを再構築するとき、顕著性領域に対してメッシュ細分化を実行し、メッシュモデルの頂点数を減らし、顕著性領域におけるメッシュモデルの詳細が、一定の豊富さを有するようにする。
図9を参照すると、図9は、本発明のコンピュータ可読記憶媒体90の実施例のフレームワークの概略図である。コンピュータ可読記憶媒体90は、プロセッサによって実行されることができるプログラム命令901を記憶し、プログラム命令901は、上記の任意の1つの三次元メッシュモデルの再構築方法実施例のステップを実現するために使用される。
上記の技術案は、ターゲット画像のターゲット特徴情報を使用して、再構築される対象の顕著性領域を決定し、三次元メッシュモデルを再構築するとき、顕著性領域に対してメッシュ細分化を実行し、メッシュモデルの頂点数を減らし、顕著性領域におけるメッシュモデルの詳細が、一定の豊富さを有するようにする。
本発明の実施例による装置および機器が備える機能またはモジュールは、上記の方法の実施例で説明される方法を実行するために使用され得、特定の実現は、上記の方法の実施例における説明を参照することができ、簡潔にするために、ここで再び説明しないことを理解されたい。
上記の各実施例に対する説明は、各実施例の違いを強調する傾向があり、同じまたは類似性を互いに参照することができ、簡潔にするために、本明細書で再び説明しない。
本発明によるいくつかの実施例では、開示された方法および装置は、他の方法で実現されることができることを理解されたい。例えば、上記で説明された装置の実施形態は、例示的なものに過ぎず、例えば、モジュールまたはユニットの分割は、論理機能の分割に過ぎず、実際に実現することには、別の分割方式があり、例えば、ユニットまたはコンポーネントを別のシステムに統合または集積してもよいし、特徴の一部を無視するか実行しなくてもよい。さらに、表示または議論される相互結合、または直接結合、または通信接続は、いくつかのインターフェースを使用して実現することができ、装置またはユニット間の間接結合または通信接続は、電気的または機械的な形であってもよく、他の形であってもよい。
さらに、本発明の各実施例における各機能ユニットは、1つの処理ユニットに統合されてもよく、または各ユニットが、物理的に別々に存在してもよく、または2つまたは2つ以上のユニットが1つのユニットに統合されてもよい。前記統合されたユニットは、ハードウェアの形で実装されてもよく、ソフトウェア機能ユニットの形で実装されてもよい。
統合されたユニットが、ソフトウェア機能ユニットの形で実現され、かつ独立した製品として販売または使用される場合、コンピュータ可読記憶媒体に記憶されることができる。このような理解に基づいて、本発明の技術的解決策は、本質的にまたは先行技術に対して寄与する部分または前記技術的解決策のすべてまたは一部は、ソフトウェア製品の形で具現されることができ、当該コンピュータソフトウェア製品は、1つの記憶媒体に記憶され、1台のコンピュータ機器(パーソナルコンピュータ、サーバ、またはネットワーク機器等であり得る)またはプロセッサ(processor)に本発明の各実施形態の方法の全部または一部のステップを実行させるためのいくつかの命令を含む。上記した記憶媒体は、Uディスク、モバイルハードディスク、読み取り専用メモリ(ROM:Read-Only Memory)、ランダムアクセスメモリ(RAM:Random Access Memory)、磁気ディスクまたは光ディスクなどのプログラムコードを記憶することができる様々な媒体を含む。
本発明は、三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体を提供し、ここで、前記方法は、ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得することであって、ここで、前記ターゲット画像は、再構築される対象を含む、ことと、前記ターゲット特徴情報に基づいて、前記再構築される対象の顕著性領域を決定することと、前記顕著性領域に基づいて、前記再構築される対象の最終的な三次元メッシュモデルを構築することと、を含む。

Claims (18)

  1. 三次元メッシュモデルの再構築方法であって、
    ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得することであって、前記ターゲット画像は、再構築される対象を含む、ことと、
    前記ターゲット特徴情報に基づいて、前記再構築される対象の顕著性領域を決定することと、
    前記顕著性領域に基づいて、前記再構築される対象の最終的な三次元メッシュモデルを構築することと、を含む、三次元メッシュモデルの再構築方法。
  2. 前記ターゲット特徴情報に基づいて、前記再構築される対象の顕著性領域を決定することは、
    前記ターゲット特徴情報を使用して、基礎点群モデルを前記再構築される対象に対応するターゲット点群モデルに変形することと、
    前記ターゲット点群モデルの顕著性領域を決定することと、を含む、
    請求項1に記載の三次元メッシュモデルの再構築方法。
  3. 前記特徴情報を使用して、基礎点群モデルを前記再構築される対象に対応するターゲット点群モデルに変形することは、
    前記基礎点群モデルを前記ターゲット画像が位置する平面に投影して、前記基礎点群モデル内の各点に対応するターゲット特徴情報を決定することと、
    第1ニューラルネットワークを使用して、前記基礎点群モデル内の各点に対応するターゲット特徴情報を処理し、前記基礎点群モデルが前記ターゲット点群モデルに変形された後の各点の位置情報を取得することと、を含み、
    前記ターゲット点群モデルの顕著性領域を決定することは、
    前記ターゲット点群モデルの点分布状況を取得することと、
    前記ターゲット点群モデル内の、前記点分布状況が顕著性分布要求を満たす点群領域を検索して、前記顕著性領域として使用することと、を含む、
    請求項2に記載の三次元メッシュモデルの再構築方法。
  4. 前記基礎点群モデルを前記ターゲット画像が位置する平面に投影する前に、前記三次元メッシュモデルの再構築方法は、
    単位球内で点を均一にサンプリングして、前記基礎点群モデルを取得することをさらに含み、
    前記基礎点群モデルを前記ターゲット点群モデルに変形した後の各点の位置情報は、前記基礎点群モデルを前記ターゲット点群モデルに変形した後の各点の位置オフセットであり、
    前記顕著性分布要求は、点分布密度がプリセットの密度値より大きいことを含む、
    請求項3に記載の三次元メッシュモデルの再構築方法。
  5. 前記三次元メッシュモデルの再構築方法は、トレーニングして前記第1ニューラルネットワークを取得するために、
    サンプル画像およびサンプル対象の実の三次元メッシュモデルを取得することであって、前記サンプル画像は、前記サンプル対象を含む、ことと、
    前記サンプル画像に対して特徴抽出を実行し、サンプル特徴情報を取得することと、
    前記基礎点群モデルを前記サンプル画像が位置する平面に投影して、前記基礎点群モデル内の各点に対応する前記サンプル特徴情報を決定することと、
    第1ニューラルネットワークを使用して、前記基礎点群モデル内の各点に対応するサンプル特徴情報を処理し、前記基礎点群モデルが前記サンプル点群モデルに変形された後の各点の位置情報を取得することと、
    前記実の三次元メッシュモデルに対してメッシュ簡略化を実行し、簡略化三次元メッシュモデルを取得することと、
    前記予測点群モデル内の、前記簡略化三次元メッシュモデルの各頂点にマッチングする点を検索して、いくつかのグループのマッチング点ペアを取得することと、
    各グループのマッチング点ペアの位置差異を使用して、前記第1ニューラルネットワークのパラメータを調整することと、をさらに含む、
    請求項3または4に記載の三次元メッシュモデルの再構築方法。
  6. 前記顕著性領域に基づいて、前記再構築される対象の最終的な三次元メッシュモデルを構築することは、
    前記ターゲット特徴情報を使用して、前記再構築される対象の初期三次元メッシュモデルを構築することと、
    前記初期三次元メッシュモデルに対してメッシュ細分化を実行し、前記再構築される対象の前記最終的な三次元メッシュモデルを取得することであって、前記メッシュ細分化は、対応する前記顕著性領域に対してローカルメッシュ細分化を実行することを含む、ことと、を含む、
    請求項1ないし5のいずれか一項に記載の三次元メッシュモデルの再構築方法。
  7. 前記初期三次元メッシュモデルに対してメッシュ細分化を実行し、前記再構築される対象の前記最終的な三次元メッシュモデルを取得することは、
    本回のメッシュ細分化を実行する前の三次元メッシュモデルを第1三次元メッシュモデルとすることと、
    前記第1三次元メッシュモデルを前記ターゲット画像が位置する平面に投影して、前記第1三次元メッシュモデル内の各頂点に対応する前記ターゲット特徴情報を決定することと、
    前記第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加することであって、前記ターゲット領域は、前記顕著性領域を少なくとも含む、ことと、
    前記第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、前記細分化エッジに対応する新しい頂点のターゲット特徴情報を取得することと、
    前記第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得することと、を含む、
    請求項6に記載の三次元メッシュモデルの再構築方法。
  8. 本回のメッシュ細分化が、前記ローカルメッシュ細分化である場合、前記第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加することは、
    前記第1三次元メッシュモデルで、前記顕著性領域に位置する少なくとも1つのエッジを細分化エッジとして使用することと、
    前記細分化エッジで少なくとも1つの新しい頂点を決定することと、を含む、
    請求項7に記載の三次元メッシュモデルの再構築方法。
  9. 前記顕著性領域は、いくつかの顕著点を含み、前記第1三次元メッシュモデルで、前記顕著性領域に位置する少なくとも1つのエッジを細分化エッジとして使用することは、
    前記第1三次元メッシュモデルで、各前記顕著点に、プリセットの位置条件を満たすエッジを検索して細分化されるエッジとして使用することと、
    前記第1三次元メッシュモデルで、各エッジが前記細分化されるエッジとして決定される回数を統計することと、
    前記細分化されるエッジの回数がプリセットの細分化条件を満たすエッジを前記細分化エッジとして使用することと、を含む、
    請求項8に記載の三次元メッシュモデルの再構築方法。
  10. 前記プリセットの位置条件は、前記顕著点の位置と最も近いことであり、
    前記プリセットの細分化条件は、前記細分化されるエッジの回数が、プリセットの回数より大きいもの、または、前記第1三次元メッシュモデルのすべてのエッジの回数が、大きいものから小さいものの順のソートにおいて、前記細分化されるエッジの回数が前のプリセットの数または前のプリセットの比率内にあるものである、
    請求項9に記載の三次元メッシュモデルの再構築方法。
  11. 前記メッシュ細分化は、さらに、対応する前記すべての三次元メッシュモデルに対してグローバルメッシュ細分化を実行することを含み、本回のメッシュ細分化が、前記グローバルメッシュ細分化である場合、前記第1三次元メッシュモデルのターゲット領域に少なくとも1つの新しい頂点を追加することは、
    前記第1三次元メッシュモデル内の各エッジをそれぞれ細分化エッジとして使用することと、
    前記細分化エッジで少なくとも1つの新しい頂点を決定することと、を含む、
    請求項6ないし10のいずれか一項に記載の三次元メッシュモデルの再構築方法。
  12. 前記細分化エッジで少なくとも1つの新しい頂点を決定することは、
    前記細分化エッジの中点を前記新しい頂点として使用することを含み、
    前記第1三次元メッシュモデルの元頂点のターゲット特徴情報を使用して、前記細分化エッジに対応する新しい頂点のターゲット特徴情報を取得することは、
    前記細分化エッジに対応する2つの前記元頂点のターゲット特徴情報を使用して、前記細分化エッジに対応する新しい頂点のターゲット特徴情報を取得することを含む、
    請求項11に記載の三次元メッシュモデルの再構築方法。
  13. 前記第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報に基づいて、本回のメッシュ細分化された第2三次元メッシュモデルを取得することは、
    第2ニューラルネットワークを使用して、前記第1三次元メッシュモデルの元頂点および新しい頂点のターゲット特徴情報を処理し、前記第1三次元メッシュモデルを前記第1三次元メッシュモデルに変形した後の各頂点の位置情報を取得することを含む、
    請求項7ないし12のいずれか一項に記載の三次元メッシュモデルの再構築方法。
  14. 前記ターゲット特徴情報を使用して、前記再構築される対象の初期三次元メッシュモデルを構築することは、
    基礎三次元メッシュモデルを前記ターゲット画像が位置する平面に投影して、前記基礎三次元メッシュモデル内の各頂点に対応する前記ターゲット特徴情報を決定することと、
    第2ニューラルネットワークを使用して、前記基礎三次元メッシュモデル内の各頂点に対応するターゲット特徴情報を処理し、前記基礎三次元メッシュモデルを前記初期三次元メッシュモデルに変形した後の各頂点の位置情報を取得することと、を含み、
    前記各頂点の位置情報は、位置オフセットである、
    請求項6ないし13のいずれか一項に記載の三次元メッシュモデルの再構築方法。
  15. 前記ターゲット画像は、二次元画像である、および/または、
    前記ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得することは、
    第3ニューラルネットワークを使用して、ターゲット画像に対して特徴抽出を実行し、いくつかの次元の特徴情報を取得することと、
    前記いくつかの次元の特徴情報を融合してターゲット特徴情報を取得することと、を含み、前記ターゲット特徴情報は、特徴テンソルである、
    請求項1ないし14のいずれか一項に記載の三次元メッシュモデルの再構築方法。
  16. 三次元メッシュモデルの再構築装置であって、
    ターゲット画像に対して特徴抽出を実行し、ターゲット特徴情報を取得するように構成される、特徴抽出モジュールであって、前記ターゲット画像は、再構築される対象を含む、特徴抽出モジュールと、
    前記ターゲット特徴情報に基づいて、前記再構築される対象の顕著性領域を決定するように構成される、顕著性領域決定モジュールと、
    前記顕著性領域に基づいて、前記再構築される対象の最終的な三次元メッシュモデルを構築するように構成される、モデル構築モジュールと、を備える、三次元メッシュモデルの再構築装置。
  17. 互いに結合されるメモリとプロセッサとを備える電子機器であって、前記プロセッサは、前記メモリに記憶されるプログラム命令を実行し、請求項1ないし15のいずれか一項に記載の三次元メッシュモデルの再構築方法を実施する、電子機器。
  18. プロセッサによって実行されるとき、前記プロセッサに請求項1ないし15のいずれか一項に記載の三次元メッシュモデルの再構築方法を実行させるためのプログラム命令を記憶した、コンピュータ可読記憶媒体。
JP2021568963A 2020-07-20 2021-03-01 三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体 Active JP7395617B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010699880.1A CN111882666B (zh) 2020-07-20 2020-07-20 三维网格模型的重建方法及其装置、设备、存储介质
CN202010699880.1 2020-07-20
PCT/CN2021/078485 WO2022016867A1 (zh) 2020-07-20 2021-03-01 三维网格模型的重建方法及其装置、设备、存储介质

Publications (2)

Publication Number Publication Date
JP2022545141A true JP2022545141A (ja) 2022-10-26
JP7395617B2 JP7395617B2 (ja) 2023-12-11

Family

ID=73154922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021568963A Active JP7395617B2 (ja) 2020-07-20 2021-03-01 三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体

Country Status (5)

Country Link
JP (1) JP7395617B2 (ja)
KR (1) KR20220028010A (ja)
CN (1) CN111882666B (ja)
TW (1) TW202205215A (ja)
WO (1) WO2022016867A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111882666B (zh) * 2020-07-20 2022-06-21 浙江商汤科技开发有限公司 三维网格模型的重建方法及其装置、设备、存储介质
CN113298948B (zh) * 2021-05-07 2022-08-02 中国科学院深圳先进技术研究院 三维网格重建方法、装置、设备及存储介质
CN113238249B (zh) * 2021-05-17 2021-12-28 湖南力研光电科技有限公司 一种水下实时三维成像方法及雷达装置
CN113706431B (zh) * 2021-08-26 2022-10-21 深圳市慧鲤科技有限公司 模型优化方法及相关装置、电子设备和存储介质
CN114741918B (zh) * 2022-02-24 2024-02-23 西北大学 一种面向遗址劣化有限元分析的并行网格剖分方法
CN114677473A (zh) * 2022-02-25 2022-06-28 河南中原动力智能制造有限公司 三维模型的重建方法、装置、设备及存储介质
CN114758337B (zh) * 2022-06-16 2022-10-28 山东海量信息技术研究院 一种语义实例重建方法、装置、设备及介质
CN116680778B (zh) * 2023-04-27 2024-03-12 清华大学 建筑结构布置生成方法、系统及生成模型的构建方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018530045A (ja) * 2015-08-14 2018-10-11 トムソン ライセンシングThomson Licensing 一連のイメージからのオブジェクトの3d再構成のための方法、一連のイメージからのオブジェクトの3d再構成を実行するように構成されたコンピュータ読取可能記憶媒体及び装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8350850B2 (en) * 2008-03-31 2013-01-08 Microsoft Corporation Using photo collections for three dimensional modeling
CN105590335A (zh) * 2014-10-23 2016-05-18 富泰华工业(深圳)有限公司 点云网格精细化系统及方法
CN106355646B (zh) * 2016-09-13 2019-10-01 广州市香港科大霍英东研究院 应用于图像处理的表面细化方法、装置以及系统
CN108765550B (zh) * 2018-05-09 2021-03-30 华南理工大学 一种基于单张图片的三维人脸重建方法
CN109191584B (zh) * 2018-08-16 2020-09-18 Oppo广东移动通信有限公司 三维模型处理方法、装置、电子设备及可读存储介质
CN109035380B (zh) * 2018-09-11 2023-03-10 北京旷视科技有限公司 基于三维重建的人脸修饰方法、装置、设备及存储介质
CN110443810B (zh) * 2019-07-17 2022-09-16 北京建筑大学 基于快速邻接体素查询的点云平面分割方法
CN111882666B (zh) * 2020-07-20 2022-06-21 浙江商汤科技开发有限公司 三维网格模型的重建方法及其装置、设备、存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018530045A (ja) * 2015-08-14 2018-10-11 トムソン ライセンシングThomson Licensing 一連のイメージからのオブジェクトの3d再構成のための方法、一連のイメージからのオブジェクトの3d再構成を実行するように構成されたコンピュータ読取可能記憶媒体及び装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NANYANG WANG, ET AL.: "Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images", ARXIV, JPN6022049620, 3 August 2018 (2018-08-03), ISSN: 0004932650 *
OMAR SEDDATI, ET AL.: "Towards Good Practices for Image Retrieval Based on CNN Features", 2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION WORKSHOPS, JPN6022049621, 29 October 2017 (2017-10-29), pages 1246 - 1255, XP033303575, ISSN: 0004932651, DOI: 10.1109/ICCVW.2017.150 *
PRIYANKA MANDIKAL, ET AL.: "Dense 3D Point Cloud Reconstruction Using a Deep Pyramid Network", 2019 IEEE WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION, JPN6022049622, 11 January 2019 (2019-01-11), pages 1052 - 1060, XP033525804, ISSN: 0004932652, DOI: 10.1109/WACV.2019.00117 *
YONGZHI WANT, ET AL.: "Fast Mesh Simplification Method for Three-Dimensional Geometric Models with Feature-Preserving Effic", SCIENTIFIC PROGRAMMING, HINDAWI, vol. Volume 2019, Article ID 4926190, JPN6022049623, 3 February 2019 (2019-02-03), ISSN: 0004932653 *

Also Published As

Publication number Publication date
TW202205215A (zh) 2022-02-01
CN111882666A (zh) 2020-11-03
KR20220028010A (ko) 2022-03-08
WO2022016867A1 (zh) 2022-01-27
JP7395617B2 (ja) 2023-12-11
CN111882666B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
JP7395617B2 (ja) 三次元メッシュモデルの再構築方法およびその装置、機器、並びに記憶媒体
US11900256B2 (en) Deep learning system
CN110494895B (zh) 使用稀疏体积数据的渲染操作
CN107730503B (zh) 三维特征嵌入的图像对象部件级语义分割方法与装置
CN111784821B (zh) 三维模型生成方法、装置、计算机设备及存储介质
WO2022193335A1 (zh) 点云数据处理方法、装置、计算机设备和存储介质
CN111598111B (zh) 三维模型生成方法、装置、计算机设备及存储介质
CN112328715A (zh) 视觉定位方法及相关模型的训练方法及相关装置、设备
CN111310821A (zh) 多视图特征融合方法、系统、计算机设备及存储介质
CN115965840A (zh) 图像风格迁移和模型训练方法、装置、设备和介质
EP4386579A1 (en) Retrieval model training method and apparatus, retrieval method and apparatus, device and medium
US20220375179A1 (en) Virtual object construction method, apparatus and storage medium
CN114742956B (zh) 模型处理方法、装置、设备及计算机可读存储介质
CN112348056A (zh) 点云数据分类方法、装置、设备及可读存储介质
TW202240531A (zh) 影像生成、三維人臉模型生成的方法、裝置、電子設備及儲存媒體
CN114677350A (zh) 连接点提取方法、装置、计算机设备及存储介质
CN115115724A (zh) 图像处理方法、装置、计算机设备及存储介质
Chen et al. Polydiffuse: Polygonal shape reconstruction via guided set diffusion models
CN112069412A (zh) 信息推荐方法、装置、计算机设备及存储介质
CN114492761A (zh) 编码模型的获取方法、聚类方法、装置、设备及介质
WO2024066697A1 (zh) 一种图像处理方法和相关装置
CN110019982B (zh) 节点坐标的确定方法以及装置
CN115471613A (zh) 人脸模型的生成方法、装置、设备及存储介质
Hart Selection-Based Convolution for Irregular Images and Graph Data
CN115512048A (zh) 图像重建方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211117

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231129

R150 Certificate of patent or registration of utility model

Ref document number: 7395617

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150