JP2018534705A - 3次元画像のための三角形メッシュの生成 - Google Patents

3次元画像のための三角形メッシュの生成 Download PDF

Info

Publication number
JP2018534705A
JP2018534705A JP2018534020A JP2018534020A JP2018534705A JP 2018534705 A JP2018534705 A JP 2018534705A JP 2018534020 A JP2018534020 A JP 2018534020A JP 2018534020 A JP2018534020 A JP 2018534020A JP 2018534705 A JP2018534705 A JP 2018534705A
Authority
JP
Japan
Prior art keywords
tree
region
regions
image
triangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018534020A
Other languages
English (en)
Other versions
JP6927980B2 (ja
Inventor
ファーレカンプ,クリスティアーン
リュック エルス ファンデワーレ,パトリック
リュック エルス ファンデワーレ,パトリック
クローン,バルト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2018534705A publication Critical patent/JP2018534705A/ja
Application granted granted Critical
Publication of JP6927980B2 publication Critical patent/JP6927980B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/005Tree description, e.g. octree, quadtree
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)
  • Processing Or Creating Images (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

装置は3次元画像の三角形メッシュを生成するように構成される。この装置は、深度マップを提供する深度マップ源(101)を含み、ツリー生成器(105)が深度マップのk−Dツリーを生成する。k−Dツリーは、非分割領域の深度変動尺度が閾値より小さいとの制約を満たす深度マップの階層的領域構成を表す。三角形メッシュ生成器(107)は、内部頂点をk−Dツリーの各領域内に配置する。次いで、三角形メッシュが、三角形メッシュの三角形の辺を隣接する非分割領域の内部頂点間を結ぶ線として形成することにより生成される。このアプローチにより、多くの3次元ビデオ処理アルゴリズムに適した改良された三角形メッシュが生成され得る。

Description

本発明は、3次元画像用の三角形メッシュの生成に関し、特に、排他的ではないが、2次元画像および深度マップによって表される3次元画像用の三角形メッシュの生成に関する。
3次元(3D)ディスプレイは、視者の2つの目に視聴されているシーンの異なるビューを提供することによって、視体験に第3の次元を加える。これは、ユーザに、表示される2つのビューを分離する眼鏡をかけさせることによって達成することができる。しかし、これはユーザにとって不便であると考えられるので、多くのシナリオでは、ディスプレイにおいて、(レンチキュラレンズやバリアなどの)手段を使用してビューを分離し、異なる方向にビューを送り、ビューが個別にユーザの目に届くオートステレオスコピックディスプレイを使用することが好ましい。ステレオディスプレイの場合、2つのビューが必要であるのに対して、オートステレオスコピックディスプレイは、一般により多くのビュー(例えば、9つのビューなど)を必要とする。
3D機能性を実現するためには、3次元情報の効果的な表現および処理を利用できることが重要である。広く使用されている手法の1つは、適切なアルゴリズムによって処理および操作できる3次元オブジェクトによって3次元情報を表現することである。
多くのシナリオで特に効果的なアプローチは、共通のエッジまたはコーナーによってポリゴンのセットが接続されるポリゴンメッシュによってイメージオブジェクトを表現することである。共通のエッジまたはコーナーは3次元の位置によって与えられる。従って、結合された3次元ポリゴンメッシュは、場合によっては画像全体の3次元記述を含む3次元オブジェクトの有効なモデルを提供する。ポリゴンメッシュは、多くの場合、3D空間で共通のコーナーを持つ三角形で形成された三角形メッシュである。
そのような表現では、ポリゴンメッシュを使用してオブジェクトの3次元形状の情報を提供するが、テクスチャは通常、別個のデータ構造として提供される。具体的には、テクスチャは、処理アルゴリズムによって3次元ジオメトリ上に重ねることができる別個の2次元マップとして提供されることが多い。
三角形メッシュの使用は、コンピュータグラフィックスアルゴリズムによる処理および操作に特に適しており、多くの効率的なソフトウェアおよびハードウェアソリューションが開発され、市販されている。システムの多くで、各ポリゴンを別々に処理するのではなく、複数のポリゴンに共通の個々の頂点を処理するアルゴリズムによって、高い計算効率が達成される。例えば、典型的な三角形メッシュの場合、個々の頂点は複数の(多くの場合3ないし8個の)三角形に共通することが多い。したがって、単一の頂点の処理は、比較的多数の三角形に適用可能であり、それによって、処理されている画像その他のオブジェクト内の点の数が大幅に削減される。
特定の例として、現在の多くのシステムオンチップ(SoC)は、3Dグラフィックスの処理に高度に最適化されたグラフィック処理ユニット(GPU)を含む。例えば、3Dオブジェクトジオメトリおよび3Dオブジェクトテクスチャの処理は、いわゆるOpenGLレンダリングパイプライン(またはDirectXなどの他の多くのAPI)において、2つの大きく異なるパスを使用して行われる。SoC上のGPUのハードウェアは、3Dソースが頂点(通常は三角形)とテクスチャの形でGPUに提示されている限り、3Dグラフィックスを効率的に処理できる。OpenGLアプリケーションインターフェイスでは、3Dオブジェクトが2Dスクリーンにどのように投影されるかを決定する仮想パースペクティブカメラの設定と制御が可能になる。OpenGLは3Dオブジェクトを入力として使用するが、出力は通常、通常の2Dディスプレイにおける2D画像である。
しかしながら、このようなアプローチは多くのシナリオにおいて魅力的であるが、3次元情報はポリゴンメッシュおよび関連するテクスチャ情報によって提供されることが必要である。しかしながら、多くの用途において、3次元画像データは、例えば画像及び深度マップなどの異なるフォーマットで提供され得る。
実際、広く使用されている3Dフォーマットは、一般にポストプロダクションで制作された、ステレオビデオから推定された、またはデプスカメラ(depth camera)を使用してキャプチャされた深度マップを有するビデオである。別のよく使用される3Dフォーマットは、左目および右目のビューに対応するステレオ画像を使用するものである。このような頻繁に使用されるフォーマットには、ポリゴンやテクスチャで表される静的オブジェクトは含まれない。
したがって、そのようなアプリケーションでは、ビデオプラスデプス(またはステレオ画像)フォーマットの、例えばOpenGLアルゴリズムを用いた再生に直接的に好適であるポリゴンメッシュおよびテクスチャ画像からなるフォーマットへの変換を実行することが望ましい。
しかしながら、そのような変換は、簡単なものではなく、多くの複雑な問題と課題を抱えています。具体的には、深度マップ(又はステレオ画像)を有する画像を(ポリゴンメッシュで表される)ジオメトリ及びテクスチャに変換するために、深度マップを、各頂点がx、y及びz座標を有する頂点を有するポリゴンのセットに変換する必要がある。さらに、変換は、典型的には、各頂点がビデオテクスチャ上のどこにマップするかを指定する、いわゆるu、v−テクスチャ座標を決定することができる。これらの(u、v)パラメータは、例えば、投影行列を使用して(x、y)パラメータから求めることができ、またはその逆もできる。
このようなポリゴンマップへの変換を実行するには様々な方法がある。多くの用途において、変換の好ましい特性は次を含む:
− ポリゴンは、各u、vテクスチャ座標が3Dポリゴンメッシュ上の固有の位置にマップされるメッシュを形成する必要がある。
− メッシュは穴なしで連続している必要がある。
− ポリゴンは深度マップを正確にモデル化しなければならない。
− GPUの負荷を制限するには、ポリゴンの数を少なくしなければならない;
− 深度マップからポリゴンを抽出するアルゴリズムは、低複雑性でなければならない;
− 好ましくは、変換は、クライアント側またはサーバ側で実行することができる。
しかしながら、画像からポリゴンメッシュを生成する既知のアルゴリズムは、最適ではなく、不完全さに悩まされる傾向がある。したがって、3次元画像用の三角形メッシュを生成する改良された手法が有利であり、特に、柔軟性の向上、精度の向上、より一貫性がありおよび/または連続した三角形メッシュ、複雑さの低減、改善された計算効率、後続のグラフィックス処理に適した表現、グラフィックス処理の既存のアプローチとの互換性の向上、および/または改善された性能が可能なアプローチが有利である。
従って、本発明は、好ましくは、単独でまたは組み合わされて、上記の1つ以上の不利な点を緩和もしくは解消するものである。
本発明の一態様により提供される装置は、3次元画像の三角形メッシュを生成する装置であって、深度マップを提供する深度マップ源と、前記深度マップのk−Dツリーを生成するツリー生成器であって、前記k−Dツリーが、非分割領域の深度変動尺度が閾値より小さいとの要件を満たす前記深度マップの階層的領域構成を表す、ツリー生成器と、内部頂点を前記k−Dツリーの各非分割領域内に配置し、前記三角形メッシュの三角形の辺を、隣接する非分割領域の内部頂点間の線として構成することにより、前記三角形メッシュを生成するように構成された三角形メッシュ生成器とを有する。
本発明により、改良された三角形メッシュが生成され得る。本アプローチにより、多くの実施形態において、より正確及び/又は高画質の3次元画像またはビデオ処理及びレンダリングが実現され得る。多くのシナリオにおいて、三角形メッシュを生成する効率的なアプローチを提供しつつ、正確かつ一貫性があり穴の無い三角形メッシュを生成できる。多くの実施形態において、複雑性及び/又はリソース使用量を低減し得る。
深度マップは3次元画像の深度マップを提供し得る。3次元画像は深度マップと2次元画像とにより表され得る。3次元画像はより大きい3次元画像の一部であってもよく、例えば、より大きい画像中の3次元オブジェクトの表現であってもよい。 深度マップは3次元画像の一部の深度マップであってもよい。三角形メッシュは部分的なものであってもよく、3次元画像の一部のみに対して生成されてもよい。特に、深度マップは画像の3次元オブジェクト(のみ)に対して提供されてもよく、三角形メッシュは画像の3次元オブジェクト(のみ)に対して生成されてもよい。
ツリー生成器105は、領域の深度変動尺度が閾値より大きいことの検出に応じて、その領域をサブ領域に分割するように構成され得る。閾値は適応的閾値であってもよい。例えば、領域の閾値はその領域のサイズに依存してもよい。
k−Dツリーは階層ツリーであってもよく、各ノードが深度マップの領域を表し、親ノードの子ノードが、その親ノードにより表される領域のサブ領域を表してもよい。複数の領域は具体的に少なくとも一点において接触していれば、隣接していると言って良い。
k−Dツリーは、深度変動尺度が閾値より小さいとの要件をすべての非分割領域が満たすまで、領域を、より小さいサブ領域(subregions)に反復的に分割することにより生成され得る。このように、k−Dツリーの最小領域の場合、深度変動尺度は閾値より小さく、深度は非分割領域において比較的一定であると考え得る。
内部頂点は領域内に配置され、それゆえその領域に完全に取り囲まれている。内部頂点は、1つの領域のみと接触し、それゆえ二以上の領域間の辺や境界や接合部には配置されない。三角形メッシュは、少なくとも2つの隣接する非分割領域の内部頂点間に形成される辺を有する少なくとも1つの三角形を含み得る。したがって、この三角形は少なくとも2つの隣接した非分割領域の一部を含むように形成され、すなわちこの三角形は少なくとも2つの領域の一部にわたり、完全に1つの領域内には制約されない。
多くの実施形態において、三角形メッシュのすべての三角形は、内部頂点間で辺を形成することにより生成される。多くの実施形態において、少なくとも1つの三角形は、3つの隣接する非分割領域の3つの内部頂点である三角形のコーナー、角または頂点により形成される。多くの実施形態において、三角形メッシュの少なくとも一部のすべての三角形は、3つの隣接する非分割領域の内部頂点として決められたコーナー、角または頂点をそれぞれが有する複数の三角形により形成されている。
三角形メッシュは、複数の三角形の連続的な3次元メッシュであってもよい。
幾つかの実施形態では、k−Dツリーは、ある位置に対して、その位置が含まれる領域の寸法(具体的にはサイズ)を示す値を有する深度マップに対応する2次元マップにより表されてもよい。
本発明の任意的な一特徴によると、領域の内部頂点は前記領域の中心に配置される。
これにより多くのシナリオで、有利な三角形メッシュが生成できるようになる一方、オペレーションが容易になる。特に、多くのシナリオで、連続的な三角形メッシュを直接生じ得る複数の頂点の生成を簡単にできる。特に、正方形領域を用いる四分木の場合、本アプローチにより確実に、連続した三角形メッシュを生成することができる。したがって、領域の頂点は、領域の幾何学的中心に位置することができる。
本発明の任意的な一特徴によると、前記三角形メッシュ生成器は、3つの領域間の各接合部に対し、前記三角形が前記3つの領域の内部頂点を接続する辺を有する三角形を形成するように構成される。
これにより、多くのシナリオにおいて、複雑性とリソース使用量を低く抑えながら、改良された三角形メッシュを生成できる。多くのタイプのk−Dツリーについて、このアプローチにより(自動的に)、連続的な三角形メッシュが生成され得る。例えば、正方形領域を用いる四分木の場合、このアプローチにより、3つの領域間の接合部に対して連続的にフィットした三角形(continuously fitting triangles)を生成してもよい。
本発明の任意的な一特徴によると、前記三角形メッシュ生成器は、4つの領域間の各接続部に対して2つの三角形を形成するように構成され、前記2つの三角形は前記4つの領域の対角線対向する2つの領域の頂点を結ぶ共通辺を有し、1つの三角形は、前記対角線対向する2つの領域の内部頂点を前記4つの領域のうちの第3の領域の内部頂点と結ぶ辺を有するように形成され、1つの三角形は、前記対角線対向する2つの領域の内部頂点を前記4つの領域のうちの第4の領域の内部頂点と結ぶ辺を有するように形成される。
これにより、多くのシナリオにおいて、複雑性とリソース使用量を低く抑えながら、改良された三角形メッシュを生成できる。多くのタイプのk−Dツリーについて、このアプローチにより(自動的に)、連続的な三角形メッシュが生成され得る。例えば、正方形領域を用いる四分木の場合、このアプローチにより、4つの領域間の接合部に対して連続的にフィットした三角形(continuously fitting triangles)を生成してもよい。
三角形メッシュ生成器は、2つの三角形が、4つの領域の対角線対向した2つの領域の頂点を結ぶ共通辺と、4つの領域のうちの第3の領域および第4の領域に対角線対向する2つの涼気の頂点を接続する辺とを有する、4つの領域間に各接合部の2つの三角形を形成するように構成され得る。
本発明の任意的な一特徴によると、k−Dツリーは四分木である。
これにより、多くの実施形態において実装が特に効率的になる一方、三角形メッシュを決定するのに有用な非常に正確なk−Dツリーが生成できる。
本発明の任意的な一特徴によると、前記ツリー生成器はさらに前記3次元画像の輝度またはクロマ特性に応じて領域を分割するように構成される。
これにより、改良されたk−Dツリーが生成され、それにより、改良された三角形メッシュが生成され得る。
本発明の任意的な一特徴によると、前記ツリー生成器は、正方形領域であることに制約されない矩形領域を有するk−Dツリーを生成するように構成される。
多くのシナリオにおいて、これにより三角形メッシュの改良が可能となる。特に、多くのシナリオでは、k−Dツリーの深度マップへのより密なフィッティングが可能となり、これにより、多くのシナリオでは、生成される領域がより少なくなり、三角形がより少ない三角形メッシュが得られる。これによりさらに、三角形メッシュに基づくその後のビデオ処理が容易になり得る。
ツリー生成器はこのように多くの実施形態では、矩形領域が正方形であるとの制約を受けずに、矩形領域を生成できる。
幾つかの実施形態では、ツリー生成器とメッシュ生成器とのうち少なくとも一方は、接合部を形成する3つの領域の三角形がその接合部を取り囲んでいないことの検出に応じて、少なくとも1つの領域を分割するように構成される。
これは、連続的な三角形メッシュの生成を支援し得る(または幾つかのシナリオにおいて、連続的な三角形メッシュが生成されるようにし得る)。このアプローチは、効率的な実装を可能にすることができ、多くの実施形態では、複雑さの低いおよび/またはリソースの要求の低い実装を提供することができる。
本発明の任意的な一特徴によると、前記ツリー生成器は、分割に続き3つの領域により形成される各接合部が前記接合部を含むとの制約の下に領域を分割するように構成される。
これは、連続的な三角形メッシュの生成を支援し得る(または幾つかのシナリオにおいて、連続的な三角形メッシュが生成されるようにし得る)。このアプローチは、効率的な実装を可能にすることができ、多くの実施形態では、複雑さの低いおよび/またはリソースの要求の低い実装を提供することができる。
幾つかの実施形態では、ツリー生成器は、第1の領域の近傍である第2の領域と、その分割に起因する2つのサブ領域との間の接合部の評価により、第1の領域を分割するように構成され、
前記評価は、以下の評価のうちの少なくとも1つを含む:第1の領域と第2の領域の共通辺と、第2の領域の頂点から第2の領域から遠い第1の領域のコーナーまでの線との間の交点が、接合部よりそのコーナーに近いかどうかの評価と;第2の領域の頂点と、2つのサブ領域の頂点との間の線が、第1の領域と第2の領域との間の共通辺と交わるかどうかの評価と;接合部が第1の領域および第2の領域の共通辺の外側にあるかどうかの評価。
これは、連続的な三角形メッシュの生成を支援し得る(または幾つかのシナリオにおいて、連続的な三角形メッシュが生成されるようにし得る)。このアプローチは、効率的な実装を可能にすることができ、多くの実施形態では、複雑さの低いおよび/またはリソースの要求の低い実装を提供することができる。
本発明の任意的な一特徴によると、前記ツリー生成器は送信器の一部であり、前記三角形メッシュ生成器は受信器の一部であり、前記送信器は前記3次元画像を表す画像データストリームを生成し、前記k−Dツリーを前記画像データストリームに符号化するように構成され、前記受信器は前記画像データストリームから前記k−Dツリーを取り出し、前記三角形メッシュ生成器に提供するように構成される。
このアプローチは、多くのシナリオにおいて3次元情報の非常に効率的な通信を可能にすることができる。多くの実施形態では、このアプローチは、サーバ側(画像送信器)とクライアント側(画像受信器)との間の機能性および計算資源使用の特に有利な分布をもたらし得る。
三角形メッシュ生成器は、頂点を前記取り出されたk−Dツリーの各領域内に配置し、前記三角形メッシュの三角形の辺を、取り出されたk−Dツリーの隣接する領域の頂点間の線として形成することにより、前記三角形メッシュを生成するように構成され得る。
本発明の任意的な一特徴によると、前記送信器は、前記k−Dツリーに画像符号化を適用して符号化k−Dツリーを生成し、前記符号化k−Dツリーを前記画像データストリームに含めるように構成される。
このアプローチは、多くのシナリオにおいて3次元情報の非常に効率的な通信を可能にすることができる。特に、多くの実施形態では、このアプローチは、既存のビデオ符号化フォーマットおよび機能性を再利用することができ、または三角形メッシュに関連する情報を運ぶように容易に適合させることができる。
幾つかの実施形態では、送信器は、k−Dツリーにカラーまたは輝度チャネル符号化を適用し、得られた符号化データを画像データストリームに含めるように構成することができる。
幾つかの実施形態では、画像符号化は、複数のチャネルを含む符号化された画像表現を提供し、送信器は、複数のチャネルの第1のチャネルで深度マップを符号化し、k−Dツリーを少なくとも複数のチャネルの第2のチャネルで符号化するように構成される。
このアプローチは、多くのシナリオにおいて3次元情報の非常に効率的な通信を可能にすることができる。特に、多くの実施形態では、このアプローチは、既存のビデオ符号化フォーマットおよび機能性を再利用することができ、または三角形メッシュに関連する情報を運ぶように容易に適合させることができる。
幾つかの実施形態では、送信器は、輝度チャネルおよび少なくとも1つのカラーチャネルを含むビデオ表現を符号化するように構成されたビデオエンコーダを備え、送信器は、深度マップを輝度チャネルに符号化し、k−Dツリーを少なくとも1つのカラーチャネルに符号化するように構成される。
幾つかの実施形態では、画像符号化は、少なくとも2つのカラーチャネルを含む符号化画像表現を提供し、送信器は、k−Dツリーの垂直領域情報を、少なくとも2つのカラーチャネルのうちの1つのカラーチャネルに符号化し、k−Dツリーの水平領域情報を、少なくとも2つのカラーチャンネルのうちの他のカラーチャンネルに符号化するように構成される。
このアプローチは、多くのシナリオにおいて3次元情報の非常に効率的な通信を可能にすることができる。特に、多くの実施形態では、このアプローチは、既存のビデオ符号化フォーマットおよび機能性を再利用することができ、または非正方形領域三角形メッシュに関連する情報を運ぶように容易に適合させることができる。
本発明の幾つかの実施形態に従って、本装置は、さらに前記3次元画像を符号化する画像エンコーダをさらに有し、前記画像エンコーダは前記k−Dツリーを用いて前記画像を符号化するように構成される。
これは、多くの実施形態において非常に効率的な動作を提供することができ、特に、複雑さ及び/又はリソース使用量及び/又は配信/通信に使用/必要な帯域幅を低減することができる。
本発明の一態様により提供される方法は、3次元画像の三角形メッシュを生成する方法であって、
深度マップを提供することと、前記深度マップのk−Dツリーを生成することであって、前記k−Dツリーが、非分割領域の深度変動尺度が閾値より小さいとの要件を満たす前記深度マップの階層的領域構成を表す、ことと、内部頂点を前記k−Dツリーの各非分割領域内に配置することと、前記三角形メッシュの三角形の辺を隣接する非分割領域の内部頂点間を結ぶ線として形成することにより前記三角形メッシュを生成することとを含む。
本発明の一態様により提供される装置は、三角形メッシュを生成する装置であって、3次元画像の表現を提供する画像データと、前記3次元画像の深度マップのk−Dツリーとを含むビデオ信号を受信する受信器であって、前記k−Dツリーは、非分割領域の深度変動尺度が閾値より小さいとの要件を満たす前記深度マップの階層的領域構成を表す、受信器と、内部頂点を前記k−Dツリーの各領域内に配置し、前記三角形メッシュの三角形の辺を、隣接する領域の内部頂点間の線として構成することにより、前記三角形メッシュを生成するように構成された三角形メッシュ生成器とを有する。
本発明の幾つかの実施形態に従って、本装置はさらに、前記画像データから3次元画像を復号する復号器をさらに有し、復号は前記k−Dツリーに応じて行われる。
これは、多くの実施形態において非常に効率的な動作を提供することができ、特に、複雑さ及び/又はリソース使用量及び/又は配信/通信に使用/必要な帯域幅を低減することができる。
本発明の上記その他の態様、特徴、及び利点を、以下に説明する実施形態を参照して明らかにして説明する。
図面を参照して、本発明の実施形態を例示により説明する。
深度マップのk−Dツリーからの三角形メッシュの可能な決定を示す図である。 本発明の幾つかの実施形態による三角形メッシュを生成する装置の一例を示す図である。 本発明の幾つかの実施形態により決定される四分木の一部を示す図である。 本発明の幾つかの実施形態により決定される四分木の一部を示す図である。 本発明の幾つかの実施形態により決定される四分木の一部を示す図である。 本発明の幾つかの実施形態により決定される四分木の一部を示す図である。 本発明の幾つかの実施形態により決定される四分木の一部を示す図である。 四分木の1つのセクションに対する三角形メッシュの可能な決定を示す図である。 本発明のいくつかの実施形態によるk−Dツリーを生成する場合の考えられる考察の例を示す図である。 本発明のいくつかの実施形態によるk−Dツリーを生成する場合の考えられる考察の例を示す図である。 本発明のいくつかの実施形態によるk−Dツリーを生成する場合の考えられる考察の例を示す図である。 本発明の幾つかの実施形態による三角形メッシュを生成する装置の一例を示す図である。
(ビデオを含む)多くの3D画像処理アルゴリズムおよびプロセスは、多くの実施形態において高い計算効率を提供することができるので、三角形メッシュの使用に基づいている。しかし、多くの実施形態では、3次元画像を他のフォーマットで受け取ることができる。例えば、関連する深度マップを有する2次元画像を受け取ることができ、したがって、このような三角形メッシュベースのアルゴリズムでは直接使用することはできない。したがって、2次元画像および深度によって表される3D画像を、三角形メッシュに変換するアプローチを取ることが望ましい。
言うまでもなく、このような手法は、別のフォーマットの入力が受信されたときにも使用できる。例えば、異なる視点に対応する複数の画像として3次元画像が受信され、具体的には3D画像がステレオ画像として受信された場合、これを2次元画像および関連する深度マップに変換することができる。例えば、画像の1つは、異なる画像内の対応するオブジェクト間の視差に基づいて決定される対応する深度と、直接的に使用されてもよい。
画像および深度マップから三角形メッシュを生成する1つの手法は、四分木(quadtree)またはより一般的にはk−Dツリーが最初に生成され、その後に三角形メッシュが四分木/k−Dツリーから生成されるアプローチを用いることである。四分木は、具体的には、高効率ビデオ符号化(HEVC(H.265))規格などのビデオ符号化のいくつかの形態で使用されている。
k−Dツリーまたは具体的には四分木では、各ノードは領域を表し(例えば、インデックスされる空間の一部を覆うバウンディングボックスを表すことができる)、ルートノードは空間全体をカバーする。領域の条件が満たされた場合、この領域はn個のサブ領域に分割される。そのような場合、領域に対応するノードには、(通常は予め定められた)数の子ノードが与えられ、各ノードはサブ領域を表す。次いで、これらのノードはさらに処理されて、潜在的にさらに分割されてもよい。このようにして、階層ツリーが構築される。
四分木は、具体的に、正方形領域を4つの新しい正方形に再帰的に分割するアルゴリズムを適用することによって画像を空間的に分割する。具体的に、四分木は、各内部ノードが正確に4つの子を有するツリーデータ構造である。四分木は、2次元空間を4つの象限または領域に再帰的に細分することによってその2次元空間を分割するために最も頻繁に使用される。細分化は、典型的には、所与の特性が適切な基準に従って十分に均質である領域にされる。したがって、ある領域が所定の閾値を超えて増加する特性の変化を有すると判定された場合、その領域は4つのより小さい領域に分割される。このプロセスは反復的に繰り返され、階層ツリーをもたらし、レベル数、したがって正方形のサイズが、一般的には画像にわたって変化する。
四分木は、k−Dツリーの具体的な例であり、任意のサイズおよびアスペクト比の長方形が使用され得る。したがって、k−Dツリーは、空間分割データ構造であり、個々のパーティション/領域が同質性基準を満たすまで、パーティション/領域がより小さいパーティション/領域に反復的に分割される。パーティション/領域は長方形であるが、基本的には任意のサイズおよび形状であってもよい。実際に、パーティション/領域のサブパーティション/領域への分割は、適応的であって、様々な特性およびパラメータに依存してもよく、特に、サブパーティション/領域内の特性に依存してもよい。したがって、k−Dツリーの場合、領域/区画の部分領域/区画への分割により、一般的にはパーティション/領域内の特性に応じて、異なる数および領域および形状のサブパーティション/領域が得られる。
対照的に、四分木の場合、パーティションされる際、各領域は4つの部分領域に分割され、その結果、各ノードは正確に4つの子を有する。そのような四分木では、すべての領域がさらに正方形の領域であるため、分割は四つの同一の正方形サブ領域への分割になる。
現在の手法で生成されるk−Dツリーは、具体的には2次元マップ(深度マップ)に関するものであり、それゆえk−Dツリーは具体的には2−Dツリーである。具体的には、2−Dツリーは、領域の各分割が4つの同一かつ正方形の領域になり、したがって各ノードが4つの子(またはなし)を有する四分木であってもよい。
四分木またはk−Dツリーアルゴリズムが深度マップに適用される場合、これは、ある均質性基準が満たされるまで、再帰的に均質領域に分割されてもよい。しかしながら、このサブ分割から、三角形メッシュがどのように構築されるか、または構築されるべきかは明らかではない。
一つのアプローチは、三角形メッシュの三角形の頂点をそのような四分木の各接合点に配置し、これらを接続して四角形を形成し、その後、各四角形を二つの三角形に分割することができるようにすることである。図1は、かかるアプローチの一例を示す図である。図1は、深度マップの四分木の小さなセクションが複数領域に分割されることを具体的に示している。
このメッシュの問題は、(図中、×印で示した)いくつかの頂点では、対応するピクセル位置(i,j)の深度値D(i,j)を直接使用することは好ましくないことである。具体的には、識別された点はまた、別の三角形エッジの中間位置にある。交点(i,j)における深度マップの深度D(i,j)は、交点(i,j)がある側の2つの頂点間の線形補間によって与えられる深度と異なっていてもよい。したがって、深度マップ値D(i,j)を直接使用すると、3次元メッシュに穴が開く可能性がある。このような穴を開けないようにするアプローチは、その側の頂点間の補間値を決定し、これを使用することである。しかし、一般的には、そのような手法は、計算的にそれほど魅力的とは言えない。メッシュ計算が複雑になり、計算集約的になることが分かっているからである。
図2は、本発明の幾つかの実施形態による三角形メッシュを生成する装置の一例を示す図である。このアプローチは、多くのシナリオで三角形メッシュを改善することができ、具体的に、前述の欠点のいくつかを回避または緩和することができる。具体的には、この装置により、比較的低い計算資源需要を維持しながら、正確な三角形メッシュを生成することができる。
図2は、3次元画像の深度マップに基づいて(例えば、3次元画像の画像オブジェクトの)3次元画像の三角形メッシュを生成することができる装置を示す。したがって、この例では、3次元画像は、2次元画像および関連する深度マップによって表される。しかし、言うまでもなく、他の実施形態では、他のフォーマットを使用することもできる。例えば、2次元画像ではなく、遮蔽されるピクセルに関する情報も含むzスタックを提供してもよい。
この例では、装置は、3次元画像の深度マップを提供するように構成された深度マップ源101と、深度マップに対応する2次元画像を提供するように構成された画像源103とを備える。
言うまでもなく、深度マップ源101および画像源103は、多くの実施形態では、共通の情報源であってもよい。例えば、多くの実施形態では、装置は、2次元画像および関連深度マップによって表される一連の3次元画像を含む3次元ビデオストリームを受信する受信器を有してもよい。受信器は、このデータストリームを復号し、各3次元画像ごとに、対応する画像および深度マップを提供するように構成することができる。したがって、受信器は、深度マップ源101と画像源103の両方の機能を実装することができる。
深度マップ源101は、深度マップからk−Dツリーを生成するように構成されたツリー生成器105に結合される。分割されていない領域の深度変動測定値が閾値未満であるという要件を満たす領域の階層配列を表すk−Dツリーが生成される。
したがって、ツリー生成器105は、深度変動尺度に基づいてk−Dツリーの生成を実行するように構成される。ある領域の深度変動尺度が所与の閾値を越える場合、その領域を1組のサブ領域に分割する、すなわち、その領域に対応する親ノードのサブ領域に対応する子ノードのセットを生成するように構成される。このアプローチは、生成されたすべての領域が基準を満たすまで反復して適用されるので、深度マップの、深度が比較的一定の複数の非分割領域への分割になる。実際、最も小さな領域、すなわち非分割領域の場合、深度変動尺度は閾値未満であり、したがって各(非分割)領域における深度の変動は(個々の実施形態の特性に応じて)ほぼ一定であることが保証される。
言うまでもなく、k−Dツリーの各(最終の/非分割の)領域内で受け入れられる深度変動の程度は、個々の実施形態の好みおよび要件に依存する。同様に、使用される正確な深度変動尺度は、個々の実施形態の好みおよび要件に依存してもよく、言うまでもなく、個々の実施形態に適した領域内の深度の変動の任意の指標を使用してもよい。
一例として、領域内の最高深度値と最低深度値との間の差に対応する深度変動尺度を使用することができる。そのようなシナリオでは、ツリー生成器105は、深度マップを、最大深度差が所与の閾値より小さい領域のセットに分割する。これは、三角形メッシュの単一の三角形として潜在的に表現されるのに十分に均質であるとみなせる領域を生成することができる。
言うまでもなく、所与の要件に基づいてk−Dツリーを生成する様々なアルゴリズムが当業者に知られており、本発明を損なうことなく任意の適切な手法を使用できる。
ツリー生成器105は、ツリー生成器105によって生成されるk−Dツリーに応答して三角形メッシュを生成するように構成された三角形メッシュ生成器107に結合されている。メッシュ生成器107は、k−Dツリーの各(非分割)領域内に頂点を配置することにより、メッシュを生成し、次いで、三角形メッシュの三角形の辺を、隣接領域の頂点間の線として構成することにより、三角形メッシュを生成することができる。したがって、メッシュ生成器107は、三角形の頂点を、領域間の接合部ではなく領域内に配置するように構成される。具体的には、各領域について、1つの頂点が生成され、領域の側ではなく領域内に、または2つ以上の領域が結合する交点/接合上に配置されてもよい。したがって、メッシュ生成器107のアプローチでは、1つの領域のみに属する頂点が生成される(各頂点は、1つの領域のみに接触するか、またはその領域によって囲まれてもよい)。
このアプローチでは、生成される頂点は、領域内に配置される内部頂点である。したがって、各内部頂点は、1つの領域にのみ接触するか、または単一の領域によって完全に囲まれているため、領域の境界、エッジまたは接合部には配置されない。以下では、頂点という用語は、必要に応じて、内部頂点/頂点を適切に参照するために使用され、つまり、簡潔に言うと、領域によって完全に囲まれた内部頂点(2つ以上の領域の境界上ではなく)を頂点と呼ぶ。
多くの実施形態では、所与の領域の頂点は、その領域の中心に生成されてもよい。したがって、領域の頂点は、領域の幾何学的中心に位置することができる。
しかし、言うまでもなく、これは本質的ではなく、実際には他の実施形態では、頂点は中心に配置されなくてもよく、または位置が異なる領域間で動的におよび/または適応的に変化してもよい。
次いで、三角形メッシュ生成器107は、これらの内部頂点を接続することによって三角形を生成することができる。一般的には、頂点間に線が形成され、結果として生じる三角形を用いて三角形メッシュを形成してもよい。
頂点は内部頂点であるため、これらの内部頂点を用いて形成される三角形は、1つの領域に限定されるものではなく、本来は複数の領域の一部を含むものである。従って、形成される三角形の各々(少なくとも幾つか)は、複数の領域にまたがって延在する。
多くの実施形態では、三角形を形成するときに、異なる領域間の接合部、すなわち交点が使用され、具体的にはどの頂点を用いて個々の三角形を形成するか選択する。
具体的には、3つの領域が互いに合う接合部については、この3つの領域の3つの内部頂点を三角形の頂点とする三角形を形成することができる。したがって、形成された三角形は、接合部で合う三つの領域のそれぞれの要素を含む三角形である。したがって、接合自体は、形成された三角形の頂点ではなく、どの領域/内部頂点を使用して結果として得られる三角形を形成するか選択するのに使用される。後により詳細に説明するように、内部頂点の位置および三角形の生成は、典型的には、領域間の接合が三角形内に入るようになる(すなわち、接合部の3次元点は、三角形メッシュ内で、接合部で合流する3つの領域の内部頂点を用いて、生成された三角形の点によって表される)。
三角形メッシュ生成器は、多くの実施形態では、三角形が3つの領域の内部頂点を接続する辺を有する3つの領域間の各接合部に対して三角形を形成するように構成されてもよい。
したがって、三角形のセットが生成され、これらの三角形のそれぞれが(これらの頂点はすべて内部頂点であるので)3つの異なる領域にまたがってまたはオーバーラップまたは延在してもよい。
4つの領域が互いに会合する接合部については、4つの領域の4つの内部頂点によって2つの三角形が形成されてもよい。そのようなシナリオでは、三角形メッシュ生成器107は、2つの対角線上の対向する領域の間の線(すなわち、共通の面を持たない2つの領域の間)として、2つの三角形の1つの共通辺を形成することができる。1つの三角形は、残りの2つの領域のうちの1つの頂点をさらに含むことによって形成されてもよく、他の三角形は、最後に残る領域の頂点をさらに含むことによって形成されてもよい。
したがって、いくつかの実施形態では、三角形メッシュ生成器107は、4つの領域の間に存在する各接合部に対して2つの三角形を形成するように構成されてもよい。2つの三角形は、4つの領域の2つの対角に対向する領域の頂点を接続する共通の側面を有する。次に、2つの対角対向領域の頂点を4つの領域の第3の領域の頂点に接続するように三角形を生成することによって、1つの三角形が形成される。次に、2つの対角対向領域の頂点を4つの領域の第4の領域の頂点に接続することによって、第2の三角形を形成する。
すなわち、三角形メッシュ生成器107は、2つの三角形が、4つの領域の対角線対向した2つの領域の頂点を結ぶ共通辺と、4つの領域のうちの第3の領域および第4の領域に対角線対向する2つの涼気の頂点を接続する辺とを有する、4つの領域間に各接合部の2つの三角形を形成するように構成され得る。
3領域接合に対して三角形が形成されるシナリオに関しては、4領域接合のために形成された2つの三角形も内部頂点から形成され、したがって、各三角形は単一の領域に限定されず、3つの異なる地域にまたがることになる。
矩形領域を有する四分木の場合、各接合部に対して三角形を生成する手法は、穴のない連続した三角形メッシュが生成されることになる。
このアプローチにより、三角形メッシュの生成が改善され得る。実際、多くの実施形態では、このアプローチは、比較的簡単かつ複雑でない処理に基づき、非常に正確なだけでなく、もともとメッシュ中に穴が開いていない三角形メッシュを生成できる。
このアプローチにより正確かつ有用な三角形メッシュができることが分かっている。これは、このアプローチがk−Dツリーから三角形メッシュを生成する仮定された基本的原理を捨てているので、驚くべきことである。特に、k−Dツリーを用いて、深度変動が非常に低い個別の領域を生成する。最も直観的なアプローチは、前述の通り、個々の領域の深度変動が低いことを補償できるので、各領域内に三角形を形成することである。これにより、同じ領域の頂点間に三角形が生成される。すなわち、領域の接合部/交点間に三角形が生成される。実際、これにより、各四角形領域が、その領域を対角線で分割することにより形成される2つの三角形により表される。
しかし、図3のシステムのアプローチの基本的かつ重要な特徴は、三角形は1つの領域内に形成されず、複数の領域間に形成されることである。このように、三角形は複数の領域と重なり合い、そのため得られる三角形は異なる領域のセクションを含む。この直観に反するアプローチは、三角形が、深度がk−Dツリー生成により構成される1つの領域内にあるように制約せず、深度変動が制約されていない複数の領域にわたる三角形を形成する。驚くべきことに、隣接する領域間の深度の変動に制限を課すことなく、高効率で正確な三角形メッシュが生成される傾向があることが分かった。さらに、この生成は本質的に三角形メッシュの穴を回避する。
以下では、四分木を使用する具体的な実施形態をより詳細に説明する。したがって、特定の例では、すべての領域が正方形であり、領域の各分割は4つの子/小領域になる。さらに、特定の例では、頂点は個々の領域の中心に配置される。
この実施形態では、三角形メッシュ生成器107は、四分木の各四角を二つに分割するのではなく、3つまたは4つの四分木領域が合う接合部に基づいて三角を構成する。接合部(junctions)に頂点を配置する代わりに、単一の頂点が各領域の中心に配置される。3つの四分木領域が合う各接合部について、単一の三角形が構成される。三角形は、合う3つの領域の3つの頂点を接続することによって構成され、すなわち、三角形の辺は、3つの領域の3つの頂点ペアを結ぶ線によって形成される。すべての領域が正方形である四分木の場合、これは本質的に接合部を取り囲んで生成される三角形をもたらし、これにより穴のない一貫した三角形メッシュが生成される。
4つの領域が接触(meet)する接合部については、2つの三角形が構成される。2つの三角形は、最初に2つの対角領域(接合部にのみ接触する2つの領域であり、共有エッジを持たない2つの領域)の頂点を選択することによって構築される。これらの2つの頂点は、2つの三角形に共通であるのに対して、残りの2つの頂点は、1つの三角形の一部のみである。したがって、第1の三角形は、2つの共通の頂点と、第3の頂点とにより形成され、第2の三角形は、2つの共通の頂点と、最後の頂点とにより形成される。
このようにして、2つの三角形が形成され、これは、正方形領域によって形成されたマップの場合、接合点を通る共通の側部/辺となる。さらに、3方向接合のため三角形を生成するための上記の手法と共に、穴のない連続した三角形メッシュが自動的に生成される。
このアルゴリズムは、例えば、四分木データ構造による階層的検索を使用して実施することができる。
一例として、図3の(小さい)四分木が考えられる。この例では、各領域内の数字は、各領域の(正方形領域の辺の長さで示される)サイズを示す。この小さな局所的構造に対して、頂点は各領域内に配置されてもよく、三角形は上述の手法を用いて形成されてもよい。図4は、可能性のある結果を示す。図からわかるように、穴のない一貫した三角形メッシュが生成される。
この例では、四分木のエッジの具体的な処理が含まれ得る。例えば、システムは、画像境界上のすべての四分木領域コーナーを頂点として追加することができる。画像境界上のこのような頂点ごとに、(まだ生成されていない場合)3つの三角形を生成することができる。これらの三角形のうちの2つは、そのコーナーの2つの四角形内にあり(2つの境界頂点を四角形の中心頂点に接続する)、第3の三角形はエッジ頂点を2つの中心頂点と接続することができる。これにより、三角形メッシュを画像の端まで拡大することができる。言うまでもなく、他の実装形態では、他の手法を用いても良い(画像のエッジまで完全には拡大されない三角形メッシュを単に生成することを含み、すなわち領域内部の頂点のみを使って三角形メッシュを生成してもよい)。
四分木からメッシュを計算するプロセスは、特に効率的に実行することができる。隣接する正方形間の接合部の位置が四分木データ構造によって定義されるからである。例えば、最大領域が128ピクセルのサイズを有する場合、xまたはy方向の128領域の開始点は常に両方向の128ピクセルの倍数に位置することが知られている。この知識を用いて、四分木内の最大領域サイズ(例えば128)から最小領域サイズ(例えば4)までのすべての領域コーナーを再帰的に訪問する効率的なアルゴリズムを導出することができる。より小さな領域は、それが四分木内の一定の位置にある場合にのみ、評価される必要がある。
三角形メッシュ生成器107が三角形メッシュを生成するために用いることができるアルゴリズムの擬似コードの例は、以下の通りである。
Figure 2018534705
この手法では、三角形メッシュ生成器107は、最初に、最小領域を識別してそれらの領域を含む三角形を形成し、その後、(より小さい領域を含み、従って、より低いレベルですでに形成されているものはスキップしつつ)次に小さい領域を識別してそれらの領域のための三角形を形成するという意味で、ボトムアップに三角形を決定する。このアルゴリズムは、すべての領域が処理されるまでこのアプローチを継続する。
特定の例では、図2の装置は、ビデオプロセッサ109をさらに備える。これは、2次元画像と三角形メッシュとを受け取り、3次元ビデオ処理を実行して出力画像を生成するように構成される。ビデオプロセッサ109は、例えば、OpenGL(例えば、https://www.opengl.org/about/を参照)またはDirectX(例えばhttps://msdn.microsoft.com/library/windows/apps/hh452744を参照)レンダリングパイプラインを用いて新しいビューを生成することができる。例えば、ビデオプロセッサ109は、生成された三角形メッシュを使用して、ビューシフトまたはビュー合成を実行することができる。
k−Dツリーを生成するための正確なアプローチは、異なる実施形態の間で異なり、正確な深度変動の尺度およびこれが分割を必要とする閾値を超えるときの基準は、実施形態が異なれば変化し得る。
いくつかの実施形態では、深度変動尺度は、領域内の最大値と最小値との間の差として具体的に生成されてもよい。これが所定の閾値を超える場合、領域はサブ領域に分割される。
多くの実施形態では、領域の深度変動尺度は、領域の平均深度と、領域が分割されている場合に領域が分割される各サブ領域の平均深度との間の最大差分として有利に決定される。
代替的に(または追加的に)、領域の深度変動尺度は、領域が分割される場合に領域が分割されるサブ領域ペアの平均深度間の最大差分として有利に決定されてもよい。
そのようなアプローチは特に効率的であり、特に計算上非常に効率的である。
具体的には、深度変動尺度の決定は、深度マップに対して生成された積分画像に基づくことができる。深度マップの積分画像では、所与の位置x、yの値は、(一般的には)最も右下隅を位置x、yとして、矩形内の深度値の積分(総和)として与えられる。したがって、積分画像は、その位置の上および左の領域における積算値を反映する値を含む。
一例として、積分画像が使用される場合、領域を分割するかどうかの決定は、親領域と4つの子領域の平均深度値の間の最大絶対差分に基づくことができる。例えば、32×32の正方形ブロックは、
Figure 2018534705
であれば、4つの16×16ブロックに分割される。ここでkは各16x16の子ブロックのインデックスである。
この基準の計算上の利点は、積分画像の使用に由来し、各ブロック平均の計算は、積分画像における4回のルックアップ演算、2回の減算、1回の加算および1回のビットシフトからなる。(ビットシフト演算は、正方形ブロック内のピクセル数が常に2の累乗であるということに起因することに留意されたい)。
したがって、このアプローチの基準は、ブロック平均間の差分に基づいてもよい。具体的には、ブロックにわたって平均化されたピクセルごとの値が考慮され得る。従って、大きいブロックと小さいブロックは、同様の範囲の値、例えば[0, 255]を有することができる。
そのような実施形態では、閾値ブロックサイズを適応的にすることが有益であり得る、すなわち、最大のブロックについて低い分割閾値を使用し、ブロックサイズが小さければ閾値を増加させて、小さなブロックが過剰になることを防止してもよい。
また、言うまでもなく、k−Dツリーを生成するときに、領域を細分するか否かの決定は、深度値だけでなく他のパラメータも考慮に入れることができる。したがって、深度マップ用のk−Dツリーの生成は、専ら深度マップ自体に基づく必要はない。
実際、多くの実施形態では、ツリー生成器105は、3次元画像の輝度または彩度(chroma)の特性に応答して領域を形成するように構成することができる。具体的には、3次元画像は、視覚情報を表す一以上の2次元画像を含むことができ、すなわち、2次元画像は、輝度または彩度(合成クロミナンスを含む)情報を含むことができる。いくつかの実施形態では、ツリー生成器105は、所与の領域を分割するかどうかを決定するときに、この情報を考慮に入れることができる。
例えば、所与の領域について、ツリー生成器105は、深度変動尺度(depth variation measure)を決定することができる。ツリー生成器105はさらに、クロミナンス(例えば、純粋な輝度または純粋な彩度を含む)変動尺度を決定することができる。尺度は、例えば、最大輝度差分または最大彩度差分(例えば、1つのカラーチャネル内または全カラーチャネルにわたる平均)として決定されてもよい。次いで、ツリー生成器105は、深度変動尺度およびクロミナンス変動尺度の両方を評価し、これらの2つの尺度のいずれかがそれぞれの閾値を超える場合、領域を分割することができる。
別の一例として、H.265のようないくつかの符号化標準では、符号化される画像/ビデオのパラメータに基づいて画像/ビデオ符号化の一部としてk−Dツリーが生成される。このようなシナリオでは、画像/ビデオ符号化のために生成されるk−Dツリーを再利用することができる(場合によっては深度マップに基づいてさらに精細化される)。
領域の細分化を考慮するときに画像パラメータを含めると、改善された三角形メッシュが生成される可能性がある。
前出の例では、生成されたk−Dツリーは、正方形領域を使用する四分木である。しかし、説明されたアプローチの利点は、それがそのような四分木に限定されず、実際にk−Dツリーを形成する領域またはこれを生成するためのアルゴリズムに実質的な制約を課すものではないということである。
したがって、多くの実施形態では、ツリー生成器105は、正方形領域のみを生成するように制約されてもよく、具体的には、サブ領域への各分割は、4つの子領域の生成による。したがって、いくつかの実施形態では、ツリー生成器105は、四分木を生成するように制約されてもよい。しかし、他の多くの実施形態では、生成により、正方形領域に制約されない矩形領域からなるk−Dツリーを生成することができる。
例えば、矩形に基づくが(必ずしも)正方形に基づかないk−Dツリーは、2つの部分k−Dツリーであって、1つは水平分割を表し、1つが垂直分割を表すものによって表すことができる。
例えば、単一の四分木表現Q(i,j)を使用する代わりに、2つのサブツリーすなわち水平ツリーQh(i,j)および垂直ツリーQv(i,j)を考えてもよく、これは水平及び垂直変動を別々にモデル化するためである。このような矩形ツリーを使用すると、通常、三角形メッシュ内の三角形の数を減らすことができる。(よく発生する)水平または垂直に細長い構造を記述するために細分化する必要がないからである。
図5は、水平サブツリーQh(i,j)の小セクションの一例を示し、図6は、垂直サブツリーQv(i,j)の対応する小セクションの一例を示す。図7は、結果として得られる四分木全体のセクションを示す。図7はまた、生成され得る、結果として生じる三角形を示す。
したがって、これらの例では、ツリー生成器105は、領域を矩形として生成するように構成され、具体的には、水平方向および垂直方向における領域の分離は異なってもよい。ツリー生成器105は、例えば、壁および極などの直立構造を分割するために垂直分割を使用し、前景−背景深度ジャンプを分割するために水平分割を使用することができる。水平分割(horizontal split)と垂直分割(vertical split)の両方を、斜めに走っている構造に使用することができる。
しかし、四分木により自動的に、中心頂点を接続することによって、連続した一貫性のある三角形メッシュが生成されるが、これは長方形の寸法に制約のない矩形k−Dツリーに対しては保証されない。
これを図8に示す。図8は、矩形(但し、必ずしも正方形ではない)領域を使用してk−Dツリーのセクション内の領域セットの中心にある頂点を接続することによって得られる三角形の例を示す。図から分かるように、結果として得られる三角形は重なり合っており、さらに連続した三角形メッシュを提供せず、むしろ穴を有するメッシュになる。
対照的、四分木(すなわち、すべての領域が正方形)の場合、図8のような状況は起こりえないことを示せる。これを例示するため、非常に大きなブロック(例えば、128×128)が1×1ブロックの隣にある場合を考える。このようなシナリオでは、2つのブロックの中心間に線を引き、その線がその2つのブロック外にでないようにすることが常に可能である。これは、その2つのブロックが互いにどこで接しているかに依らない。
したがって、多くの実施形態では、四分木を用いて、連続した三角形メッシュを確実に生成することができる。幾つかの実施形態では、k−Dツリーの生成には、連続したマップを確実に生成する幾つかの制約を課してもよい。
多くの実施形態では、システムは、3つの領域間に生成される接合部は、これら3つの領域の頂点により形成される三角形に確実に含まれるように構成され得る。これにより、図8に例示したようなシナリオは生じないようにできる。
幾つかの実施形態では、ツリー生成器105は、分割に続き3つの隣接領域により形成される各三角形が接合部(junction)を含むとの制約の下に、領域を分割(subdivide)するように構成される。したがって、かかる例では、ツリー生成器105は、領域を分割する必要があると判断した場合、この分割(division)により生成される接合部を考慮することができる。ツリー生成器105はさらに、これらの接合部が、新しい領域の中心点が接続された結果として生じる三角形内に入るか考慮してもよい。ツリー生成器105は、そうであれば分割し、そうでなければその領域を分割(subdivide)しない。
他の例として、幾つかの実施形態では、ツリー生成器105及び/又は三角形メッシュ生成器107は、接合部を形成する3つの領域の三角形がその接合部を取り囲んでいないことを検出すると、それに応じて少なくとも1つの領域を分割するように構成されている。したがって、かかる例では、このシステムは、3つの領域間の接合部がその3つの領域の頂点により形成される三角形内に入らないことを検出し、それに応じて、その領域の少なくとも1つをさらに分割し得る。このように、この場合、1つではなく2つの三角形が生成される。言うまでもなく、反復的に考慮してもよい。すなわち、分割(subdivision)により、すべての接合部がその3つの領域の頂点により形成される三角形内に確実に入るようにできる。
多くの実施形態では、ツリー生成器105は、第1領域の隣接領域である第2領域と、再分割の結果生じる2つのサブ領域との間の接合部の評価に基づき、その第1領域を再分割(subdivide)するように構成され得る。したがって、領域を分割するか考慮する際、ツリー生成器105は、新しいサブ領域と既存の隣接領域との間に形成される接合部を考慮してもよい。ツリー生成器105は、この接合部の他の点に対する位置の特徴を考慮してもよく、要件が満たされたときのみに再分割するようにしてもよい。
図9ないし11を参照して幾つかの例を説明する。2つの領域AとBが線分Eにより互いに接し、領域Aが領域Bに、線分Eに垂直に線分Eにより領域Bを再分割する制約を課している。
具体的に幾つかの実施形態では、分割は、第1領域と第2領域の共通辺と、隣接領域の頂点から分割される領域のコーナーへの線との間の交点が、接合部よりコーナーに近いかどうかの評価による。
このように、図9の例を参照して、線LによりAの中心がBの反対コーナーQに接続でき、かかるLとQのそれぞれについて、線Lが線分EとPで交わるとき、Bを、Eにより、コーナーQから遠いPの側で分割することだけができる。
幾つかの実施形態では、分割は第2領域の頂点と、2つのサブ領域の頂点との間の複数の線が、第1領域と第2領域の共通辺と交わるかどうかの評価に基づいてもよい。
したがって、図10の例を参照して、制約は、Bのサブ領域の中心が、Eを通る線により、Aの中心と接続可能でなければならない。
幾つかの実施形態では、分割は、接合部が、第1領域と第2領域の共通辺の外側にあるかどうかの評価に基づいても良い。その場合、分割が実行され得る。
このように、図11の例を参照して、領域Aは線分Eの外側に制約を課さない。
上記の分割制約は、隣接領域(neighboring region)と、分割により形成される新しい隣接サブ領域(adjacent subregion)の中心を通る線が、その隣接領域とサブ領域内に完全に入っているとの制約を課してもよい。その線が他の領域やサブ領域と交わる場合、極端に浅い三角形及び/又は穴が形成され得る。
前述のように、制約と考慮は、再分割(subdivisions)をしてk−Dツリーを生成する時に考慮してもよく、多くのシナリオにおいて、反復的に、例えば、三角形メッシュの生成と共に、考慮されてもよい。例えば、説明した制約を、k−Dツリーを生成するときに考慮してもよく、得られたk−Dツリーを用いて三角形メッシュを形成してもよい。あるいは、k−Dツリーを最初に決定するときには、制約を用いなくてもよい。このk−Dツリーを用いてトライアルの三角形メッシュを生成して、制約が満たされなければ、この段階でそれを検出してもよい。制約違反を解消するために、k−Dツリーを修正してもよい。
上記の通り、制約が満たされていないと検出されたとき、装置は再分割(subdivision)をしなくてもよい。他のシナリオでは、さらに再分割してもよい。例えば、三角形メッシュの生成中に制約が満たされないことが分かれば、本装置は、対応する分割をしないのではなく、新しい分割をして制約が満たされるより小さい領域を生成する。
他の例として、幾つかの実施形態では、システムは、制約が満たされる順序で少なくとも1つの頂点の位置を決定するように構成される。例えば、3方向の接合部が、対応する3つの領域の頂点により形成される三角形内にあるように、頂点を配置するように構成され得る。ツリー生成器105は例えば最初にすべての頂点を中心に配置してもよい。1つの接合部が対応三角形の外側にあることが分かったとき、制約が満たされるまで、すなわち接合部が三角形内に入るまで、一以上の頂点の位置を動かす。ツリー生成器105は例えば、与えられた領域の異なる位置(例えば、ランダムな位置)を試し、制約が満たされるかチェックしてもよい。そうであれば、頂点はこの位置にされ、そうでなければ、他の位置が選択され評価される。
図2及び前述の例では、説明した機能性は同じ場所にあると考えられている。しかし、発明者が気づいたところによれば、3次元画像情報の特に効率的な通信は、機能性の分配により実現できる。特に、発明者が気づいたところでは、3次元画像を提供するデータストリームの一部としてk−Dツリーを用いれば、3次元情報の特に魅力的な通信が可能である。
図12は一例を示し、画像送信器1201は画像データストリームを生成し、画像受信器1203に送信するように構成されている。この例では、画像送信器1201は、深度マップ源101と画像源103とを含み、これらは図2のものに対応し得る。同様に、画像送信器1201は、図2を参照して説明したものに対応するツリー生成器105を含む。
また、画像送信器1201は、画像データストリームを生成するように構成される画像ストリーム生成器1205を含む。多くの実施形態では、画像送信器1201は、画像シーケンスを含むビデオストリームを生成するように構成される。次の説明では、ビデオストリームが生成され、単一画像への参照が、ビデオ信号を形成する画像シーケンスのうちの1つの画像への参照として考慮される例を考える。
この例では、画像ストリーム生成器1205は、画像源103からの画像データと、深度マップ源105からの深度マップをビデオストリームに含めるように構成されるが、言うまでもなく、幾つかの実施形態では、画像データと深度マップのうち一方または両方がビデオストリームに含まれなくてもよい。この例では、ビデオストリームが設けられ、これは2次元画像シーケンスと、それに関連する深度マップとを含み得る。
また、画像ストリーム生成器1205は、ツリー生成器105からk−Dツリーを受け取り、これをビデオストリームに含めるように構成される。このように、ビデオストリームは、深度マップがどのように、実質的に均一な複数の領域のうちの領域に分割されたかに関する情報を含み得る。
ビデオデータストリームは、画像受信器1203に送信され、ストリーム受信器1207に入力される。ストリーム受信器1207は、受信されたビデオストリームから関連データを取り出すように構成されている。画像受信器1203はさらに、図2を参照して説明したものに相当する三角形メッシュ生成器107を備える。三角形メッシュ生成器107は、ストリーム受信器1207に結合されている。ストリーム受信器1207は、特にk−Dツリーを取り出し、それを三角形メッシュ生成器107に入力する。三角形メッシュ生成器107はさらに、深度マップを受け取り、前述の通り三角形メッシュの生成に進む。
このように、画像受信器1203は三角形メッシュを生成する。これは他の関連情報とともに出力できる。関連情報は、2次元画像、深度マップ、テクスチャ画像など、個別の実施形態においてあればよいものである。このデータはその後好適なポストプロセッサで用いることができ、具体的に、ポストプロセッシングは三角形メッシュに基づくことができる。
このシステムでは、三角形メッシュを生成する機能性は、このように画像送信器1201と画像受信器1203とに分散され、画像/ビデオデータストリームは、k−Dツリー情報(a representation of the k−D tree)とともに送信される。
このアプローチは多くの実施形態において魅力的な解決策を提供し得る。実際、このアプローチは、3次元情報の効率的な符号化を提供し、サーバ側(画像送信器1201)とクライアント側(画像受信器1203)で複雑性とリソース需要とを有利に分散する。
さらに、このアプローチにより可能となり得る特に有利なアプローチでは、3次元情報が画像/ビデオ信号として符号化される。実際、幾つかの実施形態では、3次元情報は、画像(ビデオ)符号化/復号アプローチを用いて符号化されてもよく、すなわちk−Dツリーを専用の符号化フォーマットを用いて直接符号化しなくてもよい。3次元情報は、通常の2次元可視画像に対して用いられるのと同じビデオ又は画像符号化アルゴリズムにより符号化される。このように、ビデオエンコーダとデコーダは、k−Dツリーにより表される3次元情報を符号化及び復号するにあたり、その3次元情報を通常の画像として処理し、実際にそれが通常の画像以外のものであることを知らずに処理する。
このアプローチは、多数の利点を有し、特に、既存の画像/ビデオのエンコーダ及びデコーダを用いることができる。実際、このアプローチにより、関連する3次元情報の配信が可能となるにあたり、新しいフォーマットや標準を開発する必要はない。この関連する3次元情報は、既存のビデオフォーマットを、データを提供できる「ラッパー(wrappers)」として用いて、有効に伝達できるからである。
k−Dツリーの伝達は、このアプローチにとって特に好適である。その理由は、この情報が、各ピクセルが1つのデータ値を有する単純な2次元マップにより表し得るからである。このように、まさに3次元構造である三角形メッシュを伝達するのと対比して、k−Dツリーは2次元マップ(a two−dimensional map of values)で表せ、k−Dツリーの伝達では、2次元画像に適用されるのと同じアプローチとフォーマットとを用いることができる。
したがって、幾つかの実施形態では、画像ストリーム生成器1205は、k−Dツリーに画像符号化(及び特にカラーまたは輝度チャネル符号化)を適用し、得られた画像符号化データを画像/ビデオデータストリームに含めるように構成される。
例えば、画像ストリーム生成器1205は、好適なビデオ符号化標準により符号化された一以上の画像信号を含むビデオストリームを生成するように構成され得る。ビデオ/画像信号は一般的に複数のカラーチャネル(これは純粋なクロマチャネルまたは純粋な輝度チャネルであってもよい)によりカラー画像を表す。例えば、幅広フォーマット(widespread format)は、Red、Green及びBlueのカラーチャネルによりカラー画像を表すものである。カラーチャネルはその後個別に符号化される。他の例は画像をYUVフォーマットで表すものであり、Yは輝度チャネルであり、UとVは2つのカラーチャネルを表し、カラーチャネルはこの例では純粋なクロマチャネルである。これらのチャネルはそれぞれ、(輝度、クロマまたはクロミナンス値を表す)データ値の2次元マップを1つ含む。
幾つかの実施形態では、k−Dツリーは適宜、2次元の値マップ(two dimensional map of values)により表され得る。例えば、深度マップの各ピクセルについて、k−Dツリーマップは、そのピクセルが属する領域のサイズを指定する値を含み得る。このマップは、カラーチャネルのマップであるかのように、ビデオエンコーダに入力されてもよく、画像の(部分的な)表現であるかのように符号化される。
同様に、ストリーム受信器1207のビデオデコーダは、そのマップを、カラーチャネル(例えば、純粋な輝度またはクロマチャネル)のマップであるかのごとく復号する。復号されたデータは、2次元マップとして出力され、三角形メッシュ生成器107に入力され、三角形メッシュを生成するのに用いられる。
幾つかの実施形態では、ビデオエンコーダはこのように、1チャネルとしてk−Dツリーマップを含む、符号化する画像を受信する。幾つかの実施形態では、他のチャネルは空でもよい(例えば、すべてのピクセルがダミーのゼロ値を含んでいてもよい)。例えば、k−Dツリーは、RGB信号のRチャネルに符号化されてもよく、G及びBチャネルにはデータが含まれていなくても(一定データ値が含まれていても)よい。
しかし、他の実施形態では、他のチャネルには他のデータが含まれていてもよい。
特に、幾つかの実施形態では、画像送信器1201は、深度マップとk−Dツリーマップとを、ビデオエンコーダにより符号化されている同じ疑似画像の異なるチャネル(カラー/クロマ/輝度チャネル)に結合するように構成されていてもよい。このように、ビデオエンコーダは、複数のチャネルを含むビデオ表現(video representation)を符号化するように構成され、ここで深度マップが第1チャネルに含まれ、k−Dツリーが(少なくとも)第2チャネルに含まれていてもよい。
画像送信器1201はカラー画像に対応するデータ構造を生成し得る。例えば、3つの2次元データマップの構造が生成され、各データマップが、例えばR、G及びBの1つに対応し、またはY、UおよびVチャネルの1つに対応してもよい。データマップの1つは、深度マップからのデータ値が追加(populate)され、1つのデータマップはk−Dツリーマップからのデータが追加されてもよい。最後のデータマップは、例えば、その他のデータ(例えば、透過マップ)が追加されても、(すべての値がゼロに設定されて)空のままであってもよい。その結果として得られたデータ構造は、ビデオエンコーダにより符号化され、ビデオストリームに含められ、画像受信器1203により取り出され、深度マップとk−Dツリーマップとを回復するため画像受信器1203のビデオデコーダにより復号される。
多くの実施形態では、ビデオエンコーダは、特に輝度チャネルと少なくとも1つのクロマチャネルとを含むビデオ表現(video representation)を符号化するように構成されてもよく、画像送信器1201は、深度マップを輝度チャネルに符号化し、k−Dツリーを少なくとも1つのクロマチャネルに符号化するように構成されてもよい。多くの実施形態では、深度マップを輝度チャネルに符号化し、k−Dツリーマップをクロマチャネルに符号化するのが特に有利であり得る。一般的に、深度マップはk−Dツリーマップより値の変動が非常に大きい傾向がある。実際、k−Dツリーマップの場合、データ値は各符号化ピクセルブロック(each encoding block of pixels)で一般的には一定である。多くのビデオ符号化標準において、輝度チャネルの符号化は、クロマチャネルの符号化より有効または正確である可能性があり、それゆえこの符号化を変動が最も大きいマップに適用することは有利であり得る。
言うまでもなく、すべてのマップの解像度は同じである必要はない。例えば、k−Dツリーの解像度は深度マップの解像度よりも低いことが多くてもよい。例えば、ツリー生成器105により生成し得る最小領域が4ピクセルである場合、k−Dツリーマップの解像度は深度マップの解像度の1/4であってもよい。
また言うまでもないが、深度マップとk−Dツリーマップの解像度は、画像源103により提供される2次元画像の解像度と異なっても良い。実際、深度マップとk−Dツリーマップは別画像として符号化されので(それゆえビデオストリームは2つの画像ストリームを含み、1つは2次元画像に対応し、1つは結合された深度マップとk−Dツリーマップに対応する)、符号化は画像とマップとの間の関係にいかなる制約を課す必要もない。
幾つかの実施形態では、k−Dツリーは、複数の値により表され得る。例えば、k−Dツリーは正方形でない矩形を許容し、それゆえ各領域は水平および垂直のサイズにより定められる。k−Dツリーは、各ピクセルにアサイン(assigned)された2つの値であって、1つの値は水平サイズを示し、他の値は垂直サイズを示すものにより表され得る。これらの2つの値は、幾つかの実施形態では、1つのk−Dツリーマップではなく、2つの異なるデータマップにアサインされ得る。画像送信器1201は2つのマップを生成し、1つのマップは水平分割を提供し、他のマップは垂直分割を提供するようにしてもよい。これらの2つのマップは異なるチャネルに符号化され得る。例えば、深度マップがYチャネルで提供され、2つのk−Dツリー深度マップがそれぞれUチャネルとVチャネルで提供されてもよい。
このように、幾つかの実施形態では、ビデオ表現は少なくとも2つのカラーチャネルを含み、画像送信器1201は、k−Dツリーの垂直領域情報を1つのカラーチャネルに符号化し、k−Dツリーの水平領域情報を他のチャネルに符号化する。
具体例として、本アプローチはH.264ビデオ符号化/復号フォーマットを用いることができる。このフォーマットはH.264ビデオの符号化と復号をサポートし、深度はビデオストリームに並んで配置される。しかし、かかるアプローチでは、ビデオデータ中の3次元三角形メッシュの符号化は実現できない。三角形メッシュデータを別々に符号化することは原理的には可能であるが、非常に困難であり、一般的には非効率な符号化となる。例えば、ビデオ/画像データを三角形メッシュデータと正確に同期させなければならないことから、大きな問題が生じる。これは上記のk−Dツリーの符号化により回避し得る。
このように、具体例として、幾つかの実施形態では、四分木Q(i,j)またはQh(i,j)およびQv(i,j)は、別のカラーチャネル(例えば、クロマチャネル)を用いて深度が配置された、ビデオストリーム中の位置に表され得る。四分木は、次いで、(H.264またはH.265)ビデオ符号化/復号の(ロッシー)符号化と復号ステップで処理される。
留意点として、ビデオ符号化はロッシー(lossy)であり得るが、k−Dツリー情報に関する効果は一般的に許容レベルまで減少され得る。さらに、データ値の多くが同じであるため、非常に効果的な符号化を実現することができる。
符号化と復号でエラーが生じるリスクを低減するため、幾つかの実施形態では、可能な限り大きい距離を有する可能なデータ値のサブセットを使用しようとする派生表現を符号化することが有益であり得る。
例えば、マッピングL(α)を適用してk−Dツリーマップのデータを生成する。例えば、値αは個別領域の正方形サイズを表すのに用いられる2の冪乗を表し得る。例えば、
Figure 2018534705
を用いて四分木を、32ステップで0(領域サイズは256)から255(領域サイズは1)までの全8ビット範囲の中で、32レベルの一定ステップで変化する値に変換できる。
幾つかの実施形態では、k−Dツリーは、3次元画像の符号化に用いることができ、特に、3次元画像の表現の一部である一以上の2次元画像の符号化に用いることができる。このように、同じk−Dツリーを、画像/ビデオ符号化と、深度マップの分割との両方に用いて、三角形メッシュが生成されるようにしてもよい。
実際、多くの実施形態では、画像またはビデオ符号化が実行され、画像をサブコーディングブロックに分割する。実際、従来のビデオ符号化フォーマットでは画像を所定の一定サイズの画像フロック(例えば、16×16ピクセル)に分割しているが、新しいアプローチが開発されて、画像の個別コーディングブロックへの動的分割が利用されている。かかる幾つかのフォーマットでは、k−Dツリーを用いて、比較的類似しており、従って効率的に符号化できるピクセルブロックを含むコーディングブロック(coding blocks)を生成してもよい。
例えば、H.265として知られるビデオ符号化アプローチは、四分木の生成を含み、結果として得られる領域は後で符号化されるコーディングブロックとして用いられる。この四分木はコードブロックツリーとして知られ、符号化される画像データとともに画像ストリーム中に符号化される。従って、受信器/復号器は、受信データストリームからコードブロックツリーを取り出し、これをデコーダに入力する。デコーダはコードブロックツリーを用いて受信画像/ビデオデータを復号する。
幾つかの実施形態では、画像またはビデオ符号化/復号k−Dツリーも、三角形メッシュを生成いするk−Dツリーとして用いてもよい。
このように、復号器において、コードブロックツリーが取り出され、受信画像データを復号するために用いられ得る。また、コードブロックツリーを三角形メッシュ生成器107に入力してもよく、三角形メッシュ生成器107はそれを用いて前述の通り三角形メッシュを生成する。
このアプローチは、2つのまったく異なるものに、すなわちビデオの符号化/復号と三角形メッシュ生成とに、同じk−Dツリーを用いてもよい。
このアプローチによりビデオデータの配信が非常に効率的になり得る。実際、関連データがすでに含まれているので、デコーダが、データオーバーヘッドを生じる必要なく、信頼できる三角形メッシュを生成できる。
幾つかの実施形態では、ビデオ信号はさらに、含まれるコードツリーブロックが三角形メッシュの生成に適しているか否かを示すフラグを含み得る。このように、信号は、コードツリーブロックがこの目的で生成されたかどうかを示す組み込みフラグ/メッセージを含み得る。これにより、受信器は、コーディングツリーブロックを用いるか(例えば、
https://sonnati.wordpress.com/2014/06/20/h265−part−i−technical−overview
を参照)又はデフォルト/フォールバック(fall−back)アプローチ(例えば、k−Dツリーをローカルで生成するか)を用いるか決定できる。
このように、幾つかの実施形態では、画像送信器1201は、(例えば、H.265を用いて)コードツリーブロックを用いて、画像と深度を符号化するように構成されてもよい。受信器は、このコードツリーブロックを取り出して、それを用いて三角形メッシュを生成してもよい。
より一般的な矩形分割の場合には、圧縮−解凍を緩和するために、できるだけ分離されたレベルにマッピングされる限定数の可能なサイズを用いるマップが生成される。幾つかの実施形態では、符号化はロスレス符号化であってもよい。
言うまでもなく、上記の説明では、明りょうにするため、異なる機能回路、ユニット、及びプロセッサを参照して本発明の実施形態を説明した。しかし、言うまでもなく、本発明から逸脱することなく、異なる機能回路、ユニット、及びプロセッサの間で機能を適宜分配して、用いることができる。例えば、別のプロセッサやコントローラにより実行される機能は、同じプロセッサやコントローラで実行してもよい。このように、具体的な機能ユニットや回路の参照は、説明した機能を提供する好適な手段の参照であり、論理的あるいは物理的に厳密な構造や組織を表しているわけではない。
本発明は、ハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせを含むいかなる好適な形式で実施することもできる。本発明は、任意的に、1つ以上のデータプロセッサ及び/またはデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして、少なくとも部分的に実施することができる。本発明の実施形態の構成要素は、いかなる好適な方法で物理的、機能的、論理的に実施してもよい。機能は単一のユニット、複数のユニット、または他の機能ユニットの一部として実施することもできる。このように、本発明は、単一ユニットで実施することもできるし、異なる複数のユニット、回路、及びプロセッサに物理的かつ機能的に分散して実施することもできる。
実施形態に関して本発明を説明したが、ここに記載した具体的な形態に限定することを意図したものではない。むしろ、本発明の範囲は添付した請求の範囲のみにより限定される。また、具体的な実施形態に関して構成を説明したように見えるかも知れないが、当業者には言うまでもなく、説明した実施形態の様々な構成を、本発明により、組み合わせることができる。請求項では、「有する」という用語は他の要素やステップの存在を排除するものではない。
さらに、個別的に列挙されていても、複数の手段、要素、回路、方法ステップは、例えば単一の回路、ユニット、またはプロセッサにより実施してもよい。また、個々の機能(feature)は異なる請求項に含まれていても、これらを有利に組み合わせることが可能であり、異なる請求項に含まれていても、機能を組み合わせられないとか、組み合わせても有利ではないということを示唆するものでもない。また、ある構成をあるカテゴリーのクレームに含めたとしても、そのカテゴリーに限定することを意味するのではなく、むしろその構成が必要に応じて他のクレームカテゴリーにも等しく適用できることを示すものである。さらに、クレーム中の構成の順序は、その構成が機能しなければならない特定の順序を示すものではなく、特に、方法クレームにおける個々のステップの順序はそのステップがこの順序で実行されなければならないことを示すものではない。むしろ、ステップは任意の好適な順序で実行してもよい。また、単数扱いをしても複数の場合を排除するものではない。よって、「1つの」、「第1の」、「第2の」等は複数の場合を排除するものではない。請求項中の参照符号は、明りょうにするために設けており、請求項の範囲を限定するものと解してはならない。

Claims (15)

  1. 3次元画像の三角形メッシュを生成する装置であって、
    深度マップを提供する深度マップ源と、
    前記深度マップのk−Dツリーを生成するツリー生成器であって、前記k−Dツリーが、非分割領域の深度変動尺度が閾値より小さいとの要件を満たす前記深度マップの階層的領域構成を表す、ツリー生成器と、
    内部頂点を前記k−Dツリーの各非分割領域内に配置し、前記三角形メッシュの三角形の辺を、隣接する非分割領域の内部頂点間の線として構成することにより、前記三角形メッシュを生成するように構成された三角形メッシュ生成器とを有する、
    装置。
  2. 領域の内部頂点は前記領域の中心に配置される、
    請求項1に記載の装置。
  3. 前記三角形メッシュ生成器は、3つの領域間の各接合部に対し、前記三角形が前記3つの領域の内部頂点を接続する辺を有する三角形を形成するように構成される、
    請求項1に記載の装置。
  4. 前記三角形メッシュ生成器は、4つの領域間の各接続部に対して2つの三角形を形成するように構成され、前記2つの三角形は前記4つの領域の対角線対向する2つの領域の頂点を結ぶ共通辺を有し、1つの三角形は、前記対角線対向する2つの領域の内部頂点を前記4つの領域のうちの第3の領域の内部頂点と結ぶ辺を有するように形成され、1つの三角形は、前記対角線対向する2つの領域の内部頂点を前記4つの領域のうちの第4の領域の内部頂点と結ぶ辺を有するように形成される、
    請求項1に記載の装置。
  5. 前記k−Dツリーは四分木である、
    請求項1に記載の装置。
  6. 前記ツリー生成器はさらに前記3次元画像の輝度またはクロマ特性に応じて領域を分割するように構成される、
    請求項1に記載の装置。
  7. 前記ツリー生成器は、正方形領域であることに制約されない矩形領域を有するk−Dツリーを生成するように構成される、
    請求項1に記載の装置。
  8. 前記ツリー生成器は、分割に続き3つの領域により形成される各接合部が前記接合部を含むとの制約の下に領域を分割するように構成される、
    請求項1に記載の装置。
  9. 前記ツリー生成器は送信器の一部であり、前記三角形メッシュ生成器は受信器の一部であり、前記送信器は前記3次元画像を表す画像データストリームを生成し、前記k−Dツリーを前記画像データストリームに符号化するように構成され、前記受信器は前記画像データストリームから前記k−Dツリーを取り出し、前記三角形メッシュ生成器に提供するように構成される、
    請求項1に記載の装置。
  10. 前記送信器は、前記k−Dツリーに画像符号化を適用して符号化k−Dツリーを生成し、前記符号化k−Dツリーを前記画像データストリームに含めるように構成される、
    請求項9に記載の装置。
  11. 前記3次元画像を符号化する画像エンコーダをさらに有し、前記画像エンコーダは前記k−Dツリーを用いて前記3次元画像を符号化するように構成される、
    請求項1に記載の装置。
  12. 3次元画像の三角形メッシュを生成する方法であって、
    深度マップを提供することと、
    前記深度マップのk−Dツリーを生成することであって、前記k−Dツリーが、非分割領域の深度変動尺度が閾値より小さいとの要件を満たす前記深度マップの階層的領域構成を表す、ことと、
    内部頂点を前記k−Dツリーの各非分割領域内に配置することと、
    前記三角形メッシュの三角形の辺を隣接する非分割領域の内部頂点間を結ぶ線として形成することにより前記三角形メッシュを生成することとを含む、
    方法。
  13. コンピュータに、請求項12に記載の方法のステップを実行させるコンピュータプログラム。
  14. 三角形メッシュを生成する装置であって、
    3次元画像の表現を提供する画像データと、前記3次元画像の深度マップのk−Dツリーとを含むビデオ信号を受信する受信器であって、前記k−Dツリーは、非分割領域の深度変動尺度が閾値より小さいとの要件を満たす前記深度マップの階層的領域構成を表す、受信器と、
    内部頂点を前記k−Dツリーの各領域内に配置し、前記三角形メッシュの三角形の辺を、隣接する領域の内部頂点間の線として構成することにより、前記三角形メッシュを生成するように構成された三角形メッシュ生成器とを有する、
    装置。
  15. 前記画像データから3次元画像を復号する復号器をさらに有し、復号は前記k−Dツリーに応じて行われる、
    請求項14に記載の装置。
JP2018534020A 2015-09-23 2016-09-22 3次元画像のための三角形メッシュの生成 Active JP6927980B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15186439 2015-09-23
EP15186439.4 2015-09-23
PCT/EP2016/072485 WO2017050858A1 (en) 2015-09-23 2016-09-22 Generation of triangle mesh for a three dimensional image

Publications (2)

Publication Number Publication Date
JP2018534705A true JP2018534705A (ja) 2018-11-22
JP6927980B2 JP6927980B2 (ja) 2021-09-01

Family

ID=54251304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018534020A Active JP6927980B2 (ja) 2015-09-23 2016-09-22 3次元画像のための三角形メッシュの生成

Country Status (9)

Country Link
US (1) US10546421B2 (ja)
EP (1) EP3353748B1 (ja)
JP (1) JP6927980B2 (ja)
KR (1) KR102659114B1 (ja)
CN (1) CN108027983B (ja)
CA (1) CA2999193A1 (ja)
RU (1) RU2018114688A (ja)
TW (1) TWI723048B (ja)
WO (1) WO2017050858A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112016007098T5 (de) * 2016-07-26 2019-04-18 Hewlett-Packard Development Company, L.P. Indexierung von voxeln für das 3d-drucken
US10699466B2 (en) 2016-12-06 2020-06-30 Koninklijke Philips N.V. Apparatus and method for generating a light intensity image
KR20180082330A (ko) 2017-01-09 2018-07-18 에스케이텔레콤 주식회사 영상 부호화 또는 복호화하기 위한 장치 및 방법
WO2019068259A1 (en) * 2017-10-02 2019-04-11 Huawei Technologies Co., Ltd. POINT CLOUD CODING
CN109598790B (zh) * 2019-02-02 2022-12-09 珠海金山数字网络科技有限公司 一种三维模型绘制方法及装置、一种计算设备及存储介质
EP3703013A1 (en) * 2019-03-01 2020-09-02 Koninklijke Philips N.V. Apparatus and method of generating an image signal
US11488359B2 (en) 2019-08-28 2022-11-01 Snap Inc. Providing 3D data for messages in a messaging system
US11457196B2 (en) 2019-08-28 2022-09-27 Snap Inc. Effects for 3D data in a messaging system
US11189104B2 (en) 2019-08-28 2021-11-30 Snap Inc. Generating 3D data in a messaging system
US11410401B2 (en) 2019-08-28 2022-08-09 Snap Inc. Beautification techniques for 3D data in a messaging system
KR102313555B1 (ko) * 2019-12-10 2021-10-18 한국전자기술연구원 3d 메시 분할 기반 3d 모델 압축 및 압축해제 시스템 및 방법
US20220164994A1 (en) * 2020-11-24 2022-05-26 Samsung Electronics Co., Ltd. Overlapped patches for mesh coding for video based point cloud compression
CN113034385B (zh) * 2021-03-01 2023-03-28 嘉兴丰鸟科技有限公司 一种基于分块的网格生成及渲染方法
TWI807449B (zh) 2021-10-15 2023-07-01 國立臺灣科技大學 多視角立體影像產生方法及系統
US20230306647A1 (en) * 2022-03-25 2023-09-28 Tencent America LLC Geometry filtering for mesh compression
CN114567775B (zh) * 2022-04-29 2022-09-09 中国科学技术大学 图像划分方法和装置
TWI812548B (zh) * 2022-11-22 2023-08-11 宏碁股份有限公司 生成並排三維影像的方法及電腦裝置
TWI817875B (zh) * 2022-12-23 2023-10-01 宏碁股份有限公司 基於多執行緒產生三維影像的電子裝置和方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009151754A (ja) * 2001-03-16 2009-07-09 Mitsubishi Electric Research Laboratories Inc グラフィクスモデル変換装置及びグラフィクスモデル変換装置としてコンピュータを機能させるグラフィクスモデル処理プログラム
JP2010218588A (ja) * 2001-11-27 2010-09-30 Samsung Electronics Co Ltd 深さイメージに基づく3次元客体の表現装置、3次元客体の表現方法およびその記録媒体
JP2013507701A (ja) * 2009-10-15 2013-03-04 トムソン ライセンシング メッシュ・モデルを符号化する方法及び装置、符号化されたメッシュ・モデル、並びに、メッシュ・モデルを復号化する方法及び装置
US20130106852A1 (en) * 2011-11-02 2013-05-02 Ben Woodhouse Mesh generation from depth images
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5345490A (en) 1991-06-28 1994-09-06 General Electric Company Method and apparatus for converting computed tomography (CT) data into finite element models
US5448686A (en) 1992-01-02 1995-09-05 International Business Machines Corporation Multi-resolution graphic representation employing at least one simplified model for interactive visualization applications
FR2794881B1 (fr) * 1999-06-10 2001-08-17 France Telecom Procede de codage d'un maillage par conquete sur les aretes, privilegiant un sommet complet en que pivot, et procede de decodage correspondant
CA2373707A1 (en) * 2001-02-28 2002-08-28 Paul Besl Method and system for processing, compressing, streaming and interactive rendering of 3d color image data
CN1261912C (zh) * 2001-11-27 2006-06-28 三星电子株式会社 基于深度图像表示三维物体的装置和方法
CN1910625A (zh) * 2004-01-13 2007-02-07 皇家飞利浦电子股份有限公司 具有内部离散元件的网络模型
US7586489B2 (en) 2005-08-01 2009-09-08 Nvidia Corporation Method of generating surface defined by boundary of three-dimensional point cloud
WO2007023427A2 (en) * 2005-08-22 2007-03-01 Koninklijke Philips Electronics N.V. Triangulation method of a surface of a physical object
CN101390129A (zh) * 2006-02-28 2009-03-18 仁爱米拉索莱有限公司 用于分析对象聚群的方法和设备
EP2319248A1 (en) * 2008-08-26 2011-05-11 Koninklijke Philips Electronics N.V. Method and system for encoding a 3d video signal, encoder for encoding a 3-d video signal, encoded 3d video signal, method and system for decoding a 3d video signal, decoder for decoding a 3d video signal
US8577085B2 (en) * 2009-01-30 2013-11-05 Microsoft Corporation Visual target tracking
CN101650836B (zh) * 2009-09-10 2011-03-30 北京农业信息技术研究中心 三维植物器官几何曲面自适应网格化方法及系统
CN101877022B (zh) * 2010-05-21 2012-06-20 西安电子科技大学 基于三角矢量基函数矩量法的载体天线结构网格划分方法
WO2013117001A1 (en) * 2012-02-09 2013-08-15 Thomson Licensing Efficient compression of 3d models based on octree decomposition
CN102867331A (zh) * 2012-08-31 2013-01-09 电子科技大学 面向gpu的大规模地形快速绘制方法
EP2983369A4 (en) * 2013-04-23 2016-10-26 Samsung Electronics Co Ltd A MULTI-POINT VIEW VIDEO ENCODING METHOD USING A POINT OF SIGHT SYNTHESIS PREDICTION AND APPARATUS THEREFOR AND MULTI-POINT VIEW POINT VIDEO DECODING METHOD AND APPARATUS THEREOF
CN103489222B (zh) * 2013-09-06 2016-06-22 电子科技大学 三维图像中的目标体表面重构法
EP3092806A4 (en) * 2014-01-07 2017-08-23 Nokia Technologies Oy Method and apparatus for video coding and decoding
CN104036532B (zh) * 2014-05-29 2017-03-15 浙江工业大学 基于三维到二维服装图案无缝映射的服装制作方法
CN104077804B (zh) * 2014-06-09 2017-03-01 广州嘉崎智能科技有限公司 一种基于多帧视频图像构建三维人脸模型的方法
CN104915986B (zh) * 2015-06-26 2018-04-17 北京航空航天大学 一种实体三维模型自动建模方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009151754A (ja) * 2001-03-16 2009-07-09 Mitsubishi Electric Research Laboratories Inc グラフィクスモデル変換装置及びグラフィクスモデル変換装置としてコンピュータを機能させるグラフィクスモデル処理プログラム
JP2010218588A (ja) * 2001-11-27 2010-09-30 Samsung Electronics Co Ltd 深さイメージに基づく3次元客体の表現装置、3次元客体の表現方法およびその記録媒体
JP2013507701A (ja) * 2009-10-15 2013-03-04 トムソン ライセンシング メッシュ・モデルを符号化する方法及び装置、符号化されたメッシュ・モデル、並びに、メッシュ・モデルを復号化する方法及び装置
US20130106852A1 (en) * 2011-11-02 2013-05-02 Ben Woodhouse Mesh generation from depth images
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding

Also Published As

Publication number Publication date
CA2999193A1 (en) 2017-03-30
WO2017050858A1 (en) 2017-03-30
US10546421B2 (en) 2020-01-28
EP3353748B1 (en) 2022-08-03
US20190057545A1 (en) 2019-02-21
CN108027983A (zh) 2018-05-11
EP3353748A1 (en) 2018-08-01
RU2018114688A (ru) 2019-10-23
JP6927980B2 (ja) 2021-09-01
CN108027983B (zh) 2022-04-19
KR102659114B1 (ko) 2024-04-23
TW201721587A (zh) 2017-06-16
RU2018114688A3 (ja) 2020-03-16
KR20180058762A (ko) 2018-06-01
TWI723048B (zh) 2021-04-01

Similar Documents

Publication Publication Date Title
JP6927980B2 (ja) 3次元画像のための三角形メッシュの生成
JP7250952B2 (ja) 点群コーディングのための方法、装置、およびコンピュータプログラム
JP5654138B2 (ja) 3dヒューマンマシンインターフェースのためのハイブリッドリアリティ
KR101468267B1 (ko) 중간 뷰 합성 및 멀티-뷰 데이터 신호 추출
US20140198182A1 (en) Representation and Coding of Multi-View Images Using Tapestry Encoding
US20060078180A1 (en) Video filtering for stereo images
US20120026289A1 (en) Video processing device, video processing method, and memory product
US11836953B2 (en) Video based mesh compression
KR102538939B1 (ko) 텍스처 맵들 및 메시들에 기초한 3d 이미지 정보의 처리
WO2009091563A1 (en) Depth-image-based rendering
JP2011523743A (ja) 深さ情報を有するビデオ信号
WO2019166107A1 (en) Apparatus and method for picture coding with selective loop-filtering
JP7448660B2 (ja) ポイントクラウドデータ送信装置、ポイントクラウドデータ送信方法、ポイントクラウドデータ受信装置及びポイントクラウドデータ受信方法
US9196080B2 (en) Medial axis decomposition of 2D objects to synthesize binocular depth
KR20220011180A (ko) 체적 비디오 인코딩 및 디코딩을 위한 방법, 장치 및 컴퓨터 프로그램
US20210241496A1 (en) Method and apparatus for encoding and decoding volumetric video data
US11240512B2 (en) Intra-prediction for video coding using perspective information
US20220084282A1 (en) Image processing device, image generation method, and image processing method
Mieloch et al. Graph-based multiview depth estimation using segmentation
US20210217229A1 (en) Method and apparatus for plenoptic point clouds generation
WO2022201787A1 (ja) 画像処理装置および方法
US20240137530A1 (en) Method for decoding immersive video and method for encoding immersive video
US11823323B2 (en) Apparatus and method of generating an image signal
KR20220067517A (ko) 다시점 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20220071126A (ko) 다시점 영상 기반 플렌옵틱 포인트 클라우드 생성 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210805

R150 Certificate of patent or registration of utility model

Ref document number: 6927980

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150