JP2022542419A - 点群表現を介したメッシュ圧縮 - Google Patents

点群表現を介したメッシュ圧縮 Download PDF

Info

Publication number
JP2022542419A
JP2022542419A JP2022506276A JP2022506276A JP2022542419A JP 2022542419 A JP2022542419 A JP 2022542419A JP 2022506276 A JP2022506276 A JP 2022506276A JP 2022506276 A JP2022506276 A JP 2022506276A JP 2022542419 A JP2022542419 A JP 2022542419A
Authority
JP
Japan
Prior art keywords
mesh
pcc
layer
encoding
patch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022506276A
Other languages
English (en)
Other versions
JP7303992B2 (ja
Inventor
ダニーロ グラジオッシ
央二 中神
アレクサンドル ザゲットー
アリ タバタバイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Sony Group Corp
Original Assignee
Sony Corp
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Group Corp filed Critical Sony Corp
Publication of JP2022542419A publication Critical patent/JP2022542419A/ja
Application granted granted Critical
Publication of JP7303992B2 publication Critical patent/JP7303992B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/08Volume rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Graphics (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Generation (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本明細書では、投影ベースの手法を使用し、投影ベースの点群圧縮のために既に生成されているツール及び構文を活用してメッシュを圧縮する方法について説明する。メッシュは、V-PCC手法と同様に表面パッチにセグメント化され、唯一の相違点はセグメントがメッシュの連結性に従う点である。各表面パッチ(又は3Dパッチ)は2Dパッチに投影され、これによってメッシュの場合、三角形表面サンプリングは、コンピュータグラフィックスで使用される一般的なラスタ化手法と同様である。投影された頂点の位置は、これらの頂点の連結性と共にパッチ毎にリスト内に保持される。サンプリングされた表面はこの時点で点群に類似し、点群圧縮に使用される同じ手法で符号化される。また、頂点及び連結性のリストがパッチ毎に符号化され、このデータが符号化された点群データと共に送信される。【選択図】 図1

Description

〔関連出願との相互参照〕
本出願は、2019年12月10日に出願された「点群表現を介したメッシュ圧縮(MESH COMPRESSION VIA POINT CLOUD REPRESENTATION)」という名称の米国仮特許出願第62/946,194号の米国特許法第119条に基づく優先権を主張するものであり、この文献は全ての目的でその全体が引用により本明細書に組み入れられる。
本発明は、3次元グラフィックスに関する。具体的には、本発明は、3次元グラフィックスの符号化に関する。
近年、3Dから2Dへの投影に基づいて点群を圧縮する新規方法が標準化されている。このV-PCC(ビデオベースの点群圧縮)としても知られている方法は、3D点群データを複数の2Dパッチにマッピングした後に、さらにこれらのパッチをアトラス画像に編成し、その後にビデオエンコーダで符号化する。アトラス画像は、点の幾何形状、それぞれのテクスチャ、及びどの位置を点群再構成のために検討すべきであるかを示す占有マップに対応する。
2017年、MPEGは、点群圧縮のための公募要領(call for proposal:CfP)を発行した。現在MPEGは、複数の提案の評価後に、(八分木及び同様の符号化法に基づく)3Dネイティブ符号化技術、又は3Dから2Dへの投影後に従来のビデオ符号化を行うもの、という2つの異なる点群圧縮技術を検討している。動的3Dシーンの場合、MPEGは、パッチ表面モデリング、3Dから2D画像へのパッチの投影、及びHEVCなどのビデオエンコーダを使用した2D画像の符号化に基づく試験モデルソフトウェア(TMC2)を使用している。この方法は、ネイティブな3D符号化よりも効率的であり、容認可能な品質で競争的ビットレートを達成できることが証明されている。
この標準は、(ビデオベースの方法又はV-PCCとしても知られている)投影ベースの方法の3D点群符号化の成功を受けて、将来のバージョンでは3Dメッシュなどのさらなる3Dデータを含むことが予想されている。しかしながら、この標準の現在のバージョンは、一連の未連結の点の送信にしか適しておらず、従って3Dメッシュ圧縮で必要とされるような点の連結性を送信する機構は存在しない。
V-PCCの機能をメッシュに拡張する方法も提案されてきた。1つの可能な方法は、V-PCCを使用して頂点を符号化した後に、TFAN又はEdgebreakerなどのメッシュ圧縮法を使用して連結性を符号化するものである。この方法の限界は、頂点から生成された点群が疎であることなく投影後に効率的に符号化できるように、元々のメッシュが密である必要があるという点である。さらに、頂点の順序が連結性の符号化に影響を与えるため、メッシュ連結性を再編する異なる方法が提案されている。疎なメッシュを符号化する別の方法は、RAWパッチデータを使用して3Dにおける頂点位置を符号化するものである。RAWパッチは直接符号化(x,y,z)を行うので、この方法では、全ての頂点がRAWデータとして符号化される一方で、上述したような同様のメッシュ圧縮法によって連結性が符号化される。RAWパッチでは、いずれかの好ましい順序で頂点を送信することができ、従って連結性符号化から生じた順序を使用することができる。この方法は疎な点群を符号化することはできるが、RAWパッチは3Dデータの符号化効率が悪く、この手法からは三角面の属性などのさらなるデータが失われることがある。
本明細書では、投影ベースの手法を使用し、投影ベースの点群圧縮のために既に生成されているツール及び構文を活用してメッシュを圧縮する方法について説明する。メッシュは、V-PCC手法と同様に表面パッチにセグメント化され、唯一の相違点はセグメントがメッシュの連結性に従う点である。各表面パッチ(又は3Dパッチ)は2Dパッチに投影され、これによってメッシュの場合、三角形表面サンプリングは、コンピュータグラフィックスで使用される一般的なラスタ化手法と同様である。投影された頂点の位置は、これらの頂点の連結性と共にパッチ毎にリスト内に保持される。サンプリングされた表面はこの時点で点群に類似し、点群圧縮に使用される同じ手法で符号化される。また、頂点及び連結性のリストがパッチ毎に符号化され、このデータが符号化された点群データと共に送信される。
さらなる連結性データは、各パッチのために生成されたベースメッシュとして解釈され、この追加データを使用するか否かの柔軟性をデコーダに与えることができる。このデータを使用して、レンダリング及び点フィルタリングアルゴリズムを改善することができる。さらに、メッシュは、投影ベースの圧縮の同じ原理を使用して符号化され、これによって現在の投影ベースの点群符号化のV-PCC手法との統合が良好になる。
1つの態様では、装置の非一時的メモリにプログラムされた方法が、入力メッシュに対してメッシュボクセル化を実行するステップと、パッチ生成を実行することによって、メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化するステップと、ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成するステップと、頂点位置及び連結性情報を使用してベースメッシュ符号化を実行するステップと、V-PCC画像及びベースメッシュ符号化に基づいてV-PCCビットストリームを生成するステップと、を含む。メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングするステップを含む。メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、最も低い頂点値がゼロを上回るようにメッシュ値をシフトさせるステップを含む。パッチ生成を実行するステップは、三角形毎の法線を計算するステップを含む。三角形の法線を計算するステップは、エッジ間の外積を使用するステップを含む。方法は、法線に従って三角形をカテゴリ分けするステップをさらに含む。方法は、隣接する三角形を分析することによって精細化プロセスを実行するステップをさらに含む。ベースメッシュ符号化は、頂点の(u,v)座標を符号化するステップを含む。V-PCCビットストリームを生成するステップは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する。マルチレイヤ実装の第1のレイヤは未加工点群を含み、マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、マルチレイヤ実装の第3のレイヤは密なメッシュを含む。方法は、各パッチのさらなる連結性データを含むベースメッシュを生成するステップをさらに含み、さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、さらなる連結性データはレンダリング及び点フィルタリングを改善する。連結性情報は、色コードに基づいて符号化される。V-PCC画像及びベースメッシュ符号化に基づいてV-PCCビットストリームを生成するステップは、パッチ毎の連結性情報を利用する。
別の態様では、装置が、入力メッシュに対してメッシュボクセル化を実行し、パッチ生成を実行することによって、メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化し、ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成し、頂点位置及び連結性情報を使用してベースメッシュ符号化を実行し、V-PCC画像及びベースメッシュ符号化に基づいてV-PCCビットストリームを生成するためのアプリケーションを記憶する非一時的メモリと、メモリに結合されてアプリケーションを処理するように構成されたプロセッサと、を含む。メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングすることを含む。メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、最も低い頂点値がゼロを上回るようにメッシュ値をシフトさせることを含む。パッチ生成を実行することは、三角形毎の法線を計算することを含む。三角形の法線を計算することは、エッジ間の外積を使用することを含む。アプリケーションは、さらに法線に従って三角形をカテゴリ分けする。アプリケーションは、さらに隣接する三角形を分析することによって精細化プロセスを実行する。ベースメッシュ符号化は、頂点の(u,v)座標を符号化することを含む。V-PCCビットストリームを生成することは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する。マルチレイヤ実装の第1のレイヤは未加工点群を含み、マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、マルチレイヤ実装の第3のレイヤは密なメッシュを含む。アプリケーションは、さらに各パッチのさらなる連結性データを含むベースメッシュを生成し、さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、さらなる連結性データはレンダリング及び点フィルタリングを改善する。連結性情報は、色コードに基づいて符号化される。V-PCC画像及びベースメッシュ符号化に基づいてV-PCCビットストリームを生成することは、パッチ毎の連結性情報を利用する。
別の態様では、システムが、3次元コンテンツを取得する1又は2以上のカメラと、入力メッシュに対してメッシュボクセル化を実行し、パッチ生成を実行することによって、メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化し、ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成し、頂点位置及び連結性情報を使用してベースメッシュ符号化を実行し、V-PCC画像及びベースメッシュ符号化に基づいてV-PCCビットストリームを生成することによって3次元コンテンツを符号化するエンコーダと、を含む。メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングすることを含む。メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、最も低い頂点値がゼロを上回るようにメッシュ値をシフトさせることを含む。パッチ生成を実行することは、三角形毎の法線を計算することを含む。三角形の法線を計算することは、エッジ間の外積を使用することを含む。エンコーダは、さらに法線に従って三角形をカテゴリ分けする。エンコーダ、さらに隣接する三角形を分析することによって精細化プロセスを実行する。ベースメッシュ符号化は、頂点の(u,v)座標を符号化することを含む。V-PCCビットストリームを生成することは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する。マルチレイヤ実装の第1のレイヤは未加工点群を含み、マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、マルチレイヤ実装の第3のレイヤは密なメッシュを含む。エンコーダは、各パッチのさらなる連結性データを含むベースメッシュを生成するようにさらに構成され、さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、さらなる連結性データはレンダリング及び点フィルタリングを改善する。連結性情報は、色コードに基づいて符号化される。V-PCC画像及びベースメッシュ符号化に基づいてV-PCCビットストリームを生成することは、パッチ毎の連結性情報を利用する。
いくつかの実施形態によるメッシュ圧縮法を示す図である。 いくつかの実施形態によるメッシュボクセル化を示す図である。 いくつかの実施形態による、パッチ生成に関連する画像を示す図である。 いくつかの実施形態による、点群表現のための投影された三角形の図である。 いくつかの実施形態による頂点及び三角形の例示的な画像を示す図である。 いくつかの実施形態による、三角形連結性を示す幾何学的画像の色チャネルを使用することによって連結性を符号化する例を示す図である。 いくつかの実施形態による、ベースメッシュシグナリングのためのネットワーク抽象レイヤ(NAL)ユニット及びマルチレイヤ実装を示す図である。 いくつかの実施形態による、ベースメッシュシグナリングのためのマルチレイヤ実装を示す図である。 いくつかの実施形態による幾何形状精細化の図である。 いくつかの実施形態による、メッシュ圧縮法を使用した点群レンダリングのフローチャートを示す図である。 いくつかの実施形態による、メッシュ圧縮法を実装するように構成された例示的なコンピュータ装置のブロック図である。
上記では、メッシュ表面の点群表現を使用した3Dメッシュデータの圧縮法について説明した。実施形態は、3D表面パッチを利用して点群を表し、3Dパッチ表面データから2Dキャンバス画像への時間的に一貫したグローバルマッピングを実行する。
ビデオエンコーダを使用した3D点群符号化では、点群を表すビデオを生成するために3Dから2Dへの投影が重要である。これらのビデオを生成する最も効率的な方法は、3Dパッチを使用することによって物体の表面をセグメント化し、正射影を使用して、共にバンドル化されてビデオエンコーダの入力として使用されるセグメント化された深度画像を生成することである。現在の点群標準では、メッシュの連結性を符号化する規定の方法が存在しないため、3Dメッシュを符号化することができない。さらに、この標準は頂点間の相関性を活用することができないので、頂点データが疎である場合には上手く機能しない。
本明細書では、点群圧縮のためのビデオベースの標準を使用してメッシュの符号化を実行する方法について説明する。メッシュ表面のセグメント化、接合面サンプリング、及び2Dパッチ生成法を開示する。また、開示する方法は、各パッチが局所的連結性のために符号化されることを説明し、頂点の位置が2Dパッチに投影される。連結性及び頂点位置をシグナリングして元々の入力メッシュの再構成を可能にする方法についても説明する。
実施形態は、テクスチャなどのメッシュ属性を含む密な時変メッシュ(dense time-varying meshes)に適用することができる。
図1に、いくつかの実施形態によるメッシュ圧縮法を示す。ステップ100において、入力メッシュに対してメッシュボクセル化が実行される。メッシュボクセル化は、入力メッシュの点の位置の浮動小数点値を整数に変換するものである。整数の精度は、ユーザによって又は自動的に設定することができる。いくつかの実施形態では、メッシュボクセル化が、負数が存在しないように値をシフトさせることを含む。ステップ102において、パッチ形成/生成を実行することによってメッシュをパッチにセグメント化する。パッチ生成は、1)ラスタライズされたメッシュ表面、並びに2)頂点位置及び連結性情報も生成する。ラスタライズされたメッシュ表面は、ステップ104においてV-PCC画像生成を経てV-PCC画像として符号化される点集合である。頂点位置及び連結性情報は、ステップ106においてベースメッシュ符号化のために受け取られる。ステップ108において、V-PCC画像生成及びベースメッシュ符号化に基づいてV-PCCビットストリームが生成される。いくつかの実施形態では、これよりも少ない又はさらなるステップが実行される。いくつかの実施形態では、ステップの順序が変更される。
メッシュボクセル化
図2に、いくつかの実施形態によるメッシュボクセル化を示す。画像200に示すように、元々のメッシュは軸線未満であることによって負数を生じる。メッシュは、メッシュボクセル化を介して負の値及び非整数値を避けるようにシフト及び/又はスケーリングされる。1つの実装では、ゼロ未満の最も低い頂点値が見つかると、最も低い頂点値がゼロを上回るようにこれらの値をシフトさせることができる。いくつかの実施形態では、これらの値の範囲が(例えば、スケーリングによって)11ビットなどの指定ビット範囲に収まる。
画像202は、元々のメッシュとボクセル化されたメッシュとの間に知覚的相違がないことを示す。
パッチ生成
本明細書で説明するパッチ生成は、V-PCCのパッチ生成と同様である。しかしながら、点毎の法線を計算する代わりに三角形毎の法線を計算する。エッジ間の外積を使用して三角形毎の法線を計算して法線ベクトルを決定する。次に、法線に従って三角形をカテゴリ分けする。例えば、法線を前、後、上、下、左及び右などのn個(例えば、6つ)のカテゴリに分割する。これらの法線は、初期セグメンテーションを示す異なる色で示される。図3の画像300は、異なる色が異なる法線を示すように異なる色を黒色及びライトグレーなどのグレースケールで示す。画像300では見えづらいかもしれないが、上面(例えば、人物の頭頂部、ボールの上部及びスニーカーの上部)は1つの色(例えば、緑色)であり、人物/ボールの第1の側面は非常に暗くて別の色(例えば、赤色)を表し、ボールの下部は別の色(例えば、紫色)であり、ほとんどがライトグレーである人物及びボールの正面は別の色(例えば、シアン)を表す。
法線の積に方向を乗算することによって主要方向を発見することができる。隣接する三角形に目を向けることによって平滑化/精細化プロセスを実行することもできる。例えば、閾値を上回る数の隣接する三角形が全て青色である場合には、たとえ最初に三角形が赤色であることを示す異常が存在していた場合でも、この三角形も青色として分類することができる。例えば、参照符号302によって示す赤色の三角形は、参照符号304で示すようにシアンに補正することができる。
画像310は、法線ベクトルを含む三角形の例を示す。
三角形の連結成分は、どの三角形が同じ色を有するか(例えば、少なくとも1つの頂点を共有する同じカテゴリの三角形)を識別するように生成される。
連結性情報は、3Dにおいてどのように点が連結されているかを表す。これらの連結(具体的には、3つの点を共有する3つの異なる連結)が組み合わさって三角形を生成し、結果としてこれらの三角形が(三角形の集合によって表される)表面を生成する。本明細書では三角形について説明しているが、他の幾何形状(例えば、矩形)も可能である。
色は、異なる色の三角形を識別することによって連結性を符号化するために使用することができる。3つの連結によって識別される各三角形は固有の色で符号化される。
このメッシュを2D表面上に投影することにより、三角形の投影によって覆われる領域も画素の集合によって決定される。グループ分けした画素を異なる色で符号化すれば、画像内の異なる色によって三角形を識別することができる。三角形が分かると、三角形を形成する3つの連結のみを識別することによって連結性を取得することができる。
各三角形はパッチに投影される。投影された頂点の位置が既に占有されている場合、三角形は別のパッチに符号化され、従って失われた三角形リストが後で再び処理されるようになる。或いは、マップを使用して重複する頂点を識別し、さらに重複する頂点を含む三角形を表すこともできる。別の選択肢では、点を別々のレイヤに分離することもできる(例えば、1つのレイヤ内の1つの点集合及び第2のレイヤ内の第2の点集合)。
三角形は、点群表現のための点を生成するようにラスタライズされる。
図4に、いくつかの実施形態による、点群表現のための投影された三角形の図を示す。三角形400は、グリッド402(例えば、三角形の2D投影)に投影されている。グリッド402内の各正方形は点群における点である。頂点の元々の点である点が存在する。点は、投影されると、ボクセル化されて図示のような位置に投影される。2D投影内の点404は、元々のメッシュ上の頂点をマーキングする。三角形400の領域では、表面をラスタライズすることによって点が生成される。三角形内のグリッド要素は、点群における点になってメッシュから点群を生成する(例えば、投影面上でラスタ化が実行される)。
点群に追加された点はメッシュの構造に従い、従って点群幾何形状は基礎を成すメッシュと同じぐらい疎であることができる。しかしながら、この幾何形状は、各ラスタライズされた画素のさらなる位置を送信することによって改善することができる。
ベースメッシュ符号化
パッチ内の点のリストは三角形の頂点であり、メッシュの連結性は投影後も同じである。図5に、いくつかの実施形態による頂点及び三角形の例示的な画像を示す。頂点は黒色の点であり、連結性は黒色の点を連結する線である。
連結性は(例えば、色コードに基づいて)符号化される。いくつかの実施形態では、整数値のリストが符号化される。リスト内の差分パルス符号変調(DPCM)を使用することができる。いくつかの実施形態では、リストを精細化することができ、又はスマートメッシュ符号化を実行することができる。いくつかの実施形態では、(例えば、いずれも符号化アルゴリズムであるEdgebreaker又はTFANを使用する)さらに高度な手法も可能である。
いくつかの実施形態では、頂点の(x,y,z)ではなく(u,v)座標が符号化される。(u,v)座標は、(例えば、頂点が投影された)2Dグリッド上の位置である。(x,y,z)情報は、幾何学的画像内の投影から決定することができる。DPCM法も可能である。いくつかの実施形態では、(u,v)座標がリスト内に記憶される。順序は、連結性によって決定することができる。連結性に基づいて、いくつかの頂点は連結しており、従って連結された頂点の(u,v)の値は類似するはずであることが分かり、これによって平行四辺形予測(例えば、Draco、メッシュ圧縮アルゴリズム)などの予測も可能になる。
図6に、いくつかの実施形態による、三角形連結性を示す幾何学的画像の色チャネルを使用することによって連結性を符号化する例を示す。例えば、いくつかの三角形が同じものである場合、色によって三角形及びメッシュの連結性が識別されるように、これらの三角形を黄色とし、異なる三角形を青色などとすることができる。
ベースメッシュシグナリング
その他の情報はパッチ毎に送信される。各パッチ情報内では、連結成分(例えば、頂点)のリスト及び2D空間内の頂点の位置が送信される。より効率的な表記法は、本明細書で説明するような顔及び頂点のためのDPCMスキームを使用することもできる。
図7に、いくつかの実施形態による、ベースメッシュのシグナリングのためのネットワーク抽象レイヤ(NAL)ユニット及びマルチレイヤ実装を示す。NAL700は、ヘッダ、グループレイヤ、顔の数、頂点の数、顔の数及び頂点位置などの情報を含む。
いくつかの実施形態では、NALにおけるマルチレイヤ実装を使用して、連結性情報を含む追加レイヤを送信する。マルチレイヤ実装で利用されるV-PCCユニットストリーム702を示す。第1のレイヤ(例えば、レイヤ0)は点群を定め、レイヤ1はメッシュレイヤを定める。いくつかの実施形態では、レイヤが互いに関連する。いくつかの実施形態では、追加レイヤが利用される。
図8に、いくつかの実施形態による、ベースメッシュシグナリングのためのマルチレイヤ実装を示す。階層表現では、layer_idを使用して異なる解像度のメッシュを送信することができる。例えば、レイヤ0は未加工点群であり、レイヤ1は疎なメッシュであり、レイヤ2は密なメッシュである。追加レイヤを実装することもできる(例えば、レイヤ3は非常に密なメッシュである)。いくつかの実施形態ではレイヤの順序が異なり、例えばレイヤ0が密なメッシュであり、レイヤ1が疎なメッシュであり、レイヤ2が未加工点群である。いくつかの実施形態では、追加レイヤが前のレイヤとの相違又は差分(delta)のみを提供する。例えば、図8に示すように、レイヤ1は3つの三角形を有し、レイヤ2は6つの三角形を有し、大きな三角形は4つの三角形に分割され、大きな三角形の分割(例えば、4つの三角形)はレイヤ2に含まれる。
パッチデータユニット構文は、以下を含むように修正することができる。
Figure 2022542419000002
いくつかの実施形態では、TFAN又はEdgebreakerなどを使用する別の符号化を実装して、頂点の平行四辺形予測及び/又はDPCM符号化を使用してパッチ連結性を符号化する。
図9に、いくつかの実施形態による幾何形状精細化の図を示す。より正確な点の位置は、ベースメッシュ表面から点群の実際の位置に差分情報を送信することによって改善することができる。メッシュ表面がラスタライズされている場合、生成される点群は、メッシュ表面と同様の疎であることができる幾何形状を有するようになる。差分情報は、メッシュ表面からの差分を送信することによって取得することができ、メッシュの法線方向を検討することもできる。
本明細書で説明したように、三角形は平面とみなされるので、三角形毎のさらなる情報を送信することができる。
レンダリング最適化及び幾何形状フィルタリングを実装することもできる。ベースメッシュは表面を示すので、三角形の境界に含まれる全ての点は論理的に連結される。点を再投影すると、幾何形状の相違及び異なるベースライン距離に起因して穴が現れることがある。しかしながら、レンダラーは、基礎を成すメッシュ情報を使用して再投影を改善することができる。レンダラーは、表面内で点が論理的に連結されているはずであることをメッシュから認識しているので、たとえ他のいずれかの情報を送信しなくても補間点を生成して穴を閉じることができる。
例えば、点群には投影に起因して穴が存在する瞬間があるが、表面は三角形によって表されたものであることが分かっているので、この表面上では全ての点が満たされるはずであり、従ってたとえメッシュ表現から点が明確に符号化されていなくても、幾何形状フィルタリングを使用して失われた点を満たすことができる。
本明細書で説明したように、メッシュ圧縮法は投影ベースの手法を使用し、本明細書では、投影ベースの点群圧縮のために既に生成されているツール及び構文を活用することについて説明する。メッシュは、V-PCC手法と同様に表面パッチにセグメント化され、唯一の相違点はセグメントがメッシュの連結性に従う点である。各表面パッチ(又は3Dパッチ)は2Dパッチに投影され、これによってメッシュの場合、三角形表面サンプリングは、コンピュータグラフィックスで使用される一般的なラスタ化手法と同様である。投影された頂点の位置は、これらの頂点の連結性と共にパッチ毎にリスト内に保持される。サンプリングされた表面はこの時点で点群に類似し、点群圧縮に使用される同じ手法で符号化される。また、頂点及び連結性のリストがパッチ毎に符号化され、このデータが符号化された点群データと共に送信される。
さらなる連結性データは、各パッチのために生成されたベースメッシュとして解釈され、この追加データを使用するか否かの柔軟性をデコーダに与えることができる。このデータを使用して、レンダリング及び点フィルタリングアルゴリズムを改善することができる。さらに、メッシュは、投影ベースの圧縮の同じ原理を使用して符号化され、これによって現在の投影ベースの点群符号化のV-PCC手法との統合が良好になる。
図10に、いくつかの実施形態による、メッシュ圧縮法を使用した点群レンダリングのフローチャートを示す。ステップ1000において、V-PCCを使用してメッシュを符号化し、及び/又は符号化されたメッシュを(例えば、装置において)受け取る。ステップ1002において、符号化されたメッシュをV-PCCデコーダによって復号し、これによって点群1004及びメッシュ1006を得る。ステップ1008において、点群1004及びメッシュ1006に点群フィルタリングを適用する。フィルタリングされた点群及びメッシュ1006は、ステップ1010の点群レンダリングにおいて使用される。いくつかの実施形態では、これよりも少ない又はさらなるステップが実行される。いくつかの実施形態では、ステップの順序が変更される。
図11に、いくつかの実施形態による、メッシュ圧縮法を実行するように構成された例示的なコンピュータ装置のブロック図を示す。コンピュータ装置1100は、3Dコンテンツを含む画像及びビデオなどの情報の取得、記憶、計算、処理、通信及び/又は表示のために使用することができる。コンピュータ装置1100は、メッシュ圧縮の態様のいずれかを実装することができる。一般に、コンピュータ装置1100を実装するのに適したハードウェア構造は、ネットワークインターフェイス1102、メモリ1104、プロセッサ1106、I/O装置1108、バス1110及び記憶装置1112を含む。プロセッサの選択は、十分な速度の好適なプロセッサが選択される限り重要ではない。メモリ1104は、当業で周知のいずれかの従来のコンピュータメモリとすることができる。記憶装置1112は、ハードドライブ、CDROM、CDRW、DVD、DVDRW、高精細ディスク/ドライブ、ウルトラHDドライブ、フラッシュメモリカード、又はその他のいずれかの記憶装置を含むことができる。コンピュータ装置1100は、1又は2以上のネットワークインターフェイス1102を含むことができる。ネットワークインターフェイスの例としては、イーサネット又は他のタイプのLANに接続されたネットワークカードが挙げられる。(単複の)I/O装置1108は、キーボード、マウス、モニタ、画面、プリンタ、モデム、タッチ画面、ボタンインターフェイス及びその他の装置のうちの1つ又は2つ以上を含むことができる。記憶装置1112及びメモリ1104には、メッシュ圧縮法を実行するために使用される(単複の)メッシュ圧縮アプリケーション1130が記憶されて、アプリケーションが通常処理されるように処理される可能性が高い。コンピュータ装置1100には、図11に示すものよりも多くの又は少ないコンポーネントを含めることもできる。いくつかの実施形態では、メッシュ圧縮ハードウェア1120が含まれる。図11のコンピュータ装置1100は、メッシュ圧縮法のためのアプリケーション1130及びハードウェア1120を含むが、メッシュ圧縮法は、ハードウェア、ファームウェア、ソフトウェア、又はこれらのいずれかの組み合わせでコンピュータ装置上に実装することもできる。例えば、いくつかの実施形態では、メッシュ圧縮アプリケーション1130がメモリにプログラムされ、プロセッサを使用して実行される。別の例として、いくつかの実施形態では、メッシュ圧縮ハードウェア1120が、メッシュ圧縮法を実装するように特別に設計されたゲートを含むプログラムされたハードウェアロジックである。
いくつかの実施形態では、(単複の)メッシュ圧縮アプリケーション730が、複数のアプリケーション及び/又はモジュールを含む。いくつかの実施形態では、モジュールが1又は2以上のサブモジュールも含む。いくつかの実施形態では、これよりも少ない又はさらなるモジュールを含めることもできる。
好適なコンピュータ装置の例としては、パーソナルコンピュータ、ラップトップコンピュータ、コンピュータワークステーション、サーバ、メインフレームコンピュータ、ハンドヘルドコンピュータ、携帯情報端末、セルラ/携帯電話機、スマート家電、ゲーム機、デジタルカメラ、デジタルカムコーダ、カメラ付き電話機、スマートホン、ポータブル音楽プレーヤ、タブレットコンピュータ、モバイル装置、ビデオプレーヤ、ビデオディスクライタ/プレーヤ(DVDライタ/プレーヤ、高精細ディスクライタ/プレーヤ、超高精細ディスクライタ/プレーヤなど)、テレビ、家庭用エンターテイメントシステム、拡張現実装置、仮想現実装置、スマートジュエリ(例えば、スマートウォッチ)、車両(例えば、自動走行車両)、又はその他のいずれかの好適なコンピュータ装置が挙げられる。
メッシュ圧縮法を利用するには、装置が3Dコンテンツを取得又は受信し、3Dコンテンツの正しい効率的な表示を可能にするように最適化された方法でコンテンツを処理及び/又は送信する。メッシュ圧縮法は、ユーザの支援を伴って、又はユーザの関与を伴わずに自動的に実行することができる。
動作中、メッシュ圧縮法は、これまでの実装に比べてより効率的かつ正確なメッシュ圧縮を可能にする。
例示的な実装では、本明細書で説明したメッシュ圧縮を1フレームのみ及び単一のマップと共にTMC2v8.0上に実装した。この実装からの情報は以下を含む。
Figure 2022542419000003
点群表現を介したメッシュ圧縮のいくつかの実施形態
1.装置の非一時的メモリにプログラムされた方法であって、
入力メッシュに対してメッシュボクセル化を実行するステップと、
パッチ生成を実行することによって、前記メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化するステップと、
前記ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成するステップと、
前記頂点位置及び連結性情報を使用してベースメッシュ符号化を実行するステップと、
前記V-PCC画像及び前記ベースメッシュ符号化に基づいてV-PCCビットストリームを生成するステップと、
を含む方法。
2.メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングするステップを含む、条項1の方法。
3.メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、前記最も低い頂点値がゼロを上回るように前記メッシュ値をシフトさせるステップを含む、条項2の方法。
4.パッチ生成を実行するステップは、三角形毎の法線を計算するステップを含む、条項1の方法。
5.前記三角形の前記法線を計算するステップは、エッジ間の外積を使用するステップを含む、条項4の方法。
6.前記法線に従って三角形をカテゴリ分けするステップをさらに含む、条項4の方法。
7.隣接する三角形を分析することによって精細化プロセスを実行するステップをさらに含む、条項4の方法。
8.ベースメッシュ符号化は、頂点の(u,v)座標を符号化するステップを含む、条項1の方法。
9.前記V-PCCビットストリームを生成するステップは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する、条項1の方法。
10.前記マルチレイヤ実装の第1のレイヤは未加工点群を含み、前記マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、前記マルチレイヤ実装の第3のレイヤは密なメッシュを含む、条項9の方法。
11.各パッチのさらなる連結性データを含むベースメッシュを生成するステップをさらに含み、前記さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、前記さらなる連結性データはレンダリング及び点フィルタリングを改善する、条項1の方法。
12.前記連結性情報は、色コードに基づいて符号化される、条項1の方法。
13.前記V-PCC画像及び前記ベースメッシュ符号化に基づいて前記V-PCCビットストリームを生成するステップは、パッチ毎の前記連結性情報を利用する、条項1の方法。
14.
入力メッシュに対してメッシュボクセル化を実行し、
パッチ生成を実行することによって、前記メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化し、
前記ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成し、
前記頂点位置及び連結性情報を使用してベースメッシュ符号化を実行し、
前記V-PCC画像及び前記ベースメッシュ符号化に基づいてV-PCCビットストリームを生成するためのアプリケーションを記憶する、
非一時的メモリと、
前記メモリに結合されて前記アプリケーションを処理するように構成されたプロセッサと、
を備える装置。
15.メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングすることを含む、条項14の装置。
16.メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、前記最も低い頂点値がゼロを上回るように前記メッシュ値をシフトさせることを含む、条項15の装置。
17.パッチ生成を実行することは、三角形毎の法線を計算することを含む、条項14の装置。
18.前記三角形の前記法線を計算することは、エッジ間の外積を使用することを含む、条項17の装置。
19.前記アプリケーションは、さらに前記法線に従って三角形をカテゴリ分けする、条項17の装置。
20.前記アプリケーションは、さらに隣接する三角形を分析することによって精細化プロセスを実行する、条項17の装置。
21.ベースメッシュ符号化は、頂点の(u,v)座標を符号化することを含む、条項14の装置。
22.前記V-PCCビットストリームを生成することは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する、条項14の装置。
23.前記マルチレイヤ実装の第1のレイヤは未加工点群を含み、前記マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、前記マルチレイヤ実装の第3のレイヤは密なメッシュを含む、条項22の装置。
24.前記アプリケーションは、さらに各パッチのさらなる連結性データを含むベースメッシュを生成し、前記さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、前記さらなる連結性データはレンダリング及び点フィルタリングを改善する、条項14の装置。
25.前記連結性情報は、色コードに基づいて符号化される、条項14の装置。
26.前記V-PCC画像及び前記ベースメッシュ符号化に基づいて前記V-PCCビットストリームを生成することは、パッチ毎の前記連結性情報を利用する、条項14の装置。
27.
3次元コンテンツを取得する1又は2以上のカメラと、
入力メッシュに対してメッシュボクセル化を実行し、
パッチ生成を実行することによって、前記メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化し、
前記ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成し、
前記頂点位置及び連結性情報を使用してベースメッシュ符号化を実行し、
前記V-PCC画像及び前記ベースメッシュ符号化に基づいてV-PCCビットストリームを生成することによって前記3次元コンテンツを符号化する、
エンコーダと、
を備えるシステム。
28.メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングすることを含む、条項27のシステム。
29.メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、前記最も低い頂点値がゼロを上回るように前記メッシュ値をシフトさせることを含む、条項28のシステム。
30.パッチ生成を実行することは、三角形毎の法線を計算することを含む、条項27のシステム。
31.前記三角形の前記法線を計算することは、エッジ間の外積を使用することを含む、条項30のシステム。
32.前記エンコーダは、さらに前記法線に従って三角形をカテゴリ分けする、条項30のシステム。
33.前記エンコーダ、さらに隣接する三角形を分析することによって精細化プロセスを実行する、条項30のシステム。
34.ベースメッシュ符号化は、頂点の(u,v)座標を符号化することを含む、条項27のシステム。
35.前記V-PCCビットストリームを生成することは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する、条項27のシステム。
36.前記マルチレイヤ実装の第1のレイヤは未加工点群を含み、前記マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、前記マルチレイヤ実装の第3のレイヤは密なメッシュを含む、条項35のシステム。
37.前記エンコーダは、各パッチのさらなる連結性データを含むベースメッシュを生成するようにさらに構成され、前記さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、前記さらなる連結性データはレンダリング及び点フィルタリングを改善する、条項27のシステム。
38.前記連結性情報は、色コードに基づいて符号化される、条項27のシステム。
39.前記V-PCC画像及び前記ベースメッシュ符号化に基づいて前記V-PCCビットストリームを生成することは、パッチ毎の前記連結性情報を利用する、条項27のシステム。
本発明の構成及び動作の原理を容易に理解できるように、詳細を含む特定の実施形態に関して本発明を説明した。本明細書におけるこのような特定の実施形態及びこれらの実施形態の詳細についての言及は、本明細書に添付する特許請求の範囲を限定することを意図したものではない。当業者には、特許請求の範囲によって定められる本発明の趣旨及び範囲から逸脱することなく、例示のために選択した実施形態において他の様々な修正を行えることが容易に明らかになるであろう。
100 メッシュボクセル化
102 パッチ生成
104 V-PCC画像生成
106 ベースメッシュ符号化
108 V-PCCビットストリーム

Claims (39)

  1. 装置の非一時的メモリにプログラムされた方法であって、
    入力メッシュに対してメッシュボクセル化を実行するステップと、
    パッチ生成を実行することによって、前記メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化するステップと、
    前記ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成するステップと、
    前記頂点位置及び連結性情報を使用してベースメッシュ符号化を実行するステップと、
    前記V-PCC画像及び前記ベースメッシュ符号化に基づいてV-PCCビットストリームを生成するステップと、
    を含むことを特徴とする方法。
  2. メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングするステップを含む、
    請求項1に記載の方法。
  3. メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、前記最も低い頂点値がゼロを上回るように前記メッシュ値をシフトさせるステップを含む、
    請求項2に記載の方法。
  4. パッチ生成を実行するステップは、三角形毎の法線を計算するステップを含む、
    請求項1に記載の方法。
  5. 前記三角形の前記法線を計算するステップは、エッジ間の外積を使用するステップを含む、
    請求項4に記載の方法。
  6. 前記法線に従って三角形をカテゴリ分けするステップをさらに含む、
    請求項4に記載の方法。
  7. 隣接する三角形を分析することによって精細化プロセスを実行するステップをさらに含む、
    請求項4に記載の方法。
  8. ベースメッシュ符号化は、頂点の(u,v)座標を符号化するステップを含む、
    請求項1に記載の方法。
  9. 前記V-PCCビットストリームを生成するステップは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する、
    請求項1に記載の方法。
  10. 前記マルチレイヤ実装の第1のレイヤは未加工点群を含み、前記マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、前記マルチレイヤ実装の第3のレイヤは密なメッシュを含む、
    請求項9に記載の方法。
  11. 各パッチのさらなる連結性データを含むベースメッシュを生成するステップをさらに含み、前記さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、前記さらなる連結性データはレンダリング及び点フィルタリングを改善する、
    請求項1に記載の方法。
  12. 前記連結性情報は、色コードに基づいて符号化される、
    請求項1に記載の方法。
  13. 前記V-PCC画像及び前記ベースメッシュ符号化に基づいて前記V-PCCビットストリームを生成するステップは、パッチ毎の前記連結性情報を利用する、
    請求項1に記載の方法。
  14. 入力メッシュに対してメッシュボクセル化を実行し、
    パッチ生成を実行することによって、前記メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化し、
    前記ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成し、
    前記頂点位置及び連結性情報を使用してベースメッシュ符号化を実行し、
    前記V-PCC画像及び前記ベースメッシュ符号化に基づいてV-PCCビットストリームを生成する、
    ためのアプリケーションを記憶する非一時的メモリと、
    前記メモリに結合されて前記アプリケーションを処理するように構成されたプロセッサと、
    を備えることを特徴とする装置。
  15. メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングすることを含む、
    請求項14に記載の装置。
  16. メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、前記最も低い頂点値がゼロを上回るように前記メッシュ値をシフトさせることを含む、
    請求項15に記載の装置。
  17. パッチ生成を実行することは、三角形毎の法線を計算することを含む、
    請求項14に記載の装置。
  18. 前記三角形の前記法線を計算することは、エッジ間の外積を使用することを含む、
    請求項17に記載の装置。
  19. 前記アプリケーションは、さらに前記法線に従って三角形をカテゴリ分けする、
    請求項17に記載の装置。
  20. 前記アプリケーションは、さらに隣接する三角形を分析することによって精細化プロセスを実行する、
    請求項17に記載の装置。
  21. ベースメッシュ符号化は、頂点の(u,v)座標を符号化することを含む、
    請求項14に記載の装置。
  22. 前記V-PCCビットストリームを生成することは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する、
    請求項14に記載の装置。
  23. 前記マルチレイヤ実装の第1のレイヤは未加工点群を含み、前記マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、前記マルチレイヤ実装の第3のレイヤは密なメッシュを含む、
    請求項22に記載の装置。
  24. 前記アプリケーションは、さらに各パッチのさらなる連結性データを含むベースメッシュを生成し、前記さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、前記さらなる連結性データはレンダリング及び点フィルタリングを改善する、
    請求項14に記載の装置。
  25. 前記連結性情報は、色コードに基づいて符号化される、
    請求項14に記載の装置。
  26. 前記V-PCC画像及び前記ベースメッシュ符号化に基づいて前記V-PCCビットストリームを生成することは、パッチ毎の前記連結性情報を利用する、
    請求項14に記載の装置。
  27. 3次元コンテンツを取得する1又は2以上のカメラと、
    入力メッシュに対してメッシュボクセル化を実行し、
    パッチ生成を実行することによって、前記メッシュを、ラスタライズされたメッシュ表面、並びに頂点位置及び連結性情報を含むパッチにセグメント化し、
    前記ラスタライズされたメッシュ表面からビデオベースの点群圧縮(V-PCC)画像を生成し、
    前記頂点位置及び連結性情報を使用してベースメッシュ符号化を実行し、
    前記V-PCC画像及び前記ベースメッシュ符号化に基づいてV-PCCビットストリームを生成する、
    ことによって前記3次元コンテンツを符号化するエンコーダと、
    を備えることを特徴とするシステム。
  28. メッシュボクセル化は、負の値及び非整数値を避けるようにメッシュ値をシフトさせ及び/又はスケーリングすることを含む、
    請求項27に記載のシステム。
  29. メッシュボクセル化は、ゼロ未満の最も低い頂点値を発見し、前記最も低い頂点値がゼロを上回るように前記メッシュ値をシフトさせることを含む、
    請求項28に記載のシステム。
  30. パッチ生成を実行することは、三角形毎の法線を計算することを含む、
    請求項27に記載のシステム。
  31. 前記三角形の前記法線を計算することは、エッジ間の外積を使用することを含む、
    請求項30に記載のシステム。
  32. 前記エンコーダは、さらに前記法線に従って三角形をカテゴリ分けする、
    請求項30に記載のシステム。
  33. 前記エンコーダ、さらに隣接する三角形を分析することによって精細化プロセスを実行する、
    請求項30に記載のシステム。
  34. ベースメッシュ符号化は、頂点の(u,v)座標を符号化することを含む、
    請求項27に記載のシステム。
  35. 前記V-PCCビットストリームを生成することは、ベースメッシュシグナリングを含み、マルチレイヤ実装を利用する、
    請求項27に記載のシステム。
  36. 前記マルチレイヤ実装の第1のレイヤは未加工点群を含み、前記マルチレイヤ実装の第2のレイヤは疎なメッシュを含み、前記マルチレイヤ実装の第3のレイヤは密なメッシュを含む、
    請求項35に記載のシステム。
  37. 前記エンコーダは、各パッチのさらなる連結性データを含むベースメッシュを生成するようにさらに構成され、前記さらなる連結性データを利用すべきであるかどうかをデコーダが決定し、さらに、前記さらなる連結性データはレンダリング及び点フィルタリングを改善する、
    請求項27に記載のシステム。
  38. 前記連結性情報は、色コードに基づいて符号化される、
    請求項27に記載のシステム。
  39. 前記V-PCC画像及び前記ベースメッシュ符号化に基づいて前記V-PCCビットストリームを生成することは、パッチ毎の前記連結性情報を利用する、
    請求項27に記載のシステム。
JP2022506276A 2019-12-10 2020-12-03 点群表現を介したメッシュ圧縮 Active JP7303992B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962946194P 2019-12-10 2019-12-10
US62/946,194 2019-12-10
US16/859,059 US11348285B2 (en) 2019-12-10 2020-04-27 Mesh compression via point cloud representation
US16/859,059 2020-04-27
PCT/IB2020/061413 WO2021116838A1 (en) 2019-12-10 2020-12-03 Mesh compression via point cloud representation

Publications (2)

Publication Number Publication Date
JP2022542419A true JP2022542419A (ja) 2022-10-03
JP7303992B2 JP7303992B2 (ja) 2023-07-06

Family

ID=76209835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022506276A Active JP7303992B2 (ja) 2019-12-10 2020-12-03 点群表現を介したメッシュ圧縮

Country Status (6)

Country Link
US (1) US11348285B2 (ja)
EP (1) EP4052471A1 (ja)
JP (1) JP7303992B2 (ja)
KR (1) KR20220084407A (ja)
CN (1) CN113939849A (ja)
WO (1) WO2021116838A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11373339B2 (en) * 2020-03-18 2022-06-28 Sony Group Corporation Projection-based mesh compression
US20210319592A1 (en) * 2020-04-13 2021-10-14 Industrial Technology Research Institute Electronic device and method for encoding and decoding point cloud
US11836953B2 (en) * 2020-10-06 2023-12-05 Sony Group Corporation Video based mesh compression
CN117581545A (zh) * 2021-07-08 2024-02-20 索尼集团公司 信息处理装置和方法
US11606556B2 (en) 2021-07-20 2023-03-14 Tencent America LLC Fast patch generation for video based point cloud coding
WO2023014038A1 (ko) * 2021-08-03 2023-02-09 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
US20230156222A1 (en) * 2021-11-15 2023-05-18 Tencent America LLC Grid-based patch generation for video-based point cloud coding
KR20230071866A (ko) * 2021-11-16 2023-05-24 한국전자기술연구원 비디오 기반 포인트 클라우드 데이터 처리 방법 및 이를 지원하는 전자 장치
WO2023136653A1 (ko) * 2022-01-13 2023-07-20 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
WO2023167430A1 (ko) * 2022-03-04 2023-09-07 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
US20230281876A1 (en) * 2022-03-04 2023-09-07 Tencent America LLC Mesh compression with constrained geometry dynamic range
WO2023172098A1 (ko) * 2022-03-11 2023-09-14 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
WO2023182676A1 (ko) * 2022-03-22 2023-09-28 현대자동차주식회사 메시 및 포인트 클라우드 코딩을 위한 방법 및 장치
WO2023180841A1 (en) * 2022-03-25 2023-09-28 Sony Group Corporation Mesh patch sub-division
WO2023180843A1 (en) * 2022-03-25 2023-09-28 Sony Group Corporation Patch generation for dynamic mesh coding
US20230412842A1 (en) * 2022-06-17 2023-12-21 Tencent America LLC Vertex prediction based on decoded neighbors
JP2024008746A (ja) * 2022-07-09 2024-01-19 Kddi株式会社 メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
WO2024058614A1 (ko) * 2022-09-15 2024-03-21 인텔렉추얼디스커버리 주식회사 다이나믹 메시 압축 방법 및 장치
WO2024091860A1 (en) * 2022-10-25 2024-05-02 Innopeak Technology, Inc. Encoding method, decoding method, encoder and decoder
WO2024123039A1 (ko) * 2022-12-05 2024-06-13 엘지전자 주식회사 3d 데이터 송신 장치, 3d 데이터 송신 방법, 3d 데이터 수신 장치 및 3d 데이터 수신 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019142667A1 (ja) * 2018-01-17 2019-07-25 ソニー株式会社 画像処理装置および方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6438266B1 (en) * 1998-08-27 2002-08-20 Lucent Technologies Inc. Encoding images of 3-D objects with improved rendering time and transmission processes
JP2010527523A (ja) * 2007-04-18 2010-08-12 ゴットフリート・ヴィルヘルム・ライプニッツ・ウニヴェルジテート・ハノーヴァー タイムコンシステントな3次元メッシュシーケンスのスケーラブルな圧縮方法
CN101872488B (zh) * 2009-04-27 2012-05-16 鸿富锦精密工业(深圳)有限公司 曲面渲染系统及方法
KR101669873B1 (ko) 2009-10-16 2016-10-27 삼성전자주식회사 삼차원 메쉬 압축장치 및 방법
KR101654777B1 (ko) * 2010-07-19 2016-09-06 삼성전자주식회사 3차원 메쉬 가변 부호화 장치 및 방법, 그리고 3차원 메쉬 가변 복호화 장치 및 방법
US9715761B2 (en) * 2013-07-08 2017-07-25 Vangogh Imaging, Inc. Real-time 3D computer vision processing engine for object recognition, reconstruction, and analysis
EP2833326B1 (en) * 2013-07-30 2016-04-06 Dassault Systèmes Lossless compression of a 3D mesh including transforming of the mesh to a image
US10134171B2 (en) * 2014-09-29 2018-11-20 Arm Limited Graphics processing systems
US10249087B2 (en) * 2016-01-29 2019-04-02 Magic Leap, Inc. Orthogonal-projection-based texture atlas packing of three-dimensional meshes
GB2548143A (en) * 2016-03-10 2017-09-13 Lancaster Univ Business Entpr Ltd Surface modelling
US10229533B2 (en) * 2016-11-03 2019-03-12 Mitsubishi Electric Research Laboratories, Inc. Methods and systems for fast resampling method and apparatus for point cloud data
GB2558314B (en) 2017-01-02 2020-07-29 Canon Kk Improved attribute mapping to encode and decode 3D models
WO2018208698A1 (en) * 2017-05-06 2018-11-15 Owlii Inc. Processing 3d video content
US10430983B2 (en) * 2017-06-05 2019-10-01 Microsoft Technology Licensing, Llc Vertex pixel buffer
US10909725B2 (en) * 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
US11062176B2 (en) * 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
BR112020024480A2 (pt) * 2018-06-15 2021-03-02 Panasonic Intellectual Property Corporation Of America método de codificação de dados tridimensionais, método de decodificação de dados tridimensionais, dispositivo de codificação de dados tridimensionais e dispositivo de decodificação de dados tridimensionais
US11823421B2 (en) * 2019-03-14 2023-11-21 Nokia Technologies Oy Signalling of metadata for volumetric video

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019142667A1 (ja) * 2018-01-17 2019-07-25 ソニー株式会社 画像処理装置および方法

Also Published As

Publication number Publication date
US11348285B2 (en) 2022-05-31
JP7303992B2 (ja) 2023-07-06
WO2021116838A1 (en) 2021-06-17
US20210174551A1 (en) 2021-06-10
EP4052471A1 (en) 2022-09-07
KR20220084407A (ko) 2022-06-21
CN113939849A (zh) 2022-01-14

Similar Documents

Publication Publication Date Title
JP7303992B2 (ja) 点群表現を介したメッシュ圧縮
CN113557745B (zh) 点云几何结构填充
US11373339B2 (en) Projection-based mesh compression
US11836953B2 (en) Video based mesh compression
KR102609776B1 (ko) 포인트 클라우드 데이터 처리 방법 및 장치
KR102634079B1 (ko) 포인트 클라우드 데이터 처리 장치 및 방법
US20220417557A1 (en) Device and method for processing point cloud data
US20220321912A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US11190803B2 (en) Point cloud coding using homography transform
US20230059625A1 (en) Transform-based image coding method and apparatus therefor
US11908169B2 (en) Dense mesh compression
US20230306641A1 (en) Mesh geometry coding
US20230316584A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US20230306684A1 (en) Patch generation for dynamic mesh coding
US20230334719A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US20230306643A1 (en) Mesh patch simplification
EP4358519A1 (en) Point cloud data transmission device and method, and point cloud data reception device and method
US20230306683A1 (en) Mesh patch sub-division
US20240121435A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
EP4171036A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device and point cloud data reception method
WO2023180839A1 (en) Mesh geometry coding
WO2023180843A1 (en) Patch generation for dynamic mesh coding
WO2023180842A1 (en) Mesh patch simplification
WO2023180841A1 (en) Mesh patch sub-division
CN117751387A (zh) 面元网格连通性编码

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230112

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230607

R151 Written notification of patent or utility model registration

Ref document number: 7303992

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151