JP7434667B2 - ビデオベースの点群コーディングのためのグループオブピクチャベースのパッチパッキング - Google Patents
ビデオベースの点群コーディングのためのグループオブピクチャベースのパッチパッキング Download PDFInfo
- Publication number
- JP7434667B2 JP7434667B2 JP2023523277A JP2023523277A JP7434667B2 JP 7434667 B2 JP7434667 B2 JP 7434667B2 JP 2023523277 A JP2023523277 A JP 2023523277A JP 2023523277 A JP2023523277 A JP 2023523277A JP 7434667 B2 JP7434667 B2 JP 7434667B2
- Authority
- JP
- Japan
- Prior art keywords
- group
- frame
- frames
- video
- patch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012856 packing Methods 0.000 title description 25
- 238000000034 method Methods 0.000 claims description 58
- 238000012545 processing Methods 0.000 claims description 35
- 230000001419 dependent effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims 1
- 230000006835 compression Effects 0.000 description 24
- 238000007906 compression Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 20
- 238000009499 grossing Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 9
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 101100207005 Caenorhabditis elegans tmc-2 gene Proteins 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本出願は、2021年7月7日に出願された米国仮特許出願第63/219,237号および2021年10月8日に出願された米国特許出願第17/497,326号の優先権を主張し、これらの開示はその全体が参照により本明細書に組み込まれる。
V-PCCに対応し得る、MPEG PCCテストモデルカテゴリ2(TMC2)モデルでは、パッチパッキングプロセスは、各生成されたパッチに対応する形状またはテクスチャデータをサイズWxHの2Dグリッド上に効率的に配置することによって、形状およびテクスチャマップを生成しようと試みる。このような配置はまた、この2Dグリッド上に配置された異なるパッチ間の最小距離を指定する、ユーザ定義の最小サイズブロックTxTを占めることができる。対応する値(T)は、符号化されてデコーダに送信され得る。
・最初に、重複しない挿入を保証するように、2Dグリッド上にパッチが配置される。パッチに属するサンプル(Tの倍数である値に丸められる)は、占有されたブロックと見なされる。
・加えて、隣り合うパッチ間のセーフガードは、Tの倍数である少なくとも1つのブロックの距離に強制される。
・パッチは、パッチインデックスリストに基づいて順序正しく処理される。リストからの各パッチは、グリッド上に反復的に配置される。グリッド解像度は、元の点群サイズに依存し、その幅(W)および高さ(H)はデコーダに伝送される。
・次のパッチに利用可能な空いた空間がない場合、グリッドの高さ値が最初に2倍され、このパッチの挿入が再度評価される。すべてのパッチの挿入が成功した場合には、高さは必要最小値にトリミングされる。しかしながら、この値は、エンコーダにおいて最初に指定された値よりも低く設定することはできない。
・WおよびHの最終値は、適切なビデオコーデックを使用してテクスチャおよび形状ビデオ信号を符号化するために使用されるフレーム解像度に対応する。
・フレームをグループに分割することができ、時間的に隣接するフレームを同じグループに入れることができる。
o実施形態では、各グループのサイズを等しく設定することができる。サイズは、エンコーダおよびデコーダの両方によって仮定されるか、またはサイズはビットストリームでシグナリングされることが可能である。
o実施形態では、各グループのサイズは異なっていてもよい。例えば、パッチされたフレームの変化が少ないとき、より大きいサイズを使用することができる。後続のグループのサイズを示すために、GoPレベルシグナリングを使用することができる。前のサイズ情報に対するデルタサイズのみをシグナリングするために、予測シグナリング方法を使用することができる。
・同じグループ内のフレームは、グループ内になく、既に処理されているフレームに依存し得る。この場合、同じグループ内のフレームは、並列で処理されてもよい。
・実施形態では、GoPベースのパッチパッキングの使用は、最も近いフレーム内のパッチの元の相関を破る可能性がある。しかしながら、(図5A~図5Bに示すように)最も近いフレームからの端方向/双方向相関は、特定の伝播規則によって復元することができる。
110 第1の端末
120 第2の端末
130 端末
140 端末
150 通信ネットワーク
200 ストリーミングシステム
201 ビデオソース
202 ストリーム
203 エンコーダ
204 符号化ビデオビットストリーム
205 ストリーミングサーバ
206 ストリーミングクライアント
209 ビデオビットストリーム
210 ビデオデコーダ
211 発信ビデオサンプルストリーム
212 ディスプレイ
213 キャプチャサブシステム
302 パッチ生成モジュール
304 パッチパッキングモジュール
306 形状画像生成モジュール
308 テクスチャ画像生成モジュール
310 平滑化モジュール
312 補助パッチ情報圧縮モジュール
314 画像パディングモジュール
316 画像パディングモジュール
318 エントロピー圧縮モジュール
320 グループ拡大モジュール
322 ビデオ圧縮モジュール
324 ビデオ圧縮モジュール
326 ビデオ圧縮モジュール
328 マルチプレクサ
332 パッチ情報
334 占有マップ
350 点群フレーム
352 形状画像
354 パディングされた形状画像
356 テクスチャ画像
358 再構築/平滑化形状
360 パディングされたテクスチャ画像
362 圧縮形状画像、圧縮テクスチャ画像
364 圧縮テクスチャ画像、圧縮形状画像
365 再構築形状画像
366 可逆符号化
368 非可逆符号化
370 圧縮補助パッチ情報
372 圧縮占有マップ
374 圧縮ビットストリーム
402 デマルチプレクサ
404 ビデオ復元モジュール
406 ビデオ復元モジュール
408 占有マップ復元モジュール
410 補助パッチ情報復元モジュール
412 形状再構築モジュール
414 平滑化モジュール
416 テクスチャ再構築モジュール
418 色平滑化モジュール
460 復元テクスチャ画像
462 復元形状画像
464 復元占有マップ
466 復元補助パッチ情報
468 再構築形状
470 平滑化形状
472 再構築テクスチャ
474 再構築点群
1000 装置
1010 取得コード
1020 グループ化コード
1030 処理コード
1040 第1の並列処理コード
1050 生成コード
1100 コンピュータシステム
1101 キーボード
1102 マウス
1103 トラックパッド
1105 ジョイスティック
1106 マイクロフォン
1107 スキャナ
1108 カメラ
1109 スピーカ
1110 タッチスクリーン
1120 CD/DVD ROM/RW
1121 媒体
1122 サムドライブ
1123 リムーバブルハードドライブまたはソリッドステートドライブ
1140 コア
1141 中央処理装置(CPU)
1142 グラフィックス処理装置(GPU)
1143 フィールドプログラマブルゲートエリア(FPGA)
1144 ハードウェアアクセラレータ
1145 読み取り専用メモリ(ROM)
1146 ランダムアクセスメモリ
1147 内部大容量記憶装置
1148 システムバス
1149 周辺バス
1150 グラフィックスアダプタ
1155 クラウドコンピューティング環境
Claims (9)
- ビデオ点群コーディングを使用してビデオストリームを符号化する方法であって、前記方法は、少なくとも1つのプロセッサによって実行され、
第1のフレームおよび残りのフレームを含む複数のフレームを取得するステップであって、前記複数のフレームの各フレームは、対応する複数のパッチでパッキングされる、ステップと、
前記残りのフレームを第1のグループおよび第2のグループにグループ化するステップであって、同じグループにグループ化されたフレームは時間的に隣接している、ステップと、
前記第1のフレームを処理するステップと、
前記第1のフレームが処理された後に、前記第1のグループ内のフレームを並列処理するステップと、
前記第1のグループ内の前記処理された第1のフレームおよび前記処理されたフレームに基づいて符号化ビデオストリームを生成するステップと
を含み、
前記第1のグループの少なくとも1つのフレームは、前記第1のフレームに依存する、方法。 - 前記第1のグループが処理された後に、前記第2のグループ内のフレームを並列処理するステップをさらに含み、
前記第2のグループの少なくとも1つのフレームは、前記第1のグループのフレームに依存し、
前記第2のグループのフレームは、前記第1のフレームに依存せず、
前記符号化ビデオストリームは、前記第2のグループの前記処理されたフレームに基づいて生成される、請求項1に記載の方法。 - 前記第1のグループのサイズと前記第2のグループのサイズとは等しいサイズである、請求項1に記載の方法。
- 前記等しいサイズは、前記符号化ビデオストリームでシグナリングされる、請求項3に記載の方法。
- 前記第1のグループのサイズは、前記第2のグループのサイズと異なっている、請求項1に記載の方法。
- 前記第1のグループの前記サイズは、前記符号化ビデオストリームでシグナリングされ、
前記第1のグループの前記サイズと前記第2のグループの前記サイズとの差は、前記符号化ビデオストリームでシグナリングされる、請求項5に記載の方法。 - 前記第1のグループに含まれるパッチ間の第1のパッチ対応関係、および前記第2のグループに含まれるパッチ間の第2のパッチ対応関係のうちの少なくとも1つを決定するステップをさらに含み、
前記符号化ビデオストリームは、前記第1のパッチ対応関係および前記第2のパッチ対応関係のうちの前記少なくとも1つに基づいて生成される、請求項1に記載の方法。 - ビデオ点群コーディングを使用してビデオストリームを符号化するための装置であって、
プログラムコードを記憶するように構成された少なくとも1つのメモリと、
前記プログラムコードを読み取り、前記プログラムコードによって命令されたとおりに動作するように構成された少なくとも1つのプロセッサと
を備え、
前記プログラムコードは、前記少なくとも1つのプロセッサに、請求項1から7のいずれか一項に記載の方法を行わせる、装置。 - コンピュータに、請求項1から7のいずれか一項に記載の方法を行わせる、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163219237P | 2021-07-07 | 2021-07-07 | |
US63/219,237 | 2021-07-07 | ||
US17/497,326 US11683523B2 (en) | 2021-07-07 | 2021-10-08 | Group of pictures based patch packing for video based point cloud coding |
US17/497,326 | 2021-10-08 | ||
PCT/US2021/054553 WO2023282926A1 (en) | 2021-07-07 | 2021-10-12 | Group of pictures based patch packing for video based point cloud coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023546441A JP2023546441A (ja) | 2023-11-02 |
JP7434667B2 true JP7434667B2 (ja) | 2024-02-20 |
Family
ID=84799072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023523277A Active JP7434667B2 (ja) | 2021-07-07 | 2021-10-12 | ビデオベースの点群コーディングのためのグループオブピクチャベースのパッチパッキング |
Country Status (6)
Country | Link |
---|---|
US (1) | US11683523B2 (ja) |
EP (1) | EP4193591A4 (ja) |
JP (1) | JP7434667B2 (ja) |
KR (1) | KR20230054434A (ja) |
CN (1) | CN116648904A (ja) |
WO (1) | WO2023282926A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019055963A1 (en) | 2017-09-18 | 2019-03-21 | Apple Inc. | COMPRESSION OF CLOUD OF POINTS |
WO2020061149A1 (en) | 2018-09-21 | 2020-03-26 | Futurewei Technologies, Inc. | Patch orientation derivation and prediction |
US20200153885A1 (en) | 2018-10-01 | 2020-05-14 | Lg Electronics Inc. | Apparatus for transmitting point cloud data, a method for transmitting point cloud data, an apparatus for receiving point cloud data and/or a method for receiving point cloud data |
US20210029381A1 (en) | 2018-04-09 | 2021-01-28 | Huawei Technologies Co., Ltd. | Method and apparatus for obtaining global matched patch |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201603144D0 (en) * | 2016-02-23 | 2016-04-06 | Magic Pony Technology Ltd | Training end-to-end video processes |
US11297346B2 (en) * | 2016-05-28 | 2022-04-05 | Microsoft Technology Licensing, Llc | Motion-compensated compression of dynamic voxelized point clouds |
US10607373B2 (en) * | 2017-11-22 | 2020-03-31 | Apple Inc. | Point cloud compression with closed-loop color conversion |
US20200045344A1 (en) * | 2018-07-31 | 2020-02-06 | Intel Corporation | Video processing mechanism |
US11049266B2 (en) * | 2018-07-31 | 2021-06-29 | Intel Corporation | Point cloud viewpoint and scalable compression/decompression |
US10708627B2 (en) * | 2019-03-04 | 2020-07-07 | Intel Corporation | Volumetric video compression with motion history |
US11223836B2 (en) * | 2019-12-02 | 2022-01-11 | Tencent America LLC | Method and apparatus for point cloud coding |
-
2021
- 2021-10-08 US US17/497,326 patent/US11683523B2/en active Active
- 2021-10-12 EP EP21949509.0A patent/EP4193591A4/en active Pending
- 2021-10-12 KR KR1020237009551A patent/KR20230054434A/ko active Search and Examination
- 2021-10-12 JP JP2023523277A patent/JP7434667B2/ja active Active
- 2021-10-12 CN CN202180086139.0A patent/CN116648904A/zh active Pending
- 2021-10-12 WO PCT/US2021/054553 patent/WO2023282926A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019055963A1 (en) | 2017-09-18 | 2019-03-21 | Apple Inc. | COMPRESSION OF CLOUD OF POINTS |
US20210029381A1 (en) | 2018-04-09 | 2021-01-28 | Huawei Technologies Co., Ltd. | Method and apparatus for obtaining global matched patch |
WO2020061149A1 (en) | 2018-09-21 | 2020-03-26 | Futurewei Technologies, Inc. | Patch orientation derivation and prediction |
US20200153885A1 (en) | 2018-10-01 | 2020-05-14 | Lg Electronics Inc. | Apparatus for transmitting point cloud data, a method for transmitting point cloud data, an apparatus for receiving point cloud data and/or a method for receiving point cloud data |
Also Published As
Publication number | Publication date |
---|---|
US11683523B2 (en) | 2023-06-20 |
EP4193591A4 (en) | 2024-01-24 |
EP4193591A1 (en) | 2023-06-14 |
JP2023546441A (ja) | 2023-11-02 |
KR20230054434A (ko) | 2023-04-24 |
WO2023282926A1 (en) | 2023-01-12 |
US20230011096A1 (en) | 2023-01-12 |
CN116648904A (zh) | 2023-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11451836B2 (en) | Techniques and apparatus for PCM patch creation using Morton codes | |
CN112188209B (zh) | 视频流解码方法、装置、计算机设备和存储介质 | |
JP2022512509A (ja) | 符号化された点群データの分割 | |
CN113508598B (zh) | 对使用视频点云编解码编码的视频流进行解码的方法和装置 | |
CN113170154B (zh) | 采用退火迭代几何平滑的点云编解码方法、装置和介质 | |
JP7434667B2 (ja) | ビデオベースの点群コーディングのためのグループオブピクチャベースのパッチパッキング | |
CN113170155A (zh) | 通过局部几何投影进行几何平滑的方法和装置 | |
KR102677403B1 (ko) | 비디오 기반 포인트 클라우드 코딩을 위한 고속 패치 생성 | |
JP7438612B2 (ja) | ビデオベースのポイント・クラウド・コーディングのための高速パッチ生成 | |
US20220394294A1 (en) | Non-binary occupancy map for video based point cloud coding | |
US11979606B2 (en) | Conditional recolor for video based point cloud coding | |
US11956478B2 (en) | Method and apparatus for point cloud chunking for improved patch packing and coding efficiency | |
KR20230012558A (ko) | 비디오 기반 포인트 클라우드 코딩을 위한 고속 재채색 | |
CN112188201A (zh) | 对视频流进行编码的方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230417 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7434667 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |