JP2023507586A - 3dof構成要素からの6dofコンテンツを符号化、復号化、及びレンダリングするための方法及び装置 - Google Patents
3dof構成要素からの6dofコンテンツを符号化、復号化、及びレンダリングするための方法及び装置 Download PDFInfo
- Publication number
- JP2023507586A JP2023507586A JP2022537568A JP2022537568A JP2023507586A JP 2023507586 A JP2023507586 A JP 2023507586A JP 2022537568 A JP2022537568 A JP 2022537568A JP 2022537568 A JP2022537568 A JP 2022537568A JP 2023507586 A JP2023507586 A JP 2023507586A
- Authority
- JP
- Japan
- Prior art keywords
- scene
- viewpoint
- clusters
- points
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 83
- 238000009877 rendering Methods 0.000 title description 65
- 230000015654 memory Effects 0.000 claims description 15
- 238000010586 diagram Methods 0.000 abstract description 3
- 230000000007 visual effect Effects 0.000 abstract description 2
- 230000000670 limiting effect Effects 0.000 description 22
- 238000004891 communication Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 230000002093 peripheral effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 229920001690 polydopamine Polymers 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 208000012886 Vertigo Diseases 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 231100000889 vertigo Toxicity 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/001—Model-based coding, e.g. wire frame
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/028—Multiple view windows (top-side-front-sagittal-orthogonal)
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
少なくとも1つのクラスタリング基準に従って、3Dシーン内の点を複数のクラスタにクラスタリングすることと、
投影パラメータに従ってクラスタを投影して、2D画像のセットを取得することと、
2D画像のセット及び投影パラメータをデータストリームのセットに符号化することと、を含む。
データストリームのセットから少なくとも1つの2D画像を取得することであって、2D画像が、3Dシーン内の点の少なくとも1つのクラスタの投影パラメータに従った投影を表し、点のクラスタ内の点が少なくとも1つのクラスタリング基準を満たす、取得することと、
投影パラメータ及び3Dシーン内の視点に従って、少なくとも2D画像の画素を逆投影することと、を含む。
メタデータを取得することであって、メタデータが、
3Dシーンに定義された視認ボックスのリストと、
視認ボックスについて、視認ボックスの視点から可視である3D点のクラスタを表す2D画像を符号化するデータストリームの記述と、を含む、取得することと、
当該視点から可視である3D点のクラスタを含むデータストリームから2D画像を復号化することと、を更に含む。
●任意選択的に深度アクティブセンシングデバイスによって補完された、カメラのリグによって撮影された実オブジェクトの捕捉から、
●モデリングツールにおける仮想カメラのリグによって撮影された仮想/合成オブジェクトの捕捉から、
●実オブジェクトと仮想オブジェクトの両方の混合物から、取得され得る。
-JPEG、仕様ISO/CEI10918-1UIT-T推奨T.81、https://www.itu.int/rec/T-REC-T.81/en;
-MPEG-4AVC又はh264とも呼ばれるAVCなどのエンコーダに準拠する。UIT-TH.264及びISO/CEI MPEG-4-Part 10(ISO/CEI14496-10)、http://www.itu.int/rec/T-REC-H.264/en,HEVC(その仕様は、ITUウェブサイト、T推奨、H系列、h265、http://www.itu.int/rec/T-REC-H.265-201612-I/enで見出される)、
-3D-HEVC(仕様がITUウェブサイト、T推奨、H系列、h265、http://www.itu.int/rec/T-REC-H.265-201612-I/en annex G and Iで見出されるHEVCの拡張子)、
-Googleによって開発されたVP9、又は
-Alliance for Open Mediaによって開発されたAV1(AO媒体ビデオ1)。
-例えば、ビデオメモリ又はRAM(又はランダムアクセスメモリ)、フラッシュメモリ、ROM(又は読み取り専用メモリ)、ハードディスクなどのローカルメモリと、
-例えば、質量ストレージ、RAM、フラッシュメモリ、ROM、光学ディスク又は磁気サポートとのインターフェースなどのストレージインターフェースと、
-例えば、有線インターフェース(例えば、バスインターフェース、広域ネットワークインターフェース、ローカルエリアネットワークインターフェース)又は無線インターフェース(IEEE802.11インターフェース又はBluetooth(登録商標)インターフェースなど)などの通信インターフェースと、
-ユーザがデータを入力することを可能にするグラフィカルユーザインターフェースなどのユーザインターフェースと、を含むセットに属する。
-例えば、DSP(又はデジタル信号プロセッサ)であるマイクロプロセッサ32(又はCPU)と、
-ROM(又は読み取り専用メモリ)33と、
-RAM(又はランダムアクセスメモリ)34と、
-ストレージインターフェース35と、
-アプリケーションから、送信するデータを受信するためのI/Oインターフェース36と、
-電源、例えば、バッテリと、を備える。
-モバイルデバイスと、
-通信デバイスと、
-ゲームデバイスと、
-タブレット(又はタブレットコンピュータ)と、
-ラップトップと、
-静止画カメラと、
-ビデオカメラと、
-符号化チップと、
-サーバ(例えば、ブロードキャストサーバ、ビデオオンデマンドサーバ又はウェブサーバ)と、を含むセットに属する。
-3Dレンダリング空間内の視認境界ボックスのリストと、
-3Dレンダリング空間の共通クラスタのリストであって、各共通クラスタが、共通のクラスタ識別子によって特徴付けられ、ソースから対応するビデオストリームを取得するために使用される一意のリソース識別子と関連付けられている、共通クラスタのリストと、
-各視認境界ボックスについて、この視認境界ボックスについての3Dシーンを表すクラスタのセットのリストと、
-視認境界ボックスに関連付けられたクラスタの各セットについて、
○共通クラスタの識別子と、
○ソースから対応するビデオストリームを取得するために、一意のリソース識別子を有する共通のクラスタ以外のクラスタのリストと、
を含む。
Claims (15)
- 3Dシーンを符号化するための方法であって、
少なくとも1つのクラスタリング基準に従って、前記3Dシーン内の点を複数のクラスタにクラスタリングすることと、
投影パラメータに従って前記クラスタを投影して、2D画像のセットを取得することと、
2D画像のセット及び前記投影パラメータをデータストリームのセットに符号化することと、を含む、方法。 - 前記2D画像のそれぞれが、別個のデータストリームで符号化される、請求項1に記載の方法。
- 視認ボックスが、前記3Dシーン内で定義され、前記視認ボックス内の2つの視点から可視であるクラスタを投影することによって得られた2D画像が、同じデータストリームで符号化される、請求項1に記載の方法。
- 2つの視認ボックスが、前記3Dシーン内で定義され、前記2つの視認ボックスのそれぞれ内の2つの視点から可視であるクラスタを投影することによって得られた2D画像が、同じデータストリームで符号化される、請求項1に記載の方法。
- 前記データストリームが、前記少なくとも1つのクラスタリング基準に従って、異なる画像レートで符号化される、請求項1~4のいずれか一項に記載の方法。
- 前記少なくとも1つの基準が、前記3Dシーンの前記点の深度に基づく基準、前記3Dシーンの点に関連付けられた意味に基づく基準、前記3Dシーンの前記点の色に基づく基準、及び前記3Dシーンの点の移動に基づく基準を含むセットに属する、請求項1~5のいずれか一項に記載の方法。
- メタデータを符号化することを更に含み、前記メタデータが、
前記3Dシーンに定義された前記視認ボックスのリストと、
視認ボックスについて、前記視認ボックスの視点から可視である3D点のクラスタを表す2D画像を符号化するデータストリームの記述と、
を含む、請求項1~6のいずれか一項に記載の方法。 - 3Dシーンを符号化するための方法であって、
データストリームのセットから少なくとも1つの2D画像を取得することであって、2D画像が、前記3Dシーン内の点の少なくとも1つのクラスタの投影パラメータに従った投影を表し、前記点のクラスタ内の点が少なくとも1つのクラスタリング基準を満たす、取得することと、
前記投影パラメータ及び前記3Dシーン内の視点に従って、前記少なくとも2D画像の画素を逆投影することと、を含む、方法。 - データストリームが、点の1つのクラスタを表す2D画像を含む、請求項8に記載の方法。
- 前記視点を含む視認ボックスが、前記3Dシーン内に定義され、データストリームが、前記視認ボックス内の前記視点及び別個の視点から可視であるクラスタを投影することによって取得された2D画像を含む、請求項8に記載の方法。
- 2つの視認ボックスが、前記3Dシーン内に定義され、前記視認ボックスのうちの少なくとも1つが前記視点を含み、データストリームが、前記視点及び別個の視点から可視であるクラスタを投影することによって取得された2D画像を含み、前記視点が前記2つの視認ボックスのそれぞれ内にある、請求項8に記載の方法。
- 前記データストリームが、前記少なくとも1つのクラスタリング基準に従って、異なる画像レートで復号化される、請求項8~11のいずれか一項に記載の方法。
- メタデータを取得することであって、前記メタデータが、
前記3Dシーンに定義された前記視認ボックスのリストと、
視認ボックスについて、前記視認ボックスの視点から可視である3D点のクラスタを表す2D画像を符号化するデータストリームの記述と、を含む、取得することと、
前記視点から可視である3D点のクラスタを含むデータストリームから2D画像を復号化することと、を更に含む、請求項8~12のいずれか一項に記載の方法。 - プロセッサと関連付けられたメモリを備える3Dシーンを符号化するためのデバイスであって、前記プロセッサが、
少なくとも1つのクラスタリング基準に従って、前記3Dシーン内の点を複数のクラスタにクラスタリングすることと、
投影パラメータに従って前記クラスタを投影して、2D画像のセットを取得することと、
前記2D画像のセット及び前記投影パラメータをデータストリームのセットに符号化することと、を行うように構成されている、デバイス。 - プロセッサと関連付けられたメモリを備える3Dシーンを復号化するためのデバイスであって、前記プロセッサが、
データストリームのセットから少なくとも1つの2D画像を取得することであって、2D画像が、前記3Dシーン内の点の少なくとも1つのクラスタの投影パラメータに従った投影を表し、前記点のクラスタ内の点が少なくとも1つのクラスタリング基準を満たす、取得することと、
前記投影パラメータ及び前記3Dシーン内の視点に従って、前記少なくとも2D画像の画素を逆投影することと、を行うように構成されている、デバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19306692.5 | 2019-12-19 | ||
EP19306692 | 2019-12-19 | ||
PCT/US2020/065990 WO2021127419A1 (en) | 2019-12-19 | 2020-12-18 | Methods and apparatuses for encoding, decoding and rendering 6dof content from 3dof+ composed elements |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023507586A true JP2023507586A (ja) | 2023-02-24 |
JPWO2021127419A5 JPWO2021127419A5 (ja) | 2023-12-27 |
Family
ID=69185201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022537568A Pending JP2023507586A (ja) | 2019-12-19 | 2020-12-18 | 3dof構成要素からの6dofコンテンツを符号化、復号化、及びレンダリングするための方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230032599A1 (ja) |
EP (1) | EP4078971A1 (ja) |
JP (1) | JP2023507586A (ja) |
CN (1) | CN114830668A (ja) |
MX (1) | MX2022007724A (ja) |
WO (1) | WO2021127419A1 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3429210A1 (en) * | 2017-07-13 | 2019-01-16 | Thomson Licensing | Methods, devices and stream for encoding and decoding volumetric video |
EP3547703A1 (en) * | 2018-03-30 | 2019-10-02 | Thomson Licensing | Method, apparatus and stream for volumetric video format |
EP3562159A1 (en) * | 2018-04-24 | 2019-10-30 | InterDigital VC Holdings, Inc. | Method, apparatus and stream for volumetric video format |
-
2020
- 2020-12-18 CN CN202080087844.8A patent/CN114830668A/zh active Pending
- 2020-12-18 JP JP2022537568A patent/JP2023507586A/ja active Pending
- 2020-12-18 US US17/785,542 patent/US20230032599A1/en active Pending
- 2020-12-18 MX MX2022007724A patent/MX2022007724A/es unknown
- 2020-12-18 WO PCT/US2020/065990 patent/WO2021127419A1/en unknown
- 2020-12-18 EP EP20841826.9A patent/EP4078971A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2022007724A (es) | 2022-07-19 |
CN114830668A (zh) | 2022-07-29 |
EP4078971A1 (en) | 2022-10-26 |
WO2021127419A1 (en) | 2021-06-24 |
US20230032599A1 (en) | 2023-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102468178B1 (ko) | 몰입형 비디오 포맷을 위한 방법, 장치 및 스트림 | |
CN112425177B (zh) | 用于体积视频传输的方法和装置 | |
US11647177B2 (en) | Method, apparatus and stream for volumetric video format | |
EP3562159A1 (en) | Method, apparatus and stream for volumetric video format | |
WO2021063887A1 (en) | A method and apparatus for encoding, transmitting and decoding volumetric video | |
CN114868396A (zh) | 用于多视点3DoF+内容的编码和解码的方法和装置 | |
CN114930812B (zh) | 用于解码3d视频的方法和装置 | |
US20230042874A1 (en) | Volumetric video with auxiliary patches | |
WO2019191202A1 (en) | Method, apparatus and stream for volumetric video format | |
EP4128765A1 (en) | A method and apparatus for encoding and decoding volumetric video | |
CN115023739A (zh) | 用于对具有视图驱动的镜面反射的体积视频进行编码和解码的方法和装置 | |
CN114503554B (zh) | 用于传送体积视频内容的方法和装置 | |
WO2018069215A1 (en) | Method, apparatus and stream for coding transparency and shadow information of immersive video format | |
JP2022549431A (ja) | 容積ビデオを符号化、送信、及び復号化するための方法及び装置 | |
JP2023507586A (ja) | 3dof構成要素からの6dofコンテンツを符号化、復号化、及びレンダリングするための方法及び装置 | |
EP3310053A1 (en) | Method and apparatus for coding transparency information of immersive video format | |
RU2807582C2 (ru) | Способ, устройство и поток для формата объемного видео | |
CN115885513A (zh) | 用于对体积视频进行编码和解码的方法和装置 | |
JP2022551064A (ja) | 容積ビデオを符号化、送信、及び復号化するための方法及び装置 | |
WO2023202897A1 (en) | A method and apparatus for encoding/decoding a 3d scene |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220621 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20220629 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20221017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231218 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231218 |