JP2023510822A - 点群データのカプセル化方法及び伝送方法 - Google Patents

点群データのカプセル化方法及び伝送方法 Download PDF

Info

Publication number
JP2023510822A
JP2023510822A JP2022542466A JP2022542466A JP2023510822A JP 2023510822 A JP2023510822 A JP 2023510822A JP 2022542466 A JP2022542466 A JP 2022542466A JP 2022542466 A JP2022542466 A JP 2022542466A JP 2023510822 A JP2023510822 A JP 2023510822A
Authority
JP
Japan
Prior art keywords
media
point cloud
list
data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022542466A
Other languages
English (en)
Inventor
徐▲異▼凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Publication of JP2023510822A publication Critical patent/JP2023510822A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1744Redundancy elimination performed by the file system using compression, e.g. sparse files
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23605Creation or processing of packetized elementary streams [PES]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/04Protocols for data compression, e.g. ROHC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23608Remultiplexing multiplex streams, e.g. involving modifying time stamps or remapping the packet identifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

Figure 2023510822000001
本発明は、点群データのカプセル化方法及び伝送方法を提供し、点群メディアファイルを圧縮し、圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットし、前記分類記録は点群メディアファイルにおける各部分のデータタイプを表すために用いられる。本発明は、点群データの伝送にあるメディアコンテンツの伝送効率の低さ、格納スペースが無駄になるという問題を改善し、メディアコンテンツの組み合わせの柔軟性を高め、マルチメディアサービスに対する管理及びコントロールを強化し、ユーザーにより多くのメディアコンテンツを独立で選択し取得する権利を与え、多様なアプリケーションシーンを提供し、ネットワーク事業者により良いマルチメディアコンテンツの提供及び伝送スキームを提供することもできる。
【選択図】図1

Description

本発明は、マルチメディア伝送技術分野に関し、具体的には、点群データのカプセル化方法及び伝送方法に関する。
近年、メディア伝送技術は急速に発展と改善をしており、画像及びビデオ情報の伝送コストが低下しつつ精度が向上し、関連アプリケーション分野の成熟が更に促進されている。三次元点群データは、新しい画像メディアデータであり、より正確で生き生きとした画像情報をユーザーに提供し、迫真度がより高く、インタラクティブ性がより強い通信体験をもたらすことが可能である。
点群データは、三次元座標データ、深度情報、色情報などを含む、スキャンによって取得される物体の表面情報である。3Dスキャン技術の成熟とシステムアーキテクチャの改善により、点群データの精度を向上させながら点群のデータ量を大きく上昇させた。そのうち、静的、動的点群データ、並びに、機械感知、人間の目の感知などの異なるタイプの点群データについては、異なる点群データの圧縮アルゴリズムがある。例えば、人間の目の動的感知点群データについて、典型的な点群圧縮アルゴリズムは、3Dの点群データを2Dの画像データに変換してから、データ処理を行い、そのうちの1つがビデオに基づく点群圧縮(Video-based Point Cloud Compression、VPCC)アルゴリズムである。この圧縮方法で、まず3Dの点群を2Dの平面に投影し、占有図情報、幾何情報、属性情報及び補助情報を取得し、属性情報には、通常、テクスチャ情報及び色情報が含まれるため、圧縮された情報も、通常、4種類のデータに分けて伝送される。
これから分かるように、VPCCデータを伝送する場合、処理すべく情報は主に幾何情報、属性情報、占有図情報及び補助情報の4種類のデータを含む。幾何情報の復号は占有図情報と補助情報に依存し、属性情報の復号は幾何情報、占有図情報及び補助情報に依存する。点群メディアデータは、従来のメディアデータに比べて複雑且つ多様であり、タイプが異なるデータを同時に処理し、整合してから、スペースとテクスチャの特性が豊富なメディアがユーザーに提示される必要がある。現在、既存のマルチメディア伝送プロトコルによって三次元点群データをカプセル化し伝送する研究には一定の進展があるが、ネットワーク伝送技術の発展に伴い、異種ネットワーク環境もますます複雑になっており、従来技術では、点群データの異種ネットワーク環境における伝送効果が悪い。
従来技術の欠点に対し、本発明の目的は、点群データのカプセル化方法及び伝送方法を提供することにある。
本発明に係る点群データのカプセル化方法は、
点群メディアファイルを圧縮することと、
圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットすることと、を含み、前記分類記録は点群メディアファイルにおける各部分のデータタイプを表すために用いられる。
好ましくは、前記点群メディアファイルは複数の点群コンテンツを含み、カプセル化された点群メディアファイルに待ちフラグをセットし、前記待ちフラグは、各点群コンテンツの全てのデータタイプのメディアリソースが既に伝送完了されたか否かを指示するために用いられる。
好ましくは、前記分類記録はメディアセグメントとメディアバージョン及びデータタイプとの間の対応関係を表す分類リストであり、
前記圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットするステップは、
圧縮された点群メディアファイルをカプセル化してメディアリソースが1つ得られ、前記メディアリソースは複数のメディアセグメントを含むことと、
前記分類リストに基づいて、複数の前記メディアセグメントをメディアバージョン及びデータタイプと関連付けることと、を含む。
好ましくは、複数の前記メディアセグメントは異なるメディアセグメント番号を有し、前記分類リストは、タイプリスト、コンテンツリスト及びセグメント番号リストを含み、前記タイプリストは点群メディアファイルのデータタイプに対応し、前記コンテンツリストは複数のメディアバージョンの集まりであり、前記セグメント番号リストは全てのメディアセグメント番号の集まりであり、各データタイプは少なくとも1つのメディアバージョンに対応し、各メディアバージョンは少なくとも1つのメディアセグメント番号に対応する。
好ましくは、前記分類記録は、メディアセグメントとメディアバージョン及びデータタイプとの間の対応関係を表す分類フラグであり、
前記圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットするステップは、
圧縮された点群メディアファイルをカプセル化してメディアリソースが1つ得られ、前記メディアリソースは複数のメディアセグメントを含むことと、
各メディアセグメントに前記分類フラグを1つ追加することと、を含む。
好ましくは、異なるメディアセグメントは同じメディアバージョン及び同じデータタイプを有する場合、追加される分類フラグは同じである。
好ましくは、前記分類フラグは2つのフラグビットを含み、1つのフラグビットはメディアセグメントのデータタイプを定義するために用いられ、もう1つのフラグビットはメディアセグメントのバージョンを定義するために用いられる。
好ましくは、前記分類記録はメディアリソースとデータタイプとの間の対応関係を表す分類リストであり、
前記圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットするステップは、
圧縮された点群メディアファイルをカプセル化して複数のメディアリソースを取得することと、
前記分類リストに基づいて、複数の前記メディアリソースをデータタイプと関連付けることと、を含む。
好ましくは、複数の前記メディアリソースは異なるメディアリソース番号を有し、前記分類リストは、メディアリソースリスト及びリソース番号リストを含み、前記メディアリソースリストは点群メディアファイルのデータタイプに対応し、前記リソース番号リストは全てのメディアリソース番号の集まりであり、各メディアリソースリストは少なくとも1つのメディアリソース番号に対応し、且つ、各メディアリソースリストに対応するメディアリソース番号の数はメディアバージョンと一致する。
本発明に係る点群データの伝送方法は、
シグナリング情報に分類記録の関連コンテンツを追加し、前記分類記録はカプセル化する際の点群メディアファイルにおける各部分のデータタイプを表すために用いられることと、
シグナリング情報に基づいて前記分類記録を取得し、前記分類記録に基づいて現在の点群メディアファイルの更新する必要がある部分データを伝送することと、を含み、
現在の点群メディアファイルの更新する必要がある部分データを伝送する前に、現在の点群メディアファイルの全部のデータを伝送することをさらに含む。
好ましくは、前記点群メディアファイルは複数の点群コンテンツを含み、カプセル化された点群メディアファイルに待ちフラグをセットし、前記待ちフラグは、各点群コンテンツの全てのデータタイプのメディアリソースが既に伝送完了されたか否かを指示するために用いられる。
好ましくは、圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットし、前記分類記録はメディアリソースとデータタイプとの間の対応関係を表す分類リストである。
好ましくは、前記圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットするステップは、
圧縮された点群メディアファイルを1セットのメディアリソースとしてカプセル化し、複数のメディアリソースを取得することと、
前記分類リストに基づいて、複数の前記メディアリソースをデータタイプと関連付けることと、を含む。
好ましくは、複数の前記メディアリソースは異なるメディアリソース番号を有し、前記分類リストは、メディアリソースリスト及びリソース番号リストを含み、前記メディアリソースリストは点群メディアファイルのデータタイプに対応し、前記リソース番号リストは全てのメディアリソース番号の集まりであり、各メディアリソースリストは少なくとも1つのメディアリソース番号に対応し、且つ、各メディアリソースリストに対応するメディアリソース番号の数はメディアバージョンと一致する。
好ましくは、前記分類記録はメディアセグメントとメディアバージョン及びデータタイプとの間の対応関係を表す分類リストであり、
前記シグナリング情報に分類記録の関連コンテンツを追加するステップは、
前記分類リストをDTG情報ファイルとして定義し、前記DTG情報ファイルをシグナリング情報に書き込む、ことを含む。
好ましくは、前記DTG情報ファイルをMPI tableに書き込むか、または、DTG情報ファイルを記述するための記述的なdescriptorを1つ追加するか、または、DTG情報ファイルを記述するためのシグナリングテーブルを1つ追加する。
好ましくは、前記分類記録はメディアリソースとデータタイプとの間の対応関係を表す分類リストであり、
前記シグナリング情報に分類記録の関連コンテンツを追加するステップは、
前記分類リストをACR情報ファイルとして定義し、前記ACR情報ファイルをシグナリング情報に書き込む、ことを含む。
好ましくは、前記ACR情報ファイルをMPI tableに書き込むか、または、ACR情報ファイルを記述するための記述的なdescriptorを1つ追加するか、または、DTG情報ファイルを記述するためのシグナリングテーブルを1つ追加する。
好ましくは、前記分類記録はメディアセグメントとメディアバージョン及びデータタイプとの間の対応関係を表す分類フラグであり、
前記シグナリング情報に分類記録の関連コンテンツを追加するステップは、
予約済みフィールドを用いて、各メディアセグメントのために分類フラグを1つ定義する。
好ましくは、前記分類フラグは2つのフラグビットを含み、1つのフラグビットはメディアセグメントのデータタイプを定義するために用いられ、もう1つのフラグビットはメディアセグメントのバージョンを定義するために用いられ、且つ、メディアセグメントのバージョンが1である場合、メディアセグメントはメディアセグメントのデータタイプを定義するためのフラグビットのみを有する。
好ましくは、メディアセグメントのデータタイプを表すために、MPU Boxにおける予約済みフィールドの2bitsを用いて1つのフラグビットを定義し、メディアセグメントのバージョンを表すために、MPU Boxにおける予約済みフィールドの3bitsを用いてもう1つのフラグビットを定義する。
従来技術と比べ、本発明は、以下のような有益な効果を有する。
本発明は、従来の点群データ処理方法に基づいて、点群メディアファイルにデータタイプに従って分類記録をセットすることで、分類記録に応じて点群データの異なるデータの識別がしやすくなり、これにより、アプリケーションのニーズに応じて点群データの部分データを柔軟に送信しやすくし、全部の点群データを送信する必要がなく、アプリケーションのニーズを満たしつつ帯域幅を節約し、より柔軟且つ効率的に点群データを伝送しやすくし、点群データの異種ネットワークでの柔軟な伝送も可能にした。そのため、本発明は、点群データの伝送に存在するメディアコンテンツの伝送効率の低さ、格納スペースが無駄になるという問題を改善し、メディアコンテンツの組み合わせの柔軟性を高め、マルチメディアサービスに対する管理及びコントロールを強化し、ユーザーにより多くのメディアコンテンツを独立で選択し取得する権利を与え、多様なアプリケーションシーンを提供し、ネットワーク事業者にもより良いマルチメディアコンテンツの提供及び伝送スキームを提供することができる。
本発明の他の特徴、目的及び利点は、下記の図を参照して非限定的な実施形態の詳細な説明を読むことによってより明らかになる。
本発明の実施形態に係る点群データをカプセル化するフローチャートである。 本発明の実施例1に係る点群データをカプセル化するフローチャートである。 本発明の実施例1に係るDTG情報ファイルの定義コンテンツである。 本発明の実施例2に係る点群データをカプセル化するフローチャートである。 本発明の実施例2に係るメディアセグメントにフラグビットを追加する模式図である。 本発明の実施例3に係る点群データをカプセル化するフローチャートである。 本発明の実施例3に係るACR情報ファイルの定義コンテンツである。
下記、本発明について、具体的な実施形態を参照して詳細に説明する。下記の実施例は、当業者が本発明を更に理解するのに役立つが、いかなる形でも本発明を限定するものではない。当業者にとって、本発明の主旨から逸脱することなく、いくつかの変更および改善を行うことが可能であることに留意されたい。これらは何れも本発明の保護の範囲内に属する。
本願の発明者は、点群メディアコンテンツは、提示される中でユーザーとのインタラクションが存在する可能性があるため、点群のいくつかの情報を変更する必要がある、ことを発見した。例えば、点群メディアに基づくキャラクター衣装替えの操作では、通常、点群のテクスチャと色などの属性情報を変更することが要求される。この時、従来の技術では、通常、クライエントに全部の点群データを送信し、このようにすると、帯域幅が増えるだけでなく、伝送効率も低くなり、ユーザーエクスペリエンスにも影響する。
上記の問題について、本発明は、点群データのカプセル化方法を提出し、図1に示すように、下記のステップを含む。
ステップS01:点群メディアファイルを圧縮する。
ステップS02:圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットする。ここで、分類記録は点群メディアファイルにおける各部分のデータタイプを表すために用いられる。
本発明は、分類記録を設けることにより、後で点群コンテンツを提示する際に、分類記録に応じて点群データの異なるデータに対して識別することを容易にし、これにより点群データの適応的な伝送と提示を可能にする。
同時に、本発明は、本発明の点群データのカプセル化方法に基づいて、点群データの伝送方法を更に提出し、下記のステップを含む。
シグナリング情報に前述した分類記録の関連コンテンツを追加する。
シグナリング情報に基づいて分類記録を取得し、分類記録に基づいて現在の点群メディアファイルの更新する必要がある部分データを伝送する。ここで、現在の点群メディアファイルの更新する必要がある部分データを伝送する前に、現在の点群メディアファイルの全部のデータを伝送することをさらに含む。
上記カプセル化方法及び伝送方法に基づいて、最初に点群コンテンツが提示される際に、当該点群コンテンツを提示するために、完全な点群データを取得する必要があり、点群コンテンツを提示した後、衣装替えなどの操作を行うだけで、分類記録に応じて、現在の点群メディアファイルの更新する必要があるデータを選択的に伝送することができ、全部の情報を伝送する必要がない。
本発明の上記目的、特徴及び利点をより明確に理解しやすくするために、本発明の具体的な実施形態について、図を参照して下記に詳細に説明する。
実施例1
本実施例では、分類リストによって分類記録を作成する。当該分類リストは、点群メディアファイルにおけるメディアセグメントとメディアバージョン及びデータタイプとの間の対応関係を表す。より具体的には、圧縮された点群メディアファイルを1つのメディアリソース(asset)としてカプセル化し、分割して図3に示す16のメディアセグメントのような複数のメディアセグメント(MPU)を取得することができる。各メディアセグメントは何れもメディアセグメント番号を1つ有し、例えば1から16の番号で順番に番号を付ける。各メディアセグメント番号は同じではなく、即ちメディアセグメント番号によりメディアセグメントを表すことがわかる。
図2は、本実施形態に係る点群データをカプセル化するフローチャートである。図2に示すように、圧縮された点群メディアファイルを取得した後、下記のステップを更に含む。
ステップS11:圧縮された点群メディアファイルを1つのメディアリソースとしてカプセル化し、複数のメディアセグメントを取得する。
ステップS12:分類リストに基づいて、複数のメディアセグメントをバージョン及びデータタイプと関連付ける。「関連付け」とは、データタイプとメディアバージョン及びメディアセグメント番号との間の対応関係を築くことであり、以下で現れる関連付けも同じ定義となる。
図3は、本実施形態に係る分類リストの定義コンテンツである。図3に示すように、分類リストはタイプリスト、コンテンツリスト及びセグメント番号リストを含む。タイプリストは点群メディアファイルのデータタイプに対応する。コンテンツリストは複数のメディアバージョンの集まりである。セグメント番号リストは全てのメディアセグメント番号の集まりである。さらに、各データタイプは少なくとも1つのメディアバージョンに対応し、各メディアバージョンは少なくとも1つのメディアセグメント番号に対応する。本実施例では、タイプリストの数は点群メディアファイルのデータタイプと対応し、1つのメディアバージョンが1つのアプリケーションシーンである。
図3を継続して参照し、ビデオに基づく点群圧縮アルゴリズム(Video-based Point Cloud Compression、VPCC)を例として、1つの点群メディアファイルが処理された後に4種類のデータが得られ、それぞれ占有図情報、幾何情報、属性情報及び補助情報である。この時、カプセル化する場合、メディアリソースを分割して複数のメディアセグメントが得られ、これらのメディアセグメントも同じく4種類のデータを含み、即ち占有図、幾何、属性及び補助情報である。1つのメディアリソースが分割されて16のメディアセグメントが得られ、番号が順番で1から16であると仮定すると、1つの点群メディアファイルの各部分のデータタイプは何れもメディアセグメントの集まりである。
1つの例示的な実施例において、前述した4種類のデータは、それぞれタイプリスト1、2、3、および4によって表される。ここで、タイプリスト1は占有図情報を表し、タイプリスト2は幾何情報を表し、タイプリスト3は属性情報を表し、タイプリスト4は補助情報を表す。占有図情報は2つのバージョンを含み、それぞれコンテンツリスト1とコンテンツリスト2であり、且つコンテンツリスト1はメディアセグメント番号が1、2であるメディアセグメントからなり、コンテンツリスト2はメディアセグメント番号が3、4、5であるメディアセグメントからなると更に仮定し、よって、占有図情報がメディアセグメント番号は1、2、3、4、5であるメディアセグメントからなる。幾何情報は1つのバージョンのみを含み、即ちコンテンツリスト3であり、且つ当該コンテンツリスト3はメディアセグメント番号が6、7であるメディアセグメントからなると仮定すると、幾何情報はメディアセグメント番号が6、7であるメディアセグメントからなる。属性情報は2つのバージョンを含み、それぞれコンテンツリスト4とコンテンツリスト5であり、ここでコンテンツリスト4はメディアセグメント番号が8、9、10であるメディアセグメントからなり、コンテンツリスト5はメディアセグメント番号が11、12のメディアセグメントからなると更に仮定し、即ち、属性情報はセグメント番号が8、9、10、11、12であるメディアセグメントからなる。また、補助情報は2つのバージョンを含み、それぞれコンテンツリスト6とコンテンツリスト7であり、コンテンツリスト6はメディアセグメント番号が13、14であるメディアセグメントからなり、コンテンツリスト7はメディアセグメント番号が15、16であるメディアセグメントからなると仮定し、即ち、補助情報はメディアセグメント番号が13、14、15、16であるメディアセグメントからなる。1つの点群コンテンツを最初に提示する際に、4つのタイプリストを選択し、さらに各タイプリストからコンテンツリストを1つ選択する必要があり、コンテンツリストが対応するメディアセグメントによって1つの点群コンテンツを完全に提示する。点群コンテンツを最初に提示した後、キャラクターなどの衣装替えの操作を行う必要がある場合に、分類リストに応じて、あるデータタイプに対応するメディアセグメントを選択的に伝送することができ、全部のメディアセグメントを伝送する必要がない。
なお、本実施例では、VPCCの点群圧縮アルゴリズムにより説明したが、本発明は点群圧縮アルゴリズムに制限されるものではなく、本発明は点群データのカプセル化方法も限定しない。そのため、点群メディアファイルのデータタイプは、ここで挙げられた4種類を含むがそれに限定されるものではなく、他の圧縮アルゴリズムを利用しても、他の数及び/またはタイプのデータを更に得ることが可能である。
更に、点群コンテンツを伝送及び提示できるように、分類リストをDTG(Data Type Group)情報ファイルとして定義し、DTG情報ファイルをシグナリング情報に書き込んで伝送する。DTG情報ファイルが定義するコンテンツは前述したタイプリストが定義するコンテンツであり、それによりDTG情報ファイルによって点群メディアファイルとメディアセグメント番号、コンテンツリスト及びタイプリストとの間の対応関係を記述する、ことが理解されるべきである。このようにすることで、受信側はDTG情報ファイルを読み取るだけで点群メディアファイルのデータ分類状況を取得することができ、これによりユーザーのニーズに応じて現在の点群メディアファイルの更新する必要があるデータを選択的に送信することができる。
次に、上記の実例をもとに、本実施例に係るDTG情報ファイルの伝送方式と、如何に点群メディアファイルに基づいてキャラクター衣装替えの操作を行うかを詳しく説明する。
点群コンテンツ(即ち点群メディアファイル)は、占有図情報、幾何情報、属性情報及び補助情報を含むと仮定する。占有図、幾何、属性及び補助情報が何れも1つのバージョンだけを有する場合、この時、タイプリストとコンテンツリストの数は同じである。しかしながら、他の状況で、占有図、幾何、属性及び補助情報が何れも1つのバージョンだけを有する場合、コンテンツリストを設けなくてもよいが、このようにすると複雑さが増す。占有図、幾何、属性、補助情報が何れも複数のバージョンを有する場合、この時、コンテンツリストを設ける必要がある。
例を挙げで説明すると、点群の占有図、幾何、属性及び補助情報を伝送する必要があれば、まず対応するタイプリストを見つける必要がある。図3を例として、タイプリスト1乃至4がそれぞれ占有図、幾何、属性及び補助情報に対応し、占有図情報がバージョンを2つ含むと仮定すると、タイプリスト1では対応して2つのコンテンツリストがあり、ユーザーがコンテンツリストを1つ選択すると、当該コンテンツリストで記載されているメディアセグメント番号に応じて、対応するメディアセグメントを取得し、点群コンテンツの提示に用いられることができる。
したがって、DTG情報ファイルには、点群コンテンツとメディアセグメント番号との対応関係の情報が含まれており、複数の方法でこれらの情報を伝送することができ、例えば、新しいシグナリングユニット、シグナリングファイル、シグナリングメッセージの定義や新しい記述(descriptor)の追加、又は伝送パケットのヘッダー情報の追加などである。実現方法に応じて、異なる方式でDTG情報ファイルが記述する情報を伝送し利用することができる。
本実施例では、DTG情報ファイルの伝送方式について、実例として、3つの伝送方式を提出したが、DTG情報ファイルをシグナリング情報に追加する方法は下記の複数の方式を含むが、これらに限定されるものではない。
方式1:シグナリング情報に、DTG情報を記述するDTG情報ファイルを1つ追加する。
方式1では、テーブル1に示すように、DTG情報ファイルをMPI tableに書き込み、シグナリングメッセージの一部として転送する。
Figure 2023510822000002
DTG情報ファイルをMPI tableに追加し、変更する必要がある部分はPI_contentの記述の部分にあり、PI_content_countの値が1増加する。ここで、PI_content_typeフィールドは、DTG情報ファイルのタイプを記述し、実際の状況に応じてDTG情報の記述に適したファイル形式を選択することは可能である。PI_content_type_length値はファイルタイプの長さ、PI_content_type_length_byte値はDTG情報ファイルのタイプ、PI_content_name_length値はDTG情報ファイル名の長さ、PI_content_name_byte値はDTG情報ファイル名の値である。PI_content_descriptores_lengthとPI_content_descriptors_byteは、それぞれDTG情報ファイルの記述情報の長さ及びコンテンツであり、現在は空であってもよく、将来の拡張のために残す。PI_content_lengthとPI_content_byteは、それぞれDTG情報ファイルの長さとコンテンツである。
上記の説明に従って、DTG情報ファイルをMPI tableに書き込んでから、シグナリング情報によりDTG情報を出すことができる。
方式2:DTG情報を記述するdescriptorを1つ追加する。
例えば、既存のMMTプロトコルが定義するシグナリングメッセージでは、いくつかの記述的なdescriptorを定義しており、descriptorはMMTにおけるシグナリング部分がいくつかのフィールド又は機能を定義するための記述的な情報である。例えば、dependency descriptorとMPU_timestamp_descriptorである。したがって、方式2では、DTG情報を記述するdescriptorを新たに1つ定義することができ、descriptorでは、メディアセグメントのタイプ情報を記述することが可能である。MP tableにおいて、asset_descriptorsフィールドが存在し、必要に応じてasset_descriptorsにテーブル2に示すようなMPUtype_descriptorを追加することで実現できる。
Figure 2023510822000003
ここで、descriptor_tagはdescriptorのタイプを指示するために用いられ、descriptor_lengthはdescriptorの長さを指示するために用いられ、num_mpuはMPUの数を指示するために用いられ、mpu_type()はMPUのデータタイプを指示するために用いられる。
方式3:DTG情報を記述するシグナリングテーブルを1つ追加する。
上記の方法に加えて、シグナリング情報にDTGファイル情報を記述するために特別に使用されるシグナリングテーブルを新たに1つ追加することが可能である。DTGファイル情報を記述するテーブルを生成してから特定のヘッダー部を追加すれば、DTG情報を記述するシグナリング情報を生成することができ、当該シグナリング情報とPA message、MPI message、MP message、CRI messageなどと共に新しいシグナリング情報を構成して転送する。受信側は、シグナリングメッセージを受信してから解析すれば、コンテンツリスト情報が得られる。
1つの例示的な操作では、ユーザーは点群占有図情報を要求する場合、受信側はDTG情報ファイルを検査することにより、占有図情報に対応するコンテンツリスト1を見つけ出し、コンテンツリスト1に対応するメディアセグメント番号1、2を見つけ出し、この時、クライエント(点群メディアプレーヤ)は、これらのメディアセグメントを送信してローカルに格納し、ローカルデータベースを更新するように要求する。ユーザーは、続いて、点群の幾何情報を要求する場合、受信側はまたDTG情報ファイルを検査することにより、幾何情報に対応するコンテンツリスト3を見つけ出し、コンテンツリスト3が対応するメディアセグメント番号6、7を見つけ出し、この時、クライエントは、これらのメディアセグメントを送信してローカルに格納し、ローカルデータベースを更新するように要求する。ユーザーは、続いて、点群属性情報を要求する場合、受信側はDTG情報ファイルを検査することにより、属性情報に対応するコンテンツリスト4を見つけ出し、コンテンツリスト4が対応するメディアセグメント番号8、9、10を見つけ出し、この時、クライエントは、これらのメディアセグメントを送信してローカルに格納し、ローカルデータベースを更新するように要求する。ユーザーは、続いて、点群の補助情報を要求する場合、受信側はDTG情報ファイルを検査することにより、補助情報に対応するコンテンツリスト6を見つけ出し、コンテンツリスト6に対応するメディアセグメント番号13、14を見つけ出し、この時、クライエントは、これらのメディアセグメントを送信してローカルに格納し、ローカルデータベースを更新するように要求する。ユーザーは、全部の情報を取得した後、4つのコンテンツリスト(コンテンツリスト1、3、4、6)における情報を統合し、1つの点群メディアを完全に提示することができる。その後、ユーザーが衣装を替える必要がある場合、まず衣装替えの必要があるデータのタイプに応じて対応するタイプリストを見つけ、続いてタイプリストからコンテンツリストを選択し、さらにコンテンツリストにおけるメディアセグメント番号に応じて必要となるメディアセグメントを抽出すればよい。
本実施例では、MMT(マルチメディア伝送プロトコル)を例として提出された点群データの伝送方式を説明したが、本実施例の点群データは、DASH伝送のように他のファイルを使用して伝送することもできる、ことを追加で説明する。
実施例2
本実施例では、分類フラグによって分類記録を形成し、当該分類フラグはメディアセグメントとメディアバージョン及びデータタイプとの間の対応関係を表す。
図4は、本実施形態に係る点群データのカプセル化のフローチャートである。図4に示すように、圧縮された点群メディアファイルを取得してから、下記のステップを更に含む。
ステップS21:圧縮された点群メディアファイルを1つのメディアリソースとしてカプセル化し、分割し図5に示す16のメディアセグメント(MPU)など複数のメディアセグメント(MPU)を取得することが可能である。
ステップS22:カプセル化する際に、各メディアセグメントに分類フラグを1つ追加し、当該分類フラグによりメディアセグメントのデータタイプ及びバージョン情報を記録する。
異なるメディアセグメントは同じメディアバージョン及び同じデータタイプを有する場合、通常、追加される分類フラグは同じである。本実施例は、分類フラグの追加方式を限定せず、例えば、点群メディアファイルをカプセル化する際に、予約済みフィールドを利用してMPUに分類フラグを追加することが可能であり、その後のユーザーは、分類フラグに応じてあるタイプの点群データを要求できればよい。
分類フラグは、下記で記述したtype_id及びtype_sequence_numberのように、通常、2つのフラグビットを含む。type_idは、メディアセグメントのデータタイプを定義するために用いられ、type_sequence_numberは、メディアセグメントのバージョンを定義するために用いられる。図5に示すものを例として、一行目の4つのMPUのデータタイプは何れもtype_id=00として定義し、二行目の4つのMPUのデータタイプはtype_id=01として定義し、三行目の4つのデータタイプはtype_id=02として定義し、最後の行の4つのMPUのデータタイプはtype_id=03として定義し、type_idの4つの値は占有図、幾何、属性及び補助情報の4種類のデータにそれぞれ対応する。本実施例は、type_id及びtype_sequence_numberの追加の具体的方式を限定しない。
例示的な実施例では、MPUBoxにおける予約済みフィールドを用いてtype_id及びtype_sequence_numberを定義することができる。例えば、予約済みフィールドにおける2bitをtype_idとして定義し、予約済みフィールドにおける3bitをtype_sequence_numberとして定義し、残りの1bitが引き続き予約済みフィールドとなる(将来必要に応じて、より多くの又はより少ない種類のtype_idを定義する必要がある場合、type_idのフィールドの長さを継続して増加又は減少することが可能である)。これにより、テーブル3に示すように、type_idを用いて、1つのメディアリソース(asset_idとして定義する)に属する全てのMPUを異なるタイプに分けることが可能である。
Figure 2023510822000004
テーブル3に示すように、左側の欄は既存のMMT定義方式であり、右側の欄は本発明のMMT定義である。本発明では、type_idに2bitを割り当て、type_sequence_numberに3bitを割り当てる、ことがわかる。
例えば、キャラクターの衣装替えを行う場合、占有図情報、幾何情報及び補助情報は何れも1つのバージョンだけを有する可能性があるが、対応する属性情報は複数のバージョンを有する可能性があるため、各type_idにtype_sequence_numberを1つセットすることができ、type_sequence_numberの数がバージョンの数である。例えば、1つの点群キャラクターが3着の服装を有する場合、type_idは10とし、type_sequence_numberは000、001、010となることができ、type_sequence_numberが同じであるMPUは同じ服装に対応する。
更に図5を参照して説明すると、type_idの値が01である場合、対応するデータは2つのバージョンを有し、type_sequence_numberは異なる値を2つ有し、例えば、000と001である。type_idの値が03である場合、対応するデータは4つのバージョンを有し、type_sequence_numberは異なる値を4つ有し、例えば、000、001、002、003である。type_id=00となるMPUは、データが1つのバージョンのみを有する場合、MPUのためにtype_sequence_numberを定義する必要がないことを理解すべきである。
実施例3
本実施例では、分類記録も分類リストであり、実施例1と異なる点は、当該分類リストは点群メディアファイルにおけるメディアリソースとデータタイプとの間の対応関係を表し、より具体的には、メディアリソース番号とメディアリソースリストとの間の対応関係を表す。
図6は、本実施形態に係る点群データのカプセル化のフローチャートである。図6に示すように、圧縮された点群メディアファイルを取得してから、下記のステップを更に含む。
ステップS31:圧縮された点群メディアファイルを1セットのメディアリソース(asset_list)としてカプセル化し、図7に示す16のメディアリソースのような複数のメディアリソースを取得することが可能である。各メディアリソースはメディアリソース番号を何れも1つ有し、例えば1から16の番号で順番に番号を付ける。各メディアリソース番号は同じではなく、即ちメディアリソース番号でメディアリソースを表す、ことがわかる。
ステップS32:分類リストに基づいて、複数のメディアリソースをデータタイプと関連付ける。
図7に示すように、分類リストはメディアリソースリスト及びリソース番号リストを含む。メディアリソースリストは点群メディアファイルのデータタイプに対応する。リソース番号リストは全てのメディアリソース番号の集まりである。各メディアリソースリストは少なくとも1つのメディアリソース番号に対応し、且つ、各メディアリソースリストに対応するメディアリソース番号の数はメディアバージョンと一致する。各メディアリソースは少なくとも1つのメディアセグメントを含み、当該メディアセグメントの時間期間は数秒であってもよい。
ある点群コンテンツは、16のメディアリソースからなり、メディアリソース番号は順番で1から16であると仮定する。メディアリソースリストは4つで、それぞれ占有図情報、幾何情報、属性情報及び補助情報に対応すると仮定する。図7に示すように、占有図情報はメディアリソースリスト1であり、5つのバージョンを対応して含み、メディアリソース番号が1乃至5であるメディアリソースに対応することができる。幾何情報はリソースカテゴリ2であり、2つのバージョンを対応して含み、それぞれメディアリソース番号が6、7であるメディアリソースに対応する。属性情報はメディアリソースリスト3であり、5つのバージョンを対応して含み、それぞれメディアリソース番号が8乃至12であるメディアリソースに対応する。補助情報はメディアリソースリスト4であり、4つのバージョンを対応して含み、メディアリソース番号が13乃至16であるメディアリソースに対応する。メディアリソース番号はメディアリソース中のフラグフィールドである。当該点群コンテンツはメディアリソース番号がそれぞれ1乃至16であるメディアリソースに対応し、異なる点群コンテンツは異なるメディアリソースの組み合わせに対応し、例えば、メディアリソース番号が1、6、8、13である場合とメディアリソース番号が1、6、9、13である場合の点群コンテンツは、同一点群キャラクターの異なる服装の時の姿に対応する可能性がある。前記点群メディアファイルは複数の点群コンテンツを含み、カプセル化された点群メディアファイルに待ちフラグ(pending_flag)をセットし、前記待ちフラグは、各点群コンテンツの全てのデータタイプのメディアリソースが準備完了されたか否かを指示するために用いられる。各点群コンテンツの全てのデータタイプのメディアリソースが準備完了されている場合、pending_flagの値は1とし、でなければその値は0とする。
例えば、メディアリソース番号が1、6、8、13である場合の点群コンテンツとメディアリソース番号が1、6、9、13である点群コンテンツを相次いで伝送し、前後2つの点群コンテンツでは1つのメディアリソースだけが違うため、後者の点群コンテンツはメディアリソース番号が9であるメディアリソースのみを伝送すればよい。前者の点群コンテンツが含むメディアリソース番号が1、6、8、13であるメディアリソースが伝送完了された後、pending_flagの値は1となる。前者の点群が伝送完了され、後者の点群コンテンツ(メディアリソース番号が9であるメディアリソースのみを伝送する必要がある)が伝送されている時、pending_flagの値が0になる。後者の点群コンテンツ(メディアリソース番号が9であるメディアリソースのみを伝送する必要がある)が伝送完了されると、pending_flagの値が1になる。
各点群コンテンツはいずれも待ちフラグ(pending_flag)を1つ対応しセットすることができ、待ちフラグは、当該点群コンテンツの全てのデータタイプのメディアリソースが準備完了されているか否かを指示するために用いられる。
更に、点群コンテンツを伝送及び提示できるように、本実施例では、分類リストをACR(Asset Content Relationship)情報ファイルとして定義し、前記ACR情報ファイルをシグナリング情報に書き込む。同様に、ACR情報ファイルで定義されるコンテンツは、本実施例の分類テーブルに対応するコンテンツであり、点群メディアファイルのデータタイプとメディアリソース番号との間の対応関係を記述するために用いられる。1つの提示可能な点群コンテンツは1つのメディアリソースリストに対応し、メディアリソースリストはメディアリソース番号の集まりであり、メディアリソース番号はメディアリソースのフラグフィールドである。このようにすることで、ACR情報ファイルを読み取るだけで点群メディアファイルの分類状況を取得することができ、これによりユーザーのニーズに応じて現在の点群メディアファイルの更新する必要があるデータを選択的に送信することを容易にする。
次に、上記の実例をもとに、本実施例に係るACR情報ファイルの伝送方式と、如何に点群メディアに基づいてキャラクター衣装替えの操作を行うかを詳しく説明する。
1つの完全な点群コンテンツを構成するのは、占有図、幾何、属性、補助情報に対応するメディアリソースリストからメディアリソース番号を探してから、対応するメディアリソースを抽出する必要があると仮定する。占有図、幾何、属性、補助情報が対応するメディアリソースリストが、それぞれasset_list[0]、asset_list[1]、asset_list[2]、asset_list[3]であると仮定し、それらからメディアリソース番号を1つずつ取得し、メディアリソースはメディアリソース番号によって区別され、その設定ルールはテーブル4に示すとおりである。
Figure 2023510822000005
ここで、メディアリソース番号(asset_id)が0、1であるメディアリソースは、それぞれ点群の占有図及び幾何情報に対応し、メディアリソース番号が2、3及び4、5であるメディアリソースは2セットの属性と補助情報である。そのため、メディアリソース番号が0、1、2、3及び0、1、4、5であるメディアリソースは、それぞれ異なる点群コンテンツを構成することが可能であり、これは同一キャラクターの異なる服装である。
ACR情報ファイルは、点群の異なるデータタイプの重要な情報を含み、異なる方法でこれらの重要な情報を伝送することが可能であり、例えば、新しいシグナリングユニット、シグナリングファイル、シグナリングメッセージの定義や新しいdescriptorの追加、又は伝送パケットのヘッダー情報の追加などである。実現の方法の違いに応じて、異なる方式でACR情報ファイルが記述する情報を伝送し利用することができる。
本実施例では、ACR情報ファイルの伝送方式について、実例として、2つの方式を提出したが、ACR情報ファイルをシグナリング情報に追加する方法は下記の複数の方式を含むが、これらに限定されない。
方式1:シグナリング情報に、ACR情報を記述するACRファイルを1つ追加する。
方式1では、テーブル5に示すように、ACR情報ファイルをMPI tableに入れて、シグナリングメッセージの一部として転送する。
Figure 2023510822000006
より具体的には、ACR情報ファイルをMPI tableに追加し、変更が必要な部分はPI_contentの記述の部分にあり、PI_content_countの値が1増加する。ここで、PI_content_typeフィールドは、ACR情報ファイルのタイプを記述し、実際の状況に応じてACR情報の記述に適したファイル形式を選択することは可能である。PI_content_type_length値はファイルタイプの長さ、PI_content_type_length_byte値はACR情報ファイルのタイプ、PI_content_name_length値はACR情報ファイルnameの長さ、PI_content_name_byte値はACR情報ファイルnameの値である。PI_content_descriptores_lengthとPI_content_descriptors_byteは、それぞれACR情報ファイルの記述情報の長さ及びコンテンツであり、現在は空であってもよく、将来の拡張のために残す。PI_content_lengthとPI_content_byteは、それぞれACR情報ファイルの長さとコンテンツである。
上記の説明に従って、ACR情報ファイルをMPI tableに書き込んだ後、シグナリング情報によりACR情報を転送することができる。
方式2:ACR情報を記述するシグナリングテーブルを1つ追加する。
上記の方法に加えて、シグナリング情報にACRファイル情報を記述するために特別に使用されるシグナリングテーブルを更に1つ追加することが可能である。ACR情報を記述するテーブルを生成してから特定のヘッダー部を追加すれば、ACR情報を記述するシグナリング情報を生成し、当該シグナリング情報はPA message、MPI message、MP message、CRI messageなどと共に新しいシグナリング情報を構成して転送する。受信側は、シグナリングメッセージを受信してから解析すれば、関連するメディアリソースリスト情報が得られる。
本発明によって提出される実現方法をより明確に説明するために、方式1に従って例を挙げて1つの具体的な実現フローを説明する。
受信側がサービスにログインすると、送信側がシグナリング情報を送信し、ユーザーがACR情報ファイルにおけるメディアリソースリスト(asset_list)を取得した後、asset_list[0]、asset_list[1]、asset_list[2]、asset_list[3]から占有図、幾何、属性及び補助情報に対応するメディアリソース番号(asset_id)を知ることができる。送信側に点群の占有図を要求する場合、受信側は、ACR情報ファイルを検査することにより、占有図のasset_list[0]に対応するasset_idが0であることを見つけ出す。ユーザーは引き続き幾何を要求する場合、DTG情報ファイル及びローカルデータベースを検査することにより、送信側から対応するメディアリソース(asset)を取得し、これらのメディアリソースはasset_list[1]が含むあるasset_idに対応するメディアリソースである。ユーザーは属性を要求する場合、ACR情報ファイル及びローカルデータベースを検査することにより、送信側から対応するメディアリソースを取得し、これらのメディアリソースはasset_list[2]が含むasset_idに対応するメディアリソースである。ユーザーは引き続き補助情報を要求する場合、DTG情報ファイル及びローカルデータベースを検査することにより、送信側から対応するメディアリソースを取得し、これらのメディアリソースはasset_list[3]が含むasset_idに対応するメディアリソースである。ユーザーは全部の情報を取得した後、取得した4つのメディアリソースの情報を統合し、点群メディアを提示することが可能である。ユーザーは衣装替えの必要がある場合、asset_list[2]とasset_list[3]中の対応するメディアリソースを再度要求するだけで済む。
本実施例は、MMT(マルチメディア伝送プロトコル)を例として提出された点群データの伝送方式を説明したが、本実施例の点群データは、DASH伝送のように他のファイルを使用して伝送することもできる、ことを追加説明する。
以上、本発明の具体的な実施形態を説明した。本発明は、上記の具体的な実施形態に限定されず、当業者は本発明の請求項の範囲内で様々な変更又は修正を行うことができ、これは本発明の本質的な内容に影響しない、ことを理解する必要がある。衝突しない状況であれば、本願の実施例および実施形態における特徴は、互いに任意に組み合わせることが可能である。
好ましくは、前記ACR情報ファイルをMPI tableに書き込むか、または、ACR情報ファイルを記述するための記述的なdescriptorを1つ追加するか、または、ACR情報ファイルを記述するためのシグナリングテーブルを1つ追加する。
実施例1
本実施例では、分類リストによって分類記録を作成する。当該分類リストは、点群メディアファイルにおけるメディアセグメントとメディアバージョン及びデータタイプとの間の対応関係を表す。より具体的には、圧縮された点群メディアファイルを1つのメディアリソース(asset)としてカプセル化し、分割して図3に示す16のメディアセグメントのような複数のメディアセグメントを取得することができる。各メディアセグメントは何れもメディアセグメント番号を1つ有し、例えば1から16の番号で順番に番号を付ける。各メディアセグメント番号は同じではなく、即ちメディアセグメント番号によりメディアセグメントを表すことがわかる。
上記の方法に加えて、シグナリング情報にDTGファイル情報を記述するために特別に使用されるシグナリングテーブルを新たに1つ追加することが可能である。DTGファイル情報を記述するテーブルを生成してから特定のヘッダー部を追加すれば、DTG情報を記述するシグナリング情報を生成することができ、当該シグナリング情報とPA message、MPI message、MP message、CRI messageなどと共に新しいシグナリング情報を構成して転送する。受信側は、新しいシグナリング情報を受信してから解析すれば、コンテンツリスト情報が得られる。
図4は、本実施形態に係る点群データのカプセル化のフローチャートである。図4に示すように、圧縮された点群メディアファイルを取得してから、下記のステップを更に含む。
ステップS21:圧縮された点群メディアファイルを1つのメディアリソースとしてカプセル化し、分割し図5に示す16のメディアセグメントなど複数のメディアセグメントを取得することが可能である。
ステップS22:カプセル化する際に、各メディアセグメントに分類フラグを1つ追加し、当該分類フラグによりメディアセグメントのデータタイプ及びバージョン情報を記録する。
ある点群コンテンツは、16のメディアリソースからなり、メディアリソース番号は順番で1から16であると仮定する。メディアリソースリストは4つで、それぞれ占有図情報、幾何情報、属性情報及び補助情報に対応すると仮定する。図7に示すように、占有図情報はメディアリソースリスト1であり、5つのバージョンを対応して含み、メディアリソース番号が1乃至5であるメディアリソースに対応することができる。幾何情報はメディアリソースリスト2であり、2つのバージョンを対応して含み、それぞれメディアリソース番号が6、7であるメディアリソースに対応する。属性情報はメディアリソースリスト3であり、5つのバージョンを対応して含み、それぞれメディアリソース番号が8乃至12であるメディアリソースに対応する。補助情報はメディアリソースリスト4であり、4つのバージョンを対応して含み、メディアリソース番号が13乃至16であるメディアリソースに対応する。メディアリソース番号はメディアリソース中のフラグフィールドである。当該点群コンテンツはメディアリソース番号がそれぞれ1乃至16であるメディアリソースに対応し、異なる点群コンテンツは異なるメディアリソースの組み合わせに対応し、例えば、メディアリソース番号が1、6、8、13である場合とメディアリソース番号が1、6、9、13である場合の点群コンテンツは、同一点群キャラクターの異なる服装の時の姿に対応する可能性がある。前記点群メディアファイルは複数の点群コンテンツを含み、カプセル化された点群メディアファイルに待ちフラグ(pending_flag)をセットし、前記待ちフラグは、各点群コンテンツの全てのデータタイプのメディアリソースが準備完了されたか否かを指示するために用いられる。各点群コンテンツの全てのデータタイプのメディアリソースが準備完了されている場合、pending_flagの値は1とし、でなければその値は0とする。
上記の方法に加えて、シグナリング情報にACRファイル情報を記述するために特別に使用されるシグナリングテーブルを更に1つ追加することが可能である。ACR情報を記述するテーブルを生成してから特定のヘッダー部を追加すれば、ACR情報を記述するシグナリング情報を生成し、当該シグナリング情報はPA message、MPI message、MP message、CRI messageなどと共に新しいシグナリング情報を構成して転送する。受信側は、新しいシグナリング情報を受信してから解析すれば、関連するメディアリソースリスト情報が得られる。
受信側がサービスにログインすると、送信側がシグナリング情報を送信し、ユーザーがACR情報ファイルにおけるメディアリソースリスト(asset_list)を取得した後、asset_list[0]、asset_list[1]、asset_list[2]、asset_list[3]から占有図、幾何、属性及び補助情報に対応するメディアリソース番号(asset_id)を知ることができる。送信側に点群の占有図を要求する場合、受信側は、DTG情報ファイルを検査することにより、占有図のasset_list[0]に対応するasset_idが0であることを見つけ出す。ユーザーは引き続き幾何を要求する場合、DTG情報ファイル及びローカルデータベースを検査することにより、送信側から対応するメディアリソース(asset)を取得し、これらのメディアリソースはasset_list[1]が含むあるasset_idに対応するメディアリソースである。ユーザーは属性を要求する場合、DTG情報ファイル及びローカルデータベースを検査することにより、送信側から対応するメディアリソースを取得し、これらのメディアリソースはasset_list[2]が含むasset_idに対応するメディアリソースである。ユーザーは引き続き補助情報を要求する場合、DTG情報ファイル及びローカルデータベースを検査することにより、送信側から対応するメディアリソースを取得し、これらのメディアリソースはasset_list[3]が含むasset_idに対応するメディアリソースである。ユーザーは全部の情報を取得した後、取得した4つのメディアリソースの情報を統合し、点群メディアを提示することが可能である。ユーザーは衣装替えの必要がある場合、asset_list[2]とasset_list[3]中の対応するメディアリソースを再度要求するだけで済む。

Claims (9)

  1. 点群メディアファイルを圧縮することと、
    圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットすることと、を含み、前記分類記録は点群メディアファイルにおける各部分のデータタイプを表すために用いられる、
    ことを特徴とする、点群データのカプセル化方法。
  2. 前記点群メディアファイルは複数の点群コンテンツを含み、カプセル化された点群メディアファイルに待ちフラグをセットすることを、さらに含み、
    前記待ちフラグは、各点群コンテンツの全てのデータタイプのメディアリソースが既に伝送完了されたか否かを指示するために用いられる、
    ことを特徴とする、請求項1に記載の点群データのカプセル化方法。
  3. 前記分類記録は、メディアリソースとデータタイプとの間の対応関係を表す分類リストであり、
    前記圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットするステップは、
    圧縮された点群メディアファイルを1セットのメディアリソースとしてカプセル化し、複数のメディアリソースを取得することと、
    前記分類リストに基づいて、複数の前記メディアリソースをデータタイプと関連付けることと、を含む、
    ことを特徴とする、請求項1に記載の点群データのカプセル化方法。
  4. 複数の前記メディアリソースは異なるメディアリソース番号を有し、前記分類リストはメディアリソースリスト及びリソース番号リストを含み、前記メディアリソースリストは点群メディアファイルのデータタイプに対応し、前記リソース番号リストは全てのメディアリソース番号の集まりであり、各メディアリソースリストは少なくとも1つのメディアリソース番号に対応し、且つ、各メディアリソースリストに対応するメディアリソース番号の数はメディアバージョンと一致する、
    ことを特徴とする、請求項3に記載の点群データのカプセル化方法。
  5. シグナリング情報に分類記録の関連コンテンツを追加し、前記分類記録はカプセル化する際の点群メディアファイルにおける各部分のデータタイプを表すために用いられることと、
    シグナリング情報に基づいて前記分類記録を取得し、前記分類記録に基づいて現在の点群メディアファイルの更新する必要がある部分データを伝送することと、を含み、
    現在の点群メディアファイルの更新する必要がある部分データを伝送する前に、現在の点群メディアファイルの全部のデータを伝送することをさらに含む、
    ことを特徴とする、点群データの伝送方法。
  6. 前記点群メディアファイルは複数の点群コンテンツを含み、カプセル化された点群メディアファイルに待ちフラグをセットし、前記待ちフラグは、各点群コンテンツの全てのデータタイプのメディアリソースが既に伝送完了されたか否かを指示するために用いられる、
    ことを特徴とする、請求項5に記載の点群データの伝送方法。
  7. 圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットすることを含み、
    前記分類記録は、メディアリソースとデータタイプとの間の対応関係を表す分類リストである、
    ことを特徴とする、請求項5に記載の点群データの伝送方法。
  8. 前記圧縮された点群メディアファイルをカプセル化し、データタイプに従って分類記録をセットするステップは、
    圧縮された点群メディアファイルを1セットのメディアリソースとしてカプセル化し、複数のメディアリソースを取得することと、
    前記分類リストに基づいて、複数の前記メディアリソースをデータタイプと関連付けることと、を含む、
    ことを特徴とする、請求項7に記載の点群データの伝送方法。
  9. 複数の前記メディアリソースは異なるメディアリソース番号を有し、前記分類リストはメディアリソースリスト及びリソース番号リストを含み、前記メディアリソースリストは点群メディアファイルのデータタイプに対応し、前記リソース番号リストは全てのメディアリソース番号の集まりであり、各メディアリソースリストは少なくとも1つのメディアリソース番号に対応し、且つ、各メディアリソースリストに対応するメディアリソース番号の数はメディアバージョンと一致する、
    ことを特徴とする、請求項8に記載の点群データの伝送方法。
JP2022542466A 2020-01-10 2021-01-08 点群データのカプセル化方法及び伝送方法 Pending JP2023510822A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010026089.4 2020-01-10
CN202010026089.4A CN113114608B (zh) 2020-01-10 2020-01-10 点云数据封装方法及传输方法
PCT/CN2021/070917 WO2021139784A1 (zh) 2020-01-10 2021-01-08 点云数据封装方法及传输方法

Publications (1)

Publication Number Publication Date
JP2023510822A true JP2023510822A (ja) 2023-03-15

Family

ID=76708606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022542466A Pending JP2023510822A (ja) 2020-01-10 2021-01-08 点群データのカプセル化方法及び伝送方法

Country Status (6)

Country Link
US (1) US20230048715A1 (ja)
EP (1) EP4090021A4 (ja)
JP (1) JP2023510822A (ja)
KR (1) KR20220124790A (ja)
CN (1) CN113114608B (ja)
WO (1) WO2021139784A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113852829A (zh) * 2021-09-01 2021-12-28 腾讯科技(深圳)有限公司 点云媒体文件的封装与解封装方法、装置及存储介质
CN116233493A (zh) * 2021-09-29 2023-06-06 腾讯科技(深圳)有限公司 沉浸媒体的数据处理方法、装置、设备及可读存储介质
GB2613853B (en) * 2021-12-16 2024-01-24 Canon Kk Method, device, and computer program for optimizing encapsulation of point cloud data

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100485662C (zh) * 2006-07-10 2009-05-06 山东理工大学 基于数据动态存取模型的产品点云型面特征分析方法
JP6567064B2 (ja) * 2015-02-13 2019-08-28 上海交通大学Shanghai Jiao Tong University 関連マルチメディアコンテンツのカスタマイズ表示の実現方法およびその応用
EP3249921A1 (en) * 2016-05-24 2017-11-29 Thomson Licensing Method, apparatus and stream for immersive video format
US20180053324A1 (en) * 2016-08-19 2018-02-22 Mitsubishi Electric Research Laboratories, Inc. Method for Predictive Coding of Point Cloud Geometries
CN106331676B (zh) * 2016-08-31 2018-03-27 贾岳杭 基于虚拟现实环境的三维数据的处理与传输方法
CN108510558B (zh) * 2017-02-28 2019-08-16 贝壳找房(北京)科技有限公司 点云数据的压缩方法、装置及终端
US11683831B2 (en) * 2017-12-01 2023-06-20 Woven Planet North America, Inc. Systems and methods for providing resource analysis for autonomous mobility on demand
CN108009979B (zh) * 2017-12-15 2021-02-26 湖北大学 基于时空数据融合的三维点云压缩存储方法及系统
US10735826B2 (en) * 2017-12-20 2020-08-04 Intel Corporation Free dimension format and codec
US10783668B2 (en) * 2017-12-22 2020-09-22 Samsung Electronics Co., Ltd. Handling duplicate points in point cloud compression
CN110012279B (zh) * 2018-01-05 2020-11-17 上海交通大学 基于3d点云数据的分视角压缩和传输方法及系统
EP3514969B1 (en) * 2018-01-18 2021-08-04 BlackBerry Limited Methods and devices using direct coding in point cloud compression
CN110363822A (zh) * 2018-04-11 2019-10-22 上海交通大学 一种3d点云压缩方法
US11381621B2 (en) * 2018-04-11 2022-07-05 Samsung Electronics Co., Ltd. Device and method for processing data in multimedia system
EP3595180B1 (en) * 2018-07-10 2021-12-08 BlackBerry Limited Methods and devices for neighbourhood-based occupancy prediction in point cloud compression
US11449771B2 (en) * 2018-09-21 2022-09-20 Woven Planet North America, Inc. Systems and methods for processing vehicle data
US10911572B2 (en) * 2018-10-01 2021-02-02 Renovo Motors, Inc. Systems and methods for dynamic application management with an autonomous vehicle
US11348284B2 (en) * 2019-01-08 2022-05-31 Apple Inc. Auxiliary information signaling and reference management for projection-based point cloud compression
US11259048B2 (en) * 2019-01-09 2022-02-22 Samsung Electronics Co., Ltd. Adaptive selection of occupancy map precision
US11200700B2 (en) * 2019-01-10 2021-12-14 Mediatek Singapore Pte. Ltd. Methods and apparatus for signaling viewports and regions of interest for point cloud multimedia data
US11200701B2 (en) * 2019-03-19 2021-12-14 Nokia Technologies Oy Method and apparatus for storage and signaling of static point cloud data
US11122102B2 (en) * 2019-07-03 2021-09-14 Lg Electronics Inc. Point cloud data transmission apparatus, point cloud data transmission method, point cloud data reception apparatus and point cloud data reception method
WO2021002657A1 (ko) * 2019-07-04 2021-01-07 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
US11627314B2 (en) * 2019-09-27 2023-04-11 Apple Inc. Video-based point cloud compression with non-normative smoothing
US11363330B2 (en) * 2019-10-01 2022-06-14 Samsung Electronics Co., Ltd. Method, apparatus and computer-readable recording medium for transmitting or receiving VPCC data
KR102518819B1 (ko) * 2019-10-07 2023-04-06 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
US11589032B2 (en) * 2020-01-07 2023-02-21 Mediatek Singapore Pte. Ltd. Methods and apparatus for using track derivations to generate new tracks for network based media processing applications
US11477483B2 (en) * 2020-01-08 2022-10-18 Apple Inc. Video-based point cloud compression with variable patch scaling

Also Published As

Publication number Publication date
EP4090021A4 (en) 2024-01-24
EP4090021A1 (en) 2022-11-16
CN113114608A (zh) 2021-07-13
CN113114608B (zh) 2022-06-10
KR20220124790A (ko) 2022-09-14
US20230048715A1 (en) 2023-02-16
WO2021139784A1 (zh) 2021-07-15

Similar Documents

Publication Publication Date Title
JP2023510822A (ja) 点群データのカプセル化方法及び伝送方法
CN101123613B (zh) 一种多维地址编址数据处理的方法和装置以及系统
CN106453536B (zh) 一种网络请求处理方法、服务器和系统
US20110285715A1 (en) Method and System for Providing Scene Data of Virtual World
CN109451006A (zh) 一种数据传输方法、装置、服务器及计算机存储介质
CN108200447A (zh) 直播数据传输方法、装置、电子设备、服务器及存储介质
WO2022194309A1 (zh) 三维点云的传输方法、接收方法、传输装置、接收装置及存储介质
CN111818354A (zh) 动画配置、播放方法、装置、电子设备、系统和介质
US20030113022A1 (en) Apparatus for transmitting and/or receiving stream data and method for producing the same
CN107454456B (zh) 一种浮层元素的管理控制方法及系统
CN114793223A (zh) Dns记录的存储方法、装置、存储介质及电子设备
CN112925595A (zh) 资源分发方法、装置、电子设备及存储介质
US11973994B2 (en) Media processing method
CN114579506A (zh) 处理器之间的通信方法、系统、存储介质以及处理器
CN114501060A (zh) 直播背景的切换方法和装置、存储介质及电子设备
KR102481009B1 (ko) 크로마 서브 샘플링된 이미지들에 대한 빠른 참조 객체 저장 형식에 대한 방법
WO2015149587A1 (zh) 一种图计算预处理的装置、方法及系统
WO2024027274A1 (zh) 一种地图场景渲染方法、装置、服务器、终端、计算机可读存储介质及计算机程序产品
CN114866514B (zh) 多用户数据流转控制与处理方法、装置、设备及介质
JP3428513B2 (ja) 多次元ストリームデータを用いた、送信装置、送信方法、受信装置、受信方法および通信システム
CN111800742B (zh) 一种移动位置数据的管理方法、装置、存储介质及终端
CN116681813B (zh) 区块链原创认证的浏览器中3d场景渲染方法及系统
US20230403383A1 (en) Data processing method and apparatus, computer and readable storage medium
US8639845B2 (en) Method for editing multimedia pages on a terminal using pre-stored parameters of objects appearing in scenes
KR102055224B1 (ko) 분산형 클라우드 기반 미디어 서비스 제공 장치 및 장치의 동작 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220906

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240412