JP7480773B2 - 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 - Google Patents
情報処理装置、情報処理方法、再生処理装置及び再生処理方法 Download PDFInfo
- Publication number
- JP7480773B2 JP7480773B2 JP2021506217A JP2021506217A JP7480773B2 JP 7480773 B2 JP7480773 B2 JP 7480773B2 JP 2021506217 A JP2021506217 A JP 2021506217A JP 2021506217 A JP2021506217 A JP 2021506217A JP 7480773 B2 JP7480773 B2 JP 7480773B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- dimensional object
- file
- dimensional
- identification information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 63
- 230000010365 information processing Effects 0.000 title claims description 41
- 238000003672 processing method Methods 0.000 title claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 111
- 238000000034 method Methods 0.000 claims description 64
- 230000008569 process Effects 0.000 claims description 16
- 230000006978 adaptation Effects 0.000 claims description 10
- 230000001965 increasing effect Effects 0.000 claims description 7
- 230000008929 regeneration Effects 0.000 claims 1
- 238000011069 regeneration method Methods 0.000 claims 1
- 238000012958 reprocessing Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 79
- 230000004048 modification Effects 0.000 description 74
- 238000012986 modification Methods 0.000 description 74
- 230000008859 change Effects 0.000 description 21
- 238000009826 distribution Methods 0.000 description 14
- 238000003860 storage Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 238000005259 measurement Methods 0.000 description 8
- 230000000153 supplemental effect Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
- G06T17/005—Tree description, e.g. octree, quadtree
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23412—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs for generating or manipulating the scene composition of objects, e.g. MPEG-4 objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23614—Multiplexing of additional data and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4348—Demultiplexing of additional data and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44012—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving rendering scenes according to scene graphs, e.g. MPEG-4 scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4728—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8543—Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/61—Scene description
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
Description
非特許文献2:"ISO/IEC 14496-11:2015", Information technology. Coding of audio-visual objects. Part11:Sene description and application engine, 2015-11
非特許文献3:"ISO/IEC 23009-1:2014", Information technology. Dynamic adaptive streaming over HTTP(DASH), Part1:Media presentation description and segment formats, 2014-15
非特許文献4:"ISO/IEC 23009-1:2014", Information technology. Dynamic adaptive streaming over HTTP(DASH), Part1:AMENDMENT 2:Spatial relationship description generalized URL parameters and other extensions, 2014-05
非特許文献5:"ISO/IEC 21000-22:2016", Information technology-Multimedia framework (MPEG-21)-Part22:User Description, 2016-11
また、以下に示す項目順序に従って本開示を説明する。
1.1-1 第1の実施形態の変形例(1-1)
1.1-2 第1の実施形態の変形例(1-2)
1.2-1 第1の実施形態の変形例(2-1)
1.2-2 第1の実施形態の変形例(2-2)
1.2-3 第1の実施形態の変形例(2-3)
1.3-1 第1の実施形態の変形例(3-1)
1.3-2 第1の実施形態の変形例(3-2)
2.第2の実施形態
2.1-1 第2の実施形態の変形例(1-1)
2.1-2 第2の実施形態の変形例(1-2)
2.2-1 第2の実施形態の変形例(2-1)
2.2-2 第2の実施形態の変形例(2-2)
2.3-1 第2の実施形態の変形例(3-1)
2.3-2 第2の実施形態の変形例(3-2)
2.4 第2の実施形態の変形例(4)
2.5 第2の実施形態の変形例(5)
2.6 第2の実施形態の変形例(6)
2.7-1 第2の実施形態の変形例(7-1)
2.7-2 第2の実施形態の変形例(7-2)
3.第3の実施形態
3.1-1 第3の実施形態の変形例(1-1)
3.1-2 第3の実施形態の変形例(1-2)
3.2-1 第3の実施形態の変形例(2-1)
3.2-2 第3の実施形態の変形例(2-2)
3.3-1 第3の実施形態の変形例(3-1)
3.3-2 第3の実施形態の変形例(3-2)
上述したように、スポーツや音楽の実写などに基づく6DoFコンテンツにおいては、空間ベースの表現手法が有効である。しかしながら、空間ベースの表現手法を用いた場合、6DoFコンテンツに含まれる各対象物を識別することが困難であり、利用者による視聴体験の決定の自由度が少ない。具体的には、対象物ベースの表現手法に比べて対象物ベースの表現手法では、以下のような制限がある。自由に視点を選択する視聴において、利用者により指定された対象物をクライアント装置で自動的に追尾して視聴させることは困難である。また、クライアント装置で対象物の位置を表示し利用者の視聴を補助することは困難である。さらに、利用者により指定された対象物に限定して高品質に表示することは困難である。また、ROI(region of interest)のような指定された視聴において、コンテンツ作成者の意図する注目すべき対象物をユーザに示したり追尾して視聴させたりすることは困難であり、さらに、その対象物に限定して高品質に表示させることは困難である。そこで、以下に説明する情報処理装置及び再生処理装置を提供する。
図1は、配信システムの一例のシステム構成図である。配信システム100は、情報処理装置であるファイル生成装置1、再生処理装置であるクライアント装置2及びWebサーバ3を含む。ファイル生成装置1、クライアント装置2及びWebサーバ3は、ネットワーク4に接続される。そして、ファイル生成装置1、クライアント装置2及びWebサーバ3は、ネットワーク4を介して相互に通信可能である。ここで、図1においては、各装置を1台ずつ示しているが、配信システム100は、ファイル生成装置1及びクライアント装置2をそれぞれ複数台含んでもよい。
次に、ファイル生成装置1の詳細について説明する。図2は、ファイル生成装置のブロック図である。情報処理装置であるファイル生成装置1は、図2に示すように、生成処理部10及び制御部11を有する。制御部11は、生成処理部10の制御に関する処理を実行する。例えば、制御部11は、生成処理部10の各部の動作タイミングなどの統括制御を行う。生成処理部10は、データ入力部101、前処理部102、符号化部103、ファイル生成部104及び送信部105を有する。
図6は、クライアント装置のブロック図である。図6に示すように、クライアント装置2は、再生処理部20及び制御部21を有する。制御部21は、再生処理部20の各部の動作を制御する。例えば、制御部21は、再生処理部20の各部の動作のタイミングを統括制御する。再生処理部20は、ファイル取得部201、計測部202、ファイル処理部203、復号処理部204、表示制御部205、表示情報生成部206及び表示部207を有する。
ファイル生成装置1は、3次元空間における3次元オブジェクトにより構成される6DoFコンテンツのシーンの構成を表すシーン構成情報であるシーングラフを生成する。次に、図7を参照して、第1の実施形態に係るファイル生成装置1によるファイル生成処理の流れについて詳細に説明する。図7は、第1の実施形態に係るファイル生成装置によるファイル生成処理のフローチャートである。
次に、図8を参照して、本実施形態に係るクライアント装置2により実行される再生処理の流れを説明する。図8は、第1の実施形態に係るクライアント装置により実行される再生処理のフローチャートである。
第1の実施形態では3次元オブジェクト特定情報をシーンディスクリプション形式で格納したが、本変形例では、3次元オブジェクト特定情報がMPEG-21の規格であるユーザディスクリプション形式で格納されることが第1の実施形態と異なる。以下に、本変形例に係るファイル生成装置1の前処理部102による3次元オブジェクト特定情報の格納の詳細について説明する。
本変形例では、3次元オブジェクト特定情報が、独自の形式で格納されることが第1の実施形態と異なる。以下に、本変形例に係るファイル生成装置1の前処理部102による3次元オブジェクト特定情報の格納の詳細について説明する。
次に、3次元オブジェクト特定情報を示すデータの格納方法について説明する。本変形例では、3次元オブジェクト特定情報が時間単位で変化しない場合について説明する。3次元オブジェクト特定情報が時間単位で変化しない場合とは、言い換えれば、3次元オブジェクトの位置情報が変化しない場合である。
本変形例では、3次元オブジェクト特定情報が時間単位で変化する場合の3次元オブジェクト特定情報を示すデータの格納方法について説明する。3次元オブジェクト特定情報が時間単位で変化する場合とは、言い換えれば、3次元オブジェクトが移動するなど位置情報が変化する場合である。
本変形例では、3次元オブジェクト特定情報が時間単位で変化する場合の3次元オブジェクト特定情報を示すデータの格納の他の方法について説明する。本変形例に係るファイル生成装置1は、ISOBMFFに3次元オブジェクト特定情報を示すデータを格納する。以下に、本変形例に係る3次元オブジェクト特定情報を示すデータを格納したファイルの生成について説明する。ここでは、シーンディスクリプション形式で表される3次元オブジェクト特定情報を示すデータを用いる場合で説明する。
本変形例では、3次元オブジェクト特定情報が時間単位で変化しない場合の、MPDを用いて3次元オブジェクト特定情報を示す方法について説明する。本変形例に係るファイル生成装置1は、3次元オブジェクト特定情報を、シーンディスクリプション又は3次元オブジェクトに対応するAdaptationSetにより示す。以下に、本変形例に係るMPDを用いた3次元オブジェクト特定情報を示す方法について説明する。
本変形例では、3次元オブジェクト特定情報が時間単位で変化する場合の、MPDによる3次元オブジェクト特定情報を示すデータを指し示す方法について説明する。本変形例に係るファイル生成装置1は、MPDを用いて、3次元オブジェクト特定情報が格納されたTimed metadataと、シーンディスクリプション又は3次元オブジェクトとを関連付ける。以下に、本変形例におけるMPDを用いた3次元オブジェクト特定情報の関連付けについて説明する。
空間ベースの手法を用いて6DoFコンテンツを提供する場合、対象物を識別できなければ、操作者が特定の対象物に注目してその対象物を高品質に視聴したいと望んでも、指定された対象物を高品質にした画像を提供することは困難である。そこで、本実施形態に係るファイル生成装置は、特定の3次元オブジェクトを高精細化した映像を提供する。以下に、特定の3次元オブジェクトの高精細化手法について説明する。本実施形態に係るファイル生成装置も図2のブロック図で表される。
本変形例に係る前処理部102は、図9に示すVisual3DObjectInfoを生成して、3次元オブジェクト特定情報をユーザディスクリプション形式で格納する。さらに、前処理部102は、高精細3次元オブジェクト特定情報をユーザディスクリプション形式で格納する。すなわち、前処理部102は、高精細3次元オブジェクト特定情報をユーザディスクリプションに格納する。図19は、ユーザディスクリプション形式で高精細3次元オブジェクト特定情報を格納する場合のシンタックスの一例を表す図である。
本変形例に係る前処理部102は、図10に示すObjectmetadataを生成して、3次元オブジェクト特定情報を独自の形式で格納する。さらに、前処理部102は、高精細3次元オブジェクト特定情報を独自の形式で格納する。すなわち、前処理部102は、高精細3次元オブジェクト特定情報を独自のディスクリプションに格納する。図21は、独自の形式で高精細3次元オブジェクト特定情報を格納する場合のシンタックスの一例を表す図である。
本変形例では、高精細3次元オブジェクト特定情報が時間単位で変化しない場合の高精細3次元オブジェクト特定情報を示すデータの格納方法について説明する。ここでは、シーンディスクリプション形式で表される高精細3次元オブジェクト特定情報を示すデータを用いる場合で説明する。ただし、ユーザディスクリプション形式を用いた場合や独自の形式を用いた場合も同様の方法で高精細3次元オブジェクト特定情報を示すデータを格納したファイルを生成することが可能である。
本変形例では、3次元オブジェクト特定情報が時間単位で変化する場合の高精細3次元オブジェクト特定情報を示すデータの格納方法について説明する。
本変形例では、3次元オブジェクト特定情報が時間単位で変化しない場合に、MPDを用いて高精細3次元オブジェクト特定情報を示す方法について説明する。
本変形例では、3次元オブジェクト特定情報が時間単位で変化する場合に、MPDによる3次元オブジェクト特定情報を示すデータを指し示す方法について説明する。本変形例に係るファイル生成装置1のファイル生成部104は、3次元オブジェクト特定情報のAdaptationSetにおいてAdaptationSet@codecsで”hobm”を指定して、Timed metadata形式の高精細3次元オブジェクト特定情報であることを示す。そして、ファイル生成部104は、Representation@associationIdで高精細化された3次元オブジェクトが含まれるシーンディスクリプションのRepresentation@idを示す。さらに、ファイル生成部104は、Representation@associationTypeを第2の実施形態の変形例(2-2)で指定したTrack Reference Boxを格納したreference Typeと同じ”cdsc”とする。
本変形例では、シーンディスクリプションから高精細3次元オブジェクトを示すアクセス情報を取得できるように拡張する。図25は、第2の実施形態の変形例(4)に係る拡張されたシーンディスクリプションを示す図である。
以上では、特定の3次元オブジェクトが高精細化された1つの空間ベース3次元オブジェクトを生成した。その場合、6DoFコンテンツの生成において高精細化したい3次元オブジェクトが多数存在すると、それぞれについて空間ベース3次元オブジェクトを作成することになり、生成コスト及びサーバ上のデータ量が増加する。そこで、生成コスト削減及びサーバ上のデータ量の削減のために以下の方法を採用することが好ましい。
本変形例では、6DoFコンテンツ全体を表す空間ベース3次元オブジェクトから特定の3次元オブジェクトを除いた基礎3次元オブジェクトと、高精細化された特定の3次元オブジェクトを示す高精細3次元オブジェクトとを用いて特定の3次元オブジェクトが高精細化された映像が生成される。図27は、基礎3次元オブジェクトを使用する場合のISOBMFFファイルの一例を表す図である。
第2の実施形態の変形例(5)及び第2の実施形態の変形例(6)では、高精細3次元オブジェクトを用いたが、そのような場合に、複数の構成から特定の3次元オブジェクトを高精細化して視聴するための構成を選択可能にするために、ファイル生成装置は、対象とする3次元空間に含まれる各3次元オブジェクトの3次元オブジェクト特定情報を提供する。本変形例では、複数の構成が1つのシーンディスクリプションに格納される場合について説明する。本変形例では、それぞれの構成に含まれる3次元オブジェクトの3次元オブジェクト特定情報をシーンディスクリプションに格納する。
本変形例では、MPDのAdaptationSetの中に各構成に含まれる3次元オブジェクト毎の3次元オブジェクト特定情報を格納する。この場合も、複数の構成が1つのシーンディスクリプションに格納される。
空間ベースの手法を用いて6DoFコンテンツを提供する場合、対象物を識別できなければ、コンテンツ作成者の意図する注目すべき3次元オブジェクトを利用者に示すことは困難である。そこで、本実施形態に係るファイル生成装置は、コンテンツ作成者が意図する注目すべき3次元オブジェクトの情報を注目オブジェクト情報として利用者に提供する。以下に、注目オブジェクト情報の提供方法について説明する。本実施形態に係るファイル生成装置も図2のブロック図で表される。
本変形例に係る前処理部102は、ユーザディスクリプション形式で注目オブジェクト情報を格納する。すなわち、前処理部102は、注目オブジェクト情報をユーザディスクリプションに格納する。以下に、ユーザディスクリプション形式で注目オブジェクト情報を格納方法の詳細を説明する。
本変形例に係る前処理部102は、独自の形式で注目オブジェクト情報を格納する。すなわち、前処理部102は、注目オブジェクト情報を独自のディスクリプションに格納する。以下に、独自の形式で注目オブジェクト情報を格納方法の詳細を説明する。
次に、注目オブジェクト情報を示すデータの格納方法について説明する。本変形例では、注目オブジェクト情報が時間単位で変化しない場合に、注目オブジェクト情報をISOBMFFに格納する場合ついて説明する。
本変形例では、注目オブジェクト情報が時間単位で変化する場合に、注目オブジェクト情報をISOBMFFに格納する場合について説明する。本変形例に係るファイル生成部104は、注目オブジェクトが時間単位で変化する場合に、ISOBMFFで注目オブジェクト情報を格納する。
次に、注目オブジェクト情報又は注目オブジェクト情報のアクセス情報をMPDに格納する場合について説明する。本変形例に係るファイル生成部104は、注目オブジェクトが時間単位で変化しない場合に、注目オブジェクト情報をシーンディスクリプション又は3次元オブジェクトのAdaptationSetに格納する。
本変形例に係るファイル生成部104は、注目オブジェクトが時間単位で変化する場合のMPDへの注目オブジェクト情報の格納について説明する。
前記3次元空間に含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を生成する前処理部と、
前記空間3次元オブジェクトのデータ及び前記オブジェクト特定情報を含むファイルを生成するファイル生成部と
を備えた情報処理装置。
(2)前記オブジェクト特定情報は、同一のオブジェクトの識別情報、位置情報及び詳細情報を含む付記(1)に記載の情報処理装置。
(3)前記前処理部は、前記オブジェクト特定情報を、シーンディスクリプションにおけるノード、ユーザディスクリプションもしくは独自のディスクリプションのいずれかに格納する付記(2)に記載の情報処理装置。
(4)前記ファイル生成部は、前記前処理部により前記オブジェクト特定情報が格納されたディスクリプション又は前記ディスクリプションへのアクセス情報を、ISO Base Media File Format(ISOBMFF)、もしくは、MPD(Media Presentation Description)におけるシーンディスクリプション又は前記特定のオブジェクトに対応するAdaptationSetのいずれか一方もしくは両方に格納する付記(3)に記載の情報処理装置。
(5)前記ファイル生成部は、前記特定のオブジェクトの前記位置情報が時刻で変化する場合、前記前処理部により前記空間3次元オブジェクトの位置情報と同時に、前記オブジェクト特定情報が格納された前記シーンディスクリプションを、シーンディスクリプションファイルとして生成する付記(3)に記載の情報処理装置。
(6)前記前処理部は、前記オブジェクトのうちの高精細化された高精細オブジェクトの特定情報及び前記高精細オブジェクトの精細度を含む高精細オブジェクト特定情報を生成する付記(1)~(5)のいずれか1項に記載の情報処理装置。
(7)前記前処理部は、前記高精細オブジェクト特定情報を、シーンディスクリプション、ユーザディスクリプション又は独自のディスクリプションのいずれかに格納する付記(6)に記載の情報処理装置。
(8)前記ファイル生成部は、前記前処理部により前記高精細オブジェクト特定情報が格納されたディスクリプション又は前記ディスクリプションへのアクセス情報を、ISOBMFF又はMPDのAdaptationSetのいずれか一方もしくは両方に格納する付記(7)に記載の情報処理装置。
(9)前記前処理部は、前記高精細オブジェクトを高精細化するための差分データを生成し、且つ、前記差分データを特定する情報を生成する付記(6)に記載の情報処理装置。
(10)前記前処理部は、前記高精細オブジェクトの高精細データ及び前記3次元空間から前記高精細オブジェクトを除いた基礎データを生成し、且つ、前記高精細データ及び前記基礎データを特定する情報を生成する付記(6)に記載の情報処理装置。
(11)前記前処理部は、前記3次元オブジェクトに含まれる前記オブジェクト毎にそれぞれに含まれる部分オブジェクトを特定する情報を生成し、前記オブジェクト毎に含まれる前記部分オブジェクトを特定する情報をシーンディスクリプション又はMPDのAdaptationSetのいずれか一方もしくは両方に格納する付記(6)に記載の情報処理装置。
(12)前記前処理部は、前記オブジェクトのうちの所定の注目オブジェクトの識別情報及び前記注目オブジェクトの注目度情報を含む注目オブジェクト情報を生成する付記(1)~(11)のいずれか1項に記載の情報処理装置。
(13)前記前処理部は、前記注目オブジェクト情報を、シーンディスクリプション、ユーザディスクリプション又は独自のディスクリプションのいずれかに格納する付記(12)に記載の情報処理装置。
(14)前記ファイル生成部は、前記前処理部により前記注目オブジェクト情報が格納されたディスクリプション又は前記ディスクリプションへのアクセス情報を、ISOBMFF又はMPDのAdaptationSetのいずれか一方もしくは両方に格納する付記(13)に記載の情報処理装置。
(15)複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトにおいて、
前記3次元空間に含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を生成する
処理をコンピュータに実行させる情報処理方法。
(16)複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトのコンテンツ及び前記空間3次元オブジェクトに含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を含むファイルを受信する受信部と、
前記受信部により受信された前記ファイルから前記オブジェクト特定情報を取得し、取得した前記オブジェクト特定情報を基に、前記空間3次元オブジェクトの中から前記特定のオブジェクトを特定する情報処理部と、
前記情報処理部による特定結果を基に、前記コンテンツを再生する再生部と
を備えた再生処理装置。
(17)複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトのコンテンツ及び前記空間3次元オブジェクトに含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を含むファイルを受信し、
受信した前記ファイルから前記オブジェクト特定情報を取得し、
取得した前記オブジェクト特定情報を基に、前記3次元空間の中から前記特定のオブジェクトを特定し、
特定結果を基に、前記コンテンツを再生する
処理をコンピュータに実行させる再生処理方法。
2 クライアント装置
3 Webサーバ
4 ネットワーク
10 生成処理部
11 制御部
20 再生処理部
21 制御部
101 データ入力部
102 前処理部
103 符号化部
104 ファイル生成部
105 送信部
201 ファイル取得部
202 計測部
203 ファイル処理部
204 復号処理部
205 表示制御部
206 表示情報生成部
207 表示部
Claims (16)
- 複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトにおいて、
前記3次元空間に含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を生成する前処理部と、
前記空間3次元オブジェクトのデータ及び前記オブジェクト特定情報を含むファイルを生成するファイル生成部と
を備え、
前記オブジェクト特定情報は、同一のオブジェクトの識別情報、位置情報及び詳細情報を含む、
情報処理装置。 - 前記前処理部は、前記オブジェクト特定情報を、シーンディスクリプションにおけるノード、ユーザディスクリプションもしくは独自のディスクリプションのいずれかに格納する請求項1に記載の情報処理装置。
- 前記ファイル生成部は、前記前処理部により前記オブジェクト特定情報が格納されたディスクリプション又は前記ディスクリプションへのアクセス情報を、ISO Base Media File Format(ISOBMFF)、もしくは、MPD(Media Presentation Description)におけるシーンディスクリプション又は前記特定のオブジェクトに対応するAdaptationSetのいずれか一方もしくは両方に格納する請求項2に記載の情報処理装置。
- 前記ファイル生成部は、前記特定のオブジェクトの前記位置情報が時刻で変化する場合、前記前処理部により前記空間3次元オブジェクトの位置情報と同時に、前記オブジェクト特定情報が格納された前記シーンディスクリプションを、シーンディスクリプションファイルとして生成する請求項2に記載の情報処理装置。
- 複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトにおいて、
前記3次元空間に含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を生成する前処理部と、
前記空間3次元オブジェクトのデータ及び前記オブジェクト特定情報を含むファイルを生成するファイル生成部と
を備え、
前記前処理部は、前記オブジェクトのうちの高精細化された高精細オブジェクトの特定情報及び前記高精細オブジェクトの精細度を含む高精細オブジェクト特定情報を生成する、
情報処理装置。 - 前記前処理部は、前記高精細オブジェクト特定情報を、シーンディスクリプション、ユーザディスクリプション又は独自のディスクリプションのいずれかに格納する請求項5に記載の情報処理装置。
- 前記ファイル生成部は、前記前処理部により前記高精細オブジェクト特定情報が格納されたディスクリプション又は前記ディスクリプションへのアクセス情報を、ISOBMFF又はMPDのAdaptationSetのいずれか一方もしくは両方に格納する請求項6に記載の情報処理装置。
- 前記前処理部は、前記高精細オブジェクトを高精細化するための差分データを生成し、且つ、前記差分データを特定する情報を生成する請求項5に記載の情報処理装置。
- 前記前処理部は、前記高精細オブジェクトの高精細データ及び前記3次元空間から前記高精細オブジェクトを除いた基礎データを生成し、且つ、前記高精細データ及び前記基礎データを特定する情報を生成する請求項5に記載の情報処理装置。
- 前記前処理部は、前記3次元オブジェクトに含まれる前記オブジェクト毎にそれぞれに含まれる部分オブジェクトを特定する情報を生成し、前記オブジェクト毎に含まれる前記部分オブジェクトを特定する情報をシーンディスクリプション又はMPDのAdaptationSetのいずれか一方もしくは両方に格納する請求項5に記載の情報処理装置。
- 複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトにおいて、
前記3次元空間に含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を生成する前処理部と、
前記空間3次元オブジェクトのデータ及び前記オブジェクト特定情報を含むファイルを生成するファイル生成部と
を備え、
前記前処理部は、前記オブジェクトのうちの所定の注目オブジェクトの識別情報及び前記注目オブジェクトの注目度情報を含む注目オブジェクト情報を生成する、
情報処理装置。 - 前記前処理部は、前記注目オブジェクト情報を、シーンディスクリプション、ユーザディスクリプション又は独自のディスクリプションのいずれかに格納する請求項11に記載の情報処理装置。
- 前記ファイル生成部は、前記前処理部により前記注目オブジェクト情報が格納されたディスクリプション又は前記ディスクリプションへのアクセス情報を、ISOBMFF又はMPDのAdaptationSetのいずれか一方もしくは両方に格納する請求項12に記載の情報処理装置。
- 複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトにおいて、
前記3次元空間に含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を生成し、
前記空間3次元オブジェクトのデータ及び前記オブジェクト特定情報を含むファイルを生成する、
処理をコンピュータに実行させ、
前記オブジェクト特定情報は、同一のオブジェクトの識別情報、位置情報及び詳細情報を含む、
情報処理方法。 - 複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトのコンテンツ及び前記空間3次元オブジェクトに含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を含むファイルを受信する受信部と、
前記受信部により受信された前記ファイルから前記オブジェクト特定情報を取得し、取得した前記オブジェクト特定情報を基に、前記空間3次元オブジェクトの中から前記特定のオブジェクトを特定する情報処理部と、
前記情報処理部による特定結果を基に、前記コンテンツを再生する再生部と
を備え、
前記オブジェクト特定情報は、同一のオブジェクトの識別情報、位置情報及び詳細情報を含む、
再生処理装置。 - 複数のオブジェクトを単体の3次元オブジェクトとして3次元空間を構成する空間3次元オブジェクトのコンテンツ及び前記空間3次元オブジェクトに含まれる特定のオブジェクトを識別するためのオブジェクト特定情報を含むファイルを受信し、
受信した前記ファイルから前記オブジェクト特定情報を取得し、
取得した前記オブジェクト特定情報を基に、前記3次元空間の中から前記特定のオブジェクトを特定し、
特定結果を基に、前記コンテンツを再生する
処理をコンピュータに実行させ、
前記オブジェクト特定情報は、同一のオブジェクトの識別情報、位置情報及び詳細情報を含む、
再生処理方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962821047P | 2019-03-20 | 2019-03-20 | |
US62/821,047 | 2019-03-20 | ||
US201962866334P | 2019-06-25 | 2019-06-25 | |
US62/866,334 | 2019-06-25 | ||
PCT/JP2020/003174 WO2020189038A1 (ja) | 2019-03-20 | 2020-01-29 | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020189038A1 JPWO2020189038A1 (ja) | 2020-09-24 |
JP7480773B2 true JP7480773B2 (ja) | 2024-05-10 |
Family
ID=72520730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021506217A Active JP7480773B2 (ja) | 2019-03-20 | 2020-01-29 | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11825135B2 (ja) |
EP (1) | EP3944629A4 (ja) |
JP (1) | JP7480773B2 (ja) |
CN (1) | CN113574902A (ja) |
WO (1) | WO2020189038A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220012740A (ko) * | 2020-07-23 | 2022-02-04 | 삼성전자주식회사 | 통신 시스템에서 컨텐츠의 송수신을 제어하기 위한 방법 및 장치 |
EP4224864A4 (en) * | 2020-09-29 | 2024-04-03 | Sony Group Corporation | DEVICE AND METHOD FOR PROCESSING INFORMATION |
CN116250013A (zh) * | 2020-10-07 | 2023-06-09 | 索尼集团公司 | 信息处理装置和方法 |
CN117121495A (zh) * | 2021-04-15 | 2023-11-24 | 索尼集团公司 | 信息处理装置及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007334739A (ja) | 2006-06-16 | 2007-12-27 | Toyota Infotechnology Center Co Ltd | 画像生成装置 |
WO2018097882A1 (en) | 2016-11-23 | 2018-05-31 | 3Dsystems, Inc. | System and method for rendering complex data in a virtual reality or augmented reality environment |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050036722A (ko) * | 2003-10-14 | 2005-04-20 | 삼성전자주식회사 | 3차원 객체 그래픽 처리장치 및 3차원 신 그래프 처리장치 |
GB2560921B (en) * | 2017-03-27 | 2020-04-08 | Canon Kk | Method and apparatus for encoding media data comprising generated content |
US11290758B2 (en) * | 2017-08-30 | 2022-03-29 | Samsung Electronics Co., Ltd. | Method and apparatus of point-cloud streaming |
KR102201763B1 (ko) * | 2018-10-02 | 2021-01-12 | 엘지전자 주식회사 | 360 비디오 시스템에서 오버레이 처리 방법 및 그 장치 |
WO2020101021A1 (ja) * | 2018-11-16 | 2020-05-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置 |
-
2020
- 2020-01-29 WO PCT/JP2020/003174 patent/WO2020189038A1/ja unknown
- 2020-01-29 US US17/431,720 patent/US11825135B2/en active Active
- 2020-01-29 EP EP20774519.1A patent/EP3944629A4/en not_active Withdrawn
- 2020-01-29 CN CN202080020931.1A patent/CN113574902A/zh active Pending
- 2020-01-29 JP JP2021506217A patent/JP7480773B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007334739A (ja) | 2006-06-16 | 2007-12-27 | Toyota Infotechnology Center Co Ltd | 画像生成装置 |
WO2018097882A1 (en) | 2016-11-23 | 2018-05-31 | 3Dsystems, Inc. | System and method for rendering complex data in a virtual reality or augmented reality environment |
Also Published As
Publication number | Publication date |
---|---|
JPWO2020189038A1 (ja) | 2020-09-24 |
US11825135B2 (en) | 2023-11-21 |
WO2020189038A1 (ja) | 2020-09-24 |
CN113574902A (zh) | 2021-10-29 |
EP3944629A1 (en) | 2022-01-26 |
EP3944629A4 (en) | 2022-05-25 |
US20220159316A1 (en) | 2022-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7480773B2 (ja) | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 | |
JP7263583B2 (ja) | タイムドメディアデータのストリーミング中にレンダリング表示を改善するための方法、デバイス及びコンピュータプログラム | |
US10171541B2 (en) | Methods, devices, and computer programs for improving coding of media presentation description data | |
WO2019202207A1 (en) | Processing video patches for three-dimensional content | |
KR102027410B1 (ko) | 계층화된 신호 품질 계층에서의 재구성 데이터의 송신 | |
US20220053224A1 (en) | Information processing apparatus and method | |
JP2017515336A (ja) | 分割タイムドメディアデータのストリーミングを改善するための方法、デバイス、およびコンピュータプログラム | |
GB2509953A (en) | Displaying a Region of Interest in a Video Stream by Providing Links Between Encapsulated Video Streams | |
JP7544048B2 (ja) | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 | |
WO2021065277A1 (ja) | 情報処理装置、再生処理装置及び情報処理方法 | |
US20240046562A1 (en) | Information processing device and method | |
WO2020137854A1 (ja) | 情報処理装置および情報処理方法 | |
JP2024508865A (ja) | 点群符号化・復号方法、装置、及び電子機器 | |
JP6632550B2 (ja) | タイムピリオドにまたがってオブジェクトを識別する方法および対応デバイス | |
WO2021002338A1 (ja) | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 | |
CN114223211A (zh) | 信息处理装置和信息处理方法 | |
CN113574899A (zh) | 信息处理装置、信息处理方法、再现处理装置和再现处理方法 | |
WO2022220278A1 (ja) | 情報処理装置および方法 | |
WO2022054744A1 (ja) | 情報処理装置および方法 | |
GB2567485A (en) | Method and device for exchanging data between a web application and an associated web engine | |
JP2024155948A (ja) | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 | |
JP4017436B2 (ja) | 3次元動画像データの提供方法とその表示方法、該提供システムと該表示端末、該方法の実行プログラム、および該方法の実行プログラムを記録した記録媒体 | |
KR20240147731A (ko) | 적응적 스트리밍 파라미터화를 위한 확장 가능한 요청 시그널링 | |
CN118633292A (zh) | 用于媒体容器文件和流传输清单中的画中画的信令 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7480773 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |