JP6960528B2 - メディアコンテンツを生成および処理するための方法、装置、およびコンピュータプログラム - Google Patents
メディアコンテンツを生成および処理するための方法、装置、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP6960528B2 JP6960528B2 JP2020513304A JP2020513304A JP6960528B2 JP 6960528 B2 JP6960528 B2 JP 6960528B2 JP 2020513304 A JP2020513304 A JP 2020513304A JP 2020513304 A JP2020513304 A JP 2020513304A JP 6960528 B2 JP6960528 B2 JP 6960528B2
- Authority
- JP
- Japan
- Prior art keywords
- view
- track
- frame
- coverage information
- view frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 62
- 238000012545 processing Methods 0.000 title claims description 16
- 238000004590 computer program Methods 0.000 title description 2
- 230000011664 signaling Effects 0.000 claims description 35
- 239000007787 solid Substances 0.000 claims 1
- 238000012856 packing Methods 0.000 description 49
- 239000002131 composite material Substances 0.000 description 41
- 230000008569 process Effects 0.000 description 21
- 239000000203 mixture Substances 0.000 description 18
- 238000005538 encapsulation Methods 0.000 description 15
- 239000000470 constituent Substances 0.000 description 12
- 230000000007 visual effect Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000009877 rendering Methods 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 102100025027 E3 ubiquitin-protein ligase TRIM69 Human genes 0.000 description 2
- 101000830203 Homo sapiens E3 ubiquitin-protein ligase TRIM69 Proteins 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001143 conditioned effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/172—Processing image signals image signals comprising non-image signal components, e.g. headers or format information
- H04N13/178—Metadata, e.g. disparity information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/204—Image signal generators using stereoscopic image cameras
- H04N13/239—Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2365—Multiplexing of several video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4347—Demultiplexing of several video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
- H04N21/4355—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8543—Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/698—Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Description
球領域(Sphere region)=4つの大円、または、2つの方位円および2つの仰角円のいずれかによって指定される球上の領域、またはある量のヨー、ピッチ、およびロール回転を適用した後の回転球上のそのような領域;
垂直範囲(Vertical range)=球領域が4つの大円によって指定される場合、球領域の中心点を通る垂直視野、または他の場合、仰角範囲;
水平範囲(Horizontal range)=球領域が4つの大円によって指定される場合、球領域の中心点を通る水平視野、または他の場合、方位角範囲;
大円(great circle)=球と球の中心点を通る平面との交点;
方位円(azimuth circle)=すべての点を同じ方位値で結ぶ球上の円;
仰角円(elevation circle)=全ての点を同じ仰角値で結ぶ球上の円。
第1のビューフレームおよび第2のビューフレームを含む符号化された立体メディアデータを取得することであって、各第1のビューフレームが第2のビューフレームに関連付けられている、前記取得することと、
前記符号化された立体メディアデータを含むトラックを生成することと、
左のビューに対応するビューフレームが識別されることに基づいて記述メタデータを生成することと、
前記生成されたトラックおよび前記生成された記述メタデータに基づいて前記1つまたは複数のメディアファイルを生成することと、
を含む方法が提供される。
前記1つまたは複数のメディアファイルを取得することと、
第1のビューフレームおよび第2のビューフレームを含む符号化された立体メディアデータを含むトラックを取得するために、前記取得された1つまたは複数のメディアファイルを処理することであって、各第1のビューフレームは第2のビューフレームに関連付けられている、前記処理することと、
左のビューに対応するビューフレームが識別されることに基づいて記述メタデータを取得するために、前記取得された1つまたは複数のメディアファイルを処理することと、
を含む方法が提供される。
本発明の実施形態は、単なる例として、以下の図面を参照して以下に記載される。
「track_non_displayable_alone」:=0x000010は、トラックが単独で表示されることを意図しておらず、プレビューに使用できないことを示す(track_in_previewフラグ値をオーバーライドする)。デフォルトでは、このフラグ値は設定されない。トラックヘッダフラグのデフォルト値は変更されず、7に等しいことに留意されたい(track_enabled 0x1、track_in_movie 0x2、track_in_preview 0x4)。
−center_azimuthおよびcenter_elevationは、球領域の中心を指定する。center_azimuthは−180*216〜180*216−1の範囲内、center_elevationは−90*216〜90*216の範囲内であり、
−center_tiltは球領域の傾斜角度を指定する。center_tiltは、−180*216〜180*216−1の範囲内とする。
−「view_idc」=「0」の場合、モノスコピックビューのカバーされた球領域、
−「view_idc」=「1」またはview_idc=「3」の場合、左ビューのカバーされた球領域、
−「view_idc」=「2」の場合、右ビューのカバーされた球領域、
−「view_idc」=「3」であり「difference_coverage_per_view」=「0」の場合、左右両方のビューのカバーされた球領域。
−「view_idc」が「0」に等しいことはカバレッジ球領域がモノスコピックであることを示し、
−「view_idc」が「1」に等しいことは、カバレッジ球領域が立体コンテンツの左ビュー上にあることを示し、
−「view_idc」が「2」に等しいことは、カバレッジ球領域が立体コンテンツの右ビュー上にあることを示し、
−「view_idc」が「3」に等しいことは、カバレッジ球領域が左ビューおよび右ビューの両方上にあり、
−「view_idc」=「4」に等しいことは、カバレッジ球領域が左ビューおよび右ビューの両方上にあり、各ビューが異なるカバレッジ情報を有することを示し、
−「SphereRegionStruct」は前の実施形態と同じセマンティクスを有する:SphereRegionStruct(range_included_flag,0)が左ビューのカバーされた球領域を表し、SphereRegionStruct(range_included_flag,1)が右ビューのカバーされた球領域を表す。
coverage_localは、カバレッジ情報がボックスを含むトラックに対してローカルであることを示す。フラグ値は0x000001である。デフォルトでは、この値は設定されていない。
−単一トラックカプセル化:単一のCoverageInformationBoxは、(Coverage_localフラグ値が設定されていない)トラックの「povd」ボックスで宣言できる
−複数トラックカプセル化:
〇 合成トラックあり:グローバルカバレッジ情報は、この合成トラックの「povd」内のCoverageInformationBoxで宣言される(フラグ値coverage_localは設定されない)。オプションとして、サブピクチャトラックはCoverageInformationBoxを宣言できる(フラグ値Coverage_localが設定されている)。
〇 合成トラックなし:合成カバレッジ情報は、フラグ値coverage_localが設定されていない「spco」ボックス内のCoverageInformationBoxで宣言される。オプションとして、サブピクチャトラックはCoverageInformationBoxを宣言できる(フラグ値Coverage_localが設定されている)。
「stereo_schemeが4に等しい」:長さパラメータの値は3」(3バイト)であり、例えば「stereo_indication_type」パラメータのようなビューのタイプを示すパラメータは、unsigned int(8)タイプの3つのシンタックス要素を含む。
例えば、「stereo_scheme」が4に等しい場合:
−lengthの値は「2」であり、「stereo_indication_type」はunsigned int(8)の2つのシンタックス要素を含む;
−修正された第1のシンタックス要素は、例えば、ISO/IEC23001−8からの「VideoFramePackingType」のようなフレームパッキングのタイプに関する情報を含む;
−修正された第2のシンタックス要素の第1の最下位ビットは例えば、ISO/IEC23001−8で指定されたQuincunxSamplingFlagの値のように、サンプリングに関する情報を含み、新しい第2のシンタックス要素の第2および第3の最下位ビットは例えば、ISO/IEC23001−8で指定された「PackedContentInterpretationType」の値のように、フレームパッキングの構成フレームの役割を解釈するためのインジケーションを含み、したがって、修正された第2のシンタックス要素が値「0」または「3」を取る場合、パックされたフレーム内のそれぞれの位置に関する情報が指定されないことを意味し、修正された第2のシンタックス要素内の残りのビットは、予約され、「0」に設定される。
−ISO/IEC23008−2で定義されるようなセマンティクスで、残りのビットの1つにおいて、空間フリッピングの有無を示すパラメータ
−ISO/IEC23008−2で定義されるような、別の残りのビットにおいて(2つの構成フレームのうちのどちらがフリップされるかを示す)frame0_flipped_flagを示すパラメータ。
−ISO/IEC23008−2で定義されているframe0_self_contained_flagまたはISO/IEC14496−10で定義されているleft_view_self_contained_flagを他の残りのビットに示すパラメータ
−ISO/IEC23008−2で定義されているframe1_self_contained_flag、または、ISO/IEC14496−10で定義されているright_view_self_contained_flagを他の残りのビットに示すパラメータ。
−トラックには、モノスコピックコンテンツ(StereoVideoBoxなし)が含まれている
−トラックには、立体コンテンツが含まれている(StereoVideoBoxの存在)
〇 ステレオの場合、1つのビュー(tref=「svdp」を参照するか、参照されるか)または両方のビューを含むかどうか
〇 ステレオで、単一のビューを含む場合、(以下に説明するような)StereoVideoBoxを介したビュー識別子
stereo_scheme=4かつstereo_indication_typeが「nopacking」を示している場合、すなわちstereo_indication_type={6、0}の場合、single_view_allowed &1が1に等しいことはトラックが右ビューを含むことを示し、single_view_allowed &2が2に等しいことは、トラックが左ビューを含むことを示す。この場合、値0及び3は禁止される。
VideoFramePackingType=7は、復号されたフレームが2つの構成フレームの対応する面の1つの単一面(すなわち、立体シーケンスの左ビューまたは右ビューのどちらか)を含むことを示す。
「stereo_schemeが4に等しい:lengthの値は2で、stereo_indication_typeはunsigned int(8)の2つのシンタックス要素を含む。第1のシンタックス要素は、ISO/IEC23001−8からのVideoFramePackingTypeを含む。値0から6までのVideoFramePackingTypeについて、第2のシンタックス要素の最下位ビットは、ISO/IEC23001−8で指定されたQuincunxSamplingFlagの値を含み、一方、他のビットは予約され、0に設定される。値7のVideoFramePackingTypeについて、第2のシンタックス要素の最下位2ビットは、左ビュー及び右ビューを識別し、そして(上に定義されるような)ViewIdcFlagの値を含み、他のビットは予約され、0に設定される。」
「stereo_schemeが4に等しい:lengthの値は3で、stereo_indication_typeはunsigned int(8)の3つのシンタックス要素を含む。第1のシンタックス要素は、ISO/IEC23001−8からのVideoFramePackingTypeを含む。第2のシンタックス要素の最下位ビットはISO/IEC23001−8で指定されたQuincunxSamplingFlagの値を含み、他のビットは予約され、0に設定される。第3のシンタックス要素の最下位2ビットは、左ビューおよび右ビューを識別し、そして(上に定義されるような)ViewIdcFlagの値を含み、他のビットは予約され、0に設定される。」
「stereo_schemeが4に等しい:lengthの値は1、2または3のいずれかであり、stereo_indication_typeは、unsigned int(8)の1、2または3つのシンタックス要素をそれぞれ含む。第1のシンタックス要素は、ISO/IEC23001−8からのVideoFramePackingTypeを含む。第2のシンタックス要素の最下位ビットは、存在する場合にはISO/IEC23001−8で指定されたQuincunxSamplingFlagの値を含み、他のビットは予約され、「0」に設定される。第3のシンタックス要素の最下位2ビットは、存在する場合には、左ビューおよび右ビューを識別し、(上記で定義された)ViewIdcFlagの値を含み、他のビットは予約され、0に設定される。」第3のシンタックス要素が存在する場合は、第2のシンタックス要素が存在する。
−マイクロプロセッサのような中央処理装置(CPU)301;
−本発明の実施形態の方法の実行可能コードを記憶するためのランダムアクセスメモリ(RAM)302、ならびに、マニフェストの読取りおよび書込み、および/またはビデオの符号化、および/または所与のファイルフォーマットの下でのデータの読取りまたは生成のための方法を実施するために必要な変数およびパラメータを記録するように構成されたレジスタ、たとえば、拡張ポートに接続された任意選択のRAMによって、そのメモリ容量を拡張することができる;
−本発明の実施形態を実施するためのコンピュータプログラムを記憶するためのリードオンリーメモリ(ROM)303;
−同様に、典型的には、処理されるべきデジタルデータが送受信される通信ネットワークに接続されるネットワークインタフェース304。ネットワークインタフェース304は単一のネットワークインタフェースであってもよく、あるいは異なるネットワークインタフェース(例えば、有線および無線インタフェース、あるいは異なる種類の有線または無線インタフェース)のセットから構成されてもよい。データは、送信のためにネットワークインタフェースに書き込まれるか、またはCPU301内で動作するソフトウェアアプリケーションの制御下で受信のためのネットワークインタフェースから読み込まれる;
−ユーザからの入力を受信するため、またはユーザに情報を表示するためのユーザインターフェース(UI)305;
−ハードディスク(HD)306;
−ビデオソースまたはディスプレイなどの外部装置との間でデータを送受信するI/Oモジュール307。
Claims (16)
- 1つまたは複数のメディアファイルを生成するための方法であって、
第1のビューフレームおよび該第1のビューフレームが関連づけられた第2のビューフレームを含む符号化された立体メディアデータを取得することと、
前記符号化された立体メディアデータを含むトラックを生成することと、
左のビューに対応するビューフレームが識別されることに基づいて記述メタデータを生成することと、
前記生成されたトラックおよび前記生成された記述メタデータに基づいて前記1つまたは複数のメディアファイルを生成することと、
を含み、
前記生成された記述メタデータは、ISOBMFF(ISO/IEC 14496−12)で定義されるStereoVideoBoxを含み、
前記StereoVideoBoxは、どのビューフレームが左のビューに対応するかをシグナリングするためのPackedContentInterpretationTypeを含む方法。 - 少なくとも1つの第1のビューフレームおよび関連する第2のビューフレームについて、前記第1のビューフレームをその関連する第2のビューフレームと組み立てて単一のフレームを形成することをさらに含み、前記符号化された立体メディアデータは、前記組み立てられた単一のフレームのうちの少なくとも1つを符号化することによって得られる、請求項1に記載の方法。
- 前記方法は、表示されるべき表面に関する第1のビューまたは第2のビューのうちの少なくとも1つのためのカバレッジ情報を提供することと、前記カバレッジ情報が前記第1のビューおよび前記第2のビューの両方のために1回だけ提供される必要がある場合または前記第1のビューおよび前記第2のビューのそれぞれのために2回だけ提供される必要がある場合に、シグナリングのための情報を提供することと、をさらに含む、請求項2に記載の方法。
- 前記第1のビューフレームおよび前記関連する第2のビューフレームが同じ符号化されたメディアデータに対応する場合、前記情報は、前記カバレッジ情報が前記第1のビューまたは前記第2のビューのうちの1つのみに提供されることをシグナリングするための所定の値をとるパラメータであり、
そうではない場合、前記カバレッジ情報は、前記第1のビューおよび前記第2のビューのそれぞれに提供される、請求項3に記載の方法。 - 前記第1のビューフレームおよび前記関連する第2のビューフレームが異なる符号化されたメディアデータに対応する場合、前記方法は、表示されるべき表面に関する第1のビューまたは第2のビューのうちの少なくとも1つに対するカバレッジ情報を提供することをさらに含み、前記カバレッジ情報は前記第1のビューまたは前記第2のビューのそれぞれに対して提供され、
そうではない場合、前記カバレッジ情報は、前記第1のビューおよび前記第2のビューの両方に対して1回だけ提供される、請求項2に記載の方法。 - 前記第1のビューフレームが左のビューフレームであり、前記第2のビューフレームが右のビューフレームである、請求項2に記載の方法。
- 1つまたは複数の以上のメディアファイルを処理する方法であって、
前記1つまたは複数のメディアファイルを取得することと、
第1のビューフレームおよび該第1のビューフレームが関連づけられた第2のビューフレームを含む符号化された立体メディアデータを含むトラックを取得するために、前記取得された1つまたは複数のメディアファイルを処理することと、
左のビューに対応するビューフレームが識別されることに基づいて記述メタデータを取得するために、前記取得された1つまたは複数のメディアファイルを処理することと、
を含み、
前記記述メタデータは、ISOBMFF(ISO/IEC14496−12)で定義されるStereoVideoBoxを含み、
前記StereoVideoBoxは、どのビューフレームが左のビューに対応するかをシグナリングするためのPackedContentInterpretationTypeを含む方法。 - 少なくとも1つの第1のビューフレームおよび前記関連する第2のビューフレームについて、前記第1のビューフレームはその関連する第2のビューフレームと組み立てられて1つの単一のフレームを形成し、前記立体メディアデータは、前記組み立てられた単一のフレームのうちの少なくとも1つを復号することによって得られる、請求項7に記載の方法。
- 前記方法は、表示されるべき表面に関する第1のビューまたは第2のビューのうちの少なくとも1つについてのカバレッジ情報を取得することと、前記カバレッジ情報が前記第1のビューおよび前記第2のビューの両方のために1回だけ取得される必要がある場合、または前記第1のビューおよび前記第2のビューのそれぞれのために2回だけ取得される必要がある場合に、シグナリングするための情報を取得することと、をさらに含む、請求項7に記載の方法。
- 前記第1のビューフレームおよび前記関連する第2のビューフレームが同じ符号化されたメディアデータに対応する場合、前記情報は、前記カバレッジ情報が前記第1のビューまたは前記第2のビューのうちの1つのみについて取得されることをシグナリングするための所定の値をとるパラメータであり、
そうではない場合、前記カバレッジ情報は、前記第1のビューおよび前記第2のビューのうちのそれぞれについて得られる、請求項9に記載の方法。 - 前記第1のビューフレームおよび前記関連する第2のビューフレームが異なる符号化されたメディアデータに対応する場合、前記方法は、表示されるべき表面に関する第1のビューまたは第2のビューのうちの少なくとも1つについてのカバレッジ情報を取得することをさらに含み、前記カバレッジ情報は前記第1のビューまたは第2のビューのそれぞれについて取得され、
そうではない場合、前記カバレッジ情報は、前記第1のビューおよび第2のビューの両方について1回だけ取得される、請求項8に記載の方法。 - 前記第1のビューフレームは左のビューフレームであり、前記第2のビューフレームは右のビューフレームである、請求項8に記載の方法。
- コンピュータまたはプロセッサによって実行される場合に、前記コンピュータまたはプロセッサに、請求項1乃至12の何れか1項に記載の方法を実行させるプログラム。
- 請求項13に記載のプログラムを記憶するコンピュータ可読記憶媒体。
- 1つまたは複数のメディアファイルを生成するための装置であって、前記装置は、請求項1乃至6の何れか1項に記載の方法を実施するように構成されている装置。
- 1つまたは複数のメディアファイルを処理するための装置であって、請求項7乃至12の何れか1項に記載の方法を実施するように構成されている装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1716749.5A GB2567624B (en) | 2017-10-12 | 2017-10-12 | Method, device and computer program for transmitting media content |
GB1716749.5 | 2017-10-12 | ||
PCT/EP2018/077059 WO2019072688A1 (en) | 2017-10-12 | 2018-10-04 | METHOD, DEVICE, AND COMPUTER PROGRAM FOR PRODUCING AND PROCESSING MULTIMEDIA CONTENT |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020537367A JP2020537367A (ja) | 2020-12-17 |
JP6960528B2 true JP6960528B2 (ja) | 2021-11-05 |
Family
ID=60419339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020513304A Active JP6960528B2 (ja) | 2017-10-12 | 2018-10-04 | メディアコンテンツを生成および処理するための方法、装置、およびコンピュータプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US11272159B2 (ja) |
JP (1) | JP6960528B2 (ja) |
GB (1) | GB2567624B (ja) |
WO (1) | WO2019072688A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2554877B (en) * | 2016-10-10 | 2021-03-31 | Canon Kk | Methods, devices, and computer programs for improving rendering display during streaming of timed media data |
US20210084282A1 (en) * | 2018-01-12 | 2021-03-18 | Sony Corporation | Information processing apparatus and method |
CN111937396B (zh) * | 2018-04-03 | 2023-11-17 | 华为技术有限公司 | 基于子图像码流视角相关视频编码中的误差抑制的文件格式指示 |
WO2020009344A1 (ko) * | 2018-07-06 | 2020-01-09 | 엘지전자 주식회사 | 360 비디오 데이터의 서브픽처 기반 처리 방법 및 그 장치 |
CN111263191B (zh) * | 2018-11-30 | 2023-06-27 | 中兴通讯股份有限公司 | 视频数据的处理方法、装置、相关设备及存储介质 |
US10972752B2 (en) * | 2018-12-05 | 2021-04-06 | Advanced Micro Devices, Inc. | Stereoscopic interleaved compression |
US11470140B2 (en) * | 2019-02-20 | 2022-10-11 | Dazn Media Israel Ltd. | Method and system for multi-channel viewing |
US11457053B2 (en) * | 2019-02-20 | 2022-09-27 | Dazn Media Israel Ltd. | Method and system for transmitting video |
BR112021026268A2 (pt) * | 2019-06-25 | 2022-03-03 | Beijing Xiaomi Mobile Software Co Ltd | Método e dispositivo para reproduzir mídia omnidirecional, e, dispositivo de terminal |
EP3782366A4 (en) * | 2019-07-03 | 2021-10-20 | Beijing Xiaomi Mobile Software Co., Ltd. | METHOD AND DEVICE FOR CODING, DECODING AND STORAGE MEDIA |
CN111147768A (zh) * | 2019-12-25 | 2020-05-12 | 北京恒峰致远科技有限公司 | 一种提高回看效率的智能监控视频回看方法 |
CN111147815A (zh) * | 2019-12-25 | 2020-05-12 | 北京恒峰致远科技有限公司 | 一种视频监控系统 |
WO2022050166A1 (ja) * | 2020-09-04 | 2022-03-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 再生装置、送信装置、再生方法、及び、送信方法 |
EP3972269A1 (en) * | 2020-09-17 | 2022-03-23 | Lemon Inc. | Subpicture entity groups in video coding |
US20220086457A1 (en) * | 2020-09-17 | 2022-03-17 | Lemon Inc. | Subpicture track referencing and processing |
CN115086781B (zh) * | 2022-06-15 | 2024-02-09 | 北京博良胜合科技有限公司 | 用于Cloud XR的音视频及控制信息的私有传输方法及装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8396906B2 (en) | 2007-10-10 | 2013-03-12 | Electronics And Telecommunications Research Institute | Metadata structure for storing and playing stereoscopic data, and method for storing stereoscopic content file using this metadata |
CN104618708B (zh) * | 2009-01-28 | 2017-07-07 | Lg电子株式会社 | 广播接收机及其视频数据处理方法 |
KR101372376B1 (ko) * | 2009-07-07 | 2014-03-14 | 경희대학교 산학협력단 | 디지털 방송 시스템의 스테레오스코픽 비디오 수신 방법 |
CN103069812B (zh) | 2010-06-09 | 2015-12-16 | 三星电子株式会社 | 提供基于分段的多媒体流服务的方法及装置、接收基于分段的多媒体流服务的方法及装置 |
JP5510097B2 (ja) | 2010-06-16 | 2014-06-04 | ソニー株式会社 | 信号伝送方法、信号送信装置および信号受信装置 |
JP6440747B2 (ja) * | 2014-06-27 | 2018-12-19 | コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ | Hevcでタイル化されたビデオ・ストリームに基づく関心領域の決定 |
WO2016004039A1 (en) * | 2014-07-01 | 2016-01-07 | Huawei Technologies Co., Ltd. | Client behavior control in adaptive streaming |
JP2018507591A (ja) * | 2014-12-31 | 2018-03-15 | ノキア テクノロジーズ オサケユイチア | スケーラブルなビデオ符号化および復号化のための層間予測 |
US9715638B1 (en) * | 2015-12-31 | 2017-07-25 | Nokia Technologies Oy | Method and apparatus for identifying salient subimages within a panoramic image |
US10389999B2 (en) * | 2016-02-17 | 2019-08-20 | Qualcomm Incorporated | Storage of virtual reality video in media files |
EP3565244A4 (en) * | 2016-12-28 | 2019-12-11 | Sony Corporation | GENERATING DEVICE, IDENTIFICATION INFORMATION GENERATING METHOD, REPRODUCING DEVICE, AND IMAGE REPRODUCTION METHOD |
WO2018198487A1 (en) * | 2017-04-25 | 2018-11-01 | Sharp Kabushiki Kaisha | Systems and methods for signaling quality information for regions in virtual reality applications |
US20190387212A1 (en) * | 2017-05-26 | 2019-12-19 | Lg Electronics Inc. | 360 video processing method and apparatus therefor |
US11082719B2 (en) * | 2017-07-03 | 2021-08-03 | Nokia Technologies Oy | Apparatus, a method and a computer program for omnidirectional video |
US10567734B2 (en) * | 2017-08-29 | 2020-02-18 | Qualcomm Incorporated | Processing omnidirectional media with dynamic region-wise packing |
-
2017
- 2017-10-12 GB GB1716749.5A patent/GB2567624B/en active Active
-
2018
- 2018-10-04 US US16/652,645 patent/US11272159B2/en active Active
- 2018-10-04 WO PCT/EP2018/077059 patent/WO2019072688A1/en active Application Filing
- 2018-10-04 JP JP2020513304A patent/JP6960528B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2019072688A1 (en) | 2019-04-18 |
JP2020537367A (ja) | 2020-12-17 |
US20200244942A1 (en) | 2020-07-30 |
GB201716749D0 (en) | 2017-11-29 |
GB2567624B (en) | 2021-05-26 |
GB2567624A (en) | 2019-04-24 |
US11272159B2 (en) | 2022-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6960528B2 (ja) | メディアコンテンツを生成および処理するための方法、装置、およびコンピュータプログラム | |
JP7399224B2 (ja) | メディアコンテンツを送信するための方法、装置及びコンピュータプログラム | |
JP7472220B2 (ja) | 方法、プログラム、及びデバイス | |
KR102329474B1 (ko) | 미디어 데이터를 생성하기 위한 방법 | |
JP7133038B2 (ja) | メディアコンテンツを送信する方法、装置及びコンピュータプログラム | |
GB2564731A (en) | Description of image composition with HEVC still image file format | |
CN110741649B (zh) | 用于轨道合成的方法及装置 | |
KR20220071228A (ko) | 병합 친화적인 파일 형식 | |
KR20220101169A (ko) | 멀티뷰 비디오 프로세싱 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200507 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200507 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211011 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6960528 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |