JP2023008952A - 事前選択の目的のシグナリング - Google Patents
事前選択の目的のシグナリング Download PDFInfo
- Publication number
- JP2023008952A JP2023008952A JP2022105948A JP2022105948A JP2023008952A JP 2023008952 A JP2023008952 A JP 2023008952A JP 2022105948 A JP2022105948 A JP 2022105948A JP 2022105948 A JP2022105948 A JP 2022105948A JP 2023008952 A JP2023008952 A JP 2023008952A
- Authority
- JP
- Japan
- Prior art keywords
- video
- picture
- indicator
- media data
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011664 signaling Effects 0.000 title description 5
- 238000000034 method Methods 0.000 claims abstract description 110
- 230000000153 supplemental effect Effects 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000006243 chemical reaction Methods 0.000 claims abstract description 18
- 230000006978 adaptation Effects 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 14
- 230000003044 adaptive effect Effects 0.000 claims description 10
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 description 19
- 238000000605 extraction Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 13
- 238000013139 quantization Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000005192 partition Methods 0.000 description 6
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000011449 brick Substances 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000012092 media component Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- IGTHEWGRXUAFKF-NVJADKKVSA-N 1-cyclopropyl-8-(difluoromethoxy)-7-[(1r)-1-methyl-2,3-dihydro-1h-isoindol-5-yl]-4-oxoquinoline-3-carboxylic acid;methanesulfonic acid;hydrate Chemical compound O.CS(O)(=O)=O.N([C@@H](C1=CC=2)C)CC1=CC=2C(C=1OC(F)F)=CC=C(C(C(C(O)=O)=C2)=O)C=1N2C1CC1 IGTHEWGRXUAFKF-NVJADKKVSA-N 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 208000034188 Stiff person spectrum disease Diseases 0.000 description 1
- 229920010524 Syndiotactic polystyrene Polymers 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 208000012112 ischiocoxopodopatellar syndrome Diseases 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000002490 spark plasma sintering Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/445—Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
- H04N5/45—Picture in picture, e.g. displaying simultaneously another television channel in a region of the screen
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
- H04N21/4316—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/23439—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234345—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47208—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting near-video-on-demand content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/637—Control signals issued by the client directed to the server or network components
- H04N21/6373—Control signals issued by the client directed to the server or network components for rate control, e.g. request to the server to modify its transmission rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/01—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
適用可能な特許法及び/又はパリ条約に従う規則の下で、本願は、2021年6月30日付けで出願された米国特許仮出願第63/216975号の優先権及びその利益を適宜請求するためになされたものである。法の下での全ての目的のために、上記の出願の全開示は、本願の開示の部分として参照により援用される。
本開示は、概して、ビデオストリーミングに関係があり、特に、ハイパーテキスト転送プロトコル上の動的適応ストリーミング(Dynamic Adaptive Streaming over Hypertext Transfer Protocol,DASH)プロトコルでのピクチャ・イン・ピクチャサービスのサポートに関係がある。
1)第1の問題を解決するために、指示がMPDでシグナリングされる。指示は、事前選択(別名、Preselection又はDASH Preselection)がピクチャ・イン・ピクチャ体験を提供するためである、ことを示す。つまり、事前選択要素内のインジケータは、事前選択要素の目的が、補足映像がメイン映像内の対象ピクチャ・イン・ピクチャ領域にオーバーレイされるよう現れるピクチャ・イン・ピクチャ体験を提供するためである、ことを示す。
2)第2の問題を解決するために、指示はMPDでシグナリングされる。指示は、メイン映像内の対象ピクチャ・イン・ピクチャ領域を表すコーディングされたビデオデータユニットが補足映像の対応するビデオデータユニットで置換可能であるかどうかを示す。
3)第3の問題を解決するために、領域IDのリストがMPDでシグナリングされる。領域IDのリストは、メイン映像の各ピクチャ内のどのコーディングされたビデオデータユニットが対象ピクチャ・イン・ピクチャ領域を表すかを示す。
4)第4の問題を解決するために、メイン映像の位置及びサイズに関する情報がMPDでシグナリングされる。実施形態において、メイン映像の位置及びサイズの情報は、メイン映像よりもサイズが小さい補足映像を埋め込む/オーバーレイするときに使用され得る。
ビデオデータと該ビデオデータの記述子との間の変換を実行するステップを有し、
前記記述子はフォーマット規則に従い、
前記フォーマット規則は、前記記述子が、該記述子の事前選択シンタックス構造のピクチャ・イン・ピクチャ使用を示すシンタックス要素を含む、ことを指定する、
方法。
前記シンタックス要素は、前記事前選択シンタックス構造のタグ属性である、
方法。
前記シンタックス要素は、前記事前選択シンタックス構造の役割属性である、
方法。
ビデオデータと該ビデオデータの記述子との間の変換を実行するステップを有し、
前記記述子はフォーマット規則に従い、
前記フォーマット規則は、前記記述子が、ピクチャ・イン・ピクチャ領域に対応する前記ビデオデータ内のメイン映像のビデオデータユニットが前記ビデオデータ内の補足映像のビデオデータユニットで置換可能であるかどうか、を示すシンタックス要素を選択的に含む、ことを指定する、
方法。
前記シンタックス要素は、前記記述子内の属性フィールドである、
方法。
前記シンタックス要素は、前記記述子内のタグ属性の値に基づき、選択的に含まれる、
方法。
ビデオデータと該ビデオデータの記述子との間の変換を実行するステップを有し、
前記記述子はフォーマット規則に従い、
前記フォーマット規則は、前記記述子が、対象ピクチャ・イン・ピクチャ領域に対応する前記ビデオデータ内のメイン映像のピクチャ内のビデオデータユニットを示す領域識別子のリストを含む、ことを指定する、
方法。
前記リストは、前記記述子内の事前選択シンタックス構造の属性として含まれる、
方法。
前記領域識別子は、前記メイン映像をコーディングするために使用されるコーディングスキームに従って前記ビデオデータユニットを示すために使用されるシンタックスフィールドに対応する、
方法。
ビデオデータと該ビデオデータの記述子との間の変換を実行するステップを有し、
前記記述子はフォーマット規則に従い、
前記フォーマット規則は、前記記述子が、補足映像をオーバーレイする又は埋め込むために使用されるメイン映像内の領域の位置及び/又はサイズの情報を示す1つ以上のフィールドを含む、ことを指定する、
方法。
前記位置及び前記サイズの情報は、前記領域の位置座標、高さ及び幅を含む4つの値を有する、
方法。
前記1つ以上のフィールドは、事前選択シンタックス構造の属性又は要素を有する、
方法。
前記領域が正確な置換可能領域又は好ましい置換可能領域であるかどうかは、他のシンタックス要素に基づき決定される、
方法。
前記記述子は、メディアプレゼンテーション記述(MPD)である、
方法。
前記変換は、ビデオからビットストリームを生成することを含む、
方法。
前記変換は、ビットストリームからビデオを生成することを含む、
方法。
解決法1乃至16のうちのいずれか1つ以上に記載の方法に従ってビットストリームを生成するステップと、
前記ビットストリームをコンピュータ可読媒体に記憶するステップと
を有する方法。
[1] ITU-T and ISO/IEC, “High efficiency video coding”, Rec. ITU-T H.265 | ISO/IEC 23008-2 (in force edition)
[2] J. Chen, E. Alshina, G. J. Sullivan, J.-R. Ohm, J. Boyce, “Algorithm description of Joint Exploration Test Model 7 (JEM7),” JVET-G1001, Aug. 2017
[3] Rec. ITU-T H.266 | ISO/IEC 23090-3, “Versatile Video Coding”, 2020
[4] B. Bross, J. Chen, S. Liu, Y.-K. Wang (editors), “Versatile Video Coding (Draft 10),” JVET-S2001
[5] Rec. ITU-T Rec. H.274 | ISO/IEC 23002-7, “Versatile Supplemental Enhancement Information Messages for Coded Video Bitstreams”, 2020
[6] J. Boyce, V. Drugeon, G. Sullivan, Y.-K. Wang (editors), “Versatile supplemental enhancement information messages for coded video bitstreams (Draft 5),” JVET-S2007
[7] ISO/IEC 14496-12: "Information technology - Coding of audio-visual objects - Part 12: ISO base media file format"
[8] ISO/IEC 23009-1: "Information technology - Dynamic adaptive streaming over HTTP (DASH) - Part 1: Media presentation description and segment formats"(DASH標準規格仕様の第4版はMPEG入力文書m52458で入手可能である。)
[9] ISO/IEC 14496-15: "Information technology - Coding of audio-visual objects - Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format"
[10] ISO/IEC 23008-12: "Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 12: Image File Format"
[11] ISO/IEC JTC 1/SC 29/WG 03 output document N0035, "Potential improvements on Carriage of VVC and EVC in ISOBMFF", Nov. 2020
[12] ISO/IEC JTC 1/SC 29/WG 03 output document N0038, "Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 12: Image File Format - Amendment 3: Support for VVC, EVC, slideshows and other improvements (CD stage)", Nov. 2020.
200 ピクチャ
202 タイル
204 サブピクチャ/スライス
206 CTUにパーティション
600 ビデオ処理システム
602 入力部
604 コーディングコンポーネント
700 ビデオ処理装置
702 プロセッサ
704 メモリ
706 ビデオ処理ハードウェア
800 ビデオコーディングシステム
810 送信元デバイス
812 ビデオソース
814,900 ビデオエンコーダ
816,826 I/Oインターフェース
820 送信先デバイス
822 表示デバイス
824,1000 ビデオデコーダ
830 ネットワーク
840 記憶媒体/サーバ
901 パーティションユニット
902 予測ユニット
903 モード選択ユニット
904 動き推定ユニット
905 動き補償ユニット
906 イントラ予測ユニット
907 残差生成ユニット
908 変換ユニット
909 量子化ユニット
910 逆量子化ユニット
911 逆変換ユニット
912 再構成ユニット
913,1007 バッファ
914 エントロピ符号化ユニット
1001 エントロピ復号化ユニット
1002 動き補償ユニット
1003 イントラ予測ユニット
1004 逆量子化ユニット
1005 逆変換ユニット
1006 再構成ユニット
Claims (20)
- メディアデータを処理する方法であって、
前記メディアデータとメディアデータファイルとの間の変換のために、事前選択要素がインジケータを含むことを決定するステップであり、前記インジケータは、前記事前選択要素の目的が、補足映像がメイン映像内の対象ピクチャ・イン・ピクチャ領域にオーバーレイされるように現れるピクチャ・イン・ピクチャ体験を提供するためである、ことを示す、ステップと、
前記インジケータに基づき前記メディアデータと前記メディアデータファイルとの間の前記変換を実行するステップと
を有する方法。 - 前記インジケータは、@tag属性を有する、
請求項1に記載の方法。 - 前記インジケータは、@value属性を有する、
請求項1に記載の方法。 - 前記インジケータは、前記事前選択要素の前記目的が前記ピクチャ・イン・ピクチャ体験を提供するためである、ことを示すよう“PicInPic”の値を有する、
請求項1に記載の方法。 - 前記インジケータは、前記事前選択要素の前記目的が前記ピクチャ・イン・ピクチャ体験を提供するためである、ことを示すよう“PicInPic”の値を有している@tag属性を有する、
請求項1に記載の方法。 - 前記インジケータは、前記事前選択要素の前記目的が前記ピクチャ・イン・ピクチャ体験を提供するためである、ことを示すよう“PicInPic”の値を有している@value属性を有する、
請求項1に記載の方法。 - 前記インジケータは、前記事前選択要素の中のCommonAttributesElements要素内の@tag属性を有する、
請求項1に記載の方法。 - 前記インジケータは、前記事前選択要素の中のRole要素の@value属性を有する、
請求項1に記載の方法。 - 前記インジケータは、デコーダに向けて選択目的のために使用され得る表現、適応セット、又は前記事前選択要素も指定する@tag属性を有する、
請求項1に記載の方法。 - 前記インジケータは、役割注釈スキームに関する情報を指定するRole要素の@value属性を有する、
請求項1に記載の方法。 - 前記事前選択要素は、前記メイン映像内の前記対象ピクチャ・イン・ピクチャ領域を表すコーディングされたビデオデータユニットが前記補足映像の対応するビデオデータユニットで置換可能であるかどうかを指定する@dataUnitsReplaceable属性を含む、
請求項1に記載の方法。 - 前記事前選択要素は、前記インジケータが“PicInPic”の値を有している@tag属性である場合にのみ、@dataUnitsReplaceable属性を含む、
請求項1に記載の方法。 - 前記事前選択要素は、前記メイン映像内の前記対象ピクチャ・イン・ピクチャ領域を表す各コーディングされたビデオデータユニットについて識別子(ID)を指定する@regionsIds属性を含む、
請求項1に記載の方法。 - 前記事前選択要素は、前記インジケータが“PicInPic”の値を有している@tag属性である場合にのみ、@regionsIds属性を含む、
請求項1に記載の方法。 - 前記事前選択要素は、メディアプレゼンテーション記述(MPD)ファイルに配置される、
請求項1に記載の方法。 - 前記事前選択要素は、ハイパーテキスト転送プロトコル上の動的適応ストリーミング(DASH)プレゼンテーション要素である、
請求項1に記載の方法。 - 前記変換は、前記メディアデータをビットストリームに符号化することを含む、
請求項1乃至16のうちいずれか一項に記載の方法。 - 前記変換は、前記メディアデータをビットストリームから復号することを含む、
請求項1乃至16のうちいずれか一項に記載の方法。 - メディアデータを処理する装置であって、
プロセッサと、命令を有する非一時的なメモリとを有し、
前記命令は、前記プロセッサによる実行時に、前記プロセッサに、
前記メディアデータとメディアデータファイルとの間の変換のために、事前選択要素がインジケータを含むことを決定するステップであり、前記インジケータは、前記事前選択要素の目的が、補足映像がメイン映像内の対象ピクチャ・イン・ピクチャ領域にオーバーレイされるように現れるピクチャ・イン・ピクチャ体験を提供するためである、ことを示す、ステップと、
前記インジケータに基づき前記メディアデータと前記メディアデータファイルとの間の前記変換を実行するステップと
を実行させる、
装置。 - ビデオ処理装置によって実行された方法によって生成されるビデオのメディアプレゼンテーション記述(MPD)を記憶する非一時的なコンピュータ可読記録媒体であって、
前記方法は、
事前選択要素がインジケータを含むことを決定するステップであり、前記インジケータは、前記事前選択要素の目的が、補足映像がメイン映像内の対象ピクチャ・イン・ピクチャ領域にオーバーレイされるように現れるピクチャ・イン・ピクチャ体験を提供するためである、ことを示す、ステップと、
前記インジケータに基づき前記MPDを生成するステップと
を有する、
非一時的なコンピュータ可読記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163216975P | 2021-06-30 | 2021-06-30 | |
US63/216975 | 2021-06-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023008952A true JP2023008952A (ja) | 2023-01-19 |
JP7460693B2 JP7460693B2 (ja) | 2024-04-02 |
Family
ID=82493947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022105948A Active JP7460693B2 (ja) | 2021-06-30 | 2022-06-30 | 事前選択の目的のシグナリング |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230007210A1 (ja) |
EP (1) | EP4114018A1 (ja) |
JP (1) | JP7460693B2 (ja) |
KR (1) | KR20230004339A (ja) |
CN (1) | CN115550719A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023159143A2 (en) * | 2022-02-17 | 2023-08-24 | Bytedance Inc. | Method, apparatus, and medium for video processing |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007104615A (ja) * | 2005-08-25 | 2007-04-19 | Sony Corp | 再生装置および再生方法、プログラム、プログラム格納媒体、データ構造、並びに、記録媒体の製造方法 |
WO2017090457A1 (ja) * | 2015-11-25 | 2017-06-01 | ソニー株式会社 | 受信装置、送信装置、及び、データ処理方法 |
JP2021505069A (ja) * | 2018-02-27 | 2021-02-15 | エルジー エレクトロニクス インコーポレイティド | カメラレンズ情報を含む360°ビデオを送受信する方法及びその装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10951310B2 (en) * | 2012-12-27 | 2021-03-16 | Panasonic Intellectual Property Corporation Of America | Communication method, communication device, and transmitter |
GB2554877B (en) * | 2016-10-10 | 2021-03-31 | Canon Kk | Methods, devices, and computer programs for improving rendering display during streaming of timed media data |
JP7407951B2 (ja) * | 2020-01-08 | 2024-01-04 | 中興通訊股▲ふん▼有限公司 | 点群データ処理 |
-
2022
- 2022-06-27 US US17/809,189 patent/US20230007210A1/en active Pending
- 2022-06-29 CN CN202210761357.6A patent/CN115550719A/zh active Pending
- 2022-06-30 EP EP22182334.7A patent/EP4114018A1/en active Pending
- 2022-06-30 KR KR1020220080683A patent/KR20230004339A/ko unknown
- 2022-06-30 JP JP2022105948A patent/JP7460693B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007104615A (ja) * | 2005-08-25 | 2007-04-19 | Sony Corp | 再生装置および再生方法、プログラム、プログラム格納媒体、データ構造、並びに、記録媒体の製造方法 |
WO2017090457A1 (ja) * | 2015-11-25 | 2017-06-01 | ソニー株式会社 | 受信装置、送信装置、及び、データ処理方法 |
JP2021505069A (ja) * | 2018-02-27 | 2021-02-15 | エルジー エレクトロニクス インコーポレイティド | カメラレンズ情報を含む360°ビデオを送受信する方法及びその装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7460693B2 (ja) | 2024-04-02 |
EP4114018A1 (en) | 2023-01-04 |
KR20230004339A (ko) | 2023-01-06 |
CN115550719A (zh) | 2022-12-30 |
US20230007210A1 (en) | 2023-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7397036B2 (ja) | 映像符号化におけるサブピクチャエンティティ | |
JP7495445B2 (ja) | どのビデオデータユニットが対象ピクチャ・イン・ピクチャ領域を表すかの指示 | |
JP7460693B2 (ja) | 事前選択の目的のシグナリング | |
JP7413434B2 (ja) | サブピクチャトラックレベルインジケータ | |
KR20240049612A (ko) | 비디오 처리를 위한 방법, 기기 및 매체 | |
KR20240049610A (ko) | 비디오 처리를 위한 방법, 장치 및 매체 | |
CN115699724A (zh) | 编解码视频中序列结束的指示 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220803 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240321 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7460693 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |