JP7490712B2 - ピクチャ・イン・ピクチャ領域内のビデオデータユニットの置換のシグナリング - Google Patents
ピクチャ・イン・ピクチャ領域内のビデオデータユニットの置換のシグナリング Download PDFInfo
- Publication number
- JP7490712B2 JP7490712B2 JP2022105485A JP2022105485A JP7490712B2 JP 7490712 B2 JP7490712 B2 JP 7490712B2 JP 2022105485 A JP2022105485 A JP 2022105485A JP 2022105485 A JP2022105485 A JP 2022105485A JP 7490712 B2 JP7490712 B2 JP 7490712B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- picture
- media data
- indicator
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000011664 signaling Effects 0.000 title description 5
- 238000000034 method Methods 0.000 claims description 112
- 230000000153 supplemental effect Effects 0.000 claims description 72
- 238000012545 processing Methods 0.000 claims description 34
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 230000015654 memory Effects 0.000 claims description 13
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 8
- 230000006978 adaptation Effects 0.000 description 20
- 239000013598 vector Substances 0.000 description 19
- 238000000605 extraction Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000013139 quantization Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000005192 partition Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 5
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000011449 brick Substances 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000012092 media component Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
- H04N21/4316—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234345—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/23439—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44016—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/637—Control signals issued by the client directed to the server or network components
- H04N21/6373—Control signals issued by the client directed to the server or network components for rate control, e.g. request to the server to modify its transmission rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8453—Structuring of content, e.g. decomposing content into time segments by locking or enabling a set of features, e.g. optional functionalities in an executable program
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/01—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
適用可能な特許法及び/又はパリ条約に従う規則の下で、本願は、2021年6月30日付けで出願された米国特許仮出願第63/216975号と、2021年7月1日付けで出願された米国特許仮出願第63/217665号との優先権及びその利益を適宜請求するためになされたものである。法の下での全ての目的のために、上記の出願の全開示は、本願の開示の部分として参照により援用される。
本開示は、概して、ビデオストリーミングに関係があり、特に、ハイパーテキスト転送プロトコル上の動的適応ストリーミング(Dynamic Adaptive Streaming over Hypertext Transfer Protocol,DASH)プロトコルでのピクチャ・イン・ピクチャサービスのサポートに関係がある。
1)第1の問題を解決するために、指示がMPDでシグナリングされる。指示は、事前選択(別名、Preselection又はDASH Preselection)がピクチャ・イン・ピクチャ体験を提供するためである、ことを示す。つまり、事前選択要素内のインジケータは、事前選択要素の目的が、補足映像がメイン映像内の対象ピクチャ・イン・ピクチャ領域にオーバーレイされるよう現れるピクチャ・イン・ピクチャ体験を提供するためである、ことを示す。
2)第2の問題を解決するために、指示はMPDでシグナリングされる。指示は、メイン映像内の対象ピクチャ・イン・ピクチャ領域を表すコーディングされたビデオデータユニットが補足映像の対応するビデオデータユニットで置換可能であるかどうかを示す。
3)第3の問題を解決するために、領域IDのリストがMPDでシグナリングされる。領域IDのリストは、メイン映像の各ピクチャ内のどのコーディングされたビデオデータユニットが対象ピクチャ・イン・ピクチャ領域を表すかを示す。
4)第4の問題を解決するために、メイン映像の位置及びサイズに関する情報がMPDでシグナリングされる。実施形態において、メイン映像の位置及びサイズの情報は、メイン映像よりもサイズが小さい補足映像を埋め込む/オーバーレイするときに使用され得る。
5)代替的に、要素、例えば、PicnPic要素と呼ばれる、が事前選択要素に加えられる。このPicnPic要素は、次のうちの少なくとも1つ以上を含む:
a.上記と同様に、@dataUnitsReplaceable属性,
b.上記と同様に、@regionsIds属性,
c.メイン映像内の対象ピクチャ・イン・ピクチャ領域の左上符号化ビデオピクセル(サンプル)の水平位置を指定する@x属性。単位はビデオピクセル(サンプル)である。4つの属性@x、@y、@width、及び@heightが全て存在するか又は全て存在しないかのどちらかである,
d.メイン映像内の対象ピクチャ・イン・ピクチャ領域の左上符号化ビデオピクセル(サンプル)の垂直位置を指定する@y属性。単位はビデオピクセル(サンプル)である,
e.メイン映像内の対象ピクチャ・イン・ピクチャ領域の幅を指定する@widhth属性。単位はビデオピクセル(サンプル)である,
f.メイン映像内の対象ピクチャ・イン・ピクチャ領域の高さを指定する@height属性。単位はビデオピクセル(サンプル)である。
6)代替的に、要素、例えば、PicnPic要素と呼ばれる、が事前選択要素に加えられる。このPicnPic要素は、次のうちの少なくとも1つ以上を含む:
a.上記と同様に、@dataUnitsReplaceable属性,
b.上記と同様に、@regionsIds属性,
c.少なくとも次を含む、例えば、Region要素と呼ばれる、要素:
i.メイン映像内の対象ピクチャ・イン・ピクチャ領域の左上符号化ビデオピクセル(サンプル)の水平位置を指定する@x属性。単位はビデオピクセル(サンプル)である,
ii.メイン映像内の対象ピクチャ・イン・ピクチャ領域の左上符号化ビデオピクセル(サンプル)の垂直位置を指定する@y属性。単位はビデオピクセル(サンプル)である,
iii.メイン映像内の対象ピクチャ・イン・ピクチャ領域の幅を指定する@widhth属性。単位はビデオピクセル(サンプル)である,
iv.メイン映像内の対象ピクチャ・イン・ピクチャ領域の高さを指定する@height属性。単位はビデオピクセル(サンプル)である。
ビデオデータと該ビデオデータの記述子との間の変換を実行するステップを有し、
前記記述子はフォーマット規則に従い、
前記フォーマット規則は、前記記述子が、該記述子の事前選択シンタックス構造のピクチャ・イン・ピクチャ使用を示すシンタックス要素を含む、ことを指定する、
方法。
前記シンタックス要素は、前記事前選択シンタックス構造のタグ属性である、
方法。
前記シンタックス要素は、前記事前選択シンタックス構造の役割属性である、
方法。
ビデオデータと該ビデオデータの記述子との間の変換を実行するステップを有し、
前記記述子はフォーマット規則に従い、
前記フォーマット規則は、前記記述子が、ピクチャ・イン・ピクチャ領域に対応する前記ビデオデータ内のメイン映像のビデオデータユニットが前記ビデオデータ内の補足映像のビデオデータユニットで置換可能であるかどうか、を示すシンタックス要素を選択的に含む、ことを指定する、
方法。
前記シンタックス要素は、前記記述子内の属性フィールドである、
方法。
前記シンタックス要素は、前記記述子内のタグ属性の値に基づき、選択的に含まれる、
方法。
ビデオデータと該ビデオデータの記述子との間の変換を実行するステップを有し、
前記記述子はフォーマット規則に従い、
前記フォーマット規則は、前記記述子が、対象ピクチャ・イン・ピクチャ領域に対応する前記ビデオデータ内のメイン映像のピクチャ内のビデオデータユニットを示す領域識別子のリストを含む、ことを指定する、
方法。
前記リストは、前記記述子内の事前選択シンタックス構造の属性として含まれる、
方法。
前記領域識別子は、前記メイン映像をコーディングするために使用されるコーディングスキームに従って前記ビデオデータユニットを示すために使用されるシンタックスフィールドに対応する、
方法。
ビデオデータと該ビデオデータの記述子との間の変換を実行するステップを有し、
前記記述子はフォーマット規則に従い、
前記フォーマット規則は、前記記述子が、補足映像をオーバーレイする又は埋め込むために使用されるメイン映像内の領域の位置及び/又はサイズの情報を示す1つ以上のフィールドを含む、ことを指定する、
方法。
前記位置及び前記サイズの情報は、前記領域の位置座標、高さ及び幅を含む4つの値を有する、
方法。
前記1つ以上のフィールドは、事前選択シンタックス構造の属性又は要素を有する、
方法。
前記領域が正確な置換可能領域又は好ましい置換可能領域であるかどうかは、他のシンタックス要素に基づき決定される、
方法。
前記記述子は、メディアプレゼンテーション記述(MPD)である、
方法。
前記フォーマット規則は、特定のシンタックス要素が前記記述子に含まれる、ことを指定し、
前記特定のシンタックス要素は、ピクチャ・イン・ピクチャ情報を含む、
方法。
前記変換は、ビデオからビットストリームを生成することを含む、
方法。
前記変換は、ビットストリームからビデオを生成することを含む、
方法。
解決法1乃至17のうちのいずれか1つ以上に記載の方法に従ってビットストリームを生成するステップと、
前記ビットストリームをコンピュータ可読媒体に記憶するステップと
を有する方法。
[1] ITU-T and ISO/IEC, “High efficiency video coding”, Rec. ITU-T H.265 | ISO/IEC 23008-2 (in force edition)
[2] J. Chen, E. Alshina, G. J. Sullivan, J.-R. Ohm, J. Boyce, “Algorithm description of Joint Exploration Test Model 7 (JEM7),” JVET-G1001, Aug. 2017
[3] Rec. ITU-T H.266 | ISO/IEC 23090-3, “Versatile Video Coding”, 2020
[4] B. Bross, J. Chen, S. Liu, Y.-K. Wang (editors), “Versatile Video Coding (Draft 10),” JVET-S2001
[5] Rec. ITU-T Rec. H.274 | ISO/IEC 23002-7, “Versatile Supplemental Enhancement Information Messages for Coded Video Bitstreams”, 2020
[6] J. Boyce, V. Drugeon, G. Sullivan, Y.-K. Wang (editors), “Versatile supplemental enhancement information messages for coded video bitstreams (Draft 5),” JVET-S2007
[7] ISO/IEC 14496-12: "Information technology - Coding of audio-visual objects - Part 12: ISO base media file format"
[8] ISO/IEC 23009-1: "Information technology - Dynamic adaptive streaming over HTTP (DASH) - Part 1: Media presentation description and segment formats"(DASH標準規格仕様の第4版はMPEG入力文書m52458で入手可能である。)
[9] ISO/IEC 14496-15: "Information technology - Coding of audio-visual objects - Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format"
[10] ISO/IEC 23008-12: "Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 12: Image File Format"
[11] ISO/IEC JTC 1/SC 29/WG 03 output document N0035, "Potential improvements on Carriage of VVC and EVC in ISOBMFF", Nov. 2020
[12] ISO/IEC JTC 1/SC 29/WG 03 output document N0038, "Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 12: Image File Format - Amendment 3: Support for VVC, EVC, slideshows and other improvements (CD stage)", Nov. 2020.
200 ピクチャ
202 タイル
204 サブピクチャ/スライス
206 CTUにパーティション
600 ビデオ処理システム
602 入力部
604 コーディングコンポーネント
700 ビデオ処理装置
702 プロセッサ
704 メモリ
706 ビデオ処理ハードウェア
800 ビデオコーディングシステム
810 送信元デバイス
812 ビデオソース
814,900 ビデオエンコーダ
816,826 I/Oインターフェース
820 送信先デバイス
822 表示デバイス
824,1000 ビデオデコーダ
830 ネットワーク
840 記憶媒体/サーバ
901 パーティションユニット
902 予測ユニット
903 モード選択ユニット
904 動き推定ユニット
905 動き補償ユニット
906 イントラ予測ユニット
907 残差生成ユニット
908 変換ユニット
909 量子化ユニット
910 逆量子化ユニット
911 逆変換ユニット
912 再構成ユニット
913,1007 バッファ
914 エントロピ符号化ユニット
1001 エントロピ復号化ユニット
1002 動き補償ユニット
1003 イントラ予測ユニット
1004 逆量子化ユニット
1005 逆変換ユニット
1006 再構成ユニット
Claims (19)
- メディアデータを処理する方法であって、
映像である前記メディアデータとハイパーテキスト転送プロトコル上の動的適応ストリーミング(DASH)のためのメディアデータファイルとの間の変換のために、事前選択要素がインジケータを含むかどうかを決定するステップであり、前記インジケータは、前記メディアデータのメイン映像の対象ピクチャ・イン・ピクチャ領域を表すビデオデータユニットが前記メディアデータの補足映像の対応するビデオデータユニットで置換可能であることを示す、ステップと、
前記インジケータに基づき前記メディアデータと前記メディアデータファイルとの間の前記変換を実行するステップと
を有し、
前記インジケータは、前記事前選択要素の属性を含む、方法。 - 前記インジケータは、@dataUnitsReplaceable属性を有する、
請求項1に記載の方法。 - 前記インジケータは、@tag属性が前記事前選択要素に存在する場合にのみ、前記事前選択要素に存在する、
請求項1に記載の方法。 - 前記インジケータは、前記事前選択要素の目的が、前記補足映像が前記メイン映像内の前記対象ピクチャ・イン・ピクチャ領域に視覚的にオーバーレイされるピクチャ・イン・ピクチャ体験を提供するためである、ことを前記事前選択要素内の@tag属性が示す場合にのみ、前記事前選択要素に存在する、
請求項1に記載の方法。 - 前記事前選択要素が前記インジケータを含まないことを決定するステップを更に有する、
請求項1に記載の方法。 - 前記メイン映像内の前記対象ピクチャ・イン・ピクチャ領域を表す前記ビデオデータユニットを前記補足映像の前記対応するビデオデータユニットで置換することは、前記事前選択要素が前記インジケータを含まない場合に未知である、
請求項5に記載の方法。 - 前記インジケータは、真の値を有している@dataUnitsReplaceable属性を有する、
請求項1に記載の方法。 - 前記@dataUnitsReplaceable属性が前記真の値を有している場合に、前記メイン映像内の前記対象ピクチャ・イン・ピクチャ領域を表す前記ビデオデータユニットを前記補足映像の前記対応するビデオデータユニットで置換することを選択することをクライアントに許すステップを更に有する、
請求項7に記載の方法。 - 前記@dataUnitsReplaceable属性が前記真の値を有している場合に、前記メイン映像内の前記対象ピクチャ・イン・ピクチャ領域を表す前記ビデオデータユニットを前記補足映像の前記対応するビデオデータユニットで置換することを選択することをクライアントに許すことによって、前記メイン映像及び前記補足映像の別々の復号化を回避するステップを更に有する、
請求項7に記載の方法。 - 前記補足映像の前記対応するビデオデータユニットは、前記補足映像の表現における復号化時間同期サンプル内の全てのビデオデータユニットである、
請求項1に記載の方法。 - 前記復号化時間同期サンプル内のビデオデータユニットは、前記メイン映像内の特定のピクチャに対応する、
請求項10に記載の方法。 - 前記事前選択要素は、PicinPic要素を含む、
請求項1に記載の方法。 - 前記インジケータは、@dataUnitsReplaceable属性を有し、
前記PicinPic要素が、前記@dataUnitsReplaceable属性を含む、
請求項12に記載の方法。 - 前記事前選択要素は、メディアプレゼンテーション記述(MPD)ファイルに配置される、
請求項1に記載の方法。 - 前記事前選択要素は、DASHプレゼンテーション要素である、
請求項1に記載の方法。 - 前記変換は、前記メディアデータを前記メディアデータファイルに符号化することを含む、
請求項1乃至15のうちいずれか一項に記載の方法。 - 前記変換は、前記メディアデータを前記メディアデータファイルから復号することを含む、
請求項1乃至15のうちいずれか一項に記載の方法。 - メディアデータを処理する装置であって、
プロセッサと、命令を有する非一時的なメモリとを有し、
前記命令は、前記プロセッサによる実行時に、前記プロセッサに、
映像である前記メディアデータとハイパーテキスト転送プロトコル上の動的適応ストリーミング(DASH)のためのメディアデータファイルとの間の変換のために、事前選択要素がインジケータを含むかどうかを決定するステップであり、前記インジケータは、前記メディアデータのメイン映像の対象ピクチャ・イン・ピクチャ領域を表すビデオデータユニットが前記メディアデータの補足映像の対応するビデオデータユニットで置換可能であることを示す、ステップと、
前記インジケータに基づき前記メディアデータと前記メディアデータファイルとの間の前記変換を実行するステップと
を実行させ、
前記インジケータは、前記事前選択要素の属性を含む、
装置。 - ハイパーテキスト転送プロトコル上の動的適応ストリーミング(DASH)のためのメディアデータファイルを記憶する方法であって、
映像であるメディアデータについて、事前選択要素がインジケータを含むかどうかを決定するステップであり、前記インジケータは、前記メディアデータのメイン映像の対象ピクチャ・イン・ピクチャ領域を表すビデオデータユニットが前記メディアデータの補足映像の対応するビデオデータユニットで置換可能であることを示す、ステップと、
前記インジケータに基づき前記メディアデータファイルを生成するステップと、
前記メディアデータファイルを非一時的なコンピュータ可読記録媒体に記憶するステップと
を有し、
前記インジケータは、前記事前選択要素の属性を含む、
方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163216975P | 2021-06-30 | 2021-06-30 | |
US63/216975 | 2021-06-30 | ||
US202163217665P | 2021-07-01 | 2021-07-01 | |
US63/217665 | 2021-07-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023008947A JP2023008947A (ja) | 2023-01-19 |
JP7490712B2 true JP7490712B2 (ja) | 2024-05-27 |
Family
ID=82493921
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022105486A Active JP7495445B2 (ja) | 2021-06-30 | 2022-06-30 | どのビデオデータユニットが対象ピクチャ・イン・ピクチャ領域を表すかの指示 |
JP2022105487A Active JP7495446B2 (ja) | 2021-06-30 | 2022-06-30 | ピクチャ・イン・ピクチャ領域のサイズ及び位置のシグナリング |
JP2022105485A Active JP7490712B2 (ja) | 2021-06-30 | 2022-06-30 | ピクチャ・イン・ピクチャ領域内のビデオデータユニットの置換のシグナリング |
JP2024083739A Pending JP2024100938A (ja) | 2021-06-30 | 2024-05-23 | ピクチャ・イン・ピクチャ領域のサイズ及び位置のシグナリング |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022105486A Active JP7495445B2 (ja) | 2021-06-30 | 2022-06-30 | どのビデオデータユニットが対象ピクチャ・イン・ピクチャ領域を表すかの指示 |
JP2022105487A Active JP7495446B2 (ja) | 2021-06-30 | 2022-06-30 | ピクチャ・イン・ピクチャ領域のサイズ及び位置のシグナリング |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024083739A Pending JP2024100938A (ja) | 2021-06-30 | 2024-05-23 | ピクチャ・イン・ピクチャ領域のサイズ及び位置のシグナリング |
Country Status (5)
Country | Link |
---|---|
US (3) | US20230018718A1 (ja) |
EP (3) | EP4114017A1 (ja) |
JP (4) | JP7495445B2 (ja) |
KR (3) | KR20230004341A (ja) |
CN (3) | CN115550720A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118743227A (zh) * | 2022-02-17 | 2024-10-01 | 字节跳动有限公司 | 用于视频处理的方法、装置和介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190306519A1 (en) | 2018-04-03 | 2019-10-03 | Mediatek Singapore Pte. Ltd. | Methods and apparatus for encoding and decoding overlay compositions |
US20200107008A1 (en) | 2018-10-02 | 2020-04-02 | Lg Electronics Inc. | Method and apparatus for overlay processing in 360 video system |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4081772B2 (ja) | 2005-08-25 | 2008-04-30 | ソニー株式会社 | 再生装置および再生方法、プログラム、並びにプログラム格納媒体 |
US8767124B2 (en) * | 2010-07-13 | 2014-07-01 | Thomson Licensing | Method of picture-in-picture for multimedia applications |
CN107087223A (zh) * | 2011-01-07 | 2017-08-22 | 夏普株式会社 | 再生装置及其控制方法、以及生成装置及其控制方法 |
KR101719998B1 (ko) * | 2011-12-12 | 2017-03-27 | 엘지전자 주식회사 | 미디어 컨텐트를 수신하는 장치 및 방법 |
US10951310B2 (en) * | 2012-12-27 | 2021-03-16 | Panasonic Intellectual Property Corporation Of America | Communication method, communication device, and transmitter |
WO2016199609A1 (ja) * | 2015-06-12 | 2016-12-15 | ソニー株式会社 | 情報処理装置および情報処理方法 |
KR102637023B1 (ko) | 2015-11-25 | 2024-02-16 | 소니그룹주식회사 | 수신 장치, 송신 장치, 및 데이터 처리 방법 |
EP3466079B1 (en) * | 2016-05-24 | 2023-07-12 | Nokia Technologies Oy | Method and an apparatus and a computer program for encoding media content |
ES2963845T3 (es) * | 2016-07-14 | 2024-04-02 | Koninklijke Kpn Nv | Codificación de vídeo |
GB2554877B (en) | 2016-10-10 | 2021-03-31 | Canon Kk | Methods, devices, and computer programs for improving rendering display during streaming of timed media data |
WO2018120294A1 (zh) | 2016-12-30 | 2018-07-05 | 华为技术有限公司 | 一种信息的处理方法及装置 |
US11297298B2 (en) | 2018-02-27 | 2022-04-05 | Lg Electronics Inc. | Method for transmitting and receiving 360-degree video including camera lens information, and device therefor |
US11140380B2 (en) | 2018-06-06 | 2021-10-05 | Lg Electronics Inc. | Method and apparatus for processing overlay media in 360 degree video system |
US10862946B1 (en) | 2019-04-05 | 2020-12-08 | Sony Interactive Entertainment LLC | Media player supporting streaming protocol libraries for different media applications on a computer system |
CA3057924A1 (en) * | 2019-10-08 | 2021-04-08 | De La Fuente Sanchez, Alfonso F. | System and method to optimize the size of a video recording or video transmission by identifying and recording a region of interest in a higher definition than the rest of the image that is saved or transmitted in a lower definition format |
KR102216956B1 (ko) * | 2019-11-26 | 2021-02-19 | 서울과학기술대학교 산학협력단 | 다중 시점 영상의 프리로드 시스템 및 방법 |
JP7407951B2 (ja) * | 2020-01-08 | 2024-01-04 | 中興通訊股▲ふん▼有限公司 | 点群データ処理 |
US20230108426A1 (en) * | 2021-10-05 | 2023-04-06 | Tencent America LLC | Method and apparatus for dynamic dash picture-in-picture streaming |
-
2022
- 2022-06-27 US US17/809,195 patent/US20230018718A1/en active Pending
- 2022-06-27 US US17/809,199 patent/US11985333B2/en active Active
- 2022-06-27 US US17/809,206 patent/US20230019913A1/en active Pending
- 2022-06-30 CN CN202210771004.4A patent/CN115550720A/zh active Pending
- 2022-06-30 KR KR1020220080707A patent/KR20230004341A/ko unknown
- 2022-06-30 EP EP22182331.3A patent/EP4114017A1/en active Pending
- 2022-06-30 KR KR1020220080691A patent/KR20230004340A/ko unknown
- 2022-06-30 JP JP2022105486A patent/JP7495445B2/ja active Active
- 2022-06-30 EP EP22182329.7A patent/EP4114016A1/en active Pending
- 2022-06-30 JP JP2022105487A patent/JP7495446B2/ja active Active
- 2022-06-30 KR KR1020220080674A patent/KR20230004338A/ko unknown
- 2022-06-30 JP JP2022105485A patent/JP7490712B2/ja active Active
- 2022-06-30 CN CN202210772575.XA patent/CN115550722A/zh active Pending
- 2022-06-30 CN CN202210771043.4A patent/CN115550721A/zh active Pending
- 2022-06-30 EP EP22182327.1A patent/EP4114015A1/en active Pending
-
2024
- 2024-05-23 JP JP2024083739A patent/JP2024100938A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190306519A1 (en) | 2018-04-03 | 2019-10-03 | Mediatek Singapore Pte. Ltd. | Methods and apparatus for encoding and decoding overlay compositions |
US20200107008A1 (en) | 2018-10-02 | 2020-04-02 | Lg Electronics Inc. | Method and apparatus for overlay processing in 360 video system |
Also Published As
Publication number | Publication date |
---|---|
US20230018718A1 (en) | 2023-01-19 |
CN115550721A (zh) | 2022-12-30 |
EP4114015A1 (en) | 2023-01-04 |
EP4114016A1 (en) | 2023-01-04 |
JP2023008948A (ja) | 2023-01-19 |
JP2024100938A (ja) | 2024-07-26 |
KR20230004338A (ko) | 2023-01-06 |
CN115550722A (zh) | 2022-12-30 |
US20230018200A1 (en) | 2023-01-19 |
JP2023008947A (ja) | 2023-01-19 |
JP7495446B2 (ja) | 2024-06-04 |
CN115550720A (zh) | 2022-12-30 |
JP2023008949A (ja) | 2023-01-19 |
US20230019913A1 (en) | 2023-01-19 |
KR20230004341A (ko) | 2023-01-06 |
KR20230004340A (ko) | 2023-01-06 |
US11985333B2 (en) | 2024-05-14 |
JP7495445B2 (ja) | 2024-06-04 |
EP4114017A1 (en) | 2023-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7397036B2 (ja) | 映像符号化におけるサブピクチャエンティティ | |
JP2024100938A (ja) | ピクチャ・イン・ピクチャ領域のサイズ及び位置のシグナリング | |
US20240244303A1 (en) | Method, device, and medium for video processing | |
JP7460693B2 (ja) | 事前選択の目的のシグナリング | |
JP7418489B2 (ja) | サブピクチャエンティティグループに対するレベルインジケータ | |
KR20240049612A (ko) | 비디오 처리를 위한 방법, 기기 및 매체 | |
WO2023220006A1 (en) | Signaling of picture-in-picture in media files |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231024 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7490712 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |