JP2021529478A - 適応的なストリーミング整列のためのフレーム変換 - Google Patents
適応的なストリーミング整列のためのフレーム変換 Download PDFInfo
- Publication number
- JP2021529478A JP2021529478A JP2020572962A JP2020572962A JP2021529478A JP 2021529478 A JP2021529478 A JP 2021529478A JP 2020572962 A JP2020572962 A JP 2020572962A JP 2020572962 A JP2020572962 A JP 2020572962A JP 2021529478 A JP2021529478 A JP 2021529478A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- audio
- video
- bitstream
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 title abstract description 24
- 238000006243 chemical reaction Methods 0.000 title description 3
- 238000000034 method Methods 0.000 claims abstract description 144
- 238000012545 processing Methods 0.000 claims abstract description 67
- 239000000872 buffer Substances 0.000 claims abstract description 54
- 230000006978 adaptation Effects 0.000 claims description 51
- 230000004044 response Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 6
- 239000002131 composite material Substances 0.000 claims description 2
- 230000001360 synchronised effect Effects 0.000 abstract description 7
- 238000004519 manufacturing process Methods 0.000 description 34
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000004806 packaging method and process Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 239000000203 mixture Substances 0.000 description 5
- 238000010397 one-hybrid screening Methods 0.000 description 5
- 101100166100 Candida parapsilosis SAPP2 gene Proteins 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000001824 photoionisation detection Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 3
- 101100122750 Caenorhabditis elegans gop-2 gene Proteins 0.000 description 2
- 101100476639 Caenorhabditis elegans gop-3 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001447 compensatory effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/61—Network physical structure; Signal processing
- H04N21/6106—Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2355—Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
- H04N21/4355—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/61—Network physical structure; Signal processing
- H04N21/615—Signal processing at physical level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/647—Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
- H04N21/64723—Monitoring of network processes or resources, e.g. monitoring of network load
- H04N21/6473—Monitoring network processes errors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本願は、いずれも2018年6月28日に出願された米国仮特許出願第62/690,998号および欧州特許出願第18180389.1号の優先権の利益を主張する。両出願は参照により本明細書に組み込まれる。
本稿は、オーディオおよびビデオ信号処理に関し、より詳細には、ビデオ・フレーム(エンコードされたビデオ・データおよび任意的にメタデータも含む)およびオーディオ・フレーム(エンコードされたオーディオ・データおよび任意的にメタデータも含む)を含むビットストリーム(たとえば、適応ストリーミング・フォーマットまたは方法/プロトコルにおいて使用されるビットストリームまたはビットストリーム・セグメントまたはトランスポート・ストリーム)の生成および適応に関する。本発明のいくつかの実施形態は、エンコードされたオーディオ・データ(たとえば、AC-4、またはMPEG-D USAC、MPEG-Hオーディオ標準に準拠するか互換性のあるフォーマットのエンコードされたオーディオ・データ)を含むビットストリーム・セグメント(たとえば、MPEG-2トランスポート・ストリーム・フォーマット、またはMMT、もしくはMPEG-DASH、もしくは別のストリーミング方法/プロトコルに従うフォーマット、または別の適応ストリーミング・フォーマット、または別の標準互換フォーマットを有する)を生成するまたは適応させる(たとえば整列させる)。
(a)第1のデコード型のフレームを含む、オーディオおよびビデオ・コンテンツを示すフレームを含む入力AVビットストリームを提供し(たとえば、それらのフレーム、またはそれらのフレームを含む入力トランスポート・ストリームもしくは他の入力AVビットストリームを、エンコーダまたはNBMPエンティティに送信、送達、または他の仕方で提供する)、任意的に、各フレームに関連付けられたメタデータを提供する。ここで、第1のデコード型の各フレームは、PフレームまたはIフレームを含み、オーディオ・コンテンツ(たとえば、エンコードされたオーディオ・コンテンツ)またはビデオ・コンテンツ(たとえば、エンコードビデオ・コンテンツ)を示す;
(b)第1のデコード型のフレームの少なくとも1つに関連付けられたメタデータの一部を異なるメタデータに修正し、第1のデコード型とは異なる第2のデコード型の少なくとも1つの再オーサリングされたフレームを生成する;
(c)入力AVビットストリームに応答して出力AVビットストリームを生成する。これは、第1のデコード型のフレームの少なくとも一つを第1のデコード型とは異なる第2のデコード型の再オーサリングされたフレームとして再オーサリングすること(たとえば、第1のデコード型のフレームのうちの前記一つがPフレームである場合は再オーサリングされたフレームは再オーサリングされたIフレームであり、あるいは、第1のデコード型のフレームのうちの前記一つがIフレームである場合は再オーサリングされたフレームは再オーサリングされたPフレームである)を含み、それにより、AVビットストリームは再オーサリングされたフレームを含むコンテンツのセグメントを含み、該コンテンツの該セグメントはIフレームで始まり、ビデオ・コンテンツのIフレームとオーディオ・コンテンツのIフレームを整列させるためにIフレームの後に少なくとも一つのPフレームを含む。たとえば、ステップ(b)は、再オーサリングされたフレームがオーディオIフレームであるように、少なくとも1つのオーディオPフレームを再オーサリングする、または、再オーサリングされたフレームがオーディオPフレームであるように、少なくとも1つのオーディオIフレームを再オーサリングする、または、再オーサリングされたフレームがビデオIフレームであるように、少なくとも1つのビデオPフレームを再オーサリングする、または、再オーサリングされたフレームがビデオPフレームであるように、少なくとも1つのビデオIフレームを再オーサリングするステップを含みうる。
フレームを提供する。ここで、それらのフレームの少なくとも1つはPフレームおよびIフレームを含むハイブリッド・フレームであり、Iフレームはコンテンツのエンコードされたバージョンを示し、Pフレームはコンテンツの異なる仕方でエンコードされたバージョンを示し、フレームのそれぞれがオーディオ・コンテンツまたはビデオ・コンテンツを示す;
AVビットストリームを生成する。これは、少なくとも1つの前記ハイブリッド・フレームのPフレームを選択し、各選択されたPフレームをAVビットストリームに含めることによることを含む。それにより、AVビットストリームは、Iフレームで始まり、該Iフレームに続く、少なくとも前記選択されたPフレームを含むセグメントを含むようにされる。
特許請求の範囲内を含め本開示を通じて、信号またはデータ「に対して」動作を実行する(たとえば、信号またはデータをフィルタリングする、スケーリングする、変換する、またはそれに利得を適用する)という表現は、広い意味で使用され、信号またはデータに対して直接、または信号またはデータの処理されたバージョンに対して(たとえば、それに対する該動作の実行前に、予備的なフィルタリングまたは前処理を受けた信号のバージョンに対して)該動作を実行することを表わす。
本発明のいくつかの実施形態は、エンコードされたオーディオ・データのIフレーム(オーディオIフレーム)と同期したビデオ・データのIフレーム(ビデオIフレーム)を含むAVビットストリームを生成するための方法およびシステムであり、AVビットストリームは、AVビットストリームのエレメンタリー・ストリームのセグメント(たとえば、ビデオ・エレメンタリー・ストリーム、および一つまたは複数の対応するオーディオ・エレメンタリー・ストリーム)間の整列の問題に対する解決策を提供する。たとえば、図1のコンテンツ送達ネットワークのNBMPエンティティ12、図7のシステム、および図4のプロダクション・ユニット3のそれぞれは、本発明の実施形態に従って構成され、そのようなAVビットストリームを生成するシステムである。
Iフレームの2つのコピー。たとえば、図6のハイブリッド・フレームH1、H5、およびH9のそれぞれは、Iフレームの2つのコピー(両方とも「I」とラベル付けされている)を含む;または
1つのIフレーム。たとえば、図6Aのハイブリッド・フレームH'1、H'5、およびH'9のそれぞれは、1つのIフレーム(「I」とラベル付けされている)からなる;
1つのIフレーム(エンコードされたオーディオ・データとメタデータを含む)と1つのPフレーム(同じエンコードされたオーディオ・データと異なるメタデータを含む)。たとえば、図6の、フレームH1、H5、またはH9以外の各ハイブリッド・フレーム、および図6Aの、フレームH'1、H'5、およびH'9以外の各ハイブリッド・フレームは、そのようなIフレーム(「I」とラベル付けされている)およびそのようなPフレーム(「P」とラベル付けされている)を含む。
ASF(audio spectral frontend[オーディオ・スペクトル・フロントエンド])メタデータ。一定のビットレートが要求されない場合、sf_infoおよびsf_dataセクション全体はハイブリッド・フレームのIフレームおよびPフレームの両方において同じである。一定のビットレートが要求される場合、Iフレームのsf_dataセクションは、Iフレーム・サイズのオーバヘッドを補償し、Iフレーム全体が対応するPフレームと同じサイズをもつよう、より小さくてもよい。どちらの場合も、sf_infoセクションは、ウィンドウ形状が完全にマッチすることを確実にするために同一である;
ASPX(spectral extension[スペクトル拡張])メタデータ。ハイブリッド・フレームのIフレームは、ハイブリッド・フレームのPフレームのaspx_configにマッチするaspx_configを含む。Iフレームのaspx_dataは、イントラフレーム符号化のみを使用し、一方、Pフレームのaspx_dataは、イントラフレーム符号化またはインターフレーム符号化のいずれかを使用することができる。エンコーダは、最もビットレート効率のよいものを選択するために、典型的には両方の方法を実行するので、これは、典型的には、エンコーダに対して追加的なオーバヘッドを課さない;
ACPL(coupling[結合])メタデータ。ハイブリッド・フレームのIフレームは、ハイブリッド・フレームのPフレームのacpl_configにマッチするacpl_configを含む。acpl_framing_dataは、PフレームおよびIフレームにおいて同一である。Iフレームのacpl_ec_dataのインスタンスはすべてdiff_type=DIFF_FREQ(イントラフレーム符号化のみ)に制約される。
(a)フレームを生成するステップであって、それらのフレームのうちの少なくとも1つがPフレームおよびIフレームを含むハイブリッド・フレームであり、Iフレームはコンテンツのエンコードされたバージョンを示し、Pフレームはコンテンツの異なる仕方でエンコードされたバージョンを示し、それらのフレームのそれぞれがオーディオ・コンテンツまたはビデオ・コンテンツを示す、ステップと;
(b)少なくとも1つの前記ハイブリッド・フレームのPフレームを選択し、選択された各PフレームをAVビットストリームに含めることによることを含め、AVビットストリームが、Iフレームで始まり、該Iフレームに続く少なくとも前記選択されたPフレームを含むセグメントを含むように、AVビットストリームを生成するステップ。
(a)フレームを提供するステップであって、それらのフレームの少なくとも1つは、PフレームおよびIフレームを決定するために有用なデータの少なくとも1つのチャンクを含むハイブリッド・フレームであり、Iフレームは、コンテンツのエンコードされたバージョンを示し、Pフレームは、コンテンツの異なる仕方でエンコードされたバージョンを示し、それらのフレームのそれぞれは、オーディオ・コンテンツまたはビデオ・コンテンツを示す、ステップと;
(b)少なくとも1つの前記ハイブリッド・フレームのデータの少なくとも1つの前記チャンク(データの前記少なくとも1つのチャンクは、IフレームまたはPフレーム全体を含んでいてもいなくてもよい)を用いて少なくとも1つのIフレームまたはPフレームを合成することによることを含め、AVビットストリームを生成し、それにより、少なくとも1つの合成されたフレームを生成し、それぞれの前記合成されたフレームをAVビットストリームに含めるステップであって、AVビットストリームは、Iフレームで始まり、該Iフレームに続く少なくとも1つの合成されたPフレームを含むセグメントを含むか、または合成されたIフレームで始まり、該合成されたIフレームに続く少なくとも1つのPフレームを含むセグメントを含む、ステップ。ステップ(b)の例は、少なくとも1つのPフレーム(またはIフレーム)を、1つのハイブリッド・フレームのデータの少なくとも1つのチャンクから、または少なくとも2つのハイブリッド・フレームを示すフレームのシーケンスのデータの少なくとも1つのチャンクから合成することを含む。いくつかの実施形態では、少なくとも1つの前記ハイブリッド・フレームは、(PフレームおよびIフレームについての)共通データのチャンクの少なくとも1つのインスタンスを含む。
第1のデコード型のフレームを含むコンテンツを示すフレームを提供するステップであって、各フレームがオーディオ・コンテンツまたはビデオ・コンテンツを示す、ステップと;
第1のデコード型のフレームの少なくとも1つを、第1のデコード型とは異なる第2のデコード型の再オーサリングされたフレームとして再オーサリングすることによることを含め、AVビットストリームを生成するステップであって、前記AVビットストリームは、再オーサリングされたフレームを含むコンテンツのセグメントを含み、コンテンツの該セグメントは、Iフレームで始まり、該Iフレームに続く少なくとも1つのPフレームを含む、ステップ、
ここで、第1のデコード型のフレームの前記1つがPフレームである場合には再オーサリングされたフレームは再オーサリングされたIフレームであり、第1のデコード型のフレームの前記1つがIフレームである場合には再オーサリングされたフレームは再オーサリングされたPフレームである。
第1のシステムにおいて、前記フレームを含む入力AVビットストリームを生成し;
入力AVビットストリームを第2のシステムに送達する、
ここで、AVビットストリームを生成する前記ステップは、前記第2のシステムにおいて実行される。
前のオーディオIフレームからのメタデータを修正することによって、修正されたメタデータを生成し;
前記オーディオPフレームの前記メタデータの少なくとも一部を修正されたメタデータで置き換えて、再オーサリングされたフレームが該修正されたメタデータを含むようにする。
第1のシステムにおいて、前記オーディオIフレームと前記オーディオPフレームを含む入力AVビットストリームを生成し;
前記入力AVビットストリームを第2のシステムに送達する、
ここで、前記AVビットストリームを生成する前記ステップは、前記第2のシステムにおいて実行される。
第1のシステムにおいて、前記オーディオIフレームを含む入力AVビットストリームを生成し;
前記入力AVビットストリームを第2のシステムに送達する、
ここで、前記AVビットストリームを生成する前記ステップは、前記第2のシステムにおいて実行される。
前記制約条件は、前記AVビットストリームが、所定のレートで生起する適応点を含み、各適応点が、前記AVビットストリームのビデオIフレームおよび前記AVビットストリームの少なくとも1つの対応するオーディオIフレームの両方の生起時刻である。
第1のデコード型のフレームを含む、コンテンツを示すフレームを受領するように結合された少なくとも1つの入力であって、各フレームがオーディオ・コンテンツまたはビデオ・コンテンツを示す、入力と;
第1のデコード型のフレームの少なくとも1つを、第1のデコード型とは異なる第2のデコード型の再オーサリングされたフレームとして再オーサリングすることによることを含め、前記AVビットストリームを生成するように結合され、構成されたサブシステムであって、前記AVビットストリームは、再オーサリングされたフレームを含むコンテンツのセグメントを含み、コンテンツの該セグメントはIフレームで始まり、該Iフレームに続く少なくとも1つのPフレームを含む、サブシステム、
ここで、第1のデコード型のフレームの前記1つがPフレームである場合、再オーサリングされたフレームは再オーサリングされたIフレームである、または第1のデコード型のフレームの前記1つがIフレームである場合、再オーサリングされたフレームは再オーサリングされたPフレームである。
前のオーディオIフレームからのメタデータを修正することによって、修正されたメタデータを生成し;
前記オーディオPフレームの前記メタデータの少なくとも一部を、修正されたメタデータで置き換えて、前記再オーサリングされたフレームが該修正されたメタデータを含むようにする。
前記制約条件は、前記AVビットストリームが、所定のレートで生起する適応点を含み、各適応点が、前記AVビットストリームのビデオIフレームおよび前記AVビットストリームの少なくとも1つの対応するオーディオIフレームの両方の生起の時刻である、ことである。
(a)フレームを提供するステップであって、前記フレームの少なくとも1つがPフレームおよびIフレームを含むハイブリッド・フレームであり、前記Iフレームはコンテンツのエンコードされたバージョンを示し、前記Pフレームはコンテンツの異なる仕方でエンコードされたバージョンを示し、前記フレームのそれぞれがオーディオ・コンテンツまたはビデオ・コンテンツを示す、ステップと;
(b)少なくとも1つの前記ハイブリッド・フレームのPフレームを選択することによることを含め、AVビットストリームを生成するステップであって、前記AVビットストリームは、Iフレームで始まり、該Iフレームに続く少なくとも前記選択されたPフレームを含むセグメントを含む、ステップ。
AVビットストリームを受領するように結合された少なくとも1つの入力であって、前記AVビットストリームはE1〜E21、E31またはE32の方法によって生成されたものである、入力と;
前記AVビットストリームを適応し(たとえば、スプライシングまたはスイッチングする)、それにより、適応されたAVビットストリームを生成するように結合され構成されたサブシステムとを含む、
システム。
バッファ・メモリと;
前記バッファ・メモリに結合された少なくとも1つのオーディオ/ビデオ処理サブシステムとを含むオーディオ/ビデオ処理ユニット。ここで、前記バッファ・メモリは、AVビットストリームの少なくとも1つのセグメントを非一時的に記憶し、前記AVビットストリームは、E1〜E21、E31またはE32のいずれかの方法によって生成されたものである。
Claims (20)
- 出力オーディオ/ビデオ・ビットストリームを生成する方法であって:
第1のデコード型のフレームを含む、オーディオおよびビデオ・コンテンツを示すフレームと、各フレームに関連付けられたメタデータとを含む入力オーディオ/ビデオ・ビットストリームを提供するステップであって、前記第1のデコード型の各フレームはPフレームまたはIフレームを含み、各フレームは、オーディオ・コンテンツまたはビデオ・コンテンツを示す、ステップと;
前記第1のデコード型のフレームの少なくとも1つに関連付けられたメタデータの一部を異なるメタデータに修正して、前記第1のデコード型とは異なる第2のデコード型の少なくとも1つの再オーサリングされたフレームを生成するステップと;
前記入力オーディオ/ビデオ・ビットストリームに応答して前記出力オーディオ/ビデオ・ビットストリームを生成するステップであって、前記出力オーディオ/ビデオ・ビットストリームは、前記再オーサリングされたフレームを含む前記オーディオおよびビデオ・コンテンツのセグメントを含み、前記オーディオおよびビデオ・コンテンツの該セグメントは、Iフレームで始まり、該Iフレームに続く少なくとも1つのPフレームを、前記ビデオ・コンテンツのIフレームを前記オーディオ・コンテンツのIフレームと整列させるために含む、ステップとを含む、
方法。 - 前記異なるメタデータは、前記第1のデコード型の前記少なくとも1つのフレームの前のフレームに関連付けられたメタデータを含む、請求項1に記載の方法。
- 前記出力オーディオ/ビデオ・ビットストリームを生成することは、前記出力オーディオ/ビデオ・ビットストリームの前記オーディオおよびビデオ・コンテンツの前記セグメントを、Iフレームで始まる前記ビデオ・コンテンツのセグメントとして決定することを含む、請求項1または2に記載の方法。
- フレームを提供する前記ステップは:
第1のシステムにおいて、前記フレームを含む前記入力オーディオ/ビデオ・ビットストリームを生成するステップと;
前記入力オーディオ/ビデオ・ビットストリームを第2のシステムに送達するステップとを含み、
前記出力オーディオ/ビデオ・ビットストリームを生成する前記ステップは、前記第2のシステムにおいて実行される、
請求項1ないし3のうちいずれか一項に記載の方法。 - 前記再オーサリングされたフレームはオーディオIフレームであり、前記第1のデコード型のフレームの前記少なくとも1つはオーディオPフレームである、請求項1ないし4のうちいずれか一項に記載の方法。
- 前記メタデータの一部を修正する前記ステップは、前記オーディオPフレームの前記メタデータの少なくとも一部を、前のオーディオIフレームからコピーされた異なるメタデータで置き換えて、前記再オーサリングされたフレームが該異なるメタデータを含むようにすることを含む、請求項5に記載の方法。
- 前記メタデータの一部を修正する前記ステップは:
前のオーディオIフレームからのメタデータを修正することによって、修正されたメタデータを生成するステップと;
前記オーディオPフレームの前記メタデータの少なくとも一部を、前記修正されたメタデータで置き換えて、前記再オーサリングされたフレームが該修正されたメタデータを含むようにするステップとを含む、
請求項5に記載の方法。 - 前記メタデータの一部を修正する前記ステップは、少なくとも1つの前のPフレームを前記オーディオPフレームにコピーすることを含む、請求項5に記載の方法。
- 前記出力/ビデオ・ビットストリームを生成することは、修正されていない、前記入力オーディオ/ビデオ・ビットストリームの前記コンテンツのセグメントの前記オーディオおよびビデオ・コンテンツと前記メタデータとを、前記出力オーディオ/ビデオ・ビットストリームに渡すことを含む、請求項1ないし8のうちいずれか一項に記載の方法。
- 前記出力オーディオ/ビデオ・ビットストリームを生成する前記ステップは、前記出力オーディオ/ビデオ・ビットストリームが少なくとも1つのネットワーク制約条件を満たすように実行される、請求項1ないし9のうちいずれか一項に記載の方法。
- 前記ネットワーク制約条件は、前記出力オーディオ/ビデオ・ビットストリームの利用可能なビットレート、またはプログラムにチューンインするための最大時間、または前記出力オーディオ/ビデオ・ビットストリームの最大の許容されるセグメント継続時間である、請求項10に記載の方法。
- 前記出力オーディオ/ビデオ・ビットストリームを生成する前記ステップは、前記出力オーディオ/ビデオ・ビットストリームが少なくとも1つの制約条件を満たすように実行され、前記制約条件は、前記出力オーディオ/ビデオ・ビットストリームが所定のレートで生起する適応点を含むというものであり、前記適応点のそれぞれは、前記出力オーディオ/ビデオ・ビットストリームのビデオIフレームと、前記出力オーディオ/ビデオ・ビットストリームの少なくとも1つの対応するオーディオIフレームの両方が生起する時刻である、請求項1ないし11のうちいずれか一項に記載の方法。
- 出力オーディオ/ビデオ・ビットストリームを生成する方法であって:
(a)フレームを提供するステップであって、前記フレームの少なくとも1つがPフレームおよびIフレームを含むハイブリッド・フレームであり、前記Iフレームはコンテンツのエンコードされたバージョンを示し、前記Pフレームは前記コンテンツの異なる仕方でエンコードされたバージョンを示し、前記フレームのそれぞれはオーディオ・コンテンツまたはビデオ・コンテンツを示す、ステップと;
(b)少なくとも1つの前記ハイブリッド・フレームの前記Pフレームを選択し、各選択されたPフレームを前記出力オーディオ/ビデオ・ビットストリーム内に含めることによることを含め、前記出力オーディオ/ビデオ・ビットストリームが、Iフレームで始まり、該Iフレームに続く少なくとも前記選択されたPフレームを含むセグメントを含むように、前記出力オーディオ/ビデオ・ビットストリームを生成するステップとを含む、
方法。 - 出力オーディオ/ビデオ・ビットストリームを生成する方法であって:
(a)フレームを提供するステップであって、前記フレームの少なくとも1つは、PフレームおよびIフレームを決定するために有用なデータの少なくとも1つのチャンクを含むハイブリッド・フレームであり、前記Iフレームは、コンテンツのエンコードされたバージョンを示し、前記Pフレームは、前記コンテンツの異なる仕方でエンコードされたバージョンを示し、前記フレームのそれぞれは、オーディオ・コンテンツまたはビデオ・コンテンツを示す、ステップと;
(b)少なくとも1つの前記ハイブリッド・フレームのデータの少なくとも1つの前記チャンクを使って少なくとも1つのIフレームまたはPフレームを合成し、それにより少なくとも1つの合成されたフレームを生成し、それぞれの前記合成されたフレームを前記出力オーディオ/ビデオ・ビットストリームに含めることによることを含め、前記出力オーディオ/ビデオ・ビットストリームが、Iフレームで始まり、該Iフレームに続く少なくとも1つの合成されたPフレームを含むセグメントを含むか、または合成されたIフレームで始まり、該合成されたIフレームに続く少なくとも1つのPフレームを含むセグメントを含むように、前記出力オーディオ/ビデオ・ビットストリームを生成するステップとを含む、
方法。 - 出力オーディオ/ビデオ・ビットストリームを適応させ、それにより、適応された出力オーディオ/ビデオ・ビットストリームを生成する方法であって、該適応された出力オーディオ/ビデオ・ビットストリームは、請求項1ないし14のうちいずれか一項に記載の方法によって生成されたものである、方法。
- 出力オーディオ/ビデオ・ビットストリームを生成するためのシステムであって、当該システムは:
第1のデコード型のフレームを含む、オーディオおよびビデオ・コンテンツを示すフレームと、各フレームに関連付けられたメタデータとを含む入力オーディオ/ビデオ・ビットストリームを受領するように結合された少なくとも1つの入力部であって、前記第1のデコード型の各フレームはPフレームまたはIフレームを含み、各フレームは、オーディオ・コンテンツまたはビデオ・コンテンツを示す、入力部と;
前記第1のデコード型のフレームの少なくとも1つに関連付けられたメタデータの一部を異なるメタデータに修正して、前記第1のデコード型とは異なる第2のデコード型の少なくとも1つの再オーサリングされたフレームを生成するように構成された第1のサブシステムと;
前記入力オーディオ/ビデオ・ビットストリームに応答して前記出力オーディオ/ビデオ・ビットストリームを生成するように結合され、構成された第2のサブシステムであって、前記出力オーディオ/ビデオ・ビットストリームは、前記再オーサリングされたフレームを含む前記オーディオおよびビデオ・コンテンツのセグメントを含み、前記コンテンツの該セグメントは、Iフレームで始まり、該Iフレームに続く少なくとも1つのPフレームを、前記ビデオ・コンテンツのIフレームを前記オーディオ・コンテンツのIフレームと整列させるために含む、第2のサブシステムとを含む、
システム。 - 当該システムが、ネットワーク・ベースのメディア処理(NBMP)エンティティである、請求項16に記載のシステム。
- 出力オーディオ/ビデオ・ビットストリーム適応のためのシステムであって:
入力オーディオ/ビデオ・ビットストリームを受領するように結合された少なくとも1つの入力部であって、前記出力オーディオ/ビデオ・ビットストリームが、請求項1ないし14のうちいずれか一項に記載の方法によって生成されたものである、入力部と;
前記出力オーディオ/ビデオ・ビットストリームを適応させ、それにより、適応された出力オーディオ/ビデオ・ビットストリームを生成するように結合され、構成されたサブシステムとを含む、
システム。 - バッファ・メモリと;
前記バッファ・メモリに結合された少なくとも1つのオーディオ/ビデオ処理サブシステムとを含むオーディオ/ビデオ処理ユニットであって、前記バッファ・メモリは、入力オーディオ/ビデオ・ビットストリームの少なくとも1つのセグメントを非一時的に記憶し、前記出力オーディオ/ビデオ・ビットストリームは、請求項1ないし14のうちいずれか一項に記載の方法によって生成されたものである、
オーディオ/ビデオ処理ユニット。 - 処理装置またはシステムによって実行されるときに、前記処理装置またはシステムに請求項1ないし15のうちいずれか一項に記載の方法を実行させる命令を有するコンピュータ・プログラム・プロダクト。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862690998P | 2018-06-28 | 2018-06-28 | |
US62/690,998 | 2018-06-28 | ||
EP18180389.1 | 2018-06-28 | ||
EP18180389 | 2018-06-28 | ||
PCT/US2019/039535 WO2020006250A1 (en) | 2018-06-28 | 2019-06-27 | Frame conversion for adaptive streaming alignment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021529478A true JP2021529478A (ja) | 2021-10-28 |
JP7171772B2 JP7171772B2 (ja) | 2022-11-15 |
Family
ID=67403003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020572962A Active JP7171772B2 (ja) | 2018-06-28 | 2019-06-27 | 適応的なストリーミング整列のためのフレーム変換 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11368747B2 (ja) |
EP (1) | EP3815387A1 (ja) |
JP (1) | JP7171772B2 (ja) |
KR (1) | KR102406318B1 (ja) |
CN (2) | CN115802046A (ja) |
WO (1) | WO2020006250A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11431817B2 (en) * | 2018-12-04 | 2022-08-30 | Samsung Electronics Co., Ltd. | Method and apparatus for management of network based media processing functions |
US11356534B2 (en) * | 2019-04-23 | 2022-06-07 | Tencent America LLC | Function repository selection mode and signaling for cloud based processing |
CN111831842A (zh) * | 2019-04-23 | 2020-10-27 | 腾讯美国有限责任公司 | Nbmp中处理媒体内容的方法、装置和存储介质 |
CN113316001B (zh) * | 2021-05-25 | 2023-04-11 | 上海哔哩哔哩科技有限公司 | 视频对齐方法及装置 |
US20230019558A1 (en) * | 2021-07-06 | 2023-01-19 | Tencent America LLC | Method and apparatus for signaling independent processing of media segments on cloud using metadata and startcode |
US11930189B2 (en) * | 2021-09-30 | 2024-03-12 | Samsung Electronics Co., Ltd. | Parallel metadata generation based on a window of overlapped frames |
CN114363791A (zh) * | 2021-11-26 | 2022-04-15 | 赛因芯微(北京)电子科技有限公司 | 串行音频元数据生成方法、装置、设备及存储介质 |
US12126879B2 (en) | 2022-07-08 | 2024-10-22 | Disney Enterprises, Inc. | Surgical micro-encoding of content |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004007648A (ja) * | 2002-05-06 | 2004-01-08 | Sony Corp | 映像音声データ記録装置、映像音声データ記録方法、映像音声データ再生装置、並びに、映像音声データ再生方法 |
JP2005051307A (ja) * | 2003-07-29 | 2005-02-24 | Kyocera Corp | データ編集装置およびデータ編集方法 |
JP2006521064A (ja) * | 2003-03-17 | 2006-09-14 | クゥアルコム・インコーポレイテッド | ワイヤレスマルチメディア通信用の部分フレームエンコーディングシステムおよび方法 |
JP2007184913A (ja) * | 2005-12-30 | 2007-07-19 | Sharp Corp | 無線ビデオ送信システム |
US20130208811A1 (en) * | 2007-06-29 | 2013-08-15 | Cisco Technology, Inc. | Expedited splicing of video streams |
JP2016136256A (ja) * | 2010-12-03 | 2016-07-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数のメディア処理ノードによる適応処理 |
JP2017508375A (ja) * | 2014-02-10 | 2017-03-23 | ドルビー・インターナショナル・アーベー | 完璧な接合のためのトランスポート・ストリームへのエンコードされたオーディオの埋め込み |
JP2017520954A (ja) * | 2014-05-09 | 2017-07-27 | ティーキューティーブイディー ソフトウェア エルティーディーエーTqtvd Software Ltda | Mpeg−2プライベートセクションで視聴覚コンテンツストリームをカプセル化するための方法、mpeg−2トランスポートストリームで多重送信されるようにmpeg−2プライベートセクションで視聴覚コンテンツをカプセル化するためのデバイス、デジタルtv用対話型アプリケーション、ユーザデバイス、視聴覚コンテンツおよび/またはデータを伝送するための方法、ならびにデータネットワーク用通信プロトコル |
WO2017138387A1 (ja) * | 2016-02-12 | 2017-08-17 | ソニー株式会社 | 情報処理装置および情報処理方法 |
JP2017195755A (ja) * | 2016-04-14 | 2017-10-26 | 株式会社ユピテル | 装置、車載機器およびシステム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1774925A (zh) * | 2003-03-17 | 2006-05-17 | 高通股份有限公司 | 用于无线多媒体传输的局部帧内编码系统和方法 |
WO2007119236A2 (en) * | 2006-04-13 | 2007-10-25 | Yosef Mizrachi | Method and apparatus for providing gaming services and for handling video content |
US7738676B1 (en) * | 2006-11-02 | 2010-06-15 | Qurio Holdings, Inc. | Client-side watermarking using hybrid I-frames |
US7983440B1 (en) * | 2006-11-02 | 2011-07-19 | Qurio Holdings, Inc. | Selection of I-frames for client-side watermarking |
US8781003B2 (en) * | 2008-07-17 | 2014-07-15 | Cisco Technology, Inc. | Splicing of encrypted video/audio content |
US8621044B2 (en) * | 2009-03-16 | 2013-12-31 | Microsoft Corporation | Smooth, stateless client media streaming |
CN102172028A (zh) * | 2009-07-31 | 2011-08-31 | 松下电器产业株式会社 | 影像数据处理装置及影像数据处理系统 |
EP2920961A4 (en) * | 2011-09-15 | 2017-05-31 | Libre Communications Inc. | Method, apparatus and computer program product for video compression |
WO2014204366A1 (en) * | 2013-06-19 | 2014-12-24 | Telefonaktiebolaget L M Ericsson (Publ) | Arrangements and method thereof for a channel change during streaming |
EP2843963A1 (en) * | 2013-08-30 | 2015-03-04 | Thomson Licensing | Method for watermarking a content |
US20150358622A1 (en) | 2014-06-10 | 2015-12-10 | Empire Technology Development Llc | Video Encoding for Real-Time Streaming Based on Audio Analysis |
US20150373075A1 (en) | 2014-06-23 | 2015-12-24 | Radia Perlman | Multiple network transport sessions to provide context adaptive video streaming |
US10349057B2 (en) * | 2015-04-01 | 2019-07-09 | Cox Communications, Inc. | Systems and methods for optimizing video coding efficiency based on characteristics of video content |
US9819480B2 (en) * | 2015-08-04 | 2017-11-14 | Ibiquity Digital Corporation | System and method for synchronous processing of analog and digital pathways in a digital radio receiver |
US10951914B2 (en) * | 2015-08-27 | 2021-03-16 | Intel Corporation | Reliable large group of pictures (GOP) file streaming to wireless displays |
-
2019
- 2019-06-27 CN CN202211544575.0A patent/CN115802046A/zh active Pending
- 2019-06-27 US US16/973,762 patent/US11368747B2/en active Active
- 2019-06-27 WO PCT/US2019/039535 patent/WO2020006250A1/en active Application Filing
- 2019-06-27 CN CN201980043163.9A patent/CN112369042B/zh active Active
- 2019-06-27 EP EP19743085.3A patent/EP3815387A1/en active Pending
- 2019-06-27 JP JP2020572962A patent/JP7171772B2/ja active Active
- 2019-06-27 KR KR1020217002694A patent/KR102406318B1/ko active IP Right Grant
-
2022
- 2022-05-26 US US17/825,995 patent/US11770582B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004007648A (ja) * | 2002-05-06 | 2004-01-08 | Sony Corp | 映像音声データ記録装置、映像音声データ記録方法、映像音声データ再生装置、並びに、映像音声データ再生方法 |
JP2006521064A (ja) * | 2003-03-17 | 2006-09-14 | クゥアルコム・インコーポレイテッド | ワイヤレスマルチメディア通信用の部分フレームエンコーディングシステムおよび方法 |
JP2005051307A (ja) * | 2003-07-29 | 2005-02-24 | Kyocera Corp | データ編集装置およびデータ編集方法 |
JP2007184913A (ja) * | 2005-12-30 | 2007-07-19 | Sharp Corp | 無線ビデオ送信システム |
US20130208811A1 (en) * | 2007-06-29 | 2013-08-15 | Cisco Technology, Inc. | Expedited splicing of video streams |
JP2016136256A (ja) * | 2010-12-03 | 2016-07-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数のメディア処理ノードによる適応処理 |
JP2017508375A (ja) * | 2014-02-10 | 2017-03-23 | ドルビー・インターナショナル・アーベー | 完璧な接合のためのトランスポート・ストリームへのエンコードされたオーディオの埋め込み |
JP2017520954A (ja) * | 2014-05-09 | 2017-07-27 | ティーキューティーブイディー ソフトウェア エルティーディーエーTqtvd Software Ltda | Mpeg−2プライベートセクションで視聴覚コンテンツストリームをカプセル化するための方法、mpeg−2トランスポートストリームで多重送信されるようにmpeg−2プライベートセクションで視聴覚コンテンツをカプセル化するためのデバイス、デジタルtv用対話型アプリケーション、ユーザデバイス、視聴覚コンテンツおよび/またはデータを伝送するための方法、ならびにデータネットワーク用通信プロトコル |
WO2017138387A1 (ja) * | 2016-02-12 | 2017-08-17 | ソニー株式会社 | 情報処理装置および情報処理方法 |
JP2017195755A (ja) * | 2016-04-14 | 2017-10-26 | 株式会社ユピテル | 装置、車載機器およびシステム |
Also Published As
Publication number | Publication date |
---|---|
EP3815387A1 (en) | 2021-05-05 |
US20220286730A1 (en) | 2022-09-08 |
CN115802046A (zh) | 2023-03-14 |
JP7171772B2 (ja) | 2022-11-15 |
WO2020006250A1 (en) | 2020-01-02 |
US11770582B2 (en) | 2023-09-26 |
KR102406318B1 (ko) | 2022-06-10 |
US20210258632A1 (en) | 2021-08-19 |
CN112369042B (zh) | 2022-12-09 |
US11368747B2 (en) | 2022-06-21 |
CN112369042A (zh) | 2021-02-12 |
KR20210024131A (ko) | 2021-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7171772B2 (ja) | 適応的なストリーミング整列のためのフレーム変換 | |
EP3149955B1 (en) | Data processor and transport of user control data to audio decoders and renderers | |
CN105981397B (zh) | 将编码音频嵌入到传输流中以供用于完美拼接 | |
US20150215679A1 (en) | Method for transmitting/receiving internet-based content and transmitter/receiver using same | |
AU2011240024B2 (en) | Method and encoder and decoder for gap - less playback of an audio signal | |
KR101789633B1 (ko) | 인터넷 기반 컨텐츠 송수신 방법 및 그를 이용한 송수신장치 | |
KR101842201B1 (ko) | 인터넷 기반 컨텐츠 송수신 방법 및 그를 이용한 송수신 장치 | |
US20210335376A1 (en) | Methods, apparatus and systems for generation, transportation and processing of immediate playout frames (ipfs) | |
US9854019B2 (en) | Method and apparatus for modifying a stream of digital content | |
US20150373076A1 (en) | Method for transmitting/receiving internet-based content and transmitter/receiver using same | |
US20150350282A1 (en) | Method for transmission/reception of internet-based content and transmitter/receiver using same | |
JP2019220974A (ja) | 復号装置 | |
US10554711B2 (en) | Packet placement for scalable video coding schemes | |
US10700799B2 (en) | Method and apparatus for broadcast signal transmission | |
JP2005347787A (ja) | 情報記録装置及び情報記録方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7171772 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |