JP7549581B2 - 最適なマルチコーデックabrラダー設計 - Google Patents
最適なマルチコーデックabrラダー設計 Download PDFInfo
- Publication number
- JP7549581B2 JP7549581B2 JP2021541591A JP2021541591A JP7549581B2 JP 7549581 B2 JP7549581 B2 JP 7549581B2 JP 2021541591 A JP2021541591 A JP 2021541591A JP 2021541591 A JP2021541591 A JP 2021541591A JP 7549581 B2 JP7549581 B2 JP 7549581B2
- Authority
- JP
- Japan
- Prior art keywords
- codec
- quality
- encoding
- stream
- ladder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013461 design Methods 0.000 title description 3
- 230000006870 function Effects 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 51
- 238000009826 distribution Methods 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 27
- 230000015654 memory Effects 0.000 claims description 8
- 238000012804 iterative process Methods 0.000 claims description 5
- 239000000523 sample Substances 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 11
- 238000001914 filtration Methods 0.000 description 7
- 230000009977 dual effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003936 working memory Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/164—Feedback from the receiver or from the transmission channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/179—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
- H04N19/197—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
- H04N19/198—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
次に、本明細書の一部をなす添付の図面を参照しながら、いくつかの例示的な実施形態について説明する。本開示の1つ又は複数の態様が実施され得る特定の実施形態が以下に記載されているが、本開示の範囲又は添付の特許請求の範囲の趣旨から逸脱することなく、他の実施形態が使用されてもよく、様々な変更がなされてもよい。
第1に、ラダーを別々に生成することにより、各コーデックに関連するABRエンコーディングラダーに割り当てられるレンディションの数の間における適切なバランスを見出すための手段がないことがある。したがって、エンコーダ120は、一群の視聴者にわたるこのようなコーデックの使用状況が異なり得るという事実を考慮することなく、各コーデックに必要と思われる数のレンディションを生成し得る。例えば、HEVCエンコードされたビデオをサポートするストリーミングクライアント150の数は、H.264をサポートするストリーミングクライアント150の数よりもはるかに少ない場合がある。また、生成され得るレンディションの数に一定の総予算が設けられているABRストリーミングシステム100では、H.264に多く割り当てることは、エンドユーザに配信される総品質により大きな全体的な影響を与える場合がある。
(R0,Q0)=(0,0) (5)
により拡張され得る。
実際には、このような帯域幅密度関数p(R)は、デバイス又はデバイスのそれぞれのアクセスネットワークが異なれば異なり得る。例えば、4G/ロングタームエボリューション(LTE)ネットワークを介して接続されたモバイルクライアントを考えると、LTEを介するTCPトラフィックの既知のスループット測定値が使用され得る。より一般的には、このような分布は、各特定のストリーミングデプロイメントを考慮して実験的に測定することができ、そして当然のことながら、デバイス、CDN、配信領域などが異なれば異なり得る。
したがって、各デコーダがそれぞれ実現する品質は、
図4Bは、デュアルコーデックデコーダ350による選択された品質を図4Aのグラフに重ねて示している。これから分かるように、デュアルコーデックデコーダ350による選択された品質は、各レートにおいて利用可能な最高の品質を選ぶH.264及びHEVCのデコーダの両方のステップと部分的に一致する。両方のコーデックを交互に用い、合計7つのステップとなる。これにより、デュアルコーデックデコーダ/クライアントは、変化するネットワークの帯域幅に一層正確に適応することができ、よって、デコーダがH.264又はHEVCのストリームとのみ連携するよりも、より良好なネットワーク利用率を実現することができる。ただし、重要なことに、デュアルコーデックデコーダはまた、品質が向上しないために切り替える意味がないポイントを省略することもできる。例えば、(459kbpsのHEVCよりも低い品質を有する)595kbpsのH.264のポイントを使う代わりに、デュアルコーデックデコーダは459kbpsのHEVCに留まる。
・ラダーポイントの総数n、
・すべてのレートポイントの限度:Rmin、Rmax、
・最初のレートポイントの最大限度:
・コーデック及びコンテンツの両方に対する品質レート関数Q1(R)、Q2(R)、
・ネットワーク帯域幅密度p(R)、及び
・クライアントの分布π
を所与のものとして、
・
並びに
・ラダーレート
を見つける。ただし、ストリーミングシステムによって与えられる品質全体
及びストリーミングシステムが提供するパフォーマンス全体が最大になるような、ラダーレート
1)マルチコーデックABRラダーで使用されるストリームの総数nを選択する。
a)そのような数がn1+・・・+nk=nを満たし、
b)このような数の一部が、実際には0に設定され得、所与のコンテンツ、コーデック、クライアント、ネットワーク、及び他の制約において、一部のコーデックを使用しても何の利点ももたらさないことを示唆する。
b)ネットワーク帯域幅分布p(R)によって取得されたネットワークの特性、
c)クライアントのデコード及び切り替えの能力と、クライアントの分布π、並びに
d)ビットレートの範囲に関する制約など、オペレータが定義する更なる制約。
p(R)=αf(R,σ1)+(1-α)f(R,σ2) (34)
・最小ビットレートの限度:rmin=50[kbps]、
・最大ビットレートの限度:rmax=10000[kbps]、及び
・最初のストリームの最大ビットレートの限度:
及びクライアントのすべての種類及び全体で実現可能な品質ギャップξについて報告される。
ここでもこの最適化技法の威力が実証され、H.264ベースラインプロファイルを別個のコーデックとして扱うことが、マルチコーデックのユースケースにおける最終的なプロファイルの構造及び形状に対して大きな影響を与えることを示している。
図14は、一実施形態による、本明細書で説明される方法を用いてマルチコーデックABRラダー生成を組み込んだマルチコーデックABRストリーミングシステム1400のブロック図である。分かるように、図14に示す構成要素は、図1のABRストリーミングシステム100に対応し得る。図14は、マルチコーデックエンコーディングラダーの決定及びストリーミングに使用される構成要素に関する更なる詳細を含む。更に、図1と同様に、実施形態は、任意の数の個々の構成要素を有していてもよく、これらの構成要素は、様々な地理的位置に分散されてもよく、及び/又は任意の数のコンピュータ(例えば、コンピュータサーバ)によって実行されてもよい。
・複数のコーデックでエンコードされたストリームを含む出力マニフェスト1415を生成するマルチコーデックABRプロファイルジェネレータ1410、
・マルチコーデックABRプロファイルジェネレータ1410の出力をフィルタリングし、システム内のクライアント1435のそれぞれの能力に合わせてラダーをカスタマイズする(具体的には、フィルタリングプロセスは、シングルコーデックを使用してエンコードされたストリームのみを残してもよいし、複数のコーデックでエンコードされたストリームの組み合わせを残してもよく、それらのビットレートソートされたシーケンスも、品質レベルが単調増加するシーケンスを生成する)マニフェストフィルタリング/ジェネレーションロジック1440、
・クライアント1435の種類を特定し、検出されたクライアント1435の種類に対して1445がフィルタリング/生成されたマニフェストを選択するデバイス検出1455、及び
・その後に、フィルタリングされたマニフェストに記述されているコンテンツを受信して再生するクライアント1435。
若しくは
又はこれらの任意の組み合わせは、それぞれがSSIM値、PSNR値、MS-SSIM値、又はVNAF値を含み得る。
Claims (20)
- マルチコーデックエンコーディングラダーを作成するための方法であって、
コンピュータシステムによって、ビデオを含むソースコンテンツを取得するステップと、
前記ソースコンテンツのためのエンコーディングラダーを生成するステップであって、
前記エンコーディングラダーによって定義される複数のビデオストリームの各ビデオストリームが、前記ソースコンテンツをエンコードするための個々のビットレート及び複数の種類のコーデックからの個々のコーデックを含み、
前記エンコーディングラダーが、
及び
の個々のビットレート並びに
及び
の個々の品質値を有する、第1のコーデックからの第1のビデオストリーム及び第2のビデオストリームと、
ここで、記号RおよびQの各々に関して、下付き添え字1は、前記第1のコーデックを示し、上付き添え字1は、前記第1のコーデックの最初のストリームを示し、上付き添え字2は、前記第1のコーデックの2番目のストリームを示しており、
のビットレート及び
の品質値を有する、第2のコーデックからの第3のビデオストリームと
を含み、
ここで、記号RおよびQの各々に関して、下付き添え字2は、前記第2のコーデックを示し、上付き添え字1は、前記第2のコーデックの最初のストリームを示しており、
且つ
である、前記生成するステップとを含む、方法。 - 前記複数の種類のコーデックの各コーデックについて、前記ソースコンテンツのビットレートと品質値との間の関係を示す、前記ソースコンテンツのための前記個々のコーデックの品質レート関数を取得することを更に含み、
前記ソースコンテンツのための前記エンコーディングラダーを生成することが、前記個々のコーデックの前記品質レート関数に基づき、
及び
が前記第1のコーデックの前記品質レート関数を用いて決定され、
が前記第2のコーデックの前記品質レート関数を用いて決定される、請求項1に記載の方法。 - 前記複数の種類のコーデックの各コーデックの前記品質レート関数が、前記複数の種類のコーデックの各コーデックにおける前記ソースコンテンツの1つ又は複数のプローブエンコーディングから決定される、請求項2に記載の方法。
- 前記エンコーディングラダーが、
ネットワーク帯域幅分布と、
前記エンコーディングラダーを用いて前記ソースコンテンツがエンコードされると、前記ソースコンテンツをストリーミングすることができるクライアントの分布であって、クライアントの前記分布が、前記第1のコーデックと前記第2のコーデックとの間で切り替えを行うことができるクライアントを含む、前記クライアントの分布と
に更に基づく、請求項2に記載の方法。 - 前記エンコーディングラダーを生成することが、反復プロセスを用いて前記複数のビデオストリームを決定することを含み、前記反復プロセスにおいて、初期の数が選択され、
(1)前記選択された数に対するフィギュアオブメリット関数を決定するステップと、
(2)次の反復のために、前記選択された数の値を増やすステップと
が、前記フィギュアオブメリット関数が最大値に到達するまで、繰り返される、請求項4に記載の方法。 - 前記フィギュアオブメリット関数が、
前記複数の種類のコーデックの各コーデックの前記品質レート関数、
前記ネットワーク帯域幅分布、若しくは
クライアントタイプの前記分布、又は
これらの任意の組み合わせ
に基づく、請求項5に記載の方法。 - 前記ネットワーク帯域幅分布が、
デバイスタイプ、
コンテンツ配信ネットワーク(CDN)、若しくは
配信領域、又は
これらの任意の組み合わせ
に関する収集された帯域幅統計値に基づいて決定された確率密度関数を含む、請求項4に記載の方法。 - 前記複数のビデオストリームの各ビデオストリームの前記ビットレート及び対応する品質値が、前記エンコーディングラダー内で単調増加する、請求項1に記載の方法。
-
、
、
若しくは
、
又はこれらの任意の組み合わせが、
構造的類似性指数指標(SSIM)値、
ピーク信号対雑音比(PSNR)値、
マルチスケールSSIM(MS-SSIM)値、又は
ビデオマルチメソッドアセスメントフュージョン(VMAF)値
をそれぞれ含む、請求項1に記載の方法。 - 前記エンコーディングラダーの各ストリームについて、
前記それぞれのストリームの前記コーデック及び前記ビットレートを用いて前記ソースコンテンツをエンコードすることにより、それぞれのエンコードされたコンテンツを作成するステップと、
それぞれのエンコードされたコンテンツを格納するステップと
を更に含む、請求項1に記載の方法。 - マルチコーデックエンコーディングラダーを作成するためのコンピュータシステムであって、
メモリと、
前記メモリに通信可能に結合された1つ又は複数の処理ユニットとを備え、前記1つ又は複数の処理ユニットが、
ビデオを含むソースコンテンツを取得し、
前記ソースコンテンツのためのエンコーディングラダーを生成し、
前記エンコーディングラダーによって定義される複数のビデオストリームの各ビデオストリームが、前記ソースコンテンツをエンコードするための個々のビットレート及び複数の種類のコーデックからの個々のコーデックを含み、
前記エンコーディングラダーが、
及び
の個々のビットレート並びに
及び
の個々の品質値を有する、第1のコーデックからの第1のビデオストリーム及び第2のビデオストリームと、
ここで、記号RおよびQの各々に関して、下付き添え字1は、前記第1のコーデックを示し、上付き添え字1は、前記第1のコーデックの最初のストリームを示し、上付き添え字2は、前記第1のコーデックの2番目のストリームを示しており、
のビットレート及び
の品質値を有する、第2のコーデックからの第3のビデオストリームと
を含み、
ここで、記号RおよびQの各々に関して、下付き添え字2は、前記第2のコーデックを示し、上付き添え字1は、前記第2のコーデックの最初のストリームを示しており、
且つ
であるように構成される、コンピュータシステム。 - 前記1つ又は複数の処理ユニットが、
前記複数の種類のコーデックの各コーデックについて、前記ソースコンテンツのビットレートと品質値との間の関係を示す、前記ソースコンテンツのための前記個々のコーデックの品質レート関数を取得し、
前記個々のコーデックの前記品質レート関数に基づいて、前記ソースコンテンツのための前記エンコーディングラダーを生成し、
前記第1のコーデックの前記品質レート関数を用いて
及び
を決定し、
前記第2のコーデックの前記品質レート関数を用いて
を決定する、
ように更に構成される、請求項11に記載のコンピュータシステム。 - 前記1つ又は複数の処理ユニットが、前記複数の種類のコーデックの各コーデックにおける前記ソースコンテンツの1つ又は複数のプローブエンコーディングから、前記複数の種類のコーデックの各コーデックの前記品質レート関数を決定するように更に構成される、請求項12に記載のコンピュータシステム。
- 前記1つ又は複数の処理ユニットが、
ネットワーク帯域幅分布と、
前記エンコーディングラダーを用いて前記ソースコンテンツがエンコードされると、前記ソースコンテンツをストリーミングすることができるクライアントの分布であって、クライアントの前記分布が、前記第1のコーデックと前記第2のコーデックとの間で切り替えを行うことができるクライアントを含む、前記クライアントの分布と
に更に基づいて、ソースのための前記エンコーディングラダーを生成するように更に構成される、請求項12に記載のコンピュータシステム。 - 前記エンコーディングラダーを生成するために、前記1つ又は複数の処理ユニットが、反復プロセスを用いて前記複数のビデオストリームを決定するように構成され、前記反復プロセスにおいて、初期の数が選択され、
(1)前記選択された数に対するフィギュアオブメリット関数を決定するステップと、
(2)次の反復のために、前記選択された数の値を増やすステップと
が、前記フィギュアオブメリット関数が最大値に到達するまで、繰り返される、請求項14に記載のコンピュータシステム。 - 前記フィギュアオブメリット関数が、
前記複数の種類のコーデックの各コーデックの前記品質レート関数、
前記ネットワーク帯域幅分布、若しくは
クライアントタイプの前記分布、又は
これらの任意の組み合わせ
に基づくように前記1つ又は複数の処理ユニットが更に構成される、請求項15に記載のコンピュータシステム。 - 前記1つ又は複数の処理ユニットが、
デバイスタイプ、
コンテンツ配信ネットワーク(CDN)、若しくは
配信領域、又は
これらの任意の組み合わせ
に関する収集された帯域幅統計値に基づいて前記ネットワーク帯域幅分布を決定するように更に構成される、請求項14に記載のコンピュータシステム。 - 前記1つ又は複数の処理ユニットが、前記複数のビデオストリームの各ビデオストリームのビットレート及び対応する品質値が前記エンコーディングラダー内で単調増加するように、ソースのための前記エンコーディングラダーを生成するように構成される、請求項11に記載のコンピュータシステム。
- 前記1つ又は複数の処理ユニットが、
構造的類似性指標(SSIM)値、
ピーク信号対雑音比(PSNR値)、
マルチスケールSSIM(MS-SSIM)値、又は
ビデオマルチメソッドアセスメントフュージョン(VMAF)値
に基づいて、
、
、
若しくは
、
又はこれらの任意の組み合わせを決定するように構成される、請求項11に記載のコンピュータシステム。 - マルチコーデックエンコーディングラダーを作成するための命令を内部に格納した非一時的コンピュータ可読媒体であって、前記命令が、1つ又は複数の処理ユニットによって実行されると、前記1つ又は複数の処理ユニットに、
ビデオを含むソースコンテンツを取得させ、
前記ソースコンテンツのためのエンコーディングラダーを生成させ、
前記エンコーディングラダーによって定義される複数のビデオストリームの各ビデオストリームが、前記ソースコンテンツをエンコードするための個々のビットレート及び複数の種類のコーデックからの個々のコーデックを含み、
前記エンコーディングラダーが、
及び
の個々のビットレート並びに
及び
の個々の品質値を有する、第1のコーデックからの第1のビデオストリーム及び第2のビデオストリームと、
ここで、記号RおよびQの各々に関して、下付き添え字1は、前記第1のコーデックを示し、上付き添え字1は、前記第1のコーデックの最初のストリームを示し、上付き添え字2は、前記第1のコーデックの2番目のストリームを示しており、
のビットレート及び
の品質値を有する、第2のコーデックからの第3のビデオストリームと
を含み、
ここで、記号RおよびQの各々に関して、下付き添え字2は、前記第2のコーデックを示し、上付き添え字1は、前記第2のコーデックの最初のストリームを示しており、
且つ
である、非一時的コンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962793577P | 2019-01-17 | 2019-01-17 | |
US62/793,577 | 2019-01-17 | ||
PCT/US2020/014169 WO2020150654A1 (en) | 2019-01-17 | 2020-01-17 | Optimal multi-codec abr ladder design |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022518234A JP2022518234A (ja) | 2022-03-14 |
JP7549581B2 true JP7549581B2 (ja) | 2024-09-11 |
Family
ID=71609289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021541591A Active JP7549581B2 (ja) | 2019-01-17 | 2020-01-17 | 最適なマルチコーデックabrラダー設計 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11153582B2 (ja) |
JP (1) | JP7549581B2 (ja) |
AU (1) | AU2020208640A1 (ja) |
CA (1) | CA3125632A1 (ja) |
GB (1) | GB2599206B (ja) |
WO (1) | WO2020150654A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11272192B2 (en) * | 2019-03-04 | 2022-03-08 | Comcast Cable Communications, Llc | Scene classification and learning for video compression |
FR3106029A1 (fr) * | 2020-01-02 | 2021-07-09 | Orange | Procédé de gestion d’un téléchargement progressif et adaptatif d’un contenu numérique par un terminal lecteur de flux multimédia connecté à un réseau de communication, dispositif de gestion, terminal lecteur de flux multimédia et programme d’ordinateur correspondants. |
US11425184B2 (en) * | 2020-04-21 | 2022-08-23 | Google Llc | Initial bitrate for real time communication |
US11277620B1 (en) * | 2020-10-30 | 2022-03-15 | Hulu, LLC | Adaptive transcoding of profile ladder for videos |
US11665374B1 (en) * | 2021-08-02 | 2023-05-30 | Amazon Technologies, Inc. | Dynamic compute allocation in multiple-bitrate live video |
US11616993B1 (en) * | 2021-10-22 | 2023-03-28 | Hulu, LLC | Dyanamic parameter adjustment for adaptive bitrate algorithm |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130268961A1 (en) | 2012-04-06 | 2013-10-10 | Wilfred Jaime Miles | Variability in available levels of quality of encoded content |
JP2018513604A (ja) | 2015-03-30 | 2018-05-24 | ネットフリックス・インコーポレイテッドNetflix, Inc. | 符号化中にビットレートおよび解像度を最適化する技術 |
WO2018102756A2 (en) | 2016-12-01 | 2018-06-07 | Brightcove, Inc. | Optimization of encoding profiles for media streaming |
WO2018156997A1 (en) | 2017-02-23 | 2018-08-30 | Netflix, Inc. | Iterative techniques for encoding video content |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5506844A (en) * | 1994-05-20 | 1996-04-09 | Compression Labs, Inc. | Method for configuring a statistical multiplexer to dynamically allocate communication channel bandwidth |
US6002802A (en) * | 1995-10-27 | 1999-12-14 | Kabushiki Kaisha Toshiba | Video encoding and decoding apparatus |
AU4338800A (en) * | 1999-12-22 | 2001-07-03 | General Instrument Corporation | Video compression for multicast environments using spatial scalability and simulcast coding |
US6810083B2 (en) * | 2001-11-16 | 2004-10-26 | Koninklijke Philips Electronics N.V. | Method and system for estimating objective quality of compressed video data |
US7092448B2 (en) * | 2002-05-24 | 2006-08-15 | Koninklijke Philips Electronics N.V. | Method and system for estimating no-reference objective quality of video data |
US7352809B2 (en) * | 2003-02-21 | 2008-04-01 | Polycom, Inc. | System and method for optimal transmission of a multitude of video pictures to one or more destinations |
NO320115B1 (no) * | 2004-02-13 | 2005-10-24 | Tandberg Telecom As | Anordning og fremgangsmate for a generere CP-bilder. |
TWI364220B (en) * | 2008-08-15 | 2012-05-11 | Acer Inc | A video processing method and a video system |
US8238444B2 (en) * | 2009-12-15 | 2012-08-07 | National Taiwan University | Perceptual-based video coding method |
US8537900B2 (en) * | 2010-10-04 | 2013-09-17 | Vidyo, Inc. | Automatic temporal layer bit allocation |
US9246842B2 (en) * | 2012-04-27 | 2016-01-26 | Intel Corporation | QoE-aware radio access network architecture for http-based video streaming |
CN114422833A (zh) * | 2012-07-10 | 2022-04-29 | Vid拓展公司 | 由无线发射/接收单元执行的方法及无线发射/接收单元 |
US9510006B2 (en) * | 2013-05-03 | 2016-11-29 | Empire Technology Development Llc | Scalable video coding prioritization |
TW201517631A (zh) * | 2013-08-29 | 2015-05-01 | Vid Scale Inc | 使用者適應視訊電話 |
US9591316B2 (en) * | 2014-03-27 | 2017-03-07 | Intel IP Corporation | Scalable video encoding rate adaptation based on perceived quality |
US9894130B2 (en) * | 2014-09-23 | 2018-02-13 | Intel Corporation | Video quality enhancement |
KR101832418B1 (ko) * | 2015-12-31 | 2018-02-26 | 네이버 주식회사 | 이미지 압축 품질을 최적화 하기 위한 방법 및 시스템 |
WO2017123071A1 (en) * | 2016-01-14 | 2017-07-20 | Samsung Electronics Co., Ltd. | A mobile device and a method for texture memory optimization thereof |
EP3495994A1 (en) * | 2017-12-05 | 2019-06-12 | Tata Consultancy Services Limited | Face video based heart rate monitoring using pulse signal modelling and tracking |
US11064203B2 (en) * | 2018-03-12 | 2021-07-13 | Nvidia Corporation | SSIM-based rate distortion optimization for improved video perceptual quality |
-
2020
- 2020-01-17 JP JP2021541591A patent/JP7549581B2/ja active Active
- 2020-01-17 AU AU2020208640A patent/AU2020208640A1/en active Pending
- 2020-01-17 GB GB2110773.5A patent/GB2599206B/en active Active
- 2020-01-17 CA CA3125632A patent/CA3125632A1/en active Pending
- 2020-01-17 US US16/746,641 patent/US11153582B2/en active Active
- 2020-01-17 WO PCT/US2020/014169 patent/WO2020150654A1/en active Application Filing
-
2021
- 2021-10-12 US US17/499,739 patent/US11706427B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130268961A1 (en) | 2012-04-06 | 2013-10-10 | Wilfred Jaime Miles | Variability in available levels of quality of encoded content |
JP2018513604A (ja) | 2015-03-30 | 2018-05-24 | ネットフリックス・インコーポレイテッドNetflix, Inc. | 符号化中にビットレートおよび解像度を最適化する技術 |
WO2018102756A2 (en) | 2016-12-01 | 2018-06-07 | Brightcove, Inc. | Optimization of encoding profiles for media streaming |
WO2018156997A1 (en) | 2017-02-23 | 2018-08-30 | Netflix, Inc. | Iterative techniques for encoding video content |
Also Published As
Publication number | Publication date |
---|---|
US11153582B2 (en) | 2021-10-19 |
GB2599206B (en) | 2023-05-10 |
GB202110773D0 (en) | 2021-09-08 |
US20200236372A1 (en) | 2020-07-23 |
CA3125632A1 (en) | 2020-07-23 |
JP2022518234A (ja) | 2022-03-14 |
WO2020150654A1 (en) | 2020-07-23 |
GB2599206A (en) | 2022-03-30 |
US11706427B2 (en) | 2023-07-18 |
US20220070479A1 (en) | 2022-03-03 |
AU2020208640A1 (en) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7549581B2 (ja) | 最適なマルチコーデックabrラダー設計 | |
JP6469788B2 (ja) | メディアコンテンツの適応型ストリーミングのための品質情報の使用 | |
CN110447225B (zh) | 视频编解码变换 | |
TWI511544B (zh) | 用於可調適視訊串流之技術 | |
US9357248B2 (en) | Method and apparatus for adaptive bit rate content delivery | |
KR101657073B1 (ko) | 완만한 품질 전이를 가능하게 하는 적응형 스트리밍 인식 노드, 인코더 및 클라이언트 | |
JP6881819B2 (ja) | ビデオトランスコーディング方法、コンピューター機器、及び記憶媒体 | |
US10148990B2 (en) | Video streaming resource optimization | |
US11477461B2 (en) | Optimized multipass encoding | |
CN110049336A (zh) | 视频编码方法和视频解码方法 | |
CN107005700B (zh) | 用于组成中间视频表示的方法 | |
KR101583896B1 (ko) | 비디오 부호화 방법 및 장치 | |
Zakerinasab et al. | Dependency-aware distributed video transcoding in the cloud | |
US11546401B2 (en) | Fast multi-rate encoding for adaptive HTTP streaming | |
EP3058658B1 (en) | Cloud encoding system | |
JP6613720B2 (ja) | 画像処理装置、プログラム及び方法 | |
Kobayashi et al. | A real-time 4K HEVC multi-channel encoding system with content-aware bitrate control | |
US9253484B2 (en) | Key frame aligned transcoding using statistics file | |
JP7310212B2 (ja) | データ中継装置、データ中継方法及びプログラム | |
CN113949871A (zh) | 一种视频编码方法及装置 | |
US9854260B2 (en) | Key frame aligned transcoding using key frame list file | |
Zhang | Heterogeneous MDFEC-coded video multicast | |
Langroodi et al. | Complexity constrained layering of broadcast video for heterogeneous mobile receivers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240716 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240830 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7549581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |