JP2015222997A - ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化 - Google Patents
ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化 Download PDFInfo
- Publication number
- JP2015222997A JP2015222997A JP2015177595A JP2015177595A JP2015222997A JP 2015222997 A JP2015222997 A JP 2015222997A JP 2015177595 A JP2015177595 A JP 2015177595A JP 2015177595 A JP2015177595 A JP 2015177595A JP 2015222997 A JP2015222997 A JP 2015222997A
- Authority
- JP
- Japan
- Prior art keywords
- video
- encoding
- input video
- vdl
- bit rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1887—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a variable length codeword
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/156—Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
- H04N19/194—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【解決手段】入力ビデオの全体VDL、時間VDL、および空間VDLを取得し、基準全体VDL、基準時間VDL、および基準空間VDLと比較する。比較に基づいて、入力ビデオを符号化するビットレートと、入力ビデオの全体符号化複雑性、時間符号化複雑性、および空間符号化複雑性とを調整する。
【選択図】図1
Description
図1は、レート−歪み−複雑性(RDC)に基づくビデオ符号化システム102を有するビデオ・ホスティング・サービス100のシステムの図を示すブロック図である。複数のユーザ/視聴者が、クライアント110A〜Nを使用して、ビデオ・ホスティング・ウェブサイトにビデオをアップロードするなど、ビデオ・ホスティング・サービス100にビデオ・ホスティングの要求を送信し、要求されたサービスをビデオ・ホスティング・サービス100から受け取る。ビデオ・ホスティング・サービス100は、ネットワーク130を介して1つまたは複数のクライアント100A〜Nと通信する。ビデオ・ホスティング・サービス100は、クライアント100A〜Nからビデオ・ホスティング・サービスの要求を受信し、RDCに基づくビデオ符号化システム102によってソース・ビデオをコード変換し、コード変換されたビデオをクライアント110A〜Nに返す。ビデオ・ホスティング・サービス100は、クラウド・コンピューティング・ネットワーク内に存在する可能性がある。
CRF符号化ストラテジは、固定レート因子を用いてビデオの符号化の一定の視覚的品質を実現することを狙っている。概して、ビデオのために選択されたCRFは、1符号化パスでビデオを符号化するための所望の視覚的品質のレベルを示す。ビデオを符号化するための大きなCRF値は、大きな量子化パラメータ(「QP」)、高い圧縮比、およびひいては低い視覚的品質をもたらす。小さなCRFは、小さなQP、低い圧縮比、およびひいては高い視覚的品質をもたらす。CRF値ゼロは、可逆圧縮、およびひいては最高の視覚的品質を意味する。CRF符号化は、ビデオ・フレームにおける動きの量にしたがってQPを動的に調整することによってビデオの異なるフレームを異なるように圧縮する。
ここで、Bは、平均ビットレート、Mは、ビデオのフレームの輝度成分(luminance component)の画素数、すなわち、空間解像であり、Tは、1秒あたりのフレーム数、すなわち、時間解像度である。パラメータcrf、M、およびTは互いにほぼ独立であるので、式(1)に示された平均ビットレート、以下のように表される可能性がある。
CRF基準ビットレート・モデル220は、当てはまるサンプルを、最小自乗法によって発見される4つ組み(crf,M,T,B)として表す。
ここで、パラメータaは、空間分解能およびCRFからの影響を含む。
図7は、固定のフレーム・レート(すなわち、fps=25)でのCRF基準ビットレート・モデル220の例示的な訓練結果を示す。図7に示された訓練結果は、平均ビットレートが、CRF値および平均ビットレートを固定するとき、空間解像度の近似的なべき関数であり、空間解像度を固定するとき、CRFの近似的な指数関数であることをさらに示す。フレーム・レートがfps=25以外であるとき、モデルは、fps/25倍に増減される可能性がある。CRF基準ビットレート・モデル220を訓練する1つの実施形態は、フレーム・レートfps=25を使用することである。
y=b×xc (8)
ここで、各CRF値に対して0<c<1である。機能y=b×xcは、座標系の原点を通り、このことは、空間解像度をゼロにすると、ビットレートがゼロになることを示唆する。0<c<1は、ビットレートと空間解像度との間の単調増加関係を示し、平均ビットレートは、空間解像度の高いビデオほど動き推定の効果の高いイントラ予測およびインター予測を有するので、空間解像度よりも増加率が低い。1実施形態において、パラメータcは、トレーニング・サンプルに当てはめるとき、平均が0.65になる。各CRF値に対するパラメータbは、式(8)に示されたべき関数を使用して平均ビットレートと空間解像度との間のマッピングをモデル化することにより得られる可能性がある。
y=m×enx (9)
式(9)をモデル化するために、パラメータmは、1380に設定され、パラメータnは、−0.20に設定される。当てはめ誤差(fitting error)は、SSE=540.3およびRMSE=7.351によって評価される。式(4)で示された平均ビットレートBおよびCRFの関係(crf,M,T,B)は、以下の式(10)によって表され得る。
したがって、CRFは、以下の式(12)を使用してビットレートBから得られる可能性がある。
入力ビデオを訓練されたCRF基準ビットレート・モデル220から得られたCRFによって符号化するために、入力ビデオを符号化することによる実際のビットレートは、入力ビデオに関連する目標のビットレートからずれる可能性がある。CRFと実際のビットレートとの間の改訂されたCRFビットレート・モデルが、入力ビデオを符号化するための目標のビットレートに向かって実際のビットレートを調整するために必要とされる。1実施形態において、RDCに基づくビデオ・コード変換モジュール400は、改訂されたCRFビットレート・モデル410を使用して、入力ビデオを符号化するためのCRF値を適合させる。改訂されたCRFビットレート・モデル410は、以下の式(15)を使用して改訂され得る。
ここで、kは、符号化されるべき入力ビデオに関連する改訂因子(revising factor)である。
//*入力:未圧縮のビデオおよびその目標のビットレートBt
//*出力:ビデオの目標のビットレートの範囲内で一定の視覚的品質を持つ圧縮されたビデオ
1:パラメータBにBtを代入することによって式(12)のCRF基準ビットレート・モデル220からcrftを見つける
2:crftを用いてビデオを符号化し、実際のビットレートBaを得る
3:(crft、Ba)のペアによって式(15)の改訂されたCRFビットレート・モデル410を得る
4:BにBtを代入することによって式(15)の改訂されたCRFビットレート・モデルからcrfaを見つける
5:crfaを用いてビデオを符号化し、改訂された実際のビットレート
6:
ここに記載したアルゴリズムは、訓練され、改訂されたCRFビットレート・モデルから評価されたCRF値を用いるマルチパスCRF符号化の1種である。工程6の収束の基準は、実際のビットレート
ビデオ・シーケンスによって取り込まれたシーンの多様なコンテンツは、ビデオ・シーケンスに含まれる情報の多様な量につながる。ビデオ・ホスティング・サービスの大規模なビデオ・コーパスを考慮すると、異なるビデオコンテンツに同じ符号化ビットレートを適用することは、異なるビデオ品質をもたらす。さらに、ビデオ・ホスティング・サービス100は、ビデオ・ホスティング・サービス100にアップロードされるそれぞれのビデオのためにさまざまなビデオ出力フォーマットを提供する。異なる出力フォーマットは、目標の再生プラットフォーム(例えば、携帯電話および高精細度TV)、配信の制約(例えば、リアルタイム・ビデオ・ストリーミングおよびビデオ・オン・デマンド)、ならびにユーザの期待の点で異なるビデオ処理の目的を有する。
control_quality
control_quality_bounded_bitrate
control_bitrateストラテジは、ビデオの目標のビットレートに可能な限り近くビデオを符号化する実際のビットレートを実現することである。このビットレート制御ストラテジは、モバイル・ビデオ・ストリーミング、およびダイヤルアップ・インターネット接続を用いるビデオ・ストリーミングに好適である。
中:ほとんどのビットレート制御ストラテジおよび出力フォーマットに好適である符号化時間対符号化効率の釣り合いを提供する。
1:すべてのあり得る{ecp0、ecp1}ペアおよび異なる目標のビットレートで、control_bitrateストラテジを使用して訓練ビデオを符号化する。
2:訓練から{R、D、C}性能サンプルを得る。
3:訓練ビデオの各{ecp0、ecp1}ペアに関してR上で歪みDおよび計算時間Cを滑らかに補完する。
4:{R、D、C}サンプルの中のパレート最適集合を見つけ、パレート集合を補間して区分的に連続な{R、D、C}面を得る。
5:計算時間Cを5つの一様な間隔の継続レベル(continuation level)に分割する。
6:レート値を選択し、選択されたビットレート値で5つの計算レベルのそれぞれに関してパレート最適な面上の{ecp0、ecp1}ペアを選択する。
7:ビデオに対する回帰試験によって最適化されたストラテジの効果を検証する。
最小限のコストで、許容可能な視覚的品質でソース・ビデオをコード変換することは、ソース・ビデオのビデオ符号化の複雑性を効果的に評価することを必要とする。ビデオのコード変換に与えるビデオコンテンツ複雑性の影響を無視することは、コード変換されたビデオの視覚的品質およびユーザ・エクスペリエンスを損なう。入力ビデオを符号化するためのビットレート情報はソース・ビデオのビデオコンテンツ複雑性を反映するので、特定の視覚的品質でビデオを符号化するためにどれだけのビットレートが必要とされるかについての情報は、ビデオ符号化の効率の最適化のために有用である。
全体VDL、
時間VDL、および
空間VDL
全体VDLは、ビデオが「CRF=26、複雑性=最速」で符号化されるときのビデオの実際のビットレートである。CRF値は、構成可能なパラメータであり、実験データは、ビデオがCRF符号化によりCRF=26で符号化されるときに良好な視覚的品質であることを示す。
例示的であるに過ぎず、必須ではなく、単一のシステムの構成要素によって実行される機能が、その代わりに複数の構成要素によって実行される可能性があり、複数の構成要素によって実行される機能が、その代わりに単一の構成要素によって実行される可能性がある。
Claims (20)
- 入力ビデオの符号化の最適化を行うためのコンピュータ・システムであって、
コンピュータ・プログラム命令を実行するためのコンピュータ・プロセッサと、
コンピュータ・プログラム命令を記憶する非一時的なコンピュータ可読記憶媒体と、を備え、該コンピュータ・プログラム命令は、
前記入力ビデオの全体ビデオ記述長(VDL)、時間VDL、および空間VDLを取得し、
前記入力ビデオの前記全体VDL、前記時間VDL、および前記空間VDLを、対応する基準全体VDL、基準時間VDL、および基準空間VDLと比較し、
前記比較に基づいて、前記入力ビデオを符号化するビットレートと、前記入力ビデオの全体符号化複雑性、時間符号化複雑性、および空間符号化複雑性とを調整するように実行可能であり、
前記入力ビデオの全体VDLは前記入力ビデオの全体的なコンテンツ複雑性を示し、前記入力ビデオの時間VDLは前記入力ビデオの時間的な符号化複雑性を示し、前記入力ビデオの空間VDLは前記入力ビデオの空間的な符号化複雑性を示す、システム。 - 前記入力ビデオの前記全体VDLが、所定の固定レート因子と計算複雑性レベルとにより符号化された前記入力ビデオの実際のビットレートによって表される、請求項1に記載のシステム。
- 前記入力ビデオの前記時間VDLが、所定の固定レート因子と計算複雑性レベルとによって符号化された前記入力ビデオの実際のビットレートと、同じ所定の固定レート因子と異なる計算複雑性レベルとによって符号化された前記入力ビデオの実際のビットレートとの間の差によって表される、請求項1に記載のシステム。
- 前記入力ビデオの前記空間VDLが、所定の固定レート因子と計算複雑性レベルとによって符号化された前記入力ビデオの実際のビットレートと、異なる所定の固定レート因子と同じ計算複雑性レベルとによって符号化された前記入力ビデオの実際のビットレートとの間の差によって表される、請求項1に記載のシステム。
- 前記基準全体VDL、前記基準時間VDL、および前記基準空間VDLが、動的な複雑性の参照テーブルまたは静的な複雑性の参照テーブルの少なくとも1つの行に由来する請求項1に記載のシステム。
- 前記入力ビデオの調整された符号化ビットレート、前記全体符号化複雑性、前記時間符号化複雑性、および前記空間符号化複雑性によって前記入力ビデオを符号化するための命令をさらに含む、請求項1に記載のシステム。
- 前記入力ビデオに関連する目標のビットレートに基づいて固定レート因子(CRF)基準ビットレート・モデルから得られたCRFによって前記入力ビデオを符号化し、
前記CRFによる前記入力ビデオの符号化から改訂因子を計算し、
前記改訂因子によって前記CRF基準ビットレート・モデルを修正し、
修正されたCRF基準ビットレート・モデルから得られたCRFによって前記入力ビデオを符号化するための命令をさらに含む、請求項6に記載のシステム。 - 前記CRF基準ビットレート・モデルが、複数のビデオに対するビデオ符号化の前記固定レート因子とレート−歪みの性能との間の関係をモデル化し、ビデオ符号化の前記レート−歪みの性能は、前記複数のビデオの符号化の平均ビットレートによって表され、
前記システムは、前記モデル化からビデオ符号化の固定レート因子と平均ビットレートとの間の1つまたは複数の関係を得るための命令をさらに含む、請求項7に記載のシステム。 - 入力ビデオの符号化の最適化を行うための方法であって、
前記入力ビデオの全体ビデオ記述長(VDL)、時間VDL、および空間VDLを取得する工程であって、前記入力ビデオの全体VDLは前記入力ビデオの全体的なコンテンツ複雑性を示し、前記入力ビデオの時間VDLは前記入力ビデオの時間的な符号化複雑性を示し、前記入力ビデオの空間VDLは前記入力ビデオの空間的な符号化複雑性を示す、工程と、
前記入力ビデオの前記全体VDL、前記時間VDL、および前記空間VDLを、対応する基準全体VDL、基準時間VDL、および基準空間VDLと比較する工程と、
前記比較に基づいて、前記入力ビデオを符号化するビットレートと、前記入力ビデオの全体符号化複雑性、時間符号化複雑性、および空間符号化複雑性とを調整する工程と、を備える方法。 - 前記入力ビデオの前記全体VDLが、所定の固定レート因子と計算複雑性レベルとにより符号化された前記入力ビデオの実際のビットレートによって表される、請求項9に記載の方法。
- 前記入力ビデオの前記時間VDLが、所定の固定レート因子と計算複雑性レベルとによって符号化された前記入力ビデオの実際のビットレートと、同じ所定の固定レート因子と異なる計算複雑性レベルとによって符号化された前記入力ビデオの実際のビットレートとの間の差によって表される、請求項9に記載の方法。
- 前記入力ビデオの前記空間VDLが、所定の固定レート因子と計算複雑性レベルとによって符号化された前記入力ビデオの実際のビットレートと、異なる所定の固定レート因子と同じ計算複雑性レベルとによって符号化された前記入力ビデオの実際のビットレートとの間の差によって表される、請求項9に記載の方法。
- 前記基準全体VDL、前記基準時間VDL、および前記基準空間VDLが、動的な複雑性の参照テーブルまたは静的な複雑性の参照テーブルの少なくとも1つの行に由来する請求項9に記載の方法。
- 前記入力ビデオの調整された符号化ビットレート、前記全体符号化複雑性、前記時間符号化複雑性、および前記空間符号化複雑性によって前記入力ビデオを符号化する工程をさらに備える、請求項9に記載の方法。
- 前記入力ビデオを符号化する工程は、
前記入力ビデオに関連する目標のビットレートに基づいて固定レート因子(CRF)基準ビットレート・モデルから得られたCRFによって前記入力ビデオを符号化することと、
前記CRFによる前記入力ビデオの符号化から改訂因子を計算することと、
前記改訂因子によって前記CRF基準ビットレート・モデルを修正することと、
修正されたCRF基準ビットレート・モデルから得られたCRFによって前記入力ビデオを符号化することとを含む、請求項14に記載の方法。 - 前記CRF基準ビットレート・モデルが、複数のビデオに対するビデオ符号化の前記固定レート因子とレート−歪みの性能との間の関係をモデル化し、ビデオ符号化の前記レート−歪みの性能は、前記複数のビデオの符号化の平均ビットレートによって表され、
前記方法は、前記モデル化からビデオ符号化の固定レート因子と平均ビットレートとの間の1つまたは複数の関係を得る工程をさらに備える、請求項15に記載の方法。 - 入力ビデオの符号化の最適化を行うための実行可能なコンピュータ・プログラム命令が記録されている非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ・プログラム命令が、
前記入力ビデオの全体ビデオ記述長(VDL)、時間VDL、および空間VDLを取得するための命令と、
前記入力ビデオの前記全体VDL、前記時間VDL、および前記空間VDLを、対応する基準全体VDL、基準時間VDL、および基準空間VDLと比較するための命令と、
前記比較に基づいて、前記入力ビデオを符号化するビットレートと、前記入力ビデオの全体符号化複雑性、時間符号化複雑性、および空間符号化複雑性とを調整するための命令と、を含み、
前記入力ビデオの全体VDLは前記入力ビデオの全体的なコンテンツ複雑性を示し、前記入力ビデオの時間VDLは前記入力ビデオの時間的な符号化複雑性を示し、前記入力ビデオの空間VDLは前記入力ビデオの空間的な符号化複雑性を示す、媒体。 - 前記入力ビデオの調整された符号化ビットレート、前記全体符号化複雑性、前記時間符号化複雑性、および前記空間符号化複雑性によって前記入力ビデオを符号化するための命令をさらに含む、請求項17に記載の媒体。
- 前記入力ビデオの調整された符号化ビットレート、前記全体符号化複雑性、前記時間符号化複雑性、および前記空間符号化複雑性によって前記入力ビデオを符号化するための前記命令は、
前記入力ビデオに関連する目標のビットレートに基づいて固定レート因子(CRF)基準ビットレート・モデルから得られたCRFによって前記入力ビデオを符号化するための命令と、
前記CRFによる前記入力ビデオの符号化から改訂因子を計算するための命令と、
前記改訂因子によって前記CRF基準ビットレート・モデルを修正するための命令と、
修正されたCRF基準ビットレート・モデルから得られたCRFによって前記入力ビデオを符号化するための命令と、を含む請求項18に記載の媒体。 - 複数のビデオに対するビデオ符号化の前記固定レート因子とレート−歪みの性能との間の関係をモデル化するための命令であって、ビデオ符号化の前記レート−歪みの性能は、前記複数のビデオの符号化の平均ビットレートによって表される、命令と、
前記モデル化からビデオ符号化の固定レート因子と平均ビットレートとの間の1つまたは複数の関係を得るための命令とをさらに含む、請求項19に記載の媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/275,090 US8885702B2 (en) | 2011-10-17 | 2011-10-17 | Rate-distortion-complexity optimization of video encoding guided by video description length |
US13/275,090 | 2011-10-17 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014537105A Division JP5808868B2 (ja) | 2011-10-17 | 2012-10-08 | ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015222997A true JP2015222997A (ja) | 2015-12-10 |
JP6019189B2 JP6019189B2 (ja) | 2016-11-02 |
Family
ID=48085984
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014537105A Active JP5808868B2 (ja) | 2011-10-17 | 2012-10-08 | ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化 |
JP2015177595A Active JP6019189B2 (ja) | 2011-10-17 | 2015-09-09 | ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014537105A Active JP5808868B2 (ja) | 2011-10-17 | 2012-10-08 | ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化 |
Country Status (5)
Country | Link |
---|---|
US (2) | US8885702B2 (ja) |
EP (1) | EP2769552A4 (ja) |
JP (2) | JP5808868B2 (ja) |
CN (2) | CN105847807B (ja) |
WO (1) | WO2013059015A1 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7515710B2 (en) | 2006-03-14 | 2009-04-07 | Divx, Inc. | Federated digital rights management scheme including trusted systems |
WO2010080911A1 (en) | 2009-01-07 | 2010-07-15 | Divx, Inc. | Singular, collective and automated creation of a media guide for online content |
US8781122B2 (en) | 2009-12-04 | 2014-07-15 | Sonic Ip, Inc. | Elementary bitstream cryptographic material transport systems and methods |
US9247312B2 (en) | 2011-01-05 | 2016-01-26 | Sonic Ip, Inc. | Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol |
US9467708B2 (en) | 2011-08-30 | 2016-10-11 | Sonic Ip, Inc. | Selection of resolutions for seamless resolution switching of multimedia content |
US8909922B2 (en) | 2011-09-01 | 2014-12-09 | Sonic Ip, Inc. | Systems and methods for playing back alternative streams of protected content protected using common cryptographic information |
US8964977B2 (en) | 2011-09-01 | 2015-02-24 | Sonic Ip, Inc. | Systems and methods for saving encoded media streamed using adaptive bitrate streaming |
CN103503462B (zh) * | 2011-12-06 | 2017-09-19 | 华为技术有限公司 | 实时转码方法及设备 |
KR101984825B1 (ko) * | 2012-10-05 | 2019-05-31 | 삼성전자주식회사 | Api 정보를 이용한 클라우드 디스플레이 화면의 부호화 방법 및 그 장치 |
US9264475B2 (en) | 2012-12-31 | 2016-02-16 | Sonic Ip, Inc. | Use of objective quality measures of streamed content to reduce streaming bandwidth |
US9191457B2 (en) | 2012-12-31 | 2015-11-17 | Sonic Ip, Inc. | Systems, methods, and media for controlling delivery of content |
US9313510B2 (en) * | 2012-12-31 | 2016-04-12 | Sonic Ip, Inc. | Use of objective quality measures of streamed content to reduce streaming bandwidth |
US10397292B2 (en) | 2013-03-15 | 2019-08-27 | Divx, Llc | Systems, methods, and media for delivery of content |
US9906785B2 (en) | 2013-03-15 | 2018-02-27 | Sonic Ip, Inc. | Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata |
US9094737B2 (en) | 2013-05-30 | 2015-07-28 | Sonic Ip, Inc. | Network video streaming with trick play based on separate trick play files |
US9967305B2 (en) | 2013-06-28 | 2018-05-08 | Divx, Llc | Systems, methods, and media for streaming media content |
US9866878B2 (en) | 2014-04-05 | 2018-01-09 | Sonic Ip, Inc. | Systems and methods for encoding and playing back video at different frame rates using enhancement layers |
US10313675B1 (en) | 2015-01-30 | 2019-06-04 | Google Llc | Adaptive multi-pass video encoder control |
US9860535B2 (en) * | 2015-05-20 | 2018-01-02 | Integrated Device Technology, Inc. | Method for time-dependent visual quality encoding for broadcast services |
WO2017023829A1 (en) * | 2015-07-31 | 2017-02-09 | Stc.Unm | System and methods for joint and adaptive control of rate, quality, and computational complexity for video coding and video delivery |
CN106856571B (zh) * | 2015-12-09 | 2019-12-06 | 阿里巴巴集团控股有限公司 | 一种转码方法及装置 |
US10834406B2 (en) | 2016-12-12 | 2020-11-10 | Netflix, Inc. | Device-consistent techniques for predicting absolute perceptual video quality |
US10498795B2 (en) | 2017-02-17 | 2019-12-03 | Divx, Llc | Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming |
CN109151481B (zh) * | 2017-06-28 | 2022-03-15 | 腾讯科技(深圳)有限公司 | 图片的传输和接收的方法、装置、系统、设备和介质 |
CN108063944B (zh) * | 2017-12-14 | 2021-07-13 | 西北工业大学 | 一种基于视觉显著性的感知码率控制方法 |
TW201942870A (zh) | 2018-04-03 | 2019-11-01 | 香港商科科串流股份有限公司 | 位元率優化系統及方法 |
US10616590B1 (en) * | 2018-05-16 | 2020-04-07 | Amazon Technologies, Inc. | Optimizing streaming video encoding profiles |
WO2019231619A1 (en) * | 2018-05-30 | 2019-12-05 | Infiniscene, Inc. | Systems and methods game streaming |
CN112468816B (zh) * | 2019-09-06 | 2022-07-19 | 上海哔哩哔哩科技有限公司 | 固定码率系数预测模型建立及视频编码的方法 |
US10897654B1 (en) | 2019-09-30 | 2021-01-19 | Amazon Technologies, Inc. | Content delivery of live streams with event-adaptive encoding |
CN111193924B (zh) * | 2019-12-26 | 2022-01-25 | 腾讯科技(深圳)有限公司 | 视频码率的确定方法、装置、计算机设备及存储介质 |
US10958947B1 (en) | 2020-03-12 | 2021-03-23 | Amazon Technologies, Inc. | Content delivery of live streams with playback-conditions-adaptive encoding |
CN112422967B (zh) * | 2020-09-24 | 2024-01-19 | 北京金山云网络技术有限公司 | 视频的编码方法及装置、存储介质、电子设备 |
US11902599B2 (en) * | 2020-12-09 | 2024-02-13 | Hulu, LLC | Multiple protocol prediction and in-session adaptation in video streaming |
US11729438B1 (en) * | 2021-01-28 | 2023-08-15 | Amazon Technologies, Inc. | Optimizing streaming video encoding profiles |
US11700376B1 (en) | 2021-09-28 | 2023-07-11 | Amazon Technologies, Inc. | Optimizing and assigning video encoding ladders |
CN116132717A (zh) * | 2021-11-12 | 2023-05-16 | 中兴通讯股份有限公司 | 入向码流码率获取方法、收流处理方法、电子设备、介质 |
CN117596425A (zh) * | 2023-10-24 | 2024-02-23 | 书行科技(北京)有限公司 | 编码帧率的确定方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001145102A (ja) * | 1999-11-17 | 2001-05-25 | Media Glue Corp | 動画像圧縮符号化信号変換方法、装置および変換プログラムを記録した媒体 |
US20040001638A1 (en) * | 2002-06-28 | 2004-01-01 | Microsoft Corporation | Rate allocation for mixed content video |
JP2005323353A (ja) * | 2004-04-15 | 2005-11-17 | Microsoft Corp | 高忠実度のトランスコーディング |
JP2009017314A (ja) * | 2007-07-05 | 2009-01-22 | Mega Chips Corp | トランスコーダ |
JP2010529748A (ja) * | 2007-05-31 | 2010-08-26 | クゥアルコム・インコーポレイテッド | イメージトランスコードのためのビットレート縮小技術 |
US20110002381A1 (en) * | 2009-07-02 | 2011-01-06 | Dialogic Corporation | Bitrate control algorithm for video transcoding systems |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7200623B2 (en) * | 1998-11-24 | 2007-04-03 | Oracle International Corp. | Methods to perform disk writes in a distributed shared disk system needing consistency across failures |
US20010047517A1 (en) * | 2000-02-10 | 2001-11-29 | Charilaos Christopoulos | Method and apparatus for intelligent transcoding of multimedia data |
US7020196B2 (en) * | 2000-03-13 | 2006-03-28 | Sony Corporation | Content supplying apparatus and method, and recording medium |
US6628300B2 (en) * | 2001-11-30 | 2003-09-30 | International Business Machines Corporation | Transcoding proxy and method for transcoding encoded streams |
US6700935B2 (en) | 2002-02-08 | 2004-03-02 | Sony Electronics, Inc. | Stream based bitrate transcoder for MPEG coded video |
US7330509B2 (en) * | 2003-09-12 | 2008-02-12 | International Business Machines Corporation | Method for video transcoding with adaptive frame rate control |
EP1615447B1 (en) | 2004-07-09 | 2016-03-09 | STMicroelectronics Srl | Method and system for delivery of coded information streams, related network and computer program product therefor |
TWI301953B (en) | 2005-03-14 | 2008-10-11 | Qisda Corp | Methods and apparatuses for video encoding |
US9544602B2 (en) * | 2005-12-30 | 2017-01-10 | Sharp Laboratories Of America, Inc. | Wireless video transmission system |
US8238424B2 (en) | 2007-02-09 | 2012-08-07 | Microsoft Corporation | Complexity-based adaptive preprocessing for multiple-pass video compression |
WO2010048524A1 (en) | 2008-10-24 | 2010-04-29 | Transvideo, Inc. | Method and apparatus for transrating compressed digital video |
US8270473B2 (en) | 2009-06-12 | 2012-09-18 | Microsoft Corporation | Motion based dynamic resolution multiple bit rate video encoding |
-
2011
- 2011-10-17 US US13/275,090 patent/US8885702B2/en active Active
-
2012
- 2012-10-08 CN CN201610317973.7A patent/CN105847807B/zh active Active
- 2012-10-08 CN CN201280062237.1A patent/CN103999471B/zh active Active
- 2012-10-08 EP EP12840940.6A patent/EP2769552A4/en not_active Withdrawn
- 2012-10-08 WO PCT/US2012/059194 patent/WO2013059015A1/en active Application Filing
- 2012-10-08 JP JP2014537105A patent/JP5808868B2/ja active Active
-
2014
- 2014-10-16 US US14/516,349 patent/US9225983B2/en active Active
-
2015
- 2015-09-09 JP JP2015177595A patent/JP6019189B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001145102A (ja) * | 1999-11-17 | 2001-05-25 | Media Glue Corp | 動画像圧縮符号化信号変換方法、装置および変換プログラムを記録した媒体 |
US20040001638A1 (en) * | 2002-06-28 | 2004-01-01 | Microsoft Corporation | Rate allocation for mixed content video |
JP2005323353A (ja) * | 2004-04-15 | 2005-11-17 | Microsoft Corp | 高忠実度のトランスコーディング |
JP2010529748A (ja) * | 2007-05-31 | 2010-08-26 | クゥアルコム・インコーポレイテッド | イメージトランスコードのためのビットレート縮小技術 |
JP2009017314A (ja) * | 2007-07-05 | 2009-01-22 | Mega Chips Corp | トランスコーダ |
US20110002381A1 (en) * | 2009-07-02 | 2011-01-06 | Dialogic Corporation | Bitrate control algorithm for video transcoding systems |
Non-Patent Citations (1)
Title |
---|
JPN6015003169; Lei Yang et al.: 'Video Description Length Guided Constant Quality Video Coding with Bitrate Constraint' 2012 IEEE International Conference on Multimedia and Expo Workshops (ICMEW) , 201207, pp.366 - 371, IEEE * |
Also Published As
Publication number | Publication date |
---|---|
US20150036740A1 (en) | 2015-02-05 |
US9225983B2 (en) | 2015-12-29 |
JP6019189B2 (ja) | 2016-11-02 |
CN103999471B (zh) | 2016-06-15 |
JP5808868B2 (ja) | 2015-11-10 |
US20130094565A1 (en) | 2013-04-18 |
EP2769552A4 (en) | 2015-06-17 |
WO2013059015A1 (en) | 2013-04-25 |
CN103999471A (zh) | 2014-08-20 |
CN105847807A (zh) | 2016-08-10 |
US8885702B2 (en) | 2014-11-11 |
CN105847807B (zh) | 2019-05-28 |
EP2769552A1 (en) | 2014-08-27 |
JP2014530587A (ja) | 2014-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6019189B2 (ja) | ビデオ記述長によって導かれるビデオ符号化のレート−歪み−複雑性の最適化 | |
US8934538B2 (en) | Rate-distortion-complexity optimization of video encoding | |
KR101744654B1 (ko) | 모션 기반 동적 해상도 다중 비트 레이트 비디오 인코딩 | |
US10645449B2 (en) | Method and apparatus of content-based self-adaptive video transcoding | |
US8290038B1 (en) | Video coding complexity estimation | |
JP5180294B2 (ja) | ビデオ符号化において、フレームの複雑さ、バッファレベル、およびイントラフレームの位置を利用するバッファベースのレート制御 | |
CN111405315B (zh) | 用于编码和交付视频内容的分布式体系结构 | |
CN108769693B (zh) | 质量感知视频优化中的宏块级自适应量化 | |
US9615098B1 (en) | Adaptive resolution transcoding for optimal visual quality | |
US20160156948A1 (en) | Adaptive Video Transcoding Based on Parallel Chunked Log Analysis | |
AU2016250476A1 (en) | Adaptive bit rate control based on scenes | |
WO2007143271A2 (en) | Scalable rate control system for a video encoder | |
US20090074075A1 (en) | Efficient real-time rate control for video compression processes | |
CN104125460A (zh) | 用于控制视频比特率的方法和设备 | |
RU2587412C2 (ru) | Управление скоростью передачи видео на основе гистограммы коэффициентов преобразования | |
US11582462B1 (en) | Constraint-modified selection of video encoding configurations | |
CN117714729A (zh) | 直播视频编码方法、装置、计算机设备及存储介质 | |
KR20040097028A (ko) | 다차원 비트율 조절에 따른 비디오 트랜스코딩 방법 및 그장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150909 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20151007 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20151014 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6019189 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |