JP5400876B2 - ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化 - Google Patents
ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化 Download PDFInfo
- Publication number
- JP5400876B2 JP5400876B2 JP2011514726A JP2011514726A JP5400876B2 JP 5400876 B2 JP5400876 B2 JP 5400876B2 JP 2011514726 A JP2011514726 A JP 2011514726A JP 2011514726 A JP2011514726 A JP 2011514726A JP 5400876 B2 JP5400876 B2 JP 5400876B2
- Authority
- JP
- Japan
- Prior art keywords
- picture
- rate control
- pictures
- coding
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
- H04N19/194—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/547—Motion estimation performed in a transform domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
Description
本出願は、アサナシス・レオンタリス(Athanasis Leontaris)およびアレキサンドラス・トゥラピス(Alexandras Tourapis)により2008年6月16日に出願され、ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化(Rate Control Model Adaptation Based on Slice Dependencies for Video Coding)と題し、本出願の譲受人に譲渡された、同時係属中の米国特許仮出願第61/061,941号に関連し、それに対する優先権とその利益を主張する。
本発明の実施形態はビデオ情報の処理に関する。
(a)圧縮ビットストリームは光または磁気ディスクあるいは不揮発性コンピュータメモリ上に記憶され輸送されることができる;
(b)ユーザはインターネット上の或るリモートサーバから圧縮ビットストリームをダウンロードし、その後の或る時点で再構築ビデオをオフラインで見ることができる;
(c)ユーザはリモートインターネットサーバから圧縮ビットストリームをストリームし、クライアントコンピュータまたはデバイス上で圧縮ビットストリームをわずかな時間遅延で見ることができる;ならびに
(d)圧縮ビットストリームは、リアルタイムの双方向ビデオ通信(例えば、ビデオ会議)、またはライブイベントのビデオストリーミング(例えば、スポーツ)のいずれかの結果、生じるものでありうる、等。
(a)受信されたピクチャビットがバッファ内に収まる(さもなければバッファオーバーフローを招く)、および
(b)ピクチャを符号化するためにデコーダがピクチャをバッファから除去する際、ピクチャ全体がまるごと受信される(さもなければバッファアンダーフローまたは枯渇を招く)。
1.0 一般概説;
2.0 ビデオ符号化のための、符号化単位依存性に基づくレート制御モデル適合化の概説;
2.0.1 第1の技法例−レート制御のモデル化、
2.0.2 第2の技法例−統計量の収集、
2.0.3 第3の技法例−ビット配分、および
2.0.4 第4の技法例−トランスコーディング;
3.0 実装機構例;
4.0 実施形態例の列挙;ならびに
5.0 均等物、拡張、代替物およびその他のこと。
図1はビデオエンコーダ内のレート制御モデル100の実装例を示す。レート制御の機構は、ビデオシステムの帯域幅、遅延および品質の制約を満たす圧縮ビットストリームを生成することができる。レート制御は、デコーダ入力バッファのオーバーフローまたは枯渇を防止しつつ、ビットレート目標を満たすことができる。任意に、レート制御は、所与のビットレート目標および遅延/バッファリング制約についての歪みを低減する機能を果たすこともできる。
(a)ブロックの残差変換係数を量子化するために用いられるパラメータ値である、量子化パラメータ(quantization parameter、QP)を変化させること;
(b)ブロック全体がスキップされその代わりに以前のブロックがコピーされて表示されなければならないと信号で知らせること等の、より少ないビットを伝送するために視覚的品質をトレードオフする符号化モードを選択すること;
(c)動き推定および符号化モード決定のラグランジュのレート−歪み最適化の間に用いられるラグランジュのラムダ(lambda)(「λ」)パラメータを変化させること;
(d)変換された係数(例えば、離散コサイン変換(discrete cosine transform、DCT)または変形DCT等のようなフーリエ型の変換を用いて変換された係数)を、品質の劣化を最小限にとどめつつもより圧縮可能であるか、または、代わりに、係数を閾値処理(ゼロ設定)する値に量子化すること。こうした量子化は、DCT係数の量子化の間に丸めオフセットを調整することによって任意に実装されてよい;ならびに
(e)或るピクチャは符号化せず、その代わり、そのようなピクチャはスキップされなければならず、スキップされたピクチャの代わりに以前の符号化ピクチャが表示されること(例えば、フレームスキップ)を信号で知らせることを選ぶこと。
1.現在のピクチャについてビット目標が計算される。
2.現在のピクチャが複数の基本単位に分割される場合、残りのビットは現在のピクチャ内の符号化されていない全ての基本単位に等しく配分される。
3.現在のピクチャ内の現在の基本単位のSAD予測誤差が、以前のピクチャの同じ位置にある基本単位のSADの線形関数(モデル)として予測される。
4.対応する量子化パラメータが、SADおよびヘッダビット数に関してパラメータ化される2次レート−歪みモデルを用いて計算される。
5.現在の基本単位が、ステップ4から導出された量子化パラメータでエンコードされる。
所与の符号化単位形式(例えばBまたはI符号化ピクチャ)の量子化パラメータの推定に必要な統計パラメータを、必ずしも同じ形式のものでなくてよい、以前に符号化された他の符号化単位(例えばP符号化ピクチャ)からの情報を用いて求める技法が提供される。或る技法は、そのような符号化単位形式の間のビットレートと品質との関係、ならびにそのような符号化単位形式のエンコーディングに用いられる量子化パラメータを用いる。符号化単位形式の間のビットレートと品質との関係を推定することにより、ピクチャの符号化に用いられる符号化単位形式に関わりなく、正確なレート制御ができる。さらに、こうした符号化単位形式の間のビットレートと品質との関係は、圧縮性能を高めるために、複数のレート制御モデルと一緒に用いられることができる。本願明細書において後にさらに詳細に説明される動き推定および補償フレームワーク(motion estimation and compensation framework、MEMC)によって生成される統計量を用いれば、レート制御パラメータがさらに最適化される。
(a)メモリの複雑さが低いこと;
(b)計算の複雑さが低いこと;
(c)正確なレート制御;および
(d)レート制御モデルの収束および初期化がより高速であること。
項目(a)および(b)は電力使用量の低減をもたらす可能性があり、項目(c)および(d)は圧縮ビットストリームの品質を向上させる可能性があることを理解されたい。
(a)ビデオエンコーダ;
(b)任意に、動き推定および補償フレームワーク(motion estimation and compensation framework、MEMC);
(c)任意の空間統計量分析モジュール;
(d)モデルのステータスを維持し決定を行う1つまたは複数のレート制御モジュール;
(e)エンコーディングプロセスから有用な統計量を収集する複数の統計量モジュール;
(f)動き推定および補償フレームワークから統計量を収集する任意の統計量モジュール;ならびに
(g)利用可能ならば任意のMEMCプリプロセッサからの統計量と、ビデオエンコーダからの統計量を融合させ、フィードバックをレート制御モジュールに提供する決定モジュール。
(a)ビデオトランスコーダ;
(b)任意に、動き推定および補償フレームワーク;
(c)任意の空間統計量分析モジュール;
(d)モデルのステータスを維持し決定を行う1つまたは複数のレート制御モジュール;
(e)エンコーディングプロセスからの有用な統計量を収集する複数の統計量モジュール;
(f)動き推定および補償フレームワークから統計量を収集する任意の統計量モジュール;ならびに
(g)利用可能ならば任意のMEMCプリプロセッサからの統計量と、ビデオトランスコーダからの統計量を融合させ、フィードバックをレート制御モジュールに提供する決定モジュール。
1.第1の技法(セクション2.0.1 第1の技法例−レート制御のモデル化にて後述)が、全ての符号化単位形式について別個のレート制御モデルを維持することなく、異なる符号化単位形式でエンコードされるシーケンスに対する正確なレート制御を可能とする。このような技法は、ビデオエンコーダおよび動き補償時間フィルタ(motion−compensated temporal filter、MCTF)プリプロセッサからの統計量を収集することによって容易になる場合がある。
2.第2の技法(セクション2.0.2 第2の技法例−統計量の収集にて後述)が、任意に、動き推定および補償フレームワーク、あるいは複数パスビデオ符号化器の最初のまたは後続のパスからの統計量を収集し、既存のレート制御方法を向上させるべくその統計量を用い、ピクチャの複雑さ推定を強化し、さらに、レート配分の最適化の助けになりうる、フェード類等のシーン形式の検出を支援する。本願明細書において後述されている、このような第2の技法のためのアルゴリズムが、第1の技法を強化するためにも用いられることができることを理解されたい。
3.第3の技法(セクション2.0.3 第3の技法例−ビット配分にて後述)が、各符号化単位形式にそれぞれ1つ用意された複数のレート制御モデルを併用して、第1の技法によって生成された統計量を用いてビットを最適に配分する。このような技法は、正確なレート制御を維持しつつ、良好な圧縮効率を達成することができる。
4.第4の技法(セクション2.0.4 第4の技法例−トランスコーディングにて後述)が、トランスコーディングの間に先の3つの(セクション2.0.1、2.0.2および2.0.3における)技法からの原理を用いて効率的なレート制御を適用する。
一実施形態は、上述の図8〜図11に示されるような複雑かつ複数の符号化依存性を持つ動き補償予測構造を用いるイメージシーケンスを圧縮する際に、効率的かつ複雑さの低いレート制御を提供するというものである。図8〜図11にて図示される構造のような複雑な構造はいくつかの形式の符号化単位を含んでよい。このような複雑さは、各符号化単位形式について個別のレート制御モデルを維持するという実用性に影響を及ぼす場合がある。N個の符号化単位形式のために、N個の符号化単位形式のうちのM個の符号化単位形式と同じ数に対応する、M個のレート制御モデルが維持される。残りのN−M個の符号化単位形式のためには、N個の符号化単位形式の符号化から収集された統計量を用いて、対応するレート制御モデルが近似される。最初は、ビットレート使用量を制御する符号化パラメータ(例えば、QP、ラグランジュのλ、閾値処理パラメータ、等)を導出するために、任意のモデルが用いられる。任意のモデルは、まず、特定の符号化単位形式の統計量を用いて更新され、次に、ビット目標T(j)を入力として用いて、ビットレート使用量を制御する符号化パラメータを確定する。一実施形態は、M個の符号化単位形式の少なくとも1つから導出されそれに対応するレート制御モデルを、N−M個の符号化単位形式の1つに対応するレート制御モデルに変換する。このような変換は、ビット目標T(j)、複雑さの推定値(例えばSAD)およびヘッダビットの推定値bheader(j)等の重要なレート制御パラメータを修正することを含む。
(a)ビデオエンコーダにおいて動き補償予測またはイントラ予測のいずれかを用いた、現在のブロックと予測ブロックとの間の予測誤差(例えば、SAD);
(b)MEMCフレームワークにおいて複数の動き補償予測の線形結合を用いた、現在のブロックと予測ブロックとの間の予測誤差(例えば、SAD);
(c)ソース信号の輝度および/または色度成分の分散;
(d)現在の基本単位(またはピクチャ)のエンコードに用いられた総ビット数;
(e)現在の基本単位(またはピクチャ)においてテクスチャのエンコードに使われたビット数;
(f)現在の基本単位においてヘッダおよび構文情報のエンコードに使われたビット数;
(g)動きパラメータ(例えば、並進、アフィンまたはいくらか高次のモデル)、ならびに前記パラメータから計算されてよい、1次および2次モーメント等の統計量;
(h)現在のブロックのための予測ブロックを導出するために重み付け予測を用いることによって導出される、基本単位のための重み付け係数;ならびに
(i)符号化単位形式。
(a)もしピクチャがシーケンス内のその特定の符号化単位形式の最初のピクチャであれば、符号化パラメータ(例えばQP)の初期セットを用いてそれをエンコードする。これらの符号化パラメータは、任意に選択されることもできようし、符号化単位に関するある予備的な情報、基本的な情報または完全な情報を所与として推定されることもできようし、あるいは反復的に選択されることもできよう。あるいは、上述のステップ2において収集された情報を用いて現在の符号化単位についての符号化パラメータを推定する。一実施形態では、ピクチャとピクチャの間の厳密な関係が依然求められていない間は、そのような関係は、平均的なビデオシーケンスの挙動を表す値で初期化される。例えば、P符号化ピクチャ群がB符号化ピクチャ群のサブセットであることを反映する情報が用いられて、それに応じてQPをB符号化ピクチャ用に適合させる。この場合、QPを例えば増加させる。例えば、ピクチャとピクチャの間の関係は、ビデオシーケンスの最初のピクチャを符号化または分析してこのピクチャに良好な初期QPを得ることによって収集される統計量と組み合わせられる。符号化単位形式がM個のバッファされたモデルの1つに対応するならば、イメージが属する符号化単位に対応するレート制御モデルが更新される。符号化単位形式に関わらず、使われたビット数およびエンコーディング後に結果として生じる歪みを含む多数の統計量が、その符号化単位形式に関連付けられる統計量バッファ内にバッファされる。
(b)さもなければ、エンコーダは、符号化単位形式が、バッファされたM個のモデルの1つまたはN−M個の足りないモデルの1つに対応するかどうかを判定する(1204)。前者の場合、すなわち符号化単位形式が、バッファされたM個のモデルの1つに対応する場合(1206、1208、1210)、現在のピクチャのための符号化パラメータを提供するべく、適当な既存のモデルが選択される(1216、1218、1220)。現在のピクチャ(またはスライス)がエンコードされる(1226、1228、1230)。次に、イメージが属する符号化単位に対応するレート制御モデルが更新される。後者の場合、符号化単位形式はN−M個の足りないモデルの1つに対応し(1212および1214)、各符号化単位形式のための統計量バッファ内に収集されたデータが処理されて変換を得る(1222、1224)。このような変換が、ビット目標T(j)およびヘッダビットbheader(j)の推定値等の符号化パラメータを、バッファされたM個のモデルの1つ(またはその組み合わせ)から、N−M個の符号化単位形式で用いられるのに適した符号化パラメータに変える(1222、1224)。結果として生じる符号化パラメータを用いてピクチャをエンコードする(1232、1234)。個々の符号化単位形式は、使われたビット数を含む多数の統計量を、その符号化単位形式に関連付けられる統計量バッファ内にバッファする。
(a)維持されたモデルまたは統計量を一切持たない新しい符号化単位。この場合、新しい符号化単位のレート制御モデル(バッファされたモデルまたは近似されたモデル)は、以前に維持されたレート制御モデルを新しいモデルに変換することによって初期化される。変換は特定の関係も用いる(例えば、B符号化ピクチャは、QPを所与とすると、平均的にP符号化ピクチャよりも用いるビットが少なくてよい)。これらの変換のために適用されることができるアルゴリズムが、本願明細書において後にセクション2.0.2、「第2の技法例−統計量の収集」でさらに詳細に記載されていることを理解されたい。
(b)以前の構造内にも存在した、新しい構造の符号化単位。この場合、以前に収集された統計量およびレート制御モデルは、新しい構造内で用いられるように適合される。
1.(1302)ビットレートスケーリングパラメータθB lおよびθIをユーザによる所定値でθB l(0)およびθI(0)として初期化する。パラメータNI,c、NP,cおよびNB,c lはそれぞれ、階層レベルlでエンコードされたI符号化、P符号化およびB符号化ピクチャの数であり、ゼロにセットされる。エンコードされるピクチャのカウンタjが0にセットされる。ステップ3に進む。
2.符号化単位形式を判定する(1306)。現在のピクチャがI符号化ピクチャとしてエンコードされたものであれば、ステップ3に進む。さもなければ、現在のピクチャがP符号化ピクチャとしてエンコードされたものであれば、ステップ4に進む。さもなければ(B符号化ピクチャ)、ステップ5に進む。
3.(1308)エンコードされたI符号化ピクチャの数NI,cを1、インクリメントする。現在のピクチャの符号化に使われたビット数を、例えば式4において記載されたように、正規化し、さらに現在のピクチャの符号化に使われたビット数を次式のようにI符号化ピクチャビット統計量バッファ内に記憶する(1310):BitsI(NI,c mod Nbuffer)=b(j)。次に、この数を、P符号化ピクチャビット統計量バッファ内にバッファされている、最新のP符号化ピクチャの符号化に使われたビット数で除算し(1312)、結果を次式のようにI符号化ピクチャビット比統計量バッファ内に記憶する:
4.エンコードされたP符号化ピクチャの数NP,cを1、インクリメントする(1316)。現在のピクチャの符号化に使われたビット数を正規化し、さらに次式のようにP符号化ピクチャビット統計量バッファ内に記憶する(1318):BitsP(NP,c mod Nbuffer)=b(j)。ステップ6に進む。
5.プロセスはステップ2におけるI符号化ピクチャのためのプロセスと同様である。所与の時間レベルlについて、次のアクションを遂行する。エンコードされたB符号化ピクチャ符号化ピクチャの数NB,c lを1、インクリメントする(1320)。現在のピクチャの符号化に使われたビット数を正規化し、さらに現在のピクチャの符号化に使われたビット数を次式のようにB符号化ピクチャビット統計量バッファ内に記憶する(1322):BitsB l(NB,c l mod Nbuffer)=b(j)。次に、この結果を、P符号化ピクチャビット統計量バッファ内にバッファされている、最新のP符号化ピクチャの符号化に使われたビット数で除算する(1324)。商をB符号化ピクチャビット比統計量バッファ内に記憶する:
6.カウンタjを1、インクリメントし(1328)、j番目のピクチャをエンコードする。エンコードすべきピクチャがさらにあるかどうかを判定する(1330)。もしなければ、アルゴリズムを終了する(1332)。さもなければ、ステップ2に進む。
或る実施形態では、SP符号化ピクチャが上述の導出におけるP符号化ピクチャに相当するとみなされる。
上述のように、第1の技法のおかげで、ビデオシーケンスにおいてありうる全ての形式の符号化単位のためのレート制御モデルを維持し更新する必要なく、複数の符号化単位形式のための正確なレート制御ができる。本セクションにおいて記載されるように、第2の技法は、レート制御を向上させるために、MEMCフレームワークおよび空間アナライザあるいは以前の符号化パスから収集された空間時間的統計量を用いるというものである。混成線形/2次レート制御アルゴリズム等のレート制御アルゴリズムが、現在のピクチャの複雑さの良好な推定値(例えば動き補償された予測誤差)を用いてよい。一実施形態では、ピクチャの複数パスエンコーディングを遂行することによって、高性能の解が得られる。ピクチャの複数パスエンコーディングを遂行することによって、レート制御モデルは、各符号化パスにおいて、継続的により正確になった符号化統計量を入手する。一実施形態では、以前の符号化パスの間に導出された動きパラメータをバッファ、再利用および精緻化することによって、現在のパスのための動き推定の複雑さが低減される場合がある。
(a)輝度および色度成分のDC値(平均値)および分散;
(b)周波数成分(DCT、mDCTまたはウェーブレット変換の係数);および
(c)ソーベルフィルタリングを用いたエッジ情報。
(a)動き補償フレームワークからの予測誤差値;
(b)並進運動ベクトル値;
(c)重み付け予測の重みおよびオフセット;ならびに
(d)アフィンまたは放物モデル等のより高次の運動モデルの動きパラメータ。
(a)ピクチャn+1がピクチャnと相似している。その判定は容易にできる(例えば、低い予測歪み値。)
(b)ピクチャn+1がピクチャn−1と相似している。その判定は幾分、困難でありうる。この場合を判定する1つの方法は、ピクチャn+1およびn−1から生じる動きベクトルを比較することである。照度を考慮したこのような動きベクトルが、大きさが同じで且つ方向が逆であるらしい(例えば相関性がある)とき、それら2つの参照は相似しており、おそらくピクチャnは何らかの一時的な遮蔽(例えば妨害)または照度変化を示していると推測される。さらに、MEMCフレームワークによって収集される、大域的(ピクチャレベル)および局所的(ブロックレベル)平均輝度および色度、ソースの分散統計量、ならびに2つの参照イメージの間の他のこのような複雑さの関係を反映する1つ以上の値(例えば2つの参照イメージの色ヒストグラムの絶対差の和)が、ピクチャn+1がピクチャn−1と相似しているかどうかについての判定を支援する場合がある。各予測参照についてのSADの間の相似性が内容の相似性を示すこともできる。
(c)上述の条件がいずれも満たされないときは、n+1からnへのSAD予測誤差が、2つのピクチャが相似しているか相似していないかを示す場合がある。
レート制御およびレート配分のための技法の一実施形態は、圧縮ビットストリームのために高い視覚的品質を達成すると同時に低遅延のビデオ通信を可能とするために、本願明細書において上述された第1の技法において提示された手法の一部を用いるというものである。第1の技法はレート制御アルゴリズムの安定性および性能を向上させるものであり、第2の技法はMEMCフレームワークまたは複数パス符号化統計量を用いてレート制御をさらに向上させるものである。本セクションに記載されている第3の技法はレート制御およびレート配分に取り組むものである。レート配分が各ピクチャについてのビット目標を設定する;レート制御が、ビット目標を実現するべくピクチャの(特定の比値を含んでよい)符号化パラメータを適合する。レート配分およびレート制御は種々の方法で達成されることができ、その例が本願明細書において後述される。
ステップ1:符号化構造の切り替わりと同時に(2102)、現在のθスケーリングパラメータをバッファし、バッファされたθスケーリングパラメータを以前の符号化構造でラベル付けする(2104);ステップ2へ行く;
ステップ2:新しい符号化構造は以前に用いられたことがあるかどうかを判定し(2106)、はいであれば、ステップ3(2110)へ行き、さもなければステップ4へ行く(2108)。
ステップ3:用いられる符号化構造が信頼できるかどうかを判定する(2110)。はいであれば、新しいθスケーリングパラメータを、同じ符号化構造に対応する、以前にバッファされたθスケーリングパラメータで初期化する(2114)。さもなければ、新しいθスケーリングパラメータはバッファされたパラメータに十分近接していない、例えば、新しいθスケーリングパラメータとバッファされたθスケーリングパラメータとの差は閾値の値よりも大きいということであり、新しいθスケーリングパラメータを、レート−歪みの点で類似したより最近の構造からバッファされたパラメータを変換したパラメータで初期化する(2112)。後者の場合、例えば、類似の構造は現在の構造に関して変換される。一実施形態では、任意に、初期化されたθスケーリングパラメータと、レート−歪みの点で最も類似した構造形式からバッファされたθスケーリングパラメータを変換したパラメータを混合する(2116)。ステップ5へ行く。
ステップ4:新しいθスケーリングパラメータを、以前に用いられた符号化構造であってレート−歪みの点で最も類似した符号化構造のθスケーリングパラメータで初期化する(2108)。この場合、例えば、類似の構造は現在の構造に関して変換される。ステップ5へ行く。
ステップ5:符号化構造の切り替わりへの対応を終了する(2118)。
ステップ1:符号化を開始する(2120)。レート制御およびθスケーリングパラメータを初期化する(2122)。ピクチャを符号化し(2124)、過去の符号化構造について記憶された(例えばバッファされた)パラメータの最初から最後までループする(例えばスキャンする)(2126);
ステップ2:記憶された各パラメータセットについて、現在の符号化構造が、記憶されたセットと同じであるかどうかを判定する(2128);はいであればステップ3へ行く;さもなければステップ4へ行く;
ステップ3:記憶されたθスケーリングパラメータを現在のピクチャの統計量で更新する(2132)。ステップ5へ行く;
ステップ4:現在の符号化構造が、レート−歪みの点で、記憶されたパラメータセットと類似しているかどうか(例えば、新しいθスケーリングパラメータとバッファされたθスケーリングパラメータとの差が閾値の値よりも大きいかどうか)を判定する(2130)。はいであれば、バッファされた、レート−歪みの点で類似した構造のθスケーリングパラメータを現在のピクチャの変換された統計量(例えばθスケーリングパラメータ)で更新する(2134)。
ステップ5:記憶された全てのパラメータセットの考慮が完了するまではステップ2へ行く(2138)。さもなければ、符号化を終える(2140)。
本セクションにおいて記載される第4の技法例は、上述の第1および第2の技法を用いてトランスコーディングを向上させるというものである。トランスコーディングの例は、1つのデジタルコーデックを他へ変換するというものである。ビットストリームから復号されたピクチャにMEMCフレームワークを適用することが可能であってよいが、それを行うには複雑さのためにコストが追加される場合がある。しかし、圧縮ビットストリームは、MEMCフレームワークまたは複数パスビデオ符号化を利用する場合のように、事前分析をしなくてもよい情報を提供することができる。
(a)動きパラメータ;
(b)重み付け予測パラメータ;
(c)予測残差の量子化された変換された係数または/および逆量子化および変換後の予測残差;
(d)符号化モード(イントラまたはインター);
(e)量子化パラメータ(Quantization parameter、QP);ならびに/あるいは
(f)各ブロック、スライスまたはフレームの符号化に使われたビット数。
図19は、本発明の実施形態が実装されてよいコンピュータシステム1900を図解するブロック図である。コンピュータシステム1900は、情報を伝達するためのバス1902または他の通信機構、ならびに情報を処理するための、バス1902と結合されたプロセッサ1904を含む。コンピュータシステム1900は、情報、およびプロセッサ1904によって実行される命令を記憶するための、バス1902に結合された、ランダムアクセスメモリ(random access memory、RAM)または他の動的記憶デバイス等のメインメモリ1906も含む。メインメモリ1906は、プロセッサ1904によって実行される命令の実行中に一時変数または他の中間情報を記憶するために用いられてもよい。コンピュータシステム1900は、静的情報、およびプロセッサ1904のための命令を記憶するための、バス1902に結合されたリードオンリーメモリ(read only memory、ROM)1908または他の静的記憶デバイスをさらに含む。磁気ディスクまたは光ディスク等の記憶デバイス1910が、情報および命令を記憶するために提供され、バス1902に結合される。
符号化単位形式(例えばB符号化またはI符号化)ピクチャの量子化因子を推定するための統計量が、他の、場合によっては異なる(例えばP符号化)ピクチャ、または以前に符号化された符号化単位から求められる。このような符号化単位形式の間のビットレートと品質との関係が量子化パラメータとともに用いられてよい。符号化単位形式の間のビットレートと品質との関係を推定することにより、それらの符号化単位形式に関わらず、ピクチャのための正確なレート制御ができる。圧縮を高めるために、符号化単位形式の間のビットレートと品質との関係が複数のレート制御モデルとともに用いられることができる。レート制御パラメータが、動き推定および補償フレームワークによって生成される統計量で調整されてよい。圧縮ビットストリームをトランスコードする際にレート制御の性能が制御されてよい。
以下のこと:
現在のピクチャの予測誤差を:
2つ以上の以前に符号化されたピクチャの予測誤差;または前記MEMCにおいて収集される統計量;
のうちの少なくとも1つのものの関数として推定すること;および
前記現在のピクチャの空間分散を、前記空間統計量分析モジュールにおいて収集される、以前に符号化されたピクチャの空間分散の関数として推定すること;
のうちの1つ以上を遂行することと;
を含む方法。
予測誤差値;
並進運動ベクトル値;
重み付け予測の重みおよびオフセット;ならびに
1つ以上のより高次の運動モデルに関連付けられる動きパラメータ;
のうちの1つ以上を含む、列挙実施形態例1の方法。
レート制御パラメータを:
1つ以上の前のMEMCモジュール;あるいは
前記前の符号化パスの運動モデルおよび符号化統計量ならびに現在のエンコーディングパスのために用いられる前記運動モデル;
のうちの1つ以上によって用いられる運動モデルの相違に基づいて修正すること;
をさらに含む、列挙実施形態例1の方法。
前記現在のピクチャを予測するために、少なくとも1つの過去のピクチャまたは少なくとも1つの未来のピクチャのうちの1つ以上のものを1つ以上の動き補償された利用可能なアンカーピクチャとして用いることと;
前記アンカーピクチャのうちの1つ以上のものに関して、前記現在のピクチャの複雑さ推定値を計算することと;
2つ以上の予測参照を用いて、前記利用可能な参照ピクチャのうちの少なくとも2つの間の複雑さの関係を反映する少なくとも1つの値を計算することと;
をさらに含む、列挙実施形態例1の方法。
前記現在のピクチャを予測するために、少なくとも1つの過去のピクチャまたは少なくとも1つの未来のピクチャのうちの1つ以上のものを1つ以上の動き補償された参照ピクチャとして用いることと;
前記少なくとも1つの未来のピクチャを用いる際、前記少なくとも1つの未来のピクチャに関連付けられる1つ以上の予測誤差および前記少なくとも1つの未来のピクチャに関連付けられる1つ以上の動きベクトルに関連する情報を比較することによって推定複雑さ特性値を計算することと;
ただし、前記1つ以上の予測誤差に関連する前記情報は前記MEMCモジュールからの前記受信情報から得られることと;
をさらに含む、列挙実施形態例1の方法。
前記レート制御パラメータを、前記MEMCあるいは最初のパスまたは以前のパスの符号化統計量からの前記受信情報からの運動モデルパラメータと、エンコーダに関連する運動モデルパラメータとの間の差の評価指標を用いて修正すること;
をさらに含む、列挙実施形態例4の方法。
前記1つ以上の符号化単位の各々に配分すべきビット数を、
前記符号化構造;
スケーリングパラメータ;および
ビット目標;
のうちのいずれかを用いて計算することと;
を含む方法。
新しいパラメータを前記スケーリングパラメータの関数として計算するとともに、前記1つ以上の符号化単位の第1の符号化単位に配分される量子化パラメータ(quantization parameter、QP)値が、前記1つ以上の符号化単位の第2の符号化単位に配分されるQP値とは異なることを許すこと;
をさらに含む、列挙実施形態例9の方法。
参照ピクチャの平均QP値を用いることによって、または現在のピクチャに対応する符号化ピクチャの前記QP値と前記現在のピクチャに対応する予測参照ピクチャの前記QP値との前記差を用いることによって、前記スケーリングパラメータを調整すること;
をさらに含む、列挙実施形態例9の方法。
1つ以上の新しい符号化構造または非周期的な挿入イントラピクチャを受信することと;
配分すべき前記ビット数を再計算することと;
をさらに含む、列挙実施形態例9の方法。
ただし、前記ビデオエンコーダはM個の数のレート制御モデルを含み、前記N個の数は前記M個の数よりも大きいことと;
前記現在のピクチャを:
特定の情報;
前記M個のレート制御モデルのうちの少なくとも1つからの1つ以上の符号化パラメータ;または
前記M個のレート制御モデルのうちの前記少なくとも1つからの前記1つ以上の符号化パラメータのうちの少なくとも1つを変換することによって得られる1つ以上の符号化パラメータ;
のうちの1つ以上を用いて符号化するステップと;
を含む方法。
前記符号化ステップが、1つ以上のレート制約を満たす符号化パラメータを用いるステップを含み;
前記現在のピクチャを特徴付ける符号化単位形式が前記M個のレート制御モデルのうちの1つに対応し;さらに
前記現在のピクチャを符号化する際、前記方法が、
M個のレート制御モデルのうちの前記対応する1つを更新するステップ;
前記第1のピクチャに関連する統計量を収集するステップ;および
前記収集される統計量をバッファするステップ;
をさらに含む、列挙実施形態例13に記載の方法。
前記符号化ステップが、
前記現在のピクチャを特徴付ける符号化単位形式を確定するステップ;ならびに
前記現在のピクチャが、前記確定された符号化単位形式の第1のピクチャを含む場合、前記現在のピクチャに前記特定の情報を関連付けるステップ;
ただし、前記付加される特定の情報は、
少なくとも1つのスケーリングまたは変換パラメータ;
少なくとも1つの反復的に推定される符号化パラメータ;あるいは
前記収集される統計量;
のうちの1つ以上のものを含むこと;
をさらに含む;列挙実施形態例14に記載の方法。
前記符号化ステップが、
前記確定された符号化単位形式に対応するレート制御モデルを確定するステップ;ならびに
前記確定されたレートモデルが前記M個のレート制御モデルのうちの1つである場合、前記確定されたレート制御モデルの1つ以上のレート制御モデルパラメータを用いるステップ;ならびに
前記確定されたレート制御モデルを更新するステップ;
をさらに含む;列挙実施形態例15に記載の方法。
前記符号化ステップが、
前記確定されたレート制御モデルを導出するステップ
をさらに含む;列挙実施形態例16に記載の方法。
前記符号化単位形式の各々について収集された、前記バッファされた統計量を処理するステップ;
前記M個のレート制御モデルのうちの少なくとも1つからのパラメータを変換するステップ;
前記変換ステップに基づいて、前記変換されたパラメータを生成するステップ;
前記変換されたパラメータを前記現在のピクチャに適用するステップ;
前記対応する符号化単位形式について前記収集ステップを実行するステップ;ならびに
前記収集された統計量について前記バッファリングステップを実行するステップ;
を含む、列挙実施形態例17に記載の方法。
ビット統計量を全ての符号化単位形式について同じ符号化パラメータに正規化すること;
をさらに含む、列挙実施形態例13の方法。
少なくとも1つの新しい符号化単位形式を含む適合された予測構造を受信することと;
前記新しい符号化単位形式が以前に存在したかどうかを判定することと;
前記新しい符号化単位形式が以前に存在した場合は、前記以前に存在した符号化単位形式の収集された統計量およびレート制御モデルを用いることと;
をさらに含む、列挙実施形態例13の方法。
少なくとも1つの新しい符号化単位形式を含む適合された予測構造を受信することと;
前記新しい符号化単位形式が以前に存在したかどうかを判定することと;
前記新しい符号化単位形式が以前に存在しなかった場合は、以前に維持されたレート制御モデルを変換することによって、前記新しい符号化単位形式に対応するレート制御モデルを初期化することと;
をさらに含む、列挙実施形態例13の方法。
P符号化ピクチャにレート制御モデルを割り当てるとともにI符号化ピクチャのためのおよびB符号化ピクチャのためのスケーリングパラメータを推定すること、あるいはI符号化ピクチャにレート制御モデルを割り当てるとともにB符号化ピクチャのためのおよびP符号化ピクチャのためのスケーリングパラメータを推定することと;
ただし前記スケーリングパラメータは、記憶されたビット比の平均値を表すことと;
をさらに含む、列挙実施形態例13の方法。
前記現在のピクチャについてのシーン形式を判定することと;
前記判定されたシーン形式に基づいて:
前記シーン形式に適したレート制御モデルを選択するステップ;
デフォルトのレート制御モデルのパラメータを調整するステップ;および
前記デフォルトのレート制御モデルを用いるステップ;
のうちの1つ以上を遂行することと;
を含む方法。
前記第1の符号化単位形式に対応する第1のレート制御モデルを用いて前記イメージシーケンスの前記第1の数のピクチャを符号化することと;
前記第1の符号化単位形式に対応する第1のレート制御モデルを用いて前記イメージシーケンスの前記第1の数のピクチャを符号化した後、前記第1のレート制御モデルのパラメータを変換することによって前記イメージシーケンスの現在のピクチャを符号化することであって、前記現在のピクチャは、前記第1の符号化単位形式とは異なる第2の符号化単位形式に対応する、符号化することと;
を含む方法。
N個の数の符号化単位形式ピクチャについて、N個の目標ビットを計算することと;
ただし、前記N個の数は前記M個の数よりも大きいかまたはそれに等しいことと;
現在のピクチャを受信することと;
前記N個の符号化単位形式のうちの前記現在のピクチャのための符号化単位形式を確定することと;
前記現在のピクチャの前記符号化単位形式が特定の符号化単位形式である場合は:
前記特定の符号化単位形式に対応する特定の符号化パラメータを用いること、または前記M個のレート制御モデルのうちの、前記特定の符号化単位形式に対応する特定のレート制御モデルを用いること;
前記特定の符号化パラメータまたは特定のレート制御モデルに基づいて前記現在のピクチャをエンコードすること;
前記特定の符号化単位形式に対応するスケーリングパラメータを更新すること;ならびに
各符号化単位形式について前記N個の目標ビットを再計算すること;
を遂行することと;
を含む方法。
前記現在のピクチャの前記符号化単位形式が前記特定の符号化単位形式とは異なる第2の符号化単位形式である場合は:
前記第2の符号化単位形式に対応する第2の符号化パラメータを用いること、または前記M個のレート制御モデルのうちの、前記第2の符号化単位形式に対応する第2のレート制御モデルを用いること;
前記第2の符号化パラメータまたは第2のレート制御モデルに基づいて現在のピクチャをエンコードすること;ならびに
目標ビットを再計算すること;
を遂行すること;
をさらに含む、列挙実施形態例30に記載の方法。
前記現在のピクチャの前記符号化単位形式が、前記特定の符号化単位形式および前記第2の符号化単位形式とは異なる、第3の符号化単位形式である場合は:
前記M個のレート制御モデルのうちの第3のレート制御モデルを用い、さらに前記第3の符号化単位形式に対応するとともに前記第3のレート制御モデルに対応する第3のスケーリングパラメータを用いること;
前記第3のレート制御モデルおよび前記第3のスケーリングパラメータに基づいて現在のピクチャをエンコードすること;
前記第3のスケーリングパラメータを更新すること;ならびに
目標ビットを再計算すること;
を遂行すること;
をさらに含む、列挙実施形態例31に記載の方法。
現在のピクチャを受信することと;
前記N個の符号化単位形式のうちの、前記現在のピクチャに対応する符号化単位形式を確定することと;
前記現在のピクチャの前記符号化単位形式が特定の符号化単位形式である場合は:
前記特定の符号化単位形式に対応する特定のレート制御モデルを用いて前記現在のピクチャをエンコードすること;
前記特定のレート制御モデルが収束したかどうかを判定すること;
前記特定のレート制御モデルを更新すること;および
前記特定のレート制御モデルが収束しなかった場合は、前記特定のレート制御モデルを、前記N個の符号化単位形式のうちの第2の符号化単位形式に対応する、前記M個のレート制御モデルのうちの変換された第2のレート制御モデルと混合すること;
を遂行することと;
を含む方法。
前記現在のピクチャの前記符号化単位形式が前記N個の符号化単位形式のうちの第3の符号化単位形式である場合は:
前記現在のピクチャを、前記M個のレート制御モデルのうちの、前記第3の符号化単位形式に対応する第3のレート制御モデルからのパラメータでエンコードすること;
前記第3のレート制御モデルが収束したかどうかを判定すること;
前記第3のレート制御モデルを更新すること;および
前記第3のレート制御モデルが収束しなかった場合は、前記第3のレート制御モデルを、前記第2の符号化単位形式のための前記変換された第2のレート制御モデルと混合すること;
を遂行すること;
をさらに含む、列挙実施形態例34に記載の方法。
前記現在のピクチャの前記符号化単位形式が前記第2の符号化単位形式である場合は、
前記現在のピクチャを前記第2のレート制御モデルからのパラメータでエンコードすることと;
前記第2のレート制御モデルを更新することと;
をさらに含む、列挙実施形態例34に記載の方法。
1つ以上のピクチャの前記圧縮ビットストリームを完全にまたは部分的に復号することと;
前記完全にまたは部分的に復号されたピクチャを:
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの1つ以上のものの時間的分析を遂行するモジュール;ならびに
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの1つ以上のものの空間的分析を遂行するモジュール;
のうちの1つ以上に送信することと;
レート制御モデルに:
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの前記1つ以上のものの時間的分析を前記遂行すること;ならびに
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの前記1つ以上のものの空間的分析を前記遂行すること;
のうちの1つ以上のことからの出力を送信することと;
ビデオ符号化器において、前記レート制御モデルからのレート制御パラメータ、および前記完全にまたは部分的に復号された1つ以上のピクチャを受信することと;
前記受信された完全にまたは部分的に復号された1つ以上のピクチャを、前記ビデオ符号化器によって、前記受信されたレート制御パラメータを用いて第2のビットストリームにエンコードし圧縮することと;
を含む方法。
ビデオ符号化器において受信することが、ビデオ符号化器において前記バッファからの出力を受信することをさらに含み;さらに
前記受信された完全にまたは部分的に復号された1つ以上のピクチャを、前記受信されたレート制御パラメータを用いて第2のビットストリームにエンコードし圧縮することが、前記バッファからの前記受信された出力を、前記受信されたレート制御パラメータを用いて第2のビットストリームにエンコードし圧縮することをさらに含む;列挙実施形態例38の方法。
1つ以上の動き推定および動き補償(motion estimation and motion compensation、MEMC)モジュール、空間統計量分析モジュール、最初の符号化パス、または複数符号化パスの以前のパスから情報を受信するステップ;
以下のこと:
現在のピクチャの予測誤差を、
2つ以上の以前に符号化されたピクチャの予測誤差;または前記MEMCにおいて収集された統計量;
のうちの少なくとも1つのものの関数として推定すること;ならびに
前記現在のピクチャの空間分散を、前記空間統計量分析モジュールにおいて収集された、以前に符号化されたピクチャの空間分散の関数として推定すること;
のうちの1つ以上を遂行するステップ;
を遂行する、コンピュータ可読媒体。
前記1つ以上の符号化単位毎に、符号化構造、1つ以上の符号化単位のためのスケーリングパラメータ、および1ピクチャ当たりのビット目標を受信するステップ;ならびに
前記1つ以上の符号化単位の各々に配分すべきビット数を:
前記符号化構造;
スケーリングパラメータ;および
ビット目標;
のうちのいずれかを用いて計算するステップ;
を遂行する、コンピュータ可読媒体。
N個の数の符号化単位形式のためのビデオエンコーダにおいて現在のピクチャを受信するステップ;
ただし、前記ビデオエンコーダはM個の数のレート制御モデルを含み、ただし前記N個の数は前記M個の数よりも大きいこと;ならびに
前記現在のピクチャを:
特定の情報;
前記M個のレート制御モデルのうちの少なくとも1つからの1つ以上のパラメータ;および
前記M個のレート制御モデルのうちの前記少なくとも1つからの前記1つ以上のパラメータのうちの少なくとも1つを変換することによって得られる1つ以上のパラメータ;
のうちの1つ以上を用いて符号化するステップ;
を遂行する、コンピュータ可読媒体。
現在のピクチャを受信するステップ;
前記現在のピクチャについてのシーン形式を判定するステップ;
前記判定されたシーン形式に基づいて:
前記シーン形式に適したレート制御モデルを選択するステップ;
デフォルトのレート制御モデルのパラメータを調整するステップ;および
前記デフォルトのレート制御モデルを用いるステップ;
のうちの1つ以上を遂行するステップ;
を遂行する、コンピュータ可読媒体。
イメージシーケンスであって、前記イメージシーケンスの第1の数のピクチャが第1の符号化単位形式のものである、イメージシーケンスを受信するステップ;
前記第1の符号化単位形式に対応する第1のレート制御モデルを用いて前記イメージシーケンスの前記第1の数のピクチャを符号化するステップ;ならびに
前記第1の符号化単位形式に対応する第1のレート制御モデルを用いて前記イメージシーケンスの前記第1の数のピクチャを符号化した後、前記第1のレート制御モデルのパラメータを変換することによって前記イメージシーケンスの現在のピクチャを符号化するステップであって、前記現在のピクチャは、前記第1の符号化単位形式とは異なる第2の符号化単位形式に対応する、符号化するステップ;
を遂行する、コンピュータ可読媒体。
N個の数の符号化単位形式のためのビデオエンコーダを初期化するステップであって、前記ビデオエンコーダはM個の数のレート制御モデルを含み、前記M個のレート制御モデルの各々は前記N個の符号化単位形式の符号化単位形式に対応し、ただしNはMよりも大きい、初期化するステップ;
現在のピクチャを受信するステップ;
前記N個の符号化単位形式のうちの、前記現在のピクチャに対応する符号化単位形式を確定するステップ;ならびに
前記現在のピクチャの前記符号化単位形式が特定の符号化単位形式である場合は:
前記特定の符号化単位形式に対応する特定のレート制御モデルを用いて前記現在のピクチャをエンコードすること;
前記特定のレート制御モデルが収束したかどうかを判定すること;
前記特定のレート制御モデルを更新すること;および
前記特定のレート制御モデルが収束しなかった場合は、前記特定のレート制御モデルを、前記N個の符号化単位形式のうちの第2の符号化単位形式に対応する、前記M個のレート制御モデルのうちの変換された第2のレート制御モデルと混合すること;
を遂行するステップ;
を遂行する、コンピュータ可読媒体。
1つ以上のピクチャの第1の圧縮ビットストリームを受信するステップ;
1つ以上のピクチャの前記圧縮ビットストリームを完全にまたは部分的に復号するステップ;
前記完全にまたは部分的に復号された1つ以上のピクチャを:
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの1つ以上のものの時間的分析を遂行するモジュール;および
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの1つ以上のものの空間的分析を遂行するモジュール;
のうちの1つ以上のものに送信するステップ;
レート制御モデルに:
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの前記1つ以上のものの時間的分析を前記遂行すること;および
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの前記1つ以上のものの空間的分析を前記遂行すること;
のうちの1つ以上からの出力を送信するステップ;
ビデオ符号化器において、前記レート制御モデルからのレート制御パラメータ、および前記完全にまたは部分的に復号された1つ以上のピクチャを受信するステップ;ならびに
前記完全にまたは部分的に復号された1つ以上のピクチャを、前記ビデオ符号化器によって、前記受信されたレート制御パラメータを用いて第2のビットストリームにエンコードし圧縮するステップ;
を遂行する、コンピュータ可読媒体。
現在のピクチャの予測誤差を、
2つ以上の以前に符号化されたピクチャの予測誤差;または前記MEMCにおいて収集された統計量;
のうちの少なくとも1つのものの関数として推定する予測誤差推定器と;
前記空間統計量分析モジュールにおいて収集された、以前に符号化されたピクチャの空間分散の関数として前記現在のピクチャの空間分散を推定する空間分散推定器と;
を含む装置。
ビット配分サブシステムであって、前記1つ以上の符号化単位の各々に配分すべきビット数を、
前記符号化構造;
スケーリングパラメータ;および
ビット目標;
のうちのいずれかを用いて計算する、ビット配分サブシステムと;
を含む装置。
ただし、前記ビデオエンコーダはM個の数のレート制御モデルを含み、ただし前記N個の数は前記M個の数よりも大きいことと;
前記現在のピクチャを:
特定の情報;
前記M個のレート制御モデルのうちの少なくとも1つからの1つ以上のパラメータ;および
前記M個のレート制御モデルのうちの前記少なくとも1つからの前記1つ以上のパラメータのうちの少なくとも1つを変換することによって得られる1つ以上のパラメータ;
のうちの1つ以上を用いて符号化する符号化サブシステムと;
を含む装置。
前記現在のピクチャについてのシーン形式を判定するシーン形式判定サブシステムと;
以下のもの:
前記判定されたシーン形式に基づいて、前記シーン形式に適したレート制御モデルを選択するレート制御モデルセレクタ;
前記判定されたシーン形式に基づいて用いられるデフォルトのレート制御モデル;および
前記判定されたシーン形式に基づいて前記デフォルトのレート制御モデルのパラメータを調整するパラメータ調整器サブシステム、
のうちの1つ以上と;
を含む装置。
前記第1の符号化単位形式に対応する第1のレート制御モデルを用いて前記イメージシーケンスの前記第1の数のピクチャを符号化する第1の符号化サブシステムと;
前記第1の符号化単位形式に対応する前記第1のレート制御モデルを用いて前記イメージシーケンスの前記第1の数のピクチャが符号化された後、前記第1のレート制御モデルのパラメータを変換することによって前記イメージシーケンスの現在のピクチャを符号化する第2の符号化サブシステムであって、前記現在のピクチャは、前記第1の符号化単位形式とは異なる第2の符号化単位形式に対応する、第2の符号化サブシステムと;
を含む装置。
現在のピクチャを受信するピクチャ受信器と;
前記N個の符号化単位形式のうちの、前記現在のピクチャに対応する符号化単位形式を確定する符号化単位形式確定サブシステムと;
前記現在のピクチャの前記符号化単位形式が特定の符号化単位形式である場合は、前記特定の符号化単位形式に対応する特定のレート制御モデルを用いて前記現在のピクチャをエンコードするエンコーダと;
前記現在のピクチャの前記符号化単位形式が特定の符号化単位形式である場合は、前記特定のレート制御モデルが収束したかどうかを判定する収束判定サブシステムと;
前記現在のピクチャの前記符号化単位形式が特定の符号化単位形式である場合は、前記特定のレート制御モデルを更新する更新サブシステムと;
前記特定のレート制御モデルが収束しなかった場合は、前記特定のレート制御モデルを、前記N個の符号化単位形式のうちの第2の符号化単位形式に対応する、前記M個のレート制御モデルのうちの変換された第2のレート制御モデルと混合する混合サブシステムと;
を含む装置。
1つ以上のピクチャの前記圧縮ビットストリームを完全にまたは部分的に復号するデコーダと;
前記完全にまたは部分的に復号された1つ以上のピクチャを:
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの1つ以上のものの時間的分析を遂行するモジュール;ならびに
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの1つ以上のものの空間的分析を遂行するモジュール;
のうちの1つ以上のものに送信する第1の送信サブシステムと;
レート制御モデルに:
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの前記1つ以上のものの時間的分析を前記遂行すること;ならびに
前記完全にまたは部分的に復号された1つ以上のピクチャのうちの前記1つ以上のものの空間的分析を前記遂行すること;
のうちの1つ以上からの出力を送信する第2の送信サブシステムと;
ビデオ符号化器において、前記レート制御モデルからのレート制御パラメータ、および前記完全にまたは部分的に復号された1つ以上のピクチャを受信するレート制御モデル受信器と;
前記完全にまたは部分的に復号された1つ以上のピクチャを、前記受信されたレート制御パラメータを用いて第2のビットストリームにエンコードし圧縮するエンコーダ−圧縮器と;
を含む装置。
前記アンカーピクチャのうちの1つ以上に関して計算される前記現在のピクチャの前記複雑さ推定値;または
前記アンカーピクチャのうちの少なくとも2つの間に存在する複雑さの関係;
ただし、前記アンカーピクチャのうちの前記少なくとも2つは、少なくとも部分的に、前記現在のピクチャの予測となるものであること;
のうちの1つ以上に関連する、列挙実施形態例6に記載の方法。
前記統計量を:
参照ピクチャ以外のピクチャ、またはアンカーピクチャからの情報;あるいは
少なくとも1つの動き補償時間フィルタ、トランスコーディング関連情報、あるいは以前のエンコーディングパスから得られる1つ以上の統計量;
ただし、前記以前のエンコーディングパスは、前記現在のエンコーディングパスの前記符号化構成以外の符号化構成に少なくとも部分的に基づくこと;
に少なくとも部分的に基づいて調整するステップ;
をさらに含む、列挙実施形態例6に記載の方法。
異なる空間的または時間的距離あるいは異なる運動モデルに対応する、1つ以上の予測誤差を比較するステップ;ならびに
前記現在のピクチャと前記以前に符号化されたピクチャとの間の関係を前記比較ステップに少なくとも部分的に基づいて定義するステップ;
を含む、列挙実施形態例6に記載の方法。
前記第1の符号化単位形式の少なくとも第2のフレーム;
少なくとも第2の符号化単位形式の1つ以上のフレーム;または
1つ以上の以前にエンコードされた符号化単位形式;
のうちの1つ以上から求めるステップであって、前記第1の、第2のまたは以前にエンコードされた符号化単位形式のうちの1つ以上はイントラフレーム(Iフレーム)、予測フレーム(Pフレーム)または双方向フレーム(Bフレーム)のうちの少なくとも1つに関連する、求めるステップと;
前記求められた統計量に少なくとも部分的に基づいて、前記第1の、第2のまたは以前にエンコードされた符号化単位形式のうちの1つ以上のものの間の1つ以上の関係を推定するステップであって、前記関係は、前記符号化単位形式の各々に関連付けられるビットレートまたはイメージ品質のうちの1つ以上に対応する、推定するステップと;
前記エンコードされたビデオストリームが前記ビデオエンコーダから伝送される前記レートを、前記量子化パラメータまたは前記推定された関係のうちの1つ以上に基づいて制御するステップと;
を含む方法。
前記ビデオエンコーダの動き推定および補償機能(motion estimation and compensation function、MECF)で生成される統計量を求めるステップと;
ただし、前記レート制御ステップは前記求められたMECF統計量にさらに基づくことと;
をさらに含む、列挙実施形態例61に記載の方法。
以下のもの:
1つ以上の動き推定および動き補償(motion estimation and motion compensation、MEMC)モジュール;
空間統計量分析モジュール;
最初の符号化パス;または
複数の符号化パスの以前のパス;
のうちの1つ以上からの情報を受信するステップ;
以下のステップ:
現在のピクチャの予測誤差を、
2つ以上の以前に符号化されたピクチャの予測誤差;または
前記MEMCにおいて収集される統計量;
のうちの少なくとも1つのものの関数として推定するステップ;あるいは
前記現在のピクチャの空間分散を、前記空間統計量分析モジュールを用いて収集される、以前に符号化されたピクチャの空間分散の関数として推定するステップ;
のうちの1つ以上のステップを遂行するステップ;
を含む、列挙実施形態例62に記載の方法。
現在のフレームを受信するステップと;
前記受信された現在のフレームに対応する1つ以上のイメージ特性から、前記現在のフレームを特徴付けるシーン形式を判定するステップと;
ただし、前記現在のピクチャについての前記シーン形式を前記判定するステップは、前記MEMCモジュールのうちの少なくとも1つからのまたは複数パスビデオ符号化器の以前の符号化パスからの空間時間的統計量を分析することを含むことと;
前記判定されたシーン形式に基づいて:
前記シーン形式に適したレート制御モデルを選択するステップ;または
デフォルトのレート制御モデルに関連付けられるパラメータを調整し、前記調整された関連パラメータを用いて、前記デフォルトのレート制御に基づいて前記レート制御ステップを遂行するステップ;
のうちの1つ以上を遂行するステップと;
をさらに含む、列挙実施形態例63に記載の方法。
1つ以上の符号化単位について、符号化構造、スケーリングパラメータ、および1ピクチャ当たりのビット目標を受信するステップと;
前記1つ以上の符号化単位の各々に配分するビット数を:
前記符号化構造;
前記スケーリングパラメータ;または
前記ビット目標;
のうちの少なくとも1つを用いて計算するステップと;
ただし、前記ビット数を前記計算するステップは:
少なくとも1つの新しいパラメータを前記スケーリングパラメータの関数として計算するステップ;ならびに
前記第1の符号化単位形式に配分される前記量子化パラメータ(quantization parameter、QP)値が、前記第2の符号化単位形式または前記以前にエンコードされた符号化単位形式のうちの1つ以上に配分される前記QP値とは異なることを可能とするステップ;
を含むことと;
をさらに含む、列挙実施形態例61に記載の方法。
N個の数の符号化単位形式のための前記ビデオエンコーダにおいて現在のフレームを受信するステップと;
ただし、前記ビデオエンコーダはM個の数のレート制御モデルを含み、ただし前記N個の数は前記M個の数よりも大きいことと;
前記現在のフレームを:
前記現在のフレームに関連する特定の情報;
前記M個のレート制御モデルのうちの少なくとも1つからの1つ以上の符号化パラメータ;または
前記M個のレート制御モデルのうちの前記少なくとも1つからの前記符号化パラメータのうちの少なくとも1つを変換することによって得られる1つ以上の符号化パラメータ;
のうちの1つ以上を用いて符号化するステップと;
をさらに含む、列挙実施形態例61に記載の方法。
前記エンコードされたビデオストリーム内のイメージのシーケンスを受信するステップであって、前記イメージシーケンスの第1の数のピクチャは前記第1の符号化単位形式である、受信するステップと;
前記第1の符号化単位形式に対応する第1のレート制御モデルを用いて前記イメージシーケンスの前記第1の数のピクチャをエンコードするステップと;
前記第1の符号化単位形式に対応する前記第1のレート制御モデルを用いて前記イメージシーケンスの前記第1の数のピクチャをエンコードする際、前記イメージシーケンスの現在のフレームをエンコードするステップであって、前記現在のフレームは、前記第1の符号化単位形式とは異なる第2の符号化単位形式に対応する、エンコードするステップと;
ただし、前記現在のフレームを前記エンコードするステップは:
前記第1のレート制御モデルに対応するパラメータを変換するステップ;
ただし、前記第1のレート制御モデルのパラメータを前記変換するステップは、前記MEMCモジュールまたは以前の符号化パスのうちの少なくとも1つからの統計量を用いることを含むこと;ならびに
前記変換されたパラメータに基づいて前記現在のフレームをエンコードするステップ;
を含むことと;
をさらに含む、列挙実施形態例61に記載の方法。
M個の数のレート制御モデルを初期化するステップと;
N個の数の符号化単位形式ピクチャについて、N個の目標ビットを計算するステップと;
ただし、前記N個の数は前記M個の数よりも大きいかまたはそれに等しいことと;
現在のピクチャを受信するステップと;
前記現在のピクチャについて前記N個の符号化単位形式の各々の前記符号化単位形式を確定するステップと;
前記現在のピクチャの前記符号化単位形式が特定の符号化単位形式である場合は:
前記特定の符号化単位形式に対応する特定の符号化パラメータを用いるか、または前記M個のレート制御モデルのうちの、前記特定の符号化単位形式に対応する特定のレート制御モデルを用いるステップ;
前記特定の符号化パラメータまたは特定のレート制御モデルに基づいて前記現在のピクチャをエンコードするステップ;
前記特定の符号化単位形式に対応するスケーリングパラメータを更新し;各符号化単位形式について前記N個の目標ビットを再計算するステップ;
を遂行するステップと;
をさらに含む、列挙実施形態例61に記載の方法。
前記第1の符号化単位形式の少なくとも第2のフレーム;
少なくとも第2の符号化単位形式の1つ以上のフレーム;または
1つ以上の以前にエンコードされた符号化単位形式;
のうちの1つ以上から求める手段であって、前記第1の、第2のまたは以前にエンコードされた符号化単位形式のうちの1つ以上はイントラフレーム(Iフレーム)、予測フレーム(Pフレーム)または双方向フレーム(Bフレーム)のうちの少なくとも1つに関連する、求める手段と;
前記求められた統計量に少なくとも部分的に基づいて、前記第1の、第2のまたは以前にエンコードされた符号化単位形式のうちの1つ以上のものの間の1つ以上の関係を推定する手段であって、前記関係は、前記符号化単位形式の各々に関連付けられるビットレートまたはイメージ品質のうちの1つ以上に対応する、推定する手段と;
前記量子化パラメータまたは前記推定された関係のうちの1つ以上に基づいて、前記エンコードされたビデオストリームが前記ビデオエンコーダから伝送される前記レートを制御する手段と;
を含むシステム。
前記システムの1つ以上の要素を通信可能に、電気的に、光学的にまたは電子的に相互結合するバスと;
前記バスに通信可能に、電気的に、光学的にまたは電子的に結合されるとともに、エンコードされた命令を含むコンピュータ可読記憶媒体と;
前記バスに通信可能に、電気的に、光学的にまたは電子的に結合されるとともに前記コンピュータ可読記憶媒体とインタラクティブに相互結合される1つ以上のプロセッサであって、前記エンコードされた命令のうちの1つ以上を実行する際:
エンコードされたビデオフレームのストリーム内の第1の符号化単位形式の第1のフレームの1つ以上のエンコーディング量子化パラメータをビデオエンコーダ内で推定するための統計量を:
前記第1の符号化単位形式の少なくとも第2のフレーム;
少なくとも第2の符号化単位形式の1つ以上のフレーム;または
1つ以上の以前にエンコードされた符号化単位形式;
のうちの1つ以上から求めるステップであって、前記第1の、第2のまたは以前にエンコードされた符号化単位形式のうちの1つ以上はイントラフレーム(Iフレーム)、予測フレーム(Pフレーム)または双方向フレーム(Bフレーム)のうちの少なくとも1つに関連する、求めるステップ;
前記求められた統計量に少なくとも部分的に基づいて、前記第1の、第2のまたは以前にエンコードされた符号化単位形式のうちの1つ以上のものの間の1つ以上の関係を推定するステップであって、前記関係は、前記符号化単位形式の各々に関連付けられるビットレートまたはイメージ品質のうちの1つ以上に対応する、推定するステップ;ならびに
前記エンコードされたビデオストリームが前記ビデオエンコーダから伝送される前記レートを、前記量子化パラメータまたは前記推定された関係のうちの1つ以上に基づいて制御するステップ;
を含むプロセスを制御するまたは生じさせるプロセッサと;
を含むシステム。
前記第1の符号化単位形式の少なくとも第2のフレーム;
少なくとも第2の符号化単位形式の1つ以上のフレーム;または
1つ以上の以前にエンコードされた符号化単位形式;
のうちの1つ以上から求める要素またはモジュールであって、前記第1の、第2のまたは以前にエンコードされた符号化単位形式のうちの1つ以上はイントラフレーム(Iフレーム)、予測フレーム(Pフレーム)または双方向フレーム(Bフレーム)のうちの少なくとも1つに関連する、求める要素またはモジュールと;
前記求められた統計量に少なくとも部分的に基づいて、前記第1の、第2のまたは以前にエンコードされた符号化単位形式のうちの1つ以上のものの間の1つ以上の関係を推定する要素またはモジュールであって、前記関係は、前記符号化単位形式の各々に関連付けられるビットレートまたはイメージ品質のうちの1つ以上に対応する、推定する要素またはモジュールと;
前記エンコードされたビデオストリームが前記ビデオエンコーダから伝送される前記レートを、前記量子化パラメータまたは前記推定された関係のうちの1つ以上に基づいて制御する要素またはモジュールと;
を含むイメージエンコーダ。
上述の明細書においては、本発明の実施形態が、実装によって異なってよい数多くの特定の詳細を参照しながら記載されている。従って、本発明、および出願人によって本発明として意図されるものを唯一かつ排他的に示すのは、本出願から発する、後の任意の訂正を含む、特定の形の請求項群である。このような請求項に包含される用語については、本願明細書において明示的に説明されている任意の定義が、請求項において用いられる用語の意味に適用されるものとする。従って、請求項の範囲は、請求項において明示的に記載されていない限定、要素、特性、特徴、利点または属性によって決して限定されてはならない。故に、明細書および図面は、限定的ではなく例示的な意味で考えられるべきものである。
Claims (3)
- N個の数の符号化単位形式のためのビデオエンコーダにおいて現在のピクチャを受信する段階と、前記ビデオエンコーダはM個の数のレート制御モデルを含み、前記N個の数は前記M個の数よりも大きく、
変換されたパラメータの第1のセットを生成するために、少なくとも1つのスケーリングパラメータ又は変換パラメータを用いて前記M個のレート制御モデルのうちの少なくとも1つからの1つ以上の符号化パラメータを変換する段階と、
変換されたパラメータの前記第1のセットを少なくとも用いて前記現在のピクチャを符号化する段階とを含み、前記現在のピクチャは、前記M個のレート制御モデルのうちのいずれにも対応しない符号化単位形式によって特徴付けられ、
当該方法は、
前記現在のピクチャを含むピクチャのシーケンス内の1つ以上の他のピクチャに関連する統計量を収集する段階と、
前記統計量に基づいて前記少なくとも1つのスケーリングパラメータ又は変換パラメータを調整する段階と、
前記M個のレート制御モデルのうちの前記少なくとも1つからの1つ以上の符号化パラメータを、変換されたパラメータの第2のセットに変換する段階と、
変換されたパラメータの前記第2のセットを少なくとも用いて第2のピクチャを符号化する段階とを更に含み、
前記統計量は、前記ビデオエンコーダの動き推定及び補償機能(MECF: Motion Estimation and Compensation Function)を用いて生成され、
前記少なくとも1つのスケーリングパラメータのうちの第一のスケーリングパラメータの計算は、
現在のピクチャをI符号化ピクチャとして符号化するために使われたビット数を正規化して第一の結果を生成し、生成した第一の結果をI符号化ピクチャビット統計量バッファに記憶すること、前記第一の結果を最新のP符号化ピクチャを符号化するために使われたビット数で除算してビット比の値を生成し、生成したビット値の比をI符号化ピクチャ比統計量バッファに記憶すること、及び前記I符号化ピクチャ比統計量バッファに記憶されているビット比の値の平均に基づいて前記第一のスケーリングパラメータを計算すること、を含み、
前記少なくとも1つのスケーリングパラメータのうちの第二のスケーリングパラメータの計算は、現在のピクチャをB符号化ピクチャとして符号化するために使われたビット数を正規化して第二の結果を生成し、生成した第二の結果をB符号化ピクチャビット統計量バッファに記憶すること、前記第二の結果を最新のP符号化ピクチャを符号化するために使われたビット数で除算してビット比の値を生成し、生成したビット値の比をB符号化ピクチャ比統計量バッファに記憶すること、及び前記B符号化ピクチャ比統計量バッファに記憶されているビット比の値の平均に基づいて前記第二のスケーリングパラメータを計算すること、を含む、
方法。 - N個の数の符号化単位形式のためのビデオエンコーダにおいて現在のピクチャを受信する手段と、前記ビデオエンコーダはM個の数のレート制御モデルを含み、前記N個の数は前記M個の数よりも大きく、
変換されたパラメータの第1のセットを生成するために、少なくとも1つのスケーリングパラメータ又は変換パラメータを用いて前記M個のレート制御モデルのうちの少なくとも1つからの1つ以上の符号化パラメータを変換する手段と、
変換されたパラメータの前記第1のセットを少なくとも用いて前記現在のピクチャを符号化する手段とを備える装置であって、前記現在のピクチャは、前記M個のレート制御モデルのうちのいずれにも対応しない符号化単位形式によって特徴付けられ、
当該装置は、
前記現在のピクチャを含むピクチャのシーケンス内の1つ以上の他のピクチャに関連する統計量を収集する手段と、
前記統計量に基づいて前記少なくとも1つのスケーリングパラメータ又は変換パラメータを調整する手段と、
前記M個のレート制御モデルのうちの前記少なくとも1つからの1つ以上の符号化パラメータを、変換されたパラメータの第2のセットに変換する手段と、
変換されたパラメータの前記第2のセットを少なくとも用いて第2のピクチャを符号化する手段とを更に備え、
前記統計量は、前記ビデオエンコーダの動き推定及び補償機能(MECF: Motion Estimation and Compensation Function)を用いて生成され、
前記少なくとも1つのスケーリングパラメータのうちの第一のスケーリングパラメータの計算は、
現在のピクチャをI符号化ピクチャとして符号化するために使われたビット数を正規化して第一の結果を生成し、生成した第一の結果をI符号化ピクチャビット統計量バッファに記憶すること、前記第一の結果を最新のP符号化ピクチャを符号化するために使われたビット数で除算してビット比の値を生成し、生成したビット値の比をI符号化ピクチャ比統計量バッファに記憶すること、及び前記I符号化ピクチャ比統計量バッファに記憶されているビット比の値の平均に基づいて前記第一のスケーリングパラメータを計算すること、を含み、
前記少なくとも1つのスケーリングパラメータのうちの第二のスケーリングパラメータの計算は、現在のピクチャをB符号化ピクチャとして符号化するために使われたビット数を正規化して第二の結果を生成し、生成した第二の結果をB符号化ピクチャビット統計量バッファに記憶すること、前記第二の結果を最新のP符号化ピクチャを符号化するために使われたビット数で除算してビット比の値を生成し、生成したビット値の比をB符号化ピクチャ比統計量バッファに記憶すること、及び前記B符号化ピクチャ比統計量バッファに記憶されているビット比の値の平均に基づいて前記第二のスケーリングパラメータを計算すること、を含む、
装置。 - 1つ以上のプロセッサに、請求項1に記載の方法を実行させる命令を含むプログラムを記録したコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US6194108P | 2008-06-16 | 2008-06-16 | |
US61/061,941 | 2008-06-16 | ||
PCT/US2009/047317 WO2010005691A1 (en) | 2008-06-16 | 2009-06-15 | Rate control model adaptation based on slice dependencies for video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011525094A JP2011525094A (ja) | 2011-09-08 |
JP5400876B2 true JP5400876B2 (ja) | 2014-01-29 |
Family
ID=41040395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011514726A Expired - Fee Related JP5400876B2 (ja) | 2008-06-16 | 2009-06-15 | ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8891619B2 (ja) |
EP (1) | EP2286595A1 (ja) |
JP (1) | JP5400876B2 (ja) |
KR (1) | KR101350723B1 (ja) |
CN (1) | CN102067610B (ja) |
WO (1) | WO2010005691A1 (ja) |
Families Citing this family (165)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100271554A1 (en) * | 2007-09-10 | 2010-10-28 | Volker Blume | Method And Apparatus For Motion Estimation In Video Image Data |
JP4569840B2 (ja) * | 2007-09-12 | 2010-10-27 | ソニー株式会社 | 画像符号化装置、画像符号化方法 |
KR101350723B1 (ko) | 2008-06-16 | 2014-01-16 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 비디오 코딩을 위한 슬라이스 종속성에 기초한 레이트 제어 모델 적응 방법 |
WO2009157581A1 (ja) * | 2008-06-27 | 2009-12-30 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
BRPI0904324A2 (pt) * | 2008-06-27 | 2015-06-30 | Sony Corp | Dispositivo de processamento de imagem, e, método de processamento de imagem |
JP5472106B2 (ja) * | 2008-06-27 | 2014-04-16 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
RU2502213C2 (ru) * | 2008-06-27 | 2013-12-20 | Сони Корпорейшн | Устройство обработки изображений и способ обработки изображений |
US8385404B2 (en) | 2008-09-11 | 2013-02-26 | Google Inc. | System and method for video encoding using constructed reference frame |
US8385676B2 (en) * | 2009-07-30 | 2013-02-26 | Hewlett-Packard Development Company, L.P. | Context-cluster-level control of filtering iterations in an iterative discrete universal denoiser |
US20110064129A1 (en) * | 2009-09-16 | 2011-03-17 | Broadcom Corporation | Video capture and generation at variable frame rates |
US8861879B2 (en) * | 2009-09-17 | 2014-10-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding image based on skip mode |
US8897370B1 (en) * | 2009-11-30 | 2014-11-25 | Google Inc. | Bitrate video transcoding based on video coding complexity estimation |
EP2520092A1 (en) * | 2009-12-31 | 2012-11-07 | Thomson Licensing | Methods and apparatus for adaptive coupled pre-processing and post-processing filters for video encoding and decoding |
WO2011084918A1 (en) | 2010-01-06 | 2011-07-14 | Dolby Laboratories Licensing Corporation | High performance rate control for multi-layered video coding applications |
KR20110123651A (ko) | 2010-05-07 | 2011-11-15 | 한국전자통신연구원 | 생략 부호화를 이용한 영상 부호화 및 복호화 장치 및 그 방법 |
JP2012034213A (ja) * | 2010-07-30 | 2012-02-16 | Toshiba Corp | 画像処理装置、画像処理システムおよび画像処理方法 |
CN101951504B (zh) | 2010-09-07 | 2012-07-25 | 中国科学院深圳先进技术研究院 | 基于重叠边界的多媒体切片转码方法和系统 |
KR101677480B1 (ko) * | 2010-09-07 | 2016-11-21 | 에스케이 텔레콤주식회사 | 효과적인 화면내 예측모드 집합 선택을 이용한 영상 부호화/복호화 방법 및 장치 |
US9094685B2 (en) * | 2010-09-21 | 2015-07-28 | Dialogic Corporation | Efficient coding complexity estimation for video transcoding systems |
US8786625B2 (en) * | 2010-09-30 | 2014-07-22 | Apple Inc. | System and method for processing image data using an image signal processor having back-end processing logic |
EP2458861A1 (en) * | 2010-11-25 | 2012-05-30 | ST-Ericsson SA | Bit rate regulation module and method for regulating bit rate |
JP5988252B2 (ja) | 2011-01-12 | 2016-09-07 | サン パテント トラスト | 複数の参照ピクチャを用いた、動画像符号化方法、動画像復号方法、動画像符号化装置、及び、動画像復号装置 |
US9307262B2 (en) * | 2011-01-13 | 2016-04-05 | Texas Instruments Incorporated | Methods and systems for facilitating multimedia data encoding utilizing configured buffer information |
US8750383B2 (en) * | 2011-01-17 | 2014-06-10 | Exaimage Corporation | Systems and methods for wavelet and channel-based high definition video encoding |
US9066097B2 (en) * | 2011-02-01 | 2015-06-23 | Sony Corporation | Method to optimize the transforms and/or predictions in a video codec |
JP6078883B2 (ja) * | 2011-02-08 | 2017-02-15 | サン パテント トラスト | 多数の参照ピクチャを用いる動画像符号化方法、動画像復号方法、動画像符号化装置、および動画像復号方法 |
WO2012117744A1 (en) | 2011-03-03 | 2012-09-07 | Panasonic Corporation | Method of encoding an image into a coded image, method of decoding a coded image, and apparatuses thereof |
US9282333B2 (en) * | 2011-03-18 | 2016-03-08 | Texas Instruments Incorporated | Methods and systems for masking multimedia data |
US8638854B1 (en) | 2011-04-07 | 2014-01-28 | Google Inc. | Apparatus and method for creating an alternate reference frame for video compression using maximal differences |
US8804820B2 (en) * | 2011-04-21 | 2014-08-12 | Dialogic Corporation | Rate control with look-ahead for video transcoding |
JP2012253722A (ja) * | 2011-06-07 | 2012-12-20 | Sony Corp | 画像符号化装置と画像復号装置およびその方法とプログラム |
KR20120138604A (ko) | 2011-06-14 | 2012-12-26 | 삼성전자주식회사 | 멀티미디어 시스템에서 복합 미디어 컨텐츠를 송수신하는 방법 및 장치 |
EP2724537A1 (en) * | 2011-06-22 | 2014-04-30 | Motorola Mobility LLC | Construction of combined list using temporal distance |
GB2492163B (en) | 2011-06-24 | 2018-05-02 | Skype | Video coding |
GB2492330B (en) | 2011-06-24 | 2017-10-18 | Skype | Rate-Distortion Optimization with Encoding Mode Selection |
GB2492329B (en) | 2011-06-24 | 2018-02-28 | Skype | Video coding |
US9369723B2 (en) * | 2011-07-14 | 2016-06-14 | Comcast Cable Communications, Llc | Preserving image quality in temporally compressed video streams |
US8792550B2 (en) * | 2011-08-04 | 2014-07-29 | Qualcomm Incorporated | Color/gray patch prevention for video coding |
GB2493777A (en) * | 2011-08-19 | 2013-02-20 | Skype | Image encoding mode selection based on error propagation distortion map |
GB2495467B (en) | 2011-09-02 | 2017-12-13 | Skype | Video coding |
GB2495468B (en) | 2011-09-02 | 2017-12-13 | Skype | Video coding |
GB2495469B (en) | 2011-09-02 | 2017-12-13 | Skype | Video coding |
WO2013047811A1 (ja) * | 2011-09-29 | 2013-04-04 | シャープ株式会社 | 画像復号装置、画像復号方法および画像符号化装置 |
CN103858430B (zh) | 2011-09-29 | 2017-05-03 | 夏普株式会社 | 图像解码装置、图像解码方法及图像编码装置 |
EP2579593A1 (en) * | 2011-10-04 | 2013-04-10 | Thomson Licensing | Adaptive quantisation for intra-encoded image blocks |
JP6034010B2 (ja) * | 2011-10-24 | 2016-11-30 | ソニー株式会社 | 符号化装置、符号化方法、およびプログラム |
US20130107962A1 (en) | 2011-10-26 | 2013-05-02 | Intellectual Discovery Co., Ltd. | Scalable video coding method and apparatus using inter prediction mode |
JP6080375B2 (ja) * | 2011-11-07 | 2017-02-15 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
US20130114694A1 (en) * | 2011-11-08 | 2013-05-09 | Qualcomm Incorporated | Parameter set groups for coded video data |
TWI685249B (zh) * | 2011-12-21 | 2020-02-11 | 日商Jvc建伍股份有限公司 | 動態影像編碼裝置、動態影像編碼方法、及儲存有動態影像編碼程式之記錄媒體 |
JP5988577B2 (ja) * | 2011-12-28 | 2016-09-07 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム |
US9451252B2 (en) | 2012-01-14 | 2016-09-20 | Qualcomm Incorporated | Coding parameter sets and NAL unit headers for video coding |
US9020294B2 (en) * | 2012-01-18 | 2015-04-28 | Dolby Laboratories Licensing Corporation | Spatiotemporal metrics for rate distortion optimization |
US9426459B2 (en) | 2012-04-23 | 2016-08-23 | Google Inc. | Managing multi-reference picture buffers and identifiers to facilitate video data coding |
US9609341B1 (en) | 2012-04-23 | 2017-03-28 | Google Inc. | Video data encoding and decoding using reference picture lists |
CN103428523B (zh) * | 2012-05-22 | 2015-07-08 | 华为技术有限公司 | 评估视频质量的方法和装置 |
US11089247B2 (en) | 2012-05-31 | 2021-08-10 | Apple Inc. | Systems and method for reducing fixed pattern noise in image data |
US9743057B2 (en) | 2012-05-31 | 2017-08-22 | Apple Inc. | Systems and methods for lens shading correction |
US9031319B2 (en) | 2012-05-31 | 2015-05-12 | Apple Inc. | Systems and methods for luma sharpening |
US9532080B2 (en) | 2012-05-31 | 2016-12-27 | Sonic Ip, Inc. | Systems and methods for the reuse of encoding information in encoding alternative streams of video data |
US9025867B2 (en) | 2012-05-31 | 2015-05-05 | Apple Inc. | Systems and methods for YCC image processing |
US9077943B2 (en) | 2012-05-31 | 2015-07-07 | Apple Inc. | Local image statistics collection |
US8872946B2 (en) | 2012-05-31 | 2014-10-28 | Apple Inc. | Systems and methods for raw image processing |
US9014504B2 (en) | 2012-05-31 | 2015-04-21 | Apple Inc. | Systems and methods for highlight recovery in an image signal processor |
US9142012B2 (en) | 2012-05-31 | 2015-09-22 | Apple Inc. | Systems and methods for chroma noise reduction |
US9332239B2 (en) | 2012-05-31 | 2016-05-03 | Apple Inc. | Systems and methods for RGB image processing |
US9105078B2 (en) | 2012-05-31 | 2015-08-11 | Apple Inc. | Systems and methods for local tone mapping |
US8917336B2 (en) | 2012-05-31 | 2014-12-23 | Apple Inc. | Image signal processing involving geometric distortion correction |
US8817120B2 (en) | 2012-05-31 | 2014-08-26 | Apple Inc. | Systems and methods for collecting fixed pattern noise statistics of image data |
US8953882B2 (en) | 2012-05-31 | 2015-02-10 | Apple Inc. | Systems and methods for determining noise statistics of image data |
US9762903B2 (en) * | 2012-06-01 | 2017-09-12 | Qualcomm Incorporated | External pictures in video coding |
EP2859729B1 (en) * | 2012-06-12 | 2020-09-16 | Coherent Logix, Incorporated | A distributed architecture for encoding and delivering video content |
US10178140B2 (en) * | 2012-07-10 | 2019-01-08 | Vid Scale, Inc | Quality-driven streaming |
JP2015528247A (ja) * | 2012-07-17 | 2015-09-24 | トムソン ライセンシングThomson Licensing | ビットストリームレベルにおけるビデオ品質評価 |
US20140056347A1 (en) * | 2012-08-23 | 2014-02-27 | Microsoft Corporation | Non-Transform Coding |
US20140086328A1 (en) * | 2012-09-25 | 2014-03-27 | Qualcomm Incorporated | Scalable video coding in hevc |
JP6172535B2 (ja) * | 2012-09-26 | 2017-08-02 | サン パテント トラスト | 画像復号方法および画像復号装置 |
US9549189B2 (en) * | 2012-11-06 | 2017-01-17 | Ittiam Systems (P) Ltd. | Method for media rate control in a video encoding system |
US9135723B1 (en) * | 2012-12-19 | 2015-09-15 | Marvell International Ltd. | Efficient visually lossless compression |
CN103079065B (zh) * | 2012-12-27 | 2016-08-03 | 华为技术有限公司 | 一种视频数据处理方法以及装置 |
US9357210B2 (en) * | 2013-02-28 | 2016-05-31 | Sonic Ip, Inc. | Systems and methods of encoding multiple video streams for adaptive bitrate streaming |
US9350990B2 (en) * | 2013-02-28 | 2016-05-24 | Sonic Ip, Inc. | Systems and methods of encoding multiple video streams with adaptive quantization for adaptive bitrate streaming |
US20140307803A1 (en) | 2013-04-08 | 2014-10-16 | Qualcomm Incorporated | Non-entropy encoded layer dependency information |
KR102161741B1 (ko) * | 2013-05-02 | 2020-10-06 | 삼성전자주식회사 | HEVC(high efficiency video coding)에서 코딩 유닛에 대한 양자화 파라미터를 변화시키는 방법과 장치, 및 시스템 |
US9756331B1 (en) | 2013-06-17 | 2017-09-05 | Google Inc. | Advance coded reference prediction |
US9565440B2 (en) * | 2013-06-25 | 2017-02-07 | Vixs Systems Inc. | Quantization parameter adjustment based on sum of variance and estimated picture encoding cost |
US20150023436A1 (en) | 2013-07-22 | 2015-01-22 | Texas Instruments Incorporated | Method and apparatus for noise reduction in video systems |
US20150071343A1 (en) * | 2013-09-12 | 2015-03-12 | Magnum Semiconductor, Inc. | Methods and apparatuses including an encoding system with temporally adaptive quantization |
FR3011429A1 (fr) * | 2013-09-27 | 2015-04-03 | Orange | Codage et decodage video par heritage d'un champ de vecteurs de mouvement |
WO2015045736A1 (ja) * | 2013-09-30 | 2015-04-02 | 日本放送協会 | 画像符号化装置、画像復号装置及びそれらのプログラム |
JP2015070488A (ja) * | 2013-09-30 | 2015-04-13 | Kddi株式会社 | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム |
CN105849800B (zh) | 2013-12-02 | 2020-04-10 | 杜比国际公司 | 位速率估值确定方法、位速率估算器、多路复用设备、位流提供方法和编码系统 |
CN104717500B (zh) * | 2013-12-12 | 2018-04-06 | 中国电信股份有限公司 | 一种视频编码码率控制方法和系统 |
WO2015095166A2 (en) * | 2013-12-16 | 2015-06-25 | Arris Enterprises, Inc. | Producing an output need parameter for an encoder |
FR3016764B1 (fr) * | 2014-01-17 | 2016-02-26 | Sagemcom Broadband Sas | Procede et dispositif de transcodage de donnees video de h.264 vers h.265 |
CN103888765B (zh) * | 2014-03-27 | 2015-09-30 | 天格科技(杭州)有限公司 | 一种改进型R-λ模型H.265码率控制方法 |
GB2525208B (en) * | 2014-04-15 | 2020-04-08 | Advanced Risc Mach Ltd | Method of and apparatus for generating an encoded frame |
US10397574B2 (en) * | 2014-05-12 | 2019-08-27 | Intel Corporation | Video coding quantization parameter determination suitable for video conferencing |
US9807398B2 (en) * | 2014-09-30 | 2017-10-31 | Avago Technologies General Ip (Singapore) Pte. Ltd. | Mode complexity based coding strategy selection |
FR3029381A1 (fr) * | 2014-11-27 | 2016-06-03 | Orange | Procede de composition d’une representation video intermediaire |
US10021396B1 (en) * | 2014-12-30 | 2018-07-10 | Ambarella, Inc. | Motion detection based on observing several pictures |
US11356709B2 (en) * | 2015-01-05 | 2022-06-07 | Arris Enterprises Llc | Using motion compensated temporal filter (MCTF) statistics for scene change detection when a fade, dissolve or cut occurs |
KR102365685B1 (ko) | 2015-01-05 | 2022-02-21 | 삼성전자주식회사 | 인코더의 작동 방법과 상기 인코더를 포함하는 장치들 |
US10165272B2 (en) * | 2015-01-29 | 2018-12-25 | Arris Enterprises Llc | Picture-level QP rate control performance improvements for HEVC encoding |
US10313675B1 (en) * | 2015-01-30 | 2019-06-04 | Google Llc | Adaptive multi-pass video encoder control |
CN104683804B (zh) * | 2015-02-14 | 2017-12-29 | 北京航空航天大学 | 基于视频内容特征的参数自适应多维码率控制方法 |
US9936203B2 (en) * | 2015-04-13 | 2018-04-03 | Qualcomm Incorporated | Complex region detection for display stream compression |
US10244255B2 (en) | 2015-04-13 | 2019-03-26 | Qualcomm Incorporated | Rate-constrained fallback mode for display stream compression |
US10284849B2 (en) | 2015-04-13 | 2019-05-07 | Qualcomm Incorporated | Quantization parameter (QP) calculation for display stream compression (DSC) based on complexity measure |
US10356428B2 (en) | 2015-04-13 | 2019-07-16 | Qualcomm Incorporated | Quantization parameter (QP) update classification for display stream compression (DSC) |
CN104796694B (zh) * | 2015-04-30 | 2017-08-15 | 上海交通大学 | 基于视频纹理信息的优化帧内视频编码方法 |
CN104902275B (zh) * | 2015-05-29 | 2018-04-20 | 宁波菊风系统软件有限公司 | 一种控制视频通信质量甜点的方法 |
CN104994387B (zh) * | 2015-06-25 | 2017-10-31 | 宁波大学 | 一种融合图像特征的码率控制方法 |
CN106331704B (zh) * | 2015-07-07 | 2019-10-22 | 杭州海康威视数字技术股份有限公司 | 一种视频码率控制方法及视频编码装置 |
FR3040849A1 (fr) * | 2015-09-04 | 2017-03-10 | Stmicroelectronics (Grenoble 2) Sas | Procede de compression d'un flux de donnees video |
KR102492318B1 (ko) | 2015-09-18 | 2023-01-26 | 삼성전자주식회사 | 모델 학습 방법 및 장치, 및 데이터 인식 방법 |
CN106559671B (zh) * | 2015-09-30 | 2019-08-23 | 展讯通信(上海)有限公司 | 一种显示图像压缩方法及系统 |
US10432952B2 (en) * | 2015-11-19 | 2019-10-01 | Qualcomm Incorporated | System and methods for fixed-point approximations in display stream compression (DSC) |
US10805635B1 (en) * | 2016-03-22 | 2020-10-13 | NGCodec Inc. | Apparatus and method for coding tree unit bit size limit management |
CN105872594A (zh) * | 2016-03-30 | 2016-08-17 | 乐视控股(北京)有限公司 | 实时码率调节方法、装置及服务端设备 |
WO2018023554A1 (en) * | 2016-08-04 | 2018-02-08 | SZ DJI Technology Co., Ltd. | System and methods for bit rate control |
WO2018027237A1 (en) | 2016-08-05 | 2018-02-08 | Sportscastr.Live Llc | Systems, apparatus, and methods for scalable low-latency viewing of broadcast digital content streams of live events |
US10635274B2 (en) | 2016-09-21 | 2020-04-28 | Iunu, Inc. | Horticultural care tracking, validation and verification |
US10791037B2 (en) * | 2016-09-21 | 2020-09-29 | Iunu, Inc. | Reliable transfer of numerous geographically distributed large files to a centralized store |
US11538099B2 (en) | 2016-09-21 | 2022-12-27 | Iunu, Inc. | Online data market for automated plant growth input curve scripts |
US11244398B2 (en) | 2016-09-21 | 2022-02-08 | Iunu, Inc. | Plant provenance and data products from computer object recognition driven tracking |
JP2017069987A (ja) * | 2017-01-18 | 2017-04-06 | 株式会社東芝 | 動画像符号化装置及び動画像符号化方法 |
CN107078852B (zh) * | 2017-01-18 | 2019-03-08 | 深圳市大疆创新科技有限公司 | 传输编码数据的方法、装置、计算机系统和移动设备 |
CN106961604B (zh) * | 2017-03-07 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 视频编码的码率分配、编码单元码率分配方法及装置 |
CN106937118B (zh) * | 2017-03-13 | 2019-09-13 | 西安电子科技大学 | 一种基于主观感兴趣区域和时空域相结合的码率控制方法 |
WO2018213481A1 (en) | 2017-05-16 | 2018-11-22 | Sportscastr.Live Llc | Systems, apparatus, and methods for scalable low-latency viewing of integrated broadcast commentary and event video streams of live events, and synchronization of event information with viewed streams via multiple internet channels |
US10608901B2 (en) | 2017-07-12 | 2020-03-31 | Cisco Technology, Inc. | System and method for applying machine learning algorithms to compute health scores for workload scheduling |
US11877001B2 (en) | 2017-10-10 | 2024-01-16 | Qualcomm Incorporated | Affine prediction in video coding |
JP6910461B2 (ja) * | 2017-10-27 | 2021-07-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法及び復号方法 |
WO2019104635A1 (en) | 2017-11-30 | 2019-06-06 | SZ DJI Technology Co., Ltd. | System and method for controlling video coding at frame level |
EP3695600A1 (en) * | 2017-11-30 | 2020-08-19 | SZ DJI Technology Co., Ltd. | System and method for controlling video coding within image frame |
WO2019104862A1 (en) | 2017-11-30 | 2019-06-06 | SZ DJI Technology Co., Ltd. | System and method for reducing video coding fluctuation |
CN109076212A (zh) * | 2017-12-27 | 2018-12-21 | 深圳市大疆创新科技有限公司 | 码率控制的方法与编码装置 |
CN108200428B (zh) * | 2018-01-29 | 2020-05-08 | 上海兆芯集成电路有限公司 | 宏块层中的码率的控制方法以及使用该方法的装置 |
US11062516B2 (en) | 2018-02-07 | 2021-07-13 | Iunu, Inc. | Augmented reality based horticultural care tracking |
CN110324622B (zh) * | 2018-03-28 | 2022-09-23 | 腾讯科技(深圳)有限公司 | 一种视频编码码率控制方法、装置、设备及存储介质 |
US10834409B2 (en) * | 2018-04-06 | 2020-11-10 | Arris Enterprises Llc | System and method of implementing multiple prediction models for local illumination compensation |
US11830225B2 (en) * | 2018-05-30 | 2023-11-28 | Ati Technologies Ulc | Graphics rendering with encoder feedback |
US10560696B2 (en) * | 2018-06-25 | 2020-02-11 | Tfi Digital Media Limited | Method for initial quantization parameter optimization in video coding |
CN108810545B (zh) * | 2018-07-04 | 2023-04-18 | 中南大学 | 用于视频编码的方法、装置、计算机可读介质及电子设备 |
US11381833B2 (en) * | 2018-07-19 | 2022-07-05 | Tencent America LLC | Method and apparatus for video coding |
JP2020028044A (ja) * | 2018-08-13 | 2020-02-20 | 富士通株式会社 | 符号化装置および符号化方法 |
US10674152B2 (en) * | 2018-09-18 | 2020-06-02 | Google Llc | Efficient use of quantization parameters in machine-learning models for video coding |
WO2020089215A1 (en) * | 2018-10-29 | 2020-05-07 | Dolby International Ab | Methods and apparatus for rate quality scalable coding with generative models |
CN109561311A (zh) * | 2018-12-07 | 2019-04-02 | 莆田学院 | 一种基于ρ域的三维视频编码码率控制方法及存储设备 |
US10764603B2 (en) | 2018-12-31 | 2020-09-01 | Alibaba Group Holding Limited | Resolution-adaptive video coding |
EP3687176A1 (en) | 2019-01-22 | 2020-07-29 | InterDigital CE Patent Holdings | A client and a method for managing, at the client, a streaming session of a multimedia content |
CN109729353B (zh) * | 2019-01-31 | 2021-01-19 | 深圳市迅雷网文化有限公司 | 一种视频编码方法、装置、系统及介质 |
WO2020156515A1 (en) * | 2019-01-31 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Refined quantization steps in video coding |
CN109889827B (zh) * | 2019-04-11 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 帧内预测编码方法、装置、电子设备及计算机存储介质 |
US20220360779A1 (en) * | 2019-07-05 | 2022-11-10 | V-Nova International Limited | Quantization of residuals in video coding |
US11720980B2 (en) | 2020-03-25 | 2023-08-08 | Iunu, Inc. | Crowdsourced informatics for horticultural workflow and exchange |
US11792408B2 (en) * | 2020-03-30 | 2023-10-17 | Alibaba Group Holding Limited | Transcoder target bitrate prediction techniques |
TWI743919B (zh) * | 2020-08-03 | 2021-10-21 | 緯創資通股份有限公司 | 視訊處理裝置及視訊串流的處理方法 |
CA3132486A1 (en) * | 2020-09-30 | 2022-03-30 | Comcast Cable Communications, Llc | Method and systems for optimized content encoding |
CN112433690A (zh) * | 2020-12-08 | 2021-03-02 | 努比亚技术有限公司 | 数据处理方法、终端及计算机可读存储介质 |
US11290725B1 (en) * | 2021-01-21 | 2022-03-29 | Agora Lab, Inc. | System and method for determining an objective video quality measure of a real-time video communication without extensive mathematical operations |
CN113053085B (zh) * | 2021-02-04 | 2022-06-03 | 北京戴纳实验科技有限公司 | 一种医院冰箱监管系统 |
CN114501015B (zh) * | 2022-04-06 | 2022-09-02 | 杭州未名信科科技有限公司 | 视频编码码率处理方法和装置、存储介质及电子设备 |
CN115190299B (zh) * | 2022-07-11 | 2023-02-28 | 杭州电子科技大学 | Vvc仿射运动估计快速计算方法 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997016031A1 (en) | 1995-10-26 | 1997-05-01 | Sarnoff Corporation | Apparatus and method for selecting a coding mode in a block-based coding system |
US6192081B1 (en) | 1995-10-26 | 2001-02-20 | Sarnoff Corporation | Apparatus and method for selecting a coding mode in a block-based coding system |
US5872598A (en) | 1995-12-26 | 1999-02-16 | C-Cube Microsystems | Scene change detection using quantization scale factor rate control |
US5929916A (en) | 1995-12-26 | 1999-07-27 | Legall; Didier J. | Variable bit rate encoding |
US6366704B1 (en) | 1997-12-01 | 2002-04-02 | Sharp Laboratories Of America, Inc. | Method and apparatus for a delay-adaptive rate control scheme for the frame layer |
US6343098B1 (en) | 1998-02-26 | 2002-01-29 | Lucent Technologies Inc. | Efficient rate control for multi-resolution video encoding |
US6192079B1 (en) | 1998-05-07 | 2001-02-20 | Intel Corporation | Method and apparatus for increasing video frame rate |
US7130349B1 (en) | 1998-07-16 | 2006-10-31 | Intel Corporation | Method and apparatus to improve efficiency in multiple-pass, bit-rate-controlled frame encoding |
US6963608B1 (en) * | 1998-10-02 | 2005-11-08 | General Instrument Corporation | Method and apparatus for providing rate control in a video encoder |
US6192080B1 (en) | 1998-12-04 | 2001-02-20 | Mitsubishi Electric Research Laboratories, Inc. | Motion compensated digital video signal processing |
CN1366778A (zh) | 2000-04-27 | 2002-08-28 | 皇家菲利浦电子有限公司 | 视频压缩 |
EP1202579A1 (en) | 2000-10-31 | 2002-05-02 | Interuniversitair Microelektronica Centrum Vzw | A method and apparatus for adaptive encoding framed data sequences |
KR100731492B1 (ko) | 2000-12-04 | 2007-06-21 | 주식회사 케이티 | 다중채널/다중레벨 동작감지기능을 가지는 비디오 부호기 및 그 동작 감지 방법 |
KR100707669B1 (ko) | 2000-12-04 | 2007-04-13 | 주식회사 케이티 | 동작 감지 기능을 가지는 비디오 부호화기 및 그를 이용한 동작 감지 방법 |
US6909745B1 (en) * | 2001-06-05 | 2005-06-21 | At&T Corp. | Content adaptive video encoder |
US7110455B2 (en) | 2001-08-14 | 2006-09-19 | General Instrument Corporation | Noise reduction pre-processor for digital video using previously generated motion vectors and adaptive spatial filtering |
KR100481732B1 (ko) | 2002-04-20 | 2005-04-11 | 전자부품연구원 | 다 시점 동영상 부호화 장치 |
RU2322770C2 (ru) | 2002-04-23 | 2008-04-20 | Нокиа Корпорейшн | Способ и устройство для указания параметров квантователя в системе видеокодирования |
DE60206738D1 (de) | 2002-06-11 | 2005-11-24 | St Microelectronics Srl | Videokodierungsverfahren und -Vorrichtung mit variabler Bitrate |
CN1206864C (zh) * | 2002-07-22 | 2005-06-15 | 中国科学院计算技术研究所 | 结合率失真优化的码率控制的方法及其装置 |
EP1639801B1 (en) | 2003-06-26 | 2018-05-09 | Thomson Licensing DTV | Multipass video rate control to match sliding window channel constraints |
US20050036549A1 (en) | 2003-08-12 | 2005-02-17 | Yong He | Method and apparatus for selection of scanning mode in dual pass encoding |
WO2005020587A1 (en) | 2003-08-26 | 2005-03-03 | Samsung Electronics Co., Ltd. | Adaptive interframe wavelet video coding method, computer readable recording medium and system therefor |
US7623719B2 (en) | 2003-09-26 | 2009-11-24 | The Regents Of The University Of California | Video encoding methods and devices |
JP2005123732A (ja) | 2003-10-14 | 2005-05-12 | Matsushita Electric Ind Co Ltd | デブロックフィルタ処理装置およびデブロックフィルタ処理方法 |
EP1551185A1 (en) * | 2004-01-05 | 2005-07-06 | Thomson Licensing S.A. | Encoding method, decoding method, and encoding apparatus for a digital picture sequence |
US20050169369A1 (en) | 2004-02-03 | 2005-08-04 | Sony Corporation | Scalable MPEG video/macro block rate control |
US7869503B2 (en) | 2004-02-06 | 2011-01-11 | Apple Inc. | Rate and quality controller for H.264/AVC video coder and scene analyzer therefor |
US20050195896A1 (en) | 2004-03-08 | 2005-09-08 | National Chiao Tung University | Architecture for stack robust fine granularity scalability |
US20060034369A1 (en) * | 2004-08-10 | 2006-02-16 | Nader Mohsenian | Method and system for parametric video quality equalization in selective re-encoding |
US7512182B2 (en) | 2004-08-30 | 2009-03-31 | General Instrument Corporation | Method and apparatus for performing motion compensated temporal filtering in video encoding |
US8948266B2 (en) | 2004-10-12 | 2015-02-03 | Qualcomm Incorporated | Adaptive intra-refresh for digital video encoding |
EP1800490A1 (de) | 2004-10-15 | 2007-06-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und verfahren zum erzeugen einer codierten videosequenz unter verwendung einer zwischen-schicht-bewegungsdaten-prädiktion |
DE102004059978B4 (de) | 2004-10-15 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium |
US8311113B2 (en) | 2004-11-12 | 2012-11-13 | Broadcom Corporation | Method and system for using motion prediction to equalize video quality across intra-coded frames |
KR100665102B1 (ko) | 2004-12-03 | 2007-01-04 | 한국전자통신연구원 | 전송 패킷의 길이를 고려한 비디오 부호화 율제어 방법 및그를 이용한 비디오 부호화 장치 |
US20060140273A1 (en) | 2004-12-28 | 2006-06-29 | Siu-Wai Wu | Dual-pass HDTV encoder with noise reduction |
US20060146932A1 (en) | 2004-12-30 | 2006-07-06 | Krit Panusopone | Method and apparatus for providing motion estimation with weight prediction |
US7876819B2 (en) * | 2005-09-22 | 2011-01-25 | Qualcomm Incorporated | Two pass rate control techniques for video coding using rate-distortion characteristics |
WO2007035147A1 (en) | 2005-09-23 | 2007-03-29 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive source signal encoding |
US8446954B2 (en) * | 2005-09-27 | 2013-05-21 | Qualcomm Incorporated | Mode selection techniques for multimedia coding |
US8175149B2 (en) | 2005-11-21 | 2012-05-08 | Electronics And Telecommunications Research Institute | Method and apparatus for controlling bitrate of scalable video stream |
US20080151998A1 (en) * | 2006-12-21 | 2008-06-26 | General Instrument Corporation | Method and Apparatus for Providing Rate Control for Panel-Based Real Time Video Encoder |
KR101350723B1 (ko) | 2008-06-16 | 2014-01-16 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 비디오 코딩을 위한 슬라이스 종속성에 기초한 레이트 제어 모델 적응 방법 |
-
2009
- 2009-06-15 KR KR1020117000547A patent/KR101350723B1/ko not_active IP Right Cessation
- 2009-06-15 JP JP2011514726A patent/JP5400876B2/ja not_active Expired - Fee Related
- 2009-06-15 EP EP09789814A patent/EP2286595A1/en not_active Withdrawn
- 2009-06-15 US US12/999,150 patent/US8891619B2/en not_active Expired - Fee Related
- 2009-06-15 CN CN2009801226036A patent/CN102067610B/zh not_active Expired - Fee Related
- 2009-06-15 WO PCT/US2009/047317 patent/WO2010005691A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20110090960A1 (en) | 2011-04-21 |
JP2011525094A (ja) | 2011-09-08 |
US8891619B2 (en) | 2014-11-18 |
WO2010005691A1 (en) | 2010-01-14 |
KR20110015695A (ko) | 2011-02-16 |
KR101350723B1 (ko) | 2014-01-16 |
CN102067610B (zh) | 2013-07-10 |
EP2286595A1 (en) | 2011-02-23 |
CN102067610A (zh) | 2011-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5400876B2 (ja) | ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化 | |
Wang et al. | Rate-distortion optimization of rate control for H. 264 with adaptive initial quantization parameter determination | |
JP5427785B2 (ja) | ビデオ圧縮技法及びビデオ伝達技法 | |
US9060175B2 (en) | System and method for motion estimation and mode decision for low-complexity H.264 decoder | |
US7916783B2 (en) | Bit-rate control method and device combined with rate-distortion optimization | |
US9020294B2 (en) | Spatiotemporal metrics for rate distortion optimization | |
JP4391809B2 (ja) | 画像のシーケンスを適応的に符号化するシステムおよび方法 | |
US8406297B2 (en) | System and method for bit-allocation in video coding | |
US9667999B2 (en) | Method and system for encoding video data | |
US20060239347A1 (en) | Method and system for scene change detection in a video encoder | |
KR20010021879A (ko) | 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법 | |
EP2730086A1 (en) | Rate -distortion optimized video encoding mode selection based on low complexity error propagation tracking | |
GB2492330A (en) | Rate-distortion optimisation (RDO) with optimal encoding mode selection | |
JP4391810B2 (ja) | 画像のシーケンスを適応的に符号化するシステムおよび方法 | |
He et al. | Linear rate control and optimum statistical multiplexing for H. 264 video broadcast | |
US20060256856A1 (en) | Method and system for testing rate control in a video encoder | |
EP1721467A2 (en) | Rate and quality controller for h.264/avc video coder and scene analyzer therefor | |
JP5649296B2 (ja) | 画像符号化装置 | |
Zhang et al. | A two-pass rate control algorithm for H. 264/AVC high definition video coding | |
Pang et al. | Dependent joint bit allocation for H. 264/AVC statistical multiplexing using convex relaxation | |
JP4243472B2 (ja) | 画像符号化装置、画像符号化方法および画像符号化プログラム | |
US20060239344A1 (en) | Method and system for rate control in a video encoder | |
Liu et al. | Improved methods for initializing RQ model parameters and quantization parameter in H. 264 rate control | |
Vizzotto et al. | Neighbor-based Fast Rate Control Scheme for Basic Unit Layer for H. 264/AVC Standard | |
Wang et al. | Motion estimation and mode decision for low-complexity h. 264 decoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121221 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130522 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130924 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131025 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |