JP2009049551A - 動画像符号化装置、動画像符号化方法およびプログラム - Google Patents
動画像符号化装置、動画像符号化方法およびプログラム Download PDFInfo
- Publication number
- JP2009049551A JP2009049551A JP2007211710A JP2007211710A JP2009049551A JP 2009049551 A JP2009049551 A JP 2009049551A JP 2007211710 A JP2007211710 A JP 2007211710A JP 2007211710 A JP2007211710 A JP 2007211710A JP 2009049551 A JP2009049551 A JP 2009049551A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- code amount
- frame
- stage
- stage encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 54
- 238000013139 quantization Methods 0.000 claims abstract description 147
- 238000012545 processing Methods 0.000 claims abstract description 42
- 230000008569 process Effects 0.000 claims description 35
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 11
- 230000007246 mechanism Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000011056 performance test Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
- H04N19/194—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【解決手段】動画像符号化装置1は、第1段階目の符号化を異なる量子化制御変数によって複数回実行する第1段階符号化手段55と、第1段階目の複数の符号化結果を用いて全ての量子化制御変数に対してフレームごとに発生する符号量を推定する符号量推定手段57と、符号量の推定結果からフレームごとの符号量の割り当てを行う符号量割り当て手段59と、割り当てたフレームごとの符号量に基づいて第2段階目の符号化を実行する第2段階符号化手段61と、を具備する。特に、第1段階符号化手段55はフレームの属性に応じて実行する符号化の回数を可変とし、2回目以降の符号化処理に含まれる処理の一部を省略する。
【選択図】図3
Description
特許文献1では、第1段階目の符号化によってフレーム単位の統計データを取得し、それに基づいて動画像シーケンス全体にわたって画像品質の向上を目的としたフレーム単位の符号量割り当てを行い、可変ビットレートによる第2段階目の符号化を行っている。
また、特許文献2では、1つの量子化スケールのみによって第1段階目の符号化を行い、当該量子化スケールと発生符号量の積などで表される複雑度指標データなるものに基づいて、フレーム単位の符号量割り当てを行っている。
また、特許文献3では、ある適当な量子化スケールを用いた第1段階目の符号化によって取得した統計データのサンプルを用いて、その他の全量子化スケール(=第1段階目の符号化に用いていない量子化スケール)による発生符号量を指数関数や高次関数の近似式で推定する。そして、その推定結果を基に、指定されたビットレート等のパラメータ条件を満たし、かつ画像品質が最も向上するようなフレーム単位の符号量割り当てを行い、第2段階目の符号化を行っている。
また、特許文献2の仕組みでは、第1段階目の符号化を1回しか行わず、すなわち、1つの量子化スケールしか用いず、符号量割り当て処理に用いる統計データ(=第1段階目の符号化による発生符号量)が1つである。これでは、複雑度指標データなるものの精度が十分とは言えず、ひいては符号量割り当てを適切に行うことはできない。
また、特許文献3の仕組みでは、近似式の具体例として、符号量が量子化スケールの逆数に依存して決まる式を挙げている(特許文献3の段落番号0031)。そして、「第1符号化において、フレーム毎に固定の量子化スケールを用いて符号化を行い、フレームごとの発生符号量を量子化の影響を受ける部分とヘッダ等の量子化の影響を受けない部分とに分離して集計する・・・」(特許文献3の段落番号0033)と記載されている。すなわち、特許文献3の仕組みでは、フレームごとに固定の量子化スケールを用いて第1符号化を行うことから、特許文献2と同様、フレームごとに1つの量子化スケールに対する統計データしか得られない。確かに、前述の近似式の具体例は、量子化の影響を受けて決定する係数が1つしかないことから、1つの量子化スケールに対する統計データだけでも式の決定は可能である。しかしながら、近似式のモデル自体が、様々な画像の性質に対応できるものにはなっていないことから、発生符号量推定の精度は十分と言えず、ひいては符号量割り当てを適切に行うことはできない。
尚、量子化スケールとは、量子化の粗さを既定する値であり、量子化スケールが大きい場合、量子化によって失われる情報量は多くなるが、圧縮効率は上がる。一方、量子化スケールが小さい場合、量子化によって失われる情報量は少なくなるが、圧縮効率は下がる。
これに対し、量子化パラメータとは、量子化を実施する際に用いるパラメータであり、量子化スケールと量子化パラメータの間には符号化方式ごとに関係が規定されている。量子化スケールをQS、量子化パラメータをQPとすると、H.264/AVCでは、QS=2^((QP−4.0)/6)(但し、x^yは、xのy乗を意味する。)である。また、MPEG−4では、QS=2×QPである。以下では、「量子化制御変数」を量子化スケールと量子化パラメータの両方を含む用語として用いることとする。
更に、同時に達成すべき目的として、符号量の正確な推定を実現しながら処理時間が著しく増大しない動画像符号化装置等を提供することである。
動画像符号化装置1は、制御部3、記憶部5、メディア入出力部7、通信制御部9、入力部11、表示部13、周辺機器I/F部15等が、バス17を介して接続される。
ROMは、不揮発性メモリであり、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部5、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部3が各種処理を行う為に使用するワークエリアを備える。
これらの各プログラムコードは、制御部3により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
入力部11を介して、コンピュータに対して、操作指示、動作指示、データ入力等を行うことができる。
フレームは、予測モードの制限によって3つのフレームタイプがある。すなわち、(1)前後のフレームとは関係なくその画面内(Intra)だけで独立して符号化するPフレーム、(2)フレーム間(Inter)の順方向予測符号化によって得られるPフレーム、(3)順方向予測、逆方向予測、両方向予測を用いることのできるBフレーム、の三つである。
マクロブロックは、マクロブロック内で独立して符号化するIntraマクロブロック、ブロック間の順方向予測符号化によって得られるInterマクロブロックに分類される。
そして、Iフレームは、Intraマクロブロックのみで構成され、PフレームやBフレームは、IntraマクロブロックとInterマクロブロックの両者で構成される。
図3は、動画像符号化装置1の機能を示すブロック図である。
入力された符号化対象データ21は、一旦、記憶部5に記憶し、制御部3が記憶部5から読み出して後述する処理を行っても良い。また、制御部3のRAMに保持し、後述する処理を行っても良い。
図4は、フレームの属性による分類の一つ目の例を示す図である。
図4に示すように、動画像シーケンス71に含まれるフレームは、フレームタイプによって分類することができる。具体的には、Iフレーム73、Pフレーム75等に分類できる。このとき、第1段階符号化手段55の第1の実行ロジックは、数種類の量子化パラメータによって、Iフレーム73とPフレーム75の両方に対し、同じ回数の第1段階目の符号化を行うものである。
尚、Bフレームについては特に言及していないが、前述の第1の実行ロジック、並びに後述する符号量推定手段57の推定ロジックの決定においては、Pフレームと同様に扱うことができる。
また、本実施の形態に係る符号化処理は、動画像シーケンス71全体に対して行っても良いし、動画像シーケンス71をある単位(例えば、グループオブピクチャ等)で分割して行っても良い。
図5に示すように、動画像シーケンス71に含まれるフレームは、フレームタイプに基づくフレームの属性によって分類することができる。具体的には、Iフレーム73、Iフレーム直後のPフレーム77、その他のPフレーム79等に分類できる。このとき、第1段階符号化手段55の第2の実行ロジックは、3つに分類したフレームごとに符号化回数を可変とするものである。例えば、Iフレーム73に対しては、数種類の量子化パラメータによって、複数回の第1段階目の符号化を行う。また、Iフレーム直後のPフレーム77に対しては、直前のIフレーム73と同様の量子化パラメータによって、複数回の第1段階目の符号化を行う。そして、その他のPフレーム79に対しては、一種類の量子化パラメータによって、一回の第1段階目の符号化を行う。
尚、Bフレームについては特に言及していないが、前述の第2の実行ロジック、並びに後述する符号量推定手段57の推定ロジックの決定においては、Pフレームと同様に扱うことができる。
また、本実施の形態に係る符号化処理は、動画像シーケンス71全体に対して行っても良いし、動画像シーケンス71をある単位(例えば、グループオブピクチャ等)で分割して行っても良い。
一般に、量子化パラメータと発生符号量の関係は、画像の性質に応じて変化するものである。図6では、(a)が標準的な画像における量子化パラメータと発生符号量の関係を示している。そして、画像の変化が大きい場合、量子化パラメータと発生符号量の関係は、(b)に示すような特性を持つ。また、画像の変化が小さい場合、量子化パラメータと発生符号量の関係は、(c)に示すような特性を持つ。そして、従来技術のように、第1段階目の符号化を1回のみ行い、ある1つの量子化パラメータに対する発生符号量(以下、単に「サンプル値」という。)しか収集できていない場合、このように画像の性質に応じて変化する量子化パラメータと発生符号量の関係を表す式を決定することは困難である。また、仮に、1つのサンプル値によって式を決定できたとしても、その結果推定される発生符号量に大きな誤差が生じることは明らかである。
符号量推定手段57は、このような量子化パラメータと発生符号量の関係について、第1段階符号化手段55によって収集した複数のサンプル値を用いて推定する。
第1の推定ロジックでは、下記の式を用いる。
qp:(QP1+1)≦qp≦(QP2−1)の範囲の量子化パラメータ、Bit
:(qpにおける)発生符号量、ΔBit:(QP1の場合の発生符号量)−(QP2の場合の発生符号量)、β:QP2の場合の発生符号量、である。
H.264/AVCの規約では、量子化パラメータが6増加すると、量子化ステップサイズが2倍になり、発生符号量がおおよそ1/2に近い値となる。第1の推定ロジックに用いる数1は、このことを考慮したものとなっている。
第2の推定ロジックでは、下記の式を用いる。
数2を用いる第2の推定ロジックでは、多項式によって発生符号量を推定する。このように、多項式によって推定する場合、多項式の次数が高くなるに従って、必要となるサンプル値の数、すなわち、第1段階目の符号化を実行する回数が増える。2次多項式であれば3つのサンプル値、3次多項式であれば4つのサンプル値、4次多項式であれば5つのサンプル値が必要となる。
第3の推定ロジックでは、下記の式を用いる。
ここで、量子化スケールは、量子化パラメータによって算出される。第3の推定ロジックでは、量子化による影響を受ける係数であるαとβの二つの値を決定することから、少なくとも二つのサンプル値が必要となる。
第4の推定ロジックでは、その他のPフレーム79の発生符号量の推定に用いることを想定し、自らのサンプル値のみでなく、他のフレームの推定結果も利用する。これは、その他のPフレーム79自体は、一つのサンプル値しか収集しない為、第1の推定ロジックから第3の推定ロジックまでのように、自らのサンプル値のみで発生符号量を推定することは困難だからである。
具体的には、下記の式を用いる。
数4において、Bit(X、QP1)、Bit(Y、QP1)はサンプル値であり、Bit(Y、qp)はYの推定結果である。このように、その他のPフレーム79の発生符号量は、Iフレーム直後のPフレーム77の発生符号量と同じ比率で推定する。これにより、推定の精度を保ちながら、一つのサンプル値のみで発生符号量を推定することができる。
図7に示すように、(1)QP0+1≦qp≦QP1−1の範囲の量子化パラメータqp、(2)QP1+1≦qp<QP2−1の範囲の量子化パラメータqpと複数の区間に分割し、別々に符号量を推定するようにしても良い。また、区間ごとに異なる推定ロジックで符号量を推定するようにしても良い。
例えば、図7に示す区間に分割し、(1)の区間と(2)の区間に対して別々に第1の推定ロジックによって符号量を推定する場合、まず、QP0、QP1、QP2の3つの量子化パラメータによって第1段階目の符号化を3回行う。次に、(1)の区間に対しては、QP0、QP1の量子化パラメータに係るサンプル値を用いて符号量の推定を行い、(2)の区間に対しては、QP1、QP2の量子化パラメータに係るサンプル値を用いて符号量の推定を行う。
尚、(3)qp≦QP0−1の範囲の量子化パラメータqp、(4)QP2+1≦qpの範囲の量子化パラメータqpに対しては、別の量子化パラメータによる第1段階目の符号化を行って推定しても良い。また、指定されたビットレートによって、(3)、(4)の区間に含まれる量子化パラメータを第2段階目の符号化において使用しないことが明らかな場合、当該範囲における符号量の推定を行わなくても良い。すなわち、指定されるビットレートに応じて、量子化パラメータの最小値と最大値を定義しておき、符号量を推定する範囲を限定するようにしても良い。
図8は、第1の実行ロジックによって第1段階目の符号化を実行した場合の推定ロジックの選択を示す図である。
図8に示すように、第1の実行ロジックでは、フレームはIフレーム73とPフレーム75とに分類される。そして、Iフレーム73の符号量推定においては、第1の推定ロジックから第3の推定ロジックまでのいずれを選択しても良い。また、Pフレーム75の符号量推定においても、第1の推定ロジックから第3の推定ロジックまでのいずれを選択しても良い。
図9に示すように、第2の実行ロジックでは、フレームはIフレーム73とIフレーム直後のPフレーム77とその他のPフレーム79とに分類される。そして、Iフレーム73、およびIフレーム直後のPフレーム77の符号量推定においては、第1の推定ロジックから第3の推定ロジックまでのいずれを選択しても良い。一方、その他のPフレーム79の符号量推定においては、第4の推定ロジックのみ選択することができる。
尚、前述した第1の推定ロジックから第4の推定ロジックは一例に過ぎず、他の推定ロジックに従って符号量の推定を行っても良い。例えば、第1段階符号化手段55によって、フレームに含まれるIntraマクロブロックの個数およびIntraマクロブロックとして発生したビット数、フレームに含まれるInterマクロブロックの個数およびInterマクロブロックとして発生したビット数等を収集した場合、マクロブロック単位での符号量推定も可能であり、より精度の高い符号量の推定を行うことができる。
このように、符号量推定手段57は、符号量の推定ロジックをフレームごとに選択することが可能である。そして、様々な推定ロジックの中から最適の推定ロジックを選択することによって、精度の高い符号量の推定を行うことができる。
一般に、量子化を伴う符号化では、量子化パラメータの増加に伴って符号化歪が増加し、復号化後の画像品質が低下する。また、符号化歪は、一義的には量子化パラメータによって決まり、画像の性質には依存しない特徴がある。つまり、動画像シーケンス71全体にわたって安定した再生画質を得るためには、量子化パラメータの変動を抑制し、均一の量子化パラメータを用いればよいことが知られている。従って、同一の量子化パラメータによって推定したフレームごとの符号量が、符号化対象の動画像シーケンス71全体で、指定されたビットレートに最も適したものとなる量子化パラメータを決定し、決定した量子化パラメータによってフレームごとの符号量割り当てを決定すれば良いことになる。
具体的には、符号量割り当て手段59は、最初に、指定されたビットレートから符号量の合計の目標値を設定する。次に、符号量割り当て手段59は、量子化パラメータごとに、推定したフレームごとの符号量の合計を算出する。そして、符号量割り当て手段59は、指定されたビットレートから設定した符号量の合計の目標値と、推定したフレームごとの符号量の合計値との差が最も少ない量子化パラメータを決定する。更に、符号量割り当て手段59は、決定した量子化パラメータによって推定した符号量をフレームごとに割り当てる。
具体的には、符号量割り当て手段59は、VBV(Video Buffer Verifier)として採用されている仮想デコーダの受信バッファモデルを用いて、バッファのアンダーフローやオーバーフローが発生するかどうか、すなわちバッファ占有量の条件を満たすかどうかチェックする。条件を満たさない場合、符号量割り当て手段59は、符号量の割り当ての修正を行う。これらの仕組みの実現については、例えば、特願2006−021965に示された手法等を用いることができる。
図10は、2段階の符号化処理全体の流れを示すフローチャートである。
以下では、フローチャートとともに、具体例についても説明する。具体例は、第1段階符号化手段55の第2の実行ロジックに従い、Iフレーム73およびIフレーム直後のPフレーム77に対しては第1段階目の符号化を3回実行し、その他のPフレーム79に対しては第1段階目の符号化を1回実行する場合とする。尚、1回目から3回目までに用いる量子化パラメータは事前に設定されているとする。
ここで、具体例においては、S101からS103までの処理が1回目の場合、事前に設定された1回目の量子化パラメータを用いることを決定し、全てのフレーム、すなわち、Iフレーム73およびIフレーム直後のPフレーム77およびその他のPフレーム79に対して、第1段階目の符号化を実行し、符号化結果を保持する。
次に、S101からS103までの処理が2回目または3回目の場合、事前に設定された2回目または3回目の量子化パラメータを用いることを決定し、Iフレーム73およびIフレーム直後のPフレーム77に対して、第1段階目の符号化を実行し、符号化結果を保持する。ここで、符号化の際、収集する情報に影響のない処理は省略することができる。
終了条件を満たさない場合(S104のNo)、S101から繰り返す。
終了条件を満たす場合(S104のYes)、S105に進む。
ここで、具体例においては、例えば、動画像シーケンス71の順に符号量を推定するフレームを決定すれば良い。尚、その他のPフレーム79については、参照するIフレーム直後のPフレーム77の符号量の推定が終了していないと、処理を実行することはできない。
符号量推定ロジックの選択は、Iフレーム73およびIフレーム直後のPフレーム77に対しては、第1の推定ロジックから第3の推定ロジックのいずれを選択することも可能である。但し、サンプルは3つであることから、第2の推定ロジックの場合、2次多項式によって推定することになる。一方、その他のPフレーム79に対しては、第4の推定ロジックのみ選択することが可能である。
ここで、前述した具体例の説明においてフレーム数には言及していないが、例えば、フレーム数が300であれば、S105からS107までの処理が300回繰り返されることになる。
終了していない場合(S107のNo)、S105から繰り返す。
終了している場合(S107のYes)、S108に進む。
ここで、前述した具体例の説明において量子化パラメータの範囲には言及していないが、例えば、量子化パラメータの最小値を5、最大値を45と事前に設定していた場合、最小値である5から順に1ずつ加算して量子化パラメータを決定すれば良い。また、最大値である45から順に1ずつ減算して量子化パラメータを決定しても良い。
符号量の合計は、フレーム数が300であれば、300通りの推定式に、決定した量子化パラメータの値をそれぞれ代入して、フレームごとの符号量を算出し、これらを合算することで算出する。
具体的には、制御部3は、指定されたビットレートから設定した符号量の合計の目標値と、S109で算出した符号量の合計値との差を算出する。そして、現時点の最適量子化パラメータによる符号量の合計値との差よりも小さい場合、(現時点では)最適であると判断する。
最適である場合(S110のYes)、当該量子化パラメータを最適量子化パラメータとして保持する(S111)。
最適でない場合(S110のNo)、S112に進む。
ここで、最適量子化パラメータの決定の終了条件は、例えば、取り得る全ての量子化パラメータに対して、S108からS111までの処理を実行したことである。
終了条件を満たさない場合(S112のNo)、S108から繰り返す。
終了条件を満たす場合(S112のYes)、S113に進む。
条件を満たさない場合(S115のNo)、制御部3は、符号量の割り当てを修正し(S116)、S114から繰り返す。
条件を満たす場合(S115のYes)、S117に進む。
以上のように、動画像符号化装置1は、2段階の符号化を実施し、第1段階目の符号化の結果によって符号化対象の画像の性質を解析し、その解析結果に基づいて第2段階目の符号化を行う。
図11は、従来方式と実施例に係る新方式の性能テストの一例を示す図である。
本実施例で使用したPC(パーソナルコンピュータ)は、CPUがPentium(登録商標)D(動作周波数3.20GHz)、メモリが1GB、HDDの空き容量が66.7GB、OSがWindows(登録商標)XPであった。
また、符号化処理はH.264/AVCの標準方式に従い、フレームレートは30fps、ビットレートは256kbpsであった。符号化対象のコンテンツは、性能テストによく用いられるテスト用のサンプル動画像データを用いた。
図11に示す旧方式では、第1段階目の符号化を1回のみとした。一方、実施例に係る新方式では、第1段階目の符号化を3種類の量子化パラメータによって3回行った。フレームは図4に示すようにIフレーム73とPフレーム75に分類し、両方に対し、同じ回数、すなわち3回の第1段階目の符号化を行った。また、符号量推定手段57は、第3の推定ロジックを用いた。
また、(新方式の全体の処理時間)/(従来方式の全体の処理時間)の平均値は約1.4倍程度であり、実用化にも問題のない性能を示す結果となった。
3………制御部
5………記憶部
7………メディア入出力部
9………通信制御部
11………入力部
13………表示部
15………周辺機器I/F部
17………バス
19………ネットワーク
51………符号化対象データ入力手段
53………符号化条件設定手段
55………第1段階符号化手段
57………符号量推定手段
59………符号量割り当て手段
61………第2段階符号化手段
63………符号化データ出力手段
71………動画像シーケンス
73………Iフレーム
75………Pフレーム
77………Iフレーム直後のPフレーム
79………その他のPフレーム
Claims (11)
- 2段階の符号化を実施し、第1段階目の符号化の結果によって符号化対象の画像の性質を解析し、その解析結果に基づいて第2段階目の符号化を行う動画像符号化装置であって、
前記第1段階目の符号化を異なる量子化制御変数によって複数回実行する第1段階符号化手段と、
前記第1段階符号化手段による複数の符号化結果を用いて、全ての前記量子化制御変数に対してフレームごとに発生する符号量を推定する符号量推定手段と、
前記符号量推定手段の推定結果から、前記フレームごとの前記符号量の割り当てを行う符号量割り当て手段と、
前記符号量割り当て手段によって割り当てた前記フレームごとの前記符号量に基づいて前記第2段階目の符号化を実行する第2段階符号化手段と、
を具備することを特徴とする動画像符号化装置。 - 前記第1段階符号化手段は、前記フレームの属性に応じて実行する符号化の回数を可変とすることを特徴とする請求項1に記載の動画像符号化装置。
- 前記第1段階符号化手段は、2回目以降の符号化処理に含まれる処理の一部を省略することを特徴とする請求項1または請求項2に記載の動画像符号化装置。
- 前記符号量推定手段は、前記フレームごとに前記符号量の推定ロジックを選択可能とすることを特徴とする請求項1から請求項3までのいずれかに記載の動画像符号化装置。
- 前記符号量割り当て手段は、同一の前記量子化制御変数によって推定した前記フレームごとの前記符号量が、符号化対象の動画像シーケンス全体で、指定されたビットレートに最も適したものとなる前記量子化制御変数を決定し、決定した前記量子化制御変数によって前記フレームごとの前記符号量を割り当てることを特徴とする請求項1から請求項4までのいずれかに記載の動画像符号化装置。
- 2段階の符号化を実施し、第1段階目の符号化の結果によって符号化対象の画像の性質を解析し、その解析結果に基づいて第2段階目の符号化を行う動画像符号化方法であって、
前記第1段階目の符号化を異なる量子化制御変数によって複数回実行する第1段階符号化ステップと、
前記第1段階符号化ステップによる複数の符号化結果を用いて、全ての前記量子化制御変数に対してフレームごとに発生する符号量を推定する符号量推定ステップと、
前記符号量推定ステップの結果から、前記フレームごとの前記符号量の割り当てを行う符号量割り当てステップと、
前記符号量割り当てステップによって割り当てた前記フレームごとの前記符号量に基づいて前記第2段階目の符号化を実行する第2段階符号化ステップと、
を含むことを特徴とする動画像符号化方法。 - 前記第1段階符号化ステップは、前記フレームの属性に応じて実行する符号化の回数を可変とすることを特徴とする請求項6に記載の動画像符号化方法。
- 前記第1段階符号化ステップは、2回目以降の符号化処理に含まれる処理の一部を省略することを特徴とする請求項6または請求項7に記載の動画像符号化方法。
- 前記符号量推定ステップは、前記フレームごとに発生符号量の推定ロジックを選択可能とすることを特徴とする請求項6から請求項8までのいずれかに記載の動画像符号化方法。
- 前記符号量割り当てステップは、同一の前記量子化制御変数によって推定した前記フレームごとの前記符号量が、符号化対象の動画像シーケンス全体で、指定されたビットレートに最も適したものとなる前記量子化制御変数を決定し、決定した前記量子化制御変数によって前記フレームごとの前記符号量を割り当てることを特徴とする請求項6から請求項9までのいずれかに記載の動画像符号化方法。
- コンピュータを請求項1から請求項5までのいずれかに記載の動画像符号化装置として機能させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007211710A JP4842899B2 (ja) | 2007-08-15 | 2007-08-15 | 動画像符号化装置、動画像符号化方法およびプログラム |
US12/192,275 US8218646B2 (en) | 2007-08-15 | 2008-08-15 | Moving image encoding apparatus, moving image encoding method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007211710A JP4842899B2 (ja) | 2007-08-15 | 2007-08-15 | 動画像符号化装置、動画像符号化方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009049551A true JP2009049551A (ja) | 2009-03-05 |
JP4842899B2 JP4842899B2 (ja) | 2011-12-21 |
Family
ID=40362944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007211710A Expired - Fee Related JP4842899B2 (ja) | 2007-08-15 | 2007-08-15 | 動画像符号化装置、動画像符号化方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8218646B2 (ja) |
JP (1) | JP4842899B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013247683A (ja) * | 2012-05-24 | 2013-12-09 | Fujitsu Ltd | 画像圧縮方法及びその装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5257215B2 (ja) * | 2009-04-16 | 2013-08-07 | ソニー株式会社 | 画像符号化装置と画像符号化方法 |
JP2010288166A (ja) * | 2009-06-15 | 2010-12-24 | Panasonic Corp | 動画像符号化装置、放送波記録装置及び、プログラム |
US8976856B2 (en) * | 2010-09-30 | 2015-03-10 | Apple Inc. | Optimized deblocking filters |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH033479A (ja) * | 1989-05-30 | 1991-01-09 | Nec Corp | 画像信号の符号化方式 |
JPH05191651A (ja) * | 1992-01-13 | 1993-07-30 | Toshiba Corp | 画像符号化装置 |
JPH08186821A (ja) * | 1994-12-27 | 1996-07-16 | Toshiba Corp | 動画像符号化装置及び動画像伝送装置 |
JPH08340531A (ja) * | 1995-06-14 | 1996-12-24 | Toshiba Corp | 可変レート符号化装置 |
JP2003018603A (ja) * | 2001-06-29 | 2003-01-17 | Toshiba Corp | 動画像符号化方法及び装置 |
JP2007028156A (ja) * | 2005-07-15 | 2007-02-01 | Sony Corp | 符号化装置、符号化方法、プログラムおよび記録媒体 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6005626A (en) * | 1997-01-09 | 1999-12-21 | Sun Microsystems, Inc. | Digital video signal encoder and encoding method |
US6118823A (en) * | 1997-04-01 | 2000-09-12 | International Business Machines Corporation | Control scheme for shared-use dual-port predicted error array |
US6356589B1 (en) * | 1999-01-28 | 2002-03-12 | International Business Machines Corporation | Sharing reference data between multiple encoders parallel encoding a sequence of video frames |
JP3395892B2 (ja) * | 1999-05-06 | 2003-04-14 | 日本電気株式会社 | 動画像符号化装置 |
US7277483B1 (en) * | 2000-04-18 | 2007-10-02 | Ati International Srl | Method and apparatus for rate control for constant-bit-rate finite-buffer-size video encoder |
US7079697B2 (en) * | 2001-03-19 | 2006-07-18 | Texas Instruments Incorporated | Image compression with transform coefficient analysis |
US9894379B2 (en) * | 2001-07-10 | 2018-02-13 | The Directv Group, Inc. | System and methodology for video compression |
KR101108661B1 (ko) * | 2002-03-15 | 2012-01-25 | 노키아 코포레이션 | 비디오 시퀀스에서의 움직임 부호화 방법 |
US7426308B2 (en) * | 2003-07-18 | 2008-09-16 | Microsoft Corporation | Intraframe and interframe interlace coding and decoding |
JP4591657B2 (ja) * | 2003-12-22 | 2010-12-01 | キヤノン株式会社 | 動画像符号化装置及びその制御方法、プログラム |
US7869503B2 (en) * | 2004-02-06 | 2011-01-11 | Apple Inc. | Rate and quality controller for H.264/AVC video coder and scene analyzer therefor |
JP3846489B2 (ja) * | 2004-05-10 | 2006-11-15 | セイコーエプソン株式会社 | 画像データ圧縮装置、エンコーダ、電子機器及び画像データ圧縮方法 |
DE602005015067D1 (de) * | 2004-09-30 | 2009-08-06 | Toshiba Kk | Informationsbearbeitungsgerät und Programm |
US8548055B2 (en) * | 2005-03-10 | 2013-10-01 | Qualcomm Incorporated | Encoding of multimedia data |
-
2007
- 2007-08-15 JP JP2007211710A patent/JP4842899B2/ja not_active Expired - Fee Related
-
2008
- 2008-08-15 US US12/192,275 patent/US8218646B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH033479A (ja) * | 1989-05-30 | 1991-01-09 | Nec Corp | 画像信号の符号化方式 |
JPH05191651A (ja) * | 1992-01-13 | 1993-07-30 | Toshiba Corp | 画像符号化装置 |
JPH08186821A (ja) * | 1994-12-27 | 1996-07-16 | Toshiba Corp | 動画像符号化装置及び動画像伝送装置 |
JPH08340531A (ja) * | 1995-06-14 | 1996-12-24 | Toshiba Corp | 可変レート符号化装置 |
JP2003018603A (ja) * | 2001-06-29 | 2003-01-17 | Toshiba Corp | 動画像符号化方法及び装置 |
JP2007028156A (ja) * | 2005-07-15 | 2007-02-01 | Sony Corp | 符号化装置、符号化方法、プログラムおよび記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013247683A (ja) * | 2012-05-24 | 2013-12-09 | Fujitsu Ltd | 画像圧縮方法及びその装置 |
Also Published As
Publication number | Publication date |
---|---|
US8218646B2 (en) | 2012-07-10 |
JP4842899B2 (ja) | 2011-12-21 |
US20090046780A1 (en) | 2009-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11317101B2 (en) | Inter frame candidate selection for a video encoder | |
JP4127818B2 (ja) | 動画像符号化方法及びその装置 | |
JP4554927B2 (ja) | ビデオトランスコーディングにおけるレート制御方法およびシステム | |
JP4513841B2 (ja) | 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体 | |
EP3038362B1 (en) | Decoding method for intra predicting a block by first predicting the pixels at the boundary | |
CN102271257B (zh) | 图像处理设备 | |
JP4425563B2 (ja) | フェーディング補償のためのパラメータ化 | |
JP4545388B2 (ja) | フェーディング推定/補償によりビデオフレームを処理するシステムおよび方法 | |
US20060104527A1 (en) | Video image encoding method, video image encoder, and video image encoding program | |
US20120128064A1 (en) | Image processing device and method | |
JP2007267414A (ja) | フレーム内画像符号化方法及びその装置 | |
JPWO2006101126A1 (ja) | 符号化装置および符号化装置を備えた動画像記録システム | |
KR20090087767A (ko) | 영상의 인트라 예측 부호화 방법 | |
CN101523915B (zh) | 使用min-max方法的用于视频编码的两遍速率控制技术 | |
CN112087628A (zh) | 使用两级帧内搜索对视频进行编码 | |
US20230056211A1 (en) | Video encoding method and apparatus, video decoding method and apparatus, computer program product, computer-readable storage medium, and electronic device | |
JP4842899B2 (ja) | 動画像符号化装置、動画像符号化方法およびプログラム | |
CN108028938A (zh) | 视频编码方法及装置 | |
US20090257497A1 (en) | Moving image processing system, encoding device, and decoding device | |
JP4130617B2 (ja) | 動画像符号化方法および動画像符号化装置 | |
JP4037839B2 (ja) | 画像符号化方法及び装置 | |
RU2587412C2 (ru) | Управление скоростью передачи видео на основе гистограммы коэффициентов преобразования | |
US20070297517A1 (en) | Entropy encoding and decoding apparatuses, and entropy encoding and decoding methods | |
JP2007251996A (ja) | 動画像符号化方法及びその装置 | |
JP2018186419A (ja) | トランスコーダ、トランスコード方法、及びトランスコードプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100430 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110927 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4842899 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141014 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |