JP3866538B2 - 動画像符号化方法及び装置 - Google Patents

動画像符号化方法及び装置 Download PDF

Info

Publication number
JP3866538B2
JP3866538B2 JP2001200158A JP2001200158A JP3866538B2 JP 3866538 B2 JP3866538 B2 JP 3866538B2 JP 2001200158 A JP2001200158 A JP 2001200158A JP 2001200158 A JP2001200158 A JP 2001200158A JP 3866538 B2 JP3866538 B2 JP 3866538B2
Authority
JP
Japan
Prior art keywords
encoding
frame
code amount
allocation
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001200158A
Other languages
English (en)
Other versions
JP2003018603A (ja
Inventor
晋一郎 古藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001200158A priority Critical patent/JP3866538B2/ja
Priority to US10/183,516 priority patent/US7075982B2/en
Publication of JP2003018603A publication Critical patent/JP2003018603A/ja
Application granted granted Critical
Publication of JP3866538B2 publication Critical patent/JP3866538B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術の分野】
本発明は、少なくとも2回の符号化により動画像を符号化する動画像符号化システムにおいて、特に1回目の符号化結果によって入力動画像の統計的性質を分析し、その分析結果に基づいて2回目の符号化を行う動画像符号化方法及び装置に関する。
【0002】
【従来の技術】
DVD(Digital Versatile Disc)に代表されるような可変レートのデータ読み出しが可能な蓄積メディアでは、動画像信号を記録する際に可変ビットレートの動画像符号化を用いることで、一定のディスク容量の中で高能率な動画像圧縮を実現している。例えば、DVDではMPEG2(Moving Picture Experts Group phase 2)動画像符号化方式が採用されている。
【0003】
MPEG2では、エントロピー符号化を用いているため、入力動画像の解像度や動きの激しさ等に応じて、一定の画質を得るための必要な符号量が異なってくる。従って動画像の性質に合わせてビットレートを変動させることで、固定ビットレートの符号化に比べて、平均ビットレートを下げることが可能となり、総符号量を削減することが可能となる。
【0004】
DVDのような蓄積メディアへの記録のための動画像符号化では、最適なビット配分を実現するため、2回の符号化により動画像を符号化する、いわゆる2パス符号化がしばしば行われる。例えば、特開平8−186821には、1回目の符号化によってフレーム単位の統計データを取得し、それに基づいて動画像シーケンス全体にわたってフレーム単位の符号量割り当てを行い、可変ビットレートによる2回目の符号化を行う技術が開示されている。
【0005】
インターネットやモバイル端末での動画像伝送をターゲットとして、DVDの記録ビットレートよりも低ビットレートで動画像信号を符号化することを目的としたMPEG4(Moving Picture Experts Group phase 4)動画像符号化方式が1999年に規格化された。MPEG4は、MPEG2に比べて圧縮効率の向上やエラー耐性の強化、オブジェクト符号化に代表されるアプリケーションの多様性など、様々な機能拡張がなされた動画像符号化方式である。MPEG2では、TV信号やシネフィルムを想定した固定フレームレートでの符号化が基本となっているのに対して、MPEG4では低レートの符号化を実現するため、フレームスキップを用いることで任意のフレームレートでの符号化が可能となっている。
【0006】
MPEG4動画像符号化方式では、フレームレートをいかに動的に制御するかが、同じ平均ビットレートの下での画質の良否に大きく影響する。例えば、特開2000−350211に示されるように、入力画像の動きの有無などを事前に検出し、シーン毎にフレームレートを変更して符号化を行う方法などが知られている。
【0007】
MPEG2およびMPEG4動画像符号化方式では、VBV(Video Buffering Verifier)と呼ばれる、仮想デコーダにおける受信バッファモデルにおいて、バッファのアンダーフローやオーバーフローが発生しないように、レート制御を伴って符号化を行うことが要求されている。しかし、特開2000−350211では、VBVの管理が考慮されていない。
【0008】
また、VBVの動作はフレームを単位とするバッファ変動モデルであるため、VBVの制御と高能率符号化のための符号量割り当てを実現するには、フレーム単位の発生符号量を正確に推定する必要がある。MPEG2やMPEG4では、フレーム間予測符号化が行われるため、フレームスキップがある場合、予測画像と参照画像とのフレーム間隔が大きくなり、予測効率が低下して符号化効率が低下する場合がある。従って、1回目の符号化と2回目の符号化においてフレームスキップの位置が異なると、1回目の符号化で2回目の符号化における発生符号量を予測することが直接的には困難となる。
【0009】
【発明が解決しようとする課題】
上述したように従来の2パス符号化による動画像符号化技術においては、2回目の符号化でフレームレート可変のフレーム間予測符号化を行う場合、VBV管理の下で正確かつ最適な符号量割り当てを行うことが困難であるという問題があった。
【0010】
本発明は、フレームレート可変のフレーム間予測符号化において最適な符号量割り当ての両立を可能とする、2パス符号化による高能率の動画像符号化方法及び装置を提供することを主たる目的とする。
【0011】
本発明の他の目的は、2パスの符号化において正確なVBV管理と最適な符号量割り当ての両立を可能とすることにある。
【0012】
【課題を解決するための手段】
上記課題を解決するため、本発明は少なくとも2回の符号化によって動画像を符号化する動画像符号化において、フレーム単位で入力される入力動画像信号を固定フレームレートで符号化してフレーム毎の発生符号量を含む統計データを生成する第1符号化を行う。次に、第1符号化で生成された統計データに従って各フレームに対する符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定し、さら各フレームのフレームスキップの実行の有無を示すフレームスキップ割り当てを決定する。こうして決定された符号量割り当て及び量子化スケール割り当ての少なくとも一方とフレームキップ割り当てに従って入力動画像信号を符号化して符号列を生成する第2符号化を行う。
【0013】
また、本発明によると少なくとも2回の符号化によって動画像を符号化する処理をコンピュータに実行させるためのプログラムであって、フレーム単位で入力される入力動画像信号を固定フレームレートで符号化してフレーム毎の発生符号量を含む統計データを生成する処理と、前記統計データに従って各フレームに対する符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定する処理と、前記統計データに従って各フレームのフレームスキップの実行の有無を示すフレームスキップ割り当てを決定する処理と、前記符号量割り当て及び量子化スケール割り当ての少なくとも一方と前記フレームキップ割り当てに従って前記入力動画像信号を符号化して符号列を生成する処理とをコンピュータに実行させるためのプログラムが提供される。
【0014】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
図1は、本発明の一実施形態に係る動画像符号化装置の概略的な構成を示すブロック図である。この動画像符号化装置は、全体がハードウェアにより実現されていてもよいが、一部または全部がコンピュータにによるソフトウェア処理によって実現されてもよい。
【0015】
図1において、蓄積メディア1は例えばハードディスクやディジタルVTRであり、この蓄積メディア1から再生される動画像信号(映像信号)は符号化部2に符号化対象の画像信号(入力動画像信号という)として入力される。符号化部2は、例えばMPEG4方式に基づく動画像符号化器(MPEG4エンコーダ)によって構成される。符号化部2は、蓄積メディア1から繰り返し再生される同じ動画像シーケンスの入力動画像信号を少なくとも2回符号化することによって最終的な符号化データを出力する。
【0016】
符号化部2においては、まず1回目の符号化(以下、第1符号化という)において入力動画像信号のフレーム毎の符号化特性を反映した統計データが抽出される。この統計データは、符号化特性推定部3に入力される。符号化特性推定部3では、入力された統計データに基づき符号化部2の後述する符号化特性が推定される。
【0017】
符号化特性推定部3で推定された符号化特性に基づいて、符号量/量子化スケール割り当て部4により各フレームに対する符号化割り当て及び量子化スケール割り当ての少なくとも一方が行われる。すなわち、符号化部2において入力動画像信号1を符号化するときの各フレームに対する符号量割り当てまたは量子化スケールあるいはその両方が決定される。
【0018】
さらに、符号化特性推定部3で推定された符号化特性に基づいて、フレームスキップ割り当て部5により各フレームのフレームスキップの実行の有無を示すフレームスキップ割り当てが行われる。すなわち、フレームスキップ割り当て部5では、符号化部2が2回目の符号化(以下、第2符号化という)を行うときの各フレームのフレームスキップの有無が決定される。
【0019】
こうしてフレーム毎に決定された符号量割り当て及び量子化スケールの少なくとも一方とフレームスキップ割り当てに基づいて、符号化部2において第2符号化が行われる。第2符号化で符号化部2により生成された符号列は、最終的な符号化データとして動画像符号化装置から出力される。
【0020】
次に、図2に示すフローチャートを用いて本実施形態における概略的な処理の流れを説明する。なお、本実施形態では各フレームに対する符号量割り当て及び量子化スケール割り当てのうち符号量割り当てのみを決定する場合について説明するが、フレーム毎の符号量割り当てに代えてフレーム毎の量子化スケール割り当てを決定してもよく、あるいはフレーム毎の符号量割り当てと量子化スケール割り当ての両方を決定してもよい。
【0021】
まず、符号化対象である入力動画像信号10に対して、第1符号化を行う(ステップS1)。第1符号化は、入力動画像信号10のフレーム毎の符号化特性を示す統計データ11を収集することが目的であり、例えば固定の量子化スケールを用い、さらに例えばMPEG4などの標準化された動画像符号化方式により、固定フレームレートで符号化を行う。統計データ11には、各フレームの量子化スケールの情報と発生符号量の情報を含むものとする。
【0022】
次に、ステップS1で得られた統計データ11から、符号化特性の推定を行う(ステップS2)。符号化特性とは、例えばフレーム毎の発生符号量と量子化スケールの関係を表す関数であり、ステップS2ではその関数のパラメータを出力する。
【0023】
次に、ステップS2で得られた符号化特性のパラメータを用いて、フレーム毎の符号量割り当て(ビットアロケーションともいう)を動画像シーケンス全体にわたって、つまり一連の連続した入力動画像信号10の全体にわたって行う(ステップS3)。この符号量割り当ては、与えられた平均ビットレートの下で均一な画質が得られるように行われる。
次に、ステップS3により割り当てられた符号量の下で、VBV(Video Buffering Verifier)の条件チェックを行う(ステップS4)。VBVは既に知られているように、MPEGビデオ符号化で定義される仮想デコーダモデルであり、仮想デコーダにおける受信バッファ(VBVバッファ)モデルにおいて、アンダーフロー及びオーバーフローが発生しないように発生符号量のバースト性を制限しなければならないというものである。
【0024】
MPEGビデオ符号化データは、VBVモデルに適合することが規格上、義務付けられている。任意の符号量割り当てを行うと、VBVの条件を満たさなくなる場合がある。このような場合には、ステップS4の後にステップS3で行われた符号量割り当てについての修正(ビットアロケーション修正)を行い(ステップS5)、また必要に応じたフレームスキップ(フレーム間引き)の挿入、すなわちフレームスキップ割り当て(フレームスキップアロケーション)を行う(ステップS6)。ステップS5及びS6の処理は、ステップS4でVBVの条件が満たされるまで繰り返される。
【0025】
VBV条件が満たされる符号量割り当ての修正及びフレームスキップの割り当てが完了した後、ステップS3で行われた符号量割り当て(ステップS5で符号量割り当てが修正された場合は修正後の符号量割り当て)とステップS6で行われたフレームスキップ割り当ての結果を表す符号量割り当て/フレームスキップ割り当てデータ12を用いて、第1符号化に供されたのと同じ動画像信号10に対して第2符号化を行う(ステップS7)。
【0026】
第2符号化では、基本的に第1符号化と同一の符号化方式を用いる。但し、第2符号化では符号量割り当て/フレームスキップ割り当てデータ12に従って、発生符号量が与えられた符号量になるようにレート制御が行われ、またフレームスキップ処理が適宜行われる。第2符号化によって、最適化された符号化データ13が出力される。
【0027】
次に、図3を用いて図2中の符号化特性推定ステップ(S2)の処理について具体的に説明する。
一般に、動画像符号化データの発生符号量は量子化スケールに対して変化するので、量子化スケールの調整によって発生符号量の制御が行われる。図3(a)に、量子化スケールと発生符号量の関係を表したグラフを示す。図3(a)において横軸は量子化スケール、縦軸は発生符号量を示している。また、これら発生符号量と量子化スケールの関係は、画像毎に、つまり画像の性質に応じて変化する。例えば、画像の解像度が高くなるに従い、あるいは画像の変化が激しくなるに従って、符号化特性は図3(a)において破線矢印で示した方向に変化する。符号化特性推定ステップ(S2)では、図3(a)に示したような符号化特性が求められる。
【0028】
一方、図3(b)は量子化スケールと復号再生画像信号のSN比との関係を示している。復号再生画像信号は、動画像符号化装置により得られた動画像符号化データを動画像復号化装置により復号して得られる動画像信号である。MPEGビデオ符号化のような量子化を伴う符号化では、量子化スケールの増加に伴って符号化歪が増加し、復号再生画像信号のSN比が低下する。符号化歪は、一義的には量子化スケールによって決まり、画像の性質には依存しない。視覚特性を考慮した量子化重み(空間周波数ごとに量子化幅が変動する)を用いる場合は、必ずしもこの限りではないが、一般に量子化スケールに対してSN比は単調減少する特徴がある。
【0029】
従って、動画像シーケンス全体にわたって安定した再生画質を得るためには、量子化スケールの変動を抑制して、なるべく均一の量子化スケールを用いればよい。但し、仮に量子化スケールを同一とした場合、上述の通りフレーム毎の発生符号量は画像の性質に依存して変化するものとなる。
【0030】
量子化スケールの変動を抑え、かつ所定のビットレートで符号化を行うためには、図3(a)に示した符号化特性を周期的に、例えばフレーム毎に求める必要がある。符号化特性、すなわち発生符号量と量子化スケールの関係は、指数関数や高次の関数で近似することが可能である。ここでは、最も単純な例として、次式により符号化特性を近似した場合について説明する。
【0031】
【数1】
Figure 0003866538
【0032】
式(1)において、Rはi番目のフレームの推定発生符号量、A及びBはi番目のフレームの符号化特性を示すパラメータ、Qは量子化スケールである。ここでAは符号化困難度を示し、これが大きいほど同一量子化スケールを用いた場合の発生符号量が大きくなる。Bは量子化スケールに依存しない一定の符号量を示す項であり、例えばヘッダ部分などの固定の符号量などを示す。
【0033】
第1符号化において、フレーム毎に固定の量子化スケールを用いて符号化を行い、フレーム毎の発生符号量を量子化の影響を受ける部分とヘッダ等の量子化の影響を受けない部分とに分離して集計することで、式(1)におけるパラメータAi及びBiをフレーム毎に決定することが可能である。
【0034】
次に、図4及び図5を用いて図2中の符号量割り当てステップ(S3)について詳しく説明する。
MPEGビデオ符号化のような動画像符号化における符号量制御は、大きく分けて固定ビットレート符号化(CBR)と可変ビットレート符号化(VBR)に分類できる。CBRでは、一定のビットレートで符号化を行うため、量子化スケールを変動させて符号量を一定にする必要がある。量子化スケールを変動させると、それに応じて画質変動が発生する。一般に、符号化困難度(A)の高い高解像度あるいは動きの激しい画像で、画質が低下する。
【0035】
図4(a)(b)(c)は、CBRにおけるビットレート変動、VBVバッファの占有量変動及びSN比の変動を示している。ビットレート及びVBVバッファの変動は非常に小さくなり、逆に画像の性質の変化に応じてSN比、つまり画質が変動するものとなる。
【0036】
一方、図5(a)(b)(c)は、VBRにおけるビットレート変動、VBVバッファの占有量変動及びSN比の変動を示している。VBRでは、画像の性質に合わせてビットレートを変動させることによりSN比の変動が小さくなり、安定した画質が得られることが分かる。
【0037】
また、MPEGビデオ符号化におけるVBVモデルでは、VBVバッファで吸収できる範囲内で、ピークレートを超える瞬間ビットレートで符号化することも可能である。ピークレートを超える部分では、VBVバッファ占有量がアンダーフロー側に遷移していくことになり、この期間が長く継続すると、VBVバッファがアンダーフローして破綻することになる。
【0038】
次に、VBRにおける図2の符号量割り当てステップ(S3)、VBVチェックステップ(S4)、符号量割り当て修正ステップ(S5)及びフレームスキップ割り当てステップ(S6)の処理について具体的に説明する。
なお、ここではVBRの場合について説明するが、本発明はVBRに限定されるものではなく、CBRのVBVモデルに従って一連の処理ステップを実行することで、2パスのCBR符号化を行う場合に対しても適用可能である。
【0039】
VBRの場合、画像の性質に合わせてビットレートの制約及びVBVの制約の範囲内で符号量割り当てを大きく変動させることが可能となる。まず、符号量割り当てステップ(S3)において、符号化特性推定ステップ(S2)で得られた各フレームの符号化特性を用いて、総符号量が所定の平均ビットレートと動画像シーケンス総時間から求まる符号量となるように動画像シーケンス全体にわたって一定の量子化スケールを決定し、各フレームに対する符号量割り当てを決定する。
【0040】
次に、MPEGビデオ規格で定義されるVBVモデルに従って、この符号量割り当ての下でのVBVバッファ占有量の時間変化を計算する。VBVチェックステップ(S4)では、VBVバッファがアンダーフロー(バッファ占有量が0を下回る)を起こすかどうかの判断を行い、アンダーフローが発生しなければ、符号量割り当てを終了し、またフレームスキップの実行は無しとする。VBVアンダーフローが発生した場合、以下の手順でステップS5の符号量割り当て修正及びステップS6のフレームスキップ割り当て処理を行う。
【0041】
図6〜図7は、VBRにおけるVBVモデルのバッファ占有量の時間変化の例を示した図であり、横軸がフレーム番号、縦軸がバッファ占有量を表している。これは各フレームにおいて発生符号量分だけバッファから瞬時にデータが抜き出されてデコードされ、フレーム間ではフレーム間隔に相当する時間だけピークレートで符号化データがバッファに充填されるというモデルとなっている。また、VBRのVBVモデルではバッファのオーバフローは発生せず、VBVバッファの最大値に達した時点で、データ転送が停止するというモデルとなっている。
【0042】
図6(a)は、途中でバッファのアンダーフローが発生した例を示している。このままの符号量配分で第2符号化を行うと、符号化データがVBV違反となるため、符号量割り当ての修正を行う。
【0043】
図6(b)は、アンダーフローが最初に発生するフレームに対する符号量割り当てを削減した例であり、これによりバッファアンダーフローが回避される場合は、符号量割り当ての修正処理を終了する。
符号量割り当ての削減は、該当するフレームに対する量子化スケールを符号量割り当てステップ(S3)で得られた量子化スケールより徐々に大きくすることで、符号化特性推定ステップ(S2)で求めた該当するフレームの符号化特性から符号量の削減量を推定して行われる。但し、大幅に量子化スケールを大きくすると、そのフレームの画質が大幅に低下するため、量子化スケールの上限は、符号量割り当てステップ(S3)で求めた量子化スケールを基準とした所定範囲の値を超えない値とする。これにより、VBVの制約に伴う急激な画質劣化を抑制することが可能となる。
【0044】
図6(c)は、図6(b)とは異なる符号量割り当て修正方法を示したものである。図6(c)では、アンダーフローが発生するフレームから、VBVバッファ占有量が最大値となるフレームまで遡って、その間全てのフレームにおける符号量割り当てを削減することで、アンダーフローを防ぐ。この場合、各フレームに対する符号量割り当ての修正量を最小限に抑えられるため、VBVの制約に伴う画質変動を図6(b)の場合に比べて、さらに小さくすることが可能となる。
【0045】
図7(d)は、図6(c)の処理によりVBVアンダーフローを防ぐための符号量割り当ての修正を行ったが、量子化スケールの上限値までの間にアンダーフローが回避できなかった場合の例を示している。この場合は、フレームスキップ割り当てステップS6により、フレームスキップを挿入することで、VBVバッファのアンダーフローを回避する。
【0046】
図7(d)の例では、図7(e)のように1フレームをスキップする(間引く)だけでは、アンダーフローが回避されない。この場合は、さらに図7(f)のように複数のフレーム(ここでは2フレーム)スキップさせることで、VBVアンダーフローを回避する。但し、図7(f)のように連続する複数のフレームがスキップされると、動画像として局所的なフレームレートが大幅に低下し、動きが荒い映像となってしまう。
【0047】
そこで、図7(g)のように、連続したフレームのスキップは避けて、アンダーフローが発生するフレームから、時間的に遡って間欠的にフレームスキップさせることで、局所的なフレームレートの大幅な低下を抑えることが可能となり、自然な動きを保ちつつVBVアンダーフローを防ぐことが可能となる。
【0048】
ところで、上述したようにVBVの制限を満たすために第2符号化でフレームスキップを実行すると、第2符号化でのフレーム間予測の予測構造が第1符号化と異なる構造に変化し、第1符号化において符号化特性推定ステップ(S2)で求めた符号化特性の精度が第2符号化で低下する場合がある。図8はフレームスキップによる予測構造の変化の一例であり、(a)が第1符号化における各フレームのピクチャタイプを示し、(b)が第2符号化における各フレームのピクチャタイプを示している。ピクチャタイプは予測符号化における符号化の種類を示す符号化タイプであり、Iはフレーム内符号化を行うフレーム(Iピクチャ)、Pは前方予測符号化を行うフレーム(Pピクチャ)をそれぞれ表す。
【0049】
図8の例では、第1符号化に供された図8(a)に示す入力動画像信号のフレームのうち、参照符号20〜23で示すフレームがスキップフレームとして割り当てられ、図8(b)のように第2符号化において間引かれる。通常、Iピクチャは固定の符号化対象フレーム数毎に用いられることが一般的であり、ここでは第1符号化及び第2符号化において、13符号化対象フレーム毎に1回の割合でIピクチャが用いられる例を示している。
【0050】
この場合、スキップするフレーム数に応じて第1符号化と第2符号化とでIピクチャとして符号化されるフレームの位置が異なってしまう。すなわち、フレームスキップにより第1符号化と第2符号化とでピクチャタイプのミスマッチが生じる。図8の例では、参照符号24,25で示すフレームにおいて、第1符号化と第2符号化とでピクチャタイプのミスマッチが発生する。IピクチャとPピクチャとでは符号化特性が大幅に異なるため、このようなピクチャタイプのミスマッチがあると、図2中の符号化特性推定ステップ(S2)で求めた符号化特性で正しく発生符号量の推定を行うことが困難となり、符号量割り当ての最適化が困難となる。
【0051】
この問題に対しては、図9に示すようにフレームスキップの有無によらず各フレームのピクチャタイプを第1符号化と第2符号化とで一致させることにより、ピクチャタイプのミスマッチに伴う符号化特性の推定精度低下を抑えることが可能となる。
【0052】
但し、図9のように各フレームのピクチャタイプを一致させた場合でも、フレーム間予測における参照画像と符号化対象画像との関係は変化する場合がある。図10は、Pピクチャのフレームスキップに伴うフレーム間予測関係の変化を示している。
図10(a)は、固定フレームレートの符号化であり、この予測構造により第1符号化が実施される。図中の矢印は、フレーム間予測における参照画像から符号化対象画像への関係を示している。
【0053】
図10(b)は、図10(a)におけるフレームP2が第2符号化においてスキップされた例を示している。符号化対象画像がP3の場合、第1符号化では参照画像はP2が用いられるが、第2符号化では参照画像はP1としてP3の符号化が行われる。
【0054】
図10(c)は、図10(a)におけるフレームP2及びP3がスキップされた例である。符号化対象画像がP4の場合、第1符号化においてはP3を参照画像とするが、第2符号化においてはP1を参照画像とすることになる。
【0055】
一般に、参照画像と符号化対象画像とのフレーム間距離が大きくなるほど、予測効率が低下し、同一量子化スケールに対して発生符号量は増加する。さらに、スキップしたフレームの中にシーンチェンジ点が含まれていると、予測効率は大幅に低下する。
【0056】
一方、図11(a)に示すように符号化対象画像に両方向予測符号化画像(Bピクチャ)が含まれる場合は、Bピクチャ自体は参照画像として用いられないため、図11(b)に示すようにBピクチャとして符号化されるフレームの中からをスキップフレームを選択すれば、図12に示すように第2符号化において符号化されるフレームの予測構造は第1符号化のそれと一致する。
【0057】
すなわち、図12(a)は固定フレームレートの符号化であり、この予測構造により第1符号化が実施される。図12(b)は、図12(a)におけるフレームB1が第2符号化においてスキップされた例を示している。図12(c)は、図12(a)におけるフレームB1及びB2がスキップされた例である。図12(b)(c)のいずれの第2符号化においても、予測構造は第1符号化の図12(a)の場合と同じである。従って、図2中の符号化特性推定ステップ(S2)で求められた符号化特性は、フレームスキップの有無によらず、修正することなく利用することが可能となる。
【0058】
図9及び図10で説明したように、フレームスキップに伴う予測効率の低下が発生する場合は、符号化特性推定ステップ(S2)で求めた符号化特性の精度が低下し、VBVを考慮した符号量配分の最適化が困難となる。そこで、以下に示す手順で符号化特性の修正を行う。
【0059】
図13に、フレームスキップの決定とそれに伴う符号化特性修正の手順のフローチャートを示す。図13は、図2におけるフレームスキップ割り当てステップ(S6)の処理を詳細に示したものである。
【0060】
VBVチェックステップ(S4)によりVBVのアンダーフローが推定された場合、上述の通り符号量割り当て修正ステップ(S5)により符号量割り当てを修正した後、ステップS10によりVBVのアンダーフローが改善されたか否か、つまりフレームスキップの必要性をチェックし、VBVアンダーフローが改善されていない場合は、フレームスキップが必要と判断して、フレームスキップを行うフレームの決定を行う。
【0061】
第2符号化において、フレームスキップを行うべきフレームの直後にスキップされずに符号化されるフレームがIピクチャ(ステップS11でYes)の場合は、第2符号化においてフレームスキップに伴う第1符号化とのフレーム間予測構造の違いは発生しないため、スキップフレームを追加し、符号化特性の修正は行わない。また、スキップ可能なBピクチャがVBVアンダーフロー推定フレームの前方の存在している場合(S12)は、該当するBピクチャをスキップフレームとする。この場合も、第1符号化とのフレーム間予測構造の違いは発生しないため、符号化特性の修正は行わない。
【0062】
一方、図10に示したように、第2符号化におけるフレームスキップにより、スキップフレーム直後に符号化されるフレームにおいて参照画像が第1符号化における参照画像と異なってしまう場合、以下に示すような符号化特性パラメータの修正を行い、また符号化特性パラメータの修正に応じて当該符号化対象フレームに対する符号量割り当てを修正する。
【0063】
ここでは、図10の場合を例にとって符号化特性パラメータの修正を行う方法について述べる。
前述した通り、式(1)におけるAはi番目のフレームの符号化困難度を示している。i番目のフレームがフレーム間予測符号化フレーム(PピクチャまたはBピクチャ)の場合、Aはフレーム間予測効率の影響を受ける。Aの時間変化を見ることで、シーンチェンジ点を検出することが可能である。例えば、図10(a)においてP1,P2,P3の各フレームにおけるAをそれぞれA,A,Aとすると、Aの値がA,Aの値に比べて突出して大きくなっている場合、P1とP2の間でシーンが切り替わったということが推測可能である。この場合、図10(b)におけるP3あるいは図10(c)におけるP4に対する参照画像となるP1は、符号化対象であるP3あるいはP4と異なるシーンの映像となってしまい、符号化効率が低下することが予測される。
【0064】
このようにフレームスキップの結果、スキップフレームの直後に符号化されるフレームと参照画像との間にシーンチェンジ点が含まれている場合は、シーンチェンジ点直後のフレームにおける符号化特性パラメータをスキップフレームの直後に符号化されるフレームの符号化特性パラメータとして用いる。図10の例では、P2の符号化特性パラメータを図10(b)におけるP3あるいは図10(c)におけるP4の符号化特性パラメータとして用いる。このように、シーンチェンジを考慮して符号化パラメータの修正を行うことで、符号化特性の推定精度の低下を抑制することができ、その結果、効率的な符号量配分を行うことが可能となる。
【0065】
連続するフレームスキップの中にシーンチェンジが含まれない場合でも、参照画像と符号化対象画像とのフレーム間距離が大きくなると、完全な静止画像でない限り、一般に予測効率が低下する。そこで、フレームスキップの中にシーンチェンジが含まれない場合は、次のように符号化特性の修正を行う。
【0066】
今、n番目のフレームがフレームスキップ直後の符号化対象画像であり、そのフレームに関する式(1)で示した符号化特性パラメータをA,Bとする。また、n番目のフレームに最も時間的に近いIピクチャの符号化特性パラメータをAnI,BnIとする。さらに、n番目のフレームの直前の連続するフレームスキップ数をrとする。ここで、これらのパラメータに応じて、n番目のフレームの符号化特性パラメータを次式に示すように修正する。
【0067】
【数2】
Figure 0003866538
【0068】
ここで、A′及びB′が修正後の符号化特性パラメータである。また、Kは定数である。式(2)では、れこらのパラメータのうち符号化困難度を表すパラメータA′は、フレームスキップが無い場合、すなわちr=0の場合はAと一致し、またフレームスキップ数が大きくなると、符号化対象画像と参照画像とのフレーム間距離の2乗に反比例して低下し、フレーム間距離が無限大のとき近傍のIピクチャの符号化困難度AnIに収束するというものである。
【0069】
図14に、式(2)の特性をグラフで示す。横軸は参照画像と符号化対象画像のフレーム間距離(r+1)、縦軸は修正後の符号化特性パラメータA′をAnIで正規化した値を示す。また、図中の破線矢印は第1符号化における符号化困難度AをAnIで正規化した値A/AnIの増加方向を示している。図14からも分かる通り、符号化対象画像の符号化特性は符号化対象画像と参照画像とのフレーム間距離が大きくなるにつれて、近傍のIピクチャの符号化特性に近づくものとなる。
【0070】
このような符号化特性パラメータ補正処理により、VBVの制約を満たすために第2符号化においてフレームスキップが用いられる場合でも、符号化特性の推定制度の低下を防ぐことが可能となり、VBVの制約を満たしつつ安定した高画質を得るための最適な符号量割り当てを求めることが可能なる。
【0071】
以上説明した本実施形態の特徴と、それによる効果を整理すると、次の通りである。
(1)まず、第1符号化ステップにおいて、フレーム単位で入力される入力動画像信号を固定フレームレートで符号化してフレーム毎の発生符号量を含む統計データを生成し、この統計データに従って入力動画像信号の各フレームに対する符号量割り当て及び量子化スケール割り当ての少なくとも一方と、各フレームのフレームスキップ割り当てを決定する。次に、第2符号化ステップにおいて、決定された符号量割り当て及び量子化スケール割り当ての少なくとも一方と各フレームのフレームスキップ割り当てに従って入力動画像信号を符号化し、最終的な符号化データである符号列を生成する。これにより、第2符号化においてフレームレート可変の符号化を行う場合でも、最適な符号量割り当てを行うことができる。
【0072】
すなわち、第1符号化と第2符号化でフレームスキップの発生が異なってしまうと、第1符号化により統計データを用いて第2符号化のための正確かつ最適なフレーム単位の符号量割り当てを行うことが困難となってしまう。これに対し、本実施形態では第1符号化においてはフレームスキップを発生させず、入力動画像信号を固定フレームレートで全てのフレームについて符号化することで、全てのフレームに対する発生符号量の情報が得られるため、第2符号化における最適なフレームスキップ割り当てを決定して、第2符号化を行うことが可能となる。
【0073】
また、通常フレームスキップの発生率は、第2符号化におけるビットレートによって変動するが、本実施形態によれば第2符号化におけるビットレートによらずに、第1符号化を行うことができる。すなわち、第1符号化を一度行えば、第1符号化で得られた統計データから、複数の異なるビットレートにおける符号量割り当て及び最適なフレームスキップ割り当てを算出することが可能となる。従って、同一の動画像素材に対して複数の異なるビットレートの符号化データを作成する場合には、各ビットレート毎に2回の符号化を行う必要がなくなり、第1符号化は一度で済むので、総符号化回数が削減される。
【0074】
(2)符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定する際、第2符号化で可変ビットレートの符号化を行うように、符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定する。
固定レート符号化において画質変動を抑制しようとすると、一般にフレームスキップが多く発生し、逆にフレームスキップを抑制しようとすると、画質変動が大きくなってしまう。これに対して、本実施形態では第2符号化が可変ビットレート符号化となるように、各フレームに対する符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定しているため、可変ビットレート符号化とフレームスキップの最適配置の相乗効果により、フレームスキップの発生率を最小限に抑え、かつ画質変動をなくすことが可能となる。
【0075】
(3)統計データから第2符号化ステップにおける各フレームの発生符号量と量子化スケールとの関係を示す関数のパラメータを推定し、該パラメータを用いて前記符号量割り当てを決定する。また、こうして決定された符号量割り当て及び量子化無スケールの少なくとも一方を用いて仮想受信バッファの占有量の時間変化を推定し、最大の量子化スケールを用いても仮想受信バッファのアンダーフローの発生が推定された場合には、アンダーフローの発生を防止すべくフレームスキップ割り当てを決定する。
フレームレートやビットレートをシーン毎に画像の性質に合わせて変動させる場合、MPEGで規定されるVBVの制限は一般に満たされなくなり、バッファのオーバフローあるいはアンダーフローが発生する危険性がある。
一方、本実施形態によると第1符号化における統計データから、各フレームの発生符号量と量子化スケールとの関係を高精度に示す関数のパラメータを推定することが可能となるため、フレーム毎の最適符号量割り当てに伴う仮想受信バッファ占有量の時間変化を精度よく推定することができる。推定した仮想受信バッファ占有量の時間変化において、バッファアンダーフローの発生が予測される場合にフレームスキップの実行を決定することにより、VBVの制限を満たし、かつフレームスキップの発生を最小限に抑制して、スムーズな画質を得ることが可能となる。また、仮想受信バッファ占有量の時間変化の推定において、量子化スケール変動の最大値を抑制することで、VBVの制限に伴う画質の低下も抑制することができる。
【0076】
(4)仮想受信バッファのアンダーフローの発生が推定された場合、アンダーフローの発生が推定されるフレームより時間的に遡ったフレームのフレームスキップ割り当てを決定する。
VBV管理を満たすためのフレームスキップ割り当ての決定において、連続した複数のフレームをスキップするように決定すると、その部分でのフレームレートが大幅に低下し、再生される動画像の動きが荒くなってしまい、違和感がある動画像となってしまう。
本実施形態によると、フレームスキップ割り当ての決定がオフライン処理となっており、すなわち第2符号化中にフレームスキップ割り当てを決定するのではなく、第1符号化の終了後、動画像シーケンス全体にわたって符号量割り当てとフレームスキップ割り当てを決定し、その後に第2符号化を行うという構成となるため、仮想受信バッファのアンダーフロー発生が予測されるフレームから、時間的に遡ったフレームにおけるフレームスキップ割り当てを決定することができる。
この性質を利用して、仮想受信バッファのアンダーフロー発生が予測される時点より遡った時刻から、徐々にフレームレートが低下するように、連続してスキップされるフレーム数が最小となるように、フレームスキップ割り当てを決定する。これによりフレームレートの低下を最小限に抑えることが可能となり、フレームスキップに伴って再生される動画像の動きが荒くなることを抑制することができる。
【0077】
(5)フレームスキップ割り当て決定するステップによってフレームスキップの実行が決定されたフレームの直後に符号化されるフレームにおいて、(a)フレームスキップの実行が決定されたフレーム数、(b)フレームスキップの実行が決定されたフレームにおける前記発生符号量と量子化スケールとの関係を示す関数のパラメータ及び(c)フレームスキップの実行が決定されたフレームの直後に符号化されるフレームの符号化タイプに応じて、フレームスキップの実行が決定されたフレームの直後に符号化されるフレームの発生符号量と量子化スケールとの関係を示す関数のパラメータを変更することにより、符号量割り当て及び量子化スケールの少なくとも一方を修正するステップをさらに有する。
フレーム間予測符号化を用いる場合、フレームスキップが発生すると予測画像と参照画像の関係が変化するため、第1符号化で得られた統計データから第2符号化における発生符号量を精度良く推定することが困難となる。発生符号量モデルの制度が低下すると、VBVの管理や符号量割り当てが正確にできなくなり、第2符号化において安定した高画質符号化が困難となる。
一方、本実施形態ではスキップしたフレーム数と、スキップしたフレームの発生符号量モデルと次に符号化するフレームの符号化タイプに応じて、符号化すべきフレームの発生符号量と量子化スケールとの関係を示すモデルを修正することで、第2符号化における発生符号量推定の精度を上げることが可能となり、第2符号化において安定した高画質符号化を行うことが可能となる。
【0078】
(6)第1符号化及び第2符号化においてフレーム毎に符号化タイプを選択可能とし、入力動画像信号の同一フレームに対する第1符号化及び第2符号化における符号化タイプを一致させる。
MPEG動画像符号化方式では、通常、フレーム内符号化を行うIピクチャ、前方フレーム間予測を行うピクチャ、両方向フレーム間予測を行うBピクチャを組み合わせて符号化を行う。これらの符号化タイプは、それぞれ符号化効率が異なり、同一動画像であっても符号化タイプにより量子化スケールに対する発生符号量の大きさが異なってくる。従って、第1符号化と第2符号化とで同一のフレームに対する符号化タイプが異なってしまった場合、第2符号化における発生符号量予測を正確に行うことが困難となる。
本実施形態のように第1符号化と第2符号化とで同一フレームに対する符号化タイプをそれぞれ一致させると、第2符号化における発生符号量予測を正確に行うことが可能となる。
【0079】
【発明の効果】
以上説明したように、本発明によれば固定フレームレートの下で第1符号化を行い、第1符号化で得られた統計データに基づいて例えば各フレームの符号化特性パラメータを算出し、これらの符号化特性パラメータを用いてVBVの制約と安定した高画質を両立するフレーム毎の符号量割り当て及び量子化スケール割り当ての少なくとも一方とフレームスキップ割り当てを行い、割り当てられた符号及びフレームスキップに従って第2符号化を行うことで、所定のビットレート条件の下で最適化された高画質符号化を実現することが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る動画像符号化装置の概略構成を示すブロック図
【図2】同実施形態に係る動画像符号化の処理手順を示すフローチャート
【図3】動画像の符号化特性を説明する図
【図4】固定ビットレート符号化の特性を説明する図
【図5】可変ビットレート符号化の特性を説明する図
【図6】同実施形態における符号量及びフレームスキップ割り当てを説明する図
【図7】同実施形態における符号量及びフレームスキップ割り当てを説明する図
【図8】同実施形態におけるPピクチャのフレームスキップに伴う予測構造の変化の一例を説明する図
【図9】同実施形態におけるPピクチャのフレームスキップに伴う予測構造の変化の他の例として第1符号化と第2符号化とで各フレームのピクチャタイプを一致させた例を説明する図
【図10】同実施形態におけるPピクチャのフレームスキップに伴うフレーム間予測関係の変化を説明する図
【図11】同実施形態におけるBピクチャのフレームスキップに伴う予測構造の変化を説明する図
【図12】同実施形態におけるBピクチャのフレームスキップに伴うフレーム間予測関係の変化を説明する図
【図13】同実施形態におけるフレームスキップに伴う符号化特性の修正処理の手順を示すフローチャート
【図14】同実施形態におけるフレームスキップに伴う符号化特性の修正を説明する図
【符号の説明】
1…蓄積メディア
2…符号化部
3…符号化特性推定部
4…符号量/量子化スケール割り当て部
5…フレームスキップ割り当て部
10…動画像信号蓄積メディア
11…符号化統計データ
12…符号量割り当て/フレームスキップ割り当てデータ
13…符号化データ
S1…第1符号化ステップ
S2…符号化特性推定ステップ
S3…符号量割り当てステップ
S4…VBVチェックステップ
S5…符号量割り当て修正ステップ
S6…フレームスキップ割り当てステップ
S7…第2符号化ステップ

Claims (5)

  1. 少なくとも2回の符号化によって動画像を符号化する動画像符号化方法において、
    フレーム単位で入力される入力動画像信号を固定フレームレートで符号化してフレーム毎の発生符号量を含む統計データを生成する第1符号化ステップと、
    前記統計データに従って前記入力動画像信号のシーケンス全体にわたり各フレームに対する符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定するステップと、
    前記統計データから仮想受信バッファの占有量の時間変化を推定し、該時間変化から前記仮想受信バッファのアンダーフローの発生を推定するステップと、
    前記アンダーフローの発生が推定される場合に前記入力動画像信号のシーケンス全体にわたりアンダーフローの発生が推定されるフレーム、または該アンダーフローの発生が推定されるフレームより時間的に遡ったフレームをスキップフレームとして決定するステップと、
    前記符号量割り当て及び量子化スケール割り当ての少なくとも一方と決定された前記スキップフレームに従って前記入力動画像信号を符号化して符号列を生成する第2符号化ステップとを有する動画像符号化方法。
  2. 前記符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定するステップは、前記第2符号化ステップが可変ビットレートの符号化を行うように前記符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定する請求項1記載の動画像符号化方法。
  3. 前記第1符号化ステップ及び第2符号化ステップは、フレーム毎に符号化タイプを選択可能であり、前記入力動画像信号の同一フレームに対する前記第1符号化ステップ及び第2符号化ステップにおける符号化タイプを一致させることを特徴とする請求項1記載の動画像符号化方法。
  4. 少なくとも2回の符号化によって動画像を符号化する動画像符号化装置において、
    フレーム単位で入力される入力動画像信号を符号化する符号化部と、
    前記符号化部が前記入力動画像信号を固定フレームレートで符号化したときのフレーム毎の発生符号量を含む統計データに従って、前記入力動画像信号のシーケンス全体にわたり各フレームに対する符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定する手段と、
    前記統計データから仮想受信バッファの占有量の時間変化を推定し、該時間変化から前記仮想受信バッファのアンダーフローの発生を推定する手段と、
    前記アンダーフローの発生が推定される場合に前記入力動画像信号のシーケンス全体にわたりアンダーフローの発生が推定されるフレーム、または該アンダーフローの発生が推定されるフレームより時間的に遡ったフレームをスキップフレームとして決定する手段とを備え、
    前記符号化部が前記符号量割り当て及び量子化スケール割り当ての少なくとも一方と決定された前記スキップフレームに従って前記入力動画像信号を符号化したときに生成される符号列を符号化データとして出力する動画像符号化装置。
  5. 少なくとも2回の符号化によって動画像を符号化する処理をコンピュータに実行させるためのプログラムであって、
    フレーム単位で入力される入力動画像信号を固定フレームレートで符号化してフレーム毎の発生符号量を含む統計データを生成する処理と、
    前記統計データに従って前記入力動画像信号のシーケンス全体にわたり各フレームに対する符号量割り当て及び量子化スケール割り当ての少なくとも一方を決定する処理と、
    前記統計データから仮想受信バッファの占有量の時間変化を推定し、該時間変化から前記仮想受信バッファのアンダーフローの発生を推定する処理と、
    前記アンダーフローの発生が推定される場合に前記入力動画像信号のシーケンス全体にわたりアンダーフローの発生が推定されるフレーム、または該アンダーフローの発生が推定されるフレームより時間的に遡ったフレームをスキップフレームとして決定する処理と、
    前記符号量割り当て及び量子化スケール割り当ての少なくとも一方と決定された前記スキップフレームに従って前記入力動画像信号を符号化して符号列を生成する処理とをコンピュータに実行させるためのプログラム。
JP2001200158A 2001-06-29 2001-06-29 動画像符号化方法及び装置 Expired - Fee Related JP3866538B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001200158A JP3866538B2 (ja) 2001-06-29 2001-06-29 動画像符号化方法及び装置
US10/183,516 US7075982B2 (en) 2001-06-29 2002-06-28 Video encoding method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001200158A JP3866538B2 (ja) 2001-06-29 2001-06-29 動画像符号化方法及び装置

Publications (2)

Publication Number Publication Date
JP2003018603A JP2003018603A (ja) 2003-01-17
JP3866538B2 true JP3866538B2 (ja) 2007-01-10

Family

ID=19037325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001200158A Expired - Fee Related JP3866538B2 (ja) 2001-06-29 2001-06-29 動画像符号化方法及び装置

Country Status (2)

Country Link
US (1) US7075982B2 (ja)
JP (1) JP3866538B2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2846179B1 (fr) * 2002-10-21 2005-02-04 Medialive Embrouillage adaptatif et progressif de flux audio
JP4179917B2 (ja) * 2003-04-22 2008-11-12 株式会社東芝 動画像符号化装置及び方法
US7751474B2 (en) * 2003-06-30 2010-07-06 Mitsubishi Denki Kabushiki Kaisha Image encoding device and image encoding method
JP2005072742A (ja) * 2003-08-21 2005-03-17 Sony Corp 符号化装置及び符号化方法
BRPI0506846B1 (pt) * 2004-01-30 2018-12-11 Thomson Licensing codificador de vídeo e método para codificar quadros de imagens divisíveis em macro-blocos
US7680326B2 (en) * 2004-03-18 2010-03-16 Fujifilm Corporation Method, system, and program for correcting the image quality of a moving image
JP4655191B2 (ja) * 2004-09-02 2011-03-23 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US20060233237A1 (en) * 2005-04-15 2006-10-19 Apple Computer, Inc. Single pass constrained constant bit-rate encoding
JP4609411B2 (ja) * 2006-10-24 2011-01-12 日本ビクター株式会社 動画像符号化装置及び動画像符号化プログラム
JP5065415B2 (ja) 2007-01-04 2012-10-31 クゥアルコム・インコーポレイテッド 無線通信のための分散スペクトルのセンシングに関する方法および装置
US8073049B2 (en) * 2007-02-01 2011-12-06 Google Inc. Method of coding a video signal
JP2008236333A (ja) * 2007-03-20 2008-10-02 Toshiba Corp 映像符号化装置及び映像符号化方法
KR101379537B1 (ko) * 2007-07-19 2014-03-28 삼성전자주식회사 무선망 채널 정보를 이용한 동영상 부호화 제어 방법
JP4842899B2 (ja) 2007-08-15 2011-12-21 Kddi株式会社 動画像符号化装置、動画像符号化方法およびプログラム
JP5179306B2 (ja) * 2008-09-22 2013-04-10 Kddi株式会社 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
KR20100122386A (ko) * 2009-05-12 2010-11-22 삼성전자주식회사 영상 시퀀스에 인위적으로 삽입된 적어도 하나의 영상 프레임을 부호화/복호화하는 방법 및 장치
US8958475B2 (en) 2009-07-02 2015-02-17 Qualcomm Incorporated Transmitter quieting and null data encoding
US9112618B2 (en) * 2009-07-02 2015-08-18 Qualcomm Incorporated Coding latency reductions during transmitter quieting
US8902995B2 (en) 2009-07-02 2014-12-02 Qualcomm Incorporated Transmitter quieting and reduced rate encoding
CA2798008C (en) * 2010-05-06 2015-10-20 Nippon Telegraph And Telephone Corporation Method for controlling video encoding if a decoder underflow condition is detected
CA2798012A1 (en) 2010-05-07 2011-11-10 Nippon Telegraph And Telephone Corporation Video encoding to prevent decoder buffer underflow by re-encoding selected pictures in a video sequence using a retry count or a retry point
CN102870415B (zh) 2010-05-12 2015-08-26 日本电信电话株式会社 活动图像编码控制方法、活动图像编码装置以及活动图像编码程序
KR101854469B1 (ko) * 2011-11-30 2018-05-04 삼성전자주식회사 오디오 컨텐츠의 비트레이트 판단장치 및 방법
US20140003494A1 (en) * 2012-01-05 2014-01-02 Yaniv Frishman Device, system and method of video encoding
US9591254B2 (en) 2015-03-26 2017-03-07 Qualcomm Incorporated Device and method for processing video data
JP6046761B2 (ja) * 2015-04-06 2016-12-21 日本電信電話株式会社 符号量算出方法、符号量算出装置及び符号量算出プログラム
JP6527384B2 (ja) * 2015-05-11 2019-06-05 日本放送協会 映像符号化装置及びプログラム
US10979744B2 (en) 2017-11-03 2021-04-13 Nvidia Corporation Method and system for low latency high frame rate streaming
US10979747B2 (en) 2017-12-21 2021-04-13 Arris Enterprises Llc Statistical multiplexing system for variable bit rate encoding with constant bit rate encoder

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3734286B2 (ja) 1994-12-27 2006-01-11 株式会社東芝 動画像符号化装置及び動画像伝送装置
JPH0998427A (ja) 1995-09-29 1997-04-08 Toshiba Corp 動画像符号化装置
JP3218994B2 (ja) 1996-10-23 2001-10-15 松下電器産業株式会社 画像符号化方法および装置
US6192154B1 (en) 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
US6895048B2 (en) * 1998-03-20 2005-05-17 International Business Machines Corporation Adaptive encoding of a sequence of still frames or partially still frames within motion video
US6310915B1 (en) * 1998-11-20 2001-10-30 Harmonic Inc. Video transcoder with bitstream look ahead for rate control and statistical multiplexing
JP2000350211A (ja) 1999-06-07 2000-12-15 Toshiba Corp 動画像符号化方法及び動画像符号化装置
US6493386B1 (en) * 2000-02-02 2002-12-10 Mitsubishi Electric Research Laboratories, Inc. Object based bitstream transcoder
US6490320B1 (en) * 2000-02-02 2002-12-03 Mitsubishi Electric Research Laboratories Inc. Adaptable bitstream video delivery system
US6574279B1 (en) * 2000-02-02 2003-06-03 Mitsubishi Electric Research Laboratories, Inc. Video transcoding using syntactic and semantic clues

Also Published As

Publication number Publication date
US20030031251A1 (en) 2003-02-13
US7075982B2 (en) 2006-07-11
JP2003018603A (ja) 2003-01-17

Similar Documents

Publication Publication Date Title
JP3866538B2 (ja) 動画像符号化方法及び装置
JP4480671B2 (ja) ビデオ・エンコーダのモード選択によるレート歪みトレードオフの制御方法および装置
US7068718B2 (en) Advanced method for rate control and apparatus thereof
JP2963416B2 (ja) 量子化活動度を用いてビット発生量を制御する映像符号化方法及び装置
EP1551186B1 (en) Video coding apparatus with resolution converter
JP4358215B2 (ja) 動画像符号化装置及びその方法
JPH11346362A (ja) リアルタイム単一パス可変ビット・レ―ト制御方法及び符号器
JP4366571B2 (ja) 動画像符号化装置及び方法
JP3907875B2 (ja) 符号化レート制御装置及び情報符号化装置
JP2001008215A (ja) 動画像符号化装置及びその方法
US6226326B1 (en) Coding device and coding method
US7274739B2 (en) Methods and apparatus for improving video quality in statistical multiplexing
JP4179917B2 (ja) 動画像符号化装置及び方法
JP4362793B2 (ja) 動画像符号化装置及びその方法
JP4073541B2 (ja) 動画像再符号化装置
US8619864B2 (en) Transcoding/encoding with code amount adjustment and stuffing bits
JP4254784B2 (ja) 動画像符号化装置、方法及びプログラム
JP3734286B2 (ja) 動画像符号化装置及び動画像伝送装置
JP4871848B2 (ja) 動画像再符号化装置
JP2001008207A (ja) 動画像符号化装置及びその方法
JP3425130B2 (ja) 符号化装置及び符号化方法
JP3852209B2 (ja) ビデオ信号の符号化装置
JP2004015351A (ja) 符号化装置及び方法、プログラム、記録媒体
JP4273385B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
US7327892B2 (en) JPEG2000 encoder

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061005

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131013

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees