JP4366571B2 - 動画像符号化装置及び方法 - Google Patents

動画像符号化装置及び方法 Download PDF

Info

Publication number
JP4366571B2
JP4366571B2 JP2003326100A JP2003326100A JP4366571B2 JP 4366571 B2 JP4366571 B2 JP 4366571B2 JP 2003326100 A JP2003326100 A JP 2003326100A JP 2003326100 A JP2003326100 A JP 2003326100A JP 4366571 B2 JP4366571 B2 JP 4366571B2
Authority
JP
Japan
Prior art keywords
encoding
image
code amount
preprocessing
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003326100A
Other languages
English (en)
Other versions
JP2005094458A (ja
Inventor
裕 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003326100A priority Critical patent/JP4366571B2/ja
Publication of JP2005094458A publication Critical patent/JP2005094458A/ja
Application granted granted Critical
Publication of JP4366571B2 publication Critical patent/JP4366571B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、MPEG(Moving Picture Expert Group)方式等に代表される、動画像を符号化するための動画像符号化装置及び方法に関する。
一般に、ディジタルデータからなる動画像を光ディスク等のメディアにそのまま記録すると膨大な量のメモリが必要になる。そのため、動画像を符号化し、効率的に圧縮してメディアに蓄積する技術が極めて重要になる。ここで、「動画像の符号化」とは、動画像を構成する各画像の性質(共通点や違い等)を利用して、画像をより少ない符号量(ビット数)で表現する技術である。
従来の動画像の符号化方法としては、例えば、特許文献1に記載された技術(以下、第1従来例と称す)が知られている。第1従来例は、入力画像(1パス目)を解析して符号化劣化の目立ちやすさを反映させたパラメータである符号化難易度を算出し、算出した符号化難易度に基づき同じ入力画像(2パス目)の符号化及びプレフィルタ制御を実行する2パス方式の符号化方法である。
第1従来例の符号化方法を適用した動画像符号化装置は、図30に示すように、事前解析手段801、制御手段802、遅延手段804、プレフィルタ805、及び符号化手段806を有する構成である。
事前解析手段801は1パス目の入力画像から符号化難易度を算出する。制御手段802は、事前解析手段801で算出された符号化難易度に基づきプレフィルタ805の特性及び目標符号量(符号化の割り当てビット量)を決定する。遅延手段804は、事前解析手段801及び制御手段802による処理が終了するまで入力画像のプレフィルタ805への入力を遅延させる。プレフィルタ805は、制御手段802で決定したフィルタ特性にしたがって遅延された入力画像の帯域をローパスフィルタにより制限する。符号化手段806はプレフィルタ805で処理された入力画像を制御手段802で決定した目標符号量に一致するように符号化する。
また、従来の他の動画像の符号化方法として、特許文献2に記載された技術(以下、第2従来例と称す)が知られている。第2従来例は、入力画像(1パス目)を符号化(第1の符号化)してMPEGで定義されるGOP(Group Of Picture)構造を決定し、該GOP構造に基づいて入力画像(2パス目)を再び符号化する(第2の符号化)。そして、第2の符号化結果から入力画像の所定期間毎の目標符号量を決定し、3パス目の入力画像を目標符号量に一致するように符号化(第3の符号化)する3パス方式の符号化方法である。
第2従来例の符号化方法を適用した動画像符号化装置は、図31に示すように、第1の符号化手段901、GOP構造設定手段902、第2の符号化手段906、目標データ量制御手段907、及び第3の符号化手段909を有する構成である。
第1の符号化手段901は、1パス目の入力画像を予め設定したGOP構造で符号化する。GOP構造設定手段902は、第1の符号化手段901の処理結果に基づいて場面の変化(シーンチェンジ)を検出し、以降の処理で用いるGOP構造(N値、M値)を決定する。
第2の符号化手段906は、2パス目の入力画像をGOP構造設定手段902で決定したGOP構造にしたがって符号化する。目標データ量制御手段907は第2の符号化手段906の処理結果に基づいて入力画像の所定期間毎の目標符号量を決定する。第3の符号化手段909は、3パス目の入力画像を目標データ量制御手段907で決定した目標符号量に一致するように符号化する。
特開平10−302396号公報 特開平8−265747号公報
上述した従来の動画像符号化装置のうち、第1従来例の動画像符号化装置では、プレフィルタ処理により画像の性質が変化するにも関わらず、フィルタ処理前の画像解析結果に基づいて符号化するため、適切に符号化できない問題がある。
一方、第2従来例の動画像符号化装置では、符号化構造としてGOP構造の制御だけが示され、他の符号化構造が選択できない問題がある。また、3パス目の入力画像に対する符号化では、2パス目の入力画像を所定期間毎に事前解析した結果しか利用しないため、例えば1パス目の入力画像の性質がシーンチェンジ等によって変化した場合に、その解析結果が3パス目の入力画像の符号化に反映されず、適切に符号化できない場合がある。
また、上記第1従来例及び第2従来例の動画像符号化装置では、画面毎の符号化難易度に応じて符号量を配分するが(目標符号量の設定)、符号配分結果によるバッファ占有量の推移については何ら考慮していない。そのため、符号化後の画像データを一時的に蓄積する符号化バッファの容量に制約がある場合に、符号化バッファがオーバーフローやアンダーフローを起こすおそれがある。一般に、動画像符号化装置は、符号化バッファのオーバーフローやアンダーフローを回避するための機能を備えているが、符号化によって実際に発生した符号量が目標符号量と大きく異なると符号量を正確に制御できなくなる。すなわち、オーバーフローやアンダーフローを回避するための処理により本来割り当てるべき量と違う符号量が割り当てられるため、符号化による画質の劣化が増大する。
さらに、第1従来例及び第2従来例の動画像符号化装置では、所定期間あたりの特徴量に応じて符号量を割り当てているが、シーンの特性やMPEGで定義される各ピクチャタイプの特性の違いを考慮していないため、ピクチャタイプ毎に最適な目標符号量を設定できない問題がある。
本発明は上記したような従来の技術が有する問題点を解決するためになされたものであり、入力画像応じた適切な符号化構造の選択、前処理制御及び符号量配分を可能にすると共に、符号化バッファの制約を守った適切な符号量配分を実現して符号化画像の品質を向上させることができる動画像符号化装置及び方法を提供することを目的とする。
上記目的を達成するため本発明の動画像符号化装置は、動画像である入力画像を符号化するための動画像符号化装置であって、
複数画像から成る前記入力画像を解析し、所定の符号化単位毎に第1の特徴量を求める第1の事前解析手段と、
前記第1の特徴量に基づいて前記符号化単位毎の符号化に用いる符号化構造を決定する符号化構造設定手段と、
前記第1の特徴量に基づいて前記符号化単位毎に施す加工処理である前処理を決定する前処理制御手段と、
前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延手段と、
前記第1の遅延手段で遅延された入力画像に前記前処理制御手段で決定した前処理を施す前処理手段と、
前記符号化構造設定手段で決定した符号化構造に基づいて前記前処理された画像を解析し、前記符号化単位毎に第2の特徴量を求める第2の事前解析手段と、
前記符号化構造設定手段で決定した符号化構造、前記前処理制御手段で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記符号化単位毎の符号化に用いる目標符号量を決定する目標符号量設定手段と、
前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延手段と、
前記符号化構造設定手段で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化手段と、
を有する構成である。
または、動画像である入力画像を符号化するための動画像符号化装置であって、
複数画像から成る前記入力画像を所定の期間毎に解析し、画像毎の第1の特徴量を求める第1の事前解析手段と、
前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定手段と、
前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御手段と、
前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延手段と、
前記第1の遅延手段で遅延された入力画像に前記前処理制御手段で決定した前処理を施す前処理手段と、
前記符号化構造設定手段で決定した符号化構造に基づいて前記前処理された画像を前記所定の期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析手段と、
前記符号化構造設定手段で決定した符号化構造、前記前処理制御手段で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定手段と、
前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延手段と、
前記符号化構造設定手段で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化手段と、
を有する構成である。
または、動画像である入力画像を符号化するための動画像符号化装置であって、
複数画像から成る前記入力画像を全ての期間で解析し、画像毎の第1の特徴量を求める第1の事前解析手段と、
前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定手段と、
前記符号化構造設定手段で決定した符号化構造を蓄積する符号化構造情報蓄積手段と、
前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御手段と、
前記前処理制御手段で決定した前処理を蓄積する前処理制御情報蓄積手段と、
前記前処理制御手段で決定した前処理を前記画像毎に施す前処理手段と、
前記符号化構造設定手段で決定した符号化構造に基づいて前記前処理された画像を全ての期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析手段と、
前記符号化構造設定手段で決定した符号化構造、前記前処理制御手段で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定手段と、
前記目標符号量設定手段で決定した目標符号量を蓄積する符号化制御情報蓄積手段と、
前記符号化構造設定手段で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化手段と、
を有する構成である。
このとき、前記目標符号量設定手段は、
複数画像から成るピクチャ群の目標符号量を決定し、
該ピクチャ群の目標符号量に応じて前記ピクチャ群内の各画像の目標符号量をそれぞれ決定してもよく、
前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
前記符号化バッファのオーバーフロー及びアンダーフローを回避するように前記目標符号量を調整してもよく、
前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
前記バッファ占有量の最大値及び最小値の振れ幅が予め設定された所定の範囲内に収まるように前記目標符号量を調整してもよい。
また、前記第2の事前解析手段は、
前処理された入力画像毎のアクティビティを算出するアクティビティ計算手段と、
過去に入力された前処理画像を参照画像として、前記符号化構造設定手段で決定された符号化構造に基づき動きベクトル探索を行い、動きベクトルを生成して動き補償フレーム間予測画像を作成し、フレーム間予測誤差を計算するフレーム間予測手段と、
前記アクティビティ及び前記フレーム間予測誤差から前記符号化構造設定手段で決定されたピクチャタイプに応じてそれぞれの画面の複雑度を推定する複雑度推定手段と、
を有していてもよく、
予め設定された符号化方法及び前記符号化構造設定手段で決定した符号化構造にしたがって前処理画像を符号化する第2の符号化手段と、
固定の量子化幅あるいは量子化幅の画面毎の平均値、及び発生符号量から画面毎の複雑度を算出する複雑度計算手段と、
を有していてもよい。
一方、本発明の動画像符号化方法は、所定の処理を実行するための処理装置を備え、
前記処理装置により動画像である入力画像を符号化するための動画像符号化方法であって、
複数画像から成る前記入力画像を解析し、所定の符号化単位毎に第1の特徴量を求める第1の事前解析工程と、
前記第1の特徴量に基づいて前記符号化単位毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
前記第1の特徴量に基づいて前記符号化単位毎に施す加工処理である前処理を決定する前処理制御工程と、
前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延工程と、
前記第1の遅延工程で遅延された入力画像に前記前処理制御工程で決定した前処理を施す前処理工程と、
前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を解析し、前記符号化単位毎に第2の特徴量を求める第2の事前解析工程と、
前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記符号化単位毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延工程と、
前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
を有する方法である。
または、所定の処理を実行するための処理装置を備え、
前記処理装置により動画像である入力画像を符号化するための動画像符号化方法であって、
複数画像から成る前記入力画像を所定の期間毎に解析し、画像毎の第1の特徴量を求める第1の事前解析工程と、
前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御工程と、
前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延工程と、
前記第1の遅延工程で遅延された入力画像に前記前処理制御手段で決定した前処理を施す前処理工程と、
前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を前記所定の期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析工程と、
前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延工程と、
前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
を有する方法である。
または、所定の処理を実行するための処理装置と、
前記処理装置の処理結果を蓄積するための記憶装置と、
を備え、
前記処理装置により動画像である入力画像を符号化するための動画像符号化方法であって、
複数画像から成る前記入力画像を全ての期間で解析し、画像毎の第1の特徴量を求める第1の事前解析工程と、
前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
前記符号化構造設定工程で決定した符号化構造を前記記憶装置に蓄積する符号化構造情報蓄積工程と、
前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御工程と、
前記前処理制御手段で決定した前処理を前記記憶装置に蓄積する前処理制御情報蓄積工程と、
前記前処理制御工程で決定した前処理を前記画像毎に施す前処理工程と、
前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を全ての期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析工程と、
前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
前記目標符号量設定工程で決定した目標符号量を蓄積する符号化制御情報蓄積工程と、
前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
を有する方法である。
このとき、前記目標符号量設定工程は、
複数画像から成るピクチャ群の目標符号量を決定し、
該ピクチャ群の目標符号量に応じて前記ピクチャ群内の各画像の目標符号量をそれぞれ決定してもよく、
前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
前記符号化バッファのオーバーフロー及びアンダーフローを回避するように前記目標符号量を調整してもよく、
前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
前記バッファ占有量の最大値及び最小値の振れ幅が予め設定された所定の範囲内に収まるように前記目標符号量を調整してもよい。
また、前記第2の事前解析工程は、
前処理された入力画像毎のアクティビティを算出するアクティビティ計算工程と、
過去に入力された前処理画像を参照画像として、前記符号化構造設定工程で決定された符号化構造に基づき動きベクトル探索を行い、動きベクトルを生成して動き補償フレーム間予測画像を作成し、フレーム間予測誤差を計算するフレーム間予測工程と、
前記アクティビティ及び前記フレーム間予測誤差から前記符号化構造設定工程で決定されたピクチャタイプに応じてそれぞれの画面の複雑度を推定する複雑度推定工程と、
を有していてもよく、
予め設定された符号化方法及び前記符号化構造設定工程で決定した符号化構造にしたがって前処理画像を符号化する第2の符号化工程と、
固定の量子化幅あるいは量子化幅の画面毎の平均値、及び発生符号量から画面毎の複雑度を算出する複雑度計算工程と、
を有していてもよい。
本発明の第1の効果は、入力画像に応じた適切な符号化構造の選択、前処理制御及び符号量配分が可能になり、符号化画像の品質が向上する。
その理由は、前処理によって加工された入力画像に対して再度事前解析を行うため、実際に符号化される画像の性質を予め正確に得られるからである。また、1パス目の事前解析結果を、例えば動き探索範囲の制御やフレーム・フィールド構造の制御及び画像サイズの制御に用い、2パス目の事前解析結果と供に3パス目の目標符号量の設定処理で利用するからである。さらに、事前解析として符号化処理を行わずに、例えば、シーンチェンジ検出や冗長フィールド検出等、符号化処理だけでは正確に得ることが難しい特徴量をそれに特化した処理で得ているからである。また、画像毎の目標符号量の決定には、複数の画像から構成されるピクチャ群の目標符号量を決定し、ピクチャ群の目標符号量に応じてピクチャ群内の各画像の目標符号量をそれぞれ決定することで、ピクチャタイプの違いに依存しない、シーンの特徴に応じた符号量配分、及びピクチャタイプ毎の特性の違いを考慮した符号量配分が実現できるからである。
本発明の第2の効果は、バッファ制約を守った適切な符号量配分が実現できることである。
その理由は、事前解析情報に基づいた符号量の割り当てを、当該期間全ての画像に対して行い、その結果から符号化バッファのバッファ占有量の推移を予測し、符号化バッファの制約に違反しないように目標符号量を調整するため、予め符号化バッファの制約を遵守した符号量の割り当てが可能になる。そのため、符号化で実際に発生する符号量を目標符号量に近づけることができるため、画面の複雑度に応じて符号量が配分され、同じビットレートにおける符号化後の画質に改善が期待できる。
次に本発明について図面を参照して詳細に説明する。
なお、以下では動画像の符号化方式としてMPEG2を用いる場合で説明する。
[第1の実施の形態]
図1は本発明の動画像符号化装置の第1の実施の形態の構成を示すブロック図である。
図1に示すように、第1の実施の形態の動画像符号化装置は、第1の事前解析手段101、符号化構造設定手段102、前処理制御手段103、第1の遅延手段104、前処理手段105、第2の事前解析手段106、目標符号量設定手段107、第2の遅延手段108、及び符号化手段109を有する構成である。
第1の事前解析手段101は、予め設定された所定期間毎に入力される複数フレームから成る入力画像を解析し、符合化単位であるフレーム内あるいはフレーム間の入力画像の特徴量をそれぞれ抽出して第1の解析情報として出力する。符号化構造設定手段102は、第1の解析情報に基づいて、第2の事前解析手段106、目標符号量設定手段107及び符号化手段109で用いる符号化構造を決定する。また、前処理制御手段103は、第1の解析情報に基づいて前処理手段105で用いる前処理制御方法を決定する。
第1の遅延手段104は、第1の事前解析手段101による処理期間だけ入力画像を遅延させて前処理手段105に供給する。前処理手段105は、第1の遅延手段104により遅延された入力画像に対して前処理制御手段103で決定した前処理制御方法にしたがって前処理を施し、前処理画像として出力する。
第2の事前解析手段106は、符号化構造設定手段102で設定された符号化構造に基づいて第1の事前解析手段101の処理期間と同期間の前処理画像を事前解析し、第2の解析情報として出力する。
目標符号量設定手段107は、符号化構造設定手段102、前処理制御手段103、第1の事前解析手段101及び第2の事前解析手段106で決定した符号化構造、前処理方法、第1の解析情報、及び第2の解析情報に基づいて、符号化手段109で用いる目標符号量を決定する。前処理された入力画像は、第2の遅延手段108により第2の事前解析手段106の処理期間だけ遅延される。
符号化手段109は、第2の遅延手段108から出力された前処理画像を、符号化構造設定手段102及び目標符号量設定手段107で決定した符号化構造及び目標符号量に基づいて所定の符号化単位毎に符号化し、符号化後の画像データである符号化ビットストリームを出力する。
なお、上記第1の事前解析手段101、符号化構造設定手段102、前処理制御手段103、第1の遅延手段104、前処理手段105、第2の事前解析手段106、目標符号量設定手段107、第2の遅延手段108、及び符号化手段109は、例えば、演算機能やメモリ機能を備えたLSI(Large scale Integrated Circuit)によって構成されてもよい。または、プログラムにしたがって処理を実行するCPU、該CPUの処理に必要なデータを保持する記憶装置、プログラムを保持する記録媒体、入力画像を取り込むための入力装置や符号化後の画像データを出力するための出力装置とのインタフェースであるI/O部、及びネットワークを介してサーバ装置等とのデータ通信を可能にする通信装置等を備えたコンピュータによって構成されてもよい。その場合、CPUは、上記記録媒体からプログラムを主記憶装置にロードし、該プログラムにしたがって処理を実行することで、上記各手段の機能をそれぞれ実現する。
入力画像の符号化単位は、例えばフレーム単位、フィールド単位、1画面をさらに細分化した画像単位等に設定すればよく、入力画像の解析期間はハードウェアの処理能力やバッファ容量等に応じて適宜設定すればよい。
次に、図2を参照して図1に示した本実施形態の動画像符号化装置の動作について説明する。なお、図2は、次のパスの入力画像に対する符号化処理の前にL(Lは整正数)フレーム分の入力画像を事前解析し、第1の遅延手段104及び第2の遅延手段108の遅延量をそのLフレーム分の入力画像の事前解析期間にそれぞれ一致させた例である。
図2に示すように、本実施形態の動画像符号化装置では、最初に、1パス目の入力画像についてMPEGで定義されるピクチャ毎に解析し、第Lフレームまでの解析情報を用いて2パス目の入力画像の第1フレームを符号化する。
次に、2パス目の入力画像についてピクチャ毎に解析し、1パス目の入力画像の第2Lフレームまでの解析情報及び2パス目の入力画像の第Lフレームまでの解析情報をそれぞれ用いて3パス目の入力画像の第1フレームを符号化する。
続いて、1パス目の入力画像の第L+1フレームまでの解析情報を用いて2パス目の入力画像の第2フレームを符号化し、1パス目の入力画像の第2L+1フレームまでの解析情報及び2パス目の入力画像の第L+1フレームまでの解析情報をそれぞれ用いて3パス目の入力画像の第2フレームを符号化する。
以降、同様の処理を繰り返し、1パス目の入力画像の第J+L−1フレームまでの解析情報を用いて2パス目の入力画像の第Jフレームを符号化し、1パス目の入力画像の第J+2L−1フレームまでの解析情報及び2パス目の入力画像の第J+L−1フレームまでの解析情報をそれぞれ用いて3パス目の入力画像の第Jフレームを符号化する。
以上のように、本実施形態の動画像符号化装置では、3パス目の入力画像の符号化処理時に、1パス目の入力画像の解析情報及び2パス目の入力画像の解析情報をそれぞれ用いることで、2パス目の入力画像の事前解析情報だけを利用する第2従来例よりも多くの入力画像の解析情報を利用できるため、より適切な符号化が可能になる。なお、図2に示す例では、1パス目の入力画像に対する2パス目の入力画像の遅延量と、2パス目の入力画像に対する3パス目の入力画像の遅延量とを同じ値に設定しているが、これらの遅延量は異なっていてもよい。
図3は第1の実施の形態の動画像符号化装置の処理手順を示すフローチャートである。
図3に示すように、第1の実施の形態の動画像符号化装置では、まずステップS101にて、1パス目の入力画像を事前解析し、第1の解析情報を出力する。
次に、ステップS102にて、第1の解析情報に基づいて符号化構造を決定する。また、ステップS103にて、第1の解析情報に基づき前処理方法を決定し、ステップS105にて、該前処理方法にしたがって入力画像に前処理を施す。
次に、ステップS106にて、決定した符号化構造により前処理された入力画像を事前解析し、第2の解析情報を出力する。
続いて、ステップS107にて、第1の解析情報及び第2の解析情報を用いて入力画像毎の目標符号量を設定する。
最後に、ステップS109にて、設定された符号化構造により前処理された入力画像を目標符号量に一致するように符号化する。
以下、図1に示した第1の実施の形態の動画像符号化装置の各構成手段における処理について、図面を用いてより具体的に説明する。
(1)第1の事前解析手段
(第1実施例)
図4は図1に示した第1の事前解析手段の第1実施例の構成を示すブロック図である。
第1実施例の第1の事前解析手段101は、アクティビティ、フレーム間の予測誤差、フレーム間相関、複雑度、及び動きベクトル統計量を入力画像の特徴量として算出するための手段をそれぞれ有する構成である。
アクティビティ計算手段1001は、画面毎のアクティビティを算出する。アクティビティAの値は、例えば次式に示す入力画像の輝度信号の分散値を用いる。
Figure 0004366571
ここで、I(x,y)は画像の位置(x,y)における画素値、Hは水平方向の画面サイズを示し、Vは垂直方向の画面サイズを示す。
また、Mは画素値の画面内平均値であり、
Figure 0004366571
で算出する。
なお、アクティビティAの値は、次式に示すように画面内輝度信号の平均偏差の絶対値平均でもよい。
Figure 0004366571
また、アクティビティAの値は、次式に示す隣接画素間差分絶対値和でもよい。
Figure 0004366571
フレーム間予測手段1002は、過去の入力画像を参照画像に用いてフレーム間予測画像を生成する。ここでは、MPEG方式における通常の符号化処理と同様に、画面を複数のブロックに分割し、予め設定された符号化構造及び探索範囲に基づいて動きベクトル探索を行い、ブロック毎に動きベクトルを算出する。そして、動きベクトルの算出結果を基に動き補償フレーム間予測画像を生成し、フレーム間予測誤差Eを算出する。
フレーム間予測誤差Eは、例えば次式で示すようにフレーム間予測画像と現画像間の誤差の2乗和平均で求める。
Figure 0004366571
ここで、P(x,y)は予測画像であり、I(x,y)は対応する現画像である。
また、フレーム間予測誤差Eは、次式で示すようにフレーム間予測画像と現画像間の差分絶対値和平均で求めてもよい。
Figure 0004366571
フレーム間相関推定手段1003は、アクティビティ計算手段1001で算出されたアクティビティAとフレーム間予測手段1012で算出されたフレーム間予測誤差Eとを用いて次式に示すフレーム間相関を示す尺度ρを計算する。
Figure 0004366571
複雑度推定手段1004は、アクティビティAとフレーム間予測誤差Eからピクチャタイプ毎の複雑度を計算する。複雑度は、アクティビティA及びフレーム間予測誤差Eと相関があることが分かっているため、これらの値から推定できる。例えば、Iピクチャの複雑度Xi、Pピクチャの複雑度Xp、及びBピクチャの複雑度Xbは、
Figure 0004366571
で推定する。ここで、ai、ap、ab、bi、bp、bbはそれぞれ推定係数であり、予め定めた一定値を用いてもよく、符号化によって得られた実測値に基づき逐次計算して更新してもよい。
動きベクトル統計量計算手段1005は、画像間の差から検出した動きベクトルの統計量を出力する。例えば、MPEG2で規定された領域であるマクロブロック毎に検出した動きベクトルの平均値、あるいはマクロブロック毎に検出した動きベクトルのヒストグラムを算出する。
(第2実施例)
図5は図1に示した第1の事前解析手段の第2実施例の構成を示すブロック図である。
第2実施例の第1の事前解析手段101は、予め定めた符号化構造により符号化を行い、特徴量として画面毎の平均量子化幅、発生符号量、複雑度、フレーム間相関、動きベクトル統計量、及び符号化誤差を算出するための手段をそれぞれ有する構成である。
符号化手段1006は、予め設定された符号化構造にしたがって入力画像を符号化する。例えば、入力画像を予め設定された固定の量子化幅で符号化し、画面毎の発生符号量を計測して出力する。あるいは、入力画像を予め設定されたビットレートで符号化し、量子化幅の画面毎の平均値と画面毎の発生符号量とを計測して出力する。また、符号化手段1006は、入力画像のフレーム間予測を行い、マクロブロック毎に検出した動きベクトル情報を生成する。そして、入力画像と符号化画像との差分を符号化誤差として出力する。
複雑度計算手段1007は、固定値の量子化幅Q、あるいは量子化幅の画面毎の平均値Qと画面毎の発生符号量Sとから画面毎の複雑度Xを次式で計算する。
Figure 0004366571
また、必要であれば、GOP毎の複雑度Xgopを算出する。
GOP毎の複雑度Xgopは、固定値の量子化幅Q、あるいは量子化幅のGOP毎の平均値QgopとGOP毎の発生符号量Sgopとを用いて次式で計算する。
Figure 0004366571
動きベクトル統計量計算手段1008は、図3に示した第1実施例と同様の処理を実行することで、検出した動きベクトルの統計量を算出する。
フレーム間相関推定手段1009は、算出した画面毎の複雑度Xから次式に示すフレーム間相関を示す尺度ρを計算する。
Figure 0004366571
ここで、XpはPピクチャの複雑度、XiはIピクチャの複雑度であり、それぞれ最新の値を用いる。
(第3実施例)
図6は図1に示した第1の事前解析手段の第3実施例の構成を示すブロック図である。
第3実施例の第1の事前解析手段101は、入力画像のフレーム間差分からシーンチェンジ及び冗長フィールドを検出し、それらの検出結果を出力するための手段をそれぞれ有する構成である。
フレーム間差分計算手段1010は、入力画像のフレーム間差分を入力画像のフィールド単位で算出する。
図7に示すように、入力画像の1フレームが2つのフィールドから構成されている場合(飛び越し走査)、フィールド単位によるフレーム間差分の値は、入力フィールドと同一フレームの直前フィールドとの差分を計算することで求める。例えば、フィールド3の画像入力時にはフィールド1とフィールド3のフレーム間差分を算出し、フィールド4の画像入力時にはフィールド2とフィールド4のフレーム間差分を算出する。
具体的には、フレーム間差分Dを次式で算出する。
Figure 0004366571
ここで、p(x,y)は入力フィールドの画素値、p’(x,y)は同一フレームの直前フィールドの画素値である。また、hは1フィールドの水平方向の画面サイズを示し、vは垂直方向の画面サイズを示す。
シーンチェンジ検出手段1011は、フレーム間差分Dの値から場面(シーン)が変化したフィールドを検出する。例えば、予め所定のしきい値を定めておき、フレーム間差分Dが該しきい値よりも大きく変化した場合はシーンチェンジが有ると判定する。なお、しきい値は固定値でもよく、場面に応じて変更してもよい。
図8はシーンチェンジの検出例を示す模式図である。
図8に示すように、例えばフィールド5から場面が変化している場合、フィールド3、5のフレーム間差分の値と、フィールド4、6のフレーム間差分の値とが大きく異なる。シーンチェンジ検出手段1011は、このフレーム間差分の変化を検出することでシーンチェンジを検出する。
冗長フィールド検出手段1012は、フレーム間差分Dの値から同じ画像を繰り返している冗長フィールドを検出する。冗長フィールドは、例えば1秒間に24コマの映画フィルムソースを1秒間に約30フレームのテレビジョン映像信号に変換する場合に、フィルム2コマ(4フィールド分)から5フィールドのテレビジョン映像を作るために挿入される繰り返しフィールドである。
図9は冗長フィールドの検出例を示す模式図である。
例えば、24コマの映画フィルムソースを30フレームのテレビジョン映像信号に変換する場合、テレビジョン映像信号のフィールド1、2には映画フィルムソースの1コマ目が挿入され、フィールド3にはフィールド1と同じ画像信号が挿入される。また、テレビジョン映像信号のフィールド4、5には映画フィルムソースの2コマ目が挿入され、テレビジョン映像信号のフィールド6、7には映画フィルムソースの3コマ目が挿入され、フィールド8にはフィールド6と同じ画像信号が挿入される。さらに、テレビジョン映像信号のフィールド9、10には映画フィルムソースの4コマ目が挿入される。以降、上記処理と同様にテレビジョン映像信号の各フィールドに映画フィルムソースが挿入される。
冗長フィールドは、例えば予め所定のしきい値を定めておき、フレーム間差分Dと該しきい値とを比較することで検出する。すなわち、フレーム間差分Dがしきい値以下である場合は、該当するフィールドが冗長フィールドであると判定する。この冗長フィールドの検出に用いるしきい値は、固定値であってもよく、場面に応じて変更してもよい。
図9に示す例では、フィールド3がフィールド1の繰り返し画像であるため、フィールド1とフィールド3のフレーム間差分Dの値がしきい値以下となり、フィールド3が冗長フィールドであると判定される。
なお、第1の事前解析手段101は、上記第1実施例〜第3実施例で示した構成のうち、一部の手段によって得られる解析情報だけを出力してもよく、図4〜図6に示した構成を任意に組み合わせて得られる解析情報を出力してもよい。
(2)符号化構造設定手段
(第1実施例)
図10は図1に示した符号化構造設定手段の第1実施例の構成を示すブロック図である。
図10に示すように、第1実施例の符号化構造設定手段102は、フレーム間の相関尺度から前方向予測フレーム(Pピクチャ)の間隔(M値)を決定して出力するM値設定手段1020を備えた構成である。
動画像の符号化方式としてMPEG2を採用する場合、ピクチャタイプには、Iピクチャ、Pピクチャ、及びBピクチャの3種類が使える。第1実施例の符号化構造設定手段102は、Iピクチャについてピクチャ内符号化を行い、フレーム間の予測は行わない。また、Pピクチャについては直前のIピクチャまたはPピクチャを参照して前方向予測のみのフレーム間予測を行う。また、Bピクチャについては前後のIピクチャまたはPピクチャを参照して前方向予測、後ろ方向予測、両方向予測のフレーム間予測を行う。
ピクチャタイプの配置は任意に選択できるが、周期的に配置する構造が一般的である。このとき、IピクチャまたはPピクチャのフレーム間隔をM値とすると、このM値で符号化構造が示される。
例えば、図11に示すように、M=3では、Pピクチャ(Iピクチャ)のフレーム間隔が3であり、それらの間に2枚のBピクチャが挟まれた構造である(図11(a)参照)。また、M=1は、Pピクチャ(Iピクチャ)のフレーム間隔が1であり、Bピクチャを使用しない構造である(図11(b)参照)。
一般に、フレーム間隔が長くなるとフレーム間予測性能が低下するが、フレーム間相関が高ければBピクチャを利用することで予測性能が向上する。逆に、フレーム間相関が低ければPピクチャの間隔を短くすることで予測性能が向上する。そのため、フレーム間相関に基づいてM値を変化させ、符号化構造を適応的に変えることが好ましい。例えば、図11に示すように、符号化構造をM=1またはM=3に適応的に切り換える(図11(c)参照)。
フレーム間の相関は、上記尺度ρの値が大きいほど低く、尺度ρの値が小さいほど高いことを示している。そこで、単調に減少する関数fを用いてM値を決定する。
M=f(ρ)
あるいは、選択できるM値を限定し(例えば、M=3またはM=1のみ使用)、尺度ρの値に対するしきい値を定め、尺度ρが該しきい値より大きければ小さなM値、すなわちM=1を選択し、尺度ρがしきい値より小さければ大きなM値、すなわちM=3を選択してもよい。
以上説明したように、IピクチャまたはPピクチャのフレーム間隔(M値)を制御することで効率のよい動画像の符号化が実現できる。
(第2実施例)
図12は図1に示した符号化構造設定手段の第2実施例の構成を示すブロック図である。
図12に示すように、第2実施例の符号化構造設定手段102は、動きベクトル統計量から動き探索範囲(動き探索パラメータ)を決定して出力する動き探索パラメータ設定手段1021を備えた構成である。例えば、画像中の動き探索範囲を固定の大きさ及び形状に設定し、その中心位置が移動できるようにする。このとき、探索範囲の移動量を動きベクトルの統計量から決定する。
図13は第2実施例の符号化構造設定手段の探索範囲の設定例を示す模式図である。
動き探索範囲は、動きベクトルの検出対象ブロックを中心に上下左右に対称な領域に設定するのが一般的であり、例えば、図13の点線で示す領域が探索範囲となる。しかしながら、動きベクトルがある方向に偏って存在する場合、同じ演算量で同じ面積を探索するならば、動きベクトルの偏りがある方向に探索範囲を移動させた方が、より大きな動きベクトルの検出が可能になる。
動き探索範囲の移動量は、動きベクトル統計量として、例えば動きベクトルの平均値を取得し、その値を用いる。あるいは動きベクトルのヒストグラムを生成し、度数の最も高い動きベクトルの位置に対する移動量を用いる。あるいは動きベクトルのヒストグラムを生成し、水平方向、垂直方向それぞれの動きベクトルの検出範囲を求め、その中心位置に対する移動量を用いてもよい。
動き探索範囲の他の設定例として、探索範囲の大きさを制限し、形状を変える方法もある。例えば、横方向の動きに偏っている場合は、図14に示すように、通常の探索範囲と面積が等しく、かつ横長の探索範囲を設定して動きベクトル探索を行う。あるいは、図15に示すように、通常の探索範囲と面積が等しく、かつより実際の動きに近い方向の動きベクトルが探索可能な形状の探索領域を設定する。
動き探索範囲の形状は、動きベクトル統計量として、例えば動きベクトルのヒストグラムを生成し、この値に基づいて設定する。具体的には、予め複数種類の形状パターンを用意しておき、ヒストグラムから検出ベクトルの網羅率を算出し、最も適合する(最も網羅率が高い)形状を選択する。
また、動き探索範囲の他の設定例として、探索範囲の大きさを縮小できるようにして、予測効率が最も高い最小限の探索範囲に設定する方法もある。これは、動きベクトルを符号化する場合に、大きな動きベクトルの符号化には多くの符号量が必要になるため、予測性能が上がっても符号化効率が低下するためである。本実施例では、大きな動きベクトルを符号化する必要がない場合に探索範囲を小さくする。探索範囲は、MPEG2ではfcodeによって段階的に設定され、大きなfcodeを使うと大きい動きベクトルが符号化できるが、ベクトル符号量は増加する。探索範囲の大きさは、例えば動きベクトルのヒストグラムを生成し、該ヒストグラムを参照して、fcodeの組み合わせで定義される複数の探索範囲のうち、検出可能な動きベクトルをある割合以上含む最小の探索範囲を選択することで決定する。図16に示すように、fcodeの組み合わせによって制限探索範囲1〜3に設定できる場合、それぞれの探索範囲に含まれる検出ベクトルの割合を計算し、ほぼ全数の検出ベクトルの探索が可能な最小探索範囲を選択する。
なお、fcodeで定義される探索範囲は、適用するビデオ符号化方式に依存するが、水平方向及び垂直方向共に同一でもよく、水平方向及び垂直方向で異なっていてもよい。さらに、動き探索パラメータは、探索範囲の移動や探索範囲を変形させる手法と組み合わせて設定してもよく、M値の適応選択制御と組み合わせてもよい。ここで、第1の事前解析手段で用いるM値と第2の事前解析手段や符号化手段で用いるM値とが異なる場合は、参照するフレーム間隔に応じて探索範囲の大きさを調整してもよい。
なお、第1の事前解析手段101の処理で用いる動き探索範囲は、第2の事前解析手段106や符号化手段109の処理で用いる動き探索範囲よりも広いことが望ましい。特に、第1の事前解析手段101の処理で用いる動き探索範囲は、移動あるいは変形させることで探索可能な範囲を全て網羅していることが望ましい。第1の事前解析手段101の処理で用いる動き探索範囲が第2の事前解析手段106や符号化手段109の処理で用いる動き探索範囲と同等以下である場合は、その範囲内で最適な探索範囲を推定する。
以上説明したように動き探索範囲を制御し、動き検出の可能性が高い探索範囲を設定することで、適切な動きベクトルが検出され、動き補償フレーム間予測性能が向上する。また、探索範囲を必要最小限に設定することで、動きベクトルの符号量を最小にできるため、動き補償フレーム間予測の処理効率が向上する。
(第3実施例)
図17は図1に示した符号化構造設定手段の第3実施例の構成を示すブロック図である。
図17に示すように、第3実施例の符号化構造設定手段102は、シーンチェンジ検出結果に基づいてIピクチャを指定して出力するN値及びフレーム・フィールド構造設定手段1022を備えた構成である。
通常、Iピクチャは所定の周期で挿入され、その間隔はN値で表記される。場面が変わる場合、フレーム間予測が効かないため、フレーム内符号化ピクチャ(Iピクチャ)を選択する。本実施例では、例えば、場面が変わった直後のPピクチャをIピクチャに変更し、N値を可変にする。
図18は第3実施例の符号化構造設定手段によるIピクチャの挿入例を示す模式図である。
図18(a)は、N=9、M=3のGOP構造を示し、9フレーム間隔でIピクチャが挿入される例である。ここで、図の黒い三角形の位置でシーンチェンジが検出された場合、図18(b)、(c)、(d)に示すように、その位置にIピクチャが挿入される。
Iピクチャ挿入以降のGOP構造は、いくつかの形態が考えられる。
例えば、図18(b)では、Iピクチャを挿入しても以降のIピクチャの位置は従来のままである。一方、図18(c)では、Iピクチャを挿入すると、そこから新たにN=9の間隔でIピクチャが挿入される。また、図18(d)では、Iピクチャを挿入すると、次のIピクチャをPピクチャに変更する例である。
以上のように、動き補償フレーム間予測が効かないフレームを検出してフレーム内符号化ピクチャ(Iピクチャ)を挿入することで、効率的な符号化が実現できる。
また、本実施例では、MPEG2のようにフレーム構造とフィールド構造とが利用できる符号化方式の場合、フレーム構造とフィールド構造とをフレーム毎に適宜選択する。例えば、フレーム構造を基本にして符号化しているとき、フレームを構成する2つのフィールドのうち、第1フィールドと第2フィールド間でシーンチェンジを検出した場合は、そのフレームについてフィールド構造を選択して符号化する。具体的には、図19に示すように、フィールド3とフィールド4間でシーンチェンジを検出した場合、フィールド3とフィールド4からなるフレームはフィールド構造を選択して符号化する。
以上のように、フレーム構造による符号化に適さないフレームを検出した場合は、そのフレームをフィールド構造で符号化することで効率的な符号化が可能になる。
(第4実施例)
図20は図1に示した符号化構造設定手段の第4実施例の構成を示すブロック図である。
図20に示すように、第4実施例の符号化構造設定手段102は、冗長フィールド検出結果に基づいてフレーム構成情報を出力するフレーム構成設定手段1023を備えた構成である。また、それに伴ってフィールドリピート情報、1stフィールド情報、及びフレームレート情報をそれぞれ出力する。
例えば、図21に示すように、フィールド3、8、13が冗長フィールドであると検出した場合、フィールド1、2、フィールド4、5、フィールド6、7、フィールド9、10でそれぞれフレームを構成して冗長フィールドを取り除き、そのフレーム構成情報を出力する。さらに、それに対応したフィールドリピート情報、1stフィールド位相情報、及びフレームレート情報を出力する。このように、冗長フィールドを検出して取り除くことで効率的な符号化が可能になる。
なお、符号化構造設定手段102は、上記第1実施例〜第4実施例で示した構成のうち、一部の手段によって得られる処理結果だけを出力してもよく、上記第1実施例〜第4実施例で示した構成を任意に組み合わせて得られる処理結果を出力してもよい。
(3)前処理制御手段
(第1実施例)
図22は図1に示した前処理制御手段の第1実施例の構成を示すブロック図である。
図22に示すように、第1実施例の前処理制御手段103は、入力画像の特徴量から前処理フィルタの特性を決定するフィルタ特性制御手段1031を備えた構成である。本実施例で用いる特徴量には、複雑度、アクティビティ、フレーム間予測誤差量、発生符号量、符号化誤差量等がある。
フィルタ特性制御手段1031は、例えば、入力画像の情報量が多い場合に、ローパスフィルタを通して帯域を制限することで符号化時の劣化を軽減する。具体的には、複雑度、アクティビティ、予測誤差量、発生符号量、あるいは符号化誤差量の大きさに比例して強く帯域を制限(より低いカットオフ周波数に設定)するローパスフィルタを用いる。
(第2実施例)
図23は図1に示した前処理制御手段の第2実施例の構成を示すブロック図である。
図23に示すように、第2実施例の前処理制御手段103は、入力画像の特徴量から画像サイズを決定する解像度制御手段1032を備えた構成である。本実施例で用いる特徴量には、複雑度、アクティビティ、予測誤差量、発生符号量、符号化誤差量等がある。
解像度制御手段1032は、例えば、入力画像の情報量が多い場合に、画面に対する表示サイズ(画像サイズ)を小さくして画素数を減らすことで符号化画質の劣化を軽減する。具体的には、複雑度、アクティビティ、予測誤差量、発生符号量、あるいは符号化誤差量の値が大きいほど解像度を下げて画像サイズを小さくし、少ない画素数で符号化する。
なお、前処理制御手段103は、入力画像の特徴量から画像のフレームレートを決定してもよい。この処理で用いる入力画像の特徴量には、複雑度、アクティビティ、予測誤差量、発生符号量、符号化誤差量等がある。
この場合、例えば、入力画像の情報量が多いときに、符号化するフレーム数(画面数)を減らすことで符号化画質の劣化を軽減する。具体的には、複雑度、アクティビティ、予測誤差量、発生符号量、符号化誤差量の値が大きいほどフレームレートを下げ、単位時間当たりの画面数を少なくして符号化する。
以上説明したように、第1の解析情報に対する符号化の前処理として、帯域制限、画像サイズ変換、あるいはフレームレート変換を実施することで、入力画像信号の情報量を低減しつつ符号化による大きな画質劣化を抑制できる。
なお、前処理制御手段103は、上記構成のうち、一部の手段によって得られる処理結果だけを出力してもよく、これらを任意に組み合わせて得られる処理結果を出力してもよい。
(4)第2の事前解析手段
(第1実施例)
図24は図1に示した第2の事前解析手段の第1実施例の構成を示すブロック図である。
第1実施例の第2の事前解析手段106は、前処理された入力画像毎のアクティビティを算出するアクティビティ計算手段と、過去に入力された前処理画像を参照画像として、符号化構造設定手段102で決定された符号化構造に基づき動きベクトル探索を行い、動きベクトルを生成して動き補償フレーム間予測画像を作成し、フレーム間予測誤差を計算するフレーム間予測手段と、アクティビティ及びフレーム間予測誤差から符号化構造設定手段102で決定されたピクチャタイプに応じてそれぞれの画面の複雑度を推定する複雑度推定手段とを有する構成である。
アクティビティ及びフレーム間予測誤差の計算方法、並びに複雑度の推定方法としては、上記第1の事前解析手段101と同様の方法を用いればよい。
(第2実施例)
図25は図1に示した第2の事前解析手段の第2実施例の構成を示すブロック図である。
第2実施例の第2の事前解析手段106は、予め設定された符号化方法及び符号化構造設定手段102で決定した符号化構造にしたがって前処理画像を符号化する符号化手段1064と、画面毎の複雑度を算出する複雑度計算手段1065とを有する構成である。
符号化手段1064は、例えば、固定の量子化幅で符号化して画面毎の発生符号量を計測する。あるいは予め設定されたビットレートで符号化し、量子化幅の画面毎の平均値と画面毎の発生符号量とを計測して出力する。
複雑度計算手段1065は、固定の量子化幅Qあるいは量子化幅の画面毎の平均値Q及び発生符号量Sから画面毎の複雑度Xを次式で計算する。
Figure 0004366571
なお、第2の事前解析手段106は、上記第1実施例及び第2実施例で示した構成のうち、一部の手段によって得られる解析情報だけを出力してもよく、図24、図25に示した構成を任意に組み合わせて得られる解析情報を出力してもよい。
(5)目標符号量設定手段
図26は図1に示した目標符号量設定手段の一構成例を示すブロック図である。
図26に示すように、本実施例の目標符号量設定手段107は、符号量初期配分決定手段1071、バッファ制約調整手段1072、及び制御パラメータ計算手段1073を備えた構成である。本実施例では、第2の事前解析手段106によりLフレーム分の入力画像について解析されているものとする。このとき、符号量初期配分決定手段1071は、期間Lの総符号量を第2の事前解析手段106で算出された複雑度Xにしたがって配分する。
例えば、符号量初期配分決定手段1071により符号量を複雑度Xに比例して配分した場合、第jレームからLフレームまでの期間の目標符号量T[j]は次式のようになる。
Figure 0004366571
ここで、Xaは期間Lの複雑度の総和である。
Figure 0004366571
Raはその期間に割り当て可能な総符号量であり、ビットレートをRとすると、次式で求まる。
Figure 0004366571
あるいは、それまでに実際に発生した符号量と目標符号量との差をDiffとしたとき、その値で補正した次式を用いて算出してもよい。
Figure 0004366571
ここで、g(Diff)は差分から補正量を決めるための関数であり、Diffに正の相関がある関数である。
さらに、期間Lに配分する符号量は、第1の事前解析手段101で算出された複雑度及び第2の事前解析手段106で算出された複雑度に応じて決めてもよい。その場合、図2に示したように、第1の事前解析手段101の解析結果は2Lフレーム先まで利用できる。
いま、フレームjからj+L−1までの期間1とフレームj+Lからj+2L−1までの期間2とで符号化構造の設定及び前処理内容が同じとする。ここで、第1の事前解析手段101で算出された複雑度をX’[i]とすると、
Figure 0004366571
を定義し、
Figure 0004366571
により符号量を配分する。
期間1と期間2の符号化構造の設定、あるいは前処理の処理内容が異なる場合は、その差異による複雑度の変化の補正関数hを予め定めておき、
Figure 0004366571
により符号量の配分を決定する。
以上のように、事前解析結果に基づいて符号量を配分することで、必要な符号量を適切に配分できるようになる。
なお、符号量初期配分決定手段1071は、符号量をX^pに比例して配分してもよい。
すなわち、
Figure 0004366571
とし、Y[i]をX[i]の代わりに用いてもよい。
人間の視覚は、情報量が多いシーンでは劣化が見え難くなる性質を有している。したがって、複雑度Xに単純に比例するのではなく、複雑度Xのp乗(p<1.0)に比例するように符号量を配分する。このように、人の視覚特性を考慮して符号量を配分することで、符号化画質が向上する。
また、符号量初期配分決定手段1071は、事前解析期間をGOP単位とし、各GOPの複雑度の計算結果に基づいてGOP毎の目標符号量を決定し、各GOPにおけるピクチャ毎に配分する符号量を決定してもよい。
例えば、第kのGOPの複雑度をXgop[k]、第kの目標符号量をTgop[k]としたとき、
Figure 0004366571
により目標符号量を決定する。ここで、Xg[k]は、第kのGOPにおける各ピクチャの複雑度の総和である。
または、ピクチャタイプ毎の符号化特性を考慮して、
Figure 0004366571
としてもよい。ここで、K[i]は第iピクチャのピクチャタイプに依存した重みとする。また、Xkg[k]は第kのGOPのピクチャの複雑度とピクチャタイプに依存した重みとの積の総和である。
これにより、GOP単位ではピクチャタイプに依存する差異を考慮せずにシーンの符号化の難易度に応じた配分を行い、GOP内部ではピクチャタイプに応じた配分比率で符号量を割り当てることができるため、シーンの特性及びピクチャタイプの特性に応じた符号量の配分が可能になる。なお、複雑度の代わりに固定の量子化幅で符号化したときに得られる発生符号量を用いてもよい。
バッファ制約調整手段1072は、符号量初期配分決定手段1071により配分された所定期間内の符号量が符号化バッファの制約を満たしているか否かを観測し、満たしていない場合は割り当て符号量を調整する。すなわち、符号化バッファでオーバーフローやアンダーフローが発生しないように目標符号量を調整する。具体的には、初期配分による割り当て符号量から次式によりピクチャ毎のバッファ占有量BOCを算出する。
Figure 0004366571
Rframeは、本実施例の符号化時に使用するビットレートRから算出されるフレームあたりの符号量であり、次式で示される。
Figure 0004366571
ここで、framerate(フレームレート)は単位時間当たりのフレーム数である。また、バッファ占有量の蓄積下限値BOC[0]=0とする。
バッファ制約調整手段1072は、符号化バッファの蓄積上限値をBとしたとき、割り当て期間内において、BOC[j]がB−Rframeより小さいか否かを確認する。この値を越えていれば符号化バッファがオーバーフローを起こす符号量であるため、BOC[j]が最大となる以前のフレームの割り当て符号量を減らしてオーバーフローが起きないようにする。減らした符号量はそれ以降のフレームに加えて再配分する。
また、バッファ制約調整手段は、BOC[j]が0より大きいか否かを確認する。この値を下回っていれば符号化バッファがアンダーフローを起こす符号量であるため、BOC[j]が最小となる以前のフレームの割り当て符号量を増やしてアンダーフローが起きないようにする。増やした符号量はそれ以降のフレームから差し引いて再配分する。
図27はバッファ制約調整手段による符号化バッファのオーバーフロー及びアンダーフローの回避処理を説明するための模式図である。
まず、バッファ制約調整手段は、符号量の初期割り当てによるBOCの推移を計算する。続いて、BOCの最大値及び最小値をそれぞれ計算する。ここで、BOCの最大値+Rframeがバッファサイズを超えている場合はオーバーフローするため、そのときの時間joを求める。また、BOCの最小値が0未満の場合はアンダーフローするため、そのときの時間juを求める。
例えば、図27に示すように、先に時間joでオーバーフローすることが判明した場合、期間jからjoまでの割り当て符号量を時間joでオーバーフローしないように減らす。減らした符号量は期間jo+1からj+L−1に割り当てる。すなわち、バッファサイズを越えないように期間1の総符号量を計算し、その符号量で期間1内に再配分する。期間1で減らした符号量は期間2に割り当て、期間2内で再配分する。
バッファ制約調整手段は、調整後の割り当て符号量により再度BOCの推移を計算し、オーバーフローあるいはアンダーフローの有無を調べる。その結果、先に時間juでアンダーフローすることが判明した場合、時間joまでは調整済みなので、期間jo+1からjuまでの割り当て符号量を時間juでアンダーフローしないように増やす。増やした符号量は期間ju+1からj+L−1で減らす。すなわち、図27に示す期間1の割り当て符号量はそのままで、目標符号量T[j]が0未満にならないように期間3の総符号量を計算し、その符号量で期間3内に再配分する。期間3で増やした符号量は期間4から減らし、期間4内で再配分する。バッファ制約調整手段は、調整後の割り当て符号量により再度BOCの推移を計算し、オーバーフローあるいはアンダーフローの有無を調べる。以降、符号化バッファのオーバーフローあるいはアンダーフローがなくなるまで同様の処理を繰り返す。
なお、符号量の調整時には、符号化バッファの蓄積上限値及び蓄積下限値に任意のマージンを設定してもよい。また、割り当て期間を1フレームずつずらし、1フレーム毎に割り当て符号量を更新する場合は、割り当て期間の最初のフレームの割り当て符号量が決まれば、以降のフレームに対する符号量の調整は省略してもよい。
バッファ制約調整手段の他の例として、BOCの振れ幅のみ制限するように調整する手法もある。すなわち、BOCの最大値及び最小値をそれぞれ測定し、それらの差が指定範囲以内に収まるようにする。そのため、符号量の初期配分にてBOCの最大値と最小値の差を測定し、その差と予め指定した値を比較し、これを越えている場合に、最大値、最小値を含む期間の割り当て符号量が指定範囲内に収まるように増減させ、それ以外の期間の符号量を該増減量にしたがって調整する。
例えば、図27に示すように、符号量が時間joで最大となり、時間juで最小となり、BOC[jo]とBOC[ju]との差が指定範囲を越え、かつ符号量が先に最大となる場合、期間joからjuでは割り当て符号量が多いため、その期間3に割り当てる符号量をBOCの指定範囲内で減らし、調整後の符号量によって期間3に再配分する。期間3において減らした分は、その他の期間である、期間1、期間4を増やし、これらの期間についても調整後の符号量で再配分する。
そして、再度、それぞれの期間のBOCを計算してBOCの最大値、最小値を測定し、その差が指定範囲内であるか否かを調べ、指定の範囲内に収まるまで上記処理を繰り返す。
以上のように、バッファ制約を考慮して符号量を配分することで、バッファ制約条件がある場合にそれを遵守しつつ符号量を割り当てることができる。
制御パラメータ計算手段1073は、バッファ制約調整手段による調整後の割り当て符号量を目標符号量として出力する。また、それから求められる目標BOCを出力する。さらに、目標符号量Tに合わせた量子化幅Qを第2の事前解析手段で求めた複雑度Xを用いて
Q=X/T
で計算し、その計算結果を出力する。これら目標符号量、量子化幅、及び目標BOCを目標符号量制御情報とする。
(6)符号化手段
符号化手段109は、目標符号量設定手段からの目標符号量制御情報に基づき、第2の遅延手段108で遅延された前処理画像を符号化して、符号化データを出力する。
図28は図1に示した符号化手段の一構成例を示すブロック図である。
図28に示すように、符号化手段109は、符号量制御手段1091、動画像符号化手段1092及び符号化バッファ1093を有する構成である。
符号量制御手段1091は、符号化構造設定手段102で決定した符号化構造、目標符号量設定手段107で算出した目標符号量制御情報、及び符号化中の状態に基づいて量子化スケールを計算し、動画像符号化手段1092に供給する。そして、動画像符号化手段1092の符号化処理で実際に発生した符号量(発生符号量)を計測する。発生符号量と割り当てた符号量(目標符号量)とに差がある場合は、所定のビットレートに近づくように発生符号量を制御する。
例えば、1画面をさらに細分化した所定の符号化単位毎に目標符号量を分配し、細分化した符号化単位毎の目標符号量と発生符号量との差を累積し、差の累積が所定値を超過すれば、以降の符号化処理では量子化スケールを大きくして符号の発生を抑制する。逆に差の累積が所定値を下回っていれば、以降の符号化処理では量子化スケールを小さくして符号の発生を多くする。
また、符号化バッファ1093のバッファ占有量を監視し、発生符号量により符号化バッファがオーバーフローあるいはアンダーフローしないように、量子化スケールの調整やスタッフィング等を制御する。例えば、オーバーフローを回避するためには、量子化スケールを大きくして符号の発生を抑制する。あるいは、符号化すべき情報を削減して発生符号量を抑制する。また、アンダーフローを回避するためには、量子化スケールを小さくして符号の発生を多くする。あるいは、スタッフィングを行って発生符号量を増大させる。
動画像符号化手段1092は、符号量制御手段から与えられたパラメータを用いて前処理画像を符号化し、符号化データを生成するとともに、発生符号量を符号量制御手段1091に通知する。
符号化バッファ1093は、動画像符号化手段で符号化されたデータを蓄積し、一定のビットレートで出力する。この符号化バッファ1093により画像毎の発生符号量の変動を吸収する。
[第2の実施の形態]
図29は本発明の動画像符号化装置の第2の実施の形態の構成を示すブロック図である。
第2の実施の形態の動画像符号化装置では、予め入力画像のシーケンス全体が既知であり、フレーム数も有限であり、かつ既知であるとする。このとき、各パスは独立に動作させることができる。
まず、1パス目の動作として、第1の事前解析手段201にて入力画像全体を一度に解析して第1の解析情報を出力し、第1の解析情報を用いて符号化構造設定手段202で符号化構造を設定し、符号化構造情報蓄積手段301に蓄積する。それとともに、第1の解析情報を用いて前処理制御手段203で前処理制御情報を生成し、前処理制御情報蓄積手段302に蓄積する。
次に、2パス目の動作として、前処理制御情報蓄積手段302に蓄積された前処理制御情報にしたがって前処理手段205により入力画像を前処理する。
次に、第2の事前解析手段206により、符号化構造情報蓄積手段301に蓄積された符号化構造にしたがって前処理画像を解析し、第2の解析情報を出力する。
目標符号量設定手段207は、第2の解析情報を用いて目標符号量情報を生成し、符号化制御情報蓄積手段303に蓄積する。
最後に、3パス目の動作として、符号化手段209にて符号化構造情報蓄積手段301に蓄積された符号化構造情報、及び目標符号量情報蓄積手段303に蓄積された目標符号量情報にしたがって前処理手段205にて前処理された画像を符号化し、符号化データを出力する。
第1の事前解析手段201、符号化構造設定手段202、前処理制御手段203、前処理手段205、第2の事前解析手段206、目標符号量設定手段207、及び符号化手段209のその他の処理は第1の実施の形態と同様であるため、その説明は省略する。
第2の実施の形態の動画像符号化装置は、入力画像全体を解析し、入力画像全体に符号量を配分し、そのあと入力画像全体を符号化する、図2に示す事前解析期間Lをシーケンス全体の期間とするものである。この場合、入力画像を3度入力することになり、符号化時間も第1の実施の形態の3倍以上必要になる。また、入力画像全体が既知である必要があるため、リアルタイム処理ができず、非リアルタイム処理向きの構成である。しかしながら、シーケンス全体の特徴量を考慮して符号量を配分できるため、より適切な符号量の割り当てが可能になる。
なお、各パスの切り分け方法は、同等に動作するものであれば本実施形態に限るものではない。例えば、1パス目は第1の事前解析手段で解析情報を生成して蓄積しておき、2パス目で蓄積した事前解析情報を用いて符号化制御情報や前処理情報を作成しながら、前処理及び第2の事前解析手段を実行してもよい。
さらに、一部のパスだけを独立して実行し、他のパスを固定された遅延量で並行して動作させてもよい。例えば、1パス目だけを独立に実行し、第2、第3のパスを固定遅延で並行して動作させてもよく、第1、第2のパスを固定遅延で並行して動作させ、3パス目だけを独立して実行してもよい。
また、上記第1の事前解析手段201、符号化構造設定手段202、前処理制御手段203、前処理手段205、第2の事前解析手段206、目標符号量設定手段207、及び符号化手段209は、例えば、演算機能やメモリ機能を備えたLSI(Large scale Integrated Circuit)によって構成されてもよい。また、符号化構造情報蓄積手段301、前処理制御情報蓄積手段302及び目標符号量情報蓄積手段303は、電気的に書き換え可能な半導体記憶装置等によって構成されてもよい。または、プログラムにしたがって処理を実行するCPU、該CPUの処理に必要なデータを保持する記憶装置、プログラムを保持する記録媒体、入力画像を取り込むための入力装置や符号化後の画像データを出力するための出力装置とのインタフェースであるI/O部、及びネットワークを介してサーバ装置等とのデータ通信を可能にする通信装置等を備えたコンピュータによって構成されてもよい。その場合、CPUは、上記記録媒体からプログラムを主記憶装置にロードし、該プログラムにしたがって処理を実行することで、上記各手段の機能をそれぞれ実現する。
以上、本発明の動画像符号化装置について、MPEG2方式で符号化する場合を想定して説明したが、本発明の動画像符号化装置に適用する符号化方式はこれに限るものではない。例えば、MPEG1、MPEG4、H.261、H.263、H.264等を用いてもよい。
本発明の動画像符号化装置の第1の実施の形態の構成を示すブロック図である。 本発明の動画像符号化装置の第1の実施の形態の動作を説明する模式図である。 第1の実施の形態の動画像符号化装置の処理手順を示すフローチャートである。 図1に示した第1の事前解析手段の第1実施例の構成を示すブロック図である。 図1に示した第1の事前解析手段の第2実施例の構成を示すブロック図である。 図1に示した第1の事前解析手段の第3実施例の構成を示すブロック図である。 1フレームが2つのフィールドから構成された入力画像を示す模式図である。 図6に示す第3実施例の第1の事前解析手段によるシーンチェンジの検出例を示す模式図である。 図6に示す第3実施例の第1の事前解析手段による冗長フィールドの検出例を示す模式図である。 図1に示した符号化構造設定手段の第1実施例の構成を示すブロック図である。 MPEG2で定義されるピクチャタイプの構造例を示す模式図である。 図1に示した符号化構造設定手段の第2実施例の構成を示すブロック図である。 図12に示した第2実施例の符号化構造設定手段の探索範囲の設定例を示す模式図である。 図12に示した第2実施例の符号化構造設定手段の探索範囲の他の設定例を示す模式図である。 図12に示した第2実施例の符号化構造設定手段の探索範囲の他の設定例を示す模式図である。 図12に示した第2実施例の符号化構造設定手段の探索範囲の他の設定例を示す模式図である。 図1に示した符号化構造設定手段の第3実施例の構成を示すブロック図である。 図17に示した第3実施例の符号化構造設定手段によるIピクチャの挿入例を示す模式図である。 図17に示した第3実施例の符号化構造設定手段によるシーンチェンジの検出例を示す模式図である。 図1に示した符号化構造設定手段の第4実施例の構成を示すブロック図である。 図20に示した第4実施例の符号化構造設定手段による冗長フレームの検出例を示す模式図である。 図1に示した前処理制御手段の第1実施例の構成を示すブロック図である。 図1に示した前処理制御手段の第2実施例の構成を示すブロック図である。 図1に示した第2の事前解析手段の第1実施例の構成を示すブロック図である。 図1に示した第2の事前解析手段の第2実施例の構成を示すブロック図である。 図1に示した目標符号量設定手段の一構成例を示すブロック図である。 図26に示すバッファ制約調整手段による符号化バッファのオーバーフロー及びアンダーフローの回避処理を説明するための模式図である。 図1に示した符号化手段の一構成例を示すブロック図である。 本発明の動画像符号化装置の第2の実施の形態の構成を示すブロック図である。 第1従来例の動画像符号化装置の構成を示すブロック図である。 第2従来例の動画像符号化装置の構成を示すブロック図である。
符号の説明
101、201 第1の事前解析手段
102、202 符号化構造設定手段
103、203 前処理制御手段
104 第1の遅延手段
105、205 前処理手段
106、206 第2の事前解析手段
107、207 目標符号量設定手段
108 第2の遅延手段
109、209、1006、1064 符号化手段
301 符号化構造情報蓄積手段
302 前処理制御情報蓄積手段
303 目標符号量情報蓄積手段
1001、1061 アクティビティ計算手段
1002、1062 フレーム間予測手段
1003、1009 フレーム間相関推定手段
1004、1063 複雑度推定手段
1005、1008 動きベクトル統計量計算手段
1007、1065 複雑度計算手段
1010 フレーム間差分計算手段
1011 シーンチェンジ検出手段
1012 冗長フィールド検出手段
1020 M値設定手段
1021 動きパラメータ設定手段
1022 N値及びフレーム・フィールド構造設定手段
1023 フレーム構成設定手段
1031 フィルタ特性計算手段
1032 解像度計算手段
1071 符号量初期配分決定手段
1072 バッファ制約調整手段
1073 制御パラメータ計算手段
1091 符号量制御手段
1092 動画像符号化手段
1093 符号化バッファ

Claims (24)

  1. 動画像である入力画像を符号化するための動画像符号化装置であって、
    複数画像から成る前記入力画像を解析し、所定の符号化単位毎に第1の特徴量を求める第1の事前解析手段と、
    前記第1の特徴量に基づいて前記符号化単位毎の符号化に用いる符号化構造を決定する符号化構造設定手段と、
    前記第1の特徴量に基づいて前記符号化単位毎に施す加工処理である前処理を決定する前処理制御手段と、
    前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延手段と、
    前記第1の遅延手段で遅延された入力画像に前記前処理制御手段で決定した前処理を施す前処理手段と、
    前記符号化構造設定手段で決定した符号化構造に基づいて前記前処理された画像を解析し、前記符号化単位毎に第2の特徴量を求める第2の事前解析手段と、
    前記符号化構造設定手段で決定した符号化構造、前記前処理制御手段で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記符号化単位毎の符号化に用いる目標符号量を決定する目標符号量設定手段と、
    前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延手段と、
    前記符号化構造設定手段で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化手段と、
    を有する動画像符号化装置。
  2. 動画像である入力画像を符号化するための動画像符号化装置であって、
    複数画像から成る前記入力画像を所定の期間毎に解析し、画像毎の第1の特徴量を求める第1の事前解析手段と、
    前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定手段と、
    前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御手段と、
    前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延手段と、
    前記第1の遅延手段で遅延された入力画像に前記前処理制御手段で決定した前処理を施す前処理手段と、
    前記符号化構造設定手段で決定した符号化構造に基づいて前記前処理された画像を前記所定の期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析手段と、
    前記符号化構造設定手段で決定した符号化構造、前記前処理制御手段で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定手段と、
    前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延手段と、
    前記符号化構造設定手段で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化手段と、
    を有する動画像符号化装置。
  3. 動画像である入力画像を符号化するための動画像符号化装置であって、
    複数画像から成る前記入力画像を全ての期間で解析し、画像毎の第1の特徴量を求める第1の事前解析手段と、
    前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定手段と、
    前記符号化構造設定手段で決定した符号化構造を蓄積する符号化構造情報蓄積手段と、
    前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御手段と、
    前記前処理制御手段で決定した前処理を蓄積する前処理制御情報蓄積手段と、
    前記前処理制御手段で決定した前処理を前記画像毎に施す前処理手段と、
    前記符号化構造設定手段で決定した符号化構造に基づいて前記前処理された画像を全ての期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析手段と、
    前記符号化構造設定手段で決定した符号化構造、前記前処理制御手段で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定手段と、
    前記目標符号量設定手段で決定した目標符号量を蓄積する符号化制御情報蓄積手段と、
    前記符号化構造設定手段で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化手段と、
    を有する動画像符号化装置。
  4. 前記目標符号量設定手段は、
    複数画像から成るピクチャ群の目標符号量を決定し、
    該ピクチャ群の目標符号量に応じて前記ピクチャ群内の各画像の目標符号量をそれぞれ決定する請求項1または2記載の動画像符号化装置。
  5. 前記目標符号量設定手段は、
    前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
    前記符号化バッファのオーバーフロー及びアンダーフローを回避するように前記目標符号量を調整する請求項1乃至3のいずれか1項記載の動画像符号化装置。
  6. 前記目標符号量設定手段は、
    前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
    前記バッファ占有量の最大値及び最小値の振れ幅が予め設定された所定の範囲内に収まるように前記目標符号量を調整する請求項1乃至3のいずれか1項記載の動画像符号化装置。
  7. 前記第2の事前解析手段は、
    前処理された入力画像毎のアクティビティを算出するアクティビティ計算手段と、
    過去に入力された前処理画像を参照画像として、前記符号化構造設定手段で決定された符号化構造に基づき動きベクトル探索を行い、動きベクトルを生成して動き補償フレーム間予測画像を作成し、フレーム間予測誤差を計算するフレーム間予測手段と、
    前記アクティビティ及び前記フレーム間予測誤差から前記符号化構造設定手段で決定されたピクチャタイプに応じてそれぞれの画面の複雑度を推定する複雑度推定手段と、
    を有する請求項1乃至3のいずれか1項記載の動画像符号化装置。
  8. 前記第2の事前解析手段は、
    予め設定された符号化方法及び前記符号化構造設定手段で決定した符号化構造にしたがって前処理画像を符号化する第2の符号化手段と、
    固定の量子化幅あるいは量子化幅の画面毎の平均値、及び発生符号量から画面毎の複雑度を算出する複雑度計算手段と、
    を有する請求項1乃至3のいずれか1項記載の動画像符号化装置。
  9. 所定の処理を実行するための処理装置を備え、
    前記処理装置により動画像である入力画像を符号化するための動画像符号化方法であって、
    複数画像から成る前記入力画像を解析し、所定の符号化単位毎に第1の特徴量を求める第1の事前解析工程と、
    前記第1の特徴量に基づいて前記符号化単位毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
    前記第1の特徴量に基づいて前記符号化単位毎に施す加工処理である前処理を決定する前処理制御工程と、
    前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延工程と、
    前記第1の遅延工程で遅延された入力画像に前記前処理制御工程で決定した前処理を施す前処理工程と、
    前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を解析し、前記符号化単位毎に第2の特徴量を求める第2の事前解析工程と、
    前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記符号化単位毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
    前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延工程と、
    前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
    を有する動画像符号化方法。
  10. 所定の処理を実行するための処理装置を備え、
    前記処理装置により動画像である入力画像を符号化するための動画像符号化方法であって、
    複数画像から成る前記入力画像を所定の期間毎に解析し、画像毎の第1の特徴量を求める第1の事前解析工程と、
    前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
    前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御工程と、
    前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延工程と、
    前記第1の遅延工程で遅延された入力画像に前記前処理制御手段で決定した前処理を施す前処理工程と、
    前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を前記所定の期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析工程と、
    前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
    前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延工程と、
    前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
    を有する動画像符号化方法。
  11. 所定の処理を実行するための処理装置と、
    前記処理装置の処理結果を蓄積するための記憶装置と、
    を備え、
    前記処理装置により動画像である入力画像を符号化するための動画像符号化方法であって、
    複数画像から成る前記入力画像を全ての期間で解析し、画像毎の第1の特徴量を求める第1の事前解析工程と、
    前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
    前記符号化構造設定工程で決定した符号化構造を前記記憶装置に蓄積する符号化構造情報蓄積工程と、
    前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御工程と、
    前記前処理制御手段で決定した前処理を前記記憶装置に蓄積する前処理制御情報蓄積工程と、
    前記前処理制御工程で決定した前処理を前記画像毎に施す前処理工程と、
    前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を全ての期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析工程と、
    前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
    前記目標符号量設定工程で決定した目標符号量を蓄積する符号化制御情報蓄積工程と、
    前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
    を有する動画像符号化方法。
  12. 前記目標符号量設定工程は、
    複数画像から成るピクチャ群の目標符号量を決定し、
    該ピクチャ群の目標符号量に応じて前記ピクチャ群内の各画像の目標符号量をそれぞれ決定する請求項または10記載の動画像符号化方法。
  13. 前記目標符号量設定工程は、
    前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
    前記符号化バッファのオーバーフロー及びアンダーフローを回避するように前記目標符号量を調整する請求項乃至11のいずれか1項記載の動画像符号化方法。
  14. 前記目標符号量設定工程は、
    前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
    前記バッファ占有量の最大値及び最小値の振れ幅が予め設定された所定の範囲内に収まるように前記目標符号量を調整する請求項乃至11のいずれか1項記載の動画像符号化方法。
  15. 前記第2の事前解析工程は、
    前処理された入力画像毎のアクティビティを算出するアクティビティ計算工程と、
    過去に入力された前処理画像を参照画像として、前記符号化構造設定工程で決定された符号化構造に基づき動きベクトル探索を行い、動きベクトルを生成して動き補償フレーム間予測画像を作成し、フレーム間予測誤差を計算するフレーム間予測工程と、
    前記アクティビティ及び前記フレーム間予測誤差から前記符号化構造設定工程で決定されたピクチャタイプに応じてそれぞれの画面の複雑度を推定する複雑度推定工程と、
    を有する請求項9乃至11のいずれか1項記載の動画像符号化方法。
  16. 前記第2の事前解析工程は、
    予め設定された符号化方法及び前記符号化構造設定工程で決定した符号化構造にしたがって前処理画像を符号化する第2の符号化工程と、
    固定の量子化幅あるいは量子化幅の画面毎の平均値、及び発生符号量から画面毎の複雑度を算出する複雑度計算工程と、
    を有する請求項9乃至11のいずれか1項記載の動画像符号化方法。
  17. コンピュータに動画像である入力画像を符号化させるためのプログラムであって、
    複数画像から成る前記入力画像を解析し、所定の符号化単位毎に第1の特徴量を求める第1の事前解析工程と、
    前記第1の特徴量に基づいて前記符号化単位毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
    前記第1の特徴量に基づいて前記符号化単位毎に施す加工処理である前処理を決定する前処理制御工程と、
    前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延工程と、
    前記第1の遅延工程で遅延された入力画像に前記前処理制御工程で決定した前処理を施す前処理工程と、
    前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を解析し、前記符号化単位毎に第2の特徴量を求める第2の事前解析工程と、
    前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記符号化単位毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
    前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延工程と、
    前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
    をコンピュータに実行させるためのプログラム。
  18. コンピュータに動画像である入力画像を符号化させるためのプログラムであって、
    複数画像から成る前記入力画像を所定の期間毎に解析し、画像毎の第1の特徴量を求める第1の事前解析工程と、
    前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
    前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御工程と、
    前記入力画像を解析する期間だけ該入力画像を遅延させる第1の遅延工程と、
    前記第1の遅延工程で遅延された入力画像に前記前処理制御手段で決定した前処理を施す前処理工程と、
    前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を前記所定の期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析工程と、
    前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
    前記前処理された画像を解析する期間だけ該前処理された画像を遅延させる第2の遅延工程と、
    前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
    をコンピュータに実行させるためのプログラム。
  19. コンピュータに動画像である入力画像を符号化させるためのプログラムであって、
    複数画像から成る前記入力画像を全ての期間で解析し、画像毎の第1の特徴量を求める第1の事前解析工程と、
    前記第1の特徴量に基づいて前記画像毎の符号化に用いる符号化構造を決定する符号化構造設定工程と、
    前記符号化構造設定工程で決定した符号化構造を記憶装置に蓄積する符号化構造情報蓄積工程と、
    前記第1の特徴量に基づいて前記画像毎に施す加工処理である前処理を決定する前処理制御工程と、
    前記前処理制御手段で決定した前処理を前記記憶装置に蓄積する前処理制御情報蓄積工程と、
    前記前処理制御工程で決定した前処理を前記画像毎に施す前処理工程と、
    前記符号化構造設定工程で決定した符号化構造に基づいて前記前処理された画像を全ての期間で解析し、前記画像毎の第2の特徴量を求める第2の事前解析工程と、
    前記符号化構造設定工程で決定した符号化構造、前記前処理制御工程で決定した前処理、前記第1の特徴量及び前記第2の特徴量に基づいて前記画像毎の符号化に用いる目標符号量を決定する目標符号量設定工程と、
    前記目標符号量設定工程で決定した目標符号量を蓄積する符号化制御情報蓄積工程と、
    前記符号化構造設定工程で決定した符号化構造及び前記目標符号量に基づいて前記前処理された画像を符号化する符号化工程と、
    をコンピュータに実行させるためのプログラム。
  20. 前記目標符号量設定工程として、
    複数画像から成るピクチャ群の目標符号量を決定し、
    該ピクチャ群の目標符号量に応じて前記ピクチャ群内の各画像の目標符号量をそれぞれ決定する処理をコンピュータに実行させるための請求項17または18記載のプログラム。
  21. 前記目標符号量設定工程として、
    前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
    前記符号化バッファのオーバーフロー及びアンダーフローを回避するように前記目標符号量を調整する処理をコンピュータに実行させるための請求項17乃至19のいずれか1項記載のプログラム。
  22. 前記目標符号量設定工程として、
    前記画像毎に割り当てた前記目標符号量に基づいて、符号化後の画像データを一時的に蓄積する符号化バッファのバッファ占有量の推移を計算し、
    前記バッファ占有量の最大値及び最小値の振れ幅が予め設定された所定の範囲内に収まるように前記目標符号量を調整する処理をコンピュータに実行させるための請求項17乃至19のいずれか1項記載のプログラム。
  23. 前記第2の事前解析工程として、
    前処理された入力画像毎のアクティビティを算出し、
    過去に入力された前処理画像を参照画像として、前記符号化構造設定工程で決定された符号化構造に基づき動きベクトル探索を行い、動きベクトルを生成して動き補償フレーム間予測画像を作成し、フレーム間予測誤差を計算し、
    前記アクティビティ及び前記フレーム間予測誤差から前記符号化構造設定工程で決定されたピクチャタイプに応じてそれぞれの画面の複雑度を推定する処理をコンピュータに実行させるための請求項17乃至19のいずれか1項記載のプログラム。
  24. 前記第2の事前解析工程として、
    予め設定された符号化方法及び前記符号化構造設定工程で決定した符号化構造にしたがって前処理画像を符号化し、
    固定の量子化幅あるいは量子化幅の画面毎の平均値、及び発生符号量から画面毎の複雑度を算出する処理をコンピュータに実行させるための請求項17乃至19のいずれか1項記載のプログラム。
JP2003326100A 2003-09-18 2003-09-18 動画像符号化装置及び方法 Expired - Fee Related JP4366571B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003326100A JP4366571B2 (ja) 2003-09-18 2003-09-18 動画像符号化装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003326100A JP4366571B2 (ja) 2003-09-18 2003-09-18 動画像符号化装置及び方法

Publications (2)

Publication Number Publication Date
JP2005094458A JP2005094458A (ja) 2005-04-07
JP4366571B2 true JP4366571B2 (ja) 2009-11-18

Family

ID=34456373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003326100A Expired - Fee Related JP4366571B2 (ja) 2003-09-18 2003-09-18 動画像符号化装置及び方法

Country Status (1)

Country Link
JP (1) JP4366571B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6765964B1 (en) 2000-12-06 2004-07-20 Realnetworks, Inc. System and method for intracoding video data
JP4655791B2 (ja) * 2005-07-08 2011-03-23 ソニー株式会社 符号化装置、符号化方法およびそのプログラム
JP4517963B2 (ja) * 2005-07-15 2010-08-04 ソニー株式会社 符号化装置、符号化方法、プログラムおよび記録媒体
US8797457B2 (en) 2005-09-20 2014-08-05 Entropic Communications, Inc. Apparatus and method for frame rate preserving re-sampling or re-formatting of a video stream
US20080025408A1 (en) * 2006-07-31 2008-01-31 Sam Liu Video encoding
JP2008098980A (ja) * 2006-10-12 2008-04-24 Victor Co Of Japan Ltd 動画像符号化装置
US7656318B2 (en) * 2007-01-29 2010-02-02 Ntt Docomo, Inc. Optimized content-based and royalty-based encoding and distribution of media data
JP4873488B2 (ja) * 2007-07-18 2012-02-08 富士フイルム株式会社 画像処理装置、画像処理方法、およびプログラム
JP4911625B2 (ja) * 2007-11-27 2012-04-04 三洋電機株式会社 画像処理装置、およびそれを搭載した撮像装置
CN101946514B (zh) * 2007-12-20 2014-06-04 高通股份有限公司 使用自适应搜索范围的真实运动矢量估计
JP5256803B2 (ja) * 2008-03-19 2013-08-07 株式会社メガチップス トランスコーダ
JP5039976B2 (ja) * 2008-03-24 2012-10-03 株式会社メガチップス トランスコーダ
JP5163429B2 (ja) * 2008-11-05 2013-03-13 ソニー株式会社 動きベクトル検出装置、その処理方法およびプログラム
US8462852B2 (en) 2009-10-20 2013-06-11 Intel Corporation Methods and apparatus for adaptively choosing a search range for motion estimation
US9654792B2 (en) 2009-07-03 2017-05-16 Intel Corporation Methods and systems for motion vector derivation at a video decoder
US8917769B2 (en) 2009-07-03 2014-12-23 Intel Corporation Methods and systems to estimate motion based on reconstructed reference frames at a video decoder
JP5501107B2 (ja) * 2010-06-14 2014-05-21 三菱電機株式会社 監視システム
EP2656610A4 (en) 2010-12-21 2015-05-20 Intel Corp SYSTEM AND METHOD FOR EXTENDED DMVD PROCESSING
JP5970507B2 (ja) * 2014-08-08 2016-08-17 日本電信電話株式会社 映像符号化装置及び映像符号化プログラム
JP6929044B2 (ja) * 2016-11-14 2021-09-01 キヤノン株式会社 撮像装置、撮像装置の制御方法、及び、プログラム
CN106961603B (zh) * 2017-03-07 2018-06-15 腾讯科技(深圳)有限公司 帧内编码帧码率分配方法和装置

Also Published As

Publication number Publication date
JP2005094458A (ja) 2005-04-07

Similar Documents

Publication Publication Date Title
JP4366571B2 (ja) 動画像符号化装置及び方法
US9866838B2 (en) Apparatus for dual pass rate control video encoding
US20190297347A1 (en) Picture-level rate control for video encoding
JP4203707B2 (ja) 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
US7079581B2 (en) Apparatus and method for controlling variable bit rate in real time
JP3866538B2 (ja) 動画像符号化方法及び装置
US8559501B2 (en) Method and apparatus for adaptively determining a bit budget for encoding video pictures
JP3166716B2 (ja) フェード画像対応動画像符号化装置及び符号化方法
JP4358215B2 (ja) 動画像符号化装置及びその方法
US8179961B2 (en) Method and apparatus for adapting a default encoding of a digital video signal during a scene change period
US20060269156A1 (en) Image processing apparatus and method, recording medium, and program
EP1551186A1 (en) Video coding apparatus with resolution converter
US8891892B2 (en) Image encoding method using adaptive preprocessing scheme
JP3907875B2 (ja) 符号化レート制御装置及び情報符号化装置
EP1978745A2 (en) Statistical adaptive video rate control
EP0949822A2 (en) Video coding control method and apparatus
US8792562B2 (en) Moving image encoding apparatus and method for controlling the same
JP4179917B2 (ja) 動画像符号化装置及び方法
US20220264111A1 (en) Video coding efficiency improvement using dynamic frame boost scaling
JPH08102946A (ja) 画像符号化装置

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050124

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050124

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060202

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090729

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090811

R150 Certificate of patent or registration of utility model

Ref document number: 4366571

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120904

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130904

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees