JP2004023670A - 画像符号化装置および同方式 - Google Patents
画像符号化装置および同方式 Download PDFInfo
- Publication number
- JP2004023670A JP2004023670A JP2002179037A JP2002179037A JP2004023670A JP 2004023670 A JP2004023670 A JP 2004023670A JP 2002179037 A JP2002179037 A JP 2002179037A JP 2002179037 A JP2002179037 A JP 2002179037A JP 2004023670 A JP2004023670 A JP 2004023670A
- Authority
- JP
- Japan
- Prior art keywords
- image
- resolution
- frame frequency
- input image
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】入力画像制御回路1が入力画像の画像構成の特性を判定し、この判定に基き画像解像度変更回路2が入力画像を所定の入力解像度となるようフィルタ処理を行う。フレーム周波数変更回路3が指定されたフレーム周波数となるよう、入力画像のフレーム数を削減する。MPEG符号化回路4は、符号化制御回路5の制御によりMPEG2ストリーム106に変換する。入力画像の画像構成の特性に合わせ適応的に解像度を変更することにより低ビットレート化する。入力画像の特性に合わせて、画像の解像度、フレーム周波数を可変とし、単位時間当たりの入力画像情報を削減する。このことにより、低レートで削減しにくいヘッダ情報や動ベクトル情報を削減し、より多くの情報をDCT係数値に与える良好な再生画像品質を得る。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、画像符号化装置および同方式に関し、特に、低ビットレートの画像符号化装置および同方式に関する。
【0002】
本発明は、MPEG2(“Generic coding of Moving Pictures and associated audio information”, ISO/IEC 13818)符号化方式を用いた画像符号化装置に関し、特に、固定符号化レートで符号化を行う際に入力画像の特性に合わせて画像解像度やフレーム周波数を可変とする、符号化制御技術に関する。
【0003】
【従来の技術】
従来、画像符号化装置および同方式は、たとえば、MPEG2方式を用いて構成される。近年、本構成に適用され画像圧縮方式として普及してきたMPEG2方式は、圧縮効率が高く画質が良いことから、ディジタル放送や家庭用光ディスクレコーダの映像符号化フォーマットとして利用されている。例えば、BSディジタル放送の場合、1080i/29.97と呼ぶ1920画素×1080ライン、4:2:0クロマフォーマット、29.97Hzの画像が使用される。1080i/29.97信号の情報量は、994Mbps=1920画素×1080ライン×29.97Hz×8bit/pel ×2(4:2:0クロマフォーマットの場合)であるが、MPEG2を用いて22Mbps程度まで圧縮しており、圧縮比は約1/45となる。
【0004】
家庭用光ディスクレコーダでは、480i/29.97と呼ぶ720画素×480ライン、4:2:0クロマフォーマット、29.97Hzの画像が使用され、164Mbps(720×480×29.97×8×2)の情報量を持つ。480i/29.97は4.7GByte/2時間で記録する場合、音声の256Kbpsを除くと5Mbpsとなるため、圧縮比は1/33となる。
【0005】
このとき、1画素当たりの情報量は、BSディジタル放送で0.35bit/画素、光ディスクレコーダで0.48bit/画素となり、入力画像の複雑度によっては高品位な再生画像を得ることが難しい。
【0006】
従来技術での入力解像度可変の例として、光ディスクレコーダがあげられる。この光ディスクレコーダでは、5Mbpsの通常モードの他に、2Mbps程度で符号化する長時間モードを持つが、720画素×480ラインの入力画像をそのまま符号化すると、1画素当たりの情報量は0.19bit/画素となり、画質劣化が知覚されやすい。このことから、入力解像度を352画素×480ラインや、352画素×240ラインの低解像度で符号化し、低符号化レートの時に現れる符号化ノイズを抑える方法が用いられる。しかし、入力解像度の変更手段は符号化レートにより予め定められていたり、符号化の結果発生する符号量が目標を上回った場合、入力解像度を小さくするなど簡易的なもので、入力画像の特性に合わせて変更するものではない。
【0007】
従来技術を用いたフレーム周波数可変の例として、テレシネ変換がある。これは、24Hzのフレーム周波数をもつ映画素材を、29.97Hzのシステムで再生したものを再度符号化する場合に用いられる。テレシネ変換では、24Hz素材を29.97Hzに変換する際に挿入されたリピートフィールドを検出し、再符号化時に削除することで冗長なフィールドを取り除くものである。また、符号化パラメータを利用したトランスコーダでは、MPEG2ピクチャヘッダ内のrepeat_first_field信号を用いてフィールド間引きを行い、従来技術を用いた装置では前フィールドとのフィールド差分値を求め、差分値があらかじめ定められた閾値の場合には削除するものであり、元々29.97Hzのフレーム周波数を持つ入力画像のフレーム周波数を変更する方式とは異なる。
【0008】
また、従来技術を用いたフレーム周波数可変の例として、ITU−R H.262規格に代表されるTV会議用符号化方式が上げられる。この方式は、予めフレーム周波数が低く設定されているためフレーム落としを行うが、符号化ビットレートが目標値をオーバーする場合も同様にフレームを落とすことで、符号化制御を行うフィードバック方式が一般的である。
【0009】
本発明と技術分野の類似する先願発明例1として、特開2001−245303号公報の「動画像符号化装置および動画像符号化方法」がある。本先願発明例1では、符号化する動画像のシーンに応じて符号化パラメタを設定し,シーン内容に適した効率的な符号配分を行い、視覚的にまとまりある見やすい画像を生成する、ことを課題としている。
【0010】
先願発明例2としての特開平5−111015号公報の「動き適応画像符号化装置」では、精細度が高いブロックに対しては粗く量子化し、精細度が低いブロックには細かく量子化して、ブロック歪が視覚的に目立たなく、良好な画質を得ることができる動き適応画像符号化装置を提供することを目的としている。
【0011】
【発明が解決しようとする課題】
しかしながら、上記の従来技術では、1080i/29.97信号を12Mbps程度の高い圧縮率で圧縮する場合には、1画素当たりの割り当て情報量は、0.19bit/画素、圧縮比は1/103となる。MPEG2符号化方式特有のヘッダ情報や動ベクトル情報の符号量は、入力解像度によって依存する。このため、入力素材を異なる符号化レートで符号化する場合であっても、一定量のオーバーヘッドが必要となる。
【0012】
良好な再生画像品質を得るためには、DCT変換係数値の割合を増やすことが重要である。符号化レートが22Mbpsの場合には、ヘッダ、動ベクトル情報を8Mbpsと仮定すると14MbpsがDCT変換係数値の符号化に割り当てることができる。しかし、12Mbpsの場合には、4MbpsしかDCT変換係数値に割り当てることが出来ない。このため、良好な再生画像品質を得ることは難しい。
【0013】
DVD等の蓄積系不謳歌システムでは、一般に、符号化ビットレートが可変符号化ビットレート(VBR:Variable bit Rate )が利用される。このVBRでは、入力の画像特性に合わせて符号化ビットレートを増減することが可能である。このため、再生画像品質を向上させることが容易である。しかし、放送では、伝送路帯域が一定であるため、固定符号化ビットレート(CBR:Constant BitRate )が一般的に利用される。このため、情報量の多い入力画像であっても符号化ビットレートを増やすことは出来ず、再生画像品質が劣化する。
【0014】
一般に、人間の視覚特性は静止画のとき解像度に敏感であるが、動画のときは解像度に鈍感となることが知られている。本発明は、この視覚特性を利用して静止画のとき解像度感の高い再生画像を、動画のとき動きの滑らかな再生画像を提供することで、低ビットレート時の再生画像品質を改善することを図る。
【0015】
従来技術を用いたフレームレートを動的に変更する例としての特開2001−245303号公報では、オブジェクトの動きの速いシーンでフレームレートを上げて動きが不自然になるのを避ける例が示されている。この方式は、可変ビットレート(VBR)が使用できる蓄積系の符号化システムでは画質改善を図る点で有効である。しかし、本従来例の符号化装置は、符号化ビットレートが一定であることを想定しているため、動きの速い画像でも画質改善のためフレームレートを上げることはできない。
【0016】
本発明は、低ビットレートでありながら再生画像品質を向上させた画像符号化装置および同方式を提供することを目的とする。
【0017】
より詳細には、低ビットレートでの符号化時に、入力画像の特性に合わせて、画像の解像度、フレーム周波数を可変とし、単位時間当たりの入力画像情報を削減する。このことにより、低レートで削減しにくいヘッダ情報や動ベクトル情報を削減し、より多くの情報をDCT係数値に与える良好な再生画像品質を得る画像符号化装置を提供することを目的とする。
【0018】
【課題を解決するための手段】
かかる目的を達成するため、請求項1記載の発明の画像符号化装置は、入力画像の画像構成の特性を判定する入力画像制御回路と、判定に基き入力画像を所定の入力解像度となるようフィルタ処理を行い解像度変更された画像信号を出力する画像解像度変更回路と、解像度変更された画像信号に対し指定されたフレーム周波数となるよう入力画像のフレーム数を削減し、該フレーム数の削減処理によりフレーム周波数変換された画像信号を出力するフレーム周波数変更回路と、フレーム周波数変換された画像信号を用いて符号化する符号化回路とを有して構成され、入力画像の画像構成の特性に合わせ適応的に解像度を変更することにより低ビットレート化を可能としたことを特徴としている。
【0019】
上記入力画像の画像構成の特性とは、入力画像の静止画度、複雑さ、解像度、フレーム周波数の少なくともいずれか1つを含む特性であり、該特性を適応的に判定してフィルタ処理を行い、符号化回路は、MPEG2ストリームに変換するMPEG符号化回路であり、入力画像制御回路は、MPEG2符号化回路から得られる符号化統計情報と、フレーム周波数変更回路から得られる前フィールドとの差分値とにより判定をして、入力画像の解像度やフレーム周波数を決定するとよい。
【0020】
また、請求項5記載の発明では、請求項1から4のいずれか1項に記載の画像解像度変更回路において、遅延した入力画像の水平画素数を変更するための水平フィルタと、垂直ライン数を変更するための垂直フィルタとで構成され、所定の入力解像度となるようフィルタ係数を決定してフィルタ処理を行い、解像度変更された画像信号をフレーム周波数変更回路に出力することを特徴とする。
【0021】
請求項6記載の発明では、請求項1から5のいずれか1項に記載の発明の画像解像度変更回路は、前フィールドとのフィールド差分値、フレーム/フィールドDCTのピクチャ内マクロブロック数、ならびに動ベクトル情報のうちの一つあるいは複数の情報を用いて入力画像の解像度を変更することを特徴とする。
【0022】
請求項7記載の発明では、請求項1から5のいずれか1項に記載の発明のフレーム周波数変更回路は、1GOP前のIピクチャ、Pピクチャ、Bピクチャのピクチャ種別毎の平均符号化ビット数比率を用いて入力画像のフレーム周波数を変更し、また、請求項8記載の発明では、内容が“0”でない動ベクトルマクロブロックの数、および動ベクトル情報のいずれか一つあるいは両方を用いて入力画像の持つフレーム周波数を変更することを特徴とする。
【0023】
請求項9記載の発明の画像符号化方式は、入力画像制御回路により入力画像の画像構成の特性を判定し、画像解像度変更回路が判定に基き入力画像を所定の入力解像度となるようフィルタ処理を行い解像度変更された画像信号を出力し、解像度変更された画像信号に対し指定されたフレーム周波数となるようフレーム周波数変更回路が入力画像のフレーム数を削減し、該フレーム数の削減処理によりフレーム周波数変換された画像信号を出力し、符号化回路がフレーム周波数変換された画像信号を用いて符号化し、入力画像の画像構成の特性に合わせ適応的に解像度を変更することにより低ビットレート化を可能としたことを特徴としている。
【0024】
上記入力画像の画像構成の特性とは、入力画像の静止画度、複雑さ、解像度、フレーム周波数の少なくともいずれか1つを含む特性であり、該特性を適応的に判定してフィルタ処理を行い、符号化回路は、MPEG2ストリームに変換し、MPEG2符号化回路から得られる符号化統計情報と、フレーム周波数変更回路から得られる前フィールドとの差分値とにより判定をして、入力画像制御回路が入力画像の解像度やフレーム周波数を決定するとよい。
【0025】
また、請求項13記載の発明では、請求項9から12のいずれか1項に記載の画像符号化方式において、遅延した入力画像の水平画素数を変更するための水平フィルタと、垂直ライン数を変更するための垂直フィルタとで、画像解像度変更回路が、所定の入力解像度となるようフィルタ係数を決定してフィルタ処理を行い、解像度変更された画像信号をフレーム周波数変更回路に出力することを特徴とする。
【0026】
請求項14記載の発明では、請求項9から13のいずれか1項に記載の画像符号化方式は、前フィールドとのフィールド差分値、フレーム/フィールドDCTのピクチャ内マクロブロック数、ならびに動ベクトル情報のうちの一つあるいは複数の情報を用いて、画像解像度変更回路が入力画像の解像度を変更することを特徴とする。
【0027】
請求項15記載の発明では、請求項9から13のいずれか1項に記載の画像符号化方式は、1GOP前のIピクチャ、Pピクチャ、Bピクチャのピクチャ種別毎の平均符号化ビット数比率を用いて、フレーム周波数変更回路が入力画像のフレーム周波数を変更することを特徴とする。
【0028】
請求項16記載の発明では、請求項9から13のいずれか1項に記載の画像符号化方式は、内容が“0”でない動ベクトルマクロブロックの数、および動ベクトル情報のいずれか一つあるいは両方を用いて、フレーム周波数変更回路が入力画像の持つフレーム周波数を変更することを特徴とする。
【0029】
【発明の実施の形態】
次に、添付図面を参照して本発明による画像符号化装置および同方式の実施の形態を詳細に説明する。図1から図6を参照すると、本発明の画像符号化装置および同方式の一実施形態が示されている。なお、図中で同じ機能を有する回路には同じ番号を付している。
【0030】
図1は、低レート符号化画像符号化装置の全体ブロック図を示したもので、入力画像制御回路1、画像解像度変更回路2、フレーム周波数変更回路3、MPEG符号化回路4、符号化制御回路5、フィールド差分値算出回路6で構成される。
【0031】
フィールド差分値算出回路6は、入力画像信号100と1フレーム前に入力された同じフィールドとの差分値を求め、フィールド差分値情報110を入力画像制御回路1に、遅延した入力画像信号111を画像解像度変更回路2に出力する。このフィールド差分値算出回路6は、通常、テレシネ変換検出あるいはシーンチェンジ検出用にMPEG符号化回路4内の入力画像を処理するインタフェース部に実装される。しかし、本発明では、MPEG符号化回路4の前段に解像度変換やフレーム周波数変換を行うため、低ビットレート符号化装置の入力部分に実装される。
【0032】
画像解像度変更回路2は、遅延した入力画像信号111の水平画素数を変更するための水平フィルタと、垂直ライン数を変更するための垂直フィルタで構成され、解像度指定信号101により所定の入力解像度となるようフィルタ係数を決定し、フィルタ処理を行い解像度変更された画像信号102をフレーム周波数変更回路3に出力する。
【0033】
フレーム周波数変更回路3は、解像度変更された画像信号102に対し単位時間当たりの画像枚数を変更するためのフレームメモリと内挿フィルタで構成され、フレーム周波数指定信号103により指示されたフレーム周波数となるよう入力画像のフレーム数を削減し、フレーム周波数変換された画像信号104としてMPEG符号化回路4に出力する。
【0034】
MPEG符号化回路4は、フレーム周波数変換された画像信号104を用いて符号化制御回路5の制御によりMPEG2ストリーム106に変換する。このとき、MB(Macro Block:マクロブロック)符号化統計情報107を符号化制御回路5に出力する。
【0035】
MB符号化統計情報107は、各MBのマクロブロックタイプ(macroblock_type)、動ベクトルタイプ(macroblock_motion_forward, macroblock_motion_backward等)、動ベクトルデータ(ISO/IEC 13818−2 Table.6.2.5.2)、DCTタイプ(dct_type)、量子化ステップ値(quantiser_scale_code)、アクティビティ値(DCT変換係数値のAC成分和あるいは自乗和)、発生符号化ビット数などで構成される。
【0036】
符号化制御回路5は、入力画像制御回路1より入力解像度情報やフレーム周波数情報で構成される入力画像制御信号108を受け取り、MPEG符号化回路4の符号化制御を行うよう符号化制御信号105を出力する。また、MPEG符号化回路4より出力されるMB符号化統計情報107を、ピクチャ単位での指標となるよう演算を行い、平均値や分散値で構成される符号化統計情報109として入力画像制御回路1に出力する。
【0037】
MPEG符号化回路4、符号化制御回路5は従来実施例の符号化装置と異なることはないが、ピクチャ単位での符号化統計情報109を入力画像制御回路1に出力することと、GOP(Group Of Picture)単位で入力画像解像度とフレーム周波数の変更を、回路を停止することなく変更することが異なる。
【0038】
MPEG2方式では、一般に次の用語が使用される。
Iピクチャは、動き補償を含まず、符号化対象画面のみで符号化されるフレーム内符号化画面を表す。Pピクチャは、時間的に過去のIまたはPピクチャからの前方向予測を用いて構成されたフレーム間符号化画面を表す。Bピクチャは時間的に前後にあるIまたはPピクチャから両方向予測を用いて構成されたフレーム間符号化画面を表す。
【0039】
GOP(Group Of Picture)は、ランダムアクセスを可能とするため、1つのIピクチャと複数枚のPピクチャ、あるいはBピクチャで構成された画面群構造を表す。GOP内のフレーム数を表す変数として“N”、GOP内のIピクチャまたはPピクチャの出現間隔を表す変数として“M”が使用され、民生機器などでは圧縮効率とエラー耐性、特殊再生対応等の観点からN=15、M=3という値が一般的に用いられる。
【0040】
オープンGOPは、前GOP最後のPピクチャを用いて、GOP内のIピクチャより前のBピクチャの動き補償を行う。オープンGOPは、複数のGOPに渡って動き補償を行うため、圧縮効率は良いがエラー耐性はクローズドGOPより悪い。クローズドGOPは、Iピクチャより前のBピクチャは同一GOP内のIピクチャのみを用いて動き補償を行う。このため、エラーが発生しても同一GOP内で閉じている。
【0041】
TP値(temporal_reference値)は、入力画像の入力順序を表す値であり、通常1フレーム毎に連続した値が付加される。repeat_first_field情報は、現在の画像フィールドを再生時にリピートすることであり、MPEG2ストリーム上は存在しない画像データを再生することができる。
【0042】
画像解像度変更回路2の実施例について、図2を用いて説明する。水平フィルタ回路21で、水平フィルタ係数122を用いて水平方向の画素数変換を行い、水平画素数変換された画像信号123を垂直フィルタ回路22に出力する。垂直フィルタ回路22は、水平画素数変換された画像信号123と垂直フィルタ係数124を用いてライン数変換を行い、解像度変更された画像信号102をフレーム周波数変更回路3に出力する。フィルタ制御回路23は、入力画像制御回路1から解像度指定信号を受け取り、対応する水平フィルタ係数、垂直フィルタ係数をピクチャ単位で水平フィルタ回路21、垂直フィルタ回路22に出力する。
【0043】
1080/29.97iの場合、フィールド差分値情報を用いて3種類の解像度変更制御を行う例について説明する。入力画像制御回路1は、入力画像がインターレース信号の場合、フィールド差分値が大きいとき動画、小さいときは静止画であると判断し、2種類の閾値F1、F2(0<F1<F2)を用いて3種類の解像度指定信号102を画像解像度変更回路2に出力する。例として、フィールド差分値が閾値F1以下のとき静止画として1920画素×1080ライン、F1より大きくF2以下の場合1440画素×1080ライン、F2より大きい場合1440画素×512ラインがある。解像度指定信号が入力画像のもつ解像度と差異が無いとき、水平フィルタ回路21、垂直フィルタ22は、フィルタ処理を行わず入力データをスルーして後段の回路に出力する。これは、入力画像の水平解像度が1920画素で、解像度指定信号101も1920画素の場合、水平フィルタ回路21はスルーすることを意味する。
【0044】
動画像では同じシーンが数十フレーム連続することが多いため、解像度変更を決定する変数として、フィールド差分値情報111以外にMPEG符号化回路4から得られるフレーム/フィールドDCTのピクチャ内MB数や、動ベクトル情報を利用することができる。これらは、動きの大きな動画部分ではフィールドDCTが選択されやすい特性や、動ベクトル情報ではベクトル距離が大きく、かつ、フィールドベクトルが選択されやすくなる特性を利用したものである。この結果、フィールド差分値情報のみを用いて解像度変換を行うより、入力画像の特性を正確に把握することができる。
【0045】
次に、フレーム周波数変更回路3の実施例について説明する。入力画像制御回路1は、符号化制御回路5から得られる符号化統計情報109から、GOP単位でIピクチャ、Pピクチャ、Bピクチャの各ピクチャタイプの符号化ビット数の比率を求める。N=15、M=3と仮定すると静止画の場合、Pピクチャは、3フレーム前のピクチャと動き補償を行っても動ベクトルが小さい値となることから、動ベクトルの符号化ビット数が少なくなる。また、予測誤差も小さくなるため、Pピクチャの符号化ビット数は、Iピクチャに比べて小さくなる。同様に、Bピクチャの符号化ビット数は、動き補償を行うフレーム間距離がIあるいはPピクチャより短いため、Pピクチャより符号化ビット数が少なくなる。
【0046】
図3は、各ピクチャの平均符号化ビット数を用いて入力画像のフレーム周波数を、29.97Hzと24Hzに変更する制御例のフローチャートを示したものである。Iaveは、1GOP前のIピクチャの符号化ビット数、Paveは、1GOP前のPピクチャの平均符号化ビット数(N=15、M=3のとき、GOP内のPピクチャの枚数は4枚なので、GOP内Pピクチャ全ての符号化ビット数をPsumとすると、Psum/4で与えられる)、Baveは1GOP前のBピクチャの平均符号化ビット数(N=15、M=3のときGOP内のBピクチャ全体の符号化ビット数をBsumとしてBsum/10で与えられる)を表し、RTH1はIPピクチャの比率の閾値を、RTH2はIBピクチャの比率の閾値を、それぞれ表す。
【0047】
例えば、RTH1=0.6、RTH2=0.3とすると、Iピクチャの符号化ビット数に対し、Pピクチャの割合が60%以下、かつ、Bピクチャの割合が30%以下のときフレーム周波数を24Hz、それ以外のとき29.97Hzとなるようフレーム周波数指定信号103をフレーム周波数変更回路3に出力する。
【0048】
次に、フレーム周波数変更回路3の実施例について説明する。入力画像制御回路1は、符号化制御回路5から得られる符号化統計情報109から、動ベクトル距離の平均値、最大値、分散値を用いてフレーム周波数の変更を行うフレーム周波数指定信号103をフレーム周波数変更回路3に出力する。これは、静止画の場合、動ベクトル距離の平均値は“0”に近くなる特性を利用したものである。また、最大値は画面内に一部の物体が大きく動いている場合の検出を行うもので、分散値も最大値同様、画面内のベクトル分布が一定でない場合は、静止画として処理を行うと動いている物体がギクシャクした動きとなるため、動画部分の判定に用いる。
【0049】
図4は、動ベクトルの平均値Vave(動ベクトル値が(x,y)成分の長さで与えられるとき√(x^2+y ^2))、なお本符号は(xの2乗+yの2乗)の平方根を表す)、最大値Vmax、分散値Vvarを用いて入力画像のフレーム周波数を29.97Hzと24Hzに変更する制御例のフローチャートを示したものである。VTH1は動ベクトル平均値、VTH2は動ベクトル最大値、VTH3は動ベクトル分散値の閾値をそれぞれ表す。
【0050】
例えば、VTH1=4、VTH2=32、VTH3=16とすると、動ベクトル平均が4以下かつ、最大値が32以下かつ、分散値が16以下のとき24Hz、それ以外のとき29.97Hzのフレーム周波数となるようフレーム周波数指定信号103を出力することを意味する。
【0051】
また、別の制御例としてピクチャ内の非0ベクトルのMB数を利用することができる。非0のベクトルのとき符号化処理ではベクトル情報を削減できるため、非0MB数閾値NZTH以下の場合、静止画として24Hzで処理し、それ以外のとき29.9Hzで処理を行う。
上に述べた二つの制御例を組み合わせることで、それぞれ単独で制御するより高精度に制御を行うことも可能である。
【0052】
次に、画像解像度変更回路2とフレーム周波数変更回路3の実施例について説明する。
図5は、画面の複雑さを表すDCT係数値のアクティビティ平均値ACTと静止画/動画の判定に動ベクトル平均値Vave を用いて、入力画像の水平解像度を1920画素と1440画素、フレーム周波数を29.97Hzと24Hzに変更する制御例のフローチャートを示したものである。VTH4は動ベクトル平均値の、ATH1はアクティビティ平均値の閾値を、それぞれ表す。
【0053】
例えば、VTH4=16、ATH1=256とすると、Vaveが16以下かつACTが256以下のとき1920画素×1080ライン、24Hz、Vaveが16以下かつACTが256より大きい場合、1440画素×1080ライン、24Hzとし、それ以外の時1440画素×1080ライン、29.97Hzとなるよう解像度指定信号101、フレーム周波数指定信号103を出力する。
【0054】
図6は、図5のフローチャートの解像度、フレーム周波数の領域を表す図である。符号化レートを12Mbpsと仮定して動作について説明する。
動ベクトル平均値が閾値VTH4以下かつアクティビティ値が閾値ATH1以下のとき領域1(1920画素×1080ライン、24Hz)とする。領域1は画面が静止画に近く平坦な部分が多いとき選択される。領域1が選択される場合、フレームレートを24Hzに下げることにより29.97Hzの時よりフレーム間の時間相関が低くなり、動ベクトル距離はより大きな値となる。しかし、単位時間当たりの入力画像情報を削減することで、画素当たりの割当bit数を、0.19bit/画素〜0.24bit/画素に増やすことが出来、再生画像品質を向上させる。
【0055】
動ベクトル平均値が閾値VTH4以下かつアクティビティ平均値が閾値ATH1より大きいとき領域2(1440画素×1080ライン、24Hz)とする。領域2は画面が静止画に近いが複雑な画像のとき選択される。領域2が選択される場合、24Hzとしても領域1同様29.97Hz時の動ベクトル平均値が小さいため、時間相関の低下を考慮しても長い動ベクトル平均値が出現しない。このため、符号化効率の低下とならない。画面解像度については、複雑度が大きい画像であるためDCT係数値の広域成分に多くの有為係数値が発生する。このため、各DCTブロックに割り当てる符号量を増やすことでブロック雑音を防ぐことができる。このとき、画素当たりの割当bit数は0.32bit/画素となる。
【0056】
動ベクトル平均値が閾値VTH4より大きいとき、領域3(1440画素×1080ライン、29.97Hz)とする。領域3は、動画部と判断される画像のとき選択される。動画は、全体の符号化レートに占める動ベクトル情報の割合が多いため、画面解像度を1440画素×1080ラインとすることで画面内の動ベクトル数を削減し、より多くの情報量をDCT係数値に割り当て再生画像品質を向上させる。このとき、画素当たりの割当bit数は0.26bit/画素となる。
【0057】
上に説明したように、入力画像の特性に合わせて解像度可変、フレーム周波数可変とすることで、1920画素×1080ライン、29.97Hzの固定値で符号化した場合、0.19bit/画素の割当bit数がそれぞれ0.24、0.32、0.26と大幅に増える。このため、ノイズを削減することにより再生画像品質を向上することができる。
【0058】
本提案の符号化装置は、符号化ビットレートが一定であることを想定している。これに対し、上記従来技術を用いたフレームレートを動的に変更する例としての先願発明例1の特開2001−245303号公報では、オブジェクトの動きの速いシーンでフレームレートを上げて動きが不自然になるのを避ける例が示されている。この方式は、可変ビットレート(VBR)が使用できる蓄積系の符号化システムでは、画質改善を図る点で有効である。しかし、符号化ビットレートが一定である場合には、動きの速い画像では画質改善のためフレームレートを上げることはできない。
【0059】
本提案の画像符号化装置では、人間の視覚特性は動きの速い領域では、動的視力が落ちることを利用して、画面内の解像度を低解像度とすることで、一定符号化レートであっても従来技術を用いた画像符号化装置より優れた再生画像品質を得ることが可能である。
【0060】
以上、本発明の実施例について回路を用いて構成する例について述べたが、予め記憶された画像データに対し、ソフトウェアを用いて圧縮する場合であっても、本実施例で説明した回路と同じ機能を有するソフトウェアで処理を行っても本実施例の効果は変わらない。
【0061】
なお、上述の実施形態は本発明の好適な実施の一例である。ただし、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施が可能である。
【0062】
【発明の効果】
以上の説明より明らかなように、本発明の画像符号化装置および同方式は、入力画像の画像構成の特性を判定し、この判定に基き入力画像を所定の入力解像度となるようフィルタ処理を行い、解像度変更された画像信号に対し指定されたフレーム周波数となるよう入力画像のフレーム数を削減し、フレーム周波数変換された画像信号を用いて符号化する。これにより、入力画像の画像構成の特性に合わせ適応的に解像度を変更することにより低ビットレート化を可能とする。本発明を用いることで、従来再生画像品質の劣化が顕著であった低ビットレートでの再生画像品質を向上することが出来るという優れた効果がある。
【図面の簡単な説明】
【図1】本発明の画像符号化装置および同方式の実施形態を示す全体ブロック図である。
【図2】画像解像度変更回路を示すブロック図である。
【図3】フレーム周波数変更制御例を示すフローチャート図(1)である。
【図4】フレーム周波数変更制御例を示すフローチャート図(2)である。
【図5】解像度変更、フレーム周波数変更制御例を示すフローチャート図である。
【図6】解像度変更、フレーム周波数変更制御例を示す領域図である。
【符号の説明】
1 入力画像制御回路
2 画像解像度変更回路
3 フレーム周波数変更回路
4 MPEG符号化回路
5 符号化制御回路
6 フィールド差分値算出回路
21 水平フィルタ回路
22 垂直フィルタ回路
23 フィルタ制御回路
100 入力画像信号
101 解像度指定信号
102 解像度変更された画像信号
103 フレーム周波数指定信号
104 フレーム周波数変換された画像信号
105 符号化制御信号
106 MPEGストリーム
107 MB符号化統計情報
108 入力画像制御信号
109 符号化統計情報
110 フィールド差分値情報
111 遅延した入力画像信号
122 水平フィルタ係数
123 水平画素数変換された画像信号
124 垂直フィルタ係数
Claims (16)
- 入力画像の画像構成の特性を判定する入力画像制御回路と、
前記判定に基き前記入力画像を所定の入力解像度となるようフィルタ処理を行い解像度変更された画像信号を出力する画像解像度変更回路と、
前記解像度変更された画像信号に対し指定されたフレーム周波数となるよう前記入力画像のフレーム数を削減し、該フレーム数の削減処理によりフレーム周波数変換された画像信号を出力するフレーム周波数変更回路と、
前記フレーム周波数変換された画像信号を用いて符号化する符号化回路とを有して構成され、
前記入力画像の画像構成の特性に合わせ適応的に解像度を変更することにより低ビットレート化を可能としたことを特徴とする画像符号化装置。 - 前記入力画像の画像構成の特性とは、該入力画像の静止画度、複雑さ、解像度、フレーム周波数の少なくともいずれか1つを含む特性であり、該特性を適応的に判定して前記フィルタ処理を行うことを特徴とする請求項1記載の画像符号化装置。
- 前記符号化回路は、MPEG2ストリームに変換するMPEG符号化回路であることを特徴とする請求項1または2記載の画像符号化装置。
- 前記入力画像制御回路は、前記MPEG2符号化回路から得られる符号化統計情報と、前記フレーム周波数変更回路から得られる前フィールドとの差分値とにより前記判定をして、前記入力画像の解像度やフレーム周波数を決定することを特徴とする請求項3記載の画像符号化装置。
- 前記画像解像度変更回路は、遅延した入力画像の水平画素数を変更するための水平フィルタと、垂直ライン数を変更するための垂直フィルタとで構成され、所定の入力解像度となるようフィルタ係数を決定して前記フィルタ処理を行い、解像度変更された画像信号を前記フレーム周波数変更回路に出力することを特徴とする請求項1から4のいずれか1項に記載の画像符号化装置。
- 前記画像解像度変更回路は、前フィールドとのフィールド差分値、フレーム/フィールドDCTのピクチャ内マクロブロック数、ならびに動ベクトル情報のうちの一つあるいは複数の情報を用いて入力画像の解像度を変更することを特徴とする請求項1から5のいずれか1項に記載の画像符号化装置。
- 前記フレーム周波数変更回路は、1GOP前のIピクチャ、Pピクチャ、Bピクチャのピクチャ種別毎の平均符号化ビット数比率を用いて前記入力画像のフレーム周波数を変更することを特徴とする請求項1から5のいずれか1項に記載の画像符号化装置。
- 前記フレーム周波数変更回路は、内容が“0”でない動ベクトルマクロブロックの数、および動ベクトル情報のいずれか一つあるいは両方を用いて前記入力画像の持つフレーム周波数を変更することを特徴とする請求項1から5のいずれか1項に記載の画像符号化装置。
- 入力画像制御回路により入力画像の画像構成の特性を判定し、
画像解像度変更回路が前記判定に基き前記入力画像を所定の入力解像度となるようフィルタ処理を行い解像度変更された画像信号を出力し、
前記解像度変更された画像信号に対し指定されたフレーム周波数となるようフレーム周波数変更回路が前記入力画像のフレーム数を削減し、該フレーム数の削減処理によりフレーム周波数変換された画像信号を出力し、
符号化回路が前記フレーム周波数変換された画像信号を用いて符号化し、
前記入力画像の画像構成の特性に合わせ適応的に解像度を変更することにより低ビットレート化を可能としたことを特徴とする画像符号化方式。 - 前記入力画像の画像構成の特性とは、該入力画像の静止画度、複雑さ、解像度、フレーム周波数の少なくともいずれか1つを含む特性であり、該特性を適応的に判定して前記フィルタ処理を行うことを特徴とする請求項9記載の画像符号化方式。
- 前記符号化回路は、MPEG2ストリームに変換することを特徴とする請求項9または10記載の画像符号化方式。
- 前記MPEG2符号化回路から得られる符号化統計情報と、前記フレーム周波数変更回路から得られる前フィールドとの差分値とにより前記判定をして、前記入力画像制御回路が前記入力画像の解像度やフレーム周波数を決定することを特徴とする請求項11記載の画像符号化方式。
- 前記遅延した入力画像の水平画素数を変更するための水平フィルタと、垂直ライン数を変更するための垂直フィルタとで、前記画像解像度変更回路が、所定の入力解像度となるようフィルタ係数を決定して前記フィルタ処理を行い、解像度変更された画像信号を前記フレーム周波数変更回路に出力することを特徴とする請求項9から12のいずれか1項に記載の画像符号化方式。
- 前フィールドとのフィールド差分値、フレーム/フィールドDCTのピクチャ内マクロブロック数、ならびに動ベクトル情報のうちの一つあるいは複数の情報を用いて、前記画像解像度変更回路が入力画像の解像度を変更することを特徴とする請求項9から13のいずれか1項に記載の画像符号化方式。
- 1GOP前のIピクチャ、Pピクチャ、Bピクチャのピクチャ種別毎の平均符号化ビット数比率を用いて、前記フレーム周波数変更回路が前記入力画像のフレーム周波数を変更することを特徴とする請求項9から13のいずれか1項に記載の画像符号化方式。
- 内容が“0”でない動ベクトルマクロブロックの数、および動ベクトル情報のいずれか一つあるいは両方を用いて、前記フレーム周波数変更回路が前記入力画像の持つフレーム周波数を変更することを特徴とする請求項9から13のいずれか1項に記載の画像符号化方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002179037A JP2004023670A (ja) | 2002-06-19 | 2002-06-19 | 画像符号化装置および同方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002179037A JP2004023670A (ja) | 2002-06-19 | 2002-06-19 | 画像符号化装置および同方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004023670A true JP2004023670A (ja) | 2004-01-22 |
Family
ID=31176586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002179037A Pending JP2004023670A (ja) | 2002-06-19 | 2002-06-19 | 画像符号化装置および同方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004023670A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006054569A (ja) * | 2004-08-10 | 2006-02-23 | Sony Corp | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
JP2006310921A (ja) * | 2005-04-26 | 2006-11-09 | Sony Corp | 動画像変換装置、および動画像変換方法、並びにコンピュータ・プログラム |
JP2006324755A (ja) * | 2005-05-17 | 2006-11-30 | Sony Corp | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
JP2006345446A (ja) * | 2005-06-10 | 2006-12-21 | Sony Corp | 動画像変換装置、動画像変換方法、及びコンピュータ・プログラム |
US7688385B2 (en) | 2008-02-29 | 2010-03-30 | Kabushiki Kaisha Toshiba | Video signal processing apparatus and method |
JP2011217130A (ja) * | 2010-03-31 | 2011-10-27 | Fujifilm Corp | 画像符号化装置および方法並びにプログラム |
JP2017517940A (ja) * | 2014-05-02 | 2017-06-29 | サムスン エレクトロニクス カンパニー リミテッド | 適応的映像データ圧縮方法及びその装置 |
JP2019537365A (ja) * | 2017-03-21 | 2019-12-19 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | ビデオ符号化方法、ビデオ復号方法、コンピュータ装置および記憶媒体 |
-
2002
- 2002-06-19 JP JP2002179037A patent/JP2004023670A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006054569A (ja) * | 2004-08-10 | 2006-02-23 | Sony Corp | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
JP4590975B2 (ja) * | 2004-08-10 | 2010-12-01 | ソニー株式会社 | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
JP2006310921A (ja) * | 2005-04-26 | 2006-11-09 | Sony Corp | 動画像変換装置、および動画像変換方法、並びにコンピュータ・プログラム |
JP2006324755A (ja) * | 2005-05-17 | 2006-11-30 | Sony Corp | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
JP2006345446A (ja) * | 2005-06-10 | 2006-12-21 | Sony Corp | 動画像変換装置、動画像変換方法、及びコンピュータ・プログラム |
US8149913B2 (en) | 2005-06-10 | 2012-04-03 | Sony Corporation | Moving picture converting apparatus and method, and computer program |
US7688385B2 (en) | 2008-02-29 | 2010-03-30 | Kabushiki Kaisha Toshiba | Video signal processing apparatus and method |
JP2011217130A (ja) * | 2010-03-31 | 2011-10-27 | Fujifilm Corp | 画像符号化装置および方法並びにプログラム |
JP2017517940A (ja) * | 2014-05-02 | 2017-06-29 | サムスン エレクトロニクス カンパニー リミテッド | 適応的映像データ圧縮方法及びその装置 |
US10757416B2 (en) | 2014-05-02 | 2020-08-25 | Samsung Electronics Co., Ltd. | Method and device for adaptively compressing image data |
JP2019537365A (ja) * | 2017-03-21 | 2019-12-19 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | ビデオ符号化方法、ビデオ復号方法、コンピュータ装置および記憶媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6862402B2 (en) | Digital recording and playback apparatus having MPEG CODEC and method therefor | |
US6944224B2 (en) | Systems and methods for selecting a macroblock mode in a video encoder | |
JP4223571B2 (ja) | 画像符号化方法及び装置 | |
KR100504641B1 (ko) | 화상 부호화 장치 및 화상 부호화 방법 | |
EP1949705B1 (en) | Image signal processing apparatus | |
US20040252758A1 (en) | Systems and methods for adaptively filtering discrete cosine transform (DCT) coefficients in a video encoder | |
US6151360A (en) | Method for encoding video signal using statistical information | |
JPH08237669A (ja) | 画像信号処理装置、画像信号処理方法および画像信号復号化装置 | |
JPH07264580A (ja) | 映像信号伝送方法並びに映像信号送信装置及び映像信号受信装置 | |
JPH08163594A (ja) | 動画像復号化方法及び動画像復号化装置 | |
EP0700213B1 (en) | Motion picture encoding method and apparatus | |
US7787541B2 (en) | Dynamic pre-filter control with subjective noise detector for video compression | |
KR20030005219A (ko) | 비디오 개선을 위한 코딩 정보에 기초한 유용성 메트릭제공 방법 및 장치 | |
JP2004023670A (ja) | 画像符号化装置および同方式 | |
JP2001506437A (ja) | クロミナンス信号処理に起因するルミナンス欠陥を補償する方法及び装置 | |
US7006570B2 (en) | Video signal coding method and video signal encoder | |
JP3703088B2 (ja) | 拡張画像符号化装置及び拡張画像復号化装置 | |
JP3428332B2 (ja) | 画像符号化方法及び装置、並びに画像伝送方法 | |
CA2206454A1 (en) | Method and apparatus for coding digital video signals | |
JP4288897B2 (ja) | 符号化装置及び方法、プログラム、記録媒体 | |
JPH0888854A (ja) | 動画像符号化方式 | |
EP0927954B1 (en) | Image signal compression coding method and apparatus | |
JP2002354484A (ja) | 符号化画像のレート変換方法、及び符号化画像レート変換装置 | |
JP2003032685A (ja) | ノイズ低減方法および映像処理装置 | |
JP3646424B2 (ja) | ノイズリデューサおよびノイズリダクション方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050318 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061107 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080212 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080617 |