実施の形態1.
図1は、この発明の実施の形態1による画像符号化装置の構成を示す図であり、MPEG−2による符号化処理に適用した場合を例として挙げている。実施の形態1による画像符号化装置は、メモリ1、減算器2、セレクタ3、DCT(Discrete Cosine Transform)演算器4、量子化器5、可変長符号化部6、バッファ7、逆量子化器8、逆DCT演算器9、フレーム加算器10、セレクタ11、イントラ/インター判定部12、動き補償予測部13、フレームメモリ14及び量子化制御部15からなる基本構成に加え、画像特性演算部16及び目標情報量演算部17を備えている。本発明の画像符号化装置は、例えば汎用コンピュータなどを用いて、本発明に従う画像符号化プログラムを実行させることによって具現化することができる。
つまり、画像符号化プログラムをコンピュータに実行させてそのハードウェア構成を上記構成要素1〜17として機能させることにより、本発明の画像符号化装置による特徴的なデータ処理を実行することができる。なお、以下の説明において、本発明の画像符号化装置を具現化するコンピュータ自体の構成及びその基本的な機能については、当業者が当該分野の技術常識に基づいて容易に認識できるものであり、本発明の本質に直接関わるものでないので詳細な記載を省略する。
個々の構成要素の概要を説明すると、メモリ1は、装置内に入力された符号化対象であるディジタルビデオ信号を数フレーム分保持する。減算器2は、メモリ1から読み出されたディジタルビデオ信号とフレームメモリ14から読み出された参照画像とをフレーム間差分してセレクタ3に出力する。セレクタ3は、メモリ1及び減算器2のうちいずれからの信号をDCT演算器4に出力するかを選択する。
DCT演算器(符号化部)4は、セレクタ3からの出力信号を離散コサイン変換して量子化器5に出力する。量子化器(符号化部)5では、DCT演算器4によって離散コサイン変換された信号について量子化処理を実行し可変長符号化部6に出力する。可変長符号化部(符号化部)6は、量子化器5による量子化結果を可変長符号に変換する。バッファ7は、可変長符号化部6により可変長符号化されたビットストリームデータを一時的に保持し必要に応じて装置外部に出力する。
逆量子化器8は、量子化器5により量子化されたディジタル信号を逆量子化処理して逆DCT演算器9に出力する。逆DCT演算器9では、逆量子化器8から入力した信号を逆離散コサイン変換する。フレーム加算器10は、フレームメモリ14から読み出された参照画像と逆DCT演算器9からの出力信号とをフレーム間加算する。セレクタ11では、逆DCT演算器9及び加算器10のうちいずれからの出力信号をフレームメモリ14に出力すべきか選択する。
イントラ/インター判定部12は、メモリ1から符号化対象画像のフレームごとに読み出された符号化対象ブロックについてイントラ(フレーム内)符号化かインター(フレーム間)符号化かを判定する。動き補償予測部13は、メモリ1からの符号化対象ブロック及びフレームメモリ14からの参照画像を用いて動き補償予測を実行する。
フレームメモリ14は、動き補償予測のための参照画像(符号化対象画像において符号化を完了したフレーム画像)を保持する。量子化制御部15は、バッファ7のバッファ量や目標情報量演算部17からの目標情報量に関する情報などに応じて量子化器5による量子化処理を制御する。
画像特性演算部16は、装置内に入力された符号化対象であるディジタルビデオ信号の視覚的な画像特性を特定する画像特性パラメータを算出する。画像特性パラメータとしては、画像や画像の一部領域を構成する画素の輝度信号と2つの色差信号についてのそれぞれの平均値と分散値、これらのフレーム間の差分の絶対値和、水平方向周波数分布や垂直方向周波数分布などがある。
また、これらの画像の視覚的な特性を示すパラメータは、符号化対象画像のフレーム内やフレーム間でのフレーム単位で求める以外に、符号化対象ブロック(MPEG−2ではマクロブロックと称す)単位、複数の符号化対象ブロック(マクロブロック)で構成される領域単位、あるいはフレーム画像をいくつかの領域に分割した領域単位で求められる。
目標情報量演算部17は、画像特性演算部16が算出する画像特性パラメータから求まる符号化対象画像の特性に応じて、イントラ符号化方法であるIピクチャ、インター符号化方法であるPピクチャ及びBピクチャに割り当てるべき目標情報量を算出する。
次に動作について説明する。
符号化対象となるディジタルビデオ信号は、本実施の形態1による画像符号化装置に入力されると、その内部のメモリ1に数フレーム分ずつ一時的に格納される。これに伴い、最初に符号化を行うための上記ビデオ信号のフレームが符号化対象ブロック(マクロブロック)単位でメモリ1から読み出され、減算器2、セレクタ3、イントラ/インター判定部12、動き補償予測部13及び画像特性演算部16にそれぞれ出力される。
動き補償予測部13では、メモリ1から符号化対象ブロック単位の入力画像とフレームメモリ14から読み出した参照画像とを用いて動き補償予測を行う。この動き補償予測では、符号化対象ブロックに対応する参照画像内の予測ブロックが求められ、両ブロック内の画素値の差分に基づいて予測誤差が算出される。そして、メモリ1から入力した符号化対象ブロックについて参照画像の中から予測ブロック予測誤差が最小となる動きベクトルが求められる。
また、動き補償予測部13は、符号化対象ブロック内の画素値に基づいて求めた評価値と予測誤差とをイントラ/インター判定部12及び目標情報量演算部17にそれぞれ出力する。
イントラ/インター判定部12では、動き補償予測部13から入力した評価値及び予測誤差に基づいて、当該符号化対象ブロックの符号化対象ピクチャがイントラ符号化であるかインター符号化であるかを判定する。例えば、符号化対象ピクチャがIピクチャであればイントラ符号化を選択する。この判定結果は、イントラ/インター判定部12から各セレクタ3,11に出力される。
セレクタ3は、イントラ/インター判定部12による判定結果に基づいて、減算器2及びメモリ1のうちのいずれかの入力を選択してDCT演算器4に出力する。ここで、減算器2では、参照画像をフレームメモリ14から読み出した参照画像とメモリ1からの符号化対象画像との差分を求める。この差分情報は、減算器2から符号化対象ブロック単位でセレクタ3に入力される。
ここで、イントラ/インター判定部12の判定結果がイントラ符号化であると、メモリ1からの符号化対象ブロックを選択してDCT演算器4に出力する。一方、インター符号化であると、セレクタ3は、減算器2からの差分情報を選択して符号化対象ブロック単位でDCT演算器4に出力する。
DCT演算器4では、セレクタ3からの符号化対象ブロック単位の画像データに対してDCTを実行し、そのDCT係数を量子化器5に出力する。量子化器5は、量子化制御部15により設定された量子化パラメータに従って、DCT演算器4からのDCT係数を量子化して可変長符号化部6及び逆量子化器8に出力する。
可変長符号化部6は、量子化器5から入力した量子化結果データを可変長符号に変換してバッファ7に保持する。バッファ7では、可変長符号化部6からの符号化データを一時的に蓄えた後、所定の転送レートのビットストリームとして外部に出力する。また、バッファ7におけるデータの占有量を示すバッファ量は、量子化制御部15及び目標情報量演算部17によって読み出される。
また、逆量子化器8では、量子化器5から入力した量子化結果データ逆量子化処理が行われ、その結果が逆DCT演算器9に出力される。逆DCT演算器9は、逆量子化器8からのデータに対して逆DCT処理を実行する。この逆DCTされたデータは、逆DCT演算器9からフレーム加算器10及びセレクタ11に出力される。
セレクタ11では、フレームメモリ14に出力すべきデータとして、イントラ/インター判定部12からの判定結果に応じて、逆DCT演算器9からの出力データ、及び、フレーム加算器10により逆DCT演算器9からの出力データにフレームメモリ14の参照画像をフレーム加算された画像データのうちのいずれかを選択する。
例えば、イントラ/インター判定部12からの判定結果がイントラ符号化であれば、フレーム内符号化されて復号された画像データとして、逆DCT演算器9からの出力データが選択されてフレームメモリ14に格納される。一方、判定結果がインター符号化であれば、フレーム間符号化されて復号された画像データとして、フレーム加算器10からの画像データが選択されてフレームメモリ14に格納される。
フレームメモリ14に格納されたセレクタ11からの出力データは、次の符号化フレームの動き補償予測の参照画像として使用される。一方、量子化制御部15は、バッファ7から読み出したバッファ量に応じて量子化器5による量子化レートを制御する。これにより、バッファ7でデータがオーバーフローやアンダーフローを起こさないように調整される。
次に目標情報量演算部17による目標情報量の算出処理について説明する。
以降の説明では、目標情報量演算部17が、例えばMPEG−2の符号化で使用されているTM5による手法を基本として、各ピクチャタイプに割り当てるべき目標情報量を算出するものとする。
TM5では、下記式(1)、(2)、(3)を用いてIピクチャ、Pピクチャ、Bピクチャに割り当てる目標情報量Ti,Tp,Tbを算出する。
Ti=R/{1+(Np・Xp)/(Xi・Kp)+(Nb・Xb)
/(Xi・Kb)} ・・・(1)
Tp=R/{Np+(Nb・Xb・Kp)/(Xp・Kb)} ・・・(2)
Tb=R/{Nb+(Np・Xp・Kb)/(Xb・Kp)} ・・・(3)
但し、Rは、符号化しているGOP(Group of Picture)において未だ符号化されていない残りのピクチャに対して割り当てることができる情報量である。Np,Nbは、符号化しているGOP(Group of Picture)において未だ符号化されていない残りのピクチャ数である。
Si,Sp,Sbは一番最近に符号化が終了した各ピクチャの発生符号ビット量であり、Qi,Qp,Qbは一番最近に符号化が終了した各ピクチャの平均量子化スケールコードである。Xi,Xp,Xbは画像の複雑さを示すパラメータであり、Xi=Si・Qi、Xp=Sp・Qp、Xb=Sb・Qbで表される。KpはIピクチャに対するPピクチャの量子化スケールコード比率、KbはIピクチャに対するBピクチャの量子化スケールコード比率を決定するパラメータである。
従来のTM5では、上記式(1)〜(3)を用いて各ピクチャの目標情報量Ti,Tp,Tbを求めるにあたり、Kp=1.0、Kb=1.4に固定すると全体の画質が最適化されるとの仮定を前提としている。ここでは、これらKp,Kb値(Kp=1.0、Kb=1.4)のときを通常値と称する。
画像特性演算部16は、メモリ1から減算器2やセレクタ3に読み出される符号化対象ブロックを入力してその画像解析を行う。このとき、画像特性演算部16は、画像特性パラメータとして、符号化対象画像のフレーム内やフレーム間でフレーム内画像やその一部領域を構成する画素の輝度信号と2つの色差信号についてのそれぞれの平均値と分散値、これらのフレーム間の差分の絶対値和、水平方向周波数分布や垂直方向周波数分布などを求める。これらの画像特性パラメータは、符号化対象画像についての視覚的な精細度を表す指標となる。
また、これらの画像の視覚的な特性を示すパラメータは、符号化対象画像のフレーム内やフレーム間でのフレーム単位で求める以外に、符号化対象ブロック(マクロブロック)単位、複数の符号化対象ブロック(マクロブロック)で構成される領域単位、あるいはフレーム画像をいくつかの領域に分割した領域単位で求められる。このようにして求められた画像特性パラメータは、画像特性演算部16から目標情報量演算部17に出力される。
目標情報量演算部17は、画像特性演算部16からの画像特性パラメータに基づいて符号化対象ブロックの画像の視覚的な特性を判断する。例えば、画像特性パラメータにおける符号化対象画像の水平方向周波数分や垂直方向周波数分布から、当該画像に高域の周波数分布があるか否かを判断する。
このあと、目標情報量演算部17は、画像特性パラメータに基づいて判断した符号化対象ブロックの視覚的な特性から、当該ブロックの符号化において各ピクチャに既に割り当てていた目標情報量での符号化により発生する情報量が適切であるか否かを判定する。
具体的には、画像特性パラメータの値における各ピクチャにより発生する情報量と符号化データを復号した結果の最良な画質との関係を予めデータベースとして目標情報量演算部17に登録しておく。目標情報量演算部17では、上記判定処理において画像特性パラメータの値と上記データベースの内容とを参照してその画像の視覚的な特性及びその画像のピクチャに既に割り当てていた目標情報量が適切であるか否かを判定する。
例えば、画像特性パラメータから符号化対象ブロックに高域周波数成分が多く存在し、当該符号化対象ブロックがIピクチャである場合、目標情報量演算部17は、当該Iピクチャの目標情報量と他のピクチャに割り当てた目標情報量とを比較して、Iピクチャと他のピクチャとにより発生する情報量の相対的な大小関係が適切であるか否かを判断する。
このとき、他のピクチャと比較してIピクチャにより発生する情報量が相対的に小さく、復号時にIピクチャに起因するぼけが顕著になるであろうことが判定されると、目標情報量演算部17は、下記のようにして他のピクチャとの関係でIピクチャでの情報量が増加するように目標情報量の変更処理を実行する。
例えば、Iピクチャの目標情報量を増加させる場合、目標情報量演算部17は、上記式(1)における量子化スケールコード比率を示すパラメータであるKp,Kbの値を変更してIピクチャの目標情報量を増加させる。
ここで、Kp,Kb値に通常値が設定されている場合、目標情報量演算部17は、上記式(1)おいて、R,Np,Nb,Xi,Xp,Xbを固定値と仮定し、Kp,Kbを通常値より大きくする。
つまり、上述のように仮定して、Kp,Kbを通常値より大きくすると、上記式(1)〜(3)における分母の(Np・Xp)/(Xi・Kp)や(Nb・Xb)/(Xi・Kb)の項がとる値がそれぞれ小さくなり、上記式(1)の分母自体が小さくなる。この結果、Pピクチャ及びBピクチャの平均量子化スケールコードを大きくするように目標情報量がそれぞれ演算される。これにより、Iピクチャの目標情報量は増加し、Pピクチャ、Bピクチャの目標情報量は減少することになる。
なお、Kp,Kbを通常値からどの程度大きくするかなどの変更分の決定は、上述したデータベースに予め求めておいた画像特性パラメータの値とこれに最適な目標情報量との関係により決定される。
目標情報量演算部17は、画像特性パラメータに応じて変更したIピクチャの目標情報量を量子化制御部15に出力する。これにより、量子化制御部15は、Iピクチャでの符号化において上記目標情報量で量子化が実行されるように量子化パラメータを量子化器5に設定する。
上記では、Iピクチャの目標情報量を増加させるために、Kp,Kbの値を変更する処理を説明したが、画像特性パラメータによりPピクチャやBピクチャの目標情報量を変更する必要がある場合も上記式(2),(3)におけるKp,Kbの値を変更することで対応することができる。
また、画像特性演算部16に、入力した符号化対象画像信号がSDTV信号(標準テレビ信号)であるかHDTV信号(ハイビジョンテレビ信号)であるかを判定する機能を持たせておき、目標情報量演算部17が、符号化対象画像の画像特性パラメータに加え、SDTVかHDTVかの判定結果も考慮してピクチャに割り当てる目標情報量を演算するようにしてもよい。これは、高域周波数成分まで有するHDTV信号では、Iピクチャにより発生する情報量が他のピクチャと比較して相対的に小さいと、Iピクチャに同期したぼけが高周波数成分に生じてしまうことによる。
そこで、画像特性演算部16によって符号化対象の入力画像がHDTV信号(ハイビジョン信号)であると判定された場合、目標情報量演算部17は、上述したような符号化対象画像の画像特性パラメータによる各ピクチャの目標情報量の算出処理に加え、Iピクチャについて他のピクチャとの間で相対的な情報量を増加させるため、上記式(1)におけるKp,Kb値を既存の値より増加させる。
この処理として、例えばSDTV信号であるとき通常値Kp=1.0、Kb=1.4で固定しておき、HDTV信号のとき他のピクチャにより発生する情報量との比較など実行することなく、予め求めた固定値Kp=2.0、Kb=3.0を設定する。このKp,Kb値は、HDTV信号の符号化において予め最適な画質を与えるものを求めておき、目標情報量演算部17にデータベースとして登録しておく。
このようにすることで、HDTV信号の符号化であれば、HDTV信号に応じて予め求めておいたKp,Kb値を設定することで、結果的にIピクチャの目標情報量を増加させ、Pピクチャ、Bピクチャの目標情報量を減少させることができる。
これにより、高域周波数成分まで有するHDTV信号において、Iピクチャにおける高域周波数信号が通常値のときよりも精度よく再現されることにより、Iピクチャに同期したぼけの現象を防止することができる。
なお、固定値Kp=2.0、Kb=3.0を設定する場合を例に述べたが、Kp,Kb値が通常値である場合よりもIピクチャに多く目標情報量を割り当てることができる限り、上述したKp,Kb値の数値例以外の値を設定することも可能である。
また、本発明では、符号化対象画像の画像特性パラメータに加えて、符号化レートに応じて各ピクチャの目標情報量を変更するように目標情報量演算部17を構成しても良い。例えば、目標情報量演算部17に外部から符号化モードの設定を受け付ける入力装置を設けておく。
さらに、目標情報量演算部17に対して、例えば符号化レートと各ピクチャの目標情報量とのデータを用いて復号後に最適な画質となる符号化レートの閾値を求める条件式を設定しておく。あるいは、目標情報量演算部17に外部から復号後に最適な画質となる符号化レートの閾値の設定を受け付ける構成を設けておく。
上述したような構成によって符号化レートが設定されると、目標情報量演算部17は、その値と上記閾値との比較結果に応じてKp,Kb値を変更する。以降の説明では、HDTV信号について示すがSDTV信号においても同様に適用できる。
例えば、外部からモード設定として符号化レートが設定されると、目標情報量演算部17は、上述したような予め求めた閾値Thと比較して、外部から設定された符号化レートが閾値Th以上(符号化レート≧Th)であるとき、上記式(1)〜(3)におけるKp=2.0、Kb=3.0とする。また、外部から設定された符号化レートが閾値Th未満(符号化レート<Th)であると、Kp=1.5、Kb=2.0に設定する。
MPEG−2などのMPEG符号化において、ピクチャの情報量は、主として動き補償予測に費やされる情報量とDCT係数に費やされる情報量がその大部分を占める。このため、フレーム画像内の符号化であるIピクチャであれば、動きベクトルに費やされる情報量は特殊なモードでない限り存在しない。
上述した2つの情報量のうち、動きベクトルに費やされる情報量は、符号化レートに依らずそれほど大きくは変化しない。また、通常の符号化では、ピクチャの目標情報量から動きベクトルに費やされる情報量を除いた情報量がDCT係数のための情報量に割り当てられる。従って、符号化レートが低くなるにつれてDCT係数に割り当てることができる情報量はさらに少なくなってくる。これは、ブロックノイズの発生などの極端な画質劣化を招くことになる。
そこで、符号化レートが上記閾値未満である場合、上述のようにKp,Kb値(Kp=1.5、Kb=2.0)を設定し、高い符号化レートのときよりもIピクチャに割り当てる目標情報量の割合を少なくし、代わりにPピクチャ、Bピクチャの目標情報量の割合を多くする。このようにして、DCT係数に割り当てるための情報量を増加させることで、全体としての画質を向上させることができる。
また、符号化レートが上記閾値未満のとき、Iピクチャへの目標情報量の割合を小さくすることができる限り、上述したKp,Kb値(Kp=1.5、Kb=2.0)の代わりに他の数値を使用することも可能である。
さらに、上述した説明では、符号化レートの閾値が1つである例を示したが閾値を複数個設定することでレートを細かく分類し、分類されたレートごとにKp,Kb値を変更するように目標情報量演算部17を構成しても良い。
以上のように、この実施の形態1によれば、時間軸上に並んだ複数のフレーム画像より構成される符号化対象画像を入力し、符号化対象画像の視覚的な特性を示す画像特性パラメータを求める画像特性演算部16と、Iピクチャなどのイントラ符号化方法及びPピクチャやBピクチャなどのインター符号化方法での符号化により発生する情報量が画像特性パラメータで示される特性を有する符号化対象画像の画質に与える影響を判定し、当該判定結果に応じて各符号化方法に割り当てる目標情報量を算出する目標情報量演算部17とを備え、符号化対象画像に対して目標情報量演算部17により算出された目標情報量で符号化を実行するので、符号化対象画像の視覚的な特性に応じて画質が最適になるように各符号化方法による発生情報量の相対的な関係を制御することができる。
また、上記実施の形態1では、符号化対象画像の視覚的な特性に応じて、そのGOPに割り当てる目標情報量を変更するのではなく、さらに詳細にGOPを構成するピクチャごとに割り当てるべき目標情報量を適宜変更される。これにより、復号後の画像について最適な画質を与える符号化処理を実現することができる。
実施の形態2.
この実施の形態2では、上記実施の形態1で示した処理に加え、符号化処理で使用する量子化マトリクスに応じて、各ピクチャの目標情報量を変更するものである。
実施の形態2による画像符号化装置の基本的な構成は、上記実施の形態1の図1で示したものと同様である。上記実施の形態1と異なる箇所としては、目標情報量演算部17が、画像特性演算部16からの画像特性パラメータや外部からモード設定されたパラメータに加え、量子化制御部15から読み出した量子化マトリクスの係数値に応じて各ピクチャの目標情報量を変更する。なお、量子化マトリクスの係数値は、量子化制御部15を介して量子化器5から入力するようにしてもよい。
次に動作について説明する。
以降では、説明の簡単のため、上記実施の形態1と同様にMPEG−2符号化方式で、各ピクチャの目標情報量を求める演算式もTM5を用いる場合を例に挙げる。なお、本実施の形態による画像符号化装置の基本的な動作は上記実施の形態1と同様であるので、異なる点である目標情報量演算部17による各ピクチャの目標情報量の演算処理について主に説明する。なお、HDTV信号について示すがSDTV信号においても同様に適用できるものである。
目標情報量演算部17は、画像特性演算部16から入力した符号化対象画像についての画像特性パラメータ(若しくは外部モード設定によるパラメータ)に加え、量子化制御部15から現時点での符号化処理に使用した量子化マトリクスの係数値を入力する。
図2は、インター符号化における量子化マトリクスを示す図である。図において、M00〜M77は、量子化マトリクスの各係数である。中高域の周波数成分に対する係数は、例えばMijとした場合、i≧4あるいはj≧4の範囲に含まれるものに相当する。
目標情報量演算部17は、量子化制御部15から符号化処理に使用した量子化マトリクスの係数値を入力すると、閾値をThとするとき、当該量子化マトリクスにおける中高域の周波数成分に対する係数Mij(i≧4あるいはj≧4)が閾値Th以上(Mij≧Th)であるとき、上記式(1)〜(3)におけるKp,Kb値を例えばKp=1.5、Kb=2.0と設定する。また、上記以外の係数であれば、例えばKp=2.0、Kb=3.0を設定する。
上述した閾値Thは、インター符号化方法における量子化マトリクス、つまりPピクチャやBピクチャでの符号化に使用される量子化マトリクスにおいて、量子化による復号後の中高域周波数成分に対応する画質の劣化を許容することができる最下限の係数値を規定するものである。
目標情報量演算部17には、例えば閾値Thの候補値と各ピクチャの目標情報量との履歴データを用いて復号後に最適な画質となる閾値Thを求める条件式を設定しておくか、あるいは、外部から復号後に最適な画質となる閾値Thの設定を受け付ける構成を設けておく。
インター符号化方法で量子化マトリクスの中高域周波数成分に対する係数が閾値Thより大きいとき、量子化処理における符号化対象ブロックの中高域周波数成分に対応するDCT係数とこれに対応する量子化係数との除算や切り捨てにより、PピクチャやBピクチャの符号化対象ブロックの中高域周波数成分に対応するDCT係数が削減される。
このため、符号化対象画像が中高域周波数成分を有する精細な画像であっても、PピクチャやBピクチャに対応するDCT係数が削減された分だけIピクチャにより発生する情報量が相対的に減ることが無く、Iピクチャに起因するぼけが目立たなくなる。
従って、この場合には、Iピクチャに対する目標情報量の割合を増加させる必要がなくなり、その分をPピクチャ、Bピクチャに割り当てることにより、全体としての画質を向上させることができる。
そこで、量子化制御部15から入力した量子化マトリクスの係数が、符号化対象画像が中高域周波数成分に対応するものであり、且つ閾値Th以上であるとき、Iピクチャの目標情報量を比較的に増加させない値として、例えばKp=1.5、Kb=2.0を上記式(1)〜(3)に設定する。これにより、Iピクチャに対する目標情報量の割合を多分に増加させることなく、割り当て可能な情報量の残分をPピクチャ、Bピクチャに割り当てることができる。
また、量子化マトリクスの中高域周数成分に対応する係数が閾値Th以上であるとき、Iピクチャへの目標情報量の割合を小さくすることができる限り、上述したKp,Kb値の代わりに他の数値を使用することも可能である。
一方、量子化制御部15から入力した量子化マトリクスの係数が、符号化対象画像が低域周波数成分に対応するものであったり、中高域周波数成分に対応するもので閾値Th未満であるとき、他のピクチャとの間でのIピクチャの相対的な目標情報量を増加させる値として、例えばKp=2.0、Kb=3.0を上記式(1)〜(3)に設定する。
以上のように、この実施の形態2によれば、量子化マトリクスの係数に基づいて決定される符号化対象画像の視覚的な特性に応じて、ピクチャごとに割り当てるべき目標情報量を適宜変更することにより、復号後の画像について最適な画質を与える符号化処理を実現することができる。
なお、上記実施の形態2において、符号化対象画像における中高域周波数成分のDCT係数が削減できるものであれば、量子化マトリクスにおける中高域周波数成分に対応する係数以外の係数であっても、上述した以外の閾値であってもよい。また、量子化マトリクスの係数ごとに上述のような閾値Thを設定するように構成しても良い。
実施の形態3.
この実施の形態3では、上記実施の形態1で示した処理に加え、Pピクチャ間隔であるM値に応じて、各ピクチャの目標情報量を変更するものである。
実施の形態3による画像符号化装置の基本的な構成は、上記実施の形態1の図1で示したものと同様である。上記実施の形態1と異なる箇所としては、目標情報量演算部17が、画像特性演算部16からの画像特性パラメータや外部からモード設定されたパラメータに加え、符号化処理時におけるPピクチャ間隔(M値)に応じて、各ピクチャの目標情報量を変更する。
次に動作について説明する。
以降では、説明の簡単のため、上記実施の形態1と同様にMPEG−2符号化方式で、各ピクチャの目標情報量を求める演算式もTM5を用いる場合を例に挙げる。なお、本実施の形態による画像符号化装置の基本的な動作は上記実施の形態1と同様であるので、異なる点である目標情報量演算部17による各ピクチャの目標情報量の演算処理について主に説明する。なお、HDTV信号について示すがSDTV信号においても同様に適用できるものである。
目標情報量演算部17は、画像特性演算部16から入力した符号化対象画像についての画像特性パラメータ(若しくは外部モード設定によるパラメータ)に加え、動き補償予測部13及びバッファ7から入力した情報に基づいてインター符号化したピクチャがPピクチャであるかBピクチャであるかを認識する。
図3は、符号化時におけるM値の変化を説明する図である。図示の例では、フレーム番号が1からK−1までM値3で符号化を行い、KからNまでM値1で符号化が行われている。ここで、目標情報量演算部17は、動き補償予測部13及びバッファ7から入力した情報に基づいて符号化対象のHDTV信号のM値を認識し、その結果に応じてKp,Kb値を上記式(1)〜(3)に設定する。
例えば、M値が3であるとき、Kp,Kb値として、上記実施の形態1で示したHDTV信号について最適な画質を与える通常値であるKp=2.0、Kb=3.0を上記式(1)〜(3)に設定して、各ピクチャの目標情報量を算出する。
一方、図3に示すようにM値が3から1に移行すると、Pピクチャが隣接して配置することになりBピクチャは使用されない。従って、このときのKbは無意味となり、このときKp値を通常値(Kp=2.0)のままで使用すると、IピクチャとPピクチャとの量子化スケールコードの平均値が同じ値となる。
このため、上記式(1)、(2)よりPピクチャにより発生する情報量と比較してIピクチャにより発生する情報量が相対的に小さくなる。これは、復号後の画像上の高精細な部分においてIピクチャに同期したぼけがより顕著に現れる要因となる。
そこで、本実施の形態3では、M値が1で符号化を行うとき、Kp値を通常値(Kp=2.0)より大きく、例えばKp=3.0として上記式(1)、(2)に設定する。これにより、Iピクチャへの目標情報量の割り当てが増加して、上述したようなIピクチャの情報量が小さいことによるぼけの発生を防止することができる。
なお、M値が1のときにKpが通常値の場合よりも、Iピクチャに多く目標情報量を割り当てることができる限り、上述したKp値の代わりに他の数値を使用することも可能である。
以上のように、この実施の形態3によれば、画像特性演算部16が求めた画像特性パラメータに基づいて決定される符号化対象画像の視覚的な特性に応じて各ピクチャの目標情報量を算出する他、インター符号化におけるM値が1であるとIピクチャ及びPピクチャに特化した条件で目標情報量を適宜変更することにより、復号後の画像について最適な画質を与える符号化処理を実現することができる。
実施の形態4.
この実施の形態4では、上記実施の形態1で示した処理に加え、画像特性演算部16において編集された特殊画像の一つであるディゾルブ画像が検出されたときに、Iピクチャ、Pピクチャ、Bピクチャの目標情報量を変更するものである。ディゾルブ画像は、第1のシーンから第2のシーンに変化するとき、第1のシーンに第2のシーンが透けるように合成され、第1のシーンが徐々に消えていくと同時に第2のシーンが浮かびあがってくる画像である。
実施の形態4による画像符号化装置の基本的な構成は、上記実施の形態1の図1で示したものと同様である。上記実施の形態1と異なる箇所としては、目標情報量演算部17が、画像特性演算部16により符号化対象画像にディゾルブ画像が検出されたか否かに応じて、各ピクチャの目標情報量を変更する。
本発明の特殊画像としては、撮像対象をそのまま撮影した画像ではなく、画面転換などの特殊効果を得るために加工が施された動画像をいい、ディゾルブ画像の他にフェードイン画像やフェードアウト画像などがある。また、ワイプと呼ばれる別の画像が画面の端から挿入され、徐々に画面内に占める割合が大きくなっていき、最終的に画面全体が上記別の画像に置き換わるような特殊画像もある。
次に動作について説明する。
以降では、説明の簡単のため、上記実施の形態1と同様にMPEG−2符号化方式で、各ピクチャの目標情報量を求める演算式もTM5を用いる場合を例に挙げる。なお、本実施の形態による画像符号化装置の基本的な動作は上記実施の形態1と同様であるので、異なる点である目標情報量演算部17による各ピクチャの目標情報量の演算処理について主に説明する。なお、HDTV信号について示すがSDTV信号においても同様に適用できるものである。
図4は、ディゾルブ画像の一例を示す図である。図示の例では、フレーム番号が1からL−1までに相当する第1のシーンから、フレーム番号がM−1からNまでに相当する第2のシーンに変化するまでの間にディゾルブ画像が設けられている。
つまり、フレーム番号が1からL−1までは第1のシーンのみが表示される非ディゾルブ期間であり、フレーム番号LからM−1までは第1のシーンと第2のシーンが重なったディゾルブ画像が表示されるディゾルブ期間となり、フレーム番号MからNまでが第2のシーンのみが表示される非ディゾルブ期間になる。この図に沿って動作を説明する。
画像特性演算部16は、フレームごとの符号化対象ブロックとしてメモリ1から読み出した符号化対象画像(例えば、HDTV信号)がディゾルブ画像であるか否かをモニタする。具体的には、画像特性演算部16が画像特性パラメータとしてフレーム単位あるいはフレームをいくつかに分割した領域単位での画素値の平均値と分散値の経時的な変化を調べることによりディゾルブ画像の有無を検出することができる。例えば、領域単位の平均値と分散値がフレームごとに単調増加あるいは単調減少しているときにディゾルブ画像と判定する。
図示の例で説明すると、フレーム番号が1〜L−1、M〜Nの期間のように第1のシーンや第2のシーンのみが表示されている非ディゾルブ期間において、画像特性演算部16は、上述のようにして各フレームの画像がディゾルブ画像でないと判断する。この判断結果は、画像特性演算部16から目標情報量演算部17に出力される。
目標情報量演算部17では、画像特性演算部16から符号化対象画像がディゾルブ画像でないとの判断結果を受けると、Kp,Kb値を例えばKp=2.0、Kb=3.0として上記式(1)〜(3)に設定し各ピクチャの目標情報量を算出する。
なお、非ディゾルブ期間では、復号後の画像でIピクチャに同期したぼけが発生するのを防止するため、Iピクチャに対する目標情報量の割合を多くする。そこで、Kp,Kb値を通常値(Kp=1.0、Kb=1.4)より大きい、例えばKp=2.0、Kb=3.0と設定して目標情報量を求める。
一方、画像特性演算部16は、上述のようにして、フレーム番号がL〜M−1の期間における各フレームの画像がディゾルブ画像であると判断する。この判断結果は、画像特性演算部16から目標情報量演算部17に出力される。
ディゾルブ期間では、非ディゾルブ期間と比較してフレーム間の相関が極端に低くなり、動き補償予測の効率が低下するとともに動きベクトルに費やされる情報量が多くなる。即ち、ディゾルブ期間においてIピクチャに対するPピクチャやBピクチャの発生情報量の割合が非ディゾルブ期間よりも大きくなる。
そこで、画像特性演算部16によってディゾルブ画像が検出されると、目標情報量演算部17は、Pピクチャ及びBピクチャにより発生する情報量を増加させるため、Kp,Kb値を非ディゾルブ期間と比較して小さくする。例えば、非ディゾルブ期間では、Kp,Kb値をKp=1.5、Kb=2.0として上記式(1)〜(3)に設定し各ピクチャの目標情報量を算出する。
このようにすることで、PピクチャやBピクチャにより発生する情報量が増加するため、Kp,Kb値を変更しない場合と比較して、復号後の画像の画質を向上させることができる。
なお、ディゾルブ画像の検出時において、PピクチャやBピクチャに多く目標情報量を割り当てることができる限り、上述したKp,Kb値の代わりに他の数値を使用することも可能である。
以上のように、この実施の形態4によれば、フレーム間の相関が極端に低くなり動き補償予測の効率が低下すると共に動きベクトルに費やされる情報量が多くなるディゾルブ画像のような特殊画像の有無を画像特性演算部16が画像特性パラメータとして検出する。この結果が特殊画像である場合、目標情報量演算部17が、特殊画像における視覚的な特性に応じて、各ピクチャの目標情報量を算出するので、特殊画像を含む画像であっても復号後に最適な画質を与える符号化処理を実現することができる。
なお、上記実施の形態では、特殊画像としてディゾルブ画像を検出する例を示したが、通常の画像と異なる画像特性を示す加工が施された特殊画像であってもその特性に応じて各ピクチャの目標情報量を算出することで、特殊画像を含む画像であっても復号後に最適な画質を与えることができる。
例えば、フェードイン画像では、ディゾルブ画像が第1のシーンと第2のシーンが両方とも自然画であるのに対し、第1のシーンが単色の画像で第2のシーンが自然画となる。また、フェードアウト画像は、第1のシーンが自然画であって第2のシーンが単色の画像となる。
これら特殊画像も、ディゾルブ画像と同様に、フレーム間の相関が極端に低くなり、動き補償予測の効率が低下するとともに動きベクトルに費やされる情報量が多くなるという画像特性を有している。従って、これら特性に応じて各ピクチャの目標情報量を算出することで上記効果を得ることができる。
実施の形態5.
この実施の形態5では、上記実施の形態1で示した処理に加え、画像特性演算部16において高輝度且つ高精細な画像が検出されたときに、Iピクチャ、Pピクチャ、Bピクチャの目標情報量を変更するものである。
実施の形態5による画像符号化装置の基本的な構成は、上記実施の形態1の図1で示したものと同様である。上記実施の形態1と異なる箇所としては、目標情報量演算部17が、画像特性演算部16により符号化対象画像に高輝度且つ高精細な画像が検出されたか否かに応じて、各ピクチャの目標情報量を変更する。
次に動作について説明する。
以降では、説明の簡単のため、上記実施の形態1と同様にMPEG−2符号化方式で、各ピクチャの目標情報量を求める演算式もTM5を用いる場合を例に挙げる。なお、本実施の形態による画像符号化装置の基本的な動作は上記実施の形態1と同様であるので、異なる点である目標情報量演算部17による各ピクチャの目標情報量の演算処理について主に説明する。なお、HDTV信号について示すがSDTV信号においても同様に適用できるものである。
画像特性演算部16は、フレームごとの符号化対象ブロックとしてメモリ1から読み出した符号化対象画像(例えば、HDTV信号)が高輝度且つ高精細な画像であるか否かをモニタする。具体的には、画像特性演算部16が画像特性パラメータとしてフレーム単位あるいはフレームをいくつかに分割した領域単位で画素値の平均値と分散値、あるいは周波数成分を調べることにより検出できる。例えば、領域単位の平均値と分散値あるいは周波数成分が予め設定した閾値よりも高いときに高輝度かつ高精細な画像と判定する。
目標情報量演算部17は、画像特性演算部16が高輝度且つ高精細な画像を検出しないとき、Kp,Kb値を例えばKp=2.0、Kb=3.0として上記式(1)〜(3)に設定し各ピクチャの目標情報量を算出する。
なお、上記Kp,Kb値は、上記実施の形態1で示した方法で決定される値を用いても良い。つまり、高輝度且つ高精細な画像ではないとき、上記実施の形態1で説明したように、他のピクチャと比較してIピクチャにより発生する情報量が相対的に小さくなることによって生じるIピクチャに同期したぼけを防止するため、通常値(Kp=1.0、Kb=1.4)よりKp,Kb値を大きくしてIピクチャに対する目標情報量の割合を多くする。
一方、上述のようにして画像特性演算部16が符号化対象画像から高輝度且つ高精細な画像を検出すると、目標情報量演算部17は、高輝度且つ高精細な画像が検出されないときより大きなKp,Kb値、例えばKp=3.0、Kb=4.0を上記式(1)〜(3)に設定し各ピクチャの目標情報量を算出する。
図5は、高輝度且つ高精細な画像の一例を示す図であり、この画像はCZP(サーキュラーゾーンプレート)と呼ばれるテスト画像である。画面の中心から外側に向かって正弦関数的に輝度レベルが変化していくものである。また、外側に向かうほど正弦関数の周波数が高くなる。
簡単に言えば、白と黒の帯が同心円状に配置され、外側に向かうほど帯の幅が狭くなっている。このような画像として白と黒の帯が中心に向かって移動する動画像もある。また、画面の四隅の部分は、周波数成分が高く、即ち高精細な部分であり、且つ輝度レベルが白の領域が存在するため高輝度でもある。
このような画像では、Iピクチャにより発生した情報量が少ない場合、符号化したときに高域周波数成分が失われる。このため、解像度が悪くなり、視覚的には復号後の画像にIピクチャに同期したぼけがかなり顕著に見えるようになる。
そこで、上述したように高輝度且つ高精細な画像を符号化する場合、他の画像である場合より大きなKp,Kb値を上記式(1)〜(3)に設定して各ピクチャの目標情報量を算出することで、Iピクチャにより発生する情報量を増加させる。
また、高輝度且つ高精細な画像を検出したとき、Iピクチャにより多くの目標情報量を割り当てることができれば、上述したKp,Kb値の代わりに他の数値を使用することも可能である。
以上のように、この実施の形態5によれば、画像特性演算部16が、Iピクチャにより発生する情報量が他のピクチャと比較して相対的に小さくなることによる画質劣化の影響を受けやすい高輝度且つ高精細な画像を画像特性パラメータとして検出し、これにより高輝度且つ高精細な画像が検出されると、目標情報量演算部17が、当該画像の視覚的な特性に応じて、各ピクチャの目標情報量を算出するので、復号後に最適な画質を与える符号化処理を実現することができる。特にIピクチャにより発生する情報量が小さいことに起因する画質劣化の発生を防止することができる。
なお、上記実施の形態では、高輝度且つ高精細な画像が検出されると、目標情報量演算部17に予め設定されたKp,Kb値を用いる例を示したが、下記のように構成しても良い。
先ず、画像特性演算部16が高輝度且つ高精細な画像を検出するにあたり、その高輝度且つ高精細の度合も規定して目標情報量演算部17に出力する。輝度や精細さのレベルとKp,Kb値の変更分とを関連付けたデータなどを用いて、目標情報量演算部17が、高輝度且つ高精細のレベルに応じてKp,Kb値の変更分を決定し、各ピクチャの目標情報量を算出する。
例えば、より高精細(画素値の分散や周波数成分がより高い)になるほど、Iピクチャの目標情報量を増加させるKp,Kb値を設定する。このように構成することで、さらに詳細に画質劣化に起因するファクタに対応することができる。
実施の形態6.
この実施の形態6では、上記実施の形態1で示した処理に加え、動き補償予測部13によって動きの速い画像が検出されたときに、Iピクチャ、Pピクチャ、Bピクチャの目標情報量を変更するものである。
実施の形態6による画像符号化装置の基本的な構成は、上記実施の形態1の図1で示したものと同様である。上記実施の形態1と異なる箇所としては、目標情報量演算部17が、符号化対象画像の動きベクトル情報に応じて、Iピクチャ、Pピクチャ及びBピクチャに割り当てるべき目標情報量を算出する。
次に動作について説明する。
以降では、説明の簡単のため、上記実施の形態1と同様にMPEG−2符号化方式で、各ピクチャの目標情報量を求める演算式もTM5を用いる場合を例に挙げる。なお、本実施の形態による画像符号化装置の基本的な動作は上記実施の形態1と同様であるので、異なる点である目標情報量演算部17による各ピクチャの目標情報量の演算処理について主に説明する。なお、HDTV信号について示すがSDTV信号においても同様に適用できるものである。
例えば、動きベクトルと各ピクチャにより発生する情報量とのデータを用いて、各ピクチャの目標情報量の変更が必要な動きの速い画像を規定する動きベクトルの大きさに関する閾値を求める条件式を動き補償予測部13に設定しておく。あるいは、外部から上記動きベクトルの閾値の設定を受け付ける構成を設けておく。
動き補償予測部13は、符号化対象ブロックから動きベクトルを検出すると、この大きさと予め設定した上記閾値とを比較して、当該ブロックの画像が動きの速い画像であるか否かを判定する。これにより、現在符号化対象となっている画像が動きの速い画像であると判定されると、動き補償予測部13は、その旨を動きベクトルと共に動きベクトル情報として目標情報量演算部17に出力する。
なお、上記実施の形態1で説明したような動き補償予測部13による動き検出機能を、画像特性演算部16に設け、上述した動きベクトルに基づく動きの速い画像の検出処理を画像特性演算部16で実行するように構成しても良い。
図6は、動きの速い画像を含む符号化対象画像の一例を示す図である。図示の例では、フレーム番号が1からK−1までが動きの遅い期間、KからNまでが動きの速い期間である。この図に沿って説明する。
フレーム番号が1からK−1までが符号化対象画像であるとき、動き補償予測部13は、これらの動きベクトルから動きの速い画像ではないものと判定し、その旨を目標情報量演算部17に出力する。
目標情報量演算部17は、動き補償予測部13から符号化対象画像が動きの速い画像ではないとの判定結果を受けると、Kp,Kb値を例えばKp=2.0、Kb=3.0として上記式(1)〜(3)に設定し各ピクチャの目標情報量を算出する。
なお、上記Kp,Kb値は、上記実施の形態1で示した方法で決定される値を用いても良い。つまり、動きの遅い期間では、上記実施の形態1で説明したように、他のピクチャと比較してIピクチャにより発生する情報量が相対的に小さくなることによって生じるIピクチャに同期したぼけを防止するため、通常値(Kp=1.0、Kb=1.4)よりKp,Kb値を大きくしてIピクチャに対する目標情報量の割合を多くする。
一方、フレーム番号がKからNまでが符号化対象画像であるとき、動き補償予測部13は、これらの動きベクトルから動きの速い画像であると判定し、その旨を目標情報量演算部17に出力する。
目標情報量演算部17では、動き補償予測部13によって符号化対象画像が動きの速い画像であると判定されると、Kp,Kb値を動きの遅い画像である場合より小さい、例えばKp=1.5、Kb=2.0として上記式(1)〜(3)に設定し各ピクチャの目標情報量を算出する。
動きの速い期間では、動きの遅い期間と比較してフレーム間の相関が低くなり、動き補償予測の効率が低下するとともに動きベクトルに費やされる情報量が多くなる。即ち、動きの速い期間においてIピクチャに対するPピクチャ、Bピクチャの発生情報量の割合が動きの遅い期間よりも大きくなる。
そこで、符号化対象画像に動きの速い画像が検出されたときには、Pピクチャ、Bピクチャに対する目標情報量を増加させるため、Kp,Kb値を動きの遅い期間と比較して小さくする。これにより、PピクチャやBピクチャにより発生する情報量が増加するため、Kp,Kb値を変更しない場合と比較して復号後の画質を向上させることができる。
また、動きの速い画像を検出した場合において、Pピクチャ、Bピクチャに多くの目標情報量を割り当てることができる限り、上述したKp,Kb値の代わりに他の数値を使用することも可能である。
以上のように、この実施の形態6によれば、動き補償予測部13が、符号化対象画像から動きの速い画像の有無を検出し、これにより動きの速い画像が検出されると、目標情報量演算部17が、当該画像の視覚的な特性に応じて、各ピクチャの目標情報量を算出するので、復号後に最適な画質を与える符号化処理を実現することができる。特に動きの速い画像においてIピクチャでの発生情報量が他のピクチャより大きくなることに起因する画質劣化の発生を防止することができる。
なお、上記実施の形態では、動きの速い画像が検出されると、目標情報量演算部17に予め設定されたKp,Kb値を用いる例を示したが、下記のように構成しても良い。
例えば、目標情報量演算部17が、動き補償予測部13から動きの速い画像を検出した旨を受信すると、当該画像の符号化結果についてのバッファ占有量をバッファ7から取得して、動きベクトルに費やされる情報量(動きの速さの度合)を算出する。
このあと、目標情報量演算部17が、動きベクトルに費やされる情報量とKp,Kb値の変更分とを関連付けたデータなどを用いて、動きベクトルに費やされる情報量に応じてKp,Kb値の変更分を決定し、各ピクチャの目標情報量を算出する。
例えば、より動きが速い(動きベクトルに費やされる情報量が大きい)画像になるほど、PピクチャやBピクチャの目標情報量を増加させるKp,Kb値を設定する。このように構成することで、さらに詳細に画質劣化に起因するファクタに対応することができる。
実施の形態7.
この実施の形態7では、上記実施の形態1で示した処理に加え、画像特性演算部16において静止画像が検出されたときに、Iピクチャ、Pピクチャ、Bピクチャの目標情報量を変更するものである。
実施の形態7による画像符号化装置の基本的な構成は、上記実施の形態1の図1で示したものと同様である。上記実施の形態1と異なる箇所としては、目標情報量演算部17が、符号化対象画像に静止画像が含まれるか否かに応じて、Iピクチャ、Pピクチャ及びBピクチャに割り当てるべき目標情報量を算出する。
次に動作について説明する。
以降では、説明の簡単のため、上記実施の形態1と同様にMPEG−2符号化方式で、各ピクチャの目標情報量を求める演算式もTM5を用いる場合を例に挙げる。なお、本実施の形態による画像符号化装置の基本的な動作は上記実施の形態1と同様であるので、異なる点である目標情報量演算部17による各ピクチャの目標情報量の演算処理について主に説明する。なお、HDTV信号について示すがSDTV信号においても同様に適用できるものである。
画像特性演算部16は、フレームごとの符号化対象ブロックとしてメモリ1から読み出した符号化対象画像(例えば、HDTV信号)に静止画像が含まれているか否かをモニタする。具体的には、画像特性演算部16が、画像特性パラメータとしてフレーム単位あるいはフレームをいくつかに分割した領域単位で、画素値の平均値と分散値、あるいは周波数成分を算出し、これらのフレーム間差分の絶対値和を求める。
これにより、画像特性演算部16は、例えば上記フレーム間差分絶対値和が予め設定した閾値よりも低いときに静止画像と判定する。なお、この閾値としては、例えば差分絶対値和と各ピクチャにより発生する情報量とのデータを用いて、各ピクチャの目標情報量の変更が必要な静止画像を規定するフレーム間差分絶対値和に関する閾値を求める条件式を設定しておく。あるいは、外部から上記フレーム間差分絶対値和の閾値の設定を受け付ける構成を設けておくようにしてもよい。
目標情報量演算部17は、画像特性演算部16が静止画像を検出しないとき、Kp,Kb値を例えばKp=2.0、Kb=3.0として上記式(1)〜(3)に設定し各ピクチャの目標情報量を算出する。
なお、上記Kp,Kb値は、上記実施の形態1で示した方法で決定される値を用いても良い。つまり、静止画像でないとき、上記実施の形態1で説明したように、他のピクチャと比較してIピクチャにより発生する情報量が相対的に小さくなることによって生じるIピクチャに同期したぼけを防止するため、通常値(Kp=1.0、Kb=1.4)よりKp,Kb値を大きくしてIピクチャに対する目標情報量の割合を多くする。
一方、上述のようにして画像特性演算部16が符号化対象画像から静止画像を検出すると、目標情報量演算部17は、静止画像が検出されないときより大きなKp,Kb値、例えばKp=3.0、Kb=4.0を上記式(1)〜(3)に設定し各ピクチャの目標情報量を算出する。
このようにKp,Kb値を増加させる理由を説明すると、静止画像では、Pピクチャ、Bピクチャにおいて動きベクトルに費やされる情報量も少なく、動き補償予測の効率も高い。このため、誤差信号も小さくDCT係数へ費やされる情報量も少ない。従って、PピクチャやBピクチャの発生情報量は非常に少なくなる。
しかしながら、静止画像では、他のピクチャと比較してIピクチャの目標情報量が相対的に少ない場合、これに起因するぼけが他の画像よりも顕著になる。そこで、静止画像が検出されないときより大きなKp,Kb値を設定して、Iピクチャの目標情報量を増加させる必要がある。
また、静止画像を検出した場合において、Iピクチャに多くの目標情報量を割り当てることができる限り、上述したKp,Kb値の代わりに他の数値を使用することも可能である。
以上のように、この実施の形態7によれば、画像特性演算部16が、符号化対象画像から静止画像の有無を検出し、これにより静止画像が検出されると、目標情報量演算部17が、当該画像の視覚的な特性に応じて、各ピクチャの目標情報量を算出するので、復号後に最適な画質を与える符号化処理を実現することができる。特に静止画像においてIピクチャの目標情報量が他のピクチャより小さいことに起因する画質劣化の発生を防止することができる。
また、上記実施の形態では、静止画像が検出されると、目標情報量演算部17に予め設定されたKp,Kb値を用いる例を示したが、下記のように構成しても良い。
画像特性演算部16が静止画像を検出するにあたり、その静止画像の精細さのレベルも規定して目標情報量演算部17に出力する。精細さのレベルとKp,Kb値の変更分とを関連付けたデータなどを用いて、目標情報量演算部17が、静止画像の精細さのレベルに応じてKp,Kb値の変更分を決定し、各ピクチャの目標情報量を算出する。
例えば、静止画像の精細さが高くなる(画素値の分散や周波数成分がより高い)ほど、Iピクチャの目標情報量を増加させるKp,Kb値を設定する。このように構成することで、さらに詳細に画質劣化に起因するファクタに対応することができる。
さらに、上記実施の形態1から7までに示した処理を適宜組み合わせて各ピクチャの目標情報量を演算するように構成しても良い。例えば、上記実施の形態1の構成を基本として、画像特性演算部16や目標情報量演算部17が、上記実施の形態2から7までの処理を符号化対象画像の画像特性に基づいて適応的に実施する。このように構成することで、さらに詳細に画質劣化に起因するファクタに対応することができる。
なお、上記実施の形態1から7ではMPEG−2による符号化を例に挙げたが、本発明はこれに限定されるものではない。つまり、I、P、Bピクチャのいずれかで符号化を行い、各ピクチャの目標情報量を求める演算において各ピクチャの量子化スケールコードの比率を規定するパラメータ値を使用する符号化処理であれば、MPEG−2以外であっても適用することができる。
1 メモリ、2 減算器、3 セレクタ、4 DCT(Discrete Cosine Transform)演算器(符号化部)、5 量子化器(符号化部)、6 可変長符号化部(符号化部)、7 バッファ、8 逆量子化器、9 逆DCT演算器、10 フレーム加算器、11 セレクタ、12 イントラ/インター判定部、13 動き補償予測部、14 フレームメモリ、15 量子化制御部、16 画像特性演算部、17 目標情報量演算部。