JP4150730B2 - 画像符号化装置、および画像符号化方法 - Google Patents

画像符号化装置、および画像符号化方法 Download PDF

Info

Publication number
JP4150730B2
JP4150730B2 JP2005036208A JP2005036208A JP4150730B2 JP 4150730 B2 JP4150730 B2 JP 4150730B2 JP 2005036208 A JP2005036208 A JP 2005036208A JP 2005036208 A JP2005036208 A JP 2005036208A JP 4150730 B2 JP4150730 B2 JP 4150730B2
Authority
JP
Japan
Prior art keywords
image
encoding
quantization step
quantization
sad
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005036208A
Other languages
English (en)
Other versions
JP2006222861A (ja
Inventor
玲子 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005036208A priority Critical patent/JP4150730B2/ja
Priority to US11/327,358 priority patent/US20060182175A1/en
Publication of JP2006222861A publication Critical patent/JP2006222861A/ja
Application granted granted Critical
Publication of JP4150730B2 publication Critical patent/JP4150730B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

本発明は、所定の量子化ステップ幅で画像符号化を行う画像符号化装置、および画像符号化方法に関するものである。
ITU−T H.264,ISO/IEC MPEG−2などの動画像符号化標準方式では、マクロブロックと呼ばれる符号化単位の特徴に応じて、個々に最適な符号化モードや量子化パラメータの選択を行うことで高画質な圧縮を行うことが可能である。具体的には、圧縮方式の最も基本的な量子化手段において、重要度が高いと判断されたブロックに対しては量子化ステップを小さくし、重要度が低いと判断されたブロックに対しては量子化ステップを大きくすることで、符号化効率および画質の改善を得る試みがなされている。
例えば、ISO/IEC MPEG−2のテストモデルであったTM5 (International Organisation for Standardisation, Test Model Editing Committee, 1993. Test Model 5. April. ISO-IEC/JTC1/SC29/WG11/N0400) (非特許文献1)においては、視覚特性を考慮した量子化ステップの修正方法が紹介されている。この方法は、人間の視覚特性が平坦部の歪に敏感であるという性質を考慮して、入力画像をマクロブロックに分割し、アクティビティと呼ばれるマクロブロック内の4つのサブブロックの画素の輝度分散の最小値を計算して、アクティビティが低い平坦部の量子化ステップの値を相対的に小さい値に修正する手法である。
International Organisation for Standardisation, Test Model Editing Committee, 1993. Test Model 5. April. ISO-IEC/JTC1/SC29/WG11/N0400.
非特許文献1の手法は、平坦部に対する量子化ステップを小さくすることで、知覚しやすい部分の量子化歪の軽減を行っている。具体的には、量子化ステップの増減に関して、入力画像の輝度分散値から単純な計算式を用いて画面内で相対的に量子化ステップを増減させている。すなわち、必ずしも人間の視覚特性に最適になるように量子化ステップを増減させているわけではない。このため、符号化効率は向上させることができるが、視認可能な画質の低下が問題となる。
本発明は、上記に鑑みてなされたものであって、符号化効率を低下させることなく人間の視覚特性に最適となるように符号化歪みを低減することのできる画像符号化装置を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、画像符号化装置であって、外部から画像を取得する画像取得手段と、前記画像取得手段が取得した前記画像を、予め設定されている量子化ステップで仮符号化する仮符号化手段と、前記量子化ステップにおける仮符号化後の画像と前記画像取得ステップにおいて取得した前記画像との符号化誤差を算出する符号化誤差算出手段と、前記画像取得手段が取得した前記画像のエッジ強度に基づいて、符号化後の画像における画像劣化が人間により視認され得る程度となる符号化誤差の閾値である視覚閾値を算出する視覚閾値算出手段と、前記符号化誤差算出手段によって算出された符号化誤差が前記視覚閾値以下の所定の範囲である視覚閾値範囲の外側の値である場合に、前記量子化ステップの幅を変更する量子化ステップ幅変更手段と、前記量子化ステップ幅変更手段によって変更された後の量子化ステップで、前記画像の符号化を行う符号化手段とを備え、前記視覚閾値算出手段は、SAD=exp(α×EAN+β)(SADは前記視覚閾値、EANは前記エッジ強度、α,βは任意の定数)により前記視覚閾値を算出すること、を特徴とする。
また、本発明の他の形態は、画像符号化方法であって、外部から画像を取得する画像取得ステップと、前記画像取得ステップにおいて取得した前記画像を、予め設定されている量子化ステップで仮符号化する仮符号化ステップと、前記量子化ステップにおける仮符号化後の画像と前記画像取得ステップにおいて取得した前記画像との符号化誤差を算出する符号化誤差算出ステップと、前記画像取得ステップにおいて取得した前記画像のエッジ強度に基づいて、符号化後の画像における画像劣化人間により視認され得る程度となる符号化誤差の閾値である視覚閾値を算出する視覚閾値算出ステップと、前記符号化誤差算出ステップにおいて算出された符号化誤差が前記視覚閾値以下の所定の範囲である視覚閾値範囲の外側の値である場合に、前記量子化ステップの幅を変更する量子化ステップ幅変更ステップと、前記量子化ステップ幅変更ステップにおいて変更された後の量子化ステップで、前記画像の符号化を行う符号化ステップとを有し、前記視覚閾値算出ステップは、SAD=exp(α×EAN+β)(SADは前記視覚閾値、EANは前記エッジ強度、α,βは任意の定数)により前記視覚閾値を算出すること、を特徴とする。
本発明にかかる画像符号化装置では、画像取得手段は、外部から画像を取得し、仮符号化手段は、画像取得手段が取得した画像を、予め設定されている量子化ステップで仮符号化し、符号化誤差算出手段は、量子化ステップにおける仮符号化後の画像と画像取得ステップにおいて取得した画像との符号化誤差を算出し、視覚閾値算出手段は、画像取得手段が取得した画像のエッジ強度に基づいて、符号化後の画像における画像劣化が人間により視認され得る程度となる符号化誤差の閾値である視覚閾値を算出し、量子化ステップ幅変更手段は、符号化誤差算出手段によって算出された符号化誤差が前記視覚閾値以下の所定の範囲である視覚閾値範囲の外側の値である場合に、量子化ステップの幅を変更し、符号化手段は、量子化ステップ幅変更手段によって変更された後の量子化ステップで、画像の符号化を行い、さらに、上記の視覚閾値算出手段が、SAD=exp(α×EAN+β)(SADは視覚閾値、EANはエッジ強度、α,βは任意の定数)により視覚閾値を算出することで、符号化効率を低減させることなく、人間の視覚特性においてより適切に符号化歪みを低減することができるという効果を奏する。
また、本発明の他の形態にかかる画像符号化方法では、画像取得ステップにおいて、外部から画像を取得し、仮符号化ステップにおいて、画像取得ステップにおいて取得した画像を、予め設定されている量子化ステップで仮符号化し、符号化誤差算出ステップにおいて、量子化ステップにおける仮符号化後の画像と画像取得ステップにおいて取得した画像との符号化誤差を算出し、視覚閾値算出ステップにおいて、画像取得ステップにおいて取得した画像のエッジ強度に基づいて、符号化後の画像における画像劣化が人間により視認され得る程度となる符号化誤差の閾値である視覚閾値を算出し、量子化ステップ幅変更ステップにおいて、前記符号化誤差算出ステップにおいて算出された前記符号化誤差が前記視覚閾値以下の所定の範囲である視覚閾値範囲の外側の値である場合に、量子化ステップの幅を変更し、符号化ステップにおいて、量子化ステップ幅変更ステップにおいて変更された後の量子化ステップで、画の符号化を行い、さらに、上記の視覚閾値算出ステップが、SAD=exp(α×EAN+β)(SADは視覚閾値、EANはエッジ強度、α,βは任意の定数)により視覚閾値を算出するので、符号化効率を低減させることなく、人間の視覚特性においてより適切に符号化歪みを低減することができるという効果を奏する。
以下に、本発明にかかる画像符号化装置、および画像符号化方法の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
(実施の形態1)
図1は、実施の形態1にかかる画像符号化装置10の機能構成を示す全体ブロック図である。画像符号化装置10は、符号化部115と、多重化器116と、出力バッファ117と、量子化制御器120とを備えている。
符号化部115は、入力画像信号100として例えばフレーム単位で画像信号を取得する。そして、画像信号に対してエントロピー符号化を行う。エントロピー符号化により生成された各符号は、符号化データ118として出力される。
なお、本実施の形態にかかる符号化部115は、特許請求の範囲に記載の仮符号化手段および符号化手段に対応する。符号化データ118は、多重化器116において多重化された後、出力バッファ117により平滑化される。こうして出力バッファ117から出力される符号化データは、図示しない伝送系または蓄積系へ送出される。
量子化制御器120は、符号化部115の制御を行う。具体的には、量子化ステップ幅の初期値である基準量子化ステップ幅123を外部より取得する。さらに、入力画像信号100を解析し、符号化歪すなわち、符号化誤差を劣化知覚歪閾値以下とするような量子化ステップ幅を決定する。そして、決定した量子化ステップ幅121を符号化部115に出力し、符号化部115に対し当該量子化ステップ幅での符号化を行わせる。ここで劣化知覚歪閾値とは、人間が視覚により認識し得るようになる符号化誤差の境界値である。
図2は、量子化制御器120の詳細な機能構成を示すブロック図である。量子化制御器120は、劣化知覚歪閾値計算器201と、量子化ステップ制御器202と、符号化誤差算出器205とを有している。
劣化知覚歪閾値計算器201は、例えば1フレーム単位の入力画像信号100を例えばマクロブロック単位に分割する。そして、各マクロブロックの劣化知覚歪閾値203を計算する。ここで、劣化知覚歪閾値203とは、人間の視覚に与える画像劣化に対応する値である。すなわち、符号化誤差の値が劣化知覚歪閾値203よりも大きな値となると、人間が視覚により認識し得る画質の劣化が生じる。
なお、本実施の形態にかかる劣化知覚歪閾値は、特許請求の範囲に記載の視覚閾値に対応する。また、本実施の形態にかかる劣化知覚歪閾値計算器201は、特許請求の範囲に記載の視覚閾値算出手段に対応する。
劣化知覚歪閾値203は、具体的には、以下の式により算出される。
d=α×log(EAN)+β ・・・(式1)
SADD=exp(d) ・・・(式2)
ここで、SADDは劣化知覚歪閾値203である。また、EANは処理対象となっているマクロブロック内のエッジ強度である。
エッジ強度は以下の処理により算出される。すなわち、処理対象となっているマクロブロック内の各画素のエッジ強度の平均値を算出する。そして、フレームに含まれる各マクロブロックのエッジ強度の平均値の最大値を1とし、各マクロブロックのエッジ強度を0から1に正規化する。なお、本実施の形態においては、マクロブロック内の各画素のエッジ強度の平均値をエッジ強度と称する。
また、αおよびβは正の定数である。例えば、実際に画像を符号化した際に劣化を知覚したときの符号化歪の値から実験的に求めた値である。
図3は、(式1)に示すエッジ強度(EAN)と劣化知覚歪閾値(SADD)の関係を示すグラフを示している。図3のグラフに示す曲線400は、劣化知覚歪閾値(SADD)を示している。図3のグラフに示すように、エッジ強度が大きくなるほど、すなわちエッジが少ないマクロブロックほど劣化知覚歪閾値(SADD)が大きくなる。
そこで、符号化誤差(SADQP)が曲線400で示される劣化知覚歪閾値(SADD)よりも小さくなるように量子化ステップ幅を変更することにより、人間が視覚により認識し得る画質の劣化を低減することができる。
再び説明を図2に戻す。符号化誤差算出器205は、符号化部115から符号化データ118を取得する。さらに、外部から入力画像信号100を取得する。そして、入力画像信号100および符号化データ118に基づいて符号化誤差(SADQP)を算出する。符号化誤差122は、量子化ステップ制御器202に出力される。
本実施の形態においては、符号化誤差算出器205は、符号化誤差(SADQP)として現画像と符号化後の絶対差分和を算出する。なお、符号化誤差(SADQP)は絶対差分和に限定されるものではなく、他の例としては絶対二乗誤差であってもよい。
量子化ステップ制御器202は、符号化部115に対し、基準量子化ステップ幅123で符号化処理を行わせる。さらに、量子化ステップ制御器202は、劣化知覚歪閾値203および符号化誤差122を取得する。そして、量子化ステップ制御器202は、符号化誤差122が劣化知覚歪閾値203より小さくなるまで量子化ステップ幅121の値を変更し、変更後の量子化ステップ幅において符号化部115に符号化処理を行わせる。
なお、本実施の形態にかかる量子化ステップ制御器202は、特許請求の範囲に記載の量子化ステップ幅変更手段に対応する。
図4は、符号化部115の詳細な機能構成を示すブロック図である。符号化部115は、減算器101と、直交変換器104と、量子化器106と、エントロピー符号化器108と、逆量子化器109と、逆直交変換器110と、加算器111と、フレームメモリ/予測画像生成器113とを有している。
減算器101は、入力画像信号100と予測画像信号102との差分を算出し、予測誤差信号103を生成する。
直交変換器104は、生成された予測誤差信号103に対して、直交変換、例えば離散コサイン変換(DCT)を施す。直交変換器104では直交変換係数105、例えばDCT係数情報が得られる。
量子化器106は、直交変換係数105を量子化し、量子化直交変換係数107を得る。量子化直交変換係数107は、エントロピー符号化器108および逆量子化器109の双方に出力される。
量子化直交変換係数107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次施され、予測誤差信号103と同様の信号とされた後、加算器111に送られる。加算器111は、逆直交変換器110から入力された信号と予測画像信号102とを加算することにより、局部復号画像信号112を生成する。局部復号画像信号112は、フレームメモリ/予測画像生成器113に入力される。
フレームメモリ/予測画像生成器113は、入力画像信号100及び局部復号画像信号112からある予測モード情報に基づく予測画像信号を生成する。具体的には、フレームメモリ/予測画像生成器113は、加算器111からの局部復号画像信号112を一旦蓄積する。そして、フレーム内のブロック毎に入力画像信号100とフレームメモリ/予測画像生成器113に蓄えられた局部復号画像信号112との間のマッチング(例えば、ブロックマッチング)を行い、動きベクトルを検出する。そして、この動きベクトルで補償された局部画像信号を用いて予測画像信号を作成する。
フレームメモリ/予測画像生成器113において生成された予測画像信号102は、選択された予測画像信号の動きベクトル情報/予測モード情報114とともにフレームメモリ/予測画像生成器113より出力される。
エントロピー符号化器108は、量子化直交変換係数107、動きベクトル情報/予測モード情報114に基づいて、エントロピー符号化を行う。なお、本実施の形態にかかるエントロピー符号化器108は、マクロブロック単位で符号化を行うが、符号化を行う単位はこれに限定されるものではなく、他の単位で行ってもよい。
図5は、量子化制御器120による量子化制御処理を示すフローチャートである。量子化制御器120は、まず入力画像信号100を取得する。そして、取得した入力画像信号100に基づいて、マクロブロックの劣化知覚歪閾値203を算出する(ステップS100)。
次に、量子化制御器120は、外部から取得した基準量子化ステップ幅123を仮符号化における量子化ステップ幅として設定する(ステップS102)。次に、符号化部115は、設定された量子化ステップ幅において仮符号化を行う(ステップS104)。次に、仮符号化における符号化誤差(SADQP)を算出する(ステップS106)。
次に、符号化誤差(SADQP)と劣化知覚歪閾値(SADD)とを比較する。符号化誤差(SADQP)が劣化知覚歪閾値(SADD)以上である場合には(ステップS108,No)、量子化ステップの幅を予め定めた量だけ狭くする(ステップS120)。そして、符号化部115は、ステップS120において変更された後の量子化ステップ幅において再度仮符号化を行う(ステップS104)。
符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも小さくなるまで(ステップS108,Yes)、ステップS104からステップS120までの処理を繰り返す。
そして、量子化制御処理により符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも小さくなると、このときの量子化ステップ幅を当該マクロブロックに対する量子化ステップ幅として決定する(ステップS110)。以上で、量子化制御処理が完了する。
そして、符号化部115は量子化制御処理により決定された量子化ステップ幅により符号化された結果を出力する。このように、劣化知覚歪閾値(SADD)よりも小さい量子化ステップ幅において符号化を行うことにより、人間が視覚により認識し得る画像の劣化を低減することができる。
図6は、量子化制御処理をより詳細に説明するための図である。図6に示すように符号化誤差(SADQP)の値が劣化知覚歪閾値(SADD)以上である場合には、符号化により人間の視覚に認識し得る程度の歪みが発生する。この場合には、歪みを小さくする必要がある。そこで、ステップS120において量子化ステップの幅を一定量だけ小さくする。符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも小さくなるまでこの処理を繰り返すことにより、人間の視覚に認識し得る程度の歪みが生じない程度になるまで、すなわち符号化誤差(SADQP)が劣化知覚歪閾値SADD)よりも小さくなるまで量子化ステップの幅を狭くすることができる。
なお、本実施の形態においては、符号化誤差(SADQP)が劣化知覚歪閾値203より小さな値となるまで、量子化ステップ幅を一定量だけ狭くし、符号化を行うという処理を繰り返したが、最終的に符号化誤差(SADQP)が劣化知覚歪閾値203より小さな値なるような量子化ステップ幅を決定できればよく、その方法は本実施の形態に限定されるものではない。
図7は、実施の形態1に係る画像符号化装置10のハードウェア構成を示す図である。画像符号化装置10は、ハードウェア構成として、画像符号化装置10における画像符号化処理を実行する画像符号化プログラムなどが格納されているROM52と、ROM52内のプログラムに従って画像符号化装置10の各部を制御するCPU51と、画像符号化装置10の制御に必要な種々のデータを記憶するRAM53と、ネットワークに接続して通信を行う通信I/F57と、各部を接続するバス62とを備えている。
先に述べた画像符号化装置10における画像符号化プログラムは、本実施の形態に特徴的な量子化制御処理を実行する量子化制御プログラムを含むプログラムである。画像符号化プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フロッピー(R)ディスク(FD)、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。
この場合には、画像符号化プログラムは、画像符号化装置10において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、本実施の形態の画像符号化プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。
(実施の形態2)
図8は、実施の形態2にかかる画像符号化装置10の全体構成を示すブロック図である。実施の形態2にかかる画像符号化装置10は、実施の形態1にかかる画像符号化装置10の構成に加えて、さらに符号化制御器119を備えている。
符号化制御器119は、出力バッファ117のバッファ量125を監視する。そして、バッファ量に基づいて、符号化単位毎の符号量の割り当てを行う。そして、割り当てた符号量に応じたステップ幅である基準量子化ステップ幅124を量子化制御器120に出力する。なお、本実施の形態にかかる符号化制御器119は、特許請求の範囲に記載のデータ量監視手段と、量子化ステップ幅決定手段とに対応する。
図9は、基準量子化ステップ幅と劣化知覚歪閾値(SADD)の関係を示すグラフとを示している。図9に示す曲線410,412,414はそれぞれ劣化知覚歪閾値(SADD)を示している。図9に示すように、基準量子化ステップ幅が小さくなるにつれて、劣化知覚歪閾値(SADD)は、曲線410から曲線414へと小さくなる。
符号化単位に割り当てられた符号量が多い場合には、符号化制御器119は、基準量子化ステップ幅を狭く設定する。このため、劣化知覚歪閾値(SADD)は小さくなる。すなわち、人間の視覚により認識し得る画像の劣化を低減させることができる。一方、符号化単位に割り当てられた符号量が少ない場合には、基準量子化ステップ幅が広く設定される。このため、劣化知覚歪閾値が大きくなる。
このように、符号化制御器119により割り当てられた符号量に基づいて定まる基準量子化ステップ幅124により、劣化知覚歪閾値(SADD)の値を決定することができる。また、符号量はバッファ量に基づいて符号量を決定する。すなわち、バッファ量により、劣化知覚歪閾値(SADD)の値を決定することができる。
図10は、実施の形態にかかる量子化制御器120による量子化制御処理を示すフローチャートである。まず、符号化制御器119は、バッファ量125に基づいて基準量子化ステップ幅を決定する(ステップS202)。次に、量子化制御器120は、入力画像信号100および基準量子化ステップ幅124に基づいて、劣化知覚歪閾値(SADD)の算出式(式1)の係数αの値を決定する(ステップS204)。
具体的には、式3により係数αを算出する。
α=a×QP_first+b (式3)
ここで、QP_firstは、基準量子化ステップ幅である。
図11は、基準量子化ステップ幅と係数αとの関係を示すグラフを示している。このように、基準量子化ステップ幅が大きくなるほどαの値が大きくなり、結果として(式1),(式2)により算出される劣化知覚歪閾値(SADD)が大きくなる。
なお、本実施の形態においては、劣化知覚歪閾値(SADD)の算出式の係数αおよびβのうち、βを固定値とし、αを適応的に変動させることとしたが、他の例としては、αを固定値とし、βを適応的に変更させてもよい。
再び説明を図10に戻す。αの値が決定されると、次に、量子化制御器120は、フラグdFlagをFalseにセットする。また、countを0にセットする(ステップS206)。次に、量子化制御器120は、入力画像信号100に基づいて、マクロブロックの劣化知覚歪閾値(SADD)を算出する(ステップS208)。
次に、符号化部115は、量子化制御器120により設定された量子化ステップ幅、すなわち基準量子化ステップ幅において仮符号化を行う(ステップS210)。次に、仮符号化における符号化誤差(SADQP)を算出する(ステップS212)。そして、countを1インクリメントする(ステップS214)。
次に、符号化誤差(SADQP)と劣化知覚歪閾値(SADD)とを比較する。符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも大きい場合には(ステップS216,No)、量子化ステップの幅を予め定めた量だけ狭くする(ステップS220)。さらに、dFlagにfalseをセットする(ステップS222)。そして、符号化部115は、より狭くなった量子化ステップ幅において再度仮符号化を行う(ステップS210)。
一方、符号化誤差(SADQP)が劣化知覚歪閾値(SADD)以下である場合には(ステップS216,Yes)countが1であるか、またはdFlagにfalseがセットされかつ基準量子化ステップ幅における符号化誤差(SADQP_first)が劣化知覚歪閾値(SADD)よりも小さい場合には(ステップS218,Yes)、量子化ステップの幅を予め定めた量だけ広くする(ステップS230)。さらに、dFlagにtrueをセットする(ステップS232)。そして、符号化部115はより広くなった量子化ステップ幅において再度符号化を行う(ステップS210)。
そして、符号化誤差(SADQP)が劣化知覚歪閾値(SADD)以下であり、かつcountが1でない場合(ステップS218,No)、または、符号化誤差(SADQP)が劣化知覚歪閾値(SADD)以下であり、dFlagにfalseがセットされ、かつ初期量子化ステップ幅における符号化誤差(SADQP_first)が劣化知覚歪閾値(SADD)以上である場合には(ステップS218,No)、量子化制御処理が完了する。そして、符号化部115は量子化制御処理により決定された量子化ステップ幅により符号化された結果を出力する。
以上のように、量子化制御処理は、符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも小さく、かつできるだけ劣化知覚歪閾値(SADD)に近い値となるように量子化ステップ幅を増減しながら繰り返される。
図12を参照しつつ量子化制御処理についてより具体的に説明する。図12に示す点310は、マクロブロックAにおける初期量子化ステップ幅における符号化誤差(SADQP)を示している。このように、初期量子化パラメータで符号化した際の符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも大きい場合には、初期量子化パラメータで符号化した際の符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも小さくなるまで量子化ステップ幅を減じる。
さらに、符号量を低減させる観点からは、できるだけ劣化知覚歪閾値(SADD)に近い値とするのが好ましい。すなわち、符号化誤差(SADQP)が図12に示す点312のように、劣化知覚歪閾値(SADD)以下であって、かつ劣化知覚歪閾値(SADD)に近い値となるような量子化ステップ幅を決定するのが好ましい。
一方、図12に示す点320は、マクロブロックBにおける基準量子化ステップ幅における符号化誤差(SADQP)を示している。このように、基準量子化パラメータで符号化した際の符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも小さい場合には、基準量子化ステップ幅で符号化した際の符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも小さくかつ劣化知覚歪閾値(SADD)に最も近い値となるような量子化ステップ幅を決定する。
このように、符号化誤差(SADQP)が劣化知覚歪閾値(SADD)よりも小さい場合には、符号化誤差(SADQP)が劣化知覚歪閾値(SADD)に最も近い値となるように量子化ステップ幅を広くすることにより、劣化を知覚しにくい範囲内で符号量を小さく抑えることができる。
さらに、量子化ステップ幅を広くすることにより符号量を小さくした分、他のマクロフロックにおける量子化ステップ幅を狭くすることもできる。
なお、本実施の形態においては、量子化ステップを所定量ずつ増減させながら劣化知覚歪閾値(SADD)に最も近い値となるように繰り返し処理を行ったが、劣化知覚歪閾値(SADD)に最も近い値となればよく、その方法は本実施の形態に限定されるものではない。
また、本実施の形態においては、劣化知覚歪閾値(SADD)より小さく、かつ劣化知覚歪閾値(SADD)に最も近い値となるように量子化ステップの増減を繰り返すこととしたが、符号化を高速に行う観点からは、量子化ステップの増減回数をN回に制限してもよい。
実施の形態1においては、劣化知覚歪閾値を求める際に、(式1)の係数α,βをそれぞれ一意に設定し、(式1)より算出される劣化知覚閾値(SAD)以下になるように量子化ステップ幅を決定し、当該量子化ステップ幅において符号化を行うため、出力される符号化ストリームの符号量は画像の特徴により異なるものとなる。これに対し、実施の形態2にかかる量子化制御処理においては、(式1)の係数α,βを符号化制御器119から与えられる基準量子化ステップ幅124に基づいて適応的に変更することにより、符号量を制御することができる。すなわち、人間の視覚により認識し得る符号化歪みを低減しつつかつ符号量を制御することができる。
以上、本発明を実施の形態を用いて説明したが、上記実施の形態に多様な変更または改良を加えることができる。
そうした第1の変更例としては、本実施の形態においては、劣化知覚歪閾値SADをマクロブロック内のエッジ強度の平均値より算出したが、この方法に限らず、マクロブロックの輝度分散値を用いるなど、別の手法を用いて算出してもよい。
また、第2の変更例としては、本実施の形態においては、符号化単位をマクロブロックとし、マクロブロック毎に予測モード及び量子化パラメータの対を決定する例について記述したが、符号化単位は複数のマクロブロック単位や、スライス、フィールド、フレーム、ピクチャ、あるいはGOPなど他の単位であってもよい。
また、本実施形態においては動画像符号化における量子化制御処理について説明したが、これにかえて、量子化制御処理を静止画像符号化や、多視点画像の符号化に適用してもよい。
実施の形態1にかかる画像符号化装置10の機能構成を示す全体ブロック図である。 量子化制御器120の詳細な機能構成を示すブロック図である。 (式1)に示すエッジ強度(EAN)と劣化知覚歪閾値(SADD)の関係を示すグラフを示す図である。 符号化部115の詳細な機能構成を示すブロック図である。 量子化制御器120による量子化制御処理を示すフローチャートである。 量子化制御処理をより詳細に説明するための図である。 実施の形態1に係る画像符号化装置10のハードウェア構成を示す図である。 実施の形態2にかかる画像符号化装置10の全体構成を示すブロック図である。 基準量子化ステップ幅と劣化知覚歪閾値(SADD)の関係を示すグラフとを示す図である。 実施の形態2にかかる量子化制御器120による量子化制御処理を示すフローチャートである。 初期量子化ステップ幅と係数αとの関係を示すグラフを示す図である。 量子化制御処理についてより具体的に説明するための図である。
符号の説明
10 画像符号化装置
51 CPU
52 ROM
53 RAM
57 通信I/F
62 バス
100 入力画像信号
101 減算器
102 予測画像信号
103 予測誤差信号
104 直交変換器
105 直交変換係数
106 量子化器
107 量子化直交変換係数
108 エントロピー符号化器
109 逆量子化器
110 逆直交変換器
111 加算器
112 局部復号画像信号
113 フレームメモリ/予測画像生成器
114 ベクトル情報/予測モード情報
115 符号化部
116 多重化器
117 出力バッファ
118 符号化データ
119 符号化制御器
120 量子化制御器
121 量子化ステップ幅
122 符号化誤差
123 初期量子化ステップ幅
124 基準量子化ステップ幅
125 バッファ量
201 劣化知覚歪閾値計算器
202 量子化ステップ制御器
203 劣化知覚歪閾値
205 符号化誤差算出器

Claims (6)

  1. 外部から画像を取得する画像取得手段と、
    前記画像取得手段が取得した前記画像を、予め設定されている量子化ステップで仮符号化する仮符号化手段と、
    前記量子化ステップにおける仮符号化後の画像と前記画像取得ステップにおいて取得した前記画像との符号化誤差を算出する符号化誤差算出手段と、
    前記画像取得手段が取得した前記画像のエッジ強度に基づいて、符号化後の画像における画像劣化が人間により視認され得る程度となる符号化誤差の閾値である視覚閾値を算出する視覚閾値算出手段と、
    前記符号化誤差算出手段によって算出された符号化誤差が前記視覚閾値以下の所定の範囲である視覚閾値範囲の外側の値である場合に、前記量子化ステップの幅を変更する量子化ステップ幅変更手段と、
    前記量子化ステップ幅変更手段によって変更された後の量子化ステップで、前記画像の符号化を行う符号化手段と
    を備え
    前記視覚閾値算出手段は、SAD=exp(α×EAN+β)(SADは前記視覚閾値、EANは前記エッジ強度、α,βは任意の定数)により前記視覚閾値を算出すること、
    特徴とする画像符号化装置。
  2. 前記符号化手段が符号化した後の前記画像を保持するバッファと、
    前記バッファが保持する前記画像のデータ量を監視するデータ量監視手段と
    をさらに備え、
    前記視覚閾値算出手段は、前記データ量監視手段によって決定された前記データ量に基づいて、前記αおよびβのうち少なくとも一方の値を決定することを特徴とする請求項に記載の画像符号化装置。
  3. 前記データ量監視手段が監視した前記データ量に基づいて前記仮符号化手段が仮符号化を行うときの量子化ステップの幅を決定する量子化ステップ幅決定手段と
    をさらに備え、
    前記視覚閾値算出手段は、前記量子化ステップ幅決定手段によって決定された前記量子化ステップ幅に基づいて、前記αおよびβのうち少なくとも一方の値を決定することを特徴とする請求項に記載の画像符号化装置。
  4. 外部から画像を取得する画像取得ステップと、
    前記画像取得ステップにおいて取得した前記画像を、予め設定されている量子化ステップで仮符号化する仮符号化ステップと、
    前記量子化ステップにおける仮符号化後の画像と前記画像取得ステップにおいて取得した前記画像との符号化誤差を算出する符号化誤差算出ステップと、
    前記画像取得ステップにおいて取得した前記画像のエッジ強度に基づいて、符号化後の画像における画像劣化人間により視認され得る程度となる符号化誤差の閾値である視覚閾値を算出する視覚閾値算出ステップと、
    前記符号化誤差算出ステップにおいて算出された符号化誤差が前記視覚閾値以下の所定の範囲である視覚閾値範囲の外側の値である場合に、前記量子化ステップの幅を変更する量子化ステップ幅変更ステップと、
    前記量子化ステップ幅変更ステップにおいて変更された後の量子化ステップで、前記画像の符号化を行う符号化ステップとを有し、
    前記視覚閾値算出ステップは、SAD=exp(α×EAN+β)(SADは前記視覚閾値、EANは前記エッジ強度、α,βは任意の定数)により前記視覚閾値を算出すること、
    特徴とする画像符号化方法。
  5. 前記符号化手段が符号化した後の前記画像をバッファに保持する保持ステップと、
    前記保持ステップによりバッファに保持された前記画像のデータ量を監視するデータ量監視ステップと
    をさらに有し、
    前記視覚閾値算出ステップは、前記データ量監視ステップによって決定された前記データ量に基づいて、前記αおよびβのうち少なくとも一方の値を決定することを特徴とする請求項に記載の画像符号化方法。
  6. 前記データ量監視ステップが監視した前記データ量に基づいて前記仮符号化ステップが仮符号化を行うときの量子化ステップの幅を決定する量子化ステップ幅決定ステップと
    をさらに有し、
    前記視覚閾値算出ステップは、前記量子化ステップ幅決定ステップによって決定された前記量子化ステップ幅に基づいて、前記αおよびβのうち少なくとも一方の値を決定することを特徴とする請求項5に記載の画像符号化方法。
JP2005036208A 2005-02-14 2005-02-14 画像符号化装置、および画像符号化方法 Expired - Fee Related JP4150730B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005036208A JP4150730B2 (ja) 2005-02-14 2005-02-14 画像符号化装置、および画像符号化方法
US11/327,358 US20060182175A1 (en) 2005-02-14 2006-01-09 Image encoding apparatus, image encoding method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005036208A JP4150730B2 (ja) 2005-02-14 2005-02-14 画像符号化装置、および画像符号化方法

Publications (2)

Publication Number Publication Date
JP2006222861A JP2006222861A (ja) 2006-08-24
JP4150730B2 true JP4150730B2 (ja) 2008-09-17

Family

ID=36815576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005036208A Expired - Fee Related JP4150730B2 (ja) 2005-02-14 2005-02-14 画像符号化装置、および画像符号化方法

Country Status (2)

Country Link
US (1) US20060182175A1 (ja)
JP (1) JP4150730B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101394151B1 (ko) * 2007-10-04 2014-05-14 삼성전자주식회사 시감 특성을 이용한 영상 부호화 장치 및 방법

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5291282A (en) * 1990-04-19 1994-03-01 Olympus Optical Co., Ltd. Image data coding apparatus and method capable of controlling amount of codes
JP3165296B2 (ja) * 1992-12-25 2001-05-14 三菱電機株式会社 フレーム間符号化処理方式及びフレーム間符号化処理方法及び符号化制御方式
WO1995013682A1 (en) * 1993-11-08 1995-05-18 Sony Corporation Animation encoding method, animation decoding method, animation recording medium and animation encoder
US6456655B1 (en) * 1994-09-30 2002-09-24 Canon Kabushiki Kaisha Image encoding using activity discrimination and color detection to control quantizing characteristics
JPH10164581A (ja) * 1996-12-03 1998-06-19 Sony Corp 画像信号符号化方法及び装置、信号記録媒体
US6961375B1 (en) * 1997-02-06 2005-11-01 Sony Corporation Picture coding device and method, picture transmitting device and method and recording medium
JP3232052B2 (ja) * 1997-10-31 2001-11-26 松下電器産業株式会社 画像復号化方法
WO1999043163A2 (en) * 1998-02-20 1999-08-26 Koninklijke Philips Electronics N.V. Method and device for coding a sequence of pictures
EP1473943B1 (en) * 1998-03-05 2009-04-08 Panasonic Corporation Image coding method, image coding and decoding method, image coding apparatus, and image recording and reproduction apparatus
DE10300048B4 (de) * 2002-01-05 2005-05-12 Samsung Electronics Co., Ltd., Suwon Verfahren und Vorrichtung zur Bildcodierung und -decodierung
US7274741B2 (en) * 2002-11-01 2007-09-25 Microsoft Corporation Systems and methods for generating a comprehensive user attention model
JP4189358B2 (ja) * 2004-06-17 2008-12-03 株式会社東芝 画像符号化装置及び方法

Also Published As

Publication number Publication date
US20060182175A1 (en) 2006-08-17
JP2006222861A (ja) 2006-08-24

Similar Documents

Publication Publication Date Title
US11575906B2 (en) Image coding device, image decoding device, image coding method, and image decoding method
US10750177B2 (en) Image coding apparatus, image coding method, and program, and image decoding apparatus, image decoding method, and program
JP4747975B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
JP4529919B2 (ja) 適応量子化装置及び適応量子化プログラム
JP4901772B2 (ja) 動画像符号化方法及び動画像符号化装置
KR101246294B1 (ko) 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR102244315B1 (ko) 영상 부호화 방법 및 장치
WO2014139396A1 (en) Video coding method using at least evaluated visual quality and related video coding apparatus
EP2806639A1 (en) Video image decoding device, video image and coding device, video image decoding method and video image coding method
JP5133290B2 (ja) 動画像符号化装置および復号装置
JP2007281949A (ja) 画像符号化装置、画像符号化復号システム、画像符号化方法、および画像符号化復号方法
JP4254147B2 (ja) 画像情報符号化方法及び装置、並びにプログラム及び記録媒体
JPH09322176A (ja) 符号化モード選択方法、動画像符号化装置、符号化方法、記録方法、及び伝送方法
JP2008004984A (ja) 画像理装置および方法、プログラム、並びに記録媒体
JP4150730B2 (ja) 画像符号化装置、および画像符号化方法
JP5295089B2 (ja) 画像符号化装置
JP4942208B2 (ja) 符号化装置
JP2020005228A (ja) ループフィルタ制御装置、画像符号化装置、画像復号装置、及びプログラム
JP4325536B2 (ja) 動画像符号化装置及び方法
JP5917117B2 (ja) 画像符号化装置及び画像符号化方法
JP6270293B1 (ja) 動画像符号化装置および動画像符号化方法
JP2008153802A (ja) 動画像符号化装置及び動画像符号化プログラム
KR20150009313A (ko) 블록별 양자화 레벨을 이용한 인코딩 방법 및 그 시스템
JP2000165878A (ja) 符号化装置及び符号化方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080624

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080630

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110704

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110704

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees