JP2012501095A - インタレース画像の符号化方法、符号化装置、及び符号化プログラム - Google Patents

インタレース画像の符号化方法、符号化装置、及び符号化プログラム Download PDF

Info

Publication number
JP2012501095A
JP2012501095A JP2011509750A JP2011509750A JP2012501095A JP 2012501095 A JP2012501095 A JP 2012501095A JP 2011509750 A JP2011509750 A JP 2011509750A JP 2011509750 A JP2011509750 A JP 2011509750A JP 2012501095 A JP2012501095 A JP 2012501095A
Authority
JP
Japan
Prior art keywords
frequency
weighting
coefficient
encoding
vertical direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011509750A
Other languages
English (en)
Other versions
JP5255116B2 (ja
Inventor
庸介 高田
Original Assignee
ジーブイビービー ホールディングス エス.エイ.アール.エル.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジーブイビービー ホールディングス エス.エイ.アール.エル. filed Critical ジーブイビービー ホールディングス エス.エイ.アール.エル.
Publication of JP2012501095A publication Critical patent/JP2012501095A/ja
Application granted granted Critical
Publication of JP5255116B2 publication Critical patent/JP5255116B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、簡易で効果的なインタレース画像の符号化方法、符号化装置、及び符号化プログラムを提供することを目的とする。本符号化方法は、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップ(S101)と、周波数帯域毎に周波数領域の係数に重み付けする重み付けステップ(S102)と、を含む。ここで、重み付けステップでは、所定の周波数を超える垂直方向の周波数帯域の係数の重み付けに用いる重み付け係数は、所定の周波数を超える水平方向の周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上となる。
【選択図】図7

Description

本発明は、インタレース画像のフレームベース符号化処理を行う符号化方法、符号化装置、及び符号化プログラムに関する。
インタレース方式のビデオカメラなどを用いた動画撮影では、データレートを増やさずに、滑らかな動きを実現し、また、フリッカーを低減するため、一般に、1フレームの画像を1ラインおきにトップフィールドとボトムフィールドの二つのフィールドに分割し、それぞれのフィールドを水平方向に走査して、例えば、毎秒50〜60フィールドを伝送するインタレース走査を行って、動画を撮影している。このようにして撮影されたインタレース構造の映像信号(以後、「インタレース画像」と呼ぶ)の符号化方式として、フィールド毎に個々のインタレース画像を符号化する符号化方式(以後、「フィールドベース符号化」と呼ぶ)と、フレーム毎に相前後する2枚のインタレース画像から合成したノンインタレース画像を符号化する符号化方式(以後、「フレームベース符号化」と呼ぶ)とがある。
フィールド毎のインタレース画像は走査線が飛び飛びであるので、走査線が連続したフレーム毎の相前後する2枚のインタレース画像を合成したノンインタレース画像に比べ垂直方向の画素相関が弱い。したがって、圧縮効率の面ではフィールドベース符号化と比較してフレームベース符号化が一般的に有利である。
しかしながら、被写体の動き量が大きい場合、1フレームのノンインタレース画像を構成する二つのフィールドのインタレース画像の間で、画像データがリークすることがある。このようなノンインタレース画像をフィールド毎に再生するとリークの部分に特にちらちらするノイズが発生する。例えば、第N番目のフィールドのインタレース画像と、その次の第N+1番目のフィールドのインタレース画像の二つのフィールドのインタレース画像とを合成して得られるフレームのノンインタレース画像の例について考える。図16に示すように、二つのフィールドのインタレース画像の間で被写体が左方向へ移動した場合、1フレームのノンインタレース画像上で被写体のエッジ部分が走査線毎に複数画素だけ「くし形」にずれる。この二つのフィールドのインタレース画像は符号化した後、1フレームのノンインタレース画像として復号される。従来、この「くし形」が原因で、復号したフレーム毎のノンインタレース画像をフィールド分解してテレビジョン受像機等で再びインタレース表示すると、各フィールドのインタレース画像に本来の映像とその「くし形」にずれた部分が足し合わされた「残像」の如き部分が表れてしまうという課題があった。これを「残像現象」という。
所望の画質を得るため、人間の視覚特性を考慮したコントラスト感度に基づき、サブバンド毎に重み付けを制御することが行われている。例えばJPEG2000方式のウェーブレット変換において、周波数領域での視覚特性を用いた重み付けをし、不必要な部分を削除(トランケーション)している。垂直方向の高周波サブバンドでは、前記の「残像」現象が生じやすいため、このサブバンドの量子化を抑制することにより、垂直方向の高周波成分が優先的に保存され、不自然な画像劣化である「残像」が効果的に抑制されることが知られている。
特開2005−65230A号公報では、かかる「残像現象」のような不自然な画質劣化を抑制し、かつ、良好な画質を得るため、インタレース画像のフレームベース符号化のフローの中で、フィールド間の動きによるくし形を残すように量子化、トランケーションを制御するものが開示されている。また、特開2005−233926号公報には、インタレース画像のフレームベース符号化において、視覚的重み付けとしてCSF(Contrast Sensitivity Function)を用いて、サブバンドの符号化を行うものが開示されている。
ところが、特開2005−65230A号公報には、インタレース画像による「くし形」が高周波成分として表れることのみを示しているが、その2つのフィールドのインタレース画像から成るフレームに特有の問題については着目しておらず、また、高周波成分にどの程度の視覚的重要性があるのかについて具体的に言及していないため、高周波サブバンドの係数に含まれる高周波成分と低周波サブバンドの係数に含まれる低周波成分の重み付けの比率の決定について、その最適な手法を導き出すに至っていない。さらに、特開2005−233926号公報に記載のCSFを用いた符号化では、各周波数領域の静的重みを自動的に決定する方法については記載されていない。ビットレートを高くすればこのようなノイズを低減することは可能であるが、構成が複雑となり、コストが高くなるという課題がある。
したがって、本発明は、上述の課題に鑑み、2つのフィールドのインタレース画像から成るフレームに特有の問題の原因を考察し、高周波領域と低周波領域の係数の重み付けの関係、特にその最適な手法を導き出し、CSFを用いた場合の符号化では、各周波数領域の静的重みを自動的に決定する手法を明らかにすることによって、ビットレートがそれ程高くなくても動画を高品質で符号化することができる、簡易で効果的なインタレース画像の符号化方法、符号化装置、及び符号化プログラムを提供することを目的とする。
さらに、上記特徴に加え、高周波領域の係数に対して常に均一に重み付けを行うのではなく、動きを表す高周波領域の係数を考慮した、より簡易で効果的なインタレース画像の符号化方法、符号化装置、及び符号化プログラムを提供することを目的とする。
本発明の第一の態様によると、インタレース画像のフレームベース符号化処理を行う符号化方法であって、前記方法は、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップと、記周波数領域の係数を周波数帯域毎に重み付けする重み付けステップと、を含み、前記重み付けステップでは、所定の周波数を超える垂直方向の周波数帯域の係数に対する重み付けに用いる重み付け係数は、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上である、符号化方法を提供する。
本符号化方法によれば、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップと、記周波数領域の係数を周波数帯域毎に重み付けする重み付けステップと、を含み、前記重み付けステップでは、所定の周波数を超える垂直方向の周波数帯域の係数に対する重み付けに用いる重み付け係数は、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上であるので、従来、このエイリアシング成分として有効利用することが困難だった所定の周波数を越える垂直方向の周波数帯域に含まれる高周波成分に、低周波成分と同様に有効な視覚重みを与えて有効に理由することができるので、ビットレートがそれ程高くなくても簡単な構成で効果的に動画を高品質で符号化することができる。
また、本発明によると、上述の垂直方向の前記所定の周波数とは、垂直方向の前記所定の周波数範囲の中間に位置する周波数であってもよい。
本方法によれば、上述の垂直方向の前記所定の周波数を垂直方向の前記所定の周波数範囲の中間に位置する周波数とすることによって、例えば、2分割サブバンド変換を水平方向と垂直方向にそれぞれ1回行い、水平方向にローパスされ、垂直方向にハイパスされたサブバンド(LH1)と、水平方向にハイパスされ、垂直方向にハイパスされたサブバンド(HH1)と、を含むサブバンドのセットと、それら以外のサブバンドを含むサブバンドのセットとに分割して、垂直方向の低周波成分にエイリアシングを生じうる垂直方向の高周波成分を含むサブバンドのセットに有効な視覚重みを与えることが可能になる。
また、本発明によると、前記重み付けステップは、前記周波数領域の係数を前記周波数帯域毎に視覚周波数特性に従って重み付けをし、垂直方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数は、前記視覚周波数特性に従う前記水平方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数と略同等以上であってもよい。
本方法によれば、前記重み付けステップは、前記重み付けステップは、前記周波数領域の係数を前記周波数帯域毎に視覚周波数特性に従って重み付けをし、垂直方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数は、前記視覚周波数特性に従う前記水平方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数と略同等以上とすることができるで、従来、このエイリアシング成分として有効利用することが困難だった高周波成分の係数に低周波成分と同様に有効な視覚重みを与えて有効に利用することができる。
また、本発明によると、垂直方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数は、垂直方向の前記所定の周波数以下の周波数に適用する視覚周波数特性を垂直方向の前記所定の周波数を中心として対称となるように反転させて得られる修正視覚周波数特性に従って決定してもよい。
本方法によれば、垂直方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数は、垂直方向の前記所定の周波数以下の周波数に適用する視覚周波数特性を垂直方向の前記所定の周波数を中心として対称となるように反転させて得られる修正視覚周波数特性に従って決定することができるで、低周波成分と同等の視覚重みを垂直方向の高周波成分に与えることができる。
また、本発明によると、前記視覚周波数特性は、CSF(Contrast Sensitivity Function)に従って表すことができる。
本方法によれば、前記視覚周波数特性として、CSF(Contrast Sensitivity Function)を用いることができるので、人間の視覚特性を十分に考慮して周波数領域の係数に重み付けを行うことができる。
また、本発明によると、前記周波数変換ステップは、サブバンド分割処理を実行するステップを含んでもよい。
本方法によれば、前記符号化方法は、垂直方向及び水平方向の周波数領域の係数の中から、所望の方向、所望の周波数領域、所望の分割レベルを有する係数に対して、選択的に重み付けを行うことができる。
また、本発明によると、前記符号化方法はさらに、前記インタレース画像を分析して特徴を抽出するステップと、前記特徴に従って、垂直方向の所定の周波数を超える周波数帯域の係数に重み付けをするための重み付け係数を決定するステップと、をさらに含んでもよい。
本装置によれば、前記符号化方法はさらに、前記インタレース画像を分析して特徴を抽出する分析ステップと、前記特徴に従って、垂直方向の所定の周波数を超える周波数帯域の係数に重み付けをするための重み付け係数を決定する決定ステップとを含み、垂直方向に所定の周波数を超える周波数帯の係数は、決定ステップで決定された重み付け係数に従って重み付けステップで重み付けることができるので、分析されたて抽出されたインタレース画像の特徴、例えば、高周波成分と低周波成分の割合、輝度、画像内における移動している部分と静止している部分との割合、被写体の動きの量などを考慮して、動的かつ効果的に係数に重み付けを行うことができる。
本発明の第二の態様によると、インタレース画像のフレームベース符号化処理を行う符号化装置であって、前記符号化装置は、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換部と、前記周波数領域の係数を周波数帯域毎に重み付けする重み付け部と、を備え、前記重み付け部は、所定の周波数を超える垂直方向の周波数帯域の係数に対して、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上である重み付け係数を用いて重み付けを行う、符号化装置が提供される。
本装置によれば、前記符号化装置は、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換部と、前記周波数領域の係数を周波数帯域毎に重み付けする重み付け部と、を備え、前記重み付け部は、所定の周波数を超える垂直方向の周波数帯域の係数に対して、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上である重み付け係数を用いて重み付けを行うので、従来、このエイリアシング成分として有効利用することが困難だった高周波成分の係数に低周波成分と同様に有効な重みを与えて有効に利用することができるので、ビットレートがそれ程高くなくても簡単な構成で効果的に動画を高品質で符号化することができる。
さらに、本発明によると、前記符号化装置は、前記インタレース画像を分析して特徴を抽出し、該特徴に従って、垂直方向の所定の周波数を超える周波数帯域の係数に重み付けするための重み付け係数を決定する制御部をさらに備えてもよい。
本装置によれば、前記符号化装置は、前記インタレース画像を分析して特徴を抽出し、該特徴に従って、垂直方向の所定の周波数を超える周波数帯域の係数に重み付けするための重み付け係数を決定する制御部をさらに備え、重み付け部は、制御部によって決定された重み付けする量に従って、垂直方向の前記所定の周波数を超える周波数帯域の係数に重み付けすることができるので、制御部によって分析されたインタレース画像の特徴、例えば、高周波成分と低周波成分の割合、輝度、画像内における移動している部分と静止している部分との割合、被写体の動きの量などを考慮して、動的かつ効果的に重み付けを行うことができる。
本発明の第3の態様によると、インタレース画像のフレームベース符号化処理をコンピュータに実行させる符号化プログラムであって、前記フレームベース符号化処理は、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップと、前記周波数領域の係数を周波数帯域毎に重み付けする重み付けステップと、を含み、前記重み付けステップでは、所定の周波数を超える垂直方向の周波数帯域の係数に対する重み付けに用いる重み付け係数は、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上である、符号化プログラムが提供される。
本プログラムによれば、前記フレームベース符号化処理は、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップと、前記周波数領域の係数を周波数帯域毎に重み付けする重み付けステップと、を含み、前記重み付けステップでは、所定の周波数を超える垂直方向の周波数帯域の係数に対する重み付けに用いる重み付け係数は、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上であるので、従来、このエイリアシング成分として有効利用することが困難だった高周波成分の係数に低周波成分と同様に有効な重みを与えて有効に利用することができるので、ビットレートがそれ程高くなくても簡単な構成で効果的に動画を高品質で符号化することができる。
本発明の第一の実施の形態のフレームベース符号化装置の概略機能構成図である。 インタレース画像について説明する図である。 エイリアシングの生成について説明する図である。 図1の符号化装置が実行する重み付け処理を説明する図である。 図1の符号化装置が実行するサブバンド分割の原理を説明する図である。 図1の符号化装置が実行するサブバンド分割の原理を説明する図である。 図1の符号化装置の重み付け部が実行する重み付けを説明する図である。 コントラスト感度関数(CSF)の一例を説明する図である。 図1の符号化装置が実行する符号化方法を説明するフロー図である。 図1の符号化装置が実行する符号化と従来の符号化とを比較した実験結果を示す図である。 図1の符号化装置が実行する符号化と従来の符号化とを比較した実験結果を示す図である。 図1の符号化装置が実行する符号化の効果を説明する図である。 本発明の第二の実施の形態のフレームベース符号化装置の概略機能構成図である。 図13の符号化装置の具体的な構成例を示す図である。 図13の符号化装置が実行する符号化方法を説明するフロー図である。 従来のインタレース画像のフレームベースの符号化で生じる「残像」を説明する図である。
1 符号化装置(第一の実施の形態)
101 周波数変換部
102 重み付け部
2 符号化装置(第二の実施の形態)
201 周波数変換部
202 重み付け部
203 制御部
205 離散ウェーブレット変換部
206 制御部
207 量子化及び符号化部
301 インタレース画像
302 サブバンド係数
303 サブバンド重み
〜V 移動する被写体
’、T’ 従来の方法で復号されたトップフィールド
’、B2’ 従来の方法で復号されたボトムフィールド
、T 本実施の形態の方法で復号されたトップフィールド
、B2 本実施の形態の方法で復号されたボトムフィールド
まず、本発明の第一の実施の形態の符号化処理装置について図1〜図8を参照して説明する。
(第一の実施の形態)
図1は、第一の実施の形態の符号化方法を実行する符号化装置1の概略機能構成図である。図1に示すように、本実施の形態の符号化装置1は、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換部101と、垂直方向の周波数領域の係数と水平方向の周波数領域の係数とを周波数帯域毎に重み付けする重み付け部102と、を備える。本実施の形態の重み付け部102は、ほとんどの場合、所定の周波数を超える垂直方向の周波数帯域の係数に対して、所定の周波数を超える水平方向の周波数帯域の係数に対する重み付けよりも大きく重み付けするようになっている。
周波数変換部101で変換された周波数領域の係数は量子化部(図示されていない)に送られて量子化され、量子化された係数はエントロピー符号化部(図示されていない)に送られてエントロピー符号化され、コードストリームを生成するようになっている。量子化部、エントロピー符号化部などについては、当業者には公知のものを適用可能であるので、本明細書では詳細な説明を省略する。重み付け部102は、好ましくは、量子化部(図示されていない)又はエントロピー符号化部(図示されていない)を制御して周波数変換部101で変換された周波数領域の係数に対する重み付けを行うことができる。
図2〜図8を参照して、本実施の形態の符号化装置1が実行する符号化処理について説明する。
既に説明したように、インタレース画像による「くし形」が高周波成分として表れることは知られている。本発明者は、インタレース画像をより簡単で効果的に符号化するために、まず、その2つのフィールドのインタレース画像から成るフレームに特有の問題について研究した。まず、図2と図3を参照して、図16を参照して説明した「残像」の原因について説明する。
図2に示すように、1つのフレームFは、垂直方向で偶数番目の走査線を走査して生成されたインタレース画像から形成されるトップフィールドTFと、垂直方向で奇数番目の走査線を走査して生成されたインタレース画像から形成されるボトムフィールドBFに分割して処理される。
ここで、トップフィールドTFとボトムフィールドBFからなるフレームFは、垂直方向にアップサンプリングしたトップフィールドTFと、垂直方向にアップサンプリングしたボトムフィールドBFとの合計と考えることができる。アップサンプリングは、トップフィールドTFとボトムフィールドBFにそれぞれ、垂直方向で奇数番目の走査線と垂直方向で偶数番目の走査線に0値を挿入したものと考えることができる。図3の上の図で右側はインタレース画像の空間領域の一列のみの連続的な画素値を模式的に表し、左側は、右側のインタレース画像の空間領域の一列だけの画素値を離散時間フーリエ変換(DTFT)して得た周波数領域の係数の絶対値を模式的に表す。図3の下の図の右側は、図3の上の図の右側に示された一連のピクセル値をアップサンプリングして得た一連の画素値を模式的に表し、図3の下の図の左側は、図3の上の図の右側をアップサンプリングした、一連の画素値を離散時間フーリエ変換して得たスペクトルの絶対値を模式的に表す。フィールド間に生じるリークを解析するに当たって、縦方向と横方向の周波数は分離して扱うことができるため、以下、一次元信号だけに注目して説明する。
図3の下の図からわかるように、周波数領域では、もとのスペクトルを折り返したものがエイリアシング成分として表れる。空間領域と周波数領域の線形性から、空間領域でアップサンプリングしたフィールドを足し合わせることは、周波数領域で足し合わせることに等しいので、2つのフィールド、トップフィールドTFとボトムフィールドBFからなるフレームFではそれぞれのエイリアシング成分が高周波数領域で足しあわされることになる。フィールド構造を再生するためには、もとのスペクトルと、そのエイリアシング成分とが必要であるため、それらは同等の視覚的重要性があると考えられる。この点について、以下、数学的に考察する。
まず、一般性を失うことなく、トップフィールドから垂直方向に切り出した一次元信号x(n)と、トップフィールド信号x(n)を0値挿入によって2倍にアップサンプルしたフレーム信号y(n)とを考えると以下の式が成立する。
ただし、nは整数とする。ここで、z(n)はトップフィールドを表し、z(n)ボトムフィールドを表す。これは、トップフィールz(n)は元の信号x(n)に等しく、ボトムフィールドz(n)はゼロ、即ち、トップフィールドからのリークがゼロであることを示す。y(n)の離散時間フーリエ変換(DTFT)
は以下のように表せる。
ただし、
はx(n)の離散時間フーリエ変換とする。
これから、アップサンプルした信号のスペクトル
は元の信号のスペクトル
が2倍の密度で詰まったものに等しいことがわかる。スペクトルが詰まることによって、図3の下の図に示す、高周波成分に折り返した、即ち、エイリアシングした低周波成分が出現する。
次に、このエイリアシングは、トップフィールドをボトムフィールドへのリークをキャンセルして再生するために必要であることを説明する。
アップサンプルした信号y(n)と,パルス列
との積をとり、アップサンプルしたトップフィールドv(n)=y(n)p(n)を取得し、アップサンプルした信号y(n)とパルス列
との積をとり、アップサンプルしたトップフィールドv(n)=y(n)p(n)を取得する。v(n)の離散フーリエ変換
は以下の式で表せる。
同様に、v(n)の離散フーリエ変換
は以下の式で表せる。
元のトップフィールドz(n)とアップサンプルしたトップフィールドv(n)の間に、z(n)=v(2n)、v(2n+1)=0(ただしnは整数とする)の関係があることに注意すると、トップフィールドの離散時間フーリエ変換
は以下の式で表せる。
同様に、z(n)=v(2n+1)、v(2n)=0(ただしnは整数とする)に注意すると、ボトムフィールドの離散時間フーリエ変換
は以下の式で表せる。
ここで、
の関係が成り立てば,トップフィールドが再生でき、ボトムフィールドへのリークがゼロになる。実際、トップフィールドとボトムフィールドの離散時間フーリエ変換は、元のトップフィールドの離散時間フーリエ変換
(周期は2π)を使って以下の式で表せる。
したがって、z(n)=x(n)、z(n)=0が成り立つ。
フーリエ変換の線形性から、0値挿入によってアップサンプルしたトップフィールドとボトムフィールドを足し合わせた信号、即ち、フレームについても同様の結果が得られる。
以上から、エイリアシング成分におけるエラーが、低周波成分へ折り返すことがわかる。このことから、本発明者は、このエイリアシングは、トップフィールドをボトムフィールドへのリークをキャンセルして再生するために必須であるとの結論に至った。即ち、従来、このエイリアシング成分として有効利用することが困難だった高周波成分は、低周波成分と同等の視覚重みを与えて有効に利用することが望ましい。実際にはフィールド間には相関があり、高周波成分はキャンセルされて小さくなる。そのため、低周波成分と同等の重みを高周波成分に与えても、高周波成分のビット割り当ては低周波成分のビット割り当てより小さくなることに留意されたい。
図4を参照して、本実施の形態の高周波成分の重み付けについてより詳細に説明する。本実施の形態の符号化装置1は、図4に示すように、周波数変換部101(図1を参照)が、インタレース画像301を周波数領域の係数に変換した後、サブバンド分割を実行し、周波数領域の係数を垂直及び水平方向に分割したサブバンド係数302を生成する。重み付け部102(図1を参照)は、後に詳細に説明する、サブバンド重み303を量子化部に送出する。量子化部は得られたサブバンド重み303を反映させてサブバンド係数302を量子化する。量子化部が実行する量子化は、明示的または暗示的量子化、例えば、JPEG2000のPCRD最適化(Post−Compression Rate−Distortion Optimization)を含んでもよい。
図5及び図6を参照して、本実施の形態のサブバンド分割について説明する。
本実施の形態のサブバンド分割は、例えば、図5に示す、JPEG2000方式などで使われる2分割フィルタバンクのツリー構成によって実現される。図5に示すように、信号x(n)を分析フィルタバンクに入力すると、分析フィルタh、hによって、低周波成分と高周波成分を含む信号に分けられる。分析フィルタh、hはそれぞれローパスフィルタ、ハイパスフィルタである。その後の間引き処理によって、それぞれが入力信号の半分の帯域を持つ低周波成分y(k)と高周波成分y(k)が得られる。一次元の場合、低周波成分y(k)と高周波成分y(k)はそれぞれ、ローパス(low−passed)されたサブバンド(「Lサブバンド」と呼ぶ)の係数とハイパス(high−passed)されたサブバンド(「Hサブバンド」と呼ぶ)の係数を表す。間引き処理とは、サンプリングされた周波数より低い周波数で再サンプリングを行う再帰的なダウンサンプリングによって実行する。これにより信号の合計の帯域幅は増えない。即ち、x(n)とy(k)、y(k)とで合計のサンプル数は同じである。元の信号を復元するには、サブバンド信号y(k)、y(k)を合成フィルタバンクに入力すればよい。それぞれ0詰め処理された後,それぞれの合成フィルタg、gに入力され,それらが足しあわされてもとの信号x(n)を復元する。0詰め処理とは、入力のサンプリングされた周波数より高い周波数で再サンプリングを行うアップサンプリングによって実行する。
ツリー構成では低周波成分が再帰的に分割される。一回の分割で得られた低周波成分、高周波成分の係数からは、原画像の略1/2の解像度の画像が得られる。このようして行ったサブバンド分割の回数をデコンポジションレベル、又は分割レベルと呼ぶ。
分割レベル3のサブバンド分割を行う場合のツリー構成フィルタバンクを図6に示す。図6において、L3、H3はそれぞれ、分割レベル3の低周波帯域、高周波帯域の係数を表す。H2、H1はそれぞれ分割レベル2、1の高周波帯域の係数を表す。
以上、1次元信号x(n)について考察したが、垂直方向と水平方向のフィルタを順に適用することで2次元信号を用いても同様の分析、合成が可能である。こうして図4のサブバンドの係数302の配列を生成する。2次元信号は、水平方向と垂直方向にそれぞれ特定の周波数範囲を有する、分離可能な水平と垂直の周波成分を有する。同様に、2次元サブバンド分割を2次元信号に適用することによって得られた2次元サブバンドは、1次元の場合のように水平方向と垂直方向にそれぞれ特定の周波数範囲を有する、水平と垂直の周波成分を有する。即ち、2次元サブバンドの係数は、水平又は垂直方向から見ると、水平又は垂直の周波成分をそれぞれ表す。したがって、2次元サブバンドとして見ると、係数は垂直周波成分と垂直周波成分の両方を有する。重み付け係数は通常、1次元周波成分、即ち、水平又は垂直周波成分に適用される。2次元サブバンドに適用する重みは、サブバンドに含まれる水平及び垂直周波成分に適用する2つの重み付け係数から、例えば、水平と垂直の重み付け係数の積をサブバンドの重みとして用いるように、決定される。なお、図5に示す2分割フィルタバンクツリー構成は本発明を説明するための一例に過ぎず、本発明はこの他の様々な構成によっても実現可能である。
サブバンド係数302の配列は、分割レベル3の2次元サブバンド分割によって、10個のサブバンドに分割されている。分割レベルnにおいて、水平方向にローパスされ、垂直方向にローパスされたサブバンドはLLn、水平方向にハイパスされ、垂直方向にローパスされたサブバンドはHLn、水平方向にローパスされ、垂直方向にハイパスされたサブバンドはLHn、水平方向にハイパスされ、垂直方向にハイパスされたサブバンドはHHnと呼ばれる。本実施の形態では、説明を容易にするため、サブバンド分割を3回行うものとして説明するが、本発明はサブバンド分割の回数に限定されないことは明らかである。
この垂直方向の周波数帯域の係数、水平方向の周波数帯域の係数を含むサブバンド係数302の配列に対して、重み付け部102が係数に重み付けを行うために用いる重み付け係数を表す視覚的サブバンド重み303を算出し、この視覚的なサブバンド重み303に従ってサブバンド係数302の配列に何らかの適当な手段を用いて重み付けがなされる。例えば、重み付け部102が量子化部又はエントロピー符号化部に視覚的なサブバンド重み303を送出し、量子化部が、例えば、量子化ステップのサイズにそれぞれのサブバンド重み303の逆数を乗じた量子化を行う、又は、それぞれのサブバンド重み303によって重み付けたサブバンド係数の量子化歪みを用いてPCRD最適化を行う、などして、結果としてサブバンド重み303に従ってサブバンド係数302の配列に重み付けを行うようにしてもよい。
各サブバンドの視覚的な重み303は対応する視覚周波数特性から求められる垂直方向と水平方向の重みから求めることができる。既に説明したように、フィールドの低周波成分を再生するには、それを逆向きに複製したエイリアシング成分が必要であるため、エイリアシング成分の原因となりうる高周波領域の係数にも低周波領域の係数と同等の重みを与えることが望ましい。
より詳細には、図7に示すように、サブバンド係数302の配列は、垂直方向の係数は周波数領域の中心である中心周波数Mを中心としてLH1、HH1からなるサブバンドとそれ以外のサブバンドと均等に二分できる。水平方向も周波数領域の中心である中心周波数Mを中心としてHL1、HH1からなるサブバンドとそれ以外のサブバンドと均等に二分できる。本発明によると、中心周波数Mを超える垂直方向の周波成分には、中心周波数Mを超える水平方向の周波成分に対する重み付けに用いる重み付け係数と略同等以上の重み付け係数で重み付けを行うので、サブバンドLH1、HH1は、通常の視覚的重み付け特性より大きな重み付けを有する。これは、中心周波数Mを超える垂直方向の周波数帯域の係数に対して、視覚周波数特性に従って決定された、中心周波数Mを超える水平方向の周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上の重み付け係数で重み付けが行われることを意味する。
フィールドの低周波成分を再生するには、低周波成分の折り返したエイリアシング成分が必要であるため、垂直方向の中心周波数Mに対して略対称となるように、中心周波数Mにおいて、中心周波数Mを超える周波数領域の視覚的周波数特性を反転して得られる修正された視覚的周波数特性を適用することが好ましい。図7で、垂直方向の中心周波数Mを下回る周波数帯域の係数と中心周波数Mを上回る周波数帯域の係数に適用する視覚的周波数特性をそれぞれAとBで表すと、視覚周波数特性Aと視覚周波数特性Bは、中心周波数Mを中心で略対称となる。
図8に示すように、視覚周波数特性として例えば、コントラスト感度関数(CSF)を用いることが好ましい。水平方向の周波数帯域の係数及び垂直方向の周波数帯域の係数への重み付けはそれぞれ、水平方向及び垂直方向の感度を適切に高めるように行うことができる。また、垂直方向の周波数帯域の係数に対する重み付けに用いる重み付け係数を、水平方向の周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上とする場合のしきい値として中心周波数Mを用いたが、本発明はこの周波数に限定されない。例えば、CSFなどの適用する視覚的周波数特性を、エイリアシングに対応付けて折り返すことができるのであれば、中心周波数M以外の任意の周波数が可能である。さらに、インタレース画像のその他の特徴、例えば、高周波成分と低周波成分の割合、輝度、画像内における移動している部分と静止している部分との割合、被写体の動きの量などを考慮して、垂直方向の周波数成分の重み付けに用いる重み付け係数が、水平方向の周波数成分の重み付けに用いる重み付け係数と略同等以上とするためのしきい値となる周波数を高くなる方向に移動させる、低くなる方向に移動させる、又は適用する視覚周波数特性、例えば、CSFを修正するなど、様々な調整も想到可能である。
このようにして、重み付けの手法の問題は、コントラスト感度に対して、自動的に視覚重み付けを決定できるようにして解決した。エイリアシングを考慮した視覚重み付けを用いて行うため、フィールド毎に表示した場合に、フィールド間に相関がない場合、即ち、被写体の動きが大きい場合であっても、一方のフィールドの成分が他方のフィールドの成分に漏れでる「残像」現象が軽減される利点がある。
以下、視覚周波数特性として用いるCSFの一例について説明する。図8に、CSFの一例を示す。CSFについては、文献Nadenau,M.:Integration of human color vision models into high quality image compression,PhD thesis, EPFL, 2000、にCSFのパラメトリックモデルが提案されている。
ここで、fは周波数を表し、単位はcpd(cycles per degree)とする。
輝度信号(luma)YのCSF関数Y_CSF、色差信号(chroma)Cb、CrのCSF関数Cb_CSF、Cr_CSFは、以下のように提案される。
ここで、fは垂直方向又は水平方向の周波数とする。
ある絵を一定の距離をおいて観察したときのサンプリング周波数fは、観察距離(viewing distance)Lの関数になる。
ここで,Lの単位は絵の垂直方向又は水平方向のサンプリング周期である。ただし、垂直方向と水平方向のサンプリング周期は等しいと仮定する。
典型的な観察距離L=1700について、絵に含まれる最大周波数(ナイキスト周波数)fmaxは以下のように算出される。
このようにして,図8におけるCSFの垂直・水平方向の最大周波数fmaxが求められる。
図9を参照して、本実施の形態のインタレース画像のフレームベース符号化処理を行う符号化方法について説明する。図9に示すように、まず、インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップ(S101)を実行し、次に、周波数帯域毎に周波数領域の係数に重み付けする重み付けステップ(S102)を実行する。ここで、重み付けステップ(S102)では、所定の周波数を超える垂直方向の周波数帯域の係数を含む垂直方向の周波数成分に対して、所定の周波数を超える水平方向の周波数帯域の係数を含む水平方向の周波数成分に対するのと略同等以上の重み付けを行う。即ち、重み付けステップ(S102)において、垂直方向の所定の周波数を超える周波数帯域の係数を含む垂直方向の周波数成分の重み付けに用いる重み付け係数は、水平向の所定の周波数を超える周波数帯域の係数を含む水平方向の周波数成分の重み付けに用いる重み付け係数と略同等以上となる。即ち、垂直方向において所定の周波数を超える周波数帯域の係数は、視覚的周波数特性に従って決定された水平方向の所定の周波数を超える周波数帯域の係数を重み付けするために使用する重み付け係数と略同等以上の重み付け係数によって重み付けすることができる。好ましくは、重み付けステップ(S102)において、垂直方向の周波数成分、即ち、垂直方向の所定の周波数を上回る周波数帯域の係数に対する重み付けは、該所定の周波数において、水平方向の周波数成分、即ち、該所定の周波数を下回る周波数帯域の係数に適用する視覚的周波数特性を、該垂直方向の所定の周波数に対して略対称となるように反転して得られる修正された視覚的周波数特性に従って実行する。
[比較実験]
本発明による符号化方法と従来の符号化方法を比較する実験を以下の条件で行った。重み付け部は、垂直方向の所定の周波数を超える垂直方向の周波数成分に対して、該所定の周波数を下回る垂直方向の周波数成分に適用する視覚的周波数特性を、該垂直方向の所定の周波数に対して略対称となるように反転して得られる修正された視覚的周波数特性に従って実行するように機能する。
入力映像:1920x1080i,29.97fps,4:2:2,8bits
ビットレート:50Mbps
コーデック:JPEG2000方式、フレーム圧縮(フィールドをまとめて圧縮)
エンコードパラメータ: 以下の2種類を使う
(a)インタレース画像用の重み(本実施の形態)
(b) プログレッシブ画像用の重み(従来技術)
[結果]
このようにして得られた画像を図10及び図11に示す。動きを含む映像において、図10(a)及び図11(a)では、本実施の形態のインタレース用の重みを用い、図10(b)及び図11(b)ではprogressive用の重みを用いた。図10(b)及び図11(b)では、移動する被写体の近くに他方のフィールドからのリークが生じ、ちらちらするアーティファクトが特に丸で示した部分に顕著に確認される。これに対し、図10(a)及び図11(a)では、リークによるアーティファクトが軽減されていることが分かる。
図12を参照して、本発明の効果について説明する。ビデオフレームの画像は左側方向に移動し、時間の経過t→t→tに従って、フィールド毎に黒丸で示された被写体は、V→V→V→Vへと移動していく。まず、VとVで示されるフィールドの被写体の動きに対応する、トップフィールドTとボトムフィールドBを復号して得られたRT’、RB’、及びRT、RBに着目する。トップフィールドTを撮影してからボトムフィールドBを撮影する間に時間(t−t)が経過しているため、フィールドの被写体は、VからVへと移動している。このため、従来の手法では、RT’、RB’に示すように残像が残る。しかし、本実施の形態の手法では従来の手法と略同等以上の重み付けを垂直方向の高周波成分に実行しているので、RT、RBに示すように残像はほとんど残らない。同様に、VとVで示されるフィールドの被写体の動きに対応する、トップフィールドTとボトムフィールドBにおいても、トップフィールドTを撮影してからボトムフィールドBを撮影する間に時間(t−t)が経過しているため、フィールドの被写体は、VからVへと移動している。このため、従来の手法では、RT’、RB’に示すように残像が残る。しかし、本実施の形態の手法では、垂直方向の高周波成分は、垂直方向の低周波成分に適用する視覚周波数特性を反転し、このようにして反転した視覚的周波数特性を垂直方向の高周波成分に適用して重み付けをしているので、RT、RBに示すように残像はほとんど残らない。
また、コンピュータを利用して本発明を実施する場合、上述の機能を実行するハードウェア又はプログラムとして実装してもよく、また、コンピュータに上述の機能を実行させるプログラムを記憶した、コンピュータが読み取り可能な記憶媒体として実装してもよい。このように本発明によると、適用する視覚周波数特性、例えば、CSFを、エイリアシングに対応するように折り返すことによって、より簡易で効果的にインタレース画像の符号化を行う符号化方法、符号化装置、及び符号化プログラムを提供することができる。
本実施の形態では、適用する視覚周波数特性、例えば、CSFを、エイリアシングに対応するように折り返すことによって、より簡易で効果的にインタレース画像を符号化する構成について説明したが、本発明は、様々な変形が可能である。インタレース画像のその他の特徴、例えば、画像内における移動している部分と静止している部分との割合を考慮して、適用する視覚周波数特性、例えば、CSFを修正する構成も可能である。この構成について次の実施の形態で説明する。
(第二の実施の形態)
図13は、第二の実施の形態の符号化方法を実行する符号化装置2の概略機能構成図である。図13に示すように、本実施の形態の符号化装置2の構成は、図1に示す第一の実施の形態の符号化方法を実行する符号化装置1とほぼ同様であるが、さらに、制御部203を備える点が異なる。制御部203は、インタレース画像を分析して特徴を抽出し、抽出した特徴に従って、制御パラメータ、例えば、所定の周波数を上回る垂直方向の周波数成分に重み付けをするための重み付け係数を決定し、重み付け部202は、制御部203によって決定された制御パラメータに従って、所定の周波数を上回る水平方向の周波数成分を重み付けするための重み付け係数よりも大きな重み付け係数を用いて、該所定の周波数を上回る垂直方向の周波数成分に重み付けを行う。以下、特徴部のみを説明し、第一の実施の形態と同様の構成については説明を省略する。
具体的には、制御部203は、インタレース画像の特徴、例えば、高周波成分と低周波成分の割合、輝度、被写体の動きの量などを考慮して、随時重みを修正してもよい。
図14を参照して、本実施の形態の符号化装置2を実現する具体的な構成例を説明する。本実施の形態の符号化装置2は、画像を入力して離散ウェーブレット変換を実行してサブバンド係数を出力する離散ウェーブレット変換部205と、入力された画像の特徴を抽出する制御部206と、離散ウェーブレット変換部205から出力されたサブバンド係数を量子化及び符号化する量子化及び符号化部207と、を含むことができる。制御部206は、量子化及び符号化部207の動作も制御する。ここで、離散ウェーブレット変換部205が周波数変換部201を構成し、量子化及び符号化部207が重み付け部202を構成する。
入力される画像はインタレース画像であり、図示していないバッファメモリに一旦記憶された後に出力される。このため、最新の画像のみならず、複数の過去画像、及びこれから処理する画像、即ち未来の画像を含んでもよい。制御部206は、例えば、入力されるインタレース画像から画像の特徴を抽出してもよく、あるいは、離散ウェーブレット変換部205から出力されるサブバンド係数、例えば、エイリアシング成分となりうるLH1、HH1のサブバンドの係数から画像の特徴を抽出してもよい。
制御部206は、抽出した画像の特徴、例えば、動きの割合に併せて動的にサブバンド重みを決定することができる。具体的には、制御部206は、例えば、画像の動きのある部分と画像全体との面積比α(αは0以上1以下)を動き検出などによって求め、例えば、サブバンドLH1及びHH1に含まれうる、所定の周波数を超える垂直方向の周波数成分に適用する、修正コントラスト感度関数CSF’(f)を、例えば、αを用いて以下のようにして算出することができる。
ここで、CSF(f)はオリジナルのコントラスト感度関数を表し、CSF(fmax―f)はそれを反転したものを表す。
量子化及び符号化部207は、制御部206が制御パラメータとして算出した修正コントラスト感度関数CSF’(f)に従って、離散ウェーブレット変換部205から出力される所定の周波数を超える垂直方向周波数成分、例えば、垂直方向のハイパスされたサブバンドLH1及びHH1の係数を量子化及び符号化する。
また、本実施の形態では、制御部206が動的にサブバンド重みを決定する場合について説明したが、符号化処理に画像の特徴をより詳細に反映するため、制御部が、サブバンドをさらに小さな領域に分割した符号化処理単位(例えば、コードブロック)毎に重みを決定するようにしてもよい。具体的には、制御部206は、コードブロック毎に垂直方向の所定の周波数を超える垂直方向の周波数成分に修正コントラスト感度関数CSF’(f)を決定し、決定した修正コントラスト感度関数CSF’(f)を算出し、量子化及び符号化部207が、制御部206が算出した修正コントラスト感度関数CSF’(f)に従って、離散ウェーブレット変換部205から出力される垂直方向の所定の周波数を超える周波数成分を含む係数をコードブロック毎に量子化及び符号化するようにしてもよい。
図15を参照して、本実施の形態のインタレース画像のフレームベース符号化処理を行う符号化方法について説明する。図15に示すように、まず、インタレース画像を分析して特徴を抽出する分析及び特徴抽出ステップ(S201)を実行し、次に、インタレース画像を、それぞれ垂直方向および水平方向に所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップ(S202)を実行する。続いて、垂直方向の周波数領域の係数と水平方向の周波数領域の係数とを周波数帯域毎に重み付けする重み付けステップ(S203)を実行する。ここで、重み付けステップは、インタレース画像の特徴を考慮して、所定の周波数を超える垂直方向の周波数帯域の係数に対して、所定の周波数を超える水平方向の周波数帯域の係数に対する重み付けと略同等以上の重み付けを行うステップを含む。即ち、重み付けステップ(S203)においては、インタレース画像の特徴を考慮して、所定の周波数を超える垂直方向の周波数帯域の係数の重み付けに用いる重み付け係数は、所定の周波数を超える水平方向の周波数帯域の係数の重み付けに用いる重み付け係数と略同等以上となる。
このように本実施の形態によると、制御部によって分析されたインタレース画像の特徴、例えば、高周波成分と低周波成分の割合、輝度、画像内における移動している部分と静止している部分との割合、被写体の動きの量などを考慮して、動的かつ効果的に重み付けを行うことができるので、より簡易で効果的なインタレース画像の符号化方法、符号化装置、及び符号化プログラムを提供することができる。
また、コンピュータを利用して本発明を実施する場合、上述の機能を実行するハードウェア又はプログラムとして実装してもよく、また、コンピュータに上述の機能を実行させるプログラムを記憶した、コンピュータが読み取り可能な記憶媒体として実装してもよい。このように本発明によると、より簡易で効果的なインタレース画像の符号化方法、符号化装置、及び符号化プログラムを提供することができる。
以上、本発明の実施の形態について説明したが、本発明は上述した実施の形態に限定されるものではない。また、本発明の実施の形態に記載された効果は、本発明から生じる最も好適な効果を列挙したものに過ぎず、本発明による効果は、本発明の実施の形態に記載されたものに限定されるものではない。
例えば、上述の実施の形態では、符号化方式の一例としてJPEG2000方式を言及して説明したが、本発明が適用可能な符号化方式はJPEG2000方式に限定されない。本発明は、サブバンド分割を行うほぼ如何なる符号化方式に適用可能である。

Claims (10)

  1. インタレース画像のフレームベース符号化処理を行う符号化方法であって、前記符号化方法は、
    インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップと、
    前記周波数領域の係数を周波数帯域毎に重み付けする重み付けステップと、を含み、
    前記重み付けステップでは、所定の周波数を超える垂直方向の周波数帯域の係数に対する重み付けに用いる重み付け係数は、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上である、符号化方法。
  2. 垂直方向の前記所定の周波数とは、垂直方向の前記所定の周波数範囲の中間に位置する周波数である、請求項1記載の符号化方法。
  3. 前記重み付けステップは、前記周波数領域の係数を前記周波数帯域毎に視覚周波数特性に従って重み付けをし、
    垂直方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数は、前記視覚周波数特性に従う前記水平方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数と略同等以上である、請求項1記載の符号化方法。
  4. 前記重み付けステップは、垂直方向の前記所定の周波数を超える前記周波数帯域の係数の重み付けに用いる重み付け係数は、垂直方向の前記所定の周波数以下の周波数に適用する視覚周波数特性を垂直方向の前記所定の周波数を中心として対称となるように反転させて得られる修正視覚周波数特性に従って決定される、請求項3記載の符号化方法。
  5. 前記視覚周波数特性は、CSF(Contrast Sensitivity Function)に従って表される、請求項3記載の符号化方法。
  6. 前記周波数変換ステップは、サブバンド分割処理を実行するステップを含む、請求項1記載の符号化方法。
  7. 前記インタレース画像を分析して特徴を抽出するステップと、
    前記特徴に従って、垂直方向の所定の周波数を超える周波数帯域の係数に重み付けをするための重み付け係数を決定するステップと、をさらに含む、請求項1記載の符号化方法。
  8. インタレース画像のフレームベース符号化処理を行う符号化装置であって、前記符号化装置は、
    インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換部と、
    前記周波数領域の係数を周波数帯域毎に重み付けする重み付け部と、を備え、
    前記重み付け部は、所定の周波数を超える垂直方向の周波数帯域の係数に対して、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上である重み付け係数を用いて重み付けを行う、符号化装置。
  9. さらに、前記インタレース画像を分析して特徴を抽出し、該特徴に従って、垂直方向の所定の周波数を超える周波数帯域の係数に重み付けするための重み付け係数を決定する制御部をさらに備える、請求項8記載の符号化装置。
  10. インタレース画像のフレームベース符号化処理をコンピュータに実行させる符号化プログラムであって、前記フレームベース符号化処理は、
    インタレース画像を垂直方向と水平方向にそれぞれ所定の周波数範囲を有する周波数領域の係数に変換する周波数変換ステップと、
    前記周波数領域の係数を周波数帯域毎に重み付けする重み付けステップと、を含み、
    前記重み付けステップでは、所定の周波数を超える垂直方向の周波数帯域の係数に対する重み付けに用いる重み付け係数は、前記所定の周波数を超える水平方向の前記周波数帯域の係数に対する重み付けに用いる重み付け係数と略同等以上である、符号化プログラム。
JP2011509750A 2008-08-29 2008-08-29 インタレース画像の符号化方法、符号化装置、及び符号化プログラム Active JP5255116B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/066022 WO2010023769A1 (en) 2008-08-29 2008-08-29 Encoding method, encoding device, and encoding program for encoding interlaced image

Publications (2)

Publication Number Publication Date
JP2012501095A true JP2012501095A (ja) 2012-01-12
JP5255116B2 JP5255116B2 (ja) 2013-08-07

Family

ID=40647144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011509750A Active JP5255116B2 (ja) 2008-08-29 2008-08-29 インタレース画像の符号化方法、符号化装置、及び符号化プログラム

Country Status (7)

Country Link
US (1) US8571337B2 (ja)
EP (1) EP2353294B1 (ja)
JP (1) JP5255116B2 (ja)
KR (1) KR20110066924A (ja)
CN (1) CN102204250A (ja)
CA (1) CA2754535C (ja)
WO (1) WO2010023769A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8571337B2 (en) 2008-08-29 2013-10-29 Gvbb Holdings S.A.R.L. Encoding method, encoding device, and encoding program for encoding interlaced image
US8442338B2 (en) * 2011-02-28 2013-05-14 Sony Corporation Visually optimized quantization
CN112750094B (zh) * 2020-12-30 2022-12-09 合肥工业大学 一种视频处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08186816A (ja) * 1994-12-28 1996-07-16 Pioneer Electron Corp サブバンド符号化方法
JP2005065230A (ja) * 2003-07-25 2005-03-10 Ricoh Co Ltd 符号化装置、符号化制御方法、プログラム及び記録媒体
JP2007049582A (ja) * 2005-08-12 2007-02-22 Ricoh Co Ltd 符号化装置、プログラム及び情報記録媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100550975C (zh) * 2004-10-13 2009-10-14 创世纪微芯片公司 用于频率内容运动检测的方法和设备
US8571337B2 (en) 2008-08-29 2013-10-29 Gvbb Holdings S.A.R.L. Encoding method, encoding device, and encoding program for encoding interlaced image

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08186816A (ja) * 1994-12-28 1996-07-16 Pioneer Electron Corp サブバンド符号化方法
JP2005065230A (ja) * 2003-07-25 2005-03-10 Ricoh Co Ltd 符号化装置、符号化制御方法、プログラム及び記録媒体
JP2007049582A (ja) * 2005-08-12 2007-02-22 Ricoh Co Ltd 符号化装置、プログラム及び情報記録媒体

Also Published As

Publication number Publication date
EP2353294A1 (en) 2011-08-10
CN102204250A (zh) 2011-09-28
WO2010023769A1 (en) 2010-03-04
EP2353294B1 (en) 2015-03-04
US20110188764A1 (en) 2011-08-04
KR20110066924A (ko) 2011-06-17
CA2754535C (en) 2019-05-14
US8571337B2 (en) 2013-10-29
CA2754535A1 (en) 2010-03-04
JP5255116B2 (ja) 2013-08-07

Similar Documents

Publication Publication Date Title
US9571856B2 (en) Conversion operations in scalable video encoding and decoding
JP4989048B2 (ja) 3dサブバンド符号化のための組み込み基本レイヤコーデック
US9554132B2 (en) Video compression implementing resolution tradeoffs and optimization
CN100574433C (zh) 用于减少视频流中的伪像的方法和装置
US8160160B2 (en) Bit-rate reduction for multimedia data streams
KR102062764B1 (ko) 모바일 단말 화면을 위한 3k해상도를 갖는 디스플레이 영상 생성 방법 및 장치
JP2005506816A (ja) 適応的コンテンツフィルタリングを用いた空間拡張可能圧縮の機構
JP2014171097A (ja) 符号化装置、符号化方法、復号装置、および、復号方法
KR20150068402A (ko) 동영상 압축 방법
Mehrseresht et al. Adaptively weighted update steps in motion compensated lifting based scalable video compression
Kuge Wavelet picture coding and its several problems of the application to the interlace HDTV and the ultra-high definition images
US20070206680A1 (en) Method Of Down-Sampling Data Values
JP5255116B2 (ja) インタレース画像の符号化方法、符号化装置、及び符号化プログラム
JP2002539657A (ja) 符号化された画像を評価するための処理、装置及び、使用
CN116762338A (zh) 使用预处理的视频编码
JP6484097B2 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、映像符号化プログラム及び映像復号プログラム
KR101225159B1 (ko) 비디오 이미지의 시퀀스를 코딩하는 방법 및 장치
JP5219948B2 (ja) 符号化装置および符号化方法
JP5140637B2 (ja) 時空間ダウンサンプリング処理装置、時空間アップサンプリング処理装置、符号化装置、復号装置及びプログラム
Matsuo et al. Video coding of 8K UHDTV by HEVC/H. 265 with spatio-gradational reduction and its restoration
JPH0918876A (ja) 動画像符号化装置及び動画像復号装置
JP6388476B2 (ja) 符号化装置及びプログラム
Ishida et al. Motion-JPEG2000 codec compensated for interlaced scanning videos
JP4590975B2 (ja) 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム
JPH1098694A (ja) 画像信号の走査変換方法及び回路

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20111004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121228

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130204

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130418

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5255116

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371