JP4849441B2 - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP4849441B2
JP4849441B2 JP2006021322A JP2006021322A JP4849441B2 JP 4849441 B2 JP4849441 B2 JP 4849441B2 JP 2006021322 A JP2006021322 A JP 2006021322A JP 2006021322 A JP2006021322 A JP 2006021322A JP 4849441 B2 JP4849441 B2 JP 4849441B2
Authority
JP
Japan
Prior art keywords
field
block
prediction
quantization
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006021322A
Other languages
English (en)
Other versions
JP2007208311A (ja
Inventor
英司 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2006021322A priority Critical patent/JP4849441B2/ja
Publication of JP2007208311A publication Critical patent/JP2007208311A/ja
Application granted granted Critical
Publication of JP4849441B2 publication Critical patent/JP4849441B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、動画像の画像信号を符号化して伝送する動画像符号化装置に関するものである。
インターレース画像である動画像の画像信号を符号化する構造として、フレーム構造とフィールド構造の2種類がある。一般的に、フレーム構造は、静止した画像或いは動きの少ない画像に有効であり、フィールド構造は、動きの多い画像に有効であるといわれている。
インターレース画像の符号化にフィールド構造を採用した場合、フレーム構造を採用した場合と比較して、画像入力から符号化開始までの時間が短い。図2に示すように、インターレース画像はトップフィールドとボトムフィールドから構成されており、インターレース画像の符号化においては、先ず、動画像符号化装置にトップフィールドの画像信号が入力され、次にボトムフィールドの画像信号が入力される。フレーム構造は、トップフィールドとボトムフィールドを合成した構造で符号化を行うのに対し、フィールド構造では、トップフィールドとボトムフィールドの符号化は独立して行なわれる。
したがって、フィールド構造の場合、トップフィールドの画像信号が入力され、符号化に必要な最低限の画像信号が入力された時点で符号化開始が可能となる。一方、フレーム構造はトップフィールドの画像信号とボトムフィールドの画像信号で構成されるため、トップフィールドの画像信号の入力完了後、フレーム構造での符号化に必要な最低限のボトムフィールドの画像信号が入力された時点で符号化開始が可能となる。このことより、フィールド構造を採用する方が、画像信号の入力を開始した時点から符号化結果の出力を開始する時点までの時間、即ち、符号化遅延がフレーム構造を採用する場合に比べて短くなる。
一方、従来の動画像符号化装置では、フィールド構造で符号化した画質と比較してフレーム構造で符号化した画質の方が良いとされていることから、フレーム構造が採用されている。フィールド構造を採用した符号化としては、例えば、動きの速いシーンではフィールド構造で符号化を行い、動きの少ないシーンではフレーム構造で符号化を行うようにシーンに応じて適応的にフィールド構造・フレーム構造の切り替えを行う方式が存在する。よって、動きの少ないシーンをフィールド構造で符号化した場合の画質を向上させることができれば、従来と比較して、画質は同等で符号化遅延が短い動画像符号化装置を提供できることになる。
フレーム構造が有利とされる静止画像、或いは、動きの少ない画像をフィールド構造で符号化を行う場合、フレーム構造と比較して、特に垂直方向の空間解像度が低くなるため、符号化画像の主観画質が劣る傾向がある。例えば、モスキートノイズが発生し易いとされる画像をフレーム構造とフィールド構造で符号化した場合、主観画質ではフィールド構造で符号化した方がモスキートノイズを知覚されやすい傾向があり、フィールド構造を用いた符号化ではフレーム構造を用いた符号化よりも、モスキートノイズの発生をより抑制することが必要である。
モスキートノイズの発生を抑制することに関して、従来の動画像符号化装置や画像処理装置では、統計的特徴量としてマクロブロック毎に輝度値の分布を調べることで、モスキートノイズが発生しやすいマクロブロックやオブジェクトのエッジが存在するマクロブロックの量子化幅を他のマクロブロックに比して相対的に小さくすることによりモスキートノイズの発生を抑えている(例えば、特許文献1参照)。或いは、マクロブロックを細分化して、サブブロック毎にアクティビティを算出し、最小のアクティビティをマクロブロックのアクティビティの代表値とし、この値に基づいて量子化ステップを決定することによりモスキートノイズを抑制している(例えば、特許文献2参照)。
特開2001−245303号公報(段落番号0048−0050、図5) WO2002/080574(第11頁第39行−第14頁第49行、図8)
従来の動画像符号化装置は以上のように構成されており、確かにモスキートノイズの発生を抑制する効果がある。但し、これらの発明はフレーム画像を対象としており、フィールド画像を用いた符号化に適用する場合、次の課題を必ずしも解決しない。即ち、フィールド構造で符号化を行う場合、トップフィールドとボトムフィールドが独立して符号化されるため、復号結果を表示する場合、垂直方向の1ライン毎に交互に異なる量子化パラメータで量子化されている領域が存在し、フレーム構造と比べて、画質の均一性で劣る可能性がある。
図8及び図9に示すように、フィールド構造においてトップフィールドとボトムフィールドそれぞれにおいて、左上から同じ位置に存在する2つのマクロブロックMB(TMB:トップフィールドのMBとBMB:ボトムフィールドのMB)の復号画像が表示される時には、1ライン単位で交互に表示されるためTMBとBMBの量子化パラメータが異なると、図10に示した範囲で画質の不均一が発生する。
一方、フレーム構造においては、TMBとBMBと表示画面上で同じ位置にある2つのMBの量子化パラメータが異なっているとしても、上半分では画質が均一であり、下半分では画質が均一である。よって、図10に示すように、フィールド構造では画質が不均一になる面積が大きく知覚されやすい。仮に、画質の評価尺度の一つであるPSNR(Peak Signal to Noise Ratio)[dB]の値が等しい場合でも、主観画質評価で劣る要因の一つとなる。
加えて、特許文献1は、2パス符号化を前提としているため、遅延量が大きく、画質を向上させ符号化遅延を削減することを目的としたフィールド構造で符号化を行う場合には適しているとは言えない。
また、特許文献2では、マクロブロックを4×4のブロックに細分化し、マクロブロックに含まれる4×4のブロックの最小の分散値をマクロブロックの代表値として量子化ステップの制御を行うため、モスキートノイズの発生には効果的である。但し、ビットレートに余裕がある使用条件を想定して為されたものであり、ビットレートが限られた使用条件では必ずしも適しているとは言えない。加えて、プリエンコード処理とエンコード処理が行われるため、2パスに近い符号化処理であって、画質を向上させ符号化遅延を低減するという目的には必ずしも適しているとは言えない。
この発明は、かかる課題を解決するためになされたもので、フィールド構造で動画像符号化を行う場合、トップフィールドでモスキートノイズの発生を抑制する量子化処理を行った領域の位置とボトムフィールドにおいて同じ位置に存在する領域に対する量子化の際、同じ値の量子化パラメータを用いることにより、画質の均一性を保ち、フレーム構造に対するフィールド構造の画質劣化を抑制することができる動画像符号化装置を得ることを目的とするものである。
この発明に係る動画像符号化装置は、トップフィールド及びボトムフィールドのそれぞれの入力画像信号を複数のブロックに分割して出力するとともに、前記ブロックと予測画像信号との予測誤差信号を変換してその変換係数を量子化する変換手段と、前記変換手段により量子化された変換係数を逆量子化し、その逆量子化された変換係数を逆変換して予測誤差信号を復号し、復号された予測誤差信号と前記予測画像信号とを加算して参照画像信号を生成する参照画像生成手段と、前記参照画像生成手段により生成された参照画像信号と前記変換手段から出力された前記ブロックとから動き補償予測を実施して前記予測画像信号を生成する予測信号生成手段と、前記変換手段により量子化された変換係数を符号化し、その符号化データを伝送する符号化手段とを備えた動画像符号化装置において、前記変換手段から出力された前記ブロックの特徴量を抽出して出力する特徴量抽出手段と、前記特徴量抽出手段からの特徴量と前記変換手段の量子化情報とを対応付けて保持し、符号化によって前記変換手段から出力されたブロックの復号画像にモスキートノイズが発生する可能性を前記特徴量を用いて予測し、前記ブロックの復号画像にモスキートノイズが発生する可能性がある場合には、前記ブロックの量子化処理に必要な量子化情報を前記モスキートノイズの発生を抑制するように制御する制御手段とをさらに備え、前記変換手段は、前記トップフィールドのブロックの復号画像に前記復号画像にモスキートノイズが発生する可能性がある場合には、前記ボトムフィールドにおける前記トップフィールドと同じ位置に存在するブロックに対する量子化の際に、前記トップフィールドと同じ量子化情報に基づいて量子化処理を実行することを特徴とする。
この発明によれば、フィールド構造で動画像符号化を行う場合、トップフィールドでモスキートノイズの発生を抑制する量子化処理を行った領域の位置とボトムフィールドにおいて同じ位置に存在する領域に対する量子化の際、同じ値の量子化パラメータを用いることにより、画質の均一性を保ち、フレーム構造に対するフィールド構造の画質劣化を抑制することができる。
実施の形態1.
図1は、この発明の実施の形態1に係る動画像符号化装置の構成を示すブロック図である。図1に示される動画像符号化装置は、符号化の対象となる入力画像信号を格納するフレームメモリ1と、フレームメモリ1に格納された入力画像信号を分割するブロック化回路2と、ブロック化回路2を介した入力画像信号と予測画像信号との誤差を求め、その予測誤差信号を出力する減算器3と、減算器3から出力された予測誤差信号を直交変換してその変換係数を出力する変換回路4と、変換回路4から出力される変換係数を量子化する量子化回路5と、量子化回路5により量子化された変換係数を逆量子化する逆量子化回路6と、逆量子化回路6により逆量子化された変換係数を逆変換して予測誤差信号を復号する逆変換回路7と、逆変換回路7により復号された予測誤差信号と予測画像信号とを加算して参照画像信号を生成する加算器8と、加算器8により生成された参照画像信号を格納するフレームメモリ9と、フレームメモリ9に格納された参照画像信号と入力画像信号から動き補償予測を実施して予測画像信号を生成する動き補償回路10と、量子化回路5により量子化された変換係数等を符号化し、その符号化データを多重化してバッファ12に格納する符号化回路11と、符号化回路11によって格納されている符号化データを伝送するバッファ12と、ブロック化回路2で領域分割されたブロックの画像特徴量を抽出する特徴量抽出回路13と、特徴量抽出回路13の出力に基づいて量子化回路5を制御する制御回路14と、特徴量抽出回路13の出力である特徴量と制御回路14の量子化パラメータを一次的に保持するメモリ15とを備える。
次に、上記構成に係る動画像符号化装置の動作について説明する。フレームメモリ1には符号化の対象となる入力画像の画像信号である入力画像信号が入力される。この入力画像信号は、図2に示すように、1つのフレームが2つのフィールドから構成されるインターレース構造であり、トップフィールドとボトムフィールドより成り立っており、通常は、トップフィールドの画像信号から入力され、続いてボトムフィールドの画像信号が入力される。
ブロック化回路2は、フレームメモリ1に格納された入力画像信号を分割する。以降の動作は、この分割された領域(ブロック)を単位に行われる。例えば、デジタル放送やDVD(Digital Versatile Disc)レコーダーなどに採用されているMPEG−2(Moving Picture Experts Group-2)では、この領域はマクロブロック(MB:Macroblock)と呼ばれ、大きさは16×16画素である。
減算器3では、入力画像信号と後述する動き補償回路10により生成された予測画像信号との誤差を求め、その予測誤差信号を出力する。変換回路4は、減算器3から出力された予測誤差信号に、例えば離散コサイン変換(DCT:Discrete Cosine Transform)などの直交変換を施してその変換係数を出力する。量子化回路5は、変換回路4から出力された変換係数を量子化する。なお、フレームメモリ1、ブロック化回路2、減算器3、変換回路4及び量子化回路5から変換手段が構成されている。
逆量子化回路6は、量子化回路5により量子化された変換係数を逆量子化する。逆変換回路7は、逆量子化回路6により逆量子化された変換係数に、例えば変換回路4で離散コサイン変換を行う場合は、逆変換として逆離散コサイン変換を施し、その予測誤差信号を復号する。加算器8は、逆変換回路7により復号された予測誤差信号と動き補償回路10により生成された予測画像信号とを加算して参照画像信号を生成する。なお、逆量子化回路6、逆変換回路7及び加算器8から参照画像生成手段が構成されている。
モスキートノイズは、変換手段としての変換回路4と量子化回路5の動作によって発生する。画像信号である輝度信号の変化が激しい箇所では変換回路4の結果である変換係数に高域係数が多く含まれる。即ち、高域の係数が0以外の値を持つ。変換係数は量子化回路5で量子化されるが、一般的に高域係数は低域係数に比べて粗く量子化されるため、量子化回路5の動作で高域係数は0となる場合がある。この係数が逆量子化回路6で逆量子化され、逆変換回路7で逆変換されて復号された結果、高域係数が0となって高域成分が失われているため、画像上で蚊が飛んでいるように知覚される。この現象がモスキートノイズと呼ばれている。特に、エッジ周辺の平坦な箇所でモスキートノイズが知覚され易いことが知られている。
フレームメモリ9は、加算器8により生成された参照画像信号を格納する。動き補償回路10は、フレームメモリ9に格納された参照画像信号と入力画像の画像信号から動き補償予測を実施して予測画像信号を生成する。なお、動き補償回路10は、予測信号生成手段を構成している。符号化回路11は、量子化回路5により量子化された変換係数等を符号化し、その符号化データを多重化してバッファ12に格納する。バッファ12は、符号化回路11によって格納されている符号化データを伝送する。なお、符号化回路11及びバッファ12から符号化手段が構成されている。バッファ12の残量から量子化回路5が量子化処理実行時に用いる量子化パラメータを算出する。
特徴量抽出回路13は、ブロック化回路2で領域分割されたブロックの画像特徴量を抽出するもので、特徴量抽出手段を構成する。制御回路14は、特徴量抽出回路13の出力に基づいて量子化回路5を制御し、メモリ15は、特徴量抽出回路13の出力である特徴量と制御回路14の量子化パラメータを一次的に保持するもので、制御回路14とメモリ15から制御手段を構成する。
次に、特徴量抽出手段としての特徴量抽出回路13、制御手段としての制御回路14とメモリ15の動作について図3に示すフローチャートを参照して説明する。図3は、特徴量抽出回路13、制御回路14、メモリ15の動作を示すフローチャートである。フレームメモリ1にはインターレース画像のトップフィールドの画像信号から入力されている。画像信号は輝度信号と色差信号である。ここで、フレームメモリ1には必要に応じて複数のフィールドの画像信号が保持されており、次のブロック化回路2は最新の入力画像の画像信号を読み出すとは限らない。
図4には、フレームメモリ1に入力されるフィールドを入力順に示しており、フィールド1・3・5・7がトップフィールド、フィールド2・4・6・8がボトムフィールドである。動画像符号化においては、符号化効率を向上させるために画像信号の並べ替えを行う場合がある。図5は、図4に示す如く入力された画像信号に対する並べ替えの一例である。この図5では、最初に符号化されるのは3番目に入力されたフィールドである。フィールド3(I)は、ピクチャ内で符号化(イントラ符号化)を行うIピクチャ(Intra-Coded Picture)、フィールド4(P)、フィールド7(P)、フィールド8(P)は、過去のフィールドを参照して動き補償予測を行うPピクチャ(Predictive-Coded Picture)、フィールド1(B)、フィールド2(B)、フィールド5(B)、フィールド6(B)は、過去と未来のフィールドを参照して動き補償予測を行うBピクチャ(Bidirectionally Predictive-Coded Picture)とする。例えば、フィールド5(B)はBピクチャとするので、過去の画像であるIピクチャのフィールド3(I)、Pピクチャであるフィールド4(P)、未来の画像であるPピクチャのフィールド7(P)、8(P)を参照画像とする。Pピクチャであるフィールド4(P)は、Iピクチャであるフィールド3(I)を参照画像とし、フィールド7(P)は、フィールド3(I)、4(P)を参照画像とする。符号化は、図5の順番に行われる。
図6は、図4に示す如く入力された画像信号に対し並べ替えを行わない場合であり、この場合は最新の入力画像の画像信号が最新の符号化対象となる。
いずれにおいても、図3に示すST100において、ブロック化回路2は、先ずトップフィールドの画像信号から所定のサイズのブロックの画像信号をフレームメモリ1から読み出し特徴量抽出回路13に出力する。図5の場合はフィールド3(I)から、図6の場合はフィールド1(I)から切り出しを行う。
次に、ST101において、特徴量抽出回路13は、ブロック化回路2でブロック化された領域の画像信号の特徴量を抽出する。抽出する特徴量としては、例えば、輝度の平均値、分散値、色差の平均値、分散値などである。これらの特徴量は、制御回路14に出力される。
ST102では、制御回路14が、特徴量抽出回路13から出力された特徴量を用い、符号化によって復号画像にモスキートノイズが発生する可能性を予測する。
ST103において、制御回路14が、符号化によってブロック化回路2から出力されたブロックの復号画像にモスキートノイズが発生する可能性があると判断した場合、ST104に遷移する。モスキートノイズが発生する可能性を判断する方法としては、例えば、輪郭線を検出することによって判断する方法や、ブロック中の画像信号である輝度信号や色差信号の分布状況から判断する方法、変換回路4の出力である変換係数から判断する方法などが挙げられる。
ST104では、制御回路14が現在のフィールドがトップフィールドであるかボトムフィールドであるかを確認する。確認する方法については、図示していないが、フレームメモリ1に入力される画像信号を含む入力信号の一部から判断する。トップフィールドであると判断した場合、ST105に遷移する。
ST105において、制御回路14は、量子化回路5が現在の制御対象であるブロックの量子化処理を実行するために必要な量子化パラメータを制御する。制御回路14は、先ず、バッファ12の残量などに基づき量子化パラメータを算出し、この量子化パラメータの値を必要に応じて制御する。モスキートノイズの発生を抑制するための制御方法としては、例えば、量子化パラメータに絶対値を与える方法や、現在の量子化パラメータから所定の値を減算する方法がある。後者の場合には、リミット値を設けておいて、減算結果が小さくなり過ぎないように制御する場合もある。また、バッファ12の残量などに基づいて算出した値が変更する必要がない場合はそのままの値を用いる。
制御回路14は、量子化パラメータを求めると、この量子化パラメータと特徴量抽出回路13から入力した特徴量をセットとして、図7に示したフォーマットでメモリ15に保存する。図8に示すように、トップフィールドの左上を原点とした場合のブロックの垂直座標V(0≦V<Hgt:Hgtは入力画像の垂直方向の画素数)と水平座標H(0≦H<Wdt:Wdtは入力画像の水平方向の画素数)からメモリ15のアドレスを算出し、このアドレスが示す領域にブロックのタイプ、量子化パラメータをセットにして書き込みを行う。ブロックのタイプには、モスキートノイズが発生する可能性がある場合は、例えば、“Mosq”と書き込む。
量子化回路5では、この量子化パラメータに基づき量子化処理が実行される。現在のトップフィールドがIピクチャであれば、変換回路4が入力画像の画像信号から構成されるブロックの信号を変換した結果である変換係数を量子化し、PピクチャまたはBピクチャである場合は、変換回路4が、動き補償回路10の出力である予測誤差信号から構成されるブロックの信号を変換した結果である変換係数が量子化される。
これらST100からST105の処理は、トップフィールドから切り出されるすべてのブロックに対して実行される。
次に、フレームメモリ1に入力されており、先のトップフィールドとフレームを構成するボトムフィールドの画像信号を対象とする。例えば、図5では、直前のフィールドがフィールド3(I)であればフィールド4(P)の画像信号が、直前のフィールドがフィールド7(P)であればフィールド8(P)の画像信号が入力される。ボトムフィールドに対してST100からST103までの動作は同じであるため説明を割愛する。
ST104では、制御回路14が現在のフィールドがトップフィールドであるかボトムフィールドであるか確認する。ボトムフィールドである場合はST106に遷移する。
ST106では、制御回路14は現在制御対象であるブロックのボトムフィールドにおける位置情報を用いてメモリ15のアドレス計算を行う。位置情報とは、図9に示す通りボトムフィールドの左上を原点とした場合の垂直座標Vと水平座標Hである。したがって、垂直座標Vと水平座標Hが同じ値を持つトップフィールドのブロックのメモリ15のアドレスが算出されることになる。メモリ15にはトップフィールドのブロックの情報が保存されているので、この位置情報と同じ位置情報を持つトップフィールドのブロックの情報を読み出す。読み出したブロックのタイプ情報が“Mosq”であった場合、同時に読み出した量子化パラメータの値を、現在処理対象のボトムフィールドのブロックに対して量子化回路5が量子化処理に用いる量子化パラメータにセットする。読み出したブロックのタイプ情報が“Mosq”でない場合は、ボトムフィールドのブロックの画像信号に基づいて量子化パラメータを制御する。制御回路14は、ボトムフィールドのブロックの画像信号から、このブロックの復号画像にモスキートノイズが発生する可能性があると判断した場合は、ボトムのみでモスキートノイズの発生を抑制する制御を行ってもよい。
これにより、図11に示すように、トップフィールドとボトムフィールドにおいて、それぞれの左上を原点として、原点からの相対位置が等しいブロックでは、制御回路14がトップフィールドのブロックの復号画像にモスキートノイズが発生する可能性があると判断した場合、これらのブロックは同じ量子化パラメータで量子化されることになり、画質の均一性が向上し、主観画質が向上する。従来の動画像符号化装置では、これら2つのブロックの量子化パラメータが必ずしも等しくなるとは限らないため、図10に示すように、復号画像を表示する場合、フレーム構造と比較してフィールド構造は画面上の垂直方向に2倍の広さで画質が不均一となり、主観画質が劣化する可能性があった。本発明により、この画質の不均一を抑制することが可能となるため、特に、フィールド構造で静止画や動きの少ない画像を符号化する場合に主観画質を向上させる効果が大きい。
実施の形態2.
図12は、この発明の実施の形態2に係る動画像符号化装置の構成を示すブロック図である。図12において、図1に示す実施の形態1に係る構成と同一部分は同一符号を付してその説明は省略する。図12に示す実施の形態2において、図1に示す実施の形態1との違いは、特徴量演算回路16をさらに備える点と、動き補償回路10から制御回路14にベクトル情報を出力するようにした点であり、この実施の形態2では、特徴量抽出手段13と特徴量演算回路16とで特徴量抽出手段を構成している。
図12において、特徴量演算回路16は、フィールド間差分情報として、図13に示すフィールド間差分絶対値和を出力するものであり、トップフィールド−トップフィールド(TTSAD)、トップフィールド−ボトムフィールド(TBSAD)、ボトムフィールド−ボトムフィールド(BBSAD)の3つのフィールド間差分絶対値和を出力する。TTSADは、トップフィールドN−1とトップフィールドNの画像信号における輝度の差分絶対値を画素単位で求めた画素数分の総和である。また、BBSADは、ボトムフィールドN−1とボトムフィールドNの画像信号における輝度の差分絶対値を画素単位で求めた画素数分の総和である。さらに、TBSADはトップフィールドNとボトムフィールドNの画像信号における輝度の差分絶対値を画素単位で求めた画素数分の総和である。また、これら3つの値は、各フィールドに含まれるブロックの数で割った値である。本実施の形態2では、トップフィールドから切り出されるブロック数とボトムフィールドから切り出されるブロック数は等しく、トップフィールドとボトムフィールドで同じ位置にあるブロックの大きさは等しいものとする。
現在符号化を行っているフィールドがトップフィールドである時、制御回路14は、動き補償回路10から出力されたベクトル情報を、ブロック情報、量子化パラメータとセットでメモリ15に記憶する。動き補償回路10から出力されるベクトル情報としては、参照フィールド、予測タイプ、水平ベクトル、垂直ベクトルである。
ここで、予測タイプと参照フィールドに関して、フィールド構造における16×16予測、16×8予測についてPフィールドを例に説明しておく。図14は、16×16予測を説明するための図である。16×16予測は、16×16画素サイズのブロック、即ち、MB単位に動き補償予測が行われる。現在の符号化対象がトップフィールドNであるとき、動き補償予測の参照画像はトップフィールドN−1またはボトムフィールドN−1であり、それぞれの参照画像に対して所定の評価関数で最小値となるベクトルVecTT、VecTBから1つが選択される。例えば、ベクトルVecTTの評価関数の値がベクトルVecTBの評価関数の値より小さい場合、ベクトVecTTが選択され、参照フィールドは同じトップフィールドとなる。
次に、ボトムフィールドNでは、ボトムフィールドN−1とトップフィールドNが参照画像となり、所定の評価関数で最小値となるベクトルVecBTとVecBBのどちらか一方が選択される。例えば、ベクトルVecBTが選択された場合、参照フィールドはトップフィールドとなる。16×16予測ではMBに1本のベクトル情報が発生する。Bフィールドの場合は、時間的に未来の画像からのベクトルが1本追加されて合計2本となる。
16×8予測については、16×16予測が16×16の画素サイズのブロックを単位として動き補償予測が行われるのに対し、この16×16の画素サイズのブロックの上半分(Upper)と下半分(Lower)の16×8画素サイズのブロックに分割し、それぞれに動き補償予測を行うものであり、MBに対して2本のベクトル情報が発生する。図15に示すように、例えばトップフィールドN上のMBのUpper側では、参照画像トップフィールドN−1に対し所定の評価関数が最小値となるベクトルVecUTT、参照画像のボトムフィールドN−1に対して所定の評価関数が最小値となるベクトルVecUTBのどちらか一方が選択され、Lower側でもベクトル情報が選択されるためMBとしては合計2本となる。Bフィールドの場合は、時間的に未来の画像からのベクトルが2本追加され、MBとしては4本のベクトル情報を持つ。
前記16×16予測と16×8予測の結果からMBの予測タイプを決定する。16×16予測の所定の評価関数の値と16×8予測の所定の評価関数の値が比較され、例えば、小さいほうが現在符号化中のMBの予測タイプとして選択される。ここで、16×8予測の所定の評価関数の値はUpper側の値とLower側の値を合計したものである。これらのベクトル選択動作は動き補償回路10で実行される。
参照フィールドの情報はトップフィールドまたはボトムフィールドである。予測タイプとして、フィールド予測、16×8予測などがあるが、制御回路14は、16×16予測の場合のみ、参照フィールド、水平ベクトル、垂直ベクトルをブロックタイプ、量子化パラメータとセットでメモリ15に書き込みを行う。これは、16×16予測が選択されるMBを画像中で静止している、または、動きの少ない領域であると判断するためである。16×16予測以外の場合は参照フィールドの情報として0をセットする。このフォーマットを図16に示す。
図16において、参照フィールドの項が‘1’である場合はトップフィールド、‘2’である場合はボトムフィールドとする。例えば、上から3行目のブロック情報は、このブロックの復号画像ではモスキートノイズが発生する可能性が高いと判断した“Mosq”であり、モスキートノイズを抑制するために量子化パラメータは10で量子化を行っており、16×16予測ではトップフィールドを参照しており、そのベクトルは水平方向に10、垂直方向に11となっている。
次に、ボトムフィールドの符号化における制御回路14の動作を説明する。図17は、制御回路14のボトムフィールドを対象とした動作を示すフローチャートである。ST200では、TTSAD、TBSAD、BBSADは、特徴量演算回路16から出力され、制御回路14に入力される。ST201では、制御回路14がTTSADとBBSADの平均値(SFAVE)を求める。ST202では、SFAVEとTBSADを比較する。ST202で、TBSADがSFAVEより大きい場合はST203に遷移し、トップフィールドとボトムフィールドの(V,H)に位置するブロックにおいて、トップフィールドのブロックのブロックタイプが“Mosq”であっても、同じ量子化パラメータで量子化する制御を行わない。これは、前記の条件を満たす場合は動きの速いシーンであると判断することによる。
ST202で条件が成立しない場合、ST204に遷移し、SFAVEとTBSADが等しいかを判定する。背景が静止して前面では高速で物体が移動するシーンを想定した判定である。等しくない場合はST212に遷移し、等しい場合はST205に遷移し、現在符号化対象であるボトムフィールドのブロックの動き補償予測における参照フィールドがボトムフィールドであるかを判定する。ボトムフィールドでない場合はST203に遷移し、ボトムフィールドである場合はST206に遷移し、水平ベクトル(BHV)、垂直ベクトル(BVV)を閾値THと比較する。ST206で水平ベクトル、垂直ベクトルがともに閾値THより小さい場合ST207に遷移し、そうでない場合はST203に遷移する。
ST207に遷移する場合、ST207では、トップフィールドの(V,H)に位置するブロックのブロックタイプをメモリ15から読み出しST208に遷移する。ST208では、タイプが“Mosq”である場合ST209に遷移し、そうでない場合はST203に遷移する。ST209に遷移した場合、ST209では参照フィールドがトップフィールドであるかを判定する。トップフィールドでない場合はST203に遷移し、トップフィールドである場合はST210に遷移し、水平ベクトル(THV)、垂直ベクトル(TVV)を閾値THと比較する。ST210で水平ベクトル、垂直ベクトルがともに閾値THとより小さい場合、ST211に遷移し、ボトムフィールドの(V,H)に位置するブロックの量子化パラメータをトップフィールドの(V,H)に位置するブロックの量子化パラメータ(TQSCALE)と同じ値になるように制御する。ST211で条件が成立しない場合はST203に遷移する。
ST204からST212に遷移した場合、ST212からST214までの処理は実施の形態1と同じ動作であるため詳細な説明は割愛するが、このST212からST214までの間は静止画像、或いは、動きの少ない画像に対応している。
ここで、TTSADとBBSADの値は少なくとも4フィールド分の画像信号が入力されていることが必要であるため、前記制御は入力順で5フィールド目以降から作用するものである。
また、TTSAD、BBSAD、TBSADの値をトップフィールドの制御に用いることにより、トップフィールドにおいても動きの速いシーンであると判断し、モスキートノイズの抑制を行う制御を停止することが可能であることは言うまでもない。
以上のように構成したので、実施の形態2では、動きの速いシーンではトップフィールドとボトムフィールドで同じ量子化パラメータで量子化を行う制御を行わないようにした。動きの速いシーンでは、人間の視覚特性からもモスキートノイズが知覚されにくいので量子化パラメータを制御しないようにした。量子化パラメータを制御すると発生符号量が増加する場合があり、動きの速いシーンでは符号化難易度が高く、発生符号量を多く必要とする可能性が高いため、量子化パラメータを制御しないようにした。また、背景が静止して前面では、動きの速いシーンなどに対しては、ベクトル情報から静止に近いブロックでのみ量子化パラメータを制御してモスキートノイズの発生を抑制するようにしたので、フィールド構造の符号化においてシーンに応じて効果的にモスキートノイズの発生を抑制して主観画質を向上できるという効果を奏する。
なお、この発明において、1つのフレームを構成するトップフィールドとボトムフィールドの関係は、トップフィールドがボトムフィールドに対し時間的に先に入力されることを前提としているが、その逆であるボトムフィールドがトップフィールドに対し時間的に先に入力される場合がある。この場合、トップフィールドとボトムフィールドを入れ換えれば何ら支障もなくこの発明を適応でき同様の効果を奏でることは言うまでもない。
この発明の実施の形態1に係る動画像符号化装置の構成を示すブロック図である。 符号化の対象となる入力画像信号の構造を示す説明図である。 図1に示す特徴量抽出手段としての特徴量抽出回路13、制御手段としての制御回路14とメモリ15の動作内容を示すフローチャートである。 図1に示すフレームメモリ1に入力されるフィールドを入力順に示した説明図である。 図4に示すフィールドを並べ替えて符号化した順に示した説明図である。 図4に示すフィールドを並べ替えないで符号化した順に示した説明図である。 図1に示すメモリ15にセットで保存される特徴量としてのブロックタイプと量子化パラメータを示す図である。 トップフィールドの左上を原点とした場合のブロックの垂直座標Vと水平座標Hから図1に示すメモリ15のアドレスを算出し、このアドレスが示す領域にブロックのタイプ、量子化パラメータをセットにして書き込みを行う場合の説明図である。 ボトムフィールドに対しての図8の対応図である。 復号画像を表示する場合にフレーム構造とフィールド構造の画質の不均一を抑制するための説明図である。 トップフィールドとボトムフィールドのそれぞれの左上を原点として、原点からの相対位置が等しいブロックにおいて同じ量子化パラメータで量子化することによる画質の均一性を説明するための図である。 この発明の実施の形態2に係る動画像符号化装置の構成を示すブロック図である。 図12に示す特徴量演算回路16から出力されるフィールド間差分情報であるフィールド間差分絶対値和を説明する図である。 フィールド構造における16×16予測を説明するための図である。 16×16の画素サイズのブロックの上半分と下半分の16×8画素サイズのブロックに分割し、それぞれに動き補償予測を行う際に、MBに対して2本のベクトル情報が発生することを説明する図である。 図12に示すメモリ15にセットで保存される特徴量としてのブロックタイプと量子化パラメータ及びベクトル情報を示す図である。 図12に示す制御回路14のボトムフィールドを対象とした動作を示すフローチャートである。
符号の説明
1 フレームメモリ、2 ブロック化回路、3 減算器、4 変換回路、5 量子化回路、6 逆量子化回路、7 逆変換回路、8 加算器、9 フレームメモリ、10 動き補償回路、11 符号化回路、12 バッファ、13 特徴量抽出回路、14 制御回路、15 メモリ、16 特徴量演算回路。

Claims (2)

  1. トップフィールド及びボトムフィールドのそれぞれの入力画像信号を複数のブロックに分割して出力するとともに、前記ブロックと予測画像信号との予測誤差信号を変換してその変換係数を量子化する変換手段と、
    前記変換手段により量子化された変換係数を逆量子化し、その逆量子化された変換係数を逆変換して予測誤差信号を復号し、復号された予測誤差信号と前記予測画像信号とを加算して参照画像信号を生成する参照画像生成手段と、
    前記参照画像生成手段により生成された参照画像信号と前記変換手段から出力された前記ブロックとから動き補償予測を実施して前記予測画像信号を生成する予測信号生成手段と、
    前記変換手段により量子化された変換係数を符号化し、その符号化データを伝送する符号化手段と
    を備えた動画像符号化装置において、
    前記変換手段から出力された前記ブロックの特徴量を抽出して出力する特徴量抽出手段と、
    前記特徴量抽出手段からの特徴量と前記変換手段の量子化情報とを対応付けて保持し、符号化によって前記変換手段から出力されたブロックの復号画像にモスキートノイズが発生する可能性を前記特徴量を用いて予測し、前記ブロックの復号画像にモスキートノイズが発生する可能性がある場合には、前記ブロックの量子化処理に必要な量子化情報を前記モスキートノイズの発生を抑制するように制御する制御手段と
    をさらに備え、
    前記変換手段は、前記トップフィールドのブロックの復号画像にモスキートノイズが発生する可能性がある場合には、前記ボトムフィールドにおける前記トップフィールドと同じ位置に存在するブロックに対する量子化の際に、前記トップフィールドと同じ量子化情報に基づいて量子化処理を実行する
    ことを特徴とする動画像符号化装置。
  2. 請求項1に記載の動画像符号化装置において、
    前記特徴量抽出手段は、トップフィールド−トップフィールドと、トップフィールド−ボトムフィールドと、ボトムフィールド−ボトムフィールドとの3つのフィールド間差分絶対値和を算出して、その情報であるフィールド間差分情報を出力する特徴量演算回路を有し、
    前記予測信号生成手段は、動き補償予測時に発生するベクトル情報を出力し、
    前記制御手段は
    記予測信号生成手段からのベクトル情報を、前記特徴量及び量子化情報とともに保持し、
    前記トップフィールド−ボトムフィールドのフィールド間差分絶対値和が、前記トップフィールド−トップフィールドのフィールド間差分絶対値和と前記ボトムフィールド−ボトムフィールドのフィールド間差分絶対値和との平均値よりも大きいかどうかを確認し、
    前記トップフィールド−ボトムフィールドのフィールド間差分絶対値和が前記平均値よりも大きい場合には、動きの速いシーンであると判断して、同じ位置のトップフィールド及びボトムフィールドのいずれか一方のブロックと同じ量子化情報で、同じ位置のトップフィールド及びボトムフィールドの他方のブロックの量子化処理を前記変換手段が行わないようにする
    ことを特徴とする動画像符号化装置。
JP2006021322A 2006-01-30 2006-01-30 動画像符号化装置 Active JP4849441B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006021322A JP4849441B2 (ja) 2006-01-30 2006-01-30 動画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006021322A JP4849441B2 (ja) 2006-01-30 2006-01-30 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2007208311A JP2007208311A (ja) 2007-08-16
JP4849441B2 true JP4849441B2 (ja) 2012-01-11

Family

ID=38487440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006021322A Active JP4849441B2 (ja) 2006-01-30 2006-01-30 動画像符号化装置

Country Status (1)

Country Link
JP (1) JP4849441B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013048521A1 (en) * 2011-10-01 2013-04-04 Intel Corporation Systems, methods and computer program products for integrated post-processing and pre-processing in video transcoding

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2935320B2 (ja) * 1992-11-25 1999-08-16 日本電気株式会社 画像圧縮伸長装置
JPH06217284A (ja) * 1993-01-18 1994-08-05 Sanyo Electric Co Ltd 画像符号化装置
JPH07143493A (ja) * 1993-11-17 1995-06-02 Canon Inc 画像符号化装置
JPH0998421A (ja) * 1995-09-29 1997-04-08 Toshiba Corp 画像符号化/復号化装置

Also Published As

Publication number Publication date
JP2007208311A (ja) 2007-08-16

Similar Documents

Publication Publication Date Title
KR101386274B1 (ko) 동화상 복호 장치 및 동화상 복호 방법
US6819714B2 (en) Video encoding apparatus that adjusts code amount by skipping encoding of image data
KR100850706B1 (ko) 적응적 동영상 부호화 및 복호화 방법과 그 장치
US8000393B2 (en) Video encoding apparatus and video encoding method
US20030095603A1 (en) Reduced-complexity video decoding using larger pixel-grid motion compensation
JP4774315B2 (ja) 画像復号化装置及び画像復号化方法
JP3210082B2 (ja) 符号化装置及びその方法
JP2008219205A (ja) 画像情報符号化装置及び画像情報符号化方法
JP2001128179A (ja) 動画像符号化装置および方法
JP3240024B2 (ja) 画像処理方法
KR100364748B1 (ko) 영상 변환 부호화 장치
KR19990032080A (ko) 적응적 블록 현상 제거 기능을 갖는 복호화기
JP2006246277A (ja) 再符号化装置、再符号化方法、および再符号化用プログラム
JP3599942B2 (ja) 動画像符号化方法、及び動画像符号化装置
JP2007124580A (ja) 動画像符号化プログラム、プログラム記憶媒体、および符号化装置。
JP2002010271A (ja) ビデオ符号化装置
JP4849441B2 (ja) 動画像符号化装置
JP4806483B2 (ja) 画像圧縮方法
JP5295089B2 (ja) 画像符号化装置
US6922490B2 (en) Image compression of selected regions based on transmission bit rate, motion, and/or region information, and bit selection before compression based on transmission bit rate
KR100454526B1 (ko) 시공간적 정보를 이용한 인트라 프레임의 에러 은닉방법
JP4857243B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP2005303555A (ja) 動画像符号化装置および動画像符号化方法
KR20010104058A (ko) 동영상 부호화기의 부호화 모드에 따른 적응적 양자화기
JP5488168B2 (ja) 画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111012

R150 Certificate of patent or registration of utility model

Ref document number: 4849441

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250