JP6294052B2 - 1パスビデオ超解像処理方法及びその映像処理を遂行する映像処理装置 - Google Patents

1パスビデオ超解像処理方法及びその映像処理を遂行する映像処理装置 Download PDF

Info

Publication number
JP6294052B2
JP6294052B2 JP2013232878A JP2013232878A JP6294052B2 JP 6294052 B2 JP6294052 B2 JP 6294052B2 JP 2013232878 A JP2013232878 A JP 2013232878A JP 2013232878 A JP2013232878 A JP 2013232878A JP 6294052 B2 JP6294052 B2 JP 6294052B2
Authority
JP
Japan
Prior art keywords
interpolation
resolution
processing method
image
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013232878A
Other languages
English (en)
Other versions
JP2015095702A (ja
Inventor
力 松永
力 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KABUSHIKI KAISYA HOUEI
Original Assignee
KABUSHIKI KAISYA HOUEI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KABUSHIKI KAISYA HOUEI filed Critical KABUSHIKI KAISYA HOUEI
Priority to JP2013232878A priority Critical patent/JP6294052B2/ja
Publication of JP2015095702A publication Critical patent/JP2015095702A/ja
Application granted granted Critical
Publication of JP6294052B2 publication Critical patent/JP6294052B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Television Systems (AREA)

Description

本発明は、映像の各種フォーマット間の変換処理等における1パスビデオ超解像処理方法及びその映像処理を遂行する映像処理装置に関する。
インターレース−プログレッシブ変換(デインターレースとも称する)は、垂直方向の2倍の拡大と見なせるが、画像の拡大処理は画素値の内挿補間処理として行われてきた。シンク関数による補間公式は無限項のたたみ込みとして表されるが、画像は有限のサイズであるため、窓関数を掛けて有限項近似するか、適当な有限関数で近似していた。特に、インターレース−プログレッシブ変換では、静止領域におけるフレーム解像度を復元するために、フレーム間差分に基づく動き検出処理による動き適応変換が行われてきた。また、近年、超解像(Super Resolution)と呼ばれる処理の研究が盛んに行われている。
例えば、動き検出回路の例としては、特許第2642846号公報や特開平5−300541号公報、特開2001−223995公報等、多くの公知文献が存在する。
特開2009−70123号公報
S. C. Park, M. K. Park, and M. G. Kang, Super-resolution image reconstruction: a technical overview,IEEE Signal Processing Magazine, Vol. 20, No. 3, pp.21-36. May 2003.
シンク関数を近似した補間処理では、解像度の劣化が生じる。しかし、近似項数を増しても、画像の不連続性によりエッジ部ではリンギングが生じてしまう。フレーム間差分に基づく動き検出処理による動き適応変換では、動き検出処理のための特別な処理が必要となる。検出処理における誤検出、検出漏れを避けるための様々な工夫もなされているが、処理コストが掛かる。再構成型超解像と呼ばれる処理の多くは反復を基本とするものであり、リアルタイム処理には向かない。
本発明は、上述の問題点に鑑み為されたものであり、フィールド内空間方向性補間とフレーム間時間方向性補間を組み合わせることにより、エッジのジャギを低減し、フレーム間の静止領域におけるフレーム解像度を復元したデインターレース処理を可能とし、さらに、フレーム内空間方向性補間によって、画像内容に適応した任意サイズへの拡大である解像度変換処理を可能とすることを目的とする。また、後処理としての非線形エンハンサ処理によって、さらなる解像度の向上を図ることを目的とする。
フィールド内画素の方向による補間を行う。画素の方向性の推定には、補間画素を中心とする近傍画素からなるブロックを用いたブロックマッチングにより推定する。ブロックマッチングの結果から重み係数を計算して、すべての方向補間の結果を重み付け平均したものを最終的な補間結果とする。さらに、フレーム間時間方向による補間結果も同様にブロックマッチングを行い、マッチング結果から重み係数を計算して、重み付け平均に加える。このとき、マッチング結果から最良の方向の補間を選択する。そのようにして、方向性補間の重み付け平均によりプログレッシブ変換された画像をフレーム内空間性補間により任意サイズへ拡大する。さらに、そのような解像度変換の結果を非線形エンハンサ処理により、解像度の向上を図る。すべての処理は1パスでの処理が可能であり、リアルタイム処理も期待される。
フィールド内空間方向性補間とフレーム間時間方向性を組み合わせることにより、エッジのジャギを低減し、フレーム間の静止領域におけるフレーム解像度を復元したデインターレース処理が可能となり、さらに、フレーム内空間方向性補間によって、画像内容に適応した任意サイズへの拡大である解像度変換処理が可能となる。後処理としての非線形エンハンサ処理によって、さらなる解像度の向上が図られる。
本発明の処理全体の概要を説明するブロック図である。 ブロックマッチングによる画素の方向性の推定について説明する概要図である。 ODDk−1&EVENk−1とODD&EVENのフレーム間のブロックマッチング及び時間方向性補間について説明する概要図である。 サブピクセル精度のフレーム内空間方向性補間について説明する図である。 非線形エンハンサ処理の動作概要について説明する図である。 時間空間方向性補間とマルチスケール非線形エンハンサによるビデオ超解像について、階層フィルタ処理概要について説明するために、階層処理を視覚化し、最初の行は入力画像であり、2行目はカーネルサイズ5画素のガウシアンフィルタによるフィルタ処理がなされたものであり、3行目は2行目の結果を1画素おきに用いて同一のフィルタ処理を行ったものである。 階層フィルタ処理によるマルチスケール非線形エンハンサ処理概要について説明するブロック図である。 順次走査とインターレース走査について説明するための順次走査について説明する図である。 順次走査とインターレース走査について説明するためのインターレース走査について説明する図であり、1枚の画像を2枚のフィールドに分け、各フィールドで1本おきに合計525本の走査線を走査することを説明する図である。 順次走査とインターレース走査について説明するための隣接するフィールドが空間的に1ラインだけオフセットが生じていることを説明する図であって、第1フィールドおよび第2フィールドを併せて1フレームと称するものとする。 人工的なエッジ画像例であり、傾斜角が各々12度である場合を説明する図である。 人工エッジ画像におけるエッジ角度(エッジ傾斜角)に対する復元画像と原画像の平均二乗誤差画像のピークSN比の結果のグラフであり、バイキュービック補間(Bicubic)、方向性補間(Dirlntp)、方向性補間+非線形エンハンサ(Dirlntp+NLEnh)について説明する図である。 連続するインターレース走査されたフレーム画像を説明する図である。 本発明におけるフィールド内方向性補間処理およびフレーム間時間方向性補間によって、奇数フィールド画素から偶数フィールド画素を生成したフレーム画像への変換結果について説明する図である。 図14に示すエッジ部の領域の拡大画像を説明する図であって、紙面左側が従来法(キュービック補間)を説明し、紙面右側が本発明による画像を説明する図である。 図14に示す静止テロップ部の領域の拡大画像を説明する図であり、紙面左側が従来法(キュービック補間)を説明し、紙面右側が本発明による画像を説明する図である。 領域判別による画素毎のブロックマッチング結果のSADα値の標準偏差値の画像表示を示しており、白い画素ほどエッジらしさを表し、画素毎のマッチング残差による偏差値の差分絶対値の最大値が白100%になるようにスケールしたものであって、インターレース画像であるので、垂直方向のサイズがフレーム画像の半分となっていることを説明する図である。 各領域の画素におけるフィールド内画素の方向性を推定するブロックマッチング結果のSADα値のグラフの一例を示す図であり、横軸α値0〜8は図2における左上から右下方向から順に右上から左下方向までの9方向を表し、エッジ部(edge)、テクスチャ部(texture)、平坦部(plane)を示す図である。 デインターレース処理の結果を1350画素×1080ラインに解像度変換した結果を説明する図である。 図19で示した結果に加えて、さらにマルチスケール非線形エンハンサ処理した結果を説明する図である。 図19(エンハンスなし)の結果の周波数スペクトル画像について示す図であり、非線形エンハンサ処理により、周波数成分が拡張されていることを説明する図である。 図20(エンハンスあり)の結果の周波数スペクトル画像について示す図であり、非線形エンハンサ処理により、周波数成分が拡張されていることを説明する図である。 垂直周波数0における水平周波数スペクトル(いずれも正規化周波数)のグラフ表示を説明する図であり、レベル0と1のDoGフィルタによるエンハンス結果(Fine)、レベル0と1及びレベル1と2のDoGフィルタによるエンハンス結果(Fine+Coarse)、エンハンスなし(Non−Enhance)を説明する図である。 水平周波数0における垂直周波数スペクトル(いずれも正規化周波数)のグラフ表示を説明する図であり、レベル0と1のDoGフィルタによるエンハンス結果(Fine)、レベル0と1及びレベル1と2のDoGフィルタによるエンハンス結果(Fine+Coarse)、エンハンスなし(Non−Enhance)を説明する図である。 従来の内挿補間処理について説明する図である。 再構成型超解像処理について説明するブロック図である。
(実施形態における新規な技術思想)
・インターレース−プログレッシブ変換においては、フィールド内の画素の方向性を注目画素近傍領域からなるブロックによるブロックマッチングにより推定して、各方向性補間の結果をマッチング残差から計算される重み係数による重み付け平均したものを最終的な補間の結果とする点。
・ブロックマッチングの結果から、画像のエッジ部、テクスチャ部、平坦部を判別して、領域毎に最良の補間を選択的に行う点。
・さらに、フレーム間時間方向における奇数フィールドと偶数フィールドからなるフレーム画像によるブロックマッチングを行い、時間方向の補間結果もマッチング残差から重み係数を計算して、フィールド内空間方向性補間の重み付け平均に加えることにより統一的に扱うことができる点。
・インターレース−プログレッシブ変換されたフレーム画像も同様にして、フレーム内方向性補間によって任意サイズへの拡大である解像度変換を行う点。
・解像度変換の結果をマルチスケール非線形エンハンサ処理を適応クリップ処理とともに用いて、さらなる解像度の向上を図る点。
(実施形態における重要な技術要素)
・インターレース−プログレッシブ変換処理(デインターレース処理)。
・解像度変換処理。
・マルチスケール非線形エンハンサ処理。
・適応クリップ処理。
(技術要素の機能)
・インターレース−プログレッシブ変換処理におけるフィールド内画素の方向性推定のためのブロックマッチング処理、フィールド内画素による方向性補間処理、各方向性補間の結果のマッチング残差による重み付け平均処理、マッチング残差による領域判別処理。
・解像度変換処理におけるフレーム内画素の方向性推定のためのブロックマッチング処理、フレーム内画素による方向性補間処理、各方向性補間の結果のマッチング残差による重み付け平均処理。
・マルチスケール非線形エンハンサ処理におけるマルチスケールエッジ検出処理およびレベルに関する非線形操作処理。
・適応クリップ処理における注目画素近傍における入力画素値の最大値最小値探索処理。
実現方法としては、ベースバンドビデオ信号を処理するハードウェア装置により実現することも可能であるし、MXFファイルを処理するソフトウェアおよびそれを実行するコンピュータをベースとした装置により実現することも可能であるし、MXFファイルをベースバンドビデオ信号に変換、あるいは逆変換する装置を用いれば、いかなる構成による実現も可能である。
本発明は、限定された離散的な時間空間方向における補間処理の結果の信頼性であるブロックマッチング残差から計算される重み係数を用いた重み付け平均によって、連続的な方向のエッジ領域に対応した補間を行うものであるが、これをさらなる時間空間的な方向に拡張することは原理的にはいくらでも可能であり、多様な空間的な画像内容や画像間の動きに対応することができる。
(本発明にかかる実施形態の要旨)
図1は、本発明の処理全体の概要を説明するブロック図である。図1に示すように、フィールド内およびフレーム間による空間および時間方向の補間処理からなるデインターレース処理(インターレースープログレッシブ変換処理)と、その結果のプログレッシブ画像をフレーム内方向性補間により任意サイズに拡大する解像度変換処理の2段階の処理からなり、さらに、後処理として、マルチスケール化した非線形エンハンサ処理を行う。非線形エンハンサ処理による過剰な補正を抑制するために、注目画素近傍における入力画素値の最大値最小値を探索して、それらの値による適応的なクリップ処理を併用する。
また、図2は、ブロックマッチングによる画素の方向性の推定について説明する概要図である。図2から理解できるように、奇数フィールド(ODD)における5つの方向の画素○の組合せにより、偶数フィールド(EVEN)における画素●を補間生成する。補間に用いる画素○を中心とする3画素×3ラインのブロックを定義して、各方向におけるブロック間の差分絶対値総和(SAD)を計算する。水平走査線上の画素の1次元補間により生成したサブピクセル精度の画素×による4方向も加える。
ブロックマッチング規準には、M画素×Nラインのブロック領域中の画素数で正規化した差分絶対値総和(Sum of Absolute Difference,SAD)を用いる。
ここで、

は、整数部分(切捨て)を表す床関数であり、Δαは、方向によるオフセット値である。
ブロックマッチングを行ったすべての方向における補間結果を次のように重み付け平均したものを最終的な補間結果とする。
ここで、

は各方向における補間結果であり、wαは次のようなブロックマッチング残差によるガウス重みとする。
σは、各方向におけるブロックマッチングの結果のSADαの許容範囲の調整パラメータである。
フィールド内画素の方向性が画像内容によっては、明確に得られない場合があるので、画像中のエッジ部、テクスチャ部、平坦部を判別して、領域毎に最適なフィールド内空間補間を行うものとする。
画像の領域判定の方法は、具体的には次のように行うものとする。
1、すべての方向におけるブロックマッチングの結果のSAD値の標準偏差σSADを計算する。
2、σSAD<dの場合、平坦部と判定する。ここで、dは、画像中の平坦部であることを判定するための閾値である。
3、SAD値データをソートして、小さい方からn個のSAD値データを除外した場合の標準偏差σ(n)SADを計算する。
4、|σSAD−σ(n)SAD|<eの場合、エッジ部と判定する。そうでなければ、テクスチャ部と判定する。ここで、eは、画像中のテクスチャ部であることを判定するための閾値である。
図3は、ODDk−1&EVENk−1とODD&EVENのフレーム間のブロックマッチング及び時間方向性補間について説明する概要図である。図3に示すように、奇数フィールドと偶数フィールドからなるフレーム画像によるブロック領域を用いて、隣接するフレーム画像間でブロックマッチングを行う。得られるマッチング残差による重み係数とフレーム間補間画素を重み付け平均処理に加えることにより、フレーム間静止領域におけるフレーム解像度を復元する。
また、解像度変換処理は、サブピクセル精度のフレーム内空間方向性補間により次のように行う。図4は、サブピクセル精度のフレーム内空間方向性補間について説明する図である。

の入力画像におけるサブピクセル位置の座標を(ξ,η)とすると、次のように簡単になる。
方向性を推定するためのブロック画素も同様にして、補間に用いる画素を中心としたサブピクセル位置の画素によるものを用いればよい。
また、図5は、非線形エンハンサ処理の動作概要について説明する図である。Dogフィルタにより検出されたエッジ成分をレベルに関する非線形操作により高周波成分を拡張して、原画像に加えるが、ここで、非線形操作による過剰な強調を抑制するために、注目画素近傍における入力画素値の最大値最小値を探索して、それらの値による適応的なクリップ処理を行う。レベルに関する非線形操作は、例えば、次のようなものが考えられる。
ここで、sgn(x)は符号関数であり、rは、2以上の定数である。
また、図6は、時間空間方向性補間とマルチスケール非線形エンハンサによるビデオ超解像について、階層フィルタ処理概要について説明するために、階層処理を視覚化し、最初の行は入力画像であり、2行目はカーネルサイズ5画素のガウシアンフィルタによるフィルタ処理がなされたものであり、3行目は2行目の結果を1画素おきに用いて同一のフィルタ処理を行ったものである。
このような非線形エンハンサをマルチスケール拡張する。すなわち、画像内容によって、細かなエッジから緩やかなエッジまで、空間周波数に応じた解像度の向上を可能とする。空間周波数の低い成分を抽出するためには、フィルタの演算量が増す(いわゆるタップ数が必要)。
そこで、階層処理によってフィルタ処理の演算量を低減する。図6の1行目(Level0)は原画像における画素であり、5タップのフィルタ処理を行った結果が2行目(Level1)であり、その結果を1画素おきに同一の5タップのフィルタ処理を行う。以降、フィルタ処理を行う画素間隔を広げていく。図7は、階層フィルタ処理によるマルチスケール非線形エンハンサ処理概要について説明するブロック図である。
(本発明にかかる実施形態の詳細な説明)
実施形態の要旨概要は上述したとおりであるが、本発明にかかる実施形態の詳細な説明について以下に詳述する。なお、以下の説明においては、上述した要旨の内容と一部重複する技術事項も含まれるものであるが、説明の流れを維持して理解を容易にする観点から、重複説明を存置するものとする。
(1パスビデオ超解像処理)
(デインターレース処理)
(インターレース方式ビデオ)
伝送のためには、信号は1次元でなければならない。このため、走査と呼ばれる方法により、時間空間的に3次元であるビデオ信号を1次元の信号に変換する。図9に示すように、1枚の画像(これをフレームと呼ぶ)を2枚のフィールドに分け、各フィールドで1本おきに合計525本の走査線で走査する(NTSCの場合)。この方式により伝送周波数の帯域を半減することができるが、処理としては複雑になる。すなわち、図10に示すように、時間方向tと垂直方向yに着目すれば、走査線は標本点と見ることができるが、インターレース方式の場合は、標本点である画素が時間的に1/60秒離れているだけでなく、空間的に走査線1ラインだけオフセットが生じている。
ここで、図8は、順次走査とインターレース走査について説明するための順次走査について説明する図であり、図9は、順次走査とインターレース走査について説明するためのインターレース走査について説明する図であり、1枚の画像を2枚のフィールドに分け、各フィールドで1本おきに合計525本の走査線を走査することを説明する図である。また、図10は、順次走査とインターレース走査について説明するための隣接するフィールドが空間的に1ラインだけオフセットが生じていることを説明する図であって、第1フィールドおよび第2フィールドを併せて1フレームと称するものとする。
(内挿補間)
従来の画像の拡大方法は、原画素と原画素の間の画素を内挿補間生成することにより行われている。標本値から元来の連続的な信号fa(x)を復元する内挿公式は、次のように与えられる。
[数式6]において、Tは標本化周期であり、その逆数は標本化周波数と呼ばれる。sin(π/T)x/(π/T)xは、シンク(sinc)関数である。画像の場合、fa(αT)は原画像における離散的な画素値に相当する。実際には、適当な窓関数を掛けて、無限に続くシンク関数を有限で打ち切ったり、適当な有限関数により近似したりする。上記[数式6]は、1次元信号に対するものである。画像は2次元信号であり、水平垂直の各方向に分離して処理が可能である。デインターレース処理は、フィールド画像の垂直方向における2倍拡大と見なせる。
特に、インターレース−プログレッシブ変換では、静止領域におけるフレーム解像度を復元するために、フレーム間差分に基づく動き検出処理による動き適応変換が行われてきた。動き検出回路の例としては、特許第2642846号公報や特開平5−300541号公報、特開2001−223995公報等、多くある。
また、近年、超解像と呼ばれる処理の研究が盛んに行われている。
[非特許文献]
S. C. Park, M. K. Park, and M. G. Kang, Super-resolution image reconstruction: a technical overview,IEEE Signal Processing Magazine, Vol. 20, No. 3, pp.21-36. May 2003.
[特許文献]
特開2009−70123号公報「画像処理装置及びその方法」
(フィールド内空間方向性補間)
フィールド内の画素を用いた空間方向性補間によるインターレース−プログレッシブ変換を行う。入力フィールド画像I(i,j),i=1,..,H,j=1,..,V/2とすると、変換されたフレーム画像I(i’,j’),i’=1,..,H,j’=1,..,Vは次のようになる。
ここで、modは剰余演算子であり、kは1から始まるフィールド番号を表す。また、

は、空間方向性補間による変換画素である。
画素の方向性の推定には、ブロックマッチングを用いる。ブロックマッチングの規準としては、次のようなM画素×Nラインのブロック領域中の画素数により正規化した差分絶対値総和(Sum of Absolute Difference,SAD)を用いる。
ここで、

は、整数部分(切捨て)を表す床関数であり、Δαは、方向によるオフセット値である。図2では、ピクセル精度の方向の場合、Δα=0,±1,±2であり、サブピクセル精度の方向の場合、Δα=±0.5,±1.5である。サブピクセル精度の方向性の推定と補間処理は、水平走査線上の画素を1次元補間することにより行う。
ブロックマッチングを行ったすべての方向における補間結果を次のように重み付け平均したものを最終的な補間結果とする。
ここで、

は、各方向における補間結果であり、wαは次のようなブロックマッチング残差によるガウス重みとする。
ここで、σrは各方向におけるブロックマッチングの結果SADαの許容範囲を調整するためのパラメータである。
(領域適応処理と動き適応処理)
フィールド内画素の方向性が画像内容によっては、明確に得られない場合がある。そこで、画像中のエッジ部、テクスチャ部、平坦部を判別して、領域毎にフィールド内空間補間を行う。画像の領域判定の方法は、次のように行う。
1、すべての方向におけるブロックマッチングの結果のSADα値の標準偏差σSADを計算する。
2、σSAD<dの場合、平坦部と判定する。ここで、dは、画像中の平坦部であることを判定するための閾値である。
3、SADα値データをソートして、小さい方からn個のSADα値データを除外した場合の標準偏差σ(n)SADを計算する。
4、|σSAD−σ(n)SAD|<eの場合、エッジ部と判定する。そうでなければ、テクスチャ部と判定する。ここで、eは、画像中のテクスチャ部であることを判定するための閾値である。
エッジ部と判定された画素に対してフィールド内方向性補間の重み付け平均を行う。それ以外の領域の画素に関しては、垂直方向のみの補間を行う。
さらにフレーム間でマッチング処理を行い、フレーム間補間処理を行う。図3に示すように、奇数フィールドと偶数フィールドからなるフレーム画像によるブロック領域を用いて、隣接するフレーム画像間でブロックマッチングを行う。得られるマッチング残差による重み係数とフレーム間補間画素を[数式9]の重み付け平均処理に加えることにより、フレーム間静止領域におけるフレーム解像度を復元する。
(解像度変換処理)
任意サイズへの拡大処理である解像度変換処理においてもデインターレース処理同様、空間的な方向性補間を行う。ここでは、インターレース走査されたフィールド画像をプログレッシブ走査されたフレーム画像に変換した結果を方向性補間するため、フレーム内空間方向性補間と呼ぶことにする。
図4の入力フレーム画像におけるサブピクセル位置の画素●を補間生成するには、走査線上のピクセル位置の画素○により1次元補間した画素×によりフレーム内空間方向性補間する。各方向における補間画素値

は、画素間の空間的な距離の逆比による重み付け平均により、

として計算できるが、

の入力画像におけるサブピクセル位置の座標を(ξ,η)とすると、次のように簡単になる。

方向性を推定するためのブロック画素も,補間に用いる画素を中心としたサブピクセル位置の画素によるものを用いればよい。各方向における補間画素

をデインターレース処理同様、[数式9]の重み付け平均する。
(マルチスケール非線形エンハンサ)
フレーム内空間方向性補間による解像度変換処理の結果を後処理的に画像のエッジ情報に基づいた非線形エンハンサ処理を行うことにより、さらなる解像度の向上を図る。図5に非線形エンハンサ処理の動作を示す。
エッジの検出にはガウシアン差分(Difference of Gaussian,DoG)フィルタを用いる。ガウシアン差分を計算するためのガウシアン平滑化フィルタの処理カーネルを、

とすると、画像I(x)のDoGフィルタは、

である(ただし、1次元の場合)。
ここで、*はたたみ込み演算であり、σ1>σ2である。DoGフィルタはガウシアン平滑化フィルタの2次微分であるラプラシアン(Laplacian of Gaussian, LoG)フィルタの良い近似であり、計算効率も高い。画像の場合には、水平垂直方向に分離して処理を行うことができる。ラプラシアンフィルタ同様、方向によらないエッジ検出が可能である。
DoGフィルタにより検出されたエッジ成分をレベルに関する非線形操作により高周波成分を拡張して、原画像に加えるが、ここで、非線形操作による過剰な強調を抑制するために、注目画素近傍における入力画素値の最大値・最小値を探索して、それらの値による適応的なクリップ処理を行う。
レベルに関する非線形操作としては、例えば、次のようなものが考えられる。

ここで、sgn(x)は符号関数であり、rは2以上の定数である。
このような非線形エンハンサをマルチスケール拡張する。DoGフィルタによるエッジ検出は、σ値を変えることにより、細かなエッジから緩やかなエッジまで検出が可能であるが、σ値が増すに従って計算量も増える。そこで、次のような階層処理を用いる。
図6は、階層処理を視覚化したものである。最初の行は入力画像であり、2行目はカーネルサイズ5画素のガウシアンフィルタによるフィルタ処理がなされたものである。
また、3行目は、2行目の結果を1画素おきに用いて同一のフィルタ処理を行ったものである。以降、フィルタ処理を行う画素間隔を広げていく。図7は、階層処理によるマルチスケール非線形エンハンサ処理のブロック図であり、図1は、処理全体のブロック図である。
(シミュレーション実験)
(人工エッジ画像実験)
図11は人工的なエッジ画像例であり、傾斜角が各々12度である場合を説明する図である。エッジの傾斜角度を0度から60度まで、6度刻みで変えたエッジ画像に、正規化カットオフ周波数0.3の低域通過フィルタ処理を行って、水平垂直ともに1/2縮小した後、インターレース化を行う。そのようなインターレース画像に対して、本発明による方法を用いてデインターレース処理、解像度変換処理およびマルチスケール非線形エンハンサ処理を行い、原画像を復元する。復元画像と原画像の平均二乗誤差画像MSEを計算して、そのピークSN比(PSNR)により復元の良さを評価する。バイキュービック補間による従来法とも比較する。
また、図12は、人工エッジ画像におけるエッジ角度(エッジ傾斜角)に対する復元画像と原画像の平均二乗誤差画像のピークSN比の結果のグラフであり、バイキュービック補間(Bicubic)、方向性補間(Dirlntp)、方向性補間+非線形エンハンサ(Dirlntp+NLEnh)について説明する図である。
従来法による結果は、エッジの傾斜角度が増すにつれて、ピークSN比が減少しているが、本発明における方向性補間の結果は、エッジの傾斜角度によらず、ほぼ一定であり、最大4.6dBの改善が得られている。また、非線形エンハンサ処理を行うことにより、さらに改善している。補間方向が離散的であっても、重み付け平均を行うことによって、連続的なエッジの方向に対応していることが理解できる。
デインターレース処理および解像度変換処理における方向は、図2にあるようにピクセル精度で5方向、サブピクセル精度で4方向の計9方向とした。方向の推定のためのブロックマッチングのブロックサイズはいずれも9画素×7ライン、各方向の補間結果の重み付け平均のためのσrは、それぞれ1.0,0.75とした。非線形エンハンサ処理における階層DoGフィルタは、σ=1として、階層はレベル2まで、非線形操作としては、3乗関数を用いた。
(実画像実験)
(デインターレース処理)
図13は、連続するインターレース走査されたフレーム画像を説明する図である。画像サイズは720画素×576ライン(PAL方式)であり、フィールド間の動きによる縞状のコーミング(combing)が見られる。第1画像における奇数フィールド画像をデインターレース処理してフレーム画像に変換する。
また、図14は、本発明におけるフィールド内方向性補間処理およびフレーム間時間方向性補間によって、奇数フィールド画素から偶数フィールド画素を生成したフレーム画像への変換結果について説明する図である。
フィールド内における方向としては、図2にあるようにピクセル精度で5方向、サブピクセル精度で4方向の計9方向とした。フィールド内およびフレーム間方向性推定のためのブロックマッチングにおけるブロックサイズは、9画素×7ラインであり、各方向の補間結果の重み付け平均のためのσr=1.0とした。
画像中の枠で囲まれた領域は、エッジ部(141)、テクスチャ部(142)、平坦部(143)、静止テロップ部(144)であり、従来法であるキュービック補間との違いを比較するために領域を拡大した画像も示している。図15のエッジ部は従来法と比較して、方向性補間の重み付け平均の結果はジャギが低減して滑らかなのが理解できる。図16の静止テロップ部はフレーム間時間方向補間により、フレーム解像度が復元されているのが理解できる。また、テクスチャ部は領域判別の結果から従来法同様、垂直方向のみの補間結果となっている。
ここで、図15は、図14に示すエッジ部の領域の拡大画像を説明する図であって、紙面左側が従来法(キュービック補間)を説明し、紙面右側が本発明による画像を説明する図である。また、図16は、図14に示す静止テロップ部の領域の拡大画像を説明する図であり、紙面左側が従来法(キュービック補間)を説明し、紙面右側が本発明による画像を説明する図である。
図17は、領域判別による画素毎のブロックマッチング結果のSADα値の標準偏差値の画像表示を示しており、白い画素ほどエッジらしさを表し、画素毎のマッチング残差による偏差値の差分絶対値の最大値が白100%になるようにスケールしたものであって、インターレース画像であるので、垂直方向のサイズがフレーム画像の半分となっていることを説明する図である。
また、図18は、各領域の画素におけるフィールド内画素の方向性を推定するブロックマッチング結果のSADα値のグラフの一例を示す図であり、横軸α値0〜8は図2における左上から右下方向から順に右上から左下方向までの9方向を表し、エッジ部(edge)、テクスチャ部(texture)、平坦部(plane)を示す図である。
領域判別には、ブロックマッチングの結果のSADα値データをソートして、小さい方から4個のSADα値を除外した標準偏差σ(4)SADを用いた。また、テクスチャ判別のためのしきい値e=10とした。
(解像度変換処理・マルチスケール非線形エンハンサ処理)
また、図19は、デインターレース処理の結果を1350画素×1080ラインに解像度変換した結果を説明する図であり、図20は、図19で示した結果に加えて、さらにマルチスケール非線形エンハンサ処理した結果を説明する図である。
解像度変換のためのフレーム内方向性補間におけるブロックマッチングには、デインターレース処理同様、9画素×7ラインのブロックを用いた。方向性も同様に9方向である。非線形エンハンサ処理における階層DoGフィルタは、σ=1として、その階層はレベル2まで、非線形操作としては、3乗関数を用いた。
また、図21、図22は、図19(エンハンスなし)、図20(エンハンスあり)のそれぞれの結果の周波数スペクトル画像について示す図であり、非線形エンハンサ処理により、周波数成分が拡張されていることを説明する図である。
図23は、垂直周波数0における水平周波数スペクトル(いずれも正規化周波数)のグラフ表示を説明する図であり、レベル0と1のDoGフィルタによるエンハンス結果(Fine)、レベル0と1及びレベル1と2のDoGフィルタによるエンハンス結果(Fine+Coarse)、エンハンスなし(Non−Enhance)を説明する図である。
図24は、水平周波数0における垂直周波数スペクトル(いずれも正規化周波数)のグラフ表示を説明する図であり、レベル0と1のDoGフィルタによるエンハンス結果(Fine)、レベル0と1及びレベル1と2のDoGフィルタによるエンハンス結果(Fine+Coarse)、エンハンスなし(Non−Enhance)を説明する図である。マルチスケール化により、さらに広範囲の周波数成分が拡張されていることが図23よ図24とから理解できる。
(まとめ)
上述のように、次世代テレビ放送における過去の映像コンテンツのリパーパスのために、反復によらない1パスビデオ超解像処理として、画像の局所的な時間空間方向による補間とマルチスケール化した非線形エンハンサを提案した。
また、インターレース走査されたフィールド画像をプログレッシブ走査されたフレーム画像に変換するデインターレース処理と任意サイズへの拡大を行う解像度変換処理の2段階の処理からなり、デインターレース処理では、フィールド内空間方向性補間にフレーム間時間方向性補間を組み合わせることによって、エッジ部におけるジャギを低減しつつ、静止テロップ部のフレーム解像度を復元した。
また、フィールド内画素の方向を推定するブロックマッチング残差の結果から領域判別処理を行い、領域毎に最良な補間処理も実現した。
また、フレーム内空間方向性補間による解像度変換処理を行った後、マルチスケール化した非線形エンハンサにより、さらなる解像度の向上を図った。
また、上述したすべての処理は1パスでの実現が可能であり、リアルタイムでの処理が期待される。
なお、図25は従来の内挿補間処理について説明する図であり、図26は再構成型超解像処理について説明するブロック図である。
本発明は、映像分野全般、特に、映像の各種フォーマット間の変換処理に適するが、画像・映像の様々な解析や認識にも適用することができる。

Claims (10)

  1. インターレース−プログレッシブ変換において、フィールド内の画素の方向性を注目画素近傍領域からなるブロックによるブロックマッチングにより推定して、各方向性補間の結果をマッチング残差から計算される重み係数による重み付け平均したものを最終的な補間の結果とし、
    さらに、フレーム間時間方向における奇数フィールドと偶数フィールドからなるフレーム画像による第2ブロックマッチングを行って時間方向の補間も遂行し、フィールド内空間方向性補間とフレーム間時間方向性を組み合わせる
    ことを特徴とする1パスビデオ超解像処理方法。
  2. 請求項1に記載の1パスビデオ超解像処理方法において、
    前記ブロックマッチングの結果から、画像のエッジ部、テクスチャ部、平坦部を判別して、領域毎に最良の補間を選択的に行う
    ことを特徴とする1パスビデオ超解像処理方法。
  3. 請求項1または請求項2に記載の1パスビデオ超解像処理方法において
    前記時間方向の補間結果も前記第2ブロックマッチングのマッチング残差から重み係数を計算して、フィールド内空間方向性補間の重み付け平均に加えることにより統一的に扱う
    ことを特徴とする1パスビデオ超解像処理方法。
  4. 請求項1乃至請求項3のいずれか一項に記載の1パスビデオ超解像処理方法において、
    前記インターレース−プログレッシブ変換されたフレーム画像も同様にして、フレーム内方向性補間によって任意サイズへの拡大である解像度変換を行う
    ことを特徴とする1パスビデオ超解像処理方法。
  5. 請求項4に記載の1パスビデオ超解像処理方法において、
    前記解像度変換の結果をマルチスケール非線形エンハンサ処理を適応クリップ処理とともに用いて、さらなる解像度の向上を図る
    ことを特徴とする1パスビデオ超解像処理方法。
  6. フィールド内画素の方向による補間を行い、補間画素を中心とする近傍画素からなるブロックを用いたブロックマッチングにより画素の方向性を推定し、
    前記ブロックマッチングの結果から重み係数を計算して、すべての方向補間の結果を重み付け平均したものを最終的な補間結果とするとともに、
    フレーム間時間方向による補間結果も第2ブロックマッチングを行い、前記第2ブロックマッチング結果から重み係数を計算して、重み付け平均に加え、前記第2ブロックマッチング結果から最良の方向の補間を選択し、方向性補間の重み付け平均によりプログレッシブ変換された画像をフレーム内空間性補間により非整数倍の任意サイズへ拡大して、解像度変換の結果を非線形エンハンサ処理により、解像度の向上を図る
    ことを特徴とする1パスビデオ超解像処理方法。
  7. 請求項4に記載の1パスビデオ超解像処理方法において、
    前記任意サイズへの拡大は非整数倍の拡大である
    ことを特徴とする1パスビデオ超解像処理方法。
  8. 請求項1乃至請求項7のいずれか一項に記載の1パスビデオ超解像処理方法を用いて映像処理を遂行する映像処理装置。
  9. 請求項1乃至請求項7のいずれか一項に記載の1パスビデオ超解像処理方法を用いた映像処理をコンピュータに遂行させるためのプログラム。
  10. 請求項9に記載のプログラムを格納されたプログラム記録媒体。
JP2013232878A 2013-11-11 2013-11-11 1パスビデオ超解像処理方法及びその映像処理を遂行する映像処理装置 Active JP6294052B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013232878A JP6294052B2 (ja) 2013-11-11 2013-11-11 1パスビデオ超解像処理方法及びその映像処理を遂行する映像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013232878A JP6294052B2 (ja) 2013-11-11 2013-11-11 1パスビデオ超解像処理方法及びその映像処理を遂行する映像処理装置

Publications (2)

Publication Number Publication Date
JP2015095702A JP2015095702A (ja) 2015-05-18
JP6294052B2 true JP6294052B2 (ja) 2018-03-14

Family

ID=53197853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013232878A Active JP6294052B2 (ja) 2013-11-11 2013-11-11 1パスビデオ超解像処理方法及びその映像処理を遂行する映像処理装置

Country Status (1)

Country Link
JP (1) JP6294052B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6137437B1 (ja) * 2015-11-17 2017-05-31 三菱電機株式会社 画像処理装置及び画像処理方法
CN108961186B (zh) * 2018-06-29 2022-02-15 福建帝视信息科技有限公司 一种基于深度学习的老旧影片修复重制方法
CN112785501B (zh) * 2021-01-20 2023-09-01 北京百度网讯科技有限公司 文字图像的处理方法、装置、设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2231460B (en) * 1989-05-04 1993-06-30 Sony Corp Spatial interpolation of digital video signals
JP4171211B2 (ja) * 2001-12-18 2008-10-22 株式会社ルネサステクノロジ 映像信号表示処理装置
JP3829985B2 (ja) * 2002-10-31 2006-10-04 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP4190462B2 (ja) * 2004-05-28 2008-12-03 シャープ株式会社 画素補間方向検出装置、画素補間装置、及び映像信号処理装置

Also Published As

Publication number Publication date
JP2015095702A (ja) 2015-05-18

Similar Documents

Publication Publication Date Title
US7406208B2 (en) Edge enhancement process and system
JP4490987B2 (ja) 高解像度化装置および方法
JP5414519B2 (ja) 運動補償されたビデオの空間アップコンバート
US20110206127A1 (en) Method and Apparatus of Frame Interpolation
JP5133038B2 (ja) 画像復元方法および画像復元装置
JP6294052B2 (ja) 1パスビデオ超解像処理方法及びその映像処理を遂行する映像処理装置
US8594199B2 (en) Apparatus and method for motion vector filtering based on local image segmentation and lattice maps
US7679676B2 (en) Spatial signal conversion
JP4355577B2 (ja) ノイズ抑制対角線方向補正によるアップコンバージョン
Jung et al. An effective de-interlacing technique using two types of motion information
Park et al. Covariance-based adaptive deinterlacing method using edge map
KR100913890B1 (ko) 움직임 적응 시공간 디인터레이싱 방법
JP4734239B2 (ja) 空間的信号変換
Krämer et al. Super-resolution mosaicing from MPEG compressed video
KR100698266B1 (ko) 3차원 디인터레이싱 장치 및 그 방법
KR101010961B1 (ko) 블럭 기반의 영역 분류를 이용한 공간적 디인터레이싱 방법
Chen et al. A gradient inverse weighted filtering approach for video deinterlacing
KR102336387B1 (ko) 구조 및 경사 기반 영상 보간 방법
JP2013500666A (ja) 信号フィルタリング方法及びフィルタ係数計算方法
Venkatesan et al. Video deinterlacing with control grid interpolation
Zhang et al. Fusion-based edge-sensitive interpolation method for deinterlacing
Jin et al. A gradient guided deinterlacing algorithm
JP2007074051A (ja) 走査変換装置及びプログラム並びに走査変換装置を有するシステム
Chen et al. Median Based Wiener Filtering interpolation method for Progressive display using Local Homogeneous Area Selector
Bi et al. A new source-side de-interlacing method for high quality video content

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180215

R150 Certificate of patent or registration of utility model

Ref document number: 6294052

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250