JP2013150066A - 画像処理装置、画像処理方法、およびプログラム - Google Patents

画像処理装置、画像処理方法、およびプログラム Download PDF

Info

Publication number
JP2013150066A
JP2013150066A JP2012007272A JP2012007272A JP2013150066A JP 2013150066 A JP2013150066 A JP 2013150066A JP 2012007272 A JP2012007272 A JP 2012007272A JP 2012007272 A JP2012007272 A JP 2012007272A JP 2013150066 A JP2013150066 A JP 2013150066A
Authority
JP
Japan
Prior art keywords
edge
image
quantization
image processing
quantization error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012007272A
Other languages
English (en)
Inventor
Masato Kazui
誠人 数井
Shunichi Kaneko
俊一 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung R&D Institute Japan Co Ltd
Original Assignee
Samsung Yokohama Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Yokohama Research Institute filed Critical Samsung Yokohama Research Institute
Priority to JP2012007272A priority Critical patent/JP2013150066A/ja
Publication of JP2013150066A publication Critical patent/JP2013150066A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】処理対象の画像信号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を推定することが可能な、画像処理装置、画像処理方法、およびプログラムを提供する。
【解決手段】入力画像信号が示す離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像が、分割された分割領域ごとに、分割領域が示す画像がエッジを含むか否かを判定するエッジ判定部と、エッジを含むと判定された分割領域であるエッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出する増分符号算出部と、エッジ分割領域ごとに算出された増分符号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を、エッジ分割領域ごとに推定する量子化誤差推定部と、を備える画像処理装置が提供される。
【選択図】図1

Description

本発明は、画像処理装置、画像処理方法、およびプログラムに関する。
近年、例えばVOD(Video On Demand)などのように、インターネット(Internet)を介して動画像を配信するサービスの普及が進んでおり、また、UGC(User Generated Contents)をテレビ受像機やPC(Personal Computer)などを用いてユーザが視聴できる環境も整いつつある。また、例えば日本では、テレビジョン放送がデジタル化している。例えば上記のような、画像配信サービスや、デジタルテレビジョン放送において、高解像度のデジタル画像の配信や放送を可能とした技術の一つとして、画像圧縮技術がある。画像圧縮技術の規格としては、例えば、MPEG−2(ISO/IEC 13818)や、H.264/MPEG−4 AVCが挙げられる。
例えば、MPEG−2や、H.264/MPEG−4 AVCでは、所定の符号化方式にて画像が非可逆に圧縮される。そのため、例えば上記のような符号化方式が用いられる場合には、画像のデータ量の削減には有利であるが、その反面、例えばブロックノイズ、モスキートノイズ、リンギングノイズなどの符号化に起因するノイズ(歪み。以下、「符号化ノイズ」と示す場合がある。)が、画像をみるユーザに認識されてしまうことが起こりうる。
このような中、符号化に起因するノイズの低減を図る技術が開発されている。符号化に起因するノイズの低減を図る技術としては、例えば、特許文献1に記載の技術や、特許文献2に記載の技術、非特許文献1に記載の技術に記載の技術が挙げられる。
また、画像の特徴を表現する技術も開発されている。隣接する、または任意の2画素間の輝度の大小関係を“0”または“1”のバイナリ・ビットである増分符号(Increment Sign:IS)で表現する技術としては、例えば、非特許文献2に記載の技術に記載の技術が挙げられる。
特開平11−32333号公報 特開2006−332987号公報
HARASHIMA H., ODAJIMA K., SHISHIKUI Y., and MIYAKAWA, H.," Epsilon-separating nonlinear digital filter and its applications", Electronics and Communications in Japan, (ISSN 0424-8368). Vol. 65, pp. 11-19. Apr. 1982. S. Kaneko, et al: "Robust image registration by increment sign correlation", Pattern Recognition, 35(10):2223-2234, October 2002.
例えば非特許文献1に記載の技術では、エッジを含む領域(例えばMPEG−2では8×8画素単位のブロック)を検出し、検出された領域内部においてエッジ保存平滑化を行うことによって、符号化ノイズを低減する。
しかしながら、例えば非特許文献1に記載の技術を用いる場合には、本来画像に含まれているテクスチャと符号化ノイズ成分との両方に基づいてノイズ量を推定してしまう可能性があることから、ノイズの平滑化時に、本来の画像テクスチャ(すなわち、画像における平滑化してはならない部分)も平滑化してしまう恐れがある。
また、例えば特許文献1に記載の技術では、ビットストリームから復号した離散コサイン変換(Discrete Cosine Transform。以下、「DCT」と示す場合がある。)係数に基づいて、ブロックノイズとモスキートノイズの線形和からなるエネルギー関数を定義する。そして、例えば特許文献1に記載の技術では、上記エネルギー関数が画像全体で最小となるように、ガウス・ザイデル法を用いた反復演算処理により最適化をすることによって、圧縮ノイズ(特許文献1に記載の技術においては、ブロックノイズおよびモスキートノイズ。)を発生させる、DCT係数の量子化誤差成分を推定している。
ここで、特許文献1に記載の技術では、ブロック境界部分の輝度段差を、ブロックノイズのエネルギーとして用いている。また、特許文献1に記載の技術では、ブロック内の量子化雑音が一様でない性質を、モスキートノイズのエネルギーとして用いている。上記は、量子化ステップの高さが最小DCT係数より高いときに、量子化ノイズ(雑音)がホワイトノイズでなくなることを、周波数領域においてモデル化したものである。
しかしながら、例えば特許文献1に記載の技術では、上記エネルギー関数の最適化を画像全体で行うので、例えば局所的に発生しうるモスキートノイズなどによるノイズ量を、局所的に推定することはできない。
また、例えば特許文献2に記載の技術では、DCT量子化によって失われる基底関数の周波数成分を検出する二つの変換係数列を用意し、これらの変換係数列と原画像とを畳み込むことによって得られる二つの相関値を算出する。そして、特許文献2に記載の技術では、算出された二つの相関値が2次元平面上で遷移する軌跡形状に基づいて、処理対象の画像信号がモスキートノイズにより劣化しているか否か(すなわち、モスキートノイズを含んでいるか否か)を判定する。ここで、特許文献2に記載の技術の原理は、画像における平坦部分からのエッジの立ち上がり部分(または立ち下がり部分)のリンギングに対して、上記変換係数列を一画素ずつずらして畳み込んだときの出力が、ある特定の遷移パターンになることを利用してエッジ近傍のリンギング状態を検出するものである。
しかしながら、特許文献2に記載の技術に係る方法では、モスキートノイズの発生の有無を判定することができる可能性はあるが、DCT係数の量子化誤差成分を推定することはできない。
さらに、例えば特許文献2に記載の技術を用いる場合には、モスキートノイズの低減のために、例えば、一般的なローパス・フィルターやε−フィルタなどの非線形フィルタなどの平滑化フィルタを用いる必要がある。よって、例えば特許文献2に記載の技術を用いる場合には、画像における平滑化してはならない部分も平滑化してしまう恐れがある。
また、例えば非特許文献2に記載の技術に係る増分符号は、明度変動に対してロバストである。そのため、例えば非特許文献2に記載の技術に係る増分符号は、例えばFA(Factory Automation)分野におけるパターンマッチングにおいてよく用いられている。しかしながら、非特許文献2では、符号化ノイズを検出することについて、何らの考慮もなされていない。
上記のように、例えば、特許文献1に記載の技術や、特許文献2に記載の技術、非特許文献1に記載の技術、非特許文献2に記載の技術を用いたとしても、画像信号が示す画像において発生しうる、離散コサイン変換係数の量子化により生じる量子化誤差を、推定することができるとは限らない。
本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、処理対象の画像信号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を推定することが可能な、新規かつ改良された画像処理装置、画像処理方法、およびプログラムを提供することにある。
上記目的を達成するために、本発明の第1の観点によれば、入力画像信号が示す離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像が、分割された分割領域ごとに、分割領域が示す画像がエッジを含むか否かを判定するエッジ判定部と、エッジを含むと判定された分割領域であるエッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出する増分符号算出部と、上記エッジ分割領域ごとに算出された増分符号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を、上記エッジ分割領域ごとに推定する量子化誤差推定部と、を備える画像処理装置が提供される。
かかる構成によって、処理対象の画像信号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を推定することができる。
また、上記量子化誤差推定部は、算出された増分符号と、離散コサイン変換係数の高周波成分の基底パターンから算出される基底増分符号との差分の二乗和を非線形最適化処理することによって、上記量子化誤差を推定してもよい。
また、上記量子化誤差推定部は、上記非線形最適化処理において、上記エッジ分割領域における水平方向および垂直方向それぞれに対応する離散コサイン変換係数の次数を設定してもよい。
また、上記量子化誤差推定部は、上記エッジ判定部において判定されたエッジの方向に基づいて、上記離散コサイン変換係数の次数を、上記判定されたエッジの方向に対応するように適応的に設定してもよい。
また、上記増分符号算出部は、上記増分符号を算出する算出部と、上記エッジ分割領域におけるエッジに対応する画素をマスキングするエッジ画素マスキング部と、を備え、上記量子化誤差推定部は、マスキングされた画素に対応する増分符号を、上記量子化誤差の推定に用いなくてもよい。
また、上記入力画像信号から、推定された量子化誤差に基づくノイズ画像を示す信号を減算して、上記入力画像信号のノイズを低減するノイズ低減部をさらに備えてもよい。
また、上記目的を達成するために、本発明の第2の観点によれば、入力画像信号が示す離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像が、分割された分割領域ごとに、分割領域が示す画像がエッジを含むか否かを判定するステップと、エッジを含むと判定された分割領域であるエッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出するステップと、上記エッジ分割領域ごとに算出された増分符号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を、上記エッジ分割領域ごとに推定するステップと、を有する画像処理方法が提供される。
かかる方法を用いることによって、処理対象の画像信号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を推定することができる。
また、上記目的を達成するために、本発明の第3の観点によれば、入力画像信号が示す離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像が、分割された分割領域ごとに、分割領域が示す画像がエッジを含むか否かを判定するステップ、エッジを含むと判定された分割領域であるエッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出するステップ、上記エッジ分割領域ごとに算出された増分符号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を、上記エッジ分割領域ごとに推定するステップ、をコンピュータに実行させるためのプログラムが提供される。
かかるプログラムを用いることによって、処理対象の画像信号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を推定することができる。
本発明によれば、処理対象の画像信号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を推定することができる。
本発明の実施形態に係る画像処理装置の構成の一例を示すブロック図である。 画像圧縮過程の概念を示す説明図である。 非圧縮画像(原画像)、観測画像、および符号化ノイズ成分の関係の一例を示す説明図である。 本発明の実施形態に係る増分符号算出部の構成の一例を示すブロック図である。 本発明の実施形態に係る入力画像信号が示す画像(観測画像)における増分符号の一例を示す説明図である。 本発明の実施形態に係る量子化誤差推定部における処理の一例を示すブロック図である。 本発明の実施形態に係るノイズ低減部の構成の一例を示す説明図である。 本発明の実施形態に係る画像処理装置におけるノイズ低減処理の効果の一例を示す説明図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
(本発明の実施形態に係る画像処理方法)
本発明の実施形態に係る画像処理装置の構成について説明する前に、本発明の実施形態に係る画像処理方法について説明する。また、以下では、本発明の実施形態に係る画像処理装置が、入力画像信号(処理対象の画像信号)に対して、本発明の実施形態に係る画像処理方法に係る処理を行うものとして説明する。
ここで、本発明の実施形態に係る入力画像信号としては、例えば、離散コサイン変換(DCT)を含む符号化処理および量子化処理により非可逆圧縮された動画像(または、複数の静止画像)、または静止画像を示す画像信号(例えば、符号化処理過程にDCTを含むコーデックによって圧縮された画像を示す画像信号)が挙げられる。以下では、本発明の実施形態に係る画像処理装置が、フレーム画像(静止画像)からなる動画像を示す画像信号を処理するものとして説明する。ここで、本発明の実施形態に係るフレーム画像とは、例えば、動画像の1フレーム(動画像がインタレース画像の場合には、1フィールドに対応する。)に対応する画像である。以下では、本発明の実施形態に係る画像処理装置が、時間順に1フレームずつ入力される画像信号を処理する場合を例に挙げて説明する。
また、本発明の実施形態に係る画像処理装置は、例えば、本発明の実施形態に係る画像処理装置がテレビ塔などから送信された放送波を(直接的、またはセットトップボックスなどを介して間接的に)受信してデコードした結果得られる画像信号を、入力画像信号として処理する。なお、本発明の実施形態に係る画像処理装置が処理する入力画像信号は、上記に限られない。例えば、本発明の実施形態に係る画像処理装置は、ネットワークを介して(または直接的に)外部装置から送信された入力画像信号を処理することも可能である。また、本発明の実施形態に係る画像処理装置は、例えば、記憶部(後述する)や、本発明の実施形態に係る画像処理装置から着脱可能な外部記録媒体に記憶された画像データをデコードすることにより得られた画像信号を処理してもよい。さらに、本発明の実施形態に係る画像処理装置が、例えば、画像(動画像/静止画像)を撮像することが可能な撮像部(後述する)を備えている場合、すなわち、本発明の実施形態に係る画像処理装置が撮像装置として機能する場合には、本発明の実施形態に係る画像処理装置は、例えば、当該撮像部(後述する)により撮像された画像に対応する画像信号を処理してもよい。
離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像を示す画像信号(入力画像信号)を処理する再生側の装置では、一般的に、圧縮前の原画像が未知であることが多い。そこで、本発明の実施形態に係る画像処理装置は、符号化ノイズの発生要因として、下記に示す(I)、(II)の2つの条件を前提条件として入力画像信号を処理することによって、符号化ノイズを検出する(より具体的には、DCT係数の量子化により生じる量子化誤差を推定する。)。
(I)エッジ強度の大きな画素(コントラストの大きな画素)がより大きな符号化ノイズを発生させる。
(II)画像のテクスチャ部分における輝度の振幅は、エッジ部分における輝度振幅より小さいと仮定し、画像のテクスチャ部分から発生する符号化ノイズは小さい、または、無いとする。
より具体的には、本発明の実施形態に係る画像処理装置は、入力画像信号に基づいて、分割領域ごとにエッジを検出し、エッジを含む分割領域(以下、「エッジ分割領域」と示す。)を判定する(エッジ判定処理)。
ここで、本発明の実施形態に係る分割領域としては、例えば、8×8画素の矩形の領域や16×16画素の矩形の領域など、予め規定された大きさの領域が挙げられる。上記予め規定された大きさの領域は、例えば、本発明の実施形態に係る画像処理装置の用途(例えば、テレビジョン放送の再生や、Blu−ray Disc(登録商標)の再生など)に応じて、設定される。なお、本発明の実施形態に係る分割領域は、上記に限られない。例えば、本発明の実施形態に係る画像処理装置は、入力画像信号をデコードしたデコーダから、ブロック境界の情報(または、コーデックの情報)を取得する場合には、当該ブロック境界の情報が示すブロック境界に対応する領域を、分割領域としてもよい。また、本発明の実施形態に係る画像処理装置は、ビットストリームに基づいて分割領域を設定することも可能である。
また、本発明の実施形態に係る画像処理装置は、エッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出する(増分符号算出処理)。ここで、本発明の実施形態に係る増分符号としては、例えば、隣接する2画素間の輝度値の差分値の正負に基づき値が設定されるバイナリ・ビットが挙げられる。本発明の実施形態に係る画像処理装置は、例えば、隣接する2画素間の輝度値の差分値を算出し、差分値が正の値のとき増分符号として“1”を設定し、また、差分値が負の値のとき増分符号として“0”を設定する。
なお、本発明の実施形態に係る増分符号は、上記のように“0”または“1”の二値で表されるバイナリ・ビットに限られない。例えば、本発明の実施形態に係る増分符号は、“−1”、“0”、“1”の三値で表されてもよい。三値で表される本発明の実施形態に係る増分符号の例については、後述する。
また、本発明の実施形態に係る画像処理装置は、エッジ分割領域ごとに算出された増分符号に基づいて、離散コサイン変換(DCT)係数の量子化により生じる量子化誤差を、エッジ分割領域ごとに推定する(量子化誤差推定処理)。より具体的には、本発明の実施形態に係る画像処理装置は、例えば、算出された増分符号と、DCT係数の高周波成分の基底パターンから算出される基底増分符号との差分の二乗和を非線形最適化処理することによって、エッジ分割領域ごとに量子化誤差を推定する。
ここで、入力画像信号が示す画像(以下、「観測画像」と示す場合がある。)に対応する増分符号と、DCT係数の高周波領域の基底画像パターンに対する増分符号とは、エッジ分割領域内の平坦部分における輝度の振幅が小さい場合に類似度が高くなる。また、類似度が高い場合には、DCT係数の量子化誤差成分の推定精度が高くなる。よって、本発明の実施形態に係る画像処理装置は、非線形最適化処理として、算出された増分符号と基底増分符号との差分の二乗和を最小化することによって、DCT係数の量子化により生じる量子化誤差の推定精度を向上させる。なお、本発明の実施形態に係る画像処理装置における非線形最適化処理の一例については、後述する。
本発明の実施形態に係る画像処理装置は、本発明の実施形態に係る画像処理方法に係る処理として、例えば上記のようなエッジ判定処理、増分符号算出処理、および量子化誤差推定処理、を行うことによって、入力画像信号(処理対象の画像信号)に基づいて、DCT係数の量子化により生じる量子化誤差を推定する。
ここで、本発明の実施形態に係る画像処理装置は、エッジ分割領域ごとにDCT係数の量子化により生じる量子化誤差を推定する。よって、本発明の実施形態に係る画像処理装置は、局所的に(分割領域ごとに)DCT係数の量子化により生じる量子化誤差を推定することができる。
また、本発明の実施形態に係る画像処理装置は、上記のように、エッジ分割領域ごとにDCT係数の量子化により生じる量子化誤差を推定する。よって、本発明の実施形態に係る量子化誤差の推定結果を用いることによって、平滑化処理を行わずにノイズを低減することができる。本発明の実施形態に係るノイズ低減処理については、後述する
なお、本発明の実施形態に係る画像処理方法に係る処理は、上記エッジ判定処理〜上記量子化誤差推定処理に限られない。例えば、本発明の実施形態に係る画像処理装置は、さらに、上記量子化誤差推定処理における量子化誤差の推定結果に基づいて、入力画像信号のノイズを低減してもよい(ノイズ低減処理)。本発明の実施形態に係る画像処理装置は、例えば、入力画像信号から、推定された量子化誤差に基づくノイズ画像を示す信号を減算して、入力画像信号のノイズを低減する。
より具体的には、本発明の実施形態に係る画像処理装置は、推定された量子化誤差に基づいてノイズ画像を生成する。そして、本発明の実施形態に係る画像処理装置は、入力画像信号から、生成されたノイズ画像を示す信号を減算する。上記のように、入力画像信号(離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像を示す画像信号)から、本発明の実施形態に係る生成されたノイズ画像を示す信号を減算することによって、入力画像信号に含まれうるノイズが低減される。ここで、本発明の実施形態に係るノイズ低減処理は、圧縮前の原画像を推定する処理に相当する。
上記のように、本発明の実施形態に係るノイズ低減処理では、平滑化処理を行わずにノイズが低減される。よって、本発明の実施形態に係る画像処理装置は、本発明の実施形態に係るノイズ低減処理を行うことによって、例えば画像のディティールが損われるなどのような、ノイズを低減する処理に伴って生じうる副作用を回避することができる。
以下、本発明の実施形態に係る画像処理装置の構成の一例について説明をすると共に、本発明の実施形態に係る画像処理方法に係る処理の具体例についても併せて説明する。
また、以下では、入力画像信号が、MPEG−2(ISO/IEC 13818)により符号化される画像信号、すなわち、8×8画素のブロックにて符号化される画像信号である場合を例に挙げて、本発明の実施形態に係る画像処理装置の構成の一例、および本発明の実施形態に係る画像処理方法に係る処理の具体例について説明する。なお、本発明の実施形態に係る入力画像信号が、MPEG−2(ISO/IEC 13818)により符号化される画像信号に限られないことは、言うまでもない。
また、以下では、本発明の実施形態に係る画像処理装置が、入力画像信号(離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像を示す画像信号)から生成したノイズ画像を示す信号を減算する、本発明の実施形態に係るノイズ低減処理を行う機能を有する場合を例に挙げて説明する。なお、本発明の実施形態に係る画像処理装置の構成は、本発明の実施形態に係るノイズ低減処理を行う機能を有する構成に限られない。例えば、本発明の実施形態に係る画像処理装置は、本発明の実施形態に係るノイズ低減処理を行う機能を有さずに、本発明の実施形態に係る量子化誤差の推定結果を示す信号(ノイズの検出結果を示す信号)、または、本発明の実施形態に係る量子化誤差の推定結果を示す信号と入力画像信号とを、本発明の実施形態に係るノイズ低減処理を行う機能を有する外部装置に送信してもよい。
(本発明の実施形態に係る画像処理装置)
図1は、本発明の実施形態に係る画像処理装置100の構成の一例を示すブロック図である。画像処理装置100は、例えば、分割領域設定部102と、エッジ判定部104と、増分符号算出部106と、量子化誤差推定部108と、ノイズ低減部110とを備える。
また、画像処理装置100は、例えば、制御部(図示せず)や、ROM(Read Only Memory。図示せず)、RAM(Random Access Memory。図示せず)、記憶部(図示せず)、ユーザが操作可能な操作部(図示せず)、様々な画面を表示画面に表示する表示部(図示せず)、外部装置と通信を行うための通信部(図示せず)、撮像部(図示せず)などを備えていてもよい。画像処理装置100は、例えば、データの伝送路としてのバスにより上記各構成要素間を接続する。
ここで、制御部(図示せず)は、例えば、CPU(Central Processing Unit)や各種処理回路などで構成され、画像処理装置100全体を制御する。また、制御部(図示せず)は、例えば、分割領域設定部102、エッジ判定部104、増分符号算出部106、量子化誤差推定部108、およびノイズ低減部110(または、これらのうちの1または2以上の部)の役目を果たしてもよい。なお、分割領域設定部102、エッジ判定部104、増分符号算出部106、量子化誤差推定部108、およびノイズ低減部110は、各部の処理を実現可能な専用の(または汎用の)処理回路で構成されていてもよいことは、言うまでもない。
また、制御部(図示せず)は、例えば、ノイズ低減処理が行われた画像信号(以下、「出力画像信号」と示す。)をエンコードして、記憶部(図示せず)に記録する、および/または、出力画像信号が示す画像を表示部(図示せず)や外部表示装置の表示画面に表示させるなど、出力画像信号に対する処理を行う役目を果たしてもよい。
ROM(図示せず)は、制御部(図示せず)が使用するプログラムや演算パラメータなどの制御用データを記憶する。RAM(図示せず)は、制御部(図示せず)により実行されるプログラムなどを一時的に記憶する。
記憶部(図示せず)は、画像処理装置100が備える記憶手段であり、例えば、画像データや、アプリケーションなど様々なデータを記憶する。ここで、記憶部(図示せず)としては、例えば、ハードディスク(Hard Disk)などの磁気記録媒体や、フラッシュメモリ(flash memory)などの不揮発性メモリ(nonvolatile memory)などが挙げられる。また、記憶部(図示せず)は、画像処理装置100から着脱可能であってもよい。
操作部(図示せず)としては、例えば、ボタンや、方向キー、あるいは、これらの組み合わせなどが挙げられる。また、画像処理装置100は、例えば、画像処理装置100の外部装置としての操作入力デバイス(例えば、キーボードやマウスなど)と接続することも可能である。
表示部(図示せず)としては、例えば、液晶ディスプレイ(Liquid Crystal Display;LCD)や有機ELディスプレイ(organic ElectroLuminescence display)などが挙げられる。なお、表示部(図示せず)は、例えばタッチスクリーンなどのように、表示とユーザ操作とが可能なデバイスであってもよい。また、画像処理装置100は、表示部(図示せず)の有無に関わらず、画像処理装置100の外部装置としての表示デバイス(例えば、外部ディスプレイなど)と接続することもできる。
通信部(図示せず)は、画像処理装置100が備える通信手段であり、ネットワークを介して(あるいは、直接的に)、外部装置と無線/有線で通信を行う。ここで、通信部(図示せず)としては、例えば、通信アンテナおよびRF(Radio Frequency)回路(無線通信)や、IEEE802.15.1ポートおよび送受信回路(無線通信)、IEEE802.11bポートおよび送受信回路(無線通信)、あるいはLAN(Local Area Network)端子および送受信回路(有線通信)などが挙げられる。また、本発明の実施形態に係るネットワークとしては、例えば、LANやWAN(Wide Area Network)などの有線ネットワーク、無線LAN(WLAN;Wireless Local Area Network)や基地局を介した無線WAN(WWAN;Wireless Wide Area Network)などの無線ネットワーク、あるいは、TCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルを用いたインターネットなどが挙げられる。
撮像部(図示せず)は、静止画像または動画像を撮像する役目を果たす。撮像部(図示せず)を備える場合には、画像処理装置100は、例えば、撮像部(図示せず)における撮像により生成された画像信号を処理することが可能である。
ここで、本発明の実施形態に係る撮像部(図示せず)としては、例えば、レンズ/撮像素子と信号処理回路とから構成される撮像デバイスが挙げられる。レンズ/撮像素子は、例えば、光学系のレンズと、CMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を複数用いたイメージセンサとで構成される。また、信号処理回路は、例えば、AGC(Automatic Gain Control)回路やADC(Analog to Digital Converter)を備え、撮像素子により生成されたアナログ信号をデジタル信号(画像データ)に変換し、各種信号処理を行う。信号処理回路が行う信号処理としては、例えば、White Balance補正処理、色調補正処理、ガンマ補正処理、YCbCr変換処理、エッジ強調処理などが挙げられる。
画像処理装置100は、例えば図1の構成によって、入力される入力画像信号に基づいて処理を行い、入力画像信号に含まれるノイズが低減された出力画像信号を出力する。ここで、本発明の実施形態に係る入力画像信号は、例えばJPEGやMPEGなどのように、符号化処理過程にDCTを含むコーデックによって圧縮された画像(離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像)を示す。
図2は、画像圧縮過程の概念を示す説明図である。図2において、“X”は、圧縮前の原画像(非圧縮画像)のブロック分割画像を示し、“X’”は、圧縮後のブロック分割画像(観測画像)を示している。また、図2において“C”は、DCT係数を示し、“C”は、量子化されたDCT係数、“Q()”は、量子化関数を示している。ここで、量子化とは、DCT係数に対して情報量を削減するために行われる処理である。また、図2に示すエントロピー符号化、およびエントロピー復号化は、多値データを2値データに変換、逆変換する可逆的な処理である。また、図2に示す“C’”は、逆量子化されたDCT係数を示しており、“Q−1()”は、逆量子化関数を示している。また、図2に示す“N”は、符号化ノイズ成分を示している。
画像処理装置100は、原画像が未知である状態において、DCT係数の量子化により生じる量子化誤差を推定することにより符号化ノイズ成分“N”を推定して、推定された符号化ノイズ成分(検出された符号化ノイズ)を低減する。
ここで、図2に示す“C’”のi,j成分“c’ij”は、例えば下記の数式1で表される。数式1に示す“cij”は、圧縮する前のDCT係数のi,j成分であり、数式1に示す“Δij”は、基本量子化マトリクスQのi,j成分である。また、数式1に示す“QS”は、量子化スケールである。
・・・(数式1)
画像処理装置100が推定する対象の量子化誤差は、図2に示す“C’”のi,j成分“c’ij”と、圧縮する前のDCT係数のi,j成分“cij”との差であり、例えば下記の数式2で表される。数式2に示す量子化誤差“cnij”が、図2に示すノイズ成分Nの原因となる。
・・・(数式2)
また、図2に示す“X”(非圧縮画像)、“X’”(観測画像)、および“N”(符号化ノイズ成分)の関係は、例えば下記の数式3で表される。
・・・(数式3)
図3は、非圧縮画像(原画像)、観測画像、および符号化ノイズ成分の関係の一例を示す説明図である。ここで、図3に示すAは、観測画像を示しており、また、図3に示すBは、非圧縮画像(原画像)、図3に示すCは、符号化ノイズ成分をそれぞれ示している。また、図3は、原画像が、輝度が階段状(ステップ状)に変化するエッジである、ステップエッジを示す場合における例を示している。
例えば図3に示すように、非圧縮画像(原画像)、観測画像、および符号化ノイズ成分は、上記数式1の関係を有する。
以下、図1に示す画像処理装置100の構成例について説明しつつ、画像処理装置100における処理(画像処理方法に係る処理)の一例について説明する。
分割領域設定部102は、入力画像信号に基づいて、入力画像信号が示す画像に対して分割領域を設定する。
エッジ判定部104は、本発明の実施形態に係る画像処理方法に係る上記エッジ判定処理を主導的に行う役目を果たし、設定された分割領域ごとに、分割領域が示す画像がエッジを含むか否かを判定する。エッジ判定部104は、例えば、判別分析法(大津の2値化)を用いて、分割領域に対応する画像内の輝度ヒストグラムが特定の2つの値に集中していることを調べることによって、例えばステップエッジやラインエッジなどのエッジを含むか否かを判定する。ここで、ラインエッジとは、例えば、輝度の変化がパルス状となるエッジである。
なお、本発明の実施形態に係るエッジ判定部104における処理は、上記に限られない。例えば、エッジ判定部104は、隣接画素間の微分値と、当該微分値の空間的な連続性とをさらに考慮して、エッジを含むか否かを判定してもよい。隣接画素間の微分値と、当該微分値の空間的な連続性とをさらに考慮することによって、エッジ判定部104では、例えば、分割領域に対応する画像が市松模様を示す場合において、当該分割領域がエッジを含む分割領域であると誤判定することを防止することが可能となる。つまり、隣接画素間の微分値と、当該微分値の空間的な連続性とをさらに考慮することによって、エッジ判定部104は、エッジの検出精度をさらに向上させることができる。
また、エッジ判定部104は、設定された分割領域ごとに、文字領域(例えば、テロップを含む領域)をさらに検出する機能を有していてもよい。ここで、例えば、放送に係る画像では、文字のまわりにモスキートノイズが目立つことが多い。また、文字を構成するエッジはステップエッジであることが多く、文字内部の輝度分布は平坦かグラデーションであることが多い。よって、例えば、エッジ判定部104が文字領域をさらに検出する機能を有する場合には、エッジの検出精度をさらに向上させることができる。
画像処理装置100では、後述する増分符号算出部106、量子化誤差推定部108において、エッジ分割領域に対して処理が行われる。よって、例えば上記のように、エッジ判定部104がエッジの検出精度をさらに向上させることによって、画像処理装置100は、量子化誤差の推定精度をさらに向上させることができる。
増分符号算出部106は、本発明の実施形態に係る画像処理方法に係る上記増分符号算出処理を主導的に行う役目を果たし、エッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出する。
図4は、本発明の実施形態に係る増分符号算出部106の構成の一例を示すブロック図である。増分符号算出部106は、例えば、算出部112と、エッジ画素マスキング部114とを備える。
算出部112は、エッジ分割領域ごとに、増分符号を算出する。より具体的には、算出部112は、例えば下記の数式4、数式5に示す演算を行うことによって、増分符号を算出する。ここで、数式4に示す“I(x,y)”は、画素の位置(x,y)における輝度値であり、数式4に示す“δ(x,y)”は、隣接する2画素間の輝度値の差分を示している。また、数式5に示す“IS(x,y)”は、増分符号を示している。
・・・(数式4)
・・・(数式5)
算出部112は、エッジ分割領域ごとに、エッジ分割領域内の画素について上記数式4、数式5の演算を行うことによって増分符号を算出する。
エッジ画素マスキング部114は、エッジ分割領域におけるエッジに対応する画素をマスキングする。より具体的には、エッジ画素マスキング部114は、コントラストの大きいエッジ画素をマスキングし、マスキングされた画素が後述する量子化誤差推定部108における処理に用いられないようにする。ここで、本発明の実施形態に係るマスキングとは、例えば、該当する画素を量子化誤差推定部108が処理に用いることができない状態にすることをいう。エッジ画素マスキング部114は、量子化誤差推定部108が処理に用いられない状態にすることができれば、任意の方法を用いてマスキングを行うことが可能である。
ここで、エッジ部分の画素については、観測画像に対応する増分符号(算出された増分符号)と、DCT係数の量子化によって生じるDCT基底ノイズパターンとの類似度が低くなる可能性がある(後述する)。また、上記類似度が低くなると、後述する量子化誤差推定部108における非線形最適化処理に係る演算において、解が収束しないことも起こる可能性はある。
そこで、画像処理装置100は、エッジ画素マスキング部114を備え、エッジに対応する画素をマスキングすることによって、上記解が収束しないことが生じる可能性を低減する。より具体的には、エッジ画素マスキング部114は、エッジ分割領域内の画素のうち、上記数式4に示す“δ(x,y)”の絶対値が所定の閾値以上の画素(または、所定の閾値よりも大きい画素)を、エッジ画素と判定して、当該エッジ画素をマスキングする。ここで、上記所定の閾値は、例えば、“δ(x,y)”の絶対値の分布に対して大津の2値化などの手法を用いることによって、設定することができる。なお、本発明の実施形態に係る上記所定の閾値の設定方法が、上記に限られないことは、言うまでもない。
なお、上記数式5では、本発明の実施形態に係る増分符号が“0”または“1”の二値で表される例を示しているが、上述したように、本発明の実施形態に係る増分符号は、“0”または“1”の二値に限られない。例えば、増分符号算出部106(より厳密には、算出部112)は、例えば下記の数式6、数式7に示す演算を行うことによって、“−1”、“0”、“1”の三値で表される増分符号を算出することも可能である。
・・・(数式6)
・・・(数式7)
ここで、数式6に示す“I(x,y)”は、画素の位置(x,y)における輝度値であり、数式6に示す“δ(x,y)”は、隣接する2画素間の輝度値の差分を示している。また、数式7に示す“IS(x,y)”は、増分符号を示している。また、数式7に示す“T”は、輝度変化の少ない画素を判別するための閾値を示し、数式7に示す“T”は、エッジ画素を判別するための閾値を示している。ここで、上記閾値“T”は、例えば、“δ(x,y)”の絶対値の分布に対して大津の2値化などの手法を用いることによって、設定される。また、上記閾値“T”は、例えば、予め設定されている固定値であってもよいし、ユーザにより変更可能の可変値であってもよい。なお、本発明の実施形態に係る上記閾値“T”、“T”の設定方法が、上記に限られないことは、言うまでもない。
算出部112が上記数式6、数式7により増分符号を算出する場合、エッジ画素マスキング部114は、例えば、“δ(x,y)”の絶対値が“T”より大きい場合(または、“δ(x,y)”の絶対値が“T”以上の場合)には、“δ(x,y)”に対応する画素をエッジ画素と判定して、当該エッジ画素をマスキングする。
また、上記数式4、数式6では、増分符号算出部106(より厳密には、算出部112)が、水平方向に隣接する画素間の輝度値の差分に基づいて増分符号を算出する例を示しているが、本発明の実施形態に係る増分符号算出処理は、上記に限られない。例えば、増分符号算出部106は、垂直方向に隣接する画素間の輝度値の差分に基づいて増分符号を算出することも可能である。
増分符号算出部106は、例えば図4に示す構成によって、エッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出する。
なお、本発明の実施形態に係る増分符号算出部106の構成は、図4に示す構成に限られない。例えば、増分符号算出部106は、図4に示すエッジ画素マスキング部114を備えない構成をとることも可能である。増分符号算出部106が上記構成をとる場合であっても、本発明の実施形態に係る画像処理装置100は、上述した本発明の実施形態に係る画像処理方法に係る処理を実現することが可能である。よって、増分符号算出部106が上記構成をとる場合であっても、本発明の実施形態に係る画像処理装置100は、処理対象の画像信号に基づいて、DCT係数の量子化により生じる量子化誤差を推定することができる。以下では、増分符号算出部106が、上述した図4に示す構成である場合を例に挙げて説明する。
また、本発明の実施形態に係る画像処理装置100は、図4に示すエッジ画素マスキング部114を、増分符号算出部106と別体の構成要素として備えていてもよい。また、本発明の実施形態に係る画像処理装置100は、図4に示すエッジ画素マスキング部114を、図4に示すエッジ画素マスキング部114の前段に備える構成をとることも可能である。
再度図1を参照して、本発明の実施形態に係る画像処理装置100の構成の一例について説明する。量子化誤差推定部108は、本発明の実施形態に係る画像処理方法に係る上記量子化誤差推定処理を主導的に行う役目を果たし、増分符号算出部106においてエッジ分割領域ごとに算出された増分符号に基づいて、DCT係数の量子化により生じる量子化誤差を、エッジ分割領域ごとに推定する。より具体的には、量子化誤差推定部108は、例えば、増分符号算出部106において算出された増分符号と、DCT係数の高周波成分の基底パターンから算出される基底増分符号との差分の二乗和を非線形最適化処理することによって、量子化誤差を推定する。
ここで、まず、DCT係数の量子化誤差を推定するための原理について説明する。
一般的な傾向として、エッジ部分における“X’”(観測画像)の増分符号と、“N”(符号化ノイズ成分)の増分符号(例えば、DCT係数の高周波成分の基底パターンから算出される増分符号。以下、「基底増分符号」と示す。)とは、異なることが多い。これは、ノイズ振幅よりもエッジコントラストの方が大きいため、エッジ部分にノイズが重畳しても隣接画素間の増分符号が変化しないためである。
そこで、本発明の実施形態では、エッジ近傍の非エッジ部分(例えば、平坦部分や微小振幅テクスチャ部分)において下記の数式8が成立するものとする。ここで、数式8に示す“IS(X’)”は、観測画像の増分符号パターン、すなわち、算出された増分符号のパターンを示し、数式8に示す“IS(X+N)”は、原画像に符号化ノイズ成分を加えた画像に対応する増分符号パターンを示している。また、数式8に示す“IS(N)”は、符号化ノイズ成分に対応する増分符号パターンを示す。
・・・(数式8)
また、数式8より下記の数式9が成立する。ここで、数式9は、例えば文字などコントラストの強いエッジの近傍部分(平坦部分)において、観測画像“X’”の増分符号パターンIS(X’)と、真のノイズ成分“N”(未知)の増分符号パターンIS(N)とが類似していることを意味する。
・・・(数式9)
図5は、本発明の実施形態に係る入力画像信号が示す画像(観測画像)における増分符号の一例を示す説明図である。図5は、上記数式3の関係の具体例を示している。ここで、図5に示すAは、原画像の一例を示している。また、図5に示すBは、図5のAに示す原画像に対応する圧縮画像X’の一例を示し、図5に示すCは、図5のBに示す圧縮画像X’に対応する増分符号を示している。また、図5に示すDは、符号化ノイズ成分Nが示す画像の一例を示し、図5に示すEは、図5のDに示す符号化ノイズ成分Nが示す画像に対応する増分符号を示している。また、図5のB〜Eの各図に示す数値は、エッジ分割領域内の各画素の輝度値を示している。
例えば図5のBに示すように、エッジ分割領域においてエッジ画素と判定された画素は、エッジ画素マスキング部114によりマスキングされる。また、図5のBに示すように、エッジ分割領域には、例えば隣接する画素間の輝度値の差分を算出できないことに起因して、計算対象外部分が生じる。
また、図5のC、Eに示す異符号部分は、図5のCに示す増分符号と図5のEに示す増分符号とが相違する部分を示している。例えば、図5のC、Eの異符号部分と、図5のBに示すマスク部分とを比較すると明らかなように、図5のCに示す増分符号と図5のEに示す増分符号とが相違する異符号部分は、エッジ画素と一致することが多い。そこで、図5のC、Eに示すような異符号部分の影響を除外するために、画像処理装置100は、エッジ画素マスキング部114において、エッジ画素と判定された画素をマスキングする。エッジ画素がマスキングがされることによって、画像処理装置100は、上記数式9に示す関係を、より等しい状態に近づけることができる。
量子化誤差推定部108は、上記数式3の性質、および上記数式9を用いて、例えば、真のノイズ成分“N”に対応するノイズ成分のDCT係数“C^”を推定する。真のノイズ成分“N”に対応するDCT係数“C^”が推定されることによって、真のノイズ成分“N”に対応する推定ノイズ成分“N^”を推定することが可能となる。
図6は、本発明の実施形態に係る量子化誤差推定部108における処理の一例を示すブロック図である。ここで、図6に示す“IS”は、増分符号演算を示し、図5に示す“IDCT”は、逆離散コサイン変換を示している。また、図6のAに示す“IS(X’)”は、増分符号算出部106から伝達される観測画像“X’”の増分符号パターンを示しており、図6のBに示す“C^”は、ノイズ成分のDCT係数を示している。量子化誤差推定部108は、例えば、“C^”の値として初期値を設定する。なお、“C^”の値は適宜更新されていくので、例えば初期値は任意の値であってもよい。また、量子化誤差推定部108は、例えば、“N^”の値を初期値に設定して処理を行ってもよい。
量子化誤差推定部108は、例えば下記の数式10で表される評価関数を最適化(Optimization)することにより、ノイズ成分のDCT係数“C^”を推定する。真のノイズ成分“N”に対応するDCT係数“C^”が推定されれば、真のノイズ成分“N”に対応する推定ノイズ成分“N^”が推定されることとなる。
・・・(数式10)
ここで、後述するように、量子化誤差推定部108は、非線形関数であるsign関数を用いて増分符号“IS(N^)”を算出するので、上記数式10の最適化には、例えばシンプレックス(Simplex)法などの非線形最適化手法を用いる。以下、数式10を最適化するための処理の一例について、より具体的に示す。
DCTの定式に基づくことにより、推定される符号化ノイズ成分“N^”は、例えば下記の数式11で表される。ここで、数式6に示す“Bmn”は、次数mnのDCT基底画像を示す。また、数式6に示す“Cmn”は、次数mnのDCT係数であり、数式6の最適化によって推定すべき変数である。
・・・(数式11)
また、符号化ノイズ成分N^が示す画像(以下、「ノイズ画像N^」と示す場合がある。)の位置(i,j)における画素値は、例えば下記の数式12で表される。
・・・(数式12)
また、上記数式12が示す画素値に対応する増分符号は、例えば下記の数式13で算出される。
・・・(数式13)
ここで、DCT係数の量子化誤差によって、例えばモスキートノイズなどの符号化ノイズを発生させる周波数帯域を下記の数式14で定義する。ここで、数式14は、量子化誤差推定部108が、DCT係数の垂直方向、および水平方向ともに次数4以上のDCT係数を用いることを表している。
・・・(数式14)
数式14に示すように、量子化誤差推定部108は、非線形最適化処理において、エッジ分割領域における水平方向および垂直方向それぞれに対応するDCT係数の次数を設定する。
なお、上記数式14では、DCT係数の垂直方向、および水平方向ともに次数4以上のDCT係数を用いることを示しているが、本発明の実施形態に係る量子化誤差推定部108が行う、符号化ノイズを発生させる周波数帯域の定義は、上記に限られない。例えば、変換符号化を行う分割領域内に垂直方向に伸びる強いエッジが存在する場合には、モスキートノイズは当該エッジに沿って強く表れる傾向があり、その場合には、数式14に示すmの広い範囲で量子化誤差が発生することが起こりうる。また、例えば、変換符号化を行う分割領域内に水平方向に伸びる強いエッジが存在する場合には、数式14に示すnの広い範囲で量子化誤差が発生することが起こりうる。
よって、量子化誤差推定部108は、例えば、エッジ判定部104において判定されたエッジの方向に基づいて、DCT係数の次数を、判定されたエッジの方向に対応するように適応的に設定してもよい。DCT係数の次数が適応的に設定された例としては、例えば下記の数式15、数式16が挙げられる。ここで、数式15は、垂直方向にエッジが検出された場合において設定されるDCT係数の次数の一例を示し、また、数式15は、水平方向にエッジが検出された場合において設定されるDCT係数の次数の一例を示している。
・・・(数式15)
・・・(数式16)
上記のように、DCT係数の次数を判定されたエッジの方向に対応するように適応的に設定することによって、量子化誤差推定部108は、モスキートノイズなどの符号化ノイズを発生させるDCT係数の量子化誤差を効率的に推定することができる。
以下では、量子化誤差推定部108が、上記数式14に示すように、エッジ分割領域における水平方向および垂直方向それぞれに対応するDCT係数の次数を設定する場合を例に挙げて、量子化誤差推定部108における量子化誤差推定処理の一例について説明する。
数式14より、数式13は、例えば下記の数式17で表される。
・・・(数式17)
以下では、説明の便宜上、数式17をベクトル形式で表現する。まず、推定すべき未知ベクトルは、例えば下記の数式18で表される。
・・・(数式18)
次に、係数ベクトルを、下記の数式19のように定義する。
・・・(数式19)
上記数式18、上記数式19より、上記数式17は、例えば下記の数式20で表される。
・・・(数式20)
また、上記数式9より、増分符号“IS(N^)”と増分符号“IS(X’)”との関係は、下記の数式21で表される。
・・・(数式21)
よって、上記数式20は、上記数式21より下記の数式22で表すことができる。
・・・(数式22)
エッジ分割領域における上記数式22が成立する領域(エッジ近傍の平坦に近い領域)を“X”とすると、“X”の画素数|X|の数分、上記数式22の値が得られる(|X|<64(例えば、分割領域が8×8画素のサイズの場合))。ここで、下記の数式23、数式24のように定義し、上記数式22の|X|個の方程式を一つの行列ベクトル方程式とすると、当該行列ベクトル方程式は、下記の数式25で表される。
・・・(数式23)
・・・(数式24)
・・・(数式25)
数式25を用いると、最適化すべき評価関数Jは、例えば下記の数式26で表される。
・・・(数式26)
評価関数Jを微分することができる場合には、例えば通常の最小二乗法を用いて評価関数の最適化を行うことが可能である。ここで、数式26に示す評価関数Jは、sign関数を含むので微分することができない。そこで、量子化誤差推定部108は、例えばシンプレックス法などを用いて、評価関数Jの最適化を行う。
ここで、量子化誤差推定部108は、数式26に示す演算を反復して行うので、数式26に示す“y”に初期値を設定する。量子化誤差推定部108は、例えば、入力画像信号が示す画像(観測画像)Xに対して平滑化を行い、入力画像信号から平滑化後の画像に対応する信号を減算したものを上記数式11の“N^”とすることによって、yの初期値、すなわち数式11に示す“Cmn”を設定する。なお、本発明の実施形態に係る量子化誤差推定部108における数式26に示す“y”の初期値の設定方法が、上記に限られないことは、言うまでもない。
量子化誤差推定部108は、上記数式26に示す評価関数Jの最適化によって“y”を求める。ここで、最適化により求められた“y”は、上記数式11の“Cmn”、すなわち、推定すべき変数であるDCT係数に該当する。また、“Cmn”が求められれば、上記数式11によって符号化ノイズ成分“N^”が算出される。
よって、量子化誤差推定部108は、例えば上記のように、上記数式26に示す評価関数Jを最適化してDCT係数“Cmn”を推定することによって、DCT係数の量子化により生じる量子化誤差を推定する。
なお、本発明の実施形態に係る量子化誤差推定部108の推定結果は、上記DCT係数に限られない。例えば、量子化誤差推定部108は、上記数式11に示す演算を行うことによって、符号化ノイズ成分“N^”を、DCT係数の量子化により生じる量子化誤差として推定してもよい。以下では、量子化誤差推定部108が、DCT係数の量子化により生じる量子化誤差として、DCT係数“Cmn”を推定する場合を例に挙げて説明する。
再度図1を参照して、本発明の実施形態に係る画像処理装置100の構成の一例について説明する。ノイズ低減部110は、本発明の実施形態に係る画像処理方法に係る上記ノイズ低減処理を主導的に行う役目を果たし、入力画像信号から、量子化誤差推定部108において推定された量子化誤差に基づくノイズ画像を示す信号を減算して、入力画像信号のノイズを低減する。
図7は、本発明の実施形態に係るノイズ低減部110の構成の一例を示す説明図である。ノイズ低減部110は、例えば、ノイズ画像生成部116と、ノイズ減算部118とを備える。
ノイズ画像生成部116は、量子化誤差推定部108において推定された量子化誤差に基づいて、ノイズ画像を生成する。より具体的には、ノイズ画像生成部116は、量子化誤差推定部108において推定された量子化誤差に該当する“Cmn”に基づいて上記数式11の演算を行うことによって符号化ノイズ成分を算出し、当該符号化ノイズ成分を合成してノイズ画像を生成する。ここで、ノイズ画像生成部116における処理は、量子化誤差推定部108において推定されたDCT係数をIDCTすることによって、空間領域のノイズ画像を求めることに相当する。
ノイズ減算部118は、入力画像信号から、ノイズ画像生成部110から伝達されるノイズ画像を示す信号を減算して、入力画像信号のノイズを低減する。また、ノイズ減算部118が、入力画像信号からノイズ画像を示す信号を減算することによって、画像処理装置100は、原画像を推定することができる。
ノイズ低減部110は、例えば、ノイズ画像生成部116とノイズ減算部118とを備えることによって、入力画像信号のノイズを低減する。
ここで、2次元画像の場合、従来の平滑化手法を用いるときには、テクスチャが失われる可能性があるが、ノイズ低減部110(より厳密には、ノイズ減算部118)は、平滑化処理を行わずにノイズを低減するので、テクスチャが失われるなどのノイズ低減処理に起因する副作用は原理的に発生しない。よって、ノイズ低減部110は、ノイズ低減処理に起因する画質の低下を防止しつつ、例えばモスキートノイズなどのような符号化ノイズを低減することができる。
なお、本発明の実施形態に係るノイズ低減部110の構成は、図7に示す構成に限られない。例えば、量子化誤差推定部108が、符号化ノイズ成分“N^”をDCT係数の量子化により生じる量子化誤差として推定する場合には、ノイズ低減部110は、ノイズ画像生成部116を備えていなくてもよい。
画像処理装置100は、例えば、図1に示す構成によって、本発明の実施形態に係る画像処理方法に係る処理(例えば、エッジ判定処理、増分符号算出処理、量子化誤差推定処理、およびノイズ低減処理)を実現する。ここで、画像処理装置100は、観測画像の空間周波数などからノイズらしい成分を推定する従来技術に係る手法に対して、上述したように、観測画像の増分符号パターンと類似した増分符号パターンを数するDCT基底画像を非線形最適化処理によって推定し、モスキートノイズなどの符号化ノイズを低減する。
図8は、本発明の実施形態に係る画像処理装置100におけるノイズ低減処理の効果の一例を示す説明図である。ここで、図8に示すAは、入力画像信号が示す画像(観測画像)を示しており、圧縮前の原画像を圧縮した画像に、符号化ノイズが重畳された画像の一例を示している。また、図8に示すBは、本発明の実施形態に係る画像処理方法に係る処理によって、図8のAに示す画像に含まれる符号化ノイズが低減された画像の一例を示している。また、図8に示すCは、図8のAに示す画像を示す信号から図8のBに示す画像を示す信号を減算した結果得られるノイズ画像、すなわち、本発明の実施形態に係る画像処理方法に係る処理によって推定される符号化ノイズ成分に対応する画像の一例を示している。
図8のBに示すように、画像処理装置100は、本発明の実施形態に係る画像処理方法に係る処理を行うことによって、符号化ノイズ量を推定し、平滑化処理をすることなく低減することができる。また、図8のCには、DCTの高周波成分の基底パターンが現れていることから、画像処理装置100が、本発明の実施形態に係る画像処理方法に係る処理によって、DCT量子化誤差を直接推定していることが分かる。
なお、本発明の実施形態に係る画像処理装置の構成は、図1に示す構成に限られない。例えば、図1では、本発明の実施形態に係る画像処理装置が分割領域設定部102を備える構成を示しているが、本発明の実施形態に係る画像処理装置は、分割領域設定部102を備えず、エッジ判定部104が分割領域設定部102の機能をさらに有していてもよい。
以上のように、本発明の実施形態に係る画像処理装置は、本発明の実施形態に係る画像処理方法に係る処理として、例えば、エッジ判定処理、増分符号算出処理、および量子化誤差推定処理、を行う。ここで、本発明の実施形態に係る画像処理装置は、入力画像信号(処理対象の画像信号)に基づいてエッジ分割領域を判定し、エッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出する。また、本発明の実施形態に係る画像処理装置は、例えば、算出された増分符号と、離散コサイン変換係数の高周波成分の基底パターンから算出される基底増分符号との差分の二乗和を非線形最適化処理することによって、エッジ分割領域ごとに、DCT係数の量子化により生じる量子化誤差を推定する。
したがって、本発明の実施形態に係る画像処理装置は、処理対象の画像信号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を推定することができる。
また、本発明の実施形態に係る画像処理装置は、エッジ分割領域ごとに離散コサイン変換係数の量子化により生じる量子化誤差を推定することが可能であるので、局所的に(分割領域ごとに)量子化誤差を推定することができる。
また、本発明の実施形態に係る画像処理装置は、本発明の実施形態に係る画像処理方法に係る処理として、さらにノイズ低減処理を行ってもよい。ここで、本発明の実施形態に係る画像処理装置は、入力画像信号(処理対象の画像信号)から、推定された量子化誤差に基づくノイズ画像を示す信号を減算して、入力画像信号のノイズを低減する。つまり、本発明の実施形態に係る画像処理装置は、平滑化処理を行わずにノイズを低減する。よって、本発明の実施形態に係る画像処理装置は、例えば画像のディティールが損われるなどのような、ノイズを低減する処理に伴って生じうる副作用を回避することができる。
したがって、本発明の実施形態に係る画像処理装置は、本発明の実施形態に係るノイズ低減処理を行うことによって、符号化ノイズ(離散コサイン変換係数の量子化により生じる量子化誤差)を低減しつつ、処理後の画像における画質の低下を防止することができる。
以上、本発明の実施形態として画像処理装置を挙げて説明したが、本発明の実施形態は、かかる形態に限られない。本発明の実施形態は、例えば、デジタルカメラなどの撮像装置、PCやサーバなどのコンピュータ、テレビ受像機などの表示装置、携帯電話やスマートフォンなどの通信装置、映像/音楽再生装置(または映像/音楽記録再生装置)、ゲーム機など、画像信号の処理が可能な様々な機器に適用することができる。また、本発明の実施形態は、例えば、上記のような機器に組み込むことが可能な、画像処理IC(Integrated Circuit)に適用することもできる。
(本発明の実施形態に係るプログラム)
コンピュータを、本発明の実施形態に係る画像処理装置として機能させるためのプログラム(例えば、エッジ判定処理、増分符号算出処理、および量子化誤差推定処理など、本発明の実施形態に係る画像処理方法に係る処理を実行することが可能なプログラム)によって、処理対象の画像信号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を推定することができる。
また、コンピュータを、図1に示すノイズ低減部110を備える画像処理装置として機能させるためのプログラム(例えば、さらにノイズ低減処理を実行することが可能なプログラム)によって、符号化ノイズ(離散コサイン変換係数の量子化により生じる量子化誤差)を低減しつつ、処理後の画像における画質の低下を防止することができる。
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
例えば、上記では、コンピュータを、本発明の実施形態に係る画像処理装置として機能させるためのプログラム(コンピュータプログラム)が提供されることを示したが、本発明の実施形態は、さらに、上記プログラムをそれぞれ記憶させた記録媒体も併せて提供することができる。
100 画像処理装置
102 分割領域設定部
104 エッジ判定部
106 増分符号算出部
108 量子化誤差推定部
110 ノイズ低減部
112 算出部
114 エッジ画素マスキング部
116 ノイズ画像生成部
118 ノイズ減算部

Claims (8)

  1. 入力画像信号が示す離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像が、分割された分割領域ごとに、分割領域が示す画像がエッジを含むか否かを判定するエッジ判定部と、
    エッジを含むと判定された分割領域であるエッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出する増分符号算出部と、
    前記エッジ分割領域ごとに算出された増分符号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を、前記エッジ分割領域ごとに推定する量子化誤差推定部と、
    を備えることを特徴とする、画像処理装置。
  2. 前記量子化誤差推定部は、算出された増分符号と、離散コサイン変換係数の高周波成分の基底パターンから算出される基底増分符号との差分の二乗和を非線形最適化処理することによって、前記量子化誤差を推定することを特徴とする、請求項1に記載の画像処理装置。
  3. 前記量子化誤差推定部は、前記非線形最適化処理において、前記エッジ分割領域における水平方向および垂直方向それぞれに対応する離散コサイン変換係数の次数を設定することを特徴とする、請求項2に記載の画像処理装置。
  4. 前記量子化誤差推定部は、前記エッジ判定部において判定されたエッジの方向に基づいて、前記離散コサイン変換係数の次数を、前記判定されたエッジの方向に対応するように適応的に設定することを特徴とする、請求項3に記載の画像処理装置。
  5. 前記増分符号算出部は、
    前記増分符号を算出する算出部と、
    前記エッジ分割領域におけるエッジに対応する画素をマスキングするエッジ画素マスキング部と、
    を備え、
    前記量子化誤差推定部は、マスキングされた画素に対応する増分符号を、前記量子化誤差の推定に用いないことを特徴とする、請求項1〜4のいずれか1項に記載の画像処理装置。
  6. 前記入力画像信号から、推定された量子化誤差に基づくノイズ画像を示す信号を減算して、前記入力画像信号のノイズを低減するノイズ低減部をさらに備えることを特徴とする、請求項1〜5のいずれか1項に記載の画像処理装置。
  7. 入力画像信号が示す離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像が、分割された分割領域ごとに、分割領域が示す画像がエッジを含むか否かを判定するステップと、
    エッジを含むと判定された分割領域であるエッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出するステップと、
    前記エッジ分割領域ごとに算出された増分符号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を、前記エッジ分割領域ごとに推定するステップと、
    を有することを特徴とする、画像処理方法。
  8. 入力画像信号が示す離散コサイン変換を含む符号化処理および量子化処理により非可逆圧縮された画像が、分割された分割領域ごとに、分割領域が示す画像がエッジを含むか否かを判定するステップ、
    エッジを含むと判定された分割領域であるエッジ分割領域ごとに、隣接する画素間の輝度値の差分に基づいて増分符号を算出するステップ、
    前記エッジ分割領域ごとに算出された増分符号に基づいて、離散コサイン変換係数の量子化により生じる量子化誤差を、前記エッジ分割領域ごとに推定するステップ、
    をコンピュータに実行させるためのプログラム。
JP2012007272A 2012-01-17 2012-01-17 画像処理装置、画像処理方法、およびプログラム Pending JP2013150066A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012007272A JP2013150066A (ja) 2012-01-17 2012-01-17 画像処理装置、画像処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012007272A JP2013150066A (ja) 2012-01-17 2012-01-17 画像処理装置、画像処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2013150066A true JP2013150066A (ja) 2013-08-01

Family

ID=49047185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012007272A Pending JP2013150066A (ja) 2012-01-17 2012-01-17 画像処理装置、画像処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2013150066A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018036226A (ja) * 2016-09-02 2018-03-08 富士通株式会社 画像処理プログラム、画像処理方法および画像処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018036226A (ja) * 2016-09-02 2018-03-08 富士通株式会社 画像処理プログラム、画像処理方法および画像処理装置

Similar Documents

Publication Publication Date Title
KR102352085B1 (ko) 크로마 예측 방법 및 디바이스
CN101640801B (zh) 图像处理设备和图像处理方法
CN105409216B (zh) 丢失视频数据的条件隐藏
US10531082B2 (en) Predictive light-field compression
WO2018058090A1 (en) Method for no-reference image quality assessment
CN102224734A (zh) 图像处理设备和方法
JP6568078B2 (ja) 画像データを符号化するための方法および装置ならびに画像データを復号するための方法および装置
US20120230604A1 (en) Image processing apparatus, image processing method and program
WO2005027041A1 (ja) 視覚処理装置、視覚処理方法、視覚処理プログラムおよび半導体装置
JP2013031163A (ja) 超解像処理装置及び超解像処理方法
US8630500B2 (en) Method for the encoding by segmentation of a picture
EP2960854A1 (en) Method and device for determining a set of modifiable elements in a group of pictures
US20170339316A1 (en) A method and device for estimating a color mapping between two different color-graded versions of a sequence of pictures
US9361500B2 (en) Image processing apparatus, image processing method, and recording medium
CN113409203A (zh) 图像模糊程度确定方法、数据集构建方法与去模糊方法
WO2015144566A1 (en) An image processing method and a corresponding device
JP2013150066A (ja) 画像処理装置、画像処理方法、およびプログラム
CN115550664B (zh) 获取运动矢量的方法和装置
JP2008147880A (ja) 画像圧縮装置と方法及びそのプログラム
Liu et al. Gradient based image transmission and reconstruction using non-local gradient sparsity regularization
TW201605228A (zh) 處理影像資料之方法及裝置
JP2013110701A (ja) 画像処理装置、画像処理方法、およびプログラム
US10148958B2 (en) Method and device for encoding and decoding a HDR picture and a LDR picture
JP2012230549A (ja) 画像処理装置、画像処理方法、およびプログラム
KR101871946B1 (ko) 화상 처리 장치, 화상 처리 방법 및 프로그램