JP2024064449A - 画像処理方法、画像処理装置、及びプログラム - Google Patents
画像処理方法、画像処理装置、及びプログラム Download PDFInfo
- Publication number
- JP2024064449A JP2024064449A JP2022173039A JP2022173039A JP2024064449A JP 2024064449 A JP2024064449 A JP 2024064449A JP 2022173039 A JP2022173039 A JP 2022173039A JP 2022173039 A JP2022173039 A JP 2022173039A JP 2024064449 A JP2024064449 A JP 2024064449A
- Authority
- JP
- Japan
- Prior art keywords
- image
- decoded data
- image processing
- captured image
- zero elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims description 28
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 73
- 230000008569 process Effects 0.000 claims abstract description 42
- 238000007906 compression Methods 0.000 claims abstract description 21
- 238000013139 quantization Methods 0.000 claims description 61
- 238000011156 evaluation Methods 0.000 claims description 44
- 238000003384 imaging method Methods 0.000 claims description 25
- 238000010586 diagram Methods 0.000 description 17
- 230000006835 compression Effects 0.000 description 9
- 238000007689 inspection Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
Abstract
【課題】 撮像画像のぼけ判定を高精度かつ高速に実行することを目的としている。【解決手段】 符号化処理を含む圧縮処理によって撮像画像を圧縮することで生成された圧縮画像データと、符号化処理に用いられた符号化情報とを含む圧縮画像情報を取得する第1の工程S11と、符号化情報を用いて圧縮画像データを復号することで復号データを生成する第2の工程S12と、復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて撮像画像のぼけの評価を行う第3の工程S13とを有する。【選択図】 図9
Description
本発明は、画像のぼけを判定する画像処理方法に関する。
撮像画像を離散コサイン変換(DCT:Discrete Cosine Transform)などの周波数変換によって得られたDCT係数に基づいて、撮像時の手振れやピントずれによる撮像画像のぼけの有無を判定(ぼけ判定)する方法が知られている。撮像装置を用いて取得された撮像画像は一般的にJPEG(Joint Photographic Experts Group)形式で圧縮処理される。JPEG形式では、画像を所定の大きさの複数のブロックに分割し、それぞれを周波数変換、量子化処理、及び符号化処理により撮像画像を圧縮することで圧縮画像データを生成する。圧縮画像データを用いて撮像画像のぼけ判定を行う場合、圧縮画像データから元の撮像画像を再構成した後、DCTなどによって空間領域から周波数領域に変換する必要があるため、ぼけ判定に時間がかかる。
特許文献1では、ぼけ判定にかかる処理時間を短縮するため、撮像画像を再構成する前にぼけ判定を行う画像処理方法が開示されている。
特許文献1の方法では、JPEG形式で圧縮している圧縮画像データに対して復号処理及び逆量子化処理を行う。そして、逆量子化処理後のDCT係数における低周波側の情報に基づいて、ぼけ判定に用いる評価値を算出する。しかしながら、撮像時の手振れやピントずれによってぼけが生じた場合、撮像画像において変化が大きいのは主に高周波側のため、低周波側の情報のみでは精度が低くなるという課題がある。
そこで、本発明は、撮像画像のぼけ判定を高精度かつ高速に実行することを目的としている。
本発明の画像処理方法は、符号化処理を含む圧縮処理によって撮像画像を圧縮することで生成された圧縮画像データと、符号化処理に用いられた符号化情報とを含む圧縮画像情報を取得する第1の工程とを有する。さらに、符号化情報を用いて圧縮画像データを復号することで復号データを生成する第2の工程と、復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて撮像画像のぼけの評価を行う第3の工程とを有することを特徴とする。
本発明によれば、撮像画像のぼけ判定を高精度かつ高速に実行することができる。
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。各図において、同一の部材については同一の参照番号を付し、重複する説明は省略する。
まず、本発明の実施形態の要旨を説明する。本実施形態における画像処理方法は、復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて撮像画像のぼけの評価を行う。復号データは、撮像画像の再構成に必要な逆量子化などの処理を要することなく圧縮画像データに対する復号処理のみによって生成される。したがって、圧縮画像データから元の撮像画像を再構成した後にぼけ判定する方法に対して、ぼけ判定における処理時間を短縮することができる。
また、撮像画像にぼけが生じた場合、撮像画像の高周波成分が大きく変化するため、撮像画像の高周波成分に基づいてぼけ判定を行うことで、ぼけ判定の精度を高めることができる。本実施形態において、復号データに含まれるゼロの要素の数及びゼロ以外の要素の数と撮像画像に含まれる高周波成分の量とは相関している。したがって、復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいてぼけの評価を行うことで、撮像画像のぼけ判定を高精度に実行することができる。
ここで、JPEGファイルの概要について説明する。JPEGファイルは、JPEG形式での圧縮処理した撮影画像を記憶媒体などに保存する際に用いられ、JPEG形式で圧縮処理された撮像画像の情報(圧縮画像データ)と、圧縮処理に関する情報とを含む。
JPEGファイルは、マーカーと呼ばれる2バイトのコードによって複数のセグメントに分割されている。セグメントとは、JPEG内に記録されている情報を種類別にまとめた領域である。JPEGファイルの最初にはSOI(Start of Image)マーカー、最後にはEOI(End of Image)マーカーがあり、その間に複数のセグメントと圧縮画像データが存在している。セグメントは、セグメントの種類を表すマーカーと、セグメントの長さの情報と、記録されている情報とを有している。各セグメントの先頭に格納されているマーカーの情報を照合することで、必要なセグメントのみ取得することができる。
次に、DQT(Define Quantization Table)セグメント、DHT(Define Huffman Table)セグメント、SOF(Start of Frame)セグメント、SOS(Start of Scan)セグメントについて説明する。
DQTセグメントには、圧縮処理における量子化処理に用いた量子化テーブル(量子化情報)が保持されている。DQTセグメント内には複数の量子化テーブルを保持することが可能であり、例えば色によって使い分けることができる。また、量子化テーブルは撮像画像におけるブロックと同じ大きさである。本実施形態におけるブロックは、JPEG形式での圧縮処理の際に撮像画像を所定の大きさごとに分割することで得られる。また、JPEG形式での圧縮処理の場合、画像の色の表示形式はRGBから変換(YCbCr変換)されたYCbCr形式であるため、例えばY(輝度情報)、Cr(青色色差情報)及びCb(赤色色差情報)に用いる量子化テーブルを別々に保持できる。
DHTセグメントには、JPEG形式における符号化処理であるハフマン符号化に用いたハフマンテーブル(符号化情報)が保持されている。DHTセグメントはDQTセグメントと同様に複数のテーブルを定義することができる。一般的にDHTセグメントのテーブルは輝度情報用のDC(直流)成分及びAC(交流)成分と、青色色差情報及び赤色色差情報用のDC成分及びAC成分とで合わせて四つのテーブルを保持していることが多い。ブロックがN×N画素の場合、DC成分はブロック内の総和のN分の1になる。つまり、DC成分がゼロになるということは対応する撮像画像のブロック部分が全てゼロの場合となる。よって、DC成分がゼロになる場合はAC成分もゼロとなる場合のみに限定されるため、DC成分の情報は取得しなくてもぼけ判定を実施することは可能となる。なお、ハフマン符号化はDC成分とAC成分とで異なる。DC成分は量子化済みのDCT係数に対してビット列に変換した後、その数値を表現するのに必要なビット数に対応したハフマンコードをビット列の前につけることで1つのコードとなる。一方、AC成分は数値を表現するのに必要なビット数毎にハフマンコードを付与する処理はDC成分と同じであるが、その後ランレングス圧縮が施される。そのため、AC成分のハフマンテーブルはビットデータ長に加えて、ゼロがどれだけ続くかといったランレングスの値を保持している。これにより、ある数値の後に複数個のゼロが続く場合、それらはまとめて1つのハフマンコードで表される。
SOFセグメントには、撮像画像のサイズやサンプリング比等の情報が保持されている。
SOSセグメントは、これ以降に圧縮画像データが続くことを表しており、圧縮画像データの前に保持されている。圧縮画像データはMCU(Minimum Coded Unit)と呼ばれる単位で格納されている。色が3色でサンプリング比が4:2:0の場合、MCUはYの8×8画素のブロックが四つ、Crの8×8の画素のブロックが一つ、及びCbの8×8画素のブロックが一つの合計六つのブロックで構成される。この場合、本来Cr、CbもYと同様に8×8画素のブロックが四つあるので、12個のブロックのデータを間引いて6個のブロックが削減されていることになる。このように、サンプリング比が4:2:0の場合は、Yに対してCr、Cbのデータは4分の1に間引かれる。ちなみに、サンプリング比が4:4:4ではCr、Cbの間引きがなくなり、Yと同じデータ数となる。
次に図1を参照してブロックについて説明する。図1は、本実施形態におけるブロックのイメージ図であり、水平方向の周波数軸をμ、鉛直方向の周波数軸をνとしている。本実施形態における撮像画像は、YCbCr変換されており、サンプリング比は4:2:0である。この場合、前述のようにMCUは12個のブロックで構成され、そのうち4個が輝度成分Yのブロックである。なお、各ブロックは8×8画素で構成されている。周波数(μ,ν)=(0,0)がDC成分で、残りの63個のデータがAC成分とである。周波数μ、νの値が大きいほど高周波の成分である。
なお、図1は二次元のデータで表されているが、実際に格納されているデータは一次元のデータである。二次元のデータの一次元化には、ジグザグスキャンと呼ばれる処理が用いられる。図2は、ジグザグスキャンの説明図であり、各マスに記載されている番号は一次元化した際の格納順である。図2のように、AC成分は(μ,ν)=(1,0)から始まって二次元データを低周波側から高周波側に向かっていき、63番目の(μ,ν)=(7,7)で終わる。ジグザグスキャン後の一次元データは周波数の順で並んでいるため、特に後半の高周波側のデータはゼロが並びやすくなる。JPEG形式では、こうしたゼロが連続したデータに対して符号化処理を行うことで高圧縮化を実現している。このように図1のような二次元状のブロックデータを取得するためには、一次元データを図2の格納順の情報をもとに二次元化する必要がある。しかし、本実施形態における撮像画像のぼけ判定では、ブロック内のDCT係数がゼロとなる要素の情報が取得できればよいため、二次元化は必須ではない。
ここで、図3乃至図6を参照して量子化処理に関して説明する。図3に、撮像画像における8×8画素の輝度情報のイメージ図を示す。図3の各値は撮像画像の輝度値を表しており、撮像画像から所定の大きさごとに分割することで生成される。JPEG形式での圧縮の際にはこの8×8画素のブロックごとに周波数変換される。なお、本実施形態における周波数変換は、離散コサイン変換(DCT)を用いる。また、本実施例において色変換によって生成された輝度情報のみを用いているが、これに限定されるものではない。
図4は、図3の輝度情報に対して離散コサイン変換を実施した場合のDCT係数を示す。図4のDCT係数は図1の座標と対応した座標を有しており、撮像画像に含まれる8×8画素のブロックにおける周波数分布を表している。また、DCT係数は左上にDC成分、その他はAC成分を示し、高周波になるほど値が小さくなる。
図5に、本実施形態における量子化テーブルを示す。量子化テーブルもブロックと同様に8×8画素を有する。なお、量子化テーブルのそれぞれの要素はそれぞれ1から255までの値を有している。DCT係数の各値と量子化テーブルの各値を対応する位置ごとに除算することで、DCT係数を量子化することができる。そのため、量子化テーブルの各要素がそれぞれ1に近いほど量子化の影響が小さくなる。JPEG画像の作成において、品質レベル(quality)を設定できる場合、量子化テーブルの要素を全て1にすることで品質レベルを最大にすることができる。
しかし、量子化テーブルの要素が全て1であっても、量子化後に整数化されるため、例えば図4の状態で絶対値が0.5未満の値はすべてゼロになる。このように、JPEG形式では量子化処理によって情報量が欠落するため、基本的には不可逆変換である。なお、品質レベルを最小とした場合、図5の要素が全て255となり、量子化後のDCT係数はほとんどがゼロとなるため圧縮率を高めることができる。
図6に、量子化後のDCT係数を示す。図6の量子化後のDCT係数は、図4のDCT係数を図5の量子化テーブルの値で除算し、四捨五入することで算出されている。量子化後のDCT係数は左上の低周波側にゼロ以外の値が集まりやすく、右下の高周波側ではゼロが多く集まりやすい。図6の二次元データをジグザグスキャンにより一次元化した場合、ゼロ以外の要素であるのはAC成分の24番目(μ,ν)=(3,3)まであり、ゼロの要素であるのは25番目以降である。このとき図6におけるゼロの要素の数(評価値)は43である。例えば評価値と閾値を比較することによって、撮像画像におけるぼけの有無を判定することができる。撮像画像のぼけ判定の詳細については後述する。
さらに、量子化後のDCT係数を上述した符号化処理を行うことで、JPEGファイルとして保存される圧縮画像データを生成することができる。
本実施形態では、撮像画像を圧縮する際の量子化後のDCT係数に相当する復号データに基づいて評価値の算出を行う。復号データは、量子化テーブルを用いて圧縮画像データを復号することで生成される。逆量子化処理を行わず復号データを用いて評価を行うことで、ぼけ判定における処理の負荷低減することができる。
上記で挙げた画像処理方法は一例であり、本発明はこれに限定されるものではない。その他の画像処理方法などの詳細は以下の実施例に述べる。
[実施例1]
次に、図7,図8を参照して、実施例1における撮像装置100の構成について説明する。図7は、撮像装置100の構成を示すブロック図である。図8は、撮像装置100の外観図である。撮像装置100には、本実施例のぼけ判定を行うための画像処理プログラムがインストールされている。
次に、図7,図8を参照して、実施例1における撮像装置100の構成について説明する。図7は、撮像装置100の構成を示すブロック図である。図8は、撮像装置100の外観図である。撮像装置100には、本実施例のぼけ判定を行うための画像処理プログラムがインストールされている。
本実施例における撮像装置100は、特に橋梁などの構造物壁面の点検や、部品の外観検査に用いる画像点検に用いられるものとする。こうした画像点検を行う際にはひび割れやキズ等を自動的に認識する点検手法がよく用いられる。一般的にはパターン認識等を用いることでひび割れやキズを検知することが多いが、これらの手法は画像がぼけてないことを前提としている。ここでぼけとは、ピントずれと手振れの両方を含むものとする。ピントずれは、被写体(橋梁であれば構造物壁面)に焦点が合っていないことが原因でぼけている状態のことを示す。また、手振れは撮影する際、露光中に撮像装置本体が動くことによって撮像画像がぼけることを示す。例えば撮像装置をユーザが手で持った状態で撮影を行うとき、露光中に縦方向に撮像装置が動いた場合、撮像画像は縦方向に大きくぼける。また、本実施例において手振れは人が撮像装置を保持している場合に限定されない。例えば、ドローン等の無人飛行機に搭載された撮像装置において、飛行時の揺れによってぼける場合も手振れに含むものとする。このような画像点検に用いる撮像画像にぼけが含まれる場合、ひびの識別精度が低下してしまう。
そこで、後述するぼけ判定を用いて撮像画像のぼけの有無を判定する処理を行い、例えば“ぼけている”と判定された画像がある場合その画像を除いて画像点検を実施する、又はその画像の撮り直しすることで、識別精度を高めることができる。
図7に示す撮像装置100は、撮像部(撮像手段)101、画像処理部(処理手段)102、記憶部103、表示部104、及びシステムコントローラ105を有する。
撮像部101は、被写体空間から入射する光を集光する光学系101aと、複数の画素を有する撮像素子101bとを有し、被写体空間の像を撮像画像として取得する。撮像素子101bは、例えばCCD(Charge Coupled Device)センサや、CMOS(Complementary Metal-Oxide Semiconductor)センサなどで構成される。取得された撮像画像は、画像処理部102に入力される。画像処理部102は、復号部102a、評価部102b、及びぼけ判定部102cを有する。復号部102aは符号化されたDCT係数を復号する。評価部102bは復号されたDCT係数(復号データ)を用いてぼけ判定のための評価値を算出する。ぼけ判定部102cは評価値に基づいて撮像画像にぼけがあるかの判定を行う。この処理の詳細は後述する。なお、画像処理部102の機能は、1つ以上のプロセッサ(処理手段)にて実現可能である。記憶部103には、撮像部101により取得された撮像画像がJPEG形式で保存されている。なお、撮像画像が保存される形式はこれに限定されない。本実施例では、記憶部103に保存されている撮像画像のぼけの評価を行う。表示部104には、ぼけ判定の結果や撮像画像を表示することができる。以上の一連の制御は、システムコントローラ105によって行われる。
次に、図9を参照して画像処理部102で行われるぼけ判定処理に関して説明する。図9はぼけ判定処理に関するフローチャートである。
ステップS11(第1の工程)において、画像処理部102は記憶部103から圧縮画像情報を取得する。なお、本実施例における圧縮は、JPEG形式で行われている。JPEG形式では、セグメントの種類を表すマーカー情報を照合することで、必要なセグメントのみ取得することができる。本実施例において圧縮画像情報として、SOSセグメント、DHTセグメント、及びSOFセグメントの情報を取得する。SOSセグメントには、JPEG形式で圧縮されている画像データ(圧縮画像データ)が保持されている。DHTセグメントには、ハフマン符号化に用いたハフマンテーブル(符号化情報)が保持されており、以降のステップにおいてデータの復号に用いられる。また、SOFセグメントには、画像のサイズやサンプリング比等の情報を保持されている。なお、本実施例では復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて評価値を算出する。このとき、DHTセグメントのうちDC成分のテーブルは取得しなくてもよい。
なお、本実施例における圧縮画像情報は、撮像装置100から取得されているが、これに限定されるものではない。例えば、別の撮像装置を用いて取得された撮像画像に基づいた圧縮画像情報を取得してもよい。また、前述のように、撮像画像は橋梁等の構造物壁面や部品の外観等の画像が望ましい。こうした画像であれば、画像内に含まれる被写体がある程度限定されるため、ぼけ判定の精度を高めることができる。
ステップS12(第2の工程)において、復号部102aは取得した圧縮画像データを復号する。圧縮画像データは、圧縮処理の際に符号化情報を用いて符号化処理を施されており、復号部102aは符号化情報を用いて圧縮画像データを復号する。また、撮像画像のうちYCbCr変換により得られた輝度情報に基づく圧縮画像データのみを復号してもよい。輝度情報のみを復号して得られた復号データを用いてぼけ判定することで処理をより高速化することができる。
ステップS13(第3の工程)において、評価部102bはぼけ判定に用いる評価値を算出する。本実施例では、復号データの各ブロックのゼロの要素の数をカウントすることで、評価値を算出する。量子化後のDCT係数の各ブロックに含まれる要素の数は特定の数であるため、ゼロ以外の要素の数を評価値として用いても同様の結果が得られる。そのため、評価値はこれに限定されずゼロ以外の要素の数を評価値としてもよい。
本実施例における量子化後のDCT係数は、8×8画素のブロックであり、64個の要素の数を有する。また、ゼロの要素の数と撮像画像のぼけとは相関しており、ゼロの要素の数が少ない場合、ブロックに含まれている高周波成分が多い。一方で、ゼロの要素の数が多い場合、ブロックに含まれている高周波成分が少ない。復号データに含まれるゼロの要素の数が多い場合、細かい構造があまりない(高周波成分が少ない)被写体を撮像しているか、又は手振れやピンぼけによって高周波成分が失われたかのどちらかである。このように、ゼロの要素の数は被写体によっても変化するため、本実施例では、ぼけ判定の精度を高めるために、複数のブロックの情報に基づいてぼけ判定を行う。
ステップS14(第4の工程)において、ぼけ判定部102cは評価値に基づいてぼけ判定を行う。本実施例においてぼけ判定部102cは、取得された複数の評価値の度数分布(ヒストグラム)を用いてぼけ判定を行う。
ここで異なる画像に対するブロックごとの評価値のヒストグラムを図10及び図11に示す。図10及び図11の縦軸はカウント数、横軸は評価値である。なお、8×8画素のブロックで計算しているため、DC成分も含め横軸の最大は64である。また、図10及び図11は輝度情報YのDCT係数のみを用いて算出しているが、これに限られない。例えば色差情報Cr、Cbを用いてもよい。なお、図10及び図11の横軸は一例であり、より細かい(又はより荒い)範囲ごとに要素の数をカウントしてもよい。
例に用いた画像の画素数は、いずれも6720×4480画素である。画像全体に対して8×8画素のブロックごとに評価値を算出した場合、64分の1である470,400個の評価値を有する画像(マップ)が生成可能である。そのため、図10及び図11は470,400個のデータから作成されているヒストグラムでありである。
本実施例では、ヒストグラムを用いて求められる最頻値を用いてぼけ判定を行う。図10における最頻値は38であり、図11における最頻値は46である。つまり、図11は、図10に対してDCT係数におけるゼロが多いため、ぼけている可能性が高い。なお、本実施例におけるぼけ判定では、閾値を設定し、その値に対して大小を比較する。例えば閾値を40に設定した場合、図10は“ぼけてない”また図11は“ぼけている”と判定される。なお、本実施例における閾値は、これに限定されるものではなく、撮像の対象に応じて設定されてもよい。例えば細かい構造の多い(高周波成分を多く含む)被写体を撮像する場合は閾値を高く設定する方が好ましい。一方で細かい構造があまりない(高周波成分が少ない)被写体を撮像する場合は閾値を低めに設定する方が好ましい。このように、閾値は撮影対象に応じて設定されることが好ましく、閾値は撮影された画像に基づいてあらかじめ算出されていてもよい。
また、本実施例ではぼけ判定の指標として最頻値としているが例えば中央値、平均値、総数等の指標を用いてもよい。また、本実施例では撮像画像の全体に対応する復号データから評価値を算出したが、撮像画像の一部の領域に対応する復号データ(部分復号データ)から算出された評価値を算出してもよい。例えば、検査目的で橋梁の壁面を複数枚撮影した際に、検査対象物ではない配管や背景を含む画像が得られる場合がある。この場合、検査対象物以外の領域を除外して評価値を算出することで、ぼけ判定の精度を高めることができる。本実施例では、撮像画像に対応した二次元のマップを作成し、そのマップを用いて評価するため、撮影画像から例えばトリミング処理によって一部の領域のみを切り出してぼけ判定を行うことができる。
さらに、通常の圧縮画像データの代わりにサムネイル用の画像データを用いてぼけ判定を行ってもよい。圧縮画像情報には圧縮画像データのほかにメインの圧縮画像データよりも画素数が少ないサムネイル画像(縮小画像)のデータが保存されていることがある。画素数の少ないサムネイル画像データを用いてぼけ判定を行うことで、より高速にぼけ判定処理を実行することができる。
なお、復号データに含まれるゼロの要素の数又はゼロ以外の要素数に基づいて評価値を算出する例を示したがこれに限定されるものではない。本実施例におけるぼけ判定は復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて撮像画像のぼけの評価を行えばよい。例えばゼロの要素の数とゼロ以外の要素の数との比やゼロの要素の数とゼロ以外の要素の数との差を評価値としてぼけ判定を行ってもよい。
本実施例では、復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて撮像画像のぼけの評価を行うことを特徴としている。復号データは、撮像画像の再構成に必要な逆量子化などの処理の必要がなく圧縮画像データから復号処理のみによって生成されるため、処理時間を短縮することができる。また、撮像画像に含まれる高周波成分の量と相関関係を有する復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて撮像画像のぼけの評価を行うことで、高精度にぼけ判定を行うことができる。
[実施例2]
次に、実施例2における撮像装置100の構成について説明する。本実施例において、撮像装置100は撮像画像のぼけの有無の判定に加え、ぼけている方向を判定する処理を行う。本実施例の方法を用いてぼけ判定を行うことで、手振れによるぼけなどの方向性のあるぼけの判定をすることができる。
次に、実施例2における撮像装置100の構成について説明する。本実施例において、撮像装置100は撮像画像のぼけの有無の判定に加え、ぼけている方向を判定する処理を行う。本実施例の方法を用いてぼけ判定を行うことで、手振れによるぼけなどの方向性のあるぼけの判定をすることができる。
図12は本実施例におけるぼけ判定処理に関するフローチャートである。図12におけるステップS21、S22は図9のステップS11、S12と同様であるため説明は省略する。
ステップS23において、復号部102aは復号したDCT係数を対称化する処理を行う。ここで、図13に図5の量子化テーブルを転置した分布を示す。
一般的に量子化テーブルは水平方向と鉛直方向とで非対称になっている。水平方向と鉛直方向で量子化テーブルの重みが非対称となっている場合、量子化後のDCT係数をそのまま用いて水平方向と鉛直方向の係数の比較をしようとしても正しく評価することはできない。例えば図4において、(μ,ν)=(5,0)のDCT係数は2.09であり、図5にて対応する重みが2なので量子化後に四捨五入されると1になる。しかし、図5の(μ,ν)=(0,5)では重みが1なので、こちらの重みを用いて量子化されていたら2になる。この量子化後のDCT係数に対して図5の量子化テーブルで割り戻すことで、対称性を改善させる(非対称性を補正する)ことができる。しかし、量子化後のDCT係数がゼロになっていた場合、除算することができないため対称性は改善できない。前述のようにJPEG形式のデータは積極的にゼロとなる要素を増やして情報量を圧縮しているため、DCT係数がゼロになることを無視すると精度が低下する。
そこで、本実施例では量子化テーブルの対称性を改善するために、図13の重みをさらに掛ける。図13は図5のテーブルの縦横を転置することで得られた重みのテーブルである。また、図5の量子化テーブルと図13のテーブルとの対応する位置の値を掛け合わせることによって、図14に示す対称性を改善した量子化テーブルを生成する。図14の量子化テーブルは、水平方向と鉛直方向で対称性を有する。このように量子化テーブルを対称化することで、水平方向と鉛直方向で対等な評価を行えるようにする。
続いて、図15に量子化テーブルの対称性を改善したブロック(補正復号データ)を示す。図15は、図6の復号したDCT係数に対して、図13のテーブルを掛け合わせて四捨五入した結果である。
なお、量子化テーブルの対象性の改善方法はこれに限定されるものではない。例えば図16に示す重みを掛けることで、図5の量子化テーブルと合わせて実質的に図4にかかる重みを図17と同様にしてもよい。このような構成とすることで、図4にかけられる重みの値を小さくすることができる。図16は称性を改善させるためのテーブルの一例であり、また図17は、対称性を改善した量子化テーブルの一例である。図17は図5の量子化テーブルと図13のテーブルの対応する位置における値の大きい方の値をとることで生成される。この場合、1未満の値を有した重みで対称化すると値がゼロとなることで圧縮することができるが、圧縮に伴いデータが劣化するため、図16のように1以上の値で構成されたテーブルを用いて対称化することが望ましい。また、本実施例では、水平方向と鉛直方向で対称になるように重みを掛ける例を示したが、DC成分を中心とした回転対称な分布になるように対称化してもよい。
ステップS24において、評価部102bはぼけ判定に用いる評価値を算出する。本実施例において復号データは、二次元化処理され8×8画素のブロックで表される。ここで、図18にぼけの方向の判定のための領域に関する図を示す。図18に示すように8×8画素の二次元で表される復号データのうち4×4画素の2つの領域に分ける。領域A(第1の領域)は水平方向が高周波で鉛直方向が低周波となる領域、領域B(第2の領域)は水平方向が低周波で鉛直方向が高周波となる領域である。本実施例ではこの領域A及び領域BのそれぞれについてDCT係数がゼロの要素の数をカウントすることで第1及び第2の評価値を算出する。一例として、図15のDCT係数に対して実施した場合、領域Aのゼロの要素の数は13個、領域Bのゼロの要素の数は14個である。なお、ゼロ以外の要素の数を評価値としてもよく、この場合も同様に処理を実施できる。
ステップS25において、ぼけ判定部102cは評価値に基づいてぼけ判定を行う。本実施例においてぼけ判定部102cは、復号データにおける領域A及び領域Bごとの評価値に基づいて生成された度数分布(ヒストグラム)を用いてぼけ判定を行う。
本実施例におけるぼけ判定部102cは、領域Aと領域Bを比較することで、ぼけている方向を判定することができる。例えば領域Bにおける最頻値に比べて領域Aにおける最頻値が大きい場合、水平方向に“ぼけている”と判定する。一方で、領域Bにおける最頻値に比べて領域Aにおける最頻値が少ない場合、鉛直方向に“ぼけている”と判定する。さらに、ぼけ判定部102cは、領域A及び領域Bの差に対する閾値を用いて領域Aと領域Bで最頻値の差が閾値よりも小さい場合に、“ぼけてない”と判定してもよい。
なお、本実施例では2つの領域に分けてぼけの方向を評価する方法について説明したが、3つ以上の領域に分けて評価してもよい。また、ぼけの方向は、水平方向と鉛直方向でゼロ以外の要素の最大座標に基づいて評価してもよい。例えば図15におけるゼロ以外の要素の最大座標は、水平方向で(μ,ν)=(5,0)、鉛直方向で(μ,ν)=(0,5)であり、図6におけるゼロ以外の要素の最大座標は、水平方向で(μ,ν)=(5,0)で鉛直方向が(μ,ν)=(0,6)である。
本実施例では、復号データにおける第1の領域と第2の領域とに対応する評価値を算出し、ぼけの方向を判定する方法について述べた。特に、ステップS23の量子化テーブルの対称性を改善する処理を入れることにより、ぼけの方向の判定精度を高めることができる。
(その他の実施例)
本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。本発明における画像処理装置は本発明の画像処理機能を有する装置であればよく、撮像装置やPCの形態で実現され得る。
本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。本発明における画像処理装置は本発明の画像処理機能を有する装置であればよく、撮像装置やPCの形態で実現され得る。
各実施例によれば、撮像画像のぼけ判定を高精度かつ高速に実行することができる画像処理方法、画像処理装置およびプログラムを提供することができる。
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されたものではなく、その要旨の範囲内で様々な変形、及び変更が可能である。
本発明の実施形態は以下の方法、及び構成を含む。
[方法1]
符号化処理を含む圧縮処理によって撮像画像を圧縮することで生成された圧縮画像データと、前記符号化処理に用いられた符号化情報とを含む圧縮画像情報を取得する第1の工程と、
前記符号化情報を用いて前記圧縮画像データを復号することで復号データを生成する第2の工程と、
前記復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて前記撮像画像のぼけの評価を行う第3の工程とを有することを特徴とする画像処理方法。
符号化処理を含む圧縮処理によって撮像画像を圧縮することで生成された圧縮画像データと、前記符号化処理に用いられた符号化情報とを含む圧縮画像情報を取得する第1の工程と、
前記符号化情報を用いて前記圧縮画像データを復号することで復号データを生成する第2の工程と、
前記復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて前記撮像画像のぼけの評価を行う第3の工程とを有することを特徴とする画像処理方法。
[方法2]
前記圧縮処理は、前記撮像画像の輝度情報を生成する処理を含み、
前記第2の工程では、前記圧縮画像データのうち前記輝度情報に対応するデータのみを復号することで前記復号データを生成することを特徴とする方法1に記載の画像処理方法。
前記圧縮処理は、前記撮像画像の輝度情報を生成する処理を含み、
前記第2の工程では、前記圧縮画像データのうち前記輝度情報に対応するデータのみを復号することで前記復号データを生成することを特徴とする方法1に記載の画像処理方法。
[方法3]
前記第3の工程では、前記復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて評価値を算出し、前記評価値と閾値とを比較することで、前記撮像画像のぼけの有無を判定することを特徴とする方法1又は2に記載の画像処理方法。
前記第3の工程では、前記復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて評価値を算出し、前記評価値と閾値とを比較することで、前記撮像画像のぼけの有無を判定することを特徴とする方法1又は2に記載の画像処理方法。
[方法4]
前記圧縮処理は、前記撮像画像の所定の大きさを有する複数のブロックのそれぞれに施される周波数変換を含み、
前記第2の工程では、前記複数のブロックのそれぞれに対応する複数の復号データを生成することを特徴とする方法1乃至3の何れか一項に記載の画像処理方法。
前記圧縮処理は、前記撮像画像の所定の大きさを有する複数のブロックのそれぞれに施される周波数変換を含み、
前記第2の工程では、前記複数のブロックのそれぞれに対応する複数の復号データを生成することを特徴とする方法1乃至3の何れか一項に記載の画像処理方法。
[方法5]
前記第3の工程では、前記複数の復号データのそれぞれに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて複数の評価値を算出し、前記複数の評価値の最頻値、平均値、中央値及び総和の少なくとも一つに基づいて前記撮像画像のぼけの有無を判定することを特徴とする方法4に記載の画像処理方法。
前記第3の工程では、前記複数の復号データのそれぞれに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて複数の評価値を算出し、前記複数の評価値の最頻値、平均値、中央値及び総和の少なくとも一つに基づいて前記撮像画像のぼけの有無を判定することを特徴とする方法4に記載の画像処理方法。
[方法6]
第3の工程では、前記復号データのうち前記撮像画像の一部の領域に対応する部分復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて前記撮像画像のぼけの評価を行うことを特徴とする方法1乃至5の何れか一項に記載の画像処理方法。
第3の工程では、前記復号データのうち前記撮像画像の一部の領域に対応する部分復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて前記撮像画像のぼけの評価を行うことを特徴とする方法1乃至5の何れか一項に記載の画像処理方法。
[方法7]
前記第2の工程では、逆量子化を行わず復号データを生成することを特徴とする方法1乃至6の何れか一項に記載の画像処理方法。
前記第2の工程では、逆量子化を行わず復号データを生成することを特徴とする方法1乃至6の何れか一項に記載の画像処理方法。
[方法8]
前記圧縮処理は、量子化処理を含み、
前記圧縮画像情報は、前記量子化処理に関する量子化情報を含み、
前記復号データと前記量子化情報とに基づいて前記量子化処理における非対称性を補正することで、補正復号データを生成する工程とをさらに有する方法1乃至7の何れか一項に記載の画像処理方法。
前記圧縮処理は、量子化処理を含み、
前記圧縮画像情報は、前記量子化処理に関する量子化情報を含み、
前記復号データと前記量子化情報とに基づいて前記量子化処理における非対称性を補正することで、補正復号データを生成する工程とをさらに有する方法1乃至7の何れか一項に記載の画像処理方法。
[構成1]
方法1乃至8の何れか一項に記載の画像処理方法を実行可能な処理手段を有することを特徴とする画像処理装置。
方法1乃至8の何れか一項に記載の画像処理方法を実行可能な処理手段を有することを特徴とする画像処理装置。
[構成2]
方法1乃至8の何れか一項に記載の画像処理方法を実行可能な処理手段と、
被写体空間の像を撮影画像として取得する撮像手段とを有することを特徴とする撮像装置。
方法1乃至8の何れか一項に記載の画像処理方法を実行可能な処理手段と、
被写体空間の像を撮影画像として取得する撮像手段とを有することを特徴とする撮像装置。
[構成3]
方法1乃至8の何れか一項に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
方法1乃至8の何れか一項に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
[構成4]
構成3に記載のプログラムを記憶していることを特徴とする記憶媒体。
構成3に記載のプログラムを記憶していることを特徴とする記憶媒体。
ステップS11 第1の工程
ステップS12 第2の工程
ステップS13 第3の工程
ステップS12 第2の工程
ステップS13 第3の工程
Claims (12)
- 符号化処理を含む圧縮処理によって撮像画像を圧縮することで生成された圧縮画像データと、前記符号化処理に用いられた符号化情報とを含む圧縮画像情報を取得する第1の工程と、
前記符号化情報を用いて前記圧縮画像データを復号することで復号データを生成する第2の工程と、
前記復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて前記撮像画像のぼけの評価を行う第3の工程とを有することを特徴とする画像処理方法。 - 前記圧縮処理は、前記撮像画像の輝度情報を生成する処理を含み、
前記第2の工程では、前記圧縮画像データのうち前記輝度情報に対応するデータのみを復号することで前記復号データを生成することを特徴とする請求項1に記載の画像処理方法。 - 前記第3の工程では、前記復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて評価値を算出し、前記評価値と閾値とを比較することで、前記撮像画像のぼけの有無を判定することを特徴とする請求項1に記載の画像処理方法。
- 前記圧縮処理は、前記撮像画像の所定の大きさを有する複数のブロックのそれぞれに施される周波数変換を含み、
前記第2の工程では、前記複数のブロックのそれぞれに対応する複数の復号データを生成することを特徴とする請求項1に記載の画像処理方法。 - 前記第3の工程では、前記複数の復号データのそれぞれに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて複数の評価値を算出し、前記複数の評価値の最頻値、平均値、中央値及び総和の少なくとも一つに基づいて前記撮像画像のぼけの有無を判定することを特徴とする請求項4に記載の画像処理方法。
- 第3の工程では、前記復号データのうち前記撮像画像の一部の領域に対応する部分復号データに含まれるゼロの要素の数、及びゼロ以外の要素の数の少なくとも一方に基づいて前記撮像画像のぼけの評価を行うことを特徴とする請求項1乃至5の何れか一項に記載の画像処理方法。
- 前記第2の工程では、逆量子化を行わず復号データを生成することを特徴とする請求項1乃至5の何れか一項に記載の画像処理方法。
- 前記圧縮処理は、量子化処理を含み、
前記圧縮画像情報は、前記量子化処理に関する量子化情報を含み、
前記復号データと前記量子化情報とに基づいて前記量子化処理における非対称性を補正することで、補正復号データを生成する工程とをさらに有する請求項1乃至5の何れか一項に記載の画像処理方法。 - 請求項1乃至5の何れか一項に記載の画像処理方法を実行可能な処理手段を有することを特徴とする画像処理装置。
- 請求項1乃至5の何れか一項に記載の画像処理方法を実行可能な処理手段と、被写体空間の像を撮影画像として取得する撮像手段とを有することを特徴とする撮像装置。
- 請求項1乃至5の何れか一項に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
- 請求項11に記載のプログラムを記憶していることを特徴とする記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022173039A JP2024064449A (ja) | 2022-10-28 | 2022-10-28 | 画像処理方法、画像処理装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022173039A JP2024064449A (ja) | 2022-10-28 | 2022-10-28 | 画像処理方法、画像処理装置、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024064449A true JP2024064449A (ja) | 2024-05-14 |
Family
ID=91034149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022173039A Pending JP2024064449A (ja) | 2022-10-28 | 2022-10-28 | 画像処理方法、画像処理装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024064449A (ja) |
-
2022
- 2022-10-28 JP JP2022173039A patent/JP2024064449A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7181082B2 (en) | Blur detection system | |
US10638162B2 (en) | Coding method and decoding processing method | |
JP4799438B2 (ja) | 画像記録装置、画像記録方法、画像符号化装置、及びプログラム | |
US9635212B2 (en) | Dynamic compression ratio selection | |
JP2011515981A (ja) | ビデオ信号のエンコーディングまたはデコーディング方法及び装置 | |
KR102070622B1 (ko) | 동영상을 위한 양자화 테이블 추정 방법 및 장치 | |
US11928843B2 (en) | Signal processing apparatus and signal processing method | |
JP2010109834A (ja) | ノイズ低減装置、ノイズ低減方法及びプログラム | |
Altinisik et al. | Extracting PRNU noise from H. 264 coded videos | |
CN108156461A (zh) | 一种Bayer图像压缩方法及装置 | |
JP6700798B2 (ja) | 撮像装置及びその制御方法 | |
US20230133895A1 (en) | Image encoding apparatus and method for controlling the same and non-transitory computer-readable storage medium | |
JP2024064449A (ja) | 画像処理方法、画像処理装置、及びプログラム | |
JP4310282B2 (ja) | 画像符号化装置および符号化方法 | |
KR20170046136A (ko) | 이미지 유형에 따른 압축 알고리즘 선택 방법 | |
JP7016660B2 (ja) | 符号化装置、その制御方法、および制御プログラム、並びに撮像装置 | |
JP5165084B2 (ja) | 画像符号化装置 | |
JP6816137B2 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP6486120B2 (ja) | 符号化装置、符号化装置の制御方法、及びプログラム | |
JP4174493B2 (ja) | 画像処理装置及び方法 | |
JP2011254393A (ja) | 符号化装置、符号化方法及びプログラム | |
Huang et al. | A method of approximately reconstructing JPEG quantization table via saturated overflow | |
JP4006276B2 (ja) | 画像認識方法、画像認識装置及びコンピュータプログラム | |
JP4078136B2 (ja) | 画像認識方法、画像認識装置及びコンピュータプログラム | |
JP2018006999A (ja) | 画像符号化装置及びその制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |