JP2015171097A - 画像処理装置及びその制御方法 - Google Patents
画像処理装置及びその制御方法 Download PDFInfo
- Publication number
- JP2015171097A JP2015171097A JP2014046754A JP2014046754A JP2015171097A JP 2015171097 A JP2015171097 A JP 2015171097A JP 2014046754 A JP2014046754 A JP 2014046754A JP 2014046754 A JP2014046754 A JP 2014046754A JP 2015171097 A JP2015171097 A JP 2015171097A
- Authority
- JP
- Japan
- Prior art keywords
- image
- roi
- sub
- encoding
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Studio Devices (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】所望とするROI(Region Of Interest)領域にリフォーカスした画像をできるようにしつつも、高い符号化効率で符号化データを生成する画像処理装置を提供する。【解決手段】画像処理装置は、多視点画像データを構成する各視点のサブイメージ内の同一位置の画素の値の平均値を算出することで、算出した平均値を該当する位置の画素値とする平均画像を生成する生成部と、各サブイメージにおけるコントラストと、各サブイメージ間の視差とに基づき、各サブイメージに共通な少なくとも1つのROI領域を検出する検出部106と、平均画像、及び、各サブイメージ内の各ROI領域で示される部分画像を符号化し、ROI領域の位置情報と合わせて符号化データ列を形成する符号列生成部111とを有する。【選択図】図22
Description
本発明は多視点画像の符号化技術に関するものである。
従来から、複数の視点で映像を撮影し、撮影した多視点映像を利用してステレオ立体視や、自由視点合成、自由焦点画像合成(リフォーカス)といった映像表現を実現する方法が知られている。そのような映像表現を実現するためには、多視点で撮影した映像を保存する必要があるが、異なる視点の映像を別々に符号化すると、視点数に比例したデータ量になってしまう課題がある。一方で、多視点映像を撮影するカメラ同士が近いほど、異なる視点の映像間の相関が高く、別々に圧縮した場合に比べて符号データを削減できると考えられ、この性質を利用した圧縮・符号化方式が多数提案されている。
既存の画像の符号化方式としては、国際標準化団体であるMPEGで検討された動画符号化であるAVC(Advanced Video Coding)やMVC(Multiview Video Coding)方式がある。MVCでは、2か所の多視点画像で似たブロックを探索し、その位置関係を視差ベクトルとして算出し、動画符号化の動きベクトルと切り替えながら符号化していく方式で、既に国際標準方式となったものである。
また、Yi−Ren(特許文献1)らのプレノプティックカメラでは、センサの前にマイクロレンズアレイを配置し、複数視点の画像を撮影し、それらを光線の入射方向を考慮しながら、自由視点合成、自由焦点画像合成を合成する方法が開示されている。
図1は、プレノプティックカメラの構成の一例である。物体Aはメインレンズ222の焦点部におかれたマイクロレンズ223で、2×2のセンサ面224に光線が分光されて像を得るものである。センサ上の各画素225は、それぞれの位置毎に集められ、画像サイズが縦横1/2の4つのサブイメージ227を生成する。図示の符号226はマイクロレンズと2×2センサの正面の模式図である。
一般に、ボケの形状はレンズの開口部の形状で決まるという事実、プレノプティックカメラで撮影した各多視点画像は、メインレンズの一部を通過した光を捉えた部分開口画像である事実が知られている。従って、2×2のセンサ225上に、円形のマイクロレンズを設置した構成では部分開口が1/4円(もしくはそれ相当)になるので、4方向に異なる異方性ボケ画像が生成されることになる。これを例示したものが図2である。図2に示すごとく、点光源のボケを示す4個のサブ画像231〜235では、そのボケの方向(グラデーション)が異なったものとなる。そして、この4つの画像の平均をとった画像235は、偏りのない画像になることも公知である。
図2で示したような、ボケを含む画像を画像符号化する場合を考える。このとき、4つのサブイメージにおいて、背景部などにおいてボケの方向が異なるため、画像間差分を計算すると、大きな差分を生じることになる。この理由により、公知技術であるAVC,MVCの原理であるフレーム間差分符号化や視差補償予測符号化の効率が悪くなることが容易に予想される。
これを対策する方法の1つとして、4つの画像の平均値をとることにより、ボケが等方性になることでまず画質が向上することを前述した。しかし、平均化処理により、画像の先鋭度が下がること、さらに、詳細は後述する実施形態から明らかにするが、4視点の情報を使った画像シフト合成による自由焦点処理(リフォーカス)ができなくなるという問題が発生する。
また、このリフォーカス処理を行うためには、各視点画像において先鋭度が高い部分が必要となり、画像全体を低圧縮にする必要があり、全体の符号量が多くなるという問題がある。
本発明は上記の問題点に鑑みなされたものであり、所望とするROI領域にリフォーカスした画像を生成できるようにしつつも、高い符号化効率で符号化データを生成する技術を提供するものである。
この課題を解決するため、例えば本発明の画像処理装置は以下の構成を備える。すなわち、
多視点画像データを符号化する画像処理装置であって、
前記多視点画像データを構成する各視点のサブイメージ内の同じ位置の画素の値の平均値を算出することで、算出した平均値を該当する位置の画素値とする平均画像を生成する生成手段と、
前記各サブイメージに共通な少なくとも1つのROI領域を検出する検出手段と、
前記生成手段で生成された前記平均画像、及び、前記検出手段で検出した各サブイメージ内の各ROI領域で示される部分画像を符号化し、前記検出手段が検出したROI領域の位置を示す情報と合わせて符号列を生成する符号列生成手段とを有する。
多視点画像データを符号化する画像処理装置であって、
前記多視点画像データを構成する各視点のサブイメージ内の同じ位置の画素の値の平均値を算出することで、算出した平均値を該当する位置の画素値とする平均画像を生成する生成手段と、
前記各サブイメージに共通な少なくとも1つのROI領域を検出する検出手段と、
前記生成手段で生成された前記平均画像、及び、前記検出手段で検出した各サブイメージ内の各ROI領域で示される部分画像を符号化し、前記検出手段が検出したROI領域の位置を示す情報と合わせて符号列を生成する符号列生成手段とを有する。
本発明によれば、所望とするROI領域にリフォーカスした画像を生成できるようにしつつも、高い符号化効率で符号化データを生成することが可能となる。
以下、添付図面を参照し、本発明に係る画像処理装置の実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載の構成の具体的な例である。
[第1の実施形態]
第1の実施形態では、撮像装置に適用した例を説明する。図22(a)は第1の実施形態における撮像装置100のブロック構成図である。撮像装置100は、CPU、ROM、RAM等で構成され、装置全体の制御を司る制御部101を有する。他の構成については、その機能と共に以下に説明する。なお、実施形態では、説明を簡単なものとするため、符号化対象の画像は1画素が、8ビットで表される1成分のモノクロ画像として説明する。これは、あくまで説明を単純にするためのものであると理解されたい。
第1の実施形態では、撮像装置に適用した例を説明する。図22(a)は第1の実施形態における撮像装置100のブロック構成図である。撮像装置100は、CPU、ROM、RAM等で構成され、装置全体の制御を司る制御部101を有する。他の構成については、その機能と共に以下に説明する。なお、実施形態では、説明を簡単なものとするため、符号化対象の画像は1画素が、8ビットで表される1成分のモノクロ画像として説明する。これは、あくまで説明を単純にするためのものであると理解されたい。
多視点撮像部102は、図1のカメラ構造を有し、1回の撮影で視点位置の異なる2×2個のサブイメージを生成し、バッファメモリ103に出力する。なお、図1では1個のマイクロレンズに対して2×2個のセンサが割り当てられている例であるが、1個のマイクレンズに対するセンサの個数が3×3個とするのでれば、3×3個のサブイメージを入力することになるので、サブイメージの個数は2×2に限るものではないことに注意されたい。
合成画像生成部104はバッファメモリ103に格納された2×2個のサブイメージを合成し、1枚の合成画像を生成し、第1符号化部108に出力する。この第1符号化部108は、入力した合成画像を符号化し、その符号化データを符号列生成部111に出力する。実施形態における、第1符号化部108は、非可逆符号化データを生成するJPEG符号化器を想定している。
デプスデータ生成部105は、バッファメモリ103に格納された2×2個のサブイメージに基づき、画素位置毎のデプスデータ(奥行データ)を生成し、それを第2符号化部109に出力する。この第2符号化部108は、入力したデプスデータを符号化し、その符号化データを符号列生成部111に出力する。実施形態における、第2符号化部109は、デプス値を画素値と見立てて、可逆符号化データを生成するJPEG−LS符号化器を想定している。
ROI検出部106は、バッファメモリ103に格納された2×2個のサブイメージそれぞれのROI(Region Of Interest)領域を検出し、その検出したROI領域の座標データ(矩形の左上隅と右下隅の座標とするが、左上隅と幅、高さでも構わない)をROI切り出し部107に出力する。ROI切り出し部107は、ROI検出部106で検出された座標データに基づき、各サブイメージ内の該当する領域を切り出し、第3符号化部110に出力する。第3符号化部110は、入力したROI領域が表す部分画像を符号化し、符号列生成部111に出力する。実施形態における、第3符号化部110は、非可逆符号化データを生成するJPEG符号化器を想定している。
なお、回路規模を小さくするのであれば、第1符号化部108、第3符号化部111の符号化処理を1つの符号化部で兼用しても構わない。ただし、ROIが表す部分画像は、その画質が高いことが望まれるので、量子化ステップは、背景画像を符号化する場合と比較して小さいことが望ましい。また、第1、第3符号化部を非可逆符号化データを生成するものとしたが、可逆符号化データを生成することを許容するのであれば、3つの符号化を1つの符号化部で兼用しても構わない。
符号列生成部111は、第1符号化部108、第2符号化部109、第3符号化部110からの符号化データを接続し、所定のヘッダを付加した符号化データファイルを生成する。そして、出力部112は、生成された符号化データファイルを、例えばメモリカードなどの記憶媒体に書き込むことになる。なお、出力対象は、メモリカードに限るものではなく、他の記憶媒体でも構わないし、場合によっては出力対象はネットワークでも良い。
以上、第1の実施形態における撮像装置100の構成について説明した。以下、係る構成を踏まえ、更に詳しく第1の実施形態を説明する。
図3は、実施形態における被写体の例である。図示は、壁の前にある植木鉢に咲く花の写真を示し、3つの花が手前、真ん中、奥に配置されているものとする。実施形態では、これらの花の部分は被写界深度内で合焦(ピント合わす)させる。一方、壁と植木鉢は被写界深度外でレンズによりボケが生じさせると仮定して説明する。
図4は、図3の被写体を撮影した際に、2×2センサ画像の各視点の画素を集めて作成したサブイメージ41乃至44の例である。これらは先に説明したように、バッファ103に格納されることになる。本実施形態であるマイクロレンズと2×2のセンサの組み合わせで、左右方向に2段階、上下方向に2段階背景がずれた4つのサブイメージ41乃至44が生成されている。被写界深度内なので、4つのサブイメージ41乃至44内の、3つの花にはすべてピントが合っている状態になっているものとする。ただし、真ん中の花は、真の合焦位置にあり、各サブイメージにおける視差がない、もしくは無視できる視差しかないものとする。
図5は、合焦している領域がA,B,Cの3箇所あることを示している。4視点のサブイメージそれぞれは、視差を持ちながら同じようなA,B,C領域がある。これらが実施形態におけるROIとして扱われることになる。すなわち、ROI検出部106は、各サブイメージ内の、これらのROIの座標を検出することになる。そして、ROI切り出し部107は、その座標に基づき、各サブイメージからROI内の画像を切り出し、第3符号化部110はそれを符号化する。
図6は、ROI検出部106におけるROI決定フローである。S601では、4視点のサブイメージをバッファメモリ103から入力する。そして、ステップ602では4視点のサブイメージ毎の高コントラスト部の検出を行う。高コントラスト検出は、例えば、m×n個の画素で構成される画素ブロック(実施形態ではm=n=8とする)内の画素値の平均値を算出し、その画素ブロック内の各画素値と平均値との差分の絶対値和を求める処理で良い。絶対値和が大きいほど、その画素ブロック内には、差が大きい画素が多く含むことを意味することになるので、絶対値和はコントラストを示していると言える。絶対値和は、その程度がわかれば良いので、例えば8ビットの精度で算出する。上記の結果、4枚のサブイメージから、コントラスト値を画素とする4枚のコントラスト画像が生成されることになる。なお、生成されるコントラス画像の画素数は、オリジナルのサブイメージの1/64の画素数となるのは明らかである。
次にステップ603は、各サブイメージから生成したコントラスト画像間で、水平方向、垂直方向(便宜的にx、y方向とする)で相関の高い領域の探索処理を行う。
例えば、図4のサブイメージ41から生成されたコントラスト画像と、サブイメージ42から生成されたコントラスト画像間での探索処理の場合には、両コントラスト画像の一方のみを水平方向に0、1、2…とシフトさせた際の画素の差分値を求める処理を行う。そして、ステップS604において、2つのコントラスト画像にて、共通に、画素値(コントラスト値)が所定以上で、かつ、画素値の差分が所定閾値以下となる連続する領域を判定し、その領域内の画素値がROIを構成する画素と認定し、それ以外を非ROI画素と認定する。そして、ROIに属すると認定された、水平、垂直方向に接続される領域をROI領域として決定する。従って、サブイメージ41から生成されたコントラスト画像と、サブイメージ42から生成されたコントラスト画像間での探索処理では、水平方向に座標位置は異なる可能性があるものの、それら両者に共通な3つのROI領域が検出できる。なお、ここで言う画素は、コントラスト画像における画素であるので、オリジナルのサブイメージに換算する場合には、その画素の座標を水平、垂直とも8倍する(m=n=8としているため)。実施形態の場合、ROIは矩形としているので、その矩形の左上隅、右下隅の座標を算出することになる。
同様に、サブイメージ42内にも3つのROIが検出されることになる。サブイメージ43のROIは、サブイメージ41との相関に基づき求めれば良い。ただし、この場合には視差は垂直方向になる点に注意されたい。そして、サブイメージ44内のROIの検出は、サブイメージ41、42、43のいずれか1つとの視差方向に従って求めればよい。
以上の結果、実施形態の場合、サブイメージ41乃至44のそれぞれに、3つのROI(「花」の部分)が検出されることになる。
図7は、ROI間の視差を計算するための、ブロックマッチングの原理図である。図示の符号71は左上視点のサブイメージであり、領域a0と相関の高い領域をサブイメージ72、73内で探索する。a1領域が視差x、a2領域が視差yでそれぞれ検出できたとする。同様にサブイメージ72と74が視差y、サブイメージ73と74が視差xで検出できた場合は、領域a1,a2,a3,a4は、各視点のサブイメージにおけるROI領域とする。同様な判断で、b0,b1,b2,b3領域もROI領域かどうかも判定可能となる。
ここで、リフォーカス処理について説明する。リフォーカス処理は、4枚のサブイメージから、着目しているROIにフォーカスした画像を生成する処理であって、主に復号装置側の機能でもある。図8は、リフォーカス処理のため画像位置をシフトすることの説明図である。サブイメージでは視点が異なるため、A,B,C領域が少しづつ、ずれて撮影される。これを実線枠で示す。破線は、各サブイメージの同じ画素位置を示している。ABC領域をこの位置に平行移動して加算するとその位置の領域だけ合焦(ピントが合う)その他はボケた画像になることは明らかである。領域Aは、真の合焦位置なので、シフトしないで4つのサブイメージの平均化により、合焦画像が得られる。シフトゼロでは、領域B,領域Cは4つのサブイメージの平均化により合焦位置がずれたボケ画像が得られる。
一方領域Bは、奥側にある領域なので、4つのサブイメージ2×2の中央側に奥行位置に応じた量sシフトして平均化すると合焦画像が得られる。一方、このシフト量では領域Aと領域Cは合焦位置がずれてボケ画像が得られる。
また、領域Cは、手前側にある領域なので、4つのサブイメージ2×2の外側に奥行位置に応じた量tシフトして平均化すると合焦画像が得られる。一方、このシフト量では領域Aと領域Bは合焦位置がずれてボケ画像が得られる。
このように、4つのサブイメージのシフト量を調整して平均化することにより、目的とするROI領域が合焦し、それ以外はボケるという再合焦(リフォーカス)した画像を生成することが可能となる。
図9は、領域Aに合焦するような、4視点画像の合成方法を示している。実線の文字で示したブロックAが合焦、破線で示した文字で示したブロックB,Cが合焦していないところを示している。
図10は、領域Bに合焦するような、4視点画像の合成方法を示している。実線の文字で示したブロックBが合焦、破線の文字で示したブロックA,Cが合焦していないところを示している。
図11は、領域Cに合焦するような、4視点画像の合成方法を示している。実線の音字文字で示したブロックCが合焦、破線の文字で示したブロックA,Bが合焦していないところを示している。
このように、いくつものROIのうち、ユーザが意図した1つにリフォーカスした画像を生成することが可能とまる。なお、図9乃至図11のいずれの処理を行うかは、ユーザが例えばマウスなどのポインティングデバイスで指定した座標が、領域A,B,Cのいずれに近いに応じて決定すれば良い。指定したROIについては合焦、指定外のROIについてはボケたた像が生成できる。
図12は、ROI部と背景部の合成方法の説明図である。4つのサブイメージでは背景部でボケの方向が違っていたが、シフト量0で、4つのサブイメージの加算平均をとると、ボケの平均化された背景部が生成できる。これを共通な背景画像とする。さらに、合成したブロックA,B,Cの再合焦(リフォーカス)画像と背景画像を合成することにより、画像全体のリフォーカス画像を得ることができる。
そのため、合成画像生成部104は、このシフト量0の4つサブイメージの加算平均した画像を生成し、第1符号化部108に出力する。シフト量0であるから、合成画像生成部104は、4つのサブイメージの同一座標位置の画素を加算し、その加算結果を4で除算した値を、合成画像中の同じ画素位置の画素値と算出するだけで良い。つまり、合成画像生成部104は、4つのサブイメージから、その平均画像を算出する。
因に、リフォーカス処理を行う際の、ROI領域が示す部分画像と背景画像の合成器は、図13に示すような構成で良い。この例でのROIが示す部分画像と背景画像を合成する時に透明度を使う方法について述べる。
図示の、符号1301はシフト0で合成した背景画像であり、1302は4視点ROI領域のシフト合成画像である。1303は、透明度設定信号である。1300は合成器で、リフォーカス後の画素値Pixは、次式に従って算出する。
Pix = α*Fg+(1−α)*Bg
ここで、FgはROI合成画像、Bgは背景画像である。透明度αは、ROI領域内(部分画像内)の各画素もしくは、微小領域の持つ画素のエッジ量を求めて、エッジ量に比例した値である。この値αは、エッジの度合いが大きければ大きいほど1に、平坦であればあるほど0になるようなブレンドの度合いを示す値でもある。故に、αはエッジの度合いを示す指標値ということもできる。このほかにも、デプスから算出する方法、領域分割結果から算出する方法なども考えられるが、これらは復号する側のリフォーカス処理であるので、これ以上の説明は省略する。
Pix = α*Fg+(1−α)*Bg
ここで、FgはROI合成画像、Bgは背景画像である。透明度αは、ROI領域内(部分画像内)の各画素もしくは、微小領域の持つ画素のエッジ量を求めて、エッジ量に比例した値である。この値αは、エッジの度合いが大きければ大きいほど1に、平坦であればあるほど0になるようなブレンドの度合いを示す値でもある。故に、αはエッジの度合いを示す指標値ということもできる。このほかにも、デプスから算出する方法、領域分割結果から算出する方法なども考えられるが、これらは復号する側のリフォーカス処理であるので、これ以上の説明は省略する。
図1に戻って、デプスデータ生成部105は、例えば、4つのサブイメージ41乃至44から奥行方向の程度を示す画素単位のデプスデータを生成する。典型的には、例えばセブイメージ41、42に着目した場合、これらは水平軸に沿った視差があるわけであるから、2つの画像中の対応画素の水平方向の差分(視差)をもとめ、その示唆の逆数を算出することで得られる。視差が大きいということは、視点からその画素を持つ対象物までの距離が近いことを示し、逆に視差が小さいということは視点からその画素を持つ対象物までの距離が遠いことを示すからである。第2符号化部109は、このデプスデータを可逆符号化し、その結果を符号列生成部111に出力する。
符号列生成部111は、ROI検出部106からの各サブイメージごとのROIの座標データ、第1符号化部108、第2符号化部109、第3符号化部110それぞれからの符号化データを入力し、復号に必要な情報を含めたヘッダに後続して、ROI座標、それら符号化データを並べたファイルを生成し、出力部112に渡すことになる。
図16は、実施形態における出力部112が出力するファイル構造の例を示している。最初のヘッダは、復号処理に必要なデータを格納する領域で、画像サイズ(水平、垂直方向の画素数)、色数(実施形態では色数が1)、色空間名、色のビット数、視点数など撮像システムの構成を示したデータを格納する。
背景画像は、第1符号化部108から出力されたシフト0で平均化して得た画像のJPEG符号化したデータである。
後続して、最初のサブイメージ41から抽出したROIの個数と各ROIの座標で構成されるROIデータ、そして、サブイメージ41中の各ROI領域の部分画像のJPEG符号化データ(第3符号化部110が生成した)で構成されるROI画像データが配置される。そして、それに後続してサブイメージ42、43、44それぞれの{ROIデータ、ROI画像データ}が配置される。そして、最後に、第2符号化部109が生成した符号化されたデプスデータが配置される。なお、最後のデプスデータであるが、表示時の背景画像の生成方法で使用する場合としない場合があり、オプションで構わない。
図17は、ROI領域間の視差ベクトルを符号化することの説明図である。4視点の1つを代表画像として、そのROI領域と別の視点からの画像のROI領域の視差ベクトルを算出し、それを符号化する。視差ベクトルは、画素単位でも良いし、画素ブロック単位でもよい。さらにその視差ベクトルを使った視差予測補償データを生成し、そのデータとそれぞれの視点の画像との差分をもとめ、その差分値を符号化することも考えられる。また、どこかの視点位置に合わせたシフト背景画像を生成すれば、その視点のROI領域は合焦しているわけだから、代表画像のROI領域の符号化が不要にすることも可能である。最終的には背景画像と合成するので、背景画像と代表ROI画像の位置とその他のROI画像との相対位置が分かればどのような方法をとっても構わない。
一部復号側の処理も含めたが、以上が実施形態における画像符号化に係る構成と処理である。ROIの個数や座標に係るデータの、全体のデータ量の占める割合は無視できる程度である。よって、本実施形態で生成されるデータ量は、図16に示すように、1つのシフトゼロの合成画像、各サブイメージ内のROI画像の符号化データ、及び、オプションであるがデプスデータの符号化データである。4つのサブイメージそれぞれをJPEG符号化する場合の合計量と比較して、十分に小さいデータ量とすることができるのは、理解できよう。
実施形態における符号化データファイルのフォーマットは図16に示す通りであるが、そのファイルを構成する個々の符号化データはJPEGやJPEG−LS等の周知のアルゴリズムに従って生成しているだけである。また、復号装置は、ヘッダを解析し符号化データを復号すれば良いだけであるので、ここでの詳述は省略する。
以上説明したように実施形態によれば、多視点画像データから1枚の背景画像を生成し、その背景画像の符号化データと、各視点の画像中のROI領域の画像の符号化データで構成されるデータを、多視点画像データの符号化データとした。この結果、各視点の画像データを符号化する場合よりもはるかに少なく、かつ、復号する側では、自然な背景を有し、所望とするROIにリフォーカスした画像を簡単に生成することも可能になる。
[第2の実施形態]
上記は図22(a)の構造を持つ装置として説明したが、その処理をソフトウェア(コンピュータプログラム)として実装しても良い。この場合、このソフトウェアは、PC(パーソナルコンピュータ)等、一般のコンピュータのメモリにインストールされることになる。そしてこのコンピュータのCPUがこのインストールされたソフトウェアを実行することで、このコンピュータは、上述の画像処理装置の機能を実現することになる。即ち、このコンピュータは、上述の画像処理装置に適用することができる。第1の実施形態に係る多視点画像符号化装置に適用可能なコンピュータのソフトウェアで実現する場合の、コンピュータハードウェア構成例を図22(b)に示し、以下に説明する。
上記は図22(a)の構造を持つ装置として説明したが、その処理をソフトウェア(コンピュータプログラム)として実装しても良い。この場合、このソフトウェアは、PC(パーソナルコンピュータ)等、一般のコンピュータのメモリにインストールされることになる。そしてこのコンピュータのCPUがこのインストールされたソフトウェアを実行することで、このコンピュータは、上述の画像処理装置の機能を実現することになる。即ち、このコンピュータは、上述の画像処理装置に適用することができる。第1の実施形態に係る多視点画像符号化装置に適用可能なコンピュータのソフトウェアで実現する場合の、コンピュータハードウェア構成例を図22(b)に示し、以下に説明する。
CPU1501は、RAM1502やROM1503に格納されているコンピュータプログラムやデータを用いて、コンピュータ全体の制御を行うと共に、画像処理装置が行うものとして説明した上述の各処理を実行する。
RAM1502は、コンピュータ読み取り可能な記憶媒体の一例である。RAM1502は、外部記憶装置1507や記憶媒体ドライブ1508からロードされたコンピュータプログラムやデータ、I/F(インターフェース)1509を介して外部装置から受信したデータなどを一時的に記憶するためのエリアを有する。更に、RAM1502は、CPU1501が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM1502は、各種のエリアを適宜提供することができる。ROM1503は、コンピュータ読み取り可能な記憶媒体の一例であり、コンピュータの設定データや、ブートプログラムなどが格納されている。
キーボード1504、マウス1505は、コンピュータの操作者が操作することで、各種の指示をCPU1501に対して入力することができる。表示装置1506は、CRTや液晶画面などにより構成されており、CPU1501による処理結果を画像や文字などでもって表示することができる。例えば、上記入力画像を表示や、多視点画像符号化装置で変換した結果の表示ができる。
外部記憶装置1507は、コンピュータ読み取り記憶媒体の一例であり、ハードディスクドライブ装置に代表される大容量情報記憶装置である。外部記憶装置1507には、OS(オペレーティングシステム)や、図22(a)に示した各部の機能をCPU1501に実現させるためのコンピュータプログラムやデータ、上記入力画像のデータ、既知の情報として説明した情報等が保存されている。外部記憶装置1507に保存されているコンピュータプログラムやデータは、CPU1501による制御に従って適宜RAM1502にロードされ、CPU1501による処理対象となる。
記憶媒体ドライブ1508は、CD−ROMやDVD−ROMなどの記憶媒体に記録されているコンピュータプログラムやデータを読み出し、読み出したコンピュータプログラムやデータを外部記憶装置1507やRAM1502に出力する。なお、外部記憶装置1507に保存されているものとして説明した情報の一部若しくは全部をこの記憶媒体に記録させておき、この記憶媒体ドライブ1508に読み取らせても良い。
I/F1509は、外部装置をコンピュータに接続する為のものである。例えば、図1で説明した、多眼方式による撮像装置など、上記入力画像を取得するための装置を、このI/F1509に接続し、この外部装置から入力画像をI/F1509を介してRAM1502や外部記憶装置1507に取得するようにしても良い。1510は、上述の各部を繋ぐバスである。
上述構成において、本コンピュータの電源がONになると、CPU1501はROM1503に格納されている上記ブートプログラムに従って、外部記憶装置1507からOSをRAM1502にロードする。この結果、キーボード1504、マウス1505を介した情報入力操作が可能となり、表示装置1506にGUIを表示することが可能となる。ユーザが、キーボード1504やマウス1505を操作し、外部記憶装置1507に格納された画像処理用アプリケーションプログラムの起動指示を入力すると、CPU1501はこのプログラムをRAM1502にロードし、実行する。これにより、本コンピュータが上記の画像処理装置として機能することになる。
CPU1501が実行する画像処理用のアプリケーションプログラムは、基本的に図22aに示す各構成要素に相当する関数を備えることになる。ここで、符号化対象の4視点画像は、I/F1509を介して外部の撮像装置から受信するものとするが、外部記憶装置1507に予め格納されていても構わない。また、符号化データファイルは、外部記憶装置1507に保存するものとして説明する。
以下、そのアプリケーションプログラムを実行した際のCPU1501の処理手順を図18のフローチャートに従って説明する。
ステップS1801では、4視点サブイメージそれぞれについて高コントラスト領域を抽出する。高コントラスト検出法は、既に説明したように画素ブロック内の平均値と平均値から差分の絶対値和を求め、その値が予め決めた閾値以上にブロックで良い。ステップ1802では、図6で示したような視差算出を行う。ステップ1803では、図6で示したようなROI領域を決定する。ステップ1804では、デプス推定を行う。デプス推定は画素毎の視差の逆数を求めるものとするが、それ以外でも構わない。ステップ1805では、背景領域のシフトゼロの合成画像を生成する。この場合、特にシフト0に限定することなく、平均化により代表画像としたい画像を1つ用意する。ステップ1806では、ROI領域の符号化を行う。符号化はそのままの状態で、JPEGなどの静止画符号化でもよいし、図17で示したような視差ベクトルやその視差ベクトルで予測した画像との差分を用いる方式でも構わない。ステップ1807では、背景領域をJPEGなどの静止画符号化で符号化する。ステップ1808では、デプスの符号化を行うが、これもJPEGを使う場合、そのほかデプス用符号化でも構わない。そして、ステップS1809にて、復号に必要な情報を含むヘッダを生成し、後続して、上記のようにして生成された各データを並べ、図16に示すような符号列のデータファイルを生成し、外部記憶装置1507に格納する。
次に、背景画像、各ROIの画像を利用した、復号装置側の合成処理を図18のフローチャートに従って説明する。
ステップ1901では合成しようとするROI領域の各画素のエッジ強度を算出する。算出方法は、ラプラシアンフィルタなど公知の方法でもよい。ステップ1902では透過率演算方法で、エッジ量が高い時ほど透明度が1に近い値になり、エッジ量が低いほど透明度が0になるような透明度αを設定する。
ステップ1903では、合成後の画素値Pixを、
Pix=(1−α)*Bg+α*Fg
の計算式で計算する。ここで、FgはROI合成画像、Bgは背景画像である。この場合の背景領域はシフト0合成画像を使用する。
Pix=(1−α)*Bg+α*Fg
の計算式で計算する。ここで、FgはROI合成画像、Bgは背景画像である。この場合の背景領域はシフト0合成画像を使用する。
図20は、デプスに依存した背景領域とROI領域合成処理のフローチャートである。 ステップ2001ではデプスを復号する。ステップ2002では各視点位置に対するローカルデプスを算出する。ステップ2003ではデプスの値に応じて透過率αを演算する。デプス値が大きい、すなわち、奥に位置するほどαを1に近づける。ステップ2004では画素値Pixを、
Pix=α*Bg+(1−α)*Fg
の計算式で計算する。この場合の背景領域は前景を抜いた背景画像を使用することが考えられる。
Pix=α*Bg+(1−α)*Fg
の計算式で計算する。この場合の背景領域は前景を抜いた背景画像を使用することが考えられる。
図21は、表示方法切り替えにより復号方法を自由焦点のみか、もしくは自由視点+自由焦点を切り替える処理のフローチャートである。ステップ2101では、符号データから背景領域の復号をする。ステップ2102では、オプションで入っているデプス情報を復号する。
ステップ2103では、4視点毎の注目領域(ROI)を復号する。ステップ2104では、リフォーカスをするのか、自由視点で復号するのか、図示しないユーザー入力手段からの信号で切り替える。リフォーカスの場合は、背景画像はそのまま使用する。ステップ2105では、合焦位置入力をする。ステップ2106では、ROI領域をシフトして合成画像を生成する。ステップ2107では、背景領域とROIリフォーカス画像を合成する。一方、ステップ2108では、表示したい視点位置と合焦位置を入力する。ステップ2109では、視点位置に応じた背景画像シフトを行う。ステップ2110では、ROI領域をシフトしてROIリフォーカス画像を合成する。ステップ2111では、背景領域とROIリフォーカス画像を合成する。
以上説明したように、コンピュータプログラムによっても、第1の実施形態と同様の作用効果を奏することが可能となる。
[第3の実施形態]
図14は、背景部をデプス情報で作った場合の例である。デプス情報は、視点の異なる2枚の画像のステレオマッチングから求めた視差をデプス変換するような公知技術で求めるたり、別のデプスカメラで撮影されたデプス画像を使ってもよい。
図14は、背景部をデプス情報で作った場合の例である。デプス情報は、視点の異なる2枚の画像のステレオマッチングから求めた視差をデプス変換するような公知技術で求めるたり、別のデプスカメラで撮影されたデプス画像を使ってもよい。
符号1401はシフト量0で合成しボケの方向性を抑制した画像である。また1402はデプス画像で距離が近い方が白、遠い方が黒でグレースケール表現されている。選択器1403では、距離情報に応じて切り替える。本方式では、距離が遠い画素は、背景画像1404の方を選択し、距離が近い固定画素値(白画素)を選択し出力する。
また1405〜1407は、各視点のROI領域の画像で、シフト量A1412を与えて、4視点合成画像1408〜1410を得る。これらと背景画像1404を合成器1411で画像合成する。
これにより、背景と前景の合成による不具合を減らすことができる。
[第4の実施形態]
図15は、視点に応じた、リフォーカス調整方式の例である。1500はシフト0合成画像で、共通の背景画像として使用する。1501〜1504は、各視点位置に応じて、画像1500をシフトして作った視点毎の背景画像である。
図15は、視点に応じた、リフォーカス調整方式の例である。1500はシフト0合成画像で、共通の背景画像として使用する。1501〜1504は、各視点位置に応じて、画像1500をシフトして作った視点毎の背景画像である。
これに、前述してきたROI部A、B、Cのリフォーカス画像1505を生成し、各位置を調整して背景画像と合成すると、視点、フォーカス位置を独立に調整できたリフォーカス画像1506乃至1508を生成することができる。
背景画像のシフト量は、まず視点毎のROI領域の視差量と、そこに対するデプス情報から、視点毎の撮影位置を求める。次に背景部のデプス情報から背景部の視差である背景シフト量を算出することができる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (8)
- 多視点画像データを符号化する画像処理装置であって、
前記多視点画像データを構成する各視点のサブイメージ内の同じ位置の画素の値の平均値を算出することで、算出した平均値を該当する位置の画素値とする平均画像を生成する生成手段と、
前記各サブイメージに共通な少なくとも1つのROI領域を検出する検出手段と、
前記生成手段で生成された前記平均画像、及び、前記検出手段で検出した各サブイメージ内の各ROI領域で示される部分画像を符号化し、前記検出手段が検出したROI領域の位置を示す情報と合わせて符号列を生成する符号列生成手段と、
を有することを特徴とする画像処理装置。 - 更に、前記各視点のサブイメージから、デプスの度合いを画素値とするデプスデータを生成するデプスデータ生成手段を有し、
前記符号列生成手段は、前記デプスデータ生成手段で生成したデプスデータを可逆符号化し、前記符号列に含めることを特徴とする請求項1に記載の画像処理装置。 - 前記符号列生成手段は、
前記平均画像を符号化する第1符号化手段、
前記デプスデータを符号化する第2符号化手段と、
前記ROI領域で示される各部分画像を符号化する第3符号化手段を有し、
前記第1、第3符号化手段は非可逆符号化を行い、前記第2符号化手段は可逆符号化を行うことを特徴とする請求項2に記載の画像処理装置。 - ユーザがいずれかのROI領域を指定したことに応じて、各サブイメージのROI領域の部分画像に基づき、指定したROI領域についてはフォーカスした部分画像を生成し、前記指定外のROI領域についてはぼかした部分画像を生成し、各部分画像を、前記生成手段が生成した平均画像を背景画像として合成することで、リフォーカス画像を生成する画像生成手段を有することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
- 前記画像生成手段は、
ROI領域の部分画像のエッジの度合いを示すαを算出し、
前記部分画像内の画素値をF、前記背景画像における画素値をBとしたとき、合成後の画素値Pを、FとBとをαの大きさに応じてブレンドして定めることを特徴とする請求項4に記載の画像処理装置。 - 多視点画像データを符号化する画像処理装置の制御方法であって、
生成手段が、前記多視点画像データを構成する各視点のサブイメージ内の同じ位置の画素の値の平均値を算出することで、算出した平均値を該当する位置の画素値とする平均画像を生成する生成工程と、
検出手段が、前記各サブイメージに共通な少なくとも1つのROI領域を検出する検出工程と、
符号列生成手段が、前記生成工程で生成された前記平均画像、及び、前記検出工程で検出した各サブイメージ内の各ROI領域で示される部分画像を符号化し、前記検出工程が検出したROI領域の位置を示す情報と合わせて符号列を生成する符号列生成工程と、
を有することを特徴とする画像処理装置の制御方法。 - コンピュータに読み込ませ実行させることで、前記コンピュータを、請求項1乃至5のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
- 請求項8に記載のプログラムを格納した、コンピュータが読み込み可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014046754A JP2015171097A (ja) | 2014-03-10 | 2014-03-10 | 画像処理装置及びその制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014046754A JP2015171097A (ja) | 2014-03-10 | 2014-03-10 | 画像処理装置及びその制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015171097A true JP2015171097A (ja) | 2015-09-28 |
Family
ID=54203436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014046754A Pending JP2015171097A (ja) | 2014-03-10 | 2014-03-10 | 画像処理装置及びその制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015171097A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106331674A (zh) * | 2016-08-23 | 2017-01-11 | 深圳市捷视飞通科技股份有限公司 | 基于图像稀疏特征的立体视频显示方法及装置 |
JP2019087859A (ja) * | 2017-11-06 | 2019-06-06 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
JP2019087860A (ja) * | 2017-11-06 | 2019-06-06 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
CN111131698A (zh) * | 2019-12-23 | 2020-05-08 | RealMe重庆移动通信有限公司 | 图像处理方法及装置、计算机可读介质、电子设备 |
US10791334B2 (en) | 2017-11-06 | 2020-09-29 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method |
-
2014
- 2014-03-10 JP JP2014046754A patent/JP2015171097A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106331674A (zh) * | 2016-08-23 | 2017-01-11 | 深圳市捷视飞通科技股份有限公司 | 基于图像稀疏特征的立体视频显示方法及装置 |
CN106331674B (zh) * | 2016-08-23 | 2018-05-15 | 深圳市捷视飞通科技股份有限公司 | 基于图像稀疏特征的立体视频显示方法及装置 |
JP2019087859A (ja) * | 2017-11-06 | 2019-06-06 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
JP2019087860A (ja) * | 2017-11-06 | 2019-06-06 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
US10750193B2 (en) | 2017-11-06 | 2020-08-18 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method |
US10791334B2 (en) | 2017-11-06 | 2020-09-29 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method |
US11019348B2 (en) | 2017-11-06 | 2021-05-25 | Canon Kabush1Ki Kaisha | Image processing apparatus and image processing method |
JP7041494B2 (ja) | 2017-11-06 | 2022-03-24 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
JP7079080B2 (ja) | 2017-11-06 | 2022-06-01 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
CN111131698A (zh) * | 2019-12-23 | 2020-05-08 | RealMe重庆移动通信有限公司 | 图像处理方法及装置、计算机可读介质、电子设备 |
CN111131698B (zh) * | 2019-12-23 | 2021-08-27 | RealMe重庆移动通信有限公司 | 图像处理方法及装置、计算机可读介质、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10134117B2 (en) | Method and apparatus for viewing images | |
JP6021541B2 (ja) | 画像処理装置及び方法 | |
US9986258B2 (en) | Efficient encoding of multiple views | |
JP5932666B2 (ja) | 画像符号化装置とその集積回路、および画像符号化方法 | |
JP4658223B2 (ja) | 画像生成方法、装置、およびそのプログラム並びにプログラムを記録した記録媒体 | |
JP2013065280A (ja) | 画像処理方法、画像処理装置およびプログラム | |
JP2013009274A (ja) | 画像処理装置および画像処理方法、プログラム | |
JP2015171097A (ja) | 画像処理装置及びその制御方法 | |
JP2012256177A (ja) | 画像処理方法、画像処理装置及びプログラム。 | |
JP5395911B2 (ja) | ステレオ画像符号化装置、方法 | |
JP6128748B2 (ja) | 画像処理装置及び方法 | |
US20130083169A1 (en) | Image capturing apparatus, image processing apparatus, image processing method and program | |
JP4944046B2 (ja) | 映像符号化方法,復号方法,符号化装置,復号装置,それらのプログラムおよびコンピュータ読み取り可能な記録媒体 | |
JP5869839B2 (ja) | 画像処理装置およびその制御方法 | |
JP2015103872A (ja) | 画像符号化装置及び画像復号装置及びそれらの制御方法 | |
JP6979290B2 (ja) | 画像符号化装置および画像復号化装置、並びに、画像符号化プログラムおよび画像復号化プログラム | |
JP2013150071A (ja) | 符号化装置、符号化方法、プログラム及び記憶媒体 | |
US20180070017A1 (en) | Image display apparatus, image capturing apparatus, image display method, and storage medium | |
JP4815004B2 (ja) | 多視点画像符号化装置 | |
US10911780B2 (en) | Multi-viewpoint image coding apparatus, multi-viewpoint image coding method, and storage medium | |
WO2024053522A1 (ja) | 画像処理装置および画像処理方法 | |
JP2014049895A (ja) | 画像処理方法 | |
JP7409604B2 (ja) | 画像処理装置、撮像装置、画像処理方法、プログラムおよび記録媒体 | |
JP5694060B2 (ja) | 画像処理装置、画像処理方法、プログラム、撮像装置及びテレビジョン受像機 | |
JP2019047145A (ja) | 画像処理装置、撮像装置、画像処理装置の制御方法およびプログラム |