JP2013223143A - 量子化装置及びその制御方法 - Google Patents

量子化装置及びその制御方法 Download PDF

Info

Publication number
JP2013223143A
JP2013223143A JP2012094182A JP2012094182A JP2013223143A JP 2013223143 A JP2013223143 A JP 2013223143A JP 2012094182 A JP2012094182 A JP 2012094182A JP 2012094182 A JP2012094182 A JP 2012094182A JP 2013223143 A JP2013223143 A JP 2013223143A
Authority
JP
Japan
Prior art keywords
scalar
quantization
value
input
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012094182A
Other languages
English (en)
Other versions
JP5959911B2 (ja
Inventor
Hideyuki Matsui
秀往 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012094182A priority Critical patent/JP5959911B2/ja
Publication of JP2013223143A publication Critical patent/JP2013223143A/ja
Application granted granted Critical
Publication of JP5959911B2 publication Critical patent/JP5959911B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

【課題】 量子化対象の各スカラー量に対して、割り当てられる代表値の許容範囲を計算し、その許容範囲を考慮して量子化のための複数の代表値を決定する。
【解決手段】 入力した着目スカラー量をS(n)(nは1、…、Nのいずれか)とし、この着目スカラー量S(n)に対する許容範囲をTmin(n)〜Tmax(n)と表わしたとき、着目スカラー量S(n)の入力に対して、Tmin(n)〜Tmax(n)で表わされる範囲の複数のスカラー量が入力されたものと見なし、各スカラー量の個数を累積カウントする。そして、量子化対象の全スカラー量を入力した場合のカウント値に従い、複数の代表値を決定する。
【選択図】 図1

Description

本発明は画像のける画素値等のスカラー量を量子化する技術に関するものである。
従来から、与えられたスカラー量を、任意に定めたいくつかの代表値のいずれかで近似することで、スカラー量の記録に必要なビット数を削減する量子化技術が知られている。当然ながら、代表値の数が増えるほど、量子化の際の近似誤差は小さくなるが、それに伴い1つのスカラー量を記録するのに必要なビット数は増加する。また、代表値の数が同じであっても、各代表値にどのような値を選択するかによって、量子化によって発生する誤差は変わる。従って、代表値としてどのような値を設定するかが、データを精度良く量子化する為にキーになる。量子化の際、低ビット表現の各値がどの代表値に対応するかの対応関係は表として記録されることが多く、その表を代表値テーブルと呼ぶ。
量子化を行う場合は、一般に、複数のスカラー量に対して、共通の代表値テーブルを用いる。例えば、グレー画像の場合は各画素の輝度値が1つのスカラー量であり、画像の全画素の輝度値に対して共通の代表値テーブルを用いて量子化することが一般的である。従って、代表値テーブルは、複数のスカラー量に対して、量子化による劣化が小さくなるように定めるのが一般的である。
代表値テーブルの定め方として良く知られた技術に、ロイド―マックス量子化がある(特許文献1)。ロイド―マックス量子化では、各スカラー量と、そのスカラー量を近似する代表値との二乗誤差の和E:
Figure 2013223143
を最小にすることを目的にして代表値を定める。ここでsi(i=1,…,K)は量子化対象のスカラー量で、si'は量子化の際に、siを近似するために割り当てられる代表値である。
特開2005−341555号公報
既に述べたように、量子化の際に割り当てられる代表値数が決まっている場合は、量子化による劣化は代表値テーブルによって決まる。劣化の基準はロイド―マックス法のように、量子化前のスカラー量と、そのスカラー量を近似する代表値との差を用いるのが一般的である。
しかし、一方で、劣化をその様な基準で評価するのが適切でない場合も存在する。例えば、画像の各画素の輝度値を量子化する場合には、その画像の中でも重要なオブジェクトを含む注目領域は許容される誤差が小さく、その他の領域は許容される誤差が大きくしたい。
本発明は上記従来例の課題を顧みてなされたものであり、量子化対象の各スカラー量に対して、割り当てられる代表値の許容範囲を計算し、その許容範囲を考慮して量子化のための複数の代表値を決定する技術を提供しようとするものである。
この課題を解決するため、例えば本発明の量子化装置は以下の構成を備える。すなわち、
各スカラー量の取り得る値がT1〜TIである、量子化対象のN個のスカラー量S(1)〜S(N)を入力し、各スカラー量を複数の代表値の中の1つで表わすことで、量子化する量子化装置であって、
各スカラー量S(n)(nは1、…、Nのいずれか)の、量子化した際の変化の許容範囲を特定する情報を取得する取得手段と、 量子化対象のスカラー量を入力する入力手段と、
該入力手段で入力した着目スカラー量S(n)について、前記取得手段で取得した情報が示す前記着目スカラー量S(n)に対する許容範囲をTmin(n)〜Tmax(n)と表わしたとき、前記着目スカラー量S(n)に対して、前記Tmin(n)〜Tmax(n)で表わされる範囲の複数のスカラー量が入力されたものと見なし、T1〜TIの各値が入力された個数を累積カウントするカウント手段と、

前記入力手段で前記N個のスカラー量を入力した場合の前記カウント手段で求めたT1〜TIのカウント値に従い、前記複数の代表値を決定する決定手段と、
該決定手段で得られた複数の代表値を用いて、前記N個のスカラー量を量子化する量子化手段とを有する。
本発明によれば、量子化対象の各スカラー量に対して、割り当てられる代表値の許容範囲を計算し、その許容範囲を考慮して量子化のための複数の代表値を決定する。この結果、各スカラー量に許容される誤差の特性を反映した量子化を行うことで、量子化に伴う劣化を軽減することが可能になる。
第1の実施形態の処理内容を示すフローチャート。 図1のS102の計算方法の詳細を示すフローチャート。 図1のS107の詳細を示すフローチャート。 量子化対象画像の例を示す図。 第1の実施形態で求める、許容範囲とカウント値の例を示す図。 第2の実施形態の自由視点画像を再生可能なシステムの構成例を示す図。 多視点画像を撮影するカメラと、被写体の位置関係を示す図。 多視点撮影されたカラー画像の例を示す図。 量子化対象となる視差画像を示す図。 視差の許容範囲とカラー画像との関係を説明する図。 第2の実施形態で求める、許容範囲の例を示す図。 第2の実施形態の変形例における、図1のS107の詳細を示すフローチャート。 第2の実施形態における図1のS102の詳細を示すフローチャート。 図13のS1302の詳細を示すフローチャート。 代表値数を自動判定する場合のフローチャート。 コンピュータのブロック構成図。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。なお、以下説明する各実施形態は、本発明を具体的に実施した場合の例を示すもので、特許請求の範囲に記載の構成の具体的な実施形態の1つである。
[第1の実施形態]
本第1の実施形態における量子化装置と機能する情報処理装置のブロック構成図を図16に示す。
CPU1601は、RAM1602やROM1603に格納されているコンピュータプログラムやデータを用いて、コンピュータ全体の制御を行うと共に、多視点画像符号化装置が行うものとして説明した上述の各処理を実行する。RAM1602は、コンピュータ読み取り可能な記憶媒体の一例である。RAM1602は、外部記憶装置1607や記憶媒体ドライブ1608、更にはネットワークインタフェース1610からロードされたコンピュータプログラムやデータを一時的に記憶するためのエリアを有する。更に、RAM1602は、CPU1601が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM1602は、各種のエリアを適宜提供することができる。ROM1603は、コンピュータ読み取り可能な記憶媒体の一例であり、コンピュータの設定データや、ブートプログラムなどが格納されている。キーボード1604、マウス1605は、コンピュータの操作者が操作することで、各種の指示をCPU1601に対して入力することができる。表示装置1606は、CRTや液晶画面などにより構成されており、CPU1601による処理結果を画像や文字などでもって表示することができる。例えば、上記量子化対象のグレー画像の表示や、量子化した結果の表示ができる。
外部記憶装置1607は、コンピュータ読み取り記憶媒体の一例であり、ハードディスクドライブ装置に代表される大容量情報記憶装置である。外部記憶装置1607には、OS(オペレーティングシステム)や、図1に示した各処理をCPU1601に実現させるためのコンピュータプログラムやデータ、上記の各種テーブル、データベース等が保存されている。外部記憶装置1607に保存されているコンピュータプログラムやデータは、CPU1601による制御に従って適宜RAM1602にロードされ、CPU1601による処理対象となる。
記憶媒体ドライブ1608は、CD−ROMやDVD−ROMなどの記憶媒体に記録されているコンピュータプログラムやデータを読み出し、読み出したコンピュータプログラムやデータを外部記憶装置1607やRAM1602に出力する。なお、外部記憶装置1607に保存されているものとして説明した情報の一部若しくは全部をこの記憶媒体に記録させておき、この記憶媒体ドライブ1608に読み取らせても良い。
I/F1609は、外部から量子化対象のグレー画像を入力するための、インタフェースであり、一例として示すのであればUSB(Universal Serial Bus)である。1610は、上述の各部を繋ぐバスである。
上述構成において、本コンピュータの電源がONになると、CPU1601はROM1603に格納されているブートプログラムに従って、外部記憶装置1607からOSをRAM1602にロードする。この結果、キーボード1604、マウス1605を介した情報入力操作が可能となり、表示装置1606にGUIを表示することが可能となる。ユーザが、キーボード1604やマウス1605を操作し、外部記憶装置1607に格納されたグレー画像量子化用のアプリケーションプログラムの起動指示を入力すると、CPU1601はこのプログラムをRAM1602にロードし、実行する。これにより、本コンピュータが画像を量子化する画像処理装置として機能することになる。
以下では、量子化対象の画像データは外部記憶装置1607に既に格納されており、量子化後のデータも外部記憶装置1607にファイルとして格納する例を説明する。だたし、量子化対象の画像データはネットワークからダウンロードしても構わないし、イメージスキャナ等で読み取るものでも構わない。また、量子化後のデータをファイルとして記憶装置に格納するのではなく、ネットワーク上に送信するものとしても構わない。すなわち、量子化対象の画像データの入力源、量子化後の画像データの出力先の種類が本願発明を限定するものではない。
図1は、所定形式の画像データの量子化を行う画像処理装置として機能する場合のCPU1601が実行する手順を示すフローチャートである。以下図1に従って本第1の実施形態による量子化処理を説明する。
図4(a)に示すグレー画像の、各画素の輝度値を量子化する場合を例に、注目領域(関心領域)に生じる誤差を抑えることができる量子化方法を示す。代表値の個数は量子化を行う上で、重要なパラメータであるが、本実施形態では簡単のために、3つ代表値の中から選ぶこととする。なお図4(a)のグレー画像の各画素は8ビットで表わされ、その輝度値は0〜255の256階調で表現される。図4(a)の網点領域401は、2つの色が混ざった領域であり、輝度値「249」と輝度値「245」の画素が入り混じっている。同図の横線領域402は、単色の領域であり、全ての画素が輝度値「9」である。同様に斜線領域403は、全ての画素が輝度値「5」の単色領域である。
まず、図1のS101では、CPU1601は、量子化対象となるスカラー量を設定する。このステップでは複数のスカラー量を選び、選ばれたスカラー量はこの後の処理により共通の代表値テーブルを用いて量子化される。例えば1枚のグレー画像を共通の代表値テーブルで量子化する場合には、グレー画像の全画素の輝度値が、量子化対象となるスカラー量である。本実施形態では、説明を簡単にするために、図4(a)に示す画像全体ではなく、図4(b)に番号1〜15で示した、1ラインの画素の輝度値を量子化対象とする。
S102では、与えられた量子化対象スカラー量に対して割り当てられる代表値の許容範囲を計算する。ここで本実施形態での許容範囲の定義を説明する。許容範囲とは、量子化に伴う各スカラー量の変化として許容できる範囲であり、許容範囲内の値で近似することができれば劣化が十分に小さいと見なせる範囲のことである。
本実施形態ではS102において、各画素の輝度値の量子化を行う際に、ユーザが指定する注目領域内の画素であるかどうかに応じて、許容範囲を定める。別の実施形態では、量子化対象のスカラー量と共に装置外部から直接許容範囲が与えられるようにしても構わない。本実施形態におけるS102の詳細を図2に示す。
図2のS201では注目領域の指定を行う。注目領域は画像の中で特に重要であり、量子化による画質劣化を抑えたい領域である。本実施形態では注目領域の指定はユーザからの入力によって成されることを想定する。例えば、量子化対象の画像をディスプレイ等に表示し、タッチパネルやマウス等で画像の一部を囲み込むことにより指定される。以下では図4(a)の領域402、403を含む矩形領域が注目領域として指定されたものとする。S202では量子化対象画像の画素を1つ選択する。S203ではS202で選択した画素がS201で指定された注目領域内にあるかどうかを判定する。S203の判定の結果、注目領域内(関心領域内)の画素であれば、S204において、その画素の輝度値の許容範囲を、輝度値±Dinと設定する。逆に、注目領域外(関心領域外)の画素であれば、S205において、その画素の輝度値の許容範囲を、輝度値±Doutと設定する。当然のことながら、Dout>Din≧0であることが望ましい。本実施形態ではDoutを2、Dinを1に設定したものとする。次にS206では全画素に対して許容範囲を設定したかを判定する。許容範囲を設定していない画素があれば、S202においてその画素を選択して許容範囲を設定する処理を繰り返すことで、全ての画素に対して許容範囲を設定する。
図1のフローチャートの説明に戻る。S103では、S102で求めた許容範囲を利用して、各輝度値のカウント値を求める。以下でカウント値の求め方を詳しく説明する。
まず、S102で求めた各画素の許容範囲から、図5(a)に示すグラフを求める。図5(a)の水平軸はスカラー量(本実施形態の場合は輝度値)、垂直軸は量子化対象のスカラー量に割り振られる番号(本実施形態の場合は画素番号)である。以下、画素番号をiとしたとき、その画素値を画素P(i)と表現する。
図5(a)の斜線501は画素P(10)の輝度値が「9」であることを示している。斜線501の左右にある、白い帯は、画素P(10)の許容範囲を示している。画素P(10)は図2のS201において注目領域内に選ばれた画素であり、S204において許容範囲が9±1つまり8〜10に設定されており、白い帯はその範囲にまたがっている。また、斜線502は画素P(4)の輝度値を表しており、その周囲の白い帯が画素P(4)の許容範囲を示している。画素P(4)は注目領域に選ばれなかった画素であるため、許容範囲は249±2つまり247〜251の範囲にまたがっている。図5(a)では他の画素についても同様に、画素の輝度値を斜線で示し、画素の許容範囲を、斜線を内包する白い帯で示した。
カウント値は、各輝度値を許容範囲に含む画素数を表すもので、図5(a)のグラフで垂直方向に和を取ることで得られる。図5(b)に、図5(a)から導かれる、輝度値毎のカウント値を示す。例えば図5(a)において、輝度値5を許容範囲内に含む画素は、画素P(7)、P(8)、P(9)であるため、図5(b)において、輝度値5のカウント値は「3」になっている。
なお、S103でカウント値を求める際の別の実施形態として、図5(a)のグラフで垂直方向に和を取る際に、重み付けを行っても良い。例えば、図5(a)中の斜線領域は「2」、白い帯の領域は「1」を加算して輝度毎のカウント値を求めても良い。この場合、図5(b)の、輝度毎のカウント値を示すヒストグラムの形状が変わるが、それ以外は、本実施形態と同様の処理を行えばよい。
次のS104では代表値を1つ決定する。代表値はカウント値が最も高い輝度値を選ぶ。本実施形態では、図5(b)から明らかなように、「247」を1つ目の代表値に選ぶ。
次のS105ではカウント対象の削減を行う。これは、次の代表値を決める場合に、許容範囲内に代表値がある画素はS103でカウント値を再計算する際に考慮しない為である。本実施形態の場合は、「247」が代表値に既に選ばれている為、「247」を許容範囲に含む画素P(1)〜P(5)、P(11)〜P(15)をカウント対象から削減する。
次のS106では、代表値が目標数に達した、或いは、カウント対象の画素が無くなった、いずれかを満たすかを判定する。本実施形態では先に述べた通り、代表値を3つ選ぶ必要があり、まだ1つしか選んでいず、且つ、カウント対象の画素も未だ残っているので、この条件を満たさず、S106の判定は偽(False)となり、再びS103に戻る。
2つ目以降の代表値を選ぶ処理は、基本的にはS103〜S105の処理を1つ目の代表値を決めた際と同様に行えば良い。2週目以降の違いは、既に述べた通り、S103でカウント値の計算を行う際に、S105でカウント対象から削減した画素を無視する点である。例えば本実施形態で、2つ目の代表値を求める際に、S103で求めるカウント値は図5(c)になる。図5(c)は、図5(a)において、1つ目の代表値247によって許容範囲内の誤差で近似できなかった画素P(6)〜P(10)のみを対象に、カウント値を求めたものである。このカウント値が最大になる輝度値を、S104で代表値に決定すれば良い。なお、図5(c)ではカウント値が最大になる輝度値が4、5、6の3つ存在する。このように、カウント値が最大となる輝度値、つまり、代表値の候補が複数存在する場合の処理を補足する。例えば、代表値の候補それぞれに対して、代表値の候補と、その代表値の候補を許容範囲内に含む画素の、量子化前の輝度値、との差分の二乗和を計算し、その結果が最も小さいものを代表値として選ぶ方法が考えられる。本実施形態の場合は、代表値の候補である輝度値4、5、6は全て、画素7、8、9の許容範囲に含まれており、画素7、8、9の量子前の輝度値5との差分の二乗和が最小になる輝度値5が、2つ目の代表値に選ばれる。
以上の処理を繰り返すと、「247」、「5」、「9」の順に代表値が選ばれる。そしてS106の判定が真(true)と判定される。この場合、次にS107に進み、各画素の輝度値を代表値に置き換えることで、量子化する。本実施形態でのS107の詳細を図3に示す。
S301では、各画素に対して、許容範囲内に代表値があるかを判定する。許容範囲は当然、S102で求めたものを用いる。許容範囲内に代表値がある場合はS302に、無い場合はS303に進む。
S302では、許容範囲内にある代表値を割り当てる。この際、許容範囲内に複数の代表値がある場合は、量子化前の輝度値に最も近い代表値を割り当てる。S303では、許容範囲に代表値が存在しないため、許容範囲外にある代表値のうち、量子化前の輝度値に最も近い代表値を割り当てる。
なお、図3の量子化処理であるが、量子化結果の画像データのデータ量を削減する場合には、代表値「5」、「9」、「247」を2ビットで00、01、10と表現し、量子化対象の画素値(8ビット)を、最も近い代表値を表わす2ビットのデータで置換したファイルを生成する。この場合、ファイルヘッダには、00、01、10に対して、画素値5、9、247を割り当てることを示す情報を格納すれば良い。
以上、図1のフローチャートに基づいて、本発明における量子化の方法を説明した。上記実施形態では、量子化対象のスカラー量が図4(b)に示すように15個の画素値であり、許容範囲も±1、±2の例であったが、これはあくまで一例であることに留意願いたい。
なお、図1のフローチャートの説明で述べたように、S103、S105では、2つ目以降の代表値を求める際に、S105でカウント対象を削減し、S103でカウント値を再計算することでカウント値を再計算した。しかし、このカウント値の再計算までを量子化装置に含めることが、必ずしも必要とは限らない。例えば、S104で1つ目の代表値を決めた際に、その周囲±1画素の範囲のカウント値を0で上書きし、そのカウント値によって2つ目の代表値を定めることもできる。ここで、周囲±1画素のカウント値を0にしたのは、本実施例で最も高精度に量子化したい着目領域の許容範囲が±1だったことに由来する。このように、2つ目以降の代表値を定める際のカウント値の再計算方法を変えたとしても、本発明の特徴であるカウント値を利用した代表値の決定方法を利用することは可能である。
従って本実施形態における技術思想を一般化した場合の量子化装置は、以下の構成を有することになる。すなわち、
各スカラー量の取り得る値がT1〜TIである、量子化対象のN個のスカラー量S(1)〜S(N)を入力し、各スカラー量を複数の代表値の中の1つで表わすことで、量子化する量子化装置であって、
各スカラー量S(n)(nは1、…、Nのいずれか)の、量子化した際の変化の許容範囲を特定する情報を取得する取得手段と、
量子化対象のスカラー量を入力する入力手段と、
該入力手段で入力した着目スカラー量S(n)について、前記取得手段で取得した情報が示す前記着目スカラー量S(n)に対する許容範囲をTmin(n)〜Tmax(n)と表わしたとき、前記着目スカラー量S(n)に対して、前記Tmin(n)〜Tmax(n)で表わされる範囲の複数のスカラー量が入力されたものと見なし、T1〜TIの各値が入力された個数を累積カウントするカウント手段と、
前記入力手段で前記N個のスカラー量を入力した場合の前記カウント手段で求めたT1〜TIのカウント値に従い、前記複数の代表値を決定する決定手段と、
該決定手段で得られた複数の代表値を用いて、前記N個のスカラー量を量子化する量子化手段とを有する構成とすれば良い。
[第2の実施形態]
本第2の実施形態では、自由視点画像合成に用いる、距離画像の量子化を行う例を示す。
まず自由視点画像合成と距離画像について概要を説明する。自由視点画像合成とは、カメラ等の撮影装置を用いて、或る視点から画像を撮影し、その視点の画像を利用して、実際には撮影を行っていない別の視点から見える画像を合成する技術である。自由視点画像合成の手法の1つに、距離画像を利用する方法が知られている。距離画像とは撮影した視点の各画素の距離情報が格納された画像である。距離画像があれば、撮影した被写体の3次元空間上の座標が特定できるため、別の視点から見た際に、被写体が画像上のどこの位置に写るかを推測することができる。
距離画像の取得には大きく分けてアクティブ方式とパッシブ方式がある。アクティブ方式は被写体にレーザーなどを照射することで距離を取得する方式で、代表的なものとしてレーザーが往復してくるまでの時間から距離を推測するタイムオブフライト方式がある。パッシブ方式は撮影した画像を用いて距離を取得する方式で、代表的なものとして、異なる2視点の撮影画像を用いるステレオマッチング法がある。
アクティブ取得した距離画像を用いて自由視点画像合成を行う場合は、撮影した多視点画像に加えて、アクティブ取得した距離画像の符号化を行う必要がある。距離画像をパッシブ取得する場合は、多視点画像から距離画像を取得することができるため距離画像の符号化は不要である。しかし、再生時の処理負荷低減などを目的に、撮影時に距離画像のパッシブ取得を行って符号化し、再生時には距離画像の再取得を行わない場合は、やはり距離画像の符号化が必要となる。
自由視点画像合成に用いられる距離画像は、視差画像の形で符号化されることが多い。視差とは、異なる2つの視点で同一の被写体(点)を撮影した際に、一方の視点に映った点が、もう一方の視点での撮影画像のどこに写っているかを示す量である。一般には異なる画像間で、同一の被写体が写っている点(以下、対応点)同士が何画素ずれているかで表現される。より具体的には、光軸が平行で、水平軸に沿った左右にb(mm)の間隔で並べた2つのカメラで、撮影面(光軸に垂直かつ、2つのカメラを通る平面)からz(mm)離れた点を撮影した場合、2つの撮影画像内の対応点の視差d(pix)は、
d=bfW/(zC) …(式1)
である。ここで,fはカメラの焦点距離(mm)、Wは撮影画像の幅(pix)、Cは撮影素子の幅(mm)である。なお、カメラが左右に正確に配置されている場合は、対応点の垂直方向の視差は0であることが保証できる(エピポーラ拘束)。従ってここで説明した視差は、対応点同士の水平方向のずれを示していることになる。
以上で、自由視点画像合成と、距離画像の概要についての説明を終える。以下では自由視点画像合成に用いる距離画像を、視差画像として符号化することを前提に、視差画像の量子化方法を説明する。
ここで視差画像の性質について補足をする。視差を近似する際には、特に、その視差画像と同一の視点から撮影されたカラー画像の、エッジ付近の精度が重要である。既に述べたように、視差画像とは、異なる画像間の対応画素がどれだけずれているかを示す情報である。視差を用いて自由視点画像合成を行う際には、画像を合成したい視点の位置と、視差の大きさに応じて、撮影した視点の画像の画素をずらす(ワープさせる)ことで行う。従って視差が変わるということは、自由視点画像合成においては、ある画素を、本来のワープ先とは別の位置にワープさせることを意味する。色の変化が僅かな領域では、本来の位置とずれた位置にワープさせても、見た目上の劣化は小さい。一方で、カラー画像のエッジ付近でワープ先を間違えると、自由視点画像上のある画素の色が、本来あるべき色と大きく異なる色になるため、劣化が目立つ。従って、視差画像を符号化する際には、カラー画像のエッジ付近程高い精度が必要となる。
本第2の実施形態で想定するシステムを図6に示す。図6は撮影装置による画像の撮影から、撮影画像を用いて、自由視点画像合成結果を表示するまでの各部の構成と、データの流れを示したものである。
まず撮影部601、602、603においてカラー画像を撮影する。撮影は光軸が平行で、左、中央、右に並べた3つのデジタルカメラで行う。左視点の画像をI1、中央視点の画像をI2、右視点の画像をI3として示している。
次に視差画像生成部604では画像I2の視差画像S2を生成する。視差画像はI1、I2、I3を用いて、ステレオマッチング法により求める。ここで、3枚の画像を使ったステレオマッチング法について補足する。既に述べたように、ステレオマッチング法は基本的には2つの画像を用いて視差を求める手法である。しかし、I2とI1、I2とI3の組み合わせでそれぞれステレオマッチングを行い、最後に2つの結果を統合することにより、より正確にI2の視差を求める手法が知られており、ここでもその様な手法を用いることを想定する。もちろん、アクティブ方式によって、被写体までの距離を計測し、(式1)に従って視差を求めても良い。
次に視差画像量子化部605では視差画像の量子化を行う。本実施形態における特徴は視差画像量子化部605での量子化処理であり、後で詳しく説明する。量子化の結果、S2が低ビット表現に量子化された視差画像S2’と、代表値テーブルT2を得る。
次に、符号化部C1、C2、C3ではそれぞれI2、S2’、T2を符号化する。符号化には例えばZIP等の可逆圧縮を用いれば良い。これら符号化データを送信部606から送信する。自由視点画像を生成する装置では、その受信部607で上記の符号化データを受信し、復号部D1、D2、D3にてそれぞれI2、S2’、T2を復号する。次に逆量子化部608においてS2’を逆量子化した視差画像S2''を得る。
最後に、自由視点画像合成部609においてカラー画像I2と視差画像S2''を用いて自由視点画像合成を行い、自由視点画像I4を再生する。本第2の実施形態では自由視点画像I4は、右視点を撮影したカメラと左視点を撮影したカメラを結んだ直線上の、いずれかに配置された視点の画像であることを想定する。従って、視差画像量子化部605でも、その範囲内にある視点から見た画像を合成する際に、視差画像の量子化による画質劣化の影響が少なくなるように量子化を行う。
以下では本第2の実施形態の特徴である、視差画像量子化部605の詳細を説明する。
まず、図6に示した、視差画像量子化部605への入力である、カラー画像I1、I2、I3と、視差画像S2について説明する。本実施形態ではカラー画像I1、I2、I3はデジタルカメラによる撮影画像とする。本実施形態で入力するカラー画像の、被写体とカメラの位置関係を図7に示す。カメラ701〜703が、図6における撮影部601、602、603に対応するものであって、それぞれがカラー画像I1、I2、I3を生成するものである。カメラ701〜703は撮影面708上に並んでおり、カメラの光軸は全て撮影面708に垂直であるものとする。これら3台のカメラで平面704〜707を撮影する。これら4つの平面は全て撮影面708と平行であり、撮影面708からの距離は(式1)に従って視差に換算すると、平面704が視差6、平面705、706が視差4、平面707が視差1である。平面704〜707はそれぞれ単色の平面であり、平面704〜706が黒色、平面707が白色であるとする。以上、図7を用いて述べた条件の下で撮影されたカラー画像I1、I2、I3をそれぞれ図8(a)、(b)、(c)に示す。図8(a)、(b)、(c)には当然、平面704、705、706、707が写っており、それらが画像のどの部分に対応するかは図8内に示した。図8中の黒い領域は平面704、705、706からなっており、全て黒色で同一の色であるため、図8内では白色の点線で区切ることで平面間の区切れを示したが、実際のカラー画像には白色の点線は存在しない。また図8の白色の領域は全て平面707である。図8(b)の視差画像S2を図9に示す。当然ながら、斜線領域901、横線領域902、横線領域903、白色領域904がそれぞれ平面704、705、706、707に対応しており、それぞれの視差は6、4、4、1である。既に述べたように、視差画像S2はI2上の各画素の対応点が、I1もしくはI3のどの点であるかを、I2上の画素の位置から左右に何画素ずれているかで表現したものである。なお、I1上にある対応点は必ずI2上の対応点の右側にあり、I3上にある対応点は必ずI2上の対応点の左側にあることは、カメラ配置から必然的に定まる。
次に、視差画像量子化部605の処理の詳細を説明する。基本的な処理の流れは実施形態1で示した図1と同様である。第1の実施形態との主な違いはS102の許容範囲の計算方法である。以下では図1に沿って、S102を中心に、第1の実施形態と違う部分に絞って説明する。
まず、S101では量子化対象スカラー量として、視差画像S2を設定する。本実施形態では、説明の簡単のために、図9に示す如く、d1〜d22の1ラインの視差値を量子化対象のスカラー量とする。
次にS102では許容範囲の計算を行う。本実施形態の特徴は視差画像S2の許容範囲の計算に、カラー画像I1、I2、I3を用いる。S102の許容範囲の計算の詳細を図13に示す。図13のS1301では視差画像S2の中で、量子化対象となっている視差d1〜d22から1つ選ぶ。ここではdi(i=1,・・・,22)を選んだとする。S1302では、I1とI2を用いて視差diの許容範囲を計算する。この処理の詳細は後に図14を用いて説明する。同様にS1303ではI3とI2を用いて許容範囲を計算する。次にS1304では、S1302とS1303で算出された許容範囲を統合する。統合の際に、両方の許容範囲に含まれている範囲のみを、diの許容範囲とする。次にS1305において、d1〜d22の全ての許容範囲を計算したかを判定する。許容範囲を計算していない画素があればS1301に戻り、全ての画素の許容範囲を求めるまでくり返し、終了する。
ここでS1302におけるI1とI2を用いた許容範囲の算出方法について図14を用いて説明する。上で述べたようにS1302の目的は視差diの許容範囲を求めることである。そこで、S1302ではdiの許容範囲の最大値をdmax、最小値をdminとし、dmaxとdminを求める。以下ではdiの許容範囲を求める処理を説明する。なお、以下で、ciはカラー画像I2上の画素であり、視差diと同じ位置にある画素とする。
まず、図14のS1401ではdmaxとdminをdiで初期化する。S1402では、ciのI1上の対応点をcrefとする。当然ながらcrefはI1上で、画素ciの位置から、視差diだけ右にずらした点である。次にS1403ではcrefを右に1ずらす。次にS1404では画素ciと画素crefの色の差が閾値以下かを判定する。例えば本実施形態では、RGB各色を256階調で表し、各色の差分の絶対値の和が20以下であるかどうかを判定する。S1404で色の差が閾値以下の場合は、S1405でdmaxをcrefとciの視差に更新し、S1403〜S1404を繰り返す。S1402からS1406を終えると、I1上のciの対応点の右側で、ciと近い色を持った画素がある範囲が求まり、その範囲内で一番左の画素とciとの視差がdmaxとして求まる。同様にS1406〜S1408を繰り返すことで、I1上のciの対応点の左側で、ciと近い色を持った画素がある範囲が求まり、その範囲内で一番左の画素と、ciとの視差がdminとして求まる。最後S1410ではdmaxとdminを、図13のS1302における、I1とI2を用いた許容範囲として出力する。具体例として、図10に、I1とI2を用いて算出した、d7の視差の許容範囲を示す。図10の左側がカラー画像I1、右側がカラー画像I2である。I1の対応点1001が、I2の画素c7の、視差d7によって定まる対応点である。対応点1001から右側に伸びた白色矢印の先にある画素と、c7との視差がdmaxである。また、対応点1001から左側に伸びた白色矢印の先にある画素と、c7との視差がdminである。
S1303では、S1302と同様に、I3とI2を用いた許容範囲の算出を行う。S1303は基本的には図14を用いて説明した手順と同様の事を行う。ただし、S1403でcrefを右にずらす処理を、左にずらす処理に入れ替え、S1408でcrefを左にずらす処理を、右にずらす処理に入れ替える必要がある。
以上で本第2の実施形態におけるS102の許容範囲の算出の説明を終える。S102を終えると、d1〜d22の許容範囲が図11に示す如く求まる。ここで、本第2の実施形態で得られた許容範囲の役割について、図11を用いて補足する。図11のd6やd17は許容範囲が狭い。これは図8(b)で示したカラー画像I2上で、d6、d17に対応する画素c6、c17が、カラー画像のエッジ付近にあることを反映している。逆に、d11やd12のように、対応するカラー画像上の画素の周りには似た色が多い場合は、許容範囲が広くなる。この様に、本第2の実施形態で得られた許容範囲は、カラー画像のエッジ付近程高い精度が必要である、という視差画像の特性を反映していることが分かる。
以下、S103〜S107は第1の実施形態と同様の手順で行えば良い。本第2の実施形態の処理を全て終えると、図9の視差d1〜d22の代表値として、「1」、「4」が選ばれる。
[第2の実施形態の変形例]
第2の実施形態の変形例として、図1のS107の代表値に基づいた量子化において、視差画像の量子化を行う場合に適した方法を説明する。本変形例における処理は、図1のS107以外は全て第2の実施形態と同様である。
本変形例におけるS107の詳細を、図12を用いて説明する。S107では量子化対象の全ての視差di(i=1,・・・,22)に対して図12で示した処理を行う。
まず、S1201ではdiの許容範囲内に代表値があるかを判定し、ある場合はS1202に、無い場合はS1203へ進む。
S1202では、許容範囲内ある全ての代表値をdiに割り当てる代表値の候補として選ぶ。S1203では許容範囲内に代表値が無いため、diより大きい代表値の中からdiに最も近い代表値を1つ、diより小さい代表値の中からdiも最も近い代表値を1つの計2つを代表値の候補として選ぶ。
S1204ではS1202もしくはS1203で選んだ代表値の候補から1つを選ぶ。この際、代表値の選び方は、
Er=diff(ci,cr1)+diff(ci,cr3)
を最小にするという優先順位に従って選ぶ。ここで、ciはI2上の画素で、視差diと同一の座標にある点であるとする。また、cr1、cr3はそれぞれI1、I3上の画素であり、diの代わりに代表値rを視差とみなした場合の、ciの対応画素である。diffは2つの画素間の色差を表しており、例えばRGB各成分の差分の絶対値の和を用いる。
上記実施形態2の変形例で説明した代表値の選び方は、視差の量子化の際には、視差自体の値の変化よりも、視差によって対応づけられる画素間の色差が重要であるという、視差の特性を反映した方法となっている。
[第3の実施形態]
第2の実施形態において、図1のS106で、代表値を選ぶ処理を打ち切る基準を変えた例を述べる。S106においては、代表値が事前に定めた目標数に達した、或いは、カウント対象のスカラー量が無くなったかによって判定をしていた。この判定を行うためには、事前に代表値の目標数を定める必要がある。しかし、本第3の実施形態では、代表値の目標数を定めることなく、画像の内容に応じて切り替える例を示す。
本実施形態のフローチャートを図15に示す。本実施形態の特徴はS1501、S1502であり、他の部分は第2の実施形態で図1を用いて説明した処理と同様である。従ってS1501とS1502のみ説明する。
S1501ではS104で決定した代表値のカウント値が、全画素数のX%以下かどうかを判定する。ここで、カウント値はS103において求めたものを用いる。また、Xは任意に定める割合を示す閾値であり、例えばX=1等と設定すれば良い。ここでカウント値が全画素数のX%以下の場合は、S1502に進み、最後に選んだ代表値のみ、代表値から外す。
本第3の実施形態で述べた方法を用いて代表値数を決めると、画像の内容に応じて代表値数を割り当てることができるようになる。つまり、量子化後に、各画素の視差を表現するために必要なビット数を画像の内容に応じて自動で切り替えることが出来る。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (11)

  1. 各スカラー量の取り得る値がT1〜TIである、量子化対象のN個のスカラー量S(1)〜S(N)を入力し、各スカラー量を複数の代表値の中の1つで表わすことで、量子化する量子化装置であって、
    各スカラー量S(n)(nは1、…、Nのいずれか)の、量子化した際の変化の許容範囲を特定する情報を取得する取得手段と、
    量子化対象のスカラー量を入力する入力手段と、
    該入力手段で入力した着目スカラー量S(n)について、前記取得手段で取得した情報が示す前記着目スカラー量S(n)に対する許容範囲をTmin(n)〜Tmax(n)と表わしたとき、前記着目スカラー量S(n)に対して、前記Tmin(n)〜Tmax(n)で表わされる範囲の複数のスカラー量が入力されたものと見なし、T1〜TIの各値が入力された個数を累積カウントするカウント手段と、
    前記入力手段で前記N個のスカラー量を入力した場合の前記カウント手段で求めたT1〜TIのカウント値に従い、前記複数の代表値を決定する決定手段と、
    該決定手段で得られた複数の代表値を用いて、前記N個のスカラー量を量子化する量子化手段と
    を有することを特徴とする量子化装置。
  2. 更に、スカラー量S(1)〜S(N)のうち、それまでに選択した代表値のいずれかを許容範囲に含むスカラー量S(n)以外をカウント対象として設定するカウント対象設定手段を持ち、
    前記カウント手段は、前記カウント対象設定手段で設定されたカウント対象のスカラー量のみを考慮してカウント値を求め、
    前記決定手段は、カウント値が最大となる値Ti(iは1、・・・、Iのいずれか)を代表値の1つとして選択し、
    予め目標とする代表値の個数の選択が行われる、又は、前記代表値の候補がなくなるまで、前記カウント対象設定手段によるカウント対象のスカラー値の設定、前記カウント手段による累積値のカウント、前記決定手段による代表値の選択を繰り返し実行する
    ことを特徴とする請求項1に記載の量子化装置。
  3. 前記決定手段は、更に、選択した代表値のカウント値が、前記Nに対して閾値以下の割合であった場合に、代表値の選択を打ち切ることを特徴とする請求項2に記載の量子化装置。
  4. 前記カウント手段は、
    当該着目スカラー量S(n)に対し、許容範囲Tmin(n)〜Tmax(n)における前記着目スカラー量S(n)を、それ以外のスカラー量よりも大きい重みを持つものとしてカウントすることを特徴とする請求項1乃至3のいずれか1項に記載の量子化装置。
  5. 更に、前記N個のスカラー量のうち、量子化の許容範囲を設定する設定手段を備え、
    前記取得手段は、前記設定手段で設定した情報を取得することを特徴とする請求項1乃至4のいずれか1項に記載の量子化装置。
  6. 前記量子化対象のスカラー量は画像を構成する画素値であって、
    前記設定手段は、前記画像における関心領域を設定する手段であって、前記関心領域内の画素の量子化の許容範囲を、前記関心領域外の画素の量子化の許容範囲よりも小さくすることを特徴とする請求項5に記載の量子化装置。
  7. 前記量子化対象のスカラー量は、所定の視点で撮影したカラー画像の距離画像であり、
    前記取得手段は、異なる視点で撮影した複数のカラー画像を用いて、各距離の許容範囲を算出することを特徴とする請求項1に記載の量子化装置。
  8. 前記量子化手段は、画素の距離を近似する代表値の候補が複数ある場合に、距離によって対応つけられる画素間の色差が、小さくなる候補を優先して選択して量子化することを特徴とする請求項7に記載の量子化装置。
  9. 各スカラー量の取り得る値がT1〜TIである、量子化対象のN個のスカラー量S(1)〜S(N)を入力し、各スカラー量を複数の代表値の中の1つで表わすことで、量子化する量子化装置の制御方法であって、
    取得手段が、各スカラー量S(n)(nは1、…、Nのいずれか)の、量子化した際の変化の許容範囲を特定する情報を取得する取得工程と、
    入力手段が、量子化対象のスカラー量を入力する入力工程と、
    カウント手段が、前記入力工程で入力した着目スカラー量S(n)について、前記取得工程で取得した情報が示す前記着目スカラー量S(n)に対する許容範囲をTmin(n)〜Tmax(n)と表わしたとき、前記着目スカラー量S(n)に対して、前記Tmin(n)〜Tmax(n)で表わされる範囲の複数のスカラー量が入力されたものと見なし、T1〜TIの各値が入力された個数を累積カウントするカウント工程と、
    決定手段が、前記入力工程で前記N個のスカラー量を入力した場合の前記カウント工程で求めたT1〜TIのカウント値に従い、前記複数の代表値を決定する決定工程と、
    量子化手段が、前記決定工程で得られた複数の代表値を用いて、前記N個のスカラー量を量子化する量子化工程と
    を有することを特徴とする量子化装置の制御方法。
  10. コンピュータに読み込ませ実行させることで、前記コンピュータを、請求項1乃至8のいずれか1項に記載の量子化装置が有する各手段として機能させるためのプログラム。
  11. 請求項10に記載のプログラムを格納したことを特徴とするコンピュータが読み取り可能な記憶媒体。
JP2012094182A 2012-04-17 2012-04-17 量子化装置及びその制御方法 Expired - Fee Related JP5959911B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012094182A JP5959911B2 (ja) 2012-04-17 2012-04-17 量子化装置及びその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012094182A JP5959911B2 (ja) 2012-04-17 2012-04-17 量子化装置及びその制御方法

Publications (2)

Publication Number Publication Date
JP2013223143A true JP2013223143A (ja) 2013-10-28
JP5959911B2 JP5959911B2 (ja) 2016-08-02

Family

ID=49593819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012094182A Expired - Fee Related JP5959911B2 (ja) 2012-04-17 2012-04-17 量子化装置及びその制御方法

Country Status (1)

Country Link
JP (1) JP5959911B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000013608A (ja) * 1998-06-23 2000-01-14 Ricoh Co Ltd 画像処理方法
JP2005341555A (ja) * 2004-04-29 2005-12-08 Mitsubishi Electric Information Technology Centre Europa Bv 画像または画像シーケンスを表現する方法、画像を表現する記述子およびその使用方法、ならびにこれらの方法を行う装置、コンピュータプログラム、および記憶媒体
JP2011211351A (ja) * 2010-03-29 2011-10-20 Sharp Corp 画像符号化装置、画像符号化装置の制御方法、制御プログラムおよび記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000013608A (ja) * 1998-06-23 2000-01-14 Ricoh Co Ltd 画像処理方法
JP2005341555A (ja) * 2004-04-29 2005-12-08 Mitsubishi Electric Information Technology Centre Europa Bv 画像または画像シーケンスを表現する方法、画像を表現する記述子およびその使用方法、ならびにこれらの方法を行う装置、コンピュータプログラム、および記憶媒体
JP2011211351A (ja) * 2010-03-29 2011-10-20 Sharp Corp 画像符号化装置、画像符号化装置の制御方法、制御プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP5959911B2 (ja) 2016-08-02

Similar Documents

Publication Publication Date Title
TWI433544B (zh) 多視點圖像編碼方法、多視點圖像解碼方法、多視點圖像編碼裝置、多視點圖像解碼裝置、多視點圖像編碼程式及多視點圖像解碼程式
JP4999854B2 (ja) 画像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
CN102308584B (zh) 多视点图像编码方法、多视点图像译码方法、多视点图像编码装置以及多视点图像译码装置
US8363985B2 (en) Image generation method and apparatus, program therefor, and storage medium which stores the program
Artusi et al. JPEG XT: A compression standard for HDR and WCG images [standards in a nutshell]
JP5947977B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
US20100290715A1 (en) Image generation method and apparatus, program therefor, and storage medium which stores the program
JP6232075B2 (ja) 映像符号化装置及び方法、映像復号装置及び方法、及び、それらのプログラム
JP4050472B2 (ja) 画像生成方法、装置およびシステム
JP5746370B2 (ja) 予測値を形成するための方法および装置
US20150016517A1 (en) Encoding device and encoding method, and decoding device and decoding method
US20200059657A1 (en) Image processing apparatus and method
JP4944046B2 (ja) 映像符号化方法,復号方法,符号化装置,復号装置,それらのプログラムおよびコンピュータ読み取り可能な記録媒体
WO2015056712A1 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、及び動画像復号プログラム
JP5959911B2 (ja) 量子化装置及びその制御方法
KR101316196B1 (ko) 입체 영상 화질 향상 장치 및 방법과 이에 관한 기록매체
JP6614822B2 (ja) 画像符号化装置及びその制御方法及びプログラム及び記憶媒体
Verma et al. Splatty-A unified image demosaicing and rectification method
JP2020092327A (ja) 画像符号化装置、画像符号化方法、およびプログラム
Gao et al. Optimization of occlusion-inducing depth pixels in 3-d video coding
WO2023023918A1 (zh) 解码方法、编码方法、解码器以及编码器
JP2014099716A (ja) 画像符号化装置及びその制御方法
Monteiro et al. Disparity compensation using geometric transforms
WO2023240455A1 (zh) 点云编码方法、编码装置、编码设备以及存储介质
WO2022257155A1 (zh) 解码方法、编码方法、解码器、编码器以及编解码设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150410

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160622

R151 Written notification of patent or utility model registration

Ref document number: 5959911

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees