JP2012010255A - 画像変換装置、画像変換装置の制御方法、画像変換装置制御プログラムおよび記録媒体 - Google Patents
画像変換装置、画像変換装置の制御方法、画像変換装置制御プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP2012010255A JP2012010255A JP2010146316A JP2010146316A JP2012010255A JP 2012010255 A JP2012010255 A JP 2012010255A JP 2010146316 A JP2010146316 A JP 2010146316A JP 2010146316 A JP2010146316 A JP 2010146316A JP 2012010255 A JP2012010255 A JP 2012010255A
- Authority
- JP
- Japan
- Prior art keywords
- depth
- image
- depth value
- value
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims description 49
- 238000009826 distribution Methods 0.000 claims abstract description 185
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008825 perceptual sensitivity Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/128—Adjusting depth or disparity
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】奥行き画像の情報量を、遅延が少なく、簡便な処理で削減する。
【解決手段】画像符号化装置10は、奥行き画像を取得する分割部11と、分割部11が取得した奥行き画像における奥行き値の出現数の分布を作成する奥行き値分布作成部13と、奥行き値分布作成部13が作成した奥行き値分布を、該分布における奥行き値の連続性に応じて複数の区間に分割し、奥行き値分布の各区間の代表値を決定する画素分類部14と、画素分類部14が分割した奥行き値分布の各区間に含まれる奥行き値を、代表値に変換することにより奥行き画像を変換する奥行き値変換部16と、を備えている。これにより、奥行き値を代表値に変換することができるので、奥行き画像の情報量を、遅延が少なく、簡便な処理で削減することができる。
【選択図】図1
【解決手段】画像符号化装置10は、奥行き画像を取得する分割部11と、分割部11が取得した奥行き画像における奥行き値の出現数の分布を作成する奥行き値分布作成部13と、奥行き値分布作成部13が作成した奥行き値分布を、該分布における奥行き値の連続性に応じて複数の区間に分割し、奥行き値分布の各区間の代表値を決定する画素分類部14と、画素分類部14が分割した奥行き値分布の各区間に含まれる奥行き値を、代表値に変換することにより奥行き画像を変換する奥行き値変換部16と、を備えている。これにより、奥行き値を代表値に変換することができるので、奥行き画像の情報量を、遅延が少なく、簡便な処理で削減することができる。
【選択図】図1
Description
本発明は、画像の奥行き値を示す奥行き画像を変換する画像変換装置、画像変換装置の制御方法、プログラムおよび記録媒体に関するものである。
近年、複数の視点からの画像(複数視点画像)を用いることにより、1視点方向からの画像である単一視点画像のみでは得ることのできない臨場感の高い映像表現が実現されている。複数視点画像を用いた映像表現としては、例えば、立体画像表示や任意視点画像表示が挙げられる。
立体画像表示は、視差のある2つの画像を用い、観察者が右眼で一方の画像を左眼で他方の画像を見ることにより、それぞれの画像は平面画像であるにもかかわらず、観察者の脳内ではあたかも立体的な三次元空間を見ているような感覚を与えるものである。具体的に図9を用いて説明する。図9は、立体画像表示の概要を示す説明図である。図9に示すように、視差のある2つ画像501、502に対し、観察者は左眼で画像501を、右眼で画像502を見ることにより、観察者の脳内503では、画像501、502内の物体504、505が立体的に存在しているように感じられる。
また、任意視点画像表示は、視点の異なる複数の視点画像およびそれぞれの視点画像におけるカメラと被写体との距離から、任意の視点における被写体の画像を作成し、表示するものである。具体的に図10を用いて説明する。図10は、任意視点画像表示の概要を示す説明図である。図10に示すように、視点の異なる複数の視点画像601v、602v、603vと、それぞれの視点画像におけるカメラと被写体との距離を示す奥行き画像601d、602d、603dとから、任意の視点における被写体の画像(図10に示す例では、視点画像604v、605v)を作成し、表示する。これにより、撮影していない視点からの被写体の画像を表示させることができる。
非特許文献1に、任意の視点おける視点画像(任意視点画像)を生成する方法が記載されている。非特許文献1に記載の方法は、2つの視点画像、およびこれらに対応する奥行き画像を利用して任意視点画像を生成するものである。具体的には、(1)仮想視点に対して奥行き画像を投影し、(2)投影した奥行き画像を平滑化し、(3)平滑化した奥行き画像に対して、実画像の画素値をマッピングし、(4)残った位置の画素を周囲の画素を利用して修復する、という方法である。このように、2視点の視点画像とその奥行き画像を利用することで、それら視点の近傍にある任意視点からの画像を生成することが可能となる。
また、任意視点画像の生成技術を用いることにより、上述した立体画像表示の改善につながる。図11を用いて説明する。図11は、任意視点画像の生成技術により立体表示の改善につながる原理を説明するための図である。図11に示すように、間隔706だけ離れて設置されている2つのカメラ701、702で被写体704、705を撮影し、視点画像701v、702vを得たとする。そして、間隔706が人間の左右の眼の間隔(一般に65mm前後と言われている)よりも大きい場合、視点画像701vを左の眼で、視点画像702vを右の眼で見たとしても、ぼやけた立体画像となるか、あるいは全く立体としては見えない画像となってしまう。
そこで、カメラ701から人間の左右の眼の間隔と同じ間隔707だけ離れた視点位置703において被写体をみた視点画像703vを作成し、視点画像701vと視点画像703vとを用いることで、適正な立体画像として観察することが可能となる。
また、2つのカメラ701、702の間隔が、人間の左右の眼の間隔と比較して狭すぎる場合であっても、カメラ701、またはカメラ702の地点から人間の左右の眼の間隔に相当する地点における視点画像を生成することにより、十分な立体感が得られる立体画像を観察することが可能になる。
さらに、上述した原理を用いることで、任意視点からの立体画像を観察することや、任意視点における立体画像の観察時の立体感を調整することが可能となる。
以上のように、複数の視点画像および対応する奥行き画像(奥行き情報)を利用すれば、画像表示の表現機能を向上させることができる。しかしながら、奥行き画像を必要とするため、記録・伝送時のデータ量が増えるという問題が生じる。
この問題を解決するため、特許文献1では、奥行き情報を伝送するときに、視覚の奥行き変化に対する時間周波数および空間周波数特性に従い、知覚感度の高い周波数成分に対して優先的に伝送量を割り当てるように奥行き値を符号化する技術が開示されている。特許文献1では、奥行き情報の情報量を圧縮するときに、人の奥行き知覚の感度に着目して符号量を割り当てることによって、奥行き情報の品質(すなわち奥行き情報を利用して生成される視点画像の品質)を保ちつつ、情報量の削減を可能にしている。
森、他:奥行き画像を用いた3D warpingによる自由視点画像生成,電子情報通信学会総合大会 情報・システム講演論文集2,D−11−7,2008年3月5日
しかしながら、上記特許文献1の方法では、奥行き情報を符号化するために、奥行き情報の時間周波数特性および空間周波数特性を分析するため、奥行き情報をそのまま符号化する方法に比べて処理量が増加し、処理時間が遅延してしまう。特に、時間周波数特性を得るためには、複数のフレームにわたって奥行き情報を分析する必要があり、必ず処理に数フレーム以上の遅延が生じてしまう。
そして、数フレーム以上の遅延が生じてしまうため、リアルタイムに符号化・復号するようなアプリケーションには適用することができない。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、奥行き画像における被写体の遠近関係を維持したまま、遅延が少なく、簡便な処理で、奥行き画像の情報量を減らすことができる画像変換装置等を実現することにある。
上記課題を解決するために、本発明に係る画像変換装置は、奥行き値を変換することによって奥行き画像を変換する画像変換装置であって、上記奥行き画像を取得する取得手段と、上記取得手段が取得した奥行き画像における奥行き値の出現数の分布を作成する奥行き値分布作成手段と、上記奥行き値分布作成手段が作成した奥行き値分布を、該分布における奥行き値の連続性に応じて複数の区間に分割する奥行き値分布分割手段と、上記奥行き値分布分割手段が分割した奥行き値分布の各区間の代表値を決定する代表値決定手段と、上記奥行き値分布分割手段が分割した奥行き値分布の各区間に含まれる奥行き値を、上記代表値決定手段が決定した代表値に変換することにより上記奥行き画像を変換する画像変換手段と、を備えたことを特徴としている。
また、本発明に係る画像変換装置の制御方法は、奥行き値を変換することによって奥行き画像を変換する画像変換装置の制御方法であって、上記奥行き画像を取得する取得ステップと、上記取得ステップで取得した奥行き画像における奥行き値の出現数の分布を作成する奥行き値分布作成ステップと、上記奥行き値分布作成ステップで作成した奥行き値分布を、該分布における奥行き値の連続性に応じて複数の区間に分割する奥行き値分布分割ステップと、上記奥行き値分布分割ステップで分割した奥行き値分布の各区間の代表値を決定する代表値決定ステップと、上記奥行き値分布分割ステップで分割した奥行き値分布の各区間に含まれる奥行き値を、上記代表値決定ステップで決定した代表値に変換することにより上記奥行き画像を変換する画像変換ステップと、を含むことを特徴としている。
上記の構成または方法によれば、奥行き画像における奥行き値の出現数の分布を、該分布における奥行き値の連続性に応じて複数の区間に分割し、分割した区間における奥行き値を代表値に変換して奥行き画像を変換する。
これにより、各奥行き画像における奥行き値の出現数の分布の形状の特徴を維持したまま、奥行き値を代表値に変換することができるので、奥行き画像の遠近関係を維持したまま奥行き画像の情報量を減らすことができる。
また、変換の対象となる奥行き画像の前後の奥行き画像を用いることなく、奥行き値を変換して奥行き画像の情報量を減らすことができるので、前後の奥行き画像を用いて奥行き値の変換を行う場合のように、変換処理が遅延してしまうことを防止することができる。
本発明に係る画像変換装置では、上記奥行き値分布分割手段は、上記奥行き値分布作成手段が作成した奥行き値分布に不連続区間が存在する場合、該不連続区間を境として奥行き値分布を分割し、上記奥行き値分布の連続区間については、該連続区間における出現数の極大値を検出し、極大値が複数存在する場合に、隣接する極大値に挟まれた区間における出現数の最小値が、該区間を挟む極大値のうちの小さい方の極大値に1未満の所定比率を乗じた値未満であるとき、該最小値をとる奥行き値を境として奥行き値分布を分割するものであることが好ましい。
上記の構成によれば、奥行き値分布を、不連続区間または極大値に挟まれた極大値に対して所定の比率を乗じた値未満の出現数の奥行き値を境として分割する。
これにより、出現数が少ない、または出現数がゼロの奥行き値を境として奥行き値分布を分割するので、分割後の各区間における奥行き値を代表値に変換しても、奥行き値分布の形状を正確に維持することができる。よって、奥行き画像の遠近関係を正確に維持したまま奥行き画像を変換することができる。
本発明に係る画像変換装置では、上記代表値決定手段は、上記奥行き値分布分割手段が分割した奥行き値分布の区間において、出現数の極大値が1つ存在する場合、該極大値に対応する奥行き値を当該区間の代表値に決定するものであることが好ましい。
分割された区間において、出現数の極大値が1つの場合、該極大値に対応する奥行き値が最も当該区間の奥行き値を表現しているということができる。
そして、上記の構成によれば、代表値決定手段は、奥行き値分布分割手段が分割した奥行き値分布の区間の代表値を、出現数の極大値が1つの場合は該極大値に対応する奥行き値に決定する。
これにより、分割された区間の奥行き値を変換する代表値を的確に決定することができる。
本発明に係る画像変換装置では、上記代表値決定手段は、上記奥行き値分布分割手段が分割した奥行き値分布の区間において、出現数が一定である場合、または出現数の極大値が複数存在する場合、当該区間の中央の奥行き値を代表値に決定するものであることが好ましい。
分割された区間において、出現数が一定であるか、または出現数の極大値が複数存在する場合、出現数が偏っていないと考えられるため、当該区間の中間の奥行き値が、最も当該区間の奥行き値を表現しているということができる。
そして、上記の構成によれば、代表値決定手段は、奥行き値分布分割手段が分割した奥行き値分布の区間の代表値を、出現数が一定であるか、または出現数の極大値が複数存在する場合は、当該区間の中央の奥行き値に決定する。
これにより、分割された区間の奥行き値を変換する代表値を的確に決定することができる。
本発明に係る画像変換装置では、上記取得手段は、視点の異なる複数の奥行き画像を取得し、上記取得手段が取得した複数の奥行き画像において、被写体の重なり方が異なる領域であるオクルージョン領域を特定するオクルージョン領域特定手段を備え、上記画像変換手段は、上記オクルージョン領域特定手段がオクルージョン領域と特定した領域については、それぞれの奥行き値を変換しないものであってもよい。
オクルージョン領域は、視点の異なる複数の奥行き画像において被写体の重なり方が異なる領域であり、狭い領域で遠近関係が大きく異なる。よって、この領域で奥行き値を代表値に変換してしまうと、大きく異なっていた遠近関係がなくなり、平坦になってしまう可能性がある。
そこで、上記の構成によれば、オクルージョン領域特定手段がオクルージョン領域と特定した領域について、画像変換手段は、それぞれの奥行き値を変換しない。
よって、オクルージョン領域については、そのままの遠近関係を維持したまま奥行き画像を変換することができる。すなわち、奥行き画像の品質を維持したまま奥行き画像を変換することができる。
本発明に係る画像変換装置では、上記取得手段が取得した複数の奥行き画像を、同じ分割位置でそれぞれ複数の分割画像に分割する画像分割手段を備え、上記奥行き値分布作成手段は、上記画像分割手段が分割した各分割画像の奥行き値の出現数の分布を作成するものであって、さらに、上記奥行き画像のうち、或る奥行き画像の分割画像と対応する他の奥行き画像の分割画像を決定する対応分割画像決定手段を備え、上記オクルージョン領域特定手段は、上記対応分割画像決定手段が決定した、対応する分割画像同士の間で、或る分割画像の奥行き値分布のすべての区間について、1区間ずつ注目区間としながら、該注目区間の特徴量と、対応する分割画像の奥行き値分布のすべての区間の特徴量との差分をそれぞれ算出し、算出したすべての差分が所定値より大きいとき、当該注目区間に属する奥行き値を有する画素よりなる領域を、オクルージョン領域と特定するものであってもよい。
オクルージョン領域は、複数の奥行き画像間で遠近関係が異なる領域なので、或る奥行き画像におけるオクルージョン領域の奥行き値分布と、この領域に対応する他の奥行き画像の奥行き値分布も異なる。
よって、オクルージョン領域では、対応する分割画像間の奥行き値分布の区間における特徴量が大きく異なることになる。逆に言えば、オクルージョン領域でなければ、対応する分割画像の奥行き値分布の区間における特徴量は、それほど変わらない。
したがって、ある分割画像における奥行き値分布の区間の特徴量と対応する分割画像における奥行き値分布の区間の特徴量との差分をみれば、オクルージョン領域か否かを特定することができる。
そこで、上記の構成によれば、オクルージョン領域特定手段は、対応する分割画像同士の間で、或る分割画像の奥行き値分布のすべての区間について、1区間ずつ注目区間としながら、該注目区間の特徴量と、対応する分割画像の奥行き値分布のすべての区間の特徴量との差分をそれぞれ算出し、算出したすべての差分が所定値より大きいとき、当該注目区間に属する奥行き値を有する画素よりなる領域を、オクルージョン領域と特定するので、オクルージョン領域の特定を正確に行うことができる。
本発明に係る画像変換装置では、上記代表値決定手段は、上記画像分割手段が分割した各奥行き画像の奥行き値分布の各区間の代表値を決定するものであって、各奥行き画像の各分割画像について、上記奥行き値分布分割手段が分割した1つの区間に属する奥行き値を有する画素よりなる領域が当該分割画像において占める面積である占有面積を、上記奥行き値分布分割手段が分割したすべての区間について算出する占有面積算出手段を備え、上記オクルージョン領域特定手段は、上記特徴量として、上記代表値および上記占有面積の少なくともいずれか一方を用いるものであってもよい。
奥行き値分布の各区間の代表値および占有面積は、当該区間の奥行き値分布の特徴を表すものである。よって、オクルージョン領域特定手段は、特徴量として、代表値および占有面積を用いることで、オクルージョン領域の特定を正確に行うことができる。
なお、上記画像変換装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記画像変換装置をコンピュータにて実現させる画像変換装置の制御プログラム、およびこれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
以上のように、本発明に係る画像変換装置は、奥行き画像を取得する取得手段と、上記取得手段が取得した奥行き画像における奥行き値の出現数の分布を作成する奥行き値分布作成手段と、上記奥行き値分布作成手段が作成した奥行き値分布を該分布の形状に応じて複数の区間に分割する奥行き値分布分割手段と、上記奥行き値分布分割手段が分割した奥行き値分布の各区間の代表値を決定する代表値決定手段と、上記奥行き値分布分割手段が分割した奥行き値分布の各区間に含まれる奥行き値を、上記代表値決定手段が決定した代表値に変換することにより上記奥行き画像を変換する画像変換手段と、を備えた構成である。
また、本発明に係る画像変換装置の制御方法は、奥行き画像を取得する取得ステップと、上記取得ステップで取得した奥行き画像における奥行き値の出現数の分布を作成する奥行き値分布作成ステップと、上記奥行き値分布作成ステップで作成した奥行き値分布を該分布の形状に応じて複数の区間に分割する奥行き値分布分割ステップと、上記奥行き値分布分割ステップで分割した奥行き値分布の各区間の代表値を決定する代表値決定ステップと、上記奥行き値分布分割ステップで分割した奥行き値分布の各区間に含まれる奥行き値を、上記代表値決定ステップで決定した代表値に変換することにより上記奥行き画像を変換する画像変換ステップと、を含む方法である。
これにより、奥行き画像における奥行き値の出現数の分布の形状の特徴を維持したまま、奥行き値を代表値に変換することができるので、奥行き画像の遠近関係を維持したまま奥行き画像の情報量を減らすことができるという効果を奏する。
また、前後の奥行き画像を用いることなく、奥行き値を変換して奥行き画像の情報量を減らすことができるので、前後の奥行き画像を用いて奥行き値の変換を行う場合のように、変換処理が遅延してしまうことを防止することができるという効果を奏する。
本発明の一実施の形態について図1〜図8に基づいて説明すれば、以下のとおりである。
(画像符号化装置の構成)
まず、本実施の形態に係る画像符号化装置(画像変換装置)10について説明する。図1は、画像符号化装置10の要部構成を示すブロック図である。画像符号化装置10は、複数の視点画像(例えば、右眼用画像および左眼用画像)に対応する奥行き画像を取得し、これらに符号化処理を施して情報量を削減し、送信する装置である。なお、右眼用画像とは、観察者が右眼で見ることを想定している画像であり、左眼用画像とは、観察者が左眼で見ることを想定している画像である。観察者が、右眼用画像と左眼用画像とを同時に見ることで、画像に表示されている被写体を立体的に見ることができる。また、本実施の形態では、奥行き画像が2つの場合を説明するが、本発明はこれに限られるものではなく、奥行き画像が3つ以上であってもよい。
まず、本実施の形態に係る画像符号化装置(画像変換装置)10について説明する。図1は、画像符号化装置10の要部構成を示すブロック図である。画像符号化装置10は、複数の視点画像(例えば、右眼用画像および左眼用画像)に対応する奥行き画像を取得し、これらに符号化処理を施して情報量を削減し、送信する装置である。なお、右眼用画像とは、観察者が右眼で見ることを想定している画像であり、左眼用画像とは、観察者が左眼で見ることを想定している画像である。観察者が、右眼用画像と左眼用画像とを同時に見ることで、画像に表示されている被写体を立体的に見ることができる。また、本実施の形態では、奥行き画像が2つの場合を説明するが、本発明はこれに限られるものではなく、奥行き画像が3つ以上であってもよい。
なお、奥行き画像とは、各画素を、カメラと被写体との距離である奥行き値を示す輝度のみで表現した画像である。通常、カメラに近い被写体ほど大きい輝度で表現され、カメラからの距離が離れるにつれて、輝度が小さくなるように、表現される。
奥行き画像の作成方法としては、例えば、カメラから赤外線や超音波を照射し、その反射を利用してカメラと被写体との距離を実測して奥行き値を求めることにより奥行き画像を作成する方法や、複数のカメラにより撮影を行い、撮影時のカメラ配置および撮影条件に関する情報と、複数のカメラで撮影したそれぞれの視点画像の対応関係とから、視点画像内の各領域の配置と前後関係を推定して奥行き値を求めることにより奥行き画像を作成する方法などを挙げることができる。
図1に示すように、画像符号化装置10は、分割部(取得手段、画像分割手段)11、マッチング部(対応分割画像決定手段)12、奥行き値分布作成部(奥行き値分布作成手段)13、画素分類部(奥行き値分布分割手段、代表値決定手段、占有面積算出手段)14、オクルージョン領域特定部(オクルージョン領域特定手段)15、奥行き値変換部(画像変換手段)16、符号化部17、および多重化部18を含む構成である。
分割部11は、右眼用画像および左眼用画像に対応する右眼用奥行き画像および左眼用奥行き画像を取得し、それぞれ、所定のサイズ(例えば、16×16画素)のブロック(分割画像)に分割するものである。そして、複数のブロックに分割したそれぞれの奥行き画像(右眼用画像および左眼用画像)をマッチング部12、および奥行き値分布作成部13へ送信する。また、奥行き画像は、複数の画素情報によって構成されており、画素情報は、当該画像における位置を示す座標情報と輝度情報とによって構成されている。なお、奥行き画像は、複数のフレームで構成される動画像であってもよいし、静止画像であってもよい。また、本実施の形態では、輝度情報は、8ビットで表現されるものとして説明するが、これに限られるものではない。
マッチング部12は、分割部11から取得した、複数のブロックに分割された右眼用奥行き画像および左眼用奥行き画像のそれぞれについて、他方の奥行き画像とのブロックマッチングを行い、最も一致度が高いブロックを判定するものである。そして、最も一致度が高いと判定したブロック同士を相互に対応付けてオクルージョン領域特定部15へ送信する。
ブロック同士の一致度の判定方法について、より具体的に説明する。マッチング部12は、左眼用奥行き画像の各ブロックについて、右眼用奥行き画像の同位置ブロックを中心に所定範囲内(例えば±16画素)のブロックに対し、差分絶対値の累積和AEを求める。そして、差分絶対値の累積和AEが最も小さいブロックを一致度が高いブロックと判定する。
奥行き値分布作成部13は、分割部11から取得した複数のブロックに分割された右眼用奥行き画像および左眼用奥行き画像について、各ブロックにおける輝度情報(奥行き値)の出現数を計数し、奥行き値と出現数(画素数)との関係を示す奥行き値分布を生成する。そして、生成した、各ブロックにおける奥行き値分布を、それぞれのブロックと対応付けて画素分類部14へ送信する。
画素分類部14は、奥行き値分布作成部13から取得した、右眼用奥行き画像および左眼用奥行き画像の各ブロックにおける奥行き値分布を用いて、各ブロックの画素を、1つ以上の画素グループに分類する。そして、各画素グループの代表値および占有面積(特徴量)を算出する。そして、各画素グループの代表値および占有面積を、それぞれのブロックを対応付けてオクルージョン領域特定部15へ送信する。なお、画素グループの分類方法、代表値および占有面積の算出方法については後述する。
オクルージョン領域特定部15は、マッチング部12から取得した、右眼用奥行き画像と左眼用奥行き画像との各ブロックの対応関係と、画素分類部14から取得した、右眼用奥行き画像および左眼用奥行き画像の各ブロックにおける画素グループの代表値および占有面積を用いて、オクルージョンが発生している領域の特定を行う。オクルージョンとは、カメラから近い距離に存在している被写体が、これよりも遠くに存在している被写体の一部または全部を隠すことをいう。本実施の形態では、オクルージョンによって、右眼用画像と左眼用画像とで、被写体の表示されている範囲が異なっている領域を、オクルージョン領域と定義する。そして、オクルージョン領域特定部15は、オクルージョンが発生している領域を特定すると、オクルージョンが発生している画素グループの奥行き画像における位置を、それぞれのブロックと対応付けて奥行き値変換部16へ送信する。なお、オクルージョンが発生している領域の特定方法については後述する。
奥行き値変換部16は、画素分類部14から取得したブロック毎の画素グループの代表値および占有面積と、オクルージョン領域特定部15から取得したオクルージョンが発生している位置とを用いて、各ブロックにおける奥行き値を変換して当該ブロックの解像度を落とす処理を行い、符号化部17へ送信するものである。変換処理の詳細については後述する。
符号化部17は、奥行き値変換部16で奥行き値が変換された奥行き画像を所定の符号化方式に基づいて、圧縮符号化するものである。符号化方式としては、符号化の対象となる画像が静止画像であればJPEG(Joint Photographic Experts Group)やJPEG2000などの方式を挙げることができる。また、符号化の対象となる画像が動画像であればMPEG(Moving Picture Experts Group)−2、MPEG−4AVC(Advanced Video Coding)/H.264などの方式を挙げることができる。そして、圧縮符号化した奥行き画像を多重化部18へ送信する。
多重化部18は、符号化部17で符号化された各奥行き画像の符号化データを、所定のフォーマットに従い多重化して、図示しない記録装置や外部通信手段などへ送信する。多重化の所定のフォーマットとしては、MVC(Multi-view Video Coding)フォーマットを挙げることができる。
(画像符号化装置における処理の流れ)
次に、図2を用いて画像符号化装置10における処理の流れを説明する。図2は、画像符号化装置10の処理の流れを示すフローチャートである。
次に、図2を用いて画像符号化装置10における処理の流れを説明する。図2は、画像符号化装置10の処理の流れを示すフローチャートである。
図2に示すように、画像符号化装置10は、奥行き画像(左眼用奥行き画像および右眼用奥行き画像)を取得すると(S1、取得ステップ)、分割部11が、これらの奥行き画像をそれぞれ所定のサイズに分割する(S2)。次に、マッチング部12は、分割部11が分割した左眼用奥行き画像の各ブロックについて、右眼用奥行き画像とブロックマッチングを行うとともに、右眼用奥行き画像の各ブロックについて、左眼用奥行き画像とブロックマッチングを行う。そして、右眼用奥行き画像および左眼用奥行き画像それぞれの各ブロックについて、マッチングペアを決定する(S3)。マッチングペアを決定する処理の詳細については後述する。
そして、奥行き値分布作成部13は、分割部11が分割したブロックごとに、奥行き値分布を作成し(S4、奥行き値分布作成ステップ)、画素分類部14は、分割部11が分割したブロックごとに画素グループの分類を行い(奥行き値分布分割ステップ)、それぞれの画素グループにおける代表値を決定し(代表値決定ステップ)、占有面積を算出する(S5)。画素グループを分類する処理の詳細については後述する。
次に、オクルージョン領域特定部15は、マッチング部12が決定したマッチングペアおよび画素分類部14が算出したそれぞれの画素グループの代表値および占有面積を用いてオクルージョンの有無を判定する(S6)。オクルージョン領域の特定処理の詳細については後述する。
その後、奥行き値変換部16は、オクルージョン領域特定部15が特定したオクルージョンの有無に応じて、奥行き値を変換し(S7、画像変換ステップ)、符号化部17は、奥行き値変換部16によって奥行き値が変換された奥行き画像を符号化し(S8)、多重化部18は、符号化されたそれぞれの奥行き画像(左眼用奥行き画像および右眼用奥行き画像)を多重化して(S8)、記録装置や外部通信装置等に送信する。なお、奥行き値の変換処理の詳細については後述する。以上で、画像符号化装置10における処理が終了する。
(マッチング部における処理)
次に、図3を用いて、マッチング部12における処理の流れを説明する。図3は、マッチング処理の流れを示すフローチャートである。
次に、図3を用いて、マッチング部12における処理の流れを説明する。図3は、マッチング処理の流れを示すフローチャートである。
まず、マッチング部12は、左眼用奥行き画像における各ブロックについて、右眼用奥行き画像における同位置ブロックおよび当該ブロックから所定の範囲内(±16画素)に存在するブロックを参照ブロックに設定する(S31)。次に、マッチング部12は、左眼用奥行き画像のブロックと、設定された右眼用奥行き画像における参照ブロックとの差分絶対値の累積和AEを算出する(S32)。そして、設定した全ての参照ブロックについて、差分絶対値の累積和AEの算出が終了すると(S33でYES)、差分絶対値の累積和AEが最小であったブロックのペアをマッチングブロックとして決定する(S34)。そして、左眼用奥行き画像の全てのブロックについて、マッチングペアが決定すると(S35でYES)、マッチング処理を終了する。
なお、右眼用奥行き画像についても、同様の処理を行う。
(画素分類部における処理)
次に、図4〜7を用いて、画素分類部14における処理について説明する。図4は、画素分類処理の流れを示すフローチャートである。なお、以下の説明では、奥行き画像における1つのブロックに対する処理について説明するが、画素分類部14は、以下の処理を、奥行き画像(左眼用奥行き画像および右眼用奥行き画像)の全てのブロックに対して行うものである。
次に、図4〜7を用いて、画素分類部14における処理について説明する。図4は、画素分類処理の流れを示すフローチャートである。なお、以下の説明では、奥行き画像における1つのブロックに対する処理について説明するが、画素分類部14は、以下の処理を、奥行き画像(左眼用奥行き画像および右眼用奥行き画像)の全てのブロックに対して行うものである。
まず、画素分類部14は、奥行き値分布作成部13が作成した各ブロックごとの奥行き値分布に不連続区間があるか否かを判定する(S51)。そして、不連続区間があれば(S1でYES)、当該不連続区間を境として2つの画素グループに分類する(S52)。画素グループとは、当該グループに分類された奥行き値を持つ画素情報(座標および奥行き値を持つ情報)のグループのことをいう。
一方、奥行き値分布に不連続区間が存在しない場合(S51でNO)、または、ステップS52で画素グループの分類を行った後、画素分類部14は、奥行き値分布作成部13が作成した各ブロックごとの奥行き値分布の連続区間における出現数の極大値を抽出する(S53)。そして、抽出した極大値の個数が1つであれば(S54でNO)、当該奥行き値分布の連続区間を1グループとする(S55)。すなわち、当該奥行き値分布の連続区間におけるそれぞれの奥行き値を持つ画素情報を、1つの画素グループに分類する。
一方、抽出した極大値が複数であれば(S54でYES)、画素分類部14は、隣接する2つの極大値に挟まれた分布の中に、両極大値に対して所定の比率(例えば20%)未満の出現数の奥行き値があるか否かを判定する(S55)。そして、両極大値に対して所定の比率(例えば20%)未満の出現数の奥行き値があれば(S55でYES)、当該奥行き値のうち出現数が最小の奥行き値を境界として2つの画素グループに分類する(S56)。すなわち、当該出現数が最小の奥行き値を境界として、それぞれの極大値を含む範囲の奥行き値を持つ画素情報を、2つのグループに分類する。他方、両極大値に対して所定の比率未満の出現数の奥行き値がなければ(S55でNO)、当該両極大値を含む範囲の奥行き値については1グループとする(S57)。
そして、画素分類部14は、分類したそれぞれの画素グループについて、代表値を決定し、占有面積を算出する(S58)。画素グループの代表値は、以下のように決定する。画素グループ内に出現数が最大の奥行き値が1つだけ存在する場合は、当該奥行き値を代表値として決定する。また、出現数が最大の奥行き値が複数存在する場合は、当該画素グループにおける奥行き値の中央の値を代表値として決定する。
また、画素グループの占有面積は、奥行き値分布を、当該画素グループの区間で積分して算出する。以上で、画素分類部14における処理が終了する。
次に、図5〜7を用いて、画素分類部14における処理の例を説明する。図5〜7は、画素分類部14における処理の例を説明するための図である。
図5は、左眼用視点画像および右眼用視点画像と、これらに対応する右眼用奥行き画像および左眼用奥行き画像を示すものである。図5の(a)は、左眼用視点画像210を示し、図5の(b)は、左眼用視点画像210と対応する左眼用奥行き画像211を示している。また、図5の(c)は、右眼用視点画像220を示し、図5の(d)は、右眼用視点画像220と対応する右眼用奥行き画像221を示している。
図5(a)および(b)は、それぞれ、2つの被写体201、202を含む空間を撮影したものであるが、視点の違いから視差が生じるために、右眼用視点画像220では被写体202は被写体201に隠れずに全て表示されているが、左眼用視点画像210では被写体202の一部分が被写体201に隠れて表示されていない。これが、上述したオクルージョンが発生している状態である。
ここで、左眼用奥行き画像211のブロック領域203aと右眼用奥行き画像221のブロック領域203bとに注目する。ブロック領域203aとブロック領域203bとは、分割部11によって分割され、マッチング部12において最も一致度が高いと判定されたブロックのペア(マッチングペア)である。
図5の(b)および(d)に示すように、左眼用奥行き画像211のブロック領域203aには、被写体202が含まれているが、右眼用奥行き画像221のブロック領域203bには被写体202は含まれていない。すなわち、右眼用奥行き画像221のブロック領域203b内の奥行き値は、被写体201と背景部分とで構成されている。
また、図6は、図5に示すブロック領域203aおよびブロック領域203bにおける奥行き値分布を示す図である。図6に示す奥行き値分布では、横軸に奥行き値、縦軸に出現数が示されている。図6の(a)は、ブロック領域203aにおける奥行き値分布を示す図(ヒストグラム)であり、図6の(b)は、ブロック領域203bにおける奥行き値分布を示す図である。
図5の左眼用奥行き画像211のブロック領域203aにおける奥行き値分布が、図6の(a)に示すような奥行き値分布であった場合、画素分類部14は、まず、奥行き値分布に不連続区間が存在するか否かを判定する。図6の(a)に示す奥行き値分布では、不連続区間603が存在する。そこで、画素分類部14は、不連続区間603を境として奥行き値分布を画素グループ301aと画素グループ302とに分類する。そして、画素グループ301aおよび画素グループ302のそれぞれに分類された奥行き値分布に、出現数の極大値が複数存在するか否かを判定する。画素グループ301aに分類された奥行き値分布には、極大値は1つ(極大値601)しかないので、画素グループ301aに分類された奥行き値分布は、これ以上複数には分類されない。また、同様に、画素グループ302に分類された奥行き値分布にも極大値は1つ(極大値602)しかないので、画素グループ302に分類された奥行き値分布は、これ以上複数には分類されない。
以上より、図6の(a)に示す奥行き値分布は、極大値601を含む画素グループ301aと極大値602を含む画素グループ302とに分類される。
そして、画素分類部14は、画素グループ301aの代表値を極大値601に対応する奥行き値に決定し、画素グループ302の代表値を極大値602に対応する奥行き値に決定する。さらに、奥行き値分布における、画素グループ301aおよび画素グループ302の区間について、積分することにより、それぞれの画素グループの占有面積を算出する。
同様に、図5の右眼用奥行き画像221のブロック領域203bにおける奥行き値分布が、図6の(b)に示すような奥行き値分布であった場合、画素分類部14は、まず、奥行き値分布に不連続区間が存在するか否かを判定する。図6の(b)に示す奥行き値分布では、不連続区間606が存在する。そこで、画素分類部14は、不連続区間606を境として奥行き値分布を画素グループ301bと画素グループ303とに分類する。そして、画素グループ301bおよび画素グループ303のそれぞれに分類された奥行き値分布に、出現数の極大値が複数存在するか否かを判定する。画素グループ301aに分類された奥行き値分布には、極大値は1つ(極大値604)しかないので、画素グループ301bに分類された奥行き値分布は、これ以上複数には分類されない。また、画素グループ303に分類された奥行き値分布には、極大値は存在しないので、画素グループ303に分類された奥行き値分布も、これ以上複数には分類されない。
以上より、図6の(a)に示す奥行き値分布は、極大値604を含む画素グループ301bと画素グループ303とに分類される。
そして、画素分類部14は、画素グループ301bの代表値を極大値604に対応する奥行き値に決定し、画素グループ303の代表値を、画素グループ303における奥行き値の中間の値である中間値605に決定する。さらに、奥行き値分布における、画素グループ301bおよび画素グループ303の区間について、積分することにより、それぞれの画素グループの占有面積を算出する。
なお、奥行き値分布に不連続区間が存在しない場合は、画素分類部14は、以下のように分類を行う。図7を用いて説明する。図7は、不連続区間が存在しない奥行き値分布を示す例である。図7に示すような奥行き値分布が存在した場合、画素分類部14は、まず、奥行き値分布の極大値を抽出する。ここでは、極大値401、極大値402が抽出される。そして、複数の極大値が抽出されたので、両極大値に挟まれた区間に両極大値に対する比率が20%未満の出現数の奥行き値が存在するか否かを判定する。図7に示す例では極小値403が存在する。そこで、画素分類部14は、極小値403を境界として、極大値401を含む画素グループ305と、極大値402を含む画素グループ304とに分類する。そして、それぞれの画素グループの代表値と占有面積を上述した方法で算出する。
(オクルージョン領域特定部における処理)
次に、図5、6、8を用いてオクルージョン領域特定部15における処理について説明する。図8は、オクルージョン領域特定部15における処理の流れを示すフローチャートである。
次に、図5、6、8を用いてオクルージョン領域特定部15における処理について説明する。図8は、オクルージョン領域特定部15における処理の流れを示すフローチャートである。
オクルージョン領域特定部15は、まず、マッチング部12が決定したマッチングペアのブロックについて、画素分類部14で複数の画素グループに分類されたか否かを判定する(S61)。そして、当該ブロックの画素グループが1つの場合は(S61でNO)、オクルージョンは発生していないと判定する(S64)。画素グループが1つの場合は、当該ブロック内には被写体領域が一つしかないことを意味するためである。
一方、複数の画素グループに分類されている場合は(S61でYES)、それぞれのブロックにおける画素グループの代表値と占有面積とを比較し、一致する画素グループがあるか否かを判定する。画素グループが一致するか否かは、例えば、或る画素グループ(注目区間に含まれる奥行き値を有する画素よりなる領域)について比較対象となるブロックに一致する画素グループがあるか否かを判定する場合、代表値と占有面積とのそれぞれについて差分を、比較対象となるブロックに含まれる全ての画素グループについて計算し、その差分値が元の値に対してそれぞれ10%未満の画素グループが存在するか否かを判定する。そして、差分値が10%未満の画素グループが存在すれば、その画素グループ同士は一致すると判定する。
そして、マッチングペアのブロック間で、一致しない画素グループがあるか否かを判定し(S62)、一致しない画素グループがあれば(S62でYES)、当該画素グループの領域をオクルージョン領域と特定する(S63)。以上で、オクルージョン領域特定部15における処理が終了する。
次に、図5、6を用いて、オクルージョン領域特定部15における処理の例を具体的に説明する。上述したように、図5(b)のブロック領域203aと図5(d)のブロック領域203bとがマッチングペアであり、オクルージョンが発生している。この場合に、これらのブロックについて、画素グループが一致するか否かを判定し、オクルージョンが発生しているか否かを判定すると以下のようになる。
図6の(a)および(b)に示すように、ブロック領域203aは、画素グループ301aおよび画素グループ302に分類されており、ブロック領域203bは、画素グループ301bおよび画素グループ303に分類されているので、ブロック領域203aおよびブロック領域203bは、ともに複数の画素グループに分類されている。
そして、画素グループ301a、画素グループ302と画素グループ301b、画素グループ303との、それぞれの代表値および占有面積を比較すると、画素グループ301aと画素グループ301bとが一致し、画素グループ302と画素グループ303とは一致しないことがわかる。そこで、オクルージョン領域特定部15は、ブロック領域203aの画素グループ302の領域と、ブロック領域203bの画素グループ303の領域とにオクルージョンが発生していると判定する。そして、オクルージョン領域特定部15は、画素グループ302の領域と画素グループ303の領域とをオクルージョンが発生している領域として特定し、奥行き値変換部16へ送信する。
(奥行き値変換部における処理)
次に、奥行き値変換部16における処理について説明する。奥行き値変換部16は、各ブロック内の画素グループの代表値と占有面積、および、オクルージョンの発生領域を用いて、次のように奥行き値を変換する。
(1)ブロック内に、画素グループが複数あり、かつ、オクルージョンが発生していない場合、各画素グループに含まれる奥行き値は、それぞれのグループの代表値に置き換える。
(2)ブロック内に、画素グループが複数あり、かつ、オクルージョンが発生している場合、オクルージョンが発生している画素グループに含まれる奥行き値はそのまま維持し、それ以外の画素グループに含まれる奥行き値は、それぞれのグループの代表値に置き換える。
(3)ブロック内に、画素値グループが1つの場合、ブロック内の奥行き値は全て、画素グループの代表値に置き換える。
次に、奥行き値変換部16における処理について説明する。奥行き値変換部16は、各ブロック内の画素グループの代表値と占有面積、および、オクルージョンの発生領域を用いて、次のように奥行き値を変換する。
(1)ブロック内に、画素グループが複数あり、かつ、オクルージョンが発生していない場合、各画素グループに含まれる奥行き値は、それぞれのグループの代表値に置き換える。
(2)ブロック内に、画素グループが複数あり、かつ、オクルージョンが発生している場合、オクルージョンが発生している画素グループに含まれる奥行き値はそのまま維持し、それ以外の画素グループに含まれる奥行き値は、それぞれのグループの代表値に置き換える。
(3)ブロック内に、画素値グループが1つの場合、ブロック内の奥行き値は全て、画素グループの代表値に置き換える。
以上のように変換処理を行うことによって、奥行き方向に重なり合う複数の被写体を含む画像に関して、オクルージョンが発生していない領域については、奥行き値が均一化されることにより、データ量およびデータの冗長度が削減される。よって、奥行き値変換部16で奥行き値が変換された奥行き画像を符号化部17において圧縮符号化を行うときに、圧縮率が向上するという効果を奏することができる。
また、上記(3)の処理を行った場合、当該ブロックの奥行き値は単一となる。これは、奥行き画像の空間解像度が削減されることを意味する。例えば、ブロックサイズが16×16=256画素の場合、(3)の処理を行うことによって256画素のすべてが同一の奥行き値で表現できることになる。よって、1画素分の奥行き値で256画素の奥行き値を表現できることになり、データ量を256分の1に削減することができる。
なお、上述した実施の形態では、奥行き値変換部16は、オクルージョンが発生している領域か否かという基準を用いて奥行き値の変換を行っている。しかしながら、奥行き値の変換の基準は、これに限られず、他の基準を用いて行ってもよい。例えば、奥行き値分布のばらつきから、奥行き値の変換を行ってもよい。すなわち、画素グループにおける奥行き値の分散σを求め、分散σが所定値Rより大きい場合には奥行き値の変換を行わず(すなわち、奥行き値をそのまま維持する)、所定値R以下の場合には当該画素グループに含まれる奥行き値を代表値に変換する。
これにより、奥行き方向の変化が大きい被写体の場合(σ>R)は、変換が行われず、奥行き方向の変化が小さい被写体の場合(σ≦R)は、変換が行われる(奥行き値が代表値に変換される)ので、被写体の遠近感の再現性を大きく損なわずに、情報量を減らすことができる。
このような方法により、奥行き方向に重なる複数の被写体の遠近関係を維持したまま、奥行き値の変換を行うことができるので、画像内の遠近感の歪みを抑えたまま、情報量を減らすことができる。
以上のように、本実施の形態によれば、奥行き画像に関して、複数被写体の前後関係を維持しながら、奥行き値の情報量を削減して符号化することで、奥行き画像の情報量を削減することができる。また、奥行き画像の情報量を削減するときに、時間方向に複数の画像フレームを用いることなく処理を行うことができるので、処理の遅延を抑えることができ、リアルタイムに符号化を行うことができる。
本発明は上述した実施の形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
最後に、画像符号化装置10の各ブロック、特に分割部11、マッチング部12、奥行き値分布作成部13、画素分類部14、オクルージョン領域特定部15、奥行き値変換部16、符号化部17、および多重化部18は、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(central processing unit)を用いてソフトウェア的に実現してもよい。
後者の場合、画像符号化装置10は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである画像符号化装置10の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記の画像符号化装置10に供給し、そのコンピュータ(またはCPUやMPU(microprocessor unit))が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM(compact disc read-only memory)/MO(magneto-optical)/MD(Mini Disc)/DVD(digital versatile disk)/CD−R(CD Recordable)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(erasable programmable read-only memory)/EEPROM(electrically erasable and programmable read-only memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、画像符号化装置10を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(local area network)、ISDN(integrated services digital network)、VAN(value-added network)、CATV(community antenna television)通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(institute of electrical and electronic engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(asynchronous digital subscriber loop)回線等の有線でも、IrDA(infrared data association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(high data rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。
視点画像に対応する奥行き値を、遅延が少なく簡便な処理で圧縮できるので、奥行き値を用いて画像を処理する装置、例えば、立体画像や任意の視点における画像を作成する装置に好適である。
10 画像符号化装置(画像変換装置)
11 分割部(取得手段、画像分割手段)
12 マッチング部(対応分割画像決定手段)
13 奥行き値分布作成部(奥行き値分布作成手段)
14 画素分類部(奥行き値分布分割手段、代表値決定手段、占有面積算出手段)
15 オクルージョン領域特定部(オクルージョン領域特定手段)
16 奥行き値変換部(画像変換手段)
17 符号化部
18 多重化部
11 分割部(取得手段、画像分割手段)
12 マッチング部(対応分割画像決定手段)
13 奥行き値分布作成部(奥行き値分布作成手段)
14 画素分類部(奥行き値分布分割手段、代表値決定手段、占有面積算出手段)
15 オクルージョン領域特定部(オクルージョン領域特定手段)
16 奥行き値変換部(画像変換手段)
17 符号化部
18 多重化部
Claims (10)
- 奥行き値を変換することによって奥行き画像を変換する画像変換装置であって、
上記奥行き画像を取得する取得手段と、
上記取得手段が取得した奥行き画像における奥行き値の出現数の分布を作成する奥行き値分布作成手段と、
上記奥行き値分布作成手段が作成した奥行き値分布を、該分布における奥行き値の連続性に応じて複数の区間に分割する奥行き値分布分割手段と、
上記奥行き値分布分割手段が分割した奥行き値分布の各区間の代表値を決定する代表値決定手段と、
上記奥行き値分布分割手段が分割した奥行き値分布の各区間に含まれる奥行き値を、上記代表値決定手段が決定した代表値に変換することにより上記奥行き画像を変換する画像変換手段と、を備えたことを特徴とする画像変換装置。 - 上記奥行き値分布分割手段は、
上記奥行き値分布作成手段が作成した奥行き値分布に不連続区間が存在する場合、該不連続区間を境として奥行き値分布を分割し、
上記奥行き値分布の連続区間については、該連続区間における出現数の極大値を検出し、極大値が複数存在する場合に、隣接する極大値に挟まれた区間における出現数の最小値が、該区間を挟む極大値のうちの小さい方の極大値に1未満の所定比率を乗じた値未満であるとき、該最小値をとる奥行き値を境として奥行き値分布を分割することを特徴とする請求項1に記載の画像変換装置。 - 上記代表値決定手段は、上記奥行き値分布分割手段が分割した奥行き値分布の区間において、出現数の極大値が1つ存在する場合、該極大値に対応する奥行き値を当該区間の代表値に決定することを特徴とする請求項1または2に記載の画像変換装置。
- 上記代表値決定手段は、上記奥行き値分布分割手段が分割した奥行き値分布の区間において、出現数が一定である場合、または出現数の極大値が複数存在する場合、当該区間の中央の奥行き値を代表値に決定することを特徴とする請求項1〜3のいずれか1項に記載の画像変換装置。
- 上記取得手段は、視点の異なる複数の奥行き画像を取得し、
上記取得手段が取得した複数の奥行き画像において、被写体の重なり方が異なる領域であるオクルージョン領域を特定するオクルージョン領域特定手段を備え、
上記画像変換手段は、上記オクルージョン領域特定手段がオクルージョン領域と特定した領域については、奥行き値を変換しないことを特徴とする請求項1〜4のいずれか1項に記載の画像変換装置。 - 上記取得手段が取得した複数の奥行き画像を、同じ分割位置でそれぞれ複数の分割画像に分割する画像分割手段を備え、
上記奥行き値分布作成手段は、上記画像分割手段が分割した各分割画像の奥行き値の出現数の分布を作成するものであって、
さらに、
上記奥行き画像のうち、或る奥行き画像の分割画像と対応する他の奥行き画像の分割画像を決定する対応分割画像決定手段を備え、
上記オクルージョン領域特定手段は、
上記対応分割画像決定手段が決定した、対応する分割画像同士の間で、
或る分割画像の奥行き値分布のすべての区間について、1区間ずつ注目区間としながら、該注目区間の特徴量と、対応する分割画像の奥行き値分布のすべての区間の特徴量との差分をそれぞれ算出し、
算出したすべての差分が所定値より大きいとき、当該注目区間に属する奥行き値を有する画素よりなる領域を、オクルージョン領域と特定することを特徴とする請求項5に記載の画像変換装置。 - 上記代表値決定手段は、上記画像分割手段が分割した各奥行き画像の奥行き値分布の各区間の代表値を決定するものであって、
各奥行き画像の各分割画像について、上記奥行き値分布分割手段が分割した1つの区間に属する奥行き値を有する画素よりなる領域が当該分割画像において占める面積である占有面積を、上記奥行き値分布分割手段が分割したすべての区間について算出する占有面積算出手段を備え、
上記オクルージョン領域特定手段は、上記特徴量として、上記代表値および上記占有面積の少なくともいずれか一方を用いることを特徴とする請求項6に記載の画像変換装置。 - 請求項1〜7に記載の画像変換装置を動作させる画像変換装置制御プログラムであって、コンピュータを上記の各手段として機能させるための画像変換装置制御プログラム。
- 請求項8に記載の画像変換装置制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
- 奥行き値を変換することによって奥行き画像を変換する画像変換装置の制御方法であって、
上記奥行き画像を取得する取得ステップと、
上記取得ステップで取得した奥行き画像における奥行き値の出現数の分布を作成する奥行き値分布作成ステップと、
上記奥行き値分布作成ステップで作成した奥行き値分布を、該分布における奥行き値の連続性に応じて複数の区間に分割する奥行き値分布分割ステップと、
上記奥行き値分布分割ステップで分割した奥行き値分布の各区間の代表値を決定する代表値決定ステップと、
上記奥行き値分布分割ステップで分割した奥行き値分布の各区間に含まれる奥行き値を、上記代表値決定ステップで決定した代表値に変換することにより上記奥行き画像を変換する画像変換ステップと、を含むことを特徴とする画像変換装置の制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010146316A JP4806088B1 (ja) | 2010-06-28 | 2010-06-28 | 画像変換装置、画像変換装置の制御方法、画像変換装置制御プログラムおよび記録媒体 |
PCT/JP2011/059961 WO2012002033A1 (ja) | 2010-06-28 | 2011-04-22 | 画像変換装置、画像変換装置の制御方法、画像変換装置制御プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010146316A JP4806088B1 (ja) | 2010-06-28 | 2010-06-28 | 画像変換装置、画像変換装置の制御方法、画像変換装置制御プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4806088B1 JP4806088B1 (ja) | 2011-11-02 |
JP2012010255A true JP2012010255A (ja) | 2012-01-12 |
Family
ID=45044112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010146316A Expired - Fee Related JP4806088B1 (ja) | 2010-06-28 | 2010-06-28 | 画像変換装置、画像変換装置の制御方法、画像変換装置制御プログラムおよび記録媒体 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4806088B1 (ja) |
WO (1) | WO2012002033A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012147740A1 (ja) * | 2011-04-25 | 2012-11-01 | シャープ株式会社 | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
KR20150003056A (ko) * | 2013-06-28 | 2015-01-08 | 엘지디스플레이 주식회사 | 3d 변환방법과 이를 이용한 입체영상 표시장치 |
WO2015037473A1 (ja) * | 2013-09-11 | 2015-03-19 | ソニー株式会社 | 画像処理装置および方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101603414B1 (ko) * | 2014-03-28 | 2016-03-15 | 경희대학교 산학협력단 | 깊이 정보를 이용한 비디오 부호화 장치 및 그 방법 |
WO2019167453A1 (ja) * | 2018-02-28 | 2019-09-06 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4348028B2 (ja) * | 2001-06-12 | 2009-10-21 | 株式会社リコー | 画像処理方法、画像処理装置、撮像装置及びコンピュータプログラム |
US7403201B2 (en) * | 2003-01-20 | 2008-07-22 | Sanyo Electric Co., Ltd. | Three-dimensional video providing method and three-dimensional video display device |
JP4909063B2 (ja) * | 2006-12-28 | 2012-04-04 | キヤノン株式会社 | 撮像装置及び画像記録方法 |
-
2010
- 2010-06-28 JP JP2010146316A patent/JP4806088B1/ja not_active Expired - Fee Related
-
2011
- 2011-04-22 WO PCT/JP2011/059961 patent/WO2012002033A1/ja active Application Filing
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012147740A1 (ja) * | 2011-04-25 | 2012-11-01 | シャープ株式会社 | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
KR20150003056A (ko) * | 2013-06-28 | 2015-01-08 | 엘지디스플레이 주식회사 | 3d 변환방법과 이를 이용한 입체영상 표시장치 |
KR102126530B1 (ko) * | 2013-06-28 | 2020-06-25 | 엘지디스플레이 주식회사 | 3d 변환방법과 이를 이용한 입체영상 표시장치 |
WO2015037473A1 (ja) * | 2013-09-11 | 2015-03-19 | ソニー株式会社 | 画像処理装置および方法 |
US20160212406A1 (en) * | 2013-09-11 | 2016-07-21 | Sony Corporation | Image processing apparatus and method |
JPWO2015037473A1 (ja) * | 2013-09-11 | 2017-03-02 | ソニー株式会社 | 画像処理装置および方法 |
US10085008B2 (en) | 2013-09-11 | 2018-09-25 | Sony Corporation | Image processing apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP4806088B1 (ja) | 2011-11-02 |
WO2012002033A1 (ja) | 2012-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5241500B2 (ja) | カメラパラメータを利用した多視点動画符号化及び復号化装置並びに方法と、これを行うためのプログラムの記録された記録媒体 | |
JP7320352B2 (ja) | 三次元モデル送信方法、三次元モデル受信方法、三次元モデル送信装置及び三次元モデル受信装置 | |
JP6027034B2 (ja) | 立体映像エラー改善方法及び装置 | |
JP7277372B2 (ja) | 三次元モデル符号化装置、三次元モデル復号装置、三次元モデル符号化方法、および、三次元モデル復号方法 | |
JP6283108B2 (ja) | 画像処理方法及び装置 | |
JP5977752B2 (ja) | 映像変換装置およびそれを利用するディスプレイ装置とその方法 | |
EP2299726B1 (en) | Video communication method, apparatus and system | |
KR101340911B1 (ko) | 다중 뷰들의 효율적인 인코딩 방법 | |
JP2013527646A5 (ja) | ||
CN112738534B (zh) | 数据处理方法及系统、服务器和存储介质 | |
KR20190038664A (ko) | 비디오 데이터의 콘텐츠 기반 스트림 분할 | |
JP4806088B1 (ja) | 画像変換装置、画像変換装置の制御方法、画像変換装置制御プログラムおよび記録媒体 | |
WO2019107181A1 (ja) | 送信装置、送信方法、および受信装置 | |
US20220342365A1 (en) | System and method for holographic communication | |
WO2012060156A1 (ja) | 多視点画像符号化装置及び多視点画像復号装置 | |
Hinds et al. | Toward the realization of six degrees-of-freedom with compressed light fields | |
CN104284193A (zh) | 编码装置和编码方法、以及解码装置和解码方法 | |
JP2013128260A (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
JP4860763B2 (ja) | 画像符号化装置、画像符号化装置の制御方法、制御プログラムおよび記録媒体 | |
JP4815004B2 (ja) | 多視点画像符号化装置 | |
CN112738009B (zh) | 数据同步方法、设备、同步系统、介质和服务器 | |
Dehkordi | 3D Video Quality Assessment | |
CN112734821B (zh) | 深度图生成方法、计算节点及计算节点集群、存储介质 | |
US20230245377A1 (en) | Information processing apparatus, information processing method, and program | |
Zhang et al. | A 3D subjective quality prediction model based on depth distortion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110811 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |