WO2012153447A1

WO2012153447A1 - 画像処理装置、映像処理方法、プログラム、集積回路

Info

Publication number: WO2012153447A1
Application number: PCT/JP2012/001266
Authority: WO
Inventors: 航太郎箱田; 雅文大久保; 山地　治
Original assignee: パナソニック株式会社
Priority date: 2011-05-11
Filing date: 2012-02-24
Publication date: 2012-11-15
Also published as: CN102884803A; US20130100123A1; JPWO2012153447A1

Abstract

　傾き算出部２０３は、視聴者の顔の傾きを算出する。ステレオ画像再生成部２０６は、算出した視聴者の顔の傾きと深度情報（デプスマップ）に基づき、原画像を構成する各画素を水平方向および垂直方向にシフトし、画像のズレ方向（視差方向）と左目と右目を結ぶ方向が一致したステレオ画像を生成する。

Description

画像処理装置、映像処理方法、プログラム、集積回路

　本発明は、画像処理技術に関し、特に立体視画像の生成技術に関する。

　近年、両眼網膜像差を利用した立体視画像表示技術が注目を集めている。人間は左目の網膜像と右目の網膜像の違いにより立体を知覚することから、視聴者の左目と右目に視差がある画像（左目用画像・右目用画像）を独立して入射させることにより、両眼の網膜に生じる物体像にズレを生じさせ、奥行きを感じさせる技術である。

　上記の立体視画像表示に用いられる左目用画像と右目用画像は、水平方向（横方向）に離れた複数位置から被写体を撮影することにより生成される。また特許文献１には、入力画像から視差を算出し、算出した視差量だけ画像を水平方向にずらし、左目用画像と右目用画像を生成する技術が開示されている。

特開２００５－０２０６０６号公報

　上記従来技術はいずれも、左目と右目は水平方向に離れて位置するとの前提のもとに、水平方向の視差を有する左目用画像・右目用画像を生成するものである。視聴者が正常な姿勢で上記の左目用画像・右目用画像を視聴する場合は問題ない。しかし、視聴者の頭部が左右へ傾いた状態で上記の左目用画像・右目用画像を視聴した場合、画像のズレ方向（視差方向）と左目と右目を結ぶ方向が一致しないため、左目の網膜像と右目の網膜像には縦方向のズレが生じる。両眼網膜像の縦方向のズレは人間にとって経験のない刺激であり、視覚疲労の原因となる。また、左目用画像と右目用画像を別々の画像と認識してしまい、立体融合が困難となる。

　映画館等では、視聴者の席が固定されており、視聴者は正常な姿勢で左目用画像・右目用画像を視聴するため、上記の問題は生じない。しかし家庭内での立体視画像の視聴においては、様々な姿勢での視聴が考えられ、網膜像の縦ズレに起因する視覚疲労や立体融合の困難が生じる恐れがある。ラフな姿勢（例えば、机に肘をついて手にあごを載せた状態）で立体視画像を視聴したいというニーズがあり、立体視画像の視聴にあたり視聴姿勢が固定されるのでは、ユーザ利便性に欠く。

　本発明は上記事情に鑑みなされたものであり、視聴者が左右に傾いた状態での立体視画像の視聴を可能とする画像処理装置を提供することを目的とする。

　上記目的を達成するため、本発明にかかる画像処理装置は、画像データに画像処理を行う画像処理装置であって、視聴者の顔の傾きを算出する傾き算出部と、前記画像データに写る被写体の奥行き方向の位置を示す深度情報を生成する深度情報生成部と、前記画像データを構成する各画素の座標を、横方向および縦方向に所定の量シフトすることにより、前記画像データとは異なる視点の画像データを生成し、前記画像データと前記画像データとは異なる視点の画像データの組からなるステレオ画像データを生成するステレオ画像データ生成部とを備え、前記横方向および縦方向の所定のシフト量は、前記深度情報および前記視聴者の顔の傾きにより定まることを特徴とする。

　本発明によれば、画像データを構成する各画素を、深度情報および視聴者の顔の傾きにより定まる量、横方向および縦方向にシフトし、ステレオ画像データを生成するので、視聴者の頭部が左右へ傾いた状態において、画像のズレ方向（視差方向）と左目と右目を結ぶ方向が一致した立体視画像を生成することができる。視聴者が頭部を左右に傾けて立体視画像を視聴した場合においても、左目の網膜像と右目の網膜像には水平方向（横方向）のみのズレが生じ、垂直方向（縦方向）のズレは生じないので、網膜像の縦ズレに起因する視覚疲労や立体融合の困難が生じず、視聴者に快適な立体視を提供することができる。また、立体視視聴における視聴姿勢の自由度を高めることができるので、ユーザ利便性を向上させることができる。

実施の形態１にかかる画像処理装置が行う処理の概要を示す図である。実施の形態１にかかる画像処理装置２００の構成の一例を示すブロック図である。視聴者の顔の傾きの算出を示す図である。飛出し立体視の場合の画素シフトを示す図である。引っ込み立体視の場合の画素シフトを示す図である。表示画面の縦方向、横方向の１画素あたりの長さを示す図である。ステレオ画像格納部２０７の格納形式の一例を示す図である。本実施の形態にかかる画像処理装置のハードウェア構成の一例を示す図である。深度情報生成処理の流れを示すフローチャートである。ステレオ画像生成・表示処理の流れを示すフローチャートである。傾き算出処理の流れを示すフローチャートである。ステレオ画像再生成処理の流れを示すフローチャートである。実施の形態２にかかる画像処理装置１３００の構成の一例を示すブロック図である。ＩＲ受信部１３０１による傾き情報の取得を示す図である。実施の形態２における傾き算出処理の流れを示すフローチャートである。実施の形態３にかかる画像処理装置１６００の構成の一例を示すブロック図である。本発明にかかる画像処理装置を備えた携帯端末を示す図である。

　以下、本発明の実施の形態について、図面を参照しながら説明する。
≪実施の形態１≫
　＜概要＞
　図１は、実施の形態１にかかる画像処理装置が行う処理の概要を示す図である。本図に示されるように、画像処理装置は、カメラから視聴者の顔画像を取得し、顔画像の画像解析により視聴者の顔の傾きを算出する。また、入力画像から被写体の奥行き方向の位置を示す深度情報（デプスマップ）を生成する。そして、顔の傾きと深度情報（デプスマップ）に基づき、原画像を構成する各画素を水平方向および垂直方向にシフトすることによりステレオ画像を生成する。

　このように、水平方向だけでなく、顔の傾きに応じて垂直方向に画素をシフトすることにより、左目と右目を結ぶ方向と画像のズレ方向（視差方向）とが一致した、視聴者にとって最適な視差方向を有するステレオ画像を生成することができる。

　＜構成＞
　まず、実施の形態１にかかる画像処理装置２００の構成について説明する。図２は、画像処理装置２００の構成の一例を示すブロック図である。本図に示されるように、画像処理装置２００は、操作入力受付部２０１、顔画像取得部２０２、傾き算出部２０３、ステレオ画像取得部２０４、深度情報生成部２０５、ステレオ画像再生成部２０６、ステレオ画像格納部２０７、出力部２０８を含んで構成される。以下、各構成部について説明する。

　＜操作入力受付部２０１＞
　操作入力受付部２０１は、視聴者の操作入力を受け付ける機能を有する。具体的には、立体視コンテンツの再生命令等を受け付ける。

　＜顔画像取得部２０２＞
　顔画像取得部２０２は、外部の撮像装置により撮影された視聴者の顔画像を取得する機能を有する。

　＜傾き算出部２０３＞
　傾き算出部２０３は、顔画像取得部２０２で取得した視聴者の顔画像を解析し、視聴者の顔の傾きを算出する機能を有する。具体的には、顔画像から特徴点を検出し、特徴点の位置関係から視聴者の顔の傾きを算出する。なお、視聴者の顔の傾きとは表示ディスプレイ面に対して平行な平面上の傾きをいう。

　特徴点とは、画像の境目や角といった特徴を点化したものであり、本実施の形態では、エッジ（輝度が鋭敏に変化している箇所）またはエッジの交点箇所をいう特徴点として抽出する。エッジの検出は、画素間の輝度の差分（一次微分）を求め、その差分からエッジ強度を算出することにより行う。なお、その他のエッジ検出方法により特徴点を抽出してもよい。

　図３は、視聴者の顔の傾きの算出を示す図である。本図に示す例では、特徴点抽出により目を検出し、両目の位置関係（Δｘ，Δｙ）を算出する。そして、視聴者の顔の傾きαを、α＝ａｒｃｔａｎ（Δｙ÷Δｘ）の数式により算出する。なお、目以外の特徴部位（３Ｄメガネ、鼻、口等）を検出し、その位置関係から顔の傾きを検出してもよい。

　＜ステレオ画像取得部２０４＞
　ステレオ画像取得部２０４は、同解像度の左目用画像と右目用画像の組みからなるステレオ画像を取得する機能を有する。ステレオ画像は、異なる視点から被写界を撮像して得られる画像であり、例えばステレオカメラ等の撮像装置で撮像された画像データであってもよい。また、外部のネットワーク、サーバ、記録媒体等から、取得された画像データであってもよい。また実写画像に限らず、異なる仮想視点を想定して作成したＣＧ（Computer Graphics）等であってもよい。また、静止画像であっても、時間的に連続する複数の静止画像を含む動画像であってもよい。

　＜深度情報生成部２０５＞
　深度情報生成部２０５は、ステレオ画像取得部２０４で取得したステレオ画像から被写体の奥行き方向の位置を示す深度情報（デプスマップ）を生成する機能を有する。具体的には、まずステレオ画像を構成する左目用画像・右目用画像間の各画素について対応点探索を行う。そして、左目用画像と右目用画像の対応点の位置関係から、三角測量の原理に基づき、被写体の奥行き方向の距離を算出する。深度情報（デプスマップ）は、各画素の奥行きを８ビットの輝度で表したグレースケール画像であり、深度情報生成部２０５は、算出した被写体の奥行き方向の距離を０～２５５までの２５６階調の値に変換する。なお、対応点探索には、注目点の周りに小領域を設け、その領域中の画素値の濃淡パターンに基づいて行う領域ベースマッチング手法と、画像からエッジなど特徴を抽出し、その特徴間で対応付けを行う特徴ベースマッチングの２つに大きく大別されるが、何れの手法を用いてもよい。

　＜ステレオ画像再生成部２０６＞
　ステレオ画像再生成部２０６は、顔の傾きと深度情報に基づき、ステレオ画像取得部２０４で取得した左目用画像を構成する各画素を水平方向および垂直方向にシフトすることにより左目用画像に対応する右目画像を生成する機能を有する。なおステレオ画像再生成部２０６は、画素シフト処理の前に、画像データの属性情報を参照して画像データの向き（撮影方向）の判別をおこない、その向きに応じて回転処理を行った後、画素シフト処理を行う。例えば画像データがＪＰＥＧ（Joint Photographic Experts Group）形式の場合、Ｅｘｉｆ（Exchangeable image file format）情報に格納されているＯｒｉｅｎｔａｔｉｏｎタグを属性情報として用いる。Ｏｒｉｅｎｔａｔｉｏｎタグは、行と列の観点から見た画像データの方向を示す情報であり、この値を参照して、画像データの縦横の向きを判別することができる。例えばＯｒｉｅｎｔａｔｉｏｎタグの値が６（時計回りに９０°回転）の場合、画像データを９０°回転させてから、画素シフト処理を行う。以下では、画素シフトの詳細について説明する。

　図４、図５は、本実施の形態にかかる画素シフトを示す図である。立体視効果には、飛び出し効果をもたらすもの（飛出し立体視）と、引っ込み効果をもたらすもの（引っ込み立体視）とがあり、図４は飛出し立体視の場合の画素シフト、図５は引っ込み立体視の場合の画素シフトを示す。これらの図において、Ｐｘは水平方向へのシフト量、Ｐｙは垂直方向へのシフト量、L-View-Pointは左目瞳孔位置、R-View-Pointは右目瞳孔位置、L-Pixelは左目画素、R-Pixelは右目画素、ｅは瞳孔間距離、αは視聴者の傾き角度、Ｈは表示画面の高さ、Ｗは表示画面の横幅、Ｓは視聴者から表示画面までの距離、Ｚは視聴者から結像点までの距離、すなわち被写体の奥行き方向の距離を示す。左目画素L-pixelと左目瞳孔L-view-pointとを結ぶ直線は左目瞳孔L-view-pointの視線、右目画素R-Pixelと右目瞳孔R-View-Pointとを結ぶ直線は右目瞳孔R-View-Pointの視線であり、３Ｄメガネによる透光・遮光の切り替えや、パララックスバリア、レンティキュラレンズ等を用いた視差障壁によって実現される。ここで、R-view-pointがL-view-pointより、上方向に位置する場合αを正の値とし、R-view-pointがL-view-pointより、下方向に位置する場合αを負の値とする。また、右目画素R-pixel・左目画素L-pixelが図４の位置関係にある場合のＰｘを負の値とし、図５の位置関係にある場合のＰｘを正の値とする。

　まず、表示画面の高さＨ、表示画面の横幅Ｗについて考える。表示画面がＸ型のテレビである場合を考えると、テレビの型数は画面の対角線の長さ（インチ）で表されるため、テレビの型数Ｘ、表示画面の高さＨ、表示画面の横幅Ｗとの間には、Ｘ²＝Ｈ²＋Ｗ²の関係が成り立つ。また表示画面の高さＨ、表示画面の横幅Ｗは、アスペクト比ｍ：ｎを用いて、Ｗ：Ｈ＝ｍ：ｎと表される。上記の関係式から、図４、図５に示される表示画面の高さＨは

表示画面の横幅Ｗは

で表され、テレビの型数Ｘの値とアスペクト比ｍ：ｎから算出することができる。なお、テレビの型数Ｘ、アスペクト比ｍ：ｎの情報は、外部ディスプレイとのネゴシエーションにより取得した値を用いる。以上が表示画面の高さＨ、表示画面の横幅Ｗの関係についての説明である。続いて、水平方向のシフト量、及び垂直方向のシフト量について説明する。

　まず、飛出し立体視の場合について説明する。図４（ａ）は視聴者が傾いていない姿勢における画素シフトを示す図、図４（ｂ）は視聴者がα度傾いた姿勢における画素シフトを示す図である。ステレオ画像再生成部２０６は、視聴者がα度傾いた場合、図４（ｂ）に示されるように、左目瞳孔L-view-pointと右目瞳孔R-View-Pointを結ぶ方向と画像のズレ方向（視差方向）とが一致するように、左目画素L-pixelをシフトする。左目用画像を構成する全画素に対して、かかる画素シフトを行うことにより、左目用画像に対応する右目画像を生成することができる。以下では、水平方向のシフト量、垂直方向のシフト量の具体的な計算式について説明する。

　図４（ａ）、図４（ｂ）を参照するに、左目瞳孔L-view-point、右目瞳孔R-View-Point、結像点の三点からなる三角形と、左目画素L-pixel、右目画素R-pixel、結像点の三点からなる三角形の相似関係から、視聴者が傾いていない場合の水平方向のシフト量Ｐｘ、被写体の距離Ｚ、視聴者から表示画面までの距離Ｓ、瞳孔間距離ｅとの間には

の関係が成り立つ。被写体の距離Ｚは深度情報（デプスマップ）から取得できる。また、瞳孔間距離ｅは、成人男性の平均値６．４ｃｍを採用する。また視聴者から表示画面までの距離Ｓは、最適な視聴距離が一般に表示画面の高さの３倍とされることから、３Ｈとする。

　ここで図６に示すように表示画面の縦方向の画素数をＬ、表示画面の横方向の画素数をＫとした場合、横方向の１画素あたりの長さは、表示画面の横幅Ｗ÷表示画面の横方向の画素数Ｋ、縦方向の１画素あたりの長さは、表示画面の高さＨ÷表示画面の縦方向の画素数Ｌとなる。また１インチは２．５４ｃｍである。従って、数３に示す視聴者が傾いていない場合の水平方向のシフト量Ｐｘを画素単位で示すと

となる。なお、表示画面の解像度（縦方向の画素数Ｌ、横方向の画素数Ｋ）の情報は、外部ディスプレイとのネゴシエーションにより取得した値を用いる。このように、上記数式に基づき、視聴者が傾いていない場合の水平方向のシフト量Ｐｘを算出することができる。

　続いて、視聴者がα度傾いた場合における水平方向へのシフト量Ｐｘ´、及び垂直方向のシフト量Ｐｙについて説明する。ステレオ画像再生成部２０６は、視聴者がα度傾いた場合、図４（ｂ）に示されるように、左目瞳孔L-view-pointと右目瞳孔R-View-Pointを結ぶ方向と画像のズレ方向（視差方向）とが一致するように左目画素L-pixelをシフトすることから、視聴者がα度傾いた場合における水平方向へのシフト量Ｐｘ´は、視聴者が傾いていない場合における水平方向へのシフト量Ｐｘにｃｏｓαを乗じた値となる。すなわち、視聴者がα度傾いた場合における水平方向へのシフト量Ｐｘ´は

となる。

　一方、垂直方向のシフト量Ｐｙは、図４（ｂ）を参照するに、視聴者が傾いていない場合における水平方向へのシフト量Ｐｘにｓｉｎαを乗じたものとなる。すなわち、垂直方向のシフト量Ｐｙは

となる。

　図５（ａ）、図５（ｂ）の引っ込み立体視の場合も上記の説明と同様の関係が成り立つ。すなわち、ステレオ画像再生成部２０６は、視聴者がα度傾いた場合、図５（ｂ）に示されるように、左目瞳孔L-view-pointと右目瞳孔R-View-Pointを結ぶ方向と画像のズレ方向（視差方向）とが一致するように、左目画素L-pixelを、水平方向に数５で定まるシフト量画素シフトし、垂直方向に数６で定まるシフト量画素シフトする。

　まとめると、ステレオ画像再生成部２０６は、被写体の奥行き方向の距離Ｚを深度情報（デプスマップ）から取得し、視聴者の顔の傾きαを傾き算出部２０３から取得する。そして、数５に示される関係式を用いて水平方向のシフト量を定め、数６に示される関係式を用いて垂直方向のシフト量を定め、左目用画像を構成する各画素をシフトする。これにより、視聴者の頭部が左右へ傾いた状態において、画像のズレ方向（視差方向）と左目と右目を結ぶ方向が一致した、視聴者にとって最適な視差方向を有するステレオ画像を生成することができる。

　＜ステレオ画像格納部２０７＞
　ステレオ画像格納部２０７は、ステレオ画像再生成部２０６で生成した左目用画像・右目用画像の組からなるステレオ画像を、視聴者の顔の傾きに関連付けて格納する機能を有する。図７は、ステレオ画像格納部２０７の格納形式の一例を示す図である。コンテンツＩＤは、３Ｄコンテンツを特定するためのＩＤである。３Ｄコンテンツの内容を一意に特定できるものであればよく、例えば３Ｄコンテンツの格納位置を示すディレクトリ名やＵＲＬ（Uniform Resource Locator）等であってもよい。本図に示される例では、コンテンツＩＤ“１１１１”のコンテンツに対して、傾き５度の条件でシフト処理を行い作成したＬ画像データ（左目用画像データ）を“ｘｘｘｘ１．ｊｐｇ”、Ｒ画像データ（右目用画像データ）を“ｘｘｘｘ２．ｊｐｇ”として格納している。なお、ここでは画像データをＪＰＥＧ形式で格納する例を示したが、ＢＭＰ（BitMaP）、ＴＩＦＦ（Tagged Image File Format）、ＰＮＧ（Portable Network Graphics）、ＧＩＦ（Graphics Interchange Format）、ＭＰＯ（Multi-Picture Format）等の形式で格納してもよい。

　このように、ステレオ画像再生成部２０６で生成した左目用画像、右目用画像を、視聴者の顔の傾きに関連付けて格納することにより、次に同条件の再生命令がなされた際に、再度画素シフト処理を行うことなく即座に表示することが可能となる。

　＜出力部２０８＞
　出力部２０８は、ステレオ画像データ格納部２０７に格納されているステレオ画像データを外部ディスプレイに出力する機能を有する。具体的には、出力部２０８は、ステレオ画像再生成部２０６が画素シフト処理を行う前に、コンテンツＩＤ及び視聴者の顔の傾きに一致するステレオ画像データが、ステレオ画像データ格納部２０７に格納されているか判定する。コンテンツＩＤ及び視聴者の顔の傾きに一致するステレオ画像データが格納されている場合、出力部２０８はそのステレオ画像データを外部ディスプレイに出力する。一致するステレオ画像データが格納されていない場合、出力部２０８はステレオ画像再生成部２０６によりステレオ画像データが生成されるのを待ち、ステレオ画像再生成部２０６によりステレオ画像データが生成されれば、そのステレオ画像データを外部ディスプレイに出力する。

　続いて、本実施の形態にかかる画像処理装置のハードウェア構成について説明する。上述した機能構成は、例えば、ＬＳＩを用いて具現化することができる。

　図８は、本実施の形態にかかる画像処理装置のハードウェア構成の一例を示す図である。本図に示されるように、ＬＳＩ８００は、例えば、ＣＰＵ８０１（中央処理装置：Central Processing Unit）、ＤＳＰ８０２（デジタル信号プロセッサ：Digital Signal Processor）、ＶＩＦ８０３（ビデオインターフェイス：Video Interface）、ＰＥＲＩ８０４（周辺機器インターフェイス：Peripheral Interface）、ＮＩＦ８０５（ネットワークインターフェイス：Network Interface）、ＭＩＦ８０６（メモリインターフェイス：Memory Interface）、ＢＵＳ８０７（バス）、ＲＡＭ／ＲＯＭ４１０８（ランダムアクセスメモリ／読み出し専用メモリ：Random Access Memory/Read Only Memory）を含んで構成される。

　上述した各機能構成が行う処理手順は、プログラムコードとしてＲＡＭ／ＲＯＭ４１０８に格納される。そして、ＲＡＭ／ＲＯＭ８０８に格納されたプログラムコードは、ＭＩＦ８０６を介して読み出され、ＣＰＵ８０１またはＤＳＰ８０２で実行される。これにより、上述した映像処理装置の機能を実現することができる。

　また、ＶＩＦ８０３は、カメラ８１３等の撮像装置や、ディスプレイ８１２等の表示装置と接続され、ステレオ画像の取得または出力を行う。また、ＰＥＲＩ８０４は、ＨＤＤ８１０（ハードディスクドライブ：Hard Disk Drive）等の記録装置や、Ｔｏｕｃｈ　Ｐａｎｅｌ８１１等の操作装置と接続され、これらの周辺機器の制御を行う。また、ＮＩＦ８０５は、ＭＯＤＥＭ８０９等と接続され、外部ネットワークとの接続を行う。

　以上が本実施の形態にかかる画像処理装置の構成についての説明である。続いて、上記構成を備える画像処理装置の動作について説明する。

　＜動作＞
　＜深度情報（デプスマップ）生成処理＞
　まず、深度情報生成部２０５による深度情報（デプスマップ）生成処理について説明する。図９は、深度情報生成処理の流れを示すフローチャートである。本図に示されるように、深度情報生成部２０５はまず、ステレオ画像取得部２０４から左目用画像、右目用画像を取得する（ステップＳ９０１）。次に、深度情報生成部２０５は、左目用画像を構成する画素に対応する画素を右目用画像から探索する（ステップＳ９０２）。そして、深度情報生成部２０５は、左目用画像と右目用画像の対応点の位置関係から、三角測量の原理に基づき、被写体の奥行き方向の距離を算出する（ステップＳ９０３）。以上のステップＳ９０２、ステップＳ９０３の処理を左目用画像を構成する全ての画素に対して行う。

　左目用画像を構成する全ての画素に対して、ステップＳ９０２、ステップＳ９０３の処理を終えた後、深度情報生成部２０５は、ステップＳ９０３の処理で得られた被写体の奥行き方向の距離の情報を８ビット量子化する（ステップＳ９０４）。具体的には、算出した被写体の奥行き方向の距離を０～２５５までの２５６階調の値に変換し、各画素の奥行きを８ビットの輝度で表したグレースケール画像を生成する。

　以上が、深度情報生成部２０５による深度情報（デプスマップ）生成処理についての説明である。続いて、画像処理装置２００によるステレオ画像生成・表示処理について説明する。

　＜ステレオ画像生成・表示処理＞
　図１０は、ステレオ画像生成・表示処理の流れを示すフローチャートである。本図に示されるように、操作入力受付部２０１は、コンテンツの表示指示の有無の判定を行う（ステップＳ１００１）。コンテンツの表示指示がない場合、コンテンツの表示指示があるまで待機する（ステップＳ１００１、ＮＯ）。コンテンツの表示指示がある場合（ステップＳ１００１、ＹＥＳ）、傾き算出処理を行う（ステップＳ１００２）。傾き算出処理の詳細は後述する。

　傾き算出処理の後、出力部２０８は、ステレオ画像格納部２０７に格納されている画像データのうち、表示指示があったコンテンツのコンテンツＩＤ、及び傾き算出処理で算出した視聴者の顔の傾きに一致する画像データが存在するか否かを判定する（ステップＳ１００３）。コンテンツＩＤ及び顔の傾きが一致する画像データがある場合（ステップＳ１００３、ＹＥＳ）、出力部２０８はその画像データをディスプレイに出力する（ステップＳ１００４）。コンテンツＩＤ及び顔の傾きが一致する画像データがない場合（ステップＳ１００３、ＮＯ）、ステレオ画像再生成部２０６によるステレオ画像再生成処理を行う（ステップＳ１００５）。ステレオ画像再生成処理の詳細は後述する。ステレオ画像再生成処理の後、出力部２０８は再生成した画像データをディスプレイに出力する（ステップＳ１００６）。

　以上が、画像処理装置２００によるステレオ画像生成・表示処理についての説明である。続いて、ステップＳ１００２の傾き算出処理の詳細について説明する。

　＜傾き算出処理＞
　図１１は、傾き算出処理（ステップＳ１００２）の流れを示すフローチャートである。本図に示されるように、まず顔画像取得部２０２は、外部の撮像装置から視聴者の顔画像を取得する（ステップＳ１１０１）。次に傾き算出部２０３は、取得した視聴者の顔画像から特徴点を抽出する（ステップＳ１１０２）。本実施の形態では、顔画像から目の特徴点を抽出する。特徴点の抽出の後、傾き算出部２０３は、特徴点を解析し、両目の位置関係から視聴者の顔の傾きαを算出する（ステップＳ１１０３）。以上が、ステップＳ１００２の傾き算出処理についての説明である。続いて、ステップＳ１００５のステレオ画像再生成処理の詳細について説明する。

　＜ステレオ画像再生成処理＞
　図１２は、ステレオ画像再生成処理（ステップＳ１００５）の流れを示すフローチャートである。本図に示されるように、まずステレオ画像再生成部２０６は、ステレオ画像データを取得する（ステップＳ１２０１）。次にステレオ画像再生成部２０６は、取得したステレオ画像データに撮影方向を示す属性情報があるか否か判定する（ステップＳ１２０２）。画像データがＪＰＥＧ（Joint Photographic Experts Group）形式の場合、Ｅｘｉｆ（Exchangeable image file format）情報に格納されているＯｒｉｅｎｔａｔｉｏｎタグを参照する。撮影方向を示す属性情報がある場合（ステップＳ１２０２、ＹＥＳ）、属性情報に基づき左目用画像に回転処理を行う（ステップＳ１２０３）。

　続いてステレオ画像再生成部２０６は、深度情報生成部２０５が生成した深度情報、及び傾き算出部２０３が算出した視聴者の顔の傾きを取得する（ステップＳ１２０４）。深度情報、視聴者の傾き情報の取得後、ステレオ画像再生成部２０６は、左目用画像の各画素について、深度情報と視聴者の顔の傾きに基づき、横座標方向および縦座標方向のシフト量を算出する（ステップＳ１２０５）。具体的には、数５に示される計算式を用いて横座標方向のシフト量を算出し、数６に示される計算式を用いて縦座標方向のシフト量を算出する。

　シフト量の算出の後、ステレオ画像再生成部２０６は、左目用画像の各画素を画素シフトすることにより、右目用画像を生成する（ステップＳ１２０６）。左目用画像・右目用画像の再生成の後、ステレオ画像再生成部２０６は、再生成した左目用画像・右目用画像を再生成に用いた視聴者の顔の傾きに関連付けて、ステレオ画像格納部２０７に格納する（ステップＳ１２０７）。以上が、ステップＳ９０５のステレオ画像再生成処理についての説明である。

　以上のように本実施の形態によれば、視聴者の顔の傾きと深度情報（デプスマップ）に基づき、原画像を構成する各画素を水平方向および垂直方向にシフトし、ステレオ画像を再生成するので、視聴者の頭部が左右へ傾いた状態において、画像のズレ方向（視差方向）と左目と右目を結ぶ方向が一致した、視聴者にとって最適な視差方向を有する立体視画像を生成することができる。視聴者が頭部を左右に傾けて立体視画像を視聴した場合においても、左目の網膜像と右目の網膜像には水平方向のみのズレが生じ、垂直方向のズレは生じないので、網膜像の縦ズレに起因する視覚疲労や立体融合の困難が生じず、視聴者に快適な立体視を提供することができる。
≪実施の形態２≫
　実施の形態２にかかる画像処理装置は、実施の形態１にかかる画像処理装置２００と同様に、入力画像から被写体の奥行き方向の位置を示す深度情報（デプスマップ）を生成し、顔の傾きと深度情報（デプスマップ）に基づき、原画像を構成する各画素を水平方向および垂直方向にシフトすることによりステレオ画像を生成する画像処理装置であるが、視聴者の顔の傾きの算出方法が異なる。実施の形態２にかかる画像処理装置は、傾きセンサを備えた３Ｄメガネから３Ｄメガネの傾きを受信し、その３Ｄメガネの傾きから視聴者の顔の傾きを算出する。これにより、視聴者の顔画像の解析をすることなく、視聴者の顔の傾きを算出することができる。

　図１３は、実施の形態２にかかる画像処理装置１３００の構成の一例を示すブロック図である。なお、図２に示す実施の形態１にかかる画像処理装置２００の構成と同じ部分については、同符号を付す。本図に示されるように、画像処理装置１３００は、ＩＲ受信部１３０１、傾き算出部１３０２、操作入力受付部２０１、ステレオ画像取得部２０４、深度情報２０５、ステレオ画像再生成部２０６、ステレオ画像格納部２０７、出力部２０８を含んで構成される。

　ＩＲ受信部１３０１は、傾きセンサを備えた３Ｄメガネから３Ｄメガネの傾き情報を受信する機能を有する。図１４は、ＩＲ受信部１３０１による傾き情報の取得を示す図である。

　本図に示されるように、３Ｄメガネには傾きセンサが内蔵されている。ここで３Ｄメガネとは、偏光フィルタを用いて左眼用画像・右目用画像を分離する偏光メガネや、左右の視界を交互に遮蔽する液晶シャッターを用いて左眼用画像・右目用画像を分離する液晶シャッターメガネ等をいう。傾きセンサは、３Ｄメガネの３軸方向の回転角度、回転方向をセンサ情報として検出する。検出したセンサ情報は、３ＤメガネのＩＲ発信部により、センサ情報を赤外線として発信する。そしてＩＲ受信部１３０１は、３ＤメガネのＩＲ発信部により発信された赤外線信号を受信する。

　傾き算出部１３０２は、ＩＲ受信部１３０１が取得したセンサ情報に基づき、視聴者の顔の傾きを算出する機能を有する。具体的には、３Ｄメガネの回転角度、回転方向から視聴者の顔の傾きαを算出する。なお、顔の傾きαは表示ディスプレイ面に対して平行な平面上の傾きである。

　操作入力受付部２０１、ステレオ画像取得部２０４、深度情報２０５、ステレオ画像再生成部２０６、ステレオ画像格納部２０７、出力部２０８については、実施の形態１にかかる画像処理装置２００と同じ構成であり、説明を略する。

　続いて、実施の形態１と異なる傾き算出処理について説明する。図１５は、傾き算出処理の流れを示すフローチャートである。本図に示されるように、傾き算出部１３０２は、ＩＲ受信部１３０１が受信したセンサ情報を取得する（ステップＳ１５０１）。センサ情報は、３Ｄメガネに内像された傾きセンサが検出する３Ｄメガネの３軸方向の回転角度、回転方向の情報である。センサ情報の取得後、傾き算出部１３０２は、センサ情報に基づき視聴者の顔の傾きαを算出する（ステップＳ１５０２）。以上が、実施の形態２における視聴者の顔の傾き算出処理についての説明である。

　以上のように本実施の形態によれば、傾きセンサを備えた３Ｄメガネから３Ｄメガネの傾きを受信し、その３Ｄメガネの傾きから視聴者の顔の傾きを算出するので、視聴者の顔画像の解析をすることなく、視聴者の顔の傾きを算出することができ、その結果より高速に視聴者の顔の傾きに応じたステレオ画像の再生成・表示を行うことができる。
≪実施の形態３≫
　実施の形態３にかかる画像処理装置は、実施の形態１にかかる画像処理装置２００と同様に、視聴者の顔の傾きを算出し、顔の傾きと深度情報（デプスマップ）に基づき、原画像を構成する各画素を水平方向および垂直方向にシフトすることによりステレオ画像を生成する画像処理装置であるが、入力画像が異なる。実施の形態１にかかる画像処理装置２００は、入力画像が左目用画像・右目用画像の組みからなるステレオ画像に対して、実施の形態３にかかる画像処理装置は、入力画像が単眼画像である。すなわち、実施の形態３にかかる画像処理装置は、外部の単眼カメラ等の撮像装置により撮像された単眼画像から、視聴者の顔の傾きに応じたステレオ画像を生成する画像処理装置である。

　図１６は、実施の形態３にかかる画像処理装置１６００の構成の一例を示すブロック図である。図２に示す実施の形態１にかかる画像処理装置２００の構成と同じ部分については、同符号を付す。本図に示されるように、画像処理装置１６００は、画像取得部１６０１、深度情報生成部１６０２、操作入力受付部２０１、顔画像取得部２０２、傾き算出部２０３、ステレオ画像再生成部２０６、ステレオ画像格納部２０７、出力部２０８を含んで構成される。

　画像取得部１６０１は、単眼画像を取得する機能を有する。ここで取得された単眼画像が、ステレオ画像再生成部２０６の画素シフト処理の対象となる。単眼画像は、例えば単眼カメラ等の撮像装置により撮像された画像データであってもよい。また実写画像に限らず、ＣＧ（Computer Graphics）等であってもよい。また、静止画像であっても、時間的に連続する複数の静止画像を含む動画像であってもよい。

　深度情報生成部１６０２は、画像取得部１６０１で取得した単眼画像の深度情報（デプスマップ）を生成する機能を有する。深度情報は、例えばＴＯＦ（Time Of Flight）型距離センサ等の距離センサにより各被写体の距離を計測し、生成する。また、外部のネットワーク、サーバ、記録媒体等から、単眼画像と共に取得するものであってもよい。また、画像取得部１６０１で取得した単眼画像を解析し、深度情報を生成するものであってもよい。具体的には、まず画像を「スーパーピクセル」と呼ばれる色、明るさなどの属性がきわめて均質な画素集合に分け、このスーパーピクセルを隣接するスーパーピクセルと比較し、テクスチャーのグラデーションなどの変化を分析することによって、被写体の距離を推定する。

　操作入力受付部２０１、顔画像取得部２０２、傾き算出部２０３、ステレオ画像再生成部２０６、ステレオ画像格納部２０７、出力部２０８については、実施の形態１にかかる画像処理装置２００と同じ構成であり、説明を略する。

　以上のように本実施の形態によれば、外部の単眼カメラ等の撮像装置により撮像された単眼画像から、視聴者の顔の傾きに応じたステレオ画像を生成することができる。

　＜補足＞
　なお、上記の実施の形態に基づいて説明してきたが、本発明は上記の実施の形態に限定されないことはもちろんである。以下のような場合も本発明に含まれる。

　（ａ）本発明は、各実施形態で説明した処理手順が開示するアプリケーション実行方法であるとしてもよい。また、前記処理手順でコンピュータを動作させるプログラムコードを含むコンピュータプログラムであるとしてもよい。

　（ｂ）本発明は、上記各実施の形態に記載の画像処理装置を制御するＬＳＩとしても実施可能である。このようなＬＳＩは、傾き算出部２０３、深度情報生成部２０５、ステレオ画像再生成部２０６等の各機能ブロックを集積化することで実現できる。これらの機能ブロックは、個別に１チップ化されても良いし、一部または全てを含むように１チップ化されてもよい。

　ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

　また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または、汎用プロセッサで実現してもよい。ＬＳＩ製造後にプログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

　さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロック及び部材の集積化を行ってもよい。このような技術には、バイオ技術の適用等が可能性としてありえる。

　（ｃ）上記実施の形態では、据え置きのディスプレイ（図１等）にステレオ画像を出力・表示する場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、ステレオ画像を出力するディスプレイが、携帯端末等のディスプレイであってもよい。図１７は、本発明にかかる画像処理装置を備えた携帯端末を示す図である。本図に示されるように、携帯端末におけるステレオ画像の視聴においては、視聴者の姿勢が傾いていない場合であっても、携帯端末を左右に傾けた結果、画像のズレ方向（視差方向）と左目と右目を結ぶ方向が一致せず、左目の網膜像と右目の網膜像には縦方向のズレが生じる場合がある。このため、網膜像の縦ズレに起因する視覚疲労や立体融合の困難が生じるおそれがある。図１７に示されるように、携帯端末上にカメラを設け、そのカメラから視聴者の顔画像を取得し、解析を行うことで、携帯端末のディスプレイ面を基準とした相対角度を算出することができ、画像のズレ方向（視差方向）と左目と右目を結ぶ方向が一致した画像を生成することができる。また、携帯端末が傾きセンサを備え、携帯端末の傾きを検知する構成としてもよい。

　（ｄ）上記実施の形態では、対応点探索を画素単位で行う場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、対応点探索を画素ブロック単位（例えば４×４画素、１６×１６画素）で行ってもよい。

　（ｅ）上記実施の形態では、被写体の奥行き方向の距離を０～２５５までの２５６階調の値に変換し、各画素の奥行きを８ビットの輝度で表したグレースケール画像として深度情報（デプスマップ）を生成する場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、被写体の奥行き方向の距離を０～１２７までの１２８階調の値に変換してもよい。

　（ｅ）上記実施の形態では、左目用画像に対して画素シフト処理を行い、左目用画像対応する右目用画像を生成する場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、右目用画像に対して画素シフト処理を行い、右目用画像に対応する左目用画像を生成してもよい。

　（ｆ）上記実施の形態では、同解像度の左目用画像と右目用画像の組みからなるステレオ画像を取得する場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、左目用画像と右目用画像は解像度が異なる画像であってもよい。解像度が異なる画像間においても、解像度変換処理を行うことで、対応点探索による深度情報の生成が可能であり、高解像度の画像に対して画素シフト処理を行うことにより高解像度のステレオ画像を生成することができる。処理が重い深度情報の生成処理を低解像度の画像サイズで行うことができるため、処理の軽減が可能となる。また、撮像装置の一部を低性能の撮像装置とすることができ、低コスト化を図ることができる。

　（ｇ）上記実施の形態では、画像データの属性情報を参照して画像データの向き（撮影方向）の判別を行い、回転処理を行う場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、視聴者が画像データの向きを指定し、その指定された向きに基づき回転処理をおこなってもよい。

　（ｈ）上記実施の形態では、テレビの型数Ｘ、アスペクト比ｍ：ｎ、表示画面の解像度（縦方向の画素数Ｌ、横方向の画素数Ｋ）の情報を、外部ディスプレイとのネゴシエーションにより取得する場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、視聴者にテレビの型数Ｘ、アスペクト比ｍ：ｎ、表示画面の解像度（縦方向の画素数Ｌ、横方向の画素数Ｋ）の情報等を入力させるものであってもよい。

　（ｉ）上記実施の形態では、視聴者から表示画面までの距離Ｓを表示画面の高さＨの３倍（３Ｈ）とし、画素シフト量を算出する場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、ＴＯＦ（Time Of Flight）型センサ等の距離センサにより、視聴者から表示画面までの距離Ｓを算出してもよい。

　（ｊ）上記実施の形態では、瞳孔間距離ｅを成人男性の平均値６．４ｃｍとし、画素シフト量を算出する場合を説明したが、本発明は必ずしもこの場合に限定されない。例えば、顔画像取得部２０２が取得した顔画像から瞳孔間距離を算出してもよい。また、視聴者が大人であるか子供であるか、男性であるか女性であるかを判別し、それに応じた瞳孔間距離ｅに基づき画素シフト量を算出してもよい。

　（ｋ）上記実施の形態では、原画像の深度情報を用いて、ステレオ画像の再生成を行う場合を説明したが、本発明は必ずしもこの場合に限定されない。原画像のズレ量（視差）を用いて、ステレオ画像の再生成を行ってもよい。視聴者がα度傾いた場合における水平方向へのシフト量は、原画像のズレ量（視差）にｃｏｓαを乗じることで算出できる。また視聴者がα度傾いた場合における垂直方向へのシフト量は、原画像のズレ量（視差）にｓｉｎαを乗じることで算出できる。

　本発明にかかる画像処理装置によれば、視聴者の顔の傾きと深度情報（デプスマップ）に基づき、原画像を構成する各画素を水平方向および垂直方向にシフトし、画像のズレ方向（視差方向）と左目と右目を結ぶ方向が一致したステレオ画像を生成するので、視聴者の頭部が左右へ傾いた状態において、網膜像の縦ズレに起因する視覚疲労や立体融合の困難が生じない、視聴者に快適な立体視を提供することができ有益である。

　２００　画像処理装置
　２０１　操作入力受付部
　２０２　顔画像取得部
　２０３　傾き算出部
　２０４　ステレオ画像取得部
　２０５　深度情報生成部
　２０６　ステレオ画像再生成部
　２０７　ステレオ画像格納部
　２０８　出力部
　１３００　画像処理装置
　１３０１　ＩＲ受信部
　１３０２　傾き算出部
　１６００　画像処理装置
　１６０１　画像取得部
　１６０２　深度情報生成部

Claims

　画像データに画像処理を行う画像処理装置であって、
　視聴者の顔の傾きを算出する傾き算出部と、
　前記画像データに写る被写体の奥行き方向の位置を示す深度情報を生成する深度情報生成部と、
　前記画像データを構成する各画素の座標を、横方向および縦方向に所定の量シフトすることにより、前記画像データとは異なる視点の画像データを生成し、前記画像データと前記画像データとは異なる視点の画像データの組からなるステレオ画像データを生成するステレオ画像データ生成部とを備え、
　前記横方向および縦方向の所定のシフト量は、前記深度情報および前記視聴者の顔の傾きにより定まることを特徴とする画像処理装置。
　前記視聴者の顔の傾きを検出した際、その傾いた顔の両目に立体視効果を生じさせるための視差とは、画像データの水平軸に対して所定の傾きをもった視差であり、
　前記ステレオ画像データ生成部は、
　前記深度情報に示される奥行きと、顔の傾きを示す角度とを用いることで、所定の傾きをもった視差の算出を行い、当該所定の傾きをもった視差の画像データ上の水平成分を画素数に変換することで、横方向の所定のシフト量を取得し、当該所定の傾きをもった視差の垂直成分を画素数に変換することで、縦方向の所定のシフト量を取得する
　ことを特徴とする請求項１記載の画像処理装置。
　前記ステレオ画像データ生成部は、
　前記横方向の所定のシフト量を下記数式（１）により取得し、前記縦方向の所定のシフト量を下記数式（２）により取得することを特徴とする請求項２に記載の画像処理装置。

但し、前記数式（１）及び数式（２）において、Ｐｘ´は横方向のシフト量、Ｐｙは縦方向のシフト量、αは視聴者の顔の傾き、ｅは視聴者の瞳孔間距離、Ｓは視聴者から表示画面までの距離、Ｚは視聴者から被写体までの奥行き方向の距離、Ｋは表示画面の横方向の画素数、Ｗは表示画面の横方向のインチ数、Ｌは表示画面の縦方向の画素数、Ｈは表示画面の縦方向のインチ数を示す。
　前記傾き算出部は、視聴者の顔画像の特徴点を解析することにより視聴者の顔の傾きを算出することを特徴とする請求項１に記載の画像処理装置。
　前記傾き算出部は、視聴者が装着した３Ｄメガネの傾きから視聴者の顔の傾きを算出することを特徴とする請求項１に記載の画像処理装置。
　前記画像処理装置はさらに、
　前記ステレオ画像データを、生成に用いた視聴者の顔の傾きに関連付けて格納するステレオ画像データ格納部を備えることを特徴とする請求項１に記載の画像処理装置。
　前記画像処理装置はさらに、
　前記ステレオ画像を表示する表示部を備え、
　前記表示部は、前記ステレオ画像データ格納部から、前記傾き算出部が算出した視聴者の顔の傾きに対応するステレオ画像データを選択して表示することを特徴とする請求項６に記載の画像処理装置。
　前記傾き算出部により算出される視聴者の顔の傾きは、立体視画像の表示面に対して平行な平面上の傾きであることを特徴とする請求項１に記載の画像処理装置。
　画像データに画像処理を行う画像処理方法であって、
　視聴者の顔の傾きを算出する傾き算出ステップと、
　前記画像データに写る被写体の奥行き方向の位置を示す深度情報を生成する深度情報生成ステップと、
　前記画像データを構成する各画素の座標を、横方向および縦方向に所定の量シフトすることにより、前記画像データとは異なる視点の画像データを生成し、前記画像データと前記画像データとは異なる視点の画像データの組からなるステレオ画像データを生成するステレオ画像データ生成ステップとを備え、
　前記横方向および縦方向の所定のシフト量は、前記深度情報および前記視聴者の顔の傾きにより定まることを特徴とする画像処理方法。
　画像データに対する画像処理をコンピュータに実行させるプログラムであって、
　視聴者の顔の傾きを算出する傾き算出ステップと、
　前記画像データに写る被写体の奥行き方向の位置を示す深度情報を生成する深度情報生成ステップと、
　前記画像データを構成する各画素の座標を、横方向および縦方向に所定の量シフトすることにより、前記画像データとは異なる視点の画像データを生成し、前記画像データと前記画像データとは異なる視点の画像データの組からなるステレオ画像データを生成するステレオ画像データ生成ステップとをコンピュータに実行させ、
　前記横方向および縦方向の所定のシフト量は、前記深度情報および前記視聴者の顔の傾きにより定まることを特徴とするプログラム。
　画像データに対する画像処理に用いる集積回路であって、
　視聴者の顔の傾きを算出する傾き算出手段と、
　前記画像データに写る被写体の奥行き方向の位置を示す深度情報を生成する深度情報生成手段と、
　前記画像データを構成する各画素の座標を、横方向および縦方向に所定の量シフトすることにより、前記画像データとは異なる視点の画像データを生成し、前記画像データと前記画像データとは異なる視点の画像データの組からなるステレオ画像データを生成するステレオ画像データ生成手段とを備え、
　前記横方向および縦方向の所定のシフト量は、前記深度情報および前記視聴者の顔の傾きにより定まることを特徴とする集積回路。