JP6517245B2 - 三次元画像を生成するための方法及び機器 - Google Patents

三次元画像を生成するための方法及び機器 Download PDF

Info

Publication number
JP6517245B2
JP6517245B2 JP2016573527A JP2016573527A JP6517245B2 JP 6517245 B2 JP6517245 B2 JP 6517245B2 JP 2016573527 A JP2016573527 A JP 2016573527A JP 2016573527 A JP2016573527 A JP 2016573527A JP 6517245 B2 JP6517245 B2 JP 6517245B2
Authority
JP
Japan
Prior art keywords
image
dimensional
depth
generation unit
dimensional image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016573527A
Other languages
English (en)
Other versions
JP2017525210A (ja
JP2017525210A5 (ja
Inventor
パトリック ルク エルス バンドワール
パトリック ルク エルス バンドワール
バート クルーン
バート クルーン
クリスティアン ヴァーエカンプ
クリスティアン ヴァーエカンプ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2017525210A publication Critical patent/JP2017525210A/ja
Publication of JP2017525210A5 publication Critical patent/JP2017525210A5/ja
Application granted granted Critical
Publication of JP6517245B2 publication Critical patent/JP6517245B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/275Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/282Image signal generators for generating image signals corresponding to three or more geometrical viewpoints, e.g. multi-view systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/302Image reproducers for viewing without the aid of special glasses, i.e. using autostereoscopic displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/302Image reproducers for viewing without the aid of special glasses, i.e. using autostereoscopic displays
    • H04N13/305Image reproducers for viewing without the aid of special glasses, i.e. using autostereoscopic displays using lenticular lenses, e.g. arrangements of cylindrical lenses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/324Colour aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/349Multi-view displays for displaying three or more geometrical viewpoints without viewer tracking
    • H04N13/351Multi-view displays for displaying three or more geometrical viewpoints without viewer tracking for displaying simultaneously
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/398Synchronisation thereof; Control thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2213/00Details of stereoscopic systems
    • H04N2213/001Constructional or mechanical details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2213/00Details of stereoscopic systems
    • H04N2213/003Aspects relating to the "2D+depth" image format

Description

本発明は、三次元画像の処理に関し、排他的にではないが具体的には、オートステレオスコピックディスプレイ上に提示するための三次元画像の生成に関する。
三次元(3D:Three dimensional)ディスプレイは益々注目されており、視聴者に三次元の知覚を与える方法について著しい研究が行われている。3Dディスプレイは、視聴シーンの異なるビューを視聴者の2つの目に与えることによって視聴体験に第三次元を加える。異なるビューを与えることは、表示される2つのビューを分けるためのメガネを利用者に装着させることによって実現され得る。しかし、メガネを装着することは利用者にとって比較的不便であるため、異なるビューを直接生成し、それらを利用者の目に投影するオートステレオスコピックディスプレイを使用することが多くのシナリオで望ましい。実際にしばらくの間、様々な企業が三次元画像のレンダリングに適したオートステレオスコピックディスプレイを積極的に開発してきた。オートステレオスコピック装置は、専用のヘッドギア及び/又はメガネを必要とすることなしに3Dの印象を視聴者に与えることができる。
オートステレオスコピックディスプレイは、一般に異なる視角ごとに異なるビューを与える。このようにして、視聴者の左目用の第1の画像及び右目用の第2の画像が生成され得る。適切な、即ち左右の目それぞれの観点から適切な画像を表示することにより、視聴者に3Dの印象を伝えることができる。
オートステレオスコピックディスプレイは、ビューを分けるために、及びそれらのビューが利用者の目に個々に到達するようにそれらのビューを異なる方向に送るために、レンチキュラレンズ又はパララックスバリア/バリアマスク等の手段を使用する傾向がある。ステレオディスプレイでは2つのビューが必要であるが、殆どのステレオスコピックディスプレイは概して更に多くのビュー(例えば9個のビュー等)を利用する。
3D画像効果への要求を満たすために、捕捉シーンの3Dの側面を記述するデータを含むようにコンテンツが作成される。例えばコンピュータグラフィックスでは、所与の視聴位置からの画像を計算するために三次元モデルが開発され、使用され得る。かかる手法は、例えば3D効果を提供するコンピュータゲームで頻繁に使用される。
別の例として、映画又はテレビ番組等のビデオコンテンツが、幾らかの3D情報を含むように益々生成されている。かかる情報は、僅かにずれたカメラ位置から2つの同時画像を捕捉し、それにより立体画像を直接生成する専用の3Dカメラを使用して捕捉され得、又は例えば奥行も捕捉できるカメラによって捕捉され得る。
典型的には、オートステレオスコピックディスプレイはビューの「円錐域」を作り出し、各円錐域はシーンの異なる視角に対応する複数のビューを含む。隣接する(又は場合によっては更に隔てられた)ビュー間の視角差は、利用者の右目と左目との視角差に対応するように生成される。従って、左右の目が2つの適切なビューを見る利用者は3D効果を知覚することになる。視覚円錐域内に9個の異なるビューが生成されるかかるシステムの一例が図1に示されている。
多くのオートステレオスコピックディスプレイは、多数のビューを作成することができる。例えば、9個のビューを作成するオートステレオスコピックディスプレイも珍しくない。かかるディスプレイは、例えば数名の視聴者がディスプレイを同時に見ることができ、全員が3D効果を体験するマルチビューワーシナリオに適している。例えば28個の異なるビューを提供可能なディスプレイを含め、更に多数のビューを有するディスプレイも開発されている。かかるディスプレイは往々にして比較的狭いビュー円錐域を使用し、視聴者の目が複数のビューからの光を同時に受け付けることになり得る。更に、(図1の例にあるように)左右の目が典型的には隣接していないビュー内に位置する。
図2は、複数のサブピクセルから(3つのカラーチャネルを有する)3D画素を形成する一例を示す。この例では、wは水平サブピクセルのピッチであり、hは垂直サブピクセルのピッチであり、Nは単色パッチごとの平均サブピクセル数である。レンチキュラレンズがs=tanθだけ傾けられ、水平方向に測定されるピッチはサブピクセルピッチを単位にしてpである。3D画素内で、太線は色が異なるパッチ間の分離を示し、細線はサブピクセル間の分離を示す。別の有用な量は、サブピクセルアスペクト比:a=w/hである。その場合、N=a/sが成立する。RGBストライプパターン上の一般的な傾斜1/6のレンズでは、a=1/3及びs=1/6、そのためN=2である。
従来の2Dディスプレイでは、殆どの用途で画質が3Dディスプレイにとって最も重要であり、とりわけ例えば3Dテレビ又はモニタ等の消費者市場にとって非常に重要である。しかし、異なるビューを表現することは更なる複雑さ、及び潜在的な画像劣化をもたらす。
とりわけ、配信し処理するデータ量を管理可能な量に保つために、3Dコンテンツは概して非常に少数の2D画像に基づく形式で提供される。例えば3D画像データは、画素ごとの奥行を示す奥行マップによって支援される1つの視角に対応する単一の2D画像によって提供され得る。別の一般的な表現は2つの2D画像を提供し、2D画像の一方は視聴者の左目用であり、もう一方は視聴者の右目用である。
従って、三次元画像情報は典型的には圧縮形式で提供され、比較的少数の異なる視点画像によって一般に表される。従って、オートステレオスコピックディスプレイのそれぞれの視方向のビュー画像を提供するために、受信データに対してかなりの処理を施す必要がある。とりわけ、オートステレオスコピックディスプレイのビュー画像を生成するために、典型的にはレンダリング更には(3D)画像処理を行う必要がある。例えば追加のビューを生成するために、奥行情報に基づく視点のシフトがしばしば必要である。
別の例として、例えば3Dモデルに基づいて画像データを生成することによって等、一部の応用例では3D画像データが3Dモデルを評価することによって直接生成される。モデルは例えばOpenGLグラフィックス標準に準拠することができ、肌理と組み合わせて三角形及び/又はメッシュを含み得る。従って一部の応用例では、三次元シーンの3Dグラフィカルモデルを評価することによって特定の視角の画像が生成され得る。
3D描写のためにオートステレオスコピックディスプレイを使用する場合、典型的には9個、15個、29個のビュー等、異なる視角に対応する比較的多数の個々のビューが投影される。従って、異なる視角に対応する多数の画像が生成されなければならない。多数の画像を生成することは、入力3D画像データの3D処理をビューごとに行うことによって果たされ得る。例えばビューごとに、既定の視角に対応する入力画像を処理して所望の視角の対応するビューを生成する。この3D処理は、とりわけ画素の奥行に応じて画素を視差シフトすること、デオクルード領域を埋めること等を含む。
同様に、3Dモデルを評価することに基づく一部のシステムでは、その視角に対応する画像を生成するためにモデルがビューごとに評価され得る。
従って一部のシステムでは、オートステレオスコピックディスプレイの各ビューの画像を生成するために3D処理が行われる。しかし、かかる手法の不利益は、かかる手法が非常に計算的に多くを求め、多くの計算資源を必要とすることである。このことは、例えば実時間処理を必要とする動画像列又はゲームの一部である3D画像にとって特に重大であり得る。
計算的な複雑さを減らすために、オートステレオスコピックディスプレイに必要な画像のサブセットのみをレンダリングすることが提案されている。例えば、3D処理は15ビューの画像に対して8個の画像のみを生成する場合がある。かかるシステムでは、ビューの視角に最も近い視角に対応する生成画像を選択することによってビューごとの画像が生成され得る。一部のシステムでは、例えば現在のビュー画像を取り囲む(即ち各方向に最も近い視角を有する画像に対応する)2つのレンダリング画像間の単純な線形補間によって所与のビュー画像が生成され得る。
実際に現在、オートステレオスコピック3Dディスプレイのコンテンツがレンダリングされる場合、典型的な手法は、固定された視角に対応する一定数の画像をレンダリングすることである。その後、オートステレオスコピックディスプレイの画素ごとに所要の出力視角が決定され、最も近い視角についてレンダリング画像内の対応する画素を選択することによって、又は最も近い視角を有する画像の画素の加重和によって画素が生成される。
しかし、かかる手法は全体的な計算資源使用量を減らすことはできるが、幾つかの不利益を発生させる傾向もある。具体的には、この手法は知覚画質を低下させる傾向があり、多くのアーティファクトを発生させる。
例えば、比較的少数の画像が3D処理によってレンダリングされる場合、知覚される3D画像内のエッジがゴースティング効果を示す傾向がある(例えばオブジェクトエッジの僅かにずれた複数の複製がしばしば体験される)。更に、視聴者の目がビュー円錐域の複数のビューを通過するように利用者がディスプレイに対して移動する場合、視聴者の目がビュー間を行き来するときに画像オブジェクトが適切な位置で飛び越すように又は揺らぐように見える場合がある比較的不均一な体験がもたらされる。
従って、高画質をもたらすために、多数の画像がレンダリングされることが望ましい。しかし、それは複雑さ及び資源使用量を増やし、従って品質と複雑さとの間には固有のトレードオフがあり、そのトレードオフは従来技術のシステムでは最適以下の傾向にある。
従って、ビュー画像を生成するための改善された手法が有利であり、とりわけ柔軟性の向上、画質の改善、複雑さの低下、資源需要の低減、複雑さと知覚画質との間のトレードオフの改善、及び/又は性能の改善を可能にする手法が有利である。
従って、本発明は上記の不利益を単独で又は任意の組合せで好ましくは軽減し、緩和し、又はなくそうとするものである。
本発明の一態様によれば、出力三次元画像を生成するための機器が提供され、この機器は、中間三次元画像を生成するための第1の画像生成ユニットであって、中間三次元画像は中間三次元画像の空間的副区分である複数の領域を含み、その複数の領域の画素値の或る数の画像ブロックを生成するように第1の画像生成ユニットが構成され、画像ブロックの数は複数の領域のうちの少なくとも2つの領域について異なり、及び各画像ブロックは視方向に対応する画素群の画素値を含む、第1の画像生成ユニットと、幾つかのビュー画像を含む出力三次元画像を中間三次元画像から生成するための第2の画像生成ユニットであって、幾つかのビュー画像のそれぞれは視方向に対応する、第2の画像生成ユニットと、中間三次元画像及び三次元シーン表現であって、第1の画像生成ユニットがそれから中間三次元画像を生成するように構成される三次元シーン表現の少なくとも一方の特性に応じて、複数の領域のうちの少なくとも第1の領域について異なる視方向を有する画像ブロックの数を適合させるためのアダプタとを含む。
本発明は、多くの実施形態において改善された三次元画像を提供することができ、かかる三次元画像はオートステレオスコピックディスプレイ等の三次元ディスプレイ上に表示されるとき、知覚画質の改善をもたらすことができる。多くの実施形態において、この手法は、例えばオートステレオスコピックディスプレイ上に第2の三次元画像が提示されるとき、例えば知覚されるクロストーク効果の減少をもたらし得る。この手法は多くの実施形態において、画像劣化及びアーティファクトの知覚的影響が減らされた三次元画像を生成することができる。表示されるとき、視聴者は見た目がより自然な三次元シーンを知覚することができる。この手法は、多くの実施形態において、とりわけ利用者がオートステレオスコピックディスプレイのビュー円錐域を通過して移動するとき、よりスムーズな体験を提供することができる。
本発明は、多くの実施形態において複雑さを減らすことができる。この手法は多くのシナリオにおいて、画像データの三次元処理の必要量を大幅に減らすことができる。この手法は多くの実施形態において、使用可能な計算資源のより効率的な使用を可能にすることができ、又は例えば必要な計算資源を減らすことができる。処理の複雑さを下げることは、出力三次元画像の広域にわたって実現され得る。計算資源使用量が大幅に減らされ得る。この手法は、例えば比較的計算能力が低い装置でも比較的多数のビュー画像を生成できるようにし得る。
本発明は多くの実施形態及びシナリオにおいて、計算資源対画質のトレードオフの改善をもたらし得る。とりわけこの手法は、使用可能な計算資源が三次元画像の最も重要な部分に充てられることを可能にし得る。従って、三次元画像の特性に基づいて第1の画像生成ユニットによって生成される画像ブロックによって表されるビューの数の適合は、利用者の目をひく可能性が最も高い箇所の画質を改善するために、使用可能な処理能力を適合させることができる。とりわけこの手法は、アーティファクトが生じる可能性が最も高い領域又はアーティファクトが最も人目をひく可能性が高い領域にアーティファクトの低減及び軽減を集中させることを可能にし得る。
具体的には、アダプタは、第1の画像生成ユニットによってレンダリングされるビューの数の局所的適合を行うことができ、この適合は局所的画像特性に基づき得る。従って、システム内で、中間画像の異なる領域が異なる数の画像ブロックによって表され得、各画像ブロックは異なる視角に対応する。従って、各領域内の画像ブロック/視角の数は局所的画像特性に依存する。
三次元画像は、三次元シーンの任意の表現とすることができ、且つとりわけ視覚的情報及び(関連する)奥行情報を与える任意のデータであり得る。三次元画像は、例えば或るシーンの異なる視点に対応する2つ以上の(ことによると部分的な)画像であり得る。三次元画像は、例えば左目ビュー及び右目ビューに対応する2つの2D画像であり得る。一部のシナリオでは、三次元画像が3個以上のビューによって、例えばオートステレオスコピックディスプレイの9個又は28個のビューに関する2D画像等によって表され得る。一部のシナリオでは、(例えば視差又は変位データとして与えられる)奥行情報が三次元画像の一部として提供され得る。一部の実施形態では、三次元画像が例えば関連する奥行情報と共に単一の画像として提供され得る。一部のシナリオでは、三次元画像が、オクルージョンデータ及び奥行きデータと共に所与の視方向からの2D画像として提供され得る。例えば三次元画像は、Zスタック表現及び場合により関連する奥行マップとして提供され得る。例えばZスタックは、所与の視点のフル画像に対応するトップレイヤを含み得る。従って、二次元ディスプレイはこの画像を直接レンダリングすることができる。画像は様々な奥行における画素を含む(例えば一部は背景画素であり、他の画素は様々な奥行にある様々な前景オブジェクトに対応する)ため、トップレイヤ画像は関連する奥行マップを有し得る。Zスタックの第2のレイヤは、トップレイヤ用のオクルージョン情報を含み得る。とりわけトップレイヤの画素ごとに、第2のレイヤは、トップレイヤ内の対応する画素によって表される画像オブジェクトがない場合に見えることになるものを表す画素を含み得る。対応する画素が既に背景画素である(従ってオクルージョンがない)場合、第2のレイヤはその画素について画素値を一切含まないことができる。この手法は、Zスタックの任意の更なるレイヤについて繰り返され得る。一部の実施形態では、Zスタックのレイヤごとに奥行マップが与えられ得る。
一部の実施形態では、第1の画像生成ユニットが、入力三次元画像を処理することによって中間三次元画像を生成することができる。かかる実施形態では、第1の画像生成ユニットは、少なくとも一部の領域について入力画像よりも多くのビューの画像データを含むように中間三次元画像を生成することができる。一部の実施形態では、第1の画像生成ユニットは、特定の視方向についてシーンの三次元グラフィカルモデルを評価することによって中間三次元画像の画像データを生成することができる。
一部の実施形態では、第1の画像生成ユニットは、三次元モデルを評価することによって中間三次元画像を生成することができる。
第1の画像生成ユニットは、三次元画像処理を使用して中間三次元画像を生成するように構成され得、三次元画像処理は処理される少なくとも1つの画像画素の奥行に依存するプロセスを含む。第1の画像生成ユニットは、奥行ベースの/奥行に依存する画像処理を使用して中間三次元画像を生成するように構成され得る。第2の画像生成ユニットは、処理される如何なる画像画素の奥行にも依存しないプロセスを使用して出力三次元画像を生成するように構成され得る。第2の画像生成ユニットは、非奥行ベースの/奥行に依存しない画像処理を使用して中間三次元画像から出力三次元画像を生成するように構成され得る。従って、第1の画像生成ユニットは中間三次元画像を生成するときに奥行/視差情報を考慮し得るのに対し、第2の画像生成ユニットは出力三次元画像を生成するときに奥行/視差情報を考慮しない。
とりわけ第2の画像生成ユニットは、中間三次元画像の画像ブロックの加重線形結合に応じて出力三次元画像を生成するように構成され得る。例えば、出力三次元画像の各ビュー画像の画素ごとに、中間三次元画像の画像ブロック内の対応する画素の加重線形結合として画素値が決定され得、重みは画像ブロックの視角に対するビューの視角に依存する。
第1の画像生成ユニットは、入力三次元画像を奥行に基づいて処理することによって中間三次元画像を生成することができる。かかる処理は、少なくとも一部の領域について、入力三次元画像内で画像データが与えられない視角に対応する画像ブロックを生成することを含み得る。従って入力三次元画像の処理は、画像の視角をシフトすることを含み得る。このシフトは、画素の変位、デオクルード領域を埋めること等を含み得る。
領域は、中間三次元画像の任意の空間的副区分に対応し得る。
中間三次元画像は、中間三次元画像の領域ごとの画像ブロックの組によって形成され得、画像ブロックの各組は1つ又は複数の画像ブロックを含み、画像ブロックの1つの組の各画像ブロックは異なる視角に対応する。多くの実施形態において、画像ブロックの各組は異なる視角ごとに最小限、例えば2個、3個、又は5個の画像ブロックを含む。多くの実施形態において、1つ又は複数の視方向の画像ブロックが画像ブロックの全ての組に含まれる。従って、中間三次元画像は(視角にそれぞれ関連する)幾つかの完全な画像を含み得る。例えば中間三次元画像は、異なる視角にそれぞれ対応するNの完全なビュー画像によって表され得、及び加えて、画像ブロックの組のサブセットが更なる視角に関する1つ又は複数の画像ブロックを含み得る。所与の組/領域の更なる画像ブロック/更なる視角の数は、その組の領域の近傍内の画像特性に基づいてアダプタによって決定される。更なる画像ブロック/更なる視角の数は、異なる領域間で異なり得る。
出力三次元画像は所定数のビュー画像を含み得る。各ビュー画像は完全な画像とすることができ、及び従って画像の全領域の画像データを含み得る。出力三次元画像は、M画像の組として生成され得、M画像のそれぞれはオートステレオスコピックディスプレイの1つのビューの画像として直接生成される。出力三次元画像はMビュー画像のみによって表され得、例えば奥行マップ又は視差マップを一切含まないことができる。出力三次元画像は、別々のビュー画像の組として表され得、又は例えばインタリーブされたビュー画像を含むウィーブ画像によって表され得る。一部の実施形態又はシナリオでは、ビュー画像の1つ又は複数が部分画像であり得る。
画像ブロックは、視覚的画素値が与えられる画像領域又は画素群に対応し得る。従って、画像ブロックは画素群の画素値によって形成され得る。画素値は、例えば輝度、彩度、及び/又はクロミナンス値等の視覚的画素値であり得る。第1の画像生成ユニットは、画素群の画素値を生成することによって画像ブロックを生成することができる。所与の視方向について、中間三次元画像は画素値が決定されていない領域(画像内の空領域又は隙間)、及び画素値が第1の画像生成ユニットによって生成されている画像ブロックを含み得る。画像ブロックは、画素群の画素値の組であり得る。
ビュー画像は、所与の視方向の画像であり得る。ビュー画像は、空領域がない完全な画像であり得る。
特性は、第1の領域の近傍の/近傍内の画像特性であり得る。近傍は、中間三次元画像又は入力三次元画像内の近傍であり得る。
一部の実施形態では、例えば中間三次元画像内の第1の領域の奥行及び/又はコントラスト等、中間三次元画像の特性に応じて複数の領域のうちの第1の領域の画像ブロックの数が適合され得る。
一部の実施形態では、三次元シーン表現から中間三次元信号が生成される。
三次元シーンは、例えば一部の実施形態では入力三次元画像によって表され得、及び中間三次元画像は入力三次元画像から生成され得る。一部の実施形態では、例えば入力三次元画像内の第1の領域の奥行及び/又はコントラスト等、入力三次元画像の特性に応じて複数の領域のうちの第1の領域の画像ブロックの数が適合され得る。
三次元シーンは、例えば一部の実施形態では三次元モデル(例えば肌理及び光源のモデリングを含む)によって表され得る。かかる実施形態では、中間三次元画像が三次元モデルから生成され得る。一部の実施形態では、例えば入力/中間三次元画像内の第1の領域に対応するモデルオブジェクトの奥行及び/又はコントラストの測度等、三次元モデルの特性に応じて複数の領域のうちの第1の領域の画像ブロックの数が適合され得る。
従って多くの実施形態において、アダプタは、中間三次元画像、入力三次元画像であって、第1の画像生成ユニットがそれに応じて中間画像を生成するように構成される入力三次元画像、及び三次元モデルであって、第1の画像生成ユニットがそれに応じて中間画像を生成するように構成される三次元モデルのうちの少なくとも1つの特性に応じて、複数の領域のうちの少なくとも第1の領域について異なる視方向を有する画像ブロックの数を適合させるように構成され得る。
本発明の任意選択的特徴によれば、特性は奥行の測度である。
特性は、とりわけ近傍の奥行の測度であり得る。アダプタは、第1の領域の近傍の奥行の測度に応じて第1の領域の画像ブロックの数を決定するように構成され得る。近傍は、第1の領域に属する少なくとも1つの画素を含む領域であり得る。アダプタは、第1の領域の少なくとも1つの画素を含む領域の奥行の測度に応じて第1の領域の画像ブロックの数を決定するように構成され得る。
アダプタは、この操作を複数の領域の全領域について行うように構成され得る。画像ブロックの数の決定は領域ごとに独立に行われ得る。
この手法は、多くの実施形態及びシナリオにおいて、画質対計算資源使用量の改善をもたらし得る。画像生成機器の計算資源がとりわけ奥行の測度に応じて画像にわたって不均一に分散され得、及び特にレンダリング資源は基準面からの著しい奥行のずれを有する領域に集中され得る。
奥行の測度は、例えば領域の近傍内の画素の奥行値を反映する平均奥行値又は加重奥行値等、奥行のレベルを示すことができる。一部の実施形態では、奥行の測度は、とりわけ(異なるビューの画像間のゼロ視差に対応する)画面レベルの奥行であり得る基準奥行からの領域内の奥行のずれを示し得る。
本発明の任意選択的特徴によれば、画像特性は近傍のコントラストの測度である。
特性は、とりわけ近傍のコントラストの測度であり得る。アダプタは、第1の領域の近傍のコントラストの測度に応じて第1の領域の画像ブロックの数を決定するように構成され得る。近傍は、第1の領域に属する少なくとも1つの画素を含む領域であり得る。アダプタは、第1の領域の少なくとも1つの画素を含む領域のコントラストの測度に応じて第1の領域の画像ブロックの数を決定するように構成され得る。
アダプタは、この操作を複数の領域の全領域について行うように構成され得る。画像ブロックの数の決定は領域ごとに独立に行われ得る。
この手法は、多くの実施形態及びシナリオにおいて、画質対計算資源使用量の改善をもたらし得る。画像生成機器の計算資源がとりわけコントラストの測度に応じて画像にわたって不均一に分散され得、及び特にレンダリング資源は相当な局所的コントラストを示す領域に集中され得る。
コントラストの測度は、領域の近傍内のコントラストの程度を示すことができ、及び例えば近傍内の輝度/明度/強度の変化の程度を示し得る。一部の実施形態では、コントラストの測度は、近傍内の画像オブジェクトエッジの遷移を示し得る。
一部の実施形態では、コントラストの測度は水平なコントラストの測度である。
多くの実施形態において、画像の特性は(近傍の)奥行の測度及び(近傍の)コントラストの測度の少なくとも一方である。アダプタは、第1の領域の近傍のコントラストの測度及び奥行の測度の少なくとも一方に応じて第1の領域の画像ブロックの数を決定するように構成され得る。アダプタは、この操作を複数の領域の全領域について行うように構成され得る。画像ブロックの数の決定は領域ごとに独立に行われ得る。
本発明の任意選択的特徴によれば、アダプタは、第1の画像生成ユニットの計算資源の可用性に応じて第1の領域の画像ブロックの数を決定するように更に構成される。
本発明は、使用可能な計算資源について、例えば画質の適合及び多くの場合に最適化の改善をもたらし得る。とりわけこの手法は、例えば結果として生じる画質に対する影響が最適化される領域に限られた可用資源が充てられ得るように、画像レンダリングの適合を可能にし得る。
本発明の任意選択的特徴によれば、複数の領域は少なくとも1つの画素行によって形成される領域を含む。
このことは多くの実施形態において、高度に柔軟な資源の標的化を依然として可能にしながら、複雑さの低下及び操作の単純化をもたらし得る。更にこの手法は、多くのシナリオにおいて、画像劣化の許容できない増加及び/又は各領域を処理するのに必要な処理の許容できない増加を招くことなしに、画像を領域に分けるための計算資源を減らすことができる。
多くのシナリオにおいて、複数の領域の全領域が1つ又は複数の画素行によって形成される。
本発明の任意選択的特徴によれば、複数の領域のうちの少なくとも1つの領域が画素行の画素のサブセットのみを含む。
このことは、多くの実施形態において資源の標的化の改善をもたらすことができ、及びとりわけ第1の画像生成ユニットの計算資源のより正確な割当を提供し得る。
本発明の任意選択的特徴によれば、第1の画像生成ユニットは、第1の数の視方向について、複数の領域の全領域の画像ブロックを生成するように構成され、及びアダプタは、第1の数の視角に関する各領域の画像ブロック間の視差に応じて少なくとも1つの更なる視方向の画像ブロックを生成する、複数の領域のうちの領域のサブセットを後で選択するように構成される。
本発明は、多くの実施形態及びシナリオにおいて、計算資源対画質のトレードオフの改善をもたらし得る。この手法は、複雑度が低く且つ資源をあまり必要としない制御及び割当手法が使用されることを可能にしながら、資源の正確な割当を可能にする効率的操作をもたらし得る。この手法は、容易にされ且つ/又は低減された実装及び/又は操作を提供し得る。
本発明の任意選択的特徴によれば、アダプタは、視差の測度が閾値を上回ることに応じて、少なくとも1つの更なる視角の画像ブロックを生成する領域を選択するように構成され、視差の測度は、更なる視角に隣接する2つの視角の2つの画像ブロックの視差の測度である。
本発明は、多くの実施形態及びシナリオにおいて、計算資源対画質のトレードオフの改善をもたらし得る。この手法は、複雑度が低く且つ資源をあまり必要としない制御及び割当手法が使用されることを可能にしながら、資源の正確な割当を可能にする効率的操作をもたらし得る。この手法は、容易にされ且つ/又は低減された実装及び/又は操作を提供し得る。
本発明の任意選択的特徴によれば、アダプタは、奥行の測度が閾値を下回る領域のサブセットを決定し、及びそのサブセットの各領域内の画像ブロックの数を1に設定するように構成される。
領域のサブセット内の領域ごとに、第1の画像生成ユニットは2D画像情報のみを生成することができる。
このことは、領域のサブセットの計算資源を減らし、それにより他の領域向けの資源割当を空けることができる。一部の実施形態では、それにより画質の改善がもたらされ得る。
一部の実施形態では、第1の画像生成ユニットは、入力三次元画像から中間三次元画像を生成するように構成され、入力三次元画像は、異なる視角に対応する複数の二次元画像の組及び関連する奥行マップを有する二次元画像の少なくとも一方によって表される。
一部の実施形態では、第1の画像生成ユニットは、グラフィカル三次元モデルを評価することによって中間三次元画像を生成するように構成される。
一部の実施形態では、特性は非空間特性とすることができ、とりわけ非奥行特性とすることができる。
本発明の任意選択的特徴によれば、特性は視覚的特性である。
このことは、多くの実施形態において性能の改善をもたらし得る。特性は、とりわけ第1の領域の少なくとも1つの画素の近傍の視覚的特性であり得る。アダプタは、第1の領域の近傍の視覚的特性に応じて第1の領域の画像ブロックの数を決定するように構成され得る。(第1の領域の)近傍は、第1の領域に属する少なくとも1つの画素を含む領域であり得る。アダプタは、第1の領域の少なくとも1つの画素を含む領域の視覚的特性に応じて第1の領域の画像ブロックの数を決定するように構成され得る。
アダプタは、この操作を複数の領域の全領域について行うように構成され得る。画像ブロックの数の決定は領域ごとに独立に行われ得る。
視覚的特性は、領域の近傍内の視覚的特性を示すことができ、例えば近傍内の輝度/明度/強度の変化の程度を示し得る。
本発明の任意選択的特徴によれば、特性は明度の特性及び色の特性の少なくとも一方を示す。
このことは、多くの実施形態において性能の改善をもたらし得る。特性は、とりわけ第1の領域の少なくとも1つの画素の近傍の明度の特性及び色の特性の少なくとも一方を示し得る。アダプタは、第1の領域の近傍の明度の特性及び色の特性の少なくとも一方に応じて第1の領域の画像ブロックの数を決定するように構成され得る。(第1の領域の)近傍は、第1の領域に属する少なくとも1つの画素を含む領域であり得る。アダプタは、第1の領域の少なくとも1つの画素を含む領域の視覚的特性に応じて第1の領域の画像ブロックの数を決定するように構成され得る。
アダプタは、この操作を複数の領域の全領域について行うように構成され得る。画像ブロックの数の決定は領域ごとに独立に行われ得る。
例えば明度及び/又は色の変化に依存することを含め、明度値及び色値の少なくとも一方に値を依存させることにより、又はそこから値を少なくとも部分的に導出可能にすることにより、特性は明度の特性及び色の特性の少なくとも一方を示し得る。
本発明の任意選択的特徴によれば、第1の画像生成ユニットは、三次元シーンの三次元モデルに基づいて中間三次元画像を生成するように構成され、及びアダプタは、三次元モデルの特性に応じて画像ブロックの数を適合させるように構成される。
本発明の一態様によれば、中間三次元画像を生成するための第1の画像生成ユニットであって、中間三次元画像は複数の領域を含み、その複数の領域の視方向に対応する画素値の或る数の画像ブロックを生成するように第1の画像生成ユニットが構成され、画像ブロックの数は複数の領域のうちの少なくとも2つの領域について異なる、第1の画像生成ユニットと、第2の数のビュー画像を含む出力三次元画像を中間三次元画像から生成するための第2の画像生成ユニットであって、第2の数のビュー画像のそれぞれは視方向に対応する、第2の画像生成ユニットと、三次元画像を表示するためのディスプレイ構成部と、出力三次元画像を表示するためにディスプレイ構成部を駆動するためのディスプレイドライバと、中間三次元画像及び第1の画像生成ユニットへの三次元入力画像の少なくとも一方の特性に応じて、複数の領域のうちの少なくとも第1の領域について異なる視方向を有する画像ブロックの数を適合させるためのアダプタとを含む、オートステレオスコピック三次元ディスプレイが提供される。
本発明の一態様によれば、出力三次元画像を生成する方法が提供され、この方法は、複数の領域の視方向に対応する画素値の或る数の画像ブロックを生成することによって複数の領域を含む中間三次元画像を生成するステップであって、画像ブロックの数は複数の領域のうちの少なくとも2つの領域について異なる、ステップと、第2の数のビュー画像を含む出力三次元画像を中間三次元画像から生成するステップであって、第2の数のビュー画像のそれぞれは視方向に対応する、ステップと、中間三次元画像及び中間三次元画像を生成するために使用される三次元入力画像の少なくとも一方の特性に応じて、複数の領域のうちの少なくとも第1の領域について異なる視方向を有する画像ブロックの数を適合させるステップとを含む。
本発明のこれらの及び他の態様、特徴、及び利点が以下に記載の実施形態から明らかになり、かかる実施形態に関して説明される。
本発明の実施形態が例としてのみ図面に関して説明される。
オートステレオスコピックディスプレイから生成されるビューの一例を示す。 オートステレオスコピックディスプレイの表示パネルにオーバレイするレンチキュラスクリーンの一例を示す。 オートステレオスコピックディスプレイ装置の要素の概略的遠近図を示す。 オートステレオスコピックディスプレイ装置の要素の断面図を示す。 本発明の一部の実施形態によるディスプレイシステムの一例を示す。 オートステレオスコピックディスプレイからの投影ビュー画像の一例を示す。 2つのオブジェクトを有する三次元シーンの一例を示す。 本発明の一部の実施形態に従って出力三次元画像を生成するための一例示的手法の側面を示す。 2つのオブジェクトを有する三次元シーンの一例を示す。 本発明の一部の実施形態に従って出力三次元画像を生成するための一例示的手法の側面を示す。 本発明の一部の実施形態に従って出力三次元画像を生成するための一例示的手法の側面を示す。
以下の説明は、三次元画像を表示するために使用されるオートステレオスコピックディスプレイに適用可能な本発明の実施形態に焦点を当てる。但し、本発明はこの用途に限定されず、例えばビュー分離メガネに基づくステレオスコピックディスプレイを含む他の多くの用途に適用され得ることが理解されよう。
オートステレオスコピックディスプレイ構成部301は、表示パネル303を含む。例えばディスプレイがLCD式のディスプレイの場合、ディスプレイ構成部301は光源307を含み得るが、例えばOLED式のディスプレイには光源は不要である。
ディスプレイ構成部301は、ビュー形成機能を果たす、表示パネル303の表示面上に配置されるレンチキュラシート形式のビュー形成光学素子309も含む。ビュー形成光学素子309は、互いに平行に延びるレンチキュラレンズ311の行を含み、明瞭にするためにそのうちの1つのみが誇張された寸法で図示されている。レンチキュラレンズ311は、ビュー形成機能を果たすビュー形成要素としての役割を果たす。図3のレンチキュラレンズ311は、表示パネルから見て外側に向く凸面を有する。凸面側を表示パネルに向けてレンチキュラレンズを形成することもできる。
レンチキュラレンズ311は、凸円柱要素の形態を取ることができ、表示パネル303からディスプレイ構成部301の前に位置する利用者の目に様々な画像又はビューを与えるための光出力方向付け手段としての役割を果たす。
図3に示されているオートステレオスコピックディスプレイ構成部301は、異なる方向に幾つかの異なる遠近感のビューを与えることができる。具体的には、各レンチキュラレンズ311は、各行内のディスプレイサブピクセル305の小さいグループ上に重なる。レンチキュラ要素311は、幾つかの異なるビューを形成するために、グループの各ディスプレイサブピクセル305を異なる方向に投影する。利用者の頭が左から右に動くと、その利用者の目は幾つかのビューのうちの異なるビューを順に受け付ける。
図5は、本発明の一部の実施形態によるオートステレオスコピックディスプレイを示す。このオートステレオスコピックディスプレイは、図3及び図4に関して説明されたようなオートステレオスコピックディスプレイ構成部301を含む。加えてこのオートステレオスコピックディスプレイは、三次元画像を提示できるようにオートステレオスコピックディスプレイ構成部301を駆動するための駆動信号を生成するように構成されるディスプレイドライバ501を含む。
三次元画像は、典型的には三次元画像によって表されるシーンの(同時に存在する)視覚情報及び奥行情報を提供する任意のデータとすることができる。典型的には、三次元画像の少なくとも一部の画素が奥行の指示及び光出力の指示の両方によって表される。奥行の指示は、例えば直接奥行値又は視差値であり得る。光出力の指示は、典型的には少なくとも1つの輝度値及び/又は彩度値を含む値の組であり得る。
三次元画像は、例えば異なるビュー/視角に対応するN画像の組であり得る。別の例として、三次元画像は、右目用の1つの二次元画像及び左目用の1つの二次元画像を有する立体画像であり得る。別の例として、三次元画像は、関連する(例えば単一画像の画素ごとに視差値又は奥行値を与える)奥行マップを有する単一の二次元画像であり得る。更に別の例として、三次元画像は関連する奥行マップを有するZスタックであり得る。三次元画像の1つ又は複数(場合により全て)の二次元画像は部分画像であり得る。従って、三次元画像の異なる二次元画像が異なる区域/領域の画像データを含み得る。
ディスプレイドライバ501は、中間三次元画像を生成するように構成される第1の画像生成ユニット503を含む。第1の画像生成ユニット503は、第1の画像生成ユニット503から受信される三次元画像データセットから出力三次元画像を生成するように構成される第2の画像生成ユニット505に結合される。
第2の画像生成ユニット505は、オートステレオスコピックディスプレイ構成部301向けの適切な駆動信号を生成するように構成されるドライバ507に結合される。とりわけ、ドライバ507は第2の画像生成ユニット505から出力三次元画像を受信し、続けて、オートステレオスコピックディスプレイ構成部301に駆動信号が供給されるとき、出力三次元画像をレンダリングさせる駆動信号を生成する。
出力三次元画像は幾つかのビュー画像を含み、各ビュー画像は(異なる)視方向に対応する。各ビュー画像は、所与の視方向からのシーンの完全な画像を提供し得る。とりわけ、出力三次元画像は異なる視方向からの、特に異なる視角からのシーンの複数の画像を含み得る。多くの実施形態において、出力三次元画像は、オートステレオスコピックディスプレイのビューごとに1つのビュー画像を含み得る。例えば、オートステレオスコピックディスプレイは9ビューディスプレイとすることができ、第2の画像生成ユニット505は出力三次元画像を9つの画像として生成することができ、各画像はオートステレオスコピックディスプレイのビューの1つの視角に対応する。
第1の画像生成ユニット503は、複数の二次元画像ブロックを含むように中間三次元画像を生成することができ、各画像ブロックは所与の視方向について生成される。画像ブロックは部分画像とすることができ、即ち各画像ブロックは画像の一部/断片であり得る。画像ブロックは、視覚的値が与えられる画素群、とりわけ彩度値及び/又は輝度値等の光出力の指示が与えられる画素群であり得る。画像データはとりわけ画素値であり得る。
各画像ブロックは、視角に対応し、その視角に対応する完全な二次元画像の一部を表すことができる。中間三次元画像は、所与の視方向について複数の画像ブロックを含み得る。一部の視角では、完全な画像を形成するのに画像ブロックが十分であり得る。従って、各画像が所与の視方向に対応し、ことによると部分画像でありながら、複数の二次元画像を含むように中間三次元画像が生成され得る。多くの実施形態において、二次元画像のサブセットがフル画像であるのに対し、他は部分画像に過ぎない(与えられる画像データ量は概して異なる)。
典型的には、二次元画像は1920×1080画素等の所与の画素領域/分解能に対応する。三次元画像では、所与の視方向に対応する各二次元画像は所与の画素領域/分解能によって表され、概してそれは三次元画像内の全ての画像について同じである。図5の例では、第1の画像生成ユニット503が、複数の視角の画像データを含むように中間三次元画像を生成することができる。視角ごとに同じ画素領域/分解能が割り当てられる。しかし、第1の画像生成ユニット503は完全な画像であるように画像の全てを生成しないことができ、即ち画像データは画像の一部についてのみ与えられ得る。従って、所与の視方向について、中間三次元画像は画像情報を含む1つ又は複数の画像ブロックを含むことができ、画像情報が提供されない空領域も含み得る。従って各画像ブロックはビュー画像の一部であり得る。例えば、画素領域が複数の領域に分割され得るが、画像データはそれらの領域のサブセットのみに与えられる場合がある。
多くの実施形態において、第1の画像生成ユニット503は、1つ又は複数の視角に関する完全な画像ブロックの組を含むように中間三次元画像を生成することができる。従って、それらの視角について完全なビュー画像が与えられる。しかし、他の視角では、領域のサブセットについてのみ画像データが生成され得る。
画像ブロックの数、位置、範囲、形状、大きさ等は、異なる視角ごとに異なり得る。従って、中間三次元画像内で画像データが与えられる視角は、画像の異なる区域/領域ごとに異なり得る。
実際に、第1の画像生成ユニット503は、(例えばオートステレオスコピックディスプレイのビュー画像ごとの画像分解能に対応する)所与の大きさの画像キャンバスに基づいて中間三次元画像を生成することができる。所与の領域(領域は例えば単一画素又は画素群であり得る)について、中間三次元画像は幾つかの異なる視角の画像データを含み得る。この画像データは画像ブロック単位で与えられる。画像データが与えられる、即ち画像ブロックが生成される視角の数は異なる領域ごとに(例えば異なる画素又は画素群ごとに)異なり得る。
同等に、中間三次元画像は、幾つかの二次元視方向画像によって形成されると見なされ得、各視方向画像は1つの視方向に対応する。二次元視方向画像は部分的であり得る。従って、画像の一部を形成する画像ブロック単位で画像データが与えられ得る。二次元視方向画像の他の部分は空であり得る。画像ブロックの特性は異なる視方向画像ごとに異なる場合があり、とりわけ所与の視方向画像内に含まれる画像ブロックの大きさ及び/又は位置は視方向画像間で異なり得る。例えば、一部の視方向画像では含まれる画像ブロックが完全な画像をもたらすことができ、即ち一部の視方向について隙間/空領域がない場合がある。他の視方向では、視方向画像が1つの又は少数の小さい画像ブロックのみを含む場合がある。従って、一部の視方向画像はほぼ完全に空であり得る。
多くの実施形態及びシナリオにおいて、少なくとも一部の画像ブロックが10画素、100画素、1000画素、又は1000画素を超える大きさを有することができ、即ち一部の画像ブロックは少なくとも10画素、100画素、1000画素、又は1000画素の群によって形成され得る。
第2の画像生成ユニット505は、中間三次元画像を処理して出力三次元画像を生成するように構成される。この処理は、オートステレオスコピックディスプレイ構成部301のビューのそれぞれについて1つの全体の/完全なビュー画像が与えられるように、完全なビュー画像の組を生成することを概して含む。
第1の画像生成ユニット503は、三次元処理に基づいて中間三次元画像を生成するように構成される。第1の画像生成ユニット503は、所与の視方向の画像ブロックを生成するためのアルゴリズムを適用し、そのアルゴリズムはシーン/画像内の様々なオブジェクトの奥行の検討を含む。とりわけ第1の画像生成ユニット503は、オブジェクトの奥行に応じて、異なるオブジェクトを表す画素の位置を生成するように構成される。
一部の実施形態では、第1の画像生成ユニット503は、入力三次元画像から中間三次元画像を生成するように構成され得る。入力三次元画像は、例えば左目ビュー及び右目ビューに対応する2つの三次元画像に対応することができ、又は例えば関連する奥行マップを有する単一の画像又はzスタック等、例えば比較的低データ速度の表現であり得る。
入力三次元画像は、ローカルメモリ、記憶媒体、遠隔ネットワークサーバ、無線放送等、任意の適切な内部情報源又は外部情報源から受信され得る。一部の実施形態では、入力三次元画像(実際は中間三次元画像及び出力三次元画像)が単一の静止画像であり得る。他の実施形態では、入力三次元画像(実際は中間三次元画像及び出力三次元画像)が三次元動画像列の単一の画像(単一のフレーム)であり得る。
かかる実施形態では、第1の画像生成ユニット503が、当業者に知られるビューシフト、デオクルージョン、画素シフト等を含む三次元処理を行うことによって入力三次元画像から画像ブロックを生成するように構成され得る。
例えば、単一の二次元画像及び奥行マップによって形成される入力三次元画像に基づいて所与の視角の画像ブロックを生成するために、第1の画像生成ユニット503は、特定の領域に対応する二次元画像の画素を選択することができる。次いで、視角及び奥行マップ内に示される画素の奥行から水平画素シフトが画素ごとに計算される。その後、計算された量だけ画素がシフトされ、シフトによって引き起こされる任意の隙間が適切なデオクルージョン手法(補間法又は外挿法等)を使用して埋められる。その結果生じる決定された画素値は、視角の画像ブロックに対応する。
一部の実施形態では、第1の画像生成ユニット503がシーン及び関連する肌理及び光源等の三次元モデル(幾何学的形状)を評価することによって中間三次元画像が生成され得る。例えばゲーム用途では、第1の画像生成ユニット503は三次元要素を評価し、異なる視角の画像データを計算することができる。かかる例では、中間三次元画像は第1の画像生成ユニット503によって然るべく合成され得、入力画像に基づかない。
特定の領域について画像ブロックが生成される視角の量は、異なる領域ごとに異なり得る。例えば、オートステレオスコピックディスプレイ構成部301のビューの視角のサブセットについて、適切な奥行ベースの技法を使用して完全な画像が入力画像から計算され得る。例えば、9ビューのオートステレオスコピックディスプレイでは、第1の画像生成ユニット503が、例えば視角の5つについて完全な画像に対応する画像ブロックを生成することができる。
奥行ベースの処理は概して非常に計算集約的であり、かなりの計算能力を必要とする。従って、所要のビュー画像のサブセットのみを計算することが有利である。
フル画像に加えて、第1の画像生成ユニット503は幾つかの追加の視角について画像ブロックを更に計算することができ、とりわけオートステレオスコピックディスプレイの残りの4つのビューに対応する視角の1つ又は複数の画像ブロックを計算することができる。従ってこれらの画像ブロックは、追加のビュー画像の1つ又は複数の部分画像を提供し得る。
第2の画像生成ユニット505は、ビュー画像を含む出力三次元画像を生成するように構成され、とりわけオートステレオスコピックディスプレイの全てのビュー画像を生成することができる。この具体例では、第2の画像生成ユニット505が、中間三次元画像に基づいて9つ全てのビュー画像の生成に進むことができる。
図5の第2の画像生成ユニット505の処理は、中間三次元画像の奥行情報を一切考慮しない。むしろ、第2の画像生成ユニット505は、中間三次元画像内の如何なるオブジェクト又は画素の奥行にも依存しない出力三次元画像を生成するための処理を行うことができる。この処理は、低複雑度をもたらす画像の二次元処理であり得る。
とりわけ第2の画像生成ユニット505は、異なる視角の中間三次元画像の画像ブロックの組合せに応じて、出力三次元画像の少なくとも一部を生成することができる。組合せは、とりわけ或る領域の画像ブロックの画像データ間の補間であり得る。補間は、典型的にはデータが計算される視方向の周囲の2つの最寄りの視方向に対応する2つの画像ブロック間であり得る。補間は線形補間とすることができ、従って組合せは直接の線形加重和であり得る。
具体例として、第1の画像生成ユニット503は、例えば(図1に関する)ビュー−3、0及び3の画像方向に対応するフル画像を生成することができる。次に第2の画像生成ユニット505は、ビュー2の画像データの生成に進むことができる。所与の領域について他の画像ブロックが与えられていない場合、その領域の画像データは、ビュー0及び3のビュー画像の画像データ間の補間によって生成され得る。しかし、別の領域では、中間三次元画像がビュー1の画像ブロックも含み得る。その場合、第1の画像生成ユニット503は、ビュー1とビュー3との間の補間によってビュー2の画像データの生成に進むことができる。
従って第2の画像生成ユニット505は、比較的複雑度が低く計算的に多くを求めないプロセスを使用することができる。とりわけ、計算的要求は第1の画像生成ユニット503の計算的要求よりも概して大幅に低い。しかし、非奥行ベースの処理により、このプロセスは典型的にはビューの正しい画像への近似のみをもたらし、とりわけ奥行を考慮しないことによる三次元アーティファクトを取り込む傾向がある。
従って、画質の観点からは第1の画像生成ユニット503の奥行ベースの処理を使用して画像データを生成することが望ましいが、計算資源の観点からは、第2の画像生成ユニット505の非奥行処理を使用して画像データを生成することが望ましい。
図5のオートステレオスコピックディスプレイは、中間三次元画像及び第1の画像生成ユニット503がそこから中間画像を生成するように構成される三次元シーン表現の少なくとも一方の特性に応じて、第1の領域内で第1の画像生成ユニット503によって生成される画像ブロックの数を適合させるように構成されるアダプタ509を更に含む。表現は、とりわけそこから中間三次元画像が生成される入力画像又は三次元モデルであり得る。一部の実施形態では、アダプタ509が、第1の画像生成ユニットへの入力画像、及びとりわけ第1の領域の近傍の画像特性に応じて画像ブロックの数を適合させるように構成され得る。
以下の説明では、中間三次元画像又は入力三次元画像の少なくとも一方における特性(とりわけコントラスト又は奥行等の画像特性)に応じて画像ブロックの数が適合される実施形態にまず焦点を当てる。
第1の領域は、例えば中間三次元画像の二次元(基準)画像内の空間領域として、又は同等に中間三次元画像の二次元(基準)画像内の画素群(又はサブピクセル)として定められる空間領域であり得る。
第1の画像領域は基準画像の一部とすることができ、典型的には総画像領域の例えば50%、25%、又は10%未満であり得る。第1の画像領域は基準画像の一部とすることができ、典型的には総画像領域の例えば0.1%、0.5%、1%、5%、又は10%を上回り得る。多くの実施形態において、画像は複数の画像領域(多くの場合、少なくとも5個若しくは10個の画像領域、及び/又は多くの場合50個、100個、若しくは500個以下の領域)に分割され得る。
多くの実施形態において、第1の領域は基準画像の10画素、100画素、1000画素、更には1000画素を超える大きさを有し得る。
明瞭且つ簡潔にするために、以下の説明は適合が複数の領域について行われる手法に焦点を当てる。第1の領域はそれらの領域の何れかであり得ることが理解されよう。
従って図5のシステムでは、中間三次元画像内で表される視角の数が動的且つ局所的に適合され得る。視角の数は、異なる領域ごとに異なり得る。とりわけ所与の領域では、中間三次元画像が異なる視方向/視角に対応する或る数の画像ブロックを含み得る。所与の領域の画像ブロックの数は、画像特性に基づいて、とりわけその領域の近傍の画像特性に基づいてアダプタ509によって適合され得る。従って第1の画像生成ユニット503によって画像情報が生成される視角の数は、局所的画像特性に基づいて適合される。
局所的画像特性に基づいて第1の画像生成ユニット503によって生成される画像ブロックの数を適合させることは、概して計算資源使用量と画質との間のトレードオフの動的且つ局所化された適合をアダプタ509が行うことを可能にする。第1の画像生成ユニット503によってレンダリングされる画像ブロックが多いほど、完全な奥行ベースの計算に基づくより多くの画像情報を入手できるため、その結果生じる第2の画像生成ユニット505によって生成されるビュー画像の質が高くなる。しかし、或る領域についてレンダリングされる画像ブロックが少ないほど、欠落情報を生成するための第2の画像生成ユニット505による処理が完全な奥行ベースの処理よりもはるかに少ない計算資源を概して必要とするため、計算資源は少なくなる。以下、第1の画像生成ユニット503による奥行ベースのレンダリングもレンダリングと呼ぶ。
従って、アダプタ509は、第1の画像生成ユニット503の奥行ベースのレンダリングに基づいて所与のビュー画像の画像データを計算することと、第2の画像生成ユニット505の非奥行ベースの処理に基づいて所与のビュー画像の画像データを計算することとの間のトレードオフの局所化された適合を行うことができる。
例えば、幾つかの領域が中間三次元画像について、及び同等に入力三次元画像について決定され得る。
アダプタ509は、例えば中間三次元画像を幾つかの領域に分割することができ、領域の近傍における中間三次元画像の局所的画像特性を領域ごとに決定することができる。領域の大きさ及び/又は形状は様々な実施形態において異なることができ、例えば画像特性に応じて動的に変わり得る。
例えば一部の実施形態では、アダプタ509が中間三次元画像を様々な画像セグメントに(例えば当業者に知られているように色及び/又は輝度に基づいて)区分化することができる。この区分化は、様々な画像オブジェクトの識別情報を直接与えることができ、又は一部の実施形態では決定されたセグメントが例えば画像オブジェクトへと組み合わせられ得る。
別の例として、第1の三次元画像が所定の大きさ及び位置の領域へと分割され得る。例えば画像は、所定の大きさの矩形画像領域の格子へと分割され得る。実際に多くの実施形態において、各領域は単一の画素に対応し得る。
領域は、例えば中間三次元画像の1つの二次元画像に対して定められ得る。例えば領域は、中間三次元画像の中央ビュー画像に対して定められ得る。この画像(又は画像キャンバス)内では、領域が画素群として定められ得る。実際に、各画素が領域と見なされ得る。一部の実施形態では、かかる基準画像が、例えば矩形画素群の格子への所定の一定分割によって画素領域へと分割され得る。
次いでアダプタは、領域ごとに適切な画像特性を決定することに進むことができ、画像特性は領域の近傍内で決定される。画像特性は、基準画像を解析することによって決定され得、又は例えば中間三次元画像の他の画像の対応する部分を解析することによって生成され得る。
例えば一部の実施形態では、アダプタ509は、中間三次元画像の基準画像を矩形画素群の格子へと分割することができる。例えば1920×1080画素は、それぞれ240×135画素によって形成される64個の領域に分割され得る。それらの領域のそれぞれについて、アダプタ509は領域の近傍内の画素の主要な色範囲を決定することができる。近傍は、とりわけ領域に直接対応することができ、従って領域ごとに決定される画像特性は、例えば領域内の基準画像の画素の中央彩度値又は平均彩度値(例えばYUV色表現の平均UV値)であり得る。一部のシナリオでは、彩度分散値(chroma variance)も決定され得る。
この平均彩度(及び任意選択的に分散値)に基づき、アダプタ509は領域の画像ブロックの数、即ち第1の画像生成ユニット503によって領域の画像データが生成される異なる視角の数を決定することができる。例えば、アダプタ509は、平均彩度が人間の肌の色合いに一致すると考えられる範囲内にあるかどうかを評価することができる。人間の肌の色合いに一致すると考えられる範囲内にある場合、且つ彩度分散値が十分低い場合、アダプタ509はその領域を潜在的な人間の皮膚領域として指定する。
次いでアダプタ509は、潜在的な人間の皮膚領域として指定されているかどうかに応じて、或る領域のために生成する画像ブロックの数を選択することができる。例えば、潜在的な人間の皮膚領域では、オートステレオスコピックディスプレイ構成部301の全ての視角について画像ブロックが生成され得る。しかし、他の全ての領域では、視角のサブセットについてのみ画像ブロックが生成される。例えば、9ビューのオートステレオスコピックディスプレイの各視角に対応する9個の画像ブロックが潜在的な人間の皮膚領域のために生成され得るのに対し、他の領域では例えばビュー−3、0及び+3に対応する3個の画像ブロックのみが生成される。
このようにして、計算資源を犠牲にして、人間の皮膚に対応する可能性が高い領域について品質向上が実現される。このことは、全体的な計算資源使用量を依然として低く抑えつつ、例えば人間の顔の画質及び三次元認識を改善することができる。
画像特性が決定される近傍の大きさ及び/又は形状は、様々な実施形態及びシナリオごとに異なることができ、それぞれの実施形態の特定の要件及び選択に依存することが理解されよう。
例えば画像特性は、領域よりも大きい、且つ場合により大幅に大きい近傍内の例えばコントラストの測度又は奥行の測度であるとしばしば決定され得る。例えば各画素が領域に対応する場合、画素の周りの領域内の画素を検討することによってコントラストの測度が決定され得る。領域は、例えばソフト遷移をもたらす加重空間フィルタによって決定され得る。
多くの実施形態において、領域の近傍は、領域の画素まで例えば50画素、100画素、250画素、又は500画素以下の距離を有する画素群であり得る。多くの実施形態において、領域の近傍は、領域の画素まで中間三次元画像の垂直寸法の5%、10%、又は例えば20%以下の垂直距離を有し、領域の画素まで中間三次元画像の水平寸法の5%、10%、又は例えば20%以下の水平距離を有する画素群であり得る。垂直寸法及び水平寸法は、例えば垂直又は水平の画素分解能として、即ち画像の画素行又は画素列の総数として測定され得る。
第1の領域の近傍は、第1の画素に属する少なくとも1つの画素を含む領域であり得る。
画像特性の決定は中間三次元画像に基づくことができ、中間三次元画像のためにどの画像ブロックが生成されるのかを適合させるために画像特性が使用され得ることが理解されよう。従って、例えば中間三次元画像の一部(中央画像又は別の基準画像等)が最初に生成される反復的手法が使用され得る。この画像に基づき、1つ又は複数の領域の画像特性が生成され得る。その結果生じる画像特性に基づき、アダプタ509はどの追加の画像ブロックを生成するのかを決定することができる。
上記の説明では、画像特性が中間三次元画像に基づいて決定された。しかし、領域の画像特性は中間三次元画像を評価し又は解析することによって直接決定される必要はなく、例えば中間三次元画像の画像特性の指示を与え得る特性を解析することによって決定され得ることが理解されよう。
とりわけ、中間三次元画像が入力三次元画像から生成される例では、入力三次元画像と中間三次元画像との間に密接な対応関係がある。実際に多くの実施形態において、画像特性は入力三次元画像を解析することによって生成され得る。
実際に、中間三次元画像内の領域と入力三次元画像内の領域との間に対応関係があることが理解されよう。例えば、中間三次元画像の中央ビュー画像に対して定められる領域では、対応する領域が入力三次元画像の画像内に存在すると考えられ得る。例えば画像が、関連する奥行マップを有する単一の中央二次元画像として与えられる場合、入力三次元画像の中央画像内の画素群が入力三次元画像の二次元画像内の同じ画素群に直接対応し得る。
基準画像に対して領域が定められる当該基準画像と、入力三次元画像又は中間三次元画像に基づいて画像特性が決定される当該入力三次元画像又は中間三次元画像の画像との間に角度差があるシナリオでは、対応する視差が考慮され得る。例えば、中間三次元画像の中央画像の領域の画像特性は、画像間の視角差を反映するようにシフトされる領域内の別の画像の画像特性を評価することによって決定され得る。しかし、一部のシナリオでは、かかるシフトが補償されない場合があり、同じ領域が単純に検討される(例えば画像特性が決定される近傍に比べてシフトが十分小さいと考えられる場合、又はセクションが完全な画素行を含む場合)。
例えば或る視方向に対して定められる画像(例えば中央画像又は基準画像)の領域に関する画像特性の指示は、他の視方向のデータを検討することによって決定され得ることも理解されよう。例えば、中央画像内の画素の奥行の指示は、基準中央画像の両側の視角について2つの画像の画素間の視差を測定することによって決定され得る(実際にそれらの2つの画像は中間三次元画像の二次元画像又は入力三次元画像の二次元画像とすることができ、例えばそれらの画像は入力左目画像及び入力右目画像であり得る)。
一部の実施形態では、画像特性がとりわけ近傍の奥行の測度であり得る。アダプタ509は、第1の領域の近傍の奥行の測度に応じて第1の領域の画像ブロックの数を決定するように構成され得る。領域の奥行の測度は、領域の近傍内の奥行の特性を示す。
一部の実施形態では、画像特性が、とりわけ近傍のコントラストの測度であり得る。アダプタ509は、第1の領域の近傍のコントラストの測度に応じて第1の領域の画像ブロックの数を決定するように構成され得る。領域のコントラストの測度は、領域の近傍内のコントラストの特性を示す。
多くの実施形態において、アダプタ509は、第1の領域の近傍のコントラストの測度及び奥行の測度の両方に応じて第1の領域の画像ブロックの数を決定するように有利に構成され得る。
測度が決定される近傍の大きさは領域の大きさと同じである必要はなく、領域の大きさよりも大きい又は小さいことができることが理解されよう。奥行の測度及びコントラストの測度を決定するのに使用される近傍は、同じであり得るか又は異なり得る。
例えばコントラストの測度は、領域よりも大きい、ことによると大幅に大きい近傍内の輝度又はカラーチャネルの強度値の変化を反映するように多くの場合に決定され得る。例えば各画素が領域に対応する場合、画素の周りの領域内の画素を検討することによってコントラストの測度が決定され得る。領域は、例えばソフト遷移をもたらす加重空間フィルタによって決定され得る。
別の例として、多くの実施形態において、奥行の測度は例えば領域の近傍内の画素の平均奥行値又は加重奥行値として決定され得る。例えば1つの画素に対応する領域では、奥行の測度は画素の周りの領域の平均奥行値であり得る。概して奥行の測度は、幾らかの空間的フィルタリング又は平均化を含むように計算される。例えば領域が画像のセグメント又はオブジェクトに対応する場合、奥行の測度は領域内の全ての奥行レベルの平均値、最小値、最大値、又は中央値として計算され得る。一部の実施形態では近傍が領域よりも小さい。例えば大きい画像セグメントが識別される場合、奥行の測度は画像セグメントの中央付近の画素の平均奥行レベルとして生成され得る。
奥行はしばしば視差値によって表されることがあり、そのため、値は基準となる画面の水平面までの距離を反映し得る。非奥行ベースの処理を使用することによる認識可能なアーティファクト量及び劣化量は、概して連続したz値の奥行よりも視差値に良く関係するため、このことは多くのシナリオにおいて魅力的である。例えば無限の奥行は、例えば65mmの画素視差に対応し得る。かかる奥行の範囲について引き起こされるアーティファクト/ぼけの量は、[0;∞]の奥行スケールよりも[0;65mm]の奥行スケールによってより良く表される傾向がある。あり得る奥行の測度の例は、例えば視差値の平均値、中央値、最大値、又は二乗平均(RMS:root-mean-square)を含む。
奥行の測度は、単一の奥行値として決定され又は計算される必要はないことが理解されよう。例えば、領域間の視差は領域の奥行に直接依存し、視差は対応する画像領域がどの程度同様か(又は同様でないか)に反映され得るため、領域間の視差は適切な奥行の指示/測度を与えることができる。従って、それぞれの奥行値を明確に計算/推定する必要はない。むしろ、代わりにシステムは明確な奥行値ではなく複数のビューを含む三次元画像を得ることができる(例えば奥行マップが得られないことができる)。その場合、ビューの差が奥行を示し、使用され得る。例えばシステムは、得られたビューを評価し、(領域の近傍内の)そのビューの画像コンテンツと(典型的には)近傍のビューの対応する画像コンテンツとの差に基づいて画像ブロックの数を適合させるように構成され得る。
一部の実施形態では、例えば第1の三次元画像が奥行マップ又は視差マップを有する画像として与えられることにより、奥行値がアダプタ509にとって直接入手可能であり得る。入力三次元画像が異なる視角に対応する複数の画像によって形成される場合等の他の実施形態では、奥行値が受信画像から最初に計算され得る。例えば、2つの画像を比較することによって視差マップが生成され得る。次いで、例えば平均化効果を与える空間フィルタリングを適用することにより、生成済みの視差マップから局所的な奥行の測度が計算され得る。
多くの実施形態において、奥行の測度は表示画面レベルに対応する、即ち様々なビューについて投影画像内に視差がない奥行に対応する基準奥行からの奥行のずれを示し得る。従って、奥行の測度は、基準となる画面レベルの奥行からの領域の近傍内の奥行のずれを示すものであり得る。一部の実施形態では、奥行が視差値によって直接表され得、従って奥行はゼロ視差に対応する奥行と比べて直接与えられる。
アダプタ509は、例えば或る領域の局所的なコントラストの測度を生成することができ、局所的なコントラストの測度は画素の近傍内の明度/強度の変化(例えば画素の輝度の変化又は単一のカラーチャネル内の強度)を示す。
従って、コントラストの測度は、例えば画素/セグメントの周りの近傍について生成され得る。近傍は、例えば各画素の周りの所定の領域と見なすことができ、又は例えば動的に決定され得る。例えば近傍の大きさは、例えば画素の奥行値、平均明度レベル等に基づいて動的に変えられ得る。近傍は画然とした境界を有することができ、又は段階的遷移を有し得ることが理解されよう。アダプタ509は明確に領域を決定する必要はないが、これはコントラストの測度を決定するために使用されるアルゴリズムに概して固有であり得ることも理解されよう。
アダプタ509は、コントラストの測度を決定するために任意の適切なアルゴリズムを使用することができる。例えば一部の実施形態では、空間的高域フィルタリングを行うことができ、その後で空間的平均化が続き局所的な輝度の変化の指示を生成する。別の例として、画像の遷移(輝度及び/又は彩度)が識別され得、遷移のグラジェントとしてコントラストの測度が決定され得る。一部の実施形態では、局所的なコントラストの測度は、現在の画素と画素の近傍との間の(例えば知覚的に重み付けされた)明度差のように単純であり得る。
別の例として、コントラストの測度は、例えば近傍ビュー間の輝度及び/又は色距離の測度に基づくコントラストの推定値として生成され得る。適切な色距離の測度は、好ましくはバンドフィルタ信号(S−CIELAB)のLb ΔE等の知覚距離の差分絶対値和(SAD:sum of absolute differences)、差分ニ乗和(SSD:sum of squared differences)、及び近似値(approximations)を含む。
多くの実施形態において、アダプタ509はコントラストの測度を水平なコントラストの測度として生成するように構成され得る。従って、水平方向の輝度又は強度の変化は考慮され得るのに対し、垂直方向の輝度又は強度の変化は実質的に無視され得る。
このことは多くの実施形態において性能の改善をもたらすことができ、とりわけ画像ブロックの適合を知覚される通りの画像により緊密に順応させることを可能にし得る。特に、三次元効果が垂直ではなく水平の変位及び視差を引き起こすことにより、遷移が水平方向に生じる場合、高コントラスト領域の影響が著しい視角的アーティファクトを取り込む可能性があるが、遷移が垂直方向に生じる場合はそうはならない。本発明者らは、水平コントラストを特に検討することにより、奥行及び/又は色合いのマッピングを局所的に適合させることによって可能な品質改善が大幅に高められ得ることを認識した。
画像変換部505は、局所的なコントラスト及び/又は奥行の測度に応じて、第1の画像生成ユニット503による完全な奥行ベースの処理によって画像データが生成される視角の数を局所的に適合させるように然るべく構成される。とりわけアダプタ509は、増加するコントラストの測度及び/又は奥行の測度について(即ち増加するコントラスト又は奥行を示す測度について)異なる視方向に対応する画像ブロックの数を増やすように構成され得る。画像ブロックの数は、コントラストの測度の単調増加関数及び/又は奥行の測度の単調増加関数であり得る。
図5のシステムは、画質(三次元体験及び知覚の改善を含む)と計算資源使用量との間のトレードオフの改善をもたらし得る。とりわけ多くのシナリオで、所与の計算資源使用量と引き換えに画質の改善が実現され、且つ/又は所与の画質と引き換えに計算資源使用量の減少が実現される。これは、局所的なコントラスト及び/又は奥行に応じて、奥行ベースの処理によって特定の画像データが生成される視角の量を局所的に適合させることによって特に実現され得る。
とりわけ本発明者らは、所与の領域の画像ブロックの数を動的に適合させることにより、単純な補間又は同様の非奥行ベースの手法から様々なビューの画像データを決定することによって引き起こされる劣化の影響が最小化され得ることを認識した。局所的な奥行及び/又はコントラストに適合を基づかせることは、とりわけ単純化された処理に敏感である可能性が最も高い領域に計算資源を集中させることを可能にする。
このことは図6の画像の一例を検討することによって説明され得る。この例は、画像のクロストークアーティファクト、とりわけゴースティングを示す。この画像では、コントラスト及び奥行のずれが非常に大きい第1の領域601を見て取ることができる。この領域内では、知覚画質を大幅に低下させる高度のゴースティングが認められ得る。対照的に、別の画像領域603はほぼ基準奥行レベルにあり、即ち奥行のずれはほぼない。この領域内では、比較的高度のコントラストにも関わらず事実上ゴースティングはなく、従って事実上クロストークアーティファクトがない。更に別の画像領域605では、奥行のずれが非常に大きいがコントラストレベルは非常に低い。この領域内では、ゴースティング効果があり得るが、非常に目立つアーティファクトは発生させない。従って、見て分かるように、奥行のずれ及びコントラストが大きい場合に高度な劣化が起こるのに対し、奥行のずれ及びコントラストが小さい場合は低度の劣化が生じる。
本発明者らは、複雑な奥行ベースの処理と単純化された非奥行ベースの処理とのバランスを局所的なコントラスト及び奥行の測度に基づいて局所的に適合させることにより、単純化された処理によって引き起こされる劣化の存在及び知覚的有意性が管理され得ることを認めた。実際にこの手法は、使用可能な計算能力を集中させることができるように、知覚的に特に敏感なセクションが識別されることを可能にし得る。
奥行は、異なるビューの画像間に視差及びオフセットがどの程度あるのかを示すものであると考えることができ、即ち異なるビューの画像がどの程度類似しているのか又は異なるのかについての指示であると考えることができる。そのため、奥行は完全な奥行ベースの処理の知覚的有意性の指示として理解され得る。
同様に、局所的なコントラストは、視角的(輝度/彩度)領域内で画像がどの程度異なるのかについての指示として捉えることができ、従って例えば単純な補間によってどのように大きい誤りが取り込まれるのかについての指示として捉えられ得る。
従って、局所的な奥行及びコントラストを一緒に検討することにより、特定の領域内で劣化がどの程度有意であり得るのかについての特に優れた指示が得られ得る。従って、2つの測度は知覚的影響についての優れた指示を相乗的にもたらし、1つのパラメータのみを検討する場合よりも知覚的影響を正確に表す情報を提供することができる。とりわけ、局所的な奥行及びコントラストを一緒に検討することは、重要な領域がより正確に識別されることを可能にし得る。
従って一部の実施形態では、アダプタ509は、局所的な奥行及びコントラストに応じて画像ブロックを生成するために、第1の画像生成ユニット503によって使用されるレンダリングパイプの数を局所的に調節するように構成される。ディスプレイの基準面(ビュー間の視差がないことに対応する)からの奥行のずれが(画面の前後に)増加すると、近傍のビューがより離れ離れになり、即ち画素の視差が増加する。増加する視差に対してより多くの画像ブロックを生成することにより、隣接する2つの画像間の視差が低く保たれ、それにより第2の画像生成ユニット505による改善された補間を可能にすることが実現され得る。記載の手法では、領域の現在の画像ブロック間の視差が高過ぎる場合、例えば追加の画像ブロックを作成することにより、隣接するビュー間の画素のシフトが所与の閾値未満に保たれ得る。全画像/シーケンスについてレンダリングされるビューの数を増やすのではなく、この手法は、奥行が大きい領域内でのみビューの数を増やし、それにより計算資源使用量を減らすことができる。
隣接するビュー間のこのシフトは、低コントラスト領域よりも高コントラスト領域内でより認識できる。実際に、コントラストが低い場合、その結果生じる補間値は完全な三次元処理によって生成される値と殆ど変らない可能性が高い。従って、視差が比較的高くても追加の画像ブロックを生成する必要がない場合がある。
一部の実施形態では、アダプタ509が、第1の画像生成機器の計算資源の可用性に応じて、複数の領域のうちの少なくとも1つの領域について第1の画像生成ユニット503によって生成される画像ブロックの数を決定するように構成され得る。
実際に多くのシナリオで、アダプタ509は、計算資源の総需要が所与の計算資源の可用性を超えないがそれに達するように、中間三次元画像の画像ブロックの数を選択することができる。
一例として、ディスプレイドライバ501は、動画像列の一部である入力三次元画像を実時間で処理することができる。従って、フレームごとに入力三次元画像が得られ、出力三次元画像が生成される。第1の画像生成ユニット503は、所定数のNビュー画像を生成するように構成され得、各ビュー画像はオートステレオスコピックディスプレイ構成部301の視角ごとに生成され、Nはオートステレオスコピックディスプレイ構成部301のビューの総数Mよりも小さい。
例えばM=15ビューのオートステレオスコピックディスプレイ構成部301では、第1の画像生成ユニット503が、(例えば関連する奥行マップを有する二次元画像として与えられ得る)フレームの入力三次元画像から常に例えばN=3のフルビュー画像を生成するように構成され得る。
この処理に必要な計算資源は比較的正確に推定され得る(又は少なくとも最大計算資源が推定され得る)。加えて、第1の画像生成ユニット503は更なる予備の可用資源を有することができ、予備資源の量はアダプタ509によって知られていても、推定されても、又は仮定され得る。例えば、第1の画像生成ユニット503の処理は、フレームごとに例えばK=100の追加の画像ブロックを生成するのに予備資源が十分であると仮定することができる。(Kは例えばアダプタ509によって動的に適合され得る)。
アダプタ509は、奥行及びコントラストの測度を領域ごとに然るべく決定することができ、領域の複合的な有意性の測度を生成することができ、有意性の測度は局所的なコントラスト及び奥行の両方を反映する。次いで、アダプタ509は領域の優先順位付けに進み、領域の有意性の測度に基づいて領域ごとに生成される画像ブロックの数を決定することができる。例えば有意性の測度が十分高い場合、第1の画像生成ユニット503がオートステレオスコピックディスプレイ構成部301の視角ごとに画像ブロックを生成すべきであると決定され得る。有意性の測度が低い場合、例えば1つおきの視方向について画像ブロックが生成されると決定される場合があり、その領域について5個の追加の画像ブロックが生成されることになる。
このようにしてアダプタ509は、資源プールが使用されるまで、即ちこの具体例では100個の画像ブロックが割り当てられるまで、領域への画像ブロックの割当を進めることができる。このようにしてアダプタ509は、奥行ベースの処理が最大限の効果を有する特定の画像部分に可用資源を集中させることができる。
従って一部の実施形態では、アダプタ509は、局所的な奥行及びコントラストの測度に応じてK画像ブロックに資源を割り当てる優先順位付けメカニズムを実装することができ、Kは使用可能なハードウェア資源によって計算可能であると分かっている又は予期される画像ブロックの数である。Kの数は一定とすることができ、又は例えば時間が決まった帰還ループ内で実行時に推定され得る。一部の実施形態では、約(又は最大)Kの有意性(又は奥行若しくはコントラスト)の測度がλよりも大きいように閾値λが推定され得る。次いで、第1の画像生成ユニット503は入力三次元画像を処理し、それらの領域の追加の画像ブロックを生成することができ、有意性(又は奥行若しくはコントラスト)の測度は閾値λを上回る。
多くの実施形態において、領域の少なくとも1つ、典型的には全てが1つ又は複数の画素行によって形成され得る。従ってかかる実施形態では、領域が画素行の一部のみを含むのではなく、全画素行が含まれるか、又は画素行の画素が含まれない。具体例として、領域は中間三次元画像の中央二次元画像を画素行へと分割することによって生成され得、即ち各画素行が1つの領域を形成することができ、同等に各領域が1つの画素行によって形成される。他の実施形態では、領域の1つ又は複数が隣接する複数の画素行を含んだ状態で、より少数の領域が生成され得る。
他の実施形態では、領域が全画素行によって形成されないことができる場合があり、実際には画素行の画素のサブセットのみが含まれる1つ又は複数の領域を含み得る。この形態は更なる柔軟性をもたらすことができ、追加の画像ブロックを生成する領域を選択する際のより細かな粒度を可能にし得る。一部の実施形態では、かかる形態が計算資源を減らし得る。
しかし、全画素行に基づく領域を使用することが多くの実施形態においてとりわけ有利であり得る。特にビューシフト、デオクルージョン等の三次元処理が水平の視差、従って画素行ベースの処理に基づく。多くの実施形態において、全画素行を処理することと、画素行の一部のみを処理することとの計算資源使用量の差は非常に小さい可能性がある。実際に多くのシナリオで、画素行をより小さいセクションに分割し、セクションごとに測度を決定し、各セクションを評価すること等に必要な追加資源は、全画素行を処理するのに必要な追加資源よりもかなり多い場合がある。従って、領域を全画素行に基づかせることは多くの場合、複雑さを減らせるだけでなく全体的な資源使用量も減らし得る。
更に、奥行ベースの処理は概して行型の操作であり、それにより複雑さ及び資源使用量を減らすだけでなく、この手法は典型的には画質の改善ももたらし得る。例えば、近傍画素が視差シフトされない一方で画素行の一部の画素が視差シフトされる場合、エッジ式のアーティファクトが生成され得る。
先に述べたように、一部の実施形態では反復的手法が使用され得る。
一例として、第1の画像生成ユニット503は、第1の数の視方向について全領域の画像ブロックの生成にまず進むことができる。1つの視方向の全領域について画像ブロックを生成することにより、その視方向の完全な画像が生成される。第1の画像生成ユニット503は、最初にそのような幾つかの完全なビュー画像の生成に進むことができる。例えば、先に述べた例のように、第1の画像生成ユニット503は、M=15ビューのオートステレオスコピックディスプレイ構成部301のN=3の完全なビュー画像を生成することができる。
その後、オートステレオスコピックディスプレイ構成部301は、領域のそれぞれについて、例えば画素行ごとに等、奥行の測度の生成に進むことができる。奥行の測度は、既に生成されているビュー画像に基づいて生成され得る。とりわけ、個々の領域の生成済みのビュー画像間の視差が決定され得る。例えば行ベースの手法では、既に生成されている画像ブロックに基づいて、即ち生成済みのビュー画像の画素行に基づいて最大視差又は平均(又は例えばRMS)視差が行ごとに決定され得る。
次いでアダプタ509は、それらの視差に基づき、新たなビューに対応する更なる画像ブロックが生成されるべき領域の選択に進むことができる。例えば第1の画像生成ユニット503は、各ビュー画像が例えば1080画素行の垂直分解能を有する中間三次元画像の追加の200画素行を処理する予備容量を有し得る。その場合、アダプタ509は、視差の測度が最も高い200画素行の選択に進むことができる。それらの画素行では、オートステレオスコピックディスプレイ構成部301の残りの視方向に対応する追加の画像ブロックが生成され得る。
アダプタ509は、選択領域の全てのビューについて画像ブロックを生成しないことができることが理解されよう。例えば一部の実施形態では、アダプタ509は、奥行の測度又はコントラストの測度が第1の閾値を上回る領域に関するオートステレオスコピックディスプレイ構成部301の全てのビューの画像ブロックが生成されるように取り決め、奥行の測度又はコントラストの測度が第1の閾値を下回るが第2の閾値を上回る領域の1つおきのビューの画像ブロックが生成されるように取り決め、奥行の測度又はコントラストの測度が第2の閾値を下回るが第3の閾値を上回る領域の2つおき等のビューの画像ブロックが生成されるように取り決めることができる。
一部の実施形態では、アダプタ509は、更なる視角の画像ブロックを生成する領域を、その領域の視差の測度が閾値を上回ることに応答して選択するように構成され得る。視差の測度は、隣接する2つの視角について既に生成されている2つの画像ブロックの視差の測度であり得る。視差の測度が閾値を上回る場合、アダプタ509は第1の画像生成ユニット503を制御して、測度が生成された隣接する2つの視方向間の視方向の追加の画像ブロックの生成に進む。典型的には、中間視角の画像ブロックが生成され得る。
例えば所与の画素行について、アダプタ509は、既に生成されている画像ブロックの全ての対を解析することができる。その対の何れかが所与の閾値を上回る視差値(例えば平均視差、最大視差、又はRMS視差)をもたらす場合、アダプタ509は第1の画像生成ユニット503を制御して、画像ブロックの対の視角の中間である視角について画素行の画像データを生成することができる。このようにして、隣接する2つの画像ブロック間の視差が大き過ぎるたびに新たな画素行の画像ブロックが生成される。このプロセスは、例えば隣接する画像ブロック間の全ての視差が閾値を下回るまで各画素行について反復され得る。この手法は全ての画素行に対して更に行われ得、それにより第1の画像生成ユニット503の奥行ベースの処理が、最大視差が閾値を下回る画像データを与えることを確実にする。
従って、領域について生成される画像ブロックの数は、この画像ブロックの数が生成されていることを受けてアダプタ509によって明確に決定される必要はなく、例えば既存の画像ブロックの視差に応じて追加の画像ブロックを継続的に生成する例えば反復的プロセスは、局所的画像特性に応じて様々な数の画像ブロックが領域ごとに生成されることをもたらすことが理解されよう。
別の例として、アダプタ509は、隣接する/近傍の視角/視方向を有する画像ブロックの各対の画素行ごとに視差の測度をまず決定することができる。アダプタ509は、生成される全ての視差の測度を、視差の測度の大きさに応じて並べられる表の中に記憶することができる。次いでアダプタ509は、計算される最も大きい視差の測度を選択し、第1の画像生成ユニット503を制御して2つの画像ブロックの視角間の視角の追加の画像ブロックの生成を進めることができる。最も大きい視差の測度が削除され得、代わりに隣接する2つの新たな画像ブロックの対のそれぞれについて視差の測度が計算され得る。これらの2つの新たな視差の測度は、視差の測度の表に追加され得る。次いでアダプタ509は、視差の測度が最も大きい画像ブロックの対を選択し、その対の間の新たな画像ブロックを生成し、前の視差の測度を削除し、新たな2つの視差の測度を追加するプロセスを繰り返すことができる。このプロセスは、処理時間がなくなるまで繰り返され得る。従ってかかる手法では、アダプタ509は、視差が最も大きい特定の領域に資源を常に割り当てることを進めることができる。その結果、最も重要である可能性が高いセクションに計算資源が集中される。
一部の実施形態では、アダプタ509は、奥行の測度が閾値を下回る領域のサブセットを決定するように構成され得る。例えば、単一の二次元画像及び関連する奥行マップを含む入力画像では、アダプタ509は、奥行マップを走査することによって画素行ごとの最大奥行を決定することができる。最大奥行は閾値と比較され得、最大奥行が閾値を下回る全ての画素行が識別され得る。
次いでアダプタ509は、識別された領域について画像ブロックを1つのみを生成するように第1の画像生成ユニット503の制御を進めることができる。従って、識別された画素行では1つの画像オブジェクトのみを含むように中間三次元画像が生成され、即ち画素値が1つの視方向についてのみ与えられる。視方向は、オートステレオスコピックディスプレイ構成部301の中央ビューにとりわけ対応することができ、例えば入力三次元画像の二次元画像の対応する行から対応する画素値を複製することによって単純に生成され得る。
従ってこの手法では、奥行が十分低い幾つかの領域が識別され、それらの領域では中間三次元画像のために二次元出力のみが生成される。従ってそれらの領域では、第2の画像生成ユニット505がオートステレオスコピックディスプレイ構成部301の全てのビューについて同じ画像データの生成を進め、とりわけ中間三次元画像から画像データを単純に複製することができる。従ってこの例では、奥行が非常に低い画素行が平らな二次元領域としてオートステレオスコピックディスプレイ構成部301によって示される。
この手法は計算資源使用量を大幅に減らせるだけでなく、例えばクロストークが低減され得るため、多くのシナリオで画質の改善ももたらし得る。この改善は三次元効果を減らすことによって実現され得るが、それは特に十分平らであると見なされる画像領域について行われるため、三次元効果が減ることは許容でき、実際多くの実施形態及び応用例において好ましい場合がある。
先の説明は中間三次元画像が入力三次元画像から生成される実施形態に焦点を当てた。しかし、述べたように一部の実施形態では、第1の画像生成ユニット503が代わりに(又は場合により加えて)グラフィカル三次元モデルを評価することによって中間三次元画像を生成するように構成され得る。従って一部の実施形態では、第1の画像生成ユニット503は、三次元シーンの三次元モデルに基づいて中間三次元画像を生成するように構成され得る。
例えばグラフィカル三次元モデルはゲーム用途に概して使用される場合があり、実際に現在多くのゲームが三次元シーンの幾何学的形状、肌理、及び光源の使用に基づいている。かかるシナリオでは、ゲーム中のユーザ入力に応じてシーンのビューを合成するために仮想遠近投影カメラが三次元モデルと共に使用される。
以下、とりわけ(これのみに限定されないが)三次元グラフィックスのOpenGL標準の使用に特に関係する幾つかの実施形態が説明される。とりわけ、OpenGLアプリケーションインタフェースによってグラフィックカードが制御され得る。OpenGL Shading Languageは、OpenGLによるレンダリングのためにグラフィックカードを使用する際の柔軟性を加える。以下、シーンの一部のみをメモリバッファに選択的に描画し、それにより計算の無駄をなくすために既存のOpenGLメカニズムを使用し得る手法が説明される。とりわけ、OpenGLメカニズムは、異なる領域の異なる画像ブロックを有する中間三次元画像を生成するために使用され、その後の出力三次元画像は中間画像から生成される。
以下の例では、中間三次元画像の視角と出力三次元画像の視角とが同じであり、とりわけ視角がオートステレオスコピックディスプレイ構成部301の視角に対応する。従って、オートステレオスコピックディスプレイ構成部301の視角について中間三次元画像の画像ブロックが生成される。但しこの例では、オートステレオスコピックディスプレイ構成部301の視角ごと(即ちビューごと)に完全な二次元画像を含むように出力三次元画像が生成されるのに対し、中間三次元画像は、視角の少なくとも一部の部分画像のみを含むように生成される。即ち、中間三次元画像の画像ブロックは、一部の領域内の一部の視角についてのみ第1の画像生成ユニット503によって生成され得る。
この例では、第1の画像生成ユニット503及び第2の画像生成ユニット505が同じ画像バッファを使用する。とりわけ機器は、オートステレオスコピックディスプレイ構成部301の視角ごとに画像バッファを含み得る。第1の画像生成ユニット503は、画像ブロックをまず生成し、それらの画像ブロックを適切なバッファ内に記憶することができる。所与の領域について、オートステレオスコピックディスプレイ構成部301の1つ又は複数の視角の画像ブロックが然るべく生成され、対応するバッファ内に記憶され得る。第1の画像生成ユニット503が画像ブロックを生成する視角の数、従ってバッファの数は、異なる領域ごとに(例えば典型的には領域内の奥行及び/又はコントラストに応じて)異なる。
図7は、2つのオブジェクトを有する三次元シーンの一例を示す。
第1のオブジェクト701の幾何学的配置は基準奥行、即ち表示奥行に近く、従って小さいパララックス/視差しかない。この幾何学的配置では、第1の画像生成ユニット503は中央ビューに概して対応する単一の視角についてのみ画像ブロックを生成し、それを出力三次元画像の全てのビューに使用することができる。実際に、視差が非常に低いと、全てのビューで同じ遠近感を使用し、それにより(オート)ステレオスコピックディスプレイ上で見たとき、オブジェクトの幾何学的配置を平面へと効率的に減らすことが許容できる。
第1の画像生成ユニット503は以下の操作を行うことができる。
1.第1のオブジェクト701のみを含むように近クリップ面及び遠クリップ面を設定する。
2.中央ビューの数に対応するようにOpenGLのビューポートを設定する。
3.シーンをレンダリングする。
4.その結果生じる第1のオブジェクトのデータを中央ビューの画像バッファ内に記憶する。
このようにして、第1の画像生成ユニット503は第1のオブジェクト701内の領域の単一の画像ブロックを生成する。
次いで第2の画像生成ユニット505が、中央ビューの画像バッファから他の全てのビューの画像ビューバッファに画像データを単純に複製することにより、出力三次元画像の対応する画素を生成することができる。
但し、このシーンは、基準奥行から離れており、従って高度のパララックス/視差を有する第2のオブジェクト703も含み得る。このオブジェクトに対しては異なる手法が使用される。とりわけ、第1の画像生成ユニット503は以下のステップを行うことができる。
1.第2のオブジェクト703のみを含むように近クリップ面及び遠クリップ面を設定する。
2.オートステレオスコピックディスプレイ構成部301の全てのビューにわたってループする。ループごとに、
a.現在のビューに対応するようにOpenGLのビューポートを設定し、
b.正しい遠近感を使用してそのビューのシーンをレンダリングし、
c.その結果生じる第2のオブジェクト703の画像データを現在のビューの画像バッファ内に記憶する。
このようにして、第1の画像生成ユニット503はあり得る全ての視角の画像ブロックを生成することができる。従ってこれらの画像ブロックについて、第2の画像生成ユニット505は、第1の画像生成ユニット503によって既に生成され、正しいバッファ内に記憶されている画像ブロックを直接使用することによって出力三次元画像を生成することができる。
図8は、これらの異なる例示的手法を示す。
一部の実施形態では、第2の画像生成ユニット505は、(第1のオブジェクト701に関する)第1の例において中央ビューから他のビューに画像ブロックを複製するとき、一定のパララックスを加えるように構成され得る。このことは、第2の画像生成ユニット505が第1のオブジェクト701を例えば画面奥行ではなく画面背後の面上に配置することを可能にし得る。この状況が図9に示されている。この視差及び奥行のシフトを取り入れるために、第2の画像生成ユニット505によって行われる複製操作が、第1のオブジェクト701の意図される奥行に応じて所与だけ水平シフトを引き起こし得る。
この例では、第1のオブジェクト701が中央ビューの画像ブロックによってのみ表された。他の例では、第1のオブジェクト701が、例えば1つおきの視角等、オートステレオスコピックディスプレイ構成部301の複数の視角の画像ブロックによって表され得る。その例が図10に示されている。この例では、第2の画像生成ユニット505が残りの視角の画像データを補間によって生成することができる。
レンダリングされるシーン上に表示されるテキスト又はグラフィックオーバレイは、画面のぼけ(out-of-screen blur)によるアーティファクトをしばしば引き起こす傾向がある。上記の手法と同様に、テキスト又はグラフィックオーバレイオブジェクトも、オートステレオスコピックディスプレイ構成部301の全てのビューに対して、同じ情報を複製することによって、又は例えば隣接するビュー間の一定のパララックス/視差を伴って効率的にレンダリングされ得る。
この操作は、例えばオーバレイオブジェクトを生成し、それを中央ビューのバッファ内に記憶する第1の画像生成ユニット503によって行われ得る。次いで、第2の画像生成ユニット505がそれを他の全てのビューに複製することができる。図11はかかる手法を示す。
一部の実施形態では、アダプタ(509)が三次元モデルの特性に応じて画像ブロックの数を適合させるように構成され得る。特性は、例えばモデルを評価することによって決定される特性、又はモデルの処理内で使用されるパラメータの特性であり得る。例えば特性は、例えば(典型的にはモデルの幾何学的配置に基づいて生成される)近クリップ面及び遠クリップ面等によって表される、画像オブジェクトが生成されるオブジェクトの奥行であり得る。別の例として、例えばオブジェクトの肌理の特性等、三次元モデルのオブジェクトの特性に基づいて画像ブロックの数が適合され得る。肌理が高コントラストの肌理である場合、肌理が低コントラストの肌理である場合よりも多くの画像ブロックが生成され得る。
データを他の画像バッファに複製するこの例は一例に過ぎず、他の多くの手法があり得ることが理解されよう。例えば、全てのビューバッファにデータを明確に複製する代わりに、第2の画像生成ユニット505はウィーブ画像を生成することができ、そのプロセスの一環として例えば特定の位置の画像データが記憶される最寄りのビューバッファからデータを直接得ることができる。同様に、記載された複製又は補間は、異なるようにレンダリングされる複数の部分から直接ウィーブすること、又はことによると選択マスクとして奥行バッファを使用してかかるバッファへのルックアップを有すること等、他の機能によって置換され又は強化され得る。
先の説明は、様々な空間的領域(空間的副区分)が画素値のブロックによって表される様々な数の視方向を有する(各ブロックは1つの視方向に対応する)中間画像から幾つかのビュー画像を有する出力画像を生成する手法を示す例を説明した。従って、出力画像の2段階生成によってプロセスが説明されている。まず、異なる視方向に対応する画素値のブロックを含む中間画像が生成される。更に、少なくとも一部の領域内でブロックの数が異なり、即ちブロックの数/表される視方向の数が空間的副区分間で異なる。次いで、中間画像の画素値ブロック(画像ブロック)から出力画像が生成される。
説明された例では、異なる視方向に対応するブロックの数は静的/一定/所定ではない。むしろ、アダプタが中間画像の特性又は基礎を成すシーンの表現の特性に基づいて異なる視方向の数を適合させる。従ってこれらの例は、個々の領域について与えられる視方向の数を画像の特性に基づいて適合させる手法を説明する。
更なる具体例として、青空の前に人間の顔と赤いボールとを含む画像が想像され得る。かかる画像では、システムが顔に対応する領域と、赤いボールに対応する領域との2つの領域を定めることができる。アダプタは、例えば領域内の色を評価し、顔に対応する領域が主に肌色であり得るのに対し、赤いボールに対応する領域が基本的に赤色であると決定することに進むことができる。次いでアダプタは、顔の領域のために、適切な範囲内で5度ごとに画像ブロックが生成されることを選択することができる(即ちアダプタは、主に肌色の領域について5度の差を必要とするアルゴリズムを実装することができる)。しかし、ボールの領域では、アダプタは20度ごとにのみ画像ブロックが生成されることを選択することができる(即ちアダプタは、主に赤色(又はことによると全般的に主に有色)の領域について20度の差を必要とするアルゴリズムを実装することができる)。
従って、例えば−20°〜+20°の範囲が有効範囲に含まれると仮定し、中間画像は、顔の領域では−20°、−15°、−10°、−5°、0°、5°、10°、15°、及び20°の画素値ブロックを有し、ボールの領域では−20°、0°、及び20°の画素値ブロックを有するように生成され得る。従って、画像の特性の特性により、或る領域は視点角度が近い9個の画像ブロックによって表されるのに対し、別の領域は視角差が大きい3個の画像ブロックによってのみ表される。
次いでこのシステムは、この中間画像から出力画像を生成することに進むことができる。但しこの処理は、異なる領域内の異なるブロック数に基づく。例えばシステムは、−10°の視方向の出力ビュー画像を生成することができる。この画像では、第2の画像生成ユニットが、顔の領域の−10°のブロックの画素値を選択することによって顔に対応する領域を直接生成することができる。しかし、ボールの領域では、第2の画像生成ユニットは、他の視方向に対応するブロックから画素値を生成しなければならない。例えば第2の画像生成ユニットは、−20°及び0°に対応するブロック間で補間することができる。
非常に単純化した例であるが、この例はシステムが(局所的)画像特性に基づく適合を行うこと、並びに第1段階のプロセス及び第2段階のプロセスの特定の特性間のトレードオフを行うことを記載の原理がどのように可能にし得るのかを示す。
先に記載された手法の原理は、中間画像を生成する又は中間画像から出力画像を生成する如何なる具体的態様にも依存せず、又はかかる具体的態様に限定されないことが理解されよう。
例えば、先に説明されたように、1つの選択肢は入力三次元画像に基づくビューシフトを行うことによって中間画像を生成することである。実際に、説明されたように、システムはビューシフト、デオクルージョン、画素シフト等を行うことができる。但しこれは一部の実施形態の例に過ぎず、この手法はかかる特定のプロセスに決して限定されず又は依存しない。実際に別の例は、例えば肌理及び光源の情報を含むシーンの三次元モデルから中間画像が生成されることである。
先の例は補間、とりわけ加重和を使用して出力画像を生成することに焦点を当てた。より広くは、第2の画像生成器は、例えば画像ブロックの組合せによって出力画像を生成することができる。但し、他の多くのあり得る組合せが可能であり、実際に組合せを行う必要はない。例えば第2の画像生成器は、最も近い視方向について生成される画像ブロック内のその位置における画素の画素値を画素ごとに単純に選択することにより、所与の視方向の画像を生成することができる。例えば上記の例では、顔の領域の画素は−10°の角度の画像ブロックの画素値として選択され得、ボールの領域の画素は、−20°(又は0°)の角度の画像ブロックの画素値として選択され得る。
更に、先の例と一致して、第1の画像生成ユニットによる中間画像の生成は実際に奥行情報に基づき得る。しかし、他の実施形態では、第1の画像生成ユニットによる中間画像の生成が奥行情報に基づかないことができる。例えば、外挿及び補間ベースのレンダリングを使用することは中間画像の画像ブロックを生成するためのあり得る手法である。
先の例は、第1の画像生成ユニットが奥行ベースのレンダリング/アルゴリズムを使用するのに対し、第2の画像生成ユニットが非奥行ベースのレンダリングを使用することに焦点を当てた。この形態は多くのシナリオにおいて特に有利な手法をもたらす。とりわけ多くの応用例で、第1の画像生成ユニットは、比較的高品質の画像ブロックを生成するために比較的複雑且つ資源を必要とする奥行ベースのアルゴリズムを使用し得るのに対し、第2の画像生成ユニットは、画像ブロックからビュー画像を生成するために比較的複雑度が低く且つ資源をあまり必要としないが精度の低い、非奥行ベースのアルゴリズムを使用することができる。例えば、第1の画像生成ユニットは、中間画像の画像ブロックを生成するために奥行ベースのビュー合成アルゴリズムを使用することができ、第2の画像生成ユニットは単純に補間する(更にはそれらから単に選択する)ことができる。その場合、この手法は第1の段階と第2の段階との間で空間的に多様な適合及びトレードオフを可能にし得る。
但し、他の実施形態では、第1の画像生成ユニットは、非奥行ベースのアルゴリズムを使用して高品質の画像ブロックを生成するように構成され得る。例えば、第1の画像生成ユニットは、異なる視方向に対応する多数の高品質の捕捉画像の形で入力を得るように構成され得る。第1の画像生成ユニットは、複雑な空間フィルタを適用することに基づく、及び受信画像の幾つかに基づく複雑な補間を適用することにより、領域の所要の画像ブロックの生成を進めることができる。次いで第2の画像生成ユニットは、例えば単純な補間によって、又は最も近い視方向を有する画像ブロックを選択することによって出力画像を生成することができる。かかる実施形態では、アダプタは、様々な領域内で表される画像視点の数を適合させることにより、依然として様々な段階の特性間のトレードオフをもたらすことができる。例えばアダプタは、より重要であると考えられる領域により多くの資源が割り当てられる適合を可能にし得る(例えば赤いボールの領域よりも顔の領域の画像ブロックを多く生成するのにより多くの資源が使用される)。
第2の画像生成ユニットが奥行ベースの処理を使用できることも指摘しておく。例えば上記の例では、中間画像が高画質(例えば高分解能、高色深度、高ダイナミックレンジ)で生成され得る。ビュー画像を生成するとき、第2の画像生成ユニットは奥行情報を考慮することができる。例えば第2の画像生成ユニットは、最も近い視方向を有する対応する画像ブロックからビューシフトすることによってビュー画像の画素を生成することができる。このビューシフトは、例えば入力画像と共に与えられるが第1の画像生成ユニットによって考慮されない低分解能奥行マップに基づき得る。従ってかかる実施形態では、中間画像の生成が非奥行ベースであり得るのに対し、中間画像から出力画像を生成することは奥行ベースであり得る。かかる手法は、例えばより多くの資源が適切な領域(例えば顔の領域)において費やされるような適合も可能にし得る。
第1の画像生成ユニットによって使用されるアルゴリズムが、第2の画像生成ユニットによって使用されるアルゴリズムよりも複雑であること、高品質であること、又は多くの資源を必要とすることは必要ないことも指摘しておく。かかる実施形態は多くのシナリオで特に有利な実装形態をもたらし得るが、この手法はそうでない実施形態にも適用され得る。例えばこの手法は、特に重要であると考えられる領域に資源を集中させることにより、全体的な知覚画質が改善される適合を依然として可能にし得る。
明瞭にするために、上記の説明では本発明の実施形態が様々な機能回路、ユニット、及びプロセッサに関して説明されたことが理解されよう。しかし、様々な機能回路、ユニット、又はプロセッサ間での任意の適切な機能分散が、本発明を損ねることなしに使用され得ることが明らかである。例えば、別々のプロセッサ又はコントローラによって実行されるように示されている機能が、同じプロセッサ又はコントローラによって実行され得る。従って、特定の機能ユニット又は回路への言及は、厳密な論理的又は物理的構造若しくは構成を示すのではなく、記載された機能を提供するための適切な手段の言及に過ぎないと見なされるべきである。
本発明は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せを含む任意の適切な形式で実装され得る。本発明は、任意選択的に1個又は複数個のデータプロセッサ及び/又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして少なくとも部分的に実装され得る。本発明の実施形態の要素及び構成要素は、任意の適切な態様で物理的に、機能的に、及び論理的に実装され得る。実際に、機能は単一のユニットによって、複数のユニットによって、又は他の機能ユニットの一部として実装され得る。そのため、本発明は単一のユニットによって実装され得、又は様々なユニット、回路、及びプロセッサ間で物理的に及び機能的に分散され得る。
本発明が一部の実施形態に関連して説明されてきたが、本発明を本明細書に記載した特定の形態に限定することは意図されない。むしろ本発明の範囲は添付の特許請求の範囲によってのみ限定される。更に、或る特徴が特定の実施形態に関連して説明されているように思われ得るが、説明した実施形態の様々な特徴が本発明に従って組み合わせられ得ることを当業者であれば理解されよう。特許請求の範囲では、含むという用語は他の要素又はステップがあることを除外しない。
更に、別々に列挙したが、複数の手段、要素、回路、又は方法のステップが、例えば単一の回路、ユニット、又はプロセッサによって実装され得る。加えて、個々の特徴が異なる請求項に含まれる場合があるが、それらの特徴は場合により有利に組み合わせられ得、異なる請求項に含まれることは特徴の組合せが実現可能でないこと及び/又は有利でないことを意味するものではない。更に、或る請求項のカテゴリに特徴を含めることは、そのカテゴリに限定することを含意せず、むしろその特徴が必要に応じて他の請求項のカテゴリに等しく適用され得ることを示す。更に、特許請求の範囲における特徴の順序は、それらの特徴が実行されなければならない如何なる特定の順序も含意せず、とりわけ方法クレーム内の個々のステップの順序はステップがその順序で実行されなければならないことを含意するものではない。むしろステップは任意の適切な順序で実行され得る。加えて、単数形での言及は複数形を除外しない。従って、「1つの(a)」、「1つの(an)」、「第1の」、「第2の」等の言及は複数形を排除しない。特許請求の範囲における参照符号は明確にするための例として与えるに過ぎず、特許請求の範囲を限定するものとして決して解釈されるべきではない。

Claims (14)

  1. 出力三次元画像を生成する機器であり、当該機器は、
    中間三次元画像を生成する第1の画像生成ユニットであって、当該中間三次元画像は当該中間三次元画像の空間的副区分である複数の領域を含み、前記第1の画像生成ユニットは奥行ベースの処理を使用して前記複数の領域の画素値の或る数の画像ブロックを生成し、前記画像ブロックの数は前記複数の領域のうちの少なくとも2つの領域について異なり、各画像ブロックはそれぞれ異なる視方向に対応する画素群の画素値を含む、第1の画像生成ユニットと、
    非奥行ベースの処理を使用して幾つかのビュー画像を含む前記出力三次元画像を前記中間三次元画像から生成する第2の画像生成ユニットであって、前記幾つかのビュー画像のそれぞれは視方向に対応する、第2の画像生成ユニットと、
    前記複数の領域のうちの少なくとも第1の領域について異なる視方向を有する前記第1の画像生成ユニットによって生成された前記画像ブロックの数を局所的に適合させるアダプタであって、当該適合は、前記第1の画像生成ユニットが三次元シーン表現から前記中間三次元画像を生成する当該三次元シーン表現と前記中間三次元画像との少なくとも一方の局所的画像特性に応じる、アダプタと、
    を含む、機器。
  2. 前記局所的画像特性は奥行の測度である、請求項1に記載の機器。
  3. 前記局所的画像特性はコントラストの測度である、請求項1に記載の機器。
  4. 前記アダプタは、前記第1の画像生成ユニットの計算資源の可用性に応じて前記第1の領域の前記画像ブロックの数を更に決定する、請求項1に記載の機器。
  5. 前記複数の領域は、少なくとも1つの画素行によって形成される領域を含む、請求項1に記載の機器。
  6. 前記複数の領域のうちの少なくとも1つの領域は、画素行の画素のサブセットのみを含む、請求項1に記載の機器。
  7. 前記第1の画像生成ユニットは、複数の視方向について、前記複数の領域の全領域の画像ブロックを生成し、その後、前記アダプタは、複数の視角に関する各領域の画像ブロック間の視差に応じて、少なくとも1つの更なる視方向についての画像ブロックを生成する前記複数の領域のうちの領域のサブセットを選択する、請求項1に記載の機器。
  8. 前記アダプタは、視差の測度が閾値を上回ることに応じて、少なくとも1つの更なる視角の画像ブロックを生成する領域を選択し、前記視差の測度は、前記更なる視角に隣接する2つの視角の2つの画像ブロックの視差の測度である、請求項1に記載の機器。
  9. 前記アダプタは、奥行の測度が閾値を下回る領域のサブセットを決定し、当該サブセットの各領域内の画像ブロックの数を1に設定する、請求項1に記載の機器。
  10. 前記局所的画像特性は視覚的特性である、請求項1に記載の機器。
  11. 前記局所的画像特性は明度の特性及び色の特性の少なくとも一方を示す、請求項1に記載の機器。
  12. 前記第1の画像生成ユニットは、三次元シーンの三次元モデルに基づいて前記中間三次元画像を生成し、
    前記アダプタは前記三次元モデルの特性に応じて前記画像ブロックの数を適合させる、請求項1に記載の機器。
  13. 奥行ベースの処理を使用して複数の領域の視方向に対応する画素値の或る数の画像ブロックを生成することによって、中間三次元画像の空間的副区分である前記複数の領域を含む、前記中間三次元画像を生成するステップであって、前記画像ブロックの数は複数の領域のうちの少なくとも2つの領域について異なり、各画像ブロックはそれぞれ異なる視方向に対応する画素群の画素値を含む、ステップと、
    非奥行ベースの処理を使用して幾つかのビュー画像を含む出力三次元画像を前記中間三次元画像から生成するステップであって、幾つかのビュー画像のそれぞれは視方向に対応する、ステップと、
    前記複数の領域のうちの少なくとも第1の領域について異なる視方向を有する画像ブロックの数を局所的に適合させるステップであって、当該適合は、前記中間三次元画像及び当該中間三次元画像を生成するために使用される三次元入力画像の少なくとも一方の局所的画像特性に応じる、ステップと、
    を含む、出力三次元画像の生成方法。
  14. コンピュータプログラムがコンピュータによって実行される時に、前記コンピュータに請求項13に記載の出力三次元画像の生成方法を実行させる命令を有する、コンピュータプログラム。
JP2016573527A 2014-06-19 2015-06-12 三次元画像を生成するための方法及び機器 Active JP6517245B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14173093 2014-06-19
EP14173093.7 2014-06-19
PCT/EP2015/063211 WO2015193198A1 (en) 2014-06-19 2015-06-12 Method and apparatus for generating a three dimensional image

Publications (3)

Publication Number Publication Date
JP2017525210A JP2017525210A (ja) 2017-08-31
JP2017525210A5 JP2017525210A5 (ja) 2018-11-08
JP6517245B2 true JP6517245B2 (ja) 2019-05-22

Family

ID=50980947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016573527A Active JP6517245B2 (ja) 2014-06-19 2015-06-12 三次元画像を生成するための方法及び機器

Country Status (11)

Country Link
US (1) US10368046B2 (ja)
EP (1) EP3158536B1 (ja)
JP (1) JP6517245B2 (ja)
KR (1) KR102492971B1 (ja)
CN (1) CN106664397B (ja)
BR (1) BR112016029335A2 (ja)
CA (1) CA2952700A1 (ja)
RU (1) RU2692432C2 (ja)
TR (1) TR201903220T4 (ja)
TW (1) TWI683281B (ja)
WO (1) WO2015193198A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10003783B2 (en) * 2016-02-26 2018-06-19 Infineon Technologies Ag Apparatus for generating a three-dimensional color image and a method for producing a three-dimensional color image
CN109588055A (zh) * 2016-07-29 2019-04-05 索尼公司 图像处理设备和图像处理方法
JP6944133B2 (ja) * 2016-07-29 2021-10-06 ソニーグループ株式会社 画像処理装置および画像処理方法
US10999498B2 (en) * 2016-07-29 2021-05-04 Sony Corporation Image processing apparatus and image processing method
JP6977725B2 (ja) * 2016-08-03 2021-12-08 ソニーグループ株式会社 画像処理装置および画像処理方法
KR102462502B1 (ko) * 2016-08-16 2022-11-02 삼성전자주식회사 스테레오 카메라 기반의 자율 주행 방법 및 그 장치
CN108900829B (zh) * 2017-04-10 2022-02-22 钰立微电子股份有限公司 动态显示系统
US10776992B2 (en) * 2017-07-05 2020-09-15 Qualcomm Incorporated Asynchronous time warp with depth data
EP3511910A1 (en) * 2018-01-12 2019-07-17 Koninklijke Philips N.V. Apparatus and method for generating view images
US20190333444A1 (en) * 2018-04-25 2019-10-31 Raxium, Inc. Architecture for light emitting elements in a light field display
US11100844B2 (en) 2018-04-25 2021-08-24 Raxium, Inc. Architecture for light emitting elements in a light field display
US10713756B2 (en) * 2018-05-01 2020-07-14 Nvidia Corporation HW-assisted upscaling and multi-sampling using a high resolution depth buffer
US11012694B2 (en) 2018-05-01 2021-05-18 Nvidia Corporation Dynamically shifting video rendering tasks between a server and a client
CN110570627B (zh) * 2019-06-27 2021-11-02 河海大学 一种基于系留气球的堰塞灾害预警装置及监测预警方法
KR20220048322A (ko) 2020-10-12 2022-04-19 윤석인 인사 평가 시스템 및 방법

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPO894497A0 (en) * 1997-09-02 1997-09-25 Xenotech Research Pty Ltd Image processing method and apparatus
RU2237283C2 (ru) * 2001-11-27 2004-09-27 Самсунг Электроникс Ко., Лтд. Устройство и способ представления трехмерного объекта на основе изображений с глубиной
US8040352B2 (en) 2003-06-05 2011-10-18 Konninklijke Philips Electronics, N.V. Adaptive image interpolation for volume rendering
KR100874226B1 (ko) * 2007-01-10 2008-12-16 광주과학기술원 다시점 화상 및 3차원 오디오 송수신 장치 및 이를 이용한송수신 방법
US8259130B2 (en) 2007-03-29 2012-09-04 International Business Machines Corporation Color buffer contrast threshold for adaptive anti-aliasing
US9380292B2 (en) * 2009-07-31 2016-06-28 3Dmedia Corporation Methods, systems, and computer-readable storage media for generating three-dimensional (3D) images of a scene
JP5663857B2 (ja) * 2009-10-08 2015-02-04 株式会社ニコン 画像表示装置および画像表示方法
WO2011120228A1 (en) 2010-04-01 2011-10-06 Intel Corporation A multi-core processor supporting real-time 3d image rendering on an autostereoscopic display
WO2011127550A1 (en) * 2010-04-14 2011-10-20 Isee3D Inc. Adapter apparatus and method for generating three-dimensional image information
KR20120063984A (ko) * 2010-12-08 2012-06-18 한국전자통신연구원 다시점 영상 생성 방법 및 장치
JP5879713B2 (ja) * 2010-12-09 2016-03-08 ソニー株式会社 画像処理装置、および画像処理方法、並びにプログラム
KR101798408B1 (ko) * 2011-01-03 2017-11-20 삼성전자주식회사 3d 디스플레이를 위한 고품질 멀티-뷰 영상의 생성 방법 및 장치
JP5732986B2 (ja) * 2011-04-08 2015-06-10 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
GB201106111D0 (en) * 2011-04-11 2011-05-25 Mccormick Malcolm Rendering images for autostereoscopic display
JP2013038602A (ja) 2011-08-08 2013-02-21 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム
CN104272729A (zh) * 2012-05-02 2015-01-07 皇家飞利浦有限公司 用于处理3d视频的质量度量
JP6019729B2 (ja) * 2012-05-11 2016-11-02 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
TWI617178B (zh) * 2012-09-20 2018-03-01 優克利丹有限公司 用以表現出三維景象之電腦圖形方法、系統及軟體產品
KR20140039649A (ko) * 2012-09-24 2014-04-02 삼성전자주식회사 다시점 영상 생성 방법 및 다시점 영상 디스플레이 장치
KR101960838B1 (ko) * 2012-11-26 2019-03-21 삼성전자주식회사 홀로그램 패턴 생성 장치 및 방법

Also Published As

Publication number Publication date
US10368046B2 (en) 2019-07-30
JP2017525210A (ja) 2017-08-31
KR102492971B1 (ko) 2023-01-30
WO2015193198A1 (en) 2015-12-23
TWI683281B (zh) 2020-01-21
US20170150115A1 (en) 2017-05-25
TR201903220T4 (tr) 2019-03-21
CA2952700A1 (en) 2015-12-23
EP3158536B1 (en) 2019-01-02
RU2017101484A3 (ja) 2019-01-10
EP3158536A1 (en) 2017-04-26
BR112016029335A2 (pt) 2017-08-22
RU2692432C2 (ru) 2019-06-24
RU2017101484A (ru) 2018-07-19
KR20170023096A (ko) 2017-03-02
TW201618042A (zh) 2016-05-16
CN106664397B (zh) 2018-11-16
CN106664397A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
JP6517245B2 (ja) 三次元画像を生成するための方法及び機器
US9407896B2 (en) Multi-view synthesis in real-time with fallback to 2D from 3D to reduce flicker in low or unstable stereo-matching image regions
US7689031B2 (en) Video filtering for stereo images
US10225540B2 (en) Autostereoscopic multi-view system
US20140198182A1 (en) Representation and Coding of Multi-View Images Using Tapestry Encoding
US20130187910A1 (en) Conversion of a digital stereo image into multiple views with parallax for 3d viewing without glasses
US20140111627A1 (en) Multi-viewpoint image generation device and multi-viewpoint image generation method
US10855965B1 (en) Dynamic multi-view rendering for autostereoscopic displays by generating reduced number of views for less-critical segments based on saliency/depth/eye gaze map
KR102121389B1 (ko) 무안경 3d 디스플레이 장치 및 그 제어 방법
CN104112275B (zh) 一种生成视点的方法及装置
KR20110049039A (ko) 능동 부화소 렌더링 방식 고밀도 다시점 영상 표시 시스템 및 방법
KR20110090958A (ko) 이미지 속성들에 대한 오클루젼 데이터의 생성
KR20080100206A (ko) 온 더 플라이 하드웨어 기반 인터디지테이션
JP2009528587A (ja) 出力画像のレンダリング
KR20130048299A (ko) 영상 처리 장치 및 방법
US20160295200A1 (en) Generaton of images for an autostereoscopic multi-view display
US9196080B2 (en) Medial axis decomposition of 2D objects to synthesize binocular depth
RU2707726C2 (ru) Генерирование изображения для автостереоскопического дисплея
WO2012140397A2 (en) Three-dimensional display system
CN115866225A (zh) 一种基于人眼特性的自适应裸眼3d视差调节方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180608

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181001

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20181001

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190417

R150 Certificate of patent or registration of utility model

Ref document number: 6517245

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350