JP2022519033A - シーンの画像表現 - Google Patents

シーンの画像表現 Download PDF

Info

Publication number
JP2022519033A
JP2022519033A JP2021543369A JP2021543369A JP2022519033A JP 2022519033 A JP2022519033 A JP 2022519033A JP 2021543369 A JP2021543369 A JP 2021543369A JP 2021543369 A JP2021543369 A JP 2021543369A JP 2022519033 A JP2022519033 A JP 2022519033A
Authority
JP
Japan
Prior art keywords
viewer
offset
pose
image
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021543369A
Other languages
English (en)
Other versions
JP7471307B2 (ja
Inventor
ウィルヘルムス ヘンドリクス アルフォンサス ブリュル
クリスティアン ヴァーエカンプ
バート クルーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2022519033A publication Critical patent/JP2022519033A/ja
Application granted granted Critical
Publication of JP7471307B2 publication Critical patent/JP7471307B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/344Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/366Image reproducers using viewer tracking
    • H04N13/378Image reproducers using viewer tracking for tracking rotational head movements around an axis perpendicular to the screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/366Image reproducers using viewer tracking
    • H04N13/383Image reproducers using viewer tracking for tracking with gaze detection, i.e. detecting the lines of sight of the viewer's eyes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Processing Or Creating Images (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

装置は、シーンの画像表現を受信するための受信部301を備える。特定部305は、視認者座標系に基づいて視認者に対する視認者ポーズを特定する。位置合わせ部307は、シーン基準位置を視認者座標系における視認者基準位置と位置合わせすることにより、シーン座標系を視認者座標系と位置合わせする。レンダラー303は、画像表現と視認者座標系に対するシーン座標系の位置合わせとに応じて異なる視認者ポーズに対するビュー画像をレンダリングする。オフセットプロセッサ309は、位置合わせ視認者ポーズに応じて視認者基準位置を特定し、視認者基準位置は、位置合わせ視認者ポーズの配向に依存し、及び、位置合わせ視認者ポーズに対する視認者眼球位置に対するオフセットをもつ。オフセットは、視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む。

Description

本発明は、シーンの画像表現に関し、特に、限定されないが、仮想現実アプリケーションの一部としての画像表現の生成及びこの画像表現からの画像のレンダリングに関する。
ビデオを使用及び消費する新しいサービス及び手法が継続的に開発され、及び導入されることに伴って、画像及びビデオアプリケーションの多様性及び範囲が近年大幅に増加している。
例えば、人気の高まっている1つのサービスは、視認者がレンダリングのパラメータを変えるためにシステムと能動的に、及び動的に相互作用することができる手法による画像シーケンスの提供である。多くのアプリケーションにおける非常に魅力的な特徴は、視認者の効果的な視認位置及び視認方向を変える能力であり、例えば視認者が提示されているシーンにおいて動くこと、及び「見て回る」ことを可能にする。
このような特徴は、特に仮想現実体験がユーザーに提供されることを可能にし得る。これは、ユーザーが例えば仮想環境において(比較的)自由に動き回ること、及び、ユーザーの位置及びユーザーが視認している場所を動的に変えることを可能にする。典型的には、このような仮想現実アプリケーションは、モデルが特定の要求されたビューを提供するために動的に評価されることを伴うシーンの三次元モデルに基づく。このアプローチは、例えば、コンピュータ及びコンソールのための例えば一人称シューティングゲームのカテゴリにおけるゲームアプリケーションにおいてよく知られている。
特に仮想現実アプリケーションに対して、提示される画像が三次元画像であることが更に望ましい。実際、視認者の没入感を最適化するために、典型的にはユーザーにとって、三次元シーンとして提示されたシーンを体験することが好ましい。実際、仮想現実体験は好ましくは、仮想世界に対するユーザー自身の位置、カメラビューポイント、及び時点をユーザーが選択することを可能にしなければならない。
典型的には、仮想現実アプリケーションがシーンの所定のモデル、及び典型的には仮想世界の人工モデルに基づくという点で、仮想現実アプリケーションは本質的に制限される。仮想現実体験が現実世界のキャプチャに基づいて提供されることが多くの場合望ましい。しかし、多くの場合、このようなアプローチは制限されるか、又は、現実世界の仮想モデルが現実世界のキャプチャにより構築されることを必要とする傾向がある。したがって、仮想現実体験はこのモデルを評価することにより生成される。
しかし、現在のアプローチは最適ではない傾向があり、多くの場合、高い演算又は通信リソース要求を伴い、及び/又は、例えばより低い品質又は制限された自由度を伴う最適ではないユーザー体験を提供する傾向がある。
多くの、例えば仮想現実アプリケーションでは、シーンは、例えばシーンに対する特定のビューポーズを表す1つ又は複数の画像により画像表現により表される。幾つかの例において、このような画像はシーンの広角ビューを提供し、例えば完全な360°ビューをカバーし、又は完全ビュー球体をカバーする。
多くのアプリケーションにおいて、及び特に仮想現実アプリケーションに対して、画像データストリームがシーンにおけるユーザーの(仮想)位置を反映するように、シーンを表すデータから画像データストリームが生成される。このような画像データストリームが仮想シーン内におけるユーザーの動きを反映するように、このような画像データストリームは典型的には動的に、及びリアルタイムで生成される。画像データストリームは、画像データストリームの画像データからユーザーに対する画像をレンダリングするレンダラーに提供される。多くのアプリケーションにおいて、レンダラーに対する画像データストリームの提供は、帯域幅の限られた通信リンクを介する。例えば、画像データストリームは、リモートサーバーにより生成され、例えば通信ネットワークを介してレンダリングデバイスに送信される。しかし、ほとんどのこのようなアプリケーションに対して、高効率の通信を可能にするために相応のデータレートを維持することが重要である。
360°ビデオストリーミングに基づいて仮想現実体験を提供することが提案されており、ここで、シーンの完全な360°ビューが所与の視認者位置に対してサーバーにより提供され、以て、クライアントが異なる方向に対するビューを生成することを可能にする。特に、仮想現実(VR)の有望なアプリケーションのうちの1つは、全方向ビデオ(例えばVR360又はVR180)である。本アプローチは、高データレートをもたらす傾向を示し、したがって、完全な360°ビュー球体が提供される対象のビューポイントの数は、典型的には少ない数に制限される。
特定の例として、仮想現実眼鏡が市場に参入している。これらの眼鏡は、視認者がキャプチャされた360度(パノラマ)ビデオを体験することを可能にする。これらの360度ビデオは多くの場合、カメラリグを使用して事前にキャプチャされ、この場合、個々の画像は1つの球形マッピングへと一緒に連結される。幾つかのこのような実施形態では、所与のビューポイントからの完全な球形ビューを表す画像が生成され、ユーザーの現在のビューに対応した眼鏡に対する画像を生成するように構成されたドライバに送信される。
多くのシステムにおいて、画像表現がシーンにおける1つ又は複数のキャプチャポイント/ビューポイントに対する画像を含み、及び多くの場合、深さを含むように、シーンの画像表現が提供される。多くのこのようなシステムにおいて、レンダラーは、現在のローカルな視認者ポーズに整合したビューを動的に生成するように構成される。このようなシステムにおいて、視認者ポーズが動的に特定され、ビューがこの視認者ポーズに整合するように動的に生成される。このような動作は、視認者ポーズが画像表現と位置合わせされること、又は画像表現に対してマッピングされることを必要とする。これは、典型的には、アプリケーションの開始時にシーン/画像表現における所与の最適な、又はデフォルト位置に視認者を配置すること、及び、次にこれに対する視認者の動きを追跡することにより行われる。最適な、又はデフォルト位置は、典型的には、画像表現が画像データを含む対象の位置、すなわちキャプチャ又はアンカー位置に対応するように選択される。
しかし、視認者ポーズがこの位置から変化するにつれて、ビュー補間及び合成が必要とされ、これは、劣化及びアーティファクトをもたらし、以て画像品質を下げる傾向を示す。
したがって、シーンの画像表現を処理するための、及び生成するための改善されたアプローチが有益である。特に、改善された動作、改善された柔軟性、改善された仮想現実体験、より低いデータレート、より高い効率、円滑化された配布、より低い複雑さ、円滑化された実施、低減されたストレージ要求、より高い画像品質、改善されたレンダリング、改善されたユーザー体験、及び/又は、改善されたパフォーマンス及び/又は動作を可能にするシステム及び/又はアプローチが有益である。
したがって、本発明は、好ましくは、単独で、又は任意の組み合わせにより、上述の欠点のうちの1つ又は複数を緩和、軽減、又は、除去することを目的とする。
本発明の一態様によると、画像をレンダリングするための装置であって、装置が、シーンの画像表現を受信するための受信部であって、画像表現が、シーン座標系に基づいて提供され、シーン座標系が、基準位置を含む、受信部と、視認者に対する視認者ポーズを特定するための特定部であって、視認者ポーズが、視認者座標系に基づいて提供される、特定部と、シーン基準位置を視認者座標系における視認者基準位置と位置合わせすることにより、シーン座標系を視認者座標系と位置合わせするための位置合わせ部と、画像表現と、及び視認者座標系に対するシーン座標系の位置合わせに応じて、異なる視認者ポーズに対するビュー画像をレンダリングするためのレンダラーと、を備え、装置が、位置合わせが実施される対象の視認者ポーズである第1の視認者ポーズに応じて視認者基準位置を特定するように構成されたオフセットプロセッサであって、視認者基準位置が、第1の視認者ポーズの配向に依存し、及び第1の視認者ポーズに対する視認者眼球位置に関連したオフセットをもち、オフセットが、視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、オフセットプロセッサを更に備え、受信部が、画像表現を含むとともに、オフセット標示を更に含む画像データ信号を受信するように構成され、オフセットプロセッサが、オフセット標示に応じてオフセットを特定するように構成された、装置が提供される。
本発明は、多くの実施形態において改善された動作及び/又はパフォーマンスを提供する。本発明は、特に、ある範囲の視認者ポーズに対して改善された画像品質を提供する。
本アプローチは、多くの実施形態において、改善されたユーザー体験を提供し、例えば、本アプローチは、多くのシナリオにおいて、柔軟性のある、効率的な、及び/又は高パフォーマンスの仮想現実(VR)アプリケーションを可能にする。多くの実施形態において、本アプローチは、異なる視認者ポーズに対する画像品質間の大幅に改善されたトレードオフを伴うVRアプリケーションを可能にし、又はできるようにする。
本アプローチは、例えば、受信側における動き及び頭部の回転への適応をサポートしたビデオサービスをブロードキャストすることに特に適している。
画像表現は、シーンの1つ又は複数の画像を備える。画像表現の各画像は、シーンに対する視認又はキャプチャポーズに関連付けられ、及び結び付けられる。視認又はキャプチャポーズは、シーン座標系に基づいて提供される。シーン基準位置は、シーン座標系における任意の位置である。シーン基準位置は、視認者ポーズに依存しない。シーン基準位置は、所定の位置及び/又は固定位置である。シーン基準位置は、少なくとも幾つかの連続した位置合わせの間で変化しない。
ビュー画像のレンダリングは位置合わせの後である。オフセット成分は、位置合わせ視認者ポーズに対するビュー方向の反対であることにより、視認者眼球位置のビュー方向の反対方向である。
第1の視認者ポーズは、位置合わせ視認者ポーズとも呼ばれる(位置合わせ視認者ポーズは、位置合わせが実施される対象の視認者ポーズである)。
位置合わせ/第1の視認者ポーズは、視認者眼球位置、及び視認者眼球位置のビュー方向を示す/表す/説明する。位置合わせ/第1の視認者ポーズは、視認者眼球位置、及び視認者眼球位置のビュー方向が特定されることを可能にするデータを含む。
オフセット標示は、視認者座標系に対してシーン座標系を位置合わせするときにシーン基準位置と視認者眼球位置との間に適用するためのターゲットオフセットを表す。ターゲットオフセットは、視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む。
本発明の任意選択的な特徴によると、オフセット成分は2cm以上である。
これは、多くの実施形態において特に有益な動作を提供する。それは、多くのシナリオにおいて、多くの視認者ポーズに対して十分に高い品質改善が達成されることを可能にする。
幾つかの実施形態において、オフセット成分は、1cm、4cm、5cm、又は更には7cm以上である。典型的には遥かに低い程度であるが前方ビューに対する画像品質を下げる可能性を伴いながら、頭部の回転に対応したビューポーズに対して生成された画像の品質を改善するために、より大きいオフセットが導出されている。
本発明の任意選択的な特徴によると、オフセット成分は12cm以下である。
これは、多くの実施形態において特に有益な動作を提供する。それは、多くのシナリオにおいて、異なる視認者ポーズに対して生成された画像に対する改善された画像品質のトレードオフを提供する。
幾つかの実施形態において、オフセット成分は、8cm又は10cm以下である。
本発明の任意選択的な特徴によると、受信部(301)は、画像表現を含むとともに、オフセット標示を更に含む画像データ信号を受信するように構成され、オフセットプロセッサが、オフセット標示に応じてオフセットを特定するように構成される。
これは、多くのシステム及びシナリオにおいて、例えば特にブロードキャスティングするシナリオに対して有益な動作を提供する。それは、オフセット最適化が複数の異なるレンダリングデバイスに対して同時に実施されることを可能にする。
本発明の任意選択的な特徴によると、オフセットプロセッサは、少なくとも1つの視認者ポーズに対する誤差尺度に応じてオフセットを特定するように構成され、誤差尺度はオフセットの候補値に依存する。
これは、多くの実施形態において改善された動作及び/又はパフォーマンスを提供する。それは、特に、多くの実施形態において、異なる視認者ポーズに対する品質における改善されたトレードオフを可能にし、及び、多くの実施形態において、動的な最適化を可能にする。それは、更に、多くの実施形態において、低複雑度の、及び/又は、高効率の/低リソースの動作を可能にする。
オフセットは、多くの実施形態において、1つ又は複数の視認者ポーズに対する(組み合わされた)最小誤差尺度をもたらすオフセットとして特定される。
幾つかの実施形態において、誤差尺度は、候補値の連続的な範囲に対する誤差測定結果又は値を表す。例えば、誤差尺度は、候補オフセットの関数として表され、オフセットは、この関数が最小化される対象の候補オフセットとして特定される。
幾つかの実施形態において、離散的な数の候補オフセット値のみが考慮され、オフセットプロセッサは、これらの候補値の各々に対して誤差尺度/測定結果/値を特定する。次に、オフセットプロセッサは、(例えば、複数の視認者ポーズに対する誤差尺度を組み合わせた後)最低誤差尺度が導出された対象の候補オフセットとしてオフセットを特定する。
本発明の任意選択的な特徴によると、オフセットプロセッサは、複数の視認者ポーズに対する誤差尺度の組み合わせに応じて候補値に対する誤差尺度を特定するように構成される。
これは、多くの実施形態において、改善された動作及び/又はパフォーマンスを提供する。
幾つかの実施形態において、オフセットプロセッサは、凝視方向の範囲に対する誤差尺度に応じて、ある範囲の視認者ポーズのうちの1つの視認者ポーズに対する誤差尺度を特定するように構成される。
本発明の任意選択的な特徴によると、視認者ポーズ及びオフセットの候補値に対する誤差尺度は、画像表現の少なくとも1つの画像から合成された視認者ポーズに対するビュー画像に対する画像品質尺度を含み、少なくとも1つの画像が、候補値に応じて視認者ポーズに対する位置をもつ。
これは、多くの実施形態において改善された動作及び/又はパフォーマンスを提供する。
本発明の任意選択的な特徴によると、視認者ポーズ及びオフセットの候補値に対する誤差尺度は、画像表現の少なくとも2つの画像から合成された視認者ポーズに対するビュー画像に対する画像品質尺度を含み、少なくとも2つの画像は、候補値に応じて視認者ポーズに対する基準位置をもつ。
これは、多くの実施形態において改善された動作及び/又はパフォーマンスを提供する。
本発明の任意選択的な特徴によると、画像表現は、全方向画像表現を包含する。
本発明は、特に、例えば特に全方向ステレオ(ODS)画像といった全方向画像に基づいて画像表現に対する改善されたパフォーマンスを提供する。
本発明の任意選択的な特徴によると、オフセットは、視認者眼球位置のビュー方向に直交する方向におけるオフセット成分を含む。
これは、多くの実施形態において改善された動作及び/又はパフォーマンスを提供する。
視認者眼球位置のビュー方向に直交する方向は水平方向であってもよい。特に、それは、視認者ポーズの一方の眼球から他方の眼球への方向に対応した方向であってもよい。縦成分は、シーン座標系における水平方向に対応した方向であってもよい。
本発明の任意選択的な特徴によると、オフセットは縦成分を含む。
これは、多くの実施形態において改善された動作及び/又はパフォーマンスを提供する。縦成分は、視認者眼球位置のビュー方向と視認者ポーズの眼球間の方向とにより形成された平面に直交する方向であってもよい。縦成分は、シーン座標系における垂直方向に対応した方向であってもよい。
本発明の一態様によると、画像信号を生成するための装置であって、装置が、1つ又は複数のポーズからシーンを表す多数の画像を受信するための受信部と、シーンの画像表現を提供する画像データを生成するための表現プロセッサであって、画像データが、多数の画像とシーン座標系に基づいて提供される画像表現とを含み、シーン座標系が、シーン基準位置を含む、表現プロセッサと、オフセット標示を生成するためのオフセット生成器であって、オフセット標示が、視認者座標系に対してシーン座標系を位置合わせするときにシーン基準位置と視認者眼球位置との間に適用するためのオフセットを示し、オフセットが、視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、オフセット生成器と、画像データとオフセット標示とを含むように画像信号を生成するための出力プロセッサとを備える、装置が提供される。
本発明の一態様によると、画像をレンダリングする方法であって、方法が、シーンの画像表現を受信するステップであって、画像表現が、シーン座標系に基づいて提供され、シーン座標系が、基準位置を含む、受信するステップと、視認者に対する視認者ポーズを特定するステップであって、視認者ポーズが、視認者座標系に基づいて提供される、特定するステップと、シーン基準位置を視認者座標系における視認者基準位置と位置合わせすることにより、シーン座標系を視認者座標系と位置合わせするステップと、画像表現と視認者座標系に対するシーン座標系の位置合わせとに応じて、異なる視認者ポーズに対するビュー画像をレンダリングするステップとを有し、方法は更に、第1の視認者ポーズに応じて視認者基準位置を特定するステップであって、視認者基準位置が、第1の視認者ポーズの配向に依存し、及び、第1の視認者ポーズに対する視認者眼球位置に対するオフセットをもち、オフセットが、視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、特定するステップを有し、シーンの画像表現を受信するステップが、画像表現を含むとともにオフセット標示を更に含む画像データ信号を受信するステップを有し、更に、オフセット標示に応じてオフセットを特定するステップを有する、方法が提供される。
本発明の一態様によると、画像信号を生成する方法であって、方法が、1つ又は複数のポーズからのシーンを表す多数の画像を受信するステップと、シーンの画像表現を提供する画像データを生成するステップであって、画像データが、多数の画像とシーン座標系に基づいて提供される画像表現とを含み、シーン座標系が、シーン基準位置を含む、生成するステップと、オフセット標示を生成するステップであって、オフセット標示が、視認者座標系に対してシーン座標系を位置合わせするときにシーン基準位置と視認者眼球位置との間に適用するためのオフセットを示し、オフセットが、視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、生成するステップと、画像データとオフセット標示とを含むように画像信号を生成するステップとを有する、方法が提供される。
本発明のこれらの、及び、他の態様、特徴及び利点が、以下で説明される実施形態から明らかとなり、以下で説明される実施形態を参照しながら説明される。
本発明の実施形態が図面を参照しながら、単なる例示として説明される。
仮想現実体験を提供するための構成体の例を示す図である。 本発明の幾つかの実施形態による、装置の要素の例を示す図である。 本発明の幾つかの実施形態による、装置の要素の例を示す図である。 シーンに対する画像表現に対する構成の例を示す図である。 シーンの全方向ステレオ画像表現の例を示す図である。 シーンの全方向ステレオ画像表現の例を示す図である。 深さマップを伴う全方向ステレオ画像の例を示す図である。 視認者ポーズに対する視認者基準位置の特定の例を示す図である。 視認者ポーズに対する視認者基準位置の特定の例を示す図である。 視認者ポーズに対する視認者基準位置の特定の例を示す図である。 視認者ポーズに対する視認者基準位置の特定の例を示す図である。 視認者ポーズに対する視認者基準位置に対するオフセットの特定の例を示す図である。 視認者ポーズに対する視認者基準位置に対するオフセットの特定の例を示す図である。 視認者ポーズに対する視認者基準位置に対するオフセットの特定の例を示す図である。 視認者ポーズに対する視認者基準位置に対するオフセットの特定の例を示す図である。
ユーザーが仮想世界において動き回ることを可能にする仮想体験は、益々一般的になりつつあり、このような需要を満たすためのサービスが開発されている。しかし、特に、体験が完全に仮想的に生成された人工的な世界ではなく、現実世界環境のキャプチャに基づく場合、効率的な仮想現実サービスの提供は非常に困難を伴う。
多くの仮想現実アプリケーションにおいて、視認者ポーズ入力はシーンにおける仮想視認者のポーズを反映して特定される。したがって、仮想現実装置/システム/アプリケーションは、視認者ポーズに対応した視認者に対するシーンのビュー及びビューポートに対応した1つ又は複数の画像を生成する。
典型的には、仮想現実アプリケーションは、左目及び右目に対する別々のビュー画像の形態を取る三次元出力を生成する。次に、これらのビュー画像は、例えば典型的にはVRヘッドセットの個々の左目ディスプレイ及び右目ディスプレイといった適切な手段によりユーザーに提示される。他の実施形態において、画像は、例えば裸眼立体視ディスプレイに提示され(この場合、より多くのビュー画像が視認者ポーズに対して生成される)、又は、実際に幾つかの実施形態において、(例えば従来の二次元ディスプレイを使用して)1つの二次元画像のみが生成される。
視認者ポーズ入力は、異なるアプリケーションにおいて異なる手法により特定されてもよい。多くの実施形態において、ユーザーの物理的動きが直接追跡される。例えば、ユーザーエリアを見渡すカメラが、ユーザーの頭部(又は更には眼球)を検出及び追跡する。多くの実施形態において、ユーザーは、外部手段及び/又は内部手段により追跡され得るVRヘッドセットを装着する。例えば、ヘッドセットは、ヘッドセットの、ひいては頭部の動き及び回転に関する情報を提供する加速度計とジャイロスコープとを備える。幾つかの例において、VRヘッドセットは信号を送信し、又は、外部センサーがVRヘッドセットの動きを特定することを可能にする(例えば視覚的)識別体を備える。
幾つかのシステムにおいて、視認者ポーズは、例えばユーザーがジョイスティックを手動で制御すること、又は同様の手動入力といった手動の手段により提供される。例えば、ユーザーは、一方の手で第1のアナログジョイスティックを制御すること、及び、他方の手で第2のアナログジョイスティックを手動で動かすことにより仮想視認者が視認する方向を手動で制御することにより、シーンにおいて仮想視認者を手動で動き回らせる。
幾つかのアプリケーションでは、手動アプローチと自動アプローチとの組み合わせが、入力視認者ポーズを生成するために使用される。例えば、ヘッドセットは頭部の配向を追跡し、シーンにおける視認者の動き/位置が、ジョイスティックを使用してユーザーにより制御される。
画像の生成は、仮想世界/環境/シーンの適切な表現に基づく。幾つかの用途では、完全な三次元モデルがシーンに対して提供され、特定の視認者ポーズからのシーンのビューが、このモデルを評価することにより特定され得る。
多くの実用的なシステムにおいて、シーンは、画像データを含む画像表現により表される。画像データは、典型的には、1つ又は複数のキャプチャ又はアンカーポーズに関連した画像を含み、特に、画像は1つ又は複数のビューポートに対して含まれ、各ビューポートが特定のポーズに対応する。1つ又は複数の画像を含む画像表現が使用され、各画像が所与のビューポーズに対する所与のビューポートのビューを表す。(画像データは、典型的には、キャプチャポーズに対応した位置及び配向をもつシーンに配置されたカメラによりキャプチャされる、又は、される可能性のある画像に対応するので)画像データが提供された対象のこのようなビューポーズ又は位置は、多くの場合、アンカーポーズ又は位置又はキャプチャポーズ又は位置と呼ばれる。
多くの典型的なVRアプリケーションは、このような画像表現に基づいて、現在の視認者ポーズに対するシーンに対するビューポートに対応したビュー画像を提供することを行い、画像が視認者ポーズの変化を反映するように動的に更新され、画像が(場合によっては)仮想シーン/環境/世界を表す画像データに基づいて生成される。アプリケーションは、当業者に理解可能であるように、ビュー合成及びビューシフトアルゴリズムを実施することによりこれを行う。
本分野において、配置及びポーズという用語は、位置及び/又は方向/配向に対する共通用語として使用される。例えば物体、カメラ、頭部、又はビューの位置及び方向/配向の組み合わせは、ポーズ又は配置と呼ばれる。したがって、配置又はポーズ標示は6つの値/成分/自由度を含み、各値/成分は、典型的には、対応する物体の配置/位置又は配向/方向の個々の特性を説明する。もちろん、多くの状況において、例えば、1つ又は複数の成分が固定されている、又は関連しないと考えられる場合、配置又はポーズはより少ない成分をもつと考えられ、又はより少ない成分を表す(例えば、すべての物体が同じ高さにあり、横配向であると考えられる場合、4つの成分は、物体のポーズの完全な表現を提供する)。以下で、ポーズという用語は、(最大の取り得る自由度に対応した)1つから6つの値により表される位置及び/又は配向を表すために使用される。
多くのVRアプリケーションは、最大自由度、すなわち、位置及び配向の各々の3つの自由度をもつポーズに基づき、全部で6つの自由度をもたらす。したがって、ポーズは、6つの自由度を表す6つの値の集合又はベクトルにより表され、したがって、ポーズベクトルは、三次元位置及び/又は三次元方向の標示を提供する。しかし、他の実施形態において、ポーズがより少ない値により表されることが理解される。
ポーズは、配向及び位置のうちの少なくとも1である。ポーズ値は、配向値及び位置値のうちの少なくとも1つを表す。
視認者に対する最大自由度を提供することに基づくシステム又は実体は、典型的には、6つの自由度(6DoF)をもつものとして参照される。多くのシステム及び実体が配向又は位置のみを提供し、これらは典型的には、3つの自由度(3DoF)をもつものとして知られる。
幾つかのシステムにおいて、VRアプリケーションは、例えば、リモートVRデータ又は処理を全く使用しない、又は更にはリモートVRデータ又は処理への任意のアクセスを含む独立型デバイスにより、視認者に対してローカルに提供される。例えば、デバイス、例えばゲームコンソールは、シーンデータを記憶するための記憶部、視認者ポーズを受信/生成するための入力、及び、シーンデータから対応する画像を生成するためのプロセッサを備える。
他のシステムにおいて、VRアプリケーションは、視認者からリモートに実現され、及び実施される。例えば、ユーザーにとってローカルなデバイスは、視認者ポーズを生成するためにデータを処理するリモートデバイスに送信された動き/ポーズデータを検出/受信する。リモートデバイスは、次に、シーンデータを説明するシーンデータに基づいて、視認者ポーズに対する適切なビュー画像を生成する。次に、ビュー画像が提示される視認者にとってローカルなデバイスに、ビュー画像が送信される。例えば、リモートデバイスは、ローカルデバイスにより直接提示されるビデオストリーム(典型的にはステレオ/3Dビデオストリーム)を直接生成する。したがって、このような例において、ローカルデバイスは、動きデータを送信することと、受信されたビデオデータを提示することとを除く任意のVR処理を実施しない場合がある。
多くのシステムにおいて、機能は、ローカルデバイス及びリモートデバイスにわたって分散される。例えば、ローカルデバイスが、受信された入力及びセンサーデータを処理して、リモートVRデバイスに連続的に送信される視認者ポーズを生成する。次に、リモートVRデバイスが対応するビュー画像を生成し、提示するためにローカルデバイスにこれらの対応するビュー画像を送信する。他のシステムにおいて、リモートVRデバイスはビュー画像を直接生成しないが、関連するシーンデータを選択してローカルデバイスにこれを送信し、次にローカルデバイスが、提示されるビュー画像を生成する。例えば、リモートVRデバイスは最も近いキャプチャポイントを識別し、対応するシーンデータ(例えば、キャプチャポイントからの球形画像及び深さデータ)を抽出し、ローカルデバイスにこれを送信する。次にローカルデバイスが、受信されたシーンデータを処理して、特定の現在のビューポーズに対する画像を生成する。ビューポーズは典型的には頭部ポーズに対応し、ビューポーズに対する基準は、典型的には同様に、頭部ポーズに対する基準に対応すると考えられる。
特にブロードキャストサービスのための多くのアプリケーションにおいて、源は、視認者ポーズに依存しないシーンの(ビデオを包含する)画像表現の形態によりシーンデータを送信する。例えば、1つのキャプチャ位置に対する1つのビュー球体に対する画像表現が、複数のクライアントに送信される。次に、個々のクライアントは、現在の視認者ポーズに対応したビュー画像をローカルに合成する。
特定の関心を引くアプリケーションは、小さい頭部の動き及び頭部の回転のみをもたらす非常に静的な視認者に対応した小さい動き及び回転に従うように提示されたビューが更新されるように、限られた動き量がサポートされる場合である。例えば、座っている視認者は、視認者の頭部を回転させ、及びそれをわずかに動かし得、提示されたビュー/画像がこれらのポーズ変化に沿うように適応される。このようなアプローチは、非常に没入させる、例えばビデオ体験を提供する。例えば、スポーツイベントを見ている視認者は、視認者がアリーナにおける特定のスポットに存在していると感じる。
このような限られた自由度のアプリケーションは、多くの異なる位置からのシーンの正確な表現を必要とせずに、改善された体験を提供し、以てキャプチャ要求を大幅に低減するという利点をもつ。同様に、レンダラーに提供される必要があるデータの量は大幅に少なくされ得る。実際、多くのシナリオにおいて、1つのビューポイントに対する画像、及び典型的には深さデータのみが提供される必要があり、ローカルレンダラーがここから所望のビューを生成することができる。
本アプローチは、特に、データが、例えばブロードキャスト又はクライアントサーバーアプリケーションのために、帯域制限のある通信チャンネルを介して源から宛先に通信させられる必要があるアプリケーションに非常に適する。
図1は、リモートVRクライアントデバイス101が例えばインターネットなどのネットワーク105を介してVRサーバー103と連携するこのようなVRシステムの例を示す。サーバー103は、場合によっては多数のクライアントデバイス101を同時にサポートするように構成される。
VRサーバー103は、例えば、特定のビューポイントに対する画像データ及び深さを送信することによりブロードキャスト体験をサポートし、更に、クライアントデバイスは、この情報を処理して現在のポーズに対応したビュー画像をローカルに合成するように構成される。
図2は、VRサーバー103の例示的な実施態様の例示的な要素を示す。
装置は1つ又は複数のポーズからのシーンを表す多数の画像を受信するように構成された受信器201を備える。
本例において、受信部201は、多数の画像を提供する源203に結合されている。源203は、特に、画像を記憶するローカルメモリであり、又は、源203は、例えばカメラの集合などの適切なキャプチャユニットである。
受信部201は、多数の画像を供給される表現プロセッサ205と呼ばれるプロセッサに結合されている。表現プロセッサ205は、多数の画像から導出された画像データを含む画像表現を含むシーンの画像表現を生成するように構成されている。
表現プロセッサ205は、画像表現を含む画像信号を生成する出力プロセッサ207に結合されており、したがって、画像信号は、特に、多数の画像の画像データを含む。多くの実施形態において、出力プロセッサ207は、画像を符号化するように、及び、例えば適切な規格に従って生成されたデータストリームといった適切なデータストリームにそれらを含むように構成される。
出力プロセッサ207は、リモートクライアント/デバイスに画像信号を送信するように、又はブロードキャストするように更に構成され、特に、画像信号はクライアントデバイス101に通信される。
図3は、本発明の幾つかの実施形態による画像をレンダリングするための装置の幾つかの要素の例を示す。本装置は図1のシステムに関するコンテキストにおいて説明され、特に、本装置はクライアントデバイス101である。
クライアントデバイス101は、サーバー103から画像信号を受信するように構成されたデータ受信器301を備える。本発明を損なわない限り、通信のための任意の適切なアプローチ及び形式が使用されてよいことが理解される。
データ受信器301は、異なるビューポート/視認者ポーズに対するビュー画像を生成するように構成されたレンダラー303に結合される。
クライアントデバイス101は、現在の視認者ポーズを動的に特定するように構成されたビューポーズ特定部305を更に備える。特に、ビューポーズ特定部305は、ヘッドセットの動きを反映したヘッドセットからのデータを受信する。ビューポーズ特定部305は、受信されたデータに基づいてビューポーズを決定するように構成される。幾つかの実施形態において、ビューポーズ特定部305は、例えばセンサー情報(例えば、加速器及びジャイロデータ)を受信し、センサー情報からビューポーズを特定する。他の実施形態において、ヘッドセットはビューポーズデータを直接提供する。
ビューポーズはレンダラー303に供給され、レンダラー303が、現在の視認者ポーズにおける視認者の2つの眼球からのシーンのビューに対応したビュー画像を生成することを行う。ビュー画像は、任意の適切な画像生成及び合成アルゴリズムを使用して、受信された画像表現から生成される。特定のアルゴリズムは、特定の画像表現、及び、個々の実施形態の設定及び要求に依存する。
一例として、画像表現は、各々が所与のビューポイントから、及び所与の方向によりシーンを視認することに対応した1つ又は複数の画像を含む。したがって、多くのキャプチャ又はアンカーポーズの各々に対して、そのビューポイントからの、及びその方向における、シーンに対するビューポートに対応した画像が提供される。多くの実施形態において、複数のカメラは、例えば一列に配置されて、この線に沿った異なる位置からシーンをキャプチャし、すべてが例えば図4の例に示されるように同じ方向に向けられる。他の実施形態において、より多い、又はより少ないアンカーポイント及び/又は画像を含む他のキャプチャ構成が使用されることが理解される。
多くの実施形態において、画像表現は、全方向ステレオ(ODS)として知られる特定の既存の3D画像形式に従う。ODSに対して、左目画像及び右目画像に対する半直線が、典型的には例えば約6.3cmの瞳孔間距離に等しい直径をもつ円上にそれらの半直線の原点をもつように、左目画像及び右目画像に対する半直線が生成される。ODSに対して、狭角度画像セクションが、ビュー円の接線に対応した逆方向に対して、及びビュー円の周囲における規則的な角距離においてキャプチャされる(図5を参照されたい)。
したがって、ODSに対して、画像が左目に対して生成され、ここで、各ピクセル列が単位円上の1つの位置に対応し、この位置におけるODSビュー円に対する接線である方向に半直線を反射する。ODSビュー円上の位置は各列に対して異なり、典型的には、ODSビュー円上における比較的多数の等距離の位置が、360°の視野の全体をカバーするように規定され、各列が1つの位置に対応する。したがって、1つのODS画像は完全な360°の視野をキャプチャし、各列がODSビュー円上の異なる位置に対応し、及び異なる半直線方向に対応する。
ODSは、右目に対する画像と左目に対する画像とを含む。図6に示されるように、これらの画像における所与の列に対して、左目画像と右目画像とはODSビュー円上の反対側の位置の半直線を反映する。したがって、ODS画像形式は、360°ビューと、2つの画像のみに基づく立体情報との両方を提供する。
以下の説明は、2つのステレオ画像が(左目画像及び右目画像に対応して)提供される対象のODSについて検討するが、ただ1つの画像が提供される対応する形式が使用され得ること、すなわち、全方向モノラル画像形式が使用されてもよいことが理解される。この画像はビュー円に関連して依然として提供され、以て、一方の眼球が例えば眼球の中心点の周りで回転するときの、一方の眼球からのビューを提供する。
代替的に、ビュー円の半径をゼロに近づけることにより、単眼視形式が実現される。この場合において、左ビューと右ビューとは同じであり、したがって、ただ1つの画像が両方を表すために必要とされる。
概して、全方向ビデオ/画像は、例えば、全方向ステレオビデオ/画像として、又は、全方向モノラルビデオ/画像として提供される。
所与の配向(視認角度)に対して、所与の配向に対するビューポート内におけるビュー方向に整合した方向に対する狭角度画像セクションを組み合わせることにより、画像が生成される。したがって、異なる方向におけるキャプチャに対応した狭角度画像セクションを組み合わせるが、異なる狭角度画像セクションが円上の異なる位置からのものとすることにより、所与のビュー画像が形成される。したがって、ビュー画像は、1つのビューポイントのみからではなく、ビュー円上の異なる位置からのキャプチャを含む。しかし、ODS表現のビュー円が(シーンのコンテンツに対して)十分に小さい場合、この影響は、許容可能なレベルまで低減され得る。更に、所与の方向に沿ったキャプチャが多くの異なる視認配向に対して再使用され得るので、必要な画像データ量の大幅な減少が実現される。視認者の2つの眼球に対するビュー画像は、典型的には、適切な接線に対して逆方向にキャプチャすることにより生成される。
ODSによりサポートされ得る理想的な頭部の回転の例が図6に示される。本例において、両目が瞳孔間距離に等しい直径をもつ円に沿って動くように、頭部が回転する。これがODSビュー円の幅に対応すると仮定すると、異なる配向に対するビュー画像は、異なるビュー配向に対応した適切な狭角度画像セクションを選択することにより簡単に特定され得る。
しかし、標準的なODSに対して、観測者は立体視を知覚するが、運動視差を知覚しない。運動視差の無いことは、(数センチメートル程度の)少しの観測者の運動に対しても不快な体験を提供する傾向がある。例えば、眼球がもはや厳密にODSビュー円上に位置しないように視認者が動く場合、単に適切な狭角度画像セクションを選択して組み合わせることに基づいてビュー画像を生成することは、生成されたビュー画像が、ユーザーの眼球がビュー円上に留まっている場合と同じになることをもたらし、したがって、ユーザーがユーザーの頭部を動かすことによりもたらされなければならない視差が表されず、これは、知覚が現実世界に対して動くことができないということをもたらす。
これを解決するために、及び、ODSデータに基づく運動視差の生成を可能にするために、ODS形式は、深さ情報を含むように拡張される。1つの狭角度深さマップセクションが、各狭角度画像セクションに対して追加される。関連する深さマップを伴うODS画像の例が図7に示される。この深さ情報は、生成された画像がビュー円の外部(又は内部)の新しい位置に対応するようにビューポイントシフトを実施するために使用される(例えば、各ビュー画像又は狭角度画像セクションは、知られた画像と深さベースのビューポイントシフトアルゴリズムとを使用して処理される)。例えば、3Dメッシュが各眼球に対して生成され、左目及び右目に対するメッシュ及びテクスチャに基づくODSデータのレンダリングが、運動視差を導入するために使用され得る。
しかし、画像表現が、例えば、異なるキャプチャポーズに対する多くの画像に、又はODSデータに基づくか否かに関わらず、画像データが提供される対象のアンカーポーズと異なるポーズに対するビュー画像を生成することは、生じ得る画像の劣化をもたらすアーティファクト及び誤差を導入する傾向を示す。
レンダラー303は、受信された画像表現に基づいて現在のビューポーズに対するビュー画像を生成するように構成される。特に、右目画像及び左目画像が立体ディスプレイ(例えばヘッドセット)のために生成され、又は、複数のビュー画像が裸眼立体視ディスプレイのビューのために生成される。シーンの提供された画像からビュー画像を生成するための多くの異なるアルゴリズム及び技術が知られていること、及び、任意の適切なアルゴリズムが特定の実施形態に応じて使用されることが理解される。
しかし、レンダリングのための重要な動作は、特定された視認者ポーズ及び画像表現が互いに位置合わせされなければならないことである。
画像表現はシーンに対する所与の座標系に基づいて提供される。画像表現は特定のアンカーポーズに関連した画像データを含み、これらのアンカーポーズはシーン座標系に基づいて提供される。
同様に、視認者ポーズは視認者座標系に基づいて提供される。例えば、ビューポーズ特定部305により提供される視認者ポーズデータは、視認者の頭部位置及び回転の変化を示し、このデータは座標系に基づいて提供される。
したがって、本質的に、画像表現及び視認者ポーズは独立して提供され、別々に生成されるので、画像表現及び視認者ポーズは2つの異なる座標系に基づいて提供される。したがって、画像表現に基づいて視認者ポーズに対する画像をレンダリングするために、これらの座標系を互いに結び付ける/位置合わせすることが必要である。多くの状況において、使用される座標は同じ縮尺をもち、特に、現実世界の縮尺に整合した縮尺をもつ座標系に基づいて提供される。例えば、2つのアンカー位置が現実世界において1メートル離れたカメラによりキャプチャされたこと、又は、2つのアンカー位置が1メートル離れていると解釈されなければならないビューを提供することを反映して、2つのアンカー位置が1メートル離れているように規定され、又は説明される。同様に、視認者ポーズデータは、ユーザーが現実世界においてユーザーの頭部をどのように動かすか、例えば、ユーザーがユーザーの頭部を何センチメートル動かしたかを示す。
しかし、座標系の縮尺が同じであると知られている(又は推測されている)状況においても、座標系の相対位置を互いに位置合わせすることが必要とされる。従来、これは典型的には、アプリケーションを始動させたとき、シーン座標系における基準ポーズ(及び特に位置)を現在の視認者ポーズと位置合わせすることにより行われる。したがって、アプリケーションを始動させたとき、視認者は、ノミナル又はデフォルト開始位置においてシーンに効果的に配置される。次に、シーン座標系における視認者ポーズにより示される相対変化を追跡することにより、(ビューをレンダリングするときにレンダラーにより使用される)シーン座標系における視認者位置が特定されるように、この位置合わせが後で使用される。したがって、視認者ポーズが視認者座標系において左に2センチメートル変化したことの標示は、シーン座標系における左への2センチメートルのシフトに対応している。
したがって、2つの座標系の位置合わせを開始することは、従来、決められており、実際の視認者ポーズに依存しない。それは、典型的には、最大品質に対応したシーン座標系における位置において、例えば、画像表現が画像データを含む対象のデフォルト位置において視認者を初期化する位置合わせである。ユーザーは、シーンにおける所定の開始位置において体験を開始し、次に、視認者ポーズの任意の変化が追跡される。
しかし、本発明者らは、このようなアプローチが多くのアプリケーションに適するが、このようなアプローチはすべてのアプリケーションに対して理想的というわけではないことに気付いた。更に、位置合わせが視認者ポーズに依存した、特に視認者配向に依存したより適応的なアプローチが多くの実施形態において改善された動作を提供することにも気付いた。それは、特に、ユーザーが例えば小さい頭部の動き及び頭部の回転に制限されるような、多くの、動きに制限のあるサービスに有益である。このようなサービスでは、特定の時点において(例えば、視認者ポーズが、基準を満たす最後の位置合わせの後に動きを示す場合に)再度の位置合わせを実施することが特に魅力的であり、以下で説明される適応的なアプローチはこのようなシナリオにおいて特に有益である。
したがって、図3の装置はシーン座標系を視認者座標系と位置合わせするように構成された位置合わせ部307を備える。位置合わせは、特に、シーン座標系におけるシーン基準位置を視認者座標系における視認者基準位置と位置合わせする/結び付けることにより、座標系を位置合わせする。したがって、位置合わせは、シーン座標系におけるシーン基準位置が視認者座標系における視認者基準位置と同位置にされるようにされ、すなわちシーン基準位置と視認者基準位置とが同じ位置にされる。
シーン座標系における基準位置は、任意の適切な位置であり、特に固定の一定のシーン基準位置である。特に、シーン基準位置は、視認者ポーズに依存しないものであり、多くの場合、所定の基準位置である。位置合わせが繰り返し実施される実施形態において、シーン基準位置は、(少なくとも2つの)連続した位置合わせ動作間において一定である。
多くの実施形態において、シーン基準位置は、アンカー位置に対して規定される。例えば、基準位置は、アンカー位置、又は、例えばアンカー位置に対する平均位置である。幾つかの実施形態において、シーン基準位置は、画像表現が画像データを含む対象の位置、及び/又は、最適な画像品質が実現され得る対象の位置に対応する。
視認者ポーズに依存しないシーン基準位置とは対照的に、視認者基準位置は、位置合わせが実施される対象の視認者ポーズである第1の視認者ポーズに依存する。この第1の視認者ポーズは、以下で位置合わせ視認者ポーズと呼ばれる。位置合わせ視認者ポーズは、位置合わせが実施されることが所望される対象の任意の視認者ポーズである。多くの場合、位置合わせ視認者ポーズは、位置合わせが実施されるときの現在の視認者ポーズである。位置合わせ視認者ポーズは、典型的には現在の視認者ポーズであり、特に、(再度の)位置合わせが初期化された時点における視認者ポーズデータにより示されるポーズである。したがって、位置合わせが発生したときに、視認者基準位置が動的に特定され、視認者基準位置は視認者ポーズに依存し、特に、視認者基準位置は視認者ポーズの配向に依存する。
したがって、図3の装置は、位置合わせ部307とビューポーズ特定部305とに結合されたオフセットプロセッサ309を備える。オフセットプロセッサ309は、位置合わせ視認者ポーズに基づいて、及び特に、位置合わせが実施されるときの現在の視認者ポーズに基づいて、視認者基準位置を特定するように構成される。位置合わせ視認者ポーズは、2つの座標系間の位置合わせが実施される対象の視認者ポーズであり、位置合わせ視認者ポーズは、以下の説明では、(位置合わせが実施されるときの)現在の視認者ポーズであると考えられる。
オフセットプロセッサ309は、特に、視認者基準位置が位置合わせ/現在の視認者ポーズの配向に依存するように、視認者基準位置を特定するように構成される。オフセットプロセッサ309は、視認者基準位置が現在の視認者ポーズに対する視認者眼球位置に対してオフセットされるように、視認者基準位置を生成するように構成される。更に、オフセットは、視認者眼球位置のビュー方向と反対の方向の成分をもつ。
したがって、所与の視認者ポーズに対して、視認者基準位置がその視認者ポーズに対する眼球位置のうちのいずれとも同位置に配置されず、及び、視認者基準位置が眼球位置に対して側方に(又は、2つの眼球間の線上に)配置されないように、視認者基準位置が特定される。むしろ、視認者基準位置は、現在の視認者ポーズに対する眼球位置の「背部に」位置する。したがって、例えば視認者ポーズ位置が常に基準位置と位置合わせされるように2つの座標系が位置合わせされる従来のシステムとは対照的に、図3の装置は、視認者ポーズ(及びその眼球位置)に対するオフセット視認者基準位置を特定する。オフセットは、2つの座標系間のオフセットをもたらす現在の視認者位置に対するビュー方向の後方に向かう方向にある。更に、オフセットは後方に向かう成分をもつので、オフセットは視認者ポーズの配向に依存し、異なる視認者ポーズは異なる視認者基準位置をもたらし、したがって、異なる位置合わせオフセットをもたらす。
特に、特定された視認者基準位置は、同じ視認者位置だが異なる視認者配向を表す2つの視認者ポーズに対して異なる。同様に、同じ視認者基準位置は、2つの視認者ポーズが異なる位置を表す場合、異なる配向を表す2つの視認者ポーズに対してのみ取得され得る。
一例として、図8は、現在の視認者ポーズがビュー/ビューポート803を所与の方向805としたときの眼球位置801を示す単純な例を示す。この場合において、視認者基準位置807は、眼球位置801に対する後方オフセット809を伴って特定されている。図8は、異なる配向を伴う2つの例を示す。明確に確認され得るように、視認者基準位置は回転に依存する(2つの例における眼球位置801が同じ位置にあると考えられる場合、視認者基準位置807として特定された位置は明確に異なる)。
図9は、視認者ポーズ901がユーザーの眼球間の中点を示す対応する例を示す。後方へのオフセット903が視認者基準位置905を提供する。図10は、視認者ポーズが同じ位置だが異なる配向を表す2つの重ね合わされた例を示す。明確に確認され得るように、対応する視認者基準位置は異なる。
結果として、視認者基準位置がシーン基準位置と位置合わせされたとき、異なる配向は、特にアンカーポーズと視認者ポーズとの間の異なる位置合わせをもたらす。これは、ODS円画像表現に対して図11に示されており、3つのキャプチャポーズに対する画像による画像表現の例に対して図12に示されている。後者の例において、キャプチャ構成の配向は変えられていないが、幾つかの実施形態において、これが、例えば、視認者ポーズ間の配向の違いに対応するように回転されることが理解される。
本発明者らは、配向依存オフセットを伴うこのような位置合わせが、多くの実用的なアプリケーションにおいて大幅に改善された品質を提供することに気付いた。特に、視認者が比較的小さい頭部の動き及び回転に制限されるアプリケーションにおいて大幅に改善された品質を提供することが見出された。この場合において、オフセットの適応的変化は、従来使用されるノミナル及びデフォルト位置から離れるように画像データを効果的に動かす。これは、この特定のビューポーズに対する画像品質を下げる何らかの更なるビューシフトが実施されることを必要とする。しかし、本発明者らは、それが典型的には、他の近位のポーズに対する、及び特に回転する動きに対する画像品質を改善することに気付いた。実際、適切なオフセットを適用することにより、幾つかの他のポーズに必要なビューシフトが小さくされ、以て、これらのポーズに対する改善された品質を可能にする。本発明者らは、適応的な後方オフセットが、典型的には、位置合わせ視認者ポーズに対する任意の品質劣化より大幅に勝る非位置合わせ視認者ポーズに対する(すなわち、ノミナルデフォルトポーズに対応しないポーズに対する)品質改善を提供することに更に気付いた。本発明者らは、特に、適応的な後方オフセットが、前方向(及び後方向)へのビューポイントシフトの品質に対する影響が(例えばデオクルージョン効果に起因した)側方ビューポイントシフトに対する品質に対する影響より大幅に小さいことを利用し得ることに気付いた。
本アプローチは、したがって、ある範囲の他の視認者ポーズにわたる大幅に改善された品質と引き換えに、ノミナル視認者ポーズに対する何らかの品質劣化を犠牲にすることにより、改善されたトレードオフを提供する。特に、制限された頭部の動きを伴うアプリケーションに対して、これは、多くの場合、大幅に改善されたユーザー体験を提供し、より大きい範囲のポーズにわたって所与の要求される画像品質がサポートされ得るので、再位置合わせに関する要求を更に下げる。
オフセットの厳密なサイズは異なる実施形態において異なり、多くの実施形態において動的に特定される。しかし、多くの実施形態において、後方オフセット成分、ひいては、ビュー方向の逆方向におけるオフセットは、視認者座標系において1cm、2cm、又は4cm以上である。視認者座標系は、典型的には、視認者ポーズ、及び特に現実世界における位置の実際の変化を反映した、現実世界の縮尺の座標系である。したがって、後方オフセット成分は、視認者ポーズに対する現実世界における縮尺における少なくとも1cm、2cm、又は4cmに対応する。
このような最小オフセット値は、典型的にはオフセットが大幅な影響を与えること、及び、多くの実際の視認者ポーズ及びポーズ変動に対して大幅な品質改善が実現され得ることを確実なものとする。
多くの実施形態において、後方オフセット成分、ひいてはビュー方向の逆方向におけるオフセットは、視認者座標系において8cm、10cm、又は12cm以下である。後方オフセット成分は、視認者ポーズに対する現実世界における縮尺における8cm、10cm、又は12cm以下に対応する。
このような最小オフセット値は、典型的には、オフセットが位置合わせ視認者ポーズに対する生成された画像に対する品質に不合理に影響を与えないことを確実なものとするために、オフセットが十分に小さいことを確実なものとする。
このようなパラメータを伴うオフセットの選択は、特に、視認者基準位置が典型的には視認者の頭部内に配置されることをもたらす。
オフセット値は、前方視認品質と側方視認品質との間においてバランスを取ると考えられ得る。より小さいオフセット値は、より小さいビューポイントシフトを理由として、前方視認に対してより小さい誤差をもたらす。しかし、頭部の回転は、デオクルージョンに起因した品質の急激な劣化をもたらす。劣化の影響、及び実際に側方視認におけるオフセットは、典型的には、前方視認に対する影響より遥かに大きい傾向を示し、それに対するオフセットを使用する利点は、頭部の回転に対して大幅に改善された利点を提供する傾向を示すとともに、前方視認に対して少しの劣化しかもたらさない。
したがって、より小さいオフセット値(1cm~4cm)は、視認者が主に前方を見ることが想定される場合に有用である。(首から上に突出した)頭部の回転軸に対応したオフセット値までの、より大きいオフセット値(8cm~12cm)は、頭部の回転にそれほど大きく依存しない品質をもたらす。したがって、視認者が大きく見回すことが想定される場合、大きいオフセット値が適切である。中間オフセット値は典型的な視認者の挙動に対して最適であると想定されるものに対応し、この場合、前方を見ることに対するバイアスが存在し、したがって、前方視認に対して、より高い品質をもつことが好ましく、本アプローチは、側方視認に対する劣化を小さくするために適用される。
多くの実施形態において、後方オフセット成分、ひいてはビュー方向の逆方向におけるオフセットは、(ノミナル/デフォルト/推測)眼球間距離の1/10、1/5、1/3、又は1/2以上である。多くの実施形態において、後方オフセット成分、ひいてはビュー方向の逆方向におけるオフセットは、(ノミナル/デフォルト/推測)眼球間距離の1倍、1.5倍、又は2倍以下である。
幾つかの実施形態において、オフセットに対する正規化された縮尺は[0,1]の範囲内であると考えられ、0はカメラにおける(例えば、回転によりもたらされる位置の変化を伴わない)値であり、1は首/頭部回転位置における値である。1の正規化された距離は、多くの場合、例えば、8cm、10cm、又は12cmに対応すると考えられる。
オフセットを特定するための異なるアプローチが、異なる実施形態に使用される。例えば、幾つかの実施形態において、所定の、及び固定のオフセットが、すべての状況において単に適用される。したがって、オフセットは、位置合わせ処理に内在する部分であり、アルゴリズムにハードコーディングされる。しかし、多くの実施形態において、オフセットは動作中に動的に決定される。
幾つかの実施形態において、オフセットは、サーバー側において生成され、画像表現と一緒に、及び特に画像信号の一部としてレンダリングデバイスに提供される。
特に、図2のVRサーバー103は、位置合わせが実施される対象の視認者ポーズに対する視認者基準位置と視認者眼球位置との間のオフセットを特定するように構成されたオフセット生成器209を備える。したがって、オフセット生成器209は、視認者座標系に対してシーン座標系を位置合わせするときにシーン基準位置と視認者眼球位置との間に適用するために、オフセットを特定する。上述のように、オフセットは視認者眼球位置のビュー方向の反対方向、すなわち位置合わせ視認者ポーズに対するビュー方向の反対におけるオフセット成分を含む。次に、オフセット標示が、オフセットを少なくとも部分的に表すように生成され、このオフセット標示は、クライアントデバイス101に送信される画像信号に含まれる。次に、クライアントデバイス101は、オフセット標示から適用されるオフセットを特定することに進み、次に、クライアントデバイス101は、シーン座標系と視認者座標系とを位置合わせするときにこのオフセットを使用し、特に、クライアントデバイス101は、視認者基準位置を特定するために視認者眼球位置にオフセットを適用する。このようなアプローチは、多くの実施形態において、例えばブロードキャストアプリケーションに対して、特に有益である。本アプローチは、特に、適切な基準に従って最良のオフセットを特定するために最適化処理が実施されることを可能にし、次に、この最適化されたオフセットは、位置合わせを実施するときに最適化されたオフセットを使用し得るすべてのクライアントデバイスに通信される。
したがって、このような実施形態において、クライアントデバイス101は、画像表現に加えてオフセット標示を更に含む画像データ信号を受信する。次に、クライアントデバイス101は、このオフセットを直接(又は、例えば変更後に)使用する。
したがって、オフセットは、例えば最適化処理に基づいて動的に特定される。このような処理は、源において実施され、又は、例えばレンダリングデバイスにより、すなわち前述の例におけるクライアントデバイス101により実施される。
オフセット生成器209は、適切なオフセットを生成するための任意の適切なアプローチを使用する。例えば、幾つかの実施形態において、ユーザー入力は、例えばユーザーがオフセットを動的に調節することを可能にすること、及び次に異なる視認者ポーズに対する画像を生成することにより、好ましいオフセットを選択するために使用される。他の実施形態において、オフセットに対する候補値の範囲を評価するために自動化された処理が使用され、適切な範囲の視認者ポーズにわたって最高品質をもたらす値が使用される。
サーバーは、特に、異なるオフセットの影響を評価するためにレンダリング側において実施される演算をエミュレートする。例えば、サーバーは、レンダラーにより実施される処理をエミュレートすることにより異なる候補値を評価し、次に、適切な品質尺度を使用して結果として得られる品質を評価する。実際、レンダラー/受信部/クライアントに関連して、及び特にオフセットプロセッサ309に関連して説明されるアプローチ、アルゴリズム、及び検討は、画像データストリームにおいて示されるオフセットを特定するときに、オフセット生成器209により更に実施される。
オフセットの標示を提供する任意の適切な手法が使用されてもよいことが更に理解される。多くの実施形態において、適用される完全に説明されているオフセットは、例えば二次元又は三次元ベクトル標示を提供することにより説明される。このようなオフセットベクトルは、例えば、適用されるオフセットの方向及びサイズを示す。視認者基準位置を特定するとき、レンダラーは、次に、位置合わせ眼球位置に、位置合わせ視認者ポーズに対する眼球ビュー方向に対して特定された方向のベクトルを配置する。
幾つかの実施形態において、オフセット標示は、オフセットの部分的表現のみを備える。例えば、多くの実施形態において、オフセット標示は、距離/サイズ標示及び/又は方向標示のみを含む。このような場合において、レンダラーは、例えば、これらに対する適切な値を特定する。したがって、幾つかの実施形態において、オフセットの特定は、サーバー側とクライアント側との両方において行われた判断に基づく。例えば、方向がオフセット標示により与えられ、サーバーにより特定されるのに対し、サイズ/距離はレンダラーにより特定される。以下で、オフセットプロセッサ309によりオフセットを特定するためのアプローチが説明される。説明される原理及びアプローチはオフセット生成器209により同じく実施され得、結果として得られるオフセットは画像データストリームに含まれることが理解される。したがって、以下で、オフセットプロセッサ309に対する言及は、オフセット生成器209に(必要な変更を加えた上で)同じく適用されると考えられる。
本アプローチは、オフセットに対する異なる候補値に対する1つ又は複数の視認者ポーズに対する誤差尺度(値/測定結果)を特定するオフセットプロセッサ309に基づいている。それは、次に、最低誤差尺度をもたらす候補値を選択し、位置合わせを実施するときにオフセットに対してこの値を使用する。
多くの実施形態において、所与の候補オフセットに対する誤差尺度は、複数の視認者ポーズに対する、例えば特にある範囲の視認者ポーズに対する誤差尺度の組み合わせに応じて特定される。例えば、異なる視認者ポーズに対して、オフセットが候補オフセットに設定されたときに画像表現からそのビューポーズに対するビュー画像を生成するときの画像品質の劣化を示す誤差尺度が特定される。次に、異なる視認者ポーズに対する結果として得られる誤差尺度は、候補値に対する組み合わされた誤差尺度を提供するために平均化される。次に、異なる候補値に対する組み合わされた誤差尺度が比較され得る。
多くの実施形態において、候補値に対する誤差尺度は、複数の異なる位置からの、及び/又は、複数の異なるポーズに対する誤差尺度を組み合わせることにより生成される。
幾つかの実施形態において、1つの候補値に対する1つの視認者ポーズに対する誤差尺度は、複数の、及び典型的にはある範囲の凝視方向に対する誤差尺度に応じたものである。したがって、異なる位置及び/又は配向が考慮されるだけでなく所与のポーズに対して、異なる凝視方向における、すなわち所与のビューポーズに対するビューポートの異なる方向における品質が考慮される。
一例として、オフセットプロセッサ309は、2cm、4cm、6cm、8cm、10cm、及び12cmの後方オフセットに対する誤差尺度を特定する。誤差尺度は、例えば、、現在のユーザーが例えば、15°、30°、及び45°の大きさぶん左又は右にユーザーの頭部を回転させることに対応した視認者ポーズといった視認者ポーズの集合に対するレンダリングされた画像に対する画像品質の標示として、対応する候補オフセットの各々に対して特定される。次に、最低誤差尺度をもたらす候補オフセットが選択される。
考慮される厳密な誤差尺度は、異なる実施形態において異なる。典型的には、適切な誤差尺度はそのポーズ及び候補オフセットに対する画像表現からのビュー合成に対する品質劣化を示す。したがって、視認者ポーズ及び候補値に対する誤差尺度は、画像表現(のうちの少なくとも1つの画像)から合成された視認者ポーズに対するビュー画像に対する画像品質尺度を含む。
シーンのモデルから画像生成に基づいてサーバー側においてオフセットが特定される実施形態では、所与の候補オフセット及び視認者ポーズに対する画像が生成されて、モデルから直接生成された対応する画像と比較される。
他の実施形態において、より間接的な尺度が使用される。例えば、(所与の候補オフセットとともに)画像データが提供される対象のキャプチャポーズに画像データが合成される対象の視認者ポーズからの距離が特定される。距離が長いほど、誤差尺度が大きいと考えられる。
幾つかの実施形態において、誤差尺度の特定は、1つより多いキャプチャポーズの考慮を含む。したがって、所与の視認者ポーズに対して合成された画像は、画像表現が1つより多くのものを含む場合、異なるアンカーポーズ画像に基づいて生成され得ることが特に考慮される。例えば、図12の画像表現などの画像表現に対して、合成はいずれかのアンカー画像に基づき、実際、合成された画像の所与のピクセルは、アンカー画像のうちの2つ以上を考慮することにより生成される。例えば、補間が使用される。
したがって、幾つかの実施形態において、視認者ポーズ及び候補値に対する誤差尺度は、画像表現の少なくとも2つの画像から合成された視認者ポーズに対するビュー画像に対する画像品質尺度を含み、この少なくとも2つの画像は、候補オフセット値に応じた視認者ポーズに対する基準位置をもつ。
オフセットを選択するためのアプローチの特定の例が、図13~図15を参照して説明される。本例において、画像表現は、1つのODSステレオ画像である。
図13は、楕円として視認者の頭部を示し、2つの眼球位置/ビューポイントは前方に向いている。現在の/位置合わせ視認者ポーズに対応したノミナル頭部ポーズは、y軸に一致するように示されている。図は、それぞれ左に45°及び90°の幾つかの生じ得る頭部の回転を更に示す(右への対応する回転は眼球位置のみにより示されている)。
図13は、ODSビュー円が視認者の眼球に一致するように配置されるように、位置合わせが従来どのようになるかを更に示す。
図14は、頭部の回転αに対応したビューポーズに対して誤差尺度がどのように生成され得るかの例を示す。本例において、左目に対する結果として得られる位置xl,ylが特定され得、この位置に対して凝視方向βが特定される。凝視方向における半直線に対する画像データを含む位置xl’,yl’におけるODSビュー円に対する接線までの眼球位置xj,xyからの距離dが特定される。この距離Dは、ODSビュー円が示されるように配置されたとき、これがODSビュー画像から生成されたとき、頭部の回転αに対して凝視方向βにおけるピクセルに対して発生する画像の劣化を示す。したがって、組み合わされた誤差尺度は、ある範囲の凝視方向(例えば、-45°<β<+45°)にわたる、及び、ある範囲の頭部回転角度(例えば、-90°<β<+90°)にわたる、対応する誤差尺度を平均化することにより生成される(幾つかの実施形態において、頭部の異なる位置も検討される)。結果として得られる組み合わされた誤差尺度は、したがって、示されるように配置されたODSステレオ画像から頭部の回転に対してビュー画像を生成するときに必要とされる「ビューポイントシフト距離」の平均化された大きさを示す。
多くの実施形態において、本アプローチは、左目と右目との両方に対して実施され、これらに対する尺度が組み合わされる。
図15により示されるように、これは、ODSビュー円の異なる位置に対して、及び特にy方向における異なるオフセットに対して実行され、最小誤差尺度が導出される対象のオフセット/位置は、位置合わせに対して使用するオフセットとして選択される。
幾つかの実施形態において、オフセットは、直接的に後方向であり、したがって直接的に、現在の/位置合わせ視認者ポーズに対するビュー方向の逆方向である。視認者座標系(したがって、視認者)に関連して、後方向は、視認者に対する矢状面又は正中面と横断面又はアキシャル面との交差部の方向である(又は、交差部と平行である)(例えば、https://en.wikipedia.org/wiki/Anatomical_planeを参照されたい)。この方向は、(例えば超音波において)アキシャル(体内への、前)方向としても知られる。
しかし、幾つかの実施形態及びシナリオにおいて、オフセットは横成分を更に含み、すなわち、オフセットは、位置合わせ視認者ポーズに対するビュー方向に直交した方向におけるオフセット成分を含む。この横成分は、依然として水平方向であり、特に、視認者の2つの眼球間の方向に対応した方向である。
横成分は、視認者座標系(したがって視認者)に基づいており、視認者に対する冠状面又は前頭面と横断面又はアキシャル面との交差部の方向である(又は、交差部と平行である)。この方向は、(例えば超音波において)横方向としても知られる。
横方向オフセット成分は、多くの実施形態において、ある範囲の視認者ポーズにわたって改善された品質を提供する、より柔軟なアプローチを提供する。例えば、位置合わせが実施される対象の現在の視認者ポーズが視認者の想定される、又は推測される更なる動きに対して対称でないことが知られている、又は前提である場合、将来の視認者ポーズに対する改善された平均的品質が、視認者の将来の位置に対してより可能性が高い位置に向けて視認者基準位置を横方向にオフセットすることにより達成される。
幾つかの実施形態において、オフセットは縦成分を含む。
縦成分は、視認者座標系(したがって視認者)に基づき、視認者に対する冠状面又は前頭面と矢状面又は正中面との交差部の方向である(又は、交差部に平行である)。この方向は(例えば超音波において)トランスバース方向としても知られる。
例えば、典型的なシーンは、眼球レベルより下方、及びその後の上方におけるより多くの状況を含む。視認者が見下げた後に見上げる可能性が高い場合、視認者が見下げるときのデオクルージョンの量を減らすために、小さい上向きオフセットをもつことが好ましい。
別の例として、視認者が上下にうなずくことにより視認者の頭部を動かすことが考えられる。これは、眼球位置及び配向の動きをもたらし、したがって、ビューポイントシフトに影響を与える。前述のアプローチは、縦オフセットを特定することを更に考慮するように拡張される。例えば、所与の候補オフセット値に対する誤差尺度を特定する場合、これは、異なる上下の頭部の回転に対応した視認者ポーズを評価することを有する。同様に、縦成分を含む候補オフセット値が評価される。
このようなアプローチは、ユーザーの動きに対して改善された柔軟性を提供し、より広い範囲の動きに対して改善された全体的な品質を提供する。
上述の説明は明確となるように、異なる機能回路、ユニット、及びプロセッサを参照しながら本発明の実施形態を説明していることが理解される。しかし、本発明を損なうことなく、異なる機能回路、ユニット又はプロセッサの間における機能の任意の適切な分散が使用されてもよいことが明らかである。例えば、独立したプロセッサ又は制御装置により実施されるように示されている機能は、同じプロセッサ又は制御装置により実施されてもよい。したがって、特定の機能ユニット又は回路についての言及は、厳密な理論的な、又は物理的な構造又は組織を表すわけではなく、説明される機能を提供する適切な手段への言及と考えられるにすぎない。
本発明は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組み合わせを含む任意の適切な形態で実現され得る。本発明は、1つ又は複数のデータプロセッサ及び/又はデジタル信号プロセッサにおいて動作するコンピュータソフトウェアとして少なくとも部分的に任意選択的に実現されてもよい。本発明の実施形態の要素及びコンポーネントは、任意の適切な手法により物理的に、機能的に、及び論理的に実現されてもよい。実際、機能が1つのユニットにおいて、複数のユニットにおいて、又は、他の機能ユニットの一部として実現されてもよい。したがって、本発明は、1つのユニットにおいて実現されてもよく、又は、異なるユニット、回路、及びプロセッサ間において物理的に、及び機能的に分散されてもよい。
本発明は幾つかの実施形態との関連において説明されているが、本発明は本明細書に記載されている特定の形態に限定されることを意図したものではない。むしろ、本発明の範囲は、添付の特許請求の範囲のみにより限定される。更に、機能が特定の実施形態に関連して説明されるように見受けられるが、説明される実施形態の様々な特徴が本発明により組み合わされてもよいことを当業者は認識する。特許請求の範囲において、備える(含む、有する、もつ)という表現は、他の要素又はステップの存在を否定するわけではない。
更に、独立して列記されている場合でも、複数の手段、要素、回路、又は方法のステップが、例えば1つの回路、ユニット、又はプロセッサにより実現されてもよい。更に、個々の機能が異なる請求項に含まれる場合があるが、場合によってはこれらが有益に組み合わされてもよく、異なる請求項に含まれていることは、特徴の組み合わせが実行可能でないこと、及び/又は、有益でないことを意味するわけではない。更に、請求項のあるカテゴリにおける機能の包含は、このカテゴリへの限定を意味するわけではなく、むしろ、機能が必要に応じて他の請求項のカテゴリに同様に適用可能であることを示す。更に、特許請求の範囲における機能の順序は、機能が実行されなければならない何らかの特定の順序を意味しているわけではなく、特に、方法の請求項における個々のステップの順序は、ステップがこの順序で実施されなければならないことを意味するわけではない。むしろ、ステップは、任意の適切な順序で実施されてもよい。加えて、単数形による記載は複数を排除しない。したがって、単数形の表現、「第1の」、「第2の」などの表現は複数を除外しない。特許請求の範囲における参照符号は明確にするための例として提供されるにすぎず、いかなる手法によっても請求項の範囲を限定すると解釈されない。
幾つかの実施形態により、以下のものが提供される。
画像をレンダリングするための装置であって、装置が、
シーンの画像表現を受信するための受信部(301)であって、画像表現が、シーン座標系に基づいて提供され、シーン座標系が、基準位置を含む、受信部(301)と、
視認者に対する視認者ポーズを特定するための特定部(305)であって、視認者ポーズが、視認者座標系に基づいて提供される、特定部(305)と、
シーン基準位置を視認者座標系における視認者基準位置と位置合わせすることにより、シーン座標系を視認者座標系と位置合わせするための位置合わせ部(307)と、
画像表現と視認者座標系に対するシーン座標系の位置合わせとに応じて、異なる視認者ポーズに対するビュー画像をレンダリングするためのレンダラー(303)と、
を備え、
装置が、
位置合わせ視認者ポーズに応じて視認者基準位置を特定するように構成されたオフセットプロセッサ(309)であって、視認者基準位置が、位置合わせ視認者ポーズの配向に依存し、及び、位置合わせ視認者ポーズに対する視認者眼球位置に対するオフセットをもち、オフセットが、視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、オフセットプロセッサ(309)
を更に備える、
装置。
画像信号を生成するための装置であって、装置が、
1つ又は複数のポーズからのシーンを表す多数の画像を受信するための受信部(201)と、
シーンの画像表現を提供する画像データを生成するための表現プロセッサ(205)であって、画像データが、多数の画像とシーン座標系に基づいて提供される画像表現とを含み、シーン座標系が、シーン基準位置を含む、表現プロセッサ(205)と、
オフセット標示を生成するためのオフセット生成器(209)であって、オフセット標示が、視認者座標系におけるシーン基準位置と視認者基準位置との間のオフセットを示す、オフセット生成器(209)と、
画像データとオフセット標示とを含むように画像信号を生成するための出力プロセッサ(207)と、
を備える、装置。
画像をレンダリングする方法であって、方法が、
シーンの画像表現を受信するステップであって、画像表現が、シーン座標系に基づいて提供され、シーン座標系が、基準位置を含む、受信するステップと、
視認者に対する視認者ポーズを特定するステップであって、視認者ポーズが、視認者座標系に基づいて提供される、特定するステップと、
シーン基準位置を視認者座標系における視認者基準位置と位置合わせすることにより、シーン座標系を視認者座標系と位置合わせするステップと、
画像表現と視認者座標系に対するシーン座標系の位置合わせとに応じて、異なる視認者ポーズに対するビュー画像をレンダリングするステップと、
を有し、
方法は、
位置合わせ視認者ポーズに応じて視認者基準位置を特定するステップであって、視認者基準位置が、位置合わせ視認者ポーズの配向に依存し、位置合わせ視認者ポーズに対する視認者眼球位置に対するオフセットをもち、オフセットが、視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、特定するステップ、
を更に有する、
方法。
画像信号を生成するための方法であって、方法が、
1つ又は複数のポーズからのシーンを表す多数の画像を受信するステップと、
シーンの画像表現を提供する画像データを生成するステップであって、画像データが、多数の画像とシーン座標系に基づいて提供される画像表現とを含み、シーン座標系が、シーン基準位置を含む、生成するステップと、
オフセット標示を生成するステップであって、オフセット標示が、視認者座標系におけるシーン基準位置と視認者基準位置との間のオフセットを示す、生成するステップと、
画像データとオフセット標示とを含むように画像信号を生成するステップと、
を有する、方法。
上述の装置及び方法は、個別に、又は任意の組み合わせにより従属請求項の特徴の各々と組み合わされてもよい。

Claims (16)

  1. 画像をレンダリングするための装置であって、前記装置が、
    シーンの画像表現を受信するための受信部であって、前記画像表現が、シーン座標系に基づいて提供され、前記シーン座標系が、基準位置を含む、受信部と、
    視認者に対する視認者ポーズを特定するための特定部であって、前記視認者ポーズが、視認者座標系に基づいて提供される、特定部と、
    シーン基準位置を前記視認者座標系における視認者基準位置と位置合わせすることにより、前記シーン座標系を前記視認者座標系と位置合わせするための位置合わせ部と、
    前記画像表現と前記視認者座標系に対する前記シーン座標系の前記位置合わせとに応じて、異なる視認者ポーズに対するビュー画像をレンダリングするためのレンダラーと、
    を備え、
    前記装置は、
    位置合わせが実施される対象の視認者ポーズである第1の視認者ポーズに応じて前記視認者基準位置を特定するオフセットプロセッサであって、前記視認者基準位置が、前記第1の視認者ポーズの配向に依存し、及び、前記第1の視認者ポーズに対する視認者眼球位置に対するオフセットをもち、前記オフセットが、前記視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、オフセットプロセッサ、
    を更に備え、
    前記受信部が、前記画像表現を含むとともにオフセット標示を更に含む画像データ信号を受信し、前記オフセットプロセッサが、前記オフセット標示に応じて前記オフセットを特定する、
    装置。
  2. 前記オフセット成分が、2cm以上である、
    請求項1に記載の装置。
  3. 前記オフセット成分が、12cm以下である、
    請求項1又は2に記載の装置。
  4. 前記オフセットプロセッサが、少なくとも1つの視認者ポーズに対する誤差尺度に応じて前記オフセットを特定し、前記誤差尺度が、前記オフセットの候補値に依存する、
    請求項1から3のいずれか一項に記載の装置。
  5. 前記オフセットプロセッサが、複数の視認者ポーズに対する前記誤差尺度の組み合わせに応じて候補値に対する前記誤差尺度を特定する、
    請求項4に記載の装置。
  6. 視認者ポーズ及び前記オフセットの候補値に対する前記誤差尺度が、前記画像表現の少なくとも1つの画像から合成された前記視認者ポーズに対するビュー画像に対する画像品質尺度を含み、前記少なくとも1つの画像が、前記候補値に応じた前記視認者ポーズに対する位置を含む、
    請求項4又は5に記載の装置。
  7. 視認者ポーズ及び前記オフセットの候補値に対する前記誤差尺度が、前記画像表現の少なくとも2つの画像から合成された前記視認者ポーズに対するビュー画像に対する画像品質尺度を含み、前記少なくとも2つの画像が、前記候補値に応じた前記視認者ポーズに対する基準位置をもつ、
    請求項4又は5に記載の装置。
  8. 前記画像表現が、全方向画像表現を含む、
    請求項1から7のいずれか一項に記載の装置。
  9. 前記オフセットが、前記視認者眼球位置のビュー方向に直交する方向におけるオフセット成分を含む、
    請求項1から8のいずれか一項に記載の装置。
  10. 前記オフセットが、縦成分を含む、
    請求項1から9のいずれか一項に記載の装置。
  11. 画像信号を生成するための装置であって、前記装置が、
    1つ又は複数のポーズからのシーンを表す多数の画像を受信するための受信部と、
    前記シーンの画像表現を提供する画像データを生成するための表現プロセッサであって、前記画像データが、前記多数の画像とシーン座標系に基づいて提供される前記画像表現とを含み、前記シーン座標系が、シーン基準位置を含む、表現プロセッサと、
    オフセット標示を生成するためのオフセット生成器であって、前記オフセット標示が、視認者座標系に対して前記シーン座標系を位置合わせするときに前記シーン基準位置と視認者眼球位置との間に適用するためのオフセットを示し、前記オフセットが、前記視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、オフセット生成器と、
    前記画像データと前記オフセット標示とを含むように前記画像信号を生成するための出力プロセッサと、
    を備える、装置。
  12. 前記オフセット生成器は、少なくとも1つの視認者ポーズに対する誤差尺度に応じて前記オフセットを特定し、前記誤差尺度が、前記オフセットの候補値に依存する、
    請求項11に記載の装置。
  13. 前記オフセット生成器が、複数の視認者ポーズに対する前記誤差尺度の組み合わせに応じて候補値に対する前記誤差尺度を特定する、
    請求項12に記載の装置。
  14. 画像をレンダリングする方法であって、前記方法が、
    シーンの画像表現を受信するステップであって、前記画像表現が、シーン座標系に基づいて提供され、前記シーン座標系が、基準位置を含む、受信するステップと、
    視認者に対する視認者ポーズを特定するステップであって、前記視認者ポーズが、視認者座標系に基づいて提供される、特定するステップと、
    シーン基準位置を前記視認者座標系における視認者基準位置と位置合わせするステップにより、前記シーン座標系を前記視認者座標系と位置合わせするステップと、
    前記画像表現と前記視認者座標系に対する前記シーン座標系の前記位置合わせとに応じて、異なる視認者ポーズに対するビュー画像をレンダリングするステップと、
    を有し、
    前記方法が、
    第1の視認者ポーズに応じて前記視認者基準位置を特定するステップであって、前記視認者基準位置が、前記第1の視認者ポーズの配向に依存し、及び、前記第1の視認者ポーズに対する視認者眼球位置に対するオフセットをもち、前記オフセットが、前記視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、特定するステップ、
    を更に有し、
    前記シーンの前記画像表現を前記受信するステップが、前記画像表現を含むとともにオフセット標示を更に含む画像データ信号を受信するステップを有し、前記オフセット標示に応じて前記オフセットを特定するステップを更に有する、
    方法。
  15. 画像信号を生成するための方法であって、前記方法が、
    1つ又は複数のポーズからのシーンを表す多数の画像を受信するステップと、
    前記シーンの画像表現を提供する画像データを生成するステップであって、前記画像データが、前記多数の画像とシーン座標系に基づいて提供される前記画像表現とを含み、前記シーン座標系が、シーン基準位置を含む、生成するステップと、
    オフセット標示を生成するステップであって、前記オフセット標示が、視認者座標系に対して前記シーン座標系を位置合わせするときに前記シーン基準位置と視認者眼球位置との間に適用するためのオフセットを示し、前記オフセットが、前記視認者眼球位置のビュー方向の反対方向におけるオフセット成分を含む、生成するステップと、
    前記画像データと前記オフセット標示とを含むように画像信号を生成するステップと、
    を有する、方法。
  16. コンピュータにおいて実行されたときに請求項14又は15に記載のすべてのステップを実施するコンピュータプログラムコード手段を含む、コンピュータプログラム。
JP2021543369A 2019-01-30 2020-01-19 シーンの画像表現 Active JP7471307B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19154468.3 2019-01-30
EP19154468.3A EP3690822A1 (en) 2019-01-30 2019-01-30 Image representation of a scene
PCT/EP2020/051205 WO2020156844A1 (en) 2019-01-30 2020-01-19 Image representation of a scene

Publications (2)

Publication Number Publication Date
JP2022519033A true JP2022519033A (ja) 2022-03-18
JP7471307B2 JP7471307B2 (ja) 2024-04-19

Family

ID=65278183

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021543369A Active JP7471307B2 (ja) 2019-01-30 2020-01-19 シーンの画像表現

Country Status (9)

Country Link
US (1) US11734875B2 (ja)
EP (2) EP3690822A1 (ja)
JP (1) JP7471307B2 (ja)
KR (1) KR20210122283A (ja)
CN (1) CN113366540A (ja)
BR (1) BR112021014724A2 (ja)
CA (1) CA3127908A1 (ja)
TW (1) TW202038605A (ja)
WO (1) WO2020156844A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11615582B2 (en) * 2021-06-08 2023-03-28 Fyusion, Inc. Enclosed multi-view visual media representation

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10619202B2 (en) 2013-11-29 2020-04-14 Koninklijke Philips N.V. Optical controlling of a chemical reaction
GB2525170A (en) * 2014-04-07 2015-10-21 Nokia Technologies Oy Stereo viewing
CN106461198B (zh) 2014-04-11 2019-11-19 飞利浦灯具控股公司 照明器材
EP3304894A1 (en) 2015-05-27 2018-04-11 Google LLC Omnistereo capture and render of panoramic virtual reality content
US9588598B2 (en) * 2015-06-30 2017-03-07 Ariadne's Thread (Usa), Inc. Efficient orientation estimation system using magnetic, angular rate, and gravity sensors
CN108292040B (zh) 2015-09-30 2020-11-06 索尼互动娱乐股份有限公司 优化头戴式显示器屏幕上的内容定位的方法
DE202017104934U1 (de) 2016-08-17 2017-11-20 Google Inc. Mehrstufiges Kameraträgersystem für die stereoskope Bildaufnahme
WO2018201048A1 (en) * 2017-04-27 2018-11-01 Google Llc Synthetic stereoscopic content capture

Also Published As

Publication number Publication date
US20220114782A1 (en) 2022-04-14
TW202038605A (zh) 2020-10-16
WO2020156844A1 (en) 2020-08-06
JP7471307B2 (ja) 2024-04-19
EP3918575A1 (en) 2021-12-08
EP3690822A1 (en) 2020-08-05
BR112021014724A2 (pt) 2021-09-28
US11734875B2 (en) 2023-08-22
KR20210122283A (ko) 2021-10-08
CN113366540A (zh) 2021-09-07
CA3127908A1 (en) 2020-08-06

Similar Documents

Publication Publication Date Title
US10681276B2 (en) Virtual reality video processing to compensate for movement of a camera during capture
JP7480163B2 (ja) 画像の奥行きマップの処理
JP6915165B2 (ja) ビュー画像を生成するための装置および方法
US20220165015A1 (en) Image signal representing a scene
JP7471307B2 (ja) シーンの画像表現
JP7377861B2 (ja) 画像生成装置及び方法
US20220174259A1 (en) Image signal representing a scene

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240409

R150 Certificate of patent or registration of utility model

Ref document number: 7471307

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150