JPWO2017195650A1 - 生成装置および生成方法、並びに、再生装置および再生方法 - Google Patents

生成装置および生成方法、並びに、再生装置および再生方法 Download PDF

Info

Publication number
JPWO2017195650A1
JPWO2017195650A1 JP2018516955A JP2018516955A JPWO2017195650A1 JP WO2017195650 A1 JPWO2017195650 A1 JP WO2017195650A1 JP 2018516955 A JP2018516955 A JP 2018516955A JP 2018516955 A JP2018516955 A JP 2018516955A JP WO2017195650 A1 JPWO2017195650 A1 JP WO2017195650A1
Authority
JP
Japan
Prior art keywords
image
resolution
unit
omnidirectional image
omnidirectional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018516955A
Other languages
English (en)
Other versions
JP6977720B2 (ja
Inventor
伸明 泉
伸明 泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2017195650A1 publication Critical patent/JPWO2017195650A1/ja
Application granted granted Critical
Publication of JP6977720B2 publication Critical patent/JP6977720B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06T3/04
    • G06T3/12
    • G06T3/06
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4092Image resolution transcoding, e.g. client/server architecture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234363Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4347Demultiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/74Projection arrangements for image reproduction, e.g. using eidophor

Abstract

本開示は、全天球画像を用いて生成される全ての視線方向の表示画像の画質を同程度にすることができるようにする生成装置および生成方法、並びに、再生装置および再生方法に関する。低解像度化部は、全天球画像を低解像度化する。透視投影部は、3Dモデルにマッピングされた全天球画像を複数の2次元平面に投影することにより、複数の画像を生成する。本開示は、例えば、6方向の撮影画像から全天球画像を生成し、その全天球画像の低解像度ストリームと高解像度ストリームを生成する生成装置等に適用することができる。

Description

本開示は、生成装置および生成方法、並びに、再生装置および再生方法に関し、特に、全天球画像を用いて生成される全ての視線方向の表示画像の画質を同程度にすることができるようにした生成装置および生成方法、並びに、再生装置および再生方法に関する。
全天球画像の再生方法としては、全天球画像を3Dモデルにマッピングして透視投影することにより、視聴者の視線方向の視野範囲の画像を表示画像として生成し、表示する方法がある。全天球画像とは、水平方向の周囲360度および垂直方向の周囲180度の画像を3Dモデルにマッピングすることにより得られる画像である。
この方法では、全天球画像のうちの一部のみが表示画像の生成に用いられる。例えば、水平方向の視野角が90度である場合、水平方向については、全天球画像全体のうちの1/4の領域のみが表示画像の生成に用いられる。垂直方向についても同様である。従って、全天球画像全体に対する表示画像の生成に用いられる領域の割合は小さい。
しかしながら、視聴者の視線方向は、再生時に視聴者により指示されるため、記録装置は、全天球画像のうちの表示画像の生成に用いられる領域のみを記録することは困難である。従って、記録装置は全天球画像全体を記録し、再生装置が表示画像の生成に用いられる領域のみを記録装置に要求することにより、記録装置から再生装置への全天球画像の伝送量を削減することが望まれている。
そこで、全天球画像を複数の領域に分割し、分割領域ごとの符号化ストリームを生成することにより、所定の分割領域の符号化ストリームのみを記録装置から再生装置に伝送可能にすることが考案されている(例えば、特許文献1参照)。
また、低解像度の全天球画像全体と、互いに重なりを有する分割領域ごとの高解像度の全天球画像を別々に符号化し、低解像度の全天球画像全体と視聴者の視線方向に対応する分割領域の高解像度の全天球画像の符号化ストリームのみを記録装置から再生装置に伝送することも考案されている(例えば、特許文献2参照)。
この場合、記録装置は、高解像度の全天球画像については、表示画像の生成に用いられる分割領域の符号化ストリームのみを伝送すればよいため、全ての分割領域の高解像度の全天球画像を伝送する場合に比べて伝送量を削減することができる。また、表示画像の生成に、伝送されてきた高解像度の全天球画像の符号化ストリームに対応する分割領域以外の領域の全天球画像が用いられる場合や、視聴者の視線方向が急に変化する場合であっても、低解像度の全天球画像を用いて表示画像を生成することができる。さらに、分割領域の数を多数にしたり、全天球画像の端部にまたがる領域を分割領域に設定したりすることにより、表示画像の生成に用いられる全天球画像のうちの高解像度の全天球画像の割合を増加させることができる。
特開2001−298652号公報 特開2016−15705号公報
しかしながら、全天球画像が、例えば水平方向の周囲360度および垂直方向の周囲180度の画像がマッピングされた球の正距円筒図法による画像である場合、全天球画像の球上の形状は、極部(地球儀としての球において北極および南極に相当する部分)に近いほど歪む。例えば、全天球画像の矩形の領域は、球の極部付近にマッピングされると、球上の形状が扇状に歪む。
従って、同一の形状およびサイズの分割領域の高解像度の全天球画像であっても、分割領域の全天球画像上の位置によって、透視投影面上の形状やサイズが異なる。その結果、視線方向によって表示画像における分割領域の高解像度の全天球画像の領域の割合が異なり、全ての視線方向に対して同程度の画質の表示画像を生成することは困難であった。
本開示は、このような状況に鑑みてなされたものであり、全天球画像を用いて生成される全ての視線方向の表示画像の画質を同程度にすることができるようにするものである。
本開示の第1の側面の生成装置は、全天球画像を低解像度化する低解像度化部と、3Dモデルにマッピングされた前記全天球画像を複数の2次元平面に投影することにより、複数の画像を生成する投影部とを備える生成装置である。
本開示の第1の側面の生成方法は、本開示の第1の側面の生成装置に対応する。
本開示の第1の側面においては、全天球画像が低解像度化され、3Dモデルにマッピングされた前記全天球画像を複数の2次元平面に投影することにより、複数の画像が生成される。
本開示の第2の側面の再生装置は、3Dモデルにマッピングされた全天球画像を複数の2次元平面に投影することにより生成された複数の画像のうちの少なくとも1つの画像と、低解像度化された前記全天球画像とを受け取る受け取り部と、前記受け取り部により受け取られた前記画像および低解像度化された前記全天球画像の少なくとも一方に基づいて、表示画像を生成する描画部とを備える再生装置である。
本開示の第2の側面の再生方法は、本開示の第2の側面の再生装置に対応する。
本開示の第2の側面においては、3Dモデルにマッピングされた全天球画像を複数の2次元平面に投影することにより生成された複数の画像のうちの少なくとも1つの画像と、低解像度化された前記全天球画像とが受け取られ、前記画像および低解像度化された前記全天球画像の少なくとも一方に基づいて、表示画像が生成される。
なお、第1の側面の生成装置および第2の側面の再生装置は、コンピュータにプログラムを実行させることにより実現することができる。
また、第1の側面の生成装置および第2の側面の再生装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
本開示の第1の側面によれば、画像を生成することができる。また、本開示の第1の側面によれば、全天球画像を用いて生成される全ての視線方向の表示画像の画質を同程度にすることができるように画像を生成することができる。
本開示の第2の側面によれば、画像を再生することができる。また、本開示の第2の側面によれば、全天球画像を用いて生成される全ての視線方向の表示画像の画質を同程度にすることができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
全天球画像の球上の形状の歪みを説明する図である。 本開示を適用した配信システムの第1実施の形態の構成例を示すブロック図である。 図2の生成装置の構成例を示すブロック図である。 2次元平面の第1の例を示す図である。 高解像度画像を説明する図である。 第1実施の形態における2次元平面テーブルの構成例を示す図である。 図3の生成装置の生成処理を説明するフローチャートである。 図2の配信サーバと再生装置の構成例を示すブロック図である。 図8のマッピング処理部によるマッピングを説明する図である。 表示画像の例を示す図である。 図8の再生装置の再生処理を説明するフローチャートである。 2次元平面の第2の例を示す図である。 全天球画像の生成方法の例を説明する図である。 低解像度画像の他の例を示す図である。 投影面の座標系を説明する図である。 tan軸投影を説明する図である。 透視投影とtan軸投影における投影点を説明する図である。 透視投影により生成された高解像度画像上の全天球画像の各画素の例を示す図である。 tan軸投影により生成された高解像度画像上の全天球画像の各画素の例を示す図である。 透視投影およびtan軸投影により生成された高解像度画像上の全天球画像の各画素の他の例を示す図である。 第2実施の形態における2次元平面テーブルの構成例を示す図である。 コンピュータのハードウエアの構成例を示すブロック図である。 車両制御システムの概略的な構成の一例を示すブロック図である。 車外情報検出部及び撮像部の設置位置の一例を示す説明図である。
以下、本開示の前提および本開示を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
0.本開示の前提(図1)
1.第1実施の形態:配信システム(図2乃至図14)
2.第2実施の形態:配信システム(図15乃至図21)
3.第3実施の形態:コンピュータ(図22)
4.応用例(図23および図24)
<本開示の前提>
図1は、全天球画像が、水平方向の周囲360度および垂直方向の周囲180度の画像がマッピングされた球の正距円筒図法による画像である場合に発生する、全天球画像の球上の形状の歪みを説明する図である。
図1のAおよび図1のBの左側は、全天球画像1を示しており、全天球画像1内の水平方向の線および垂直方向の線は、それぞれ、緯線、経線である。また、図1のAおよび図1のBの中央の球2は、内側の面に全天球画像1がマッピングされた球である。さらに、図1のAおよび図1のBの右側の図は、球2にマッピングされた全天球画像1を球2の内側から見た図である。
図1のAの左側に示すように、全天球画像1の中央付近の矩形の領域1Aが、図1のAの中央に示すように球2の内側の面にマッピングされると、図1のAの右側に示すように、球2の内側から見た領域1Aの極部方向に垂直な辺は、同程度に歪み、曲線となる。即ち、領域1Aは、全天球画像1の中央付近の領域であり、極部方向のマッピング位置は、両極部から略同一の距離だけ離れている。従って、球2の内側から見た領域1Aの極部方向に垂直な辺は、同程度に歪む。
一方、図1のBの左側に示すように、領域1Aと同一の形状およびサイズであるが、全天球画像1の上側の領域1Bが、図1のBの中央に示すように球2の内側の面にマッピングされると、図1のBの右側に示すように、球2の内側から見た領域1Bの形状は、扇形になる。即ち、領域1Bは、全天球画像1の上側付近の領域であり、極部方向のマッピング位置は、図中上側の極部に近く、図中下側の極部から遠い。従って、球2の内側から見た領域1Bの極部方向に垂直な2辺は歪み、曲線となるが、歪み量は、極部から遠い辺に比べて近い辺の方が大きくなる。
以上のように、全天球画像が、水平方向の周囲360度および垂直方向の周囲180度の画像がマッピングされた球の正距円筒図法による画像である場合、全天球画像1上の形状およびサイズが同一であっても、全天球画像1上の位置によって、球2上の形状およびサイズが異なる。従って、球2にマッピングされた全天球画像1を透視投影した2次元平面上の形状およびサイズも異なる。
<第1実施の形態>
(配信システムの第1実施の形態の構成例)
図2は、本開示を適用した配信システムの第1実施の形態の構成例を示すブロック図である。
図2の配信システム10は、撮影装置11、生成装置12、配信サーバ13、ネットワーク14、再生装置15、およびヘッドマウントディスプレイ16により構成される。配信システム10は、撮影装置11により撮影された撮影画像から全天球画像を生成し、全天球画像を用いて視聴者の視野範囲の表示画像を表示する。
具体的には、配信システム10の撮影装置11は、6個のカメラ11A−1乃至11A−6により構成される。なお、以下では、カメラ11A−1乃至11A−6を特に区別する必要がない場合、それらをまとめてカメラ11Aという。
各カメラ11Aは、動画像を撮影する。撮影装置11は、各カメラ11Aにより撮影された6方向の動画像を撮影画像として生成装置12に供給する。なお、撮影装置11が備えるカメラの数は、複数であれば、6個に限定されない。
生成装置12は、正距円筒図法を用いた方法により、撮影装置11から供給される撮影画像から全天球画像を生成して低解像度化する。生成装置12は、低解像度化された全天球画像である低解像度画像(YUV画像)を符号化し、1本の低解像度ストリームを生成する。
また、生成装置12は、全天球画像を3Dモデルとしての球にマッピングし、球にマッピングされた全天球画像を5個の視線方向に対応する2次元平面に、球の中心を焦点として透視投影することにより、5個の画像を生成する。生成装置12は、この5個の画像をそれぞれ高解像度画像(YUV画像)として符号化し、5本の高解像度ストリームを生成する。
さらに、生成装置12は、各高解像度画像に対応する2次元平面の位置、傾き、およびサイズを示す2次元平面情報を生成する。生成装置12は、1本の低解像度ストリーム、5本の高解像度ストリーム、および2次元平面情報を配信サーバ13にアップロードする。
配信サーバ13は、ネットワーク14を介して再生装置15と接続する。配信サーバ13は、生成装置12からアップロードされた1本の低解像度ストリーム、5本の高解像度ストリーム、および2次元平面情報を記憶する。配信サーバ13は、再生装置15からの要求に応じて、記憶している低解像度ストリーム、高解像度ストリーム、および2次元平面情報を、ネットワーク14を介して再生装置15に送信する。
再生装置15は、配信サーバ13に1本の低解像度ストリームと2次元平面情報を、ネットワーク14を介して要求し、その要求に応じて送信されてくる1本の低解像度ストリームと2次元平面情報を受け取る。
また、再生装置15は、カメラ15Aを内蔵し、ヘッドマウントディスプレイ16に付されたマーカ16Aを撮影する。そして、再生装置15は、マーカ16Aの撮影画像に基づいて、3Dモデルの座標系における視聴者の視聴位置を検出する。さらに、再生装置15は、ヘッドマウントディスプレイ16のジャイロセンサ16Bの検出結果を、ヘッドマウントディスプレイ16から受け取る。再生装置15は、ジャイロセンサ16Bの検出結果に基づいて、3Dモデルの座標系における視聴者の視線方向を決定する。再生装置15は、視聴位置と視線方向に基づいて、3Dモデルの内部に位置する視聴者の視野範囲を決定する。
そして、再生装置15は、2次元平面情報と視聴者の視野範囲とに基づいて、5本高解像度ストリームのうちの1本の高解像度ストリームをネットワーク14を介して要求し、その要求に応じて送信されてくる1本の高解像度ストリームを受け取る。
再生装置15は、受け取られた1本の低解像度ストリームと1本の高解像度ストリームを復号する。再生装置15は、復号の結果得られる低解像度画像を3Dモデルとしての球にマッピングし、高解像度画像を球の内部の3Dモデルとしての2次元平面にマッピングすることにより、3Dモデル画像を生成する。
そして、再生装置15は、視聴位置を焦点として、3Dモデル画像を視聴者の視野範囲に透視投影することにより、視聴者の視野範囲の画像を表示画像として生成する。再生装置15は、表示画像をヘッドマウントディスプレイ16に供給する。
ヘッドマウントディスプレイ16は、視聴者の頭部に装着され、再生装置15から供給される表示画像を表示する。ヘッドマウントディスプレイ16には、カメラ15Aにより撮影されるマーカ16Aが付されている。従って、視聴者は、ヘッドマウントディスプレイ16を頭部に装着した状態で、移動することにより視聴位置を指定することができる。また、ヘッドマウントディスプレイ16には、ジャイロセンサ16Bが内蔵され、そのジャイロセンサ16Bによる角速度の検出結果は再生装置15に伝送される。従って、視聴者は、ヘッドマウントディスプレイ16を装着した頭部を回転させることにより、視線方向を指定することができる。
配信システム10において、配信サーバ13から再生装置15への配信方法は、どのような方法であってもよい。配信方法が、例えば、MPEG-DASH(Moving Picture Experts Group phase − Dynamic Adaptive Streaming over HTTP)を用いる方法である場合、配信サーバ13は、HTTP(HyperText Transfer Protocol)サーバであり、再生装置15はMPEG-DASHクライアントである。
(生成装置の構成例)
図3は、図2の生成装置12の構成例を示すブロック図である。
図3の生成装置12は、スティッチング処理部21、マッピング処理部22、低解像度化部23、エンコーダ24、設定部25、透視投影部26−1乃至26−5、エンコーダ27−1乃至27−5、テーブル生成部28、および送信部29により構成される。
スティッチング処理部21は、フレームごとに、図2のカメラ11Aから供給される6方向の撮影画像の色や明るさを同一にし、重なりを除去して接続する。スティッチング処理部21は、その結果得られるフレーム単位の撮影画像をマッピング処理部22に供給する。
マッピング処理部22は、正距円筒図法を用いた方法により、スティッチング処理部21から供給される撮影画像から全天球画像を生成する。具体的には、マッピング処理部22は、撮影画像をテクスチャとして所定の視点を中心とした球にマッピングし、その球の正距円筒図法による画像を全天球画像として生成する。従って、マッピング処理部22により生成される全天球画像の形状は、符号化に適した矩形である。
マッピング処理部22は、全天球画像を低解像度化部23および透視投影部26−1乃至26−5に供給する。なお、スティッチング処理部21とマッピング処理部22は、一体化されていてもよい。
低解像度化部23は、マッピング処理部22から供給される全天球画像を低解像度化し、低解像度画像を生成する。低解像度化部23は、生成された低解像度画像をエンコーダ24に供給する。
エンコーダ24(低解像度符号化部)は、低解像度化部23から供給される低解像度画像をMPEG2(Moving Picture Experts Group phase 2)方式やAVC(Advanced Video Coding)方式などの符号化方式で符号化し、1本の低解像度トリームを生成する。エンコーダ24は、1本の低解像度ストリームを送信部29に供給する。
設定部25は、5個の視線方向に対応する2次元平面情報を設定する。設定部25は、各2次元平面情報を透視投影部26−1乃至26−5に供給する。また、設定部25は、5個の2次元平面情報をテーブル生成部28に供給する。
透視投影部26−1乃至26−5は、それぞれ、マッピング処理部22から供給される全天球画像を球にマッピングする。透視投影部26−1乃至26−5は、それぞれ、球の中心を焦点として、球にマッピングされた全天球画像を、設定部25から供給される2次元平面情報が示す2次元平面に透視投影することにより、画像を生成する。これにより、生成された画像は、球にマッピングされた全天球画像を球の中心から所定の視線方向に向かって見た画像となる。透視投影部26−1乃至26−5は、それぞれ、生成された画像を高解像度画像としてエンコーダ27−1乃至27−5に供給する。
エンコーダ27−1乃至エンコーダ27−5(高解像度符号化部)は、それぞれ、透視投影部26−1乃至26−5から供給される高解像度画像を、MPEG2方式やAVC方式などの符号化方式で符号化し、1本の高解像度ストリームを生成する。
このとき、例えば、エンコーダ27−1乃至27−5により生成される5本の高解像度ストリームの間で、GOP(Group of Picture)の先頭ピクチャやIDRピクチャなどのシンクポイントは同一にされる。エンコーダ27−1乃至27−5は、それぞれ、生成された1本の高解像度ストリームを送信部29に供給する。
なお、以下では、透視投影部26−1乃至26−5を特に区別する必要がない場合、それらをまとめて透視投影部26という。同様に、エンコーダ27−1乃至27−5をまとめてエンコーダ27という。
テーブル生成部28は、設定部25から供給される5個の2次元平面情報を含む2次元平面テーブルを生成して、送信部29に供給する。
送信部29は、エンコーダ24から供給される1本の低解像度ストリーム、エンコーダ27のそれぞれから供給される合計5本の高解像度ストリーム、およびテーブル生成部28から供給される2次元平面テーブルを、図2の配信サーバ13にアップロード(送信)する。
(2次元平面の第1の例)
図4は、図3の設定部25により設定される5個の2次元平面の例を示す図である。
図4のAと図4のBは、それぞれ、2次元平面が内部に設定された3Dモデルとしての球の透視図、水平切断面の上面図である。
図4の例では、全天球画像が、コンサート会場を撮影した撮影画像から生成された全天球画像である。また、全天球画像が球40にマッピングされた際、球40の中心Oを通り、中心Oを通る水平面上の基準軸との水平方向の角度が、−90度、−45度、0度、45度、90度である方向に、コンサート会場に配置されたステージの全天球画像が存在する。即ち、中心Oを視聴位置とする視聴者にとって重要であると想定される視線方向の基準軸との水平方向の角度が、−90度、−45度、0度、45度、90度である。
従って、図4のAおよび図4のBに示すように、設定部25は、球40の中心Oを通り、基準軸との水平方向の角度が、−90度、−45度、0度、45度、90度である線を、中心を通る法線とし、隣接するものどうしが交差するように、球40の内部に2次元平面41乃至45を設定する。よって、2次元平面41乃至45のうちの隣接するどうしに透視投影される全天球画像の一部は重複する。
また、図4の例では、2次元平面41乃至45の中心を通る法線と基準軸との水平方向の角度の絶対値は90度以下である。従って、再生装置15は、全ての2次元平面に対応する高解像度画像を用いても、水平方向の周囲360度および垂直方向の周囲180度の全ての視線方向に対応する表示画像を生成することはできない。
なお、図4の例では、2次元平面41乃至45の中心を通る法線と基準軸との垂直方向の角度は全て0度であり、2次元平面41乃至45の傾きはない。
(高解像度画像の説明)
図5は、図3の透視投影部26により生成される高解像度画像を説明する図である。
図5の例では、設定部25が、図4の2次元平面41乃至45の2次元平面情報を設定する。また、図5のAおよび図5のBは、全天球画像がマッピングされた球40を上から見た図であり、図中の小さい黒丸は画素を表す。
図5のAに示すように、隣接するものどうしが互いに重なりを有する分割領域ごとに全天球画像が分割されることにより、高解像度画像が生成される場合、隣接する高解像度画像の重なり合う領域の各画素(サンプリング点)の球40上のマッピング位置は同一になる。
具体的には、隣接する分割領域の高解像度画像61と高解像度画像62の重複する領域内の画素61Aと画素62Aの球40へのマッピング位置は同一である。同様に、隣接する分割領域の高解像度画像62と高解像度画像63の重複する領域内の画素62Bと画素63Aの球40上のマッピング位置は同一である。即ち、画素61Aと画素62Aの全天球画像上の位置は同一であり、画素62Bと画素63Aの全天球画像上の位置は同一である。
従って、高解像度画像61乃至63の重複する領域の各画素どうしを重ね合わせて貼り付けることにより、全天球画像の一部を生成することができる。なお、図5のAでは、見やすくするため、高解像度画像61および高解像度画像63を球40から離して図示している。
一方、図5のBに示すように、透視投影部26により2次元平面42乃至44に透視投影された高解像度画像82乃至84の各画素の球40上のマッピング位置は異なる。
具体的には、高解像度画像82の画素82Aの球40上のマッピング位置と、そのマッピング位置の最も近くにマッピングされる高解像度画像83の画素83Aのマッピング位置とは異なる。同様に、高解像度画像83の画素83Bの球40上のマッピング位置と、そのマッピング位置の最も近くにマッピングされる高解像度画像84の画素84Bのマッピング位置とは異なる。従って、高解像度画像82乃至84を重ね合わせて貼り付けても、全天球画像の一部を生成することはできない。
なお、図5のBでは、2次元平面42乃至44に透視投影された高解像度画像82乃至84のみ図示したが、2次元平面41および2次元平面45に透視投影された高解像度画像についても、高解像度画像82乃至84と同様である。
(2次元平面テーブルの構成例)
図6は、図3のテーブル生成部28により生成される2次元平面テーブルの構成例を示す図である。
図6の例では、2次元平面情報が、図4の2次元平面41乃至45の位置を示す情報として方位角と仰角を含み、傾きを示す情報として回転角を含み、サイズを示す情報として横画角と縦画角を含む。
なお、方位角と仰角は、それぞれ、球40の中心Oと2次元平面41乃至45の中心を結ぶ線と、中心Oを通る水平面上の基準軸とのなす水平方向の角度、垂直方向の角度である。回転角は、2次元平面41乃至45の中心と中心Oを結ぶ線を軸としたときの2次元平面41乃至45の回転方向の角度である。横画角は、2次元平面41乃至45の横方向の2つの端部それぞれと中心Oとを結んだ線のなす角度であり、縦画角は、2次元平面41乃至45の縦方向の2つの端部それぞれと中心Oとを結んだ線のなす角度である。
この場合、図6に示すように、2次元平面テーブルには、2次元平面41乃至45のそれぞれに固有のIDが登録される。図6の例では、2次元平面41乃至45に対して1から順にIDが付与されており、2次元平面テーブルには、IDとして1乃至5が登録される。
また、2次元平面テーブルには、IDに対応付けて、そのIDに対応する2次元平面の2次元平面情報と、各2次元平面の高解像度画像の横方向の画素数である横画素数および縦方向の画素数である縦画素数とが登録される。
具体的には、2次元平面41乃至45は、それぞれ、球40の中心Oを通り、基準軸との水平方向の角度が−90度、−45度、0度、45度、90度であり、垂直方向の角度が全て0度である線を、中心を通る法線とし、傾きがないように設定される。従って、ID「1」乃至「5」のそれぞれに対応付けて、方位角「−90度」、方位角「−45度」、方位角「0度」、方位角「45度」、方位角「90度」が登録される。また、ID「1」乃至「5」に対応付けて、仰角「0度」および回転角「0度」が登録される。
また、図6の例では、2次元平面41乃至45の横画角および縦画角は90度であり、横画素数および縦画素数は1024である。従って、ID「1」乃至「5」に対応付けて、横画角「90度」、縦画角「90度」、横画素数「1024」、および縦画素数「1024」が登録される。
(生成装置の処理の説明)
図7は、図3の生成装置12の生成処理を説明するフローチャートである。
図7のステップS11において、スティッチング処理部21は、フレームごとに、図2のカメラ11Aから供給される6方向の撮影画像の色や明るさを同一にし、重なりを除去して接続する。スティッチング処理部21は、その結果得られるフレーム単位の撮影画像をマッピング処理部22に供給する。
ステップS12において、マッピング処理部22は、正距円筒図法を用いた方法により、スティッチング処理部21から供給される撮影画像から全天球画像を生成する。マッピング処理部22は、全天球画像を低解像度化部23および透視投影部26−1乃至26−5に供給する。
ステップS13において、低解像度化部23は、マッピング処理部22から供給される全天球画像を低解像度化し、低解像度画像を生成する。低解像度化部23は、生成された低解像度画像をエンコーダ24に供給する。
ステップS14において、エンコーダ24は、低解像度化部23から供給される低解像度画像を符号化し、1本の低解像度トリームを生成する。エンコーダ24は、1本の低解像度ストリームを送信部29に供給する。
ステップS15において、設定部25は、5個の視線方向に対応する2次元平面情報を設定する。設定部25は、各2次元平面情報を各透視投影部26に供給し、5個の2次元平面情報をテーブル生成部28に供給する。
ステップS16において、各透視投影部26は、マッピング処理部22から供給される全天球画像を球にマッピングし、球の中心を焦点として、球にマッピングされた全天球画像を、設定部25から供給される2次元平面情報が示す2次元平面に透視投影することにより、画像を生成する。各透視投影部26は、生成された画像を高解像度画像として各エンコーダ27に供給する。
ステップS17において、各エンコーダ27は、透視投影部26から供給される高解像度画像を符号化して、1本の高解像度ストリームを生成し、送信部29に供給する。
ステップS18において、テーブル生成部28は、設定部25から供給される5個の2次元平面情報を含む2次元平面テーブルを生成して、送信部29に供給する。
ステップS19において、送信部29は、エンコーダ24から供給される1本の低解像度ストリーム、各エンコーダ27から供給される合計5本の高解像度ストリーム、およびテーブル生成部28から供給される2次元平面テーブルを、配信サーバ13にアップロードする。
(配信サーバと再生装置の構成例)
図8は、図2の配信サーバ13と再生装置15の構成例を示すブロック図である。
図8に示すように、配信サーバ13は、受信部101、ストレージ102、送信部103、および送信部104により構成される。
受信部101は、図2の生成装置12からアップロードされた1本の低解像度ストリーム、5本の高解像度ストリーム、および2次元平面テーブルを受信し、ストレージ102に供給する。
ストレージ102は、受信部101から供給される1本の低解像度ストリーム、5本の高解像度ストリーム、および2次元平面テーブルを記憶する。
送信部103は、再生装置15からの要求に応じて、1本の低解像度ストリームと2次元平面テーブルをストレージ102から読み出し、ネットワーク14を介して再生装置15に送信する。
送信部104は、再生装置15からの要求に応じて、1本の高解像度ストリームをストレージ102から読み出し、ネットワーク14を介して再生装置15に送信する。なお、送信する高解像度ストリームの変更は、シンクポイントで行われる。従って、送信する高解像度ストリームの変更は、数フレームから数十フレーム単位で行われる。
また、上述したように、5本の高解像度ストリームの間でシンクポイントは同一である。従って、送信部104は、送信する高解像度ストリームをシンクポイントで切り替えることにより、再生装置15において、再生する高解像度画像の切り替えを容易に行うことができる。
再生装置15は、カメラ15A、受信部121、デコーダ122、受信部123、デコーダ124、マッピング処理部125、描画部126、受け取り部127、および視線検出部128により構成される。
再生装置15の受信部121は、配信サーバ13に1本の低解像度ストリームと2次元平面情報を、ネットワーク14を介して要求する。受信部121(受け取り部)は、その要求に応じて送信部103から送信されてくる1本の低解像度ストリームと2次元平面情報を受け取る。受信部121は、1本の低解像度ストリームをデコーダ122に供給し、2次元平面情報を視線検出部128に供給する。
デコーダ122(低解像度復号部)は、受信部121から供給される低解像度ストリームを復号し、低解像度画像を生成する。デコーダ122は、低解像度画像をマッピング処理部125に供給する。
受信部123は、視線検出部128から、5個の2次元平面のうちの1つである選択面のIDを示す選択面情報を取得する。受信部123は、選択面情報に基づいて、5本の高解像度ストリームのうちの、選択面情報により特定される選択面の1本の高解像度ストリームを、ネットワーク14を介して要求する。受信部123は、その要求に応じて送信部104から送信されてくる1本の高解像度ストリームを受け取り、デコーダ124に供給する。
デコーダ124(高解像度復号部)は、受信部123から供給される1本の高解像度ストリームを復号し、高解像度画像を生成する。デコーダ124は、高解像度画像をマッピング処理部125に供給する。
マッピング処理部125は、視線検出部128から供給される選択面の2次元平面情報に基づいて、予め3Dモデルとして設定されている球の内部に選択面を3Dモデルとして設定する。マッピング処理部125は、デコーダ122から供給される低解像度画像を、3Dモデルとしての球にテクスチャとしてマッピングする。また、マッピング処理部125は、3Dモデルとしての2次元平面に、デコーダ124から供給される高解像度画像をテクスチャとしてマッピングする。マッピング処理部125は、球と選択面にテクスチャがマッピングされた3Dモデル画像を描画部126に供給する。
描画部126は、マッピング処理部125から供給される3Dモデル画像を、視線検出部128から供給される視聴位置を焦点として、視聴者の視野範囲に透視投影することにより、視聴者の視野範囲の画像を表示画像として生成する。即ち、描画部126は、視聴位置から視野範囲を通して見える球40または2次元平面にマッピングされた画像を表示画像として生成する。描画部126は、表示画像をヘッドマウントディスプレイ16に供給する。
受け取り部127は、図2のジャイロセンサ16Bの検出結果をヘッドマウントディスプレイ16から受け取り、視線検出部128に供給する。
視線検出部128は、受け取り部127から供給されるジャイロセンサ16Bの検出結果に基づいて、3Dモデルの座標系における視聴者の視線方向を決定する。また、視線検出部128は、カメラ15Aからマーカ16Aの撮影画像を取得し、その撮影画像に基づいて、3Dモデルの座標系における視聴位置を検出する。
視線検出部128(選択部)は、3Dモデルの座標系における視聴位置および視線方向、並びに、受信部121から供給される2次元平面情報に基づいて、5個の2次元面のうちの、視聴者の視線に最も近い法線に対応する1個の2次元平面を選択面に決定する。
具体的には、視線検出部128は、視聴位置から視線方向に延びる視線と基準軸のなす水平方向および垂直方向の角度並びに視線の回転角に最も近い、方位角および仰角並びに回転角に対応する2次元平面のIDを選択面のIDとして取得する。
これにより、視線検出部128は、視聴者の視野範囲に透視投影される高解像度画像の割合が最も高くなるように、その高解像度画像に対応する2次元平面を選択面として選択することができる。視線検出部128は、選択面情報を受信部123に供給し、選択面の2次元平面情報をマッピング処理部125に供給する。
また、視線検出部128は、3Dモデルの座標系における視聴位置と視線方向に基づいて、3Dモデルの座標系における視聴者の視野範囲を決定する。視線検出部128は、視聴者の視野範囲と視聴位置を描画部126に供給する。
(マッピングの説明)
図9は、図8のマッピング処理部125によるマッピングを説明する図である。
図9の例では、視聴位置が球40の中心Oである。この場合、中心Oから視線方向に延びる視線141と基準軸のなす水平方向および垂直方向の角度並びに視線141の回転角に最も近い、方位角および仰角並びに回転角に対応する、中心Oから矢印142の方向に延びる線を、中心を通る法線とする2次元平面143が、選択面として選択される。
従って、マッピング処理部125は、球40の内側に2次元平面143を3Dモデルとして設定する。そして、マッピング処理部125は、3Dモデルとしての球40に低解像度画像151をテクスチャとしてマッピングし、3Dモデルとしての2次元平面143に高解像度画像152をテクスチャとしてマッピングする。
以上のように、2次元平面143は、球40の内部に配置される。従って、描画部126は、低解像度画像151と高解像度画像152の両方が存在する方向から、2次元平面143より内側の視野範囲に透視投影を行う際、低解像度画像151に比べて高解像度画像152を優先的に用いることができる。
(表示画像の例)
図10は、表示画像の例を示す図である。
図10の例では、視聴位置が球40の中心Oである。また、図10の矩形は、高解像度画像または低解像度画像の16画素×16画素のブロックを示している。このブロックは、例えば高解像度画像と低解像度画像の符号化方式がAVC方式である場合、符号化単位となる。
図10のAに示すように、視聴者が所定の2次元平面を正面として視聴する場合、表示画像170の中央には高解像度画像171が配置される。図10のAの例では、表示画像170のサイズが高解像度画像171のサイズより大きいため、表示画像170の両端には、低解像度画像172が配置されている。
図10のBに示すように、視聴者の視線方向が斜め上方向である場合、視線に最も近い法線に対応する2次元平面(図10のBの例では、仰角が45度である2次元平面)の高解像度画像181が表示画像180の中央に配置される。また、図10のBに示すように、表示画像180の高解像度画像181以外の領域には、低解像度画像182が配置される。図10のBに示すように、表示画像180のうちの、球40の極部付近にマッピングされる低解像度画像182のブロックの密度は、球40の中央部付近にマッピングされる低解像度画像182のブロックの密度に比べて大きい。
図10のCに示すように、視聴者の視線方向が上方向である場合、視線に最も近い法線に対応する2次元平面(図10のCの例では、仰角が90度である2次元平面)の高解像度画像181が表示画像190の中央に配置される。また、図10のCに示すように、表示画像190の高解像度画像191以外の領域には、低解像度画像192が配置される。
図10のCの例では、高解像度画像に対応する2次元平面の仰角が90度であるため、表示画像190内の球40の極部方向に対応する領域は、高解像度画像191である。即ち、表示画像190内の、低解像度画像において比較的大きい歪みが発生する、球40の極部方向に対応する領域は、歪みが発生しない高解像度画像191である。従って、球40の極部方向に対応する領域が低解像度画像192である場合に比べて、表示画像190の画質を向上させることができる。
なお、図10のA乃至図10のCに示すように、低解像度画像172(182,192)は、高解像度画像171(181,191)に比べて解像度が小さい。従って、低解像度画像172(182,192)のブロックが配置される表示画像170(180,190)内の領域のサイズは、高解像度画像171(181,191)のブロックが配置される表示画像170(180,190)内の領域のサイズに比べて大きくなっている。
以上のように、図10のA乃至図10のCの例では、表示画像170(180,190)の全領域のうちの、解像度が視覚に大きく影響する中央に高解像度画像171(181,191)が配置される。従って、表示画像170(180,190)の中央に低解像度画像172(182,192)が配置される場合に比べて、表示画像170(180,190)の画質を向上させることができる。
(再生装置の処理の説明)
図11は、図8の再生装置15の再生処理を説明するフローチャートである。この再生処理は、例えば、視聴者の要求に応じて開始される。
図11のステップS31において、再生装置15の受信部121は、配信サーバ13に2次元平面情報を要求し、その要求に応じて送信部103から送信されてくる2次元平面情報を受け取る。受信部121は、2次元平面情報を視線検出部128に供給する。
ステップS32において、受け取り部127は、図2のジャイロセンサ16Bの検出結果をヘッドマウントディスプレイ16から受け取り、視線検出部128に供給する。
ステップS33において、視線検出部128は、受け取り部127から供給されるジャイロセンサ16Bの検出結果に基づいて、3Dモデルの座標系における視聴者の視線方向を決定する。
ステップS34において、視線検出部128は、カメラ15Aからマーカ16Aの撮影画像を取得し、その撮影画像に基づいて3Dモデルの座標系における視聴位置を検出する。
ステップS35において、視線検出部128は、3Dモデルの座標系における視聴位置および視線方向、並びに、受信部121から供給される2次元平面情報に基づいて、5個の2次元面のうちの視聴者の視線に最も近い1個の2次元平面を選択面に決定する。視線検出部128は、選択面の選択面情報を受信部123に供給し、選択面の2次元平面情報をマッピング処理部125に供給する。
ステップS36において、視線検出部128は、3Dモデルの座標系における視聴位置と視線方向に基づいて、3Dモデルの座標系における視聴者の視野範囲を決定する。視線検出部128は、視聴者の視野範囲と視聴位置を描画部126に供給する。
ステップS37において、受信部123は、視線検出部128から供給される選択面情報により特定される選択面の1本の高解像度ストリームを配信サーバ13に要求し、その要求に応じて送信部104から送信されてくる1本の高解像度ストリームを受け取る。受信部123は、受け取られた1本の高解像度ストリームをデコーダ124に供給する。
ステップS38において、デコーダ124は、受信部123から供給される1本の高解像度ストリームを復号し、高解像度画像を生成する。デコーダ124は、高解像度画像をマッピング処理部125に供給する。
ステップS39において、マッピング処理部125は、視線検出部128から供給される選択面の2次元平面情報に基づいて、予め3Dモデルとして設定されている球の内部に選択面を3Dモデルとして設定する。
ステップS40において、マッピング処理部125は、デコーダ124から供給される高解像度画像を、3Dモデルとして設定された選択面にテクスチャとしてマッピングする。
ステップS41において、受信部121は、配信サーバ13に1本の低解像度ストリームを要求し、その要求に応じて送信部103から送信されてくる1本の低解像度ストリームを受け取る。受信部121は、1本の低解像度ストリームをデコーダ122に供給する。
ステップS42において、デコーダ122は、受信部121から供給される低解像度ストリームを復号し、低解像度画像を生成する。デコーダ122は、低解像度画像をマッピング処理部125に供給する。
ステップS43において、マッピング処理部125は、デコーダ122から供給される低解像度画像を、3Dモデルとしての球にテクスチャとしてマッピングする。マッピング処理部125は、球と2次元平面にテクスチャがマッピングされた3Dモデル画像を描画部126に供給する。
ステップS44において、描画部126は、マッピング処理部125から供給される3Dモデル画像を、視線検出部128から供給される視聴位置を焦点として、視聴者の視野範囲に透視投影することにより、視聴者の視野範囲の画像を表示画像として生成する。
ステップS45において、描画部126は、表示画像をヘッドマウントディスプレイ16に送信して表示させる。ステップS46において、再生装置15は、再生を終了するかどうか、例えば視聴者により再生の終了が要求されたかどうかを判定する。
ステップS46で再生を終了しないと判定された場合、処理はステップS31に戻り、再生を終了すると判定されるまで、ステップS31乃至S46の処理が繰り返される。一方、ステップS46で再生を終了すると判定された場合、処理を終了する。
なお、上述した説明では、2次元平面の数は5個であるものとたが、2次元平面の数は、5個に限定されない。2次元平面の数が多いほど、再生装置15は、視聴者の視線により近い法線に対応する高解像度画像を用いて表示画像を生成することができる。従って、表示画像における高解像度画像の割合が多くなり、その結果、表示画像の画質が向上する。しかしながら、高解像度ストリームの本数が増加するため、必要となるストレージ102の記憶容量と高解像度ストリームを生成するための生成装置12の処理量が増加する。
また、2次元平面テーブルには、2次元平面情報、横画素数、および縦画素数のうちの固定値以外が登録されるようにしてもよい。さらに、2次元平面は、1以上のフレーム単位で設定されてもよいし、シーン単位で設定されてもよい。
(2次元平面の第2の例)
図12は、2次元平面の数が5個以外である場合の2次元平面の例を示す図である。
なお、図12において、矢印は各2次元平面の中心を通る法線を示している。
図12のAに示すように、設定部25は、2次元平面として、球40の中心Oを中心とする立方体210の6個の各面211乃至216を設定することもできる。この場合、6個の2次元平面の中心を通る法線は、中心Oを通り、互いに直交する3軸の両方向の合計6本の線である。また、全ての2次元平面の横画角と縦画角は90度であり、各2次元平面は重なり合わない。
即ち、この場合、2次元平面の高解像度画像は、キューブマッピングにより生成された全天球画像を3Dモデルとしての立方体の面単位で分割した画像である。なお、キューブマッピングとは、3Dモデルとしての立方体に画像をマッピングし、画像がマッピングされた立方体の展開図を全天球画像とする全天球画像の生成方法である。
また、図12のBに示すように、設定部25は、各2次元平面の中心を通る法線が、立方体210の12本の各辺の中点と中心Oを通る線であるように、12個の2次元平面を設定することもできる。この場合、図12のAの場合に比べて、隣接する2次元平面間の角度が小さくなるため、再生装置15は、視線により近い法線に対応する2次元平面を選択面とすることができる。その結果、表示画像内の高解像度画像の割合が大きくなり、表示画像の画質が向上する。
さらに、図12のCに示すように、設定部25は、各2次元平面の中心を通る法線が、立方体210の12本の各辺の中点と中心Oを通る線、および、立方体210の6個の各面211乃至216の中心と中心Oを通る線であるように、18個の2次元平面を設定することもできる。この場合、2次元平面は、面211乃至216と図12のBの場合の2次元平面である。
図12のAおよび図12のCの例では、面211乃至216に対応する高解像度画像を全て用いることにより、水平方向の周囲360度および垂直方向の周囲180度の全ての視線方向に対応する表示画像を生成することができる。
(全天球画像の生成方法の他の例)
上述した説明では、全天球画像は、正距円筒図法を用いた方法により生成されたが、全天球画像の生成方法は、この方法に限定されない。
図13は、正距円筒図法を用いた方法以外の全天球画像の生成方法の例を説明する図である。
図13の全天球画像の生成方法では、図13のAに示すように、撮影画像が、3Dモデルとしての正八面体230にマッピングされる。そして、正八面体230の正三角形の各面231乃至238にマッピングされた画像の形状が、直角三角形に変形され、図13のBに示すように、各直角三角形の画像241乃至248を組み合わせることにより、正方形の全天球画像240が生成される。
図13の生成方法で全天球画像が生成される場合、2次元平面261は、正八面体230の内部に配置される。また、マッピング処理部125で低解像度画像がマッピングされる3Dモデルは、正八面体230である。
全天球画像の生成方法は、図13の方法のほか、キューブマッピングなどであってもよい。また、低解像度画像の低解像度化前の全天球画像の生成方法と、高解像度画像の生成に用いられる全天球画像の生成方法は、異なっていてもよい。
(低解像度画像の他の例)
図14は、低解像度画像の他の例を示す図である。
上述した説明では、低解像度画像は、1つの視点の全天球画像を低解像度化した画像であったが、左目用の視点と右目用の視点の全天球画像をそれぞれ低解像度化した画像を合成(パッキング)した画像であってもよい。
具体的には、図14のAに示すように、低解像度画像は、例えば、左目用の視点の全天球画像を低解像度化した低解像度画像421と右目用の視点の全天球画像を低解像度化した低解像度画像422が横方向(水平方向)にパッキングされたパッキング画像420(低解像度パッキング画像)であってもよい。
また、図14のBに示すように、低解像度画像は、例えば、左目用の視点の低解像度画像421と右目用の視点の低解像度画像422が縦方向(垂直方向)にパッキングされたパッキング画像440(低解像度パッキング画像)であってもよい。
同様に、各2次元平面の高解像度画像は、その2次元平面の左目用の視点の高解像度画像と右目用の視点の高解像度画像が横方向または縦方向にパッキングされたパッキン画像(高解像度パッキング画像)であってもよい。所定の2次元平面の左目用の視点の高解像度画像は、球にマッピングされた左目用の視点の全天球画像を球の中心を焦点として、その2次元平面に透視投影することにより得られる画像である。また、所定の2次元平面の右目用の高解像度画像は、球にマッピングされた右目用の視点の全天球画像を球の中心を焦点として、その2次元平面に透視投影することにより得られる画像である。
低解像度画像と高解像度画像がパッキング画像である場合、図8のマッピング処理部125は、デコーダ122による復号の結果得られるパッキング画像を左目用の視点の低解像度画像と右目用の視点の低解像度画像に分離する。また、マッピング処理部125は、デコーダ124による復号の結果得られるパッキング画像を左目用の視点の高解像度画像と右目用の視点の高解像度画像に分離する。そして、マッピング処理部125は、左目用の視点および右目用の視点のそれぞれについて3Dモデル画像を生成し、描画部126は、左目用の視点および右目用の視点のそれぞれについて、3Dモデル画像を用いて表示画像を生成する。
これにより、ヘッドマウントディスプレイ16は、3D表示可能である場合、左目用の視点および右目用の視点の表示画像を、それぞれ、左目用の画像、右目用の画像として表示することにより、表示画像を3D表示することができる。
以上のように、配信システム10の生成装置12は、全天球画像を複数の2次元平面に透視投影することにより高解像度画像を生成する。従って、高解像度画像の3Dモデル上の形状は歪まない。
よって、再生装置15は、等方性を有する高解像度画像を用いて表示画像を生成することができる。その結果、全ての視線方向の表示画像の画質を同程度にすることができる。また、表示画像内の高解像度画像の領域を用いて、歪みが精度に大きく影響する顔認識処理などの一般的な画像処理を高精度に行うことができる。
また、3Dモデル上の動きと高解像度画像上の動きが一致するため、高解像度画像に対して動き補償を用いた符号化を高精度で行うことができる。さらに、高解像度画像において均一なビット配分を行うことができる。
また、再生装置15は、視線方向に対応する2次元平面の高解像度ストリームのみを配信サーバ13に要求して受け取る。従って、全ての2次元平面の高解像度ストリームを受け取る場合に比べて、配信サーバ13と再生装置15間の伝送量を削減することができる。
さらに、生成装置12は、全天球画像全体を低解像度化して低解像度画像を生成する。従って、生成装置12は、表示画像が高解像度画像の領域以外の領域にも対応する場合や、視聴者の視線方向が急に変化する場合であっても、低解像度画像を用いて表示画像を生成することができる。また、配信システム10は、全天球画像全体の符号化ストリームのみを再生する再生装置との互換性を有することができる。
また、生成装置12は、低解像度ストリームと選択面の高解像度ストリームを受け取り、表示画像を生成する。従って、1つの解像度の全天球画像の符号化ストリームを受け取り、表示画像を生成する場合に比べて、同一の伝送量や処理量で、表示画像の解像度を向上させることができる。
さらに、生成装置12は、任意の位置、傾き、およびサイズで2次元平面を設定することができる。従って、生成装置12は、任意の視線方向に対応する高解像度画像を生成することができる。これに対して、正距円筒図法を用いた方法により生成された全天球画像を分割することにより高解像度画像を生成する場合、全天球画像において横方向に延びる領域に対応する、球40の極部にマッピングされる画像を高解像度画像として生成することは困難である。
また、生成装置12は、撮影画像から、低解像度画像の生成に用いられる全天球画像を生成し、その全天球画像から高解像度画像を生成する。従って、再生装置15は、高解像度画像と低解像度画像を用いて、撮影画像そのものを高解像度画像とする場合に比べて高解像度画像の領域と低解像度画像の領域が連続した違和感のない表示画像を生成することができる。
なお、2次元平面は、視聴者にとって重要であると想定される被写体を見ることが可能な視線方向の範囲である重要範囲に対応して高密度で設定され、重要範囲以外の範囲に対応して低密度で設定されるか、または、設定されないようにしてもよい。この場合、視聴者の視線が重要範囲内にあるとき、再生装置15は、視線により近い法線に対応する2次元平面の高解像度を用いて表示画像を生成することができる。従って、表示画像における高解像度画像の割合が多くなり、その結果、表示画像の画質が向上する。また、重要範囲以外の範囲に対応する高解像度ストリームの本数は少ないため、高解像度ストリームの本数の増加を抑制することができる。
また、高解像度ストリーム、低解像度ストリーム、および2次元平面テーブルは、ストレージ102に記憶されず、受信部101から送信部103と送信部104を介して再生装置15にリアルタイム配信(ライブ配信)されるようにしてもよい。
さらに、上述した説明では、撮影画像は動画像であるものとしたが、静止画像であってもよい。また、選択面の数は1つでなくてもよい。
配信システム10は、ヘッドマウントディスプレイ16の代わりに、設置型ディスプレイを有するようにしてもよい。この場合、再生装置15はカメラ15Aを有さず、視聴位置および視線方向は、視聴者が、再生装置15または設置型ディスプレイと接続するコントローラを操作することにより入力される。
また、配信システム10は、再生装置15とヘッドマウントディスプレイ16の代わりに、モバイル端末を有するようにしてもよい。この場合、モバイル端末は、カメラ15A以外の再生装置15の処理を行い、モバイル端末が有するディスプレイに表示画像を表示させる。視聴者は、視聴位置および視線方向をモバイル端末の姿勢を変化させることにより入力し、モバイル端末は、内蔵するジャイロセンサにモバイル端末の姿勢を検出させることにより、入力された視聴位置および視線方向を取得する。
<第2実施の形態>
本開示を適用した配信システムの第2実施の形態の構成は、透視投影の代わりにtan軸投影(詳細は後述する)が行われる点を除いて、図2の配信システム10の構成と同一である。従って、以下では、tan軸投影についてのみ説明する。
(投影面の座標系の説明)
図15は、投影面の座標系を説明する図である。
なお、第2実施の形態では、投影面は、生成装置12が、高解像度画像を生成する際、球にマッピングされた全天球画像をtan軸投影する2次元平面、または、再生装置15が、表示画像を生成する際、3Dモデル画像をtan軸投影する視野範囲である。
図15の例では、3Dモデルの3次元のxyz座標系において、zが-1.0である投影面501が設定されている。この場合、投影面501の中心O´を原点とし、投影面501の水平方向をs方向とし、垂直方向をt方向とする2次元のst座標系が、投影面501の座標系となる。
なお、以下では、xyz座標系の原点Oからst座標系の座標(s,t)に向かうベクトル502を、座標(s,t)と、原点Oから投影面501までの距離である-1.0とを用いて、ベクトル(s,t,-1.0)という。
(tan軸投影の説明)
図16は、tan軸投影(正接軸投影)を説明する図である。
図16は、投影面501をzの負方向に見た図である。図16の例では、st座標系において、投影面501のs値およびt値の最小値は-1.0であり、最大値は1.0である。
この場合、透視投影では、原点Oから投影面501上の投影点に向かう投影ベクトルがベクトル(s´,t´-1.0)となるように、投影面501上に投影点が設定される。なお、s´は、-1.0から1.0までのs値の範囲に設けられた所定の間隔ごとの値であり、t´は-1.0から1.0までのt値の範囲に設けられた所定の間隔ごとの値である。従って、透視投影における投影点は、投影面501上で均一である。
これに対して、投影面501の画角をθw(図16の例ではπ/2)とすると、tan軸投影では、投影ベクトルがベクトル(tan(s´*θw/2), tan(t´*θw/2), -1.0)となるように、投影面501上に投影点が設定される。
具体的には、ベクトル(tan(s´*θw/2), tan(t´*θw/2), -1.0)は、s´*θw/2をθとし、t´*θw/2をφとすると、ベクトル(tanθ,tanφ,-1.0)になる。このとき、画角θwがπに近付くと、tanθやtanφは無限大に発散する。従って、tanθやtanφが無限大に発散しないように、ベクトル(tanθ,tanφ,-1.0)が、ベクトル(sinθ*cosφ, cosθ*sinφ, -cosθ*cosφ)に補正され、投影ベクトルがベクトル(sinθ*cosφ, cosθ*sinφ, -cosθ*cosφ)となるように、投影面501上に投影点が設定される。従って、tan軸投影では、隣り合う投影点に対応する投影ベクトルどうしがなす角が同一になる。
なお、対数軸(ログスケール)と同様に、tan(s´*θw/2), tan(t´*θw/2)は、tan軸のs´,t´であると捉えられる。従って、本明細書では、投影ベクトルがベクトル(tan(s´*θw/2), tan(t´*θw/2), -1.0)となる投影を、tan軸投影と称している。
(透視投影とtan軸投影における投影点の説明)
図17は、透視投影とtan軸投影における投影点を説明する図である。
図17は、投影面501をyの負方向に見た図である。図17の例では、投影面501上に投影点が9個配置される。
この場合、図17に示すように、透視投影では、投影点P1乃至P9が投影面501上に同一の間隔dで配置される。従って、投影点P1乃至P9に対応する、球511にマッピングされた全天球画像上の点P1´乃至P9´の間隔d´は等間隔ではない。即ち、間隔d´は、投影ベクトルに依存し、投影面501の中央に近い投影点ほど間隔d´が広い。
これに対して、tan軸投影では、投影点Q1乃至Q9が、隣り合う投影点の投影ベクトルどうしのなす角度が同一の角度αになるように配置される。従って、投影点Q1乃至Q9に対応する、球511にマッピングされた全天球画像上の点Q1´乃至Q9´の間隔は同一の間隔d´´になる。
(透視投影とtan軸投影により生成された高解像度画像上の全天球画像の各画素の例)
図18は、透視投影により生成された高解像度画像上の全天球画像の各画素の例を示す図であり、図19は、tan軸投影により生成された高解像度画像上の全天球画像の各画素の例を示す図である。
なお、図18および図19では、高解像度画像上の全天球画像の各画素の境界を白線で図示してある。このことは、後述する図20においても同様である。また、図18および図19の例では、投影面としての2次元平面が、図12のAの6つの面211乃至216である。このことは、後述する図21においても同様である。
この場合、図18に示すように、球にマッピングされた全天球画像の各画素が、面211乃至216のそれぞれに透視投影されることにより生成される高解像度画像521乃至526上の全天球画像の画素530(図中白線で囲まれた矩形)の密度は、画面の中央に近いほど高くなる。
即ち、投影点の間隔が面211乃至216上で同一である透視投影では、球にマッピングされた全天球画像上の投影点に対応する点の角度あたりの密度が、面211乃至216の中央に近い投影点ほど低くなる。従って、高解像度画像521乃至526上の全天球画像の画素530の密度は、画面の中央に近いほど高くなる。
これに対して、図19に示すように、球にマッピングされた全天球画像の各画素が、面211乃至216のそれぞれにtan軸投影されることにより生成される高解像度画像541乃至546上の全天球画像の画素550(図中白線で囲まれた矩形)の密度は、略均一になる。
即ち、投影点に対応する、球にマッピングされた全天球画像上の点の間隔が同一であるtan軸投影では、透視投影に比べて、球にマッピングされた全天球画像上の投影点に対応する点の角度あたりの密度が均一になる。従って、高解像度画像541乃至546上の全天球画像の画素550の密度は略均一になる。その結果、高解像度画像541乃至546の画質は、全天球画像の画素の密度が均一ではない高解像度画像521乃至526に比べて向上する。
なお、高解像度画像541や高解像度画像546の各画素550の境界は同心円を描かないため、高解像度画像541や高解像度画像546は、魚眼レンズにより撮影された撮影画像とは異なる。また、高解像度画像521乃至526のそれぞれと、高解像度画像541乃至546のそれぞれは、全天球画像の同一の領域が投影された画像であるため、相互変換が可能である。
図20は、透視投影およびtan軸投影により生成された高解像度画像上の全天球画像の各画素の他の例を示す図である。
図20の上段には、2次元平面の画角θwが、60°、90°、120°、150°、170°である場合に透視投影により生成された高解像度画像561乃至565が図示してある。
また、図20の下段には、2次元平面の画角θwが、60°、90°、120°、150°、170°である場合にtan軸投影により生成された高解像度画像571乃至575が図示してある。
図20の上段に示すように、透視投影により生成された高解像度画像561乃至565上の全天球画像の画素の密度の、画面内の位置による差は、画角θwが大きいほど大きくなる。一方、図20の下段に示すように、tan軸投影により生成された高解像度画像571乃至575の全天球画像の画素の密度は、画面内で均一に近い。従って、画角θwが大きいほど、tan軸投影により生成された高解像度画像571乃至575は、透視投影により生成された高解像度画像561乃至565に比べて画質が向上する。
また、透視投影により生成された高解像度画像561乃至565の画面中央の全天球画像の画素の密度は、画角θwが大きいほど高くなる。従って、例えば、画角θwが120°である高解像度画像563の画面中央の解像度は、画角θwが90°である高解像度画像562に比べて低下する。
一方、tan軸投影により生成された高解像度画像571乃至575全体の全天球画像の画素の密度は、画角θwが大きいほど高くなるが、画面内で均一に近い。従って、tan軸投影では、透視投影に比べて、画角θwが大きくなるほど画面中央の全天球画像の画素の密度が高くなることを抑制することができる。
例えば、画角θwが120°であり、tan軸投影により生成される高解像度画像573の画面中央における全天球画像の画素の密度は、画角θwが90°であり、透視投影により生成される高解像度画像562の画面中央における全天球画像の画素の密度と略等しくなる。その結果、tan軸投影では、透視投影に比べて、画面中央の重要な領域の解像度を向上させることができる。
なお、図示は省略するが、高解像度画像521乃至526が立方体の各面にテクスチャとしてマッピングされ、隣接する2つの面の境界が画面中央に投影されるように透視投影が行われると、その境界に近いほど、透視投影された全天球画像の画素の密度が高くなる。同様に、隣接する3つの面の境界が画面中央に投影されるように透視投影が行われると、その境界に近いほど、透視投影された全天球画像の画素の密度が高くなる。即ち、高解像度画像521乃至526がマッピングされた立方体の頂点付近から透視投影された全天球画像の画素の密度は、他の領域に比べて高くなる。
(2次元平面テーブルの構成例)
図21は、第2実施の形態における2次元平面テーブルの構成例を示す図である。
図21の2次元平面テーブルの構成は、新たに2次元平面への投影の方式が投影方式として登録される点を除いて、図6の構成と同一である。具体的には、第2実施の形態では、2次元平面への投影の方式がtan軸投影であるため、図21の2次元平面テーブルには、IDとしての1乃至5に対応付けて、投影方式としてtan軸投影が登録される。
なお、第1実施の形態においても、第2実施の形態と同様に、2次元平面テーブルに投影方式が登録されるようにしてもよいし、第2実施の形態において、第1実施の形態と同様に、2次元平面テーブルに投影方式が登録されないようにしてもよい。
以上のように、第2実施の形態では、球にマッピングされた全天球画像を2次元平面にtan軸投影することにより高解像度画像を生成するので、高解像度画像の画質を向上させることができる。また、3Dモデル画像を視野範囲にtan軸投影することにより表示画像を生成するので、表示画像の画質を向上させることができる。
なお、高解像度画像や表示画像を生成する際に行われる投影は、透視投影、tan軸投影以外であってもよい。また、2次元平面ごとに投影方式が異なるようにしてもよい。
<第3実施の形態>
(本開示を適用したコンピュータの説明)
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図22は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータ900において、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。
バス904には、さらに、入出力インタフェース905が接続されている。入出力インタフェース905には、入力部906、出力部907、記憶部908、通信部909、及びドライブ910が接続されている。
入力部906は、キーボード、マウス、マイクロフォンなどよりなる。出力部907は、ディスプレイ、スピーカなどよりなる。記憶部908は、ハードディスクや不揮発性のメモリなどよりなる。通信部909は、ネットワークインタフェースなどよりなる。ドライブ910は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア911を駆動する。
以上のように構成されるコンピュータ900では、CPU901が、例えば、記憶部908に記憶されているプログラムを、入出力インタフェース905及びバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ900(CPU901)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア911に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータ900では、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インタフェース905を介して、記憶部908にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部909で受信し、記憶部908にインストールすることができる。その他、プログラムは、ROM902や記憶部908に、あらかじめインストールしておくことができる。
なお、コンピュータ900が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
<応用例>
本開示に係る技術は、様々な製品へ応用することができる。例えば、本開示に係る技術は、自動車、電気自動車、ハイブリッド電気自動車、自動二輪車、自転車、パーソナルモビリティ、飛行機、ドローン、船舶、ロボット、建設機械、農業機械(トラクター)などのいずれかの種類の移動体に搭載される装置として実現されてもよい。
図23は、本開示に係る技術が適用され得る移動体制御システムの一例である車両制御システム7000の概略的な構成例を示すブロック図である。車両制御システム7000は、通信ネットワーク7010を介して接続された複数の電子制御ユニットを備える。図23に示した例では、車両制御システム7000は、駆動系制御ユニット7100、ボディ系制御ユニット7200、バッテリ制御ユニット7300、車外情報検出ユニット7400、車内情報検出ユニット7500、及び統合制御ユニット7600を備える。これらの複数の制御ユニットを接続する通信ネットワーク7010は、例えば、CAN(Controller Area Network)、LIN(Local Interconnect Network)、LAN(Local Area Network)又はFlexRay(登録商標)等の任意の規格に準拠した車載通信ネットワークであってよい。
各制御ユニットは、各種プログラムにしたがって演算処理を行うマイクロコンピュータと、マイクロコンピュータにより実行されるプログラム又は各種演算に用いられるパラメータ等を記憶する記憶部と、各種制御対象の装置を駆動する駆動回路とを備える。各制御ユニットは、通信ネットワーク7010を介して他の制御ユニットとの間で通信を行うためのネットワークI/Fを備えるとともに、車内外の装置又はセンサ等との間で、有線通信又は無線通信により通信を行うための通信I/Fを備える。図23では、統合制御ユニット7600の機能構成として、マイクロコンピュータ7610、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660、音声画像出力部7670、車載ネットワークI/F7680及び記憶部7690が図示されている。他の制御ユニットも同様に、マイクロコンピュータ、通信I/F及び記憶部等を備える。
駆動系制御ユニット7100は、各種プログラムにしたがって車両の駆動系に関連する装置の動作を制御する。例えば、駆動系制御ユニット7100は、内燃機関又は駆動用モータ等の車両の駆動力を発生させるための駆動力発生装置、駆動力を車輪に伝達するための駆動力伝達機構、車両の舵角を調節するステアリング機構、及び、車両の制動力を発生させる制動装置等の制御装置として機能する。駆動系制御ユニット7100は、ABS(Antilock Brake System)又はESC(Electronic Stability Control)等の制御装置としての機能を有してもよい。
駆動系制御ユニット7100には、車両状態検出部7110が接続される。車両状態検出部7110には、例えば、車体の軸回転運動の角速度を検出するジャイロセンサ、車両の加速度を検出する加速度センサ、あるいは、アクセルペダルの操作量、ブレーキペダルの操作量、ステアリングホイールの操舵角、エンジン回転数又は車輪の回転速度等を検出するためのセンサのうちの少なくとも一つが含まれる。駆動系制御ユニット7100は、車両状態検出部7110から入力される信号を用いて演算処理を行い、内燃機関、駆動用モータ、電動パワーステアリング装置又はブレーキ装置等を制御する。
ボディ系制御ユニット7200は、各種プログラムにしたがって車体に装備された各種装置の動作を制御する。例えば、ボディ系制御ユニット7200は、キーレスエントリシステム、スマートキーシステム、パワーウィンドウ装置、あるいは、ヘッドランプ、バックランプ、ブレーキランプ、ウィンカー又はフォグランプ等の各種ランプの制御装置として機能する。この場合、ボディ系制御ユニット7200には、鍵を代替する携帯機から発信される電波又は各種スイッチの信号が入力され得る。ボディ系制御ユニット7200は、これらの電波又は信号の入力を受け付け、車両のドアロック装置、パワーウィンドウ装置、ランプ等を制御する。
バッテリ制御ユニット7300は、各種プログラムにしたがって駆動用モータの電力供給源である二次電池7310を制御する。例えば、バッテリ制御ユニット7300には、二次電池7310を備えたバッテリ装置から、バッテリ温度、バッテリ出力電圧又はバッテリの残存容量等の情報が入力される。バッテリ制御ユニット7300は、これらの信号を用いて演算処理を行い、二次電池7310の温度調節制御又はバッテリ装置に備えられた冷却装置等の制御を行う。
車外情報検出ユニット7400は、車両制御システム7000を搭載した車両の外部の情報を検出する。例えば、車外情報検出ユニット7400には、撮像部7410及び車外情報検出部7420のうちの少なくとも一方が接続される。撮像部7410には、ToF(Time Of Flight)カメラ、ステレオカメラ、単眼カメラ、赤外線カメラ及びその他のカメラのうちの少なくとも一つが含まれる。車外情報検出部7420には、例えば、現在の天候又は気象を検出するための環境センサ、あるいは、車両制御システム7000を搭載した車両の周囲の他の車両、障害物又は歩行者等を検出するための周囲情報検出センサのうちの少なくとも一つが含まれる。
環境センサは、例えば、雨天を検出する雨滴センサ、霧を検出する霧センサ、日照度合いを検出する日照センサ、及び降雪を検出する雪センサのうちの少なくとも一つであってよい。周囲情報検出センサは、超音波センサ、レーダ装置及びLIDAR(Light Detection and Ranging、Laser Imaging Detection and Ranging)装置のうちの少なくとも一つであってよい。これらの撮像部7410及び車外情報検出部7420は、それぞれ独立したセンサないし装置として備えられてもよいし、複数のセンサないし装置が統合された装置として備えられてもよい。
ここで、図24は、撮像部7410及び車外情報検出部7420の設置位置の例を示す。撮像部7910,7912,7914,7916,7918は、例えば、車両7900のフロントノーズ、サイドミラー、リアバンパ、バックドア及び車室内のフロントガラスの上部のうちの少なくとも一つの位置に設けられる。フロントノーズに備えられる撮像部7910及び車室内のフロントガラスの上部に備えられる撮像部7918は、主として車両7900の前方の画像を取得する。サイドミラーに備えられる撮像部7912,7914は、主として車両7900の側方の画像を取得する。リアバンパ又はバックドアに備えられる撮像部7916は、主として車両7900の後方の画像を取得する。車室内のフロントガラスの上部に備えられる撮像部7918は、主として先行車両又は、歩行者、障害物、信号機、交通標識又は車線等の検出に用いられる。
なお、図24には、それぞれの撮像部7910,7912,7914,7916の撮影範囲の一例が示されている。撮像範囲aは、フロントノーズに設けられた撮像部7910の撮像範囲を示し、撮像範囲b,cは、それぞれサイドミラーに設けられた撮像部7912,7914の撮像範囲を示し、撮像範囲dは、リアバンパ又はバックドアに設けられた撮像部7916の撮像範囲を示す。例えば、撮像部7910,7912,7914,7916で撮像された画像データが重ね合わせられることにより、車両7900を上方から見た俯瞰画像が得られる。
車両7900のフロント、リア、サイド、コーナ及び車室内のフロントガラスの上部に設けられる車外情報検出部7920,7922,7924,7926,7928,7930は、例えば超音波センサ又はレーダ装置であってよい。車両7900のフロントノーズ、リアバンパ、バックドア及び車室内のフロントガラスの上部に設けられる車外情報検出部7920,7926,7930は、例えばLIDAR装置であってよい。これらの車外情報検出部7920〜7930は、主として先行車両、歩行者又は障害物等の検出に用いられる。
図23に戻って説明を続ける。車外情報検出ユニット7400は、撮像部7410に車外の画像を撮像させるとともに、撮像された画像データを受信する。また、車外情報検出ユニット7400は、接続されている車外情報検出部7420から検出情報を受信する。車外情報検出部7420が超音波センサ、レーダ装置又はLIDAR装置である場合には、車外情報検出ユニット7400は、超音波又は電磁波等を発信させるとともに、受信された反射波の情報を受信する。車外情報検出ユニット7400は、受信した情報に基づいて、人、車、障害物、標識又は路面上の文字等の物体検出処理又は距離検出処理を行ってもよい。車外情報検出ユニット7400は、受信した情報に基づいて、降雨、霧又は路面状況等を認識する環境認識処理を行ってもよい。車外情報検出ユニット7400は、受信した情報に基づいて、車外の物体までの距離を算出してもよい。
また、車外情報検出ユニット7400は、受信した画像データに基づいて、人、車、障害物、標識又は路面上の文字等を認識する画像認識処理又は距離検出処理を行ってもよい。車外情報検出ユニット7400は、受信した画像データに対して歪補正又は位置合わせ等の処理を行うとともに、異なる撮像部7410により撮像された画像データを合成して、俯瞰画像又はパノラマ画像を生成してもよい。車外情報検出ユニット7400は、異なる撮像部7410により撮像された画像データを用いて、視点変換処理を行ってもよい。
車内情報検出ユニット7500は、車内の情報を検出する。車内情報検出ユニット7500には、例えば、運転者の状態を検出する運転者状態検出部7510が接続される。運転者状態検出部7510は、運転者を撮像するカメラ、運転者の生体情報を検出する生体センサ又は車室内の音声を集音するマイク等を含んでもよい。生体センサは、例えば、座面又はステアリングホイール等に設けられ、座席に座った搭乗者又はステアリングホイールを握る運転者の生体情報を検出する。車内情報検出ユニット7500は、運転者状態検出部7510から入力される検出情報に基づいて、運転者の疲労度合い又は集中度合いを算出してもよいし、運転者が居眠りをしていないかを判別してもよい。車内情報検出ユニット7500は、集音された音声信号に対してノイズキャンセリング処理等の処理を行ってもよい。
統合制御ユニット7600は、各種プログラムにしたがって車両制御システム7000内の動作全般を制御する。統合制御ユニット7600には、入力部7800が接続されている。入力部7800は、例えば、タッチパネル、ボタン、マイクロフォン、スイッチ又はレバー等、搭乗者によって入力操作され得る装置によって実現される。統合制御ユニット7600には、マイクロフォンにより入力される音声を音声認識することにより得たデータが入力されてもよい。入力部7800は、例えば、赤外線又はその他の電波を利用したリモートコントロール装置であってもよいし、車両制御システム7000の操作に対応した携帯電話又はPDA(Personal Digital Assistant)等の外部接続機器であってもよい。入力部7800は、例えばカメラであってもよく、その場合搭乗者はジェスチャにより情報を入力することができる。あるいは、搭乗者が装着したウェアラブル装置の動きを検出することで得られたデータが入力されてもよい。さらに、入力部7800は、例えば、上記の入力部7800を用いて搭乗者等により入力された情報に基づいて入力信号を生成し、統合制御ユニット7600に出力する入力制御回路などを含んでもよい。搭乗者等は、この入力部7800を操作することにより、車両制御システム7000に対して各種のデータを入力したり処理動作を指示したりする。
記憶部7690は、マイクロコンピュータにより実行される各種プログラムを記憶するROM(Read Only Memory)、及び各種パラメータ、演算結果又はセンサ値等を記憶するRAM(Random Access Memory)を含んでいてもよい。また、記憶部7690は、HDD(Hard Disc Drive)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等によって実現してもよい。
汎用通信I/F7620は、外部環境7750に存在する様々な機器との間の通信を仲介する汎用的な通信I/Fである。汎用通信I/F7620は、GSM(Global System of Mobile communications)、WiMAX、LTE(Long Term Evolution)若しくはLTE−A(LTE−Advanced)などのセルラー通信プロトコル、又は無線LAN(Wi−Fi(登録商標)ともいう)、Bluetooth(登録商標)などのその他の無線通信プロトコルを実装してよい。汎用通信I/F7620は、例えば、基地局又はアクセスポイントを介して、外部ネットワーク(例えば、インターネット、クラウドネットワーク又は事業者固有のネットワーク)上に存在する機器(例えば、アプリケーションサーバ又は制御サーバ)へ接続してもよい。また、汎用通信I/F7620は、例えばP2P(Peer To Peer)技術を用いて、車両の近傍に存在する端末(例えば、運転者、歩行者若しくは店舗の端末、又はMTC(Machine Type Communication)端末)と接続してもよい。
専用通信I/F7630は、車両における使用を目的として策定された通信プロトコルをサポートする通信I/Fである。専用通信I/F7630は、例えば、下位レイヤのIEEE802.11pと上位レイヤのIEEE1609との組合せであるWAVE(Wireless Access in Vehicle Environment)、DSRC(Dedicated Short Range Communications)、又はセルラー通信プロトコルといった標準プロトコルを実装してよい。専用通信I/F7630は、典型的には、車車間(Vehicle to Vehicle)通信、路車間(Vehicle to Infrastructure)通信、車両と家との間(Vehicle to Home)の通信及び歩車間(Vehicle to Pedestrian)通信のうちの1つ以上を含む概念であるV2X通信を遂行する。
測位部7640は、例えば、GNSS(Global Navigation Satellite System)衛星からのGNSS信号(例えば、GPS(Global Positioning System)衛星からのGPS信号)を受信して測位を実行し、車両の緯度、経度及び高度を含む位置情報を生成する。なお、測位部7640は、無線アクセスポイントとの信号の交換により現在位置を特定してもよく、又は測位機能を有する携帯電話、PHS若しくはスマートフォンといった端末から位置情報を取得してもよい。
ビーコン受信部7650は、例えば、道路上に設置された無線局等から発信される電波あるいは電磁波を受信し、現在位置、渋滞、通行止め又は所要時間等の情報を取得する。なお、ビーコン受信部7650の機能は、上述した専用通信I/F7630に含まれてもよい。
車内機器I/F7660は、マイクロコンピュータ7610と車内に存在する様々な車内機器7760との間の接続を仲介する通信インタフェースである。車内機器I/F7660は、無線LAN、Bluetooth(登録商標)、NFC(Near Field Communication)又はWUSB(Wireless USB)といった無線通信プロトコルを用いて無線接続を確立してもよい。また、車内機器I/F7660は、図示しない接続端子(及び、必要であればケーブル)を介して、USB(Universal Serial Bus)、HDMI(High-Definition Multimedia Interface)、又はMHL(Mobile High-definition Link)等の有線接続を確立してもよい。車内機器7760は、例えば、搭乗者が有するモバイル機器若しくはウェアラブル機器、又は車両に搬入され若しくは取り付けられる情報機器のうちの少なくとも1つを含んでいてもよい。また、車内機器7760は、任意の目的地までの経路探索を行うナビゲーション装置を含んでいてもよい。車内機器I/F7660は、これらの車内機器7760との間で、制御信号又はデータ信号を交換する。
車載ネットワークI/F7680は、マイクロコンピュータ7610と通信ネットワーク7010との間の通信を仲介するインタフェースである。車載ネットワークI/F7680は、通信ネットワーク7010によりサポートされる所定のプロトコルに則して、信号等を送受信する。
統合制御ユニット7600のマイクロコンピュータ7610は、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660及び車載ネットワークI/F7680のうちの少なくとも一つを介して取得される情報に基づき、各種プログラムにしたがって、車両制御システム7000を制御する。例えば、マイクロコンピュータ7610は、取得される車内外の情報に基づいて、駆動力発生装置、ステアリング機構又は制動装置の制御目標値を演算し、駆動系制御ユニット7100に対して制御指令を出力してもよい。例えば、マイクロコンピュータ7610は、車両の衝突回避あるいは衝撃緩和、車間距離に基づく追従走行、車速維持走行、車両の衝突警告、又は車両のレーン逸脱警告等を含むADAS(Advanced Driver Assistance System)の機能実現を目的とした協調制御を行ってもよい。また、マイクロコンピュータ7610は、取得される車両の周囲の情報に基づいて駆動力発生装置、ステアリング機構又は制動装置等を制御することにより、運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行ってもよい。
マイクロコンピュータ7610は、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660及び車載ネットワークI/F7680のうちの少なくとも一つを介して取得される情報に基づき、車両と周辺の構造物や人物等の物体との間の3次元距離情報を生成し、車両の現在位置の周辺情報を含むローカル地図情報を作成してもよい。また、マイクロコンピュータ7610は、取得される情報に基づき、車両の衝突、歩行者等の近接又は通行止めの道路への進入等の危険を予測し、警告用信号を生成してもよい。警告用信号は、例えば、警告音を発生させたり、警告ランプを点灯させたりするための信号であってよい。
音声画像出力部7670は、車両の搭乗者又は車外に対して、視覚的又は聴覚的に情報を通知することが可能な出力装置へ音声及び画像のうちの少なくとも一方の出力信号を送信する。図23の例では、出力装置として、オーディオスピーカ7710、表示部7720及びインストルメントパネル7730が例示されている。表示部7720は、例えば、オンボードディスプレイ及びヘッドアップディスプレイの少なくとも一つを含んでいてもよい。表示部7720は、AR(Augmented Reality)表示機能を有していてもよい。出力装置は、これらの装置以外の、ヘッドホン、搭乗者が装着する眼鏡型ディスプレイ等のウェアラブルデバイス、プロジェクタ又はランプ等の他の装置であってもよい。出力装置が表示装置の場合、表示装置は、マイクロコンピュータ7610が行った各種処理により得られた結果又は他の制御ユニットから受信された情報を、テキスト、イメージ、表、グラフ等、様々な形式で視覚的に表示する。また、出力装置が音声出力装置の場合、音声出力装置は、再生された音声データ又は音響データ等からなるオーディオ信号をアナログ信号に変換して聴覚的に出力する。
なお、図23に示した例において、通信ネットワーク7010を介して接続された少なくとも二つの制御ユニットが一つの制御ユニットとして一体化されてもよい。あるいは、個々の制御ユニットが、複数の制御ユニットにより構成されてもよい。さらに、車両制御システム7000が、図示されていない別の制御ユニットを備えてもよい。また、上記の説明において、いずれかの制御ユニットが担う機能の一部又は全部を、他の制御ユニットに持たせてもよい。つまり、通信ネットワーク7010を介して情報の送受信がされるようになっていれば、所定の演算処理が、いずれかの制御ユニットで行われるようになってもよい。同様に、いずれかの制御ユニットに接続されているセンサ又は装置が、他の制御ユニットに接続されるとともに、複数の制御ユニットが、通信ネットワーク7010を介して相互に検出情報を送受信してもよい。
なお、図1乃至図21を用いて説明した本実施形態に係る配信システム10の各機能を実現するためのコンピュータプログラムを、いずれかの制御ユニット等に実装することができる。また、このようなコンピュータプログラムが格納された、コンピュータで読み取り可能な記録媒体を提供することもできる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリ等である。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信されてもよい。
以上説明した車両制御システム7000に、図1乃至図21を用いて説明した本実施形態に係る配信システム10を適用する場合、例えば、配信システム10の撮影装置11は、撮像部7410の少なくとも一部に相当する。また、生成装置12、配信サーバ13、再生装置15は一体化され、マイクロコンピュータ7610と記憶部7690に相当する。ヘッドマウントディスプレイ16は、表示部7720に相当する。なお、配信システム10を統合制御ユニット7600に適用する場合、ネットワーク14、カメラ15A、マーカ16A,およびジャイロセンサ16Bは設けられず、視聴者である搭乗者の入力部7800の操作により視聴者の視線方向および視聴位置が入力される。以上のようにして、配信システム10を、図23に示した応用例の統合制御ユニット7600に適用することにより、全天球画像を用いて生成される全ての視線方向の表示画像の画質を同程度にすることができる。
また、図1乃至図21を用いて説明した配信システム10の少なくとも一部の構成要素は、図23に示した統合制御ユニット7600のためのモジュール(例えば、一つのダイで構成される集積回路モジュール)において実現されてもよい。あるいは、図1乃至図21を用いて説明した配信システム10が、図23に示した車両制御システム7000の複数の制御ユニットによって実現されてもよい。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
また、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本開示は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
本開示は、以下のような構成もとることができる。
(1)
全天球画像を低解像度化する低解像度化部と、
3Dモデルにマッピングされた前記全天球画像を複数の2次元平面に投影することにより、複数の画像を生成する投影部と
を備える生成装置。
(2)
前記低解像度化部により低解像度化された前記全天球画像を符号化し、低解像度ストリームを生成する低解像度符号化部と、
前記投影部により生成された前記複数の画像をそれぞれ符号化し、高解像度ストリームを生成する高解像度符号化部と
前記低解像度符号化部により生成された前記低解像度ストリームと、前記高解像度符号化部により生成された前記高解像度ストリームを送信する送信部と
をさらに備える
前記(1)に記載の生成装置。
(3)
前記送信部は、前記複数の2次元平面の位置を示す2次元平面情報を送信する
ように構成された
前記(2)に記載の生成装置。
(4)
隣接する前記2次元平面の前記画像どうしの一部は重複する
ように構成された
前記(1)乃至(3)のいずれかに記載の生成装置。
(5)
前記複数の2次元平面の中心を通る法線は、立方体の各辺の中点と前記立方体の中心を通る線である
ように構成された
前記(1)乃至(4)のいずれかに記載の生成装置。
(6)
前記複数の2次元平面の中心を通る法線は、立方体の各辺の中点と前記立方体の中心を通る線と、前記立方体の各面の中心と前記立方体の中心を通る線である
ように構成された
前記(1)乃至(4)のいずれかに記載の生成装置。
(7)
前記全天球画像は、左目用の視点の全天球画像と右目用の視点の全天球画像からなり、
前記低解像度化部は、低解像度化された前記左目用の視点の全天球画像と前記右目用の視点の全天球画像をパッキングして低解像度パッキング画像を生成し、
前記投影部は、前記3Dモデルにマッピングされた前記左目用の視点の全天球画像および前記右目用の視点の全天球画像それぞれを前記複数の2次元平面に投影することにより生成された、前記左目用の視点および前記右目用の視点の前記複数の画像を、前記2次元平面ごとにパッキングして高解像度パッキング画像を生成する
ように構成された
前記(1)乃至(6)のいずれかに記載の生成装置。
(8)
生成装置が、
全天球画像を低解像度化する低解像度化ステップと、
3Dモデルにマッピングされた前記全天球画像を複数の2次元平面に投影することにより、複数の画像を生成する投影ステップと
を含む生成方法。
(9)
3Dモデルにマッピングされた全天球画像を複数の2次元平面に投影することにより生成された複数の画像のうちの少なくとも1つの画像と、低解像度化された前記全天球画像とを受け取る受け取り部と、
前記受け取り部により受け取られた前記画像および低解像度化された前記全天球画像の少なくとも一方に基づいて、表示画像を生成する描画部と
を備える再生装置。
(10)
視聴者の視線方向に基づいて、前記複数の画像から、前記受け取り部により受け取られる前記画像を選択する選択部
をさらに備える
ように構成された
前記(9)に記載の再生装置。
(11)
前記受け取り部は、前記複数の2次元平面の位置を示す2次元平面情報を受け取り、
前記選択部は、前記2次元平面情報と前記視線方向に基づいて前記画像を選択する
ように構成された
前記(10)に記載の再生装置。
(12)
前記画像を前記2次元平面にマッピングし、低解像度化された前記全天球画像を前記3Dモデルにマッピングすることにより、3Dモデル画像を生成するマッピング処理部
をさらに備え、
前記描画部は、前記マッピング処理部により生成された前記3Dモデル画像を、視聴者の視野範囲に投影することにより前記表示画像を生成する
ように構成された
前記(9)に記載の再生装置。
(13)
低解像度化された前記全天球画像を符号化することにより生成された低解像度ストリームを復号し、低解像度化された前記全天球画像を生成する低解像度復号部と、
前記複数の画像のうちの少なくとも1つの画像を符号化することにより生成された高解像度ストリームを復号し、前記画像を生成する高解像度復号部と
をさらに備え、
前記受け取り部は、前記低解像度ストリームと前記高解像度ストリームを受け取る
ように構成された
前記(9)乃至(12)のいずれかに記載の再生装置。
(14)
隣接する前記2次元平面の前記画像どうしの一部は重複する
ように構成された
前記(9)乃至(13)のいずれかに記載の再生装置。
(15)
前記複数の2次元平面の中心を通る法線は、立方体の各辺の中点と前記立方体の中心を通る線である
ように構成された
前記(9)乃至(14)のいずれかに記載の再生装置。
(16)
前記複数の2次元平面の中心を通る法線は、立方体の各辺の中点と前記立方体の中心を通る線と、前記立方体の各面の中心と前記立方体の中心を通る線である
ように構成された
前記(9)乃至(14)のいずれかに記載の再生装置。
(17)
前記低解像度化された全天球画像は、低解像度化された左目用の視点の全天球画像と右目用の視点の全天球画像をパッキングした画像であり、
前記複数の画像は、前記2次元平面ごとに、前記3Dモデルにマッピングされた前記左目用の視点の全天球画像および前記右目用の視点の全天球画像をそれぞれ前記2次元平面に投影することにより生成された画像をパッキングした画像である
ように構成された
前記(9)乃至(11)のいずれかに記載の再生装置。
(18)
前記描画部は、前記受け取り部により受け取られた前記画像および前記低解像度化された全天球画像を視点ごとに分離し、視点ごとに、分割された前記画像および前記低解像度化された全天球画像の少なくとも一方に基づいて、前記表示画像を生成する
ように構成された
前記(17)に記載の再生装置。
(19)
再生装置が、
3Dモデルにマッピングされた全天球画像を複数の2次元平面に投影することにより生成された複数の画像のうちの少なくとも1つの画像と、低解像度化された前記全天球画像とを受け取る受け取りステップと、
前記受け取りステップの処理により受け取られた前記画像および低解像度化された前記全天球画像の少なくとも一方に基づいて、表示画像を生成する描画ステップと
を含む再生方法。
12 生成装置, 23 低解像度化部, 24 エンコーダ, 26−1乃至26−5 透視投影部, 27−1乃至27−5 エンコーダ, 29 送信部, 40 球, 41乃至45 2次元平面, 121 受信部, 122 デコーダ, 123 受信部, 124 デコーダ, 125 マッピング処理部, 126 描画部, 128 視線検出部, 143 2次元平面, 151 低解像度画像, 152 高解像度画像, 170 表示画像, 171 高解像度画像, 172 低解像度画像, 180 表示画像, 181 高解像度画像, 182 低解像度画像, 190 表示画像, 191 高解像度画像, 192 低解像度画像

Claims (19)

  1. 全天球画像を低解像度化する低解像度化部と、
    3Dモデルにマッピングされた前記全天球画像を複数の2次元平面に投影することにより、複数の画像を生成する投影部と
    を備える生成装置。
  2. 前記低解像度化部により低解像度化された前記全天球画像を符号化し、低解像度ストリームを生成する低解像度符号化部と、
    前記投影部により生成された前記複数の画像をそれぞれ符号化し、高解像度ストリームを生成する高解像度符号化部と
    前記低解像度符号化部により生成された前記低解像度ストリームと、前記高解像度符号化部により生成された前記高解像度ストリームを送信する送信部と
    をさらに備える
    請求項1に記載の生成装置。
  3. 前記送信部は、前記複数の2次元平面の位置を示す2次元平面情報を送信する
    ように構成された
    請求項2に記載の生成装置。
  4. 隣接する前記2次元平面の前記画像どうしの一部は重複する
    ように構成された
    請求項1に記載の生成装置。
  5. 前記複数の2次元平面の中心を通る法線は、立方体の各辺の中点と前記立方体の中心を通る線である
    ように構成された
    請求項1に記載の生成装置。
  6. 前記複数の2次元平面の中心を通る法線は、立方体の各辺の中点と前記立方体の中心を通る線と、前記立方体の各面の中心と前記立方体の中心を通る線である
    ように構成された
    請求項1に記載の生成装置。
  7. 前記全天球画像は、左目用の視点の全天球画像と右目用の視点の全天球画像からなり、
    前記低解像度化部は、低解像度化された前記左目用の視点の全天球画像と前記右目用の視点の全天球画像をパッキングして低解像度パッキング画像を生成し、
    前記投影部は、前記3Dモデルにマッピングされた前記左目用の視点の全天球画像および前記右目用の視点の全天球画像それぞれを前記複数の2次元平面に投影することにより生成された、前記左目用の視点および前記右目用の視点の前記複数の画像を、前記2次元平面ごとにパッキングして高解像度パッキング画像を生成する
    ように構成された
    請求項1に記載の生成装置。
  8. 生成装置が、
    全天球画像を低解像度化する低解像度化ステップと、
    3Dモデルにマッピングされた前記全天球画像を複数の2次元平面に投影することにより、複数の画像を生成する投影ステップと
    を含む生成方法。
  9. 3Dモデルにマッピングされた全天球画像を複数の2次元平面に投影することにより生成された複数の画像のうちの少なくとも1つの画像と、低解像度化された前記全天球画像とを受け取る受け取り部と、
    前記受け取り部により受け取られた前記画像および低解像度化された前記全天球画像の少なくとも一方に基づいて、表示画像を生成する描画部と
    を備える再生装置。
  10. 視聴者の視線方向に基づいて、前記複数の画像から、前記受け取り部により受け取られる前記画像を選択する選択部
    をさらに備える
    ように構成された
    請求項9に記載の再生装置。
  11. 前記受け取り部は、前記複数の2次元平面の位置を示す2次元平面情報を受け取り、
    前記選択部は、前記2次元平面情報と前記視線方向に基づいて前記画像を選択する
    ように構成された
    請求項10に記載の再生装置。
  12. 前記画像を前記2次元平面にマッピングし、低解像度化された前記全天球画像を前記3Dモデルにマッピングすることにより、3Dモデル画像を生成するマッピング処理部
    をさらに備え、
    前記描画部は、前記マッピング処理部により生成された前記3Dモデル画像を、視聴者の視野範囲に投影することにより前記表示画像を生成する
    ように構成された
    請求項9に記載の再生装置。
  13. 低解像度化された前記全天球画像を符号化することにより生成された低解像度ストリームを復号し、低解像度化された前記全天球画像を生成する低解像度復号部と、
    前記複数の画像のうちの少なくとも1つの画像を符号化することにより生成された高解像度ストリームを復号し、前記画像を生成する高解像度復号部と
    をさらに備え、
    前記受け取り部は、前記低解像度ストリームと前記高解像度ストリームを受け取る
    ように構成された
    請求項9に記載の再生装置。
  14. 隣接する前記2次元平面の前記画像どうしの一部は重複する
    ように構成された
    請求項9に記載の再生装置。
  15. 前記複数の2次元平面の中心を通る法線は、立方体の各辺の中点と前記立方体の中心を通る線である
    ように構成された
    請求項9に記載の再生装置。
  16. 前記複数の2次元平面の中心を通る法線は、立方体の各辺の中点と前記立方体の中心を通る線と、前記立方体の各面の中心と前記立方体の中心を通る線である
    ように構成された
    請求項9に記載の再生装置。
  17. 前記低解像度化された全天球画像は、低解像度化された左目用の視点の全天球画像と右目用の視点の全天球画像をパッキングした画像であり、
    前記複数の画像は、前記2次元平面ごとに、前記3Dモデルにマッピングされた前記左目用の視点の全天球画像および前記右目用の視点の全天球画像をそれぞれ前記2次元平面に投影することにより生成された画像をパッキングした画像である
    ように構成された
    請求項9に記載の再生装置。
  18. 前記描画部は、前記受け取り部により受け取られた前記画像および前記低解像度化された全天球画像を視点ごとに分離し、視点ごとに、分割された前記画像および前記低解像度化された全天球画像の少なくとも一方に基づいて、前記表示画像を生成する
    ように構成された
    請求項17に記載の再生装置。
  19. 再生装置が、
    3Dモデルにマッピングされた全天球画像を複数の2次元平面に投影することにより生成された複数の画像のうちの少なくとも1つの画像と、低解像度化された前記全天球画像とを受け取る受け取りステップと、
    前記受け取りステップの処理により受け取られた前記画像および低解像度化された前記全天球画像の少なくとも一方に基づいて、表示画像を生成する描画ステップと
    を含む再生方法。
JP2018516955A 2016-05-13 2017-04-28 生成装置および生成方法、並びに、再生装置および再生方法 Active JP6977720B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2016097360 2016-05-13
JP2016097360 2016-05-13
JP2016142286 2016-07-20
JP2016142286 2016-07-20
PCT/JP2017/016907 WO2017195650A1 (ja) 2016-05-13 2017-04-28 生成装置および生成方法、並びに、再生装置および再生方法

Publications (2)

Publication Number Publication Date
JPWO2017195650A1 true JPWO2017195650A1 (ja) 2019-03-14
JP6977720B2 JP6977720B2 (ja) 2021-12-08

Family

ID=60267064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018516955A Active JP6977720B2 (ja) 2016-05-13 2017-04-28 生成装置および生成方法、並びに、再生装置および再生方法

Country Status (6)

Country Link
US (1) US10762597B2 (ja)
EP (1) EP3457352B1 (ja)
JP (1) JP6977720B2 (ja)
KR (1) KR102343651B1 (ja)
CN (1) CN109074628A (ja)
WO (1) WO2017195650A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10043237B2 (en) * 2015-08-12 2018-08-07 Gopro, Inc. Equatorial stitching of hemispherical images in a spherical image capture system
JP6930541B2 (ja) * 2016-08-19 2021-09-01 ソニーグループ株式会社 画像処理装置および画像処理方法
KR102598082B1 (ko) * 2016-10-28 2023-11-03 삼성전자주식회사 영상 표시 장치, 모바일 장치 및 그 동작방법
EP3322149B1 (en) * 2016-11-10 2023-09-13 Tata Consultancy Services Limited Customized map generation with real time messages and locations from concurrent users
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
CN108537721B (zh) * 2017-03-02 2021-09-07 株式会社理光 全景图像的处理方法、装置及电子设备
US10839480B2 (en) * 2017-03-22 2020-11-17 Qualcomm Incorporated Sphere equator projection for efficient compression of 360-degree video
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
US20190005709A1 (en) * 2017-06-30 2019-01-03 Apple Inc. Techniques for Correction of Visual Artifacts in Multi-View Images
WO2019009750A1 (en) * 2017-07-05 2019-01-10 Huawei Technologies Co., Ltd APPARATUS AND METHOD FOR PANORAMIC VIDEO CODING
JP6472864B1 (ja) * 2017-11-29 2019-02-20 株式会社近江デジタルファブリケーションズ 画像配信システム、及び配信画像生成方法
JP6996300B2 (ja) * 2018-01-04 2022-01-17 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP7106332B2 (ja) * 2018-04-17 2022-07-26 日立Astemo株式会社 外界認識装置
US10666863B2 (en) * 2018-05-25 2020-05-26 Microsoft Technology Licensing, Llc Adaptive panoramic video streaming using overlapping partitioned sections
US10764494B2 (en) 2018-05-25 2020-09-01 Microsoft Technology Licensing, Llc Adaptive panoramic video streaming using composite pictures
US20200045344A1 (en) * 2018-07-31 2020-02-06 Intel Corporation Video processing mechanism
US11178373B2 (en) 2018-07-31 2021-11-16 Intel Corporation Adaptive resolution of point cloud and viewpoint prediction for video streaming in computing environments
JP2021192470A (ja) 2018-09-07 2021-12-16 ソニーグループ株式会社 コンテンツ配信システムおよびコンテンツ配信方法、並びにプログラム
CN109444157A (zh) * 2018-12-25 2019-03-08 苏州凡目视觉科技有限公司 一种划痕检测装置与方法
US20230093035A1 (en) * 2020-03-05 2023-03-23 Sony Semiconductor Solutions Corporation Information processing device and information processing method
CN111479128A (zh) * 2020-04-01 2020-07-31 黑龙江省农业科学院农业遥感与信息研究所 一种利用互联网进行农业种植技术推广的系统及方法
WO2021253189A1 (en) * 2020-06-15 2021-12-23 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Electric device, scanning method of controlling electric device, and computer readable storage medium
US20230281921A1 (en) * 2022-03-01 2023-09-07 Tencent America LLC Methods of 3d clothed human reconstruction and animation from monocular image

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10234043A (ja) * 1997-02-20 1998-09-02 Toshiba Corp 動画像符号化/復号化装置
JP2000347650A (ja) * 1999-06-07 2000-12-15 Matsushita Joho System Kk 画像表示装置及び方法
JP2002312778A (ja) * 2001-04-09 2002-10-25 Be Here Corp モーションパノラマ画像を電子的に配信する方法および装置
JP2003267295A (ja) * 2002-03-14 2003-09-25 Foundation For Nara Institute Of Science & Technology 遠隔操縦システム
JP2004048546A (ja) * 2002-07-15 2004-02-12 Sony Corp 情報処理装置および方法、表示装置および方法、並びにプログラム
JP2004072694A (ja) * 2002-08-09 2004-03-04 Sony Corp 情報提供システムおよび方法、情報提供装置および方法、記録媒体、並びにプログラム
JP2004094523A (ja) * 2002-08-30 2004-03-25 Canon Inc 情報処理装置及び方法
US20060034367A1 (en) * 2004-08-13 2006-02-16 Gwang-Hoon Park Method and apparatus to encode image, and method and apparatus to decode image data
JP2012120054A (ja) * 2010-12-02 2012-06-21 Canon Inc 画像符号化装置、画像符号化方法およびプログラム
EP2490179A1 (en) * 2011-02-18 2012-08-22 Alcatel Lucent Method and apparatus for transmitting and receiving a panoramic video stream

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001298652A (ja) 2000-04-17 2001-10-26 Sony Corp 画像圧縮方法及び画像圧縮装置、並びにソフトウェア記憶媒体
JP2003141562A (ja) * 2001-10-29 2003-05-16 Sony Corp 非平面画像の画像処理装置及び画像処理方法、記憶媒体、並びにコンピュータ・プログラム
US7308131B2 (en) * 2002-12-03 2007-12-11 Ntt Docomo, Inc. Representation and coding of panoramic and omnidirectional images
US7334883B2 (en) * 2004-08-25 2008-02-26 Hewlett-Packard Development Company, L.P. Printer, printhead, apparatus and method for air-free ink delivery
US9635252B2 (en) * 2013-04-16 2017-04-25 Disney Enterprises, Inc. Live panoramic image capture and distribution
JP6302624B2 (ja) * 2013-04-24 2018-03-28 住友重機械工業株式会社 画像生成装置
JP6075889B2 (ja) 2014-06-10 2017-02-08 日本電信電話株式会社 映像配信装置及び映像再生装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10234043A (ja) * 1997-02-20 1998-09-02 Toshiba Corp 動画像符号化/復号化装置
JP2000347650A (ja) * 1999-06-07 2000-12-15 Matsushita Joho System Kk 画像表示装置及び方法
JP2002312778A (ja) * 2001-04-09 2002-10-25 Be Here Corp モーションパノラマ画像を電子的に配信する方法および装置
JP2003267295A (ja) * 2002-03-14 2003-09-25 Foundation For Nara Institute Of Science & Technology 遠隔操縦システム
JP2004048546A (ja) * 2002-07-15 2004-02-12 Sony Corp 情報処理装置および方法、表示装置および方法、並びにプログラム
JP2004072694A (ja) * 2002-08-09 2004-03-04 Sony Corp 情報提供システムおよび方法、情報提供装置および方法、記録媒体、並びにプログラム
JP2004094523A (ja) * 2002-08-30 2004-03-25 Canon Inc 情報処理装置及び方法
US20060034367A1 (en) * 2004-08-13 2006-02-16 Gwang-Hoon Park Method and apparatus to encode image, and method and apparatus to decode image data
JP2012120054A (ja) * 2010-12-02 2012-06-21 Canon Inc 画像符号化装置、画像符号化方法およびプログラム
EP2490179A1 (en) * 2011-02-18 2012-08-22 Alcatel Lucent Method and apparatus for transmitting and receiving a panoramic video stream

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曽良 洋介(外3名): "「多面体モデルを用いた全方位ビデオの圧縮」", 情報処理学会研究報告, vol. 2003, no. 41, JPN6016015183, 8 May 2003 (2003-05-08), pages 59 - 66, ISSN: 0004535148 *

Also Published As

Publication number Publication date
CN109074628A (zh) 2018-12-21
WO2017195650A1 (ja) 2017-11-16
US20190108611A1 (en) 2019-04-11
EP3457352B1 (en) 2022-06-01
JP6977720B2 (ja) 2021-12-08
KR20190008193A (ko) 2019-01-23
EP3457352A4 (en) 2019-10-30
KR102343651B1 (ko) 2021-12-28
US10762597B2 (en) 2020-09-01
EP3457352A1 (en) 2019-03-20

Similar Documents

Publication Publication Date Title
JP6977720B2 (ja) 生成装置および生成方法、並びに、再生装置および再生方法
JP6944136B2 (ja) 画像処理装置および画像処理方法
WO2018021067A1 (ja) 画像処理装置および画像処理方法
JP6944138B2 (ja) 画像処理装置および画像処理方法
WO2018074252A1 (ja) 画像処理装置および画像処理方法
JP6944137B2 (ja) 画像処理装置および画像処理方法
JP7095697B2 (ja) 生成装置および生成方法、並びに、再生装置および再生方法
JP6743893B2 (ja) 画像処理装置および画像処理方法
JP7028168B2 (ja) 画像処理装置および画像処理方法
KR102378860B1 (ko) 화상 처리 장치 및 화상 처리 방법
WO2018070266A1 (ja) 画像処理装置および画像処理方法
JP6743894B2 (ja) 画像処理装置および画像処理方法
WO2018034171A1 (ja) 画像処理装置および画像処理方法
JP6977725B2 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211025

R151 Written notification of patent or utility model registration

Ref document number: 6977720

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151