JPWO2017145756A1 - ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法 - Google Patents

ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法 Download PDF

Info

Publication number
JPWO2017145756A1
JPWO2017145756A1 JP2018501553A JP2018501553A JPWO2017145756A1 JP WO2017145756 A1 JPWO2017145756 A1 JP WO2017145756A1 JP 2018501553 A JP2018501553 A JP 2018501553A JP 2018501553 A JP2018501553 A JP 2018501553A JP WO2017145756 A1 JPWO2017145756 A1 JP WO2017145756A1
Authority
JP
Japan
Prior art keywords
file
image
depth
quality
quality information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018501553A
Other languages
English (en)
Other versions
JP6868783B2 (ja
Inventor
充 勝股
充 勝股
平林 光浩
光浩 平林
俊也 浜田
俊也 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2017145756A1 publication Critical patent/JPWO2017145756A1/ja
Application granted granted Critical
Publication of JP6868783B2 publication Critical patent/JP6868783B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/275Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B30/00Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images
    • G02B30/40Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images giving the observer of a single two-dimensional [2D] image a perception of depth
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0007Image acquisition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/178Metadata, e.g. disparity information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2362Generation or processing of Service Information [SI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals

Abstract

本開示は、少なくともデプス画像を含むデプス関連画像の品質情報を効率的に格納するファイルを生成することができるようにするファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法に関する。セグメントファイル生成部は、少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するクオリティファイルを生成する。本開示は、例えば、MPEG-DASHに準ずる方式で動画コンテンツのセグメントファイルとMPDファイルを配信する情報処理システムのファイル生成装置等に適用することができる。

Description

本開示は、ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法に関し、特に、少なくともデプス画像を含むデプス関連画像の品質情報を効率的に格納するファイルを生成することができるようにしたファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法に関する。
立体視を実現する手法としてテクスチャ画像とデプス画像を用いる手法がある。デプス画像とは、各画素の被写体の奥行き方向の位置を表す値を画素値とする画像である。
このような手法では、自然な立体視を実現するために、追加情報としてオクルージョン画像を用いる場合がある。オクルージョン画像とは、テクスチャ画像には存在しない被写体、即ちテクスチャ画像の視点からは見えない被写体(例えば、前方の被写体によって隠れている被写体)の領域であるオクルージョン領域のテクスチャ画像である。テクスチャ画像とデプス画像だけでなく、オクルージョン画像も用いることにより、異なる視点から覗き込み等を行った場合の立体視を実現する3D画像を生成することができる。
テクスチャ画像とデプス画像は、例えば、既存のMPEG-DASH(Moving Picture Experts Group Dynamic Adaptive Streaming over HTTP standard)方式で伝送することができる(例えば、非特許文献1参照)。
この場合、DASHクライアントは、伝送路や自身のバッファ量を考慮して、DASHサーバに記憶されている複数のビットレートのデプス画像から、許容可能な最大のビットレートのデプス画像を選択して取得する。
しかしながら、デプス画像のビットレートによる3D画像の画質への影響が小さい場合や、デプス画像の画素値の変化量が小さい場合などでは、デプス画像のビットレートによって3D画像の画質があまり変化しない。従って、この場合、DASHクライアントが、許容可能な最大のビットレートのデプス画像を選択して取得すると、伝送路やバッファが無駄になる。
一方、ISO/IEC 23001-10において、テクスチャ画像の1以上の種類の品質を表す品質情報をISOベースメディアファイルフォーマットのMP4ファイルに格納することが提案されている。
ISO/IEC 23009-1 Dynamic adaptive streaming over HTTP(DASH) Part1:Media presentation description and segment formats,Apr.2012
以上により、少なくともデプス画像を含むデプス関連画像についても、テクスチャ画像と同様に品質情報をファイルに格納させ、DASHクライアントが、その品質情報を用いて適切なビットレートのデプス関連画像を取得することが望まれている。しかしながら、デプス関連画像の品質情報を効率的にファイルに格納することは考えられていない。
本開示は、このような状況に鑑みてなされたものであり、少なくともデプス画像を含むデプス関連画像の品質情報を効率的に格納するファイルを生成することができるようにするものである。
本開示の第1の側面のファイル生成装置は、少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルを生成するファイル生成部を備えるファイル生成装置である。
本開示の第1の側面のファイル生成方法は、本開示の第1の側面のファイル生成装置に対応する。
本開示の第1の側面においては、少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルが生成される。
本開示の第2の側面の再生装置は、少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルから、所定の種類の前記品質情報を取得する取得部を備える再生装置である。
本開示の第2の側面の再生方法は、本開示の第2の側面の再生装置に対応する。
本開示の第2の側面においては、少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルから、所定の種類の前記品質情報が取得される。
なお、本開示の第1の側面のファイル生成装置および第2の側面の再生装置は、コンピュータにプログラムを実行させることにより実現することができる。
また、本開示の第1の側面のファイル生成装置および第2の側面の再生装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
本開示の第1の側面によれば、ファイルを生成することができる。また、本開示の第1の側面によれば、少なくともデプス画像を含むデプス関連画像の品質情報を効率的に格納するファイルを生成することができる。
本開示の第2の側面によれば、少なくともデプス画像を含むデプス関連画像の品質情報を効率的に格納するファイルから品質情報を取得することができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本開示を適用した第1実施の形態における情報処理システムの概要を説明する図である。 オクルージョン画像を説明する図である。 MPDファイルの階層構造を説明する図である。 図1のファイル生成装置の構成例を示すブロック図である。 第1実施の形態におけるセグメントファイルの例を示す図である。 第1実施の形態におけるQualityMetricsSampleEntryの記述例を示す図である。 図6のQualityMetricsSampleEntryの記述内容を説明する図である。 metric_codeの例を示す図である。 第1実施の形態におけるMPDファイルのリプレゼンテーション要素の例を示す図である。 第1実施の形態におけるMPDファイルの記述例を示す図である。 第1実施の形態におけるlevaボックスを説明する図である。 ファイル生成処理を説明するフローチャートである。 ストリーミング再生部の構成例を示すブロック図である。 第1実施の形態における再生処理の第1の例を説明するフローチャートである。 第1実施の形態における再生処理の第2の例を説明するフローチャートである。 本開示を適用した情報処理システムの第2実施の形態におけるセグメントファイルの例を示す図である。 本開示を適用した情報処理システムの第3実施の形態におけるセグメントファイルの例を示す図である。 第3実施の形態におけるMPDファイルの記述例を示す図である。 第3実施の形態における再生処理の第1の例を説明するフローチャートである。 第3実施の形態における再生処理の第2の例を説明するフローチャートである。 本開示を適用した情報処理システムの第4実施の形態におけるセグメントファイルの例を示す図である。 本開示を適用した情報処理システムの第5実施の形態におけるセグメントファイルの例を示す図である。 本開示を適用した情報処理システムの第6実施の形態におけるセグメントファイルの例を示す図である。 第6実施の形態におけるMPDファイルの記述例を示す図である。 本開示を適用した情報処理システムの第7実施の形態におけるセグメントファイルの例を示す図である。 図25のトラックのサンプルの構成例を示す図である。 デプスファイルのmoovボックスの構成例を示す図である。 QualityMetricsConfigurationBoxの記述例を示す図である。 第7実施の形態におけるQualityMetricsSampleEntryに記述される場合のQualityMetricsSampleEntryの記述例を示す図である。 SubsampleInformationBoxの記述例を示す図である。 SubsampleReferenceBoxの記述例を示す図である。 第7実施の形態におけるMPDファイルの記述例を示す図である。 本開示を適用した情報処理システムの第8実施の形態におけるセグメントファイルの例を示す図である。 levaボックスの第1の記述例を示す図である。 図34のlevaボックスにより対応付けられるレベルとサブサンプルの第1の例を説明する図である。 levaボックスの第2の記述例を示す図である。 図36のlevaボックスにより対応付けられるレベルとサブサンプルの第2の例を説明する図である。 サブサンプルグループエントリの記述例を示す図である。 levaボックスにより対応付けられるレベルとサブサンプルの第3の例を説明する図である。 コンピュータのハードウエアの構成例を示すブロック図である。
以下、本開示を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.第1実施の形態:情報処理システム(図1乃至図15)
2.第2実施の形態:情報処理システム(図16)
3.第3実施の形態:情報処理システム(図17乃至図20)
4.第4実施の形態:情報処理システム(図21)
5.第5実施の形態:情報処理システム(図22)
6.第6実施の形態:情報処理システム(図23および図24)
7.第7実施の形態:情報処理システム(図25乃至図32)
8.第8実施の形態:情報処理システム(図33および図39)
9.第9実施の形態:コンピュータ(図40)
<第1実施の形態>
(情報処理システムの概要)
図1は、本開示を適用した第1実施の形態における情報処理システムの概要を説明する図である。
図1の情報処理システム10は、ファイル生成装置11に接続するDASHサーバとしてのWebサーバ12と、DASHクライアントとしての動画再生端末14とが、インターネット13を介して接続されることにより構成される。
情報処理システム10では、MPEG−DASHに準ずる方式で、Webサーバ12が、ファイル生成装置11により生成された動画コンテンツのファイルを、動画再生端末14に配信する。
具体的には、ファイル生成装置11は、動画コンテンツのテクスチャ画像、デプス画像、オクルージョン画像の画像データ、音声データ、デプス画像とオクルージョン画像の品質情報を含むメタデータ等を、それぞれ、1以上のビットレートで符号化する。
本明細書では、テクスチャ画像のビットレートが8Mbpsと4Mbpsの2種類であり、デプス画像のビットレートが、2Mbpsと1Mpbsの2種類であり、オクルージョン画像のビットレートが1Mpbsの1種類であるものとする。また、以下では、デプス画像とオクルージョン画像を特に区別する必要がない場合、それらをまとめてデプスオクルージョン画像という。
ファイル生成装置11は、符号化の結果生成された各ビットレートの画像データおよび音声データの符号化ストリームを、セグメントと呼ばれる数秒から10秒程度の時間単位で、ISOベースメディアファイルフォーマットでファイル化する。ファイル生成装置11は、その結果生成された画像データおよび音声データのMP4ファイルであるセグメントファイルを、Webサーバ12にアップロードする。
また、ファイル生成装置11は、セグメント単位のデプスオクルージョン画像の品質情報を含むメタデータの符号化ストリームを、デプスオクルージョン画像の種類ごとに分割してISOベースメディアファイルフォーマットでファイル化する。ファイル生成装置11は、その結果生成されたメタデータのセグメントファイルを、Webサーバ12にアップロードする。
ファイル生成装置11はまた、動画コンテンツのセグメントファイル群を管理するMPD(Media Presentation Description)ファイル(管理ファイル)を生成する。ファイル生成装置11は、MPDファイルをWebサーバ12にアップロードする。
Webサーバ12は、ファイル生成装置11からアップロードされたセグメントファイルとMPDファイルを格納する。Webサーバ12は、動画再生端末14からの要求に応じて、格納しているセグメントファイルやMPDファイルを動画再生端末14に送信する。
動画再生端末14(再生装置)は、ストリーミングデータの制御用ソフトウエア(以下、制御用ソフトウエアという)21、動画再生ソフトウエア22、HTTP(HyperText Transfer Protocol)アクセス用のクライアント・ソフトウエア(以下、アクセス用ソフトウエアという)23などを実行する。
制御用ソフトウエア21は、Webサーバ12からストリーミングするデータを制御するソフトウエアである。具体的には、制御用ソフトウエア21は、動画再生端末14にWebサーバ12からMPDファイルを取得させる。
また、制御用ソフトウエア21は、MPDファイルと、動画再生ソフトウエア22により指定される再生対象の時刻、ビットレート等を表す再生対象情報とに基づいて、再生対象のセグメントファイルの符号化ストリームの送信要求を、アクセス用ソフトウエア23に指令する。
動画再生ソフトウエア22は、Webサーバ12から取得された符号化ストリームを再生するソフトウエアである。具体的には、動画再生ソフトウエア22は、メタデータの符号化ストリームを再生対象とする再生対象情報を制御用ソフトウエア21に指定する。そして、動画再生ソフトウエア22は、アクセス用ソフトウエア23からメタデータの符号化ストリームの受信開始の通知を受信したとき、動画再生端末14により受信されたメタデータの符号化ストリームを復号する。
動画再生ソフトウエア22は、復号の結果得られるメタデータに含まれる品質情報、インターネット13のネットワーク帯域などに基づいて、所定のビットレートの画像データや音声データの符号化ストリームを再生対象とする再生対象情報を制御用ソフトウエア21に指定する。そして、動画再生ソフトウエア22は、アクセス用ソフトウエア23から画像データや音声データの符号化ストリームの受信開始の通知を受信したとき、動画再生端末14により受信された画像データや音声データの符号化ストリームを復号する。
動画再生ソフトウエア22は、復号の結果得られるテクスチャ画像の画像データをそのまま出力する。または、動画再生ソフトウエア22は、テクスチャ画像とデプス画像を用いて3D画像の画像データを生成し、出力する。または、動画再生ソフトウエア22は、テクスチャ画像、デプス画像、およびオクルージョン画像を用いて3D画像の画像データを生成し、出力する。また、動画再生ソフトウエア22は、復号の結果得られる音声データを出力する。
アクセス用ソフトウエア23は、HTTPを用いたインターネット13を介したWebサーバ12との通信を制御するソフトウエアである。具体的には、アクセス用ソフトウエア23は、制御用ソフトウエア21の指令に応じて、再生対象のセグメントファイルの符号化ストリームの送信要求を、動画再生端末14に送信させる。また、アクセス用ソフトウエア23は、その送信要求に応じてWebサーバ12から送信されてくる符号化ストリームの受信を動画再生端末14に開始させ、受信開始の通知を動画再生ソフトウエア22に供給する。
なお、本開示は、動画コンテンツの画像データおよびメタデータに関する発明であるので、以下では、音声データのセグメントファイルの格納および再生についての説明は省略する。
(オクルージョン画像の説明)
図2は、オクルージョン画像を説明する図である。
図2の上段の円柱41と立方体42が、矢印51が示す正面方向から撮影されると、図2の下段の左側のテクスチャ画像61が得られる。
このテクスチャ画像61とテクスチャ画像61のデプス画像とを用いて、矢印52が示す左から覗き込む方向から撮影されるテクスチャ画像62を生成する場合、まず、テクスチャ画像61のデプス画像に基づいて、テクスチャ画像62の各画素に対応するテクスチャ画像61の画素値が取得される。そして、テクスチャ画像62の各画素の画素値を、その画素に対応するテクスチャ画像61の画素値とすることにより、テクスチャ画像62が生成される。
しかしながら、図2の下段の右側に示すように、テクスチャ画像62には、対応するテクスチャ画像61が存在しない、即ち、矢印51が示す方向から撮影する際には撮影されないが、矢印52が示す方向から撮影する際には撮影される被写体(図2の例では、立方体42の側面)の領域であるオクルージョン領域43が発生する。このオクルージョン領域43のテクスチャ画像が、オクルージョン画像である。
従って、テクスチャ画像61、テクスチャ画像61のデプス画像、およびオクルージョン領域43のテクスチャ画像を用いることにより、テクスチャ画像61とは異なる視点のテクスチャ画像62を生成することができる。また、このテクスチャ画像62とテクスチャ画像61のデプス画像から、テクスチャ画像62のデプス画像を生成することができる。よって、テクスチャ画像62とテクスチャ画像62のデプス画像から、テクスチャ画像61とは異なる視点の3D画像を生成することができる。
(MPDファイルの説明)
図3は、MPDファイルの階層構造を説明する図である。
MPDファイルには、動画コンテンツの符号化方式やビットレート、画像のサイズ、音声の言語などの情報が階層化されて、XML形式で記述される。
具体的には、図3に示すように、MPDファイルには、ピリオド(Period)、アダプテーションセット(AdaptationSet)、リプレゼンテーション(Representation)、セグメントインフォ(SegmentInfo)等の要素が階層的に含まれている。
MPDファイルでは、自分が管理する動画コンテンツが所定の時間範囲(例えば、番組、CM(Commercial)などの単位)で分割される。ピリオド要素は、分割された動画コンテンツごとに記述される。ピリオド要素は、動画コンテンツのプログラム(同期を取った1組の画像データや音声データなどのデータ)の再生開始時刻、動画コンテンツのセグメントファイルを格納するWebサーバ12のURL(Uniform Resource Locator)などの情報を有する。
アダプテーションセット要素は、ピリオド要素に含まれ、そのピリオド要素に対応する動画コンテンツの同一の符号化ストリームのセグメントファイル群に対応するリプレゼンテーション要素をグルーピングする。リプレゼンテーション要素は、例えば、対応する符号化ストリームのデータの種類によってグルーピングされる。アダプテーションセット要素は、グループに共通のメディア種別、言語、字幕または吹き替えなどの用途を有する。
リプレゼンテーション要素は、それをグルーピングするアダプテーションセット要素に含まれ、上位層のピリオド要素に対応する動画コンテンツの同一の符号化ストリームのセグメントファイル群ごとに記述される。リプレゼンテーション要素は、セグメントファイル群に共通のビットレート、画像のサイズなどを有する。
セグメントインフォ要素は、リプレゼンテーション要素に含まれ、そのリプレゼンテーションに対応するセグメントファイル群の各セグメントファイルに関する情報を有する。
(ファイル生成装置の構成例)
図4は、図1のファイル生成装置の構成例を示すブロック図である。
図4のファイル生成装置11は、取得部81、符号化部82、セグメントファイル生成部83、MPDファイル生成部84、およびアップロード部85により構成される。
ファイル生成装置11の取得部81は、動画コンテンツのテクスチャ画像、デプス画像、およびオクルージョン画像の画像データを取得し、符号化部82に供給する。また、取得部81は、2Mbpsと1Mbpsのデプス画像および1Mbpsのオクルージョン画像の符号化ストリームの品質情報を含むメタデータを取得し、符号化部82に供給する。
符号化部82は、取得部81から供給されるテクスチャ画像の画像データを8Mbpsと4Mbpsで符号化し、デプス画像の画像データを2Mbpsと1Mbpsで符号化する。また、符号化部82は、オクルージョン画像の画像データを1Mbpsで符号化する。さらに、符号化部82は、2Mbpsと1Mbpsのデプス画像および1Mbpsのオクルージョン画像のメタデータを、それぞれ、所定のビットレートで符号化する。符号化部82は、符号化の結果生成された符号化ストリームをセグメントファイル生成部83に供給する。
セグメントファイル生成部83は、符号化部82から供給されるテクスチャ画像、デプス画像、およびオクルージョン画像の符号化ストリームを、ビットレートごとにセグメント単位でファイル化し、画像データのセグメントファイルを生成する。
また、セグメントファイル生成部83(ファイル生成部)は、符号化部82から供給されるメタデータの符号化ストリームを、デプスオクルージョン画像の種類ごとに2つに分割する。そして、セグメントファイル生成部83は、セグメント単位で、分割されたメタデータの符号化ストリームを異なるセグメントファイルに配置することによりメタデータのセグメントファイルを生成する。
具体的には、セグメントファイル生成部83は、符号化部82から供給されるメタデータの符号化ストリームを、2Mbpsと1Mbpsのデプス画像のセグメント単位のメタデータの符号化ストリームと、1Mbpsのオクルージョン画像のセグメント単位のメタデータの符号化ストリームとに分割する。そして、セグメントファイル生成部83は、2Mbpsと1Mbpsのデプス画像のセグメント単位のメタデータの符号化ストリームと、1Mbpsのオクルージョン画像のセグメント単位のメタデータの符号化ストリームとを別々にファイル化し、メタデータのセグメントファイルを生成する。セグメントファイル生成部83は、生成されたセグメントファイルをアップロード部85に供給する。
MPDファイル生成部84(ファイル生成部)は、MPDファイルを生成し、アップロード部85に供給する。
アップロード部85は、セグメントファイル生成部83から供給されるセグメントファイルと、MPDファイル生成部84から供給されるMPDファイルとを、Webサーバ12にアップロードする。
(セグメントファイルの例)
図5は、図4のセグメントファイル生成部83により生成されるセグメントファイルの例を示す図である。
図5に示すように、セグメントファイル生成部83は、8Mbpsのテクスチャ画像のセグメントファイルをテクスチャファイル(texture1 file)として生成し、4Mbpsのテクスチャ画像のセグメントファイルをテクスチャファイル(texture2 file)として生成する。また、セグメントファイル生成部83は、2Mbpsのデプス画像のセグメントファイルをデプスファイル(depth1 file)として生成し、1Mpbsのデプス画像のセグメントファイルをデプスファイル(depth2 file)として生成する。さらに、セグメントファイル生成部83は、1Mpbsのオクルージョン画像のセグメントファイルをオクルージョンファイル(occlusion1 file)として生成する。
また、セグメントファイル生成部83は、2Mbpsおよび1Mpbsのデプス画像の品質情報を含むメタデータのセグメントファイルを、クオリティファイル(quality1 file)として生成する。クオリティファイル(quality1 file)では、2Mbpsのデプス画像の品質情報を含むメタデータと、1Mpbsのデプス画像の品質情報を含むメタデータが、異なるトラック(quality track(depth1),quality track(depth2))に配置される。
さらに、セグメントファイル生成部83は、1Mpbsのオクルージョン画像の品質情報を含むメタデータのセグメントファイルを、クオリティファイル(quality2 file)として生成する。
以上のように、セグメントファイル生成部83は、品質情報を含むメタデータの符号化ストリームを、デプスオクルージョン画像の種類ごとに別々にファイル化する。従って、動画再生端末14が、テクスチャ画像とデプス画像を用いて3D画像を生成する場合、デプス画像のクオリティファイル(quality1 file)から所望のデプス画像の品質情報を容易に取得することができる。
これに対して、全てのデプスオクルージョン画像の品質情報の符号化ストリームが、まとめてファイル化される場合、不要なオクルージョン画像の品質情報も含むファイルから所望のデプス画像の品質情報を取得することになり、取得効率が悪い。
また、全てのデプスオクルージョン画像の品質情報の符号化ストリームが、符号化ストリームごとに別々にファイル化される場合、複数の所望のデプスオクルージョン画像を取得する際、複数のファイルから品質情報を取得する必要があり、取得効率が悪い。
なお、取得部81は、8Mbpsと4Mbpsのテクスチャ画像の品質情報を含むメタデータを取得しないようにしたが、取得するようにしてもよい。この場合、セグメントファイル生成部83は、8Mbpsと4Mbpsのテクスチャ画像の品質情報を含むメタデータの符号化ストリームがセグメント単位でまとめて格納されるセグメントファイルも生成する。また、8Mbpsのテクスチャ画像のメタデータと4Mbpsのテクスチャ画像のメタデータは、異なるトラックに配置される。
(QualityMetricsSampleEntryの記述例)
図6は、クオリティファイルに配置されるQualityMetricsSampleEntryの記述例を示す図である。
図6に示すように、QualityMetricsSampleEntryには、QulityMetricsConfigurationBoxが配置される。QualityMetricsConfigurationBoxには、field_size_bytesとmetric_countが記述され、metric_count分だけmetric_codeが記述される。
図7に示すように、field_size_bytesは、クオリティファイルのサンプルに含まれる品質情報の符号化ストリームの1種類の品質(Quality)あたりのデータサイズである。ある種類の品質情報の符号化ストリームの実サイズがfield_size_bytesより小さい場合には、その品質情報の符号化ストリームにパディングが付加される。
また、metric_countは、クオリティファイルのサンプルに含まれる品質情報の符号化ストリームに対応する品質の種類数である。metric_codeは、クオリティファイルのサンプルに含まれる品質情報の符号化ストリームに対応する各品質の種類を表す情報であり、サンプルに配置される品質情報の符号化ストリームの順に記述される。
(metric_codeの例)
図8は、metric_codeの例を示す図である。
図8に示すように、metric_codeとしては、ISO/IEC 23001-10において定義されているpsnr,ssim,msim,j144,j247,mops,fsigだけでなく、ocerやocprも設定可能になっている。
例えば、psnrは、品質情報が表す品質の種類が画面全体のPSNR(Peak signal-to-noise ratio)であることを表している。
また、ocerとocprは、オクルージョン画像の品質情報がサンプルに含まれるときに設定される。ocerは、品質情報が表す品質の種類が、テクスチャ画像の画面全体に対する、オクルージョン画像に対応するオクルージョン領域、即ちオクルージョン領域の有効範囲の割合であることを表している。ocprは、品質情報が表す品質の種類が、オクルージョン画像のみのPSNR、即ちオクルージョン領域の有効範囲のみのPSNRであることを表している。
以上のように、オクルージョン画像の品質情報がサンプルに含まれる場合、metric_codeとしてocerやocprを設定することができる。従って、オクルージョン領域の割合やPSNRを表す品質情報をサンプルに格納することができる。よって、動画再生端末14は、この品質情報に基づいて、最適なオクルージョンファイルを選択し、再生することができる。
即ち、オクルージョン画像は、画面内のオクルージョン領域のみの画像であるため、画面全体のPSNRなどの既存の品質に与える影響が少ない可能性がある。従って、既存の品質情報では、オクルージョン画像の品質を十分に表すことはできない。よって、オクルージョン画像の品質に大きな影響を与えるオクルージョン領域の割合やPSNRを品質として表す品質情報をサンプルに格納可能にすることにより、動画再生端末14が、品実情報に基づいて、より適したオクルージョンファイルを選択することを可能にする。
(リプレゼンテーション要素の例)
図9は、図4のMPDファイル生成部84により生成されるMPDファイルのリプレゼンテーション要素の例を示す図である。
図5に示したように、セグメントファイル生成部83は、テクスチャファイル(texture1 file)、テクスチャファイル(texture2 file)、デプスファイル(depth1 file)、デプスファイル(depth2 file)、オクルージョンファイル(occlusion1 file)、クオリティファイル(quality1 file(depth))、およびクオリティファイル(quality2 file(occlusion))の7種類のセグメントファイルを生成する。従って、図9に示すように、MPDファイルでは、7つのリプレゼンテーション要素が含まれる。
(MPDファイルの記述例)
図10は、図4のMPDファイル生成部84により生成されるMPDファイルの記述例を示す図である。
なお、本明細書では、テクスチャファイル(texture2 file)の再生時に、デプスファイル(depth1 file)やオクルージョンファイル(occlusion file)を用いても、3D画像の画質が向上しないものとする。従って、テクスチャファイル(texture2 file)と、デプスファイル(depth1 file)やオクルージョンファイル(occlusion file)とを用いた3D画像の再生はすべきでない。よって、下記の再生パターン1乃至7のみが再生すべきパターンである。
再生パターン1.テクスチャファイル(texture1 file)のテクスチャ画像の再生
再生パターン2.テクスチャファイル(texture2 file)のテクスチャ画像の再生
再生パターン3.テクスチャファイル(texture1 file)とデプスファイル(depth1 file)を用いた3D画像の再生
再生パターン4.テクスチャファイル(texture1 file)とデプスファイル(depth2 file)を用いた3D画像の再生
再生パターン5.テクスチャファイル(texture1 file)、デプスファイル(depth1 file)、およびオクルージョンファイル(occlusion file)を用いた3D画像の再生
再生パターン6.テクスチャファイル(texture1 file)、デプスファイル(depth2 file)、およびオクルージョンファイル(occlusion file)を用いた3D画像の再生
再生パターン7.テクスチャファイル(texture2 file)とデプスファイル(depth2 file)を用いた3D画像の再生
図10のMPDファイルでは、テクスチャファイル(texture1 file)群とテクスチャファイル(texture2 file)群が1つのアダプテーションセット(AdaptationSet)要素でグルーピングされる。
このテクスチャファイル用のアダプテーションセット要素には、テクスチャファイル(texture1 file)群に対応するリプレゼンテーション要素と、テクスチャファイル(texture2 file)群に対応するリプレゼンテーション要素が記述される。
リプレゼンテーション要素は、Representation id, bandwidth, BaseURL, associationIDなどを有する。Representation idは、リプレゼンテーション要素に固有のIDであり、リプレゼンテーション要素に対応する符号化ストリームを特定する情報である。bandwidthは、テクスチャファイル群のビットレートを表す情報であり、BaseURLは、ファイル名のベースを表す情報である。また、associationIDは、復号や表示(再生)時に関係する他のリプレゼンテーション要素のRepresentation idである。このassociationIDは、ISO/IEC 23009-1 Amendment2で規定されている。
従って、テクスチャファイル(texture1 file)群に対応するリプレゼンテーション要素には、Representation idとしてvt1が記述され、bandwidthとして8Mbpsを表す8192000が記述され、BaseURLとして「texture1.mp4」が記述される。
テクスチャファイル(texture2 file)群に対応するリプレゼンテーション要素には、Representation idとしてvt2が記述され、bandwidthとして4Mbpsを表す4096000が記述され、BaseURLとして「texture2.mp4」が記述される。
なお、テクスチャファイル(texture1 file)群およびテクスチャファイル(texture2 file)群に対応するリプレゼンテーション要素は他のリプレゼンテーション要素と関係していないため、テクスチャファイル(texture1 file)群およびテクスチャファイル(texture2 file)群に対応するリプレゼンテーション要素には、associationIDは記述されない。
また、デプスファイル(depth1 file)群とデプスファイル(depth2 file)群が1つのアダプテーションセット要素でグルーピングされる。このデプスファイル用のアダプテーションセット要素には、デプスファイル(depth1 file)群に対応するリプレゼンテーション要素と、デプスファイル(depth2 file)群に対応するリプレゼンテーション要素が記述される。
デプスファイル(depth1 file)群に対応するリプレゼンテーション要素には、Representation idとしてvd1が記述され、bandwidthとして2Mbpsを表す2048000が記述され、BaseURLとして「depth1.mp4」が記述される。
また、再生パターン1乃至7においてデプスファイル(depth1 file)の表示時に関係するテクスチャファイル群は、テクスチャファイル(texture1 file)群である。従って、デプスファイル(depth1 file)群に対応するリプレゼンテーション要素には、associationIDとしてテクスチャファイル(texture1 file)群のRepresentation idであるvt1が記述される。
デプスファイル(depth2 file)群に対応するリプレゼンテーション要素には、Representation idとしてvd2が記述され、bandwidthとして1Mbpsを表す1024000が記述され、BaseURLとして「depth2.mp4」が記述される。
また、再生パターン1乃至7においてデプスファイル(depth2 file)の表示時に関係するテクスチャ画像のテクスチャファイル群は、テクスチャファイル(texture1 file)群またはテクスチャファイル(texture2 file)群である。従って、デプスファイル(depth1 file)群に対応するリプレゼンテーション要素には、associationIDとしてテクスチャファイル(texture1 file)群のRepresentation idであるvt1およびテクスチャファイル(texture2 file)群のRepresentation idであるvt2が記述される。
さらに、オクルージョンファイル(occlusion1 file)群が1つのアダプテーションセット要素でグルーピングされる。このオクルージョンファイル用のアダプテーションセット要素には、オクルージョンファイル(occlusion file)群に対応するリプレゼンテーション要素が記述される。
オクルージョンファイル(occlusion file)群に対応するリプレゼンテーション要素には、Representation idとしてvo1が記述され、bandwidthとして1Mbpsを表す1024000が記述され、BaseURLとして「occlusion.mp4」が記述される。
また、再生パターン1乃至7においてオクルージョンファイル(occlusion file)の表示時に関係するデプス画像のデプスファイル群は、デプスファイル(depth1 file)群またはデプスファイル(depth2 file)群である。従って、オクルージョンファイル(occlusion file)群に対応するリプレゼンテーション要素には、associationIDとしてデプスファイル(depth1 file)群のRepresentation idであるvd1とデプスファイル(depth2 file)群のRepresentation idであるvd2が記述される。
また、クオリティファイル(quality1 file)群とクオリティファイル(quality2 file)群が1つのアダプテーションセット要素でグルーピングされる。
クオリティファイル用のアダプテーションセット要素には、SupplementalPropertyを用いて、テクスチャ画像、デプス画像、およびオクルージョン画像のうちの、再生すべき画像の組み合わせ、即ち再生時に使用候補となる画像の組み合わせを表すためのschemeIdUriである schemeIdUri=“urn:mpeg:dash:quality:playback:combination:2015”が記述可能になっている。schemeIdUri=“urn:mpeg:dash:quality:playback:combination:2015”のvalueとして、組み合わせを構成する画像のRepresentation idが記述される。
具体的には、上述した再生パターン1の再生に用いられるテクスチャ画像を表す情報として、テクスチャファイル(texture1 file)のRepresentation idであるvt1をvalueとする<SupplementalProperty schemeIdUri=”urn:mpeg:dash:quality:playback:combination:2015 value=”vt1””>が記述される。
同様に、再生パターン3の再生に用いられるテクスチャ画像とデプス画像を表す情報として、テクスチャファイル(texture1 file)のRepresentation idであるvt1とデプスファイル(depth1 file)のRepresentation idであるvd1をvalueとする<SupplementalProperty schemeIdUri=”urn:mpeg:dash:quality:playback:combination:2015 value=”vt1 vd1””>が記述される。
再生パターン4の再生に用いられるテクスチャ画像とデプス画像を表す情報として、テクスチャファイル(texture1 file)のRepresentation idであるvt1とデプスファイル(depth2 file)のRepresentation idであるvd2をvalueとする<SupplementalProperty schemeIdUri=”urn:mpeg:dash:quality:playback:combination:2015 value=”vt1 vd2””>が記述される。
再生パターン5の再生に用いられるテクスチャ画像、デプス画像、およびオクルージョン画像を表す情報として、テクスチャファイル(texture1 file)のRepresentation idであるvt1、デプスファイル(depth1 file)のRepresentation idであるvd1、およびオクルージョンファイル(occlusion file)のRepresentation idであるvo1をvalueとする<SupplementalProperty schemeIdUri=”urn:mpeg:dash:quality:playback:combination:2015 value=”vt1 vd1 vo1””>が記述される。
再生パターン6の再生に用いられるテクスチャ画像、デプス画像、およびオクルージョン画像を表す情報として、テクスチャファイル(texture1 file)のRepresentation idであるvt1、デプスファイル(depth2 file)のRepresentation idであるvd2、およびオクルージョンファイル(occlusion file)のRepresentation idであるvo1をvalueとする<SupplementalProperty schemeIdUri=”urn:mpeg:dash:quality:playback:combination:2015 value=”vt1 vd2 vo1””>が記述される。
再生パターン2の再生に用いられるテクスチャ画像を表す情報として、テクスチャファイル(texture1 file)のRepresentation idであるvt2をvalueとする<SupplementalProperty schemeIdUri=”urn:mpeg:dash:quality:playback:combination:2015”>が記述される。
再生パターン7の再生に用いられるテクスチャ画像とデプス画像を表す情報として、テクスチャファイル(texture2 file)のRepresentation idであるvt2とデプスファイル(depth2 file)のRepresentation idであるvd2をvalueとする<SupplementalProperty schemeIdUri=”urn:mpeg:dash:quality:playback:combination:2015”>が記述される。
以上のように、MPDファイルには、再生すべきパターンにおいて用いられる画像の組み合わせを構成する画像のRepresentation idが記述される。従って、動画再生端末14は、MPDファイルを参照して再生を行うことにより、再生すべきパターン以外のパターンで再生を行わないようにすることができる。
また、クオリティファイル用のアダプテーションセット要素には、クオリティファイル(quality1 file)群とクオリティファイル(quality2 file)群のそれぞれに対応するリプレゼンテーション要素が記述される。
クオリティファイル(quality1 file(depth))群に対応するリプレゼンテーション要素には、Representation idとしてvq1が記述され、BaseURLとして「quality1.mp4」が記述される。
また、クオリティファイル(quality1 file)に格納される品質情報は、デプスファイル(depth1 file)とデプスファイル(depth2 file)に格納されるデプス画像の品質情報である。従って、クオリティファイル(quality1 file)群に対応するリプレゼンテーション要素には、associationIDとしてデプスファイル(depth1 file)群のRepresentation idであるvd1とデプスファイル(depth2 file)群のRepresentation idであるvd2が記述される。
これにより、動画再生端末14は、クオリティファイル(quality1 file)群に格納される品質情報が、デプスファイル(depth1 file)群とデプスファイル(depth2 file)群に対応するデプス画像の品質情報であることを認識することができる。
しかしながら、クオリティファイル(quality1 file)の2つのトラックのうちのいずれのトラックに格納されている品質情報が、デプスファイル(depth1 file)群またはデプスファイル(depth2 file)群に格納されるデプス画像の品質情報であるかを認識することはできない。
従って、図10のMPDファイルでは、トラックと対応付けることが可能なレベルごとにリプレゼンテーション要素を分割したサブリプレゼンテーション(SubRepresentation)要素が拡張され、サブリプレゼンテーション要素が、Representation要素と同様にassociationIdを有することを可能にする。これにより、クオリティファイル(quality1 file)の各トラックと、デプス画像を特定するRepresentationID(デプス関連画像特定情報)との対応関係を記述することができる。
具体的には、図10の例では、クオリティファイル(quality1 file)に配置されるlevaボックス(LevelAssignmentBox)により、レベル1にデプスファイル(depth1 file)に格納されるデプス画像の品質情報を格納するトラックが対応付けられている。また、レベル2にデプスファイル(depth2 file)に格納されるデプス画像の品質情報を格納するトラックが対応付けられている。
従って、レベル1と、associationIDとしてのデプスファイル(depth1 file)のRepresentation idであるvd1とを対応付ける<SubRepresentation level=”1” associationId=”vd1”>が記述される。また、レベル2と、associationIDとしてのデプスファイル(depth2 file)のRepresentation idであるvd2とを対応付ける<SubRepresentation level=”2” associationId=”vd2”>が記述される。
また、クオリティファイル(quality2 file)群に対応するリプレゼンテーション要素には、Representation idとしてvq2が記述され、BaseURLとして「quality2.mp4」が記述される。
クオリティファイル(quality2 file)に格納されるメタデータに含まれる品質情報は、オクルージョンファイル(occlusion file)に格納されるオクルージョン画像の品質情報である。従って、クオリティファイル(quality1 file)群に対応するリプレゼンテーション要素には、associationIDとしてオクルージョンファイル(occlusion file)群のRepresentation idであるvo1が記述される。
なお、図10の例では、クオリティファイル用のアダプテーションセット要素には、bandwidthが記述されないが、記述されるようにしてもよい。
(levaボックスの説明)
図11は、MPDファイルが図10のMPDファイルである場合にクオリティファイル(quality1 file)に配置されるlevaボックスを説明する図である。
図11に示すように、複数のトラックを有するクオリティファイル(quality1 file)には、levaボックス(Level assignment box)が配置される。このlevaボックスでは、レベル1から順に、そのレベルに対応するトラックを特定する情報が記述されることにより、レベルとトラックの対応関係が記述される。
従って、動画再生端末14は、levaボックスにより、MPDファイルのサブリプレゼンテーション要素が有するassociationIDに対応するトラックを特定することができる。具体的には、動画再生端末14は、vd1であるassociationIDに対応するトラックを、レベル1に対応する先頭から1番目のトラック(quality track(depth1))に特定することができる。また、動画再生端末14は、vd2であるassociationIDに対応するトラックを、レベル2に対応する先頭から2番目のトラック(quality track(depth2))に特定することができる。
(ファイル生成装置の処理の説明)
図12は、図1のファイル生成装置11のファイル生成処理を説明するフローチャートである。
図12のステップS11において、ファイル生成装置11の取得部81は、動画コンテンツのテクスチャ画像、デプス画像、およびオクルージョン画像の画像データ、並びに、2Mbpsと1Mbpsのデプス画像および1Mbpsのオクルージョン画像の符号化ストリームの品質情報を含むメタデータを取得する。そして、取得部81は、取得された画像データとメタデータを符号化部82に供給する。
ステップS12において、符号化部82は、取得部81から供給されるテクスチャ画像の画像データを8Mbpsと4Mbpsで符号化し、デプス画像の画像データを2Mbpsと1Mbpsで符号化する。また、符号化部82は、オクルージョン画像の画像データを1Mbpsで符号化する。さらに、符号化部82は、2Mbpsと1Mbpsのデプス画像および1Mbpsのオクルージョン画像のメタデータを、それぞれ、所定のビットレートで符号化する。符号化部82は、符号化の結果生成された符号化ストリームをセグメントファイル生成部83に供給する。
ステップS13において、セグメントファイル生成部83は、符号化部82から供給されるテクスチャ画像、デプス画像、およびオクルージョン画像の符号化ストリームを、ビットレートごとにセグメント単位でファイル化する。セグメントファイル生成部83は、その結果生成されたテクスチャファイル、デプスファイル、およびオクルージョンファイルをアップロード部85に供給する。
ステップS14において、セグメントファイル生成部83は、符号化部82から供給されるメタデータの符号化ストリームを、デプスオクルージョン画像の種類ごとに2つに分割する。
ステップS15において、セグメントファイル生成部83は、セグメント単位で、分割されたメタデータの符号化ストリームを異なるクオリティファイルに配置することによりクオリティファイルを生成し、アップロード部85に供給する。
ステップS16において、MPDファイル生成部84は、MPDファイルを生成し、アップロード部85に供給する。ステップS17において、アップロード部85は、テクスチャファイル、デプスファイル、オクルージョンファイル、クオリティファイル、およびMPDファイルを、Webサーバ12にアップロードする。
以上のように、ファイル生成装置11は、デプスオクルージョン画像の品質情報を、デプスオクルージョン画像の種類ごとに分割して異なるクオリティファイルに配置する。従って、デプスオクルージョン画像ごとに異なるクオリティファイルに品質情報が配置される場合に比べて、クオリティファイルの数を削減することができる。よって、デプスオクルージョン画像の品質情報を効率的に格納することができるといえる。また、動画再生端末14の品質情報の取得に関する処理量を削減することができる。
また、動画再生端末14は、テクスチャ画像とデプス画像を再生に用いる場合、デプス画像の品質情報のみを格納するクオリティファイル(quality1 file)から品質情報を取得することができる。従って、全てのデプスオクルージョン画像の品質情報を格納するクオリティファイルから品質情報を取得する場合に比べて、品質情報の取得効率を向上させることができる。
さらに、ファイル生成装置11は、サブリプレゼンテーション要素にassociationIdを記述するMPDファイルを生成する。これにより、MPDファイルは、複数のデプスオクルージョン画像の品質情報のそれぞれが異なるトラックに分割して配置されるクオリティファイルの各トラックとデプスオクルージョン画像の対応関係を管理することができる。その結果、動画再生端末14は、複数のデプスオクルージョン画像の品質情報のそれぞれが異なるトラックに分割して配置されるクオリティファイルから、各デプスオクルージョン画像の品質情報を抽出することができる。
また、ファイル生成装置11は、再生すべきパターンの再生に用いられる画像の組み合わせを記述したMPDファイルを生成するので、動画再生端末14に再生すべきパターンの再生のみを行わせることができる。その結果、例えば、動画コンテンツの製作者は、自分が意図した品質の画像をユーザに提供することができる。また、動画再生端末14は、再生すべきパターンから再生パターンを選択すればよいため、再生可能な全ての再生パターンから再生パターンを選択する場合に比べて、処理負荷が軽減される。
(動画再生端末の機能的構成例)
図13は、図1の動画再生端末14が制御用ソフトウエア21、動画再生ソフトウエア22、およびアクセス用ソフトウエア23を実行することにより実現されるストリーミング再生部の構成例を示すブロック図である。
ストリーミング再生部100は、MPD取得部101、MPD処理部102、品質情報取得部103、復号部104、画像取得部105、復号部106、出力制御部107、および計測部108により構成される。
ストリーミング再生部100のMPD取得部101は、MPDファイルをWebサーバ12に要求し、取得する。MPD取得部101は、取得されたMPDファイルをMPD処理部102に供給する。
MPD処理部102は、MPD取得部101から供給されるMPDファイルを解析する。具体的には、MPD処理部102は、MPDファイルの各Representation要素が有するbandwidthを、そのRepresentation要素に対応する画像のビットレートとして取得する。
また、MPD処理部102は、MPDファイルのschemeIdUri=“urn:mpeg:dash:quality:playback:combination:2015”のvalueと、各Representation要素が有するRepresentation idから、再生すべきパターンの再生に用いられる画像の組み合わせを取得する。さらに、MPD処理部102は、MPDファイルの各Representation要素が有するBaseURLやサブリプレゼンテーション要素のassociationId等から、そのRepresentation要素に対応するセグメントファイル群のファイル名、各デプスオクルージョン画像の品質情報に対応するレベル等の取得情報を取得する。
MPD処理部102は、再生すべきパターンの中から再生パターンの候補を選択する。MPD処理部102は、再生パターンの候補、計測部108から供給されるインターネット13のネットワーク帯域、および画像のビットレートに基づいて、デプスオクルージョン画像の取得候補のリストを作成する。MPD処理部102は、そのリストに登録されているデプスオクルージョン画像の品質情報の取得情報を、品質情報取得部103に供給する。
例えば、デプスオクルージョン画像の取得候補のリストにデプス画像が登録されている場合、MPD処理部102は、クオリティファイル(quality1 file)内の、リストに登録されているデプス画像の品質情報の取得情報を、品質情報取得部103に供給する。デプスオクルージョン画像の取得候補のリストにオクルージョン画像が登録されている場合、MPD処理部102は、クオリティファイル(quality2 file)内の、リストに登録されているオクルージョン画像の品質情報の取得情報を、品質情報取得部103に供給する。
また、MPD処理部102は、復号部104から供給される品質情報に基づいて、再生パターンの候補から再生パターンを選択する。MPD処理部102は、選択された再生パターンの再生において用いられるテクスチャファイルのテクスチャ画像の取得情報を画像取得部105に供給する。また、MPD処理部102は、選択された再生パターンの再生においてデプスオクルージョン画像のファイルが用いられる場合、そのデプスオクルージョン画像の取得情報を画像取得部105に供給する。
品質情報取得部103は、MPD処理部102から供給される取得情報に基づいて、品質情報を含むメタデータの符号化ストリームをWebサーバ12に要求し、取得する。品質情報取得部103は、取得された符号化ストリームを復号部104に供給する。
復号部104は、品質情報取得部103から供給される符号化ストリームを復号し、品質情報を含むメタデータを生成する。復号部104は、品質情報をMPD処理部102に供給する。
画像取得部105、復号部106、および出力制御部107は、再生部として機能し、MPD処理部102から供給される取得情報に基づいて、テクスチャ画像のみ、または、テクスチャ画像とデプスオクルージョン画像を再生する。
具体的には、画像取得部105は、MPD処理部102から供給される取得情報に基づいて、テクスチャファイルやデプスオクルージョン画像のファイルの符号化ストリームをWebサーバ12に要求し、取得する。画像取得部105は、取得された符号化ストリームを復号部104に供給する。
復号部106は、画像取得部105から供給される符号化ストリームを復号し、画像データを生成する。復号部106は、生成された画像データを出力制御部107に供給する。
出力制御部107は、復号部106から供給される画像データがテクスチャ画像の画像データのみである場合、そのテクスチャ画像の画像データに基づいて、動画再生端末14が有する図示せぬディスプレイ等の表示部にテクスチャ画像を表示させる。
一方、出力制御部107は、復号部106から供給される画像データがテクスチャ画像とデプスオクルージョン画像の画像データである場合、そのテクスチャ画像とデプスオクルージョン画像の画像データに基づいて、3D画像の画像データを生成する。そして、出力制御部107は、生成された3D画像の画像データに基づいて、図示せぬディスプレイ等の表示部に3D画像を表示させる。
計測部108は、インターネット13のネットワーク帯域を計測し、MPD処理部102に供給する。
(ストリーミング再生部の処理の第1の例の説明)
図14は、図13のストリーミング再生部100の再生処理の第1の例を説明するフローチャートである。なお、図14の再生処理では、ストリーミング再生部100は、テクスチャ画像とデプス画像を用いた3D画像の再生を行う。
図14のステップS31において、MPD取得部101は、MPDファイルをWebサーバ12に要求し、取得する。MPD取得部101は、取得されたMPDファイルをMPD処理部102に供給する。
ステップS32において、MPD処理部102は、MPD取得部101から供給されるMPDファイルを解析する。これにより、MPD処理部102は、各テクスチャ画像およびデプス画像のビットレート、再生すべきパターンでの再生に用いられる画像の組み合わせ、並びに、テクスチャ画像、デプス画像、および品質情報の取得情報を取得する。
ステップS33において、MPD処理部102は、再生すべきパターンでの再生に用いられる画像の組み合わせに基づいて、再生すべきパターンの中からテクスチャ画像とデプス画像のみを用いて再生を行う再生パターン3,4、および7を、再生パターンの候補として選択する。以降のステップS34乃至S43の処理は、セグメント単位で行われる。
ステップS34において、計測部108は、インターネット13のネットワーク帯域を計測し、MPD処理部102に供給する。
ステップS35において、MPD処理部102は、ネットワーク帯域と、各テクスチャ画像のビットレートとに基づいて、再生パターンの候補での再生に用いられるテクスチャ画像の中から、取得するテクスチャ画像を決定する。
例えば、MPD処理部102は、ネットワーク帯域の80パーセントがテクスチャ画像の最大許容ビットレートであるものとし、再生パターンの候補での再生に用いられるテクスチャ画像のうちの、最大許容ビットレートより小さいビットレートのテクスチャ画像を、取得するテクスチャ画像に決定する。
ステップS36において、MPD処理部102は、取得するテクスチャ画像を再生する再生パターンの候補とデプス画像のビットレートとに基づいて、デプス画像の取得候補のリストを作成する。
例えば、MPD処理部102は、ネットワーク帯域の20パーセントがデプス画像の最大許容ビットレートであるものとする。そして、取得するテクスチャ画像がテクスチャファイル(texture1 file)のテクスチャ画像であり、デプスファイル(depth1 file)とデプスファイル(depth2 file)のデプス画像のビットレートが最大許容ビットレートより小さい場合、MPD処理部102は、再生パターン3および4に基づいて、デプスファイル(depth1 file)とデプスファイル(depth2 file)のデプス画像が登録されたリストを作成する。
一方、取得するテクスチャ画像がテクスチャファイル(texture2 file)のテクスチャ画像であり、デプスファイル(depth2 file)のデプス画像のビットレートが最大許容ビットレートより小さい場合、MPD処理部102は、再生パターン7に基づいて、デプスファイル(depth2 file)のデプス画像が登録されたリストを作成する。
そして、MPD処理部102は、リストに登録されたデプス画像の品質情報の取得情報を、品質情報取得部103に供給する。なお、取得するテクスチャ画像とともに再生すべきデプス画像の全てのビットレートが最大許容ビットレート以上である場合、デプス画像の取得候補のリストには何も登録されず、テクスチャ画像の符号化ストリームのみが取得、復号、および表示され、処理はステップS43に進む。
ステップS37において、品質情報取得部103は、MPD処理部102から供給される取得情報に基づいて、デプス画像の品質情報を含むメタデータの符号化ストリームをWebサーバ12に要求し、取得する。品質情報取得部103は、取得された符号化ストリームを復号部104に供給する。
ステップS38において、復号部104は、品質情報取得部103から供給されるデプス画像の品質情報の符号化ストリームを復号し、デプス画像の品質情報を含むメタデータを生成する。復号部104は、デプス画像の品質情報をMPD処理部102に供給する。
ステップS39において、MPD処理部102は、復号部104から供給される品質情報に基づいて、デプス画像のリストに登録されているデプス画像から、取得するデプス画像を決定する。
例えば、MPD処理部102は、品質情報が表す品質が最も良いデプス画像、品質情報が表す品質が直前のセグメント(またはサブセグメント)のデプス画像の品質に最も近いデプス画像、または品質情報が表す品質が許容可能な品質であり、かつ、最もビットレートが小さいデプス画像を、取得するデプス画像に決定する。
品質情報が表す品質が直前のセグメント(またはサブセグメント)のデプス画像の品質に最も近いデプス画像が、取得するデプス画像に決定される場合、再生される3D画像の見た目の違和感を軽減することができる。MPD処理部102は、取得するデプス画像の取得情報を画像取得部105に供給する。
ステップS40において、画像取得部105は、MPD処理部102から供給される取得情報に基づいて、テクスチャ画像およびデプス画像の符号化ストリームをWebサーバ12に要求し、取得する。画像取得部105は、取得された符号化ストリームを復号部104に供給する。
ステップS41において、画像取得部105から供給される符号化ストリームを復号し、テクスチャ画像とデプス画像の画像データを生成する。復号部106は、生成されたテクスチャ画像とデプス画像の画像データを出力制御部107に供給する。
ステップS42において、出力制御部107は、復号部106から供給されるテクスチャ画像とデプス画像の画像データに基づいて、3D画像の画像データを生成し、図示せぬ表示部に3D画像を表示させる。
ステップS43において、ストリーミング再生部100は、動画コンテンツの最後のセグメントの画像を表示したかどうかを判定する。ステップS43で動画コンテンツの最後のセグメントの画像をまだ表示していないと判定された場合、処理はステップS34に戻る。
一方、ステップS43で動画コンテンツの最後のセグメントの画像を表示したと判定された場合、処理は終了する。
なお、図示は省略するが、ストリーミング再生部100が、テクスチャ画像、デプス画像、およびオクルージョン画像を用いて3D画像の再生を行う再生処理の第1の例は、以下の点を除いて図14の再生処理と同様である。
即ち、図14のステップS33で選択される再生パターンの候補が、再生パターン5および6である。また、ステップS39とステップS40の間で、デプス画像の品質情報についてのステップS36乃至S39の処理と同様に、オクルージョン画像の品質情報についての処理が行われる。
但し、この場合、テクスチャ画像、デプス画像、オクルージョン画像の最大許容ビットレートは、例えば、ネットワーク帯域の70パーセント、15パーセント、15パーセントとされる。さらに、ステップS40乃至S42の処理におけるデプス画像は、デプス画像とオクルージョン画像の両方になる。
(ストリーミング再生部の処理の第2の例の説明)
図15は、図13のストリーミング再生部100の再生処理の第2の例を説明するフローチャートである。なお、図15の再生処理では、ストリーミング再生部100は、テクスチャ画像とデプス画像を用いた3D画像の再生を行う。
図15の再生処理は、主に、テクスチャ画像とデプス画像の最大許容ビットレートのネットワーク帯域に対する割合が決められていない点が、図14の再生処理と異なる。
図15のステップS61乃至S64は、図14のステップS31乃至S34の処理と同様であるので、説明は省略する。ステップS64乃至S73の処理は、セグメント単位で行われる。
ステップS65において、MPD処理部102は、再生パターンの候補、計測部108から供給されるインターネット13のネットワーク帯域、並びに、テクスチャ画像とデプス画像のビットレートに基づいて、テクスチャ画像およびデプス画像の組み合わせの取得候補のリストを作成する。
具体的には、再生パターン3,4、および7での再生に用いられるテクスチャ画像とデプス画像の組み合わせのうちの、テクスチャ画像とデプス画像のビットレートの和がネットワーク帯域を超えないものが登録されたリストを作成する。
なお、テクスチャ画像とデプス画像のビットレートの下限を予め決定しておき、リストに登録された組み合わせのうち、少なくとも一方のビットレートが下限を下回る組み合わせを除外するようにしてもよい。
また、再生パターン3,4、および7での再生に用いられるテクスチャ画像とデプス画像のビットレートの和の全てがネットワーク帯域を超えている場合、テクスチャ画像およびデプス画像の組み合わせの取得候補のリストには何も登録されない。そして、ネットワーク帯域を超えない最大のビットレートのテクスチャ画像の符号化ストリームのみが取得、復号、および表示され、処理はステップS73に進む。
ステップS66において、MPD処理部102は、ステップS65で作成されたリストに登録されたデプス画像のリストを作成する。そして、MPD処理部102は、リストに登録されたデプス画像の品質情報の取得情報を、品質情報取得部103に供給する。
ステップS67およびS68の処理は、図14のステップS37およびS38の処理と同様であるので、説明は省略する。
ステップS69において、MPD処理部102は、品質情報に基づいて、テクスチャ画像およびデプス画像の組み合わせのリストに登録されている組み合わせの中から、取得するテクスチャ画像およびデプス画像の組み合わせを決定する。
例えば、MPD処理部102は、図14のステップS39と同様に取得するデプス画像を決定する。そして、MPD処理部102は、取得するデプス画像との組み合わせが組み合わせリストに登録されているテクスチャ画像のうちの、最もビットレートの高いテクスチャ画像を、取得するテクスチャ画像に決定する。
ステップS70乃至S73の処理は、図14のステップS40乃至S43の処理と同様であるので、説明は省略する。
なお、図示は省略するが、ストリーミング再生部100が、テクスチャ画像、デプス画像、およびオクルージョン画像を用いて3D画像の再生を行う再生処理の第2の例は、以下の点を除いて図15の再生処理と同様である。
即ち、図15のステップS63で選択される再生パターンの候補が、再生パターン5および6である。また、ステップS65乃至S72の処理におけるデプス画像は、デプス画像とオクルージョン画像の両方になる。
以上のように、動画再生端末14は、デプスオクルージョン画像の品質情報を取得するので、その品質情報に基づいて、適切なデプスオクルージョン画像を取得することができる。
<第2実施の形態>
(セグメントファイルの例)
本開示を適用した情報処理システムの第2実施の形態の構成は、主に、品質情報を含むメタデータの符号化ストリームがデプス関連画像の種類ではなく、テクスチャ画像ごとに分割され、異なるクオリティファイルに配置される点を除いて、図1の情報処理システム10の構成と同一である。従って、以下では、クオリティファイルに関する説明以外の説明は適宜省略する。
図16は、本開示を適用した情報処理システムの第2実施の形態のセグメントファイル生成部83により生成されるセグメントファイルの例を示す図である。
図16のセグメントファイルは、クオリティファイルを除いて、図5のセグメントファイルと同一である。
図16に示すように、セグメントファイル生成部83は、2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリーム、および、1Mpbsのオクルージョン画像の品質情報の符号化ストリームを、その符号化ストリームとの再生に用いられるべきテクスチャ画像ごとに2つに分割する。そして、セグメントファイル生成部83は、セグメント単位で、分割されたメタデータの符号化ストリームを異なるクオリティファイルに配置することにより、クオリティファイルを生成する。
具体的には、再生すべきパターンでの再生においてテクスチャファイル(texture1 file)とともに再生に用いられるデプスオクルージョン画像は、2Mbpsおよび1Mpbsのデプス画像と1Mpbsのオクルージョン画像である。従って、セグメントファイル生成部83は、2Mbpsおよび1Mpbsのデプス画像の品質情報を含むメタデータの符号化ストリーム、および、1Mpbsのオクルージョン画像の品質情報を含むメタデータの符号化ストリームをセグメント単位で配置したクオリティファイル(quality1 file)を生成する。
クオリティファイル(quality1 file)では、各符号化ストリームが異なるトラック(quality track(depth1),quality track(depth2) ,quality track(occlusion1))に配置される。
また、再生すべきパターンでの再生においてテクスチャファイル(texture2 file)とともに再生に用いられるデプスオクルージョン画像は、1Mpbsのデプス画像である。従って、セグメントファイル生成部83は、1Mpbsのデプス画像の品質情報を含むメタデータの符号化ストリームをセグメント単位で配置したクオリティファイル(quality2 file)を生成する。
以上のように、セグメントファイル生成部83は、品質情報を含むメタデータの符号化ストリームを、テクスチャ画像ごとに別々にファイル化する。従って、動画再生端末14は、取得するテクスチャ画像のクオリティファイルから品質情報を取得することにより、そのテクスチャ画像とともに再生すべきパターンでの再生に用いられるデプスオクルージョン画像の品質情報を容易に取得することができる。
即ち、クオリティファイルには、そのクオリティファイルに対応するテクスチャ画像とともに再生すべきパターンでの再生において用いられるデプスオクルージョン画像の品質情報のみが格納されている。従って、全てのデプスオクルージョン画像の品質情報の符号化ストリームが、まとめてファイル化される場合に比べて、取得するテクスチャ画像とともに再生に用いられるべきデプスオクルージョン画像の品質情報を容易に取得することができる。
また、図示は省略するが、第2実施の形態におけるMPDファイルは、下記の点を除いて、図10のMPDファイルと同様である。即ち、第2実施の形態におけるMPDファイルでは、クオリティファイル(quality1 file)のリプレゼンテーション要素が有するassociationIDは、vd1とvd2だけでなく、vo1も含む。また、クオリティファイル(quality1 file)のリプレゼンテーション要素は、レベル3とassociationIDとしてのvo1を有するサブリプレゼンテーション要素をさらに含む。さらに、クオリティファイル(quality2 file)のリプレゼンテーション要素が有するassociationIDは、vo1ではなくvd2である。
さらに、図示は省略するが、第2実施の形態におけるファイル生成処理は、ステップS14において品質情報を含むメタデータの符号化ストリームがデプス関連画像の種類ではなく、テクスチャ画像ごとに分割される点を除いて、図12のファイル生成処理と同一である。
また、図示は省略するが、第2実施の形態における再生処理は、ステップS36において、MPD処理部102が、リストに登録されたデプス画像の品質情報の取得情報のうちの、取得するテクスチャ画像のクオリティファイルに格納される品質情報の取得情報を、品質情報取得部103に供給する点を除いて、図14の再生処理と同一である。
以上のように、第2実施の形態におけるファイル生成装置11は、デプスオクルージョン画像の品質情報を、そのデプスオクルージョン画像とともに再生すべきテクスチャ画像ごとに分割して異なるクオリティファイルに配置する。従って、デプスオクルージョン画像ごとに異なるクオリティファイルに品質情報が配置される場合に比べて、クオリティファイルの数を削減することができる。よって、デプスオクルージョン画像の品質情報を効率的に格納することができるといえる。また、動画再生端末14の品質情報の取得に関する処理量を削減することができる。
また、動画再生端末14は、再生対象のテクスチャ画像とともに再生すべきデプスオクルージョン画像の品質情報のみを格納するクオリティファイルから、品質情報を取得することができる。従って、全てのデプスオクルージョン画像の品質情報を格納するクオリティファイルから品質情報を取得する場合に比べて、品質情報の取得効率を向上させることができる。
<第3実施の形態>
(セグメントファイルの例)
本開示を適用した情報処理システムの第3実施の形態の構成は、主に、デプスオクルージョン画像の品質情報が、再生すべきパターンにおいて再生されるテクスチャ画像または3D画像の品質情報に代わる点、および、品質情報の符号化ストリームが、その品質情報に対応する再生パターンの種類ごとに分割されて異なるクオリティファイルに配置される点を除いて、図1の情報処理システム10の構成と同一である。従って、以下では、クオリティファイルに関する説明以外の説明は適宜省略する。
図17は、本開示を適用した情報処理システムの第3実施の形態のセグメントファイル生成部83により生成されるセグメントファイルの例を示す図である。
図17のセグメントファイルは、クオリティファイルを除いて、図5のセグメントファイルと同一である。
図17に示すように、セグメントファイル生成部83は、符号化部82から供給される再生パターン1乃至7の品質情報を含むメタデータの符号化ストリームを、再生パターンの種類ごとに3つに分割する。そして、セグメントファイル生成部83は、セグメント単位で、分割された符号化ストリームを異なるクオリティファイルに配置することによりクオリティファイルを生成する。
具体的には、セグメントファイル生成部83は、テクスチャ画像のみを用いて再生を行う再生パターン1および2の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality1 file)を生成する。クオリティファイル(quality1 file)では、各符号化ストリームが異なるトラック(quality track(texture1),quality track(texture2))に配置される。
また、セグメントファイル生成部83は、テクスチャ画像とデプス画像のみを用いて再生を行う再生パターン3,4、および7の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality2 file)を生成する。クオリティファイル(quality2 file)では、各符号化ストリームが異なるトラック(quality track(texture1+depth1), quality track(texture1+depth2) ,quality track(texture2+depth2))に配置される。
さらに、セグメントファイル生成部83は、テクスチャ画像、デプス画像、およびオクルージョン画像を用いて再生を行う再生パターン5および6の品質情報を含むメタデータの符号化ストリームをセグメント単位で配置したクオリティファイル(quality3 file)を生成する。クオリティファイル(quality3 file)では、各符号化ストリームが異なるトラック(quality track(texture1+depth+occlusion1), quality track(texture1+depth2+occlusion1))に配置される。
以上のように、セグメントファイル生成部83は、再生すべきパターンにおいて再生されるテクスチャ画像または3D画像の品質情報を含むメタデータの符号化ストリームをクオリティファイルに配置する。従って、動画再生端末14は、品質情報に基づいて、最終的に再生されるテクスチャ画像または3D画像の品質が高い再生を行うことができる。
また、セグメントファイル生成部83は、再生すべきパターンの品質情報の符号化ストリームを、再生パターンの種類ごとに別々にファイル化する。従って、動画再生端末14は、候補とする再生パターンの種類のクオリティファイルから、候補とする再生パターンの品質情報を容易に取得することができる。
これに対して、全ての再生パターンの品質情報の符号化ストリームが、まとめてファイル化される場合、候補とする再生パターンの種類ではない不要な再生パターンの品質情報も含むファイルから、候補とする再生パターンの品質情報を取得する必要がある。
(MPDファイルの記述例)
図18は、第3実施の形態におけるMPDファイルの記述例を示す図である。
図18のMPDファイルの記述は、クオリティファイル用のアダプテーションセット要素を除いて、図10の記述と同一である。
図18のMPDファイルでは、クオリティファイル(quality1 file)群、クオリティファイル(quality2 file)群、およびクオリティファイル(quality3 file)群が、1つのアダプテーションセット要素でグルーピングされる。
クオリティファイル用のアダプテーションセット要素には、クオリティファイル(quality1 file)群、クオリティファイル(quality2 file)群、およびクオリティファイル(quality3 file)群のそれぞれに対応するリプレゼンテーション要素が記述される。
クオリティファイル(quality1 file)群に対応するリプレゼンテーション要素には、Representation idとしてvq1が記述され、BaseURLとして「quality1.mp4」が記述される。
また、クオリティファイル(quality1 file)に格納される品質情報は、テクスチャファイル(texture1 file)とテクスチャファイル(texture2 file)の品質情報である。従って、クオリティファイル(quality1 file)に対応するリプレゼンテーション要素には、associationIDとしてテクスチャファイル(texture1 file)群およびテクスチャファイル(texture2 file)群のRepresentation idであるvt1およびvt2が記述される。
さらに、図18の例では、レベル1およびレベル2に対応するトラックが、それぞれ、テクスチャファイル(texture1 file)の品質情報、テクスチャファイル(texture2 file)の品質情報を格納している。
従って、クオリティファイル(quality1 file)群に対応するリプレゼンテーション要素には、レベル1と、associationIDとしてのテクスチャファイル(texture1 file)のRepresentation idであるvt1とを対応付ける<SubRepresentation level=”1” associationId=”vt1”>が記述される。また、レベル2と、associationIDとしてのテクスチャファイル(texture2 file)のRepresentation idであるvt2とを対応付ける<SubRepresentation level=”2” associationId=”vt2”>が記述される。即ち、クオリティファイル(quality1 file)の各トラックと、テクスチャ画像を特定するRepresentationID(テクスチャ画像特定情報)との対応関係が記述される。
また、クオリティファイル(quality2 file)群に対応するリプレゼンテーション要素には、Representation idとしてvq2が記述され、BaseURLとして「quality2.mp4」が記述される。
また、クオリティファイル(quality2 file)に格納される品質情報は、テクスチャファイル(texture1 file)とデプスファイル(depth1 file)を用いて再生される3D画像、テクスチャファイル(texture1 file)とデプスファイル(depth2 file)を用いて再生される3D画像、テクスチャファイル(texture2 file)とデプスファイル(depth2 file)を用いて再生される3D画像の品質情報である。
従って、クオリティファイル(quality2 file)群に対応するリプレゼンテーション要素には、associationIDとしてテクスチャファイル(texture1 file)、テクスチャファイル(texture2 file)、デプスファイル(depth1 file)、およびデプスファイル(depth2 file)のRepresentation idであるvt1,vt2,vd1、およびvd2が記述される。
さらに、図18の例では、レベル1に対応するトラックがテクスチャファイル(texture1 file)とデプスファイル(depth1 file)を用いて再生される3D画像の品質情報を格納する。レベル2に対応するトラックがテクスチャファイル(texture1 file)とデプスファイル(depth2 file)を用いて再生される3D画像の品質情報を格納する。レベル3に対応するトラックがテクスチャファイル(texture2 file)とデプスファイル(depth2 file)を用いて再生される3D画像の品質情報を格納する。
従って、クオリティファイル(quality2 file)群に対応するリプレゼンテーション要素には、レベル1と、associationIDとしてのテクスチャファイル(texture1 file)とデプスファイル(depth1 file)のRepresentation idであるvt1とvd1とを対応付ける<SubRepresentation level=”1” associationId=”vt1 vd1”>が記述される。また、レベル2と、associationIDとしてのテクスチャファイル(texture1 file)とデプスファイル(depth2 file)のRepresentation idであるvt1とvd2とを対応付ける<SubRepresentation level=”2” associationId=”vt1 vd2”>が記述される。
さらに、レベル3と、associationIDとしてのテクスチャファイル(texture2 file)とデプスファイル(depth2 file)のRepresentation idであるvt2とvd2とを対応付ける<SubRepresentation level=”3” associationId=”vt2 vd2”>が記述される。
また、クオリティファイル(quality3 file)群に対応するリプレゼンテーション要素には、Representation idとしてvq3が記述され、BaseURLとして「quality3.mp4」が記述される。
また、クオリティファイル(quality3 file)に格納される品質情報は、テクスチャファイル(texture1 file)、デプスファイル(depth1 file)、およびオクルージョンファイル(occlusion file)を用いて再生される3D画像と、テクスチャファイル(texture1 file)、デプスファイル(depth2 file)、およびオクルージョンファイル(occlusion file)を用いて再生される3D画像の品質情報である。
従って、クオリティファイル(quality3 file)群に対応するリプレゼンテーション要素には、associationIDとしてテクスチャファイル(texture1 file)、デプスファイル(depth1 file)、デプスファイル(depth2 file)、およびオクルージョンファイル(occlusion file)のRepresentation idであるvt1,vd1,vd2、およびvo1が記述される。
さらに、図18の例では、レベル1に対応するトラックがテクスチャファイル(texture1 file)、デプスファイル(depth1 file)、およびオクルージョンファイル(occlusion file)を用いて再生される3D画像の品質情報を格納する。レベル2に対応するトラックがテクスチャファイル(texture1 file)、デプスファイル(depth2 file)、およびオクルージョンファイル(occlusion file)を用いて再生される3D画像の品質情報を格納する。
従って、クオリティファイル(quality3 file)群に対応するリプレゼンテーション要素には、レベル1と、associationIDとしてのテクスチャファイル(texture1 file)、デプスファイル(depth1 file)、およびオクルージョンファイル(occlusion file)のRepresentation idであるvt1,vd1、およびvo1とを対応付ける<SubRepresentation level=”1” associationId=”vt1 vd1 vo1”>が記述される。また、レベル2と、associationIDとしてのテクスチャファイル(texture1 file)、デプスファイル(depth2 file)、およびオクルージョンファイル(occlusion file)のRepresentation idであるvt1,vd2、およびvo1とを対応付ける<SubRepresentation level=”2” associationId=”vt1 vd2 vo1”>が記述される。
なお、図18の例では、クオリティファイル用のアダプテーションセット要素には、bandwidthが記述されないが、記述されるようにしてもよい。
また、図示は省略するが、第3実施の形態におけるファイル生成処理は、ステップS11において取得される品質情報が、再生すべきパターンで再生されるテクスチャ画像または3D画像の品質情報である点、および、ステップS14において品質情報を含むメタデータの符号化ストリームがデプス関連画像の種類ではなく、再生パターンの種類ごとに分割される点を除いて、図12のファイル生成処理と同一である。
(ストリーミング再生部の処理の第1の例の説明)
図19は、第3実施の形態におけるストリーミング再生部100の再生処理の第1の例を説明するフローチャートである。なお、図19の再生処理では、ストリーミング再生部100は、テクスチャ画像とデプス画像を用いた3D画像の再生を行う。
図19のステップS91乃至S95の処理は、図14のステップS31乃至S35の処理と同様であるので、説明は省略する。ステップS94乃至S103の処理は、セグメント単位で行われる。
ステップS96において、MPD処理部102は、取得するテクスチャ画像を再生する再生パターンのリストを作成する。
例えば、MPD処理部102は、ネットワーク帯域の20パーセントがデプス画像の最大許容ビットレートであるものとする。そして、取得するテクスチャ画像がテクスチャファイル(texture1 file)のテクスチャ画像であり、デプスファイル(depth1 file)とデプスファイル(depth2 file)のデプス画像のビットレートが最大許容ビットレートより小さい場合、MPD処理部102は、再生パターン3および4が登録されたリストを作成する。
一方、取得するテクスチャ画像がテクスチャファイル(texture2 file)のテクスチャ画像であり、デプスファイル(depth2 file)のデプス画像のビットレートが最大許容ビットレートより小さい場合、MPD処理部102は、再生パターン7が登録されたリストを作成する。そして、MPD処理部102は、リストに登録された再生パターンの品質情報の取得情報を、品質情報取得部103に供給する。
なお、取得するテクスチャ画像とともに再生すべきデプス画像の全てのビットレートが最大許容ビットレート以上である場合、デプス画像の取得候補のリストには何も登録されず、テクスチャ画像の符号化ストリームのみが取得、復号、および表示され、処理はステップS103に進む。
ステップS97において、品質情報取得部103は、MPD処理部102から供給される取得情報に基づいて、所定の再生パターンの品質情報を含むメタデータの符号化ストリームをWebサーバ12に要求し、取得する。品質情報取得部103は、取得された符号化ストリームを復号部104に供給する。
ステップS98において、復号部104は、品質情報取得部103から供給される所定の再生パターンの品質情報の符号化ストリームを復号し、所定の再生パターンの品質情報を含むメタデータを生成する。復号部104は、所定の再生パターンの品質情報をMPD処理部102に供給する。
ステップS99において、MPD処理部102は、復号部104から供給される品質情報に基づいて、リストに登録されている再生パターンの再生に用いられるデプス画像の中から、取得するデプス画像を決定する。
例えば、MPD処理部102は、品質情報が表す品質が最も良い再生パターン、品質情報が表す品質が直前のセグメント(またはサブセグメント)の再生パターンの品質に最も近い再生パターン、または品質情報が表す品質が許容可能な品質であり、かつ、最もビットレートが小さい再生パターンでの再生に用いられるデプス画像を、取得するデプス画像に決定する。
品質情報が表す品質が直前のセグメント(またはサブセグメント)の再生パターンの品質に最も近い再生パターンでの再生に用いられるデプス画像が、取得するデプス画像に決定される場合、再生される3D画像の見た目の違和感を軽減することができる。MPD処理部102は、取得するデプス画像の取得情報を画像取得部105に供給する。
ステップS100乃至S103の処理は、図14のステップS40乃至S43の処理と同様であるので、説明は省略する。
なお、図示は省略するが、ストリーミング再生部100が、テクスチャ画像、デプス画像、およびオクルージョン画像を用いて3D画像の再生を行う再生処理は、以下の点を除いて図19の再生処理と同様である。
即ち、図19のステップS93で選択される再生パターンの候補が、再生パターン5および6である。また、ステップS99乃至S102の処理におけるデプス画像がデプス画像とオクルージョン画像に代わる。なお、この場合、テクスチャ画像、デプス画像、オクルージョン画像の最大許容ビットレートは、例えば、ネットワーク帯域の70パーセント、15パーセント、15パーセントとされる。
(ストリーミング再生部の処理の第2の例の説明)
図20は、第3実施の形態におけるストリーミング再生部100の再生処理の第2の例を説明するフローチャートである。なお、図20の再生処理では、ストリーミング再生部100は、テクスチャ画像とデプス画像を用いた3D画像の再生を行う。
図20の再生処理は、主に、テクスチャ画像とデプス画像の最大許容ビットレートのネットワーク帯域に対する割合が決められていない点が、図19の再生処理と異なる。
図20のステップS121乃至S124は、図19のステップS91乃至S94の処理と同様であるので、説明は省略する。ステップS124乃至S132の処理は、セグメント単位で行われる。
ステップS125において、MPD処理部102は、再生パターンの候補、計測部108から供給されるインターネット13のネットワーク帯域、並びに、テクスチャ画像とデプス画像のビットレートに基づいて、再生パターンのリストを作成する。
具体的には、再生パターン3,4、および7のうちの、再生に用いられるテクスチャ画像とデプス画像のビットレートの和がネットワーク帯域を超えないものが登録されたリストを作成する。
なお、テクスチャ画像とデプス画像のビットレートの下限を予め決定しておき、リストに登録された再生パターンのうち、再生に用いられるテクスチャ画像とデプス画像の少なくとも一方のビットレートが下限を下回る再生パターンを除外するようにしてもよい。
また、再生パターン3,4、および7での再生に用いられるテクスチャ画像とデプス画像のビットレートの和の全てがネットワーク帯域を超えている場合、再生パターンのリストには何も登録されない。そして、ネットワーク帯域を超えない最大のビットレートのテクスチャ画像の符号化ストリームのみが取得、復号、および表示され、処理はステップS132に進む。
ステップS126およびS127の処理は、図19のステップS97およびS98の処理と同様であるので、説明は省略する。
ステップS128において、MPD処理部102は、品質情報に基づいて、リストに登録されている再生パターンでの再生に用いられるテクスチャ画像およびデプス画像の組み合わせの中から、図15のS69の処理と同様に、取得するテクスチャ画像およびデプス画像の組み合わせを決定する。
ステップS129乃至S132の処理は、図19のステップS100乃至S103の処理と同様であるので、説明は省略する。
なお、図示は省略するが、ストリーミング再生部100が、テクスチャ画像、デプス画像、およびオクルージョン画像を用いて3D画像の再生を行う再生処理の第2の例は、以下の点を除いて図20の再生処理と同様である。
即ち、図20のステップS123で選択される再生パターンの候補が、再生パターン5および6である。また、ステップS128乃至S131の処理におけるデプス画像は、デプス画像とオクルージョン画像の両方になる。
以上のように、第3実施の形態におけるファイル生成装置11は、再生すべきパターンの品質情報を、再生パターンの種類ごとに分割して異なるクオリティファイルに配置する。従って、再生すべきパターンごとに異なるクオリティファイルに品質情報が配置される場合に比べて、クオリティファイルの数を削減することができる。よって、品質情報を効率的に格納することができるといえる。また、動画再生端末14の品質情報の取得に関する処理量を削減することができる。
また、動画再生端末14は、候補とする種類の再生パターンの品質情報のみを格納するクオリティファイルから品質情報を取得することができる。従って、全ての再生パターンの品質情報を格納するクオリティファイルから品質情報を取得する場合に比べて、候補とする再生パターンの品質情報の取得効率を向上させることができる。
<第4実施の形態>
(セグメントファイルの例)
本開示を適用した情報処理システムの第4実施の形態の構成は、主に、品質情報を含むメタデータの符号化ストリームが再生パターンの種類ではなく、再生に用いられるテクスチャ画像ごとに分割され、異なるクオリティファイルに配置される点を除いて、第3実施の形態の構成と同一である。従って、以下では、クオリティファイルに関する説明以外の説明は適宜省略する。
図21は、本開示を適用した情報処理システムの第4実施の形態のセグメントファイル生成部83により生成されるセグメントファイルの例を示す図である。
図21のセグメントファイルは、クオリティファイルを除いて、図5のセグメントファイルと同一である。
図21に示すように、セグメントファイル生成部83は、符号化部82から供給される再生パターン1乃至7の品質情報を含むメタデータの符号化ストリームを、各再生パターンでの再生に用いられるテクスチャ画像ごとに2つに分割する。そして、セグメントファイル生成部83は、セグメント単位で、分割された符号化ストリームを異なるクオリティファイルに配置することによりクオリティファイルを生成する。
具体的には、セグメントファイル生成部83は、テクスチャファイル(texture1 file)を用いて再生を行う再生パターン1乃至5の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality1 file)を生成する。クオリティファイル(quality1 file)では、各符号化ストリームが異なるトラック(quality track(texture1),quality track(texture1+depth1) ,quality track(texture1+depth2) ,quality track(texture1+depth1+occlusion) ,quality track(texture1+depth2+occlusion))に配置される。
また、セグメントファイル生成部83は、テクスチャファイル(texture2 file)を用いて再生を行う再生パターン6および7の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality2 file)を生成する。クオリティファイル(quality2 file)では、各符号化ストリームが異なるトラック(quality track(texture2), quality track(texture2+depth2))に配置される。
以上のように、セグメントファイル生成部83は、再生パターンの品質情報の符号化ストリームを、テクスチャ画像ごとに別々にファイル化する。従って、動画再生端末14は、取得するテクスチャ画像のクオリティファイルから品質情報を取得することにより、そのテクスチャ画像を用いて再生を行う再生すべきパターンの品質情報を容易に取得することができる。
また、図示は省略するが、第4実施の形態におけるMPDファイルは、下記の点を除いて、図18のMPDファイルと同様である。即ち、第4実施の形態におけるMPDファイルでは、クオリティファイル用のアダプテーションセット要素に含まれるリプレゼンテーション要素の数は2つである。
1つ目のクオリティファイル(quality1 file)群のリプレゼンテーション要素が有するassociationIDは、vt1,vt2,vd1,vd2、およびvo1である。また、クオリティファイル(quality1 file)のリプレゼンテーション要素は、レベル1とassociationIDとしてのvt1、レベル2とassociationIDとしてのvt1およびvd1、レベル3とassociationIDとしてのvt1およびvd2、レベル4とassociationID としてのvt1,vd1、およびvo1、レベル5と、associationIDとしてのvt1,vd2、およびvo1をそれぞれ有する5つのサブリプレゼンテーション要素を含む。
2つ目のクオリティファイル(quality2 file)のリプレゼンテーション要素が有するassociationIDは、vt2とvd2である。また、クオリティファイル(quality1 file)のリプレゼンテーション要素は、レベル1とassociationIDとしてのvt2、レベル2とassociationIDとしてのvt2およびvd2をそれぞれ有する2つのサブリプレゼンテーション要素を含む。
さらに、図示は省略するが、第4実施の形態におけるファイル生成処理は、品質情報を含むメタデータの符号化ストリームが再生パターンの種類ではなく、テクスチャ画像ごとに分割される点を除いて、第3実施の形態におけるファイル生成処理と同一である。
また、図示は省略するが、第4実施の形態における再生処理は、図19や図20の再生処理と同一である。
以上のように、第4実施の形態におけるファイル生成装置11は、再生すべきパターンの品質情報を、テクスチャ画像ごとに分割して異なるクオリティファイルに配置する。従って、再生すべきパターンごとに異なるクオリティファイルに品質情報が配置される場合に比べて、クオリティファイルの数を削減することができる。よって、再生すべきパターンの品質情報を効率的に格納することができるといえる。また、動画再生端末14の品質情報の取得に関する処理量を削減することができる。
また、動画再生端末14は、再生対象のテクスチャ画像を用いて再生を行う再生すべきパターンの品質情報のみを格納するクオリティファイルから、品質情報を取得することができる。従って、全ての再生パターンの品質情報を格納するクオリティファイルから品質情報を取得する場合に比べて、再生対象のテクスチャ画像を用いて再生を行う再生すべきパターンの品質情報の取得効率を向上させることができる。
<第5実施の形態>
(セグメントファイルの例)
本開示を適用した情報処理システムの第5実施の形態の構成は、主に、品質情報を含むメタデータの符号化ストリームが再生パターンの種類だけでなく、テクスチャ画像ごとにも分割され、異なるクオリティファイルに配置される点を除いて、第3実施の形態の構成と同一である。即ち、第5実施の形態は、第3実施の形態と第4実施の形態を組み合わせたものである。従って、以下では、クオリティファイルに関する説明以外の説明は適宜省略する。
図22は、本開示を適用した情報処理システムの第5実施の形態のセグメントファイル生成部83により生成されるセグメントファイルの例を示す図である。
図22のセグメントファイルは、クオリティファイルを除いて、図5のセグメントファイルと同一である。
図22に示すように、セグメントファイル生成部83は、符号化部82から供給される再生パターン1乃至7の品質情報を含むメタデータの符号化ストリームを、再生パターンの種類、および、各再生パターンでの再生に用いられるテクスチャ画像ごとに、5つに分割する。そして、セグメントファイル生成部83は、セグメント単位で、分割された符号化ストリームを異なるクオリティファイルに配置することによりクオリティファイルを生成する。
具体的には、セグメントファイル生成部83は、テクスチャファイル(texture1 file)のみを用いて再生を行う再生パターン1の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality1 file)を生成する。
また、セグメントファイル生成部83は、テクスチャファイル(texture1 file)とデプスファイルのみを用いて再生を行う再生パターン3および4の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality2 file)を生成する。クオリティファイル(quality2 file)では、各符号化ストリームが異なるトラック(quality track(texture1+depth1) ,quality track(texture1+depth2))に配置される。
さらに、セグメントファイル生成部83は、テクスチャファイル(texture1 file)、デプスファイル、およびオクルージョンファイルを用いて再生を行う再生パターン5および6の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality3 file)を生成する。クオリティファイル(quality3 file)では、各符号化ストリームが、異なるトラック(quality track(texture1+depth1+occlusion) ,quality track(texture1+depth2+occlusion))に配置される。
また、セグメントファイル生成部83は、テクスチャファイル(texture2 file)のみを用いて再生を行う再生パターン2の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality4 file)を生成する。
さらに、セグメントファイル生成部83は、テクスチャファイル(texture2 file)とデプスファイルのみを用いて再生を行う再生パターン7の品質情報の符号化ストリームをセグメント単位で配置したクオリティファイル(quality5 file)を生成する。
以上のように、セグメントファイル生成部83は、再生パターンの品質情報の符号化ストリームを、再生パターンの種類およびテクスチャ画像ごとに別々にファイル化する。従って、候補とする再生パターンの種類であり、かつ再生対象のテクスチャ画像を用いて再生を行う再生すべきパターンのクオリティファイルから、そのテクスチャ画像を用いて再生を行う、候補とする種類の再生すべきパターンの品質情報を容易に取得することができる。
また、図示は省略するが、第5実施の形態におけるMPDファイルは、下記の点を除いて、図18のMPDファイルと同様である。即ち、第5実施の形態におけるMPDファイルでは、クオリティファイル用のアダプテーションセット要素に含まれるリプレゼンテーション要素の数は5つである。
1つ目のクオリティファイル(quality1 file)のリプレゼンテーション要素が有するassociationIDはvt1であり、4つ目のクオリティファイル(quality4 file)のリプレゼンテーション要素が有するassociationIDはvt2である。5つ目のクオリティファイル(quality5 file)のリプレゼンテーション要素が有するassociationIDはvt2とvd2である。
2つ目のクオリティファイル(quality2 file)のリプレゼンテーション要素が有するassociationIDは、vt1,vd1、およびvd2である。また、クオリティファイル(quality1 file)のリプレゼンテーション要素は、レベル1とassociationIDとしてのvt1およびvd1、レベル2とassociationIDとしてのvt1およびvd2をそれぞれ有するサブリプレゼンテーション要素を含む。
3つ目のクオリティファイル(quality2 file)のリプレゼンテーション要素が有するassociationIDは、vt1,vd1,vd2、およびvo1である。また、クオリティファイル(quality1 file)のリプレゼンテーション要素は、レベル1とassociationIDとしてのvt1,vd1、およびvo1、レベル2とassociationIDとしてのvt1,vd2、およびvo1をそれぞれ有するサブリプレゼンテーション要素を含む。
さらに、図示は省略するが、第5実施の形態におけるファイル生成処理は、品質情報を含むメタデータの符号化ストリームが再生パターンの種類だけでなく、テクスチャ画像ごとにも分割される点を除いて、第3実施の形態におけるファイル生成処理と同一である。また、図示は省略するが、第5実施の形態における再生処理は、図19や図20の再生処理と同一である。
以上のように、第5実施の形態におけるファイル生成装置11は、再生すべきパターンの品質情報を、再生パターンの種類およびテクスチャ画像ごとに分割して異なるクオリティファイルに配置する。従って、再生すべきパターンごとに異なるクオリティファイルに品質情報が配置される場合に比べて、クオリティファイルの数を削減することができる。よって、再生すべきパターンの品質情報を効率的に格納することができるといえる。また、動画再生端末14の品質情報の取得に関する処理量を削減することができる。
また、動画再生端末14は、候補とする再生パターンの種類の、再生対象のテクスチャ画像を用いて再生を行う再生すべきパターンの品質情報のみを格納するクオリティファイルから、品質情報を取得することができる。従って、全ての再生パターンの品質情報を格納するクオリティファイルから品質情報を取得する場合に比べて、候補とする再生パターンの種類の、再生対象のテクスチャ画像を用いて再生を行う再生すべきパターンの品質情報の取得効率を向上させることができる。
<第6実施の形態>
(セグメントファイルの例)
本開示を適用した情報処理システムの第6実施の形態の構成は、主に、品質情報を含むメタデータの符号化ストリームが1つのクオリティファイルにまとめて配置される点を除いて、図1の情報処理システム10の構成と同一である。従って、以下では、クオリティファイルに関する説明以外の説明は適宜省略する。
図23は、本開示を適用した情報処理システムの第6実施の形態のセグメントファイル生成部83により生成されるセグメントファイルの例を示す図である。
図23のセグメントファイルは、クオリティファイルを除いて、図5のセグメントファイルと同一である。
図23に示すように、セグメントファイル生成部83は、2Mbpsおよび1Mpbsのデプス画像の品質情報を含むメタデータの符号化ストリーム、および、1Mpbsのオクルージョン画像の品質情報を含むメタデータの符号化ストリームを、セグメント単位で、1つのクオリティファイル(quality1 file)に配置することにより、1つのクオリティファイル(quality1 file)を生成する。
クオリティファイル(quality1 file)では、各符号化ストリームに異なるトラック(quality track(depth1),quality track(depth2) ,quality track(Occlusion1))が割り当てられる。
(MPDファイルの記述例)
図24は、第6実施の形態におけるMPDファイルの記述例を示す図である。
図24のMPDファイルの構成は、クオリティファイル用のアダプテーションセット(AdaptationSet)要素を除いて、図10の構成と同一である。
図24のMPDファイルでは、クオリティファイル(quality1 file)群が、1つのアダプテーションセット要素でグルーピングされる。
クオリティファイル用のアダプテーションセット要素には、クオリティファイル(quality1 file)群に対応するリプレゼンテーション要素が記述される。クオリティファイル(quality1 file)群に対応するリプレゼンテーション要素には、Representation idとしてvq1が記述され、BaseURLとして「quality1.mp4」が記述される。
また、クオリティファイル(quality1 file)に格納される品質情報は、デプスファイル(depth1 file)、デプスファイル(depth2 file)、およびオクルージョンファイル(occlusion1 file)の品質情報である。従って、クオリティファイル(quality1 file)に対応するリプレゼンテーション要素には、associationIDとしてデプスファイル(depth1 file)群、デプスファイル(depth2 file)群、およびオクルージョンファイル(occlusion1 file)群のRepresentation idであるvd1,vd2、およびvo1が記述される。
さらに、図24の例では、レベル1乃至レベル3に対応するトラックが、それぞれ、デプスファイル(depth1 file)、デプスファイル(depth2 file)、オクルージョンファイル(occlusion1 file)の品質情報を格納している。
従って、クオリティファイル(quality1 file)群に対応するリプレゼンテーション要素には、レベル1と、associationIDとしてのデプスファイル(depth1 file)のRepresentation idであるvd1とを対応付ける<SubRepresentation level=”1” associationId=”vd1”>が記述される。レベル2と、associationIDとしてのデプスファイル(depth2 file)のRepresentation idであるvd2とを対応付ける<SubRepresentation level=”2” associationId=”vd2”>が記述される。レベル3と、associationIDとしてのオクルージョンファイル(occlusion1 file)のRepresentation idであるvo1とを対応付ける<SubRepresentation level=”3” associationId=”vo1”>が記述される。
なお、図24の例では、クオリティファイル用のアダプテーションセット要素には、bandwidthが記述されないが、記述されるようにしてもよい。
また、図示は省略するが、第6実施の形態におけるファイル生成処理は、ステップS14の処理が行われず、ステップS15において品質情報を含むメタデータの符号化ストリームがセグメント単位で1つのクオリティファイルに配置される点を除いて、図12のファイル生成処理と同一である。
また、図示は省略するが、第6実施の形態における再生処理は、図14や図15の再生処理と同一である。
なお、第1および第6実施の形態では、再生すべきパターンにおける画像の組み合わせがMPDファイルに記述されたが、記述されなくてもよい。この場合、組み合わせ可能な画像の全ての組み合わせを用いた再生パターンから、再生パターンの候補が選択される。
また、品質情報の符号化ストリームは、符号化ストリームごとに異なるクオリティファイルに配置されるようにしてもよい。
<第7実施の形態>
(セグメントファイルの構成例)
本開示を適用した情報処理システムの第7実施の形態の構成は、主に、デプスオクルージョン画像の符号化ストリームとデプスオクルージョン画像の品質情報の符号化ストリームが、デプスオクルージョン画像の種類ごとに分割されて異なるセグメントファイルに配置される点、および、同一のセグメントファイル内の品質情報の符号化ストリームは同一のトラックに配置される点を除いて、図1の情報処理システム10の構成と同一である。従って、以下では、デプスオクルージョン画像の種類ごとのセグメントファイルに関する説明以外の説明は適宜省略する。
図25は、本開示を適用した情報処理システムの第7実施の形態のセグメントファイル生成部83により生成されるセグメントファイルの例を示す図である。
図25のテクスチャファイルは、図5のテクスチャファイルと同一である。図25に示すように、セグメントファイル生成部83は、2Mbpsおよび1Mpbsのデプス画像並びに1Mpbsのオクルージョン画像の品質情報の符号化ストリームと、2Mbpsおよび1Mpbsのデプス画像並びに1Mpbsのオクルージョン画像の符号化ストリームを、デプスオクルージョン画像の種類ごとに2つに分割する。
そして、セグメントファイル生成部83は、セグメント単位で、分割された2Mbpsおよび1Mpbsのデプス画像の符号化ストリーム並びに2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリームを配置したセグメントファイルを生成する。
具体的には、セグメントファイル生成部83は、2Mbpsおよび1Mpbsのデプス画像の符号化ストリーム並びに2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリームを配置したデプスファイル(depth1 file)を生成する。
デプスファイル(depth1 file)では、2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリームが同一のトラック(quality1 track)に配置され、2Mbpsのデプス画像の符号化ストリームと1Mpbsのデプス画像の符号化ストリームがそれぞれ別のトラック(depth1 track,depth2 track)に配置される。
従って、2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリームのトラック(quality1 track)では、2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリームの両方がまとめてサンプル化されている。
また、セグメントファイル生成部83は、1Mpbsのオクルージョン画像の符号化ストリームおよび1Mpbsのオクルージョン画像の品質情報の符号化ストリームを配置したオクルージョンファイル(occlusion1 file)を生成する。
以上のように、第7実施の形態では、同一のデプスオクルージョン画像のセグメントファイルに配置される品質情報の符号化ストリームは、同一のトラックに配置される。従って、同一のデプスオクルージョン画像のセグメントファイルに配置される品質情報の符号化ストリームが、符号化ストリームごとに異なるトラックに配置される場合に比べて、デプスオクルージョン画像のセグメントファイル内のトラック数を削減することができる。その結果、デプスオクルージョン画像のセグメントファイルのサイズを小さくすることができる。また、動画再生端末14の負荷を軽減することができる。
(サンプルの構成例)
図26は、図25のトラック(quality1 track)のサンプルの構成例を示す図である。
図26に示すように、トラック(quality1 track)のサンプルは、2つのサブサンプルに分割され、各サブサンプルには、2Mbpsおよび1Mpbsのデプス画像の符号化ストリームのそれぞれが分割して配置される。
図26の例では、i番目(i=1,2,...,n)のサンプルの1つ目のサブサンプルに2Mbpsのデプス画像の符号化ストリーム(Depth1 Quality i)が配置され、2つ目のサブサンプルに1Mbpsのデプス画像の符号化ストリーム(Depth2 Quality i)が配置されている。サブサンプルの詳細については、ISO/IEC 23001-10に記載されている。
(デプスファイルのmoovボックスの構成例)
図27は、デプスファイル(depth1 file)のmoovボックス(movie box)の構成例を示す図である。
図27に示すように、デプスファイル(depth1 file)のmoovボックスには、トラックごとにtrakボックスが配置される。trakボックスには、トラックに固有のIDであるトラックID(track_ID)を記述するtkhdボックス(track header box)が配置される。
図27の例では、2Mbpsのデプス画像の符号化ストリームが配置されるトラック(depth1 track)のトラックIDが1であり、1Mpbsのデプス画像の符号化ストリームが配置されるトラック(depth2 track)のトラックIDが2である。また、2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリームが配置されるトラック(quality1 track)のトラックIDが3である。
trakボックスにはまた、自分のトラックと関係する他のトラックのトラックIDを記述するtrefボックス(track reference)を配置することができる。具体的には、トラック(quality1 track)は、トラック(depth1 track)とトラック(depth2 track)に配置されるデプス画像の符号化ストリームの品質情報の符号化ストリームを格納するトラックである。従って、トラック(quality1 track)には、トラック(depth1 track)とトラック(depth2 track)のトラックIDである1と2を記述するtrefボックスが配置される。
これにより、動画再生端末14は、トラック(quality1 track)が、トラック(depth1 track)とトラック(depth2 track)に配置されるデプス画像の符号化ストリームの品質情報の符号化ストリームを格納していることを認識することができる。
しかしながら、動画再生端末14は、トラック(quality1 track)のどのサブサンプルが、トラック(depth1 track)またはトラック(depth2 track)に格納されるデプス画像の符号化ストリームの品質情報の符号化ストリームを格納しているかを認識することはできない。
従って、第7実施の形態では、サブサンプルと、そのサブサンプルに配置される品質情報の符号化ストリームに対応するデプスオクルージョン画像のトラックを特定するトラックID(トラック特定情報)との対応関係(以下、サブサンプルトラック対応関係という)が記述される。これにより、動画再生端末14は、各サブサンプルに格納されるデプスオクルージョン画像の符号化ストリームの品質情報を認識することができる。その結果、動画再生端末14は、トラック(quality1 track)から各デプスオクルージョン画像の品質情報の符号化ストリームを取得することができる。
第7実施の形態では、サブサンプルトラック対応関係が、デプスオクルージョン画像のセグメントファイル内のQualityMetricsConfigurationBox,QualityMetricsSampleEntry,SubsampleInformationBox、またはSubsampleReferenceBoxに記述されるようにするが、これら以外のボックスに記述されるようにしてもよい。
(QualityMetricsConfigurationBoxの記述例)
図28は、サブサンプルトラック対応関係が、トラック(quality1 track)のtrakボックスに配置されるQualityMetricsConfigurationBoxに記述される場合のQualityMetricsConfigurationBoxの記述例を示す図である。
図28のQualityMetricsConfigurationBoxでは、field_size_bytesとmetric_countが記述され、metric_count分だけmetric_codeが記述される。field_size_bytes,metric_count、およびmetric_countは、クオリティファイルはトラック(quality1 track)に代わる点を除いて、図6の場合と同様である。
第7実施の形態では、クオリティファイルはトラック(quality1 track)のサンプルに、トラック(depth1 track)とトラック(depth2 track)の2種類の品質情報の符号化ストリームが格納される。従って、metric_countは2である。
また、QualityMetricsConfigurationBoxでは、サブサンプルトラック対応関係が記述可能であることを示す1が、flagとして設定される。
flagが1である場合、QualityMetricsConfigurationBoxには、metric_codeごとに、トラック(quality1 track)を含むデプスファイル(depth1 file)内に参照するトラックが存在するかどうかを示すreferenced_track_in_file_flagが記述される。
各metric_codeのreferenced_track_in_file_flagが1である場合、QualityMetricsConfigurationBoxには、そのmetric_codeに対応するサブサンプルのreference_track_id_numと、reference_track_id_num個のtrack_idとが記述される。
reference_track_id_numは、参照するデプスファイル(depth1 file)内のトラックの数である。track_idは、参照するデプスファイル(depth1 file)内のトラックのトラックIDである。
第7実施の形態では、トラック(quality1 track)のサンプル内の1つ目のサブサンプルは、デプスファイル(depth1 file)内のトラック(depth1 track)に対応し、2つ目のサブサンプルは、トラック(depth2 track)に対応する。従って、各サブサンプルに対応するmetric_code のreferenced_track_in_file_flagは、トラック(quality1 track)を含むデプスファイル(depth1 file)内に参照するトラックが存在することを示す1に設定される。
また、各サブサンプルに対応するmetric_codeのreference_track_id_numは1である。さらに、1つ目のサブサンプルに対応するmetric_codeのtrack_idは、そのサブサンプルに配置される品質情報の符号化ストリームに対応するデプス画像のトラック(depth1 track)を特定するトラックID(トラック特定情報)である1である。また、2つ目のサブサンプルに対応するmetric_codeのtrack_idは、そのサブサンプルに配置される品質情報の符号化ストリームに対応するデプス画像のトラック(depth2 track)のトラックIDである2である。
以上のように、QualityMetricsConfigurationBoxでは、サンプルに配置される順に、サブサンプルに対応するデプス画像のトラックIDが記述されることにより、サブサンプルトラック対応関係が記述される。
(QualityMetricsSampleEntryの記述例)
図29は、サブサンプルトラック対応関係がトラック(quality1 track)のtrakボックスに配置されるQualityMetricsSampleEntryに記述される場合のQualityMetricsSampleEntryの記述例を示す図である。
図29のQualityMetricsSampleEntryには、QualityMetricsReferenceBoxが配置される。QualityMetricsReferenceBoxには、図28のQualityMetricsConfigurationBoxと同様に、metric_countが記述される。また、QualityMetricsConfigurationBoxのmetric_codeの順で、referenced_track_in_file_flagが記述され、各metric_codeのreferenced_track_in_file_flagが1である場合、そのmetric_codeのreference_track_id_numとreference_track_id_num分のtrack_idが記述される。
(SubsampleInformationBoxの記述例)
図30は、サブサンプルトラック対応関係がトラック(quality1 track)のtrakボックスに配置されるSubsampleInformationBoxに記述される場合のSubsampleInformationBoxの記述例を示す図である。
SubsampleInformationBoxは、サブサンプルに関する情報を記述するボックスである。trakボックスは、flagsの値の異なるSubSampleInformationBoxを複数有することができる。図30のSubsampleInformationBoxでは、サブサンプルトラック対応関係が記述可能であることを示す2が、versionとして設定される。
versionが1より大きい場合、SubsampleInformationBoxには、サブサンプルごとに、track_reference_is_exist_flagとreferenced_track_in_file_flagが記述される。track_reference_is_exist_flagは、サブサンプルトラック対応関係を記述可能にする拡張が必要であるかどうかを示すフラグである。これにより、versionとして3以上の値が設定される場合に、サブサンプルトラック対応関係を記述可能にする拡張が無駄に行われることを防止することができる。
第7実施の形態では、サブサンプルトラック対応関係を記述可能にする拡張が必要であるため、track_reference_is_exist_flagは、サブサンプルトラック対応関係を記述可能にする拡張が必要であることを示す1に設定される。
各サブサンプルのtrack_reference_is_exist_flagとreferenced_track_in_file_flagの両方が1である場合、SubsampleInformationBoxには、そのサブサンプルのreference_track_id_numとreference_track_id_num個のtrack_idとが記述される。
(SubsampleReferenceBoxの記述例)
図31は、サブサンプルトラック対応関係がトラック(quality1 track)のtrakボックスに配置されるSubsampleReferenceBoxに記述される場合のSubsampleReferenceBoxの記述例を示す図である。
図31のSubsampleReferenceBoxには、サブサンプルごとに、referenced_track_in_file_flagが記述され、各サブサンプルのreferenced_track_in_file_flagが1である場合、そのサブサンプルのreference_track_id_numとreference_track_id_num 分のtrack_idが記述される。
(MPDファイルの記述例)
図32は、第7実施の形態におけるMPDファイルの記述例を示す図である。
図32のMPDファイルの構成は、デプスファイル用のアダプテーションセット要素およびオクルージョンファイル用のアダプテーションセット要素の構成、並びに、クオリティファイル用のアダプテーションセット要素が設けられない点を除いて、図10のMPDファイルの構成と同一である。
図32のデプスファイル用のアダプテーションセット要素には、デプスファイル(depth1 file)群に対応するリプレゼンテーション要素が記述される。
デプスファイル(depth1 file)群に対応するリプレゼンテーション要素には、Representation idとしてvd1が記述され、BaseURLとして「depth1.mp4」が記述される。なお、図32の例では、bandwidthが記述されていないが、bandwidthが記述されてもよい。
また、デプスファイル(depth1 file)とともに再生すべきテクスチャファイルは、テクスチャファイル(texture1 file)またはテクスチャファイル(texture2 file)である。従って、デプスファイル(depth1 file)に対応するリプレゼンテーション要素には、associationIDとしてテクスチャファイル(texture1 file)とテクスチャファイル(texture2 file)のRepresentation idであるvt1とvt2が記述される。
さらに、図32の例では、levaボックスにより、レベル1および2のそれぞれに、トラック(depth1 track)、トラック(depth2 track)が対応付けられている。
従って、図32のデプスファイル(depth1 file)群に対応するリプレゼンテーション要素には、レベル1と、associationIDとしての、トラック(depth1 track)とともに再生すべきテクスチャファイル(texture1 file)のRepresentation idであるvt1とを対応付ける<SubRepresentation level=”1” associationId=”vt1”>が記述される。
同様に、レベル2と、associationIDとしての、トラック(depth2 track)とともに再生すべきテクスチャファイル(texture1 file)およびテクスチャファイル(texture2 file)のRepresentation idであるvt1およびvt2とを対応付ける<SubRepresentation level=”2” associationId=”vt1 vt2”>が記述される。
オクルージョンファイル(occlusion1 file)群に対応するリプレゼンテーション要素には、Representation idとしてvo1が記述され、BaseURLとして「occlusion1.mp4」が記述される。なお、図32の例では、bandwidthが記述されていないが、bandwidthが記述されてもよい。
また、オクルージョンファイル(occlusion1 file)ともに再生すべきデプスファイルは、デプスファイル(depth1 file)である。従って、オクルージョンファイル(occlusion1 file)に対応するリプレゼンテーション要素には、associationIDとしてデプスファイル(depth1 file)のRepresentation idであるvd1が記述される。
なお、図32の例では、再生すべきパターンにおいて用いられる画像の組み合わせがMPDファイルに記述されていないが、記述されるようにしてもよい。
また、図示は省略するが、第7実施の形態におけるファイル生成処理は、ステップS13において生成されるデプスファイルおよびオクルージョンファイルに、対応する品質情報が配置され、ステップS14およびS15の処理が行われない点を除いて、図12のファイル生成処理と同一である。
さらに、図示は省略するが、第7実施の形態における再生処理は、サブサンプルトラック対応関係も参照して符号化ストリームが取得される点を除いて、図14や図15の再生処理と同一である。
以上のように、第7実施の形態におけるファイル生成装置11は、同一のデプスオクルージョン画像のセグメントファイルに配置される複数の品質情報の符号化ストリームを、まとめて1つのトラックに配置する。従って、各品質情報の符号化ストリームを異なるトラックに配置する場合に比べて、デプスオクルージョン画像のセグメントファイルを構成するトラックの数を削減することができる。即ち、デプスオクルージョン画像の品質情報を効率的に格納することができる。これにより、デプスオクルージョン画像のセグメントファイルのサイズが削減される。その結果、ファイル生成装置11が、デプスオクルージョン画像のセグメントファイルをアップロードする際の伝送量が低減される。
なお、第7実施の形態では、品質情報がデプスオクルージョン画像の品質情報であったが、テクスチャ画像またはテクスチャ画像とデプスオクルージョン画像を用いて再生される3D画像の品質情報であるようにしてもよい。
この場合、例えば、テクスチャファイルに、テクスチャ画像のトラックとテクスチャ画像の品質情報のトラックが配置され、デプスファイルに、デプス画像のトラックと、テクスチャ画像およびデプス画像を用いて再生される3D画像の品質情報のトラックが配置される。また、オクルージョンファイルに、オクルージョン画像のトラックと、テクスチャ画像、デプス画像、およびオクルージョン画像を用いて再生される3D画像の品質情報のトラックが配置される。
<第8実施の形態>
(セグメントファイルの構成例)
本開示を適用した情報処理システムの第8実施の形態の構成は、主に、同一のクオリティファイル内の品質情報の符号化ストリームは同一のトラックに配置される点を除いて、図1の情報処理システム10の構成と同一である。従って、以下では、デプス画像のクオリティファイル(quality1 file)に関する説明以外の説明は適宜省略する。
図33は、本開示を適用した情報処理システムの第8実施の形態のセグメントファイル生成部83により生成されるセグメントファイルの例を示す図である。
図33のセグメントファイルは、デプス画像のクオリティファイル(quality1 file)を除いて、図5のセグメントファイルと同一である。
図33に示すように、セグメントファイル生成部83は、2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリームをまとめて1つのトラック(quality1 track)に配置したクオリティファイル(quality1 file)を生成する。トラック(quality1 track)では、第7実施の形態と同様に、2Mbpsおよび1Mpbsのデプス画像の品質情報の符号化ストリームの両方がまとめてサンプル化されている。
第8実施の形態におけるMPDファイルは、図10のMPDファイルと同一である。即ち、第8実施の形態におけるMPDファイルでは、クオリティファイル(quality1 file)に対応するリプレゼンテーション要素において、各レベルとデプスオクルージョン画像を特定するassociationIDとの対応関係が記述される。
(levaボックスの第1の記述例)
図34は、クオリティファイル(quality file)のlevaボックスの第1の記述例を示す図である。
図34に示すように、クオリティファイル(quality file)のlevaボックスには、MPDファイルに記述されたクオリティファイル(quality file)に対応するサブリプレゼンテーション要素が有するレベルの数を示すlevel_countが記述される。
また、クオリティファイル(quality file)のlevaボックスには、レベル1から順にlevel_countだけ、各レベルのtrack_id,assignment_type等が記述される。assignment_typeは、レベルと対応付けられるもののタイプである。
図34のlevaボックスでは、assignment_typeとして5が設定可能になっている。図34の例では、assignment_typeとしての5は、レベルと対応付けられるもののタイプが、QualityMetricsConfigurationBoxに記述されるmetric_codeであることを表している。即ち、assignment_typeが5である場合、レベルi(i=1,2)と、QualityMetricsConfigurationBoxに記述される先頭からi番目のmetric_codeが対応付けられる。
(levaボックスにより対応付けられるレベルとサブサンプルの第1の例の説明)
図35は、図34のlevaボックスにより対応付けられるクオリティファイル(quality1 file)におけるレベルとサブサンプルの第1の例を説明する図である。
第8実施の形態のMPDファイルにおいて、クオリティファイル(quality1 file)に対応するサブリプレゼンテーション要素が有するレベルの数は、2つである。従って、図35に示すように、クオリティファイル(quality file)のlevaボックスには、level_countとして2が記述される。
また、2つのレベルに対応するトラックは、トラックIDが1であるトラック(quality1 track)である。従って、クオリティファイル(quality file)のlevaボックスには、2つのレベルのtrack_idとして1が記述される。また、2つのレベルのassignment_typeとして5が記述される。
従って、図35のlevaボックスにより、各サブリプレゼンテーション要素が有するレベルiを、QualityMetricsConfigurationBoxに記述される先頭からi番目のmetric_codeと対応付けることができる。そして、QualityMetricsConfigurationBoxの記述により、QualityMetricsConfigurationBoxに記述される先頭からi番目のmetric_codeと、先頭からi番目のサブサンプルとを対応付けることができる。
以上のように、levaボックスのassignment_typeとして5を記述することにより、MPDファイルに記述されるレベルiとi番目のサブサンプルとを対応付けることができる。従って、assignment_typeとしての5は、レベルとサブサンプルとを対応付ける情報といえる。
(levaボックスの第2の記述例)
図36は、クオリティファイル(quality file)のlevaボックスの第2の記述例を示す図である。
図36のクオリティファイル(quality file)のlevaボックスは、assignment_typeとして5が設定される場合を除いて、図34の構成と同一である。
図36の例では、assignment_typeとしての5は、レベルと対応付けられるもののタイプが、subsボックス(Sub-Sample Information Box)に情報が記述されるサブサンプルであることを表している。即ち、assignment_typeが5である場合、レベルiと、subsボックスに情報が記述される先頭からi番目のサブサンプルとが対応付けられる。また、図36のlevaボックスでは、assignment_typeが5である場合、レベルiと対応付けられるsubsボックスのflagsが記述される。
(levaボックスにより対応付けられるレベルとサブサンプルの第2の例の説明)
図37は、図36のlevaボックスにより対応付けられるクオリティファイル(quality1 file)におけるレベルとサブサンプルの第2の例を説明する図である。
図37のlevaボックスは、各レベルのsubsample_flagとして0が記述される点を除いて、図35のlevaボックスと同一である。
従って、図37のlevaボックスにより、各サブリプレゼンテーション要素が有するレベルiを、flagsが0であるsubsボックスに情報が記述される先頭からi番目のサブサンプルと対応付けることができる。そして、subsボックスの記述により、subsボックスに情報が記述される先頭からi番目のサブサンプルを特定することができる。
以上のように、levaボックスのassignment_typeとして5を記述することにより、MPDファイルに記述されるレベルとサブサンプルとを対応付けることができる。従って、assignment_typeとしての5は、レベルとサブサンプルとを対応付ける情報といえる。
なお、トラック(quality1 track)に配置される2つのサブサンプルは、1つのグループにグループ分けされていてもよい。この場合、図38に示すサブサンプルグループエントリ(Sub-SampleGroupEntry)が、トラック(quality1 track)のtrakボックスに配置される。
図38のサブサンプルグループエントリは、画像を格納するサブサンプルだけでなく、画像以外を格納するサブサンプルのサブサンプルグループエントリの基になるSampleGroupDescriptionEntryが拡張されたものである。
図38のサブサンプルグループエントリには、サブサンプルのグループのタイプ(図38の例ではsgss)が記述される。また、図38のサブサンプルグループエントリには、グループに属するサブサンプルのサンプルエントリの名前であるcode_parameterと、subsボックスのflagsであるsub_sample_flagsが記述される。
また、図39に示すように、levaボックスのassignment_typeは、レベルと対応付けられるもののタイプが、sgpdボックス(sample group description box)に記述される所定のグループに属するサブサンプルに関する情報であることを表す0に設定される。
さらに、levaボックスには、subsample_flagではなく、レベルi(i=1,2)と対応付けられるsgpdボックスに記述されるgrouping_typeが記述される。grouping_typeは、sgpdボックスに対応するサブサブサンプルのグループのタイプである。図36の例では、トラック(quality1 track)に配置される2つのサブサンプルが属するグループのタイプがsgssであり、levaボックスの各レベルに対応するgrouping_typeは、両方ともsgssである。
図39のlevaボックスにより、各サブリプレゼンテーション要素が有するレベルiが、sgpdボックスに記述される、grouping_typeがsgssであるグループに属するサブサンプルに関する情報のうちの、先頭からi番目のサブサンプルに関する情報と対応付けられる。
サブサンプルに関する情報としては、サブサンプルを構成するサンプルのサンプルエントリの名前とsubsボックスのflagsが記述される。図36の例では、トラック(quality1 track)に配置される2つのサブサンプルを構成するサンプルのサンプルエントリの名前は両方ともvqmeであり、flagsは両方とも0である。従って、sgpdボックスには、各サブサンプルに関する情報として、vqmeと0が記述される。
このsgpdボックスの記述により、各サブリプレゼンテーション要素が有するレベルiを、flagが0であり、サンプルエントリの名前がvqmeであるサンプルのsubsボックスに情報が記述される先頭からi番目のサブサンプルと対応付けることができる。そして、subsボックスの記述により、subsボックスに情報が記述される先頭からi番目のサブサンプルを特定することができる。
以上のように、図39のlevaボックスにより、MPDファイルに記述されるレベルとサブサンプルとを対応付けることができる。
なお、第8実施の形態において、第2乃至第6実施の形態のように、クオリティファイルが分割されていてもよい。
また、第1乃至第8実施の形態では、associationIdを記述できるようにサブリプレゼンテーション要素が拡張されたが、associationId以外のattributeを記述できるようにサブリプレゼンテーション要素が拡張されてもよい。
例えば、サブリプレゼンテーション要素に対応するRepresentationIDを記述するSubassociationIdなどのattributeが新しく定義され、そのattributeを記述できるようにサブリプレゼンテーション要素が拡張されてもよい。
また、復号時に参照が必要なトラックのIDを示すattributeであるdependencyIdをサブリプレゼンテーション要素にも記述できるようにサブリプレゼンテーション要素が拡張され、サブリプレゼンテーション要素のdependencyIdとして、そのサブリプレゼンテーション要素に対応するRepresentationIDが記述されるようにしてもよい。
なお、サブリプレゼンテーション要素とRepresentationIDの対応関係を示すサブリプレゼンテーション要素のattributeは、テクスチャ画像とデプスオクルージョン画像の関係や、デプスオクルージョン画像と品質情報の関係以外の関係を表す際にも用いることができる。
<第9実施の形態>
(本開示を適用したコンピュータの説明)
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図40は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータ200において、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。
バス204には、さらに、入出力インタフェース205が接続されている。入出力インタフェース205には、入力部206、出力部207、記憶部208、通信部209、及びドライブ210が接続されている。
入力部206は、キーボード、マウス、マイクロフォンなどよりなる。出力部207は、ディスプレイ、スピーカなどよりなる。記憶部208は、ハードディスクや不揮発性のメモリなどよりなる。通信部209は、ネットワークインタフェースなどよりなる。ドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア211を駆動する。
以上のように構成されるコンピュータ200では、CPU201が、例えば、記憶部208に記憶されているプログラムを、入出力インタフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ200(CPU201)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア211に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータ200では、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インタフェース205を介して、記憶部208にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部209で受信し、記憶部208にインストールすることができる。その他、プログラムは、ROM202や記憶部208に、あらかじめインストールしておくことができる。
なお、コンピュータ200が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
なお、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
さらに、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、オクルージョン画像のセグメントファイルは生成されなくてもよい。即ち、本開示は、デプス画像のみ、または、デプス画像とオクルージョン画像の両方からなるデプス関連画像、即ち少なくともデプス画像を含むデプス関連画像のセグメントファイルが生成される情報処理システムに適用することができる。
なお、本開示は、以下のような構成もとることができる。
(1)
少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルを生成するファイル生成部
を備えるファイル生成装置。
(2)
前記ファイル生成部は、前記品質情報を前記種類ごとに分割して異なる前記ファイルに配置する
ように構成された
前記(1)に記載のファイル生成装置。
(3)
前記デプス関連画像は、前記デプス画像に対応するオクルージョン領域のテクスチャ画像であるオクルージョン画像を含む
ように構成された
前記(2)に記載のファイル生成装置。
(4)
前記オクルージョン画像の前記品質情報は、前記テクスチャ画像の画面に対する前記オクルージョン領域の割合または前記オクルージョン画像のノイズ量を表す情報である
ように構成された
前記(3)に記載のファイル生成装置。
(5)
前記種類は、前記デプス関連画像の種類である
ように構成された
前記(3)または(4)に記載のファイル生成装置。
(6)
前記種類は、前記デプス関連画像に対応するテクスチャ画像である
ように構成された
前記(2)乃至(4)のいずれかに記載のファイル生成装置。
(7)
前記品質情報は、前記デプス関連画像に対応するテクスチャ画像と前記デプス関連画像とを用いて再生される3D画像の品質を表す情報である
ように構成された
前記(2)または(3)に記載のファイル生成装置。
(8)
前記ファイル生成部は、複数のビットレートの前記デプス関連画像の前記品質情報を前記種類ごとに分割して異なる前記ファイルに配置する場合、同一の前記ファイルに配置される複数の前記品質情報をそれぞれ異なるトラックに配置する
ように構成された
前記(2)乃至(7)のいずれかに記載のファイル生成装置。
(9)
前記ファイル生成部は、複数のビットレートの前記デプス関連画像の前記品質情報を前記種類ごとに分割して異なる前記ファイルに配置する場合、同一の前記ファイルに配置される複数の前記品質情報をまとめてサンプル化して、同一のトラックに配置する
ように構成された
前記(2)乃至(5)のいずれかに記載のファイル生成装置。
(10)
前記サンプルには、前記複数の品質情報のそれぞれが異なるサブサンプルに分割して配置され、
前記ファイル生成部は、前記サブサンプルと、前記サブサンプルに配置される前記品質情報に対応する前記デプス関連画像のトラックを特定するトラック特定情報との対応関係を前記ファイルに記述する
ように構成された
前記(9)に記載のファイル生成装置。
(11)
前記ファイル生成部は、前記サンプルに配置される順に、前記サブサンプルに対応する前記デプス関連画像のトラック特定情報を前記ファイルに記述することにより、前記ファイルに前記対応関係を記述する
ように構成された
前記(10)に記載のファイル生成装置。
(12)
前記サブサンプルに配置される前記品質情報に対応する前記デプス関連画像のトラックは、前記品質情報のトラックと同一の前記ファイルに配置される
前記(10)または(11)に記載のファイル生成装置。
(13)
ファイル生成装置が、
少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルを生成するファイル生成ステップ
を含むファイル生成方法。
(14)
少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルから、所定の種類の前記品質情報を取得する取得部
を備える再生装置。
(15)
再生装置が、
少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルから、所定の種類の前記品質情報を取得する取得ステップ
を含む再生方法。
11 ファイル生成装置, 14 動画再生端末, 83 セグメントファイル生成部, 84 MPDファイル生成部, 103 品質情報取得部, 105 画像取得部, 106 復号部, 107 出力制御部

Claims (15)

  1. 少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルを生成するファイル生成部
    を備えるファイル生成装置。
  2. 前記ファイル生成部は、前記品質情報を前記種類ごとに分割して異なる前記ファイルに配置する
    ように構成された
    請求項1に記載のファイル生成装置。
  3. 前記デプス関連画像は、前記デプス画像に対応するオクルージョン領域のテクスチャ画像であるオクルージョン画像を含む
    ように構成された
    請求項2に記載のファイル生成装置。
  4. 前記オクルージョン画像の前記品質情報は、前記テクスチャ画像の画面に対する前記オクルージョン領域の割合または前記オクルージョン画像のノイズ量を表す情報である
    ように構成された
    請求項3に記載のファイル生成装置。
  5. 前記種類は、前記デプス関連画像の種類である
    ように構成された
    請求項3に記載のファイル生成装置。
  6. 前記種類は、前記デプス関連画像に対応するテクスチャ画像である
    ように構成された
    請求項2に記載のファイル生成装置。
  7. 前記品質情報は、前記デプス関連画像に対応するテクスチャ画像と前記デプス関連画像とを用いて再生される3D画像の品質を表す情報である
    ように構成された
    請求項2に記載のファイル生成装置。
  8. 前記ファイル生成部は、複数のビットレートの前記デプス関連画像の前記品質情報を前記種類ごとに分割して異なる前記ファイルに配置する場合、同一の前記ファイルに配置される複数の前記品質情報をそれぞれ異なるトラックに配置する
    ように構成された
    請求項2に記載のファイル生成装置。
  9. 前記ファイル生成部は、複数のビットレートの前記デプス関連画像の前記品質情報を前記種類ごとに分割して異なる前記ファイルに配置する場合、同一の前記ファイルに配置される複数の前記品質情報をまとめてサンプル化して、同一のトラックに配置する
    ように構成された
    請求項2に記載のファイル生成装置。
  10. 前記サンプルには、前記複数の品質情報のそれぞれが異なるサブサンプルに分割して配置され、
    前記ファイル生成部は、前記サブサンプルと、前記サブサンプルに配置される前記品質情報に対応する前記デプス関連画像のトラックを特定するトラック特定情報との対応関係を前記ファイルに記述する
    ように構成された
    請求項9に記載のファイル生成装置。
  11. 前記ファイル生成部は、前記サンプルに配置される順に、前記サブサンプルに対応する前記デプス関連画像のトラック特定情報を前記ファイルに記述することにより、前記ファイルに前記対応関係を記述する
    ように構成された
    請求項10に記載のファイル生成装置。
  12. 前記サブサンプルに配置される前記品質情報に対応する前記デプス関連画像のトラックは、前記品質情報のトラックと同一の前記ファイルに配置される
    請求項10に記載のファイル生成装置。
  13. ファイル生成装置が、
    少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルを生成するファイル生成ステップ
    を含むファイル生成方法。
  14. 少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルから、所定の種類の前記品質情報を取得する取得部
    を備える再生装置。
  15. 再生装置が、
    少なくともデプス画像を含むデプス関連画像の品質を表す品質情報を種類ごとに分割して配置するファイルから、所定の種類の前記品質情報を取得する取得ステップ
    を含む再生方法。
JP2018501553A 2016-02-22 2017-02-08 ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法 Active JP6868783B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016030859 2016-02-22
JP2016030859 2016-02-22
PCT/JP2017/004531 WO2017145756A1 (ja) 2016-02-22 2017-02-08 ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法

Publications (2)

Publication Number Publication Date
JPWO2017145756A1 true JPWO2017145756A1 (ja) 2018-12-20
JP6868783B2 JP6868783B2 (ja) 2021-05-12

Family

ID=59685019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018501553A Active JP6868783B2 (ja) 2016-02-22 2017-02-08 ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法

Country Status (5)

Country Link
US (2) US10904515B2 (ja)
EP (1) EP3422702B1 (ja)
JP (1) JP6868783B2 (ja)
CN (1) CN108702478B (ja)
WO (1) WO2017145756A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114051737A (zh) * 2019-07-04 2022-02-15 索尼集团公司 信息处理装置、信息处理方法、再现处理装置以及再现处理方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11049219B2 (en) * 2017-06-06 2021-06-29 Gopro, Inc. Methods and apparatus for multi-encoder processing of high resolution content
US11509917B2 (en) * 2017-07-19 2022-11-22 Nec Corporation Data delivery device, system, method, and recording medium
US11228781B2 (en) 2019-06-26 2022-01-18 Gopro, Inc. Methods and apparatus for maximizing codec bandwidth in video applications
US11481863B2 (en) 2019-10-23 2022-10-25 Gopro, Inc. Methods and apparatus for hardware accelerated image processing for spherical projections
US20210400100A1 (en) 2020-06-23 2021-12-23 Tencent America LLC Bandwidth cap signaling using combo-index segment track in media streaming

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014107377A2 (en) * 2013-01-04 2014-07-10 Qualcomm Incorporated Signaling of spatial resolution of depth views in multiview coding file format
WO2014112186A1 (ja) * 2013-01-18 2014-07-24 ソニー株式会社 コンテンツサーバおよびコンテンツ配信方法
WO2015008774A1 (ja) * 2013-07-19 2015-01-22 ソニー株式会社 情報処理装置および方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4177409B2 (ja) * 2004-04-07 2008-11-05 松下電器産業株式会社 情報記録装置及び情報記録方法
JP5542912B2 (ja) * 2009-04-09 2014-07-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディア・コンテナ・ファイル管理
US9406132B2 (en) * 2010-07-16 2016-08-02 Qualcomm Incorporated Vision-based quality metric for three dimensional video
KR20130011994A (ko) * 2011-07-22 2013-01-30 삼성전자주식회사 송신 장치, 수신 장치 및 그 송수신 방법
KR20130088636A (ko) * 2012-01-31 2013-08-08 삼성전자주식회사 영상 전송 장치 및 방법, 그리고 영상 재생 장치 및 방법
US20130329939A1 (en) * 2012-06-12 2013-12-12 Jorg-Ulrich Mohnen Decoding a quilted image representation into a digital asset along with content control data
KR102216585B1 (ko) * 2013-01-04 2021-02-17 삼성전자주식회사 깊이 영상의 부호화 장치 및 복호화 장치, 부호화 방법 및 복호화 방법
CN105230024B (zh) * 2013-07-19 2019-05-24 华为技术有限公司 一种媒体表示自适应方法、装置及计算机存储介质
US20150181168A1 (en) * 2013-12-20 2015-06-25 DDD IP Ventures, Ltd. Interactive quality improvement for video conferencing
KR20170019361A (ko) * 2014-06-18 2017-02-21 삼성전자주식회사 깊이 블록을 이용하는 멀티 레이어 비디오 부호화 방법 및 멀티 레이어 비디오 복호화 방법
US20160373771A1 (en) * 2015-06-18 2016-12-22 Qualcomm Incorporated Design of tracks and operation point signaling in layered hevc file format
KR101731430B1 (ko) * 2015-07-02 2017-04-28 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014107377A2 (en) * 2013-01-04 2014-07-10 Qualcomm Incorporated Signaling of spatial resolution of depth views in multiview coding file format
WO2014112186A1 (ja) * 2013-01-18 2014-07-24 ソニー株式会社 コンテンツサーバおよびコンテンツ配信方法
WO2015008774A1 (ja) * 2013-07-19 2015-01-22 ソニー株式会社 情報処理装置および方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114051737A (zh) * 2019-07-04 2022-02-15 索尼集团公司 信息处理装置、信息处理方法、再现处理装置以及再现处理方法

Also Published As

Publication number Publication date
CN108702478B (zh) 2021-07-16
EP3422702B1 (en) 2022-12-28
US20210076024A1 (en) 2021-03-11
WO2017145756A1 (ja) 2017-08-31
EP3422702A4 (en) 2019-01-02
US11252397B2 (en) 2022-02-15
JP6868783B2 (ja) 2021-05-12
US20190007676A1 (en) 2019-01-03
US10904515B2 (en) 2021-01-26
EP3422702A1 (en) 2019-01-02
CN108702478A (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
JP6868783B2 (ja) ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法
JP5829626B2 (ja) 再生装置、再生装置の制御方法、生成装置、生成装置の制御方法、制御プログラム、及び該プログラムを記録した記録媒体
KR101777348B1 (ko) 데이터 전송 방법 및 장치와 데이터 수신 방법 및 장치
JP6944131B2 (ja) ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法
JP7080007B2 (ja) 情報処理装置および情報処理方法
WO2015182491A1 (ja) 情報処理装置および情報処理方法
JP6697695B2 (ja) 情報処理装置および情報処理方法
JP7238948B2 (ja) 情報処理装置および情報処理方法
WO2018142946A1 (ja) 情報処理装置および方法
KR101944601B1 (ko) 기간들에 걸쳐 오브젝트들을 식별하기 위한 방법 및 이에 대응하는 디바이스
JPWO2018173876A1 (ja) コンテンツ処理装置およびコンテンツ処理方法、並びにプログラム
CN101395909A (zh) 用于组合编辑信息和媒体内容的方法和系统

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210322

R151 Written notification of patent or utility model registration

Ref document number: 6868783

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151