JPWO2019031306A1 - 生成装置、再生装置、生成方法、再生方法、制御プログラム、記録媒体 - Google Patents

生成装置、再生装置、生成方法、再生方法、制御プログラム、記録媒体 Download PDF

Info

Publication number
JPWO2019031306A1
JPWO2019031306A1 JP2019535125A JP2019535125A JPWO2019031306A1 JP WO2019031306 A1 JPWO2019031306 A1 JP WO2019031306A1 JP 2019535125 A JP2019535125 A JP 2019535125A JP 2019535125 A JP2019535125 A JP 2019535125A JP WO2019031306 A1 JPWO2019031306 A1 JP WO2019031306A1
Authority
JP
Japan
Prior art keywords
video
thinned
image
viewpoint
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019535125A
Other languages
English (en)
Inventor
徳毛 靖昭
靖昭 徳毛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPWO2019031306A1 publication Critical patent/JPWO2019031306A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

ネットワークとクライアントに対する負荷を軽減させるような映像の高速再生を可能にする生成装置及び再生装置を実現する。上記の課題を解決するために、本発明の一態様に係る生成装置(10)は、複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を生成する情報生成部(111)と、一部のフレームが前記ある部分映像から間引かれた間引映像を示すデータを生成するデータ生成部(112)とを備える。また、本発明の一態様に係る再生装置(20)は、複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を参照して、該ある部分映像、又は、一部のフレームが該ある部分映像から間引かれた間引映像を再生する再生処理部(211)を備える。

Description

本発明の一態様は、複数の視点又は視線方向の映像に関するデータを生成する生成装置及び生成方法、該データを再生する再生装置及び再生方法、並びに該データの生成又は再生に関する制御プログラム及び記録媒体に関する。
従来、同じ位置に設置した複数のカメラで撮影した撮影映像を合成することによって上下左右360度の全方位又は全方位に準ずる範囲の映像(全天球映像)を生成する技術がある。類似の技術として、異なる位置に設置した複数のカメラ(視点)で同じ被写体を撮影した撮影映像を合成することによって多視点映像を生成する技術も存在する。
また、近年、映像を配信するための様々な技術が開発されている。映像を配信するための技術としては、MPEG(Moving Picture Experts Group)にて現在標準化作業が進められているDASH(Dynamic Adaptive Streaming over HTTP)が挙げられる(非特許文献1)。DASHでは、MPD(Media Presentation Description)データ等のメタデータのフォーマットが規定されている。
ISO/IEC 23009-1 Second edition 2014-05-15
従来、サーバ上に存在する映像であって、多視点映像における特定の視点からの映像をクライアント側の端末が高速再生するケースとして、一部のフレームを間引くことによって高速再生を行うケースがあった。このような高速再生には以下のような問題があった。
即ち、サーバ側からクライアント側へ該映像の高速再生に必要が無いフレーム部分のデータまで送信していた。そのため、サーバとクライアント間のネットワークに余分な負荷がかかっていた。
さらに、クライアント側でも、間引くべきフレーム(再生に必要がないフレーム)を特定する処理も必要であったため、クライアントのCPUにも余分な負荷がかかっていた。
本発明の一様態は以上の課題に鑑みてなされたものであり、ネットワークとクライアントに対する負荷を軽減させるような映像の高速再生を可能にする生成装置及び再生装置を実現することを主たる目的とする。
上記の課題を解決するために、本発明の一態様に係る生成装置は、複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を生成する情報生成部と、一部のフレームが前記ある部分映像から間引かれた間引映像を示すデータを生成するデータ生成部とを備える。また、本発明の一態様に係る再生装置は、複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を参照して、該ある部分映像、又は、一部のフレームが該ある部分映像から間引かれた間引映像を再生する再生処理部を備える。
本発明の一態様によれば、ネットワークとクライアントに対する負荷を軽減させるような映像の高速再生を可能にする生成装置及び再生装置を実現できる。
本発明の実施形態1に係る生成装置と再生装置の機能ブロック図である。 実施形態1に係るMPDデータを生成する処理等を示す図である。 実施形態1に係る、視点Pの撮影映像を加工して間引映像を生成する処理の一部について、説明するための図である。 実施形態1に係る、視点Pの撮影映像を加工して、間引映像を生成する処理の一部について説明するための図である。 実施形態1に係る生成装置の一動作を示すフローチャートである。 実施形態1に係る再生装置の一動作を示すフローチャートである。 実施形態1の変形例に係る、視点Pの撮影映像を加工して間引映像を生成する処理の一部について、説明するための図である。 実施形態1の変形例に係る、視点Pの撮影映像を加工して、間引映像を生成する処理の一部について説明するための図である。 実施形態2に係るMPDデータを生成する処理等を示す図である。 実施形態2に係る、視点P及び視点Qの撮影映像を加工して、間引映像を生成する処理の一部について説明するための図である。 実施形態2に係る生成装置の一動作を示すフローチャートである。 実施形態2に係る再生装置の一動作を示すフローチャートである。 実施形態2の変形例に係る3次元モデルデータを付加した間引映像を生成する処理の一部について説明するための図である。 その他の実施形態における間引映像を生成する処理に関する図である。
以下、本発明の実施形態について図1〜図14に基づいて説明すれば以下の通りである。
〔実施形態1〕
本発明の一実施形態に係る多視点映像システム(以下、単に「多視点映像システム」と称する)について、以下に説明する。
多視点映像システムは、被写体を円状に取り囲む複数の視点の各々の撮影映像が合成された全体映像(多視点映像)におけるある撮影映像(ある視点映像)を高速再生する。なお、本明細書において視点とはユーザの仮想的な立ち位置に相当する場所という意味と該ユーザが向ける視線方向という意味の両方を包含する。
本実施形態では、生成装置が、撮影映像を加工して、一部のフレームが予め間引かれた間引映像を生成し、撮影映像に対する高速再生の操作を受け付けた再生装置は、間引映像を再生するようになっている。以下では、加工前の撮影映像のことを元映像とも称する。
なお、生成装置は、多視点映像を構成する各視点映像(元映像)から間引映像を生成する機能に加え、多視点映像自体を生成する機能(複数台のカメラ)を備えたサーバであってもよい。ただし、該機能(複数台のカメラ)は本発明において必須ではない。該機能を備えていない生成装置(サーバ)には、撮影済の多視点映像を予め保存しておくものとする。
[1.生成装置10と再生装置20の構成]
図1は実施形態1に係る生成装置と再生装置の機能ブロック図である。
生成装置10は制御部11、記憶部12、及び送信部19を備えており、再生装置20は制御部21、記憶部22、表示部23及び受信部29を備えている。制御部11は、生成装置10全体を統括する制御回路であり、情報生成部111とデータ生成部112として機能する。また、制御部21は、再生装置20全体を統括する制御回路であり、再生処理部211として機能する。
記憶部12は、生成装置10において撮影映像を加工する場合等に参照又は生成するデータを保持する記憶装置である。送信部19は、例えば再生装置20にデータを送信する送信回路である。
情報生成部111は多視点映像における、ある撮影映像の再生に関するメタ情報を生成する。
データ生成部112は元映像から間引映像を示すデータを生成する。
記憶部22は再生装置20において映像を再生する際に参照すべきデータを保持する記憶装置である。表示部23はユーザの操作に基づき再生された映像が表示される表示パネルである。受信部29は例えば生成装置10から送られたデータを受信する受信回路である。
再生処理部211は、ユーザによる再生操作の種類(標準速再生、又は、高速再生)に応じて、元映像、又は、元映像を加工した間引映像を再生する。なお、必ずしも図1のように生成装置と再生装置の間にネットワークを介しているとは限らず、生成装置10と再生装置20が直接的に接続されていても構わない。また、記憶部12は生成装置10の外部に、記憶部22及び表示部23は再生装置20の外部にそれぞれ存在していても構わない。
[2.MPDデータ及びメディアセグメントについて]
図2は、ある視点Pの撮影映像を高速再生するためのMPDデータを生成する処理、及び、MPDデータを参照して撮影映像を高速再生する処理について、説明するための図である。なお、視点Pの撮影映像は、多視点映像を合成するために使用した、異なる複数の視点からの複数の撮影映像のうちの1つである。
MPDデータは、撮影映像の再生に関する前述のメタ情報の一例である。また、メディアセグメントは、元映像及び間引映像を時分割したHTTP伝送の伝送単位(例えば、ISOBMFF(ISO Base Media File Format)をベースにしたデータ)である。各メディアセグメントは、I(Intra、イントラ)フレーム、P(Predictive、片方向予測)フレーム、及び、B(Bi-directional、双方向予測)フレームを含んでいる。
この図を参照して、MPDデータ及びメディアセグメントについてもう少し具体的に説明する。MPDデータは、図2のように、上位の階層要素から順に、MPD要素100、Period要素110、AdaptationSet要素(120、121)、Representation要素(130、131)、SegmentList要素、及び、SegmentURL要素を含む木構造となっている。なお、図2におけるSegment 1(140−1)、Segment n(140−n)、Segment(141)等はSegmentList要素に含まれるn個のSegmentURL要素に相当し、SegmentList要素は、図2においては省略されている。
本実施形態では、ある視点Pの撮影映像を再生するためのAdaptationSet要素として、少なくとも標準速再生用120と高速再生用121との2つが存在する。
なお、各階層要素が含む直下の階層要素のデータの数は1つとは限らず、扱う映像データサイズ等によって異なる。例えば、MPD要素は、図2のように1つのPeriod要素を含むことも、複数のPeriod要素を含むこともあり得る。AdaptationSet要素はRepresentation要素及びSegmentList要素を介して通常複数のSegmentURL要素を含んでいる。即ち、標準速再生用のAdaptationSet要素120に含まれる各SegmentURL要素(第2の情報)は、上位階層であるPeriod要素が示す期間の元映像が時分割されたn個のメディアセグメントのうちの、対応する1つの映像の取得先を示す情報(URL)を含んでいる。
また、高速再生用のAdaptationSet要素121においては、SegmentURL要素141(第1の情報)が、上位階層であるPeriod要素が示す期間の間引映像が時分割された1又は複数のメディアセグメントのうちの、対応する1つの映像の取得先を示す情報(URL)を含んでいる。
以下、各メディアセグメントが有するインデックス情報(例えばsidxボックスやssixボックスのインデックス情報)について説明する。
MPEG-DASHの各メディアセグメントはメタ情報として内部にstyp,sidx,ssix,moof等のボックスと呼ばれる情報を有している。このうちsidxボックスには対応するメディアセグメントに含まれるランダムアクセスポイント(例えば、Iフレーム)の位置を特定するインデックスが格納されている。ssixボックスのL0レイヤーには対応するメディアセグメントに含まれるIフレームの位置を特定するインデックスが格納されており、ssixボックスのL1レイヤーには対応するメディアセグメントに含まれるPフレームの位置を特定するインデックスが格納されている。即ち、メディアセグメントが含むIフレームの位置を特定する場合には、そのメディアセグメント自身のsidxボックスを参照してもいいし、そのメディアセグメント自身のssixボックスのL0レイヤーを参照しても構わない。
[3.生成装置10における処理の流れ]
以下、生成装置10が前述のMPDデータ及び間引映像を生成する動作について、図2〜図5を参照しながら説明する。図3及び図4は、視点Pの撮影映像を加工して、間引映像を生成する処理について説明するための図である。図5は、生成装置の上記動作を示すフローチャートである。
データ生成部112は、記憶部12に記録されている、視点Pの元映像を構成するn個のメディアセグメントの各々について、前述の方法を用いてIフレームの位置を特定する(S51)。そして、図3に示すように、データ生成部112は、n個の各メディアセグメント(150−1、・・、150−n)から、特定した位置のフレーム(Iフレーム、例えば、図3のI1及びI10)以外のフレーム(Bフレーム、Pフレーム)を間引く(S52)。
そして、データ生成部112は、Bフレーム及びPフレームが間引かれたn個のメディアセグメント(150−1’、・・、151−n’)から、間引映像を構成するメディアセグメント151を生成する(S53)。具体的には、図3及び図4からわかるように、n個のメディアセグメントにおいてより早く提示されるべき位置にあるIフレームがより早い時期に提示されるように、間引映像を構成する1又は複数のメディアセグメントを生成する。
その結果、記憶部12には、視点Pの元映像とは別に、元映像からBフレーム及びPフレームが間引かれた間引映像が記録されることとなる。
その後、生成装置10は、公知のMPDデータの生成処理に加えて以下の処理を行うことによって、前述のMPDデータを生成する。
即ち、情報生成部111は、視点Pの元映像を構成するn個のメディアセグメント(150−1、・・、150−n)の取得先を示すn個のSegmentURL要素(140−1、・・、140−n)を含むAdaptationSet要素120をMPDデータに記述する(S54)。更に、情報生成部111は、視点Pの間引映像を構成する1つ以上のメディアセグメント151の取得先を示す1つ以上のSegmentURL要素141を含むAdaptationSet要素121をMPDデータ内に記述する(S55)。
その結果、視点Pの撮影映像を高速再生(及び標準速再生)するための前述のMPDデータ100が記憶部12に記録されることとなる。
[4.再生装置20における処理の流れ]
以下、前述のMPDデータ100を参照して、ある視点Pの撮影映像を再生する操作を受けつけた場合の再生装置20の動作について、図2及び図6を参照しながら説明する。図6は、再生装置の上記動作を示すフローチャートである。
まず、再生処理部211は、受け付けた再生操作の種類を判定する(S61)。再生処理部211は、標準再生の操作(第2の操作)を受け付けたと判定した場合、記憶部22に記録されているMPDデータ100におけるAdaptationSet要素120を参照する。
具体的には、再生処理部211は、n個のSegmentURL要素(140−1、・・、140−n)を参照し、受信部29を介して、n個のメディアセグメント(150−1、・・、150−n)を取得する(S62)。
再生処理部211は、取得したn個のメディアセグメント(150−1、・・、150−n)を、メディアセグメント150−1、・・、メディアセグメント150−nの順に標準速再生する(S63)。
一方、再生処理部211は、高速再生の操作(第1の操作)を受け付けたと判定した場合、記憶部22に記録されているMPDデータ100におけるAdaptationSet要素121(SegmentURL要素141)を参照し、メディアセグメント151を取得する(S64)。
再生処理部211は、取得したメディアセグメント151(間引映像)を標準速再生する(S65)。
なお、再生装置20は、標準速再生、高速再生に加え、低速再生をサポートしていてもよい。低速再生をサポートする再生装置20では、低速再生の操作を受け付けた場合にもS62の工程を実行し、取得したn個のメディアセグメントを低速再生してもよい。
また、再生装置20は、高速再生の操作を受け付けた場合に、S64の工程を実行し、取得したメディアセグメント151(間引映像)を高速再生(間引再生)してもよい。
(変形例1)
図7及び図8を参照して、本実施形態の変形例について説明する。図7及び図8は、視点Pの撮影映像を加工して、間引映像を生成する処理の変形例について説明するための図である。
本変形例では、データ生成部112は、図7に示すように、メディアセグメント(150−1、・・、150−n)のssixボックスのL0レイヤー及びL1レイヤーを参照して、Iフレーム及びPフレームの位置を特定する。
そして、データ生成部112は、n個の各メディアセグメント(150−1、・・、150−n)から、特定した位置のフレーム(Iフレーム及びPフレーム、例えば、図7のI1及びP2)以外のフレーム(Bフレーム)を間引く。データ生成部112は、図8に示すように、Bフレームが間引かれたn個のメディアセグメント(150−1”、・・、150−n”)から、間引映像を構成するメディアセグメント151aを生成する。
その結果、記憶部12には、視点Pの元映像とは別に、元映像からBフレームのみが間引かれた間引映像が記録されることとなる。
Pフレームもメディアセグメントの生成に使用した場合、生成したデータ量はIフレームのみを使用した場合と比較して大きくなるが、Iフレームのみを使用した場合と比較してより滑らかな高速再生を実現することができる。いずれにしても、少なくともBフレームを間引くことによって、再生装置側では、部分映像の高速再生の際に、双方向の参照画像を復号するまで再生できないBフレームを再生しないので、デコード能力の低い再生装置であっても部分映像を高速に再生できるという効果を奏する。
(変形例2)
AdaptationSet要素121には、AdaptationSet要素121が間引映像の取得先を示す情報であることを示す記述子を含んでいてもよい。
このような記述子としては、例えば、EssentialProperty要素若しくはSupplementalProperty要素、又は、mimeType属性が挙げられる。
(変形例3) 生成装置10には、ユーザの操作に応じて、高速再生用の間引映像を生成する処理と、高速再生用のAdaptationSet要素121をMPDデータに記述する処理と、を行う場合と、これらの処理を行わない場合と、があってもよい。
前者の場合には、生成装置10は、MPD要素のProfile属性に、高速再生用のAdaptationSet要素121がMPDデータ100に含まれていることを示す属性値を記述してもよい。また、後者の場合には、生成装置10は、MPD要素のProfile属性に、高速再生用のAdaptationSet要素121がMPDデータに含まれていないことを示す属性値を記述してもよい。
そして、再生装置20は、ある多視点映像に含まれるある視点映像(元映像)を高速再生する操作を受け付けた場合に、その多視点映像に対応するMPDデータに記述されている上記Profile属性の値に基づき処理を切り替えてもよい。
すなわち、再生装置20は、属性値が高速再生用のAdaptationSet要素121がMPDデータ100に含まれていることを示す場合には、AdaptationSet要素121を参照して、前記元映像から生成された間引映像を取得及び再生してもよい。一方、再生装置20は、属性値が高速再生用のAdaptationSet要素121がMPDデータ100に含まれていないことを示す場合には、AdaptationSet要素120を参照して、元映像を取得及び高速再生(間引再生)してもよい。
なお、上述の変形例1〜変形例3は、後述の各実施形態にも適用可能である。
(本実施形態の利点)
以上のように、生成装置10では、情報生成部111が、複数の視点の撮影映像を含む多視点映像における、ある撮影映像の再生に関するMPDデータ100を生成する。
また、データ生成部112が、少なくともBフレームがある撮影映像(元映像)から間引かれた間引映像を示すメディアセグメントを生成する。
MPDデータ100は、前記ある撮影映像の高速再生操作に応じて参照される、間引映像の取得先を示すAdaptationSet要素121(SegmentURL要素141)と、前記ある撮影映像の標準速再生操作に応じて参照される、元映像の取得先を示すAdaptationSet要素120(SegmentURL要素140−1、・・、140−n)と、を含んでいる。
また、再生装置20では、再生処理部211が、MPDデータ100を参照し、元映像又は間引映像を再生する。
具体的には、再生処理部211は、前記高速再生操作に応じて、AdaptationSet要素121(SegmentURL要素141)に基づいて間引映像を取得及び再生し、前記標準速再生操作に応じて参照される、AdaptationSet要素120(SegmentURL要素140−1、・・、140−n)に基づいて元映像を取得及び再生する。
上記の構成によれば、高速再生を行う場合においてサーバである生成装置10側からクライアントである再生装置20側に送出するデータ量を少なくともBフレームのデータ量だけ削減できるのでネットワークの負荷を軽減できる。更に再生装置20側では、高速再生の際にBフレームを間引く必要がないため、少ないCPUのリソースで高速再生することができる。
〔実施形態2〕
本発明の他の実施形態について、図1及び図9〜図13に基づいて説明すれば以下のとおりである。本実施形態においては、多視点映像システムにおいて、ある視点Pと視点Qとの中間の視点からの映像を高速再生する場合について説明する。
[1.生成装置10と再生装置20の構成]
本実施形態においても実施形態1の場合と同様に図1の構成を用いる。
[2.MPDデータ及びメディアセグメントについて]
図9は、ある視点Pと視点Qとの中間の視点からの映像を高速再生するためのMPDデータを生成する処理、及び、MPDデータを参照して撮影映像を高速再生する処理について、説明するための図である。なお、視点P及び視点Q(第1の視点及び第2の視点)は、該中間の視点(特定の視点)に隣接する視点である。また、視点P及び視点Qの撮影映像の各々は、多視点映像を合成するために使用した、異なる複数の視点からの複数の撮影映像(即ち、元映像)のうちの1つである。
Segment 1(240−1)、Segment n(240−n)、Segment 1(241−1)、Segment n(241−n)及びSegment(242)等はSegmentList要素に含まれるn個のSegmentURL要素に相当し、SegmentList要素は、図2同様、図9においても省略されている。
本実施形態では、ある視点Pと視点Qとの撮影映像を再生するためのAdaptationSet要素として、標準速再生用AdaptationSet220と221とがそれぞれ存在し、視点Pと視点Qとの中間の視点からの映像を再生するための高速再生用AdaptationSet222が存在する。
なお、各階層要素が含む直下の階層要素のデータの数は1つとは限らず、扱う映像データサイズ等によって異なる。例えば、MPD要素は、図9のように1つのPeriod要素を含むことも、複数のPeriod要素を含むこともあり得る。AdaptationSet要素はRepresentation要素及びSegmentList要素を介して通常複数のSegmentURL要素を含んでいる。即ち、標準速再生用のAdaptationSet要素220及び221に含まれる各SegmentURL要素(第2の情報)は、上位階層であるPeriod要素が示す期間の元映像が時分割されたn個のメディアセグメントのうちの、対応する1つの映像の取得先を示す情報(URL)を含んでいる。
また、高速再生用のAdaptationSet要素222においては、SegmentURL要素242(第1の情報)が、上位階層であるPeriod要素が示す期間の視点P及び視点Qの間引映像が時分割された1又は複数のメディアセグメントのうちの、対応する1つの映像の取得先を示す情報(URL)を含んでいる。
[3.生成装置10における処理の流れ]
以下、生成装置10が前述のMPDデータ及び間引映像を生成する動作について、図9〜図11を参照しながら説明する。図10は、視点P及び視点Qの撮影映像を加工して、間引映像を生成する処理について説明するための図である。図11は、生成装置の上記動作を示すフローチャートである。
データ生成部112は、記憶部12に記録されている、2n個のメディアセグメントの各々について、前述の方法を用いてIフレームの位置を特定する(S71)。これら2n個のメディアセグメントは、図9に示した、AdaptationSet要素220及び221を参照して取得される2n個のメディアセグメント(250−1、・・、250−n、251−1、・・、251−n)である。そして、図10に示すように、データ生成部112は、2n個の各メディアセグメント(250−1、・・、250−n、251−1、・・、251−n)から、特定した位置のフレーム(Iフレーム、例えば、図10のI1及びI10)以外のフレーム(Bフレーム、Pフレーム)を間引く(S72)。即ち、データ生成部112は、一部のフレーム(Bフレーム、Pフレーム)を、視点Pの元映像を構成するn個のメディアセグメント(250−1、・・、250−n)から間引く。データ生成部112は、同様に、これら一部のフレームと同時刻に生成された一部のフレーム(Bフレーム、Pフレーム)を、視点Qの元映像を構成するn個の各メディアセグメント(251−1、・・、251−n)から間引く。
そして、データ生成部112は、Bフレーム及びPフレームが間引かれた2n個のメディアセグメント(250−1’、・・、250−n’、251−1’、・・、251−n’)から、間引映像を構成するメディアセグメント252を生成する。
具体的には、図10からわかるように、n個のメディアセグメントにおいてより早く提示されるべき位置にあるIフレームがより早い時期に提示されるように、間引映像を構成する1又は複数のメディアセグメントを生成する。上記生成において視点Pの映像のメディアセグメントに由来するIフレーム(250−1’、・・、250−n’)はメディアセグメント252のトラック1に、視点Qの映像のメディアセグメントに由来するIフレーム(251−1’、・・、251−n’)はメディアセグメント252のトラック2にそれぞれ格納する(S73)。
その結果、記憶部12には、視点P及び視点Qの元映像が格納されている2n個のメディアセグメントとは別に、視点Pの元映像からBフレーム及びPフレームが間引かれた間引き映像及び視点Qの元映像からBフレーム及びPフレームが間引かれた間引き映像がメディアセグメント252の別のトラックにそれぞれ記録されることとなる。なお、再生装置20は、視点Pの間引映像と視点Qの間引映像とを公知の方法及び/又は本明細書において後述されている方法で合成することによって、視点Pと視点Qとの中間の視点からの間引映像を生成できる。従って、視点Pの間引映像と視点Qの間引映像とが格納されたメディアセグメント252は、視点Pと視点Qとの中間の視点からの間引映像(特定の視点の部分映像)が格納されたメディアセグメントであるとも言える。
その後、生成装置10は、公知のMPDデータの生成処理に加えて以下の処理を行うことによって、前述のMPDデータを生成する。
即ち、情報生成部111は、視点Pの元映像を構成するn個のメディアセグメント(250−1、・・、250−n)の取得先を示すn個のSegmentURL要素(240−1、・・、240−n)を含むAdaptation Set要素220をMPDデータに記述する(S74)
また、情報生成部111は、視点Qの元映像を構成するn個のメディアセグメント(251−1、・・、251−n)の取得先を示すn個のSegmentURL要素(241−1、・・、241−n)を含むAdaptation Set要素221をMPDデータに記述する(S75)
更に、情報生成部111は、視点P及び視点Qの間引映像が格納された1つ以上のメディアセグメント252の取得先を示す1つ以上のSegmentURL要素242を含むAdaptationSet要素222をMPDデータ内に記述する(S76)。
その結果、視点Pと視点Qとの中間の視点からの映像を高速再生し、視点P及び視点Qの撮影映像を標準速再生するための前述のMPDデータ200が記憶部12に記録されることとなる。
[4.再生装置20における処理の流れ]
以下、前述のMPDデータ200を参照して、ある視点Pの撮影映像を再生する操作を受けつけた場合の再生装置20の動作について、図12を参照しながら説明する。図12は、再生装置の上記動作を示すフローチャートである。
まず、再生処理部211は、受け付けた再生操作の種類を判定する(S81) 。
再生処理部211は、視点Pからの映像を標準再生させる操作(第2の操作)を受け付けたと判定した場合、記憶部22に記録されているMPDデータ100におけるAdaptationSet要素220を参照する。
具体的には、再生処理部211は、n個のSegmentURL要素(240−1、・・、240−n)を参照し、受信部29を介して、n個のメディアセグメント(250−1、・・、250−n)を取得する(S82)。
再生処理部211は、取得したn個のメディアセグメント(250−1、・・、250−n)を、メディアセグメント250−1、・・、メディアセグメント250−nの順に標準速再生する(S83)。
再生処理部211は、視点Qからの映像を標準再生させる操作(第2の操作)を受け付けたと判定した場合、記憶部22に記録されているMPDデータ100におけるAdaptationSet要素221を参照する。
具体的には、再生処理部211は、n個のSegmentURL要素(241−1、・・、241−n)を参照し、受信部29を介して、n個のメディアセグメント(251−1、・・、251−n)を取得する(S84)。
再生処理部211は、取得したn個のメディアセグメント(250−1、・・、250−n)を、メディアセグメント250−1、・・、メディアセグメント250−nの順に標準速再生する(S85)。
一方、再生処理部211は、視点Pと視点Qとの中間の視点からの映像を高速再生させる操作(第一の操作)を受け付けたと判定した場合、記憶部22に記録されているMPDデータ200におけるAdaptationSet要素222(SegmentURL要素242)を参照し、メディアセグメント252を取得する(S86)。
次いで再生処理部211は、メディアセグメント252に含まれる視点Pの間引映像及び視点Qの間引映像を対象として視点合成を行う。再生処理部211は、これにより生成した前記中間の視点からの間引映像を標準速再生する。これらの処理(S87)をより具体的に説明すると以下の通りである。
即ち、再生処理部211は、同時刻に生成(撮影)されたIフレームのペア(視点Pの間引映像に含まれるIフレーム、及び、視点Qの間引映像に含まれるIフレーム)からステレオマッチング等の既存の方法で求めたデプスマップ(奥行き情報)を用いることによって、視点Pと視点Qの中間視点の映像を合成する。これにより、再生処理部211は、視点Pと視点Qの中間視点の間引映像を構成するフレーム群(画像群)を得る。再生処理部211は、より早い時期に生成(撮影された)Iフレームのペアから合成したフレーム(画像)がより早く再生されるように、合成したフレーム(間引映像を構成するフレーム)を順次再生する。
また、図12のフローチャートでは省略しているが、再生処理部211は、視点Pと視点Qの中間の視点からの映像を標準速再生させる操作(第2の操作)を受け付けたと判定した場合、記憶部22に記録されているMPDデータ200におけるAdaptationSet要素220、及びAdaptationSet要素221を参照する。
具体的には、再生処理部211は、n個のSegmentURL要素(240−1、・・、240−n)を参照し、受信部29を介して、n個のメディアセグメント(250−1、・・、250−n)を取得するとともに、n個のSegmentURL要素(241−1、・・、241−n)を参照し、受信部29を介して、n個のメディアセグメント(251−1、・・、251−n)を取得する。
再生処理部211は、取得したn個のメディアセグメント(250−1、・・、250−n)、及び取得したn個のメディアセグメント(251−1、・・、251−n)に基づき視点合成を行い再生する。
本実施形態の構成であっても、実施形態1と同様な効果を奏すると共に、撮影時の視点(視点Pや視点Q)ではない視点(視点P及び視点Qに隣接する視点)からの映像を、より少ないCPUの負荷で高速再生することができる、というさらなる効果を奏する。
(変形例)
図13を参照して、本実施形態の変形例について説明する。図13は視点P及び視点Qの中間の視点からの映像の高速再生に係るメディアセグメントの一例を示す図である。本変形例では、より高い精度で視点合成を行うために、視点合成の処理に更に3次元モデルデータを利用する。即ち、多視点映像に含まれる被写体の像に関し、生成装置10は、該像を示す3次元モデルデータを含むような高速再生用のメディアセグメントを生成し、再生装置20に送信する。
3次元モデルデータの格納場所としては、例えば図13で示すように、メディアセグメント252’のトラック3が挙げられる。他の例としては、イニシャライゼーションセグメントを、3次元モデルデータを格納するための領域として使用する態様でも良い。
上記の構成によると、再生操作の前に3次元モデルデータが再生装置20内に用意されている必要が無い。また、3次元モデルデータを再生装置20内に用意するための、再生操作とは別個の操作も不要になる。従って、本変形例に係る構成は、中間視点からの被写体の見え方をより忠実に再現した映像を再生しつつ、再生装置20のリソースを節約し、且つ、再生装置20の利用者の手間を低減することができる、と言える。
なお、本変形例は、後述の各実施形態にも適用可能である。
〔実施形態3〕
本発明の他の実施形態について、図1、図9、図11及び図12に基づいて説明すれば以下のとおりである。
本実施形態においては、多視点映像システムにおいて、ある視点Pと視点Qとの間を視点移動した映像を高速再生する場合について説明する。
[1.生成装置10と再生装置20の構成]
本実施形態においても実施形態1の場合と同様に図1の構成を用いる。
[2.MPDデータ及びメディアセグメントについて]
本実施形態においても実施形態2の場合と同様に、図9に示す構成を用いる。
[3.生成装置10における処理の流れ]
本実施形態においても実施形態2の場合と同様に、図11のフローチャートに示す処理を行う。
[4.再生装置20における処理の流れ]
以下、前述のMPDデータ200を参照して、ある視点Pと視点Qとの間を視点移動したときの任意の視点の映像を再生する操作を受けつけた場合の再生装置20の動作について、図12を参照しながら説明する。図12は、再生装置の上記動作を示すフローチャートである。
ステップS86までの処理は実施形態2と同様である。
続くステップS87においては、実施形態2では視点Pと視点Qの中間視点(時間の経過とともに視点は変化しない)の映像を合成したが、本実施形態は、視点Pと視点Qの間の任意の視点(時間の経過とともに視点が変化)の映像を合成する点で実施形態2の場合と異なる。
再生処理部211は、同時刻に生成(撮影)されたIフレームのペア(視点Pの間引映像に含まれるIフレーム、及び視点Qの間引映像に含まれるIフレーム)からステレオマッチング等の既存の方法で求めたデプスマップ(奥行き情報)を用いることによって、視点Pと視点Qの間の任意の視点の映像を合成する。
なお、視点Pから視点Qに視点移動する場合の、移動速度は必ずしも一律であることに限定されない。視点移動に要する時間は同じであっても、例えば視点Pに近い視点の映像が視点Qに近い視点の映像よりもより長い時間再生されるような構成でも構わない。
これにより、再生処理部211は、間引映像を構成するフレーム群(画像群)を得る。再生処理部211は、より早い時期に生成(撮影された)Iフレームのペアから合成したフレーム(画像)がより早く再生されるように、合成したフレーム(間引映像を構成するフレーム)を順次再生する。上記再生により、ユーザは、視点Pが位置する地点から視点Qが位置する地点へと実際に移動しながら被写体の様子を閲覧しているかのように、被写体の映像を鑑賞することができる。アニメーションのように視点Pから視点Qへスムースに視点が移動したように見える。
本実施形態の構成であっても、実施形態2と同様な効果を奏する。更に、本実施形態の構成は、視点Pが位置する地点から視点Qが位置する地点へと移動しながら確認できる被写体の様子を、再生装置のCPUの負荷を低減させる本実施形態の高速再生の方法により、より短い期間でユーザに観察させることができる。
<実施形態1〜3に係る付記事項>
生成装置10は、高速再生に係る間引映像を生成する場合、間引映像を構成する各種データに、該データが高速再生用のデータであることを示す情報を含めてもよい。
上記各種データの一例としてはメディアセグメントが挙げられる。この例において、生成装置10は、各メディアセグメントのstypボックスに上記情報を含めてもよい。
また、上記各種データの他の例としては、初期化セグメント(Initialization Segment)又は自己初期化(Self-initializing)メディアセグメントが挙げられる。これらの例において、生成装置10は、各セグメントのftypボックス内のcompatible_brandsフィールドに上記情報を含めてもよい。
<実施形態2及び3に係る付記事項>
実施形態2及び3は、被写体を円状に取り囲む複数の視点の各々の撮影映像が合成された多視点映像を再生する多視点映像システムに係る実施形態である。
実施形態2及び3に開示されている技術的事項を、被写体を球状に取り囲む複数の視点の各々の撮影映像が合成された多視点映像システムに適用することができる。
この場合、生成装置は、例えば、隣接する4つの視点に取り囲まれたある視点からの映像を高速再生するためのMPDデータ及びメディアセグメント群を生成することになる。
なお、各メディアセグメント内のデータは、上記4つの視点に由来する高速再生に係るフレーム群を該メディアセグメントの1〜4トラックに格納したものであってもよい。
この場合、再生装置は、上記MPDデータ内に記述されている、上記高速再生に使用するAdaptationSetが含むSegmentURL群を参照して上記メディアセグメント群を取得することになる。再生装置は、取得した各メディアセグメントの4つのトラックに格納された4つの視点に由来するフレーム群を用いて、上記高速再生を行う。
<その他の付記事項>
本発明は、上述の実施形態1〜3、及び、各変形例には限定されない。
即ち、上述の実施形態1〜3は、多視点映像における、ある部分映像の再生に関する実施形態であるが、複数の視線方向の各々の部分映像を含む全体映像(例えば、全天球映像)における部分映像の再生に関する実施形態も本発明の範疇に含まれる。
即ち、実施形態1〜3で説明した方法を用いて、全天球映像におけるある部分映像を再生するためのMPDデータの生成、元映像から間引映像の生成、及び、部分映像(元映像、間引映像)の再生を行う実施形態も、本発明の範疇に含まれる。
〔ソフトウェアによる実現例〕
生成装置10の制御ブロック(特に制御部11及び記憶部12)及び再生装置20の制御ブロック(特に制御部21及び記憶部22)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
後者の場合、生成装置10は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも1つのプロセッサ(制御装置)を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも1つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る生成装置10は、複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を生成する情報生成部111と、一部のフレームが前記ある部分映像から間引かれた間引映像を示すデータを生成するデータ生成部112と、を備え、前記メタ情報は、前記ある部分映像を高速再生させる第1の操作に応じて参照される、前記間引映像の取得先を示す第1の情報と、該ある部分映像を第1の操作よりも低速で再生させる第2の操作に応じて参照される、該ある部分映像の取得先を示す第2の情報と、を含んでいる、構成である。
上記の構成によれば、ネットワークとクライアントに対する負荷を軽減させるような映像の高速再生を可能にする生成装置10を実現することができる。
本発明の態様2に係る生成装置10は、上記の態様1において、前記全体映像は、前記複数の視点の各々の撮影映像が合成された多視点映像であり、前記ある部分映像は、前記複数の視点のうちのある視点から撮影された撮影映像である、構成としてもよい。
本発明の態様3に係る生成装置10は、上記の態様1において、前記全体映像は、前記複数の視点の各々の撮影映像が合成された多視点映像であり、前記ある部分映像は、特定の視点に隣接する2つの視点から撮影された第1の撮影映像及び第2の撮影映像を合成することによって得られる前記特定の視点の部分映像であり、前記データ生成部112は、一部のフレームを第1の撮影映像から間引くとともに、該一部のフレームと同時刻に生成された一部のフレームを第2の撮影映像から間引くことによって得られる各映像データを含むように、前記間引映像を示すデータを生成する、構成としてもよい。
上記の構成によれば、態様1と同様な効果を奏すると共に、撮影時の視点ではない視点からの映像を、より少ないCPUの負荷で高速再生することができる、というさらなる効果を奏する。
本発明の態様4に係る生成装置10は、上記の態様3において、前記データ生成部112は、前記特定の視点の部分映像に含まれる被写体の像に関して、該被写体の3次元モデルデータを更に含むように、前記間引映像を示すデータを生成する、構成としてもよい。
上記の構成によれば、中間視点からの被写体の見え方をより忠実に再現した映像を再生しつつ、視点合成に関わる再生装置20のリソースを節約することができる。
本発明の態様5に係る生成装置10は、上記の態様1から4の何れか1態様において、前記一部のフレームには、少なくともB(Bi-Predictive)フレームが含まれている、構成としてもよい。
上記の構成によれば、少なくともBフレームを間引くことによって、再生装置20側では、部分映像の高速再生の際に、双方向の参照画像を復号するまで再生できないBフレームを再生しないので、デコード能力の低い再生装置であっても部分映像を高速に再生できるという効果を奏する。
本発明の態様6に係る生成装置10は、上記の態様1から5の何れか1態様において、前記メタデータは、DASH(Dynamic Adaptive Streaming over HTTP)規定のMPDデータであり、前記間引映像を示すデータは、1つ以上のDASH規定のメディアセグメントであり、第1の情報は、DASH規定のAdaptationSet要素に含まれる、DASH規定の1つ以上のSegmentURL要素であり、前記AdaptationSet要素には、該AdaptationSet要素が前記間引映像の取得先を示す情報であることを示す記述子が含まれている、構成としてもよい。
上記の構成によれば、態様1と同様な効果を奏すると共に、該AdaptationSetが前記間引映像の取得先を示す情報であることを簡便に確認できる効果を奏する。
本発明の態様7に係る再生装置20は、複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を参照して、該ある部分映像、又は、一部のフレームが該ある部分映像から間引かれた間引映像を再生する再生処理部211を備え、前記メタ情報は、前記間引映像の取得先を示す第1の情報と、前記ある部分映像の取得先を示す第2の情報と、を含み、前記再生処理部211は、前記ある部分映像を高速再生させる第1の操作に応じて、第1の情報に基づいて取得した前記間引映像を再生し、該ある部分映像を第1の操作よりも低速で再生させる第2の操作に応じて、第2の情報に基づいて取得した該ある部分映像を再生する、構成である。
ネットワークとクライアントに対する負荷を軽減させるような映像の高速再生を可能にする再生装置20を実現することができる。
本発明の態様8に係る再生装置20は、上記の態様7において、前記全体映像は、前記複数の視点の各々の撮影映像が合成された多視点映像であり、前記ある部分映像は、前記複数の視点のうちのある視点から撮影された撮影映像である、構成としてもよい。
上記の構成によれば、態様7と同様な効果を奏する。
本発明の態様9に係る再生装置20は、上記の態様7において、前記全体映像は、前記複数の視点の各々の撮影映像が合成された多視点映像であり、前記ある部分映像は、特定の視点に隣接する2つの視点から撮影された第1の撮影映像及び第2の撮影映像を合成することによって得られる前記特定の視点の部分映像であり、前記再生処理部211は、一部のフレームを第1の撮影映像から間引くとともに、該一部のフレームと同時刻に生成された一部のフレームを第2の撮影映像から間引くことによって得られた各映像データを含んだ、前記間引映像を示すデータを、第1の情報を参照して取得し、前記再生処理部211は、前記各映像データの一方に含まれるフレームと、前記各映像データの他方に含まれる、該フレームと同時刻に生成されたフレームとを合成して得た前記特定の視点の画像を、順次再生する、構成としてもよい。
上記の構成によれば、態様7と同様な効果を奏すると共に、撮影時の視点ではない視点からの映像を、より少ないCPUの負荷で高速再生することができる、というさらなる効果を奏する。
本発明の態様10に係る再生装置20は、上記の態様7から9の何れか1態様において、前記一部のフレームには、少なくともB(Bi-Predictive)フレームが含まれている、構成としてもよい。
上記の構成によれば、少なくともBフレームを間引くことによって、再生装置20側では、部分映像の高速再生の際に、双方向の参照画像を復号するまで再生できないBフレームを再生しないので、デコード能力の低い再生装置であっても部分映像を高速に再生できるという効果を奏する。
本発明の態様11に係る再生装置20は、上記の態様7から10の何れか1態様において、前記メタデータは、DASH(Dynamic Adaptive Streaming over HTTP)規定のMPDデータであり、前記間引映像を示すデータは、1つ以上のDASH規定のメディアセグメントであり、第1の情報は、DASH規定のAdaptationSet要素に含まれる、DASH規定の1つ以上のSegmentURL要素であり、前記AdaptationSet要素には、該AdaptationSet要素が前記間引映像の取得先を示す情報であることを示す記述子が含まれている、構成としてもよい。
上記の構成によれば、態様11に係る再生装置20は、第1の操作を受け付けた場合に取得及び再生すべき間引映像の取得先を示すAdaptationSetを即座に特定できる。従って、態様11に係る再生装置20には、第1の操作を受け付けてから間引映像の再生を開始するまでのタイムラグが短いという利点がある。
本発明の態様12に係る制御プログラムは、上記の態様1に係る生成装置10としてコンピュータを機能させるための制御プログラムであって、上記コンピュータを上記生成装置10として機能させる構成としてもよい。
本発明の態様13に係る制御プログラムは、上記の態様7に係る再生装置20としてコンピュータを機能させるための制御プログラムであって、上記コンピュータを上記再生装置20として機能させる構成としてもよい。
本発明の態様14に係る生成方法は、装置により実行される生成方法であって、複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を生成する情報生成ステップと、一部のフレームが前記ある部分映像から間引かれた間引映像を示すデータを生成するデータ生成ステップと、を含み、前記メタ情報は、前記ある部分映像を高速再生させる第1の操作に応じて参照される、前記間引映像の取得先を示す第1の情報と、該ある部分映像を第1の操作よりも低速で再生させる第2の操作に応じて参照される、該ある部分映像の取得先を示す第2の情報と、を含んでいる、方法である。
上記の方法によれば、態様1に係る生成装置と同様の作用効果を奏する。
本発明の態様15に係る再生方法は、装置により実行される再生方法であって、複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を参照して、該ある部分映像、又は、一部のフレームが該ある部分映像から間引かれた間引映像を再生する再生ステップを含み、前記メタ情報は、前記間引映像の取得先を示す第1の情報と、該ある部分映像の取得先を示す第2の情報と、を含み、該ある部分映像を高速再生させる第1の操作に応じて、第1の情報に基づいて前記間引映像を取得する第1の取得ステップと、該ある部分映像を第1の操作よりも低速で再生させる第2の操作に応じて、第2の情報に基づいて該ある部分映像を取得する第2の取得ステップと、を含んでいる、方法である。
上記の方法によれば、態様7に係る再生装置と同様の作用効果を奏する。
本発明の態様16に係る記録媒体は、態様12に係る制御プログラムを記録したコンピュータ読み取り可能な記録媒体であってもよい。同様に、本発明の態様17に係る記録媒体は、態様13に係る制御プログラムを記録したコンピュータ読み取り可能な記録媒体であってもよい。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
例えば、実施形態1の変形例1に開示された技術手段と、実施形態2に開示された技術的手段との組み合わせが考えられる。図14は、そのような組み合わせに係る実施形態における間引映像を生成する処理に関する図である。
図14に示すように、該実施形態に係るシステムは、視点Pの撮影映像からBフレームのみを間引き、視点Qの撮影映像からBフレームのみを間引くことによって、視点Pと視点Qとに隣り合う視点の間引映像を生成・再生することができる。なお、該システムは、間引映像の各フレームを間引かずに再生してもよいが、間引映像のうちのIフレームのみを再生する(即ち、再生時にPフレームを間引く)ようにしてもよい。
〔関連出願の相互参照〕
本出願は、2017年8月7日に出願された出願番号2017−152321号の出願に関するものであって上記出願を基礎として優先権を主張するものである。上記出願の内容は、参照により本明細書に含まれる。
10 生成装置
11 制御部(制御装置)
12 記憶部
20 再生装置
21 制御部
22 記憶部
23 表示部

Claims (17)

  1. 複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を生成する情報生成部と、
    一部のフレームが前記ある部分映像から間引かれた間引映像を示すデータを生成するデータ生成部と、を備え、
    前記メタ情報は、前記ある部分映像を高速再生させる第1の操作に応じて参照される、前記間引映像の取得先を示す第1の情報と、該ある部分映像を第1の操作よりも低速で再生させる第2の操作に応じて参照される、該ある部分映像の取得先を示す第2の情報と、を含んでいる、ことを特徴とする生成装置。
  2. 前記全体映像は、前記複数の視点の各々の撮影映像が合成された多視点映像であり、
    前記ある部分映像は、前記複数の視点のうちのある視点から撮影された撮影映像である、ことを特徴とする請求項1に記載の生成装置。
  3. 前記全体映像は、前記複数の視点の各々の撮影映像が合成された多視点映像であり、
    前記ある部分映像は、特定の視点に隣接する2つの視点から撮影された第1の撮影映像及び第2の撮影映像を合成することによって得られる前記特定の視点の部分映像であり、
    前記データ生成部は、一部のフレームを第1の撮影映像から間引くとともに、該一部のフレームと同時刻に生成された一部のフレームを第2の撮影映像から間引くことによって得られる各映像データを含むように、前記間引映像を示すデータを生成する、ことを特徴とする請求項1に記載の生成装置。
  4. 前記データ生成部は、前記特定の視点の部分映像に含まれる被写体の像に関して、該被写体の3次元モデルデータを更に含むように、前記間引映像を示すデータを生成する、ことを特徴とする請求項3に記載の生成装置。
  5. 前記一部のフレームには、少なくともB(Bi-Predictive)フレームが含まれている、ことを特徴とする請求項1から4の何れか1項に記載の生成装置。
  6. 前記メタ情報は、DASH(Dynamic Adaptive Streaming over HTTP)規定のMPDデータであり、
    前記間引映像を示すデータは、1つ以上のDASH規定のメディアセグメントであり、
    第1の情報は、DASH規定のAdaptationSet要素に含まれる、DASH規定の1つ以上のSegmentURL要素であり、
    前記AdaptationSet要素には、該AdaptationSet要素が前記間引映像の取得先を示す情報であることを示す記述子が含まれている、ことを特徴とする請求項1から5の何れか1項に記載の生成装置。
  7. 複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を参照して、該ある部分映像、又は、一部のフレームが該ある部分映像から間引かれた間引映像を再生する再生処理部を備え、
    前記メタ情報は、前記間引映像の取得先を示す第1の情報と、前記ある部分映像の取得先を示す第2の情報と、を含み、
    前記再生処理部は、前記ある部分映像を高速再生させる第1の操作に応じて、第1の情報に基づいて取得した前記間引映像を再生し、該ある部分映像を第1の操作よりも低速で再生させる第2の操作に応じて、第2の情報に基づいて取得した該ある部分映像を再生する、ことを特徴とする再生装置。
  8. 前記全体映像は、前記複数の視点の各々の撮影映像が合成された多視点映像であり、
    前記ある部分映像は、前記複数の視点のうちのある視点から撮影された撮影映像である、ことを特徴とする請求項7に記載の再生装置。
  9. 前記全体映像は、前記複数の視点の各々の撮影映像が合成された多視点映像であり、
    前記ある部分映像は、特定の視点に隣接する2つの視点から撮影された第1の撮影映像及び第2の撮影映像を合成することによって得られる前記特定の視点の部分映像であり、
    前記再生処理部は、一部のフレームを第1の撮影映像から間引くとともに、該一部のフレームと同時刻に生成された一部のフレームを第2の撮影映像から間引くことによって得られた各映像データを含んだ、前記間引映像を示すデータを、第1の情報を参照して取得し、
    前記再生処理部は、前記各映像データの一方に含まれるフレームと、前記各映像データの他方に含まれる、該フレームと同時刻に生成されたフレームとを合成して得た前記特定の視点の画像を、順次再生する、ことを特徴とする請求項7に記載の再生装置。
  10. 前記一部のフレームには、少なくともB(Bi-Predictive)フレームが含まれている、ことを特徴とする請求項7から9の何れか1項に記載の再生装置。
  11. 前記メタ情報は、DASH(Dynamic Adaptive Streaming over HTTP)規定のMPDデータであり、
    前記間引映像を示すデータは、1つ以上のDASH規定のメディアセグメントであり、
    第1の情報は、DASH規定のAdaptationSet要素に含まれる、DASH規定の1つ以上のSegmentURL要素であり、
    前記AdaptationSet要素には、該AdaptationSet要素が前記間引映像の取得先を示す情報であることを示す記述子が含まれている、ことを特徴とする請求項7から10の何れか1項に記載の再生装置。
  12. 請求項1に記載の生成装置としてコンピュータを機能させるための制御プログラムであって、上記コンピュータを上記生成装置として機能させることを特徴とする制御プログラム。
  13. 請求項7に記載の再生装置としてコンピュータを機能させるための制御プログラムであって、上記コンピュータを上記再生装置として機能させることを特徴とする制御プログラム。
  14. 装置により実行される生成方法であって、
    複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を生成する情報生成ステップと、
    一部のフレームが前記ある部分映像から間引かれた間引映像を示すデータを生成するデータ生成ステップと、を含み、
    前記メタ情報は、前記ある部分映像を高速再生させる第1の操作に応じて参照される、前記間引映像の取得先を示す第1の情報と、該ある部分映像を第1の操作よりも低速で再生させる第2の操作に応じて参照される、該ある部分映像の取得先を示す第2の情報と、を含んでいる、ことを特徴とする生成方法。
  15. 装置により実行される再生方法であって、
    複数の視点又は視線方向の各々の部分映像を含む全体映像における、ある部分映像の再生に関するメタ情報を参照して、該ある部分映像、又は、一部のフレームが該ある部分映像から間引かれた間引映像を再生する再生ステップを含み、
    前記メタ情報は、前記間引映像の取得先を示す第1の情報と、該ある部分映像の取得先を示す第2の情報と、を含み、
    該ある部分映像を高速再生させる第1の操作に応じて、第1の情報に基づいて前記間引映像を取得する第1の取得ステップと、
    該ある部分映像を第1の操作よりも低速で再生させる第2の操作に応じて、第2の情報に基づいて該ある部分映像を取得する第2の取得ステップと、を含んでいる、ことを特徴とする再生方法。
  16. 請求項12に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
  17. 請求項13に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2019535125A 2017-08-07 2018-07-31 生成装置、再生装置、生成方法、再生方法、制御プログラム、記録媒体 Pending JPWO2019031306A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017152321 2017-08-07
JP2017152321 2017-08-07
PCT/JP2018/028655 WO2019031306A1 (ja) 2017-08-07 2018-07-31 生成装置、再生装置、生成方法、再生方法、制御プログラム、記録媒体

Publications (1)

Publication Number Publication Date
JPWO2019031306A1 true JPWO2019031306A1 (ja) 2020-08-06

Family

ID=65271143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019535125A Pending JPWO2019031306A1 (ja) 2017-08-07 2018-07-31 生成装置、再生装置、生成方法、再生方法、制御プログラム、記録媒体

Country Status (4)

Country Link
US (1) US20200374567A1 (ja)
JP (1) JPWO2019031306A1 (ja)
CN (1) CN110999309A (ja)
WO (1) WO2019031306A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7170441B2 (ja) * 2018-07-12 2022-11-14 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
CN114026849A (zh) * 2019-07-03 2022-02-08 索尼集团公司 信息处理装置、信息处理方法、再现处理装置以及再现处理方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090118019A1 (en) * 2002-12-10 2009-05-07 Onlive, Inc. System for streaming databases serving real-time applications used through streaming interactive video
US8315307B2 (en) * 2004-04-07 2012-11-20 Qualcomm Incorporated Method and apparatus for frame prediction in hybrid video compression to enable temporal scalability
JP2006140553A (ja) * 2004-11-10 2006-06-01 Canon Inc 立体画像生成プログラム、立体画像生成装置および立体画像生成方法
CN100588250C (zh) * 2007-02-05 2010-02-03 北京大学 一种多视点视频流的自由视点视频重建方法及系统
CN102348117A (zh) * 2010-08-03 2012-02-08 深圳Tcl新技术有限公司 低带宽传输数字高清信号的系统、方法及网络多媒体电视
CN102075739B (zh) * 2010-09-15 2013-01-02 深圳市九洲电器有限公司 网络视频快进退平稳播放的方法和装置
US9451298B2 (en) * 2012-07-02 2016-09-20 Sony Corporation Transmission device, transmission method, and network apparatus
KR101946019B1 (ko) * 2014-08-18 2019-04-22 삼성전자주식회사 파노라믹 동영상을 생성하는 동영상 처리 장치 및 그 방법
CN105430376B (zh) * 2015-11-12 2018-03-09 深圳进化动力数码科技有限公司 一种全景相机一致性的检测方法及装置
JP6609468B2 (ja) * 2015-12-07 2019-11-20 日本放送協会 受信装置、再生時刻制御方法、及びプログラム
WO2017123474A1 (en) * 2016-01-15 2017-07-20 Vid Scale, Inc. System and method for operating a video player displaying trick play videos
CN105847777B (zh) * 2016-03-24 2018-04-17 湖南拓视觉信息技术有限公司 一种传输三维深度图像的方法及装置

Also Published As

Publication number Publication date
CN110999309A (zh) 2020-04-10
WO2019031306A1 (ja) 2019-02-14
US20200374567A1 (en) 2020-11-26

Similar Documents

Publication Publication Date Title
KR102241082B1 (ko) 복수의 뷰포인트들에 대한 메타데이터를 송수신하는 방법 및 장치
KR102246002B1 (ko) 가상 현실 미디어 콘텐트의 스트리밍을 개선하는 방법, 디바이스, 및 컴퓨터 프로그램
KR102258448B1 (ko) 핫스팟 및 roi 관련 메타데이터를 이용한 360도 비디오를 송수신하는 방법 및 그 장치
JP6384480B2 (ja) 情報処理装置および情報処理方法
JP6565922B2 (ja) 符号化装置および方法、再生装置および方法、並びにプログラム
US11539983B2 (en) Virtual reality video transmission method, client device and server
US10911809B2 (en) Communication apparatus, communication method, and program
KR20210016530A (ko) 미디어 콘텐츠 전송을 위한 방법, 디바이스, 및 컴퓨터 프로그램
US11252397B2 (en) File generation apparatus and file generation method as well as reproduction apparatus and reproduction method
JP6860485B2 (ja) 情報処理装置、および情報処理方法、並びにプログラム
TWI672947B (zh) 用於推導複合軌的方法和裝置
CN114450966A (zh) 用于异构沉浸式媒体的表示和流式传输的数据模型
KR20210019017A (ko) 컨텐츠의 처리 방법 및 장치
JPWO2019031306A1 (ja) 生成装置、再生装置、生成方法、再生方法、制御プログラム、記録媒体
JP7396267B2 (ja) 情報処理装置、情報処理方法、及びプログラム
KR101944601B1 (ko) 기간들에 걸쳐 오브젝트들을 식별하기 위한 방법 및 이에 대응하는 디바이스
JP2019514050A5 (ja)
WO2020137876A1 (ja) 生成装置、3次元データ送信装置、及び3次元データ再生装置
US20230025664A1 (en) Data processing method and apparatus for immersive media, and computer-readable storage medium
KR20200136394A (ko) 정보 처리 장치, 정보 처리 방법 및 프로그램
JP2017130957A (ja) 送信装置、送信方法、再生装置、及び再生方法
JP2021033354A (ja) 通信装置およびその制御方法
US20230043591A1 (en) Information processing apparatus and method
JP7237927B2 (ja) 情報処理装置、情報処理装置およびプログラム
CN111200580A (zh) 一种播放器及播放方法