JP2019532597A - 360°ビューコンテンツをエンコードおよび再生するためのシステムおよび方法 - Google Patents

360°ビューコンテンツをエンコードおよび再生するためのシステムおよび方法 Download PDF

Info

Publication number
JP2019532597A
JP2019532597A JP2019531602A JP2019531602A JP2019532597A JP 2019532597 A JP2019532597 A JP 2019532597A JP 2019531602 A JP2019531602 A JP 2019531602A JP 2019531602 A JP2019531602 A JP 2019531602A JP 2019532597 A JP2019532597 A JP 2019532597A
Authority
JP
Japan
Prior art keywords
video content
streams
playback device
manifest
alternative streams
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2019531602A
Other languages
English (en)
Inventor
ホーンウェイ マイケル ハー,
ホーンウェイ マイケル ハー,
ユーリ ブラヴァ,
ユーリ ブラヴァ,
Original Assignee
ソニック アイピー, インコーポレイテッド
ソニック アイピー, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニック アイピー, インコーポレイテッド, ソニック アイピー, インコーポレイテッド filed Critical ソニック アイピー, インコーポレイテッド
Publication of JP2019532597A publication Critical patent/JP2019532597A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44209Monitoring of downstream path of the transmission network originating from a server, e.g. bandwidth variations of a wireless network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8543Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Graphics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

360°ビューコンテンツをエンコードおよび再生するためのシステムおよび方法が開示される。システムおよび方法は、各々が異なる視点を有する2つ以上のカメラから、ビデオコンテンツのストリームを取得し得る。受信されたビデオコンテンツは、ビデオコンテンツを代替ストリームにエンコードし、代替ストリームのためのインデックス情報を生成する1つ以上のエンコーダに提供されることができる。代替ストリームは、第1の視点のためのビデオコンテンツを含み、各々が異なる最大ビットレートにおいてエンコードされるストリームの第1の組と、第2の視点からのビデオコンテンツを含み、各々が異なる最大ビットレートにおいてエンコードされるストリームの第2の組とを含む。

Description

本発明は、概して、適応ストリーミングに関連し、より具体的には、2つ以上のカメラによって捕捉されるライブイベントからのビデオデータを各カメラのためのフィードにエンコードするシステムに関する。本発明は、概して、再生のためにエンコードされたビデオコンテンツを取得するためにストリームを使用する再生デバイスにも関連する。
用語「ストリーミングメディア」は、再生デバイス上のメディアの再生を説明し、メディアは、サーバ上に記憶され、再生中にネットワークを経由して再生デバイスに連続的に送信される。典型的には、再生デバイスは、再生中、任意の所与の時間にバッファの中に十分な量のメディアを記憶することにより、再生デバイスが再生するメディアの次の部分の受信の前に全てのバッファされたメディアの再生を完了することに起因する再生の中断を防止する。適応ビットレートストリーミングまたは適応ストリーミングは、リアルタイムで現在のストリーミング条件(例えば、ユーザのネットワーク帯域幅およびCPU容量)を検出し、適宜、ストリーミングされたメディアの品質を調節することを伴う。典型的には、ソースメディアは、複数のビットレートにおいてエンコードされ、再生デバイスまたはクライアントは、利用可能なリソースに応じて、異なるエンコーディングを有するストリームを切り替える。
適応ストリーミングソリューションは、典型的には、Internet Engineering Task ForceおよびWorld Wide Web ConsortiumによってRFC2616として公開されたハイパーテキスト転送プロトコル(HTTP)、またはInternet Engineering Task ForceによってRFC2326として公開されたリアルタイムストリーミングプロトコル(RTSP)のいずれかを利用し、サーバと再生デバイスとの間でメディアをストリーミングする。HTTPは、再生デバイスがファイル内のバイト範囲を要求することを可能にするステートレスプロトコルである。HTTPは、サーバが、再生デバイスから受信される要求に応答するために、情報を要求する再生デバイスの状態または再生デバイスによって要求されるバイト範囲に関する情報を記録することを要求されないので、ステートレスとして表される。RTSPは、ストリーミングメディアサーバを制御するために使用されるネットワーク制御プロトコルである。再生デバイスは、「再生」および「一時停止」等の制御コマンドをメディアをストリーミングするサーバに発行し、メディアファイルの再生を制御する。RTSPが利用されるとき、メディアサーバは、各クライアントデバイスの状態を記録し、クライアントデバイスから受信される命令およびクライアントの状態に基づいて、ストリーミングすべきメディアを決定する。
適応ストリーミングシステムでは、ソースメディアは、典型的には、最上位インデックスファイルまたはマニフェストとしてメディアサーバ上に記憶され、それは、実際のビデオおよびオーディオデータを含むいくつかの代替ストリームを指し示す。各ストリームは、典型的には、1つ以上のコンテナファイルの中に記憶される。異なる適応ストリーミングソリューションは、典型的には、異なるインデックスおよびメディアコンテナを利用する。World Wide Web Consortiumによって開発された同期マルチメディア統合言語(SMIL)は、Microsoft Corporation(Redmond,Washington)によって開発されたIISスムースストリーミング、およびAdobe Systems Incorporated(San Jose,California)によって開発されたフラッシュダイナミックストリーミングを含むいくつかの適応ストリーミングソリューションにおいて、インデックスを作成するために利用される。Apple Computer Incorporated(Cupertino,California)によって開発されたHTTP適応ビットレートストリーミングは、典型的には、メディアコンテナファイルを識別するURLのリストを含むテキストファイルである拡張M3Uプレイリストファイル(.M3U8)を使用して、インデックスファイルを実装する。最も一般的に使用されているメディアコンテナフォーマットは、MPEG−4 Part14(すなわち、ISO/IEC14496−14)で規定されるMP4コンテナフォーマット、およびMPEG−2 Part1(すなわち、ISO/IEC規格13818−1)で規定されるMPEGトランスポートストリーム(TS)コンテナである。MP4コンテナフォーマットは、IISスムースストリーミングおよびフラッシュダイナミックストリーミングで利用される。TSコンテナは、HTTP適応ビットレートストリーミングで使用される。
Matroskaコンテナは、Matroska非営利団体(Aussonne,France)によってオープンスタンダートプロジェクトとして開発されたメディアコンテナである。Matroskaコンテナは、拡張マークアップ言語(XML)のバイナリ派生語である拡張可能バイナリメタ言語(EBML)に基づく。Matroskaコンテナのデコードは、多くの消費者電子(CE)デバイスによってサポートされる。DivX,LLC(SanDiego,California)によって開発されたDivX Plusファイルフォーマットは、Matroskaコンテナフォーマットの拡張を利用する(すなわち、Matroskaコンテナフォーマットに基づくが、Matroskaフォーマット内で規定されていない要素を含む)。
インターネットを経由したメディアコンテンツの配信のための一貫した手段を提供するために、International Organization for Standardization(ISO)およびInternational Electrotechnical Commission(IEC)は、HTTP規格による動的適応ストリーミング(DASH)を提示している。DASH規格は、メディアコンテンツのためのフォーマット、およびHTTPを使用するMPEGコンテンツの配信のためのコンテンツの説明を規定する。DASHによると、提示のためのメディアコンテンツの各コンポーネントは、1つ以上のストリームの中に記憶される。ストリームの各々は、セグメントに分割される。メディア提示記述(MPD)は、ストリームの各々の中のセグメントについての情報と、再生中にメディアコンテンツを提示するために必要とされる他の情報とを含むデータ構造である。再生デバイスは、MPDを使用し、再生のために適応ビットレートストリーミングを使用してメディアコンテンツのコンポーネントを取得する。
ネットワーク接続の速度および帯域幅が増加するにつれて、限定されないが、スポーツ大会およびコンサート等のライブイベントのオーバーザトップ(OTT)伝送が、ユーザがイベントを見るための一般的な手段になっている。殆どのライブイベントは、常に、2つ以上のカメラおよび/またはマイクロホンによって捕捉されている。そして、後処理が、イベントの放送のために提示すべき単一のカメラからのビデオを選択するために使用される。これは、視聴者を放送のプロデューサによって選択される単一のカメラからのビューに制限する。しかしながら、時には、ユーザは、他のコンテンツを示すカメラビューを選択できることを欲する。例えば、ユーザは、プロデューサによって選択されるカメラからのビデオコンテンツによって示されないこともある試合中の特定の選手または競技場の部分を見ることに集中することを欲し得る。したがって、視聴者は、ユーザが異なるカメラまたはカメラの組み合わせからのビデオコンテンツからビューを選択する場合、イベントを見ることにより多くの満足を得るであろう。
本発明の実施形態によるシステムおよび方法は、再生デバイスの視点に基づく適合組の選択、および、ネットワークおよび/または再生デバイスの容量に基づく選択された視点からのビデオの適応ビットレートストリーミングを可能にするいくつかの異なる視点の各々のための適合組を提供する。
本発明の一実施形態は、プロセッサと、プロセッサによってアクセス可能なメモリと、メモリに記憶された命令とを含み、命令は、コンテンツプロバイダシステムからビデオコンテンツを要求することと、コンテンツプロバイダシステムから、ビデオコンテンツの複数の代替ストリームを読み出すための情報を含むマニフェストを受信することであってし、複数の代替ストリームの各々は、ビデオコンテンツの複数のビューのうちの1つのためのビデオコンテンツのセグメントを含み、特定の最大ビットレートにおいてエンコードされる、ことと、再生デバイスとコンテンツプロバイダシステムとの間の通信のためのネットワーク帯域幅を決定することと、ビデオコンテンツの所望のビューを決定することと、決定されたネットワーク帯域幅と所望のビューとマニフェストにおける複数の代替ストリームのための情報とに基づいて、ストリーミングに使用する複数の代替ストリームのうちの1つを決定することと、コンテンツプロバイダシステムからのマニフェストにおける複数の代替ストリームのうちの1つのための情報に基づいて、複数の代替ストリームのうちの決定された1つからのビデオコンテンツのセグメントを要求することと、要求に応答して、コンテンツプロバイダシステムから、複数の代替ストリームのうちの決定された1つからの要求されたセグメントを受信することと、受信されたセグメントを再生することとを行うようにプロセッサに指図する。
さらなる実施形態では、命令は、再生デバイスとコンテンツプロバイダシステムとの間の通信を監視することと、監視された通信に基づいて、新しいネットワーク帯域幅へのネットワーク帯域幅の変化を検出することと、マニフェストを使用して、新しいネットワーク帯域幅および所望のビューに基づいて、ストリーミングに使用する複数の代替ストリームのうちの第2のものを決定することと、コンテンツプロバイダシステムからのマニフェストにおける複数の代替ストリームのうちの第2のもののための情報に基づいて、コンテンツプロバイダシステムからの複数の代替ストリームのうちの第2のものから、ビデオコンテンツのセグメントを要求することと、要求に応答して、コンテンツプロバイダシステムからの複数の代替ストリームのうちの第2のものから、要求されたセグメントを受信することと、受信されたセグメントを再生することとを行うようにプロセッサにさらに指図する。
別の実施形態では、命令はさらに、プロセッサに、第2のビューへのビデオコンテンツのビューにおける変化が所望されていることを決定し、マニフェストを使用して、ネットワーク帯域幅および第2のビューに基づいて、ストリーミングに使用する複数の代替ストリームのうちの第2のものを決定し、マニフェストにおける複数の代替ストリームのうちの第2のもののための情報に基づいて、コンテンツプロバイダシステムからの複数の代替ストリームのうちの第2のものから、ビデオコンテンツのセグメントを要求し、要求に応答して、コンテンツプロバイダシステムからの複数の代替ストリームのうちの第2のものの要求されたセグメントを受信し、受信されたセグメントを再生するように指図する。
なおもさらなる実施形態では、ビューの決定は、再生デバイスの検出された移動に基づく。
なおも別の実施形態では、ビューの決定は、視点を決定するための別のデバイスから捕捉された再生デバイスの画像に基づく。
その上さらなる実施形態では、ビューの決定は、ビデオコンテンツとともに受信されるメタデータに基づく。
本発明の方法の実施形態は、再生デバイスを使用して、コンテンツプロバイダシステムからビデオコンテンツを要求することと、コンテンツプロバイダシステムから再生において、ビデオコンテンツの複数の代替ストリームを読み出すための情報を含むマニフェストを受信することであって、複数の代替ストリームの各々は、ビデオコンテンツの複数のビューのうちの1つのためのビデオコンテンツのセグメントを含み、特定の最大ビットレートにおいてエンコードされている、ことと、再生デバイスを使用して、再生デバイスとコンテンツプロバイダシステムとの間の通信のためのネットワーク帯域幅を決定することと、再生デバイスを使用して、ビデオコンテンツの所望のビューを決定することと、再生デバイスを使用して、決定されたネットワーク帯域幅、所望のビュー、およびマニフェストにおける複数の代替ストリームのための情報に基づいて、ストリーミングに使用する複数の代替ストリームのうちの1つを決定することと、再生デバイスを使用して、コンテンツプロバイダシステムからのマニフェストにおける複数の代替ストリームのうちの1つのための情報に基づいて、複数の代替ストリームのうちの決定された1つからのビデオコンテンツのセグメントを要求することと、要求に応答して、再生デバイスにおいて、コンテンツプロバイダシステムからの複数の代替ストリームのうちの1つの要求されたセグメントを受信することと、再生デバイスを使用して、受信されたセグメントを再生することとを含む。
別の実施形態は、再生デバイスを使用して、再生デバイスとコンテンツプロバイダシステムとの間の通信を監視することと、再生デバイスを使用して、新しいネットワーク帯域幅へのネットワーク帯域幅の変化を検出することと、マニフェストにおける情報を使用して、マニフェストを使用して新しいネットワーク帯域幅および所望のビューに基づいて、ストリーミングに使用する複数の代替ストリームのうちの第2のものを決定することと、再生デバイスを使用して、マニフェストにおける複数の代替ストリームのうちの第2のもののための情報に基づいて、コンテンツプロバイダシステムからの複数の代替ストリームのうちの第2のものから、ビデオコンテンツのセグメントを要求することと、要求に応答して、再生デバイスにおいて、コンテンツプロバイダシステムから複数の代替ストリームのうちの第2のものの要求されたセグメントを受信することと、再生デバイスを使用して、受信されたセグメントを再生することとを含む。
さらなる実施形態は、再生デバイスを使用して、第2のビューへのビデオコンテンツのビューにおける変化が所望されていることを決定することと、再生デバイスを使用して、マニフェストにおける情報に基づいて、ネットワーク帯域幅および第2のビューに基づいて、ストリーミングに使用する複数の代替ストリームのうちの第2のものを決定することと、再生デバイスを使用して、マニフェストにおける複数の代替ストリームのうちの第2のもののための情報に基づいて、コンテンツプロバイダシステムからの複数の代替ストリームのうちの第2のものから、ビデオコンテンツのセグメントを要求することと、要求に応答して、再生デバイスにおいて、コンテンツプロバイダシステムからの複数の代替ストリームのうちの第2のものの要求されたセグメントを受信することと、再生デバイスを使用して、受信されたセグメントを再生することとを含む。
なおも別の実施形態では、ビューの決定は、再生デバイスの検出された移動に基づく。
その上さらなる実施形態では、ビューの決定は、視点を決定するための別のデバイスから捕捉された再生デバイスの画像に基づく。
さらに別の実施形態では、ビューの決定は、ビデオコンテンツとともに受信されるメタデータに基づく。
別のさらなる実施形態は、コンテンツプロバイダシステムからビデオコンテンツを要求することと、コンテンツプロバイダシステムから、ビデオコンテンツの複数の代替ストリームを読み出すための情報を含むマニフェストを受信することであって、複数のストリームの各々は、ビデオコンテンツの複数のビューのうちの1つのためのビデオコンテンツのセグメントを含み、特定の最大ビットレートにおいてエンコードされている、ことと、再生デバイスとコンテンツプロバイダシステムとの間の通信のためのネットワーク帯域幅を決定することと、ビデオコンテンツの所望のビューを決定することと、決定されたネットワーク帯域幅、所望のビュー、およびマニフェストにおける複数の代替ストリームのための情報に基づいて、ストリーミングに使用する複数の代替ストリームのうちの1つを決定することと、コンテンツプロバイダシステムからのマニフェストにおける複数の代替ストリームのうちの1つのための情報に基づいて、複数の代替ストリームのうちの決定された1つからのビデオコンテンツのセグメントを要求することと、要求に応答して、コンテンツプロバイダシステムから複数の代替ストリームのうちの1つの要求されたセグメントを受信することと、受信されたセグメントを再生することとを含む。
なおも別のさらなる実施形態は、プロセッサと、プロセッサによってアクセス可能なメモリと、メモリに記憶された命令とを含み、命令は、複数のカメラのうちの1つによって捕捉されたビデオを含むビデオコンテンツの少なくとも1つのストリームを取得することであって、複数のカメラの各々は、異なる視点を有する、ことと、少なくとも1つのストリームからのビデオコンテンツを複数のエンコーダに提供することであって、複数のエンコーダは、ビデオコンテンツ内からの複数の別個の視点の各々を複数の代替ストリームを備えている適合組にエンコードする、ことと、複数の別個の視点の各々に対応する適合組のためのインデックス情報を生成することと、生成された適合組の各々をメモリに記憶することと、マニフェストの中に各適合組のためのマニフェスト情報を記憶することとを行うようにプロセッサに指図し、マニフェストは、適合組の中の複数のストリームの各々のための最大ビットレートと各適合組のための視点とを示す。
さらに別のさらなる実施形態では、ビデオコンテンツの複数のストリームを取得する命令は、複数のカメラによって捕捉されたビデオコンテンツのソースストリームを受信する命令と、ソースストリームを複数のストリームに分割する命令であって、複数のストリームの各々は、複数のカメラのうちの1つからのビデオコンテンツを含む、命令とを含む。加えて、複数のカメラからのビデオコンテンツの複数のストリームは、エンコーダに提供される。
再び、別のさらなる実施形態では、ビデオコンテンツの複数のストリームを取得する命令は、複数のカメラによって捕捉されたビデオコンテンツのソースストリームを受信する命令と、ソースストリームのビデオコンテンツから360度ビュービデオコンテンツを生成する命令と、360度ビュービデオコンテンツを複数のタイルに分割する命令であって、複数のタイルの各々は、特定の視点からのビデオコンテンツのストリームである、命令と含む。加えて、複数のタイルは、エンコーダに提供される。
別のさらなる追加の実施形態では、複数のストリームを取得する命令は、複数のカメラのうちの1つのための複数のストリームの各々を受信する命令を含み、受信された複数のストリームの各々は、複数のエンコーダに提供される。
再び、さらなる実施形態では、プロセッサに指図する命令は、ビデオコンテンツの入力ストリームを受信し、複数の代替ストリームのためのビデオコンテンツを出力するエンコーダを提供する命令をさらに含み、複数の代替ストリームの各々は、異なる最大ビットレートでエンコードされ、エンコーダを提供する命令は、エンコーダを提供する命令から複数のエンコーダをインスタンス化することによって、複数のエンコーダにスケーラブルである。
再び、別の実施形態では、複数のエンコーダに提供されるビデオコンテンツの複数のストリームは、ビデオコンテンツのためのタイミング情報を含み、複数のエンコーダによる複数の代替ストリームへのビデオコンテンツのエンコーディングは、ビデオコンテンツの複数のストリームの中のタイミング情報に基づいて同期させられる。
なおもさらなる実施形態は、再び、複数のカメラのうちの1つによって捕捉されたビデオを含むビデオコンテンツの少なくとも1つのストリームを取得することであって、複数のカメラの各々は、異なる視点を有する、ことと、少なくとも1つのストリームからのビデオコンテンツを複数のエンコーダに提供することであって、複数のエンコーダは、ビデオコンテンツ内からの複数の別個の視点の各々を複数の代替ストリームを備えている適合組にエンコードする、ことと、複数の別個の視点の各々に対応する適合組のためのインデックス情報を生成することと、生成された適合組の各々をメモリに記憶することと、マニフェストの中に各適合組のためのマニフェスト情報を記憶することであって、マニフェストは、適合組の中の複数のストリームの各々のための最大ビットレートと各適合組のための視点とを示す、こととを含む。
再び、なおも別の実施形態では、ビデオコンテンツの複数のストリームの取得は、エンコーディングシステムにおいて、複数のカメラによって捕捉されたビデオコンテンツのソースストリームを受信することと、エンコーディングシステムを使用して、ソースストリームを複数のストリームに分割することであって、複数のストリームの各々は、複数のカメラのうちの1つからのビデオコンテンツを含む、こととを含む。加えて、複数のカメラからのビデオコンテンツの複数のストリームは、エンコーダに提供される。
さらなる追加の実施形態では、ビデオコンテンツの複数のストリームの取得は、エンコーディングシステムにおいて、複数のカメラの各々によって捕捉されたビデオコンテンツのソースストリームを受信することと、エンコーディングシステムを使用して、ソースストリームのビデオコンテンツから360度ビュービデオコンテンツを生成することと、エンコーディングシステムを使用して、360度ビュービデオコンテンツを複数のタイルに分割することであって、複数のタイルの各々は、特定のビューからのビデオコンテンツのストリームである、こととを含む。加えて、複数のタイルは、エンコーダに提供される。
別の追加の実施形態では、複数のストリームの取得は、エンコーディングシステムにおいて、複数のカメラのうちの1つのための複数のストリームの各々を受信することを含み、受信された複数のストリームの各々は、複数のエンコーダに提供される。
なおもその上さらなる追加の実施形態では、複数のエンコーダに提供されるビデオコンテンツの複数のストリームは、ビデオコンテンツのためのタイミング情報を含み、複数のエンコーダによる複数の代替ストリームへのビデオコンテンツのエンコーディングは、ビデオコンテンツの複数のストリームの中のタイミング情報に基づいて同期させられる。
図1は、本発明の実施形態による、異なるカメラおよび/またはビューからのライブイベントのビデオコンテンツのOTT伝送を提供するための適応ビットレートストリーミングシステムのネットワーク図を図示する。 図2は、本発明の実施形態による、2つ以上のカメラおよび/またはビューからのビデオコンテンツをエンコードするエンコーダシステムのコンポーネントのブロック図を図示する。 図3は、本発明の実施形態による、異なる最大ビットレートを有するエンコードされたストリームを使用し、適応ビットレートストリーミングを介してビデオコンテンツを取得する再生デバイスの中の処理システムのコンポーネントのブロック図を図示する。 図4は、本発明の実施形態による、ビデオコンテンツを異なる最大ビットレートを有するストリームにエンコードするエンコーダサーバシステムの中の処理システムのコンポーネントのブロック図を図示する。 図5は、本発明の実施形態による、各々がビューを表す1つ以上のフィードからのビデオコンテンツを適応ビットレートストリーミングシステムで使用される代替ストリームにエンコードするために、エンコーダサーバシステムによって実施されるプロセスのフロー図を図示する。 図6は、本発明の実施形態による、1つ以上の特定のフィードのビデオコンテンツの各セグメントを代替ストリームにエンコードするために、エンコーダサーバシステムの中の各エンコーダによって実施されるプロセスのフロー図を図示する。 図7は、本発明の実施形態による代替ストリームのためのマニフェスト情報を取得し、代替ストリームを使用し、適応ビットレートシステムを使用してビデオコンテンツを取得するために、再生デバイスによって実施されるプロセスのフロー図を図示する。
ここで図面に目を向けると、本発明のいくつかの実施形態による2つ以上のカメラおよび/またはビューからのビデオコンテンツを適応ビットレートストリーミングのための代替ストリームにエンコードし、再生デバイスを使用してコンテンツを取得するためのシステムおよび方法が、図示される。本発明のいくつかの実施形態によると、エンコーディングシステムは、1つ以上のエンコーダを含む。これらの実施形態のうちのいくつかによると、エンコーダは、エンコーディングシステムにおける処理システムによって実行されるソフトウェアによって提供され得る。多くの実施形態によると、エンコーダは、エンコーディングシステムにおけるファームウェアによって提供され得る。いくつかの実施形態によると、エンコーダは、エンコーディングシステムにおけるハードウェアによって提供される。
エンコーディングシステムは、2つ以上のカメラからビデオコンテンツの少なくとも1つのソースストリームを受信する。各カメラからのビデオコンテンツは、タイムスタンプを使用して、他のカメラからのコンテンツと同期させられることができる。いくつかの実施形態によると、ビデオコンテンツは、リアルタイムで録画されているライブフィードであり得る。多くの実施形態によると、各カメラからのビデオコンテンツのソースストリームは、万国標準時によるタイムスタンプを含むことができる。
いくつかの実施形態によると、2つ以上のカメラからのビデオコンテンツは、1つ以上の異なる視点からビューを生成するために処理される。多くの実施形態によると、2つ以上のカメラからのビデオコンテンツは、単一の3Dビデオコンテンツを生成するために使用されることができ、そして、それは、タイルに分割され得る。
いくつかの実施形態によると、2つ以上のカメラの各々からのビデオコンテンツおよび/または異なる視点から生成されたビデオコンテンツのセグメントは、ソースエンコーディングシステムに提供される。多くの実施形態によると、セグメントは、ビデオコンテンツが異なるカメラによって捕捉されるにつれて、リアルタイムでソースエンコーディングシステムに提供され得る。ソースエンコーディングシステムは、2つ以上のカメラの各々からのビデオコンテンツおよび/または異なるビューを用いて生成されたビデオコンテンツのセグメントを受信することができ、各特定のカメラおよび/またはビューからのセグメントを各カメラおよび/またはビューのための代替ストリームを生成する特定のエンコーダもしくはエンコーダの群に提供し得る。これらの代替ストリームは、時として、適応ビットレートストリーミングの文脈において適合組と称される。各特定のエンコーダおよび/またはエンコーダの特定の群は、ビデオコンテンツの各セグメントを適応ビットレートストリーミングをサポートするために使用される種々の代替ストリームにエンコードすることができる。いくつかの実施形態によると、特定のカメラからのビデオコンテンツのため、および/または特定のビューのために生成される各ストリームは、特定のカメラおよび/またはビューのビデオコンテンツのために生成される他の代替ストリームのうちの1つ以上のものと異なる最大ビットレート(もしくは異なる標的平均ビットレート)を有する。多くの実施形態によると、限定されないが、アスペクト比、分解能、およびフレームレートを含む他のパラメータは、各特定のカメラおよび/またはビューからビデオコンテンツのために生成されているストリームの中で変動され得る。
各エンコーダおよび/またはエンコーダの群は、本発明のいくつかの実施形態によると、各特定のストリームのために生成されるセグメントを特定のストリームのための1つ以上のコンテナファイルの中に記憶する。エンコーダは、各カメラおよび/またはビューからのビデオコンテンツのためのストリームの生成された部分の各々のためのインデックスもしくはマニフェスト情報を生成することができる。生成されたインデックスマニフェスト情報は、本発明のいくつかの実施形態によると、インデックスファイルまたはマニフェストに追加され得る。プロセスは、カメラおよび/またはビューからのソースストリームの終了が受信されるまで繰り返され得る。
多くの実施形態によると、各カメラおよび/またはビューのためのメディアコンテンツは、H.265/HEVCまたはH.264/AVCエンコーディング規格によるコンテンツのエンコーディングを伴うMPEG−DASH規格に従ってストリームの中に記憶され、ISOコンテナファイルフォーマットで記憶されることができる。多くの実施形態では、コンテナファイルの中に記憶されたコンテンツは、MPEGによって規定される共通暗号化フォーマットに従って暗号化される。しかしながら、限定されないが、Matroska(MKV)コンテナファイルフォーマット等の他のフォーマットも、本発明の種々の実施形態によると、メディアコンテンツのストリームを記憶するために使用され得る。
本発明のいくつかの実施形態による適応ビットレートストリーミングシステムの性能は、ビデオのセグメントが内部フレームである瞬間デコーダリフレッシュ(IDR)フレームから始まる単一の(または少なくとも1つの)ピクチャの閉鎖グループ(GOP)として各ストリームの中でエンコードされるように、代替ストリームの各々の中のソースビデオの各部分をエンコードすることによって、有意に強化されることができる。再生中、再生デバイスは、ビデオセグメントが取得されるストリームにかかわらず、ビデオセグメントの再生の完了時に使用される代替ストリームを切り替えることができる。何故なら、次のビデオセグメントの第1のフレームが、IDRフレームであるからであり、IDRフレームは、ビデオセグメント内に含まれるエンコードされたメディア以外のどんなエンコードされたメディアも参照することなくデコードされ得る。
いくつかの実施形態では、再生デバイスは、MPDからカメラおよび/またはビューの各々のためのビデオコンテンツの利用可能なストリームの各々に関する情報を取得する。そして、再生デバイスは、ビデオコンテンツの再生で利用する1つ以上のストリームを選択し得る。再生デバイスは、関連コンテナファイル内に記憶されるエンコードされたビデオコンテンツのセグメントにインデックスを付けるインデックス情報も要求し得る。インデックス情報は、コンテナファイル内に、コンテナファイルとは別個にMPDの中、または別個のインデックスファイルの中に記憶されることができる。インデックス情報は、再生デバイスがコンテンツプロバイダのサーバからHTTP(または別の適切なステートフルもしくはステートレスプロトコル)を介してエンコードされたビデオコンテンツの特定の部分を含むコンテナファイル(またはコンテナファイル全体)内のエンコードされたビデオコンテンツのセグメントに対応するビデオコンテンツのバイト範囲を要求することを可能にすることができる。再生は、再生デバイスがネットワーク条件および/または再生デバイスの性質によってサポートされ得る最大ビットレートにおいてエンコードされる特定のカメラ/ビューのためのビデオコンテンツを有するストリームからのエンコードされたビデオコンテンツのセグメントを要求することにより継続される。
本発明のいくつかの実施形態によると、再生デバイスは、以下の様式で動作し、エンコーディングシステムにおける複数のエンコーダによって生成される異なるカメラおよび/または異なるビューからのビデオコンテンツのストリームを使用し得る。再生デバイスは、ビデオコンテンツを含むメディアコンテンツを要求することができる。要求に応答して、再生デバイスは、メディアコンテンツのために維持されるMPDまたはインデックスファイルを受信することができる。再生デバイスは、MPDからのインデックス情報を使用し、適応ビットレートストリーミングを実施して、選択されたカメラおよび/またはビューからビデオコンテンツを取得することができる。コンテンツの視聴中、再生デバイスは、視聴方向の変化に基づいて、適応ストリームの代替的組に切り替えることができる。このように、いわゆる「360度」ビデオは、一連のタイルとしてエンコードされることができ、タイルの各々は、適応ビットレートストリーミングを介して配信され得、再生デバイスは、視聴方向、利用可能な帯域幅、および/または処理能力に基づいて選択するストリームを決定するストリーム切り替え決定エンジンに基づいて、ストリームの間で選定することができる。
本発明のいくつかの実施形態による適応ビットレートストリーミングで使用するために2つ以上のカメラおよび/または異なるビューからのビデオコンテンツをエンコードし、適応ビットレートストリーミングを介して生成されたストリームからビデオコンテンツを取得するためのシステムおよび方法が、以下でさらに議論される。
(適応ストリーミングアーキテクチャ)
本発明の実施形態による2つ以上のカメラおよび/または異なるビューによって捕捉されるビデオコンテンツのための代替ストリームを生成するエンコーディングシステムを含む適応ビットレートストリーミングシステムが、図1に図示される。適応ストリーミングシステム10は、ソースメディアコンテンツをエンコードするように構成されるソースエンコーディングシステム12を含み、ソースエンコーディングシステム12は、2つ以上のカメラ捕捉されたビデオコンテンツ、および/または、いくつかの代替ストリームとして捕捉されたコンテンツから生成される異なるビューを含む。図示される実施形態では、ソースエンコーダは、単一のサーバである。多くの実施形態によると、ソースエンコーダは、プロセッサと、代替ストリームへのソースメディア(限定されないが、ビデオ、オーディオ、および/または字幕を含む)のトランスコーディングを実施するために十分なリソースとを含む任意の処理デバイスもしくは処理デバイスの群であり得る。典型的には、ソースエンコーディングサーバ12は、MPDを生成し、MPDは、ストリームを含むコンテナファイルを示すインデックス、および/またはメタデータ情報を含む。多くの実施形態では、インデックス(例えば、MPDファイル)の中で識別されるストリームのうちの少なくとも2つは、単一のカメラによって、および/または単一の視点から捕捉されるビデオコンテンツの代替ストリームである。代替ストリームは、異なる方法で同じメディアコンテンツをエンコードするストリームである。多くの事例では、代替ストリームは、異なる最大ビットレートにおいてビデオコンテンツをエンコードする。いくつかの実施形態によると、ビデオコンテンツの代替ストリームは、異なる分解能、異なるフレームレート、および他の種々のビデオパラメータを用いてエンコードされることもできる。しかしながら、ソースエンコーダシステム12は、複数のエンコーダを使用して、代替ストリームを生成し得、各特定のエンコーダは、特定のエンコーダによって生成される1つまたは複数のストリームのセグメントのためのインデックスもしくはマニフェストデータ(例えば、MPDデータ)を生成することができる。種々のエンコーダによって生成されるMPDまたはマニフェスト情報、およびコンテナファイルは、HTTPサーバ14にアップロードされることができる。そして、種々の再生デバイスは、HTTPまたは別の適切なステートレスプロトコルを使用して、インターネット等のネットワーク16を介して、MPD、インデックスファイル、およびコンテナファイルの部分を要求することができる。
本発明のいくつかの実施形態によると、ソースエンコーディングシステム12は、接続されたカメラシステム150からビデオおよび/またはオーディオコンテンツを取得する。カメラシステム150は、異なる視点からビデオコンテンツを捕捉する複数のカメラ155−159を含み得る。多くの実施形態によると、カメラシステム150は、個々のカメラ155−159の種々の視野角度に基づいて、環境の360°ビューを捕捉するために十分な数のカメラを含み得る。いくつかの実施形態によると、個々のカメラシステム155−159は、単一のシステムに統合されないこともあり、種々の異なる視点から場面を捕捉するような様式で配置され、および/または間隔を置かれ得る。いくつかの実施形態によると、カメラ155−158および/またはカメラシステム150は、ソースエンコーディングシステム12に直接接続されないこともある。代わりに、カメラ155−159および/またはカメラシステム150は、ネットワーク接続を介してソースエンコーディングシステム12に接続されることができる。種々の実施形態によると、ネットワークは、広域ネットワーク(WAN)、ローカルローカルエリアネットワーク(LAN)、またはインターネットを使用する仮想プライベートネットワーク(VPN)であり得る。いくつかの実施形態によると、カメラシステム150および/またはカメラ155−159は、無線通信システムによってソースエンコーディングネットワーク12に接続され得る。いくつかの実施形態によると、カメラシステム150は、Nokia Technologies(Finland)製のNokia OZOカメラシステムである。
図示される実施形態では、ソースシステム12の種々のエンコーダによって生成されるマニフェストデータ(例えば、MPDデータ)を使用して、適応ビットレートストリーミングを実施し得る再生デバイスは、パーソナルコンピュータ18、CEプレーヤ、および携帯電話20を含むことができる。多くの実施形態によると、再生デバイスはまた、DVDプレーヤ、Blu−ray(登録商標)プレーヤ、テレビ、セットトップボックス、ビデオゲーム機、タブレット、仮想現実ヘッドセット、拡張現実ヘッドセット、および(限定されないが)HTTPを含む通信プロトコルを介してサーバに接続し、エンコードされたメディアを再生することが可能である他のデバイス等の消費者電子デバイスを含むこともできる。
具体的アーキテクチャが図1に示されているが、適応ビットレートストリーミングではなく、従来のストリーミングを実施する(例えば、切り替えが視点の変化のみに基づく)システムを含む種々のアーキテクチャのうちのいずれかが、本発明の種々の実施形態によると、再生デバイスがビデオコンテンツのセグメントを要求および再生することを可能にするために、利用されることができる。
(エンコーダシステム)
本発明の実施形態による複数のエンコーダを使用し、2つ以上のカメラおよび/またはビューからのビデオコンテンツを適応ビットレートストリーミングでの使用のための代替ストリームにエンコードするソースエンコーダシステムが、図2に示される。ソースエンコーディングシステム200は、ルータ205と、エンコーディングサーバ210とを含む。エンコーディングサーバ210は、ルータ205に通信可能に接続される。ルータ205は、本発明の種々の実施形態によると、類似機能を果たすサーバ、任意の他のシステム、またはシステムの群でもあり得る。図2では、1つのみのルータが、明確および簡潔にするために示されている。ルータ205は、カメラ201−204の各々からビデオコンテンツのストリームを受信する。いくつかの実施形態によると、各カメラ201−204は、イベントの画像を捕捉し、タイミング情報を含むコンテンツのストリームを生成する。多くの実施形態によると、各カメラ201−204は、埋め込まれたタイミング情報を伴うビデオコンテンツのストリームを生成するカメラシステムにカメラによって捕捉されるビデオコンテンツを提供する。ルータ205は、カメラ201−204から受信されるビデオコンテンツのストリームをエンコーダサーバ210に提供する。
エンコーダサーバ210は、複数のエンコーダ215−218を含む。いくつかの実施形態によると、エンコーダ215−218の各々は、ソフトウェアのインスタンス化であり得、ソフトウェアは、ソースコンテンツのデコーディングおよび/またはエンコーディングを実施するためにメモリに記憶された命令からプロセッサによって実行される。多くの実施形態によると、エンコーダ215−218のうちの1つ以上のものの各々は、受信されたコンテンツをエンコードするサーバの中の特定のハードウェアコンポーネントであり得る。いくつかの実施形態では、エンコーダのうちの1つ以上のものは、ハードウェアおよびソフトウェアがエンコーダを提供するために使用されるファームウェアコンポーネントであり得る。いくつかの実施形態によると、ルータ205は、カメラ201−204からのビデオコンテンツの各着信ソースストリームをサーバ210のエンコーダ215−218のうちの1つに提供することができる。多くの実施形態によると、ルータ205は、カメラ201−204のうちの1つからの各ストリームの部分をエンコーダ215−218のうちの2つ以上のものに伝送し得る。いくつかの実施形態によると、サーバ210は、ルータ205からソースストリームを受信し得、ソースストリームが受信されること、各着信ソースストリームのコピーを関連付けられたエンコーダの群に提供することができる。そして、エンコーダ215−218は、以下でより詳細に説明されるように、コンテンツのストリームを代替ストリームにエンコードし、ストリームのためのマニフェスト情報を生成し得る。
サーバシステムの具体的アーキテクチャが図2に示されているが、2つ以上のカメラからのビデオコンテンツのストリームからビデオコンテンツをエンコードするシステムを含む種々のアーキテクチャのうちのいずれかが、本発明の種々の実施形態によると、利用されることができる。
(再生デバイス)
本発明のいくつかの実施形態による異なるカメラおよび/またはビューからのビデオコンテンツのための代替ストリームを使用するためのプロセスは、再生デバイスによって実行される。本発明実施形態によるプロセスを実施し得る再生デバイスの中の関連コンポーネントが、図3に示される。再生デバイスは、本発明の種々の実施形態から逸脱することなく簡略にするために省略される他のコンポーネントを含み得る。図3では、再生デバイス300は、プロセッサ305と、不揮発性メモリ310と、揮発性メモリ315とを含む。プロセッサ305は、揮発性メモリ315および/または不揮発性メモリ310の中に記憶された命令を実施し、メモリに記憶されたデータを操作するプロセッサ、マイクロプロセッサ、コントローラ、またはプロセッサ、マイクロプロセッサ、および/またはコントローラの組み合わせであり得る。不揮発性メモリ310は、本発明のいくつかの実施形態によると、複数のエンコーダによってエンコードされる代替ストリームを使用し、適応ビットレートストリーミングを使用してビデオコンテンツを取得するためのプロセスを含むプロセスを実施するように再生デバイス300を構成するために利用されるプロセッサ命令を記憶することができる。種々の他の実施形態によると、再生デバイスは、命令を含む、および/またはこれらのプロセスを実施し得るハードウェアおよび/またはファームウェアを有し得る。なおも他の実施形態によると、プロセスのための命令は、特定の用途に適切な種々の非一過性コンピュータ読み取り可能なメディアのうちのいずれかの中に記憶されることができる。
(サーバシステム)
本発明の実施形態による複数のエンコーダを使用して、2つ以上のカメラおよび/またはビューの各々からのビデオコンテンツを適応ビットレートストリーミングのための代替ストリームにエンコードする方法およびシステムを提供するプロセスは、エンコーディングサーバ等のエンコーダシステムによって実施される。本発明の実施形態によるこれらのプロセスを実施するエンコーディングサーバの中の関連コンポーネントが、図4に示される。種々の他の実施形態によるサーバは、本発明の種々の実施形態から逸脱することなく簡略にするために省略される他のコンポーネントを含み得る。サーバ400は、プロセッサ405と、不揮発性メモリ410と、揮発性メモリ415とを含む。プロセッサ405は、揮発性415および/または不揮発性メモリ410の中に記憶された命令を実施し、メモリに記憶されたデータを操作するプロセッサ、マイクロプロセッサ、コントローラ、またはプロセッサ、マイクロプロセッサ、および/またはコントローラの組み合わせであり得る。不揮発性メモリ410は、本発明のいくつかの実施形態によると、メディアコンテンツをエンコードするため、および/またはマーカ情報を生成するためのプロセスを含むプロセスを実施するようにサーバ400を構成するために利用されるプロセッサ命令、および/または利用されているプロセスのためのデータを記憶することができる。多くの実施形態によると、これらの命令は、サーバソフトウェアおよび/またはファームウェアの中にあり得、特定の用途に適切な種々の非一過性コンピュータ読み取り可能なメディアのうちのいずれかの中に記憶されることができる。具体的サーバが図4に図示されているが、任意の数のプロセスを実施するように構成される種々のサーバのうちのいずれかが、本発明の種々の実施形態によると、利用されることができる。
(エンコーディングシステムを使用する適応ビットレートストリーミングのための代替ストリームへの2つ以上のカメラからのビデオコンテンツのエンコーディング)
本発明のいくつかの実施形態によると、エンコーディングシステムは、複数のエンコーダを使用して、2つ以上のカメラおよび/またはビューの各々からのビデオコンテンツを適応ビットレートストリーミングのための代替ストリームにエンコードする。多くの実施形態によると、エンコーダは、プロセッサによって実施または実行され得るメモリから読み取られるソフトウェア命令のインスタンス化であるソフトウェアエンコーダであり得る。ソフトウェアエンコーダは、処理およびメモリリソースのみが追加のエンコーダをシステムに追加するために必要とされるので、エンコーダの費用を削減すること、および/またはシステムのスケーラビリティを改良することが望ましいときに使用され得る。いくつかの実施形態によると、複数のエンコーダのうちの1つ以上のものは、ハードウェアエンコーダであり得る。ハードウェアエンコーダは、受信されたコンテンツを1つ以上のストリームにエンコードするためのプロセスを実施するように構成される回路である。いくつかの実施形態によると、エンコーダのうちの1つ以上のものは、ファームウェアエンコーダであり得る。ファームウェアエンコーダは、いくつかのハードウェアコンポーネントおよびいくつかのソフトウェアプロセスを組みわせ、エンコーダを提供する。
2つ以上のカメラの各々からのビデオコンテンツは、コンテンツプロバイダからの単一のソースストリームまたは複数のストリームとして受信され得る。いくつかの実施形態によると、2つ以上のカメラの各々からのビデオコンテンツは、ビデオコンテンツがリアルタイムで捕捉およびストリーミングされていることを意味する生放送であり得る。ビデオコンテンツは、時間情報を含み得る。時間情報は、限定されないが、放送時間、提示時間、および/または記録時間を含み得る。多くの実施形態によると、エンコーダシステムは、2つ以上のカメラの各々からソースストリームを受信し、各ストリームを特定のエンコーダまたはエンコーダの群に提供する。エンコーダまたはエンコーダの群の各々は、各カメラおよび/またはビューのためのビデオコンテンツのソースストリームを受信することができ、代替ストリームの部分を生成することができる。いくつかの実施形態によると、エンコーディングシステムは、1つのソースストリームの中で2つ以上のカメラからストリームを受信し得、ソースストリームにおける各カメラによって捕捉されるビデオコンテンツを各カメラからのビデオコンテンツの別個のストリームに分割する。多くの実施形態によると、複数のエンコーダまたはエンコーダの群の各々は、特定のカメラおよび/またはビューからのビデオコンテンツのストリームのための代替ストリームの単一の組を生成することができる。いくつかの実施形態によると、エンコーディングシステムは、処理を実施し、1つ以上のカメラからのビデオコンテンツのストリームから、1つ以上のビューのためのストリームを生成し得る。いくつかの実施形態では、エンコーディングシステムは、2つ以上のカメラの各々からのビデオコンテンツのストリームから1つの360°ビデオストリームを生成し、その360°ビデオストリームを特定のビューを生成することにおける使用のためのタイルに分割し得る。本発明のいくつかの異なる実施形態による2つ以上のカメラおよび異なるビューからのビデオコンテンツの各ソースストリームから、ビデオコンテンツの代替ストリームをエンコードするためのプロセスが、図5および6に示される。
本発明の実施形態による2つ以上のカメラおよび/またはビューの各々からのビデオコンテンツを適応ビットレートストリーミングでの使用のための代替ストリームにエンコードするために、エンコーディングシステムによって実施されるプロセスのフローチャートが、図5に示される。プロセス500では、エンコーダは、2つ以上のカメラの各々からのビデオコンテンツを含むビデオコンテンツのソースストリームの一部を受信する(505)。エンコーダは、2つ以上のカメラからのビデオコンテンツのソースストリームを2つ以上のカメラの各々のためのビデオコンテンツの個々のソースストリームに分離する(510)。いくつかの実施形態によると、個々のカメラからのビデオコンテンツは、個々のストリームの中で受信され得、分離は、必要とされない。
ソースエンコーダシステムは、2つ以上のカメラのビデオストリームからのビデオコンテンツを処理し、2つ以上のカメラの視点と異なる1つ以上の視点のためのビデオコンテンツを生成し得る(515)。いくつかのこれらの実施形態では、処理は、2つ以上のストリームによって捕捉されるビデオコンテンツから360°ビデオコンテンツのストリームを生成することと、360°ビデオコンテンツを各タイルが別個のソースストリームである別個のタイルに分割することとを含み得る。各タイルは、別個のソースストリームを構成し得るが、タイルは、オリジナル360°ビデオコンテンツの重複した領域をエンコードすることにより、コンテンツの360°ビュー内の隣接した視点のための適合組の間の円滑な遷移を可能にし得る。容易に理解され得るように、360°ビデオコンテンツをエンコードするために使用されるタイルの数および(該当する場合)タイル間の重複の程度は、具体的用途の要件に大きく依存する。
各ビデオコンテンツストリームは、適応ビットレートストリーミングでの使用のために、各ソースストリームを複数の代替ストリームにエンコードする特定のエンコーダまたはエンコーダの群に提供されることができる(520)。いくつかの実施形態によると、各特定のカメラおよび/またはビューからのビデオコンテンツの生成されたストリームのうちの2つ以上のものは、異なる最大ビットレートでエンコードされる。いくつかの他の実施形態によると、2つ以上のカメラおよび/またはビューのうちの特定のものからのビデオコンテンツのための代替ストリームのうちの2つ以上のものは、同じ最大ビットレートと、限定されないが、異なるアスペクト比、分解能、および/またはフレームレートを含む異なるビデオパラメータとを有する。エンコーダは、生成されたセグメントのためのインデックスまたはマニフェスト情報も生成する。各ストリームのための生成されたセグメントは、特定のストリームのセグメントを記憶する単一のコンテナファイルまたは別個のコンテナファイルの中に記憶されることができ(525)、インデックスまたはマニフェスト情報は、メモリに記憶されたビデオコンテンツのためのマニフェストまたはインデックスファイルに追加され、および/または、マニフェストファイルによって参照される別個のファイルの中に設置されることができる。ストリームが生放送からであるいくつかの実施形態では、マニフェストまたはインデックス情報は、更新としてクライアント再生デバイスに配信され得る。プロセス500は、エンコーダがソースストリームの終了を受信する、および/または、ソースストリームの受信がある他の様式で停止されるまで、繰り返す(530)。
2つ以上のカメラおよび/またはビューの各々からのビデオコンテンツのためのビデオコンテンツの代替ストリームをエンコードするためにエンコーダによって実施されるプロセスの種々の実施形態が、上で説明されるが、システム要件に従って、エンコーディングプロセスのステップを追加、除去、および/または組み合わせる種々の他の実施形態によるプロセスも、可能である。
本発明のいくつかの実施形態によると、各エンコーダまたはエンコーダの群は、カメラまたはビューのうちの1つからのビデオコンテンツのソースストリームをセグメントに分割し、ビデオコンテンツのための代替ストリームのセグメントを生成する。本発明の実施形態による2つ以上のカメラおよび/またはビューのうちの1つからのビデオコンテンツの複数の代替ストリームを生成するために、各エンコーダまたはエンコーダの群によって実施されるプロセスのフロー図が、図6に示される。
プロセス600では、エンコーダまたはエンコーダの群は、少なくとも2つのカメラまたはビューのうちの1つからビデオコンテンツのソースストリームの一部を受信する(605)。いくつかの実施形態によると、一部は、タイミング情報を含む。多くの実施形態によると、エンコーダまたはエンコーダの群は、一部とともに受信される時間情報を使用し、エンコーダがストリームをエンコードし始めるべきストリームにおける点を決定し得る。いくつかの実施形態によると、ソースストリームの全てのためのエンコーダが同じタイミング情報を使用しているので、エンコーダによって実施されるエンコーディングは、同期させられることができ、それによって、各エンコードによって生成されるセグメントは、提示時間の観点から、提示するビデオコンテンツの同じ持続時間を含み得、セグメントは、整列させられる。
エンコーダは、代替ストリームの各々の性質に従って、ストリームの受信された部分からのビデオコンテンツを修正し、代替ストリームのためのセグメントを生成することができる(610)。いくつかの実施形態によると、各特定のカメラおよび/またはビューからのビデオコンテンツの代替ストリームのうちの2つ以上のものは、異なる最大ビットレートでエンコードされ得る。いくつかの他の実施形態によると、各特定のカメラおよび/またはビューからのビデオコンテンツの代替ストリームのうちの2つ以上のものは、異なるビデオパラメータを用いるが、同じ最大ビットレートにおいてエンコードされ得る。いくつかの実施形態によると、ビデオパラメータは、限定されないが、アスペクト比、分解能、および/またはフレームレートを含む。多くの実施形態では、異なる最大ビットレートは、異なるビデオパラメータを伴うビデオをエンコードすることによって達成される。各特定の代替ストリームのための各生成されたセグメントが、エンコードされることができ(620)、生成されたセグメント毎のマニフェスト情報が、生成されることができる(625)。各代替ストリームのためのエンコードされたセグメントは、セグメントの代替ストリームに関連付けられるコンテナファイルの中に記憶されることができ(630)、マニフェスト情報は、セグメントの特定の代替ストリームに関連付けられたマニフェストまたはインデックスファイルに追加されることができる(635)。多くの実施形態によると、特定のエンコーダによって生成されるマニフェストまたはインデックス情報は、特定のエンコーダによってエンコードされるセグメントのためのMPDに追加され得る。いくつかの実施形態では、マニフェストまたはインデックス情報は、更新としてクライアント再生デバイスに配信されることができる。プロセス600は、エンコーダがストリームの終了を受信するまで、および/または、ストリームの受信がある他の様式で停止されるまで、繰り返す(640)。
本発明の種々の実施形態による2つ以上のカメラまたはビューの各々からのビデオコンテンツのためのビデオコンテンツの代替ストリームをエンコードするためにエンコーダによって実施されるプロセスの種々の例が、上で説明されるが、システム要件に従って、ステップを追加、組み合わせ、および/または除去する種々の他の実施形態によるストリームのための部分をエンコードするための他のプロセスが、実施され得る。
(複数のエンコーダによって生成される代替ストリームを使用してビデオコンテンツを取得するために、再生デバイスによって実施されるプロセス)
本発明のいくつかの実施形態によると、再生デバイスは、再生のために2つ以上のカメラおよび/またはビューの各々からのビデオコンテンツのための代替ストリームを使用する。多くの実施形態では、再生デバイスは、適応ビットレートストリーミングを使用し、複数のエンコーダを使用して生成される代替ストリームからメディアコンテンツを取得する。そうするために、再生デバイスは、適応ビットレートストリーミング中、セグメントを取得することにおける使用のためのエンコーダによって生成されるマニフェスト情報(例えば、MPD)を受信し得る。本発明の実施形態による適応ビットレートストリーミングを実施するために再生デバイスによって実施されるプロセスが、図7に示される。
プロセス700では、再生デバイスは、ビデオコンテンツのための情報を提供するMPD、インデックス、またはマニフェストを要求する(705)。再生デバイスは、2つ以上のカメラおよび/またはビューの各々からのビデオコンテンツの代替ストリームのための情報を含むMPD、インデックス、またはマニフェストを受信する(710)。再生デバイスは、ネットワーク帯域幅を決定する(715)。ネットワーク帯域幅の決定は、本発明の種々の実施形態によると、任意の数の既知の様式のうちの1つで実施され得る。
ビデオコンテンツを受信および視聴すべき所望のビューまたはカメラが、決定される(720)。種々の実施形態によると、再生デバイスは、限定されないが、再生デバイスの検出された移動;視点を決定するために別のデバイスから捕捉されるデバイスおよび/またはユーザの画像の使用;および/または、ビデオコンテンツとともに受信される運動データまたは他のメタデータを含む任意の数の様式で所望のビューまたはカメラを決定し得る。再生デバイスは、ネットワーク帯域幅および所望のビューまたはカメラを使用し、適応ストリーミングで使用すべき代替ストリームのうちの1つを選択し、所望のビューまたはカメラのためのビデオコンテンツを取得することができる。再生デバイスは、決定されたストリームを使用して、所望のカメラおよび/またはビューのためのビデオコンテンツのセグメントを取得することができる(725)。本発明のいくつかの実施形態によると、再生デバイスは、再生デバイスとコンテンツプロバイダシステムとの間のネットワークを経由した通信に基づいて、ネットワーク帯域幅を監視し得る。再生デバイスは、再生が完了するまで適応ビットレートストリーミング技法を使用して、現在のネットワーク帯域幅を考慮して再生デバイスによってハンドリングされることができる最高の最大ビットレートにおいてエンコードされる所望のビューのオーディオおよび/またはビデオコンテンツの他のストリームを選択し得る(730)。いくつかの実施形態によると、再生デバイスによって実施される適応ビットレートストリーミングは、その開示が参照することによってその全体として本明細書に組み込まれる、「Systems and Methods for Determining Available Bandwidth and Performing Initial Stream Selection When Commencing Streaming Using Hypertext Transfer Protocol」と題された米国特許出願公開第2013/0007200号、および「Systems and Methods for Performing Multiphase Adaptive Bitrate Streaming」と題された米国特許第8,832,297号に説明されるプロセスに従い得る。より具体的には、これらの参考文献に説明される適応ビットレートストリーミングを使用してビデオコンテンツを取得するために再生デバイスによって実施されるプロセスは、参照することによって本明細書に組み込まれる。そして、プロセス700は、ビデオコンテンツの終了に達するまで、または提示がある他の様式で中断されるまで、周期的に繰り返される(730)。
本発明は、本発明の範囲および精神から逸脱することなく、それらが準拠する特定の規格内で規定されるもの以外の特徴をサポートするエンコーダおよびデコーダを利用すること等の実装の種々の変更を含む上で具体的に説明されるもの以外の様式で実践され得ることを理解されたい。したがって、上で議論される本発明の実施形態は、あらゆる点で制限的ではなくて例証的と見なされるべきである。

Claims (24)

  1. 再生デバイスであって、前記再生デバイスは、
    プロセッサと、
    前記プロセッサによってアクセス可能なメモリと、
    前記メモリに記憶された命令と
    を備え、
    前記命令は、
    コンテンツプロバイダシステムからビデオコンテンツを要求することと、
    コンテンツプロバイダシステムから、ビデオコンテンツの複数の代替ストリームを読み出すための情報を含むマニフェストを受信することであって、複数の代替ストリームの各々は、前記ビデオコンテンツの複数のビューのうちの1つのためのビデオコンテンツのセグメントを含み、特定の最大ビットレートにおいてエンコードされている、ことと、
    前記再生デバイスとコンテンツプロバイダシステムとの間の通信のためのネットワーク帯域幅を決定することと、
    前記ビデオコンテンツの所望のビューを決定することと、
    前記決定されたネットワーク帯域幅と前記所望のビューと前記マニフェストにおける前記複数の代替ストリームのための情報とに基づいて、ストリーミングのために使用すべき前記複数の代替ストリームのうちの1つを決定することと、
    前記コンテンツプロバイダシステムからの前記マニフェストにおける前記複数の代替ストリームのうちの前記決定された1つのための情報に基づいて、前記複数の代替ストリームのうちの前記決定された1つからのビデオコンテンツのセグメントを要求することと、
    前記要求に応答して、前記コンテンツプロバイダシステムから、前記複数の代替ストリームのうちの前記決定された1つからの前記要求されたセグメントを受信することと、
    前記受信されたセグメントを再生することと
    を行うように前記プロセッサに指図する、再生デバイス。
  2. 前記命令は、
    前記再生デバイスと前記コンテンツプロバイダシステムとの間の通信を監視することと、
    前記監視された通信に基づいて、新しいネットワーク帯域幅への前記ネットワーク帯域幅の変化を検出することと、
    前記マニフェストを使用して、前記新しいネットワーク帯域幅および前記所望のビューに基づいて、ストリーミングのために使用すべき前記複数の代替ストリームのうちの第2のものを決定することと、
    前記コンテンツプロバイダシステムからの前記マニフェストにおける前記複数の代替ストリームのうちの前記第2のもののための情報に基づいて、前記コンテンツプロバイダシステムから、前記複数の代替ストリームのうちの前記第2のものからの前記ビデオコンテンツのセグメントを要求することと、
    前記要求に応答して、前記コンテンツプロバイダシステムから、前記複数の代替ストリームのうちの前記第2のものからの前記要求されたセグメントを受信することと、
    前記受信されたセグメントを再生することと
    を行うように前記プロセッサにさらに指図する、請求項1に記載の再生デバイス。
  3. 前記命令は、
    第2のビューへの前記ビデオコンテンツのビューにおける変化が所望されていることを決定することと、
    前記マニフェストを使用して、前記ネットワーク帯域幅および前記第2のビューに基づいて、ストリーミングのために使用すべき前記複数の代替ストリームのうちの第2のものを決定することと、
    前記マニフェストにおける前記複数の代替ストリームのうちの前記第2のもののための情報に基づいて、前記コンテンツプロバイダシステムから、前記複数の代替ストリームのうちの前記第2のものからの前記ビデオコンテンツのセグメントを要求することと、
    前記要求に応答して、前記コンテンツプロバイダシステムから、前記複数の代替ストリームのうちの前記第2のものの前記要求されたセグメントを受信することと、
    前記受信されたセグメントを再生することと
    を行うように前記プロセッサにさらに指図する、請求項1に記載の再生デバイス。
  4. 前記ビューの決定は、前記再生デバイスの検出された移動に基づく、請求項1に記載の再生デバイス。
  5. 前記ビューの決定は、視点を決定するための別のデバイスから捕捉された前記再生デバイスの画像に基づく、請求項1に記載の再生デバイス。
  6. 前記ビューの決定は、前記ビデオコンテンツとともに受信されるメタデータに基づく、請求項1に記載の再生デバイス。
  7. 再生デバイスを使用して複数のビューのうちの1つからのビデオコンテンツの再生を提供する方法であって、前記方法は、
    前記再生デバイスを使用して、コンテンツプロバイダシステムからビデオコンテンツを要求することと、
    コンテンツプロバイダシステムから、前記再生において、ビデオコンテンツの複数の代替ストリームを読み出すための情報を含むマニフェストを受信することであって、複数の代替ストリームの各々は、前記ビデオコンテンツの複数のビューのうちの1つのためのビデオコンテンツのセグメントを含み、特定の最大ビットレートにおいてエンコードされている、ことと、
    前記再生デバイスを使用して、前記再生デバイスとコンテンツプロバイダシステムとの間の通信のためのネットワーク帯域幅を決定することと、
    前記再生デバイスを使用して、前記ビデオコンテンツの所望のビューを決定することと、
    前記再生デバイスを使用して、前記決定されたネットワーク帯域幅、前記所望のビュー、および前記マニフェストにおける前記複数の代替ストリームのための情報に基づいて、ストリーミングのために使用すべき前記複数の代替ストリームのうちの1つを決定することと、
    前記再生デバイスを使用して、前記コンテンツプロバイダシステムからの前記マニフェストにおける前記複数の代替ストリームのうちの前記決定された1つのための情報に基づいて、前記複数の代替ストリームのうちの前記決定された1つからのビデオコンテンツのセグメントを要求することと、
    前記要求に応答して、前記再生デバイスにおいて、前記コンテンツプロバイダシステムからの前記複数の代替ストリームのうちの前記1つからの前記要求されたセグメントを受信することと、
    前記再生デバイスを使用して、前記受信されたセグメントを再生することと
    を含む、方法。
  8. 前記再生デバイスを使用して、前記再生デバイスと前記コンテンツプロバイダシステムとの間の通信を監視することと、
    前記再生デバイスを使用して、新しいネットワーク帯域幅への前記ネットワーク帯域幅の変化を検出することと、
    前記マニフェストにおける情報を使用して、前記マニフェストを使用して前記新しいネットワーク帯域幅および前記所望のビューに基づいて、ストリーミングのために使用すべき前記複数の代替ストリームのうちの第2のものを決定することと、
    前記再生デバイスを使用して、前記マニフェストにおける前記複数の代替ストリームのうちの前記第2のもののための情報に基づいて、前記コンテンツプロバイダシステムから、前記複数の代替ストリームのうちの前記第2のものからの前記ビデオコンテンツのセグメントを要求することと、
    前記要求に応答して、前記再生デバイスにおいて、前記コンテンツプロバイダシステムから前記複数の代替ストリームのうちの前記第2のものの前記要求されたセグメントを受信することと、
    前記再生デバイスを使用して、前記受信されたセグメントを再生することと
    をさらに含む、請求項7に記載の方法。
  9. 前記再生デバイスを使用して、第2のビューへの前記ビデオコンテンツのビューにおける変化が所望されていることを決定することと、
    前記再生デバイスを使用して、前記マニフェストにおける情報に基づいて、前記ネットワーク帯域幅および前記第2のビューに基づいて、ストリーミングのために使用すべき前記複数の代替ストリームのうちの第2のものを決定することと、
    前記再生デバイスを使用して、前記マニフェストにおける前記複数の代替ストリームのうちの前記第2のもののための情報に基づいて、前記コンテンツプロバイダシステムから、前記複数の代替ストリームのうちの前記第2のものからの前記ビデオコンテンツのセグメントを要求することと、
    前記要求に応答して、前記再生デバイスにおいて、前記コンテンツプロバイダシステムから、前記複数の代替ストリームのうちの前記第2のものの前記要求されたセグメントを受信することと、
    前記再生デバイスを使用して、前記受信されたセグメントを再生することと
    をさらに含む、請求項7に記載の方法。
  10. 前記ビューの決定は、前記再生デバイスの検出された移動に基づく、請求項7に記載の方法。
  11. 前記ビューの決定は、視点を決定するための別のデバイスから捕捉された前記再生デバイスの画像に基づく、請求項7に記載の方法。
  12. 前記ビューの決定は、前記ビデオコンテンツとともに受信されるメタデータに基づく、請求項7に記載の方法。
  13. 命令を記憶している非一過性機械読み取り可能な媒体であって、前記命令は、ビデオコンテンツを再生する方法を実施するように処理ユニットに指図し、前記方法は、
    コンテンツプロバイダシステムからビデオコンテンツを要求することと、
    コンテンツプロバイダシステムから、ビデオコンテンツの複数の代替ストリームを読み出すための情報を含むマニフェストを受信することであって、複数のストリームの各々は、前記ビデオコンテンツの複数のビューのうちの1つのためのビデオコンテンツのセグメントを含み、特定の最大ビットレートにおいてエンコードされている、ことと、
    前記再生デバイスとコンテンツプロバイダシステムとの間の通信のためのネットワーク帯域幅を決定することと、
    前記ビデオコンテンツの所望のビューを決定することと、
    前記決定されたネットワーク帯域幅、前記所望のビュー、および前記マニフェストにおける前記複数の代替ストリームのための情報に基づいて、ストリーミングのために使用すべき前記複数の代替ストリームのうちの1つを決定することと、
    前記コンテンツプロバイダシステムからの前記マニフェストにおける前記複数の代替ストリームのうちの前記1つのための情報に基づいて、前記複数の代替ストリームのうちの前記決定された1つからのビデオコンテンツのセグメントを要求することと、
    前記要求に応答して、前記コンテンツプロバイダシステムから前記複数の代替ストリームのうちの1つの前記要求されたセグメントを受信することと、
    前記受信されたセグメントを再生することと
    を含む、非一過性機械読み取り可能な媒体。
  14. 複数のカメラから捕捉されたビデオコンテンツから、ビデオコンテンツの複数の代替ストリームを生成するためのエンコーディングシステムであって、前記エンコーディングシステムは、
    プロセッサと、
    前記プロセッサによってアクセス可能なメモリと、
    前記メモリに記憶された命令と
    を備え、
    前記命令は、
    複数のカメラのうちの1つによって捕捉されたビデオを含むビデオコンテンツの少なくとも1つのストリームを取得することであって、前記複数のカメラの各々は、異なる視点を有する、ことと、
    前記少なくとも1つのストリームからのビデオコンテンツを複数のエンコーダに提供することであって、前記複数のエンコーダは、前記ビデオコンテンツ内からの複数の別個の視点の各々を複数の代替ストリームを備えている適合組にエンコードする、ことと、
    前記複数の別個の視点の各々に対応する前記適合組のためのインデックス情報を生成することと、
    前記生成された適合組の各々をメモリに記憶することと、
    マニフェストの中に各適合組のためのマニフェスト情報を記憶することと
    を行うように前記プロセッサに指図し、
    前記マニフェストは、適合組における前記複数のストリームの各々のための最大ビットレートと各適合組のための視点とを示す、エンコーディングシステム。
  15. 前記ビデオコンテンツの複数のストリームを取得するための前記命令は、
    前記複数のカメラによって捕捉されたビデオコンテンツのソースストリームを受信する命令と、
    前記ソースストリームを複数のストリームに分割する命令であって、前記複数のストリームの各々は、前記複数のカメラのうちの1つからのビデオコンテンツを含む、命令と
    を含み、
    前記複数のカメラからの前記ビデオコンテンツの複数のストリームは、前記エンコーダに提供される、請求項14に記載のエンコーディングシステム。
  16. 前記ビデオコンテンツの複数のストリームを取得するための前記命令は、
    前記複数のカメラによって捕捉されたビデオコンテンツのソースストリームを受信する命令と、
    前記ソースストリームの前記ビデオコンテンツから360度ビュービデオコンテンツを生成する命令と、
    前記360度ビュービデオコンテンツを複数のタイルに分割する命令と
    含み、
    前記複数のタイルの各々は、特定の視点からのビデオコンテンツのストリームであり、
    前記複数のタイルは、前記エンコーダに提供される、請求項14に記載のエンコーディングシステム。
  17. 前記複数のストリームを取得するための前記命令は、前記複数のカメラのうちの1つのための前記複数のストリームの各々を受信する命令を含み、前記受信された複数のストリームの各々は、前記複数のエンコーダに提供される、請求項14に記載のエンコーディングシステム。
  18. 前記プロセッサに指図する前記命令は、ビデオコンテンツの入力ストリームを受信し、複数の代替ストリームのためのビデオコンテンツを出力するエンコーダを提供する命令をさらに含み、前記複数の代替ストリームの各々は、異なる最大ビットレートでエンコードされ、前記エンコーダを提供する前記命令は、前記エンコーダを提供する前記命令から複数のエンコーダをインスタンス化することによって、前記複数のエンコーダにスケーラブルである、請求項14に記載のエンコーディングシステム。
  19. 前記複数のエンコーダに提供される前記ビデオコンテンツの複数のストリームは、前記ビデオコンテンツのためのタイミング情報を含み、前記複数のエンコーダによる複数の代替ストリームへの前記ビデオコンテンツのエンコーディングは、前記ビデオコンテンツの複数のストリームの中の前記タイミング情報に基づいて同期させられる、請求項14に記載のエンコーディングシステム。
  20. 複数のカメラから捕捉されたビデオコンテンツから、ビデオコンテンツの複数の代替ストリームを生成するためのエンコーディングシステムであって、前記システムは、
    複数のカメラのうちの1つによって捕捉されたビデオを含むビデオコンテンツの少なくとも1つのストリームを取得することであって、前記複数のカメラの各々は、異なる視点を有する、ことと、
    前記少なくとも1つのストリームからのビデオコンテンツを複数のエンコーダに提供することであって、前記複数のエンコーダは、前記ビデオコンテンツ内からの複数の別個の視点の各々を複数の代替ストリームを備えている適合組にエンコードする、ことと、
    前記複数の別個の視点の各々に対応する前記適合組のためのインデックス情報を生成することと、
    前記生成された適合組の各々をメモリに記憶することと、
    マニフェストの中に各適合組のためのマニフェスト情報を記憶することと
    を含み、
    前記マニフェストは、適合組における前記複数のストリームの各々のための最大ビットレートと各適合組のための視点とを示す、システム。
  21. 前記ビデオコンテンツの複数のストリームの前記取得は、
    前記エンコーディングシステムにおいて、前記複数のカメラによって捕捉されたビデオコンテンツのソースストリームを受信することと、
    前記エンコーディングシステムを使用して、前記ソースストリームを複数のストリームに分割することと
    を含み、
    前記複数のストリームの各々は、前記複数のカメラのうちの1つからのビデオコンテンツを含み、
    前記複数のカメラからの前記ビデオコンテンツの前記複数のストリームは、前記エンコーダに提供される、請求項20に記載の方法。
  22. 前記ビデオコンテンツの複数のストリームの前記取得は、
    前記エンコーディングシステムにおいて、前記複数のカメラの各々によって捕捉されたビデオコンテンツのソースストリームを受信することと、
    前記エンコーディングシステムを使用して、前記ソースストリームの前記ビデオコンテンツから360度ビュービデオコンテンツを生成することと、
    前記エンコーディングシステムを使用して、前記360度ビュービデオコンテンツを複数のタイルに分割することと
    含み、
    前記複数のタイルの各々は、特定のビューからのビデオコンテンツのストリームであり、
    前記複数のタイルは、前記エンコーダに提供される、請求項20に記載の方法。
  23. 前記複数のストリームの前記取得は、前記エンコーディングシステムにおいて、前記複数のカメラのうちの1つのための前記複数のストリームの各々を受信することを含み、前記受信された複数のストリームの各々は、前記複数のエンコーダに提供される、請求項20に記載の方法。
  24. 前記複数のエンコーダに提供される前記ビデオコンテンツの複数のストリームは、前記ビデオコンテンツのためのタイミング情報を含み、前記複数のエンコーダによる複数の代替ストリームへの前記ビデオコンテンツの前記エンコーディングは、前記ビデオコンテンツの複数のストリームの中の前記タイミング情報に基づいて同期させられる、請求項20に記載の方法。
JP2019531602A 2016-08-30 2017-08-30 360°ビューコンテンツをエンコードおよび再生するためのシステムおよび方法 Withdrawn JP2019532597A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662381485P 2016-08-30 2016-08-30
US62/381,485 2016-08-30
PCT/US2017/049483 WO2018045098A1 (en) 2016-08-30 2017-08-30 Systems and methods foe encoding and playing back 360 view video content

Publications (1)

Publication Number Publication Date
JP2019532597A true JP2019532597A (ja) 2019-11-07

Family

ID=61243866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019531602A Withdrawn JP2019532597A (ja) 2016-08-30 2017-08-30 360°ビューコンテンツをエンコードおよび再生するためのシステムおよび方法

Country Status (4)

Country Link
US (1) US20180063590A1 (ja)
EP (1) EP3507977A4 (ja)
JP (1) JP2019532597A (ja)
WO (1) WO2018045098A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10284888B2 (en) * 2017-06-03 2019-05-07 Apple Inc. Multiple live HLS streams
TW202415077A (zh) * 2017-09-08 2024-04-01 美商開放電視股份有限公司 用於內容呈現之位元率及管線保留技術
JP7035401B2 (ja) * 2017-09-15 2022-03-15 ソニーグループ株式会社 画像処理装置およびファイル生成装置
US10440367B1 (en) * 2018-06-04 2019-10-08 Fubotv Inc. Systems and methods for adaptively encoding video stream
EP3618442B1 (en) * 2018-08-27 2020-09-30 Axis AB An image capturing device, a method and computer program product for forming an encoded image
US10826964B2 (en) 2018-09-05 2020-11-03 At&T Intellectual Property I, L.P. Priority-based tile transmission system and method for panoramic video streaming
CN109511008B (zh) * 2018-11-27 2021-07-13 成都索贝数码科技股份有限公司 一种基于对象存储支持视音频文件内容追加的方法
US12020395B2 (en) * 2019-03-15 2024-06-25 STX Financing, LLC Systems and methods for compressing and decompressing a sequence of images
US10979477B1 (en) * 2019-03-26 2021-04-13 Amazon Technologies, Inc. Time synchronization between live video streaming and live metadata
CN111447503A (zh) * 2020-04-26 2020-07-24 烽火通信科技股份有限公司 一种多视点视频的视点切换方法、服务器和系统
CN114390324A (zh) * 2022-03-23 2022-04-22 阿里云计算有限公司 视频处理方法、系统以及云转播方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080040753A1 (en) * 2006-08-10 2008-02-14 Atul Mansukhlal Anandpura Video display device and method for video display from multiple angles each relevant to the real time position of a user
EP2869579B1 (en) * 2012-07-02 2017-04-26 Sony Corporation Transmission apparatus, transmission method, and network apparatus for multi-view video streaming using a meta file including cache priority or expiry time information of said video streams
US9143543B2 (en) * 2012-11-30 2015-09-22 Google Technology Holdings LLC Method and system for multi-streaming multimedia data
KR101879519B1 (ko) * 2013-07-29 2018-07-17 코닌클리즈케 케이피엔 엔.브이. 타일 비디오 스트림을 클라이언트에게 제공하는 방법
US9270721B2 (en) * 2013-10-08 2016-02-23 Qualcomm Incorporated Switching between adaptation sets during media streaming
US9402095B2 (en) * 2013-11-19 2016-07-26 Nokia Technologies Oy Method and apparatus for calibrating an audio playback system
US10015551B2 (en) * 2014-12-25 2018-07-03 Panasonic Intellectual Property Management Co., Ltd. Video delivery method for delivering videos captured from a plurality of viewpoints, video reception method, server, and terminal device
GB2534136A (en) * 2015-01-12 2016-07-20 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
EP3259739A4 (en) * 2015-02-17 2018-08-29 NEXTVR Inc. Methods and apparatus for generating and using reduced resolution images and/or communicating such images to a playback or content distribution device
US10269155B1 (en) * 2015-06-29 2019-04-23 Amazon Technologies, Inc. Image artifact masking

Also Published As

Publication number Publication date
WO2018045098A1 (en) 2018-03-08
US20180063590A1 (en) 2018-03-01
EP3507977A4 (en) 2020-06-24
EP3507977A1 (en) 2019-07-10

Similar Documents

Publication Publication Date Title
KR102190364B1 (ko) 비디오 콘텐트를 인코딩하기 위한 시스템 및 방법
US11470405B2 (en) Network video streaming with trick play based on separate trick play files
US20180063590A1 (en) Systems and Methods for Encoding and Playing Back 360° View Video Content
US9247317B2 (en) Content streaming with client device trick play index
US9860612B2 (en) Manifest generation and segment packetization
US10218981B2 (en) Clip generation based on multiple encodings of a media stream
US20140359678A1 (en) Device video streaming with trick play based on separate trick play files
US20140297804A1 (en) Control of multimedia content streaming through client-server interactions
US20130013803A1 (en) Method for recovering content streamed into chunk
JP2019522919A (ja) トリックプレイモードにおいて可変速度を提供するためのシステムおよび方法
JP7001673B2 (ja) 再生のクイックスタートアップのためのシステムおよび方法
JP2019517219A (ja) トリックプレイ再生の間にオーディオコンテンツを提供するためのシステムおよび方法
WO2014193996A2 (en) Network video streaming with trick play based on separate trick play files
KR101568317B1 (ko) Ip 카메라에서 hls 프로토콜을 지원하는 시스템 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200326

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20200508