JP2012523781A - ビデオファイルを処理するシステム及び方法 - Google Patents

ビデオファイルを処理するシステム及び方法 Download PDF

Info

Publication number
JP2012523781A
JP2012523781A JP2012505036A JP2012505036A JP2012523781A JP 2012523781 A JP2012523781 A JP 2012523781A JP 2012505036 A JP2012505036 A JP 2012505036A JP 2012505036 A JP2012505036 A JP 2012505036A JP 2012523781 A JP2012523781 A JP 2012523781A
Authority
JP
Japan
Prior art keywords
bitstream
video
view
independently encoded
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012505036A
Other languages
English (en)
Other versions
JP5289618B2 (ja
Inventor
ワン、イェ−クイ
Original Assignee
ファーウェイ テクノロジーズ カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファーウェイ テクノロジーズ カンパニー リミテッド filed Critical ファーウェイ テクノロジーズ カンパニー リミテッド
Publication of JP2012523781A publication Critical patent/JP2012523781A/ja
Application granted granted Critical
Publication of JP5289618B2 publication Critical patent/JP5289618B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一実施形態によれば、ビデオサーバを動作させる方法は、第1のビデオビットストリームを受信し、第1のビットストリームをメモリ内に記憶し、第1のビデオビットストリームから、第2のビデオビットストリームを生成し、第2のビデオビットストリームをメモリ内に記憶することを含む。第1のビデオビットストリームは、複数の独立して符号化されたビューを有し、第2のビデオビットストリームは、複数の独立して符号化されたビューのうちの1つを有する。

Description

本特許出願は、2009年4月14日に出願された、「Storage of Transcoded Subsets of Scalable or Multi−View Video Contents(スケーラブル又はマルチビュービデオコンテンツのトランスコードされたサブセットの記憶)」と題された、米国仮特許出願第61/169,247号、及び、2010年4月6日に出願された、「System and Method for Processing Video Files(ビデオファイルを処理するシステム及び方法)」と題された、米国非仮特許出願第12/754896号の優先権を主張するものであり、当該出願はその全体が参照により本明細書中に援用される。
本発明は、一般に、コンピュータシステムに関し、特に、ビデオファイルを処理するシステム及び方法に関する。
インターネットがより高速に、かつ、より偏在するようになるにつれて、コンピュータネットワークを介したビデオ信号の伝送は、ますます普及している。その結果、より多くのビデオコンテンツプロバイダが、従来の小売店でデジタルビデオディスクを販売及び賃貸しするよりも、オンラインでビデオを配信することを選択している。しかし、電子的に配信されるビデオの画質及び解像度が向上するにつれて、コンピュータビデオ配信ネットワークによって必要とされる処理量は、対応して増加している。
ビデオ処理の量を増加させる1つの要因は、マルチビュービデオコンテンツである。例えば、マルチビュービデオビットストリームは、1つが右目用に指定され、1つが左目用に指定された、2つのビュー(視点)を含む場合がある。マルチビュービデオ技術は、複数の(3つ以上の)ビューを有することが役に立つ状況(例えば、スポーツイベント、又はライブプレイ)においても使用される。そのようなマルチビュービデオコンテンツは、例えば、H.264/AVC仕様のアネックスHにおいて規定された、H.264/AVCのマルチビュー拡張である、マルチビュービデオコーディング(MVC)などの、マルチビュー符号化標準を使用して、複数のビューを同じビデオビットストリーム内に符号化することによって実施される。ビデオ処理の量を増加させるもう1つの要因は、様々な品質、フレームレート、及び/又は空間解像度(標準解像度(SD)及び高解像度(HD)の両方)のビデオ信号を同じビデオビットストリーム内で表すことが可能な、スケーラブルビデオコンテンツである。
マルチビュー及び/又はスケーラブルビデオコンテンツを有することの結果の1つは、そのようなコンテンツの送信及び受信が、帯域幅及び処理を非常に多く消費するものとなり得るということである。更に、そのようなビデオコンテンツを受信する全てのクライアントが、送信されたビデオ信号のコンテンツの全てを必要とするとは限らない。例えば、シングル標準解像度モニタ(single standard resolution monitor)を有するユーザは、HD又は3次元ビデオ信号によって提供される特徴の全てを必要とするわけではない。
必要とされているのは、より効率的にビデオコンテンツをクライアントに配信するシステム及び方法である。
一実施形態によれば、方法は、第1の形式の第1のビットストリームと、第2の形式の第2のビットストリームとを含むビデオファイルを記憶することを含む。第1のビットストリームは、複数の独立して符号化されたビデオコンポーネントを含み、第2のビットストリームは、複数の独立して符号化されたビデオコンポーネントのうちの1つを含む。この方法は、複数の独立して符号化されたビデオコンポーネントのうちの1つを選択し、第2のビットストリームを記憶するトラックを識別することを更に含む。
一実施形態によれば、ビデオサーバを動作させる方法は、第1のビデオビットストリームを受信し、第1のビットストリームをメモリ内に記憶し、第1のビデオビットストリームから、第2のビデオビットストリームを生成し、第2のビデオビットストリームをメモリ内に記憶することを含む。第1のビデオビットストリームは、複数の独立して符号化されたビューを有し、第2のビデオビットストリームは、複数の独立して符号化されたビューのうちの1つを有する。
別の実施形態によれば、ビデオサーバは、メモリと、プロセッサとを有する。プロセッサは、第1の独立して符号化されたビューと、第2の独立して符号化されたビューとを有する、第1のビデオビットストリームを受信し、第1のビデオビットストリームから、第2の独立して符号化されたビューを有する第2のビデオビットストリームを生成するように構成される。プロセッサは、第1及び第2のビデオビットストリームをメモリ内に記憶する。
以下の本発明の詳細な説明がより良く理解されることが可能なように、上記では、本発明の実施形態の特徴について幾分おおまかに概説した。本発明の特許請求の範囲の主題を形成する、本発明の実施形態の追加の特徴及び利点は、以下に記載される。開示される概念及び特定の実施形態は、本発明と同じ目的を達成するために、他の構成又はプロセスを修正又は設計するための基礎として、容易に利用されることが可能であるということを、当業者は理解されたい。そのような均等な構成は、添付の特許請求の範囲に記載される、本発明の精神及び範囲から逸脱するものではないということも、当業者は理解されたい。
本発明、及びその利点のより完全な理解のために、以下の説明を、添付の図面と組み合わせて参照する。
特に指定しない限り、異なる図中の対応する数字及び記号は、一般に、対応する部分を表す。図は、実施形態の関連する側面を明確に示すように描かれており、必ずしも一定の縮尺で描かれてはいない。
ビデオサーバシステムの実施形態を示す図である。 メモリ割り当ての実施形態を示す図である。
様々な実施形態の作製及び使用について、以下に詳細に説明する。しかし、本発明は、様々な特定の状況において実施することが可能な、多くの適用可能な発明概念を提供するということを理解されたい。説明する特定の実施形態は、本発明を作製及び使用する特定の方法を例示するものにすぎず、本発明の範囲を限定するものではない。
本発明は、特定の状況における実施形態(例えば、ビデオファイルを処理するシステム及び方法)に関して記載される。本発明の実施形態は、他のタイプのデータ通信を目的とするシステム及び方法に適用されてもよい。
図1は、ビデオ配信システム100の実施形態を示す。クライアント104は、接続106を介して、サーバ102に結合される。図示を容易にするために、1つのクライアント104のみが示されているが、実施形態においては、2つ以上のクライアントが、サーバ102に接続されてもよい。サーバ102は、プロセッサ112と、ネットワークインタフェース116と、メモリ114とを有する。いくつかの実施形態では、サーバ102は、接続108を介して、更なるネットワーク(例えば、インターネット110)に結合される。いくつかのその他の実施形態では、インターネット110及び接続108は、接続106の一部である。実施形態において、サーバ102は、メモリ114内に、ビデオコンテンツ、又はその部分を記憶する。メモリ114は、一実施形態では、ディスクドライブアレイにより構成されるが、メモリ114は、その他の形態の記憶装置(例えば、DRAM及びSRAMなどの半導体メモリ、他の種類の磁気記憶装置、又は他の形態のメモリ記憶装置)を包含してもよい。サーバ102は、例えば、ワイドエリア又はメトロポリタンネットワーク内の、サービスプロバイダによって運営される遠隔に位置するサーバ、ローカルエリアネットワークサーバ、又は別のタイプのサーバであってもよい。接続106及び108は、有線、無線、DSL、及び/又は、その他のタイプの接続であってもよい。更に、接続106及び108は、TCP−IP、UDP−IP、又はその他の種類のプロトコルに従って動作させられてもよい。
図2は、サーバ102のメモリ114(図1)の割り当ての実施形態を示す。本発明の一実施形態では、第1のビデオビットストリーム120と、第2のビデオビットストリーム112とが、メモリ114内に記憶される。一実施形態では、第1のビデオビットストリーム120は、1つ以上の独立して符号化されたビューを有し、第2のビデオビットストリーム122は、1つの独立して符号化されたビューを有する。
一実施形態では、第1のビットストリーム120は、少なくとも2つのビデオコンポーネントを有する。第1のビデオコンポーネントは、「Aビュー」と呼ばれる。実施形態において、この「Aビュー」は、第1のビットストリーム120内の、独立して符号化されたビューである。第1のビットストリーム122は、少なくとも1つの更なるビデオコンポーネントも有し、そのうちの第1のものは、「Bビュー」と呼ばれる。いくつかの場合、「Bビュー」は、「Aビュー」から独立して符号化されていない(例えば、「Bビュー」が「Aビュー」と密接に相関する、3−Dビデオなどの場合)。そのような場合、「Bビュー」情報は、「Bビュー」全体を符号化するのではなく、「Aビュー」からの符号化された差から形成されてもよい。いくつかの実施形態では、しかし、「Bビュー」は、独立して符号化される(例えば、第1のビットストリーム120が、演劇、パフォーマンス、又はスポーツイベントの複数のビューを運ぶ場合)。例えば、「Aビュー」は、レース場の鳥瞰ビュー(bird’s eye view)を表してもよく、「Bビュー」は、自動車レースの車内ビュー(in−car view)を表してもよい。更なる実施形態では、第1のビットストリーム120は、3つ以上のビュー(例えば、「Cビュー」「Dビュー」など)を更に含む。これらの追加のビューは、「Aビュー」に従属していてもよく、又は、「Aビュー」から独立していてもよい。
一実施形態では、「Aビュー」と、少なくとも1つの更なるビュー(例えば、「Bビュー」)とは、独立して符号化されたビューである。説明を簡単にするために、「Bビュー」は、独立して符号化されたと仮定する。「Bビュー」以外のその他のビューが独立して符号化されてもよい。従って、「Bビュー」について言及する場合、その他のビューが同様に考慮されてもよい、ということを理解されたい。例えば、一実施形態では、「Bビュー」は従属ビュー(dependent view)であり、「Cビュー」は独立ビュー(independent view)である。
一実施形態では、サーバ102は、少なくとも2つの独立ビューを有する第1のビットストリームを取得し、1つのビューを含む第2のビットストリーム122を作成する。一実施形態では、第2のビットストリーム内に符号化されるビューは、「Aビュー」以外の、独立して符号化されたビューである。更なる実施形態では、第2のビットストリームは、「Aビュー」を、あるいは、任意の独立して、又は従属して符号化されたビューを含んでもよい。
一実施形態では、サーバは、接続108から、第1のビットストリーム120を受信し、しかし、第1のビットストリームは、ユーザによって、ローカルに記憶するために、メモリ又はハードディスク又はその他の装置内に書き込まれてもよい(例えば、ユーザが、ネットワークなしで、DVDビデオを直接コピーする場合)。第2のビットストリーム122は、クライアント104による後の取り出しのために、サーバ102が第1のビットストリーム120を受信したすぐ後に生成されて書き込まれる。あるいは、第2のビットストリーム122は、例えば、クライアント104又はその他のクライアントによる代替要求(request for an alternate)に応えて、後で生成されてもよい。
一実施形態では、プロセッサ112は、圧縮されたスケーラブル又はマルチビュービデオコンテンツのサブセットをトランスコードする(トランスコードされたレイヤ又はビューのトラックから、元のレイヤ又はビューのトラックへのマッピングを行うことを含む)。一実施形態では、サーバ102は、元のビットストリームのサブセットに対応する、標準適合のスケーラブル又はマルチビュービットストリームを提供するために、トランスコード機能を実施しない(ここで、サブセットは、ベースレイヤ又はベースビューに従属しない)。むしろ、サーバ102は、いくつかの実施形態において、1つのビットストリームを有する第2のビットストリーム122を作成する。
いくつかの実施形態では、マルチビュー及びシングルビュービットストリームは、H.264/AVC標準(ITU−T勧告H.264、及びISO/IEC国際標準(IS)14496−10としても知られる)に従って形式化される。この標準は、ISO/IECモーション・ピクチャ・エキスパーツ・グループ(MPEG)とITU−Tビデオ・コーディング・エキスパーツ・グループ(VCEG)との共同ビデオチーム(JVT)によって開発された。スケーラブルビデオコーディング(SVC)は、H.264/AVC仕様のアネックスGで規定された、H.264/AVCのスケーラブル拡張であり、マルチビュービデオコーディング(MVC)は、H.264/AVC仕様のアネックスHで規定された、H.264/AVCのマルチビュー拡張である。代替の実施形態では、ISO/IEC IS 13818−2などの、その他の標準が使用されてもよい。
SVCベースの実施形態では、ビットストリームの一部が抽出、復号化され、より低い空間解像度、より低い品質、又はより低いフレームレートを使用して提示される。SVCビットストリームは、1つのベースレイヤと、複数のエンハンスメントレイヤとを有する。ベースレイヤビットストリームサブセットは、H.264/AVC仕様のアネックスAで以前に規定された非スケーラブルプロファイルのうちの1つ以上と後方互換性がある。いくつかの実施形態では、エンハンスメントレイヤは、符号化効率の向上のための、レイヤ間予測のために、より低いレイヤを使用する。簡単にするために、本開示では、エンハンスメントレイヤを、非ベースレイヤとも呼ぶ。
他方、MVCビットストリームの実施形態は、例えば複数のカメラによって捕捉された、1つ以上の符号化されたビューを有する。代替の実施形態では、これらの符号化されたビューは、様々なソースからの様々なビデオコンテンツを有してもよい。ビットストリーム全体によって表されるビューのサブセットを表すために、ビットストリームの一部が抽出、及び復号化される。MVCビットストリーム内のビューのうちの1つは、ベースビューであり、このビットストリームサブセットは、H.264/AVC仕様のアネックスAで以前に規定された非スケーラブルプロファイルのうちの1つ以上と後方互換性がある。その他のビューは、非ベースビューと呼ばれる。いくつかの実施形態において、非ベースビューは、符号化効率の向上のために、別のビューを使用してもよい。
簡単にするために、H.264/AVC仕様のアネックスAで規定されたプロファイルに準拠する、又は適合する、又はそのプロファイルと互換の、又はそのプロファイルを有するビットストリーム又は復号器は、H.264/AVCに準拠する、又は適合する、又はH.264/AVCと互換である、又はH.264/AVCを有すると呼ばれ、H.264/AVC仕様のアネックスGで規定されたプロファイルに準拠する、又は適合する、又はそのプロファイルと互換の、又はそのプロファイルを有するビットストリーム又は復号器は、SVCに準拠する、又は適合する、又はSVCと互換である、又はSVCを有すると呼ばれ、H.264/AVC仕様のアネックスHで規定されたプロファイルに準拠する、又は適合する、又はそのプロファイルと互換の、又はそのプロファイルを有するビットストリーム又は復号器は、MVCに準拠する、又は適合する、又はMVCと互換である、又はMVCを有すると呼ばれる。
SVC又はMVCの実施の実施形態では、非ベースレイヤ又はビューは、他のレイヤ又はビューに従属しても、しなくてもよい。他のビューに従属しない非ベースレイヤ又はビューの一例は、全てのレイヤ又はビューが相互に独立している場合である。別の例は、非ベースレイヤ又はビューのサブセットが、他の全てのレイヤ又はビューから独立しており、サブセット内では従属性が存在する場合である。そのような場合、他のいずれのレイヤ又はビューにも従属しない、少なくとも1つのレイヤ又はビューが、サブセット内に存在する。
一実施形態では、受信器が、非ベースレイヤ又はビューの、1つの独立して符号化されたサブセットを再生するための要求を発行する。独立したサブセット内の、非ベースレイヤ又はビューの数が1である場合、受信器は、H.264/AVCに準拠する、あるいはSVC又はMVCに準拠する復号器を使用することが可能である。両方の場合に、要求された非ベースレイヤ又はビューのための、抽出されたビットストリームサブセットは、H.264/AVCに準拠するようにトランスコードされる。後者の場合(すなわち、受信器が、SVC又はMVCに準拠する復号器を有する場合)に、非ベースビュー又はレイヤが、やはりH.264/AVCに準拠するようにトランスコードされる理由の1つは、SVC又はMVCにおいて、適合するビットストリームが、H.264/AVCに準拠するベースレイヤ又はビューを含むことが必要とされる場合があるからである。従って、非ベースレイヤ又はビューの、独立したサブセットが抽出される場合、サブセット内の独立した非ベースレイヤ又はビューは、H.264/AVCに準拠するようにトランスコードされる。独立したサブセット内の、非ベースレイヤ又はビューの数が2以上である場合、受信器は、SVC又はMVCに準拠する復号器を使用する。従って、レイヤ又はビューのサブセットを有するビットストリームを生成するために、サブセット内の独立した非ベースレイヤ又はビューが、H.264/AVCに準拠するようにトランスコードされる。
一実施形態では、独立した非ベースレイヤをH.264/AVC準拠にトランスコードすることは、H.264/AVC仕様のサブクローズG.13.2.1(シンタクス要素conversion_type_idc[i]が2に等しい場合の、conversion_type_idc[i]のセマンティクス)に記載されている。
一実施形態では、非ベースビューの独立したサブセット内の、独立した非ベースビューを、H.264/AVC準拠表現にトランスコードする方法は、H.264/AVC仕様のサブクローズH8.5.5に記載されている方法に従って達成される。
一実施形態では、非ベースレイヤ又はビューの、1つの独立して符号化されたサブセットに対する、受信器の要求に応えて、ビデオサーバが、(例えば、上記の例で指定された通りに)トランスコードを実行し、トランスコードされたビットストリームを、受信器に送信する。しかし、複雑さとコストを減少させるために、一部のサーバは、そのようなトランスコード機能を装備していなくてもよい。そのような適用シナリオを可能にするために、いくつかの実施形態では、一メカニズムが、トランスコードされたビットストリームをメディアファイル内に記憶し、これにより、サーバは、ファイル内の所望のトラックを直接選択して、そのエレメンタリストリームを受信器に送信する。
マルチメディアコンテンツの記憶のために広く使用されている、ISOベースのメディアファイルの形式は、ISO/IEC IS 14496−12で規定されている。MPEG−4ファイル形式(ISO/IEC IS 14496−14)、H.264/AVCファイル形式(ISO/IEC IS 14496−15)、SVCファイル形式(ISO/IEC IS 14496−15アメンドメント2)、及びMVCファイル形式(ISO/IEC IS 14496−15アメンドメント3)を含む、ファイル形式の標準又はドラフト標準のファミリは、いくつかの実施形態では、ISOベースのメディアファイル形式に基づいて導き出される。
一実施形態では、MPEG出力文書W10445(第87回MPEG会議、ローザンヌ、スイス、2009年2月)におけるドラフトMVCファイル形式に基づいた方法が使用され、当該文書は参照により本明細書中に援用される。この実施形態では、VirtualBaseViewTracks(仮想ベースビュートラック)ボックスと命名された、新たなボックスが規定される。VirtualBaseViewTracksボックスは、ファイル内に記憶されたマルチビューストリームのベースビューを含むトラックのMedia Information(メディア情報)ボックス内に含まれる、Multi−view Information(マルチビュー情報)ボックス内に含まれる。
新たなボックスは、以下のように規定される。Box Type(ボックスタイプ)は、「vbvt」に設定される。Multi−view Informationボックス(「mvci」)は新たなボックスを収容する。いくつかの実施形態では、新たなボックスは、省略可能である。新たなボックスは、独立して符号化された非ベースビューについての、仮想ベースビューを記憶するトラックの情報を提供する。一実施形態では、任意の独立して符号化された非ベースビューについて、仮想ベースビューは、ビューのH.264/AVC互換表現であり、H.264/AVC仕様のサブクローズH.8.5.5で規定されたプロセスによって作成することが可能である。独立して符号化された非ベースビューのデータ単位を含むサンプルと、仮想ベースビューのサンプルとは、復号化時間までにアライメントされる。
以下のシンタクスは、新たなボックスの形式と、どのような情報を新たなボックスVirtualBaseViewTracksが含むかとを規定する。
Figure 2012523781
上記のシンタクスの実施形態において、シンタクス要素のセマンティクスは、以下の通りである。
num_entriesは、トラック又はティア(それについて、仮想ベースビューを含むトラックが識別される)の数である。
entry_typeは、どのタイプのトラック又はティアが続くかを示す。entry_typeの以下の値が指定される。
0−トラック全体。この場合、track_idによって識別されるトラックは、独立して符号化された非ベースビューのみを含む。
1−トラック内のティア。この場合、track_id及びtier_idによって識別されるティアは、独立して符号化された非ベースビューのみを含む。
track_idは、トラックを示す。
tier_idは、トラック内のティアを示す。
vbv_track_idは、track_id(entry_typeが0に等しい場合)によって、又は、track_id及びtier_id(entry_typeが1に等しい場合)によって識別されるビューについての、仮想ベースビューを含む、トラックを示す。
一実施形態では、VirtualBaseViewTracksボックスは、それぞれの独立して符号化された非ベースビュー(又はその一時的サブセット)について、H.264/AVC準拠の、かつ、例えばH.264/AVC仕様のサブクローズH.8.5.5で規定されたプロセスに従って作成された、仮想ベースビュー(又はその一時的サブセット)を含むトラックのトラック識別子を提供する。非ベースビューのサブセットが抽出及び復号化される場合、ビューのサブセットのうち最も小さなビュー順序インデックスを有するビューが、独立に符号化された非ベースビューである(そうでなければ、より多くのビューが抽出される必要がある)。この場合、最も小さなビュー順序インデックスを有するビューについては、対応する仮想ベースビュートラックからデータ単位が取得される。その他のビューについてのデータ単位は、元のトラック(1つ又は複数)から、通常通り取得される。抽出及び復号化される非ベースビューのサブセット内のビューの数が1である場合(すなわち、1つのみの独立して符号化された非ベースビューが抽出及び復号化される場合)、仮想ビューは直接取得される。
本発明の別の実施形態では、MPEG出力文書W10445(第87回MPEG会議、ローザンヌ、スイス、2009年2月)におけるドラフトMVCファイル形式に基づいた別の方法が使用される。この方法では、新たなボックスを規定する代わりに、新たなトラック参照タイプ「vbvt」が規定される。実施形態において、仮想ベースビューを含む任意のトラックは、対応する独立して符号化された非ベースビューを含むソーストラックを参照する、タイプ「vbvt」のトラック参照(track reference)を含む。この新たなトラック参照タイプを使用して、サーバは、独立して符号化された非ベースビューの、仮想ベースビューを含むファイルトラックを識別し、独立して符号化された非ベースビューがクライアントによって要求された場合、サーバは、識別されたトラック内に含まれるメディアデータを、クライアントに送信する。
更なる実施形態では、新たなボックス又は新たなトラック参照タイプが、スケーラブルビデオコンテンツに適用するために使用される。そのような新たなボックス又は新たなトラック参照タイプは、非ベースレイヤがクライアントによって要求された場合、マルチビュービデオコンテンツについての上記と同様の機能を、ここでは、スケーラブルビデオコンテンツのために提供する。
一実施形態では、方法は、第1の形式の第1のビットストリームと、第2の形式の第2のビットストリームとを含むビデオファイルを記憶することを含む。第1のビットストリームは、複数の独立して符号化されたビデオコンポーネントを含み、第2のビットストリームは、複数の独立して符号化されたビデオコンポーネントのうちの1つを含む。この方法は、複数の独立して符号化されたビデオコンポーネントのうちの1つを選択し、第2のビットストリームを記憶するトラックを識別することを更に含む。いくつかの実施形態では、この方法は、第2のビットストリームをクライアントに送信することを更に含む。更なる実施形態では、複数の独立して符号化されたビデオコンポーネントのそれぞれは、独立して符号化されたビュー、及び/又は、独立して符号化されたレイヤを含む。
一実施形態では、第1の形式は、H.264/AVCビデオ符号化標準のアネックスHで規定されたプロファイルに従う、マルチビュービデオコーディング(MVC)形式であり、第2の形式は、H.264/AVCビデオ符号化標準のアネックスAで規定されたプロファイルに従う、アドバンストビデオコーディング(AVC)形式である。別の実施形態では、第1の形式は、H.264/AVCビデオ符号化標準のアネックスGで規定されたプロファイルに従う、スケーラブルビデオコーディング(SVC)形式であり、第2の形式は、H.264/AVCビデオ符号化標準のアネックスAで規定されたプロファイルに従う、アドバンストビデオコーディング(AVC)形式を含む。いくつかの実施形態では、ビデオファイルは、マルチビュービデオコーディング(MVC)ファイル形式に従って、又は、スケーラブルビデオコーディング(SVC)ファイル形式に従って記憶される。更なる実施形態では、その他の形式が使用されてもよい。
実施形態によれば、第2のビットストリームを記憶するトラックを識別することは、ビデオファイルからの情報を使用することを含み、ここで、ビデオファイルからの情報は、第2のビットストリームを記憶するトラックを示す。いくつかの実施形態では、第2のビットストリームを記憶するトラックを示す、ビデオファイルからの情報は、第2のビットストリームを記憶するトラックの情報を含むボックス、及び/又は、第2のビットストリームを記憶するトラックの情報を示すトラック参照を含む。
一実施形態では、ビデオサーバを動作させる方法は、第1のビデオビットストリームを受信することを含み、ここで、第1のビデオビットストリームは、複数の独立して符号化されたビューを含む。この方法は、第1のビットストリームをメモリ内に記憶し、第1のビデオビットストリームから、第2のビデオビットストリームを生成し、第2のビデオビットストリームをメモリ内に記憶することを更に含む。第2のビデオビットストリームは、複数の独立して符号化されたビューのうちの1つを含む。一実施形態では、この方法は、第2のビットストリームをクライアントに送信することを更に含む。更なる実施形態では、この方法は、複数のビットストリームのうちの1つに対する要求を、クライアントから受信することを更に含み、ここで、送信することは、要求を受信することに応えて実行される。いくつかの実施形態は、第1のビデオビットストリームから、第3のビデオビットストリームを生成し(ここで、第3のビデオビットストリームは、複数の独立して符号化されたビューのうちの別の1つを含み)、第3のビデオビットストリームをメモリ内に記憶することを含む。いくつかの実施形態では、第2のビデオビットストリームは、第1のビットストリームと同じファイル内に記憶される。
いくつかの実施形態では、第2のビットストリームは、第1のビットストリームとは異なる形式で符号化される。一例において、第1のビットストリームは、マルチビュービデオコーディング(MVC)形式で符号化され、第2のビットストリームは、スケーラブルビデオコーディング(SVC)形式で符号化される。いくつかの実施形態では、複数の独立して符号化されたビューは、Aビューと、少なくとも1つの更なる独立して符号化されたビューとを含み、第2のビットストリーム内の、複数の独立して符号化されたビューのうちの1つは、少なくとも1つの更なる独立して符号化されたビューを含む。
一実施形態では、ビデオサーバは、メモリと、プロセッサとを含み、ここで、プロセッサは、第1の独立して符号化されたビューと、第2の独立して符号化されたビューとを有する、第1のビデオビットストリームを受信するように構成される。プロセッサは、第1のビットストリームをメモリ内に記憶し、第1のビデオビットストリームから、第2のビデオビットストリームを生成し、第2のビデオビットストリームをメモリ内に記憶するように更に構成される。第2のビデオビットストリームは、第2の独立して符号化されたビューを含む。いくつかの実施形態では、ビデオサーバは、第2のビットストリームを送信するように構成される。更なる実施形態では、ビデオサーバは、第2のビデオストリームに対する要求に応えて、第2のビットストリームをクライアントに送信するように構成される。
一実施形態では、第2のビットストリームは、第1のビットストリームとは異なる形式で符号化される。一例において、第1のビットストリームは、マルチビュービデオコーディング(MVC)形式で符号化され、第2のビットストリームは、スケーラブルビデオコーディング(SVC)形式で符号化される。更なる実施形態では、第1の独立して符号化されたビューは、Aビューを含み、第2の独立して符号化されたビューは、Bビューを含む。
一実施形態では、ビデオデータを配信する方法は、第1のビデオビットストリームを提供することを含み、ここで、第1のビデオビットストリームは、第1の独立して符号化されたビューと、第2の独立して符号化されたビューとを含む。この方法は、第1のビデオビットストリームから、第2のビデオビットストリームを生成し、第2のビデオビットストリームをメモリ内に記憶することを更に含み、ここで、第2のビデオビットストリームは、第2の独立して符号化されたビューを含む。実施形態において、この方法は、第2のビットストリームをクライアントに送信することを更に含む。いくつかの実施形態では、第2のビットストリームをクライアントに送信することは、第2の独立して符号化されたビューに対する、クライアントからの要求に応えて実行される。
いくつかの実施形態では、生成することは、プロセッサによって実行される。更なる実施形態では、第1のビデオビットストリームを提供することは、第1のビデオビットストリームを、コンピュータネットワークから受信することを含む。ビデオサーバのいくつかの実施形態では、第1のビットストリームは、マルチビュービデオコーディング(MVC)形式で符号化され、第2のビットストリームは、スケーラブルビデオコーディング(SVC)形式で符号化される。
いくつかの実施形態では、アルゴリズムの実施形態は、プロセッサ上で実行されるコンピュータプログラム又はソフトウェアを使用して実施されてもよい。
マルチビュービットストリームからシングルビュービットストリームを作成する実施形態の利点は、副次的ビューが要求されるたびにトランスコード動作を実行する必要なしに、副次的ビューをクライアントに提供する能力である。
実施形態の更なる利点は、副次的ビューを要求しているクライアントノードが、マルチビュー復号化アルゴリズムをサポート又は実行する必要がなく、かつ、マルチビュー復号化に処理リソースを割り当てる必要がないということである。これにより、スマートフォン及びノートブックなどの、低パワーかつ/又は低性能のクライアントが、マルチビュービットストリームからビューを抽出するために処理リソースを費やす必要なしに、フルフィーチャーのビデオコンテンツにアクセスすることが可能となる。
本発明の実施形態は、
ビデオファイルを記憶するために使用される、記憶ユニットと(ビデオファイルは、第1の形式の第1のビットストリームと、第2の形式の第2のビットストリームとを含み、第1のビットストリームは、複数の独立して符号化されたビデオコンポーネントを含み、第2のビットストリームは、複数の独立して符号化されたビデオコンポーネントのうちの1つを含み)、
複数の独立して符号化されたビデオコンポーネントのうちの1つを選択するために使用される、選択ユニットと、
第2のビットストリームを記憶するトラックを識別するために使用される、識別ユニットとを含む、ビデオファイル処理装置を更に提供する。
ビデオファイル処理装置は、第2のビットストリームをクライアントに送信するために使用される、送信ユニットを更に含んでもよい。
ビデオファイル処理装置の識別ユニットは、ビデオファイルからの情報を使用してもよく、ここで、ビデオファイルからの情報は、第2のビットストリームを記憶するトラックを示す。
本発明の実施形態は、
第1のビデオビットストリームを受信するために使用される、受信ユニットと(第1のビデオビットストリームは、複数の独立して符号化されたビューを含み)、
第1のビデオビットストリームから、第2のビデオビットストリームを生成するために使用される、生成ユニットと(第2のビデオビットストリームは、複数の独立して符号化されたビューのうちの1つを含み)、
第1のビットストリームと、第2のビデオビットストリームとを記憶するために使用される、記憶ユニットとを含む、ビデオサーバも更に提供する。
ビデオサーバは、第2のビットストリームをクライアントに送信するために使用される、送信ユニットを更に含んでもよい。
別の態様において、ビデオサーバは、
第1のビデオビットストリームから、第3のビデオビットストリームを生成するために更に使用される、生成ユニットと(第3のビデオビットストリームは、複数の独立して符号化されたビューのうちの別の1つを含み)、
第3のビデオビットストリームをメモリ内に記憶するために更に使用される、記憶ユニットとを更に含んでもよい。
本実施形態及びその利点について詳細に説明してきたが、添付の特許請求の範囲によって規定される本発明の精神及び範囲から逸脱することなく、様々な変更、置換、及び改変が本明細書で行われてもよいということを理解されたい。例えば、上述の特徴及び機能のうちの多くは、ソフトウェア、ハードウェア、ファームウェア、又はそれらの組み合わせで実施されてもよい。
更に、本出願の範囲は、本明細書に記載された、プロセス、機械、製造物、組成物、手段、方法、及びステップの特定の実施形態に限定されることを意図するものではない。当業者が、本発明の開示から容易に理解するであろうように、本明細書に記載された対応する実施形態と実質的に同じ機能を実行する、又は実質的に同じ結果を達成する、現在存在している、又は後に開発される、プロセス、機械、製造物、組成物、手段、方法、又はステップは、本発明に従って利用されてもよい。従って、添付の特許請求の範囲は、その範囲内に、そのようなプロセス、機械、製造物、組成物、手段、方法、又はステップを含むことを意図するものである。
本発明は、一般に、コンピュータシステムに関し、特に、ビデオファイルを処理するシステム及び方法に関する。
インターネットがより高速に、かつ、より偏在するようになるにつれて、コンピュータネットワークを介したビデオ信号の伝送は、ますます普及している。その結果、より多くのビデオコンテンツプロバイダが、従来の小売店でデジタルビデオディスクを販売及び賃貸しするよりも、オンラインでビデオを配信することを選択している。しかし、電子的に配信されるビデオの画質及び解像度が向上するにつれて、コンピュータビデオ配信ネットワークによって必要とされる処理量は、対応して増加している。
ビデオ処理の量を増加させる1つの要因は、マルチビュービデオコンテンツである。例えば、マルチビュービデオビットストリームは、1つが右目用に指定され、1つが左目用に指定された、2つのビュー(視点)を含む場合がある。マルチビュービデオ技術は、複数の(3つ以上の)ビューを有することが役に立つ状況(例えば、スポーツイベント、又はライブプレイ)においても使用される。そのようなマルチビュービデオコンテンツは、例えば、H.264/AVC仕様のアネックスHにおいて規定された、H.264/AVCのマルチビュー拡張である、マルチビュービデオコーディング(MVC)などの、マルチビュー符号化標準を使用して、複数のビューを同じビデオビットストリーム内に符号化することによって実施される。ビデオ処理の量を増加させるもう1つの要因は、様々な品質、フレームレート、及び/又は空間解像度(標準解像度(SD)及び高解像度(HD)の両方)のビデオ信号を同じビデオビットストリーム内で表すことが可能な、スケーラブルビデオコンテンツである。
マルチビュー及び/又はスケーラブルビデオコンテンツを有することの結果の1つは、そのようなコンテンツの送信及び受信が、帯域幅及び処理を非常に多く消費するものとなり得るということである。更に、そのようなビデオコンテンツを受信する全てのクライアントが、送信されたビデオ信号のコンテンツの全てを必要とするとは限らない。例えば、シングル標準解像度モニタ(single standard resolution monitor)を有するユーザは、HD又は3次元ビデオ信号によって提供される特徴の全てを必要とするわけではない。
必要とされているのは、より効率的にビデオコンテンツをクライアントに配信するシステム及び方法である。
一実施形態によれば、方法は、第1の形式の第1のビットストリームと、第2の形式の第2のビットストリームとを含むビデオファイルを記憶することを含む。第1のビットストリームは、複数の独立して符号化されたビデオコンポーネントを含み、第2のビットストリームは、複数の独立して符号化されたビデオコンポーネントのうちの1つを含む。この方法は、複数の独立して符号化されたビデオコンポーネントのうちの1つを選択し、第2のビットストリームを記憶するトラックを識別することを更に含む。
一実施形態によれば、ビデオサーバを動作させる方法は、第1のットストリームを受信し、第1のビットストリームをメモリ内に記憶し、第1のットストリームから、第2のットストリームを生成し、第2のットストリームをメモリ内に記憶することを含む。第1のットストリームは、複数の独立して符号化されたビューを有し、第2のットストリームは、複数の独立して符号化されたビューのうちの1つを有する。
別の実施形態によれば、ビデオサーバは、メモリと、プロセッサとを有する。プロセッサは、第1の独立して符号化されたビューと、第2の独立して符号化されたビューとを有する、第1のットストリームを受信し、第1のットストリームから、第2の独立して符号化されたビューを有する第2のットストリームを生成するように構成される。プロセッサは、第1及び第2のットストリームをメモリ内に記憶する。
以下の本発明の詳細な説明がより良く理解されることが可能なように、上記では、本発明の実施形態の特徴について幾分おおまかに概説した。本発明の特許請求の範囲の主題を形成する、本発明の実施形態の追加の特徴及び利点は、以下に記載される。開示される概念及び特定の実施形態は、本発明と同じ目的を達成するために、他の構成又はプロセスを修正又は設計するための基礎として、容易に利用されることが可能であるということを、当業者は理解されたい。そのような均等な構成は、添付の特許請求の範囲に記載される、本発明の精神及び範囲から逸脱するものではないということも、当業者は理解されたい。
本発明、及びその利点のより完全な理解のために、以下の説明を、添付の図面と組み合わせて参照する。
特に指定しない限り、異なる図中の対応する数字及び記号は、一般に、対応する部分を表す。図は、実施形態の関連する側面を明確に示すように描かれており、必ずしも一定の縮尺で描かれてはいない。
ビデオサーバシステムの実施形態を示す図である。 メモリ割り当ての実施形態を示す図である。
様々な実施形態の作製及び使用について、以下に詳細に説明する。しかし、本発明は、様々な特定の状況において実施することが可能な、多くの適用可能な発明概念を提供するということを理解されたい。説明する特定の実施形態は、本発明を作製及び使用する特定の方法を例示するものにすぎず、本発明の範囲を限定するものではない。
本発明は、特定の状況における実施形態(例えば、ビデオファイルを処理するシステム及び方法)に関して記載される。本発明の実施形態は、他のタイプのデータ通信を目的とするシステム及び方法に適用されてもよい。
図1は、ビデオ配信システム100の実施形態を示す。クライアント104は、接続106を介して、サーバ102に結合される。図示を容易にするために、1つのクライアント104のみが示されているが、実施形態においては、2つ以上のクライアントが、サーバ102に接続されてもよい。サーバ102は、プロセッサ112と、ネットワークインタフェース116と、メモリ114とを有する。いくつかの実施形態では、サーバ102は、接続108を介して、更なるネットワーク(例えば、インターネット110)に結合される。いくつかのその他の実施形態では、インターネット110及び接続108は、接続106の一部である。実施形態において、サーバ102は、メモリ114内に、ビデオコンテンツ、又はその部分を記憶する。メモリ114は、一実施形態では、ディスクドライブアレイにより構成されるが、メモリ114は、その他の形態の記憶装置(例えば、DRAM及びSRAMなどの半導体メモリ、他の種類の磁気記憶装置、又は他の形態のメモリ記憶装置)を包含してもよい。サーバ102は、例えば、ワイドエリア又はメトロポリタンネットワーク内の、サービスプロバイダによって運営される遠隔に位置するサーバ、ローカルエリアネットワークサーバ、又は別のタイプのサーバであってもよい。接続106及び108は、有線、無線、DSL、及び/又は、その他のタイプの接続であってもよい。更に、接続106及び108は、TCP−IP、UDP−IP、又はその他の種類のプロトコルに従って動作させられてもよい。
図2は、サーバ102のメモリ114(図1)の割り当ての実施形態を示す。本発明の一実施形態では、第1のットストリーム120と、第2のットストリーム122とが、メモリ114内に記憶される。一実施形態では、第1のットストリーム120は、1つ以上の独立して符号化されたビューを有し、第2のットストリーム122は、1つの独立して符号化されたビューを有する。
一実施形態では、第1のビットストリーム120は、少なくとも2つのビデオコンポーネントを有する。第1のビデオコンポーネントは、「Aビュー」と呼ばれる。実施形態において、この「Aビュー」は、第1のビットストリーム120内の、独立して符号化されたビューである。第1のビットストリーム120は、少なくとも1つの更なるビデオコンポーネントも有し、そのうちの第1のものは、「Bビュー」と呼ばれる。いくつかの場合、「Bビュー」は、「Aビュー」から独立して符号化されていない(例えば、「Bビュー」が「Aビュー」と密接に相関する、3−Dビデオなどの場合)。そのような場合、「Bビュー」情報は、「Bビュー」全体を符号化するのではなく、「Aビュー」からの符号化された差から形成されてもよい。いくつかの実施形態では、しかし、「Bビュー」は、独立して符号化される(例えば、第1のビットストリーム120が、演劇、パフォーマンス、又はスポーツイベントの複数のビューを運ぶ場合)。例えば、「Aビュー」は、レース場の鳥瞰ビュー(bird’s eye view)を表してもよく、「Bビュー」は、自動車レースの車内ビュー(in−car view)を表してもよい。更なる実施形態では、第1のビットストリーム120は、3つ以上のビュー(例えば、「Cビュー」「Dビュー」など)を更に含む。これらの追加のビューは、「Aビュー」に従属していてもよく、又は、「Aビュー」から独立していてもよい。
一実施形態では、「Aビュー」と、少なくとも1つの更なるビュー(例えば、「Bビュー」)とは、独立して符号化されたビューである。説明を簡単にするために、「Bビュー」は、独立して符号化されたと仮定する。「Bビュー」以外のその他のビューが独立して符号化されてもよい。従って、「Bビュー」について言及する場合、その他のビューが同様に考慮されてもよい、ということを理解されたい。例えば、一実施形態では、「Bビュー」は従属ビュー(dependent view)であり、「Cビュー」は独立ビュー(independent view)である。
一実施形態では、サーバ102は、少なくとも2つの独立ビューを有する第1のビットストリームを取得し、1つのビューを含む第2のビットストリーム122を作成する。一実施形態では、第2のビットストリーム内に符号化されるビューは、「Aビュー」以外の、独立して符号化されたビューである。更なる実施形態では、第2のビットストリームは、「Aビュー」を、あるいは、任意の独立して、又は従属して符号化されたビューを含んでもよい。
一実施形態では、サーバは、接続108から、第1のビットストリーム120を受信し、しかし、第1のビットストリームは、ユーザによって、ローカルに記憶するために、メモリ又はハードディスク又はその他の装置内に書き込まれてもよい(例えば、ユーザが、ネットワークなしで、DVDビデオを直接コピーする場合)。第2のビットストリーム122は、クライアント104による後の取り出しのために、サーバ102が第1のビットストリーム120を受信したすぐ後に生成されて書き込まれる。あるいは、第2のビットストリーム122は、例えば、クライアント104又はその他のクライアントによる代替要求(request for an alternate)に応えて、後で生成されてもよい。
一実施形態では、プロセッサ112は、圧縮されたスケーラブル又はマルチビュービデオコンテンツのサブセットをトランスコードする(トランスコードされたレイヤ又はビューのトラックから、元のレイヤ又はビューのトラックへのマッピングを行うことを含む)。一実施形態では、サーバ102は、元のビットストリームのサブセットに対応する、標準適合のスケーラブル又はマルチビュービットストリームを提供するために、トランスコード機能を実施しない(ここで、サブセットは、ベースレイヤ又はベースビューに従属しない)。むしろ、サーバ102は、いくつかの実施形態において、1つのビットストリームを有する第2のビットストリーム122を作成する。
いくつかの実施形態では、マルチビュー及びシングルビュービットストリームは、H.264/AVC標準(ITU−T勧告H.264、及びISO/IEC国際標準(IS)14496−10としても知られる)に従って形式化される。この標準は、ISO/IECモーション・ピクチャ・エキスパーツ・グループ(MPEG)とITU−Tビデオ・コーディング・エキスパーツ・グループ(VCEG)との共同ビデオチーム(JVT)によって開発された。スケーラブルビデオコーディング(SVC)は、H.264/AVC仕様のアネックスGで規定された、H.264/AVCのスケーラブル拡張であり、マルチビュービデオコーディング(MVC)は、H.264/AVC仕様のアネックスHで規定された、H.264/AVCのマルチビュー拡張である。代替の実施形態では、ISO/IEC IS 13818−2などの、その他の標準が使用されてもよい。
SVCベースの実施形態では、ビットストリームの一部が抽出、復号化され、より低い空間解像度、より低い品質、又はより低いフレームレートを使用して提示される。SVCビットストリームは、1つのベースレイヤと、複数のエンハンスメントレイヤとを有する。ベースレイヤビットストリームサブセットは、H.264/AVC仕様のアネックスAで以前に規定された非スケーラブルプロファイルのうちの1つ以上と後方互換性がある。いくつかの実施形態では、エンハンスメントレイヤは、符号化効率の向上のための、レイヤ間予測のために、より低いレイヤを使用する。簡単にするために、本開示では、エンハンスメントレイヤを、非ベースレイヤとも呼ぶ。
他方、MVCビットストリームの実施形態は、例えば複数のカメラによって捕捉された、1つ以上の符号化されたビューを有する。代替の実施形態では、これらの符号化されたビューは、様々なソースからの様々なビデオコンテンツを有してもよい。ビットストリーム全体によって表されるビューのサブセットを表すために、ビットストリームの一部が抽出、及び復号化される。MVCビットストリーム内のビューのうちの1つは、ベースビューであり、このビットストリームサブセットは、H.264/AVC仕様のアネックスAで以前に規定された非スケーラブルプロファイルのうちの1つ以上と後方互換性がある。その他のビューは、非ベースビューと呼ばれる。いくつかの実施形態において、非ベースビューは、符号化効率の向上のために、別のビューを使用してもよい。
簡単にするために、H.264/AVC仕様のアネックスAで規定されたプロファイルに準拠する、又は適合する、又はそのプロファイルと互換の、又はそのプロファイルを有するビットストリーム又は復号器は、H.264/AVCに準拠する、又は適合する、又はH.264/AVCと互換である、又はH.264/AVCを有すると呼ばれ、H.264/AVC仕様のアネックスGで規定されたプロファイルに準拠する、又は適合する、又はそのプロファイルと互換の、又はそのプロファイルを有するビットストリーム又は復号器は、SVCに準拠する、又は適合する、又はSVCと互換である、又はSVCを有すると呼ばれ、H.264/AVC仕様のアネックスHで規定されたプロファイルに準拠する、又は適合する、又はそのプロファイルと互換の、又はそのプロファイルを有するビットストリーム又は復号器は、MVCに準拠する、又は適合する、又はMVCと互換である、又はMVCを有すると呼ばれる。
SVC又はMVCの実施の実施形態では、非ベースレイヤ又はビューは、他のレイヤ又はビューに従属しても、しなくてもよい。他のビューに従属しない非ベースレイヤ又はビューの一例は、全てのレイヤ又はビューが相互に独立している場合である。別の例は、非ベースレイヤ又はビューのサブセットが、他の全てのレイヤ又はビューから独立しており、サブセット内では従属性が存在する場合である。そのような場合、他のいずれのレイヤ又はビューにも従属しない、少なくとも1つのレイヤ又はビューが、サブセット内に存在する。
一実施形態では、受信器が、非ベースレイヤ又はビューの、1つの独立して符号化されたサブセットを再生するための要求を発行する。独立したサブセット内の、非ベースレイヤ又はビューの数が1である場合、受信器は、H.264/AVCに準拠する、あるいはSVC又はMVCに準拠する復号器を使用することが可能である。両方の場合に、要求された非ベースレイヤ又はビューのための、抽出されたビットストリームサブセットは、H.264/AVCに準拠するようにトランスコードされる。後者の場合(すなわち、受信器が、SVC又はMVCに準拠する復号器を有する場合)に、非ベースビュー又はレイヤが、やはりH.264/AVCに準拠するようにトランスコードされる理由の1つは、SVC又はMVCにおいて、適合するビットストリームが、H.264/AVCに準拠するベースレイヤ又はビューを含むことが必要とされる場合があるからである。従って、非ベースレイヤ又はビューの、独立したサブセットが抽出される場合、サブセット内の独立した非ベースレイヤ又はビューは、H.264/AVCに準拠するようにトランスコードされる。独立したサブセット内の、非ベースレイヤ又はビューの数が2以上である場合、受信器は、SVC又はMVCに準拠する復号器を使用する。従って、レイヤ又はビューのサブセットを有するビットストリームを生成するために、サブセット内の独立した非ベースレイヤ又はビューが、H.264/AVCに準拠するようにトランスコードされる。
一実施形態では、独立した非ベースレイヤをH.264/AVC準拠にトランスコードすることは、H.264/AVC仕様のサブクローズG.13.2.1(シンタクス要素conversion_type_idc[i]が2に等しい場合の、conversion_type_idc[i]のセマンティクス)に記載されている。
一実施形態では、非ベースビューの独立したサブセット内の、独立した非ベースビューを、H.264/AVC準拠表現にトランスコードする方法は、H.264/AVC仕様のサブクローズH8.5.5に記載されている方法に従って達成される。
一実施形態では、非ベースレイヤ又はビューの、1つの独立して符号化されたサブセットに対する、受信器の要求に応えて、ビデオサーバが、(例えば、上記の例で指定された通りに)トランスコードを実行し、トランスコードされたビットストリームを、受信器に送信する。しかし、複雑さとコストを減少させるために、一部のサーバは、そのようなトランスコード機能を装備していなくてもよい。そのような適用シナリオを可能にするために、いくつかの実施形態では、一メカニズムが、トランスコードされたビットストリームをメディアファイル内に記憶し、これにより、サーバは、ファイル内の所望のトラックを直接選択して、そのエレメンタリストリームを受信器に送信する。
マルチメディアコンテンツの記憶のために広く使用されている、ISOベースのメディアファイルの形式は、ISO/IEC IS 14496−12で規定されている。MPEG−4ファイル形式(ISO/IEC IS 14496−14)、H.264/AVCファイル形式(ISO/IEC IS 14496−15)、SVCファイル形式(ISO/IEC IS 14496−15アメンドメント2)、及びMVCファイル形式(ISO/IEC IS 14496−15アメンドメント3)を含む、ファイル形式の標準又はドラフト標準のファミリは、いくつかの実施形態では、ISOベースのメディアファイル形式に基づいて導き出される。
一実施形態では、MPEG出力文書W10445(第87回MPEG会議、ローザンヌ、スイス、2009年2月)におけるドラフトMVCファイル形式に基づいた方法が使用され、当該文書は参照により本明細書中に援用される。この実施形態では、VirtualBaseViewTracks(仮想ベースビュートラック)ボックスと命名された、新たなボックスが規定される。VirtualBaseViewTracksボックスは、ファイル内に記憶されたマルチビューストリームのベースビューを含むトラックのMedia Information(メディア情報)ボックス内に含まれる、Multi−view Information(マルチビュー情報)ボックス内に含まれる。
新たなボックスは、以下のように規定される。Box Type(ボックスタイプ)は、「vbvt」に設定される。Multi−view Informationボックス(「mvci」)は新たなボックスを収容する。いくつかの実施形態では、新たなボックスは、省略可能である。新たなボックスは、独立して符号化された非ベースビューについての、仮想ベースビューを記憶するトラックの情報を提供する。一実施形態では、任意の独立して符号化された非ベースビューについて、仮想ベースビューは、ビューのH.264/AVC互換表現であり、H.264/AVC仕様のサブクローズH.8.5.5で規定されたプロセスによって作成することが可能である。独立して符号化された非ベースビューのデータ単位を含むサンプルと、仮想ベースビューのサンプルとは、復号化時間までにアライメントされる。
以下のシンタクスは、新たなボックスの形式と、どのような情報を新たなボックスVirtualBaseViewTracksが含むかとを規定する。
Figure 2012523781
上記のシンタクスの実施形態において、シンタクス要素のセマンティクスは、以下の通りである。
num_entriesは、トラック又はティア(それについて、仮想ベースビューを含むトラックが識別される)の数である。
entry_typeは、どのタイプのトラック又はティアが続くかを示す。entry_typeの以下の値が指定される。
0−トラック全体。この場合、track_idによって識別されるトラックは、独立して符号化された非ベースビューのみを含む。
1−トラック内のティア。この場合、track_id及びtier_idによって識別されるティアは、独立して符号化された非ベースビューのみを含む。
track_idは、トラックを示す。
tier_idは、トラック内のティアを示す。
vbv_track_idは、track_id(entry_typeが0に等しい場合)によって、又は、track_id及びtier_id(entry_typeが1に等しい場合)によって識別されるビューについての、仮想ベースビューを含む、トラックを示す。
一実施形態では、VirtualBaseViewTracksボックスは、それぞれの独立して符号化された非ベースビュー(又はその一時的サブセット)について、H.264/AVC準拠の、かつ、例えばH.264/AVC仕様のサブクローズH.8.5.5で規定されたプロセスに従って作成された、仮想ベースビュー(又はその一時的サブセット)を含むトラックのトラック識別子を提供する。非ベースビューのサブセットが抽出及び復号化される場合、ビューのサブセットのうち最も小さなビュー順序インデックスを有するビューが、独立に符号化された非ベースビューである(そうでなければ、より多くのビューが抽出される必要がある)。この場合、最も小さなビュー順序インデックスを有するビューについては、対応する仮想ベースビュートラックからデータ単位が取得される。その他のビューについてのデータ単位は、元のトラック(1つ又は複数)から、通常通り取得される。抽出及び復号化される非ベースビューのサブセット内のビューの数が1である場合(すなわち、1つのみの独立して符号化された非ベースビューが抽出及び復号化される場合)、仮想ビューは直接取得される。
本発明の別の実施形態では、MPEG出力文書W10445(第87回MPEG会議、ローザンヌ、スイス、2009年2月)におけるドラフトMVCファイル形式に基づいた別の方法が使用される。この方法では、新たなボックスを規定する代わりに、新たなトラック参照タイプ「vbvt」が規定される。実施形態において、仮想ベースビューを含む任意のトラックは、対応する独立して符号化された非ベースビューを含むソーストラックを参照する、タイプ「vbvt」のトラック参照(track reference)を含む。この新たなトラック参照タイプを使用して、サーバは、独立して符号化された非ベースビューの、仮想ベースビューを含むファイルトラックを識別し、独立して符号化された非ベースビューがクライアントによって要求された場合、サーバは、識別されたトラック内に含まれるメディアデータを、クライアントに送信する。
更なる実施形態では、新たなボックス又は新たなトラック参照タイプが、スケーラブルビデオコンテンツに適用するために使用される。そのような新たなボックス又は新たなトラック参照タイプは、非ベースレイヤがクライアントによって要求された場合、マルチビュービデオコンテンツについての上記と同様の機能を、ここでは、スケーラブルビデオコンテンツのために提供する。
一実施形態では、方法は、第1の形式の第1のビットストリームと、第2の形式の第2のビットストリームとを含むビデオファイルを記憶することを含む。第1のビットストリームは、複数の独立して符号化されたビデオコンポーネントを含み、第2のビットストリームは、複数の独立して符号化されたビデオコンポーネントのうちの1つを含む。この方法は、複数の独立して符号化されたビデオコンポーネントのうちの1つを選択し、第2のビットストリームを記憶するトラックを識別することを更に含む。いくつかの実施形態では、この方法は、第2のビットストリームをクライアントに送信することを更に含む。更なる実施形態では、複数の独立して符号化されたビデオコンポーネントのそれぞれは、独立して符号化されたビュー、及び/又は、独立して符号化されたレイヤを含む。
一実施形態では、第1の形式は、H.264/AVCビデオ符号化標準のアネックスHで規定されたプロファイルに従う、マルチビュービデオコーディング(MVC)形式であり、第2の形式は、H.264/AVCビデオ符号化標準のアネックスAで規定されたプロファイルに従う、アドバンストビデオコーディング(AVC)形式である。別の実施形態では、第1の形式は、H.264/AVCビデオ符号化標準のアネックスGで規定されたプロファイルに従う、スケーラブルビデオコーディング(SVC)形式であり、第2の形式は、H.264/AVCビデオ符号化標準のアネックスAで規定されたプロファイルに従う、アドバンストビデオコーディング(AVC)形式を含む。いくつかの実施形態では、ビデオファイルは、マルチビュービデオコーディング(MVC)ファイル形式に従って、又は、スケーラブルビデオコーディング(SVC)ファイル形式に従って記憶される。更なる実施形態では、その他の形式が使用されてもよい。
実施形態によれば、第2のビットストリームを記憶するトラックを識別することは、ビデオファイルからの情報を使用することを含み、ここで、ビデオファイルからの情報は、第2のビットストリームを記憶するトラックを示す。いくつかの実施形態では、第2のビットストリームを記憶するトラックを示す、ビデオファイルからの情報は、第2のビットストリームを記憶するトラックの情報を含むボックス、及び/又は、第2のビットストリームを記憶するトラックの情報を示すトラック参照を含む。
一実施形態では、ビデオサーバを動作させる方法は、第1のットストリームを受信することを含み、ここで、第1のットストリームは、複数の独立して符号化されたビューを含む。この方法は、第1のビットストリームをメモリ内に記憶し、第1のットストリームから、第2のットストリームを生成し、第2のットストリームをメモリ内に記憶することを更に含む。第2のットストリームは、複数の独立して符号化されたビューのうちの1つを含む。一実施形態では、この方法は、第2のビットストリームをクライアントに送信することを更に含む。更なる実施形態では、この方法は、複数のビットストリームのうちの1つに対する要求を、クライアントから受信することを更に含み、ここで、送信することは、要求を受信することに応えて実行される。いくつかの実施形態は、第1のットストリームから、第3のットストリームを生成し(ここで、第3のットストリームは、複数の独立して符号化されたビューのうちの別の1つを含み)、第3のットストリームをメモリ内に記憶することを含む。いくつかの実施形態では、第2のットストリームは、第1のビットストリームと同じファイル内に記憶される。
いくつかの実施形態では、第2のビットストリームは、第1のビットストリームとは異なる形式で符号化される。一例において、第1のビットストリームは、マルチビュービデオコーディング(MVC)形式で符号化され、第2のビットストリームは、スケーラブルビデオコーディング(SVC)形式で符号化される。いくつかの実施形態では、複数の独立して符号化されたビューは、Aビューと、少なくとも1つの更なる独立して符号化されたビューとを含み、第2のビットストリーム内の、複数の独立して符号化されたビューのうちの1つは、少なくとも1つの更なる独立して符号化されたビューを含む。
一実施形態では、ビデオサーバは、メモリと、プロセッサとを含み、ここで、プロセッサは、第1の独立して符号化されたビューと、第2の独立して符号化されたビューとを有する、第1のットストリームを受信するように構成される。プロセッサは、第1のビットストリームをメモリ内に記憶し、第1のットストリームから、第2のットストリームを生成し、第2のットストリームをメモリ内に記憶するように更に構成される。第2のットストリームは、第2の独立して符号化されたビューを含む。いくつかの実施形態では、ビデオサーバは、第2のビットストリームを送信するように構成される。更なる実施形態では、ビデオサーバは、第2のトリームに対する要求に応えて、第2のビットストリームをクライアントに送信するように構成される。
一実施形態では、第2のビットストリームは、第1のビットストリームとは異なる形式で符号化される。一例において、第1のビットストリームは、マルチビュービデオコーディング(MVC)形式で符号化され、第2のビットストリームは、スケーラブルビデオコーディング(SVC)形式で符号化される。更なる実施形態では、第1の独立して符号化されたビューは、Aビューを含み、第2の独立して符号化されたビューは、Bビューを含む。
一実施形態では、ビデオデータを配信する方法は、第1のットストリームを提供することを含み、ここで、第1のットストリームは、第1の独立して符号化されたビューと、第2の独立して符号化されたビューとを含む。この方法は、第1のットストリームから、第2のットストリームを生成し、第2のットストリームをメモリ内に記憶することを更に含み、ここで、第2のットストリームは、第2の独立して符号化されたビューを含む。実施形態において、この方法は、第2のビットストリームをクライアントに送信することを更に含む。いくつかの実施形態では、第2のビットストリームをクライアントに送信することは、第2の独立して符号化されたビューに対する、クライアントからの要求に応えて実行される。
いくつかの実施形態では、生成することは、プロセッサによって実行される。更なる実施形態では、第1のットストリームを提供することは、第1のットストリームを、コンピュータネットワークから受信することを含む。ビデオサーバのいくつかの実施形態では、第1のビットストリームは、マルチビュービデオコーディング(MVC)形式で符号化され、第2のビットストリームは、スケーラブルビデオコーディング(SVC)形式で符号化される。
いくつかの実施形態では、アルゴリズムの実施形態は、プロセッサ上で実行されるコンピュータプログラム又はソフトウェアを使用して実施されてもよい。
マルチビュービットストリームからシングルビュービットストリームを作成する実施形態の利点は、副次的ビューが要求されるたびにトランスコード動作を実行する必要なしに、副次的ビューをクライアントに提供する能力である。
実施形態の更なる利点は、副次的ビューを要求しているクライアントノードが、マルチビュー復号化アルゴリズムをサポート又は実行する必要がなく、かつ、マルチビュー復号化に処理リソースを割り当てる必要がないということである。これにより、スマートフォン及びノートブックなどの、低パワーかつ/又は低性能のクライアントが、マルチビュービットストリームからビューを抽出するために処理リソースを費やす必要なしに、フルフィーチャーのビデオコンテンツにアクセスすることが可能となる。
本発明の実施形態は、
ビデオファイルを記憶するために使用される、記憶ユニットと(ビデオファイルは、第1の形式の第1のビットストリームと、第2の形式の第2のビットストリームとを含み、第1のビットストリームは、複数の独立して符号化されたビデオコンポーネントを含み、第2のビットストリームは、複数の独立して符号化されたビデオコンポーネントのうちの1つを含み)、
複数の独立して符号化されたビデオコンポーネントのうちの1つを選択するために使用される、選択ユニットと、
第2のビットストリームを記憶するトラックを識別するために使用される、識別ユニットとを含む、ビデオファイル処理装置を更に提供する。
ビデオファイル処理装置は、第2のビットストリームをクライアントに送信するために使用される、送信ユニットを更に含んでもよい。
ビデオファイル処理装置の識別ユニットは、ビデオファイルからの情報を使用してもよく、ここで、ビデオファイルからの情報は、第2のビットストリームを記憶するトラックを示す。
本発明の実施形態は、
第1のットストリームを受信するために使用される、受信ユニットと(第1のットストリームは、複数の独立して符号化されたビューを含み)、
第1のットストリームから、第2のットストリームを生成するために使用される、生成ユニットと(第2のットストリームは、複数の独立して符号化されたビューのうちの1つを含み)、
第1のビットストリームと、第2のットストリームとを記憶するために使用される、記憶ユニットとを含む、ビデオサーバも更に提供する。
ビデオサーバは、第2のビットストリームをクライアントに送信するために使用される、送信ユニットを更に含んでもよい。
別の態様において、ビデオサーバは、
第1のットストリームから、第3のットストリームを生成するために更に使用される、生成ユニットと(第3のットストリームは、複数の独立して符号化されたビューのうちの別の1つを含み)、
第3のットストリームをメモリ内に記憶するために更に使用される、記憶ユニットとを更に含んでもよい。
本実施形態及びその利点について詳細に説明してきたが、添付の特許請求の範囲によって規定される本発明の精神及び範囲から逸脱することなく、様々な変更、置換、及び改変が本明細書で行われてもよいということを理解されたい。例えば、上述の特徴及び機能のうちの多くは、ソフトウェア、ハードウェア、ファームウェア、又はそれらの組み合わせで実施されてもよい。
更に、本出願の範囲は、本明細書に記載された、プロセス、機械、製造物、組成物、手段、方法、及びステップの特定の実施形態に限定されることを意図するものではない。当業者が、本発明の開示から容易に理解するであろうように、本明細書に記載された対応する実施形態と実質的に同じ機能を実行する、又は実質的に同じ結果を達成する、現在存在している、又は後に開発される、プロセス、機械、製造物、組成物、手段、方法、又はステップは、本発明に従って利用されてもよい。従って、添付の特許請求の範囲は、その範囲内に、そのようなプロセス、機械、製造物、組成物、手段、方法、又はステップを含むことを意図するものである。

Claims (31)

  1. ビデオファイルを記憶し、前記ビデオファイルは、第1の形式の第1のビットストリームと、第2の形式の第2のビットストリームとを含み、前記第1のビットストリームは、複数の独立して符号化されたビデオコンポーネントを含み、前記第2のビットストリームは、前記複数の独立して符号化されたビデオコンポーネントのうちの1つを含み、
    前記複数の独立して符号化されたビデオコンポーネントのうちの前記1つを選択し、
    前記第2のビットストリームを記憶するトラックを識別すること
    を含む、方法。
  2. 前記第2のビットストリームをクライアントに送信することを更に含む、請求項1に記載の方法。
  3. 前記複数の独立して符号化されたビデオコンポーネントのそれぞれは、独立して符号化されたビューを含む、請求項1に記載の方法。
  4. 前記複数の独立して符号化されたビデオコンポーネントのそれぞれは、独立して符号化されたレイヤを含む、請求項1に記載の方法。
  5. 前記第1の形式は、H.264/AVCビデオ符号化標準のアネックスHで規定されたプロファイルに従う、マルチビュービデオコーディング(MVC)形式を含み、前記第2の形式は、前記H.264/AVCビデオ符号化標準のアネックスAで規定されたプロファイルに従う、アドバンストビデオコーディング(AVC)形式を含む、請求項1に記載の方法。
  6. 前記第1の形式は、H.264/AVCビデオ符号化標準のアネックスGで規定されたプロファイルに従う、スケーラブルビデオコーディング(SVC)形式を含み、前記第2の形式は、前記H.264/AVCビデオ符号化標準のアネックスAで規定されたプロファイルに従う、アドバンストビデオコーディング(AVC)形式を含む、請求項1に記載の方法。
  7. 前記ビデオファイルは、マルチビュービデオコーディング(MVC)ファイル形式に従って記憶される、請求項1に記載の方法。
  8. 前記ビデオファイルは、スケーラブルビデオコーディング(SVC)ファイル形式に従って記憶される、請求項1に記載の方法。
  9. 前記第2のビットストリームを記憶するトラックを識別することは、前記ビデオファイルからの情報を使用することを含み、前記ビデオファイルからの前記情報は、前記第2のビットストリームを記憶する前記トラックを示す、請求項1に記載の方法。
  10. 前記第2のビットストリームを記憶する前記トラックを示す、前記ビデオファイルからの前記情報は、前記第2のビットストリームを記憶する前記トラックの情報を含むボックスを含む、請求項9に記載の方法。
  11. 前記第2のビットストリームを記憶する前記トラックを示す、前記ビデオファイルからの前記情報は、前記第2のビットストリームを記憶する前記トラックの情報を示すトラック参照を含む、請求項9に記載の方法。
  12. 第1のビデオビットストリームを受信し、前記第1のビデオビットストリームは、複数の独立して符号化されたビューを含み、
    前記第1のビットストリームを記憶し、
    前記第1のビデオビットストリームから、第2のビデオビットストリームを生成し、前記第2のビデオビットストリームは、前記複数の独立して符号化されたビューのうちの1つを含み、
    前記第2のビデオビットストリームを記憶すること
    を含む、ビデオサーバを動作させる方法。
  13. 前記第2のビットストリームをクライアントに送信することを更に含む、請求項11に記載の方法。
  14. 複数のビットストリームのうちの1つに対する要求を、前記クライアントから受信することを更に含み、送信することは、前記要求を受信することに応えて実行される、請求項13に記載の方法。
  15. 前記第2のビットストリームは、前記第1のビットストリームとは異なる形式で符号化される、請求項12に記載の方法。
  16. 前記第1のビットストリームは、マルチビュービデオコーディング(MVC)形式で符号化され、
    前記第2のビットストリームは、スケーラブルビデオコーディング(SVC)形式で符号化される、
    請求項15に記載の方法。
  17. 複数の独立して符号化されたビューは、Aビューと、少なくとも1つの更なる独立して符号化されたビューとを含み、
    前記第2のビットストリーム内の、前記複数の独立して符号化されたビューのうちの前記1つは、前記少なくとも1つの更なる独立して符号化されたビューを含む、
    請求項16に記載の方法。
  18. 前記第1のビデオビットストリームから、第3のビデオビットストリームを生成し、前記第3のビデオビットストリームは、前記複数の独立して符号化されたビューのうちの別の1つを含み、
    前記第3のビデオビットストリームをメモリ内に記憶すること
    を更に含む、請求項12に記載の方法。
  19. 前記第2のビデオビットストリームは、前記第1のビットストリームと同じファイル内に記憶される、請求項12に記載の方法。
  20. ビデオファイルを記憶するために使用される、記憶ユニットであって、前記ビデオファイルは、第1の形式の第1のビットストリームと、第2の形式の第2のビットストリームとを含み、前記第1のビットストリームは、複数の独立して符号化されたビデオコンポーネントを含み、前記第2のビットストリームは、前記複数の独立して符号化されたビデオコンポーネントのうちの1つを含む、前記記憶ユニットと、
    前記複数の独立して符号化されたビデオコンポーネントのうちの前記1つを選択するために使用される、選択ユニットと、
    前記第2のビットストリームを記憶するトラックを識別するために使用される、識別ユニットと
    を備える、ビデオファイル処理装置。
  21. 前記第2のビットストリームをクライアントに送信するために使用される、送信ユニットを更に含む、請求項20に記載の装置。
  22. 前記識別ユニットは、前記ビデオファイルからの情報を使用し、前記ビデオファイルからの前記情報は、前記第2のビットストリームを記憶する前記トラックを示す、請求項20に記載の装置。
  23. 複数の独立して符号化されたビューを含む第1のビデオビットストリームを受信するために使用される、受信ユニットと、
    前記第1のビデオビットストリームから、前記複数の独立して符号化されたビューのうちの1つを含む第2のビデオビットストリームを生成するために使用される、生成ユニットと、
    前記第1のビットストリームと、前記第2のビデオビットストリームとを記憶するために使用される、記憶ユニットと
    を備える、ビデオサーバ。
  24. 前記第2のビットストリームをクライアントに送信するために使用される、送信ユニットを更に備える、請求項23に記載のビデオサーバ。
  25. 前記第1のビデオビットストリームから、前記複数の独立して符号化されたビューのうちの別の1つを含む第3のビデオビットストリームを生成するために更に使用される、前記生成ユニットと、
    前記第3のビデオビットストリームをメモリ内に記憶するために更に使用される、前記記憶ユニットと
    を更に備える、請求項12に記載のビデオサーバ。
  26. メモリと、
    プロセッサとを備える、ビデオサーバであって、前記プロセッサは、
    第1の独立して符号化されたビューと、第2の独立して符号化されたビューとを含む、第1のビデオビットストリームを受信し
    前記第1のビットストリームをメモリ内に記憶し、
    前記第1のビデオビットストリームから、第2のビデオビットストリームを生成し、前記第2のビデオビットストリームは、前記第2の独立して符号化されたビューを含み、
    前記第2のビデオビットストリームを前記メモリ内に記憶する
    ように構成された、ビデオサーバ。
  27. 前記ビデオサーバは、前記第2のビットストリームを送信するように構成された、請求項20に記載のビデオサーバ。
  28. 前記ビデオサーバは、前記第2のビデオストリームに対する要求に応えて、前記第2のビットストリームをクライアントに送信するように構成された、請求項20に記載のビデオサーバ。
  29. 前記第2のビットストリームは、前記第1のビットストリームとは異なる形式で符号化される、請求項20に記載のビデオサーバ。
  30. 前記第1のビットストリームは、マルチビュービデオコーディング(MVC)形式で符号化され、
    前記第2のビットストリームは、スケーラブルビデオコーディング(SVC)形式で符号化される、
    請求項23に記載のビデオサーバ。
  31. 前記第1の独立して符号化されたビューは、Aビューを含み、前記第2の独立して符号化されたビューは、Bビューを含む、
    請求項24に記載のビデオサーバ。
JP2012505036A 2009-04-14 2010-04-14 ビデオファイルを処理するシステム及び方法 Active JP5289618B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16924709P 2009-04-14 2009-04-14
US61/169,247 2009-04-14
US12/754,896 2010-04-06
US12/754,896 US8948247B2 (en) 2009-04-14 2010-04-06 System and method for processing video files
PCT/CN2010/071764 WO2010118686A1 (en) 2009-04-14 2010-04-14 System and method for processing video files

Publications (2)

Publication Number Publication Date
JP2012523781A true JP2012523781A (ja) 2012-10-04
JP5289618B2 JP5289618B2 (ja) 2013-09-11

Family

ID=42934092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012505036A Active JP5289618B2 (ja) 2009-04-14 2010-04-14 ビデオファイルを処理するシステム及び方法

Country Status (6)

Country Link
US (1) US8948247B2 (ja)
EP (1) EP2420065A4 (ja)
JP (1) JP5289618B2 (ja)
KR (1) KR101265990B1 (ja)
CN (2) CN103856778A (ja)
WO (1) WO2010118686A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8948247B2 (en) 2009-04-14 2015-02-03 Futurewei Technologies, Inc. System and method for processing video files
WO2010120033A1 (ko) * 2009-04-17 2010-10-21 엘지전자 주식회사 다시점 비디오 신호의 처리 방법 및 장치
WO2012070875A2 (ko) * 2010-11-23 2012-05-31 삼성전자 주식회사 멀티미디어 시스템에서 다계층 영상을 위한 미디어 파일 생성 방법 및 장치와 이를 이용한 미디어 파일 재생 장치
CN103875248B (zh) 2011-08-30 2018-09-07 帝威视有限公司 用于编码和流处理通过使用多个最大比特率级别编码的视频的系统和方法
US8818171B2 (en) 2011-08-30 2014-08-26 Kourosh Soroushian Systems and methods for encoding alternative streams of video for playback on playback devices having predetermined display aspect ratios and network connection maximum data rates
KR20130037194A (ko) * 2011-10-05 2013-04-15 한국전자통신연구원 비디오 부호화/복호화 방법 및 그 장치
US10452715B2 (en) 2012-06-30 2019-10-22 Divx, Llc Systems and methods for compressing geotagged video
US20140003799A1 (en) * 2012-06-30 2014-01-02 Divx, Llc Systems and methods for decoding a video sequence encoded using predictions that include references to frames in reference segments from different video sequences
GB2534136A (en) * 2015-01-12 2016-07-20 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US10148989B2 (en) 2016-06-15 2018-12-04 Divx, Llc Systems and methods for encoding video content

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190293A (ja) * 1996-01-12 1997-07-22 Nec Corp データ読出装置
JP2002232912A (ja) * 2001-02-06 2002-08-16 Kansai Tlo Kk 画像配信装置、プログラム及び記録媒体
JP2003346183A (ja) * 2002-05-28 2003-12-05 Canon Inc 3dコンテンツサービスシステム
JP2005124200A (ja) * 2003-10-16 2005-05-12 Sharp Corp 三次元ビデオ符号化に関するシステム及び方法
JP2007156961A (ja) * 2005-12-07 2007-06-21 Sharp Corp 情報処理装置、テレビ、プログラム及び情報処理方法
WO2008156318A2 (en) * 2007-06-19 2008-12-24 Electronics And Telecommunications Research Institute Metadata structure for storing and playing stereoscopic data, and method for storing stereoscopic content file using this metadata

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001097531A2 (en) * 2000-06-12 2001-12-20 Vrex, Inc. Electronic stereoscopic media delivery system
KR100556826B1 (ko) 2003-04-17 2006-03-10 한국전자통신연구원 Mpeg-4 기반의 양안식 3차원 동영상을 서비스하기 위한 인터넷 방송 시스템 및 그 방법
US7336837B2 (en) 2005-01-11 2008-02-26 Nokia Corporation Method and system for coding/decoding of a video bit stream for fine granularity scalability
US20060233247A1 (en) 2005-04-13 2006-10-19 Visharam Mohammed Z Storing SVC streams in the AVC file format
US7894535B2 (en) 2005-08-23 2011-02-22 Sony Ericsson Mobile Communications Ab Systems and methods for distributing and/or playing multicasted video signals in multiple display formats
US20070122045A1 (en) 2005-11-29 2007-05-31 Jiun-Yuan Wu System for scaling a picture unit from a first video resolution format to a second video resolution format
KR100747598B1 (ko) * 2005-12-09 2007-08-08 한국전자통신연구원 디지털방송 기반의 3차원 입체영상 송수신 시스템 및 그방법
EP2080379B1 (en) * 2006-10-16 2018-08-22 Nokia Technologies Oy System and method for using parallelly decodable slices for multi-view video coding
CN101578884B (zh) 2007-01-08 2015-03-04 诺基亚公司 提供和使用译码的媒体流的互操作点的预定信令的系统和方法
US8471893B2 (en) * 2007-06-26 2013-06-25 Samsung Electronics Co., Ltd. Method and apparatus for generating stereoscopic image bitstream using block interleaved method
KR100973657B1 (ko) * 2007-11-01 2010-08-02 경희대학교 산학협력단 디블록킹 필터링을 포함하는 코덱 사이의 트랜스코딩 방법 및 장치
US8121191B1 (en) * 2007-11-13 2012-02-21 Harmonic Inc. AVC to SVC transcoder
US20090163185A1 (en) * 2007-12-24 2009-06-25 Samsung Electronics Co., Ltd. Method and system for creating, receiving and playing multiview images, and related mobile communication device
AU2009287465B2 (en) * 2008-09-17 2014-09-11 Panasonic Corporation Recording medium, playback device, and integrated circuit
JP4957823B2 (ja) 2009-04-08 2012-06-20 ソニー株式会社 再生装置および再生方法
US20100259595A1 (en) * 2009-04-10 2010-10-14 Nokia Corporation Methods and Apparatuses for Efficient Streaming of Free View Point Video
KR101632076B1 (ko) 2009-04-13 2016-06-21 삼성전자주식회사 우선순위에 따른 스테레오스코픽 영상 데이터의 전송 장치 및 방법
US8948247B2 (en) 2009-04-14 2015-02-03 Futurewei Technologies, Inc. System and method for processing video files
US8719309B2 (en) 2009-04-14 2014-05-06 Apple Inc. Method and apparatus for media data transmission

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190293A (ja) * 1996-01-12 1997-07-22 Nec Corp データ読出装置
JP2002232912A (ja) * 2001-02-06 2002-08-16 Kansai Tlo Kk 画像配信装置、プログラム及び記録媒体
JP2003346183A (ja) * 2002-05-28 2003-12-05 Canon Inc 3dコンテンツサービスシステム
JP2005124200A (ja) * 2003-10-16 2005-05-12 Sharp Corp 三次元ビデオ符号化に関するシステム及び方法
JP2007156961A (ja) * 2005-12-07 2007-06-21 Sharp Corp 情報処理装置、テレビ、プログラム及び情報処理方法
WO2008156318A2 (en) * 2007-06-19 2008-12-24 Electronics And Telecommunications Research Institute Metadata structure for storing and playing stereoscopic data, and method for storing stereoscopic content file using this metadata

Also Published As

Publication number Publication date
CN103856778A (zh) 2014-06-11
CN102224733A (zh) 2011-10-19
EP2420065A1 (en) 2012-02-22
EP2420065A4 (en) 2012-02-22
US20100259690A1 (en) 2010-10-14
JP5289618B2 (ja) 2013-09-11
KR20110118174A (ko) 2011-10-28
WO2010118686A1 (en) 2010-10-21
KR101265990B1 (ko) 2013-05-22
CN102224733B (zh) 2014-03-12
US8948247B2 (en) 2015-02-03

Similar Documents

Publication Publication Date Title
JP5289618B2 (ja) ビデオファイルを処理するシステム及び方法
CN113141379B (zh) 在定时媒体数据流式传输期间改进渲染显示的方法、设备和计算机程序
CN109076229B (zh) 在图片中最感兴趣的区域
CA2758237C (en) Media container file management
Chen et al. The emerging MVC standard for 3D video services
KR100934006B1 (ko) 2차원 및 3차원 양안식 비디오신호의 적응변환 장치 및 그방법
JP6516766B2 (ja) 分割タイムドメディアデータのストリーミングを改善するための方法、デバイス、およびコンピュータプログラム
JP6556126B2 (ja) ファイルの生成方法、ファイルの生成装置、及び、プログラム。
KR101242472B1 (ko) 트랙 및 트랙 서브세트의 그룹화를 위한 방법 및 장치
JP5866359B2 (ja) ネットワークストリーミングされるビデオデータについての属性をシグナリングすること
KR100995968B1 (ko) 규모 가변적 미디어 코딩 및 전송을 위한 다중 상호운용성 포인트
KR102120525B1 (ko) 통신 장치, 통신 데이터 생성 방법, 및 통신 데이터 처리 방법
JP5591932B2 (ja) ファイルフォーマットトラック選択のためのメディアエクストラクタトラック
US20120269267A1 (en) Method and apparatus for unified scalable video encoding for multi-view video and method and apparatus for unified scalable video decoding for multi-view video
JP2017153127A (ja) メディアコンテンツ復号装置
JP2009529825A (ja) 均一な画質を提供する多視点映像符号化及び復号化方法及び装置
JP3843101B2 (ja) 階層符号化データ配信装置および方法
CN108476346B (zh) 信息处理装置和信息处理方法
JP5734699B2 (ja) 配信映像の超解像化装置
KR101386651B1 (ko) 다시점 비디오 인코딩 및 디코딩 방법 및 이를 이용한 인코딩 및 디코딩 장치
KR101944601B1 (ko) 기간들에 걸쳐 오브젝트들을 식별하기 위한 방법 및 이에 대응하는 디바이스
WO2020184672A1 (ja) 画像復号装置、画像復号方法、画像符号化装置、および画像符号化方法
Kurutepe et al. A standards-based, flexible, end-to-end multi-view video streaming architecture
Coelho Low Cost Transcoder
Cho et al. Effective multiview video coding using a scalable depth map

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20120831

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20121016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121023

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130128

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130604

R150 Certificate of patent or registration of utility model

Ref document number: 5289618

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250