JP6080951B2 - 円滑な品質遷移を可能にする適応ストリーミングアウェアノード、エンコーダ及びクライアント - Google Patents

円滑な品質遷移を可能にする適応ストリーミングアウェアノード、エンコーダ及びクライアント Download PDF

Info

Publication number
JP6080951B2
JP6080951B2 JP2015519022A JP2015519022A JP6080951B2 JP 6080951 B2 JP6080951 B2 JP 6080951B2 JP 2015519022 A JP2015519022 A JP 2015519022A JP 2015519022 A JP2015519022 A JP 2015519022A JP 6080951 B2 JP6080951 B2 JP 6080951B2
Authority
JP
Japan
Prior art keywords
quality
video
slice
versions
version
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015519022A
Other languages
English (en)
Other versions
JP2015526959A (ja
Inventor
デ・フェレスハウエル,ダニー
デ・フリーント,ヨハン
ロビンソン,デイブ
Original Assignee
アルカテル−ルーセント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント filed Critical アルカテル−ルーセント
Publication of JP2015526959A publication Critical patent/JP2015526959A/ja
Application granted granted Critical
Publication of JP6080951B2 publication Critical patent/JP6080951B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/613Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for the control of the source by the destination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2402Monitoring of the downstream path of the transmission network, e.g. bandwidth available
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、一般に、ビデオセグメント、即ち、利用可能なネットワークリソース及びクライアントリソースに応じて、異なるバージョン又は品質レベルにおいて配信され得る、数秒の典型的な長さを有するビデオアイテムの固定サイズ又は可変サイズのフラグメントの適応ストリーミングに関する。本発明は、特に、ビデオアイテムの要求される品質を変化させる必要があるようにネットワークリソース又はクライアントリソースが変化する場合、ビデオ品質、ビットレート及びプレイアウトバッファの充填レベルにおける変動を円滑にすることを目指す。
ビデオは、例えば、ハイパーテキスト転送プロトコル(HTTP)適応ストリーミング(HAS:HTTP adaptive streaming)のような、適応ストリーミング(AS)技術を使用してますます配信されている。HASは、当該HASが他のプロトコルよりも容易にファイアウォールを通過し、TCPから継承された固有の輻輳制御を有し、且つ、HTTPキャッシングノード及びコンテンツ配信ネットワーク(CDN:Content Distribution Network)ノードなどの利用可能なHTTPインフラストラクチャを利用するため、容易に配備可能であるという利点を有する。
適応ストリーミングを使用して、ビデオアイテム、例えば、ビデオファイル又はストリームは、異なるバージョンで符号化され、利用可能とされる。異なるバージョンは、異なる品質レベル及び異なるビットレートを表す。特定の時点において、ビデオクライアントは、当該ビデオクライアント自身の測定値に基づいて、持続可能な最高の品質レベルを推定し、この持続可能な最高の品質レベルにおいてビデオアイテムを要求する。2つの連続した切り替え時間の間の間隔は、ビデオセグメントと呼ばれる。当該間隔に対応するビット列は、 − 品質バージョンと同数のビット列が存在することに留意されたい − チャンクと呼ばれる。換言すれば、ビデオクライアントは、利用可能なネットワークスループット、より具体的には、伝送制御プロトコル(TCP)によって提供されるスループットを監視し、次のビデオセグメントのビデオビットレートを、当該ビデオセグメントを特定の品質で配信することを要求することによって、利用可能なネットワークスループットに一致させようと試みる。要求されるビットレートは、利用可能なビットレートと厳密には一致し得ないため、ビデオクライアントは、プレイアウトバッファを維持して、プレイアウトの休止又は中断を回避する必要がある。
従来のHTTP適応ストリーミングの場合において、各セグメントは、プレイアウトのために利用可能な品質レベル及び必要とされるセグメントの観点からビデオアイテムを記述するマニフェストファイルと共に、HTTPサーバを通じて利用可能となる。ビデオクライアントは、HTTPサーバからのマニフェストファイルを要求することによって、プレイアウトを開始する。その後、ビデオクライアントは、各セグメントについてHTTP−GET要求を送信することによって、ビデオセグメントをダウンロードし始める。所望の品質は、HTTP−GET要求において各ビデオセグメントについて指定される。ビデオクライアントは、各要求されたビデオセグメントの品質レベルを自律的に決めるクライアントヒューリスティックを組み入れている。クライアントヒューリスティックによる品質の選択は、本明細書において上述されたような、監視された利用可能なネットワークのスループットに基づくが、例えば、ディスプレイサイズ、サポートされるデコーダ及びクライアント装置の処理能力、並びにクライアントにおけるバッファの充填レベルなどの進行中のセッションに関連する付加的な情報等、クライアント端末の仕様のような他のパラメータを反映してもよい。
多くの場合、ビデオアイテムの2つの品質バージョン間の切り替えは、視聴者にとってあまりにも顕著な品質におけるジャンプ、あまりにも明白なビットレートにおけるジャンプ、及びあまりにも大きく、その結果、クライアントのヒューリスティックを再度切り替えさせる、プレイアウトバッファの充填レベルにおける変動につながる。2つの隣接する品質バージョンの場合でさえ、より高い品質/ビットレートのバージョンは、利用可能なネットワークのスループットを大きく超えることがある一方で、より低い品質/ビットレートのバージョンは、当該スループットに及ばないことがある。結果として、ビデオクライアントのアルゴリズムは、2つの隣接する品質バージョン間であまりにも頻繁に切り替わり、不快な品質のジャンプ及び視聴者体験につながる。
上記に定義された問題のための直接的な解決策は、ビデオアイテムのより多くの品質バージョンを予見することと、それに応じてビデオクライアントの知能を増加させて、切り替えるビットレートの粒度を洗練することとから成る。しかしながら、この解決策は、各ビデオアイテムのより多くの品質バージョンが、ビデオオンデマンド(VoD)の状況では、ビデオサーバ及び中間ノードにおける、より多くの記憶容量を必要とし、又はライブストリーミングの状況では、ビデオクライアントがサービスを提供されるノードへのより高いネットワーク伝送容量を必要とするという不都合を有する。
必要とされる記憶容量及び伝送容量の増加が回避される異なる解決策では、トランスコーディングが、ビデオサーバ又は中間CDNノードにおいて実施され得る。デコーディング及びエンコーディングを通じて、そのようなトランスコーディング機能は、クライアントによって要求される場合、既存のものから新しい品質バージョンを構築し得る。しかしながら、トランスコーダを有する異なる解決策は、当該トランスコーダにおけるデコーディング及びエンコーディングを可能にするために、ビデオサーバ及び中間CDNノードにおける処理能力の実質的な増加を必要とする。
本発明の目的は、ビデオサーバ及びCDNノードについての必要とされる記憶容量又は処理能力に実質的に影響を及ぼすことなく、且つ、必要とされるネットワーク転送容量に影響を及ぼすことなく、従来の適応ストリーミングにおけるビットレート、バッファ充填レベル及び品質における高い変動の上記に定義された技術的問題を解決する適応ストリーミングアウェア(aware)ネットワークノード、適応ストリーミングアウェアクライアント、及びビデオエンコーダを開示することである。
本発明によれば、上記に定義された目的は、ビデオアイテムのビデオセグメントをクライアントへストリーミングすることが可能な、請求項1によって定義される適応ストリーミングアウェアネットワークノードによって実現され、ビデオアイテムは、複数の品質バージョンにおいて利用可能であり、複数の品質バージョンは、同じ画像アスペクト比を有し、複数の品質バージョンにおける対応するビデオスライスは、等しい画像部分についてのビット列を含むように前処理され、当該適応ストリーミングアウェアネットワークノードは:
− ビデオアイテムのビデオセグメントについてのクライアントからの要求を受信及び解釈するための要求受信手段であって、当該要求は、任意の要求される品質を指定する、要求受信手段と、
− 任意の要求される品質に一致する割合で複数の品質バージョンからビデオセグメントについてのビデオスライスを比例的に選択するためのスライス選択手段と、
− 比例的に選択されたビデオスライスから成るビデオセグメントをクライアントへストリーミングするためのストリーミング手段と、
を備える。
従って、本発明は、ビデオサーバ又は中間ノード内のメカニズムにおいて、要求されたビデオセグメントについて、クライアントによって要求された如何なる任意の品質のビット列又はチャンクも構築することを予期する。ビット列は、要求される任意の品質/ビットレートに一致することを可能にする量又は比で既存の品質バージョンのビデオスライスを選ぶことによって構築される。そのようなビデオスライスは、独立して復号され得るマクロブロックのセットである。マクロブロックは、例えば、16×16画素の基本ブロックである。ビデオスライスに対応するビット列は、ネットワーク適合層(NAL:Network Adaptation Layer)ユニットと呼ばれる。従って、本発明は、所望の任意の品質レベル、典型的には、そのNALユニットが選択され、比例的に組み合わされた複数の品質バージョンの中間の品質レベルに一致又は近似する、要求されたビデオセグメントについてのチャンクを構築するために、例えば、ビデオアイテムの2つの隣接する品質バージョンからNALユニットをインテリジェントに選択する。
本発明によるノードは、利用可能な品質バージョンにおけるビデオスライスを利用するため、デコーディング及びエンコーディングはNALユニット選択処理において必要とされず、その結果、ビデオサーバ及び/又はCDNノードにおける必要とされる処理能力が悪影響を受けない。ビデオアイテムの付加的な品質バージョンは予期及び記憶されないため、ビデオサーバ及びCDNにおいて必要とされる全体的な記憶容量、並びに全体的なネットワーク伝送容量も影響を受けない。
品質の劣化を回避するために、ビデオスライス又はNALユニットは、好適には、独立して、即ち、現在復号されるビデオスライス又はNALユニットとは異なるビデオアイテムの品質/ビットレートのバージョンから選択されている可能性がある、過去に復号されたビデオセグメントのNALユニットに依拠することなく、復号され得る。独立し復号され得るNALユニットを有するために、ビデオアイテムの異なる品質バージョンにおけるビデオスライスは、等しい画像部分についてのビット列、即ち、画像内の同じ領域を表すビット列を含むように前処理されることが必要である。換言すれば、スライスはビデオセグメントによって異なり得るが、ビデオスライスは、異なる品質バージョンにわたって揃えられなければならない。下記により詳細に説明されるように、等しい動きベクトルは、異なる品質バージョンの対応するビデオフレームにおいて符号化されること、及び、異なる品質バージョンにおけるフレームモードの遷移は同期されることが、さらに好適である。異なる品質バージョンが同じ画像アスペクト比、即ち、同じ幅/高さのアスペクト比、例えば、4:3又は16:9を有することは、本発明についてのさらなる必要条件である。
請求項2によって定義される、本発明による適応ストリーミングアウェアネットワークノードの第1の実施形態では、スライス選択手段が、ビデオアイテムの第1の品質バージョン及び第2の品質バージョンから、任意の要求される品質/ビットレートに一致するように決定されたそれぞれの確率で、ビデオスライスをランダムに又は疑似ランダムに選択するように構成される。
従って、第1の実施形態において、ビデオスライスは、ビデオアイテムの第1の品質バージョンからは確率Pで、第2の品質バージョンからは確率1−Pで、ランダムに又は疑似ランダムに選ばれる。第1の品質バージョン及び第2の品質バージョンは、典型的には、第1の品質バージョンが任意の要求される品質よりも低い品質/ビットレートを有し、第2の品質バージョンが当該任意の要求される品質よりも高い品質/ビットレートを有する、連続する品質バージョンである。Pは、第1の品質/第1のビットレートのスライスと第2の品質/第2のビットレートのスライスとの比が、任意の要求される品質に一致又は近似することを可能にするように決定される。
請求項3によって定義される、本発明による適応ストリーミングアウェアネットワークノードの第2の実施形態では、スライス選択手段が、ビデオアイテムの第1の量のビデオスライスを第1の品質バージョンから、ビデオアイテムの第2の量のビデオスライスを第2の品質バージョンから選択するように構成され、当該第1の量及び第2の量は、任意の要求される品質に一致するように決定される。
従って、第2の実施形態において、ビデオスライスは、ビデオアイテムの第1の品質バージョン及び第2の品質バージョンから決定論的手法で選ばれる。ここでも、第1の品質バージョン及び第2の品質バージョンは、典型的には、第1の品質バージョンが任意の要求される品質よりも低い品質/ビットレートを有し、第2の品質バージョンが当該任意の要求される品質よりも高い品質/ビットレートを有する、連続する品質バージョンである。第1の品質/第1のビットレートのスライスと第2の品質/第2のビットレートのスライスとの比は、任意の要求される品質に一致又は近似するように決定される。
請求項4によって定義される、本発明による適応ストリーミングアウェアネットワークノードの第3の実施形態では、スライス選択手段が、第1の意味論的意味を有する第1の量のビデオスライスを第1の品質バージョンのビデオアイテムから、第2の意味論的意味を有する第2の量のビデオスライスを第2の品質バージョンのビデオアイテムから選択するように構成され、当該第1の量及び第2の量は、任意の要求される品質に一致するように決定される。
従って、第3の実施形態において、ビデオスライスは、ビデオアイテムの第1の品質バージョン及び第2の品質バージョンから決定論的手法でも選ばれる。ここでも、第1の品質バージョン及び第2の品質バージョンは、典型的には、第1の品質バージョンが任意の要求される品質よりも低い品質/ビットレートを有し、第2の品質バージョンが当該任意の要求される品質よりも高い品質/ビットレートを有する、連続する品質バージョンである。第3の実施形態において、例えば、前景スライスのような、主観的な品質体験により大きな影響を有するスライスは、第2のより高い品質/ビットレートのバージョンから選択されるのに対して、例えば、背景スライスのような、主観的な品質体験により低い影響を有するスライスは、第1のより低い品質/ビットレートのバージョンから選ばれる。換言すれば、スライスの意味論的意味は、どのスライスを第1のバージョンから選び、どのスライスを第2のバージョンから選ぶかを決定する際に考慮される。第1の品質/第1のビットレートのスライスと第2の品質/第2のビットレートのスライスとの比は、任意の要求される品質に一致又は近似するように決定される。
本発明による適応ストリーミングアウェアネットワークノードの第4の実施形態では、前記ビデオアイテムの第1の品質バージョンと第2の品質バージョンとが、有理数N’/Nだけ異なる解像度を有し、前記第1の品質バージョンにおけるN×N四方のマクロブロック、及び前記第2の品質バージョンにおける対応するN’×N’四方のマクロブロックについて、実質的に等しいコーディング決定が採用される。本発明の文脈において、第1の画像におけるマクロブロックのセットと第2の画像におけるマクロブロックのセットとの双方のセットが画像の表面領域の同じ一部をカバーする場合、第1の画像におけるマクロブロックのセット(それぞれスライスである)は、第2の画像におけるマクロブロックのセット(それぞれスライスである)に対応すると言われる。第4の実施形態におけるスライス選択は、第1、第2又は第3の実施形態と同様に実施され得る。
従って、第4の実施形態において、2つの品質バージョンは、有理数だけ異なる解像度を有すると仮定される。双方の解像度におけるスライス構造は、異なる解像度におけるスライスが双方の解像度において画像の表面領域の同じ一部をカバーするという意味で対応するようにやはり選択される。さらに、第1の品質バージョンにおけるN四方のマクロブロックの一部を形成するマクロブロック、及び第2の品質バージョンにおけるN’四方のマクロブロックの一部を形成する対応するマクロブロックについては、実質的に等しいコーディング決定が採用され、例えば、動きベクトルは、できる限り同様のものが選択され、モード選択は、これら全てのマクロブロックについて同じものが選択されるように、エンコーディング処理は、第4の実施形態において制限される。これにより、第1の実施形態と同様に、即ち、確率Pでランダムに、第2の実施形態と同様に、即ち、部分的に決定論的手法で、又は、第3の実施形態と同様に、即ち、スライスの意味論的意味を考慮に入れてすることができる、NALユニット選定処理からの歪みがより少なくなるという結果になる。
請求項1によって定義されるような適応ストリーミングアウェアネットワークノードに加えて、本発明は、請求項6によって定義されるような、ビデオアイテムのビデオセグメントをクライアントへストリーミングするための対応する方法に関連し、ビデオアイテムは、複数の品質バージョンにおいて利用可能であり、複数の品質バージョンは、同じ画像アスペクト比を有し、複数の品質バージョンにおける対応するビデオスライスは、等しい画像部分についてのビット列を含むように前処理され、当該方法は、
− ビデオアイテムのビデオセグメントについてのクライアントからの要求を受信及び解釈するステップであって、当該要求は、任意の要求される品質を指定する、受信及び解釈するステップと、
− 任意の要求される品質に一致する割合で複数の品質バージョンからビデオセグメントについてのビデオスライスを比例的に選択するステップと、
− 比例的に選択されたビデオスライスから成るビデオセグメントをクライアントへストリーミングするステップと、
を含む。
請求項7によって定義されるように、本発明は、同じ画像アスペクト比を有する複数の品質バージョンにおけるビデオアイテムのビデオセグメントを符号化することが可能な適応ストリーミングビデオエンコーダにさらに関与し、当該適応ストリーミングビデオエンコーダは、複数の品質バージョンの対応するビデオスライスにおいて、等しい画像部分についてのビット列を符号化するように構成される。
実際には、本発明は、ビデオアイテムの複数のバージョンのビデオスライスを組み合わせて、任意の要求される品質に近似させるため、異なるバージョンにおける対応するビデオスライスは、当該ビデオアイテム内の画像の同じ領域を表さなければならない。ビデオスライスによって表される領域は、任意の形状とすることができ、フレームによって変わり得るが、エンコーダは、ビデオアイテムの全てのバージョンにおける対応するスライスが、同じ画像部分又は表面領域についてのビット列又はチャンクを含むような手法で、異なるバージョンを前処理しなければならない。換言すれば、ビデオアイテムの異なる品質バージョンのスライス間には、1対1のマッピングが存在しなければならない。さもなければ、ビデオアイテムの複数のバージョンから選ばれるスライスの任意の選択は、完全な画像又はフレームを表さないであろう。
請求項8によって定義される随意的な態様によれば、本発明による適応ストリーミングビデオエンコーダは、複数の品質バージョンの対応するビデオフレームにおいて、等しい動きベクトルを使用するようにさらに構成され得る。
異なるバージョンは、Iフレーム、又は、独立して、即ち、より早期に受信されたフレームを使用せずに、復号され得るフレームを含む。ビデオスライスは異なるバージョン間で揃えられるため、Iフレームも揃えられる。他のタイプのフレーム、即ち、Pフレーム又はBフレームは、復号されるために、より早期に受信されたフレームからの情報を使用する。必要とされる、より早期に受信されたフレームは、フレームを伴い、当該より早期に受信されたフレームにおける画素値を指し示す動きベクトルによって参照される。本発明を実施する場合、即ち、複数の品質バージョンからビデオスライスを選択する場合、エンコーディング上の制限は、好適には、異なるバージョンの対応するPスライス及びBスライスにおいて、(考慮された品質バージョンの双方の解像度間のスケーリングファクタを考慮に入れて)動きベクトルが同一とされることである。これにより、ビデオアイテムの異なる品質バージョンからの対応するスライスが異なる動きベクトルを含んでおり、その結果として、より早期に受信されたフレームにおいて参照される画素が、選択されたスライスに依存する状況と比較して、ノイズが低減される。
請求項9によって定義される別の随意的な態様によれば、本発明による適応ストリーミングビデオエンコーダは、複数の品質バージョンにおけるフレームモードの遷移を同期させるようにさらに構成され得る。
実際には、Pフレームについて容認可能な動きベクトルを見つけることができない場合、例えば、より早期に受信されたフレームからの情報を新たなフレームを生成/復号するために使用することができないシーン変化の場合において、フレームは、独立して復号され得るIフレームとして符号化される。そのようなフレームモード変化又はフレームモード遷移も、好適には、本発明が適用される場合にノイズを低減するために、異なる品質バージョンにわたって調整される。
請求項7によって定義されるような適応ストリーミングビデオエンコーダに加えて、本発明は、同じ画像アスペクト比を有する複数の品質バージョンにおけるビデオアイテムのビデオセグメントを符号化するための対応する方法にも関連し、当該方法は、複数の品質バージョンの対応するビデオスライスにおいて、等しい画像部分についてのビット列を符号化するステップを含む。この方法は、請求項10によって定義される。
本発明は、請求項11によって定義されるような、ビデオアイテムのビデオセグメントを要求し、受信し、復号することが可能な適応ストリーミングアウェアクライアントにもさらに関連し、ビデオアイテムは、複数の品質バージョンにおいて利用可能であり、複数の品質バージョンは、同じ画像アスペクト比を有し、複数の品質バージョンにおける対応するビデオスライスは、等しい画像部分についてのビット列を含むように前処理され、当該適応ストリーミングアウェアクライアントは、
− ビデオアイテムのビデオセグメントについての要求を生成するための要求生成手段であって、当該要求は、複数の品質バージョンのうちのいずれとも一致しない任意の要求される品質を指定する、要求生成手段
を備える。
従って、本発明による適応ストリーミングアウェアクライアントは、如何なる任意の品質のビデオセグメントも要求することが可能とされる。当該適応ストリーミングアウェアクライアントは、もはやマニフェストファイル内に列挙される品質バージョンに制限されず、如何なる中間品質におけるビデオセグメントも配信するように要求することができる。中間バージョンは、本発明によるサーバによって、要求される任意の品質レベルに近似するような相対的比率で、異なる既存の品質バージョンからスライスを選ぶことによって、構築される。クライアントは、監視されたスループット、プレイアウトバッファの充填レベル、及び最終的な他のパラメータに応じて、要求される品質レベルを決定し、もはや算出された所望の品質レベル/ビットレートをマニフェストファイル内に列挙された最も近い利用可能な品質レベルにマッピングする必要はない。
請求項12によって定義される、本発明による適応ストリーミングアウェアクライアントのさらなる実施形態において、当該クライアントは:
− 複数の品質バージョンにおけるビデオアイテムのビデオスライスの利用可能性を記述するマニフェストファイルを受信及び解釈するためのマニフェストファイル受信手段と、
− ビデオセグメントにおける各ビデオスライスについての要求される品質バージョンを選択するための各スライス品質選択手段であって、当該要求される品質バージョンは、任意の要求される品質に一致する割合で複数の品質バージョンから比例的に選択される、各スライス品質選択手段と、
をさらに備え、
− 要求生成手段が、各ビデオスライスについて要求される品質バージョンを指定する要求を生成するように構成される。
従って、任意の中間品質レベルに近似させるために、異なる品質バージョンからビデオスライスを比例的に選択するためのインテリジェンスが、サーバの代わりにクライアントに統合される本発明の実施形態が予期される。そのようなクライアントは、各ビデオスライスについて、品質レベルを指定する要求を送信しなければならない。そうすることが可能であるために、クライアントは、各ビデオスライスが利用可能な品質レベルを熟知していなければならない。この情報は、マニフェストファイルにおいて指定され得る。各ビデオスライスについて品質バージョンを選択するために、クライアントは、本発明のサーバの実施について上述されたものと同様のアルゴリズムを適用し得る:スライスは、確率を使用して、異なる品質バージョンから比例的に選択されてもよいし、スライスは、決定論的な様式で、異なる品質バージョンから比例的に選択されてもよいし、又は、当該スライスは、それらの意味論的意味を考慮に入れて、異なる品質バージョンから選択されてもよい。
請求項11によって定義されるような適応ストリーミングアウェアクライアントに加えて、本発明は、請求項13によって定義されるような、ビデオアイテムのビデオセグメントを要求し、受信し、復号するための対応する方法にも関連し、ビデオアイテムは、複数の品質バージョンにおいて利用可能であり、複数の品質バージョンは、同じ画像アスペクト比を有し、複数の品質バージョンにおける対応するビデオスライスは、等しい画像部分についてのビット列を含むように前処理され、当該方法は:
− ビデオアイテムのビデオセグメントについての要求を生成するステップであって、当該要求は、複数の品質バージョンのうちのいずれとも一致しない任意の要求される品質を指定する、生成するステップ
を含む。
従来技術による、HASサーバとHASクライアントとの間の適応ビデオストリーミングの図である。 本発明によるHASエンコーダによる前処理を例示する図である。 本発明による、HASサーバとHASクライアントとの間の適応ビデオストリーミングの図である。 本発明によるHASアウェアサーバの実施形態における、ビデオスライスの意味論的意味ベースの選択を例示する図である。
図1は、従来技術による適応ストリーミングの技術的問題を例示する。図1Dは、ビデオアイテムが提示される2つの隣接する品質レベル116及び117を示す。HASサーバ101は、HASクライアント103に、品質レベル116及び117の存在を、いわゆるマニフェストファイルを介して通知する。幾つかの連続するビデオセグメントの期間中のこれらの品質レベル116及び117の各々に関連付けられるビットレートは、図1Aに描かれており、それぞれ111及び112と参照される。HASクライアントは、ネットワーク102内の利用可能な帯域幅又はビットレートを推定する。推定された利用可能な帯域幅は、図1Bにおいて113と参照される。HASクライアント103は、次いで、推定された利用可能な帯域幅113に応じて、それぞれの品質レベルにおける連続するビデオセグメントを要求することによって、ビットレート114を利用可能なビットレート113に一致させようと試みる。この要求される品質レベル118は、図1Eによって例示される。
従来技術において、116及び117のような2つの隣接する品質バージョン間の切り替えは、多くの場合、あまりに粗い。これは、あまりに顕著な118における品質のジャンプ、及びあまりに明白なビットレート114におけるジャンプを引き起こす。上記2つのうちのより高いビットレートのバージョン116は、利用可能なネットワークスループットを大きく超える一方で、当該2つのうちのより低いビットレートのバージョン117は、それに及ばない。これは、HASクライアント103に要求される品質レベルをあまりに頻繁に切り替えさせる、ビデオプレイアウトバッファの大きな変動を引き起こす。
本発明は、ビデオアイテムの異なる品質バージョンにおける対応するマクロブロックのセット又は対応するビデオスライスのために行われるある決定が同様であるように、適応ストリーミングのために複数の品質バージョンにおいて利用可能とされるビデオアイテムのエンコーディング処理を制限する。これは、図2によって例示されており、以下の段落においてさらに説明されるであろう。
1つの品質バージョンにおけるビデオスライスと別の品質バージョンにおけるビデオスライスとの双方のスライスが対応するマクロブロックの同じセットを含む場合、1つの品質バージョンにおけるビデオスライスは、ビデオアイテムの別の品質バージョンにおけるビデオスライスに対応する。これは、ビデオスライスが双方の品質バージョンにおける同じ関連する表面領域をカバーする場合に当てはまる。異なる品質バージョンにおける対応するスライスは対応するマクロブロックを含む必要があるという事実の他に、付加的な制限はない。ビデオスライスは、任意の形状とすることができ、フレームによって変わり得る。例えば、図2において、ビデオアイテムのi番目の品質バージョンにおけるフレーム201は、画像表面領域の上半分と下半分とをそれぞれカバーする第1のスライス211と第2のスライス212とを含む。第1のスライス211において、マクロブロックのセット213及び214が描かれている。同じビデオアイテムの(i+1)番目の品質バージョンにおける対応するフレーム202は、フレーム201におけるスライス211及び212にそれぞれ対応する第1のスライス221及び第2のスライス222を含む。ビデオスライス221及び222も、それぞれ画像表面領域の上半分と下半分とをカバーする。ビデオスライス221において、フレーム201におけるマクロブロックのセット213及び214にそれぞれ対応するマクロブロックのセット223及び224が描かれている。別の例において、第1のスライスは、例えば、(フレームの上半分の代わりに)前景をカバーし、別のスライスは、例えば、(フレームの下半分の代わりに)背景をカバーし得る。前景及び背景は、フレーム毎に展開し、その結果、スライスによってカバーされる表面領域もフレーム毎に展開し得る。
異なる品質バージョンのアスペクト比、即ち、異なる品質バージョンにおける画像又はフレームの高さ/幅の割合は、同じであると仮定される。さらに、(k,l)及び(k’,l’)は、それぞれビデオアイテムのi番目及び(i+1)番目の品質バージョンにおけるあるマクロブロックの座標であるとさらに仮定される。そのようなマクロブロックは、画素の基本ブロックであり、例えば、4:2:0の画像シーケンスにおける16×16四方のルマサンプル及び2つの対応する8×8のクロマサンプルから成る。i番目の品質バージョンにおける画素の座標(k,l)と(i+1)番目の品質バージョンにおける画素の座標(k’,l’)が、関係:k/N=k’/N’=k’’及びl/N=l’/N’=l’’に従い、ここで、当該対応に関連付けられるペア(k’’,l’’)は、双方のバージョンにおける画像又はフレームの全表面領域の同じ一部をカバーする領域を指定する場合、i番目の品質バージョンにおけるNのマクロブロックのセットは、(i+1)番目の品質バージョンにおけるN’のマクロブロックのセットに一致する。ここで、N/N’は、ビデオアイテムのi番目と(i+1)番目の品質バージョンの解像度の割合を表し、ただし、NとN’とは互いに素であり、即ち、NとN’とは公約数を持たない整数値である。RS<RSi+1、ただし、RSはi番目の品質バージョンの解像度であり、RSi+1は(i+1)番目の品質バージョンの解像度であると、さらに仮定される。
対応するマクロブロック及びスライスの上記の定義は、N=2とN’=3の場合について図2に例示される。例えば、i番目の品質バージョンのフレーム201における座標(0,0)、(0,1)、(1,0)及び(1,1)を有するマクロブロックのセット213は、(i+1)番目の品質バージョンのフレーム202における座標(0,0)、(0,1)、(0,2)、(1,0)、(1,1)、(1,2)、(2,0)、(2,1)及び(2,2)を有するマクロブロックのセット223に一致する。異なる品質バージョンが同じ解像度である場合、即ち、N=N’の場合、対応するマクロブロックは、同じ座標を有するマクロブロックである。
要約すれば、本発明は、ビデオアイテムの異なる品質バージョン間の対応するスライスの1対1のマッピングが存在するように、スライス構造が選択されることを必要とする。特に、異なる品質バージョンにおけるスライスは、対応しなければならない。
HASにおいては、各チャンクの最初のフレームがIDR即ちInstantaneously Decoded Refreshフレームであることが好適であることにさらに留意されたい。そのようなフレームは、Iスライスから構成される必要がある。なぜならば、切り替え点において、即ち、セグメントエッジにおいて、フレームは、以前のフレームを参照せずに復号可能であることが必要であるためである。これは、どのバージョンのフレームがクライアントにおいて利用可能となるかが確かではないためである。
本発明の実施は、図3によって例示される。サーバ301は、図3Dにおける品質316及び317をそれぞれ有する2つの隣接する品質バージョンのNALユニット又はスライスを選ぶ。アクセスユニットkの各スライスm(m=1...M)について、 − アクセスユニットは、1つの画像を復号するために必要とされるビット列を表す − 隣接する品質バージョン316及び317における2つの対応するNALユニットのうちのどちらが選択されるかが決められなければならない。この選択処理は、ランダムとするか、又は、下記の異なる実施形態を参照して説明されるように、ある規則によって行われることができる。第1の品質バージョン316から選択されるNALユニット/スライスと、第2の品質バージョン317から選択されるNALユニット/スライスとの割合は、ネットワーク302内で監視されるスループットに照らして、クライアント303によって要求される品質によって決定される。この監視されたスループット又は帯域幅は、図3Bにおいて313と参照されるのに対して、連続したビデオセグメントの期間中の品質バージョン316及び317に対応するビットレートは、図3Aにおいて311及び312と参照される。従って、マニフェストファイルにおいて、公称ビットレートR及びRi+1(ただし、R<Ri+1)を有する2つの品質/ビットレートのバージョンが告知されることが仮定される。これらの品質バージョンは、それぞれ対応する品質Q又は317及びQi+1又は316を有する。サーバ301による中間チャンクの構築は、各スライスについて公称ビットレートRi+1を有するバージョンからのNALユニット、又は公称ビットレートRiを有するバージョンから対応するNALユニットを選ぶことから成る。NALユニットの一部分Pが第1の品質バージョン316から選択され、一部分(1−P)が第2の品質バージョン317から選択される場合、公称ビットレートP・Ri+1+(1−P)・Rを有するチャンクが構築され、対応する品質は、P・Qi+1+(1−P)・Qに近くなるであろう。サーバ301は、2つの隣接するビットレートRとRi+1との間の任意の公称ビットレートRを得ることができるように、パラメータPを決定する。これは、図3C及び図3Eによって例示される。クライアント303は、監視されたスループット313に照らして、任意の品質/ビットレートを要求する。サーバ301は、要求されたビデオセグメントを、要求された任意の品質/ビットレートに近似する品質/ビットレートで配信するために、パラメータPを決定する。あるビデオセグメントは、第1の品質バージョンのビットレート311と第2の品質バージョンのビットレート312との間のビットレート320で配信される。このビデオセグメントはまた、第1の品質レベル316と第2の品質レベル317との間の品質321で配信される。結果として、品質レベル間で粗い遷移が行われず、ビットレートにおけるジャンプが行われない。
本発明の第1の実施形態において、ビデオアイテムの2つの品質バージョンは同じ解像度を有すると仮定され、スライス/チャンクの選択処理はランダムである。この実施形態では、N=N’=1であり、対応するスライスは、同じマクロブロックを含む。エンコーディング上の制限は、対応するPスライス及びBスライスにおいて、動きベクトルが再利用され、全ての対応するマクロブロックにおけるモード決定、即ち、マクロブロックがタイプI、P若しくはBであるか否か、又はどのようにマクロブロックをより小さなブロックに分割するか、...ができる限り一貫して選択される、というものである。実際には、量子化の方法の決定のみが双方の対応するスライスにおいて異なる。対応するスライス(k=1...K及びm=1...M)の各々について、2つのバージョンのうちの1つが、(i+1)番目の品質バージョンから確率Pでランダムに選ばれる。Pスライス又はBスライスに関連付けられたNALユニットは、一方の品質バージョンから選択され得る一方で、他方の品質バージョンから選択されたNALユニットに基づいて復号されたフレームをその動きベクトルを介して指し示すため、わずかな品質低下の可能性がある。この特定のスライスの残差信号はエンコーダ内の残差信号と異なるため、付加的な歪みが存在するであろう。しかしながら、上記の規則に従う場合、この歪みは小さくなる。選択されたモードは対応するマクロブロックについて同じである必要があるという要件は緩和され得るが、これにより、新たに構築されるチャンクにおいて付加的な歪みが導入されるであろう。
本発明の第2の実施形態において、2つの品質のバージョンは、同じ解像度を有するものとここでも仮定され、選択処理は、品質における漸進的な増加又は減少を目指す。この第2の実施形態において、エンコーディング上の制限は第1の実施形態のものと同一であるが、NALユニット選択処理が異なる。ビットレートの漸進的な増加又は減少も同様に実施される。以下においては、漸進的な減少のみが詳細に説明される。各アクセスユニットk(k=1...K)は、NALユニット選択処理期間中に、表示順に1つずつアクセスされる。k番目のアクセスユニット(m=1...M)の各NALユニットは、確率P=1−(k−1)/(K−1)で(i+1)番目の品質バージョンから選ばれる。このランダムな選択処理は、部分的に決定論的なものによって置換され得る。各々10個のスライスを含む、11個のアクセスユニットがチャンク内に存在すると想定すると、最初のアクセスユニット内の全てのNALユニットは、(i+1)番目の品質バージョンから選ばれ得る。その次のアクセスユニットでは、9個から10個のNALユニットが(i+1)番目の品質バージョンから選ばれ、その次のものでは、8個から10個のNALユニットが(i+1)番目の品質バージョンから選ばれる等である。
本発明の第3の実施形態において、2つの品質のバージョンは、同じ解像度を有するものとここでも仮定され、選択処理は、スライスの重要性に依存する。この第3の実施形態において、エンコーダの制限は、ここでも第1の実施形態のものに等しいが、NALユニット選択処理が異なる。画像において、スライスは、品質バージョンを選択するために使用されることができる意味論的意味を有するものと仮定される。例えば、図4に例示されるように、前景のスライス及び背景のスライスがあり得る。i番目の品質バージョンにおいて、画像401は、背景画素の第1のスライス411と前景画素の第2のスライス412とを有し得る。(i+1)番目の品質のバージョンにおいて、対応する画像402は、背景画素の対応する第1のスライス421と前景画素の対応する第2のスライス422とを有する。i番目の品質のバージョンにおける対応するチャンクは、NALユニット431及び432を含む。同様に、(i+1)番目の品質のバージョンにおける対応するチャンクは、NALユニット441及び442を含む。新たに構築されるスライス/チャンクにおいて、最高品質のNALユニット442が各前景スライスについて選ばれる一方で、背景スライスについては、要求される中間の品質と一致するように尊重されるべき第1の品質レベルのスライス/第2の品質レベルのスライスの割合が必要とする範囲で、最低品質のNALユニット431が選択される。ビデオアイテムの複数の品質バージョンからのスライスの意味論的意味ベースの選択が、第2の実施形態2に関連して本明細書において上述されたような、品質を漸進的に増加又は低下させるための技術と組み合わせられ得ることは明らかである。
第4の実施形態において、2つの品質のバージョンは、有理数だけ異なる解像度を有すると仮定される。双方の解像度におけるスライス構造は、異なる解像度におけるスライスが一致するように選択される。さらに、(ビットレートRの)i番目の品質バージョンにおけるN四方のマクロブロックの一部を形成するマクロブロック、及び(ビットレートRi+1の)(i+1)番目の品質バージョンにおけるN’四方のマクロブロックの一部を形成する対応するマクロブロックについて、できる限り同様のコーディング決定が採用され、例えば、動きベクトルは、できる限り同様のものが選択され、モード選択は、これら全てのマクロブロックについて同じものが選択されるように、エンコーディング処理は制限される。より多くの決定が共通して行われるほど、本発明によるNALユニット選定処理に由来する歪みは少なくなるが、コーデックは、最適なレート歪曲線から大きく逸れるであろう。NALユニット選択処理は、第1の実施形態と同様に、即ち、確率Pによりランダムに、第2の実施形態と同様に、即ち、決定論的手法で、又は、第3の実施形態と同様に、即ち、スライスの意味論的意味を考慮に入れてすることができる。
本発明は、特定の実施形態を参照することによって例示されてきたが、本発明が前述の例示的な実施形態の詳細に限定されないこと、及び、本発明がその範囲から逸脱することなく様々な変更及び変形と共に具現化され得ることは、当業者には明らかであろう。そのため、本実施形態は、あらゆる点において例示のためのものであって、制限するものではないとみなされるべきであり、本発明の範囲は、前述の説明によってではなく、むしろ添付の特許請求の範囲によって示され、そのため、特許請求の範囲と均等の意味及び範囲内に収まる全ての変更は、当該意味及び範囲内に包含されることが意図される。換言すれば、基本的な原理の範囲内に入り、且つ、それらの本質的な属性が本特許出願において請求項に記載されている任意及び全ての変形、バリエーション又は均等物をカバーすることが予期される。さらに、「comprising(備える、含む)」又は「comprise(備える、含む)」という用語は他の要素又はステップを排除しないこと、「a」又は「an」という用語は複数を排除しないこと、及びコンピュータシステム、プロセッサ、又は別の一体化されたユニットなどの単一の要素が、特許請求の範囲において記載される幾つかの手段の機能を実現し得ることが、本特許出願の読者によって理解されるであろう。特許請求の範囲における如何なる参照符号も、関与するそれぞれの請求項を限定するものとして解されるべきではない。「第1の」、「第2の」、「第3の」、「a」、「b」、「c」等の用語は、明細書又は特許請求の範囲において使用される場合、同様の要素又はステップ間を区別するために導入され、必ずしも順序又は時系列を記載するわけではない。同様に、「上部(top)」、「底部(bottom)」、「上に(over)」、「下に(under)」等の用語は、記述的な目的のために導入され、必ずしも相対的な位置を表すために導入されるわけではない。そのように使用される用語は適当な状況下では互換可能であり、本発明の実施形態は、他の順序において、又は上記に記載され若しくは例示された(1つ又は複数の)配向とは異なる配向において、本発明に従って動作することが可能であることが理解されるべきである。

Claims (8)

  1. ビデオアイテムのビデオセグメントをクライアント(303)へストリーミングすることが可能な適応ストリーミングアウェアネットワークノード(301)であって、前記ビデオアイテムは、複数のフレームを有し、各フレームは複数のビデオスライスを有し、前記ビデオアイテムは、複数の品質バージョン(316、317)において利用可能であり、前記複数の品質バージョン(316、317)は、同じ画像アスペクト比を有し、前記複数の品質バージョン(316、317)における対応する各フレームの対応するビデオスライス(411、421;412、422)は、等しい画像部分についてのビット列を含むように前処理される、適応ストリーミングアウェアネットワークノード(301)において、
    前記ビデオアイテムのビデオセグメントについての前記クライアント(303)からの要求を受信及び解釈するための要求受信手段であって、前記要求は、任意の要求される品質を指定する、要求受信手段と、
    前記ビデオセグメントについて、前記任意の要求される品質に一致する割合で前記複数の品質バージョン(316、317)の前記対応する各フレームからビデオスライス(431、442)を比例的に選択するためのスライス選択手段と、
    各々の新たなフレームが比例的に選択された前記ビデオスライス(431、442)から成る、複数の該新たなフレームにより構成される前記ビデオセグメントを前記クライアント(303)へストリーミングするためのストリーミング手段と、
    を備える、適応ストリーミングアウェアネットワークノード(301)。
  2. 前記スライス選択手段が、前記ビデオアイテムの第1の品質バージョン(317)及び第2の品質バージョン(316)から、前記任意の要求される品質に一致するように決定されたそれぞれの確率で、ビデオスライス(431、442)をランダム又は疑似ランダムに選択するように構成される、
    請求項1に記載の適応ストリーミングアウェアネットワークノード(301)。
  3. 前記スライス選択手段が、前記ビデオアイテムの第1の量のビデオスライス(431)を第1の品質バージョン(317)から、前記ビデオアイテムの第2の量のビデオスライス(442)を第2の品質バージョン(316)から選択するように構成され、前記第1の量及び前記第2の量は、前記任意の要求される品質に一致するように決定される、
    請求項1に記載の適応ストリーミングアウェアネットワークノード(301)。
  4. 前記スライス選択手段が、第1の重要性を有する第1の量のビデオスライス(431)を第1の品質バージョン(317)から、第2の重要性を有する第2の量のビデオスライス(442)を第2の品質バージョン(316)から選択するように構成され、前記第1の量及び前記第2の量は、前記任意の要求される品質に一致するように決定される、
    請求項1に記載の適応ストリーミングアウェアネットワークノード(301)。
  5. 前記ビデオアイテムの第1の品質バージョンと第2の品質バージョンとが、有理数N’/Nだけ異なる解像度を有し、
    前記第1の品質バージョンにおけるN×N四方のマクロブロック、及び前記第2の品質バージョンにおける対応するN’×N’四方のマクロブロックについて、実質的に等しいコーディング決定が採用される、
    請求項2又は請求項3又は請求項4に記載の適応ストリーミングアウェアネットワークノード(301)。
  6. ビデオアイテムのビデオセグメントをクライアント(303)へストリーミングするための方法であって、前記ビデオアイテムは、複数のフレームを有し、各フレームは複数のビデオスライスを有し、前記ビデオアイテムは、複数の品質バージョン(316、317)において利用可能であり、前記複数の品質バージョン(316、317)は、同じ画像アスペクト比を有し、前記複数の品質バージョン(316、317)における対応する各フレームの対応するビデオスライス(411、421;412、422)は、等しい画像部分についてのビット列を含むように前処理される、方法において、
    前記ビデオアイテムのビデオセグメントについての前記クライアント(303)からの要求を受信及び解釈するステップであって、前記要求は、任意の要求される品質を指定する、受信及び解釈するステップと、
    前記ビデオセグメントについて、前記任意の要求される品質に一致する割合で前記複数の品質バージョン(316、317)の前記対応する各フレームからビデオスライス(431、442)を比例的に選択するステップと、
    各々の新たなフレームが比例的に選択された前記ビデオスライス(431、442)から成る、複数の該新たなフレームにより構成される前記ビデオセグメントを前記クライアント(303)へストリーミングするステップと、
    を含む、方法。
  7. ビデオアイテムのビデオセグメントを要求し、受信し、復号することが可能な適応ストリーミングアウェアクライアント(303)であって、前記ビデオアイテムは、複数のフレームを有し、各フレームは複数のビデオスライスを有し、前記ビデオアイテムは、複数の品質バージョン(316、317)において利用可能であり、前記複数の品質バージョン(316、317)は、同じ画像アスペクト比を有し、前記複数の品質バージョン(316、317)における対応する各フレームの対応するビデオスライス(411、421;412、422)は、等しい画像部分についてのビット列を含むように前処理される、適応ストリーミングアウェアクライアント(303)において、
    前記ビデオアイテムのビデオセグメントについての要求を生成するための要求生成手段であって、前記要求は、前記複数の品質バージョン(316、317)のうちのいずれとも一致しない任意の要求される品質を指定する、要求生成手段と、
    前記複数の品質バージョン(316、317)における前記ビデオアイテムのビデオスライスの利用可能性を記述するマニフェストファイルを受信及び解釈するためのマニフェストファイル受信手段と、
    前記ビデオセグメントにおける各ビデオスライスについての要求される品質バージョンを選択するための各スライス品質選択手段であって、前記要求される品質バージョンは、前記任意の要求される品質に一致する割合で前記複数の品質バージョン(316、317)から比例的に選択される、各スライス品質選択手段と、
    を備え、
    前記要求生成手段が、各ビデオスライスについて前記要求される品質バージョンを指定する要求を生成するように構成される、
    適応ストリーミングアウェアクライアント(303)。
  8. 前記要求は、前記複数の品質バージョン(316、317)のうちのいずれとも一致しない任意の要求される品質を指定する、請求項6に記載の方法。
JP2015519022A 2012-06-28 2013-06-24 円滑な品質遷移を可能にする適応ストリーミングアウェアノード、エンコーダ及びクライアント Expired - Fee Related JP6080951B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20120290211 EP2680527A1 (en) 2012-06-28 2012-06-28 Adaptive streaming aware node, encoder and client enabling smooth quality transition
EP12290211.7 2012-06-28
PCT/EP2013/063117 WO2014001246A1 (en) 2012-06-28 2013-06-24 Adaptive streaming aware node, encoder and client enabling smooth quality transition

Publications (2)

Publication Number Publication Date
JP2015526959A JP2015526959A (ja) 2015-09-10
JP6080951B2 true JP6080951B2 (ja) 2017-02-15

Family

ID=48670572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015519022A Expired - Fee Related JP6080951B2 (ja) 2012-06-28 2013-06-24 円滑な品質遷移を可能にする適応ストリーミングアウェアノード、エンコーダ及びクライアント

Country Status (6)

Country Link
US (1) US20150127778A1 (ja)
EP (1) EP2680527A1 (ja)
JP (1) JP6080951B2 (ja)
KR (1) KR101657073B1 (ja)
CN (1) CN104429041B (ja)
WO (1) WO2014001246A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9973559B2 (en) * 2013-05-29 2018-05-15 Avago Technologies General Ip (Singapore) Pte. Ltd. Systems and methods for presenting content streams to a client device
JP6305279B2 (ja) * 2014-08-26 2018-04-04 株式会社東芝 映像圧縮装置および映像再生装置
EP3001688A1 (en) * 2014-09-26 2016-03-30 Alcatel Lucent System and method for transferring adaptive streaming video between a server and a client
EP3001693A1 (en) * 2014-09-26 2016-03-30 Alcatel Lucent Server, client, method and computer program product for adaptive streaming of scalable video and/or audio to a client
US9935993B2 (en) * 2015-03-31 2018-04-03 Avago Technologies General Ip (Singapore) Pte. Ltd. Streaming video over a hybrid network
US10313765B2 (en) 2015-09-04 2019-06-04 At&T Intellectual Property I, L.P. Selective communication of a vector graphics format version of a video content item
CN108141639B (zh) * 2015-10-06 2021-07-27 索尼互动娱乐股份有限公司 通信系统、发送装置、接收装置和通信系统控制方法
JP2017157904A (ja) * 2016-02-29 2017-09-07 富士ゼロックス株式会社 情報処理装置
US20190182701A1 (en) * 2016-05-19 2019-06-13 Vid Scale, Inc. Client centric service quality control
US10454987B2 (en) * 2016-10-28 2019-10-22 Google Llc Bitrate optimization for multi-representation encoding using playback statistics
US20180183845A1 (en) * 2016-12-22 2018-06-28 Facebook, Inc. Systems and methods for providing content
US10819763B2 (en) 2017-03-31 2020-10-27 At&T Intellectual Property I, L.P. Apparatus and method of video streaming
US10484308B2 (en) 2017-03-31 2019-11-19 At&T Intellectual Property I, L.P. Apparatus and method of managing resources for video services
CN108600863A (zh) * 2018-03-28 2018-09-28 腾讯科技(深圳)有限公司 多媒体文件处理方法和装置、存储介质及电子装置
CN110798751B (zh) * 2018-08-02 2022-09-02 阿里巴巴集团控股有限公司 一种数据传输方法及设备
US11044185B2 (en) 2018-12-14 2021-06-22 At&T Intellectual Property I, L.P. Latency prediction and guidance in wireless communication systems
US20230283865A1 (en) * 2022-03-04 2023-09-07 Streaming Global, Inc. Media and data synchronization and encoding platform

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4779230B2 (ja) * 2001-05-15 2011-09-28 ソニー株式会社 動画像符号化装置、動画像符号化方法、動画像符号化プログラム格納媒体及び動画像符号化プログラム
US20040260827A1 (en) * 2003-06-19 2004-12-23 Nokia Corporation Stream switching based on gradual decoder refresh
EP2106092A1 (en) * 2008-03-27 2009-09-30 British Telecommunications Public Limited Company Device content management
US8996547B2 (en) * 2008-10-31 2015-03-31 Microsoft Technology Licensing, Llc Dynamic fragmentation of digital media
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
JP5339290B2 (ja) * 2009-11-12 2013-11-13 日本電信電話株式会社 映像多重化装置、映像多重化方法、及びプログラム
KR101777347B1 (ko) * 2009-11-13 2017-09-11 삼성전자주식회사 부분화에 기초한 적응적인 스트리밍 방법 및 장치
JP5300760B2 (ja) * 2010-02-23 2013-09-25 日本電信電話株式会社 映像伝送システム、映像伝送方法及びプログラム
JP5487074B2 (ja) * 2010-03-18 2014-05-07 日本電信電話株式会社 映像伝送方法、及び映像伝送システム
CN103098484A (zh) * 2010-06-14 2013-05-08 汤姆森许可贸易公司 用于封装编码多组件视频的方法和装置
US8930562B2 (en) * 2010-07-20 2015-01-06 Qualcomm Incorporated Arranging sub-track fragments for streaming video data
US20120030723A1 (en) * 2010-07-27 2012-02-02 Motorola, Inc. Method and apparatus for streaming video
US9456015B2 (en) * 2010-08-10 2016-09-27 Qualcomm Incorporated Representation groups for network streaming of coded multimedia data

Also Published As

Publication number Publication date
CN104429041B (zh) 2017-06-09
KR101657073B1 (ko) 2016-09-13
US20150127778A1 (en) 2015-05-07
CN104429041A (zh) 2015-03-18
EP2680527A1 (en) 2014-01-01
JP2015526959A (ja) 2015-09-10
WO2014001246A1 (en) 2014-01-03
KR20150036232A (ko) 2015-04-07

Similar Documents

Publication Publication Date Title
JP6080951B2 (ja) 円滑な品質遷移を可能にする適応ストリーミングアウェアノード、エンコーダ及びクライアント
TWI511544B (zh) 用於可調適視訊串流之技術
US9351020B2 (en) On the fly transcoding of video on demand content for adaptive streaming
US9226022B2 (en) Method of switching from a first encoded video stream to a second encoded video stream
TWI520590B (zh) 影音串流傳輸方法、影音裝置以及影音提供裝置
US20190182518A1 (en) Adaptive content delivery network
JP2006087125A (ja) ビデオフレームシーケンスを符号化する方法、符号化ビットストリーム、画像又は画像シーケンスを復号する方法、データの送信又は受信を含む使用、データを送信する方法、符号化及び/又は復号装置、コンピュータプログラム、システム、並びにコンピュータ読み取り可能な記憶媒体
US20120179833A1 (en) Method and apparatus for adapting media
US10148990B2 (en) Video streaming resource optimization
KR20150008087A (ko) 복수의 트랜스코딩된 컨텐츠 스트림들을 제공하기 위한 방법 및 장치
JP2007089137A (ja) ロバストなストリーミングを行うためのサーバメディア処理による適応型メディアプレイアウト
CA2797895A1 (en) System and method for adaptive streaming in a multipath environment
US9800945B2 (en) Class-based intelligent multiplexing over unmanaged networks
Bae et al. Why is http adaptive streaming so hard?
US20230156204A1 (en) Adaptive video quality
JP5979406B2 (ja) 画像処理装置、画像処理方法、および画像処理システム
EP3322189A1 (en) Method and system for controlling video transcoding
US10002644B1 (en) Restructuring video streams to support random access playback
EP2781088A1 (en) Reducing amount op data in video encoding
Nandakumar et al. Efficient Multibitrate HEVC Encoding for Adaptive Streaming
CN114902685B (zh) 用于发送和接收视频的方法和装置
KR20200081162A (ko) 컨텐츠 인코딩 장치 및 방법
EP4213485A1 (en) Method for dynamic computational resource management and apparatus for implementing the same
Lin et al. Design and Implementation of H. 264 Player for Multiple Description Coded Videos

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170117

R150 Certificate of patent or registration of utility model

Ref document number: 6080951

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees