JP2007515866A - 無線媒体を通して伝送されるビデオの全体の品質を平滑化するための方法及び装置 - Google Patents

無線媒体を通して伝送されるビデオの全体の品質を平滑化するための方法及び装置 Download PDF

Info

Publication number
JP2007515866A
JP2007515866A JP2006539056A JP2006539056A JP2007515866A JP 2007515866 A JP2007515866 A JP 2007515866A JP 2006539056 A JP2006539056 A JP 2006539056A JP 2006539056 A JP2006539056 A JP 2006539056A JP 2007515866 A JP2007515866 A JP 2007515866A
Authority
JP
Japan
Prior art keywords
quality level
quality
media
frame
output image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006539056A
Other languages
English (en)
Inventor
デル ストク,ペトリュス デシデリウス フィクトル ファン
クリスティアーン ウーエスト,クレメンス
ヤルニコフ,ドミトリ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007515866A publication Critical patent/JP2007515866A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/4424Monitoring of the internal components or processes of the client device, e.g. CPU or memory load, processing speed, timer, counter or percentage of the hard disk space used
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、マルコフデシジョンプロセスとしてモデルリングすることでスケーラブルビデオアプリケーションを制御するためのシステム及び方法に関する。モデルは、アプリケーション相対的なプログレスを測定することに基づいており、相対的なプログレスは、フレームを処理するために割り当てられたCPUバジェットとフレームの処理で使用される実際のCPUサイクルとの間の違いである。この制御ストラテジーは、受信されたレイヤの数(最大の品質レベル)とバジェットされたCPU時間とに基づいて次のフレームのためにデコードされる、最近にデコードされたレベル数及び最大レベルに基づいている。目的は、品質レベルを最大にしつつ、デッドラインのミス(完全にデコードされていないフレーム)の数と品質レベルの変化の数の両者を最小にする品質レベルの制御ストラテジーを開発することで、フレーム間の品質の遷移を平滑にすることである。品質レベルの変化が少なくなると、視聴される画像が平滑になる。

Description

本発明は、全体の品質を平滑化するために無線媒体を通して伝送されるビデオフレームのデコード品質を制御するためのスケーラブルビデオアプリケーションのための方法に関する。
(たとえばIEEE802.11)無線媒体の帯域幅の変動は、一般的に非常に大きい。無線媒体を通して伝送されるビデオの合理的な視聴経験を可能にするため、ベースレイヤ(BL)及び1以上のエンハンスメントレイヤ(EL)(たとえばMPEG4又はMPEG2スケーラブルプロファイル)としてコードが送出される。この技術は、スケーラブルビデオストリームと呼ばれる。スケーラブルビデオのコンセプトは、BLの伝送及びデコードが認識可能な品質のビデオを再構成するのに十分であって、ELの伝送及び処理が受信されたビデオ系列の品質の更なる改善のためにのみ必要とされるようなやり方で、ビデオデータをBL及びELに区分することを提案する。たとえば、1つのELをもつBLは、合理的な品質の画像を伝送し、全てのELをもつBLは、最大の品質のビデオ画像を伝達する。BLは、それぞれのフレームについてネットワークを通して最初に送出され、そのフレームに属する連続するEL部分が後続する。
帯域幅がかなり変動するとき、BLのみが1つのフレームについて到達し、他のフレームについて1以上のELをもつBLがディスプレイに到達する。これにより、一定に変化する画質が得られる。品質におけるかかる変化は、受信された画像を視聴しているエンドユーザにより理解されない。
本発明は、複数の品質レベルで、たとえばビデオフレームといったメディアフレームを処理することができるメディア処理アプリケーションの全体の出力品質を制御するためのシステム及び方法を提供する。品質レベルは、BL及び特定の数のEL(ゼロ以上)の処理に対応する。それぞれの品質レベルは、区別可能な(しかし必ずしも固定されない)量のリソース、たとえばCPUを必要とする。より高い品質レベル(すなわち、処理される大きな数のEL)は、高いリソースの使用量のコストで、良好な品質の画像が得られる。品質レベルは、フレーム毎に選択される。リソースは有限であるので、処理は、この出力処理の完了のデッドラインによる所与のレベルの出力品質について完了されない場合があり、すなわちデッドラインのミスが生じる。それぞれのデッドラインのミスにより、出力において厳しいアーチファクトが生じる。無線媒体の性質のため、所与のフレームについて受信されるレイヤ数は、時間を通して変動し、これはフレームについて選択された品質レベルの数を制限する。好適な実施の形態では、たとえばビデオフレームといったメディアフレームが受信され、表示されるたびに、受信されたレイヤ数が調べられる。処理することができる最大のレイヤ数は、フレームについて受信されたレイヤの数、及び対応するデッドラインを失う最小のリスクをもつそのフレームのレイヤを処理するのにCPUが利用可能である回数により決定される。しかし、品質レベルの変化は、知覚し得るアーチファクトとなる場合がある。時間につれての品質レベルのジャンプの数を最小にすること、すなわち時間につれての受信される画像を平滑化することで、ユーザはかなり安定な品質を有する画像を視聴する。この平滑化は、好適な実施の形態では、マルコフ連鎖を設定し、バリューファンクションを定義することで行われる。ネットワーク状態により引き起こされない品質レベルの変化は、負の値を生じる。ネットワークの変動により引き起こされる品質レベルの変化は、品質の低下の場合にゼロ値を生じる。画像を全く表示しないことは最も高いペナルティを受ける。他方で、より高い数の処理されたレイヤは、高い値を生じる。他方で、より高い数の処理されたレイヤは、より高い値を生じる。
現実的なパケットの損失をもつ多くのビデオを再生することで、バリューファンクションに関して最適化されるレイヤの選択手順が開発される。このようなやり方で開発された最適化されたレイヤの選択機能は、所与のフレーム及び先行するフレームについて受信されたレイヤの機能として表示される必要があるレイヤ数を決定するために使用される。
リソースの消費を最適化すること、及び出力品質を最大にすることに対処する多数のアプローチが存在する。1つは、スケーラブルビデオアルゴリズムをスケーラブルビデオのデコードに適用する本発明のアプローチである。品質レベルは、処理されるべきレイヤ数として定義される。従来技術のアルゴリズムは、(DVDのような)安定な入力を仮定している。安定な入力は、伝送の間に情報の損失がないことを意味しており、したがって、ビデオデータのデコードの間に如何なる品質レベルをも選択することができることを意味している。本発明は、不安定な入力も同様に対処する。本発明は、CPUの可用性で見るだけでなく、アプリケーションの入力でも見ることで、デコード(及び可能であれば、後処理)ストラテジーを最適化する。基本的に、本発明は、ネットワークからの依存性を制御ストラテジーに導入する。したがって、本発明は、安定(たとえばCD、DVD、HDD)かつ不安定な(無線ネットワーク)入力で機能することができる。
以下の説明は例示するためのものであって、限定するものではないことが当業者により理解されるべきである。当業者であれば、本発明の精神及び特許請求の範囲に含まれる多くの変形が存在することを理解されるであろう。公知の機能及び動作の不必要な詳細は、本発明を曖昧にしないように、ここでの記載から省略される場合がある。
本発明は、リソースの利用と出力品質の間のトレードオフを解決するための内部設定の動的な変更を可能にするスケーラブルビデオアプリケーションを制御するビデオ制御メカニズムのシステム及び方法を提供する。図1は、パラメータのセット103によりスケーラブルアプリケーション101の挙動に影響を及ぼす制御メカニズム102をもつスケーラブルビデオプロセッサの基本コンセプトを説明する。ビデオ処理を達成するためのスケーラブルアプリケーションの使用は、出力品質を達成することができるように、アプリケーションの一部が容易にスケーリングされるのを可能にし、これによりリソースの消費量が出力品質に対してバランスされるのを可能にする。
スケーラブルビデオアプリケーション(SVA)としてビデオデコーダを考える。このビデオデコーダは、品質の出力ビデオストリームを生成するためにその内部設定を変えることで制御することができる。表1に例示されるように、デコーダは、最も低い品質レベルで動作するときにベースレイヤのみを処理する。品質レベルの増加により、デコーダは、処理時間(及び、明らかにリソースの消費量)と同様に、処理されるべきレイヤの数を増加させる。
Figure 2007515866
しかし、全てのレイヤが常に利用可能ではない。デコーダがネットワークからレイヤを受けると仮定すると、時間的な如何なる瞬間でデコーダに入力されるレイヤ数について保証がない。したがって、幾つのレイヤ数が次に処理されるかが確かでない。利用可能なレイヤ数に関する情報は、入力バッファから得ることができる。
一般に、本発明のスケーラブルアプリケーションによる処理は以下のように記載される。アプリケーションは、入力バッファからワークユニット“a unit of work”(フレーム)を引き出し、それを処理して、結果を出力バッファに送出する。アプリケーションは、ワークユニット、すなわちビデオフレームを処理するためのCPU時間の固定されたバジェット“budget”を受ける。ワークユニットは、サイズ及び複雑さの点で異なり、このことは、ワークユニットを処理するために必要とされる時間における差となる。ワークユニットの完了は、マイルストーンと呼ばれ、かかるマイルストーンのそれぞれについてデッドラインが存在する。スケーラブルビデオアプリケーションの環境では、フレームのデコードは、厳密に周期的なデッドラインを有するワークユニットであり、すなわちデッドラインは、所与の固定された周期Pで生じる。デッドラインのミスが防止されることになる。
それぞれのマイルストーンで、デッドライン周期で表現されるマイルストーンのデッドラインにまで残っている保証されるリソースのバジェットの量として相対的なプログレス“progress”が計算される。バッファサイズは有限であるので、バッファが含むフレーム数に上限が存在する。このフレーム数は、以下のように前もってデコードすることができるフレーム数の範囲を提供するために使用することができる。
{min[入力バッファにおけるフレーム数],max[出力バッファにおけるフレーム数]}
マイルストーンでの相対的なプログレスが負となる場合、少なくとも1つのデッドラインが失われ、すなわち相対的なプログレスが負であったように少なくとも1つのフレームを処理するために保証されたバジェットよりも多くを要する。測定が行われないとき、かかるデッドラインのミスの影響は累積的である。かかる累積的なデッドラインのミスを防止するため、アプリケーションは、それぞれのマイルストーンで実行される品質レベルを調整する。
品質レベルを選択するために3つの目的が調整される。
1. 品質レベルが最大にされる。
2. デッドラインのミスが最小にされる。
3. 品質レベルの変化が最小にされる。
本発明の適用により、後処理が考慮されない。
これらの目的を言い換えると、スケーラブルメディア処理アプリケーションについて品質レベルの制御ストラテジーが必要とされ、これは、デッドラインのミスの数及び品質レベルの変化の数の両者を最小にし、品質レベルを最大にするように、固定されたCPUのバジェットが割り当てられている。
本発明によれば、この問題は、マルコフデシジョン(Markov Decision)モデルとしてモデル化される。このモデルは、そのマイルストーンでのアプリケーションの相対的なプログレスを計算することに基づいている。マルコフデシジョンの問題を解決することで、オーバヘッドを殆ど受けることなしに、実行時間の間に適用することができる品質レベルの制御ストラテジーとなる。
セットトップボックス及びデジタルTVセットのような消費者の端末は、オープンかつフレキシブルとなることが市場により必要とされる。このことは、等価なメディア処理アプリケーションが実行する中央処理装置(CPU)により、幾つかの専用のハードウェアコンポーネントを置き換え、特定のメディア処理アプリケーションを実行することで達成される。CPU時間、メモリ及びバス帯域幅のようなリソースは、これらのアプリケーションの間で共有される。ここで、好ましくは、CPUリソースのみが考慮される。
それぞれのマイルストーンで、相対的なアプリケーションのプログレスが計算される。ここで、マイルストーンでの相対的なプログレスは、デッドラインの周期で表現されるマイルストーンのデッドラインまでの時間として定義される。
マイルストーンでの相対的なプログレスは以下のように計算することができる。一般性を欠くことなしに、アプリケーションは時間t=0で処理を始めるものとする。マイルストーンmの時間はcmにより示される。つぎに、マイルストーンのデッドラインは、dmにより示される。デッドラインは、厳密に周期的であって、これは、以下のように書くことができることを示す。
m=d0+m*P
ここでPは2つの連続するデッドライン間の周期であって、d0はオフセットである。ρmで示されるマイルストーンでの相対的なプログレスは、以下に与えられる。
Figure 2007515866
相対的なプログレスの計算を説明するため、図2に示される例示的なタイムラインを考える。この例では、P=1及びd0=1である。式(1)を使用して計算された1〜5までのマイルストーンでの相対的なプログレスは、ρ1=(d1−c1)/P=(2−1)/1,ρ2=1.5,ρ3=1,ρ4=0及びρ5=0.5により与えられる。なお、マイルストーン4は時間的に間に合った状態である。
マイルストーン(m+1)番目の相対的なプログレスがゼロ以下に下がった場合、m番目以降のマイルストーンから[−ρm+1](−ρm+1までの次の大きな整数)デッドラインのミスが生じる。どのようにデッドラインのミスが対処されるかは、アプリケーションに特化する。ここで、ちょうど作成された出力が捨てられないが、何かに使用されることを意味する、機能維持アプローチが想定される。1つのやり方は、この出力を最初の次のデッドラインで使用することであり、これは調整された相対的なプログレス
ρ’m=ρm+[−ρm]≧0
が得られることを意味する。連続するアプローチは、ρ’m=0、すなわち最も低い可能な値とされ、この値はある意味では、作成に応じた直後の出力を使用することに対応する。言い換えれば、デッドラインdm及びその後のデッドラインは、−ρm*Pの量を延ばす。結果的に、式(1)を使用したマイルストーンでの相対的なプログレスを計算することができるが、新たなオフセットd0’=d0−ρm*Pをもつ。
このプロセスは、図3に示される例示的なタイムラインにより説明される。この例では、P=1及びd0=0.5である。式(1)を使用して、以下を導出することができる。ρ1=0.5,ρ2=0.5及びρ3=−0.5。マイルストーン3での相対的なプログレスは、ゼロ以下に下がり、したがってマイルストーン2、すなわちt=3.5以降で[−ρ3]=1のデッドラインのミスが生じる。つぎに、デッドラインd3は、d’3=c3=4に延ばされ、更なるデッドラインは、0.5の量だけ延ばされる。続いて、ρ4=0.5及びρ5=0.5が発見される。
マイルストーンでのアプリケーションの状態は、その相対的なプログレスにより与えられる。これは、しかし、無限に大きな状態のセットを与え、マルコフデシジョンプロセスは、有限のセットを必要とする。後者は以下のように達成され、p>0が相対的なプログレスに関する所与の上限を示すとする。数pは、アプリケーションが前に機能した周期の数の測定であり、これは先に説明されたバッファサイズから導出される。0とpとの間の相対的なプログレス空間は、有限のセットΠ={π0,...,πn-1} n≧1に分割され、ここでプログレスのインターバルは以下に示される。
Figure 2007515866
プログレスのインターバルπの下限及び上限は、
(外1)
Figure 2007515866
によりそれぞれ示される。
それぞれのマイルストーンで、次のワークユニット処理される品質レベルに関する判定が行われる必要がある。したがって、ある状態、すなわちマルコフデシジョンの問題で行うことができる判定のセットは、アプリケーションが実行することのできる品質レベルのセットに対応する。このセットはQで示される。
それぞれの品質レベルは、処理されるレイヤの数に対応する。したがって、所与のフレームについて入力バッファに存在するよりも多くのレイヤをデコードする必要がある品質レベルを選択することは不可能である。このように、選択することのできる最大の品質レベルは、受信されたレイヤの数により与えられ、maxq(i)により定義される。
品質レベルの変化が考慮され、それぞれのマイルストーンで、以前に使用された品質レベルが知られる必要がある。このことは、品質レベルで状態のセットを拡張することで実現することができる。したがって、状態iは、以下により定義される。
・π(i)により示される状態iでの相対的なプログレスのインターバル。
・maxq(i)により示される状態iにおける次のワークユニットについて選択するのが可能な最大の品質レベル。
・q(i)により示される状態iにおける以前に使用された品質レベル。
したがって、状態のセットはΠ×Q×Qとなる。
マルコフデシジョンの問題が構成される第二のエレメントは、遷移確率のセットからなる。pij qを、次のワークユニットを処理するための品質レベルqが選択される場合、現在のマイルストーンでの状態iから次のマイルストーンでの状態jへの遷移をなす遷移確率を示すとする。遷移の後、q(i)=q及びmaxq(i)≧qであり、これはq≠q(j)又はq>maxq(i)の場合にpij q=0であることを意味する。
一般性を欠くことなしに、アプリケーションがマイルストーンmで状態iにあると仮定する。それぞれの品質レベルqについて、ランダム変数Xqを導入し、これは品質レベルqにおける1つのワークユニットを処理するのにアプリケーションが必要な時間を与える。アプリケーションが周期P当たり計算のバジェットbを受けるとする場合、相対的なプログレスρm+1は、再帰的な式によりρmで表現することができる。
Figure 2007515866
ここで表記が使用される。
Figure 2007515866
π,ρm,maxqm,maxqm+1は、ランダム変数とし、このランダム変数は、現在のマイルストーンでの相対的なプログレスはρmであり、最大の品質レベルはmaxqm+1であり、品質レベルqが選択されると仮定して、次のマイルストーンm+1でのアプリケーションの相対的なプログレスρm+1はプログレスのインターバルπにある確率を与え、このマイルストーンで選択することができる最大の品質レベルはmaxqm+1である。
変数Yπ,ρm,maxqm,maxqm+1は、2つの独立なイベントの確率を記載し、次のマイルストーンにおけるアプリケーションは、プログレスのインターバルπにあり、最大の品質レベルmaxqmは、maxqm+1に設定される。したがって、以下を得る。
Figure 2007515866
その後、以下が導出される。
Figure 2007515866
qはXqの累積の分布関数を示し、インターバル
Figure 2007515866
における最も低い値を選択することでρmの悲観的な近似をなす。上記が与えられると、確率pij qは以下により近似することができる。
Figure 2007515866
更に多くのプログレスのインターバルが選択され、より正確な遷移確率のモデリングが行われると、式(3)における近似が良好になる。
マルコフデシジョンの問題を構成する第三のエレメントは、レベニュー“revenue”である。状態iでの品質レベルqを選択するレベニューはri qにより示される。レベニューは、3つの問題の目的を実現するために使用される。
はじめに、ワークユニットが処理される品質レベルは、できるだけ高くあるべきである。これは、関数u(q)により与えられる、それぞれri qに報酬を割り当てることで実現される。この関数は、ユーティリティ関数と呼ばれる。この関数は、品質レベルqで実行されているアプリケーションの出力の知覚される品質に直接関連される正の値をリターンする。
第二に、デッドラインのミスの数は、できるだけ低くするべきである。デッドラインのミスのペナルティ関数は、品質レベルqが現在の状態で選択される場合に、ミスするのを期待するデッドラインの数に関連する正の値をリターンする。この値は、レベニューから引かれる。最後に、品質レベルの変化の数は、できるだけ低くあるべきである。これは、それぞれのri qからc(q(i),q)により与えられるペナルティを引くことで達成される。この関数は、正の値をリターンし、このことは、q(i)≠qの場合にq(i)とqとの間のギャップのサイズで増加し、その他の場合にゼロである場合がある。さらに、品質レベルにおける増加は、品質レベルにおける減少よりも低いペナルティが与えられる場合がある。関数c(q(i),q)は、品質の変化の関数と呼ばれる。
有限の数の遷移のみが考慮される場合(いわゆる有限時間の限界)、マルコフデシジョンの問題のソリューションは、ダイナミックプログラミングにより発見される全ての遷移を通したレベニューの合計を最大にするデシジョンストラテジーにより与えられる。しかし、遷移の数を制限することができないので、無限の時間の限界が存在する。そのケースでは、最大化するための有効な基準は、遷移当たりの平均のレベニューにより与えられる。この基準は、全ての遷移が等しく重要であることを強調している。連続近似、ポリシーイタレーション、及びリニアプログラミングのような無限時間の限界のマルコフデシジョンの問題のための多数の解決技法が存在する。たとえば、Martin L. Putermanによる“Markov Decision Processes: Discrete Stochastic Dynamic Programming”, Wiley Series in Probability and mathematical Statistics, John Wiley & Sons Inc. 1994、及びD.J.Whiteによる“Markov Decision Processes”, John Wiley & Sons Inc. 1993を参照されたい。ここで記載される経験について連続近似が使用される。
マルコフデシジョンの問題を解決することで、最適な固定したストラテジーが得られる。ここで「固定した」とは、適用されるデシジョンストラテジーが全てのマイルストーンで同一であること、すなわちマイルストーンの数に依存しないことを意味する。|Π|=300,b=40000μsについて、例示的な制御ストラテジーが図4に示されている。この図は、たとえば、特定のマイルストーンでの相対的なプログレスが1に等しい場合、及び、前に使用された品質レベルがq3であり、次のフレームの最大の品質レベルがq3である場合、品質レベルq3は、次のワークユニット、すなわち次のフレームを処理するために選択される。
最適性を失うことなしに、いわゆる単調な制御ストラテジーを使用することができ、すなわち前に使用された品質レベル当たり、より高い相対的なプログレスにより、高いか又は等しい品質レベルの選択が得られると仮定することができる。次いで、最適な制御ストラテジーを記憶するため、前に使用された品質レベル当たり、制御ストラテジーが特定の品質レベルから別の品質レベルに変化する相対的なプログレスの境界のみが記憶される必要がある。したがって、制御ストラテジーは、プログレスのインターバルの数に独立であるO(|Q|2)のスペースの複雑さを有する。
マルコフデシジョンの問題は、アプリケーションが実行を開始する前にオフラインで解くことができる。つぎに、結果的に得られる制御ストラテジーを以下のようにオンラインで適用する。それぞれのマイルストーンで、前に使用された品質及び最大の品質レベルが知られており、アプリケーションの相対的なプログレスが計算される。次いで、次のワークユニットが処理されるべき品質レベルが調べられる。このアプローチは、オーバヘッドを受けない。
経験のための入力として、120000フレームからなるビデオ系列のMPEG−2信号対雑音比(SNR)デコーディングトレースファイルが使用される。このトレースファイルは、それぞれのフレームについて、増加する品質レベルの順序で、q0〜q3にまでラベル付けされる、4つの異なる品質レベルのそれぞれにおいて、TriMediaでのCPUサイクルで表現される、それをデコードするために必要とされる処理時間を含む。すなわち、エンハンスメントレイヤの数は3に設定され、全てのレイヤのビットレートは等しい。
本発明の評価における最初のステップとして、ある最大の品質レベルから別の品質レベルへの遷移の確率が等しいことが想定される。したがって、マイルストーンmで、変数Ymaxqm,maxqm+1は、如何なるペアmaxqm及びmaxqm+1について同じ値を有する。
第二に、問題のパラメータは、以下のように定義される。相対的なプログレスpでの上限は、2に等しく選択され、これは、少なくとも2つのデコードされたフレームを記憶することができる出力バッファが使用されるものとする。また、入力バッファが何れかの時間の瞬間で少なくとも2つのフレームを含むとする。ビデオの知覚的な品質は、ビデオストリームの実際のビットレートに依存し、これは品質レベルに直接連結される。それぞれの品質レベルの増加によりファクタ2だけ品質のファクタが増加されるとすると、ユーティリティ関数は、u(q0)=2 u(q1)=4 u(q2)=7.5 u(q3)=12、により定義される。
デッドラインのミスのペナルティは100000に等しく選択され、これは8000フレーム当たりおおまかに約1つのデッドラインのミスが許容されることを意味する。言い換えれば、5秒のビデオ当たり多くとも1フレームがスキップされる。
品質レベルを増加する品質レベルの変化のペナルティは5に設定され、品質レベルが1、2及び3によりそれぞれ増加される場合に5、50及び500に設定される。品質レベルを減少するため、ペナルティは1、2及び3レベルでそれぞれ減少するために50,500及び5000に設定される。状態jにおける利用可能なレイヤの数が与えられると、状態jの最大品質レベルがq(j)に等しいため、品質レベルがq(i)〜q(j)に減少される場合、これは強制された変化であると考えられ、品質レベルの変化のペナルティは、ゼロに設定される。
できるだけ多くのレイヤが所与のCPUのバジェットでデコードされる簡単なアルゴリズムに本発明を比較する評価が行われる。先に記載されたように、連続的なアルゴリズムは、問題の瞬間を解くために使用される。計算の不正確さから離れて、連続的な近似は、最適な制御ストラテジーを発見する。0.001の値は不正確さの耐性のために使用された。結果的に得られる制御ストラテジーは、相対的なプログレス、前に使用された品質レベル、及び最大の品質レベルが与えられると、それぞれのマイルストーンで次のフレームがデコードされるべき品質レベルを与える。
i.テスト1
最初のテストは、40ms及び最大の品質レベルのバジェットを使用し、ネットワークのスループットが全てのレイヤの伝達について十分であるとしている。表2は、本発明のスケーラブルアプリケーションの品質レベルにおける変化を含む。表3は、簡単なアプリケーションの品質レベルにおける変化を含む。表2及び表3に示されるように、簡単なアルゴリズムは、平均して4番目のフレーム毎の品質レベルにおける変化をなし、本発明によりなされる変化の数の1300倍である。同時に、表4に例示されるように本発明のスケーラブルアプリケーションの平均の品質は、簡単なアプリケーションについてよりも高く、表4は、品質レベルの使用量のパーセンテージを例示する。
Figure 2007515866
表2−テスト1におけるスケーラブルアプリケーションの品質レベルの変化
Figure 2007515866
表3−テスト1における簡単(straightforward)なアプリケーションの品質レベルの変化
Figure 2007515866
表4−テスト1における品質レベルの使用量におけるパーセンテージ
ii.テスト2
第二のテストについて、予算は40msであり、フレームを処理するために選択することができる最大の品質レベル(バッファで利用可能なフレームのレイヤ数)はランダムに生成される。表5〜表7で示されるように、(最大の品質レベルの変化の数が1228であるとき)第二のテストでは、本発明のスケーラブルアプリケーションによりなされる幾つかの変化はあるレベルから別のレベルへの頻繁に発生する遷移を平滑化する試みにより生じる。
Figure 2007515866
表5−テスト2におけるスケーラブルアプリケーションの品質レベルの変化
Figure 2007515866
表6−テスト2における簡単なアプリケーションの品質レベルの変化
Figure 2007515866
表7−品質レベルの使用量のパーセンテージ
iii.比較
両方のアプリケーションは、デッドラインのミスを受ける。図6は、バジェット及び固定された最大品質レベルを変えるために両方のアプリケーションのデッドラインのミスと平均品質レベルのパーセンテージを例示している。簡単なアプリケーションは、所与のCPUバジェットで残されつつ、異なる品質レベル間で容易に移動する。したがって、低いCPUバジェットの状態下で、簡単なアプリケーションの平均品質は、本発明の平均品質よりもかなり高い。しかし、品質レベルにおける不必要な増加のペナルティは、膨大な数のデッドラインのミスである。本発明の好適な実施の形態のスケーラブルビデオアプリケーションは、所与のCPUバジェットのデッドラインのミスが8000フレーム当たり1の予め定義された制限にあることを保証することができる後にのみ品質レベルの増加を許容する。
図7は、最大の品質レベルがランダムに選択されたときのケースについて結果を示している。図7から分かるように、最大の品質レベルが頻繁に変化するとき、簡単なアプリケーションは、平均で、本発明のスケーラブルアプリケーションよりも高い品質を有する。これは、スケーラブルアプリケーションが品質レベルのジャンプを平滑にした事実により引き起こされ、これにより品質レベルが下がった後に品質レベルの緩やかな成長となる。
固定されたCPUバジェットを有するスケーラブルメディア処理アプリケーションの品質レベルの制御は、モデルは、マイルストーンで計算されたアプリケーションの相対的なプログレス、及び、アプリケーションの入力バッファにおける(たとえば受信されたレイヤといった)利用可能なビデオデータの量に基づいている。3つの目的は、品質レベルを選択するために適合され、受信されたレイヤの数により決定される最大の品質レベルを考慮して、1.品質レベルが最大にされ、2.デッドラインのミスが最小にされ、3.品質レベルの変化が最小にされる。後処理は考慮されない。
これらの目的を再始動して、品質レベルの制御ストラテジーは、スケーラブルメディア処理アプリケーションについて開発され、これは、品質レベルを最大にしつつ、デッドラインのミスの数及び品質レベルの変化の数の両者を最小にするように、固定されたCPUバジェットが割り当てられている。モデルにおけるパラメータは、品質レベルの変化の数である。変化の数が少ないと、視聴される画像が平滑化される。
図8は、概念的なやり方で本発明に係るシステム1200を例示している。システム1200は、ソフトウェアバス1208を介して中央処理ユニット1210と通信するメモリ1202を有する。メモリ1202は、先に記載されたようにメディアフレームを処理するために使用されるCPUサイクルの量を決定するために設計されるコンピュータ読取り可能なコード1204を有する。さらに、メモリ1202は、マイルストーンで計算されたメディア処理アプリケーションの相対的なプログレスに基づいてメディアフレームの品質レベルを制御するために設計されるコンピュータ読取り可能なコード1206を有する。好ましくは、メディアフレームを処理する品質レベルは、先に記載された多数のメディアフレームを処理するためにモデル化されるマルコフデシジョンの問題に基づいて設定される。コンピュータ読取り可能なコードは、本発明に係る方法を実行するために設計されるコンピュータプログラムプロダクトを有するストレージ装置1212から更新することができる。ストレージ装置は、システム1200に接続される、たとえばCDリーダ1214といった適切な読取装置により読取られる。システムは、ハードウェア及びソフトウェアの両者で、又はソフトウェアを動作可能な他の標準的なアーキテクチャで実現することができる。
図9は、本発明に係るシステムの実施の形態を有する、概念的な方法での本発明に係るテレビジョンセット1310を例示している。ここで、アンテナ1330は、テレビジョン信号を受信する。たとえばサテライトディッシュ、ケーブル、ストレージ装置、インターネット、又はイーサネット(登録商標)のようなテレビジョン信号を受信又は再生可能な装置もアンテナ1300を置き換えることができる。受信機1302は、テレビジョン信号を受信する。受信機1302の代わりに、テレビジョンセットは、たとえばプログラマブル集積回路といったプログラマブルコンポーネント1304を含む。このプログラマブルコンポーネントは、本発明に従ってシステム1306を含む。テレビジョンスクリーン1308は、受信機1302により受信され、プログラマブルコンポーネント1304により処理される文書を表示する。テレビジョンセット1310は、任意に、テレビジョン信号を供給するDVDプレーヤ1312を有するか、DVDプレーヤに接続することができる。
図10は、概念的なやり方で、本発明に係るシステムの実施の形態を有するセットトップボックス1402の大部分の重要な部分を説明する。ここで、アンテナ1400は、テレビジョン信号を受信する。また、アンテナは、たとえばサテライトディッシュ、ケーブル、ストレージ装置、インターネット、又はテレビジョン信号を受信可能な他の装置である場合があり、セットトップボックス1402は、信号を受信する。信号はたとえばデジタルである。ここでは示されないが、セットトップボックスに含まれる通常の部材の他に、セットトップボックスは、本発明1404に係るシステムを含む。テレビジョン信号は、セットトップボックス1402に接続されるテレビジョンセット1406で表示される。
先に記載された実施の形態は本発明を限定するよりはむしろ例示するものであり、当業者であれば、特許請求の範囲から逸脱することなしに多くの代替的な実施の形態を設計することが可能である。本発明は、幾つかの個別のエレメントを有するハードウェア、適切にプログラムされたコンピュータにより実現される。さらに、特定の状況に適合するために多くの変更がなされ、本発明の教示は、その中心的な範囲から逸脱することなしに等価であるやり方で適合することができる。したがって、本発明を実行することが意図される最良のモードとして開示される特定の実施の形態に本発明が制限されることが意図されないが、本発明は特許請求の範囲に含まれる全ての実施の形態を含むことが意図される。
スケーラブルビデオアプリケーションの一般的なビューを例示する図である。 本発明の実施の形態に係るスケーラブルビデオアプリケーションの例示的なタイムラインを説明する図である。 デッドライン(d3)が失われた例示的なタイムラインを説明する図である。 本発明に係る最適なストラテジーのためのq0、q1、q2及びq3についての前に使用された品質レベルに対する相対的なプログレスを説明する図であり、ここでb=40000及び|Π|=300。 本発明に係るスケーラブルアプリケーションの挙動を説明する図である。 簡単な用途との本発明に係るスケーラブルビデオアプリケーションの定量的な比較を説明する図である。 最大の品質レベルの1000の変化について本発明にかかるスケーラブルビデオアプリケーションの定量的な比較を説明する図である。 本発明の実施の形態に係るシステムのアーキテクチャを説明する簡略化されたブロック図である。 本発明に従って変更されたTVセットを説明する図である。 本発明に従って変更されたセットトップボックスを説明する図である。

Claims (12)

  1. メディア処理アプリケーションによりメディアフレームの出力画像の品質レベルを設定する方法であって、
    前記メディアフレームを処理するために使用されるリソースの量を決定するステップと、
    a)マイルストーンで計算された前記メディア処理アプリケーションの相対的なプログレス、b)前記出力画像のための選択することが可能な最大の品質レベル、c)出力画像の以前に使用された品質レベル、及び、d)受信されたレイヤ数に基づいた最大の品質レベルに基づいて前記出力画像の品質レベルを制御するステップと、
    を含むことを特徴とする方法。
  2. 前記品質レベルは、次のフレームを処理するために可能な最高の品質レベルと前記出力画像の品質を保持するために必要とされる最高の品質レベルとの最小値に基づいて選択される、
    請求項1記載の方法。
  3. 前記メディアフレームの品質レベルを制御するステップは、状態のセット、デシジョンのセット、遷移確率のセット及びレベニューのセットを有するマルコフデシジョンの問題としてモデル化され、
    前記マルコフデシジョンの問題を解いて最適なストラテジーを導出するステップと、
    この解に基づいてデコードされるメディアフレームのレイヤ数を決定するステップとを含む、
    請求項1記載の方法。
  4. マイルストーンで前記メディア処理アプリケーションの相対的なプログレス及び前記以前に使用された品質レベルを含むための状態のセットを定義するステップと、
    前記メディア処理アプリケーションが提供することができる複数の品質レベルを含むためのデシジョンのセットを定義するステップと、
    前記複数の品質レベルの所与の品質レベルについて、現在のマイルストーンでの状態のセットのあるセットから次のマイルストーンでの状態のセットの他のセットに遷移がなされる確率を含むために遷移確率のセットを定義するステップと、
    前記メディアフレームの品質レベルに関連する正のレベニュー、デッドラインのミスに関連する負のレベニュー、及び品質レベルの変化に関連する負のレベニューを含むためにレベニューのセットを定義するステップと、
    を更に含むことを特徴とする方法。
  5. スケーラブルメディア処理アプリケーションによりメディアフレームの出力画像の品質レベルを設定するシステムであって、
    前記メディアフレームを処理するために使用されるリソースの量を決定する決定手段と、
    a)マイルストーンで計算された前記メディア処理アプリケーションの相対的なプログレス、b)前記メディアフレームの前記出力画像のために選択することが可能な最大の品質レベル、c)メディアフレームの出力画像の以前に使用された品質レベル、及び、d)受信されたレイヤ数に基づいた最大の品質レベルに基づいて前記メディアフレームの前記出力画像の品質レベルを制御する制御手段と、
    を有することを特徴とするシステム。
  6. 前記品質レベルは、次のフレームを処理するために可能な最高の品質レベルと前記出力画像の品質を保持するために必要とされる最高の品質レベルとの最小値に基づいて選択される、
    請求項5記載のシステム。
  7. 前記制御手段は、状態のセット、デシジョンのセット、遷移確率のセット及びレベニューのセットを有するマルコフデシジョンの問題として前記メディアフレームの品質レベルの制御をモデル化し、
    デシジョンストラテジーを使用して前記マルコフデシジョンの問題への解とし、
    この解に基づいて前記メディアフレームの品質レベルを設定するために更に構成される、
    請求項5記載のシステム。
  8. 前記状態のセットは、マイルストーンで前記メディア処理アプリケーションの相対的なプログレス及び以前のメディアフレームの前記以前に使用された品質レベルを含み、
    前記デシジョンのセットは、前記メディア処理アプリケーションが提供することができる複数の品質レベルを含み、
    前記遷移確率のセットは、前記複数の品質の所与の品質レベルについて、現在のマイルストーンでの状態のセットのあるセットから次のマイルストーンでの状態のセットの他のセットに遷移がなされる確率を含み、
    前記レベニューのセットは、前記メディアフレームの品質レベルに関連する正のレベニュー、デッドラインのミスに関連する負のレベニュー、及び品質レベルの変化に関連する負のレベニューを含む、
    請求項7記載のシステム。
  9. 請求項1記載の方法を実行するために設計されるコンピュータプログラムプロダクト。
  10. 請求項9記載のコンピュータプログラムプロダクトを含む記憶装置。
  11. 請求項5記載のシステムを含むテレビジョンセット。
  12. 請求項5記載のシステムを含むセットトップボックス。
JP2006539056A 2003-11-13 2004-11-11 無線媒体を通して伝送されるビデオの全体の品質を平滑化するための方法及び装置 Pending JP2007515866A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US51980903P 2003-11-13 2003-11-13
PCT/IB2004/052389 WO2005048606A1 (en) 2003-11-13 2004-11-11 Method and apparatus for smoothing overall quality of video transported over a wireless medium

Publications (1)

Publication Number Publication Date
JP2007515866A true JP2007515866A (ja) 2007-06-14

Family

ID=34590447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006539056A Pending JP2007515866A (ja) 2003-11-13 2004-11-11 無線媒体を通して伝送されるビデオの全体の品質を平滑化するための方法及び装置

Country Status (6)

Country Link
US (1) US20070153891A1 (ja)
EP (1) EP1685718A1 (ja)
JP (1) JP2007515866A (ja)
KR (1) KR20060116000A (ja)
CN (1) CN1883205A (ja)
WO (1) WO2005048606A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011234370A (ja) * 2010-04-29 2011-11-17 Irdeto Corporate Bv デジタルコンテンツの適応ストリーミングを制御すること
JP2014107796A (ja) * 2012-11-29 2014-06-09 Mitsubishi Electric Corp 映像表示システム及び映像表示装置
JP2018056993A (ja) * 2016-09-26 2018-04-05 三星ディスプレイ株式會社Samsung Display Co.,Ltd. ビデオ送信方法及びデータ送信機
CN110049315A (zh) * 2019-04-26 2019-07-23 山西大学 一种提高直播视频系统用户体验质量的方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8355403B2 (en) * 2006-11-13 2013-01-15 Fujitsu Semiconductor Limited Stale data removal using latency count in a WiMAX scheduler
US7953880B2 (en) 2006-11-16 2011-05-31 Sharp Laboratories Of America, Inc. Content-aware adaptive packet transmission
US7668170B2 (en) 2007-05-02 2010-02-23 Sharp Laboratories Of America, Inc. Adaptive packet transmission with explicit deadline adjustment
EP2485441B1 (en) * 2011-01-31 2014-10-08 Alcatel Lucent A video packet scheduling method for multimedia streaming
GB2548789B (en) 2016-02-15 2021-10-13 V Nova Int Ltd Dynamically adaptive bitrate streaming
GB2570449B (en) * 2018-01-23 2022-05-18 Canon Kk Method and system for auto-setting of cameras

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3477397A (en) * 1996-06-04 1998-01-05 Paul J. Werbos 3-brain architecture for an intelligent decision and control system
AU2002353299A1 (en) * 2001-12-10 2003-06-23 Koninklijke Philips Electronics N.V. Method of and system to set a quality of a media frame
US7657861B2 (en) * 2002-08-07 2010-02-02 Pact Xpp Technologies Ag Method and device for processing data

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011234370A (ja) * 2010-04-29 2011-11-17 Irdeto Corporate Bv デジタルコンテンツの適応ストリーミングを制御すること
JP2014107796A (ja) * 2012-11-29 2014-06-09 Mitsubishi Electric Corp 映像表示システム及び映像表示装置
JP2018056993A (ja) * 2016-09-26 2018-04-05 三星ディスプレイ株式會社Samsung Display Co.,Ltd. ビデオ送信方法及びデータ送信機
JP7073065B2 (ja) 2016-09-26 2022-05-23 三星ディスプレイ株式會社 ビデオ送信方法及びデータ送信機
CN110049315A (zh) * 2019-04-26 2019-07-23 山西大学 一种提高直播视频系统用户体验质量的方法
CN110049315B (zh) * 2019-04-26 2020-04-24 山西大学 一种提高直播视频系统用户体验质量的方法

Also Published As

Publication number Publication date
CN1883205A (zh) 2006-12-20
US20070153891A1 (en) 2007-07-05
WO2005048606A1 (en) 2005-05-26
EP1685718A1 (en) 2006-08-02
KR20060116000A (ko) 2006-11-13

Similar Documents

Publication Publication Date Title
Wust et al. Qos control strategies for high-quality video processing
KR20090075686A (ko) 복잡도 인식 인코딩
Kan et al. RAPT360: Reinforcement learning-based rate adaptation for 360-degree video streaming with adaptive prediction and tiling
CN101107862B (zh) 编码装置及具备编码装置的动态图像记录系统
US8135061B1 (en) Variable bit rate encoding
CN112672153B (zh) 融合视频特征分析的可伸缩编码视频码率自适应选择方法
CN110198495A (zh) 一种视频下载和播放的方法、装置、设备和存储介质
JP2008504750A (ja) マルチパスのビデオ符号化
CN111314772B (zh) 一种视频下载码率的确定方法、装置、终端和存储介质
CN112672186B (zh) 视频预加载的方法和装置
CN113194320B (zh) 参数预测模型的训练方法及装置和参数预测方法及装置
JP2007515866A (ja) 無線媒体を通して伝送されるビデオの全体の品質を平滑化するための方法及び装置
CN111787322B (zh) 视频编码的方法、装置、电子设备及计算机可读存储介质
CN112714315B (zh) 基于全景视频的分层缓冲方法及系统
CN112437321B (zh) 一种基于直播流媒体的自适应码率计算方法
Turkkan et al. GreenABR: Energy-aware adaptive bitrate streaming with deep reinforcement learning
CN111031347A (zh) 一种视频处理的方法及装置、电子设备、存储介质
US20140092204A1 (en) Dynamic rate control algorithm for high definition video conferencing
US7660512B2 (en) Systems and methods for managing frame rates during multimedia playback
US20040146103A1 (en) Bit rate control method and apparatus for MPEG-4 video coding
KR102129115B1 (ko) 컨텐츠 인지 신경망을 이용하여 실시간으로 적응형 비디오를 전송하는 방법 및 장치
CN108200470A (zh) 一种视频码率调整方法及设备
Pleşca et al. Multimedia prefetching with optimal Markovian policies
CN110072125A (zh) 视频播放方法及装置
JP2004521563A (ja) ビデオフレームを表示する方法及びシステム