JP6190525B2 - 品質対ビットレートが変動するメディアデータストリームの品質を決定するための概念 - Google Patents

品質対ビットレートが変動するメディアデータストリームの品質を決定するための概念 Download PDF

Info

Publication number
JP6190525B2
JP6190525B2 JP2016520469A JP2016520469A JP6190525B2 JP 6190525 B2 JP6190525 B2 JP 6190525B2 JP 2016520469 A JP2016520469 A JP 2016520469A JP 2016520469 A JP2016520469 A JP 2016520469A JP 6190525 B2 JP6190525 B2 JP 6190525B2
Authority
JP
Japan
Prior art keywords
quality
media
data stream
bit rate
parameter set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016520469A
Other languages
English (en)
Other versions
JP2016530751A (ja
Inventor
クリスティアン・シュミットマー
ミヒャエル・キール
マティアス・オベルマン
ローランド・ビット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Opticom Dipl Ing Michael Keyhl GmbH
Original Assignee
Opticom Dipl Ing Michael Keyhl GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Opticom Dipl Ing Michael Keyhl GmbH filed Critical Opticom Dipl Ing Michael Keyhl GmbH
Publication of JP2016530751A publication Critical patent/JP2016530751A/ja
Application granted granted Critical
Publication of JP6190525B2 publication Critical patent/JP6190525B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64723Monitoring of network processes or resources, e.g. monitoring of network load
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44209Monitoring of downstream path of the transmission network originating from a server, e.g. bandwidth variations of a wireless network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44227Monitoring of local network, e.g. connection or bandwidth variations; Detecting new devices in the local network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/4425Monitoring of client processing errors or hardware failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6125Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/64322IP
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4143Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a Personal Computer [PC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • General Engineering & Computer Science (AREA)

Description

本発明は、品質対ビットレートが変動するメディアデータストリームの品質を決定することに関する。
現代の伝送技術において、データ量を低減するための特定の符号化方法が、オーディオ信号及びビデオ信号の送信に利用可能である。上記特定の符号化方法は、エンドユーザに、現在の送信チャネル容量に応じて可能な最良の品質を提供するように利用される。
図11は、現在使用されているものとしての、エンドユーザに対する一般的な送信リンクを示す。送信リンクは、送信されるべきすべての種類のメディアデータを記憶するデータベースと、ネットワークを介したデータの配信を請け負うストリーミングサーバと、ネットワーク自体と、所望のデータを受信するエンドユーザ/クライアントとを含む。メディアデータは、例えば、ビデオであり得る。頻繁に尋ねられる質問は、エンドユーザによって知覚されるビデオの実際の品質に関するものである。例えば、メディアデータがサーバ側で複数の異なる品質レベルにおいて提供されるDASH(動的適応型httpストリーミング:Dynamic Adaptive Streaming over http)又はHLS(HTTPライブストリーミング:HTTP Live Streaming)のような適応型ビデオストリーミング技法の割合を増大させるには、受信者側で知覚されるメディアコンテンツの品質を評価するために、可能な最大範囲まで標準化されるように、複数の異なるフレームサイズ及び/又は品質レベルを評価することができる安定した、又は均一な品質尺度(品質測定基準)が必要であることが分かっている。
一般的に、品質概念は3つのカテゴリに区分され得る。
いわゆるフルリファレンス(FR)品質測定技法は、圧縮によって劣化していない元のメディアコンテンツを、その品質が決定されるべきメディアコンテンツと比較する。ここで不利なことは、メディアコンテンツの元のバージョンにアクセスする必要があることである。いわゆるノーリファレンス(NR)品質測定技法は、もっぱら、受信されるメディアコンテンツ、又はすでに受信されていてそのメディアコンテンツを表すデータストリームのみに基づいて品質を決定する。場合によって、これは、送信アーティファクトを検出し、品質尺度を決定するためにそれらを定量化することのみを含む。いわゆる縮小リファレンス(RR)品質測定技法は、当該技法が排他的に受信データストリーム又は受信メディアコンテンツのみを使用するのではなく、送信側でリアルタイムに決定される中間結果が受信側品質の決定に寄与するという点で、FR技法とNR技法との間の一種の中間的なソリューションを表す品質測定技法である。それらのパラメータ又は中間結果は一般的に、送信されるメディアデータストリーム内でともに送信(ともに符号化)される。
特にモバイル用途において、FR品質測定技法はほとんど実装することができない。この問題に対する解決策が、米国特許出願公開第2009/0153668A1号(特許文献1)に記載されている。送信機側において、送信機側で受け取る品質分析結果がRTP拡張ヘッダ内のような送信されるデータストリーム内に挿入され、例えば、それらの品質分析結果は一般的に、送信されるメディアコンテンツのFR分析の結果である。受信機側において、送信されたメディアデータストリームが、アーティファクトがないように送信されているか否かを決定するための検証が実施される。アーティファクトがない期間においては、データストリーム自体の中で送信される品質情報が受信品質の決定に使用される。欠陥のある送信が発生している、すなわち、送信アーティファクトが発生している期間においては、受信機側で品質推定が実施される。最終的に、受信機側品質は、両方の品質測定値、すなわち、干渉のない期間中に送信される品質情報に基づいて得られる測定値と、干渉の傾向がある期間中に受信機側で推定されている測定値との組み合わせから導出される。この手法は、FR方法を適用するために基準メディアコンテンツが受信機側に存在する必要がないという結果をもたらすにしても、上記で引用されている文献に提示されている方法は、多くの観点において不利であり、適応型ストリーミング方法において満足のいくソリューションを見出すのには適していない。適応型ストリーミング方法は、個々のクライアントに、変動する品質レベルでメディアコンテンツを提供する。当然のことながら、品質は、各クライアントに対して、そのクライアントにとっていずれの帯域幅が現在利用可能であるかに応じて、異なる程度まで変化する。しかしながら、同時に複数のクライアントに対して様々な品質を提供するために、適応型ストリーミング方法は一般的に、プリコーディングされたデータを利用する。例えば、ビデオは複数のタイムスロットに分割され、高度に多様な品質レベルを有するプリコーディングされたバージョンが各タイムスロットに対して作成される。所定のプロトコルが、タイムスロット境界において個々の品質レベル間でスイッチングすることによって、クライアントが変動する品質レベルにおいてビデオをロードすることを可能にする。それらのタイムスロットは、例えば、2〜4秒の長さをもつことができ、チャンクと称されることもある。しかしながら、例えば、主観テストに適合されているITU-T J.247のようなFR品質測定技法は、品質を決定するためにチャンク継続時間よりも長い継続時間、すなわち、いくつかのチャンクにわたって延伸する継続時間を必要とする。したがって、上記US文献に記載されている方法を実現するためには、送信機側品質測定は、送信機側において各クライアントについて特定的に実施されなければならなくなり、受信機側にとって、拡張ヘッダを用いて、すなわち、すべてのクライアントについてオンライン及び/又はリアルタイムで利用可能にならなければならなくなる。しかしながら、同時に存在する多くのクライアントを有する多くの用途にとって、そのような手法は、時間及びエネルギーに関して費用が大きいという理由で実現可能でない。
米国特許出願公開第2012/0278441A1号(特許文献2)は、受信機側における品質、すなわち、エンドユーザによって実際に知覚される品質を推定する方法を記載している。その方法について示されている1つの利点は、受信機側において計算能力をほんの少ししか必要とせず、任意の時点において実施されることが可能であると考えられることである。この方法では、特に、メディアデータの転送に影響をあたえるために受信機側測定値を使用することも可能である。このUS文献において提案されている方法は、送信機側で複数の異なる品質レベルにおいてメディアコンテンツを提供することによって開始する。必要である場合、メディアコンテンツを表す署名が送信機側で作成され、その署名は、多かれ少なかれ画像コンテンツ全体に依存し、多かれ少なかれ画像コンテンツを表す。その署名は、少なくとも署名はアーティファクトがないように受信されるように、画像コンテンツとともに受信機側に送信される。受信機側において、その後、取得されたメディアコンテンツから同じように署名が生成され、その後、送信機側から送信されている署名と比較されて、その比較から品質値QoEが得られる。比較をQoE値にマッピングするために、継続的に訓練され及び/又は事前に分かっている分類関数が使用される。ここで、QoE値は、例えば、「非常に良い(excellent)」、「良い(good)」、「普通(adequate)」、及び「悪い(poor)」のカテゴリで、受信機側の品質を示す。QoE値は、受信機側で実際に得られる品質を、送信経路の再ルーティング、再生品質の変更などのような手段を用いて実際に期待されるその品質に適合させるように、送信機側のメディアサーバによって使用されるように受信機側から送信機側に送信し戻されることが可能であると考えられる。
米国特許出願公開第2009/0153668号 米国特許出願公開第米国特許出願公開第2012/0278441号
本発明の目的は、より効率的であり、かつ/又は、エンドツーエンド測定の意味での品質知覚に対して決定的なすべての特性の現実的な検出及び評価を可能にする、メディアデータストリームの品質を決定するための概念を提供することである。
この目的は、新たに提出される独立請求項の主題によって達成される。
本発明の中核的な着想は、適応型ストリーミングの状況内でのもののような、メディアコンテンツにわたって変動する品質対ビットレートレベルを有するメディアコンテンツの複数のメディア部分を送信するデータストリーム部分のシーケンスから構成されるメディアデータストリームの品質が、それぞれのデータストリーム部分について各データストリーム部分から識別子が導出される場合に、かつ、各データストリーム部分について、それぞれのデータストリーム部分について導出される識別子によってルックアップテーブルからパラメータセットが検索され、それによって、パラメータセットを集約して、それに基づいて品質を決定することが可能である場合に、より効率的に決定され得ることが分かっているということにある。この手法は、各クライアントのメディアデータストリームを構成しているデータストリーム部分が、経時的に変化する可能性のあるその個々の帯域幅状況に応じて変化しないままであることを可能にし、データストリームには何も追加される必要がない。言い換えれば、メディアデータストリームとともに品質情報を受信機側に送信する必要はない。むしろ、受信機側の各クライアントにおける品質を決定するには、データストリーム部分についてルックアップテーブル内で提供されるパラメータで十分であり、すなわち、それぞれのクライアントに対して選択される品質対ビットレートの変動、及び、さらには、品質が決定され、いくつかのメディア部分が位置するテスト又は分析部分にさえかかわりなく、十分である。この方法では、例えば、品質の決定の基礎として、ITU-T J.247のような、主観テストに適合されている標準的な測定技法を利用することが可能である。
一実施形態によれば、識別子の導出は、例えば、ハッシュ関数をそれぞれのデータストリーム部分の非復号バージョンに適用することによって実施される。これによって、複数の異なる品質のデータストリーム部分、メディアコンテンツの複数の異なるメディア部分、及び、複数の異なるメディアコンテンツ自体の間で効率的に区別することが可能になる。特に、このタイプの識別子導出は本質的に送信における変化から保護される。すなわち、送信アーティファクト及びクライアントへの送信リンクに沿ったコード変換動作は十分に高い確率レベルをもって検索動作の失敗をもたらし、それによって、前もって誤って決定されたパラメータセットが品質の決定に使用される可能性はなくなる。前もって誤って決定されたパラメータセットは、結果的に符号化品質と基本的に相関付けられ得るが、メディアデータストリーム内の後続の変化とは相関付けられ得ない。したがって、識別が非復号バージョンによって、例えば、エレメンタリストリーム(ES)レベルで実施される場合、検索動作は送信アーティファクト及び/又はコード変換動作を検出することを暗に可能にもする。
サーバとクライアントを備えているネットワーク環境の概略ブロック図であり、それらのサーバとクライアントの間でメディアデータストリームの送信が、変動する品質対ビットレートで行われ、品質決定概念が一実施形態に従ってその環境内に適用される。 メディアデータストリーム及びそのメディアデータストリーム内に符号化されているメディアコンテンツ、並びにサーバ側における複数の異なる品質対ビットレートレベルの存在の概略図である。 一実施形態による品質決定のためのデバイスのブロック図であり、そのデバイスはオフラインで準備されたルックアップテーブルにアクセスする。 ルックアップテーブルを備えている一実施形態によるサーバの概略ブロック図であり、そのサーバは図3のデバイスと対話することができる。 一実施形態によるテーブル作成の流れ図である。 ルックアップテーブルを作成するための一実施形態によるデバイスの可能な実施態様のブロック図である。 受信機側の品質を決定するための一実施形態によるデバイスの可能な動作モードの流れ図である。 一実施形態によるパラメータセット決定の流れ図である。 サーバ側で利用可能なメディア信号の一部分の概略図であり、この信号におけるパラメータセット決定を示すように、基準信号の時間的に対応する部分を有する特定の一定の品質対ビットレートレベルを含んでいる。 送信アーティファクトを考慮に入れながら全体的な品質を決定する一実施形態による可能な実施態様の流れ図である。 ビットレート適応型メディアデータストリーム送信による一般的なサーバ−クライアントネットワークを示す図である。 OTT(オーバーザトップ:over-the-top)ストリーミングサービスの全体的なQoEを表し、4つの層によってモデル化されている4層OTT品質モデルの概略図であり、各層が担当のインフラストラクチャに含まれるパーティの手になるものである。
本発明の有利な実施態様が、従属請求項の主題を形成する。本出願の好ましい実施形態を、添付の図面を参照して下記により詳細に説明する。
図1はサーバとクライアントを備えた環境を示し、その中に本出願の一実施形態によるメディアデータストリームの品質を決定するための概念が使用されている。特に、図1は図11に示されているような送信リンクを示し、メディアコンテンツがプリコーディングされて記憶されているメディアデータベース10と、メディアデータベース10にアクセスすることができるサーバ12と、ネットワーク16を介してサーバ12に通信可能に接続されているクライアント14とを備えている。例えば、クライアント14は、ユーザの端末上で作動するコンピュータプログラム又はアプリケーションである。端末は、例えば、携帯電話、ノートブックなどのような携帯端末であってもよい。ネットワーク16は有線部分及び/又は無線部分を備えることができる。サーバ12は、例えば、コンピュータ又はコンピュータネットワークであり、メディアデータベース10は、例えば、1つもしくは複数のハードディスク又は他の不揮発性メモリを含む。
サーバ12とクライアント14との間の通信に関して、サーバ12は、例えば、メディアデータストリームを、ネットワーク16を介してクライアント14に送信する。例として、以下の説明は、メディアデータストリームが、メディアコンテンツとしてビデオを表すビデオデータストリームであると仮定するものとするが、後続の実施形態はオーディオコンテンツ、3Dグリッドモデルなどのような、他のメディアコンテンツ又は他のメディアデータストリームに容易に移行することができることに留意されるべきである。例として、図2は、メディアデータストリーム18及びメディアデータストリームとともに送信されるメディアコンテンツ20を示し、メディアコンテンツはここでは、すでに言及したように、例としてビデオである。
図2に示すように、メディアデータストリーム18は、メディアコンテンツ20の複数の異なるメディア部分24が、メディアコンテンツにわたって変化する品質対ビットレートで符号化されているデータストリーム部分22のシーケンスを含む。図2においては一例として時間的に変化するメディア信号の役割を果たすビデオ20は、図2において、例えば、ビデオの直接相互に隣接する連続したタイムスロットが個々のメディア部分24を形成するという点において、複数のメディア部分24に区分化されているものとして示されている。したがって、各メディア部分24は、ビデオ20の画像26のそれぞれのシーケンスを含む。
部分24が品質対ビットレートをもってデータストリーム部分22に符号化されており、その品質対ビットレートの変動は、クライアント14の側においてクライアントにおけるメディアコンテンツ又はビデオ20のリアルタイムの再生におけるデータストリームバッファのアイドリング、いわゆる「ストール(stall)」を回避するように、また、他方では、バッファの混雑状態を回避するように、例えば適切な基準に従って制御される。適応型ストリーミングはメディアデータストリーム18のhttpベースのストリーミング、例えばDASHなど、とすることができ、それに従って、サーバ12はクライアント14に、いわゆるMPD、メディア表現記述を介して、利用可能なダウンロード可能品質対ビットレートレベルに関する情報を提供する。そのレベルに基づいて、クライアント14内に位置する調整モジュールが、サーバ12からクライアント14までの効率的に利用可能な送信帯域幅にわたって行われる推定に応じて、かつクライアント14における現在のバッファ利用レベルに応じて、利用可能なレベルの間で選択を実施し変更することができる。
図2に示すように、メディアデータベース10は、例えば、各メディア部分24の各々の複数の品質対ビットレートレベルQ1〜Q4の各々について、内部に記憶されているデータストリーム部分を有する。それらのデータストリーム部分は、図2において長方形28によって示されている。したがって、実際にクライアント14に出力されるメディアデータストリーム18はデータストリーム部分22のシーケンス又はストリームから構成され、各データストリーム部分22は、異なる1つのメディア部分24と関連付けられ、かつ記憶されているデータストリーム部分28のうちのそのメディア部分24にとって利用可能な1つに対応する。例として、図2は、メディア部分24がメディアデータストリーム18内において時間t0、t1、t2及びt3の間が品質レベルQ1、Q3及びQ2で送信されることを示しているが、上述したように、この選択は個々のクライアント14に関する状況に応じて決まる。図2は、矢印30によって、状況に応じた品質対ビットレート調整を示している。すでに説明したように、この調整は、例えば、クライアント14によって実行することができる。
クライアント14において又はサーバ12とクライアント14との間の送信リンクに沿った異なる箇所においてメディアデータストリームの品質を決定するように、下記に説明する品質を決定する概念は、デバイス32がデータストリーム部分22から識別子を導出して、それに基づいてルックアップテーブル34において検索してデータストリーム部分22のパラメータセットを得て、1つ又は複数のテスト部分又は分析部分のためにそれらのパラメータセットを集約し、それから品質を決定することを可能にする。本明細書から明らかになるように、メディアデータベース10内に記憶されているデータストリーム部分28はこの目的のために変更される必要はなく、これによって、既存のメディアサーバインフラストラクチャ内に品質決定概念を導入することがより容易になる。その上、サーバ−クライアント通信に他の情報をさらに導入する必要はない。通信は影響されないままである。ルックアップテーブル34の内容は、テーブル36を作成することによって前もってオフラインで生成され、これによって、デバイス32の部分において品質を決定するのに関連する労力は手頃に低く保たれる。それにもかかわらず、下記により詳細に説明する品質決定のための概念は、特にデータストリーム部分i(22)のシーケンスの変動する品質レベルQiにかかわらず、主観的品質テスト方法、例えば、特定のテスト部分もしくは分析部分又は例えばいくつかのメディア部分24に及ぶ所定の時間間隔にわたる品質決定など、に適合されるための必要条件を構成する形態での品質決定を可能にする。
これまで言及してきたメディア部分24は実際には異なる意味を有し、単純にするためにのみ同一であるように記載されており、例えば、GOPのような、互いから別個のメディアデータストリーム内に符号化されているメディア部分、及び、そのパラメータセットが各事例においてテーブル34内に存在するメディア部分があることが留意されるべきである。例えば、前者のGOP、すなわち、画像シーケンスは、IPPP … PP画像シーケンスなどのように、互いから独立して復号可能である。そのようなメディアコンテンツの単位において、メディアデータストリーム18は、例えば、レベルQ1〜Q4にあるその品質対ビットレートを変更し得る。そのような各メディア部分24について、識別子が生成され得る、すなわち、品質対ビットレートの変動の粒度は、識別子生成の粒度と同一になり得る。しかしながら、これは必ずしもそうである必要はない。以下の説明は、識別子生成が相対的に小さい単位で、例えば、各画像26に対してのように、行われ得ることを明瞭に示す。参照符号24’を有するメディア部分は、それぞれの識別子を有するそれぞれのデータストリーム部分と関連付けられているようなメディアコンテンツ20の部分と常に関係する。GOP、すなわち、他のGOPとは別個に復号することができる自己完結型の画像シーケンスについては、特に各品質対ビットレートレベルに関して、いくつかの識別情報を含むいくつかのメディア部分24’、すなわちいくつかの画像、が存在することになる。データストリーム部分22は、常に、そのメディア部分24’と関連付けられることになる。対照的に、アポストロフィのないメディア部分24は、例えば、GOPのように、その単位においてビットレートが変動し得るような部分を示す。すでに言及したように、両方の単位/部分は一致し得るが、必ずしもそうである必要はなく、後続の実施形態によれば、たとえそれらの単位/部分がこの観点において、すなわち、1つの画像よりも大きいがGOPよりは小さいすべての中間形態、例えば、部分24’によって容易に可変であり得るとしても、これは実際にはそうではない。したがって、図2においてまた、部分24について、すなわち、N個の品質レベル及び部分24’となる部分24のM個の下位区分について、データベース内にM*N個のデータストリーム部分も存在し得る。
次に、デバイス32、又は、ルックアップテーブル34を備えているサーバ38の可能な設定について、図3及び図4を参照して説明する。
図3に示すように、デバイス32は、識別子生成器40と、検索ユニット42と、集約器44と、品質決定器46とを含む。図3に示すように、要素40〜46は直列に接続することができ、識別子生成器40はメディアデータストリーム18を受信し、品質決定器46はメディアデータストリームの品質48を出力する。
識別子生成器40は、入来するメディアデータストリーム18の各データストリーム部分22からそれぞれの部分24’に対する識別子50を導出する。検索ユニット42は、入来するメディアデータストリーム18のデータストリーム部分22に対する識別子50を取得する。検索ユニットは、各データストリーム部分22についてサーバ38のルックアップテーブル34内で検索して、各データストリーム部分22のパラメータセット52を取得し、検索ユニット42は、例えば、対応するクエリー54をサーバ38に送信し、応答56として、それぞれのクエリー内に含まれる識別子に関連するパラメータセットを取得するという点で、データストリーム部分22について導出された識別子50を用いて検索動作を実施する。データストリーム部分22のパラメータセットは、下記により詳細に記載するものとする。簡潔には、パラメータセットは、部分24’ごとに、例えば、それぞれのメディアデータストリーム部分22内に符号化されているそれぞれのメディアコンテンツ24’内の画像26ごとに、それぞれの画像26の符号化品質、より正確に言えば、干渉のない送信の場合にその画像26の再生品質を記述するいくつかのパラメータを含む測定パラメータであり、パラメータは、例として、符号化干渉が一切ないメディアコンテンツの品質、すなわち、元のメディアコンテンツの品質を記述する、部分24’ごとの1つ又は複数のパラメータを含むことも可能である。以下の説明において、さらなる詳細が与えられるものとするが、すでに言及したように、本出願及び下記に説明する実施形態はビデオには限定されないことが留意されるべきである。例えば、メディア部分24はまた、オーディオ信号の連続した時間間隔、又は、時間的に変化するグリッドモデルのタイムスロットなどでもあり得る。一般的に、関連付けられるデータストリーム部分22のパラメータセットは、符号化品質、すなわち、メディア部分24’の逸脱を記述し、そのメディア部分24’は、データストリーム部分22から再生可能であり、損失の多い符号化によっては導入されない元の符号化エラー、及び、任意選択的に、全体的なメディアコンテンツ24’の品質を含む。
集約器44は、所望のテスト部分又は分析部分のためのパラメータセット52を集約する。テスト部分は、例えば、一連のメディア部分24、及び、したがって、一連の部分24’にわたって延伸する。図2に関して、テスト部分は、例えば、時間t0〜時間t6まで延伸し得る。テスト間隔の長さは、特定の最小持続時間、連続性、すなわち、時間の空白がないこと等に関する基準のような、対応する主観的FR品質テスト方法の必要とされる基準を満たす。したがって、集約器44は、例えば、図2におけるt0〜t6のような、メディア信号のテスト部分内に位置するメディア部分24’を送信するデータストリーム部分22に対して検索されたパラメータセット52の集約58を出力する。上記の説明から明らかになっているように、集約パラメータセット52は、複数の異なる品質レベルに由来し得る。
したがって、品質決定器46は、複数の集約58、すなわち、メディアコンテンツ20の対応するテスト部分内に位置するメディア部分24’の全てに対するものを取得し、上記パラメータセット52の集約58に基づいて、品質決定器は品質48を決定し、これに関する詳細は下記により詳細に説明する。
完全を期すためにのみ、図4は、ルックアップテーブル34を含む図1のサーバ38を示す。メディアデータベース10内の各データストリーム部分28について、ルックアップテーブル34は、エラーのない送信の場合に識別子生成器40によってデータストリーム18の部分22として生成されているような、識別子60を内部に記憶しており、かつ、そのデータストリーム部分と関連付けられるか又はそのデータストリーム部分28と関連付けられるメディア部分24’から生成されているパラメータセット62を内部に記憶している。図4に示すように、各パラメータセット62は、例えば、N個の異なるパラメータを備え得る。パラメータセット62は、各事例において、メディア部分24、すなわち、例えば画像26に関係し、いくつかのメディア部分24’はメディア部分24内に位置し得、その単位において、クライアントはフェッチされるビットレート及び/又は品質に関して変化させる。サーバ38はクエリー応答器64を含み、クエリー応答器64はルックアップテーブル34に接続されており、デバイス32から入来し特定の識別子を含むクエリー54に対して、このパラメータセット62を返信56においてデバイス32に返すように、テーブル34内でこの識別子のために記憶されているこのパラメータセットによって応答するように構成されている。
デバイス32とサーバ38との間の通信54及び56も、ネットワーク16を介して、例えば、インターネット接続などを介して行なうことができる。サーバ38は、サーバ12及びメディアデータベース10とは別個の、それ自体のサーバとすることができる。ルックアップテーブル34は、例えば、不揮発性メモリ内で具現化することができ、クエリー応答器64は、例えば、コンピュータ又はコンピュータネットワークによって実装することができる。デバイス32は、クライアント14も実行されているそのモバイルデバイス上で実行されるアプリケーションであってもよいが、無論、デバイス32の異なる構成及び実施態様も可能である。
上記の説明からすでに明らかになっているように、データストリーム部分から取得される識別子によってパラメータセットを検索する手法の利点は、パラメータセット決定、及び、したがって、ルックアップテーブル34の設定、すなわち、テーブル生成36を、オフラインで前もって、すなわち、クライアント14へのメディアストリーム送信が実際に行われる前に実施することができることにある。完全を期すためにのみ、次に、図5はテーブル生成36の1つの可能性を示す。この可能性によれば、メディアデータベース10内の各データストリーム部分28について、識別子生成66が、特に妨害のない送信の場合に識別子生成器40を用いて生じるのと同じ識別子が結果として生じるように実施され、かつパラメータセット決定68が実施される。
これまでで、品質決定概念に関与する要素の概説が図1及び図5を参照して与えられたので、例えば、要素のこの概念又は相互作用、がどのように実施され得るかの説明を例として、具体的な用語で下記に与えるものとする。これに関して、比較的に特定的な説明が、例えば、パラメータセットに関連して与えられるが、この説明は上述した他の要素に関連しても与えられ、それらの具体化の可能性のすべては、上記の以前の実施態様に個々に適用可能であることが理解されるべきである。これが、下記において図1から図5が繰り返し参照される理由であり、可能であるかぎり図1から図5の説明に使用されている参照符号が再使用される。
本出願の説明に対する導入部において説明したように、メディアデータ転送における重要な質問は、最終的なユーザの元に実際に届くメディアデータの品質のタイプに関するものである。以前の図面に関連してすでに大まかに説明したように、この決定は、前もって取得されるパラメータにアクセスすることによって行うことができる。図1に記載されているように、これに関与するものは、メディアデータベース10を分析するテーブル生成モジュール36、メディアデータベース10から計算されるパラメータセットを記憶するためのデータベースを提供するルックアップテーブル34、及びデバイス32、すなわち、現在の品質を計算するために、例えばクライアント側で利用されるデバイスである。
最終的なユーザ又はクライアント14におけるメディアデータの全体的な品質の評価において、原則として、以下の2つの外乱パターンが留意されるべきである。
1)符号化品質。これは、とりわけ、使用される符号化方法、及び平均ビットレートのような使用される設定に依存する。及び、
2)送信品質。これは送信チャネルにおける現在の外乱を記述するものである。送信品質は、パケット損失、ビットエラーなどのような外乱を考慮に入れる。
これまでの図1〜図5の以前の説明は、実際には符号化品質のみに対処している。例えば、説明したような識別子生成が例として非復号領域内で行われるとき、それによって、欠陥のあるデータストリーム部分は検出可能に欠陥のある識別子をもたらすことがすでに十分に保証されている。というのは、例えば、各事例において関連付けられるメディア部分24について、欠陥のあるデータストリーム部分は、現在のメディアコンテンツ20のそのメディア部分24のルックアップテーブル34内に記憶されているデータストリーム部分28のいずれとも一致しないからである。下記に説明するように、品質決定器46が、パラメータセット52の対応する集約58から1つ又は複数のテスト部分について決定されるとともに符号化品質を反映する品質と、品質外乱の量に関する推定とを組み合わせて、全体的な品質を取得することが可能である。
信号の全体的な品質を、符号化品質及び送信品質の規定の部分領域に分解することによって、客観的な方法で、品質予測に必要とされる計算能力を最適化することが可能になる。ここで、符号化品質は、送信チャネル内の現在の外乱には依存しないことが留意されるべきである。それゆえ、原則として、複数の異なる入力シーケンス及び符号化設定について、すなわち、テスト部分全体にわたって、前もって符号化品質を完全に計算することが可能である。しかしながら、本出願の説明に対する導入部において説明したように、ビットレートが、テスト部分よりも小さい時間単位においてクライアントごとに個々に変動するというだけの理由で、これは困難である。言い換えれば、符号化設定は、送信チャネルの現在の状態に応じて絶えず変化する。加えて、全体的な品質は、上記で言及した品質レベルの間で線形に連結するというだけのものではない。それゆえ、上記において「パラメータ」と称されており、下記において「インジケータ」と称されることがあるベンチマークデータを前もって決定し、実際の送信特性に応じて品質を推定するためにこのデータを使用することが、より意味のあるものなっている。
図6は、ビデオの例をメディアコンテンツとして使用することによって、メディア送信のためのパラメータセットを前もって決定するためのデバイス、すなわち、テーブル生成36を実施するのに適しているデバイスを示す。
見て分かるように、図6のデバイスは、復号器70、分割器72、評価器74、識別子決定器76、ならびに、基準メディアコンテンツ、ここでは特に基準ビデオを受信するための入力78、一定の品質対ビットレートレベルでメディアデータストリームを受信するための入力80、及び、ルックアップテーブル34のデータベースエントリ又はルックアップテーブルエントリ、すなわち、識別子60と、関連付けられるパラメータセット62との対を出力するための出力82を含む。分割器72は、3つの入力、すなわち、入力78に接続されている入力と、入力80に直に接続されているさらなる入力と、入力80におけるメディアデータストリームの復号された又は再生可能なバージョンを取得するように復号器70を介して入力80に接続されている第3の入力とを備え、当該メディアデータストリームは、例えば、テストビデオが復号器70の出力に又は分割器72の入力に存在するように、図6に示すように、例えば、H.264を用いて符号化することができる。分割器72は、入来する基準ビデオ、入来するテストビデオ、及び入来するメディアデータストリームを、基本的にそれらのサイズに関して以前に言及したテスト部分に対応する視聴期間に分割し、各視聴期間について、入力80におけるメディアデータストリームの対応するデータストリーム部分22を識別子決定器76に転送し、それぞれの視聴期間内にあるテストビデオからのフレーム26のようなメディア部分24’、及び、基準ビデオからの対応する部分、例えば、画像を評価器74に転送する。単純にするために、視聴期間への分割はいかなる空白もなしに行われることが下記において仮定されるので視聴期間が互いにシームレスに隣接するが、そうでない場合も実現可能である。
識別子決定器76は、上述したものと同じように、かつ/又は、デバイス32内の識別子生成器40によって行われるものと同じマッピングを用いて、入力するデータストリーム部分22のすべての識別子を決定する。識別子生成器はハッシュ値形成を含み得るが、識別子はまた、識別性の理由で、ハッシュ値と、例えば、メディアライブラリ10内の個々のメディアコンテンツに割り当てられているさらなるIDとの合成でもあり得ることに注意すべきである。
評価器74内の評価は、下記により詳細に説明するように行われ、各メディア部分24’について、各視聴期間から、対応するメディアコンテンツ24’が符号化されているデータストリーム部分22から取得されている識別子と関連付けられている対応するパラメータセットをもたらす。
たった今説明したプロセスは、基準ビデオが入力78に存在していかなる符号化損失もなくメディアコンテンツを表している間、対応するメディアデータストリーム18が入力80に与えられるという状況において、メディアデータベース10内に存在するそれぞれのメディアコンテンツ又はビデオ20の品質対ビットレートレベルの各々について繰り返される。品質対ビットレートレベルは各時点において一定のままである。より具体的には、入力80におけるメディアデータストリーム18のデータストリーム部分22は各時点において、すべてのデータストリーム部分22について同一である品質対ビットレートレベルにおいて関連付けられるメディア部分24’を表し、このレベルは、連続する時点の間で変化させられる。このように、識別子と、関連付けられるパラメータセットとの対は、すでに説明したように、メディアコンテンツ20の各メディア部分24’の各品質対ビットレートレベルについて、ルックアップテーブルをもたらす。
したがって、原則として、図6の評価器74は図5のパラメータセット決定64を採用し、識別子決定器76は図5の識別子生成66を採用する。分割器72は、図6の実施形態においては、パラメータセットを取得するために評価器74によって実施される評価と相関する視聴期間への分割を実施する。視聴期間は、デバイス32内の品質決定器46によるテスト部分の選択に使用されるものと同じ基準を満たすことができるような期間である。したがって、視聴期間は、例えば、いくつかのメディア部分24にわたって延伸し得る。それにもかかわらず、評価器74は、視聴期間の評価から、現在の視聴期間内にあるメディア部分24’ごとにパラメータセットを生成する。
それゆえ、より具体的には、基準ビデオ、それぞれの一定の品質対ビットレートレベルを含む送信されるべきメディアデータストリーム、及びメディアデータストリームから復号されるテストビデオは、それらの元の長さにおいて、図6のデバイスに対する入力として役割を果たす。評価器74は、主観テストをマッピングするように、例えば、ITU−T J.247又はITU−T J.341のような客観的テスト方法を使用することができる。そのような客観的テスト方法は、そのようなテストに使用される画像シーケンスに対して適合される。そのような画像シーケンス又はそのような視聴期間の持続時間は、各場合を含めて、例えば、10〜16秒、又は6〜20秒である。このように、分割器72は、例えば、基準ビデオ、テストビデオ及び入来するメディアデータストリームをそのような視聴期間に分割し、このように分割されている基準ビデオ及びテストビデオを評価器74に転送する。評価器74内で実施される客観的測定技法の中で、パラメータ又はインジケータ、すなわち、パラメータセットがその後、視聴期間72内の各メディア部分24’について、例えば、それぞれの視聴期間72内の各画像26について決定される。パラメータセットを抽出するために利用される可能性があり得る方法を、以下より詳細に説明する。また以下、パラメータ又はインジケータも説明する。
例えば、分割器72によって基準ビデオ及びテストビデオが分割される視聴期間の評価において、各画像のような各部分24’についてパラメータセットがもたらされるように、識別子決定器76は、各メディア部分24’について、例えば、各画像26について、それぞれのデータストリーム部分22から識別子を決定する。識別子は下記において識別要素とも称される。識別要素は、ビットストリーム18内で符号化されている部分24’とデータベースエントリとの精密な関連付けが後の時点において可能であるように、部分24’に関連して計算される。識別要素として、例えば、明確に決定されるべきMD5和又は異なる「ハッシュ(HASH)」和を使用することができる。
上記ですでに説明したように、インジケータ又はパラメータセットはその後「ハッシュ」和とともに、さらに、任意ではあるが可能性としては、例えば画像形状に関する情報のようなさらなる制御要素とともに、データベース内に記憶される。したがって、符号化品質を決定するために必要などのような情報も、複数のビデオシーケンス及びフレームレベルでの符号化設定についてデータベース34内で利用できる。
図7は、現在送信されている信号又はクライアント14に送信されているメディアデータストリーム18の全体的な品質を推定する方法を示す。この方法は、デバイス32、例えば図3のデバイスによって実施されるが、図3の機能は、下記に説明するように、図7の方法を実施するために補完されている。すでに述べたように、たとえ説明がビデオ以外のメディアコンテンツにも容易に転用することができるとしても、説明はビデオストリームについて示されている。
図7に示すように、入来するメディアデータストリーム18は最初にデータストリーム分析86を受け、データストリーム18は、すでに述べたように、例えば受信機に、又は一般的に言えばクライアント14のような受信機側に到来するものである。メディアデータストリーム18を取得するために、データは例えばネットワークカードから取り出されてもよい。データストリーム分析86において、ビデオ関連データ又はここでは例としてビデオデータストリームであるメディアデータストリーム18が、パケット損失、ビットエラー、時間遅延、パケット反復などのような送信アーティファクトについて分析される。その分析は、例えば、識別子生成器40と並列に接続され、かつ/又は、メディアデータストリーム18も取得する送信アーティファクト分析器又は検出器186内で実施することができる。その分析結果に基づいて、その後、送信リンクの外乱を記述する現在の送信品質がステップ88において推定できる。それと同時に、データストリーム要素22のシーケンスが、入来するメディアデータストリーム18から、すなわち、例えば、画像レベルにおいてなどの画像部分24’ごとに又は各ビデオフレームについて抽出される。データストリーム要素22のシーケンスは例えばH.264ビットストリームを表し、それを用いて識別子又は識別要素が計算される。識別子決定90が、例えば、識別子生成器40によって実施される。すでに述べたように、ステップ66において又は識別子決定器76においてデータベースを生成するために利用されるものと同じアルゴリズム又は同じマッピングが、ステップ90において計算される識別要素に利用される。それゆえ、送信外乱に起因して「ハッシュ」値又は識別子を決定することができない場合、画像部分24’とルックアップテーブル34内のエントリとの明確な関連付けを行うことができ、このステップは、図7においてデータベース検索92と称され、図3内の検索ユニット42によって実施されるステップである。各画像部分24’例えば画像26について検索されるインジケータ又はパラメータセットは、その後、現在の符号化品質の計算、すなわち、符号化品質推定のステップ94に使用される。このステップ94は、図3の集約器44及び品質決定器46によって実施される。このための唯一の必要条件は、デバイス32が、すでに確立されているデータベース34にアクセスできることである。これは、例えば、損失のないデータラインによって、又は前もってすでに送信されているデータベース34によって保証することができる。符号化品質推定94のプロセスのより詳細な説明は下記で行う。
この点において留意すべきことは、これまで説明した実施形態は、例えばHLS(HTTPライブストリーミング:HTTP Live Streaming)のような最新のストリーミング方法もサポートするということである。
ステップ96は、ステップ88の推定送信品質とステップ94の推定符号化品質に基づいて最終的に全体的な品質を推定することを含む。このステップは、例えば図3の品質決定器46によって、送信品質推定88ができるように実施することもできる。
したがって、上記の実施形態は、適応型ストリーミング方法が既存の送信チャネル容量に応じて複数の異なる符号化品質を利用する課題を解決する。符号化品質は、送信チャネル特性が変化する場合は、送信中に変更することさえできる。フレームレベルにおける任意の数の品質組み合わせを記憶するルックアップテーブル34の利用によって、上記の実施形態に従って適切なインジケータを常に抽出することができる。
パラメータセット決定器64又は評価器74がどのように構成され得るかのより詳細な説明は下記に述べる。すでに説明したように、実際に良好な品質予測をもたらすことがすでに証明されている確立された標準的な測定技法を、インジケータ又はパラメータセットの抽出に使用することができる。例えば、ITU−T J.247の名称でITUによって標準化されている方法を使用することができる。完全を期すために、他の非標準的な方法又はNR方法もパラメータセットを取得するために使用することができるが、それは一般的に、測定精度に関して損失を伴うことにも注意すべきである。
図8は、特に図6の評価器74によって実施され得る可能なステップシーケンスの一例を示し、評価器74が、視聴期間についてのパラメータセットを決定するために、復号によって受信メディアデータストリーム18から取得されるテストビデオと、関連付けられる基準ビデオの両方を取得することが仮定されている。しかしながら、以下の説明は、パラメータセットを生成するとき視聴期間に分割することが絶対に強制されるというものではないことを示す。視聴期間への分割は、パラメータセットを生成するための十分に標準化された測定技法を使用することをより容易にするに過ぎない。
入力パラメータとして、視聴期間に分割されている基準ビデオからの時間部分、ならびに、評価対象であり、符号化外乱を呈する可能性があるビデオに由来する対応する時間部分が、図8のパラメータセット抽出方法に与えられる。時間的視聴期間及び/又はテスト部分の持続時間は、客観的測定技法の評価のもとになる主観テストの一般的な持続時間と、可能性のある品質切替え部分24が指定されるストリーミング方法の要件との両方に応じて決まり得る。例えば、HLS方法において、転送部分24は、理想的には上記長さの整数倍が選択されるように、個々のファイルとして存在する。一般的な値は、各場合を含めて、例えば、4〜14秒又は2〜25秒の部分長である。
視聴期間に対応する基準ビデオの部分とテストビデオの部分との間に時間的なずれはないことが保証されている。必要なら、フレームを時間的に関連付けるためのアルゴリズムが利用される。
準備100、すなわち第1のステップにおいて、個々の部分が読み込まれ、内部画像表現に変換される。このステップは任意であり、画像表現変換が必要とされない場合には省略してもよい。
信号分析102において、個々のビデオ部分、すなわち、それぞれの視聴期間又はそれぞれのテスト部分が分析され、画像レベルで特性化される。ここでは画像シーケンス分析が行われ、変化する画像シーケンス及び個々の静止フレーム部分が認識される。このブロックにおいて、元のビデオとテストビデオが別個に分析される。
後続のステップ104は、色マッチングを実施することを含む。このステップは、個々のグレースケール及び色成分のヒストグラム分析を含み、その後、元のビデオとテストビデオとの間の分布が適合される。わずかに異なるシステム色表示(色表現)及びシステム歪みは、一般的には観察者によってほとんど認識することができないため、ここで取り除かれる。除去する結果として、後続のインジケータ分析106が、この欠陥のある色表示(誤った色表現)及び歪みに反応しなくなる。
特に、インジケータ分析106は、品質評価に関連する外乱要素のセット、すなわちパラメータセットを抽出することを含む。パラメータセットの計算は、テストビデオ内で、各事例において、部分24’について、すなわち例えば各事例における画像について実施され、それによって、各フレームについてパラメータセットが利用可能になる。すでに述べたように、メディア部分24’が1つだけのフレームよりも大きくなる別の例も実現可能である。パラメータ又はインジケータの特性は下記に詳細に説明される。
上述したように、パラメータ又はインジケータのセット62は、その後、特にそれぞれの識別子60とともに又はそれと関連付けられて、データベース又はルックアップテーブル34内に記憶される。それぞれの識別子60は、データストリーム部分22から取得されたものであり、それぞれのメディア部分24’、例えば、ここでは個々の画像、を符号化された形態で含み、セット62はメディア部分24’について決定されている。図8に示すように、そのセット62のインジケータは、後の時点において後処理するために、制御要素とともにバッファリングすることが可能である。そのような制御要素の例は上記ですでに述べた。データベース又はルックアップテーブル34の設定は、この時点では自由に選択可能であり、サイズならびに既存のソフトウェア及びハードウェアの要件に応じて決まる。ここで利用することができるデータベースの一例として、MySQLを挙げることができる。識別子を生成することによって、関連するパラメータ又はパラメータセット62だけでなく、識別子60、画像又はフレーム、すなわち、テストビデオ内のメディア部分24’の間の明確な関連付けが保証されることは言及する価値がある。セット62の個々のインジケータ値は、例えば、IEEE浮動小数点数として利用できることも留意されるべきである。J.247がパラメータの生成に使用される場合、データベースエントリ82は、例えば、セット62の6つのパラメータ、1つの識別子60、及び、任意ではあるが1つの制御要素から構成することができる。
以前の実施形態についてパラメータがどのように選択され得るか、すなわち、それらのパラメータがいずれの次元を有し得るか、それらがどのように生成されるかなどの可能性は、下記において検討する。しかしながら、以下の説明は例示に過ぎず、無論、変動の可能性があることに留意されるべきである。同じく上記ですでに述べたように、例として、以下の説明において、パラメータセットが、個々の画像又はフレーム26に対応するメディア部分24’について決定されることが仮定される。J.247を使用し、又はそれに従いながら、計算が実施される。しかしながら、テストビデオ内の各フレーム、すなわちメディアコンテンツの再構成されたバージョン、についてどのようにパラメータが計算されるかについての概要のみが下記において与えられる。詳細な数学的説明については、さらに、参照により本明細書に組み込まれるrecommendation ITU−T J.247、特にチャプタB.1.10も参照されたい。
後述する実施形態によれば、それゆえ、以下の分析、すなわち、以下の1つ、いくつか又はすべてが図1のテーブル生成36において、インジケータ分析106において、又は評価器74によって実施される。
類似度分析
類似度分析に関し、例えば、この事例における、つまり一例としての各画像26やビデオ20の各メディア部分24’の再構成されたバージョンと、基準ビデオ120の対応する部分124’との間の類似度の相関ベースの尺度が決定される。読者には再び、分析が一般的にオフラインで行われることを想起されたい。ビデオ20は、符号化によって、一定の品質対ビットレートレベルを有するデータストリーム部分のシーケンスから構成されるメディアデータストリームに由来するものである。本発明の実施形態において、メディア部分24’は個々のフレームであるため、したがって、類似度分析は、テストビデオ20の画像26を、符号化損失によって損なわれていない基準ビデオ120の時間的に対応する画像126と比較する。テストビデオ20と基準ビデオ120内の画像26又は126の時系列を示すために、それらのビデオの2つの連続する画像を図9に示し、例としてインデックス1と2によって区別する。相関ベースの尺度を計算するために、複数の異なる画像部分における画像領域にわたって、例えば画像261と1261との間の相関が決定され、局所的に取得された相関の適切な平均に基づいて相関ベースの尺度が決定される。したがって、例えば、テストビデオ20からの、特にテスト部分からの画像261と基準ビデオ120の時間的に対応する画像1261が個々の画像領域130に分割され、基準ビデオとテストビデオとの間のこれらの領域130における相関が決定され、例えば、平均相関値が類似度尺度及び/又は相関ベースの尺度として決定されて、パラメータの1つが取得される。画像の領域構造における外乱が、このインジケータ又はパラメータを用いて特に強調される。類似度分析は、テスト部分又は視聴期間内で、各メディア部分24’、すなわちここでは各フレーム26について決定される。
エッジ分析
エッジ分析は、各画像26及び/又は各メディア部分24’について、それぞれの画像26内に存在するエッジと対応する画像126内に存在するエッジとの間の差の尺度をもたらす。それらのエッジは、例えば、画像26及び126の輝度面内で、及び/又は輝度成分から決定される。区別する基準として、例えば、画像26及び126から取得される対応するエッジ画像の単なる減算が使用される。エッジ差分の1つの尺度を達成するために、画像領域にわたる適切な平均化を再使用することができる。平均化は、例えばL5ノルムに基づくことができる。言い換えれば、エッジ分析は、基準画像とテスト画像の輝度面内のエッジ画像を比較し、それらを差分について調査することを含む。インジケータ値を決定するために、外乱の平均化が、例えば、重み付きL5ノルムによって実施される。画像を見るとき、目はエッジによって方向付けられることが多い。それゆえ、エッジ外乱は特にはっきりと知覚される。
ブロック分析
ブロック分析はテスト部分内の各画像26及び/又はメディア部分24’におけるブロック外乱の尺度をもたらす。ブロック形成は、最新の「コーデック」によって生じる高頻度のエラーカテゴリである。この外乱は、「ブロック歪み(blockiness)」又は「タイリング(tiling)」と称されることもある。このエラーは、エッジ分析と同様に計算される。しかしながら、この値については、元の画像126と比較してテスト画像26において追加されているエッジのみが評価される。例えば、ブロック外乱の尺度を達成するように、ここで重み付きL2ノルムを用いて局所平均化を実行することができる。他の分析、すなわち、類似度分析及びエッジ分析ならびに後続の分析と同様に、ブロック分析は、視聴期間及び/又はテスト部分内の各画像26について実施される。
色度(chrominance)分析
色度分析はそれぞれの画像26と対応する元の画像126内の色度平面の差の尺度をもたらす。この尺度及び/又はインジケータの値は、画像の色度平面の差に基づく。その結果、インジケータ値を決定するための元の画像とテスト画像との間の正規化画像点の、例えば差分の加重平均がもたらされる。
外乱の時間的経過の分析
外乱の時間的経過の分析は、テストビデオ20の画像26内に存在するエッジの時間的変化と、基準ビデオ120の対応する画像126内に存在するエッジの時間的変化との差の尺度をもたらす。テストビデオ20の画像262のエッジの時間的変化が決定されるのは、例えば、この画像262及び時間的に先行する画像261のエッジ画像が最初に、ここでも輝度レベル内などで決定され、かつこれら2つの時間的に連続するエッジ画像の差が、基準ビデオ120において時間的に対応する画像1261と1262から取得されたエッジ画像の対応する差と比較されるからである。他の分析オプションと同様に、エッジ画像は、例えば、対応するハイパスフィルタリングによっても決定される。これらの時間的変化の差の尺度を達成するために、適切な局所平均化を再使用することができる。外乱の時間的経過の分析に対する背景には、時間的変化を呈する予期せぬ外乱が観察者によって非常に悩ましいものとして知覚されるということがある。この外乱カテゴリを評価するために、基準ビデオとテストビデオのエッジ画像の時間的変化が、発生したときにログ記録される。ここで計算されるインジケータは、基準画像126とテスト画像26との間の、現在の画像又はフレームに関するエッジ画像の変化の差を記述するものである。観察者は外乱が加わっているか又は一部分が除去されているかに応じて別様に反応するため、このカテゴリについて2つのインジケータ又はパラメータを計算することができる。すなわち、ここでの局所平均化が、外乱が加わっている場合には重み付きL5ノルムを用いて、部分が失われている場合には重み付きL2ノルムを用いて実施される。しかしながら、これらは例に過ぎず、結局のところ、そこから逸脱が生じる可能性があり得る。
上記の分析及び結果的にもたらされるパラメータのすべてが組み込まれる場合、6個のパラメータが各パラメータセット62をもたらす。これら6個のパラメータは、そのパラメータセット62に属するものとしてテーブル34に記憶されている識別子と明確に関連付けられているデータストリーム部分からの結果として、それぞれのメディア部分、ここではそれぞれの画像を記述するものである。
続いて、品質決定器46又は符号化品質推定94による品質決定の可能な実施態様の詳細を説明する。上記で概説したように、画像面内の、例えば、すなわち単一画像サイズのメディア部分24’についてのインジケータ及び/又はパラメータをデータベース34内に記憶することによって、後の時点において、デバイス32内で、受信機側で取得されるビデオシーケンスの部分、すなわち、テスト部分及び/又は視聴期間についての品質を計算することが可能になる。それゆえ、下記において、受信機側における符号化品質推定を実施するデバイス32のより詳細な説明を行う。デバイス32は、個々のインジケータ及び/又はパラメータにのみアクセスすればよい。上述したように、上記アクセスのために、そのデバイスは識別要素又は識別子を使用する。すべての画像及びすべての品質レベルに関するエントリ82がデータベース34内で利用可能である。
しかしながら、可能な実施態様の詳細の説明を続ける前に、テーブル34内のパラメータセットに基づく受信機側符号化品質決定の視聴期間が、パラメータセットを生成するためにオフラインで使用される視聴期間、又は受信機側でテーブル生成のためにオフラインで使用される視聴期間に一致する必要はないことが留意されるべきである。異なる開始時刻及び終了時刻が可能である。これに関して、視聴期間内又はテスト部分内に中断が生じないことを確実にすることが有利であり得る。このように、実際の品質曲線を推定するように、最新のストリーミング方法の切り替えプロセスを検出することが可能である。
図10は、符号化品質推定94又は品質決定器46内での品質決定の可能な実施態様の流れ図である。メディアコンテンツ及び/又はビデオの現在の視聴期間又は現在のテスト部分についての、検索によってデータベース34内の識別子50を用いて取得されるパラメータセット52、及び/又はその集約58(図3参照)が、最初にステップ150における平均化、すなわち経時的な平均化を受けて、それによってその後、平均化の結果に基づいて、ステップ152において符号化品質推定が実施される。それゆえ、より具体的には、実際に送信されたデータストリーム18からデバイス32によって計算された識別要素又は識別子を用いて、データベース34からの関連付けられるパラメータセット及び/又はインジケータ52が決定されて、対応する平均化モジュールにおける平均化150を受ける。平均化を受けるパラメータセット52の数は、図2に関連して説明されたような視聴期間内のフレーム26の数、すなわち、その中で符号化品質推定が実施されるべき視聴期間及び/又はテスト部分に対応する。
平均化150は、個々のインジケータ及び/又はパラメータを経時的に平均化することを含む。例えば、異なるインジケータカテゴリ及び/又は異なるパラメータのカテゴリに対して、異なる平均化プロセスを使用することができる。インジケータ及び/又はパラメータごとの以下の平均化技法が可能である。
・類似度分析のインジケータ
このインジケータの平均化1は、個々の値を、要素の時間経過にわたって後続のL2ノルムを用いてロジスティックにマッピングすることによって実行される。
このインジケータの平均化2は、個々の値を、要素の時間経過にわたって後続のL4ノルムを用いてロジスティックにマッピングすることによって実行される。
・エッジ分析のインジケータ
このインジケータの平均化1は、個々の値を、時間的要素にわたって後続のL2ノルムを用いて線形的にマッピングすることによって実行される。
このインジケータの平均化2は、個々の値を、時間的要素にわたって後続のL2ノルムを用いてロジスティックにマッピングすることによって実行される。
・ブロック分析のインジケータ
時間的に平均化されたインジケータ値は個々の値の最小値である。
・色度分析のインジケータ
このインジケータの平均化は要素のL1ノルムによって実行される。
・外乱の時間的経過を分析するためのインジケータ
導入されている外乱のためのインジケータの平均化はL1ノルムによって実行される。
除去されている部分のためのインジケータの平均化はL1ノルムによって実行される。
その後、測定されるべき部分の品質推定152が、時間的に平均化されたインジケータを用いて実施される。この目的のために、個々の時間的に平均化されたインジケータは、ロジスティック関数に供給され、その後、線形平均化を受ける。ロジスティック関数のパラメータはここでも、フレームサイズに応じて決まる。
送信信号の全体的な品質はステップ96において、符号化品質と送信品質を統合することによって決定される。ここで、1つの符号化品質値の最大値は各視聴部分について計算されることに留意されるべきである。例えば、送信外乱に起因してデータ関連付けが可能でなかったために失われている任意の視聴部分は、送信外乱を考慮に入れながらの補間によって計算することができる。全体的な品質の推定の方法として、単一の数値が決定されてもよく、又は、品質レベルの分布がヒストグラムの形態で示されてもよい。
それゆえ、ここでも結局のところ、上記の実施形態がほとんどビデオに関係していることは例に過ぎないことに留意されるべきである。しかしながら、上記の実施形態は、オーディオ信号に容易に転用することができる。品質決定の組み合わせ、すなわち、オーディオ信号とビデオ信号との組み合わせの品質の決定も実現可能である。識別子生成に関して、一実施形態によれば、識別子生成は必ずしも非復号領域、例えば、エレメンタリストリームレベルにおいて行われる必要はなく、また、特に、必ずしもハッシュ値形成を用いて行われる必要はないことに留意されるべきである。むしろ、識別子を生成するために、対象になっているデータストリーム部分の復号バージョンの部分を使用することも可能であり得る。しかしながら、上述したバージョンが好ましく、それによれば、識別子を決定するために、それぞれのデータストリーム部分の非復号バージョンが、少なくとも大部分、例えば、その80%超について、マッピング、例えば、ハッシュマッピングに供給され、その結果として、その部分内の小さい変化又は個々のビットエラーにも関連する異なる識別子がもたらされ、それによって、データベース10内でのデータストリーム部分28の確実な識別性が保証される。
上記では指摘していないが、デバイス32、ルックアップテーブル34、及びテーブル生成32によって実現される品質決定サービスは、決済システムの対象にすることができることが自明である。言い換えれば、品質決定概念は、無論、商用利用することができる。各デバイス32に対して、各品質決定プロセスに対して、各テーブル生成32に対して、テーブル34へのアクセスごとに、テーブル34の提示の持続時間及びサイズに対して、又は他の適切な選択肢に対してロイヤルティ収入を受け取ることができる。
図7の記載が明瞭にしているように、図3に関連してすでに説明した要素に加えて送信アーティファクト検出器186を備えてもよく、その送信アーティファクト検出器186がメディアデータストリーム18の不完全に受信された部分を検出する。品質決定器46は、不完全に受信された部分に対して、メディアデータストリーム18の送信アーティファクトの定量化88をオンラインで実施し、ステップ96における全体的な品質の決定において、不完全に受信された部分について決定された送信アーティファクトを使用するように構成することができる。
データベースのオフライン生成に関して、視聴期間に分割することに関連してそこで説明した可能性を省くこともできることに留意されるべきである。パラメータの生成はまた、個々のメディア部分24’に対するいかなるそのような分割もなしに実施することもできる。
すでに説明したように、テスト部分の集約パラメータセットの統計的分析を、集約パラメータセット内に含まれる異なるパラメータに対して異なる統計的評価が実施されるように、例えば、異なるパラメータの中心傾向及び/又は分散に対して異なる統計学的モーメント及び尺度が決定されるように実施することができるが、これらは、例として上記で言及したものには限定されない。
上記で概説した実施形態の利点及び効果をより現実的に示すために、4層品質モデルが使用され、図12を参照して下記に示す。この4層品質モデルは、送信中にアーティファクトに寄与し得る異なるソースを反映する。
コンテンツ品質:元のコンテンツを、非圧縮、又は非常に高いビットレートでほんの緩やかな符号化のいずれかで、優れたスタジオ品質で提供することができる。それゆえ、「コンテンツ品質」という用語は、元のコンテンツの利用可能な最も高い品質を指す。この品質は、元の画像、又はフレームのサイズ(UHD、HD、又はSD)、順次走査もしくはインタレース走査と、元のフレームレート(29.97、25、又は24フレーム/秒(fps))によって定義される。原ビデオコンテンツは、莫大な記憶/送信リソースを必要とするが、符号化された後に記憶でき、配信できる。
メディアストリーム品質:IPを介した配信のためには、ビデオは様々な配信フォーマットに整合するようにコード変換(すなわち、より効率的に再符号化)される必要がある。この層を、「メディアストリーム品質」と称する。この段階における圧縮ビデオの品質は、元のコンテンツの品質+符号化品質によって定義される。符号化品質は、符号化パラメータとともに主に符号化器のタイプによって決定される。符号化器のタイプはほとんどがH.264であり、符号化パラメータは主に出力ビットレートである。符号化品質の決定には、いくつかの他の設定も関与する。そのような設定に含まれるのは、目標フレームレート、I、B及びPフレーム又は画像の比、ならびに、符号化効率に影響を与える他の選択の可能性、すなわち、エントロピー符号化の好ましいタイプである。そのようなエントロピー符号化としては、CAVLC(コンテキストベース適応型可変長符号化:context-based adaptive variable length encoding)又はCABAC(コンテキストベース適応型2進演算符号化:context-based adaptive binary arithmetic encoding)がある。メディアストリーム品質を決定し得る別の態様は、符号化器が、固定ビットレート(CBR:constant bitrate)を生成するように設定されているか、又は可変ビットレート(VBR:variable bitrate)を生成するように設定されているかである。
すべての適応型ストリーミングソリューションには、クライアントがそれぞれのネット又はネットワークによって許容されるような複数の異なる品質レベルの間でおおよそ「円滑に」切り替えながら、コンテンツが様々なビットレート、したがって品質で提供されるべきであるという共通点がある。実際には、これは、各々が異なるビットレートで、かつ異なる目標スクリーンに対して符号化されている同じコンテンツが、サーバ上で、例えば、最大11のストリーム内に存在することを意味し得る。1つのストリームから別のストリームへと切り替わるときにビットレートが変化しようとし得るだけでなく、利用可能なビットレートに応じて、フレームサイズ(解像度)及び符号化器プロファイルも変化しようとし得ることに留意されたい。
送信品質:実際のネットワークにおけるパケット送信に損失がないことは滅多にない。帯域幅不整合、パケットドロップ、待ち時間及び他の送信機能障害がビデオ品質の深刻な劣化をもたらし、したがって加入者のQoEを低減するおそれがある。それゆえ、送信品質は、上記の送信機能障害によって決定される。静止型ネットワーク又はモバイルネットワークのリアルタイムの制約に対処するように、特に現在利用可能なビットレートに適合するように、様々なストリーミング設定及びプロトコルが考案されている。プログレッシブダウンロードについて、フレームサイズ及びビットレートは一度選択されるとビデオ提示中は変化しないが、ビデオ(及び/又はオーディオ)が複数のビットレートで符号化され、各2〜4秒チャンクについて符号化されるとき、動的要素が適応型ストリーミングプロトコルに関与する。クライアント/再生器はここで、その需要に最良に適するチャンク、すなわち、その瞬間に取り扱うことができる最良のビットレート及び解像度を選択することができる。ウェブサーバは一般的に、ネットワーク帯域幅が許容する限りの速さでデータを配信する。クライアントは、ユーザ帯域幅を容易に推定し、より大きい又はより小さいチャンクをダウンロードすべきかを早めに判断することができる。
提示品質:知覚される提示品質にとって重要な要因はクライアントデバイス自体、すなわち、フラットスクリーンテレビ、タブレット又はスマートフォンである。まったく異なるユーザ期待度を含み得るスクリーンサイズと視聴環境に加えて、再生ソフトウェアが提示品質に顕著な影響を及ぼし、例えば、プレイアウトバッファとダウンロードバッファのサイズのようなパラメータが、完全にカスタマイズ可能である。
上記の態様に加えて、提示品質は以下の様なクライアント側のいくつかの態様に応じて決まる。
− エンドユーザデバイスのCPUパワー、メモリ及び接続性の制約、
− オペレーティングシステム及びそのストリーミングプロコトルの固有のサポート、
− 使用時のストリーミングプロトコルの性能、すなわち、実効的にはクライアント/サーバネゴシエーション、
− 再バッファリング、エラー隠蔽技法などを含む再生ソフトウェアであり、これらはオペレーティングシステムの機能のセット、インターネットブラウザ、(サードパーティ)プラグイン(例えば、Adobe Flash、Microsoft Silverlight)、又は、OTTサービスプロバイダによって提供されるアプリのいずれかである、ならびに
− 最後に、視聴環境とともに、(元々の)ディスプレイ又は接続モニタもしくはTVのサイズ、解像度及びリフレッシュレート、そのインターフェース(WLAN、RGB、又はHDMI)。
考案されている4層OTT品質モデルを図12に示す。今提示されている4層手法は、OTTストリーミングサービスの事例において、加入者とのQoE競合状態に関与するパーティに非常に適しており、実際には、図12の4層モデルはその関与するパーティとの1:1対応を含む。
− コンテンツ品質はコンテンツ所有者の責任下に入る。コンテンツ所有者の例は、Sony Pictures、Paramount、Universal、Warner Bros.(これらは登録商標)などである。所有者は、自身の映画及びTVシリーズ製品を新たなVoDチャネルを介して売り込むことによって、自身の収益ストリームを拡大することを望む。
− メディアストリーム品質は、OTTプロバイダの責任下に入り、OTTプロバイダの例は、Netflix、Hulu、Amazon/Lovefilm(これらは登録商標)などである。OTTプロバイダは、オンラインビデオ提供の新たなビジネスモデルをめぐって互いに競合するだけでなく、OTTサービス自体を設定するコンテンツ所有者とも競合する。
− 送信品質は明確にネットワークプロバイダの責任下に入る。ネットワークプロバイダの例は、BBC、Deutsche Telekom、Time Warner Cableである。これらのプロバイダは、輸送インフラストラクチャを提供するだけでなく、それら自体のVoD提供(BBC iPlayer、Telekom Entertain)も確立する。また、
− 提示品質は、デバイス又はハンドセットの製造業者の主要な責任下に入る。接続TV及びスマートTV、セットトップボックス(「STB」、接続Blu−Rayプレーヤ及びゲームコンソールを含む)、PC、タブレット及びスマートフォンのようなエンドユーザデバイスのそのような製造業者、ならびに、オペレーティングソフトウェア及び標準ソフトウェアの販売元(Microsoft、Adobe、Apple)がユーザインターフェースを視聴者(=加入者)に供給する。
4層品質モデルに基づいて、適応型ストリーミングに適した正確な知覚尺度に課される要件は以下のようなものであると要約することができる。
コンテンツ品質の評価:アクセス可能性に応じて、元のコンテンツ又は(ゆるやかに符号化された)配信バージョンのいずれかの優れたスタジオ品質がコンテンツ品質を表すと考えられる。この「基準」品質は、後に符号化及びコード変換によって累積する圧縮アーティファクトの量を評価するための任意のFR測定のための基礎を形成する。それゆえ、適応型ストリーミング品質基準は、この基準信号受け入れることが可能であるべきである。
メディアストリーム品質の評価:適応型ビデオストリーミングについて、1つのストリームから別のストリームへと切り替わるときにビットレートが変化しようとするだけでなく、利用可能なビットレートに応じて、フレームサイズ(解像度)及び符号化器プロファイルも変化しようとする。それゆえ、適応型ストリーミングの知覚ビデオ品質尺度は、解像度及びフレームサイズのスケーラビリティに適したものでなければならない。
送信品質の評価:適応型ストリーミングに適した知覚品質尺度は、有線及び無線IPネットワークのすべての種類の送信アーティファクトに敏感であるだけでなく、長期的スケールの状況において異なるビットレートのチャンクの適応的切り替えから生じるアーティファクトを評価するのに適したものでなければならない。これによってまた、ミクロスケール(チャンク長)からマクロスケール(実際のコンテンツ長)に及ぶ、時間領域におけるスケーラビリティも必要とされる。
提示品質の評価:知覚される提示品質にとって重要な要因はクライアントデバイス自体、すなわちフラットスクリーンTV、タブレット又はスマートフォンである。スクリーンサイズと視聴環境は完全に異なるユーザ期待度を含み得るが、それらに加えて適応型ストリーミングに適した知覚品質尺度は、再生ソフトウェアによって導入されるすべての種類のアーティファクトに敏感でなければならない。
要約すると、適応型ストリーミングの正確な知覚ビデオ品質測定は、複数の異なるビットレート(=品質)を継続的にトラッキングすることが可能であるだけでなく、プレーヤがどれだけ頻繁にストリームを切り替えるか、及びプレーヤがどれだけ「円滑に」混雑したネットワーク内でサーバと対話することが可能であるかを評価することも可能であるべきである。加えて、この品質測定は、複数の異なるフレームサイズ及びフレームレートについて、画像品質を測定し、かつ比較することが可能であるべきである。最後に、知覚されるQoEの正確な予測のためにデバイス特性と視聴環境が考慮に入れられるべきである。
上記で提示した実施形態は、それらの要件を満たすことができるか、又は、少なくともそれらの要件のすべてを満たすための基礎を形成することができる。
上記で提示した実施形態の背後にある第1の着想は、適応型ビデオストリーミングにおいて一般的にチャンク(シーケンス)長であると考えられる2〜4秒のビデオの分析が依然として、現在の規格の標準的な使用事例に、満足のいく程度によく適合するということである。上記で提示した実施形態は、相対的に長いシーケンスの連結した測定値を組み合わせるという可能性を提供する。
上記で提示した実施形態の背後にある第2の着想は、言及した4つの品質層(コンテンツ、メディア、送信及び提示の品質)が動的な品質態様及び準一定の品質態様にグループ分けできるということである。
一般的なオンデマンドOTTアプリケーションのストリーミングサーバ(図1の10及び12参照)上に存在するメディアストリームの符号化品質は「準一定」であると考えることができる。いったん異なる品質レベルに符号化されフォーマット化されると、サーバ上のファイルの符号化品質は同じままである。
他方、送信及び提示の品質は、特定のネットワークを通じて特定のコンテンツの各要求に対して動的に変化する。
これら2つの態様の背景に対して、上記実施形態は、モバイルデバイス上でさえ、例えば、FR高精度ビデオ品質測定をリアルタイム測定と組み合わせることを可能にするように、準一定の態様及び動的な態様をカバーすることが可能である。それゆえ、2つの主要なブロック、すなわち、メディアストリーム品質分析(64及び66参照)とクライアントプローブ(図3参照)から構成されるハイブリッド設定が使用される。
メディアストリーム品質分析の目的は、ストリーミングサーバ(図1の10及び12参照)上に存在するような特定の符号化コンテンツのメディアストリーム品質を決定することである。適応型ストリーミングの場合、これは、そのようなコンテンツの各品質レベルについてメディアストリーム品質を評価することを意味する(図2及び図5参照)。
この分析は、2つのステップ、すなわちコンテンツの取得と実際の品質測定において実施される。
コンテンツの取得中、すべての符号化品質レベル(図2のQ1〜Q4参照)のすべてのチャンクが、上述のメディアデータストリーム部分24に従ってストリーミングサーバから取り出される。適応型ストリーミングはTCPにより動作するため、コンテンツの取得中にさらに歪みを導入することになるパケット損失の危険性はない。しかし、サーバ上のチャンクが失われることによって又はマニフェストファイルが不正確であることによって生じ得るようないかなる空白もなく、コンテンツの品質レベルのすべてが完全に取得されることが確実であることに注意を要する。
実際のメディアストリーム品質分析は、例えば、上記に記載したように、標準的なFRビデオ品質モデルPEVQをもとに構築できる。PEVQは長さの短いビデオチャンクの適切な分析を確実にするためにさらに発展している。通常は高解像度の元のコンテンツである基準ビデオがPEVQにおける入力として提供される必要があり、一方で、取得される品質レベルを、基準復号器を用いて復号することによって劣化したビデオが生成される。分析(図5参照)によって、各品質レベルの各フレームについての品質値のセットがもたらされる。これらの品質値を特定の短いビデオ持続時間、例えば、10秒にわたって集約(図4参照)することによって、例えば、対応するビデオのJ.247準拠のMOSスコアを計算することができる。
メディアストリーム品質データベース(10参照)は、それぞれのコンテンツのメディア情報のいくつかの項目とともに、品質値を記憶する。その後、データベース内の情報は、動的な品質の態様の測定中にクライアントプローブ(すなわち、図1の32)によって使用される。
復号ビデオ信号からメディアストリーム品質を測定することの主要な利点は、分析が、基礎となっている符号化技術に何が使用されているかに依存しないことにある。これによって、種々の符号化システムにわたって正確で一貫した測定値がもたらされる。別の顕著な利点は、メディアストリーム品質が準一定であると考えられるため、データベースは各コンテンツについて一度だけ生成されればよいということである。これは、計算的に要求の多いビデオ復号及び場合によってはFR品質分析を、テストごとに繰り返す必要もクライアントデバイス上で実行する必要もなく、専用のオフラインメディアストリーム品質分析デバイスに割り当てることができることを意味する。
クライアントプローブの目的は、動的ビデオストリーミング品質(すなわち、送信及び提示の品質)を分析し、それを、最終的なQoEスコアの計算のために静的な品質の態様(コンテンツ及びメディアストリームの品質)に関する情報と組み合わせることである。
その目的のために、プローブは、入来するHTTPトラヒックを捕捉し、その後、ビットストリーム分析を行う。
このビットストリーム分析中、例えば、ジッタ及びパケット再送のようなネットワークパケット特性を考慮に入れることができる。流されたビデオコンテンツの各フレームについて、クライアントにおける到来時刻を計算することができる。
その後、この情報はクライアントデバイス上のソフトウェアプレーヤのプレイアウト(play-out)挙動をモデル化するストリーミングプレーヤモデルに供給される。それゆえ、プレーヤモデル出力は、現在のネットワーク状況下でのビデオの現実的なプレイアウト挙動を表す。これは、初期バッファリング(最初のプレイアウトまでの時間)及び再バッファリング/ストーリングのような効果を含む。
適応型ストリーミングには、クライアントデバイス上のソフトウェアプレーヤが、ネットワーク混雑状態に応じて各チャンクのビットレートについて、サーバとの交渉を管理し、したがって、バッファが枯渇することが非常に一般的である。それゆえ、ここでは、メディアストリーム品質の品質値を、プレーヤから要求されるように、各チャンク及び各ビットレートについてデータベース内で正確に識別することができる。その後、受信ビデオシーケンスについて、記憶されている品質値を集約及び後処理することによって流されたビデオの実際の品質が計算される。
上記で提示したハイブリッド手法には、FR測定の計算負荷なしに、クライアントにおいて実際の受信ビデオの正確な符号化品質が処理され、一方で、FR測定が、オフライン前処理済みメディアストリーム分析の間に容易に実施され得るという利点もある。
プローブは、例えば、データベースに対するHTTPアクセスを有するPCベースのテスタ上で動作してもよく、又は、モバイル及びポータブルアプリケーションについて、プローブはさらには、ストリーミングクライアント上のソフトウェアに組み込まれてもよく、当該ソフトウェアはストリーミングプレーヤと並列に動作する。それぞれの利用事例、例えば、モバイルネットワークのいわゆるドライブ及び/又は歩行試験(すなわち、車両内又は歩行中のモバイルデバイスによる測定)に応じて、明確に定義された、したがって、高度に限定されたビデオテストシーケンスセットが通常利用される。加えて、データベース・アクセス中のさらなるネットワークトラヒックによる測定に対するいかなる影響も排除するように、データベースのオフライン抜粋をクライアントデバイス上に記憶することが好ましい。
このように、上記で説明した実施形態の概念はいくつかの応用形態及び利用形態を可能にする。この最適化の可能性によって、関与するすべてのパーティ、すなわち、コンテンツ所有者、ネットワーク及びCDNオペレータ、OTTサービスプロバイダ、並びにデバイス製造者に対する有用なガイダンスがもたらされる。
このハイブリッドアーキテクチャは、クライアント側における低複雑度ビットストリーム分析の利点を、現実のピクセルベースの画像品質分析の高精度であるが複雑なFR測定と組み合わせるのに非常によく適している。
いくつかの態様を装置に関して説明してきたが、当然のことながら、それらの態様はまた対応する方法の説明をも表しており、それによって、装置のブロック又は構造的構成要素はまた、対応する方法ステップ又は方法ステップの特徴としても理解されるべきである。それと同様に、方法ステップに関連して又は方法ステップとして説明されている態様も、対応する装置の対応するブロック又は詳細もしくは特徴の説明をも表す。方法ステップのいくつか又はすべては、例えば、マイクロプロセッサ、プログラマブルコンピュータ又は電子回路のようなハードウェアデバイスによって(又はハードウェアデバイスを使用しながら)実施することができる。いくつかの実施形態において、ほとんどの重要な方法ステップのいくつか又は2〜3より多くのものがそのような装置によって実施することができる。
特定の実施要件に応じて、本発明の実施形態は、ハードウェア又はソフトウェアで実装することができる。実施態様は、デジタル記憶媒体、例えば、フロッピーディスク、DVD、Blu−rayディスク、CD、ROM、PROM、EPROM、EEPROMもしくはフラッシュメモリ、ハードディスク、又は任意の他の磁気もしくは光メモリを使用しながら実行することができる。そのデジタル記憶媒体には、それぞれの方法が実施されるようにプログラマブルコンピュータシステムと協働できるかもしくは協働する電子的に読取り可能な制御信号が記憶されている。それゆえ、そのデジタル記憶媒体はコンピュータ読取り可能である。
したがって、本発明によるいくつかの実施形態は、本明細書に記載されている方法のいずれかが実施されるようにプログラマブルコンピュータシステムと協働することが可能な電子的に読取り可能な制御信号を含むデータキャリアを含む。
概して、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、そのプログラムコードはそのコンピュータプログラム製品がコンピュータ上で作動するときに本発明方法のいずれかを実施するように実行可能である。
そのプログラムコードはまた、例えば、機械的に読取り可能なキャリア上に記憶することもできる。
他の実施形態は、本明細書に記載されている方法のいずれかを実施するためのコンピュータプログラムを含み、そのコンピュータプログラムは、機械的に読取り可能なキャリアに記憶することができる。
言い換えれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムであり、そのコンピュータプログラムは、そのコンピュータプログラムがコンピュータ上で作動するときに本明細書に記載されている本発明の方法のいずれかを実施するためのプログラムコードを有する。
本発明の方法のさらなる実施形態は、したがって、本明細書に記載されている本発明の方法のいずれかを実施するためのコンピュータプログラムが記録されているデータキャリア(又はデジタル記憶媒体もしくはコンピュータ読取り可能な媒体)である。
本発明の方法のさらなる実施形態は、したがって、本明細書に記載されている本発明の方法のいずれかを実施するためのコンピュータプログラムを表すデータストリーム又は信号シーケンスである。そのデータストリーム又は信号シーケンスは、例えば、データ通信リンクを介して、例えばインターネットを介して転送されるように構成することができる。
さらなる実施形態は、本明細書に記載されている本発明の方法のいずれかを実施するように構成又は適合されている処理手段、例えば、コンピュータ又はプログラマブル論理デバイスを含む。
さらなる実施形態は、本明細書に記載されている本発明の方法のいずれかを実施するためのコンピュータプログラムがインストールされているコンピュータを含む。
本発明によるさらなる実施形態は、本明細書に記載されている本発明の方法の少なくとも1つを実施するためのコンピュータプログラムを受信機に送信するように構成されている装置又はシステムを含む。その送信は、例えば電子的又は光学的とすることができる。その受信機は、例えばコンピュータ、モバイルデバイス、メモリデバイス又は同様のデバイスとすることができる。その装置又はシステムは、例えば、コンピュータプログラムを受信機に送信するためのファイルサーバを含むことができる。
いくつかの実施形態において、プログラマブル論理デバイス(例えば、フィールドプログラマブルゲートアレイ、FPGA)が、本明細書に記載されている本発明の方法の機能のいくつか又はすべてを実施するために使用することができる。いくつかの実施形態において、フィールドプログラマブルゲートアレイは、マイクロプロセッサと協働して、本明細書に記載されている本発明の方法のいずれかを実施することができる。概して、本発明の方法は、いくつかの実施形態において、任意のハードウェア装置によって実施される。そのハードウェア装置は、コンピュータプロセッサ(CPU)のような任意の普遍的に適用可能なハードウェアであってもよく、又はASICのような、本方法に特有のハードウェアであってもよい。
上述した実施形態は本発明の原理の例示を提示しているに過ぎない。当然のことながら、他の当業者には、本明細書に記載されている構成及び詳細の任意の修正及び変形がわかる。それゆえ、本発明は、実施形態の記載及び説明によって本明細書に提示されている特定の詳細によってではなく、添付の特許請求項の範囲によってのみ限定されるように意図されている。

Claims (12)

  1. メディアコンテンツ(20)の複数の異なるメディア部分(24)を、前記メディアコンテンツ(20)にわたってそのレベルが変動する品質対ビットレートで送信するデータストリーム部分(22)のシーケンスを含むメディアデータストリーム(18)の品質を決定するためのデバイスであって、該デバイスは、
    前記データストリーム部分のすべてについて同じである導出仕様によって、各データストリーム部分(22)からそれぞれの前記データストリーム部分(22)に対する識別子(50)を導出するように構成されている識別子生成器(40)と、
    それぞれの前記データストリーム部分(22)について導出された前記識別子(50)を用いて、各データストリーム部分(22)について、ルックアップテーブル(34)からパラメータセット(52)を検索するように構成されている検索ユニット(42)と、
    前記メディアコンテンツ(20)のテスト部分内にあるメディア部分(24’)を送信するデータストリーム部分(22)について検索された前記パラメータセット(52)を集約するように構成されている集約器(44)と、
    前記集約されたパラメータセットに基づいて前記品質を決定するように構成されている品質決定器(46)と、を備えているデバイス。
  2. 前記識別子生成器(40)は、前記それぞれのデータストリーム部分(22)の非復号バージョンに基づいて前記識別子の前記導出を実施するように構成されている、請求項1に記載のデバイス。
  3. 前記データストリーム部分(22)のシーケンスは、前記品質対ビットレートのレベルの変動が、前記メディアデータストリームの他の部分から独立して再現可能である前記メディアデータストリーム(18)の部分の単位で行われ、各部分が1つ又は複数のメディア部分(24’)を含むように、前記メディアコンテンツ(20)の前記複数の異なるメディア部分(24’)を送信する請求項1又は2に記載のデバイス。
  4. 前記部分はGOP又は個々のファイルである請求項3に記載のデバイス。
  5. 前記メディアデータストリーム(18)の不完全に受信された部分を検出するように構成されている送信アーティファクト検出器(186)をさらに備え、前記品質決定器(46)は、前記不完全に受信された部分に対して前記メディアデータストリームの送信アーティファクトのオンライン定量化(88)を実施するとともに、前記品質の決定(96)に、前記不完全に受信された部分について決定された前記送信アーティファクトを使用するように構成されている請求項1からのいずれか一項に記載のデバイス。
  6. 各パラメータセットは、
    前記それぞれのデータストリーム部分によって送信される前記メディア部分の再構築バージョンと、基準メディアコンテンツの対応する部分との間の類似度の相関ベースの尺度、
    前記それぞれのメディア部分内に位置するエッジと、前記対応する基準部分内に位置するエッジとの差の尺度、
    前記それぞれのメディア部分内におけるブロック外乱の尺度、
    前記それぞれのメディア部分内と前記対応する基準メディア部分内の色度平面の差の尺度、及び
    前記それぞれの部分内に位置するエッジの時間的変化と、前記対応するメディア部分内に位置するエッジの時間的変化との差の尺度、
    の1つ又は複数を含む請求項1からのいずれか一項に記載のデバイス。
  7. 前記品質決定器は、前記集約されたパラメータセットの統計学的分析から前記品質を決定するように構成されている請求項1からのいずれか一項に記載のデバイス。
  8. ルックアップテーブル内に、
    メディアコンテンツの各メディア部分に対して、複数のレベルの品質対ビットレートの各々について、
    前記それぞれのレベルの品質対ビットレートでそれぞれの前記メディア部分が符号化されているデータストリーム部分の符号化品質を記述するパラメータセットと、
    前記パラメータセットと関連付けられるとともに、前記それぞれのレベルの品質対ビットレートで前記それぞれのメディア部分が符号化されている前記データストリーム部分から、前記データストリーム部分のすべてについて同じである導出仕様によって導出することができる識別子とを記憶するように構成されており、
    前記識別子と関連付けられている前記パラメータセットを返すことによって、識別子を含む要求に応答するように構成されているサーバ。
  9. ルックアップテーブルを生成するためのデバイスであって、該デバイスは、
    メディアコンテンツの各メディア部分に対して、複数のレベルの品質対ビットレートの各々について、
    前記それぞれのレベルの品質対ビットレートで前記それぞれのメディア部分が符号化されているデータストリーム部分の符号化品質を記述するパラメータセットと、
    前記パラメータセットと関連付けられるとともに、前記それぞれのレベルの品質対ビットレートで前記それぞれのメディア部分が符号化されている前記データストリーム部分から、前記データストリーム部分のすべてについて同じである導出仕様によって導出することができる識別子とを生成するように構成されている、デバイス。
  10. メディアコンテンツの複数の異なるメディア部分を、前記メディアコンテンツにわたってそのレベルが変動する品質対ビットレートで送信するデータストリーム部分のシーケンスを含むメディアデータストリームの品質を決定する方法であって、該方法は、
    前記データストリーム部分のすべてについて同じである導出仕様によって、各データストリーム部分から、それぞれの前記データストリーム部分に対する識別子を導出することと、
    各データストリーム部分について、それぞれの前記データストリーム部分について導出された前記識別子を用いて、ルックアップテーブルからパラメータセットを検索することと、
    前記メディアコンテンツのテスト部分内にあるメディア部分を送信するデータストリーム部分について検索された前記パラメータセットを集約することと、
    前記集約されたパラメータセットに基づいて前記品質を決定することと、
    を含む方法。
  11. メディアコンテンツの各メディア部分に対して、複数のレベルの品質対ビットレートの各々について、
    それぞれのレベルの前記品質対ビットレートで前記それぞれのメディア部分が符号化されているデータストリーム部分の符号化品質を記述するパラメータセットを生成することと、
    前記パラメータセットと関連付けられるとともに、前記それぞれのレベルの品質対ビットレートにおける前記それぞれのメディア部分が符号化されている前記データストリーム部分から、前記データストリーム部分のすべてについて同じである導出仕様によって導出することができる識別子を生成することと、
    を含むルックアップテーブルを生成する方法。
  12. コンピュータ上で作動するときに、請求項10又は11に記載の方法を実施するためのプログラムコードを含むコンピュータプログラムを記憶したコンピュータ読取り可能な媒体
JP2016520469A 2013-06-19 2014-06-18 品質対ビットレートが変動するメディアデータストリームの品質を決定するための概念 Active JP6190525B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102013211571.7A DE102013211571B4 (de) 2013-06-19 2013-06-19 Konzept zur bestimmung der qualität eines mediadatenstroms mit variierender qualität-zu-bitrate
DE102013211571.7 2013-06-19
PCT/EP2014/062853 WO2014202682A1 (de) 2013-06-19 2014-06-18 Konzept zur bestimmung der qualität eines mediadatenstroms mit variierender qualität-zu-bitrate

Publications (2)

Publication Number Publication Date
JP2016530751A JP2016530751A (ja) 2016-09-29
JP6190525B2 true JP6190525B2 (ja) 2017-08-30

Family

ID=51022840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016520469A Active JP6190525B2 (ja) 2013-06-19 2014-06-18 品質対ビットレートが変動するメディアデータストリームの品質を決定するための概念

Country Status (10)

Country Link
US (1) US10687122B2 (ja)
EP (1) EP3011752B1 (ja)
JP (1) JP6190525B2 (ja)
KR (1) KR101789086B1 (ja)
CN (1) CN105474650B (ja)
AU (1) AU2014283266B2 (ja)
CA (1) CA2915446C (ja)
DE (1) DE102013211571B4 (ja)
ES (1) ES2653462T3 (ja)
WO (1) WO2014202682A1 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014109088A1 (de) * 2014-06-27 2015-12-31 Deutsche Telekom Ag Verfahren zum kontinuierlichen Überwachen einer Synchronität zwischen verschiedenen beim HTTP adaptiven Streaming verwendeten Qualitätsprofilen
FR3030989A1 (fr) * 2014-12-18 2016-06-24 Orange Systeme pour evaluer la qualite de communication dans un reseau sans-fil
EP3254470B8 (en) * 2015-02-07 2022-06-08 SSIMWAVE Inc. Method and system for smart adaptive video streaming driven by perceptual quality-of-experience estimations
ES2768979T3 (es) * 2015-02-27 2020-06-24 Divx Llc Sistema y método para la duplicación de fotogramas y la ampliación de fotogramas en codificación y envío por flujo continuo de vídeo en directo
US9614756B2 (en) * 2015-03-25 2017-04-04 Ca, Inc. VOIP route selection using call metrics
US10334316B2 (en) * 2015-09-18 2019-06-25 At&T Intellectual Property I, L.P. Determining a quality of experience metric based on uniform resource locator data
US11153359B2 (en) * 2015-09-29 2021-10-19 Sony Group Corporation User equipment and media streaming network assistance node
JP6610187B2 (ja) * 2015-11-16 2019-11-27 株式会社リコー 通信端末、通信システム、通信制御方法、及びプログラム
US9894366B2 (en) * 2016-01-28 2018-02-13 Arris Enterprises Llc Variant and buffer handling for adaptive bitrate streaming
JP2017157904A (ja) * 2016-02-29 2017-09-07 富士ゼロックス株式会社 情報処理装置
EP3829182A1 (en) 2016-03-06 2021-06-02 SSIMWAVE Inc. Method and system for automatic user quality-of-experience measurement of streaming video
WO2017152932A1 (en) * 2016-03-07 2017-09-14 Telefonaktiebolaget Lm Ericsson (Publ) Method and scoring node for estimating a user's quality of experience for a delivered service
US10999614B2 (en) 2016-03-31 2021-05-04 Rovi Guides, Inc. Methods and systems for efficiently downloading media assets
DE102016214939A1 (de) 2016-08-11 2018-02-15 Robert Bosch Gmbh Verfahren und Vorrichtung zur Ansteuerung einer sicherheitsrelevanten Funktion eines Fahrzeugs
KR102433822B1 (ko) * 2016-10-12 2022-08-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 공간적으로 불균등한 스트리밍
US10348796B2 (en) 2016-12-09 2019-07-09 At&T Intellectual Property I, L.P. Adaptive video streaming over preference-aware multipath
US10798387B2 (en) 2016-12-12 2020-10-06 Netflix, Inc. Source-consistent techniques for predicting absolute perceptual video quality
US10509788B2 (en) * 2016-12-30 2019-12-17 Dev Gupta Systems and methods for lossy data compression using key artifacts and dynamically generated cycles
US10362080B2 (en) 2017-04-25 2019-07-23 At&T Intellectual Property I, L.P. Methods, systems, and devices for video streaming adaptation using control theoretic approach
US10945141B2 (en) * 2017-07-25 2021-03-09 Qualcomm Incorporated Systems and methods for improving content presentation
JP7035401B2 (ja) * 2017-09-15 2022-03-15 ソニーグループ株式会社 画像処理装置およびファイル生成装置
KR102424356B1 (ko) 2017-11-06 2022-07-22 삼성전자주식회사 어플리케이션의 QoS 제어 방법, 장치 및 시스템
US10841623B1 (en) * 2018-07-26 2020-11-17 CSC Holdings, LLC System and method for real-time distributed MPEG transport stream analysis
US10728180B2 (en) 2018-08-21 2020-07-28 At&T Intellectual Property I, L.P. Apparatus, storage medium and method for adaptive bitrate streaming adaptation of variable bitrate encodings
US10880354B2 (en) * 2018-11-28 2020-12-29 Netflix, Inc. Techniques for encoding a media title while constraining quality variations
US10735742B2 (en) 2018-11-28 2020-08-04 At&T Intellectual Property I, L.P. Adaptive bitrate video testing
CN109905156B (zh) * 2019-01-23 2021-04-02 武汉科技大学 基于图像结构相似性的迫零预编码器设计方法
CN113557741B (zh) * 2019-03-08 2023-12-08 Vid拓展公司 用于点云的自适应流式传输的方法和装置
WO2020190945A1 (en) * 2019-03-18 2020-09-24 Google Llc Frame overlay for encoding artifacts
US11410680B2 (en) 2019-06-13 2022-08-09 The Nielsen Company (Us), Llc Source classification using HDMI audio metadata
EP4002358A4 (en) * 2019-07-19 2023-03-22 Intellectual Discovery Co., Ltd. ADAPTIVE AUDIO PROCESSING METHOD, DEVICE, COMPUTER PROGRAM AND ASSOCIATED RECORDING MEDIA IN A WIRELESS COMMUNICATION SYSTEM
US11297365B2 (en) * 2019-12-13 2022-04-05 At&T Intellectual Property I, L.P. Adaptive bitrate video testing from screen recording
US12088782B2 (en) * 2020-02-25 2024-09-10 Nippon Telegraph And Telephone Corporation Video quality estimation apparatus, video quality estimation method and program
CN113839906B (zh) * 2020-06-08 2022-12-30 华为技术有限公司 音视频流质量的确定方法、装置、设备及可读存储介质
US12088821B1 (en) * 2020-06-30 2024-09-10 Amazon Technologies, Inc. Dynamic encoder-time scaling service for live and on-demand adaptive streaming
WO2023014848A1 (en) * 2021-08-06 2023-02-09 Triveni Digital Inc. Apparatus and method for controlling delivery of broadcast content
US11785262B1 (en) 2022-03-16 2023-10-10 International Business Machines Corporation Dynamic compression of audio-visual data
CN115002086B (zh) * 2022-05-23 2024-04-02 阿里巴巴(中国)有限公司 实时流媒体的传输方法及电子设备
US11689601B1 (en) 2022-06-17 2023-06-27 International Business Machines Corporation Stream quality enhancement
US20240251138A1 (en) * 2023-01-23 2024-07-25 T-Mobile Usa, Inc. Reference video quality measurement feedback
CN118158471B (zh) * 2024-03-20 2024-09-24 广东九安智能科技股份有限公司 一种用于实时视频监控的无线局域网传输方法及系统

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020093B2 (en) * 2001-05-30 2006-03-28 Intel Corporation Delivery of streaming media
CN100591145C (zh) * 2003-08-22 2010-02-17 日本电信电话株式会社 影像质量评价装置和影像质量评价方法
CA2646805C (en) * 2003-08-22 2012-04-24 Nippon Telegraph And Telephone Corporation Video quality assessing apparatus, video quality assessing method, video quality assessing program, video aligning apparatus, video aligning method, and video aligning program
US9113147B2 (en) 2005-09-27 2015-08-18 Qualcomm Incorporated Scalability techniques based on content information
US20070271590A1 (en) * 2006-05-10 2007-11-22 Clarestow Corporation Method and system for detecting of errors within streaming audio/video data
JP4798495B2 (ja) * 2006-05-30 2011-10-19 日本電気株式会社 映像配信品質測定システム、装置および方法
US9432433B2 (en) * 2006-06-09 2016-08-30 Qualcomm Incorporated Enhanced block-request streaming system using signaling or block creation
CA2666376C (en) * 2006-10-19 2015-06-02 Telefonaktiebolaget L M Ericsson (Publ) A method of determining video quality
EP2220617B1 (en) * 2007-11-02 2018-10-24 Ecole de Technologie Supérieure Method and system for generating a quality prediction table for quality-aware transcoding of digital images
JP5176175B2 (ja) * 2007-11-02 2013-04-03 エコール・ドゥ・テクノロジー・スュペリュール 品質制御パラメータの変更及びスケーリングによって変換される画像のファイルサイズを予想するシステム、方法及びプログラム
KR20090063406A (ko) 2007-12-14 2009-06-18 삼성전자주식회사 전송 특성을 고려한 실시간 동영상 화질 평가 시스템 및방법
US8621544B2 (en) * 2008-08-13 2013-12-31 At&T Intellectual Property I, L.P. Mitigatation of video artifacts
EP2432161B1 (en) 2010-09-16 2015-09-16 Deutsche Telekom AG Method of and system for measuring quality of audio and video bit stream transmissions over a transmission chain
US9060191B2 (en) * 2011-04-20 2015-06-16 Empire Technology Development Llc Full-reference computation of mobile content quality of experience in real-time
US20120278441A1 (en) * 2011-04-28 2012-11-01 Futurewei Technologies, Inc. System and Method for Quality of Experience Estimation
US20120297433A1 (en) * 2011-05-18 2012-11-22 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for supporting quality estimation of streamed video
US8525883B2 (en) * 2011-09-02 2013-09-03 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for automatic video quality assessment
US8745403B2 (en) * 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9571827B2 (en) * 2012-06-08 2017-02-14 Apple Inc. Techniques for adaptive video streaming

Also Published As

Publication number Publication date
DE102013211571A1 (de) 2014-12-24
KR101789086B1 (ko) 2017-11-20
CN105474650B (zh) 2019-07-12
DE102013211571B4 (de) 2016-02-11
CA2915446C (en) 2020-06-09
CN105474650A (zh) 2016-04-06
AU2014283266B2 (en) 2017-11-30
CA2915446A1 (en) 2014-12-24
JP2016530751A (ja) 2016-09-29
US10687122B2 (en) 2020-06-16
US20160105728A1 (en) 2016-04-14
EP3011752A1 (de) 2016-04-27
WO2014202682A1 (de) 2014-12-24
EP3011752B1 (de) 2017-11-15
ES2653462T3 (es) 2018-02-07
KR20160025558A (ko) 2016-03-08
AU2014283266A1 (en) 2016-01-28

Similar Documents

Publication Publication Date Title
JP6190525B2 (ja) 品質対ビットレートが変動するメディアデータストリームの品質を決定するための概念
Barman et al. QoE modeling for HTTP adaptive video streaming–a survey and open challenges
US10826807B2 (en) Media player analytics
Frnda et al. Impact of packet loss and delay variation on the quality of real-time video streaming
US10567825B2 (en) Cloud DVR storage
US12069115B2 (en) Video streaming delivery
WO2013173909A1 (en) Methods and apparatus for providing a presentation quality signal
WO2012013777A2 (en) Method and apparatus for assessing the quality of a video signal during encoding or compressing of the video signal
US20200186615A1 (en) Estimating video quality of experience metrics from encrypted network traffic
Kumar et al. Quality of experience driven rate adaptation for adaptive HTTP streaming
Adeyemi-Ejeye et al. Packet loss visibility across SD, HD, 3D, and UHD video streams
Karim et al. Measurement of objective video quality in social cloud based on reference metric
Barkowsky et al. Objective video quality assessment—towards large scale video database enhanced model development
EP3264709A1 (en) A method for computing, at a client for receiving multimedia content from a server using adaptive streaming, the perceived quality of a complete media session, and client
US20220232275A1 (en) Adaptive bitrate video testing from screen recording
US11917327B2 (en) Dynamic resolution switching in live streams based on video quality assessment
Hegde et al. QoE aware video adaptation for video streaming in 5G networks
Thang et al. Video streaming over HTTP with dynamic resource prediction
Pal et al. Model for mobile online video viewed on samsung galaxy note 5
Begen Spending" quality"'time with the web video
KR101083063B1 (ko) 비디오 체감 품질을 측정하는 방법 및 장치
US20240205474A1 (en) Methods and systems for quality of experience measurements
Begen Quality-aware HTTP adaptive streaming
Cheon et al. Quality assessment of mobile videos
CN108023855B (zh) 一种视频质量监控方法、视频质量监控服务器及设备

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20161020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20161020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161220

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170804

R150 Certificate of patent or registration of utility model

Ref document number: 6190525

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250