固定及び移動ユーザ・デバイス双方を含む種々のタイプのユーザ・デバイスに配信することができる、例えばビデオのようなメディア・コンテンツのサービス範囲及び品質の、新たな通信技術の出現に伴う改善により、例えばマルチメディア・ストリーミングのようなマルチメディア・サービスは、益々大いにポピュラーになりつつある。
そのようなメディア・サービスの良好な経験品質を確保するために、無線及び有線ネットワークの通信システムの運用会社は、通常、既にソースに近いネットワーク又はサービスの問題のある位置を突き止め、回避するツール及び測定法を使用する。
メディア・コンテンツの重要な特性を認識するツールにより、分析結果を使用してネットワークを最適化することができ、それによりサービス・プロバイダが利用可能なネットワーク・リソースにより、より多くのユーザが、提供されるサービスの適切な品質経験を持つことを可能にする。
幾つかのサービスは、エンド・ユーザに良好な品質推定を与えるために、例えばスループットのような少しのネットワーク・パラメータを測定することを必要とする。例えばビデオ・ストリーミングのようなマルチメディア・サービスの場合、メディア自体を含む品質の劣化に寄与する幾つかの要因があるので、経験品質の測定タスクは、些細な問題ではない。
ビデオ品質評価は、ビデオの人の感じ方に関係し、主観的及び客観的方法に区分できる。主観的試験法は、通常、最良の結果を生むが、信頼できる結果を達成するのであれば、平均オピニオンスコア(MOS)の計算前に、多くの試験要員が各ビデオ・シーケンスの格付けを行わなければならないので、主観的試験法は経費が高く、時間も掛る。客観的モデルは、実時間の品質評価に使用することができ、主観的MOSを推定するスコアを出力するように設計されることが多い。
客観的モデルは3つのカテゴリ、即ち、知覚モデル、パラメトリック・モデル及びビット・ストリーム・モデルに区分することができる。
知覚モデルは、ビデオの人工的産物を強調し、定量化する複数のイメージ分析アルゴリズムに依存することが多い。知覚モデルは、フル参照(FR)モデル、削減参照(RR)モデル及び非参照(NR)モデルに区分されることが多い。知覚NRモデルは、モデルへの入力として復号されたビデオのみを使用するが、FRモデルは関連する、非符号化参照も処理入力として使用する。フル参照を使用する代わりに、RRモデルは、狭いサイド・チャネルを介する入力として参照に関する情報を使用する。
知覚モデルについて、例えば、特許文献1のような複数の標準が存在し、特許文献1は、種々のFRTVマルチメディア(MM)に関し、特許文献2は、RRMMモデルに関し、特許文献3は、FRMMモデルに関するものである。しかしながら、NR知覚モデルの性能は、そのモデルを標準化するにはなお低すぎる。
従来技術で既知のパラメトリック・モデルは、ビット・ストリームの品質スコアを推定するための入力として、種々のネットワーク・パラメータ及びコーデック情報を共通して使用する。パラメトリック・モデルの性能は、FR知覚モデルの性能より悪い傾向にあるが、パラメトリック・モデルは、一般に、複雑度が低く、知覚モデルが通常必要とする計算能力を必要としない。パラメトリック・モデルは、それ故、例えばセット・トップ・ボックス(STB)及び移動デバイスのようなネットワーク・ノード及びユーザ装置双方に容易に実装することができる。
ビット・ストリームの品質を推定しようとする場合、ビデオ・ビット・ストリーム・モデルは、入力として圧縮ビデオ・ビット・ストリームを使用する。ビット・ストリーム・モデルは、より多くのデータを分析する必要があるので、パラメトリック・モデルより幾分複雑である。しかしながら、符号化に関する情報を得ることができるので、これらのタイプのモデルは、その他のモデルによりも、良好な精度を有するビデオ品質の推定値を提供する能力を有する。
例えばハンドブレーク、クイックタイム及びへリックスのような、今日、マーケットで利用可能な多くの新しい符号化器がある。これらの符号化器からのビット・ストリームを分析する場合、同じプロファイル及びレベルを使用しても、符号化器の特徴設定が異なりうることが見られる。可能な符号化器の特徴量は、符号化器に必要な計算能力に影響し、結果として、フレームを符号化するのに要する時間は設定により異なりうる。これはまた復号器側で必要とする計算能力量に影響し、従って、符号化器は、特徴量が既知であれば特徴量の制限を選択することができ、或いは、復号器側に、例えば、計算能力制限又はメモリ制限のような幾つかのタイプのリソース制限を設ける。
符号化器における、種々の符号化の特徴設定の使用により、これらの設定は、それぞれ異なる複雑度レベルに対応するものと見ることができ、ここで、マクロ・ブロックのより小さなパーティションへの分割及びモーション推定過程の動きベクトル分解能は、計算能力に影響し得る典型的特徴である。
このタイプの特徴は、通常、符号化器ループの残存を減じ、符号化ストリームの品質を向上させる機会を生成するのに使用される。
特許文献1は、量子化及びDCT係数に関する情報を使用することにより、ビデオ・ビット・ストリームの品質を分析する方法を記載する。
ビット・ストリーム品質スコアを計算するために、伝送及びビデオ・ストリーム・パラメータを使用することや、ある符号化について、例えば、動きベクトル情報及びイントラ/インター予測フレーム/スライスの割合、つまり、実際のビット・ストリームに関係する情報のようなデータをその計算のベースとすることも広く知られている。
会議論文である非特許文献4は、ビット・ストリーム品質スコアを計算する場合に、量子化パラメータ(QP)のみに依存するIPTVビット・ストリーム・モデルを提示している。
従来技術のビット・ストリームの品質モデルの解決策に共通の課題は、符号化手順の複雑度は、場合により異なりうるが、これがビット・ストリーム品質スコアを得るために選択するビット・ストリーム品質モデルの処理に反映しないことである。結果、特定の符号化器の複雑度に最適であるビット・ストリーム品質モデルが、異なる複雑度を使用する符号化器を含む種々のシナリオに対して、同じデータ設定を使用することになる。
その結果、使用するビット・ストリーム品質モデルの入力として同じデータ設定を使用しても、結果として得られるビット・ストリーム品質スコアの精度は、測定毎に変動し得る。
よって、ビット・ストリーム品質評価の改善を可能にする方法及び装置が必要とされる。
例えばビデオのようなマルチメディア・コンテンツを搬送する符号化マルチメディア・ビット・ストリームのビット・ストリーム品質スコアを予測する場合、ビット・ストリーム品質モデルに提供する入力データの使用は、ビット・ストリーム品質スコアが達成できる良い精度のために必要である。加えて、マルチメディア復号デバイス、特に移動ビデオ復号デバイスにとって、複雑なビット・ストリームを扱うことができる幾つかのコプロセッサ又はアクセラレータ・ブロックが必要となる場合が多い。そのようなコプロセッサ及び/又はアクセラレータ・ブロックは、必要な場合オン・オフするように構成されることも多い。より詳細には、そのようなサブ・システムは多かれ少なかれ電力を消費するので、それが絶対的に必要でなければ、そのようなサブ・システムを動作させ続けるのは望ましくない。その上、復号デバイスにおけるビット・ストリーム復号処理に対するメモリ・リソースの割り当ては、各コーデックが使用する信号プロファイル及びレベルに基づくことが多い。
必要なのは、ビット・ストリーム符号化特性の分析を可能にする改善された方法であり、選択する複雑度レベルについて、ビット・ストリームの符号化をどの様に実行するかの詳細が考慮される。そのような機構を手にすることにより、上記問題の少なくとも幾つかを改善することができ、結果として、ビット・ストリーム品質モデルの予測精度が改善され、或いは、復号デバイスにおける僅かなリソースの使用を最適化する。従って、ビット・ストリーム符号化の複雑度を表す、つまり、抽出ビット・ストリームの符号化の間に適用する符号化器が使用する複雑度の表示を、何らかの方法で使用する方法が提案される。用語“表示”は、ここでは、最も広い意味に解釈すべきであり、抽出する情報が、多かれ少なかれ詳細な情報を含み、処理を行う際に、ビット・ストリームの符号化に符号化器が使用する複雑度の詳細な表示を多かれ少なかれ与えることができる。
符号化器での複雑度の程度は、符号化ビット・ストリームから抽出される1つ以上のパラメータと、抽出した情報/パラメータを処理しようとする場合に適用可能な規則に依存し得る。
提案する方法は、典型的には、符号化ビデオ・ビット・ストリームに適用可能であるが、他のタイプの符号化マルチメディア・ビット・ストリームの対応する処理にも使用することができる。
提案する方法は、復号及び描画デバイス又はネットワーク・ノードで複雑度関連情報を抽出して処理することに基づくものである。
より良好な精度によりビット・ストリーム品質スコアを取得するために、ビット・ストリーム・ソースで実行する符号化処理の複雑度を示す1つ以上のパラメータに基づくパラメータ抽出法を提案する。
提案する方法によると、受信ビット・ストリームの分析を必要とする復号デバイス又はネットワーク・ノードでの符号化ビット・ストリームの解析により、典型的には、1つ以上の予め規定されたパラメータを、符号化ビット・ストリームから抽出する。解析は、マルチメディア・コンテンツを搬送するビット・ストリームからの情報を解析する任意の従来の手順により実行することができる。
一度抽出すると、改善された精度を有するビット・ストリーム品質スコアを提供するために、そのようなパラメータは単独で、或いは、任意の従来技術の解決法により読み出された品質に関連するパラメータの様な、他のパラメータとの組み合わせで使用することができる。
符号化ビット・ストリームの処理は、典型的には、コプロセッサ及び/又はアクセラレータ・ブロックのような、復号デバイスの復号サブ・システムの種々の部分に対する特定の要求条件を結果として生むことになろう。これらのサブ・システムは多かれ少なかれ電力を消費するので、絶対的に必要でない限り、そのようなサブ・システムを動作させ続けるのは、通常、望ましくない。符号化複雑度の変更により、要求に応じて復号サブ・システムの種々の部分をオン・オフする要求があり得る。抽出する複雑度に関係する情報の使用により、復号サブ・システムのそのような適合化又は最適化を達成することができる。
換言すれば、提案する方法は、復号デバイス又はネットワーク・ノードで適切なデータ設定を選択するための入力として、ビット・ストリーム・ソースで使用する符号化器の複雑度を示す複雑度関連パラメータを使用する。そのようなデータ設定は、良好な精度を有するビット・ストリーム品質スコアを取得するビット・ストリーム品質モデルへの入力又は復号サブ・システムを適合化するための入力として使用することができる。
提案する方法が基礎とする一般的原理を、図1a及び1bの2つのフローチャートをそれぞれ参照して説明し、ここで、これらのフローチャートは、端末又はサーバのようなビット・ストリーム・ソース100から符号化ビット・ストリームの形式のマルチメディア・コンテンツを受信して処理する復号デバイス101において実行する方法のステップと、対応するビット・ストリーム・ソース100において実行するステップを、一般的な用語で示すものである。
ビット・ストリーム・ソース100で実行する総てのステップは、従来のマルチメディア配信法を実行する従来のステップとして参照できることを理解すべきである。
ビデオ・ビット・ストリームの場合、そのようなビデオ配信は、ビデオ・ストリーム、ビデオ電話サービス、又は、圧縮ビデオ配信を可能にする任意の他のサービスに関連し得る。そのようなサービスは、例えばMBMS又はDVB−Hの様な移動TV、ビデオ会議、例えばDVB−T、DBV−C又はDVB−Sの様なディジタルで放送されるTVの任意のものに関連し得る。復号デバイスとして使用する端末は、例えば移動装置、ビデオ会議端末、セット・トップ・ボックス(STB)又は圧縮ビデオを復号するように構成された任意の他のタイプの端末であり得る。
図1aは、例えば圧縮ビデオのようなマルチメディア・コンテンツが送信され得る通信ネットワーク102を介して接続される2つのエンティティでの方法のステップを示すが、本明細書で提案するパラメータ抽出機構は、ネットワークが全く存在せず、よって、代わりに復号デバイスが、符号化ビット・ストリームを、復号デバイスに統合されているビット・ストリーム・ソース又は復号デバイスと直接接続されているビット・ストリーム・ソースから符号化ビット・ストリームを受信する場合にも適用できることを理解すべきである。
図1aの簡略化したシナリオで、例えば送信端末又はサーバのようなビット・ストリーム・ソース100は、第1のステップ1:1で、ビット・ストリーム・ソースからビデオ又は任意のタイプのマルチメディア・コンテンツを獲得する。マルチメディア・コンテンツは、次のステップ1:2に示すように、従来からの任意のタイプの符号化技術を使用して符号化され、その後符号化ビット・ストリームは、次のステップ1:3に示すように、ネットワーク102を介して復号デバイス100に送信される(通信ネットワークを必要としなければ、復号デバイス100に直接提供される)。
別のステップ1:4で示すように、受信端末100で一度受信されると、別のステップ1:5で示すように、1つ以上の予め定めたパラメータの形式で、符号化の複雑度関連情報が、ビデオ・ビット・ストリームから、典型的には、ビデオ・ビット・ストリームの解析により抽出される。
上述した様に、例えば、他の品質に関するパラメータのような追加パラメータを、複雑度に関するパラメータに加えて抽出することができる。
次のステップ1:6で、抽出したパラメータを処理し、1つ以上のデータ設定を選択できるようにする。結果として得られるデータ設定は、代替ステップ1:7aとして示す代替パスのように、ビット・ストリームの復号において、或いは、別の代替ステップ1:7cでのビット・ストリーム品質スコアの計算のために、ステップ1:7bで示すように、ビット・ストリーム品質モデルへの入力として使用することができる。
次のステップ1:8で、ビット・ストリームを復号し、パラメータ処理の結果は、以下に詳細を説明する手順の任意のもので使用することができる。しかしながら、パラメータ抽出手順の目的がステップ1:7b及び1:7cで示す、ビット・ストリーム品質スコアを取得することであれば、ステップ1:8の復号ステップは従来方法で実行することができる。最終ステップ1:9で、符号化マルチメディア・コンテンツをエンド・ユーザに表示又は提示することができる。
別の代替シナリオによれば、提案するパラメータ抽出機構は、例えばネットワーク・ノードの試験ユニットにおいて適用することができ、試験ユニットにおいて、受信符号化ビット・ストリームは解析され、1つ以上の必要とする複雑度に関するパラメータが、ビット・ストリームから抽出され、例えばサービス又は保守の目的で使用され得る。
図1bは、そのような代替法のステップを示し、代替法において、受信マルチメディア・コンテンツの描画は行われない。そのような実施形態は、例えば、ビット・ストリーム品質スコアを必要とするネットワーク・ノードに適用可能であり得る。そのようなネットワーク・ノードは、典型的に、一度必要な情報を抽出すると、それに応じてネットワーク・ノードへのビット・ストリームの転送を可能にする従来機能も含んでいる。
複雑度関連情報の抽出及び抽出手順の結果として読み出した情報の使用の代替法の詳細を以下に説明する。
図2aは、ビット・ストリーム品質モデルのデータ設定を選択するために複雑度関連情報を使用するフローチャートであり、ここでは、良好な精度を有するビデオ・ビット・ストリームの品質を推定するために使用するビデオ・ビット・ストリーム品質モデルで例示し、図2bは、提案するパラメータ抽出機構の結果が、どの様に、より効率的な復号手順を取得するための復号サブ・システムの適合化に使用されるかを示すフローチャートである。
符号化ビデオ・ビット・ストリームから抽出する複雑度関連情報の、これら代替の利用法は、マルチメディア・システムのエンド・ユーザに表示するビデオの性能改善を得るのに直接的又は間接的に使用され得る。
図2aによると、ビデオ・ビット・ストリームは、第1のステップ2:1で、ビット・ストリーム・ソースから受信される。
次のステップ2:2で、典型的には、受信符号化ビット・ストリームの少なくとも一部の解析結果として、符号化器の複雑度を示す1つ以上のパラメータが、ビデオ・ビット・ストリームから抽出される。抽出するパラメータは、別のステップ2:3で示すように、予め定義した規則に従い1つ以上のデータ設定を選択するための入力として使用され得る。
既に述べた様に、例えば量子化パラメータのような追加パラメータも、ステップ2:2でビット・ストリームから抽出することができ、そのような場合、1つ以上のデータ設定は、抽出したパラメータの組み合わせを含むデータ入力に基づき選択される。
一代替実施形態によれば、抽出ステップ2:2で得たデータ入力を、予め定義した複雑度レベルの設定値と比較することで、ステップ2:3を行うことができ、ここで、パラメータ値のある組み合わせは、低い複雑度の符号化を示すものと解釈され、よって、各ビット・ストリームに関連する低い複雑度レベルに結果としてなり得る、別のパラメータ値の組み合わせの評価は、各ビット・ストリームの符号化に関連する低い複雑度レベルに結果としてなり、別のパラメータ値の組み合わせの評価は、符号化のより高い複雑度を表す複雑度レベルの選択に結果としてなり得る。
最終ステップ2:4aで、あるビデオ品質モデルを使用する場合、データ設定が、ビット・ストリーム品質スコアを計算するための入力として使用される。
図2bに示す様に、ステップ2:1から2:3は、図2aで実行する第1のステップと同一である。しかしながら、ビデオ・ビット・ストリームのビット・ストリーム品質スコアを計算するために品質モデルを使用する場合、精度改善のために情報抽出結果を使用する代わりに、結果は、復号デバイスの復号サブ・システムにおける限られたリソースの1つ以上の特定カテゴリのより効率的な使用を取得するために使用され得る。
ビデオ・ビット・ストリームの符号化の複雑度関連情報を適合化又は最適化する手順に基づくと、典型的には、復号結果を損じることなく、復号の間、リソースのより効率的な使用を結果として得ることができる。
複雑度関連情報は、例えば、種々のイントラ若しくはインター・マクロ・ブロック・パーティション・サイズ、スキップ・マクロ・ブロック(MB)、動きベクトル分解能又はビデオ・ビット・ストリームの符号化の過程で使用する参照画像量に関する情報の存在及び分布といった、符号化の種々の様相を示す情報を含むことができる。
例えば、ビット・ストリームの解析によりビデオ・ビット・ストリームから抽出すべき1つの複雑度に関するパラメータは、例えば、ビデオ・ビット・ストリーム符号化の過程で使用したイントラ又はインター・パーティション・サイズのパーセンテージを示すパラメータであり、他のパラメータは、例えば、受信ビデオ・ビット・ストリーム・シーケンスにおけるスキップMBのパーセンテージを示すものであり得る。
H.264は、イントラ16x16、イントラ8x8及びイントラ4x4と表記される3つの異なるイントラ・パーティション・サイズをそれぞれ定義する。ビデオ・ビット・ストリームで各MBに使用するパーティションは、例えば、符号化に使用するビット数、現エリアを所要品質で符号化する困難度及び/又は符号化器が利用可能な時間及び処理能力のといった種々の観点に基づき符号化器が決定できる。複雑さが少ないビデオ・シーケンスの場合、符号化器は、典型的には、ビデオのビジュアル品質を損じることなく多量のMBをスキップすることができる。
処理の制約に伴い低い複雑度を有する符号化器を表すと考えられる符号化器は、総ての利用可能なイントラ・パーティションを検査することなく選択することができるが、符号化の過程で、使用するパーティションについて、符号化手順に関連する検査を、いくつかの好ましいパーティションに制限することは、より複雑な符号化手順と考えられるものにおける場合より、全体的に低い品質の結果を伴う。
図3aは、イントラMB300aの典型的例の例であり、イントラMB300aは、対角に位置する2つのイントラ8x8パーティション301、302と、対角に位置する8つのイントラ4x4パーティション303〜310に分割されている。直近の例の典型的な反映は、MB300aのセクション303から306及び307から310がより多くの変化を含み、よって、セクション301及び302より多くの符号化のための容量を必要とする。
インターMBに対し、H.264は、7つの異なるパーティション・サイズ、つまり、16x16、16x8、8x16、8x8、8x4、4x8及び4x4を定義している。イントラMBと同様に、符号化器は、これら利用可能なインターMBのどれを、符号化手順で使用するかを決定しなければならない。
またインターMBの検査についても、総ての可能なパーティションを検査することは、符号化器の処理が大変大きくなり、複雑さの低い符号化器のコストでは、実行可能ですらない。
図3bは、インターMB300bの典型的な例であり、インターMB300bは、符号化の過程で、1つの16x8パーティション311と、2つの8x4パーティション312及び313と、1つの4x8パーティション314と、2つの4x4パーティション315及び316とに分割されている。
MBが、前の画像の対応するMBに非常に似ているとき、或いは、利用可能なビット数がMBの符号化のためには少なすぎると考えられるとき、符号化器はMBのスキップを選択することができる。
動きベクトルの場合、H.264は、3つの分解能、つまり、整数ピクセル、ハーフ・ピクセル及びクオータ・ピクセル分解能を定義する。整数ピクセル分解能は、符号化器/復号器が扱う最も簡単な分解能であり、ハーフ・ピクセル及びクオータ・ピクセル分解能を扱うためには、隣接ピクセル間の補間を、現参照データに対して実行しなければならない。ハーフ・ピクセルの補間の実行には、6タップのFIRフィルタが一般に使用され、クオータ・ピクセルのためには、バイリニア(bilinear)補間がハーフ・ピクセルに対して実行される。
符号化器は、例えば1つ以上の上述したような基準に基づき各インター・ブロックに使用する精度を決定しなければならない。ハーフ又はクオータ・ピクセル分解能の動きベクトルのそれぞれを検査するために、符号化器は、処理能力を消費する補間を実行しなければならず、画像の種々の部分間の大きな変動により種々のパーティション・サイズを有するMBでは特に消費が大きくなる。
例えば符号化器で整数ピクセル分解能のみを使用することを選択することにより、計算の複雑度は、符号化器及び復号器側の両方において減少し得る。
ビデオ・ビット・ストリームにおいて幾つかの参照フレームの使用が可能であるので、そのような決定は、符号化及び復号の計算能力にも影響を及ぼし得る。
符号化器側では、これは検査しなければならない参照データ量の増加に結果としてなりえ、これは最終的に計算能力の需要増加に結果としてなるであろう。
復号器側では、参照データを、同じフレームにおいて、複数回、メモリの異なる部分から読み出す必要があるため、複数の参照フレームの使用は、復号を実行するために残す計算能力を減少させる。またこの特定の状況において、符号化器は、使用する参照フレーム数について決定しなければならない。また、その決定は、例えば使用ビット数、現エリアの良好な品質での符号化の困難さの度合い及び符号化器が利用可能な時間と処理能力のような、種々の観点に基づき行うことができる。
従って、符号化ステップでの複雑度レベルの表示を取得する複数の方法がある。符号化ビット・ストリームから、ある予め定義したパラメータを抽出し、これらのパラメータをパラメータに応じて処理することにより、典型的には、従来のデータ抽出手段により、符号化の後に、ビット・ストリーム・ソースで符号化器が使用した複雑度関連情報を取得することができる。抽出パラメータの評価の過程で使用する複雑度レベルを定義することにより、必要とする複雑度レベルの測定は、複雑度のより予測可能な表示を与えることができる。
例えば、復号デバイスでの符号化ビット・ストリームの復号に関連する符号化ビット・ストリーム、或いは、ネットワーク・ノードでの符号化ビット・ストリームの処理に関連する符号化ビット・ストリームから、以下のパラメータを抽出することができる。
P1=イントラ16x16パーティションの割合
P2=イントラ8x8パーティションの割合
P3=イントラ4x4パーティションの割合
P4=インター16x16パーティションの割合
P5=インター16x8パーティションの割合
P6=インター8x16パーティションの割合
P7=インター8x8パーティションの割合
P8=インター4x8パーティションの割合
P9=インター8x4パーティションの割合
P10=インター4x4パーティションの割合
P11=参照画像数(nbrRef)
P12=動きベクトル分解能表現(MVres)
ここで、例えば、整数ピクセル分解能を使用する場合はMVresを1に、ハーフ・ピクセル分解能を使用する場合はMVresを2に設定することができる。
P13=平均量子化パラメータ(AQP)
P14=平均フレーム速度(AFR)
上記例示的な抽出パラメータは、例えば、予測品質スコア(PQS)モデルとして参照する以下の品質モデルの様な、線形品質モデルで使用することができる。
PQS=a0+a1×P1+a2×P2+a3×P3+a4×P4+a5×P5+
a6×P6+a7×P7+a8×P8+a9×P9+a10×P10+
a11×P11+a12×P12+a13×P13+a14×P14 (1)
あるいは抽出パラメータは、例えば以下のモデルの様な、非線形PQSモデルを使用することができる。
PQS=a0+a1×P1 b1+a2×P2 b2+a3×P3 b3+・・・ (2)
上式で、a0、a1・・・及びb1、b2・・・は、ビット・ストリーム品質モデルの特定の係数であり、係数は、例えば、主観試験データに関するビット・ストリーム品質モデル又はPQSモデルの調整により事前選択することができ、或いは、複雑度レベルに基づき選択することができる。本例では、P13及びP14は、複雑度に関するパラメータP1〜P12に加えて使用する品質パラメータである。線形又は非線形品質モデルの計算に基づき、ビット・ストリーム品質スコアが導出される。
代わりに事前に定義した複雑度レベルを適用すれば、抽出したパラメータ・セットの予め定義した組み合わせが、例えば、閾値として定義され得る1つ以上の予め定義された複雑度レベルと、典型的には、比較され得る。
符号化過程に1つの特定タイプのパーティションのみが存在することは、ビット・ストリーム・ソースで高い複雑度の符号化が使用されたことの、ビット・ストリーム品質スコアを必要とする復号デバイス又はネットワーク・ノードへの指示であり得る。
例えば、イントラ4x4パーティションをビット・ストリーム・ソースでの符号化で使用したことを復号デバイスが認識すれば、つまり、P3が復号デバイスで抽出され、P3P3が0以外の値を持てば、これは高い複雑度レベル、例えば、1から4のスケールでレベル4の複雑度を選択すべきとの指示であり、P3が0であれば、レベル4より小さな複雑度が代わりに選択されるべきことの指示であり得る。どの様に複雑度レベルを、1つ以上のパラメータに依存させるかの他の規則も、複数の可能な組み合わせにより事前に規定することができる。
抽出情報を、復号サブ・システムの適合化に使用するのであれば、上述したのと同様の方法で、1つ以上のパラメータのある組み合わせと、予め定義した複雑度レベル・セットとをまず比較することにより間接的に、入力パラメータとして直接的に使用することができる。結果に基づき、復号器のあるアクセラレーション・ブロックは、消費電力を抑えるために動作停止とし、及び/又は、割り当てメモリ空間を節約するために、幾つかのメモリブロックを解放することができる。
復号器サブ・システムの適合化は、複雑度関連情報によりサブ・システムを準備するステップを含むことができる。例えば、抽出情報からハーフ・ピクセル分解能を使用すると決定した場合、復号器で補間が必要となり、よって、復号器サブ・システムを適合化する場合、この特定タスクのために構成する復号器サブモジュールを動作させることができる。
上記説明では、H.264を、符号化/復号過程で生じる例示的な問題のために使用したが、本明細書で提案する解決策は、H.264のみに限定されず、例えば、H.261、H.263、MPEG−2及びMPEG−4のような、他の類似タイプのビデオ・コーデックにも適用できることを理解すべきである。符号化過程で使用するパーティション・サイズ及び動きベクトル分解能は、他のコーデックと同じではないが、原理は同じである。
上記実施形態のいずれかに従い、上述した複雑度関連情報以外のタイプの複雑度関連情報もビデオ・ビット・ストリーム又は任意の他のマルチメディア・ビット・ストリームから抽出でき処理できることも理解すべきである。
図4を参照して、品質モデルへの入力として、ビット・ストリーム品質モデル及び符号化器の複雑度を示す1つ以上のパラメータを使用することにより、ビット・ストリーム品質スコアを提供するように構成された例示的装置について説明する。
図4は、例示的な装置400を示し、装置400は、ここでは、ビット・ストリーム・ソース100から例えばビデオ・ビット・ストリームのような符号化ビット・ストリームを受信する、例えば、メディア品質監視デバイスとして参照される。装置400と共に、ビット・ストリーム・ソース100は、マルチメディア・システム401を形成し、図によると、システムにおいては、2つのユニット間に直接アクセスが提供されている。図1a及び1bで既に述べた様に、ビット・ストリームを、ビット・ストリーム・ソース100から装置400に、図に示すように、直接的に配信することができるが、任意のタイプの従来の通信ネットワークを介して配信することができることも理解すべきである。
描画デバイスの一部であり、図ではネットワーク・ノード/復号デバイス402として参照する復号機能を含む装置400又はネットワーク・ノードは、受信ビット・ストリームを表すビット・ストリーム品質スコアを導出するよう構成され、本明細書ではパラメータ抽出ユニット400aと呼ぶユニットを含み、パラメータ抽出ユニット400aは、1つ以上の予め定義したパラメータ形式の情報を抽出するように構成され、抽出情報は、少なくともある程度、ビット・ストリーム・ソース100での符号化において使用した複雑度を示し、言い換えると、抽出情報は、符号化で使用した複雑度レベルの表示を与え、この指示は、符号化ビット・ストリームのその後の復号又は処理において解釈され得る。装置400は、本明細書で制御ユニット400bと呼ぶ別のユニットをも含み、制御ユニット400bは、ビット・ストリーム品質モデルに対し予め定義された複数の可能なデータ設定から、ビット・ストリーム品質モデルのデータ設定を選択するように構成される。受信ビット・ストリームを表すビット・ストリーム品質スコアが、その後、選択したデータ設定に基づき計算される。これは典型的には、制御ユニット400bにより達成され、要求されたビット・ストリーム品質スコアの計算に使用する予め定義された品質モデルに、選択したデータ設定を使用することを保証する。そのような計算手順は、例示的な構成によれば、図4の品質モデル・ユニット400dのような個別ユニットにおいて実行され得る。
一実施形態によれば、制御ユニット400bは、1つ以上の抽出パラメータをこの決定への直接的な入力として使用して、1つ以上の適切なデータ設定を決定するように構成され得る。あるいは、制御ユニット400bは、抽出情報と予め定義した複雑度レベル・セットとの比較に基づき、そのような決定を行うことができ、予め定義した複雑度レベル・セットは、本明細書で複雑度レベル・データベース400cと呼ぶデータベースから、典型的には取得することができる。
複雑度に関するパラメータのみに基づき決定する代わりに、制御ユニット400bは、受信ビデオ・ビット・ストリームから抽出可能な、例えば量子化パラメータ、フレーム速度、ビット速度及び/又は1つ以上の他の品質に関するパラメータのような、他の情報も考慮するように構成され得る。後者の場合、パラメータ抽出ユニット400aは、この追加タイプのパラメータも抽出するように構成され得る。または、そのようなパラメータは、別の(図示しない)パラメータ抽出ユニットから抽出されるかもしれない。
結果、制御ユニット400bは、1つ以上の抽出パラメータの関数として、1つ以上のデータ設定を選択するように構成され、これらのデータ設定は、品質モデル・ユニット400dで実行するビット・ストリーム品質モデルのデータ入力に使用される。一度導出すると、結果として得られるビット・ストリーム品質スコアは、品質モデル・ユニット400dから転送され、或いは、QoEサーバ又は符号化ビット・ストリームのビット・ストリーム品質スコアを必要とするであろう任意の他のタイプのエンティティによって読み出され得る。
あるいは、ビット・ストリーム品質スコアは、ネットワーク・ノード/復号デバイスにおいて直接監視され、ネットワーク・ノード/復号デバイスにおいて、ビット・ストリーム品質スコアは、任意のタイプの従来方法で測定される。
上述した抽出機能と、読み出したビット・ストリーム品質スコアを利用する任意の他の従来機能に加えて、装置400は、例えば復号機能及び/又は例えばビデオの表示若しくはビデオのルーティングを可能にする、受信符号化ビット・ストリームの従来処理を可能にする機能のような、他の従来機能も含むことができる。
このタイプのオプション機能は、提案する抽出機構の理解には必要ではないので、本装置のために、そのような追加機能のさらなる説明は行わない。
上述した様に、提案するパラメータ抽出法は、代替実施形態によれば、復号サブ・システムのリソース使用について、復号手順の最適化に努めるため、復号デバイスの復号サブ・システム適合化の目的に使用され得る。
そのような適合化又は最適化手順は、種々の代替法で構成され得る。第1の実施形態によれば、復号の開始前に、符号化ビット・ストリームを解析することができる。そのような構成は、しかしながら、ビット・ストリームのバッファリングを必要とし、よって、そのような手順を適用する場合、符号化ビット・ストリームが提供するマルチメディア・コンテンツの最適な表示は遅延するかもしれない。
これらの個別手順をそれぞれステップ5:1a及び5:1bとしてそれぞれ示す。
図5は、そのような適合化/最適化機構を示している。図に示す様に、ビット・ストリーム・ソース100から復号サブ・システム500に提供される符号化ビット・ストリームは、バッファ502によりまずバッファリングされ、同時に、1つ以上の符号化の複雑度に関するパラメータが、適合化ユニット501により符号化ビット・ストリームから抽出される。
抽出されたパラメータは、別のステップ5:2で示すように、適合化ユニット501により処理される。この処理ステップは、1つ以上の抽出パラメータの関数として直接的又は間接的に、つまり、抽出情報と、予め定義した複雑度レベル・セットとの比較後に、1つ以上のデータ設定を選択するステップを含んでいる。データ設定に基づき、復号サブ・システム500は適合化され、僅かなリソースの1つ以上のカテゴリの使用又は復号サブ・システムの他の選択可能な機能が、適合化され得る。そのような適合化ステップをステップ5:3に示す。一度適合化されると、符号化ビット・ストリームからのコンテンツを、復号処理において復号することができ、復号処理でステップ5:4で示すように、復号サブ・システム500の種々の部分をより効率的な方法で使用する。
図6を参照して次に説明する別の代替実施形態によれば、復号サブ・システム600は、従来手順に従い、つまり、復号手順の適合化を最初に可能としない手順により、受信符号化ビット・ストリームの復号を開始する。
第1のステップ6:1で、符号化ビット・ストリームをビット・ストリーム・ソース100から受信する。復号サブ・システム600により一度受信されと、符号化ビット・ストリームを、処理ステップ6:2aで示すように、任意の従来の復号技術を使用して復号する。同時に、適合化ユニット601は、別のステップ6:2bで示すように、受信ビット・ストリームから1つ以上の予め定義した複雑度に関するパラメータを抽出する。適合化ユニット601は、図5の対応する処理ステップ5:2に従い、抽出パラメータを処理する。これを図6の別の処理ステップ6:3に示す。
一度処理すると、適切なデータ設定は、復号サブ・システム600への入力として使用され、その後、復号サブ・システム600が予め定義した規則に従い適合化される。これをステップ6:4に示す。最終ステップ6:5で示すように、ステップ6:4で実行した適合化に従い、復号手順が実行される。
上記の提案した何れかの実施形態により説明される適合化は、制限された時間間隔の間に実行され、或いは、連続的に反復され、それにより復号サブ・システムを連続して適合化させることができることを理解すべきである。
図5及び6の実施形態は、単に概要的、単純化したシステムの概略であり、提案する適合化機構の理解に不要な追加のシステム・エンティティ及びステップは省略されていることも理解すべきである。
例えば、符号化ビット・ストリームは、典型的には、通信ネットワークを介して復号サブ・システム及び適合化ユニットに提供される。典型的には、復号サブ・システムは、描画機能、つまり、復号ビデオのエンド・ユーザへの表示を可能にするある種の表示手段にも接続される。
図5及び6を参照して、上述した何れかの実施形態による、復号サブ・システムの適合化を実行するように構成された例示的な装置について、図7を参照してさらに詳細に説明する。
図4と同様に、図7は、ビット・ストリーム・ソース100から符号化ビット・ストリームを受信して復号するように構成された装置700を示し、ビット・ストリーム・ソース100は、装置700と共にマルチメディア・システム701を形成し、マルチメディア・システム701において、これら2つのエンティティは、図に示すように直接的に相互接続されるか、ネットワーク経由で相互接続される。
図4の装置と同様に、各装置の理解に必要なユニットのみを図に示していることも理解すべきである。
典型的には、復号デバイス702の一部である図7の装置700は、パラメータ抽出ユニット700aを含み、パラメータ抽出ユニット700aは、典型的には、図4のパラメータ抽出ユニット400a、つまり、符号化ビット・ストリームを解析する様に構成されたユニットに対応し、よって、1つ以上の予め定義したパラメータの形式の複雑度関連情報を、符号化ビット・ストリームから抽出することを可能にし、或いは、換言すれば、符号化ビット・ストリームの符号化過程で使用する複雑度を示す情報の抽出を可能にする。よって、この抽出情報をそれに応じて処理することにより、先行する符号化処理で使用した複雑度関連情報を使用することが可能になる。
装置700は、パラメータ抽出ユニット700aから取得する抽出情報に従い、1つ以上のデータ設定を選択するように構成された制御ユニット700bを備えている。パラメータ抽出ユニット700a及び制御ユニット700bは、共に図5及び6にそれぞれ示す、適合化ユニット501、601を形成する。1つ以上の抽出パラメータに依存する規則に従いデータ設定は選択され、或いは、本明細書で複雑度レベル・データベース700cと呼ぶデータベースから典型的にはアクセス可能である、予め定義した複雑度レベル・セットとの比較結果としてデータ設定は選択され得る。
装置700が、図5を参照して説明した第1の実施形態による方法を実行するように構成されるのであれば、装置700は、符号化ビット・ストリームから情報を抽出するのと並行して、符号化ビット・ストリームをバッファリングするように構成されるバッファ700eも備えている。
装置700が、図6を参照して説明した第2の実施形態による方法に使用されるのであれば、復号サブ・システム700dは、パラメータ抽出ユニット700aにより、ビデオ・ビット・ストリームから抽出された複雑度関連情報を受信して処理するように構成される制御ユニット700bと同時に、ビット・ストリーム・ソース100から提供される符号化ビット・ストリームを受信するであろう。
特定の例示的な実施形態を参照して本発明を説明したが、本説明は広く本発明の概念の説明を目的とし、本発明の範囲を限定するものと解釈すべきではなく、本発明の範囲は添付の特許請求の範囲により規定される。
具体的には、図4で提案する装置や、図7を参照して説明した装置は、符号化ビット・ストリームから、複雑度関連情報を抽出し、記載した実施形態にその情報を使用するために、どの様に装置又はネットワーク・ノードを構成するかについての、簡略化した例を表示するのみであり、このタイプの装置において広く使用される機能エンティティであるが、本明細書の範囲である抽出機構の理解に不要なものについては、簡略化のために各図において省略されていることを理解すべきである。
略語リスト
DVB−H ディジタル・ビデオ放送
DVB−T ディジタル・ビデオ地上放送
DVB−C ディジタル・ビデオ放送
DVB−S ディジタル・ビデオ放送
FR フル・リファレンス
MB マクロ・ブロック
MBMS マルチメディア放送マルチキャスト・サービス
MOS 平均オピニオン・スコア
NR ノー・リファレンス
PEVQ ビデオ品質知覚評価
PSNR ピーク信号対雑音比
OoE 経験品質
RR リデュースド・リファレンス
VQEG ビデオ品質エキスパート・グループ