JP2008524893A - 伝送チャネルを解する可変ビットレート送信方法 - Google Patents

伝送チャネルを解する可変ビットレート送信方法 Download PDF

Info

Publication number
JP2008524893A
JP2008524893A JP2007546095A JP2007546095A JP2008524893A JP 2008524893 A JP2008524893 A JP 2008524893A JP 2007546095 A JP2007546095 A JP 2007546095A JP 2007546095 A JP2007546095 A JP 2007546095A JP 2008524893 A JP2008524893 A JP 2008524893A
Authority
JP
Japan
Prior art keywords
vector
quality
transmission
parameter
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007546095A
Other languages
English (en)
Other versions
JP2008524893A5 (ja
Inventor
ピエール ブルティヨン
アントォワヌ ペスム
Original Assignee
ティーディーエフ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ティーディーエフ filed Critical ティーディーエフ
Publication of JP2008524893A publication Critical patent/JP2008524893A/ja
Publication of JP2008524893A5 publication Critical patent/JP2008524893A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/26Flow control; Congestion control using explicit feedback to the source, e.g. choke packets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/29Flow control; Congestion control using a combination of thresholds
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/38Flow control; Congestion control by adapting coding or compression rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、調整可能な可変ビットレート伝送チャネルを通じてオーディオおよび/またはビデオプログラムを送信するための方法に関し、エンドユーザによる所望の受信品質を表す少なくとも1次元を有する少なくとも1つの目標ベクトルに従って、少なくとも1つの符号化および/または送信パラメータの調整を実行する。

Description

特にビデオサービスにおいて、サービスの配信に関与するオペレータは、サービスコンテンツの価値を下げないようにするために、エンドユーザに、ユーザの端末上で所定の品質レベルを供給する必要がある。
オペレータはまた、レート低減ビデオ符号化に用いられる方法と、そしてまたビデオサービスの送信に割り振られる伝送ネットワークのリソースの両方とを調整することにより、サービスストレージコストおよび/または配信コストを最小限にしなければならない。
それら符号化および送信方法は、ユーザが再生する品質に影響を及ぼし、その影響は、方法がどのように設定されるのかと、ビデオサービスのコンテンツの両方とに依存する。
さらに、ディジタル技術の発展は、公共に利用可能になっているビデオ画像を再生することができる非常に種々様々な端末をもたらした。そのような端末は、例えば、携帯端末の小さなスクリーンからテレビ受像機の大きなスクリーンに至る、非常に種々様々な可能性を示す。
レート低減符号化あるいはディジタル伝送にリソースを割り振るための多数の方法が知られている。それらの方法間の差異は、用いられる品質測定、品質に作用する方法(即ち、その方法が作用するリソース)、および、時には実行される最適化アルゴリズムにある。
公知の品質測定には3つの主なタイプがある。
・ 伝送チャネル中のビットエラーレート(BER)あるいはブロックエラーレート(BLER)、チャネルのデータレート、そのパワーを伝送するパスバンド、および信号/干渉比率(SIR)等といった、個々の単位情報に関連する情報を生じさせる物理的な測定。ビットエラーレート(以下、BER)は、チャネルエラーを特徴付けるために文献において最も広く用いられる測定量である。
・ パケット、パケット損失レート、動作中のデータレート、送信遅延、および送信遅延における変動といった、一般に、より構造化された情報要素に関係があるネットワークおよびトランスポートレベルの測定。
・ デコードされた画像について客観的な品質測定が時々実行される。しかしながら、そのような測定はリソースを割り振るために活用されない。ビデオ画像の複雑さの測定もまた、データレートを調整する目的のために、統計的多重化方法(L.Boroczky,“Statistical multiplexing using MPEG−2 encoders”,IBM J. res. develop. Vol.43 No.4 Jul−1999 を参照)において用いられる。
それらの測定は、符号化されたビデオストリームに作用する様々なメカニズムを調整するために用いられる。
・ レート低減符号化レベルにおいて: 符号化レート、およびスケーラブル符号器を用いる場合のレイヤー数。
・ 符号器とネットワークとの間のインタフェース、およびネットワーク内において: 受信されなかったあるいは誤って受信されたパケットの再送信、並びに、その重要性、データ送信の優先度、および送信器パワーに応じた、より多くの又はより少ない量の保護を受信するデータを用いた、補正メカニズムによるエラーに対するデータ保護レベルの修正。
リソースを割り振る又は最適化する方法には2つのタイプがある。
・ 測定により検知されたイベントに基づいて、動作に従属させるあるいはリソースを割り振るバイナリ法。例えば、パケットが損失あるいは誤っていることを示す信号が受信器により送信される場合、パケットはネットワーク上に再送信される。
・ 論理的または経験的に予め決定されている関係からリソースを調整する方法。このアプローチの例は、3GPP技術仕様 23.107,V5.12.0 “Quality of Service(QoS) concept and architecture”,3rd Generation Partnership Projectの文献中に示される。UMTSネットワーク上におけるサービスの送信パラメータは、サービスのタイプの関数として定義される。
リソースを調整する技術を用いる特別な分野は、ディジタルTVである。現在、符号化レートの調整は、含まれ得る様々なタイプの端末の特性を考慮しておらず、また、それは、少なくとも部分的に手動で実行される。
・ オペレータは、各プログラムの符号化レートをそのコンテンツに応じて決める必要があり、そしておそらく、彼らは経験からのフィードバックの関数として、データレートを手動で調整する必要がある。
代わりに、可変レート低減符号化方法および統計的多重化方法の使用は、ビデオコンテンツのみの関数として変化可能なレートを得ることを可能にする。それでもなお、プログラムのコンテンツの関数として選択される最小および最大許容データレートを手動で設定する必要がある。
ビデオサービスの配信に関与するオペレータは、どのようにリソースが用いられるかの調整を含んで、サービスの蓄積および/または配信に関与するコストを最小限にしながら、エンドユーザに所定の品質レベルを提供する必要がある。上記したように、このように少なくとも部分的に手動でリソースを割り振る技術、および自動的にリソースを割り振る技術が存在する。それら公知の技術は全て、少なくとも1つの欠点を示す。
現在、多くの符号化リソース調整技術は、少なくとも部分的に手動である。例えば、ディジタルTVのオペレータは、各プログラムあるいはプログラムの各タイプについて符号化レートを決定し、それらのパラメータを手動で設定する。実際、スポーツ番組といった多くの動きを有するプログラムは、他のプログラムにより要求されるデータレートより大きなデータレートを要求する。あるいは、可変レート低減符号化方法および統計的多重化方法の使用は、ビデオコンテンツの関数として変化可能なレートを得ることを可能にする。それでもなお、最小許容レートおよび最大許容レートを設定するために手動で動作することが未だ必要である。さらに、符号化レートの調整のために用いられる品質判定基準は、画像の複雑さに由来するパラメータであり、符号化の後に知覚されるような品質の測定値ではない。最後に、その方法は、符号化パラメータを調整する目的のために、端末に固有な特性を考慮しない。
送信リソースを自動的に割り振るための既存の技術はすべて、ネットワークレベルにおける伝送品質の測定に基づいている。不運にも、そのタイプの測定は、ユーザに再生されるときの知覚品質をそれほど表すものではない。そのような非知覚測定を用いる1つの結果は、エンドユーザが再生する品質について保証がなく、その結果、送信リソースが最適に使用されないということである。これは、オペレータが所定の知覚品質レベルを保証することができず、それゆえに、最適な方法で送信リソースを利用することができないことを意味する。
本発明は、レート低減ビデオ符号化の設定と、伝送ネットワークレベルにおけるリソースの割り振りとを選択するための方法およびシステムを提供する。
対象とする目的は、端末上で所定の品質レベルのビデオを再生し、ストレージおよび/または送信リソースの使用を最適化することにある。これを達成するために、本方法は、ビデオの知覚品質を測定するための技術、あるいは適切なベクトル量子化による最適化のための技術に関連する。
本発明は、端末における知覚品質に基づいて、あるいはまた、ユーザ端末の特性に基づいて、レート低減ビデオ符号化の設定を選択し、伝送ネットワークレベルにおけるリソースを割り振るための方法およびシステムを提供する。
所望の目的は、端末上で所定の品質レベルのビデオを再生し、ストレージおよび/または送信リソースの使用を最適化することにある。
これを達成するために、本方法は、ビデオの知覚品質を測定し、最適化を行うための技術に関連する。知覚品質の測定値は、圧縮されたビデオストリームに代えて、デコードされたビデオ画像から得られ得る。
従って、本発明は、伝送チャネル上でオーディオおよび/またはビデオプログラムを可変ビットレートで送信する方法を提供し、本方法は、エンドユーザによる所望の受信品質を表す少なくとも1次元を有する少なくとも1つの目標ベクトルの関数として、少なくとも1つの符号化および/または送信パラメータの調整を実行する。
前記送信パラメータは、ビットレート、および/または変調のタイプ、および/または送信パワーであり得る。
前記調整は、所望の前記受信品質と前記符号化および/または送信パラメータとの間の決定論的な関係から実行される。
あるいは、前記調整は、前記目標ベクトルと、前記エンドユーザにおいて測定されて前記受信品質を表す測定ベクトルとの間の距離の関数として実行される。
前記受信品質は、前記プログラムの決定された継続時間のシーケンスについて測定され得る。特に、前記調整は、前記目標ベクトルと前記測定ベクトルとの間の距離の関数として前記送信パワーPを修正することにより実行される。
如何なる場合でも、前記調整は、前記プログラムのコンテンツに関する少なくとも1つのパラメータの関数として実行され得る。コンテンツパラメータは、活動度パラメータ、および/または前記プログラムの名前および/または前記プログラムのタイプに与えられるパラメータであり得る。前記調整はまた、端末の特性パラメータの関数として実行され得る。
前記端末の特性パラメータは、表示される画像の解像度および/またはそのパスバンドであり得る。
方法は、NZ個のテストデータを特徴付けるNZ個のベクトルRと、テストのランクzの知覚品質を表すベクトルQの結合から生じる、前記テストのランクzの各々のベクトルR(zは1からNZまで変化する)と、前記テストのランクzの前記符号化および/または送信パラメータを表すベクトルPとを含み、且つ必要に応じて、前記テストのランクzの端末のパラメータを表すベクトルTおよび/または前記プログラムのコンテンツパラメータを表すベクトルCを含むトレーニングセットから辞書を生成し得る。
数NZがあまり大きくない場合、第1の実施形態が適用可能であり、前記辞書は前記トレーニングセットのベクトルから構成される。それは、N個のベクトル(N=NZ)のグループから構成される。この実施形態が適用可能なベクトルの最大数NZは、応用例の特性(例えば、最適なベクトルを検索するための秒間当たりのリクエスト数)、および実行上の制限(例えば、最適なベクトルを検索する処理に割り振られ得る演算能力および記憶容量)に強く依存する。例えば、毎秒最高10,000回のベクトルの比較を行うことが望まれる場合、NZ=100ベクトルのリスト中の最適なベクトルの秒間当たりわずか100回の検索、あるいはNZ=200ベクトルのリスト中の最適なベクトルの秒間当たりたった50回の検索を実行することができるであろう。
そうでなければ、前記辞書は、ベクトル分類アルゴリズムにより前記トレーニングセットから得られ、前記辞書は、前記トレーニングセットのNZ個のベクトルに対して最小の平均歪みを表すN個のベクトル(N<NZ)のグループから構成される。用いられる辞書のベクトルの数Nは、応用例の特性および実行上の制限(第1の実施形態中のNZの選択として)に強く依存し、ベクトルNの数はまた、辞書の精度とサイズとの間で釣り合う関数でもある。大きい辞書ほど辞書の精度は増大し、それにより、システムのより良いパフォーマンスを提供する。実際、2つの異なる解像度および10の異なるデータレート(NZ=200の設定を与える)で符号化された10個の異なるシーケンスを含むトレーニングセットには、N=20〜40のベクトルを有する辞書が適切であり得る。
辞書が構成された後、少なくとも所望の前記品質を表す制限ベクトルに最も良く対応する前記辞書のベクトルを決定するために、ベクトル量子化により調整が実行され得る。
前記制限ベクトルは、所望の前記品質を表すベクトル、少なくとも1つのコンテンツパラメータを表すベクトル、および/または前記端末の少なくとも1つのパラメータを表すベクトルの結合により構成され得る。
他の実施形態では、ベクトル量子化を用いないが、端末レベルにおいて、送信されたプログラムに対する知覚品質の測定に関連し、方法は、前記調整、例えば送信パワーPの前記調整が、前記ビデオプログラムについて測定した知覚品質Qと目標品質QCとの間の差の関数として、サイズDPのステップで実行されることで特徴付けられる。
さらにまた、方法は以下の点で特徴付けられる。
・ |Q−Q|が第1の閾値未満の場合、前記パワーPは修正されず、
・ |Q−Q|が前記第1の閾値と第2の閾値との間にある場合、Q−QCの符号がそれぞれ正または負かに応じて、前記パワーが前記ステップのサイズDPずつ増大または減少され、そして、
・ |Q−Q|が、第2の閾値と、前記第2の閾値より大きい第3の閾値との間にある場合、Q−Qの前記符号がそれぞれ正または負かに応じて、前記パワーがkDP(1<k=2)ずつ増大または減少される。
有利なことに、本方法は、前記ステップサイズDPが、前記ビデオプログラムに関連する前記コンテンツタイプの関数として可変である点で特徴付けられる。
本発明の他の特徴および利点は、図面を参照して以下の記載を読めば明らかになるであろう。
エンドユーザに対して再生されるビデオサービスの品質は、データレート低減符号化に用いられた方法、伝送ネットワーク中のサービスに割り振られたリソース、およびディスプレイ端末の能力により明白に影響を受ける。
図1は、ビデオサービスの提供に関連する主な要素、即ち、ビデオ圧縮(又はデータレート低減符号化)、伝送ネットワーク上の端末への送信、および最後に端末を示す。
1)ビデオ圧縮あるいはレート低減符号化の方法:
それらは、ビデオ画像を表すバイナリ情報ストリームを、下流に位置する機器:即ちネットワーク機器および端末装置の能力に適応させることができる。しかしながら、これらの方法は情報の損失につながる。デコード後に再生される画像はオリジナルの画像と同一ではない。このことはデコード画像の目に見える劣化に結びつき、それにより、エンドユーザに配信されるサービスの品質に影響を及ぼし得る。
コーディング劣化が視認できる程度は、多数のパラメータ:ビデオ信号の内容、符号化されたバイナリストリームのビットレート、解像度、画像のリフレッシュ周波数などの関数として変化する。したがって、所望の品質レベルで再生するためには、レート低減符号化方法のパラメータを注意して選択しなければならない。
2)伝送ネットワークを通じた端末へのレート低減符号化により低減されたバイナリストリームの送信:
この伝送にはバイナリ情報の損失が伴うかもしれない。ストリームを受信し端末でデコードする方法は、そして、目に見える劣化を生じるかもしれないビデオ信号を再生し、それにより、エンドユーザに配信されるサービスの品質に影響を及ぼす。
送信による劣化が視認される程度は、多数のパラメータ:ビデオ信号の内容、割り振られたビットレートあるいは割り振られた送信パワー、伝送プロトコル(パケットで、補正有り又は無しで、・・・)、損失の配信および大きさ、失われる情報のタイプなどの関数として変化する。本発明は、要求される品質に、あるいは、要求される品質と比較して測定された品質に送信パラメータを調整することにより、ネットワークリソースの使用を最小限にしながら、ユーザに配信される品質レベルを維持する方法を提供する。
3)端末:
バイナリストリームおよびビデオの特性を、ディスプレイ端末の処理能力および表示能力に適応させる必要がある。例えば、端末のスクリーンの解像度より高い解像度でビデオストリームを送信することに意味はなく、又は、そのことは、ストリームを受信またはデコードするために必要となる演算能力を越える演算能力を要求する。従って、端末の特性は、ビデオ圧縮方法のパラメータを選ぶ際に考慮に入れられる必要のある制限を構成する。
本発明に従って、レート低減符号化方法の品質レベルに関するパラメータを選択することにより、ビデオサービス供給者が知覚品質のレベルを保証することが可能となる。さらに、端末の特性を考慮するそのような選択により、オペレータは、ストレージ及び/またはサービスの送信に必要となるリソースを最小限にすることができる。
送信パラメータの調整は、知覚品質を維持するために、伝送チャネルの特性の変化に適合させることを可能にする。
本発明は、データレートの著しい節減を得ることを可能にする。レート低減符号化後に知覚される品質は、符号化レートに大きく依存する。コンテンツタイプ、そして特に、シーン中の動きの存在および細部の存在は、与えられた品質レベルを得るために、ほとんど動きがない(複雑さが少ないと呼ばれる)シーンが要求するデータレートよりも大きなデータレートを要求する。
図2は、複雑さが増大する3つのシーケンスI、II、およびIIIについての知覚品質の変動を符号化レートの関数として示す。
知覚品質の測定を実行するリソース割り振りの提案された方法なしでは、ビデオストリームレートあるいはバイナリエラーレートの測定といった、ネットワークレベルにおいて実行される測定に基づいて再生される品質を知る方法はない。その結果、よい品質を得るための公知の解決策の1つは、最も複雑なシーケンスの品質を保証するのに必要とされるレートを割り振って、当該特別のシーケンスにかかわらずその割り振りを用いることである。図3は、そのような状況の下で図2中のシーケンスIIIと比較したデータレートの節減を示し、それにより、20%から50%の範囲でデータレートの非常に著しい節減を示す。
ディジタルネットワーク上で送信されるビデオストリームの感度は、ビデオコンテンツのタイプにより変化する。動きの存在は、伝送エラーにより生成される劣化の視認に大きな影響を及ぼす。インターネットプロトコル(IP)ネットワーク上での送信では、失われる所定数のIPパケットについて、大量の動きを有する内容のビデオシーケンスについては、品質の低下がより大きいことが理解され得る。
実際、「複雑な」、即ち大量の動きを示すビデオストリームに優先度を与えるために、UMTS送信器からの送信パワーを調整する方法においてこのことが活用され得る。
図4は、発明のシステムの一例を示す。それは次のものを本質的に含む。
・ 放送または伝送ネットワーク中のビデオ信号の知覚品質を測定するための機器1。この機器は端末によりデコードされたビデオ信号に基づいて測定を実行する。任意に、機器は端末中に含まれ得る。
・ ビデオコンテンツCのタイプ、端末の特性、得られる知覚品質QC(あるいは目標品質)、および実際に測定される知覚品質Cについての情報に基づいて、符号化および/または送信パラメータPを最適化するための機器2。そして、
・ データベースエンティティDBおよび決定エンティティRECHにより構成されるパラメータ最適化機器。
適用可能なビデオ知覚品質の測定方法は、ビデオデコード処理から生じるデータを用いるものである。
・ 送信後に受信したビデオ画像の画素のみを(この方法は参照なしと呼ばれる)、
・ またはその代わりに、送信後に受信したビデオ画像の画素および少数のソース画像情報を(この方法は少量の参照を有すると呼ばれる)。
これら2つのタイプの方法の例示として、テレディフュジオン・ドゥ・フランスにより出願された、公開番号EP1020085およびPCT WO2004/047451の特許出願にとりわけ参照がなされ得、そのPCT出願は「METHOD AND SYSTEM FOR MEASURING VIDEO IMAGE DEGRADATIONS INTRODUCED BY AN ENCODING SYSTEM WITH THROUGHPUT REDUCTION」と表題されている。
完全な参照を用いる品質測定の方法は、送信後に受信したビデオ画像の画素と送信前の画像の画素との両方を必要とするので適用可能ではない。
最適化手順の目的は、所定のレベルの知覚品質に到達することを可能にする符号化または送信の設定を求めることにより、リソースの使用を調整することである。次の2つの技術の1つあるいは他のものを用いることができる。
1.知覚品質と符号化または伝送ネットワーク設定との間の関係を表すインスタンスのデータベースの使用。ベクトル量子化を用いる検索エンジンは、ネットワークに要求されるリソースを最小限にしながら、(避けられない)現在の状況の下で所望の知覚品質に最も対応するデータベース中のインスタンスを検索する。
2.計算を前もって行い、知覚品質と考慮中の符号化または伝送ネットワーク設定との間の関係を与えるための、決定論または経験的な関係の使用。
最適化手順はベクトル量子化により実行され得る。
ベクトル量子化は、t次元空間中のポイントX(即ちベクトル)を、辞書として知られている1組のN個のベクトルU1…Nのうち、最も近接しているポイントU=QV(X)に関連付ける技術であり、ここで、近接度は距離Δで測定される。
1…N=(Uj,j=1…N) 式1
QV(X)=i/Δ(X,U)≦Δ(X,U); k=1…N 式2
Δ(X,U)はベクトル(X,U)間の距離である 式3
複雑な処理をモデル化するためのこの技術は、画像符号化を用いる一例として用いられてきた。最初に、矩形の画素ブロックのようなサブセットへ画像が細分され、次に、各々の画素ブロックについて、ベクトル量子化は、辞書(ベクトルと呼ばれる)中の最も近接している画素ブロックを検索する。ベクトルについてのインデックスあるいはアドレスだけが、画像デコーダに送信され、デコーダが辞書および対応するベクトル識別子を知っているので、デコーダが画像を再構成する。
図5は、ベクトル量子化による符号化およびデコードの原理を示す。Xは符号化されるベクトルであり、Uは辞書の要素である;k=1…NでNはベクトルの数である。ベクトル量子化による符号化は、Xを、Xが最も近接している辞書中のベクトルのインデックス(i)に対応させる。このインデックスは、送信されるコードワードである。
2つのベクトル間の距離または歪みの概念は、最も近接しているベクトルについて辞書を検索するために導入される。ベクトル量子化を最適化するために、および最初の信号に対する忠実度を最大限にするために、いくつかの距離が提案されてきた。
二次エラーとして知られている距離または歪みは、ベクトル量子化に最も広く用いられるものの1つである。
Figure 2008524893
ここで、(A,B)は次元tの2つのベクトルである。
ベクトル量子化技術の使用は、相互依存する2つのメインステップに依存する。
1.トレーニングセットに基づいて辞書を形成すること、そして、
2.適切な距離を用いて最も近接する隣接物を検索すること。
レート低減により符号化され、ディジタルで伝送されるビデオサービスの知覚品質を調整するための発明において、それらの2つのステップが用いられる方法が、以下に連続して記述される。
辞書DBの生成は、ベクトル量子化による符号化および送信の設定の任意の最適化に先立つステップを構成する。辞書は、与えられたビデオコンテンツおよび端末の或る特性についての、知覚品質と符号化または伝送ネットワーク設定との間の関係を表すインスタンスU=U1…Nを含むデータベースDBである。
辞書を生成するために、1セットのテストを実行する必要がある。テストを特徴付けるデータは、辞書構造(図6)についての特定の手順により用いられるトレーニングセット{R}にある。この方法は、特定のビデオコンテンツおよび端末の或る特性についてのトレーニングを実行することにより、知覚品質と符号化または伝送ネットワーク設定との間の関係をモデル化するための経験的アプローチである。
NZ個のテストの各々はその数zにより識別される。テストはそれぞれ、与えられた端末TおよびビデオコンテンツCの特性について、測定された知覚品質Qと符号化および送信パラメータPとの間の関係の特定のインスタンスを与える。実行された様々なテストを適切に選択することは、高機能を示す辞書に達することを可能にする。この目的のために、様々なパラメータ間の関係を良くモデル化し得るために、第1に、実際の動作状況に対応する範囲に渡って、第2に、所望の知覚品質レベルQ(図7)を得るような方法で、パラメータP、TおよびCを変化させる。
最も一般的な場合、Q、P、TおよびCはベクトルである。
=(VQ1,z,..,VQnq,z) 式5
ここで、nq:品質パラメータの数、および、VQ1..nq,z:テストzについての品質パラメータである。
=(VP1,z,..,VPnp,z) 式6
ここで、np:符号化および送信パラメータの数、および、VP1..np,z:テストzについての符号化および送信パラメータである。
=(VT1,z,..,VTnt,z) 式7
ここで、nt:端末パラメータの数、および、VT1..nt,z:テストzについての端末パラメータである。
=(VC1,z,..,VCnc,z) 式8
ここで、nc:コンテンツパラメータの数、および、VC1..nc,z:テストzについてのコンテンツパラメータである。
次元tのトレーニングベクトルRはそれぞれ、Q、P、TおよびCの結合から生じる。それは、テストz(知覚品質、符号化および送信パラメータ、端末パラメータおよびコンテンツパラメータ)に関連したデータセットを特徴付ける。
=Q∪P∪T∪C=(V1,z,..,Vt,z) 式9
ここで、t=nq+np+nt+nc,∪=結合
Figure 2008524893
ベクトルR、1<z≦NZのセットは、トレーニングセット(表1)を構成する。典型的なインスタンスU、1<k≦Nの辞書を生成するために、特定の手順がトレーニングセットに適用される。2つの状況が起こり得る。
・ 状況1(ベクトル分類のない第1の実施形態に対応する): 品質レベルと、符号化および送信の設定と、端末およびコンテンツの特性との間の組合せの数が制限(例えばNZ<100)されている。この状況では、辞書U1‥Nはトレーニングセットと単に等しくなり得る。
1‥N=(R,k=1...NZ) および N=NZ 式10
組合せの数の制限は、例えば、最適な設定を見つけるために最適化モデルにより必要とされるデータベースあるいは演算ファイルのサイズといった、実装上の基準を用いて自由に設定され得る。
・ 状況2(ベクトル分類を有する第2の実施形態に対応する): トレーニングセットに含まれる組合せRの数NZが非常に大きい。初期のベクトルセットRを最も良く表す辞書のN個のベクトルU1‥Nを生成するために、分析手順が必要とされる。ベクトルのこのグループは、他のすべての潜在的な候補辞書のうち、トレーニングセットの全てのベクトルに対して最も小さな平均歪みを示すグループである。そして、このグループのベクトルは、トレーニングセットを表すための最良のベクトルであり、従って、品質と、符号化および送信の設定と、端末およびコンテンツの特性との間の関係である。
分類アルゴリズムが用いられる。数人の著者が、辞書を分類するための解決策:ダイナミッククラウド、あるいはLBGアルゴリズムを提案してきた。辞書のベクトルの数Nは、トレーニングセット中のベクトルの初期の数、モデリングの精度および実装上の制限に依存して選択される。
分類手順により得られた辞書はデータベースDB(図7)を構成する。
もちろん、知覚品質と符号化および送信パラメータとのみを考慮するトレーニングベクトルを少なくとも用いることが可能である。それでもやはり、コンテンツを考慮することが有利である。意図した応用例のユーザが多様である場合、および与えられたユーザの端末についてパラメータを得ることが可能な場合を除いて、端末のパラメータが考慮される必要はない。
次のステップは、符号化および送信の設定を検索することにある。
第1のステップは、与えられたビデオコンテンツおよび端末の或る特性についての、測定された知覚品質と符号化および伝送ネットワーク設定との間の関係を表す辞書を生成した。
第2のステップは、エンドユーザのために、或る目標品質QCを保証する符号化および送信の設定を見つけるためにその辞書を利用する。これを達成するために、モジュールRECHは、データベースDB(図4)中の前記設定を検索する。
図4により表されるデータは以下に定義される。
・ ベクトルQは、現在測定した知覚品質パラメータを含む。それは式5により定義されるベクトルと同一である。
Q=(VQ,..,VQnq) ここで、nq:品質パラメータVQの数
式11
ビデオコンテンツが提示される時間を表す日付もまた、このベクトルQに関連付けられる。
例えば、nq=1、Q=0から100の範囲内の品質インデックス。
・ ベクトルQCは、達成される目標となる知覚品質のパラメータを定義する。目標品質を特徴付けるQCのパラメータVQCはすべてQに存在し、もちろん異なる値を取り得る。反対に、測定した品質を特徴付けるQのパラメータVQのすべては、必ずしもQCに存在しない。
例えば、ベクトルQCは次元nqc=1であるかもしれず、視聴覚サービス(gqc)の品質のために達成される目標品質(例えば、視聴覚サービスの供給者との契約によりユーザが購入した目標品質)に対応する1つの値gqcのみを含み得る。
ベクトルQは、gqをgqcと比較することにより、ベクトル量子化による最適化の方法を動作可能にするために、測定により得られる視聴覚品質値gqを必然的に含まなければならない。QはQCの次元nqc(例えばnqc=1)より大きな次元であり得るが、Qが、Q=(aq,vq,gq)、オーディオ信号の測定により得られる品質(aq)、ビデオ信号の測定により得られる品質(vq)および視聴覚信号の測定により得られる品質(gq)にそれぞれ対応する3つの値を含む設定中では、nq=3であり得る。
QC=(VQC,..,VQCnqc) ここで、nqc<nq、およびnqc:目標品質パラメータVQCの数 式12
例えば、nqc=1、QC=30から95の範囲内の目標品質インデックス。
・ ベクトルTは、端末の特性であるパラメータを含む。それは式7により定義されるベクトルと同一である。
T=(VT,..,VTnt) ここで、nt:端末VTの特性パラメータの数
式13
例えば、nt=1、パラメータVT=スクリーンの解像度。
・ ベクトルCは、ビデオコンテンツのパラメータを定義する。それは式8により定義されるベクトルと同一である。
C=(VC,..,VCnc) ここで、nc:ビデオコンテンツVCのパラメータの数 式14
例えば、nc=1、パラメータVC:ビデオシーケンスの活動度またはタイプ(遅い、速い、中間)。
・ ベクトルPは、探求される符号化および送信パラメータを定義する。それは式6により定義されるベクトルと同一である。
P=(VP,..,VPnp) ここで、np:符号化および送信パラメータVPの数 式15
例えば、np=1、2あるいは3、VP、VP、VP:送信パワー、および/またはビットレート、および/またはパスバンド。
符号化および送信のための最適な設定を検索するための処理はベクトルPの抽出にあり、ベクトルPは、値Q、TおよびCにより表される制限の現在の状況の下における目標品質を表すベクトルQCにより定義されるサービス品質を、ユーザに配信するために用いられる符号化および送信の設定を与える。ベクトル化方法の利点は、辞書を構成する間を除いて、知覚品質Qを測定する必要がないことである。
検索処理は3つのサブステップに細分される。
a.制限ベクトルOの生成。ベクトルQに関連付けられる日付は、制限ベクトルOに関連付けられる。この日付は、ビデオコンテンツが提示される時間を表す。
b.入力において示された制限ベクトルOに最も良く対応する辞書のベクトルUを見つけるための、制限ベクトルOのベクトル量子化、そして、
c.符号化および伝送システムのためのパラメータのベクトルPの抽出。
サブステップa)制限ベクトルOの形成
システム上の動作制限の現在のセットを表すベクトルOは、ベクトルTと、ベクトルCと、ベクトルQおよびQCの組合せQ’との結合の、最も高いパフォーマンスの環境中に構成される。ベクトルQCのパラメータはすべてベクトルQの中にあるが、ベクトルOのパラメータはそれぞれ一意的でなければならない。最終目的は、QCにより定義される目標品質が得られることを可能にする符号化パラメータベクトルPを探し出すことである。
Figure 2008524893
例えば、QCが次元nqc=1であり、達成される目標品質に対応する1つのベクトルgqcを含んでおり、また、Qが次元nq=3であり、Q=(aq,vq,gq)、オーディオ信号の測定により得られる品質(aq)、ビデオ信号の測定により得られる品質(vq)および視聴覚信号の測定により得られる品質(gq)にそれぞれ対応する3つの値を含んでいる場合、式16の適用に起因するベクトルQ’は、Q’=(gqc)であり、符号化および伝送システムにより得られる視聴覚品質の制限に対応する。
そして、ベクトルOはT、CおよびQ’の結合により形成される。その結果生じるベクトルは次元hである。
O=Q’∪T∪C=(VO,..,VO) ここで、h=nq+nt+nc
式17
サブステップb)ベクトル量子化
ベクトル量子化は、パラメータVOの入力ベクトルOを、入力において示された制限ベクトルOに最も近接している辞書ベクトルUに一致させる。ベクトル量子化は、各ベクトルUのサブベクトルSに対して適切に実行される。ベクトルOは、ベクトルUのパラメータのサブセットのみを含む。Oの中に存在しないUのパラメータは、制限Oの前記セットに関連付けられた符号化および送信パラメータPである。よって、それぞれのベクトルSは次のように定義される。
Figure 2008524893
そして、入力ベクトルOと辞書のベクトルU1…NのすべてのサブベクトルSとの間の歪みの最小化が実行される。それは、制限ベクトルOに最も良く対応するベクトルUを識別する役目をする。
サブステップc)符号化および送信パラメータの抽出
Oの中に存在しないUのパラメータは、制限Oの前記セットに関連付けられた符号化および送信パラメータPである。したがって、符号化パラメータを表すベクトルPをUから抽出することで十分であり、よってそれは次のように定義される。
Figure 2008524893
図9に、nq=4およびnqc=2の特定の状況についての検索手順の全体的な動作が示される。
一旦、ベクトルPのパラメータが見つかると、その後、必要であれば、サブステップb)のベクトル量子化により見つかったベクトルUの或るパラメータと共に、レート低減符号化処理および送信処理にそれらを適用することが可能である。
制限パラメータと見なされ、それによりベクトルOの中に存在するいくつかのパラメータもまた、送信設定を定義するために役立つパラメータであり得る。
例えば、2つのパラメータ、即ち解像度および符号化レートの作用により、ビデオの符号化設定の最適化を望む状況を考える。スクリーン用の可能な2つの空間解像度に対応する2つの異なるタイプの端末がある場合、およびそれらの端末が、それ自身のスクリーンの解像度以外の解像度で符号化されたビデオを正確に表示する能力がない場合、解像度パラメータは、レート低減を用いるビデオ符号化方法についての制限になる。そのとき、ベクトルPのただ1つのパラメータは符号化レートである。それにもかかわらず、最適化方法が完全であることを保証するために、符号化解像度(端末により課される)もまた符号化方法に適用されなければならない。
また、データベースDBは、知覚品質を測定するためのモジュールにより出力されるデータを、モジュールRECHにより得られる最適化の結果と共に格納する機能を有する。この目的のために、データベースDBは、ベクトルOと関連付けられて、ビデオコンテンツが提示される時間を表す日付と共に、図9に示されるベクトルOおよびPを格納する。
ベクトル量子化の代案は、論理的もしくは経験的に前もって決定された関係を実行することにより計算を行い、知覚品質と、考慮中の符号化または伝送ネットワーク設定との間の関係を与えることである。最適化手順fは、端末TおよびビデオコンテンツCの特性が与えられ、且つ現在測定された品質レベルQ(図10)が与えられた場合、目標品質QCを得るために用いられるべき符号化および送信パラメータPを与える。パラメータP、QC、T、CおよびQは、15ページの式11から式15により定義される。
P=f(QC,Q,T,C) 式20
これらの状況の下では、最適化手順に必要とされる情報はすべて、モジュールRECH内にある決定論的な関係に含まれる。データベースDBは、最適化手順に関係するデータを含まない。
決定論的な関係を用いる最適化アプローチは、非常に大きいかもしれないデータベースを必要としないため有利である。対照的に、設定の数が少ない場合に限り、決定論的な関係は容易に決定され得る。
ベクトル量子化および典型的なインスタンスのデータベースを用いるアプローチは、多数の設定がある場合により有利である。
本発明は、所望のシーケンスのタイプの関数として、エンドユーザにより要求される品質および端末の解像度の関数として最適な符号化レートのベクトル量子化を用いることにより、要求に応じたビデオシーケンスのサーバからの提供に特によく適合する。
この応用例は、ビデオサーバ上に格納され予め符号化されたビデオシーケンス用のデータレートを、いくつかの可能な値のうちから選択する発明を用いる。ユーザ端末の解像度および所望の品質レベルは、サービスの供給に必要とされるデータレートを最小限にするように考慮され、それにより、伝送ネットワークの最適な利用につながる。使用される伝送ネットワークは、例えば、IP(インターネットプロトコル)、DVB(ディジタルビデオ放送)、あるいはUMTS(Universal Mobile Telecommunications System)のうちの1つであり得る。
この応用例は、上記したように、ベクトル量子化に基づいた最適化手順を用いることができる。
同じ表記法を使用して、この応用例は従ってパラメータQ、QC、T、PおよびCを次のように定義する。
・Q=QC=0〜100の範囲内にある測定されたあるいは目標のビデオ品質。品質を測定する方法は、例えば、TDFにより出願された、前記PCT特許出願WO2004/047451に記載の方法を含む。
・T=端末のスクリーン解像度、例えばCIF(352×288)もしくはQCIF(176×144)、
・P=kbit/sでの符号化データレート、そして、
・C=シーケンスの名前、あるいは、第2の実施形態において、C=シーケンスタイプによりビデオコンテンツを特徴付けるコンテンツ(スポーツ、ニュース、…)のタイプ。
そうでなければ、シーケンス内の複数の数秒のサブシーケンス内の画像の活動度についてのパラメータにより、ビデオコンテンツを特徴付けることが可能である。
ビデオコンテンツが、DBモジュール内に含まれる辞書中のコンテンツ名とコンテンツタイプとのどちらかにより定義されるかに依存して、辞書を構成する異なる2つの実施形態が以下に記述される。
図11を参照して、コンテンツ名を用いる第1の実施形態が示される。
1.いくつかのソースビデオ信号が要求され、レート低減により符号化される。符号化は、あらゆる端末の解像度を用いて、そして端末および伝送ネットワークの能力に対応する範囲から選択される複数のデータレートを用いて実行される。この例では、CIFおよびQCIFの解像度が、48kbit/sから384kbit/sの範囲内にある伝送チャネルデータレートで、例えば、それら2つの解像度の各々に適用される10kbit/sのステップサイズで用いられる。
2.各々のストリームは知覚品質測定モジュールにより評価される。符号化されたビデオシーケンスを特徴付ける品質Qは、シーケンス全般に渡って測定された平均品質である。
3.符号化されたビデオストリームはビデオサーバ上に格納される。DB中に格納されて辞書を構成する他のデータは、品質Q、伝送チャネルのデータレートP、端末の解像度Tおよびコンテンツ名Cを含む。よって、辞書のサイズが適度なままであるため、この例では分類手順を用いる必要はない。
その後、上記説明したように、モジュールRECHにより辞書が用いられ、必要とされるデータレートが見つけられ得る。
図12を参照して、コンテンツ名の代わりにコンテンツサイズを用いる第2の実施形態が示される。辞書は同じ方法で構成される。シーケンスは全ての所望の設定で符号化され、それらの品質Qが評価される。名前に代えて、コンテンツタイプ(例えば、スポーツまたはニュース)についての情報を用いることに違いがある。実際、知覚品質に対するレート低減ビデオ符号化の影響は、特に伝送チャネルによりもたらされる追加の欠陥の存在により、シーケンス中のコンテンツタイプの関数として大きく変化する。例えば、スポーツのシーケンスは、それらのコンテンツがより多くの動きを有するため、一般により高いレートを必要とする。コンテンツタイプを、所定の受信品質を得るために必要とされる符号化レートに対応させるために、この特性を用いることが可能である。
これを達成するために、単独のベクトルQ、T、PおよびC内に格納されているのだが、異なるが全て同じタイプCの複数のシーケンスについて、同じ視覚および符号化条件TおよびPの下で実行された様々な品質測定値Qをグループ化する分類手順が望ましい。この実施の形態では、好ましくは、式21において以下に示されるように、用いられる分類手順は距離を用いるLBGアルゴリズムである。
図13は、ユーザにより要求が提出される場合に実行される最適化手順の詳細を示す。
まず初めに、ユーザは、ビデオサーバ上に格納された、例えばインターネットブラウザにより名前およびタイプが識別されたコンテンツのリストにアクセスする。ユーザはコンテンツおよび所望の品質レベルを選択し、リクエストを作成する。その後、ユーザによる介入のない3つの段階で、本発明を用いるメカニズムが開始する。
1.ユーザ端末は、モジュールRECHに、それ自身の特性、選択されたコンテンツの特性、所望の品質レベルQC、およびおそらく最も最近の品質測定値Qを送信する。
2.モジュールRECHは、ビデオサーバ上に存在するコンテンツCについて、端末により課された解像度において、要求された品質QCを保証するであろう符号化レートPを、ベクトル量子化によりデータベース中で検索し、この情報を端末へ送信する。受信されて端末へ送信されるパラメータもまた、例えば後続の分析手順のためにデータベースに格納される。
ユーザ端末は、RECHにより選択されたレートPで、ユーザにより選択されたコンテンツCにアクセスし、ユーザは、品質QCの要求したコンテンツを得る。
ここでベクトル量子化のために用いられ得る2つのベクトルAおよびB間の直線距離が、式4の二乗距離よりも実行がより簡単であることに注意されたい。
Figure 2008524893
図14は、モジュールRECHにより実行される動作シーケンスを示す。
RECHは、端末TおよびコンテンツCの特性を、そしておそらく品質測定値Qも受信する。それはデータベース管理システム(DBMS)を通じて、データベースDB中にこれらの測定値を格納する。その後、RECHは、これまたDB中に格納された辞書に基づいて、最良の符号化および送信の設定Pの検索を実行する。設定Pは当該機器へ送信される。
最適符号化レートが端末の解像度および要求された品質の関数として選択されるこの第1の応用例の実施形態では、本発明の方法は、到達される品質レベルのみを考慮しながらビデオシーケンスの符号化レートを最小限にするために用いられ、このことは、伝送ネットワークの最適な利用につながる。このアプローチは、ビデオサービスの利用条件、特に端末のタイプおよびサービスコンテンツのタイプがほとんど変わらない場合に、特に適用可能である。これは例えば、ユーザによるTV型端末上での視聴のためのオンデマンドビデオサービスに当てはまる。
発明は、第1の応用例について同じ表記法を用いて上記したように、ベクトル量子化に基づいた同じ最適化手順を用いる。主な違いは、パラメータTおよびPが空であることである。そして、ベクトル量子化は次に基づく。
・Q=QC=0〜100の範囲内にある測定された又は目標のビデオ品質。品質を測定する方法は、例えば前記PCT出願WO/2004/047451に記載の方法を用いる。
・P=kbit/s単位の符号化データレート。
辞書を構成しパラメータPを最適化するために、同じ方法が、この場合では符号化レートが制限されて用いられ得る。
他の実施形態では、本発明の方法は、例えば、ベクトル量子化を実行せずに、所望の品質の関数として、およびおそらくコンテンツタイプの関数として、送信パワーを調整するために用いられ得る。
この応用例は、信号対雑音比Eb/Noといった、UMTSにおいて用いられる標準ネットワークレベルパラメータの関数としての代わりに、知覚品質の関数として、UMTSアクセスネットワークの送信器からのサービスの送信パワーのレベルを調整する。目的は、目標のバイナリエラーレートではなく、所定の品質レベルを維持することである。
ディジタルネットワークを通じて送信されるビデオストリームの感度は、ビデオコンテンツのタイプによって変化する。動きの存在は、伝送エラーにより生成される劣化の視認に大きな影響を及ぼす。提案された実施の形態では、発明は、知覚品質を維持するために必要とされる場合に限り、この特性が作用するという利点を有する。
そのような状況の下で、本発明は、上記したような、決定論的なアルゴリズムに基づく最適化手順を使用することができる。その際、辞書に導くトレーニング手順はない。上記した同じ表記法を使用して、この応用例は、パラメータQ、QC、T、PおよびCを次のように定義する。
・QC=0〜100の範囲内にある目標ビデオ品質、
・Q=0〜100の範囲内にある測定された又は目標のビデオ品質。知覚品質を測定する方法は、上記したPCT特許出願WO2004/047451に記載の方法を含む。Qはさらに他の測定値:端末が受信した実際のデータレート、および誤ったデータのパケットが受信されるレートを含む。
・T=(使用されない)、
・P=送信パワー(dB単位)、
・C=使用されない、あるいは第2の実施形態において、C=コンテンツタイプ(スポーツ、ニュース、…)。
図13は、この応用例の好ましい実施形態を示す。
ユーザは、例えばインターネットナビゲータを用いて、ビデオサーバ上に格納された、名前およびタイプが識別されたコンテンツのリストにアクセスする。ユーザは、コンテンツおよび所望の品質レベルを選択する。その後、ユーザによる介入のない3つの段階で、本発明を用いるメカニズムが動作する。
1.端末は、最も最近の品質測定値Q、所望の品質レベルQC、そして第2の実施形態では、選択されたコンテンツの特性Cを、定期的にモジュールRECHに送信する。
2.モジュールRECHは、コンテンツCについて現在知覚される品質条件の下で要求される品質QCを保証するために必要とされるパワーPを発見するために、C、QCおよびQに基づいて、最適化手順を適用する。このパワーPは、ビデオサービス伝送ネットワークに適用される。
端末から受信されてその後ネットワークへ送信されるパラメータもまた、例えば後続の分析手順のためにデータベースに格納される。
ベクトル量子化を用いないこの最適化手順は、測定した知覚品質Qの関数としてパワーに作用する。測定した品質Qの目標品質QCからのずれが大きいほど、パワーの変化の総量は大きい。
その手順は、現在のパワーPoldに基づいて、例えば毎秒1回定期的に新しいパワーPを計算する。これは次のように要約され得る。
パワーを増大させるためのステップサイズDPが定義される。
|Q−QC|<5の場合 P=Pold
5<|Q−QC|<10の場合 P=Pold−sign(Q−QC)×1×DP
10<|Q−QC|<20の場合 P=Pold−sign(Q−QC)×2×DP
その他の場合 P=Pold−sign(Q−QC)×4×DP
関数sign(X)はXの符号を返す。従って、Q<QCの場合にパワーが増大する。例えば、DPはパワーの1%から5%を表し得る。
本方法はまた、ベクトル量子化を用いずに、端末において測定された品質およびコンテンツタイプを同時に考慮して実行され得る。
この実施形態は、ビデオコンテンツのタイプに依存する伝送エラーに対する、ビデオストリームの感度における変動に利点を有する。IPあるいはUMTSネットワークを通じて送信する場合、失われる所定数のIPパケットについて、大量の動きを有するコンテンツのビデオシーケンスでは、品質の低下がより大きいことが知られている。図16は、送信によるビデオ画像の損失レートを劣化の基準としてこの現象を示す。画像の損失は、あまり良くない品質に相当する、多くの動きを有するシーケンスについて、より多くなる。
最適化手順のこの第2の実施形態は、次の手順の使用によって、この特性の利点を有する。
パワーを増大させるために、各々のコンテンツタイプについて2つのステップサイズが定義される:DP_sport>DP_news。
C=“スポーツ”の場合、DP=DP_sportであり、例えばパワーの2%から10%である。
その他の場合、DP=DP_newsであり、例えばパワーの1%から5%である。
|Q−QC|<5の場合 P=Pold
|Q−QC|<10の場合 P=Pold−sign(Q−QC)×1×DP
|Q−QC|<20の場合 P=Pold−sign(Q−QC)×2×DP
その他の場合 P=Pold−sign(Q−QC)×4×DP
関数sign(X)はXの符号を返す。従って、Q<QCの場合にパワーが増大する。
実施例1:第1の応用例(コンテンツ名を使用して、端末の解像度の関数および要求される品質の関数として、最適符号化レートを選択する)の第1の実施形態について。
表は、目標品質およびその名前により指定されるコンテンツの関数として最適レートを検索するために用いられる辞書の一部のインスタンスを、ディスプレイの解像度制限と共に示す。示された抜粋は、2つの解像度および4つのレートの組合せで符号化された、5つの異なるコンテンツに当てはまる。これらのコンテンツは次の名前を有する:フットボール、カヤック、森、TVニュースおよび漫画。
Figure 2008524893
表1中の各行、即ち辞書の各ベクトルの座標は、式5、6、7および8について上記で定義された、ベクトルQ、C、TおよびPの定義に、次のように関連付けられ得る。
Q=(pqos) およびnq=1
pqos=1から100の範囲内のシーケンス品質
C=(シーケンス名) およびnc=1
T=(画像サイズ) およびnt=1
P=(ビットレート) およびnp=1
その結果、目標品質値pqosを含むベクトルQCを用いるベクトル量子化手順の応用例は、「ビットレート」パラメータに最適な値を選ぶことを可能にする。この実施例において、与えられたベクトルの2つの座標が等しい場合、2つの「画像サイズ」座標(または「ビットレート」)間の距離はゼロであり、その他の場合、pqos座標と同程度の大きさの桁を有するように、例えば100と同じになるように、それは選択され得る。
その後、本詳細な説明(サブステップc)中において上記したように、符号器に送られる符号化設定は、おそらくベクトルUの前記要素と共に、ベクトルPから構成される。本実施例において、パラメータ「画像サイズ」あるいは「ビットレート」は、この設定を構成する。
実施例2:第1の応用例(コンテンツタイプを使用して、端末の解像度の関数および要求される品質の関数として、最適符号化レートを選択する)の第2の実施形態について。
表は、目標品質の関数およびコンテンツタイプ(「ニュース」または「スポーツ」)の関数として最適レートを検索するために用いられる辞書のインスタンスを、ディスプレイの解像度制限と共に示す。
Figure 2008524893
表2中の各行、即ち辞書の各ベクトルの座標は、式5、6、7および8について上記で定義された、ベクトルQ、C、TおよびPの定義に、次のように関連付けられ得る。
Q=(pqos) およびnq=1
C=(コンテンツタイプ) およびnc=1
T=(画像サイズ) およびnt=1
P=(ビットレート) およびnp=1
その結果、目標品質値pqosを含むベクトルQCを用いるベクトル量子化手順の適用は、「ビットレート」パラメータに最適な値を選ぶことを可能にする。本実施例において、2つの座標が等しい場合、2つの画像サイズまたはビットレート座標の間の距離はゼロであり、その他の場合、pqos座標と同程度の大きさの桁を提示するために、例えば100と同じになるように、それは選択され得る。
その後、本詳細な説明(サブステップc)中において上記したように、符号器に送られる符号化設定は、おそらくベクトルUの要素のうちのいくつかと共に、ベクトルPから構成される。本実施例において、パラメータ「ビットレート」および「画像サイズ」は、この設定を構成する。
ビデオサービスの供給の一般的な状況を示す図である。 符号化レートと知覚品質との間の関係をコンテンツの関数として示す図である。 図2に関連するレート節減を示す図である。 本発明の方法を示す図である。 ベクトル量子化による符号化を示す図である。 辞書の生成手順を示す図である。 本発明の実施の形態に係る辞書の生成手順を示す図である。 ベクトル量子化を用いる符号化および送信設定を検索するサブステップを示す図である。 ベクトル量子化を用いる符号化および送信設定を検索するサブステップを示す図である。 決定論的な関係を用いる場合の符号化および送信設定の検索手順を示す図である。 分類の無い辞書の構造を示す図である。 分類の有る辞書の構造を示す図である。 端末の解像度および要求される品質の関数として最適な符号化レートの選択を示す図である。 最適な設定に調整する間のステップのシーケンスを示す図である。 測定される品質およびコンテンツタイプの関数として送信パワーを調整することを示す図である。 ビデオ画像の損失レートに対するパケット損失の影響の一例をシーケンスのタイプ(遅いまたは速い)の関数として示す図である。

Claims (19)

  1. 伝送チャネル上でオーディオおよび/またはビデオプログラムを可変ビットレートで送信する方法であって、エンドユーザによる所望の受信品質を表す少なくとも1次元を有する少なくとも1つの目標ベクトルの関数として、少なくとも1つの符号化および/または送信パラメータの調整を実行することを特徴とする方法。
  2. サーバからユーザへビデオシーケンスを配信するために実行され、前記ユーザのビデオシーケンスの選択および品質レベルQCの選択を実行することを特徴とする請求項1による方法。
  3. 前記送信パラメータが、ビットレート、および/または変調のタイプ、および/または送信パワーであることを特徴とする請求項1または請求項2による方法。
  4. 前記調整が、所望の前記受信品質と前記符号化および/または送信パラメータとの間の決定論的な関係から実行されることを特徴とする請求項1から3の何れか1つによる方法。
  5. 前記調整が、前記目標ベクトルと、前記エンドユーザにおいて測定されて前記受信品質を表す測定ベクトルとの間の距離の関数として実行されることを特徴とする請求項1から3の何れか1つによる方法。
  6. 前記受信品質が、前記プログラムの決定された継続時間のシーケンスについて測定されることを特徴とする請求項5による方法。
  7. 前記調整が、前記目標ベクトルと前記測定ベクトルとの間の距離の関数として前記送信パワーPを修正することにより実行されることを特徴とする請求項5または請求項6による方法。
  8. 前記調整が、さらに、前記プログラムのコンテンツに関する少なくとも1つのパラメータの関数として実行されることを特徴とする先行する請求項の何れかによる方法。
  9. コンテンツパラメータが、活動度パラメータ、および/または前記プログラムの名前および/または前記プログラムのタイプに与えられるパラメータであることを特徴とする先行する請求項の何れかによる方法。
  10. 前記調整が、さらに、端末の特性パラメータの関数として実行されることを特徴とする先行する請求項の何れかによる方法。
  11. 前記端末の特性パラメータが、前記端末上に表示される画像の解像度、および/またはそのパスバンドであることを特徴とする請求項10による方法。
  12. NZ個のテストデータを特徴付けるNZ個のベクトルRと、テストのランクzの知覚品質を表すベクトルQの結合から生じる、前記テストのランクzの各々のベクトルR(zは1からNZまで変化する)と、前記テストのランクzの前記符号化および/または送信パラメータを表すベクトルPとを含み、且つ必要に応じて、前記テストのランクzの端末のパラメータを表すベクトルTおよび/またはコンテンツパラメータを表すベクトルCを含むトレーニングセットから辞書を生成することを特徴とする先行する請求項の何れかによる方法。
  13. 前記辞書が、前記トレーニングセットのベクトルから構成されることを特徴とする請求項12による方法。
  14. 前記辞書が、ベクトル分類アルゴリズムにより前記トレーニングセットから得られ、前記トレーニングセットのNZ個のベクトルに対して最小の平均歪みを示すN個のベクトル(N<NZ)のグループから構成されることを特徴とする請求項12による方法。
  15. 前記調整が、ベクトル量子化を行うことにより、少なくとも所望の前記品質を表す制限ベクトルに最も良く対応する前記辞書の前記ベクトルを決定することを特徴とする請求項13または請求項14による方法。
  16. 前記制限ベクトルが、所望の前記品質を表すベクトル、少なくとも1つのコンテンツパラメータを表すベクトル、および/または前記端末の少なくとも1つのパラメータを表すベクトルの結合により構成されることを特徴とする請求項15による方法。
  17. 例えば送信パワーPの前記調整が、前記ビデオプログラムについて測定した知覚品質Qと目標品質QCとの間の差の関数として、サイズDPのステップで実行されることを特徴とする請求項1または請求項2による方法。
  18. ・ |Q−Q|が第1の閾値未満の場合、前記パワーPは修正されず、
    ・ |Q−Q|が前記第1の閾値と第2の閾値との間にある場合、Q−QCの符号がそれぞれ正または負かに応じて、前記パワーが前記ステップのサイズDPずつ増大または減少され、そして、
    ・ |Q−Q|が、第2の閾値と、前記第2の閾値より大きい第3の閾値との間にある場合、Q−QCの前記符号がそれぞれ正または負かに応じて、前記パワーがkDP(1<k=2)ずつ増大または減少されることを特徴とする請求項17による方法。
  19. 前記ステップサイズDPが、前記ビデオプログラムに関連する前記コンテンツタイプの関数として可変であることを特徴とする請求項18による方法。
JP2007546095A 2004-12-15 2005-11-18 伝送チャネルを解する可変ビットレート送信方法 Pending JP2008524893A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0413321A FR2879387B1 (fr) 2004-12-15 2004-12-15 Procede de transmission a debit binaire variable a travers un canal de transmission.
PCT/FR2005/002868 WO2006064098A1 (fr) 2004-12-15 2005-11-18 Procede de transmission a debit binaire variable a travers un canal de transmission

Publications (2)

Publication Number Publication Date
JP2008524893A true JP2008524893A (ja) 2008-07-10
JP2008524893A5 JP2008524893A5 (ja) 2008-08-28

Family

ID=34951583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007546095A Pending JP2008524893A (ja) 2004-12-15 2005-11-18 伝送チャネルを解する可変ビットレート送信方法

Country Status (7)

Country Link
US (1) US20080123749A1 (ja)
EP (1) EP1829377A1 (ja)
JP (1) JP2008524893A (ja)
CN (1) CN101080928A (ja)
FR (1) FR2879387B1 (ja)
IL (1) IL183845A0 (ja)
WO (1) WO2006064098A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015073154A (ja) * 2013-10-01 2015-04-16 株式会社リコー データ伝送システム、データ伝送プログラム及びデータ伝送方法
JP2016046707A (ja) * 2014-08-25 2016-04-04 ルネサスエレクトロニクス株式会社 画像通信装置、画像送信装置および画像受信装置
JPWO2021024456A1 (ja) * 2019-08-08 2021-02-11

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8582647B2 (en) * 2007-04-23 2013-11-12 Qualcomm Incorporated Methods and systems for quality controlled encoding
US8804815B2 (en) * 2011-07-29 2014-08-12 Dialogic (Us) Inc. Support vector regression based video quality prediction
US20140192207A1 (en) * 2013-01-07 2014-07-10 Jinsong Ji Method and apparatus to measure video characteristics locally or remotely
CN103400584B (zh) * 2013-07-31 2015-10-28 成都华迈通信技术有限公司 音频压缩性能最大化和流量低消耗的智能处理方法及装置
CN103596038B (zh) * 2013-11-20 2017-04-26 韩巍 一种实时视频内容的导航方法及装置
EP3073738A1 (en) * 2015-03-26 2016-09-28 Alcatel Lucent Methods and devices for video encoding
US10178143B2 (en) 2015-09-29 2019-01-08 International Business Machines Corporation Selecting bitrate to stream encoded media based on tagging of important media segments
EP3672135B1 (en) * 2018-12-19 2022-08-24 Aptiv Technologies Limited Method and system for testing the quality of a signal transmission in a communication system
CN109842797B (zh) * 2018-12-28 2020-04-24 城云科技(中国)有限公司 大数据编码方法及计算机可读存储介质
EP4228187B1 (en) 2022-02-15 2024-06-19 Aptiv Technologies AG Integrity tests for mixed analog digital systems

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002543690A (ja) * 1999-04-26 2002-12-17 テレメディア システムズ リミテッド プログレッシブ送信のためのメディアファイルのスケーラブルフォーマットへの変換
JP2003188733A (ja) * 2001-10-30 2003-07-04 Oplayo Oy 符号化方法及び装置
JP2003235025A (ja) * 2002-02-08 2003-08-22 Nippon Telegr & Teleph Corp <Ntt> 配信サービスの品質対応符号化制御方法及びその装置並びにそのプログラム
JP2003319420A (ja) * 2002-04-19 2003-11-07 Nippon Telegr & Teleph Corp <Ntt> 映像コンテンツ配信方法、装置、および映像コンテンツ配信プログラム
JP2004215069A (ja) * 2003-01-07 2004-07-29 Ricoh System Kaihatsu Co Ltd Lossy圧縮における保存プレビュー方法、装置および圧縮率予測方法
JP2005311599A (ja) * 2004-04-20 2005-11-04 Keio Gijuku 通信システム、通信方法およびストリーミングサーバ

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2769453B1 (fr) * 1997-10-06 2000-01-07 Telediffusion Fse Procede d'evaluation de la degradation d'une image video introduite par un systeme de codage et/ou de stockage et/ou de transmission numerique
US6430394B1 (en) * 1999-06-17 2002-08-06 Lockheed Martin Corporation System for controlling communications between a terminal and satellite and method therefore
FR2795578B1 (fr) * 1999-06-23 2002-04-05 Telediffusion Fse Procede d'evaluation de la qualite de sequences audiovisuelles
US6574279B1 (en) * 2000-02-02 2003-06-03 Mitsubishi Electric Research Laboratories, Inc. Video transcoding using syntactic and semantic clues
GB2367219A (en) * 2000-09-20 2002-03-27 Vintage Global Streaming of media file data over a dynamically variable bandwidth channel
US7165102B2 (en) * 2000-12-18 2007-01-16 Raza Microelectronics, Inc. Adaptive link quality management for wireless medium
US20030125040A1 (en) * 2001-11-06 2003-07-03 Walton Jay R. Multiple-access multiple-input multiple-output (MIMO) communication system
JP4401721B2 (ja) * 2002-09-26 2010-01-20 キヤノン株式会社 映像受信装置
FR2847412B1 (fr) * 2002-11-15 2005-01-14 Telediffusion De France Tdf Procede et systeme de mesure des degradations d'une image video introduites par les systemes de diffusion numerique

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002543690A (ja) * 1999-04-26 2002-12-17 テレメディア システムズ リミテッド プログレッシブ送信のためのメディアファイルのスケーラブルフォーマットへの変換
JP2003188733A (ja) * 2001-10-30 2003-07-04 Oplayo Oy 符号化方法及び装置
JP2003235025A (ja) * 2002-02-08 2003-08-22 Nippon Telegr & Teleph Corp <Ntt> 配信サービスの品質対応符号化制御方法及びその装置並びにそのプログラム
JP2003319420A (ja) * 2002-04-19 2003-11-07 Nippon Telegr & Teleph Corp <Ntt> 映像コンテンツ配信方法、装置、および映像コンテンツ配信プログラム
JP2004215069A (ja) * 2003-01-07 2004-07-29 Ricoh System Kaihatsu Co Ltd Lossy圧縮における保存プレビュー方法、装置および圧縮率予測方法
JP2005311599A (ja) * 2004-04-20 2005-11-04 Keio Gijuku 通信システム、通信方法およびストリーミングサーバ

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015073154A (ja) * 2013-10-01 2015-04-16 株式会社リコー データ伝送システム、データ伝送プログラム及びデータ伝送方法
JP2016046707A (ja) * 2014-08-25 2016-04-04 ルネサスエレクトロニクス株式会社 画像通信装置、画像送信装置および画像受信装置
US10362306B2 (en) 2014-08-25 2019-07-23 Renesas Electronics Corporation Image communication apparatus, image transmission apparatus, and image reception apparatus
JPWO2021024456A1 (ja) * 2019-08-08 2021-02-11
WO2021024456A1 (ja) * 2019-08-08 2021-02-11 日本電気株式会社 通信制御方法、通信装置及び通信システム
JP7456445B2 (ja) 2019-08-08 2024-03-27 日本電気株式会社 通信制御方法、通信装置及び通信システム
US12069324B2 (en) 2019-08-08 2024-08-20 Nec Corporation Communication control method, communication apparatus, and communication system

Also Published As

Publication number Publication date
EP1829377A1 (fr) 2007-09-05
FR2879387B1 (fr) 2007-04-27
US20080123749A1 (en) 2008-05-29
FR2879387A1 (fr) 2006-06-16
CN101080928A (zh) 2007-11-28
IL183845A0 (en) 2007-10-31
WO2006064098A1 (fr) 2006-06-22

Similar Documents

Publication Publication Date Title
JP2008524893A (ja) 伝送チャネルを解する可変ビットレート送信方法
US20240007517A1 (en) Situation-dependent dynamic bit rate encoding and distribution of content
US7382729B2 (en) Video transmission of layered coded data
EP1594287B1 (en) Method, apparatus and medium for providing multimedia service considering terminal capability
US20150334157A1 (en) Methods for quality-aware adaptive streaming over hypertext transfer protocol
US8352982B2 (en) Service substitution techniques
US20130304934A1 (en) Methods and systems for controlling quality of a media session
US8631143B2 (en) Apparatus and method for providing multimedia content
KR20130014508A (ko) 적응 스트리밍 시스템에서 비트 전송률 조정
CN112868229A (zh) 用于流传输数据的方法和设备
Park et al. Mosaic: Advancing user quality of experience in 360-degree video streaming with machine learning
WO2016014738A1 (en) Quality of experience based network resource management
US20200322567A1 (en) Video Chunk Combination Optimization
Duanmu et al. Assessing the quality-of-experience of adaptive bitrate video streaming
US20160028594A1 (en) Generating and Utilizing Contextual Network Analytics
US20240195994A1 (en) Method to determine encoder parameters
Pal et al. A No‐Reference Modular Video Quality Prediction Model for H. 265/HEVC and VP9 Codecs on a Mobile Device
Yao et al. Video streaming adaptation strategy for multiview navigation over DASH
CN108200470A (zh) 一种视频码率调整方法及设备
Feng et al. Perceptual quality aware adaptive 360-degree video streaming with deep reinforcement learning
US11871061B1 (en) Automated adaptive bitrate encoding
Pal et al. Model for mobile online video viewed on samsung galaxy note 5
JP2013030852A (ja) スケーラブル映像符号化装置及び方法及びプログラム
Guo et al. EAAT: Environment-aware adaptive transmission for split-screen video streaming
Zhilong et al. Wireless multicast of virtual reality videos with MPEG-I format

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080708

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110404

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110411

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110502

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110726