JP6437663B2 - 視聴体験とシステム制約に基づくコーディングパラメタの適合化 - Google Patents

視聴体験とシステム制約に基づくコーディングパラメタの適合化 Download PDF

Info

Publication number
JP6437663B2
JP6437663B2 JP2017542085A JP2017542085A JP6437663B2 JP 6437663 B2 JP6437663 B2 JP 6437663B2 JP 2017542085 A JP2017542085 A JP 2017542085A JP 2017542085 A JP2017542085 A JP 2017542085A JP 6437663 B2 JP6437663 B2 JP 6437663B2
Authority
JP
Japan
Prior art keywords
decoder
video
parameters
viewing experience
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017542085A
Other languages
English (en)
Other versions
JP2018511966A (ja
Inventor
ティトガット,ドニー
ステフェンス,クリストフ
リーベンス,サミー
Original Assignee
アルカテル−ルーセント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント filed Critical アルカテル−ルーセント
Publication of JP2018511966A publication Critical patent/JP2018511966A/ja
Application granted granted Critical
Publication of JP6437663B2 publication Critical patent/JP6437663B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/395Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオデコーダ、ビデオエンコーダおよびビデオシステムに関する。本発明はさらに、ビデオを復号するための方法に関する。
ビデオ復号は今日、できる限り良好に原ソースを再現するように試みる。これは、視聴条件が、映像を記録/編集する際に思い描かれた予想されるシナリオと合致するという想定のもとに行われる。一般的な想定は、平均的な大きさのテレビから「通常の」距離に平均的な能力の視聴者が居る平均的な明るさの部屋を含む。これが平均的な使用シナリオに合うものではあるが、多くの使用事例にとって(圧縮、ユーザ体験、複雑性の観点から)最適であるとは言えない。
既存の解決策は平均的にどんな場合にも合うような解決策を提供するものであり、ここでは、コンテンツ作成者が視聴条件を想定し、この想定に合致するようにコンテンツを作成する。
現代のテレビは、ユーザが特定の視聴プロファイルを手動で選択できるようにすることによって、小規模ではあるが適合可能性を提供するものである。これは、特定の画像処理プロファイルを機能させて、何らかの方法(たとえば、コンテンツのダイナミックレンジを高めようとする「映画」プロファイルなど)で、視聴体験を充実させるものである。この適合は有用であり得るが、ユーザ体験を(わずかに)充実させることに限定され、かつ、手動で構成されることを要する。さらに、これは視聴コンテキストのごく一部分、すなわち視聴デバイス自体に適合するのみである。加えて、これらの後処理ステップは、いかなる先行するコーディングステップおよび構成も考慮に入れず、それゆえ、次善の性能を提供するものである。
スケーラブルビデオの分野では、他の適合メカニズムが一般的である。ビデオの質を向上/低下させるため、帯域幅を犠牲にして、コーデックにおいて異なるレイヤを利用することができる。これらのレイヤの選択は、帯域幅に対して(かつ、暗黙的にはビデオのフリーズの回数を制限することによってユーザ体験に対して)最適化するために、ネットワークによって構成される。他のシステムは、エンドユーザが適切なレイヤを手動で選択できるようにする。ネットワークがネットワーク利用に基づくシステムを構成するか、または、ユーザがコーデックを自身によって手動で構成する必要がある。
本発明の目的は、より最適な方法でユーザにビデオを提供することである。
この目的のために、本発明は、センサデータに基づいてユーザ視聴体験を推定するように構成された推定器を備え、かつ、デコーダパラメータを用いる際に制約を分析するように構成された制約分析器を備える、可変デコーダパラメータから選択されたデコーダパラメータに基づいてビデオを復号するように構成されたビデオデコーダを提供し、このビデオデコーダは、推定器および制約分析器に結合される、可変デコーダパラメータからデコーダパラメータを選択するように構成された選択器をさらに備える。
本発明は、環境がユーザ視聴体験に異なる方法で影響を及ぼす、異なるタイプの環境にユーザが存在し得るという洞察に基づいている。下記に、例が記述される。直接的または間接的にセンサデータに基づいてユーザ視聴体験を測定することによって、可変デコーダパラメータからデコーダパラメータが選択され得る。本発明のビデオデコーダはさらに、デコーダパラメータを用いる際に制約を分析する。これらの要素の組合せは、可変デコーダパラメータから最適なデコーダパラメータを選択できるようにし、ここで、ユーザ視聴体験および制約が考慮される。このことは、ユーザ視聴体験の低下を限定しながらより少ない労力でビデオを復号することができるデコーダパラメータの選択を可能にする。
本発明は、より柔軟な解決策が提供され得るように、圧縮、複雑性またはユーザ体験の観点から潜在的利益を考慮に入れる。それによって、本発明は、エンドユーザコンテキストに基づくコーデック機能の自動構成という解決策を提案する。本発明は、エンドユーザコンテキストに基づいて利用可能なコーデックパラメータを自動的に適合させることを可能にする。視聴条件は急に変化することがあり(たとえば、移動中にコンテンツを視聴するときなど)、本発明は、復号パラメータの適合がこれらの条件に合致できるようにする。
選択器は、所定規則のセットに従ってユーザ視聴体験と制約が均衡されるようにデコーダパラメータを選択するように構成されることが好ましい。それによって、所定規則のセットは、選好およびメカニズムを符号化して、最適なデコーダパラメータを選択できるようにすることができる。
選択器は、選択されたデコーダパラメータをコーデックパラメータに変換するように構成されることが好ましく、ここで、ビデオデコーダは、コーデックパラメータをビデオエンコーダに送信するための通信モジュールをさらに備える。このようにして、エンコーダもまた、デコーダにおいてなされた選択によって統合され、かつ影響を受ける。その結果、デコーダに関連する制約のみならず、エンコーダに関連する制約、および帯域幅のようなネットワーク伝送制約も、デコーダパラメータを選択する際に考慮され得る。
これらの制約は、計算要件、メモリ使用量、バッテリ使用および帯域幅使用の1つまたは複数を含むことが好ましい。これらの制約は分析され得、デコーダパラメータはユーザ視聴体験に照らしてこれらの制約を最適化するように選択され得る。それによって、デコーダパラメータを選択するための規則は、たとえば、バッテリ不足である場合には、バッテリ使用を最小限に抑えるようにデコーダパラメータが選択されることを確実にする規則を含むことができる。
センサデータは環境パラメータを測定するように構成されることが好ましく、ここで、ユーザ視聴体験は、環境パラメータとユーザ視聴体験との所定の相関関係に基づいて推定される。このようにして、センサデータはユーザ視聴体験を推定するために間接的に提供される。所定の相関関係は、たとえば、テストおよびシミュレーションデータに基づいて構築されたデータベースに記憶されてよい。
センサデータは心拍数および/または視線などのユーザ条件を測定するように構成されることが好ましく、ここで、ユーザ視聴体験はユーザ条件の所定の解釈に基づいて推定される。今日では、センサは、ユーザ条件を測定することができる、より一層進歩したものである。将来的には、神経センサがユーザの神経活動を測定し得る。心拍数および視線のようなセンサは、既に市場で入手可能である。これらのユーザ条件センサに基づいて、ユーザ視聴体験は所定の解釈に基づいて推定され得る。このようにして、センサデータは、デコーダパラメータの変更がユーザ視聴体験に及ぼす影響を自動的直接的に測定することができる。このことは、デコーダパラメータの最適化を可能にする。
ビデオデコーダは、デコーダパラメータを変更しながらユーザ視聴体験の変化が観察されるように、センサデータが収集されながらデコーダパラメータが変更されるテストループを含むことが好ましい。このテストループは定期的に実行されるように構成され、デコーダパラメータの変更がユーザ視聴体験に及ぼす影響を測定することができるようにする。詳細には、たとえばユーザが疲れるなどユーザ条件が変化する場合、または環境パラメータが変化する場合、ユーザ視聴体験とデコーダパラメータの変更との相関関係は変化することがある。テストループを定期的に実行することによって、最適なデコーダパラメータが選択され得、かつ、デコーダパラメータは視聴条件の変化に適合され得る。
本発明はさらに、本発明によるビデオデコーダからコーデックパラメータを受信するための通信モジュールを備える、符号化パラメータに基づいてビデオを符号化するように構成されたビデオエンコーダに関する。このビデオエンコーダは、ユーザ視聴体験と制約との間の所定の最適な均衡によることを意味する、より最適な方法でビデオを符号化することができる。
本発明はさらに、本発明によるビデオデコーダを備え、かつ本発明によるビデオエンコーダを備え、このビデオエンコーダがネットワーク機器を介してビデオデコーダと接続されるビデオシステムに関する。
本発明はさらに、デコーダパラメータに基づいてビデオを復号するための方法に関し、この方法は、
センサデータに基づいてユーザ視聴体験を推定するステップと、
デコーダパラメータを用いる際に制約を分析するステップと、
推定および分析ステップに基づいて可変デコーダパラメータからデコーダパラメータを選択するステップとを含む。
この方法によれば、復号パラメータはユーザ視聴体験および制約に基づいて選択され得る。利点および効果については、ビデオデコーダとの関連で上記において記述される。
選択するステップは、所定規則のセットに従って視聴体験と制約を均衡させるステップを含むことが好ましい。この方法は、デコーダパラメータをコーデックパラメータに変換するステップと、このコーデックパラメータをビデオエンコーダに送信するステップとをさらに含むことが好ましい。これらの特徴の利点および効果については、ビデオデコーダとの関連で上記において記述される。
本発明はさらに、本発明の方法を実行するための命令のマシン実行可能プログラムを符号化するデジタル記憶媒体に関する。本発明はさらに、プログラムがコンピュータ上で実行された場合、本発明の方法を実行するためのコンピュータ実行可能命令を含むコンピュータプログラム製品に関する。
ここで、本発明の実施形態による装置および/または方法のいくつかの実施形態について、単なる例として、添付の図面を参照して記述される。
本発明の一実施形態によるエンコーダおよびデコーダの一例を示す図である。 自動化された影響モデルを備える、本発明の一実施形態によるエンコーダおよびデコーダの一例を示す図である。
本発明の第1の実施形態は、ビデオデコーダを、好ましくはメタデータを含む、知覚された視聴条件およびコンテンツ自体に基づいて、利用可能なコーデックパラメータの変更が視聴体験に及ぼす影響の推定を可能にするシステムと結合することを含む。このことは、たとえば複雑性、ユーザ体験、帯域幅、視聴距離のような制約のセットに従ったこれらのパラメータの最適化をさらに可能にする。上位レベルからすると、いくつかのセンサがデコーダ側に配置され、これらは視聴コンテキストを推定するために用いられる。視聴コンテキストは光条件、視聴者の疲労、視線、雑音などのうち1つまたは複数を含むことが好ましい。コンテキストが推定されると、前もって学習された影響モデル、および所与のコーデックモデルを考慮して最適なデコーダパラメータが決定され得る。影響モデルは、知覚スコアλに関して、視聴条件、コーデックパラメータ、および任意選択的にコンテンツパラメータがどのように相互に関連し合うのかについて示す。コーデックモデルは、コーデックパラメータを、計算要件、メモリ使用量、バッテリ影響および帯域幅などのシステムに関連する性能基準のセットに変換する。それによって、下記に記述されるように、帯域幅はビデオエンコーダもまた影響を受けるさらなる実施形態に関連するにすぎないことが留意される。
図1は、本発明の一実施形態を示す。生のセンサデータS(s1、s2、...、sn)は、センサ変換器11によってセンサ非依存バージョンVに変換されることが好ましい。センサ非依存データVは、生のセンサデータSの抽象バージョンである。この変換が好ましいのは、そうでなければ、新しいタイプのセンサが現れたときに新しい影響モデルを訓練することが必要とされ、または、本質的に同一量を測定するセンサが異なるタイプの生の情報を出力する可能性があるからである。このステップを実行することによって、システムの残りの部分から実際の生のセンサを分離することができる。センサモデル10はこれを容易にし、この目的のために、Se(S)=Vを行うファンクションSeが生成される。このモデル10は、システムによって新しいセンサがサポートされ、一方システムの残りの部分は影響を受けない場合に、更新される。このセンサ非依存データに基づいて、視聴コンテキストが得られる。その結果、視聴コンテキストもまた、それがセンサデータVに直接的に関連するので、基準Vが割り当てられる。
影響モデル12は、変更を加えることが、特定の視聴コンテキストVに関するデコーダパラメータP、および任意選択的に特定のコンテンツパラメータCに及ぼす知覚的影響を決定する。コンテンツパラメータCは、たとえば、時点t−1における場面の統計を表し、さまざまなレベルの詳細を含むことができる。一例として、低レベルのパラメータは平均的な輝度(明るい/暗い)のようなものであり、中間レベルのパラメータはある場面における平均的な動きのようなものを含んでよく、一方、高レベルのパラメータはたとえば人や自然など、その場面における対象のタイプに関する情報を含むことができる。コンテンツパラメータCは、さらなるレベルの適合を可能にする。たとえばアクション映画の場合、動きの速い場面での時間的な不明瞭化という理由から、フレーム品質を向上させる影響はロマンチック映画の場合に比べて小さいであろう。
影響モデル12は、ファンクションIで表される。I(V、P、C)は、所与の視聴コンテキストV、コンテンツ分析器15によって決定されるコンテンツパラメータC、およびデコーダパラメータPについて知覚スコアλを返す。ベクトルV、CおよびPは、選択されたタイムスケールにおける差分情報も含むのが好ましいことに留意されたく、たとえば、v1は1つまたは複数の関連したΔv1、tsも有することができる。この差分情報は、システムが絶対値についてのみならず数値の変化も推測できるようにする。
影響モデル12は、所定規則のセットに基づいてユーザ体験影響Iを決定する。それによって、センサデータVは、ユーザコンテキストを所定規則のセット内で予め定義されたユーザコンテキストと比較して、対応するユーザ体験影響Iを抽出するために用いられる。別法として、影響モデル12はセンサデータV自体に基づいてユーザ体験影響Iを決定し、ここで、ユーザ体験はセンサによって直接的または間接的に測定される。それによって、所定のユーザ体験のテストループは、少なくとも定期的に実行されて、デコーダパラメータPを変更しつつユーザ体験影響をテストする。このようなテストループを用いることで、ユーザ体験影響Iはリアルタイムまたは少なくとも準リアルタイムで測定可能である。影響モデル12の構築については、下記においてより詳細に記述される。
制約分析器13とも呼ばれるコーデックモデル13は、デコーダパラメータPの変更がシステム制約Mに及ぼす影響を決定する。デコーダに対する計算要件、メモリ使用量およびバッテリなどの測定基準はこのような制約の例である。コーデックモデル13は、デコーダパラメータの変更の非知覚的影響を決定するためにシステムによって用いられる。たとえば携帯デバイス上でバッテリの消耗が抑えられる必要がある場合、制約分析器13はこの調整を行うためにどのデコーダパラメータを変更するかを決定する。
影響モデル12およびコーデックモデル13とともにセンサ情報Sが、最適なデコーダパラメータPを選択するために選択器14によって用いられる。携帯デバイス上でバッテリ寿命を節約する例を挙げると、選択器14はセンサデータVに基づいて視聴条件を考慮し、バッテリ性能を最大限に活用しつつ知覚品質の低下を抑えるデコーダパラメータPを決定する。それをさらに一歩進めると、一例において、選択器14は、特定の特徴を、通常はこれらを正確に示さない視聴条件において、強調することによって知覚品質を向上させることができるであろう。たとえば日光が非常に明るい中で視聴される携帯タブレットの場合、デコーダパラメータのセットの一部であるならば、システムは、細粒度の詳細を取り除きつつ、その場面における対象の縁のコントラストを上げることができる。
一例において、デコーダ1は、エンコーダ2へのバックワードリンク4によらずにフォワードリンク3によってのみで程度の差はあれ独立した方法で動作し、結果として、最適化は複雑性およびユーザ体験を最適化することに限定される。このような例では、帯域幅、とりわけフォワードリンク3の帯域幅は影響を受け得ない。このシナリオは、マルチキャスト向けである。バックワードリンク4がエンコーダ2に対して提供され、かつエンコーダが影響を受け得るさらなる例は、次に考察されるとおりである。
前述の例は、デコーダのみが選択されたパラメータによって影響を受けることを想定した。このことは、エンコーダ2とデコーダ1との間に厳密に一方向の通信経路がある既存のコーデックに関する一般的なシナリオである。しかしながら将来、ビデオ伝送セッション3の間にデコーダ1がエンコーダ2と通信できるようになる可能性は十分にある。このことは、充実したコンテンツ5の相互作用に関して、またはさらには改善された圧縮性能に関して、複雑性をデコーダおよび/またはネットワークに移すことによってエンコーダ2の側での複雑性が改善されることを理由として行われ得る。このようなシナリオでは、推定される視聴コンテキストおよびコンテンツにとって最適なコーデックパラメータをエンコーダ2に伝えるのにも非常に有用である。そのようにして、エンコーダ2は、ユーザ体験および複雑性のみならず帯域幅も最適化するために制御され得る。この例では、選択された最適なパラメータは、デコーダ2だけでなくコーデック6全体にも影響を及ぼす。さらに、エンコーダ2に至る矢印4は「コーデック」ボックス6を通過し、これは、この情報がエンコーダによって定められるチャネル内(帯域内)に送信されるであろうということを意味することに留意されたい。これは必須ではないが、しかしながら、同期およびネットワーク横断に関する潜在的問題を減じるものである(たとえばファイアウォールなど)。
提示された形態においては、1つのレシーバ/デコーダ1はエンコーダ2からの特定の適合を必要とするため、この例はマルチキャストについて最適化されたものではないことに留意されたい。このことは、ビデオ消費はブロードキャストからユニキャストへ徐々に移行するものと思われるので必ずしも問題ではないが、それでもなお、「最適な」コーデックパラメータが複数のユーザ/デコーダ1に対して集められる「ハイブリッドキャスト」システムを構築する可能性があり、ここでは、クラウドにおいてユーザグループは類似のコンテキストを有すると予想され、特定のエンコーダ2のみがユーザのグループごとに必要とされる。
さらに、前処理ステップにおいて先ず一般的動作が実行され、実際の符号化ステップにおいて個人化され得る動作が実行される、段階的なエンコーダ2が用いられることがある。これを図1上にマッピングすると、コンテンツ記憶装置5は実際には前処理されたストリームを包含するであろうし、エンコーダ2はこの前処理された情報を用いて最終のコーディングおよび適合ステップを行う。このように、ユーザ/ユーザグループごとに完全ではないエンコーダが必要とされる。
影響モデル12の例について、より詳細に記述される。しかしながら、この影響モデル12は、特定の視聴コンテキストV、コーデックパラメータのセットPおよびコンテンツのタイプCについて、視聴体験に及ぼす影響が何かを決定するものであるので、簡単なモデルではない。このように、この影響モデル12は何らかの方法で構築される。一例では、これは手動で行われ、関連する研究から得られる発見的方法を用いる。別の例では、メカニズムは、たとえばさまざまな自由度を与えること、パラメータのセットインスタンスごとにユーザ体験を測定することができるシステムを用いることなどによって、影響モデル12に自己学習を行わせるように実施される。
影響が手動で決定される影響モデル12の第1の例では、視聴コンテキストVがシミュレートされ、コンテンツ記憶装置5は代表的なコンテンツのセットを提供するために選択される。「影響を決定する(Determine impact)」と呼ばれるモジュール(図示せず)が加えられて影響モデル12と通信し、この加えられたモジュールは、特定のパラメータデルタが有するユーザ体験に及ぼす影響を測定し、またはこれをユーザから受信する役割を担う。
それによって、好ましくは異なるパラメータのセットでこれらのクリップ(clip)に示される代表的なテスト集団と、これらの観察者がその体験が良くなったか悪くなったかを示すための装置とを用いて、ユーザ体験は影響モデル12に手動で入力される。この影響は次に複雑性および帯域幅に及ぼす潜在的影響と組み合わされ得、影響モデル12に配置される。
影響モデル12の別の実施形態では、ライブ(live)評価システムが実施される。このようなライブ評価システムでは、センサSによって特定の生理的反応が測定され、特定のパラメータのセットがユーザ体験に及ぼす影響を推定するために用いられる。たとえばウェアラブルデバイスの進歩に伴って、神経活動をライブ方法で監視することが可能になり、そのようにして、たとえば観察者がいつ注意を失うかを決定する。それゆえ、影響モデル12は、近い将来さらに自動化され得、コーデックを最適化するためにユーザおよびユーザの習慣から学習するシステムを構築する可能性は十分にある。
影響モデル12の一例が図2に示される。図2は上記に記述された要素を示し、さらにエンコーダ2に対する入力として機能する代表的なコンテンツ記憶装置16を示す。ブロック17においてどのように視聴コンテキストがエミュレートされるか、かつデコーダパラメータを介して反復するブロック18に対する入力として用いられるかを示す。さらに、ブロック19において影響が決定され、ブロック20において影響モデルの更新が行われる。このようなメカニズムによって、影響モデル12は更新され得る。
本発明は、消費者側のコンテキスト特性に基づくコーデックの的確な適合を可能にする。このコンテキストはこれらのコンテキストの変化の影響とともに推定され、これは、視聴体験、帯域幅および/または複雑性を最適化するために、コーデック特性を機能させるのに用いられる。
本発明は、これまで不可能であった多数の最適化を可能にする。このシステムを介して、光条件、注意持続時間、注視、顕著性などによる適合が可能である。このことは結果として、ユーザがシステムに適合しなければならないというよりも、システムがユーザに適合することを可能にし、それゆえビデオデータが消費される方法に重要な進歩をもたらす。
既存の解決策は、視聴者のコンテキストに従ってコーデックパラメータを自動的に適合させるものではない。本発明は、そのような自動化されたコーデック適合を可能にし、ユーザ体験に関してであれ、帯域幅の使用または複雑性に関してであれ、ビデオ配信システムを最適化することができる多数の使用シナリオを可能にする。
当業者であれば、さまざまな上述した方法のステップは、プログラム化されたコンピュータによって実行され得ることを容易に認識するであろう。本明細書において、いくつかの実施形態はまた、たとえばデジタルデータ記憶媒体など、プログラム記憶デバイスにも及ぶことが意図されており、このプログラム記憶デバイスとは、マシンまたはコンピュータ可読であり、マシン実行可能またはコンピュータ実行可能な命令のプログラムを符号化するものであって、前記命令が、前記上述した方法のステップの一部または全部を実行する。プログラム記憶デバイスは、たとえば、デジタルメモリ、磁気ディスクおよび磁気テープなどの磁気記憶媒体、ハードドライブ、または光学的に可読なデジタルデータ記憶媒体であってよい。実施形態はまた、上述した方法の前記ステップを実行するようにプログラム化されたコンピュータにも及ぶことが意図されている。
本記述および図面は、本発明の原理を例証するにすぎない。したがって、本明細書において明示的に記述または図示されていなくても、当業者であれば、本発明の原理を実施し、かつ本発明の趣旨および範囲に含まれるさまざまな構成を考案できるであろうことが認識されよう。さらに、本明細書で列挙されたすべての例は、主に、本発明の原理および当技術を進展させるために発明者により貢献された概念を読み手が理解する際の助けとなる教育上の目的のみであるということが明確に意図されており、これらの例は、そのような特定の列挙された例および条件に限定されることなく解釈されるべきである。さらに、本明細書において本発明の原理、態様および実施形態、ならびにそれらの特定の例を列挙するすべての記載は、それらの均等物を包含することが意図されている。
「プロセッサ」とラベル付けされた任意の機能ブロックを含む、図に示されるさまざまな要素の機能は、専用のハードウェアおよび適切なソフトウェアと関連付けられたソフトウェアを実行することができるハードウェアの使用を通じて提供されてよい。プロセッサにより提供される場合は、これらの機能は、単一の専用プロセッサによって、単一の共有プロセッサによって、または、そのうちのいくつかが共有され得る複数の個別プロセッサによって提供されてよい。さらに、「プロセッサ」または「コントローラ」という用語を明示的に用いることは、ソフトウェアを実行することができるハードウェアを排他的に指すものと解釈されるべきでなく、限定的ではないが、デジタル信号プロセッサ(DSP)ハードウェア、ネットワークプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ソフトウェアを記憶するための読出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、および不揮発性記憶装置を暗黙的に含んでよい。従来のおよび/またはカスタムの他のハードウェアもまた含まれてよい。同様に、図に示されるいずれのスイッチも概念上のものにすぎない。このスイッチの機能は、プログラムロジックの動作によって、専用ロジックによって、プログラム制御と専用ロジックとの相互作用によって、または手動によってさえも実行されることがあり、特定の技術は、実施者によってコンテキストからより具体的に理解されるように選択可能である。
当業者には、本明細書におけるいずれのブロック図も本発明の原理を実施する例証的な回路の概念図を表すということを認識されたい。同様に、いずれのフローチャート、フローダイアグラム、状態遷移図、擬似コードなども、コンピュータ可読媒体において実質的に表され、かつ、そのようなコンピュータまたはプロセッサが明示的に示されているかどうかに関わらずコンピュータまたはプロセッサによってそのように実行され得るさまざまなプロセスを表すことが認識されるであろう。

Claims (12)

  1. センサデータに基づいてユーザ視聴体験を推定するように構成された推定器を備え、かつ、デコーダパラメータを用いる際に制約を分析するように構成された制約分析器を備える、可変デコーダパラメータから選択されたデコーダパラメータに基づいてビデオを復号するように構成されたビデオデコーダであって、推定器および制約分析器に結合される、可変デコーダパラメータから前記デコーダパラメータを選択するように構成された選択器をさらに備え、
    選択器が所定規則のセットに従ってユーザ視聴体験と制約が均衡されるようにデコーダパラメータを選択するように構成される、ビデオデコーダ。
  2. 選択器が選択されたデコーダパラメータをコーデックパラメータに変換するように構成され、ビデオデコーダがコーデックパラメータをビデオエンコーダに送信するための通信モジュールをさらに備える、請求項1に記載のビデオデコーダ。
  3. 制約が、計算要件、メモリ使用量、バッテリ使用および帯域幅使用の1つまたは複数を含む、請求項1または2に記載のビデオデコーダ。
  4. センサデータが環境パラメータを測定するように構成され、ユーザ視聴体験が環境パラメータとユーザ視聴体験との所定の相関関係に基づいて推定される、請求項1から3のいずれか一項に記載のビデオデコーダ。
  5. センサデータが心拍数視線および光条件の少なくとも1つを含むユーザ条件を測定するように構成され、ユーザ視聴体験がユーザ条件の所定の解釈に基づいて推定される、請求項1から4のいずれか一項に記載のビデオデコーダ。
  6. デコーダパラメータを変更しながらユーザ視聴体験の変化が観察されるように、センサデータが収集されながらデコーダパラメータが変更されるテストループを含む、請求項5に記載のビデオデコーダ。
  7. 請求項1から6のいずれか一項に記載のビデオデコーダから、選択されたデコーダパラメータから変換されたコーデックパラメータを受信するための通信モジュールを備える、コーデックパラメータに基づいてビデオを符号化するように構成された、ビデオエンコーダ。
  8. 請求項1から6のいずれか一項に記載のビデオデコーダを備え、かつ請求項7に記載のビデオエンコーダを備え、ビデオエンコーダがネットワーク機器を介して前記ビデオデコーダと接続される、ビデオシステム。
  9. デコーダパラメータに基づいてビデオを復号するための方法であって、
    − センサデータに基づいてユーザ視聴体験を推定するステップと、
    − デコーダパラメータを用いる際に制約を分析するステップと、
    − 前記推定および前記分析に基づいて可変デコーダパラメータから前記デコーダパラメータを選択するステップとを含む、ビデオを復号するための方法であって、
    前記選択するステップが、所定規則のセットに従ってユーザ視聴体験と制約を均衡させるステップを含む、方法。
  10. 方法が、前記デコーダパラメータをコーデックパラメータに変換するステップと、前記コーデックパラメータをビデオエンコーダに送信するステップとをさらに含む、請求項9に記載の方法。
  11. 実行されたときに、データ処理装置に請求項9または10に記載の方法のステップを実行させる命令を含む、コンピュータ可読記憶媒体。
  12. 実行されたときに、データ処理装置に請求項9または10に記載の方法のステップを実行させる命令を含む、コンピュータプログラム。
JP2017542085A 2015-02-13 2016-02-08 視聴体験とシステム制約に基づくコーディングパラメタの適合化 Active JP6437663B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15305214.7A EP3057318A1 (en) 2015-02-13 2015-02-13 Adapting coding parameters based on viewing experience and system constraints
EP15305214.7 2015-02-13
PCT/EP2016/052628 WO2016128354A1 (en) 2015-02-13 2016-02-08 Adapting coding parameters based on viewing experience and system constraints

Publications (2)

Publication Number Publication Date
JP2018511966A JP2018511966A (ja) 2018-04-26
JP6437663B2 true JP6437663B2 (ja) 2018-12-12

Family

ID=52596904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017542085A Active JP6437663B2 (ja) 2015-02-13 2016-02-08 視聴体験とシステム制約に基づくコーディングパラメタの適合化

Country Status (5)

Country Link
US (1) US10531081B2 (ja)
EP (1) EP3057318A1 (ja)
JP (1) JP6437663B2 (ja)
CN (1) CN107211120A (ja)
WO (1) WO2016128354A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2558644A (en) * 2017-01-13 2018-07-18 Nokia Technologies Oy Video encoding
US10735770B2 (en) * 2018-09-13 2020-08-04 Tencent America LLC Method and device using high layer syntax architecture for coding and decoding
CN116348952A (zh) * 2023-02-09 2023-06-27 北京小米移动软件有限公司 一种音频信号处理、装置、设备及存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11122624A (ja) * 1997-10-16 1999-04-30 Matsushita Electric Ind Co Ltd ビデオデコーダ処理量を低減する方法および装置
JP2000115771A (ja) 1998-10-09 2000-04-21 Sony Corp 画像送信装置および方法、画像受信装置および方法、画像通信システム、並びに提供媒体
US20080320509A1 (en) * 2001-01-16 2008-12-25 Gustafson Joseph E Quantitative Assessment of Marketing Strategies
US6704362B2 (en) * 2001-07-06 2004-03-09 Koninklijke Philips Electronics N.V. Resource scalable decoding
KR100587417B1 (ko) * 2003-12-22 2006-06-08 한국전자통신연구원 주파수 분할 다중화를 사용하는 무선통신 시스템에서의적응 송수신 장치 및 그 방법
JP5030495B2 (ja) * 2006-07-14 2012-09-19 ソニー株式会社 再生装置、再生方法、プログラム、および記録媒体
US8443398B2 (en) * 2006-11-01 2013-05-14 Skyfire Labs, Inc. Architecture for delivery of video content responsive to remote interaction
JP2008288859A (ja) * 2007-05-17 2008-11-27 Olympus Corp 高度な色再現が可能な映像表示システム
US8125314B2 (en) * 2008-02-05 2012-02-28 International Business Machines Corporation Distinguishing between user physical exertion biometric feedback and user emotional interest in a media stream
US8964828B2 (en) * 2008-08-19 2015-02-24 Qualcomm Incorporated Power and computational load management techniques in video processing
KR20120018145A (ko) * 2009-05-06 2012-02-29 톰슨 라이센싱 프리젠테이션 장치 능력에 따라서 최적화된 멀티미디어 콘텐츠를 전송하기 위한 방법 및 시스템
US20110095875A1 (en) * 2009-10-23 2011-04-28 Broadcom Corporation Adjustment of media delivery parameters based on automatically-learned user preferences
US9894314B2 (en) * 2010-06-15 2018-02-13 Dolby Laboratories Licensing Corporation Encoding, distributing and displaying video data containing customized video content versions
US9186077B2 (en) * 2012-02-16 2015-11-17 Google Technology Holdings LLC Method and device with customizable power management
US8768089B2 (en) * 2012-03-23 2014-07-01 Futurewei Technologies, Inc. System and method for filtering an image
US9245497B2 (en) * 2012-11-01 2016-01-26 Google Technology Holdings LLC Systems and methods for configuring the display resolution of an electronic device based on distance and user presbyopia
US9794026B2 (en) * 2013-04-12 2017-10-17 Qualcomm Incorporated Adaptive data interference cancellation
KR102062764B1 (ko) * 2013-07-19 2020-02-21 삼성전자주식회사 모바일 단말 화면을 위한 3k해상도를 갖는 디스플레이 영상 생성 방법 및 장치
US10506257B2 (en) * 2015-09-28 2019-12-10 Cybrook Inc. Method and system of video processing with back channel message management
US10510146B2 (en) * 2016-10-06 2019-12-17 Qualcomm Incorporated Neural network for image processing
US10735154B2 (en) * 2017-03-23 2020-08-04 Huawei Technologies Co., Ltd. Methods and apparatus for coding sub-channel selection

Also Published As

Publication number Publication date
CN107211120A (zh) 2017-09-26
EP3057318A1 (en) 2016-08-17
US20180027232A1 (en) 2018-01-25
WO2016128354A1 (en) 2016-08-18
US10531081B2 (en) 2020-01-07
JP2018511966A (ja) 2018-04-26

Similar Documents

Publication Publication Date Title
Sengupta et al. HotDASH: Hotspot aware adaptive video streaming using deep reinforcement learning
US20220030244A1 (en) Content adaptation for streaming
Liu et al. 360 innovations for panoramic video streaming
CN110620892B (zh) 视频通信中的视频标注技术
CN109618565B (zh) 流式视频用户体验质量的自动测量方法和系统
JP6437663B2 (ja) 視聴体験とシステム制約に基づくコーディングパラメタの適合化
WO2019231619A1 (en) Systems and methods game streaming
Yarnagula et al. QoE for mobile clients with segment-aware rate adaptation algorithm (SARA) for DASH video streaming
CN110087071A (zh) 基于感知的图像处理装置及相关方法
CN116506665A (zh) 自适应码率控制的vr串流方法、系统、装置及存储介质
CN114173160B (zh) 直播推流方法及装置
CN115996292A (zh) 流控模型训练方法、装置、计算机设备和存储介质
Zhang et al. A QOE-driven approach to rate adaptation for dynamic adaptive streaming over http
CN112866756A (zh) 一种多媒体文件的码率控制方法、装置、介质和设备
US11936698B2 (en) Systems and methods for adaptive video conferencing
Wilk et al. A content-aware video adaptation service to support mobile video
AT&T
CN115426526B (zh) 一种视频播放方法、装置、存储介质及设备
Qin Adaptive Bitrate Streaming Over Cellular Networks: Rate Adaptation and Data Savings Strategies
US20240244225A1 (en) Content-aware, machine-learning-based rate control
US20240244227A1 (en) Quality-metric-agnostic rate control
US20240244228A1 (en) Rate control based on machine learning for video encoders
US11870833B2 (en) Methods and systems for encoder parameter setting optimization
CN118102005B (zh) 视频数据处理方法、装置、设备以及介质
US20240121400A1 (en) Video Encoding Complexity Predictor

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180918

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181114

R150 Certificate of patent or registration of utility model

Ref document number: 6437663

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250