JP2009510952A - 拘束された可変ビットレート(vbr)ビデオ・エンコードの方法および装置 - Google Patents

拘束された可変ビットレート(vbr)ビデオ・エンコードの方法および装置 Download PDF

Info

Publication number
JP2009510952A
JP2009510952A JP2008533799A JP2008533799A JP2009510952A JP 2009510952 A JP2009510952 A JP 2009510952A JP 2008533799 A JP2008533799 A JP 2008533799A JP 2008533799 A JP2008533799 A JP 2008533799A JP 2009510952 A JP2009510952 A JP 2009510952A
Authority
JP
Japan
Prior art keywords
time period
bit rate
base layer
signal data
video signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008533799A
Other languages
English (en)
Inventor
イン,ペン
ボイス,ジル,マクドナルド
Original Assignee
トムソン リサーチ ファンディング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by トムソン リサーチ ファンディング コーポレイション filed Critical トムソン リサーチ ファンディング コーポレイション
Publication of JP2009510952A publication Critical patent/JP2009510952A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ネットワークにおける伝送のためにビデオ信号データをエンコードする方法および装置が提供される。本方法は、優先度付けされた構造またはスケーラブルな符号化構造のうちの少なくとも一方を使って可変ビットレートでビデオ信号データをエンコードし、基本層および向上層を有するビットストリームを得るステップを含む。エンコードする前記ステップは、基本層ビットレートが第一の時間期間にわたって第一の値以下であり、基本層および向上層を含むビットストリームの全体が第二の時間期間にわたって第二の値以下であるビットレートに拘束されるよう、ビデオ信号データをエンコードする。

Description

〈政府の権利〉
米国標準・技術局(National Institute of Standards and Technology)によって授与されたプロジェクトID契約第2003005676Bの条件により定められているように、米国政府は本発明に支払い済みのライセンスを有しており、限られた状況では特許保有者に対して他者にリーズナブルな条件でライセンスするよう要求する権利を有するものである。
〈関係する出願への相互参照〉
本出願は、2005年9月29日に出願され、“Method and Apparatus for Constrained Variable Bit Rate (VBR) Video Encoding”と題する米国仮出願第60/721,768号の恩恵を主張するものであり、該文献はここに参照によってその全体において組み込まれる。
〈発明の分野〉
本発明は、概括的にはビデオ・エンコードに、より詳細には、拘束された可変ビットレート(VBR)ビデオ・エンコードのための方法および装置に関する。
エンコードされたビデオ・ストリームのビットレートを調節するためにレート制御が使われる。レート制御がエンコーダで適用されるとき、目標ビットレートを満たすよう量子化パラメータが調整される。レート制御は大まかに次の二つの範疇に分けることができる:固定ビットレート(CBR: constant bit rate)および可変ビットレート(VBR: variable bit rate)である。ネットワーク・アプリケーションでは、CBRがネットワーク動作を大幅に単純化できるものの、CBRはVBRほど効率的ではなく、著しくビデオ品質をコンプライズする。特に、動きの多いコンテンツについて低ビットレートではそうである。個々のフレームが異なるレベルの複雑さをもち、よって同じデコード品質で圧縮される異なる数のビットを必要とするということを考えると、VBRがビデオについての「自然な」表現と見ることができる。
VBR符号化はCBR符号化より良好な品質を与えると考えられてきたが、純粋な、あるいは拘束されないVBRは実際上は使われていない。一つの理由は、典型的な伝送環境が、伝送レートの任意の変動は許容しないことがありうるということである。よって、エンコーダは、ある種の拘束を満たすことのできるVBRビットストリームを生成する必要がある。
VBRが実際上使われるとき、ビットレート割り当てに適用される一般的な拘束は、シーケンス全体の平均ビットレートまたは特定のフレーム期間についての総ビットレートである。しかしながら、VBR伝送が、ビデオ優先度付けされた(prioritized)構造および/またはスケーラブルな(scalable)構造に関してビデオを認識する(video-aware)ネットワークで、あるいは追加的に、ビデオを認識するパケットレベルの多重化(multiplexing)または交換(switching)を許容するネットワークで使われるとき、そのようなネットワークを利用して可能な最良の品質が達成できるようにするためには、新しいVBR拘束が必要とされる。
従来技術のこれらおよびその他の欠点および不都合な点が、拘束された可変ビットレート(VBR)ビデオ・エンコードのための方法および装置に向けられている本発明によって対処される。
本発明のある側面によれば、ネットワークにおける伝送のためにビデオ信号データをエンコードする方法が提供される。本方法は、優先度付けされた構造またはスケーラブルな符号化構造のうちの少なくとも一方を使って可変ビットレートでビデオ信号データをエンコードし、基本層および向上層を有するビットストリームを得るステップを含む。エンコードする前記ステップは、基本層ビットレートが第一の時間期間にわたって第一の値以下であり、基本層および向上層を含むビットストリームの全体が第二の時間期間にわたって第二の値以下であるビットレートに拘束されるよう、ビデオ信号データをエンコードする。
本発明のもう一つの側面によれば、ビデオを認識する多重化およびビデオを認識する交換のうちの少なくとも一方をサポートするネットワークにおける伝送のためにビデオ信号データをエンコードするビデオ・エンコーダが提供される。本ビデオ・エンコーダは、優先度付けされた構造またはスケーラブルな符号化構造のうちの少なくとも一方を使って可変ビットレートでビデオ信号データをエンコードし、基本層および向上層を有するビットストリームを得るエンコーダを含む。前記エンコーダは、基本層ビットレートが第一の時間期間にわたって第一の値以下であり、基本層および向上層を含むビットストリームの全体が第二の時間期間にわたって第二の値以下であるビットレートに拘束されるよう、ビデオ信号データをエンコードする。
本発明のこれらのことを含むさまざまな側面、特徴および利点は、付属の図面と関連して読まれるべき、例示的な実施形態の以下の詳細な記述から明らかになるであろう。
本発明は、例示的な図面に基づいてよりよく理解されうる。
本発明は、拘束された可変ビットレート(VBR)ビデオ・エンコードのための方法および装置に向けられる。ある実施形態では、優先度付けされた符号化構造および/またはスケーラブルな符号化構造に関してビデオを認識し、ビデオを認識する多重化または交換をサポートするネットワークについて改良された品質を達成する、VBRのための新しい拘束が提案される。ここでの用法では、「ビデオを認識する(video-aware)」の用語は、ビデオを他のデータまたは声から区別できるネットワーク、ルーターおよび/または交換機構をいう。
本記述は、本発明の原理を例示するものである。よって、当業者が、ここで明示的に記述や図示されなくても、本発明の原理を具現し、その精神および範囲内に含まれるさまざまな構成を考案できるであろうことは理解されるであろう。
ここで言及されるあらゆる例および条件的な言辞は、読者が本発明の原理および当技術分野の発展に対して発明者が貢献する概念を理解するのを助ける教育的な目的のために意図されており、そのような個別的に言及される例および条件への限定なしに解釈されるものとする。
さらに、本発明の原理、側面および実施形態ならびにその個別的な例に言及するあらゆる陳述は、その構造的および機能的な等価物の両方を包含することが意図されている。さらに、そのような等価物は、現在知られている等価物も将来開発される等価物、すなわち構造に関わりなく同じ機能を実行する開発された任意の要素も両方とも含むことが意図されている。
よって、たとえば、当業者は、ここに呈示されるブロック図は本発明の原理を具現する例示的な回路の概念的なビューを表現していることを理解するであろう。同様に、あらゆるフローチャート、流れ図、状態遷移図、擬似コードなどは、コンピュータ可読媒体において実質的に表現され、よってコンピュータまたはプロセッサによって実行されうるさまざまなプロセスを表すことが理解されるであろう。それはそのようなコンピュータやプロセッサが明示的に示されているか否かによらない。
図面に示されるさまざまな要素の機能は、専用ハードウェアの使用を通じても、適切なソフトウェアに関連してソフトウェアを実行できるハードウェアの使用を通じても提供されうる。プロセッサによって提供されるとき、諸機能は単一の専用プロセッサによって、単一の共有プロセッサによって、あるいは一部が共有されていてもよい複数の個別プロセッサによって提供されてもよい。さらに、「プロセッサ」または「コントローラ」の用語の明示的な使用は、ソフトウェアを実行できるハードウェアのみを指すものと解釈すべきではなく、これに限られないが、デジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを記憶する読み出し専用メモリ(ROM)、ランダム・アクセス・メモリ(RAM)および不揮発性記憶装置を暗黙的に含みうる。
通常のハードウェアおよび/またはカスタム・ハードウェアを含む他のハードウェアも含められてもよい。同様に、図示されるいかなるスイッチも単に概念的である。その機能はプログラム論理の動作を通じて、専用論理を通じて、プログラム制御および専用論理の相互作用を通じて、またさらには手動でさえも実行されうる。具体的な技術は、コンテキストからより個別的に理解されるように、実装者が選択できる。
本願の請求項では、指定された機能を実行する手段として表現されているいかなる要素も、その機能を実行する任意の仕方を包含することが意図されている。それにはたとえば、a)その機能を実行する回路要素の組み合わせ、b)ファームウェア、マイクロコードなどを含む任意の形のソフトウェアをその機能を実行するためにそのソフトウェアを実行する適切な回路と組み合わせたもの、が含まれる。そのような請求項によって定義される発明は、さまざまな記載される手段によって提供される機能性がそれらの請求項が求めている仕方で組み合わされ、まとめられるという事実に存する。よって、それらの機能性を提供できるいかなる手段もここに示される手段と等価であると見なされる。
図1に目を転じると、例示的なビデオを認識するネットワークが、概括的に参照符号100によって示されている。優先度付けのあるネットワーク(prioritized network)100はコンテンツ・プロバイダー110を含む。コンテンツ・プロバイダー110は今度はビデオ・エンコーダ112およびマルチプレクサ114を含む。ビデオ・エンコーダ112の第1ないし第Nの出力は、ビデオ・ストリーム1ないしビデオ・ストリームNに対応し、それぞれマルチプレクサ114の第1ないし第Nの入力と信号通信において接続されている。マルチプレクサ114の出力は、地域のブロードバンド・ネットワーク120の入力と信号通信において接続されている。地域のブロードバンド・ネットワーク120の出力は、デジタル加入者線アクセス・マルチプレクサ(DSLAM: Digital Subscriber Line Access Multiplexer)130の入力と信号通信において接続されている。DSLAM130の第1ないし第Mの出力は、それぞれ、第1ないし第Mのモデム(図1ではモデム142およびモデム144によって代表されている)の入力と信号通信において接続されている。モデム142の第一の出力は、STB152の入力と信号通信において接続されている。STB152の出力は、テレビ162の入力と信号通信において接続されている。モデム142の第二の出力は、STB54の入力と信号通信において接続されている。STB154の出力は、テレビ164の入力と信号通信において接続されている。
DSLAM130はビデオを認識するよう構成されている。DSLAM130は、個々のADSLリンクのトラフィックを管理して、各家庭が商業品質で任意の二つ(または任意のN本)の番組ストリームを受信できることを保証するようにする。たとえば、セットトップボックス(set top box)152および154ならびにテレビ162および164を含む家は、商業品質で、モデム142を通じて、単一の非対称デジタル加入者線(ADSL: Asymmetric Digital Subscriber Line)リンクを介して、ビデオ・エンコーダ112から任意の二本の番組ストリームを受信できるであろう。単一のADSLラインを通じた二つのビットストリームは、追加的な帯域幅が該ADSLリンク上で利用可能である場合、たとえば、一つのストリームしかない場合、あるいは他方のストリームがより低い瞬間ビットレートを有している場合、追加的な帯域幅を動的に利用できるべきである。DSLAM130によって実行される多重化を大幅に単純化するであろう単純な解決策は、まずネットワーク100の総帯域幅(R)をビットストリーム数(N)で割り、目標平均ビットレートRavg=R/Nを求め、次いでその同じビットレートRavgでのCBRで各ストリームを符号化することである。しかし、これではVBRよりも低品質になる。
図2に目を転じると、本発明が適用されうる例示的なエンコーダが、概括的に参照符号200によって示されている。エンコーダ200への入力は、加算接合点210の非反転入力と信号通信において接続されている。加算接合点210の出力は、ブロック変換器220と信号通信において接続されている。変換器220は量子化器230の第一の入力と信号通信において接続されている。量子化器230の出力は、可変長符号化器(VLC: variable length coder)240と信号通信において接続されている。ここで、VLC240の出力が、エンコーダ200の外部から利用可能な出力である。レート・コントローラ277の第一の入力は、加算接合点210の出力と信号通信において接続されており、レート・コントローラ277の第二の入力は、VLC240の出力と信号通信において接続されており、レート・コントローラ277の出力は、量子化器230の第二の入力と信号通信において接続されている。
量子化器230の出力はさらに、逆量子化器250と信号通信において接続されている。逆量子化器250は、逆ブロック変換器260と信号通信において接続されている。逆ブロック変換器260は今度は参照画像記憶270と信号通信において接続されている。参照画像記憶270の第一の出力は、動き推定器280の第一の入力と信号通信において接続されている。エンコーダ200への入力がさらに、動き推定器280の第二の入力と信号通信において接続されている。動き推定器280の出力は、動き補償器290の第一の入力と信号通信において接続されている。参照画像記憶270の第二の出力は、動き補償器290の第二の入力と信号通信において接続されている。動き補償器290の出力は、加算接合点210の反転入力と信号通信において接続されている。
本発明の原理によれば、優先度付けされた符号化構造および/またはスケーラブルな符号化構造に関してビデオを認識し、ビデオを認識する多重化または交換をサポートするネットワーク(たとえば、図1に関して図示および記述されたネットワーク100のような)について改良された品質を達成する、VBRのための新しい拘束が呈示される方法および装置が開示される。ビデオ・ストリームは、優先度付けされたおよび/またはスケーラブルなビデオ符号化をサポートすると想定される。たとえば、ストリームは、図3に示されるような基本層(base layer)および(単数または複数の)向上層(enhancement layer)を含む優先化された構造を使って時間的なスケーラビリティをサポートできる。
図3に目を向けると、例示的なビデオ・ピクチャー・グループ(GOP: group of pictures)構造が概括的に参照符号300によって示されている。ビデオGOP構造300は、表示順に示されており、フレーム依存性および割り当てられた優先度レベルを示している。基本層310はI画像およびP画像のみを含み、向上層320はB/b画像を含む。I画像はイントラ符号化された画像であり、他の画像を符号化するときに参照として使われる。P画像は予測的にインター符号化された画像であり、他の画像を符号化するときに参照として使われる。B画像は双方向予測的に符号化された画像であり、他の画像を符号化するときに参照として使われる。b画像は、双方向予測的に符号化された画像であって、他の画像を符号化するときに参照として使われないものである。基本層310は、向上層320よりも高い優先度をもつ。基本層310は、低めのフレームレートのビデオについて、向上層320からは独立してデコードできる。この型の構造では、エンコーダによって生成される可変ビットレートが目標平均ビットレート(I+P+B+b)を超えることを許容するが、ビットストリームのある部分(B+b)、たとえば向上層は、商業品質の要求(I+P)を満たしつつ、後続の基本層ビットストリームに影響することなく無視できる。VBRがこの型のビットストリームを生成するために使われて、ビットストリームの平均ビットレートおよびある期間についてのピーク・ビットレートだけが考えられ、さらにB/bフレームが全部落とされるようにされる場合、それでも残りのビットレートが平均帯域幅より高いことがありうる。これは、DSLAM130が最高優先度のパケットを落とすことを強制し、よってビデオ品質を大いに害することがありうる。
ビットストリームiについての基本層ビットストリーム・レートがRbase,iで、Rbase,iは拘束:
Figure 2009510952
を満たすとする。
式(1)を満たす単純な解決策は、Rbase,i=Ravgとおくことである。しかしながら、他の解決策も可能である。ビットストリームiについての全体ビットストリーム・レート(すなわち、基本層および向上層についての)がRtot,iで、Rtot,i≧Rbase,iであるとする。これは、基本層と向上層との間のビットレート比要件および/または受け容れられる主観的品質に基づいて決定できる。よって、各ビットストリームについての新しいVBR拘束を、次のように定義できる:(1)拘束1(基本層拘束)では、基本層のビットレートが、時間期間Tbaseにわたって高々Rbase,iに拘束される;(2)拘束2(全体ビットストリーム拘束)では、全体ビットストリーム(基本層および向上層)が時間期間Ttotalにわたって高々Rtot,iに拘束される;(3)拘束3(MinQP拘束)では、各画像および/またはマクロブロックについての最小の量子化パラメータ(QP: Quantization Parameter)がMinQPに設定される。
上記の拘束のうち、拘束1は、ネットワークを通じて送信されるすべてのビットストリームについて最小受け容れ可能品質が満たせることを保証することに向けられるものである。Rbase,iは式(1)を満たすので、基本層ビットストリームは、すべてのビットストリームについて保証される。すなわち、基本層からの画像はDSLAM130によって落とされることはない。拘束2は、追加的な帯域幅が利用可能なときに、可能な最良の品質を達成するために統計的な多重化(statistical multiplexing)を利用することに向けられる。拘束3では、それより小さな値は主観的な品質改善を与えることなく無用にビットレートを増してしまうようなMinQPが定義される。拘束3は、単純な内容のビットストリームがより少ない帯域幅を使うことを許容し、それにより他のビットストリームにより多くの帯域幅を残すようにすることができる。これは統計的な多重化の利得を改善することもできる。
上記の諸拘束において、TbaseはTtotalに等しくてもよいし、あるいは両者は異なっていてもよい。時間期間は、全連続期間または各離散期間として決定できる。拘束3は任意的であり、本願の原理に基づくある種の実施形態では実装されてもされなくてもよいことを理解しておくべきである。
図4に目を向けると、ビデオを認識する多重化および/またはビデオを認識する交換をサポートするネットワークにおける可変ビットレート(VBR)エンコードのための例示的な方法が、概括的に参照符号400によって示されている。方法400は、ループ境界ブロック410に制御を渡す初期化ブロック405を含む。ループ境界ブロック410は、エンコードされるべきビットストリームの各フレームについてループを開始し、判断ブロック415に制御を渡す。判断ブロック415は、現在のフレームが基本層に属しているかどうかを判定する。基本層に属していれば、制御は機能ブロック420に渡される。そうでなければ、制御は機能ブロック425に渡される。
機能ブロック420は、ある期間にわたる基本層拘束(拘束1)を使ってフレーム・ビット割り当てを実行し、機能ブロック425に制御を渡す。機能ブロック425は、ある期間にわたる全体ビットストリーム拘束(拘束2)を使ってフレーム・ビット割り当てを実行し、機能ブロック430に制御を渡す。機能ブロック430は、現在フレームの前処理を実行し、機能ブロック435に制御を渡す。機能ブロック435はフレーム量子化パラメータ(QP)の推定を実行し、ここでQP=max(QP,minQP)であり、ループ境界ブロック440に制御を渡す。ループ境界ブロック440は、現在フレームにおける各マクロブロックについてのループを開始し、判断ブロック445に制御を渡す。判断ブロック445は、マクロブロック(MB)レベルのレート制御が実行されるべきかどうかを判定する。そうであれば、制御は機能ブロック450に渡される。そうでなければ、制御は機能ブロック480に渡される。
機能ブロック450は、マクロブロック量子化パラメータ推定を実行し、ここでQP=max(QP,minQP)であり、機能ブロック455に制御を渡す。機能ブロック455は、MBエンコードを実行し、機能ブロック460に制御を渡す。機能ブロック460はマクロブロック統計を更新し、ループ境界ブロック465に制御を渡す。ループ境界ブロック465は、現在フレームの各マクロブロックについてのループを終了し、機能ブロック470に制御を渡す。機能ブロック470は、フレーム統計およびフレーム・バッファを更新し、ループ境界ブロック475に制御を渡す。ループ境界ブロック475は現在フレームについてのループを終了し、終了ブロック485に制御を渡す。
機能ブロック480はマクロブロック・エンコードを実行し、ループ境界ブロック465に制御を渡す。
ここで、本発明の多くの付随する利点/特徴のいくつかについて述べる。そのいくつかは上述されている。たとえば、ある利点/特徴は、ネットワークにおける伝送のためにビデオ信号データをエンコードする方法であって、優先度付けされた構造またはスケーラブルな符号化構造のうちの少なくとも一方を使って可変ビットレートでビデオ信号データをエンコードし、基本層および向上層を有するビットストリームを得るステップを含む。エンコードする前記ステップは、基本層ビットレートが第一の時間期間にわたって第一の値以下であり、基本層および向上層を含むビットストリームの全体が第二の時間期間にわたって第二の値以下であるビットレートに拘束されるよう、ビデオ信号データをエンコードする。もう一つの利点/特徴は、エンコードする前記ステップが、ビデオ信号データ中の画像またはマクロブロックをエンコードするために使われる量子化パラメータを、ある特定の閾値以上になるよう拘束することを含む、前記エンコード方法である。さらにもう一つの利点/特徴は、前記エンコード方法であって、前記ビデオ信号データがネットワークを通じた伝送のために少なくとも二つのビットストリームにエンコードされ、当該方法がさらに、前記少なくとも二つのビットストリームについての基本層ビットレートの合計が総ネットワーク帯域幅以下となるよう拘束することを含む、方法である。さらにもう一つの利点/特徴は、前記第一の値が、総ネットワーク帯域幅を、ある所与の時点でネットワークを通じて伝送されるべきビットストリームの総数で割ることによって計算される目標平均ビットレートに等しくなるよう設定される、前記エンコード方法である。また、もう一つの利点/特徴は、前記第二の値が、基本層と向上層とのビットレート比要件または受け容れられる主観的品質のうちの少なくとも一方に基づいて、前記第一の値以上となるよう設定される、前記エンコード方法である。さらに、もう一つの利点/特徴は、前記第一の時間期間および前記第二の時間期間が、それぞれ、連続的な時間期間または離散的な時間期間として選択的に定義されることができる、前記エンコード方法である。さらに、もう一つの利点/特徴は、前記第一の時間期間が前記第二の時間期間に等しい、前記エンコード方法である。さらに、もう一つの利点/特徴は、前記第一の時間期間が前記第二の時間期間に等しくない、前記エンコード方法である。また、もう一つの利点/特徴は、前記ネットワークが、ビデオを認識する多重化またはビデオを認識する交換のうちの少なくとも一方をサポートする、前記エンコード方法である。
本発明のこれらおよびその他の特徴および利点は、本稿の教示に基づいて当業者によって容易に認識されうる。本発明の教示がさまざまな形のハードウェア、ソフトウェア、ファームウェア、特殊目的プロセッサまたはそれらの組み合わせで実装されうることは理解しておくべきである。
最も好ましくは、本発明の教示は、ハードウェアおよびソフトウェアの組み合わせとして実装される。さらに、前記ソフトウェアは、プログラム記憶ユニット上に具体的に具現されたアプリケーション・プログラムとして実装されてもよい。アプリケーション・プログラムは、いかなる好適なアーキテクチャを有する機械にアップロードされ、該機械によって実行されてもよい。好ましくは、該機械は、一つまたは複数の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)および入出力(I/O)インターフェースのようなハードウェアを有するコンピュータ・プラットフォーム上で実装される。コンピュータ・プラットフォームは、オペレーティング・システムおよびマイクロ命令コードを含みうる。本稿で記載されたさまざまなプロセスおよび機能は、マイクロ命令コードの一部またはアプリケーション・プログラムの一部またはそれらのいかなる組み合わせであってもよく、CPUによって実行されてもよい。さらに、追加的なデータ記憶ユニットおよび印刷ユニットといったさまざまな他の周辺ユニットが前記コンピュータ・プラットフォームに接続されていてもよい。
さらに、付属の図面に描かれている構成システム・コンポーネントおよび方法の一部は好ましくはソフトウェアで実装されるので、システム・コンポーネントまたはプロセス機能ブロックの間の実際の接続は、本発明がプログラムされる仕方に依存して異なることがあることを理解しておくべきである。本稿の教示を与えられれば、当業者は、本発明のこれらおよび同様の実装または構成を考えることができるであろう。
例示的な実施形態は、付属の図面を参照して記載されてきたが、本発明が精密にそれらの実施形態に限定されるものではないこと、本発明の範囲や精神から外れることなく当業者はそれにさまざまな変更および修正を実施しうることは理解しておくべきである。そのようなすべての変更および修正は、付属の請求項に述べられている本発明の範囲内に含められることが意図されている。
本願の原理のある実施形態に基づく、本願の原理が適用されうる例示的なビデオを認識するネットワークについてのブロック図である。 本願の原理のある実施形態に基づく、本願の原理が適用されうる例示的なビデオ・エンコーダについてのブロック図である。 本願の原理のある実施形態に基づく、本願の原理が適用されうる例示的なビデオ・ピクチャー・グループ(GOP)の図である。 本願の原理のある実施形態に基づく、ビデオを認識する多重化および/またはビデオを認識する交換をサポートするネットワークにおける可変ビットレート(VBR)エンコードのための例示的な方法の流れ図である。

Claims (18)

  1. ネットワークにおける伝送のためにビデオ信号データをエンコードする方法であって:
    可変ビットレートでビデオ信号データをエンコードし、基本層および向上層を有するビットストリームを得るステップを有しており;
    エンコードする前記ステップは、基本層ビットレートが第一の時間期間にわたって第一の値未満であり、組み合わされた基本層および向上層のビットレートが第二の時間期間にわたって第二の値未満のビットレートに拘束されるよう、ビデオ信号データをエンコードする、方法。
  2. エンコードする前記ステップが、ビデオ信号データ中の画像またはマクロブロックのうちの少なくとも一方をエンコードするために使われる量子化パラメータを、ある閾値より大きくなるよう拘束することを含む、請求項1記載の方法。
  3. 請求項1記載の方法であって、前記ビデオ信号データがネットワークを通じた伝送のために少なくとも二つのビットストリームにエンコードされ、当該方法がさらに、前記少なくとも二つのビットストリームについての基本層ビットレートの合計が総ネットワーク帯域幅以下となるよう拘束することを含む、方法。
  4. 前記第一の値が、総ネットワーク帯域幅を、ある所与の時点でネットワークを通じて伝送されるべきビットストリームの総数で割ることによって計算される目標平均ビットレートに等しくなるよう設定される、請求項1記載の方法。
  5. 前記第二の値が、基本層と向上層とのビットレート比要件または受け容れられる主観的品質のうちの少なくとも一方に基づいて、前記第一の値以上となるよう設定される、請求項1記載の方法。
  6. 前記第一の時間期間および前記第二の時間期間が、それぞれ、連続的な時間期間または離散的な時間期間として選択的に定義されることができる、請求項1記載の方法。
  7. 前記第一の時間期間が前記第二の時間期間に等しい、請求項1記載の方法。
  8. 前記第一の時間期間が前記第二の時間期間に等しくない、請求項1記載の方法。
  9. 前記ネットワークが、ビデオを認識する多重化またはビデオを認識する交換のうちの少なくとも一方をサポートする、請求項1記載の方法。
  10. ネットワークにおける伝送のためにビデオ信号データをエンコードする装置であって:
    可変ビットレートでビデオ信号データをエンコードし、基本層および向上層を有するビットストリームを得るエンコーダを有しており;
    前記エンコーダは、基本層ビットレートが第一の時間期間にわたって第一の値未満であり、組み合わされた基本層および向上層のビットレートが第二の時間期間にわたって第二の値未満のビットレートに拘束されるよう、ビデオ信号データをエンコードする、装置。
  11. 前記エンコーダが、ビデオ信号データ中の画像またはマクロブロックのうちの少なくとも一方をエンコードするために使われる量子化パラメータを、ある閾値より大きくなるよう拘束することを含む、請求項10記載の装置。
  12. 請求項10記載の装置であって、前記ビデオ信号データがネットワークを通じた伝送のために少なくとも二つのビットストリームが得られるようエンコードされ、前記エンコーダが、前記少なくとも二つのビットストリームについての基本層ビットレートの合計が総ネットワーク帯域幅以下となるよう拘束する、装置。
  13. 前記第一の値が、総ネットワーク帯域幅を、ある所与の時点でネットワークを通じて伝送されるべきビットストリームの総数で割ることによって計算される目標平均ビットレートに等しくなるよう設定される、請求項10記載の装置。
  14. 前記第二の値が、基本層と向上層とのビットレート比要件または受け容れられる主観的品質のうちの少なくとも一方に基づいて、前記第一の値以上となるよう設定される、請求項10記載の装置。
  15. 前記第一の時間期間および前記第二の時間期間がそれぞれ、連続的な時間期間または離散的な時間期間として選択的に定義されることができる、請求項10記載の装置。
  16. 前記第一の時間期間が前記第二の時間期間に等しい、請求項10記載の装置。
  17. 前記第一の時間期間が前記第二の時間期間に等しくない、請求項10記載の装置。
  18. 前記ネットワークが、ビデオを認識する多重化またはビデオを認識する交換のうちの少なくとも一方をサポートする、請求項10記載の装置。
JP2008533799A 2005-09-29 2006-09-27 拘束された可変ビットレート(vbr)ビデオ・エンコードの方法および装置 Pending JP2009510952A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72176805P 2005-09-29 2005-09-29
PCT/US2006/039207 WO2007038807A2 (en) 2005-09-29 2006-09-27 Method and apparatus for constrained variable bit rate (vbr) video encoding

Publications (1)

Publication Number Publication Date
JP2009510952A true JP2009510952A (ja) 2009-03-12

Family

ID=37807874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008533799A Pending JP2009510952A (ja) 2005-09-29 2006-09-27 拘束された可変ビットレート(vbr)ビデオ・エンコードの方法および装置

Country Status (7)

Country Link
US (1) US8477840B2 (ja)
EP (1) EP1938618A2 (ja)
JP (1) JP2009510952A (ja)
KR (1) KR101340937B1 (ja)
CN (1) CN101297555B (ja)
BR (1) BRPI0616615A8 (ja)
WO (1) WO2007038807A2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012124896A (ja) * 2010-12-07 2012-06-28 Mediatek Inc 低遅延階層のbグループを有するピクチャ構造を用いた動画像符号化の方法及び装置
WO2014002914A1 (ja) * 2012-06-28 2014-01-03 ソニー株式会社 送信/受信装置、方法、符号化/復号化装置
WO2015177966A1 (ja) * 2014-05-23 2015-11-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法及び画像符号化装置
JP2016051927A (ja) * 2014-08-28 2016-04-11 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US10129551B2 (en) 2014-08-28 2018-11-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
JP2019092202A (ja) * 2014-05-23 2019-06-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像符号化方法及び画像復号装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8229983B2 (en) * 2005-09-27 2012-07-24 Qualcomm Incorporated Channel switch frame
NZ566935A (en) * 2005-09-27 2010-02-26 Qualcomm Inc Methods and apparatus for service acquisition
WO2008061211A2 (en) * 2006-11-15 2008-05-22 Qualcomm Incorporated Systems and methods for applications using channel switch frames
US20090279614A1 (en) * 2008-05-10 2009-11-12 Samsung Electronics Co., Ltd. Apparatus and method for managing reference frame buffer in layered video coding
FR2939593B1 (fr) * 2008-12-09 2010-12-31 Canon Kk Procede et dispositif de codage video
US8904445B2 (en) * 2011-01-24 2014-12-02 At&T Intellectual Property I, L.P. Methods and apparatus to manage bandwidth allocations in media delivery networks
US9510006B2 (en) * 2013-05-03 2016-11-29 Empire Technology Development Llc Scalable video coding prioritization
US9992502B2 (en) 2016-01-29 2018-06-05 Gopro, Inc. Apparatus and methods for video compression using multi-resolution scalable coding
US10291910B2 (en) 2016-02-12 2019-05-14 Gopro, Inc. Systems and methods for spatially adaptive video encoding
US10163030B2 (en) 2016-05-20 2018-12-25 Gopro, Inc. On-camera image processing based on image activity data
US10198862B2 (en) 2017-01-23 2019-02-05 Gopro, Inc. Methods and apparatus for providing rotated spherical viewpoints
US10897648B2 (en) * 2019-03-27 2021-01-19 Rovi Guides, Inc. Method and apparatus for identifying a single user requesting conflicting content and resolving said conflict
WO2021074269A1 (en) * 2019-10-15 2021-04-22 Interdigital Ce Patent Holdings, Sas Method and apparatuses for sending and receiving a video
CN111787323B (zh) 2020-05-23 2021-09-03 清华大学 一种基于对抗学习的可变比特率生成式压缩方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02182081A (ja) * 1989-01-07 1990-07-16 Nippon Steel Corp 指定ビットレートの簡易実現法
JPH06339115A (ja) * 1993-05-26 1994-12-06 Victor Co Of Japan Ltd 画像符号化装置及び記録媒体
JPH08317384A (ja) * 1995-05-17 1996-11-29 Hitachi Ltd 情報処理システム
JPH11112998A (ja) * 1997-10-01 1999-04-23 Matsushita Electric Ind Co Ltd 映像信号階層化符号化装置
JP2000078529A (ja) * 1998-06-17 2000-03-14 Victor Co Of Japan Ltd 可変転送レ―ト符号化装置
JP2001025013A (ja) * 1999-07-12 2001-01-26 Matsushita Electric Ind Co Ltd 送受信方法及びその装置
JP2002100994A (ja) * 2000-07-14 2002-04-05 Nokia Mobile Phones Ltd 媒体ストリームのスケーラブル符号化方法、スケーラブルエンコーダおよびマルチメディア端末
WO2004075561A1 (en) * 2003-02-21 2004-09-02 Mitsubishi Denki Kabushiki Kaisha Method and system for transporting a video over a network including multiple

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6721306B1 (en) * 1997-03-11 2004-04-13 Verizon Services Corp. Public wireless/cordless internet gateway
US6477202B1 (en) 1997-09-03 2002-11-05 Matsushita Electric Industrial Co., Ltd. Apparatus of layered picture coding, apparatus of picture decoding, methods of picture decoding, apparatus of recording for digital broadcasting signal, and apparatus of picture and audio decoding
US6118498A (en) 1997-09-26 2000-09-12 Sarnoff Corporation Channel scanning and channel change latency reduction in an ATSC television receiver
US7313318B2 (en) 1998-06-17 2007-12-25 Victor Company Of Japan, Limited Video signal encoding and recording apparatus with variable transmission rate
US7457415B2 (en) 1998-08-20 2008-11-25 Akikaze Technologies, Llc Secure information distribution system utilizing information segment scrambling
FI106998B (fi) * 1999-01-15 2001-05-15 Nokia Mobile Phones Ltd Bittinopeuden ohjaus multimedialaitteessa
US6639943B1 (en) 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
US6510177B1 (en) * 2000-03-24 2003-01-21 Microsoft Corporation System and method for layered video coding enhancement
US7418007B1 (en) 2000-09-20 2008-08-26 General Instrument Corporation Method and apparatus for determining a transmission bit rate in a statistical multiplexer
KR20020064904A (ko) * 2000-09-22 2002-08-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 파인-입상 스케일러빌리티의 바람직한 전송/스트리밍 오더
JP4492777B2 (ja) * 2001-08-28 2010-06-30 日本電気株式会社 動画像符号化装置
WO2003028237A1 (en) 2001-09-28 2003-04-03 Divxnetworks, Inc. Dynamic bit rate control process
FI114527B (fi) * 2002-01-23 2004-10-29 Nokia Corp Kuvakehysten ryhmittely videokoodauksessa
US6763019B2 (en) 2002-03-05 2004-07-13 Nokia Corporation Method and system for authenticated fast channel change of media provided over a DSL connection
US20030196211A1 (en) 2002-04-10 2003-10-16 Peter Chan Systems, methods and apparatuses for simulated rapid tuning of digital video channels
US7457416B1 (en) * 2002-07-17 2008-11-25 Bbn Technologies Corp. Key distribution center for quantum cryptographic key distribution networks
US7810124B2 (en) 2003-01-28 2010-10-05 Thomson Licensing Robust mode staggercasting fast channel change
US20040181813A1 (en) 2003-02-13 2004-09-16 Takaaki Ota Methods and systems for rapid channel change within a digital system
FR2858741A1 (fr) * 2003-08-07 2005-02-11 Thomson Licensing Sa Dispositif et procede de compression d'images numeriques
US7369610B2 (en) 2003-12-01 2008-05-06 Microsoft Corporation Enhancement layer switching for scalable video coding
US8286203B2 (en) 2003-12-19 2012-10-09 At&T Intellectual Property I, L.P. System and method for enhanced hot key delivery
US20050175085A1 (en) * 2004-01-23 2005-08-11 Sarnoff Corporation Method and apparatus for providing dentable encoding and encapsulation
US7430222B2 (en) 2004-02-27 2008-09-30 Microsoft Corporation Media stream splicer
US20050229221A1 (en) 2004-04-05 2005-10-13 Sharp Laboratories Of America Inc. System and method for low-delay channel hopping

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02182081A (ja) * 1989-01-07 1990-07-16 Nippon Steel Corp 指定ビットレートの簡易実現法
JPH06339115A (ja) * 1993-05-26 1994-12-06 Victor Co Of Japan Ltd 画像符号化装置及び記録媒体
JPH08317384A (ja) * 1995-05-17 1996-11-29 Hitachi Ltd 情報処理システム
JPH11112998A (ja) * 1997-10-01 1999-04-23 Matsushita Electric Ind Co Ltd 映像信号階層化符号化装置
JP2000078529A (ja) * 1998-06-17 2000-03-14 Victor Co Of Japan Ltd 可変転送レ―ト符号化装置
JP2001025013A (ja) * 1999-07-12 2001-01-26 Matsushita Electric Ind Co Ltd 送受信方法及びその装置
JP2002100994A (ja) * 2000-07-14 2002-04-05 Nokia Mobile Phones Ltd 媒体ストリームのスケーラブル符号化方法、スケーラブルエンコーダおよびマルチメディア端末
WO2004075561A1 (en) * 2003-02-21 2004-09-02 Mitsubishi Denki Kabushiki Kaisha Method and system for transporting a video over a network including multiple

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873627B2 (en) 2010-12-07 2014-10-28 Mediatek Inc Method and apparatus of video coding using picture structure with low-delay hierarchical B group
JP2012124896A (ja) * 2010-12-07 2012-06-28 Mediatek Inc 低遅延階層のbグループを有するピクチャ構造を用いた動画像符号化の方法及び装置
US10250901B2 (en) 2012-06-28 2019-04-02 Saturn Licensing Llc Transmitting/receiving device, method, and coding/decoding device
WO2014002914A1 (ja) * 2012-06-28 2014-01-03 ソニー株式会社 送信/受信装置、方法、符号化/復号化装置
US11979594B2 (en) 2012-06-28 2024-05-07 Saturn Licensing Llc Transmitting/receiving device, method, and coding/decoding device
JPWO2014002914A1 (ja) * 2012-06-28 2016-05-30 ソニー株式会社 送信/受信装置、方法、符号化/復号化装置
US10750199B2 (en) 2012-06-28 2020-08-18 Saturn Licensing Llc Transmitting/receiving device, method, and coding/decoding device
RU2641470C2 (ru) * 2012-06-28 2018-01-17 Сони Корпорейшн Устройство передачи/приема, способ и устройство кодирования/декодирования
WO2015177966A1 (ja) * 2014-05-23 2015-11-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法及び画像符号化装置
JP2019092202A (ja) * 2014-05-23 2019-06-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像符号化方法及び画像復号装置
JPWO2015177966A1 (ja) * 2014-05-23 2017-04-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像符号化方法及び画像符号化装置
US10129551B2 (en) 2014-08-28 2018-11-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
JP2016051927A (ja) * 2014-08-28 2016-04-11 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
US20100158134A1 (en) 2010-06-24
BRPI0616615A8 (pt) 2018-03-06
KR20080049775A (ko) 2008-06-04
BRPI0616615A2 (pt) 2011-06-28
WO2007038807A3 (en) 2007-06-07
EP1938618A2 (en) 2008-07-02
CN101297555A (zh) 2008-10-29
US8477840B2 (en) 2013-07-02
CN101297555B (zh) 2011-07-27
WO2007038807A2 (en) 2007-04-05
KR101340937B1 (ko) 2013-12-13

Similar Documents

Publication Publication Date Title
JP2009510952A (ja) 拘束された可変ビットレート(vbr)ビデオ・エンコードの方法および装置
KR100942395B1 (ko) 다층 비디오 설계를 위한 레이트 제어
US9497502B2 (en) Method and apparatus enabling fast channel change for DSL system
US20060088094A1 (en) Rate adaptive video coding
KR101178811B1 (ko) 중복된 비디오 스트림을 사용하여 dsl을 통한 디지털 비디오 방송 시스템에서의 고속 채널 변경 방법 및 장치
US20050175085A1 (en) Method and apparatus for providing dentable encoding and encapsulation
JP4753204B2 (ja) 符号化処理装置および符号化処理方法
CN102065302B (zh) 一种基于h.264的可伸缩视频编码方法
US20090097551A1 (en) Methods for Efficient Bandwidth Scaling of Compressed Video Data
US20080196061A1 (en) Method and Apparatus for Channel Change in Dsl System
Van der Auwera et al. Implications of smoothing on statistical multiplexing of H. 264/AVC and SVC video streams
JP2007525063A (ja) スライディング・ウィンドウ・チャネル制限に一致させるようマルチパス・ビデオレートを制御する方法
KR100511034B1 (ko) 화상전송장치및화상전송방법
TWI683572B (zh) 基於畫面動態資訊的視訊位元率傳輸控制方法
Shorfuzzaman et al. Video transcoding using network processors to support dynamically adaptive video multicast
Bagus et al. MPEG video bit-rate shaping technique using smooth-transcoding algorithm
Shorfuzzaman et al. In‐Network Adaptation of Video Streams Using Network Processors
Song An Adaptive Rate Control Algorithm for RCBR Transmission of Streaming Video
Waheed Novel Mechanism for Smoothing and Efficient Transport of SVC Coded Video over Optical Burst Switching Network
Shorfuzzaman et al. Research Article In-Network Adaptation of Video Streams Using Network Processors

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111011

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120105

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120410

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120918