JP2008533844A - ビデオ・レート制御における状況適応帯域幅調節 - Google Patents

ビデオ・レート制御における状況適応帯域幅調節 Download PDF

Info

Publication number
JP2008533844A
JP2008533844A JP2008500939A JP2008500939A JP2008533844A JP 2008533844 A JP2008533844 A JP 2008533844A JP 2008500939 A JP2008500939 A JP 2008500939A JP 2008500939 A JP2008500939 A JP 2008500939A JP 2008533844 A JP2008533844 A JP 2008533844A
Authority
JP
Japan
Prior art keywords
value
bit rate
determining
bandwidth
instructions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008500939A
Other languages
English (en)
Inventor
ティアン、タオ
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008533844A publication Critical patent/JP2008533844A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6373Control signals issued by the client directed to the server or network components for rate control, e.g. request to the server to modify its transmission rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6377Control signals issued by the client directed to the server or network components directed to server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】ビデオ・レート制御の際の状況適応帯域幅調節。
【解決手段】方法及び装置は、目標ビット・レートでビデオを符号化し、そしてさらに比較的一貫した映像品質で複雑さが変化するビデオを符号化するために量子化パラメータ(QP)の変化を許容する。一定ビット・レート(CBR)符号化は、伝送環境又は同報通信環境におけるような、複数のアプリケーションにおいて望ましい。しかしながら、従来のCBR技術は、映像品質を損なう。開示された技術は、QP値の適応変化を許容し、そしてCBR環境に適用可能である目標ビット・レートへの十分な追従を維持しつつ、可変ビット・レート(VBR)方式において適用可能な映像符号化の改善を提供する。
【選択図】図3

Description

関連文献
[米国特許法119条に基づく優先権の主張]
特許に関する本出願は、米国特許仮出願番号第60/660,881号、名称“ビデオ・レート制御における状況適応帯域幅調節のための方法及び装置(METHOD AND APPARATUS FOR CONTEXT-ADAPTIVE BANDWIDTH ADJUSTMENT IN VIDEO RATE CONTROL)”、2005年3月10日出願、に優先権を主張し、本出願の譲受人に譲渡され、そして本明細書中に引用によって特に取り込まれている。
[特許に関する同時継続中の出願]
特許に関する本出願は、本願と同時に出願された同時継続中の米国特許出願、名称“先取りを用いる擬似−一定−品質レート制御(Quasi-Constant-Quality Rate Control with Look Ahead)”に優先権を主張し、それは本出願の譲受人に譲渡され、そして本明細書中に引用によって特に取り込まれている。
本発明は、一般にマルチメディア・データに係り、そしてより詳しくはマルチメディア・データ圧縮に関する。
インターネット及び無線通信の爆発的な成長及び非常な成功のために、同様にマルチメディア・サービスに対する要求の増加のために、インターネット及び移動チャネル/無線チャネルを経由するメディアのストリーミングは、大きな注目を引き出している。異種インターネット・プロトコル(IP:Internet Protocol)ネットワークにおいて、ビデオは、サーバによって提供され、そして1又はそれより多くのクライアントによってストリームされることが可能である。有線接続は、ダイアル呼び出し、統合サービス・ディジタル・ネットワーク(ISDN:integrated service digital network)、ケーブル、ディジタル加入者回線プロトコル(集合的にxDSLと呼ぶ)、ファイバ、狭域ネットワーク(LAN:local area network)、広域ネットワーク(WAN:wide area network)、及びその他を含む。伝送モードは、ユニキャスト又はマルチキャストのいずれかであり得る。
異種IPネットワークと同様なものは、移動体通信/無線通信である。移動チャネル/無線チャネルを経由するマルチメディア・コンテントの伝達は、マルチパス・フェーディング、シャドーイング、シンボル間干渉、及びノイズ擾乱に由来してこれらのチャネルがしばしば甚だしく損なわれるという理由で、非常に興味をそそるものである。いくつかの別の理由、例えば、移動性及び競合するトラフィックも、同様に帯域幅変動及び損失を引き起こす。チャネル・ノイズ及び取り扱われるユーザの数は、チャネル環境の時間変化する特性を決定する。
ディジタル・ビデオは、一般的に効率的な保管及び/又は伝送のために圧縮される。ビデオ圧縮の多くの規格が存在する。
ビデオ圧縮に共通な1つの問題は、帯域幅(1秒当りのビット)と映像品質との間の妥協である。ピーク信号対ノイズ比(PSNR:peak signal-to-noise ratio)のような様々な尺度が、映像品質を評価するために使用されることができる。一定のフレーム・レートで、ビデオのフレームを符号化するために使用するビットは、そのビデオに対するビット・レート又は帯域幅に直接に比例する、そして技術的には同じでないが、これらの用語(ビットと帯域幅)は、この分野において多くの場合に互換的に使用され、そして適正な解釈は、前後の状況(context)から判断されるであろうことが、理解される。
比較的良い映像品質のために必要な帯域幅は、符号化されようとしているビデオの複雑性とともに変化する。例えば、ニュースキャスタの一場面のような比較的変化のない場面は、比較的低い帯域幅を用いて比較的高い映像品質で符号化されることができる。対照的に、スポーツ行事における激しい運動選手の場面のような、比較的ダイナミックな場面は、同じ映像品質のために比較的大きな量の帯域幅を消費することがある。
多くの伝送環境又は同報通信環境では、特定のチャネル又はチャネルのグループに対する帯域幅容量は限られている。一定ビット・レートのアプリケーションに対するレート制御の様々な形式がある。既存の技術は、目標ビット・レートに可能な限り近いビット・レートを維持することに焦点を当てており、その目標ビット・レートは、符号化の複雑性が変化するフレームに対して選択される量子化パラメータ(QP:quantization parameter)の適応性を制限することがあり、その複雑性は次に符号化されたビデオに関係する映像品質を損なうことがある。
したがって、伝送媒体に対する一定なビット・レートを維持することが可能であり、そして鑑賞者の楽しみのために比較的良い映像品質の可変ビット・レート能力の尺度をさらに提供するレート制御技術に対して、この分野における必要性がある。
サマリー
本明細書中に開示される実施形態は、符号化されようとしているフレームに先立つフレームを符号化する際に使用する量子化パラメータ(QP)値の履歴に少なくとも基づいて目標とするビット・レートに調節を与えることによって上記の必要性に対処する。
1つの態様は、受け取ったマルチメディア・データを処理する方法であり、ここで該方法は、符号化のために使用されるべき第1の量子化パラメータ(QP)値を決定すること;該決定された第1のQP値を用いて該マルチメディア・データの第1の部分を符号化すること;該第1のQP値に基づいて仮の帯域幅を決定すること;及び該仮の帯域幅に少なくとも一部は基づいて該マルチメディア・データの第2の部分を符号化するために使用されるべき該第1のQP値を再決定すること、前記第2の部分は時間的に該第1のQP値の後で受け取られる、ことを含む。
1つの態様は、受け取ったマルチメディア・データを処理するための装置であり、ここで該装置は、符号化のために使用されるべき第1の量子化パラメータ(QP)値を決定するための手段;該決定された第1のQP値を用いて該マルチメディア・データの第1の部分を符号化するための手段;該第1のQP値に基づいて仮の帯域幅を決定するための手段;及び該仮の帯域幅に少なくとも一部は基づいて該マルチメディア・データの第2の部分を符号化するために使用されるべき該第1のQP値を再決定するための手段、前記第2の部分は時間的に該第1の部分の後で受け取られる、ことを含む。
1つの態様は、受け取ったマルチメディア・データを処理するための装置であり、ここで該装置は、符号化のために使用されるべき第1の量子化パラメータ(QP)値を決定するために構成されたエンコーダ、ここで、該エンコーダは該決定された第1のQP値を用いて該マルチメディア・データの第1の部分を符号化するためにさらに構成される;及び該第1のQP値に基づいて仮の帯域幅を決定するために構成されたプロセッサ;ここにおいて、該エンコーダは、該仮の帯域幅に少なくとも一部は基づいて該マルチメディア・データの第2の部分を符号化するために使用されるべき該第1のQP値を再決定するために構成される、前記第2の部分は時間的に該第1の部分の後で受け取られる、ことを含む。
1つの態様は、受け取ったマルチメディア・データを処理するための命令を有する実体的な媒体中に組み込まれたコンピュータ・プログラム製品であり、ここで該コンピュータ・プログラム製品は、符号化のために使用されるべき第1の量子化パラメータ(QP)値を決定するための命令を有するモジュール;該決定された第1のQP値を用いて該マルチメディア・データの第1の部分を符号化するための命令を有するモジュール;該第1のQP値に基づいて仮の帯域幅を決定するための命令を有するモジュール;及び該仮の帯域幅に少なくとも一部は基づいて該マルチメディア・データの第2の部分を符号化するために使用されるべき該第1のQP値を再決定するための命令を有するモジュール、前記第2の部分は時間的に該第1の部分の後で受け取られる、ことを含む。
1つの態様は、マルチメディア符号化プロセスのためにビット・レートを調節する方法であり、ここで該方法は、オブジェクトを符号化するために使用されてきている前の量子化パラメータ(QP)値を受け取ること;前のQP値の長期統計値を決定すること;及び該前のQP値及び該長期統計値に少なくとも部分的に基づいて符号化されるべきオブジェクトに対する変更されたビット・レートを決定すること、を含む。
1つの態様は、マルチメディア符号化プロセスのためにビット・レートを調節するための装置であり、ここで該装置は、前の量子化パラメータ(QP)値の長期統計値を決定するための手段;及び前のQP値及び該長期統計値に少なくとも部分的に基づいて符号化されるべきオブジェクトに対する変更されたビット・レートを決定するための手段、ここで、該前のQP値は、オブジェクトを符号化するために使用されてきている、ことを含む。
1つの態様は、マルチメディア符号化プロセスのためにビット・レートを調節するための装置であり、ここで該装置は、前の量子化パラメータ(QP)値の長期統計値を決定するために構成された統計値発生器;オブジェクトを符号化するために使用されてきている前のQP値を受け取るために構成された調節回路、ここで、該調節回路は該前のQP値及び該長期統計値に少なくとも部分的に基づいて符号化されるべきオブジェクトに対する変更されたビット・レートを決定するためにさらに構成される、ことを含む。
1つの態様は、マルチメディア符号化プロセスのためにビット・レートを調節するための命令を有する実体的な媒体中に組み込まれたコンピュータ・プログラム製品であり、ここで該コンピュータ・プログラム製品は、オブジェクトを符号化するために使用されてきている前の量子化パラメータ(QP)値を受け取るための命令を有するモジュール;前のQP値の長期統計値を決定するための命令を有するモジュール;及び該前のQP値及び該長期統計値に少なくとも部分的に基づいて符号化されるべきオブジェクトに対する変更されたビット・レートを決定するための命令を有するモジュール、を含む。
1つの態様は、ビデオ・チャネルをビデオ符号化する方法であり、ここで該方法は、該ビデオ・チャネルの複数のビデオ・フレームのビデオ符号化のために目標とされるビット・レートを受け取ること、ここにおいて、該複数のビデオ・フレームは第1の時間インターバルに対してである;該ビデオ・チャネルの第1のフレームを符号化すること、ここにおいて、該第1のフレームは第1の量子化パラメータ(QP)値を用いてそして仮のビット割当てを用いて符号化される;該第1の量子化パラメータ(QP)値を用いて量子化パラメータの移動平均を更新すること;該ビデオ・チャネルの該第1のフレームに直ぐ引き続く第2のフレームに対するビット割当てを計算すること、ここで、該第2のフレームに対する該ビット割当てのための計算は、該第1の量子化パラメータ(QP)及び該移動平均に少なくとも基づいて適応して調節可能である;及び該計算されたビット割当てを使用して該第2のフレームを符号化すること、を含む。
[詳細な説明]
本方法及び装置は、目標とするビット・レートでマルチメディアを符号化し、そしてしかも複雑さが変化するビデオを比較的一貫した映像品質で符号化するために量子化パラメータ(QP)の変動を許容する。マルチメディア・データは、視覚データ、オーディオ・データ、又は視覚データとオーディオ・データの両方の組み合わせを含むことができる。これは、複数の一定ビット・レート(CBR)環境内、例えば、伝送環境又は同報通信環境内での、適用可能性のために目標とするビット・レートを維持しつつ比較的良い映像品質のためにQPが変えられることを許容する。
ビット・レート制御に関する従来技術は、ビット・レート制御のために映像品質を犠牲にする。例えば、MPEG協会からの試験モデル5(TM5)の第10章<http:// www.mpeg.org/MSSG/tm5/Ch10/Ch10.html>は、狭いビット・レート制御に対してバッファ占有レベルを維持するために厳しい方法でQPを制御することを絶命する。これは、結果としてのデータがCBR媒体を介して提供されることを可能にするが、映像品質は損なわれる。
典型的なシステムでは、データ・バッファは、着信データを一時的に記憶する。時間の比較的短い期間のあいだ、データ・バッファは、データが提供されるレートとは異なるレートでシステムがデータを使用することを許容する。これは、ビット・レートのある変動がCBRシステム内で許容されることを可能にし、同様に伝送媒体中での変動に対するある強さを可能にする。そのような伝送媒体は、例えば、衛星テレビ、例えば、ディレクTV(DirecTV(登録商標))、ディジタル・ケーブル・ネットワーク、広域ネットワーク、インターネット、無線ネットワーク、光学ネットワーク、セルラ電話機ネットワーク、及びその他を含むことができる。無線通信システムのケースでは、伝送媒体は、例えば、符号分割多元接続(code division multiple access)(CDMA又はCDMA2000)通信システムの一部を備えることが可能であり、又は代わりに、システムは、周波数分割多元接続(FDMA:frequency division multiple access)システム、直交周波数分割多元接続(OFDM:orthogonal frequency division multiple access)システム、時分割多元接続(TDMA:time division multiple access)システム、例えば、サービス産業のためのGSM/GPRS(General Packet Radio Service:汎用パケット無線通信サービス)/EDGE(enhanced data GSM environment:拡張データGSM環境)又はTETRA(Terrestrial Trunked Radio;地上波幹線無線通信)移動電話技術、広帯域符号分割多元接続(WCDMA)、高データ・レート(1xEV−DO又は1xEV−DOゴールド・マルチキャスト(Gold Multicast))システム、又は一般的に複数の技術の組み合わせを採用する任意の無線通信システム、であり得る。開示される技術は、データ・バッファにより許容し得るビット・レートの変動の利点を利用し、そして比較的良い映像品質を提供するためにCBRシステムの前後関係の範囲内でビット・レートを調節する。
CBRシステムにおいて、目標ビット・レートは、時間の比較的長い期間にわたって一定である。これらの時間インターバルは、ある複数のシステムに対して無限に長くすることが可能であり、そして区分されたインターバルのあいだ一定ビット・レートであるシステムに対しては期間が1秒であるように、さらに短くすることが可能である。例えば、別々のビデオ・ストリーム又はビデオ・チャネルが、1秒インターバルのあいだのような定期的なインターバルのあいだに個々のチャネルが一緒に多重化されるシステムにおいて、その個々のチャネルは、それらの期間インターバルのあいだ一定である目標とするビット・レートを有することが可能である。
図1は、横軸に時間そして縦軸にビット・レートをとった“単一の(pure)”一定ビット・レート(CBR)システムのグラフを図示する。図2は、横軸に時間そして縦軸にビット・レートをとった区分的CBRシステムのグラフを図示する。目標とされるビット・レート及び実際のビット・レートの一例がそれぞれのグラフに図示されている。
図3は、変更されたビット・レートを発生するためのプロセッサ300の一例を説明するシステム図である。例えば、プロセッサ300は、特殊化された回路であり得る、又は汎用プロセッサ又はディジタル信号プロセッサのようなプロセッサ上で実行されるソフトウェア又はファームウェアによって与えられることができる。図示されたプロセッサ300は、長期量子化パラメータ(QP)統計値発生器302及び調節回路304を含む。調節回路304は、第1の調節副回路306と第2の調節副回路308とを含む。プロセッサ300は、エンコーダの内部の回路としてスタンドアロン・システム内で使用されることが可能であり、又はマイクロプロセッサ又は類似のものの中で実行されるソフトウェアにプラグ−インとして組み込まれることさえも可能である。例えば、プロセッサ300は、ビデオ・コーデック及び/又はオーディオ・コーデック中に組み込まれることが可能である。
入力として、プロセッサ300は、マルチプレクサのような制御ソースから目標ビット・レートBtgtを受け取る。例えば、目標ビット・レートBtgtは、図1に示されたような一定ビット・レート(CBR)システムに対する目標ビット・レートBtgt、又は図2に示されたような区分的CBRシステムに対して選択された目標ビット・レートBtgtに対応することができる。
別の1つの入力として、プロセッサ300は、エンコーダ310から短期量子化パラメータQPI,Pを受け取る。プロセッサ300とエンコーダ310のうちの1つ又は両者は、データの記憶のためそして検索のためにデータ記憶装置320と通信することが可能であり、そのデータは、例えば、プログラム・データ、変数、符号化されていないマルチメディア・データ、符号化されたマルチメディア・データ、又はその他である。エンコーダは、例えば、レート制御のためにテスト・モデル5(TM5)を使用するMPEG−2エンコーダのような多種多様なエンコーダに対応することが可能であるが、それに限定されない。短期量子化パラメータQPI,Pは、エンコーダ310により符号化されようとしているフレームの直前に既に符号化されているフレームに対して使用された量子化パラメータ(QP)の値であることが可能である。他の比較的短期の統計値も、同様に使用されることが可能である。
出力として、プロセッサ300は、エンコーダ310が目標ビット・レート制御として使用する変更されたビット・レートBtempを発生する。プロセッサ300は、エンコーダ310の入力として通常は適用されるはずの目標ビット・レート制御Btgtを変更し、そしてその代わりに目標ビット・レート制御として変更されたビット・レートBtempを与える。これは、適応ビット・レート制御をエンコーダに与え、それはCBRシステムに対して十分に一定であり、そしてさらに変化している映像の複雑さに応じて十分に適応可能であり、その結果符号化の映像品質は、比較的一定である。例えば、マルチメディアを符号化するために使用する総合ビット・レートが一定ビット・レート(CBR)の目標とされるビット・レート、例えば、図1に示された“単一の”CBR環境又は図2に示された区分的に一定なビット・レート環境、に近づくことが可能であるとはいえ、目標とされるビット・レートは、擬似一定品質符号化目標達成を可能にするために調節可能である。
長期量子化パラメータ(QP)統計値発生器302は、短期QP値QPI,Pの履歴、例えば、エンコーダ310によって使用された最新のQP値、に基づいて長期統計値を発生する。様々な長期統計値のうちの1つ又はそれより多くが、発生されることが可能である。例えば、指数関数的加重移動平均(EWMA:exponentially-weighted moving average)が使用されることが可能である。下記の式1は、そのようなEWMAに対する割当てステートメントを表す。
LTQP←α×QPI,P+(1−α)×LTQP (式1)
式1において、LTQPは、長期指数関数的加重移動平均を示し、αは、平滑化定数を示し、そしてQPI,Pは、短期QP値、例えば、エンコーダ310によって使用された最新の使用済みQP値、を示す。矢印の左のLTQPは、計算される値を示す。矢印の右側のLTQPは、LTQPの前の計算からの値を示す。EWMA技術の1つの利点は、大量の前のQP値の履歴が計算のために必要ないことである。様々な技術が、指数関数的加重移動平均LTQPの初期値に対して使用されることが可能である。例えば、前の値は、出発点として使用されることが可能であり、単純移動平均が使用されることが可能であり、LTQPに対して予想される値のようなデフォルト値が使用可能である、等々。平滑化定数αに対する適切な値の一例は、毎秒50フレームで動作するシステムに対して0.3である。その他の適切な値が、当業者により容易に決定されるであろう。
別の技術も、同様に長期統計値を発生させるために適用することが可能である。単純移動平均も、同様に使用されることが可能である。不均等加重移動平均も、同様に使用されることが可能である。上記のものの組み合わせも、同様に使用されることが可能である。他の技術は、当業者により容易に決定されるであろう。
短期統計値QPI,P及び長期統計値LTQPは、第1の調節副回路306への入力として与えられる。これらの値は、短期QP値及び長期QP値に基づいて変更されたビット・レートBtempを重み付けするために使用され、調節されたビット・レートBを発生する。例えば、第1の調節副回路306は、式2に示された計算を実行することができる。
Figure 2008533844
指数関数的調節は、式2で説明される。指数関数的調節は、短期統計値と長期統計値との間のQP値の比較的大きな差に対して調節されたビット・レートBに比較的大きな変化を与える。しかしながら、指数関数的でない他の調節が、使用されることが可能であり、他の非線形調節又は線形調節でさえも含まれるが、それらに限定されない。それに加えて、公式を計算することよりはむしろ、ルックアップ・テーブル又は同様のものが、調節係数を検索するために使用されることが可能である。
ここで式2に戻って、符号化の前の又は第1の調節副回路306の動作の前の初期状態として、変更されたビット・レートBtempの値は、目標ビット・レートBtgtの値に初期化されることができる。短期統計値QPI,P及び長期統計値LTQPは、期待値のようなデフォルト値に初期化されることが可能である。変数Aの値は、どれだけの大きさの偏差が望まれているかに応じて非常に広い範囲で変化させることができる。一例では、40の値が、Aに対して効果的であると決定された。別の適切な値が、当業者によって容易に決定されるであろう。
調節されたビット・レートBは、第2の調節副回路308への入力として与えられる。例えば、第2の調節副回路308は、式3にしたがって変更されたビット・レートBtempに対する値を計算することが可能である。
Figure 2008533844
指数関数的調節が、式3で説明される。指数関数的調節は、調節されたビット・レートBと目標ビット・レートBtgtとの間の比較的大きな偏差に対して変更されたビット・レートBtempの比較的大きな変化を与える。しかしながら、指数関数的でない別の調節を使用することが可能であり、それは別の非線形調節又は線形調節さえも含むが、それらに限定されない。それに加えて、公式を計算するよりはむしろ、ルックアップ・テーブル及びその他が、変更されたビット・レートに対する調節係数を検索するために使用されることが可能である。それに加えて、エンコーダ310に変更されたビット・レートBtempを与えることの前に、変更されたビット・レートBtempは、例えば、最小符号化レート値及び最大符号化レート値に対するシステム限界によって制限されることがある。γの値は、指数関数的調節に関係する減衰に影響を及ぼす。γの値は、広い範囲で変化することが可能であり、そして一例では、γに対する1/48の値が効果的であると見出された。γに対する別の適用可能な値は、当業者によって容易に決定されるであろう、そしてバッファ・サイズのようなシステム制約に依存することがある。それに加えて、システム・バッファが比較的大きな場合には、A及びγに対するより小さな値が使用されることが可能であり、それは目標ビット・レートBtgtからのより大きな乖離を容認する。
結果の変更されたビット・レートBtempは、エンコーダ310への入力として与えられ、そのエンコーダ310は目標ビット・レートとして変更されたビット・レートBtempを使用してビデオ・フレームを符号化する。1つの例では、エンコーダ310は、変更されたビット・レートBtempが与えられるとフレームを符号化するために使用する量子化パラメータ(QP)を計算するために、MPEG協会からの試験モデル5(TM5)の第10章<http:// www.mpeg.org/MSSG/tm5/Ch10/Ch10.html>にしたがうことができる。エンコーダ310によって使用されるQPも、同様に、例えば、使用された前の値、仮想バッファ占有レベル、及びその他に対する変化の大きさを制限することによって、エンコーダ310の内部で変えられることが可能であることも、同様に注目されるはずである。
図4は、符号化のために目標とされるビット・レートを変更するプロセスを一般的に説明するフローチャートである。説明されるプロセスが様々な方法で変更され得ることは、実行する当業者により認識されるであろう。例えば、別の1つの実施形態では、説明されるプロセスの様々な部分を統合することが可能であり、別の順番に並べ替えることが可能であり、削除することが可能であり、等々である。
ステート410において、図示されたプロセスは、エンコーダ、例えば、エンコーダ310からの量子化パラメータQPを検索する。例えば、最も直近に符号化されたフレームのQP値は、QP値の短期統計値QPI,Pとして使用されることが可能である。
プロセスは進み、ステート420において、前のQP値から長期統計値LTQPを決定する。例えば、指数関数的加重移動平均は、式1に関連して前に説明されたように計算されることが可能である。図3に関連して前に説明されたように、別のタイプの計算が、長期統計値LTQPを発生させるために使用されることが可能である。
ステート430において、目標ビット・レートは、長期統計値LTQPに関係する値に少なくとも部分的に基づいて変更される。例えば、変更されたビット・レートは、式2と式3の適用によって発生されることが可能であり、それは図3に関連して前に説明された。プロセッサ手段、例えば図3のプロセッサ300は、ステート420と430の決定する動作及び変更する動作を実行する。エンコーダ手段、例えば図3に図示されたエンコーダ310は、それから擬似一定ビット・レート方式でビデオ符号化の改善のために変更されたビット・レートを使用することが可能である。
図5は、符号化のために目標とされるビット・レートを変更するプロセスを一般的に説明するフローチャートである。説明されるプロセスが、本発明の精神及び範囲から逸脱することなく様々な方法で変更され得ることは、当業者により認識されるであろう。例えば、別の1つの実施形態では、説明されるプロセスの様々な部分は、統合されることが可能であり、別の順番に並べ替えられることが可能であり、削除されることが可能であり、等々である。
図示されたプロセスは、ステート510において、例えば、複数のビデオ・ストリームに対するマルチプレクサのような、ビット・レートのシステム・コントローラから目標ビット・レートBtgtを受け取る。目標ビット・レートBtgtは、一定ビット・レート(CBR)システムの代表値であるような一定値であり得る、又は区分的一定CBRシステムにおいて出会うことがあるように変化する値であり得る。
プロセスは進み、ステート520において、エンコーダ310のようなエンコーダから量子化パラメータQPに対する値を受け取る。この値は、短期統計QP値QPI,Pとして使用されることが可能である。
530において、ビット・レートは、長期QP統計値に基づく調節を使用して符号化のために調節される。そのような調節の一例は、式2に関連して前に説明された指数関数的調節である。図3において、対応する変更されたビット・レートは、調節されたビット・レートBに関連して説明された。
540において、調節されたビット・レートBは、目標ビット・レートBtgtに基づいて変更されたビット・レートBtempにさらに変更される。これは、ビット・レートの調節又は変更が十分に広いインターバルのあいだ一定ビット・レート(CBR)目標達成度を所望の目標ビット・レートBtgtに戻るように導く。そのような変更の一例が、式3に関連して前に説明された。1つのオプションの態様では、調節されたビット・レートBと変更されたビット・レートBtempのうちの1つ又は両方は、符号化されようとしているマルチメディア・データの前後関係(context)に基づいて調節される。例えば、前後関係は、例えば、映像の複雑性のような符号化の複雑さであり得る。
図6は、受信したマルチメディア・データを処理する方法を一般的に説明するフローチャートである。説明される方法が様々な方法で変更され得ることは、当業者により認識されるであろう。例えば、別の1つの実施形態では、説明される方法の様々な部分が統合されることが可能であり、別の順番に並べ替えられることが可能であり、削除されることが可能である、等々である。
本方法は、フレーム又はマクロブロックのようなオブジェクトを符号化するために使用されるQP値を決定すること610によって始まる。最初に、符号化のために選択された帯域幅は、例えば、マルチプレクサによって与えられる。方法は、次に決定されたQP値を使用してオブジェクトを符号化すること620に進む。方法は、次に引き続く符号化のために使用する仮の帯域幅を決定する630ことができる。仮の帯域幅は、決定されたQP値、前のQP値、及びその他に少なくとも一部は基づくことが可能である。プロセスは、引き続くオブジェクトの符号化のために使用される新しいQP値を決定すること610に戻ることが可能であり、そして追加のオブジェクトに対して望まれるように繰り返されることが可能である。
図7は、受信したマルチメディア・データを処理するための装置の一例を説明するシステム図である。説明される装置が様々な方法で変更され得ることは、当業者により認識されるであろう。例えば、構成要素は、分離されることが可能であり、統合されることが可能であり、汎用プロセッサ又はディジタル信号プロセッサ、又はその他によって実行されるファームウェアにより与えられることが可能である。本装置は、QP決定器710、エンコーダ720、及び仮の帯域幅決定器730を含むことが可能である。
QP決定器710は、符号化のために使用されるべきQP値を決定し、そしてそのQP値を符号化するためにエンコーダ720にそして少なくともそのQP値に基づいて仮の帯域幅の決定のために仮の帯域幅決定器730に与える。仮の帯域幅は、それから仮の帯域幅決定器730によってQP決定器710に与えられ、そして引き続くQP値を発生させるために使用される。
図8は、マルチメディア符号化プロセスのためにビット・レートを調節するための装置の一例を説明するシステム図である。説明される装置が様々な方法で変更され得ることは、当業者により認識されるであろう。例えば、構成要素は、分離されることが可能であり、統合されることが可能であり、汎用プロセッサ又はディジタル信号プロセッサ、又はその他によって実行されるファームウェアにより与えられることが可能である。本装置は、長期統計値決定器810及び変更されたビット・レート決定器820を含む。
長期統計値決定器810は、前のQP値を受け取り、そのQP値はマクロブロック又はフレームのようなオブジェクトを符号化するためにエンコーダによって使用されてきている。例えば、長期統計値決定器は、前のQP値の指数関数的加重移動平均を計算することが可能である。長期統計値決定器からの加重平均のような統計値及び前のQP値は、変更されたビット・レート決定器820に与えられる、それは引き続くオブジェクトを符号化する際に使用される変更されたビット・レートを決定する。例えば、ビット・レートは、与えられたビット・レートから変更されることが可能であり、擬似一定品質符号化性能を可能にするビット・レートの十分な変動を許容する、そしてさらに符号化の制御を目標とされるビット・レートの近くに維持する、その結果符号化されたマルチメディア・データは、一定ビット・レート・システムと矛盾しない。
情報及び信号が、様々な異なる技術及び技法のいずれかを使用して表わされることができることを、当業者は、理解するはずである。例えば、上記の説明の全体を通して参照されることができる、データ、命令、コマンド、情報、信号、ビット、シンボル、及びチップは、電圧、電流、電磁波、磁場又は磁力粒子、光場又は光粒子、若しくはこれらの任意の組み合わせによって表わされることができる。
本明細書中に開示された実施形態に関連して説明された様々な例示的な論理ブロック、モジュール、及びアルゴリズムのステップが、電子ハードウェア、ファームウェア、コンピュータ・ソフトウェア、ミドルウェア、マイクロコード、又はそれらの組み合わせとして与えられることができることを、当業者は、さらに認識するはずである。ハードウェアとソフトウェアのこの互換性を明確に説明するために、様々な例示的な複数の構成要素、ブロック、モジュール、回路、及びステップが、それらの機能性の面から一般的に上に説明されてきている。そのような機能性が、ハードウェア又はソフトウェアとして導入されるかどうかは、特定のアプリケーション及びシステム全体に課せられた設計の制約に依存する。知識のある者は、説明された機能性をそれぞれの特定のアプリケーションに対して違ったやり方で実行することができる。しかし、そのような実行の判断は、開示された方法の範囲からの逸脱を生じさせるように解釈されるべきではない。
本明細書中に開示された実施形態に関連して述べられた、様々な例示的な論理ブロック、モジュール、及び回路は、汎用プロセッサ、ディジタル信号プロセッサ(DSP:digital signal processor)、用途特定集積回路(ASIC:application specific integrated circuit)、フィールド・プログラマブル・ゲートアレイ(FPGA:field programmable gate array)又は他のプログラマブル論理デバイス、ディスクリート・ゲート・ロジック又はトランジスタ論理回路、ディスクリート・ハードウェア・コンポーネント、又は本明細書中で説明された機能を実行するために設計されたこれらのいずれかの組み合わせで、導入される又は実行されることができる。汎用プロセッサは、マイクロプロセッサであり得るが、しかし代わりに、プロセッサは、いずれかの従来型のプロセッサ、コントローラ、マイクロコントローラ、又はステート・マシンであり得る。プロセッサは、演算装置の組み合わせとして導入されることができる。例えば、DSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサの組み合わせ、DSPコアとともに1又はそれより多くのマイクロプロセッサの組み合わせ、若しくはいずれかの別のそのような構成の組み合わせであり得る。
本明細書中に開示された実施形態に関連して説明された方法又はアルゴリズムは、ハードウェアにおいて、プロセッサにより実行されるソフトウェア・モジュールにおいて、又は両者の組み合わせにおいて直接実現されることができる。ソフトウェア・モジュールは、RAMメモリ、フラッシュ・メモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハード・ディスク、脱着可能なディスク、CD−ROM、又はこの技術において公知のいずれかの他の記憶媒体の中に存在できる。ある具体例の記憶媒体は、プロセッサが記憶媒体から情報を読み出し、そこに情報を書き込めることができるようにプロセッサと接続される。あるいは、記憶媒体は、プロセッサに集積されることができる。プロセッサ及び記憶媒体は、ASIC中に存在できる。ASICは、ユーザ端末中に存在できる。あるいは、プロセッサ及び記憶媒体は、ユーザ端末中の単体素子として存在できる。
開示された実施形態のこれまでの説明は、当業者が、本発明を作成する又は使用することを可能にするために提供される。これらの実施形態への様々な変形は、当業者に容易に明白にされるであろう。そして、ここで規定された一般的な原理は、別の例に適用されることができ、そして増設要素は、追加されることができる。例えば、プロセッサ300の要素のうちの1つ又は組み合わせが、プロセッサの動作に影響を与えることなく統合される及び/又は再配列されることができる。プロセッサ300、エンコーダ310、及びデータ記憶装置320のうちの1つ又は組み合わせが、同様に、ある実施形態では統合される及び/又は再配列されることがある。同様に、QP決定器710、エンコーダ720、及び仮の帯域幅決定器730のうちの1つ又は組み合わせが、統合される及び/又は再配列されることがある。長期統計値決定器810及び変更されたビット・レート決定器820が、統合される及び/又は再配列されることがある。
それゆえ、本発明は、本明細書中に示された実施形態に制限することを意図したものではなく、本明細書中に開示した原理及び新奇な機能と整合する最も広い範囲に適用されるものである。
図1は、横軸に時間そして縦軸にビット・レートを有する“単一の”一定ビット・レート(CBR)システムのグラフを図示する。 図2は、横軸に時間そして縦軸にビット・レートを有する区分的CBRシステムのグラフを図示する。 図3は、変更されたビット・レートを発生するためのプロセッサの一例を説明するシステム図である。 図4は、符号化のために目標とされるビット・レートを変更するプロセスを一般的に説明するフローチャートである。 図5は、符号化のために目標とされるビット・レートを変更するプロセスを一般的に説明するフローチャートである。 図6は、受信したマルチメディア・データを処理する方法を一般的に説明するフローチャートである。 図7は、受信したマルチメディア・データを処理するための装置の一例を説明するシステム図である。 図8は、マルチメディア符号化プロセスのためにビット・レートを調節するための装置の一例を説明するシステム図である。
符号の説明
300…プロセッサ,302…長期量子化パラメータ(QP)統計値発生器,304…調節回路,310…エンコーダ,320…データ記憶装置。

Claims (50)

  1. 受け取ったマルチメディア・データを処理する方法であって、該方法は、
    符号化のために使用されるべき第1の量子化パラメータ(QP)値を決定すること;
    該決定された第1のQP値を用いて該マルチメディア・データの第1の部分を符号化すること;
    該第1のQP値に基づいて仮の帯域幅を決定すること;及び
    該仮の帯域幅に少なくとも一部は基づいて該マルチメディア・データの第2の部分を符号化するために使用されるべき該第1のQP値を再決定すること、前記第2の部分は該第1のQP値の後で一時的に受け取られる、
    を具備することを特徴とする方法。
  2. 前に使用した該第1のQP値及び少なくとも1つの前に使用した別の第1のQP値に基づいて第2の値を決定すること
    をさらに具備することを特徴とする、請求項1の方法。
  3. 該仮の帯域幅を再決定することは、
    該第1のQP値及び該第2の値に少なくとも部分的に基づいて該仮の帯域幅を決定すること
    を備えることを特徴とする、請求項2の方法。
  4. 再決定することは、該QP値、該第2の値及び目標帯域幅に少なくとも部分的に基づいて該仮の帯域幅を再決定することをさらに備えることを特徴とする、請求項2の方法。
  5. 該第1のQP値が該第2の値よりも高い場合に、該仮の帯域幅を増加させること;及び
    該第1のQP値が該第2の値よりも低い場合に、該仮の帯域幅を減少させること
    をさらに具備することを特徴とする、請求項2の方法。
  6. 該マルチメディア・データの第1の部分及び第2の部分は、第1のビデオ・フレーム及び第2のビデオ・フレームにそれぞれ対応することを特徴とする、請求項1の方法。
  7. 少なくとも区分的に一定な目標帯域幅を受け取ること、そして符号化されようとしている該マルチメディア・データの複雑度に少なくとも一部は基づいて該仮の帯域幅を変更することをさらに具備することを特徴とする、請求項1の方法。
  8. 符号化されようとしている該マルチメディア・データの内容に少なくとも部分的に基づいて該仮の帯域幅を決定することをさらに具備することを特徴とする、請求項1の方法。
  9. 該内容は、複雑度を含むことを特徴とする、請求項8の方法。
  10. 受け取ったマルチメディア・データを処理するための装置であって、該装置は、
    符号化のために使用されるべき第1の量子化パラメータ(QP)値を決定するための手段;
    該決定された第1のQP値を用いて該マルチメディア・データの第1の部分を符号化するための手段;
    該第1のQP値に基づいて仮の帯域幅を決定するための手段;及び
    該仮の帯域幅に少なくとも一部は基づいて該マルチメディア・データの第2の部分を符号化するために使用されるべき該第1のQP値を再決定するための手段、前記第2の部分は時間的に該第1の部分の後で受け取られる
    ことを具備することを特徴とする装置。
  11. 前に使用した該第1のQP値及び少なくとも1つの前に使用した別の第1のQP値に基づいて第2の値を決定するための手段をさらに具備することを特徴とする、請求項10の装置。
  12. 該再決定するための手段は、該第1のQP値及び該第2の値に少なくとも部分的に基づいて該仮の帯域幅を決定するために構成されることを特徴とする、請求項11の装置。
  13. 該再決定するための手段は、該QP値、該第2の値及び目標帯域幅に少なくとも部分的に基づいて該仮の帯域幅を決定するために構成されることを特徴とする、請求項11の装置。
  14. 該第1のQP値が該第2の値よりも高い場合に、該仮の帯域幅を増加させるための手段;及び
    該第1のQP値が該第2の値よりも低い場合に、該仮の帯域幅を減少させるための手段
    をさらに具備することを特徴とする、請求項11の装置。
  15. 該マルチメディア・データの第1の部分及び第2の部分は、第1のビデオ・フレーム及び第2のビデオ・フレームにそれぞれ対応することを特徴とする、請求項10の装置。
  16. 受け取ったマルチメディア・データを処理するための装置であって、該装置は、
    符号化のために使用されるべき第1の量子化パラメータ(QP)値を決定するために構成されたエンコーダ、ここで、該エンコーダは該決定された第1のQP値を用いて該マルチメディア・データの第1の部分を符号化するためにさらに構成される;及び
    該第1のQP値に基づいて仮の帯域幅を決定するために構成されたプロセッサ;
    ここにおいて、該エンコーダは、該仮の帯域幅に少なくとも一部は基づいて該マルチメディア・データの第2の部分を符号化するために使用されるべき該第1のQP値を再決定するために構成される、前記第2の部分は時間的に該第1の部分の後で受け取られる
    ことを具備することを特徴とする装置。
  17. 該プロセッサは、前に使用した該第1のQP値及び少なくとも1つの前に使用した別の第1のQP値に基づいて第2の値を決定するためにさらに構成されることを特徴とする、請求項16の装置。
  18. 該プロセッサは、該第1のQP値及び該第2の値に少なくとも部分的に基づいて該仮の帯域幅を決定するためにさらに構成されることを特徴とする、請求項17の装置。
  19. 該プロセッサは、該QP値、該第2の値及び目標帯域幅に少なくとも部分的に基づいて該仮の帯域幅を決定するためにさらに構成されることを特徴とする、請求項17の装置。
  20. 該プロセッサは、
    該第1のQP値が該第2の値よりも高い場合に、該仮の帯域幅を増加させるため;及び
    該第1のQP値が該第2の値よりも低い場合に、該仮の帯域幅を減少させるために
    さらに構成されることを特徴とする、請求項17の装置。
  21. 該マルチメディア・データの第1の部分及び第2の部分は、第1のビデオ・フレーム及び第2のビデオ・フレームにそれぞれ対応することを特徴とする、請求項16の装置。
  22. マルチプレクサから目標帯域幅を受け取ることをさらに具備することを特徴とする、請求項16の装置。
  23. 受け取ったマルチメディア・データを処理するための命令を有する実体的な媒体中に組み込まれたコンピュータ・プログラム製品であって、該コンピュータ・プログラム製品は、
    符号化のために使用されるべき第1の量子化パラメータ(QP)値を決定するための命令を有するモジュール;
    該決定された第1のQP値を用いて該マルチメディア・データの第1の部分を符号化するための命令を有するモジュール;
    該第1のQP値に基づいて仮の帯域幅を決定するための命令を有するモジュール;及び
    該仮の帯域幅に少なくとも一部は基づいて該マルチメディア・データの第2の部分を符号化するために使用されるべき該第1のQP値を再決定するための命令を有するモジュールを具備し、前記第2の部分は時間的に該第1の部分の後で受け取られる、
    ことを特徴とするコンピュータ・プログラム製品。
  24. 前に使用した該第1のQP値及び少なくとも1つの前に使用した別の第1のQP値に基づいて第2の値を決定するための命令を有するモジュール、
    をさらに具備することを特徴とする、請求項23のコンピュータ・プログラム製品。
  25. 該仮の帯域幅を再決定するための命令を有する該モジュールは、
    該第1のQP値及び該第2の値に少なくとも部分的に基づいて該仮の帯域幅を決定するための命令を有するモジュール、
    をさらに備えることを特徴とする、請求項24のコンピュータ・プログラム製品。
  26. 再決定するための命令を有する該モジュールは、該QP値、該第2の値及び目標帯域幅に少なくとも部分的に基づいて該仮の帯域幅を再決定するための命令を有するモジュールをさらに備えることを特徴とする、請求項24のコンピュータ・プログラム製品。
  27. 該第1のQP値が該第2の値よりも高い場合に、該仮の帯域幅を増加させるための命令を有するモジュール;及び
    該第1のQP値が該第2の値よりも低い場合に、該仮の帯域幅を減少させるための命令を有するモジュール、
    をさらに具備することを特徴とする、請求項24のコンピュータ・プログラム製品。
  28. 該マルチメディア・データの第1の部分及び第2の部分は、第1のビデオ・フレーム及び第2のビデオ・フレームにそれぞれ対応することを特徴とする、請求項23のコンピュータ・プログラム製品。
  29. マルチメディア符号化プロセスのためのビット・レートを調節する方法であって、該方法は、
    オブジェクトを符号化するために使用されてきている前の量子化パラメータ(QP)値を受け取ること;
    前のQP値の長期統計値を決定すること;及び
    該前のQP値及び該長期統計値に少なくとも部分的に基づいて符号化されるべきオブジェクトのための変更されたビット・レートを決定すること、
    を具備することを特徴とする方法。
  30. 該前のQP値及び該長期統計値を使用して該変更されたビット・レートを指数関数的に調節することをさらに具備することを特徴とする、請求項29の方法。
  31. 該変更されたビット・レートを調節するために目標とされるビット・レートを使用することをさらに具備することを特徴とする、請求項29の方法。
  32. 該長期統計値に関する指数関数的加重移動平均を計算することをさらに具備することを特徴とする、請求項29の方法。
  33. 符号化されようとしているオブジェクトのための目標ビット・レートとしてエンコーダに該変更されたビット・レートを与えることをさらに具備することを特徴とする、請求項29の方法。
  34. 符号化されようとしている該マルチメディア・データの内容に少なくとも部分的に基づいて該仮の帯域幅を決定することをさらに具備することを特徴とする、請求項29の方法。
  35. 該内容は、複雑度を含むことを特徴とする、請求項34の方法。
  36. マルチメディア符号化プロセスのためのビット・レートを調節するための装置であって、該装置は、
    前の量子化パラメータ(QP)値の長期統計値を決定するための手段;及び
    前のQP値及び該長期統計値に少なくとも部分的に基づいて符号化されるべきオブジェクトのための変更されたビット・レートを決定するための手段を具備し、ここで、該前のQP値は、オブジェクトを符号化するために使用されてきている、
    ことを特徴とする装置。
  37. 該変更されたビット・レートを該決定する手段は、該前のQP値及び該長期統計値を使用して該変更されたビット・レートを指数関数的に調節するために構成されることを特徴とする、請求項36の装置。
  38. 該変更されたビット・レートを調節するために目標とされるビット・レートを使用するための手段をさらに具備することを特徴とする、請求項36の装置。
  39. 該長期統計値を該決定する手段は、該長期統計値に対する指数関数的加重移動平均を計算するために構成されることを特徴とする、請求項36の装置。
  40. 符号化されようとしているオブジェクトのための目標ビット・レートとしてエンコーダに該変更されたビット・レートを与えるための手段、をさらに具備することを特徴とする、請求項36の装置。
  41. マルチメディア符号化プロセスのためのビット・レートを調節するための装置であって、該装置は、
    前の量子化パラメータ(QP)値の長期統計値を決定するために構成された統計値発生器;
    オブジェクトを符号化するために使用されてきている前のQP値を受け取るために構成された調節回路、ここで、該調節回路は該前のQP値及び該長期統計値に少なくとも部分的に基づいて符号化されるべきオブジェクトのための変更されたビット・レートを決定するためにさらに構成される、
    ことを具備することを特徴とする装置。
  42. 該調節回路は、該前のQP値及び該長期統計値を使用して該変更されたビット・レートを指数関数的に調節するために構成されることを特徴とする、請求項41の装置。
  43. 該調節回路は、目標ビット・レートの観点から該変更されたビット・レートを調節するためにさらに構成されることを特徴とする、請求項41の装置。
  44. 該統計値発生器は、該長期統計値に対する指数関数的加重移動平均を計算するためにさらに構成されることを特徴とする、請求項41の装置。
  45. 該調節回路に目標ビット・レートを与えるために構成されたマルチプレクサをさらに具備することを特徴とする、請求項41の装置。
  46. マルチメディア符号化プロセスのためのビット・レートを調節するための命令を有する実体的な媒体中に組み込まれたコンピュータ・プログラム製品であって、該コンピュータ・プログラム製品は、
    オブジェクトを符号化するために使用されてきている前の量子化パラメータ(QP)値を受け取るための命令を有するモジュール;
    前のQP値の長期統計値を決定するための命令を有するモジュール;及び
    該前のQP値及び該長期統計値に少なくとも部分的に基づいて符号化されるべきオブジェクトのための変更されたビット・レートを決定するための命令を有するモジュール、
    を具備することを特徴とするコンピュータ・プログラム製品。
  47. 該前のQP値及び該長期統計値を使用して該変更されたビット・レートを指数関数的に調節するための命令を有するモジュールをさらに具備することを特徴とする、請求項46の装置。
  48. 該変更されたビット・レートを調節するために目標とされるビット・レートを使用するための命令を有するモジュールをさらに具備することを特徴とする、請求項46の装置。
  49. 該長期統計値に対する指数関数的加重移動平均を計算するための命令を有するモジュールをさらに具備することを特徴とする、請求項46の装置。
  50. 符号化されようとしているオブジェクトのための目標ビット・レートとしてエンコーダに該変更されたビット・レートを与えるための命令を有するモジュール、をさらに具備することを特徴とする、請求項46の装置。
JP2008500939A 2005-03-10 2006-03-10 ビデオ・レート制御における状況適応帯域幅調節 Pending JP2008533844A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US66088105P 2005-03-10 2005-03-10
PCT/US2006/008488 WO2006099086A1 (en) 2005-03-10 2006-03-10 Context-adaptive bandwidth adjustment in video rate control

Publications (1)

Publication Number Publication Date
JP2008533844A true JP2008533844A (ja) 2008-08-21

Family

ID=36613423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008500939A Pending JP2008533844A (ja) 2005-03-10 2006-03-10 ビデオ・レート制御における状況適応帯域幅調節

Country Status (15)

Country Link
US (1) US20060227870A1 (ja)
EP (2) EP1875739A1 (ja)
JP (1) JP2008533844A (ja)
KR (1) KR100943875B1 (ja)
CN (1) CN101171844A (ja)
AR (1) AR052603A1 (ja)
AU (1) AU2006223420A1 (ja)
BR (1) BRPI0608229A2 (ja)
CA (1) CA2600482A1 (ja)
IL (1) IL185829A0 (ja)
MX (1) MX2007011100A (ja)
NO (1) NO20075123L (ja)
RU (1) RU2349054C1 (ja)
TW (1) TW200718213A (ja)
WO (1) WO2006099086A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006061838A2 (en) 2004-12-08 2006-06-15 Imagine Communications Ltd. Distributed statistical multiplexing of multi-media
US7483388B2 (en) * 2005-06-23 2009-01-27 Cisco Technology, Inc. Method and system for sending a multimedia stream in an IP multicast network
KR101329860B1 (ko) * 2006-09-28 2013-11-14 톰슨 라이센싱 효과적인 레이트 제어 및 비디오 인코딩 품질의 향상을 위한 ρ-도메인 프레임 레벨 비트 할당 방법
US8139487B2 (en) 2007-02-28 2012-03-20 Microsoft Corporation Strategies for selecting a format for data transmission based on measured bandwidth
US8259735B2 (en) * 2007-08-09 2012-09-04 Imagine Communications Ltd. Constant bit rate video stream
US8542730B2 (en) * 2008-02-22 2013-09-24 Qualcomm, Incorporated Fast macroblock delta QP decision
US8055785B2 (en) * 2008-09-17 2011-11-08 Futurewei Technologies, Inc. Rate control for stream switching
TWI397269B (zh) * 2010-10-14 2013-05-21 Univ Nat Taiwan 傳輸端電路
CN102395030B (zh) * 2011-11-18 2014-05-07 杭州海康威视数字技术股份有限公司 基于视频压缩码流的运动分析方法、码流转换方法及其装置
US9942580B2 (en) 2011-11-18 2018-04-10 At&T Intellecutal Property I, L.P. System and method for automatically selecting encoding/decoding for streaming media
US9805442B2 (en) 2012-10-03 2017-10-31 Avago Technologies General Ip (Singapore) Pte. Ltd. Fine-grained bit-rate control
US9978156B2 (en) 2012-10-03 2018-05-22 Avago Technologies General Ip (Singapore) Pte. Ltd. High-throughput image and video compression
CN104704838B (zh) * 2012-10-03 2018-03-27 安华高科技通用Ip(新加坡)公司 二维块图像编码
US9883180B2 (en) 2012-10-03 2018-01-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Bounded rate near-lossless and lossless image compression
US9813711B2 (en) 2012-10-03 2017-11-07 Avago Technologies General Ip (Singapore) Pte. Ltd. Hybrid transform-based compression
US10812829B2 (en) 2012-10-03 2020-10-20 Avago Technologies International Sales Pte. Limited 2D block image encoding
US9363517B2 (en) 2013-02-28 2016-06-07 Broadcom Corporation Indexed color history in image coding
US9462306B2 (en) 2013-07-16 2016-10-04 The Hong Kong University Of Science And Technology Stream-switching in a content distribution system
US9788078B2 (en) * 2014-03-25 2017-10-10 Samsung Electronics Co., Ltd. Enhanced distortion signaling for MMT assets and ISOBMFF with improved MMT QoS descriptor having multiple QoE operating points
US9955191B2 (en) 2015-07-01 2018-04-24 At&T Intellectual Property I, L.P. Method and apparatus for managing bandwidth in providing communication services
GB2564644B (en) * 2017-07-12 2020-12-16 Canon Kk Method and system of encoding a data stream according to a variable bitrate mode
EP3742728B1 (en) * 2019-05-24 2022-09-21 Axis AB A method and bitrate controller for controlling output bitrate of a video encoder
CN112492349A (zh) * 2020-10-29 2021-03-12 广州视源电子科技股份有限公司 视频编码控制方法、装置、设备和存储介质
US20240089436A1 (en) * 2022-09-13 2024-03-14 Google Llc Dynamic Quantization Parameter for Encoding a Video Frame

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0865677A (ja) * 1994-08-22 1996-03-08 Nec Corp 動画像符号化装置
JPH10136354A (ja) * 1996-10-31 1998-05-22 Sony Corp 映像信号符号化方法、映像信号符号化装置及び記録媒体
JPH10164588A (ja) * 1996-11-26 1998-06-19 Sony Corp 映像信号符号化方法、映像信号符号化装置及び記録媒体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5926569A (en) * 1995-09-28 1999-07-20 Intel Corporation Bitrate damper for selecting quantization levels for image encoding
GB2306832B (en) * 1995-10-30 2000-03-29 Sony Uk Ltd Image activity in video compression
JP3934712B2 (ja) * 1996-09-27 2007-06-20 日本ビクター株式会社 映像信号符号化方法及び装置
US6115420A (en) * 1997-03-14 2000-09-05 Microsoft Corporation Digital video signal encoder and encoding method
US5852630A (en) * 1997-07-17 1998-12-22 Globespan Semiconductor, Inc. Method and apparatus for a RADSL transceiver warm start activation procedure with precoding
US6278735B1 (en) * 1998-03-19 2001-08-21 International Business Machines Corporation Real-time single pass variable bit rate control strategy and encoder
GB2346282B (en) * 1999-01-28 2003-02-19 Snell & Wilcox Ltd Bit rate control in compression encoding
US6895054B2 (en) 2001-09-28 2005-05-17 Divxnetworks, Inc. Dynamic bit rate control process
US7391809B2 (en) * 2003-12-30 2008-06-24 Microsoft Corporation Scalable video transcoding
US7697608B2 (en) * 2004-02-03 2010-04-13 Sony Corporation Scalable MPEG video/macro block rate control
US7751478B2 (en) * 2005-01-21 2010-07-06 Seiko Epson Corporation Prediction intra-mode selection in an encoder
US8031774B2 (en) * 2005-01-31 2011-10-04 Mediatek Incoropration Video encoding methods and systems with frame-layer rate control

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0865677A (ja) * 1994-08-22 1996-03-08 Nec Corp 動画像符号化装置
JPH10136354A (ja) * 1996-10-31 1998-05-22 Sony Corp 映像信号符号化方法、映像信号符号化装置及び記録媒体
JPH10164588A (ja) * 1996-11-26 1998-06-19 Sony Corp 映像信号符号化方法、映像信号符号化装置及び記録媒体

Also Published As

Publication number Publication date
US20060227870A1 (en) 2006-10-12
KR20070119677A (ko) 2007-12-20
AU2006223420A1 (en) 2006-09-21
EP2096868A2 (en) 2009-09-02
BRPI0608229A2 (pt) 2009-11-24
AR052603A1 (es) 2007-03-21
TW200718213A (en) 2007-05-01
EP2096868A3 (en) 2009-09-23
CN101171844A (zh) 2008-04-30
KR100943875B1 (ko) 2010-02-24
WO2006099086A1 (en) 2006-09-21
RU2349054C1 (ru) 2009-03-10
CA2600482A1 (en) 2006-09-21
NO20075123L (no) 2007-10-23
IL185829A0 (en) 2008-01-06
EP1875739A1 (en) 2008-01-09
MX2007011100A (es) 2007-11-22

Similar Documents

Publication Publication Date Title
JP2008533844A (ja) ビデオ・レート制御における状況適応帯域幅調節
US7974341B2 (en) Rate control for multi-layer video design
US8792555B2 (en) Methods and systems for resizing multimedia content
US8565301B2 (en) Quasi-constant-quality rate control with look-ahead
JP5350404B2 (ja) 早いマクロブロック・デルタqpの決定
RU2414091C2 (ru) Адаптация скорости видео к состояниям обратной линии связи
KR20050090841A (ko) 비트율 제어 방법
KR20040036343A (ko) 비디오 트랜스코더의 적응적 비트율 제어장치 및 방법
US8548045B2 (en) Method and apparatus for video encoding
Kim et al. An accurate bit-rate control for real-time MPEG video encoder
Eminsoy et al. Transcoding-based error-resilient video adaptation for 3G wireless networks
KR20040046055A (ko) 동영상 전송 비트율 조절방법
KR100923961B1 (ko) 저지연 영상 통신 시스템 및 방법
JP2002534864A (ja) ビデオデータの帯域幅スケーラビリティのための適応バッファ及び量子化調整スキーム
JP2002101417A (ja) 動画像符号化方法および装置
EP1944980A2 (en) Bit rate control algorithm
JP2006094347A (ja) 動画像符号量制御方式
KR20050083672A (ko) 비디오 시퀀스의 레이트를 제어하는 방법 및 장치, 비디오부호화 장치

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110809