JP2008541570A - 多層ビデオ設計のためのレート制御 - Google Patents

多層ビデオ設計のためのレート制御 Download PDF

Info

Publication number
JP2008541570A
JP2008541570A JP2008510209A JP2008510209A JP2008541570A JP 2008541570 A JP2008541570 A JP 2008541570A JP 2008510209 A JP2008510209 A JP 2008510209A JP 2008510209 A JP2008510209 A JP 2008510209A JP 2008541570 A JP2008541570 A JP 2008541570A
Authority
JP
Japan
Prior art keywords
multimedia data
encoding
layer
quality
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008510209A
Other languages
English (en)
Inventor
チェン、ペイソン
ティアン、タオ
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008541570A publication Critical patent/JP2008541570A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】多層ビデオ設計のためのレート制御。
【解決手段】ライブビデオストリーム等のマルチメディアデータの効率的符号化のための方法及び装置を開示する。マルチメディアデータは複数の層に事前符号化され、事前符号化されたデータの特性が判定される。判定した特性に少なくとも部分的には基づき、マルチメディアデータは複数の層に符号化される。
【選択図】 図5

Description

(米国特許法第119条に基づく優先権の主張)
本特許出願は、本出願の譲受人に譲渡され、2005年5月3日に出願された「2層ビデオ設計のためのレート制御(Rate Control For Two Layer Video Design)」というタイトルの仮出願第60/677,608号に対する優先権を主張するものであり、参照として本明細書に明示的に組み込まれる。
(分野)
本発明は、強化層フレーム構築のため基層モジュールを効率的に再利用しながら、スケーラブルマルチメディアデータを符号化/復号化する方法及び装置に関する。
インターネットと無線通信の爆発的発展と成功を収め、マルチメディアサービスに対する需要の高まりにともない、インターネット及びモバイル/無線チャネル上でのストリーミングメディアに多大な関心が寄せられている。異種混合インターネットプロトコル(IP)ネットワークの中で、ビデオはサーバによって提供され、1つ以上のクライアントによってストリームできる。有線接続は、ダイヤルアップ、ISDN、ケーブル、xDSL、ファイバ、LAN(ローカルエリアネットワーク)、WAN(ワイドエリアネットワーク)、その他を含む。伝送モードにはユニキャストとマルチキャストがある。PDA(個人用デジタル補助装置)、ラップトップ、デスクトップ、セットトップボックス、TV、HDTV(高精細度テレビジョン)、携帯電話機、その他を含む、様々な個別クライアントデバイスは、同じコンテンツのため帯域幅の異なるビットストリームを同時に要求する。接続帯域幅は時間にともない急速に変化し(9.6kbps〜100Mbps以上)、サーバの反応より速くなることがある。
モバイル/無線通信は異種混合IPネットワークに似ている。モバイル/無線チャネル上でのマルチメディアコンテンツ転送は、これらのチャネルがマルチパスフェーディング、シャドーイング、シンボル間干渉、ノイズ妨害等によってしばしばひどく阻害されるため、非常に困難である。この他に、モビリティや競合トラフィックも帯域幅変動・損失の原因となる。時間にともない変化するチャネル環境の性質は、チャネルのノイズとサービスを受けるユーザの数によって決まる。環境条件に加え、地理的位置やモバイルローミングのため、第2〜第3世代のセルラーネットワークからデータのみのブロードバンドデータネットワークと、目的地ネットワークが変わることがある。これらの変動要因はいずれも、マルチメディアコンテンツの、ことによると転送時の、適応型レート調整を要求する。よって、異種混合有線/無線ネットワーク上でビデオ伝送を成功させるには、効率的な符号化と、損害から立ち直りつつ変化するネットワーク条件、デバイス特性、ユーザ選好へ適応する能力とが要求される。
異なるユーザ要求に応えるため、そしてチャネル変動に適応するため、伝送帯域幅と、ユーザの表示及び演算能力に基づき1組の制約条件に各々対応するビットストリームの複数の個別バージョンを生成できるが、これは、サーバのストレージとマルチキャストアプリケーションにとって効率的ではない。ハイエンドユーザに対応する単一のマクロビットストリームがサーバで構築されるスケーラブル符号化では、ローエンドアプリケーションのためのビットストリームが、マクロビットストリームのサブセットとして埋め込まれる。よって、サブビットストリームを選択的に送信することによって、1つのビットストリームを多様なアプリケーション環境に適応させることができる。スケーラブル符号化には、エラーが発生しやすいチャネル上での堅牢なビデオ伝送というもうひとつの利点がある。エラー保護とエラー封じ込めとを遂行できる。最重要の情報を収容する基層ビットには、信頼性により優れた伝送チャネルを、又はより優れたエラー保護を適用できる。
MPEG−1、MPEG−2、MPEG−4(MPEG−xと総称する)、H.261、H.262、H.263、及びH.264(H.26xと総称する)等のハイブリッド符号器には、空間、時間、及び信号対雑音比(SNR)スケーラビリティがある。ハイブリッド符号化では、動き補償予測(MCP)によって時間冗長性が排除される。ビデオは通常、一連のピクチャグループ(GOP)に分割され、ここで各々のGOPはイントラ符号化フレーム(I)から始まり、その後に前方予測フレーム(P)と双方向予測フレーム(B)との配置が続く。PフレームとBフレームはいずれもインターフレームである。ほとんどのMPEG様符号器において時間スケーラビリティの鍵を握るのはBフレームである。ただし、MPEG−4シンプルプロファイルやH.264ベースラインプロファイル等、一部のプロファイルはBフレームをサポートしない。MPEG−4規格はISO/IEC 14496−2に記載されている。H.264規格はISO/IEC 14496−10に記載されている。
MPEG−4で、プロファイルとレベルはある特定のビットストリームの復号化に要求される復号器能力に基づきシンタクスとセマンティクスのサブセットを定義する手段を提供する。プロファイルは、全ビットストリームシンタクスの規定サブセットである。レベルは、ビットストリームでパラメータに課せられる1組の規定制約条件である。所定のプロファイルで、レベルは一般的に復号器の処理負荷とメモリ能力とに相当する。よって、プロファイルとレベルはビットストリームに対する規制を指定し、それ故ビットストリームの復号化能力を制限する。一般的に復号器は、所与のレベルにて所与のプロファイルの全構文要素の全許容値を正しく復号化できる場合に、そのレベルのそのプロファイルに適合するとみなすことができる。
(概要)
ビデオストリームから複数の層へのスケーラブル符号化を可能にするビデオ符号化及び復号化システムを説明する。基層符号化と強化層符号化の品質は、基層及び強化層の伝送帯域幅が比などの数学的関係を満たすよう修正できる。
一例は、マルチメディアデータを少なくとも第1及び第2の層に符号化する方法であって、ここで第1及び第2の層の各々は関連伝送帯域幅を有する。方法は、マルチメディアデータの1つ以上の特性パラメータを生成するためマルチメディアデータを事前符号化(pre-encoding)することと、少なくとも第1及び第2の層を生成するためマルチメディアデータを符号化することとを含み、ここで関連帯域幅は、これが数学的関係を概ね満たすよう、特性パラメータに少なくとも部分的には基づき判定される。
別の例は、マルチメディアデータを少なくとも第1及び第2の層に符号化するように構成されたマルチメディアデータ符号化装置であって、ここで第1及び第2の層の各々は対応する伝送帯域幅を有する。装置は、マルチメディアデータの1つ以上の特性パラメータを生成するためマルチメディアデータを事前符号化するように構成された事前符号器と、少なくとも第1及び第2の層を生成するためマルチメディアデータを符号化するように構成された符号器とを含み、ここで対応する伝送帯域幅は、これが数学的関係を概ね満たすよう、特性パラメータに少なくとも部分的には基づき判定される。
別の例は、マルチメディアデータを少なくとも第1及び第2の層に符号化するように構成されたマルチメディアデータ符号化装置であって、ここで第1及び第2の層の各々は対応する伝送帯域幅を有し、装置は、マルチメディアデータの1つ以上の特性パラメータを生成するためマルチメディアデータを事前符号化する手段と、少なくとも第1及び第2の層を生成するためマルチメディアデータを符号化する手段とを含み、ここで対応する伝送帯域幅は、これが数学的関係を概ね満たすよう、特性パラメータに少なくとも部分的には基づき判定される。
別の例は、実行時にマルチメディアデータを少なくとも第1及び第2の層に符号化する方法をシステムに遂行させる命令を含むコンピュータ可読媒体であって、ここで第1及び第2の層の各々は、対応する伝送帯域幅を有する。方法は、マルチメディアデータの1つ以上の特性パラメータを生成するためマルチメディアデータを事前符号化することと、少なくとも第1及び第2の層を生成するためマルチメディアデータを符号化することとを含み、ここで対応する伝送帯域幅は、これが数学的関係を概ね満たすよう、特性パラメータに少なくとも部分的には基づき判定される。
別の例は、マルチメディアデータの1つ以上の特性パラメータを生成するためマルチメディアデータを事前符号化する形に、そして少なくとも第1及び第2の層を生成するためマルチメディアデータを符号化する形に構成された、プロセッサである。対応する伝送帯域幅は、これが数学的関係を概ね満たすよう、特性パラメータに少なくとも部分的には基づき判定される。
(詳細な記載)
基層及び強化層の伝送帯域幅が比などの所望の数学的関係を満たすよう、基層符号化の品質と強化層符号化の品質を修正できる、スケーラブルビデオ符号化データを提供するように構成された方法、装置、及びシステムを説明する。原データを特性化する目的で、ビデオフレームは事前符号化品質にて事前符号化できる。次に、原データの特性化に基づき、スーパーフレーム(例えば1秒のマルチメディアデータ)にわたって基層及び強化層の帯域幅が1:1比など特定の数学的関係を満たすよう、フレームを符号化できる。
以降の説明では、例に対し十分な理解を得るため具体的詳細を提示する。ただし、これらの具体的詳細がなくとも例を実践できることは、当業者によって理解されるであろう。例えば電気コンポーネントは、不必要な詳細で例が不明瞭にならないようにするためブロック図で示されることがある。例を詳しく解説するため、場合によってはかかるコンポーネントやその他の構造及び手法が詳細に示されることもある。
フローチャート、フロー図、構造図、又はブロック図として描かれるプロセスとして、例が説明されることがある点にも留意されたい。フローチャートでは一連のプロセスとしてオペレーションを説明することがあるが、オペレーションの多くは並行して、又は同時に遂行でき、プロセスは繰り返すことができる。加えて、オペレーションの順序は変えることができる。プロセスは、これのオペレーションが完了した時点で終了する。プロセスは、メソッド、関数、プロシージャ、サブルーチン、サブプログラム、その他に相当することがある。プロセスが関数に相当する場合、これの終了は、呼び出し元の関数か又はメイン関数への当該関数の復帰に相当する。
MPEG−x及びH.26xとして知られる1組のビデオ符号化規格は、固定又は可変長ソース符号化手法を使用するビデオ、オーディオ、及びその他情報の圧縮と送達とに適した、データ処理及び操作手法を説明する(本明細書ではハイブリッド符号化と呼ぶ)。具体的に、上述した規格とその他のハイブリッド符号化規格及び手法は実例として、イントラフレーム符号化手法(例えばランレングス符号化、ハフマン符号化など)とインターフレーム符号化手法(例えば前方及び後方予測符号化、動き補償など)とを用いて、ビデオ情報を圧縮する。特にビデオ処理システムの場合、ハイブリッドビデオ符号化システムは、イントラ及び/又はインターフレーム動き補償符号化によるビデオフレームの予測本位圧縮符号化を特徴とする。
イントラフレーム符号化は、あるピクチャ(フィールド又はフレーム)を、他のピクチャを参照せずに符号化することを指すが、そのイントラ符号化ピクチャは他のピクチャにとってのリファレンスとして用いることができる。イントラフレーム、イントラ符号化フレーム、及びIフレームという用語はいずれも、本願の全体を通じて使われるイントラ符号化によって形成されるビデオオブジェクトの例である。
インター又は予測符号化は、あるピクチャ(フィールド又はフレーム)を、他のピクチャを参照しながら符号化することを指す。インター符号化又は予測ピクチャは、イントラ符号化ピクチャより効率的に符号化できる。予測フレーム(前方又は後方予測、Pフレームとも呼ばれる)と双方向予測フレーム(Bフレームとも呼ばれる)は、インター符号化ピクチャの例として本願の全体を通じて使われる。インター符号化の用語はこの他に、ハイパス符号化、残差符号化、動き補償内挿、及び当業者にとって周知のその他を含む。
スケーラブル符号化として知られる手法は、符号化データを、ビットストリームにて異なる層に、例えば基層と強化層とに分割できる。スケーラブル符号化は動的なチャネルにおいて有用であり、ここでスケーラブルビットストリームは、ネットワーク帯域幅の変動に合わせて適応させることができる。エラーが発生しやすいチャネルの場合、スケーラブル符号化は、基層と強化層との不平等エラー保護を通じて堅牢さを増すことができる。より重要な層にはより優れたエラー保護を提供できる。
図1は、ストリーミングピクチャを符号化及び復号化する通信システムのブロック図である。システム100は、符号器デバイス105と復号器デバイス110とを含む。符号器デバイス105はさらに、符号化コンポーネント120と、事前符号化コンポーネント125と、メモリコンポーネント130と、通信コンポーネント175とを含む。符号器デバイス105は、通信コンポーネント175に内蔵された通信ロジックを用いて外部ソース135からデータを受信することができる。外部ソース135は、例えば外部メモリ、インターネット、ライブビデオ及び/又はオーディオフィードであってよく、データを受信することは、有線及び/又は無線通信を含み得る。外部ソース135に収容されるデータは、原始(符号化されていない)状態か、又は符号化された状態であってよい。事前符号化コンポーネント125は、データの初期符号化を遂行する形に、そして原データを特性化する1つ以上のパラメータを生成する形に、構成される。複雑性指標等の特性化パラメータは、事前符号化コンポーネント125によって生成できる。符号化コンポーネント120は、事前符号化コンポーネント125で生成された特性化パラメータに基づき原データを符号化する形に構成される。事前符号化コンポーネント125と符号化コンポーネント120の各々は、フレームのイントラ符号化部分と、前方予測、後方予測、及び双方向予測を含むフレームの予測部分との、両方を符号化する形に構成される。
事前符号化コンポーネント125と符号化コンポーネント120の各々は、マルチメディアデータのどの部分をイントラ符号化するべきか、そしてどの部分をインター符号化するべきかを判定する形に構成される。事前符号化コンポーネント125と符号化コンポーネント120の各々は、優先度が低く強化層に置くべきビデオの部分はどれか、そして優先度が高く基層に置くべき部分はどれかを、判定する形に構成される。事前符号化コンポーネント125と符号化コンポーネント120の各々は、オーバーヘッド情報を符号化する形に構成され、同オーバーヘッド情報は、イントラ符号化及びインター符号化部分のマップを、例えばマクロブロックマップを含むことがあり、同マクロブロックマップでは、イントラ符号化又はインター符号化されるマクロブロック(又はサブマクロブロック)が識別され(インター符号化のタイプを、例えば前方、後方、又は双方向をも識別する)、さらにインター符号化部分の参照先にあたるフレームがどれなのかが識別される。符号化後、符号化されたフレームはメモリコンポーネント130又は外部メモリに格納される。外部メモリは外部ソース135の中に収容でき、又は単独のメモリコンポーネント(図示せず)であってよい。
通信コンポーネント175は、ネットワーク140との関連でデータ送信(Tx)に用いるロジックを内蔵する。ネットワーク140は、電話、ケーブル、及び光ファイバ等の有線システムの、又は無線システムの一部であってよい。無線通信システムの場合、ネットワーク140は、例えば符号分割多重アクセス(CDMA又はCDMA2000)通信システムの一部を備えてよく、あるいは代わりにシステムは、周波数分割多重アクセス(FDMA)システム、直交周波数分割多重アクセス(OFDMA)システム、GSM/GPRS(汎用パケット無線サービス)/EDGE(強化データGSM環境)又はサービス産業のためのTETRA(地上基幹無線)携帯電話技術等の時分割多重アクセス(TDMA)システム、広帯域符号分割多重アクセス(WCDMA)、高データレート(1xEV−DO又は1xEV−DOゴールドマルチキャスト)システム、又は概して手法を組み合わせて使用する何らかの無線通信システムであってよい。符号化されたフレームは、ネットワーク140上で送信(Tx)される。符号器デバイス105によって遂行される符号化プロセスは、この後さらに詳しく説明する。
復号器デバイス110は、符号器デバイス105と類似するコンポーネントを収容し、復号化コンポーネント150と、メモリコンポーネント160と、通信コンポーネント180とを含む。復号器デバイス110は、ネットワーク140を介し、又は外部ストレージ165から送信された、符号化されたデータを受信する。通信コンポーネント180は、ネットワーク140との関連で符号化データを受信(Rx)するためのロジックと、外部ストレージ165から符号化データを受信するためのロジックとを内蔵する。外部ストレージ165は、例えば外部RAM又はROM、又はリモートサーバであってよい。復号化コンポーネント150は、イントラ符号化データとインター符号化データとを復号化するため使われる。復号化コンポーネント150はまた、Pフレーム(前方又は後方予測)とBフレームの両方を復号化する。
復号化コンポーネント150はまた、上述したマクロブロックマップを含むオーバーヘッド情報を復号化するためのロジックを内蔵し、しかるべきマクロブロックをしかるべき方法で復号化するためこの情報を解釈する。復号化コンポーネント150はまた、双方向予測フレーム及び/又は低優先度マルチメディアデータを含む強化層データの復号化を省略するためのロジックを内蔵する。例えば、強化層データが受信されないか、又は乏しい又は不十分なSNRで受信される場合、及び/又は復号器デバイスの処理能力が不十分な場合には、強化層データの復号化を省略できる。復号化の後、復号化されたフレームは表示コンポーネント170で表示でき、あるいは内部メモリ160又は外部ストレージ165に格納できる。表示コンポーネント170は、表示画面を含むビデオ表示ハードウェア及びロジック等の部品を内蔵する、復号器デバイスの一体化された部分であってよく、あるいはこれは外部周辺デバイスであってよい。復号器デバイス110によって遂行される復号化プロセスは、後ほどさらに詳しく説明する。
典型的なMPEG復号器で、予測符号化ピクセルブロック(すなわち、1つ以上の動きベクトルと残差成分とを備えるブロック)は、基準フレームを基準にして復号化される(ここでイントラフレームか、又は別の予測フレームは、基準フレームの役割を果たすことができる)。図2Aは従来のMPEG−4シンプルプロファイルデータストリームを図解する図であり、GOPのフレーム依存関係を描いている。GOP210は初期Iフレーム212と、その後に続く数個の前方予測Pフレーム214とからなる。Pフレームの、先行I又はPフレームへの依存は、前方予測フレームだけをサポートするシステム(MPEG−4シンプル及びH.264ベースラインプロファイルに適合するシステム等)に与えられる時間スケーラビリティを制限することがある。Pフレーム214のいずれかが除去されると、他のPフレームの復号化にあたって極めて重要な情報が失われるおそれがある。Pフレームの除去は、例えばビデオジッターを招くおそれがあり、あるいは復号器は、次のGOPの始まりを印す次のIフレーム216まで復号化を続行できなくなることがある。
上述したとおり、スケーラブルビデオ符号化システムの強化層における双方向予測データの使用は、動的なチャネルにおいて有益である。図2Bは時間スケーラビリティを可能にする従来の符号化データストリームを図解する図であり、GOPのフレーム依存関係を描いている。GOP220は、Iフレーム222Aと、前方予測Pフレーム224と、双方向予測Bフレーム226とからなる。各Bフレームは、前方及び後方動きベクトルと、Iフレーム222A又は前方予測Pフレーム224(後方予測Pフレームも使用できるが、この例には図示されていない)を基準とする残差とを、組み合わせることができる。Iフレーム222Bは次のGOPの始まりを印す。図2Bに示すとおり、Iフレーム222AとPフレーム224との間、又は2つのPフレーム224の間には、ただひとつのBフレーム226が収容されている。時間スケーラビリティの柔軟性を高めるため、基準フレームの間には数個のBフレームを挿入できる。基準フレームとしてBフレームに依存するフレームは他にないため、Bフレーム226が取り除かれても、他のフレームの復号化にかかわる情報がなくなることはない。このBフレーム226の特性により、ビットストリーム中に挿入されたBフレーム226は、チャネル条件、帯域幅制限、バッテリー電力、その他の検討材料に応じて、符号器、トランスコーダー、又は復号器の任意判断で除去できる。例えば、仮に基準フレームの間に3つのBフレームがある場合、3つのBフレームを全て取り除くことによりフレームレートを4分の3減らすことができ、あるいは中間のBフレームを残して他の2つを取り除くことにより、フレームレートを2分の1に減らすことができる。データレートも相応に減少する。
Pフレーム(又は何らかのインター符号化セクション)は、現在のピクチャの中にある一領域と基準ピクチャの中にあるベストマッチ予測領域との間で、時間冗長性を活かすことができる。現在の領域とベストマッチ基準予測領域との差は、残差(又は予測誤差)として知られている。基準フレームにおけるベストマッチ予測領域の位置は動きベクトルで符号化できる。図3は、例えばMPEG−4におけるPフレーム構築プロセスの一例を図解するものである。プロセス300は、5×5マクロブロックからなる現在のピクチャ305を含み、ここでこの例におけるマクロブロックの数は任意である。マクロブロックは16×16ピクセルからなる。ピクセルは、1つの8ビット輝度値(Y)と2つの8ビットクロミナンス値(Cr及びCb)とによって定義できる。MPEGではY、Cr、及びCb成分を4:2:0形式で格納でき、ここでCr及びCb成分はX及びY方向にて2によってダウンサンプルされる。よって各々のマクロブロックは256個のY成分と、64個のCr成分と、64個のCb成分とからなる。現在のピクチャ305のマクロブロック315は、現在のピクチャ305とは異なる時点で基準ピクチャ310から予測される。符号化される現在のマクロブロック315にY、Cr、及びCb値の点で最も近いベストマッチマクロブロック320を見つけるため、基準ピクチャ310の中で探索が行われる。当業者にとって公知のベストマッチマクロブロック320を探索する方法は、a)現在のマクロブロック315と基準ピクチャ310のマクロブロックとのSAD(絶対ピクセル差の和)を最小化すること、b)SSD(平方ピクセル差の和)を最小化すること、及びc)レート歪の意味での最小コスト、その他を含む。基準ピクチャ310におけるベストマッチマクロブロック320の位置は、動きベクトル325で符号化される。基準ピクチャ310は、復号器が現在のピクチャ305の構築に先駆け再構築することになるIフレーム又はPフレームであってよい。ベストマッチマクロブロック320が現在のマクロブロック315から引かれることにより(Y、Cr、及びCb成分の各々につき差を計算する)、残差330を得る。残差330は2D離散コサイン変換(DCT)335によって符号化され、次に量子化340される。空間圧縮を求めるため、量子化340は、例えば高い周波数係数により少ないビットを割り当てる一方で、低い周波数係数により多いビットを割り当てることによって果たすことができる。動きベクトル325及び基準ピクチャ310識別情報に加えて、残差330の量子化係数は現在のマクロブロック315を表す符号化情報となる。この符号化情報は、先々の使用のためメモリに格納でき、又は例えばエラー訂正や画像改善の目的で操作でき、又はネットワーク345を介して送信できる。
残差330の符号化量子化係数は、符号化動きベクトル325とともに、符号器における現在のマクロブロック315の再構築に用いることができ、これは、以降の動き推定及び補償で基準フレームの一部として使われる。このPフレームの再構築にあたって、符号器は復号器の手順を模倣できる。復号器の模倣の結果、符号器と復号器は同じ基準ピクチャを扱うことになる。さらなるインター符号化のため符号器で行われるか、又は復号器で行われる、再構築プロセスの一例をここに紹介する。Pフレームの再構築は、基準フレーム(又は参照されているピクチャ又はフレームの一部分)が再構築された後に着手できる。符号化量子化係数は逆量子化350され、次に2D逆DCTを、すなわちIDCT355を遂行することにより、復号化された、又は再構築された、残差360を得る。再構築済みの基準ピクチャ310の中で再構築済みのベストマッチマクロブロック365を見つけるには、符号化動きベクトル325を使用する。そして、再構築残差360が再構築ベストマッチマクロブロック365へ加えられることにより、再構築マクロブロック370が形成される。再構築されたマクロブロック370はメモリに格納でき、単独で、又はピクチャの中で他の再構築マクロブロックとともに、表示でき、あるいは画像改善のためさらに処理できる。
Bフレーム(又は双方向予測で符号化される何らかのセクション)は、現在のピクチャの中にある一領域と、先行ピクチャの中にあるベストマッチ予測領域と、後続ピクチャの中にあるベストマッチ予測領域との間で、時間冗長性を活かすことができる。後続ベストマッチ予測領域と後方ベストマッチ予測領域とが組み合わせれることにより、合同双方向予測領域が形成される。現在のピクチャの領域とベストマッチ合同双方向予測領域との差は、残差(又は予測誤差)である。後続基準ピクチャにおけるベストマッチ予測領域の位置と、先行基準ピクチャにおけるベストマッチ予測領域の位置とは、2つの動きベクトルで符号化できる。
上述したとおり、Iフレーム、Pフレーム、及びBフレームの各々の情報は、複数の層で符号化でき、例えば基層は、Iフレームデータの他に、ヘッダ情報、予測フレームの動きベクトル及び残差情報等、最低限の情報を有することができる。強化層は、必ずしも必須ではなく、ただし任意に復号化された場合に表示データの品質を向上させる情報を有することができる。例えば強化層は、基層内のデータより高い品質で符号化される、IフレームデータとPフレーム及びBフレームの残差データとを有することができる。符号化されるデータの品質は、符号化データの量子化レベルを決定する量子化パラメータ(QP)等、様々な符号化パラメータの修正を通じて調整できる。例えば、QPを増すことにより符号化データの量子化は高くなり、したがってビットは少なくなり、ひいては帯域幅要求が低くなる。強化層は、Bフレーム等、基層に含まれないさらなるフレームを含むこともできる。基層と強化層はいずれも復号器へ送信できる。
一部のシステムでは、比、又は比及び定数等、所定の数学的関係に従って帯域幅を割り当てることが望まれる。例えばいくつかの実施形態において、基層の帯域幅に対する強化層の帯域幅の比は1:1であり、ここで基層へ割り当てられる帯域幅は強化層の帯域幅に等しい。1.5:1、2:1等、これ以外の比が望まれることもある。
いくつかの実施形態においては、各GOPにつき1:1比の帯域幅を達成することが望まれる。いくつかの実施形態は、GOPのIフレームデータとP及びBフレーム残差データとを強化層品質で符号化する。そして、符号化データのサイズによって全基層及び強化層の所望の帯域幅が決まる。そして基層の帯域幅は、基層帯域幅と強化層帯域幅との所望の数学的関係に基づいて決まる。
基層の帯域幅が分かったら、基層要素の各々につき帯域幅を決めることができる。いくつかの実施形態において、特定の固定品質基層要素の帯域幅は基層全体の帯域幅と区別できる。例えばいくつかの実施形態において、予測フレームのヘッダ情報と動きベクトル情報の内少なくとも一方は、基層の中で固定品質で符号化できる。例えばいくつかの実施形態において、ヘッダ及び動きベクトル情報は強化層と同じ高品質で符号化できる。ヘッダ及び動きベクトル情報の固定品質によって、これらの固定品質基層要素のサイズが決まり、ひいては帯域幅要求が決まる。固定品質基層要素の帯域幅要求が分かったら、IフレームデータとP及びBフレーム残差等、残りの可変品質基層要素へ残りの基層帯域幅を分配できる。したがって、可変品質基層要素は、符号化されたデータを残りの帯域幅で送信することを可能にする品質で符号化できる。
図4は、上述した帯域幅割り当て法を描く帯域幅割り当て図である。符号化強化層情報410と符号化基層情報420とが描かれており、ここで各々の水平寸法は各々に分配される帯域幅を表す。図示されたとおり、この例で各層の全帯域幅は等しい。強化層は、高い強化層品質で符号化されたIフレーム情報412とB及びPフレーム情報414とを収容する。基層は、ヘッダ情報422と、動きベクトル情報424と、Iフレーム情報426と、B及びPフレーム情報428とを収容する。基層を、強化層と同じ帯域幅で送信できる形に生成するには、Iフレーム情報426とB及びPフレーム情報428とを、強化層の品質より低い基層品質で各々符号化する。
上述した方式には様々な修正を施すことができる。例えば、いくつかの実施形態でBフレーム情報は基層の中で符号化されない。かかる実施形態において、復号器は、これが強化層を受信し処理できる場合に、Bフレーム情報を復号化できる。いくつかの実施形態においては、基層帯域幅に対する強化層帯域幅の比が1:1ではなく、別の比である。いくつかの実施形態においては、Iフレーム情報412がB及びPフレーム残差情報414と異なる品質で符号化される。同様に、いくつかの実施形態においては、Iフレーム情報426がB及びPフレーム残差情報428と異なる品質で符号化される。
図4の例で、強化層と基層の帯域幅はGOPにわたって概ね等しい。いくつかの実施形態において、少なくとも小さいデータ部分には、例えばフレームには、あるいはマクロブロックには、1:1比が当てはまらない。例えばいくつかの実施形態においては、GOP全体の基層帯域幅から固定品質要素に割り当てられる帯域幅を引いたものが、事前符号化オペレーションで判定される各可変品質要素の特性パラメータに従い、可変品質要素へ割り当てられる。
図5は、マルチメディアデータを符号化する方法を示すフローチャートである。510では、強化層の帯域幅と基層の帯域幅との数学的関係を決定する。いくつかの実施形態において、数学的関係はメモリ位置における比であり、例えば1:1比であって、ここで強化層帯域幅は基層帯域幅に概ね等しい。いくつかの実施形態においては、アルゴリズムに基づいて数学的関係を決定する。
520ではマルチメディアデータが事前符号化される。マルチメディアデータは高品質で事前符号化できる。事前符号化データの特性化パラメータは測定される。マルチメディアデータを事前符号化することによって、符号化データの様々な複雑性指標を判定できる。例えば、符号化フレームのサイズが測定され格納される。その他のパラメータも測定でき格納できる。データの様々な部分のパラメータを測定できる。例えばGOP、フレーム、スライス、マクロブロック、及びサブマクロブロックについて、符号化情報の複雑性を測定できる。いくつかの実施形態において、GOPは1秒のマルチメディアデータを収容するスーパーフレームである。
530では、520で測定した特性化パラメータに従ってマルチメディアデータを符号化する。一例において、IフレームデータとB及びPフレーム残差は強化層の中で高強化層品質で符号化される。そして、上述した方法に従いGOPの強化層及び基層帯域幅が決定する。上述した方法に従い、ヘッダ情報や動きベクトル情報等、固定品質要素の帯域幅もまた決定する。
次に、GOP全体の基層帯域幅(BWBL)から基層の固定品質要素へ割り当てられる帯域幅(BWfqe)を引いたものを、基層の可変品質要素へ割り当てる(BWvqe)。したがって、BWvqe=BWBL−BWfqeである。BWvqeは、520の事前符号化オペレーションで判定される各可変品質要素の特性化パラメータに、例えば複雑性指標等に従って、基層の可変品質要素に割り当てられる。例えば、520の事前符号化オペレーションで判定される複雑性指標は、各符号化フレームのサイズであってよい。フレームiの割り当て帯域幅(BWvqe(i))は、520の事前符号化オペレーションで判定されるフレームiの複雑性に従い加重される全BWvqeの一部分であってよい。したがって、BWvqe(i)=BWvqe×Size(i)/Sizetotalであり、ここで、Size(i)は520で符号化されるフレームiのサイズであり、Sizetotalは520で符号化されるGOPの全フレームの合計サイズである。その結果、GOPの各フレームに帯域幅が割り当てられる。各フレームに帯域幅を割り当てたら、符号化されたフレームを割り当てられた帯域幅で送信することを可能にする最大限の品質で、各フレームの情報を符号化する。
図6は、マルチメディアGOPに対する事前符号化オペレーションから得られるビットストリームと、その後に続く、GOPの強化層ビットストリームとGOPの基層ビットストリームとを生成する符号化オペレーションの結果との、図式表現である。この例で、GOPはGOPヘッダと、3つのフレーム、すなわちIフレームと、Bフレームと、Pフレームとを備える。Iフレームはヘッダを備え、B及びPフレームはヘッダと動きベクトルとを各々備える。
図示されたとおり、事前符号化ビットストリームは、ヘッダ情報と、動きベクトル情報と、Iフレームデータと、B及びPフレームからの残差情報との全てを含む。この例で、事前符号化オペレーションは高品質で符号化を行い、強化層ビデオの品質に概ね等しい品質のビットストリームを生成する。強化層ビットストリームは、強化層品質で符号化されたIフレームデータとB及びPフレーム残差情報とを備える。いくつかの実施形態において、強化層は、事前符号化データより高い、又は低い品質で生成できる。上述したとおり、この例で基層ビットストリームは、強化層ビットストリームと概ね同じサイズを、したがって概ね同じ帯域幅を有する。ただし、基層はヘッダ及び動きベクトル情報をも含み、これらは強化層品質で符号化できるため、IフレームデータとB及びPフレームヘッダ及び残差情報は強化層よりも低い品質で符号化されるであろう。基層におけるIフレームデータ、Bフレーム残差、及びPフレーム残差の各々の帯域幅割り当ては、事前符号化プロセスで判定される、対応する事前符号化データの複雑性に応じて加重できる。
いくつかの実施形態においては、マルチメディアデータを少なくとも第1及び第2の層に符号化する形に、マルチメディアデータ符号化装置を構成できる。第1及び第2の層の各々は対応する伝送帯域幅を有する。装置は、マルチメディアデータの1つ以上の特性化パラメータを生成するためマルチメディアデータを事前符号化する手段と、少なくとも第1及び第2の層を生成するためマルチメディアデータを符号化する手段とを含む。事前符号化する手段は、所望の品質で符号化するように構成された符号器であってよく、符号化する手段は、同じ品質か又は別の品質で符号化するように構成された別の符号器又は同じ符号器であってよい。伝送帯域幅は、これが数学的関係を概ね満たすよう、特性化パラメータに少なくとも部分的には基づき判定される。
いくつかの実施形態において、基層と強化層の全帯域幅分配は、複数の用途に向けて帯域幅を判定するマルチプレクサ(MUX)によって判定される。基層帯域幅と強化層帯域幅の和が、MUXによって設定される限度を超えないのが有利である。MUXは、異なるプログラムへ公平にビットを割り当てることを試みる。公平性は、異なるプログラムがほぼ同じ品質を有するものとして定義される。よって、全帯域幅を異なるプログラムへより効果的に割り当てることができる。全帯域幅の制限のためMUXはある特定のプログラムのビットレートをカットすることがあるから、スーパーフレーム(SF)ベースの2パス符号化が有利であり、ここでSFはマルチメディアデータの1である。
さらに、基層と強化層は、例えばSFベースで1:1比を保つ必要があるが、フレーム単位では、基層フレームと強化層フレームとの比にそのような1:1制約はないかもしれない。したがってSFベースの2パス符号化は、SFベースで1:1比としつつ、フレームの複雑性に基づき各フレームにビットを割り当てるのにも役立つであろう。
事前符号化のとき、符号化は強化層品質を目指すことができ、基層品質を、又は別の品質を目指すことができ、基層ビットレートに2を掛けることにより基層と強化層の和のビットレートを得ることができる。どのアプローチを選択するかは、符号器設計によって、そしてどちらの層を先に最適化するかによって決まる。いくつかの実施形態においては両方の層を受信できるため、強化層品質を先に最適化できる。事前符号化はマルチメディアデータの特性化であり、基層と強化層の基準品質を提供する。この例では特性化に基づき1:1比の要求に従い基層品質が推定される。
事前符号化オペレーションにはいくつかの理由がある。マルチメディアデータを好適な品質で符号化するときには、所望の全帯域幅が判定され、MUXへ与えることができる。もうひとつの理由は、以降の符号化に向けてレート制御のための情報を収集することである。符号器は、SF全体の事前符号化を終えた後に、より多くの帯域幅を必要とするSFの部分がどれなのかを全体的につかむことができる。さらに、ビット割り当ての必須ツールであるレート制御モデルを、より正確に構築できる。シングルパス符号化では普通、現在のマクロブロック(MB)のため近傍MBの符号化に基づくモデルが使われる。
装置は、事前符号化結果に基づき基層及び強化層SFサイズを推定できる。
Iフレームの場合はイントラMBだけがある。MBモード、空間予測方向等のMBヘッダ情報は、基層の中で符号化できる。係数情報は強化層と基層の両方で符号化できる。符号化後の推定基層フレームサイズは
Figure 2008541570
であり、ここでf1,i(header)とf1,i(Intra coeff)は、それぞれ第1パス符号化におけるフレームiのヘッダビット数と係数ビット数を表す。α1は第2パス符号化に基づき推定される。Δqpは、第1パスQPと好適な基層QPとの差である。
第2パス符号化における推定ELフレームサイズは
Figure 2008541570
である。Pフレームの場合、動き情報は基層で送信される。この部分のビット数は正確に分かる。Iフレームと同様、係数ビットは指数関数に基づき推定される。
したがって、BLフレームサイズは
Figure 2008541570
と定義され、ここでf1,i(header)は事前符号化におけるMBモードと動き情報のビットを表し、f1,i(Inter coeff)は事前符号化におけるインターMBの係数のビットを表し、f1,i(Intra coeff)は事前符号化におけるイントラMBの係数のビットを表し、ΔqpP,InterはBL及び事前符号化インターMBのQP差であり、ΔqpP,IntraはBL及び事前符号化イントラMBのQP差であり、αP,Inter及びαP,Intraは実験によって決定する係数である。
ELフレームサイズは
Figure 2008541570
と定義される。Bフレームの場合、もしもBフレームが1つの層だけに存在するなら、これのサイズをその層のSFサイズにそのまま加えることができる。それらが2つの層を有する場合、各層に対するそれらの寄与はPフレームと同じ要領で推定される。
推定BL SFサイズ
Figure 2008541570

Figure 2008541570
と定義される。推定EL SFサイズ
Figure 2008541570

Figure 2008541570
と定義される。MUXへ送信されるビットレートリクエストは
Figure 2008541570
となる。MUXは、異なるプログラムが要求する要求ビットレートに基づき、各プログラムにつき上限を返す。
シングルパス符号化では普通、複雑性指標は時間予測後の残差の統計に基づき、レート制御モデルは近傍MBの符号化に基づき構築される。これらはいずれも、モデルと現実のシナリオとの間に食い違いをもたらす。代わりに、事前符号化の結果を用いることにより、符号化オペレーションの符号化複雑性を反映する正確な複雑性指標を構築できる。この方式に基づくレート制御モデルは、符号化オペレーションでビットをより効果的に割り当てるのに役立つ。
指標は、事前符号化オペレーションにおける各MBのビット数に依拠できる。異なるMBは異なるQPを使用できるため、指数関係を用いて全MBを同じQPへ正規化し、対応する係数ビットを導き出す。インターMB QPが減ると、真の動き複雑性を反映しないことがある係数ビットが大幅に増えるため、このプロセスは有利である。同じ理由から、もしも(符号化順序で)SFの最初のフレームがPフレームなら、ここでインターMB係数ビットが調整される。この調整は、最初のPフレームのMB QPと基準エリアのQPとに依拠できる。ヘッダビットは変更はなくてもよい。ここで、各MBの複雑性指標はこれのヘッダ及び係数の合計ビットである。各フレームの複雑性指標は、これのMBの複雑性指標の和である。
符号化オペレーションでは、各層につき目標ビットレートのレート制御、基層のWb(0)、及び強化層のWe(0)がある。2層レート制御のときには、単一層符号化に関する基層及び強化層オーバーヘッドを最小限にとどめるべきである。基層でQPが劇的に変化すると大量のオーバーヘッドを招く。この種の問題を避けるには、事前符号化のときに収集される統計に基づき、基層における符号化オペレーションビット割り当てをより正確なものにできる。
基層符号化では、SF内での瞬間的出力レートの変動を平滑化するため1秒バッファを使用できる。ただし従来の水漏れバケツモデルと違って、近傍SFは個別のバッファを有する。よって平滑化効果はSFの中だけで起こる。
Wb(j)は、(j−1)番目のフレームを符号化した後に残る、現在のSFの基層帯域幅である。SFの先頭でj=1である。Wb(j)はWb(j)=Wb(j−1)−Sb(j−1)というふうにフレーム毎に更新され、ここでSb(j−1)は(j−1)番目のフレームによって生成されるビットの数である。
予想フレームサイズは
Figure 2008541570
であり、ここでN(j)は現在のSFの残りの未符号化フレームである。β(nj)は、事前符号化で決定するj番目のフレームの複雑性指標である。
基本単位は1つ又は複数のMBであってよい。基本単位のサイズによって、QPをどれほど頻繁に調整できるかが決まる。ただし、QP調整があまりにも多いとオーバーヘッドが増す。統計情報がほぼ同じMBは、1つのグループにまとめて1つのQPを割り当てることができる。インターMBとイントラMBの統計情報は異なるため、事前符号化によって決まるインターモード又はイントラモードに基づき、モードが同じMBは基本単位にまとめることができる。事前符号化オペレーションの係数情報に基づき、MBをグループ分けすることもできる。もしもPフレームの中の1つのMBが非ゼロ係数を有するなら、このMBを基本単位にする。
fr(k)は、フレームjにて基本単位kを符号化した後に残るビットの数である。最初はfr(0)=R(j)である。現在の基本単位で費やされる係数ビットの数は
Figure 2008541570
として計算され、ここでβ(BUk)は符号化される基本単位の複雑性指標であり、β(nj,k)は残りのフレームの複雑性指標である。
一方、第1パス生成基本単位ヘッダサイズb1,hdr(BUk)も検討するべきである。もしもb1,hdr(BUk)<b(BUk)、
Figure 2008541570
なら、
Figure 2008541570
である。そしてQbを計算でき、Qb=MAX_BASE_QP、ここで
Figure 2008541570
は符号化基層ヘッダビットの推定数であり、
Figure 2008541570
は符号化基層係数ビットの推定数であり、MAX_BASE_QPは最高基層QPである。MAX_BASE_QPは普通、基層で最低許容品質を提供するべく選択される。
基本単位QPは指数モデルR=αQ−Q1b1,coeff(BUk)に従って割り当てられ、ここでb1,coeff(BUk)は第1パス係数ビットの推定数であり、Q1は第1パス符号化QPであり、αは線形回帰を用いてフレーム毎に更新されるパラメータである。イントラMBとインターMBは異なるαを使用する。fr(k)は、使用ビット数
Figure 2008541570
Figure 2008541570
に従って更新される。
上の論述ではフレームサイズの判定に焦点を当てているが、フレームとの関係で述べた原理と方法は、マクロブロックや、特性が類似するマクロブロックを備える基本単位等、他のデータ部分にも応用できる。いくつかの実施形態においては、フレームサイズ判定との関係で述べた原理及び方法を、サイズの異なるマルチメディアデータ部分に応用できる。例えば、GOPの中の各フレームには、上述したとおり、GOPの残りの使用可能帯域幅と、フレームの特性化パラメータと、GOPの残りのフレームの特性化パラメータとに従い、帯域幅を割り当てることができる。加えて、1つ以上のフレームの中にあるマクロブロックには、1つ以上のフレームの残りの使用可能帯域幅と、マクロブロックの特性化パラメータと、残りのマクロブロックか又は1つ以上のフレームの他の部分の特性化パラメータとに従い、帯域幅を割り当てることができる。様々なマルチメディアデータ部分及びマルチメディアデータ部分の組み合わせに原理を応用する、数多くの他の実施形態もまた可能である。
当業者は、様々な技術・手法のいずれかを用いて情報と信号を表現できることを理解するであろう。例えば、上の説明の全体を通じて言及されているデータ、命令、コマンド、情報、信号、ビット、記号、及びチップは、電圧、電流、電磁波、磁場又は磁性粒子、光場又は光粒子、又はこれらの組み合わせによって表現できる。
当業者はさらに、ここに開示する例との関係で説明した様々な例証的論理ブロック、モジュール、及びアルゴリズムステップを、電子ハードウェア、コンピュータソフトウェア、又は両方の組み合わせとして実装できることを認めるであろう。このハードウェア及びソフトウェアの互換性を明確に例証するため、様々な例証的コンポーネント、ブロック、モジュール、回路、及びステップを、それらの機能の点で上に概説した。かかる機能をハードウェア又はソフトウェアとして実装するか否かは、特定のアプリケーションとシステム全体にかかる設計制約次第で決まる。当業者は、説明した機能を特定のアプリケーション毎に異なる方法で実装できるが、かかる実装決定は、開示される方法の範囲からの逸脱をもたらすものと解釈されるべきではない。
本明細書に開示する例との関係で説明した様々な例証的論理ブロック、モジュール、及び回路は、本明細書で説明した機能を遂行するよう設計された汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)又はその他プログラマブル論理素子、個別ゲート又はトランジスタロジック、個別ハードウェアコンポーネント、又はこれらの任意の組み合わせにより実装又は遂行できる。汎用プロセッサはマイクロプロセッサであってよく、ただし代案において、プロセッサは任意の従来のプロセッサ、コントローラ、マイクロコントローラ、又は状態機械であってよい。プロセッサはまた、計算装置の組み合わせとして、例えばDSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアと連動する1つ以上のマイクロプロセッサ、又は他の何らかのかかる構成として、実装できる。
本明細書に開示する例との関係で説明した方法又はアルゴリズムのステップは、ハードウェアにて直接的に、プロセッサによって実行されるソフトウェアモジュールにて、又は双方の組み合わせにて、具現化できる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、又は当技術分野で公知の他の何らかの形をとる記憶媒体の中にあってよい。記憶媒体はプロセッサへ結合され、かくしてプロセッサは記憶媒体から情報を読み取ることができ、且つこれへ情報を書き込むことができる。代案において、記憶媒体はプロセッサへ一体化されてよい。プロセッサと記憶媒体は特定用途向け集積回路(ASIC)の中にあってよい。ASICは無線モデムの中にあってよい。代案において、プロセッサと記憶媒体は個別コンポーネントとして無線モデムの中にあってよい。
開示された実施形態の先の説明は、当業者が本発明を作る又は使用することを可能にするために提供されている。これらの実施形態に対する様々な修正は当業者にとって容易に明白となるであろうし、本明細書に定める一般原理は他の例に応用でき、本発明の精神又は範囲から逸脱せずにさらなる要素を加えることができる。よって本発明は本明細書に紹介された実施形態に限定されるべきものではなく、本明細書に開示された原理と新規の特徴とに一致する最も広い範囲が認められるべきものである。
ストリーミングピクチャを符号化及び復号化する通信システムのブロック図である。 従来のMPEG−4シンプルプロファイルデータストリームを図解する図である。 時間スケーラビリティを可能にする従来の符号化データストリームを図解する図である。 MPEG−4におけるPフレーム構築プロセスの一例を図解する図である。 帯域幅割り当て法を描く帯域幅割り当て図である。 マルチメディアデータを符号化する方法を示すフローチャートである。 ビットストリームの図式表現である。

Claims (48)

  1. 少なくとも第1及び第2の層にマルチメディアデータを符号化する方法であり、前記第1及び第2の層の各々は関連伝送帯域幅を有する方法であって、
    前記マルチメディアデータの1つ以上の特性化パラメータを生成するため前記マルチメディアデータを事前符号化することと、
    前記少なくとも第1及び第2の層を生成するため前記マルチメディアデータを符号化することであって、前記関連帯域幅は、前記関連帯域幅が関係を概ね満たすよう、特性化パラメータに少なくとも部分的には基づき判定されることと、
    を備える方法。
  2. 前記少なくとも第1及び第2の層に関連する前記伝送帯域幅のため前記関係を判定することをさらに備える、請求項1に記載の方法。
  3. 前記関係は比を備える、請求項2に記載の方法。
  4. 前記比は概ね1:1である、請求項3に記載の方法。
  5. 前記マルチメディアデータを事前符号化することは、事前符号化品質で事前符号化することを備え、前記マルチメディアデータを符号化することは、前記第2の層の中で第2の層品質にて前記マルチメディアデータを符号化することを備え、前記事前符号化品質は、前記第2の層品質に概ね等しい、請求項1に記載の方法。
  6. 前記マルチメディアデータを事前符号化することは、事前符号化品質で事前符号化することを備え、前記マルチメディアデータを符号化することは、前記第2の層の中で第2の層品質にて前記マルチメディアデータを符号化することを備え、前記事前符号化品質は、前記第2の層品質より高い、請求項1に記載の方法。
  7. 前記特性化パラメータは、前記事前符号化マルチメディアデータの複雑性によって少なくとも部分的には判定される、請求項1に記載の方法。
  8. 前記マルチメディアデータを事前符号化することは、前記マルチメディアデータの複数の部分の各々に関連する1つ以上の特性化パラメータを生成するため、前記マルチメディアデータの複数の部分を事前符号化することを備え、前記マルチメディアデータを符号化することは、前記マルチメディアデータの前記複数の部分の各々を前記第1の層の対応する部分に符号化することを備え、前記第1の層の各部分は、前記対応するマルチメディアデータ部分の前記関連特性化パラメータと、前記マルチメディアデータの前記少なくとも1つの他の部分の前記関連特性化パラメータとに、少なくとも部分的には基づく帯域幅を有する、請求項1に記載の方法。
  9. 前記第1の層の前記品質は、前記第1の層の前記帯域幅を調整するため調整される、請求項1に記載の方法。
  10. 前記事前符号化マルチメディアデータは、ヘッダ情報と、動きベクトル情報と、残差情報とを備え、前記第2の符号化層は、第2の層品質で符号化される残差情報を備える、請求項1に記載の方法。
  11. 前記第1の符号化層は、ヘッダ情報と残差情報とを備える、請求項10に記載の方法。
  12. 前記第1の符号化層は、前記第2の層品質で符号化される前記ヘッダ情報と前記動きベクトル情報と、第1の層品質で符号化される前記残差情報とを備え、前記第1の層品質は、前記関係を概ね満たすよう判定される、請求項11に記載の方法。
  13. 少なくとも第1及び第2の層にマルチメディアデータを符号化するように構成された装置であり、前記第1及び第2の層の各々は対応する伝送帯域幅を有する装置であって、
    前記マルチメディアデータの1つ以上の特性化パラメータを生成するため前記マルチメディアデータを事前符号化するように構成された事前符号器と、
    前記少なくとも第1及び第2の層を生成するため前記マルチメディアデータを符号化するように構成された符号器であって、前記対応する伝送帯域幅は、前記対応する帯域幅が関係を概ね満たすよう、特性化パラメータに少なくとも部分的には基づき判定される、符号器と、
    を備える装置。
  14. 前記関係は比を備える、請求項1に記載の装置。
  15. 前記事前符号器は、事前符号化品質で事前符号化する形に構成され、前記符号器は、前記第2の層の中で第2の層品質にて前記マルチメディアデータを符号化する形に構成され、前記事前符号化品質は、前記第2の層品質に概ね等しい、請求項1に記載の装置。
  16. 前記事前符号器は、事前符号化品質で前記マルチメディアデータを事前符号化する形に構成され、前記符号器は、前記第2の層の中で第2の層品質にて前記マルチメディアを符号化する形に構成され、前記事前符号化品質は、前記第2の層品質より高い、請求項1に記載の装置。
  17. 前記事前符号器は、前記事前符号化マルチメディアデータの複雑性に少なくとも部分的には基づき前記特性化パラメータを決定する形に構成される、請求項1に記載の装置。
  18. 前記事前符号器は、前記マルチメディアデータの複数の部分の各々に関連する1つ以上の特性化パラメータを生成するため、前記マルチメディアデータの複数の部分を事前符号化する形に構成され、前記符号器は、前記マルチメディアデータの前記複数の部分の各々を前記第1の層の対応する部分に符号化する形に構成され、前記第1の層の各部分は、前記対応するマルチメディアデータ部分の前記関連特性化パラメータと、前記マルチメディアデータの前記他の部分の内少なくとも1つの前記関連特性化パラメータとに、少なくとも部分的には基づく帯域幅を有する、請求項1に記載の装置。
  19. 前記第1の層の前記品質は、前記第1の層の前記帯域幅を調整するため調整される、請求項1に記載の装置。
  20. 前記事前符号化マルチメディアデータは、ヘッダ情報と、動きベクトル情報と、残差情報とを備え、前記第2の符号化層は、第2の層品質で符号化される残差情報を備える、請求項1に記載の装置。
  21. 前記第1の符号化層は、ヘッダ情報と残差情報とを備える、請求項8に記載の装置。
  22. 前記第1の符号化層は、前記第2の層品質で符号化される前記ヘッダ情報と前記動きベクトル情報と、第1の層品質で符号化される前記残差情報とを備え、前記第1の層品質は、前記関係を概ね満たすよう判定される、請求項9に記載の装置。
  23. 少なくとも第1及び第2の層にマルチメディアデータを符号化するように構成された装置であり、前記第1及び第2の層の各々は対応する伝送帯域幅を有する装置であって、
    前記マルチメディアデータの1つ以上の特性化パラメータを生成するため前記マルチメディアデータを事前符号化する手段と、
    前記少なくとも第1及び第2の層を生成するため前記マルチメディアデータを符号化する手段であって、前記対応する伝送帯域幅は、前記対応する帯域幅が関係を概ね満たすよう、特性化パラメータに少なくとも部分的には基づき判定される、手段と、
    を備える装置。
  24. 前記関係は比を備える、請求項11に記載の装置。
  25. 前記事前符号化する手段は、事前符号化品質で事前符号化する形に構成され、前記符号化する手段は、前記第2の層の中で第2の層品質にて前記マルチメディアデータを符号化する形に構成され、前記事前符号化品質は、前記第2の層品質に概ね等しい、請求項11に記載の装置。
  26. 前記事前符号化する手段は、事前符号化品質で前記マルチメディアデータを事前符号化する形に構成され、前記符号化する手段は、前記第2の層の中で第2の層品質にて前記マルチメディアを符号化する形に構成され、前記事前符号化品質は、前記第2の層品質より高い、請求項11に記載の装置。
  27. 前記事前符号化する手段は、前記事前符号化マルチメディアデータの複雑性に少なくとも部分的には基づき前記特性化パラメータを生成する形に構成される、請求項11に記載の装置。
  28. 前記事前符号化する手段は、前記マルチメディアデータの複数の部分の各々に関連する1つ以上の特性化パラメータを生成するため、前記マルチメディアデータの複数の部分を事前符号化する形に構成され、前記符号化する手段は、前記マルチメディアデータの前記複数の部分の各々を前記第1の層の対応する部分に符号化する形に構成され、前記第1の層の各部分は、前記対応するマルチメディアデータ部分の前記関連特性化パラメータと、前記マルチメディアデータの前記他の部分の内少なくとも1つの前記関連特性化パラメータとに、少なくとも部分的には基づく帯域幅を有する、請求項11に記載の装置。
  29. 前記第1の層の前記品質は、前記第1の層の前記帯域幅を調整するため調整される、請求項11に記載の装置。
  30. 前記事前符号化マルチメディアデータは、ヘッダ情報と、動きベクトル情報と、残差情報とを備え、前記第2の符号化層は、第2の層品質で符号化される残差情報を備える、請求項11に記載の装置。
  31. 前記第1の符号化層は、ヘッダ情報と残差情報とを備える、請求項18に記載の装置。
  32. 前記第1の符号化層は、前記第2の層品質で符号化される前記ヘッダ情報と前記動きベクトル情報と、第1の層品質で符号化される前記残差情報とを備え、前記第1の層品質は、前記関係を概ね満たすよう判定される、請求項19に記載の装置。
  33. 実行時に、少なくとも第1及び第2の層にマルチメディアデータを符号化する方法を、システムに遂行させる命令を備えるコンピュータ可読媒体であり、前記第1及び第2の層の各々は対応する伝送帯域幅を有するコンピュータ可読媒体であって、前記方法は、
    前記マルチメディアデータの1つ以上の特性化パラメータを生成するため前記マルチメディアデータを事前符号化することと、
    前記少なくとも第1及び第2の層を生成するため前記マルチメディアデータを符号化することであって、前記対応する伝送帯域幅は、前記対応する帯域幅が関係を概ね満たすよう、特性化パラメータに少なくとも部分的には基づき判定されることと、
    を備える媒体。
  34. 前記関係は比を備える、請求項21に記載の媒体。
  35. 前記マルチメディアデータを事前符号化することは、事前符号化品質で事前符号化することを備え、前記マルチメディアデータを符号化することは、前記第2の層の中で第2の層品質にて前記マルチメディアデータを符号化することを備え、前記事前符号化品質は、前記第2の層品質に概ね等しい、請求項21に記載の媒体。
  36. 前記マルチメディアデータを事前符号化することは、事前符号化品質で事前符号化することを備え、前記マルチメディアデータを符号化することは、前記第2の層の中で第2の層品質にて前記マルチメディアデータを符号化することを備え、前記事前符号化品質は、前記第2の層品質より高い、請求項21に記載の媒体。
  37. 前記特性化パラメータは、前記事前符号化マルチメディアデータの複雑性に少なくとも部分的には基づき判定される、請求項21に記載の媒体。
  38. 前記マルチメディアデータを事前符号化することは、前記マルチメディアデータの複数の部分の各々に関連する1つ以上の特性化パラメータを生成するため、前記マルチメディアデータの複数の部分を事前符号化することを備え、前記マルチメディアデータを符号化することは、前記マルチメディアデータの前記複数の部分の各々を前記第1の層の対応する部分に符号化することを備え、前記第1の層の各部分は、前記対応するマルチメディアデータ部分の前記関連特性化パラメータと、前記マルチメディアデータの前記他の部分の内少なくとも1つの前記関連特性化パラメータとに、少なくとも部分的には基づく帯域幅を有する、請求項21に記載の媒体。
  39. 前記第1の層の前記品質は、前記第1の層の前記帯域幅を調整するため調整される、請求項21に記載の媒体。
  40. 前記事前符号化マルチメディアデータは、ヘッダ情報と、動きベクトル情報と、残差情報とを備え、前記第2の符号化層は、第2の層品質で符号化される残差情報を備える、請求項21に記載の媒体。
  41. 前記第1の符号化層は、ヘッダ情報と残差情報とを備える、請求項28に記載の媒体。
  42. 前記第1の符号化層は、前記第2の層品質で符号化される前記ヘッダ情報と前記動きベクトル情報と、第1の層品質で符号化される前記残差情報とを備え、前記第1の層品質は、前記関係を概ね満たすよう判定される、請求項29に記載の媒体。
  43. マルチメディアデータの1つ以上の特性化パラメータを生成するため前記マルチメディアデータを事前符号化し、そして
    前記少なくとも第1及び第2の層を生成するため前記マルチメディアデータを符号化するように構成されたプロセッサであって、前記対応する伝送帯域幅は、前記対応する帯域幅が関係を概ね満たすよう、前記特性化パラメータに少なくとも部分的には基づき判定される、プロセッサ。
  44. 前記関係は比を備える、請求項31に記載のプロセッサ。
  45. 前記マルチメディアデータの複数の部分の各々に関連する1つ以上の特性化パラメータを生成するため、前記マルチメディアデータの複数の部分を事前符号化し、そして
    前記マルチメディアデータの前記複数の部分の各々を前記第1の層の対応する部分に符号化するようにさらに構成されたプロセッサであって、ここで前記第1の層の各部分は、前記対応するマルチメディアデータ部分の前記関連特性化パラメータと、前記マルチメディアデータの前記他の部分の内少なくとも1つの前記関連特性化パラメータとに、少なくとも部分的には基づく帯域幅を有する、請求項31に記載のプロセッサ。
  46. 前記事前符号化マルチメディアデータは、ヘッダ情報と、動きベクトル情報と、残差情報とを備え、前記第2の符号化層は、第2の層品質で符号化される残差情報を備える、請求項31に記載のプロセッサ。
  47. 前記第1の符号化層は、ヘッダ情報と残差情報とを備える、請求項34に記載のプロセッサ。
  48. 前記第1の符号化層は、前記第2の層品質で符号化される前記ヘッダ情報と前記動きベクトル情報と、第1の層品質で符号化される前記残差情報とを備え、前記第1の層品質は、前記関係を概ね満たすよう判定される、請求項35に記載のプロセッサ。
JP2008510209A 2005-05-03 2006-05-03 多層ビデオ設計のためのレート制御 Withdrawn JP2008541570A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67760805P 2005-05-03 2005-05-03
PCT/US2006/017164 WO2006119436A2 (en) 2005-05-03 2006-05-03 Rate control for multi-layer video design

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012108243A Division JP5384694B2 (ja) 2005-05-03 2012-05-10 多層ビデオ設計のためのレート制御

Publications (1)

Publication Number Publication Date
JP2008541570A true JP2008541570A (ja) 2008-11-20

Family

ID=37308706

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008510209A Withdrawn JP2008541570A (ja) 2005-05-03 2006-05-03 多層ビデオ設計のためのレート制御
JP2012108243A Expired - Fee Related JP5384694B2 (ja) 2005-05-03 2012-05-10 多層ビデオ設計のためのレート制御

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2012108243A Expired - Fee Related JP5384694B2 (ja) 2005-05-03 2012-05-10 多層ビデオ設計のためのレート制御

Country Status (7)

Country Link
US (1) US7974341B2 (ja)
EP (1) EP1884027A4 (ja)
JP (2) JP2008541570A (ja)
KR (1) KR100942395B1 (ja)
CN (1) CN101208873B (ja)
TW (1) TW200718215A (ja)
WO (1) WO2006119436A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013251903A (ja) * 2012-06-01 2013-12-12 Samsung Electronics Co Ltd 多階層ビデオコーディングのためのレート制御方法、これを用いるビデオエンコード装置及びビデオ信号処理システム
JP2015510355A (ja) * 2012-02-14 2015-04-02 マイクロソフト コーポレーション コンピュータにより実行される方法及び記憶媒体

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101326610B1 (ko) * 2005-07-11 2013-11-08 톰슨 라이센싱 매크로블록 적응적 인터-층 인트라 텍스쳐 예측을 위한 방법 및 장치
US8948309B2 (en) 2005-07-26 2015-02-03 Broadcom Corporation Method and system for redundancy-based decoding of video content in a wireless system
KR100772878B1 (ko) * 2006-03-27 2007-11-02 삼성전자주식회사 비트스트림의 비트율 조절을 위한 우선권 할당 방법,비트스트림의 비트율 조절 방법, 비디오 디코딩 방법 및 그방법을 이용한 장치
US8135063B2 (en) * 2006-09-08 2012-03-13 Mediatek Inc. Rate control method with frame-layer bit allocation and video encoder
US7961665B2 (en) 2006-12-13 2011-06-14 Viasat, Inc. Terminal aware multicasting
AU2007333037A1 (en) * 2006-12-13 2008-06-19 Viasat, Inc. ACM aware encoding systems and methods
US8576858B2 (en) 2006-12-13 2013-11-05 Viasat, Inc. Multiple transmission paths for hierarchical layers
US8456986B2 (en) * 2006-12-13 2013-06-04 Viasat, Inc. Video and data network load balancing
US20090041100A1 (en) 2006-12-13 2009-02-12 Viasat, Inc. Link aware mobile data network
US8358690B2 (en) * 2006-12-13 2013-01-22 Viasat, Inc. Predictive adaptive coding and modulation
US8411571B2 (en) 2006-12-13 2013-04-02 Viasat, Inc. Video and data network load balancing with video drop
US7944872B2 (en) * 2006-12-13 2011-05-17 Viasat, Inc. Adaptive coding and modulation aware network load balancing
US8411572B2 (en) * 2006-12-13 2013-04-02 Viasat, Inc. ACM and fixed coding and modulation of hierarchical layers
US8395993B2 (en) * 2006-12-13 2013-03-12 Viasat, Inc. Video and data network load balancing with video placeholder
US8630355B2 (en) * 2006-12-22 2014-01-14 Qualcomm Incorporated Multimedia data reorganization between base layer and enhancement layer
US7970066B1 (en) 2006-12-27 2011-06-28 Marvell International Ltd. Tracking automatic gain control of orthogonal frequency domain multiplexing systems
US20080205529A1 (en) * 2007-01-12 2008-08-28 Nokia Corporation Use of fine granular scalability with hierarchical modulation
FR2913844B1 (fr) * 2007-03-16 2009-06-05 Canon Kk Procede et dispositif d'allocation de debit dans une sequence video
KR101366244B1 (ko) * 2007-04-24 2014-02-21 삼성전자주식회사 레지듀얼 데이터를 이용한 영상의 에러 은닉 방법 및 장치
US8989260B2 (en) 2007-06-26 2015-03-24 Nokia Corporation Using scalable codecs for providing channel zapping information to broadcast receivers
EP2059050A1 (en) * 2007-10-31 2009-05-13 Thomson Licensing Method for coding a subsequent sequence of pictures by help of a preceding sequence of pictures
US8457958B2 (en) 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
US20100008419A1 (en) * 2008-07-10 2010-01-14 Apple Inc. Hierarchical Bi-Directional P Frames
US9747371B2 (en) * 2008-10-14 2017-08-29 Disney Enterprises, Inc. Method and system for producing customized content
KR101590633B1 (ko) * 2008-11-11 2016-02-02 삼성전자주식회사 슬라이스 단위로 분할된 동영상을 처리하는 동영상 부호화/복호화장치 및 동영상 부호화/복호화방법
WO2010056310A1 (en) * 2008-11-12 2010-05-20 Thomson Licensing I-frame de-flickering for gop-parallel multi-thread video encoding
WO2010056315A1 (en) * 2008-11-13 2010-05-20 Thomson Licensing Multiple thread video encoding using gop merging and bit allocation
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US20100262708A1 (en) * 2009-04-08 2010-10-14 Nokia Corporation Method and apparatus for delivery of scalable media data
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8213506B2 (en) * 2009-09-08 2012-07-03 Skype Video coding
GB2476271B (en) * 2009-12-17 2015-09-02 Skype Coding data streams
US8908758B2 (en) * 2010-01-06 2014-12-09 Dolby Laboratories Licensing Corporation High performance rate control for multi-layered video coding applications
KR101379188B1 (ko) * 2010-05-17 2014-04-18 에스케이 텔레콤주식회사 인트라 블록 및 인터 블록이 혼합된 코딩블록을 이용하는 영상 부호화/복호화 장치 및 그 방법
US9143793B2 (en) * 2010-05-27 2015-09-22 Freescale Semiconductor, Inc. Video processing system, computer program product and method for managing a transfer of information between a memory unit and a decoder
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
TWI394462B (zh) * 2010-06-22 2013-04-21 Univ Nat Taiwan 基於視覺感知的位元-失真最佳化位元分配的位元率控制方法
WO2012099589A1 (en) * 2011-01-20 2012-07-26 Vidyo, Inc. Participant aware configuration for video encoder
US8925027B2 (en) * 2011-01-20 2014-12-30 Vidyo, Inc. Participant aware configuration for video encoder
US9948938B2 (en) 2011-07-21 2018-04-17 Texas Instruments Incorporated Methods and systems for chroma residual data prediction
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US9626772B2 (en) * 2012-01-18 2017-04-18 V-Nova International Limited Distinct encoding and decoding of stable information and transient/stochastic information
US9578326B2 (en) * 2012-04-04 2017-02-21 Qualcomm Incorporated Low-delay video buffering in video coding
US9635369B2 (en) * 2012-07-02 2017-04-25 Qualcomm Incorporated Video parameter set including HRD parameters
US9473771B2 (en) 2013-04-08 2016-10-18 Qualcomm Incorporated Coding video data for an output layer set
US9510004B2 (en) 2013-06-12 2016-11-29 Microsoft Technology Licensing, Llc Multi-layered rate control for scalable video coding
US9578342B2 (en) * 2013-06-24 2017-02-21 Dialogic Corporation Rate control algorithm for scalable video encoding with disposable P-frames
US20150172680A1 (en) * 2013-12-16 2015-06-18 Arris Enterprises, Inc. Producing an Output Need Parameter for an Encoder
JP6354262B2 (ja) * 2014-03-31 2018-07-11 株式会社Jvcケンウッド 映像符号化データ送信装置、映像符号化データ送信方法、映像符号化データ受信装置、映像符号化データ受信方法、及び映像符号化データ送受信システム
US20150350686A1 (en) * 2014-05-29 2015-12-03 Apple Inc. Preencoder assisted video encoding
TWI508531B (zh) * 2014-06-04 2015-11-11 Hon Hai Prec Ind Co Ltd 視訊編碼裝置及方法
FR3041851B1 (fr) * 2015-09-24 2018-02-16 B<>Com Procede d'allocation de debit, dispositif, codeur et programme d'ordinateur associes
US11595650B2 (en) 2017-03-31 2023-02-28 Intel Corporation Optimization of multi-sink Wi-Fi display with intelligent multi-session encoding
CN113132728B (zh) * 2019-12-31 2023-06-27 上海海思技术有限公司 编码方法及编码器
US11917206B2 (en) 2021-12-17 2024-02-27 Lenovo (Singapore) Pte. Ltd. Video codec aware radio access network configuration and unequal error protection coding
US11824653B2 (en) 2021-12-17 2023-11-21 Lenovo (Singapore) Pte. Ltd. Radio access network configuration for video approximate semantic communications
US20240089436A1 (en) * 2022-09-13 2024-03-14 Google Llc Dynamic Quantization Parameter for Encoding a Video Frame

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10174110A (ja) * 1996-07-03 1998-06-26 General Instr Corp Of Delaware ステレオデジタルビデオ符号化のための比率制御
JP2003517743A (ja) * 1998-08-27 2003-05-27 ジェネラル・インスツルメント・コーポレイション 圧縮デジタルビデオ信号および圧縮されていないデジタルビデオ信号の統計的な多重化のための動的ビット配分

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5933567A (en) * 1993-01-13 1999-08-03 Hitachi America, Ltd. Method and apparatus for controlling the position of the heads of a digital video tape recorder during trick play operation and for recording digital data on a tape
US5515377A (en) * 1993-09-02 1996-05-07 At&T Corp. Adaptive video encoder for two-layer encoding of video signals on ATM (asynchronous transfer mode) networks
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6292512B1 (en) * 1998-07-06 2001-09-18 U.S. Philips Corporation Scalable video coding system
US6637031B1 (en) * 1998-12-04 2003-10-21 Microsoft Corporation Multimedia presentation latency minimization
US6263022B1 (en) * 1999-07-06 2001-07-17 Philips Electronics North America Corp. System and method for fine granular scalable video with selective quality enhancement
US7463683B2 (en) * 2000-10-11 2008-12-09 Koninklijke Philips Electronics N.V. Method and apparatus for decoding spatially scaled fine granular encoded video signals
JP2004515132A (ja) 2000-11-23 2004-05-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化方法及び対応するエンコーダ
GB0031538D0 (en) 2000-12-22 2001-02-07 Pa Consulting Services Video layer mapping
JP2005506815A (ja) * 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間拡張可能圧縮のための方法及び装置
JP4390112B2 (ja) 2002-09-05 2009-12-24 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ ビデオシーケンスのレートを制御する方法及び装置並びにビデオ符号化装置
US7400889B2 (en) * 2003-04-01 2008-07-15 Telefonaktiebolaget Lm Ericsson (Publ) Scalable quality broadcast service in a mobile wireless communication network
CN1871858A (zh) * 2003-10-20 2006-11-29 三星电子株式会社 规格化视觉品质的比特率控制方法与装置
US7227894B2 (en) * 2004-02-24 2007-06-05 Industrial Technology Research Institute Method and apparatus for MPEG-4 FGS performance enhancement
US7676722B2 (en) * 2004-03-31 2010-03-09 Sony Corporation Multimedia content delivery using pre-stored multiple description coded video with restart
US7671893B2 (en) * 2004-07-27 2010-03-02 Microsoft Corp. System and method for interactive multi-view video
WO2006075901A1 (en) * 2005-01-14 2006-07-20 Sungkyunkwan University Methods of and apparatuses for adaptive entropy encoding and adaptive entropy decoding for scalable video encoding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10174110A (ja) * 1996-07-03 1998-06-26 General Instr Corp Of Delaware ステレオデジタルビデオ符号化のための比率制御
JP2003517743A (ja) * 1998-08-27 2003-05-27 ジェネラル・インスツルメント・コーポレイション 圧縮デジタルビデオ信号および圧縮されていないデジタルビデオ信号の統計的な多重化のための動的ビット配分

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015510355A (ja) * 2012-02-14 2015-04-02 マイクロソフト コーポレーション コンピュータにより実行される方法及び記憶媒体
JP2013251903A (ja) * 2012-06-01 2013-12-12 Samsung Electronics Co Ltd 多階層ビデオコーディングのためのレート制御方法、これを用いるビデオエンコード装置及びビデオ信号処理システム

Also Published As

Publication number Publication date
JP5384694B2 (ja) 2014-01-08
US20080144723A1 (en) 2008-06-19
WO2006119436A2 (en) 2006-11-09
EP1884027A2 (en) 2008-02-06
TW200718215A (en) 2007-05-01
WO2006119436A3 (en) 2007-11-01
CN101208873B (zh) 2012-04-25
KR100942395B1 (ko) 2010-02-17
JP2012178864A (ja) 2012-09-13
KR20080015831A (ko) 2008-02-20
CN101208873A (zh) 2008-06-25
EP1884027A4 (en) 2012-02-29
US7974341B2 (en) 2011-07-05

Similar Documents

Publication Publication Date Title
JP5384694B2 (ja) 多層ビデオ設計のためのレート制御
CA2565645C (en) Method and apparatus to construct bi-directional predicted frames for temporal scalability
RU2372743C2 (ru) Масштабируемое видеокодирование с двухуровневым кодированием и одноуровневым декодированием
RU2452128C2 (ru) Адаптивное кодирование информации заголовка видеоблока
JP4109113B2 (ja) ビデオ伝送におけるビットストリーム間の切換
JP5069099B2 (ja) 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測のための方法および装置
JP5350404B2 (ja) 早いマクロブロック・デルタqpの決定
US8406297B2 (en) System and method for bit-allocation in video coding
EP1549074A1 (en) A bit-rate control method and device combined with rate-distortion optimization
US9066097B2 (en) Method to optimize the transforms and/or predictions in a video codec
JP2010515305A (ja) 他のコーディングモードの情報を使用したコーディングモードの選択
MX2007011084A (es) Clasificacion de contenido para procesamiento multimedia.
US20050129125A1 (en) Method and apparatus for pitcure compression using variable block of arbitrary size
JP2004201298A (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP5675719B2 (ja) マルチメディアデータを処理する方法および装置
US20070058723A1 (en) Adaptively adjusted slice width selection
Abd Al-azeez et al. Optimal quality ultra high video streaming based H. 265
KR100770873B1 (ko) 영상 부호화시 비트율 제어 방법 및 장치
KR100718468B1 (ko) 영상 축소 트랜스 코딩 방법 및 장치
KR20040093253A (ko) 16×16 인트라 휘도 예측 모드 결정방법 및 장치
KR101307469B1 (ko) 비디오 인코더, 비디오 디코더, 비디오 인코딩 방법 및 비디오 디코딩 방법
He et al. Improved fine granular scalable coding with interlayer prediction
Mamatha et al. BIT RATE REDUCTION FOR H. 264/AVC VIDEO BASED ON NOVEL HEXAGON SEARCH ALGORITHM.
Baguda et al. H264/AVC features & functionalities suitable for wireless video transmission
Pan Digital Video Coding–Techniques and Standards

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110301

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110531

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110607

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110701

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110708

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110801

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120409

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120416

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20120518

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120529

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A072

Effective date: 20121009