JP4728339B2 - デジタルビデオ符号化のための適応性イントラリフレッシュ - Google Patents

デジタルビデオ符号化のための適応性イントラリフレッシュ Download PDF

Info

Publication number
JP4728339B2
JP4728339B2 JP2007536953A JP2007536953A JP4728339B2 JP 4728339 B2 JP4728339 B2 JP 4728339B2 JP 2007536953 A JP2007536953 A JP 2007536953A JP 2007536953 A JP2007536953 A JP 2007536953A JP 4728339 B2 JP4728339 B2 JP 4728339B2
Authority
JP
Japan
Prior art keywords
frame
rate
current frame
intra
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007536953A
Other languages
English (en)
Other versions
JP2008516561A (ja
Inventor
リアン、イ
エル−マレー、クハレド・ヘルミ
マンジュナス、シャラス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008516561A publication Critical patent/JP2008516561A/ja
Application granted granted Critical
Publication of JP4728339B2 publication Critical patent/JP4728339B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本開示は、デジタルビデオ符号化に関し、特に、デジタルビデオフレームを圧縮する場合における適応性イントラリフレッシュのための技術に関する。
デジタルビデオシーケンスの符号化のために、多くの異なるビデオ符号化規格が確立されている。例えばMPEG(Moving Picture Experts Group)は、MPEG−1、MPEG−2、及びMPEG−4を含む多くの規格を開発している。他の例は、国際電気通信連合(ITU)H.263規格、及び新興のITU H.264規格を含む。これらのビデオ符号化規格は、一般に、データを圧縮方式で符号化することにより、改善されたビデオシーケンスの送信効率をサポートする。圧縮は、ビデオフレームの効率的な送信のために送信される必要のある全体データ量を低減する。
例えば、MPEG−4、ITU H.263、及びITU H.264規格は、時間的な相関又はフレーム間相関とも称されており、フレーム間圧縮を提供するために、連続したビデオフレーム間の類似性を利用するビデオ符号化技術をサポートする。フレーム間圧縮技術は、ビデオフレームのピクセルベースの表示を、動作表示に変換することによって、フレームにわたるデータ冗長性を利用する。フレーム間技術を使用して符号化されるフレームは、P(「予測的」(predictive))フレーム、又はB(「双方向」(bi-directional))フレームと呼ばれる。幾つかのフレーム、あるいはフレーム内のマクロブロック(MB)は、非予測的である空間的なイントラフレーム圧縮を用いて符号化される。イントラコードフレームは、一般に、I(「イントラ」)フレームと称される。
無線ネットワークによるビデオデータの送信は、チャネル損失によって信頼性が低くなりえる。チャネル損失に起因する誤りは、ユーザに示されるビデオの品質に悪い影響を与えうる。特に、チャネル誤りは、現在のフレームの品質のみならず、動作推定及び圧縮技術を用いて現在のフレームから生成される後のインターコードフレームの品質をも下げる。1つのフレームから別のフレームへのチャネル誘導誤りの伝搬を制限するために、ビデオエンコーダは一般に、イントラリフレッシュ(IR)技術を適用する。IR技術によれば、Pフレーム内のMBは、インターコード化されるのではなく、選択的にイントラコード化される。イントラコード化されたMBは、誤り回復力を改善することができるが、送信されねばならないビット数の増加を必要とする。従って、IRレートは、誤り回復力と帯域幅効率との両方の観点から符号化性能にインパクトを与える。
Z. He, J. Cai, and CW. Chen, "Joint source channel rate- distortion analysis for adaptive mode selection and rate control in wireless video coding," IEEE Transactions on Circuits and Systems for Video Technology, Volume: 12 , Issue: 6 , June 2002, pages: 511 - 523.
本出願は、本明細書に参照によってその全体が組み込まれ、2004年10月12日に出願された米国仮出願60/618,383号の利益を要求する。
本開示は、例えばMBのように、デジタルビデオフレーム内のビデオブロックの適応性IRのための技術に向けられる。本技術は、ビデオコンテンツ、又はビデオコンテンツとチャネル条件との組み合わせに基づいてIRレートを調節する。IRレートは、フレームレベルあるいはMBレベルで適用されうる。フレームレベルでは、IRレートは、フレーム内でイントラコード化されるMBの割合を指定する。MBレベルでは、IRレートは、特定のMBがイントラコード化される統計的確率を定義する。
ビデオコンテンツは、フレーム対フレーム変化、及びフレーム内テクスチャ情報の両方に基づいて評価されうる。フレーム対フレーム変化は、例えば、フレームからフレームへの差分平方和(SSD)によって判断されうる。フレームテクスチャ情報は、一般にテクスチャ複雑さを示すフレーム分散の観点から特徴付けることができる。チャネル条件は、推定チャネル損失確率から決定されるかもしれない。
IRレートは、推定されたフレーム対フレームSSD、テクスチャ情報、及びチャネル損失確率を重み付ける結合数的指標に比例して調節される。結合数的指標は、推定チャネル損失確率及びSSDに比例するが、フレーム分散に逆比例する。結合数的指標が変化すると、IRレートが変化し、誤り回復力、帯域幅効率、及び実装複雑さのバランスを保つ適応性IRスキームを提供する。
特に、IRレートは、比較的低い実装複雑さしか要求しないクローズフォームソリューション(close-form solution)を用いて決定することができる。例えば、そのようなクローズフォームは一般に、反復又は徹底的な探索を必要としない。更に、IRレートは、特定のフレーム又はMBについて動作推定及び動作補償が実行される前に利用可能なパラメータから決定することができる。
1つの実施形態では、本開示は、現在のフレームと別のフレームとの間のフレーム対フレーム変化の測定値を取得することと、現在のフレームのためのテクスチャ情報を取得することと、フレーム対フレーム変化とテクスチャ情報とに基づいて、現在のフレームのためのイントラリフレッシュ(IR)レートを生成することとを含むビデオ符号化方法を提供する。
別の実施形態では、本開示は、現在のフレームと別のフレームとの間のフレーム対フレーム変化の測定値と、現在のフレームのテクスチャ情報とに基づいて、現在のフレームのイントラリフレッシュ(IR)レートを生成するIR制御ユニットと、前記IRレートに基づいて、現在のフレーム内のマクロブロック(MB)のためのインターコード又はイントラコードを選択するモード選択ユニットとを備えるビデオエンコーダを提供する。
追加の実施形態では、本開示は、現在のビデオフレームのビデオコンテンツに基づいて、現在のビデオフレームのためのイントラリフレッシュ(IR)レートを生成することと、前記IRレートに基づいて、現在のフレーム内のマクロブロック(MB)のためのインターコード化又はイントラコード化を選択することとを含むビデオ符号化方法を提供する。
別の実施形態では、本開示は、現在のビデオフレームのビデオコンテンツに基づいて、現在のビデオフレームのためのイントラリフレッシュ(IR)レートを生成するIRレート制御ユニットと、前記IRレートに基づいて、現在のフレーム内のマクロブロック(MB)のためのインターコード化又はイントラコード化を選択するモード選択ユニットとを備えるビデオエンコーダを備える。
本開示は更に、ビデオエンコーダを形成する1又は複数のプロセッサに対して、本明細書で開示された技術のうちの1つを実行させる命令を含むコンピュータ読取可能媒体を考慮する。
1又は複数の実施形態の詳細は、添付図面と以下の説明において述べられる。他の特徴、目的、及び利点は、説明、図面、及び特許請求の範囲から明白になる。
図1は、ビデオ符号化および復号システム10を例示するブロック図である。図1に示すように、システム10は、送信チャネル16によって接続されたエンコーダシステム12及びデコーダシステム14を含んでいる。エンコーダシステム12は、マルチプレクサ(MUX)18、ビデオエンコーダ20、及びオーディオエンコーダ22を含んでいる。デコーダシステム14は、デマルチプレクサ(DEMUX)26、ビデオデコーダ28、及びオーディオデコーダ30を含んでいる。記載されるように、ビデオエンコーダ20は、適応性IR技術を適用するように構成されうる。適応性IR技術によれば、ビデオエンコーダ20は、特定のPフレーム内の、例えばMBのようなビデオブロックがイントラリフレッシュされるIRレートを決定する。IRレートは、一般に、イントラリフレッシュされるMBの数を決定し、フレームレベル又はMBレベルにおいて適用される。
IRレートは、ビデオコンテンツ、あるいはビデオコンテンツとチャネル条件との組み合わせに基づいて決定されうる。例えば、IRレートは、推定チャネル損失確率、現在のフレームと他のフレームとの間のフレーム対フレーム変化、及び現在のフレームのテクスチャ情報を測定する結合数的指標に基づいて決定されうる。従って、適応性IR技術は、ビデオコンテンツとチャネル条件との両方を考慮しうる。IRレートが与えられると、ビデオエンコーダ20は、更に、フレーム内でイントラリフレッシュされるべきである特定のMBを識別するために、適応性探索技術を用いるかもしれない。この適応性探索技術は、テクスチャ情報に依存しうる。そして、動作推定前に実行することができる。
システム10は、例えばビデオ電話通信のために、双方向ビデオ送信を提供するかもしれない。従って、相補的な(reciprocal)符号化、復号、MUX及びDEMUXの要素が、チャネル16の反対側に提供されうる。幾つかの実施形態では、エンコーダシステム12及びデコーダシステム14は、ビデオストリーミング、ビデオ電話通信、あるいはその両方のために備えられた無線モバイル端末のようなビデオ通信デバイス内に組み込まれうる。モバイル端末は、セッション開始プロトコル(SIP:Session Initiated Protocol)、ITU H.323規格、ITU H.324M規格、又はその他の規格に従ってビデオ電話通信をサポートすることができる。
ビデオエンコーダ20は、例えばMPEG−2、MPEG−4、ITU H.263、又はITU H.264のようなビデオ圧縮規格に従って符号化されるビデオデータを生成する。オーディオエンコーダ22は、ビデオデータを伴うオーディオデータを符号化する。MUX18は、ビデオエンコーダ20及びオーディオエンコーダ22から、適応レイヤビデオデータユニット及びオーディオデータユニットを取得する。MUX18は、このビデオデータ及びオーディオデータを多重化して、チャネル16を経由して送信するために一連の多重化データユニットを生成する。一例として、MUX18及びDEMUX26は、ITUによって公開されているH.223多重化プロトコルに従って動作しうる。しかしながら、例えばユーザデータグラムプロトコル(UDP)のような他のプロトコルも使用されうる。
チャネル16は、この多重化された情報を、論理送信ユニット(LTU)と称されうる物理レイヤデータユニットとしてデコーダシステム14へ運ぶ。チャネル16は、エンコーダシステム12とデコーダシステム14との間の任意の物理的な接続でありうる。例えば、チャネル16は、ローカルあるいはワイドエリアネットワークのような有線接続でありうる。あるいは、本明細書に記載するように、チャネル16は、セルラ、衛星、又は光接続のような無線接続かもしれない。これは、送信パケットの損失による重大な誤りの傾向がありうる。チャネル16は、例えばW−CDMA、CDMA2000 1x、CDMA2000 1x EV−DO、あるいはCDMA2000 EV−DVのような様々なラジオ周波数(RF)プロトコルのうちの何れかに従った無線パケットの送信をサポートしうる。
DEMUX26は、LTUから多重化データユニットを識別し、多重化レイヤデータユニットのコンテンツを逆多重化して、ビデオ及びオーディオの適応レイヤデータユニットを生成する。これら適応レイヤデータユニットは、適応レイヤ内で処理され、ビデオデータフレームを生成する。ビデオデコーダ28は、アプリケーションレイヤにおいてビデオデータフレームを復号し、ディスプレイデバイスの駆動に使用されるビデオデータのストリームを生成する。特に、ビデオデコーダ28は、ビデオデータフレーム内の個々のビデオスライスを復号する。オーディオデコーダ30は、オーディオデータを復号し、オーディオを生成する。
ビデオエンコーダ20によって適用される適応性IR技術は、比較的低い複雑さで適用されうる。この技術に従って、ビデオエンコーダ20は、調節されたIRレートで、Pフレーム内のMBをイントラリフレッシュする。フレーム対フレーム変化、テクスチャ情報、及び推定チャネル損失確率を用いて、ビデオエンコーダ20は、到来するビデオフレームに対するIRレートを動的に調節する。このIRレートは、各フレームのために調節されるか、あるいは与えられたフレーム内のMBのために調節されうる。
チャネル、変化、及びテクスチャのパラメータが重み付けられ、IRレートの調節のための基本として役立つ結合数的指標が生成される。このように、ビデオエンコーダ20は、チャネル及びコンテンツの両方に適応するIR技術を用いるように構成することができる。特に、チャネル条件は、推定チャネル損失確率によって表される。一方、ビデオコンテンツは、現在のフレームと他のフレームとの間のフレーム対フレーム変化と、現在のフレームのテクスチャ情報との両方によって表される。
フレーム対フレーム変化は、現在のフレームと前のフレームとの間の差分平方和(SSD)数的指標によって決定することができる。テクスチャ情報は、現在のフレーム又はMB内の分散によって決定されうる。分散は、フレーム又はMB内のビデオコンテンツのピクセル変化を表わす。高い分散は、一般に、与えられたフレーム又はMB内のより複雑なビデオコンテンツを示し、より高いイントラコード化費用と関連する傾向にある。しかしながら、より高いチャネル損失、及びフレーム対フレーム変化は、誤り伝播によるより高い誤り率又は品質低下と関連し、かつ誤り回復のためにイントラコード化をサポートする傾向にある。
チャネル及びビデオコンテンツパラメータを考慮することによって、誤り回復力と符号化効率とのバランスを保つ適応性アプローチが可能となる。更に、以下に説明するように、動作推定に先立って利用可能なパラメータを考慮することによって、この適応性IR技術は、低い実装複雑さを可能とする。特に、IR技術は、符号化プロセス全体を完了させる必要のないクローズフォームソリューションを利用する。
本明細書に記載のIR技術は、汎用マイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)、フィールドプログラム可能なゲートアレイ(FPGA)、又はその他の等価な論理デバイス内に実装される。例えば、ビデオエンコーダシステム12、及びそのコンポーネントは、デジタル信号プロセッサ(DSP)又はその他の制御デバイス上で動作する符号化プロセス、又は符号化/復号(CODEC)プロセスの一部として実施されうる。従って、モジュールとして記載されるコンポーネントは、そのようなプロセスのうちのプログラム可能な機能を形成するかもしれず、また、共通のプロセッサ又は個別のプロセッサ上でともに実現されうる。
ビデオエンコーダシステム12は、専用のハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせに加えて、命令及びデータを格納するための専用メモリを備えうる。もしソフトウェアで実現されれば、この技術は、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、非揮発性ランダムアクセスメモリ(NVRAM)、電子的消去可能プログラマブル読取専用メモリ(EEPROM)、FLASHメモリ、磁気媒体、光媒体等のようなコンピュータ読取可能媒体上の命令として具体化されうる。それら命令は、1又は複数のプロセッサに対して、本開示で記載された機能のある局面を実行させる。
図2は、本開示に従った適応性IR技術を使用するビデオエンコーダ20を例示するブロック図である。図2に示すように、ビデオエンコーダ20は、インターコーダ32、イントラコーダ34、差分ユニット36、変換(T)ユニット38、及び量子化(Q)ユニット40を含む。差分ユニット36は、到来するデジタルビデオフレームFnからインター又はイントラ予測Pを引き、差分Dnを生成する。インター又はイントラ予測Pは、インターコーダ32又はイントラコーダ34のうちの何れか一方から得られる。変換ユニット38は、離散コサイン変換(DCT)のような標準的な圧縮変換を使用して、差分ユニット36の出力を、周波数成分に変換する。量子化ユニット40は、変換された出力を量子化して、量子化変換係数のセットXを生成する。
インターコーダ32は、例えばMPEG−4又はH.264圧縮方法に従って、フレームFnのインターコード化を実行する。図2に示すように、インターコーダ32は、動作推定(ME)ユニット42と、動作補償(MC)ユニット44とを含み、1又は複数の前に符号化されたフレーム
Figure 0004728339
に対する、到来フレームFnの標準的なインターコード化をサポートする。特に、インター予測Pは、1又は複数の前のフレーム
Figure 0004728339
からの動作補償予測によって生成される。前のフレームは、以前に符号化され、
Figure 0004728339
を生成するために再構築される。
イントラコーダ34は、到来するビデオフレームFnのイントラコード化を実行し、イントラ予測Pを生成する。イントラ予測は、以前に符号化され、復号され、更に再構築されて、再構築フレーム
Figure 0004728339
を生成する現在のフレームFn内のサンプルから生成される。結果として得られるイントラ予測Pは、差分Dnを生成するために、ビデオエンコーダ20がイントラモードで動作しているときに差分ユニット36に加えられる。イントラコーダ34は、イントラコード化を実行してIフレームを生成するか、又はPフレーム内でイントラコード選択されたMBを生成し、イントラリフレッシュをサポートする。
モード選択ユニット46は、例えばフレーム毎、あるいはMB毎ベースで、インターコード化とイントラコード化との間を選択的に切リ換える。特に、モード選択ユニット46は、フレームレベル又はMBレベルの何れか一方で、インターコーダ32又はイントラコーダ34の何れか一方の出力を選択する。このように、モード選択ユニット46は、差分ユニット36に加えられる予測Pが、インターコード化又はイントラコード化されるかを決定する。モード選択ユニット46は、IRレート制御ユニット48に応答する。IRレート制御ユニット48は、ビデオエンコーダ20内のIRレートを動的に調節し、モード選択ユニット46を制御する。
IRレート制御ユニット48は、フレーム毎ベース、又はMB毎ベースで、IRレートを更新する。IRレートがフレーム全体に対して決定される場合、そのIRレートは、フレーム中の全てのMBに当てはまる。しかしながら、IRレートが、個々のMBのために決定される場合、IRレートは、MB毎に変わりうる。この場合、IRレートは、確率として個々のMBに対して加えられ、イントラコード化が適用されるべきかが決定される。
上述したように、IRレート制御ユニット48は、チャネル入力及びコンテンツ入力の組み合わせに基づいて、順応的にIRレートを調節する。特に、図2に示すように、IRレート制御ユニット48は、推定チャネル損失確率(CHANNEL LOSS)、差分平方和(SSD)値でありうるフレーム対フレーム又はMB対MB変化値、及びピクセルレベル分散(VARIANCE)に関して表されうるテクスチャ値を受け取って処理する。
推定チャネル損失確率は、チャネル16を介して送信される場合、現在のフレームが失われる確率を定量化し、もって、チャネルを特徴付ける。SSD及び分散は、符号化されるフレーム又はMBの実際のコンテンツを特徴付ける。また、IRレート制御ユニットは、チャネル損失及びビデオコンテンツの両方における変化に対して順応性がある。
CHANNEL LOSS、SSD、及び分散は、個々に重み付けられ、合計され、IRレート調節のための結合数的指標が形成される。IRレート制御ユニット48は、IRレートを調節することによって、結合数的指標における変化に応答する。IRレートはその後、フレームレベルベース又はMBレベルベースでインターコード化又はイントラコード化のうちの何れか一方を選択するために、制御モード選択ユニット46に加えられる。
特に、IRレート制御ユニット48は、事前モードで、すなわちフレーム又はMBが動作推定及び動作補償を用いてインターコード化される前に取得されうる容易に利用可能なパラメータに依存する。このように、IRレートは、反復的又は徹底的な探索ではなく、クローズフォームソリューションを用いて決定することができる。これは、比較的低い実装複雑さを提供する。
IRレート制御ユニット48は、Pフレーム内のMBがイントラコード化されるべきかを判定する際に、チャネル条件及びビデオコンテンツにおける変化に適応する。一般に、IRレートは、SSD及び分散が一定であり、推定チャネル損失確率が増加する場合に増加し、推定チャネル損失確率が一定であり、SSDが増加する場合に増加する。しかしながら、IRレートは、現在のフレーム内のビデオコンテンツの分散が増加すると減少する。これら入力量が変わるとIRレートは変化する。これは、本技術の適応性のある性質を反映している。
IRレート制御ユニット48によって生成されたIRレートは、IR決定を与えるために、モード選択ユニット46によって使用される。IR決定は、予測Pのために、インターコーダ32又はイントラコーダ34かのうちの何れか一方の出力を選択する。このモード選択は、フレームレベルにおいて適用することができ、これによって、IRレートが、フレーム全体のために固定されるようになる。この場合、モード選択ユニット46は、フレーム全体のためにIRレートを適用するが、IRレートを満足するために十分な数にイントラリフレッシュされる特定のMBを選択する必要がある。しかしながら、IRレートがMBレベルに決定されるのであれば、モード選択ユニット46は、フレーム内のMBをスキャンすると、IRレートにおける変化に反応する。
フレームレベル実装では、IRレート制御ユニット48によって生成されるIRレートは、イントラコード化されるに違いない現在のフレーム内のMBの固定された割合として表現されうる。MBレベル実装では、IRレートは、特定のMBがイントラコード化される統計的確率として表現されうる。SSD及び分散は、フレームレベル実装に対してフレームレベルで、及びMBレベル実装に対してMBレベルで測定される。チャネル条件測定値は、定期的に得られ、フレームレベルあるいはMBレベルのIRレート調節の何れかのために使用されうる。
フレームのテクスチャ情報は、分散の観点から表すことができる。一般に、現在のフレーム又はMB内のビデオコンテンツの分散は、現在のコンテンツをイントラコード化するコストを表す。フレーム内の隣接MB間に著しい変化がある場合、イントラコード化は、インターコード化よりも著しく多くのビットを必要とするだろう。フレームからフレームへのSSDは、フレームからフレームへの動作量を表わす。そして、パケット損失が送信チャネルにおいて起こる事象における潜在的なデコーダ歪みに直接マップする。従って、より高いSSDは、誤り回復の目的のために、イントラコード化を好む。本開示に記載された適応性IRレート技術は、特定のデータレートが与えられた歪み全体を低減しながら、圧縮効率と誤りロバスト性との間のバランスを保つことができる。
SSDは、フレームレベル実装ではフレーム全体で、MBレベル実装では同一場所に配置されたMBで測定することができる。SSDは、何れの動作推定及び補償が実行される前に、前のフレームFn−1の再構築されたあるいはオリジナルのバージョンと、現在のフレームFのオリジナルバージョンとの間で測定することができる。このように、初期の「事前モード」決定は、IRレートに関連して行うことができる。あるいは、幾つかの実施形態では、SSD、あるいは絶対差の合計(SAD)数的指標が、動作補償が実行された後にフレーム間で測定される。
推定チャネル損失確率は、様々な異なる方法で得ることができる。一例として、推定チャネル損失確率は、例えば、H.3xxベースのビデオ電話通信規格のH.245シグナリング、又は品質サービス(QoS)フィードバックの形態によるリアルタイム伝送制御プロトコル(RTCP)による遠隔端末からの受信機フィードバックに基づいて決定されうる。単純な代替例として、推定チャネル損失確率は、チャネル16の送受信方向におけるチャネル歪みの対称性を仮定して、遠隔端末から受信したビットストリームからの損失統計量を用いて、エンコーダ側で推定することができる。何れの場合も、SSD及び分散と異なり、チャネル損失確率は、検討中のフレーム又はMBとの正確な時間的相関を与えないかもしれないが、比較的頻繁に得ることができる。
フレームレベル実装では、イントラコード化されるMBの割合が、与えられたPフレームのために決定された後、イントラコード化される実際のMBは、異なる方法で決定することができる。モード選択ユニット46は、IRレート制御ユニット48によって規定されたIRレートを満足するために、MBの領域、又は個々のMBを選択するように構成されうる。例えば、MBは、MBが、フレームからフレームへと、連続的に、かつ、周期的に、固定され予め定められたパターンでイントラリフレッシュされる周期的アプローチに従って選択することができる。
あるいは、モード選択ユニット46は、予め定めたルールに従ってMBを区別しうる。例えば、特定のしきい値未満の低分散を有するMBは、高分散(及び高いコード化費用)を有するMBと比較して、イントラリフレッシュのために、モード選択ユニット46によって優先的に選択することができる。この場合、イントラリフレッシュされるMBの探索が、ビデオコンテンツ、更に詳しくは、MBによって表されるアンダーレイビデオのテクスチャに従って実行される。
更に他の代替例として、様々なランダムアプローチが、MBを識別するためにIRのために使用されうる。例えば、幾つかのランダムなアプローチは、MBのランダム選択、又はランダムベースでのフレーム内のMBの異なる領域の選択を含みうる。更に別のアプローチは、周期的、適応性、及びランダム局面を結合し、ハイブリッドなIR技術を提供しうる。
上述した各MB選択技術に従って、フレームレベル実装については、与えられたPフレーム内でイントラリフレッシュされたMBの数は、IRレート制御ユニット48によって指定されたIRレートに相当する。しかしながら、MBレベル実装については、検討中のMBは、IRレート制御ユニット48によってそれぞれのMBのために計算されたIRレートに従って、イントラリフレッシュのために選択される。IRレートが決定され、与えられたPフレームの全体にわたってMB毎ベースで適用される。この場合、IRレートは、確率として適用され、モード選択結果は、「確率によりバイアスされたコインをフリップする(flipping a probability-biased coin)」効果を持つ。言い換えると、検討中のMBが、IRレート制御ユニット48によって割り当てられた高IRレートを持つのであれば、モード選択ユニット46によって、イントラリフレッシュのために選択される確率が高くなるであろう。
本明細書に記載の適応性IRレート技術は、現在のフレーム又はMBに対して、例えばSSD及び分散のようなビデオコンテンツにおける変化に対して応答するという意味で、自己コンテンツ適応性があると考えることができる。更に、有利なことに、そのような変化は、フレーム又はMBについて如何なる推定及び補償が行われる前に検出することができる。ある場合には、そのような技術は、単一のサンプルシーケンスを使用して調整され、いかなるパラメータ又はしきい値を調整又は設定することなく、ビデオシーケンスに適用される。この適応性IRレート技術はまた、イントラコード化されたフレームの周期及び推定チャネル損失確率に従ってIRレートを調節することによって、イントラコード化されたフレームが使用される場合にも良好に動作する。
幾つかの実施形態では、フレームレベル又はMBレベルの何れかにおいて、IRレートは、ビデオコンテンツ及びチャネル条件と共に、例えばイントラフレーム周期、フレームレート、データレート、フレームサイズ等のようなシステム設定に従って予め決定することができる。従って、この適応性IRレート制御技術は、推定チャネル損失確率、SSD、及び分散に対して応答するのみならず、ビデオエンコーダ20のために確立された1又は複数のシステム設定パラメータに対しても応答しうる。
幾つかの実施形態では、複雑さを低減するために、IRレート制御技術は、上述した入力のサブセットを考慮するように単純化される。例えば、推定チャネル損失確率、SSD、及び分散を考慮する代わりに、本技術は、推定チャネル損失確率のみを考慮するように構成されうる。このように、IRレート制御は、IRレートを決定するために、ビデオコンテンツにアクセスする必要さえもなくなる。代わりに、IRレートは、推定チャネル損失確率のみによって決定され、ほとんどのビデオシーケンスのために動作するように調整することができる。この限定された技術は、それほど効果的ではないかもしれないが、複雑さを低減するために望ましいかもしれない追加オプションを提供する。
図3は、典型的な適応性IR技術の動作を例示するフローチャートである。図3の例では、IRレート制御ユニット48は、ビデオエンコーダ20のため1又は複数の選択されたシステム設定パラメータを決定する(50)。上述したように、例えば、IRレート制御ユニット48は、ビデオエンコーダ20のために選択されたイントラフレーム周期、フレームレート、データレート、及びフレームサイズを決定する。その後、IRレート制御ユニット48は、推定チャネル損失確率(52)と、SSD値によって表されるフレーム変化(54)と、ピクセル変化によって表されるテクスチャ(56)とを受け取る。上述したように、推定チャネル損失確率は、様々な方法で決定されうる。
推定チャネル損失確率、フレーム変化とテクスチャ、及びオプションとしての1又は複数のシステム設定パラメータに基づいて、IRレート制御ユニット48は、新たなIRレートを計算し(58)、現在のフレーム又はMBに関する事前モードIR決定の生成(60)のためにそのIRレートをモード選択ユニット46に渡す。説明するように、フレームレベル実装では、IR決定は、周期的IR(CIR)、適応性IR(AIR)、又はランダムIR(RIR)スキームによって実行されうる(60)。CIRスキームによれば、MBは、周期的なパターンでリフレッシュされる。AIRスキームは、イントラリフレッシュするMBを選択するために、例えば分散のようなテクスチャ情報に基づいて個々のMBを評価しうる。RIRは、イントラリフレッシュする個々のMB、又はMBのグループをランダムに選択することを含む。
各々の場合において、イントラリフレッシュされるMBの数は、IRレート制御ユニット48によって計算される(58)IRレートに対応する。AIR、RIA、又はCIRとAIRとRIRとの局面を結合するハイブリッドIRは、イントラリフレッシュの局在化を阻止することができる。ハイブリッドIRスキームは、チャネル歪みを低減するために、近隣MB及びフレームにおけるイントラコード化されたMBと、インターコード化されたMBとの間の品質差を最小にしながら、周期的及び適応性リフレッシュストラテジの利益を組み合わせる。
特定のフレームのためのモード決定が、イントラコード化という結果になるのであれば(62)、ビデオエンコーダ20は、例えばH.264のような空間推定を実行する(64)。モード決定が、インターコード化の結果になるのであれば(62)、ビデオエンコーダ20は、動作推定及び空間推定を実行し(66)、例えば、図2のインターコーダ32を用いて、事後モード決定を生成する(68)。その後、この処理は、推定チャネル損失確率、SSD、及び分散におけるあらゆる変化に基づいて、IRレートの調節のために、次のフレーム又はMBに進む。特に、図3に示すように、イントラコード化決定は、何れの動作推定もが実行される前になされる。
IRレートを決定するために、本明細書に記載したような入力が与えられると、IRレート制御ユニット48は、例えば、Z. He、 J. Cai、及びCW. Chenによる"Joint source channel rate- distortion analysis for adaptive mode selection and rate control in wireless video coding"、 IEEE Transactions on Circuits and Systems for Video Technology, Volume: 12 , Issue: 6 , June 2002, pages: 511 - 523(非特許文献1)に記載されたような、与えられた目標コード化ビットレートRのためにレート歪みモデルを適用するように構成されうる。レート歪みモデルの適用は、以下のように表現されうる。
Figure 0004728339
合計歪みDtotalを最小化するために、以下の方程式を満たさなければならない。
Figure 0004728339
IRレートβを決定するために、以下の方程式が使用される。
Figure 0004728339
βを[0,30%]にとどめる。ここで、
−D(D=ソース歪み、D=チャネル歪み)は、隣接フレーム間のSSDによって表され、潜在的な誤り伝搬を定量化する。
−Varは分散であり、現在のフレームの複雑さと、イントラコード化の費用とを定量化する。
−pは推定チャネル損失確率である。
−a,b,c,及びdは定数である。

Figure 0004728339
は、再構築された前のフレームである。
−F(n)は、現在のフレームである。
IRレート制御ユニット48は、インター/イントラコード化を決定するために、結果として得られたIRレートβを、モード選択ユニット46に適用する。これは、フレームレベル又はMBレベルにおいてなされる。上述したように、βは、反復又は徹底的な探索ではなく、クローズフォームソリューションを用いて得られる。この相対的な単純性は、IRレート制御ユニット48の実装における複雑さを著しく低減する。
上記のアプローチによって複雑さが比較的低減されるが、複雑さの更なる低減は、代替実装によって達成されうる。一例として、IRレート制御モジュール48は、チャネル適応スキームのみを適用するように構成されうる。ここでは、IRレートβが、
Figure 0004728339
のように、推定チャネル損失確率にのみ基づいて決定される。ここで、Cは定数である。更なる代替例として、IRレート制御ユニット48は、
Figure 0004728339
のように、IRレートβを決定するために、動作補償の実行後、絶対差合計(SAD)数的指標を適用するように構成されうる。ここで、SADは、SSDの代わりに使用され、歪みDを表す。Cは、他の定数である。
従来システムでは、イントラ/インターモードの決定は、最小の絶対差合計(SAD)という点において、与えられたMBに対する最良の動作ベクトルを見つけるために、動作推定探索が実行された後になされる。この従来のアプローチは、動作ベースのイントラ/インターモード決定とも称される。しかしながら、本開示に従って、適応性MBイントラリフレッシュ(AIR:adaptive MB Intra-refreshing)スキームは、動作探索エンジンで実行される集約的計算をする必要なく、イントラ/インターモード決定を可能にする。
また、動作ベースのイントラ/インターモード決定の代わりに、モード選択ユニット46は、分散に依存するテクスチャベースのイントラ/インターモード決定アルゴリズムを適用するように構成されうる。Pフレーム用のM個のMBのための望ましいリフレッシュレートβが与えられると、モード選択ユニット46は、イントラコード化されるMBとなる、最も少ないテクスチャ情報、すなわち、最も少ないコード化ビット要求を持つMBを選択する。テクスチャベースのイントラ/インターモード決定のステップは、各MBについて、以下のように表される。
1.MB分散を計算する。例えば、テクスチャの推定を与える。
2.計算された分散を、前のフレームから推定された平均分散、例えば、前のフレームからの平均テクスチャビットと比較する。
3.前のフレームのスケールされた平均分散よりも分散が小さい場合にはMBをイントラコードし、そうでない場合には、MBをインターコード化する。
4.イントラコード化されたMBの数が、フレームのイントラリフレッシュレートβを満足するのであれば、テクスチャベースのイントラ−インターモード決定プロセスを停止する。
5.フレーム内の残りのMBに対して、動作ベースのモード決定プロセスを適用する。その結果、更にMBがイントラコード化される。
テクスチャベースのモード決定プロセスはまた、以下の擬似コードによっても表される。
Figure 0004728339
ここで、Aは、現在のMBの分散、Bは、前のフレームの平均分散、αは、経験的なしきい値、mode_Intraは、テクスチャベースのモード決定を用いてイントラコード化されたMBのカウンタ、Mは、例えばIRレート制御ユニット48によって決定されるような、Pフレーム内のイントラコード化されたMBの望ましい数である。動作推定プロセスは、標準的な動作推定と、動作ベースのイントラ/インター決定とを表す。DCT量子化は、例えば図2の変換ユニット38及び量子化ユニット40による標準的なDCT変換及び量子化の適用を表す。
図4は、テクスチャベースのイントラ/インターコード化決定プロセスを例示するフロー図である。図4に示すように、IRレート制御ユニット48は、例えば上述したように、推定チャネル損失確率、SSD、及び分散を用いて、テクスチャベースのIRレートを生成する(70)。その後、モード選択ユニット46は、テクスチャベースのイントラ/インターモード決定を行うために、IRレートを適用する(71)。テクスチャベースのイントラ/インターモード決定(71)が、イントラコード化を求める場合、イントラコーダ34が選択され、イントラコード化されたMBが差分ユニット36、及び変換ユニット38によるDCT符号化に適用される(74)。
モード選択ユニット46によるテクスチャベースの決定が、イントラコード化を示さないのであれば、ビデオエンコーダ20は次に、例えば図2のインターコーダ32内で、整数−ピクセル動作推定探索をMBに提供し(76)、標準的な動作ベースのイントラ/インターモード決定を適用する(78)。イントラコード化が示される場合(80)、イントラコード化されたMBが、DCT符号化(74)のために提供される。イントラコード化が、動作ベースのイントラ/インターモード決定によって示されない場合(80)、このMBは、標準的な動作補償に提供される。特に、ビデオエンコーダ20は、動作補償(84)が後に続く半ピクセル動作推定探索(82)を適用する。その後、結果として得られるインターコード化された予測が、差分ユニット36に適用される。その後、DCT符号化(74)が続く。
本明細書で記載したように、MBがインターコード化されるか、又はイントラコード化されるかを決定するためにテクスチャベースのアルゴリズムを用いることは、連続フレーム内でイントラコード化されたMBの繰り返しパターン、すなわち、フレーム内の同じ場所においてイントラコード化されたMBという結果になる。近隣のフレーム間の一般に高い時間的相関によって反復が生じる。一般に、反復は、誤り伝播を阻止するための望ましい機能ではない。特に、誤りは、一般に本質的にランダムであり、フレーム内の異なる領域(MB)に生じる。
繰り返しパターンを阻止するために、モード選択ユニット46は更に、ランダムアルゴリズムを適用するように構成されうる。この場合、モード選択ユニット46は、連続したフレームにおいて、異なる領域、すなわち「グリッド」を探索することによって、イントラコード化されたMBの選択をランダム化する。この技術は、グリッドベースの適応性IR(AIR)と称されうる。このグリッドベースのAIR技術によれば、Pフレームは、複数の等しい領域へ分解される。連続したフレームでは、テクスチャベースのイントラ−インター決定における考慮のために先ず、異なる領域が選択される。
図5は、テクスチャベースのイントラ/インターコード化決定プロセスをサポートするために、3つの異なる探索グリッドA,B,Cに分割されたビデオフレームFを例示する図である。フレームFは、例示目的のために3つのグリッドA,B,Cを含んでいる。従って、異なるグリッドサイズに加えて、より多く又はより少ない数のグリッドが、異なる実装において利用されうる。グリッドベースのAIR処理は、上述したように、テクスチャベースのイントラ/インター決定プロセスに用いるために、グリッドA,B,Cのうちの1つを選択するために適用される。
特定のグリッドA,B,Cを選択すると、テクスチャベースのイントラ/インター決定プロセスは、選択されたグリッドに限定されるか、又は他のグリッドの考慮前のグリッド内で少なくとも開始する。選択されたグリッドが、フレームのために適用可能なIRレートを満足するのに十分なイントラコード化MBを生むのであれば、テクスチャベースのイントラ/インターコード化決定のために他のグリッドを探索する必要はない。しかしながら、選択されたグリッド及びその他のグリッド内のMBは、動作ベースのイントラ/インターコード化決定のプロセスのために再検討されうる。
何れの場合でも、連続フレーム内のテクスチャベースのイントラ/インターコード化決定の開始のため、異なるグリッドA,B,Cを選択することによって、連続フレームにおいて局在化された領域内でイントラコード化されたMBの反復及び集中を阻止することができる。言い換えると、フレーム毎に探索グリッドをローテーションさせることによって、フレームからフレームへのイントラコード化MBの持続的な局在化を阻止することができる。また、MBの異なるグリッドA,B,Cの選択及びローテーションは、実装の複雑さが比較的低いことを示す。
一例として、各フレーム中に99のMBを備えた1/4共通中間フォーマット(QCIF)フレームの場合、このフレームは、以下に示すように、3つの等しいMBのグリッドA,B,Cに分割されうる。
A[0−32],
B[33−65],及び
C[66−98]。
ここで[i,i]は、グリッド境界を示し、iは、開始MBのインデクス、iは、終了MBのインデクスである。また、与えられたフレーム内の3つのグリッドの指定は、例示の目的のためであり、限定して考慮されるべきではない。また、グリッドは、異なるパターンでローテーションされうる。例えば、1つのフレームにおいてグリッドAを選択することは、AからB,Cへの連続したローテーションではなく、次のフレームにおいてグリッドCを選択することが続く。
図6は、異なる一様な適応性IR探索グリッドによる9つのPフレームF1〜F9のシーケンスを例示する図である。図6は、フレームからフレームへの探索グリッドのローテーションを例示する。これによって、連続フレームにおけるテクスチャベースのイントラ/インターコード化決定プロセスのための開始点として同一の探索グリッドが使用されなくなる。例えばフレームF1では、テクスチャベースのイントラ/インターコード化決定プロセスは、選択されたグリッドAにおいて始まる。次のフレームF2では、この決定プロセスは、異なるグリッドBにおいて始まる。同様に、次のフレームF3では、異なるグリッドCが選択される。このように、選択されたグリッドは、初めの3つのフレームF1,F2,F3にわたってフレーム毎にローテーションする。その後、このプロセスは、各フレームF4,F5,F6においてそれぞれ選択されたグリッドA,B,Cによって示されるように、次の3つのフレームについて繰り返す。また、各フレームF7,F8,F9においてそれぞれ選択されたグリッドA,B,Cによって示されるように、次の3つのフレームについて繰り返す。
例えばF1からF3のように、3つの連続したPフレームのサイクルにおいて、このプロセスは、テクスチャベースの動作決定を用いて、フレームF1内でイントラコード化されるグリッドA内のM個(M<33)のMBを選択することによって始まる。その後、次のPフレームF2について、グリッドBにおけるM個のMBが、イントラコード化されるとして選択され、第3のフレームF3については、グリッドCにおけるM個のMBが選択される。この処理は、グリッドA,B,C,A,B,C,A,B,Cといったパターンを用いて、次の3つのPフレームであるF4〜F6について繰り返され、更に、次の3つのフレームF7〜F9について繰り返される。3つの連続したPフレームからなるサイクルはそれぞれ、図6においてX、Y、Zで示されている。
また、このプロセスは、3つの連続したPフレームにおける同じ場所におけるMBのイントラリフレッシュを阻止する。しかしながら、3つのPフレームF1〜F3の最初のサイクルXの後、イントラリフレッシュされたMBは、再び、最初のサイクルにおける同じ場所において生じうる。特に、Pフレームにおける次の2つのサイクルY,ZであるF4〜F6、及びF7〜F9においてそれぞれ同じグリッドが選択される。Pフレームにおける全てのMBをリフレッシュする確率を高めるために、各MBのためのイントラ/インターモード決定が、IRが実行されるグリッド内にのみ格納される。このように、MBのためのイントラリフレッシュの反復があまりに早くなることが回避される。
図5及び図6の例では、グリッドベースのAIR技術は、各フレームを3つの一様サイズのグリッドに分割する。図7は、異なる、非一様な適応性IR探索グリッドを持つ9つのPフレームのシーケンスを例示する図である。3つのフレームF1,F2,F3からなる第1のシリーズXでは、それぞれ等しいサイズのグリッドA,B,Cが、IR決定プロセスのために選択される。フレームF4,F5,F6からなる第2のシリーズYでは、個々のグリッドA,B,Cのサイズが異なっている。具体的には、図7の例では、フレームF4のグリッドAは、フレームF1のグリッドAよりも実質的に小さく、フレームF5のグリッドBは、フレームF2のグリッドBよりも実質的に大きい。さらに、フレームF6のグリッドCは、フレームF3のグリッドCよりも実質的に小さい。3つのフレームF7,F8,F9からなる次のシリーズZでは、グリッドBが最も小さいグリッドであり、小さい順に従って、次にグリッドC及びグリッドAが続く。
図7に示すように、連続したフレームシリーズ間の非均一なグリッドサイズに基づくアプローチは、フレーム毎の同じ場所においてイントラコード化されたMBの反復に対する追加測定を提供する。ある場合には、開始グリッドのサイズは、十分に小さく、テクスチャベースのイントラ/インター決定プロセスが、別のグリッドに拡張されることが保証される。フレームF6では、例えば、開始グリッドCが非常に小さいので、IRレートは、そのグリッド内のMBの数を超えるだろう。この場合、テクスチャベースのイントラ/インター決定プロセスは、指定された次のグリッドへ達する。これは、実装に依存して、フレームF6におけるAグリッド又はBグリッドのうちの何れかになりうる。
別のオプションとして、ハイブリッドIR(HIR)スキームが、例えばCIR,AIR,RIRのような単一のIRタイプの代わりに使用されうる。一例として、ハイブリッドIRスキームは、CIRとAIRとの両方の局面を組み合わせうる。その結果、改善された誤り回復性能、及び良好な視覚品質となる。例えば、高IRレートを伴う周期的IRのみを用いることによって、連続したフレームにおいて、気に障る、波のような視覚アーチファクト(artifact)が生じる。一方、AlRにのみ依存することは、可能なIRのためフレーム中のすべてのMBの検討を可能にしないかもしれない。周期的リフレッシュパターン及び適応性リフレッシュパターンの利点を組み合わせるハイブリッドIRスキームは、CIR又はAIRのみの場合に対して改良された性能を提供することができる。
このハイブリッドIRスキームによれば、IRレートの割合は、CIRとAIRとの間に分布する。CIRに約束されたIRレートの割合は、標準的なCIRスキームによって実現される。ここでは、MBは、予め定めたパターンへ連続的及び周期的にイントラリフレッシュされる。本明細書で記載しているように、AIRに約束されたIRレートの割合は、適応性IRスキームによって実現される。ここでは、テクスチャベースのイントラ/インター決定プロセスが、フレーム内の個々のMBに適用される。AIRについては、より低い分散を有するMBが、イントラリフレッシュのために好適に選択される。対照的に、テクスチャ情報は、一般に、CIRには重要ではない。ハイブリッドIRスキームでは、CIR及びAIRが組み合わされ、高い性能を提供する。
図8は、CIRスキーム及びハイブリッドIRスキームの比較実験結果を例示するグラフである。図8のグラフは、5つの異なるIRスキームの、ブロック誤り率(BLER)と、ピーク信号対雑音比(PSNR)とをプロットしている。10%IRレートにおける限定的なCIRである第1のスキームの性能は、曲線96で表される。曲線98は、合計5%のIRレートに対して2%CIRと3%AIRとを組み合わせたハイブリッドスキームの性能を示す。曲線100,102,104はそれぞれ、CIR/AIRが7/3,3/7,5/5の割合であるハイブリッドスキームの性能結果を示す。図8のグラフは、15fps及び48kbpsで符号化されたQCIFフレームシーケンス(母−娘)の結果を示す。
図9乃至図12は、様々なIR技術に対する比較実験結果を例示する追加グラフである。図9乃至図12のグラフの条件は以下の通りである。符号化レート=48Kbps、イントラフレーム周期400、フレーム長さ150、PSNRはdBで測定。各場合では、複数のビデオシーケンスが使用される。
図9では、曲線106,108,110,112,114はそれぞれ、Foremanシーケンスに対する400からなるイントラフレーム周期での(1)0パーセントIR、(2)5パーセント標準RIR、(3)10パーセント標準RIR、(4)本明細書に記載の推定チャネル損失確率、SSD、及び分散を用いた適応性RIR、(5)推定チャネル損失確率のみを用いた適応性RIRの結果を示す。図10は、図9と同じ実験を示すが、母−娘シーケンスの結果を示す。
図11及び図12では、曲線116,118,120,122,124はそれぞれ、(1)0パーセントIR、(2)5パーセント標準RIR、(3)10パーセント標準RIR、(4)最適適応性RIR、(5)動作補償後にSAD数的指標を用いた適応性RIRの結果を示す。最適適応性RIRスキームは、近似や置き換えのない正確な測定を用いる。図11及び図12は共に、Foremanシーケンス及び母−娘シーケンスのための400からなるイントラフレーム周期に関する。
図13は、別の実施形態に従ったイントラフレーム周期に従ってIR調節を例示する図である。一般に、本出願は、イントラフレーム周期が比較的長い場合について、チャネル適応性アプローチ又はビデオコンテンツ、及びチャネル適応性アプローチを用いたIRレートの調節を記載した。より短い周期でイントラフレームがより頻繁に使用される場合、MB IRレートを低減することができる。従って、本開示は更に、ビデオコンテンツ及びチャネル条件のみならず、イントラフレーム周期に基づいてIRレートの調節を検討する。この場合、推定チャネル損失確率、フレーム対フレーム変化、及びイントラフレームテクスチャを用いて生成されたIRレートは更に、一般的なイントラフレーム周期に従って調節される。
長いイントラ周期の場合、IRレートは一般にβと表され、推定チャネル損失確率はpと表され、イントラフレーム周期はIと表され、調節されたIRレートはβと表される。イントラフレーム周期による調節は、イントラフレーム周期Iの3つの異なる領域130,132,134に関して説明される。領域130,132,134では、イントラフレーム周期はそれぞれ、1/(2p)未満、1/(2p)と2/pとの間、2/p超である。これらの領域では、推定チャネル損失確率、フレーム対フレーム変化、及びイントラフレームテクスチャに基づき決定されたIRレートβは、更に、以下に示すようなイントラフレーム周期Iの関数として調節される。
Figure 0004728339
ここで、fは、現在のフレームと、最直近のイントラフレームとの間の距離であり、1≦f≦I−1である。
イントラフレーム周期Iが十分大きい場合、IRレートβは、調節される必要はない。Iが十分小さい場合、MB IRは、必要ではない。その他の場合では、IRレートは、最直近のイントラフレームに対する現在のフレームの距離に従って、直線的に減衰する。このアプローチは、現在のフレームが更に、次のイントラフレームリフレッシュから遠ざかるときを認識する。このフレームは、潜在的な誤り伝播に起因する性能劣化を低減するために、イントラMBを用いてより確実に保護されるべきである。
図14及び図15は、図13において例示するような技術を用いた様々なIR技術に対する実験結果を例示するグラフである。図14及び図15において、曲線136,138,140,142,144はそれぞれ、(1)0パーセントIR、(2)5パーセント標準RIR、(3)10パーセント標準RIR、(4)本明細書で説明した推定チャネル損失確率、SSD、及び分散を用いた適応性RIR、(5)推定チャネル損失確率のみを用いた適応性RIRに対する結果を表す。
図14及び図15では、比較的短いイントラフレーム周期が適用される。しかしながら、図14は、Foremanシーケンスを表す一方、図15は、母−娘シーケンスを表す。図14及び図15は、イントラフレーム周期が小さい(15フレーム)場合におけるIR性能を例示する。2%の損失レートでは、MB IRは使用されない。4%および6%の損失レートでは、図13に関して上述したように、βに対するイントラリフレッシュ周期調節式に従って決定される。図14及び図15における結果は、短いイントラフレーム周期でかつ低損失レートの場合において、MBレベルIRがどのようにして体裁良くバックオフできるかを実証する。
様々な実施形態が記載された。これら及び他の実施形態は、特許請求の範囲のスコープ内である。
図1は、ビデオ符号化及び復号システムを例示するブロック図である。 図2は、本開示に従った適応性IR技術を使用するビデオエンコーダシステムを例示するブロック図である。 図3は、典型的な適応性IR技術の動作を例示するフロー図である。 図4は、テクスチャベースのイントラ/インターコード化決定プロセスを例示するフロー図である。 図5は、テクスチャベースのイントラ−インターコード化決定プロセスをサポートするために3つの異なる探索領域に分割されたビデオフレームを例示する図である。 図6は、異なる一様な適応性IR探索領域を持つ9つのPフレームのシーケンスを例示する図である。 図7は、異なる非一様な適応性IR探索領域を持つ9つのPフレームのシーケンスを例示する図である。 図8は、周期的IR(CIR)及びハイブリッドIR制御技術のための相対的実験結果を例示するグラフである。 図9は、様々なIR制御技術の相対的実験結果を例示する追加のグラフである。 図10は、様々なIR制御技術の相対的実験結果を例示する追加のグラフである。 図11は、様々なIR制御技術の相対的実験結果を例示する追加のグラフである。 図12は、様々なIR制御技術の相対的実験結果を例示する追加のグラフである。 図13は、イントラフレーム周期に従ったIR制御を例示する図である。 図14は、図13に例示したような技術を使用した様々なIR技術に対する実験結果を例示するグラフである。 図15は、図13に例示したような技術を使用した様々なIR技術に対する実験結果を例示するグラフである。

Claims (34)

  1. ビデオ符号化方法であって、
    現在のフレームと別のフレームとの間のフレーム対フレーム変化の測定値を得ることと、
    前記現在のフレームのテクスチャを得ることと、
    前記フレーム対フレーム変化及び前記テクスチャに基づいて、前記現在のフレームのイントラリフレッシュ(IR)レートを生成することとを含み、
    前記フレーム対フレーム変化が大きいほど、前記現在のフレームのIRレートを大きくし、前記テクスチャ値が、前記現在のフレーム内のピクセルレベル分散によって決定され、前記分散が大きいほど、前記現在のフレームのIRレートを小さくする方法。
  2. 前記フレーム対フレーム変化の測定値を得ることは、前記現在のフレームと前記別のフレームとの差分平方和(SSD)を得ることを含み、前記テクスチャは、前記現在のフレーム内のテクスチャ複雑さを特徴付ける請求項1の方法。
  3. 前記ピクセルレベル分散値、前記現在のフレーム内のピクセル変化に基づく請求項1の方法。
  4. チャネル損失確率の推定値を得ることを更に含み、
    前記IRレートを生成することは、前記チャネル損失確率の推定値、前記フレーム対フレーム変化の測定値、及びテクスチャ複雑さに基づいて前記現在のフレームのIRレートを生成することを含む請求項1の方法。
  5. 前記チャネル損失確率の推定値を得ることは、遠隔端末から受信した制御メッセージを用いて、又は、遠隔端末によって送信された情報の損失に基づいて前記推定値を得ることを含む請求項4の方法。
  6. 前記IRレートに基づいて、前記現在のフレーム内の全てのマクロブロック(MB)についてインターコード化又はイントラコード化を選択することを更に含む請求項1の方法。
  7. 前記IRレートに基づいて、前記現在のフレーム内の個々のマクロブロック(MB)についてインターコード化又はイントラコード化を選択することを更に含む請求項1の方法。
  8. フレーム毎ベースで前記IRレートを更新することを更に含む請求項1の方法。
  9. 前記現在のフレーム内のマクロブロック毎ベースで前記IRレートを更新することを更に含む請求項1の方法。
  10. 前記現在のフレーム内の複数のグリッドであって、
    各々が、前記現在のフレーム内のマクロブロック(MB)のサブセットを含む複数のグリッドのうちの1つを選択することと、
    前記IRレートを適用し、前記選択されたグリッド内のマクロブロック(MB)のためにイントラコード化を選択することと
    を更に含む請求項1の方法。
  11. 連続する複数のフレームのうちの各々における異なるグリッドを選択することを更に含み、
    前記グリッドの各々は、実質的に等しい数のMBを含む請求項10の方法。
  12. 連続する複数のフレームのうちの各々における異なるグリッドを選択することを更に含み、
    前記グリッドは、異なる数のMBを含む請求項10の方法。
  13. マクロブロック(MB)に関連したテクスチャ及び前記IRレートに基づいて、前記現在のフレーム内の前記MBのためにインターコード化又はイントラコード化を選択することを更に含む請求項1の方法。
  14. 前記MBに関連したテクスチャに基づく前記MBの選択と、前記MBの周期的パターンの選択との組み合わせに基づいて、前記現在のフレーム内の前記MBのためにインターコード化又はイントラコード化を選択することを更に含む請求項13の方法。
  15. イントラフレーム周期に基づいて前記IRレートを調節することを更に含む請求項1の方法。
  16. 現在のフレームのテクスチャと、前記現在のフレームと別のフレームとの間のフレーム対フレーム変化の測定値とに基づいて、前記現在のフレームのイントラリフレッシュ(IR)レートを生成するIRレート制御ユニットと、
    前記IRレートに基づいて、前記現在のフレーム内のマクロブロック(MB)のためにインターコード化又はイントラコード化を選択するモード選択ユニットとを備え
    前記IRレート制御ユニットは、前記フレーム対フレーム変化が大きいほど、前記現在のフレームのIRレートを大きくし、前記テクスチャ値が、前記現在のフレーム内のピクセルレベル分散によって決定され、前記分散が大きいほど、前記現在のフレームのIRレートを小さくするビデオエンコーダ。
  17. 前記フレーム対フレーム変化は、前記現在のフレームと前記別のフレームとの差分平方和(SSD)であり、前記テクスチャは、前記現在のフレーム内のテクスチャ複雑さを特徴付ける請求項16のビデオエンコーダ。
  18. 前記ピクセルレベル分散値、前記現在のフレーム内のピクセル変化に基づく請求項16のビデオエンコーダ。
  19. 前記IRレート制御ユニットは、前記現在のフレームと別のフレームとの間のフレーム対フレーム変化の測定値、前記現在のフレームのテクスチャ、及び推定されたチャネル損失確率に基づいて前記IRレートを生成する請求項16のビデオエンコーダ。
  20. 前記チャネル損失確率の推定値は、遠隔端末から受信した制御メッセージ、又は、遠隔端末によって送信された情報の損失に基づく請求項19のビデオエンコーダ。
  21. 前記モード選択ユニットは、前記IRレートに基づいて、前記現在のフレーム内の全てのマクロブロック(MB)についてインターコード化又はイントラコード化を選択する請求項16のビデオエンコーダ。
  22. 前記モード選択ユニットは、前記IRレートに基づいて、前記現在のフレーム内の個々のマクロブロック(MB)についてインターコード化又はイントラコード化を選択する請求項16のビデオエンコーダ。
  23. 前記IRレート制御ユニットは、フレーム毎ベースで前記IRレートを更新する請求項16のビデオエンコーダ。
  24. 前記IRレート制御ユニットは、前記現在のフレーム内のマクロブロック毎ベースで前記IRレートを更新する請求項16のビデオエンコーダ。
  25. 前記モード選択ユニットが、前記現在のフレーム内の複数のグリッドであって、各々が、前記現在のフレーム内のマクロブロック(MB)のサブセットを含む複数のグリッドのうちの1つを選択し、前記IRレートを適用し、前記選択されたグリッド内のマクロブロック(MB)のためにイントラコード化を選択する請求項16のビデオエンコーダ。
  26. 前記モード選択ユニットは、連続する複数のフレームのうちの各々において異なるグリッドを選択し、前記グリッドの各々は、実質的に等しい数のMBを含む請求項25のビデオエンコーダ。
  27. 前記モード選択ユニットは、連続する複数のフレームのうちの各々における異なるグリッドを選択し、前記グリッドは、異なる数のMBを含む請求項25のビデオエンコーダ。
  28. 前記モード選択ユニットは、MBに関連したテクスチャ及び前記IRレートに基づいて、前記現在のフレーム内の前記MBのためにインターコード化又はイントラコード化を選択する請求項16のビデオエンコーダ。
  29. 前記モード選択ユニットは、前記MBに関連したテクスチャに基づく前記MBの選択と、前記MBの周期的パターンの選択との組み合わせに基づいて、前記現在のフレーム内の前記MBのためにインターコード化又はイントラコード化を選択する請求項16のビデオエンコーダ。
  30. 前記IRレート制御ユニットは、イントラフレーム周期に基づいて前記IRレートを調節する請求項16のビデオエンコーダ。
  31. ビデオエンコーダ内のプロセッサに対して、
    現在のフレームと別のフレームとの間のフレーム対フレーム変化の測定値を得ることと、
    前記現在のフレームのテクスチャを得ることと、
    前記フレーム対フレーム変化及び前記テクスチャに基づいて、前記現在のフレームのイントラリフレッシュ(IR)レートを生成することと
    をさせる命令を備え
    前記命令は、前記フレーム対フレーム変化が大きいほど、前記現在のフレームのIRレートを大きくさせ、前記テクスチャ値が、前記現在のフレーム内のピクセルレベル分散によって決定され、前記分散が大きいほど、前記現在のフレームのIRレートを小さくさせるコンピュータ読取可能媒体。
  32. 前記プロセッサに対して、前記フレーム対フレーム変化を、前記現在のフレームと前記別のフレームとの差分平方和(SSD)として得ることをさせる命令を更に備え、
    前記テクスチャは、前記現在のフレーム内のテクスチャ複雑さを特徴付ける請求項31のコンピュータ読取可能媒体。
  33. 前記ピクセルレベル分散値、前記現在のフレーム内のピクセル変化に基づく請求項31のコンピュータ読取可能媒体。
  34. 前記プロセッサに対して、
    チャネル損失確率の推定値を得ることと、
    前記チャネル損失確率の推定値、前記フレーム対フレーム変化、及び前記テクスチャに基づいて前記IRレートを生成することと
    をさせる命令を更に備える請求項31のコンピュータ読取可能媒体。
JP2007536953A 2004-10-12 2005-10-12 デジタルビデオ符号化のための適応性イントラリフレッシュ Active JP4728339B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US61838304P 2004-10-12 2004-10-12
US60/618,383 2004-10-12
US11/025,297 2004-12-28
US11/025,297 US8948266B2 (en) 2004-10-12 2004-12-28 Adaptive intra-refresh for digital video encoding
PCT/US2005/037072 WO2006042323A2 (en) 2004-10-12 2005-10-12 Adaptive intra-refresh for digital video encoding

Publications (2)

Publication Number Publication Date
JP2008516561A JP2008516561A (ja) 2008-05-15
JP4728339B2 true JP4728339B2 (ja) 2011-07-20

Family

ID=35636952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007536953A Active JP4728339B2 (ja) 2004-10-12 2005-10-12 デジタルビデオ符号化のための適応性イントラリフレッシュ

Country Status (6)

Country Link
US (1) US8948266B2 (ja)
EP (1) EP1805997B1 (ja)
JP (1) JP4728339B2 (ja)
KR (1) KR20070072578A (ja)
CN (1) CN101138250B (ja)
WO (1) WO2006042323A2 (ja)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8549574B2 (en) 2002-12-10 2013-10-01 Ol2, Inc. Method of combining linear content and interactive content compressed together as streaming interactive video
US9077991B2 (en) * 2002-12-10 2015-07-07 Sony Computer Entertainment America Llc System and method for utilizing forward error correction with video compression
US8979655B2 (en) 2002-12-10 2015-03-17 Ol2, Inc. System and method for securely hosting applications
US20100166056A1 (en) * 2002-12-10 2010-07-01 Steve Perlman System and method for encoding video using a selected tile and tile rotation pattern
US9314691B2 (en) 2002-12-10 2016-04-19 Sony Computer Entertainment America Llc System and method for compressing video frames or portions thereof based on feedback information from a client device
US9108107B2 (en) 2002-12-10 2015-08-18 Sony Computer Entertainment America Llc Hosting and broadcasting virtual events using streaming interactive video
US9192859B2 (en) 2002-12-10 2015-11-24 Sony Computer Entertainment America Llc System and method for compressing video based on latency measurements and other feedback
US9227139B2 (en) 2002-12-10 2016-01-05 Sony Computer Entertainment America Llc Virtualization system and method for hosting applications
US8366552B2 (en) * 2002-12-10 2013-02-05 Ol2, Inc. System and method for multi-stream video compression
US20090118019A1 (en) 2002-12-10 2009-05-07 Onlive, Inc. System for streaming databases serving real-time applications used through streaming interactive video
US8711923B2 (en) 2002-12-10 2014-04-29 Ol2, Inc. System and method for selecting a video encoding format based on feedback data
US9446305B2 (en) 2002-12-10 2016-09-20 Sony Interactive Entertainment America Llc System and method for improving the graphics performance of hosted applications
US10201760B2 (en) 2002-12-10 2019-02-12 Sony Interactive Entertainment America Llc System and method for compressing video based on detected intraframe motion
US8526490B2 (en) 2002-12-10 2013-09-03 Ol2, Inc. System and method for video compression using feedback including data related to the successful receipt of video content
US9061207B2 (en) * 2002-12-10 2015-06-23 Sony Computer Entertainment America Llc Temporary decoder apparatus and method
US9138644B2 (en) * 2002-12-10 2015-09-22 Sony Computer Entertainment America Llc System and method for accelerated machine switching
US8964830B2 (en) 2002-12-10 2015-02-24 Ol2, Inc. System and method for multi-stream video compression using multiple encoding formats
US9237347B2 (en) * 2005-03-21 2016-01-12 The Regents Of The University Of California Systems and methods for video compression for low bit rate and low latency video communications
CN101406099B (zh) 2006-03-20 2013-03-27 松下电器产业株式会社 无线通信移动台装置以及无线通信方法
JP2009540636A (ja) * 2006-06-09 2009-11-19 トムソン ライセンシング ビデオ・ピクチャを符号化するためにビット・バジェットを適応的に求める方法及び装置
US8443398B2 (en) * 2006-11-01 2013-05-14 Skyfire Labs, Inc. Architecture for delivery of video content responsive to remote interaction
US8375304B2 (en) * 2006-11-01 2013-02-12 Skyfire Labs, Inc. Maintaining state of a web page
US8711929B2 (en) * 2006-11-01 2014-04-29 Skyfire Labs, Inc. Network-based dynamic encoding
US9247260B1 (en) 2006-11-01 2016-01-26 Opera Software Ireland Limited Hybrid bitmap-mode encoding
US8233023B2 (en) * 2007-01-06 2012-07-31 Samsung Electronics Co., Ltd Method and apparatus for controlling intra-refreshing in a video telephony communication system
US8630512B2 (en) * 2007-01-25 2014-01-14 Skyfire Labs, Inc. Dynamic client-server video tiling streaming
US8737485B2 (en) * 2007-01-31 2014-05-27 Sony Corporation Video coding mode selection system
US20080247468A1 (en) * 2007-04-05 2008-10-09 Interuniversitair Microelektronica Centrum Vzw (Imec) Method and system for performing rate control adapted to channel conditions
US9168457B2 (en) 2010-09-14 2015-10-27 Sony Computer Entertainment America Llc System and method for retaining system state
NZ585901A (en) * 2007-12-05 2012-02-24 Onlive Inc System and method for compressing video based on detected intraframe motion
US8406296B2 (en) * 2008-04-07 2013-03-26 Qualcomm Incorporated Video refresh adaptation algorithms responsive to error feedback
US8780986B2 (en) * 2008-06-06 2014-07-15 Apple Inc. Refresh pixel group selection and coding adjustment
KR20090129926A (ko) * 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
JP5400876B2 (ja) * 2008-06-16 2014-01-29 ドルビー ラボラトリーズ ライセンシング コーポレイション ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化
US20100014715A1 (en) * 2008-07-17 2010-01-21 Siou-Shen Lin Image processing apparatus having texture information consideration and method thereof
US8724707B2 (en) * 2009-05-07 2014-05-13 Qualcomm Incorporated Video decoding using temporally constrained spatial dependency
US9113169B2 (en) * 2009-05-07 2015-08-18 Qualcomm Incorporated Video encoding with temporally constrained spatial dependency for localized decoding
CN101998101A (zh) * 2009-08-31 2011-03-30 中兴通讯股份有限公司 可视电话的视频数据接收和发送系统、视频数据处理方法
US8477846B2 (en) * 2009-10-07 2013-07-02 Ittiam Systems (P) Ltd. System and method for adaptive intra refresh rate setting in a video encoder
JP5667364B2 (ja) * 2010-02-10 2015-02-12 株式会社メガチップス 画像符号化装置
US9426477B2 (en) * 2010-02-25 2016-08-23 International Business Machines Corporation Method and apparatus for encoding surveillance video
JP2011233991A (ja) * 2010-04-26 2011-11-17 Hitachi Consumer Electronics Co Ltd 符号化装置および符号化方法
CN102271250B (zh) * 2010-06-01 2013-04-17 杭州华三通信技术有限公司 一种帧内宏块刷新方法和装置
US20120057629A1 (en) 2010-09-02 2012-03-08 Fang Shi Rho-domain Metrics
US20120106632A1 (en) * 2010-10-28 2012-05-03 Apple Inc. Method and apparatus for error resilient long term referencing block refresh
SI2636218T1 (sl) 2010-11-04 2021-12-31 Ge Video Compression, Llc Kodiranje slike, ki podpira združevanje blokov in preskakovalni način
WO2012108919A2 (en) * 2011-02-11 2012-08-16 Intel Corporation Media stream over pass through mechanism
US9025672B2 (en) * 2011-05-04 2015-05-05 Cavium, Inc. On-demand intra-refresh for end-to end coded video transmission systems
GB2492329B (en) 2011-06-24 2018-02-28 Skype Video coding
GB2492330B (en) 2011-06-24 2017-10-18 Skype Rate-Distortion Optimization with Encoding Mode Selection
GB2492163B (en) 2011-06-24 2018-05-02 Skype Video coding
US8902248B1 (en) 2011-07-14 2014-12-02 Vmware, Inc. Method and system for measuring display performance of a remote application
GB2493777A (en) 2011-08-19 2013-02-20 Skype Image encoding mode selection based on error propagation distortion map
GB2495467B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495468B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495469B (en) 2011-09-02 2017-12-13 Skype Video coding
KR102171788B1 (ko) * 2011-11-11 2020-10-29 지이 비디오 컴프레션, 엘엘씨 적응적 분할 코딩
KR101904457B1 (ko) 2011-11-11 2018-10-04 지이 비디오 컴프레션, 엘엘씨 분할 코딩을 이용한 효과적인 예측
EP4161078A1 (en) 2011-11-11 2023-04-05 GE Video Compression, LLC Effective wedgelet partition coding using spatial prediction
EP2777286B1 (en) 2011-11-11 2017-01-04 GE Video Compression, LLC Effective wedgelet partition coding
US9100636B2 (en) * 2012-09-07 2015-08-04 Intel Corporation Motion and quality adaptive rolling intra refresh
US9674265B2 (en) 2013-11-04 2017-06-06 Vmware, Inc. Filtering unnecessary display updates for a networked client
US9674518B2 (en) * 2013-12-20 2017-06-06 Vmware, Inc. Measuring remote video display with embedded pixels
US9699247B2 (en) 2014-06-17 2017-07-04 Vmware, Inc. User experience monitoring for application remoting
CN105765973B (zh) * 2015-03-31 2018-06-08 深圳市大疆创新科技有限公司 一种图像编码的方法及编码装置
CN106488229B (zh) * 2015-09-01 2022-01-21 恩智浦美国有限公司 具有可调整帧内刷新率的视频编码器
EP3809700B1 (en) * 2019-10-16 2022-02-16 Axis AB Periodic intra refresh pattern for video encoding
EP3829169B1 (en) * 2019-11-29 2021-10-13 Axis AB Method for intra refresh encoding of a plurality of image frames using convex and concave distribution functions

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07298272A (ja) * 1994-04-28 1995-11-10 Canon Inc 映像符号化装置
JP2000308065A (ja) * 1999-04-22 2000-11-02 Matsushita Electric Ind Co Ltd 動画伝送装置
JP2001359102A (ja) * 2000-06-12 2001-12-26 Matsushita Electric Ind Co Ltd 画像符号化方法及び画像符号化装置
JP2002522984A (ja) * 1998-08-07 2002-07-23 ノキア モービル フォーンズ リミテッド ワイヤレス送信用の適応デジタル映像コーデック

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5057916A (en) 1990-11-16 1991-10-15 General Instrument Corporation Method and apparatus for refreshing motion compensated sequential video images
US5754754A (en) * 1995-07-26 1998-05-19 International Business Machines Corporation Transmission order based selective repeat data transmission error recovery system and method
US5991403A (en) * 1996-12-23 1999-11-23 Intel Corporation Recoverable cryptographic transformation on YUV data suitable for compressions
CN1217852A (zh) * 1997-02-13 1999-05-26 三菱电机株式会社 动态图象预测方式
JP3063715B2 (ja) * 1997-12-19 2000-07-12 日本電気株式会社 画像圧縮装置
US7072398B2 (en) * 2000-12-06 2006-07-04 Kai-Kuang Ma System and method for motion vector generation and analysis of digital video clips
JP4644939B2 (ja) 2001-01-17 2011-03-09 日本電気株式会社 動画像符号化装置および動画像符号化方法
US20030012287A1 (en) 2001-03-05 2003-01-16 Ioannis Katsavounidis Systems and methods for decoding of systematic forward error correction (FEC) codes of selected data in a video bitstream
US6671322B2 (en) * 2001-05-11 2003-12-30 Mitsubishi Electric Research Laboratories, Inc. Video transcoder with spatial resolution reduction
US6842484B2 (en) 2001-07-10 2005-01-11 Motorola, Inc. Method and apparatus for random forced intra-refresh in digital image and video coding
US7020203B1 (en) 2001-12-21 2006-03-28 Polycom, Inc. Dynamic intra-coded macroblock refresh interval for video error concealment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07298272A (ja) * 1994-04-28 1995-11-10 Canon Inc 映像符号化装置
JP2002522984A (ja) * 1998-08-07 2002-07-23 ノキア モービル フォーンズ リミテッド ワイヤレス送信用の適応デジタル映像コーデック
JP2000308065A (ja) * 1999-04-22 2000-11-02 Matsushita Electric Ind Co Ltd 動画伝送装置
JP2001359102A (ja) * 2000-06-12 2001-12-26 Matsushita Electric Ind Co Ltd 画像符号化方法及び画像符号化装置

Also Published As

Publication number Publication date
EP1805997A2 (en) 2007-07-11
WO2006042323A3 (en) 2006-09-08
EP1805997B1 (en) 2013-07-10
US8948266B2 (en) 2015-02-03
CN101138250B (zh) 2011-09-28
WO2006042323A2 (en) 2006-04-20
KR20070072578A (ko) 2007-07-04
CN101138250A (zh) 2008-03-05
US20060078051A1 (en) 2006-04-13
JP2008516561A (ja) 2008-05-15

Similar Documents

Publication Publication Date Title
JP4728339B2 (ja) デジタルビデオ符号化のための適応性イントラリフレッシュ
US8873626B2 (en) Template matching for video coding
KR100942395B1 (ko) 다층 비디오 설계를 위한 레이트 제어
US9609357B2 (en) Non-zero rounding and prediction mode selection techniques in video encoding
JP5350404B2 (ja) 早いマクロブロック・デルタqpの決定
KR101377883B1 (ko) 비디오 인코딩에서 넌-제로 라운딩 및 예측 모드 선택 기법들
US8150172B2 (en) Video coding mode selection using estimated coding costs
US7653130B2 (en) Method and apparatus for bit rate reduction in video telephony
US8406297B2 (en) System and method for bit-allocation in video coding
JP2010515305A (ja) 他のコーディングモードの情報を使用したコーディングモードの選択
MX2007011084A (es) Clasificacion de contenido para procesamiento multimedia.
WO2007084475A2 (en) Methods and apparatus for low complexity error resilient motion estimation and coding mode selection
CN108989818B (zh) 一种图像编码参数调整方法及装置
KR100770873B1 (ko) 영상 부호화시 비트율 제어 방법 및 장치
KR100584366B1 (ko) 동영상 압축을 위한 부호화 시스템

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110414

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4728339

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250