JP6031106B2 - エラーのない基準フレームを使用したビデオリフレッシュ - Google Patents

エラーのない基準フレームを使用したビデオリフレッシュ Download PDF

Info

Publication number
JP6031106B2
JP6031106B2 JP2014528685A JP2014528685A JP6031106B2 JP 6031106 B2 JP6031106 B2 JP 6031106B2 JP 2014528685 A JP2014528685 A JP 2014528685A JP 2014528685 A JP2014528685 A JP 2014528685A JP 6031106 B2 JP6031106 B2 JP 6031106B2
Authority
JP
Japan
Prior art keywords
distortion
frame
mode
encoder
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014528685A
Other languages
English (en)
Other versions
JP2014525719A5 (ja
JP2014525719A (ja
Inventor
ジャオ,デイヴィッド
ニルソン,マティアス
ヴァフィン,レナート
イェフレモフ,アンドレイ
ヴァン アンダソン,ソレン
ヴァン アンダソン,ソレン
カールソン,ポンタス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2014525719A publication Critical patent/JP2014525719A/ja
Publication of JP2014525719A5 publication Critical patent/JP2014525719A5/ja
Application granted granted Critical
Publication of JP6031106B2 publication Critical patent/JP6031106B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • H04N19/166Feedback from the receiver or from the transmission channel concerning the amount of transmission errors, e.g. bit error rate [BER]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオ信号の部分を符号化するための符号化モードを選択するときにビットレートと歪みとの間のトレードオフのバランスをとることに関する。本発明は、特に(排他的にではないが)、符号化器がストリームをカメラなどから受信するとできるだけ早く該ストリームを送信のために動的に符号化しなければならない、ビデオ通話のストリームのようなビデオストリームをリアルタイムに符号化する場合、すなわちライブ・ビデオ・ストリームの場合に適用可能であり得る。
符号化されるべきビデオデータのストリームを図1Aに概略的に示す。ストリームは、各々が異なるそれぞれの瞬間におけるビデオ画像を表す複数のフレーム(F)を含む。当業者には既知であるように、符号化を目的として、各フレーム(F)は複数の部分に分割され、各部分も、より小さい複数の下位部分に細分化され、各部分または下位部分は、複数のピクセルを含む。たとえば、ある用語によれば、符号化されるべきビデオストリームの各フレームは複数のマクロブロック(MB)に分割され、各マクロブロックは、複数のブロックまたはサブブロック(b)に細分化され、各ブロックまたはサブブロックは複数のピクセルを含む。各フレームはまた、独立して復号可能なスライス(S)に分割され得、各スライスは1つまたは複数のマクロブロックを含む。図1Aに示す分割は例示を目的とした概略に過ぎないことに留意されたく、これらは必ずしも任意の実際の符号化方式に対応することを意味するものではなく、たとえば、各フレームはより多数のマクロブロックを含む可能性があることは了解されよう。
ビデオコード化が採用され得る例示的な通信システムを、図2のブロック図に概略的に示す。通信システムは、送信側の第1の端末12と、受信側の第2の端末22とを備える。たとえば、各端末12、22は、携帯電話もしくはスマートフォン、タブレット、ラップトップコンピュータ、デスクトップコンピュータ、またはテレビセット、セット・トップ・ボックス、ステレオシステムなどのような他の家庭用電化製品を含んでもよい。第1の端末12および第2の端末22は各々、通信ネットワーク32に動作可能に結合される。それにより、送信側の第1の端末12は、受信側の第2の端末22によって受信される信号を送信するように構成されている。無論、送信端末12は、受信端末22からの信号を受信することも、その逆も可能であり得るが、説明の目的のために、ここでは送信は第1の端末12の視点から説明し、受信は第2の端末22の視点から説明する。通信ネットワーク32は、たとえば、広域インターネットおよび/またはローカル・エリア・ネットワーク、および/またはモバイル・セルラ・ネットワークなどのパケットベースのネットワークを含んでもよい。
第1の端末12は、フラッシュメモリもしくは他の電子メモリ、磁気記憶装置、および/または光記憶装置のような記憶媒体14を含む。第1の端末12は、1つまたは複数のコアを有するCPUの形態の処理装置16と、少なくとも送信機18を有する有線または無線モデムのような送受信機と、端末12の残りの部分と同じ筐体内に収容されてもよいし、されなくてもよいビデオカメラ15も備える。記憶媒体14、ビデオカメラ15および送信機18は各々処理装置16に動作可能に結合されており、送信機18は有線または無線リンクを介してネットワーク32に動作可能に結合されている。同様に、第2の端末22は、電子、磁気、および/または光記憶装置のような記憶媒体24と、1つまたは複数のコアを有するCPUの形態の処理装置26とを備える。第2の端末は、少なくとも受信機28を有する有線または無線モデムのような送受信機と、端末22の残りの部分と同じ筐体内に収容されてもよいし、されなくてもよい画面25とを備える。第2の端末の記憶媒体24、画面25および受信機28は各々それぞれの処理装置26に動作可能に結合されており、受信機28は有線または無線リンクを介してネットワーク32に動作可能に結合されている。
第1の端末12にある記憶媒体14は少なくとも、処理装置16で実行されるように構成されているビデオ符号化器を記憶している。実行されると、符号化器は「生」の(符号化されていない)入力ビデオストリームをビデオカメラ15から受信し、ビデオストリームを符号化してよりビットレートの低いストリームに圧縮し、符号化ビデオストリームを送信のために送信機18および通信ネットワーク32を介して第2の端末22の受信機28に対して出力する。第2の端末22の記憶媒体は少なくとも、第2の端末22自体の処理装置26上で実行されるように構成されているビデオ復号器を記憶している。実行されると、復号器は、符号化ビデオストリームを受信機28から受信し、画面25に対する出力のために復号する。符号化器および/または復号器を指すために使用され得る一般用語が、コーデックである。
ビデオコーデックの目的は、可能な最高の品質を維持しながら、ビデオ信号を送信するのに必要とされるビットレートを低減することである。この目的は、統計冗長性(ビデオ信号の類似性)および知覚的非関連性(人間の視覚系の感度に関する)を利用することによって達成される。
今日のビデオコーデックのほとんどは、他のピクセルブロックからのピクセルブロックの予測、予測残差の変換、変換係数の量子化、および量子化指数のエントロピーコード化を含むアーキテクチャに基づく。これらのステップは、冗長性および非関連性を低減するのに寄与する。
以下の文献を参照する。
[1]ITU−T,Recommendation H.264、「Advanced video coding for generic audiovisual services」、2007年
[2]Zhang他、「Error resilience video coding in H.264 encoder with potential distortion tracking」、(Proc.IEEE International Conference on Image Processing、163−166頁、2004年)
予測は一般的に、現在のフレーム以外のビデオフレーム内のピクセルから(インター予測)、および、同じフレーム内のピクセルから(イントラ予測)実行することができる。すなわち、イントラフレーム符号化を使用して符号化される場合、フレームのブロック、サブブロックまたは他の部分(対象ブロックまたは部分)は、同じフレーム内の別のブロック、サブブロックまたは画像部分(基準ブロックまたは部分)に関連して符号化され、インターフレーム符号化を使用して符号化される場合、対象ブロックまたは部分は、別のフレーム内の基準ブロックまたは部分に関連して符号化される。この処理を、一般的に予測または予測コード化と称する。インターまたはイントラ予測モジュールはしたがって、たとえば、イントラフレーム符号化の場合には隣接するブロックまたはサブブロックの指示、および/または、インターフレーム符号化の場合は動きベクトルの形式で予測を生成する。一般的に、符号化器は、予測されたブロックと実際のブロック(または予測されたサブブロックと実際のサブブロックと、など)の間の「残った」差を表す残差信号をも生成する。その後、残差、動きベクトル、および、イントラ予測と関連付けられる任意の必要とされるデータが、一般的に、量子化器およびエントロピー符号化器のようなさらなるコード化段を介して、符号化ビデオストリーム内に出力される。したがって、ビデオ内のほとんどのブロックは、ブロック間の差に関して符号化され得、これによって符号化に必要とされるビットは、絶対ピクセル値を符号化するよりも少なく、したがって、ビットレートが節約される。イントラ予測符号化は一般的に、インター予測よりも多くのビットを必要とするが、それでも絶対値を符号化するのにまさる節約を示す。ビデオに関する適切なインターおよびイントラ符号化技法は当業者には既知であろう。
最新のコーデックは、フレーム内の異なる複数の部分に対して異なる複数の予測符号化モードを使用することを可能にする。異なる複数のコード化選択肢を有することが可能であることによって、ビデオコーデックのレート−歪み効率が増大する。すべてのフレーム領域に対して最適なコード化表現を見つけなければならない。一般的に、そのような領域は、たとえば、16×16ピクセルから成るマクロブロックである。すなわち、そのため、イントラ予測またはインター予測モードが各マクロブロックに対して個々に選択されることが可能であり、それによって、同じフレーム内の異なる複数のマクロブロックが異なる複数のモードで符号化されることができる。コーデックによっては、マクロブロックの異なる複数のレベルの区分化に基づいて、たとえば、マクロブロック内の各4×4サブブロックに対して別個の予測が実行されるより複雑なモードと、8×8もしくは8×16ブロックのみまたはさらにはマクロブロック全体に基づいて予測が実行されるより複雑でないモードとの間で選択して、異なる複数のモードを使用ことも可能である。利用可能なモードは、予測を実行するための異なる複数の選択肢をも含んでもよい。たとえば、図1Bに概略的に示すように、あるイントラモードにおいて、直上のサブブロックからの隣接するピクセルから下方に外挿することによって、または、直ぐ左にあるサブブロックから側方に外挿することによって、4×4サブブロック(b)のピクセルが決定されてもよい。コーデックによっては、「スキップモード」と呼ばれる別の特別な予測モードも提供されてもよく、これは代替的なタイプのインターモードと考えることができる。スキップモード(PSkip)においては、対象の動きベクトルが、その上および左にある動きベクトルに基づいて推定され、残差係数の符号化は行われない。動きベクトルが推定される方法は動きベクトル予測と一致しており、したがって、動きベクトル差はゼロであり、そのため、マクロブロックがスキップブロックであることを伝えるだけでよい。
図3は、送信端末12上に実装され得るような符号化器を概略的に示す高レベルブロック図である。符号化器は、離散コサイン変換(DCT)モジュール51と、量子化器53と、逆変換モジュール61と、逆量子化器63と、イントラ予測モジュール41と、インター予測モジュール43と、減算段(−)とを備える。符号化器は、スイッチ47と、モード選択モジュール49とをも備える。これらのモジュールの各々は、好ましくは、送信端末の記憶媒体14に記憶されているコードの一部分として実装され、その処理装置16で実行するように構成されているが、これらのいくつかまたはすべてが全体的にまたは部分的に専用ハードウェア回路内で実装される可能性は除外されない。
スイッチ47およびモード選択モジュール49の各々は、複数のマクロブロックMBを含む入力ビデオストリームのインスタンスを受信するように構成されている。モード選択モジュール49は、各マクロブロックについてコード化モード「o」を選択するように構成されており、マルチプレクサ47に動作可能に結合されており、それによって、マルチプレクサを、選択されているモードに適切であるように、逆量子化器63の出力をイントラ予測モジュール41またはインター予測モジュール43のいずれかの入力に通すように制御する。モード選択モジュール49は、選択されているモード「o」を関連する予測モジュール41、43に示し(たとえば、4×4区分化モード、8×8モード、スキップモードなどを示し)、次のフレームに関するモードの選択に使用するために予測モジュール41、43からフィードバックされる情報を受信するようにも構成されてもよい。イントラ予測モジュール41またはインター予測モジュール43の出力は、その後、減算段(−)の入力に結合され、減算段は、その他方の入力において符号化されていない入力ビデオストリームを受信して、予測されたブロックを、それらの符号化されていない相手から減算するように構成されており、したがって、残差信号を生成する。その後、残差ブロックは変換(DCT)モジュール51を通過し、そこで、それらの残差値が周波数領域に変換され、その後、量子化器53に至り、そこで、変換された値が離散的な量子化指数に変換される。量子化、変換された信号は逆量子化器63および逆変換モジュール61を通じてフィードバックされて、選択されている予測モジュール41、43によって使用するためのブロックまたはサブブロックの予測バージョン(復号器において分かるような)が生成される。予測モジュール41、43において使用される予測の指示、インター予測モジュール43によって生成された動きベクトル、ならびに、変換モジュール51および量子化モジュール53によって生成されている残差の量子化、変換された指数はすべて、一般的に、さらなる、エントロピー符号化器(図示せず)のような可逆符号化段を介して符号化ビデオストリーム内に含めるために出力され、予測値および変換、量子化された指数が、当該技術分野において既知の可逆符号化技法を使用してさらに圧縮され得る。
上記によれば、このように、コード化表現は、ブロック区分化情報、予測モード、動きベクトル、量子化精度などを含んでもよい。最適なコード化選択肢は、ビデオ内容、ビットレート、以前のコード化決定などに応じて決まる。変換係数の量子化の精度は一般的に、ビットレート制約を満たすように選択される。さらに、歪みは最小限に抑えられるべきである。
たとえば、H.264ビデオコーダは、予測モードを選択にあたって大きな柔軟性を提供する(非特許文献1)。ルマ成分のインター予測について、16×16ピクセルから成るマクロブロックが、16×16ピクセルから成る1つのブロック、または、16×8ピクセルから成る2つのブロック、または、8×16ピクセルから成る2つのブロック、または、8×8ピクセルから成る4つのブロックとして表現され得る。さらに、8×8ブロックが、8×8ピクセルから成る1つのブロック、または、8×4ピクセルから成る2つのサブブロック、または、4×8ピクセルから成る2つのサブブロック、または、4×4ピクセルから成る4つのサブブロックとして表現され得る。インター予測は、マクロブロックの各許可されている区分化に対して試行される。ブロックのインター予測は、一般的にサブピクセル予測によって推定される基準フレーム(複数の場合もあり)および動きベクトル(複数の場合もあり)をインデックス付けする(それぞれの基準フレーム内の基準ブロックから空間シフト)ことによって表現される。ルマ成分のイントラ予測について、16×16ブロックに対しては4つのモードの可能性があり、4×4サブブロックに対しては9つのモードの可能性がある。さらに、クロマ成分については4つのモードの可能性がある。最良の予測モードは、インター予測モードとイントラ予測モードとの性能を比較することによって選択される。
H.264 AVC(非特許文献1)のようなビデオコーデックのレート−歪み性能は、大体において、マクロブロックモード選択oの性能に応じて決まる。これは、たとえば、イントラモードまたはインターモードを使用してレート−歪みトレードオフについてマクロブロックが最良に符号化されているかを判定する手順である。ロバスト性の視点から、イントラコード化マクロブロックは、一時的なエラー伝播を止める(制約されたイントラ予測を使用する、すなわち、インター予測されたマクロブロックからのイントラ予測が禁止されると仮定して)ため、有益である。しかしながら、イントラコード化マクロブロックは概して、インターコード化マクロブロックと比較してレートに関してより費用がかかり、したがって、復号器における歪み(たとえば、平均歪み)が特定のビット配分およびチャネル状態を所与として最小限に抑えられるように、イントラコード化マクロブロックを系統的に導入することが重要である。Zhang他による非特許文献2は、復号器における予測される平均差分二乗和(SSD)の最小化に基づいてイントラコード化マクロブロックを導入するためのそのような系統的なフレームワークを提案している。潜在的な歪みをトラッキングすることによって、Zhang他は、符号化器レート−歪みループ内のインターマクロブロックの費用を計算するときにソースコード化歪みに付加される、予測エラー伝播歪み(復号器における)に関連するバイアス項を計算することが可能である。
レート−歪み性能最適化問題は、ビットレート制約Rの下で歪みを最小化することに関して定式化することができる。この問題を解決するためにラグランジュ最適化フレームワークが使用されることが多く、それに従って、最適化基準を以下のように定式化することができる。
J=D(m,o)+λR(m,o) (1)
式中、Jはラグランジュ関数であり、Dは歪みの量を表し(モードoおよびマクロブロックmまたはマクロブロック下位区分の関数)、Rはビットレートであり、λは歪みとレートとの間のトレードオフを定義するパラメータである。一般的に使用される歪み量は元のピクセルと再構築されたピクセルとの間の差分二乗和(SSD)、または、元のピクセルと予測されるピクセルとの間の差分絶対値和(SAD)である。
この応用において、ラグランジュ最適化問題を解くことは、ラグランジュ関数Jを最小化する符号化モードoを見つけることを意味し、このラグランジュ関数Jは、少なくとも歪みを表す項と、ビットレートを表す項と、それら2つの間のトレードオフを表す係数(「ラグランジュ乗数」)とを含む。符号化モードoがより完全なまたはより良好な品質の符号化モードに向かって変化するとき、歪み項Dは低減することになる。しかしながら、同時に、レート項Rは増大することになり、λに依存する特定の点において、Rの増大はDの低減を上回ることになる。したがって、式Jは何らかの最小値を有することになり、これが起こる符号化モードoが最適な符号化モードと考えられる。
この意味において、ビットレートR、またはむしろ項λRは、この項が、増大し続ける品質から最適な符号化モードを引き戻すという点において、最適化に制約を課す。この最適なバランスが見つかるモードはλに応じて決まり、したがって、λはビットレートと歪みとの間のトレードオフを表すと考えてもよい。
ラグランジュ最適化は、コード化選択決定のプロセスにおいて一般的に使用されており、すべてのフレーム領域(たとえば、16×16ピクセルから成るすべてのマクロブロック)に適用される。一般的に、歪みはすべての処理段を考慮にいれるように評価され得る。これらは予測、変換、および量子化を含む。さらに、再構築されたピクセルを計算するために、逆量子化、逆変換、および逆予測のステップを実行しなければならない。SSDは、結果としてSADと比較してより高い品質をもたらすため、歪み基準として好まれることが多い。一般的に、レートは、予測、および、量子化された変換係数[4]を既述するパラメータを含む、すべての必要とされるパラメータのコード化をも考慮に入れる。
Zhang他による非特許文献2において、著者は、ソースコード化だけでなくチャネルエラーにも起因する復号器内の潜在的な歪み、すなわち、信号がチャネルを介して送信されるときのデータの損失に起因して受けることになる、潜在的なる歪みをも推定している。推定された潜在的な歪みは、その後、モード選択をイントラコード化に向かってバイアスするのに間接的に使用される(チャネルエラーの可能性がある場合)。Zhangの「端から端まで」の歪みの式は、差分二乗和(SSD)歪み量に基づき、マクロブロックの損失についてベルヌーイ分布を仮定する。最適なマクロブロックモードooptは以下によって与えられる。
Figure 0006031106
式中、D(m,o)はマクロブロックmおよびマクロブロックモードoについての元のピクセルおよび再構築されたピクセルの間のSSD歪みを示し、Rは合計レートであり、λは歪みおよびレート項を関連付けるラグランジュ乗数である。Dep_ref(m,o)は、エラー伝播に起因する復号器内の基準マクロブロックにおける予測される歪みを示す。したがって、Dep_ref(m,o)は、エラー伝播歪みが大きくなりすぎる場合に最適化をイントラコード化に向かってバイアスするバイアス項をもたらす。Dep_ref(m,o)は、イントラコード化マクロブロックモードについてはゼロである。式D(m,o)+Dep_ref(m,o)+λR(m,o)は、ラグランジュ関数Jのインスタンスとみなされ得る。Argminは、式Jの値が最小値である引数oの値を出力する。
非特許文献2において、項Dep_ref(m,o)は物体の運動に従い、現在の動きベクトルを使用して総歪みマップから計算される。総予測エラー伝播歪みマップDepがエラー隠蔽の性能によって駆動され、各マクロブロックモード選択後に以下のように更新される。
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+p(Dec−rec(m(k),n,oopt)+Dec−ep(m(k),n)) (3)
式中、nはフレーム数であり、m(k)はマクロブロックmのk番目の下位区分(すなわち、ブロックまたはサブブロック)を示し、pはパケット損失の確率を示し、Dec−recは符号化器における再構築されたピクセルとエラー隠蔽されたピクセルとの間のSSDを示し、Dec−epは符号化器および復号器におけるエラー隠蔽されたピクセルの間の予測SSDを示す。
非特許文献2において、Depはフレームの各マクロブロックの上の4×4格子上に記憶され、すなわち、マクロブロックあたり16個のDepの値があり、そのため、各マクロブロックの4×4ピクセルサブブロックあたり1つのDepの値がある。図1Cに示すように、Dep_ref(m(k),o)、すなわち、時刻nにおけるフレームのマクロブロックm内のサブブロックkに関する予測エラー伝播基準歪みの計算は、このとき、時刻n−1からの先行するフレームからの4つのサブブロックからのDepの値の加重和として実行される。重みは、問題のブロックmの動きベクトルから求められる。すなわち、以下のようになる。
Figure 0006031106
式中、重みwは重複部分に比例し、q(k)は先行するフレームn−1内のマクロブロックqのサブブロックkを示す。
図1Cは、例示的なサブブロックb1...b4を参照した動きベクトルからの予測エラー伝播基準歪みおよび予測エラー伝播歪みマップの計算の図解を提供する(この例において、kはb1に対応し、iはb1...b4を通じてカウントする)。
ITU−T,Recommendation H.264、「Advanced video coding for generic audiovisual services」、2007年 Zhang他、「Error resilience video coding in H.264 encoder with potential distortion tracking」、(Proc.IEEE International Conference on Image Processing、163−166頁、2004年)
Zhang他による非特許文献2のプロセスは、チャネルにわたる損失の可能性に関して純粋に符号化器において行われる事前の確率論的仮定のみに基づく。
しかしながら、いくつかの既存の通信システムは、受信機から送信機に戻る特定の情報を報告する目的で、および/または制御の目的でフィードバック機構を提供する。たとえば、符号化器は、いずれのフレームが正確に復号器に到着したか、および/または、いずれのフレームが送信において喪失したかに関する戻り情報を受信し得、それに応答して、エラー伝播を遮断するためにイントラフレームを生成し得る。しかしながら、既存のメカニズムは、イントラフレーム全体の生成しかトリガせず、また、まだ確認応答されていないか、またはまだ喪失を報告されていないかのいずれかである他のフレームまたはフレームの部分の損失に起因して受ける可能性がある歪みの確率的推定を何ら組み込んでいないという点で単純に過ぎる。
Zhang他による非特許文献2によるアルゴリズムは、何らのフィードバックを使用する可能性または可用性をも考慮せずエラーのあるチャネルを介してビデオを送信するシナリオのみを考慮しており、そのため、Zhangのプロセスはチャネルの何らの実際の事後知識にも基づいていない。
他の視点から見ると、従来のフィードバックの使用は、イントラフレーム全体の生成のみをトリガし、フレーム内の個々の部分のレベルにおける(たとえば、マクロブロックごとの)モード選択はない。また、従来のフィードバックの使用は、チャネルにわたる可能性のある損失に起因して受けることになる歪みの推定を含まない。
他方、本発明者は、符号化器における損失適応的レート−歪み最適化プロセスにさらに適応し、それによって、Zhang他による方法と比較して全体的なレート−歪み性能を改善するために、復号器から符号化器へフィードバックされている情報、たとえば、パケットおよび/またはフレーム到着ステータスを利用することを提案する。
本発明の第1の実施形態は、短期基準および長期基準のシステムを利用することができる。たとえば、H.264標準規格は、特定の基準フレームをいわゆる「長期」基準としてマーキングする機能をサポートしている。これらの長期基準は明示的に削除されるまで復号画像バッファ内にあるままである。これは、復号画像バッファにおいて、新たな短期基準を最も古い短期基準フレームに上書きする「短期」基準フレームとは対照的である。
本発明の第1の実施形態によれば、フィードバック機構を使用して、復号器を、(いずれのフレームが喪失されたかに関する情報に加えて)いずれが復号器において利用可能な最近に確認応答された長期基準であるかにアウェアにすることができる。以下において、確認応答された基準とは、好ましくは、単にそれ自体が確認応答されている基準ではなく、確認応答されたエラーのない基準(すなわち、エラー伝播歪みが一切ない基準)を意味する。すなわち、この基準は、好ましくは、単に現在の基準がその履歴の厳密な確認応答なしに受信されたことが確認応答されているのとは対照的に、基準が受信されたものとして確認応答され、その基準の履歴内の関連するすべても受信されたものとして確認応答されており、それによって、エラー伝播がないと知ることができるという厳密な定義に従って確認応答されるべきである。それ自体が確認応答されているだけであるが、エラーのないブロックに対して符号化されているフレーム内の部分もエラーがない(伝播エラーがない)ことに留意されたい。
確認応答された長期基準フレームに基づくインター予測を使用して、イントラコード化と同様に、復号器内のエラー伝播を止めることができる。長期基準からのインター予測を使用する利点は、インター予測の結果、概して所与の歪みレベルに対してビットレートが低くなることである。
確認応答された長期基準をインター予測に利用することによって、本発明のこの第1の実施形態は、たとえば、Zhangによる非特許文献2のフレームワーク内で使用されるイントラコード化と同様に、しかし概してより低い関連するビットレートにおいてエラー伝播を止めることができるが、追加のマクロブロックコード化モードを利用可能にする。
Zhang他による非特許文献2によるアルゴリズムは、2つの異なるタイプのコード化モード、すなわちイントラおよびインターコード化のみを考慮する。その場合、式(3)内のエラー伝播基準歪みDep_ref(m,o)はイントラコード化マクロブロックモードについてのみゼロである。しかしながら、本発明の第1の実施形態は、利用可能なコード化モードのセットを拡大して、確認応答された長期基準からのインターコード化を含む。このとき、Dep_ref(m,o)はイントラコード化についてだけでなく、確認応答された基準からのインターコード化についてもゼロに設定される。そのようなコード化モードの利点は、イントラコード化と同様であるが、概してより低いビットレートにおいてエラー伝播を止めることができることである。
本発明の第1の実施形態の変形形態は、フィードバックがまだ受信されていない特定の基準(たとえば、長期基準)について、それにもかかわらず、この基準が、復号器からの中間報告に基づいてエラーのない確認応答された基準になる一定の確率を有するという着想を使用する。たとえば、確認応答されていない長期基準に基づくインター予測の使用を、確認応答されていない短期基準に基づくインター予測の使用から区別するまた別の利用可能な符号化モードが導入されてもよい。確認応答されていない長期基準について、損失の確率の事前の推定に応じて(すなわち、pはそれ自体はフィードバックに基づいていない)、および、確認応答されていない基準の履歴内の最後の(最近の)確認応答された長期基準からの時間(または同等にフレーム数)に基づいてエラー伝播歪みDep_ref(m,o)の推定は低減される。
第1の実施形態の別の変形形態において、パケットの往復時間(RTT)が復号画像バッファ内の長期基準の数と比較して十分に短い(往復時間とは、パケットが送信機から受信機へ進んで再び戻ってくるまでの時間である)とき、同じ概念を短期基準に適用してもよい。すなわち、十分に小さいRTTについて、代替的なまたは追加の可能性は、短期基準を確認応答されているものとして認識することであり、これは、その後、上述した、確認応答された長期基準と同様に使用することができる。ここでも式(3)に対して必要とされるアルゴリズムの変更は、Dep_ref(m,o)がイントラコード化についてだけでなく、確認応答された基準からのインターコード化についてもゼロに設定されることである。
また、確認応答はフレーム全体ベースである必要はないことに留意されたい。代わりに、これは、フレームの部分、たとえば、スライスのみに対する確認応答を受信し、確認応答もしくはそれがないこと(または受信されなかったことの明確な報告)に応じてそれらの異なる複数の部分を別様に処理するように構成されてもよい。
本発明の第2の実施形態において、パケットおよび/またはフレーム到着ステータスのような、復号器から符号化器へフィードバックされている情報が、復号器内の潜在歪みマップを調整し、それによって、Zhang他による方法と比較して全体的なレート−歪み性能を改善するために使用される。
第2の実施形態によれば、潜在エラー伝播歪みマップは、符号化器の復号画像バッファ内に各フレームまたはスライスと関連付けて(エラー隠蔽再構築歪みマップ、エラー隠蔽エラー伝播マップ、対応するモード決定および動きベクトル情報とともに)記憶される。この第2の実施形態は、その後、復号器からのフィードバック情報を、潜在歪みマップを更新するのに利用する。フィードバック情報は、精密な潜在歪みトラッキングを可能にし、より良好なレート−歪み性能をもたらす。
特定のフレームが復号器に到着したことを知らせるフィードバック情報を符号化器が受信した場合、エラー隠蔽寄与を式(3)内のエラー伝播歪みマップから削除することができる。逆に、特定のフレームまたはスライスが復号器において喪失したことを知らせるフィードバック情報が受信された場合、関連するエラー伝播歪みマップが、エラー隠蔽歪みからの寄与、すなわち、式(3)の右辺の第2の項および第3の項(pを用いて正規化されている)のみを含むように再計算される。
このとき、往復時間(RTT)が復号画像バッファ内の基準画像の数と比較して短い場合、時刻n−RTTにおける調整された潜在エラー伝播マップを、再帰的に式(3)を使用して時刻n−1におけるエラー伝播歪みマップに伝搬させることが可能である。このとき、時刻n−1における更新されたエラー伝播歪みマップは、モード選択プロセス(2)において使用される時刻nにおけるDep_refの計算を基礎とすることになる。この結果、潜在歪みマップのトラッキングがより正確になり、システムの全体的なレート−歪み性能が改善する。
上記は、いくつかの特定の例示的な実施形態を概説しているが、より一般的に、本発明は、以下に一致するシステム、コンピュータプログラム製品および装置を提供する。
本発明の一態様によれば、損失を伴うチャネルを介して受信端末にある復号器に送信するための送信端末の符号化器においてビデオストリームを符号化する方法が提供され、方法は、レート−歪み最適化プロセスであって、複数のフレームの各々の中の符号化されるべき複数の対象画像部分の各々について、対象画像部分に関する歪みの推定値および対象画像部分を符号化するのに必要とされるビットレートの量を含む関数を最適化することによって符号化モードセットのうちの好ましい符号化モードを選択することを含み、歪みの推定値はソースコード化歪み、および、チャネルにわたる起こり得る損失に起因して受けることになる歪みの推定値に基づく、レート−歪み最適化プロセスを実行することと、選択された符号化モードを使用して対象画像部分を符号化して符号化ビデオストリームにすることと、符号化ビデオストリームをチャネルを介して送信することとを含み、上記フレームのうちの現在のフレームに対するレート−歪み最適化プロセスは、上記フレームのうちの先行するフレームに基づいて受信端末から受信されるフィードバックに従って実行される。
上記フィードバックは、上記先行するフレームの少なくとも一部分が受信されたという確認応答、および、上記先行するフレームの少なくとも一部分が受信されなかったという報告のうちの一方を含んでもよい。
本発明の第1の実施形態において、符号化モードのセットは、確認応答された先行するフレームまたは先行するフレームの確認応答された部分内の対応する基準部分に対して対象画像部分を符号化する確認応答基準インター予測モードを含んでもよい。
確認応答基準インター予測モードは、基準部分が受信されたものとして確認応答され、それに対して基準部分が符号化されたあらゆるものも受信されたものとして確認応答されており、それによって、基準部分がエラー伝播を受けないと知ることができることを条件として、符号化モード選択に使用するために利用可能であり得る。
上記フィードバックに従う損失適応的レート−歪み最適化プロセスの実行は、上記確認応答を含むフィードバックが受信されていることを条件として損失に起因する歪みの推定値をなしに設定することを含んでもよい。
方法は、符号化器において復号器の符号化器側インスタンスを実行することと、符号化器において、復号器の符号化器側インスタンスによって再構築された基準画像データの形態の短期および長期基準を記憶している復号画像バッファを維持することとを含んでもよく、短期基準は連続したフレームによって自動的に上書きされてもよく、一方で長期基準は明確な削除コマンドの条件に基づいて削除されてもよく、確認応答基準インター予測モードは、受信端末において受信されたと確認応答されている復号画像バッファ内の長期基準のうちの対応するものに対して対象画像部分を符号化してもよい。
符号化モードのセットは少なくとも、イントラフレームモード、少なくとも1つの非確認応答インターフレーム符号化モード、および上記確認応答インター予測モードを含んでもよい。
符号化モードのセットは、復号画像バッファ内に記憶されている確認応答されていないフレームまたはフレームの一部分内の対応する長期基準に対して対象画像部分を符号化する非確認応答長期基準インター予測モードを含んでもよく、上記フィードバックに従う損失適応的レート−歪み最適化プロセスの実行は、推定損失確率、および、最後に確認応答された先行するフレームまたは先行するフレームの確認応答された部分からの時間に従って損失に起因する歪みの推定値を求めることを含んでもよい。
符号化モードのセットは、非確認応答短期基準インター予測モードをも含んでもよい。
方法は、符号化器において復号器の符号化器側インスタンスを実行することと、符号化器において、復号器の符号化器側インスタンスによって再構築された基準画像データの形態の短期および長期基準を記憶している復号画像バッファを維持することとを含んでもよく、短期基準は連続したフレームによって自動的に上書きされてもよく、一方で長期基準は明確な削除コマンドの条件に基づいて削除されてもよく、確認応答基準インター予測モードは、受信端末において受信されたと確認応答されている復号画像バッファ内の対応する短期基準に対して対象画像部分を符号化してもよい。
符号化モードのセットは、インター符号化基準部分からの対象画像部分のイントラ符号化を可能にする非制約イントラ符号化モードを含んでもよい。
本発明の第2の実施形態において、上記フィードバックに従う損失適応的レート−歪み最適化プロセスの実行は、上記フィードバックに従って、先行するフレームまたは先行するフレームの一部分に対する歪みの推定値を調整することと、調整された歪みの推定値を現在のフレームに関連する使用に対して伝搬させることとを含んでもよい。
上記フィードバックに従う損失適応的レート−歪み最適化プロセスの実行は、上記確認応答および上記報告のうちの少なくとも一方に従って、先行するフレームまたは先行するフレームの一部分に対する歪みの推定値を調整することと、調整された歪みの推定値を現在のフレームに関連する使用に対して伝搬させることとを含んでもよい。
起こり得る損失に起因して受けることになる歪みの推定値は、対象部分がチャネルにわたって到着する場合に、対象部分の予測が依存する対象部分の履歴内の基準部分が到着しないことに起因して受けることになる歪みの推定値を表す第1の寄与、および、隠蔽に起因して受けることになる歪みの推定値を表す第2の寄与に基づいてもよい。
第2の寄与は、対象部分がチャネルを通じて喪失された場合に対象部分の損失を隠蔽するのに使用されることになる画像部分に対する対象部分の隠蔽歪みの量を表す寄与、および、対象部分の隠蔽が依存する対象部分の履歴内の画像部分の損失に起因して受けることになる歪みの推定値を表す寄与を含んでもよい。
上記フィードバックに従う損失適応的レート−歪み最適化プロセスの実行は、上記確認応答を含むフィードバックが受信されていることを条件として、第2の寄与を先行するフレームに関するなしに設定すること、および、受信されていないという上記報告を含むフィードバックが受信されていることを条件として、第1の寄与を先行するフレームに関するなしに設定すること、のうちの一方または両方を含んでもよい。
本発明の別の態様によれば、損失を伴うチャネルを介して受信端末にある復号器に送信するためのビデオストリームを符号化するための送信端末が提供され、送信端末は、レート−歪み最適化プロセスを実行するように構成されている符号化器であって、レート−歪み最適化プロセスは、複数のフレームの各々の中の符号化されるべき複数の対象画像部分の各々について、対象画像部分に関する歪みの推定値および対象画像部分を符号化するのに必要とされるビットレートの量を含む関数を最適化することによって符号化モードセットのうちの好ましい符号化モードを選択することを含み、歪みの推定値はソースコード化歪み、および、チャネルにわたる起こり得る損失に起因して受けることになる歪みの推定値に基づき、当該符号化器は、選択された符号化モードを使用して対象画像部分を符号化して符号化ビデオストリームにするように構成されている、符号化器と、符号化ビデオストリームをチャネルを介して送信するように構成されている送信機とを備え、符号化器は、上記フレームのうちの現在のフレームに対するレート−歪み最適化プロセスが、上記フレームのうちの先行するフレームに基づいて受信端末から受信されるフィードバックに従って実行されるように構成されている。
実施形態において、符号化器は、上記方法の特徴のいずれかによる動作を実行するようにさらに構成されてもよい。
本発明の別の態様によれば、損失を伴うチャネルを介して受信端末にある復号器に送信するための送信端末の符号化器においてビデオストリームを符号化するためのコンピュータプログラム製品が提供され、コンピュータプログラム製品はコンピュータ可読媒体上で具現化され、送信端末上で実行されると、レート−歪み最適化プロセスであって、複数のフレームの各々の中の符号化されるべき複数の対象画像部分の各々について、対象画像部分に関する歪みの推定値および対象画像部分を符号化するのに必要とされるビットレートの量を含む関数を最適化することによって符号化モードセットのうちの好ましい符号化モードを選択することを含み、歪みの推定値はソースコード化歪み、および、チャネルにわたる起こり得る損失に起因して受けることになる歪みの推定値に基づく、レート−歪み最適化プロセスを実行する動作と、選択された符号化モードを使用して対象画像部分を符号化して符号化ビデオストリームにする動作と、符号化ビデオストリームをチャネルを介して送信する動作とを実行するように構成されているコードを備え、上記フレームのうちの現在のフレームに対するレート−歪み最適化プロセスは、上記フレームのうちの先行するフレームに基づいて受信端末から受信されるフィードバックに従って実行される。
実施形態において、コードは、実行されると、上記方法の特徴のいずれかによる動作を実行するようにさらに構成されてもよい。
本発明をより良く理解し、それがどのように実行され得るかを示すために、例として添付の図面を参照する。
ビデオストリームの概略図である。 いくつかのイントラ予測コード化モードの概略図である。 エラー伝播歪みの計算の概略図である。 通信システムの概略ブロック図である。 符号化器の概略ブロック図である。 復号器から符号化器へのフィードバックを利用するシステムの概略ブロック図である。
以下は、損失適応的レート−歪み最適化プロセスにさらに適応し、それによって、全体的なレート−歪み性能を改善するために、復号器から符号化器へフィードバックされている情報、たとえば、パケットおよび/またはフレーム到着ステータスを利用する符号化システムおよび方法を説明する。符号化器は、図3に関連して説明されているものと同様であるが、モード選択モジュール49が変更されている。これは、図1に示す種類のビデオストリームを符号化するのに使用され、図2のもののような通信システム内で実装され得る。
記載のように、モード選択は、ラグランジュ型関数を最適化(たとえば、最小化)することを含んでもよい。
J=D(m,o)+λR(m,o) (1)
式中、Jはラグランジュ関数であり、Dは歪みの量を表し(モードoおよびマクロブロックmまたはマクロブロック下位区分の関数)、Rはビットレートであり、λは歪みとレートとの間のトレードオフを定義するパラメータである。
従来の事例において、歪み項Dはソースコード化歪み、すなわち、量子化によって導入される歪みのような符号化器の欠陥に起因するもののみを考慮に入れる。これは、たとえば、パケットベースのネットワーク32にわたる送信におけるパケット損失に起因する、チャネルにわたるデータの損失に起因して導入され得る歪みは考慮に入れない。
他方、本発明およびZhangによる非特許文献2の技法のような損失適応的技法は、ソース符号化およびチャネルにわたるデータの損失に起因する歪みの両方を考慮に入れた「端から端まで」の歪みの量を定義するように試行する。所与の(対象)ブロック、マクロブロックまたはサブブロックに対する端から端までの歪みは、以下のように記述され得る。
D=(1−p)Darrival+pDloss (5)
式中、Darrivalは対象ブロックが復号器に到着する場合に受けることになる歪みの推定値であり、Dlossは対象ブロックが、チャネルにわたるパケット損失に起因して、たとえば、パケットベースのネットワーク32にわたるそのブロックを含むパケットの損失に起因して復号器に到着しない場合に受けることになる歪みの推定値である。パラメータpは、結果として問題のブロックまたは画像部分が喪失されることになる、チャネルにわたって発生する損失事象の確率の推定値、たとえば、パケット損失の確率の推定値である。便宜上、「ブロック」という用語は、本明細書の所々において、概して、フレーム区分の関連レベル(たとえば、H.264のような特定の標準規格のブロックまたはサブブロック)を指すために使用され得る。
arrivalは、ソースコード化歪みだけでなく、ブロックの過去の歪み、すなわち、対象ブロックがそこから予測されることになる1つまたは複数の基準ブロック内の歪みに起因して導入されることになる歪みも表す。それゆえ、Darrivalはソースコード化歪み項D、および、予測される対象ブロックの履歴内の歪み(すなわち、対象ブロック内に進むことになる対象ブロックの基準ブロック内の歪み)を表すエラー伝播歪み項Dep_refの両方を含む。
arrival=D+Dep_ref (6)
lossは隠蔽に起因する損失を含む。対象ブロックが受信されない場合、復号器は、以前に復号されたブロックの凍結、または1つまたは複数の復号に成功したブロックからの(現在のフレームおよび/または前のフレームのいずれかからの)補間もしくは外挿を含み得る隠蔽アルゴリズムを適用することになる。それゆえ、Dlossはこの隠蔽プロセスに起因する歪みと識別することができる。
loss=Dec (7)
そのため、式(5)を調べると、項Dは、損失がまったくない場合に受けることになる歪みの推定値を表し、項Decは、対象ブロックが喪失した場合に受けることになる歪みの推定値を表し、項Dep_refは、対象ブロックの受信に成功したがその履歴内の何かが喪失した場合(対象ブロックの基準ブロックが喪失した、または基準ブロックの基準ブロックが喪失した、などの場合)に受けることになる歪みの推定値を表す。
およびDep_refは符号化モード選択oの関数である。Decは、モード選択oの関数ではなく、そのため、ラグランジュ式から落とされている(依然として喪失されているため、喪失したブロックがどのように符号化されたかは問題にならない)。したがって、最適化は以下のように書くことができる。
Figure 0006031106
は、符号化器において知ることができる情報に基づく、たとえば、生の入力サンプル値sと再構築サンプル値
Figure 0006031106
との間の差に基づくため、決定論的である。符号化器は、符号化器側で復号器の並列インスタンス(またはそれに類するもの)を作動させる。図3におけるインター予測モジュール43を詳細に示す挿入図を参照されたい。インター予測モジュール43は、動き補償予測(MCP)ブロック44と、各サンプルインデックスiについて、予測サンプル
Figure 0006031106
と再構築残差
Figure 0006031106
とを組み合わせること、すなわち、
Figure 0006031106
によって再構築サンプル
Figure 0006031106
を求めるように構成されている加算段(+)とを備える。
インター符号化の場合、符号化器において、予測サンプル
Figure 0006031106
は、基準ブロック(対象フレームに対して動きベクトルの分だけずれている基準フレーム内の基準ブロック。まもなく再度説明される、図1Cを参照されたい)のサンプル
Figure 0006031106
と同じであり得る。
したがって、符号化器は、実際のサンプルsと、符号化器および復号器側に見られるような再構築サンプル
Figure 0006031106
との間の差を求めることができる(今までのところ、これは復号器において受けるさらなる歪みを導入することになる損失の可能性を無視している)。サンプルの差は、たとえば、以下の式における対象ブロックのすべてのサンプルインデックスiにわたる差分二乗和(SSD)エラーとして計算され得る。
Figure 0006031106
しかしながら、Dep_refは推定されていないままであり、これは、符号化データが(たとえば、パケットベースのネットワーク32にわたって)送信されることになるチャネルに関する何らかの推定を行うことに基づく。
これを達成するために、符号化器内のモード選択モジュール49は、最近に符号化されたフレーム内の各マクロブロックまたはマクロブロックの区分の歪みを記述するエラー伝播歪みマップDepを維持するように構成されてもよい。モード選択モジュール49は、対象ブロックが底から予測されることになる基準ブロックを含むパケットがチャネルにわたって喪失されることになる確率pを求め(、それゆえまた、パケットが到着する確率1−pを黙示的にまたは明示的に求め)るようにも構成される。確率pは、統計的モデル化に基づいて設計段階で事前決定されてもよく、この場合、モード選択モジュール49は、メモリ14から値を取り出すことによってpを決定する。一方、別の可能性として、モード選択モジュール49は、受信機22からのフィードバックに基づいてpを決定することもある。
エラー伝播マップは以下のように表され得る。
ep=(1−p)Dep_arrival+pDloss (9)
エラー伝播マップDepは、最近に符号化されたフレームのマクロブロックmまたはより好ましくは各下位部分(ブロックまたはサブブロック)m(k)に対する歪み推定値を含む。したがって、これはより明示的に以下のように書かれ得る。
ep(m(k))=(1−p)Dep_arrival(m(k))+pDloss(m(k)) (10)
式中、m(k)はマクロブロックmのk番目の下位部分(たとえば、サブブロック)を示し、pはパケット損失の確率を示す。
lossは上述のようにDecに等しい。Dep_arrivalはチャネルにわたる差、すなわち、符号化器における再構築サンプルと復号器における再構築との間の差を表す。たとえば、これは、差分二乗和(SSD)に関して量子化され得る。
Figure 0006031106
式中、
Figure 0006031106
はソースコード化歪みおよびチャネルに起因する歪みの両方を考慮に入れた、復号器において受信される(インデックスiの)サンプルである。すなわち、sは、生の符号化されていない入力サンプルであり、
Figure 0006031106
はソースコード化歪み(たとえば、量子化に起因する)を考慮に入れた、符号化器における再構築サンプルであり、
Figure 0006031106
は、チャネルの損失を伴う影響を含む合計の端から端までの歪みを考慮に入れたサンプルである。
Figure 0006031106
ep_arrivalは以下に拡張することができる。
Figure 0006031106
式中、
Figure 0006031106
は再構築残差のサンプルである。それゆえ、以下のようになる。
Figure 0006031106
そのため、式(9)に代入すると、エラー伝播マップは以下のように書き換えることができる。
ep=(1−p)Dep_ref+pDec (14)
または、
ep(m(k))=(1−p)Dep_ref(m(k))+pDec(m(k)) (15)
モード最適化問題を考慮すると、以下のようにも書かれ得る。
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+pDec(m(k),n,oopt) (16)
式中、nはフレーム数であり、すなわち、Dep(n+1)は、既存の決定ooptおよび先行する時刻nにおけるフレームに関する歪みDep(n)マップを所与として、時刻n+1におけるフレームに関してモード選択を行うために使用されることになるエラー伝播マップである。
Zhangによる非特許文献2にあるように、Dec項はまた、以下のように拡張され得る。
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+p(Dec−rec(m(k),n,oopt)+Dec−ep(m(k),n)) (3)
式中、Dec−recは符号化器における再構築されたピクセルとエラー隠蔽されたピクセルとの間のSSDを示し、Dec−epは符号化器および復号器におけるエラー隠蔽されたピクセルの間の予測SSDを示す。
式(3)を調べると、上記で説明したように、項Dep_refは、対象ブロックの受信に成功したがその履歴内の何かが喪失した場合(対象ブロックの基準ブロックが喪失した、または基準ブロックの基準ブロックが喪失した、などの場合)に受けることになる歪みを表す。さらに、Dec−recは、隠蔽アルゴリズム自体の性質に起因する歪み(予測に関する内因性のソースコード化歪みDにいくらか類似している)の推定値を表す。このとき、Dec−epは、両方の対象ブロックが喪失し(そのため、復号器において隠蔽される必要がある)、隠蔽された対象ブロックの履歴内の何かが喪失した場合(隠蔽がそこから行われるブロックが喪失した、または、そのブロックがそこから予測もしくは隠蔽されるブロックが喪失した、等の場合)に受けることになる歪みの推定値を表す。
そのため、歪みマップDepは、Dec−recおよび部分的にDec−epから生じる新たな損失に起因する寄与、ならびに、Dep_refおよび同じく部分的にDec−epから生じる過去の損失に起因する寄与を含む。
シーケンス内の最初のフレームについて、フレームは、イントラコード化を用いてコード化されることになり、この場合、Dep_ref=0で、それゆえDep=pDecである。
エラー隠蔽歪みDecはモード選択モジュール49によって計算される。項Dec−recは、隠蔽アルゴリズムの知識に基づき、使用される特定のエラー隠蔽アルゴリズムに応じて決まり得る。Dec−epは、Dep_refと同様に、たとえば、基本隠蔽アルゴリズムの場合は同じ位置にあるブロックの歪みをコピーすることによって、または、動きを外挿するように試みるより複雑な隠蔽が使用される場合は複数の以前に符号化されたブロックb1〜b4からの歪みの加重和を計算することによって(たとえば、下記の図1Cに関連する説明を参照されたい)、既存の(最近の)歪みマップに基づいて計算される。Decを計算する他の方法が使用され得、これは、符号化器内の再構築サンプルと、復号器に見られることになるようなエラー隠蔽されたサンプル(すなわち、喪失したフレームまたは領域を隠蔽するために以前に受信されたフレームまたは同じフレームの受信された領域からコピー、補間または外挿されたサンプル)との間の差の任意の推定値であり得る。
その後、モード選択モジュール49は、各後続のインター予測フレームに関するエラー伝播マップを、各モード選択決定後に更新することによって維持し、これはここで、既存のエラーマップの知識からDep_refを計算することを含む。インター予測(動き推定)の場合、Zhangによる非特許文献2に従って、これは、問題のフレームの動きベクトルを使用して行われる。
この一例が図1Cに示されている。4つの例示的なブロックb1、b2、b3およびb4が基準フレームF内に(時刻n−1において)示されており、基準フレームはすでに符号化されている。対象フレームFのブロック(後続の時刻nにおける)は、基準フレームFn−1から予測されることになる。たとえば、対象フレームF内の対象ブロックbを考える。この目的のために、動き予測モジュール44が、基準ブロックが基準フレームFn−1内のオフセット位置から対象フレームF内の対象ブロックb’の位置に平行移動されるときに、対象ブロックbの最良の推定値を与えるような、対象フレームF内の対象ブロックと基準フレームFn−1内の基準ブロック(点線で示す)との間のオフセットを定義する動きベクトルを求める。それゆえ、点線の基準ブロックは必ずしも基準フレームFn−1内のインデックス可能なブロックではなく、すなわち、必ずしも基準フレームの所定の下位区分ではなく、任意裁量の量だけずれていてもよい(事実、さらにはある分数のピクセルだけずれていてもよい)ことに留意されたい。したがって、基準ブロックは、4つの実際のインデックス可能なブロックb1、b2、b3およびb4からの寄与から構成されている。
したがって、エラー伝播マップDep(n+1)の更新に使用するためのDep_refを求めるためのモード選択モジュール49によって実行される既存の計算は、既存のマップDep(n)内のブロックまたはサブブロックb1〜b4に関して記録されている歪みの加重和を計算することを含む。
Figure 0006031106
またはより明示的には、
Figure 0006031106
式中、wはブロックまたはサブブロックbからの寄与を表す重みであり、Dep(i)はブロックまたはサブブロックbに対するエラー伝播マップエントリである。
上記は、最初のエラー伝播マップDepを求め、このエラー伝播マップを使用して後続のコード化のための最適なコード化モード決定ooptを選択し、このコード化決定を使用してマップDepを更新し、その後、更新されたマップを次のコード化決定に使用し、以下続く既存のプロセスを説明しており、エラー伝播マップは、チャネルにわたる損失の推定される影響を含む端から端までの歪みを表す。たとえば、再びZhangによる非特許文献2が参照される。これは、本明細書においては損失適応的レート−歪み最適化(LARDO)と称される。
しかしながら、Zhang他による非特許文献2のプロセスは、チャネルにわたる損失の可能性に関して純粋に符号化器において行われる事前の確率論的仮定のみに基づく。
本発明は、符号化器における損失適応的レート−歪み最適化プロセスにさらに適応し、それによって、全体的なレート−歪み性能を改善するために、復号器から符号化器へフィードバックされている情報、たとえば、パケットおよび/またはフレーム到着ステータスを利用することによって、Zhangにまさる改善を提供する。
図4は、本発明を実施するのに使用され得る符号化器および復号器から成るシステムを示す概略ブロック図である。好ましくは、符号化器は、送信端末12の記憶装置14および処理装置16内で具現化され、復号器は、受信端末22の記憶装置24および処理装置26内で具現化される。送信端末12の符号化器は、符号化モジュールと、復号器において実行されるような復号をミラーリングまたは近似する復号モジュールの符号化器側インスタンスとを備える。符号化モジュールは、順変換モジュール51および量子化器53、ならびに、可能性として、エントロピー符号化器(図示せず)のような1つまたは複数の他の段を備える。符号化器側復号モジュールは、逆量子化器63および逆変換モジュール61、ならびに、可能性として、エントロピー復号器のような他の段を備える。符号化器は、動き補償予測(MCP)モジュール44と、減算段(−)とをも備える。これらの符号化器要素の間の接続を説明するために、再び図3を参照する。
さらに、図3には図示されていないが、符号化器は、符号化器側復号モジュール61、63と動き補償予測モジュール44との間の経路内に接続されている復号画像バッファ65をも備える。復号画像バッファ65は、各々が短期基準または長期基準のいずれかを保持しているとマークされ得る複数の構成バッファ領域を備える。H.264において、長期基準を示すためにマーカが使用されている実際のバッファは1つしかない(しかし、他の実施態様における別個の専用の短期および長期バッファの可能性は除外されない)。図4において、復号画像バッファ65は、1つまたは複数の短期基準66、1つまたは複数の確認応答されていない長期基準67、および、1つまたは複数の確認応答された長期基準68を保持しているものとして示されている。
各構成バッファ領域は、1つまたは複数の以前に符号化されたフレームまたはスライスが再構築された(すなわち、符号化された後、符号化器において見られることになるようなフレームまたはスライスを表すように、復号モジュール符号化器側インスタンス61、63によって再び復号されている)ものを記憶するように動作可能である。以前に符号化されたフレームまたはスライスのこれらの再構築されたものは、現在のフレームまたはスライスのインター予測コード化における基準として使用するために提供される、すなわち、それによって、符号化されるべき対象ブロックがバッファ内の基準ブロックに対してコード化されることができる。
復号画像バッファ65は、短期基準66が、符号化されている各連続するフレームまたはスライスを用いて自動的に更新されるように構成されている。すなわち、各フレームまたはスライスが符号化されると、その後、新たなフレームまたはスライスの復号されたものが自動的に、以前に短期バッファ内に保持されていた別の少し前の基準フレームまたはスライスに上書きされる。好適な実施形態において、復号画像バッファ65は、複数の短期基準66を保持することができ、最も古い短期基準が常に、バッファ内で上書きされる基準である。これを行うために追加の条件は必要ない。
記載のように、H.264 AVC標準規格は、特定の基準フレームまたはスライスが長期基準67、68としてマークされることも可能にする。これらの長期基準は明示的に削除されるまで復号画像バッファ内にあるままである。すなわち、それらは、続いて符号化されるフレームまたはスライスによって自動的に上書きされず、代わりに、符号化器の別の動作または要素、たとえば、メモリ管理コマンドのような制御コマンドがトリガするという追加の条件に応じてのみ上書きまたは他の様態で削除される。制御コマンドは、いずれの動作を行うべきかを決定する符号化器のコントローラ(図示せず)によって発行されてもよい。長期バッファをクリアするためのコマンドが、スライスヘッダのような符号化ビットストリームのヘッダ内で復号器に送信されてもよい。同様の機能が、他の標準規格に組み込まれ得る。
受信端末24の復号器は、動き補償予測モジュール44、復号モジュール61、63、ならびに、対応する短期および長期基準66、67および68を記憶するように構成されている復号画像バッファ65の復号器側インスタンス44’、61’、63’、65’、66’、67’、および68’を備える。
受信端末24上の復号器は、フィードバックチャネルを介して送信端末12上の符号化器と通信するように構成されている。フィードバックは好ましくは、ビデオストリームが受信端末22に送信されるものと同じネットワーク32、たとえば、インターネットのような同じパケットベースのネットワークを介するが、代替的なフィードバック機構の可能性は除外されない。
例として、長期基準は以下のようにコントローラによって管理され得る。たとえば、復号画像バッファ内に2つの長期基準(たとえば、lt pos0およびlt pos1)を維持すると決定される。符号化される第1のフレーム(時刻t0における)がlt pos0内に置かれ得る。第1のフレームは復号器に到着することになり(1RTT後に復号器からのフィードバックが到着することになる)、それゆえ、lt pos0は最初はエラーなく確認応答されたとマークされることが仮定され得る。長期基準としてマークされる次のフレームは、時刻t0+RTTにおけるフレームであり、これはlt pos1に置かれる。lt pos1における基準が到着した(そして、エラー伝播を含まない)ことを示す復号器からのフィードバックを符号化器が得た場合、lt pos1はエラーなく確認応答されたとマークされ、次の長期基準フレーム(時刻t0+2RTT)がlt pos0に置かれる。このように、これらの2つの位置がピンポンバッファを形成し、エラーなく確認応答される1つの位置と、精査に一時的に使用される1つの位置とが常にある。このように、損失の場合からの回復フレームを生成するのに使用することができる、復号画像バッファ内のごく最近に確認応答されたエラーのない基準が常にあるべきである。原則として、長期基準フレームが現時点位置に近くなるほど、インターコード化は効率的になり、したがって、回復フレームは(ビットが)小さくなる。しかしながら、これは例として説明した、符号化器のコントローラが長期基準を管理するための使用のために構成され得る1つの戦略に過ぎず、画像バッファ内の長期基準および短期基準のシステムを管理する他の方法が可能である(たとえば、さらにより良好な方法は、より多くの長期基準を提供することである)ことは了解されよう。
図4の例示的な実施態様を参照すると、本発明は、復号器における復号画像バッファ65’に関する情報を含むためにフィードバックを考慮する。このフィードバックが与えられると、復号器は、たとえば、復号器内のいずれのフレームまたはスライスが、エラー伝播歪みを一切含むことなく復号されたかを知る。図4において、復号画像バッファ65内のエントリ68は、そのような確認応答されたエラーのないフレームを指す。復号画像バッファ65内のエントリ67は、確認応答されていないフレームを指す。フィードバック機構を使用して、復号器に、(いずれのフレームが喪失されたかに関する情報に加えて)いずれが復号器において利用可能な最近に確認応答された長期基準であるかを気付かせることができる。以下において、確認応答された基準とは、好ましくは、単にそれ自体が確認応答されている基準ではなく、確認応答されたエラーのない基準(すなわち、エラー伝播歪みが一切ない基準)を意味する。すなわち、この基準は、好ましくは、単に現在の基準がその履歴の厳密な確認応答なしに受信されたことが確認応答されているのとは対照的に、基準が受信されたものとして確認応答され、その基準の履歴内の関連するすべても受信されたものとして確認応答されており、それによって、エラー伝播がないと知ることができるという厳密な定義に従って確認応答されるべきである。それ自体が確認応答されているだけであるが、エラーのないブロックに対して符号化されているフレーム内の部分もエラーがない(伝播エラーがない)ことに留意されたい。
本発明の第1の実施形態によれば、確認応答された長期基準フレーム(またはスライス)に基づくインター予測を使用して、イントラコード化と同様に、復号器内のエラー伝播を止めることができる。長期基準からのインター予測を使用する利点は、インター予測の結果、概して所与の歪みレベルに対してビットレートが低くなることである。
確認応答された長期基準をインター予測に使用することによって、本発明の第1の実施形態は、たとえば、Zhangによる非特許文献2のフレームワーク内で使用されることになる、イントラコード化と同様に、しかし概してより低い関連するビットレートにおいてエラー伝播を止めることができるが、追加のマクロブロックコード化モードを利用可能にする。
Zhang他による非特許文献2によるアルゴリズムは、2つの異なるタイプのコード化モード、すなわちイントラおよびインターコード化のみを考慮する。その場合、式(3)において、エラー伝播基準歪みDep_ref(m,o)はイントラコード化マクロブロックモードについてのみゼロである。しかしながら、本発明の第1の実施形態は、利用可能なコード化モードのセットを拡大して、確認応答された長期基準からのインターコード化を含む。そのようなコード化モードの利点は、イントラコード化と同様であるが、概してより低いビットレートにおいてエラー伝播を止めることができることである。
上記で提示したアルゴリズムに対して必要な変更は、式(2)および(3)におけるエラー伝播基準歪みが、コード化モードが確認応答された基準フレームからのインター符号化であるときにもゼロに設定されることであり、すなわち、以下のとおりである。
Figure 0006031106
第1の実施形態の特定の変形例において、上記の例は以下のように変更することができる。符号化器が、たとえば、往復時間(RTT)に応じて決まる周期的な間隔をおいて、基準フレームを長期基準としてマークするシナリオを考える。したがって、復号画像バッファ65(図4に示す)は、ある瞬間において、短期基準66、「確認応答されていない」長期基準67、および確認応答された長期基準68を含むことになる。「確認応答されていない」長期基準67が厳密な定義に従って復号器において確認応答されるためには、確認応答されていない長期基準の前に損失がないこと、すなわち、確認応答された長期基準が一切のエラー伝播歪みなしに復号されたフレームであることが必要とされることになる。符号化器側において、いずれのフレームが復号器によって受信されたかに関する情報を搬送するフィードバックが受信される。符号化器がいずれのフレームが(確認応答されていない)長期基準としてマークされているかを正確に知っており、パケットまたはフレーム損失確率の推定値pを有することを所与として、確認応答されていない長期基準が確認応答された長期基準に変換することになる確率のモデルを設定することが可能である。フレーム損失確率がpであり、2つの長期基準の間に既知のまたは所定の間隔Lがある場合、確認応答されていない長期基準が確認応答されることになる事前の確率は(1−p)である。漸進的に、肯定的なフィードバック情報が受信され、たとえば、復号器がそれまでにL個のフレームのうちのlを受信しているとき、長期基準が確認応答されることになる確率は(1−p)から(1−p)L−lに変化する。ここで、記載の確率モデルを使用して、以下のように、上記のDep_ref(m,o)について式を一般化することができる。
Figure 0006031106
式中、Dep_LTref(m(k))は確認応答されていない長期基準(単純にそのフレームのDepのコピー)に対する予測されるエラー伝播を示す。
したがって、第1の実施形態のこの変形例は、確認応答されていない長期基準に基づくインター予測の使用を、確認応答されていない短期基準に基づくインター予測の使用から区別するまた別の符号化モードを導入する。フィードバックがまだ受信されていない特定の長期基準について、それにもかかわらず、これは、復号器からの中間報告に基づいてエラーのない確認応答された基準になる一定の確率を有する。確認応答されていない長期基準について、それゆえ、損失の確率の事前の推定に応じて(すなわち、pはそれ自体はフィードバックに基づいていない)、および、確認応答されていない基準の履歴内の最後の(最近の)確認応答された長期基準からの時間(または同等にフレーム数)に基づいてエラー伝播歪みDep_ref(m,o)の推定は重み付けされ得る。重みは、推定値を低減または抑制するために、歪みの推定値を減衰させる。
上記の論理は例示的な実施形態に過ぎず、上記の形態において、すべての損失が長期基準とマークされているフレームに影響を及ぼすと仮定している点においていくらか保守的であることが留意され得る。上記の論理は、長期基準フレームに影響を与えるフレームまたはスライスの損失のみを考慮にいれるように修正することができる。
また別の一般化において、長期基準が復号器によって受信されているが、長期基準の前に損失があった事例を考える。したがって、長期基準は上記の厳密な定義に従って「確認応答」されていない。しかしながら、フレームのすべてのマクロブロックについてモード決定が記憶されている場合、対応するモードがイントラまたは確認応答された長期基準に設定された部分は、ゼロエラー伝播基準歪みに関連付けられ、したがって、それらの領域から参照されるインター予測が、イントラコード化と比較してより低い可能性があるレート−歪みコストにおいてエラー伝播を遮断する。
上記の例示的な実施形態はすべて長期基準およびフィードバック報告の概念に基づくが、往復時間(RTT)が復号画像バッファ内の短期基準の数と比較して十分に短いとき、同じ概念が短期基準に適用されてもよい。すなわち、十分に小さいRTTについて、代替的なまたは追加の可能性は、短期基準を確認応答されているものとして認識することであり、これは、その後、上述した、確認応答された長期基準と同様に使用することができる。前の節における式(3)に対して必要とされるアルゴリズムの変更は、Dep_ref(m,o)がイントラコード化についてだけでなく、確認応答された基準からのインターコード化についてもゼロに設定されることである。
上述の第1の実施形態に対する一般化は、ロバスト性とソースコード化との間でトレードオフを行うにあたっての柔軟性を改善する。
さらに、デフォルトのLARDOは、制約されたイントラ予測を仮定する、すなわち、インター予測マクロブロックからのイントラ予測が禁止されている。しかしながら、本発明者は、制約されたイントラ予測が事実上、より深刻なコード化歪みを(特に、平滑な勾配画像領域上で)引き起こす可能性があることを観測している。それゆえ、本発明の特に好適な変形例において、制約されたイントラ予測なしにLARDOを作動させるべきである。イントラコード化モード(インター予測マクロブロックから予測されるとき)が、エラー伝播基準歪みにも関連付けられることが含まれ、したがって、エラー伝播基準歪みに関連付けられていないモードのみが、確認応答されたエラーのない基準画像からのインター予測である。
本発明の第2の実施形態において、パケットおよび/またはフレーム到着ステータスのような、復号器から符号化器へフィードバックされている情報が、符号化器内の潜在歪みマップを調整し、それによって、Zhang他による方法と比較して全体的なレート−歪み性能を改善するために使用される。
第2の実施形態によれば、各フレームまたはフレームのスライスに関する各エラー伝播歪みマップDepが、符号化器の復号画像バッファ65内にそのフレームまたはスライスと関連付けて記憶される。各フレームまたはスライスについて、符号化器における復号画像バッファ65は、対応するエラー隠蔽再構築歪みマップDec−rec、エラー隠蔽エラー伝播マップDec−ep、対応するモード決定oおよび動きベクトル情報をも記憶する。その後、復号器からのフィードバック情報が符号化器によって歪みマップを更新するために使用される。再び式(3)を参照する。フィードバック情報は、推定歪みトラッキングを改善することを可能にし、より良好なレート−歪み性能をもたらす。
好ましくは、これは以下のように達成される。特定のフレームまたはスライスが復号器への到着に成功したことを知らせるフィードバック情報を符号化器が受信した場合、エラー隠蔽寄与Dec−recおよびDec−epを式(3)内のエラー伝播歪みマップDepから削除することができる。逆に、特定のフレームまたはスライスが復号器において喪失したことを知らせるフィードバック情報が受信された場合、関連するエラー伝播歪みマップDepが、エラー隠蔽歪みからの寄与、すなわち、式(3)の右辺の第2の項Dec−recおよび第3の項Dec−ep(事前の損失確率推定値pを用いて正規化されている)のみを含むように再計算される。
このとき、往復時間(RTT)が復号画像バッファ内の基準画像の数と比較して短い場合、時刻n−RTTにおける調整された潜在エラー伝播マップDepを、再帰的に式(3)を適用して時刻n−1におけるエラー伝播歪みマップに伝搬させることが可能である。このとき、時刻n−1における更新されたエラー伝播歪みマップDepは、モード選択プロセス(2)において使用される時刻nにおけるDep_refの計算を基礎とすることになる。この結果、潜在歪みマップのトラッキングがより正確になり、システムの全体的なレート−歪み性能が改善する。
上記の実施形態は例としてのみ説明されていることが了解されよう。
概して、上記はスライス、マクロブロックおよびブロックまたはサブブロックに関して記載されているが、これらの用語は必ずしも限定であるようには意図されておらず、本明細書に記載の着想は、フレームを分割または細分化するいかなる特定の方法にも限定されない。さらに、歪みマップは、フレームまたはフレーム内の領域全体をカバーしてもよく、コード化決定プロセスはフレーム全体にわたって、またはフレーム内のある領域のみに対して適用されてもよい。また、予測ブロック粒度は歪みマップ粒度と同じである必要はなく、またはさらには関連する必要もないことに留意されたい(ただし、その可能性は除外されない)。
差分二乗和(SSD)が、差分絶対値和(SAD)と比較してより高い品質をもたらすため差の量として好適であることが多いが、後者の可能性または他の可能性は除外されず、概して、本発明は、歪みを量子化するための基礎としてサンプル間の差の任意の量を使用して実装され得る。
一般的に、レートの量は、予測、および、量子化された変換係数を既述するパラメータを含む、すべての必要とされるパラメータのコード化をも考慮に入れる。この種類の最適化は、本明細書においては完全レート−歪み最適化(RDO)と称される。しかしながら、より複雑度の低い実施形態において、歪みおよび/またはレート項は、すべてではなくいくつかの処理段の影響のみを考慮に入れること、たとえば、予測の影響のみを考慮に入れることによって近似され得る。
さらに、本発明が2つのフレームn−1およびn、またはnおよびn+1などに関して説明されている場合、本発明の特定の実施形態によれば、(既存のコーデックではそうなっている場合があるが)これらが2つの隣接するフレームを参照する必要はない。いくつかの実施形態において、インター予測がさらにより先行しているフレームに対して実行され得る可能性があり、したがって、n−1およびn、またはnおよびn+1は、本発明に関連して、それぞれ、任意の以前に符号化されたフレームまたは画像部分、および、それから予測されることになる後続のフレームまたは部分を参照するのに使用されてもよい。
再び、損失に起因する寄与、またはデータがチャネルなどにわたって喪失したなどの「場合」に起こることを既述する任意のものが本願において記載されている場合、これは復号器によって受け得ることに関して符号化器によって行われる確率的仮定(たとえば、p)に関連するに過ぎず、符号化器は無論何が起こるかを知らないことに留意されたい。確率論的仮定は、統計的ネットワークモデル化に基づいて設計段階において事前決定されてもよく、および/または、さらには復号器からのフィードバックに基づいて動的に決定され得る。
本明細書における開示を所与として当業者には他の変形例が明らかになり得る。本発明の範囲は、記載されている実施形態によっては限定されず、添付の特許請求のみによって限定される。

Claims (10)

  1. 損失を伴うチャネルを介して受信端末にある復号器に送信するための送信端末の符号化器においてビデオストリームを符号化する方法であって、前記方法は、
    レート−歪み最適化プロセスであって、複数のフレームの各々の中の符号化されるべき複数の対象画像部分の各々について、前記対象画像部分に関する歪みの推定値および前記対象画像部分を符号化するのに必要とされるビットレートの量を含む関数を最適化することによって符号化モードセットのうちの好ましい符号化モードを選択することを含み、前記歪みの推定値はソースコード化歪み、および、前記チャネルにわたる起こり得る損失に起因して受けることになる歪みの推定値に基づく、レート−歪み最適化プロセスを実行するステップであって、前記フレームのうちの現在のフレームに対する前記レート−歪み最適化プロセスは、前記フレームのうちの先行するフレームに基づいて前記受信端末から受信されるフィードバックに従って実行される、ステップと、
    前記選択された符号化モードを使用して前記対象画像部分を符号化して符号化ビデオストリームにするステップであって、前記選択された符号化モードは、イントラフレームモード、確認応答基準インター予測モード、又は非確認応答インターフレームモード、のうちの1つを有する、ステップと、
    前記符号化ビデオストリームを前記チャネルを介して送信するステップと、
    前記符号化器において前記復号器の符号化器側インスタンスを作動し、前記符号化器において、エラー伝播歪みマップを記憶する復号画像バッファを維持するステップであって、前記エラー伝播歪みマップは、前記復号画像バッファに記憶されている各々のフレームに関連付けられる、ステップと、
    各々の個々の後の符号化モード選択で使用するために、前記フィードバックに基づき前記エラー伝播歪みマップを更新するステップであって、前記の更新はレート−歪み性能を改善する、ステップと、
    を含方法。
  2. 前記フィードバックは、前記先行するフレームの少なくとも一部分が受信されたという確認応答、および、前記先行するフレームの少なくとも一部分が受信されなかったという報告のうちの一方を含む、請求項1に記載の方法。
  3. 前記符号化モードのセットは、確認応答された先行するフレームまたは前記先行するフレームの確認応答された部分内の対応する基準部分に対して前記対象画像部分を符号化する前記確認応答基準インター予測モードを含み、
    前記確認応答基準インター予測モードは、前記基準部分が受信されたものとして確認応答され、それに対して前記基準部分が符号化されたあらゆるものも受信されたものとして確認応答されており、それによって、前記基準部分がエラー伝播を受けないと知ることができることを条件として、前記符号化モードの選択に使用するために利用可能である、請求項2に記載の方法。
  4. 前記復号画像バッファは、前記復号器の前記符号化器側インスタンスによって再構築された基準画像データの形態の短期および長期基準を更に記憶し、前記短期基準は連続したフレームによって自動的に上書きされ、一方で前記長期基準は明確な削除コマンドの条件に基づいて削除され、
    前記確認応答基準インター予測モードは、前記受信端末において受信されたと確認応答されている前記復号画像バッファ内の前記長期基準のうちの対応するものに対して前記対象画像部分を符号化するか、または、前記受信端末において受信されたと確認応答されている前記復号画像バッファ内の対応する短期基準に対して前記対象画像部分を符号化するかのいずれかである、請求項3に記載の方法。
  5. 前記符号化モードのセットは少なくとも、前記イントラフレームモード、少なくとも1つの非確認応答インターフレーム符号化モード、および前記確認応答基準インター予測モード、ならびに、インター符号化基準部分からの対象画像部分のイントラ符号化を可能にする非制約イントラ符号化モードを含む、請求項4に記載の方法。
  6. 前記符号化モードのセットは、それぞれ前記復号画像バッファ内に記憶されている確認応答されていないフレームまたはフレームの一部分内の対応する長期基準および短期基準に対して前記対象画像部分を符号化する、非確認応答長期基準インター予測モードおよび非確認応答短期基準インター予測モードの少なくとも一方を含み、
    前記フィードバックに従う前記レート−歪み最適化プロセスの実行は、推定損失確率、および、最後に確認応答された先行するフレームまたは先行するフレームの確認応答された部分からの時間に従って損失に起因する歪みの推定値を求めることを含む、請求項5に記載の方法。
  7. 前記フィードバックに従う前記レート−歪み最適化プロセスの実行は、前記フィードバックに従って、前記先行するフレームまたは前記先行するフレームの一部分に対する歪みの前記推定値を調整するステップと、前記調整された歪みの推定値を現在のフレームに関連して使用するために転送するステップとを含む、請求項1〜6のいずれかに記載の方法。
  8. 起こり得る損失に起因して受けることになる歪みの前記推定値は、前記対象画像部分が前記チャネルにわたって到着する場合に、前記対象画像部分の予測が依存する前記対象画像部分の履歴内の基準部分が到着しないことに起因して受けることになる歪みの推定値を表す第1の寄与、ならびに、前記対象画像部分が前記チャネルにわたって喪失した場合に前記対象画像部分の損失を隠蔽するのに使用されることになる画像部分に対する前記対象画像部分の隠蔽歪みの量を表す寄与、および、前記対象画像部分の隠蔽が依存する前記対象画像部分の履歴内の画像部分の損失に起因して受けることになる歪みの推定値を表す寄与を含む、隠蔽に起因して受けることになる歪みの推定値を表す第2の寄与に基づく、請求項1〜7のいずれかに記載の方法。
  9. 損失を伴うチャネルを介して受信端末にある復号器に送信するための送信端末においてビデオストリームを符号化するためのコンピュータプログラムであって、前記コンピュータプログラムはコンピュータ可読媒体上で具現化され、前記送信端末で実行されると、請求項1〜8のいずれかに記載の方法による動作を実行するように構成されているコードを備える、コンピュータプログラム。
  10. 損失を伴うチャネルを介して受信端末にある復号器に送信するためのビデオストリームを符号化するための送信端末であって、前記送信端末は、
    レート−歪み最適化プロセスを実行するように構成されている符号化器であって、該レート−歪み最適化プロセスは、複数のフレームの各々の中の符号化されるべき複数の対象画像部分の各々について、前記対象画像部分に関する歪みの推定値および前記対象画像部分を符号化するのに必要とされるビットレートの量を含む関数を最適化することによって符号化モードセットのうちの好ましい符号化モードを選択するステップを含み、前記歪みの推定値はソースコード化歪み、および、前記チャネルにわたる起こり得る損失に起因して受けることになる歪みの推定値に基づき、前記フレームのうちの現在のフレームに対する前記レート−歪み最適化プロセスは、前記フレームのうちの先行するフレームに基づいて前記受信端末から受信されるフィードバックに従って実行され、前記符号化器は、前記選択された符号化モードを使用して前記対象画像部分を符号化して符号化ビデオストリームにするように構成され、前記選択された符号化モードは、イントラフレームモード、確認応答基準インター予測モード、又は非確認応答インターフレームモード、のうちの1つを有し、前記符号化器は、前記復号器の符号化器側インスタンスを作動し、エラー伝播歪みマップを記憶する復号画像バッファを維持するように構成され、前記エラー伝播歪みマップは、前記復号画像バッファに記憶されている各々のフレームに関連付けられ、前記符号化器は、各々の個々の後の符号化モード選択で使用するために、前記フィードバックに基づき前記エラー伝播歪みマップを更新するように構成され、前記の更新はレート−歪み性能を改善する、符号化器と、
    前記符号化ビデオストリームを前記チャネルを介して送信するように構成されている送信機と、
    を備え送信端末。
JP2014528685A 2011-09-02 2012-09-02 エラーのない基準フレームを使用したビデオリフレッシュ Expired - Fee Related JP6031106B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB1115201.4A GB2495467B (en) 2011-09-02 2011-09-02 Video coding
GB1115201.4 2011-09-02
US13/274,881 2011-10-17
US13/274,881 US9338473B2 (en) 2011-09-02 2011-10-17 Video coding
PCT/US2012/053583 WO2013033679A1 (en) 2011-09-02 2012-09-02 Video refresh using error-free reference frames

Publications (3)

Publication Number Publication Date
JP2014525719A JP2014525719A (ja) 2014-09-29
JP2014525719A5 JP2014525719A5 (ja) 2015-09-24
JP6031106B2 true JP6031106B2 (ja) 2016-11-24

Family

ID=44882137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014528685A Expired - Fee Related JP6031106B2 (ja) 2011-09-02 2012-09-02 エラーのない基準フレームを使用したビデオリフレッシュ

Country Status (6)

Country Link
US (1) US9338473B2 (ja)
EP (1) EP2737703B1 (ja)
JP (1) JP6031106B2 (ja)
KR (1) KR102064023B1 (ja)
GB (1) GB2495467B (ja)
WO (1) WO2013033679A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5373909B2 (ja) * 2008-08-19 2013-12-18 トムソン ライセンシング 圧縮ビデオにおける構文要素のcabac/avc準拠の透かし入れ
CN102187673B (zh) * 2008-08-19 2014-07-30 汤姆森特许公司 亮度评估
CN102132247B (zh) * 2008-08-19 2014-09-10 汤姆森特许公司 传播地图
BRPI0917635B1 (pt) * 2008-08-20 2021-06-29 Contentarmor Método para selecionar alterações para a formação de marcas dágua em um vídeo compactado
KR101763336B1 (ko) 2010-02-09 2017-07-31 콘텐트 아머 프로퍼게이션 맵을 사용한 워터마크 검출
GB2492329B (en) 2011-06-24 2018-02-28 Skype Video coding
GB2492330B (en) 2011-06-24 2017-10-18 Skype Rate-Distortion Optimization with Encoding Mode Selection
GB2492163B (en) 2011-06-24 2018-05-02 Skype Video coding
GB2493777A (en) 2011-08-19 2013-02-20 Skype Image encoding mode selection based on error propagation distortion map
GB2495469B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495468B (en) 2011-09-02 2017-12-13 Skype Video coding
US9094684B2 (en) * 2011-12-19 2015-07-28 Google Technology Holdings LLC Method for dual pass rate control video encoding
US20130272398A1 (en) * 2012-01-25 2013-10-17 Sharp Laboratories Of America, Inc. Long term picture signaling
US20130188709A1 (en) * 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
EP2747316A3 (en) * 2012-12-24 2018-01-03 Akademia Gorniczo-Hutnicza im. Stanislawa Staszica w Krakowie A system and a method for synchronization and transmission of information in a distributed measurement and control system
CN103404146B (zh) 2013-03-11 2016-10-12 华为技术有限公司 视频文件修复方法及装置
FR3029381A1 (fr) * 2014-11-27 2016-06-03 Orange Procede de composition d’une representation video intermediaire
US10595025B2 (en) 2015-09-08 2020-03-17 Microsoft Technology Licensing, Llc Video coding
US10313685B2 (en) 2015-09-08 2019-06-04 Microsoft Technology Licensing, Llc Video coding
WO2018121775A1 (en) 2016-12-30 2018-07-05 SZ DJI Technology Co., Ltd. System and methods for feedback-based data transmission
CN109936746B (zh) 2016-12-30 2021-07-16 深圳市大疆创新科技有限公司 图像处理方法与设备
WO2018120198A1 (zh) * 2016-12-30 2018-07-05 深圳市大疆创新科技有限公司 图像处理方法、装置、无人飞行器和接收端
US10484710B2 (en) * 2018-03-21 2019-11-19 Novatek Microelectronics Corp. Video encoding apparatus and method
US10567756B2 (en) * 2018-05-31 2020-02-18 Agora Lab, Inc. Slice level reference picture reconstruction
US10567757B2 (en) * 2018-05-31 2020-02-18 Agora Lab, Inc. Dynamic reference picture reconstruction
US10848782B2 (en) * 2018-09-21 2020-11-24 Tencent America LLC Method and apparatus for video coding
US11582442B1 (en) * 2020-12-03 2023-02-14 Amazon Technologies, Inc. Video encoding mode selection by a hierarchy of machine learning models
WO2022168516A1 (ja) * 2021-02-08 2022-08-11 ソニーセミコンダクタソリューションズ株式会社 情報処理装置および方法

Family Cites Families (107)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0620303B2 (ja) 1984-11-08 1994-03-16 日本電信電話株式会社 フレ−ム間符号化方式におけるリフレッシュ処理方式
FR2700632B1 (fr) * 1993-01-21 1995-03-24 France Telecom Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.
JPH10145794A (ja) 1996-11-11 1998-05-29 Oki Electric Ind Co Ltd 画像符号化方法及び画像符号化装置
JPH11218673A (ja) 1998-01-30 1999-08-10 Olympus Optical Co Ltd カメラシステム
US6434196B1 (en) * 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
US6421387B1 (en) 1998-05-15 2002-07-16 North Carolina State University Methods and systems for forward error correction based loss recovery for interactive video transmission
JP3606306B2 (ja) 1998-10-08 2005-01-05 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6320919B1 (en) 1998-11-30 2001-11-20 Ericsson Inc. Adaptive channel characterization using decoded symbols
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
US7093028B1 (en) 1999-12-15 2006-08-15 Microsoft Corporation User and content aware object-based data stream transmission methods and arrangements
WO2002017538A2 (en) 2000-08-18 2002-02-28 The Regents Of The University Of California Fixed, variable and adaptive bit rate data source encoding (compression) method
GB2370452B (en) 2000-12-19 2004-10-20 Inmarsat Ltd Communication method and apparatus
JP2003032287A (ja) 2001-07-16 2003-01-31 Furukawa Electric Co Ltd:The ネットワーク間接続方法、その装置およびその装置を用いたシステム
US7257163B2 (en) 2001-09-12 2007-08-14 Silicon Image, Inc. Method and system for reducing inter-symbol interference effects in transmission over a serial link with mapping of each word in a cluster of received words to a single transmitted word
US20030151513A1 (en) 2002-01-10 2003-08-14 Falk Herrmann Self-organizing hierarchical wireless network for surveillance and control
US7317759B1 (en) * 2002-02-28 2008-01-08 Carnegie Mellon University System and methods for video compression mode decisions
US7391807B2 (en) * 2002-04-24 2008-06-24 Mitsubishi Electric Research Laboratories, Inc. Video transcoding of scalable multi-layer videos to single layer video
FR2840495B1 (fr) 2002-05-29 2004-07-30 Canon Kk Procede et dispositif de selection d'une methode de transcodage parmi un ensemble de methodes de transcodage
WO2004004359A1 (en) 2002-07-01 2004-01-08 E G Technology Inc. Efficient compression and transport of video over a network
FR2846835B1 (fr) 2002-11-05 2005-04-15 Canon Kk Codage de donnees numeriques combinant plusieurs modes de codage
EP1439712A1 (en) 2002-12-17 2004-07-21 Visiowave S.A. Method of selecting among "Spatial Video CODEC's" the optimum CODEC for a same input signal
WO2004064373A2 (en) * 2003-01-09 2004-07-29 The Regents Of The University Of California Video encoding methods and devices
CN100499788C (zh) 2003-01-09 2009-06-10 加利福尼亚大学董事会 视频编码设备
US7672523B2 (en) * 2003-03-03 2010-03-02 The Hong Kong University Of Science And Technology Efficient rate allocation for multi-resolution coding of data
US7280597B2 (en) 2003-06-24 2007-10-09 Mitsubishi Electric Research Laboratories, Inc. System and method for determining coding modes, DCT types and quantizers for video coding
US7433661B2 (en) * 2003-06-25 2008-10-07 Lucent Technologies Inc. Method for improved performance and reduced bandwidth channel state information feedback in communication systems
KR20050061762A (ko) * 2003-12-18 2005-06-23 학교법인 대양학원 부호화 모드 결정방법, 움직임 추정방법 및 부호화 장치
US7349472B2 (en) * 2004-02-11 2008-03-25 Mitsubishi Electric Research Laboratories, Inc. Rate-distortion models for error resilient video transcoding
JP4031455B2 (ja) 2004-03-29 2008-01-09 株式会社東芝 画像符号化装置
EP1603339A1 (en) 2004-06-01 2005-12-07 STMicroelectronics S.r.l. Method and system for communicating video data in a packet-switched network, related network and computer program product therefor
JP4680008B2 (ja) 2004-08-31 2011-05-11 株式会社エヌ・ティ・ティ・ドコモ 通信システム、通信ノード及び通信方法
US8948266B2 (en) 2004-10-12 2015-02-03 Qualcomm Incorporated Adaptive intra-refresh for digital video encoding
US20060098573A1 (en) 2004-11-08 2006-05-11 Beer John C System and method for the virtual aggregation of network links
US8634413B2 (en) * 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
WO2006078595A2 (en) * 2005-01-18 2006-07-27 Thomson Licensing Method and apparatus for estimating channel induced distortion
US9667999B2 (en) 2005-04-25 2017-05-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and system for encoding video data
US20060268976A1 (en) * 2005-05-03 2006-11-30 Motorola, Inc. Method and apparatus for determining channel quality and performing adaptive modulation coding within a multi carrier communication system
DE102005029127A1 (de) 2005-06-23 2007-04-19 On Demand Microelectronics Ag Verfahren und Vorrichtung zur optimierten prädiktiven Videocodierung
US20070030894A1 (en) * 2005-08-03 2007-02-08 Nokia Corporation Method, device, and module for improved encoding mode control in video encoding
US8139642B2 (en) 2005-08-29 2012-03-20 Stmicroelectronics S.R.L. Method for encoding signals, related systems and program product therefor
US7916796B2 (en) 2005-10-19 2011-03-29 Freescale Semiconductor, Inc. Region clustering based error concealment for video data
US7242360B2 (en) 2005-11-14 2007-07-10 Northrop Grumman Corporation High power dual band high gain antenna system and method of making the same
CN105049894B (zh) 2005-12-08 2018-03-16 维德约股份有限公司 用于视频通信系统中的差错弹性和随机接入的系统和方法
US8089892B2 (en) * 2005-12-15 2012-01-03 Thomson Licensing Adaptive joint source and channel coding scheme for H.264 video multicasting over wireless networks
WO2007075220A1 (en) * 2005-12-22 2007-07-05 Thomson Licensing Method and apparatus for optimization of frame selection for flexible macroblock ordering (fmo) video encoding
WO2007080480A2 (en) * 2006-01-09 2007-07-19 Nokia Corporation Error resilient mode decision in scalable video coding
WO2007084475A2 (en) 2006-01-17 2007-07-26 Thomson Licensing Methods and apparatus for low complexity error resilient motion estimation and coding mode selection
US20070285501A1 (en) 2006-06-09 2007-12-13 Wai Yim Videoconference System Clustering
US8395414B2 (en) 2006-06-21 2013-03-12 Element Cxi, Llc Hierarchically-scalable reconfigurable integrated circuit architecture with unit delay modules
US7733913B1 (en) 2006-07-31 2010-06-08 Hewlett-Packard Development Company, L.P. Striping data over transmission channels
JP4845640B2 (ja) 2006-08-23 2011-12-28 富士通株式会社 無線通信システムおよび無線通信方法
CN102098517B (zh) 2006-08-28 2014-05-07 汤姆森许可贸易公司 用于确定解码视频块中的期望失真的方法及设备
US8861597B2 (en) 2006-09-18 2014-10-14 Sharp Laboratories Of America, Inc. Distributed channel time allocation for video streaming over wireless networks
US9872045B2 (en) 2006-10-16 2018-01-16 Conversant Wireless Licensing S.A R.L. Method, electronic device, system, computer program product and circuit assembly for reducing error in video coding
US8467448B2 (en) 2006-11-15 2013-06-18 Motorola Mobility Llc Apparatus and method for fast intra/inter macro-block mode decision for video encoding
US8731070B2 (en) * 2006-12-15 2014-05-20 Thomson Licensing Hybrid look-ahead and look-back distortion estimation
CA2677087A1 (en) 2007-02-05 2008-08-14 Andrew Corporation System and method for optimizing location estimate of mobile unit
US8892625B2 (en) 2007-03-20 2014-11-18 Thomson Licensing Hierarchically clustered P2P streaming system
US8824567B2 (en) * 2007-04-04 2014-09-02 Ittiam Systems (P) Ltd. Method and device for tracking error propagation and refreshing a video stream
KR100898176B1 (ko) * 2007-06-12 2009-05-19 한국전자통신연구원 비디오 인코딩을 위한 인터 모드 결정 방법
US20080316364A1 (en) * 2007-06-25 2008-12-25 The Hong Kong University Of Science And Technology Rate distortion optimization for video denoising
US8265144B2 (en) * 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8982947B2 (en) * 2007-07-20 2015-03-17 The Hong Kong University Of Science And Technology Rate control and video denoising for noisy video data
CN100566427C (zh) 2007-07-31 2009-12-02 北京大学 用于视频编码的帧内预测编码最佳模式的选取方法及装置
US20090067495A1 (en) 2007-09-11 2009-03-12 The Hong Kong University Of Science And Technology Rate distortion optimization for inter mode generation for error resilient video coding
US9445110B2 (en) * 2007-09-28 2016-09-13 Dolby Laboratories Licensing Corporation Video compression and transmission techniques
US20090103635A1 (en) 2007-10-17 2009-04-23 Peshala Vishvajith Pahalawatta System and method of unequal error protection with hybrid arq/fec for video streaming over wireless local area networks
US20090110062A1 (en) * 2007-10-30 2009-04-30 The Hong Kong University Of Science And Technology Optimal heegard-berger coding schemes
US20090135901A1 (en) * 2007-11-28 2009-05-28 The Hong Kong University Of Science And Technology Complexity adaptive video encoding using multiple reference frames
CN101459835A (zh) 2007-12-12 2009-06-17 上海摩波彼克半导体有限公司 认知无线电网络中提高跨层多媒体传输质量的方法
FR2925819A1 (fr) 2007-12-21 2009-06-26 Thomson Licensing Sas Procede de codage double passe par macrobloc
US8238427B2 (en) 2008-01-17 2012-08-07 Texas Instruments Incorporated Rate distortion optimized adaptive intra refresh for video coding
US8265171B2 (en) 2008-02-26 2012-09-11 Richwave Technology Corp. Error resilient video transmission using instantaneous receiver feedback and channel quality adaptive packet retransmission
US8798137B2 (en) * 2008-02-29 2014-08-05 City University Of Hong Kong Bit rate estimation in data or video compression
US8406296B2 (en) 2008-04-07 2013-03-26 Qualcomm Incorporated Video refresh adaptation algorithms responsive to error feedback
EP2286595A1 (en) 2008-06-16 2011-02-23 Dolby Laboratories Licensing Corporation Rate control model adaptation based on slice dependencies for video coding
EP2139138B1 (en) 2008-06-24 2013-06-19 Alcatel Lucent Radio link adaption of a channel between a first network element and a second network element in a communication network
WO2010009770A1 (en) 2008-07-25 2010-01-28 Telefonaktiebolaget Lm Ericsson (Publ) A method for the estimation of spatio-temporal homogeneity in video sequences
WO2010036772A2 (en) 2008-09-26 2010-04-01 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
KR101619972B1 (ko) * 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
US20100106431A1 (en) 2008-10-29 2010-04-29 Hitachi, Ltd. Apparatus and method for ultrasonic testing
KR101217525B1 (ko) 2008-12-22 2013-01-18 한국전자통신연구원 비터비 디코더와 이를 이용한 음성 인식 방법
US8780821B2 (en) 2009-02-20 2014-07-15 Qualcomm Incorporated Channel interleaver for transmission of multiple code blocks in a wireless communication system
US20100238997A1 (en) * 2009-03-17 2010-09-23 Yang En-Hui Method and system for optimized video coding
EP2230849A1 (en) 2009-03-20 2010-09-22 Mitsubishi Electric R&D Centre Europe B.V. Encoding and decoding video data using motion vectors
US8031747B2 (en) 2009-04-29 2011-10-04 Juniper Networks, Inc. Apparatus and method of compensating for clock frequency and phase variations by processing packet delay values
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8477846B2 (en) 2009-10-07 2013-07-02 Ittiam Systems (P) Ltd. System and method for adaptive intra refresh rate setting in a video encoder
US8411750B2 (en) 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors
TWI390503B (zh) 2009-11-19 2013-03-21 Gemtek Technolog Co Ltd Dual channel voice transmission system, broadcast scheduling design module, packet coding and missing sound quality damage estimation algorithm
GB2476271B (en) 2009-12-17 2015-09-02 Skype Coding data streams
US8553796B2 (en) * 2009-12-23 2013-10-08 Intel Corporation Distortion-aware multiple input multiple output precoding
EP2522144B1 (en) 2010-01-08 2019-05-01 Nokia Technologies Oy Apparatus and method for video coding
US9078009B2 (en) 2010-02-19 2015-07-07 Skype Data compression for video utilizing non-translational motion information
US20130007831A1 (en) * 2010-03-05 2013-01-03 Thomson Licensing Bit rate adjustment in an adaptive streaming system
US9131238B2 (en) 2010-06-18 2015-09-08 The Trustees Of Princeton University System and method for lossy source-channel coding at the application layer
US9131395B2 (en) 2010-09-08 2015-09-08 Broadcom Corporation Acknowledgment and/or receiver recovery mechanisms for scheduled responses within multiple user, multiple access, and/or MIMO wireless communications
US20120069927A1 (en) * 2010-09-17 2012-03-22 Intel Corporation CQI feedback mechanisms for distortion-aware link adaptation toward enhanced multimedia communications
EP3541075B1 (en) * 2010-10-20 2021-03-10 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Error resilient rate distortion optimization for image and video encoding
CN103918262B (zh) * 2011-06-14 2017-11-10 王舟 基于结构相似度的码率失真优化感知视频编码方法和系统
GB2492329B (en) * 2011-06-24 2018-02-28 Skype Video coding
GB2492330B (en) 2011-06-24 2017-10-18 Skype Rate-Distortion Optimization with Encoding Mode Selection
GB2492163B (en) 2011-06-24 2018-05-02 Skype Video coding
GB2493777A (en) 2011-08-19 2013-02-20 Skype Image encoding mode selection based on error propagation distortion map
GB2495469B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495468B (en) * 2011-09-02 2017-12-13 Skype Video coding

Also Published As

Publication number Publication date
EP2737703B1 (en) 2021-09-29
US9338473B2 (en) 2016-05-10
JP2014525719A (ja) 2014-09-29
KR102064023B1 (ko) 2020-01-08
EP2737703A1 (en) 2014-06-04
WO2013033679A1 (en) 2013-03-07
GB2495467A (en) 2013-04-17
KR20140054164A (ko) 2014-05-08
GB2495467B (en) 2017-12-13
GB201115201D0 (en) 2011-10-19
US20130058405A1 (en) 2013-03-07

Similar Documents

Publication Publication Date Title
JP6031106B2 (ja) エラーのない基準フレームを使用したビデオリフレッシュ
JP6047835B2 (ja) 符号化方法及び送信端末
JP6175666B2 (ja) 誤り伝搬追跡および受信機からの誤りフィードバックを用いるビデオリフレッシュ
EP2712482B1 (en) Low complexity mode selection
EP2712481B1 (en) Mode decision with perceptual-based intra switching
US8804836B2 (en) Video coding
EP2710802B1 (en) Rate-distortion optimization for video coding
CN102946534A (zh) 视频编码
CN102946532A (zh) 视频编码

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150805

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160426

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160823

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160923

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161021

R150 Certificate of patent or registration of utility model

Ref document number: 6031106

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees