JP6175666B2 - 誤り伝搬追跡および受信機からの誤りフィードバックを用いるビデオリフレッシュ - Google Patents

誤り伝搬追跡および受信機からの誤りフィードバックを用いるビデオリフレッシュ Download PDF

Info

Publication number
JP6175666B2
JP6175666B2 JP2014528683A JP2014528683A JP6175666B2 JP 6175666 B2 JP6175666 B2 JP 6175666B2 JP 2014528683 A JP2014528683 A JP 2014528683A JP 2014528683 A JP2014528683 A JP 2014528683A JP 6175666 B2 JP6175666 B2 JP 6175666B2
Authority
JP
Japan
Prior art keywords
distortion
error propagation
frames
frame
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014528683A
Other languages
English (en)
Other versions
JP2014528200A5 (ja
JP2014528200A (ja
Inventor
ニルソン,マティアス
ヴァフィン,レナート
ヴァン アンダソン,ソレン
ヴァン アンダソン,ソレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2014528200A publication Critical patent/JP2014528200A/ja
Publication of JP2014528200A5 publication Critical patent/JP2014528200A5/ja
Application granted granted Critical
Publication of JP6175666B2 publication Critical patent/JP6175666B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • H04N19/166Feedback from the receiver or from the transmission channel concerning the amount of transmission errors, e.g. bit error rate [BER]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、誤りのあるチャネルを介する符号化ビデオの送信に関する。本発明は、エンコーダがストリームをカメラなどから受信するとできるだけ早く該ストリームを送信のため動的に符号化する必要がある、リアルタイムでビデオストリーム、すなわち、ビデオ電話のビデオストリームのようなライブビデオストリームを符号化するとき、特に(排他的にではなく)適用できる。
符号化されるビデオデータのストリームは、図1Aに概略的に例示されている。ストリームは、1つずつが異なったそれぞれの時点でのビデオ画像を表現する複数のフレーム(F)を備える。当業者によく知られているように、符号化の目的のため、各フレーム(F)は部分に分割され、各部分はより小さい下位部分にさらに再分割されても良く、各部分または下位部分は複数の画素を備える。たとえば、ある用語によれば、符号化されるビデオストリームの各フレームは、マクロブロック(MB)に分割され、各マクロブロックは、ブロックまたはサブブロック(b)に再分割され、各ブロックまたはサブブロックは、複数の画素を備える。各フレームは、独立に復号化可能なスライス(S)に分割されても良く、各スライスは、1つ以上のマクロブロックを備える。注意すべきことは、図1Aに示された分割が例示の目的のための概略図に過ぎないことであり、これらの分割は、何らかの実際の符号化スキームに必ずしも対応しないこと、たとえば、各フレームがより多数のマクロブロックを含んでいる可能性が高いことである。
ビデオ符号化が採用され得る例示的な通信システムは、図2のブロック図に概略的に示されている。通信システムは、第1の送信端末12と、第2の受信端末22とを備える。たとえば、各端末12、22は、携帯電話機もしくはスマートフォン、タブレット、ラップトップコンピュータ、デスクトップコンピュータ、または、テレビジョンセット、セット・トップ・ボックス、ステレオシステムなどのようなその他の家電製品を備えても良い。第1および第2の端末12、22は、それぞれが通信ネットワーク32に動作可能に結合し、第1の送信端末12は、それによって、第2の受信端末22によって受信される信号を送信するように配置構成されている。当然ながら、送信端末12は、受信端末22から信号を受信する能力を備えても良く、逆もまた同様であるが、説明の目的のため、送信は、本願明細書では、第1の端末12の立場から表現され、受信は、第2の端末22の立場から表現されている。通信ネットワーク32は、たとえば、ワイド・エリア・インターネットおよび/またはローカル・エリア・ネットワーク、および/または、モバイル・セルラー・ネットワークのようなパケットベース・ネットワークを備えても良い。
第1の端末12は、フラッシュメモリもしくはその他の電子メモリ、磁気記憶装置、および/または、光学記憶装置のような記憶媒体14を備える。第1の端末12は、1個以上のコアを有するCPUの形式の処理装置16と、少なくとも送信機18を有している有線または無線モデムのような送受信機と、端末12の残部と同じ筐体内に収容され又は収容されなくても良いビデオカメラ15とをさらに備える。記憶媒体14、ビデオカメラ15および送信機18は、それぞれが処理装置16に動作可能に結合され、送信機18は、有線または無線リンクを介してネットワーク32に動作可能に結合されている。同様に、第2の端末22は、電子、磁気、および/または、光学記憶装置のような記憶媒体24と、1個以上のコアを有するCPUの形式の処理装置26とを備える。第2の端末は、少なくとも受信機28を有している有線または無線モデムのような送受信機と、端末22の残部と同じ筐体内に収容され又は収容されなくても良い画面25とを備える。第2の端末の記憶媒体24、画面25および受信機28は、それぞれがそれぞれの処理装置26に動作可能に結合され、受信機28は、有線または無線リンクを介してネットワーク32に動作可能に結合されている。
第1の端末12上の記憶媒体14は、処理装置16上で実行されるように配置構成された少なくともビデオエンコーダを記憶する。実行されたとき、エンコーダは、ビデオカメラ15から「未加工」(非符号化)入力ビデオストリームを受信し、より低ビットレートのストリームに圧縮するためにビデオストリームを符号化し、送信機18および通信ネットワーク32を介する第2の端末22の受信機28への送信のため符号化ビデオストリームを出力する。第2の端末22上の記憶媒体は、第2の端末22自身の処理装置26上で実行されるように配置構成された少なくともビデオデコーダを記憶する。実行されたとき、デコーダは、受信機28から符号化ビデオストリームを受信し、画面25への出力のためこれを復号化する。エンコーダおよび/またはデコーダに言及するために使用され得る総称は、コーデックである。
いくつかのシステムでは、受信端末22のデコーダは、フィードバックチャネルを介して、好ましくは、同じパケットベース・ネットワーク32を介して、フィードバックを送信端末12のエンコーダに送信するように配置構成されても良い。
ビデオコーデックの目的は、考えられる最高品質を維持しながら、ビデオ信号を送信するために必要とされるビットレートを低減することである。この目的は、統計的冗長性(ビデオ信号の中の類似性)および(人の視覚系の感度に関連する)知覚的無関連性を利用することにより達成される。
現在のビデオコーデックの大多数は、他の画素ブロックからの画素ブロックの予測と、予測残差の変換と、変換係数の量子化と、量子化指数のエントロピー符号化とを含むアーキテクチャに基づく。これらのステップは、冗長性および無関連性の低減に寄与する。
予測は、典型的に、現在フレーム以外のビデオフレームの中の画素(インター予測)から、および、同じフレームの中の画素(イントラ予測)から実行される可能性がある。すなわち、フレーム内符号化を使用して符号化される場合、ブロック、サブブロックまたはフレームのその他の部分(対象ブロックまたは部分)が同じフレームの中の別のブロック、サブブロックまたは画像部分(参照ブロックまたは部分)に関連して符号化され、そして、フレーム間符号化を使用して符号化される場合、対象ブロックまたは部分が別のフレームの中の参照ブロックまたは部分に関連して符号化される。このプロセスは、予測または予測符号化と広く呼ばれる。インターまたはイントラ予測モジュールがこのようにして、たとえば、フレーム内符号化の場合に近傍ブロックまたはサブブロック、および/または、フレーム間符号化の場合に動きベクトルの指示の形式で予測を発生させる。典型的に、エンコーダは、予測ブロックと実際のブロックと(または予測サブブロックと実際のサブブロックと、など)の間の「残りの」差を表現する残差信号をさらに発生させる。イントラ予測と関係がある残差、動きベクトル、および、何か所要のデータは、その後、典型的に、量子化器およびエントロピー・エンコーダのようなさらなる符号化段階を介して、符号化ビデオストリームに出力される。それ故に、ビデオの中の殆どのブロックは、ブロック間の差の観点から符号化される可能性があり、このことは、絶対画素値を符号化するより少数のビットしか符号化するために必要としないので、ビットレートを軽減する。イントラ予測符号化は、典型的に、インター予測より多数のビットを必要とするが、それでもなお絶対値を符号化することを超える節約を示す。ビデオのため適当なインター符号化技術およびイントラ符号化技術の詳細は、当業者によく知られているであろう。
イントラ符号化の実施例は、図1Bに概略的に例示され、インター符号化の実施例は、図1cに概略的に例示される。イントラ符号化では、対象ブロックまたはサブブロックbの上からのまたは/および左への画素(全てが同じフレームの内部にある)が対象ブロックまたはサブブロックの予測のため使用される。このプロセスは、イントラ予測と呼ばれる。その上、イントラ予測からの残差は、さらに変換され、量子化され、エントロピー符号化されても良い。インター符号化実施例では、対象ブロックまたはサブブロックb1の画素が、対象ブロックまたはサブブロックb1から動きベクトルの分だけオフセットさせられた(ブロックの何分かの1、または、画素のさらに何分かの1ずつオフセットされても良い)前のフレームの中の対応するエリアに基づいて予測される。このプロセスは、インター予測と呼ばれる。インター予測からの残差は、イントラ予測残差と同様に、さらに変換され、量子化され、エントロピー符号化されても良い。以下の文献:
[1]ITU−T,Recommendation H.264,「Advanced video coding for generic audiovisual services」,2007
[2]Zhang et al.,「Error resilience video coding in H.264 encoder with potential distortion tracking」,In Proc.IEEE International Conference on Image Processing,pp.163−166,2004
[3]Vadapalli et al.,「Low−complexity frame−level joint source−channel distortion optimal,adaptive intra refresh」,In Proc.IEEE Workshop on Multimedia Signal Processing,pp.473−480,2008
を参照する。
従来のシステムでは、フィードバックチャネルは、フレームが受信端末22で損失するに至ったこと(損失レポート)を送信端末12上のエンコーダに返信するために使用できる。フィードバックチャネルは、フレームが受信端末22で受信に成功したこと(肯定応答)をエンコーダに返信するためにさらに使用できる。典型的に、損失フレームは、措置が講じられない限り、長時間に亘って持続する可能性がある深刻な歪みを復号化ビデオに引き起こす。1つのこのような措置は、ある種のフレームが失われたことをデコーダからエンコーダに報告を返し、その後、受信され、復号化されたときに誤り伝搬を停止させる「復元フレーム」を強制的にエンコーダに生成させることである。復元フレームは、たとえば、キーフレームである(すなわち、全てイントラ符号化される)、または、デコーダの中で利用可能であることが知られている(それ自体は、受信されたものであることが肯定応答され、かつ、この履歴において関連性のある何か他のことが肯定応答されるので、誤りのないことが分かる)誤りのないフレームに関連してインター符号化されたフレームである可能性がある。後者は、一般に、前者と比べると所定の品質でより低いビットレートという結果をもたらす。復元フレームを送信することに関連する不利点は、ビットレート・オーバーシュート(レートスパイク)、または、代替的にソース符号化歪みの増加である。ビットレート・オーバーシュートは、次には、新しい損失を引き起こすか、または、強制的にエンコーダにフレームを落とさせる可能性があり、急激に増加するソース符号化歪みは、知覚的に邪魔になるかもしれない。
異なるアプローチがZhang et al.の文献[2]によって講じられる。Zhangは、復元フレームを使用することなく、むしろ、チャネルの事前確率モデルに基づいてレートと歪みのどちらを取るかを最適化しようとする方法で、(イントラ符号化モードおよびインター符号化モードを含む)種々の符号化モードの間で選択を行うモード選択プロセスを実行する。
最新のコーデックは、フレーム内部の種々の部分のため種々の予測符号化モードの使用を可能にする。種々の符号化選択肢を有する可能性は、ビデオコーデックのレート−歪み効率を増大させる。最適符号化表現があらゆるフレーム領域に対し見つけられるべきである。典型的に、このような領域は、たとえば、16×16画素からなるマクロブロックである。すなわち、その結果、イントラ予測またはインター予測モードが各マクロブロックに対して個別に選択されることが可能であるので、同じフレーム内部の異なるマクロブロックは、異なるモードで符号化される可能性がある。一部のコーデックでは、異なるレベルのマクロブロックの区分に基づいて、たとえば、別個の予測がマクロブロック内部の4×4のサブブロック毎に実行されるより高い複雑性モード、または、予測が僅かに8×8もしくは8×16ブロック、または、実にマクロブロック全体に基づいて実行されるより低い複雑性モードの間で選択を行うことにより、異なるモードを使用することも可能である。利用可能なモードは、予測を実行する種々の選択肢をさらに含んでも良い。たとえば、図1Bに概略的に例示されるように、1つのイントラモードでは、4×4型サブブロック(b)の画素は、直上にあるサブブロックからの近傍画素から下向きに外挿することにより、または、直ぐ左にあるサブブロックから横向きに外挿することにより決定されても良い。「スキップモード」と呼ばれる別の特別な予測モードがいくつかのコーデックにさらに設けられても良く、代替的な形式のインターモードとしてみなされ得る。スキップモード(PSkip)では、対象の動きベクトルは、上の方かつ左の方の動きベクトルに基づいて推定され、残差係数の符号化は存在しない。動きベクトルが推定される方法は、動きベクトル予測と整合性が取れ、それ故に、動きベクトル差分は零であるので、マクロブロックがスキップブロックであることを伝達するだけで良い。
符号化表現は、このようにして、ブロック区分情報、予測モード、動きベクトル、量子化精度などを含んでも良い。最適な符号化選択肢は、ビデオコンテンツ、ビットレート、先行の符号化決定などに依存する。変換係数の量子化の精度は、典型的に、ビットレート制約を満たすように選定される。さらに、歪みは、最小化されるべきである。
たとえば、H.264ビデオコーダは、予測モードの選定に大きな柔軟性を提供する[1]。輝度成分のインター予測に関して、16×16画素からなるマクロブロックは、16×16画素からなる1個のブロック、または16×8画素の2個のブロック、または8×8画素からなる4個のブロックとして表現される可能性がある。さらに、8×8型ブロックは、8×8画素からなる1個のブロック、または8×4画素からなる2個のサブブロック、または4×8画素からなる2個のサブブロック、または4×4画素からなる4個のサブブロックとして表現される可能性がある。インター予測は、マクロブロックの許容された区分毎に試行される。ブロックのインター予測は、参照フレーム(群)と、典型的に、サブ画素精度で推定される動きベクトル(群)(それぞれの参照フレームの中の参照ブロックからの空間シフト)とを指数化することにより表現される。輝度成分のイントラ予測に関して、16×16型ブロックのための4個の可能なモードと、4×4型サブブロックのための9個の可能なモードとが存在する。さらに、彩度成分のための4個の可能なモードが存在する。最良予測モードは、インター予測モードおよびイントラ予測モードの性能を比較することにより選定される。
H.264 AVC[1]のようなビデオコーデックのレート−歪み性能は、マクロブロックモード選択の性能oに大幅に依存する。すなわち、レートと歪みのどちらを取るかの点から、たとえば、イントラモードまたはインターモードを使用して、マクロブロックが最良に符号化されるか否かを決定する手続である。頑健性の観点から、イントラ符号化マクロブロックは、(制約付きのイントラ予測、すなわち、インター予測マクロブロックからのイントラ予測の使用が禁止されると仮定すると)時間的誤り伝搬を停止するので有利である。しかし、イントラ符号化マクロブロックは、一般に、レートの点から、インター符号化マクロブロックより高コストであり、それ故に、ある種のビット配分およびチャネル条件を仮定すると、デコーダでの歪み(たとえば、平均歪み)が最小化されるようにイントラ符号化マクロブロックを系統的に導入することが重要である。Zhang et al.[2]は、デコーダでの期待平均差分二乗和(SSD)の最小化に基づいてイントラ符号化マクロブロックを導入するためにこのような系統的な枠組みを提案する。潜在的な歪みを追跡することにより、Zhang et al.は、エンコーダのレート−歪みループの内部のインターマクロブロックのコストを計算するとき、ソース符号化歪みに加算される(デコーダでの)期待誤り伝搬歪みに関連するバイアス項を計算することが可能である。
レート−歪み最適化(RDO)問題は、ビットレート制約Rの下での歪みの最小化の点で定式化される可能性がある。ラブランジュ最適化の枠組みは、この問題を解決するためにしばしば使用され、この枠組みによれば、最適化規準は:
J=D(m,o)+λR(m,o) (1)
として定式化され、式中、Jは、ラグランジュ関数を表し、Dは、歪みの尺度(モードoとマクロブロックmまたはマクロブロック下位区分との関数)を表し、Rは、ビットレートであり、λは、歪みとレートのどちらを取るかについてのパラメータである。広く使用される歪み尺度は、原画素と再構成画素との間の差分二乗和(SSD)、または、原画素と予測画素との間の差分絶対和(SAD)である。
本願では、ラグランジュ最適化問題を解くことは、ラグランジュ関数Jを最小化する符号化モードoを見つけることを意味し、ここで、ラグランジュ関数Jは、歪みを表す項と、ビットレートを表す項と、両者の間でどちらを取るかを表す倍数(「ラグランジュ乗数」))とを備える。符号化モードoがより完全なまたはより良い品質の符号化モードに向かって変化するにつれて、歪み項Dは、減少する。しかし、同時に、レート項Rは、増加することになり、λに依存する特定の点で、Rの増加は、Dの減少を上回っても良い。それ故に、式Jは、何らかの最小値を有し、これが起こる符号化モードoが最適符号化モードであると考えられる。
この意味で、ビットレートR、もっと正確にはλRは、この項が絶えず増加する品質から最適符号化モードを引き戻すので、最適化に制約を課す。この最適バランスが見つけられるモードは、λに依存することになり、それ故に、λは、ビットレートと歪みのどちらを取るかを表すと考えられる。
ラグランジュ最適化は、符号化決定を選定するプロセスで広く使用され、あらゆるフレーム領域(たとえば、16×16画素からなるあらゆるマクロブロック)に適用される。一般に、歪みは、全ての処理段階を明らかにするために評価される。これらの処理段階は、予測、変換、および量子化を含む。さらに、再構成画素を計算するために、逆量子化、逆変換、および逆予測のステップが実行される必要がある。SSDは、SADと比べてより高い品質という結果をもたらすので、歪み規準として好ましい場合がよくある。一般に、レートは、予測を記述するパラメータと、量子化された変換係数を含む全ての必要とされたパラメータの符号化をさらに明らかにする。
[2]Zhang et al.では、著者は、ソース符号化だけでなく、チャネル誤り、すなわち、信号がチャネルを介して送信されるときにデータの損失のために起こるものである見込み歪みにも起因するデコーダ内での潜在的な歪みを推定する。推定された見込み歪みは、その後、イントラ符号化の方へモード選択を偏らせるために間接的に使用される(チャネル誤りの可能性がある場合)。この種類のアプローチは、本願明細書では、損失適応型レート−歪み最適化(LARDO)と呼ばれる。
Zhangの「終端間」歪み式は、差分二乗和(SSD)歪み尺度に基づき、損失マクロブロックにベルヌーイ分布を仮定する。最適マクロブロックモードooptは:
Figure 0006175666
によって与えられ、式中、D(m,o)は、マクロブロックmおよびマクロブロックモードoに対する原画素と再構成画素との間のSSD歪みを表し、Rは、総レートを表し、λは、歪みおよびレート項を関連付けるラグランジュ乗数を表す。Dep_ref(m,o)は、誤り伝搬に起因するデコーダにおける参照マクロブロック内部の期待歪みを表す。Dep_ref(m,o)は、このようにして、誤り伝搬歪みが大きくなり過ぎた場合、イントラ符号化の方へ最適化を偏らせるバイアス項をもたらす。Dep_ref(m,o)は、イントラ符号化マクロブロックモードに対して零である。式D(m,o)+Dep_ref(m,o)+λR(m,o)は、ラグランジュ関数Jの例であると考えられる。Argminは、値が最小である式Jに対する引数oの値を出力する。
[2]において、項Dep_ref(m,o)は、物体の動きに追随し、現在の動きベクトルを使用して総歪みマップから計算される。総期待誤り伝搬歪みマップDepは、誤り隠蔽の性能によって動かされ、各マクロブロックモード選択後に:
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+p(Dec−rec(m(k),n,oopt)+Dec−ep(m(k),n)) (3)
として更新され、式中、nは、フレーム番号であり、m(k)は、マクロブロックmのk番目の下位区分(すなわち、ブロックまたはサブブロック)を表し、pは、パケット損失の確率を表し、Dec−recは、エンコーダにおける再構成画素と隠蔽画素との間のSSDを表し、Dec−epは、エンコーダおよびデコーダにおける誤り隠蔽画素の間の期待SSDを表す。
[2]では、Depは、フレームの各マクロブロックに亘って4×4型グリッドで、すなわち、マクロブロック1つ当たりにDepの16個の値で、従って、各マクロブロックの4×4型画素サブブロック1つ当たりにDepの1個の値で記憶される。図1cに示されるように、Dep_ref(m(k),o)、すなわち、時点nでのフレームのマクロブロックmの内部のサブブロックkに対する期待誤り伝搬参照歪みの計算は、その後、時点n−1からの先行フレームの4個のサブブロックからのDepの値の加重和として実行される。重みは、当該ブロックmに対する動きベクトルから決定される。すなわち:
Figure 0006175666
であり、式中、重みwは、オーバーラップのエリアに比例し、q(k)は、先行フレームn−1の中のマクロブロックqのサブブロックkを表す。
図1Dは、典型的なサブブロックb1...b4に関連して(本例では、kは、b1に対応し、iは、b1からb4まで数える)、動きベクトルおよび期待誤り伝搬歪みマップからの期待誤り伝搬参照歪みの計算の説明図を提供する。
Zhang[2]のRDOに基づくモード選択プロセスは、イントラ符号化を使用してどのマクロブロックでも符号化することを偶然に決定することもあり、従って、長期に亘って、これは、必要に応じてフレームをリフレッシュする傾向がある。しかし、LARDOを用いる復元は、多くの場合に十分に高速ではないので、損失レポートによって始動された復元フレームを送出することが依然として(知覚的に)有利である。他方では、復元フレームを発生させる従来の技術は、高いビットレートスパイクをもたらす結果になる。
Vadapalli[3]は、ある種の決定された規則性でフレームを強制的にリフレッシュするために付加的なイントラリフレッシュ動作でZhang[2]のモード選択プロセスを補う技術を開示する。イントラリフレッシュ動作は、ある種の決定された時点で、しかし、復元フレームのビットレートコストを取り除き、かつ、レートスパイクを回避するために、復元フレームを発生させ、その後、Vadapelliに従って、各個別のインフラリフレッシュ動作がある程度の数のフレームに亘って広げられる。すなわち、所定の復元動作に対して、フレームの種々の部分領域がこのある程度の数のフレームの種々のそれぞれの部分領域においてリフレッシュされる。さらに、フレーム領域がリフレッシュされる順番は、損失の多いチャネルのZhangの事前確率モデルに基づいてより高い誤り伝搬歪みを持つと推定された領域が先にリフレッシュされ、その上、より低い誤り伝搬歪みを持つと推定された領域が後でリフレッシュされるように、Zhang[2]の誤り伝搬歪みマップに基づいて決定される。Vadapalli[3]では、復元動作が実行される時点は、同様にチャネルの事前確率モデルに基づいて決定された規則性で、エンコーダによって一方向に設定される。
長期に亘ってレートを平滑化するさらに別の代替的なアプローチは、いわゆるペーシングバッファを使用することである。ペーシングバッファは、ビデオエンコーダのバースト的な出力レートにローパスフィルタとしての機能を果たし、それによって、送信チャネルにより一様なレートを生じる。ペーシングバッファのコストは、遅延である。
ITU−T,Recommendation H.264,「Advanced video coding for generic audiovisual services」,2007 Zhang et al.,「Error resilience video coding in H.264 encoder with potential distortion tracking」,In Proc.IEEE International Conference on Image Processing,pp.163−166,2004 Vadapalli et al.,「Low−complexity frame−level joint source−channel distortion optimal,adaptive intra refresh」,In Proc.IEEE Workshop on Multimedia Signal Processing,pp.473−480,2008
本発明の発明者は、十分に滑らかなビットレートを維持した状態で、誤り伝搬の歪みの影響を低減するさらなる余地があると確信している。
前述のとおり、フィードバックチャネルは、たとえば、フレームが受信機で失われたことを伝達するために使用される。典型的に、損失フレームは、ある種のフレームが失われたことをデコーダからエンコーダに返信し、その後、受信され、復号化されたときに誤り伝搬を停止する復元フレーム、たとえば、キーフレーム(全てイントラ符号化される)、または、デコーダで利用できることが知られている(受信機からフィードバックされた1つ以上の肯定応答により分かる)誤りのないフレームに関連してインター符号化されたフレームをエンコーダに強制的に発生させるような措置が講じられない限り、長期間に亘って持続する可能性がある深刻な歪みを復号化ビデオに引き起こす。後者のフレームは、一般に、前者のフレームと比べて、所定の品質でより低いビットレートという結果をもたらす。復元フレームを送出することと関係がある不利点は、ビットレート・オーバーシュートであり、または、代替的に、ソース符号化歪みの増加である。ビットレート・オーバーシュートは、次には、新しい損失を引き起こすか、または、強制的にエンコーダにフレームを落とさせる可能性があり、急激に増加するソース符号化歪みは、知覚的に邪魔になり得る。
上記問題を解決するために、本発明は、損失が報告された後に1つの完全復元フレームを発生させるのではなく、ある期間に亘って部分復元フレームを生成する。部分復元フレームは、ある程度の数のフレームに亘って広げられたフレームの種々の部分領域に適用されるイントラリフレッシュのような技術の使用を意味する。イントラリフレッシュは、標準的な復元フレームのシナリオのように同時に全てのマクロブロックではなく、ある期間に亘って各フレームの中である程度の数のマクロブロックのイントラ符号化を強制することを目的とする。リフレッシュパターンは、好ましくは、全てのマクロブロック位置がある種の期間内にイントラ符号化によって(または、デコーダにおいて復号化ピクチャバッファ内部で利用できることが知られているフレームに関して相互に)リフレッシュされるように配置構成される。この種の技術は、「ソフト復元」動作と考えられる。
本発明によれば、イントラリフレッシュまたはその他のこのようなソフト復元動作は、チャネルを介して起こった損失を報告するデコーダからのフィードバックによって始動される。
イントラリフレッシュ、または、復元フレーム(群)の発生のためのその他のソフト復元技術の使用に加えて、本発明の特に好ましい実施形態は、エンコーダにおいて推定されるようなデコーダでの(パケット損失の効果を含む)潜在的な歪みを使用するイントラリフレッシュを駆動する。エンコーダ内部でデコーダでの潜在的歪みを追跡することは、たとえば、Zhang et al.によって[2]に開示されているように実施される可能性がある。Zhang[2]における潜在的な歪みは、デコーダ内部の間違った参照に起因した潜在的な歪みと、フレームが失われ、誤り隠蔽が呼び出された場合に導入される歪みとの加重和として構築され得る。Zhangでは、歪みマップは、進行中のモード選択プロセスで単に使用されるだけであるが、本発明の好ましい実施形態によれば、歪みマップの目的は、ブロックがソフト復元動作においてリフレッシュされる順序、または、全体でリフレッシュされるべきブロックに優先度を付けることである。
復元の目的は、全ての誤り伝搬を即時に中断することである。ソフト復元の目的は、誤り伝搬を少し緩和し、数フレーム以内に復元を生じさせることである。それにもかかわらず、ソフト復元は、やはり、Zhang[2]が一般に行うLARDOプロセスの単なる適用よりも早く誤り伝搬歪みを終了する。すなわち、ソフト復元は、LARDOプロセスが偶然にフレームのエリアを対象にするために要する時間より短いある程度の数のフレームに亘って、フレームエリアを確実にリフレッシュする。ソフト復元は、画像エリア全体または少なくとも画像のエリア全体を(複数のマクロブロックを一緒に)リフレッシュすることを目的とするが、RDOは、各個別のブロックまたはマクロブロックに対して分離してモード選択決定を行い、当該エリアの系統的なリフレッシュを行わない。
ある程度類似するアプローチが[3]においてVadapalli et al.によって提案されている。しかし、Vadapalliは、フィードバックチャネルが利用できる可能性を利用できない。
Zhang[2]のプロセスおよびVadapalli[3]のプロセスは、両方共に、チャネルを介する損失の可能性に関して完全にエンコーダで行われた事前確率仮定だけに基づく。すなわち、これらのプロセスは、それぞれがチャネルの確率モデルを使用する完全にモデルベースのアプローチに依拠する。歪みの推定値は、チャネルの事後経験的知識をもつことなく、損失確率pの所定の推定値に依拠する。
さらに、Zhang[2]とは異なって、ソフト復元動作は、報告された損失フレームによって始動された特定の時点で行われるだけであるが、ZhangのRDOアプローチのようなRDOアプローチは、いつでも起こっている進行中のプロセスである。
このようにして、本発明は、送出レートを平滑化するために(単一の全て同時の復元フレームと比べて)、チャネルを介して起こっている損失に関する事後情報を報告する受信端末からのフィードバックに応答して始動された、部分復元フレームの発生を行う。特に好ましい実施形態では、本発明は、どのマクロブロックがどの順序でリフレッシュされるかを決定するために、復号化フレームにおける潜在的な歪みに基づく優先度マップを使用する。
本発明の一態様によれば、複数のフレームのうちの各々でビデオ画像を符号化するステップであって、それによって符号化ビデオストリームを発生させ、フレーム群のうちの一部の少なくとも一部分を符号化するためにフレーム間符号化を使用するステップを含む、ステップと、復号化ビデオを生成するために受信機で復号化される符号化ビデオストリームを損失の多いチャネルを介して送信するステップと、ビデオ画像の符号化をリフレッシュするために、上記チャネルを介する損失の存在下でインター予測の効果に起因して復号化ビデオの中に現れた誤り伝搬を打ち切る復元動作を実行するステップと、を備え、上記復元動作は、受信機からフィードバックされた、損失を表すレポートによって始動され、復元動作は、複数の個数のフレームに亘って実行され、種々のそれぞれのフレームで種々の部分フレーム領域の符号化をリフレッシュする方法が提供される。
実施形態では、リフレッシュ動作は、上記個数のフレームに亘って上記ビデオ画像の全体の符号化をリフレッシュしても良い。
復元動作は、上記フレーム間符号化の代わりにフレーム内符号化を使用して上記部分フレーム領域のうちの1つ以上を符号化するステップを備えても良い。
復元動作は、受信機からフィードバックされた受け取りの肯定応答のために誤りのないことが知られている上記フレームのうちの1つの一部分に関連してインター予測を使用して上記部分フレーム領域のうちの1つ以上を符号化するステップを備えても良い。
この方法は、ビデオ画像の種々のそれぞれの部分に亘って上記誤り伝搬に起因する歪みの推定値をマッピングする誤り伝搬歪みマップを維持するステップを備えても良く、部分フレーム領域の各々は、上記部分の1つ以上を取り囲んでも良く、部分フレーム領域は、種々の部分に対する誤り伝搬歪みマップの中の歪みの推定値に依存して決定された優先度に従ってリフレッシュされても良い。
それぞれのフレームの各々で、誤り伝搬歪みマップの中の上記部分に対する推定値に基づいて、部分フレーム領域の中で誤り伝搬歪みの最大推定値に対応する1つだけ、または、部分集合がリフレッシュされても良い。
部分フレーム領域は、上記個数のフレームに亘って優先度の順番でリフレッシュされても良く、優先度の順番は、より大きい推定誤り伝搬に対応する部分フレーム領域が上記個数のフレームの中でより先にリフレッシュされ、より小さい推定誤り伝搬に対応する部分フレーム領域が上記個数のフレームの中でより後でリフレッシュされるように、誤り伝搬歪みマップの中の推定値に基づいて決定されている。
ビデオ画像の部分の全部が優先度順にリフレッシュされても良い。
フレームの上記個数は、ビデオ映像がエリア内で分割可能である上記部分フレーム領域の個数以上でも良い。
この方法は、復元動作によるリフレッシュ化を反映させるために誤り伝搬マップを更新するステップを備えても良い。
上記部分フレーム領域の各々は、複数の上記部分を取り囲んでも良く、各部分フレーム領域に対する対応する推定誤り伝搬歪みは、誤り伝搬マップの中のそれぞれの複数の部分に対する推定値に基づいて決定されても良い。
誤り伝搬マップの中の推定値は、対象部分の予測が依存する対象部分の履歴の中の参照部分の不到着に起因して、対象部分がチャネルを介して到着する場合に起こる歪みの推定値を表現する第1の寄与度と、隠蔽に起因して起こる歪みの推定値を表現する第2の寄与度とに基づいても良い。
第2の寄与度は、対象部分がチャネルを介して失われた場合に対象部分の損失を隠蔽するために使用される画像部分に関連して対象部分の隠蔽歪みの尺度を表現する寄与度と、対象部分の隠蔽が依存する対象部分の履歴の中の画像部分の損失に起因して起こる歪みの推定値を表現する寄与度とを備えても良い。
復元動作に加えて、誤り伝搬歪みマップは、各画像部分に個別に適用され、かつ、デコーダからのフィードバックによって始動されるのではなく、進行中のプロセスである別個の符号化モード選択プロセスでさらに使用されても良い。
符号化モード選択プロセスは、個別の画像部分に対してイントラ符号化とインター符号化とを選択しても良い。
復元動作は、モード選択プロセスより高速にビデオ画像の符号化をリフレッシュしても良い。
復元動作は、上記個数のフレームによって画定される所定の期間内にビデオ画像全体の符号化をリフレッシュしても良いが、モード選択プロセスは、この所定の期間内にビデオ画像全体の符号化をリフレッシュすることを保証しなくても良い。
モード選択プロセスは、どの所定の期間内にもビデオ画像全体の符号化をリフレッシュすることを保証しなくても良い。
本発明の別の態様によれば、複数のフレームのうちの各々でビデオ画像を符号化するように配置構成されているエンコーダであって、それによって符号化ビデオストリームを発生させ、フレーム群のうちの一部の少なくとも一部分を符号化するためにフレーム間符号化を使用する、エンコーダと、復号化ビデオを生成するために受信端末で復号化される符号化ビデオストリームを損失の多いチャネルを介して送信するように配置構成されている送信機とを備え、エンコーダは、ビデオ画像の符号化をリフレッシュするために、上記チャネルを介する損失の存在下でインター予測の効果に起因して復号化ビデオの中に現れた誤り伝搬を打ち切る復元動作を実行するように構成され、エンコーダは、上記復元動作が受信端末からフィードバックされた、損失を表すレポートによって始動されるように構成され、エンコーダは、複数の個数のフレームに亘って復元動作を実行し、種々のそれぞれのフレームで種々の部分フレーム領域の符号化をリフレッシュするように構成されている、送信端末が提供される。
実施形態では、エンコーダは、上記方法特徴のいずれかに記載の動作を実行するようにさらに構成されても良い。
本発明の別の態様によれば、コンピュータ読み取り可能な媒体上に具現化され、送信端末上で実行されたときに以下の動作、複数のフレームのうちの各々でビデオ画像を符号化するステップであって、それによって符号化ビデオストリームを発生させ、フレーム群のうちの一部の少なくとも一部分を符号化するためにフレーム間符号化を使用するステップを含む、ステップと、復号化ビデオを生成するために受信機で復号化される符号化ビデオストリームを損失の多いチャネルを介して送信するステップと、ビデオ画像の符号化をリフレッシュするために、上記チャネルを介する損失の存在下でインター予測の効果に起因して復号化ビデオの中に現れた誤り伝搬を打ち切る復元動作を実行するステップとを実行するように構成され、上記復元動作は、受信機からフィードバックされた、損失を表すレポートによって始動され、復元動作は、複数の個数のフレームに亘って実行され、種々のそれぞれのフレームで種々の部分フレーム領域の符号化をリフレッシュするコードを備えるコンピュータ・プログラムが提供される。
実施形態では、コードは、実行されたとき、上記方法特徴のいずれかに記載された動作を実行するようにさらに構成されても良い。
本発明のより良い理解のため、かつ、本発明がどのように実施されるかを明らかにするために、一例として添付図面を参照する。
ビデオストリームの概略図である。 いくつかのイントラ予測符号化モードの概略図である。 インター予測符号化の概略図である。 誤り伝搬歪みの計算の概略図である。 通信システムの概略ブロック図である。 エンコーダの概略ブロック図である。 誤り伝搬歪みマップの概略図である。 ソフト復元動作の始動の概略図である。
以下は、受信機から送信機まで利用可能であるフードバックチャネルを用いた誤りのあるチャネルを介したリアルタイムビデオ送信の分野に関する。
図2を再び参照すると、受信端末22上で動かされているデコーダは、フレームまたはフレームの一部が受信端末22で受信されなかったので、チャネルを介して失われたことを判断したとき、送信端末12上で動いているエンコーダに返信するように構成されている。損失は、パケットがパケットベース・ネットワークを介する送信中に落とされたことを理由とすること、または、データが改竄されたことを理由とすることもあり得る。受信端末22上のデコーダは、パケット、フレーム、またはフレームの一部が受信に成功したときに肯定応答をフィードバックすることもある。
発明の好ましい実施形態によれば、送信端末12のエンコーダで実行されるイントラリフレッシュに基づく復元動作が受信端末22から返信された損失レポートによって始動され、単一復元フレームの代わりにイントラリフレッシュに基づく復元またはその他のソフト復元動作を使用する方法が説明されている。
イントラリフレッシュに基づく復元スキームに関連したある程度の数の難題が存在する。第1に、(深刻な)歪みの持続期間が最小化されるように、最初に最大歪みと関係がある領域をリフレッシュすることが望ましいであろう。第2に、いくらかの期間の後、誤り伝搬歪みの確率が(新しい損失が起こらない限り)小さいということを確実にすることが望ましいであろう。これらの2つの問題を扱うため、エンコーダ内部の潜在的なデコーダ歪みを追跡することが役立つであろう。歪みを追跡する1つのこのような方法は、Zhang et al.[2]によって説明された方法であるが、その他の方法が可能であっても良い。追跡は、送信端末12上で動いているエンコーダで誤り伝搬歪みマップを維持することを備える。これは、チャネルを介して起こり得る損失に起因する歪みの推定値を当該ビデオ画像のフレームエリアの種々のそれぞれの部分にマッピングし、たとえば、それぞれの推定誤り伝搬歪み値をフレームエリアの各マクロブロックにマッピングする。
本発明は、フレームの中でソフト復元動作においてリフレッシュされるべき領域に優先順位を付けるために、好ましくは、領域がソフト復元に関与するフレームの個数に亘ってリフレッシュされる順番に優先順位を付けるために誤り伝搬マップの中で推定歪み値を使用する。誤り伝搬歪みの大きい方の推定値を有する領域は、先にリフレッシュされることになり、誤り伝搬歪みの小さい方の推定値を有する領域は、順番の中でより後にリフレッシュされる。しかし、Vadapalli[3]とは異なって、ソフト復元動作は、受信端末22からフィードバックされ、チャネル(たとえば、パケットベース・ネットワーク32を介して確立されたチャネル)を介した損失を表すレポートによって始動される。好ましくは、この始動は、特定の損失事象、すなわち、特殊なパケット、フレームまたはフレームの一部の損失に対応するレポートである。
フレームの所定の領域のリフレッシュは、イントラ符号化、または、デコーダで利用できることが知られている(それ自体は、受信されたものであることが肯定応答され、かつ、この履歴において関連性のある何かが肯定応答されているので、誤りのないことが知られている)誤りのないフレームに関連したインター符号化のいずれかを使用して達成される可能性がある。
好ましくは、ソフト復元動作は、フレームエリア全体、すなわち、ビデオ画像全体のエリアの全ての領域がリフレッシュされるまで継続する。
図4は、リフレッシュが受信端末22からのフィードバックレポートにより始動された時点に送信端末12でエンコーダによって維持されている誤り伝搬マップの「スナップショット」を概略的に表す。
図4に例示されているのは、誤り伝搬歪みマップへの複数のエントリであり、1つずつがフレームエリア内の種々のそれぞれの位置で全フレームエリアのそれぞれの部分に対応している。たとえば、マップは、ブロックまたはマクロブロックmのサブブロックm(k)毎に1個のエントリを維持しても良い。エントリの1つずつは、フレームエリアのそれぞれのフレーム部分に対する誤り伝搬歪みのそれぞれの推定値を表現するそれぞれの値Dep(m(k))を格納する。これは、推定された歪みが、チャネルを介する当該符号化画像データの可能な損失に起因して、そして、誤り隠蔽データに基づくインター符号化フレームの継続する復号化のため進行中のフレームを通じて伝搬する損失の影響に起因して、フレームエリアのその部分においてデコーダで現在起こっているかもしれないことを表現する。マップは、エンコーダで実施されたチャネルの推定値またはモデルに従って決定される。当該エントリは、新しい符号化モード選択またはフレーム領域のリフレッシュが実行される度に更新される。
本発明の典型的な実施形態によれば、受信端末22からフィードバックされた、損失のレポートにより始動されたとき、送信端末12でエンコーダは、誤り伝搬マップの中でどれが最大推定誤り伝搬歪みを有しているかに基づいて、フレームエリアの種々の部分、たとえば、種々のブロックまたはマクロブロックのリフレッシュの相対優先順位を決定する。
図5は、符号化されているフレームの系列を概略的に例示する。図5に示されるように、ソフト復元動作は、特殊なパケット、フレーム、またはフレームの一部の損失を報告するデコーダからフィードバックされた損失レポートに応答して始動された後、少数個の部分復元フレームに亘って実行される。好ましくは、所定の復元動作の部分復元フレームは、時間的に連続するシーケンスを形成する。ソフト復元が実行される間のフレームの個数は、LARDOモード選択プロセスが偶然にフレーム全体をリフレッシュするために要する時間と比べて少ない。一例として、ソフト復元は、図5では4個のフレームに亘って実行されているものとして示されているが、その他の個数も可能であることが認められるであろう。実施形態では、この個数は、固定されるか、または、そうではない場合、所定の個数であるが、その場限りで変化する個数の可能性は、排除されない。
決定された優先順位に基づいて、エンコーダは、その後、フレームの中のどの部分領域、すなわち、ブロックまたはマクロブロックのどのグループが復元のため割り当てられたフレームのうちどのフレームでリフレッシュされるかを決定する。
リフレッシュは、フレーム領域のブロックのイントラ符号化を備えても良く、または、参照フレーム、もしくは、誤り伝搬歪みなしでデコーダにおいて受信されたことが知られているフレームの一部と関連するブロックのインター符号化を備えても良い。なぜならば、この参照フレームは、デコーダによって受信されていることが肯定応答され、参照フレームの履歴の中の何らかの関連性が受信されていることが肯定応答されているからである(すなわち、参照フレーム自体が先行する参照フレームからインター予測された等の場合、連鎖の中の全ての参照フレームは、誤り伝搬歪みがないことを保証するために、デコーダによって受信されたものとして肯定応答される必要がある)。リフレッシュは、種々の領域に対してこれらの2つの技術の組み合わせをさらに備えても良い。
一例として、図4には、最高推定誤り伝搬歪み値を有しているブロックの組が太字で示されている。
一実施形態では、最高推定誤り伝搬歪みを有しているこのブロックまたはマクロブロックの組は、たとえば、1つずつが肯定応答された誤りのないフレームまたはフレームの一部に関連してインター符号化されることによって、最初にリフレッシュされる領域を形成する。しかし、マップの中で最高推定値を有しているブロックは、必ずしも互いに隣接しなくても良く、リフレッシュされる領域がマップ上で分散させられるように散乱させられても良い。これは、所望のリフレッシュ技術が互いに関連してこれらのブロックをイントラ符号化する場合、簡便ではない。
代替的な実施形態では、エンコーダは、何らかの集計尺度、たとえば、最高歪みブロックの組の最大収容部分による最高の全体的な推定誤り伝搬歪みを有しているか、または、この領域内のブロックの誤り伝搬歪み値の最大平均を有している、空間的にグループ分けされた、隣接するブロックまたはマクロブロックからなるより広い領域(しかし、依然として、フレームの部分領域)を決定する。このような領域の実施例は、図4に縁取りを付けて示されている。エンコーダは、個別に最高である歪みブロックの全てを必ずリフレッシュするのではなく、この領域のブロックを最初にリフレッシュするであろう。
好ましくは、フレームエリアが分割可能である領域と同数の復元フレームが存在するので、フレームエリア全体がこの個数の部分復元フレーム中にリフレッシュされる可能性がある。注意すべきことは、実際には、実施形態では、リフレッシュされた部分は、原則的に、リフレッシュされていない領域からの誤り伝搬のために再び改竄される可能性があるので、これは、フレームの最小個数に過ぎず、それ故に、さらなるリフレッシュが誤り伝搬歪みのない復号化を(何らかの確率で)保証するために必要とされ得ることである。
リフレッシュ優先順位の1つの戦略によれば、ソフト復元に関与しているフレームの個数の1つずつで、エンコーダは、このフレームの個数に亘ってフレームエリア全体の網羅的なリフレッシュを強制するために必ずしも措置を講じることなく、この時点でどちらでも最高推定歪みを有している領域を単に符号化しても良い。好ましくは、誤り伝搬歪みマップは、各部分フレーム領域がリフレッシュされた後に更新され、すなわち、この領域が一旦リフレッシュされると、この領域に誤り伝搬歪みが殆どまたは全くないことが分かる(部分復元フレームがチャネルを介して失われ、その結果、デコーダでリフレッシュ効果がない確率は、低いけれども存在するために、低いが零ではない期待誤り伝搬歪みが依然として存続しても良い)。この場合、いかなるフレームにおいても最大推定誤り伝搬歪み値を有している領域をリフレッシュするだけの方策は、順番を明示的に割り当てる、または、強制することなく、フレームエリア全体をリフレッシュする効果を有する。なぜならば、各部分リフレッシュの後に、領域のブロックは、殆どまたは全く歪みを有することがなく、その結果、次にリフレッシュされる可能性がなく、前に2番目に高い歪みをもつブロックのグループが今度は最高であり、以下同様に続く、からである。それ故に、この戦略は、ある種の暗黙の優先度に従ってリフレッシュし得る。
代替的に、エンコーダは、各復元フレームの時点で、しかし、比較から既にリフレッシュされた領域を除外するために連続的な復元フレームの各々の時点で、最高推定歪みを有している領域をどちらでも符号化するように構成されても良い。これは、(フレームエリアが分割可能である領域と少なくとも同数の復元フレームが依然として存在すると仮定して)フレームエリア全体が優先度順番でリフレッシュされたことを保証する効果を有するので、より高い推定誤り伝搬歪みを有している領域が先にリフレッシュされ、より低い推定誤り伝搬歪みを有している領域が後でリフレッシュされる。
別の代替的な戦略では、ソフト復元が最初に始動された動作の開始時に、エンコーダは、誤り伝搬歪みマップの中の対応する推定値に基づいて、複数の領域の全てに対して優先度順番を立案しても良いので、より高い推定誤り伝搬歪みを有している領域により高い優先度が割り当てられ、より低い推定誤り伝搬歪みを有している領域により低い優先度が割り当てられる。エンコーダは、その後、割り当てられた優先度の順番で領域の各々をリフレッシュする。
いくつかの実施形態では、上記戦略はいずれも、リフレッシュされた部分が原則としてリフレッシュされていない領域からの誤り伝搬のために再び改竄される可能性があるという事実に適応するために、1つ以上の領域が全体的または部分的に2回以上リフレッシュされ得るようにさらに適応されても良い。このようにして、さらなるリフレッシュは、誤り伝搬歪みなしの復号化を(いくらかの確率で)保証することが必要とされ得る。この場合、ソフト復元動作は、フレームエリアが分割可能である上記部分フレーム領域の個数より多くのフレームのため動くように適応させられる。前述の第2または第3の戦略の場合、これらは、最高推定誤り伝搬歪みをもつか、または、最高優先度が割り当てられた領域のうちの1つ以上に対してリフレッシュを繰り返すように配置構成されても良い。
前述のとおり、[2]では、著者は、エンコーダの中で、復号化後に(ソース符号化およびチャネル誤りに起因する)潜在的な歪みを推定する。彼らの文献では、推定された潜在的な歪みは、その後、(チャネル誤りの非零確率が存在する場合)モード選択をイントラ符号化の方へ偏らせるために間接的に使用される。
彼らのいわゆる終端間歪み式は、差分二乗和(SSD)歪み尺度に基づき、損失マクロブロックのベルヌーイ分布を仮定する。最適マクロブロックモードoは:
Figure 0006175666
によって与えられ、式中、D(m,o)は、マクロブロックmおよびマクロブロックモードoに対する原画素と再構成画素との間のSSDソース符号化歪みを表し、Rは、総レートを表し、ラムダは、歪みおよびレート項を関連付けるラグランジュ乗数を表す。Dep_ref(m,o)は、誤り伝搬に起因するデコーダにおける参照ブロック内部の期待歪みを表す。Dep_ref(m,o)は、(制約付きのイントラ予測を仮定して)イントラ符号化マクロブロックモードに対して零である。[2]において、Dep_ref(m,o)は、動きに追随し、現在の動きベクトルを使用して総歪みマップから計算される。総期待誤り伝搬歪みマップDepは、誤り隠蔽の性能によって動かされ、各マクロブロックモード選択後に:
ep(m(k))=(1−p)Dep_ref(m(k),oopt)+p(Dec−rec(m(k),oopt)+Dec−ep(m(k)) (3a)
として更新され、式中、m(k)は、マクロブロックmのk番目のサブブロックを表し、pは、パケット損失の確率を表し、Dec−recは、エンコーダにおける再構成画素と隠蔽画素との間のSSDを表し、Dec−epは、エンコーダおよびデコーダにおける誤り隠蔽画素の間の期待SSDを表す。
本発明の実施形態では、式(2)の使用は、決定的ではない。関連性がある式は、潜在的な歪みの追跡について記述する(3)または(3a)である。フレーム全体に対して式(3)または(3a)が与えられると、エンコーダは、最大の潜在的な歪みをもつ最大Kmax個のブロックの中からK個をリフレッシュするために選定する可能性があり、これによって、深刻な歪みの持続期間を最小化する第1の関心事を取り扱う。これは、イントラリフレッシュとの関連でVadapalli et al.[3]によって提案されたことに類似するが、受信機12からフィードバックされた損失レポートによって始動される。
さらに、本発明の好ましい実施形態は、フレームとフレームとの間で歪みを追跡するので、エンコーダは、マクロブロックのリフレッシュが次のフレームにどのように伝搬するか(または再び改竄されるか)を推定し、それによって、復号化ピクチャの中の残留誤り伝搬歪みの確率の優れた推定値を取得するように構成されても良い。
ソフト復元メカニズムは、LARDOモード選択の有無にかかわらず使用される可能性がある独立した復元アプローチである。本発明のソフト復元動作は、ソフトリフレッシュ動作が報告された損失フレームによって始動されたある一定の時点に限り起こるのに対して、LARDOが常に起こっている進行中のプロセスであるので、モード選択プロセスと区別できる。再び図5を参照のこと。同様に、ソフトリフレッシュは、画像全体または少なくとも大量の画像全体(複数のマクロブロックを一緒に)をリフレッシュすることを目的とするのに対して、LARDOは、各別個のブロックまたはマクロブロックに対して分離してモード選択決定を行う。
LARDOプロセスは、イントラ符号化を使用していかなるマクロブロックでも符号化することを決定するために生じ得るので、長期に亘ると、(従来はフィードバックなしで行われていたとしても)必要に応じてフレームをリフレッシュする傾向がある。しかし、発明者は、LARDOを用いた復元が多くの場合に十分に高速ではなく、その結果、損失レポートによって始動された復元フレームを送出することが依然として(知覚的に)有利であることを経験している。復元動作の目的は、全ての誤り伝搬を即座に中断することである。ソフト復元の目的は、これを少し緩和し、復元が2〜3フレーム以内に起こることを可能にすることである。しかし、ソフト復元は、それでもなお、単にLARDOを適用することが行う誤りより高速に誤り伝搬歪みを終了する。好ましくは、ソフト復元動作は、ソフトリフレッシュが広がるフレームの個数によって画定されたある種の所定の期間内にフレームエリア全体をリフレッシュすることを保証するのに対して、これは、LARDOプロセスがその性質上保証することができない。
本発明を実施する適当なエンコーダは、図3に関連して説明されている。
図3は、送信端末12で実施され得るエンコーダを概略的に例示するハイレベル・ブロック図である。エンコーダは、離散コサイン変換(DCT)モジュール51と、量子化器53と、逆変換モジュール61と、逆量子化器63と、イントラ予測モジュール41と、インター予測モジュール43と、減算段階(−)とを備える。エンコーダは、スイッチ47とコントローラ49とをさらに備える。モジュールの1つずつは、好ましくは、送信端末の記憶媒体14に記憶され、処理装置16での実行のため配置構成されたコードの一部分として実施される。しかし、これらのモジュールの一部または全部が専用ハードウェア回路で完全にまたは部分的に実施される可能性も排除されない。
スイッチ47およびモードコントローラ49の1つずつは、複数のマクロブロックMBを備える入力ビデオストリームのインスタンスを受信するように配置構成されている。コントローラ49は、マクロブロックがイントラ符号化を使用して符号化されているか、または、インター符号化を使用して符号化されているかを選択するように配置構成されている(そして、実施形態では、種々のインターモードおよび/または種々のイントラモードの間で選択しても良い)。コントローラ49は、マルチプレクサが選択された符号化形式に適切に逆量子化器63の出力をイントラ予測モジュール41またはインター予測モジュール43のいずれかの入力に渡すことを制御するためにマルチプレクサ47に動作的に結合されている。コントローラ49は、ソフト復元動作に従ってリフレッシュされたフレーム領域の発生を制御するために、たとえば、ソフトリフレッシュの期間に亘って種々の所要の位置においてイントラ符号化領域を発生させるためにこの能力を使用する。このため、コントローラ49は、フィードバックチャネルを介して受信端末22からフィードバックされた損失のレポート(および場合によってはさらに肯定応答)を受信するために接続されている。Zhang[2]のプロセスのようなLARDOモード選択プロセスがソフト復元メカニズムと並列にさらに必要とされる場合、個別のマクロブロック(など)のためのモード選択「o」は、コントローラ49によってさらに制御され得る。実施形態では、コントローラ49は、選択されたモード「o」に関する情報を関連性のある予測モジュール41、43に指示するために(たとえば、4×4型区分モード、8×8型モード、スキップモードなどを指示するために)、そして、予測モジュール41、43からフィードバックされ、次のフレームのためのモードを選択するときに用いられる情報を受信するように配置構成されても良い。
イントラ予測モジュール41またはインター予測モジュール43の出力は、その後、減算段階(−)の入力に結合され、この減算段階は、これのもう一方の入力で符号化されていない入力ビデオストリームを受信し、予測ブロックをこれらの符号化されていない対応部分から減算し、このようにして、残差信号を発生させるように配置構成されている。残差ブロックは、その後、それぞれの残差値が周波数ドメインに変換される変換(DCT)モジュール51を介して、変換された値が離散量子化指数に変換される量子化器53に渡される。変換され、量子化された信号は、逆量子化器63および逆変換モジュール61を通してフィードバックされ、(デコーダで見られるように)選択された予測モジュール41、43によって用いられる予測されたブロックまたはサブブロックを発生させる。予測モジュール41、43で使用された予測の指示と、インター予測モジュール43によって発生された動きベクトルと、変換モジュール51および量子化モジュール53によって発生されたような残差の変換、量子化された指数とは、全てが符号化ビデオストリームに組み込むため出力され、典型的には、予測値および量子化され、変換された指数が技術的に知られている無損失符号化技術を使用してさらに圧縮され得るエントロピーエンコーダ(図示せず)のようなさらなる無損失符号化段階を経由する。
一例として、Zhangの誤り伝搬歪みマップを維持する方法は、今度はより詳細に説明される。しかし、チャネルを介する損失に起因する可能な歪みをモデリングする他の方法が存在し得る。本発明は、この特定のアプローチに限定されないことが認められるであろう。
前述のとおり、モード選択は、ラグランジュ型の関数:
J=D(m,o)+λR(m,o) (1)
を最適化(たとえば、最小化)することを含み得る。式中、Jは、ラグランジュ関数を表し、Dは、歪みの尺度(モードoとマクロブロックmまたはマクロブロック下位区分との関数)を表し、Rは、ビットレートであり、λは、歪みとレートのどちらを取るかについてのパラメータである。
従来の場合、歪み項Dは、ソース符号化歪みのみを考慮し、すなわち、量子化によって導入された歪みのようなエンコーダの中の不完全性に起因する。これは、チャネルを介するデータの損失に起因して、たとえば、パケットベース・ネットワーク32を介する送信中のパケット損失に起因して導入され得る歪みを考慮しない。
他方では、本発明およびZhang[2]の技術のような損失適合技術は、ソース符号化およびチャネルを介するデータの損失に起因する歪みを共に考慮する「終端間」歪みの尺度を定義しようとする。所定の(対象)ブロック、マクロブロックまたはサブブロックに対する終端間歪みは:
D=(1−p)Darrival+pDloss (5)
として記述できる。式中、Darraivalは、対象ブロックがデコーダに到着した場合に起こる歪みの推定値であり、Dlossは、対象ブロックがチャネルを介するパケット損失に起因して、たとえば、パケットベース・ネットワーク32を介するブロックを含むパケットの損失に起因してデコーダに到着しない場合に起こり得る歪みの推定値である。パラメータpは、当該ブロック画像部分が結果的に失われるチャネルを介して起こる損失事象の確率の推定値、たとえば、パケット損失の確率の推定値である。簡便さのため、用語「ブロック」は、フレーム区分の関連性のあるレベル(たとえば、H.264のようなある種の規格のブロックまたはサブブロック)に一般的に言及するためにここでは適当な位置で使用され得る。
arraivalは、ソース符号化歪みだけではなく、ブロックの過去の歪みに起因して導入される歪み、すなわち、対象ブロックが予測される原因である1つ以上の参照ブロックにおける歪みも表現する。その結果、Darrivalは、ソース符号化歪み項Dと、予測された対象ブロックの履歴の中の歪み(すなわち、対象ブロックへ繰り越す対象ブロックの参照ブロックの中の歪み)を表現する誤り伝搬歪み項Def_refとを共に含む:
arrival=D+Dep_ref (6)
lossは、隠蔽に起因する損失を含む。対象ブロックが受信されない場合、デコーダは、先に符号化されたブロックを凍結すること、または、(現在フレームおよび/または前のフレームのいずれかからの)1つ以上の復号化に成功したブロックからの内挿または外挿を含み得る隠蔽アルゴリズムを適用する。その結果、Dlossは、この隠蔽プロセスに起因する歪みとして識別される可能性がある:
loss=Dec (7)
従って、式(5)を調べると、項Dは、損失が全くない場合に起こる歪みの推定値を表現し、項Decは、対象ブロックが失われた場合に起こる歪みの推定値を表現し、項Dep_refは、対象ブロックが受信に成功し、しかし、この履歴の中の何かが失われた場合(対象フレームの参照ブロックが失われた場合、または、参照フレームの参照ブロックが失われた場合など)に起こる歪みの推定値を表現する。
およびDep_refは、符号化モード選択oの関数である。Decは、モード選択oの関数ではなく、従って、ラグランジュ式から落とされる(損失ブロックがどのように符号化されたかは問題ではない。それにもかかわらず失われている)。それ故に、最適化は:
Figure 0006175666
として記述できる。
は、エンコーダで知ることができる情報に基づくので、たとえば、未加工入力サンプル値sと再構成サンプル値
Figure 0006175666
との間の差分に基づくので、決定論的である。エンコーダは、エンコーダ側でデコーダの並列インスタンス(または、これの近似)を動かす。図3のインター予測モジュール43を詳述する差し込み図を参照のこと。インター予測モジュール43は、動き補償予測(MCP)ブロック44と、予測サンプル
Figure 0006175666
と再構成残差
Figure 0006175666
とを組み合わせることにより、すなわち、各サンプル指数iに対して、
Figure 0006175666
により再構成サンプル
Figure 0006175666
を決定するように配置構成された加算段階(+)とを備える。インター符号化の場合、エンコーダで、予測サンプル
Figure 0006175666
は、参照ブロック
Figure 0006175666
のサンプルと同じであっても良い(参照フレームの中の参照ブロックは、対象フレームに対して動きベクトルのみによってオフセットされている。再び簡単に説明される図1Cを参照のこと)。
それ故に、エンコーダは、エンコーダおよびデコーダ端で見られるような実際のサンプルsと再構成サンプル
Figure 0006175666
との間の差分を決定する可能性がある(これは、この段階では、デコーダで起こるさらなる歪みを導入する損失の可能性を無視する)。サンプルにおける差分は、たとえば、当該対象ブロックの全てのサンプル指数iに亘る差分二乗和(SSD)誤り:
Figure 0006175666
として計算され得る。
しかし、Dep_refは、まだ推定されず、これは、符号化データが(たとえば、パケットベース・ネットワーク32を介して)送信されるべきチャネルに関するいくつかの推定を行うことに基づく。
これを達成するために、エンコーダの中のコントローラ49は、直前に符号化されたフレーム内部の各マクロブロックまたはマクロブロックの区分の歪みを記述する誤り伝搬歪みマップDepを維持するように構成され得る。コントローラ49は、対象ブロックが予測される原因である参照ブロックを収容するパケットがチャネルを介して失われる確率pを決定するように(そして、その結果、さらにパケットが到着する確率1−pを暗黙的または明示的に決定するように)さらに配置構成されている。確率pは、統計的モデリングに基づいて設計段階で予め決定されても良い。この場合、コントローラ49は、メモリ14から値を取り出すことによりpを決定する。しかし、別の可能性は、コントローラ49が受信機22からのフィードバックに基づいてpを決定する。
誤り伝搬マップは:
ep=(1−p)Dep_arrival+pDloss (9)
として表現できる。
誤り伝搬マップDepは、直前に符号化されたフレーム内部のマクロブロックmに対する、または、より好ましくは、各下位区分(ブロックまたはサブブロック)m(k)に対する歪み推定値を備える。それ故に、誤り伝搬マップは、より明示的には:
ep(m(k))=(1−p)Dep_arrival(m(k))+pDloss(m(k)) (10)
として記述できる。式中、m(k)は、マクロブロックmのk番目の下位区分(たとえば、サブブロック)を表し、pは、パケット損失の確率を表す。
lossは、前述のとおりDecに等しい。Dep_arraivalは、チャネルを介する差分、すなわち、エンコーダでの再構成サンプルとデコーダでの再構成サンプルとの間の差分を表現する。たとえば、これは、差分二乗和(SSD)の観点から定量化でき:
Figure 0006175666
式中、
Figure 0006175666
は、ソース符号化歪みおよびチャネルに起因する歪みを共に考慮したデコーダで受信された(指数i)のサンプルである。すなわち、sは、未加工の符号化されていない入力サンプルであり、
Figure 0006175666
は、(たとえば、量子化に起因する)ソース符号化歪みを考慮してエンコーダで再構成されたサンプルであり、
Figure 0006175666
は、チャネルの損失の多い効果を含む総終端間歪みを考慮したサンプルであり;
Figure 0006175666
である。
ep_arraivalは:
Figure 0006175666
に拡張できる。式中、
Figure 0006175666
は、再構成残差のサンプルである。その結果:
Figure 0006175666
である。
そこで、式(9)に代入すると、誤り伝搬マップは:
ep=(1−p)Dep_ref+pDec (14)
または;
ep(m(k))=(1−p)Dep_ref(m(k))+pDec(m(k)) (15)
として記述される可能性がある。
モード最適化問題を考慮すると、これは:
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+pDec(m(k),n,oopt) (16)
と記述されることもあり、式中、nは、フレーム番号であり、すなわち、Dep(n+1)は、既存の決定ooptおよび先行時点nでのフレームに対する歪みDep(n)マップを仮定すると、時点n+1でフレームに対するモード選択を行うため使用される誤り伝搬マップである。
Zhang[2]の場合と同様に、Dec項は:
ep(m(k),n+1)=(1−p)Dep_ref(m(k),n,oopt)+p(Dec−rec(m(k),n,oopt)+Dec−ep(m(k),n)) (3)
に拡張されることもあり、式中、Dec−recは、エンコーダにおける再構成画素と隠蔽画素との間のSSDを表し、Dec−epは、エンコーダおよびデコーダにおける誤り隠蔽画素の間の期待SSDを表す。
式(3)を調べると、前述のとおり、項Dep_refは、対象ブロックは受信に成功しているが、これの履歴の中の何かが失われている場合に(対象フレームの参照ブロックが失われているか、または、参照フレームの参照ブロックが失われているなどの場合に)起こる歪みを表現する。さらに、Dec−recは、隠蔽アルゴリズム自体の性質に起因する歪み(予測に対して内在するソース符号化歪みDにやや類似する)の推定値を表現する。Dec−epは、このとき、対象ブロックが失われ(その結果、デコーダで隠蔽される必要がある)、かつ、隠蔽された対象ブロックの履歴の中の何かが失われている場合に(隠蔽が行われる原因であるブロックが失われる、または、ブロックが予測されるか、または、隠蔽される原因であるブロックが失われるなどの場合に)歪みの推定値を表現する。
従って、歪みマップDepは、新しい損失に起因し、Dec−recおよび部分的にDec−epの結果として生じる寄与度と、過去の損失に起因し、Dep−refおよび部分的にさらにDec−epの結果として生じる寄与度とを備える。
系列の中の1番目のフレームに対して、フレームは、イントラ符号化を用いて符号化されることになり、この場合、Dep−ref=0であり、従って、Dep=pDecである。
誤り隠蔽歪みDecは、コントローラ49によって計算される。項Dec−recは、隠蔽アルゴリズムの知識に基づき、使用された特殊な誤り隠蔽アルゴリズムに依存しても良い。Dec−epは、Dep−refに類似する方法で、たとえば、基本的な隠蔽アルゴリズムの場合に、同じ場所にあるブロックの歪みをコピーすることにより、または、より複雑な隠蔽が使用される場合に、動きを外挿しようとする複数の先に符号化されたブロックb1〜b4から歪みの加重和を計算することにより(類推によって、以下の図1Cに関連した検討を参照のこと)、既存の(直前の)歪みマップに基づいて計算される。Decを計算する他の方法が使用されることもあり、これは、エンコーダの中の再構成サンプルとデコーダによって見られる誤り隠蔽サンプル(すなわち、損失フレームまたは領域を隠蔽するために、前に受信されたフレーム、または、同じフレームの受信された領域からコピー、内挿または外挿されたサンプル)との間の差分の何らかの推定ということもあり得る。
コントローラ49は、その後、既存の誤りマップの知識からのDep_refの計算を含めて、各モード選択決定の後に誤り伝搬マップを更新することにより、1つずつの後に続くインター予測フレームに対する誤り伝搬マップを維持する。インター予測(動き推定)の場合、Zhang[2]によれば、これは、当該フレームに対する動きベクトルを使用して行われる。
これの一例は、図1Cに例示されている。4つの実例ブロックb1、b2、b3およびb4が(時点n−1での)参照フレームFに示され、この参照フレームは、既に符号化されている。(後に続く時点nでの)対象フレームFのブロックは、参照フレームFn−1から予測される。たとえば、対象フレームFの中のブロックbを考慮する。このため、動き予測モジュール44は、参照ブロックが参照フレームFn−1の中のオフセット位置から対象フレームFの中の対象ブロックb’の位置に平行移動されたとき、対象ブロックbの最良推定値をもたらすように、対象フレームFの中の対象ブロックと参照フレームFn−1の中の(点線によって示された)参照ブロックとの間のオフセットを定義する動きベクトルを決定する。その結果、点線の参照ブロックは、必ずしも参照フレームFn−1の中の指数付け可能なブロックではなく、すなわち、必ずしも参照フレームの所定の再分割ではなく、任意の量によってオフセットされる得ることに(そして、実際には、画素の何分かの1によってオフセットされることさえあることに)注意すべきである。それ故に、参照ブロックは、4つの実際の指数付け可能なブロックb1、b2、b3およびb4からの寄与度で構成される。
その結果、誤り伝搬マップDep(n+1)の更新で用いられるDep_refを決定するためにコントローラ49によって実行される既存の計算は、既存のマップDep(n)においてブロックまたはサブブロックb1からb4に対して記録された歪みの加重和:
Figure 0006175666
を計算することを備える。
あるいは、より明示的に:
Figure 0006175666
であり、式中、wは、ブロックまたはサブブロックbからの寄与度を表現する重みであり、Dep(i)は、ブロックまたはサブブロックbに対する誤り伝搬マップエントリである。
前述のとおり、本発明の実施形態では、モード選択式(2)の使用は、決定的ではなく、ソフト復元メカニズムは、LARDOモード選択の有無にかかわらず使用される可能性がある独立した復元アプローチである。関連性のある式は、潜在的な歪みの追跡を記述する(3)または(3a)である。フレーム全体に対して式(3)または(3a)を仮定すると、エンコーダは、最大の潜在的な歪みをもつ最大Kmax個のブロックの中からK個をリフレッシュすることを選定し、これによって、深刻な歪みの持続期間を最小化する第1の関心事を扱う可能性がある。
上記実施形態は、単なる一例として記載されていることが認められるであろう。
たとえば、上記は、Zhang[2]に記載されているように維持された誤り伝搬マップの観点から説明されている。しかし、誤り伝搬マップを維持する他の技術も可能である。たとえば、Zhangの技術は、チャネルを介する損失の確率pの所定の推定値に基づくが、他の技術は、実際の歪みを知ることができるか、または、少なくともよりよく推定できるように、損失に起因する歪みは、何が失われたかについての実際の知識に、たとえば、デコーダで起こったpの値のフィードバック、および/または、失われた実際のフレーム、もしくは、実際のフレームの一部のフィードバックに基礎を置くこともあり得る。
概して、上記は、スライス、マクロブロック、および、ブロックまたはサブブロックの観点から説明されているが、これらの用語は、必ずしも限定的ではなく、本願明細書に記載された考え方は、フレームを分割または再分割する何らかの特殊な方法に限定されるものではない。さらに、歪みマップは、フレーム全体またはフレーム内の領域を対象としても良く、符号化決定プロセスは、フレーム全体、または、フレーム内のある領域のみに適用されても良い。予測ブロック粒度は、(可能性は排除されないが)歪みマップ粒度と同じであること、または、歪みマップ粒度に関係させられることさえ必要でないことにも注意すべきである。
差分二乗和(SSD)は、差分絶対和(SAD)と比べると、結果としてより高い品質をもたらすので、多くの場合に差分の尺度として好ましいが、後者の可能性またはその他の可能性が排除されることはなく、概して、発明は、歪みを定量化する基礎としてサンプルの間の差分の何らかの尺度を使用して実施され得る。
広くは、レートの尺度は、予測を記述するパラメータおよび量子化された変換係数を含む全ての必要とされるパラメータの符号化をさらに明らかにする。この種の最適化は、本願明細書では、完全なレート−歪み最適化(RDO)と呼ばれる。より複雑性の低い実施形態では、しかし、歪みおよび/またはレート項は、いくつかの、しかし、全部ではない処理段階の効果のみを考慮することにより、たとえば、予測の効果のみを考慮することにより近似され得る。
さらに、本発明は、2つのフレームn−1およびn、または、nおよびn+1などの観点から説明されているが、発明のある種の実施形態では、これらは、(既存のコーデックの場合、そうであるかもしれないが)2個の隣接するフレームを参照する必要がない。いくつかの実施形態では、インター予測がさらに先行のフレームに対して実行され得るので、n−1およびn、または、nおよびn+1が先に符号化されたフレームまたは画像部分と、そこから予測される後に続くフレームまたは部分を参照するために本発明に関連して使用できる。
損失に起因する寄与度は、本願において言及されるか、または、データがチャネルなどを介して失われた「場合に」何が起こるかについて記載している何かであるが、このことは、デコーダに起こったかもしれないことに関して、エンコーダは、当然ながら何が起こるかを知らないが、エンコーダによって行われた確率的仮定(たとえば、p)のみに関係していることにもう一度注意すべきである。確率的仮定は、統計的ネットワークモデリングに基づいて設計段階で予め決められても良く、および/または、デコーダからのフィードバックに基づいて動的に決定されても良い。
その他の変形例は、本願明細書における開示により、当業者に明らかになるであろう。発明の範囲は、記載された実施形態ではなく、特許請求の範囲のみによって限定される。

Claims (9)

  1. 複数のフレームのうちの各々でビデオ画像を符号化するステップであって、それによって符号化ビデオストリームを発生させ、フレーム群のうちの幾つかの少なくとも部分を符号化するためにフレーム間符号化を使用するステップを含む、ステップと、
    復号化ビデオを生成するために受信機で復号化される前記符号化ビデオストリームを所定の損失のあるチャネルを介して送信するステップと、
    前記ビデオ画像の符号化をリフレッシュするために、前記チャネルを介する損失の存在下でインター予測の効果に起因して前記復号化ビデオの中に現れた誤り伝搬を打ち切る復元動作を実行するステップと、
    前記ビデオ画像の種々のそれぞれの部分に亘って前記誤り伝搬に起因する歪みの1又は複数の推定値をマッピングする誤り伝搬歪みマップを維持するステップと、
    を備え、
    前記復元動作は、前記受信機からフィードバックされた、損失を表すレポートによって始動され、
    前記復元動作は、複数の個数のフレームに亘って実行され、種々のそれぞれのフレームで種々の部分フレーム領域の符号化をリフレッシュし、
    前記部分フレーム領域の各々は、前記部分の1つ以上を取り囲み、前記部分フレーム領域は、前記種々の部分に対する前記誤り伝搬歪みマップの中の歪みの前記1又は複数の推定値に依存して決定された優先度に従ってリフレッシュされ
    前記誤り伝搬歪みマップは、前記部分フレーム領域の各々がリフレッシュされる度に更新される、
    方法。
  2. 前記リフレッシュは、前記個数のフレームに亘って前記ビデオ画像の全体の符号化をリフレッシュする、請求項1に記載の方法。
  3. 前記復元動作は、前記フレーム間符号化の代わりにフレーム内符号化を使用して前記部分フレーム領域のうちの1つ以上を符号化するステップを備える、請求項1または2に記載の方法。
  4. 前記復元動作は、前記受信機からフィードバックされた受け取りの肯定応答のために誤りのないことが知られている前記フレームのうちの1つの一部分に関連してインター予測を使用して前記部分フレーム領域のうちの1つ以上を符号化するステップを備える、請求項1、2または3に記載の方法。
  5. 前記それぞれのフレームの各々で、前記誤り伝搬歪みマップの中の前記部分に対する前記推定値に基づいて、誤り伝搬歪みの最大推定値に対応する前記部分フレーム領域の中のただ1つ、または、部分集合がリフレッシュされる、請求項1乃至4のいずれか一項に記載の方法。
  6. 前記部分フレーム領域は、前記個数のフレームに亘って優先度の順番でリフレッシュされ、前記優先度の順番は、より大きい推定誤り伝搬に対応する部分フレーム領域が前記個数のフレームの中でより先にリフレッシュされ、より小さい推定誤り伝搬に対応する部分フレーム領域が前記個数のフレームの中でより後でリフレッシュされるように、前記誤り伝搬歪みマップの中の前記推定値に基づいて決定される、請求項1または5に記載の方法。
  7. 前記ビデオ画像の全ての部分が優先度順にリフレッシュされる、請求項1乃至6のいずれか一項に記載の方法。
  8. 複数のフレームのうちの各々でビデオ画像を符号化するよう構成されているエンコーダであって、それによって符号化ビデオストリームを発生させ、フレーム群のうちの幾つかの少なくとも部分を符号化するためにフレーム間符号化を使用する、エンコーダと、
    復号化ビデオを生成するために受信端末で復号化される前記符号化ビデオストリームを所定の損失のあるチャネルを介して送信するよう構成されている送信機と
    を備え、
    前記エンコーダは、前記ビデオ画像の符号化をリフレッシュするために、前記チャネルを介する損失の存在下でインター予測の効果に起因して前記復号化ビデオの中に現れた誤り伝搬を打ち切る復元動作を実行するように構成され、
    前記エンコーダは、前記ビデオ画像の種々のそれぞれの部分に亘って前記誤り伝搬に起因する歪みの1又は複数の推定値をマッピングする誤り伝搬歪みマップを維持するように構成され、
    前記エンコーダは、前記復元動作が前記受信端末からフィードバックされた、損失を表すレポートによって始動されるように構成され、
    前記エンコーダは、複数の個数のフレームに亘って前記復元動作を実行し、種々のそれぞれのフレームで種々の部分フレーム領域の符号化をリフレッシュするように構成され、
    前記部分フレーム領域の各々は、前記部分の1つ以上を取り囲み、前記部分フレーム領域は、前記種々の部分に対する前記誤り伝搬歪みマップの中の歪みの前記1又は複数の推定値に依存して決定された優先度に従ってリフレッシュされ
    前記誤り伝搬歪みマップは、前記部分フレーム領域の各々がリフレッシュされる度に更新される、送信端末。
  9. コンピュータ読み取り可能な媒体上に具現化され、送信端末上で実行されたときに請求項1から7のいずれかに記載の動作を実行するように構成されているコードを備える、コンピュータ・プログラム。
JP2014528683A 2011-09-02 2012-09-02 誤り伝搬追跡および受信機からの誤りフィードバックを用いるビデオリフレッシュ Active JP6175666B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB1115209.7 2011-09-02
GB1115209.7A GB2495468B (en) 2011-09-02 2011-09-02 Video coding
US13/274,803 US8908761B2 (en) 2011-09-02 2011-10-17 Video coding
US13/274,803 2011-10-17
PCT/US2012/053580 WO2013033676A1 (en) 2011-09-02 2012-09-02 Video refresh with error propagation tracking and error feedback from receiver

Publications (3)

Publication Number Publication Date
JP2014528200A JP2014528200A (ja) 2014-10-23
JP2014528200A5 JP2014528200A5 (ja) 2015-09-24
JP6175666B2 true JP6175666B2 (ja) 2017-08-09

Family

ID=44882143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014528683A Active JP6175666B2 (ja) 2011-09-02 2012-09-02 誤り伝搬追跡および受信機からの誤りフィードバックを用いるビデオリフレッシュ

Country Status (6)

Country Link
US (2) US8908761B2 (ja)
EP (1) EP2737701B1 (ja)
JP (1) JP6175666B2 (ja)
KR (1) KR102146583B1 (ja)
GB (1) GB2495468B (ja)
WO (1) WO2013033676A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2492163B (en) 2011-06-24 2018-05-02 Skype Video coding
GB2492329B (en) 2011-06-24 2018-02-28 Skype Video coding
GB2492330B (en) 2011-06-24 2017-10-18 Skype Rate-Distortion Optimization with Encoding Mode Selection
GB2493777A (en) 2011-08-19 2013-02-20 Skype Image encoding mode selection based on error propagation distortion map
GB2495468B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495469B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495467B (en) 2011-09-02 2017-12-13 Skype Video coding
US9407923B2 (en) * 2013-05-20 2016-08-02 Gamefly Israel Ltd. Overconing lost IP packets in streaming video in IP networks
CN110033494A (zh) 2013-09-20 2019-07-19 Vid拓展公司 视频解码器设备和方法
CN108337519B (zh) 2013-12-13 2021-12-03 Vid拓展公司 视频编码设备及方法
US9380097B2 (en) * 2014-04-01 2016-06-28 Gamefly Israel Ltd. Overcoming data loss in streaming video in IP networks
GB2536059B (en) 2015-03-06 2017-03-01 Garrison Tech Ltd Secure control of insecure device
JP6558071B2 (ja) * 2015-05-20 2019-08-14 富士通コネクテッドテクノロジーズ株式会社 無線通信装置、無線通信プログラム、及び無線通信方法
CN107683605B (zh) * 2015-06-24 2021-12-03 索尼公司 编码装置、解码装置和传输控制方法
US20170013274A1 (en) * 2015-07-09 2017-01-12 Microsoft Technology Licensing, Llc Intra-refresh for video streaming
US10003811B2 (en) 2015-09-01 2018-06-19 Microsoft Technology Licensing, Llc Parallel processing of a video frame
US10313685B2 (en) 2015-09-08 2019-06-04 Microsoft Technology Licensing, Llc Video coding
US10595025B2 (en) 2015-09-08 2020-03-17 Microsoft Technology Licensing, Llc Video coding
US20170085871A1 (en) * 2015-09-22 2017-03-23 Ati Technologies Ulc Real time video coding system with error recovery using earlier reference picture
CN105405155A (zh) * 2015-10-21 2016-03-16 努比亚技术有限公司 一种信息处理方法及移动终端
GB2545010B (en) 2015-12-03 2018-01-03 Garrison Tech Ltd Secure boot device
US10841621B2 (en) * 2017-03-01 2020-11-17 Wyse Technology L.L.C. Fault recovery of video bitstream in remote sessions
US11138076B2 (en) * 2017-06-30 2021-10-05 Redis Ltd. Methods, systems, and media for controlling append-only file rewrites
US10291936B2 (en) * 2017-08-15 2019-05-14 Electronic Arts Inc. Overcoming lost or corrupted slices in video streaming
US20190068983A1 (en) * 2017-08-25 2019-02-28 Advanced Micro Devices, Inc. Sending a Frame Difference or Raw Chunk Based on a Known Acknowledgement
US10523947B2 (en) 2017-09-29 2019-12-31 Ati Technologies Ulc Server-based encoding of adjustable frame rate content
US10594901B2 (en) 2017-11-17 2020-03-17 Ati Technologies Ulc Game engine application direct to video encoder rendering
US11290515B2 (en) 2017-12-07 2022-03-29 Advanced Micro Devices, Inc. Real-time and low latency packetization protocol for live compressed video data
US11109025B2 (en) * 2018-06-04 2021-08-31 Tencent America LLC Method and apparatus for sub-block based temporal motion vector prediction
US10841617B2 (en) 2018-11-27 2020-11-17 Semiconductor Components Industries, Llc Methods and apparatus for successive intra block prediction
US10936055B2 (en) * 2019-01-24 2021-03-02 Dell Products, L.P. Encoding content for virtual, augmented, and mixed reality (xR) applications in connectivity-constrained environments
US11100604B2 (en) 2019-01-31 2021-08-24 Advanced Micro Devices, Inc. Multiple application cooperative frame-based GPU scheduling
US10886943B2 (en) * 2019-03-18 2021-01-05 Samsung Electronics Co., Ltd Method and apparatus for variable rate compression with a conditional autoencoder
US11418797B2 (en) 2019-03-28 2022-08-16 Advanced Micro Devices, Inc. Multi-plane transmission
EP4062638A4 (en) * 2019-12-27 2023-01-11 Zhejiang Dahua Technology Co., Ltd AFFINE PREDICTION PROCESS AND ASSOCIATED DEVICES
US11870575B2 (en) * 2020-05-05 2024-01-09 Google Llc Systems and methods for error detection in transmitted video data
US11488328B2 (en) 2020-09-25 2022-11-01 Advanced Micro Devices, Inc. Automatic data format detection
JPWO2022168516A1 (ja) * 2021-02-08 2022-08-11
CN113347422B (zh) * 2021-05-13 2022-07-12 北京大学 一种粗粒度上下文熵编码方法

Family Cites Families (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0620303B2 (ja) * 1984-11-08 1994-03-16 日本電信電話株式会社 フレ−ム間符号化方式におけるリフレッシュ処理方式
JP2661122B2 (ja) * 1988-04-07 1997-10-08 日本電気株式会社 フレーム間予測符号化復号化装置
FR2700632B1 (fr) 1993-01-21 1995-03-24 France Telecom Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.
JPH10145794A (ja) * 1996-11-11 1998-05-29 Oki Electric Ind Co Ltd 画像符号化方法及び画像符号化装置
JPH11218673A (ja) 1998-01-30 1999-08-10 Olympus Optical Co Ltd カメラシステム
JPH11289542A (ja) * 1998-02-09 1999-10-19 Matsushita Electric Ind Co Ltd 画像符号化装置、画像符号化方法、および画像符号化プログラムを記録した記録媒体
US6434196B1 (en) 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
US6421387B1 (en) 1998-05-15 2002-07-16 North Carolina State University Methods and systems for forward error correction based loss recovery for interactive video transmission
JP3606306B2 (ja) * 1998-10-08 2005-01-05 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6320919B1 (en) 1998-11-30 2001-11-20 Ericsson Inc. Adaptive channel characterization using decoded symbols
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
US7093028B1 (en) 1999-12-15 2006-08-15 Microsoft Corporation User and content aware object-based data stream transmission methods and arrangements
WO2002017538A2 (en) 2000-08-18 2002-02-28 The Regents Of The University Of California Fixed, variable and adaptive bit rate data source encoding (compression) method
JP4525878B2 (ja) * 2000-10-02 2010-08-18 日本電気株式会社 動画像符号化方法
GB2370452B (en) 2000-12-19 2004-10-20 Inmarsat Ltd Communication method and apparatus
JP2003032287A (ja) 2001-07-16 2003-01-31 Furukawa Electric Co Ltd:The ネットワーク間接続方法、その装置およびその装置を用いたシステム
US7257163B2 (en) 2001-09-12 2007-08-14 Silicon Image, Inc. Method and system for reducing inter-symbol interference effects in transmission over a serial link with mapping of each word in a cluster of received words to a single transmitted word
US20030151513A1 (en) 2002-01-10 2003-08-14 Falk Herrmann Self-organizing hierarchical wireless network for surveillance and control
US7317759B1 (en) 2002-02-28 2008-01-08 Carnegie Mellon University System and methods for video compression mode decisions
US7391807B2 (en) 2002-04-24 2008-06-24 Mitsubishi Electric Research Laboratories, Inc. Video transcoding of scalable multi-layer videos to single layer video
FR2840495B1 (fr) 2002-05-29 2004-07-30 Canon Kk Procede et dispositif de selection d'une methode de transcodage parmi un ensemble de methodes de transcodage
CA2491522C (en) 2002-07-01 2014-12-09 E G Technology Inc. Efficient compression and transport of video over a network
FR2846835B1 (fr) 2002-11-05 2005-04-15 Canon Kk Codage de donnees numeriques combinant plusieurs modes de codage
EP1439712A1 (en) 2002-12-17 2004-07-21 Visiowave S.A. Method of selecting among "Spatial Video CODEC's" the optimum CODEC for a same input signal
CN100499788C (zh) 2003-01-09 2009-06-10 加利福尼亚大学董事会 视频编码设备
US7672523B2 (en) 2003-03-03 2010-03-02 The Hong Kong University Of Science And Technology Efficient rate allocation for multi-resolution coding of data
US7280597B2 (en) 2003-06-24 2007-10-09 Mitsubishi Electric Research Laboratories, Inc. System and method for determining coding modes, DCT types and quantizers for video coding
US7433661B2 (en) 2003-06-25 2008-10-07 Lucent Technologies Inc. Method for improved performance and reduced bandwidth channel state information feedback in communication systems
KR20050061762A (ko) 2003-12-18 2005-06-23 학교법인 대양학원 부호화 모드 결정방법, 움직임 추정방법 및 부호화 장치
JP4031455B2 (ja) 2004-03-29 2008-01-09 株式会社東芝 画像符号化装置
EP1603339A1 (en) 2004-06-01 2005-12-07 STMicroelectronics S.r.l. Method and system for communicating video data in a packet-switched network, related network and computer program product therefor
JP4680008B2 (ja) 2004-08-31 2011-05-11 株式会社エヌ・ティ・ティ・ドコモ 通信システム、通信ノード及び通信方法
US8948266B2 (en) 2004-10-12 2015-02-03 Qualcomm Incorporated Adaptive intra-refresh for digital video encoding
US20060098573A1 (en) 2004-11-08 2006-05-11 Beer John C System and method for the virtual aggregation of network links
US8634413B2 (en) 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
WO2006078595A2 (en) 2005-01-18 2006-07-27 Thomson Licensing Method and apparatus for estimating channel induced distortion
US9667999B2 (en) 2005-04-25 2017-05-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and system for encoding video data
US20060268976A1 (en) 2005-05-03 2006-11-30 Motorola, Inc. Method and apparatus for determining channel quality and performing adaptive modulation coding within a multi carrier communication system
DE102005029127A1 (de) * 2005-06-23 2007-04-19 On Demand Microelectronics Ag Verfahren und Vorrichtung zur optimierten prädiktiven Videocodierung
US20070030894A1 (en) 2005-08-03 2007-02-08 Nokia Corporation Method, device, and module for improved encoding mode control in video encoding
US8139642B2 (en) 2005-08-29 2012-03-20 Stmicroelectronics S.R.L. Method for encoding signals, related systems and program product therefor
US7916796B2 (en) 2005-10-19 2011-03-29 Freescale Semiconductor, Inc. Region clustering based error concealment for video data
US7242360B2 (en) 2005-11-14 2007-07-10 Northrop Grumman Corporation High power dual band high gain antenna system and method of making the same
CA2633819C (en) 2005-12-08 2016-12-06 Vidyo, Inc. Systems and methods for error resilience and random access in video communication systems
WO2007070056A1 (en) 2005-12-15 2007-06-21 Thomson Licensing An adaptive joint source and channel coding scheme for h.264 video multicasting over wireless networks
WO2007075220A1 (en) 2005-12-22 2007-07-05 Thomson Licensing Method and apparatus for optimization of frame selection for flexible macroblock ordering (fmo) video encoding
JP2009522972A (ja) 2006-01-09 2009-06-11 ノキア コーポレイション スケーラブルなビデオ符号化におけるエラー耐性を有するモード決定
WO2007084475A2 (en) 2006-01-17 2007-07-26 Thomson Licensing Methods and apparatus for low complexity error resilient motion estimation and coding mode selection
US20070285501A1 (en) 2006-06-09 2007-12-13 Wai Yim Videoconference System Clustering
US8395414B2 (en) 2006-06-21 2013-03-12 Element Cxi, Llc Hierarchically-scalable reconfigurable integrated circuit architecture with unit delay modules
US7733913B1 (en) 2006-07-31 2010-06-08 Hewlett-Packard Development Company, L.P. Striping data over transmission channels
JP4845640B2 (ja) 2006-08-23 2011-12-28 富士通株式会社 無線通信システムおよび無線通信方法
US8457202B2 (en) 2006-08-28 2013-06-04 Thomson Licensing Method and apparatus for determining expected distortion in decoded video blocks
US8861597B2 (en) 2006-09-18 2014-10-14 Sharp Laboratories Of America, Inc. Distributed channel time allocation for video streaming over wireless networks
US9872045B2 (en) 2006-10-16 2018-01-16 Conversant Wireless Licensing S.A R.L. Method, electronic device, system, computer program product and circuit assembly for reducing error in video coding
US8467448B2 (en) 2006-11-15 2013-06-18 Motorola Mobility Llc Apparatus and method for fast intra/inter macro-block mode decision for video encoding
WO2008076148A2 (en) 2006-12-15 2008-06-26 Thomson Licensing Distortion estimation
CA2677087A1 (en) 2007-02-05 2008-08-14 Andrew Corporation System and method for optimizing location estimate of mobile unit
WO2008115221A2 (en) 2007-03-20 2008-09-25 Thomson Licensing Hierarchically clustered p2p streaming system
US8824567B2 (en) 2007-04-04 2014-09-02 Ittiam Systems (P) Ltd. Method and device for tracking error propagation and refreshing a video stream
KR100898176B1 (ko) 2007-06-12 2009-05-19 한국전자통신연구원 비디오 인코딩을 위한 인터 모드 결정 방법
US20080316364A1 (en) 2007-06-25 2008-12-25 The Hong Kong University Of Science And Technology Rate distortion optimization for video denoising
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8265144B2 (en) 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
US8982947B2 (en) 2007-07-20 2015-03-17 The Hong Kong University Of Science And Technology Rate control and video denoising for noisy video data
CN100566427C (zh) 2007-07-31 2009-12-02 北京大学 用于视频编码的帧内预测编码最佳模式的选取方法及装置
US20090067495A1 (en) 2007-09-11 2009-03-12 The Hong Kong University Of Science And Technology Rate distortion optimization for inter mode generation for error resilient video coding
JP5427785B2 (ja) 2007-09-28 2014-02-26 ドルビー ラボラトリーズ ライセンシング コーポレイション ビデオ圧縮技法及びビデオ伝達技法
US20090103635A1 (en) 2007-10-17 2009-04-23 Peshala Vishvajith Pahalawatta System and method of unequal error protection with hybrid arq/fec for video streaming over wireless local area networks
US20090110062A1 (en) 2007-10-30 2009-04-30 The Hong Kong University Of Science And Technology Optimal heegard-berger coding schemes
US20090135901A1 (en) 2007-11-28 2009-05-28 The Hong Kong University Of Science And Technology Complexity adaptive video encoding using multiple reference frames
CN101459835A (zh) 2007-12-12 2009-06-17 上海摩波彼克半导体有限公司 认知无线电网络中提高跨层多媒体传输质量的方法
FR2925819A1 (fr) 2007-12-21 2009-06-26 Thomson Licensing Sas Procede de codage double passe par macrobloc
US8238427B2 (en) 2008-01-17 2012-08-07 Texas Instruments Incorporated Rate distortion optimized adaptive intra refresh for video coding
US8265171B2 (en) 2008-02-26 2012-09-11 Richwave Technology Corp. Error resilient video transmission using instantaneous receiver feedback and channel quality adaptive packet retransmission
US8798137B2 (en) 2008-02-29 2014-08-05 City University Of Hong Kong Bit rate estimation in data or video compression
US8406296B2 (en) * 2008-04-07 2013-03-26 Qualcomm Incorporated Video refresh adaptation algorithms responsive to error feedback
KR101350723B1 (ko) 2008-06-16 2014-01-16 돌비 레버러토리즈 라이쎈싱 코오포레이션 비디오 코딩을 위한 슬라이스 종속성에 기초한 레이트 제어 모델 적응 방법
EP2139138B1 (en) 2008-06-24 2013-06-19 Alcatel Lucent Radio link adaption of a channel between a first network element and a second network element in a communication network
WO2010009770A1 (en) 2008-07-25 2010-01-28 Telefonaktiebolaget Lm Ericsson (Publ) A method for the estimation of spatio-temporal homogeneity in video sequences
US9479786B2 (en) 2008-09-26 2016-10-25 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
KR101619972B1 (ko) 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
EP2434281A3 (en) 2008-10-29 2012-05-02 Hitachi, Ltd. Apparatus and method for ultrasonic testing
KR101217525B1 (ko) 2008-12-22 2013-01-18 한국전자통신연구원 비터비 디코더와 이를 이용한 음성 인식 방법
US8780821B2 (en) 2009-02-20 2014-07-15 Qualcomm Incorporated Channel interleaver for transmission of multiple code blocks in a wireless communication system
US20100238997A1 (en) 2009-03-17 2010-09-23 Yang En-Hui Method and system for optimized video coding
EP2230849A1 (en) 2009-03-20 2010-09-22 Mitsubishi Electric R&D Centre Europe B.V. Encoding and decoding video data using motion vectors
US8031747B2 (en) 2009-04-29 2011-10-04 Juniper Networks, Inc. Apparatus and method of compensating for clock frequency and phase variations by processing packet delay values
US8270473B2 (en) 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8477846B2 (en) 2009-10-07 2013-07-02 Ittiam Systems (P) Ltd. System and method for adaptive intra refresh rate setting in a video encoder
US8411750B2 (en) 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors
TWI390503B (zh) 2009-11-19 2013-03-21 Gemtek Technolog Co Ltd Dual channel voice transmission system, broadcast scheduling design module, packet coding and missing sound quality damage estimation algorithm
GB2476271B (en) 2009-12-17 2015-09-02 Skype Coding data streams
US8553796B2 (en) 2009-12-23 2013-10-08 Intel Corporation Distortion-aware multiple input multiple output precoding
CN102783151A (zh) 2010-01-08 2012-11-14 诺基亚公司 用于视频编码的装置、方法和计算机程序
US9078009B2 (en) 2010-02-19 2015-07-07 Skype Data compression for video utilizing non-translational motion information
EP2543189A1 (en) 2010-03-05 2013-01-09 Thomson Licensing Bit rate adjustment in an adaptive streaming system
US9131238B2 (en) 2010-06-18 2015-09-08 The Trustees Of Princeton University System and method for lossy source-channel coding at the application layer
US9131395B2 (en) 2010-09-08 2015-09-08 Broadcom Corporation Acknowledgment and/or receiver recovery mechanisms for scheduled responses within multiple user, multiple access, and/or MIMO wireless communications
US20120069927A1 (en) 2010-09-17 2012-03-22 Intel Corporation CQI feedback mechanisms for distortion-aware link adaptation toward enhanced multimedia communications
WO2012054570A1 (en) 2010-10-20 2012-04-26 Dolby Laboratories Licensing Corporation Error resilient rate distortion optimization for image and video encoding
EP2721826A4 (en) 2011-06-14 2015-05-06 Zhou Wang METHOD AND SYSTEM FOR OPTIMIZATION OF FLOW-DISTORTION BASED ON STRUCTURAL SIMILARITY FOR PERCEPTUAL VIDEO CODING
GB2492329B (en) 2011-06-24 2018-02-28 Skype Video coding
GB2492163B (en) 2011-06-24 2018-05-02 Skype Video coding
GB2492330B (en) 2011-06-24 2017-10-18 Skype Rate-Distortion Optimization with Encoding Mode Selection
GB2493777A (en) 2011-08-19 2013-02-20 Skype Image encoding mode selection based on error propagation distortion map
GB2495467B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495468B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495469B (en) 2011-09-02 2017-12-13 Skype Video coding

Also Published As

Publication number Publication date
US20130058394A1 (en) 2013-03-07
EP2737701A1 (en) 2014-06-04
US9307265B2 (en) 2016-04-05
GB2495468B (en) 2017-12-13
WO2013033676A1 (en) 2013-03-07
US8908761B2 (en) 2014-12-09
US20150071353A1 (en) 2015-03-12
GB201115209D0 (en) 2011-10-19
KR20140056316A (ko) 2014-05-09
JP2014528200A (ja) 2014-10-23
KR102146583B1 (ko) 2020-08-21
GB2495468A (en) 2013-04-17
EP2737701B1 (en) 2021-07-14

Similar Documents

Publication Publication Date Title
JP6175666B2 (ja) 誤り伝搬追跡および受信機からの誤りフィードバックを用いるビデオリフレッシュ
KR102064023B1 (ko) 무-에러 기준 프레임을 이용한 비디오 리프레시 기법
JP6047835B2 (ja) 符号化方法及び送信端末
EP2712481B1 (en) Mode decision with perceptual-based intra switching
EP2712482B1 (en) Low complexity mode selection
US9036699B2 (en) Video coding
GB2493777A (en) Image encoding mode selection based on error propagation distortion map
CN102946534A (zh) 视频编码
CN102946532A (zh) 视频编码

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150805

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170516

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170614

R150 Certificate of patent or registration of utility model

Ref document number: 6175666

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250