JP2003533950A - ビデオ符号化方法 - Google Patents

ビデオ符号化方法

Info

Publication number
JP2003533950A
JP2003533950A JP2001585519A JP2001585519A JP2003533950A JP 2003533950 A JP2003533950 A JP 2003533950A JP 2001585519 A JP2001585519 A JP 2001585519A JP 2001585519 A JP2001585519 A JP 2001585519A JP 2003533950 A JP2003533950 A JP 2003533950A
Authority
JP
Japan
Prior art keywords
image
reference image
frame
current
current image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001585519A
Other languages
English (en)
Other versions
JP4362259B2 (ja
JP2003533950A5 (ja
Inventor
ハンナクセラ ミスカ
カグラー ケレム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2003533950A publication Critical patent/JP2003533950A/ja
Publication of JP2003533950A5 publication Critical patent/JP2003533950A5/ja
Application granted granted Critical
Publication of JP4362259B2 publication Critical patent/JP4362259B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Abstract

(57)【要約】 画像のシーケンスを表しているビデオ信号を符号化する方法であって、前記方法は、符号化のために現在の画像を受信するステップと、現在の画像に対するデフォルト基準画像から現在の画像の時間的予測を形成するステップと、前記デフォルト基準画像を少なくとも1つの別の基準画像と比較するステップと、前記デフォルト基準画像と各別の基準画像との間の類似性の測度を計算するステップと、類似性の測度が所定の基準を満たす場合、その別の基準画像を識別する指示子を出力するステップとを含む。

Description

【発明の詳細な説明】
【0001】 (技術分野) 本発明はビデオ符号化に関する。
【0002】 (背景技術) ビデオ・シーケンスは一連の静止画像またはフレームから構成されている。ビ
デオ圧縮方法は、ビデオ・シーケンスの冗長部分および知覚的に無関係な部分を
減らすことに基づいている。ビデオ・シーケンスにおける冗長性は、スペクトル
冗長性、空間的冗長性および時間的冗長性に分類することができる。スペクトル
冗長性は、同じ画像の異なるカラー成分間の類似性を指す。空間的冗長性は、1
つの画像中の隣接しているピクセル間の類似性に起因する。時間的冗長性は前の
画像の中に現れているオブジェクトが現在の画像中にも現れる可能性があるので
存在する。この時間的冗長性を利用し、現在の画像を別の画像、すなわち、アン
カー画像または基準画像から予測することによって圧縮を行うことができる。現
在の画像と前の画像との間の動きを記述する動き補償データを生成することによ
って、さらに圧縮が行われる。
【0003】 しかし、シーケンスの本来的な冗長性を減らすことだけによっては十分な圧縮
が行われないのが普通である。それ故、ビデオ・エンコーダは、ビデオ・シーケ
ンスの主観的にあまり重要でない部分の品質を低減しようとする。さらに、圧縮
パラメータおよび係数の効率的な無損失符号化によって、符号化されたビット・
ストリームの冗長性が減らされる。その主な技法は、可変長符号を使用する方法
である。
【0004】 ビデオ圧縮方法は、通常、時間的冗長性の削減を利用する画像と利用しない画
像を識別する。時間的冗長性削減方法を利用しない圧縮された画像は、普通はIN
TRAフレームまたはIフレームまたはI画像と呼ばれる。時間的に予測された画
像は、普通は現在の画像の前に発生している画像から前方に予測されており、IN
TERフレームまたはPフレームと呼ばれる。INTERフレームの場合、予測された動
き補償された画像が十分に正確であることは稀であり、したがって、空間的に圧
縮された予測誤差フレームが各INTERフレームに関連付けられる。INTER画像は、
INTRA符号化領域を含むことができる。
【0005】 多くのビデオ圧縮方式は、時間的双方向性予測フレームも使用する。それらは
普通B画像またはBフレームと呼ばれている。B画像はIフレームおよび/また
はPフレームのアンカー画像ペア間に挿入され、これらのアンカー画像の1つま
たは両方から予測される。B画像は、普通は前方予測型画像と比較して圧縮度が
大きくなる。B画像はアンカー画像としては使用されない。すなわち、他の画像
がB画像から予測されることはない。したがって、以降の画像の画像品質を損な
わずにB画像を捨てる(意図的にまたは無意識的に)ことができる。B画像はP
画像に比較して圧縮性能を改善することができるが、それらを生成するための計
算が比較的複雑となり、より多くのメモリを必要とし、追加の遅延時間を導入す
る。これはビデオ・ストリーミングのような非リアルタイムの用途に対しては問
題とならないが、ビデオ会議のようなリアルタイムの用途においては問題となる
場合がある。
【0006】 圧縮されたビデオ・クリップは、時間的に独立のINTRA画像と、時間的に差分
符号化されたINTER画像とに大雑把に分類することができる画像のシーケンスか
ら構成されている。INTRA画像における圧縮効率は、普通はINTER画像の場合より
低いので、INTRA画像は慎重に使用され、特にビット・レートの低い用途に使用
される。
【0007】 ビデオ・シーケンスは、いくつかのシーンまたはショットから構成することが
できる。画像の内容はシーンごとに著しく異なっている場合があり、したがって
、1つのシーンの最初の画像は、通常、INTRA符号化されている。テレビジョン
および映画の中ではシーンが頻繁に変化するが、ビデオ会議においてはシーンの
急激な場面転換は比較的稀である。さらに、再構成されたビデオ信号における伝
送誤りの時間的な伝播を止めるために、そしてビデオのビット・ストリームに対
するランダムなアクセス・ポイントを提供するために、通常、INTRA画像が挿入
されている。
【0008】 圧縮されたビデオは、主として2つの理由のために伝送誤りによって容易に破
損する。第1に、時間的予測差分符号化(INTERフレーム)を利用するために、
誤りが空間的および時間的の両方において伝播するからである。実際には、これ
は、誤りが一度発生すると、それは比較的長い時間にわたって人間の目に見えや
すい。特に影響を受けやすいのは、低いビット・レートでの伝送の場合であり、
その場合、少数のINTRA符号化フレームだけしかないので、時間的な誤りの伝播
がある程度の時間止まらない。第2に、可変長符号を使用することによって誤り
の影響を受けやすくなるからである。1ビット誤りが符号語を変化させると、そ
のデコーダは符号語の同期を失い、また次の同期化(すなわち、開始)符号まで
後続の誤りのない符号語(いくつかのビットを含む)を誤って復号化する。同期
化符号は他の符号語の合法的組合せから生成することができないビット・パター
ンであり、同期化を可能にするためにそのような符号がある間隔でビット・スト
リームに追加される。さらに、伝送の間にデータが失われると誤りが発生する。
たとえば、IPネットワークにおける信頼性の低いUDP転送プロトコルを使用して
いるビデオ・アプリケーションにおいては、ネットワーク要素が符号化ビデオ・
ビット・ストリームの部分を捨てる場合がある。
【0009】 伝送経路において生じた破損に受信機が対処する多くの方法がある。一般に、
信号の受信時に、伝送誤りが先ず検出され、次に受信機によって補正または隠蔽
される。誤り補正は誤りが最初に導入されなかったかのように、誤りデータを完
全に復元するプロセスを指す。誤りの隠蔽は、伝送誤りの影響がその再構成され
たビデオ・シーケンスにおいてほとんど見られないように隠蔽するプロセスを指
す。通常、誤り検出、補正および隠蔽を助けるために、ソースまたはトランスポ
ート符号化によってある程度の量の冗長性が追加される。
【0010】 多くの隠蔽アルゴリズムが周知であり、そのレビューが、Y.ワング(Wang)
およびQ.−F.ジュー(Zhu)によって“Error Control and Concealment for
Video Communication:A Review”(ビデオ通信のための誤り制御および隠蔽:
レビュー)、Proceedings of the IEEE, Vol.86,No.5, May 1998,pp.974−997
および、P.サラマ(Salama)、N.B.シュロフ(Shroff)、およびE.J.
デルプ(Delp)によってIEEE Journal on Selected Areas in Communicationsに
提出された“Error Concealment in Encoded Video”(符号化されたビデオにお
ける誤り隠蔽)の中で与えられている。
【0011】 現在のビデオ符号化規格は、自足可能なビデオ・ビット・ストリームに対する
構文を定義している。現時点で最もポピュラーな規格は、ITU−T勧告H.263、“V
ideo coding for low bit rate communication”(低ビット・レート通信のため
のビデオ符号化)、February 1998;ISO/IEC 14496−2、“Generic Coding of A
udio−Visual Objects: Part 2:Visual”(オーディオ−ビジュアル・オブジェ
クトの一般的符号化:第二部:ビジュアル)、1999(MPEG−4として知られてい
る);およびITU−T勧告H.262(ISO/IEC 13818−2)(MPEG−2として知られて
いる)である。これらの規格はビット・ストリームに対する、したがって、画像
シーケンスおよび画像に対する階層を定義している。 H.263においては、階層は4層になっている。それらは画像層、画像セグメン
ト層、マクロブロック層、およびブロック層である。画像層のデータは、その画
像全体の領域およびその画像データの復号化に影響を及ぼすパラメータを含んで
いる。そのデータのほとんどがいわゆる画像ヘッダ内に配置されている。
【0012】 画像セグメント層は、ブロック層またはスライス層の1つのグループのいずれ
かである可能性がある。デフォルトによって各画像は、ブロックのグループに分
割されている。ブロックのグループ(GOB)は、通常、16個の連続したピクセ
ル・ラインを含む。各GOBに対するデータはオプションのGOBヘッダの次にマクロ
ブロックに対するデータが続いているものから構成されている。オプションのス
ライス構造化モードが使用されている場合、各画像はGOBの代わりにスライスに
分割されている。スライスは、走査順に連続するいくつかのマクロブロックを含
む。各スライスに対するデータは、スライス・ヘッダの次にそのマクロブロック
に対するデータが続いているものから構成されている。
【0013】 各GOBまたはスライスはマクロブロックに分割されている。マクロブロックは
、16×16ピクセル(または2×2ブロック)の輝度およびその空間的に対応
している8×8ピクセル(またはブロック)の色彩成分に関連する。1つのブロ
ックは、輝度または色彩の8×8ピクセルに関連する。 ブロック層のデータは、一様に量子化された個々のコサイン変換係数から構成
され、それらはジグザグに走査され、ランレングス・エンコーダで処理され、可
変長符号で符号化されている。MPEG−2およびMPEG−4層の階層はH.263の階層と
似ている。
【0014】 デフォルトによって、これらの規格は時間的予測のための基準として時間的に
前のアンカー(I.EI、P、またはEP)画像を使用する。この一片の情報は伝送
されない。すなわち、ビット・ストリームは基準画像の識別に関連する情報を含
まない。結果として、デコーダは基準画像が失われたかどうかを検出するための
手段を持たない。多くのトランスポート・コーダはビデオ・データをパケット化
し、それらがそのパケットに付けられたシーケンス番号に関連するようにする。
しかし、この種のシーケンス番号は、ビデオ・ビット・ストリームには関連付け
られていない。たとえば、ビデオ・ビット・ストリームの1つのセクションは、
P画像P1、B画像B2、P画像P3およびP画像P4がこの順序で捕捉された
(そして表示される)データを含むことができる。しかし、ビデオ・ビット・ス
トリームのこのセクションは、P1、P3、B2、P4の順序で圧縮され、伝送
され、復号化されることになる。何故なら、B2を符号化または復号化できる前
にB2はP1およびP3を必要とするからである。1つの画像当たりに1つのパ
ケットがあり、各パケットがシーケンス番号を含むと仮定する。さらに、B2を
搬送しているパケットが失われていると仮定する。受信機はこの消失をパケット
のシーケンス番号から検出することができる。しかし、受信機はP4に対する動
きの補償基準画像が失われているかどうか、あるいはB画像が失われているかど
うかを検出するための手段を備えていない。その場合、受信機は復号化を普通に
継続することができる。
【0015】 したがって、デコーダは、普通はINTRA要求を送信機に送信し、その画像をデ
ィスプレイ上に凍結する。しかし、送信機はこの要求に応答することができない
可能性がある。たとえば、非リアルタイムのビデオ・ストリーミングの用途にお
いては、送信機はデコーダからのINTRA要求に応答することができない。したが
って、デコーダは次のINTRAフレームが受信されるまでその画像を凍結する。ビ
デオ会議のようなリアルタイムの用途において、送信機は応答することができな
い可能性がある。たとえば、複数のパーティによる会議において、エンコーダは
個々の要求に対応することができない場合がある。この場合も、デコーダは、IN
TRAフレームが送信機から出力されるまでその画像を凍結する。
【0016】 (発明の開示) 第1の態様によれば、本発明は、画像のシーケンスを表しているビデオ信号を
符号化する方法を提供する。前記方法は、符号化のために現在の画像を受信する
ステップと、現在の画像の時間的予測を現在の画像に対するデフォルト基準画像
から形成するステップと、デフォルト基準画像を少なくとも1つの別の基準画像
と比較するステップと、デフォルト基準画像と各別の基準画像との間の類似性の
測度を計算するステップと、その類似性の測度が所定の基準を満たす場合に、そ
の別の基準画像を識別する指示子を出力するステップと、その指示子を現在のフ
レームの時間的予測と関連付けるステップとを含む。
【0017】 エンコーダはこの指示子を使用して、どの画像が現在の動き補償基準画像とよ
く似ていて、伝送の間に実際の基準画像が失われた場合に、それらのうちの1つ
を予備基準画像として使用することができることをデコーダに知らせる。デコー
ダが実際の基準画像を失っているが、予備基準画像にアクセスすることができる
場合、そのデコーダはINTRA画像更新要求を送信しないことが好ましい。その指
示子は、どの基準画像がデフォルト基準画像に似ているかをデコーダに指示する
ので、予備基準画像番号と呼ぶことができる。この「予備」基準画像を使用して
、デコーダは、何らかの理由のためにデフォルト基準画像が失われている場合に
、現在のフレームを復号化することができる。
【0018】 予備基準画像番号は、画像全体または画像の一部分に関するものであってよい
。前者の場合、通常、予備基準画像番号は画像ヘッダ内に含まれている。後者の
場合、その予備基準画像番号は、画像セグメントのヘッダまたはその画像のマク
ロブロック・ヘッダ内に含まれている。本発明の1つの好適な実施形態において
は、ビデオ信号はH.263規格に従って符号化され、その指示子は、「補助的エン
ハンスメント」(Supplemental Enhancement)情報の中に含められる。
【0019】 好適には、上記方法は、また、現在の画像に対する第1のデフォルト基準画像
および第2のデフォルト基準画像から現在の画像の時間的予測を形成するステッ
プを含み、前記第1のデフォルト基準画像は時間的に現在の画像の前に現れ、前
記第2のデフォルト基準画像は時間的に現在の画像の後に現れ、上記方法は、さ
らに、第1のデフォルト基準画像を時間的に前記現在の画像の前に現れる少なく
とも1つの別の基準画像と比較するステップと、第1のデフォルト基準画像と各
別の基準画像との間の類似性の測度を計算するステップと、前記類似性の測度が
所定の基準を満たす場合に、前記別の基準画像を識別する指示子を出力するステ
ップとを含む。
【0020】 それ故、指示子は前方に予測されたフレームに対して提供され、後方に予測さ
れたフレームには提供されない。 好適には、デフォルト基準画像は複数の別の基準画像と比較され、所定の基準
を満たす各別の基準画像に指示子が出力される。有利なこととしては、所定の基
準を満たす別の基準画像は類似性の順序でランク付けられ、その指示子にはラン
クの順序で現在のフレームの時間的予測に関連付けられ、デフォルト基準画像に
最もよく似ている別の基準画像が最初に置かれる。その比較はある時点における
画像の部分、たとえば、その画像のブロックまたは他の非四角形領域に対して実
行されてもよい。
【0021】 第2の態様によれば、本発明は、画像のシーケンスを表しているビデオ信号を
符号化する方法を提供する。前記方法は、符号化のために現在の画像を受信する
ステップと、現在の画像に対するデフォルト基準画像から現在の画像の少なくと
も一部分の予測を形成するステップと、デフォルト基準画像または現在の画像の
一部分をそのシーケンスの少なくとも1つの別の画像の対応する部分と比較して
類似性の測度を形成するステップと、類似性の測度が所定の基準を満たす場合に
、現在のフレームのその部分に関してそのシーケンスの別の画像を識別する指示
子を出力するステップとを含む。
【0022】 第3の態様によれば、本発明は、画像のシーケンスを表している符号化された
ビデオ信号を復号化する方法を提供する。前記符号化された信号は、現在の画像
に対するデフォルト基準画像から現在の画像の時間的予測を形成することによっ
て符号化された画像を含み、前記方法は、現在の画像を表している符号化された
ビデオ信号を受信するステップと、現在の画像の少なくとも画像ヘッダを復号化
するステップとを含み、デコーダが現在の画像のデフォルト基準画像を復号化す
ることができない時、別の基準画像を識別する指示子を調べるステップと、その
ような指示子が現在の画像に関連付けられている場合に、前記別の基準画像を基
準として現在の画像を復号化するステップとを含む。
【0023】 第4の態様によれば、本発明は、ビデオ・エンコーダを提供する。前記ビデオ
・エンコーダは、画像のシーケンスを表しているビデオ信号を受信するための入
力と、符号化のために現在の画像を受信するための入力と、現在の画像に対する
デフォルト基準画像から現在の画像の時間的予測を形成するための予測コーダと
、デフォルト基準画像または現在の画像を少なくとも1つの別の基準画像と比較
し、類似性の測度を計算するためのコンパレータとを含み、類似性の測度が所定
の基準を満たす時、前記別の基準画像を識別する指示子を出力する。
【0024】 第5の態様によれば、本発明は、ビデオ・デコーダを提供する。前記ビデオ・
デコーダは画像のシーケンスを表している符号化されたビデオ信号を受信するた
めの入力を含み、その符号化された信号は現在の画像に対するデフォルト基準画
像から現在の画像の時間的予測を形成することによって符号化された画像を含み
、さらに、デコーダは現在の画像を表している符号化されたビデオ信号を受信す
るための入力と、現在の画像の少なくとも画像ヘッダを復号化するためのプロセ
ッサとを含み、デコーダが現在の画像のデフォルト基準画像を復号化することが
できない時、デコーダは別の基準画像を識別する指示子を調べ、上記指示子が現
在の画像に関連付けられている場合に、前記別の基準画像を基準として現在の画
像を復号化するように構成されている。
【0025】 本発明は、また、前記エンコーダおよび/またはデコーダを含む無線通信装置
にも関する。 本発明を、添付の図面を参照しながら以下に記述するが、これは単なる例示と
してのものにすぎない。
【0026】 (発明を実施するための最良の形態) 図1は、代表的なマルチメディア移動通信システムを示している。第1のマル
チメディア移動端末1は、無線リンク3を経由して移動通信ネットワーク4に対
して第2のマルチメディア移動端末2と通信する。制御データがマルチメディア
・データと同様に、2つの端末1、2の間で送信される。
【0027】 図2は、端末1の代表的なマルチメディア構成部品を示している。前記端末は
、ビデオ・コーデック10と、オーディオ・コーデック20と、データ・プロト
コル・マネージャ30と、制御マネージャ40と、マルチプレクサ/デマルチプ
レクサ50と、モデム60(必要な場合)とを含む。ビデオ・コーデック10は
、端末のビデオ捕捉装置(図示せず)(たとえば、カメラ)からの信号を符号化
のために受信し、ディスプレイ70上で端末1において表示するためのリモート
端末2からの信号を復号化するために受信する。オーディオ・コーデック20は
端末1のマイクロホン(図示せず)からの信号を符号化のために受信し、端末1
のラウドスピーカ(図示せず)によって再生するためのリモート端末2からの信
号を復号化のために受信する。端末は、無線電話機のような携帯型無線通信装置
であってよい。
【0028】 制御マネージャ40は、ビデオ・コーデック10、オーディオ・コーデック2
0およびデータ・プロトコル・マネージャ30の動作を制御する。しかし、本発
明はビデオ・コーデック10の動作に関係しているので、オーディオ・コーデッ
ク20およびデータ・プロトコル・マネージャ30についてはこれ以上説明しな
い。
【0029】 図3は、本発明によるビデオ・コーデック10の一例を示している。 ビデオ・コーデックは、エンコーダ部分100と、デコーダ部分200とを含
む。エンコーダ部分100は、端末1のカメラまたはビデオ・ソース(図示せず
)からビデオ信号を受信するための入力101を含む。スイッチ102が、INTR
Aモードの符号化とINTERモードの符号化との間でエンコーダを切り換える。ビデ
オ・コーデック10のエンコーダ部分100は、DCT変換器103と、量子化器
104と、逆量子化器108と、逆DCT変換器109と、加算器110と、複数
の画像記憶装置107(詳細は図4参照)と、予測誤差を形成するための減算器
106と、スイッチ113と、符号化制御マネージャ105とを含む。
【0030】 ビデオ・コーデック10のデコーダ部分200は、逆量子化器120と、逆DC
T変換器121と、動き補償器122と、複数の画像記憶装置123と、コント
ローラ124とを含む。コントローラ124は符号化されたマルチメディア・ス
トリームからデマルチプレクサ50によって逆多重化されたビデオ・コーデック
制御信号を受信する。実際には、エンコーダのコントローラ105と、デコーダ
のコントローラ124とは同じプロセッサであってよい。
【0031】 本発明によるエンコーダの動作が以下に記述される。ビデオ・コーデック10
は符号化されるビデオ信号を受信する。ビデオ・コーデックのエンコーダ100
はDCT変換、量子化および動き補償を実行することによって前記ビデオ信号を符
号化する。符号化されたビデオ・データは、次にマルチプレクサ50に出力され
る。マルチプレクサ50は、ビデオ・コーデック10からのビデオ・データ、お
よびコントロール40からの制御データ(および、適当な他の信号)をマルチメ
ディア信号に多重化する。端末1はこのマルチメディア信号をモデム60(必要
な場合)経由で受信側の端末2に出力する。
【0032】 INTRAモードにおいては、入力101からのビデオ信号が、DCT変換器103に
よってDCT係数に変換される。次に、DCT係数が、その係数を量子化する量子化器
104に渡される。スイッチ102および量子化器104は両方ともビデオ・コ
ーデックの符号化制御マネージャ105によって制御される。また、符号化制御
マネージャ105は、制御マネージャ40によって受信側の端末2からフィード
バック制御を受信する。次に、復号化された画像が量子化器からのデータ出力を
逆量子化器108を通して渡すことによって、そして逆量子化されたデータに対
して逆DCT変換109を適用することによって形成される。次に、結果のデータ
が加算器110に入力される。INTRAモードにおいては、スイッチ113が、ス
イッチ113から加算器110への入力が0に設定されるように設定される。加
算器110に対する2つの入力が一緒に加算され、その結果のデータが画像記憶
装置107に入力される。
【0033】 INTERモードにおいては、入力101からの信号と画像記憶装置107内に格
納されている基準画像との間の差を減算器106から受け入れるように操作され
る。減算器106から出力される差分データは、現在の画像と画像記憶装置10
7内に格納されている基準画像との間の予測誤差を表す。動き推定器111が、
従来の方法で画像記憶装置107内のデータを基準にして動き補償データを生成
することができる。
【0034】 符号化制御マネージャ105は、減算器106の出力または受信側のデコーダ
からのフィードバック制御データに対する応答のいずれかに基づいて、INTRAま
たはINTER符号化を適用するかどうか、あるいはそのフレーム全体を符号化する
かどうかを決定する。符号化制御マネージャは、現在のフレームと基準フレーム
との間の類似性が非常に高いか、あるいはフレームを符号化するための時間がな
い場合、受信フレームを符号化しないように決定することができる。符号化制御
マネージャはそれに従ってスイッチ102を操作する。
【0035】 フィードバック制御データに応答しない時、エンコーダは、通常、符号化の開
始時(他のすべてのフレームがPである)または一定の周期、たとえば、5秒ご
とのいずれかにおいて、あるいは減算器の出力から現在の画像と画像記憶装置1
07内に格納されている画像とがあまりにも違い過ぎると判断された時に、INTR
Aフレームとしてフレームを符号化するのが普通である。また、エンコーダは、
たとえば、IBBPBBPBBPBBPBBIBBPなどの特定の規則的なシー
ケンスでフレームを符号化するようにプログラムすることもできる。
【0036】 ビデオ・コーデックは量子化されたDCT係数112aと、量子化インデックス
112b(すなわち、使用されている量子化の詳細)と、実行される符号化のモ
ード(IまたはP/B)を示すためのINTRA/INTERフラグ112cと、符号化さ
れているフレームの数を示すための送信フラグ112dと、(INTERモードにお
いては)符号化されている画像に対する動きベクトル112eとを示すための送
信フラグ112dとを出力する。これらは他のマルチメディア信号と一緒にマル
チプレクサ50によって多重化される。
【0037】 エンコーダ100が、ビデオ・コーデックのエンコーダ100の簡単な図を示
す、図4を参照してさらに説明される。エンコーダ100は、複数の画像記憶装
置107a〜107gを含む。この例においては7個の画像記憶装置が示されて
いるが、画像記憶装置の数は2つ以上であってよい。 入力信号をIBBPBBPBBPBBPBBPBBPBBIなどのフォーマッ
トで符号化するように構成されているエンコーダを考える。簡単にするため、エ
ンコーダは入力信号のすべてのフレームを符号化する、すなわち、どのフレーム
もスキップされないと仮定する。これが図5に示されている。
【0038】 前に述べたように、フレームはビデオ捕捉装置から0、1、2、3、4、5、
6などの順序で受信され、この順序で表示される。すなわち、復号化フレームは
I0、B1、B2、P3、B4、B5、P6などの順序で表示される。しかし、
ビデオのビット・ストリームは下記の順序、すなわち、I0、P3、B1、B2
、P6、B4、B5などで圧縮され、送信され、復号化される。これは各Bフレ
ームが符号化/復号化される前に、前の基準フレームおよび後続の基準フレーム
を必要とするからである。すなわち、フレームB1はそれが符号化/復号化され
る前に、フレームI0およびP3が符号化/復号化される必要がある。
【0039】 第1のフレームが受信される時、画像記憶装置107のすべてが空であり、ス
イッチ102は入力信号がINTRAフォーマットで符号化されるように符号化コン
トローラ105の制御下でINTRAモードに置かれている。入力信号がDCT変換およ
び量子化される。これはマクロブロックについてマクロブロック・ベースで行わ
れる。その結果の信号が次に逆量子化器108および逆DCT109によって復号
化される。フレームがINTRA符号化されているので、スイッチ113は開いてい
る。加算器110の出力が第1の画像記憶装置107aに入力される。この目的
のために、スイッチ114aが閉じられ、一方、スイッチ114b〜gは開いて
いる。それ故、フレーム記憶装置107aは基準画像I0の復号化バージョンを
保持する。
【0040】 符号化されるべき次の画像はフレーム3であり、それはI0から前方に予測さ
れるべきである。したがって、フレーム3が101において入力されると、スイ
ッチ102がINTERモードに切り換えられ、最新の基準画像記憶装置の出力スイ
ッチ115(すなわち、スイッチ115a)が閉じられ、画像記憶装置107a
の動き補償された内容が入力信号から差し引かれ、動き補償されたデータが従来
の方法で計算される。この予測誤差が次にDCT103および量子化器104によ
って符号化され、逆量子化器108およびIDCT109によって復号化される。次
に、スイッチ113が閉じられ、スイッチ115aが閉じられ、スイッチ114
bが閉じられる(他のスイッチ114および115は開いている)。それ故、加
算器110は、復号化された画像を画像記憶装置107a内に格納されている画
像に加算し、その結果を画像記憶装置107bに格納する。
【0041】 符号化される次のフレームはフレーム2であり、それはBフレームとして符号
化される。それ故、フレーム記憶装置107aおよび107bの両方の内容が従
来の方法で減算器106に対して利用できる。Bフレームは他のどのフレームに
対する基準画像も形成しないので、符号化されたBフレームは復号化されず、基
準画像記憶装置内に格納される。 それ故、上記の場合において、19フレームの後、フレーム記憶装置107a
から107gまでが、フレームI0、P3、P6、P9、P12、P15および
P18の復号化バージョンをそれぞれ含む。
【0042】 本発明において、エンコーダがフレームを予測的な方法で符号化する時、符号
化制御マネージャ105は、そのフレームを「予備基準画像番号」(SRPN)と関
連付けることができる。たとえば、SRPNをビデオ信号のPフレームおよびBフレ
ームと関連付けることができるが、Iフレームと関連付けることはできない。 エンコーダは、このメッセージを使用して、どの基準画像(または複数の基準
画像)が現在の基準画像に似ているかをデコーダに知らせ、それらのうちの1つ
を、実際の基準画像が伝送の間に失われた場合に予備基準画像として使用するこ
とができるようにすることができる。
【0043】 フレーム3がフレーム0を基準として符号化される時、他の基準フレームは基
準画像記憶装置107a〜gの中には格納されない。したがって、SRPNはフレー
ム3と関連付けられない。同様に、フレーム1および2がフレーム0および3を
基準として双方向に符号化される時、基準画像記憶装置107a〜g内には他の
フレームは保持されていない。したがって、SRPNはこれらのフレームのいずれに
も関係付けられない。
【0044】 しかし、フレーム6がフレーム3(その復号化バージョンが画像記憶装置10
7b内に格納されている)から前方に予測される時、フレームI0の復号化され
たコピーも画像記憶装置107a内にある。エンコーダは、現在のフレームのデ
フォルト基準画像(すなわち、フレーム6に対するフレーム3)と他の格納され
た画像記憶装置、すなわち、画像記憶装置107aの内容との間の類似性を計算
する。2つの基準画像が十分によく似ていた場合(たとえば、フレーム記憶装置
107aの内容と107bの内容との間の相関がしきい値以上であった場合)、
エンコーダはSRPNをフレーム6に対するデータに関連付ける。そのSRPNは予備基
準画像としてフレーム0を識別する。しかし、類似性が十分でなかった場合、SR
PNはフレーム6に関連付けられない。
【0045】 類似性の測度を生成する方法は、本発明にとって重要ではなく、任意の適切な
類似性の測度を使用することができる。たとえば、「差の絶対値の和」(SAD)
を類似性の測度として使用することができる。好適には、SADの値は現在のフレ
ームに対するデフォルト基準画像内の空間的に対応しているピクセルともう1つ
の「潜在的な」基準フレーム、すなわち、画像記憶装置107のうちの1つ内に
格納されているフレームとの間の値の差を取ることによって計算される。各差の
絶対値が得られ、その絶対値の差の値が累積されてSADを形成する。このように
、デフォルト基準フレームと他の潜在的な基準フレームとの間の類似性をSADが
表している。明らかに、2つの画像はそれらの間のSADがしきい値以下である時
に十分に似ていると考えることができる。他の方法としては、現在の画像に対す
るデフォルト基準フレームと別の潜在的な基準フレームとの類似性を、画像のヒ
ストグラムを使用して評価することができる。画像のヒストグラムは、所与の画
像中のピクセル値の発生の回数の測度であり、2つの画像はそれぞれのヒストグ
ラムの対応している度合が大きい場合に似ていると考えることができる。
【0046】 本発明の1つの代替実施形態においては、現在のフレームに対するデフォルト
基準フレームと別の潜在的な基準フレームとの間の類似性を判定する代わりに、
エンコーダは、画像記憶装置107の1つの中の利用できる別の潜在的な基準フ
レームと現在のフレームそのものとの間の類似性を調べる。本発明のこの代替実
施形態においては、現在のフレームと潜在的な基準フレームとの間の許される最
大の差を定義しているしきい値が設定される。それ故、現在のフレームと十分に
高い類似性(小さい差)を示す任意の格納されたフレームを現在の画像に対する
予備の基準フレームとして使用することができる。ふたたび、「差の絶対値の和
」(SAD)、画像ヒストグラムまたは他の任意の適当な方法を使用して、現在の
フレームと他の潜在的な基準フレームとの間の類似性/差を評価することができ
る。
【0047】 理解されるように、フレーム15が(Pフレームとして)符号化される時、フ
レーム0、3、6、9および12の復号化バージョンが、それぞれ画像記憶装置
114a〜e内に保持されている。デフォルトによってフレーム15は画像記憶
装置107e中に格納されているフレーム12を基準として符号化される。また
、エンコーダは、画像記憶装置107e内のデータと画像記憶装置107a〜d
内に格納されている他のデータとの間の相関の計算も実行する。エンコーダは、
画像記憶装置107eの内容と相関が最も大きい、すなわち、符号化されている
現在のフレームに対するデフォルト基準画像と相関が最も大きい画像記憶装置(
したがって、基準画像)を識別する。次に、エンコーダは、その識別された基準
画像を示す符号化されたデータにSRPNを追加する。このSRPNは以下に説明される
ように、基準画像の時間的基準に等しくなる可能性がある。
【0048】 2つ以上のSRPNをフレームに関連付けることができる。この場合、SRPNは類似
性の順序で画像ヘッダ内に順序付けられ、最もよく似ている基準画像(デフォル
ト以外の)が最初に配置されている。 符号化制御マネージャ105は、このSRPN符号語を出力112fにおいて出力
し、それは符号化されたフレームと関連付けられた「予備基準画像番号」を示す
。これはマルチプレクサによってビデオのビット・ストリームに多重化される。
【0049】 図5は、このエンコーダの第1の実施形態の動作を示している。図5の第1行
は、捕捉入力装置から受信されたデータのフレームを表し、ビデオ・コーダに対
して入力101において入力される。図5の第2行は、エンコーダが符号化する
ことを決定する入力信号のフレームおよび各フレームを符号化するために使用さ
れる符号化モードを表す。前に述べたように、この例においては、エンコーダは
すべてのフレームを符号化し、IBBP符号化フォーマットを使用するように構成さ
れている。
【0050】 フレーム0はINTRAモードで符号化され;フレーム1はフレーム0および/ま
たは3を基準としてBフレームとして符号化され;フレーム2はフレーム0およ
び/または3を基準としてBフレームとして符号化され;フレーム3はフレーム
0を基準としてPフレームとして符号化され;フレーム4はフレーム3および/
または6を基準としてBフレームとして符号化され;フレーム5はフレーム3お
よび/または6を基準としてBフレームとして符号化され;フレーム6はフレー
ム3を基準としてPフレームとして符号化される。以下同様に符号化される。
【0051】 図5の第3行は、符号化された信号のフレームに関連付けられたSRPNフィール
ドを示している。この実施形態においては、SRPNは図5の第3行において示され
ているように、PフレームおよびBフレームに関連付けられている。符号化され
たフレームのPフレームおよびBフレームは時間的に予測的に符号化され、Iフ
レームは符号化されない。
【0052】 図5の第4行は、符号化されたフレームの時間的基準(TR)を示している。こ
れはH.263中に含まれる1つのフィールドであり、TRの値は時間的に前の基準画
像ヘッダ内のその値を、前に送信された基準画像からスキップされたか、あるい
は基準でない画像の数に1を足した値でインクリメントすることによって形成さ
れる。それ故、図5に示されている例においては、各フレームに対して示されて
いるTRは101に対する元の信号入力内のフレームの元の時間的順序と同じにな
っている。
【0053】 SRPNの可能な値の例が示されている。これらの値は、上記のように、エンコー
ダによって識別された予備基準フレームのTRを示している。この例は以前に符号
化された各画像に対して1つだけのSRPNを示しているが、以前に説明したように
、2つ以上のSRPNを以前に符号化された各画像に関連付けることができる。
【0054】 図6は、本発明によるエンコーダの第2の実施形態の動作を示している。この
実施形態においては、エンコーダは規則的なシーケンスIBBPBBPBBPB
BIBBPBBPに従ってフレームを符号化するように構成されている。しかし
、この実施形態においては、SRPNは前方に予測されたフレーム(すなわち、Pフ
レーム)だけに関連付けられている。
【0055】 図6の最初の行は、入力のフレームを示しており、第2行は符号化されたフレ
ームおよびそれぞれの符号化モード、I、PまたはBを示している。 図6の第3行は、Pフレームに関連付けられたSRPNを示している。これらは、
図4を参照して上で説明したように生成することができる。 図6の第4行は、符号化されたフレームの時間的基準(TR)を示している。図
5に示された例の場合のように、各フレームに対して示されているTRは、101
に対する元の信号入力内のフレームの元の時間的順序と同じである。
【0056】 端末1が端末2からの符号化されたビデオ・データを受信していると考えて、
ビデオ・コーデック10の動作が、その復号化の役割に関して以下に説明される
。端末1は、送信端末2からマルチメディア信号を受信する。デマルチプレクサ
50が、そのマルチメディア信号を逆多重化し、そのビデオ・データをビデオ・
コーデック10に渡し、制御データを制御マネージャ40に渡す。ビデオ・コー
デックのデコーダ200は、そのデータを逆量子化し、逆DCT変換し、そして動
き補償することによって、その符号化されたビデオ・データを復号化する。デコ
ーダのコントローラ124は、受信されたデータの完全性をチェックし、誤りが
検出された場合、前に説明された方法でその誤りを隠蔽しようとする。次にその
復号化され、補償され、隠蔽されたビデオ・データが、画像記憶装置123の1
つの中に格納され、受信端末1のディスプレイ70上で再生するために出力され
る。
【0057】 ビデオ・データにおける誤りは、画像レベル、GOBレベルまたはマクロブロッ
ク・レベルにおいて発生する場合がある。誤りチェックをこれらのレベルのいず
れか、またはそれぞれにおいて実行することができる。 最初に図5に示されているような信号を考え、本発明によるデコーダが、この
信号を受信すると、その信号の各信号フレームが、従来の方法で復号化されてか
らディスプレイ手段上で表示されると考える。復号化フレームは誤りが隠蔽され
ていて、誤りが従来の方法で符号化されている可能性がある。フレームが復号化
されるたびに、デコーダはTRフィールドを調べて、そのフレームが表示される時
期を決定する。
【0058】 図5に示されているケースにおいては、デコーダはフレーム0を受信し、その
画像ヘッダからそのフレームがINTRA符号化されていると判定する。デコーダは
、他のどの画像も参照せずにフレーム0を復号化し、それを画像記憶装置123
a内に格納する。次に、デコーダは、フレーム3を受信し、その画像ヘッダから
そのフレームがPフレームとしてINTER符号化されていることを判定する。した
がって、デコーダは、前の基準フレーム0を基準としてフレーム3を復号化し、
それを次の画像記憶装置123bに格納する。次に、デコーダは、フレーム0お
よび3を基準としてフレーム1および2を復号化する。以下同様に続く。これら
のフレームは画像記憶装置123には格納されない。何故なら、B画像と同様に
、それらは他の任意のフレームに対する基準フレームとしては使用されないから
である。
【0059】 ここで、デコーダが、フレーム9を復号化することができない(それ故、再構
成することができない)と仮定する(これはフレーム9のデータが大きく破損し
ているか、または全て失われているために起こる)。デコーダによって受信され
る次のフレームはフレーム7であり、それはTR=7、SRPN=0である。フレーム
9(フレーム7に対するデフォルト基準画像の1つ)は、デコーダによって復号
化されなかったので、デコーダは後方予測に対する受信されたフレームのヘッダ
内のSRPNを探す。しかし、フレーム7は後方向においてSRPNを含まない。したが
って、デコーダはフレーム7を復号化することができない。これは、またフレー
ム8に対するケースでもある。
【0060】 受信される次のフレームはフレーム12であり、それは画像9を基準として符
号化されたものであり、SRPN=6になっている。フレーム9が復号化されなかっ
たので、デコーダはSRPNによって示されている基準画像(すなわち、画像記憶装
置123cの中に格納されているフレーム6)を使用してフレーム12を復号化
する。次に、デコーダはフレーム10を受信し、それはフレーム9および12を
基準として符号化されたものであった。フレーム9はデコーダによって復号化さ
れなかった。しかし、フレーム10は、SRPN=6になっている。したがって、デ
コーダは、フレーム7ではなく画像記憶装置123c内に格納されている復号化
された基準フレーム6を使用し、前方においてフレーム10を復号化する。これ
はフレーム11の場合も同じである。
【0061】 デコーダは、基準フレームの省略をいくつかの方法で検出することができる。
たとえば、各符号化されたフレームの時間的順序に関連している情報を調べるこ
とができる。他の方法としては、符号化された信号の基準フレームに、同じ日付
で出願された英国特許出願の中に記述されているような順序で番号を割り当てる
ことができる。
【0062】 デコーダが、制御フィードバック・データを送信ビデオ・エンコーダに送信す
る機能を有している場合、そのデコーダは送信側のビデオ・エンコーダに要求を
送信し、フレームをINTRAフレームとして符号化し、したがって、フレーム10
および11がフレーム6を基準として復号化されることの結果として生じること
になる時間的な誤り伝播を停止させることができる。デコーダは信号を従来の方
法で復号化し続ける。
【0063】 デコーダが、INTRAフレームであるフレーム21を受信すると、デコーダは、
他のどのフレームも参照せずにフレーム21を復号化し、その復号化フレームを
画像記憶装置123に格納する。次に、デコーダはフレーム18および21を基
準としてフレーム19および20を復号化する。フレーム9ではなく、フレーム
6を基準としてフレーム12を復号化することによって、フレーム18に対して
、ある程度の誤りが入り込んだ可能性があるが、その結果の画像は満足できるも
のであり、表示される画像は、INTRA画像が受信されるまで凍結状態に保たれな
い。これは見る人により喜ばれるだろう。
【0064】 ここで図6に示されているような信号を考え、本発明によるデコーダが、この
信号を受信すると、その信号の各フレームが、従来の方法で復号化されてからデ
ィスプレイ手段上で表示されると考える。復号化フレームは、誤り訂正および誤
り隠蔽が従来の方法で行われている可能性がある。フレームが復号化されるたび
に、デコーダはそのTRフィールドを調べてそのフレームをいつ表示するかを決定
する。
【0065】 デコーダは、INTRAフレームであるフレーム0を受信し、それをそれに従って
復号化し、画像記憶装置123aに格納する。ここでデコーダがフレーム3を再
構成することができず(これはそのデータが大幅に破損しているか、あるいは全
て失われているために発生する)、そしてデコーダによって受信されて復号化さ
れる次のフレームがフレーム1であると仮定する。フレーム1は、フレーム0お
よび3を基準として符号化された双方向フレームである。フレーム3が失われて
いるので、デコーダはフレーム1を再構成することができず、同様にフレーム2
を再構成することができない。Bフレーム1および2が失われているという事実
はデコーダに影響しない。何故なら、Bフレームは他のどのフレームに対しても
基準画像を形成せず、それ故、その消失は時間的な誤り伝播を導入しないからで
ある。デコーダは、その信号を通常の方法で復号化し続ける。
【0066】 デコーダによって受信されて復号化される次のフレームはフレーム6である。
デコーダは、前の基準画像P3が失われていること(デコーダがフレーム1また
は2を復号化することができなかったので)を知っている。したがって、デコー
ダは、SRPNを求めて受信されたフレームのヘッダを調べる。デコーダは、フレー
ム6がSRPN=0であることを知り、したがって、画像記憶装置123a内のフレ
ーム0を使用してフレーム6を復号化する。
【0067】 デコーダが、送信側のビデオ・エンコーダに制御フィードバック・データを送
信する機能を備えている場合、そのデコーダは、送信側のビデオ・エンコーダに
対してINTRAフレームとしてフレームを符号化するよう要求を送信し、デフォル
ト・フレーム3ではなく、フレーム0を基準として復号化されたフレーム6を基
準として後続のフレームが復号化されることの結果として生じる時間的な誤り伝
播を停止させることができる。しかし、デコーダは復号化を継続することができ
、それがINTRA符号化されたフレームを待っている間、ディスプレイ上でその画
像を凍結しない。
【0068】 予備基準画像番号を符号化された信号内に含めることができる方法を、H.263
ビデオ符号化規格を参照して以下に説明する。 図7は、H.263に従う、周知のビット・ストリーム構文を示している。以下の
実施形態は、GOBフォーマットを記述するが、本発明は、スライス・フォーマッ
トで実施することもできることは当業者にとって明らかである。 既に述べたように、ビット・ストリームは4つの層を備えている。それらは画
像層、画像セグメント層、マクロブロック層およびブロック層である。画像層は
、画像ヘッダの後にブロックのグループに対するデータが続き、結果としてその
次にオプションの「シーケンスの終り」符号およびスタッフビットが続く。 従来技術のH.263のビット・ストリームは、図7に示されているようにフォー
マット化されている。各部分に対する記述子が以下に与えられる。
【0069】
【表1】
【0070】 図7に示されているような構造は、オプションのPLUSTYPEデータ・フィールド
を含まない。PSBIは、CPMによって示されている場合にのみ存在する。TRおよ
びDBQUANTは、PTYPEがいわゆるPBフレーム・モードの仕様を示している場合にの
み存在する(PLUSTYPEフィールドが存在してDBQUANTの使用がその中で示されて
いない限り)。これらの事項はH.263の仕様書の中でより詳しく扱われている。
【0071】 次のパラグラフでは、本発明の第1の態様によるエンコーダによって出力され
るビット・ストリームの可能な実施形態を概説する。 予備基準画像番号をH.263のビット・ストリーム中に、以下のように組み込む
ことができる。図8は、本発明の第1の実施形態によるエンコーダから出力され
るビット・ストリームの一例を示している。図8に示されているように、そのビ
ット・ストリームは、「予備基準画像番号」を示す符号語であるさらに1つの符
号語SRPNを含む。これは上記のように、本発明によるエンコーダによって挿入さ
れる。
【0072】 他の方法としては、SRPNは、「補助的エンハンスメント情報」PSUPP(H.263の
付録および図5参照)に含めることができる。この補助的情報は、そのデコーダ
がそれを使用するための強化機能を提供することができない場合であっても、あ
るいはそれを正しく解釈することができない場合であっても、ビット・ストリー
ム中に存在することができる。この補助的情報を単純に捨てることは、要求され
た機能を提供するための条件が外部手段によってネゴシエートされていない限り
、デコーダによって許される。 PEIが「1」に設定されている場合、8ビットのデータ(PSUPP)および、次に
更なる9個のビットが続くかどうかを示すための別のPEIビットから構成されて
いる9個のビットが続く。
【0073】 PSUPPデータは、4ビットの機能タイプ指示FTYPEと、その次に4ビットのパラ
メータ・データ・サイズ仕様DSIZEが続き、その後にファンクション・パラメー
タ・データのDSIZEのオクテットが続き、オプションとして別のFTYPEが続くよう
に構成されている。このPSUPP符号語を使用して各種の状況を知らせることは周
知である。たとえば、PSUPPはサイズ変更あり/なしで画像全体または部分的な
画像の凍結または凍結−解放要求を示すため;外部使用のためにビデオ・ストリ
ーム中の画像の特定の画像または画像のシーケンスにタグを付けるため;あるい
は、ビデオ・コンポジットのための色彩キー情報を伝えるために使用される。 「補助的エンハンスメント」情報を使用して本発明を実施するために、さらに
1つのFTYPEが「予備基準画像番号」として定義されている。
【0074】 図9は、パラメータSRPNが画像ヘッダのSEIの中に含められている例を示し
ている。FTYPEはSRPNとして定義される。DSIZEはそのパラメータのサイズを規定
し、それに続くオクテットはパラメータ・データ、すなわち、SRPNの値である。
この値から、受信側のデコーダはメインの基準画像が失われたか、あるいは破損
した場合に使用できる予備基準画像が定義されているかどうかを判定することが
できる。
【0075】 他の方法としては、その情報を“Draft of new Annex W:Additional Supplem
entary Enhancement Information Specification”(新しい付録Wの草案:追加
の補助的エンハンスメント情報の仕様)P.ニング(Ning)およびS.ウエンガ
(Wenger),ITU−T Study Group 16 Question 15 Document Q15−I−58,Nove
mber 1999の中で規定されているような、追加の「補助的エンハンスメント」情
報の中に含めることができる。
【0076】 付録Wに対するこの草案の提案において、FTYPE14が「画像メッセージ」と
して定義されている。このFTYPEが設定されていると、画像メッセージ機能が、
メッセージ・データを表している1つまたはそれ以上のオクテットの存在を示す
。そのメッセージ・データの最初のオクテットは、図10に示されている構造の
メッセージ・ヘッダ、すなわち、CONT、EBITおよびMTYPEである。DSIZEは、最初
のオクテット・メッセージ・ヘッダを含む画像メッセージ機能に対応しているメ
ッセージ・データ中のオクテットの数に等しい。
【0077】 継続フィールドCONTは、1に等しい場合、その画像メッセージに関連付けられ
ているメッセージ・データが、次の画像メッセージ機能に関連付けられているメ
ッセージ・データと同じ論理メッセージの部分であることを示している。「終り
のビット位置」フィールドEBITは、最後のメッセージ・オクテットの中で無視さ
れる下位ビットの数を規定する。これらのフィールドの詳細は、付録Wの中に記
載されている。
【0078】 フィールドMTYPEはメッセージのタイプを示す。各種のタイプのメッセージが
付録Wの草案の中で提案されている。本発明によれば、1つのタイプ、たとえば
、MTYPE13が「予備基準画像」として定義されている。MTYPE13の値はメッセ
ージ・ヘッダに続いているオクテットの中で定義されている。メッセージ・デー
タのバイトは、好みの順序で予備基準画像の「画像番号」を含む(最も好ましい
ものが最初に現れる)。「画像番号」は、付録Uまたは付録WのセクションW.6
.3.12に従って送信される値を指す。付録Wによるメッセージ・フォーマットを
P、B、PB、改善されたPB、およびEPの画像タイプに対して使用することができ
る。しかし、付録Nまたは付録Uが使用されていて、その画像が複数の基準画像
と関連付けられている場合、付録Wによるメッセージ・フォーマットは使用され
ないことが好ましい。EP画像の場合、そのメッセージは、好適には、前方予測の
ためだけに使用されるべきである。一方、上方向の予測は時間的に対応している
基準層の画像から常に行うことができる。B、PBおよび改善されたPBの画像タイ
プに対して、メッセージは前方の動き予測基準として使用するための画像を規定
する。このメッセージは、その画像がIまたはEIの画像である場合には使用され
るべきではない。
【0079】 1つの予備基準画像が示されて、そのSRPNが10ビットで表されている特定の
例において、このメッセージは1つのデータ・タイプ、すなわち、DSIZEが3、C
ONTが0、EBITが6であるデータ・バイトを含む。DSIZE、CONTおよびEBITの値は
、示されている予備基準画像の数およびその予備基準画像番号が表される精度(
ビットの数)によって変化することを理解されたい。2つ以上の予備基準画像番
号が示されている場合、そのメッセージ・データ・タイプは好みの順序で(最も
好ましいものが最初に現れる)で予備基準画像の「予備基準画像番号」を含むこ
とが好ましい。
【0080】 上記説明は、双方向に予測された画像(B画像)を符号化する、符号化された
ビデオ・ストリームに関して行われてきた。前に述べたように、B画像は基準画
像としては決して使用されない。それ以降の画像の画像品質に影響を及ぼさずに
B画像を捨てることができるので、それらは時間的なスケーラビリティを提供す
る。スケーラビリティによって2つ以上の品質レベルにおいて圧縮されたビデオ
・シーケンスの復号化が可能である。言い換えれば、スケーラブルなマルチメデ
ィア・クリップを圧縮し、それを異なるデータ・レートでチャネル上でストリー
ム化し、リアルタイムで復号化して再生できるようにすることができる。
【0081】 それ故、ビデオ・ストリームを異なるデコーダによって異なる方法で復号化す
ることができる。たとえば、デコーダは、そのデコーダが達成できる復号化の最
大レートである場合に、信号のIおよびP画像だけを復号化するように決定する
ことができる。しかし、デコーダがその容量を有している場合、それはB画像も
復号化することができ、したがって、画像の表示レートを増加させることができ
る。したがって、表示された画像の認識される画像品質が、IおよびPの画像だ
けを復号化するデコーダ上で改善される。
【0082】 スケーラブルなマルチメディアは、通常、データの階層的な層があるように順
序付けられている。ベース層は、そのマルチメディア・クリップの基本的な表示
を含み、一方、エンハンスメント層はその下にある層のトップにリファインメン
ト・データを含む。結果として、エンハンスメント層はそのクリップの品質を改
善する。 スケーラビリティは異種混合の、そして誤りが発生しやすい環境に対して望ま
しい性質である。この性質は、制限事項、たとえば、ビット・レート、ディスプ
レイの分解能、ネットワークのスループット、およびデコーダの複雑度における
制約に対処するために望ましい。
【0083】 階層型の符号化が、トランスポートの優先順位付けと組み合わされているトラ
ンスポート・システムにおいて、誤りからの復元能力を改善するために、スケー
ラビリティを使用することができる。トランスポートの優先順位付けは、ここで
はトランスポートにおける異なるサービスの品質、たとえば、不平等な誤り保護
を提供するため、誤り/消失レートが異なる、異なるチャネルを提供するための
各種のメカニズムを指す。それらの性質に依存して、データが異なって割り当て
られている。たとえば、ベース層は誤り保護が高度であるチャネルを通じて配送
することができ、そしてエンハンスメント層は比較的誤りが起きやすいチャネル
を通して送信することができる。
【0084】 一般に、スケーラブルなマルチメディア符号化は非スケーラブルな符号化より
圧縮効率が悪い。言い換えれば、エンハンスメント層を伴ってスケーラブルなマ
ルチメディア・クリップとして符号化されたマルチメディア・クリップは、それ
が平等な品質の非スケーラブルな単独層のクリップとして符号化された場合より
大きなバンド幅を必要とする。しかし、この一般的な規則に対する例外が存在す
る。たとえば、ビデオ圧縮における時間的にスケーラブルなBフレームがその例
外である。
【0085】 本発明は、他のスケーラブルなビデオ圧縮システムに適用することができる。
たとえば、H.263の付録Oにおいて、2つの他の形式のスケーラビリティが定義
されている。それらは信号対雑音(SNR)のスケーラビリティおよび空間的スケ
ーラビリティである。 空間的スケーラビリティおよびSNRのスケーラビリティは密接に関連付けられ
ており、その唯一の違いは空間的スケーラビリティによって提供される増強され
た空間分解能である。SNRスケーラブルな画像の一例が図11に示されている。S
NRのスケーラビリティはマルチ・レートのビット・ストリームの生成を含む。そ
れによって符号化誤り、または元の画像とその再構成画像との間の違いの回復が
可能である。これはより細かい量子化器を使用してエンハンスメント層において
異なる画像を符号化することによって達成される。この追加の情報によって再構
成された画像の総合的なSNRが増加する。
【0086】 空間的スケーラビリティによって、各種のディスプレイ条件および/または制
約を満たすために複数分解能のビット・ストリームを生成することができる。空
間的にスケーラブルな構造が図12に示されている。それはSNRのスケーラビリ
ティと本質的に同じであるが、空間的エンハンスメント層は再構成された基準層
画像のアップサンプルされたバージョンと元の画像のより高い分解能のバージョ
ンとの間の符号化消失を回復しようとする。たとえば、その基準層が4分の1共
通中間フォーマット(QCIF)の分解能を備えていて、エンハンスメント層が共通
中間フォーマット(CIF)分解能を備えている場合、その基準層の画像はそれに
従ってスケールされ、エンハンスメント層の画像をそれから予測できるようにし
なければならない。QCIF規格において、垂直方向のみ、水平方向のみ、あるいは
垂直および水平の両方の方向において単独のエンハンスメント層に対して分解能
を2倍増加させることができる。複数のエンハンスメント層があって、それぞれ
が前の層の画像分解能を増加させるようにすることができる。基準層の画像をア
ップサンプルするために使用される補間フィルタがH.263規格において明示的に
定義されている。エンハンスメント層に対する基準からのアップサンプリング・
プロセスはさておき、空間的にスケールされた画像の処理および構文はSNRスケ
ール型の画像の場合と同じである。
【0087】 SNRまたは空間的のスケーラビリティのいずれにおいても、エンハンスメント
層の画像はEIまたはEP画像と呼ばれる。エンハンスメント層の画像が基準層にお
ける画像から上方に予測される場合、そのエンハンスメント層の画像はエンハン
スメント−I(EI)画像と呼ばれる。このタイプのスケーラビリティにおいて、
基準層は現在のエンハンスメント層の「下の」層を意味する。いくつかのケース
においては、基準層の画像の予測が不完全であると、その画像の静的な部分の過
剰符号化がエンハンスメント層において発生する可能性があり、不必要に過剰な
ビット・レートを生じる可能性がある。この問題を避けるために、エンハンスメ
ント層においては前方の予測が許される。前のエンハンスメント層の画像から前
方に予測することができるか、あるいは代わりに、基準層の画像から上方向に予
測することができる画像はエンハンスメント−P(EP)画像と呼ばれる。上方向
および前方に予測された画像の平均を計算することによって、EP画像に対する双
方向の予測を提供することができることに留意されたい。EIおよびEPの画像の両
方に対して、基準層の画像からの上方向の予測は、動きベクトルが不要であるこ
とを意味する。EP画像に対する前方予測の場合、動きベクトルが必要である。
【0088】 SRPNフィールドをP、PB、改善されたPB、およびエンハンスメント層(EP)の
画像と関連付けることができる。PBおよび改善されたPBフレームの特性がH.263
の付録Gおよび付録Mにそれぞれ記述されている。 しかし、付録Nまたは付録Uが使用されていて、その画像に複数の基準画像が
関連付けられている場合、SRPNは使用されない。PBおよび改善されたPBの画像の
場合、通常、メッセージはP部分だけに関係する。EP画像の場合、そのメッセー
ジは前方に対して使用され、一方、上方向の予測は時間的に対応している基準層
の画像から行われる。このメッセージは、その画像がI、EIまたはB画像である
場合には使用されないことが好ましい。
【0089】 エンコーダが複数層の符号化(たとえば、H.263の付録Oにおいて説明されて
いるような)が可能である場合、各層は連続した予備基準画像番号を持っている
。これらを現在の画像のエンハンスメント層番号(ELNUM)と関連付けることが
できる。「予備基準画像番号」は、同じエンハンスメント層の中の以前に符号化
された基準画像の対応している番号から1だけインクリメントされている。しか
し、同じエンハンスメント層の中の隣接している画像が同じ時間的基準を有して
いて、H.263の付録Nまたは付録Uが使用されている場合、そのデコーダはこれ
をほぼ同じ画像のシーンの内容の冗長なコピーが送られたこと、そしてこれらの
画像のすべてがその時同じ「画像番号」を共有していることの指示とみなすこと
が好ましい。
【0090】 本発明の1つの実施形態によれば、現在の画像の規定された四角形の領域に対
してSRPNを示すことができることにも留意されたい。1つの画像に対して複数の
メッセージがある可能性があり、それぞれが現在の画像のオーバラップしていな
い四角形の領域に対してSRPNを指定している場合がある。そのメッセージが画像
のいくつかの領域に対してSRPNを指定していない場合、デコーダは誤り隠蔽を使
用し、それらが予測された元の対応している基準フレーム(またはその領域)を
復号化できない場合にそれらの領域における誤りを隠すことができる。この状況
においては、デコーダは画像のタイプに対応する隠蔽方法を使用することが好ま
しい。すなわち、INTRA画像に対してはINTRA誤り隠蔽法が使用され、INTER画像
に対してはINTER誤り隠蔽法が使用される。
【0091】 現在の画像の異なる領域に対して、SRPN値が提供されている上記の状況の1つ
の特定の例を以下に説明する。各SRPNメッセージは、1つのSRPNおよびその画像
の規定された四角形の領域の左上隅の水平および垂直の位置を含む4つのPSUPP
オクテットと、それぞれ8ビットを使用して16ピクセルの単位で表現されてい
る四角形の領域の幅および高さ(明るい画像の)とを含む。たとえば、この決ま
りを使用し、QCIF画像全体が4つのパラメータ(0,0,11,9)によって規定される
【0092】 幅および高さが16で割り切れない画像フォーマットの場合、16で割り切れ
る次のより大きいサイズまで、その規定された領域を拡張することができる。た
とえば、160×120ピクセルのサイズの画像全体が4つのパラメータ(0,0,
10,8)によって規定される。その規定された領域は、同じ画像の他の規定された
誤り隠蔽領域と境界が交差しないか、あるいはオーバラップしないことが好まし
い。
【0093】 本発明は、他のビデオ符号化プロトコルで実施することもできる。たとえば、
MPEG−4は、任意のバイナリ・データを含み、画像と必ずしも関連付けられてい
ない、いわゆるユーザ・データを提示している。これらのフィールドに対してフ
ィールドを追加することができる。 本発明は、上記ビデオ符号化プロトコルに限定されることを意図しているもの
ではない。これらは単に例示としてのものに過ぎない。本発明は、時間的予測を
使用した任意のビデオ符号化プロトコルに対して適用することができる。上記の
ように情報を追加することによって、受信側のデコーダが、画像が失われた場合
に最善のアクションの理由を決定することができる。
【図面の簡単な説明】
【図1】 マルチメディア移動通信システムを示す。
【図2】 マルチメディア端末のマルチメディア構成部品の一例を示す。
【図3】 ビデオ・コーデックの一例を示す。
【図4】 本発明によるビデオ・エンコーダのより詳しい図を示す。
【図5】 本発明によるビデオ・エンコーダの第1の実施形態の動作を示す。
【図6】 本発明によるビデオ・エンコーダの第2の実施形態の動作を示す。
【図7】 H.263により周知のビット・ストリームの構文を示す。
【図8】 本発明によるエンコーダからのビット・ストリーム出力の第1の例を示す。
【図9】 本発明によるエンコーダからのビット・ストリーム出力の第2の例を示す。
【図10】 本発明によるエンコーダからのビット・ストリーム出力の第3の例を示す。
【図11】 SNRスケーラビリティのためにビデオ符号化において使用されるエンハンスメ
ント層を示す。
【図12】 空間的スケーラビリティのためにビデオ符号化において使用されるエンハンス
メント層を示す。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CR,CU,CZ,DE,DK ,DM,DZ,EE,ES,FI,GB,GD,GE, GH,GM,HR,HU,ID,IL,IN,IS,J P,KE,KG,KP,KR,KZ,LC,LK,LR ,LS,LT,LU,LV,MA,MD,MG,MK, MN,MW,MX,MZ,NO,NZ,PL,PT,R O,RU,SD,SE,SG,SI,SK,SL,TJ ,TM,TR,TT,TZ,UA,UG,UZ,VN, YU,ZA,ZW Fターム(参考) 5C059 MA00 MA05 MA14 MA23 MA31 MC11 NN21 PP05 PP06 PP07 RA09 RB09 RF11 RF15 SS10 TA76 TB07 TC00 TC25 TD05 TD10 UA02 UA05

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 画像のシーケンスを表しているビデオ信号を符号化する方法
    であって、前記方法が、符号化のために現在の画像を受信するステップと、前記
    現在の画像に対するデフォルト基準画像から前記現在の画像の時間的予測を形成
    するステップと、前記デフォルト基準画像を少なくとも1つの別の基準画像と比
    較するステップと、前記デフォルト基準画像と各別の基準画像との類似性の測度
    を計算するステップと、前記類似性の測度が所定の基準を満たす場合、前記別の
    基準画像を識別する指示子を出力するステップとを含むことを特徴とする方法。
  2. 【請求項2】 請求項1に記載の方法において、さらに、前記現在の画像に
    対する第1のデフォルト基準画像と第2のデフォルト基準画像とから前記現在の
    画像の時間的予測を形成するステップを含み、前記第1のデフォルト基準画像が
    時間的に前記現在の画像の前に発生し、前記第2のデフォルト基準画像が時間的
    に前記現在画像の後に発生し、前記方法が、さらに、前記第1のデフォルト基準
    画像を時間的に前記現在の画像の前に発生している少なくとも1つの別の基準画
    像と比較するステップと、前記第1のデフォルト基準画像と各別の基準画像との
    間の類似性の測度を計算するステップと、前記類似性の測度が所定の基準を満た
    す場合、前記別の基準画像を識別する指示子を出力するステップとを含むことを
    特徴とする方法。
  3. 【請求項3】 請求項1または2に記載の方法において、さらに、前記デフ
    ォルト基準画像を複数の別の基準画像と比較するステップと、前記所定の基準を
    満たす前記各別の基準画像に対する指示子を出力するステップとを含むことを特
    徴とする方法。
  4. 【請求項4】 請求項3に記載の方法において、さらに、前記所定の基準を
    満たす前記別の基準画像をランク付けするステップと、ランクの順序で前記現在
    のフレームの前記時間的な予測に前記指示子を関連付けるステップとを含み、前
    記デフォルト基準画像に最もよく似ている前記別の基準画像が最初に置かれるこ
    とを特徴とする方法。
  5. 【請求項5】 請求項1乃至4のいずれかに記載の方法において、前記指示
    子が画像ヘッダ内に含まれることを特徴とする方法。
  6. 【請求項6】 請求項1乃至5のいずれかに記載の方法において、前記ビデ
    オ信号がH.263ビデオ圧縮規格に従って符号化され、前記指示子が「補助的エン
    ハンスメント情報」の中に含められることを特徴とする方法。
  7. 【請求項7】 請求項1乃至6のいずれかに記載の方法において、前記比較
    が1度に1つの画像の部分に対して実行されることを特徴とする方法。
  8. 【請求項8】 画像のシーケンスを表しているビデオ信号を符号化する方法
    であって、前記方法が、符号化のために現在の画像を受信するステップと、前記
    現在の画像に対するデフォルト基準画像から前記現在の画像の少なくとも一部分
    の予測を形成するステップと、前記デフォルト基準画像または前記現在の画像の
    部分を前記シーケンスの少なくとも1つの対応する部分と比較して類似性の測度
    を形成するステップと、前記類似性の測度が所定の基準を満たす場合、前記シー
    ケンスの前記別の画像を識別する指示子を前記現在のフレームの部分に関して出
    力するステップとを含むことを特徴とする方法。
  9. 【請求項9】 画像のシーケンスを表している符号化されたビデオ信号を復
    号化する方法であって、前記符号化された信号が、前記現在の画像に対するデフ
    ォルト基準画像から現在の画像の時間的予測を形成することによって符号化され
    た画像を含み、前記方法が、現在の画像を表している符号化されたビデオ信号を
    受信するステップと、少なくとも前記現在の画像の画像ヘッダを復号化するステ
    ップとを含み、前記デコーダが前記現在の画像の前記デフォルト基準画像を復号
    化することができない時、別の基準画像を識別する指示子が前記現在の画像に関
    連付けられている場合に、前記指示子を調べ、前記別の基準画像を基準として前
    記現在の画像を復号化するステップを含むことを特徴とする方法。
  10. 【請求項10】 ビデオ・エンコーダであって、画像のシーケンスを表して
    いるビデオ信号を受信するための入力と、符号化のために現在の画像を受信する
    ための入力と、前記現在の画像に対するデフォルト基準画像から前記現在の画像
    の時間的予測を形成するための予測コーダと、前記デフォルト基準画像または前
    記現在の画像を少なくとも1つの別の基準画像と比較して、その類似性の測度を
    計算し、前記類似性の測度が所定の基準を満たす時、前記別の基準画像を識別す
    る指示子を出力するためのコンパレータとを含むことを特徴とするビデオ・エン
    コーダ。
  11. 【請求項11】 画像のシーケンスを表している符号化されたビデオ信号を
    受信するための入力を含むビデオ・デコーダであって、前記符号化された信号が
    、前記現在の画像に対するデフォルト基準画像から前記現在の画像の時間的予測
    を形成することによって符号化された画像を含み、前記デコーダが、現在の画像
    を表している符号化されたビデオ信号を受信するための入力と、少なくとも前記
    現在の画像の画像ヘッダを復号化するためのプロセッサとを含み、前記デコーダ
    が前記現在の画像の前記デフォルト基準画像を復号化することができない時、前
    記デコーダが別の基準画像を識別する指示子を調べ、前記指示子が前記現在の画
    像に関連付けられている場合に、前記別の基準画像を基準として前記現在の画像
    を復号化するように構成されることを特徴とするビデオ・デコーダ。
  12. 【請求項12】 請求項10に記載のエンコーダおよび/または請求項11
    に記載のデコーダを含むことを特徴とする無線通信装置。
JP2001585519A 2000-05-15 2001-05-14 ビデオ符号化方法 Expired - Lifetime JP4362259B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0011606.1 2000-05-15
GB0011606A GB2362532B (en) 2000-05-15 2000-05-15 Video coding
PCT/EP2001/005453 WO2001089223A2 (en) 2000-05-15 2001-05-14 Video coding

Publications (3)

Publication Number Publication Date
JP2003533950A true JP2003533950A (ja) 2003-11-11
JP2003533950A5 JP2003533950A5 (ja) 2007-09-27
JP4362259B2 JP4362259B2 (ja) 2009-11-11

Family

ID=9891561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001585519A Expired - Lifetime JP4362259B2 (ja) 2000-05-15 2001-05-14 ビデオ符号化方法

Country Status (16)

Country Link
US (1) US7711052B2 (ja)
EP (2) EP2148513B1 (ja)
JP (1) JP4362259B2 (ja)
KR (2) KR100892119B1 (ja)
CN (2) CN100394802C (ja)
AT (1) ATE522086T1 (ja)
AU (1) AU2001272409A1 (ja)
BR (1) BRPI0110770B1 (ja)
CA (1) CA2409027C (ja)
EE (1) EE05652B1 (ja)
GB (1) GB2362532B (ja)
HK (1) HK1079938A1 (ja)
HU (1) HU230597B1 (ja)
MX (1) MXPA02011201A (ja)
WO (1) WO2001089223A2 (ja)
ZA (1) ZA200208744B (ja)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1338131B1 (en) 2000-11-29 2009-08-19 BRITISH TELECOMMUNICATIONS public limited company Transmitting and receiving real-time data
US20030219232A1 (en) * 2001-10-01 2003-11-27 Shu Lin System and method for identifying data on a storage medium
US7610358B2 (en) * 2001-11-26 2009-10-27 Time Warner Cable System and method for effectively presenting multimedia information materials
FR2834852B1 (fr) * 2002-01-16 2004-06-18 Canon Kk Procede et dispositif de segmentation temporelle d'une sequence video
FI114527B (fi) * 2002-01-23 2004-10-29 Nokia Corp Kuvakehysten ryhmittely videokoodauksessa
RU2297729C2 (ru) * 2002-01-23 2007-04-20 Нокиа Корпорейшн Группирование кадров изображения на видеокодировании
JP4150951B2 (ja) * 2002-02-19 2008-09-17 ソニー株式会社 動画配信システム、動画配信装置および方法、並びにプログラム
JP2004088722A (ja) 2002-03-04 2004-03-18 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
ES2355083T3 (es) * 2002-03-27 2011-03-22 British Telecommunications Public Limited Company Codificación y transmisión de vídeo.
EP1359722A1 (en) 2002-03-27 2003-11-05 BRITISH TELECOMMUNICATIONS public limited company Data streaming system and method
ES2644005T3 (es) * 2002-04-19 2017-11-27 Panasonic Intellectual Property Corporation Of America Procedimiento de cálculo de vectores de movimiento
ES2745059T3 (es) 2002-04-19 2020-02-27 Panasonic Ip Corp America Método de cálculo de vectores de movimiento
KR20040011903A (ko) * 2002-07-31 2004-02-11 최두현 대본 혹은 영상의 유사성과 사람의 인지 능력을 고려한동영상 파일 인코딩 방법
KR20040035005A (ko) * 2002-10-18 2004-04-29 (주) 임펙링크제너레이션 비디오 압축을 위한 결정선택방법을 이용한모션정보예측보간
EP2309758B1 (en) 2002-11-20 2014-07-30 Panasonic Intellectual Property Corporation of America Moving image predicting method, moving image encoding method and device, and moving image decoding method and device
GB0306296D0 (en) 2003-03-19 2003-04-23 British Telecomm Data transmission
JP2004350263A (ja) * 2003-04-28 2004-12-09 Canon Inc 画像処理装置及び画像処理方法
US8472792B2 (en) 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
US9560367B2 (en) * 2004-09-03 2017-01-31 Nokia Technologies Oy Parameter set and picture header in video coding
US20060083298A1 (en) * 2004-10-14 2006-04-20 Nokia Corporation Reference picture management in video coding
US7417632B2 (en) * 2004-12-02 2008-08-26 Sap Ag Automatic testing of graphics programs
US9049449B2 (en) * 2005-04-13 2015-06-02 Nokia Corporation Coding of frame number in scalable video coding
US7817180B2 (en) * 2005-04-28 2010-10-19 Apple Inc. Video processing in a multi-participant video conference
KR100878811B1 (ko) * 2005-05-26 2009-01-14 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 이의 장치
EP1793581A1 (en) * 2005-12-05 2007-06-06 Microsoft Corporation Automatic selection of images for transfer depending on connection characteristics
WO2007106844A2 (en) 2006-03-14 2007-09-20 Divx, Inc. Federated digital rights management scheme including trusted systems
US8253752B2 (en) * 2006-07-20 2012-08-28 Qualcomm Incorporated Method and apparatus for encoder assisted pre-processing
EP3901779B1 (en) 2007-01-05 2022-10-26 DivX, LLC Video distribution system including progressive playback
EP1944978A1 (en) * 2007-01-12 2008-07-16 Koninklijke Philips Electronics N.V. Method and system for encoding a video signal. encoded video signal, method and system for decoding a video signal
US8494049B2 (en) * 2007-04-09 2013-07-23 Cisco Technology, Inc. Long term reference frame management with error video feedback for compressed video communication
JP5513400B2 (ja) 2007-11-16 2014-06-04 ソニック アイピー, インコーポレイテッド マルチメディアファイルのための階層的で簡略なインデックス構造体
US8638844B2 (en) * 2008-07-01 2014-01-28 Mediatek Inc. Method and apparatus for storing decoded moving pictures with a reduced memory requirement
FR2934453B1 (fr) * 2008-07-22 2010-10-15 Canon Kk Procede et dispositif de masquage d'erreurs
KR101631270B1 (ko) * 2009-06-19 2016-06-16 삼성전자주식회사 의사 난수 필터를 이용한 영상 필터링 방법 및 장치
US8781122B2 (en) 2009-12-04 2014-07-15 Sonic Ip, Inc. Elementary bitstream cryptographic material transport systems and methods
KR101681589B1 (ko) * 2010-07-27 2016-12-01 엘지전자 주식회사 영상 처리 장치 및 그 방법
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US9247312B2 (en) 2011-01-05 2016-01-26 Sonic Ip, Inc. Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol
US8989256B2 (en) * 2011-05-25 2015-03-24 Google Inc. Method and apparatus for using segmentation-based coding of prediction information
US8812662B2 (en) 2011-06-29 2014-08-19 Sonic Ip, Inc. Systems and methods for estimating available bandwidth and performing initial stream selection when streaming content
US9635374B2 (en) * 2011-08-01 2017-04-25 Apple Inc. Systems and methods for coding video data using switchable encoders and decoders
KR102163151B1 (ko) 2011-08-30 2020-10-08 디빅스, 엘엘씨 복수의 최대 비트레이트 레벨들을 사용하여 인코딩된 비디오를 인코딩하고 스트리밍하기 위한 시스템들 및 방법들
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8787570B2 (en) 2011-08-31 2014-07-22 Sonic Ip, Inc. Systems and methods for automatically genenrating top level index files
US8799647B2 (en) 2011-08-31 2014-08-05 Sonic Ip, Inc. Systems and methods for application identification
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
JP5698644B2 (ja) * 2011-10-18 2015-04-08 株式会社Nttドコモ 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム
US9247257B1 (en) 2011-11-30 2016-01-26 Google Inc. Segmentation based entropy encoding and decoding
US20130179199A1 (en) 2012-01-06 2013-07-11 Rovi Corp. Systems and methods for granting access to digital content using electronic tickets and ticket tokens
US20130208992A1 (en) * 2012-02-13 2013-08-15 Shu Lin System and method for difference frame threshold encoding and decoding
US9094681B1 (en) 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
US20130287109A1 (en) * 2012-04-29 2013-10-31 Qualcomm Incorporated Inter-layer prediction through texture segmentation for video coding
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US9936267B2 (en) 2012-08-31 2018-04-03 Divx Cf Holdings Llc System and method for decreasing an initial buffering period of an adaptive streaming system
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US10397292B2 (en) 2013-03-15 2019-08-27 Divx, Llc Systems, methods, and media for delivery of content
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
US9100687B2 (en) 2013-05-31 2015-08-04 Sonic Ip, Inc. Playback synchronization across playback devices
US9380099B2 (en) 2013-05-31 2016-06-28 Sonic Ip, Inc. Synchronizing multiple over the top streaming clients
KR101502145B1 (ko) * 2013-06-21 2015-03-12 주식회사 에스원 영상 부호화/복호화 방법 및 장치
US9386067B2 (en) 2013-12-30 2016-07-05 Sonic Ip, Inc. Systems and methods for playing adaptive bitrate streaming content by multicast
US9866878B2 (en) 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
KR102306641B1 (ko) 2014-08-07 2021-09-30 디빅스, 엘엘씨 독립적으로 인코딩된 타일을 포함한 기본 비트스트림을 보호하는 시스템 및 방법
JP2016092837A (ja) * 2014-10-30 2016-05-23 株式会社東芝 映像圧縮装置、映像再生装置および映像配信システム
WO2016112112A1 (en) 2015-01-06 2016-07-14 Sonic Ip, Inc. Systems and methods for encoding and sharing content between devices
CN107251008B (zh) 2015-02-27 2020-11-13 帝威视有限公司 在实况视频编码和流传输中进行帧复制和帧扩展的系统和方法
EP3200456A1 (en) * 2016-01-28 2017-08-02 Axis AB Video encoding method and video encoder system for temporal noise reduction
US10075292B2 (en) 2016-03-30 2018-09-11 Divx, Llc Systems and methods for quick start-up of playback
US10231001B2 (en) 2016-05-24 2019-03-12 Divx, Llc Systems and methods for providing audio content during trick-play playback
US10129574B2 (en) 2016-05-24 2018-11-13 Divx, Llc Systems and methods for providing variable speeds in a trick-play mode
US10148989B2 (en) 2016-06-15 2018-12-04 Divx, Llc Systems and methods for encoding video content
US10498795B2 (en) 2017-02-17 2019-12-03 Divx, Llc Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming
WO2019195036A1 (en) 2018-04-03 2019-10-10 Futurewei Technologies, Inc. File format signaling of error mitigation in sub-picture bitstream based viewport dependent video coding
US11825142B2 (en) 2019-03-21 2023-11-21 Divx, Llc Systems and methods for multimedia swarms

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4972261A (en) * 1987-08-28 1990-11-20 The General Electric Company, P.L.C. Motion compensation image signal encoding system
US5150210A (en) * 1988-12-26 1992-09-22 Canon Kabushiki Kaisha Image signal restoring apparatus
US5455629A (en) * 1991-02-27 1995-10-03 Rca Thomson Licensing Corporation Apparatus for concealing errors in a digital video processing system
US5198901A (en) * 1991-09-23 1993-03-30 Matsushita Electric Corporation Of America Derivation and use of motion vectors in a differential pulse code modulation system
FR2696026B1 (fr) * 1992-09-18 1994-12-30 Sgs Thomson Microelectronics Procédé de masquage d'erreurs de transmission d'image compressée en MPEG.
US5515388A (en) * 1993-03-19 1996-05-07 Sony Corporation Apparatus and method for preventing repetitive random errors in transform coefficients representing a motion picture signal
CA2114052A1 (en) 1993-07-29 1995-01-30 Monica Medina-Puri Method of detecting scene cuts
GB2293293B (en) * 1994-09-15 1998-10-21 Northern Telecom Ltd Interactive video system
JPH08154247A (ja) * 1994-09-29 1996-06-11 Sanyo Electric Co Ltd 圧縮画像データ処理装置及び方法
EP1098527A1 (en) * 1994-11-04 2001-05-09 Matsushita Electric Industrial Co., Ltd. Picture coding apparatus and decoding apparatus
US5731840A (en) * 1995-03-10 1998-03-24 Kabushiki Kaisha Toshiba Video coding/decoding apparatus which transmits different accuracy prediction levels
JP3068002B2 (ja) * 1995-09-18 2000-07-24 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
JP3788823B2 (ja) * 1995-10-27 2006-06-21 株式会社東芝 動画像符号化装置および動画像復号化装置
JP3347954B2 (ja) * 1995-11-02 2002-11-20 三菱電機株式会社 動画像符号化装置及び動画像復号化装置
TW351903B (en) * 1996-07-03 1999-02-01 Matsushita Electric Ind Co Ltd Encoding method, encoding apparatus, decoding and compositing method, decoding and composition appratus, and record medium recorded with the aforesaid methods for multiple images
JPH10191356A (ja) * 1996-12-27 1998-07-21 Oki Electric Ind Co Ltd 画像符号化装置
US5880688A (en) * 1997-04-09 1999-03-09 Hewlett-Packard Company Arithmetic coding context model that adapts to the amount of data
US6438165B2 (en) * 1998-03-09 2002-08-20 Lg Electronics Method and apparatus for advanced encoder system
US6188728B1 (en) * 1998-09-29 2001-02-13 Sarnoff Corporation Block motion video coding and decoding
JP3606306B2 (ja) * 1998-10-08 2005-01-05 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6700933B1 (en) * 2000-02-15 2004-03-02 Microsoft Corporation System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding

Also Published As

Publication number Publication date
KR100892119B1 (ko) 2009-04-09
US20010040700A1 (en) 2001-11-15
CA2409027A1 (en) 2001-11-22
KR20030005348A (ko) 2003-01-17
ATE522086T1 (de) 2011-09-15
GB2362532A (en) 2001-11-21
GB2362532B (en) 2004-05-05
CN1193622C (zh) 2005-03-16
US7711052B2 (en) 2010-05-04
HU230597B1 (hu) 2017-02-28
BR0110770A (pt) 2003-03-11
EP1287699A2 (en) 2003-03-05
EE200200642A (et) 2004-04-15
BRPI0110770B1 (pt) 2016-03-08
HK1079938A1 (en) 2006-04-13
ZA200208744B (en) 2004-02-24
KR20080083030A (ko) 2008-09-12
EP1287699B1 (en) 2011-08-24
WO2001089223A3 (en) 2002-04-04
EP2148513B1 (en) 2012-10-31
CN1633185A (zh) 2005-06-29
HUP0302055A2 (hu) 2003-09-29
CA2409027C (en) 2011-11-01
AU2001272409A1 (en) 2001-11-26
EP2148513A2 (en) 2010-01-27
KR100929558B1 (ko) 2009-12-03
JP4362259B2 (ja) 2009-11-11
WO2001089223A2 (en) 2001-11-22
MXPA02011201A (es) 2003-03-10
EP2148513A3 (en) 2010-08-04
CN100394802C (zh) 2008-06-11
CN1440623A (zh) 2003-09-03
GB0011606D0 (en) 2000-07-05
EE05652B1 (et) 2013-04-15
HUP0302055A3 (en) 2005-11-28

Similar Documents

Publication Publication Date Title
JP4362259B2 (ja) ビデオ符号化方法
JP5007012B2 (ja) ビデオ符号化方法
US8144764B2 (en) Video coding
US7751473B2 (en) Video coding

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050816

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090421

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090721

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090817

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4362259

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130821

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term