JP2005514872A - 動的フィルタのコーディング - Google Patents

動的フィルタのコーディング Download PDF

Info

Publication number
JP2005514872A
JP2005514872A JP2003559135A JP2003559135A JP2005514872A JP 2005514872 A JP2005514872 A JP 2005514872A JP 2003559135 A JP2003559135 A JP 2003559135A JP 2003559135 A JP2003559135 A JP 2003559135A JP 2005514872 A JP2005514872 A JP 2005514872A
Authority
JP
Japan
Prior art keywords
filter
video
values
difference
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003559135A
Other languages
English (en)
Other versions
JP4494789B2 (ja
JP2005514872A5 (ja
Inventor
レイニマ,ジャニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2005514872A publication Critical patent/JP2005514872A/ja
Publication of JP2005514872A5 publication Critical patent/JP2005514872A5/ja
Application granted granted Critical
Publication of JP4494789B2 publication Critical patent/JP4494789B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Abstract

ビデオ・フレームのシーケンスを含むビデオ・シーケンスをコーディングするためのビデオ・コーディング・システムであって、各フレームはピクセル値のアレイを有し、デコーディング・プロセスにおいてピクセル値を再構成するために補間フィルタが規定されるビデオ・コーディング・システム。システムは、所定のベース・フィルタと比較して差をつけて補間フィルタの係数をコーディングして、差分値の組を与える。ベース・フィルタ係数がエンコーダおよびデコーダの両方に対して既知であり、ベース・フィルタ係数をビデオ・シーケンスで使用される実際のフィルタに対して統計的に合理的に近くすることができるために、デコーダは、差分値の組に基づいてピクセル値を再構成することができる。

Description

本出願は、米国仮特許出願第60/348,811号明細書(2002年1月14日出願)に基づいており、この仮出願の特典を主張する。
本発明はビデオ・コーディングにおける動き補償に関する。より具体的には、本発明は、動き補償ビデオ・エンコーダおよびデコーダにおける画像ピクセル値の再構成に用いられる補間フィルタの係数のコーディング方法に関する。また本発明は、本発明の方法を実施する対応するビデオ・エンコーダ、ビデオ・デコーダ、およびビデオ送信システムに関する。
現在、様々なビデオ・コーディング標準が存在している。これらには、国際電気通信連合電気通信標準化部門(ITU−T)勧告H.263、および国際標準化機構(ISO)動画符号化専門グループ(MPEG)標準MPEG−1、MPEG−2、およびMPEG−4などがある。これらのビデオ・コーディング標準は、動き補償予測および予測エラー・コーディングを用いることを基礎としている。動き補償予測は、ビデオ・シーケンス内の連続フレームを分析およびコーディングすること、ならびに動き情報を用いて画像ブロックを再構成することによって行なわれる。画像ブロックの再構成は、画像(ピクセル)値を、必要なピクセルおよびサブ・ピクセルの位置用に生成することができる動き補間フィルタを用いて作り上げられる。動き補償予測と補間フィルタを用いる画像再構成との基本原理を、以下の段落で、より詳細に説明する。
デジタル・ビデオ・シーケンスは、普通のフィルム上に記録される動画と同様に、静止画像(「フレーム」と言われることが多い)のシーケンスを含んでいる。フレームを次々と比較的速い速度で、通常は15〜30フレーム/秒で表示することによって、動きの錯覚が形成される。フレーム速度が比較的速いために、連続フレームの画像コンテントは、かなり類似する傾向がある。そのため連続フレームは、かなりの量の冗長な情報を含んでいる。
デジタル・ビデオ・シーケンスの各フレームは、画像ピクセルのアレイを含んでいる。一般的に使用されるデジタル・ビデオ形式(クォータ一般交換形式(QCIF)として知られる)では、フレームは176×144ピクセルのアレイを含んでおり、すなわち各フレームは25,344ピクセルを有している。フレームの各ピクセルは、ある数のビットによって表わされる。これは、ピクセルに対応する画像の領域の輝度および/またはカラー・コンテント(クロミナンス)に関する情報を伝える。一般には、いわゆるYUVカラー・モデルを用いて、画像の輝度およびクロミナンス・コンテントを表わす。輝度またはY成分は画像の強度(明るさ)を表わし、一方で画像のカラー・コンテントは、UおよびVと名付けられる2つのクロミナンス成分によって表わされる。
画像コンテントの輝度/クロミナンス表示に基づくカラー・モデルの場合、原色(赤、緑、および青、RGB)を含む表示に基づくカラー・モデルと比べて、ある程度の利点が得られる。人間の視覚システムはカラー変化よりも強度変化に対して敏感であるので、YUVカラー・モデルでは、クロミナンス成分(U、V)に対して用いる空間分解能を、輝度成分(Y)に対する分解能よりも低くすることによって、この特性を利用している。このようにして、画像内のカラー情報のコーディングに必要な情報量を、画像品質の劣化を軽微に留めて、減らすことができる。
クロミナンス成分の空間分解能を低くすることは通常、空間的なサブ・サンプリングによって実現される。通常、16×16の画像ピクセルのブロックを、輝度情報を表わす16×16値の1ブロックによってコーディングし、2つのクロミナンス成分をそれぞれ、16×16アレイの輝度値の画像面積に等しい画像面積を表わす8×8値の1つのブロックによって表わす。このようにしてクロミナンス成分を、水平および垂直方向に2倍、空間的にサブ・サンプリングする。結果として生じる1つの16×16輝度ブロックと2つの8×8クロミナンス・ブロックとのアセンブリは普通、YUVマクロブロック、または略してマクロブロックと言われる。
QCIF画像には11×9のマクロブロックが含まれている。輝度ブロックとクロミナンス・ブロックとを、8ビット分解能を用いて表わした場合(数で0〜255の範囲にある)、マクロブロックごとに必要となるビット総数は、(16×16×8)+2×(8×8×8)=3072ビットとなる。したがってQCIF形式のビデオ・フレームを、成分あたり8ビット数分解能を用いて表わすのに必要なビット数は、99×3072=304,128ビットとなる。したがって、一連のこのようなQCIF形式フレームを含むビデオ・シーケンスを30フレーム/秒の速度で送信、記録、または表示するのに必要なデータ量は、9Mbps(100万ビット/秒)よりも多くなる。このようなデータ速度は、ビデオ記録、送信、および表示用途で使用するには実際的ではない。と言うのは、非常に大きな記憶容量、送信チャネル容量、およびハードウェア性能が要求されるからである。このために、ビデオ・コーディング標準、たとえば前述したようなものが、許容範囲の画像品質を保持する一方でビデオ・データを表現および送信するのに必要な情報量を減らすために開発されている。
前述した各ビデオ・コーディング標準は、特性の異なるビデオ記録または送信システムでの適用に適応するように作られている。たとえばISOMPEG−1標準は、利用可能なデータ・バンド幅が最大で約1.5Mビット/秒の状況で使用することに対して具体的にデザインされている。MPEG−2ビデオ・コーディング標準は主に、デジタル記憶媒体およびビデオ放送または通信(利用可能なデータ・バンド幅が最大で約10Mビット/秒)に対して適用できる。ITU−T勧告H.263は、利用可能なバンド幅が一般にはるかに低いシステムでの使用が意図されている。ITU−T勧告H.263は、ビデオ・データをリアル・タイムで固定回線ネットワーク上、たとえばISDN(総合デジタル通信網)または従来のPSTN(公衆交換電話網)(利用可能なデータ送信バンド幅が通常64kビット/秒のオーダである)上で、送信する状況での使用に特に適している。送信が少なくとも部分的に無線通信リンク上で行なわれる携帯テレビ電話では、利用可能なバンド幅は20kビット/秒と小さい可能性がある。
現在存在する種々のビデオ・コーディング標準は、種々の状況での使用に適応するように作られているが、送信すべき情報量を減らすためにそれらが用いるメカニズムは、多くの共通する特徴を有している。特にそれらはすべて、送信すべきビデオ・シーケンスにおいて冗長で知覚的に関連のない情報量を減らすように作用する。ビデオ・シーケンスには基本的に3つのタイプの冗長性が存在する。すなわち空間的冗長性、時間的冗長性、およびスペクトル冗長性である。空間的冗長性は、シーケンスの個々のフレーム内の隣接するピクセル間の相関性を記述するために用いられる用語である。時間的な冗長性は、シーケンスの1つのフレーム内に現れる物体が、その後のフレームに現れる可能性があるという事実を表わす。スペクトル冗長性は、同じ画像の異なるカラー成分間の相関性を指す。
通常、所定の画像シーケンスにおいて種々の形態の冗長性を単に減らすだけでは、十分に効率的な圧縮を実現することはできない。そのため現在のビデオ・エンコーダのほとんどは、自覚される範囲で最も重要性が低いビデオ・シーケンス部分の品質も落としている。加えて、圧縮ビデオ・ビット・ストリームの冗長性それ自体は、効率的な低損失エンコーディングによって低減される。通常、これはエントロピ・コーディングを用いて実現される。
動き補償予測は、時間的な冗長性が低減される形式であり、ビデオ・シーケンスにおけるいくつか(しばしば多くの)フレームのコンテントを、フレーム間の画像の物体または領域の動きを追跡することによって、シーケンスの他のフレームから「予測する」。動き補償予測を用いて圧縮されるフレームは通常、インター・コーデッドまたはPフレームと言われ、動き補償予測を用いないで圧縮されるフレームは、イントラ・コーデッドまたはIフレームと言われる。予測される(動き補償される、インター・コーデッドな)画像が、十分な品質の画像コントラスを表わすほどに十分に正確であることはめったにない。そのため、空間的に圧縮される予測エラー(PE)フレームも、各インター・フレームに付随する。多くのビデオ圧縮方式は、双方向性の予測フレームを用いることもでき、これは一般にBピクチャまたはBフレームと言われる。Bピクチャは、基準またはいわゆる「アンカ」ピクチャ対(IまたはPフレーム)の間に挿入され、アンカ・ピクチャのいずれか一方または両方から予測される。
添付図面の図3に、通常の圧縮ビデオ・シーケンス内で生じる種々のタイプのフレームを例示する。図から分かるように、シーケンスは、イントラまたはIフレーム30から始まる。図3では、矢印33によって、Pフレーム34が形成される「前方」予測プロセスを示す。Bフレーム36が形成される双方向性予測プロセスを、矢印31aおよび31bによって、それぞれ示す。
図1および図2に、動き補償予測を用いる一般的なビデオ・コーディング・システムの概略的なダイアグラムを示す。図1では、動き補償予測を用いるエンコーダ10を例示する。図2では、対応するデコーダ20を例示する。図1に示すエンコーダ10は、動き領域推定ブロック11、動き領域コーディング・ブロック12、動き補償予測ブロック13、予測エラー・コーディング・ブロック14、予測エラー・デコーディング・ブロック15、多重化ブロック16、フレーム・メモリ17、および加算器19を備える。デコーダ20は、動き補償予測ブロック21、予測エラー・デコーディング・ブロック22、逆多重化ブロック23、およびフレーム・メモリ24を備える。
動き補償予測を用いるビデオ・コーダの動作原理は、予測エラー・フレームEn(x、y)内の情報量を最小限にすることである。予測エラー・フレームEn(x、y)は、コーディングされている現在のフレームIn(x、y)と予測フレームPn(x、y)との間の差分である。したがって予測エラー・フレームは次のように規定される。
Figure 2005514872
予測フレームPn(x、y)は、基準フレームRn(x、y)のピクセル値を用いて作られる。基準フレームRn(x、y)は一般的に、すでにコーディングされて送信されたフレームの1つ(たとえば現在のフレームの直前のフレーム)であり、またエンコーダ10のフレーム・メモリ17から入手することができる。より具体的には、予測フレームPn(x、y)は、現在のフレーム内のピクセルに実質的に一致する基準フレームRn(x、y)内の「予測ピクセル」を見つけることによって構成される。現在のフレーム内のピクセルと基準フレーム内の対応する予測ピクセルとの間の関係(たとえば相対的な位置、回転、比率など)を記述する動き情報を得て、動き情報に従って予測ピクセルを移動させることによって予測フレームが形成される。このようにして予測フレームは、基準フレーム内のピクセル値を用いて、現在のフレームの概略的な表現として構成される。したがって前述の予測エラー・フレームは、予測フレームによって得られる現在のフレームの概略的な表現と現在のフレームそれ自体との間の差分を表わす。動き補償予測を用いるビデオ・エンコーダによって得られる基本的な有利点は、現在のフレームの比較的コンパクトな記述を得ることが、その予測を形成するために必要となる動き情報とともに、予測エラー・フレーム内の付随する予測エラー情報によって、可能となるという事実から生じる。
フレーム内には多数のピクセルがあるために、各ピクセルに対する別個の動き情報をデコーダへ送信することは一般的に効率的ではない。その代わりに、ほとんどのビデオ・コーディング方式では、現在のフレームをもっと大きな画像セグメントSkに分割して、セグメントに関する動き情報をデコーダへ送信している。たとえば通常は、フレームの各マクロブロックに対して動き情報を与えて、そしてマクロブロック内のすべてのピクセルに対して同じ動き情報を用いる。現在開発中のITU−T勧告H.26Lなどの一部のビデオ・コーディング標準では、マクロブロックをもっと小さいブロックに分割して、小さいブロックのそれぞれに独自の動き情報を与える。
動き情報は通常、動きベクトル[Δx(x、y)、Δy(x,y)]の形を取る。一対の数Δx(x、y)およびΔy(x,y)によって、基準フレームRn(x、y)内のピクセルに対する現在のフレームIn(x、y)内のピクセル(x、y)の水平および垂直方向の変位が表わされる。動きベクトル[Δx(x、y)、Δy(x,y)]は、動き領域推定ブロック11において計算され、現在のフレームの動きベクトルの組[Δx(・)、Δy(・)]は動きベクトル領域と言われる。
通常、現在のビデオ・フレーム内でのマクロブロックの位置は、その左上角の(x、y)座標によって特定される。したがってフレームの各マクロブロックに動き情報が付随するビデオ・コーディング方式では、現在のフレームIn(x、y)内のマクロブロックの左上角を表わすピクセルの、基準フレームRn(x、y)内の予測ピクセルの実質的に対応するブロックの左上角のピクセルに対する水平および垂直方向の変位Δx(x、y)およびΔy(x、y)が、各動きベクトルによって記述される(図4bに示す)。
動き推定は、計算が集約される作業である。基準フレームRn(x、y)と、たとえば現在のフレーム内のN×Nピクセルを含む正方形のマクロブロック(図4aに示す)とを仮定すると、動き推定の目標は、ある基準にしたがって現在のピクチャ内のマクロブロックの特性にマッチングする基準フレーム内のN×Nピクセル・ブロックを見つけることである。この基準は、たとえば現在のフレーム内のマクロブロックのピクセルと、それが比較される基準フレーム内のピクセルのブロックとの間の絶対差分和(SAD)とすることができる。このプロセスは、「ブロック・マッチング」として一般に知られている。実在の物体はスケール変化を、さらに回転および歪みを経る可能性があるため、一般に、マッチングすべきブロックの幾何形状と基準フレーム内のそれとは同じである必要はないことを理解されたい。しかし現在の国際的なビデオ・コーディング標準、たとえば前述したようなものでは、並進運動モデルのみが用いられており(以下を参照)、したがって固定された矩形幾何形状で十分である。
理想的には、マッチングを見つける最高の可能性を得るためには、基準フレームの全体をサーチする必要がある。しかしこれは、ビデオ・エンコーダに課される計算の負担が大きくなりすぎるために、非現実的である。その代わりに図4cに示すように、サーチ領域を一般に、現在のフレーム内のマクロブロックの本来の位置の周囲の領域[−p、p]に限定する。
エンコーダ10からデコーダ20へ送信すべき動き情報をさらに減らすために、エンコーダ10の動き領域コーディング・ブロック12内で、動きベクトル領域を動きモデルを用いて表わすことによってコーディングする。このプロセスでは、画像セグメントの動きベクトルをある所定の関数を用いて再表現するか、または言い換えれば、動きベクトル領域をモデルを用いて表わす。現在使用されている動きベクトル領域モデルのほとんど全てが、加法的な動きモデルであり、以下の式に従う。
Figure 2005514872
Figure 2005514872
ここで、aiおよびbiは動き係数である。動き係数は、デコーダ20に送信される(図1および2における情報ストリーム2)。関数fiおよびgiは、動き領域の基底関数である。これらは、エンコーダおよびデコーダの両方に対して既知である。概略的な動きベクトル領域
Figure 2005514872
を、係数および基底関数を用いて構成することができる。基底関数がエンコーダ10およびデコーダ20の両方に対して既知である(すなわち格納されている)ために、エンコーダへ送信する必要があるのは動き係数のみであり、したがってフレームの動き情報を表わすのに必要な情報量を減らすことができる。
最も単純な動きモデルは、各セグメントの動きベクトルを記述するのに2つの係数のみを必要とする並進運動モデルである。動きベクトルの値は以下のように与えられる。
Figure 2005514872
これは、ITU−T勧告H.263およびISO標準MPEG−1、MPEG−2、MPEG−4において、16×16および8×8ブロックの動きを記述するために用いられるモデルである。並進運動モデルを用いるシステムは通常、フル・ピクセル分解能またはフル・ピクセル分解能の整数分の1、たとえばピクセル分解能の2分の1または4分の1で、動き推定を行なう。
予測フレームPn(x、y)は、エンコーダ10の動き補償予測ブロック13において構成され、以下のように与えられる。
Figure 2005514872
予測エラー・コーディング・ブロック14では、予測エラー・フレームEn(x、y)が通常、いくつかの2次元関数の有限級数として表わすこと(変換)によって、圧縮される。たとえば2次元離散コサイン変換(DCT)を用いることができる。変換係数を、デコーダへ送信する(図1および2における情報ストリーム1)前に、量子化してエントロピ(たとえばハフマン(Huffman))コーディングする。量子化によってエラーが導入されるために、この動作によって通常、予測エラー・フレームEn(x、y)内で多少の劣化(情報の損失)が生じる。この劣化を補償するために、エンコーダ10は、予測エラー・デコーディング・ブロック15も備えている。予測エラー・デコーディング・ブロック15では、デコーディングされた予測エラー・フレーム
Figure 2005514872
が、変換係数を用いて構成される。この局所的にデコーディングされた予測エラー・フレームが、加算器19によって予測フレームPn(x、y)に加えられ、結果として生じるデコーディングされた現在のフレーム
Figure 2005514872
がフレーム・メモリ17内に格納されて、次の基準フレームRn+1(x、y)としてさらに用いられる。
マルチプレクサ16において、動きベクトルについての情報を伝える情報ストリーム2を予測エラーについての情報と組み合わせ、通常は少なくともこれら2つのタイプの情報を含む情報ストリーム3をデコーダ20へ送る。
次に、対応するビデオ・デコーダ20の動作について説明する。
デコーダ20のフレーム・メモリ24には、すでに再構成された基準フレームRn(x、y)が格納されている。デコーダ20の動き補償予測ブロック21では、すでに再構成された基準フレームRn(x、y)の受信された動き係数情報とピクセル値とを用いて、式5に従って予測フレームPn(x、y)が構成される。予測エラー・デコーディング・ブロック22では、予測エラー・フレームEn(x、y)の送信された変換係数を用いて、デコーディングされた予測エラー・フレーム
Figure 2005514872
が構成される。次に、デコーディングされた現在のフレーム
Figure 2005514872
のピクセルが、予測フレームPn(x、y)とデコーディングされた予測エラー・フレーム
Figure 2005514872
とを加えることによって、再構成される。
Figure 2005514872
このデコーディングされた現在のフレームを、次の基準フレームRn+1(x、y)としてフレーム・メモリ24に格納しても良い。
前述したデジタル・ビデオの動き補償エンコーディングおよびデコーディングの説明では、基準フレームRn(x、y)に対する現在のフレーム内のマクロブロックの動きを記述する動きベクトル[Δx(x、y)、Δy(x,y)]は、基準フレーム内のどのピクセルも指し示すことができる。これは、デジタル・ビデオ・シーケンスのフレーム間の動きを表わすことができるのは、フレーム内の画像ピクセルによって決定される分解能(いわゆるフル・ピクセル分解能)においてのみであることを意味する。しかし実際の動きは精度が定まらないため、前述したシステムによって与えられるのは、デジタル・ビデオ・シーケンスの連続フレーム間の動きについての概略的なモデリングのみである。通常、フル・ピクセル分解能を有するビデオ・フレーム間の動きについてのモデリングは精度が十分ではないため、各マクロブロックまたはフレームに関連する予測エラー(PE)情報を効率的に最小化することができない。そのため実際の動きについてのもっと正確なモデリングを可能にし、エンコーダからデコーダへ送信すべきPE情報を減らすことを促進するために、多くのビデオ・コーディング標準では、動きベクトルが画像ピクセル「の中間」を指し示すことができる。言い換えれば、動きベクトルが「サブ・ピクセル」分解能を有することができる。動きベクトルがサブ・ピクセル分解能を有することができるようになると、行なうべきエンコーディングおよびデコーディング動作の複雑さが増加するため、動きベクトルが有しても良い空間分解能の程度を限定することがやはり有利である。そのためビデオ・コーディング標準、たとえば前述したようなものでは通常、フル、2分の1、または4分の1ピクセル分解能のみを有することができる。
図5の典型的な方法で例示するように、サブ・ピクセル分解能を有する動き推定を、動きベクトルがフルまたは2分の1ピクセル分解能を有し得る一般的なビデオ・コーディング方式に対して、2段階プロセスとして実行することができる。第1のステップでは、フル・ピクセル分解能を有する動きベクトルを、前述したブロック・マッチング・プロセスなどの適切な動き推定方式を用いて決定する。図5に、結果として生じるフル・ピクセル分解能を有する動きベクトルを示す。
第2の段階では、第1の段階で決定された動きベクトルを精緻化して、所望の2分の1ピクセル分解能を得る。図5に例示した例では、これは、16×16ピクセルの8つの新しいサーチ・ブロックを形成することによって行なわれる。図5では、各ブロックの左上角の位置がXによってマーキングされている。これらの位置は、[Δx+m/2、Δy+n/2]によって示される。ここでmおよびnは、−1、0、+1の値を取ることができるが、同時には0にはなれない。本来の画像ピクセルのピクセル値のみが既知であるため、2分の1ピクセル位置にあるサブ・ピクセルの値(たとえば、輝度および/またはクロミナンス値)が、8つの新しいサーチ・ブロックのそれぞれに対して、ある補間方式の形態を用いて推定される。
サブ・ピクセルの値を2分の1ピクセル分解能で補間したら、8つのサーチ・ブロックのそれぞれを、動きベクトルが探索されているマクロブロックと比較する。フル・ピクセル分解能を有する動きベクトルを決定するために行なうブロック・マッチング・プロセスの場合と同様に、マクロブロックを、ある基準たとえばSADにしたがって8つのサーチ・ブロックのそれぞれと比較する。比較の結果、最小のSAD値が一般的に得られる。ビデオ・シーケンスにおける動きの種類に応じて、最小値は、本来の動きベクトルによって特定される位置(フル・ピクセル分解を有する)に対応しても良いし、2分の1ピクセル分解能を有する位置に対応しても良い。こうして、動きベクトルがフル・ピクセル位置を指し示すべきかサブ・ピクセル位置を指し示すべきかを決定することができ、サブ・ピクセル分解能が適切である場合には、正確なサブ・ピクセル分解能の動きベクトルを決定することができる。
実際には、基準フレーム内のサブ・ピクセル値を推定することは、周囲のピクセル値からサブ・ピクセル値を補間することによって行なわれる。一般に、非整数位置(x、y)=(n+Δx、m+Δy)に配置されるサブ・ピクセル値F(x、y)を補間することは2次元動作として定式化することができ、以下のように数学的に表わされる。
Figure 2005514872
ここで、f(k、l)はフィルタ係数であり、nおよびmは、xおよびyをそれぞれ切り捨てによって整数値にすることによって得られる。通常、フィルタ係数はxおよびyの値に依存し、補間フィルタは通常、いわゆる「分離可能なフィルタ」である。この場合、サブ・ピクセル値F(x、y)は以下のように計算することができる。
Figure 2005514872
動きベクトルはエンコーダで計算される。対応する動き係数がいったんデコーダに送信されたら、エンコーダで使用される補間方法と同一の補間方法を用いて必要なサブ・ピクセルを補間することは簡単な事である。このようにして、フレーム・メモリ24内で基準フレームに続くフレームを、基準フレームおよび送信すべき動きベクトルから再構成することができる。
従来、ビデオ・エンコーダおよびデコーダで使用される補間フィルタには固定のフィルタ係数値が用いられ、同じフィルタ(すなわち同じフィルタ係数値を有する同じタイプのフィルタ)を、コーディングされているビデオ・シーケンスのすべてのフレームに対して用いている。同じフィルタをすべてのビデオ・シーケンスに対して、それらの種類およびそれらが取得された(捕らえられた)方法に関係なくさらに用いる。ウェディ(Wedi)(「動き補償ハイブリッド・ビデオ・コーディングに対する適合可能な補間フィルタ(Adaptive Interpolation for Motion Compensated Hybrid Video Coding)」、ピクチャ・コーディング・シンポジウム(Picture Coding Symposium)(PCS2001)、ソウル、韓国、2001年4月)では、適合可能なフィルタ係数値を有する補間フィルタを用いて、ビデオ・コーディング・プロセスにおけるある種の欠点を補償することが提案されている。特にウェディ(Wedi)は、画像取得プロセスにおけるエイリアシング、許容される動きベクトルの分解能が有限であること、および並進運動モデルの妥当性が限られていることによって、さらなる予測エラーがどのように導入されるかについて説明している。ビデオ画像内のエイリアシングは、画像取得プロセスにおいて非理想的なロー・パス・フィルタを用いること(および結果として生じるナイキスト(Nyquist)・サンプリング法則の不履行)のために生じる。エイリアシングによって、ビデオ・シーケンス内での動き補償予測が妨げられ、さらなる予測エラー成分が生じる。また許容される動きベクトルの精度が有限であること(たとえばフル・ピクセル、2分の1ピクセル、または4分の1ピクセル)と、並進運動モデルが表わせるのは連続ビデオ・フレーム間の水平および垂直の動きのみであることとによっても、さらなる予測エラー寄与が生じる。ウェディはさらに、補間フィルタのフィルタ係数値を適合させて、エイリアシングと、動きベクトル精度が有限であることと、および並進運動モデルの妥当性が限られていることとによって導入されるさらなる予測エラーを補償することによって、コーディング効率の向上を実現できることを提案している。
より一般的には、動きの種類および特性がビデオ・シーケンス内で変化するため、最適の補間フィルタは時間および画像位置の関数として変化することを理解されたい。ウェディによって提示される例では、動的に適合可能なフィルタ係数値を有する補間フィルタがH.26Lビデオ・コーデックに、より具体的には、テスト・モデル(TML)によって規定されるそのコーデックのバージョンに、組み込まれている。H.26LのTML−4では、4分の1ピクセルの動きベクトル分解能と、6つの対称的なフィルタ係数を有するウィナー(Wiener)・タイプの補間フィルタ(6タップ・フィルタ)とが使用された。ウェディで示される例では、補間フィルタのフィルタ係数をフレームづつのベースで適合させること、フィルタ係数を差をつけてコーディングすること、およびフィルタ係数を、メインのビデオ・データに対する副次的な情報としてデコーダへ送信することが示されている。このアプローチに基づいて、H.26Lビデオ・コーデックのテスト・モデル8において動的なフィルタ係数数値を有する補間フィルタを使用することを含める提案がなされた。これはITU電気通信標準化部門において、表題「H.26L用の適合可能な補間フィルタ(Adaptive Interpolation Filter for H. 26L)」、研究グループ16、議題6、ビデオ・コーディング専門家グループ(VCEG)、文献VCEG−N28(2001年9月)および、表題「H.26L用の適合可能な補間フィルタに関するさらなる結果(More Results on Adaptive Interpolation Filter for H. 26L)」、研究グループ16、議題6、ビデオ・コーディング専門家グループ(VCEG)、文献VCEG−O16rl(2001年11月)にて提出された。
動的に適合可能な補間フィルタを用いることは、エンコーディングされたビデオ・データ・ストリームのコーディング効率に関して重要な問題を引き起こし、またエンコーディングされたビデオ・データのエラー回復に影響を及ぼす。コーディング効率の問題は、簡単な仕方で理解することができる。固定のフィルタ係数値を有する補間フィルタを用いるビデオ・コーディング・システムでは、エンコーディングされたビデオ・データ・ビット・ストリーム内に、フィルタ係数値に関する情報を含める必要がまったくない。フィルタ係数値を、ビデオ・エンコーダおよびビデオ・デコーダに簡単に記録することができる。言い換えれば、固定の補間フィルタを用いる特定のビデオ・コーディング標準にしたがって実装されるビデオ・コーディング・システムでは、係数値は、標準の仕様に従ってエンコーダおよびデコーダの両方に対して事前プログラムされる。しかし動的に適合可能なフィルタ係数が可能になれば、係数値に関する情報を送信する必要が生じてくる。フィルタ係数は周期的に(たとえばフレームづつのベースで)更新されるため、これは必然的に、ビデオ・エンコーダからデコーダへ送るべき情報量に加えられ、またコーディング効率に対して悪影響を及ぼす。ビット・レートが低いビデオ・コーディング用途では、送信すべき情報量がわずかでも増えることは一般に望ましくない。
したがって動きを最適にモデリングおよび補償するために、動的な補間フィルタを効率的に表現する必要がある。
エラー回復に関しては、動的に可変の補間フィルタの係数についての情報をエンコーダからデコーダへ送信する方法によって、送信エラーに対するビデオ・データの敏感さに影響が出る場合があることを理解されたい。より具体的には、動的に適合可能な補間フィルタを用いるビデオ・コーディング・システムでは、デコーダにおけるビデオ・シーケンスのフレームの正確な再構成は、フィルタ係数値の正確な受信およびデコーディングに依存する。係数値に関する情報が、エンコーダからデコーダへ送信される間にエラーの影響を受けやすい場合には、再構成されるビデオ・データの破損が起こる可能性がある。従来技術から知られるフィルタ係数のコーディング方法には3種類ある。第1は、フィルタ係数値を別個にエントロピ・コーディングすることである。第2は、フィルタ係数値を、すでにデコーディングされたフィルタのフィルタ係数と比較して差をつけて、エントロピ・コーディングすることである(ウェディにおいて提案されている)。第3は、フィルタの組を規定して、選択したフィルタのインデックスをコーディングすることである。
前述したように補間フィルタ係数のコーディングに利用できる可能性がある従来技術の解決方法はすべて、それらの使用方法のシナリオが異なることに付随する問題がある。第1の方法では、補間フィルタ係数を別個にコーディングするが、先験的な情報(すなわちすでにコーディングされた補間フィルタ係数値に関する情報)を何ら利用しないため、コーディング性能が劣っている。したがってこのアプローチでは、エンコーディングされたビデオ・ビット・ストリームに過度に多量の情報を加えて、補間フィルタ係数値を記述する必要がある。ウェディにおいて提案されるように、係数の差分コーディングは効率的ではあるが、フィルタ係数が、以前のフィルタ係数が正しくデコーディングされていることに依存するために、送信エラーを伴う可能性がある環境では使用することができない。前述したように、エンコーディングされたビデオ・ビット・ストリームが、エンコーダからデコーダへ送信される間に、エラーの影響を受けやすい場合には、デコーダにおいて再構成されるビデオ・データの破損が起こる可能性がある。所定のフィルタの組を伴う第3の従来技術の解決方法では、限られた選択肢のみが与えられるため、コーディング性能が劣化する。言い換えれば、このオプションでは、ウェディで述べられているように動的に適合可能なフィルタ係数値を有する補間フィルタを用いる利点を十分に実現することはできない。
したがって、適合可能な補間フィルタの係数値をコーディングする方法として、効率的であるとともに、エンコーディングされたビデオ・ビット・ストリームのエラー回復の劣化につながらない方法が必要とされていることが理解される。
本発明では、差分コーディングの良好なコーディング効率をエラー回復特徴と組み合わせることで、差分コーディングをすべての環境で使用できるようにする。したがってそれは、エラーが生じやすい環境、たとえばエンコーディングされたビデオ・ビット・ストリームを干渉を受けやすい無線通信リンク上で送信すべき環境で使用するためのビデオ・コーディング・システム内への実装に特に適している。
したがって、本発明の第1の態様によれば、デジタル・ビデオ・シーケンスにおける画像をエンコーディングしてエンコーディングされたビデオ・データを与えるための方法であって、デジタル・ビデオ・シーケンスはビデオ・フレームのシーケンスを含み、各フレームは複数のピクセル値を有し、複数の係数値によって表わされる複数の係数を有する補間フィルタを用いて、エンコーディングされたビデオ・データから前記デジタル・ビデオ・シーケンスのフレーム内のピクセル値を再構成する方法が提供される。この方法は、
補間フィルタの係数値を、所定のベース・フィルタと比較して差をつけてコーディングして、差分値の組を形成するステップと、
エンコーディングされたビデオ・データにおける前記差分値の組を適合させて、ピクセル値の再構成が前記差分値の組に基づくようにするステップと、を含むことを特徴とする。
有利なのは、エンコーディングされたビデオ・データが、前記差分値の組を示すエンコーディングされた値を含み、前記差分値の組を、ビデオ・エンコーダからビデオ・デコーダへ送信する前にエントロピ・コーディングすることである。
有利なのは、所定のベース・フィルタが、補間フィルタの係数値に統計的に類似する値の複数の係数を有することである。
有利なのは、補間フィルタの係数を、選択された画像セグメント内でのピクセルを補間するように選択することである。
有利なのは、所定のベース・フィルタが、固定された係数値を有することである。
有利なのは、所定のベース・フィルタが、ビデオ・シーケンスの統計値に適合される複数の係数を有することである。
好ましくは、補間フィルタが対称的であり、フィルタ係数の2分の1のみがコーディングされる。
有利なことは、補間フィルタの係数値が、第1の係数値から最後の係数値まで、ある順序でコーディングされ、ある順序は前記係数の空間的な順序とは異なることである。
有利なことは、補間フィルタの係数値の合計が固定されていることである。
有利なことは、所定のベース・フィルタが複数の係数値を有し、所定のベース・フィルタの係数値に一定の値を加えて、補間フィルタの係数値と所定のベース・フィルタの係数値との間の差分の振幅を減らすことである。
本発明の第2の態様によれば、ビデオ・フレームのシーケンスを有するデジタル・ビデオ・シーケンスにおける画像をエンコーディングして、ビデオ・シーケンスを示すエンコーディングされたビデオ・データを与える手段であって、ビデオ・シーケンスの各フレームは複数のピクセル値を含む手段と、
デコーディング・プロセスにおいて前記デジタル・ビデオ・シーケンスのフレーム内のピクセル値を再構成するための補間フィルタを規定する手段であって、補間フィルタは複数の係数値によって表わされる多くの係数を有する手段と、を備えるビデオ・エンコーダが提供される。このビデオ・エンコーダは、補間フィルタに対応して、前記補間フィルタの係数値と所定のベース・フィルタの係数値との間の差分を計算して差分値の組を与える手段と、
エンコーディングされたビデオ・データにおける前記差分値の組を適合させて、デコーディング・プロセスにおけるピクセル値の再構成が前記差分値の組に基づくようにする手段と、を備えることを特徴とする。
有利なことは、エンコーダが、エンコーディングされたビデオ・データにおける前記差分値の組を適合させる前に前記差分値の組をエントロピ・コーディングするための手段をさらに備えることである。
本発明の第3の態様によれば、ビデオ・フレームのシーケンスを含むデジタル・ビデオ・シーケンスを示すビデオ・データをデコーディングする方法であって、ビデオ・シーケンスの各フレームは複数のピクセル値を含み、複数の係数値によって表わされる複数の係数を有する補間フィルタを用いて前記デジタル・ビデオ・シーケンスのフレーム内のピクセル値を再構成する方法が提供される。この方法は、
ビデオ・データから差分値の組を回収するステップであって、前記差分値の組は、補間フィルタの係数値と所定のベース・フィルタの係数値との間の差分を示すステップと、
前記差分値の組と所定のベース・フィルタとに基づいて、さらなるフィルタを構成するステップと、
さらなるフィルタに基づいてピクセル値を再構成するステップと、を含むことを特徴とする。
有利なことは、所定のベース・フィルタが、複数の係数値によって表わされる複数の係数を有し、さらなるフィルタの構成を、前記差分値の組を所定のベース・フィルタの係数値と合計することによって行なうことである。
有利なことは、前記差分値の組を、ビデオ・データから、エントロピ・デコーディングによって回収することである。
本発明の第4の態様によれば、ビット・ストリーム内のビデオ・データを受信するための手段であって、受信したビデオ・データは、ビデオ・フレームのシーケンスを含むデジタル・ビデオ・シーケンスを示し、ビデオ・シーケンスの各フレームは複数のピクセル値を含む手段を備えるビデオ・デコーダが提供される。ビデオ・デコーダは、
ビット・ストリームから差分値の組を回収するための手段と、
所定のベース・フィルタと前記差分値の組とに基づいて補間フィルタを構成するための手段と、
補間フィルタと受信したビデオ・データとに基づいてビデオ・シーケンスのフレーム内のピクセル値を再構成するための手段と、を備えることを特徴とする。
有利なことは、ビデオ・デコーダが、前記差分値の組を所定のベース・フィルタのさらなる係数値と合計して補間フィルタを構成する手段、およびビット・ストリームからの前記差分値の組をエントロピ・デコーディングする手段も備えることである。
本発明の第5の態様によれば、ビデオ・フレームのシーケンスを有するデジタル・ビデオ・シーケンスにおける画像をエンコーディングして、ビデオ・シーケンスを示すビット・ストリームでのエンコーディングされたビデオ・データを与えるエンコーダであって、ビデオ・シーケンスの各フレームは複数のピクセル値を含み、エンコーダは、デコーディング・プロセスにおいて前記デジタル・ビデオ・シーケンスのフレーム内のピクセル値を再構成するための補間フィルタを規定する手段であって、補間フィルタは複数の係数値によって表わされる複数のフィルタ係数を有する手段、を有するエンコーダと、
ビット・ストリームでのエンコーディングされたビデオ・データを受信して、デコーディング・プロセスにおいてビデオ・シーケンスのフレーム内のピクセル値を再構成するためのデコーダと、を備えるビデオ・コーディング・システムが提供される。ビデオ・コーディング・システムは、
エンコーダがさらに、
補間フィルタと所定のベース・フィルタとの間の差分を計算して差分値の組を与える手段と、
ビット・ストリームでの前記差分値の組を適合させる手段と、を備え、
デコーディングは、
ビット・ストリームから前記差分値の組を回収するための手段と、
所定のベース・フィルタと回収された差分値の組とに基づいてさらなるフィルタを構成して、デコーディング・プロセスにおけるピクセル値の再構成がさらなるフィルタに基づくようにする手段と、を備えることを特徴とする。
本発明のこれらの特徴および他の特徴は、以下の説明を添付の図面とともに参照することによって明らかになる。しかし図面は、例示のためにデザインされているに過ぎず、本発明の限界を規定するものとしてではないことを理解されたい。
本発明によれば、エンコーダは、所定のベース・フィルタ係数と比較して差をつけてフィルタ係数をコーディングする。図6a〜6cに、本発明による方法を例示する。図6aに示すバー・グラフは、補間フィルタ係数値を表わしており、各バーは、フィルタ係数の1つに対応する。バーの高さは個々の係数値を表わす。水平軸の上方に延びるバーは正係数値を表わし、水平軸の下方に延びるバーは負係数値を表わす。図6aおよび図6bを参照して、バー・グラフ110は、選択された画像セグメントの動き推定に最も適しているとエンコーダによって検出されたフィルタを表わす一方で、バー・グラフ140はベース・フィルタを表わす。図6aに示す例では、フィルタは、6つのフィルタ係数を有する6タップ対称性フィルタである。フィルタ係数自体を送る代わりに、選択されたフィルタ110とベース・フィルタ140との間の差分130をコーディングして送る。図6cに、送られる係数120を示す。
本発明を用いた場合、エントロピ・コーダを用いて小さい振幅差分を効率的にコーディングすることができるために、コーディング・ゲインが得られる。ビデオ・エンコーダによって生成されたエンコーディングされたビデオ・ビット・ストリーム内にこのような差分が含まれ、ビデオ・ビット・ストリームをエンコーダから対応するデコーダへ送信するときには、エンコーディングされたビット・ストリームから差分値を回収し、それらを、デコーダに格納された所定のベース・フィルタの個々の係数値に加えることによって、補間フィルタの係数をデコーダにおいて再構成することができる。
またベース・フィルタを、ビデオ・シーケンスと受信されたフィルタ係数との統計値に適合させて、コーディング係数をさらに改善できることを理解されたい。ベース・フィルタを、コーデック全体に対して予め規定することもできる。言い換えれば、予め規定された同じフィルタを、コーディングすべき全てのビデオ・シーケンスに対して、それらの特性と関係なく、またはそれらが取得された方法で用いる。あるいは、ベース・フィルタをビデオ・データに適合させる、すなわち異なるビデオ・シーケンスに対して異なるベース・フィルタを用いるか、またはベース・フィルタを、ある所定のルールに従って特定のビデオ・シーケンスのエンコーディングの間に適合させることができる。
図6a〜6cに示すように、フィルタが対称的である場合には、コーディングする必要があるのはフィルタ係数の2分の1だけである。その他はコピーによって得ることができる。図6cに示した例では、エンコーディングされたビデオ・ビット・ストリーム内の適合可能な補間フィルタの係数値を表わすのに必要な情報量をさらに減らすことが、4番目、5番目、6番目のフィルタ係数が3番目、2番目、1番目のフィルム係数とそれぞれ同一となることを実現することによって可能となる。したがってこの場合には、補間フィルタの6つの係数を実際には、次の3つの値でコーディングすることができる。すなわち、第1の補間フィルタ係数と所定のベース・フィルタの第1の係数との間の差分を表わす第1、第2の補間フィルタ係数と所定のベース・フィルタの第2の係数との間の差分を表わす第2、および第3の補間フィルタ係数と所定のベース・フィルタの第3の係数との間の差分を表わす第3である。したがってこれらの3つの差分値を、エンコーダからデコーダへ送信されるエンコーディングされたビデオ・ビット・ストリーム内に含めることだけが必要であり、再構成された最初の3つのフィルタ係数値を適切にコピーすることによって、デコーダは残りの3つの補間フィルタ係数を得ることができる。ベース・フィルタと補間フィルタとが有する係数の数が偶数ではなく奇数であるが、それにもかかわらずそれらが対称的である場合には、同様のアプローチを採用することができる。この場合、コーディングすべき差分値の数は(n/2)+1であり、ここでnはベース・フィルタ/補間フィルタにおける係数の数であることを、理解されたい。また本発明による方法は、他の係数コーディング方法と組み合わせることもできる。たとえば、最も頻繁に使用されるフィルタの組は、それらのインデックスによって規定およびコーディングすることができる。それほど頻繁には使用されないフィルタを、説明した発明によってコーディングして、利用可能なフィルタに対して最大限の変化を与えることで、係数値をコーディングするための従来技術の第3の方法に関する前述の不利点を打開することができる。
フィルタ係数のコーディング順序は、空間的な順序に従う必要はない。たとえば、補間フィルタ係数値を表わす差分値を、エンコーディングされたビデオ・ビット・ストリーム内に、フィルタ内で生じる係数と同じ順序で含める必要はない。この場合には、差分値がビット・ストリーム内に現れる順序を指定する所定のルールを規定して、それをエンコーダおよびデコーダの両方に対して既知としなければならない。
ベース・フィルタを、同じフィルタの受信されたフィルタ係数に適合させることができる。たとえば、第1の送信されたフィルタ係数がベース・フィルタ係数よりも大きい場合には、第2のベース・フィルタ係数を小さくすることができる。これは特に、フィルタ係数の合計が知られている場合に当てはまる。
通常、フィルタ係数の合計は固定されている。このような場合、最後のフィルタ係数をコーディングする必要はまったくなく、しかし最後のフィルタ係数は、最初の係数の合計を全体の合計から引き算することによって計算することができる。フィルタ係数の合計が固定されていない場合には、別個に送信される定数をベース・フィルタ係数またはフィルタ出力に加えて、係数差分の振幅を小さくすることができる。
図7に、本発明に従って動作するように適合させることができるビデオ・エンコーディングおよびデコーディング機器を備える端末装置を示す。より正確には、図7に、ITU−T勧告H.324に従って実装されるマルチメディア端末60を例示する。端末は、マルチメディア送受信器装置と考えることができる。それは、マルチメディア・データ・ストリームを捕捉、エンコーディング、および多重化して通信網を介して送信する要素にくわえて、受信したマルチメディア・コンテントを受信、逆多重化、デコーディング、および表示する要素を含む。ITU−T勧告H.324は、端末の動作全体を規定し、その種々の構成部分の動作を支配する他の勧告について言及している。この種のマルチメディア端末は、対話形式テレビ電話などのリアル・タイム用途、またはビデオ・クリップの回収またはストリーミングをたとえばインターネット内のマルチメディア・コンテント・サーバーから行なうなどの非リアル・タイム用途で用いることができる。
本発明の文脈においては、図7に示したH.324端末は、本発明の方法の応用に適した多くの代替的なマルチメディア端末実装の1つに過ぎないことを理解されたい。また端末機器の位置および実装に関して多くの代替案が存在することにも注意されたい。図7に例示したように、マルチメディア端末を、アナログPSTN(公衆交換電話網)などの固定回線電話網に接続された通信機器内に位置付けても良い。この場合、マルチメディア端末に、ITU−T勧告V.8、V.34、および任意にV.8の2に準拠するモデム71が備え付けられる。あるいは、マルチメディア端末を外部のモデムに接続しても良い。モデムによって、マルチメディア端末によって生成された多重化デジタル・データおよび制御信号を、PSTN上への送信に適したアナログ形式に変換することができる。さらにモデムによって、マルチメディア端末がデータおよび制御信号をPSTNからアナログ形式で受信して、端末が適切な方法で逆多重化して処理することができるデジタル・データ・ストリームに変換することができる。
またH.324マルチメディア端末の実装を、ISDN(総合デジタル通信網)などのデジタル固定回線網に直接接続できるように行なっても良い。この場合、モデム71を、ISDNユーザ・ネットワーク・インターフェースと取り替える。図7では、このISDNユーザ・ネットワーク・インターフェースを、代わりのブロック72で表わしている。
またH.324マルチメディア端末を、モバイル通信用途で使用するために適合させても良い。無線通信リンクとともに使用する場合、図7の代わりのブロック73で表わしたように、モデム71を何らかの適切な無線インターフェースと取り替えることができる。たとえばH.324/Mマルチメディア端末は、現在の第2世代GSM携帯電話網または提案される第3世代UMTS(ユニバーサル移動電話システム)への接続が可能な無線送受信器を含むことができる。
双方向通信用に、すなわちビデオ・データの送信および受信用にデザインされたマルチメディア端末では、本発明により実装されるビデオ・エンコーダおよびビデオ・デコーダの両方を設けることが有利であることを理解されたい。このようなエンコーダおよびデコーダは多くの場合、単一の組み合わせ機能ユニット(「コーデック」と言われる)として実装される。
次に典型的なH.324マルチメディア端末を、図7を参照して、より詳細に説明する。マルチメディア端末60には、「端末機器」と言われる種々の要素が含まれている。この端末機器には、ビデオ、オーディオ、およびテレマティック装置が含まれており、それぞれ総称的に参照番号61、62、および63によって示す。ビデオ機器61はたとえば、ビデオ映像を捕らえるためのビデオ・カメラ、受信したビデオ・コンテントを表示するためのモニタ、および任意にビデオ処理機器を含んでいても良い。オーディオ機器62は通常、たとえば口頭によるメッセージを捕らえるためのマイクロフォン、および受信したオーディオ・コンテントを再生するためのラウドスピーカを含んでいる。またオーディオ機器は、さらなるオーディオ処理ユニットを含んでいても良い。テレマティック機器63は、データ端末、キーボード、電子黒板、または静止画像受信器(たとえばファックス・ユニット)を含んでいても良い。
ビデオ機器61は、ビデオ・コーデック65に結合されている。ビデオ・コーデック65は、ビデオ・エンコーダおよび対応するビデオ・デコーダを備えており、両方とも本発明により実装されている。このようなエンコーダおよびデコーダを以下で説明する。ビデオ・コーデック65は、捕らえられたビデオ・データを通信リンク上でさらに送信するのに適切な形式でエンコーディングし、および通信網から受信した圧縮ビデオ・コンテントをデコーディングする役割を担っている。図7に例示した例では、ビデオ・コーデックが、動的に適合可能な補間フィルタを用いることが含まれるように実装されることが想定されている。また前述したように、本発明の方法の実施形態により、ビデオ・コーデックのエンコーダ部分が、補間フィルタ係数値をエンコーディングして、対応するデコーダに送信するように適合されることが、さらに想定されている。同様に、ビデオ・コーデックのデコーダ部分は、本発明の方法の同じ実施形態によりエンコーディングされたフィルタ係数値を受信してデコーディングするように適合される。
端末のオーディオ機器は、図7で参照番号66によって示されるオーディオ・コーデックに結合されている。ビデオ・コーデックと同様に、オーディオ・コーデックは、エンコーダ/デコーダ対を備えている。それは、端末のオーディオ機器によって捕らえられたオーディオ・データを、通信リンク上での送信に適した形式に変換し、またネットワークから受信されたエンコーディングされたオーディオ・データを変換して、たとえば端末のラウドスピーカ上での再生に適した形式に戻す。オーディオ・コーデックの出力は、遅延ブロック67へ送られる。ここでは、ビデオ・コーディング・プロセスで生じた遅延を補償することによって、オーディオおよびビデオ・コンテントの同期化が保証される。
マルチメディア端末のシステム制御ブロック64では、終端対ネットワーク・シグナリングを適切な制御プロトコル(シグナリング・ブロック68)を用いて制御して、送信および受信端末間の共通の動作モードを確立する。シグナリング・ブロック68では、送信および受信端末のエンコーディングおよびデコーディング能力に関する情報を交換する。シグナリング・ブロック68を用いて、ビデオ・エンコーダの種々のコーディング・モードをイネーブルにすることができる。またシステム制御ブロック64では、データ暗号化を使用することも制御する。データ送信で用いるべき暗号化のタイプに関する情報が、暗号化ブロック69からマルチプレクサ/デマルチプレクサ(MUX/DMUXユニット)70へ送られる。
マルチメディア端末からのデータ送信の間、MUX/DMUXユニット70は、エンコーディングされ同期化されたビデオおよびオーディオ・ストリームを、テレマティック機器63からのデータ入力および考えられる制御データと組み合わせて、単一のビット・ストリームを形成する。暗号化ブロック69によって供給される、ビット・ストリームに加えるべきデータ暗号化(もしあれば)のタイプに関する情報を用いて、暗号化モードを選択する。対応して、多重化されおよびおそらく暗号化されるマルチメディア・ビット・ストリームを受信しているときに、MUX/DMUXユニット70は、ビット・ストリームを解読して、その構成媒体成分に分解し、それらの成分を適切なコーデックおよび/または端末機器へデコーディングおよび再生のために送る役割を担う。
図8aは、本発明の好ましい実施形態により実装されるビデオ・エンコーダ700を示す概略的なブロック・ダイアグラムである。図8aに示すビデオ・エンコーダの構造は、多くの点で、図1に例示した従来技術のビデオ・エンコーダに類似しているが、サブ・ピクセル値の補間と、エンコーディングされたビデオ・ビット・ストリームの形成とに関連する動作を行なうエンコーダ部分に、適切な変更が加えられている。ビデオ・エンコーダ700のほとんどの要素は、前述した従来技術のビデオ・エンコーダ10(図1を参照)の対応する要素に類似する方法で、機能し動作する。このような要素の説明は、簡潔にするために省略する。特にビデオ・エンコーダ700は、動き領域推定ブロック711、動き領域コーディング・ブロック712、動き補償予測ブロック713、予測エラー・コーディング・ブロック714、予測エラー・デコーディング・ブロック715、多重化ブロック716、フレーム・メモリ717、および加算器719を備えている。また図8aに示すように、動き領域推定ブロック711は、差分係数計算ブロック710を含む。差分係数計算ブロック710は、選択したフィルタとベース・フィルタ709との間の差分を計算するために用いられる。
次にビデオ・エンコーダ700の動作について、詳細に考察する。従来技術から知られるビデオ・エンコーダと同様に、本発明のこの実施形態によるビデオ・エンコーダ700では、基準フレームRn(x、y)に対する動き補償予測を用いて、インター形式でコーディングされているビデオ・フレームを表わすビット・ストリームを生成する。それは、動き補償予測をサブ・ピクセル分解能まで行ない、さらに動的に可変なフィルタ係数値を有する補間フィルタを用いて、動き推定プロセスの間に要求されるサブ・ピクセル値を形成する。
ビデオ・エンコーダ700は、ブロックづつのベースで動き補償予測を行ない、動き補償を、サブ・ピクセル分解能まで、各ブロックに対して2段階プロセスとして行なう。第1段階では、フル・ピクセル分解能を有する動きベクトルを、ブロック・マッチングによって、すなわちコーディングすべき現在の画像ブロックのピクセル値と最もマッチングするピクセル値のブロックを基準フレームRn(x、y)内でサーチすることによって、決定する。ブロック・マッチング動作は、動き領域推定ブロック711によって、フレーム記憶装置717と協力して行なわれる。フレーム記憶装置717からは、基準フレームRn(x、y)のピクセル値が回収される。動き補償予測の第2段階では、第1段階で決定された動きベクトルを精緻化して、所望のサブ・ピクセル分解能にする。これを行なうために、動き領域推定ブロック711が、サブ・ピクセル分解能を有する新しいサーチ・ブロックを形成する。これは、現在コーディングされている画像ブロック(図5を参照)に対するベスト・マッチングとしてすでに特定された領域において基準フレームRn(x、y)のピクセル値を補間することよって、行なわれる。このプロセスの一部として、動き領域推定ブロック711が、サブ・ピクセル値の補間に対して最適な補間フィルタを決定する。有利なことは、補間フィルタの係数値が、各画像ブロックのエンコーディングとともに適合されることである。代替的な実施形態においては、補間フィルタの係数を適合させる頻度を少なくしても良い。たとえばフレームごとに一度、またはコーディングすべき新しいビデオ・シーケンスの始まりにおいてである。
必要なサブ・ピクセル値を補間して新しいサーチ・ブロックを形成したら、動き領域推定ブロック711は、さらにサーチを行なって、新しいサーチ・ブロックの何れかが、フル・ピクセル分解能において当初特定されたベスト・マッチング・ブロックよりも良好なマッチングを、現在の画像ブロックに対して表わすかどうかを決定する。このようにして、動き領域推定ブロック711は、現在コーディングされている画像ブロックを表わす動きベクトルが、フル・ピクセル位置を指し示すべきかサブ・ピクセル位置を指し示すべきかを決定する。
前述したように、動き領域推定ブロック711は、特定された動きベクトルを動き領域コーディング・ブロック712に出力し、このブロック712では、動きモデルを用いて動きベクトルを見積もる。次に、動き補償予測ブロック713は、見積もられた予測エラー情報を用いて、現在の画像ブロックに対する予測を形成する。予測は、その後に、予測エラー・コーディング・ブロック714内でコーディングされる。次に、現在の画像ブロックに対するコーディングされた予測エラー情報を、予測エラー・コーディング・ブロック714からマルチプレクサ・ブロック716へ転送する。またマルチプレクサ・ブロック716は、見積もられた動きベクトルについての情報(動き係数の形式)も、動き領域コーディング・ブロック712から受信し、同様に、現在の画像ブロックの動き補償予測の間に用いられる最適な補間フィルタについての情報も、動き領域推定ブロック711から受信する。本発明のこの実施形態によれば、動き領域推定ブロック711は、差分係数計算ブロック710により計算された計算結果に基づいて、現在のブロックに対する最適な補間フィルタのフィルタ係数とエンコーダ700に格納された所定のベース・フィルタ709の係数との間の差分を示す差分値705の組を送信する。その後にマルチプレクサ・ブロック716は、画像の現在のブロックを表わすエンコーディングされたビット・ストリーム703を、動き情報(動き係数)、予測エラー・データ、フィルタ係数差分値、および考えられる制御情報を組み合わせることによって、形成する。種々タイプの情報のそれぞれをエントロピ・コーダによってエンコーディングすることを、ビット・ストリーム内に含めてその後に対応するデコーダへ送信する前に、行なっても良い。
本発明の代替的な実施形態においては、図8bに示すように、動き領域推定ブロック711は、最適な補間フィルタのフィルタ係数を示す値704の組を、動き領域推定ブロック711とマルチプレクサ・ブロック716との間に位置する差分係数計算ブロック710へ送る。ベース・フィルタ709に基づいて、差分係数計算ブロック710は、差分値705を計算して、マルチプレクサ・ブロック716へ送る。
他の代替的な実施形態においては、差分係数計算ブロック710が、マルチプレクサ・ブロック716内に配置されている。この場合、図8cに示すように、最適な補間フィルタのフィルタ係数704を、動き領域推定ブロック711によってマルチプレクサ・ブロック716へ直接送ることができる。
図9aは、本発明の好ましい実施形態により実装されるビデオ・デコーダ800のブロック・ダイアグラムであり、図8aに例示したビデオ・エンコーダ700に対応している。デコーダ800は、動き補償予測ブロック721、予測エラー・デコーディング・ブロック722、逆多重化ブロック723、およびフレーム・メモリ824を備える。デコーダ800内のほとんどの要素は、従来技術20(図2を参照)内の対応する要素に類似する仕方で機能および動作する。しかし図9aに示したように、本発明のデコーダ800には、フィルタ再構成ブロック810が含まれる。これは、差分値130(図6bおよび図6c)および所定のベース・フィルタ809に基づいて、最適な補間フィルタ110(図6aを参照)を再構成するものである。所定のベース・フィルタ809は好ましくは、ベース・フィルタ709(図8a〜8c)と同一である。
次に、ビデオ・デコーダ800の動作を詳細に考察する。デマルチプレクサ823は、エンコーディングされたビット・ストリーム803を受信して、ビット・ストリームを、その構成部分(動き係数、予測エラー・データ、フィルタ係数差分値、および考えられる制御情報)に分割し、種々のデータ・タイプについて何らかの必要なエントロピ・デコーディングを行なう。デマルチプレクサ823は、受信したビット・ストリーム803から回収した予測エラー情報を、予測エラー・デコーディング・ブロック822へ転送する。また、受信した動き情報も、動き補償予測ブロック821へ転送する。本発明のこの実施形態においては、デマルチプレクサ823は、受信した(およびエントロピ・デコーディングされた)差分値を、信号802を介して動き補償予測ブロック821へ転送する。その結果、フィルタ再構成ブロック810が、受信した差分値を、デコーダに格納された所定のベース・フィルタ809の係数へ加えることによって、最適な補間フィルタ110(図6aを参照)を再構成することができる。その後に、動き補償予測ブロック821が、再構成された係数値によって規定されるように、最適な補間フィルタを用いて、現在デコーディングされている画像ブロックに対する予測を構成する。より具体的には、動き補償予測ブロック821は、現在の画像ブロックに対する予測を形成することを、フレーム・メモリ824に格納された基準フレームRn(x、y)のピクセル値を回収し、そして必要に応じて、受信した動き情報に従ってピクセル値を補間して、何らかの必要なサブ・ピクセル値を形成することによって、行なう。次に、現在の画像ブロックに対する予測を、対応する予測エラー・データと組み合わせて、当該画像ブロックの再構成を形成する。
あるいは、図9bに示すように、フィルタ再構成ブロック810は、動き補償予測ブロック821の外に配置されている。デマルチプレクサ823から受信した信号802内に含まれる差分値から、フィルタ再構成ブロック810は、最適な補間フィルタを再構成して、再構成フィルタ係数805を動き補償予測ブロック821へ送る。さらに他の代替的な実施形態においては、フィルタ再構成ブロック810が、デマルチプレクサ・ブロック823内に配置されている。デマルチプレクサ・ブロック823は、最適な補間フィルタの再構成された係数を、動き補償予測ブロック821へ転送する。
本発明によれば、エンコーダが、所定のベース・フィルタ係数と比較して差をつけてフィルタ係数をコーディングすることによって、デコーダが、差分値に基づいて、最適な補間フィルタを再構成することができる。ベース・フィルタ係数は、エンコーダおよびデコーダの両方に対して既知でなければならず、また良好なコーディング性能をもたらすように、ビデオ・シーケンス内で使用される実際のフィルタに統計的に合理的に近くなければならない。言い換えれば、本発明の方法によれば、特定の係数値の組を有するベース・フィルタを規定した後、ベース・フィルタ係数と、実際に使用される補間フィルタの係数との間の差分をコーディングして、ビデオ・ビット・ストリーム内に含める。このようにして、エンコーディングされたビデオ・ビット・ストリーム内の適合可能な補間フィルタ係数を表わすのに必要な情報量が、適合可能なフィルタ係数のそれぞれを別個にコーディングする方法と比較して低減される。実際に用いられる補間フィルタの係数にベース・フィルタの係数が十分に類似していれば、コーディングすべき差分値は小さい。したがって実際に用いられる補間フィルタに所定のベース・フィルタが統計的に類似しているならば、この場合には、差分値が減りコーディング効率のさらなる改善が得られるために、有利である。
ウェディで提案されている差分コーディング方法とは異なり、本発明による方法は、比較的良好なエラー回復を保持している。エンコーディングされたビデオ・ビット・ストリームをエンコーダからデコーダへ送信する間にエラーが生じた場合には、それは、ベース・フィルタと、エラーの影響を受ける実際に用いられる補間フィルタとの間の差分に過ぎない。
本発明によるマルチメディア端末、ビデオ・エンコーダ、デコーダ、およびビデオ・コーデックの機能要素は、ソフトウェアもしくは専用のハードウェア、または2つの組み合わせとして、実装できることを理解されたい。本発明によるビデオ・エンコーディングおよびデコーディング方法は、本発明の機能ステップを実行するための機械読み取り可能な命令を含むコンピュータ・プログラムの形態での実装に、特に適している。したがって本発明によるエンコーダ、デコーダ、およびビデオ・コーデックを、記憶媒体上に格納されたソフトウェア・コードとして実装して、パーソナル・デスクトップ・コンピュータなどのコンピュータ内で実行することで、そのコンピュータに、ビデオ・エンコーディングおよび/またはデコーディング機能性を持たせても良い。
特定の実施形態との関連で説明してきたが、これらの教示に対する多くの変更および種々の変形を行なっても良いことが当業者には明らかである。すなわち本発明は特に1つまたは複数の好ましい実施形態に関して図示して説明してきたが、前述したような本発明の範囲および趣旨から逸脱することなく、ある種の変更または変形を行なっても良いことが、当業者によって理解される。
従来技術による一般的なビデオ・エンコーダを例示するブロック・ダイアグラムである。 従来技術による一般的なビデオ・デコーダを例示するブロック・ダイアグラムである。 ビデオ・エンコーディングで用いるフレームのタイプを例示する概略的な図である。 現在のフレーム内のマクロブロックを例示する概略的な図である。 ブロック・マッチング用の基準フレームを例示する概略的な図である。 現在のフレーム内のマクロブロックの本来の位置の周辺のサーチ領域を例示する概略的な図である。 従来技術によるサブ・ピクセル分解能までの動き推定プロセスを例示する概略的な図である。 最適な補間フィルタを例示する概略的な図である。 最適な補間をベース・フィルタと差分係数とに分解する様子を例示する概略的な図である。 コーディングしてデコーダへ送るべき差分係数を例示する概略的な図である。 本発明を実施することができるビデオ・エンコーディングおよびデコーディング機器を備える端末装置を例示する例示するブロック・ダイアグラムである。 本発明の好ましい実施形態によるビデオ・エンコーダを例示するブロック・ダイアグラムである。 本発明の他の実施形態によるビデオ・エンコーダを例示するブロック・ダイアグラムである。 本発明のさらに他の実施形態によるビデオ・エンコーダを例示するブロック・ダイアグラムである。 本発明の好ましい実施形態によるビデオ・デコーダを例示するブロック・ダイアグラムである。 本発明の他の実施形態によるビデオ・デコーダを例示するブロック・ダイアグラムである。 本発明のさらに他の実施形態によるビデオ・デコーダを例示するブロック・ダイアグラムである。

Claims (21)

  1. デジタル・ビデオ・シーケンスにおける画像をエンコーディングしてエンコーディングされたビデオ・データを与えるための方法であって、デジタル・ビデオ・シーケンスはビデオ・フレームのシーケンスを含み、各フレームは複数のピクセル値を有し、複数の係数値によって表わされる複数の係数を有する補間フィルタを用いて、エンコーディングされたビデオ・データから前記デジタル・ビデオ・シーケンスのフレーム内のピクセル値を再構成し、前記方法は、
    補間フィルタの係数値を、所定のベース・フィルタと比較して差をつけてコーディングして、差分値の組を形成するステップと、
    エンコーディングされたビデオ・データにおける前記差分値の組を適合させて、ピクセル値の再構成が前記差分値の組に基づくようにするステップと、
    を含むことを特徴とする方法。
  2. エンコーディングされたビデオ・データをビデオ・エンコーダからビデオ・デコーダへ送信し、
    エンコーディングされたビデオ・データは、前記差分値の組を示すエンコーディングされた値を含み、前記差分値の組を、ビデオ・エンコーダからビデオ・デコーダへ送信する前にエントロピ・コーディングすることを特徴とする、請求項1に記載の方法。
  3. 所定のベース・フィルタが、補間フィルタの係数値に統計的に類似する値の複数のさらなる係数を有することを特徴とする、請求項1に記載の方法。
  4. 補間フィルタの係数を、選択された画像セグメント内でのピクセル値を補間するように選択することを特徴とする、請求項1に記載の方法。
  5. 所定のベース・フィルタが、固定された係数値を有することを特徴とする、請求項1に記載の方法。
  6. 所定のベース・フィルタが、ビデオ・シーケンスの統計値に適合される複数の係数を有することを特徴とする、請求項1に記載の方法。
  7. 補間フィルタが対象的であり、フィルタ係数の2分の1のみがコーディングされることを特徴とする、請求項1に記載の方法。
  8. 補間フィルタの係数値が、第1の係数値から最後の係数値まで、ある順序でコーディングされることを特徴とする、請求項1に記載の方法。
  9. 係数値がコーディングされるある順序が、前記係数の空間的な順序とは異なることを特徴とする、請求項8に記載の方法。
  10. 補間フィルタの係数値の合計が固定されていることを特徴とする、請求項8に記載の方法。
  11. 所定のベース・フィルタが複数のさらなる係数値を有し、所定のベース・フィルタのさらなる係数値に一定の値を加えて、補間フィルタの係数値と所定のベース・フィルタのさらなる係数値との間の差分の振幅を減らすことを特徴とする、請求項1に記載の方法。
  12. ビデオ・フレームのシーケンスを有するデジタル・ビデオ・シーケンスにおける画像をエンコーディングして、ビデオ・シーケンスを示すエンコーディングされたビデオ・データを与える手段であって、ビデオ・シーケンスの各フレームは複数のピクセル値を含む手段と、
    デコーディング・プロセスにおいて前記デジタル・ビデオ・シーケンスのフレーム内のピクセル値を再構成するための補間フィルタを規定する手段であって、補間フィルタは複数の係数値によって表わされる多くの係数を有する手段と、
    を備えるビデオ・エンコーダであって、
    補間フィルタに対応して、前記補間フィルタの係数値と所定のベース・フィルタの係数値との間の差分を計算して差分値の組を与える手段と、
    エンコーディングされたビデオ・データにおける前記差分値の組を適合させて、デコーディング・プロセスにおけるピクセル値の再構成が前記差分値の組に基づくようにする手段と、
    を備えることを特徴とするビデオ・エンコーダ。
  13. エンコーディングされたビデオ・データにおける前記差分値の組を適合させる前に前記差分値の組をエントロピ・コーディングするための手段をさらに備えることを特徴とする、請求項12に記載のビデオ・エンコーダ。
  14. 補間フィルタが対称的であり、エントロピ・コーディング手段を、前記差分値の組の2分の1のみをエンコーディングするように用意することを特徴とする、請求項13に記載のビデオ・エンコーダ。
  15. ビデオ・フレームのシーケンスを含むデジタル・ビデオ・シーケンスを示すビデオ・データをデコーディングする方法であって、ビデオ・シーケンスの各フレームは複数のピクセル値を含み、複数の係数値によって表わされる複数の係数を有する補間フィルタを用いて前記デジタル・ビデオ・シーケンスのフレーム内のピクセル値を再構成し、前記方法は、
    ビデオ・データから差分値の組を回収するステップであって、前記差分値の組は、補間フィルタの係数値と所定のベース・フィルタの係数値との間の差分を示すステップと、
    前記差分値の組と所定のベース・フィルタとに基づいて、さらなるフィルタを構成するステップと、
    さらなるフィルタに基づいてピクセル値を再構成するステップと、
    を含むことを特徴とする方法。
  16. 所定のベース・フィルタが、複数のさらなる係数値によって表わされる複数のさらなる係数を有し、
    前記差分値の組を所定のベース・フィルタのさらなる係数値と合計してさらなるフィルタを構成するステップ、をさらに含むことを特徴とする、請求項15に記載の方法。
  17. 前記差分値の組を、ビデオ・データから、エントロピ・デコーディングによって回収することを特徴とする、請求項16に記載の方法。
  18. ビット・ストリーム内のビデオ・データを受信するための手段であって、受信したビデオ・データは、ビデオ・フレームのシーケンスを含むデジタル・ビデオ・シーケンスを示し、ビデオ・シーケンスの各フレームは複数のピクセル値を含む手段、を備えるビデオ・デコーダであって、
    ビット・ストリームから差分値の組を回収するための手段と、
    所定のベース・フィルタと前記差分値の組とに基づいて補間フィルタを構成するための手段と、
    補間フィルタと受信したビデオ・データとに基づいてビデオ・シーケンスのフレーム内のピクセル値を再構成するための手段と、
    を備えることを特徴とするビデオ・デコーダ。
  19. 所定のベース・フィルタが、さらなる係数値によって表わされる複数のさらなる係数を有し、
    前記差分値の組を所定のベース・フィルタのさらなる係数値と合計して補間フィルタを構成する手段、をさらに備えることを特徴とする、請求項18に記載のビデオ・デコーダ。
  20. ビット・ストリームからの前記差分値の組をエントロピ・デコーディングする手段、をさらに備えることを特徴とする、請求項18に記載のビデオ・デコーダ。
  21. ビデオ・フレームのシーケンスを有するデジタル・ビデオ・シーケンスにおける画像をエンコーディングして、ビデオ・シーケンスを示すビット・ストリームでのエンコーディングされたビデオ・データを与えるエンコーダであって、ビデオ・シーケンスの各フレームは複数のピクセル値を含み、前記エンコーダは、デコーディング・プロセスにおいて前記デジタル・ビデオ・シーケンスのフレーム内のピクセル値を再構成するための補間フィルタを規定する手段であって、補間フィルタは複数の係数値によって表わされる複数のフィルタ係数を有する手段、を有するエンコーダと、
    ビット・ストリームでのエンコーディングされたビデオ・データを受信して、デコーディング・プロセスにおいてビデオ・シーケンスのフレーム内のピクセル値を再構成するためのデコーダと、
    を備えるビデオ・コーディング・システムであって、
    エンコーダがさらに、
    補間フィルタと所定のベース・フィルタとの間の差分を計算して差分値の組を与える手段と、
    ビット・ストリームでの前記差分値の組を適合させる手段と、を備え、
    デコーディングは、
    ビット・ストリームから前記差分値の組を回収するための手段と、
    所定のベース・フィルタと回収された差分値の組とに基づいてさらなるフィルタを構成して、デコーディング・プロセスにおけるピクセル値の再構成がさらなるフィルタに基づくようにする手段と、
    を備えることを特徴とするビデオ・コーディング・システム。
JP2003559135A 2002-01-14 2003-01-14 動的フィルタのコーディング Expired - Lifetime JP4494789B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US34881102P 2002-01-14 2002-01-14
PCT/IB2003/000061 WO2003058945A2 (en) 2002-01-14 2003-01-14 Coding dynamic filters

Publications (3)

Publication Number Publication Date
JP2005514872A true JP2005514872A (ja) 2005-05-19
JP2005514872A5 JP2005514872A5 (ja) 2008-07-31
JP4494789B2 JP4494789B2 (ja) 2010-06-30

Family

ID=23369646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003559135A Expired - Lifetime JP4494789B2 (ja) 2002-01-14 2003-01-14 動的フィルタのコーディング

Country Status (12)

Country Link
US (1) US7379501B2 (ja)
EP (1) EP1466477B1 (ja)
JP (1) JP4494789B2 (ja)
KR (1) KR100945546B1 (ja)
CN (1) CN100553321C (ja)
AU (1) AU2003201069C1 (ja)
BR (2) BRPI0304545B1 (ja)
HU (1) HU228615B1 (ja)
MX (1) MXPA04006814A (ja)
RU (1) RU2302707C2 (ja)
SG (1) SG149694A1 (ja)
WO (1) WO2003058945A2 (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007111292A1 (ja) * 2006-03-27 2007-10-04 Matsushita Electric Industrial Co., Ltd. 画像符号化装置および画像復号化装置
JP2008544708A (ja) * 2005-06-24 2008-12-04 株式会社エヌ・ティ・ティ・ドコモ 適応補間を使用する映像符号化及び復号化の方法と装置
KR20090103776A (ko) * 2008-03-27 2009-10-01 엘지전자 주식회사 비디오 신호의 인코딩 또는 디코딩 방법 및 장치
JP2010516082A (ja) * 2007-01-09 2010-05-13 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 適応フィルタ表現
JP2011517240A (ja) * 2008-04-10 2011-05-26 クゥアルコム・インコーポレイテッド ビデオコーディングにおける整数ピクセル位置の補間的フィルタリング
JP2011517237A (ja) * 2008-04-10 2011-05-26 クゥアルコム・インコーポレイテッド ビデオ・コーディングにおける補間のための予測技法
JP2011517912A (ja) * 2008-04-10 2011-06-16 クゥアルコム・インコーポレイテッド ビデオコーディングにおけるサブピクセル位置の補間フィルタリングに対する対称性
JP2011135460A (ja) * 2009-12-25 2011-07-07 Kddi R & D Laboratories Inc 動画像符号化装置および動画像復号装置
JP2011523235A (ja) * 2008-01-08 2011-08-04 クゥアルコム・インコーポレイテッド 水平対称性および垂直対称性に基づくフィルタ係数のビデオ符号化
JP2012515514A (ja) * 2009-01-15 2012-07-05 クゥアルコム・インコーポレイテッド ビデオのコーディングの際の、アクティビティメトリックに基づくフィルタ予測
JP2012134870A (ja) * 2010-12-22 2012-07-12 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、及び映像復号方法
US8705622B2 (en) 2008-04-10 2014-04-22 Qualcomm Incorporated Interpolation filter support for sub-pixel resolution in video coding
US8964853B2 (en) 2011-02-23 2015-02-24 Qualcomm Incorporated Multi-metric filtering
JP5759387B2 (ja) * 2010-01-08 2015-08-05 シャープ株式会社 符号化装置および復号装置
US9967590B2 (en) 2008-04-10 2018-05-08 Qualcomm Incorporated Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter
US10123050B2 (en) 2008-07-11 2018-11-06 Qualcomm Incorporated Filtering video data using a plurality of filters

Families Citing this family (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1169303C (zh) 2000-05-09 2004-09-29 索尼公司 数据处理装置和方法以及记录介质
JP4102973B2 (ja) * 2002-04-24 2008-06-18 日本電気株式会社 動画像の符号化方法および復号化方法、これを用いた装置とプログラム
JP2004061446A (ja) * 2002-07-31 2004-02-26 Fujitsu Ten Ltd パターンマッチング処理方法及び画像処理装置
US20040091047A1 (en) 2002-11-11 2004-05-13 Sony Corporation Method and apparatus for nonlinear multiple motion model and moving boundary extraction
JP4462823B2 (ja) * 2002-11-20 2010-05-12 ソニー株式会社 画像信号の処理装置および処理方法、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラム
US9330060B1 (en) 2003-04-15 2016-05-03 Nvidia Corporation Method and device for encoding and decoding video image data
US8660182B2 (en) * 2003-06-09 2014-02-25 Nvidia Corporation MPEG motion estimation based on dual start points
US7817869B2 (en) * 2004-05-07 2010-10-19 Sony Corporation Variable support robust transform for multiple description coding
US8503530B2 (en) * 2004-05-27 2013-08-06 Zhourong Miao Temporal classified filtering for video compression
JP2008503960A (ja) * 2004-06-23 2008-02-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ピクセル補間
JP4736456B2 (ja) * 2005-02-15 2011-07-27 株式会社日立製作所 走査線補間装置、映像表示装置、映像信号処理装置
JP2008536414A (ja) * 2005-04-13 2008-09-04 ゴットフリート・ヴィルヘルム・ライプニッツ・ウニヴェルジテート・ハノーヴァー ビデオの拡張された符号化方法及び装置
WO2007011851A2 (en) * 2005-07-15 2007-01-25 Texas Instruments Incorporated Filtered and warped motion compensation
FR2889778A1 (fr) * 2005-08-12 2007-02-16 Thomson Licensing Sas Procede de codage et de decodage d'images video avec echelonnabilite spatiale
KR100754841B1 (ko) * 2005-10-28 2007-09-04 경희대학교 산학협력단 비트율 왜곡 비용에 기초하여 선택된 보간 필터를 이용하여공간 계층간 예측을 수행하는 스케일러블 h.264부호화/복호화 방법
US8731071B1 (en) 2005-12-15 2014-05-20 Nvidia Corporation System for performing finite input response (FIR) filtering in motion estimation
EP1841230A1 (en) * 2006-03-27 2007-10-03 Matsushita Electric Industrial Co., Ltd. Adaptive wiener filter for video coding
US8724702B1 (en) * 2006-03-29 2014-05-13 Nvidia Corporation Methods and systems for motion estimation used in video coding
EP1840875A1 (en) * 2006-03-31 2007-10-03 Sony Deutschland Gmbh Signal coding and decoding with pre- and post-processing
US8208553B2 (en) * 2006-05-04 2012-06-26 Altera Corporation Methods and apparatus for quarter-pel refinement in a SIMD array processor
US8831111B2 (en) * 2006-05-19 2014-09-09 The Hong Kong University Of Science And Technology Decoding with embedded denoising
TWI367457B (en) 2006-07-03 2012-07-01 Nippon Telegraph & Telephone Image processing method and apparatus, image processing program, and storage medium for storing the program
US8660380B2 (en) 2006-08-25 2014-02-25 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
US9307122B2 (en) * 2006-09-27 2016-04-05 Core Wireless Licensing S.A.R.L. Method, apparatus, and computer program product for providing motion estimation for video encoding
WO2008044637A1 (fr) 2006-10-10 2008-04-17 Nippon Telegraph And Telephone Corporation Procédés de codage et de décodage vidéo, leur dispositif, leur programme, et le support de stockage contenant le programme
CN101711481B (zh) * 2006-10-18 2013-01-09 汤姆森特许公司 使用预测数据精选进行视频编码的方法和装置
KR101354659B1 (ko) * 2006-11-08 2014-01-28 삼성전자주식회사 멀티 코덱을 지원하는 움직임 보상 방법 및 장치
WO2008069073A1 (ja) 2006-11-30 2008-06-12 Ntt Docomo, Inc. 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号化装置、動画像復号化方法及び動画像復号化プログラム
EP2127391A2 (en) * 2007-01-09 2009-12-02 Nokia Corporation Adaptive interpolation filters for video coding
KR101369746B1 (ko) 2007-01-22 2014-03-07 삼성전자주식회사 적응적 보간 필터를 이용한 영상 부호화, 복호화 방법 및장치
US8756482B2 (en) 2007-05-25 2014-06-17 Nvidia Corporation Efficient encoding/decoding of a sequence of data frames
US9118927B2 (en) 2007-06-13 2015-08-25 Nvidia Corporation Sub-pixel interpolation and its application in motion compensated encoding of a video signal
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US8428133B2 (en) * 2007-06-15 2013-04-23 Qualcomm Incorporated Adaptive coding of video block prediction mode
US8873625B2 (en) 2007-07-18 2014-10-28 Nvidia Corporation Enhanced compression in representing non-frame-edge blocks of image frames
AU2008306503A1 (en) * 2007-10-05 2009-04-09 Nokia Corporation Video coding with pixel-aligned directional adaptive interpolation filters
US8090031B2 (en) * 2007-10-05 2012-01-03 Hong Kong Applied Science and Technology Research Institute Company Limited Method for motion compensation
EP2048886A1 (en) * 2007-10-11 2009-04-15 Panasonic Corporation Coding of adaptive interpolation filter coefficients
WO2009088340A1 (en) * 2008-01-08 2009-07-16 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive filtering
EP2252063A4 (en) * 2008-03-07 2012-09-12 Toshiba Kk DEVICE FOR DYNAMIC IMAGE CODING / DECODING
RU2505938C2 (ru) * 2008-04-10 2014-01-27 Квэлкомм Инкорпорейтед Интерполяция на основе искажений в зависимости от скорости передачи для кодирования видео на основе неперестраиваемого фильтра или адаптивного фильтра
US8804831B2 (en) 2008-04-10 2014-08-12 Qualcomm Incorporated Offsets at sub-pixel resolution
US8971412B2 (en) 2008-04-10 2015-03-03 Qualcomm Incorporated Advanced interpolation techniques for motion compensation in video coding
US8059908B2 (en) * 2008-04-29 2011-11-15 Sony Corporation Adaptive area of influence filter for irregular spatial sub-sampled images
US8059909B2 (en) * 2008-04-29 2011-11-15 Sony Corporation Adaptive generation of irregular spatial sub-sampling for images
US8055087B2 (en) * 2008-04-29 2011-11-08 Sony Corporation Sample level variation for spatial sub-sampled images
US8811484B2 (en) * 2008-07-07 2014-08-19 Qualcomm Incorporated Video encoding by filter selection
WO2010014087A1 (en) * 2008-07-30 2010-02-04 Micro Motion, Inc. Optimizing processor operation in a processing system including one or more digital filters
EP2154893A1 (en) * 2008-08-13 2010-02-17 Thomson Licensing Method for modifying a reference block of a reference image, method for encoding or decoding a block of an image by help of a reference block and device therefor and storage medium or signal carrying a block encoded by help of a modified reference block
US8548041B2 (en) 2008-09-25 2013-10-01 Mediatek Inc. Adaptive filter
WO2010038858A1 (ja) * 2008-10-03 2010-04-08 ソニー株式会社 画像処理装置および方法
US8666181B2 (en) 2008-12-10 2014-03-04 Nvidia Corporation Adaptive multiple engine image motion detection system and method
WO2011003326A1 (en) * 2009-07-06 2011-01-13 Mediatek Singapore Pte. Ltd. Single pass adaptive interpolation filter
KR101701342B1 (ko) 2009-08-14 2017-02-01 삼성전자주식회사 적응적인 루프 필터링을 이용한 비디오의 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
JP2011050001A (ja) * 2009-08-28 2011-03-10 Sony Corp 画像処理装置および方法
CN101854549B (zh) * 2010-05-28 2012-05-02 浙江大学 基于空域预测的视频和图像编解码方法和装置
KR101710883B1 (ko) * 2009-11-04 2017-02-28 삼성전자주식회사 필터 정보를 이용한 영상 압축 장치 및 방법과 영상 복원 장치 및 방법
KR101729903B1 (ko) * 2009-12-18 2017-04-24 샤프 가부시키가이샤 복호 장치
EP2988503A1 (en) * 2010-01-14 2016-02-24 Dolby Laboratories Licensing Corporation Buffered adaptive filters
US9219921B2 (en) * 2010-04-12 2015-12-22 Qualcomm Incorporated Mixed tap filters
US9154807B2 (en) * 2010-06-25 2015-10-06 Qualcomm Incorporated Inclusion of switched interpolation filter coefficients in a compressed bit-stream
BR112013000554A2 (pt) * 2010-07-09 2020-09-24 Samsung Electronics Co., Ltd. método para interpolar imagem, e aparelho para interpolar imagem
US9661337B2 (en) 2010-10-01 2017-05-23 Samsung Electronics Co., Ltd. Image intra prediction method and apparatus
US10045046B2 (en) * 2010-12-10 2018-08-07 Qualcomm Incorporated Adaptive support for interpolating values of sub-pixels for video coding
KR101438471B1 (ko) * 2011-01-03 2014-09-16 미디어텍 인크. 필터 유닛 기반 인-루프 필터링 방법
JP5670226B2 (ja) * 2011-03-04 2015-02-18 Kddi株式会社 動画像符号化装置、動画像符号化方法、およびプログラム
JP5552092B2 (ja) * 2011-06-13 2014-07-16 日本電信電話株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP5649523B2 (ja) * 2011-06-27 2015-01-07 日本電信電話株式会社 映像符号化方法,装置,映像復号方法,装置およびそれらのプログラム
JP5907367B2 (ja) * 2011-06-28 2016-04-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
KR102039049B1 (ko) * 2011-07-15 2019-11-15 지이 비디오 컴프레션, 엘엘씨 저-지연을 위한 샘플 배치 코딩
TWI595776B (zh) * 2012-06-27 2017-08-11 Sony Corp Image processing device and method
JP5972687B2 (ja) * 2012-07-02 2016-08-17 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
JP5798539B2 (ja) * 2012-09-24 2015-10-21 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法
US10218971B2 (en) * 2012-09-28 2019-02-26 Vid Scale, Inc. Adaptive upsampling for multi-layer video coding
JP2014082541A (ja) * 2012-10-12 2014-05-08 National Institute Of Information & Communication Technology 互いに類似した情報を含む複数画像のデータサイズを低減する方法、プログラムおよび装置
CN103905825B (zh) * 2012-12-27 2018-02-13 中国电信股份有限公司 视频图像的运动补偿方法和装置
US10356426B2 (en) * 2013-06-27 2019-07-16 Google Llc Advanced motion estimation
US10432974B2 (en) 2014-02-13 2019-10-01 Intel Corporation Methods and apparatus to perform fractional-pixel interpolation filtering for media coding
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
CN106331722B (zh) 2015-07-03 2019-04-26 华为技术有限公司 图像预测方法和相关设备
EP3125429A1 (en) 2015-07-28 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Partitioned block frequency domain adaptive filter device comprising adaptation modules and correction modules
CN105739935B (zh) * 2016-01-22 2019-06-04 厦门美图移动科技有限公司 一种多终端联合显示方法、装置及系统
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
US11750784B2 (en) * 2019-05-31 2023-09-05 Medicapture, Inc. Automatic video file repair method and system
US11356707B2 (en) * 2019-09-23 2022-06-07 Qualcomm Incorporated Signaling filters for video processing
CN112004081A (zh) * 2020-06-15 2020-11-27 广东科学技术职业学院 一种视频编码方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3853554T2 (de) * 1987-06-09 1995-08-24 Sony Corp Bewegungsvektorabschätzung in Fernsehbildern.
US5784107A (en) * 1991-06-17 1998-07-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for picture coding and method and apparatus for picture decoding
JP2991833B2 (ja) 1991-10-11 1999-12-20 松下電器産業株式会社 インターレス走査ディジタルビデオ信号の符号化装置及びその方法
GB2301971B (en) * 1995-06-06 1999-10-06 Sony Uk Ltd Video compression
US6122017A (en) 1998-01-22 2000-09-19 Hewlett-Packard Company Method for providing motion-compensated multi-field enhancement of still images from video
US6937772B2 (en) * 2000-12-20 2005-08-30 Eastman Kodak Company Multiresolution based method for removing noise from digital images
DE10120395A1 (de) * 2001-04-25 2002-10-31 Bosch Gmbh Robert Einrichtung zur Interpolation von Abtastwerten sowie Bildencoder und Bilddecoder

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008544708A (ja) * 2005-06-24 2008-12-04 株式会社エヌ・ティ・ティ・ドコモ 適応補間を使用する映像符号化及び復号化の方法と装置
WO2007111292A1 (ja) * 2006-03-27 2007-10-04 Matsushita Electric Industrial Co., Ltd. 画像符号化装置および画像復号化装置
JP5513740B2 (ja) * 2006-03-27 2014-06-04 パナソニック株式会社 画像復号化装置、画像符号化装置、画像復号化方法、画像符号化方法、プログラムおよび集積回路
US8712171B2 (en) 2006-03-27 2014-04-29 Panasonic Corporation Image coding apparatus and image decoding apparatus
US8189934B2 (en) 2006-03-27 2012-05-29 Panasonic Corporation Image coding apparatus and image decoding apparatus
JP2010516082A (ja) * 2007-01-09 2010-05-13 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 適応フィルタ表現
JP2011523235A (ja) * 2008-01-08 2011-08-04 クゥアルコム・インコーポレイテッド 水平対称性および垂直対称性に基づくフィルタ係数のビデオ符号化
US8638852B2 (en) 2008-01-08 2014-01-28 Qualcomm Incorporated Video coding of filter coefficients based on horizontal and vertical symmetry
US8634479B2 (en) 2008-03-27 2014-01-21 Lg Electronics Inc. Decoding a video signal using in-loop filter
KR101591825B1 (ko) * 2008-03-27 2016-02-18 엘지전자 주식회사 비디오 신호의 인코딩 또는 디코딩 방법 및 장치
KR20090103776A (ko) * 2008-03-27 2009-10-01 엘지전자 주식회사 비디오 신호의 인코딩 또는 디코딩 방법 및 장치
JP2011515981A (ja) * 2008-03-27 2011-05-19 エルジー エレクトロニクス インコーポレイティド ビデオ信号のエンコーディングまたはデコーディング方法及び装置
US8831086B2 (en) 2008-04-10 2014-09-09 Qualcomm Incorporated Prediction techniques for interpolation in video coding
JP2011517912A (ja) * 2008-04-10 2011-06-16 クゥアルコム・インコーポレイテッド ビデオコーディングにおけるサブピクセル位置の補間フィルタリングに対する対称性
US8462842B2 (en) 2008-04-10 2013-06-11 Qualcomm, Incorporated Symmetry for interpolation filtering of sub-pixel positions in video coding
US9077971B2 (en) 2008-04-10 2015-07-07 Qualcomm Incorporated Interpolation-like filtering of integer-pixel positions in video coding
KR101250115B1 (ko) 2008-04-10 2013-04-03 퀄컴 인코포레이티드 비디오 코딩에서의 서브-픽셀 포지션들의 보간 필터링을 위한 대칭
US8705622B2 (en) 2008-04-10 2014-04-22 Qualcomm Incorporated Interpolation filter support for sub-pixel resolution in video coding
JP2011517240A (ja) * 2008-04-10 2011-05-26 クゥアルコム・インコーポレイテッド ビデオコーディングにおける整数ピクセル位置の補間的フィルタリング
JP2011517237A (ja) * 2008-04-10 2011-05-26 クゥアルコム・インコーポレイテッド ビデオ・コーディングにおける補間のための予測技法
US10440388B2 (en) 2008-04-10 2019-10-08 Qualcomm Incorporated Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter
US9967590B2 (en) 2008-04-10 2018-05-08 Qualcomm Incorporated Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter
US11683519B2 (en) 2008-04-10 2023-06-20 Qualcomm Incorporated Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter
US11711548B2 (en) 2008-07-11 2023-07-25 Qualcomm Incorporated Filtering video data using a plurality of filters
US10123050B2 (en) 2008-07-11 2018-11-06 Qualcomm Incorporated Filtering video data using a plurality of filters
JP2012515514A (ja) * 2009-01-15 2012-07-05 クゥアルコム・インコーポレイテッド ビデオのコーディングの際の、アクティビティメトリックに基づくフィルタ予測
US9143803B2 (en) 2009-01-15 2015-09-22 Qualcomm Incorporated Filter prediction based on activity metrics in video coding
US8780995B2 (en) 2009-12-25 2014-07-15 Kddi R&D Laboratories Inc. Video encoding apparatus and video decoding apparatus
JP2011135460A (ja) * 2009-12-25 2011-07-07 Kddi R & D Laboratories Inc 動画像符号化装置および動画像復号装置
JP5759387B2 (ja) * 2010-01-08 2015-08-05 シャープ株式会社 符号化装置および復号装置
JP2012134870A (ja) * 2010-12-22 2012-07-12 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、及び映像復号方法
US8989261B2 (en) 2011-02-23 2015-03-24 Qualcomm Incorporated Multi-metric filtering
US9877023B2 (en) 2011-02-23 2018-01-23 Qualcomm Incorporated Multi-metric filtering
US9819936B2 (en) 2011-02-23 2017-11-14 Qualcomm Incorporated Multi-metric filtering
US9258563B2 (en) 2011-02-23 2016-02-09 Qualcomm Incorporated Multi-metric filtering
US8982960B2 (en) 2011-02-23 2015-03-17 Qualcomm Incorporated Multi-metric filtering
US8964852B2 (en) 2011-02-23 2015-02-24 Qualcomm Incorporated Multi-metric filtering
US8964853B2 (en) 2011-02-23 2015-02-24 Qualcomm Incorporated Multi-metric filtering

Also Published As

Publication number Publication date
AU2003201069C1 (en) 2008-11-06
CN1615645A (zh) 2005-05-11
SG149694A1 (en) 2009-02-27
BRPI0304545B1 (pt) 2018-07-03
EP1466477A2 (en) 2004-10-13
JP4494789B2 (ja) 2010-06-30
WO2003058945A2 (en) 2003-07-17
HU228615B1 (en) 2013-04-29
CN100553321C (zh) 2009-10-21
WO2003058945A3 (en) 2003-12-31
BR0304545A (pt) 2004-11-03
US7379501B2 (en) 2008-05-27
EP1466477A4 (en) 2006-10-25
US20030169931A1 (en) 2003-09-11
HUP0500030A2 (hu) 2005-07-28
KR100945546B1 (ko) 2010-03-08
AU2003201069B2 (en) 2008-02-28
KR20040075348A (ko) 2004-08-27
RU2302707C2 (ru) 2007-07-10
EP1466477B1 (en) 2013-02-27
AU2003201069A1 (en) 2003-07-24
RU2004124831A (ru) 2006-01-27
MXPA04006814A (es) 2004-12-06

Similar Documents

Publication Publication Date Title
JP4494789B2 (ja) 動的フィルタのコーディング
RU2477575C2 (ru) Способ интерполяции значений под-пикселов
KR20060105409A (ko) 영상 신호의 스케일러블 인코딩 및 디코딩 방법
JP2001525150A (ja) ユニバーサル・シリアルバス接続用の二重圧縮ビデオ・ビットストリーム・カメラ
JP2005524304A (ja) ビデオ符号化システムにおける量子化器パラメータを表示するための方法および装置
JP2004215252A (ja) ビデオエラー隠蔽のための動的イントラ符号化マクロブロックリフレッシュインターバル
US20060120454A1 (en) Method and apparatus for encoding/decoding video signal using motion vectors of pictures in base layer
KR20080013880A (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
US20060159176A1 (en) Method and apparatus for deriving motion vectors of macroblocks from motion vectors of pictures of base layer when encoding/decoding video signal
US20070242747A1 (en) Method and apparatus for encoding/decoding a first frame sequence layer based on a second frame sequence layer
KR20060059773A (ko) 베이스 레이어 픽처의 벡터를 이용하는 영상신호의엔코딩/디코딩 방법 및 장치
US20060120457A1 (en) Method and apparatus for encoding and decoding video signal for preventing decoding error propagation
GB2379820A (en) Interpolating values for sub-pixels
AU2007237319B2 (en) Method for sub-pixel value interpolation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100309

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100408

R150 Certificate of patent or registration of utility model

Ref document number: 4494789

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140416

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term