JP2002526998A - ブロック動きビデオのコード化及びデコード化 - Google Patents
ブロック動きビデオのコード化及びデコード化Info
- Publication number
- JP2002526998A JP2002526998A JP2000573099A JP2000573099A JP2002526998A JP 2002526998 A JP2002526998 A JP 2002526998A JP 2000573099 A JP2000573099 A JP 2000573099A JP 2000573099 A JP2000573099 A JP 2000573099A JP 2002526998 A JP2002526998 A JP 2002526998A
- Authority
- JP
- Japan
- Prior art keywords
- data
- block
- motion
- video
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 239000013598 vector Substances 0.000 claims abstract description 60
- 238000007906 compression Methods 0.000 claims abstract description 33
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims description 66
- 230000008569 process Effects 0.000 claims description 34
- 230000006835 compression Effects 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims 2
- 238000012937 correction Methods 0.000 abstract description 5
- 230000004069 differentiation Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 6
- 230000002457 bidirectional effect Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 230000006837 decompression Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/112—Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
- H04N19/619—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding the transform being operated outside the prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
2,214及び1999年2月25日のに出願された米国仮出願No.60/1
21,531の出願日に基づく利益を請求するものである。
ァミリのアルゴリズムに対応するような典型的な変換ベースのビデオ圧縮アルゴ
リズムにおいては、離散コサイン変換(DCT)のようなブロックベースの変換
が、例えば、動き補正されたインターフレーム差別体系に基づいて発生された画
素値又は画素差のいずれかに対応した像データのブロックに施される。それぞれ
のブロックに対する得られた変換係数は、次いで、引き続くコード化(例えば、
可変長さコード化によってフォローされるラン長さコード化)のために一般的に
量子化されてコード化されたビデオビットストリームを発生させる。
な種々のフレームとして指定できる。
ーム、 ・予測される(P)フレームであって、予めI又はPフレームに対応する基準
フレームに基づいてイントラフレーム圧縮技術を用いてコード化されるとともに
それ自身一つ又はそれ以上のその他のフレームをコード化するための基準フレー
ムを発生するのに用いることができる予測される(P)フレーム、及び、 ・(i)予めのI又はPフレーム、(ii)引き続くI又はPフレーム、(iii)
両方の組み合わせのいずれかから(i)順方向、(ii)逆方向、又は、(iii)双
方向予測に基づいてインターフレーム圧縮技術を用いてコード化され、及び、そ
れ自身はその他のフレームのコード化には使えない双方向(B)フレーム。
トラフレーム圧縮技術を用いてコード化できる。
化するために、特定の圧縮処理が、逆転又は反転されなければならない。例えば
、可変長さデコード化が、ラン長さデコード化に引き続いてビットストリームに
施すことができて、次いで、非量子化によって非量子化された変換係数のブロッ
クが発生する。反転変換が、次いで、非量子化された変換係数のブロックに施さ
れ、(1)デコード化された画素データ又は(2)画素差データのいずれかが発
生する(像データの対応するブロックが、当初に、それぞれ、(1)イントラフ
レーム又は(2)インターフレーム圧縮技術を用いてコード化されたかどうかに
応じて)。動き補正されたインターフレーム圧縮技術が使われるとき、次いで、
イントラフレーム追加が、動き補正された基準フレームデータを用いる画素差デ
ータに施されてデコード化された画素データを発生させ、ここで、動き補正の量
は、圧縮処理中にビットストリームにコード化される動きベクトルによって決定
される。動き補正された基準フレームデータは、デコード化された像データの予
測であると考えられ、画素差データは、その予測における誤差であると考えられ
る。このようにして、動き補正されたインターフレーム圧縮追加過程は、予測の
補正に対応する。
オビットストリームが発生された後に施される。典型的に、コード化されたビデ
オビットストリームは、別の、多分離れて位置するプロセッサによって予め発生
されており、必要な追加の処理の目的で入力として取り扱われる。例えば、 「トランスコーディング(transcoding)」が実行できることが好ましく、こ
れは、一つのビデオ圧縮/伸長(コーデック)アルゴリズムに適合する存在する
コード化ビデオビットストリームが、異なるビデオコーデックアルゴリズムに適
合する対応するコード化されたビデオビットストリームに変換されることである
。このような 「トランスコーディング」操作が実行できる一つの「暴力的な(b
rute force)」アプローチは、入力ビットストリームを第1のビデオコーデック
アルゴリズムに基づいてデコード化された画素領域に完全にデコード化し、次い
で、得られたデコード化画素データを第2のビデオコーデックアルゴリズムに基
づいて出力ビットストリームに完全にコード化することである。
ムへのウォータマークの挿入である。ここで、またウォータマーク挿入への一つ
の暴力的なアプローチは、入力ビットストリームをデコード化される画素領域に
完全にデコード化し、画素領域内のデコード化される画素データを処理して必要
なウォータマークを挿入し、次いで、修正された画素データを完全に再コード化
し、必要な処理を受けた出力コード化ビデオビットストリームを発生することで
ある。
逆方向変換過程は、コード化の複雑さと処理時間の両方のために比較的コスト高
である。さらに、損失のある変換において、存在するコード化されたビデオビッ
トストリームの乱暴な強行な処理中における逆方向変換の適用と、次に順方向変
換の再適用は、入力ビットストリームに含まれる情報の損失を一般的に招き、処
理されたビットストリームにおけるデコード化された画質に劣化をもたらす。こ
のようにして、最初にビットストリームを完全にデコード化せずに入力ビットス
トリームにある処理操作(例えば、トランスコーディングやウォータマーク挿入
のような)を行なえることが望ましい。このような処理操作が情報の大きな損失
無しに変換領域において実行できるときは、コスト高で損失の大きな逆方向及び
順方向変換過程は、回避される。
リームを最初に完全にデコード化することなく存在するコード化ビデオビットス
トリームをさらに処理することを可能にする技術に関する。特に、この発明は、
入力ビットストリームに含まれている情報の大きな損失のない、又は、できれば
まったく損失のない変換領域における部分的にデコード化されたビデオデータを
処理することを可能にするものである。このようにして、この発明は、存在する
入力ビットストリームの処理中にコスト高で損失の大きな逆方向及び順方向変換
過程を施すことを回避する。
のに用いられる動き補正されたインターフレームビデオ圧縮技術は、ブロック境
界に一致する動きベクトルに基づくものに限定される。例えば、(8×8)DCT
変換に基づいたMPEGビデオ圧縮アルゴリズムにおいて、動きベクトル成分は
、整数×8(整数は、正、負又は0であることができる)に限定される。その結
果、処理操作が、大きな情報の損失のない(又は、できればまったく損失のない
)変換領域において部分的にデコード化されたビデオデータに適用できる。典型
的なMPEGビデオコーデックアルゴリズムに対して、可変長さデコード化、ラ
ン長さデコード化が、コード化された入力ビデオビットストリームに施すことが
できて、次いで、非量子化によってDCT係数データが発生される。動きベクト
ルはブロック境界との一致に限定されるので、動き補正されたインターフレーム
追加が、次いで、逆方向DCT変換を最初に適用することなくDCT変換領域に
おいて実行される。得られた動き補正された変換データは、次いで、変換領域に
おいて特別の必要な処理操作(例えば、トランスコーディング操作、ウォータマ
ークの挿入)を受けることができる。適用の仕方に対応して、得られた処理され
たDCT係数データは、次に動き推定、動き補正されたインターフレーム減算、
再量子化、ラン長さ再コード化、及び、可変長さ再コード化の少なくとも一部分
を受けることができて逆方向及び順方向DCT変換過程を別々に展開することな
く必要な処理された出力コード化ビデオビットストリームを発生させる。
(a)対応する基準データに基づいてビデオデータのフレームについて動き推定
を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推
定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベ
クトルのみの識別に制限され、及び、ブロックベースの動きベクトルの少なくと
も一つが、非ゼロ動きベクトルであり、 (b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビ
デオデータに対して動き補正されたインターフレーム差別を行なってインターフ
レーム差データを発生させ、及び、(c)前記インターフレーム差データに一つ
又はそれ以上のビデオ圧縮過程を与えて前記ビデオデータに対応するコード化さ
れたビデオビットストリームに対してコード化されたデータを発生させる過程か
らなるものである。
ットストリームを処理する方法であって、(a)一つ又はそれ以上のデコード化
過程を入力ビットストリームに施して変換領域内における変換係数データ及び対
応するブロックベースの動きベクトルを回復し、その際前記ブロックベースの動
きベクトルが、対応する基準データにおけるブロック境界との一致に制限され、
(b)前記ブロックベースの動きベクトルと前記基準データに基づいて変換領域
内において動き補正されたインターフレーム追加を実行して予測エラー補正され
た(PEC)変換係数データを発生させ、及び、(c)変換領域内において前記
PEC変換係数データの引き続いての処理を実行するようにした過程からなるも
のである。
方法であって、(a)対応する基準データに基づいてビデオデータのフレームに
ついて動き推定を行なってそのフレームに対する動きベクトルの組を識別し、そ
の際前記動き推定が、前記基準データにおけるブロック境界と一致するブロック
ベースの動きベクトルのみの識別に制限され、及び、ブロックベースの動きベク
トルのすべてが、0動きベクトルであり、(b)前記基準データ及び前記ブロッ
クベースの動きベクトルに基づいた前記ビデオデータに対して動き補正されたイ
ンターフレーム差別を行なってインターフレーム差データを発生させ、及び、(
c)前記インターフレーム差データに一つ又はそれ以上の追加のビデオ圧縮過程
を与えて前記ビデオデータに対応するコード化されたビデオビットストリームに
対してコード化されたデータを発生させ、その際前記コード化されたビデオビッ
トストリームが、MPEGコーデックアルゴリズムに適合する過程からなるもの
である。
デオ圧縮処理のブロック図である。この実施例により、動きベクトルが、ブロッ
ク境界と一致するものに限定される。
データに施される。インターフレームビデオ圧縮処理が(i)順方向予測、(ii
)逆方向予測、又は、(iii)双方向予測に基づいているかどうかにより、基準
データが、それぞれ、(i)予めのフレーム、(iii)引き続くフレーム、(iii
)両方の組み合わせ(例えば、予めのフレームと引き続くフレームの平均)のい
ずれかに基づいて発生される。いずれにせよ、動き推定処理は、なんらかの適切
な同様の尺度(例えば、絶対的な画素差の和(SAD))に基づいて像データの
その時点でのブロックに極めて密に一致する基準データのブロックを識別しよう
とするものである。この発明によれば、動き推定処理中に用いられる基準データ
のブロックの組は、ブロック境界に一致するものに限定される。従来周知の動き
推定処理においては、このような制限は存在せず、従って、動き推定処理に使う
ことができる基準データのブロックは、特定のサーチ範囲ないの画素(又はサブ
画素)位置に対応する。
データに対するこの発明による動き推定処理(図3)の差を示している。図2及
び図3は、像データの特定の(8×8)ブロックに対する基準データのサーチ領域
を示しており、基準データにおけるその対応する位置は、ブロックの中央に対す
る(0,0)の動きベクトルを備えた太い(8×8)ブロックにより図において示
されている。図2及び図3におけるサーチ領域は、その成分が8画素の大きさに
それぞれ制限されている動きベクトルに基づいている(すなわち、動きベクトル
成分は、−8から+8に独立に変動する)。
−8から+8までの17の異なる整数成分値の組み合わせに基づく289の異な
る整数ベースの動きベクトルに対応する基準データの289の異なる使用可能な
(8×8)ブロックが存在する。「フラクショナル画素」に基づいた動き推定体系
においては、それ以上の基準データのブロックを使うことができる。
のこのような特定の実施例に対して、使用可能な基準データのブロックは、ブロ
ック境界に対応して9ブロックに限定される(すなわち、−8,0,+8の3個
の異なる成分値の組み合わせに基づいた9個の動きベクトルの一つを備えた)。
このブロックベースの動き推定処理体系から得られた典型的な予測は、従来周知
の画素ベースの動き推定処理体系よりも精度が低いが、多くのアプリケーション
において、ブロックベースの動き推定処理予測の精度は、許容し得るものであろ
う。
いので(例えば、図2及び図3の実施例において289から9に)、この発明に
よるブロックベースの動き推定処理は、より迅速に実行が可能である。その上、
サーチ範囲は、従来周知の画素ベースの動き推定処理体系よりも動き推定に対し
て必要な処理時間が少ないのにもかかわらず、非常に拡張されている。例えば、
±8の代わりに±24にサーチ範囲を拡大しても処理されるべき基準データは4
9(8×8)ブロックを残すのみである。実際のところ、サーチ範囲は、同一の数
の基準ブロック(すなわち、289)が±8に制限されているサーチ範囲を備え
た画素ベースの動き推定に使えるようになる前に、±64に拡大可能である。
対応して、ブロック102における動き推定処理は、像データのブロックのそれ
ぞれに対して3個の、順方向光予測、逆方向予測及び双方向予測からなる異なる
ブロックベースの動きベクトルを識別できる。モード制御処理104が、動き推
定後に実行され、イントラフレームコード化技術を用いてコード化する可能性を
含んで、その時点での像データにおけるブロックのコード化の仕方を決定する。
このコード化モード制御の結果に応じて、イントラフレーム差別化106が、次
いで、対応する動き補正された基準データを用いる像データに実行されてブロッ
ク動き補正されたインターフレーム画素差データを発生させる。
画素領域データのブロックに適用され、110で量子化され、112でラン長さ
コード化され、114で可変長さコード化される変換係数のブロックを発生して
コード化されたビデオビットストリームの一部分を発生させる。図1には示され
ていないが、可能ならば、像データのブロックをコード化するために使われる動
きベクトルは、また、ビットストリーム内でコード化される。
コード化過程であるので、図1における圧縮アルゴリズムの一部分(すなわち、
図1の上方部分)であるデコード化処理は、ビデオコーデックアルゴリズムに対
する信頼性を損なうことなく量子化ブロック110によって発生させられる量子
化係数とともにスタートできる。特に、ブロック110からの量子化された変換
係数は、116で非量子化され、118で逆方向に変換され、及び、もし可能な
らば、動き補正されたインターフレーム追加120が施されて、像データにおけ
るその他の組のコード化において使われる可能性のある基準データを発生させる
。
過程のその他が、MPEG標準に適合するような従来周知のビデオ圧縮技術に基
づいて展開できるものであることは、当該技術に通常の知識を有する者には明ら
かなことであろう。
オ圧縮処理のブロック図である。図1の実施例と同じように、動きベクトルは、
ブロック境界に一致するものに限定される。しかしながら、図4において、変換
401が、動き推定402の前に未処理の像データに施される。このようにして
、ブロック限定の動き推定402、モード制御404、及び、動き補正されたイ
ンターフレーム差別化406が、図1の実施例におけるような画素領域において
ではなく、変換領域においてすべて実行される。動き推定及び補正が変換領域に
おいて実行されるので、コード化フィードバック路において生じる動き補正され
たインターフレーム追加420の過程は、また、変換領域において実行される。
その結果、逆方向変換は、コード化処理の間はまったく実行されない。量子化1
10、ラン長さコード化412、可変長さコード化414、非量子化416は、
図1に示されている実施例における過程と類似した過程で実行される。
図である。図5の部分的なデコード化処理は、図1におけるブロックベースの動
き補正されたインターフレームビデオ圧縮アルゴリズムを用いて発生される存在
するコード化されたビデオビットストリームで動作するように設計されている。
特に、部分的なデコード化処理が、入力ビットストリームを受け入れて部分的に
デコード化して出力非量子化変換データを発生させる。追加の処理過程(例えば
、トランスコーディングやウォータ挿入に関連し、図5には示されていない)が
、次いで、変換領域内において非量子化された変換データに適用されて処理され
た変換データを発生し、次いで、さらにコード化されて、必要な処理をされたコ
ード化されたビデオビットストリームを発生させる。
長さデコード化/ラン長さデコード化/非量子化506は、入力ビットストリー
ムに適用され、それぞれ、(1)ブロックベース動きベクトル、(2)モード制
御情報(すなわち、いずれのブロックが、順方向、逆方向又は双方向(すなわち
、内挿された)予測に基づいてイントラフレーム技術又はインターフレーム技術
を用いてコード化されたか)、及び、(3)変換領域における予測誤差に対応す
る非量子化された変換(例えば、DCT)を回復する。
準データ(例えば、非量子化されたDCT係数)を保持し、他方で、メモリB5
10は、先行するフレームに対応する変換領域基準データを保持している。メモ
リA及びBからの基準データの対応するブロックは、デコード化ブロック502
によって回復されたブロックベースの動きベクトルによって識別されるように、
平均化ノード512によって平均化されて双方向予測のための内挿された基準デ
ータを形成する。
データによって指令される。モード制御データが「後方予測」を指示していると
き、スイッチ514は、メモリAから加算ノード516への適切な(すなわち、
動き補正された)引き続くフレーム基準データを送るように配置されている。モ
ード制御データが「前方予測」を指示しているとき、スイッチ514は、メモリ
Bから加算ノード516への適切な先行フレーム基準データを送るように配置さ
れている。モード制御データが「双方向予測」を指示しているとき、スイッチ5
14は、平均化ノード512から加算ノード516への適切な内挿された基準デ
ータを送るように配置されている。最後に、モード制御データが「イントラコー
ド化」を指示しているとき、スイッチ514は、0を加算ノード516へ送る「
接地」に配置されている。
れたDCT係数が、スイッチ514から選択された変換領域基準データに加えら
れてすべて変換領域内にある予測誤差とともに予測を補正する。もし適切ならば
(すなわち、現時点でのフレームがI又はPフレームであるとき)、加算ノード
516からの変換データは、一つ又はそれ以上のその他のビデオフレームをコー
ド化するために基準データとして使うためにメモリA又はBにフィードバックさ
れる。
うな変換が直線的であるために、加算ノード516における動き補正されたイン
ターフレーム追加は、変換領域において、逆方向変換を最初に行なわずに実行で
きる。このようにして、量子化損失などを除いて、加算ノード516において発
生された得られた動き補正された変換データは、原像データに直接変換を施した
ときに得られるであろう変換データに対応する。追加の処理(図5には示されて
いない)が、次いで、逆方向変換を施さずに得られた補正された変換データに対
して実行される。この追加の処理は、典型的に、必要な処理を受けた出力コード
化ビデオビットストリームを発生させるのに必要な過程を含んでいる。その場合
、追加の処理は、変換領域における動き推定及び動き補正、再量子化、ラン長さ
再コード化、及び、可変長さ再コード化過程を含むことができる。適当な状況に
おいて、変換領域における動き推定及び/又は動き補正過程は、省略することが
できる。例えば、入力ビットストリームからの動きベクトルが再使用されるとき
は、動き推定が省略できる。動き補正なしに出力ビットストリームが発生される
ときは、動き推定及び動き補正の両方が省略できる。
なビデオコーデックアルゴリズムに展開することができ、それらには、(8×8)
DCT変換以外の変換に基づいたアルゴリズム及び/又はラン長さコード化及び
可変長さコード化過程を含まず及び/又は追加のその他の量子化後コード化過程
を含むアルゴリズムが含まれる。
開できる。当該技術に通常の知識を備えた者には明らかなように、回路部材の種
々の機能が、ソフトウェアプログラムにおける処理過程としてデジタル領域にお
いて展開できる。このようなソフトウェアは、例えば、デジタル信号プロセッサ
、マイクロコントローラ、又は、汎用のコンピュータにおいて使える。
形で具体化できる。この発明は、また、フロッピー(登録商標)ディスク、CD −ROM、ハードドライブ、又は、その他の機械読み取り可能な記憶媒体のよう な実体的な媒体において実現されるプログラムコードの形で具体化され、その際 プログラムコードがコンピュータのような機械によって装填されるとともに実行 されるとき、この機械は、この発明を具体化する装置となる。この発明は、また 、例えば、記憶媒体に記憶され、機械に装填され及び/又は機械によって実行さ れ、又は、光学繊維を介して、又は、電磁放射線を経由して電線又はケーブルの ようなものからなるいくつかの通信媒体又はキャリヤにまたがって搬送されるプ ログラムコードの形で具体化可能であり、その際プログラムコードがコンピュー タのような機械に装填され及び実行されるとき、この機械は、この発明を具体化 する装置となる。汎用のプロセッサのために実行されるとき、プログラムコード セグメントは、プロセッサに組み合わせられて特定の論理回路をアナログ的に作 動させるユニークな装置を構成する。
置の様々な変化が、特許請求の範囲に表現されているような発明の原理及び範囲
を逸脱することなく当該技術に通常の知識を備えた者にとって容易に行ない得る
ことは明らかであろう。
特許請求の範囲、及び、添付の図面から完全に明らかになろう。
処理のブロック図である。
を示している。
理のブロック図である。
。
Claims (12)
- 【請求項1】 ビデオデータを圧縮する方法において、 (a)対応する基準データに基づいてビデオデータのフレームについて動き推定
を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推
定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベ
クトルのみの識別に制限され、及び、ブロックベースの動きベクトルの少なくと
も一つが、非ゼロ動きベクトルであり、 (b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビ
デオデータに対して動き補正されたインターフレーム差別を行なってインターフ
レーム差データを発生させ、及び、 (c)前記インターフレーム差データに一つ又はそれ以上のビデオ圧縮過程を与
えて前記ビデオデータに対応するコード化されたビデオビットストリームに対し
てコード化されたデータを発生させるようにした方法。 - 【請求項2】 過程(a)及び(b)が、画素領域において実行され、及び
、過程(c)が、 (1)前記インターフレーム差データに変換を加えて変換領域に変換係数データ
を発生させ、及び、 (2)前記変換係数データを量子化して量子化された変換係数データを発生させ
る過程からなるようにした特許請求の範囲第1項に記載の方法。 - 【請求項3】 前記コード化されたビデオビットストリームが、MPEGコ
ーデックアルゴリズムに適合し、及び、前記変換が、離散コサイン変換(DCT
)であるようにした特許請求の範囲第2項に記載の方法。 - 【請求項4】 過程(a)が、さらに、画素データに変換を加えて変換領域
において変換係数データを発生させ、その際前記動き推定が、変換領域において
前記基準データに基づいて前記変換係数データに加えられるようにした過程を含
むようにした特許請求の範囲第1項に記載の方法。 - 【請求項5】 コード化されたプログラムコードを含む機械読み取り可能な
媒体であって、前記プログラムコードが機械によって実行されるとき、前記機械
が、 (a)対応する基準データに基づいてビデオデータのフレームについて動き推定
を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推
定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベ
クトルのみの識別に制限され、及び、ブロックベースの動きベクトルの少なくと
も一つが、非ゼロ動きベクトルであり、 (b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビ
デオデータに対して動き補正されたインターフレーム差別を行なってインターフ
レーム差データを発生させ、及び、 (c)前記インターフレーム差データに一つ又はそれ以上のビデオ圧縮過程を与
えて前記ビデオデータに対応するコード化されたビデオビットストリームに対し
てコード化されたデータを発生させることからなる過程を展開するようにした機
械読み取り可能な媒体。 - 【請求項6】 存在する入力コード化ビデオビットストリームを処理する方
法において、 (a)一つ又はそれ以上のデコード化過程を入力ビットストリームに施して変換
領域内における変換係数データ及び対応するブロックベースの動きベクトルを回
復し、その際前記ブロックベースの動きベクトルが、対応する基準データにおけ
るブロック境界との一致に制限され、 (b)前記ブロックベースの動きベクトルと前記基準データに基づいて変換領域
内において動き補正されたインターフレーム追加を実行して予測エラー補正され
た(PEC)変換係数データを発生させ、及び、 (c)変換領域内において前記PEC変換係数データの引き続いての処理を実行
するようにした方法。 - 【請求項7】 前記ブロックベースの動きベクトルの少なくとも一つが、非
ゼロ動きベクトルであるようにした特許請求の範囲第6項に記載の方法。 - 【請求項8】 前記コード化されたビデオビットストリームが、MPEGコ
ーデックアルゴリズムに適合し、及び、前記変換領域が、DCT変換領域に対応
するようにした特許請求の範囲第6項に記載の方法。 - 【請求項9】 前記過程(c)が、一つ又はそれ以上のビデオ圧縮過程を施
して処理された出力コード化ビデオビットストリームを発生させる過程を含むよ
うにした特許請求の範囲第6項に記載の方法。 - 【請求項10】 前記一つ又はそれ以上のビデオ圧縮過程が、動き補正され
たインターフレーム差別を変換領域において処理された変換係数に行なって変換
係数差データを発生させるようにした特許請求の範囲第9項に記載の方法。 - 【請求項11】 コード化されたプログラムコードを含む機械読み取り可能
な媒体であって、前記プログラムコードが機械によって実行されるとき、前記機
械が、 (a)一つ又はそれ以上のデコード化過程を存在する入力コード化ビデオビット
ストリームに施して変換領域内における変換係数データ及び対応するブロックベ
ースの動きベクトルを回復し、その際前記ブロックベースの動きベクトルが、対
応する基準データにおけるブロック境界との一致に制限され、 (b)前記ブロックベースの動きベクトルと前記基準データに基づいて変換領域
内において動き補正されたインターフレーム追加を実行して予測エラー補正され
た(PEC)変換係数データを発生させ、及び、 (c)変換領域内において前記PEC変換係数データの引き続いての処理を実行
するようにした機械読み取り可能な媒体。 - 【請求項12】 ビデオデータを圧縮する方法において、 (a)対応する基準データに基づいてビデオデータのフレームについて動き推定
を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推
定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベ
クトルのみの識別に制限され、及び、ブロックベースの動きベクトルのすべてが
、0動きベクトルであり、 (b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビ
デオデータに対して動き補正されたインターフレーム差別を行なってインターフ
レーム差データを発生させ、及び、 (c)前記インターフレーム差データに一つ又はそれ以上のビデオ圧縮過程を与
えて前記ビデオデータに対応するコード化されたビデオビットストリームに対し
てコード化されたデータを発生させ、その際前記コード化されたビデオビットス
トリームが、MPEGコーデックアルゴリズムに適合するようにした方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10221498P | 1998-09-29 | 1998-09-29 | |
US60/102,214 | 1998-09-29 | ||
US12153199P | 1999-02-25 | 1999-02-25 | |
US60/121,531 | 1999-02-25 | ||
US09/388,701 | 1999-09-02 | ||
US09/388,701 US6188728B1 (en) | 1998-09-29 | 1999-09-02 | Block motion video coding and decoding |
PCT/US1999/022635 WO2000019725A1 (en) | 1998-09-29 | 1999-09-29 | Block motion video coding and decoding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010160883A Division JP2010268505A (ja) | 1998-09-29 | 2010-07-15 | ブロック動きビデオのコード化及びデコード化 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002526998A true JP2002526998A (ja) | 2002-08-20 |
Family
ID=27379311
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000573099A Withdrawn JP2002526998A (ja) | 1998-09-29 | 1999-09-29 | ブロック動きビデオのコード化及びデコード化 |
JP2010160883A Pending JP2010268505A (ja) | 1998-09-29 | 2010-07-15 | ブロック動きビデオのコード化及びデコード化 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010160883A Pending JP2010268505A (ja) | 1998-09-29 | 2010-07-15 | ブロック動きビデオのコード化及びデコード化 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP1118224A1 (ja) |
JP (2) | JP2002526998A (ja) |
WO (1) | WO2000019725A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2519289B (en) | 2013-10-11 | 2016-10-12 | Canon Kk | Method and apparatus for displacement vector component transformation in video coding and decoding |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01300781A (ja) * | 1988-05-30 | 1989-12-05 | Nec Corp | 動画像信号の符号化・復号化方式 |
JPH02181586A (ja) * | 1989-01-06 | 1990-07-16 | Nec Corp | 動き補償フレーム間予測符号化方式 |
JPH05501944A (ja) * | 1989-11-14 | 1993-04-08 | ドイチエ トムソン―ブラント ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 伝送系 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4245248A (en) * | 1979-04-04 | 1981-01-13 | Bell Telephone Laboratories, Incorporated | Motion estimation and encoding of video signals in the transform domain |
JP3089165B2 (ja) * | 1994-11-10 | 2000-09-18 | 株式会社グラフィックス・コミュニケーション・ラボラトリーズ | 動きベクトル探索装置 |
US5708732A (en) * | 1996-03-06 | 1998-01-13 | Hewlett-Packard Company | Fast DCT domain downsampling and inverse motion compensation |
-
1999
- 1999-09-29 EP EP99950015A patent/EP1118224A1/en not_active Withdrawn
- 1999-09-29 JP JP2000573099A patent/JP2002526998A/ja not_active Withdrawn
- 1999-09-29 WO PCT/US1999/022635 patent/WO2000019725A1/en not_active Application Discontinuation
-
2010
- 2010-07-15 JP JP2010160883A patent/JP2010268505A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01300781A (ja) * | 1988-05-30 | 1989-12-05 | Nec Corp | 動画像信号の符号化・復号化方式 |
JPH02181586A (ja) * | 1989-01-06 | 1990-07-16 | Nec Corp | 動き補償フレーム間予測符号化方式 |
JPH05501944A (ja) * | 1989-11-14 | 1993-04-08 | ドイチエ トムソン―ブラント ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 伝送系 |
Also Published As
Publication number | Publication date |
---|---|
JP2010268505A (ja) | 2010-11-25 |
EP1118224A1 (en) | 2001-07-25 |
WO2000019725A1 (en) | 2000-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6188728B1 (en) | Block motion video coding and decoding | |
US6625215B1 (en) | Methods and apparatus for context-based inter/intra coding mode selection | |
CA2109138C (en) | Device for encoding digital signals representing images, and corresponding decoding device | |
US20050002458A1 (en) | Spatial scalable compression | |
US8144782B2 (en) | Adaptive motion estimation/compensation device for MB/based illumination change and method thereof | |
JP4226172B2 (ja) | 適応的変換方法を用いる映像圧縮符号化装置および復号化装置ならびにその方法 | |
JPH02308671A (ja) | 変換符号化装置 | |
JPH11275592A (ja) | 動画像符号列変換装置及びその方法 | |
JP3805734B2 (ja) | 離散コサイン変換係数の予測方法 | |
US20050265444A1 (en) | Moving image encoding/decoding apparatus and method | |
EP1428393A1 (en) | Method and apparatus for motion vector coding with global motion parameters | |
US6847684B1 (en) | Zero-block encoding | |
JP2000102016A (ja) | 動き補償予測回路 | |
KR100928325B1 (ko) | 영상의 부호화, 복호화 방법 및 장치 | |
US7912124B2 (en) | Motion compensation for fine-grain scalable video | |
JP5101818B2 (ja) | 非標準化ビデオ量子化コーダを使用するビデオ規格に準拠した残差コーディング | |
JP2002526998A (ja) | ブロック動きビデオのコード化及びデコード化 | |
US6266448B1 (en) | Method of and apparatus for compressing and encoding digitized moving picture signals | |
JP4253572B2 (ja) | 画像符号化装置、画像符号化方法および画像符号化プログラム | |
JP2007517438A (ja) | 参照フレームの数を固定する符号化方式で画像の参照ブロックを取得する方法 | |
TW462184B (en) | Block motion video coding and decoding | |
JP2005507620A (ja) | 圧縮 | |
KR0130167B1 (ko) | 동영상 압축 부호화 장치 | |
JP2639324B2 (ja) | 動画像信号の符号化装置・復号化装置 | |
JPH06169453A (ja) | 画像データ符号化および復号化装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060814 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20070416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090508 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090806 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090813 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100316 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100715 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20100803 |