JP2001527352A - Partial decoding of compressed video sequences - Google Patents

Partial decoding of compressed video sequences

Info

Publication number
JP2001527352A
JP2001527352A JP2000526055A JP2000526055A JP2001527352A JP 2001527352 A JP2001527352 A JP 2001527352A JP 2000526055 A JP2000526055 A JP 2000526055A JP 2000526055 A JP2000526055 A JP 2000526055A JP 2001527352 A JP2001527352 A JP 2001527352A
Authority
JP
Japan
Prior art keywords
block
image data
low
transform
compressed video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000526055A
Other languages
Japanese (ja)
Inventor
スチュアート, ジェイ ゴーリン,
チャールズ, マーティン ワイン,
Original Assignee
サーノフ コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サーノフ コーポレイション filed Critical サーノフ コーポレイション
Publication of JP2001527352A publication Critical patent/JP2001527352A/en
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 (例えばDCTなどの)変換を使用して生成された、圧縮ビデオシーケンスは、部分的に復号され(202)、符号化されたビットストリームから低周波数変換係数(例えば、DC係数のみ)を回復する(204)。次に低周波数係数を使用して、画像データのブロックが生成され、画像データのブロックにモーション補正されたフレーム間の加算が施されて(206)、部分的に復号された画像が生成される。部分的に復号された画像は、ビデオ解析のためのヒストグラム分析(208)など、その後の処理に使用できる。本発明は、計算上コストのかかる逆変換操作を行う必要を避けながら、なお充分な結果を得られるものである。 SUMMARY A compressed video sequence, generated using a transform (eg, a DCT), is partially decoded (202) and converted to low-frequency transform coefficients (eg, a DCT) from an encoded bitstream. Coefficient only) is recovered (204). A block of image data is then generated using the low frequency coefficients, and the block of image data is subjected to motion compensated frame addition (206) to generate a partially decoded image. . The partially decoded image can be used for further processing, such as histogram analysis (208) for video analysis. The present invention still achieves satisfactory results while avoiding the need to perform computationally expensive inverse transformation operations.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】 (発明の分野) 本発明は、ビデオ処理に関し、より詳細には圧縮されたビデオシーケンスの復
号に関する。
[0001] The present invention relates to video processing, and more particularly to decoding of compressed video sequences.

【0002】 (関連出願の相互参照) 本出願は、米国仮出願番号第60/068,774号(1997年12月23日出願)の出願日 の優先権の利益を主張するものである。[0002] This application claims the benefit of filing date priority of US Provisional Application No. 60 / 068,774, filed December 23, 1997.

【0003】 (連邦政府援助による研究開発に関する記述) アメリカ合衆国政府は、政府契約番号MDA-904-95-C-3126号に従い、本発明の 少なくとも一部に一定の権利を有する。STATEMENT REGARDING FEDERALLY SPONSORED RESEARCH AND DEVELOPMENT The United States Government has certain rights, at least in part, in the present invention in accordance with Government Contract No. MDA-904-95-C-3126.

【0004】 (関連技術の説明) デジタルビデオシーケンスにおけるビデオ画像(即ちフレーム)は通常画像素
子、即ち画素の配列によって表され、各画素は1つ以上の異なる要素によって表
される。例えば、モノクロ濃度階調画像では、各画素は画素の強度に対応した値
を持つ要素によって表される。RGBカラーフォーマットでは、各画素は赤の要
素(R)、緑の要素(G)、及び青の要素(B)によって表される。同様にYU
Vカラーフォーマットでは、各画素は強度(又は輝度)要素Y、及び2つの色(
又は色光度)要素U、Vによって表される。これらカラーフォーマットの24ビ
ット版では、各画素要素は8ビット値で表される。
2. Description of the Related Art A video image (or frame) in a digital video sequence is usually represented by an array of picture elements, or pixels, where each pixel is represented by one or more different elements. For example, in a monochrome density gradation image, each pixel is represented by an element having a value corresponding to the intensity of the pixel. In the RGB color format, each pixel is represented by a red component (R), a green component (G), and a blue component (B). Similarly YU
In the V color format, each pixel has an intensity (or luminance) component Y and two colors (
Or luminous intensity) elements U, V. In the 24-bit versions of these color formats, each pixel element is represented by an 8-bit value.

【0005】 典型的なビデオシーケンスは、ショットと呼ばれる一連の連続したフレームか
らなっており、ある1つのショットのフレームは同じ基本シーンに対応している
。1つのショットは、1つのカメラから得られた切れ目のないフレームの連続で
ある。現在、デジタルビデオをその構成ショットに解析することに、非常に高い
関心が寄せられている。ビデオ素材が更に入手しやすくなり、ビデオデータベー
スのインデックス作成の必要性が急速に高まっていることが、ビデオ解析への関
心の高さに拍車をかけている。ビデオ解析はまた、ビデオの編集や圧縮にも有用
である。
[0005] A typical video sequence consists of a series of consecutive frames called shots, where the frames of one shot correspond to the same basic scene. One shot is a continuous sequence of frames from one camera. At present, there is a great interest in analyzing digital video into its constituent shots. The growing availability of video material and the rapidly increasing need for indexing video databases has fueled interest in video analytics. Video analysis is also useful for video editing and compression.

【0006】 デジタルビデオシーケンス中の異なるショットを識別する1つの方法として、
ビデオフレームに対応するヒストグラムの分析がある。フレームヒストグラムと
は、ビデオデータの1つのフレームに対する、要素値の配分を表したものである
。例えば32binヒストグラムは、24ビットYUVカラーフォーマットで表
されたビデオフレームの、8ビットY要素に対して生成される。ここで最初のb
inは、フレーム中何個の画素が0〜7のY値を持つかを示し、2番目のbin
は何個の画素が8〜15のY値を持つかを示す。以下同様に、最後の32番目の
binは、何個の画素が248〜255のY値を持つかを示す。
One way to identify different shots in a digital video sequence is to
There is an analysis of the histogram corresponding to the video frame. The frame histogram represents the distribution of element values for one frame of video data. For example, a 32 bin histogram is generated for an 8-bit Y component of a video frame represented in a 24-bit YUV color format. Here the first b
in indicates how many pixels in the frame have a Y value of 0 to 7, and the second bin
Indicates how many pixels have a Y value between 8 and 15. Similarly, the last 32nd bin indicates how many pixels have Y values of 248 to 255.

【0007】 多次元ヒストグラムも、異なる要素からのビットの組み合わせに基づき生成可
能である。例えば、3次元(3D)ヒストグラムは、YUVデータに対してY要
素の最も重要な4ビット(MSBs)と、U要素及びV要素の3つのMSBsを
用いて生成することができる。このとき3Dヒストグラム中の各binは、Yの
同じ4MBSs、Uの同じ3MSBs、及びVの同じ3MSBsを持つフレーム
の中の画素数に対応する。
[0007] Multidimensional histograms can also be generated based on combinations of bits from different elements. For example, a three-dimensional (3D) histogram can be generated for the YUV data using the four most significant bits (MSBs) of the Y component and the three MSBs of the U and V components. At this time, each bin in the 3D histogram corresponds to the number of pixels in a frame having the same 4 MBSs of Y, the same 3 MSBs of U, and the same 3 MSBs of V.

【0008】 ビデオシーケンスの一般的な特徴の1つとして、ある種のヒストグラムでは、
与えられたショット内のフレームに対するヒストグラム同士は、それとは異なる
場面に対応するショット内のフレームに対するヒストグラムよりも、通常、より
類似している。従って、デジタルビデオをその構成ショットに解析する1つの方
法は、ビデオシーケンス内のフレームに対して生成されたヒストグラムを比較す
ることにより、ショット間の転位を探すことである。一般に、類似するヒストグ
ラムを持つフレームは、異なるヒストグラムを持つフレームよりも、同じ場面に
対応している可能性がより高い。
[0008] One of the general features of video sequences is that in certain histograms,
The histograms for frames in a given shot are usually more similar than the histograms for frames in shots corresponding to different scenes. Thus, one way to analyze digital video into its constituent shots is to look for dislocations between shots by comparing the histograms generated for the frames in the video sequence. In general, frames with similar histograms are more likely to correspond to the same scene than frames with different histograms.

【0009】 ビデオシーケンスは通常、圧縮デジタル形式にて格納、及び/又は伝送される
。圧縮デジタル形式では、オリジナル画素データはビデオフレーム内、及びビデ
オフレーム間の両方に発生する冗長量を利用するよう処理される。ビデオデータ
圧縮には、周知のアルゴリズムが多数ある。これらアルゴリズムの中には、離散
的コサイン変換(DCT)などの変換を採用したものがあり、これによって画素
強度データが空間周波数領域の変換係数に変換される。DCT変換は画素値に直
接適用するか、或いは、モーション推定を採用する場合には、現在のフレーム中
の画素データと参照フレームからモーション補正された画素データとの間の差分
に対応する、フレーム間の画素の差分に対して適用する。フレーム間の差分演算
は、モーション推定及びモーション補正と共に行うか、或いはこれらを伴わずに
実施する。適切な画素データにDCT変換を適用後、その結果生じたDCT係数
は量子化され、その後、例えばジグザグRLパターンなどを使用してランレング
ス(RL)符号化される。RL符号化されたデータは、次に任意で、圧縮ビデオ
データストリームとして格納、及び/又は伝送するために更に符号化される。モ
ーション推定中に導き出され、モーション補正されたフレーム間での差分演算に
使用されるモーションベクトルもまた、圧縮ビデオデータストリームに符号化さ
れる。RGBデータやYUVデータなど多重要素のビデオデータに対しては、各
ビデオフレームに対する異なる画素要素値の平面は、通常別々に圧縮される。
[0009] Video sequences are typically stored and / or transmitted in compressed digital form. In compressed digital form, the original pixel data is processed to take advantage of the amount of redundancy that occurs both within and between video frames. There are many well-known algorithms for video data compression. Some of these algorithms employ a transform such as discrete cosine transform (DCT), which converts the pixel intensity data into transform coefficients in the spatial frequency domain. The DCT transform is applied directly to the pixel values or, if motion estimation is employed, the inter-frame corresponding to the difference between the pixel data in the current frame and the pixel data motion compensated from the reference frame. Apply to the pixel difference. The difference calculation between frames is performed together with or without motion estimation and motion correction. After applying the DCT transform to the appropriate pixel data, the resulting DCT coefficients are quantized and then run-length (RL) coded using, for example, a zigzag RL pattern. The RL encoded data is then optionally further encoded for storage and / or transmission as a compressed video data stream. The motion vectors derived during the motion estimation and used in the difference operation between the motion compensated frames are also encoded into the compressed video data stream. For multi-element video data such as RGB or YUV data, the planes of different pixel element values for each video frame are usually compressed separately.

【0010】 ビデオシーケンスを圧縮ビデオストリームから回復するときには、符号化工程
を逆行することで表示できる完全なビデオ画像に復元する。例えば、上述の圧縮
アルゴリズムでは、圧縮データは必要に応じRL復号され非量子化されて、符号
化されていないDCT係数を回復する。次に、復号されたDCT係数に対して逆
DCT変換が適用され、画素データが回復される。画素データがフレーム間の差
分に対応する場合、モーション補正されたフレーム間で、(圧縮ビデオストリー
ムから復号された)モーションベクトルを用いた加算が行われる。その結果、復
号されたビデオシーケンスの現在のフレームに対する、復号された画素強度値が
生成される。
When recovering a video sequence from a compressed video stream, the encoding process is reversed to restore a complete video image that can be displayed. For example, in the above-described compression algorithm, the compressed data is RL-decoded and dequantized as needed to recover uncoded DCT coefficients. Next, an inverse DCT transform is applied to the decoded DCT coefficients to recover pixel data. If the pixel data corresponds to the difference between the frames, an addition using the motion vector (decoded from the compressed video stream) is performed between the motion-compensated frames. As a result, a decoded pixel intensity value is generated for the current frame of the decoded video sequence.

【0011】 圧縮ビデオシーケンスをその構成ショットに解析する1つの方法は、圧縮ビデ
オストリームを完全に復元して復号されたビデオフレームを完全に回復させ、そ
の後で、復元されたビデオシーケンスにヒストグラム分析を適用することである
。この方法は計算上コストがかかり、処理速度が遅い。例えば逆DCT変換など
の計算に、極めて時間がかかるのがその理由である。
One method of analyzing a compressed video sequence into its constituent shots is to completely restore the compressed video stream to fully recover the decoded video frames, and then perform a histogram analysis on the restored video sequence. Is to apply. This method is computationally expensive and slow. For example, the reason for this is that it takes an extremely long time to perform calculations such as inverse DCT.

【0012】 DCT変換などの、変換に基づく圧縮アルゴリズムを用いて生成された圧縮ビ
デオシーケンスを解析する別の手法として、低解像度復号方式に基づくものがあ
る。この低解像度復号方式では、圧縮ビデオストリームにおける最低空間周波数
DCT係数(即ち、DCT変換のDC係数)を除く、すべてのDCT係数が無視
され、DC係数のみを用いて、圧縮ビデオストリームの各フレームに対する低解
像度復号画像を生成する。ここで、低解像度復号画像の各画素は、オリジナルビ
デオシーケンスの対応するフレームにおける、画素ブロックに対するDC係数で
ある。その後で、低解像度画像に対してヒストグラム分析が行われる。
Another technique for analyzing a compressed video sequence generated using a compression algorithm based on a transform, such as a DCT transform, is based on a low resolution decoding scheme. In this low-resolution decoding scheme, all DCT coefficients except for the lowest spatial frequency DCT coefficient in the compressed video stream (that is, the DC coefficient of DCT transform) are ignored, and only the DC coefficient is used for each frame of the compressed video stream. Generate a low-resolution decoded image. Here, each pixel of the low-resolution decoded image is a DC coefficient for a pixel block in a corresponding frame of the original video sequence. Thereafter, a histogram analysis is performed on the low resolution image.

【0013】 図1(A)及び図1(B)はそれぞれ、オリジナルビデオシーケンスにおける
オリジナルフレーム102と、対応する低解像度復号ビデオシーケンスにおける
低解像度フレーム104を示す。オリジナルフレーム102は480行、512
列の画素を持っている。1つの有り得る圧縮アルゴリズムによれば、オリジナル
フレーム102は(8×8)の画素ブロックに分割され、オリジナルフレーム1
02は60行、64列の(8×8)ブロックを持っている。各(8×8)ブロッ
クに対してモーション推定が行われ、モーションベクトルが特定される。モーシ
ョンベクトルは、各(8×8)ブロックを、参照フレーム(図示しない)の対応
する(8×8)ブロックに関連付ける。モーション補正されたフレーム間の差分
演算が適用され、オリジナルフレーム102の各(8×8)ブロックに対して、
(8×8)のフレーム間の画素差分ブロックを生成する。(8×8)DCT変換
が各(8×8)フレーム間画素差分ブロックに適用され、DCT係数の(8×8
)ブロックが生成する。ここで、DC係数は通常左上の隅に位置する。DCT係
数の各(8×8)ブロックは、圧縮ビデオストリームとして格納及び/又は伝送
されるため、次にモーションベクトルと共に量子化、ランレングス符号化され、
或いは更に符号化される。
FIGS. 1A and 1B show an original frame 102 in an original video sequence and a low-resolution frame 104 in a corresponding low-resolution decoded video sequence, respectively. Original frame 102 has 480 rows and 512 rows
Has columns of pixels. According to one possible compression algorithm, the original frame 102 is divided into (8 × 8) pixel blocks and the original frame 1
02 has an (8 × 8) block of 60 rows and 64 columns. Motion estimation is performed for each (8 × 8) block, and a motion vector is specified. The motion vector associates each (8 × 8) block with a corresponding (8 × 8) block in a reference frame (not shown). A difference operation between the motion-compensated frames is applied, and for each (8 × 8) block of the original frame 102,
A pixel difference block between (8 × 8) frames is generated. An (8 × 8) DCT transform is applied to each (8 × 8) inter-frame pixel difference block and the DCT coefficients (8 × 8
) Block generated. Here, the DC coefficient is usually located in the upper left corner. Since each (8 × 8) block of DCT coefficients is stored and / or transmitted as a compressed video stream, it is then quantized, run-length coded with motion vectors,
Alternatively, it is further encoded.

【0014】 低解像度復号方式によれば、圧縮ビデオストリームを解析するために(例えば
、ショット間の転位を特定するために)、圧縮ビデオデータにランレングス復号
が適用され、量子化DCT係数を回復する。適切であれば、各DCT係数の組か
ら量子化されたDC係数を非量子化し、モーション補正されたフレーム間で、復
号されたDC係数に対して加算を行って(因子8で適切に縮尺した復号されたモ
ーションベクトルを用いて)、図1の低解像度フレーム104を生成する。ここ
で、低解像度フレーム104の各画素は、復元されたDC係数のみに対応してい
る。従って、オリジナルフレーム102における各(8×8)ブロックは低解像
度フレーム104の単一画素によって表され、従って低解像度フレーム104は
、60(即ち480/8)行、64(即ち512/8)列の画素のみを有してい
る。DCT変換のDC係数は、対応する(8×8)画素ブロック中の64画素の
平均強度値と等しいため、低解像度フレーム104は、オリジナルフレーム10
2の低解像度の近似値である。
According to the low resolution decoding scheme, run-length decoding is applied to the compressed video data to analyze the compressed video stream (eg, to identify transitions between shots) to recover the quantized DCT coefficients. I do. If appropriate, the quantized DC coefficients from each set of DCT coefficients are dequantized and added between the motion compensated frames to the decoded DC coefficients (appropriately scaled by a factor of 8). Using the decoded motion vectors), generate the low resolution frame 104 of FIG. Here, each pixel of the low-resolution frame 104 corresponds to only the restored DC coefficient. Thus, each (8 × 8) block in the original frame 102 is represented by a single pixel in the low resolution frame 104, so that the low resolution frame 104 has 60 (ie, 480/8) rows and 64 (ie, 512/8) columns. Of pixels. Since the DC coefficient of the DCT transform is equal to the average intensity value of 64 pixels in the corresponding (8 × 8) pixel block, the low-resolution frame 104
2 is a low resolution approximation.

【0015】 次に、一連の低解像度フレームにヒストグラム分析が適用され、圧縮ビデオシ
ーケンスがその構成ショットに解析される。この低解像度復号方式は、計算コス
トのかかる逆DCT処理を避けているため、逆DCT処理を用いて生成する完全
に復号された画像に対してヒストグラム分析を適用する場合よりも、圧縮ビデオ
シーケンスの解析がより速く、安価に達成される。残念ながら、この従来の低解
像度復号方式を用いて復号されたフレームの解像度は非常に低く、正確な解析結
果を得られずに、ポジの誤り(即ち、オリジナルビデオシーケンスに本当はない
ショット間の転位を特定する)、及び/又はネガの誤り(即ち、オリジナルビデ
オシーケンスにある本当の転位を見逃す)を非常に多く導いている。
Next, histogram analysis is applied to the series of low resolution frames, and the compressed video sequence is analyzed into its constituent shots. This low-resolution decoding scheme avoids the computationally expensive inverse DCT processing, and thus reduces the complexity of the compressed video sequence compared to applying histogram analysis to the fully decoded image generated using the inverse DCT processing. Analysis is faster and cheaper. Unfortunately, the resolution of frames decoded using this conventional low resolution decoding scheme is very low, and without accurate analysis results, a positive error (i.e., a shift between shots that is not true in the original video sequence). And / or negative errors (i.e. miss the true dislocations in the original video sequence).

【0016】 (発明の概要) 本発明は、ビデオ解析などの応用のために、圧縮されたビデオストリームを部
分的に復号する方式に向けられたものである。1つの実施形態によれば、圧縮ビ
デオストリームは復号され、オリジナル各画像データブロックに対して、1つ以
上の低周波数変換係数を回復する。低周波数画像データのブロックは、オリジナ
ル各画像データブロックに対応する低周波数変換係数の各組から生成される。モ
ーション補正されたフレーム間の差分演算が、低周波数画像データの各ブロック
に適用され、圧縮ビデオストリームの各フレームに対し部分的に復号された画像
が生成される。
SUMMARY OF THE INVENTION The present invention is directed to a scheme for partially decoding a compressed video stream for applications such as video analysis. According to one embodiment, the compressed video stream is decoded to recover one or more low frequency transform coefficients for each original image data block. A block of low frequency image data is generated from each set of low frequency transform coefficients corresponding to each original image data block. A difference operation between the motion compensated frames is applied to each block of the low frequency image data to generate a partially decoded image for each frame of the compressed video stream.

【0017】 (詳細な説明) 本発明の実施形態によれば、変換をベースとした圧縮ビデオストリームを部分
的に復号して部分的に復号された画像を生成し、その後、部分的に復号された画
像に、ビデオ解析のためのヒストグラム分析など、次の処理を与える。部分的に
復号された画像は、圧縮ビデオストリームから得られた、復号されたDC変換係
数のみを用いてブロックを形成することにより生成される。
DETAILED DESCRIPTION According to embodiments of the present invention, a partially decoded image is generated by partially decoding a transform-based compressed video stream, and then partially decoded. The following processing is applied to the resulting image, such as histogram analysis for video analysis. Partially decoded images are generated by forming blocks using only the decoded DC transform coefficients obtained from the compressed video stream.

【0018】 図2は、本発明の1つの実施形態による処理の流れ図を示す。圧縮されたビデ
オストリームは部分的に復号され、符号化された変換係数のDC係数が回復され
る(図2のステップ202)。例えば、圧縮されたビデオストリームが(8×8
)DCT変換を用いて符号化されている場合、ステップ202における圧縮ビデ
オストリームの復号(例えばRL復号や、或いは非量子化)は、オリジナルビデ
オシーケンス中の各(8×8)画素ブロックに対応する復号DC DCT係数を
、ビットストリームから回復するのに充分なだけの、圧縮ビデオストリームの復
号を意味している。
FIG. 2 shows a flowchart of a process according to one embodiment of the present invention. The compressed video stream is partially decoded to recover the DC coefficients of the encoded transform coefficients (step 202 in FIG. 2). For example, if the compressed video stream is (8 × 8
3.) If encoded using a DCT transform, the decoding (eg, RL decoding or unquantization) of the compressed video stream in step 202 corresponds to each (8 × 8) pixel block in the original video sequence. Decoding DC means decoding the compressed video stream only enough to recover the DCT coefficients from the bit stream.

【0019】 画像データのブロックは、その後DC係数のみを用いて、ブロックの各画素に
対して対応するDC係数を複製することによって生成される(ステップ204)
。1つの実施形態では各ブロックはサブブロックであり、サブブロックは変換係
数を生成するために使用するオリジナルビデオシーケンスの対応領域よりも小さ
い。例えば、DCT変換がオリジナルビデオシーケンスの(8×8)ブロックに
適用された場合、ステップ204で生成されるサブブロックは(2×2)或いは
(4×4)となる(ただし、その他のサイズも使用可能)。或いは、複製された
DC係数のブロックが、変換と同じサイズ(例えば8×8)を取ることも可能で
ある。
A block of image data is then generated by duplicating the corresponding DC coefficient for each pixel of the block, using only DC coefficients (step 204).
. In one embodiment, each block is a sub-block, where the sub-block is smaller than the corresponding area of the original video sequence used to generate the transform coefficients. For example, if the DCT transform is applied to (8 × 8) blocks of the original video sequence, the sub-block generated in step 204 will be (2 × 2) or (4 × 4) (although other sizes may be used). Available). Alternatively, the block of duplicated DC coefficients can take the same size (eg, 8 × 8) as the transform.

【0020】 適切であれば、モーション補正されたフレーム間の加算がその後行われ、部分
的に復号された画像が生成される(ステップ206)。その後、部分的に復号さ
れた画像に、ビデオ解析のためのヒストグラム分析など追加の処理が与えられる
(ステップ208)。複製DC係数のブロックがオリジナル変換サイズよりも小
さい場合、モーション補正されたフレーム間の加算で使用される、復号されたモ
ーションベクトルには、それに応じた倍率をかけなくてはならない。(4×4)
又は(2×2)サブブロックを用いる1つの利点は、除算を行うことなく単純に
ビットをずらすことによって、モーションベクトルをそれぞれ2或いは4の因子
で縮尺できる点にある。
If appropriate, the addition between the motion compensated frames is then performed to produce a partially decoded image (step 206). Thereafter, the partially decoded image is subjected to additional processing such as histogram analysis for video analysis (step 208). If the block of duplicate DC coefficients is smaller than the original transform size, the decoded motion vectors used in the addition between motion compensated frames must be scaled accordingly. (4x4)
One advantage of using (2 × 2) sub-blocks is that motion vectors can be scaled by a factor of 2 or 4, respectively, by simply shifting bits without performing division.

【0021】 図3(A)及び図3(B)は、図2の処理の実施による、オリジナルビデオシ
ーケンス中のオリジナルフレーム302と、対応する部分的に復号されたビデオ
シーケンスの部分的に復号されたフレーム304を、それぞれ示す。オリジナル
フレーム302は、図1(A)のフレーム102同様、(480×512)のフ
レームである。部分的に復号された画像304は、複製されたDC係数の(4×
4)ブロックから生成され、従って240行、256列の画素を持っている。
FIGS. 3A and 3B illustrate an original frame 302 in an original video sequence and a partially decoded version of a corresponding partially decoded video sequence, according to an implementation of the process of FIG. Each of the frames 304 is shown. The original frame 302 is a (480 × 512) frame like the frame 102 in FIG. The partially decoded image 304 has a (4 ×
4) It is generated from a block and therefore has 240 rows and 256 columns of pixels.

【0022】 図3(C)は、図3(B)の部分的に復号された画像304を生成するために
使用する、サブブロックを表す複製されたDC係数の(4×4)ブロック306
を示す。複製されたDC係数のあるサブブロックに対して、各画素は同じ情報を
含んでいるが、適切に縮尺された復号されたモーションベクトルを用いてモーシ
ョン補正されたフレーム間での加算が行われる場合、その結果の、部分的に復号
された画像における対応するサブブロックは、通常同じデータの複製を含んでい
ない。これは、ほとんどのモーションベクトルが、4の整数倍以外の要素を持つ
からである。
FIG. 3C shows a (4 × 4) block 306 of duplicated DC coefficients representing sub-blocks used to generate the partially decoded image 304 of FIG. 3B.
Is shown. For a sub-block with duplicated DC coefficients, each pixel contains the same information, but the addition between the motion compensated frames is performed using appropriately scaled decoded motion vectors. , The corresponding sub-blocks in the resulting partially decoded image usually do not contain duplicates of the same data. This is because most motion vectors have elements other than integral multiples of four.

【0023】 本発明者らは、この部分的復号方式によって、従来技術の低解像度復号方式を
行うよりも、圧縮ビデオストリームのビデオ解析がより良く行われる(即ち、ポ
ジ及び/又はネガの誤りが少ない)ことを見出した。いくつかの追加計算の負荷
、例えば、より大きな復号画像に対してモーション補正されたフレーム間の加算
演算などが必要となるが、本発明の部分的復号方式は、従来技術の低解像度復号
方式における逆変換の実施を避ける、という利点を共有している。従って処理の
制限次第で、本発明は計算コストが上がっても手頃な価格にできる点で、より良
い結果を提供することができる。
The present inventors believe that this partial decoding scheme allows for better video analysis of the compressed video stream than does the prior art low resolution decoding scheme (ie, positive and / or negative errors are eliminated). Less). Although some additional computational load is required, such as the addition between motion-compensated frames for larger decoded images, the partial decoding scheme of the present invention is less than the prior art low resolution decoding scheme. They share the advantage of avoiding the inverse transformation. Thus, depending on processing limitations, the present invention can provide better results in that it can be made more affordable even if the computational cost increases.

【0024】 図4(A)〜図4(D)は、4つの異なるDC要素ブロックサイズについてP
x64ビデオ圧縮方式を用いて符号化された1500フレームの試験用シーケン
スに関して、フレーム間のヒストグラムの差異をフレーム数に対してプロットし
、グラフ表現で表したものである(Y軸のスケールは任意)。図4(A)は、従
来技術の処理に対応するものであり、低解像度画像の単一のDC値(即ち、(1
×1)ブロック)によって各(8×8)画素ブロックが表されている。図4(B
)は、本発明による処理に対応しており、部分的に復号された画像における複製
されたDC値の(2×2)ブロックによって、各(8×8)画素ブロックが表さ
れている。同様に、図4(C)及び図4(D)は本発明による処理に対応してお
り、部分的に復号された画像における複製されたDC値の、それぞれ(4×4)
ブロック、及び(8×8)ブロックによって、各(8×8)画素ブロックが表さ
れている。これらの図における高いピークは、ビデオシーケンスでの場面変化を
示している。
FIGS. 4A to 4D show P for four different DC element block sizes.
For a test sequence of 1500 frames encoded using the x64 video compression scheme, the histogram differences between the frames are plotted against the number of frames and represented in a graphical representation (Y-axis scale is arbitrary). . FIG. 4A corresponds to the processing of the prior art, where a single DC value (ie, (1)
Each (8 × 8) pixel block is represented by (× 1) block). FIG. 4 (B
) Corresponds to the process according to the invention, wherein each (8 × 8) pixel block is represented by a (2 × 2) block of duplicated DC values in a partially decoded image. Similarly, FIGS. 4 (C) and 4 (D) correspond to the process according to the invention, in which (4 × 4) of the duplicated DC values in the partially decoded image, respectively.
Each (8 × 8) pixel block is represented by a block and an (8 × 8) block. High peaks in these figures indicate scene changes in the video sequence.

【0025】 図4(A)〜図4(D)では、複製されたDC値のブロックが(1×1)から
(8×8)に増えるにつれて、結果としてバックグラウンドのノイズレベルが減
少することが示されている。このことは、従来技術である図4(A)の低解像度
方式に勝る、本発明の利点の1つである。
FIGS. 4A-4D show that as the number of blocks of duplicated DC values increases from (1 × 1) to (8 × 8), the background noise level decreases as a result. It is shown. This is one of the advantages of the present invention over the conventional low-resolution system shown in FIG.

【0026】 本発明を2次元(8×8)DCT変換の状況下について説明してきたが、当業
者には、本発明を例えば(8×8)以外のサイズの2次元DCT変換や1次元D
CT変換などその他のDCT変換、或いは1次元や2次オリジナルスラント変換
やハール変換など、その他の変換を同様に用いて実施することが可能であること
が理解されるであろう。同様に本発明を、モーション推定やモーション補正が(
8×8)画素データブロックに対して行われる、という状況について説明してき
たが、モーション分析はその他のサイズのブロックに対しても実施可能であり、
これらその他のサイズは、変換サイズとは異なっていてもよいことが理解される
であろう。例えば一般的なビデオ圧縮方式では、変換が(8×8)DCT変換で
あっても、モーション推定及びモーション補正を(16×16)画素データブロ
ックに対して実行させている。
Although the present invention has been described in the context of a two-dimensional (8 × 8) DCT transform, those skilled in the art will appreciate that the present invention can be applied to two-dimensional DCT transforms of sizes other than (8 × 8) or one-dimensional D
It will be appreciated that other DCT transforms, such as a CT transform, or other transforms, such as a one-dimensional or second-order original Slant transform or a Haar transform, can be used as well. Similarly, the present invention can be applied to motion estimation and motion correction (
Although we have described the situation where it is performed on 8 × 8) pixel data blocks, motion analysis can be performed on blocks of other sizes,
It will be appreciated that these other sizes may be different from the transform size. For example, in a general video compression method, motion estimation and motion correction are performed on a (16 × 16) pixel data block even if the transform is an (8 × 8) DCT transform.

【0027】 更に、本発明をDC変換係数のみを用いて、部分的に復号された画像を生成す
る状況について説明してきたが、当業者には選択的な実施例として、2つ以上の
低周波数変換係数(DC係数を含む)を用いて部分的に復号された画像を生成す
ることも可能であることが理解されるであろう。
Further, while the present invention has been described in terms of generating a partially decoded image using only DC transform coefficients, those skilled in the art will appreciate that, as an alternative, two or more low frequency It will be appreciated that transform coefficients (including DC coefficients) may be used to generate the partially decoded image.

【0028】 同様に、本発明をヒストグラム分析に基づいたビデオ解析を行うという状況で
説明してきたが、当業者には、本発明が、低解像度を受認可能なその他の適用、
例えば画像中画像の生成、ビデオシーケンスの早送り再生、ターゲットの認識、
及びモーション検出などに対しても使用可能であることが理解されよう。
Similarly, while the present invention has been described in the context of performing video analysis based on histogram analysis, those skilled in the art will recognize that the present invention may be used in other applications where low resolution is acceptable,
For example, generation of images in images, fast forward playback of video sequences, target recognition,
It can also be used for motion detection and the like.

【0029】 本発明は、これらの方法を行うための方法、及び装置の形で具体化することが
できる。本発明はまた、フロッピーディスク、CD−ROM、ハードディスクド
ライブ、或いはその他の装置読取可能の記憶媒体など、具体的な媒体に具現化さ
れたプログラムコードの形で具体化することができる。このとき、プログラムコ
ードがコンピュータのような機械にロードされ、機械によって実行される場合、
機械が本発明を行うための装置となる。本発明はまた、プログラムコードの形で
具体化することができ、前記プログラムコードは、例えば機械にロードされ、及
び/又は、機械によって実行されるような記憶媒体に記憶されるか、或いは、例
えば電気配線、ケーブル、光ファイバ、電磁放射線など、なんらかの伝送媒体を
通じて伝送されることが可能である。このとき前記プログラムコードがコンピュ
ータなどの機械にロードされ、それによって実行される場合に、その機械が本発
明を行う装置となる。汎用プロセッサ上で実行される場合、プログラムコードの
セグメントがプロセッサに結合し、特定の論理回路と類似の動作を行う、固有の
デバイスを提供する。
The present invention can be embodied in the form of a method and an apparatus for performing these methods. The present invention can also be embodied in the form of program code embodied in a specific medium, such as a floppy disk, CD-ROM, hard disk drive, or other device-readable storage medium. At this time, if the program code is loaded on a machine such as a computer and executed by the machine,
A machine is an apparatus for performing the present invention. The invention can also be embodied in the form of program code, said program code being loaded on a machine and / or stored on a storage medium as executed by the machine, or It can be transmitted through any transmission medium, such as electrical wiring, cables, optical fibers, electromagnetic radiation, and the like. At this time, when the program code is loaded on a machine such as a computer and executed by the machine, the machine becomes an apparatus for performing the present invention. When executed on a general-purpose processor, the program code segments combine with the processor to provide a unique device that performs similar operations as certain logic circuits.

【0030】 更に、当業者には、本発明の本質を説明するために記述及び例証された詳細、
材料、及び部分の配置については、以下の請求項に表された本発明の原理及び範
囲から逸脱することなく、様々に変更することが可能であることが理解されよう
Further, those skilled in the art will appreciate the details described and illustrated, to illustrate the essence of the invention;
It will be understood that various changes may be made in the materials and arrangement of parts without departing from the principles and scope of the invention as set forth in the following claims.

【図面の簡単な説明】[Brief description of the drawings]

本発明の他の様態、特徴、及び利点は、以下に詳述する説明、添付の請求項、
及び以下の図面からより完全に明らかになろう。
Other aspects, features, and advantages of the invention are set forth in the description which follows, the appended claims,
And will be more fully apparent from the following figures.

【図1】 (A)及び(B)は、オリジナルビデオシーケンスにおけるオリジナルフレー
ムと、対応する低解像度復号ビデオシーケンスにおける低解像度フレームを、そ
れぞれ示す。
1A and 1B show an original frame in an original video sequence and a low-resolution frame in a corresponding low-resolution decoded video sequence, respectively.

【図2】 本発明の1つの実施形態による、処理の流れ図を示す。FIG. 2 illustrates a process flow diagram according to one embodiment of the present invention.

【図3】 (A)及び(B)は、図2の処理による、オリジナルビデオシーケンスにおけ
るオリジナルフレームと、部分的に復号された対応するビデオシーケンスにおけ
る部分的に復号されたフレームを、それぞれ示し、(C)は、図3(B)の部分
的に復号された画像の生成に使用される、サブブロックを表す、複製されたDC
係数の(4×4)ブロックを示す。
FIGS. 3A and 3B show an original frame in an original video sequence and a partially decoded frame in a corresponding partially decoded video sequence, respectively, according to the process of FIG. 2; (C) is a duplicated DC representing a sub-block used to generate the partially decoded image of FIG. 3 (B).
Shows a (4 × 4) block of coefficients.

【図4】 (A)〜(D)は、4つの異なるDC要素ブロックサイズについてPx64ビ
デオ圧縮方式を用いて符号化された、1500フレームの試験用シーケンスに関
して、フレーム間のヒストグラムの差異をフレーム数に対してプロットして表し
たグラフを示す(Y軸のスケールは任意)。
4A-4D show histogram differences between frames for a 1500 frame test sequence encoded using the Px64 video compression scheme for four different DC element block sizes. Is shown (a scale on the Y axis is arbitrary).

───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SZ,UG,ZW),EA(AM ,AZ,BY,KG,KZ,MD,RU,TJ,TM) ,AL,AM,AT,AU,AZ,BA,BB,BG, BR,BY,CA,CH,CN,CU,CZ,DE,D K,EE,ES,FI,GB,GE,GH,GM,HR ,HU,ID,IL,IS,JP,KE,KG,KP, KR,KZ,LC,LK,LR,LS,LT,LU,L V,MD,MG,MK,MN,MW,MX,NO,NZ ,PL,PT,RO,RU,SD,SE,SG,SI, SK,SL,TJ,TM,TR,TT,UA,UG,U Z,VN,YU,ZW Fターム(参考) 5C059 KK01 KK40 MA23 PP04 RF09 SS20 TA76 TB02 TC04 TD10 TD11 ──────────────────────────────────────────────────続 き Continuation of front page (81) Designated country EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE ), OA (BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG), AP (GH, GM, KE, LS, MW, SD, SZ, UG, ZW), EA (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, CU, CZ, DE, DK, EE, ES, FI, GB, GE, GH, GM, HR, HU, ID, IL, IS, JP, KE, KG, KP , KR, KZ, LC, LK, LR, LS, LT, LU, LV, MD, MG, MK, MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, UA, UG, UZ, VN, YU, ZWF terms (reference) 5C059 KK01 KK40 MA23 PP04 RF09 SS20 TA76 TB02 TC04 TD10 TD11

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 (a)圧縮ビデオストリームを復号し、オリジナル画像デー
タの各ブロックに対して1つ以上の低周波数変換係数を回復するステップと、 (b)オリジナル画像データの各ブロックに対応する低周波数変換係数の各組か
ら、低周波数画像データのブロックを生成するステップと、 (c)モーション補正されたフレーム間の差分演算を低周波数画像データの各ブ
ロックに適用するステップであって、圧縮ビデオストリームの各フレームについ
て部分的に復号された画像を生成するステップと、 を備えることを特徴とする変換をベースとした圧縮ビデオストリームを部分的に
復号するための方法。
(A) decoding a compressed video stream to recover one or more low frequency transform coefficients for each block of original image data; and (b) corresponding to each block of original image data. Generating a block of low-frequency image data from each set of low-frequency transform coefficients; and (c) applying a difference operation between motion-compensated frames to each block of low-frequency image data. Generating a partially decoded image for each frame of the video stream. A method for partially decoding a transform-based compressed video stream.
【請求項2】 部分的に復号された画像に対しヒストグラム分析を適用して
、圧縮ビデオストリームを解析するステップを更に備えることを特徴とする請求
項1に記載の発明。
2. The invention of claim 1, further comprising applying a histogram analysis to the partially decoded image to analyze the compressed video stream.
【請求項3】 低周波数画像データの各ブロックが変換サイズよりも小さい
ことを特徴とする請求項1に記載の発明。
3. The invention according to claim 1, wherein each block of the low-frequency image data is smaller than the transform size.
【請求項4】 変換が離散的コサイン変換(DCT)であることを特徴とす
る請求項1に記載の発明。
4. The invention according to claim 1, wherein the transform is a discrete cosine transform (DCT).
【請求項5】 変換が(8×8)DCT変換であり、低周波数画像データの
各ブロックが(2×2)もしくは(4×4)のいずれかであることを特徴とする
請求項4に記載の発明。
5. The method according to claim 4, wherein the transform is an (8 × 8) DCT transform, and each block of the low-frequency image data is either (2 × 2) or (4 × 4). The described invention.
【請求項6】 低周波数画像データの各ブロックが変換のサイズよりも小さ
く、部分的に復号された画像にヒストグラム分析を適用して圧縮ビデオストリー
ムを解析するステップを更に備えることを特徴とする請求項5に記載の発明。
6. The method of claim 1, wherein each block of the low frequency image data is smaller than a size of the transform, and further comprising applying a histogram analysis to the partially decoded image to analyze the compressed video stream. Item 6. The invention according to Item 5.
【請求項7】 ステップ(a)が、圧縮ビデオストリームを復号して、オリ
ジナル画像データの各ブロックについてDC変換係数のみを回復するステップを
備え、 ステップ(b)が、各DC変換係数から低周波数画像データのブロックを生成す
るステップを備えることを特徴とする請求項1に記載の発明。
7. Step (a) comprises decoding the compressed video stream to recover only DC transform coefficients for each block of original image data, and step (b) comprises: The invention of claim 1, further comprising the step of generating a block of image data.
【請求項8】 低周波数画像データの各ブロックが、対応するDC変換係数
を複製することによって生成されることを特徴とする請求項7に記載の発明。
8. The invention of claim 7, wherein each block of low frequency image data is generated by duplicating a corresponding DC transform coefficient.
【請求項9】 (a)圧縮ビデオストリームを復号して、オリジナル画像デ
ータの各ブロックについて1つ以上の低周波数変換係数を回復するための手段と
、 (b)オリジナル画像データの各ブロックに対応する低周波数変換係数の各組か
ら、低周波数画像データのブロックを生成するための手段と、 (c)低周波数画像データの各ブロックに対してモーション補正されたフレーム
間の差分演算を適用する手段であって、圧縮ビデオストリームの各フレームにつ
いて部分的に復号された画像を生成するための手段と、 を備えることを特徴とする、変換をベースとした圧縮ビデオストリームを部分的
に復号する装置。
9. A means for decoding the compressed video stream to recover one or more low frequency transform coefficients for each block of the original image data; and (b) corresponding to each block of the original image data. Means for generating blocks of low-frequency image data from each set of low-frequency transform coefficients to be applied; and (c) means for applying a difference operation between motion-compensated frames to each block of low-frequency image data. Means for generating a partially decoded image for each frame of the compressed video stream, wherein the apparatus partially decodes the transform-based compressed video stream.
【請求項10】 複数の命令が格納されたコンピュータ読取可能媒体であり
、前記複数の命令には、プロセッサによって実行されたときに、変換をベースと
した圧縮ビデオストリームを部分的に復号する方法をプロセッサに実行させる命
令が含まれており、 前記手段は、 (a)圧縮ビデオストリームを復号し、オリジナル画像データの各ブロックにつ
いて1つ以上の低周波数変換係数を回復するステップと、 (b)オリジナル画像データの各ブロックに対応する低周波数変換係数の各組か
ら、低周波数画像データのブロックを生成するステップと、 (c)低周波数画像データの各ブロックに対してモーション補正されたフレーム
間の差分演算を適用するステップであって、圧縮ビデオストリームの各フレーム
について部分的に復号された画像を生成するステップと、 を備えることを特徴とするコンピュータ読取可能媒体。
10. A computer readable medium having stored thereon a plurality of instructions, the instructions comprising, when executed by a processor, a method for partially decoding a conversion-based compressed video stream. Instructions for causing the processor to execute, the means comprising: (a) decoding the compressed video stream and recovering one or more low frequency transform coefficients for each block of the original image data; Generating a block of low-frequency image data from each set of low-frequency transform coefficients corresponding to each block of image data; and (c) a difference between frames whose motion has been corrected for each block of low-frequency image data. Applying an operation, wherein for each frame of the compressed video stream the partially decoded image Computer-readable medium, comprising the steps of: generating a.
JP2000526055A 1997-12-23 1998-12-22 Partial decoding of compressed video sequences Pending JP2001527352A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US6877497P 1997-12-23 1997-12-23
US60/068,774 1997-12-23
US10574698A 1998-06-26 1998-06-26
US09/105,746 1998-06-26
PCT/US1998/027223 WO1999033275A1 (en) 1997-12-23 1998-12-22 Partial decoding of compressed video sequences

Publications (1)

Publication Number Publication Date
JP2001527352A true JP2001527352A (en) 2001-12-25

Family

ID=26749360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000526055A Pending JP2001527352A (en) 1997-12-23 1998-12-22 Partial decoding of compressed video sequences

Country Status (6)

Country Link
EP (1) EP1048174A4 (en)
JP (1) JP2001527352A (en)
KR (1) KR20010033550A (en)
AU (1) AU1937799A (en)
CA (1) CA2310652C (en)
WO (1) WO1999033275A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018085741A (en) * 2010-02-17 2018-05-31 ユニバーシティ−インダストリ コーポレーション グループ オブ キュン ヘ ユニバーシティ Video signal processing

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3593944B2 (en) 2000-03-08 2004-11-24 日本電気株式会社 Image data processing apparatus and motion compensation processing method used therefor
EP1685537B1 (en) * 2003-11-18 2015-04-01 Mobile Imaging in Sweden AB Method for processing a digital image and image representation format
US11025942B2 (en) * 2018-02-08 2021-06-01 Samsung Electronics Co., Ltd. Progressive compressed domain computer vision and deep learning systems

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4920426A (en) * 1986-11-10 1990-04-24 Kokusai Denshin Denwa Co., Ltd. Image coding system coding digital image signals by forming a histogram of a coefficient signal sequence to estimate an amount of information
JP2604371B2 (en) * 1987-04-30 1997-04-30 日本電気株式会社 Orthogonal transform coding device
EP0339589A3 (en) * 1988-04-28 1992-01-02 Sharp Kabushiki Kaisha Orthogonal transform coding system for image data
JPH02226886A (en) * 1989-02-28 1990-09-10 Sony Corp Data transmitter
US5097331A (en) * 1990-08-24 1992-03-17 Bell Communications Research, Inc. Multiple block-size transform video coding using an asymmetric sub-band structure
US5049992A (en) * 1990-08-27 1991-09-17 Zenith Electronics Corporation HDTV system with receivers operable at different levels of resolution
US5189526A (en) * 1990-09-21 1993-02-23 Eastman Kodak Company Method and apparatus for performing image compression using discrete cosine transform
US5150208A (en) * 1990-10-19 1992-09-22 Matsushita Electric Industrial Co., Ltd. Encoding apparatus
US5235420A (en) * 1991-03-22 1993-08-10 Bell Communications Research, Inc. Multilayer universal video coder
US5262854A (en) * 1992-02-21 1993-11-16 Rca Thomson Licensing Corporation Lower resolution HDTV receivers
US5412429A (en) * 1993-03-11 1995-05-02 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Picture data compression coder using subband/transform coding with a Lempel-Ziv-based coder

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018085741A (en) * 2010-02-17 2018-05-31 ユニバーシティ−インダストリ コーポレーション グループ オブ キュン ヘ ユニバーシティ Video signal processing

Also Published As

Publication number Publication date
CA2310652C (en) 2008-07-22
CA2310652A1 (en) 1999-07-01
WO1999033275A1 (en) 1999-07-01
AU1937799A (en) 1999-07-12
KR20010033550A (en) 2001-04-25
EP1048174A4 (en) 2004-04-07
EP1048174A1 (en) 2000-11-02

Similar Documents

Publication Publication Date Title
US6400763B1 (en) Compression system which re-uses prior motion vectors
EP1389016B1 (en) Improved motion estimation and block matching pattern
US6360024B1 (en) Method and apparatus for removing noise in still and moving pictures
US6058210A (en) Using encoding cost data for segmentation of compressed image sequences
EP1407611B1 (en) Track for improved video compression
JPH06205386A (en) Picture reproduction device
US6643410B1 (en) Method of determining the extent of blocking artifacts in a digital image
JP3791003B2 (en) Image processing apparatus and method, recording medium, and program
JPH08251422A (en) Block distortion correction device and image signal expander
JPH05227525A (en) Picture encoder
US20120093227A1 (en) Data compression method and data compression device
US20110129012A1 (en) Video Data Compression
JP2001527352A (en) Partial decoding of compressed video sequences
JP2919986B2 (en) Image signal decoding device
JP2003204436A (en) Image coding equipment and program thereof
JP3081658B2 (en) Image signal encoding device and image signal decoding device
JP2643636B2 (en) Signal processing method
JP3063380B2 (en) High efficiency coding device
JP2809552B2 (en) Image encoding method and image decoding method
JPH09307897A (en) Image data compression processing method
JPH0244883A (en) Moving picture transmission system
Coria et al. Using temporal correlation for fast and highdetailed video tone mapping
JPH11136674A (en) Image coding method and storage medium
JPH08186842A (en) Noise reducing device for image data and method therefor
WO2016047250A1 (en) Signal processing apparatus, imaging apparatus and signal processing method