JP2005516495A - 既圧縮マルチメディアのビットレートの低減 - Google Patents

既圧縮マルチメディアのビットレートの低減 Download PDF

Info

Publication number
JP2005516495A
JP2005516495A JP2003563223A JP2003563223A JP2005516495A JP 2005516495 A JP2005516495 A JP 2005516495A JP 2003563223 A JP2003563223 A JP 2003563223A JP 2003563223 A JP2003563223 A JP 2003563223A JP 2005516495 A JP2005516495 A JP 2005516495A
Authority
JP
Japan
Prior art keywords
run
level
compressed
discarded
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003563223A
Other languages
English (en)
Other versions
JP2005516495A5 (ja
Inventor
ゲリット シー ランゲラール
ヨセフス エイ ペイネンブルグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005516495A publication Critical patent/JP2005516495A/ja
Publication of JP2005516495A5 publication Critical patent/JP2005516495A5/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための方法において、ビットレートが幾らかの可変長コード(VLC)をランダムに破棄することにより低減される。破棄されたVLCは、その後のVLCとマージされてビットレートを低減させる。

Description

本発明は、メディアストリームの形態の既圧縮マルチメディアデータ(already compressed multimedia data)の信号を後処理するための方法に関する。本発明はまた、対応する装置、コンピュータ可読媒体、デジタル情報信号及び方法の使用にも関する。ここで使われているように、“マルチメディア”という用語は、データパケットのストリームの形態で典型的には配信される、ビデオや音声等の如何なる形式のメディアがあり得る。
JPEG、MPEG、H.320等のメディアビットストリームの個別ブロックを処理するための幾つかの圧縮方法がある。以下、MPEGの変形例であるMPEG−2をどのように圧縮をなすことができるかを説明するために簡単にさらに述べる。MPEG−2規格に関する追加の情報は、本発明を理解するために必須ではないが、例えば、ISO/IEC Copyright Office Case postal 56, CH 1211, Geneva 20, Switzerlandから入手可能なMPEG−2規格書 ISO/IEC 13818-1, 2, 3に見られる。ここで、“メディアビットストリーム”は、典型的にはビデオ又は音声メディアのビットストリームである。
MPEG−2ビデオビットストリームは、階層化構造を持つ。各層は、一つ以上の副層を有する。例えば、ビデオシーケンスは、表示順に連続するビデオフレームの組を表す多数のピクチャグループ、いわゆる“GOP(group of picture)”に分割され得る。その副層において、フレームは“スライス”及び“マクロブロック”に分けられ、さらに、ブロックの更に別の副層に分けられ得る。
三つのタイプのフレームがMPEGの処理で用いられる。すなわち、他のフレームへの如何なる参照なしに符号化されるイントラフレーム(intra frames(Iフレーム))、過去のIフレーム又はPフレームへの参照をもって符号化される予測フレーム(predicted
frames(Pフレーム))、及び過去及び将来両方のフレームへの参照をもって符号化される双方向補間フレーム(bi-directionally
interpolated frames(Bフレーム))である。符号化されたGOPは、ビデオストリームのランダムアクセスのためのアクセスポイントを提供するために常にIフレームで始まる。
MPEG−2は、ピクチャ全体が8×8の画素ブロックに細分され、これらブロックが典型的には離散コサイン変換(DCT)により処理され、単独で元のピクチャを表す係数の圧縮された組に量子化されるようにIフレームが“イントラ”符号化されることを規定する。MPEG−2規格書はまた、Pフレームに対して、DCTにより全てのブロックを符号化するのではなく、いわゆる“動き補償”を用いて、殆どのビデオデータに見られる時間的冗長性(temporal redundancy)を利用することを許容する。動き補償は、GOP内で、フレーム間の時間的冗長性が、予測を適用して差分信号、いわゆる予測誤差を得ることにより低減され、これがさらに空間的相関性(spatial
correlation)を除去するためにDCTを用いて圧縮されるように作用する。その後、結果のDCT係数が量子化される。最後に、動きベクトルがDCT情報と組み合わされ、可変長符号によりビデオデータを表すために可変長符号化(VLC)を用いて符号化される。
動き補償を用いることにより、MPEG−2は、画像を大幅に低減させることなく必要とされるデータ記憶容量及び関連するビットレートを劇的に低減させる。しかしながら、既圧縮メディアストリームの追加のビットレートの低減が、例えばデジタルレコーディング及びデジタルネットワークの分野におけるアプリケーションのためにしばしば必要とされる。
一例として、時としてデジタルレコーダは、例えばビデオ編集において二つのビデオの断片(video fragments)間のつなぎ(transition)を作成するためにビットレートを局所的に増加させる何等かの処理を施さなければならない。ビットレートを一定に保つことを可能にするため、これらレコーダは、それ故、例えば±10%により既圧縮メディアストリームのビットレートを調整することが可能な微調整ビットレート制御機構を必要とする。
欧州特許出願公開第EP-A2-0 599 257号は、ビットレートの低減を提供する、ビデオ信号を記録又は送信するために用いられるビデオ信号記録装置及び方法を開示する。しかしながら、本文献は、再生エラーが頻繁に起こる装置に適したビデオ信号記録装置及び方法を述べていて、それ故に、該文献は、どのようにして斯かる欠陥(defects)の効果を低減させるかを述べている。
重要なことは、開示されている装置及び方法は、どのようにして既圧縮ストリームに適用可能な複雑さの低いビットレート制御方法によりビットレートを低減させるかを述べていないことである。
本発明の目的は、低減されたビットレートを得るために元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている既圧縮マルチメディアストリームを後処理するための方法及び装置を提供することにある。ここで、“画素”という用語は、像内で最小の識別可能な及び分解可能な領域を含む(がこれに限定されるものではない)如何なる空間解像度の要素(spatial resolution element)も意味する。
本発明の一態様によれば、前記目的は、符号化変換係数の選択された組を破棄する方法において実現される。ここで、“変換係数”は、意味又は値を大幅に変えることなく情報の構造又は組成を変える係数である。
本発明の好ましい実施例によれば、元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための方法であって、
− 前記ビットストリームを表す情報信号であって、符号化変換係数を有する該信号を設けるステップ、及び
− 前記符号化変換係数の選択された組を破棄することにより前記信号のビットレートを低減させるステップを含む方法が提供される。
有利なことは、本発明が直接圧縮メディアストリームに対して演算し、高価なドリフト補償技術がアーチファクト、典型的には可視アーチファクトを回避するために必要とされないことである。
好ましくは、前記符号化変換係数の選択された組を破棄するステップが、
− (-1,
+1)のランダム符号を持つ変換係数を表すランダムパターンを設けるステップ、
− ラン−レベル対に前記ビットストリームを解析し部分的に復号するステップ、
− (-1,
1)に等しいレベルを持つ候補のラン−レベル対を選択するステップであって、ランはある係数に先行するゼロの数に等しく、レベルは該係数の値に等しいステップ、
− 対応するランダム符号を決定するステップ、
− 候補及びバッファのレベルの合計がゼロに等しい場合該候補を破棄する(discard)ステップ、
− 破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、新しいラン−レベル対を形成するステップ、及び
− 上記新しいラン−レベル対に対する新しいコードを生成し、新しい情報信号を得るステップを含む。
本発明のある好ましい実施例の第1の態様においては、最下位の係数(least significant coefficients)が破棄される。
本発明のある好ましい実施例の第2の態様においては、3以下の組が破棄される。
本発明のある実施例の第3の態様においては、破棄される組が目標品質に応じて変換ブロック内のインデックスにより決定される。
本発明のある好ましい実施例の第4の態様においては、破棄される組がより低いインデックスを持つことにより決定される。
更に、本発明の好ましい実施例によれば、一つ以上のプロセッサに、元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための方法であって、
− 前記ビットストリームを表す情報信号であって、符号化変換係数を有する該信号を設けるステップ、及び
− 前記符号化変換係数の選択された組を破棄することにより前記信号のビットレートを低減させるステップを含む方法を実行させるためのプログラム命令を備えるコンピュータ可読媒体が提供される。
更に、本発明の好ましい実施例によれば、元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのデジタル情報信号であって、符号化変換係数の低減された組を備えることにより低減されたビットレートを持つデジタル情報信号が提供される。ここで、“信号”という用語は、情報のコンベヤー、典型的にはあるポイントから別のポイントへ情報を運ぶ(convey)事象的又は電気的な量を意味する。
更に、本発明の好ましい実施例によれば、元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための装置であって、
− (-1,
+1)のランダム符号を持つ変換係数を表すランダムパターンを有するバッファ手段、
− 前記ビットストリームを表す符号化変換係数を有する入力/出力情報信号を解析し復号/符号化するための復号/符号化手段、
− 変換係数を有する少なくとも一つのビデオブロック、及び
− 前記ビデオブロック、バッファ及びデコーダ/エンコーダを制御するための制御手段を有し、
前記復号/符号化手段が、ラン−レベル対に前記ストリームを解析し部分的に復号し、前記制御手段が、(-1, 1)に等しいレベルを持つ候補のラン−レベル対を選択し、前記バッファ手段から対応するランダム符号を決定し、候補及びバッファ手段のレベルの合計がゼロに等しい場合該候補を破棄し、破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、前記復号/符号化手段が、上記新しいラン−レベル対に対する新しいコードを生成して、低減されたビットレートを得るために符号化変換係数の選択された組を破棄した出力情報信号を提供する装置が提供される。
ここで、“バッファ”は、ある装置から他の装置へ情報を伝送する際に情報の流れの速度やイベントの発生の速度の違いを補償するために設けられる如何なる記憶装置があり、典型的には高速の記憶領域である。
更に、本発明の好ましい実施例によれば、インターネット等のデジタルネットワークにおける本発明の種々の実施例による方法の使用が提供される。
本発明の重要な態様は、画質に著しく悪影響を及ぼすことなく最大10%ビットレートを低減させる方法を提供することである。本発明のこの及びその他の態様が以下に記載の実施例を参照して明らかになり、詳述されるであろう。
本発明は、添付の図面と関連して読まれる本発明の好ましい実施例の以下の記載からより明瞭に理解されるであろう。
本発明の好ましい実施例を述べる前に、MPEG−2の基本についての短い説明を本発明のより良い理解のために与える。
本発明に関連するMPEG−2の基本:
MPEG−2においては、輝度成分Y並びに色差成分U及びVにより表される、予測フレーム及びイントラフレーム内の予測誤差における空間的冗長性が、以下に述べられる演算を用いて低減される。
先ず、色差成分U及びVがサブサンプルされる(sub-sampled)。次いで、DCT処理がY、U及びV成分の8×8画素ブロックに対して実行され、結果のDCT係数が量子化される。人間の目は周波数が高いほど感度が低いので、より低い周波数のエネルギはより粗く量子化され得る。
最下位のMPEG層であるブロック層において、空間的な8×8画素ブロックは、64の量子化DCT係数により表される。これが図1に図示されている。図1は、量子化DCT係数と対応する8×8の整数エントリ(integer entries)を持つ画素ブロック10を示す。多くのエントリはたいていゼロであり、特に、上述したようにより粗く量子化される高空間周波数(spatial
higher frequencies)と対応するエントリの場合にそうなる。図1に示される8×8画素ブロックは、どのように従来技術のブロックがDCT係数を備え得るかを単に例示しているだけである。
インデックス(0、0)を持つゼロ周波数係数を含むブロック10の左上角におけるエントリは“DC係数”と呼ばれる。なぜなら、8×8画素ブロック10の平均値を表すからである。量子化DCT係数を表す前記ブロックの他のエントリは“AC係数”と呼ばれる。
いわゆる“ジグザグスキャン”が(点)線により示されている。このスキャンは、ブロック10の左上角で始まり、矢印により示される方向に継続する。単純化のために、完全なスキャンは図示されず、その一部のみがいわゆる“ラン−レベル”対の原理を述べるために示されている。
ラン−レベル対(run-level pairs):
非ゼロAC係数は並べ換えられ(re-ordered)、ラン−レベル対により表され得る。ここで、“ラン”はある係数に先行するゼロの数に等しく、“レベル”は該係数の値に等しい。これは、第1ステップにおいて、量子化AC−DCT係数の一次元配列の形態で記述され得る。例えば、図1から、配列は、(DC, 0, 3, 0, -1, 2, 0, 1, 0, 0, 0, 0, 0,…, 0)として表され得る。次いで、第2ステップにおいて、係数が(ラン、レベル)の形態のラン−レベル対及び終わりブロックの終了に対するマーカー(EOB)として表される。図1からの係数を用いて、表現は、(DC), (1, 3), (1, -1), (0, 2), (1, 1), EOBのようになろう。
最後に、ラン−レベル対はエントロピー符号化され、VLCコード語により表される。単一のDCTブロックに対するコード語は、EOBマーカーにより終了する。図1からの係数を用いて、表現は、(DC), (001001010), (0111), (01000), (0110), (10)となろう。
本発明の好ましい実施例:
ここで、本発明の好ましい実施例を詳細に述べる。図2aは、本発明の好ましい実施例による圧縮マルチメディアのビットストリームを後処理するための装置1を示す。装置1は、DCT係数を表すランダムパターンが設けられたランダムバッファ2を有する。ランダムバッファ2の図示のパターンは一例にすぎず、決してこの特定のパターンに限定されるものではない。典型的にはランダムジェネレータ(図示せず)により生成されることにより、如何なる適宜のパターンも用いることが可能である。装置1はさらに、この例においては入力メディアストリームQin、この例においてはMPEGビットストリームを解析し復号するためのMPEGパーサ(MPEG parser)を有するデコーダ/エンコーダ3を有する。デコーダ/エンコーダ3から出発する出力ビットストリームQoutも示されている。8×8DCT係数を有するビデオブロック4もある。ブロック4は、デコーダ/エンコーダ3へのアクセスが可能である。これは、この図において、ビデオブロック4とデコーダ/エンコーダ3との間の両方向矢印を用いて図示されている。ビデオブロック4内のDCT係数に達する前に実行する必要がある全ての方法ステップはこの図に示されていないが、図2bを参照して以下詳細に述べる。コントローラ8が、ビデオブロック4、バッファ2及びデコーダ/エンコーダ3を制御するために設けられている。
ビットストリームを低減させるために、先ずバッファ2にDCT係数のランダムパターンが用意される。このバッファ2はランダム符号(-1, +1)しか持たない。図2aでは、既に用意されたパターンを持つバッファ2が示されている。ここで、デコーダ/エンコーダ3内のMPEGパーサが入力メディアストリームQin、典型的にはMPEGストリームを解析し部分的に復号する。図2aにおいて、入力MPEGストリームのデータは示されていないが、このストリームの既に解析され復号されたビデオブロック4が図2bに示されている。図2bにおけるビデオブロック4から、MPEGパーサがラン−レベル対(1,
3), (1, -1), (0, 2), (1, 1),…, (10)(これによりラン−レベル対(10)はEOBである)を表すVLCコードを見出すであろうことが明白である。MPEGパーサは、いわゆる“候補の対(candidate pairs)”、この特定の例においては影が付けられた対(1, -1)及び(1, 1)を選択する。候補の対は、−1又は1の何れかに等しいレベルを持つラン−レベル対である対である。選択されたDCT係数に影が付けられているランダムバッファ2に応じて、両係数のレベルはウォーターマークを埋め込むために増加されるべきである。ラン−レベル対はDC, (1, 3), (1, -1), (0, 2), (1, 1), EOBである。かくして、第2の候補のラン−レベル対(1, 1)は(1, 2)になるであろう。しかしながら、第1の候補のラン−レベル対(1, -1)は(1, 0)になるであろう。これは、VLCのレベルとランダムバッファからの符号との合計がゼロに等しいため、このラン−レベル対が消滅することを意味する。1つのゼロのラン及び以下に記載のラン−マージ法(run-merge method)によりゼロになった係数が、次のラン−レベル対(0, 2)に加算され、この場合(2, 2)になる。シーケンス(1, 3), (2, 2), (1, 1), (EOB)に対する結果のVLCがデコーダ/エンコーダ3により再生成され、出力ストリームQoutとして送信され得る。
言い換えれば、マージは次のように述べることができる。すなわち、破棄されたVLCに起因する追加のゼロ(extra zero)が次のラン−レベル対のランにマージされる。最後に、新しいVLCコードがこの新しいラン−レベル対に対して生成される。
他の方法においては、例えば8×8DCTブロック毎に3である最下位の係数の組が破棄され、これにより、ビットレートを、画質に著しく悪影響を及ぼすことなく最大約10%低減させることができる。
また、変換ブロック内のインデックスが、例えば全体的に許容される変化を規定することにより及び/又は量子化ステップによって目標品質に応じ得る。破棄される組は、より低いインデックスを持つことによっても決定され得る。
好ましくは、デコーダ/エンコーダ及び方法ステップは、部分的に又は完全にソフトウェアのみのソリューションである。
次に、本発明により実行される処理演算を全体的に述べる。
本発明の好ましい実施例によって提供される方法ステップは、
− (-1,
+1)のランダム符号を持つ変換係数を表すランダムパターンを設けるステップ、
− ラン−レベル対にビットストリームを解析し部分的に復号するステップ、
− (-1,
1)に等しいレベルを持つ候補のラン−レベル対(候補)を選択するステップであって、ランはある係数に先行するゼロの数に等しく、レベルは該係数の値に等しいステップ、
− 対応するランダム符号(-1, +1)を決定するステップ、
− 候補及びバッファのレベルの合計がゼロに等しい場合該候補を破棄するステップ、
− 破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、新しいラン−レベル対を形成するステップ、
− 上記新しいラン−レベル対に対する新しいコードを生成し、新しい情報信号を得るステップである。
これらステップは、図2aを参照することによって述べたもの以外の種々のハードウェア構造により実現され得る。例えば、前記ステップは、別個専用の部品を用いて、または恐らくは像の復号/符号化のために最適化された、汎用ハードウェア上で走る一つ以上の特別のソフトウェアルーチンにより実現され得る。実現例(implementation)は、例えば、像データ及び/又はプログラム命令を記憶するための一つ以上のRAMモジュールとして例えば具現化される像を復号し本発明の演算を実行するための一つ以上のプロセッサ、プログラム命令を記憶するための任意の一つ以上のROMモジュール、他のシステムと通信を行なうための一つ以上のI/Oインタフェース装置、及びこれら個別部品を接続するための一つ以上のバスであり得るであろう。有利には、上記プロセッサは、例えばTM-1000タイプのDSP(Philips Electronics North America Corp.)または同様の一つ以上のデジタルシグナルプロセッサを有する。
処理演算がソフトウェアで実現される本発明の実施例においては、本発明はさらに、一つ以上のプロセッサに該処理演算を実行させるための記録された又は符号化されたプログラム命令が設けられたコンピュータ可読媒体又はメディアを有する。斯かる媒体は、フロッピーディスク、ハードウェア、テープ等の磁気媒体や、半導体メモリ等の技術的に利用可能なその他の媒体テクノロジーを含み得る。
ソフトウェアのみのソリューションは、例えば、DIVXムービー等の後処理のために設けられ得る。例えば、高速の後処理法が、DIVXファイルのサイズを、後処理の前にほんの数メガバイトしか大きすぎないこともあろうから、一枚のCDに収めるために完全な符号化処理を改めて実行する代わりに、該CDに収まるように微調整することができる。
本発明の一態様は、ハードウェアコストを著しく増大させることなしに多量の処理時間を浪費するタスクをハードウェアに委ねることにある。斯くして、ハードウェアソリューションの実行とソフトウェアソリューションのコスト且つ簡素さとを組み合わせた非常にコスト競争力のあるハイブリッドソリューションも用いられ得る。
本発明は決してMPEG−2ビデオに限定されるものではなく、他のMPEGの変形例、例えばMPEG−4(例えばDIVXムービー)や音声規格も同様に保護範囲に含まれ得る。例えば、ドルビーAC−3オーディオ技術は本文献で例として述べられていないが、本発明の範囲内である。また、本発明によるビデオ後処理と従来の音声処理との組合わせも適用することができ、故に本発明の範囲内である。MPEG−2ビデオ信号に対するビットレートが典型的には5−9Mb/秒である一方、圧縮オーディオ信号は著しく低いビットレート、例えば、384Kb/秒を持つので、斯様な組合わせも好ましいものである。
8×8のビデオブロックのサイズもMPEG−2規格書に関する例にすぎず、故に、如何なる適宜のサイズが、例えばMPEG−2以外の圧縮方法が用いられる場合に適用されてもよい。ブロックサイズの他の例は例えば16×16があり得るであろう。
マルチメディアストリームは典型的には種々のシステム情報、ビデオ情報及びオーディオ情報を含む。システムにおいては、通例、ストリーム解析段、ビデオ処理段及びオーディオ処理段を必要とする。しかしながら、このことは、これらの段の機能が当業者に良く知られているので本文献では開示されていない。ビデオ及びオーディオストリームの結合及び/又は分離並びに対応するタイミング情報のハンドリングの課題も、当業者に良く知られているので、本文献に開示されていない。例えば、ISO/IEC 13818規格が、どのようにデコーダを具現化できるかを述べている。
本文献は、誤り訂正、ビットディドリング(bit diddling)又は記録密度を増大させるための他の方法等のその他の後処理技術を開示していない。なぜなら、これらは当該技術分野でよく知られているからである。しかしながら、これは、各請求項により規定される本発明の範囲から逸脱することなしに本発明と共に実現されるべき斯かる技術を除外するものではない。
変換係数が破棄されるので、ラン−マージされたストリームのサイズは常に元のストリームのサイズよりも小さくなるであろう。局所的にビットレートは増加するかもしれないが、典型的には平均してビットレートは8−10%減少する。また、スタートコードのバイトアライメントを保つために、スタッフィングビットがMPEGストリーム内の各スタートコードの前に付加され得る。
本発明は、斯かるアーキテクチャに基づくDVDテクノロジー、マルチメディアPC環境及びその他のホームエンターテイメント製品でも実現され得る。斯かる実現例において、例えばPCにおいて、本発明は、プロセッサ及び/もしくはその他のハードウェア部品において、またはソフトウェアのみのソリューションとして実現され得る。
本発明による方法は、MPEG−4メディアストリーム等のデジタルネットワークにおけるデジタルメディアストリームをインターネットにより用いられるいわゆるリアルタイムプロトコル(RTP)に適合させるための後処理方法としても適用され得る。この場合、同期層が、MPEG−4メディア層とRTPスタックとの間のインタフェースとして含まれるかもしれない。
上述の実施例は本発明を限定するものとして示されたものではなく、当業者が添付の請求の範囲から逸脱することなしに多くの他の実施例を設計できるであろうことに留意されたい。各請求項において、括弧で括られた如何なる参照符号も本発明を限定するものとして解釈されるべきではない。“有する”という言葉は請求項に列挙された以外の部品やステップの存在を除外するものではない。本発明は、幾つかの個別部品を有するハードウェアによって、および適宜プログラムされたコンピュータによって実現され得る。幾つかの手段を列挙する装置の請求項において、これらの手段の幾つかは、ハードウェアの同一アイテムにより具現化され得る。ある対策が相互に異なる従属請求項で引用されているという単なる事実は、これらの対策の組合わせを有利に用いることができないということを示すものではない。
完全に復号される一例の従来技術の8×8ブロックの概略図である。 本発明の好ましい実施例による装置のブロック図である。 低減されたビットレートを持たない図2aに図示されるビデオブロックの拡大図である。 低減されたビットレートを持つ図2aに図示されるビデオブロックの拡大図である。

Claims (13)

  1. 元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための方法であって、
    − 前記ビットストリームを表す情報信号であって、符号化変換係数を有する該信号を設けるステップ、及び
    − 前記符号化変換係数の選択された組を破棄することにより前記信号のビットレートを低減させるステップを含む方法。
  2. 請求項1に記載の方法において、前記符号化変換係数の選択された組を破棄するステップが、
    − (-1,
    +1)のランダム符号を持つ変換係数を表すランダムパターンを設けるステップ、
    − ラン−レベル対に前記ビットストリームを解析し部分的に復号するステップ、
    − (-1,
    1)に等しいレベルを持つ候補のラン−レベル対(候補)を選択するステップであって、ランはある係数に先行するゼロの数に等しく、レベルは該係数の値に等しいステップ、
    − 対応するランダム符号を決定するステップ、
    − 候補及びバッファのレベルの合計がゼロに等しい場合該候補を破棄するステップ、
    − 破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、新しいラン−レベル対を形成するステップ、及び
    − 上記新しいラン−レベル対に対する新しいコードを生成し、新しい情報信号を得るステップを含むことを特徴とする方法。
  3. 請求項2に記載の方法において、最下位の係数の組が破棄されることを特徴とする方法。
  4. 請求項3に記載の方法において、3以下の組が破棄されることを特徴とする方法。
  5. 請求項2に記載の方法において、前記破棄される組は目標品質に応じて変換ブロック内のインデックスにより決定されることを特徴とする方法。
  6. 請求項2に記載の方法において、前記破棄される組はより低いインデックスを持つことにより決定されることを特徴とする方法。
  7. 請求項2に記載の方法において、前記破棄される組は全体的に許容される変化により決定されることを特徴とする方法。
  8. 請求項2に記載の方法において、前記破棄される組は量子化ステップにより決定されることを特徴とする方法。
  9. 一つ以上のプロセッサに請求項1又は2に記載の方法を実行させるためのプログラム命令を備えるコンピュータ可読媒体。
  10. 元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのデジタル情報信号であって、符号化変換係数の低減された組を備えることにより低減されたビットレートを持つデジタル情報信号。
  11. 元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための装置であって、
    − (-1,
    +1)のランダム符号を持つ変換係数を表すランダムパターンを有するバッファ手段、
    − 前記ビットストリームを表す符号化変換係数を有する入力/出力情報信号を解析し復号/符号化するための復号/符号化手段、
    − 変換係数を有する少なくとも一つのビデオブロック、及び
    − 前記ビデオブロック、前記バッファ手段及び前記復号/符号化手段を制御するための制御手段を有し、
    前記復号/符号化手段が、ラン−レベル対に前記ストリームを解析し部分的に復号し、前記制御手段が、(-1, 1)に等しいレベルを持つ候補のラン−レベル対を選択し、前記バッファ手段から対応するランダム符号を決定し、候補及び前記バッファ手段のレベルの合計がゼロに等しい場合該候補を破棄し、破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、前記復号/符号化手段が、上記新しいラン−レベル対に対する新しいコードを生成して、低減されたビットレートを得るために前記符号化変換係数の選択された組を破棄した出力情報信号を提供することを特徴とする装置。
  12. 元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのデジタル像情報信号を記録するための装置であって、請求項11に記載の圧縮マルチメディアビットストリームを後処理するための装置を有する装置。
  13. インターネット等のデジタルネットワークにおける請求項1に記載の方法の使用。
JP2003563223A 2002-01-22 2003-01-13 既圧縮マルチメディアのビットレートの低減 Withdrawn JP2005516495A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02075251 2002-01-22
PCT/IB2003/000057 WO2003063498A1 (en) 2002-01-22 2003-01-13 Reducing bit rate of already compressed multimedia

Publications (2)

Publication Number Publication Date
JP2005516495A true JP2005516495A (ja) 2005-06-02
JP2005516495A5 JP2005516495A5 (ja) 2006-03-02

Family

ID=27589111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003563223A Withdrawn JP2005516495A (ja) 2002-01-22 2003-01-13 既圧縮マルチメディアのビットレートの低減

Country Status (6)

Country Link
US (1) US20050041874A1 (ja)
EP (1) EP1472882A1 (ja)
JP (1) JP2005516495A (ja)
KR (1) KR20040075951A (ja)
CN (1) CN1703911A (ja)
WO (1) WO2003063498A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9119462B2 (en) 2011-07-23 2015-09-01 Braun Gmbh Oral cleaning implement having a plastic staple comprising a cavity

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
EP1978743B1 (en) * 2007-04-02 2020-07-01 Vestel Elektronik Sanayi ve Ticaret A.S. A method and apparatus for transcoding a video signal
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8355447B2 (en) * 2007-12-19 2013-01-15 Vixs Systems, Inc. Video encoder with ring buffering of run-level pairs and methods for use therewith
AU2008249145A1 (en) * 2008-11-21 2010-06-10 Canon Kabushiki Kaisha Resolution independent image degradation
CN102170292B (zh) * 2011-01-31 2014-05-07 华为技术有限公司 一种数据处理方法、数据处理系统以及相关设备
CN109788284B (zh) * 2019-02-27 2020-07-28 北京大学深圳研究生院 一种量化块的解码方法、装置及电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5229864A (en) * 1990-04-16 1993-07-20 Fuji Photo Film Co., Ltd. Device for regenerating a picture signal by decoding
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
US6014466A (en) * 1997-07-10 2000-01-11 Hughes Electronics Corporation Object-based video coding of arbitrarily shaped objects using lapped orthogonal transforms (LOTs) defined on rectangular and L-shaped regions
US6314192B1 (en) * 1998-05-21 2001-11-06 Massachusetts Institute Of Technology System, method, and product for information embedding using an ensemble of non-intersecting embedding generators
US20020131645A1 (en) * 2001-01-16 2002-09-19 Packeteer Incorporated Method and apparatus for optimizing a JPEG image using regionally variable compression levels
US7020775B2 (en) * 2001-04-24 2006-03-28 Microsoft Corporation Derivation and quantization of robust non-local characteristics for blind watermarking
US6968091B2 (en) * 2001-09-18 2005-11-22 Emc Corporation Insertion of noise for reduction in the number of bits for variable-length coding of (run, level) pairs
US7096245B2 (en) * 2002-04-01 2006-08-22 Broadcom Corporation Inverse discrete cosine transform supporting multiple decoding processes
US7295612B2 (en) * 2003-09-09 2007-11-13 Apple Inc. Determining the number of unidirectional and bidirectional motion compensated frames to be encoded for a video sequence and detecting scene cuts in the video sequence

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9119462B2 (en) 2011-07-23 2015-09-01 Braun Gmbh Oral cleaning implement having a plastic staple comprising a cavity

Also Published As

Publication number Publication date
KR20040075951A (ko) 2004-08-30
EP1472882A1 (en) 2004-11-03
WO2003063498A1 (en) 2003-07-31
US20050041874A1 (en) 2005-02-24
CN1703911A (zh) 2005-11-30

Similar Documents

Publication Publication Date Title
RU2297729C2 (ru) Группирование кадров изображения на видеокодировании
CN1151681C (zh) 具有mpeg编码解码器的数字记录和回放装置及其方法
JP4676450B2 (ja) デジタルビデオ符号化処理における可変精度ピクチャ間タイミング指定方法及び装置
US8064516B2 (en) Text recognition during video compression
JP4928726B2 (ja) ビデオストリーム中の有効エントリポイントの指示
EP0517141A2 (en) High efficiency coding signal processing apparatus with error propagation influence reduction
EP1553779A1 (en) Data reduction of video streams by selection of frames and partial deletion of transform coefficients
US20010026587A1 (en) Image encoding apparatus and method of same, video camera, image recording apparatus, and image transmission apparatus
US7079578B2 (en) Partial bitstream transcoder system for compressed digital video bitstreams
JPH0818979A (ja) 画像処理装置
JP2005516495A (ja) 既圧縮マルチメディアのビットレートの低減
JP2000165889A (ja) 動きベクトルを再計算せずに圧縮されたビデオを修正する装置および方法
KR20010108077A (ko) 매크로블럭 기반으로 압축된 비디오 데이터의 헤더 정보를로버스트 디코딩하기 위한 방법 및 장치
JPH0496484A (ja) ディジタル映像信号再生装置
JP2000333180A (ja) スキップマクロブロック禁止制御方法、スキップマクロブロック禁止制御装置およびスキップマクロブロック禁止制御プログラムを記録した媒体
KR100338725B1 (ko) 목표부호량에근접시킨영상신호부호화방법및그에따른장치
JP2937180B2 (ja) 映像符号化方法およびこの映像符号化方法による符号データが格納された記録媒体
JP3517795B2 (ja) 画像符号化装置
JPH0646369A (ja) 映像信号処理装置
JP2002300586A (ja) 符号化用画像信号のための電子透かし情報挿入方法及び装置
de With A new single-table bit assignment technique for transform coded images
JP2002305723A (ja) データ記録装置
JP2002305726A (ja) 記録媒体
JP2002320200A (ja) データ記録方法
JP2002305722A (ja) データ生成装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060112

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070522