JP2005516495A

JP2005516495A - 既圧縮マルチメディアのビットレートの低減

Info

Publication number: JP2005516495A
Application number: JP2003563223A
Authority: JP
Inventors: ゲリットシーランゲラール; ヨセフスエイペイネンブルグ
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-01-22
Filing date: 2003-01-13
Publication date: 2005-06-02
Also published as: US20050041874A1; CN1703911A; WO2003063498A1; EP1472882A1; KR20040075951A

Abstract

元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための方法において、ビットレートが幾らかの可変長コード（ＶＬＣ）をランダムに破棄することにより低減される。破棄されたＶＬＣは、その後のＶＬＣとマージされてビットレートを低減させる。

Description

本発明は、メディアストリームの形態の既圧縮マルチメディアデータ(already compressed multimedia data)の信号を後処理するための方法に関する。本発明はまた、対応する装置、コンピュータ可読媒体、デジタル情報信号及び方法の使用にも関する。ここで使われているように、“マルチメディア”という用語は、データパケットのストリームの形態で典型的には配信される、ビデオや音声等の如何なる形式のメディアがあり得る。

ＪＰＥＧ、ＭＰＥＧ、Ｈ．３２０等のメディアビットストリームの個別ブロックを処理するための幾つかの圧縮方法がある。以下、ＭＰＥＧの変形例であるＭＰＥＧ−２をどのように圧縮をなすことができるかを説明するために簡単にさらに述べる。ＭＰＥＧ−２規格に関する追加の情報は、本発明を理解するために必須ではないが、例えば、ISO/IEC Copyright Office Case postal 56, CH 1211, Geneva 20, Switzerlandから入手可能なＭＰＥＧ−２規格書 ISO/IEC 13818-1, 2, 3に見られる。ここで、“メディアビットストリーム”は、典型的にはビデオ又は音声メディアのビットストリームである。

ＭＰＥＧ−２ビデオビットストリームは、階層化構造を持つ。各層は、一つ以上の副層を有する。例えば、ビデオシーケンスは、表示順に連続するビデオフレームの組を表す多数のピクチャグループ、いわゆる“ＧＯＰ(group of picture)”に分割され得る。その副層において、フレームは“スライス”及び“マクロブロック”に分けられ、さらに、ブロックの更に別の副層に分けられ得る。

三つのタイプのフレームがＭＰＥＧの処理で用いられる。すなわち、他のフレームへの如何なる参照なしに符号化されるイントラフレーム（intra frames（Ｉフレーム））、過去のＩフレーム又はＰフレームへの参照をもって符号化される予測フレーム（predicted
frames（Ｐフレーム））、及び過去及び将来両方のフレームへの参照をもって符号化される双方向補間フレーム（bi-directionally
interpolated frames（Ｂフレーム））である。符号化されたＧＯＰは、ビデオストリームのランダムアクセスのためのアクセスポイントを提供するために常にＩフレームで始まる。

ＭＰＥＧ−２は、ピクチャ全体が８×８の画素ブロックに細分され、これらブロックが典型的には離散コサイン変換（ＤＣＴ）により処理され、単独で元のピクチャを表す係数の圧縮された組に量子化されるようにＩフレームが“イントラ”符号化されることを規定する。ＭＰＥＧ−２規格書はまた、Ｐフレームに対して、ＤＣＴにより全てのブロックを符号化するのではなく、いわゆる“動き補償”を用いて、殆どのビデオデータに見られる時間的冗長性(temporal redundancy)を利用することを許容する。動き補償は、ＧＯＰ内で、フレーム間の時間的冗長性が、予測を適用して差分信号、いわゆる予測誤差を得ることにより低減され、これがさらに空間的相関性(spatial
correlation)を除去するためにＤＣＴを用いて圧縮されるように作用する。その後、結果のＤＣＴ係数が量子化される。最後に、動きベクトルがＤＣＴ情報と組み合わされ、可変長符号によりビデオデータを表すために可変長符号化（ＶＬＣ）を用いて符号化される。

動き補償を用いることにより、ＭＰＥＧ−２は、画像を大幅に低減させることなく必要とされるデータ記憶容量及び関連するビットレートを劇的に低減させる。しかしながら、既圧縮メディアストリームの追加のビットレートの低減が、例えばデジタルレコーディング及びデジタルネットワークの分野におけるアプリケーションのためにしばしば必要とされる。

一例として、時としてデジタルレコーダは、例えばビデオ編集において二つのビデオの断片(video fragments)間のつなぎ(transition)を作成するためにビットレートを局所的に増加させる何等かの処理を施さなければならない。ビットレートを一定に保つことを可能にするため、これらレコーダは、それ故、例えば±１０％により既圧縮メディアストリームのビットレートを調整することが可能な微調整ビットレート制御機構を必要とする。

欧州特許出願公開第EP-A2-0 599 257号は、ビットレートの低減を提供する、ビデオ信号を記録又は送信するために用いられるビデオ信号記録装置及び方法を開示する。しかしながら、本文献は、再生エラーが頻繁に起こる装置に適したビデオ信号記録装置及び方法を述べていて、それ故に、該文献は、どのようにして斯かる欠陥(defects)の効果を低減させるかを述べている。

重要なことは、開示されている装置及び方法は、どのようにして既圧縮ストリームに適用可能な複雑さの低いビットレート制御方法によりビットレートを低減させるかを述べていないことである。

本発明の目的は、低減されたビットレートを得るために元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている既圧縮マルチメディアストリームを後処理するための方法及び装置を提供することにある。ここで、“画素”という用語は、像内で最小の識別可能な及び分解可能な領域を含む（がこれに限定されるものではない）如何なる空間解像度の要素(spatial resolution element)も意味する。

本発明の一態様によれば、前記目的は、符号化変換係数の選択された組を破棄する方法において実現される。ここで、“変換係数”は、意味又は値を大幅に変えることなく情報の構造又は組成を変える係数である。

本発明の好ましい実施例によれば、元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための方法であって、
− 前記ビットストリームを表す情報信号であって、符号化変換係数を有する該信号を設けるステップ、及び
− 前記符号化変換係数の選択された組を破棄することにより前記信号のビットレートを低減させるステップを含む方法が提供される。

有利なことは、本発明が直接圧縮メディアストリームに対して演算し、高価なドリフト補償技術がアーチファクト、典型的には可視アーチファクトを回避するために必要とされないことである。

好ましくは、前記符号化変換係数の選択された組を破棄するステップが、
− (-1,
+1)のランダム符号を持つ変換係数を表すランダムパターンを設けるステップ、
− ラン−レベル対に前記ビットストリームを解析し部分的に復号するステップ、
− (-1,
1)に等しいレベルを持つ候補のラン−レベル対を選択するステップであって、ランはある係数に先行するゼロの数に等しく、レベルは該係数の値に等しいステップ、
− 対応するランダム符号を決定するステップ、
− 候補及びバッファのレベルの合計がゼロに等しい場合該候補を破棄する(discard)ステップ、
− 破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、新しいラン−レベル対を形成するステップ、及び
− 上記新しいラン−レベル対に対する新しいコードを生成し、新しい情報信号を得るステップを含む。

本発明のある好ましい実施例の第１の態様においては、最下位の係数(least significant coefficients)が破棄される。

本発明のある好ましい実施例の第２の態様においては、３以下の組が破棄される。

本発明のある実施例の第３の態様においては、破棄される組が目標品質に応じて変換ブロック内のインデックスにより決定される。

本発明のある好ましい実施例の第４の態様においては、破棄される組がより低いインデックスを持つことにより決定される。

更に、本発明の好ましい実施例によれば、一つ以上のプロセッサに、元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための方法であって、
− 前記ビットストリームを表す情報信号であって、符号化変換係数を有する該信号を設けるステップ、及び
− 前記符号化変換係数の選択された組を破棄することにより前記信号のビットレートを低減させるステップを含む方法を実行させるためのプログラム命令を備えるコンピュータ可読媒体が提供される。

更に、本発明の好ましい実施例によれば、元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのデジタル情報信号であって、符号化変換係数の低減された組を備えることにより低減されたビットレートを持つデジタル情報信号が提供される。ここで、“信号”という用語は、情報のコンベヤー、典型的にはあるポイントから別のポイントへ情報を運ぶ(convey)事象的又は電気的な量を意味する。

更に、本発明の好ましい実施例によれば、元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための装置であって、
− (-1,
+1)のランダム符号を持つ変換係数を表すランダムパターンを有するバッファ手段、
− 前記ビットストリームを表す符号化変換係数を有する入力／出力情報信号を解析し復号／符号化するための復号／符号化手段、
− 変換係数を有する少なくとも一つのビデオブロック、及び
− 前記ビデオブロック、バッファ及びデコーダ／エンコーダを制御するための制御手段を有し、

前記復号／符号化手段が、ラン−レベル対に前記ストリームを解析し部分的に復号し、前記制御手段が、(-1, 1)に等しいレベルを持つ候補のラン−レベル対を選択し、前記バッファ手段から対応するランダム符号を決定し、候補及びバッファ手段のレベルの合計がゼロに等しい場合該候補を破棄し、破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、前記復号／符号化手段が、上記新しいラン−レベル対に対する新しいコードを生成して、低減されたビットレートを得るために符号化変換係数の選択された組を破棄した出力情報信号を提供する装置が提供される。

ここで、“バッファ”は、ある装置から他の装置へ情報を伝送する際に情報の流れの速度やイベントの発生の速度の違いを補償するために設けられる如何なる記憶装置があり、典型的には高速の記憶領域である。

更に、本発明の好ましい実施例によれば、インターネット等のデジタルネットワークにおける本発明の種々の実施例による方法の使用が提供される。

本発明の重要な態様は、画質に著しく悪影響を及ぼすことなく最大１０％ビットレートを低減させる方法を提供することである。本発明のこの及びその他の態様が以下に記載の実施例を参照して明らかになり、詳述されるであろう。

本発明は、添付の図面と関連して読まれる本発明の好ましい実施例の以下の記載からより明瞭に理解されるであろう。

本発明の好ましい実施例を述べる前に、ＭＰＥＧ−２の基本についての短い説明を本発明のより良い理解のために与える。

本発明に関連するＭＰＥＧ−２の基本：
ＭＰＥＧ−２においては、輝度成分Ｙ並びに色差成分Ｕ及びＶにより表される、予測フレーム及びイントラフレーム内の予測誤差における空間的冗長性が、以下に述べられる演算を用いて低減される。

先ず、色差成分Ｕ及びＶがサブサンプルされる(sub-sampled)。次いで、ＤＣＴ処理がＹ、Ｕ及びＶ成分の８×８画素ブロックに対して実行され、結果のＤＣＴ係数が量子化される。人間の目は周波数が高いほど感度が低いので、より低い周波数のエネルギはより粗く量子化され得る。

最下位のＭＰＥＧ層であるブロック層において、空間的な８×８画素ブロックは、６４の量子化ＤＣＴ係数により表される。これが図１に図示されている。図１は、量子化ＤＣＴ係数と対応する８×８の整数エントリ(integer entries)を持つ画素ブロック１０を示す。多くのエントリはたいていゼロであり、特に、上述したようにより粗く量子化される高空間周波数（spatial
higher frequencies）と対応するエントリの場合にそうなる。図１に示される８×８画素ブロックは、どのように従来技術のブロックがＤＣＴ係数を備え得るかを単に例示しているだけである。

インデックス(0、0)を持つゼロ周波数係数を含むブロック１０の左上角におけるエントリは“ＤＣ係数”と呼ばれる。なぜなら、８×８画素ブロック１０の平均値を表すからである。量子化ＤＣＴ係数を表す前記ブロックの他のエントリは“ＡＣ係数”と呼ばれる。

いわゆる“ジグザグスキャン”が（点）線により示されている。このスキャンは、ブロック１０の左上角で始まり、矢印により示される方向に継続する。単純化のために、完全なスキャンは図示されず、その一部のみがいわゆる“ラン−レベル”対の原理を述べるために示されている。

ラン−レベル対(run-level pairs)：
非ゼロＡＣ係数は並べ換えられ(re-ordered)、ラン−レベル対により表され得る。ここで、“ラン”はある係数に先行するゼロの数に等しく、“レベル”は該係数の値に等しい。これは、第１ステップにおいて、量子化ＡＣ−ＤＣＴ係数の一次元配列の形態で記述され得る。例えば、図１から、配列は、(DC, 0, 3, 0, -1, 2, 0, 1, 0, 0, 0, 0, 0,…, 0)として表され得る。次いで、第２ステップにおいて、係数が（ラン、レベル）の形態のラン−レベル対及び終わりブロックの終了に対するマーカー（ＥＯＢ）として表される。図１からの係数を用いて、表現は、(DC), (1, 3), (1, -1), (0, 2), (1, 1), EOBのようになろう。

最後に、ラン−レベル対はエントロピー符号化され、ＶＬＣコード語により表される。単一のＤＣＴブロックに対するコード語は、ＥＯＢマーカーにより終了する。図１からの係数を用いて、表現は、(DC), (001001010), (0111), (01000), (0110), (10)となろう。

本発明の好ましい実施例：
ここで、本発明の好ましい実施例を詳細に述べる。図２ａは、本発明の好ましい実施例による圧縮マルチメディアのビットストリームを後処理するための装置１を示す。装置１は、ＤＣＴ係数を表すランダムパターンが設けられたランダムバッファ２を有する。ランダムバッファ２の図示のパターンは一例にすぎず、決してこの特定のパターンに限定されるものではない。典型的にはランダムジェネレータ（図示せず）により生成されることにより、如何なる適宜のパターンも用いることが可能である。装置１はさらに、この例においては入力メディアストリームＱ_ｉｎ、この例においてはＭＰＥＧビットストリームを解析し復号するためのＭＰＥＧパーサ(MPEG parser)を有するデコーダ／エンコーダ３を有する。デコーダ／エンコーダ３から出発する出力ビットストリームＱ_ｏｕｔも示されている。８×８ＤＣＴ係数を有するビデオブロック４もある。ブロック４は、デコーダ／エンコーダ３へのアクセスが可能である。これは、この図において、ビデオブロック４とデコーダ／エンコーダ３との間の両方向矢印を用いて図示されている。ビデオブロック４内のＤＣＴ係数に達する前に実行する必要がある全ての方法ステップはこの図に示されていないが、図２ｂを参照して以下詳細に述べる。コントローラ８が、ビデオブロック４、バッファ２及びデコーダ／エンコーダ３を制御するために設けられている。

ビットストリームを低減させるために、先ずバッファ２にＤＣＴ係数のランダムパターンが用意される。このバッファ２はランダム符号(-1, +1)しか持たない。図２ａでは、既に用意されたパターンを持つバッファ２が示されている。ここで、デコーダ／エンコーダ３内のＭＰＥＧパーサが入力メディアストリームＱ_ｉｎ、典型的にはＭＰＥＧストリームを解析し部分的に復号する。図２ａにおいて、入力ＭＰＥＧストリームのデータは示されていないが、このストリームの既に解析され復号されたビデオブロック４が図２ｂに示されている。図２ｂにおけるビデオブロック４から、ＭＰＥＧパーサがラン−レベル対(1,
3), (1, -1), (0, 2), (1, 1),…, (10)（これによりラン−レベル対(10)はEOBである）を表すＶＬＣコードを見出すであろうことが明白である。ＭＰＥＧパーサは、いわゆる“候補の対(candidate pairs)”、この特定の例においては影が付けられた対(1, -1)及び(1, 1)を選択する。候補の対は、−１又は１の何れかに等しいレベルを持つラン−レベル対である対である。選択されたＤＣＴ係数に影が付けられているランダムバッファ２に応じて、両係数のレベルはウォーターマークを埋め込むために増加されるべきである。ラン−レベル対はDC, (1, 3), (1, -1), (0, 2), (1, 1), EOBである。かくして、第２の候補のラン−レベル対(1, 1)は(1, 2)になるであろう。しかしながら、第１の候補のラン−レベル対(1, -1)は(1, 0)になるであろう。これは、ＶＬＣのレベルとランダムバッファからの符号との合計がゼロに等しいため、このラン−レベル対が消滅することを意味する。１つのゼロのラン及び以下に記載のラン−マージ法(run-merge method)によりゼロになった係数が、次のラン−レベル対(0, 2)に加算され、この場合(2, 2)になる。シーケンス(1, 3), (2, 2), (1, 1), (EOB)に対する結果のＶＬＣがデコーダ／エンコーダ３により再生成され、出力ストリームＱ_ｏｕｔとして送信され得る。

言い換えれば、マージは次のように述べることができる。すなわち、破棄されたＶＬＣに起因する追加のゼロ(extra zero)が次のラン−レベル対のランにマージされる。最後に、新しいＶＬＣコードがこの新しいラン−レベル対に対して生成される。

他の方法においては、例えば８×８ＤＣＴブロック毎に３である最下位の係数の組が破棄され、これにより、ビットレートを、画質に著しく悪影響を及ぼすことなく最大約１０％低減させることができる。

また、変換ブロック内のインデックスが、例えば全体的に許容される変化を規定することにより及び／又は量子化ステップによって目標品質に応じ得る。破棄される組は、より低いインデックスを持つことによっても決定され得る。

好ましくは、デコーダ／エンコーダ及び方法ステップは、部分的に又は完全にソフトウェアのみのソリューションである。

次に、本発明により実行される処理演算を全体的に述べる。

本発明の好ましい実施例によって提供される方法ステップは、
− (-1,
+1)のランダム符号を持つ変換係数を表すランダムパターンを設けるステップ、
− ラン−レベル対にビットストリームを解析し部分的に復号するステップ、
− (-1,
1)に等しいレベルを持つ候補のラン−レベル対（候補）を選択するステップであって、ランはある係数に先行するゼロの数に等しく、レベルは該係数の値に等しいステップ、
− 対応するランダム符号(-1, +1)を決定するステップ、
− 候補及びバッファのレベルの合計がゼロに等しい場合該候補を破棄するステップ、
− 破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、新しいラン−レベル対を形成するステップ、
− 上記新しいラン−レベル対に対する新しいコードを生成し、新しい情報信号を得るステップである。

これらステップは、図２ａを参照することによって述べたもの以外の種々のハードウェア構造により実現され得る。例えば、前記ステップは、別個専用の部品を用いて、または恐らくは像の復号／符号化のために最適化された、汎用ハードウェア上で走る一つ以上の特別のソフトウェアルーチンにより実現され得る。実現例(implementation)は、例えば、像データ及び／又はプログラム命令を記憶するための一つ以上のＲＡＭモジュールとして例えば具現化される像を復号し本発明の演算を実行するための一つ以上のプロセッサ、プログラム命令を記憶するための任意の一つ以上のＲＯＭモジュール、他のシステムと通信を行なうための一つ以上のＩ／Ｏインタフェース装置、及びこれら個別部品を接続するための一つ以上のバスであり得るであろう。有利には、上記プロセッサは、例えばTM-1000タイプのDSP(Philips Electronics North America Corp.)または同様の一つ以上のデジタルシグナルプロセッサを有する。

処理演算がソフトウェアで実現される本発明の実施例においては、本発明はさらに、一つ以上のプロセッサに該処理演算を実行させるための記録された又は符号化されたプログラム命令が設けられたコンピュータ可読媒体又はメディアを有する。斯かる媒体は、フロッピーディスク、ハードウェア、テープ等の磁気媒体や、半導体メモリ等の技術的に利用可能なその他の媒体テクノロジーを含み得る。

ソフトウェアのみのソリューションは、例えば、ＤＩＶＸムービー等の後処理のために設けられ得る。例えば、高速の後処理法が、ＤＩＶＸファイルのサイズを、後処理の前にほんの数メガバイトしか大きすぎないこともあろうから、一枚のＣＤに収めるために完全な符号化処理を改めて実行する代わりに、該ＣＤに収まるように微調整することができる。

本発明の一態様は、ハードウェアコストを著しく増大させることなしに多量の処理時間を浪費するタスクをハードウェアに委ねることにある。斯くして、ハードウェアソリューションの実行とソフトウェアソリューションのコスト且つ簡素さとを組み合わせた非常にコスト競争力のあるハイブリッドソリューションも用いられ得る。

本発明は決してＭＰＥＧ−２ビデオに限定されるものではなく、他のＭＰＥＧの変形例、例えばＭＰＥＧ−４（例えばＤＩＶＸムービー）や音声規格も同様に保護範囲に含まれ得る。例えば、ドルビーＡＣ−３オーディオ技術は本文献で例として述べられていないが、本発明の範囲内である。また、本発明によるビデオ後処理と従来の音声処理との組合わせも適用することができ、故に本発明の範囲内である。ＭＰＥＧ−２ビデオ信号に対するビットレートが典型的には５−９Ｍｂ／秒である一方、圧縮オーディオ信号は著しく低いビットレート、例えば、３８４Ｋｂ／秒を持つので、斯様な組合わせも好ましいものである。

８×８のビデオブロックのサイズもＭＰＥＧ−２規格書に関する例にすぎず、故に、如何なる適宜のサイズが、例えばＭＰＥＧ−２以外の圧縮方法が用いられる場合に適用されてもよい。ブロックサイズの他の例は例えば１６×１６があり得るであろう。

マルチメディアストリームは典型的には種々のシステム情報、ビデオ情報及びオーディオ情報を含む。システムにおいては、通例、ストリーム解析段、ビデオ処理段及びオーディオ処理段を必要とする。しかしながら、このことは、これらの段の機能が当業者に良く知られているので本文献では開示されていない。ビデオ及びオーディオストリームの結合及び／又は分離並びに対応するタイミング情報のハンドリングの課題も、当業者に良く知られているので、本文献に開示されていない。例えば、ISO/IEC 13818規格が、どのようにデコーダを具現化できるかを述べている。

本文献は、誤り訂正、ビットディドリング(bit diddling)又は記録密度を増大させるための他の方法等のその他の後処理技術を開示していない。なぜなら、これらは当該技術分野でよく知られているからである。しかしながら、これは、各請求項により規定される本発明の範囲から逸脱することなしに本発明と共に実現されるべき斯かる技術を除外するものではない。

変換係数が破棄されるので、ラン−マージされたストリームのサイズは常に元のストリームのサイズよりも小さくなるであろう。局所的にビットレートは増加するかもしれないが、典型的には平均してビットレートは８−１０％減少する。また、スタートコードのバイトアライメントを保つために、スタッフィングビットがＭＰＥＧストリーム内の各スタートコードの前に付加され得る。

本発明は、斯かるアーキテクチャに基づくＤＶＤテクノロジー、マルチメディアＰＣ環境及びその他のホームエンターテイメント製品でも実現され得る。斯かる実現例において、例えばＰＣにおいて、本発明は、プロセッサ及び／もしくはその他のハードウェア部品において、またはソフトウェアのみのソリューションとして実現され得る。

本発明による方法は、ＭＰＥＧ−４メディアストリーム等のデジタルネットワークにおけるデジタルメディアストリームをインターネットにより用いられるいわゆるリアルタイムプロトコル（ＲＴＰ）に適合させるための後処理方法としても適用され得る。この場合、同期層が、ＭＰＥＧ−４メディア層とＲＴＰスタックとの間のインタフェースとして含まれるかもしれない。

上述の実施例は本発明を限定するものとして示されたものではなく、当業者が添付の請求の範囲から逸脱することなしに多くの他の実施例を設計できるであろうことに留意されたい。各請求項において、括弧で括られた如何なる参照符号も本発明を限定するものとして解釈されるべきではない。“有する”という言葉は請求項に列挙された以外の部品やステップの存在を除外するものではない。本発明は、幾つかの個別部品を有するハードウェアによって、および適宜プログラムされたコンピュータによって実現され得る。幾つかの手段を列挙する装置の請求項において、これらの手段の幾つかは、ハードウェアの同一アイテムにより具現化され得る。ある対策が相互に異なる従属請求項で引用されているという単なる事実は、これらの対策の組合わせを有利に用いることができないということを示すものではない。

完全に復号される一例の従来技術の８×８ブロックの概略図である。本発明の好ましい実施例による装置のブロック図である。低減されたビットレートを持たない図２ａに図示されるビデオブロックの拡大図である。低減されたビットレートを持つ図２ａに図示されるビデオブロックの拡大図である。

Claims

元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための方法であって、
− 前記ビットストリームを表す情報信号であって、符号化変換係数を有する該信号を設けるステップ、及び
− 前記符号化変換係数の選択された組を破棄することにより前記信号のビットレートを低減させるステップを含む方法。
請求項１に記載の方法において、前記符号化変換係数の選択された組を破棄するステップが、
− (-1,
+1)のランダム符号を持つ変換係数を表すランダムパターンを設けるステップ、
− ラン−レベル対に前記ビットストリームを解析し部分的に復号するステップ、
− (-1,
1)に等しいレベルを持つ候補のラン−レベル対（候補）を選択するステップであって、ランはある係数に先行するゼロの数に等しく、レベルは該係数の値に等しいステップ、
− 対応するランダム符号を決定するステップ、
− 候補及びバッファのレベルの合計がゼロに等しい場合該候補を破棄するステップ、
− 破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、新しいラン−レベル対を形成するステップ、及び
− 上記新しいラン−レベル対に対する新しいコードを生成し、新しい情報信号を得るステップを含むことを特徴とする方法。
請求項２に記載の方法において、最下位の係数の組が破棄されることを特徴とする方法。
請求項３に記載の方法において、３以下の組が破棄されることを特徴とする方法。
請求項２に記載の方法において、前記破棄される組は目標品質に応じて変換ブロック内のインデックスにより決定されることを特徴とする方法。
請求項２に記載の方法において、前記破棄される組はより低いインデックスを持つことにより決定されることを特徴とする方法。
請求項２に記載の方法において、前記破棄される組は全体的に許容される変化により決定されることを特徴とする方法。
請求項２に記載の方法において、前記破棄される組は量子化ステップにより決定されることを特徴とする方法。
一つ以上のプロセッサに請求項１又は２に記載の方法を実行させるためのプログラム命令を備えるコンピュータ可読媒体。
元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのデジタル情報信号であって、符号化変換係数の低減された組を備えることにより低減されたビットレートを持つデジタル情報信号。
元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのビットストリームを後処理するための装置であって、
− (-1,
+1)のランダム符号を持つ変換係数を表すランダムパターンを有するバッファ手段、
− 前記ビットストリームを表す符号化変換係数を有する入力／出力情報信号を解析し復号／符号化するための復号／符号化手段、
− 変換係数を有する少なくとも一つのビデオブロック、及び
− 前記ビデオブロック、前記バッファ手段及び前記復号／符号化手段を制御するための制御手段を有し、
前記復号／符号化手段が、ラン−レベル対に前記ストリームを解析し部分的に復号し、前記制御手段が、(-1, 1)に等しいレベルを持つ候補のラン−レベル対を選択し、前記バッファ手段から対応するランダム符号を決定し、候補及び前記バッファ手段のレベルの合計がゼロに等しい場合該候補を破棄し、破棄された候補からの追加のゼロを次のラン−レベル対のランにマージし、前記復号／符号化手段が、上記新しいラン−レベル対に対する新しいコードを生成して、低減されたビットレートを得るために前記符号化変換係数の選択された組を破棄した出力情報信号を提供することを特徴とする装置。
元のマルチメディアデータをカバーする重畳しない画素ブロックの個別の圧縮を含む処理により圧縮されている圧縮マルチメディアデータのデジタル像情報信号を記録するための装置であって、請求項１１に記載の圧縮マルチメディアビットストリームを後処理するための装置を有する装置。
インターネット等のデジタルネットワークにおける請求項１に記載の方法の使用。