JP2022536512A - 符号化器及び一連のフレームを符号化する方法 - Google Patents

符号化器及び一連のフレームを符号化する方法 Download PDF

Info

Publication number
JP2022536512A
JP2022536512A JP2021573589A JP2021573589A JP2022536512A JP 2022536512 A JP2022536512 A JP 2022536512A JP 2021573589 A JP2021573589 A JP 2021573589A JP 2021573589 A JP2021573589 A JP 2021573589A JP 2022536512 A JP2022536512 A JP 2022536512A
Authority
JP
Japan
Prior art keywords
frame
linearly transformed
encoding
frames
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021573589A
Other languages
English (en)
Inventor
ペルグラン,パスカル
ドゥムード,ギヨーム
ルーヴロワ,ガエル
ビィッシャート,シャルル
Original Assignee
イントピックス・エスア
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イントピックス・エスア filed Critical イントピックス・エスア
Publication of JP2022536512A publication Critical patent/JP2022536512A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

一連のフレーム(113)を符号化する際、例えば、ウェーブレット変換(104)などの線形変換(101)を、一連のフレームにフレームごとに適用する。線形変換して得られたフレームの少なくとも1つの部分を、線形変換されたフレームの差分表現に基づいてインターモードで符号化する。差分表現は、一方で線形変換されたフレームの部分と、他方で少なくとも1つの他の線形変換されたフレームの対応する部分の表現との間の差分と対応する。次に、データ圧縮(106、107)を線形変換されたフレームの部分の差分表現に適用する。【選択図】図1

Description

本発明の態様は、一連のフレームを符号化するように適合された符号化器に関するものである。符号化器は、例えば、動画像ストリームを、送信もしくは記憶又はその両方を効率的に行うため符号化するように使用することができるものである。本発明のさらなる態様は、一連のフレームの符号化方法、符号化器用のコンピュータプログラム、復号器、及び符号化した一連のフレームの復号方法に関する。
米国特許第9,332,258号明細書は、デジタル画像の圧縮が、通常、無相関化変換(de-correlative transform)、エントロピー符号化及びレート割り当ての3つのステップで行われると述べている。無相関化変換によって、エントロピーが減少する、つまり、変換された画像のエントロピーは、発生確率が係数値の小さいサブセットでは増すので低くなり得る。画像圧縮において一般に用いられる無相関化変換は、色変換、インター/イントラ予測、DCT変換又はウェーブレット変換である。エントロピー符号化によって、変換された画像のデータサイズが小さくなり、少ないデータ量で、変換された画像を表示できる。最後に、レート割り当てによって、所望の圧縮比を得られるように、圧縮画像の出力ストリームの一部分となるデータを選択する。
米国特許第9,332,258号明細書は、符号化器及び復号器の複雑さを最小限にしながら許容可能な圧縮効率を有する、入力データストリームを出力データストリームに圧縮するための技術を記載している。入力データストリームにおけるmビットのワード列をmビットのnワードのグループにグループ分けし、nは、2より大きいか又は2と等しい。それぞれのグループについて、最大符号化ラインインデックス(GCLI)の値を検出する。GCLIは、そのグループのワードの任意の符号ビットを除くビット間で最も重みが大きい非ゼロビットのインデックスである。出力データストリームは、入力ストリームの当該グループにおけるmビットのnワードに対応するGCLIビットのnワードのグループを含む。それぞれのワードのGCLIのビットは、入力ストリームにおいて対応するワードの最も重みが小さいGCLIビットと、GCLIの値とである。
米国特許第9,332,258号明細書
以下の高圧縮、高画質及び適度なコストの基準の少なくとも1つの基準にさらによく適合する一連のフレームを符号化できる改善された解決策が求められている。
請求項1に記載の本発明の態様によれば、一連のフレームを符号化するように適合された符号化器が提供され、当該符号化器は、
符号化対象の一連のフレーム中のフレームよりもエントロピーが少ない一連の線形変換されたフレームを得るように、一連のフレームにフレームごとに線形変換を適用するように適合された線形変換アセンブリと、
線形変換されたフレームよりデータ量が少ない一連の符号化されたフレームを得るように、一連の線形変換されたフレームを符号化するように適合された符号化アセンブリと、
を備え、
符号化アセンブリは、線形変換されたフレームの少なくとも1つの部分を、符号化アセンブリが、インターモードで符号化された線形変換されたフレームの少なくとも1つの部分の差分表現を提供するインターモードで符号化するように適合され、差分表現は、一方で、線形変換されたフレームの少なくとも1つの部分と、他方で、少なくとも1つの他の線形変換されたフレームの対応する少なくとも1つの部分の表現との間の差分に対応しており、符号化アセンブリは、符号化されたフレームの少なくとも1つの部分を得るように、データ圧縮を線形変換されたフレームの少なくとも1つの部分の差分表現に適用する符号化器が提供される。
請求項12、13及び14に記載の本発明のさらなる態様によれば、一連のフレームを符号化する方法、符号化器用コンピュータプログラム及び復号器がそれぞれ提供される。
従来の符号化スキームとの主な違いは、インターモードで、線形変換されたフレームの少なくとも1つの部分の差分表現が、フレーム又はその一部分の差分表現というより、元の形態で処理されることである。これによって、ハードウェアもしくはソフトウェア又はその両方に関連して複雑さが緩和された実装が可能であり、その結果、低コストかつ低電力消費の実装が可能となる。さらに、インターモードの符号化を適用することによって、画質をさほど劣化させずに高圧縮を達成することができる。
元のフレーム間の差分というより、線形変換されたフレーム間の差分を符号化しても、原理上、画質に悪影響は及ばない。これは、線形変換後の差分演算が線形変換前の差分演算と同等であることによる。線形変換後の差分演算により得られた差分表現に線形変換の逆を適用すると、線形変換前の差分演算により得られた差分表現がもたらされることになる。逆に、線形変換前の差分演算により得られた差分表現に線形変換を適用すると、線形変換後の差分演算により得られた差分表現がもたらされることになる。
上述の符号化器において、符号化アセンブリは、無相関化であり得る任意の変換をこれ以上実行する必要がないことに留意すべきである。よって、このような符号化器では、線形変換されたフレームに、エントロピーを減少させ得る変換をこれ以上行う必要はない。むしろ、上述のように差分表現に適用されるデータ圧縮は、少ないデータで差分表現を示すために、エントロピー符号化を差分表現に直接適用することにある。
図示目的で、本発明のいくつかの実施形態を、添付の図面を参照して詳細に説明する。この説明において、従属項にそのいくつかを記載している追加の特徴を提示していくことで、利点が明らかとなるだろう。
図1は、動画像符号化器のブロック図である。 図2は、動画像符号化器が定めるサブバンドを図示した周波数の図である。 図3は、動画像符号化器において生成された線形変換フレームの画像の図である。 図4は、動画像符号化器における符号化モード選択モジュールのブロック図である。 図5は、符号化モード選択モジュールにおける4つのサンプルのグループからのGCLI値抽出を示す概念図である。 図6は、イントラモードで符号化された部分と、インターモードで符号化された他の部分とを示す線形変換フレームの画像の図である。 図7は、動画像符号化器における参照フレームバッファアセンブリのブロック図である。 図8は、動画像復号器のブロック図である。
図1は、動画像符号化器100の概略を図示したものである。図1は、動画像符号化器100のブロック図を提供する。動画像符号化器100は、例えば、動画像を取り込むことができるもしくは動画像を記憶できる又はその両方ができる、例えばスマートフォンなどの通信装置に備えることができる。動画像符号化器100によって、通信装置が、動画像を別の通信装置にネットワークにより設けられ得る通信路を介して効率的に伝送することができる。
動画像符号化器100は、線形変換アセンブリ101と、符号化アセンブリ102とを備える。線形変換アセンブリ101は、可逆色変換モジュール103と、ウェーブレット変換モジュール104とを備え得る。符号化アセンブリ102は、符号化モード選択モジュール105と、量子化モジュール106と、エントロピー符号化モジュール107と、データパッケージ化モジュール108と、レート割り当てモジュール109と、逆量子化モジュール110と、再構成モジュール111と、参照フレームバッファアセンブリ112とを備え得る。
動画像符号化器100は、基本的に、以下のように作動する。動画像符号化器100は、動画像ストリーム113を受信し、当該動画像ストリーム113は、一連のフレームを含む。応答の際、動画像符号化器100は、符号化された動画像ストリーム114を出力し、当該動画像ストリーム114は、受信した動画像ストリーム113よりデータレートが著しく小さくなり得る。
受信した動画像ストリーム113のフレームは、画素マトリクスとみなすことができ、当該画素マトリクスは、画素の行と、画素の列とを含んでいる。画素は、3つの成分を含むことができ、当該3つの成分は、組み合わされて、画素に関する輝度の情報及び色の情報を伝達する。3つの成分は、例えば、RGBと呼ばれる色座標系など、色座標系にしたがって表わされる。
可逆色変換モジュール103は、画素の3つの成分を別の色座標系の3つの成分に変換する。このような可逆色変換によって、エントロピーを減少させることができる。それに応じて、可逆色変換モジュールは、可逆色変換されたフレームを提供し、当該フレームでは、エントロピーが元の形態のフレームよりも減少し得る。このことは、画像圧縮に役立つ。
便利かつ簡単になるように、可逆色変換されたフレームを画素マトリクスとして、これにより、画素は、例えば、輝度成分(Y)のみなど、1つの成分のみを有するものとする。すなわち、可逆色変換されたフレームは、単一の成分のみを示すサンプルの単一のマトリクスであり、その一方で、実際、可逆色変換されたフレームは、サンプルの3つのマトリクスのセットとみなすことができ、そのそれぞれが特定の成分を示す。例えば、可逆色変換されたフレームは、実際、輝度(Y)成分を示すサンプルのマトリクス、第1の色成分(Cr)を示すサンプルの別のマトリクス及び第2の色成分(Cb)を示すサンプルのさらに別のマトリクスを含み得る。サンプルのこれらのマトリクスは、後述するように個別に処理することができる。サンプルは、当該成分の値を表す2進ワードの形態にすることができる。
ウェーブレット変換モジュール104は、ウェーブレット変換を可逆色変換されたフレームに適用する。ウェーブレット変換には、フィルタ処理及びサブサンプリング処理が必要である。これらの処理によって、線形変換されたフレームを共同で構成する各サブバンドフレームのセットが生成される。サブバンドフレームは、特定のスペクトルバンドにおいて可逆色変換されたフレームのスペクトル成分を示すものであり、当該スペクトルバンドは、サブバンドと呼ばれる。ウェーブレット変換モジュール104が実行するウェーブレット変換は、例えば、JPEG-XSとして知られる画像符号化スキームなど、既存のウェーブレットベースの画像符号化スキームにおけるものと類似した変換にすることができる。
図2は、ウェーブレット変換モジュール104が規定する各サブバンド201~207の概念図を示す。各サブバンド201~207は、2次元の周波数の図に示しており、当該周波数の図は、水平方向の周波数FHを示す水平の軸線と、垂直方向の周波数FVを示す垂直の軸線とを有する。ウェーブレット変換モジュール104は、よって、これらの各サブバンド201~207に各サブバンドフレームを提供する。サブバンドフレームは、サブバンド係数のマトリクスとみなすことができる。可逆色変換されたフレームに対するサブバンド係数のマトリクスの大きさは、ウェーブレット変換モジュール104が当該サブバンドフレームを得るように適用したサブサンプリング係数により決まる。
図3は、線形変換されたフレームを共同で構成する各サブバンドフレーム301~307の概略を図示したものである。各サブバンドフレーム301~307は、画像の図として示されている。サブバンドフレームは、図2に図示した特定のサブバンドと関連づけられている。図3は、特定のサブバンドであって、基準サイン(reference sign)をこの特定のサブバンドに関連付けることによりサブバンドフレームが関連付けられた特定のサブバンドを示す。
線形変換されたフレームは、4つの相対的に小さく低周波数のサブバンドフレーム301~304と、3つの相対的に大きく高周波数のサブバンドフレーム305~307とを含んでいる。3つの高周波数のサブバンドフレーム305~307に対して、サブサンプリング係数は2である。4つの低周波数のサブバンドフレーム301~304に対して、サブサンプリング係数は4である。4つの低周波数のサブバンドフレーム301~304の中に、可逆色変換されたフレームをローパスフィルタ処理してダウンスケールした版に相当する最低域のサブバンドフレーム301がある。このような意味合いで、ダウンスケーリングは、サブサンプリングと同等である。
サブバンドフレームは、図3から理解できるように、スペクトル情報及び空間情報の両方を含む。この特性は、図1に図示しさらに詳細に説明した動画像符号化器100において活用される。すなわち、サブバンドフレームの特定の部分を、可逆色変換されたフレーム及び符号化対象のフレームの同様の位置の部分と関連付けることができる。
図1を参照すると、符号化アセンブリ102は、各サブバンドフレーム301~307を個別に、ただし、圧縮されたサブバンドフレームを結合する場合レート割り当て及びデータパッケージ化を除いて、符号化することができる。すなわち、符号化モード選択モジュール105、量子化モジュール106、逆量子化モジュール110並びにエントロピー符号化モジュール107は、連続して各サブバンドフレーム301~307を個別に処理することができる。他の実施形態では、符号化アセンブリ102は、並行処理方式により作動可能である。このような一実施形態では、符号化アセンブリ102は、以下のタイプの複数のモジュール、符号化モード選択モジュール、量子化モジュール、逆量子化モジュール及びエントロピー符号化モジュールを含み得る。すなわち、それぞれのサブバンドフレームのためのこのような1つのモジュールが線形変換されたフレームに含まれ得る。のちほど、単一のサブバンドフレームの符号化を簡略化のためかつ便宜上説明する。他のサブバンドフレームが同様に符号化される。
サブバンドフレームを符号化するために、参照フレームバッファアセンブリ112は、先に符号化されている動画像ストリーム113中の別のフレームに関連した対応するサブバンドフレームの表現を含む。対応するという用語は、前述の両方のサブバンドフレームが、同一のサブバンドと関連付けられていることを表している。先に符号化されているフレームに関連した対応するサブバンドフレームの表現は、以後、簡略化及び簡潔化のため対応する先のサブバンドフレームと呼ぶ。さらに一般的には、線形変換されたフレームを符号化するために、参照フレームバッファアセンブリ112は、先に符号化されている別の線形変換されたフレームの表現を含み得る。上述の両方の線形変換されたフレームは、図3に図示した各サブバンドフレーム301~307を含む。
符号化アセンブリ102は、サブバンドフレームを部分ごとに符号化することができる。符号化対象のサブバンドフレームの一部分は、同一の線に32のサンプルのグループを含み得る。本実施形態では2又は4であり得るサブサンプリング係数によって、サブバンドフレームのこのような一部分は、符号化対象のフレームにおいて、2つのサンプルで64のブロック、4つのサンプルで128のブロックにそれぞれ対応することができる。符号化対象のサブバンドフレームの一部分は、以後、簡略化及び簡潔化のためサブバンドフレーム部分と呼ぶ。
サブバンドフレーム部分を符号化するために、符号化モード選択モジュール105は、参照フレームバッファアセンブリ112から、対応する先のサブバンドフレームの対応する部分を検索する。この実施形態では、対応する部分は、符号化対象のサブバンドフレーム部分の位置と同様の対応する先のサブバンドフレーム内の位置を有する。対応する先のサブバンドフレームの対応する部分は、以後、簡略化及び簡潔化のため、対応する先のサブバンドフレーム部分と呼ぶ。
図4は、符号化モード選択モジュール105をさらに詳細に概略図示したものである。図4は、符号化モード選択モジュール105のブロック図を提供する。符号化モード選択モジュール105は、コンパレータ401と、2つの最大符号化ラインインデックス(greatest coded line index)エクストラクタ402、403、データバッファ404、符号化モード決定ユニット405、及びマルチプレクサ406とを備える。2つの最大符号化ラインインデックスエクストラクタの一方は、以後、簡略化のため、インターモードGCLIエクストラクタ402と呼ぶ。2つの最大の符号化ラインインデックスエクストラクタの他方は、以後、イントラモードGCLIエクストラクタ403と呼ぶ。
符号化モード選択モジュール105は、基本的に以下のように作動する。コンパレータ401が、符号化対象のサブバンドフレーム部分の差分表現を提供する。差分表現は、符号化対象のサブバンドフレーム部分と対応する先のサブバンドフレーム部分との間の差異に対応し、当該差異は、フレームバッファアセンブリから検索されたものである。マルチプレクサ406は、1つの入力時に符号化されるサブバンドフレーム部分と、別の入力時のサブバンドフレーム部分自体との間の差分表現を受信する。
符号化モード選択モジュール105によって、符号化アセンブリ102が、イントラモード又はインターモードいずれかでサブバンドフレーム部分を符号化する。イントラモードで、マルチプレクサ406は、線形変換されたフレームに存在するサブバンドフレーム部分を、図1に図示した量子化モジュール106に渡す。それに応じて、イントラモードで、線形変換されたフレームに存在するサブバンドフレーム部分が、符号化され、これには、量子化モジュール106及びエントロピー符号化モジュール107によるデータ圧縮が必要である。インターモードで、マルチプレクサ406は、サブバンドフレーム部分の差分表現を量子化器に渡す。それに応じて、インターモードで、サブバンドフレーム部分の差分表現が、符号化され、これには、同様に、量子化モジュール106及びエントロピー符号化モジュール107によるデータ圧縮が必要である。
従来の符号化スキームとの主な違いは、インターモードで、線形変換されたフレームの少なくとも1つの部分の差分表現が、フレーム又はその一部分の差分表現というより、元の形態で処理されることである。それに応じて、本開示に係る符号化スキームは、線形変換されたフレームの少なくとも1つの部分に線形逆変換を適用する必要がないのに対して、従来の符号化スキームには線形逆変換を適用することが必要である。よって、本開示に係る符号化スキームによって、ハードウェアもしくはソフトウェア又はその両方に関連する複雑さが少なくなった実装が可能となって、ひいては、低コスト及び低電力消費の実装が可能となる。
元のフレーム間の差異を符号化するより、変換されたフレーム間の差異を符号化しても、原理上、画質に不利な影響は及ばない。このことは、上述の可逆色変換及びウェーブレット変換が、それぞれ線形であることによる。このことは、これらの変換後の差分演算が、これらの変換前の差分演算と同等であることを示唆している。これらの変換後に差分演算を行うことにより得られた差分表現にこれらの変換の逆を適用することは、これらの変換前の演算により得られた差分表現をもたらすことになる。逆に、これらの変換前に差分演算を行うことにより得られた差分表現に関連した変換を適用することは、これらの変換後に差分演算を行うことにより得られた差分表現をもたらすことになる。
符号化モード選択モジュール105は、以下のように、イントラモード又はインターモードでサブバンドフレーム部分を符号化することを決定する。インターモードGCLIエクストラクタ402は、サブバンドフレーム部分の差分表現に含まれる4つのサンプルの8つのグループに関連する8つのGCLI値のセットを提供する。これらのGCLI値は、以後、簡略化のためインターモードGCLI値と呼ぶ。イントラモードGCLIエクストラクタ403はまた、符号化対象のサブバンドフレーム部分に含まれる4つのサンプルの8つのグループに関連する8つのGCLI値のセットを提供する。これらのGCLI値は、以後、簡略化のためイントラモードGCLI値と呼ぶ。インターモードGCLIエクストラクタ402及びイントラモードGCLIエクストラクタ403は、それぞれ、米国特許第9,332,258号明細書に記載のように作動することができる。この作動は、GCLIの抽出にあり、以下に簡単に概要を述べていく。
図5は、4つのサンプル501~504のグループからのGCLI値の抽出の概略を図示する。図5は、2進ワードの形態である4つのサンプル501~504を表したこの抽出の概念図を提供する。本例では、2進ワードは、それぞれ、値を定める階層化された複数のビットを含む。2進ワードは、さらに、それぞれ、符号ビットをさらに含むことができ、当該符号ビットは、簡略化のため図5には表していない。
階層化された複数のビットにおいて、それぞれのビットは、M、…5、4、3、2、1で示す、特定の階層位を有する。Mは、階層化された複数のビットに含まれるビット数に対応する整数値である。最高階層位Mを有するビットは、通常、最上位ビットとして示されている。最低階層位1を有するビットは、通常、最下位ビットとして示されている。
4つのサンプルのグループにおいて、同一の階層位を有するビットは、いわゆるビットプレーンを構成する。よって、4つのサンプルのグループは、階層化された複数のビットにあるビットと同程度のビットプレーンを含む。それぞれのビットプレーンは、ビットプレーンに含まれるビットの階層位に対応する階層位を有する。最上位ビットは、最上位ビットプレーンを構成し、当該最上位ビットプレーンは、最高階層位Mであり、その一方で、最下位ビットは、最下位ビットプレーンを構成し、当該最下位ビットプレーンは、最低階層位1である。
GCLI値の抽出は、ビットプレーンが、最上位ビットプレーンから始まり最下位ビットプレーンに向かう少なくとも1つの非ゼロビットを含むかを判断することにある。GCLI値は、このビットプレーンの階層位を示す。GCLI値は、例えば、整数値1が最下位ビットプレーンを示し、整数値Mが最上位ビットプレーンを示す階層位を表す整数値に対応し得る。
図5に図示した例では、Mから5のビットプレーンは、それぞれゼロビットのみを含む。このようなビットプレーンは、ゼロビットのみを含むものであり、以後、簡略化のため、ゼロビットプレーンと呼ぶ。図5に図示した実施例では、ビットプレーン4は、少なくとも1つの非ゼロビットを含む最高階層位のビットプレーンである。本例では、GCLI値は、よって、4にすることができる。
バッファは、符号化対象のサブバンドフレーム部分の差分表現に基づいてインターモードGCLIエクストラクタ402が提供する8つのGCLI値を一時的に記憶する。バッファはまた、イントラモードGCLIエクストラクタが符号化対象のサブバンドフレーム部分に基づいて提供する8つのGCLI値を一時的に記憶する。
符号化モード決定ユニット405は、インターモードGCLIエクストラクタ402が提供した8つのGCLI値の合計を計算する。この合計は、以後、インターモードGCLI合計値と呼ぶ。符号化モード決定ユニット405はまた、イントラモードGCLIエクストラクタ403が提供した8つのGCLI値の合計を計算する。この合計は、以後、イントラモードGCLI合計値と呼ぶ。
イントラモードGCLI合計値は、サブバンドフレーム部分がイントラモードで符号化される場合に達成し得るデータ圧縮係数を示す。インターモードGCLI合計値は、サブバンドフレーム部分がインターモードで符号化される場合に達成し得るデータ圧縮係数を示す。実際、上述のGCLI合計値は、それぞれデータ圧縮係数の推定値を表す。
符号化モード選択モジュール105は、イントラモードGCLI合計値がインターモードGCLI合計値より小さいか又はそれと等しい場合、イントラモードでサブバンドフレーム部分を符号化する。その目的のために、符号化モード決定ユニット405は、マルチプレクサ406が符号化対象のサブバンドフレーム部分を符号化モード選択モジュール105の出力に渡すように、マルチプレクサ406を制御する。それに応じて、イントラモードで、サブバンドフレーム部分が、量子化モジュール106、エントロピー符号化モジュール107及びデータパッケージ化モジュール108によりさらに処理される。
符号化モード選択モジュール105は、インターモードGCLI合計値がイントラモードGCLI合計値よりも小さい場合、イントラモード又はインターモードでサブバンドフレーム部分を符号化することができる。イントラモードは、符号化モード決定ユニット405が、所定の数Kの対応する先のサブバンドフレーム部分がすべてインターモードで符号化されたと判断した場合に、選択され、Kは、整数値を表している。その場合、サブバンドフレーム部分は、イントラモードで強制的に符号化され、その一方、そうでない場合は、インターモードで符号化されることになる。そうすることによって、符号化モード決定ユニット405は、一連のK+1の対応するサブバンドフレーム部分における少なくとも1つのサブバンドフレーム部分が、イントラモードで符号化されることを保証する。よって、1を超えるK+1は、対応するサブバンドフレーム部分がイントラモードで符号化される最小周波数を表すものとみなすことができる。
符号化モード選択モジュール105は、インターモードGCLI合計値がイントラモードGCLI合計値よりも小さくかつK未満の対応する先のサブバンドフレームがインターモードで符号化された場合、インターモードでサブバンドフレーム部分を符号化する。その場合、符号化モード決定ユニット405は、マルチプレクサ406が符号化対象のサブバンドフレーム部分の差分表現を符号化モード選択モジュール105に渡すように、マルチプレクサ406を制御する。それに応じて、インターモードで、差分表現が、量子化モジュール106、エントロピー符号化モジュール107及びデータパッケージ化モジュール108によりさらに処理される。
符号化モード選択モジュール105は、よって、インターモードGCLI合計値により示されたデータ圧縮係数がイントラモードGCLI合計値により示された圧縮係数より大きいか否かを評価する。上述の条件が適用される場合、サブバンドフレーム部分は、原理上、インターモードで符号化される。符号化モード選択モジュール105は、それにも拘わらず、イントラモードでの符号化が適用される所定の最小周波数を保証するために、イントラモードでサブバンドフレーム部分を強制的に符号化するように決定することができる。上述の条件が適用されない場合、サブバンドフレーム部分はイントラモードで符号化される。
符号化モード選択モジュール105は、よって、いくつかのタイプの出力データを符号化対象のサブバンドフレーム部分に提供する。符号化モード選択モジュール105は、圧縮対象のサブバンドフレームデータを提供する。サブバンドフレームデータは、線形変換されたフレームに存在するサブバンドフレーム部分又はサブバンドフレーム部分の差分表現のいずれかであって、イントラモード又はインターモードのいずれがそれぞれ選択されたかにより決まる。その上、符号化モード選択モジュール105は、符号化モードフラグを提供し、当該フラグは、サブバンドフレーム部分が、インターモードを与えるイントラモードで符号化されるかを示すものである。GCLI符号化モード選択モジュール105は、さらに、GCLI符号化値を提供し、当該値は、イントラモードGCLI値又は上述のインターモードGCLI値のいずれかであって、サブバンドフレーム部分がイントラモード又はインターモードのいずれでそれぞれ符号化されるかにより決まる。
図6は、図3に図示したものと同一の線形変換されたフレームの概略を図示するものであって、当該図では、サブバンドフレーム部分がイントラモードで符号化され、他のサブバンドフレーム部分がインターモードで符号化されている。イントラモードで符号化されたサブバンドフレーム部分は、相対的に濃い色調の矩形により示されている。インターモードで符号化されたサブバンドフレーム部分は、相対的に薄い色調の矩形により示されている。
図6は、サブバンドフレームが個別に符号化されることを明確に図示している。例えば、最低域のサブバンドフレーム301の第1のサブバンドフレーム部分は、インターモードで符号化することができるのに対して、別の低周波数のサブバンドフレーム302、303、304の第1のサブバンドフレーム部分は、イントラモードで符号化することができる。
上述のように、符号化モード決定ユニット405は、一連の線形変換されたフレームにおいて、対応のサブバンドフレーム部分がイントラモードで周期的に符号化されることを保証する。このことは、リフレッシュの仕組みとみなすことができ、これによって、復号側において、比較的良好な画質を迅速に実現することができる。動画像復号器は、図1に図示した動画像符号化器100が提供する符号化された動画像ストリーム114を、いわば、迅速に自動追尾し続けることができる。さらには、このことによっても、さらに安定した動画像送信が可能となる。符号化された動画像ストリーム114の一部分が、例えば、送信エラーにより失われた場合でも、衝撃を受けたフレームの区域を比較的迅速に復旧させることができる。
同一のサブバンドにすべて関連する一連の対応するサブバンドフレームにおいて、強制的にイントラモードで符号化されるサブバンドフレームの一部分が、強制的にイントラモードで符号化された先行するサブバンドフレームの一部分に対して位置を相違させてよい。例えば、図6を参照して、最低域のサブバンドフレームの第1のサブバンドフレーム部分301が、強制的にイントラモードで符号化されたと仮定する。その場合、後続の最低域のサブバンドフレームにおいて、第1のサブバンドフレーム部分の後に配置される第2のサブバンドフレーム部分が、強制的にイントラモードで符号化され得る。さらに後続の最低域のサブバンドフレームにおいて、第2のサブバンドフレーム部分の後に配置される第3のサブバンドフレーム部分が、強制的にイントラモードで符号化されるなどがあり得る。これは、サブバンドフレーム部分が、周期的にイントラモードで符号化されることによる、シフト又は位相シフトスキームとみなすことができる。このようなスキームは、効果的なレート割り当てと、動画像復号器が符号化された動画像ストリーム114を迅速に自動追尾し続けることとに役立つ。
サブバンドフレーム部分が強制的にイントラモードで符号化される最小の周波数は、これらのサブバンドフレーム部分が属するサブバンドフレームにより決まる。図3及び図6を参照すると、最小の周波数は、高周波数のサブバンドフレーム305~307に対する周波数よりも、低周波数のサブバンドフレーム301~304に対する周波数の方が高くなる場合がある。すなわち、最小周波数の逆数を表す上述の数K+1は、低周波数のサブバンドフレーム301~304に対するものよりも、高周波数のサブバンドフレーム305~307に対するものの方が高くなる場合がある。これによって、圧縮の有効性をそれほど損なうことなく、復号側の許容可能な質の低解像度の動画像表現と、少し後の高解像度の動画像表現とを迅速に得ることができる。例えば、一実施形態では、低解像度の表現が、4つのフレームの後に得られ、その一方で、高解像度の表現が、32のフレームの後に得られる。
再度図1を参照すると、量子化モジュール106は、符号化モード選択モジュール105が提供するサブバンドフレームデータを量子化する。それに応じて、量子化モジュール106は、量子化されたサブバンドフレームデータを提供する。量子化モジュール106は、サブバンドフレームデータを量子化する際量子化係数を適用する。量子化係数が相対的に高い場合、サブバンドフレームデータに、相対的に高いデータ圧縮を提供する粗い量子化が行われる。逆に、量子化係数が相対的に低い場合、サブバンドフレームデータに、相対的に低いデータ圧縮を提供する細かい量子化が行われる。量子化係数は、レート割り当てモジュール109により、画質を最適化しながら符号化された動画像ストリーム114が所望のデータレートを有するように調整することができる。
エントロピー符号化モジュール107は、エントロピー符号化処理を量子化されたサブバンドフレームデータに適用する。エントロピー符号化処理は、例えば、すでに上に述べた米国特許第9,332,258号明細書に記載の処理を含み得る。その場合、エントロピー符号化モジュール107は、GCLI符号化値を上述の符号化モード選択モジュール105から受信する。GCLI符号化値は、量子化されたサブバンドフレームデータにおいてゼロビットプレーンを示す。エントロピー符号化モジュール107は、次に、これらのゼロビットプレーンを除去することができる。実際には、ゼロビットプレーンは、サブバンドフレームデータにこれらのビットプレーンがある場所を示すGCLI符号化値と置き換えられる。エントロピー符号化モジュール107はまた、エントロピー符号化をGCLI符号化値に、これらの値ができる限り少ないデータで表現されるように適用する。米国特許第9,332,258号明細書は、その効果に用いることのできるエントロピー符号化技術を記載している。
ゼロビットプレーンを除去することに加えて、エントロピー符号化モジュール107はまた、量子化されたサブバンドフレームデータにおいてサンプルをトランケートすることができる。このようなトランケーションには、1つ以上の最下位ビットプレーンを除去する必要のある場合がある。これもまた、米国特許第9,332,258号明細書に記載されている。レート割り当てモジュール109は、トランケーションを調整し、1つ以上の最下位ビットプレーンを除去すべきか否か、もしそうなら、その数がどれくらいかを決定する。レート割り当てモジュール109は、符号化された動画像ストリーム114が、画質を最適化しながら所望のデータレートを有することを達成するために、トランケーションを調整することができる。
データパッケージ化モジュール108は、いくつかのタイプのデータを符号化された動画像ストリーム114にパッケージ化する。これは、エントロピー符号化モジュール107が提供するエントロピーが符号化されたサブバンドフレームデータを含む。これは、さらに、例えば、エントロピーが符号化されたGCLI値と、符号化モードフラグと、量子化モジュール106が適用した量子化係数とを含み得る。
レート割り当てモジュール109は、量子化モジュール106及びエントロピー符号化モジュール107を、符号化モード選択モジュール105が提供するGCLI符号化値に基づいて制御することができる。GCLI符号化値によって、ゼロビットプレーンのみを除去することにより得られるデータ圧縮係数を推定することができる。レート割り当てモジュール109は、このデータ圧縮係数を、符号化された動画像ストリーム114の所望のデータレートを表す所望のデータ圧縮係数と比較することができる。もし、例えば、上述のデータ圧縮係数間の差が相対的に大きい場合、レート割り当てモジュール109が、相対的に大きな量子化係数を適用すべきかもしくは相対的に大きなトランケーションを適用すべきか、又はその両方を適用すべきかを決定することができる。
上述のように、参照フレームバッファアセンブリ112は、すでに符号化された先に線形変換されたフレームの表現を含み得る。この表現は、今回符号化される線形変換されたフレームのサブバンドフレーム部分をインターモードで符号化するための基準を構成する。先に線形変換されたフレームの表現は、以下のように得られる。
逆量子化モジュール110は、量子化モジュール106が提供する量子化されたサブバンドフレームデータに逆量子化を適用する。それに応じて、逆量子化モジュール110は、符号化モード選択モジュール105が生成したサブバンドフレームデータのさらに粗い表現とみなすことができる逆量子化されたサブバンドフレームデータを提供する。イントラモードの符号化の場合、逆量子化されたサブバンドフレームデータは、線形変換されたフレームに存在するサブバンドフレーム部分のさらに粗い表現である。インターモードの符号化の場合、逆量子化されたサブバンドフレームデータは、サブバンドフレーム部分の差分表現のさらに粗い表現である。
再構成モジュール111は、インターモードで符号化する場合、逆量子化されたサブバンドフレームデータを処理する。再構成モジュール111は、上述の対応する先のサブバンドフレームを参照フレームバッファアセンブリ112から検索する。すなわち、対応する先のサブバンドフレームは、逆量子化されたサブバンドフレームデータが生成されたことに基づいてサブバンドフレーム部分の差分表現を生成することに使用されている。再構成モジュール111は、次に、対応する先のサブバンドフレーム部分を、逆量子化されたサブバンドフレームデータに追加する。それに応じて、今回符号化されたサブバンドフレーム部分の再構成版が得られる。再構成モジュール111は、サブバンドフレーム部分の再構成版を参照フレームバッファアセンブリ112に適用する。
再構成モジュール111は、イントラモードで符号化する場合、逆量子化されたサブバンドフレームデータを直接参照フレームバッファアセンブリ112に渡す。すなわち、その場合、逆量子化されたサブバンドフレームデータが、サブバンドフレーム部分の再構成版を構成する。
よって、符号化プロセスでは、参照フレームバッファアセンブリ112は、再構成されたサブバンドフレームを共同で形成できる、再構成された複数のサブバンドフレーム部分を連続して受信する。さらに一般的には、参照フレームバッファアセンブリ112は、線形変換されたフレームの再構成版を共同で形成する、再構成されたサブバンドフレームを連続して受信する。理想的には、線形変換されたフレームの再構成版は、以後提示していく実施形態の動画像復号器における線形変換されたフレームの復号版と対応する。すなわち、一般的には、データを符号化するための基準は、理想的には、同一のデータを復号するために用いる基準と対応させるべきである。よって、データを復号するために用いる基準が先に復号されたデータからなる場合、そのデータを符号化するために用いる基準は、元の形態のデータというより、先に符号化されたデータの復号版であるべきである。
図7は、参照フレームバッファアセンブリ112の概略を図示するものである。図7は、参照フレームバッファアセンブリ112のブロック図を提供する。参照フレームバッファアセンブリ112は、基本エントロピー符号化器701、バッファメモリ702、基本エントロピー復号器703を備える。
参照フレームバッファアセンブリ112は、基本的に以下のように作動する。基本エントロピー符号化器701が、サブバンドフレーム部分の再構成版にGCLI抽出を適用する。このGCLI抽出は、図5に関連して前述したものと類似したものにできる。基本エントロピー符号化器701は、サンプルの各グループにおいてゼロビットプレーンを除去する。基本エントロピー符号化器701は、さらに、1つ以上の最下位ビットプレーンを除去することによりサンプルをトランケートすることができる。それに応じて、ゼロの1つ以上の最上位ビットがなく、トランケートされた1つ以上の最下位ビットがない場合がある圧縮されたサンプルが得られる。
基本エントロピー符号化器701は、サブバンドフレーム部分の圧縮再構成版を生成し、当該圧縮再構成版は、圧縮されたサンプルを含む。圧縮再構成版は、図4及び図5に関連して本明細書に上述した、GCLI抽出により得られたGCLI値をさらに含み得る。圧縮再構成版は、エントロピーが符号化された形態でGCLI値を含み得る。
バッファメモリ702は、サブバンドフレーム部分の圧縮再構成版を記憶する。それに応じて、符号化プロセスにおいて、バッファメモリ702は、圧縮再構成されたサブバンドフレームを共同で形成することができる圧縮再構成されたサブバンドフレーム部分を連続して記憶する。さらに一般的には、参照フレームバッファアセンブリ112は、線形変換されたフレームの圧縮再構成版を共同で形成する、圧縮再構成されたサブバンドフレームを連続して記憶する。
基本エントロピー復号器703は、圧縮再構成されたサブバンドフレーム部分を復元し、当該サブバンドフレーム部分は、対応する後のサブバンドフレーム部分をインターモードで符号化することを要求される場合がある。このように、対応する先のサブバンドフレームの上述の表現が得られる。
図1に図示した動画像符号化器100は、よって、フレームバッファの圧縮を適用する。それに応じて、サブバンドフレーム、さらに一般的には、インターモードで符号化するのに必要とされる線形変換されたフレームを記憶するのには、比較的小容量のメモリで十分である。さらには、フレームバッファ圧縮によって、再構成されたサブバンドフレーム部分に関わるデータのバッファメモリ702への送受信に関連する帯域幅の要件が緩和される。このことは、バッファメモリ702が外部のメモリ回路の形態である一方で、画像符号化器100の他のエンティティが単一の処理回路に組み込まれている場合の実施形態において、大きな利点となり得る。このような実施形態及び他の実施形態において、緩和された帯域幅条件は、電力消費を相対的に低下させることに一般的に役立つ。
しかしながら、フレームバッファの圧縮は、ある程度画質に影響する場合がある。これは、インターモードで符号化するために利用可能である、対応する先のサブバンドフレーム部分の表現が、対応する先のサブバンドフレーム部分自体のさらに粗い版であることによる。それでもなお、多くの実施形態において、画質の損失が視覚的にほとんど気づかれないほどであるか又は視覚的にまったく気づかれないフレームバッファ圧縮を構成することができる。すなわち、フレームバッファの圧縮は、視覚的に損失がないものにできる。そのうえ、原理上、フレームバッファの圧縮は、復号を開始してから十分な画質に達するまでの間の遅延には影響しない。
図8は、動画像復号器の概略を図示しており、当該動画像複合器は、ブロック図で示している。動画像複合器は、図1~7に関連して上述した動画像符号化器100により生成された符号化された動画像ストリーム114を受信し復号することができる。動画像複合器は、アンパックモジュール801、エントロピー復号・逆量子化モジュール802、復号再構成モジュール803、復号バッファメモリ804、逆ウェーブレット変換・色変換モジュール805を備える。
動画像複合器は、基本的に以下のように作動する。アンパックモジュール801が、上述のパックモジュールにより実行される処理と逆の処理を実行する。それに応じて、アンパックモジュール801は、符号化された動画像ストリーム114から、エントロピーが符号化されたサブバンドフレームデータ、エントロピーが符号化されたGCLI値及び符号化モードフラグなど種々のタイプのデータを検索する。
エントロピー復号・逆量子化モジュール802は、上述のエントロピー符号化モジュール107が実行する処理と逆の処理を実行する。例えば、エントロピー復号・逆量子化モジュール802は、エントロピーが符号化されたGCLI値からGCLI符号化値を検索することができる。エントロピー復号・逆量子化モジュール802は、次に、除去されたゼロビットプレーンをこれらのGCLI符号化値に基づいて元に戻すことができる。エントロピー復号・逆量子化モジュール802は、さらに、ダミービットを追加して、トランケーションの結果除去された最下位ビットを置き換えることができる。それに応じて、量子化されたサブバンドフレームデータが、再現され、次に、逆量子化処理を受ける。逆量子処理は、符号化された動画像ストリーム114にパックされている量子化係数に基づく。それに応じて、エントロピー復号・逆量子化モジュール106は、復号されたサブバンドフレームデータを提供する。
復号再構成モジュール803は、符号化モードフラグに基づいて復号されたサブバンドフレームデータを処理する。符号化モードフラグがイントラモードでの符号化を示す場合、復号されたサブバンドフレームデータは、線形変換されたフレームをさらに処理することなく再構成するように直接用いることができるサブバンドフレーム部分の復号版である。その場合、復号再構成モジュール803は、サブバンドフレーム部分の復号版を一時記憶用の復号バッファメモリ804に適用する。さらに、サブバンドフレーム部分の復号版は、逆ウェーブレット変換・色変換モジュール805に適用される。
符号化モードフラグがインターモードでの符号化を示す場合、復号されたサブバンドフレームデータは、サブバンドフレーム部分の差分表現の復号版である。その場合、復号再構成モジュール803は、対応の先に復号されたサブバンドフレーム部分を復号バッファメモリ804から検索する。復号再構成モジュール803は、次に、対応の先に復号されたサブバンドフレーム部分をサブバンドフレーム部分の差分表現の復号版に追加する。これに応じて、サブバンドフレーム部分の復号版が、得られ、復号バッファメモリ804及び逆ウェーブレット変換・色変換モジュール805に適用される。
よって、従来の動画像複合器と逆に、復号バッファメモリ804は、空間領域にある、完全に復号されたフレームというよりは、線形変換されたフレームの一部であるサブバンドフレームを一時的に記憶する。すなわち、図8に図示した動画像複合器800において、線形変換されたフレームは、完全に復号されたフレームというよりは、インターモードで復号するための基準として機能するものである。
逆ウェーブレット変換・色変換モジュール805は、ウェーブレット変換の逆及び可逆色変換の逆をサブバンドフレーム部分の復号版に適用する。すなわち、線形逆変換が、サブバンドフレーム部分の復号版に適用される。線形逆変換を、サブバンドフレーム部分の連続して復号された版に適用することによって、線形逆変換が、線形変換されたフレームの復号版を構成するサブバンドフレームの復号版に適用される。すると、図1に図示した動画像符号化器100により符号化されたフレームの復号版が得られる。
留意事項
図面を参照して上述した実施形態は、図示目的で提示している。本発明は、多数の各種方法で実施可能である。これを図示するために、いくつかの代替物を簡単に示す。
本発明は、動画像圧縮もしくは動画像復元又はその両方に関連する多数のタイプの製品又は方法において適用可能である。例えば、本発明は、動画像圧縮以外の少なくとも1つの機能を実施できる多機能の集積回路において適用可能である。
動画像符号化器及び動画像復号器を本発明にしたがって実施する多数の各種方法がある。提示した実施形態におけるモジュールのいずれかは、専用のものであるか又はプログラム可能なものである電気回路によりもしくは適切にプログラムされたプロセッサにより、又はそれらの組合せにより実施可能である。コンピュータプログラムは、動画像符号化器により実行される1つ以上の処理を定義することができ、当該動画像符号化器は、図1~図7に関連して説明している。同様に、コンピュータプログラムは、動画像符号化器により実行される1つ以上の処理を定義することができ、当該動画像符号化器は、図8に関連して説明している。この点において、図1、図4、図7及び図8のブロック図は、それぞれ、少なくとも部分的に、このようなコンピュータプログラムのフローチャート図並びにコンピュータプログラムを実行するときにプロセッサが実行し得る方法を表すものとみなして構わない。例えば、図1に図示した可逆色変換モジュールは、色変換ステップを表すものとみなして構わない。同様に、他のモジュールは、方法のステップを表すものとみなして構わない。
本発明に係る製品又は方法において線形変換を実施する多数の各種方法がある。提示した実施形態では、線形変換は、可逆色変換を含む。他の実施形態では、この変換なしで済ませることができる。提示した実施形態では、線形変換は、ウェーブレット変換を含む。他の実施形態では、線形変換は、例えば、離散コサインベースの変換であってよい。
本発明に係る製品又は方法において圧縮データの符号化を実施する多数の各種方法がある。提示した実施形態では、このような符号化には、GCLI抽出、ゼロビットプレーンの除去及びトランケーションが必要である。他の実施形態では、他のエントロピー符号化スキームを用いてよい。
本発明に係る製品に参照フレームバッファアセンブリを実装する又は本発明に係る方法を実施する多数の各種方法がある。提示した実施形態では、参照フレームバッファアセンブリは、フレームバッファの圧縮を用いる。他の実施形態では、参照フレームバッファアセンブリがデータ圧縮用の動画像符号化器及びデータ圧縮用の動画像復号器を備える必要がなくなるように、フレームバッファの圧縮を省いてよい。
インターモードで符号化するため別の線形変換されたフレームの対応する部分の表現を得る多数の各種方法がある。提示した実施形態では、対応する部分は、先に線形変換されたフレームに同一の位置を有する部分である。すなわち、動き予測又は動き補償は用いない。他の実施形態では、動き予測を、対応する部分を特定するために用いてよい。さらに、インターモードで符号化するため用いる対応する部分が、必ずしも、先に線形変換された単一のフレームに基づくものにする必要はない。例えば、対応する部分は、先に線形変換された2つ以上のフレームにおいて部分を組合せたものに基づくものとしてよい。
一般に、本発明を実施する多数の各種方法があり、当該方法により、各種実施には各種トポロジーを具え得る。任意の所定のトポロジーでは、単一のエンティティが、いくつかの機能を実行可能であり、又はいくつかのエンティティは、単一の機能を共同で実行可能である。この点で、図面は、非常に図式的である。
図面に関連して記載した実施形態は、本発明を限定するというより本発明を図示していることをここまで述べてきた。本発明は、添付の特許請求の範囲内の多数の代替方法で実施可能である。特許請求の範囲の均等物の意味及び範囲内のすべての変更は、その範囲内に含まれることとなる。ある請求項のいかなる参照符号も、その請求項を限定するものと解釈すべきではない。請求項の中の「備える(comprise)」という動詞は、その請求項に挙げられた要素以外の他の要素またはステップの存在を除外しない。同じことが、「含む(include)」及び「含有する(contain)」などの同様の動詞に当てはまる。製品に関する請求項の中の単数形の要素への言及は、その製品が複数のこのような要素を含み得ることを除外しない。同様に、方法に関する請求項の中の単数形のステップへの言及は、その方法が複数のこのようなステップを含み得ることを除外しない。各従属請求項が追加の各特徴を定義するという単なる事実は、その請求項に反映される特徴以外の追加の特徴の組み合わせを除外しない。

Claims (15)

  1. 一連のフレームを符号化するように適合された符号化器(100)であって、当該符号化器は、
    符号化対象の前記一連のフレーム中のフレームよりもエントロピーが少ない一連の線形変換されたフレームを得るように、前記一連のフレームにフレームごとに線形変換を適用するように適合された線形変換アセンブリ(101)と、
    前記線形変換されたフレームよりもデータ量が少ない一連の符号化されたフレームを得るように、前記一連の線形変換されたフレームを符号化するように適合された符号化アセンブリ(102)と、を備え、
    前記符号化アセンブリは、線形変換されたフレームの少なくとも1つの部分を、前記符号化アセンブリが前記インターモードで符号化された前記線形変換されたフレームの少なくとも1つの部分の差分表現を提供するインターモードで符号化するように適合され、前記差分表現は、一方で、前記形変換されたフレームの少なくとも1つの部分と、他方で、少なくとも1つの他の線形変換されたフレームの対応する少なくとも1つの部分の表現との間の差分に対応しており、前記符号化アセンブリは、符号化されたフレームの少なくとも1つの部分を得るように、データ圧縮を前記線形変換されたフレームの少なくとも1つの部分の前記差分表現に適用する符号化器。
  2. 前記符号化アセンブリ(102)は、前記少なくとも1つの他の線形変換されたフレームの前記対応する少なくとも1つの部分を符号化することにより得られた少なくとも1つの符号化されたフレームの対応する少なくとも1つの部分に前記データ圧縮の逆を適用することにより、前記少なくとも1つの他の線形変換されたフレームの前記対応する少なくとも1つの部分の表現を得るように適合された請求項1に記載の符号化器。
  3. 前記符号化アセンブリ(102)は、前記データ圧縮が前記線形変換されたフレーム部分に直接適用されるイントラモードで線形変換されたフレームの部分を符号化する一方で、前記線形変換されたフレームの別の部分が前記インターモードで符号化されるように適合された請求項1及び2のいずれかに記載の符号化器。
  4. 前記符号化アセンブリ(102)は、線形変換されたフレームの部分について、以下の条件、前記線形変換されたフレームの部分が前記インターモードで符号化される場合、前記イントラモードで前記線形変換されたフレームの部分を符号化することにより得られる符号化版よりもデータ量が少ない前記線形変換されたフレームの部分の符号化版が得られるという条件に適合するか否かを評価するように適合され、前記符号化アセンブリは、前記条件に適合する場合に前記線形変換されたフレームの部分を前記インターモードで符号化し、前記条件に適合しない場合に前記イントラモードで前記線形変換されたフレーム部分を符号化するように適合された請求項3に記載の符号化器。
  5. 前記符号化アセンブリ(102)は、各線形変換されたフレーム部分を前記イントラモードで周期的に符号化するように適合された請求項3及び4のいずれかに記載の符号化器。
  6. 前記符号化アセンブリ(102)は、最小周波数を伴って同一の位置を有する各線形変換されたフレーム部分を前記イントラモードで周期的に符号化し、同一の前記最小周波数を伴って別の同等の位置を有するが、上述の各前記線形変換されたフレーム部分のイントラモードの符号化に対して位相シフトされた各線形変換されたフレーム部分を前記イントラモードで周期的に符号化するように適合された請求項5に記載の符号化器。
  7. 前記符号化アセンブリ(102)は、最小周波数を伴って線形変換されたフレームのグループに属する各線形変換されたフレーム部分を前記イントラモードで周期的に符号化し、異なる最小周波数を伴って線形変換されたフレーム部分の別のグループに属する各線形変換されたフレーム部分を前記イントラモードで周期的に符号化するように適合された請求項5及び6のいずれかに記載の符号化器。
  8. 前記線形変換アセンブリ(101)は、各サブバンドを定めるように適合され、これにより、前記線形変換されたフレーム部分の一方のグループ及び他方のグループは、異なるサブバンドと関連付けられる請求項7に記載の符号化器。
  9. 前記符号化アセンブリ(102)が適用する前記データ圧縮は、最大符号化ラインインデックス符号化処理を含む請求項1~8のいずれかに記載の符号化器。
  10. 前記符号化アセンブリ(102)が適用する前記データ圧縮は、量子化処理を含む請求項1~9のいずれかに記載の符号化器。
  11. 前記符号化アセンブリ(102)は、復号された線形変換フレームを得るように符号化されたフレームを復号するように適合され、前記符号化アセンブリは、前記復号された線形変換フレームの圧縮版を得るように、前記復号された線形変換フレームにデータ記憶の圧縮を適用するように適合され、前記符号化アセンブリは、前記復号された線形変換フレームの圧縮版をフレームバッファメモリ(702)に記憶するように適合され、前記符号化アセンブリは、前記インターモードでの符号化対象の線形変換されたフレームの少なくとも対応する版の差分表現を提供するために使用される線形変換されたフレームの少なくとも1つの部分の表現が得られる前記復号された線形変換フレームの復元版を得るように、前記データ記憶の圧縮の逆を前記復号された線形変換フレームの圧縮版に適用するように適合された請求項1~10のいずれかに記載の符号化器。
  12. 前記符号化アセンブリ(102)が前記復号された線形変換フレームに適用する前記データ記憶の圧縮は、最大符号化ラインインデックス符号化処理を含む請求項11に記載の符号化器。
  13. 一連のフレームを符号化する方法であって、当該方法は、
    符号化対象の前記一連のフレーム中のフレームよりエントロピーが低い一連の線形変換されたフレームを得るように、前記一連のフレームにフレームごとに線形変換を適用する線形変換ステップと、
    前記一連の線形変換されたフレームを、前記線形変換されたフレームよりもデータ量が少ない一連の符号化されたフレームを得るように符号化する符号化ステップと、
    前記符号化ステップにおいて、線形変換されたフレームの少なくとも1つの部分を、前記線形変換されたフレームの少なくとも1つの部分の差分表現を得られるインターモードで符号化し、前記差分表現は、一方で前記線形変換されたフレームの少なくとも1つの部分と、他方で少なくとも1つの他の線形変換されたフレームの対応する少なくとも1つの部分の表現との間の差分に対応するものであって、データ圧縮を、符号化されたフレームの少なくとも1つの部分を得るように前記線形変換されたフレームの少なくとも1つの部分の差分表現に適用する符号化方法。
  14. 請求項13に記載の前記方法を前記符号化器に実行させることができるインストラクションのセットを含む、符号化器(100)用のコンピュータプログラム。
  15. 請求項1~12のいずれかに記載の符号化器により得られる前記一連の符号化されたフレームを復号するように適合された復号器(800)。
JP2021573589A 2019-06-12 2020-06-12 符号化器及び一連のフレームを符号化する方法 Pending JP2022536512A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19179802.4A EP3751852A1 (en) 2019-06-12 2019-06-12 Encoder and method of encoding a sequence of frames
EP19179802.4 2019-06-12
PCT/EP2020/066389 WO2020249790A1 (en) 2019-06-12 2020-06-12 Encoder and method of encoding a sequence of frames

Publications (1)

Publication Number Publication Date
JP2022536512A true JP2022536512A (ja) 2022-08-17

Family

ID=66857680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021573589A Pending JP2022536512A (ja) 2019-06-12 2020-06-12 符号化器及び一連のフレームを符号化する方法

Country Status (10)

Country Link
US (2) US11924470B2 (ja)
EP (3) EP3751852A1 (ja)
JP (1) JP2022536512A (ja)
KR (1) KR20220019285A (ja)
CN (1) CN114245989A (ja)
AU (1) AU2020291116A1 (ja)
CA (1) CA3141246A1 (ja)
ES (1) ES2937085T3 (ja)
IL (1) IL288888B2 (ja)
WO (1) WO2020249790A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4266685A1 (en) * 2022-04-22 2023-10-25 intoPIX s.a. Video encoder comprising a frame buffer assembly
EP4270948A1 (en) 2022-04-26 2023-11-01 intoPIX s.a. Video encoding applying a refresh scheme
EP4270947A1 (en) 2022-04-26 2023-11-01 intoPIX s.a. Video encoding applying a refresh scheme

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5585852A (en) * 1993-06-16 1996-12-17 Intel Corporation Processing video signals for scalable video playback using independently encoded component-plane bands
US6031940A (en) * 1996-11-27 2000-02-29 Teralogic, Inc. System and method for efficiently encoding video frame sequences
US6628716B1 (en) * 1999-06-29 2003-09-30 Intel Corporation Hardware efficient wavelet-based video compression scheme
CN101335892B (zh) * 2008-04-25 2010-06-09 太原科技大学 基于帧内模式决策的混合分布式视频编码方法
US9185422B2 (en) * 2010-07-15 2015-11-10 Qualcomm Incorporated Variable localized bit-depth increase for fixed-point transforms in video coding
JP2013026952A (ja) * 2011-07-25 2013-02-04 Sony Corp 画像処理方法、エンコード装置、デコード装置および画像処理装置
US9332258B2 (en) 2013-03-01 2016-05-03 intoPIX SA Method and device for display stream compression
US20170163988A1 (en) * 2015-12-08 2017-06-08 Samsung Display Co., Ltd. Systems and method of using compressed reference frames in video codecs
PL3556097T3 (pl) * 2016-12-19 2022-04-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie obrazu z wykorzystaniem adaptacji predykcji zależnej od podpasma do enkodowania entropijnego gcli

Also Published As

Publication number Publication date
IL288888B2 (en) 2024-08-01
ES2937085T3 (es) 2023-03-23
US11924470B2 (en) 2024-03-05
AU2020291116A1 (en) 2022-01-27
CN114245989A (zh) 2022-03-25
CA3141246A1 (en) 2020-12-17
IL288888B1 (en) 2024-04-01
WO2020249790A1 (en) 2020-12-17
EP3984225A1 (en) 2022-04-20
EP3984225B1 (en) 2022-10-26
US20240196014A1 (en) 2024-06-13
EP3751852A1 (en) 2020-12-16
US20220248057A1 (en) 2022-08-04
EP4175298A1 (en) 2023-05-03
IL288888A (en) 2022-02-01
KR20220019285A (ko) 2022-02-16

Similar Documents

Publication Publication Date Title
KR100818928B1 (ko) 색 공간 스케일러블 비디오 코딩 방법 및 이를 위한 장치
KR100703749B1 (ko) 잔차 재 추정을 이용한 다 계층 비디오 코딩 및 디코딩방법, 이를 위한 장치
KR100880039B1 (ko) 웨이블릿 기반 이미지 코덱에서의 부호화 이득을 달성하는방법 및 시스템
KR100736086B1 (ko) 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치
US20240196014A1 (en) Encoder and method of encoding a sequence of frames
WO2008004769A1 (en) Image encoding/decoding method and apparatus
JP2004531924A (ja) 信号圧縮装置及び方法
US20060013311A1 (en) Video decoding method using smoothing filter and video decoder therefor
KR20070077059A (ko) 엔트로피 부호화/복호화 방법 및 장치
KR100643269B1 (ko) Roi를 지원하는 영상 코딩 방법 및 장치
US20240040160A1 (en) Video encoding using pre-processing
KR100412176B1 (ko) 문자와 이미지가 포함된 문서의 압축, 복원 시스템 및방법
US20090074059A1 (en) Encoding method and device for image data
KR20070029776A (ko) 색 공간 스케일러블 비디오 코딩 방법 및 이를 위한 장치
WO2023111574A1 (en) Digital image processing
Shum et al. Image Compression Techniques
Akramullah et al. Digital Video Compression Techniques
Mandal Digital image compression techniques
Young Software CODEC algorithms for desktop videoconferencing
Demaude et al. Using interframe correlation in a low-latency and lightweight video codec
WO2006078107A2 (en) Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking
KR20090059707A (ko) 폐루프 필터링을 이용한 스케일러블 비디오 인코딩 장치 및그 방법

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20220210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230526

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240604