JP2014241579A - 映像圧縮装置 - Google Patents
映像圧縮装置 Download PDFInfo
- Publication number
- JP2014241579A JP2014241579A JP2014046923A JP2014046923A JP2014241579A JP 2014241579 A JP2014241579 A JP 2014241579A JP 2014046923 A JP2014046923 A JP 2014046923A JP 2014046923 A JP2014046923 A JP 2014046923A JP 2014241579 A JP2014241579 A JP 2014241579A
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- unit
- prediction
- value
- minimum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
【課題】圧縮処理における予測精度が高く、動作周波数及びスループットを向上させることができる映像圧縮装置を提供する。
【解決手段】予測画素生成部は、入力原画画素の圧縮対象画素に対し、ラインメモリの所定位置から読み出したローカルデコード画素を上参照画素とし、圧縮対象画素の左に位置する入力原画画素を左参照画素として定義される複数の予測モードの予測画素値を生成する。予測モード決定部は、所定数連続する入力原画画素からなるユニットを処理単位とし、圧縮対象画素値と予測画素値との差分値に基づいて、ユニットにおける予測誤差を算出し、予測誤差が最小となる最小予測モードを選択する。DPCM部は、ラインメモリ内のローカルデコード画素を上参照画素、1サイクル前のローカルデコード画素値を左参照画素として、最小予測モードに対応する最小予測画素値と圧縮対象画素との最小差分値を生成する。
【選択図】図1
【解決手段】予測画素生成部は、入力原画画素の圧縮対象画素に対し、ラインメモリの所定位置から読み出したローカルデコード画素を上参照画素とし、圧縮対象画素の左に位置する入力原画画素を左参照画素として定義される複数の予測モードの予測画素値を生成する。予測モード決定部は、所定数連続する入力原画画素からなるユニットを処理単位とし、圧縮対象画素値と予測画素値との差分値に基づいて、ユニットにおける予測誤差を算出し、予測誤差が最小となる最小予測モードを選択する。DPCM部は、ラインメモリ内のローカルデコード画素を上参照画素、1サイクル前のローカルデコード画素値を左参照画素として、最小予測モードに対応する最小予測画素値と圧縮対象画素との最小差分値を生成する。
【選択図】図1
Description
本発明の実施形態は、映像圧縮装置に関する。
近年、ディスプレイインターフェース、カメラインターフェースでの画像圧縮やSoC(System−on−a−Chip)内部のバスにおける画像圧縮では、圧縮器に毎サイクル1画素が入力され、伸長器は毎サイクル1画素を伸張しなければならないため、高スループットが要求されている。このような画像圧縮は回路規模が小さいことが求められるが、H.264等のブロック単位での圧縮では回路規模が大きいため、画素単位での予測値との差分を取るDPCM(Differential Pulse Code Modulation)ベースの圧縮が用いられている。DPCMベースの圧縮で高圧縮率を実現するためには、予測値の予測精度を上げることが必要であり、多数の予測モードを備えておくことが重要である。
しかしながら、従来技術では、1画素/サイクルのスループットを実現するために、DPCMでの多数の予測モードを備えると、圧縮器側の動作周波数が上がらない問題があった。すなわち、1サイクル以内に次の圧縮対象画素の予測モード決定処理に必要なローカルデコード画素を生成しなければならないが、このパスの回路遅延が大きいため、動作周波数が上がりにくかった。
本発明は、上記従来技術の問題に鑑み、圧縮処理における予測精度が高く、かつ、動作周波数およびスループットを向上させることができる映像圧縮装置を提供することを目的とする。
本発明の一実施形態に係る映像圧縮装置は、ラスタスキャン順に入力原画画素を格納する入力原画バッファと、ローカルデコード画素を格納するラインメモリと、前記入力原画画素の中から順次選択した圧縮対象画素に対して、前記ラインメモリの所定位置から読み出したローカルデコード画素を上参照画素とし、前記圧縮対象画素の左に位置する入力原画画素を左参照画素として定義される複数の予測モードの予測画素値をそれぞれ生成する予測画素生成部と、所定数連続する入力原画画素からなるユニットを処理単位とし、このユニット内の前記圧縮対象画素の画素値と前記予測画素値との差分値に基づいて、前記ユニットにおける予測誤差を算出し、前記複数の予測モードの中から前記予測誤差が最小となる最小予測モードを選択する予測モード決定部と、前記ラインメモリ内のローカルデコード画素を上参照画素とし、圧縮対象画素の1サイクル前のローカルデコード画素値を左参照画素として、前記最小予測モードに対応する最小予測画素値を生成し、前記最小予測画素値と圧縮対象画素との最小差分値を生成するDPCM部と、前記最小差分値を量子化した量子化データを生成する量子化部と、前記量子化データを伝送符号に変換する符号化部と、前記量子化データを逆量子化した逆量子化データを生成する逆量子化部と、前記逆量子化データと前記最小予測画素値を用いて前記圧縮対象画素に対するローカルデコード画素値を生成し、これを前記ラインメモリに順次格納する逆DPCM部と、を備えることを特徴とする。
以下、本発明の実施形態について図面を用いて詳細に説明する。
<実施形態1>
図1は、本発明の実施形態1に係る映像圧縮装置100の全体構成例を示すブロック図である。映像圧縮装置100は、入力原画バッファ101、ローカルデコード画素収納ラインメモリ102、予測画素生成部103、予測モード決定部104、DPCM部105、量子化部106、逆量子化部107、逆DPCM部108、ローカルデコードレジスタ109、および符号化部110から構成されている。図1の中の破線で囲まれた領域は、後述する4つのパイプラインPL1〜PL4と各部との対応関係を示している。入力原画バッファ101は、圧縮対象となる入力画像(以下、「原画」とも呼ぶ。)を順次読込み、一時格納するメモリである。本実施形態では、ラスタスキャン順に毎サイクル1画素(スループットは1画素/cycle)で読み込まれ、各構成要素は毎サイクル1画素ずつ処理されていく。ラスタスキャンとは、二次元の画像の左上から右下まで水平走査線を高速に走査することによって、画像を得る走査方式である。ローカルデコード画素収納ラインメモリ102は、圧縮対象となる画像(原画)の画素(以下、「圧縮対象画素」という。)から生成されたローカルデコード画素を格納するメモリである。ローカルデコード画素の生成方法の詳細については後述する。
<実施形態1>
図1は、本発明の実施形態1に係る映像圧縮装置100の全体構成例を示すブロック図である。映像圧縮装置100は、入力原画バッファ101、ローカルデコード画素収納ラインメモリ102、予測画素生成部103、予測モード決定部104、DPCM部105、量子化部106、逆量子化部107、逆DPCM部108、ローカルデコードレジスタ109、および符号化部110から構成されている。図1の中の破線で囲まれた領域は、後述する4つのパイプラインPL1〜PL4と各部との対応関係を示している。入力原画バッファ101は、圧縮対象となる入力画像(以下、「原画」とも呼ぶ。)を順次読込み、一時格納するメモリである。本実施形態では、ラスタスキャン順に毎サイクル1画素(スループットは1画素/cycle)で読み込まれ、各構成要素は毎サイクル1画素ずつ処理されていく。ラスタスキャンとは、二次元の画像の左上から右下まで水平走査線を高速に走査することによって、画像を得る走査方式である。ローカルデコード画素収納ラインメモリ102は、圧縮対象となる画像(原画)の画素(以下、「圧縮対象画素」という。)から生成されたローカルデコード画素を格納するメモリである。ローカルデコード画素の生成方法の詳細については後述する。
予測画素生成部103は、圧縮対象画素に対して所定の相対位置にある複数の参照画素に基づいて圧縮対象画素の予測画素値を生成する回路である。本実施形態では、予測画素生成部103は、圧縮対象画素の上参照画素としてローカルデコード画素収納ラインメモリ102に格納されたローカルデコード画素を使用するとともに、圧縮対象画素の左参照画素として入力原画バッファ101から読み出した原画画素を使用し、圧縮対象画素の位置において、後述する複数の予測モードに対応する複数個の予測画素値を生成する。
図2は、予測画素生成部103が複数の予測モードに対応する予測画素値を生成する方法を説明する図であり、予測画素値を算出する際に参照する画素および算出式は予測モードによって異なっている。図2の“Pred mode”の値は予測モードの識別番号、“pred”は圧縮対象画素の予測画素値、ボックス内の符号a〜fは画素値をそれぞれ示している。また、圧縮対象画素の上ラインに位置する5つのローカルデコード画素は上参照画素として用いられ、左側に隣接する原画画素は左参照画素として用いられる。例えば、予測モード識別番号が1の場合には、圧縮対象画素の予測画素値は左側に隣接する原画画素を左参照することで、pred=fと算出される。また、予測モード識別番号が2の場合には、予測画素値は真上に位置する圧縮対象画素を上参照することで、pred=cと算出される。予測モード識別番号が3の場合には、上ラインのローカルデコード画素の画素値cと左側の原画画素の画素値fに基づいて予測画素値は、pred = (c+1)/2 + (f/2)と算出される。尚、入力画像の最上部のラインや左端に位置する画素が圧縮対象画素の場合には、その上部や左側に参照できる画素が存在しないため、参照画素として所定の設定値(例えば、全ビットが1の画素値)が用いられるものとする。
予測モード決定部104は、連続した複数の水平画素単位で、予測画素生成部103で生成した予測画素値に関する予測誤差が最小となる予測モード(以下、「最小予測モード」という。)を選択する回路である。図3は、予測モード決定部104が予測モードを決定する際の処理単位の具体例を示す図である。ここでは、予測モード決定部104が、原画画素と8通りの予測モードに対応して演算した8個の予測画素を入力とし、最小予測モードを32画素単位(以下、この処理単位を「ユニット」と呼ぶ。)で処理することが示されている。なお、1ユニットの画素数は、任意に設計変更できる。例えば、画素数が小さい方が予測モードの精度は上がる。しかし、圧縮データ中に予測モード3bitを入れるため、1ユニットの画素数が小さければ頻繁に予測モードが入ることとなる。その結果、使用可能なbit数が減り、圧縮効率は落ちる。逆に、大き過ぎると処理は速くなるが、予測モードの精度は悪くなる。このため、1ユニットは32画素に設定すると好適である。
図4は、図1に示す予測画素生成部103と予測モード決定部104の具体的構成を説明する図である。また、図4に示す予測モード(Pred mode)は、図2と共通である。図4では、予測画素生成部103が圧縮対象画素について8通りの予測モードに対応する予測画素値を並列に生成して予測モード決定部104に出力すると、予測モード決定部104が予測画素値と原画画素との差分絶対値和(SAD)を32画素分(1ユニット分)累積加算し、累積値同士を比較している。そして、各ユニットでのSADが最小の予測モードを、そのユニットに含まれる32画素の予測モードとすることが示されている。
DPCM部105は、予測モード決定部104において決定された予測モードを受けて、ローカルデコード画素収納ラインメモリ102内のローカルデコード画素を上参照画素とし、圧縮対象画素の1サイクル前のローカルデコード値を左参照画素として、最小予測モードに対応する最小予測画素値を生成し、最小予測画素値と圧縮対象画素との最小差分値を生成すると、その最小差分値を量子化部106へ出力する。予測モード決定部104の場合とは異なり、DPCM部105での最小予測画素値の生成には上参照画素と左参照画素の両方にローカルデコード画素値を使用している。
量子化部106は、DPCM部105が出力した差分値を量子化し、予測誤差として逆量子化部107および符号化部110へそれぞれ出力する回路である。量子化の方法としては、所定の値で除算して整数値に変換する方法や、非線形マッピングを用いる方法などがある。これに対し、逆量子化部107は、量子化部106によって量子化された予測誤差の逆量子化を行い、逆DPCM部108へ出力する回路である。逆量子化の方法としては、予測誤差値の量子化時に用いた係数値を量子化後の値に乗算する方法や、非線形マッピングを用いる方法などがある。
一般に、量子化を行う非可逆圧縮では、原画と復号画像は異なるため、エンコーダにおいて予測画素値を原画から生成すると、その予測画素値はデコーダ側では再生できない。同様に、原画を用いて生成した予測画素値と原画画素値の差分値を量子化・逆量子化した値もまた、デコーダ側で再生できない。その結果、デコーダ側とエンコーダ側で誤差が生じ、この誤差はデコーダ側で蓄積されるため、デコーダで再生した画像の画質をエンコーダ側で制御できなくなる。
このようなデコード時の誤差蓄積を避けるため、エンコーダ側では、実際に符号化する予測画素と原画画素の差分値を生成する際、デコーダ側で生成されるデコード画素(エンコーダ内部で生成されるデコード画素値であるので「ローカルデコード画素」と呼ばれる)を用いて予測画素を生成しなければならない。
逆DPCM部108は、圧縮対象画素について逆量子化部107が出力した逆量子化データと同画素に対応する予測画素値(最小予測画素値)に基づいて圧縮対象画素のローカルデコード画素値を生成し、ローカルデコードレジスタ109へ出力する。ローカルデコードレジスタ109は、逆DPCM部108が出力したローカルデコード画素値をローカルデコード画素収納ラインメモリ102に格納する。すなわち、逆DPCM部108は、DPCM部105とは逆の処理を行う。上記のように、ラスタスキャン順に入力され、ラスタスキャン順に画素単位で圧縮し、予測画素生成時に圧縮対象画素の左に位置する画素を左参照画素として使用する場合には、圧縮対象画素P1について生成されたローカルデコード画素値は、次サイクルの圧縮対象画素(P1の1画素左に位置するP2)の最小予測画素値を生成するためにDPCM部105で左参照画素として使用される。
符号化部110は、量子化部106が出力した予測誤差を可変長または固定長で符号化し、圧縮データとして出力する回路である。本実施形態では、原画画素値を用いて予測画素値を生成して予測モードを決め、実際に符号化する際にはローカルデコード画素値のみを用いて予測画素値を生成するが、符号化部110が予測モードおよび量子化パラメータを圧縮データ内に含めてデコーダ側に送信するため、デコーダ側でもエンコード時の予測画素を再生できる。圧縮データの詳細については後述する。
このように、量子化部106における量子化後のデータは、逆量子化、逆DPCM処理を行って、ローカルデコード画素値を生成する第1のパスと、符号化部110への第2のパスに別れる。第1のパスでは、毎サイクル1画素(スループットは1画素/cycle)を処理しなければならないため、ローカルデコード画素生成のループである、ローカルデコード画素値を用いた予測画素値生成処理、原画画素との差分値生成処理、量子化処理、逆量子化処理および逆DPCM処理を1サイクル以内に終えなければならない。したがって、ローカルデコード画素生成のループはクリティカルパスになり易く、ローカルデコード画素生成ループの回路遅延によって動作周波数が決まることが多い。
図5(A)は、映像圧縮装置100における処理単位を説明する図であり、32画素単位で連続する5つのユニット(unit0〜4)が例示されている。図5(B)は、図5(A)のユニットに対するパイプライン処理の動作タイミングチャートである。ここでは、入力原画バッファ101への入力を行う第1のパイプラインPL1と、予測画素生成と予測モード決定を行う第2のパイプラインPL2と、DPCM、量子化、逆量子化、逆DPCMからなるローカルデコード生成処理を実行する第3のパイプラインPL3と、量子化データの可変長・固定長符号化を行う第4のパイプラインPL4が示されている。4つのPL1〜PL4における処理はユニット単位でそれぞれ行われる。 例えば、時刻t0〜t1においては、unit0についての入力原画バッファ101への入力処理が第1のパイプラインPL1で行われているが、このとき第2のパイプラインPL2、第3のパイプラインPL3および第4のパイプラインPL4では処理が行われてない。
時刻t2〜t3においては、unit0についてのローカルデコード画素生成処理が第3のパイプラインPL3で行われているが、同時にunit1について予測画素生成と予測モード決定処理が第2のパイプラインPL2で行われ、unit2についての入力原画バッファ101への入力処理が第1のパイプラインPL1で行われている。このとき、第4のパイプラインPL4では処理が行われていない。
時刻t3〜t4においては、unit0についての可変長・固定長符号化処理が第4のパイプラインPL4で行われているが、unit1についてのローカルデコード画素生成処理が第3のパイプラインPL3で行われ、unit2について予測画素生成と予測モード決定処理が第2のパイプラインPL2で行われ、unit3についての入力原画バッファ101への入力処理が第1のパイプラインPL1で行われている。このようなパイプライン処理により高いスループット処理を実現できる。
以下、上記のように構成された映像圧縮装置における一連の動作を説明する。
先ず、入力原画バッファ101内に入力画像(原画)がラスタスキャン順で格納する(図5(B):PL1)。
次に、予測画素生成部103は、原画画素の中から選択された圧縮対象画素に対して、ローカルデコード画素収納ラインメモリ102の所定位置から読み出したローカルデコード画素を上参照画素とし、圧縮対象画素の左に位置する入力原画画素を左参照画素として定義される複数の予測モードの予測画素値をそれぞれ生成する(図5(B):PL2)。
先ず、入力原画バッファ101内に入力画像(原画)がラスタスキャン順で格納する(図5(B):PL1)。
次に、予測画素生成部103は、原画画素の中から選択された圧縮対象画素に対して、ローカルデコード画素収納ラインメモリ102の所定位置から読み出したローカルデコード画素を上参照画素とし、圧縮対象画素の左に位置する入力原画画素を左参照画素として定義される複数の予測モードの予測画素値をそれぞれ生成する(図5(B):PL2)。
次に、予測モード決定部104は、所定数の連続した原画画素からなるユニットを処理単位として、複数の予測モードのうち、圧縮対象画素の画素値と予測画素生成部103がユニット単位で生成した予測画素値との予測誤差が最小となる最小予測モードを選択する。例えば、1ユニットが32画素から構成される場合、予測画素生成部103は、画素ごとに8通りの予測モードの予測画素値を演算する。そして、予測モード決定部104が予測画素値と原画画素との差分絶対値和(SAD)を32画素分累積加算し、予測モードごとの積算値の比較結果によって最小予測モードを選択する(図5(B):PL2)。同じユニット内の画素は、同一の予測モードに対応付けられる。
次に、DPCM部105は、予測モード決定部104が決定した予測モードに応じて、上参照画素、左参照画素ともにローカルデコード画素値を使用して予測画素値を生成し、原画画素との差分値を生成し、量子化部106へ出力する(図5(B):PL3)。
次に、量子化部106は、DPCM部105が出力した差分値を所定の量子化パラメータに基づいて量子化し、予測誤差として逆量子化部107および符号化部110へそれぞれ出力する(図5(B):PL3)。量子化部106からパスは二つに分かれる。
第1のパス側では、逆量子化部107が、量子化部106によって量子化された予測誤差値を逆量子化し、その処理結果を逆DPCM部108へ出力する(図5(B):PL3)。
そして、逆DPCM部108は、圧縮対象画素について逆量子化部107が出力した逆量子化データと同画素に対応する予測画素値に基づいてローカルデコード画素値を生成し、ローカルデコードレジスタ109へ格納する。ローカルデコードレジスタ109は、このローカルデコード画素値をローカルデコード画素収納ラインメモリ102に格納する(図5(B):PL3)。
他方、第2のパス側では、符号化部110が、予測モードおよび予測誤差値を含む圧縮データ(伝送ストリーム)を例えばディスプレイインターフェース、カメラインターフェースなどの出力先へ出力する(図5(B):PL4)。
また、図6は、従来型の映像圧縮装置と図1に示す映像圧縮装置100の処理の流れを対比して説明する図である。図6(A)は、従来型の映像圧縮装置の処理の流れを示しており、予測画素生成からローカルデコード画素生成までが一つのループの中に含まれている。これに対し、図6(B)は、本実施形態の映像圧縮装置100の処理の流れを示している。図6(A)の場合とは異なり、ローカルデコード画素生成のループと予測画素生成から予測モード決定までのパスをパイプラインの別ステージに分けることで、上記のローカルデコード画素生成のループ内におけるパスが短くなる。一般に、予測画素生成から予測モード決定までのパスにおける処理時間T1は、ローカルデコード画素生成における処理時間T2の半分位の時間を必要とするため、処理時間T1が上記(A)のループの全処理時間の中で約1/3の割合を占めていた。しかし、上記(B)のように、本実施形態の場合には、予測画素生成から予測モード決定までがループから分かれ、独立して別のパイプライン(第1のパイプラインPL1)で実行される。ループ内のパスが短くなったことで、ループ内の処理時間は従来の約2/3にすることができる。また、第1のパイプラインPL1で実行される予測モード決定処理においては、左参照画素については入力原画を用いるため、ローカルデコード画素の生成を待つ必要がない構成である。すなわち、第2のパイプラインPL2で実行されるローカルデコード画素生成処理との依存関係がなく、圧縮対象画素の予測モードを先行して決定することができる。
このように、本実施形態に係る映像圧縮装置100によれば、2次元方向からの予測画素・予測画像を生成し、差分画素値、差分画像を用いる画像圧縮において、予測モードを決める際に、上参照画素としてローカルデコード画素、左参照画素として原画画素値を用いる。1サイクル以内に行わなければいけない処理、すなわち、処理回路の遅延を削減すると同時に、予測モード選択を高い精度で行うことが可能となるため、動作周波数及びスループットを向上させることができ、かつ、高画質での圧縮が可能となる。
<実施形態2>
図7は、本発明の実施形態2に係る映像圧縮装置100の全体構成例を示すブロック図である。同図に示されるように、本実施形態では、実施形態1における第1のパスにおいて、可変長・固定長符号化に繋がる量子化部106とは別に、量子化処理と逆量子化処理を同時に行う量子化・逆量子化部111が設けられており、DPCM部105から直接差分値を入力する。この量子化・逆量子化部111は、量子化部106と逆量子化部107を繋ぐのではなく、量子化・逆量子化結果をテーブル引きにより一度に求める回路である。テーブルには、DPCM部105の出力結果である差分値、量子化パラメータの値及び量子化・逆量子化結果の対応関係が定義されているものとする。
図7は、本発明の実施形態2に係る映像圧縮装置100の全体構成例を示すブロック図である。同図に示されるように、本実施形態では、実施形態1における第1のパスにおいて、可変長・固定長符号化に繋がる量子化部106とは別に、量子化処理と逆量子化処理を同時に行う量子化・逆量子化部111が設けられており、DPCM部105から直接差分値を入力する。この量子化・逆量子化部111は、量子化部106と逆量子化部107を繋ぐのではなく、量子化・逆量子化結果をテーブル引きにより一度に求める回路である。テーブルには、DPCM部105の出力結果である差分値、量子化パラメータの値及び量子化・逆量子化結果の対応関係が定義されているものとする。
上記実施形態1の場合には量子化部106と逆量子化部107をそのまま繋いでいるため各部で演算処理が必要になるが、本実施形態に係る映像圧縮装置100によれば、量子化および逆量子化のために演算処理を行う必要は無い。量子化・逆量子化部111においてテーブル引きにより量子化・逆量子化結果を一度に求めるため、実施形態1の場合と比べてローカルデコード生成のループにおける回路遅延が小さくなる。その結果、ローカルデコード生成のパスにおける回路遅延が小さくなり、クリティカルパスが改善されるため、動作周波数が向上し、スループットも向上する。
<実施形態3>
図8は、本発明の実施形態3に係る映像圧縮装置100の全体構成例を示すブロック図である。上述した実施形態1においては、予測画素生成時に上参照画素はローカルデコード画素を用い、左参照画素は入力された原画画素をそのまま用いていた。参照画素としてローカルデコード画素を用いると予測精度が上がり、圧縮効率・画質が向上するが、左参照画素としてローカルデコード画素そのものを用いると、上記のようにローカルデコード画素生成における回路遅延が大きく動作周波数が上がらない。
図8は、本発明の実施形態3に係る映像圧縮装置100の全体構成例を示すブロック図である。上述した実施形態1においては、予測画素生成時に上参照画素はローカルデコード画素を用い、左参照画素は入力された原画画素をそのまま用いていた。参照画素としてローカルデコード画素を用いると予測精度が上がり、圧縮効率・画質が向上するが、左参照画素としてローカルデコード画素そのものを用いると、上記のようにローカルデコード画素生成における回路遅延が大きく動作周波数が上がらない。
そこで、本実施形態に係る映像圧縮装置100は、原画画素補正部112を設け、原画画素のみから生成した擬似的なローカルデコード画素を予測画素生成部103で左参照画素として用いる。原画画素補正部112における疑似的なローカルデコード画素の生成方法としては例えば下記のものが有用である。
1.原画画素を量子化・逆量子化した値を出力する。
2.原画画素の下位ビットを特定の値にして出力する、たとえば、量子化パラメータに合わせて下位ビットを0にする。
3.将来にわたって左参照する複数の原画画素の隣接差分値が連続してある閾値以下であれば、左予測が効果的であると見做し、左予測が当たりやすくなるように水平ローパスフィルタをかけて水平方向に平均化した値を出力する。
図9は、図8に示す映像圧縮装置100における擬似的ローカルデコード画素の生成例を示す図であり、上記3.のケースに該当する。ここでは、入力原画バッファ101に格納された原画画素群において原画画素P[i]が圧縮対象画素として選択される前に、当該画素における予測モードの決定処理において左参照画素として使用する擬似的なローカルデコード画素P′[i-1]を生成する例を示している。原画画素群の中で原画画素P[i]の左側に位置するi個の画素P[0]〜P[i-1]を予測モード決定処理に先行して読込み、隣接する二つの原画画素P[i]およびP[i-1]の間の差分値の絶対値を左側から順番に演算する。そして、演算した各絶対値がいずれも閾値Tb以下である場合には、予測モード決定時に左参照画素として使用する擬似的なローカルデコード画素P′[i-1]を例えば水平方向に3つ連続する原画画素P[i-2]、P[i-1]およびP[i]の平均することで算出している。
2.原画画素の下位ビットを特定の値にして出力する、たとえば、量子化パラメータに合わせて下位ビットを0にする。
3.将来にわたって左参照する複数の原画画素の隣接差分値が連続してある閾値以下であれば、左予測が効果的であると見做し、左予測が当たりやすくなるように水平ローパスフィルタをかけて水平方向に平均化した値を出力する。
図9は、図8に示す映像圧縮装置100における擬似的ローカルデコード画素の生成例を示す図であり、上記3.のケースに該当する。ここでは、入力原画バッファ101に格納された原画画素群において原画画素P[i]が圧縮対象画素として選択される前に、当該画素における予測モードの決定処理において左参照画素として使用する擬似的なローカルデコード画素P′[i-1]を生成する例を示している。原画画素群の中で原画画素P[i]の左側に位置するi個の画素P[0]〜P[i-1]を予測モード決定処理に先行して読込み、隣接する二つの原画画素P[i]およびP[i-1]の間の差分値の絶対値を左側から順番に演算する。そして、演算した各絶対値がいずれも閾値Tb以下である場合には、予測モード決定時に左参照画素として使用する擬似的なローカルデコード画素P′[i-1]を例えば水平方向に3つ連続する原画画素P[i-2]、P[i-1]およびP[i]の平均することで算出している。
原画画素補正部112は、ローカルデコード画素生成ループとの依存関係が無いため、パイプライン化することが可能であるから、動作周波数を低下させることは無い。
このように、本実施形態に係る映像圧縮装置100によれば、予測画素生成部103における左参照画素として、原画画素またはローカルデコード画素を使用する代わりに、原画画素補正部112が原画のみから生成した擬似的なローカルデコード画素を用いるため、実施形態1の効果を合わせ持ち、かつ、実施形態1よりも圧縮効率・画質が向上する。
<実施形態4>
図10は、本発明の実施形態4に係る映像圧縮装置の全体構成例を示すブロック図である。本実施形態は、実施形態1に対してレート制御部113を更に備えた装置構成である。
図10は、本発明の実施形態4に係る映像圧縮装置の全体構成例を示すブロック図である。本実施形態は、実施形態1に対してレート制御部113を更に備えた装置構成である。
レート制御部113は、符号化部110での圧縮データの伝送レートを一定に制御する回路であり、符号化部110から入力した符号化量に基づいて圧縮データに含める信号の種類毎に量子化パラメータを切り替える。例えば、符号化部110における符号量が大き過ぎ、圧縮データの伝送レートが所定の値を超えてしまった場合には、量子化パラメータの値を大きくすることで、符号量を小さくすることができる。
図11は、符号化部110が出力する圧縮データのデータ構造の例を示す図である。ここでは、原画の一部を構成する32画素のunit0を圧縮した場合に、予測モード決定部104で決定された予測モードの値を予測モード識別番号として先頭3ビット内に格納し、その後に輝度信号(Y)、色差信号(Cb)および色差信号(Cr)の量子化パラメータを各Nビット内に格納し、最後に32画素の画素値をそれぞれ可変長符号化したデータ(予測画素値)を格納した例を示している。レート制御部113によって量子化パラメータを任意に設定できる構成のため、信号の種類毎に量子化部106における処理内容を変更することができる。例えば、輝度信号(Y)については、原画画素値を8で除算し、色差信号(Cb)および色差信号(Cr)については、原画画素値を4で除算して量子化の実行を制御できる。
このように、本実施形態に係る映像圧縮装置によれば、符号化部110が予測モードおよび量子化パラメータを圧縮データ内に含めてデコーダ側に送信するため、予測モードおよび量子化パラメータに基づいてデコーダ側でもエンコード時の予測画素を再生できる。また、圧縮データに含める信号の種類毎に量子化レベルを柔軟に変更することもできる。
以下、上記実施形態の幾つかの変形例について説明する。
<実施形態5>
図12は、本発明の実施形態5に係る映像圧縮装置の全体構成例を示すブロック図である。本実施形態の構成は実施形態2と実施形態3を組合せたものであり、実施形態1の装置に量子化・逆量子化部111と原画画素補正部112を加えたものである。このため、実施形態2および実施形態3の効果を合わせ持つ。
図12は、本発明の実施形態5に係る映像圧縮装置の全体構成例を示すブロック図である。本実施形態の構成は実施形態2と実施形態3を組合せたものであり、実施形態1の装置に量子化・逆量子化部111と原画画素補正部112を加えたものである。このため、実施形態2および実施形態3の効果を合わせ持つ。
<変形例>
なお、上記の各実施形態はそれぞれ以下のように変形することもできる。
なお、上記の各実施形態はそれぞれ以下のように変形することもできる。
例えば、実施形態1の処理をソフトウェアで実装した場合(変形例1)、予測画素生成、予測モード選択は、2次元DPCMを含むローカルデコード画素生成とは別スレッドで並列実行できるため、ハードウェアで実装する場合と同様にスループットが向上する。
また、実施形態2の処理をソフトウェアで実装した場合(変形例2)には、変形例1と同様に、予測画素生成、予測モード選択は、2次元DPCMを含むローカルデコード画素生成とは別スレッドで並列実行でき、更に、量子化と可変長・固定長符号化処理、量子化・逆量子化と逆DPCMのローカルデコード生成処理も別スレッドで並列実行できるため、ハードウェアで実装する場合と同様に全体のスループットが向上する。
同様に、実施形態3の処理をソフトウェアで実装した場合(変形例3)には、変形例1と同様に予測画素生成、予測モード選択は、2次元DPCMを含むローカルデコード画素生成とは別スレッドで並列実行できるため、ハードウェアで実装する場合と同様にスループットが向上する。更に、実施形態3と同様に予測効率が上がり画質が向上する。
更に、変形例1の処理をソフトウェアで実装した場合(変形例4)には、変形例1・2と同様の理由でスループットが向上する。また、実施形態3と同様の理由で予測効率が上がり画質も向上する。
以上、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100…映像圧縮装置、
101…入力原画バッファ、
102…ローカルデコード画素収納ラインメモリ、
103…予測画素生成部、
104…予測モード決定部、
105…DPCM部、
106…量子化部、
107…逆量子化部、
108…逆DPCM部、
109…ローカルデコードレジスタ、
110…符号化部、
111…量子化・逆量子化部、
112…原画画素補正部、
113…レート制御部。
101…入力原画バッファ、
102…ローカルデコード画素収納ラインメモリ、
103…予測画素生成部、
104…予測モード決定部、
105…DPCM部、
106…量子化部、
107…逆量子化部、
108…逆DPCM部、
109…ローカルデコードレジスタ、
110…符号化部、
111…量子化・逆量子化部、
112…原画画素補正部、
113…レート制御部。
Claims (4)
- ラスタスキャン順に入力原画画素を格納する入力原画バッファと、
ローカルデコード画素を格納するラインメモリと、
前記入力原画画素の中から順次選択した圧縮対象画素に対して、前記ラインメモリの所定位置から読み出したローカルデコード画素を上参照画素とし、前記圧縮対象画素の左に位置する入力原画画素を左参照画素として定義される複数の予測モードの予測画素値をそれぞれ生成する予測画素生成部と、
所定数連続する入力原画画素からなるユニットを処理単位とし、このユニット内の前記圧縮対象画素の画素値と前記予測画素値との差分値に基づいて、前記ユニットにおける予測誤差を算出し、前記複数の予測モードの中から前記予測誤差が最小となる最小予測モードを選択する予測モード決定部と、
前記ラインメモリ内のローカルデコード画素を上参照画素とし、圧縮対象画素の1サイクル前のローカルデコード画素値を左参照画素として、前記最小予測モードに対応する最小予測画素値を生成し、前記最小予測画素値と圧縮対象画素との最小差分値を生成するDPCM部と、
前記最小差分値を量子化した量子化データを生成する量子化部と、
前記量子化データを伝送符号に変換する符号化部と、
前記量子化データを逆量子化した逆量子化データを生成する逆量子化部と、
前記逆量子化データと前記最小予測画素値を用いて前記圧縮対象画素に対するローカルデコード画素値を生成し、これを前記ラインメモリに順次格納する逆DPCM部と、
を備えることを特徴とする映像圧縮装置。 - ラスタスキャン順に入力原画画素を格納する入力原画バッファと、
ローカルデコード画素を格納するラインメモリと、
前記入力原画画素の中から順次選択した圧縮対象画素に対して、前記ラインメモリの所定位置から読み出したローカルデコード画素を上参照画素とし、前記圧縮対象画素の左に位置する入力原画画素を左参照画素として定義される複数の予測モードの予測画素値をそれぞれ生成する予測画素生成部と、
所定数連続する入力原画画素からなるユニットを処理単位とし、このユニット内の前記圧縮対象画素の画素値と前記予測画素値との差分値に基づいて、前記ユニットにおける予測誤差を算出し、前記複数の予測モードの中から前記予測誤差が最小となる最小予測モードを選択する予測モード決定部と、
前記ラインメモリ内のローカルデコード画素を上参照画素とし、圧縮対象画素の1サイクル前のローカルデコード画素値を左参照画素として、前記最小予測モードに対応する最小予測画素値を生成し、前記最小予測画素値と圧縮対象画素との最小差分値を生成するDPCM部と、
前記最小差分値を量子化した第1の量子化データを生成する量子化部と、
前記量子化データを伝送符号に変換する符号化部と、
前記最小予測画素値と前記圧縮対象画素との差分値を量子化して第2の量子化データを生成するとともに、この第2の量子化データを逆量子化した逆量子化データを生成する量子化・逆量子化部と、
前記逆量子化データと前記最小予測画素値を用いて前記圧縮対象画素に対するローカルデコード画素値を生成し、これを前記ラインメモリに順次格納する逆DPCM部と、
を備えることを特徴とする映像圧縮装置。 - 前記予測画素生成部および前記予測モード決定部における処理と、前記DPCM部、前記量子化部、前記逆量子化部および前記逆DPCM部における処理とを別のパイプラインによりそれぞれ処理することを特徴とする請求項1記載の映像圧縮装置。
- 前記入力原画バッファから圧縮対象画素の位置を基準に読み出した画素に対して補正処理を行い、補正画素を前記予測画素生成部へ出力する原画画素補正部を更に備えることを特徴とする請求項1乃至請求項3のいずれか一項記載の映像圧縮装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014046923A JP2014241579A (ja) | 2013-05-13 | 2014-03-10 | 映像圧縮装置 |
US14/266,422 US9641850B2 (en) | 2013-05-13 | 2014-04-30 | Video compression device |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101070 | 2013-05-13 | ||
JP2013101070 | 2013-05-13 | ||
JP2014046923A JP2014241579A (ja) | 2013-05-13 | 2014-03-10 | 映像圧縮装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014241579A true JP2014241579A (ja) | 2014-12-25 |
Family
ID=51864774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014046923A Abandoned JP2014241579A (ja) | 2013-05-13 | 2014-03-10 | 映像圧縮装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9641850B2 (ja) |
JP (1) | JP2014241579A (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016195370A (ja) * | 2015-04-01 | 2016-11-17 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
US10762394B2 (en) | 2018-07-31 | 2020-09-01 | Intel Corporation | System and method for 3D blob classification and transmission |
US11178373B2 (en) | 2018-07-31 | 2021-11-16 | Intel Corporation | Adaptive resolution of point cloud and viewpoint prediction for video streaming in computing environments |
US11212506B2 (en) | 2018-07-31 | 2021-12-28 | Intel Corporation | Reduced rendering of six-degree of freedom video |
US11049266B2 (en) * | 2018-07-31 | 2021-06-29 | Intel Corporation | Point cloud viewpoint and scalable compression/decompression |
US10887574B2 (en) | 2018-07-31 | 2021-01-05 | Intel Corporation | Selective packing of patches for immersive video |
US10893299B2 (en) | 2018-07-31 | 2021-01-12 | Intel Corporation | Surface normal vector processing mechanism |
DE102019127349A1 (de) | 2018-10-10 | 2020-04-16 | Intel Corporation | Punktwolkencodierungsstandard-konformitätsdefintion in computerumgebungen |
US11057631B2 (en) | 2018-10-10 | 2021-07-06 | Intel Corporation | Point cloud coding standard conformance definition in computing environments |
US20210245047A1 (en) | 2020-02-10 | 2021-08-12 | Intel Corporation | Continuum architecture for cloud gaming |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007139266A1 (en) * | 2006-06-01 | 2007-12-06 | Electronics And Telecommunications Research Institute | Method and apparatus for video coding on pixel-wise prediction |
KR100837410B1 (ko) * | 2006-11-30 | 2008-06-12 | 삼성전자주식회사 | 주관적인 무손실 이미지 데이터 압축 방법 및 장치 |
JP2009290498A (ja) | 2008-05-29 | 2009-12-10 | Renesas Technology Corp | 画像符号化装置及び画像符号化方法 |
JP2010035025A (ja) | 2008-07-30 | 2010-02-12 | Canon Inc | 符号化装置およびその方法 |
JP5116704B2 (ja) | 2009-02-02 | 2013-01-09 | パナソニック株式会社 | 画像符号化装置及び画像符号化方法 |
JP2010268259A (ja) * | 2009-05-15 | 2010-11-25 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP5598199B2 (ja) | 2010-09-16 | 2014-10-01 | 富士通株式会社 | 動画像符号化装置 |
US9258573B2 (en) * | 2010-12-07 | 2016-02-09 | Panasonic Intellectual Property Corporation Of America | Pixel adaptive intra smoothing |
JP5582019B2 (ja) | 2010-12-17 | 2014-09-03 | 株式会社Jvcケンウッド | 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム |
WO2012081193A1 (ja) | 2010-12-17 | 2012-06-21 | 株式会社Jvcケンウッド | 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム |
CA2807545C (en) * | 2011-02-22 | 2018-04-10 | Panasonic Corporation | Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus |
US20130201025A1 (en) * | 2012-02-07 | 2013-08-08 | Arunkumar Kamalakannan | Method of Monitoring a Gas Leakage Incident |
US9380303B1 (en) * | 2015-03-18 | 2016-06-28 | Sony Corporation | Adding run-mode to block-based DPCM codec |
-
2014
- 2014-03-10 JP JP2014046923A patent/JP2014241579A/ja not_active Abandoned
- 2014-04-30 US US14/266,422 patent/US9641850B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20140334541A1 (en) | 2014-11-13 |
US9641850B2 (en) | 2017-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014241579A (ja) | 映像圧縮装置 | |
RU2645358C2 (ru) | Способ и устройство для кодирования или декодирования блоков пиксела | |
RU2683165C1 (ru) | Внутреннее предсказание блочного копирования с асимметричными разделами и схемами поиска на стороне кодера, диапазоны поиска и подходы к разделению | |
US10368092B2 (en) | Encoder-side decisions for block flipping and skip mode in intra block copy prediction | |
US10567754B2 (en) | Hash table construction and availability checking for hash-based block matching | |
JP6462119B2 (ja) | コンピューティングデバイス | |
US10136140B2 (en) | Encoder-side decisions for screen content encoding | |
JP7357684B2 (ja) | ビデオ復号のための方法、装置、およびコンピュータプログラム | |
JP6681383B2 (ja) | エンコーダ、デコーダ、および方法 | |
JP7402280B2 (ja) | 動画像復号装置、動画像復号方法及びプログラム | |
US20170099498A1 (en) | Data encoding and decoding | |
JP2015515812A (ja) | ビデオ符号化のための量子化係数を提供するための機器および方法 | |
US11044466B2 (en) | Image processing device | |
JP2010206751A (ja) | 動画像圧縮符号化装置 | |
JP6564315B2 (ja) | 符号化装置、復号装置、及びプログラム | |
JP2009260494A (ja) | 画像符号化装置及びその制御方法 | |
JP2017069617A (ja) | 半導体装置および画像符号化方法 | |
JP2009071472A (ja) | 画像符号化方法、画像復号化方法、画像符号化装置、画像復号化装置、及び半導体集積回路 | |
JP6480790B2 (ja) | 画像判定装置、符号化装置、及びプログラム | |
JP2008311824A (ja) | 画像符号化装置および画像符号化プログラム | |
US9866841B2 (en) | Image coding method and image coding apparatus | |
US11991375B2 (en) | Moving image encoding device, moving image compression device, moving image encoding method, and program | |
JP2010276686A (ja) | 画像制御装置 | |
JP6280266B2 (ja) | 復号装置、及び復号方法 | |
US20160277740A1 (en) | System and a method for determining cost of application of a coding type in a video encoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160212 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20160722 |