JPWO2010041488A1 - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JPWO2010041488A1
JPWO2010041488A1 JP2010532837A JP2010532837A JPWO2010041488A1 JP WO2010041488 A1 JPWO2010041488 A1 JP WO2010041488A1 JP 2010532837 A JP2010532837 A JP 2010532837A JP 2010532837 A JP2010532837 A JP 2010532837A JP WO2010041488 A1 JPWO2010041488 A1 JP WO2010041488A1
Authority
JP
Japan
Prior art keywords
compression
code amount
unit
variable length
compression mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010532837A
Other languages
English (en)
Other versions
JP5524072B2 (ja
Inventor
直人 伊達
直人 伊達
古藤 晋一郎
晋一郎 古藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2010532837A priority Critical patent/JP5524072B2/ja
Publication of JPWO2010041488A1 publication Critical patent/JPWO2010041488A1/ja
Application granted granted Critical
Publication of JP5524072B2 publication Critical patent/JP5524072B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/69Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving reversible variable length codes [RVLC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

動画像データを圧縮して符号データを生成する際に、符号量が所定の値以下かつ復号画像の画質がよい符号データを生成する。画像データの所定の単位を分割した処理単位毎に、互いに圧縮率が異なる複数の可変長圧縮モードにより圧縮することにより、前記圧縮モード毎の符号量を算出する算出手段と、算出された前記圧縮モード毎の符号量及び前記画像データを固定長圧縮モードにより圧縮する際の符号量に基づいて、前記可変長圧縮モード及び前記固定長圧縮モードの中から、符号量の累計が所定の符号量以下となる圧縮モードを選択する選択手段と、選択された前記圧縮モードにより前記処理単位の画像データを圧縮して圧縮データを生成する圧縮手段と、を有する動画像符号化装置。

Description

本発明は、動画像符号化に関する。
従来から、動画像圧縮の技術分野においては、圧縮データが通る伝送路の帯域制限と圧縮データ格納領域のサイズ制限が伴うことが多く、動画像を所定のデータサイズ以下に圧縮するビットレート制御が重要である。ビットレート制御では、例えば、圧縮処理の際に、処理単位毎に量子化幅を制御することで、発生するデータ量、すなわち、符号量の調整を行う。量子化幅を示すパラメータを、Quantization Parameter(以下、「QP」という。)と呼ぶ。
基本的なビットレート制御として、発生する符号量が処理単位毎に一定に近くなるCBR(Constant Bit Rate)制御がある。ところで、画像中には、複雑な絵柄の領域と単純な絵柄の領域の両方が含まれるが、前者は圧縮困難度が高く、後者は圧縮困難度が低い。CBR制御では、複雑な絵柄の領域と単純な絵柄の領域とに、同等の符号量を割り当てるため、単純な絵柄の領域にとっては十分な符号量が割り当てられるものの、複雑な絵柄の領域では符号量不足となってしまう。これにより、画像中の複雑な絵柄の領域で局所的に映像品質の劣化が発生する。
そこで、例えば、各処理単位を圧縮する際に、発生符号量の処理単位による平均値が、処理単位あたりの目標符号量を超えないようにQPを選択する方式がある。また例えば、各処理単位を圧縮する際に、発生した符号量と処理単位あたりの目標符号量とのズレから、次に処理するべき処理単位に割り当てる符号量を決定付けるフィードバック方式等がある。
例えば、特開2008−42943号公報(JP-A-2008-42943)では、異なる複数のQPにより量子化して生成する符号量とより低圧縮な圧縮方式による符号量とに基づいて、選択したQPによる圧縮又はより低圧縮な圧縮方式の何れかを、符号化単位毎に選択する画像圧縮符号化装置等の発明が開示されている。
特開2008−42943号公報
しかしながら、JP-A-2008-42943に開示の画像圧縮符号化装置等の発明では、例えば、一のピクチャを圧縮して生成する符号の符号量が、必ず、所定の値より小さくなるか否かについては、考慮されていない。
理想的な符号量制御は、発生する符号量を処理単位毎に可変とすることで、画像内の映像品質を一様に保ち、かつ、QPを画像内で一定に近づけることで、画像を所定のデータサイズ以下に圧縮できる制御である。
本発明は、上記の点に鑑みて、これらの問題を解消するために発明されたものであり、動画像データを圧縮して符号データを生成する際に、符号量が所定の値以下かつ復号画像の画質がよい符号データを生成することを目的としている。
上記目的を達成するために、本発明の動画像符号化装置は次の如き構成を採用した。
画像データの所定の単位を分割した処理単位毎に、互いに圧縮率が異なる複数の可変長圧縮モードにより圧縮することにより、前記圧縮モード毎の符号量を算出する算出手段と、算出された前記圧縮モード毎の符号量及び前記画像データを固定長圧縮モードにより圧縮する際の符号量に基づいて、前記可変長圧縮モード及び前記固定長圧縮モードの中から、符号量の累計が所定の符号量以下となる圧縮モードを選択する選択手段と、選択された前記圧縮モードにより前記処理単位の画像データを圧縮して圧縮データを生成する圧縮手段と、を有する構成とすることができる。
本発明の動画像符号化装置によれば、動画像データを圧縮して符号データを生成する際に、符号量が所定の値以下かつ復号画像の画質がよい符号データを生成することが可能になる。
CBR制御を説明する図。 画像における圧縮困難度と符号量の割り当てとの関係を示す図。 動画像符号化装置103を示すブロック図。 仮圧縮部105を示すブロック図。 符号量上限ラインの説明。 固定長圧縮部108の例を示すブロック図。 可変長圧縮部109の例を示すブロック図。 符号量上限ラインと制御線との関係を示す図。 可変長符号化部53の例を示すブロック図。 圧縮モード判定部106の例を示すブロック図。 既に圧縮した画像の圧縮困難度に基づく圧縮モードの変更を説明する図。 可変長符号化部53の例を示すブロック図。 既に観測された信号値と未だ観測されない信号とを示す図。 符号反転前と符号反転後との信号ヒストグラムを示す図。 動画像を圧縮する処理を示すフロー図。 可変長圧縮部109による処理の詳細を示すフロー図。
以下、本実施の形態を図面に基づき説明する。
放送・通信・蓄積の何れの分野でも、動画像圧縮のビットレート制御は必須である。放送では、例えば、地上デジタル放送において、電波帯域の制限により、映像データ(MPEG−2)のビットレート制限が発生する。通信では、例えば、無線で映像データを送受信するケーブルレスな壁掛けテレビを実現しようとすれば、無線のデータ転送速度を満たすように圧縮する必要がある。蓄積では、例えば、デジタルバーサタイルディスク(DVD)においては、ディスクからの読み出し速度の制限と、ディスク容量の制限を満たすように、動画像を圧縮する必要がある。
その他の例では、コーデックLSI等、大量の映像データを処理するシステムにおいて、映像データを格納するためのメモリーの入出力部に圧縮装置を備えることで、メモリー量やバス幅を低減できる。このように、動画像を所定のデータサイズ以下に圧縮するビットレート制御の重要度は非常に高い。
動画像圧縮では、まず、処理単位毎に、エントロピー削減処理を行い、次に、信号を量子化することでデータ量を削減する。処理単位とは、例えば、画素、画素ブロック、MPEGにおけるマクロブロック(以下、「MB」という。)等である。またエントロピー削減処理とは、例えば、画像信号同士の差分演算や、画像に対するDCT等の直交変換である。
図1は、CBR制御を説明する図である。図1の横軸は、処理単位のインデックスであり、例えば、MB毎の識別番号である。また、図1の縦軸は、処理単位毎に発生する符号量の累積値を表す。
図1の方式1は、各処理単位を圧縮する際に、発生符号量の累計値が目標符号量を超えないようにQPを選択する方式である。また、図1の方式2は、各処理単位を圧縮する際に、発生した符号量と目標符号量1とのズレから、次に処理するべき処理単位に割り当てる符号量を決定付けるフィードバック方式である。
ところで、処理単位毎に発生する符号量が一定に近くなる方式は、画質面での課題が残る。図2は、画像における圧縮困難度と符号量の割り当てとを説明する図である。図2の例では、符号化対象画像p1は、横方向の中心付近に圧縮困難度が高い領域を有する。
図2(a)は、処理単位毎の符号量が一定となるように制御する例である。図2(a)のテーブルt1では、処理単位毎の画質と発生ビット量を示す。テーブルt1において、処理単位に付された数字は、画質を表し、()内の数値は、発生ビット量を表す。画質を表す数値は、大きいほど画質が悪いことを表す。テーブルt1において、ハッチングが付された箇所は、数値の高い箇所である。テーブルt1では、画質を表す数値は、横方向の中心付近が高くなっている。また、各処理単位の発生ビット量は、全て100である。
図2(b)は、処理単位毎の画質が一定となるように制御する例である。図2(b)のテーブルt2では、処理単位毎の発生ビット量が、80から140であり、画質を表す数値は、1又は2である。図2(b)は、図2(a)よりも、画像内の映像品質を一様に保ち、また、符号量の総和は、図2(a)よりも小さい。
〔第1の実施の形態〕
図3は、第1の実施形態に係る動画像符号化装置103の機能構成を説明する図である。動画像符号化装置103は、入力画像102が入力され、固定長圧縮モード符号量101に基づく圧縮モード判定により圧縮処理を行い、圧縮データ110を出力する。動画像符号化装置103は、画像ブロック用バッファ104、仮圧縮部105、圧縮モード判定部106、本圧縮部107を備える。
入力画像102は、ブロック毎に分割され、画像ブロック用バッファ104に格納される。入力画像102は、所定の圧縮率を保証する単位とし、画像フレームだけでなく、画素ラインや画像ブロックも含む概念である。本実施の形態では、入力画像102に対し、符号化の際の目標符号量を設定する。ブロックとは、画像を任意の方法で分割したもので、最小単位は画素、最大単位は画像全体とする。ブロックは、例えば、MPEGにおける、フレーム、スライス、MB、ブロック、又は、画像シーケンス等の何れでもよい。画像ブロック用バッファ104に格納された画像のブロックは、仮圧縮部105にて複数の異なるQPにより仮圧縮され、QP毎に対応する符号量が得られる。
図4は、仮圧縮部105の機能構成を説明する図である。仮圧縮部105は、エントロピー削減処理部51、量子化部52、及び、可変長符号化部53を有する。エントロピー削減処理部51は、画像ブロック用バッファ104に格納されたブロックに対し、画素予測値との差分処理、又は、DCT(Discrete Cosine Transform)等の線形変換を行う。エントロピー削減処理部51は、画素予測値との差分処理により、予測誤差値を生成する。量子化部52は、エントロピー削減処理部51が出力するブロック、又は、画像ブロック用バッファに格納されているブロックを量子化する。可変長符号化部53は、量子化されたブロックを可変長符号化する。以上の処理により生成する符号の符号量が得られ、圧縮モード判定部106に送られる。
圧縮モード判定部106は、本圧縮部107により圧縮する際の圧縮モードを決定する。圧縮モード判定部106には、固定長圧縮モード符号量101が設定される。固定長圧縮モード符号量101は、ブロックに均等に符号を割り当てた場合の符号量以下となる値であり、ブロックの平均割り当て符号量以下となる値である。
圧縮モード判定部106は、処理単位毎に、符号量上限ラインを超えない範囲で、圧縮モードを選択する。圧縮モード判定部106は、仮圧縮部105で生成する符号量を評価した可変長圧縮モードと固定長圧縮モードとの中から一つの圧縮モードを選択する。圧縮判定部106が選択する圧縮モードは、例えば、量子化ステップサイズが最小となるモード、符号化歪みが最小となるモード、又は、Rate−Distortionコスト(符号化歪み量+符号量×lambda、但し、lambdaは係数)が最小となるモード等である。なお、Rate−DistortionコストRDは、次式(1)により表される。
(RD)=(符号化歪み量)+(符号量)×(lambda)・・・(1)
但し、lambdaは係数
図5は、圧縮モード判定部106が圧縮モードを判定する際の符号量上限ラインを説明する図である。図5は、横軸を処理単位、縦軸を発生符号量の累計としたグラフである。図5において、符号量上限ラインは、固定長圧縮モード符号量を傾きとし、目標符号量から固定長圧縮モード符号量×画像中の処理単位数を減算したものを切片とする、一次関数である。符号量上限ラインを超えなければ、圧縮データは所定のデータサイズに収まることを保証している。すなわち、全てのブロックを固定長圧縮モードで圧縮すれば、生成する圧縮データは所定のデータサイズに収まる。
なお、図5における符号量上限ラインは一例であり、この一次関数によって表される値に対し有効数字の桁数を減じた近似値でもよい。また、図5において、発生符号量一定ラインは、目標符号量を処理単位の数で除した値を傾きとする一次関数である。発生符号量一定ラインを、処理単位毎の符号量を設定する際の下限とするとよい。
本圧縮部107は、固定長圧縮部108と可変長圧縮部109とを有する。本圧縮部107は、入力画像102を所定のサイズ以下に圧縮し圧縮データ110を出力する。固定長圧縮部108には、固定長圧縮モード符号量101が設定される。本圧縮部107は、圧縮モード判定部106の選択結果に従い、固定長圧縮部108、又は、可変長圧縮部109の何れかで圧縮処理を行い、圧縮データ110を生成する。
図6は、固定長圧縮部108の構成の例を説明する図である。固定長圧縮部108は、エントロピー削減処理部81、量子化部82、及び、固定長符号化部83を有する。画像ブロックは、エントロピー削減処理部81によるエントロピー削減処理と量子化部82による量子化の後、固定長符号生成部303により固定長符号化が行われる。なお、量子化部82は、画像ブロックを直接量子化してもよい。これらの処理により、符号量が固定長圧縮モード符号量101以下となる圧縮データ110が得られる。
図7は、可変長圧縮部109の構成の例を説明する図である。可変長圧縮部109は、エントロピー削減処理部91、量子化部92、及び、可変長符号化部93を有する。エントロピー削減処理部91及び量子化部92の作用は、仮圧縮部105が有するエントロピー削減処理部51及び量子化部52の作用と同一である。可変長符号化部93は、量子化された画像ブロックを可変長符号化することにより圧縮データ110を出力する。
以上の処理により、入力画像102を所定のデータサイズの圧縮データ110に圧縮できる。第1の実施の形態によれば、圧縮モード判定部106における圧縮モード選択の自由度が大きく、ブロック毎の割り当て符号量を可変にすることが可能であるため、画質が画面内で一様に近くなり、CBR制御よりも高品質な圧縮が可能となる。
〔第2の実施の形態〕
図3は、第2の実施形態に係る動画像符号化装置103の機能構成を説明する図である。動画像符号化装置103は、入力画像102が入力され、固定長圧縮モード符号量101に基づく圧縮モード判定により圧縮処理を行い、圧縮データ110を出力する。動画像符号化装置103は、画像ブロック用バッファ104、仮圧縮部105、圧縮モード判定部106、本圧縮部107を備える。
本実施の形態において、入力画像102は、第1の実施の形態と同様に、ブロックに分割され、画像ブロック用バッファ104に格納され、目標符号量が設定される。画像ブロック用バッファ104に格納された画像のブロックは、仮圧縮部105にて複数の異なるQPにより仮圧縮され、QP毎に対応する符号量が得られる。
図4は、仮圧縮部105の機能構成を説明する図である。本実施の形態において、仮圧縮部105の機能及び構成は第1の実施の形態と同一であるので、ここでは説明を省略する。
圧縮モード判定部106は、本圧縮部107により圧縮する際の圧縮モードを決定する。圧縮モード判定部106には、固定長圧縮モード符号量101が設定される。固定長圧縮モード符号量101は、ブロックに均等に符号を割り当てた場合の符号量以下となる値であり、ブロックの平均割り当て符号量以下となる値である。圧縮判定部106は、例えば第1の実施の形態で述べた方法を用いて、圧縮モードを選択する。
圧縮モード判定部106は、処理単位毎に、符号量上限ラインを超えない範囲で、圧縮モードを選択する。圧縮モード判定部106は、仮圧縮部105で生成する符号量を評価した可変長圧縮モードと固定長圧縮モードとの中から一つの圧縮モードを選択する。
図8は、圧縮モード判定部106が圧縮モードを判定する際の符号量上限ラインと制御線とを説明する図である。図8は、横軸を処理単位、縦軸を発生符号量の累計としたグラフである。図8において、符号量上限ラインは、固定長圧縮モード符号量を傾きとし、目標符号量から固定長圧縮モード符号量×画像中の処理単位数を減算したものを切片とする、一次関数である。符号量上限ラインを超えなければ、圧縮データは所定のデータサイズに収まることを保証している。すなわち、全てのブロックを固定長圧縮モードで圧縮すれば、生成する圧縮データは所定のデータサイズに収まる。
制御線は、符号量上限ライン以下の領域に位置し、画像データの所定の単位を圧縮する際に、圧縮の初期段階で符号量を多量に消費することを回避するために存在する。より詳細には、処理単位毎に、発生する符号量が制御線を超える場合に、圧縮モードを再度設定する。この際に、可変長圧縮におけるQPを大きくする、又は、固定長圧縮モードを選択する等の処理を行う。
図8における符号量上限ラインは一例であり、この一次関数によって表される値に対し有効数字の桁数を減じた近似値でもよい。また、図8において、発生符号量一定ラインは、目標符号量を処理単位の数で除した値を傾きとする一次関数である。発生符号量一定ラインを、処理単位毎の符号量を設定する際の下限とするとよい。図8に一例として示した制御線は、発生符号量一定ラインに定数のオフセットを加算したものとなっている。
本圧縮部107は、固定長圧縮部108と可変長圧縮部109とを有する。本圧縮部107は、入力画像102を所定のサイズ以下に圧縮し圧縮データ110を出力する。固定長圧縮部108には、固定長圧縮モード符号量101が設定される。本圧縮部107は、圧縮モード判定部106の選択結果に従い、固定長圧縮部108、又は、可変長圧縮部109の何れかで圧縮処理を行い、圧縮データ110を生成する。固定長圧縮部108及び可変長圧縮部109の機能及び構成は、第1の実施の形態と同一である。
以上の処理により、入力画像102を所定のデータサイズの圧縮データ110に圧縮できる。第2の実施の形態によれば、圧縮モード判定部106における圧縮モード選択の自由度が大きく、ブロック毎の割り当て符号量を可変にすることが可能であるため、画質が画面内で一様に近くなり、CBR制御よりも高品質な圧縮が可能となる。
〔第3の実施の形態〕
図3は、第3の実施形態に係る動画像符号化装置103の機能構成を説明する図である。動画像符号化装置103は、入力画像102が入力され、固定長圧縮モード符号量101に基づく圧縮モード判定により圧縮処理を行い、圧縮データ110を出力する。動画像符号化装置103は、画像ブロック用バッファ104、仮圧縮部105、圧縮モード判定部106、本圧縮部107を備える。
本実施の形態において、入力画像102は、第1の実施の形態と同様に、ブロックに分割され、画像ブロック用バッファ104に格納され、目標符号量が設定される。画像ブロック用バッファ104に格納された画像のブロックは、仮圧縮部105にて複数の異なるQPにより仮圧縮され、QP毎に対応する符号量が得られる。
本実施の形態において、仮圧縮部105の構成は、第1の実施の形態とほぼ同一であり、可変長符号化部53の機能が異なる。そこで、ここでは可変長符号化部53について説明する。
図9は、可変長符号化部53の機能構成の例を説明する図である。図9の可変長符号化部53は、特性の異なる複数の可変長符号化部(idx=0,1,…M)を備えている。より詳細には、各可変長符号化部(idx)が可変長符号化処理を行う際の、可変長符号テーブルがそれぞれ異なる。可変長符号化部53は、入力信号列に応じて符号量が最も少ない可変長符号化部(idx)を選択する。これにより、様々な入力画像に対して、適切な可変長符号テーブルを用いる圧縮処理を施すことができる。
なお、図9の例では、可変長符号化部(idx)が複数設けられる構成となっているが、複数の可変長符号テーブルを、一の可変長符号化部が切り替えて用いる構成でもよい。
以上の処理により生成する符号の符号量が得られ、圧縮モード判定部106に送られる。
圧縮モード判定部106は、本圧縮部107により圧縮する際の圧縮モードを決定する。圧縮モード判定部106には、固定長圧縮モード符号量101が設定される。固定長圧縮モード符号量101は、ブロックに均等に符号を割り当てた場合の符号量以下となる値であり、ブロックの平均割り当て符号量以下となる値である。圧縮判定部106は、例えば第1の実施の形態で述べた方法を用いて、圧縮モードを選択する。
圧縮モード判定部106は、処理単位毎に、符号量上限ラインを超えない範囲で、圧縮モードを選択する。圧縮モード判定部106は、仮圧縮部105で生成する符号量を評価した可変長圧縮モードと固定長圧縮モードとの中から一つの圧縮モードを選択する。
圧縮モード判定部106の処理の詳細は、第1の実施の形態と同様であるので、ここでは説明を省略する。また、本圧縮部107が有する固定長圧縮部108及び可変長圧縮部109の機能及び構成は、第1の実施の形態と同一である。
以上の処理により、入力画像102を所定のデータサイズの圧縮データ110に圧縮できる。この方式では、圧縮モード判定部106における圧縮モード選択の自由度が大きく、ブロック毎の割り当て符号量を可変にすることが可能であるため、画質が画面内で一様に近くなり、CBR制御よりも高品質な圧縮が可能となる。
〔第4の実施の形態〕
図3は、第4の実施形態に係る動画像符号化装置103の機能構成を説明する図である。動画像符号化装置103は、入力画像102が入力され、固定長圧縮モード符号量101に基づく圧縮モード判定により圧縮処理を行い、圧縮データ110を出力する。動画像符号化装置103は、画像ブロック用バッファ104、仮圧縮部105、圧縮モード判定部106、本圧縮部107を備える。
本実施の形態において、入力画像102は、第1の実施の形態と同様に、ブロックに分割され、画像ブロック用バッファ104に格納され、目標符号量が設定される。画像ブロック用バッファ104に格納された画像のブロックは、仮圧縮部105にて複数の異なるQPにより仮圧縮され、QP毎に対応する符号量が得られる。
図4は、仮圧縮部105の機能構成を説明する図である。本実施の形態において、仮圧縮部105の機能及び構成は第1の実施の形態と同一であるので、ここでは説明を省略する。仮圧縮部105の処理により生成する符号の符号量が得られ、圧縮モード判定部106に送られる。
圧縮モード判定部106は、本圧縮部107により圧縮する際の圧縮モードを決定する。圧縮モード判定部106には、固定長圧縮モード符号量101が設定される。固定長圧縮モード符号量101は、ブロックに均等に符号を割り当てた場合の符号量以下となる値であり、ブロックの平均割り当て符号量以下となる値である。
圧縮モード判定部106は、処理単位毎に、符号量上限ラインを超えない範囲で、圧縮モードを選択する。圧縮モード判定部106は、仮圧縮部105で生成する符号量を評価した可変長圧縮モードと固定長圧縮モードとの中から一つの圧縮モードを選択する。圧縮判定部106は、例えば第1の実施の形態で述べた方法を用いて、圧縮モードを選択する。
圧縮モード判定部106の処理の詳細は、第1の実施の形態と同様であるので、ここでは説明を省略する。
図10は、圧縮モード判定部106の機能構成の例を説明する図である。圧縮モード判定部106は、圧縮モード判定部61と圧縮モードバッファ62とを備える。圧縮モードバッファ62には、既に圧縮した画像の圧縮の難しさを示す値である圧縮困難度が保持されている。圧縮困難度は、例えば、QPであり、固定長圧縮モードにおいては、例えば、QPの最大値+1とするとよい。既に圧縮した画像とは、例えば、画像において一のブロックの直上のブロックを含むブロックラインに含まれる画像である。
圧縮モード判定部61は、さらに、未圧縮のブロックの圧縮困難度を、既に圧縮された画像の圧縮困難度として近似する。圧縮困難なブロックが未圧縮のブロックから検出された場合には、QPを大きくする圧縮モードの変更を行い、符号量を削減する。
図11は、既に圧縮した画像の圧縮困難度に基づく圧縮モードの変更を説明する図である。図11において、BL0は、1ブロックライン上のブロック毎のQPを示す。また図11において、BL1は、現在圧縮しているブロックを含むブロックラインのブロック毎のQPである。また、「QPave」は、「前の画像の処理単位毎の圧縮モード値」の平均値である。
図11において、圧縮困難度平均値QPaveと圧縮モードバッファに格納されたnブロック先の圧縮困難度QPとを比較し、nブロック先の圧縮困難度QPが、QPaveよりも所定数大きい場合は、現在選択されている圧縮モードをQPが大きくなるように変更する。図11では、BL0において、5番目のブロックの圧縮困難度QPが、QPaveよりも1.5大きい。そこで、BL1においては、3番目のブロックのQPを1に設定する。なお、このQP変更処理は、符号量に余裕がある場合は、必ずしも適用しなくてよい。例えば、圧縮済みデータの累積符号量が、図8における発生符号量一定ラインから定数のオフセットを減算したラインを超える場合に、QP変更処理を適用するようにしても良い。圧縮モード判定部61が決定した圧縮モードに対応した圧縮困難度は、圧縮モードバッファ62に格納される。
本圧縮部107は、固定長圧縮部108と可変長圧縮部109とを有する。本圧縮部107は、入力画像102を所定のサイズ以下に圧縮し圧縮データ110を出力する。固定長圧縮部108には、固定長圧縮モード符号量101が設定される。本圧縮部107は、圧縮モード判定部106の選択結果に従い、固定長圧縮部108、又は、可変長圧縮部109の何れかで圧縮処理を行い、圧縮データ110を生成する。固定長圧縮部108及び可変長圧縮部109の機能及び構成は、第1の実施の形態と同一である。
以上の処理により、入力画像102を所定のデータサイズの圧縮データ110に圧縮できる。この方式では、圧縮モード判定部106における圧縮モード選択の自由度が大きく、ブロック毎の割り当て符号量を可変にすることが可能であるため、画質が画面内で一様に近くなり、CBR制御よりも高品質な圧縮が可能となる。
〔第5の実施の形態〕
図3は、第5の実施形態に係る動画像符号化装置103の機能構成を説明する図である。動画像符号化装置103は、入力画像102が入力され、固定長圧縮モード符号量101に基づく圧縮モード判定により圧縮処理を行い、圧縮データ110を出力する。動画像符号化装置103は、画像ブロック用バッファ104、仮圧縮部105、圧縮モード判定部106、本圧縮部107を備える。
本実施の形態において、入力画像102は、第1の実施の形態と同様に、ブロックに分割され、画像ブロック用バッファ104に格納され、目標符号量が設定される。画像ブロック用バッファ104に格納された画像のブロックは、仮圧縮部105にて複数の異なるQPにより仮圧縮され、QP毎に対応する符号量が得られる。
本実施の形態において、仮圧縮部105の構成は、第1の実施の形態とほぼ同一であり、可変長符号化部53の機能が異なる。そこで、ここでは可変長符号化部53について説明する。
図12は、可変長符号化部53の構成の第1の実施の形態とは異なる例を説明する図である。可変長符号化部53は、正負反転部531と可変長符号化部532とを備える。正負反転部531は、入力される量子化後の信号列の正負を観測し、一定区間に入力された信号列が正に偏っている場合に、次に入力される信号は負である確率が高いとみなし、信号の正負を反転してから可変長符号化部532へ送る。なお、可変長符号化部532が可変長符号化するシンボルは、量子化後の変換係数等の他に、画素値でもよい。
図13は、入力信号列における既に観測された信号と、未だ観測されない信号とを説明する図である。図13では、観測された順に対応する値を左から順に並べ、未だ観測されていない値を記号「?」(疑問符)で示す。数値は、既に観測された信号の直前の信号との差分値である予測値である。図13の例では、既に観測された信号の予測値は、全て正の値である。したがって、未だ観測されていない信号の予測値は、負の値になる確率が高いとみなし、新たに観測する信号の正負を反転させる。
図14は、符号反転前と符号反転後との信号ヒストグラムを説明する図である。図14において、符号を反転させることにより、入力信号の分布に偏りが発生している。より詳細には、入力信号列において、正負がほぼ等確率で発生する性質を利用し、局所的に信号の正負に偏りが見られた場合に符号を反転することで、入力信号の分布に偏りを発生させる。これにより、符号長が、正と負とで非対称の可変長符号テーブルを用いる際にエントロピーを減少させることができる。可変長符号化部53は、入力信号を可変長符号化し、圧縮モード判定部106に送る。
圧縮モード判定部106は、本圧縮部107により圧縮する際の圧縮モードを決定する。圧縮モード判定部106には、固定長圧縮モード符号量101が設定される。固定長圧縮モード符号量101は、ブロックに均等に符号を割り当てた場合の符号量以下となる値であり、ブロックの平均割り当て符号量以下となる値である。
圧縮モード判定部106は、処理単位毎に、符号量上限ラインを超えない範囲で、圧縮モードを選択する。圧縮モード判定部106は、仮圧縮部105で生成する符号量を評価した可変長圧縮モードと固定長圧縮モードとの中から一つの圧縮モードを選択する。圧縮判定部106は、例えば第1の実施の形態で述べた方法を用いて、圧縮モードを選択する。
本圧縮部107の機能及び構成は、第1の実施の形態と同一である。
以上の処理により、入力画像102を所定のデータサイズの圧縮データ110に圧縮できる。この方式では、圧縮モード判定部106における圧縮モード選択の自由度が大きく、ブロック毎の割り当て符号量を可変にすることが可能であるため、画質が画面内で一様に近くなり、CBR制御よりも高品質な圧縮が可能となる。
〔第6の実施の形態〕
図3は、第6の実施形態に係る動画像符号化装置103の機能構成を説明する図である。動画像符号化装置103は、入力画像102が入力され、固定長圧縮モード符号量101に基づく圧縮モード判定により圧縮処理を行い、圧縮データ110を出力する。動画像符号化装置103は、画像ブロック用バッファ104、仮圧縮部105、圧縮モード判定部106、本圧縮部107を備える。
入力画像102は、複数のコンポーネント信号を含む。複数のコンポーネント信号とは、例えば、RGBやYUV等である。本実施の形態において、入力画像102は、コンポーネント毎に、ブロックに分割され、画像ブロック用バッファ104に格納され、目標符号量が設定される。画像ブロック用バッファ104に格納された画像のブロックは、コンポーネント毎に、仮圧縮部105にて複数の異なるQPにより仮圧縮され、QP毎に対応する符号量が得られる。
図4は、仮圧縮部105の機能構成を説明する図である。仮圧縮部105は、エントロピー削減処理部51、量子化部52、及び、可変長符号化部53を有する。エントロピー削減処理部51は、画像ブロック用バッファ104に格納されたブロックに対し、画素予測値との差分処理、又は、DCT等の線形変換を行う。
ここで、入力画像の画素値に対して、制限範囲を設ける。一般的に、画素予測値と入力画素との差分値のビット長は、入力画素のビット数+1となる。例えば、8ビットの入力画素のとり得る値は0〜255で、差分信号のとり得る値は、−255〜255で符号付9ビットとなる。
そこで、入力画像の画素値を、あらかじめ量子化幅によってきまる範囲内に制限すれば、差分値を符号無しの値としてビット長を入力画素のビット長と同一に納めることができる。入力画素を復元する際には、画素予測値に、量子化誤差を含む差分値を加算したのち、キャリービットを破棄すればよい。この画素値の制限範囲は、入力画像を、量子化し、逆量子化し、画像復元を行った際に、誤差が、量子化幅以内に収まるように決定する。
例えば、ロスレス圧縮の場合、画素値が0、予測値が255の時は、差分値を−255ではなく+1として取り扱う。画素復元時には、予測値255に差分値+1を加算し、256が得られる。256は2進数で100000000なので、キャリービットを破棄し、下位8ビットを抜き出すことで、元の画素0が復元できる。
一方、ロッシー圧縮の場合、画素値が0、予測値が255のとき、差分信号を量子化幅3で量子化する例を考える。画素値の範囲の制限が無い場合、差分信号は+1で、これを量子化幅3で量子化すると1/3=0(四捨五入)となる。逆量子化して得られた差分値も3×0=0のままなので、予測値255と差分値0からもとの画素値0を復元することができない。そこで、画素値を2〜253の間に制限するようにする。画素値0は値の制限により2として扱われ、予測値は255、差分信号は+3となる。差分信号を量子化幅3で量子化すると、3/3=1(四捨五入)となる。これを逆量子化すると、差分信号+3が得られる。予測値255に差分信号+3を加算すると258が得られる。258は2進数で100000010なので、キャリービットを破棄し、下位8ビットを抜き出すことで、入力画素を2として復元できる(誤差2)。
この一連の処理により、符号化するためのシンボル数を減らすことができ、圧縮性能を向上し、回路規模を削減する効果がある。また、この処理は、高スループットで実現できる。そこで、この処理を適用しても良い。
量子化部52は、エントロピー削減処理部51が出力するブロック、又は、画像ブロック用バッファに格納されているブロックを量子化する。可変長符号化部53は、量子化されたブロックを可変長符号化する。
本実施の形態において、可変長符号化部53の機能及び構成は、第3の実施の形態と同一であるので、ここでは説明を省略する。
以上の処理により生成する符号の符号量が得られ、圧縮モード判定部106に送られる。
圧縮モード判定部106は、本圧縮部107により圧縮する際の圧縮モードを決定する。圧縮モード判定部106には、固定長圧縮モード符号量101が設定される。固定長圧縮モード符号量101は、ブロックに均等に符号を割り当てた場合の符号量以下となる値であり、ブロックの平均割り当て符号量以下となる値である。圧縮判定部106は、例えば第1の実施の形態で述べた方法を用いて、圧縮モードを選択する。
圧縮モード判定部106は、処理単位毎に、符号量上限ラインを超えない範囲で、圧縮モードを選択する。圧縮モード判定部106は、仮圧縮部105で生成する符号量を評価した可変長圧縮モードと固定長圧縮モードとの中から一つの圧縮モードを選択する。
圧縮モード判定部106の処理の詳細は、第1の実施の形態と同様であるので、ここでは説明を省略する。また、本圧縮部107が有する固定長圧縮部108及び可変長圧縮部109の機能及び構成は、第1の実施の形態と同一である。
圧縮データ110は、第1QP、QPオフセット、idx、予測に係る情報、及び、画素毎に対応するシンボル値を有する。第1QPは、複数のコンポーネントのうちの一のコンポーネント信号に対応する。QPオフセットは、他のコンポーネント信号のQPと第1QPとの差であり、第1QPに加算することにより、他のコンポーネント信号のQPを算出する。idxは、各コンポーネント信号の可変長符号化の方式を識別する情報である。予測に係る情報は、各コンポーネント信号の予測に関わる情報であり、予測方向及び予測値計算式等の情報を含む。
一つのシンボル値は、複数のコンポーネント信号を含む。一つのシンボル値は、連続する複数のプレフィックスと、連続する複数のサフィックスと、で構成される。連続する複数のプレフィクスの内の一つのプレフィクスと、連続する複数のサフィックスの内の一つのサフィックスと、から得られる第二シンボル値が、一つのコンポーネントの信号となる。第二シンボル値の例としては、プレフィックスが可変長のユーナリコード、サフィックス長がidxおよびプレフィクス長によって決定されるゴロムライス符号があげられる。
以下に、YUV444フォーマットの画像を圧縮する際の圧縮データのデータ構造の例を2例示す。YUV444_compression_dataは、輝度Yに対し、色差U,Vが、それぞれQPオフセットを有する例である。
YUV444_compression_data

・QP_Y (YのQP)
・QP_offsetU (UのQP=QP_Y+QP_offsetU)
・QP_offsetV (VのQP=QP_Y+QP_offsetV)
・VLC_idxY (Yの可変長符号化idx)
・VLC_idxU (Uの可変長符号化idx)
・VLC_idxV (Vの可変長符号化idx)
・symbol_YUV444_1 (YUV圧縮シンボルの第一番目要素)
・symbol_YUV444_2 (YUV圧縮シンボルの第二番目要素)
・・・
・symbol_YUV444_i (YUV圧縮シンボルの第i番目要素)
・・・
・symbol YUV444_n (YUV圧縮シンボルの第n番目要素)
symbolYUV444_i (YUV圧縮シンボルの第i番目要素)

・prefixY (Yを構成するシンボルのプレフィクス)
・prefixU (Uを構成するシンボルのプレフィクス)
・prefixV (Vを構成するシンボルのプレフィクス)
・suffixY (Yを構成するシンボルのサフィックス)
・suffixU (Uを構成するシンボルのサフィックス)
・suffixV (Vを構成するシンボルのサフィックス)
symbolYUV444_iの例について、以下説明する。例えば、prefixは可変長のユーナリコードであり、suffixはprefix長と可変長符号化のidxにより決定される。以下の例では、Yのsuffix長=4、Uのsuffix長=5、Vのsuffix長=3である。
ここでは、それぞれのプレフィックスとサフィックスとを示すが、シンボル中では、これらのコードは、連続している。
prefixY 000001
prefixU 00001
prefixV 01
suffixY 1010
suffixU 11111
suffixV 101
この場合、Y、U、Vのシンボルは、それぞれ以下の通りとなる。
Yのシンボル 000001|1010
Uのシンボル 00001|11111
Vのシンボル 01|101
また、YUV444_compression_data2は、予測に関わる情報を有し、さらに、輝度Yに対し、色差U,Vが、共通のQPオフセットを有する例である。
YUV444_compression_data2

・predMode_Luma (Yの予測に関わる情報)
・predMode_Chroma (UとVの予測に関わる情報)
・QP_Luma (YのQP)
・QP_offsetChroma (UとVのQP=QP_Y+QP_offsetChroma)
・VLC_idxLuma (Yの可変長符号化idx)
・VLC_idxChroma (UとVの可変長符号化idx)
・symbol_YUV444_1 (YUV圧縮シンボルの第一番目要素)
・symbol_YUV444_2 (YUV圧縮シンボルの第二番目要素)
・・・
・symbol_YUV444_i (YUV圧縮シンボルの第i番目要素)
・・・
・symbol YUV444_n (YUV圧縮シンボルの第n番目要素)
次に、YUV422フォーマットの画像を圧縮する際の圧縮データのデータ構造の例を示す。YUV422_compression_dataは、輝度Yに対し、色差U,Vが、それぞれQPオフセットを有する例である。YUV422フォーマットの圧縮データは、輝度Yと色差Uとの組み合わせからなるシンボルの要素と、輝度Yと色差Vとの組み合わせからなるシンボルの要素とを有する。
YUV422_compression_data

・QP_Y (YのQP)
・QP_offsetU (UのQP=QP_Y+QP_offsetU)
・QP_offsetV (VのQP=QP_Y+QP_offsetV)
・VLC_idxY (Yの可変長符号化idx)
・VLC_idxU (Uの可変長符号化idx)
・VLC_idxV (Vの可変長符号化idx)
・symbol_YU_1 (YU圧縮シンボルの第一番目要素)
・symbol_YV_1 (YV圧縮シンボルの第一番目要素)
・・・
・symbol_YU_i (YU圧縮シンボルの第i番目要素)
・symbol_YV_i (YV圧縮シンボルの第i番目要素)
・・・
・symbol_YU_n (YU圧縮シンボルの第n番目要素)
・symbol_YV_n (YV圧縮シンボルの第n番目要素)
symbolYU_i{
・prefixY (Yを構成するシンボルのプレフィクス)
・prefixU (Uを構成するシンボルのプレフィクス)
・suffixY (Yを構成するシンボルのサフィックス)
・suffixU (Uを構成するシンボルのサフィックス)
symbolYV_i{
・prefixY (Yを構成するシンボルのプレフィクス)
・prefixV (Vを構成するシンボルのプレフィクス)
・suffixY (Yを構成するシンボルのサフィックス)
・suffixV (Vを構成するシンボルのサフィックス)
symbolYUiの例について、以下説明する。例えば、prefixは可変長のユーナリコードであり、suffixはprefix長と可変長符号化のidxにより決定される。以下の例では、Yのsuffix長=2、Uのsuffix長=3である。
ここでは、それぞれのプレフィックスとサフィックスとを示すが、シンボル中では、これらのコードは、連続している。
prefixY 0001
prefixU 001
suffixY 11
suffixU 101
この場合、Y、U、Vのシンボルは、それぞれ以下の通りとなる。
Yのシンボル 0001|11
Uのシンボル 001|101
symbolYViの例について、以下説明する。例えば、prefixは可変長のユーナリコードであり、suffixはprefix長と可変長符号化のidxにより決定される。以下の例では、Yのsuffix長=2、Vのsuffix長=5である。
ここでは、それぞれのプレフィックスとサフィックスとを示すが、シンボル中では、これらのコードは、連続している。
prefixY 000001
prefixV 01
suffixY 01
suffixV 10101
この場合、Y、U、Vのシンボルは、それぞれ以下の通りとなる。
Yのシンボル 000001|01
Vのシンボル 01|10101
以上の処理により、入力画像102を所定のデータサイズの圧縮データ110に圧縮できる。この方式では、圧縮モード判定部106における圧縮モード選択の自由度が大きく、ブロック毎の割り当て符号量を可変にすることが可能であるため、画質が画面内で一様に近くなり、CBR制御よりも高品質な圧縮が可能となる。
〔第7の実施の形態〕
本発明の実施の形態は、第1の実施の形態から第6の実施の形態のうち、何れか一以上の実施の形態が組み合わされたものでもよい。図15は、動画像符号化装置103による動画像を圧縮する処理を説明するフロー図である。図15の処理では、入力された画像データがブロックに分割され、所定の符号量以下となる圧縮モードが選択されて圧縮されることにより、圧縮データが生成される。
図15のステップS101では、入力画像102の所定の単位が、ブロックに分割され、画像ブロック用バッファ104に格納される。ステップS101に続くステップS102からステップS107の処理は、所定の単位に含まれるブロックの数だけ繰り返される。
ステップS102では、仮圧縮部105が、複数の可変長圧縮モードによる圧縮処理を行い、生成する符号の符号量を算出する。ここでは、異なる複数のQPにより圧縮処理を行うとよい。また、一のQPに対し、異なる可変長符号テーブルを用いてもよい。
ステップS102に続くステップS103では、圧縮モード判定部106が、ステップS102で符号量が算出された複数の可変長圧縮モードと固定長圧縮モードとの中から、一の圧縮モードを選択する。より詳細には、例えば、図7に基づいて、符号量が所定の値以下となる圧縮モードが選択される。圧縮判定部106は、例えば第1の実施の形態で述べた方法を用いて、圧縮モードを選択する。
圧縮モード判定部106は、さらに、圧縮モードバッファ62に、圧縮モードの情報を格納させる。この情報は、圧縮率に係る情報であり、例えば、QP等の量子化のパラメータ、ブロックの符号量、又は、圧縮率等である。QPは、例えば、量子化ステップ幅でもよい。
ステップS103に続いてステップS104に進む。ステップS104では、既に圧縮されたブロックの圧縮率に係る情報を利用し、圧縮モードを更新する。例えば、図11に示す、1ブロックライン上のQPaveを用いる処理があげられる。
ステップS104に続いてステップS105に進み、ステップS104で選択された圧縮モードが、固定長圧縮モードであるか否かの判断がなされる。固定長圧縮モードである場合には、ステップS106に進み、固定長圧縮モードではない場合には、ステップS107に進む。
ステップS105に続くステップS106では、固定長圧縮部108が、固定長圧縮モードにより各ブロックを符号化して圧縮データを生成する。一方、ステップS105に続くステップS107では、可変長圧縮部109が、可変長圧縮モードにより各ブロックを符号化して圧縮データを生成する。ステップS106又はステップS107の処理の後、未だ処理されていないブロックがある場合には、ステップS102に戻って処理を繰り返す。一方、全てのブロックが処理されている場合には、処理を終了する。
図16は、可変長圧縮部109による図15のステップS107の処理の詳細を説明するフロー図である。ステップS201では、エントロピー削減処理が行われる。エントロピー削減処理は、画素毎の差分演算等の予測処理、又は、DCT等による線形変換等である。ステップS201に続いてステップS202に進み、ステップS201でエントロピー削減処理された値に対し、量子化処理が行われる。なお、量子化処理は、エントロピー削減処理される前の値に対して行われてもよい。
ステップS202に続いてステップS203に進み、既に生成された可変長符号に対して、入力された信号列が正又は負の何れか一に偏っているか否かの判断がなされる。正又は負に偏っている場合にはステップS204に進み、偏っていない場合にはステップS205に進む。ステップS203に続いてステップS204に進み、可変長符号化を行うシンボルの正負を反転する。ステップS204の後、ステップS205に進む。
ステップS205では、異なる複数の可変長符号テーブルのそれぞれに対応する可変長符号を生成する。ステップS205に続いてステップS206に進み、ステップS205で生成された可変長符号のうち、符号量が最小の可変長符号を選択して出力する。なお、ステップS203からステップS205の処理は、図15のステップS102において行われてもよい。
(コンピュータ等による実現)
上述の各実施の形態の動画像符号化装置は、例えば、ASIC回路として実現されることができる。上述の各実施の形態の動画像符号化装置は、パーソナルコンピュータ(PC)等で実現されても構わない。また、上述の各実施の形態の動画像符号化方法は、例えば、CPUがROMやハードディスク装置等に記憶されたプログラムに従い、RAM等のメインメモリをワークエリアとして使用し、実行される。
本発明は、上述の実施の形態に限定されるものではない。本発明の主旨をそこなわない範囲で変更することが可能である。
本発明の動画像符号化装置は、動画像を記録又は送信する装置に有用である。
51 エントロピー削減処理部
52 量子化部
53 可変長符号化部
61 圧縮モード判定部
62 圧縮モードバッファ
81 エントロピー削減処理部
82 量子化部
83 固定長符号化部
91 エントロピー削減処理部
92 量子化部
93 可変長符号化部
101 固定長圧縮モード符号量
102 入力画像
103 動画像符号化装置
104 画像ブロック用バッファ
105 仮圧縮部
106 圧縮モード判定部
107 本圧縮部
108 固定長圧縮部
109 可変長圧縮部
110 圧縮データ
303 固定長符号生成部
531 正負反転部
532 可変長符号化部

Claims (11)

  1. 画像データの所定の単位を分割した処理単位毎に、互いに圧縮率が異なる複数の可変長圧縮モードにより圧縮することにより、前記可変長圧縮モード毎の符号量を算出する算出手段と、
    算出された前記可変長圧縮モード毎の符号量及び前記画像データを固定長圧縮モードにより圧縮する際の符号量に基づいて、前記可変長圧縮モード及び前記固定長圧縮モードの中から、符号量の累計が所定の符号量以下となる圧縮モードを選択する選択手段と、
    選択された前記圧縮モードにより前記処理単位の画像データを圧縮して圧縮データを生成する圧縮手段と、
    を有する動画像符号化装置。
  2. 前記所定の符号量は、前記所定の単位を前記処理単位毎に固定長圧縮モードにより圧縮する際の、前記処理単位当たりの平均符号量に基づく値である請求項1記載の動画像符号化装置。
  3. 前記所定の符号量は、前記所定の単位に対して設定される目標符号量と、前記所定の単位のうち前記圧縮手段によりまだ圧縮されていない処理単位の数と前記平均符号量とを乗じた数と、の差以下の値又は差である請求項2記載の動画像符号化装置。
  4. 前記処理単位は、前記画像データが矩形に分割されラスター順に並ぶ前記矩形のうちの一つであり、
    前記選択手段は、既に圧縮済みの矩形において選択された圧縮モードによる圧縮率に係る情報を利用して、前記一の矩形に対して選択される圧縮モードを更新する請求項4記載の動画像符号化装置。
  5. 前記圧縮手段は、可変長圧縮手段と固定長圧縮手段とを有し、
    前記可変長圧縮手段は、既に生成された可変長符号に対応する可変長符号化前のシンボル値が正又は負の何れかに偏る場合に、新たに可変長符号化するシンボル値の正負を反転させる請求項4記載の動画像符号化装置。
  6. 前記可変長圧縮手段は、生成する可変長符号が異なる複数の可変長符号化を行い、生成した可変長符号のうち符号量が最小である可変長符号を出力する請求項5記載の動画像符号化装置。
  7. 前記画像データが、複数のコンポーネント信号を有する場合に、
    前記算出手段は、前記処理単位のコンポーネント信号毎に、前記圧縮モード毎の符号量を算出し、
    前記選択手段は、前記処理単位毎のコンポーネント信号に対応する符号量の和に基づいて、圧縮モードを選択することを特徴とする請求項1記載の動画像符号化装置。
  8. 前記圧縮手段は、画素値の差分信号を量子化して圧縮データを生成し、
    前記画像データに対し、前記圧縮データを逆量子化して復号する際の誤差が量子化幅以内になる画素値の範囲の制限を行う制限手段を有することを特徴とする請求項7記載の動画像符号化装置。
  9. 前記圧縮手段は、量子化及び可変長符号化を含む圧縮を行い、前記圧縮データに、一の前記コンポーネント信号に対応する量子化幅に係る情報である量子化パラメータ、前記量子化幅と他のコンポーネント信号の量子化幅との差に係る情報である量子化パラメータオフセット、前記コンポーネント信号毎の可変長符号表の識別情報、及び、複数のコンポーネント信号の可変長符号を含むシンボル値を含ませることを特徴とする請求項7記載の動画像符号化装置。
  10. 前記圧縮手段は、さらに、前記コンポーネント信号毎の予測を行い、前記圧縮データに、さらに、前記コンポーネント信号毎の予測に関わる情報を含ませることを特徴とする請求項9記載の動画像符号化装置。
  11. 一の画素の一のコンポーネント信号の可変長符号が、一のプレフィックスと一のサフィックスとの結合により表される場合に、
    前記圧縮手段は、前記シンボル値に、複数のコンポーネント信号のプレフィックスが連続する符号列と、複数のコンポーネント信号のサフィックスが連続する符号列と、を含ませることを特徴とする請求項10記載の動画像符号化装置。
JP2010532837A 2008-10-10 2009-06-05 動画像符号化装置 Expired - Fee Related JP5524072B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010532837A JP5524072B2 (ja) 2008-10-10 2009-06-05 動画像符号化装置

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2008264501 2008-10-10
JP2008264501 2008-10-10
JP2009044518 2009-02-26
JP2009044518 2009-02-26
PCT/JP2009/060382 WO2010041488A1 (ja) 2008-10-10 2009-06-05 動画像符号化装置
JP2010532837A JP5524072B2 (ja) 2008-10-10 2009-06-05 動画像符号化装置

Publications (2)

Publication Number Publication Date
JPWO2010041488A1 true JPWO2010041488A1 (ja) 2012-03-08
JP5524072B2 JP5524072B2 (ja) 2014-06-18

Family

ID=42100445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010532837A Expired - Fee Related JP5524072B2 (ja) 2008-10-10 2009-06-05 動画像符号化装置

Country Status (3)

Country Link
US (1) US9131249B2 (ja)
JP (1) JP5524072B2 (ja)
WO (1) WO2010041488A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011259362A (ja) * 2010-06-11 2011-12-22 Sony Corp 画像処理装置および方法
KR101824167B1 (ko) * 2011-04-06 2018-02-02 삼성디스플레이 주식회사 표시 장치를 위한 영상 압축 장치 및 방법
US9378560B2 (en) 2011-06-17 2016-06-28 Advanced Micro Devices, Inc. Real time on-chip texture decompression using shader processors
JP5149427B2 (ja) 2011-06-22 2013-02-20 シャープ株式会社 符号化装置、復号化装置、符復号化システム、符号化方法及び復号化方法
JP5818588B2 (ja) * 2011-09-05 2015-11-18 株式会社東芝 放射線検出データ処理装置及び方法
JP5591838B2 (ja) 2012-02-02 2014-09-17 株式会社東芝 画像符号化装置、及び方法
US8754792B2 (en) * 2012-07-14 2014-06-17 Sigma Designs, Inc. System and method for fixed rate entropy coded scalar quantization
JP2014179707A (ja) * 2013-03-13 2014-09-25 Toshiba Corp 画像符号化装置、及びその方法
US9294766B2 (en) 2013-09-09 2016-03-22 Apple Inc. Chroma quantization in video coding
JP6196117B2 (ja) * 2013-10-08 2017-09-13 株式会社東芝 画像符号化装置及び画像復号装置
US10536699B2 (en) 2015-06-03 2020-01-14 Nec Corporation Moving image coding device, moving image coding method and recording medium for storing moving image coding program
GB2550965B (en) * 2016-06-03 2019-11-20 Advanced Risc Mach Ltd Encoding and decoding arrays of data elements
JP6360591B2 (ja) * 2017-05-22 2018-07-18 株式会社東芝 画像符号化装置、及びその方法
JP7279109B2 (ja) * 2020-07-29 2023-05-22 キヤノン株式会社 画像復号方法及びプログラム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3205087B2 (ja) * 1992-11-06 2001-09-04 キヤノン株式会社 画像処理装置及び方法
US6553143B2 (en) * 1992-06-30 2003-04-22 Canon Kabushiki Kaisha Image encoding method and apparatus
JPH06153172A (ja) * 1992-10-30 1994-05-31 Hitachi Ltd 符号量制御方式
KR0155784B1 (ko) * 1993-12-16 1998-12-15 김광호 영상데이타의 적응형 가변장 부호화/복호화방법
US6704494B1 (en) * 1995-03-15 2004-03-09 Kabushiki Kaisha Toshiba Moving picture coding and/or decoding systems, and variable-length coding and/or decoding system
US7116829B1 (en) * 1996-11-06 2006-10-03 Matsushita Electric Industrial Co., Ltd. Image coding and decoding methods, image coding and decoding apparatuses, and recording media for image coding and decoding programs
JP2001224027A (ja) * 2000-02-08 2001-08-17 Ricoh Co Ltd 画像符号化装置、画像符号化方法、およびコンピュータが実行可能なプログラムを記録した記録媒体
US7505485B2 (en) * 2002-01-22 2009-03-17 Microsoft Corporation Methods and systems for start code emulation prevention and data stuffing
JP4089753B2 (ja) * 2002-03-28 2008-05-28 ソニー株式会社 画像圧縮符号化装置及び方法、プログラム、並びに記録媒体
US7158684B2 (en) * 2002-04-25 2007-01-02 Texas Instruments Incoporated Entropy coding scheme for video coding
EP1487113B1 (de) * 2002-05-02 2006-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung und Dekodierung von Transformationskoeffizienten in Bild- oder Videokodierern
JP4240283B2 (ja) * 2002-10-10 2009-03-18 ソニー株式会社 復号装置及び復号方法
US6900748B2 (en) * 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
US7660355B2 (en) * 2003-12-18 2010-02-09 Lsi Corporation Low complexity transcoding between video streams using different entropy coding
US7646814B2 (en) * 2003-12-18 2010-01-12 Lsi Corporation Low complexity transcoding between videostreams using different entropy coding
US7936938B2 (en) * 2004-09-07 2011-05-03 Canon Kabushiki Kaisha Methods and devices for encoding a digital image signal and associated decoding methods and devices
DE102004049156B4 (de) * 2004-10-08 2006-07-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codierschema für einen ein zeitlich veränderliches Graphikmodell darstellenden Datenstrom
JP4495034B2 (ja) * 2005-06-01 2010-06-30 パナソニック株式会社 可変長符号化方式および可変長符号化装置
KR100718134B1 (ko) * 2005-07-21 2007-05-14 삼성전자주식회사 비트율에 적응적인 영상 데이터 이진 산술 부호화/복호화장치 및 방법
WO2007108395A1 (ja) * 2006-03-23 2007-09-27 Nec Corporation 可変長符号の復号装置および復号方法
FR2900004A1 (fr) * 2006-04-18 2007-10-19 Thomson Licensing Sas Procede et dispositif de decodage arithmetique
JP4825644B2 (ja) * 2006-11-14 2011-11-30 ルネサスエレクトロニクス株式会社 画像復号装置、画像符号化装置、およびシステムlsi
EP2112764A1 (en) * 2008-04-25 2009-10-28 Thomson Licensing Method for encoding a sequence of integers, storage device and signal carrying an encoded integer sequence and method for decoding a sequence of integers
KR101611375B1 (ko) * 2008-08-19 2016-04-11 톰슨 라이센싱 압축된 비디오에서 구문 요소의 cabac/avc 준수 워터마킹

Also Published As

Publication number Publication date
WO2010041488A1 (ja) 2010-04-15
JP5524072B2 (ja) 2014-06-18
US9131249B2 (en) 2015-09-08
US20110164678A1 (en) 2011-07-07

Similar Documents

Publication Publication Date Title
JP5524072B2 (ja) 動画像符号化装置
US11463698B2 (en) Selection of the maximum dynamic range of transformed data and the data precision of transform matrices according to the bit depth of input data
KR100970315B1 (ko) 트랜스코더 및 부호화 화상 변환 방법
EP3020196B1 (en) Data encoding and decoding
US9282329B2 (en) Methods and devices for data compression using offset-based adaptive reconstruction levels
JP4354520B2 (ja) 符号化装置
US10616581B2 (en) Modified coding for a transform skipped block for CABAC in HEVC
US8213498B2 (en) Bitrate reduction techniques for image transcoding
US8396311B2 (en) Image encoding apparatus, image encoding method, and image encoding program
US7388995B2 (en) Quantization matrix adjusting method for avoiding underflow of data
EP3270591A2 (en) Modified coding for a transform skipped block for cabac in hevc
US20120128064A1 (en) Image processing device and method
JP2004135251A (ja) 画像情報符号化方法及び画像情報復号方法
EP3014879B1 (en) Modified coding for a transform skipped block for cabac in hevc
CN108702513B (zh) 用于在显示流压缩中量化参数的适应性计算的设备及方法
JPWO2009157577A1 (ja) 画像処理装置及び画像処理方法
WO2006098226A1 (ja) 符号化装置および符号化装置を備えた動画像記録システム
JP5231243B2 (ja) 符号化装置及び符号化方法
JPH09200758A (ja) 画像符号化装置
JP2003230142A (ja) 画像情報符号化方法及び装置、並びにプログラム及び記録媒体
JPWO2002080567A1 (ja) 画像信号量子化装置およびその方法
JP2004235683A (ja) 画像処理装置および符号化装置とそれらの方法
US7623720B2 (en) Image processing apparatus and method
KR20070076166A (ko) 영상의 변화율에 따른 적응적 비트율 제어 장치 및 방법
KR100225348B1 (ko) 양자화번호 결정을 위한 양자화계수 카운트장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120321

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130625

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140409

LAPS Cancellation because of no payment of annual fees