WO2005104561A1

WO2005104561A1 - データ処理装置およびその方法と符号化装置

Info

Publication number: WO2005104561A1
Application number: PCT/JP2005/007472
Authority: WO
Inventors: Daisuke Tsuru; Hideyuki Ichihashi; Yuji Ando
Original assignee: Sony Corporation
Priority date: 2004-04-20
Filing date: 2005-04-19
Publication date: 2005-11-03
Also published as: TW200539000A; US7711197B2; JP2005311559A; US20070122047A1; TWI277890B; CN100471272C; CN1788495A; EP1650976A1; KR20060132761A

Abstract

　符号化により得られた符号化データを基に、当該符号化データが復号時に復号に供されるビットレートを特定する。また、被処理データの符号化難易度を検出する。そして、上記特定した前記ビットレートと、上記検出した前記符号化難易度とを基に、前記量子化スケールを制御する。

Description

明細書

データ処理装置およびその方法と符号化装置

技術分野

[0001] 本発明は、量子化スケールを適切に決定できるデータ処理装置およびその方法と符号化装置に関する。

背景技術

[0002] 近年、画像データとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮する MPEG(Moving Picture Experts Group)や JVT(Joint Video Team)などの規格に準拠した装置が開発されている。

このような規格の符号ィ匕装置では、画像の局所的な情報を利用することにより、効率の良、符号化を実現して、る。

画像には、画像中で複雑な部分は、他の部分よりも量子化を粗くして符号化しても、肉眼では画質劣化が認識され難!、と、う性質がある。

[0003] 従って、従来の符号化装置では、画像を複数の部分に分け、各部分にっ、て、画像の複雑度を検出し、その検出結果を基に、複雑な画像の部分は粗く量子化し、そうでない部分は細力べ量子化して、画質劣化の影響を抑えながら、データ量を削減している。

このような画像の複雑度の情報は、アクティビティ (activity)と呼ばれて、る。従来の符号化装置では、量子化対象の画像データのアクティビティを算出し、当該アクティビティに基づ、て、量子化スケールを規定する量子化スケールを各ピクチャ毎に生成している。すなわち、各ピクチャ毎に、当該ピクチヤに割り当てるビット量を決定している。

ところで、符号ィ匕装置が生成した符号ィ匕データは、復号装置において、ノッファ CP B(Coded Picture Buffer)に蓄積された後に、符号化データを構成するピクチャが所定のピクチャレートで復号部に順に供給されて復号される。

ここで、バッファ CPB力復号部に 1つのピクチヤが供給されることによりバッファ CP Bのデータ蓄積量が減少する量は、当該ピクチヤのデータ量、すなわち当該ピクチャの量子化パレメータに依存する。

従って、符号化装置は、復号装置のバッファ CPBがアンダーフローしないように、上記量子化スケールを決定する必要がある。

発明の開示

発明が解決しょうとする課題

[0004] しかしながら、上述した従来の符号化装置では、量子化対象の画像データのァクテイビティのみを基に、各ピクチャの量子化スケールを決定しているため、ノッファ CPB の状態を適切に保つように最終的に符号ィ匕されるピクチャのデータ量を制御できない場合があり、復号された画像の品質が低いという問題がある。

[0005] 本発明は力かる事情に鑑みてなされたものであり、高品質な復号画像を得ることが可能な符号化データを生成できるデータ処理装置およびその方法と符号化装置を提供することを目的とする。

課題を解決するための手段

[0006] 上述した従来技術の問題を解決し、上述した目的を達成するために、第 1の発明は、被処理データを量子化して符号化する場合に、前記量子化の量子化スケールを決定するデータ処理装置であって、前記符号化により得られた符号化データを基に、当該符号化データが復号時に復号に供されるビットレートを特定する特定回路と、前記被処理データの符号化難易度を検出する符号化難易度検出回路と、前記特定回路が特定した前記ビットレートと、前記符号化難易度検出回路が検出した前記符号化難易度とを基に、前記量子化スケールを制御する量子化制御回路とを有する。

[0007] 第 1の発明のデータ処理装置の作用は以下のようになる。

特定回路が、符号化により得られた符号化データを基に、当該符号化データが復号時に復号に供されるビットレートを特定する。

また、符号化難易度検出回路が、前記被処理データの符号化難易度を検出する。そして、量子化制御回路が、前記特定回路が特定した前記ビットレートと、前記符号化難易度検出回路が検出した前記符号化難易度とを基に、前記量子化スケールを制御する。 [0008] 第 2の発明のデータ処理方法は、被処理データを量子化して符号ィヒする場合に、前記量子化の量子化スケールを決定するデータ処理方法であって、前記符号化により得られた符号化データを基に、当該符号化データが復号時に復号に供されるビットレートを特定する第 1の工程と、前記被処理データの符号化難易度を検出する第 2の工程と、前記第 1の工程で特定した前記ビットレートと、前記第 2の工程で検出した前記符号化難易度とを基に、前記量子化スケールを制御する第 3の工程とを有する。

[0009] 第 2の発明のデータ処理方法の作用は以下のようになる。

第 1に工程において、符号化により得られた符号化データを基に、当該符号化デ一タが復号時に復号に供されるビットレートを特定する。

また、第 2の工程において、前記被処理データの符号化難易度を検出する。

そして、第 3の工程において、前記第 1の工程で特定した前記ビットレートと、前記第 2の工程で検出した前記符号化難易度とを基に、前記量子化スケールを制御する

[0010] 第 3の発明の符号ィ匕装置は、量子化スケールを算出する量子化スケール算出回路と、前記量子化スケール算出回路が算出した前記量子化スケールを基に、被処理データを量子化する量子化回路と、前記量子化回路の量子化結果を符号化して符号化データを生成する符号化回路とを有し、前記量子化スケール算出回路は、前記符号化回路が生成した前記符号化データを基に、当該符号化データが復号時に復号に供されるビットレートを特定する特定回路と、前記被処理データの符号化難易度を検出する符号化難易度検出回路と、前記特定回路が特定した前記ビットレートと、前記符号化難易度検出回路が検出した前記符号化難易度とを基に、前記量子化スケールを制御する量子化制御回路とを有する。

[0011] 第 3の発明の符号化装置の作用は以下のようになる。

量子化スケール算出回路が、第 1の発明と同様の作用により、量子化スケールを算出する。

次に、量子化回路が、前記量子化スケール算出回路が算出した前記量子化スケールを基に、被処理データを量子化する。次に、符号化回路が、前記量子化回路の量子化結果を符号化して符号化データを生成する。

発明の効果

[0012] 本発明によれば、高品質な復号画像を得ることが可能な符号ィ匕データを生成できるデータ処理装置およびその方法と符号ィ匕装置を提供することができる。

図面の簡単な説明

[0013] [図 1]図 1は、本発明の実施形態の画像処理システムの全体構成図である。

[図 2]図 2は、図 1に示す符号化装置 2の構成図である。

[図 3]図 3は、符号ィ匕データ EDを基に量子化スケール MBQを生成する部分に関する図 2に示す Q算出回路の構成図である。

[図 4]図 4は、図 3に示す MBR測定回路の処理を説明するためのフローチャートである。

[図 5]図 5は、図 3に示す LT調整量算出回路の処理を説明するための図である。

[図 6]図 6は、図 3に示す LT調整量算出回路の処理を説明するための図である。

[図 7]図 7は、図 3に示す ST調整量算出回路の処理を説明するためのフローチャートである。

[図 8]図 8は、データ CpbScaleと指標データ CPBOCとの関係を示す図である。

[図 9]図 9は、図 3に示す PicQ制御回路の処理を説明するためのフローチャートである。

[図 10]図 10は、図 3に示す Q算出回路の全体動作について説明するためのフローチヤートである。

[図 11]図 11は、図 10に示すステップ ST42の処理を説明するためのフローチャートである。

符号の説明

[0014] 1· ··通信システム、 2…符号化装置、 3…復号装置、 4· ··復号部、 5…符号化難易度検出回路、 6…画像難易度指標生成回路、 10—MBR測定回路、 11 CPBOC算出回路、 12—LT調整量算出回路、 13—ST調整量算出回路、 14—CTBR算出回路、 15· ··遅延回路、 16"'PicQ制御回路、 17—MBQ制御回路、 22· ··ΑΖϋ変換回路、 23…画面並べ替え回路、 24· ··演算回路、 25· ··直交変換回路、 26· ··量子化回路、 27· ··可逆符号化回路、 28· ··バッファ、 29· ··逆量子化回路、 30· ··逆直交変換回路、 31· ··フレームメモリ、 32· ··動き予測 ·補償回路、 33· ··アクティビティ算出回路、 34 .Q算出回路、 CPB…バッファ

発明を実施するための最良の形態

[0015] 以下、本発明の実施形態に係わる画像処理装置について説明する。

以下、上述した問題を解決するための本実施形態の画像処理装置およびその方法と符号ィ匕装置について説明する。

図 1は、本実施形態の画像処理システム 1の全体構成図である。

図 1に示すように、画像処理システム 1は、符号化装置 2および復号装置 3を有する。符号化装置 2は、離散コサイン変換やカルーネン 'レーべ変換などの直交変換と動き補償によって圧縮した符号ィ匕データ ED (ビットストリーム）を生成し、当該符号ィ匕データ EDを変調した後に、衛星放送波、ケーブル TV網、電話回線網、携帯電話回線網などの伝送媒体を介して送信する。

復号装置 3は、例えば、符号化装置 2から受信した符号化データ EDを復調した後に、ノッファ CPBに格納し、ノッファ CPB (本発明の記憶回路)から読み出した符号化データ EDを復号部 4に供給し、復号部 4におヽて上記符号化時の直交変換の逆変換と動き補償によって復号した画像データを生成して利用する。

ここで、バッファ CPB力も復号部 4に 1つのピクチヤが供給されることによりバッファ C PBのデータ蓄積量が減少する量は、当該ピクチヤのデータ量、すなわち当該ピクチャの量子化パラメータに依存する。

符号化装置 2は、後述するように、復号装置 3のバッファ CPBがオーバーフローおよびアンダーフローしな、ように、上記量子化スケールを決定する。

なお、上記伝送媒体は、光ディスク、磁気ディスクおよび半導体メモリなどの記録媒体であってもよい。

画像処理システム 1は、符号ィ匕装置 2における量子化スケールの算出方法に特徴を有している。

[0016] 以下、図 1に示す符号ィ匕装置 2について説明する。符号ィ匕装置 2が発明の符号ィ匕装置に対応している。

図 2は、図 1に示す符号化装置 2の構成図である。

図 2に示すように、符号化装置 2は、例えば、 AZD変換回路 22、画面並べ替え回路 23、演算回路 24、直交変換回路 25、量子化回路 26、可逆符号化回路 27、バッファ 28、逆量子化回路 29、逆直交変換回路 30、フレームメモリ 31、 Q算出回路 34、動き予測'補償回路 36およびデブロックフィルタ 37を有する。

[0017] 量子化回路 26が第 3の発明の量子化回路の一例であり、可逆符号ィ匕回路 27が第

3の発明の符号ィ匕回路の一例であり、 Q算出回路 34が第 1の発明のデー処理装置および第 3の発明の量子化スケール算出回路の一例である。

[0018] 以下、図 2に示す符号ィ匕装置 2の構成要素について説明する。

AZD変換回路 22は、入力されたアナログの輝度信号 Y、色差信号 Pb, Prから構成される画像信号をデジタルの画像信号に変換し、これを画面並べ替え回路 23〖こ出力する。

画面並べ替え回路 23は、 AZD変換回路 22から入力した画像信号内のフレーム画像信号を、そのピクチャタイプ I, P, Bからなる GOP(Group Of Pictures)構造に応じて、符号化する順番に並べ替えた画像データ S23 (本発明の被処理データ)を演算回路 24、動き予測 ·補償回路 36および Q算出回路 34に出力する。

[0019] 演算回路 24は、画像データ S23がインター (Inter)符号ィ匕される場合には、画像データ S23と、動き予測'補償回路 36から入力した予測画像データ S32aとの差分を示す画像データ S24を生成し、これを直交変換回路 25に出力する。

また、演算回路 24は、画像データ S23がイントラ (Intra)符号ィ匕される場合には、画像データ S23を画像データ S24として直交変換回路 25に出力する。

直交変換回路 25は、画像データ S24に離散コサイン変換やカルーネン 'レーべ変換などの直交変換を施して画像データ (例えば DCT係数信号) S25を生成し、これを量子化回路 26に出力する。

量子化回路 26は、 Q算出回路 34から入力した量子化スケール MBQで、画像データ S25をマクロブロック MB単位で量子化して画像データ S26を生成し、これを可逆符号ィ匕回路 27および逆量子化回路 29に出力する。 [0020] 可逆符号化回路 27は、画像データ S26を可変長符号化あるヽは算術符号化して符号化データ EDを生成し、これをバッファ 28に格納する。

このとき、可逆符号化回路 27は、動き予測 ·補償回路 36から入力した動きベクトル MVあるいはその差分を符号ィ匕して符号ィ匕データ EDのヘッダデータ内に格納する。ノッファ 28に格納された符号ィ匕データ EDは、 Q算出回路 34に出力されると共に、例えば、変調等された後に図 1に示す復号装置 3に送信される。

[0021] 逆量子化回路 29は、画像データ S26を逆量子化したデータを生成し、これをデイスプレイ 40に出力する。

逆量子化回路 29は、 JVT規格に基づいて、量子化処理を行う。

逆直交変換回路 30は、逆量子化回路 29から入力した逆量子化されデータに上記直交変換の逆変換を施して生成した画像データをデブロックフィルタ 37に出力する。デブロックフィルタ 37は、逆量子化変換回路 30から入力した画像データのブロック歪みを除去してフレームメモリ 31に書き込む。

[0022] 動き予測 ·補償回路 36は、フレームメモリ 31からの画像データ S31と、画面並べ替え回路 23からの画像データ S23とを基に、動き予測 ·補償処理を行って、動きべタトル MVおよび予測画像データ S32aを算出する。

なお、動き予測 ·補償回路 36は、 Q算出回路 34からのマクロブロック MBの量子化スケール MBQを基にマクロブロックタイプを決定し、当該決定したマクロブロックタイプで規定されるブロックを単位として、動き予測'補償処理を行う。

動き予測 ·補償回路 36は、動きベクトル MVを可逆符号ィ匕回路 27に出力し、予測画像データ S32aを演算回路 24に出力する。

[0023] Q算出回路 34は、画面並べ替え回路 23からの画像データ S23およびバッファ 28 力もの符号ィ匕データ EDを基に、各ピクチャの量子ィ匕スケール PicQを算出する。具体的には、 Q算出回路 34は、上記算出した量子化スケール PicQを基に、各ピクチヤを構成する各マクロブロック MBの量子化スケール MBQを算出し、これを量子化回路 26および動き予測，補償回路 36に出力する。

以下、 Q算出回路 34が、画像データ S23および符号ィ匕データ EDを基に量子化スケール PicQを算出する方法を説明する。 Q算出回路 34は、画像データ S23の符号化難易度の他に、図 1に示す復号装置 3 のバッファ CPBの状態を考慮しながら、ノッファ CPBに記憶される符号ィ匕データ ED のデータ量が適切な値 (初期値 InitialCpb)に近づくように、各ピクチャの量子化スケール PicQ、すなわち各ピクチャのデータ量を制御する。

ここで、バッファ CPBから単位時間に読み出されて復号部 4に供給されるピクチャの数はピクチャレートによって規定される一定数であるため、各ピクチャのデータ量を Q 算出回路 34で制御することで、ノッファ CPBに記憶されている符号ィ匕データ EDのデータ量 (バッファ蓄積量)を制御できる。

[0024] 以下、図 2に示す Q算出回路 34の構成について詳細に説明する。

図 3は、符号ィ匕データ EDを基に量子化スケール MBQを生成する部分に関する図 2に示す Q算出回路 34の構成図である。

図 3に示すように、 Q算出回路 34は、例えば、符号化難易度検出回路 5、画像難易度指標生成回路 6、発生ビット量検出回路 8、 MBR測定回路 9、 ABR測定回路 10、 CPBOC算出回路 11、 LT調整量算出回路 12、 ST調整量算出回路 13、 CTBR算出回路 14、遅延回路 15、 PicQ制御回路 16および MBQ制御回路 17を有する。図 3において、 MBR測定回路 9が第 1および第 3の発明の特定回路に対応し、符号化難易度検出回路 5および画像難易度指標生成回路 6が第 1および第 3の発明の符号化難易度検出回路に対応し、 PicQ制御回路 16が第 1および第 3の発明の量子化制御回路に対応している。

また、 CPBOC算出回路 11が第 1の発明の指標生成回路に対応し、 LT調整量算出回路 12、 ST調整量算出回路 13および CTBR算出回路 14が第 1の発明の目標算出回路に対応している。

[0025] 〔符号化難易度検出回路 5〕

符号化難易度検出回路 5は、画面並べ替え回路 23から入力した画像データ S23 の符号ィ匕難易度を検出し、当該検出した符号ィ匕難易度を示す符号ィ匕難易度データ E— DIFCTEDを画像難易度指標生成回路 6に出力する。

符号化難易度検出回路 5は、具体的には、画像データ S23のフレームに含まれる、ブロックノイズやモスキートノイズを発生する要因となる画像パターン、例えば、細か、絵柄での激 U、動きゃ激、輝度変化 (又はシ―ンチェンジ)等を基に、当該画像ノターンが多く含まれるに従って値が大きくなるように、符号ィ匕難易度データ E— DI FCTEDを生成する。

[0026] 〔画像難易度指標生成回路 6〕

画像難易度指標生成回路 6は、所定の難易度係数と、指定された最終目標ビットレート FTBRと、符号ィ匕難易度検出回路 5から入力した符号ィ匕難易度データ E—DIFC Tとを下記式（1)に示すように乗じて画像難易度指標データ DIFCTを生成する。画像難易度指標生成回路 6は、上記生成した画像難易度指標データ DIFCTを C TBR算出回路 14に出力する。

[0027] (数 1)

DIFCT = (難易度係数） * FTBR* E_DIFCT

…ひ）

なお、画像難易度指標生成回路 6は、画像難易度指標データ DIFCTを、例えば、一定時間、数ピクチャあるいは数 GOPを単位として算出する。

本実施形態において、画像難易度指標データ DIFCTを、シーケンス全体からの相対的な指標として扱うことで、マルチパスの可変ビットレートを実現でき、シーケンスの一部について用いることでシングルパスの可変ビットレートとを実現できる。

[0028] 〔発生ビット量検出回路 8〕

発生ビット量検出回路 8は、図 2に示すバッファ 28から入力した符号ィ匕データ ED ( ビットストリーム）ののビット量 (発生ビット量)を検出し、その結果を示すビット量データ BAを MBR測定回路 9、 ABR測定回路 10および CPBOC算出回路 11に出力する。

[0029] 〔MBR測定回路 9〕

MBR測定回路 9は、発生ビット量検出回路 8から入力したビット量データ BAを基に、符号ィ匕データ EDを構成する各ピクチャのビットレートを示す測定ビットレート CMB R (本実施形態の特定回路が特定するビットレート)を算出し、これを PicQ制御回路 1 6に出力する。

[0030] 測定ビットレート CMBRは、図 1に示す復号装置 3において、符号化データ EDがノッファ CPBから読み出されて復号部 4に出力されるビットレートを示している。図 4は、 MBR測定回路 9の処理を説明するためのフローチャートである。

ステップ ST1：

MBR測定回路 9は、発生ビット量検出回路 8から入力したビット量データ BAを基に、過去に符号ィ匕された符号ィ匕データ EDを構成する Iピクチャの平均ビット量 AvelPic Bitを算出する。

ステップ ST2 :

MBR測定回路 9は、過去に符号化された符号化データ EDを構成する Pピクチヤの平均ビット量 AvePPicBitを算出する。

ステップ ST3 :

MBR測定回路 9は、ステップ ST1で算出した AveIPicBit、ステップ ST2で算出した AvePPicBitを基に、下記式（2)により、測定ビットレート CMBRを算出する。

[0031] (数 2)

CMBR = PicR * (AvelPicBit + AvePPicBit * PPicNumlnGop) /TotalPic NumlnGop - -- (2)

[0032] 上記式（2)にお!/、て、 TotalPicNumlnGopは、単数の GOP内のピクチャの数を示し、予め設定された定数である。

また、 PPicNumlnGopは、（TotalPicNumlnGop - 1)を示して!/、る。

[0033] 〔ABR測定回路 10〕

ABR測定回路 10は、発生ビット量検出回路 8から入力したビット量データ BAを基に、符号ィ匕データ EDを構成する累積的なビット量 (データ量)を算出し、これを基に平均ビットレート ABRを算出する。

具体的には、 ABR測定回路 10は、符号化対象のコンテンツの符号化を符号化装置 2で開始して力得たビット量データ BAの累積値を基に平均ビットレート ABRを算出する。

ABR測定回路 10は、上記算出した平均ビットレート ABRを LT調整量算出回路 12 に出力する。

[0034] 〔CPBOC算出回路 11〕

CPBOC算出回路 11は、発生ビット量検出回路 8から入力したビット量データ BAを基に、復号装置 3のバッファ CPBに記憶されて、る符号ィ匕データ EDのデータ量 (蓄積データ量)を示す指標データ CPBOCを算出する。

CPBOC算出回路 11は、指標データ CPBOCを LT調整量算出回路 12および ST 調整量算出回路 13に出力する。

[0035] 〔LT調整量算出回路 12〕

LT調整量算出回路 12は、測定ビットレート CMBRが最終目標ビットレート FTBR に近づくように、目標ビットレート CTBRを調整するための調整量 LTAJを算出する。

LT調整量算出回路 12は、 CPBOC算出回路 11からの指標データ CPBOCと、 A BR測定回路 10からの平均ビットレート ABRとをを基に、後述する目標ビットレート C TBRの調整量 LTAJを算出する。

ここで、調整量 LTAJは、目標ビットレート CTBRが負にならないように調整するためのものである。

LT調整量算出回路 12は、符号化装置 2の外部から指定された最終目標ビットレート FTBR (本発明の最終目標ビットレート）と、 ABR測定回路 10から入力した平均ビットレート ABRと、符号化経過時間 ELAPSEDと、補正期間 DURATIONとを基に下記式（3)により、目標ビットレート CTBRの調整量 LTAJを算出する。

[0036] ここで、符号ィ匕経過時間 ELAPSEDは、符号化対象のコンテンツの符号化を符号化装置 2で開始してから、当該コンテンツ内のフレームを次に符号化するまでの時間を示している。

また、補正期間 DURATIONは、例えば、目標ビットレート CTBRが更新される期間である。

LT調整量算出回路 12は、図 5に示すように、符号ィ匕経過時間 ELAPSEDのタイミングにおける平均ビットレート ABRを、補正期間 DURATION経過後に、最終目標ビットレート FTBRなるように、調整量 LTAJを算出する。

[0037] (数 3)

LTAJ= (FTBR -ABR) * (ELAPSED + DURATION) /DURATION

…

[0038] なお、符号ィ匕開始直後で不安定な平均ビットレート ABRの影響を抑制するたに、 L T調整量算出回路 12は、下記式 (4)に示すように、目標ビットレート CTBRの調整量 LTAJを算出してもよい。

下記式 (4)において、初期値 InitialLTDelayは、調整量 LTAJの初期変動の影響を抑制するために規定された定数値であり、例えば、 5 (sec)である。

[0039] (数 4)

LTAJ=min (l. 0, ELAPSED/lnitialLTDelay) * LTAJ

…(

[0040] LT調整量算出回路 12は、上記式 (4)を用いた場合に、例えば、図 6に示すように、符号化経過時間 ELAPSEDが初期値 InitialLTDelayまでは、上記式（3)で算出した調整量 LTAJ以下となり、符号化経過時間 ELAPSEDが初期値 InitialLTDela yに近づくに従って上記式（3)で算出した調整量 LTAJに近づくように、調整量 LTAJ を算出する。

[0041] 調整量 LTAJは、指標データ CPBOCが初期値 InitialCpb以上の場合に正の値を示す、すなわち目標ビットレート CTBRを上げる向きに調整する値を持つ。

また、調整量 LTAJは、指標データ CPBOCが初期値 InitialCpb未満の場合に負の値を示す、すなわち目標ビットレート CTBRを下げる向きに調整する値を持つ。また、調整量 LTAJは、指標データ CPBOCが所定の値以下になっても、所定の値より小さくならないように規定される。これにより、目標ビットレート CTBRが負になることが回避される。

上述した調整量 LTAJの特性は、 LT調整量算出回路 12が上記式（3) , (4)により、目標ビットレート CTBRの調整量 LTAJを算出することによって得られる。

なお、 LT調整量算出回路 12は、調整量 LTAJを、例えば、一定時間、数ピクチャあるいは数 GOPを単位として算出する。

[0042] 〔ST調整量算出回路 13〕

ST調整量算出回路 13は、復号装置 3のバッファ CPBがアンダーフローしな、ように、目標ビットレート CTBRを調整するための調整量 STAJを算出する。

ST調整量算出回路 13は、 CPBOC算出回路 11からの指標データ CPBOCを基に、目標ビットレート CTBRの調整量 STAJを算出する。ここで、調整量 STAJは、指標データ CPBOCを、初期値 InitialCpbに戻すように作用する。

図 7は、 ST調整量算出回路 13の処理を説明するためのフローチャートである。ステップ ST21 :

ST調整量算出回路 13は、 CPBOC算出回路 11から入力した指標データ CPBOC を用いて、下記式（5)により、データ CpbScaleを算出する。

[0043] (数 5)

CpbScale = - ( (Scale * (initCpb - CPBOC) + CPBOC) / ( (initCpb - CP BOC) + Scale * CPBOC) )

… ）

[0044] 図 8は、上記データ CpbScaleと指標データ CPBOCとの関係を示す図である。

図 8に示すように、データ CpbScaleは、指標データ CPBOCが初期値 InitialCpb 以上の場合に所定の正の値 Kを示す、すなわち目標ビットレート CTBRを上げる向きに調整する値を持つ。

また、データ CpbScaleは、指標データ CPBOCが初期値 InitialCpb未満の場合に負の値を示す、すなわち目標ビットレート CTBRを下げる向きに調整する値を持つまた、データ CpbScaleは、図 8に示すように、指標データ CPBOCが所定の値 (例えば、 180000)以下になると、急峻にその値を小さくする。

これにより、上述した復号装置のバッファ CPBがアンダフローすることを回避する。上述したデータ CpbScaleの特性は、 ST調整量算出回路 13が上記式（5)により、データ CpbScaleを算出することによって実現される。

[0045] ステップ ST22 :

ST調整量算出回路 13は、ステップ ST21で算出したデータ CpbScaleと、入力した最終目標ビットレート FTBRとを下記式 (6)により乗算して調整量 STAJを算出する。

[0046] (数 6)

STAJ = FTBR * CpbScale · '· (6)

[0047] 〔CTBR算出回路 14〕 CTBR算出回路 14は、入力した最終目標ビットレート FTBRと、画像難易度指標生成回路 6から入力した画像難易度指標データ DIFCTと、 LT調整量算出回路 12から入力した調整量 LTAJと、 ST調整量算出回路 13から入力した調整量 STAJとを下記式 (7)により加算して目標ビットレート CTBRを算出する。

CTBR算出回路 14は、目標ビットレート CTBRを PicQ制御回路 16に出力する。

[0048] (数 7)

CTBR = FTBR + DIFCT + LTAJ + STAJ · · · ( 7)

[0049] 〔遅延回路 15〕

遅延回路 15は、 PicQ制御回路 16から入力したピクチャの Qスケール QPicを 1ピクチヤに相当する時間だけ遅延させて PicQ制御回路 16に出力する。

[0050] 〔PicQ制御回路 16〕

PicQ制御回路 16は、ピクチャの Qスケール QPic (本発明の量子化スケール）を算出（決定)し、これを遅延回路 15および MBQ制御回路 17に出力する。

PicQ制御回路 16は、 MBR測定回路 9から入力した測定ビットレート CMBRと、 C TBR算出回路 14力入力した目標ビットレート CTBRとを基に、 Qスケール QPicを以下のように算出する。

具体的には、 PicQ制御回路 16は、測定ビットレート CMBRを目標ビットレート CTB Rに近づけるように、 Qスケール QPicを算出する。

[0051] 図 9は、 PicQ制御回路 16の処理を説明するためのフローチャートである。

ステップ ST31 :

PicQ制御回路 16は、 MBR測定回路 9から入力した測定ビットレート CMBRと、 C TBR算出回路 14から入力した目標ビットレート CTBRとを用いて、下記式 (8)により、データ PRO— PARTを算出する。

式 (8)内の Kpは、応答性を調整するための係数であり、例えば、測定ビットレート C MBR、目標ビットレート CTBRおよび指標データ CPBOCなどを用いて規定される。当該応答性を低くすることで、量子化スケールの変動を抑制することができる。

[0052] (数 8)

PRO PART=Kp * (CMBRZCTBR— 1) · '· (8) [0053] ステップ ST32 :

PicQ制御回路 16は、 MBR測定回路 9から入力した測定ビットレート CMBRと、 C TBR算出回路 14から入力した目標ビットレート CTBRとを用いて、下記式（9)により、データ DV— PARTを算出する。

式（9)内の Kdは、応答性を良くするための係数である。

また、 nはピクチャの番号を示している。 CMBR〔n—l〕は、 CMBR〔n〕に対応するピクチャの 1つ前のピクチャの CMBRを示している。

[0054] (数 9)

DV— PART=Kd * (CMBR〔n〕一 CMBR〔n—l〕）

…ゆ）

[0055] ステップ ST33 :

PicQ制御回路 16は、前回算出した量子化スケール QPic〔n—l〕と、ステップ ST3 1で算出したデータ PRO— PARTと、ステップ ST32で算出したデータ DV— PART とを用いて、下記式（10)により、量子化スケール QPic〔n〕を算出する。

[0056] (数 10)

QPic〔n〕 =QPic〔n— 1〕 * (1 + PRO— PART +DV— PART)

…ひ。）

[0057] 〔MBQ制御回路 17〕

MBQ制御回路 17は、 PicQ制御回路 16から入力したピクチヤの量子化スケール P icQを基に、当該ピクチャ内の各マクロブロック MBの量子化スケール MBQを算出し、これを図 2に示す量子化回路 26および動き予測 ·補償回路 36に出力する。

[0058] 以下、図 3に示す Q算出回路 34の全体動作について説明する。

図 10は、図 3に示す Q算出回路 34の全体動作について説明するためのフローチヤートである。

ステップ ST41 :

図 3に示す Q算出回路 34の MBR測定回路 9が、図 4を用いて説明した手順で測定ビットレート CMBRを算出する。

ステップ ST42 : 図 3に示す CPBOC算出回路 11、 LT調整量算出回路 12、 ST調整量算出回路 13 および CTBR算出回路 14が、図 5〜図 8を用いて説明した手順で目標ビットレート C TBRを算出する。

すなわち、図 11に示すように、図 5および図 6を用いて前述した手順で LT調整量算出回路 12が調整量 LTAJを算出し (ST51)、図 7および図 8を用いて前述した手順で ST調整量算出回路 13が調整量 STAJを算出し (ST52)、これを用いて CTBR 算出回路 14が目標ビットレート CTBRを算出する（ST53)。

[0059] ステップ ST43 :

Q算出回路 34の PicQ制御回路 16が、ステップ ST41で算出した測定ビットレート C MBRおよびステップ ST42で算出した目標ビットレート CTBRとを基に、図 9を用いて説明したように、各ピクチャの量子化スケール QPicを算出し、その後、各マクロブロック MBの量子化スケール MBQを算出し、これを量子化回路 26および動き予測'補償回路 36に出力する。

[0060] 次に、図 2に示す符号化装置 2の全体動作を説明する。

入力となる画像信号は、まず、 AZD変換回路 22においてデジタル信号に変換される。次に、出力となる画像圧縮情報の GOP構造に応じ、画面並べ替え回路 23にぉ、て画像データの並べ替えが行われる。

Q算出回路 34は、画面並べ替え回路 23からの画像データ S23と、バッファ 28からの符号ィ匕データ EDとを基に前述したように、量子化スケール MBQを算出し、これを量子化回路 26および動き予測 ·補償回路 36に出力する。

[0061] イントラ符号ィ匕が行われる画像データに関しては、画像データ全体の画像情報が直交変換回路 25に入力され、直交変換回路 25において離散コサイン変換やカルーネン ·レーべ変換等の直交変換が施される。

直交変換回路 25の出力となる変換係数は、量子化回路 26において量子化処理され、画像データ S25として可逆符号ィ匕回路 27に出力される。

量子化回路 26は、 Q算出回路 34から入力した量子化スケール MBQに基づいて、量子化スケール QPを基に画像データ S25を量子化する。

可逆符号化回路 27は、画像データ S26に可変長符号化、算術符号化等の可逆符号化を施して符号化データ EDを生成し、これをバッファ 28に出力する。同時に、量子化回路 26からの画像データ S26は、逆量子化回路 29に入力され、さらに逆直交変換回路 30において逆直交変換処理が施されて、復号された画像データとなり、その画像データがフレームメモリ 31に蓄積される。

[0062] 一方、インター符号ィ匕が行われる画像に関しては、先ず、その画像データ S23が動き予測'補償回路 36に入力される。また、参照画像の画像データ S31がフレームメモリ 31より読み出され、動き予測 ·補償回路 36に出力される。

そして、動き予測 ·補償回路 36において、参照画像の画像データ S31を用いて、動きベクトル MVおよび予測画像データ S32aが生成される。

[0063] そして、演算回路 24にお!/、て、画面並べ替え回路 23からの画像データ S23と、動き予測'補償回路 36からの予測画像データ S32aとの差分信号である画像データ S2 4が生成され、当該画像データ S24が直交変換回路 25に出力される。

そして、可逆符号ィ匕回路 27において、動きベクトル MVが可変長符号ィ匕あるいは算術符号化といった可逆符号化処理され、画像データのヘッダ部に挿入される。その他の処理はイントラ符号ィ匕を施される画像データと同様である。

[0064] 以上説明したように、符号化装置 2では、 Q算出回路 34において、ノッファ 28からの符号化データ EDを基に、図 1に示す復号装置 3のバッファ CPBの蓄積量を考慮して、量子化スケール MBQを決定する。

そのため、符号化装置 2によれば、復号装置 3のバッファ CPBのアンダーフローを回避でき、復号部 4で復号された画像の品質を向上できる。

また、符号化装置 2では、 Q算出回路 34において、画像難易度指標生成回路 6が生成した画像難易度指標データ DIFCTを基に量子化スケール MBQを決定する。そのため、 Q算出回路 34は、符号ィ匕の難易度が高いフレーム (ピクチャ)の量子化スケール MBQを小さくして、多くのビットを使用することができ、符号化データ EDのビットレートを符号ィ匕対象の画像データ S23の符号ィ匕難易度に追従させることができ、高品質の画像を提供できる。

[0065] また、符号ィ匕装置 2によれば、図 4を用いて説明したように、 MBR測定回路 9において、複数のピクチャの平均ビット量を基に測定ビットレート CMBRを算出し、これを基に目標ビットレート CTBRを算出する。そのため、各ピクチャのビット量の差異により、各ピクチャの量子化スケール MBQが大幅に変動することを回避できる。

また、符号ィ匕装置 2によれば、復号部 4の処理負担の均一化できる。これにより、復号後の画質を向上できる。

また、符号ィ匕装置 2によれば、上記式（9)に示すように、 PicQ制御回路 16がフィードバックにより、量子化スケール QPicを算出する。これによつても、量子化スケール Q Picの時間的な急激な変動を抑えることができる。

また、符号ィ匕装置 2によれば、上記式 (8)内の Kpを調整することにより、量子化スケールの急激な変動を抑制することができる。これによつても、復号部 4の処理負担の均一化できる。これにより、復号後の画質を向上できる。

[0066] また、符号ィ匕装置 2によれば、符号ィ匕難易度検出回路 5において、シーケンス全体について符号ィ匕難易度を検出するか、シーケンンスの一部について符号ィ匕難易度を検出するかを切り換えることで、マルチパスおよびシングルパスの何れにも適合した可変ビットレート制御を実現できる。

[0067] 本発明は上述した実施形態には限定されない。

すなわち、当業者は、本発明の技術的範囲またはその均等の範囲内において、上述した実施形態の構成要素に関し、様々な変更、コンビネーション、サブコンビネーシヨン、並びに代替を行ってもよい。

例えば、図 3に示す Q算出回路 34は、 CTBR算出回路 14において、最終目標ビットレート FTBRと、画像難易度指標生成回路 6からの画像難易度指標データ DIFCT とのみを基に、目標ビットレート CTBRを算出してもよい。

また、 CTBR算出回路 14は、調整量 STAJ, LTAJの何れか一方と、指標最終目標ビットレート FTBRと、画像難易度指標データ DIFCTとを基に、目標ビットレート CTB Rを算出してもよい。

産業上の利用可能性

[0068] 本発明は、被処理データを量子化するシステムに適用できる。

Claims

請求の範囲

[1] 被処理データを量子化して符号化する場合に、前記量子化の量子化スケールを決定するデータ処理装置であって、

前記符号化により得られた符号化データを基に、当該符号化データが復号時に復号に供されるビットレートを特定する特定回路と、

前記被処理データの符号化難易度を検出する符号化難易度検出回路と、前記特定回路が特定した前記ビットレートと、前記符号化難易度検出回路が検出した前記符号ィヒ難易度とを基に、前記量子化スケールを制御する量子化制御回路とを有するデータ処理装置。

[2] 前記量子化制御回路は、前記符号化難易度検出回路が検出した前記符号化難易度が高くなるに従って、前記量子化スケールを小さくするように前記量子化スケールを制御する

請求項 1に記載のデータ処理装置。

[3] 前記符号ィ匕データを基に、前記符号ィ匕データの復号側に設けられ復号に供するために前記符号化データを記憶する記憶回路のデータ蓄積量を特定するための指標となる指標データを生成する指標生成回路と、

前記指標生成回路が生成した前記指標データを基に、前記ビットレートの目標値を示す目標ビットレートを算出する目標算出回路と

をさらに有し、

前記量子化制御回路は、前記特定回路によって特定される前記ビットレートが、前記目標算出回路が算出した前記目標ビットレートに近づくように、前記量子化スケールを制御する

請求項 1に記載のデータ処理装置。

[4] 前記目標算出回路は、指定された最終目標ビットレートと、過去の前記符号化データの平均ビットレートとの差分を基に、当該差分を小さくように、前記目標ビットレートを算出する請求項 3に記載のデータ処理装置。

[5] 前記目標算出回路は、前記記憶回路がアンダーフローすることを回避するように前記目標ビットレートを算出する請求項 4に記載のデータ処理装置。

[6] 前記目標算出回路は、前記記憶回路がアンダーフローすることを回避するように前記目標ビットレートを算出する

請求項 3に記載のデータ処理装置。

[7] 前記特定回路は、前記復号側において前記復号に供するために前記記憶回路から読み出される前記符号ィヒデータの前記ビットレートを特定する

請求項 3に記載のデータ処理装置。

[8] 前記特定回路は、過去の前記符号化データ内のピクチヤの平均ビット量と、前記ピクチャのピクチャレートとを基に、前記符号ィ匕データのビットレートを特定する請求項 7に記載のデータ処理装置。

[9] 前記符号ィ匕データが動画の複数のピクチャで構成される場合に、

前記量子化制御回路は、前記複数のピクチャの前記量子化スケールを制御する請求項 1に記載のデータ処理装置。

[10] 前記量子化制御回路は、前記特定回路が特定した前記ビットレートと前記目標算出回路が算出した前記目標ビットレートとの比と、前回決定した前記量子化スケールとを基に、新たな前記量子化スケールを決定して前記制御を行う

請求項 3に記載のデータ処理装置。

[11] 前記量子化制御回路は、前記特定回路が特定した前記ビットレートと、前記目標算出回路が算出した前記目標ビットレートとの差分と、前回決定した前記量子化スケールとを基に、前記ビットレートのオーバシュートおよびアンダーシュートを抑制するように、新たな前記量子化スケールを決定して前記制御を行う

請求項 3に記載のデータ処理装置。

[12] 被処理データを量子化して符号化する場合に、前記量子化の量子化スケールを決定するデータ処理方法であって、

前記符号化により得られた符号化データを基に、当該符号化データが復号時に復号に供されるビットレートを特定する第 1の工程と、

前記被処理データの符号化難易度を検出する第 2の工程と、

前記第 1の工程で特定した前記ビットレートと、前記第 2の工程で検出した前記符号化難易度とを基に、前記量子化スケールを制御する第 3の工程と

を有するデータ処理方法。

量子化スケールを算出する量子化スケール算出回路と、

前記量子化スケール算出回路が算出した前記量子化スケールを基に、被処理データを量子化する量子化回路と、

前記量子化回路の量子化結果を符号化して符号化データを生成する符号化回路と

を有し、

前記量子化スケール算出回路は、

前記符号化回路が生成した前記符号化データを基に、当該符号化データが復号時に復号に供されるビットレートを特定する特定回路と、

前記被処理データの符号化難易度を検出する符号化難易度検出回路と、前記特定回路が特定した前記ビットレートと、前記符号化難易度検出回路が検出した前記符号ィヒ難易度とを基に、前記量子化スケールを制御する量子化制御回路とを有する符号化装置。