JP3043599B2

JP3043599B2 - ニューラルネットワークを用いた量子化ステップサイズ制御装置

Info

Publication number: JP3043599B2
Application number: JP17234995A
Authority: JP
Inventors: 濟昌鄭; 祐演安
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 1994-07-08
Filing date: 1995-07-07
Publication date: 2000-05-22
Anticipated expiration: 2015-07-07
Also published as: US5638125A; KR0139154B1; CN1124434A; CN1083216C; JPH0879748A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はビデオデータの符号
化方法及びその装置に係り、特にバッファ占有度、映像
複雑度などに基づき量子化ステップサイズを制御する装
置に関する。

【０００２】

【従来の技術】一般に、高画質ＴＶ、ディジタルＶＴ
Ｒ、ディジタルカムコーダなどのように画像信号及び音
響信号をディジタル処理するシステムは動き画像及びそ
れに関連した音響をディジタル符号化して伝送し、伝送
されたデータを再び復号化する。符号化されたデータを
一定した伝送速度を有する伝送路を通じて伝送する場合
の符号化器は発生されるデータ量を調節するのが求めら
れる。符号化されたデータを一定した伝送率で伝送する
ために量子化ステップサイズを定める装置を図１に基づ
き説明する。

【０００３】図１は動き画像を圧縮し一定したデータ伝
送率に圧縮されたデータを伝送するための一般の符号化
装置のブロック図である。図１の装置は当業者にとって
公知の符号器なのでその動作を簡単に説明する。図１に
おいて、現在フレームのビデオデータは減算器３１と動
き推定部１８に印加される。動き推定部１８は外部から
印加されるビデオデータとフレームメモリ１７に貯蔵さ
れたビデオデータを用いて動きベクトルを発生する。動
きベクトルは現在フレームのビデオデータにより形成さ
れるＮ（横）×Ｎ（縦）画素（通常、８×８画素）のブ
ロック毎に発生し、動き補償部１９及び伝送チャネルに
供給される。動き補償部１９はフレームメモリ１７に貯
蔵されたデータのうち動きベクトルに対応するビデオデ
ータをスイッチ３３，３４に供給する。スイッチ３３，
３４は図１の装置がインタフレームモードとして動作す
ればオンされ、図１の装置がイントラフレームモードと
して動作すればオフされる。スイッチ３３がオン状態の
場合、減算器３１は外部から印加されるビデオデータか
らスイッチ３３を通じて動き補償部１９から供給される
データを減算して差分データを発生する。

【０００４】一方、スイッチ３３がオフ状態なら、減算
器３１は外部から印加されるビデオデータをそのまま変
換部１１に供給する。変換部１１は減算器３１の出力デ
ータを周波数領域の変換係数に変換させる。変換は前述
したブロック単位からなる。変換部１１から出力される
変換係数は量子化部１２に供給される。量子化部１２は
バッファ１４から供給される量子化ステップサイズによ
り変換係数を量子化させ可変長符号化部１３及び逆量子
化部１５に供給する。量子化もやはり前述したブロック
単位からなる。可変長符号化部１３はデータの統計的特
性に基づき入力データを可変長符号化する。逆量子化部
１５は量子化部１２により量子化された変換係数を逆量
子化して逆変換部１６に出力する。かかる逆量子化部１
５は量子化部１２による信号処理の逆過程を行う。

【０００５】逆変換部１６は入力される変換係数を空間
領域のビデオデータに変換させる。加算器３２はスイッ
チ３４を通じて動き補償部１９から供給されるデータと
逆変換部１６からのデータとを加算してフレームメモリ
１７に出力する。フレームメモリ１７は外部から印加さ
れるビデオデータにより更新しつづけるデータを１フレ
ーム分ずつ貯蔵し、フレームメモリ１７に貯蔵されたデ
ータは動き推定部１８及び動き補償部１９による動き推
定及び動き補償に使われる。

【０００６】一方、バッファ１４は一定したデータを伝
送率を保つためのもので、貯蔵されたデータによるバッ
ファ占有度による量子化ステップサイズをマクロブロッ
ク毎に発生する。マクロブロックは通常１６×１６画素
からなる。量子化ステップサイズとバッファから出力さ
れる符号化されたデータは伝送チャネルを通じて図２の
装置に供給される。

【０００７】符号化された動き画像を復号化する図２の
装置は量子化ステップサイズ及び動きベクトルを用いて
図１の装置により符号化されたデータを復号化する。さ
らに詳しくは、可変長復号化部２１は可変長符号化部１
３による信号処理の逆過程を行う。逆量子化部２２は可
変長復号化部２１から供給されるデータを量子化ステッ
プサイズにより逆量子化する。

【０００８】逆変換部２３は入力される周波数領域のデ
ータを空間領域のデータに変換する。加算器３５はスイ
ッチ３６を通じて動き補償部２４から供給されるデータ
と逆変換部２３の出力データを加算する。フレームメモ
リ２５は加算器３５から出力されるデータを１フレーム
分ほど貯蔵する。動き補償部２４は図１の装置により発
生された動きベクトルに対応するデータをフレームメモ
リ２４から読み出してスイッチ３６に供給する。かかる
方式で動作する図２の装置は図１の装置により符号化さ
れたデータを復号化する。加算器３５から出力されるビ
デオデータはディスプレイを通じて表示される。

【０００９】しかし、前述した量子化部１１は損失（lo
ss）符号器の一種なので、量子化される前のデータと、
量子化された後逆量子化されたデータは同一でない。従
って、ビデオデータをマクロブロックのような所定の大
きさのブロック単位に与えられる量子化ステップサイズ
により量子化する場合、ユーザーは画面上でブロック間
の境界線を視覚的に認識するようになる。かかるブロッ
キング現象は複雑な場面の場合、ユーザーにより気がつ
かない。しかし、単純な場面や映像の明るさが急激に変
わって視覚的には輪郭線と認識されるエッジのある場面
で現れるブロッキング現象はユーザーにより容易に気が
つくので画質に悪影響を及ぼす。

【００１０】良質の画質を提供するために量子化ステッ
プサイズを決める技術としては、１９９１年８月６日付
けにて特許された“Hang”のアメリカ特許第５，０３
８，２０９号がある。この先行技術によるバッファ／量
子化器制御器は以前フレームの平均量子化ステップサイ
ズと出力バッファの充満度表示に応答して目標量子化ス
テップサイズを発生する。量子化ステップサイズを定め
る他の先行技術としては、前置解析部から供給される映
像複雑度と出力バッファから供給されるバッファ状態を
用いて量子化ステップサイズを定める比率制御技術など
がある。

【００１１】

【発明が解決しようとする課題】本発明の目的はニュー
ラルネットワークを用いて映像複雑度、バッファ状態な
どのような量子化ステップサイズの決定に使われる媒介
変数から所定の量子化ステップサイズを定めることによ
り、場面の変化に従って変わる多様な媒介変数に拘らず
ユーザーがブロッキング現象を認識できないほどの画質
を提供することである。

【００１２】

【課題を解決するための手段】前述した本発明の目的を
達成するために、１映像フレームを既に設定された大き
さを有する第１ブロックに分割して符号化し、符号化さ
れたデータを一定した伝送率で伝送する符号器のために
量子化ステップサイズを制御する装置は、量子化しよう
とする第１ブロックのそれぞれに対する映像複雑度を検
出する前置解析部と、前記第１ブロックのそれぞれを代
表する輝度値を出力する輝度解析部と、量子化されたデ
ータをそれに応ずる量子化ステップサイズを用いて復元
し、既に設定された個数の第１ブロックからなる第２ブ
ロック毎の復元されたデータに基づきブロッキング現象
を最も少なくする判断基準値を発生する画質評価部と、
前記量子化されたデータを貯蔵し、貯蔵されたデータの
バッファ占有度を出力するバッファと、ニューラルネッ
トワークのための加重値と前記加重値を更新するための
改正規則を貯蔵し、量子化された以前の第２ブロックに
対する前記画質評価部の判断基準値と、前記貯蔵された
改正規則により前記貯蔵された加重値を更新し、量子化
しようとする現在の第２ブロックに対する映像複雑度及
び輝度値のうち少なくとも一種の情報と前記バッファか
らのバッファ占有度及び前記更新された加重値に基づき
前記現在の第２ブロックのための量子化ステップサイズ
を発生し、発生された量子化ステップサイズを前記画質
評価部に供給するニューラルネットワークと、前記符号
器により符号化された第２ブロックのそれぞれのデータ
を前記ニューラルネットワークから供給される対応量子
化ステップサイズにより量子化する量子化部とを含む。

【００１３】また本発明の目的を達成するために、１映
像フレームを既に設定された大きさを有する第１ブロッ
クに分割して符号化し、符号化されたデータを一定した
伝送率で伝送するために量子化ステップサイズを制御す
る符号化装置は、予め貯蔵された基準フレームのデータ
と符号化しようとする現在フレームのデータに基づき現
在フレームの第１ブロックのそれぞれに対応する動きベ
クトルと動き補償されたデータを発生する動き補償部
と、前記現在フレームの第１ブロックのそれぞれのデー
タと前記動き補償部からの対応する動き補償されたデー
タ間の差分データを発生し、前記第１ブロックのそれぞ
れに対応して発生された差分データを変換符号化する符
号化手段と、前記現在フレームの第１ブロックのそれぞ
れに対する映像複雑度を検出する前置解析部と、前記現
在フレームの第１ブロックのそれぞれを代表する輝度値
を出力する輝度解析部と、前記符号化手段により符号化
され、前記現在フレームの既に設定された個数の第１ブ
ロックからなる第２ブロックをそれぞれのデータを対応
量子化ステップサイズにより量子化する量子化部と、動
き補償部からの動きベクトルと前記量子化部により量子
化されたデータを可変長符号化して出力する手段と、前
記量子化部により量子化されたデータを復元し、前記第
２ブロック毎の復元されたデータに基づきブロッキング
現象を最も少なくする判断基準値を発生する画質評価部
と、前記可変長符号化手段から出力するデータを貯蔵
し、貯蔵されたデータのバッファ占有度を出力するバッ
ファと、ニューラルネットワークのための加重値と前記
加重値を更新するための改正規則を貯蔵し、量子化され
た以前の第２ブロックに対する前記画質評価部の判断基
準値と前記貯蔵された改正規則により前記貯蔵された加
重値を更新し、量子化しようとする現在の第２ブロック
に対する動きベクトルと映像複雑度及び輝度値のうち少
なくとも一種の情報と、前記バッファからのバッファ占
有度及び前記更新された加重値に基づき前記現在の第２
ブロックのための量子化ステップサイズを発生するニュ
ーラルネットワークとを含む。

【００１４】

【発明の実施の形態】以下、添付した図３に基づき本発
明の望ましい一実施例を詳細に説明する。図３は本発明
によるニューラルネットワークを用いた符号化装置を示
すブロック図である。図３の装置は図１の装置に前置解
析部４１、輝度解析部４２、ニューラルネットワーク４
３及び画質評価部４４をさらに含めた構成を有する。

【００１５】図３において、図１に示したブロックと同
一な機能を有するブロックについては同一な部材番号を
付し、その具体的な動作説明は省くこととする。入力端
１０を通じて外部から図３の装置に印加されるビデオデ
ータは前置解析部４１、輝度解析部４２、動き推定部１
８及び減算器３１に供給される。前置解析部４１は入力
端１０を通じて印加されるビデオデータにより形成され
るブロック毎の映像複雑度ＦＡを定める。ここで、ブロ
ックはＮ（水平）×Ｎ（垂直）画素からなる。映像複雑
度ＦＡは空間領域、周波数領域またはこの二つの領域を
全部用いて得られたデータの分析に基づき決定される。
輝度解析部２２もやはり前述したブロック毎を代表する
輝度値ＢＲを検出してニューラルネットワーク４３に出
力する。動き推定部１８は図１の装置に関連して説明さ
れた方式により動き推定を行ってブロック毎の動きベク
トルＭＶを発生する。発生された動きベクトルＭＶはニ
ューラルネットワーク４３と可変長符号化部４５に供給
される。可変長符号化部４５は動きベクトルを可変長符
号化してバッファ１４に出力する。ニューラルネットワ
ーク４３は後述する方式によりブロック毎にまたは複数
個のブロックからなるマクロブロック毎の量子化ステッ
プサイズＭＱＵＡＮＴを発生する。量子化部１２は変換
部１１から印加されるデータを量子化して可変長符号化
部１３に出力する。バッファ１４は可変長符号化部１
３，４５から供給されるデータを貯蔵し、貯蔵されたデ
ータによるバッファ充満度ＢＦをニューラルネットワー
ク４３に出力する。ここで、バッファ充満度ＢＦとはバ
ッファ１４の有する全体データ貯蔵容量に対する実際バ
ッファ１４に貯蔵されたデータの比率を示す。

【００１６】一方、画質評価部４４は可変長符号化部１
３から出力されるデータを復元する。データの復元には
ニューラルネットワーク４３から供給される該当量子化
ステップサイズが使われる。画質評価部４４は復元され
たデータに基づきブロッキング現象を視覚的に最も少な
く感じるようにする判断基準値を発生する。かかる判断
基準値はブロック毎にまたはマクロブロック毎に発生す
る。

【００１７】量子化しようとするブロックまたはマクロ
ブロックに対する映像複雑度ＦＡ、輝度値ＢＲ及び動き
ベクトルＭＶと、直前に量子化されたブロックまたはマ
クロブロックによる判断基準値とバッファ充満度ＢＦが
ニューラルネットワーク４３に印加されれば、ニューラ
ルネットワーク４３は判断基準値に基づいて加重値を更
新した後、現在のバッファ充満度ＢＦと各ブロック毎に
発生される映像複雑度ＦＡ、輝度値ＢＲ及び動きベクト
ルＭＶを用いて各ブロックの量子化のための量子化ステ
ップサイズＭＱＵＡＮＴを発生する。かかるニューラル
ネットワーク４３は映像複雑度ＦＡと輝度値ＢＲのうち
一つとバッファ１４から供給される現在のバッファ占有
度ＢＦを用いて量子化ステップサイズＭＱＵＡＮＴを発
生させる変形された形態に設計することもできる。そし
て、四つのブロックからなるマクロブロックを規定する
“ＭＰＥＧ−２”規格に適合に図３の装置を設計する場
合、ニューラルネットワーク４３はマクロブロック毎に
量子化ステップサイズＭＱＵＡＮＴを発生する。

【００１８】かかるニューラルネットワーク４３は公知
のニューラルネットワーク理論に基づき具現できるもの
で、本発明の一実施例では３層ニューラルネットワーク
を用いて具現した。３層ニューラルネットワークは入力
端と出力層、そして入力端と出力層との間の第１及び第
２中間層（hidden layer) を有し、各層はニューラルノ
ードとから構成される。第１中間層の各ニューラルノー
ドは全ての入力端に連結され、第２中間層の各ニューラ
ルノードは第１中間層の全てのニューラルノードに連結
される。そして、出力層の各ニューラルノードもやはり
第２中間層の全てのニューラルノードに連結される。ノ
ードを連結するシナプスにはそれぞれ加重値が付加さ
れ、加重値は最適値となるまで改正規則により可変され
る。

【００１９】画質評価部４４から以前ブロック（または
マクロブロック）による判断基準値が供給されれば、ニ
ューラルネットワーク４３はその判断基準値を改正規則
に適応させ以前ブロック（またはマクロブロック）の量
子化ステップサイズＭＱＵＡＮＴの発生に使われる加重
値を更新する。そして、ニューラルネットワーク４３は
現在のバッファ占有度ＢＦと量子化しようとする現在の
ブロック（またはマクロブロック）に対する量子化ステ
ップサイズＭＱＵＡＮＴを発生する。発生された量子化
ステップサイズＭＱＵＡＮＴは量子化部１２と伝送チャ
ネルに供給される。量子化部１２は変換部１１から供給
される現在のブロック（またはマクロブロック）のデー
タをそれに対応する量子化ステップサイズＭＱＵＡＮＴ
により量子化させる。すなわち、量子化部１２はブロッ
ク（またはマクロブロック）間の境界線が視覚的に認識
しやすくブロック（またはマクロブロック）には相対的
に多量のビットが割り当てられ、ブロック（またはマク
ロブロック）間の境界線が視覚的に少なく認識されるブ
ロック（またはマクロブロック）には相対的に少ないビ
ットが割り当てられるように変換部１１から供給される
データを量子化する。従って、図３の装置により符号化
されたデータはブロック間またはマクロブロック間の境
界線が視覚的に良く認識されない映像として再現され
る。量子化部１２と可変長符号化部１３を経て出力され
るデータは次のブロック（またはマクロブロック）のた
めの判断基準値の発生に使われる。バッファ１４は供給
されたデータを一定した伝送率で復号化側に伝送するた
めに伝送チャネルに供給し、次のブロック（またはマク
ロブロック）のための新たなバッファ充満度ＢＦを出力
する。

【００２０】

【発明の効果】以上述べたように、本発明によるニュー
ラルネットワークを用いた符号化装置は量子化ステップ
サイズを定めるための条件を再調整する学習能力を備え
たニューラルネットワークを用いて量子化ステップサイ
ズを定めることにより量子化された映像データの復元時
復元画素のブロック間境界線が視覚的に少なく認識する
ようにする。よって、安定した画質を保たせうる。

【図面の簡単な説明】

【図１】一般の符号化装置を示すブロック図である。

【図２】一般の復号化装置を示すブロック図である。

【図３】本発明の望ましい一実施例によるニューラルネ
ットワークを用いた符号化装置を示すブロック図であ
る。

【符号の説明】

１２量子化部１４バッファ４１前置解析部４２輝度解析部４３ニューラルネットワーク４４画質評価部

フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04N 7/24 G06T 9/00 H03M 7/30 H03M 7/40

Claims

(57)【特許請求の範囲】

【請求項１】１映像フレームを既に設定された大きさ
を有する第１ブロックに分割して符号化し、符号化され
たデータを一定した伝送率で伝送する符号器のために量
子化ステップサイズを制御する装置において、量子化しようとする第１ブロックのそれぞれに対する映
像複雑度を検出する前置解析部と、前記第１ブロックのそれぞれを代表する輝度値を出力す
る輝度解析部と、量子化されたデータをそれに応ずる量子化ステップサイ
ズを用いて復元し、既に設定された個数の第１ブロック
からなる第２ブロック毎の復元されたデータに基づきブ
ロッキング現象を最も少なくする判断基準値を発生する
画質評価部と、前記量子化されたデータを貯蔵し、貯蔵されたデータの
バッファ占有度を出力するバッファと、ニューラルネットワークのための加重値と前記加重値を
更新するための改正規則を貯蔵し、量子化された以前の
第２ブロックに対する前記画質評価部の判断基準値と、
前記貯蔵された改正規則により前記貯蔵された加重値を
更新し、量子化しようとする現在の第２ブロックに対す
る映像複雑度及び輝度値のうち少なくとも一種の情報と
前記バッファからのバッファ占有度及び前記更新された
加重値に基づき前記現在の第２ブロックのための量子化
ステップサイズを発生し、発生された量子化ステップサ
イズを前記画質評価部に供給するニューラルネットワー
クと、前記符号化器により符号化された第２ブロックのそれぞ
れのデータを前記ニューラルネットワークから供給され
る対応量子化ステップサイズにより量子化する量子化部
とを含む装置。
【請求項２】前記第２ブロックは一つの第１ブロック
からなることを特徴とする請求項１に記載の装置。
【請求項３】前記第２ブロックは複数個の前記第１ブ
ロックからなるマクロブロックであることを特徴とする
請求項１に記載の装置。
【請求項４】前記画質評価部は前記以前の第２ブロッ
クのデータに基づき前記現在の第２ブロックに対する判
断基準値を出力することを特徴とする請求項１に記載の
装置。
【請求項５】前記ニューラルネットワークは前記現在
の第２ブロックに対応する映像複雑度とバッファ占有度
及び前記更新された加重値に基づき前記現在の第２ブロ
ックのための量子化ステップサイズを発生することを特
徴とする請求項１に記載の装置。
【請求項６】前記ニューラルネットワークは前記現在
の第２ブロックに対応する輝度値とバッファ占有度及び
前記更新された加重値に基づき前記現在の第２ブロック
のための量子化ステップサイズを発生することを特徴と
する請求項１に記載の装置。
【請求項７】前記ニューラルネットワークは前記現在
の第２ブロックに対応する映像複雑度輝度値、バッファ
占有度及び前記更新された加重値に基づき前記現在の第
２ブロックのための量子化ステップサイズを発生するこ
とを特徴とする請求項１に記載の装置。
【請求項８】１映像フレームを既に設定された大きさ
を有する第１ブロックに分割して符号化し、符号化され
たデータを一定した伝送率で伝送する符号化装置におい
て、予め貯蔵された基準フレームのデータと符号化しようと
する現在フレームのデータに基づき現在フレームの第１
ブロックのそれぞれに対応する動きベクトルと動き補償
されたデータを発生する動き補償部と、前記現在フレームの第１ブロックのそれぞれのデータと
前記動き補償部からの対応する動き補償されたデータ間
の差分データを発生し、前記第１ブロックのそれぞれに
対応して発生された差分データを変換符号化する符号化
手段と、前記現在フレームの第１ブロックのそれぞれに対する映
像複雑度を検出する前置解析部と、前記現在フレームの第１ブロックのそれぞれを代表する
輝度値を出力する輝度解析部と、前記符号化手段により符号化され、前記現在フレームの
既に設定された個数の第１ブロックからなる第２ブロッ
クのそれぞれのデータを対応量子化ステップサイズによ
り量子化する量子化部と、動き補償部からの動きベクトルと前記量子化部により量
子化されたデータを可変長符号化して出力する手段と、前記量子化部により量子化されたデータを復元し、前記
第２ブロック毎の復元されたデータに基づきブロッキン
グ現象を最も少なくする判断基準値を発生する画質評価
部と、前記可変長符号化手段から出力するデータを貯蔵し、貯
蔵されたデータのバッファ占有度を出力するバッファ
と、ニューラルネットワークのための加重値と前記加重値を
更新するための改正規則を貯蔵し、量子化された以前の
第２ブロックに対する前記画質評価部の判断基準値と前
記貯蔵された改正規則により前記貯蔵された加重値を更
新し、量子化しようとする現在の第２ブロックに対する
動きベクトルと映像複雑度及び輝度値のうち少なくとも
一種の情報と、前記バッファからのバッファ占有度及び
前記更新された加重値に基づき前記現在の第２ブロック
のための量子化ステップサイズを発生するニューラルネ
ットワークとを含む符号化装置。
【請求項９】前記第２ブロックは一つの第１ブロック
からなることを特徴とする請求項８に記載の符号化装
置。
【請求項１０】前記第２ブロックは複数個の前記第１
ブロックからなるマクロブロックであることを特徴とす
る請求項８に記載の符号化装置。
【請求項１１】前記画質評価部は前記以前の第２ブロ
ックのデータに基づき前記現在の第２ブロックに対する
判断基準値を出力することを特徴とする請求項８に記載
の符号化装置。
【請求項１２】前記ニューラルネットワークは前記現
在の第２ブロックに対応する映像複雑度とバッファ占有
度及び前記更新された加重値に基づき前記現在の第２ブ
ロックのための量子化ステップサイズを発生することを
特徴とする請求項８に記載の符号化装置。
【請求項１３】前記ニューラルネットワークは前記現
在の第２ブロックに対応する輝度値とバッファ占有度及
び前記更新された加重値に基づき前記現在の第２ブロッ
クのための量子化ステップサイズを発生することを特徴
とする請求項８に記載の符号化装置。
【請求項１４】前記ニューラルネットワークは前記現
在の第２ブロックに対応する映像複雑度、輝度値、バッ
ファ占有度及び前記改善された加重値に基づき前記現在
の第２ブロックのための量子化ステップサイズを発生す
ることを特徴とする請求項８に記載の符号化装置。
【請求項１５】前記ニューラルネットワークは前記現
在の第２ブロックに対応する動きベクトル、映像複雑
度、輝度値、バッファ占有度及び前記更新された加重値
に基づき前記現在の第２ブロックのための量子化ステッ
プサイズを発生することを特徴とする請求項８に記載の
符号化装置。