JP2003264837A - 復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体 - Google Patents

復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体

Info

Publication number
JP2003264837A
JP2003264837A JP2002061419A JP2002061419A JP2003264837A JP 2003264837 A JP2003264837 A JP 2003264837A JP 2002061419 A JP2002061419 A JP 2002061419A JP 2002061419 A JP2002061419 A JP 2002061419A JP 2003264837 A JP2003264837 A JP 2003264837A
Authority
JP
Japan
Prior art keywords
data
tap
learning
class
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002061419A
Other languages
English (en)
Other versions
JP2003264837A5 (ja
JP4081745B2 (ja
Inventor
Tetsujiro Kondo
哲二郎 近藤
Toshihiko Hamamatsu
俊彦 浜松
Takeharu Nishikata
丈晴 西片
Hideki Otsuka
秀樹 大塚
Takeshi Kunihiro
威 國弘
Takafumi Morifuji
孝文 森藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002061419A priority Critical patent/JP4081745B2/ja
Publication of JP2003264837A publication Critical patent/JP2003264837A/ja
Publication of JP2003264837A5 publication Critical patent/JP2003264837A5/ja
Application granted granted Critical
Publication of JP4081745B2 publication Critical patent/JP4081745B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 符号化データを、高画質の画像に復号する。 【解決手段】 ミスマッチ検出部1は、MPEG符号化
された符号化データに含まれるDCTタイプの正しさ
を、その符号化データに含まれる動きベクトルに基づい
て判定し、その判定結果を表すミスマッチ情報を、復号
処理部2に供給する。復号処理部2は、符号化データか
ら、予測タップとするものを、ミスマッチ情報に基づい
て抽出することにより、そのミスマッチ情報に応じたタ
ップ構造の予測タップを構成する。さらに、復号処理部
2は、その予測タップと、あらかじめ学習を行うことに
より求められたタップ係数とを用いて線形1次予測演算
を行うことにより、高画質の画像データの予測値を求め
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、復号装置および復
号方法、学習装置および学習方法、並びにプログラムお
よび記録媒体に関し、特に、例えば、画像データを符号
化した符号化データを、高品質(高画質)の画像に復号
することができるようにする復号装置および復号方法、
学習装置および学習方法、並びにプログラムおよび記録
媒体に関する。
【0002】
【従来の技術】画像(動画像)データの高能率符号化方
式としては、例えば、MPEG(Moving Picture Expert
s Group)方式が知られており、MPEG方式では、画像
データが、横×縦が8×8画素のブロック単位で、水平
および垂直の2方向についてDCT(Discrete Cosine
Transform)変換され、さらに量子化される。
【0003】このように、MPEG方式では、画像デー
タがDCT変換されるが、例えば、MPEG2方式で
は、DCT変換の対象となるブロックのDCTタイプ
を、マクロブロック単位で、フレームDCTモードとフ
ィールドDCTモードに切り替えることができる。フレ
ームDCTモードでは、ブロックが、同一フレームの画
素から構成され、そのようなブロックの画素値がDCT
変換される。また、フィールドDCTモードでは、ブロ
ックが、同一フィールドの画素から構成され、そのよう
なブロックの画素値がDCT変換される。
【0004】DCTタイプを、フレームDCTモードま
たはフィールドDCTモードのうちのいずれとするか
は、基本的には、例えば、画像の動きや、周辺のマクロ
ブロックとの連続性等の画像の特性に基づき、復号画像
におけるブロック歪みモスキートノイズ等を低減するよ
うに決定される。即ち、例えば、動きの大きい画像につ
いては、フィールドDCTモードが選択され、動きのほ
とんどない画像(静止している画像)については、フレー
ムDCTモードが選択される。
【0005】
【発明が解決しようとする課題】ところで、MPEG2
方式においては、デコーダ側においてオーバーフローお
よびアンダーフローが生じないように、符号化データの
データレートが制限される。そして、この符号化データ
のデータレートを制限するために、本来、フレームDC
TモードまたはフィールドDCTモードに設定すべきD
CTタイプが、フィールドDCTモードまたはフレーム
DCTモードに、いわば不適切に設定されることがあ
る。
【0006】即ち、DCTタイプとしては、一般には、
フィールドを構成する画素間の相関(例えば、フィール
ドを構成する、隣接する画素どうしの差分の自乗和の逆
数など)(以下、適宜、フィールド画素相関という)
が、フレームを構成する画素間の相関(例えば、フレー
ムを構成する、隣接する画素どうしの差分の自乗和の逆
数など)(以下、適宜、フレーム画素相関という)より
大であれば、フィールドDCTモードが設定され、フレ
ーム画素相関が、フィールド画素相関より大であれば、
フレームDCTモードが設定される。
【0007】しかしながら、符号化データが、データレ
ートの制限を受ける場合には、DCTタイプは、フィー
ルド画素相関とフレーム画素相関の大小に関係なく、そ
の制限されたデータレートに基づいて設定され、従っ
て、例えば、動きの大きい画像について、フィールドD
CTモードではなく、フレームDCTモードが設定され
るような、不適切なDCTタイプが設定されることがあ
る。
【0008】このような不適切なDCTタイプが設定さ
れた場合であっても、デコーダ側では、その不適切なD
CTタイプにしたがって、符号化データを復号しなけれ
ばならず、復号画像の画質が劣化する課題があった。
【0009】また、動きのある画像が、高圧縮率でMP
EG2符号化された場合には、データレートの制限に起
因して、あるフレームのマクロブロックと、次のフレー
ムの対応するマクロブロックとにおいて、同一の動き物
体が表示されているのにもかかわらず、異なるDCTタ
イプが設定されることがあり、その結果、動きが不自然
な復号画像が得られることがあった。
【0010】一方、復号側において、復号画像から、フ
レームDCTモードとフィールドDCTモードのうちの
いずれを設定するのが適切であったのかを判定すること
は困難である。
【0011】本発明は、このような状況に鑑みてなされ
たものであり、符号化データを、高品質(高画質)の画
像に復号することができるようにするものである。
【0012】
【課題を解決するための手段】本発明の復号装置は、符
号化データに含まれる第1の復号制御情報の正しさを、
その符号化データに含まれる第2の復号制御情報に基づ
いて判定し、その判定結果を表すミスマッチ情報を出力
する判定手段と、ミスマッチ情報に基づいて、符号化デ
ータを復号する復号手段とを備えることを特徴とする。
【0013】本発明の復号方法は、符号化データに含ま
れる第1の復号制御情報の正しさを、その符号化データ
に含まれる第2の復号制御情報に基づいて判定し、その
判定結果を表すミスマッチ情報を出力する判定ステップ
と、ミスマッチ情報に基づいて、符号化データを復号す
る復号ステップとを備えることを特徴とする。
【0014】本発明の第1のプログラムは、符号化デー
タに含まれる第1の復号制御情報の正しさを、その符号
化データに含まれる第2の復号制御情報に基づいて判定
し、その判定結果を表すミスマッチ情報を出力する判定
ステップと、ミスマッチ情報に基づいて、符号化データ
を復号する復号ステップとを備えることを特徴とする。
【0015】本発明の第1の記録媒体は、符号化データ
に含まれる第1の復号制御情報の正しさを、その符号化
データに含まれる第2の復号制御情報に基づいて判定
し、その判定結果を表すミスマッチ情報を出力する判定
ステップと、ミスマッチ情報に基づいて、符号化データ
を復号する復号ステップとを備えるプログラムが記録さ
れていることを特徴とする。
【0016】本発明の学習装置は、学習用の画像データ
から、タップ係数の学習の教師となる教師データを生成
して出力する教師データ生成手段と、学習用の画像デー
タから、タップ係数の学習の生徒となる生徒データを生
成して出力する生徒データ生成手段と、学習用の画像デ
ータを符号化し、複数の復号制御情報を含む学習用の符
号化データを出力する符号化手段と、学習用の符号化デ
ータに含まれる第1の復号制御情報の正しさを、その学
習用の符号化データに含まれる第2の復号制御情報に基
づいて判定し、その判定結果を表すミスマッチ情報を出
力する判定手段と、ミスマッチ情報に基づき、教師デー
タと生徒データを用いて、タップ係数を学習する学習手
段とを備えることを特徴とする。
【0017】本発明の学習方法は、学習用の画像データ
から、タップ係数の学習の教師となる教師データを生成
して出力する教師データ生成ステップと、学習用の画像
データから、タップ係数の学習の生徒となる生徒データ
を生成して出力する生徒データ生成ステップと、学習用
の画像データを符号化し、複数の復号制御情報を含む学
習用の符号化データを出力する符号化ステップと、学習
用の符号化データに含まれる第1の復号制御情報の正し
さを、その学習用の符号化データに含まれる第2の復号
制御情報に基づいて判定し、その判定結果を表すミスマ
ッチ情報を出力する判定ステップと、ミスマッチ情報に
基づき、教師データと生徒データを用いて、タップ係数
を学習する学習ステップとを備えることを特徴とする。
【0018】本発明の第2のプログラムは、学習用の画
像データから、タップ係数の学習の教師となる教師デー
タを生成して出力する教師データ生成ステップと、学習
用の画像データから、タップ係数の学習の生徒となる生
徒データを生成して出力する生徒データ生成ステップ
と、学習用の画像データを符号化し、複数の復号制御情
報を含む学習用の符号化データを出力する符号化ステッ
プと、学習用の符号化データに含まれる第1の復号制御
情報の正しさを、その学習用の符号化データに含まれる
第2の復号制御情報に基づいて判定し、その判定結果を
表すミスマッチ情報を出力する判定ステップと、ミスマ
ッチ情報に基づき、教師データと生徒データを用いて、
タップ係数を学習する学習ステップとを備えることを特
徴とする。
【0019】本発明の第2の記録媒体は、学習用の画像
データから、タップ係数の学習の教師となる教師データ
を生成して出力する教師データ生成ステップと、学習用
の画像データから、タップ係数の学習の生徒となる生徒
データを生成して出力する生徒データ生成ステップと、
学習用の画像データを符号化し、複数の復号制御情報を
含む学習用の符号化データを出力する符号化ステップ
と、学習用の符号化データに含まれる第1の復号制御情
報の正しさを、その学習用の符号化データに含まれる第
2の復号制御情報に基づいて判定し、その判定結果を表
すミスマッチ情報を出力する判定ステップと、ミスマッ
チ情報に基づき、教師データと生徒データを用いて、タ
ップ係数を学習する学習ステップとを備えるプログラム
が記録されていることを特徴とする。
【0020】本発明の復号装置および復号方法、並びに
第1のプログラムおよび第1の記録媒体においては、符
号化データに含まれる第1の復号制御情報の正しさが、
その符号化データに含まれる第2の復号制御情報に基づ
いて判定され、その判定結果を表すミスマッチ情報が出
力される。そして、そのミスマッチ情報に基づいて、符
号化データが復号される。
【0021】本発明の学習装置および学習方法、並びに
第2のプログラムおよび第2の記録媒体においては、学
習用の画像データから、タップ係数の学習の教師となる
教師データが生成されるとともに、生徒となる生徒デー
タが生成される。また、学習用の画像データが符号化さ
れ、複数の復号制御情報を含む学習用の符号化データが
出力される。そして、学習用の符号化データに含まれる
第1の復号制御情報の正しさが、その学習用の符号化デ
ータに含まれる第2の復号制御情報に基づいて判定さ
れ、その判定結果を表すミスマッチ情報が出力される。
さらに、そのミスマッチ情報に基づき、教師データと生
徒データを用いて、タップ係数の学習が行われる。
【0022】
【発明の実施の形態】図1は、本発明を適用した復号装
置の一実施の形態の構成例を示している。
【0023】復号装置には、図示せぬ記録媒体(例え
ば、光ディスクや、光磁気ディスク、相変化ディスク、
磁気テープ、半導体メモリ等)から再生された符号化デ
ータ、または伝送媒体(例えば、インターネットや、C
ATV網、衛星回線、地上波等)を介して伝送されてく
る符号化データが、復号対象として入力されるようにな
っている。ここで、符号化データは、画像(動画像)デ
ータを所定の符号化方式で符号化して得られるもので、
少なくとも、その復号を制御するための復号制御情報を
含んでいる。
【0024】なお、符号化データとしては、例えば、画
像データをMPEG2方式で符号化したもの等を採用す
ることができる。
【0025】ここで、MPEG2方式では、符号化側に
おいて、画像データ(原画像)がブロック単位でDCT
変換され、さらに量子化される。また、符号化側では、
符号化対象の画像データについて、動きベクトルが検出
されるとともに、符号化データがローカルデコードさ
れ、そのローカルデコードされた画像データを参照画像
として、その参照画像について、検出された動きベクト
ルを用いて動き補償が施されることにより、予測画像が
生成される。そして、符号化対象の画像と予測画像との
差分が演算されることにより、残差画像が求められ、そ
の残差画像が、上述のようにDCT変換、量子化され
る。さらに、符号化側では、ブロック単位でのDCT変
換にあたって、DCTタイプ(フレームDCTモードま
たはフィールドDCTモード)が、マクロブロック単位
で設定される。
【0026】一方、画像データ(原画像または残差画
像)をDCT変換し、さらに量子化して得られるDCT
係数を、量子化DCT係数というものとすると、復号側
では、量子化DCT係数が、逆量子化され、DCT係数
とされる。さらに、復号側では、そのDCT係数が逆D
CT変換され、その結果得られる画素が、DCTタイプ
にしたがい、フレーム構造に並べ替えられることで、画
像データが復号され、あるいは残差画像データが求めら
れる。そして、残差画像データについては、既に復号さ
れた画像データを参照画像として、その参照画像につい
て、動きベクトルを用いて動き補償が施されることによ
り、予測画像データが生成される。そして、残差画像デ
ータと予測画像データとが加算されることにより、画像
データが復号される。
【0027】従って、画像データをMPEG2方式で符
号化して得られる符号化データには、画像データ(原画
像または残差画像)をDCT変換し、さらに量子化して
得られるDCT係数、つまり、画像データの直接の符号
化結果の他、復号側において、そのDCT係数を画像に
復号するのに必要な情報、即ち、動きベクトルや、DC
Tタイプなどの復号を制御する情報(以下、適宜、復号
制御情報という)も含まれる。なお、符号化データに
は、動きベクトルやDCTタイプの他、ピクチャタイプ
や、テンポラルリファレンス、その他の復号制御情報も
含まれる。
【0028】復号装置に入力された符号化データは、ミ
スマッチ検出部1と復号処理部2に供給されるようにな
っている。
【0029】ミスマッチ検出部1は、符号化データから
ミスマッチ情報を検出する。即ち、ミスマッチ検出部1
は、符号化データに含まれる復号制御情報の正しさを判
定し、その判定結果を表すミスマッチ情報を、復号処理
部2に出力する。復号処理部2は、ミスマッチ検出部1
から供給されるミスマッチ情報に基づいて、符号化デー
タを復号し、その結果得られる復号データを出力する。
【0030】次に、図2のフローチャートを参照して、
図1の復号装置の処理(復号処理)について説明する。
【0031】ミスマッチ検出部1と復号処理部2には、
符号化データが供給され、ミスマッチ検出部1は、まず
最初に、ステップS1において、符号化データからミス
マッチ情報を検出し、復号処理部2に供給して、ステッ
プS2に進む。ステップS2では、復号処理部2が、ミ
スマッチ検出部1から供給されるミスマッチ情報に基づ
いて、そのミスマッチ情報が検出された符号化データを
復号し、復号画像データを出力して、ステップS3に進
む。ステップS3では、ミスマッチ検出部1または復号
処理部2が、復号すべき符号化データが、まだ存在する
かどうかを判定する。ステップS3において、復号すべ
き符号化データが、まだ存在すると判定された場合、ス
テップS1に戻り、以下、同様の処理が繰り返される。
【0032】また、ステップS3において、復号すべき
符号化データが存在しないと判定された場合、処理を終
了する。
【0033】次に、図3は、本発明を適用した復号装置
の他の実施の形態の構成例を示している。なお、図中、
図1における場合と対応する部分については、同一の符
号を付してあり、以下では、その説明は、適宜省略す
る。即ち、図3の復号装置は、パラメータ記憶部3が、
新たに設けられている他は、基本的に、図1の復号装置
と同様に構成されている。
【0034】パラメータ記憶部3は、後述する学習装置
による学習によって得られたパラメータを記憶してお
り、復号処理部2は、パラメータ記憶部3に記憶された
パラメータを用いて、そこに供給される符号化データを
復号する。
【0035】従って、図3の復号装置では、復号処理部
2において、符号化データの復号が、パラメータ記憶部
3に記憶されたパラメータを用いて行われる他は、図1
の復号装置と同様の処理が行われるため、その処理につ
いての説明は省略する。
【0036】次に、図4は、図3のパラメータ記憶部3
に記憶させるパラメータを学習する学習装置の一実施の
形態の構成例を示している。
【0037】学習用データ記憶部11は、パラメータの
学習に用いられる画像(動画像)データである学習用デ
ータを記憶している。
【0038】符号化部12は、学習用データ記憶部11
に記憶されている学習用データを読み出し、図3の復号
装置で復号対象とする符号化データと同一の符号化方式
で、学習用データを符号化する。学習用データを符号化
することにより得られる符号化データ(以下、適宜、学
習用符号化データという)は、符号化部12からミスマ
ッチ検出部13に供給されるようになっている。
【0039】ミスマッチ検出部13は、図3のミスマッ
チ検出部1と同様に構成され、符号化部12から供給さ
れる符号化データから、ミスマッチ情報を検出し、学習
処理部14に供給する。
【0040】学習処理部14は、学習用データ記憶部1
1に記憶されている学習用データを読み出し、その学習
用データから、パラメータについての学習の教師となる
教師データと、その学習の生徒となる生徒データを生成
する。さらに、学習処理部14は、ミスマッチ検出部1
3から供給されるミスマッチ情報に基づき、生成した教
師データと生徒データを用いて、生徒データを教師デー
タに変換するパラメータを学習する。
【0041】次に、図5のフローチャートを参照して、
図4の学習装置の処理(学習処理)について説明する。
【0042】まず最初に、ステップS11において、符
号化部12は、学習用データ記憶部11に記憶されてい
る学習用データを読み出して符号化し、その結果得られ
る学習用符号化データを、ミスマッチ検出部13に供給
して、ステップS12に進む。ステップS12では、ミ
スマッチ検出部13が、符号化部12から供給される符
号化データから、ミスマッチ情報を検出し、学習処理部
14に供給して、ステップS13に進む。
【0043】ステップS13では、学習処理部14が、
学習用データ記憶部11から、学習用データを読み出
し、その学習用データから、教師データと生徒データを
生成する。さらに、学習処理部14は、ミスマッチ検出
部13から供給されるミスマッチ情報に基づき、生成し
た教師データと生徒データを用いて、パラメータを学習
する。
【0044】即ち、学習処理部14は、ミスマッチ情報
に基づき、生徒データから、対応する教師データを得る
ことができるようにするのに最適なパラメータを算出す
ることができるようにするための処理(学習)を行う。
【0045】そして、ステップS14に進み、符号化部
12または学習処理部14が、まだ処理していない学習
用データが、学習用データ記憶部11に記憶されている
かどうかを判定する。ステップS14において、まだ処
理していない学習用データが、学習用データ記憶部11
に記憶されていると判定された場合、ステップS11に
戻り、その、まだ処理していない学習用データを対象
に、以下、同様の処理が繰り返される。
【0046】また、ステップS14において、まだ処理
していない学習用データが、学習用データ記憶部11に
記憶されていないと判定された場合、即ち、学習用デー
タ記憶部11に記憶された学習用データすべてを用いて
学習を行った場合、ステップS15に進み、学習処理部
14は、ステップS13の学習結果に基づき、パラメー
タを算出し、処理を終了する。
【0047】次に、図6は、図3の復号装置の詳細構成
例を示している。
【0048】復号制御情報抽出部21には、画像データ
を、例えばMPEG2方式で符号化して得られる符号化
データが、復号対象として供給されるようになってお
り、復号制御情報抽出部21は、符号化データから、そ
の符号化データに含まれる複数(複数種類)の復号制御
情報、即ち、本実施の形態では、例えば、DCTタイ
プ、ピクチャタイプ、動きベクトルを抽出して、判定部
22に供給する。
【0049】判定部22は、復号制御情報抽出部21か
ら供給される複数の復号制御情報のうちの1つの(1つ
の種類の)復号制御情報の正しさを、他の(他の種類
の)復号制御情報に基づいて判定する。そして、判定部
22は、その1つの復号制御情報の正しさの判定結果と
してのミスマッチ情報を、復号処理部2に出力する。
【0050】なお、以上の復号制御情報抽出部21およ
び判定部22が、図3のミスマッチ検出部1を構成して
いる。
【0051】前処理部31には、復号対象の符号化デー
タが供給されるようになっており、前処理部31は、符
号化データに対して、所定の前処理を施し、その結果得
られる前処理データを、クラス分類適応処理部32に供
給する。
【0052】クラス分類適応処理部32は、前処理部3
1から供給される前処理データから、後述する予測タッ
プおよびクラスタップを構成し、係数メモリ41に記憶
されたパラメータを用いて、後述するクラス分類適応処
理を行う。そして、クラス分類適応処理部32は、クラ
ス分類適応処理を行うことによって得られるデータ(以
下、適宜、適応処理データという)を、後処理部33に
出力する。
【0053】また、クラス分類適応処理部32には、ミ
スマッチ検出部1の判定部22が出力するミスマッチ情
報が供給されるようになっており、クラス分類適応処理
部32は、このミスマッチ情報に基づき、クラス分類適
応処理を行う。
【0054】後処理部33は、クラス分類適応処理部3
2が出力するデータに対して、所定の後処理を施し、こ
れにより、符号化データを、高画質の画像データに復号
して出力する。
【0055】なお、以上の前処理部31、クラス分類適
応処理部32、および後処理部33が、図3の復号処理
部2を構成している。
【0056】係数メモリ41は、クラス分類適応処理部
32がクラス分類適応処理を行うのに用いる、後述する
クラスごとのタップ係数を記憶している。
【0057】なお、この係数メモリ41によって、図3
のパラメータ記憶部3が構成されている。
【0058】次に、図7および図8を参照して、図6の
ミスマッチ検出部1の処理について説明する。
【0059】図7は、MPEG2方式において、フレー
ムDCTモードでDCT変換されるブロック(図7A)
と、フィールドDCTモードでDCT変換されるブロッ
ク(図7B)を示している。
【0060】なお、図7の実施の形態では、輝度信号の
ブロックを示してある。また、図7において(後述する
図8においても同様)、影を付してあるラインは、奇数
ライン(トップフィールド)を表し、影を付していない
ラインは、偶数ライン(ボトムフィールド)を表す。
【0061】フレームDCTモードでは、横×縦が16
×16画素で構成されるマクロブロックが、図7Aに示
すように、左上、左下、右上、または右下の4つの8×
8画素のブロックに分割され、各ブロックがDCT変換
される。
【0062】一方、フィールドDCTモードでは、マク
ロブロックは、図7Bに示すように、上側の8ラインが
奇数ライン(トップフィールド)で構成され、下側の8
ラインが偶数ライン(ボトムフィールド)で構成される
ように、画素の位置が並べ替えられる。そして、その並
べ替え後のマクロブロックが、左上、左下、右上、また
は右下の4つの8×8画素のブロックに分割され、各ブ
ロックがDCT変換される。
【0063】以上のように、フレームDCTモードで
は、同一フレームを構成する8×8画素のブロック単位
で、DCT変換が行われ、フィールドDCTモードで
は、同一フィールドを構成する8×8画素のブロック単
位で、DCT変換が行われる。
【0064】ところで、例えば、いま、円形の動き物体
が、水平方向に移動している画像を考えた場合、あるフ
レームを構成するトップフィールドとボトムフィールド
において、円形の動き物体は、例えば、図8Aに示すよ
うに、その動きに対応して、少しずれた位置に表示され
る。このため、このような動き物体が表示された画像に
ついては、フレーム画素相関よりも、フィールド画素相
関の方が大になり、フィールドDCTモードでDCT変
換を行うことにより、滑らかな動きの復号画像を得るこ
とができる。
【0065】しかしながら、MPEG方式では、前述し
たように、動き物体が表示された画像について、データ
レートの制限に起因して、符号化データのデータ量を低
減するために、フィールドDCTモードではなく、フレ
ームDCTモードで、画像データがDCT変換される場
合がある。
【0066】いま、円形の動き物体が表示されている部
分の一部のマクロブロックについて、フレームDCTモ
ードが設定されるとともに、他のマクロブロックについ
て、フィールドDCTモードが設定され、DCT変換が
行われたとすると、フレームDCTモードが設定された
マクロブロックについては、例えば、図8Bに示すよう
に、円形の動き物体のエッジ部分がぼやけた復号画像が
得られる。
【0067】ここで、図8Bは、2×2個のマクロブロ
ックのうち、右上のマクロブロックのDCTタイプがフ
レームDCTモードとされ、他の3つのマクロブロック
のDCTタイプがフィールドDCTモードとされた場合
の復号画像を示している。
【0068】DCTタイプを、フレームDCTモードま
たはフィールドDCTモードのうちのいずれとするか
は、マクロブロック単位で設定されることから、異なる
フレームの対応するマクロブロック(同一位置のマクロ
ブロック)であっても、DCTタイプが異なる場合があ
る。そして、動き物体が表示されている、ある位置のマ
クロブロックのDCTタイプが、フレーム単位で変化す
ると、復号画像における動き物体の動きは、不自然なも
のとなる。
【0069】このような復号画像におけるエッジ部分の
ぼけ(ぶれ)や、不自然な動きは、フィールドDCTモ
ードでDCT変換すべきマクロブロックが、データレー
トの制限から、フレームDCTモードでDCT変換され
たこと、即ち、動きのある部分は、フィールドDCTモ
ードでDCT変換すべきであるのに、フレームDCTモ
ードでDCT変換されたことに起因する。従って、フィ
ールドDCTモードでDCT変換すべきマクロブロック
を、フレームDCTモードでDCT変換したことは、復
号画像の画質を向上させる観点からは、正しくない(適
切でない)ということができ、符号化データに含まれる
復号制御情報の1つである、そのようなフレームDCT
モードを表すDCTタイプも正しくないということがで
きる。
【0070】そこで、ミスマッチ検出部1は、例えば、
符号化データに含まれるDCTタイプの正しさを判定
し、その判定結果を表すミスマッチ情報を出力する。
【0071】即ち、ミスマッチ検出部1は、例えば、動
きのある画像が表示されているマクロブロックのDCT
タイプが、フレームDCTモードとなっている場合、そ
のマクロブロックのDCTタイプが正しくないと判定す
る。一方、ミスマッチ検出部1は、例えば、動きのある
画像が表示されているマクロブロックのDCTタイプ
が、フィールドDCTモードとなっている場合と、マク
ロブロックに動きがない画像が表示されている場合は、
そのマクロブロックのDCTタイプが正しいと判定す
る。
【0072】なお、ミスマッチ検出部1は、マクロブロ
ック(に表示された画像)に動きがあるかどうかを、符
号化データに含まれる復号制御情報の他の1つである、
例えば、そのマクロブロックの動きベクトルに基づいて
判定する。
【0073】次に、図9は、図6のクラス分類適応処理
部32の構成例を示している。
【0074】クラス分類適応処理は、クラス分類処理と
適応処理とからなり、クラス分類処理によって、データ
が、その性質に基づいてクラス分けされ、各クラスごと
に適応処理が施される。
【0075】ここで、適応処理について、低画質の画像
(以下、適宜、低画質画像という)を、高画質の画像
(以下、適宜、高画質画像という)に変換する場合を例
に説明する。
【0076】この場合、適応処理では、低画質画像を構
成する画素(以下、適宜、低画質画素という)と、所定
のタップ係数との線形結合により、その低画質画像の画
質を向上させた高画質画像の画素の予測値を求めること
で、その低画質画像の画質を高画質化した画像が得られ
る。
【0077】具体的には、例えば、いま、ある高画質画
像データを教師データとするとともに、その高画質画像
の画質を劣化させた低画質画像データを生徒データとし
て、高画質画像を構成する画素(以下、適宜、高画質画
素という)yの予測値E[y]を、幾つかの低画質画素
(低画質画像を構成する画素の画素値)x1,x2,・・
・の集合と、所定のタップ係数w1,w2,・・・の線形
結合により規定される線形1次結合モデルにより求める
ことを考える。この場合、予測値E[y]は、次式で表
すことができる。
【0078】 E[y]=w11+w22+・・・ ・・・(1)
【0079】式(1)を一般化するために、タップ係数
jの集合でなる行列W、生徒データxijの集合でなる
行列X、および予測値E[yj]の集合でなる行列Y’
を、
【数1】 で定義すると、次のような観測方程式が成立する。
【0080】 XW=Y’ ・・・(2)
【0081】ここで、行列Xの成分xijは、i件目の生
徒データの集合(i件目の教師データyiの予測に用い
る生徒データの集合)の中のj番目の生徒データを意味
し、行列Wの成分wjは、生徒データの集合の中のj番
目の生徒データとの積が演算されるタップ係数を表す。
また、yiは、i件目の教師データを表し、従って、E
[yi]は、i件目の教師データの予測値を表す。な
お、式(1)の左辺におけるyは、行列Yの成分yi
サフィックスiを省略したものであり、また、式(1)
の右辺におけるx1,x2,・・・も、行列Xの成分xij
のサフィックスiを省略したものである。
【0082】式(2)の観測方程式に最小自乗法を適用
して、高画質画素(の画素値)yに近い予測値E[y]
を求めることを考える。この場合、教師データとなる高
画質画素の真値yの集合でなる行列Y、および高画質画
素yの予測値E[y]の残差(真値yに対する誤差)e
の集合でなる行列Eを、
【数2】 で定義すると、式(2)から、次のような残差方程式が
成立する。
【0083】 XW=Y+E ・・・(3)
【0084】この場合、高画質画素yに近い予測値E
[y]を求めるためのタップ係数wjは、自乗誤差
【数3】 を最小にすることで求めることができる。
【0085】従って、上述の自乗誤差をタップ係数wj
で微分したものが0になる場合、即ち、次式を満たすタ
ップ係数wjが、高画質画素yに近い予測値E[y]を
求めるため最適値ということになる。
【0086】
【数4】 ・・・(4)
【0087】そこで、まず、式(3)を、タップ係数w
jで微分することにより、次式が成立する。
【0088】
【数5】 ・・・(5)
【0089】式(4)および(5)より、式(6)が得
られる。
【0090】
【数6】 ・・・(6)
【0091】さらに、式(3)の残差方程式における生
徒データxij、タップ係数wj、教師データyi、および
残差eiの関係を考慮すると、式(6)から、次のよう
な正規方程式を得ることができる。
【0092】
【数7】 ・・・(7)
【0093】なお、式(7)に示した正規方程式は、行
列(共分散行列)Aおよびベクトルvを、
【数8】 で定義するとともに、ベクトルWを、数1で示したよう
に定義すると、式 AW=v ・・・(8) で表すことができる。
【0094】式(7)における各正規方程式は、生徒デ
ータxijおよび教師データyiのセットを、ある程度の
数だけ用意することで、求めるべきタップ係数wjの数
Jと同じ数だけたてることができ、従って、式(8)
を、ベクトルWについて解くことで(但し、式(8)を
解くには、式(8)における行列Aが正則である必要が
ある)、最適なタップ係数wjを求めることができる。
なお、式(8)を解くにあたっては、例えば、掃き出し
法(Gauss-Jordanの消去法)などを用いることが可能で
ある。
【0095】以上のように、生徒データと教師データを
用いて、最適なタップ係数(ここでは、生徒データから
教師データの予測値を求めた場合に、その予測値の自乗
誤差の総和を最小にするタップ係数)wjを求める学習
をしておき、さらに、そのタップ係数wjを用い、式
(1)により、教師データyに近い予測値E[y]を求
めるのが適応処理である。
【0096】なお、適応処理は、低画質画像には含まれ
ていないが、高画質画像に含まれる成分が再現される点
で、単なる補間とは異なる。即ち、適応処理では、式
(1)だけを見る限りは、いわゆる補間フィルタを用い
ての単なる補間と同一に見えるが、その補間フィルタの
タップ係数に相当するタップ係数wが、教師データと生
徒データを用いての学習により求められるため、教師デ
ータとしての高画質画像に含まれる成分を再現すること
ができる。このことから、適応処理は、いわば画像の創
造作用がある処理ということができる。
【0097】ここで、生徒データとしては、例えば、教
師データとしての高画質の画像データをMPEG符号化
し、さらにMPEG復号して得られる復号画像データを
用いることができる。この場合、MPEG符号化におけ
る量子化に起因して生じるブロック歪み等を低減した高
画質の画像を求めることのできるタップ係数を得ること
ができる。
【0098】さらに、例えば、教師データとして、高画
質の画像データを用いるとともに、生徒データとして、
教師データとしての画像データをDCT変換し、さらに
量子化、逆量子化して得られるDCT係数を用いるよう
にすることも可能である。この場合、DCT係数を、高
画質の画像(の予測値)に変換するタップ係数を得るこ
とができる。
【0099】また、上述の場合には、高画質画像の予測
値を、線形1次予測するようにしたが、その他、高画質
画像の予測値は、2次以上の式によって予測することも
可能である。
【0100】図9のクラス分類適応処理部32は、上述
のようなクラス分類適応処理を行うようになっている。
【0101】即ち、前処理部31(図6)が出力する前
処理データは、タップ抽出部51および52に供給され
るようになっている。
【0102】タップ抽出部51は、得ようとしている適
応処理データを、注目データとし、さらに、その注目デ
ータを予測するのに用いる前処理データの幾つかを、予
測タップとして抽出する。また、タップ抽出部52は、
注目データをクラス分類するのに用いる前処理データの
幾つかを、クラスタップとして抽出する。
【0103】ここで、タップ抽出部51および52に
は、判定部22(図6)が出力するミスマッチ情報も供
給されるようになっている。そして、タップ抽出部51
と52は、ミスマッチ情報に基づき、予測タップとクラ
スタップの構造を、それぞれ変更するようになってい
る。
【0104】なお、ここでは、説明を簡単にするため
に、予測タップとクラスタップは、同一のタップ構造を
有するものとする。但し、予測タップとクラスタップと
は、異なるタップ構造とすることが可能である。
【0105】タップ抽出部51で得られた予測タップ
は、予測部54に供給され、タップ抽出部52で得られ
たクラスタップは、クラス分類部53に供給される。
【0106】クラス分類部53には、クラスタップの
他、ミスマッチ情報も供給されるようになっており、ク
ラス分類部53は、タップ抽出部52からのクラスタッ
プとミスマッチ情報に基づき、注目データをクラス分類
し、その結果得られるクラスに対応するクラスコード
を、係数メモリ41に供給する。
【0107】係数メモリ41は、各クラスコードに対応
するアドレスに、そのクラスコードに対応するクラスの
タップ係数を記憶しており、クラス分類部53から供給
されるクラスコードに対応するアドレスに記憶されてい
るタップ係数を、予測部54に供給する。
【0108】予測部54は、タップ抽出部51が出力す
る予測タップと、係数メモリ41が出力するタップ係数
とを取得し、その予測タップとタップ係数とを用いて、
式(1)に示した線形予測演算を行う。これにより、予
測部54は、適応処理データ(の予測値)を求めて出力
する。
【0109】次に、図10のフローチャートを参照し
て、図6の復号装置の処理(復号処理)について説明す
る。
【0110】クラス分類適応処理部32(図9)のタッ
プ抽出部51では、得ようとしている適応処理データ
が、注目データとされ、ステップS21において、ミス
マッチ検出部1が、その注目データに対応する符号化デ
ータ(以下、適宜、注目符号化データという)から、ミ
スマッチ情報を生成する。
【0111】即ち、ミスマッチ検出部1では、復号制御
情報抽出部21が、注目符号化データから、複数の復号
制御情報としての、例えば、動きベクトルやDCTタイ
プなどを抽出し、判定部22に供給する。そして、判定
部22は、例えば、復号制御情報抽出部21から供給さ
れる動きベクトルなどに基づいて、同じく復号制御情報
抽出部21から供給されるDCTタイプの正しさを判定
し、その判定結果としてのミスマッチ情報を、クラス分
類適応処理部32に供給する。
【0112】そして、ステップS22に進み、前処理部
31は、注目データについての予測タップとクラスタッ
プを構成するのに必要な前処理データを得るための符号
化データに対して、前処理を施し、その結果得られる前
処理データを、クラス分類適応処理部32に供給する。
【0113】クラス分類適応処理部32(図9)では、
ステップS23において、タップ抽出部51と52が、
前処理部31から供給される前処理データを用い、例え
ば、ミスマッチ検出部1からのミスマッチ情報に基づく
タップ構造の予測タップとクラスタップを、それぞれ構
成する。そして、予測タップは、タップ抽出部51から
予測部54に供給され、クラスタップは、タップ抽出部
52からクラス分類部53に供給される。
【0114】クラス分類部53は、タップ抽出部52か
ら、注目データについてのクラスタップを受信し、ステ
ップS24において、そのクラスタップと、ミスマッチ
検出部1から供給されるミスマッチ情報に基づき、注目
データをクラス分類し、注目データのクラスを表すクラ
スコードを、係数メモリ41に出力する。
【0115】係数メモリ41は、クラス分類部53から
供給されるクラスコードに対応するアドレスに記憶され
ているタップ係数を読み出して出力する。予測部54
は、ステップS25において、係数メモリ41が出力す
るタップ係数を取得し、ステップS26に進む。
【0116】ステップS26では、予測部54が、タッ
プ抽出部51が出力する予測タップと、係数メモリ41
から取得したタップ係数とを用いて、式(1)に示した
線形予測演算を行う。これにより、予測部54は、注目
データとしての適応処理データ(の予測値)を求め、後
処理部33に供給する。
【0117】後処理部33(図6)は、ステップS27
において、クラス分類適応処理部32(の予測部54)
からの注目データに対して、所定の後処理を施し、これ
により、復号画像データを得て出力する。
【0118】その後、ステップS28に進み、まだ、注
目データとしていない適応処理データがあるかどうかが
判定される。ステップS28において、まだ、注目デー
タとしていない適応処理データがあると判定された場
合、その、まだ注目データとされていない適応処理デー
タのうちの1つが、新たに注目データとされ、ステップ
S21に戻り、以下、同様の処理が繰り返される。
【0119】また、ステップS28において、まだ、注
目データとされていない適応処理データがないと判定さ
れた場合、処理を終了する。
【0120】次に、図11は、図6の係数メモリ41に
記憶させるタップ係数を学習する場合の、図4の学習装
置の詳細構成例を示している。
【0121】図11の実施の形態において、ミスマッチ
検出部13は、復号制御情報抽出部71および判定部7
2から構成されており、符号化部12が出力する符号化
データは、復号制御情報抽出部71に供給されるように
なっている。復号制御情報抽出部71または判定部72
は、図6の復号制御情報抽出部21または判定部22と
それぞれ同様に構成されており、図6で説明した場合と
同様に、後述する注目教師データに対応する符号化デー
タから、ミスマッチ情報を求めて、学習処理部14に供
給する。
【0122】学習処理部14は、適応学習部60、教師
データ生成部61、および生徒データ生成部63から構
成されている。
【0123】適応学習部60は、教師データ記憶部6
2、生徒データ記憶部64、タップ抽出部65および6
6、クラス分類部67、足し込み部68、およびタップ
係数算出部69から構成され、教師データ生成部61
は、逆後処理部61Aから構成され、生徒データ生成部
63は、符号化部63Aおよび前処理部63Bから構成
されている。
【0124】逆後処理部61Aは、学習用データ記憶部
11から学習用データを読み出し、図6の後処理部33
が行う処理と相補的な関係にある処理(以下、適宜、逆
後処理という)を行う。即ち、例えば、学習用データを
yとするとともに、図6の後処理部33が、適応処理デ
ータxに対して施す後処理を、関数f(x)で表すとす
ると、逆後処理部61Aは、学習用データyに対して、
関数f-1(y)(f-1()は、関数f()の逆関数を表
す)で表される処理を逆後処理として施し、その結果得
られるデータを、教師データとして、適応学習部60に
出力する。なお、逆後処理部61Aが出力する教師デー
タは、図6のクラス分類適応処理部32から後処理部3
3に供給される適応処理データに相当する。
【0125】教師データ記憶部62は、教師データ生成
部61(の逆後処理部61A)が出力する教師データを
一時記憶する。
【0126】符号化部63Aは、学習用データ記憶部1
1から学習用データを読み出し、符号化部12と同一の
符号化方式、即ち、本実施の形態では、例えば、MPE
G2方式で符号化して出力する。従って、符号化部63
Aは、符号化部12が出力するのと同一の符号化データ
を出力する。なお、符号化部12と63Aとは、1つの
符号化部で共用することが可能である。
【0127】前処理部63Bは、符号化部63Aが出力
する符号化データに対して、図6の前処理部31が行う
のと同一の前処理を施し、その結果得られる前処理デー
タを、生徒データとして、適応学習部60に出力する。
なお、前処理部63Bが出力する生徒データは、図6の
前処理部31からクラス分類適応処理部32に供給され
る前処理データに相当する。
【0128】生徒データ記憶部64は、生徒データ生成
部63(の前処理部63B)が出力する生徒データを一
時記憶する。
【0129】タップ抽出部65は、教師データ記憶部6
2に記憶された教師データを、順次、注目教師データと
し、その注目教師データについて、生徒データ記憶部6
4に記憶された生徒データを抽出することにより、図9
のタップ抽出部51が構成するのと同一のタップ構造の
予測タップを構成して出力する。なお、タップ抽出部6
5には、ミスマッチ検出部13(の判定部72)が出力
するミスマッチ情報が供給されるようになっており、タ
ップ抽出部65は、図9のタップ抽出部51と同様に、
注目教師データについてのミスマッチ情報に基づいて、
予測タップのタップ構造を変更するようになっている。
【0130】タップ抽出部66は、注目教師データにつ
いて、生徒データ記憶部64に記憶された生徒データを
抽出することにより、図9のタップ抽出部52が構成す
るのと同一のタップ構造のクラスタップを構成して出力
する。なお、タップ抽出部66には、ミスマッチ検出部
13が出力するミスマッチ情報が供給されるようになっ
ており、タップ抽出部66は、図9のタップ抽出部52
と同様に、注目教師データについてのミスマッチ情報に
基づいて、クラスタップのタップ構造を変更するように
なっている。
【0131】クラス分類部67には、タップ抽出部66
が出力するクラスタップと、ミスマッチ検出部13が出
力するミスマッチ情報が供給されるようになっている。
クラス分類部67は、注目教師データについてのクラス
タップとミスマッチ情報に基づき、注目教師データにつ
いて、図9のクラス分類部53と同一のクラス分類を行
い、その結果得られるクラスに対応するクラスコード
を、足し込み部68に出力する。
【0132】足し込み部68は、教師データ記憶部62
から、注目教師データを読み出し、その注目教師データ
と、タップ抽出部65から供給される注目教師データに
ついて構成された予測タップを構成する生徒データを対
象とした足し込みを、クラス分類部67から供給される
クラスコードごとに行う。
【0133】即ち、足し込み部68は、クラス分類部6
7から供給されるクラスコードに対応するクラスごと
に、予測タップ(生徒データ)を用い、式(8)の行列
Aにおける各コンポーネントとなっている、生徒データ
どうしの乗算(xinim)と、サメーション(Σ)に相
当する演算を行う。
【0134】さらに、足し込み部68は、やはり、クラ
ス分類部67から供給されるクラスコードに対応するク
ラスごとに、予測タップ(生徒データ)および教師デー
タを用い、式(8)のベクトルvにおける各コンポーネ
ントとなっている、生徒データと教師データの乗算(x
ini)と、サメーション(Σ)に相当する演算を行
う。
【0135】即ち、足し込み部68は、前回、注目教師
データとされた教師データについて求められた式(8)
における行列Aのコンポーネントと、ベクトルvのコン
ポーネントを、その内蔵するメモリ(図示せず)に記憶
しており、その行列Aまたはベクトルvの各コンポーネ
ントに対して、新たに注目教師データとされた教師デー
タについて、その教師データyiおよび生徒データxin(x
im)を用いて計算される、対応するコンポーネントxin
imまたはxiniを足し込む(行列A、ベクトルvに
おけるサメーションで表される加算を行う)。
【0136】そして、足し込み部68は、教師データ記
憶部62に記憶された教師データすべてを注目教師デー
タとして、上述の足し込みを行うことにより、各クラス
について、式(8)に示した正規方程式をたてると、そ
の正規方程式を、タップ係数算出部69に供給する。
【0137】タップ係数算出部69は、足し込み部68
から供給されるクラスごとの正規方程式を解くことによ
り、各クラスごとのタップ係数を求めて出力する。
【0138】次に、図12のフローチャートを参照し
て、図11の学習装置の処理(学習処理)について、説
明する。
【0139】まず最初に、ステップS31において、教
師データ生成部61と生徒データ生成部63が、学習用
データ記憶部11に記憶された学習用データから、教師
データと生徒データを、それぞれ生成する。教師データ
は、教師データ生成部61から教師データ記憶部62に
供給されて記憶され、生徒データは、生徒データ生成部
63から生徒データ記憶部64に供給されて記憶され
る。
【0140】その後、タップ抽出部65は、教師データ
記憶部62に記憶された教師データのうち、まだ、注目
教師データとしていないものを、注目教師データとす
る。そして、ステップS32において、符号化部12
は、学習用データ記憶部11に記憶された学習用データ
を符号化し、これにより、注目教師データに対応する符
号化データ(注目教師データに対応する学習用データを
符号化したもの)を得て、ミスマッチ検出部13に供給
する。
【0141】ミスマッチ検出部13は、符号化部12か
ら供給される符号化データから、注目教師データについ
てのミスマッチ情報を生成し、学習処理部14のタップ
抽出部65および66、並びにクラス分類部67に供給
する。
【0142】そして、ステップS34に進み、タップ抽
出部65が、ミスマッチ情報に基づき、注目教師データ
について、生徒データ記憶部64に記憶された生徒デー
タを読み出して予測タップを構成し、足し込み部68に
供給するとともに、タップ抽出部66が、やはり、ミス
マッチ情報に基づき、注目教師データについて、生徒デ
ータ記憶部64に記憶された生徒データを読み出してク
ラスタップを構成し、クラス分類部67に供給する。
【0143】クラス分類部67は、ステップS35にお
いて、注目教師データについてのクラスタップとミスマ
ッチ情報に基づき、注目教師データについてクラス分類
を行い、その結果得られるクラスに対応するクラスコー
ドを、足し込み部68に出力する。
【0144】足し込み部68は、ステップS36におい
て、教師データ記憶部62から注目教師データを読み出
し、その注目教師データと、タップ抽出部65からの予
測タップを用い、式(8)の行列Aとベクトルvのコン
ポーネントを計算する。さらに、足し込み部68は、既
に得られている行列Aとベクトルvのコンポーネントの
うち、クラス分類部67からのクラスコードに対応する
ものに対して、注目データと予測タップから求められた
行列Aとベクトルvのコンポーネントをそれぞれ足し込
み、ステップS37に進む。
【0145】ステップS37では、タップ抽出部65
が、教師データ記憶部62に、まだ、注目教師データと
していない教師データが記憶されているかどうかを判定
する。ステップS37において、注目教師データとして
いない教師データが、まだ、教師データ記憶部62に記
憶されていると判定された場合、タップ抽出部65は、
まだ注目教師データとしていない教師データを、新た
に、注目教師データとして、ステップS32に戻り、以
下、同様の処理が繰り返される。
【0146】また、ステップS37において、注目教師
データとしていない教師データが、教師データ記憶部6
2に記憶されていないと判定された場合、足し込み部6
8は、いままでの処理によって得られたクラスごとの行
列Aおよびベクトルvのコンポーネントで構成される式
(8)の正規方程式を、タップ係数算出部69に供給
し、ステップS38に進む。
【0147】ステップS38では、タップ係数算出部6
9は、足し込み部68から供給される各クラスごとの正
規方程式を解くことにより、各クラスごとに、タップ係
数を求めて出力し、処理を終了する。
【0148】なお、学習用データ記憶部11に記憶され
ている学習用データの数が十分でないこと等に起因し
て、タップ係数を求めるのに必要な数の正規方程式が得
られないクラスが生じることがあり得るが、そのような
クラスについては、タップ係数算出部69は、例えば、
デフォルトのタップ係数を出力するようになっている。
【0149】次に、図13は、符号化データが画像デー
タをMPEG2方式で符号化したものである場合の、図
6の復号装置の第1の詳細構成例を示している。
【0150】図13の実施の形態では、復号制御情報抽
出部21は、逆VLC部111で構成されている。逆V
LC部111は、例えば、後述するMPEGデコーダ1
16を構成する逆VLC部121(図14)と同様に構
成されており、符号化データから、複数の復号制御情報
としての、例えば、DCTタイプ、ピクチャタイプ、マ
クロブロック(MB)タイプ、動きベクトルを抽出し、
判定部22に供給する。
【0151】判定部22は、フィールド/フレーム判定
部112、イントラ/ノンイントラ判定部113、静動
判定部114、およびミスマッチ情報生成部115から
構成されている。
【0152】フィールド/フレーム判定部112は、逆
VLC部111が出力するDCTタイプに基づいて、注
目データに対応する画素を有するブロック(以下、適
宜、注目ブロックという)が、フレームDCTモードと
フィールドDCTモードのうちのいずれでDCT変換さ
れたかを判定し、その判定結果を、ミスマッチ情報生成
部115に供給する。
【0153】イントラ/ノンイントラ判定部113は、
逆VLC部111が出力するピクチャタイプとマクロブ
ロックタイプに基づいて、注目ブロック(を含むマクロ
ブロック)が、イントラ符号化とノンイントラ符号化の
うちのいずれで符号化されているのかを判定し、その判
定結果を、ミスマッチ情報生成部115に供給する。
【0154】静動判定部114は、逆VLC部111が
出力する動きベクトルに基づいて、注目ブロックの動き
の有無(注目ブロックに表示された画像の動きの有無)
を判定し、その判定結果を、ミスマッチ情報生成部11
5に供給する。
【0155】ミスマッチ情報生成部115は、フィール
ド/フレーム判定部112、イントラ/ノンイントラ判
定部113、および静動判定部114の出力に基づい
て、逆VLC部111が出力する注目ブロック(を含む
マクロブロック)のDCTタイプの正しさを判定し、そ
の判定結果としてのミスマッチ情報を生成して、クラス
分類適応処理部32に供給する。
【0156】ここで、図13の実施の形態では、前処理
部31は、MPEGデコーダ116で構成されており、
MPEGデコーダ116は、符号化データをMPEG2
方式で復号し、その結果得られる復号画像データを、前
処理データとして、クラス分類適応処理部32に供給す
る。
【0157】次に、図14は、図13のMPEGデコー
ダ116の構成例を示している。
【0158】符号化データは、逆VLC部121に供給
される。逆VLC部121は、符号化データから、量子
化DCT係数(量子化されたDCT係数)のVLCコー
ド(量子化DCT係数を可変長符号化したもの)を分離
するとともに、量子化ステップ、動きベクトル、ピクチ
ャタイプ、テンポラルリファレンス、その他の復号制御
情報を分離する。
【0159】そして、逆VLC部121は、量子化DC
T係数のVLCコードを逆VLC処理することで、量子
化DCT係数に復号し、逆量子化部122に供給する。
さらに、逆VLC部121は、量子化ステップを逆量子
化部122に、動きベクトルを動き補償部125に、ピ
クチャタイプをメモリ126に、テンポラルリファレン
スをピクチャ選択部127に、それぞれ供給する。
【0160】逆量子化部122は、逆VLC部121か
ら供給される量子化DCT係数を、同じく逆VLC部1
21から供給される量子化ステップで逆量子化し、その
結果得られるDCT係数を、逆DCT変換部123に供
給する。逆DCT変換部123は、逆量子化部122か
ら供給されるDCT係数を、逆DCT変換し、演算部1
24に供給する。
【0161】演算部124には、逆DCT変換部123
の出力の他、動き補償部125の出力も供給されるよう
になっており、演算部124は、逆DCT変換部123
の出力に対して、動き補償部125の出力を、必要に応
じて加算することにより、復号画像データを得て出力す
る。
【0162】即ち、MPEG符号化では、ピクチャタイ
プとして、I,P,Bの3つが定義されており、各ピク
チャは、横×縦が8×8画素のブロック単位で、DCT
変換されるが、その際、Iピクチャのブロックは、他の
フレームまたはフィールドを参照せずに(予測画像との
差分が計算されずに)イントラ(intra)符号化され、P
ピクチャのブロックは、イントラ符号化、または前方予
測符号化され、Bピクチャのブロックは、イントラ符号
化、前方予測符号化、後方予測符号化、または両方向予
測符号化される。
【0163】ここで、前方予測符号化では、符号化対象
のブロックのフレーム(またはフィールド)より時間的
に先行するフレーム(またはフィールド)の画像を参照
画像として、その参照画像を動き補償することにより得
られる、符号化対象のブロックの予測画像と、符号化対
象のブロックとの差分が求められ、その差分値、即ち、
残差画像がDCT変換される。
【0164】また、後方予測符号化では、符号化対象の
ブロックのフレームより時間的に後行するフレームの画
像を参照画像として、その参照画像を動き補償すること
により得られる、符号化対象のブロックの予測画像と、
符号化対象のブロックとの差分が求められ、その差分値
(残差画像)がDCT変換される。
【0165】さらに、両方向予測符号化では、符号化対
象のブロックのフレームより時間的に先行するフレーム
と後行するフレームの2フレーム(またはフィールド)
の画像を参照画像として、その参照画像を動き補償する
ことにより得られる、符号化対象のブロックの予測画像
と、符号化対象のブロックとの差分が求められ、その差
分値(残差画像)がDCT変換される。
【0166】従って、ブロックが、ノンイントラ(non-i
ntra)符号化(前方予測符号化、後方予測符号化、また
は両方向予測符号化)されている場合、逆DCT変換部
123の出力は、残差画像(元の画像と、その予測画像
との差分値)を復号したものとなっており、演算部12
4は、この残差画像の復号結果(以下、適宜、復号残差
画像という)と、動き補償部125から供給される予測
画像とを加算することで、ノンイントラ符号化されたブ
ロックを復号し、その結果得られる復号画像データを出
力する。
【0167】一方、逆DCT変換部123が出力するブ
ロックが、イントラ符号化されたものであった場合に
は、逆DCT変換部123の出力は、元の画像を復号し
たものとなっており、演算部124は、逆DCT変換部
123の出力を、そのまま、復号画像データとして出力
する。
【0168】演算部124が出力する復号画像データ
は、メモリ126とピクチャ選択部127に供給され
る。
【0169】メモリ126は、演算部124から供給さ
れる復号画像データが、IピクチャまたはPピクチャの
画像データである場合、その復号画像データを、その後
に復号される符号化データの参照画像として一時記憶す
る。ここで、MPEG2では、Bピクチャは参照画像と
されないことから、演算部124から供給される復号画
像が、Bピクチャの画像である場合には、メモリ126
では、Bピクチャの復号画像は記憶されない。なお、メ
モリ126は、演算部124から供給される復号画像
が、I,P,Bのうちのいずれのピクチャであるかは、
逆VLC部121から供給されるピクチャタイプを参照
することにより判断する。
【0170】ピクチャ選択部127は、演算部124が
出力する復号画像、またはメモリ126に記憶された復
号画像のフレーム(またはフィールド)を、表示順に選
択して出力する。即ち、MPEG2方式では、画像のフ
レーム(またはフィールド)の表示順と復号順(符号化
順)とが一致していないため、ピクチャ選択部127
は、復号順に得られる復号画像のフレーム(またはフィ
ールド)を表示順に並べ替えて出力する。なお、ピクチ
ャ選択部127は、表示順を、逆VLC部121から供
給されるテンポラルリファレンスを参照することにより
判断する。
【0171】一方、動き補償部125は、逆VLC部1
21が出力する動きベクトルを受信するとともに、参照
画像となるフレーム(またはフィールド)を、メモリ1
26から読み出し、その参照画像に対して、逆VLC部
121からの動きベクトルにしたがった動き補償を施
し、その結果得られる予測画像を、演算部124に供給
する。演算部124では、上述したように、動き補償部
125からの予測画像と、逆DCT変換部123が出力
する残差画像と加算され、これにより、ノンイントラ符
号化(予測符号化)されたブロックが復号される。
【0172】次に、図15のフローチャートを参照し
て、図13のミスマッチ情報生成部115の処理につい
て説明する。
【0173】ミスマッチ情報生成部115は、まず最初
に、ステップS41において、注目ブロック(を含むマ
クロブロック)が、イントラ符号化されたものである
か、またはノンイントラ符号化されたものであるかを、
イントラ/ノンイントラ判定部113の出力に基づいて
判定する。
【0174】ここで、イントラ/ノンイントラ判定部1
13は、注目ブロックのフレームのピクチャタイプが、
Iピクチャを表している場合、注目ブロックがイントラ
符号化されていると判定する。また、イントラ/ノンイ
ントラ判定部113は、注目ブロックのフレームのピク
チャタイプが、PまたはBピクチャを表している場合に
は、注目ブロックを含むマクロブロック(以下、適宜、
注目マクロブロックという)のマクロブロックタイプに
基づいて、注目ブロックがイントラ符号化またはノンイ
ントラ符号化されているかを判定する。
【0175】ステップS41において、注目ブロックが
ノンイントラ符号化されていると判定された場合、ステ
ップS42に進み、ミスマッチ情報生成部115は、注
目ブロックが、動いている画像を表示しているブロック
(以下、適宜、動きブロックという)であるか、または
静止している画像を表示しているブロック(以下、適
宜、静止ブロックという)であるかを、静動判定部11
4の出力に基づいて判定する。
【0176】ここで、静動判定部114は、ノンイント
ラ符号化されているブロックについては、そのブロック
を含むマクロブロックの動きベクトルの大きさが、所定
の閾値εより大(または以上)である場合、そのノンイ
ントラ符号化されているブロックが動きブロックである
と判定する。また、静動判定部114は、ノンイントラ
符号化されているブロックを含むマクロブロックの動き
ベクトルの大きさが、所定の閾値ε以下(または未満)
である場合、そのノンイントラ符号化されているブロッ
クが静止ブロックであると判定する。
【0177】ステップS42において、注目ブロックが
動きブロックであると判定された場合、ステップS45
に進み、後述する処理が行われる。
【0178】また、ステップS42において、注目ブロ
ックが静止ブロックであると判定された場合、ステップ
S43に進み、ミスマッチ情報生成部115は、注目デ
ータのミスマッチ情報として、注目データのDCTタイ
プ(注目マクロブロックのDCTタイプ)が正しいこと
を表す、例えば、1ビットの0を生成して出力し、処理
を終了する。
【0179】一方、ステップS41において、注目ブロ
ックがイントラ符号化されていると判定された場合、ス
テップS44に進み、ミスマッチ情報生成部115は、
注目ブロックが、動きブロックまたは静止ブロックのう
ちのいずれであるかを、静動判定部114の出力に基づ
いて判定する。
【0180】ここで、静動判定部114は、イントラ符
号化されているブロックについては、例えば、そのブロ
ックの、1フレーム前のフレームにおける対応するブロ
ック(以下、適宜、対応前ブロックという)と、1フレ
ーム後のフレームにおける対応するブロック(以下、適
宜、対応後ブロックという)のうちのいずれか一方、ま
たは両方の動きベクトルと、所定の閾値εとの大小関係
によって、ノンイントラ符号化されているブロックにお
ける場合と同様に、動きブロックまたは静止ブロックの
別を判定する。あるいは、静動判定部114は、例え
ば、イントラ符号化されているブロックについての対応
前ブロックと対応後ブロックのうちのいずれか一方、ま
たは両方が動きブロックである場合、そのイントラ符号
化されているブロックも動きブロックであると判定し、
対応前ブロックと対応後ブロックのうちの両方またはい
ずれか一方が静止ブロックである場合、そのイントラ符
号化されているブロックも静止ブロックであると判定す
る。
【0181】ステップS44において、注目ブロックが
静止ブロックであると判定された場合、ステップS43
に進み、上述したように、ミスマッチ情報生成部115
は、注目データのミスマッチ情報として、注目データの
DCTタイプが正しいことを表す1ビットの0を生成し
て出力し、処理を終了する。
【0182】また、ステップS44において、注目ブロ
ックが動きブロックであると判定された場合、ステップ
S45に進み、ミスマッチ情報生成部115は、注目ブ
ロックのDCTタイプが、フレームDCTモードまたは
フィールドDCTモードのうちのいずれであるかを、フ
ィールド/フレーム判定部112の出力に基づいて判定
する。
【0183】ステップS45において、注目ブロックの
DCTタイプが、フィールドDCTモードであると判定
された場合、ステップS43に進み、上述したように、
ミスマッチ情報生成部115は、注目データのミスマッ
チ情報として、注目データのDCTタイプが正しいこと
を表す1ビットの0を生成して出力し、処理を終了す
る。
【0184】また、ステップS45において、注目ブロ
ックのDCTタイプが、フレームDCTモードであると
判定された場合、ステップS46に進み、ミスマッチ情
報生成部115は、注目データのミスマッチ情報とし
て、注目データのDCTタイプ(注目マクロブロックの
DCTタイプ)が正しくないことを表す、例えば、1ビ
ットの1を生成して出力し、処理を終了する。
【0185】図15の実施の形態によれば、例えば、図
16に示すように、隣接する2×2個のマクロブロック
MB#1,#2,#3,#4において、水平方向に移動
している円形の物体が表示されている場合において、右
上のマクロブロックMB#2のDCTタイプがフレーム
DCTモードであり、他の3つのマクロブロックMB#
1,#3、および#4のDCTタイプがフィールドDC
Tモードであるときには、ミスマッチ情報生成部115
において、以下のようなミスマッチ情報が生成される。
【0186】即ち、マクロブロックMB#1,#2,#
3,#4それぞれを構成するブロックは、いずれも、動
きブロックであり、フィールドDCTモードでDCT変
換すべきである。従って、DCTタイプがフィールドD
CTモードになっているマクロブロックMB#1,#
3,#4それぞれを構成するブロックのデータが注目デ
ータとされた場合には、ミスマッチ情報として、DCT
タイプが正しいことを表す1ビットの0が生成される。
また、DCTタイプがフレームDCTモードになってい
るマクロブロックMB#2を構成するブロックのデータ
が注目データとされた場合には、ミスマッチ情報とし
て、DCTタイプが正しくないことを表す1ビットの1
が生成される。
【0187】なお、図15の実施の形態では、注目ブロ
ックが動きブロックであり、かつそのDCTタイプがフ
レームDCTモードになっている場合にのみ、DCTタ
イプが正しくないことを表すミスマッチ情報を生成し、
他の場合には、DCTタイプが正しいことを表すミスマ
ッチ情報を生成するようにしたが、その他、例えば、注
目ブロックが動きブロックであり、かつそのDCTタイ
プがフレームDCTモードになっている場合と、注目ブ
ロックが静止ブロックであり、かつそのDCTタイプが
フィールドDCTモードになっている場合に、DCTタ
イプが正しくないことを表すミスマッチ情報を生成し、
注目ブロックが動きブロックであり、かつそのDCTタ
イプがフィールドDCTモードになっている場合と、注
目ブロックが静止ブロックであり、かつそのDCTタイ
プがフレームDCTモードになっている場合に、DCT
タイプが正しいことを表すミスマッチ情報を生成するよ
うにすることなども可能である。
【0188】また、図15の実施の形態では、説明を簡
単にするために、DCTタイプが正しいか、正しくない
かを表す1ビットのミスマッチ情報を生成するようにし
たが、ミスマッチ情報としては、その他、例えば、注目
データのDCTタイプと、その注目データを含むブロッ
ク(注目ブロック)が、本来、フレームDCTモードま
たはフィールドDCTモードのうちのいずれでDCT変
換すべきものであるかを表す情報(以下、適宜、ブロッ
クタイプという)とのセットを生成するようにすること
も可能である。
【0189】ここで、ブロックタイプは、例えば、注目
ブロックが動きブロックである場合には、フィールドD
CTモードを表すものとし、注目ブロックが静止ブロッ
クである場合には、フレームDCTモードを表すものと
するようにすることが可能である。
【0190】次に、図13の実施の形態におけるクラス
分類適応処理部32(図9)の処理について説明する。
【0191】クラス分類適応処理部32では、前処理部
31を構成する図14で説明したMPEGデコーダ11
6が出力する復号画像データを対象に、クラス分類適応
処理が行われ、その結果得られる適応処理データが、後
処理部33に出力される。後処理部33は、クラス分類
適応処理部32からの適応処理データを、そのまま、高
画質の画像データ(高画質画像データ)として出力す
る。
【0192】従って、図13の実施の形態では、クラス
分類適応処理部32においてクラス分類適応処理が行わ
れることにより、前処理部31のMPEGデコーダ11
6が出力する、符号化データをMPEG方式で復号した
復号画像データが、高画質画像データに変換されて出力
される。
【0193】即ち、クラス分類適応処理部32(図9)
では、前処理部31のMPEGデコーダ116が出力す
る復号画像データが、タップ抽出部51と52に供給さ
れる。
【0194】タップ抽出部51は、まだ、注目データと
していない高画質画像データの画素を注目データとし
て、その注目データ(の画素値)を予測するのに用いる
復号画像データの幾つか(の画素)を、予測タップとし
て抽出する。タップ抽出部52も、注目データをクラス
分類するのに用いる復号画像データの幾つかを、クラス
タップとして抽出する。
【0195】ここで、上述したように、タップ抽出部5
1および52には、判定部22からミスマッチ情報も供
給されるようになっており、タップ抽出部51と52
は、ミスマッチ情報に基づき、予測タップとクラスタッ
プの構造を、それぞれ変更するようになっている。
【0196】即ち、例えば、いま、上述したような、注
目ブロックのDCTタイプとブロックタイプとのセット
が、注目データについてのミスマッチ情報として、判定
部22(のミスマッチ情報生成部115(図13))か
らクラス分類適応処理部32に供給されるものとする
と、タップ抽出部51は、ミスマッチ情報としての、注
目ブロックのDCTタイプとブロックタイプとのセット
を受信し、MPEGデコーダ116から供給される復号
画像データから、例えば、図17に示すようなタップ構
造設定テーブルにしたがったタップ構造の予測タップを
抽出する。
【0197】即ち、タップ抽出部51は、ミスマッチ情
報としてのDCTタイプとブロックタイプが、いずれも
フィールドDCTモードである場合、後述するフィール
ドタップのみからなるパターンAのタップ構造の予測タ
ップを構成する。また、タップ抽出部51は、ミスマッ
チ情報としてのDCTタイプとブロックタイプが、それ
ぞれフィールドDCTモードとフレームDCTモードで
ある場合、フィールドタップの数が、後述するフレーム
タップの数より多いパターンBのタップ構造の予測タッ
プを構成する。さらに、タップ抽出部51は、ミスマッ
チ情報としてのDCTタイプとブロックタイプが、それ
ぞれフレームDCTモードとフィールドDCTモードで
ある場合、フレームタップの数が、フィールドタップの
数より多いパターンCのタップ構造の予測タップを構成
する。また、タップ抽出部51は、ミスマッチ情報とし
てのDCTタイプとブロックタイプが、いずれもフレー
ムDCTモードである場合、フレームタップのみからな
るパターンDのタップ構造の予測タップを構成する。
【0198】ここで、図18は、パターンA乃至Dのタ
ップ構造を示している。なお、図18において、○印
が、復号画像データの画素を表している。また、斜線を
付してある○印は、フィールドタップとなっている画素
を表し、●印は、フレームタップとなっている画素を表
している。
【0199】図18Aは、パターンAのタップ構造を示
している。パターンAのタップ構造は、例えば、注目デ
ータに対応する復号画像データの画素(以下、適宜、注
目画素という)、注目画素の左右それぞれに隣接する2
画素、注目画素の上方向に1画素おいて隣接する画素、
その画素の左右それぞれに隣接する2画素、注目画素の
上方向に3画素おいて隣接する画素、その画素の左右そ
れぞれに隣接する2画素、注目画素の下方向に1画素お
いて隣接する画素、その画素の左右それぞれに隣接する
2画素、注目画素の下方向に3画素おいて隣接する画
素、その画素の左右それぞれに隣接する2画素の合計2
5画素で構成される。
【0200】ここで、フィールドタップとは、例えば、
その上下に隣接する2画素が、いずれもタップ(ここで
は、予測タップまたはクラスタップ)となっていない画
素を意味する。図18AのパターンAのタップ構造で
は、いずれのタップも、その上下に隣接する画素がタッ
プになっていないので、すべてフィールドタップであ
る。
【0201】図18Bは、パターンBのタップ構造を示
している。パターンBのタップ構造は、例えば、注目画
素、注目画素の左右それぞれに隣接する2画素、注目画
素の上方向に1画素おいて隣接する画素の左右それぞれ
に隣接する2画素、注目画素の上方向に3画素おいて隣
接する画素の左右それぞれに隣接する1画素、注目画素
の下方向に1画素おいて隣接する画素の左右それぞれに
隣接する2画素、注目画素の下方向に3画素おいて隣接
する画素の左右それぞれに隣接する1画素、注目画素の
上に隣接する4画素、注目画素の下に隣接する4画素の
合計25画素で構成される。
【0202】ここで、フレームタップとは、その上また
は下に隣接する画素のうちの少なくとも一方がタップと
なっている画素を意味する。図18BのパターンBのタ
ップ構造では、注目画素と、注目画素の上下それぞれに
隣接する4画素の合計9画素がフレームタップとなって
おり、残りの16画素がフィールドタップとなってい
る。
【0203】図18Cは、パターンCのタップ構造を示
している。パターンCのタップ構造は、例えば、注目画
素、注目画素の左右それぞれに隣接する2画素、注目画
素の上方向に1画素おいて隣接する画素の左右それぞれ
に隣接する2画素、注目画素の下方向に1画素おいて隣
接する画素の左右それぞれに隣接する2画素、注目画素
の上下それぞれに隣接する4画素、注目画素の上に隣接
する画素の左右それぞれに隣接する1画素、注目画素の
下に隣接する画素の左右それぞれに隣接する1画素の合
計25画素で構成される。
【0204】パターンCのタップ構造では、注目画素、
注目画素の上下それぞれに隣接する4画素、注目画素の
左に隣接する画素、その画素の上下それぞれに隣接する
2画素、注目画素の右に隣接する画素、その画素の上下
それぞれに隣接する2画素の合計19画素がフレームタ
ップとなっており、残りの6画素がフィールドタップに
なっている。
【0205】図18Dは、パターンDのタップ構造を示
している。パターンDのタップ構造は、例えば、注目画
素を中心として隣接する、横×縦が5×5画素の合計2
5画素で構成される。
【0206】パターンDのタップ構造では、いずれのタ
ップも、その上または下の少なくとも一方の画素がタッ
プとなっているので、すべてフレームタップである。
【0207】タップ抽出部51(図9)は、ミスマッチ
情報に基づき、注目データについて、図18に示したパ
ターンA乃至Dのうちのいずれかのタップ構造の予測タ
ップを構成する。
【0208】タップ抽出部52も、タップ抽出部51と
同様に、ミスマッチ情報に基づくタップ構造のクラスタ
ップを構成する。
【0209】なお、ここでは、ミスマッチ情報に基づい
て、予測タップとして抽出する復号画像データの画素の
位置を変更するだけで、予測タップを構成する画素数
は、25画素のまま変更しないようにしたが、タップ抽
出部51では、ミスマッチ情報に基づいて、予測タップ
を構成する復号画像データの画素の数を変更するように
することも可能である。
【0210】また、前処理部31のMPEGデコーダ1
16では、符号化データにおける量子化DCT係数が、
その符号化データに含まれる動きベクトルや、DCTタ
イプ、量子化ステップ、ピクチャタイプ、その他の復号
制御情報を用いて、画像に復号されるが、タップ抽出部
51では、このような復号制御情報も、予測タップに含
めることが可能である。さらに、この場合、ミスマッチ
情報に基づいて、予測タップとする復号制御情報を変更
することも可能である。さらに、タープ抽出部51で
は、符号化データに含まれる量子化DCT係数や、その
量子化DCT係数を逆量子化して得られるDCT係数
も、予測タップに含めるようにすることが可能である。
【0211】タップ抽出部52でも、タップ抽出部51
における場合と同様にして、クラスタップを構成するこ
とができる。
【0212】タップ抽出部51で得られた予測タップ
は、予測部54に供給され、タップ抽出部52で得られ
たクラスタップは、クラス分類部53に供給される。
【0213】クラス分類部53には、クラスタップの
他、注目データについてのミスマッチ情報も供給され、
クラス分類部53では、上述したように、クラスタップ
とミスマッチ情報に基づき、注目データがクラス分類さ
れる。
【0214】即ち、クラス分類部53は、例えば、注目
データについてのクラスタップに対して、例えば、ADRC
(Adaptive Dynamic Range Coding)処理等の圧縮処理を
施すことによりクラス分類を行い、クラスコードを求め
る。
【0215】ここで、ADRC処理を用いたクラス分類で
は、クラスタップを構成するデータ(ここでは、画素
値)が、ADRC処理され、例えば、その結果得られるADRC
コードが、クラスコードとされる。
【0216】なお、KビットADRCにおいては、例えば、
クラスタップを構成するデータの最大値MAXと最小値MIN
が検出され、DR=MAX-MINを、集合の局所的なダイナミッ
クレンジとし、このダイナミックレンジDRに基づいて、
クラスタップを構成するデータがKビットに再量子化さ
れる。即ち、クラスタップを構成する各データから、最
小値MINが減算され、その減算値がDR/2Kで除算(量子
化)される。そして、以上のようにして得られる、クラ
スタップを構成するKビットの各データを、所定の順番
で並べたビット列が、ADRCコードとして出力される。従
って、クラスタップが、例えば、1ビットADRC処理され
た場合には、そのクラスタップを構成する各データは、
最小値MINが減算された後に、最大値MAXと最小値MINと
の平均値で除算され(小数点以下切り捨て)、これによ
り、各データが1ビットとされる(2値化される)。そ
して、その1ビットのデータを所定の順番で並べたビッ
ト列が、ADRCコードとして出力される。
【0217】なお、クラス分類部53には、例えば、ク
ラスタップを構成するデータのレベル分布のパターン
を、そのままクラスコードとして出力させることも可能
である。しかしながら、この場合、クラスタップが、N
個のデータで構成され、各データに、Kビットが割り当
てられているとすると、クラス分類部24が出力するク
ラスコードの場合の数は、(2NK通りとなり、データ
のビット数Kに指数的に比例した膨大な数となる。
【0218】従って、クラス分類部53においては、ク
ラスタップの情報量を、上述のADRC処理や、あるいはベ
クトル量子化等によって圧縮することにより、クラス分
類を行うのが好ましい。
【0219】ここで、クラスタップを用いてクラス分類
を行うことにより得られるクラスコードを、以下、適
宜、クラスタップコードという。
【0220】クラス分類部53は、上述のようにしてク
ラスタップコードを求める他、注目データについてのミ
スマッチ情報としての、例えば、DCTタイプとブロッ
クタイプのセットを用いてクラス分類を行うことによ
り、2ビットのクラスコードを求める。
【0221】即ち、いま、ミスマッチ情報を用いたクラ
ス分類によって得られるクラスコードを、ミスマッチコ
ードというものとすると、クラス分類部53は、ミスマ
ッチ情報としてのDCTタイプとブロックタイプが、い
ずれもフィールドDCTモードを表している場合には、
2ビットのミスマッチコードを、例えば「00」とす
る。また、クラス分類部53は、DCTタイプとブロッ
クタイプが、それぞれフィールドDCTモードとフレー
ムDCTモードを表している場合には、2ビットのミス
マッチコードを、例えば「01」とする。さらに、クラ
ス分類部53は、DCTタイプとブロックタイプが、そ
れぞれフレームDCTモードとフィールドDCTモード
を表している場合には、2ビットのミスマッチコード
を、例えば「10」とする。また、クラス分類部53
は、DCTタイプとブロックタイプが、いずれもフレー
ムDCTモードを表している場合には、2ビットのミス
マッチコードを、例えば「11」とする。
【0222】その後、クラス分類部53は、例えば、注
目データについて得られたクラスタップコードの上位ビ
ットとして、注目データについて得られたミスマッチコ
ードを付加し、このクラスタップコードとミスマッチコ
ードとで構成されるコードを、注目データについての最
終的なクラスコードとして出力する。
【0223】なお、クラス分類部53では、その他、例
えば、DCTタイプ以外の復号制御情報にも基づいて、
クラス分類を行うようにすることが可能である。
【0224】クラス分類部53が出力するクラスコード
は、係数メモリ41に供給される。係数メモリ41で
は、そのクラスコードに対応するタップ係数が読み出さ
れ、予測部54に供給される。
【0225】予測部54は、タップ抽出部51が出力す
る予測タップと、係数メモリ41から取得したタップ係
数とを用いて、式(1)に示した線形予測演算を行う。
これにより、予測部54は、注目データ(の予測値)、
即ち、高画質画像データを求め、後処理部33に供給す
る。
【0226】後処理部33では、上述したように、クラ
ス分類適応処理部32(の予測部54)の出力、即ち、
高画質画像データが、そのまま出力される。
【0227】なお、上述の場合には、注目ブロックのD
CTタイプが正しいか、正しくないかを表す1ビットの
情報や、注目ブロックのDCTタイプとブロックタイプ
のセットを、ミスマッチ情報とするようにしたが、ミス
マッチ情報としては、その他、例えば、注目ブロックの
DCTタイプが、どの程度正しいかを表す評価値などを
採用することが可能である。
【0228】注目ブロックのDCTタイプの正しいの程
度を表す評価値としては、例えば、注目ブロックのDC
TタイプがフィールドDCTモードである場合には、注
目ブロック(注目マクロブロック)の動きベクトルの大
きさを採用し、注目ブロックのDCTタイプがフレーム
DCTモードである場合には、動きベクトルの最大の大
きさから、注目ブロックの動きベクトルの大きさを減算
して得られる減算値を採用することが可能である。この
場合、注目ブロックのDCTタイプがフィールドDCT
モードであるときには、注目ブロックの動きベクトルの
大きさが大きいほど、また、注目ブロックのDCTタイ
プがフレームDCTモードであるときには、注目ブロッ
クの動きベクトルの大きさが小さいほど、評価値が大き
くなる。
【0229】そして、この場合、タップ抽出部51や5
2では、例えば、ミスマッチ情報としての評価値を、1
つ以上の閾値と比較し、その比較結果に基づいて、予測
タップやクラスタップのタップ構造を変更するようにす
ることが可能である。また、クラス分類部53では、例
えば、ミスマッチ情報としての評価値を量子化し、その
量子化値を、ミスマッチコードとして用いることが可能
である。
【0230】さらに、上述の場合には、注目ブロックが
動きブロックか、または静止ブロックであるかを、注目
ブロックの動きベクトル、あるいは対応前ブロックまた
は対応後ブロックの動きベクトルや、静止ブロックもし
くは動きブロックの別に基づいて判定するようにした
が、注目ブロックが動きブロックまたは静止ブロックの
うちのいずれであるかの判定は、その他、例えば、注目
ブロックや、対応前ブロックまたは対応後ブロックの周
辺のブロックの動きベクトル等にも基づいて判定するよ
うにすることが可能である。
【0231】次に、図19は、図13の係数メモリ41
に記憶させるタップ係数を学習する場合の、図11の学
習装置の詳細構成例を示している。
【0232】図19の実施の形態では、学習用データ記
憶部11に、学習用データとして、高画質の画像データ
(学習用画像データ)が記憶されている。
【0233】図19の実施の形態において、符号化部1
2は、MPEGエンコーダ131で構成されており、M
PEGエンコーダ131は、学習用データ記憶部11か
ら学習用画像データを読み出して、MPEG2方式で符
号化し、その結果得られる符号化データを出力する。
【0234】即ち、図20は、図19のMPEGエンコ
ーダ131の構成例を示している。
【0235】学習用画像データは、動きベクトル検出部
141と演算部143に供給される。動きベクトル検出
部141は、学習用画像データを対象に、例えば、ブロ
ックマッチングを行うことにより、学習用画像データの
動きベクトルを検出し、動き補償部142に供給する。
【0236】また、演算部143は、必要に応じて、学
習用画像データ(原画像)から、動き補償部142から
供給される予測画像を減算し、その結果得られる残差画
像を、DCT変換部144に供給する。DCT変換部1
44は、演算部143からの残差画像をDCT変換し、
その結果得られるDCT係数を、量子化部145に供給
する。量子化部145は、DCT変換部144から供給
されるDCT係数を、所定の量子化ステップで量子化す
ることにより、量子化DCT係数を得て、VLC部14
6および逆量子化部147に供給する。
【0237】VLC部146は、量子化部145から供
給される量子化DCT係数をVLCコードに可変長符号
化し、さらに、必要な復号制御情報(例えば、動きベク
トル検出部141で検出された動きベクトルや、量子化
部145で用いられた量子化ステップなど)を多重化す
ることで、符号化データを得て出力する。
【0238】一方、逆量子化部147では、量子化部1
45が出力する量子化DCT係数が逆量子化され、DC
T係数が求められて、逆DCT変換部148に供給され
る。逆DCT変換部148は、逆量子化部147からの
DCT係数を、逆DCT変換することにより、残差画像
に復号し、演算部149に供給する。
【0239】演算部149には、逆DCT変換部148
から、残差画像が供給される他、動き補償部142か
ら、その残差画像を求めるのに演算部143で用いられ
たのと同一の予測画像が供給されるようになっており、
演算部149は、残差画像と予測画像とを加算すること
で、元の画像を復号(ローカルデコード)する。この復
号画像は、メモリ150に供給され、参照画像として記
憶される。
【0240】そして、動き補償部142では、メモリ1
50に記憶された参照画像が読み出され、動きベクトル
検出部141から供給される動きベクトルにしたがって
動き補償が施されることにより、予測画像が生成され
る。この予測画像は、動き補償部142から演算部14
3および149に供給される。
【0241】上述したように、演算部143では、動き
補償部142からの予測画像を用いて、残差画像が求め
られ、また、演算部149では、動き補償部142から
の予測画像を用いて、元の画像が復号される。
【0242】図19に戻り、MPEGデコーダ131が
出力する符号化データは、復号制御情報抽出部71に供
給される。
【0243】復号制御情報抽出部71は、逆VLC部1
32で構成されている。逆VLC部132は、図13の
逆VLC部111と同様の処理を行い、これにより、符
号化データから、複数の復号制御情報としてのDCTタ
イプ、ピクチャタイプ、マクロブロックタイプ、動きベ
クトルを抽出し、判定部72に供給する。
【0244】判定部72は、フィールド/フレーム判定
部133、イントラ/ノンイントラ判定部134、静動
判定部135、およびミスマッチ情報生成部136で構
成されている。そして、フィールド/フレーム判定部1
33、イントラ/ノンイントラ判定部134、静動判定
部135、またはミスマッチ情報生成部136では、復
号制御情報抽出部71から供給される複数の復号制御情
報としてのDCTタイプ、ピクチャタイプ、マクロブロ
ックタイプ、および動きベクトルを用いて、図13のフ
ィールド/フレーム判定部112、イントラ/ノンイン
トラ判定部113、静動判定部114、またはミスマッ
チ情報生成部115における場合とそれぞれ同様の処理
が行われ、これにより、適応学習部60において注目教
師データとされている教師データについてのミスマッチ
情報が生成される。このミスマッチ情報は、ミスマッチ
情報生成部136から適応学習部60に供給される。
【0245】図19の実施の形態では、逆後処理部61
Aは、学習用データ記憶部11から学習用画像データを
読み出し、そのまま、教師データとして、適応学習部6
0に出力する。適応学習部60(図11)では、教師デ
ータ記憶部62において、逆後処理部61Aからの教師
データが記憶される。
【0246】符号化部63Aは、MPEGエンコーダ1
37で構成され、MPEGエンコーダ137は、MPE
Gエンコーダ131と同様に、学習用データ記憶部11
から学習用画像データを読み出して、MPEG2方式で
符号化し、その結果得られる符号化データを、前処理部
63Bに出力する。
【0247】前処理部63Bは、図14のMPEGデコ
ーダ116と同様に構成されるMPEGデコーダ138
で構成され、MPEGデコーダ138は、MPEGエン
コーダ137からの符号化データを、MPEG2方式で
復号し、その結果得られる復号画像データを、生徒デー
タとして、適応学習部60に出力する。適応学習部60
(図11)では、生徒データ記憶部64において、MP
EGデコーダ138からの生徒データが記憶される。
【0248】そして、適応学習部60では、教師データ
および生徒データを用い、生徒データから抽出される予
測タップから、式(1)の線形予測演算を行うことによ
り得られる教師データの予測値の予測誤差を統計的に最
小にするタップ係数を求める学習が行われる。
【0249】即ち、適応学習部60(図11)では、タ
ップ抽出部65が、教師データ記憶部62に記憶された
教師データのうち、まだ、注目教師データとしていない
ものを、注目教師データとし、注目教師データについ
て、生徒データ記憶部64に記憶された生徒データから
予測タップを構成して、足し込み部68に供給する。さ
らに、タップ抽出部66が、注目教師データについて、
生徒データ記憶部64に記憶された生徒データからクラ
スタップを構成し、クラス分類部67に供給する。
【0250】ここで、タップ抽出部65および66に
は、ミスマッチ情報が供給されるようになっており、タ
ップ抽出部65または66それぞれは、ミスマッチ情報
に基づき、注目教師データについて、図13で説明した
クラス分類適応処理部32のタップ抽出部51または5
2(図9)が構成するのと同一のタップ構造の予測タッ
プまたはクラスタップを構成する。
【0251】従って、例えば、タップ抽出部51または
52において、図13で説明したように、符号化データ
に含まれる復号制御情報をも用いて、予測タップまたは
クラスタップがそれぞれ構成される場合には、図19の
学習装置でも、タップ抽出部65または66(図11)
において、復号制御情報をも用いて、予測タップまたは
クラスタップがそれぞれ構成される。
【0252】その後、クラス分類部67(図11)で
は、注目教師データについてのクラスタップとミスマッ
チ情報に基づき、注目教師データについて、図13で説
明したクラス分類部53における場合と同様のクラス分
類を行い、その結果得られるクラスに対応するクラスコ
ードを、足し込み部68に出力する。
【0253】足し込み部68は、教師データ記憶部62
から注目教師データを読み出し、その注目教師データ
と、タップ抽出部65からの予測タップを用い、式
(8)の行列Aとベクトルvのコンポーネントを計算す
る。さらに、足し込み部68は、既に得られている行列
Aとベクトルvのコンポーネントのうち、クラス分類部
67からのクラスコードに対応するものに対して、注目
教師データと予測タップから求められた行列Aとベクト
ルvのコンポーネントを足し込む。
【0254】以上の処理が、教師データ記憶部62に記
憶された教師データすべてを、注目教師データとして行
われると、足し込み部68は、いままでの処理によって
得られたクラスごとの行列Aおよびベクトルvのコンポ
ーネントで構成される式(8)の正規方程式を、タップ
係数算出部69に供給し、タップ係数算出部69は、そ
の各クラスごとの正規方程式を解くことにより、各クラ
スごとに、タップ係数を求めて出力する。
【0255】なお、図19の学習装置では、例えば、符
号化部63AのMPEGエンコーダ137において学習
用画像データをMPEG符号化する前に、その学習用画
像データの画素数を,1/Nに間引くようにすること
で、適応学習部60において、MPEG復号された画像
データを、高画質で、かつ画素数をN倍にする(解像度
を高くする)タップ係数を得ることができる。
【0256】次に、図21は、符号化データが画像デー
タをMPEG2方式で符号化したものである場合の、図
6の復号装置の第2の詳細構成例を示している。なお、
図中、図13における場合と対応する部分については、
同一の符号を付してあり、以下では、その説明は、適宜
省略する。
【0257】図21の実施の形態では、前処理部31
が、逆VLC部161、逆量子化部162、演算部16
3、MPEGデコーダ164、メモリ165、動き補償
部166、およびDCT変換部167で構成されてい
る。
【0258】前処理部31において、符号化データは、
逆VLC部161とMPEGデコーダ164に供給され
る。
【0259】逆VLC部161は、符号化データから、
量子化DCT係数のVLCコードを分離するとともに、
量子化ステップ、動きベクトル、その他の復号制御情報
を分離する。そして、逆VLC部161は、量子化DC
T係数のVLCコードを逆VLC処理することで、量子
化DCT係数に復号し、逆量子化部162に供給する。
さらに、逆VLC部161は、量子化ステップを、逆量
子化部162に、動きベクトルを、動き補償部166
に、それぞれ供給する。
【0260】逆量子化部162は、逆VLC部161か
ら供給される量子化DCT係数を、同じく逆VLC部1
61から供給される量子化ステップで逆量子化し、その
結果得られる8×8画素のブロックのDCT係数を、演
算部163に供給する。
【0261】一方、MPEGデコーダ164では、符号
化データが、MPEG方式で復号され、復号画像データ
が出力される。MPEGデコーダ164が出力する復号
画像のうち、参照画像とされ得るIピクチャとPピクチ
ャは、メモリ165に供給されて記憶される。
【0262】そして、動き補償部166は、メモリ16
5に記憶された復号画像を参照画像として読み出し、そ
の参照画像に対して、逆VLC部161から供給される
動きベクトルにしたがい、動き補償を施すことで、逆量
子化部162から演算部163に供給されたブロックの
予測画像を生成し、DCT変換部167に供給する。D
CT変換部167は、動き補償部166から供給される
予測画像をDCT変換し、その結果得られるDCT係数
を、演算部163に供給する。
【0263】演算部163は、逆量子化部162から供
給されるブロックの各DCT係数と、DCT変換部16
7から供給される、対応するDCT係数とを、必要に応
じて加算することで、そのブロックの画素値をDCT変
換したDCT係数を求める。
【0264】即ち、逆量子化部162から供給されるブ
ロックがイントラ符号化されているものである場合、逆
量子化部162から供給されるブロックのDCT係数
は、元の画素値をDCT変換したものとなっているか
ら、演算部163は、逆量子化部162から供給される
ブロックのDCT係数を、そのまま出力する。
【0265】また、逆量子化部162から供給されるブ
ロックがノンイントラ符号化されているものである場
合、逆量子化部162から供給されるブロックのDCT
係数は、元の画素値と予測画像との差分値(残差画像)
をDCT変換したものとなっているから、演算部163
は、逆量子化部162から供給されるブロックの各DC
T係数と、DCT変換部167から供給される、予測画
像をDCT変換して得られるDCT係数の対応するもの
とを加算することにより、元の画素値をDCT変換して
得られるDCT係数を求めて出力する。
【0266】演算部163が出力するブロックのDCT
係数は、前処理データとして、クラス分類適応処理部3
2に供給される。
【0267】図21の実施の形態では、クラス分類適応
処理部32において、前処理部31が出力するDCT係
数を対象に、クラス分類適応処理が行われ、これによ
り、高画質画像データ(の予測値)が、適応処理データ
として求められる。
【0268】即ち、クラス分類適応処理部32(図9)
では、前処理部31が出力するDCT係数が、タップ抽
出部51と52に供給される。
【0269】タップ抽出部51は、まだ、注目データと
していない高画質画像データの画素を注目データとし
て、その注目データを予測するのに用いる前処理データ
としてのDCT係数の幾つかを、予測タップとして抽出
する。タップ抽出部52も、注目データをクラス分類す
るのに用いる前処理データとしてのDCT係数の幾つか
を、クラスタップとして抽出する。
【0270】なお、タップ抽出部51または52は、注
目データについてのミスマッチ情報に基づいて、予測タ
ップまたはクラスタップのタップ構造を、それぞれ変更
する。
【0271】即ち、タップ抽出部51は、例えば、注目
データのブロック(注目ブロック)のDCT係数すべて
の他、注目ブロックの上下左右それぞれに隣接するブロ
ックにおける必要なDCT係数を、ミスマッチ情報に応
じて抽出して、予測タップを構成する。タップ抽出部5
1も、タップ抽出部51と同様にして、クラスタップを
構成する。
【0272】そして、タップ抽出部51で得られた予測
タップは、予測部54に供給され、タップ抽出部52で
得られたクラスタップは、クラス分類部53に供給され
る。
【0273】クラス分類部53では、クラスタップと、
注目データについてのミスマッチ情報に基づき、図13
で説明した場合と同様にして、注目データがクラス分類
され、注目データについてのクラスコードが、係数メモ
リ41に供給される。係数メモリ41では、注目データ
についてのクラスコードに対応するタップ係数が読み出
され、予測部54に供給される。
【0274】予測部54は、係数メモリ41から供給さ
れるタップ係数を取得し、そのタップ係数と、タップ抽
出部51が出力する予測タップとを用いて、式(1)に
示した線形予測演算を行う。これにより、予測部54
は、注目データ(の予測値)、即ち、高画質画像データ
を求め、後処理部33に供給する。
【0275】後処理部33では、クラス分類適応処理部
32からの高画質画像データが、そのまま出力される。
【0276】従って、図21の実施の形態では、クラス
分類適応処理部32において、DCT係数が高画質画像
データに変換される。
【0277】次に、図22は、図21の復号装置の係数
メモリ41に記憶させるタップ係数を学習する場合の、
図11の学習装置の詳細構成例を示している。なお、図
中、図19における場合と対応する部分については、同
一の符号を付してあり、以下では、その説明は、適宜省
略する。
【0278】図22の実施の形態では、前処理部63B
が、逆VLC部171、逆量子化部172、演算部17
3、MPEGデコーダ174、メモリ175、動き補償
部176、およびDCT変換部177で構成されてお
り、これらの逆VLC部171乃至DCT変換部177
は、図21の逆VLC部161乃至DCT変換部167
とそれぞれ同様に構成されている。
【0279】従って、前処理部63Bでは、符号化部6
3AのMPEGエンコーダ137が出力する符号化デー
タに対して、図21の前処理部31における場合と同様
の処理が施され、これにより得られるDCT係数が、生
徒データとして、適応学習部60に供給される。
【0280】適応学習部60(図11)では、生徒デー
タ記憶部64において、前処理部63Bから供給される
DCT係数が、生徒データとして記憶され、図19で説
明した場合と同様に、教師データおよび生徒データを用
い、生徒データから抽出される予測タップから、式
(1)の線形予測演算を行うことにより得られる教師デ
ータの予測値の予測誤差を統計的に最小にするタップ係
数を求める学習が行われ、これにより、生徒データとし
てのDCT係数を、高画質画像データに変換するクラス
ごとのタップ係数が求められる。
【0281】但し、図22の実施の形態において、適応
学習部60(図11)では、そのタップ抽出部65また
は66それぞれにおいて、図21のクラス分類適応処理
部32(図9)におけるタップ抽出部51または52が
構成するのと同一のタップ構造の予測タップまたはクラ
スタップが、ミスマッチ情報に基づいて構成される。さ
らに、図22の適応学習部60(図11)におけるクラ
ス分類部67でも、図21のクラス分類適応処理部32
(図9)におけるクラス分類部53と同様のクラス分類
が行われる。
【0282】次に、図23は、符号化データが画像デー
タをMPEG2方式で符号化したものである場合の、図
6の復号装置の第3の詳細構成例を示している。なお、
図中、図21における場合と対応する部分については、
同一の符号を付してあり、以下では、その説明は、適宜
省略する。
【0283】図23の復号装置は、後処理部33が、逆
DCT変換部181で構成されていることを除いて、図
21における場合と同様に構成されている。
【0284】図23の実施の形態では、クラス分類適応
処理部32において、前処理部31が出力するDCT係
数を対象に、クラス分類適応処理が行われ、これによ
り、逆DCT変換を行った場合に、高画質画像データを
得ることのできるDCT係数(以下、適宜、高画質DC
T係数という)(の予測値)が、適応処理データとして
求められる。
【0285】即ち、クラス分類適応処理部32(図9)
では、前処理部31が出力する前処理データとしてのD
CT係数が、タップ抽出部51と52に供給される。
【0286】タップ抽出部51は、まだ、注目データと
していない高画質DCT係数を注目データとして、その
注目データを予測するのに用いる前処理データとしての
DCT係数の幾つかを、予測タップとして抽出する。即
ち、タップ抽出部51は、ミスマッチ情報に基づき、注
目データについて、例えば、図21における場合と同様
のタップ構造の予測タップを構成する。タップ抽出部5
2も、ミスマッチ情報に基づき、注目データについて、
例えば、図21における場合と同様のタップ構造のクラ
スタップを構成する。
【0287】そして、タップ抽出部51で得られた予測
タップは、予測部54に供給され、タップ抽出部52で
得られたクラスタップは、クラス分類部53に供給され
る。
【0288】クラス分類部53では、クラスタップと、
注目データについてのミスマッチ情報に基づき、図21
における場合と同様にして、注目データがクラス分類さ
れ、注目データについてのクラスコードが、係数メモリ
41に供給される。係数メモリ41では、注目データに
ついてのクラスコードに対応するタップ係数が読み出さ
れ、予測部54に供給される。
【0289】予測部54は、係数メモリ41が出力する
タップ係数を取得し、そのタップ係数と、タップ抽出部
51が出力する予測タップとを用いて、式(1)に示し
た線形予測演算を行う。これにより、予測部54は、注
目データ(の予測値)、即ち、高画質DCT係数を求
め、後処理部33に供給する。
【0290】後処理部33では、逆DCT変換部181
において、クラス分類適応処理部32が出力する高画質
DCT係数が、ブロック単位で逆DCT変換され、これ
により、高画質画像データが求められて出力される。
【0291】次に、図24は、図23の復号装置の係数
メモリ41に記憶させるタップ係数を学習する場合の、
図11の学習装置の詳細構成例を示している。なお、図
中、図22における場合と対応する部分については、同
一の符号を付してあり、以下では、その説明は、適宜省
略する。
【0292】図24の学習装置は、逆後処理部61A
が、DCT変換部191で構成されていることを除い
て、図22における場合と同様に構成されている。
【0293】従って、逆後処理部61Aでは、DCT変
換部191において、学習用データ記憶部11から読み
出された学習用画像データとしての高画質画像データ
が、ブロック単位でDCT変換され、その結果得られる
DCT係数である高画質DCT係数が、教師データとし
て、適応学習部60に供給される。
【0294】適応学習部60(図11)では、教師デー
タ記憶部62において、逆後処理部61Aから供給され
る高画質DCT係数が、教師データとして記憶され、そ
の教師データと、生徒データ記憶部64に記憶された生
徒データとしてのDCT係数(このDCT係数は、画像
データをMPEG符号化した符号化データから得たも
の)とを用い、生徒データから抽出される予測タップか
ら、式(1)の線形予測演算を行うことにより得られる
教師データの予測値の予測誤差を統計的に最小にするタ
ップ係数を求める学習が行われ、これにより、生徒デー
タとしてのDCT係数を、高画質DCT係数に変換する
クラスごとのタップ係数が求められる。
【0295】即ち、いまの場合、生徒データされている
DCT係数は、前処理部63Bにおいて、符号化データ
から求められたものであり、量子化誤差を含んでいるた
め、そのDCT係数を逆DCT変換して得られる画像
は、いわゆるブロック歪み等を有する低画質のものとな
る。
【0296】そこで、適応学習部60では、上述のよう
に、式(1)の線形予測演算を行うことにより得られる
教師データ(学習用画像データをDCT変換して得られ
る高画質DCT係数)の予測値の予測誤差を統計的に最
小にするタップ係数を求める学習が行われることによ
り、生徒データされているDCT係数を、高画質DCT
係数に変換するクラスごとのタップ係数が求められる。
【0297】なお、図24の実施の形態において、適応
学習部60(図11)では、そのタップ抽出部65また
は66それぞれにおいて、図23のクラス分類適応処理
部32(図9)におけるタップ抽出部51または52が
構成するのと同一のタップ構造の予測タップまたはクラ
スタップが、ミスマッチ情報に基づいて構成される。さ
らに、図24の適応学習部60(図11)におけるクラ
ス分類部67でも、図23のクラス分類適応処理部32
(図9)におけるクラス分類部53と同様のクラス分類
が行われる。
【0298】以上のように、符号化データに含まれる復
号制御情報の正しさを判定し、その判定結果を表すミス
マッチ情報に基づいて、符号化データの復号、およびそ
の復号に用いるタップ係数の学習を行うようにしたの
で、学習においては、復号制御情報の正しさを考慮し
て、原画像に近い予測値を求めるためのタップ係数を求
めることができ、その結果、そのようなタップ係数を用
いて、符号化データの復号を行うことで、高画質の画像
を得ることが可能となる。
【0299】即ち、本実施の形態では、DCTタイプの
正しさを判定し、その判定結果を考慮して、タップ係数
の学習を行うようにしたので、MPEG2方式で復号す
れば、自然な動きになる部分については、その部分を、
原画像に近い予測値に復号するためのタップ係数を得る
ことができる他、MPEG2方式で復号すれば、不自然
な動きになる部分についても、その部分を、原画像に近
い予測値に復号するためのタップ係数を得ることができ
る。そして、そのようなタップ係数を用い、やはり、D
CTタイプの正しさを考慮して、符号化データの復号を
行うことにより、高画質の画像を得ることができる。
【0300】次に、上述した一連の処理は、ハードウェ
アにより行うこともできるし、ソフトウェアにより行う
こともできる。一連の処理をソフトウェアによって行う
場合には、そのソフトウェアを構成するプログラムが、
汎用のコンピュータ等にインストールされる。
【0301】そこで、図25は、上述した一連の処理を
実行するプログラムがインストールされるコンピュータ
の一実施の形態の構成例を示している。
【0302】プログラムは、コンピュータに内蔵されて
いる記録媒体としてのハードディスク405やROM4
03に予め記録しておくことができる。
【0303】あるいはまた、プログラムは、フレキシブ
ルディスク、CD-ROM(Compact DiscRead Only Memory),
MO(Magneto Optical)ディスク,DVD(Digital Versatile
Disc)、磁気ディスク、半導体メモリなどのリムーバブ
ル記録媒体411に、一時的あるいは永続的に格納(記
録)しておくことができる。このようなリムーバブル記
録媒体411は、いわゆるパッケージソフトウエアとし
て提供することができる。
【0304】なお、プログラムは、上述したようなリム
ーバブル記録媒体411からコンピュータにインストー
ルする他、ダウンロードサイトから、ディジタル衛星放
送用の人工衛星を介して、コンピュータに無線で転送し
たり、LAN(Local Area Network)、インターネットとい
ったネットワークを介して、コンピュータに有線で転送
し、コンピュータでは、そのようにして転送されてくる
プログラムを、通信部408で受信し、内蔵するハード
ディスク405にインストールすることができる。
【0305】コンピュータは、CPU(Central Processing
Unit)402を内蔵している。CPU402には、バス4
01を介して、入出力インタフェース410が接続され
ており、CPU402は、入出力インタフェース410を
介して、ユーザによって、キーボードや、マウス、マイ
ク等で構成される入力部407が操作等されることによ
り指令が入力されると、それにしたがって、ROM(Read O
nly Memory)403に格納されているプログラムを実行
する。あるいは、また、CPU402は、ハードディスク
405に格納されているプログラム、衛星若しくはネッ
トワークから転送され、通信部408で受信されてハー
ドディスク405にインストールされたプログラム、ま
たはドライブ409に装着されたリムーバブル記録媒体
411から読み出されてハードディスク405にインス
トールされたプログラムを、RAM(Random Access Memor
y)404にロードして実行する。これにより、CPU40
2は、上述したフローチャートにしたがった処理、ある
いは上述したブロック図の構成により行われる処理を行
う。そして、CPU402は、その処理結果を、必要に応
じて、例えば、入出力インタフェース410を介して、
LCD(Liquid CryStal Display)やスピーカ等で構成され
る出力部406から出力、あるいは、通信部408から
送信、さらには、ハードディスク405に記録等させ
る。
【0306】ここで、本明細書において、コンピュータ
に各種の処理を行わせるためのプログラムを記述する処
理ステップは、必ずしもフローチャートとして記載され
た順序に沿って時系列に処理する必要はなく、並列的あ
るいは個別に実行される処理(例えば、並列処理あるい
はオブジェクトによる処理)も含むものである。
【0307】また、プログラムは、1のコンピュータに
より処理されるものであっても良いし、複数のコンピュ
ータによって分散処理されるものであっても良い。さら
に、プログラムは、遠方のコンピュータに転送されて実
行されるものであっても良い。
【0308】なお、本実施の形態では、画像データをM
PEG2方式で符号化した場合について説明したが、本
発明は、MPEG2方式に限定されるものではなく、そ
の他の非可逆圧縮方式で符号化された画像を復号する場
合に適用可能である。
【0309】また、本実施の形態では、符号化データに
含まれる複数の復号制御情報のうちの1つであるDCT
タイプの正しさ(適切さ)を、その複数の復号制御情報
のうちの他の1つである動きベクトルに基づいて判定
し、その判定結果を表すミスマッチ情報に基づいて、符
号化データの復号およびタップ係数の学習を行うように
したが、その他、符号化データに含まれる複数の復号制
御情報のうちのDCTタイプ以外の正しさ(適切さ)
を、その複数の復号制御情報のうちの他の1以上に基づ
いて判定し、その判定結果を表すミスマッチ情報に基づ
いて、符号化データの復号およびタップ係数の学習を行
うようにすることが可能である。
【0310】
【発明の効果】本発明の復号装置および復号方法、並び
に第1のプログラムおよび第1の記録媒体によれば、符
号化データに含まれる第1の復号制御情報の正しさが、
その符号化データに含まれる第2の復号制御情報に基づ
いて判定され、その判定結果を表すミスマッチ情報が出
力される。そして、そのミスマッチ情報に基づいて、符
号化データが復号される。従って、符号化データを、高
画質の画像データに復号することが可能となる。
【0311】本発明の学習装置および学習方法、並びに
第2のプログラムおよび第2の記録媒体によれば、学習
用の画像データから、タップ係数の学習の教師となる教
師データが生成されるとともに、生徒となる生徒データ
が生成される。また、学習用の画像データが符号化さ
れ、複数の復号制御情報を含む学習用の符号化データが
出力される。そして、学習用の符号化データに含まれる
第1の復号制御情報の正しさが、その学習用の符号化デ
ータに含まれる第2の復号制御情報に基づいて判定さ
れ、その判定結果を表すミスマッチ情報が出力される。
さらに、そのミスマッチ情報に基づき、教師データと生
徒データを用いて、タップ係数の学習が行われる。従っ
て、そのタップ係数により、符号化データを、高画質の
画像データに復号することが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した復号装置の一実施の形態の構
成例を示すブロック図である。
【図2】復号装置の処理を説明するフローチャートであ
る。
【図3】本発明を適用した復号装置の他の一実施の形態
の構成例を示すブロック図である。
【図4】本発明を適用した学習装置の一実施の形態の構
成例を示すブロック図である。
【図5】学習装置の処理を説明するフローチャートであ
る。
【図6】本発明を適用した復号装置のより詳細な構成例
を示すブロック図である。
【図7】フレームDCTモードとフィールドDCTモー
ドを説明する図である。
【図8】動き物体が表示されたマクロブロックを、フレ
ームDCTモードとフィールドDCTモードで符号化し
た場合の復号画像を模式的に示す図である。
【図9】クラス分類適応処理部32の構成例を示すブロ
ック図である。
【図10】復号装置の処理を説明するフローチャートで
ある。
【図11】本発明を適用した学習装置のより詳細な構成
例を示すブロック図である。
【図12】学習装置の処理を説明するフローチャートで
ある。
【図13】MPEG方式で符号化された符号化データを
復号する復号装置の第1の構成例を示すブロック図であ
る。
【図14】MPEGデコーダ116の構成例を示すブロ
ック図である。
【図15】ミスマッチ情報生成部115の処理を説明す
るフローチャートである。
【図16】動き物体が表示されたマクロブロックを、フ
レームDCTモードとフィールドDCTモードで符号化
した場合の復号画像を模式的に示す図である。
【図17】タップ構造設定テーブルを示す図である。
【図18】パターンA乃至Dのタップ構造を示す図であ
る。
【図19】MPEG方式で符号化された符号化データを
復号するのに用いられるタップ係数を学習する学習装置
の第1の構成例を示すブロック図である。
【図20】MPEGエンコーダ131の構成例を示すブ
ロック図である。
【図21】MPEG方式で符号化された符号化データを
復号する復号装置の第2の構成例を示すブロック図であ
る。
【図22】MPEG方式で符号化された符号化データを
復号するのに用いられるタップ係数を学習する学習装置
の第2の構成例を示すブロック図である。
【図23】MPEG方式で符号化された符号化データを
復号する復号装置の第3の構成例を示すブロック図であ
る。
【図24】MPEG方式で符号化された符号化データを
復号するのに用いられるタップ係数を学習する学習装置
の第3の構成例を示すブロック図である。
【図25】本発明を適用したコンピュータの一実施の形
態の構成例を示すブロック図である。
【符号の説明】
1 ミスマッチ検出部, 2 復号処理部, 3 パラ
メータ記憶部, 11学習用データ記憶部, 12 符
号化部, 13 ミスマッチ検出部, 14学習処理
部, 21 復号制御情報抽出部, 22 判定部,
31 前処理部, 32 クラス分類適応処理部, 3
3 後処理部, 41 係数メモリ,51,52 タッ
プ抽出部, 53 クラス分類部, 54 予測部,
60適応学習部, 61 教師データ生成部, 61A
逆後処理部, 62 教師データ記憶部, 63 生
徒データ生成部, 63A 符号化部, 63B前処理
部, 64 生徒データ記憶部, 65,66 タップ
抽出部, 67クラス分類部, 68 足し込み部,
69 タップ係数算出部, 71 復号制御情報抽出
部, 72 判定部, 111 逆VLC部, 112
フィールド/フレーム判定部, 113 イントラ/
ノンイントラ判定部, 114 静動判定部, 115
ミスマッチ情報生成部, 116 MPEGデコー
ダ,121 逆VLC部, 122 逆量子化部, 1
23 逆DCT変換部, 124 演算部, 125
動き補償部, 126 メモリ, 127 ピクチャ選
択部, 131 MPEGエンコーダ, 132 逆V
LC部, 133 フィールド/フレーム判定部, 1
34 イントラ/ノンイントラ判定部, 135 静動
判定部, 136 ミスマッチ情報生成部, 137
MPEGエンコーダ, 138 MPEGデコーダ,
141 動きベクトル検出部, 142動き補償部,
143 演算部, 144 DCT変換部, 145
量子化部, 146 VLC部, 147 逆量子化
部, 148 逆DCT変換部,149 演算部, 1
50 メモリ, 161 逆VLC部, 162 逆量
子化部, 163 演算部, 164 MPEGデコー
ダ, 165 メモリ,166 動き補償部, 167
DCT変換部, 171 逆VLC部, 172 逆
量子化部, 173 演算部, 174 MPEGデコ
ーダ, 175メモリ, 176 動き補償部, 17
7 DCT変換部, 181 逆DCT変換部, 19
1 DCT変換部, 401 バス, 402 CP
U, 403 ROM, 404 RAM, 405 ハード
ディスク, 406 出力部,407 入力部, 40
8 通信部, 409 ドライブ, 410 入出力イ
ンタフェース, 411 リムーバブル記録媒体
───────────────────────────────────────────────────── フロントページの続き (72)発明者 西片 丈晴 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 大塚 秀樹 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 國弘 威 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 森藤 孝文 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5C059 MA00 MA03 MA05 MA23 NN01 SS20 TA32 TB04 TC12 TD13 UA02 UA05 UA38 UA39 5J064 AA01 BA16 BB01 BB03 BB08 BC01 BC26 BD01

Claims (60)

    【特許請求の範囲】
  1. 【請求項1】 画像データを符号化した符号化データで
    あって、少なくとも、前記符号化データの復号を制御す
    るための複数の復号制御情報を含む符号化データを復号
    する復号装置において、 前記符号化データに含まれる第1の復号制御情報の正し
    さを、その符号化データに含まれる第2の復号制御情報
    に基づいて判定し、その判定結果を表すミスマッチ情報
    を出力する判定手段と、 前記ミスマッチ情報に基づいて、前記符号化データを復
    号する復号手段とを備えることを特徴とする復号装置。
  2. 【請求項2】 前記符号化データは、前記画像データか
    ら動きベクトルを検出し、その動きベクトルを用いて動
    き補償を行うことにより予測画像を生成し、前記画像デ
    ータと予測画像との差分を、所定のブロック単位で、フ
    ィールドDCT(Discrete Cosine Transform)モードま
    たはフレームDCTモードによりDCT変換するノンイ
    ントラ符号化を行うことにより得られるDCT係数を含
    み、 前記第1の復号制御情報は、前記画像データをDCT変
    換したときのフィールドDCTモードまたはフレームD
    CTモードを表すDCTタイプであり、 前記第2の復号制御情報は、前記画像データの動きベク
    トルであることを特徴とする請求項1に記載の復号装
    置。
  3. 【請求項3】 前記判定手段は、 前記動きベクトルに基づいて、前記ブロック単位の画像
    データの動きの有無を判定し、 前記ブロック単位の画像データに動きがある場合におい
    て、そのブロックについてのDCTタイプがフレームD
    CTモードであるとき、そのDCTタイプが正しくない
    と判定することを特徴とする請求項2に記載の復号装
    置。
  4. 【請求項4】 前記符号化データは、前記ブロック単位
    の画像データを対象に、ノンイントラ符号化、または前
    記予測画像を用いない符号化であるイントラ符号化を行
    うことにより得られたものであり、 前記判定手段は、 イントラ符号化されたブロックについては、そのブロッ
    クのフレームの前または後のフレームのブロックにおけ
    る前記動きベクトルに基づいて、画像データの動きの有
    無を判定し、 ノンイントラ符号化されたブロックについては、そのブ
    ロックにおける前記動きベクトルに基づいて、画像デー
    タの動きの有無を判定することを特徴とする請求項3に
    記載の復号装置。
  5. 【請求項5】 前記復号手段は、 前記符号化データを復号した復号データのうちの、注目
    している注目復号データについて、その注目復号データ
    を、複数のクラスのうちのいずれかのクラスにクラス分
    類するのに用いるクラスタップを、前記符号化データか
    ら抽出するクラスタップ抽出手段と、 前記クラスタップに基づいて、前記注目復号データをク
    ラス分類し、対応するクラスのクラスコードを出力する
    クラス分類手段と、 前記クラスごとの所定のタップ係数から、前記クラスコ
    ードに対応するタップ係数を取得するタップ係数取得手
    段と、 前記注目復号データについて、前記タップ係数との所定
    の予測演算に用いる予測タップを、前記符号化データか
    ら抽出する予測タップ抽出手段と、 前記予測タップ抽出手段が出力する予測タップと、前記
    タップ係数取得手段において得られたタップ係数とを用
    いて予測演算を行うことにより、前記注目復号データを
    求める予測演算手段とを有することを特徴とする請求項
    1に記載の復号装置。
  6. 【請求項6】 前記クラスタップ抽出手段は、前記ミス
    マッチ情報に基づき、前記符号化データから、クラスタ
    ップを抽出することを特徴とする請求項5に記載の復号
    装置。
  7. 【請求項7】 前記クラス分類手段は、前記ミスマッチ
    情報にも基づいて、 前記注目復号データをクラス分類することを特徴とする
    請求項5に記載の復号装置。
  8. 【請求項8】 前記予測タップ抽出手段は、前記ミスマ
    ッチ情報に基づき、前記符号化データから、予測タップ
    を抽出することを特徴とする請求項5に記載の復号装
    置。
  9. 【請求項9】 前記符号化データは、画像データを、M
    PEG(Moving Picture Experts Group)方式によって符
    号化することにより得られたものであることを特徴とす
    る請求項1に記載の復号装置。
  10. 【請求項10】 前記復号手段は、 前記符号化データを、MPEG方式にしたがって復号
    し、MPEG復号データを出力するMPEG復号手段
    と、 前記MPEG復号データを高品質化した高品質化データ
    のうちの、注目している注目高品質化データについて、
    その注目高品質化データを、複数のクラスのうちのいず
    れかのクラスにクラス分類するのに用いるクラスタップ
    を、前記MPEG復号データから抽出するクラスタップ
    抽出手段と、 前記クラスタップに基づいて、前記注目高品質化データ
    をクラス分類し、対応するクラスのクラスコードを出力
    するクラス分類手段と、 前記クラスごとの所定のタップ係数から、前記クラスコ
    ードに対応するタップ係数を取得するタップ係数取得手
    段と、 前記注目高品質化データについて、前記タップ係数との
    所定の予測演算に用いる予測タップを、前記MPEG復
    号データから抽出する予測タップ抽出手段と、 前記予測タップ抽出手段が出力する予測タップと、前記
    タップ係数取得手段において得られたタップ係数とを用
    いて予測演算を行うことにより、前記注目高品質化デー
    タを求める予測演算手段とを有することを特徴とする請
    求項9に記載の復号装置。
  11. 【請求項11】 前記クラスタップ抽出手段は、前記ミ
    スマッチ情報に基づき、前記MPEG復号データから、
    クラスタップを抽出することを特徴とする請求項10に
    記載の復号装置。
  12. 【請求項12】 前記クラス分類手段は、前記ミスマッ
    チ情報にも基づいて、前記注目復号データをクラス分類
    することを特徴とする請求項10に記載の復号装置。
  13. 【請求項13】 前記予測タップ抽出手段は、前記ミス
    マッチ情報に基づき、前記MPEG復号データから、予
    測タップを抽出することを特徴とする請求項10に記載
    の復号装置。
  14. 【請求項14】 前記クラスタップ抽出手段は、前記符
    号化データからも、前記クラスタップを抽出することを
    特徴とする請求項10に記載の復号装置。
  15. 【請求項15】 前記予測タップ抽出手段は、前記符号
    化データからも、前記予測タップを抽出することを特徴
    とする請求項10に記載の復号装置。
  16. 【請求項16】 前記復号手段は、 前記符号化データから、画像データをDCT(Discrete
    Cosine Transform)変換したDCT係数を取得するD
    CT係数取得手段と、 前記符号化データをMPEG復号したMPEG復号デー
    タを高品質化した高品質化データのうちの、注目してい
    る注目高品質化データについて、その注目高品質化デー
    タを、複数のクラスのうちのいずれかのクラスにクラス
    分類するのに用いるクラスタップを、前記DCT係数か
    ら抽出するクラスタップ抽出手段と、 前記クラスタップに基づいて、前記注目高品質化データ
    をクラス分類し、対応するクラスのクラスコードを出力
    するクラス分類手段と、 前記クラスごとの所定のタップ係数から、前記クラスコ
    ードに対応するタップ係数を取得するタップ係数取得手
    段と、 前記注目高品質化データについて、前記タップ係数との
    所定の予測演算に用いる予測タップを、前記DCT係数
    から抽出する予測タップ抽出手段と、 前記予測タップ抽出手段が出力する予測タップと、前記
    タップ係数取得手段において得られたタップ係数とを用
    いて予測演算を行うことにより、前記注目高品質化デー
    タを求める予測演算手段とを有することを特徴とする請
    求項9に記載の復号装置。
  17. 【請求項17】 前記クラスタップ抽出手段は、前記ミ
    スマッチ情報に基づき、前記DCT係数から、クラスタ
    ップを抽出することを特徴とする請求項16に記載の復
    号装置。
  18. 【請求項18】 前記クラス分類手段は、前記ミスマッ
    チ情報にも基づいて、前記注目高品質化データをクラス
    分類することを特徴とする請求項16に記載の復号装
    置。
  19. 【請求項19】 前記予測タップ抽出手段は、前記ミス
    マッチ情報に基づき、前記DCT係数から、予測タップ
    を抽出することを特徴とする請求項16に記載の復号装
    置。
  20. 【請求項20】 前記クラスタップ抽出手段は、前記符
    号化データからも、前記クラスタップを抽出することを
    特徴とする請求項16に記載の復号装置。
  21. 【請求項21】 前記予測タップ抽出手段は、前記符号
    化データからも、前記予測タップを抽出することを特徴
    とする請求項16に記載の復号装置。
  22. 【請求項22】 前記復号手段は、 前記符号化データから、画像データをDCT(Discrete
    Cosine Transform)変換したDCT係数を取得するD
    CT係数取得手段と、 高品質の復号画像を求めるためのDCT係数である高品
    質化DCT係数のうちの、注目している注目高品質化D
    CT係数について、その注目高品質化DCT係数を、複
    数のクラスのうちのいずれかのクラスにクラス分類する
    のに用いるクラスタップを、前記DCT係数取得手段に
    おいて得られたDCT係数から抽出するクラスタップ抽
    出手段と、 前記クラスタップに基づいて、前記注目高品質化DCT
    係数をクラス分類し、対応するクラスのクラスコードを
    出力するクラス分類手段と、 前記クラスごとの所定のタップ係数から、前記クラスコ
    ードに対応するタップ係数を取得するタップ係数取得手
    段と、 前記注目高品質化DCT係数について、前記タップ係数
    との所定の予測演算に用いる予測タップを、前記DCT
    係数取得手段において得られたDCT係数から抽出する
    予測タップ抽出手段と、 前記予測タップ抽出手段が出力する予測タップと、前記
    タップ係数取得手段において得られたタップ係数とを用
    いて予測演算を行うことにより、前記注目高品質化DC
    T係数を求める予測演算手段と、 前記高品質化DCT係数を逆DCT変換し、高品質の復
    号画像を求める逆DCT変換手段とを有することを特徴
    とする請求項9に記載の復号装置。
  23. 【請求項23】 前記クラスタップ抽出手段は、前記ミ
    スマッチ情報に基づき、前記DCT係数から、クラスタ
    ップを抽出することを特徴とする請求項22に記載の復
    号装置。
  24. 【請求項24】 前記クラス分類手段は、前記ミスマッ
    チ情報にも基づいて、前記注目高品質化DCT係数をク
    ラス分類することを特徴とする請求項22に記載の復号
    装置。
  25. 【請求項25】 前記予測タップ抽出手段は、前記ミス
    マッチ情報に基づき、前記DCT係数から、予測タップ
    を抽出することを特徴とする請求項22に記載の復号装
    置。
  26. 【請求項26】 前記クラスタップ抽出手段は、前記符
    号化データからも、前記クラスタップを抽出することを
    特徴とする請求項22に記載の復号装置。
  27. 【請求項27】 前記予測タップ抽出手段は、前記符号
    化データからも、前記予測タップを抽出することを特徴
    とする請求項22に記載の復号装置。
  28. 【請求項28】 画像データを符号化した符号化データ
    であって、少なくとも、前記符号化データの復号を制御
    するための複数の復号制御情報を含む符号化データを復
    号する復号方法において、 前記符号化データに含まれる第1の復号制御情報の正し
    さを、その符号化データに含まれる第2の復号制御情報
    に基づいて判定し、その判定結果を表すミスマッチ情報
    を出力する判定ステップと、 前記ミスマッチ情報に基づいて、前記符号化データを復
    号する復号ステップとを備えることを特徴とする復号方
    法。
  29. 【請求項29】 画像データを符号化した符号化データ
    であって、少なくとも、前記符号化データの復号を制御
    するための複数の復号制御情報を含む符号化データを復
    号する復号処理を、コンピュータに行わせるプログラム
    において、 前記符号化データに含まれる第1の復号制御情報の正し
    さを、その符号化データに含まれる第2の復号制御情報
    に基づいて判定し、その判定結果を表すミスマッチ情報
    を出力する判定ステップと、 前記ミスマッチ情報に基づいて、前記符号化データを復
    号する復号ステップとを備えることを特徴とするプログ
    ラム。
  30. 【請求項30】 画像データを符号化した符号化データ
    であって、少なくとも、前記符号化データの復号を制御
    するための複数の復号制御情報を含む符号化データを復
    号する復号処理を、コンピュータに行わせるプログラム
    が記録されている記録媒体において、 前記符号化データに含まれる第1の復号制御情報の正し
    さを、その符号化データに含まれる第2の復号制御情報
    に基づいて判定し、その判定結果を表すミスマッチ情報
    を出力する判定ステップと、 前記ミスマッチ情報に基づいて、前記符号化データを復
    号する復号ステップとを備えるプログラムが記録されて
    いることを特徴とする記録媒体。
  31. 【請求項31】 画像データを符号化した符号化データ
    であって、少なくとも、前記符号化データの復号を制御
    するための複数の復号制御情報を含む符号化データを復
    号するのに用いられるタップ係数を学習する学習装置に
    おいて、 学習用の画像データから、前記タップ係数の学習の教師
    となる教師データを生成して出力する教師データ生成手
    段と、 前記学習用の画像データから、前記タップ係数の学習の
    生徒となる生徒データを生成して出力する生徒データ生
    成手段と、 前記学習用の画像データを符号化し、前記複数の復号制
    御情報を含む学習用の符号化データを出力する符号化手
    段と、 前記学習用の符号化データに含まれる第1の復号制御情
    報の正しさを、その学習用の符号化データに含まれる第
    2の復号制御情報に基づいて判定し、その判定結果を表
    すミスマッチ情報を出力する判定手段と、 前記ミスマッチ情報に基づき、前記教師データと生徒デ
    ータを用いて、前記タップ係数を学習する学習手段とを
    備えることを特徴とする学習装置。
  32. 【請求項32】 前記符号化データは、前記画像データ
    から動きベクトルを検出し、その動きベクトルを用いて
    動き補償を行うことにより予測画像を生成し、前記画像
    データと予測画像との差分を、所定のブロック単位で、
    フィールドDCT(Discrete Cosine Transform)モード
    またはフレームDCTモードによりDCT変換するノン
    イントラ符号化を行うことにより得られるDCT係数を
    含み、 前記第1の復号制御情報は、前記画像データをDCT変
    換したときのフィールドDCTモードまたはフレームD
    CTモードを表すDCTタイプであり、 前記第2の復号制御情報は、前記画像データの動きベク
    トルであることを特徴とする請求項31に記載の学習装
    置。
  33. 【請求項33】 前記判定手段は、 前記動きベクトルに基づいて、前記ブロック単位の画像
    データの動きの有無を判定し、 前記ブロック単位の画像データに動きがある場合におい
    て、そのブロックについてのDCTタイプがフレームD
    CTモードであるとき、そのDCTタイプが正しくない
    と判定することを特徴とする請求項32に記載の学習装
    置。
  34. 【請求項34】 前記符号化データは、前記ブロック単
    位の画像データを対象に、ノンイントラ符号化、または
    前記予測画像を用いない符号化であるイントラ符号化を
    行うことにより得られたものであり、 前記判定手段は、 イントラ符号化されたブロックについては、そのブロッ
    クのフレームの前または後のフレームのブロックにおけ
    る前記動きベクトルに基づいて、画像データの動きの有
    無を判定し、 ノンイントラ符号化されたブロックについては、そのブ
    ロックにおける前記動きベクトルに基づいて、画像デー
    タの動きの有無を判定することを特徴とする請求項33
    に記載の学習装置。
  35. 【請求項35】 前記学習手段は、 注目している前記教師データである注目教師データにつ
    いて、その注目教師データを、複数のクラスのうちのい
    ずれかのクラスにクラス分類するのに用いるクラスタッ
    プを、前記生徒データから抽出するクラスタップ抽出手
    段と、 前記クラスタップに基づいて、前記注目教師データをク
    ラス分類し、対応するクラスのクラスコードを出力する
    クラス分類手段と、 前記注目教師データについて、前記タップ係数との所定
    の予測演算に用いる予測タップを、前記生徒データから
    抽出する予測タップ抽出手段と、 前記予測タップとタップ係数とを用いて予測演算を行う
    ことにより得られる前記教師データの予測値の予測誤差
    が統計的に最小になる前記タップ係数を、前記クラスご
    とに求めるタップ係数演算手段とを有することを特徴と
    する請求項31に記載の学習装置。
  36. 【請求項36】 前記クラスタップ抽出手段は、前記ミ
    スマッチ情報に基づき、前記生徒データから、クラスタ
    ップを抽出することを特徴とする請求項35に記載の学
    習装置。
  37. 【請求項37】 前記クラス分類手段は、前記ミスマッ
    チ情報にも基づいて、前記注目教師データをクラス分類
    することを特徴とする請求項35に記載の学習装置。
  38. 【請求項38】 前記予測タップ抽出手段は、前記ミス
    マッチ情報に基づき、前記生徒データから、予測タップ
    を抽出することを特徴とする請求項35に記載の学習装
    置。
  39. 【請求項39】 前記符号化手段は、学習用の画像デー
    タを、MPEG(Moving Picture Experts Group)方式に
    よって符号化して、前記学習用の符号化データを出力す
    ることを特徴とする請求項31に記載の学習装置。
  40. 【請求項40】 前記教師データ生成手段は、前記学習
    用の画像データを、そのまま、前記教師データとして出
    力し、 前記生徒データ生成手段は、前記学習用の画像データ
    を、MPEG方式によって符号化し、さらにMPEG方
    式によって復号して、その復号結果を、前記生徒データ
    として出力し、 前記学習手段は、 注目している前記教師データである注目教師データにつ
    いて、その注目教師データを、複数のクラスのうちのい
    ずれかのクラスにクラス分類するのに用いるクラスタッ
    プを、前記生徒データから抽出するクラスタップ抽出手
    段と、 前記クラスタップに基づいて、前記注目教師データをク
    ラス分類し、対応するクラスのクラスコードを出力する
    クラス分類手段と、 前記注目教師データについて、前記タップ係数との所定
    の予測演算に用いる予測タップを、前記生徒データから
    抽出する予測タップ抽出手段と、 前記予測タップとタップ係数とを用いて予測演算を行う
    ことにより得られる前記教師データの予測値の予測誤差
    が統計的に最小になる前記タップ係数を、前記クラスご
    とに求めるタップ係数演算手段とを有することを特徴と
    する請求項39に記載の学習装置。
  41. 【請求項41】 前記クラスタップ抽出手段は、前記ミ
    スマッチ情報に基づき、前記生徒データから、クラスタ
    ップを抽出することを特徴とする請求項40に記載の学
    習装置。
  42. 【請求項42】 前記クラス分類手段は、前記ミスマッ
    チ情報にも基づいて、前記注目教師データをクラス分類
    することを特徴とする請求項40に記載の学習装置。
  43. 【請求項43】 前記予測タップ抽出手段は、前記ミス
    マッチ情報に基づき、前記生徒データから、予測タップ
    を抽出することを特徴とする請求項40に記載の学習装
    置。
  44. 【請求項44】 前記クラスタップ抽出手段は、前記生
    徒データ生成手段が前記学習用の画像データをMPEG
    方式によって符号化することにより得られる符号化デー
    タからも、前記クラスタップを抽出することを特徴とす
    る請求項40に記載の学習装置。
  45. 【請求項45】 前記予測タップ抽出手段は、前記生徒
    データ生成手段が前記学習用の画像データをMPEG方
    式によって符号化することにより得られる符号化データ
    からも、前記予測タップを抽出することを特徴とする請
    求項40に記載の学習装置。
  46. 【請求項46】 前記教師データ生成手段は、前記学習
    用の画像データを、そのまま、前記教師データとして出
    力し、 前記生徒データ生成手段は、前記学習用の画像データ
    を、MPEG方式によって符号化して復号し、その結果
    得られるDCT係数を、前記生徒データとして出力し、 前記学習手段は、 注目している前記教師データである注目教師データにつ
    いて、その注目教師データを、複数のクラスのうちのい
    ずれかのクラスにクラス分類するのに用いるクラスタッ
    プを、前記生徒データから抽出するクラスタップ抽出手
    段と、 前記クラスタップに基づいて、前記注目教師データをク
    ラス分類し、対応するクラスのクラスコードを出力する
    クラス分類手段と、 前記注目教師データについて、前記タップ係数との所定
    の予測演算に用いる予測タップを、前記生徒データから
    抽出する予測タップ抽出手段と、 前記予測タップとタップ係数とを用いて予測演算を行う
    ことにより得られる前記教師データの予測値の予測誤差
    が統計的に最小になる前記タップ係数を、前記クラスご
    とに求めるタップ係数演算手段とを有することを特徴と
    する請求項39に記載の学習装置。
  47. 【請求項47】 前記クラスタップ抽出手段は、前記ミ
    スマッチ情報に基づき、前記生徒データから、クラスタ
    ップを抽出することを特徴とする請求項46に記載の学
    習装置。
  48. 【請求項48】 前記クラス分類手段は、前記ミスマッ
    チ情報にも基づいて、前記注目教師データをクラス分類
    することを特徴とする請求項46に記載の学習装置。
  49. 【請求項49】 前記予測タップ抽出手段は、前記ミス
    マッチ情報に基づき、前記生徒データから、予測タップ
    を抽出することを特徴とする請求項46に記載の学習装
    置。
  50. 【請求項50】 前記クラスタップ抽出手段は、前記生
    徒データ生成手段が前記学習用の画像データをMPEG
    方式によって符号化することにより得られる符号化デー
    タからも、前記クラスタップを抽出することを特徴とす
    る請求項46に記載の学習装置。
  51. 【請求項51】 前記予測タップ抽出手段は、前記生徒
    データ生成手段が前記学習用の画像データをMPEG方
    式によって符号化することにより得られる符号化データ
    からも、前記予測タップを抽出することを特徴とする請
    求項46に記載の学習装置。
  52. 【請求項52】 前記教師データ生成手段は、前記学習
    用の画像データをDCT(Discrete Cosine Transfor
    m)変換し、その結果得られるDCT係数を、前記教師
    データとして出力し、 前記生徒データ生成手段は、前記学習用の画像データ
    を、MPEG方式によって符号化して復号し、その結果
    得られるDCT係数を、前記生徒データとして出力し、 前記学習手段は、 注目している前記教師データである注目教師データにつ
    いて、その注目教師データを、複数のクラスのうちのい
    ずれかのクラスにクラス分類するのに用いるクラスタッ
    プを、前記生徒データから抽出するクラスタップ抽出手
    段と、 前記クラスタップに基づいて、前記注目教師データをク
    ラス分類し、対応するクラスのクラスコードを出力する
    クラス分類手段と、 前記注目教師データについて、前記タップ係数との所定
    の予測演算に用いる予測タップを、前記生徒データから
    抽出する予測タップ抽出手段と、 前記予測タップとタップ係数とを用いて予測演算を行う
    ことにより得られる前記教師データの予測値の予測誤差
    が統計的に最小になる前記タップ係数を、前記クラスご
    とに求めるタップ係数演算手段とを有することを特徴と
    する請求項39に記載の学習装置。
  53. 【請求項53】 前記クラスタップ抽出手段は、前記ミ
    スマッチ情報に基づき、前記生徒データから、クラスタ
    ップを抽出することを特徴とする請求項52に記載の学
    習装置。
  54. 【請求項54】 前記クラス分類手段は、前記ミスマッ
    チ情報にも基づいて、前記注目教師データをクラス分類
    することを特徴とする請求項52に記載の学習装置。
  55. 【請求項55】 前記予測タップ抽出手段は、前記ミス
    マッチ情報に基づき、前記生徒データから、予測タップ
    を抽出することを特徴とする請求項52に記載の学習装
    置。
  56. 【請求項56】 前記クラスタップ抽出手段は、前記生
    徒データ生成手段が前記学習用の画像データをMPEG
    方式によって符号化することにより得られる符号化デー
    タからも、前記クラスタップを抽出することを特徴とす
    る請求項52に記載の学習装置。
  57. 【請求項57】 前記予測タップ抽出手段は、前記生徒
    データ生成手段が前記学習用の画像データをMPEG方
    式によって符号化することにより得られる符号化データ
    からも、前記予測タップを抽出することを特徴とする請
    求項52に記載の学習装置。
  58. 【請求項58】 画像データを符号化した符号化データ
    であって、少なくとも、前記符号化データの復号を制御
    するための複数の復号制御情報を含む符号化データを復
    号するのに用いられるタップ係数を学習する学習方法に
    おいて、 学習用の画像データから、前記タップ係数の学習の教師
    となる教師データを生成して出力する教師データ生成ス
    テップと、 前記学習用の画像データから、前記タップ係数の学習の
    生徒となる生徒データを生成して出力する生徒データ生
    成ステップと、 前記学習用の画像データを符号化し、前記複数の復号制
    御情報を含む学習用の符号化データを出力する符号化ス
    テップと、 前記学習用の符号化データに含まれる第1の復号制御情
    報の正しさを、その学習用の符号化データに含まれる第
    2の復号制御情報に基づいて判定し、その判定結果を表
    すミスマッチ情報を出力する判定ステップと、 前記ミスマッチ情報に基づき、前記教師データと生徒デ
    ータを用いて、前記タップ係数を学習する学習ステップ
    とを備えることを特徴とする学習方法。
  59. 【請求項59】 画像データを符号化した符号化データ
    であって、少なくとも、前記符号化データの復号を制御
    するための複数の復号制御情報を含む符号化データを復
    号するのに用いられるタップ係数を学習する学習処理
    を、コンピュータに行わせるプログラムにおいて、 学習用の画像データから、前記タップ係数の学習の教師
    となる教師データを生成して出力する教師データ生成ス
    テップと、 前記学習用の画像データから、前記タップ係数の学習の
    生徒となる生徒データを生成して出力する生徒データ生
    成ステップと、 前記学習用の画像データを符号化し、前記複数の復号制
    御情報を含む学習用の符号化データを出力する符号化ス
    テップと、 前記学習用の符号化データに含まれる第1の復号制御情
    報の正しさを、その学習用の符号化データに含まれる第
    2の復号制御情報に基づいて判定し、その判定結果を表
    すミスマッチ情報を出力する判定ステップと、 前記ミスマッチ情報に基づき、前記教師データと生徒デ
    ータを用いて、前記タップ係数を学習する学習ステップ
    とを備えることを特徴とするプログラム。
  60. 【請求項60】 画像データを符号化した符号化データ
    であって、少なくとも、前記符号化データの復号を制御
    するための複数の復号制御情報を含む符号化データを復
    号するのに用いられるタップ係数を学習する学習処理
    を、コンピュータに行わせるプログラムが記録されてい
    る記録媒体において、 学習用の画像データから、前記タップ係数の学習の教師
    となる教師データを生成して出力する教師データ生成ス
    テップと、 前記学習用の画像データから、前記タップ係数の学習の
    生徒となる生徒データを生成して出力する生徒データ生
    成ステップと、 前記学習用の画像データを符号化し、前記複数の復号制
    御情報を含む学習用の符号化データを出力する符号化ス
    テップと、 前記学習用の符号化データに含まれる第1の復号制御情
    報の正しさを、その学習用の符号化データに含まれる第
    2の復号制御情報に基づいて判定し、その判定結果を表
    すミスマッチ情報を出力する判定ステップと、 前記ミスマッチ情報に基づき、前記教師データと生徒デ
    ータを用いて、前記タップ係数を学習する学習ステップ
    とを備えるプログラムが記録されていることを特徴とす
    る記録媒体。
JP2002061419A 2002-03-07 2002-03-07 復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体 Expired - Fee Related JP4081745B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002061419A JP4081745B2 (ja) 2002-03-07 2002-03-07 復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002061419A JP4081745B2 (ja) 2002-03-07 2002-03-07 復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体

Publications (3)

Publication Number Publication Date
JP2003264837A true JP2003264837A (ja) 2003-09-19
JP2003264837A5 JP2003264837A5 (ja) 2005-09-02
JP4081745B2 JP4081745B2 (ja) 2008-04-30

Family

ID=29195737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002061419A Expired - Fee Related JP4081745B2 (ja) 2002-03-07 2002-03-07 復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4081745B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012090329A (ja) * 2004-12-30 2012-05-10 Microsoft Corp パケットロスのリカバリを改善するためのフレームキャッシングの使用
JP2013535908A (ja) * 2010-07-30 2013-09-12 ドイッチェ テレコム アーゲー 映像ビットストリームと出力映像シーケンスとの間の時間的な同期のための方法および装置
US9232219B2 (en) 1999-03-12 2016-01-05 Microsoft Technology Licensing, Llc Media coding for loss recovery with remotely predicted data units

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9232219B2 (en) 1999-03-12 2016-01-05 Microsoft Technology Licensing, Llc Media coding for loss recovery with remotely predicted data units
US9918085B2 (en) 1999-03-12 2018-03-13 Microsoft Technology Licensing, Llc Media coding for loss recovery with remotely predicted data units
JP2012090329A (ja) * 2004-12-30 2012-05-10 Microsoft Corp パケットロスのリカバリを改善するためのフレームキャッシングの使用
US8634413B2 (en) 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
US9866871B2 (en) 2004-12-30 2018-01-09 Microsoft Technology Licensing, Llc Use of frame caching to improve packet loss recovery
US10341688B2 (en) 2004-12-30 2019-07-02 Microsoft Technology Licensing, Llc Use of frame caching to improve packet loss recovery
JP2013535908A (ja) * 2010-07-30 2013-09-12 ドイッチェ テレコム アーゲー 映像ビットストリームと出力映像シーケンスとの間の時間的な同期のための方法および装置

Also Published As

Publication number Publication date
JP4081745B2 (ja) 2008-04-30

Similar Documents

Publication Publication Date Title
KR101266168B1 (ko) 영상의 부호화, 복호화 방법 및 장치
US6104434A (en) Video coding apparatus and decoding apparatus
US8315310B2 (en) Method and device for motion vector prediction in video transcoding using full resolution residuals
US7782955B2 (en) Transcoder and transcoding method operating in a transform domain for video coding schemes possessing different transform kernels
US7289671B2 (en) Data processing apparatus and method and recording medium
WO2009084340A1 (ja) 動画像符号化装置、および、動画像復号装置
US20100284467A1 (en) Image coding apparatus, image decoding apparatus, image coding method, and image decoding method
US20080008238A1 (en) Image encoding/decoding method and apparatus
US20110170597A1 (en) Method and device for motion vector estimation in video transcoding using full-resolution residuals
JP4847076B2 (ja) トランスコーディングのために出力マクロブロック及び動きベクトルを推定する方法及びトランスコーダ
JP2005503737A (ja) 境界強度に基づく適応フィルタリング
KR20120116936A (ko) 영상 블록 코딩 및 재구성 방법
US20110170596A1 (en) Method and device for motion vector estimation in video transcoding using union of search areas
MX2014015293A (es) Dispositivo de codificacion, dispositivo de decodificacion y programa.
JP4494803B2 (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
JP2003061091A (ja) 圧縮ビットストリームをアップサンプリングする方法および装置
JP4081745B2 (ja) 復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP4752088B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4517448B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4505729B2 (ja) 画像処理装置、画像処理方法、プログラム、および記録媒体
JP4154902B2 (ja) 画像処理装置および画像処理方法、並びにプログラムおよび記録媒体
KR102467091B1 (ko) 효과적인 비디오 압축을 위한 슈퍼 레졸루션 영상 처리 방법 및 시스템
JP4857152B2 (ja) 直交変換・量子化装置
JP4538698B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4100067B2 (ja) 画像情報変換方法及び画像情報変換装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050303

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070824

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080131

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140222

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees