JP4582416B2 - 画像符号化装置および画像符号化方法 - Google Patents

画像符号化装置および画像符号化方法 Download PDF

Info

Publication number
JP4582416B2
JP4582416B2 JP2005308102A JP2005308102A JP4582416B2 JP 4582416 B2 JP4582416 B2 JP 4582416B2 JP 2005308102 A JP2005308102 A JP 2005308102A JP 2005308102 A JP2005308102 A JP 2005308102A JP 4582416 B2 JP4582416 B2 JP 4582416B2
Authority
JP
Japan
Prior art keywords
layer
image
circuit
learning
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005308102A
Other languages
English (en)
Other versions
JP2006101535A (ja
Inventor
哲二郎 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005308102A priority Critical patent/JP4582416B2/ja
Publication of JP2006101535A publication Critical patent/JP2006101535A/ja
Application granted granted Critical
Publication of JP4582416B2 publication Critical patent/JP4582416B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、画像符号化装置および画像符号化方法に関する。特に、画像を、画素数の異なる複数の階層に分割する階層符号化を行う画像符号化装置および画像符号化方法に関する。
元の画像(原画像)を、第1階層(最上位階層)の画像として、その画素数を順次少なくした(解像度を順次低くした)第2階層の画像、第3階層の画像、・・・を形成する符号化(以下、適宜、階層符号化という)が提案されている。
階層符号化によれば、複数の階層の画像を、送信側から受信側に送信し、受信側では、その複数の階層の画像それぞれに対応してモニタにより、各階層の画像を表示することができる。
さらに、階層符号化においては、例えば、最下位階層の画像(最も画素数の少ない画像)についてのデータには、他の階層の画像よりも強力な誤り訂正処理などが施されるようになされており、これにより、最下位階層以外の階層の画像について訂正することができない誤りが生じた場合に、最悪でも、最下位階層の画像についてのデータだけは、受信側において、正常なものを得ることができるようになされている。その結果、受信側では、最下位階層の画像についてのデータから、より上位階層の画像を、例えば補間処理などにより得ることができ、従って、階層符号化によれば、誤りに対するロバスト性を向上させることができる。
図47は、以上のような階層符号化を行う、従来の画像符号化装置の一例の構成を示している。符号化すべき画像データは、第1階層(最上位階層)のデータとして、間引き回路11および信号処理回路501に供給されるようになされている。
間引き回路11では、第1階層の画像データの画素数が間引かれることにより、1つ下位の第2階層の画像データが形成され、間引き回路12および信号処理回路501に供給される。間引き回路12では、第2階層の画像データの画素数が間引かれることにより、さらに1つ下位の第3階層の画像データが形成され、信号処理回路501に供給される。
信号処理回路501では、第1階層乃至第3階層の画像データに対して、例えば誤り訂正処理その他の必要な信号処理が施され、その後、多重化されて、符号化データとして出力される。なお、信号処理回路501においては、最下位階層である第3階層の画像データに対しては、他の階層のデータより強力な誤り訂正が施されるようになされている。
図48は、図47の画像符号化装置から出力される符号化データを階層復号化する、従来の画像復号化装置の一例の構成を示している。
信号処理回路601においては、符号化データが、第1階層乃至第3階層の画像データに分離され、さらに、誤り訂正処理その他が施されて出力される。第1階層の画像データは、第1階層の復号画像としてそのまま出力される。また、第2階層の画像データは、補間回路602に供給される。補間回路602は、第2階層の画像データに対して補間処理を施すことにより、1つ上位の第1階層の画像データと同一の画素数の画像データを生成し、第1階層の復号画像として出力する。
第3階層の画像データは、補間回路603に供給される。補間回路603は、第3階層の画像データに対して補間処理を施すことにより、1つ上位の第2階層の画像データと同一の画素数の画像データ、即ち、第2階層の復号画像を生成し、補間回路604に出力する。補間回路604は、補間回路603の出力に対して、補間回路602における場合と同様の補間処理を施すことにより、さらに1つ上位の第1階層の画像データと同一の画素数の画像データを生成し、第1階層の復号画像として出力する。
従って、画像復号化装置においては、第1階層の画像データを何らかの原因で得ることができなくても、第2階層の画像データから、第1階層の復号画像を得ることができる。また、同様に、第1階層および第2階層の画像データを何らかの原因で得ることができなくても、第3階層の画像データから、第1階層や第2階層の復号画像を得ることができる。
しかしながら、最下位階層である第3階層の画像データだけから得られる、上位階層の復号画像は、その画質が著しく劣化したものとなる。
本発明は、このような状況に鑑みてなされたものであり、最下位階層の符号化データだけからでも、高画質の復号画像を得ることができるようにするものである。
請求項1に記載の画像符号化装置は、第1の階層の画像を構成する画素を、それぞれを中心とした所定の位置関係となる複数の画素から構成されるクラス分類用ブロックの画素のレベル分布からなる性質に応じて所定のクラスに分類する分類手段と、クラスごとに、所定のマッピング係数を記憶しているマッピング係数記憶手段と、第1の階層の画像の中の、注目している第1の階層の画像データの画素数を少なくした第2の階層の画像データの画素に対応する位置の注目画素およびその周辺画素と、その注目画素のクラスに対応するマッピング係数とを用いて所定の線形、または非線形の関数による演算を行うことにより、その演算結果からなる第1の階層の画像データの画素数を少なくした第2の階層の画像データに符号化する符号化手段とを備えることを特徴とする。
請求項6に記載の画像符号化方法は、第1の階層の画像を構成する画素を、それぞれを中心とした所定の位置関係となる複数の画素から構成されるクラス分類用ブロックの画素のレベル分布からなる性質に応じて所定のクラスに分類し、クラスごとに、記憶されている所定のマッピング係数のうち、第1の階層の画像の中の、注目している第1の階層の画像データの画素数を少なくした第2の階層の画像データの画素に対応する位置の注目画素に対応するクラスのマッピング係数を読み出し、そのマッピング係数と注目画素およびその周辺画素とを用いて所定の線形、または非線形の関数による演算を行うことにより、その演算結果からなる第1の階層の画像データの画素数を少なくした第2の階層の画像データに符号化することを特徴とする。
本発明の一側面においては、第1の階層の画像を構成する画素が、それぞれを中心とした所定の位置関係となる複数の画素から構成されるクラス分類用ブロックの画素のレベル分布からなる性質に応じて所定のクラスに分類され、クラスごとに、所定のマッピング係数が記憶され、第1の階層の画像の中の、注目している前記第1の階層の画像データの画素数を少なくした第2の階層の画像データの画素に対応する位置の注目画素およびその周辺画素と、その注目画素のクラスに対応する前記マッピング係数とが用いられて所定の線形、または非線形の関数による演算が行われ、その演算結果からなる前記第1の階層の画像データの画素数を少なくした第2の階層の画像データに符号化される。
本発明の一側面によれば、第1の階層の画像の中の、注目している注目画素に対応するクラスのマッピング係数と注目画素およびその周辺画素とを用いて所定の演算が行われることにより、その演算結果からなる第1の階層の画像データの画素数を少なくした第2の階層の画像データに符号化される。従って、その第2階層の画像データから、高画質の第1階層の画像データを得ることが可能となる。
以下に、本発明の実施の形態を説明するが、その前に、特許請求の範囲に記載の発明の各手段と以下の実施の形態との対応関係を明らかにするために、各手段の後の括弧内に、対応する実施の形態(但し、一例)を付加して、本発明の特徴を記述すると、次のようになる。
本発明の一側面の画像符号化装置は、画像を階層符号化する画像符号化装置であって、第1の階層の画像を構成する画素を、それぞれを中心とした所定の位置関係となる複数の画素から構成されるクラス分類用ブロックの画素のレベル分布からなる性質に応じて所定のクラスに分類する分類手段(例えば、図34に示すクラス分類回路113など)と、クラスごとに、所定のマッピング係数を記憶しているマッピング係数記憶手段(例えば、図34に示すマッピング係数メモリ114など)と、第1の階層の画像の中の、注目している前記第1の階層の画像データの画素数を少なくした第2の階層の画像データの画素に対応する位置の注目画素およびその周辺画素と、その注目画素のクラスに対応するマッピング係数とを用いて所定の線形、または非線形の関数による演算を行うことにより、その演算結果からなる第1の階層の画像データの画素数を少なくした第2の階層の画像データに符号化する符号化手段(例えば、図34に示す演算回路116など)とを備えることを特徴とする。
本発明の一側面の画像符号化方法は、画像を階層符号化する画像符号化方法であって、第1の階層の画像を構成する画素を、それぞれを中心とした所定の位置関係となる複数の画素から構成されるクラス分類用ブロックの画素のレベル分布からなる性質に応じて所定のクラスに分類し、クラスごとに、記憶されているマッピング係数のうち(例えば、図34に示すマッピング係数メモリ114など)、第1の階層の画像の中の、注目している前記第1の階層の画像データの画素数を少なくした第2の階層の画像データの画素に対応する位置の注目画素に対応するクラスのマッピング係数を読み出し、そのマッピング係数と注目画素およびその周辺画素とを用いて所定の線形、または非線形の関数による演算を行うことにより、その演算結果からなる第1の階層の画像データの画素数を少なくした第2の階層の画像データに符号化することを特徴とする。
なお、勿論この記載は、各手段を上記したものに限定することを意味するものではない。
図1は、本発明を適用した画像処理システム(システムとは、複数の装置が論理的に集合したものをいい、各構成の装置が同一筐体中にあるか否かは問わない)の一実施の形態の構成を示している。
送信装置1には、ディジタル化された画像データが供給されるようになされている。送信装置1は、入力された画像データを階層符号化し、その結果得られる符号化データを、例えば、光ディスクや、光磁気ディスク、磁気テープ、相変化ディスクその他でなる記録媒体2に記録し、または、例えば、地上波や、衛星回線、電話回線、CATV網、インターネットその他の伝送路3を介して伝送する。
受信装置4では、記録媒体2に記録された符号化データが再生され、または、伝送路3を介して伝送されてくる符号化データが受信され、その符号化データが階層復号化される。そして、その結果得られる復号画像が、図示せぬディスプレイに供給されて表示される。
なお、以上のような画像処理システムは、例えば、光ディスク装置や、光磁気ディスク装置、磁気テープ装置その他の、画像の記録/再生を行う装置や、あるいはまた、例えば、テレビ電話装置や、テレビジョン放送システム、CATVシステムその他の、画像の伝送を行う装置などに適用される。また、送信装置1が出力する符号化データのデータ量が少ないため、図1の画像処理システムは、伝送レートの低い、例えば、携帯電話機その他の、移動に便利な携帯端末などにも適用可能である。
図2は、送信装置1の構成例を示している。
符号化すべきディジタル画像データ、即ち、第1階層(最上位階層)の画像データは、第1階層の符号化データとして、そのまま信号処理回路15に供給される他、間引き回路11および最適補正データ算出回路13に供給される。間引き回路11では、第1階層の画像データの画素数が間引かれることにより、1つ下位の第2階層の画像データが形成される。即ち、間引き回路11では、例えば、図3に示すように、第1階層の画像データ(同図において、○印で示す部分)が1/9に単純に間引かれ(横方向および縦方向とも1/3に間引かれ)、これにより第2階層の画像データ(同図において△印で示す部分)が形成される。この第2階層の画像データは、間引き回路12および最適補正データ算出回路13に供給される。
間引き回路12では、第2階層の画像データの画素数が間引かれることにより、さらに1つ下位の第3階層の画像データが形成される。即ち、間引き回路12では、例えば、間引き回路11における場合と同様に、第2階層の画像データが1/9に単純に間引かれ、これにより、図3において×印で示す第3階層の画像データが形成される。この第3階層の画像データは、最適補正データ算出回路14に供給される。
以上のようにして、間引き回路11および12では、図4に示すように、第1階層の画像データ(原画像)から、第2階層および第3階層の画像データが形成される。
最適補正データ算出回路13では、第2階層の画像データから、第1階層の階層の復号画像を得るのに最適な最適補正データ(以下、適宜、第2階層の最適補正データという)が算出され、第2階層の符号化データとして信号処理回路15に出力される。最適補正データ算出回路14においては、最適補正データ算出回路14が出力する最適補正データを得るのに最適な最適補正データ(以下、適宜、第3階層の最適補正データという)が算出され、第3階層の符号化データとして信号処理回路15に供給される。
ここで、第3階層の最適補正データは、第2階層の最適補正データを得るのに最適なものであり、また、第2階層の最適補正データは、第1階層の復号画像を得るのに最適なものであるから、第3階層の最適補正データも、第2階層の最適補正データと同様に、第1階層の復号画像を得るのに最適なものということができる。
信号処理回路15では、第2階層の符号化データに含まれる、後述する予測係数(第1階層の予測係数)が取り出され、第3階層の符号化データの中に含められる。そして、信号処理回路15では、第1階層乃至第3階層の符号化データに対して、例えば誤り訂正処理その他の必要な信号処理が施され、その後、多重化されて、最終的な符号化データとして出力される。なお、信号処理回路15においては、最下位階層である第3階層の符号化データに対しては、他の階層の符号化データより強力な誤り訂正が施されるようになされている。
以上のようにして信号処理回路13から出力された符号化データが、記録媒体2に記録され、または伝送路3を介して伝送される。
なお、以上においては、間引き回路11および12において、同一の割合で間引きが行われるものとしたが、間引き回路11と12で行われる間引きの割合は、同一である必要はない。
次に、図5は、図2の最適補正データ算出回路13の構成例を示している。なお、最適補正データ算出回路14も、最適補正データ算出回路13と同様に構成されるため、その説明は省略する。
間引き回路11からの第2階層の画像データは、補正部21に供給されるようになされており、また、第1階層の画像データは、ローカルデコード部22に供給されるようになされている。さらに、第1階層の画像データは、誤差算出部23にも供給されるようになされている。
補正部21は、第2階層の画像データを、判定部24からの制御にしたがって補正するようになされている。補正部21における補正の結果得られる補正データは、ローカルデコード部22および判定部24に供給するようになされている。
ローカルデコード部22は、補正部21からの補正データ、即ち、第2階層の画像データの補正結果に基づいて、その1つ上位の第1階層の予測値を予測し、誤差算出部23に供給するようになされている。
なお、ローカルデコード部22は、後述するように、補正データとの線形結合によって得られる第1階層の予測値を算出するためのクラスごとの予測係数を、補正データと第1階層の画像データ(原画像)とを用いて求める処理を行い、そのクラスごとの予測係数に基づいて、第1階層の予測値を求める適応処理を行うようになされており、このとき得られたクラスごとの予測係数は、判定部24に供給されるようにもなされている。
誤差算出部23は、そこに入力される、第1階層の画像データ(原画像)に対する、ローカルデコード部22からの予測値の予測誤差を算出するようになされている。この予測誤差は、誤差情報として、判定部24に供給されるようになされている。
判定部24は、誤差算出部23からの誤差情報に基づいて、補正部21が出力した補正データを、元の画像(ここでは、第1階層の画像)の階層符号化結果とすることの適正さを判定するようになされている。そして、判定部24は、補正部21が出力した補正データを、元の画像の階層符号化結果とすることが適正でないと判定した場合には、補正部21を制御し、さらに、第2階層の画像データを補正させ、その結果得られる新たな補正データを出力させるようになされている。また、判定部24は、補正部21が出力した補正データを、元の画像の階層符号化結果とすることが適正であると判定した場合には、補正部21から供給された補正データを、最適な補正データ(第2階層の最適補正データ)として多重化部25に供給するとともに、ローカルデコード部22から供給されたクラスごとの予測係数も多重化部25に供給するようになされている。
多重化部25は、判定部24からの最適補正データと、クラスごとの予測係数とを多重化し、その多重化結果を、第2階層の符号化データとして出力するようになされている。
次に、図6のフローチャートを参照して、その動作について説明する。補正部21に対して、第2階層の画像データが供給されると、補正部21は、ステップS1において、最初は、補正を行わずに、そのまま第2階層の画像データを、ローカルデコード部22および判定部24に出力する。ローカルデコード部22では、ステップS2において、補正部21からの補正データ(最初は、上述したように、第2階層の画像データそのもの)がローカルデコードされる。
即ち、ステップS2では、補正部21からの補正データとの線形結合によって得られる1つ上位の第1階層の予測値を算出するためのクラスごとの予測係数を、補正データと第1階層の画像データとを用いて求める処理が行われる。さらに、そのクラスごとの予測係数に基づいて、第1階層の画像の予測値が求められ、誤差算出部23に供給される。
誤差算出部23は、ローカルデコード部22から、第1階層の予測値を受信すると、ステップS3において、第1階層の画像データに対する、ローカルデコード部22からの予測値の予測誤差を算出し、誤差情報として、判定部24に供給する。判定部24は、誤差算出部23から誤差情報を受信すると、ステップS4において、その誤差情報に基づいて、補正部21が出力した補正データを、第1階層の画像の階層符号化結果とすることの適正さを判定する。
即ち、ステップS4においては、例えば、誤差情報が所定の閾値ε以下であるかどうかが判定される。ステップS4において、誤差情報が所定の閾値ε以下でないと判定された場合、補正部21が出力した補正データを、第2階層の画像とするのは適正でないと認識され、ステップS5に進み、判定部24は、補正部21を制御し、これにより、第2階層の画像データを補正させる。補正部21は、判定部24の制御にしたがって、補正量(後述する補正値△)を変えて、第2階層の画像データを補正し、その結果得られる補正データを、ローカルデコード部22および判定部24に出力する。そして、ステップS2に戻り、以下、同様の処理が繰り返される。
一方、ステップS4において、誤差情報が所定の閾値ε以下であると判定された場合、補正部21が出力した補正データを、第2階層の画像とするのは適正であると認識され、判定部24は、所定の閾値ε以下の誤差情報が得られたときの補正データを、最適補正データとして、クラスごとの予測係数とともに、多重化部25に出力する。多重化部25では、ステップS6において、判定部24からの最適補正データとクラスごとの予測係数とが多重化され、その多重化結果が、第2階層の符号化データとして出力されて、処理を終了する。
以上のように、誤差情報が所定の閾値ε以下となったときにおける補正データを、第2階層の画像データとするようにしたので、受信装置4側においては、その補正データ(最適補正データ)に基づいて、元の画像(第1階層の画像)とほぼ同一の画像を得ることが可能となる。
なお、最適補正データ算出回路13においては、補正データとの線形結合によって得られる1つ上位の第1階層の予測値を算出するためのクラスごとの予測係数を求める処理が、上述したように、第1階層の画像データを用いて行われるが、最適補正データ算出回路14では、その処理は、最適補正データ算出回路13が出力する最適補正データを用いて行われる。但し、最適補正データ算出回路14には、間引き回路11が出力する第2階層の画像をそのまま用いて、適応処理(予測係数に基づいて予測値を求める処理)を行わせるようにすることも可能である。
次に、図7は、図5の補正部21の構成例を示している。
第2階層の画像データは、補正回路32に供給されるようになされており、補正回路32は、判定部24(図5)からの制御信号にしたがって、補正値ROM33にアドレスを与え、これにより、補正値△を読み出すようになされている。そして、補正回路32は、第2階層の画像データに対して、補正値ROM33からの補正値△を、例えば加算することで、補正データを生成し、ローカルデコード部22および判定部24に供給するようになされている。補正値ROM33は、第2階層の画像データを補正するための、各種の補正値△の組合せ(例えば、1フレーム分の第2階層の画像データを補正するための補正値の組合せなど)を記憶しており、補正回路32から供給されるアドレスに対応する補正値△の組合せを読み出して、補正回路32に供給するようになされている。
次に、図8を参照して、図7の補正部21の処理について説明する。
例えば、1フレーム分などの第2階層の画像データが、補正回路32に供給されると、補正回路32は、ステップS11において、その第2階層の画像データを受信し、ステップS12において、判定部24(図5)から制御信号を受信したかどうかを判定する。ステップS12において、制御信号を受信していないと判定された場合、ステップS13およびS14をスキップして、ステップS15に進み、補正回路32は、第2階層の画像データを、そのまま補正データとして、ローカルデコード部22および判定部24に出力し、ステップS12に戻る。
即ち、判定部24は、上述したように、誤差情報に基づいて、補正部21(補正回路32)を制御するようになされており、補正回路32において第2階層の画像データが受信された直後は、まだ、誤差情報が得られないため(誤差情報が、誤差算出部23から出力されないため)、判定部24からは制御信号は出力されない。このため、第2階層の画像データを受信した直後は、補正回路32は、その第2階層の画像データを補正せず(0を加算する補正をして)、そのまま補正データとして、ローカルデコード部22および判定部24に出力する。
一方、ステップS12において、判定部24からの制御信号を受信したと判定された場合、ステップS13において、補正回路32は、その制御信号にしたがったアドレスを、補正値ROM33に出力する。これにより、ステップS13では、補正値ROM33から、そのアドレスに記憶されている、1フレーム分の第2階層の画像データを補正するための補正値△の組合せ(集合)が読み出され、補正回路32に供給される。補正回路32は、補正値ROM33から補正値△の組合せを受信すると、ステップS14において、1フレームの第2階層の画像データそれぞれに、対応する補正値△を加算し、これにより、第2階層の画像データを補正した補正データを算出する。その後は、ステップS15に進み、補正データが、補正回路32からローカルデコード部22および判定部24に出力され、ステップS12に戻る。
以上のようにして、補正部21は、判定部24の制御にしたがって、第2階層の画像データを、種々の値に補正した補正データを出力することを繰り返す。
なお、判定部24は、1フレームの画像についての符号化を終了すると、その旨を表す制御信号を、補正部21に供給するようになされている。補正部21では、ステップS12において、1フレームの画像についての符号化が終了した旨の制御信号を、判定部24から受信したかどうかも判定されるようになされており、受信したと判定された場合は、そのフレームに対する処理を終了する。そして、次のフレームが供給されるのを待って、ステップS11に戻り、再び、ステップS11からの処理を繰り返す。
次に、図9は、図5のローカルデコード部22の構成例を示している。
補正部21からの補正データは、クラス分類用ブロック化回路41および予測値計算用ブロック化回路42に供給されるようになされている。クラス分類用ブロック化回路41は、補正データを、その性質に応じて所定のクラスに分類するための単位である、注目している補正データ(注目補正データ)を中心としたクラス分類用ブロックにブロック化するようになされている。
即ち、いま、例えば、図10において、○印で示す画素が第1階層の画像を構成するものとするとともに、●印で示す画素が第2階層の画像(補正データ)を構成するものとして、上からi番目で、左からj番目の補正データ(または画素)をXijと表すとすると、クラス分類用ブロック化回路41は、注目画素(注目補正データ)Xijの左上、上、右上、左、右、左下、下、右下に隣接する8つの画素X(i-1)(j-1),X(i-1)j,X(i-1)(j+1),Xi(j-1),Xi(j+1),X(i-1)(j-1),X(i-1)j,X(i+1)(j+1)に、自身を含め、合計9画素(9の補正データ)で構成されるクラス分類用ブロックを構成するようになされている。このクラス分類用ブロックは、クラス分類適応処理回路43に供給されるようになされている。
なお、この場合、クラス分類用ブロックは、3×3画素でなる正方形状のブロックで構成されることとなるが、クラス分類用ブロックの形状は、正方形である必要はなく、その他、例えば、長方形や、十文字形、その他の任意な形とすることが可能である。また、クラス分類用ブロックを構成する画素数も、3×3(横×縦)の9画素に限定されるものではない。
予測値計算用ブロック化回路42は、補正データを、第1階層の画像の予測値を計算するための単位である、注目補正データを中心とした予測値計算用ブロックにブロック化するようになされている。即ち、いま、図10において、補正データXij(図中、●印で示す部分)を中心とする、元の画像(ここでは、第1階層の画像)における3×3の9画素の画素値を、その最も左から右方向、かつ上から下方向に、Yij(1),Yij(2),Yij(3),Yij(4),Yij(5),Yij(6),Yij(7),Yij(8),Yij(9)と表すとすると、画素Yij(1)乃至Yij(9)の予測値の計算のために、予測値計算用ブロック化回路42は、例えば、画素Xijを中心とする5×5の25画素X(i-2)(j-2),X(i-2)(j-1),X(i-2)j,X(i-2)(j+1),X(i-2)(j+2),X(i-1)(j-2),X(i-1)(j-1),X(i-1)j,X(i-1)(j+1),X(i-1)(j+2),Xi(j-2),Xi(j-1),Xij,Xi(j+1),Xi(j+2),X(i+1)(j-2),X(i+1)(j-1),X(i+1)j,X(i+1)(j+1),X(i+1)(j+2),X(i+2)(j-2),X(i+2)(j-1),X(i+2)j,X(i+2)(j+1),X(i+2)(j+2)で構成される正方形状の予測値計算用ブロック(画素Xijを注目画素(注目補正データ)とする予測値計算用ブロック)を構成するようになされている。
具体的には、例えば、図10において四角形で囲む、第1階層の画像における画素Y33(1)乃至Y33(9)の9画素の予測値の計算のためには、補正データX11,X12,X13,X14,X15,X21,X22,X23,X24,X25,X31,X32,X33,X34,X35,X41,X42,X43,X44,X45,X51,X52,X53,X54,X55により、予測値計算用ブロックが構成される。
予測値計算用ブロック化回路42において得られた予測値計算用ブロックは、クラス分類適応処理回路43に供給されるようになされている。
なお、予測値計算用ブロックについても、クラス分類用ブロックにおける場合と同様に、その画素数および形状は、上述したものに限定されるものではない。但し、予測値計算用ブロックを構成する画素数は、クラス分類用ブロックを構成する画素数よりも多くするのが望ましい。
また、上述のようなブロック化を行う場合において(ブロック化以外の処理についても同様)、画像の画枠付近では、対応する画素が存在しないことがあるが、この場合には、例えば、画枠を構成する画素と同一の画素が、その外側に存在するものとして処理を行う。
クラス分類適応処理回路43は、ADRC(Adaptive Dynamic Range Coding)処理回路、クラス分類回路45、および適応処理回路46で構成され、クラス分類適応処理を行うようになされている。
クラス分類適応処理とは、入力信号を、その特徴に基づいて幾つかのクラスに分類し、各クラスの入力信号に、そのクラスに適切な適応処理を施すもので、大きく、クラス分類処理と適応処理とに分かれている。
ここで、クラス分類処理および適応処理について簡単に説明する。
まず、クラス分類処理について説明する。
いま、例えば、図11(A)に示すように、ある注目画素と、それに隣接する3つの画素により、2×2画素でなるブロック(クラス分類用ブロック)を構成し、また、各画素は、1ビットで表現される(0または1のうちのいずれかのレベルをとる)ものとする。この場合、2×2の4画素のブロックは、各画素のレベル分布により、図11(B)に示すように、16(=(214)パターンに分類することができる。即ち、ブロックを構成する注目画素をパターン分けすることができ、このようなパターン分けが、クラス分類処理であり、クラス分類回路45において行われる。
なお、クラス分類処理は、画像(ブロック内の画像)のアクティビティ(画像の複雑さ)(変化の激しさ)などをも考慮して行うようにすることが可能である。
ここで、通常、各画素には、例えば8ビット程度が割り当てられる。また、本実施の形態においては、上述したように、クラス分類用ブロックは、3×3の9画素で構成される。従って、このようなクラス分類用ブロックを対象にクラス分類処理を行ったのでは、(289という膨大な数のクラスに分類されることになる。
そこで、本実施の形態においては、ADRC処理回路44において、クラス分類用ブロックに対して、ADRC処理が施されるようになされており、これにより、クラス分類用ブロックを構成する画素のビット数を小さくすることで、クラス数を削減するようになされている。
即ち、例えば、いま、説明を簡単にするため、図12(A)に示すように、直線上に並んだ4画素で構成されるブロックを考えると、ADRC処理においては、その画素値の最大値MAXと最小値MINが検出される。そして、DR=MAX−MINを、ブロックの局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、ブロックを構成する画素の画素値がKビットに再量子化される。
即ち、ブロック内の各画素値から、最小値MINを減算し、その減算値をDR/2Kで除算する。そして、その結果得られる除算値に対応するコード(ADRCコード)に変換される。具体的には、例えば、K=2とした場合、図12(B)に示すように、除算値が、ダイナミックレンジDRを4(=22)等分して得られるいずれの範囲に属するかが判定され、除算値が、最も下のレベルの範囲、下から2番目のレベルの範囲、下から3番目のレベルの範囲、または最も上のレベルの範囲に属する場合には、それぞれ、例えば、00B,01B,10B、または11Bなどの2ビットにコード化される(Bは2進数であることを表す)。そして、復号側においては、ADRCコード00B,01B,10B、または11Bは、ダイナミックレンジDRを4等分して得られる最も下のレベルの範囲の中心値L00、下から2番目のレベルの範囲の中心値L01、下から3番目のレベルの範囲の中心値L10、または最も上のレベルの範囲の中心値L11に変換され、その値に、最小値MINが加算されることで復号が行われる。
ここで、このようなADRC処理はノンエッジマッチングと呼ばれる。
なお、ADRC処理については、本件出願人が先に出願した、例えば、特開平3−53778号公報などに、その詳細が開示されている。
ブロックを構成する画素に割り当てられているビット数より少ないビット数で再量子化を行うADRC処理を施すことにより、上述したように、クラス数を削減することができ、このようなADRC処理が、ADRC処理回路44において行われるようになされている。
なお、本実施の形態では、クラス分類回路45において、ADRC処理回路44から出力されるADRCコードに基づいて、クラス分類処理が行われるが、クラス分類処理は、その他、例えば、DPCM(予測符号化)や、BTC(Block Truncation Coding)、VQ(ベクトル量子化)、DCT(離散コサイン変換)、アダマール変換などを施したデータを対象に行うようにすることも可能である。
次に、適応処理について説明する。
例えば、いま、第1階層の画像の画素値yの予測値E[y]を、その周辺の幾つかの画素の画素値(ここでは、第2階層の画像データを補正した補正データ)(以下、適宜、学習データという)x1,x2,・・・と、所定の予測係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。
E[y]=w11+w22+・・・
・・・(1)
そこで、一般化するために、予測係数wの集合でなる行列W、学習データの集合でなる行列X、および予測値E[y]の集合でなる行列Y’を、
Figure 0004582416
で定義すると、次のような観測方程式が成立する。
XW=Y’
・・・(2)
そして、この観測方程式に最小自乗法を適用して、第1階層の画像の画素値yに近い予測値E[y]を求めることを考える。この場合、第1階層の画像の画素値(以下、適宜、教師データという)yの集合でなる行列Y、および第1階層の画像の画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、
Figure 0004582416
で定義すると、式(2)から、次のような残差方程式が成立する。
XW=Y+E
・・・(3)
この場合、第1階層の画像の画素値yに近い予測値E[y]を求めるための第1階層の予測係数wiは、自乗誤差
Figure 0004582416
を最小にすることで求めることができる。
従って、上述の自乗誤差を予測係数wiで微分したものが0になる場合、即ち、次式を満たす予測係数wiが、第1階層の画像の画素値yに近い予測値E[y]を求めるため最適値ということになる。
Figure 0004582416
・・・(4)
そこで、まず、式(3)を、第1階層の予測係数wiで微分することにより、
次式が成立する。
Figure 0004582416
・・・(5)
式(4)および(5)より、式(6)が得られる。
Figure 0004582416
・・・(6)
さらに、式(3)の残差方程式における学習データx、予測係数w、教師データy、および残差eの関係を考慮すると、式(6)から、次のような正規方程式を得ることができる。
Figure 0004582416
・・・(7)
式(7)の正規方程式は、求めるべき予測係数wの数と同じ数だけたてることができ、従って、式(7)を解くことで、最適な予測係数wを求めることができる。なお、式(7)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを適用することが可能である。
以上のようにして、クラスごとに最適な第1階層の予測係数wを求め、さらに、その予測係数wを用い、式(1)により、第1階層の画像の画素値yに近い予測値E[y]を求めるのが適応処理であり、この適応処理が、適応処理回路46において行われるようになされている。
なお、適応処理は、間引かれた画像(ここでは、第2階層の画像)には含まれていない、元の画像(ここでは、第1階層の画像)に含まれる成分が再現される点で、補間処理とは異なる。即ち、適応処理では、式(1)だけを見る限りは、いわゆる補間フィルタを用いての補間処理と同一であるが、その補間フィルタのタップ係数に相当する予測係数wが、教師データyを用いての、いわば学習により求められるため、元の画像に含まれる成分を再現することができる。このことから、適応処理は、いわば画像の創造作用がある処理ということができる。
次に、図13のフローチャートを参照して、図9のローカルデコード部22の処理について説明する。
ローカルデコード部22においては、まず最初に、ステップS21において、補正部21からの補正データがブロック化される。即ち、クラス分類用ブロック化回路41において、補正データが、注目補正データを中心とする3×3画素のクラス分類用ブロックにブロック化され、クラス分類適応処理回路43に供給されるとともに、予測値計算用ブロック化回路42において、補正データが、注目補正データを中心とする5×5画素の予測値計算用ブロックにブロック化され、クラス分類適応処理回路43に供給される。
クラス分類適応処理回路43には、上述したように、クラス分類用ブロックおよび予測値計算用ブロックの他、第1階層の画像データが供給されるようになされており、クラス分類用ブロックはADRC処理部44に、予測値計算用ブロックおよび第1階層の画像データは適応処理回路46に供給されるようになされている。
ADRC処理回路44は、クラス分類用ブロックを受信すると、ステップS22において、そのクラス分類用ブロックに対して、例えば、1ビットのADRC(1ビットで再量子化を行うADRC)処理を施し、これにより、補正データを、1ビットに変換(符号化)して、クラス分類回路45に出力する。クラス分類回路45は、ステップS23において、ADRC処理が施されたクラス分類用ブロックに対して、クラス分類処理を施す。即ち、クラス分類用ブロックを構成する各画素のレベル分布の状態を検出し、そのクラス分類用ブロックが属するクラス(そのクラス分類用ブロックを構成する注目補正データのクラス)を判定する。このクラスの判定結果は、クラス情報として、適応処理回路46に供給される。
なお、本実施の形態においては、1ビットのADRC処理が施された3×3の9画素で構成されるクラス分類用ブロックに対して、クラス分類処理が施されるので、各クラス分類用ブロックは、512(=(219)のクラスのうちのいずれかに分類されることになる。
そして、ステップS24に進み、適応処理回路46において、クラス分類回路45からのクラス情報に基づいて、各クラスごとに適応処理が施され、これにより、第1階層のクラスごとの予測係数および1フレーム分の予測値が算出される。
即ち、本実施の形態においては、クラスごとの25×9個の予測係数が、1フレームの補正データと第1階層の画像データとから算出される。そして、例えば、ある1つの補正データに注目した場合に、その注目補正データに対応する、第1階層の画像の画素と、その画素の周りに隣接する8個の画素の、合計9個の画素についての予測値が、注目補正データを中心とする5×5画素でなる予測値計算用ブロックを用いて、適応処理が行われることにより算出される。
具体的には、例えば、いま、図10に示した補正データX33を中心とする3×3の補正データX22,X23,X24,X32,X33,X34,X42,X43,X44でなるクラス分類用ブロック(補正データX33を注目補正データとして構成されたクラス分類用ブロック)についてのクラス情報Cが、クラス分類回路45から出力され、また、そのクラス分類用ブロックに対応する予測値計算用ブロックとして、補正データX33を中心とする5×5画素の補正データX11,X12,X13,X14,X15,X21,X22,X23,X24,X25,X31,X32,X33,X34,X35,X41,X42,X43,X44,X45,X51,X52,X53,X54,X55でなる予測値計算用ブロック(補正データX33を注目補正データとする予測値計算用ブロック)が、予測値計算用ブロック化回路42から出力されたものとすると、まず、その予測値計算用ブロックを構成する補正データを、学習データとするとともに、第1階層の画像における、補正データX33を中心とする3×3画素(図10において四角形で囲んである部分)の画素値Y33(1)乃至Y33(9)を、教師データとして、式(7)に示した正規方程式がたてられる。
さらに、例えば、1フレームの中の、同一のクラス情報Cにクラス分類されるクラス分類用ブロックに対応する、他の予測値計算用ブロックについても同様にして、正規方程式がたてられ、画素値Y33(k)(ここでは、k=1,2,・・・,9)の予測値E[Y33(k)]を求めるための予測係数w1(k)乃至w25(k)(本実施の形態では、1つの予測値を求めるのに学習データが25個用いられるので、それに対応して、予測係数wも25個必要となる)を算出することができるだけの数の正規方程式が得られると(従って、そのような数の正規方程式が得られるまでは、ステップS24では、正規方程式をたてる処理までが行われる)、その正規方程式を解くことで、クラス情報Cについて、画素値Y33(k)の予測値E[Y33(k)]を求めるのに最適な予測係数w1(k)乃至w25(k)が算出される。
この処理は、各クラスごとに行われ、これにより、各クラスごとに25×9個の予測係数が算出される。そして、クラス情報Cに対応する予測係数と、予測地形算用ブロックとを用い、式(1)に対応する次式にしたがって、予測値E[Y33(k)]が求められる。
E[Y33(k)]=w1(k)X11+w2(k)X12+w3(k)X13
+w4(k)X14+w5(k)X15+w6(k)X21
+w7(k)X22+w8(k)X23+w9(k)X24
+w10(k)X25+w11(k)X31
+w12(k)X32+w13(k)X33
+w14(k)X34+w15(k)X35
+w16(k)X41+w17(k)X42
+w18(k)X43+w19(k)X44
+w20(k)X45+w21(k)X51
+w22(k)X52+w23(k)X53
+w24(k)X54+w25(k)X55
・・・(8)
ステップS24では、以上のようにして、25×9の予測係数が、クラスごとに求められ、さらに、そのクラスごとの予測係数を用いて、注目補正データを中心とする3×3の原画像の画素の予測値が求められる。
その後、ステップS25に進み、クラスごとの25×9の予測係数は判定部24に供給され、3×3画素単位で求められた1フレーム分の予測値は誤差算出部23に供給される。そして、ステップS21に戻り、以下同様の処理が、例えば、上述したように1フレーム単位で繰り返される。
次に、図14は、図5の誤差算出部23の構成例を示している。
ブロック化回路51には、元の画像データ、即ち、ここでは第1階層の画像データが供給されるようになされており、そこでは、ブロック化回路51は、その画像データを、ローカルデコード部22から出力される第1階層の予測値に対応する9個単位でブロック化し、その結果得られる3×3画素のブロックを、自乗誤差算出回路52に出力するようになされている。自乗誤差算出部52には、上述したように、ブロック化回路51からブロックが供給される他、ローカルデコード部22から第1階層の予測値が、9個単位(3×3画素のブロック単位)で供給されるようになされており、自乗誤差算出回路52は、第1階層の画像に対する、その予測値の予測誤差としての自乗誤差を算出し、積算部55に供給するようになされている。
即ち、自乗誤差算出回路52は、演算器53および54で構成されている。演算器53は、ブロック化回路51からのブロック化された画像データそれぞれから、対応する予測値を減算し、その減算値を、演算器54に供給するようになされている。演算器54は、演算器53の出力(第1階層の画像データとその予測値との差分)を自乗し、積算部55に供給するようになされている。
積算部55は、自乗誤差算出回路52から自乗誤差を受信すると、メモリ56の記憶値を読み出し、その記憶値と自乗誤差とを加算して、再び、メモリ56に供給して記憶させることを繰り返すことで、自乗誤差の積算値(誤差分散)を求めるようになされている。さらに、積算部55は、所定量(例えば、1フレーム分など)についての自乗誤差の積算が終了すると、その積算値を、メモリ56から読み出し、誤差情報として、判定部24に供給するようになされている。メモリ56は、1フレームについての処理が終了するごとに、その記憶値をクリアしながら、積算部55の出力値を記憶するようになされている。
次に、その動作について、図15のフローチャートを参照して説明する。誤差算出部23では、まず最初に、ステップS31において、メモリ56の記憶値が、例えば0にクリアされ、ステップS32に進み、ブロック化回路51において、第1階層の画像データが、上述したようにブロック化され、その結果得られるブロックが、自乗誤差算出回路52に供給される。自乗誤差算出回路52では、ステップS33において、ブロック化回路51から供給されるブロックを構成する、第1階層の画像の画像データと、ローカルデコード部22から供給される第1階層の予測値との自乗誤差が算出される。
即ち、ステップS33では、演算器53において、ブロック化回路51より供給されたブロック化された第1階層の画像データそれぞれから、対応する予測値が減算され、演算器54に供給される。さらに、ステップS33では、演算器54において、演算器53の出力が自乗され、積算部55に供給される。
積算部55は、自乗誤差算出回路52から自乗誤差を受信すると、ステップS34において、メモリ56の記憶値を読み出し、その記憶値と自乗誤差とを加算することで、自乗誤差の積算値を求める。積算部55において算出された自乗誤差の積算値は、メモリ56に供給され、前回の記憶値に上書きされることで記憶される。
そして、積算部55では、ステップS35において、所定量としての、例えば、1フレーム分についての自乗誤差の積算が終了したかどうかが判定される。ステップS35において、1フレーム分についての自乗誤差の積算が終了していないと判定された場合、ステップS32に戻り、再び、ステップS32からの処理を繰り返す。また、ステップS35において、1フレーム分についての自乗誤差の積算が終了したと判定された場合、ステップS36に進み、積算部55は、メモリ56に記憶された1フレーム分についての自乗誤差の積算値を読み出し、誤差情報として、判定部24に出力する。そして、ステップS31に戻り、再び、ステップS31からの処理を繰り返す。
従って、誤差算出部23では、第1階層の画像データをYij(k)とするとともに、ローカルデコード部22において補正データから生成された第1階層の予測値をE[Yij(k)]とするとき、次式にしたがった演算が行われることで、誤差情報Qが算出される。
Q=Σ(Yij(k)−E[Yij(k)])2
但し、Σは、1フレーム分についてのサメーションを意味する。
次に、図16は、図5の判定部24の構成例を示している。
予測係数メモリ61は、ローカルデコード部22から供給される予測係数を記憶するようになされている。補正データメモリ62は、補正部21から供給される補正データを記憶するようになされている。
なお、補正データメモリ62は、補正部21において、第2階層の画像データが新たに補正され、これにより、新たな補正データが供給された場合には、既に記憶している補正データ(前回の補正データ)に代えて、新たな補正データを記憶するようになされている。また、このように補正データが、新たなものに更新された後、ローカルデコード部22からは、その新たな補正データに対応する、新たなクラスごとの予測係数のセットが出力されるが、予測係数メモリ61においても、このように新たなクラスごとの予測係数が供給された場合には、既に記憶しているクラスごとの予測係数(前回のクラスごとの予測係数)に代えて、その新たなクラスごとの予測係数を記憶するようになされている。
誤差情報メモリ63は、誤差算出部23から供給される誤差情報を記憶するようになされている。なお、誤差情報メモリ63は、誤差算出部23から、今回供給された誤差情報の他に、前回供給された誤差情報も記憶するようになされている(新たな誤差情報が供給されても、さらに新たな誤差情報が供給されるまでは、既に記憶している誤差情報を保持するようになされている)。また、誤差情報メモリ63は、新たなフレームについての処理が開始されるごとにクリアされるようになされている。
比較回路64は、誤差情報メモリ63に記憶された今回の誤差情報と、所定の閾値εとを比較し、さらに、必要に応じて、今回の誤差情報と前回の誤差情報との比較も行うようになされている。比較回路64における比較結果は、制御回路65に供給されるようになされている。
制御回路65は、比較回路64における比較結果に基づいて、補正データメモリ62に記憶された補正データを、画像の符号化結果とすることの適正(最適)さを判定し、最適でないと認識(判定)した場合には、新たな補正データの出力を要求する制御信号を、補正部21(図5)に供給するようになされている。また、制御回路65は、補正データメモリ62に記憶された補正データを、画像の符号化結果とすることが最適であると認識した場合には、予測係数メモリ61に記憶されているクラスごとの予測係数を読み出し、多重化部25に出力するとともに、補正データメモリ62に記憶されている補正データを読み出し、最適補正データとして、やはり多重化部25に供給するようになされている。さらに、この場合、制御回路65は、1フレームの画像についての符号化を終了した旨を表す制御信号を、補正部21に出力し、これにより、上述したように、補正部21に、次のフレームについての処理を開始させるようになされている。
次に、図17を参照して、判定部24の動作について説明する。判定部24では、まず最初に、ステップS41において、誤差算出部23から誤差情報を受信したかどうかが、比較回路64によって判定され、誤差情報を受信していないと判定された場合、ステップS41に戻る。また、ステップS41において、誤差情報を受信したと判定された場合、即ち、誤差情報メモリ63に誤差情報が記憶された場合、ステップS42に進み、比較回路64において、誤差情報メモリ63に、いま記憶された誤差情報(今回の誤差情報)と、所定の閾値εとが比較され、いずれが大きいかが判定される。
ステップS42において、今回の誤差情報が、所定の閾値ε以上であると判定された場合、比較回路64において、誤差情報メモリ63に記憶されている前回の誤差情報が読み出される。そして、比較回路64は、ステップS43において、前回の誤差情報と、今回の誤差情報とを比較し、いずれが大きいかを判定する。
ここで、1フレームについての処理が開始され、最初に誤差情報が供給されたときには、誤差情報メモリ63には、前回の誤差情報は記憶されていないので、この場合には、判定部24においては、ステップS43以降の処理は行われず、制御回路65において、所定の初期アドレスを出力するように、補正回路32(図7)を制御する制御信号が出力されるようになされている。
ステップS43において、今回の誤差情報が、前回の誤差情報以下であると判定された場合、即ち、第2階層の画像データの補正を行うことにより誤差情報が減少した場合、ステップS44に進み、制御回路65は、補正値△を、前回と同様に変化させるように指示する制御信号を、補正回路32に出力し、ステップS41に戻る。また、ステップS43において、今回の誤差情報が、前回の誤差情報より大きいと判定された場合、即ち、第2階層の画像データの補正を行うことにより誤差情報が増加した場合、ステップS45に進み、制御回路65は、補正値△を、前回と逆に変化させるように指示する制御信号を、補正回路32に出力し、ステップS41に戻る。
なお、減少し続けていた誤差情報が、あるタイミングで上昇するようになったときは、制御回路65は、補正値△を、いままでの場合の、例えば1/2の大きさで、前回と逆に変化させるように指示する制御信号を出力するようになされている。
そして、ステップS41乃至S45の処理を繰り返すことにより、誤差情報が減少し、これにより、ステップS42において、今回の誤差情報が、所定の閾値εより小さいと判定された場合、ステップS46に進み、制御回路65は、予測係数メモリ61に記憶されているクラスごとの予測係数を読み出すとともに、補正データメモリ62に記憶されている1フレーム分の補正データを、最適補正データとして読み出し、多重化部25に供給して、処理を終了する。
その後は、次のフレームについての誤差情報が供給されるのを待って、再び、図17に示すフローチャートにしたがった処理を繰り返す。
なお、補正回路32には、第2階層の画像データの補正は、1フレームすべてのデータについて行わせるようにすることもできるし、その一部のデータについてだけ行わせるようにすることもできる。一部のデータについてだけ補正を行う場合においては、制御回路65に、例えば、誤差情報に対する影響の強い画素を検出させ、そのような画素についてのデータだけを補正するようにすることができる。誤差情報に対する影響の強い画素は、例えば、次のようにして検出することができる。即ち、まず最初に、第2階層の画像データをそのまま用いて処理を行うことにより、その誤差情報を得る。そして、第2階層の画像データを、1画素ずつ、同一の補正値△だけ補正するような処理を行わせる制御信号を、制御回路65から補正回路32に出力し、その結果得られる誤差情報を、第2階層の画像データをそのまま用いた場合に得られる誤差情報と比較し、その差が、所定値以上となる画素を、誤差情報に対する影響の強い画素として検出すれば良い。
以上のように、誤差情報を所定の閾値εより小さくする(以下にする)まで、第2階層の画像データの補正が繰り返され、誤差情報が所定の閾値εより小さくなったときにおける補正データが、画像の符号化結果として出力されるので、受信装置4(図1)においては、間引き後の画像を構成する画素の画素値を、元の画像を復元するのに最も適当な値にした補正データ(最適補正データ)から、原画像と同一(ほぼ同一)の復号画像を得ることが可能となる。
また、画像は、間引き処理により圧縮される他、ADRC処理およびクラス分類適応処理などによっても圧縮されるため、非常に高圧縮率の符号化データを得ることができる。なお、送信装置1における、以上のような符号化処理は、間引きによる圧縮処理と、クラス分類適応処理とを、いわば有機的に統合して用いることにより、高能率圧縮を実現するものであり、このことから統合符号化処理ということができる。
次に、図18は、図1の受信装置4の構成例を示している。
信号処理回路71には、記録媒体2に記録された符号化データが再生され、または伝送路3を介して伝送されてくる符号化データが受信されて供給される。信号処理回路71においては、そこに供給される符号化データが受信され、第1階層乃至第3階層の符号化データに分離されて、誤り訂正処理その他が施される。さらに、信号処理部71は、第3階層の符号化データの中から、第1階層の予測係数をコピーし、第2階層の符号化データの中に含め、その後、第1階層乃至第3階層の符号化データを出力する。
第1階層の符号化データは、そのまま第1階層の復号画像として出力される。また、第2階層または第3階層の符号化データは、予測部72または73にそれぞれ出力される。
予測部72では、第2階層の符号化データに基づいて、第1階層の画像の予測値が求められ、第1階層の復号画像として出力される。また、予測部72では、第3階層の符号化データに基づいて、やはり、第1階層の予測値が求められて出力される。
次に、図19は、予測部72の構成例を示している。
信号処理回路71(図18)からの第2階層の符号化データは、分離部81に供給され、そこで、第2階層の最適補正データと、第1階層のクラスごとの予測係数とに分離され、デコード部80に供給される。
デコード部80は、クラス分類用ブロック化回路82、予測値計算用ブロック化回路83、ADRC処理回路84、クラス分類回路85、および予測回路86で構成されており、分離部81からの第2階層の最適補正データは、クラス分類用ブロック化回路82および予測値計算用ブロック化回路83に入力され、また、第1階層のクラスごとの予測係数は、予測回路86に入力される。そして、予測回路86では、その第1階層のクラスごとの予測係数が、その内蔵するメモリ86Aに記憶される。
クラス分類用ブロック化回路82、予測値計算用ブロック化回路83、ADRC処理回路84、またはクラス分類回路85は、図9におけるクラス分類用ブロック化回路41、予測値計算用ブロック化回路42、ADRC処理回路44、またはクラス分類回路45それぞれと同様に構成されており、従って、これらのブロックにおいては、図9における場合と同様の処理が行われ、これにより、予測値計算用ブロック化回路83からは第2階層の最適補正データで構成される予測値計算用ブロックが出力され、また、クラス分類回路85からはクラス情報が出力される。これらの予測値計算用ブロックおよびクラス情報は、予測回路86に供給される。
予測回路86では、クラス分類回路85から供給されるクラス情報に対応した25×9の予測係数が、メモリ86Aから読み出され、その25×9の予測係数と、予測値計算用ブロック化回路83から供給される5×5画素の予測値計算用ブロックを構成する最適補正データとを用い、式(1)にしたがって、第1階層の予測値が、3×3画素単位で算出されていく。そして、1フレーム分の予測値が求められると、これが、第1階層の復号画像として出力される。
第2階層の最適補正データは、上述したようにそれにより予測を行うことで得られる第1階層の予測値と、第1階層の画像との誤差とを閾値ε以下とするものであり、従って、第2階層の最適補正データによれば、解像度の高い第1階層の復号画像を得ることが可能となる。
次に、図20は、図18の予測部73の構成例を示している。
信号処理回路71(図18)からの第3階層の符号化データは、分離部81に供給され、そこで、第3階層の最適補正データ、第2階層のクラスごとの予測係数、および第1階層のクラスごとの予測係数に分離される。第3階層の最適補正データと第2階層のクラスごとの予測係数は、デコード部222に供給され、第1階層のクラスごとの予測係数はデコード部223に供給される。
デコード部222は、図19のデコード部80と同様に構成されるものであり、従って、デコード部222では、第3階層の最適補正データと第2階層のクラスごとの予測係数とから、上述した場合と同様にして、第2階層の画像の予測値が算出され、そのような予測値で構成される第2階層の1フレーム分の復号画像(予測値)が、デコード部223に供給される。デコード部223も、デコード部80と同様に構成されるものであり、従って、第2階層の予測値と第1階層のクラスごとの予測係数とから、第1階層の予測値が算出され、そのような予測値で構成される1フレーム分の画像が、第1階層の復号画像(予測値)として出力される。
第2階層のクラスごとの予測係数は、図2の最適補正データ算出回路14において、第2階層の最適補正データとして最適なものが得られるように算出されたものであり、また、第2階層の最適補正データによれば、上述したように解像度の高い第1階層の復号画像を得ることができるから、第3階層の符号化データによっても、解像度の高い第1階層の復号画像を得ることができる。
以上から、第1階層および第2階層の符号化データの一部またはすべてが、何らかの理由で失われても、最下位階層である第3階層の符号化データ、即ち、第3階層の最適補正データ並びに第1階層および第2階層のクラスごとの予測係数により、解像度の高い復号画像を得ることが可能となる。
また、受信側が、第2および第3階層の符号化データ(第2階層および第3階層の最適補正データ並びに第1および第2階層のクラスごとの予測係数)しか受信できないものであっても、高解像度の復号画像(第1階層の画像)を得ることができる。さらに、第3階層の符号化データしか受信することができない受信装置であっても、やはり、高解像度の復号画像を得ることができる。
なお、上述の場合においては、第2階層の符号化データの中に、第2階層の最適補正データを含めるようにしたが、第2階層の符号化データの中には、第2階層の最適補正データではなく、第2階層の画像データそのものを含めるようにすることが可能である。
また、信号処理回路15から出力される符号化データには、第1階層乃至第3階層の符号化データを含めるようにしたが、上述したように、第3階層の符号化データ(第3階層の最適補正データ並びに第1階層および第2階層のクラスごとの予測係数)だけから、高画質の復号画像を得ることができるので、信号処理回路15から出力される符号化データには、第3階層の符号化データだけを含めるようにすることが可能である。
さらに、図2においては、最適補正データ算出回路14に、最適補正データ算出回路13が出力する第2階層の最適補正データを供給し、その第2階層の最適補正データを得るために最適なクラスごとの予測係数を求めるようにしたが、最適補正データ算出回路14には、第2階層の最適補正データの代わりに、第2階層の画像データそのものを供給し、第2階層の画像データを得るのに最適なクラスごとの予測係数を求めるようにすることも可能である。
ところで、上述の場合においては、図9のローカルデコード部22において第1階層のクラスごとの予測係数(最適補正データ算出回路14を構成するローカルデコード部22においては第2階層のクラスごとの予測係数)を求め、それを用いて、第1階層の予測値を算出するようにしたが、予測値は、クラスごとの予測係数を求めずに(あらかじめ学習により求めておいた予測係数を用いて)算出するようにすることが可能である。
即ち、図21は、図2の最適補正データ算出回路13(14)の第2の構成例を示している。なお、図中、図5における場合と対応する部分については、同一の符号を付してある。即ち、この最適補正データ算出回路13は、ローカルデコード部22に代えて、ローカルデコード部1022が設けられている他は、図5における場合と同様に構成されている。
但し、図5においては、ローカルデコード部22に原画像データ(最適補正データ算出回路13においては第1階層の画像、最適補正データ算出回路14においては第2階層の最適補正データ)が供給されるようになされていたが、図21においては、ローカルデコード部1022には、原画像データが供給されないようになっている。
図22は、図21のローカルデコード部1022の構成例を示している。なお、図中、図9における場合と対応する部分については、同一の符号を付してある。即ち、ローカルデコード部1022は、適応処理回路46に代えて、予測係数ROM88および予測回路89が設けられている他は、図9におけるローカルデコード部22と同様に構成されている。
予測係数ROM88は、あらかじめ学習(後述する)を行うことにより求められたクラスごとの25×9個の予測係数を記憶しており、クラス分類回路45が出力するクラス情報を受信し、そのクラス情報に対応するアドレスに記憶されている予測係数を読み出して、予測回路89に供給する。
予測回路89では、予測値計算用ブロック化回路42からの5×5画素の予測値計算用ブロックと、予測係数ROM88からの25×9の予測係数とを用いて、式(1)(具体的には、例えば、式(8))に示した線形1次式が計算され、これにより、元の画像の予測値が、3×3画素単位で算出される。
従って、図22のクラス分類適応処理回路43によれば、元の画像(原画像)を用いずに、その予測値が算出される。このため、上述したように、ローカルデコード部1022には、原画像(第1階層の画像または第2階層の最適補正データ)が供給されないようになっている(供給する必要がないので、供給されない)。
次に、図23のフローチャートを参照して、図22のローカルデコード部1022の処理についてさらに説明する。
ローカルデコード部1022においては、まず最初に、ステップS1021乃至S1023において、図13のステップS21乃至S23における場合とそれぞれ同様の処理が行われ、これにより、クラス分類回路45からは、クラス情報が出力され、予測値計算用ブロック化回路42からは、予測値計算用ブロックが出力される。このクラス情報または予測値計算用ブロックは、予測係数ROM88または予測回路89にそれぞれ供給される。
予測係数ROM88は、クラス情報を受信すると、ステップS1024において、そのクラス情報に対応する25×9の予測係数を、記憶しているクラスごとの予測係数の中から読み出し、予測回路89に供給する。
予測回路89には、予測係数ROM88から25×9の予測係数が供給される他、上述したように、予測値計算用ブロック化回路42から5×5画素の予測値計算用ブロックも供給される。そして、予測回路89では、ステップS1025において、予測係数ROM88からの25×9の予測係数と、予測値計算用ブロック化回路42からの5×5画素の予測値計算用ブロックとを用いて適応処理が行われることにより、即ち、具体的には、式(1)(または式(8))にしたがった演算が行われることにより、注目補正データ(ここでは、予測値計算用ブロックの中心にある画素)を中心とする3×3の原画像の画素の予測値が求められる。
その後、例えば、1フレーム分の予測値が求められると、ステップS1026に進み、予測係数ROM88に記憶されたクラスごとの25×9の予測係数が読み出され、判定部24に供給されるとともに、ステップS1025で求められた予測値が誤差算出部23に供給される。そして、ステップS1021に戻り、以下同様の処理が、例えば、1フレーム単位で繰り返される。
なお、この実施の形態では、クラスごとの予測係数は、予測係数ROM88に記憶されたものが使用され、従って、その値は変化しないから、ステップS1025において、クラスごとの予測係数を、判定部24に一度供給した後は、基本的に、再度供給する必要はない。
また、最適補正データ算出回路13および14が、図21に示したように構成される場合においても、受信装置4は、図18に示したように構成することで、原画像とほぼ同一の復号画像を得ることができる。
次に、図24は、図22の予測係数ROM88に記憶されているクラスごとの予測係数を得るための学習を行う画像処理装置の構成例を示している。
学習用ブロック化回路91および教師用ブロック化回路92には、あらゆる画像に適用可能な予測係数を得るための学習用の画像データ(学習用画像)が供給されるようになされている。なお、第1階層のクラスごとの予測係数を得る場合には、学習用画像として、第1階層の画像データが、また、第2階層のクラスごとの予測係数を得る場合には、学習用画像として、第2階層の画像データが、学習用ブロック化回路91および教師用ブロック化回路92に供給される。
学習用ブロック化回路91は、入力される画像データから、例えば、図10に●印で示した位置関係の注目画素を中心とする25画素(5×5画素)を抽出し、この25画素で構成されるブロックを、学習用ブロックとして、ADRC処理93および学習データメモリ96に供給する。
また、教師用ブロック化回路92では、入力される画像データから、例えば、注目画素を中心とする3×3の9画素で構成されるブロックが生成され、この9画素で構成されるブロックが、教師用ブロックとして、教師データメモリ98に供給される。
なお、学習用ブロック化回路91において、例えば、図10に●印で示した位置関係の25画素で構成される学習用ブロックが生成されるとき、教師用ブロック化回路92では、同図に四角形で囲んで示す3×3画素の教師用ブロックが生成されるようになされている。この場合、注目画素は、画素X33である。
ADRC処理回路93は、学習用ブロックを構成する25画素から、その中心の9画素(3×3画素)を抽出し、この9画素でなるブロックに対して、図22のADRC処理回路44における場合と同様に、1ビットのADRC処理を施す。ADRC処理の施された、3×3画素のブロックは、クラス分類回路94に供給される。クラス分類回路94では、図22のクラス分類回路45における場合と同様に、ADRC処理回路93からのブロックがクラス分類処理され、それにより得られるクラス情報が、スイッチ95の端子aを介して、学習データメモリ96および教師データメモリ98に供給される。
学習データメモリ96または教師データメモリ98では、そこに供給されるクラス情報に対応するアドレスに、学習用ブロック化回路91からの学習用ブロックまたは教師用ブロック化回路92からの教師用ブロックが、それぞれ記憶される。
従って、学習データメモリ96において、例えば、図10に●印で示した5×5画素でなるブロックが学習用ブロックとして、あるアドレスに記憶されたとすると、教師データメモリ98においては、そのアドレスと同一のアドレスに、同図において、四角形で囲んで示す3×3画素のブロックが、教師用ブロックとして記憶される。
以下、同様の処理が、あらかじめ用意されたすべての学習用の画像について繰り返され、これにより、学習用ブロックと、図22のローカルデコード部1022において、その学習用ブロックを構成する25画素と同一の位置関係を有する25の補正データで構成される予測値計算用ブロックを用いて予測値が求められる9画素で構成される教師用ブロックとが、学習用データメモリ96と、教師用データメモリ98とにおいて、同一のアドレスに記憶される。
なお、学習用データメモリ96と教師用データメモリ98においては、同一アドレスに複数の情報を記憶することができるようになされており、これにより、同一アドレスには、複数の学習用ブロックと教師用ブロックを記憶することができるようになされている。
学習用画像すべてについての学習用ブロックと教師用ブロックとが、学習データメモリ96と教師データメモリ98に記憶されると、端子aを選択していたスイッチ95が、端子bに切り替わり、これにより、カウンタ97の出力が、アドレスとして、学習データメモリ96および教師データメモリ98に供給される。カウンタ97は、所定のクロックをカウントし、そのカウント値を出力しており、学習データメモリ96または教師データメモリ98では、そのカウント値に対応するアドレスに記憶された学習用ブロックまたは教師用ブロックが読み出され、演算回路99に供給される。
従って、演算回路99には、カウンタ97のカウント値に対応するクラスの学習用ブロックのセットと、教師用ブロックのセットとが供給される。
演算回路99は、あるクラスについての学習用ブロックのセットと、教師用ブロックのセットとを受信すると、それらを用いて、最小自乗法により、誤差を最小とする予測係数を算出する。
即ち、例えば、いま、学習用ブロックを構成する画素の画素値を、x1,x2,x3,・・・とし、求めるべき予測係数をw1,w2,w3,・・・とするとき、これらの線形1次結合により、教師用ブロックを構成する、ある画素の画素値yを求めるには、予測係数w1,w2,w3,・・・は、次式を満たす必要がある。
y=w11+w22+w33+・・・
そこで、演算回路99では、同一クラスの学習用ブロックと、対応する教師用ブロックとから、真値yに対する、予測値w11+w22+w33+・・・の自乗誤差を最小とする予測係数w1,w2,w3,・・・が、上述した式(7)に示
す正規方程式をたてて解くことにより求められる。以上の処理が、クラスごとに行われることで、各クラスごとに、25×9個の予測係数が算出される。
演算回路99において求められた、クラスごとの予測係数は、メモリ100に供給される。メモリ100には、演算回路99からの予測係数の他、カウンタ97からカウント値が供給されており、これにより、メモリ100においては、演算回路99からの予測係数が、カウンタ97からのカウント値に対応するアドレスに記憶される。
以上のようにして、メモリ100には、各クラスに対応するアドレスに、そのクラスのブロックの3×3画素を予測するのに最適な25×9個の予測係数が記憶される。
図22の予測係数ROM88には、以上のようにしてメモリ100に記憶されたクラスごとの予測係数が記憶されている。
次に、図25は、図2の最適補正データ算出回路13(14)の第3の構成例を示している。なお、図中、図5における場合と対応する部分については、同一の符号を付してある。即ち、この送信装置1は、ローカルデコード部22または判定部24に代えて、ローカルデコード部2022または判定部2024がそれぞれ設けられているとともに、多重化部25が設けられていない他は、図5における場合と同様に構成されている。
但し、この場合も、図22における場合と同様に、ローカルデコード部2022には、原画像データ(第1階層の画像データまたは第2階層の最適補正データ)が供給されないようになっている。さらに、図25の実施の形態では、ローカルデコード部2022は、予測係数を判定部2024に出力しないようになっている。
次に、図26のフローチャートを参照して、その動作について説明する。
圧縮部21に対して、画像データ(第2階層の画像データまたは第3階層の画像データ)が供給されると、圧縮部21は、ステップS1001において、その画像データを間引くことにより圧縮し、最初は、補正を行わずに、ローカルデコード部2022および判定部2024に出力する。ローカルデコード部2022では、ステップS1002において、圧縮部21からの補正データ(最初は、上述したように、画像データを、単純に間引いた圧縮データそのもの)がローカルデコードされる。
即ち、ステップS1002では、圧縮部21からの補正データが、例えば、図22に示したローカルデコード部1022における場合と同様にして、ローカルデコードされ、これにより、原画像の予測値が算出される。この予測値は、誤差算出部23に供給される。
誤差算出部23では、ステップS1003において、図6のステップS3における場合と同様にして、予測誤差が算出され、誤差情報として、判定部2024に供給される。判定部2024は、誤差算出部23から誤差情報を受信すると、ステップS1004において、図6のステップS4における場合と同様に、誤差算出部23からの誤差情報が所定の閾値ε以下であるかどうかを判定する。ステップS1004において、誤差情報が所定の閾値ε以下でないと判定された場合、ステップS1005に進み、判定部2024は、圧縮部21を制御し、これにより、第2階層の画像データを補正させる。そして、圧縮部21において、第2階層の画像データが補正され、新たな補正データが出力されるのを待って、ステップS1002に戻る。
一方、ステップS1004において、誤差情報が所定の閾値ε以下であると判定された場合、判定部2024は、所定の閾値ε以下の誤差情報が得られたときの補正データを、最適補正データとして、信号処理回路15(図2)に出力し、処理を終了する。
従って、ここでは、クラスごとの予測係数は出力されない。
次に、図27は、図25のローカルデコード部2022の構成例を示している。なお、図中、図22における場合と対応する部分については、同一の符号を付してある。即ち、ローカルデコード部2022は、基本的に図22におけるローカルデコード部1022と同様に構成されている。
但し、図22においては、予測係数ROM88がそこに記憶されているクラスごとの予測係数を、判定部24に供給するようになっていたが、図27では、予測係数ROM88は、クラスごとの予測係数を、判定部2024に供給しないようになっている。
次に、図28のフローチャートを参照して、その動作について説明する。
ローカルデコード部2022では、ステップS2021乃至S2025において、図23のステップS1021乃至1025における場合とそれぞれ同様の処理が行われる。そして、ステップS2026において、ステップS2025で求められた予測値のみが、誤差算出部23に供給され、ステップS2021に戻り、以下、同様の処理が、例えば、1フレーム単位で繰り返される。即ち、上述したように、ここでは、クラスごとの予測係数は出力されない。
次に、図29は、図25の判定部2024の構成例を示している。なお、図中、図16における場合と対応する部分については、同一の符号を付してある。即ち、上述したように、ローカルデコード部2022からは予測係数が供給されないため、判定部2024には、その予測係数を記憶するための予測係数メモリ61が設けられておらず、そのことを除けば、基本的に、図16の判定部24と同様に構成されている。
次に、図30のフローチャートを参照して、その動作について説明する。
判定部2024では、ステップS2041乃至2045において、図17のステップS41乃至S45における場合とそれぞれ同様の処理が行われ、これにより、誤差情報が減少するように、圧縮部21が制御される。
そして、ステップS2041乃至S2045の処理を繰り返すことにより、誤差情報が減少し、これにより、ステップS2042において、今回の誤差情報が、所定の閾値εより小さいと判定された場合、ステップS2046に進み、制御回路65は、補正データメモリ62に記憶されている1フレームの補正データを、最適補正データとして読み出し、信号処理回路15に供給して、処理を終了する。即ち、ローカルデコード部2022からは予測係数は供給されないので、ステップS2046では、補正データだけが出力される。
その後は、次のフレームについての誤差情報が供給されるのを待って、再び、同様の処理を繰り返す。
次に、図31は、最適補正データ算出回路13および14が図25に示したように構成される場合の図18の受信装置4における予測部72の構成例を示している。なお、図中、図19における場合と対応する部分については、同一の符号を付してある。即ち、図31の予測部72は、クラス分類回路85と予測回路86との間に予測係数ROM87が新たに設けられ、予測回路86がメモリ86Aを内蔵しておらず、かつ分離部81が設けられていない他は、図19における場合と基本的に同様に構成されている。
最適補正データ算出回路13(14)が図25に示したように構成される場合、上述したことから、第2階層の符号化データには、第2階層のクラスごとの予測係数は含まれておらず、第2階層の符号化データは、基本的に、第2階層の最適補正データだけで構成される。このため、信号処理回路71(図18)からの第2階層の符号化データとしての第2階層の最適補正データは、クラス分類用ブロック化回路82および予測値計算用ブロック化回路83に、直接供給される(分離部81(図19)を介さずに供給される)。
クラス分類用ブロック化回路82、予測値計算用ブロック化回路83,ADRC処理回路84、またはクラス分類回路85では、図9におけるクラス分類用ブロック化回路41、予測値計算用ブロック化回路42,ADRC処理回路44、またはクラス分類回路45それぞれと同様の処理が行われ、これにより、予測値計算用ブロック化回路83からは5×5画素の予測値計算用ブロックが出力され、また、クラス分類回路85からはクラス情報が出力される。予測値計算用ブロックは予測回路86に供給され、クラス情報は予測係数ROM87に供給される。
予測係数ROM87には、図27の予測係数ROM88に記憶されているクラスごとの予測係数と同一のものが記憶されており、クラス分類回路85からクラス情報が供給されると、そのクラス情報に対応した25×9の予測係数が読み出され、予測回路86に供給される。
予測回路86は、予測係数ROM87からの25×9の予測係数と、予測値計算用ブロック化回路83から供給される5×5画素の予測値計算用ブロックを構成する補正データとを用い、式(1)にしたがって、原画像の3×3画素の予測値を算出し、そのような予測値で構成される1フレームの画像を、復号画像として出力する。
次に、図32は、最適補正データ算出回路13および14が図25に示したように構成される場合の図18の受信装置4における予測部73の構成例を示している。
この場合、予測部73は、デコード部1222および1223で構成される。
最適補正データ算出回路13(14)が図25に示したように構成される場合、上述したことから、第3階層の符号化データにも、第1および第2階層のクラスごとの予測係数は含まれておらず、従って、第3階層の符号化データは、基本的に、第3階層の最適補正データだけで構成される。このような第3階層の符号化データとしての第3階層の最適補正データが、信号処理回路71からデコード部1222に供給される。
デコード部1222は、図31の予測部72と同様に構成されるものであり、従って、デコード部1222では、第3階層の最適補正データから、上述した場合と同様にして、第2階層の画像の予測値が算出され、そのような予測値で構成される第2階層の1フレーム分の復号画像(予測値)が、デコード部1223に供給される。デコード部1223も、図31の予測部72と同様に構成されるものであり、従って、第2階層の予測値から、第1階層の予測値が算出され、そのような予測値で構成される1フレーム分の画像が、第1階層の復号画像(予測値)として出力される。
なお、デコード部1222と1223は、基本的には、上述したように、いずれも予測部72と同様に構成されるが、予測係数ROM87には、デコード部1222においては第2階層の画像を学習用画像として用いて学習したクラスごとの予測係数が、デコード部1223においては第1階層の画像を学習用画像として用いて学習したクラスごとの予測係数が、それぞれ記憶されている。
最適補正データ算出回路13および14が図25に示したように構成されるとともに、受信装置4の予測部72または73がそれぞれ図31または図32に示したように構成される場合、クラスごとの25×9の予測係数を送受信せずに済むので、その分だけ、伝送容量または記録容量を低減することができる。
なお、予測係数ROM87(図31)や88(図22、図27)には、各クラスに対応するアドレスに、予測係数を記憶させるのではなく、教師用ブロックを構成する画素値の平均値などを記憶させるようにすることが可能である。この場合、クラス情報が与えられると、そのクラスに対応する画素値が出力されることになり、図22のローカルデコード部1022や、図27のローカルデコード部2022においては、予測値計算用ブロック化回路42および予測回路89を設けずに済むようになる。また、図31の予測部72においても、予測値計算用ブロック化回路83および予測回路86を設けずに済むようになる。さらに、この場合、図22においては、予測係数を伝送する必要がない。
また、最適補正データ算出回路13および14を図25に示したように構成する場合においては、上述したように、図2に示した送信装置1において、最適補正データ算出回路13には第1階層の画像データを供給する必要はなく、また、最適補正データ算出回路14にも、最適補正データ算出回路13から出力される第2階層の最適補正データを供給する必要はない。そして、この場合、クラスごとの予測係数は求められないので、信号処理回路15が出力する符号化データには、上述したように、クラスごとの予測係数は含められない。
従って、この場合、図31または図32に示した予測部72または73は、分離部81(図19)または221(図20)を設けずに構成することができる。
ここで、以下、適宜、図9で説明したように、予測係数を逐次求めて予測値を得る方式を逐次方式と、また、図22や図27で説明したように、予測係数を、あらかじめ予測係数ROM88に記憶させておき、これを用いて予測値を得る方式を、ROM方式という。
次に、図33は、図1の送信装置1の他の構成例を示している。なお、図中、図2における場合と対応する部分については、同一の符号を付してある。
即ち、この実施の形態においては、最適補正データ算出回路101には、第1階層の画像データのみが供給されるようになされており、そこでは、第1階層の画像データから第2階層の最適補正データが算出され、第2階層の符号化データとして、信号処理回路15に供給されるようになされている。また、最適補正データ算出回路102には、間引き回路11が出力する第2階層の画像データのみが供給されるようになされており、そこでは、第2階層の画像データから第3階層の最適補正データが算出され、第3階層の符号化データとして、信号処理回路15に供給されるようになされている。
次に、図34は、図33の最適補正データ算出回路101の構成例を示している。なお、最適補正データ算出回路102も、最適補正データ算出回路101と同様に構成されるため、その説明は省略する。
ブロック化回路111には、第1階層の画像データ(最適補正データ算出回路102における場合には、第2階層の画像データ)が入力されるようになされており、ブロック化回路111は、第1階層の画像データを、その性質に応じて所定のクラスに分類するための単位である、注目画素を中心とするクラス分類用ブロックにブロック化し、ADRC処理回路112および遅延回路115に供給するようになされている。
ADRC処理回路112は、ブロック化回路111からのブロック(クラス分類用ブロック)に対してADRC処理を施し、その結果得られるADRCコードで構成されるブロックを、クラス分類回路113に供給するようになされている。
クラス分類回路113は、ADRC処理回路112からのブロックを、その性質に応じて所定のクラスに分類するクラス分類処理を行い、そのブロック(そのブロックを構成する注目画素)がいずれのクラスに属するかを、クラス情報として、マッピング係数メモリ114に供給するようになされている。
マッピング係数メモリ114は、後述するような学習(マッピング係数学習)により得られるマッピング係数を、クラス情報ごとに記憶しており、クラス分類回路113から供給されるクラス情報をアドレスとして、そのアドレスに記憶されているマッピング係数を読み出し、演算回路116に供給するようになされている。
遅延回路115は、ブロック化回路111から供給されるブロックを、そのブロックのクラス情報に対応するマッピング係数が、マッピング係数メモリ114から読み出されるまで遅延し、演算回路116に供給するようになされている。
演算回路116は、遅延回路115から供給されるブロックを構成する画素の画素値と、マッピング係数メモリ114から供給される、そのブロックのクラスに対応するマッピング係数とを用いて所定の演算を行うことにより、画像を、その画素数を間引いて(少なくして)符号化した符号化データ(第1階層の画像の画素数を少なくした第2階層の最適補正データ)を算出するようになされている。即ち、演算回路116は、ブロック化回路111が出力するブロックを構成する各画素の画素値をy1,y2,・・・とするとともに、マッピング係数メモリ114が出力する、そのブロックのクラスに対応するマッピング係数をk1,k2,・・・とするとき、それらを引数とする所定の関数値f(y1,y2,・・・,k1,k2,・・・)を演算し、その関数値f(y1,y2,・・・,k1,k2,・・・)を、ブロック化回路111が出力するブロック(クラス分類用ブロック)を構成する画素のうちの、例えば中心の画素の画素値として出力するようになされている。
従って、ブロック化回路111が出力するクラス分類用ブロックを構成する画素数をN画素とすると、演算回路16は、画像データを1/Nに間引き、これを、符号化データとして出力するようになされている。
なお、演算回路116が出力する符号化データは、N画素で構成されるブロックの中心の画素を抽出して出力するような、いわば単純な間引き処理により得られるものではなく、上述したように、そのブロックを構成するN画素により規定される関数値f(y1,y2,・・・,k1,k2,・・・)であるが、この関数値f(y1,y2,・・・,k1,k2,・・・)は、見方を変えれば、単純な間引き処理により得られる、ブロックの中心の画素の画素値を、その周辺の画素値に基づいて、元の画像を得るのに最適な値に補正したものと考えることができる。そこで、マッピング係数と、ブロックを構成する画素との演算の結果得られるデータも、以下、適宜、最適補正データという。
また、演算回路116における演算処理は、ブロック化回路111が出力するクラス分類用ブロックを構成する各画素の画素値を、関数値f(y1,y2,・・・,k1,k2,・・・)にマッピング(写像)する処理とも考えることができる。そこで、そのような処理に用いられる係数k1,k2,・・・をマッピング係数と呼んでいる。
次に、図35のフローチャートを参照して、その動作について説明する。
ブロック化回路111には、例えば、1フレーム単位で、第1階層の画像データが供給されるようになされており、ブロック化回路111では、ステップS101において、1フレームの第1階層の画像が、クラス分類用ブロックにブロック化される。即ち、ブロック化回路111は、例えば、図10に四角形で囲んで示すように、第1階層の画像データを、注目画素を中心とする3×3(横×縦)の9画素でなるクラス分類用ブロックに分割し、ADRC処理回路112および遅延回路115に、順次供給する。
なお、この場合、クラス分類用ブロックは、3×3画素でなる正方形状のブロックで構成されることとなるが、クラス分類用ブロックの形状は、正方形である必要はなく、その他、例えば、長方形や、十文字形、その他の任意な形とすることが可能である。また、クラス分類用ブロックを構成する画素数も、3×3の9画素に限定されるものではない。さらに、クラス分類用ブロックは、隣接する画素どうしで構成するのではなく、離れた画素どうしで構成するようにすることも可能である。但し、その形状および画素数は、後述する学習(マッピング係数学習)時における場合のものと一致している必要がある。
ADRC処理回路112は、ブロック化回路111からクラス分類用ブロックを受信すると、ステップS102において、そのブロックに対して、例えば、1ビットのADRC処理を施し、これにより、1ビットで表現される画素で構成されるブロックとする。ADRC処理の施されたクラス分類用ブロックは、クラス分類回路113に供給される。
クラス分類回路113では、ステップS103において、ADRC処理回路112からのクラス分類用ブロックがクラス分類され、その結果得られるクラス情報が、マッピング係数メモリ114に、アドレスとして供給される。これにより、ステップS104において、マッピング係数メモリ114からは、クラス分類回路113より供給されたクラス情報に対応するマッピング係数が読み出され、演算回路116に供給される。
一方、遅延回路115では、ブロック化回路111からのクラス分類用ブロックが遅延され、そのブロックのクラス情報に対応するマッピング係数が、マッピング係数メモリ114から読み出されるのを待って、演算器116に供給される。演算器116では、ステップS105において、遅延回路115からのクラス分類用ブロックを構成する各画素の画素値と、マッピング係数メモリ114からのマッピング係数を用いて、上述した関数値f(・)(この関数fのかっこ内の・は、画素値y1,y2,・・・と、マッピング係数k1,k2,・・・の集合を表すものとする)が演算されることにより、クラス分類用ブロックを構成する中心の画素(中心画素)の画素値を最適なものに補正した最適補正データが算出される。この最適補正データは、ステップS106において、第2階層の符号化データとして、信号処理回路15(図33)に出力される。
そして、ステップS107に進み、1フレーム分の第1階層の画像データについての処理が終了したかどうかが判定される。ステップS107において、1フレーム分の第1階層の画像データについての処理が、まだ終了していないと判定された場合、ステップS102に戻り、次のクラス分類用ブロックを対象に、ステップS102以下の処理が繰り返される。また、ステップS107において、1フレーム分の第1階層の画像データについての処理が終了したと判定された場合、ステップS101に戻り、次のフレームを対象に、ステップS101以下の処理が繰り返される。
次に、図36は、図34のマッピング係数メモリ114に記憶されているマッピング係数を算出するための学習(マッピング係数学習)処理を行う画像処理装置の構成例を示している。
メモリ121には、学習に適した第1階層の画像データ(以下、適宜、学習用画像という)が1フレーム以上記憶されている。なお、最適補正データ算出回路102(図33)を構成するマッピング係数メモリ114に記憶させるマッピング係数を算出する場合には、メモリ121には、第2階層の画像データが記憶される。
ブロック化回路122は、メモリ121に記憶されている画像データを読み出し、図34のブロック化回路111から出力されるクラス分類用ブロックと同一のブロックを構成して、ADRC処理回路123および演算回路126に供給するようになされている。
ADRC処理回路123またはクラス分類回路124は、図34のADRC処理回路112またはクラス分類回路113における場合とそれぞれ同様の処理を行うようになされている。従って、クラス分類回路124からは、ブロック化回路122が出力するブロックのクラス情報が出力されるようになされている。そして、このクラス情報は、マッピング係数メモリ131に、アドレスとして供給されるようになされている。
演算器126は、ブロック化回路122から供給されるブロックを構成する画素と、マッピング係数メモリ131から供給されるマッピング係数とを用いて、図34の演算回路116における場合と同一の演算を行い、その結果得られる補正データ(関数値f(・))を、ローカルデコード部127に供給するようになされている。
ローカルデコード部127は、演算回路126から供給される補正データに基づいて、元の学習用画像の予測値(ブロック化回路122が出力するブロックを構成する画素の画素値の予測値)を、上述したROM方式または逐次方式により予測し(算出し)、誤差算出部128に供給するようになされている。なお、予測値を、逐次方式により求める場合においては、ローカルデコード部127には、クラスごとの予測係数を求めるために、メモリ121に記憶された学習用の画像が供給される(ここでは、例えば、ROM方式によることとしているため、学習用の画像はローカルデコード部127に供給されていない)。
誤差算出部128は、ローカルデコード部127から供給される予測値に対応する学習用画像の画素値(真値)をメモリ121から読み出し、その学習用画像の画素値に対する、予測値の予測誤差を算出(検出)し、その予測誤差を、誤差情報として、判定部129に供給するようになされている。
判定部129は、誤差算出部128からの誤差情報と、所定の閾値ε1とを比較し、その比較結果に対応して、マッピング係数設定回路130を制御するようになされている。マッピング係数設定回路130は、判定部129の制御にしたがって、クラス分類回路124におけるクラス分類の結果得られるクラス数と同一の数のマッピング係数のセットを設定(変更)し、マッピング係数メモリ131に供給するようになされている。
マッピング係数メモリ131は、マッピング係数設定回路30から供給されるマッピング係数を一時記憶するようになされている。なお、マッピング係数メモリ131は、クラス分類回路124においてクラス分類されるクラスの数だけのマッピング係数(マッピング係数のセット)を記憶することのできる記憶領域を有しており、各記憶領域においては、マッピング係数設定回路130から、新たなマッピング係数が供給されると、既に記憶しているマッピング係数に代えて、その新たなマッピング係数が記憶されるようになされている。
また、マッピング係数メモリ131は、クラス分類回路124から供給されるクラス情報に対応するアドレスに記憶されたマッピング係数を読み出し、演算回路126に供給するようにもなされている。
次に、図37のフローチャートを参照して、その動作について説明する。
まず最初に、マッピング係数設定回路130は、ステップS151においてマッピング係数の初期値のセットを、クラス分類回路124においてクラス分類されるクラスの数だけ設定し、マッピング係数メモリ131に供給する。マッピング係数メモリ131では、マッピング係数設定回路130からのマッピング係数(初期値)が、対応するクラスのアドレスに記憶される。
そして、ブロック化回路122は、ステップS152において、メモリ121に記憶されている学習用画像すべてを、図34のブロック化回路111における場合と同様に、注目画素と中心とした3×3画素のブロックにブロック化する。さらに、ブロック化回路121は、そのブロックを、メモリ121から読み出し、ADRC処理回路123および演算回路126に順次供給する。
ADRC処理回路123では、ステップS153において、ブロック化回路122からのブロックに対して、図34のADRC処理回路112における場合と同様に、1ビットのADRC処理が施され、クラス分類回路124に供給される。クラス分類回路124では、ステップS154において、ADRC処理回路123から供給されたブロックのクラスが決定され、そのクラス情報が、アドレスとして、マッピング係数メモリ131に供給される。これにより、ステップS155において、マッピング係数メモリ131の、クラス分類回路124から供給されるクラス情報に対応するアドレスから、マッピング係数が読み出され、演算回路126に供給される。
演算回路126は、ブロック化回路122からブロックを受信するとともに、マッピング係数メモリ131から、そのブロックのクラスに対応するマッピング係数を受信すると、ステップS156において、そのマッピング係数と、ブロック化回路122から供給されるブロックを構成する画素の画素値とを用いて、上述の関数値f(・)を演算する。この演算結果は、ブロック化回路122から供給されるブロックの中心画素の画素値を補正した補正データとして、ローカルデコード部127に供給される。
即ち、例えば、上述の図10において、四角形で囲んで示すような3×3画素のブロックが、ブロック化回路122から出力されたものとすると、演算回路126では、同図において●印で示す画素の画素値を補正した補正データが求められ、ローカルデコード部127に出力される。
従って、演算回路126では、学習用画像を構成する画素数が、1/9に間引かれ、ローカルデコード部127に供給される。
ステップS156で補正データが算出された後は、ステップS157に進み、メモリ121に記憶されたすべての学習用画像についての補正データが求められたかどうかが判定される。ステップS157において、すべての学習用画像についての補正データが、まだ求められていないと判定された場合、ステップS153に戻り、すべての学習用画像についての補正データが求められるまで、ステップS153乃至S157の処理を繰り返す。
また、ステップS157において、すべての学習用画像についての補正データが求められたと判定された場合、即ち、メモリ121に記憶されたすべての学習用画像を、1/9に間引いた間引き画像が得られた場合(但し、この間引き画像は、学習用画像を、単純に1/9に間引いたものではなく、マッピング係数との演算により画素値が求められたものである)、ステップS158に進み、ローカルデコード部127において、その間引き画像がローカルデコードされることにより、元の学習用画像の予測値が算出される。この予測値は、誤差算出部128に供給される。
誤差算出部128では、ステップS159において、メモリ121から学習用画像が読み出され、その学習用画像に対する、ローカルデコード部127から供給される予測値の予測誤差が算出される。即ち、学習用画像の画素値をYijと表すとともに、ローカルデコード部127から出力される、その予測値をE[Yij]と表すとき、誤差算出部128では、次式で示される誤差分散(誤差の自乗和)Qが算出され、これが、誤差情報として、判定部129に供給される。
Q=Σ(Yij−E[Yij])2
但し、上式において、Σは、学習用画像の画素すべてについてのサメーションを表す。
判定部129は、誤差算出部128から誤差情報を受信すると、その誤差情報と所定の閾値ε1とを比較し、ステップS160において、その大小関係を判定する。ステップS160において、誤差情報が閾値ε1以上であると判定された場合、即ち、ローカルデコード部127において得られる予測値で構成される画像が、元の学習用画像と同一であるとは認められない場合、判定部129は、マッピング係数設定回路130に制御信号を出力する。マッピング係数設定回路130は、ステップS161において、判定部129からの制御信号にしたがい、マッピング係数を変更し、その変更後のマッピング係数を、マッピング係数メモリ131に新たに記憶させる。
そして、ステップS153に戻り、マッピング係数メモリ131に記憶された、変更後のマッピング係数を用いて、再び、ステップS153以下の処理が繰り返される。
ここで、マッピング係数設定回路130における、マッピング係数の変更は、ランダムに行っても良いし、また、今回の誤差情報が、前回の誤差情報より小さくなった場合には、前回と同様の傾向で変化させ、今回の誤差情報が、前回の誤差情報より大きくなった場合には、前回と逆の傾向で変化させるようにすることもできる。
さらに、マッピング係数の変更は、すべてのクラスについて行うようにすることもできるし、その一部のクラスについてだけ行うようにすることもできる。一部のクラスについてのマッピング係数だけの変更を行う場合においては、例えば、誤差情報に対する影響の強いクラスを検出させ、そのようなクラスについてのマッピング係数だけを変更するようにすることができる。誤差情報に対する影響の強いクラスは、例えば、次のようにして検出することができる。即ち、まず最初に、マッピング係数の初期値を用いて処理を行うことにより、その誤差情報を得る。そして、マッピング係数を、1クラスごとに同一の量だけ変化させ、その結果得られる誤差情報を、初期値を用いた場合に得られた誤差情報と比較し、その差が、所定値以上となるクラスを、誤差情報に対する影響の強いクラスとして検出すれば良い。
また、マッピング係数が、上述したk1,k2,・・・のように複数で1セットとされている場合には、その中の誤差情報に対する影響の強いものだけを変更させるようにすることもできる。
さらに、上述の場合においては、マッピング係数を、クラスごとに設定するようにしたが、マッピング係数は、その他、例えば、ブロックごとに独立して設定したり、また、近接するブロック単位などで設定したりするようにすることが可能である。
但し、マッピング係数を、例えば、ブロックごとに独立して設定するようにした場合などにおいては、ある1つのクラスに対して、複数セットのマッピング係数が得られることがある(この逆に、マッピング係数が、1セットも得られないクラスが生じることもある)。マッピング係数は、最終的には、クラスごとに決める必要があるため、上述のように、あるクラスに対して、複数セットのマッピング係数が得られた場合には、複数セットのマッピング係数を対象に、何らかの処理を行うことで、1セットのマッピング係数を決める必要がある。
一方、ステップS160において、誤差情報が閾値ε1より小さいと判定された場合、即ち、ローカルデコード部127において得られる予測値で構成される画像が、元の学習用画像と同一であると認められる場合、処理を終了する。
この時点で、マッピング係数メモリ131に記憶されている、クラスごとのマッピング係数が、もとの画像と同一と認められる復号画像(予測値)を復元することができる補正データを得るために最適なものとして、図34のマッピング係数メモリ114にセットされている。
従って、このようなマッピング係数を用いて得られる最適補正データによれば、元の画像とほぼ同一の画像を得ることが可能となる。
なお、図36の実施の形態においては、上述したように、ブロック化回路122において、画像が、注目画素を中心とした3×3の9画素にブロック化され、また、ADRC処理回路123において、1ビットのADRC処理が行われるので、クラス分類回路124によるクラス分類により得られるクラス数は512(=(219)であり、従って、512セットのマッピング係数が得られる。
次に、図38は、図34のマッピング係数メモリ114に記憶されているマッピング係数を算出するための学習(マッピング係数学習)処理を行う画像処理装置の他の構成例を示している。
なお、図36の画像処理装置によれば、関数fが、例えば、線形1次式で表される場合の他、非線形な式や、2次以上の式で表される場合も、最適な予測係数を求めることができるが、図38の画像処理装置では、関数fが、線形1次式で表される場合にのみ、最適な予測係数を求めることができるようになされている。
即ち、図38の画像処理装置は、図34において、ブロック化回路111が出力する3×3画素のブロックを構成する各画素の画素値をy1,y2,・・・,y9とするとともに、マッピング係数メモリ114が出力するマッピング係数をk1,k2,・・・,k9とする場合において、演算回路116が、次式にしたがって関数値f(y1,y2,・・・,k1,k2,・・・)を演算して補正データを求めるようになされているときに用いることができる。
f(・)=k11+k22+・・・+k99
間引き回路171には、学習に適した学習用の画像としての第1階層の画像データが、例えば1フレーム単位で供給されるようになされており、そこでは、第1階層の画像データの画素数が間引かれることにより、第2階層の画像データが形成されるようになされている。なお、最適補正データ算出回路102(図33)を構成するマッピング係数メモリ114に記憶させるマッピング係数を算出する場合には、間引き回路171には、第2階層の画像データが供給され、これにより、第3階層の画像データが形成される。
間引き回路171において得られた第2階層の画像データは、最適補正データ算出部170に供給されるようになされている。最適補正データ算出部170は、図5における補正部21、ローカルデコード部22、誤差算出部23、または判定部24(あるいは、図21における補正部21、ローカルデコード部1022、誤差算出部23、または判定部24や、図25における補正部21、ローカルデコード部2022、誤差算出部23、または判定部2024)とそれぞれ同様に構成される補正部172、ローカルデコード部173、誤差算出部174、または判定部175で構成されており、そこでは、そこに入力される画像、即ち、ここでは、第1階層の画像の画素数を少なくした第2階層の画像についての最適補正データが生成され、ラッチ回路176に供給されるようになされている。なお、ローカルデコード部173において、逐次方式により予測値を求める場合においては、クラスごとの予測係数を求めるために、元の画像(ここでは、学習用の画像としての第1階層の画像データ)が、ローカルデコード部173に供給される。
ラッチ回路176は、メモリ176Aを内蔵しており、そのメモリ176Aに、最適補正データ算出部170から供給される最適補正データを記憶させるようになされている。さらに、ラッチ回路176は、メモリ176Aに記憶された最適補正データのうち、ブロック化回路177のメモリ177Aから読み出されるブロックの中心画素に対応するものを読み出し、メモリ180に供給するようになされている。なお、ラッチ回路176は、メモリ176Aに、1フレーム分の補正データが記憶されると、その旨を示す制御信号を、ブロック化回路177に出力するようになされている。
ブロック化回路177には、間引き回路171に供給される画像データと同一の画像データ、即ち、ここでは、第1階層の画像データが、1フレーム単位で供給されるようになされている。ブロック化回路177は、メモリ177Aを内蔵しており、そのメモリ177Aに、そこに供給される学習用画像を記憶させるようになされている。また、ブロック化回路177は、ラッチ回路176から制御信号を受信すると、メモリ177Aに記憶された学習用画像を、図34のブロック化回路111における場合と同様に、注目画素と中心とする3×3画素で構成されるブロックに分割し、そのブロックを順次読み出して、ADRC処理回路178およびメモリ180に供給するようになされている。
なお、ブロック化回路177は、その内蔵するメモリ177Aからブロックを読み出すときに、そのブロックの位置を示す制御信号を、ラッチ回路176に供給するようになされている。ラッチ回路176では、この制御信号に基づいて、メモリ177Aから読み出される3×3画素のブロックが認識され、上述したように、そのブロックの中心画素に対応する最適補正データが、メモリ176Aから読み出されるようになされている。即ち、これにより、メモリ180に対しては、ある3×3画素のブロックと、そのブロックに対応する最適補正データとが同時に供給されるようになされている。
ADRC処理回路178またはクラス分類回路179は、図34のADRC処理回路112またはクラス分類回路113とそれぞれ同様に構成されている。そして、クラス分類回路179が出力する、ブロック化回路177からのブロックについてのクラス情報は、メモリ180に対して、アドレスとして供給されるようになされている。
メモリ180は、クラス分類回路179から供給されるクラス情報に対応するアドレスに、ラッチ回路176から供給される最適補正データと、ブロック化回路177から供給されるブロックとを対応付けて記憶するようになされている。なお、メモリ180は、1つのアドレスに複数の情報を記憶することができるようになされており、これにより、あるクラス情報に対応する最適補正データおよびブロックを、複数セット記憶することができるようになされている。
演算回路181は、メモリ180に記憶された、学習用画像の3×3のブロックを構成する9画素y1,y2,・・・,y9と、そのブロックに対応付けられている最適補正データy’とを読み出し、これらに最小自乗法を適用することで、クラスごとに、マッピング係数k1乃至k9を求め、メモリ182に供給するようになされている。メモリ182は、演算回路181から供給されるクラスごとのマッピング係数k1乃至k9を、そのクラスに対応したアドレスに記憶するようになされている。
次に、図39のフローチャートを参照して、その動作について説明する。
学習用画像としての第1階層の画像データが入力されると、その学習用画像は、ブロック化回路177のメモリ177Aに記憶されるとともに、間引き回路171に供給される。間引き回路171では、第1階層の画像データから第2階層の画像データが形成され、最適補正データ算出部170に供給される。
最適補正データ算出部170は、第2階層の画像データを受信すると、ステップS131において、第2階層の最適補正データを算出し、ラッチ回路176のメモリ176Aに供給して記憶させる。
そして、ラッチ回路176は、そのメモリ176Aに、1フレーム分の最適補正データを記憶すると、制御信号を、ブロック化回路177に出力する。ブロック化回路177は、ラッチ回路176から制御信号を受信すると、ステップS132において、メモリ177Aに記憶された学習用画像を、3×3画素で構成されるブロックに分割する。そして、ブロック化回路177は、メモリ177Aに記憶された学習用画像のブロックを読み出して、ADRC処理回路178およびメモリ180に供給する。
また、同時に、ブロック化回路177は、メモリ177Aからブロックを読み出すときに、そのブロックの位置を示す制御信号を、ラッチ回路176に供給し、ラッチ回路176は、その制御信号に対応して、メモリ177Aから読み出された3×3画素のブロックを認識し、そのブロックの中心画素に対応する最適補正データを読み出して、メモリ180に供給する。
そして、ステップS133に進み、ADRC処理回路178において、ブロック化回路177からのブロックがADRC処理され、さらに、クラス分類回路179において、そのブロックがクラス分類される。このクラス分類結果は、アドレスとして、メモリ180に供給される。
メモリ180では、ステップS134において、クラス分類回路179から供給されるクラス情報に対応するアドレスに、ラッチ回路176から供給される最適補正データと、ブロック化回路177から供給されるブロック(学習データ)とが対応付けられて記憶される。
そして、ステップS135に進み、メモリ180に、1フレーム分のブロックおよび最適補正データが記憶されたかどうかが判定される。ステップS135において、メモリ180に、1フレーム分のブロックおよび最適補正データが、まだ記憶されていないと判定された場合、ブロック化回路177から次のブロックが読み出されるとともに、ラッチ回路176からそのブロックに対応する最適補正データが読み出され、ステップS133に戻り、以下、ステップS133以降の処理を繰り返す。
また、ステップS135において、メモリ180に、1フレーム分のブロックおよび最適補正データが記憶されたと判定された場合、ステップS136に進み、学習用画像すべてについて処理が終了したかどうかが判定される。ステップS136において、学習用画像すべてについての処理が、まだ終了していないと判定された場合、ステップS131に戻り、次の学習用画像について、ステップS131からの処理が繰り返される。
一方、ステップS136において、学習用画像すべてについての処理が終了したと判定された場合、ステップS137に進み、演算回路181は、メモリ180に記憶された最適補正データとブロックとを、クラスごとに読み出し、これらにより、式(7)に示したような正規方程式をたてる。さらに、演算回路181は、ステップS138において、その正規方程式を解くことで、誤差を最小にする、クラスごとのマッピング係数を算出する。このマッピング係数は、ステップS139において、メモリ182に供給されて記憶され、処理を終了する。
関数fが、線形1次式で表される場合においては、以上のようにしてメモリ182に記憶されたマッピング係数を、図34のマッピング係数メモリ114に記憶させ、これを用いて最適補正データを得ることができる。
なお、クラスによっては、マッピング係数を求めることができるだけの数の正規方程式が得られない場合がある。このような場合は、図34の演算回路116において、ブロック化回路111から出力される3×3画素のブロックを構成する9画素の、例えば平均値などが出力されるようなマッピング係数、即ち、k1乃至k9=1/9などが、デフォルトの値として設定される。
ここで、送信装置1が図33に示したように構成される場合、受信装置4は図18に示したように構成される。但し、図18の受信装置4において、予測部72または73は、図31または図32に示したようにそれぞれ構成される。また、この場合、予測部72(予測部73についても同様)で用いる予測係数は、基本的に、図36のローカルデコード部127または図38のローカルデコード部173で用いられたものと同一のものを採用する必要がある。
ところで、図2の場合においては、まず、図40(A)に示すように、第1階層の画像データとの誤差(誤差情報)を、所定の閾値ε以下とする第1階層の予測値が得られる、第2階層の画像データを補正した最適補正データが、最適補正データ算出回路13において求められ、その後、同図(B)に示すように、第2階層の最適補正データとの誤差(誤差情報)を、所定の閾値ε以下とする第2階層の予測値が得られる、第3階層の画像データを補正した最適補正データが、最適補正データ算出回路14において求められるが、最下位階層である第3階層の最適補正データは、その他、例えば、図41に示すようにして求めるようにすることも可能である。
即ち、第3階層の画像データを補正した補正データから第2階層の予測値を求め、さらに、その第2階層の予測値をそのまま用いて第1階層の予測値を求める。そして、その第1階層の予測値の予測誤差(誤差情報)を所定の閾値ε以下とする補正データを、第3階層の最適補正データとする。
図42は、以上のようにして、第3階層の最適補正データを求めるようにした送信装置1の構成例を示している。なお、図中、図2における場合と対応する部分については、同一の符号を付してある。
この実施の形態においては、最適補正データ算出回路201に、第1階層乃至第3階層の画像データが供給されるようになされており、そこでは、第3階層の画像データを補正した補正データから第2階層の予測値が求められ、さらに、その第2階層の予測値をそのまま用いて第1階層の予測値を求められるようになされている。そして、最適補正データ算出回路201は、第1階層の予測値の予測誤差(誤差情報)を所定の閾値ε以下とする補正データが求められると、その補正データを、第3階層の最適補正データとし、第3階層の符号化データとして信号処理回路15に出力するようになされている。
なお、図42の実施の形態では、第1階層の画像データが、そのまま第1階層の符号化データとして信号処理回路15に供給されるようになされている。また、図42の実施の形態では、第2階層の画像データは信号処理回路15に供給されないようになっているが、第1階層と同様に、第2階層の符号化データとして、信号処理回路15に供給することも可能である。
次に、図43は、図42の最適補正データ算出回路201の構成例を示している。なお、図中、図5における場合と対応する部分については、同一の符号を付してある。即ち、最適補正データ算出回路201は、ローカルデコード部231が新たに設けられている他は、図5の最適補正データ算出回路13と基本的に同様に構成されている。
なお、この実施の形態においては、補正部21には、第3階層の画像データが入力され、その第3階層の画像データを補正した補正データが出力されるようになされている。また、ローカルデコード部22には、補正部21が出力する補正データと、第2階層の画像データとが入力されるようになされており、そこでは、第2階層の予測値が算出されて出力されるようになされている。さらに、ローカルデコード部231は、例えば、ローカルデコード部22と同様に構成され、そこには、ローカルデコード部22が出力する第2階層の予測値と、第1階層の画像データとが入力されるようになされている。そして、ローカルデコード部231では、第1階層の予測値が算出されて出力されるようになされている。
従って、この実施の形態では、ローカルデコード部22および231において、逐次方式により予測値が算出されるようになされている。但し、ローカルデコード部22および231は、例えば、図22に示したローカルデコード部1022のように構成し、ROM方式により予測値を算出するようにすることも可能である。
次に、図44のフローチャートを参照して、その動作について説明する。
補正部21に対して、第3階層の画像データが供給されると、補正部21は、ステップS201において、最初は、補正を行わずに、そのまま第3階層の画像データを、ローカルデコード部22および判定部24に出力する。ローカルデコード部22では、ステップS202において、補正部21からの補正データ(最初は、上述したように、第3階層の画像データそのもの)がローカルデコードされる。
即ち、ステップS202では、図9で説明した場合と同様にして、第2階層のクラスごとの予測係数が求められ、さらに、そのクラスごとの予測係数に基づいて、第2階層の予測値が求められ、ローカルデコード部231に供給される(但し、ローカルデコード部22がローカルデコード部1022のように構成され、これにより、第2階層の予測値がROM方式により求められる場合には、ROMから第2階層の予測係数が読み出され、その予測係数に基づいて、第2階層の予測値が求められる)。
ローカルデコード部231では、ステップS203において、ローカルデコード部22からの第2階層の予測値がローカルデコードされる。
即ち、ステップS203では、ローカルデコード部22における場合と同様にして、第1階層のクラスごとの予測係数が求められ、さらに、そのクラスごとの予測係数に基づいて、第1階層の予測値が求められ、誤差算出部23に供給される(但し、ローカルデコード部231がローカルデコード部1022のように構成され、これにより、第1階層の予測値がROM方式により求められる場合には、ROMから第1階層の予測係数が読み出され、その予測係数に基づいて、第1階層の予測値が求められる)。
以下、ステップS204乃至S207において、図6のステップS3乃至S6における場合とそれぞれ同様の処理が行われ、これにより、第1階層の予測値を閾値ε以下にする第3階層の最適補正データが求められる。
従って、このようにして得られる第3階層の最適補正データによっても、上述した場合と同様に、高画質の復号画像を得ることができる。
なお、図42の実施の形態においては、第2階層の符号化データを信号処理回路15に供給しないようにしたが、第2階層の符号化データを信号処理回路15に供給する場合においては、上述したように、第2階層の画像データそのものを第2階層の符号化データとする他、例えば、ローカルデコード部22が出力する第2階層の予測値などを、第2階層の符号化データとすることが可能である。また、例えば、図2に示した最適補正データ算出回路13を設け、そこから出力される第2階層の最適補正データを、第2階層の符号化データとすることなども可能である。
また、図42の実施の形態における場合も、信号処理回路15から出力される符号化データには、第1階層乃至第3階層の符号化データのすべてを含めるのではなく、第3階層の符号化データだけを含めるようにすることが可能である。
なお、図42に示した送信装置1から出力される符号化データについては、図18に示した受信装置4により復号が可能である。但し、図18の受信装置4において、予測部72または73は、例えば、図19または図20に示したようにそれぞれ構成する必要がある。
次に、図45は、図42の最適補正データ算出回路201の他の構成例を示している。なお、図中、図43における場合と対応する部分については、同一の符号を付してある。即ち、図45の最適補正データ算出回路201は、ローカルデコード部22または231に代えて、ローカルデコード部3022または3231がそれぞれ設けられ、多重化部25が設けられていない他は、図43における場合と基本的に同様に構成されている。
ローカルデコード部3022は、そこに入力される第3階層の画像データを補正した補正データから第2階層の予測値を、例えば、ROM方式によって算出し、ローカルデコード部3231に供給するようになされている。ローカルデコード部3231は、ローカルデコード部3022からの第2階層の予測値から第1階層の予測値を、例えば、やはり、ROM方式によって算出し、誤差算出部23に供給するようになされている。
なお、この実施の形態では、ローカルデコード部3022および3231は、いずれも、例えば、図27に示したローカルデコード部2022と同様に構成されており、従って、予測係数は、判定部24に出力されないようになっている。
次に、図46のフローチャートを参照して、その動作について説明する。
ステップS3201乃至S3206においては、基本的に、図44のステップS201乃至S206における場合とそれぞれ同様の処理が行われる。但し、ステップS3202では、ローカルデコード部3022において、図27で説明したように、予測係数ROM88から、第2階層の、必要なクラスの予測係数が読み出され、その予測係数に基づいて、第2階層の予測値が求められて、ローカルデコード部3231に供給される。また、ステップS3203でも、ステップS3202における場合と同様に、ローカルデコード部3231において、第1階層の必要なクラスの予測係数が読み出され、その予測係数に基づいて、第1階層の予測値が求められて、誤差算出部23に供給される。
そして、ステップS3205において、誤差情報が閾値ε以下であると判定された場合、即ち、第1階層の予測値を閾値ε以下にする第3階層の最適補正データが得られた場合、ステップS3207に進み、判定部24は、その第3階層の最適補正データを、信号処理回路15に出力して、処理を終了する。即ち、ローカルデコード部2022と同様に構成されるローカルデコード部3022および3231からは予測係数は出力されないため、ステップS3207では、最適補正データだけが出力される。
以上のようにして得られる第3階層の最適補正データによっても、上述した場合と同様に、高画質の復号画像を得ることができる。
なお、図42の送信装置1の最適補正データ算出回路201が図45に示したように構成される場合には、上述したことから、予測係数が送信されないため、図18の受信装置4において、予測部72または73は、例えば、図31または図32に示したようにそれぞれ構成する必要がある。
以上、本発明を適用した画像処理システムについて説明したが、このような画像処理装置は、例えば、NTSC方式などの標準方式のテレビジョン信号を符号化する場合の他、データ量の多い、いわゆるハイビジョン方式のテレビジョン信号などを符号化する場合に、特に有効である。
なお、本実施の形態においては、1フレームの画像を対象にブロック化を行うようにしたが、ブロックは、その他、例えば、時系列に連続する複数フレームにおける、同一位置の画素を集めて構成するようにすることも可能である。
また、本実施の形態においては、誤差情報として、誤差の自乗和を用いるようにしたが、誤差情報としては、その他、例えば、誤差の絶対値和や、その3乗以上したものの和などを用いるようにすることが可能である。いずれを誤差情報として用いるかは、例えば、その収束性などに基づいて決定するようにすることが可能である。
さらに、本実施の形態では、画像を、3階層に符号化するようにしたが、階層数は、3に限定されるものではない。
また、最下位階層である第3階層の最適補正データとしては、上述した場合による他、例えば、各階層の予測値の予測誤差を求め、その総和値を所定値以下にする補正データを求めるようにすることも可能である。
さらに、例えば、図13の実施の形態では、1フレーム単位で、正規方程式をたてて、クラスごとの予測係数を求めるようにしたが、予測係数の算出処理は、その他、例えば、1フィールド単位や複数フレーム単位で正規方程式をたてて行うようにすることも可能である。他の処理についても同様である。
また、本発明は、ハードウェアによっても、あるいは、上述した処理を行うためのアプリケーションプログラムが記録されたハードディスク等の記録媒体から、そのアプリケーションプログラムを読み出して、コンピュータに実行させることによっても、実現可能である。
本発明を適用した画像処理システムの一実施の形態の構成を示すブロック図である。 図1の送信装置1の第1実施の形態の構成を示すブロック図である。 図2の間引き回路11および12の処理を説明するための図である。 図2の間引き回路11および12の処理を説明するための図である。 図2の最適補正データ算出回路13(14)の第1の構成例を示すブロック図である。 図5の最適補正データ算出回路13の処理を説明するためのフローチャートである。 図5の補正部21の構成例を示すブロック図である。 図7の補正部21の動作を説明するためのフローチャートである。 図5のローカルデコード部22の構成例を示すブロック図である。 図9のクラス分類用ブロック化回路41の処理を説明するための図である。 クラス分類処理を説明するための図である。 ADRC処理を説明するための図である。 図9のローカルデコード部22の動作を説明するためのフローチャートである。 図5の誤差算出部23の構成例を示すブロック図である。 図14の誤差算出部23の動作を説明するためのフローチャートである。 図5の判定部24の構成例を示すブロック図である。 図16の判定部24の動作を説明するためのフローチャートである。 図1の受信装置4の一実施の形態の構成を示すブロック図である。 図18の予測部72の構成例を示すブロック図である。 図18の予測部73の構成例を示すブロック図である。 図2の最適補正データ算出回路13(14)の第2の構成例を示すブロック図である。 図21のローカルデコード部1022の構成例を示すブロック図である。 図22のローカルデコード部1022の処理を説明するためのフローチャートである。 予測係数を求める学習処理を行う画像処理装置の構成例を示すブロック図である。 図2の最適補正データ算出回路13(14)の第3の構成例を示すブロック図である。 図25の最適補正データ算出回路13(14)の処理を説明するためのフローチャートである。 図25のローカルデコード部2022の構成例を示すブロック図である。 図27のローカルデコード部2022の処理を説明するためのフローチャートである。 図25の判定部2024の構成例を示すブロック図である。 図29の判定部2024の処理を説明するためのフローチャート 図18の予測部72の他の構成例を示すブロック図である。 図18の予測部73の他の構成例を示すブロック図である。 図1の送信装置1の第2実施の形態の構成を示すブロック図である。 図33の最適補正データ算出回路101(102)の構成例を示すブロック図である。 図34の最適補正データ算出回路101の動作を説明するためのフローチャートである。 マッピング係数を得るための学習を行う画像処理装置の第1実施の形態の構成を示すブロック図である。 図36の画像処理装置の動作を説明するためのフローチャートである。 マッピング係数を得るための学習を行う画像処理装置の第2実施の形態の構成を示すブロック図である。 図38の画像処理装置の動作を説明するためのフローチャートである。 本発明による第1の階層符号化の方法を説明するための図である。 本発明による第2の階層符号化の方法を説明するための図である。 図1の送信装置1の第3実施の形態の構成を示すブロック図である。 図42の最適補正データ算出回路201の構成例を示すブロック図である。 図43の最適補正データ算出回路201の動作を説明するためのフローチャートである。 図42の最適補正データ算出回路201の他の構成例を示すブロック図である。 図45の最適補正データ算出回路201の動作を説明するためのフローチャートである。 従来の階層符号化を行う画像符号化装置の一例の構成を示すブロック図である。 従来の階層復号化を行う画像復号化装置の一例の構成を示すブロック図である。
符号の説明
1 送信装置, 2 記録媒体, 3 伝送路, 4 受信装置, 11,12 間引き回路, 13,14 最適補正データ算出回路, 15 信号処理回路, 21 補正部, 22 ローカルデコード部, 23 誤差算出部, 24 判定部, 25 多重化部, 32 補正回路, 33 補正値ROM, 41 クラス分類用ブロック化回路, 42 予測値計算用ブロック化回路, 43 クラス分類適応処理回路, 44 ADRC処理回路, 45 クラス分類回路, 46 適応処理回路, 51 ブロック化回路, 52 自乗誤差算出回路, 53,54 演算器, 55 積算部, 56 メモリ, 61 予測係数メモリ, 62 補正データメモリ, 63 誤差情報メモリ, 64 比較回路, 65 制御回路, 71 信号処理回路, 72,73 予測部, 80 デコード部, 81 分離部, 82 クラス分類用ブロック化回路, 83 予測値計算用ブロック化回路, 84 ADRC処理回路, 85 クラス分類回路, 86 予測回路, 86Aメモリ, 87,88 予測係数ROM, 89 予測回路, 91 学習用ブロック化回路, 92 教師用ブロック化回路, 93 ADRC処理回路, 94 クラス分類回路, 95 スイッチ, 96 学習データメモリ, 97 カウンタ, 98 教師データメモリ, 99 演算回路, 100 メモリ, 101,102 最適補正データ算出回路, 111 ブロック化回路, 112 ADRC処理回路, 113 クラス分類回路, 114 マッピング係数メモリ, 115 遅延回路, 116 演算回路, 121 メモリ, 122 ブロック化回路, 123 ADRC処理回路, 124 クラス分類回路, 126 演算回路, 127 ローカルデコード部, 128 誤差算出部, 129 判定部, 130 マッピング係数設定回路, 131 マッピング係数メモリ, 141 クラス分類用ブロック化回路, 142 予測値計算用ブロック化回路, 143 クラス分類適応処理回路, 144 ADRC処理回路, 145 クラス分類回路, 146 予測係数ROM, 147 予測回路, 170 最適補正データ算出部, 171 間引き回路, 172 補正部, 173 ローカルデコード部, 174 誤差算出部, 175 判定部, 176 ラッチ回路, 176A メモリ, 177 ブロック化回路, 177A メモリ, 178 ADRC処理回路, 179 クラス分類回路, 180 メモリ, 181 演算回路, 182 メモリ, 201 最適補正データ算出回路, 221 分離部, 222,223 デコード部, 231,1022 ローカルデコード部, 1222,1223 デコード部, 2022 ローカルデコード部, 2024 判定部, 3022,3231 ローカルデコード部

Claims (6)

  1. 画像を階層符号化する画像符号化装置であって、
    第1の階層の画像を構成する画素を、それぞれを中心とした所定の位置関係となる複数の画素から構成されるクラス分類用ブロックの画素のレベル分布からなる性質に応じて所定のクラスに分類する分類手段と、
    前記クラスごとに、所定のマッピング係数を記憶しているマッピング係数記憶手段と、
    前記第1の階層の画像の中の、注目している前記第1の階層の画像データの画素数を少なくした第2の階層の画像データの画素に対応する位置の注目画素およびその周辺画素と、その注目画素のクラスに対応する前記マッピング係数とを用いて所定の線形、または非線形の関数による演算を行うことにより、その演算結果からなる前記第1の階層の画像データの画素数を少なくした第2の階層の画像データに符号化する符号化手段と
    を備えることを特徴とする画像符号化装置。
  2. 前記符号化手段は、前記注目画素を含む、前記第1の階層の画像の前記注目画素を中心とした所定の位置関係となる複数の画素から構成されるクラス分類用ブロックの画素と、その注目画素のクラスに対応する前記マッピング係数とを用いて所定の線形、または非線形の関数による演算を行う
    ことを特徴とする請求項1に記載の画像符号化装置。
  3. 前記マッピング係数は、学習用の画像データを用いて、前記第2の階層の画像から第1の階層の画像を予測した予測結果の、その第1の階層の画像に対する予測誤差が最小になるように、または所定値以下になるように学習を行うことにより得られたものである
    ことを特徴とする請求項1に記載の画像符号化装置。
  4. 前記マッピング係数は、
    学習用の第1の階層の画像を構成する画素を、その性質に応じて前記クラスのうちのいずれかに分類し、
    前記学習用の第1の階層の画像の中の、注目している前記第1の階層の画像データの画素数を少なくした第2の階層の画像データの画素に対応する位置の注目学習画素およびその周辺画素と、その注目学習画素のクラスに対応する所定の係数とを用いて所定の線形、または非線形の関数による演算を行うことにより、その演算結果を前記学習用の第1の階層の画像の画素数を少なくした学習用の第2の階層の画像データとして算出し、
    前記学習用の第2の階層の画像に基づいて、前記学習用の第1の階層の画像の予測値を予測し、
    前記学習用の第1の階層の画像に対する、前記学習用の第1の階層の画像の予測値の予測誤差を算出し、
    その予測誤差に基づいて、前記所定の係数を変更する
    ことを、前記所定の係数が、前記予測誤差を所定値以下または最小値とする最適な値になるまで繰り返す
    ことにより得られた、その最適な値の前記所定の係数である
    ことを特徴とする請求項1に記載の画像符号化装置。
  5. 前記マッピング係数は、
    学習用の第1の階層の画像よりも画素数の少ない学習用の第2の階層の画像を形成し、
    前記学習用の第2の階層の画像を補正して、学習用補正データを出力し、
    前記学習用補正データに基づいて、前記学習用の第1の階層の画像を予測して、その予測値を出力し、
    前記学習用の第1の階層の画像に対する、前記学習用の第1の階層の画像の予測値の予測誤差を算出し、
    その予測誤差に基づいて、前記学習用補正データの適正さを判定する
    ことを、前記予測誤差が所定値以下または最小値となることで、前記学習用補正データが適正になるまで前記学習用の第2の階層の画像の補正を繰り返す
    ことにより得られた、その適正になった前記学習用補正データと、前記学習用の第1の階層の画像とを用いてその適正になった前記学習用補正データの各画素の画素値が、前記学習用の第1の階層の画像の各画素およびその周辺画素の画素値とマッピング係数との線形和と等しい関係となることを表す正規方程式を生成し、前記正規方程式を解くことにより得られる係数である
    ことを特徴とする請求項1に記載の画像符号化装置。
  6. 画像を階層符号化する画像符号化方法であって、
    第1の階層の画像を構成する画素を、それぞれを中心とした所定の位置関係となる複数の画素から構成されるクラス分類用ブロックの画素のレベル分布からなる性質に応じて所定のクラスに分類し、
    前記クラスごとに、記憶されている所定のマッピング係数のうち、前記第1の階層の画像の中の、注目している前記第1の階層の画像データの画素数を少なくした第2の階層の画像データの画素に対応する位置の注目画素に対応するクラスの前記マッピング係数を読み出し、
    そのマッピング係数と前記注目画素およびその周辺画素とを用いて所定の線形、または非線形の関数による演算を行うことにより、その演算結果からなる前記第1の階層の画像データの画素数を少なくした第2の階層の画像データに符号化する
    ことを特徴とする画像符号化方法。
JP2005308102A 1996-07-17 2005-10-24 画像符号化装置および画像符号化方法 Expired - Fee Related JP4582416B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005308102A JP4582416B2 (ja) 1996-07-17 2005-10-24 画像符号化装置および画像符号化方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP20655596 1996-07-17
JP2005308102A JP4582416B2 (ja) 1996-07-17 2005-10-24 画像符号化装置および画像符号化方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP20853597A Division JP3912629B2 (ja) 1996-07-17 1997-07-17 画像処理システム、画像符号化装置および画像符号化方法、伝送方法、並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2006101535A JP2006101535A (ja) 2006-04-13
JP4582416B2 true JP4582416B2 (ja) 2010-11-17

Family

ID=36240829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005308102A Expired - Fee Related JP4582416B2 (ja) 1996-07-17 2005-10-24 画像符号化装置および画像符号化方法

Country Status (1)

Country Link
JP (1) JP4582416B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8711943B2 (en) * 2011-07-21 2014-04-29 Luca Rossato Signal processing and tiered signal encoding
CN102572435B (zh) * 2012-01-16 2014-03-12 中南民族大学 基于压缩采样的视频编解码系统及其方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07147681A (ja) * 1993-09-30 1995-06-06 Sony Corp ディジタル画像信号の階層符号化および復号装置
JPH07162848A (ja) * 1993-12-03 1995-06-23 Sony Corp ディジタル画像信号の処理装置
JPH0846934A (ja) * 1994-08-01 1996-02-16 Sony Corp ディジタル画像信号の処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07147681A (ja) * 1993-09-30 1995-06-06 Sony Corp ディジタル画像信号の階層符号化および復号装置
JPH07162848A (ja) * 1993-12-03 1995-06-23 Sony Corp ディジタル画像信号の処理装置
JPH0846934A (ja) * 1994-08-01 1996-02-16 Sony Corp ディジタル画像信号の処理装置

Also Published As

Publication number Publication date
JP2006101535A (ja) 2006-04-13

Similar Documents

Publication Publication Date Title
JP3912627B2 (ja) 画像符号化装置および画像符号化方法、並びに伝送方法
JP3748088B2 (ja) 画像処理装置および方法、並びに学習装置および方法
KR100529662B1 (ko) 화상코딩및디코딩장치,및계층적코딩및디코딩방법
JP3915855B2 (ja) 画像符号化装置および画像符号化方法、並びに学習装置および学習方法
KR100537123B1 (ko) 화상 신호 부호화 장치, 화상 신호 부호화 방법, 화상 신호 복호 장치, 화상 신호 복호 방법 및 기록매체
EP0825776B1 (en) Image coding using sub-sampling, classification of pixel blocks and association of mapping coefficients
KR100574732B1 (ko) 영상코딩장치,영상코딩방법,영상디코딩방법,영상디코딩장치,영상데이터전송방법및기록매체
JP4582416B2 (ja) 画像符号化装置および画像符号化方法
JP3912629B2 (ja) 画像処理システム、画像符号化装置および画像符号化方法、伝送方法、並びに記録媒体
WO1998030028A1 (en) Picture coding device, picture coding method, picture decoding device, picture decoding method, and recording medium
JP3747970B2 (ja) 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法
JP4534951B2 (ja) 画像符号化装置および画像符号化方法、画像処理システムおよび画像処理方法、伝送方法、並びに記録媒体
JP3912558B2 (ja) 画像符号化装置および画像符号化方法、並びに記録媒体
JP3844031B2 (ja) 画像符号化装置および画像符号化方法、並びに、画像復号装置および画像復号方法
JP3912628B2 (ja) 画像符号化装置、画像符号化方法、画像符号化および復号化システム、画像符号化および復号化方法、並びに記録媒体
JP3952326B2 (ja) 画像符号化装置および画像符号化方法、画像処理システムおよび画像処理方法、伝送方法、並びに記録媒体
JP4496494B2 (ja) 画像符号化装置および画像符号化方法
JP4487900B2 (ja) 画像処理システム
KR100567710B1 (ko) 화상코딩장치,화상코딩방법,화상디코딩방법,화상디코딩장치,화상데이타전송방법및기록매체
KR100598754B1 (ko) 원 화상 데이타 부호화 장치, 부호화 화상 데이타 복호화 장치, 원 화상 데이타 부호화 방법, 부호화 화상 데이타 복호화 방법, 화상 데이타 송신 방법, 컴퓨터로 판독 가능한 기록 매체
JP4807349B2 (ja) 学習装置および方法
JP4566877B2 (ja) 画像処理装置および方法
EP1298934A1 (en) Apparatus and method for image coding and decoding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100506

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100805

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100818

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130910

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees