JP2004289284A - 画像処理方法および画像処理装置ならびに画像処理プログラム - Google Patents

画像処理方法および画像処理装置ならびに画像処理プログラム Download PDF

Info

Publication number
JP2004289284A
JP2004289284A JP2003076243A JP2003076243A JP2004289284A JP 2004289284 A JP2004289284 A JP 2004289284A JP 2003076243 A JP2003076243 A JP 2003076243A JP 2003076243 A JP2003076243 A JP 2003076243A JP 2004289284 A JP2004289284 A JP 2004289284A
Authority
JP
Japan
Prior art keywords
data
encoded data
triangular
frame
coded data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003076243A
Other languages
English (en)
Other versions
JP4232496B2 (ja
Inventor
Mitsuhiro Inazumi
満広 稲積
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2003076243A priority Critical patent/JP4232496B2/ja
Publication of JP2004289284A publication Critical patent/JP2004289284A/ja
Application granted granted Critical
Publication of JP4232496B2 publication Critical patent/JP4232496B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】動画の符号化を少ない計算量、メモリ量で実現する。
【解決手段】画像入力手段1に入力された画像を1つ以上の正方形領域に分割する正方形領域分割手段2と、分割されたぞれぞれの正方形領域を再帰的に三角形領域に分割する再帰的三角形領域分割手段3と、分割された三角形領域を符号化する符号化データ生成ステップ5と、生成された個々のフレーム対応の符号化データに対しフレーム間相関を用い、現フレームに対する符号化データを前フレームの符号化データで置換できるか否かを判定し、前フレームの符号化データで置換できると判定された場合は、それを示す情報を出力する符号化データ差分化手段20(符号化データ記憶手段7、前フレーム符号化データ記憶手段8、符号化データ比較手段9、符号化データ選択手段10からなる)と、この符号化データ差分化手段20により生成された符号化データを出力する符号化データ出力手段6とを有する。
【選択図】 図35

Description

【0001】
【発明の属する技術分野】
本発明は画像処理方法及び画像処理装置並びに画像処理プログラムに関する。特に、画像を正方形領域とし、その正方形領域を三角形領域に分割し、分割された三角形領域に対し画像処理行う画像処理技術を用い、動画データを符号化し、それを復号化する画像処理方法および画像処理装置ならびに画像処理プログラムに関する。
【0002】
【従来の技術】
動画信号を高い効率で圧縮、伸張する動画符号化技術は、携帯電話機やインタネットの普及、およびそれらの上でのマルチメディア通信に対する要求とともにその必要性が高まっている。
【0003】
この動画符号化技術においては、小型の携帯機器での処理を可能とするために、低いビットレートを実現できるように符号化効率が高いこと、その処理の際の計算量、メモリ量が少ないことが求められている。さらに、符号化処理が専用機ではなく、汎用機器上で実行される場合、その機器で並行に処理される他の処理の負荷変動に対する柔軟な対応が可能であることなどが要求される。
【0004】
動画を符号化する方法として、それぞれのフレームのデータをフレームごとに独立した静止画データとして符号化する方法がある。この例としては、モーションJPEGなどがある。この方法は、符号化された個々のフレームが独立しているために、編集時や早送り、巻き戻し操作が容易であるなどの特徴がある。
【0005】
また、画像入力が可能である機器の多くが静止画処理のためのハードウエアを持っていることが多く、それを利用できるという利点がある。しかし、動画としての符号化効率は高いとはいえない。
【0006】
動画の符号化効率を高めるための符号化方法として、前フレームデータとの差分のみを符号化する方法がある。これは、動画データにおいて、それぞれのフレーム間のデータの相関が大きいということを利用したものである。さらに、この方法には、前フレームデータと現フレームデータとの間で、対象物の動きを考慮して差分を求める場合と、動きを考慮しないで差分を求める場合とに分けることができる。
【0007】
対象物の動きを考慮した差分とは、動き補償処理とも呼ばれ、前フレームのある範囲のデータが、現フレームの異なる位置にあるか否かを考慮するものである。たとえば、前フレームデータの一部が、現フレームデータ上においては、ある方向へ移動しているということは動画においては頻繁に現れる状況である。このような場合、動き補償処理では、前フレームデータのどの領域が、どの方向へどれだけ動いたという動きベクトルと呼ばれる情報が符号化される。これは、動きを考慮しない差分と比較すると、符号化するデータ量を少なくすることができる特徴がある。この具体例としては、H.261などの符号化ある。
【0008】
一方、対象物の動きを考慮しない差分とは、単純に前フレームデータと現フレームデータとの間で、対応する位置のデータにどれだけの差分があるかということである。この差分が小さいとされた領域は、前フレームデータをそのまま用いることで処理され、前フレームデータを用いるという情報のみが符号化される。この処理は、動き補償処理において、動きベクトルが0である特殊な場合と考えることもできる。その意味で、動き補償を含む処理のほうがより一般的なものであるが、このように仮定することにより、処理を非常に軽くすることができる特徴がある。
【0009】
上述したそれぞれの符号化方法はリアルタイムの動画を符号化する場合を想定したものであるが、蓄積された動画符号化においては、参照するフレームデータは直前のフレームデータのみではなく、過去の複数のフレームデータ、さらに、未来の複数のフレームデータとの差分を求める方法もある。この具体例としては、MPEGにおける動画符号化などがある。
【0010】
ここで、従来の一般的な符号化方法について説明する。図54はH.261の符号化方式を説明する図であり、概略的には、画像データ入力手段201、動き補償手段202、データ選択手段203、DCT(離散コサイン変換)手段204、量子化手段205、逆量子化手段206、逆DCT手段207、データ記憶手段208、符号化手段209、符号化データ出力手段210などを有した構成となっている。
【0011】
このような構成において、画像データ入力手段201に入力された1フレーム分の画像データは、それが差分モードで符号化される場合は動き補償手段202で処理される。
【0012】
データ選択手段203は、差分モードで符号化される場合においては、動き補償手段202による動き補償後のデータを選択し、差分モードではない場合においては、画像データ入力手段201により与えられるデータそのものを選択する。
【0013】
このデータ選択手段203で選択されたデータは、DCT手段204によって周波数データへ変換され、得られたDCT係数を量子化手段205によって量子化し、符号化手段209で符号化することによりデータが圧縮される。
【0014】
また、量子化されたデータを逆量子化手段206によって逆量子化し、逆DCT手段207によって逆量子化することによって得られたデータは、データ記憶手段208に記憶され、次のフレームのデータでの差分化処理のための前フレームデータとして用いられる。これは、復号処理側で参照可能な前フレームデータは、符号化されたデータから復号されたデータのみであることに対応する。
【0015】
ここで、動き補償処理は任意の大きさの領域で行われるものではなく、マクロブロックと呼ばれる16画素×16画素の正方形領域を単位として行われる。また、DCT処理などの空間周波数への変換処理は、位置に対する情報を分散させてしまうために、動き補償処理は入力された画像に対するDCT処理、量子化処理などが施される前に実行される必要がある。
【0016】
この符号化処理において、DCT処理なども大きな計算量が必要な処理であるが、動き補償処理もまた大きな計算量を必要とする処理である。つまり、動きベクトルを求める処理は、各々のブロックに対し、
【0017】
【数1】
Figure 2004289284
【0018】
により与えられる誤差Err(i,j)が最小となり、かつ、それが、所定の値よりも小さくなるようなiとjを求めるような処理である。
【0019】
上述の(1)式においては、二乗誤差を評価基準として用いることを想定しており、D(x,y)は、ある座標(x、y)におけるデータ(画素)値を示すものとする。同様に、P(x+i,y+j)における前フレームのデータ(画素)値を示すものとする。ここで、値(i,j)が動きベクトルを表す。また、Lは処理対象とする正方形ブロックの大きさを表す。この演算処理の結果、ある動きベクトル(i,j)に対する差異Err(i,j)が求められる。
【0020】
H.261の符号化方式においては、L=16である。また、1組のiとjの範囲としては、−15から+15の範囲の計算を行う。そのため、単純に実行すれば、(1)式を900回以上の行うことが必要となる。
【0021】
また、この動き補償処理は、マクロブロックという正方形領域を用いた処理であるため、その中の小さな部分において動きがあった場合でも、そのブロック全体の処理が必要となる。また、動き補償においてブロックをコピーする場合、そのブロックの境界に不連続が生じる可能性がある。
【0022】
この演算量の多さや不連続性の改善を図る技術の例として、特開平8−37664号公報に記載の技術「動画像符号化/復号化装置」や特開平10−341441号公報に記載の技術「二次元三角パッチ線格子モデルを用いた動画像の動き推定方法」などがある。
【0023】
特開平8−37664号公報に記載の技術は、その公報に記載された図2に見られるように、入力データから代表点を求め、それらを結ぶ三角形領域を設定し、この代表点の移動より、フレーム間での動きベクトルを求めるものである。この代表点およびそれらを結ぶ三角形領域は、対象となるデータに依存し、任意の位置、任意の大きさに取ることができる。これにより、動き補償の演算量を削減し、かつ、前フレームからの、より滑らかな動きや変形を可能とすることができる。
【0024】
一方、特開平10−341441号公報に記載の技術は、上述の特開平8−37664号公報に記載の技術とは異なり、その公報に記載された図3に示されるように、入力データ全体に対し、マクロブロックを対角線で2分割した二次元三角パッチ線格子モデルと呼ぶ小さな二次元三角形よりなる格子を当てはめる。その後、その公報に記載された図2に示されるように、その三角形領域の頂点を基準に、動きベクトルを計算する。そして、求められた動きベクトルをもとに、その公報に記載された図5(c)に示されるように、三角パッチ線格子が変形させせられる。これにより、最終的には特開平8−37664号公報に記載の技術と同様に、演算量を削減し、前フレームからの、より滑らかな動きや変形を可能とすることができる。
【0025】
【特許文献1】
特開平8−37664号公報
【特許文献2】
特開平10−341441号公報
【0026】
【発明が解決しようとする課題】
しかしながら、特開平8−37664号公報に記載の技術においては、代表点を求めること自体に多くの計算量を必要とし、また、代表点が誤検出された場合は、非常に大きな画質劣化を招くといった問題がある。また、特開平10−341441号公報においても、動きベクトルを求めるに多くの計算量が必要となる。
【0027】
動き補償処理は、動画の圧縮効率を大きく改善するものである。しかし、さまざまな改善手段はあるものの、動き補償処理には依然として非常に大きな計算量、メモリ量を必要とし、たとえば、携帯型情報機器のようなハードウエア能力、電源能力などに大きな制約のある状況下での使用は困難である場合が多い。また、専用ハードウエア化は、それらの課題を改善するものであるが、汎用性、コストの面での新たな問題点が出てくる。
【0028】
また、動画符号化処理が、汎用機器の上で他の処理と並行して行われる場合、他の処理の負荷変動に依存して、動画符号化処理に割り当てられる計算能力を柔軟に変化させることができる方がより好都合である。
【0029】
しかし、従来例のように、動き補償処理が処理の最前段に存在する場合(図54参照)、動き補償処理は符号化処理と一体化しており、負荷変動に対応することは困難であった。また、動き補償処理が処理の最前段に存在するということは、得られた符号化データ量が目標とする符号化データ量ではなく、リトライを行う場合、動き補償処理にまで遡って、多くの処理をやり直す必要があるため、リトライ時の演算量が多くなるという問題もある。
【0030】
そこで本発明は、動画の符号化および復号化を少ない計算量、少ないメモリ量で実現できる画像処理方法および画像処理装置ならびに画像処理プログラムを提供することを目的としている。
【0031】
【課題を解決するための手段】
本発明は、動画データの符号化および復号化を行うものであるが、その符号化および復号化を行うに際して、処理対象となる画像を正方形とすることが前提である。この画像の正方形化を行う際、処理対象画像を1つ以上の正方形領域に分割する方法、もう1つは処理対象画像を正方形に変形させることで1つの正方形領域を生成する方法が考えられるが、本発明では前者、すなわち、処理対象画像を1つ以上の正方形領域に分割する方法を採用する。
【0032】
まず、本発明の画像処理方法について言えば、この画像処理方法の符号化側は、動画を構成する連続した個々のフレーム対応の画像データをフレーム間相関を用いて符号化する画像処理方法であって、その画像処理手順として、フレーム対応の画像データを入力する画像入力ステップと、入力されたフレーム対応の画像データを1つ以上の正方形領域に分割する正方形領域分割ステップと、分割されたぞれぞれの正方形領域を再帰的に三角形領域に分割する再帰的三角形領域分割ステップと、分割された三角形領域を符号化する符号化データ生成ステップと、この符号化データ生成ステップによって生成された個々のフレーム対応の符号化データに対しフレーム間相関を用い、現フレームに対する符号化データを前フレームの符号化データで置換できるか否かを判定し、前フレームの符号化データで置換できると判定された場合は、それを示す情報を出力する符号化データ差分化ステップと、この符号化データ差分化ステップの判定結果に基づいた符号化データを出力する符号化データ出力ステップとを含むことを特徴としている。
【0033】
このような画像処理方法において、前記符号化データ差分化ステップは、前記個々のフレーム対応の符号化データを現フレーム符号化データとし、この現フレーム符号化データと前フレーム符号化データとをそれぞれの対応する三角形領域で比較し、その差異の大きさが所定値未満であるか否かを判定し、差異が所定値未満である場合には、当該三角形領域における現フレーム符号化データを前フレーム符号化データで置換することを示す情報を出力し、差異が所定値以上である場合には、当該三角形領域は現フレームの符号化データを出力するようにしている。
【0034】
また、この画像処理方法において、前記再帰的に分割されたそれぞれの三角形領域を、その元となる正方形領域を根とする2分木で表現し、前記符号化データ差分化ステップは、前記前フレーム符号化データに対応する2分木の最終階層の三角形領域と現フレーム符号化データに対応する2分木の最終階層の三角形領域について、両者の差異を求め、その差異の大きさに基づいて当該三角形領域が前フレームの同じ領域の符号化データで置換できるか否かを判定し、それよりも上位の階層の三角形領域においては、自身を2分割して得られた2つの三角形領域がともに前フレームの同じ領域の符号化データで置換できる場合に、自身の三角形領域も前フレームの同じ領域の符号化データで置換できると判定するようにしている。
【0035】
また、この画像処理方法において、前記前フレーム符号化データで置換することを示す情報は、当該前フレーム符号化データで置換するとされた最上位の三角形領域のみに付されるようにしている。
【0036】
また、本発明の画像処理方法の復号化側は、動画を構成する連続した個々のフレーム対応の画像データが、1つ以上の正方形領域に分割され、そのそれぞれの正方形領域が再帰的三角形領域分割処理されたのち、その分割された三角形領域が符号化され、かつ、当該処理対象となるフレーム対応の画像データがフレーム間相関を用いて符号化されてなり、この符号化データを復号化する画像処理方法であって、その画像処理手順として、符号化データを入力する符号化データ入力ステップと、この符号化データ入力ステップに入力された符号化データを解析する符号化データ解析ステップと、この符号化データ解析ステップによる解析結果に基づいて、前フレーム符号化データを選択するか現フレーム符号化データを選択するかを判定する符号化データ選択判定ステップと、この符号化データ選択判定ステップの判定結果に基づいて、再帰的に三角形領域を合成する再帰的三角形領域合成ステップと、合成された三角形領域により正方形領域を合成する正方形領域合成ステップと、合成された正方形領域から画像データを復元して出力する画像データ出力ステップとを含むことを特徴としている。
【0037】
このような画像処理方法において、前記符号化データ選択判定ステップが行う前フレーム符号化データを選択するか現フレーム符号化データを選択するかの判定は、前フレームデータで置換することを示す情報に基づいて行い、ある三角形領域に前フレームデータで置換することを示す情報が与えられている場合には、当該三角形領域より下の階層の三角形領域全体を、前フレームの同じ領域の符号化データを用いて復号化するようにしている。
【0038】
また、本発明の画像処理装置の符号化側は、動画を構成する連続した個々のフレーム対応の画像データをフレーム間相関を用いて符号化する画像処理装置であって、その構成要素として、画像データを入力する画像入力手段と、入力された画像データを1つ以上の正方形領域に分割する正方形領域分割手段と、分割されたぞれぞれの正方形領域を再帰的に三角形領域に分割する再帰的三角形領域分割手段と、分割された三角形領域を符号化する符号化データ生成手段と、この符号化データ生成手段によって生成された個々のフレーム対応の符号化データに対しフレーム間相関を用い、現フレームに対する符号化データを前フレームの符号化データで置換できるか否かを判定し、前フレームの符号化データで置換できると判定された場合は、それを示す情報を出力する符号化データ差分化手段と、この符号化データ差分化手段の判定結果に基づいた符号化データを出力する符号化データ出力手段とを含むことを特徴としている。
【0039】
このような画像処理装置において、前記符号化データ差分化手段は、前記個々のフレーム対応の符号化データを現フレーム符号化データとし、この現フレーム符号化データと前フレーム符号化データとをそれぞれの対応する三角形領域で比較し、その差異の大きさが所定値未満であるか否かを判定し、差異が所定値未満である場合には、当該三角形領域における現フレーム符号化データを前フレーム符号化データで置換することを示す情報を出力し、差異が所定値以上である場合には、当該三角形領域は現フレームの符号化データを出力するようにしている。
【0040】
また、この画像処理装置において、前記再帰的に分割されたそれぞれの三角形領域を、その元となる正方形領域を根とする2分木で表現し、前記符号化データ差分化手段は、前フレーム符号化データに対応する2分木の最終階層の三角形領域と現フレーム符号化データに対応する2分木の最終階層の三角形領域について、両者の差異を求め、その差異の大きさに基づいて当該三角形領域が前フレームの同じ領域の符号化データで置換できるか否かを判定し、それよりも上位の階層の三角形領域においては、自身を2分割して得られた2つの三角形領域がともに前フレームの同じ領域の符号化データで置換できる場合に、自身の三角形領域も前フレームの同じ領域の符号化データで置換できると判定するようにしている。
【0041】
また、この画像処理装置において、前記前フレーム符号化データで置換することを示す情報は、当該前フレーム符号化データで置換するとされた最上位の三角形領域のみに付されるようにしている。
【0042】
また、本発明の画像処理装置の復号化側は、動画を構成する連続した個々のフレーム対応の画像データが1つ以上の正方形領域に分割され、そのそれぞれの正方形領域が再帰的三角形領域分割処理されたのち、その分割された三角形領域が符号化され、かつ、当該処理対象となるフレーム対応の画像データがフレーム間相関を用いて符号化されてなり、この符号化データを復号化する画像処理装置であって、その構成要素として、符号化データを入力する符号化データ入力手段と、この符号化データ入力手段に入力された符号化データを解析する符号化データ解析手段と、この符号化データ解析手段による解析結果に基づいて、前フレーム符号化データを選択するか現フレーム符号化データを選択するかを判定する符号化データ選択判定手段と、この符号化データ選択判定手段の判定結果に基づいて、再帰的に三角形領域を合成する再帰的三角形領域合成手段と、合成された三角形領域により正方形領域を合成する正方形領域合成手段と、合成された正方形領域から画像データを復元して出力する画像データ出力手段とを含むことを特徴としている。
【0043】
このような画像処理装置において、前記符号化データ選択判定手段が行う前フレーム符号化データを選択するか現フレーム符号化データを選択するかの判定は、前フレーム符号化データで置換することを示す情報に基づいて行い、ある三角形領域に前フレーム符号化データで置換することを示す情報が与えられている場合には、当該三角形領域より下の階層の三角形領域全体を、前フレームの同じ領域の符号化データを用いて復号化するようにしている。
【0044】
また、本発明の画像処理プログラムの符号化側は、動画を構成する連続した個々のフレーム対応の画像データをフレーム間相関を用いて符号化する画像処理方法であって、その画像処理手順として、フレーム対応の画像データを入力する画像入力ステップと、入力されたフレーム対応の画像データを1つ以上の正方形領域に分割する正方形領域分割ステップと、分割されたぞれぞれの正方形領域を再帰的に三角形領域に分割する再帰的三角形領域分割ステップと、分割された三角形領域を符号化する符号化データ生成ステップと、この符号化データ生成ステップによって生成された個々のフレーム対応の符号化データに対しフレーム間相関を用い、現フレームに対する符号化データを前フレームの符号化データで置換できるか否かを判定し、前フレームの符号化データで置換できると判定された場合は、それを示す情報を出力する符号化データ差分化ステップと、この符号化データ差分化ステップの判定結果に基づいた符号化データを出力する符号化データ出力ステップとを含むことを特徴としている。
【0045】
このような画像処理プログラムにおいて、前記符号化データ差分化ステップは、前記個々のフレーム対応の符号化データを現フレーム符号化データとし、この現フレーム符号化データと前フレーム符号化データとをそれぞれの対応する三角形領域で比較し、その差異の大きさが所定値未満であるか否かを判定し、差異が所定値未満である場合には、当該三角形領域における現フレーム符号化データを前フレーム符号化データで置換することを示す情報を出力し、差異が所定値以上である場合には、当該三角形領域は現フレームの符号化データを出力するようにしている。
【0046】
また、この画像処理プログラムにおいて、前記再帰的に分割されたそれぞれの三角形領域を、その元となる正方形領域を根とする2分木で表現し、前記符号化データ差分化ステップは、前記前フレーム符号化データに対応する2分木の最終階層の三角形領域と現フレーム符号化データに対応する2分木の最終階層の三角形領域について、両者の差異を求め、その差異の大きさに基づいて当該三角形領域が前フレームの同じ領域の符号化データで置換できるか否かを判定し、それよりも上位の階層の三角形領域においては、自身を2分割して得られた2つの三角形領域がともに前フレームの同じ領域の符号化データで置換できる場合に、自身の三角形領域も前フレームの同じ領域の符号化データで置換できると判定するようにしている。
【0047】
また、この画像処理プログラムにおいて、前記前フレーム符号化データで置換することを示す情報は、当該前フレーム符号化データで置換するとされた最上位の三角形領域のみに付されるようにしている。
【0048】
また、本発明の画像処理プログラムの復号化側は、動画を構成する連続した個々のフレーム対応の画像データが、1つ以上の正方形領域に分割され、そのそれぞれの正方形領域が再帰的三角形領域分割処理されたのち、その分割された三角形領域が符号化され、かつ、当該処理対象となるフレーム対応の画像データがフレーム間相関を用いて符号化されてなり、この符号化データを復号化する画像処理方法であって、その画像処理手順として、符号化データを入力する符号化データ入力ステップと、この符号化データ入力ステップに入力された符号化データを解析する符号化データ解析ステップと、この符号化データ解析ステップによる解析結果に基づいて、前フレーム符号化データを選択するか現フレーム符号化データを選択するかを判定する符号化データ選択判定ステップと、この符号化データ選択判定ステップの判定結果に基づいて、再帰的に三角形領域を合成する再帰的三角形領域合成ステップと、合成された三角形領域により正方形領域を合成する正方形領域合成ステップと、合成された正方形領域から画像データを復元して出力する画像データ出力ステップとを含むことを特徴としている。
【0049】
このような画像処理プログラムにおいて、前記符号化データ選択判定ステップが行う前フレーム符号化データを選択するか現フレーム符号化データを選択するかの判定は、前フレームデータで置換することを示す情報に基づいて行い、ある三角形領域に前フレームデータで置換することを示す情報が与えられている場合には、当該三角形領域より下の階層の三角形領域全体を、前フレームの同じ領域の符号化データを用いて復号化するようにしている。
【0050】
このように本発明は、画像を正方形領域とした上で処理を行うものであり、その符号化側では、処理対象となる画像データを符号化するに際して、処理対象の画像データを1つ以上の正方形領域に分割し、取り出された正方形を再帰的に三角形領域に分割し、得られたそれぞれの三角形領域の3頂点の画素情報(以下では画素値という)と斜辺中点の画素値を得るようにしている。このとき、再帰的分割処理によって得られるそれぞれの三角形の型は、元の正方形に対する分割の仕方を決めておけば、あとは分割順にしたがって自動的に決めることができる。また、それぞれの三角形の頂点の画素値は正方形の持っている画素値をそのまま継承でき、斜辺中点の画素値も元の正方形から求めることができる。そして、このような再帰的三角形分割処理による三角形の型と保持すべき画素値(斜辺中点画素値)を2分木で表現でき、その2分木に基づいて1次元化された符号化データとして出力することができる。
【0051】
これによれば、処理対象となる画像データを符号化する際、符号化を行う際に保持あるいは伝送すべきデータはごく少量ですみ、それによって、演算を大幅に簡略化することができるとともにメモリの使用量を大幅に減らすことができる。
【0052】
また、本発明ではこの画像処理技術を用いて動画の符号化およびその復号化を行うものであり、その動画符号化は、処理対象となるフレーム対応の画像をフレーム間相関を用いるが動き補償処理は行わずに符号化するものである。このように本発明は、動き補償処理を用いないので、動きベクトルを求めるために多くの計算量、メモリ量を必要としていた従来技術に比べると、計算量やメモリ量を大幅に削減できる効果がある。
【0053】
また、符号化したあとのデータのみを用いてフレーム間の差分を計算するので、これによっても、計算量やメモリ量を削減できる。なお、動き補償を行わないことによる符号化効率の劣化は、本発明の基礎となる画像処理技術である正方形領域を再帰的三角形領域分割することによって得られた2分木のデータ構造により、差異のある部分をそれに最も適したサイズの領域として表現することを可能とすることによって改善できる。
【0054】
つまり、従来例においては、前述したように、処理の単位が16画素×16画素のマクロブックという固定された大きさであったが、本発明においては、可能である限り、大きな領域を前フレームの符号化データで置換できるというような符号化を行う。逆に言うと、差異のある部分をできるだけ小さな領域で表現することによって、トータルとしての符号化効率を改善する効果がある。
【0055】
また、上述したように、本発明の動画符号化で用いられる符号データ差分化処理は、符号化したあとのデータを用いて行われるので、本発明の基礎となる画像処理技術による符号化や、それを基にした個々のフレームのデータ省略処理とは独立して行うことができる。そのため、たとえば、本発明で用いられる符号データ差分化処理を行っている最中に、他の処理負荷が増加して、本発明で用いられる符号データ差分化処理に割り当てられる演算処理量が少なくなった場合、その符号化データ差分化処理を中断し、それまでに処理された結果を直接に符号化出力とすることが可能である。また、他の処理負荷が始めから大きい場合には本発明の符号化データ差分化処理を全く行わないようにすることもできる。このように、システムの処理負荷の大きさに応じて、柔軟に対応することができる。また、符号化したあとのデータを用いて符号化データ差分化処理を行うことは、上述したような種々の効果の他に、最終的に得られた符号化データが目標とするデータと異なるような場合のリトライ処理を行う際の演算量を少なくすることができるという効果も得られる。
【0056】
つまり、従来の技術では、入力された画像データに対して動き補償を行った後に、符号化してその符号化データを出力するという方式では、リトライを行う場合、動き補償処理にまで遡って、再度、動き補償処理を行った後に符号化するというように複数段階の処理をやり直す必要があるが、本発明では、符号化データ差分化処理だけをやり直すだけですむので、リトライを行う場合の演算量を少なくすることができる。
【0057】
また、符号化側からの符号化データを復号する際は、符号化側からの符号化データを解析し、その符号化データが現フレーム対する差分データであるのか、それとも、データ置換の要求されたデータであるのかを判定して、その判定結果に基づいて、三角形領域の合成をおこなうようにしている。このとき、データ置換の要求されたデータであるのか否かの判定は、データ置換の可能な最上位の三角形領域に付されたデータ置換が可能であることを示す情報に基づいて行い、ある三角形領域に対してデータ置換が可能であることを示す情報が与えられている場合には、当該三角形領域より下の階層の三角形領域全体を、そのデータ置換が可能であることを示す情報の付加された三角形領域の符号化データを用いて復号化するようにしているので、効率的な三角形領域の合成が行える。
【0058】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。まず、本発明の基礎となる技術として、処理対象となる画像を1つ以上の正方形領域に分割し、それぞれの正方形領域を再帰的に三角形領域に分割して、分割された三角形領域を符号化する画像処理と、それによって符号化された符号化データを復号化する画像処理について説明し、そのあとで、本発明の動画符号化処理とそれを復号する復号化処理について説明する。
【0059】
図1は本発明に係る画像処理装置の符号化、すなわち、処理対象となる画像を1つ以上の正方形領域に分割し、それぞれの正方形領域を再帰的に三角形領域に分割して、分割された三角形領域を符号化する符号化側の構成を示すブロック図である。その構成を大きく分けると、画像データ入力手段1、正方形領域分割手段2、再帰的三角形領域分割手段3、三角形領域分割制御手段4、符号化データ生成手段5、符号化データ出力手段6を有した構成となっている。
【0060】
画像データ入力手段1は、図2に示すように、個々の画素データを入力する画素データ入力手段101と、入力された画素の色データを各色成分へ分離する色成分分離手段102と、分離された色データに基づき、たとえば、RGBからYUVデータへ変換する色変換手段103と、必要であるならばデータの間引きを行うデータ間引き手段104を有している。なお、この画像データ入力手段1に入力される画像データは、たとえば、カメラからの画像データ、ファイルからの画像データ、何らかの通信手段からの画像データなどが考えられる。
【0061】
再帰的三角形領域分割手段3は、少なくとも、複数種類の三角形型(これについては後述する)を記憶する形状型記憶手段31と、三角形の3つの頂点の画素値および斜辺中点画素値を記憶する頂点画素値記憶手段32と、三角形の斜辺中点の画素値を補う斜辺中点画素値取得手段33と、後述する規則(図11参照)を用いて三角形型を更新する形状型更新手段34と、三角形の3つの頂点の画素値および斜辺中点の画素値を更新する頂点画素値更新手段35とを有している。
【0062】
以下に図1で示した各構成要素の動作について詳細に説明する。
【0063】
本発明は、処理すべき画像データを正方形とし、それを再帰的に三角形領域へ分割してその三角形領域に対して画像処理を行う。たとえば、画像データ入力手段1から得られた画像データのある1つの色成分が図3(a)のようであるとする。本発明は、これを、図3(b)のように三角形領域の集合として表現する。
【0064】
このように、本発明では処理すべき画像データが正方形であることを前提に処理を行うが、画像データ入力手段1から得られる画像データは必ずしも正方形であるとは限らない。そこで、画像データが正方形ではない場合の処理について説明する。
【0065】
入力された画像データが正方形ではない場合、正方形領域分割手段2によって入力された画像データを1つ以上の正方形領域へ分割する。たとえば、入力された画像データが、図4(a)のような横長の長方形画像である場合、これを図4(b)で示すような複数の正方形領域へ分割する。この時、分割される正方形の1辺に含まれる画素数をLとすると、Lは2のN剰+1であることが望ましい。この理由は後述する。なお、Nは自然数である。
【0066】
このように、もともと正方形でない画像を正方形領域分割手段2によって正方形領域へ分割すると、図4(b)に示すように、画像の端部に重なる正方形部分には画像の存在しない空白部が生じる。また、一般的には、画像データの幅と高さは、Lの整数倍とはならない。この空白部に対する処理と画像データの幅と高さが、Lの整数倍とはならない場合の処理について図5のフローチャートと図6の画像例を参照しながら説明する。
【0067】
図5は正方形領域分割処理手段2が行う正方形領域分割処理手順を説明するフローチャートであり、まず、分割すべき正方形領域の1辺値としてLを入力する(ステップS1)。ただし、上述したように、Lは2のN剰+1とする(Nは自然数)とする。ここで、当該画像の幅WがLの整数倍ではないとき、当該画像の幅がLの整数倍となるまで0を挿入する(ステップS2)。また、同様に、当該画像の高さHがLの整数倍ではないとき、当該画像の高さHがLの整数倍となるまで0を挿入する(ステップS3)。
【0068】
図6は、ある横長の画像に対し、図5で説明した正方形領域分割処理を施した例である。この図6からもわかるように、当該画像の幅WはLの整数倍ではないので、当該画像の幅がLの整数倍であるとして、その余白部に0を補填している。同様に、当該画像の高さHはLの整数倍ではないので、当該画像の高さHがLの整数倍であるとして、その余白部に0を補填している。
【0069】
この図5および図6で説明した例は、画像の幅方向および高さ方向をLの整数倍として、それによって生じる余白部に0を補填するようにした例について説明したが、それ以外にも、たとえば、JPEGなどの処理に見られるように、幅方向においては、当該画像における最も右側の列の画素値を繰り返し、また高さ方向においては、当該画像における最も下側の行の画素値を繰り返すと言うようなものであってもよい。また、JPEG2000などに見られるように、幅方向においては、当該画像における最も右側の列で画像値を折り返す、また高さ方向においては、当該画像における最も下側の行で画像値を折り返すと言うようなものであってもよい。
【0070】
なお、これ以降の処理は、JPEGなどと同様に、この分割された正方形領域のそれぞれにおいて独立した処理となるので、一般性を損なうことなく、画像データは正方形であるとして説明を続ける。
【0071】
次に上述したように正方形領域に分割されたそれぞれの正方形を三角形に分割する処理について説明する。この三角形に分割する処理は、再帰的三角形領域分割手段3によって行われる。この再帰的三角形領域分割手段3は、それぞれの正方形領域を再帰的に三角形領域へ分割するもので、たとえば、図7(a),(b)に示すように、ある1つの正方形領域は、2つの三角形に分割される。そして、この図7(a),(b)では図示されていないが、分割された三角形はさらにそれぞれ三角形に分割される。
【0072】
この正方形を三角形に分割する方法は二通りあり、その第1の方法としては図7(a)示すような分割の仕方であり、第2の方法としては図7(b)に示すような分割の仕方である。
【0073】
すなわち、正方形の4つの角部の画素値をa,b,c,dとしたとき、図7(a)は第1の方法によって2つの三角形に分割し、図7(b)は第2の方法によって2つの三角形に分割した例であり、これら第1および第2の方法を用いて分割されることによって生成される三角形の型を、それぞれの図中で示したように、#1、#2、#3、#4と表すことにする。
【0074】
ところで、この図7(a),(b)のように分割された三角形を再帰的に分割して得られる三角形は合計で8種あり、その8種類のそれぞれを図8に示すように、#1、#2、#3、#4、#5、#6、#7、#8の型番号を付す。なお、この図8に示される各三角形のそれぞれの頂点に付されたa,b,cはそれぞれその位置における画素値を表しており、また、それぞれの斜辺に付されたdは、その斜辺中点位置における画素値を表すが、これについては後に説明する。
【0075】
このような再帰的三角形領域分割されたそれぞれの三角形の型(三角形型)は相互に関連つけることができる。たとえば、図9に示すように、#6の型の三角形を分割すると、#1と#4の型の三角形が生成される。つまり、本発明の再帰的三角形領域分割処理において、分割処理後の3角形の型は、その元となる三角形の型から自動的に定まるので、出力データの中に三角形の型を保存する必要はない。
【0076】
ところで、上述した図7により正方形を三角形に分割する方法(第1の方法および第2の方法)について説明をしたが、このとき、正方形の4頂点の位置の画素値がどのようにして三角形に継承されるのかを説明する。
【0077】
ここで、正方形の4頂点の画素値がa,b,c,dであったとすると、この正方形の4頂点の画素値a,b,c,dの継承パタンとしては図7(a),(b)で説明した分割の仕方によって2種類がある。
【0078】
図10はこの継承規則を示したものである。たとえば、正方形が図7(a)のような方法(第1の方法)で三角形に分割されたとすると、図10の上段に示すように、分割前(正方形)の型をここでは#0と表すものとすると、この正方形の4頂点の画素値(a,b,c,d)は、三角形分割において得られた#1型の三角形の画素値として(a,b,c,−)が継承され、#2型の三角形の画素値として(b,c,d,−)が継承される。
【0079】
一方、正方形が図7(b)のような方法(第2の方法)で三角形分割されたとすると、図10の下段に示すように、分割前(正方形)の型をここでも#0と表すものとすると、この正方形の4頂点の画素値(a,b,c,d)は、三角形分割において得られた#3型の三角形の画素値として(a,c,d,)が継承され、#4型の三角形の画素値として(a,b,d,−)が継承される。
【0080】
なお、本発明においては、それぞれの三角形の3頂点の画素値に加え、三角形の斜辺中点の画素情報も加えた4つの画素値を考慮するが、図10の中で、ハイフン「−」で示した部分が斜辺中点の画素値であり、このハイフンはそれが不明であること、あるいは、その画素値の設定を必要とすることを示している。
【0081】
図11は図8で示した8種類の三角形をさらに分割したときの画素値の継承規則を示すものであり、この図11に示されるように、分割前にある型(#1から#8)であった三角形は、それを分割すると、それぞれ2つの型の三角形となるが、そのときの画素値はこの図11に示すように継承される。なお、この図11においても、ハイフン「−」で示した部分が斜辺中点の画素値であり、このハイフンはそれが不明であること、あるいは、その画素値の設定を必要とすることを示している。
【0082】
この図11によれば、たとえば、頂点の画素値がa,b,c、斜辺中点の画素値がdである#6型の三角形を分割すると、#1型と#4型の2つの三角形に分割され(図9参照)、#1型の三角形の画素値は(a,d,c,−)、#4型の三角形の画素値は(c,d,b,−)となる。
【0083】
以上の再帰的三角形分割処理のまとめを図12により説明する。ある1つの正方形を、たとえば、#1と#2の型の三角形に分割するものとする。この、#1と#2の型の三角形は、#1型についてはさらに#5型と#6型に分割され、#2型についてはさらに#7型と#8型に分割される。この分割された三角形は、さらに、より小さな三角形に分割される。なお、この再帰的な分割処理は、斜辺中点に画素が存在する限りは次々と分割可能であるが、分割限界に達しなくても所定の段階で分割処理を終了することも可能である。どの段階まで分割するかは予め設定しておくことができる。
【0084】
上述した再帰的三角形分割処理は、図13に示すような2分木で表現することができる。図13において、○の中の数字は三角形の型を示す。最も上部の内部に数字の無い○を正方形とし、これをルート(根)Rとした2分木が生成される。
【0085】
ルートRから生成される2つのノード(節)N11,N12の三角形型は、図7(a),(b)の2つの分割方法(第1の方法または第2の方法)に対応しているが、これが決定されてしまえば、それぞれのノードを2分割してできる三角形は、図11に示すような継承規則により一意に定まる。たとえば、#1型を持つ三角形は、図11からわかるように、#5型と#6型の三角形に2分される。同様に、#5型を持つ三角形は、図11からわかるように、#1型と#3型の三角形に2分される。
【0086】
以降、記述の簡略化のため、三角形型がT、3頂点の画素値がa,b,cであって、斜辺中点の画素値がdである三角形を、T(a,b,c,d)と表す。たとえば、三角形型が#6でその3頂点の画素値がa,b,cであって、斜辺中点の画素値がdである三角形は、#6(a,b,c,d)で表され、それは、#1(d,b,c,−)と#4(a,d,c,−)へ分割されるというように表される。
【0087】
この例から明らかなように、このそれぞれの三角形を分割した後の三角形において、ハイフンで示した不定である斜辺中点の画素値を補うことにより、図11の継承規則を用いて三角形領域分割を再帰的に行うことができる。
【0088】
これは、前述の従来技術の項で引用した特開平9−191409号公報に記載された技術のように、一つの三角形を表現するために、3つの頂点のX座標値が3個、Y座標値が3個、3つの頂点の画素値として3個の合計9個の画素情報を必要としそれを保持する必要のあるものに比較して、ワーストケースにおいて、1/9のデータ量である。
【0089】
以上より、図1に示した再帰的三角形領域分割手段3は、少なくとも、#1型1から#8型の8通りの三角形型を記憶する形状型記憶手段31と、三角形の3つの頂点の画素値および斜辺中点の画素値を記憶する頂点画素値記憶手段32と、三角形の斜辺中点画素値を補う斜辺中点画素値取得手段33と、図11に示す継承規則用いて三角形型を更新する形状型更新手段34と、三角形の3つの頂点の画素値および斜辺中点の画素値を更新する頂点画素値更新手段35により、再帰的に三角形領域を分割することができる。
【0090】
以上の再帰的三角形領域分割処理を具体的な数値例を用いて説明する。説明を簡単にするために、図14に示すように、1辺の画素数LがL=3(この場合は、Lが2のN乗+1であるという条件において、N=1とした場合である)の正方形を例にとる。なお、図14において、それぞれの画素を黒丸で表し、それぞれの画素に付された数値はその画素における画素値を表している。
【0091】
このような正方形に対し、図7(a)で示したような方法(第1の方法)で2分割したとすると、図15(a)に示すように、2つの三角形に分割される。この左上の三角形は、#1型の三角形であり、その頂点の画素値は(3,9,1)であるので、#1(3,9,1,−)と表され、これに斜辺中点の画素値7を補うことにより、#1(3,9,1,7)という情報を生成することができる。
【0092】
このような情報が生成されたら、この情報を用い、図16のフローチャートに示す手順で分割後の三角形を得る。すなわち、現在の型情報を用いて図11で示した継承規則の検索を行い、分割後の2つの三角形の情報を求める(ステップS21)。そして、図11で示した継承規則の情報に基づき、現三角形の4つの画素値の並べ替えを行い、2つの新三角形を得る(ステップS22)。
【0093】
つまり、この例では、図17に示すように、#1(3,9,1,7)の情報を有する三角形は、#5(3,7,1,−)と、#6(3,9,7,−)に分割されることになる。これを示したものが、図15(a),(b)であり、#1(3,9,1,−)の情報を有する三角形は、その斜辺中点に7の画素値を補填し、それを2分割すると、#5(3,7,1,−)の情報を有する三角形と#6(3,9,7,−)の情報を有する三角形が得られる。以降、これら三角形のそれぞれの斜辺中点の画素値として、図15(c)に示すように、#5型の三角形については5を補填し、#6型の三角形T12については4を補填するという処理を行うことにより再帰的三角形領域分割を行う。
【0094】
以上の図14から図17で説明した処理は、図18に示すような2分木で表現できる。この図18の2分木表現も図13で示した2分木表現と同様に、2分木の○の中に示した三角形型は、その上位の型から一意に定まるために、データとして出力する必要はなく、その○の下に示した斜辺中点の画素値のみを補うことにより、より下位の三角形領域分割を行うことができる。
【0095】
この図18は、図14で示した正方形を三角形領域分割する場合の2分木表現であり、ルートRに相当する正方形は図14からもわかるように、その4頂点の画素値は(3,9,1,8)であって、このような正方形を図15(a),(b),(c)で説明したような三角形領域分割処理を行ったものである。
【0096】
このように、処理対象となる画像データに対し、最初の正方形の4頂点の画素値、それを最初に3角形分割したときの三角形の型、分割された三角形の斜辺中点の画素値の連鎖の3種のデータによって、正方形領域の画像を表現することができる。
【0097】
なお、このデータのうち、正方形を最初に三角形に分割する際、図7(a),(b)の第1の方法または第2の方法のいずれかで行うかを固定することは可能である。また、正方形領域の1辺に含まれる画素数Lは、2のN剰+1(Nは自然数)となるような条件を満たすようにすると、分割された三角形の斜辺中点には必ず画素が存在する。このため、処理を容易にするためには、正方形領域の1辺に含まれる画素数Lが2のN剰+1(Nは自然数)であることが望ましい。
【0098】
以上のような処理の結果、たとえば図19に示すように、ある画像が複数の正方形領域に分割されている場合、そのそれぞれの正方形領域は、図20に示されるような複数の2分木に変換されることになる。
【0099】
ところで、2分木として表現された画像データを、伝送、記録するためには、それを1次元のデータ列に変換する必要がある。その順序には幾つもの方法が考えられるが、たとえば、以下のような2種の方法も可能である。
【0100】
図21は、2分木の幅方向優先の出力方法を示したものである。これは数字の下にアルファベットA,B,C,・・・で示した順番(アルファベット順)にデータが1次元化される。たとえば、最初に、ルートRとして正方形のデータ(4頂点の画素値)Aが出力され、その後、このルートRの下位の同じ深さのノードN11、N12のデータ(斜辺中点の画素値)B,Cが出力され、さらに、その後、ノードN11,N12の下位の同じ深さのノードN21,N22,N23,N24のデータ(斜辺中点の画素値)D,E,F,Gが出力される。
【0101】
図22は、この方法により1次元化されたデータの結果を示すものであり、アルファベットA,B,C,・・・の順に、それぞれのアルファベットA,B,C,・・・に対応した画素値が出力される。
【0102】
図23は、2分木の深さ方向優先の出力方法を示したものである。これも図21と同様にアルファベットA,B,C,・・・で出力の順番を示してある。この場合、ルートRのデータAを出力したあと、ノードN11のデータBを出力し、その後は、それの下位にあたるノードN21のデータCの出力が行われる。このように、2分木の底に到達するまでの出力が行われると、ノードN22のデータDの出力が行われる。そして、今度は、ノードN12のデータEの出力が行われ、続いて、そのノードN12の下位にあたるノードルN23のデータFを出力するというようなデータ出力順序となる。
【0103】
図24は、この方法により1次元化されたデータの結果を示すものであり、アルファベットA,B,C,・・・の順に、それぞれのアルファベットA,B,C,・・・に対応した画素値が出力される。
【0104】
以上のようにして、処理対象となる画像データの符号化処理が終了する。これによって符号化されたデータは、たとえば、図21または図23示されるような2分木のデータ構造となっており、その2分木に基づいて、図22または図24のようなデータ形式で出力される。
【0105】
以上説明した符号化処理をフローチャートにまとめたものが図25である。各部の詳細については説明済みであるので、ここでは概略を説明する。
【0106】
図25において、まず、正方形領域分割処理を行う(ステップS31)。これは、図3から図6で説明したように、処理対象となる画像データを1つ以上の正方形領域へ分割する処理であり、この正方形領域分割処理によって得られたそれぞれの正方形について符号化処理を行うが、すべての正方形領域を符号化したか否かを判断し(ステップS32)、すべての正方形に対してすでに符号化されていれば処理が終了したものとするが、符号化されていなければ、その正方形の4頂点画素値を出力する(ステップS33)。
【0107】
そして、三角形分割処理が終了したか否かを判断し(ステップS34)、終了していれば、ステップS32に戻り、終了していなければ、すべての三角形を符号化したかを判断する(ステップS35)。ここで、すべての三角形の符号化が終了していなければ、斜辺中点の画素値を出力し(ステップS36)、三角形領域更新処理を行い(ステップS37)、ステップS35に戻る。
【0108】
そして、すべての三角形の符号化が終了し、かつ、三角形分割処理が終了し、さらに、すべての正方形領域の符号化が終了していれば、その画像に対する符号化処理を終了する。
【0109】
以上の説明は処理対象となる画像データを符号化する処理についての説明であるが、そのおおまかな処理としては、処理対象の画像データを正方形領域として取り出し、取り出された正方形を再帰的に三角形領域に分割し、得られたそれぞれの三角形領域の3頂点の画素値と斜辺中点の画素値を得るようにしている。このとき、再帰的分割処理によって得られるそれぞれの三角形の型は、元の正方形を2分割の仕方を決めておけば、以降は分割順に従って自動的に決めることができる。また、それぞれの三角形の頂点の画素値は正方形の持っている画素値をそのまま継承できるので、斜辺中点の画素値を元の正方形から求めれば、画像全体を図18に示すような2分木で表現でき、それを図21と図22または図23と図24に示すように1次元化して出力することができる。
【0110】
このような処理を行うことにより、処理対象となる画像データを表現するために保持すべきデータはごく少量ですみ、それによって、演算を大幅に簡略化することができるとともにメモリの使用量を大幅に減らすことができる。
【0111】
次に、符号化されたデータを復号化する処理について説明する。図26は本発明の基礎となる画像処理装置の復号化側の構成を示すブロック図である。この復号化側の構成としては、大きく分けると、符号化データ入力手段11、符号化データ解析手段12、再帰的三角形領域合成手段13、三角形領域合成制御手段14、正方形領域合成手段15、画像データ出力手段16を有している。
【0112】
再帰的三角形領域合成手段13は、少なくとも、分割された三角形の型(前述の符号化の説明においては#1型から#8型の8種類としているので、ここでも#1型から#8型の8種類とする)の三角形型を記憶する形状型記憶手段131と、三角形の3つの頂点の画素値および斜辺中点画素値を記憶する頂点画素値記憶手段132と、三角形の斜辺中点の画素値を補う斜辺中点画素値取得手段133と、前述の図11の継承規則を用いて三角形型を更新する形状型更新手段134と、三角形の3つの頂点の画素値および斜辺中点の画素値を更新する頂点画素値更新手段135とを有している。
【0113】
また、符号化データ入力手段11は、図1で示した符号化データ出力手段6からの符号化データ(たとえば、図22や図24に示したような符号化データ)を、伝送路や記憶媒体から入力する。この符号化データ入力手段11に入力される符号化データとしては、図27(a)に示されるように、最初に、正方形の4頂点の画素値が入力される。たとえば、符号化データとして図24を例にとれば、まず、図24で示す符号化データにおける下線部Aの部分が読み込まれ、正方形の4頂点の画素値(3、9、1、8)が復元される。その後、図24の下線部Bに対応する画素値(7)が読み込まれ、図27(a)に示すような2分木の太線の部分が復元される。またそれは、正方形領域の太線部分に対応する。以降、次々にデータ(画素値)が読み込まれ、図27(b),(c)のように、データの2分木の太線部分が復元され、それによって、正方形領域の太線部分が復元される。
【0114】
図28は、図27の処理内容をプログレッシブな復元の立場から説明したものである。図22で示す符号化データフォーマットによれば、最初に図28(a)のように2分木の上位層のみが復元され、続いて、同図(b)のように2分木の次の階層が復元され、さらに、同図(c)のように2分木のさらに次の階層が復元されというように、2分木の階層ごとに順次復元され、最終的には同図(d)に示すように、2分木の底までの復元がなされる。
【0115】
これによって、処理対象となる画像は、2分木の階層ごとの復元に伴って、順次、大きく、あるいは、解像度が上がったものとなる。
【0116】
なお、たとえば、図28(a)のようなデータ量が少なく小さい画像をそのまま最終画像と同じように拡大しようとすると、解像度の小さい画像となる。すなわち、これは、画像の見え方と言う観点で言えば、画像全体を縮小表示したものであると考えることができる。あるいは、画像サイズを元データと同じとした場合は、それを低い解像度で示したものであると考えることもできる。
【0117】
仮に、画像全体を低い解像度で表現したものであると考える場合、各々の三角形領域は拡大されることになる。この時、三角形領域の内部は、その3頂点の画素値を用いて平面として内挿することにより求めることもできる。勿論、その周辺の三角形領域のデータを用いて、より高次の推定を行うことも可能である。
【0118】
3頂点の画素値を用いて平面として内挿する場合は、図29のような方法を用いることが可能である。この図29について簡単に説明する。三角形の3頂点への位置ベクトルをa,b,c(a,b,cそれぞれの上に→が付される)とし、その頂点における画素値をA,B,Cとする。ここで、画素値を求めるべき位置(pとする)の位置ベクトルをp(pの上に→が付される)とし、この位置ベクトルp(pの上に→が付される)が、
【0119】
【数2】
Figure 2004289284
【0120】
で与えられるものとする。なお、画素値を求めるべき位置pがその三角形領域の内部であるためには、x、y、zは0以上の実数または重み係数であり、かつ、
x+y+z=1 (3)
の条件を満たす必要がある。このx,y,zを用い、位置pにおける画素値Pは、
P=xA+yB+zC (4)
により求められる。
【0121】
ところで、前述の実施形態1における図21、図22または図23、図24で示したデータの1次元化方法は、画像データの内容とは無関係なものである。しかし、符号化方法あるいは記憶媒体からのデータの読み出し方法を変えることにより、関心領域あるいはROI(Region Of Interest)を優先的に高画質化することができる。
【0122】
たとえば、図30に示すように、2分木の中の斜線を施した部分を優先的に伝送あるいは読み出すとする。仮に、この2分木の階層の深い部分が、図31に示すように、本発明の実施形態1および実施形態2の説明で用いている画像例としての猿の顔画像の目の部分であるとする。そうすると、図30の2分木の浅い階層の復元処理では図32(a)のように、画像全体が低解像度で復元されたものが、階層が深くなるに連れ、図32(b)のように、先ず目の部分から高解像度化が進行し、最終的に、図32(c)のように全体が高解像度化されるというような表示が可能である。勿論、このような表示は途中の段階で中止することもできる。
【0123】
このように、2分木で表されるデータの伝送あるいは読み出し順に、関心領域あるいはROIに基づいて優先度を設定することによって、画像全体の中のある特定部分のみをいち早く高解像度で表示させることができる。
【0124】
これによって、多数の画像データの中から所望とする画像データを検索したり画像データの分類を行うような場合、個々の画像の特徴的な部分のみをいち早く高解像度で表示させることができるので、検索や分類を効率よく行うことができる。また、このとき、個々の画像の内容がわかった段階で表示処理を中止し、それ以降の表示処理を行わないようにすることもできる。
【0125】
以上説明した復号化処理をフローチャートにまとめたものが図33である。各部の詳細については説明済みであるので、ここでは概略を説明する。
【0126】
図33において、まず、すべての正方形領域を復号化したか否かを判断し(ステップS41)、すべての正方形領域の復号化が終了していなければ、その正方形の4頂点画素値を復号する(ステップS42)。そして、三角形合成処理が終了かを判断し(ステップS43)、終了していれば、ステップS41に戻り、終了していなければ、すべての三角形を合成したかを判断する(ステップS44)。そして、すべての三角形の合成が終了していなければ、斜辺中点の画素値を復号し(ステップS45)、三角形領域合成処理を行い(ステップS46)、ステップS44に戻る。
【0127】
そして、すべての正方形領域の復号化が終了していれば(ステップS41)、正方形領域合成処理を行い(ステップS47)、復号化処理を終了する。
【0128】
このステップS47による正方形領域合成処理された画像データは、図26で示した画像データ出力手段16によって出力処理される。この画像データ出力手段16は、図34に示すように、色データ入力手段161、間引きデータ復元手段162、色変換手段163、画素データ復元手段164を有した構成となっており、復元された画像データから、画像幅、画像高さを正方形の1辺の整数倍にするために補填されたデータを取り除き、元の画像を出力する。なお、この画像データ出力手段16が行う画像データ出力処理には、ノイズ低減処理であるとか、何らかの後処理などが含まれても良い。
【0129】
次にこれまで説明した画像処技術を基に、本発明の画像処理方法および画像処理装置ならびに画像処理プログラムについて説明する。
【0130】
本発明では、上述したような画像処理技術において用いた2分木のデータ構造をもとに、フレーム間相関を用いることで動画符号化およびその復号化を行うものである。なお、本発明は、フレーム間相関を用いるが動き補償は行わないのが特徴であり、また、動画符号化処理はこれまで説明した本発明の基礎となる画像処理技術における符号化の後処理として実行されるものである。以下、詳細に説明する。
【0131】
図35は本発明の画像処理装置の符号化側の構成を示すもので、その構成を大きく分けると、画像データ入力手段1、正方形領域分割手段2、再帰的三角形領域分割手段3、三角形領域分割制御手段4、符号化データ生成手段5、符号化データ出力手段6、符号化データ差分化手段20(符号化データ記憶手段7、前フレーム符号化データ記憶手段8、符号化データ比較手段9、符号化データ選択手段10からなる)を有した構成となっている。
【0132】
この図35の構成は図1で示した構成に対して、符号化データ生成手段5と符号化データ出力手段6との間に、符号化データ差分化手段20としての符号化データ記憶手段7、前フレーム符号化データ記憶手段8、符号化データ比較手段9、符号化データ選択手段10が設けられている点が異なるだけで、その他は図1と同じ構成であるので、同一構成要素についての説明はここでは省略する。
【0133】
符号化データ記憶手段7は符号化データ生成手段5からの符号化データ、つまり、本発明の基礎となる画像処理技術において符号化された符号化データを一時的に記憶するものである。
【0134】
前フレーム符号化データ記憶手段8は、符号化データ出力手段6から出力された前フレームの符号化データを記憶するものである。この前フレーム符号化データ記憶手段8に記憶される前フレーム符号化データは、符号化データ記憶手段7に記憶されている前フレームに対応する符号化データそのものではなく、たとえば、符号化データ選択手段10で現フレームデータが選択された場合は、その現フレームデータによって前フレーム符号化データ記憶手段8の内容が更新され、それによって、その更新データが前フレームの符号化データとなる。
【0135】
符号化データ比較手段9は、符号化データ記憶手段7に記憶された現フレーム符号化データと前フレーム符号化データ記憶手段8に記憶された前フレーム符号化データとを比較し、その差異が所定値未満であるか否かを判定し、所定値未満であると判断された場合は、現フレームの符号化データを前フレームの符号化データで置換する。
【0136】
符号化データ選択手段10は、現フレーム符号化データか前フレーム符号化データのいずれかを選択するもので、符号化データ比較手段9の比較判定結果に基づき、差異が所定値未満の場合は、置換された符号化データ(前フレームの符号化データ)を選択し、差異が所定値以上である場合は現フレーム符号化データを選択する。
【0137】
符号化データ出力手段6は、符号化データ選択手段10で選択結果を当該フレームの符号化データ(1次元配列化されたデータ)として出力する。
【0138】
図36は画像を1つ以上の正方形領域に分割して、分割されたそれぞれの正方形領域の符号化を行う処理手順を示すもので、図37は分割されたある1つの正方形領域内における符号化手順を示すものであり、これらのフローチャートは、先に説明した本発明の基礎となる画像処理技術における符号化処理の説明に用いた図25のフローチャートを、画像を1つ以上の正方形領域に分割して、それぞれの正方形領域の符号化を行う処理手順と、分割されたある1つの正方形領域内における符号化を行う処理手順とに分けて示すものである。
【0139】
この図36および図37の処理手順は基本的には図25と同じであるが、図36および図37においては、切り出されたある1つの正方形領域内を符号化する処理が終了したあと、前フレームの符号化データとの差異を出力する処理が追加されている。なお、この処理についての詳細は後述する。
【0140】
図36において、まず、正方形領域分割処理を行う(ステップS51)。これは、図3から図6で説明したように、処理対象となる画像データを1つ以上の正方形領域へ分割する処理であり、この正方形領域分割処理によって得られたそれぞれの正方形について符号化処理を行うが、すべての正方形領域を符号化したか否かを判断し(ステップS52)、すべての正方形に対してすでに符号化されていれば符号化処理が終了したものとするが、すべての正方形領域の符号化がなされていなければ、その正方形領域の4頂点画素値を符号化データ記憶手段7に出力(ステップS53)するとともに、その正方形領域内の符号化処理(図37参照)を行う(ステップS54)。そして、その正方形領域内の符号化処理が終了すると、前フレームの符号化データとの差異を符号化する処理を行う(ステップS55)。なお、この前フレームの符号化データとの差異を符号化する処理の具体例については図44から図47を参照して後に説明する。
【0141】
図37は図36におけるステップS54の処理、つまり、ある1つの正方形領域内の符号化処理手順であり、まず、ある1つの正方形領域における2分木の全階層について符号化したかを判断し(ステップS61)、全階層の符号化が終了していれば符号化処理を終了し、全階層の符号化が終了していなければ、その階層のすべての三角形領域を符号化したかを判断する(ステップS62)。
【0142】
ここで、その階層のすべての三角形領域の符号化が終了していれば、ステップS61に戻る。また、その階層のすべての三角形領域の符号化が終了していなければ、その三角形領域の斜辺中点画素値を取得する(ステップS63)。そして、その取得した斜辺中点画素値を符号化し、符号化データ記憶手段7に出力し(ステップS64)、ステップS62に戻り、その階層のすべての三角形の符号化が終了していなければ、ステップS62以降の処理を繰り返し、その階層のすべての三角形領域の符号化が終了していれば、ステップS61に戻って、全階層の符号化を終了したか否かを判断し、全階層の符号化を終了していれば、符号化処理を終了し、全階層の符号化を終了していなければ、ステップS62以降の処理を繰り返す。
【0143】
ここで、図35に示した符号化データ差分化手段20の処理、つまり、符号化データ生成手段5によって生成された個々のフレーム対応の符号化データに対し、フレーム間相関を用い、現フレームに対する符号化データを前フレーム符号化データで置換できるか否かを判定し、前フレーム符号化データで置換できると判定された場合は、それを示す情報を出力する処理について説明する。
【0144】
この処理は、前フレーム符号化データ記憶手段8に記憶された前フレーム符号化データと、符号化データ記憶手段7に一時的に記憶された現フレーム符号化データとの比較を符号化データ比較手段9が行って、その比較結果に基づいた符号化データを符号化データ選択手段10が選択して出力するもので、これは、前述した2分木で示すデータ構造の最終階層から、上位の階層に向かって行われる。
【0145】
この2分木における最終階層の三角形領域は、それ以上分割できない三角形領域であり、斜辺中点画素値を考慮する必要がないので、3つの頂点の画素値で構成される。したがって、この最終階層の三角形領域の前フレームと現フレームとの比較は、それぞれの3頂点画素値の比較で済むため、下記の(5)式のような単純な計算式で両者の差異Errを求めることができる。
【0146】
【数3】
Figure 2004289284
【0147】
この(5)式において、Diは現フレームのある三角形領域の画素値(iは3つの頂点の位置を表すので1から3の値をとる)、Piは前フレームの同じ三角形領域の画素値であり、iは同じく1から3の値をとる。この(5)式を前述した従来技術の説明で用いた(4)式と比べると、計算が単純であり計算量が大幅に少ないことがわかる。
【0148】
ここで、具体例を参照しながら説明する。この具体例の説明で用いる2分木を図38に示す。この図38に示す2分木は、ある1つの正方形領域について図39の(a)〜(d)に示すような三角形領域分割処理を行った場合に生成されるものであり、ここでは、説明の都合上、2分木を構成するそれぞれの三角形領域に付される符号(型番号)は、これまでの説明で用いた2分木(たとえば、図13など)とは異なった符号が付されている。
【0149】
この場合、正方形を2分割して得られた第1階層の2つの三角形領域に#10,#11の型番号を付し、この第1階層の三角形領域#10,#11をそれぞれ2分割して得られた第2階層の4つの三角形領域に#20,#21,#22,#23の型番号を付し、この第2階層の三角形領域#20,#21,#22,#23#をそれぞれ2分割して得られた第3階層の8つの三角形領域に#30,#31,#32,#33,#34,#35,#36,#37の型番号を付し、この第3階層の8つの三角形領域#30,#31,#32,#33,#34,#35,#36,#37をそれぞれ2分割して得られた第4階層の16個の三角形領域に#40,#41,#42,・・・,#49,#4a,#4b,#4c,#4d,#4e,#4fの型番号を付すことにする。
【0150】
このような第1階層から第4階層の4つの階層で構成される2分木として表現された画像データを、1次元のデータ列に変換する。ここでは、図40で示すように2分木の幅方向優先の出力方法によって、データ(各三角形領域の斜辺中点画素値)を出力、すなわち、第1階から第4階層において、それぞれの階層ごとに太線で示す矢印方向に沿ってデータ(各三角形領域の斜辺中点画素値)を出力すると、図41のような1次元のデータ列が得られる。
【0151】
図42はここで用いられる画像例を示すもので、(a)はある1つの正方形領域における前フレーム画像、(b)はその現フレーム画像である。この図42からもわかるように、現フレーム画像が前フレーム画像と異なるのは、画像の左下部分に人間が存在している点だけであり、その他は何ら変化していない。
【0152】
この図42に示す画像例の正方形領域を再帰的三角形領域分割したものが図43(a)、(b)である。この図43(a)、(b)の再帰的三角形領域分割は、図39に対応するものであるので、図43(a)の前フレーム画像および(b)の現フレーム画像は、それぞれ図38のような2分木のデータ構造として表される。
【0153】
ここで、図43(a)、(b)における最終階層(第4階層)の三角形領域、つまり、図38の2分木における第4階層の16個の三角形領域#40,#41,#42,・・・,#49,#4a,#4b,#4c,#4d,#4e,#4fそれぞれについて、上述の(5)式を用いて、前フレームとデータと現フレームデータとの差異Errを求め、求められたそれぞれの差異Errが所定値未満であるか否かを判定する。
【0154】
この判定の結果、この場合、#42,#43,#48,#49の4つの三角形領域だけが前フレーム画像の対応する三角形領域と差異Errが所定値以上であると判定される。これを2分木で表したものが図44である。この場合、図44における破線枠で囲った第4階層の三角形領域のうち、#42,#43,#48,#49の4つの三角形領域(斜線が施されている)だけが前フレーム画像の対応する三角形領域と差異が所定値以上異なっていると判定される。
【0155】
これによって、#42,#43,#48,#49の4つの三角形領域は前フレームの符号化データを用いることはできない(前フレームの符号化データで置換することはできない)と判定され、それ以外の三角形領域は、前フレームの符号化データで置換できると判定される。
【0156】
このようにして、最終階層(第4階層)のそれぞれの三角形領域において(5)式を計算して、求められた差異Errが所定値以上か否かの判定を行えば、それより上位の階層については、(5)式を用いた比較計算を行う必要はなく、自身を2分割して得られた三角形領域(自身から下位に伸びる2つの枝の三角形領域)の結果に基づいて、前フレーム符号化データで置換できるか否かの判断が行える。これについて、図45、図46、図47を用いて説明する。
【0157】
図45は第3階層に対して第4階層の結果を用いて前フレーム符号化データで置換できるか否かの判断を行った結果を示すものである。この場合、自身の三角形領域#30,#31,・・・,#37の三角形領域を表すノードから下に伸びる2つの枝で示される2つの三角形領域が前フレーム符号化データで置換可能であれば、自身も置換可能であると判定され、2つの枝で示される2つの三角形領域の一方が置換可能でなければ、自身も置換可能ではないと判定される。
【0158】
すなわち、この第3階層においては、#30の三角形領域は、それよりも下位の#40、#41の2つの三角形領域がともに置換可能であるので、自身(#30の三角形領域)も置換可能であると判定され、同様に、#32、#33、#33、#35、#36、#37の三角形領域も、自身よりも下位の2つの三角形領域がそれぞれともに置換可能であるので、自身も置換可能であると判定される。
【0159】
これに対して、#31の三角形領域は、それよりも下位の#42、#43の2つの三角形領域がともに置換可能ではないので、自身(#31の三角形領域)も置換可能ではないと判定される。同様に、#34の三角形領域は、それよりも下位の#48、#49の2つの三角形領域がともに置換可能ではないので、自身(#34の三角形領域)も置換可能ではないと判定される。
【0160】
続いて、第2階層について同様の判定を行う(図46参照)。この第2階層においては、#20の三角形領域は、それよりも下位の#30、#31の2つの三角形領域のうち、#31の三角形領域が置換可能でないので、自身(#20の三角形領域)も置換可能でないと判定され、同様に、#22の三角形領域も、自身よりも下位の#34、#35の2つの三角形領域のうち、#34の三角形領域が置換可能でないので、自身(#22の三角形領域)も置換可能でないと判定される。
【0161】
これに対して、#21の三角形領域は、それよりも下位の#32、#33の2つの三角形領域がともに置換可能であるので、自身(#21の三角形領域)も置換可能であると判定され、同様に、#23の三角形領域は、それよりも下位の#36、#37の2つの三角形領域がともに置換可能であるので、自身(#23の三角形領域)も置換可能であると判定される。
【0162】
続いて、第1階層について同様の判定を行う(図47参照)。この第1階層においては、#10の三角形領域は、それよりも下位の#20、#21の2つの三角形領域のうち、#20の三角形領域が置換可能でないので、自身(#10の三角形領域)も置換可能でないと判定され、同様に、#11の三角形領域も、自身よりも下位の#22、#23の2つの三角形領域のうち、#22の三角形領域が置換可能でないので、自身(#11の三角形領域)も置換可能でないと判定される。
【0163】
以上の処理がなされることによって、処理対象となっているある1つの正方形領域の現フレーム符号化データは、その一部が前フレーム符号化データで置き換えることができる。以上のような処理がなされたあとの現フレーム符号化データを2分木で表したものが図48である。
【0164】
この図48において、四角で示したノードで示される三角形領域は、それ以下の階層すべてを前フレーム符号化データの2分木の同じ位置の符号化データで置換できることを示している。この例では、#21、#23、#30、#35の三角形領域は、前フレーム符号化データの2分木の同じ位置の符号化データで置換できる。
【0165】
この図48に示される2分木構造の符号化データに対し、図40と同様のデータ読み出しが行われることによって、1次元のデータ配列を生成することができる。
【0166】
図49は図48に示した2分木を第1階層から第4階層までそれぞれの階層ごとに図示の太線矢印で示すような方向にデータ読み出しを行う例を説明する図であり、これを縦に並べて示したものが図50である。
【0167】
この図50は先に説明した図41の1次元化されたデータ配列に対応するものである。この図50の右端に示される四角で囲った“0”または“1”の1ビットのデータは、符号化データの置換がなされているか否かを示すもので、“0”が与えられた三角形領域はデータ置換がなされていないことを示し、“1” が与えられた三角形領域はそれ以降において符号化データ置換がなされていることを示している。
【0168】
この例では、#10、#11,#20、#22、#31、#34、#42、#43、#48、#49の三角形領域はそれぞれ“0”が与えられ、#21、#23、#30、#35の三角形領域はそれぞれ“1”が与えられている。
【0169】
これは、#21、#23、#30、#35の三角形領域はその符号化データが前フレームの同じ領域の符号化データで置換されていることを示し、#21の三角形領域は、前フレームにおける#21の三角形領域の符号化データが用いられる。同様に、#23の三角形領域は、前フレームにおける#23の三角形領域の符号化データが用いられる。同様に、#30の三角形領域は、前フレームにおける#30の三角形領域の符号化データが用いられる。同様に、#35の三角形領域は、前フレームにおける#35の三角形領域の符号化データが用いられる。
【0170】
この図50で示す1次元化されたデータ配列を図41で示した1次元化されたデータ配列と比較すると、より多くのデータが省略されていることがわかり(省略されている三角形領域は破線枠で示されている)、データ圧縮率がより高いものとなっている。
【0171】
また、この図50からもわかるように、ある三角形領域(たとえば、#21,#23,#30,#35の三角形領域)において符号化データ置換がなされている場合、それよりも下位の三角形領域においては、符号化データ置換がなされていることを明示的に示す必要がないことも特徴の1つである。これは、本発明においては、それぞれの三角形領域の位置関係が自明であるため、上位の三角形領域において符号化データ置換がなされた場合、それより下位のどの三角形領域が符号化データ置換対象であるかが自明となるためであり、それによって、下位の三角形領域において、データ置換を示す符号の付加は不要となる。そして、この図51で示す符号化データは復号化側に送られて復号化される。
【0172】
図51は本発明に係る画像処理装置の復号化側の構成を示すブロック図である。この復号化側の構成としては、大きく分けると、符号化データ入力手段11、符号化データ解析手段12、再帰的三角形領域合成手段13、三角形領域合成制御手段14、正方形領域合成手段15、画像データ出力手段16、符号化データ選択判定手段30(前フレーム符号化データ記憶手段17、符号化データ選択手段18からなる)を有している。
【0173】
符号化データ解析手段12は、符号化データ入力手段11に入力された符号化データを解析し、符号化データに与えられた1ビットの情報(図50に示す符号化データ置換の有無を示す情報)に基づいて、その符号化データが現フレームに対する差分データであるのか、それとも、前フレーム符号化データを用いることを要求したデータ(データ置換の要求されたデータ)であるのかを判定する。
【0174】
前フレーム符号化データ記憶手段17は、前フレーム符号化データを記憶するものであるが、この前フレーム符号化データ記憶手段17に記憶される前フレーム符号化データは、符号化データ入力手段11が入力した前フレームに対応する符号化データそのものではなく、たとえば、符号化データ選択手段18によって選択されたデータによってデータ更新がなされた場合は、その更新されたデータが前フレームの符号化データとして記憶される。
【0175】
符号化データ選択手段18は、符号化データ解析手段12の解析結果に基づき、現フレームの差分データか、あるいは、前フレーム符号化データ記憶手段17に記憶されたデータのいずれかを選択する。そして、選択されたデータが現フレームに対する差分データであった場合には、それを用いて、前フレーム符号化データ記憶手段17の内容を更新する。
【0176】
このように、図51の構成は本発明の基礎となる画像処理技術で説明した復号化側の構成(図26参照)に対して、符号化データ解析手段12と三角形領域合成制御手段14との間に、前フレーム符号化データ記憶手段17と符号化データ選択手段18が設けられている点が異なるだけで、あとは、図26と同じであるので、同一構成要素については同一符号を付すことでその詳細な説明はここでは省略する。
【0177】
図52および図53は本発明の復号化処理手順を説明するためのフローチャートであり、図52は分割されたすべての正方形領域の復号化を行う処理手順を示すもので、図53はある1つの正方形領域における復号化手順を示すものである。
【0178】
なお、これら図52および図53のフローチャートは、先に説明した本発明の基礎となる画像処理技術における復号化処理の説明に用いた図33のフローチャートを、分割されたすべての正方形領域の復号化を行う処理手順と、ある1つの正方形領域内における復号化を行う処理手順とに分けて示すものであり、基本的な処理は図33と同じであるが、図53に示すある1つの正方形領域内を復号化する処理において、現在処理対象となっている三角形領域に対して前フレームの符号化データが選択されたか否か判定する処理と、その判定結果に対応した処理が追加されている。
【0179】
図52において、まず、すべての正方形領域を復号化したか否かを判断し(ステップS71)、すべての正方形領域の復号化が終了していれば、正方形領域合成処理を行って(ステップS72)、復号化処理を終了し、すべての正方形領域の復号化が終了していなければ、その正方形の4頂点画素値を復号し(ステップS73)、その正方形領域内の合成処理(図53参照)を行う(ステップS74)。
【0180】
図53はある1つの正方形領域の復号化処理を示すもので、まず、全階層を復号化したかを判断し(ステップS81)、全階層の復号化が終了していれば復号化処理を終了し、全階層の復号化が終了していなければ、その階層(現在処理対象となっている階層)のすべての三角形を合成したかを判断する(ステップS82)。
【0181】
そして、その階層のすべての三角形の合成が終了していなければ、その三角形領域(現在、符号化処理対象となっている三角形領域)に対し、前フレームの符号化データを選択か否かを判定し(ステップS83)、前フレームの符号化データを選択すると判定された場合は前フレームの符号化データを取得し(ステップS84)、ステップS82に戻る。また、前フレームの符号化データを選択しないと判定された場合は、現フレームの斜辺中点画素値を復号し(ステップS85)、前フレーム符号化データを更新して(ステップS86)、ステップS82に戻る。
【0182】
そして、ステップS82において、その階層(現在処理対象となっている階層)のすべての三角形を合成したかを判断し、当該階層のすべての三角形について処理を終了していれば、その階層の三角形領域合成処理を行い(ステップS87)、ステップS81に戻る。
【0183】
このように、この復号化処理では、前フレーム符号化データを選択か否か、つまり、この場合、図50で示したデータ置換を行うか否かを示す情報(“0”または“1”)を調べ、現在、復号化対象の三角形領域の上位の三角形領域でデータ置換が可能でないことを示す“0”が与えられていれば、その三角形領域については斜辺中点画素値を復号化し、かつ、前フレーム符号化データ記憶手段17に記憶されている前フレーム符号化データの更新を行う。一方、上位の三角形領域でデータ置換を行うことを示す“1”が与えられていれば、当該三角形領域以降の階層の三角形領域全体を、前フレーム符号化データを用いて復号化する。
【0184】
なお、本発明は上述の各実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲で種々変形実施可能となるものである。たとえば、上述した符号化データ(図50で示す1次元化されたデータ)を所定の暗号化鍵を用いて暗号化してそれを復号化側に送信し、復号化側ではその暗号化された符号化データを所定の復号化鍵を用いて復号化するということもできる。
【0185】
たとえば、この暗号化として、2分木の各階層ごとの符号化データを階層に対応して用意された暗号化鍵を用いて暗号化する。これによって、各階層ごとのそれぞれの三角形領域のデータ(斜辺中点画素値)がその階層に用意された暗号化鍵で暗号化されたデータとして出力することができる。そして、このような符号化側からの暗号化データを復号化する際は、2分木の各階層に対応して用意された復号化鍵を取得して各階層ごとに復号するようにする。これにより、各階層対応の復号化鍵によってそれぞれの階層に応じた解像度の画像が復元されるので、たとえば、第2階層までの復号化鍵しか取得できなかった場合には、第2階層に対応した解像度での画像しか得ることができず、また、第3階層までの復号化鍵を取得すれば、第3階層までの解像度の画像を得ることができるというように、どの階層までの復号化鍵を取得したかによって、その階層に応じた解像度の画像を得ることができる。
【0186】
これによって、たとえば、画像データの閲覧システムなどにおいて、ユーザが閲覧できる階層(解像度)を制限することができ、閲覧する解像度に応じた課金の設定などを行うことができる。また、著作権の保護の目的などにも適用することができるといった効果が得られる。
【0187】
また、本発明は個々のフレーム(静止画像)に対し、省略できるデータはそれを省略するデータ省略処理を行ったあとに、前述した本発明の処理を行うようにすることもできる。
【0188】
このデータ省略処理は、ある1つのフレーム、つまり、ある1つの静止画像データにおいて、それを幾つかの正方形領域に分割し、分割されたぞれぞれの正方形領域を再帰的に三角形領域に分割して、それによって得られた三角形領域を平面近似した画素値と当該三角形領域の実際の画素値との誤差を求め、その誤差に基づいて当該三角形領域のそれ以降の分割を省略することができるか否かを判定する。そして、この判定結果に基づいて符号化すべき三角形領域の符号化データを生成する。
【0189】
さらに具体的に説明すると、再帰的に分割されたそれぞれの三角形領域を、その元となる正方形領域を根とする2分木で表現する。そして、前述したデータ省略判定処理は、処理対象の三角形領域の斜辺両端を結ぶ直線上の中点画素値を近似的な画素値とし、その近似的な画素値と当該三角形領域の実際の斜辺中点画素値との誤差の大きさが所定値未満であるか否かを判定する処理と、当該三角形領域が分割可能であるか否かを判定する処理とを含む処理をデータ省略判定処理として行い、このデータ省略判定処理を、前記処理対象の三角形領域を基点に、当該三角形領域を再帰的分割して得られる個々の三角形領域について順次行い、自身の三角形領域の誤差の大きさが所定値未満であると判定され、かつ、2分割されて生成された双方の三角形領域の誤差の大きさが所定値未満であると判定され、それが最終段の三角形領域にまで到達した場合に、当該処理対象となる三角形領域のそれ以上の分割が省略可能であることを示す情報を出力する。
【0190】
このように、個々のフレームにおいてこのようなデータ省略処理を行ったあとに本発明の動画処理を行うことによって、演算量、メモリ量をより一層削減することができる。
【0191】
また、本発明はこのようなデータ省略処理を行ったのちに、これまで説明した本発明の動画の符号化処理を行い、さらにそのあとに上述した暗号化処理することもできる。
【0192】
また、本発明は以上説明した本発明を実現するための処理手順が記述された処理プログラムを作成し、その処理プログラムをフロッピィディスク、光ディスク、ハードディスクなどの記録媒体に記録させておくこともでき、本発明は、その処理プログラムの記録された記録媒体をも含むものである。また、ネットワークから当該処理プログラムを得るようにしてもよい。
【0193】
【発明の効果】
以上説明したように本発明は、処理対象となるフレーム対応の画像をフレーム間相関を用いて符号化するものであるが、動き補償処理を行わないので、動きベクトルを求めるために多くの計算量、メモリ量を必要としていた従来技術に比べると、計算量やメモリ量を大幅に削減できる効果がある。なお、動き補償を行わないことによる符号化効率の劣化は、本発明の基礎となる画像処理技術である正方形領域を再帰的三角形領域分割することによって得られた2分木のデータ構造により、前フレームとの差異のある部分をそれに最も適したサイズの領域として表現することを可能とすることによって改善できる。つまり、従来例においては、前述したように、処理の単位が16画素×16画素のマクロブックという固定された大きさであったが、本発明においては、可能である限り、大きな領域を前フレームの符号化データで置換できるというような符号化を行う。逆に言うと、差異のある部分をできるだけ小さな領域で表現することによって、トータルとしての符号化効率を改善する効果がある。
【0194】
また、本発明の動画符号化で用いる符号化データ差分化処理は、個々のフレームデータ(静止画データ)の符号化を行ったあとのデータを用いて行われるので、これによっても、計算量やメモリ量を削減でき、さらに、本発明の基礎となる画像処理技術による符号化や、それを基にした個々のフレームのデータ省略処理とは独立して行うことができる。そのため、たとえば、本発明で用いる符号化データ差分化処理を行っている最中に、他の処理負荷が増加して、本発明の符号化データ差分化処理に割り当てられる演算処理量が少なくなった場合、その符号化データ差分化処理を中断し、それまでに処理された結果を直接に符号化出力とすることが可能である。また、他の処理負荷が始めから大きい場合には本発明の符号化データ差分化処理を全く行わないようにすることもできる。このように、システムの処理負荷の大きさに応じて、柔軟に対応することができる。
【0195】
また、符号化側からの符号化データを復号する際は、符号化側からの符号化データを解析し、その符号化データが現フレーム対する差分データであるのか、それとも、データ置換の要求されたデータであるのかを判定して、その判定結果に基づいて、三角形領域の合成を行うようにしている。このとき、データ置換の要求されたデータであるのか否かの判定は、データ置換の可能な最上位の三角形領域に付されたデータ置換が可能であることを示す情報に基づいて行い、ある三角形領域に対してデータ置換が可能であることを示す情報が与えられている場合には、当該三角形領域より下の階層の三角形領域全体を、そのデータ置換が可能であることを示す情報の付加された三角形領域の符号化データを用いて復号化するようにしているので、効率的な三角形領域の合成が行える。
【図面の簡単な説明】
【図1】本発明の基礎となる画像処理技術についての符号化側の構成図である。
【図2】図1で示した画像データ入力手段の構成を説明する図である。
【図3】処理対象画像が正方形である場合、その画像を三角形に分割した例を示す図である。
【図4】処理対象画像が正方形でない場合、その画像を複数の正方形領域に分割した例を示す図である。
【図5】画像を複数の正方形領域に分割する際の分割処理手順を説明するフローチャートである。
【図6】画像を複数の正方形領域に分割する際に生じる空白部分へ画素値0を補填する例を説明する図である。
【図7】ある1つの正方形を2つの三角形に分割する2つの方法(第1の方法と第2の方法)について説明する図である。
【図8】ある1つの正方形を2分割して2つの三角形を得て、さらに、その2つの三角形を再帰的に分割して得られた三角形の8種類の型を示す図である。
【図9】図8で示した三角形の型が相互に関連つけられることを説明する図である。
【図10】図7で示した2つの分割方法によって分割された三角形と元の正方形との画素値の継承規則を示す図である。
【図11】図8で示した8種類の型をそれぞれ2分割して得られた三角形の型とその画素値の継承規則を示す図である。
【図12】ある1つの正方形を第1の方法で2分割して得られた2つの三角形をさらに2分割して得られる三角形の型を示す図である。
【図13】ある1つの正方形を第1の方法で2分割して得られた2つの三角形をさらに2分割し、それをさらに2分割して得られる三角形の型を2分木で表現した図である。
【図14】図1で示した符号側の具体的な処理を説明するために一辺の画素数が3で、それぞれの画素に具体的な数値(画素値)を与えた図である。
【図15】図14を用いて三角形領域の再帰的分割処理を行う例を説明する図である。
【図16】図15で示した三角形領域の再帰的分割処理手順を説明するフローチャートである。
【図17】図15で示した三角形領域の再帰的分割処理手順を行う際の求めるべき画素値を図11に示す継承規則を参照して得る処理を説明する図である。
【図18】図15から図17で示した処理を2分木で表現した図であり、図13の2分木表現に斜辺中点の画素値を加えた図である。
【図19】処理対象画像を複数の正方形領域に分割した例を示す図である。
【図20】図19で得られた正方形領域それぞれを2分木で表現した例を説明する図である。
【図21】ある1つの2分木で表現される画像データを符号化する順序の一例を説明する図である。
【図22】図21で説明した符号化手順によって符号化されたデータ例を示す図である。
【図23】ある1つの2分木で表現される画像データを符号化する順序の他の例を説明する図である。
【図24】図23で説明した符号化手順によって符号化されたデータ例を示す図である。
【図25】本発明の基礎となる画像処理技術についての符号化処理手順を説明するフローチャートである。
【図26】本発明の基礎となる画像処理技術についての復号化側の構成図である。
【図27】図22の符号化データを復号化する手順を説明する図である。
【図28】図27の復号化手順を実際の画像の復元を例にとって説明する図である。
【図29】画像データを復号化する際の三角形内部にデータを補間する処理の一例を説明する図である。
【図30】画像データを復号化する際、ある特定の領域(たとえば関心領域)を優先的に高解像度で複合する処理を説明する図である。
【図31】図30におけるある特定の領域を処理対象となる画像に対応させた例を示す図である。
【図32】図30による復号化手順によって復元される画像の復元度合い変化を示す図である。
【図33】本発明の基礎となる画像処理技術についての復号化処理手順を説明するフローチャートである。
【図34】図26で示した画像データ出力手段の構成を説明する図である。
【図35】本発明の画像処理装置の符号化側の実施形態を説明する構成図である。
【図36】本発明の符号化側の処理手順を説明するフローチャートであり、正方形領域分割とその符号化手順を説明するフローチャートである。
【図37】本発明の符号化側の処理手順を説明するフローチャートであり、分割されたある1つの正方形領域内の符号化手順を説明するフローチャートである。
【図38】本発明の実施形態の具体例を説明するための2分木の例を示す図である。
【図39】図38に示す2分木に対応する再帰的三角形領域分割例を示す図である。
【図40】図39の2分木で表現される画像データを符号化する順序を説明する図である。
【図41】図40に示す順序で符号化されたデータを縦方向に並べたデータ配列を示す図である。
【図42】本発明の実施形態で用いる画像例であり、(a)は前フレームデータ、(b)は現フレームデータを示す図である。
【図43】図42の画像例を再帰的三角形領域分割した図である。
【図44】前フレーム符号化データと現フレーム符号化データとの差分に基づいて個々の三角形領域がデータ置換可能か否かを判定する例を説明する図であり、最終階層の三角形領域における処理例を説明する図である。
【図45】前フレーム符号化データと現フレーム符号化データとの差分に基づいて個々の三角形領域がデータ置換可能か否かを判定する例を説明する図であり、第3階層の三角形領域における処理例を説明する図である。
【図46】前フレーム符号化データと現フレーム符号化データとの差分に基づいて個々の三角形領域がデータ置換可能か否かを判定する例を説明する図であり、第2階層の三角形領域における処理例を説明する図である。
【図47】前フレーム符号化データと現フレーム符号化データとの差分に基づいて個々の三角形領域がデータ置換可能か否かを判定する例を説明する図であり、第1階層の三角形領域における処理例を説明する図である。
【図48】図38の2分木において図44から図47の処理を行った結果の2分木を示す図である。
【図49】図48に示す2分木において符号化データ出力例を説明する図である。
【図50】図49による符号化データを縦に並べたデータ配列を示す図である。
【図51】本発明の画像処理装置の復号化側の実施形態を説明する構成図である。
【図52】本発明の復号化側の処理手順を説明するフローチャートであり、それぞれの正方形領域の復号化と正方形領域の合成処理手順を説明するフローチャートである。
【図53】本発明の復号化側の処理手順を説明するフローチャートであり、分割されたある1つの正方形領域内の復号化手順を説明するフローチャートである。
【図54】従来の動画符号化の一例としてのH.261の構成を示す図である。
【符号の説明】
1 画像データ入力手段
2 正方形領域分割手段
3 再帰的三角形領域分割手段
4 三角形領域分割制御手段
5 符号化データ生成手段
6 符号化データ出力手段
7 符号化データ記憶手段
8 前フレーム符号化データ記憶手段
9 符号化データ比較手段
10 符号化データ選択手段
11 符号化データ入力手段
12 符号化データ解析手段
13 再帰的三角形領域合成手段
14 三角形領域合成制御手段
15 正方形領域合成手段
16 画像データ出力手段
17 前フレーム符号化データ記憶手段
18 符号化データ選択手段
20 符号化データ差分化手段
30 符号化データ選択判定手段
31 形状型記憶手段
32 頂点画素値記憶手段
33 斜辺中点画素値取得手段
34 形状型更新手段
35 頂点画素値更新手段
#1〜#8 三角形型

Claims (18)

  1. 動画を構成する連続した個々のフレーム対応の画像データをフレーム間相関を用いて符号化する画像処理方法であって、その画像処理手順として、
    フレーム対応の画像データを入力する画像入力ステップと、
    入力されたフレーム対応の画像データを1つ以上の正方形領域に分割する正方形領域分割ステップと、
    分割されたぞれぞれの正方形領域を再帰的に三角形領域に分割する再帰的三角形領域分割ステップと、
    分割された三角形領域を符号化する符号化データ生成ステップと、
    この符号化データ生成ステップによって生成された個々のフレーム対応の符号化データに対しフレーム間相関を用い、現フレームに対する符号化データを前フレームの符号化データで置換できるか否かを判定し、前フレームの符号化データで置換できると判定された場合は、それを示す情報を出力する符号化データ差分化ステップと、
    この符号化データ差分化ステップの判定結果に基づいた符号化データを出力する符号化データ出力ステップと、
    を含むことを特徴とする画像処理方法。
  2. 前記符号化データ差分化ステップは、前記個々のフレーム対応の符号化データを現フレーム符号化データとし、この現フレーム符号化データと前フレーム符号化データとをそれぞれの対応する三角形領域で比較し、その差異の大きさが所定値未満であるか否かを判定し、差異が所定値未満である場合には、当該三角形領域における現フレーム符号化データを前フレーム符号化データで置換することを示す情報を出力し、差異が所定値以上である場合には、当該三角形領域は現フレームの符号化データを出力することを特徴とする請求項1記載の画像処理方法。
  3. 前記再帰的に分割されたそれぞれの三角形領域を、その元となる正方形領域を根とする2分木で表現し、前記符号化データ差分化ステップは、前記前フレーム符号化データに対応する2分木の最終階層の三角形領域と現フレーム符号化データに対応する2分木の最終階層の三角形領域について、両者の差異を求め、その差異の大きさに基づいて当該三角形領域が前フレームの同じ領域の符号化データで置換できるか否かを判定し、それよりも上位の階層の三角形領域においては、自身を2分割して得られた2つの三角形領域がともに前フレームの同じ領域の符号化データで置換できる場合に、自身の三角形領域も前フレームの同じ領域の符号化データで置換できると判定することを特徴とする請求項2記載の画像処理方法。
  4. 前記前フレーム符号化データで置換することを示す情報は、当該前フレーム符号化データで置換するとされた最上位の三角形領域のみに付されることを特徴とする請求項2または3記載の画像処理方法。
  5. 動画を構成する連続した個々のフレーム対応の画像データが、1つ以上の正方形領域に分割され、そのそれぞれの正方形領域が再帰的三角形領域分割処理されたのち、その分割された三角形領域が符号化され、かつ、当該処理対象となるフレーム対応の画像データがフレーム間相関を用いて符号化されてなり、この符号化データを復号化する画像処理方法であって、その画像処理手順として、
    符号化データを入力する符号化データ入力ステップと、
    この符号化データ入力ステップに入力された符号化データを解析する符号化データ解析ステップと、
    この符号化データ解析ステップによる解析結果に基づいて、前フレーム符号化データを選択するか現フレーム符号化データを選択するかを判定する符号化データ選択判定ステップと、
    この符号化データ選択判定ステップの判定結果に基づいて、再帰的に三角形領域を合成する再帰的三角形領域合成ステップと、
    合成された三角形領域により正方形領域を合成する正方形領域合成ステップと、
    合成された正方形領域から画像データを復元して出力する画像データ出力ステップと、
    を含むことを特徴とする画像処理方法。
  6. 前記符号化データ選択判定ステップが行う前フレーム符号化データを選択するか現フレーム符号化データを選択するかの判定は、前フレームデータで置換することを示す情報に基づいて行い、ある三角形領域に前フレームデータで置換することを示す情報が与えられている場合には、当該三角形領域より下の階層の三角形領域全体を、前フレームの同じ領域の符号化データを用いて復号化することを特徴とする請求項5記載の画像処理方法。
  7. 動画を構成する連続した個々のフレーム対応の画像データをフレーム間相関を用いて符号化する画像処理装置であって、その構成要素として、
    画像データを入力する画像入力手段と、
    入力された画像データを1つ以上の正方形領域に分割する正方形領域分割手段と、
    分割されたぞれぞれの正方形領域を再帰的に三角形領域に分割する再帰的三角形領域分割手段と、
    分割された三角形領域を符号化する符号化データ生成手段と、
    この符号化データ生成手段によって生成された個々のフレーム対応の符号化データに対しフレーム間相関を用い、現フレームに対する符号化データを前フレームの符号化データで置換できるか否かを判定し、前フレームの符号化データで置換できると判定された場合は、それを示す情報を出力する符号化データ差分化手段と、
    この符号化データ差分化手段の判定結果に基づいた符号化データを出力する符号化データ出力手段と、
    を含むことを特徴とする画像処理装置。
  8. 前記符号化データ差分化手段は、前記個々のフレーム対応の符号化データを現フレーム符号化データとし、この現フレーム符号化データと前フレーム符号化データとをそれぞれの対応する三角形領域で比較し、その差異の大きさが所定値未満であるか否かを判定し、差異が所定値未満である場合には、当該三角形領域における現フレーム符号化データを前フレーム符号化データで置換することを示す情報を出力し、差異が所定値以上である場合には、当該三角形領域は現フレームの符号化データを出力することを特徴とする請求項7記載の画像処理装置。
  9. 前記再帰的に分割されたそれぞれの三角形領域を、その元となる正方形領域を根とする2分木で表現し、前記符号化データ差分化手段は、前フレーム符号化データに対応する2分木の最終階層の三角形領域と現フレーム符号化データに対応する2分木の最終階層の三角形領域について、両者の差異を求め、その差異の大きさに基づいて当該三角形領域が前フレームの同じ領域の符号化データで置換できるか否かを判定し、それよりも上位の階層の三角形領域においては、自身を2分割して得られた2つの三角形領域がともに前フレームの同じ領域の符号化データで置換できる場合に、自身の三角形領域も前フレームの同じ領域の符号化データで置換できると判定することを特徴とする請求項8記載の画像処理装置。
  10. 前記前フレーム符号化データで置換することを示す情報は、当該前フレーム符号化データで置換するとされた最上位の三角形領域のみに付されることを特徴とする請求項8または9記載の画像処理装置。
  11. 動画を構成する連続した個々のフレーム対応の画像データが1つ以上の正方形領域に分割され、そのそれぞれの正方形領域が再帰的三角形領域分割処理されたのち、その分割された三角形領域が符号化され、かつ、当該処理対象となるフレーム対応の画像データがフレーム間相関を用いて符号化されてなり、この符号化データを復号化する画像処理装置であって、その構成要素として、
    符号化データを入力する符号化データ入力手段と、
    この符号化データ入力手段に入力された符号化データを解析する符号化データ解析手段と、
    この符号化データ解析手段による解析結果に基づいて、前フレーム符号化データを選択するか現フレーム符号化データを選択するかを判定する符号化データ選択判定手段と、
    この符号化データ選択判定手段の判定結果に基づいて、再帰的に三角形領域を合成する再帰的三角形領域合成手段と、
    合成された三角形領域により正方形領域を合成する正方形領域合成手段と、
    合成された正方形領域から画像データを復元して出力する画像データ出力手段と、
    を含むことを特徴とする画像処理装置。
  12. 前記符号化データ選択判定手段が行う前フレーム符号化データを選択するか現フレーム符号化データを選択するかの判定は、前フレーム符号化データで置換することを示す情報に基づいて行い、ある三角形領域に前フレーム符号化データで置換することを示す情報が与えられている場合には、当該三角形領域より下の階層の三角形領域全体を、前フレームの同じ領域の符号化データを用いて復号化することを特徴とする請求項11記載の画像処理装置。
  13. 動画を構成する連続した個々のフレーム対応の画像データをフレーム間相関を用いて符号化する画像処理プログラムあって、その画像処理プログラムは、
    処理対象となるフレーム対応の画像データを入力する画像入力ステップと、
    入力されたフレーム対応の画像データを1つ以上の正方形領域に分割する正方形領域分割ステップと、
    分割されたぞれぞれの正方形領域を再帰的に三角形領域に分割する再帰的三角形領域分割ステップと、
    分割された三角形領域を符号化する符号化データ生成ステップと、
    この符号化データ生成ステップによって生成された個々のフレーム対応の符号化データに対しフレーム間相関を用い、現フレームに対する符号化データを前フレームの符号化データで置換できるか否かを判定し、前フレームの符号化データで置換できると判定された場合は、それを示す情報を出力する符号化データ差分化ステップと、
    この符号化データ差分化ステップの判定結果に基づいた符号化データを出力する符号化データ出力ステップと、
    を含むことを特徴とする画像処理プログラム。
  14. 前記符号化データ差分化ステップは、前記個々のフレーム対応の符号化データを一時的に記憶するとともに、前記符号化データ出力ステップからの符号化データを前フレーム符号化データとして記憶し、この前フレーム符号化データと現フレーム符号化データとをそれぞれの対応する三角形領域で比較し、その差異の大きさが所定値未満であるか否かを判定し、差異が所定値未満である場合には、当該三角形領域における現フレーム符号化データを前フレーム符号化データで置換することを示す情報を出力し、差異が所定値以上である場合には、当該三角形領域は現フレームの符号化データを出力することを特徴とする請求項13記載の画像処理プログラム。
  15. 前記再帰的に分割されたそれぞれの三角形領域を、その元となる正方形領域を根とする2分木で表現し、前記符号化データ差分化ステップは、前記前フレーム符号化データに対応する2分木の最終階層の三角形領域と現フレーム符号化データに対応する2分木の最終階層の三角形領域について、両者の差異を求め、その差異の大きさに基づいて当該三角形領域が前フレームの同じ領域の符号化データで置換できるか否かを判定し、それよりも上位の階層の三角形領域においては、自身を2分割して得られた2つの三角形領域がともに前フレームの同じ領域の符号化データで置換できる場合に、自身の三角形領域も前フレームの同じ領域の符号化データで置換できると判定することを特徴とする請求項14記載の画像処理プログラム。
  16. 前記前フレーム符号化データで置換することを示す情報は、当該前フレーム符号化データで置換するとされた最上位の三角形領域のみに付されることを特徴とする請求項14または15記載の画像処理プログラム。
  17. 動画を構成する連続した個々のフレーム対応の画像データが1つ以上の正方形領域に分割され、そのそれぞれの正方形領域が再帰的三角形領域分割処理されたのち、その分割された三角形領域が符号化され、かつ、当該処理対象となるフレーム対応の画像データをフレーム間相関を用いて符号化されてなり、この符号化データを復号化する画像処理プログラムであって、その画像処理プログラムは、
    符号化データを入力する符号化データ入力ステップと、
    この符号化データ入力ステップに入力された符号化データを解析する符号化データ解析ステップと、
    この符号化データ解析ステップによる解析結果に基づいて、前フレーム符号化データを選択するか現フレーム符号化データを選択するかを判定する符号化データ選択判定ステップと、
    この符号化データ選択判定ステップの判定結果に基づいて、再帰的に三角形領域を合成する再帰的三角形領域合成ステップと、
    合成された三角形領域により正方形領域を合成する正方形領域合成ステップと、
    合成された正方形領域から画像データを復元して出力する画像データ出力ステップと、
    を含むことを特徴とする画像処理プログラム。
  18. 前記符号化データ選択判定ステップが行う前フレーム符号化データを選択するか現フレーム符号化データを選択するかの判定は、前フレーム符号化データで置換することを示す情報に基づいて行い、ある三角形領域に前フレーム符号化データで置換することを示す情報が与えられている場合には、当該三角形領域より下の階層の三角形領域全体を、前フレームの同じ領域の符号化データを用いて復号化することを特徴とする請求項17記載の画像処理プログラム。
JP2003076243A 2003-03-19 2003-03-19 画像処理方法および画像処理装置ならびに画像処理プログラム Expired - Fee Related JP4232496B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003076243A JP4232496B2 (ja) 2003-03-19 2003-03-19 画像処理方法および画像処理装置ならびに画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003076243A JP4232496B2 (ja) 2003-03-19 2003-03-19 画像処理方法および画像処理装置ならびに画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2004289284A true JP2004289284A (ja) 2004-10-14
JP4232496B2 JP4232496B2 (ja) 2009-03-04

Family

ID=33291347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003076243A Expired - Fee Related JP4232496B2 (ja) 2003-03-19 2003-03-19 画像処理方法および画像処理装置ならびに画像処理プログラム

Country Status (1)

Country Link
JP (1) JP4232496B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7796835B2 (en) 2004-11-18 2010-09-14 Ziosoft, Inc. Computer readable medium for image processing and image processing method
JP2014006900A (ja) * 2012-06-22 2014-01-16 Palo Alto Research Center Inc 圧縮水平順序付けエッジシーケンス符号化のためのシステム及び方法
CN110169060A (zh) * 2017-01-09 2019-08-23 Sk电信有限公司 用于对图像进行编码或解码的设备和方法
WO2020259372A1 (zh) * 2019-06-24 2020-12-30 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN113362233A (zh) * 2020-03-03 2021-09-07 浙江宇视科技有限公司 图片处理方法、装置、设备、系统及存储介质
CN113438484A (zh) * 2021-06-28 2021-09-24 遥聚信息服务(上海)有限公司 一种遥感图像的数据传输方法及系统
RU2797353C1 (ru) * 2019-06-24 2023-06-02 Ханчжоу Хиквижен Диджитал Текнолоджи Ко., Лтд. Способ, аппарат и устройство кодирования и декодирования

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7796835B2 (en) 2004-11-18 2010-09-14 Ziosoft, Inc. Computer readable medium for image processing and image processing method
JP2014006900A (ja) * 2012-06-22 2014-01-16 Palo Alto Research Center Inc 圧縮水平順序付けエッジシーケンス符号化のためのシステム及び方法
US9876638B2 (en) 2012-06-22 2018-01-23 Palo Alto Research Center Incorporated System and method for compressed level-ordered edge sequence encoding
CN110169060A (zh) * 2017-01-09 2019-08-23 Sk电信有限公司 用于对图像进行编码或解码的设备和方法
WO2020259372A1 (zh) * 2019-06-24 2020-12-30 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
RU2797353C1 (ru) * 2019-06-24 2023-06-02 Ханчжоу Хиквижен Диджитал Текнолоджи Ко., Лтд. Способ, аппарат и устройство кодирования и декодирования
US12041266B2 (en) 2019-06-24 2024-07-16 Hangzhou Hikvision Digital Technology Co., Ltd. Encoding and decoding method, apparatus and device
CN113362233A (zh) * 2020-03-03 2021-09-07 浙江宇视科技有限公司 图片处理方法、装置、设备、系统及存储介质
CN113362233B (zh) * 2020-03-03 2023-08-29 浙江宇视科技有限公司 图片处理方法、装置、设备、系统及存储介质
CN113438484A (zh) * 2021-06-28 2021-09-24 遥聚信息服务(上海)有限公司 一种遥感图像的数据传输方法及系统

Also Published As

Publication number Publication date
JP4232496B2 (ja) 2009-03-04

Similar Documents

Publication Publication Date Title
KR101461209B1 (ko) 2d 매트릭스들에 인코딩 파라미터들을 저장하는 이미지 압축을 위한 방법 및 장치
US20240205431A1 (en) Information processing apparatus and method
KR20160114570A (ko) 고정폭 가변길이의 화소 샘플값 문자열의 매칭이 강화된 영상 압축 방법 및 장치
KR100574702B1 (ko) 화상부호/복호방법 및 그 프로그램을 기록한 기록매체
JP4656912B2 (ja) 画像符号化装置
JP2013211908A (ja) ビデオ圧縮方法
JP2006174415A (ja) 画像復号装置、画像復号プログラム、画像復号方法、画像符号化装置、画像符号化プログラム及び画像符号化方法
CN101595734A (zh) 用于减轻图像中的伪影的系统和方法
CN114731455A (zh) 使用与图像质量相关的ai元数据的设备和方法
KR20100016272A (ko) Pixon 방법을 사용한 이미지 압축 및 압축 해제
JP5689291B2 (ja) 画像復号装置、画像復号方法、画像復号プログラム、画像符号化装置、画像符号化方法、及び画像符号化プログラム
JP2003018602A (ja) 画像データ符号化および復号のための方法および装置
CN117980914A (zh) 用于以有损方式对图像或视频进行编码、传输和解码的方法及数据处理系统
JP4232496B2 (ja) 画像処理方法および画像処理装置ならびに画像処理プログラム
US8538175B1 (en) System and method for representing and coding still and moving images
JP4082194B2 (ja) 画像処理方法および画像処理装置ならびに画像処理プログラム
JP3932244B2 (ja) 画像符号/復号方法及びその装置並びにそのプログラムを記録した記録媒体
JP5307681B2 (ja) 画像符号化構造の自動生成方法,画像符号化構造の自動生成装置およびそのプログラム
US20080260029A1 (en) Statistical methods for prediction weights estimation in video coding
JP4042594B2 (ja) 画像処理方法および画像処理装置ならびに画像処理プログラム
JP2002199401A (ja) 画像符号化装置、画像復号化装置、電子カメラ、および記録媒体
JP4194472B2 (ja) 画像処理方法及び装置
WO2024140849A1 (en) Method, apparatus, and medium for visual data processing
US20230110665A1 (en) Image processing apparatus and method, and storage medium
JP4344184B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060308

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080507

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees