JP2008541282A - データ処理のための離散変換の連続拡張 - Google Patents

データ処理のための離散変換の連続拡張 Download PDF

Info

Publication number
JP2008541282A
JP2008541282A JP2008511520A JP2008511520A JP2008541282A JP 2008541282 A JP2008541282 A JP 2008541282A JP 2008511520 A JP2008511520 A JP 2008511520A JP 2008511520 A JP2008511520 A JP 2008511520A JP 2008541282 A JP2008541282 A JP 2008541282A
Authority
JP
Japan
Prior art keywords
image data
data set
doft
different spatial
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008511520A
Other languages
English (en)
Inventor
パテラ、ジリ
アトヤン、アーメン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universite de Montreal
Original Assignee
Universite de Montreal
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universite de Montreal filed Critical Universite de Montreal
Publication of JP2008541282A publication Critical patent/JP2008541282A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4084Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/62Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding by frequency transforming in three dimensions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/649Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

逆離散変換の連続拡張関数を使用して画像を補間するための方法が開示される。該方法は、画像データセットの少なくとも1ブロックを定義するステップと、少なくとも1つのブロックを表わす順離散軌道関数変換係数を計算して保存するステップとを含む。該方法は、第1および第2の異なる空間分解能を定義するステップと、保存された離散軌道関数変換係数および第1の異なる空間分解能を使用し、前記少なくとも1つのブロックを表わす離散軌道関数変換の少なくとも1つの連続拡張を使用して第1の処理済み画像データセットを計算するステップとを含む。第2の処理済み画像データセットは、保存された離散軌道関数変換係数および第2の異なる空間分解能を使用し、前記少なくとも1つのブロックを表わす離散軌道関数変換の少なくとも1つの連続拡張を使用して計算される。
【選択図】 なし

Description

本発明は、データ補間、データ圧縮、および/またはノイズ除去を含むデータ処理の分野に関し、さらに詳しくは、1次元、2次元、3次元、またはより高次元の画像補間、圧縮および/またはノイズ除去に関する。
矩形2次元グリッド上に画定された画像のような離散多次元データの補間は、多くの実際の用途で求められる。例えば、コンピュータ断層撮像に要求されるように、観察のために関心領域でズームし、画像を回転し、あるいはデータを極座標からデカルト座標に変換することが必要かもしれない。画像を処理して画素の空間分解能または位置を変化させるときに、特定の目的に最もよく適合する公知のアルゴリズムを選択することによって補間が行なわれる。補間の速度と品質との間で妥協が見出される。最速であるが品質が最悪なのは、最近隣からの新しい画素値の補間である。品質が最良であるが速度が最悪なのは、処理後の画像の各画素の周囲に原画像からの画素の数個の最近隣「環」を含む、双三次およびより高次の多項式補間アルゴリズムである。これらのアルゴリズムは全て周波数成分を変化させ、したがって原画像の初期情報を変化させることに注意されたい。
JPEGのような現在の標準圧縮技術は、画像を空間的にブロックに分割し、各ブロックの画素値に対する離散変換(JPEGの場合、これは離散コサイン変換つまりDCTである)の係数を算出するステップを含む。これらの係数は、圧縮されていなければ、逆離散変換を用いることによって、データの損失無しに各ブロックの正確な画素値を決定するために使用することができる。変換係数の無損失符号化は結果的にデータビットサイズを多少低減することができるが、大部分の場合、データ圧縮は、変換係数を表わす情報を減少することによって行なわれる。この圧縮は、画像の外観に対する影響が低減されるような仕方で行なわれる。例えば、一般的に高い周波数に対応する重要性の低い周波数に関係する係数は除去するか、あるいは低い精度で表わすことができる。このステップは係数データの量子化と呼ばれる。
R. V. Moody, J. Patera. Computation of character decompositions of class functions on compact semisimple Lie groups, Mathematics of Computation, vol.48 (1987), pp. 799-827. A.L. Onishchik, E.B. Vinberg (eds.). Lie groups and Lie algebras III: structure of Lie groups and Lie algebras, Berlin, New-York, Springer- Verlag, 1994. M. Bremner, R.V.Moody, J. Patera. Tables of dominant weight multiplicities for representations of simple Lie group algebras, Marcel Dekker, New York, 1985. W. McKay, J. Patera. Tables of dimensions, indices, and branching rules for representations of simple Lie algebras, Marcel Dekker, New York, 1981 W. McKay, J. Patera, D. Rand, Tables of representations of simple Lie algebras, Exceptional simple Lie algebras, Les Publications CRM, Montreal 1990 A. Atoyan, J. Patera, Properties of continuous Fourier extension of the discrete cosine transform and its multidimensional generalization, J. Math. Phys. Vol.45 (2004), pp.2468-2491 A. Atoyan, J. Patera, 2005, Continuous extension of the discrete cosine transform, and its applications to data processing", CRM Proceedings and Lecture Notes, vol. 39, 2005, in press; (Proc. "Workshop on group theory and numerical methods", Montreal, 26-31 May 2003), A. Atoyan, J. Patera. 2005, Application of continuous extension of DCT to FLIR images., in E. Shahbazian, G. Rogova, P. Valin (eds.) "Data Fusion for Situation Monitoring, Incident Detection, Alert and Response Management", ISO Press, Amsterdam, 2005 in press; (Proc. NATO ASI-03, Tsakhkadzor, Armenia, Aug 18-29, 2003) A. Atoyan, J. Patera, V. Sahakian, A. Akhperjanian, Fourier transform method for imaging atmospheric Cherenkov telescopes, Astroparticle Physics, vol. 23 (2005), pp. 79-95. A. Akhperjanian, A. Atoyan, J. Patera, V. Sahakian. 2005, Application of multidimensional discrete transforms on Lie groups for image processing, in E. Shahbazian, G. Rogova, P. Valin (eds.) "Data Fusion for Situation Monitoring, Incident Detection, Alert and Response Management", ISO Press, Amsterdam, 2005 in press; (Proc. NATO ASI-03, Tsakhkadzor, Armenia, Aug 18-29, 2003) J. Patera, A. Zaratsyan, Discrete and continuous cosine transform generalized to the Lie groups SU(2)x SU(2) and O(5), to appear in J. Math. Phys., May 2005. J. Patera, A. Zaratsyan, Discrete and continuous cosine transform generalized to the Lie groups SU(3) and G(2), submitted to J. Math. Phys., 2005 K. R. Rao, P. Yip, "Discrete cosine transform - Algorithms, Advantages, Applications", Academic Press (1990) H. J. Nussbaumer, Fast Fourier transform and convolution algorithms, Springer- Verlag, Berlin Heidelberg N-Y (1982)
発明の概要
本明細書で、「画像データセット」とは、n次元実ユークリッド空間Rnの点{zk|k=1,2,...,K}の離散グリッドF(N)上のn次元(「n‐D」と略される)連続変数z∈Rnの連続関数f(z)のサンプリングから結果的に得られるものと考えることのできる実数値また、一般的に複素数値の、「離散関数」とも呼ばれるデータセット{fk|k=1,2,...,K}を意味するつもりである。すなわちfk=f(zk)である。このグリッドF(N)は、矩形、三角形、六角形等のような所与の対称性の格子(その数学的定義の)の部分集合を表わすべきであり、ここでNはグリッド点の密度を定義する整数(一般的にn次元)である。各事例のn次元格子は、ランクnの1つの半単純なコンパクトリー群、例えばG群の基本的ウェイトの格子、またはウェイト格子に対応する。前記グリッドは、G群の基本領域Fに埋め込む必要があり、あるいは埋め込まれるものとして再定義することが可能でなければならない。半単純なコンパクトリー群および属性は周知であり、完全に数学に分類される。追加情報については、文献1〜5を参照されたい。
時間は可能な次元とすることができる。したがって、2D(「2次元」の略語)ビデオシーケンスは3D画像データセットとみることができる。拍動する心臓の3Dコンピュータ断層画像のシーケンスは、4D画像データセットと見ることができる。
この明細書で、「軌道関数」とは、次のように定義される三角多項式関数を意味するつもりである。

Figure 2008541282
ここで(μ|z)はスカラ積であり、μはn次元周波数(または波数)空間のベクトルである。W(p)は要素pから有限対称性群Wによって生成される要素の有限集合であり、したがってG群のウェイト格子Pからの要素pのW軌道を表わす。
この明細書で、DOFTとも略される「離散軌道関数変換」とは、離散三角級数

Figure 2008541282
への拡張による、画像データセットのn‐D周波数空間への順および逆変換対から成る任意の変換を意味するつもりである。該変換の基礎は、グリッド点{zk}で評価される式(1)によって定義される軌道関数、またはそのような軌道関数の任意の線形結合から成る。式(2)で、S(N)⊂Pは、変換の基底関数を定義するn次元周波数ベクトルの集合{pj|j=1,...,K}に対応し、NはグリッドF(N)の点の密度を定義するのと同じ数字である。
この明細書で、「順離散変換」とは、変換係数Apjに対して拡張級数(2)を解くことを意味するつもりであり、「逆離散変換」とは、グリッド点{zk}における画像データセットの級数(2)の形の拡張を意味するつもりである。
この明細書では、離散変換の「連続拡張」(CEと略される)は、離散変数zkが連続変数z∈Rnに置換されるときに逆離散変換から結果的に生じる連続関数g(z)を意味するつもりである。離散軌道関数変換の場合、式(2)によって定義される逆DOFTの連続拡張は

Figure 2008541282
となる。ここで、係数APjは順離散変換から計算される。
この明細書では、実数値画像データセットのDOFTの「連続拡張」は、式(3)によって定義される連続関数g(z)の実部を意味するつもりである。
この明細書では、ここでCEDOFTと略されるDOFTの「連続拡張」とは、順離散変換から求められた係数Apjが、繰込み、乗算、減算、非相関等を実行するなど、さらなる処理および修正を受けた、式(3)にあるような、軌道関数から成る連続三角多項式関数を意味するつもりである。CEDOFTはまた、離散変換の連続拡張として生成される連続関数とすることもでき、その基底関数は、引数zの線形変換によって、すなわち式(3)にΦp(z)→Φp(az+∇)を代入することによって、式(1)の形の軌道関数にすることができる。これは画像空間におけるグリッドF(N)のシフトおよび/またはリスケーリングと考えることができる。
この明細書で、用語「異なる空間分解能」とは、入力画像データセットを処理する文脈で、異なるグリッド点空間密度(例えばズーム)および異なる向き(例えば画像回転)のような、少なくとも1つの点で初期組{zk}‘とは異なる1組の点{zk}’で定義される出力画像データセットを得ることを意味するつもりである。そのような処理は、点の少なくとも何らかの補間を使用する。図26Aおよび26Bはそれぞれ、非回転画像およびそれに対応する回転後の画像を示す。
この明細書で、用語「非矩形グリッド」とは、非矩形基本領域を有するリー群のウェイト格子の部分集合であるグリッドを意味するつもりである。2D画像の場合の非矩形グリッドの例として、ハニカム配列の画素を有するカメラに由来するもの、および従来のベイヤCCD画像の緑色画素の5点形配列がある。
この明細書で、「圧縮率」とは、圧縮画像を構築するためにCEDOFTで使用される係数の個数に対する、所与の画像データセットの順DOFTの係数{Apj}の総数の比を意味するつもりである。
この明細書で、「Lのブロックサイズ」(ここでLは数値である)とは、画像データセット内の各次元のLのブロックサイズを意味するつもりであり、すなわちL=(L1,...,Ln)である。文脈から、場合によっては、ブロックは正方形、立方形などである必要はなく、格子またはグリッドに従って矩形または異なる形状とすることができることが明らかである
この明細書で、「目立つブロックアーチファクト」とは、平均的な人間の観察者が画像全体を見たときに知覚するブロックアーチファクトを意味するつもりである。JPEG2000圧縮で使用される16×16のブロックサイズでは、画像に現われる目立つブロックアーチファクトは、正方格子のブロックの境界の線に似ている。目立つブロックアーチファクトは、画像全体内の線が少なくなるようにブロック境界線間の間隔を増加することによって低減されるとは考えられず、むしろ、画像全体内の各線の出現が考えられる。一部の画像は、同一圧縮率で他の画像より目立つブロックアーチファクトを生じやすい。目立つブロックアーチファクトが無い場合、これらの線は、平均的な人間の観察者による画像全体の理解を妨害しない。
本発明の目的は、離散軌道関数変換の連続拡張を使用して、原画像とは異なる空間分解能を有する画像データセットをもたらす、原画像を処理する方法を提供することである。
本発明では、画像データセットの少なくとも1ブロックを定義するステップと、該ブロックを表わす順離散軌道関数変換(DOFT)係数を算出するステップと、DOFT係数を使用して該ブロックを表わす離散軌道関数変換の少なくとも1つの連続拡張(CEDOFT)を決定するステップと、異なる空間分解能を定義するステップと、CEDOFTおよび異なる空間分解能を使用して処理済み画像データセットを算出するステップとを含む、画像データセットを処理する方法を提供する。
一部の実施形態では、画像データセットは非矩形グリッドを含み、異なる空間分解能が矩形グリッドを含む場合、該方法は画像フォーマット変換をもたらす。
2D画像の場合、DOFTは離散コサイン変換(DCT)、例えばDCT‐1またはDCT‐2である。
画像圧縮の場合、該方法はさらに、変換係数を量子化して圧縮を達成するステップを含み、異なる空間分解能を定義するステップ、および処理済み画像データセットを算出するステップは、画像データセットの復元の一環として実行される。圧縮画像データは第1場所に格納することが望ましく、異なる空間分解能を定義するステップは、希望するズームおよび回転値の少なくとも1つを繰返し指定することを含むことができ、処理済み画像データセットは少なくとも1つの第2場所に格納される。これにより、圧縮画像データセットを異なるズームおよび/または回転パラメータに従って表示することが可能になる。
カラーCCDの場合、該方法はさらに、カラーフィルタアレイパターンの画素を有するCCDを使用して、画像データセットを取得するステップを含み、DOFT係数を算出するステップは、各色のDOFT係数を得るために、各色の画素を使用してCCDの各色毎に別々に行なわれ、処理がカラーフィルタアレイからカラー画像データセットへの変換を実行するように、異なる空間分解能は各色に対して同じである。
画像が圧縮されるカラーCCDの場合、該方法はさらに、変換係数を量子化して圧縮を達成するステップを含み、異なる空間分解能を定義するステップおよび処理済み画像データセットを算出するステップは、画像データセットの復元の一環として実行される。
本発明はまた、圧縮される画像データセットが提供され、圧縮率が定義され、該画像データセットは圧縮および復元されるときに離散コサイン変換を使用し、16のブロックサイズが結果的に目立つブロックアーチファクトを引き起こす、画像データセットを圧縮および復元する方法を提供する。該方法は、16より適切に大きいブロックサイズを選択するステップと、該適切に大きいブロックサイズおよび定義された圧縮率を使用して画像データセットを圧縮して、圧縮画像データセットを得るステップとを含む。該圧縮画像データセットは次いで復元されて、目立つブロックアーチファクトを有さない復元画像データセットが得られる。該適切に大きいブロックサイズは2nの値、すなわち32、64、128等であることが好ましいが、他の値も可能である。本発明のこの態様は、連続拡張を使用せずに(すなわち、離散関数のみを使用して)実行することができるが、画素補間が望ましい場合には、本発明の他の態様に係る連続拡張関数を使用することができることは理解されるであろう。
本発明は、添付の図面に関連する特定の実施形態の以下の詳細な説明によって、いっそう深く理解されるであろう。
発明の詳細な説明
一般的な場合、リー群Gでの離散軌道関数変換およびDOFTの連続拡張は、次のように理解することができる。選択された群Gで、我々はその属性を自動的に持つ。請求する方法は、次のものを外延的に使用する。
‐ウェイト格子Pおよび実空間Rnにおけるその双対。
‐Pの有限対称性群W。
‐対応する無限群Wアフィン。
‐要素p∈Pを含む群Wによる変換の下で不変量である W(p)と呼ばれるPのs個の点μの有限集合を計算するための公知のアルゴリズム。それはPの要素pのW軌道である。個数sはリー群によって定義される。
‐リー群の基本領域F。それはn次元空間における所定の対称性の領域である(R1では線分[0,0.5];2次元空間では矩形または三角形;3次元空間では3d矩形、3次元四面体等)
‐F(N)と表わされ、選択された正の整数Nによって定義される、Fにおける点{zk}のグリッド。
‐我々の方法の(フーリエ型)変換のための基本関数を表わす軌道関数Φp(z)。これらの関数は上記式(1)によって定義される。
‐次式ように表わせるグリッドFMにおける異なる値pおよびp´による軌道関数の離散直交性の特性。

Figure 2008541282
ここでオーバラインは複素共役を表わし、dzおよびDN,pは各群Gに特異的な既知の定数である。直交特性は、n次元周波数(または同等の波数)空間でもグリッドを作る離散集合SNでpを持つ関数Φp(z)の有限集合に有効である。Nが一定である場合、グリッドSNおよびFNは両方とも分かる。
所与の離散関数{fk|k=1,...,K}の離散軌道関数変換は、式(2)の形で点{Zk|k=1,2,...,K}で評価される一連の関数Φp(Zk)へのその拡張に対応する。K個の拡張係数{Apj|j=1,2,...,K}に対するK個の式のこの集合の反転は、離散関数の周波数空間への順離散変換に対応する。それは直交関係(4)を使用して行なわれる。

Figure 2008541282
DOFTの逆は式(2)によって与えられ、したがって逆離散変換と呼ばれる。コンパクトな半単純リー群の軌道関数に対するこの離散変換の数学的な詳細は、文献1に見られる。
DOFTの連続拡張は、式(2)によって与えられる逆離散変換から構成された、三角多項式関数の形の連続関数として定義され、ここで離散変数zk∈F(N)⊂F⊂Rnは連続変数z∈Rnに置換される一方、拡張係数は式(4)により離散順変換から計算される。
CEDOFT関数は、ノイズによって支配されている項(これらは一般的に高周波数に対応する)を三角級数から減少するか完全に切り捨てるなど、係数Apを変更することによって修正することができる。そのような修正されあるいは切り捨てられたCEDOFT関数も、データの顕著な圧縮に随伴するノイズの高速抑制、およびそれから切捨てCEDOFTシリーズを使用して画像品質を改善するような、画像処理用途に役立つことができる。そのようなデータ処理の例はおそらく図7c、図8d、図9cに掲げられる。
離散変換の連続拡張は、1次元の事例に対するコンパクトな単純リー群SU(2)、およびn次元矩形グリッドに対するランクnの半単純なリー群SU(2)x...xSU(2)の例について、文献6で最初に定義された。画像補間、ノイズ除去、および圧縮のためのSU(2)CEDOFTの実現は、文献7、8に提案されている。ランク2の他のリー群の離散変換およびそれらの連続拡張は、文献9、10、11で検討されている。
〔実施例:三角形グリッドのリー群SU(3)の事例〕
図25は、整数aおよびbで線形結合p=aω1+bω2=(a,b)を通してウェイト格子Pを定義する、SU(3)群の基本ウェイト(ω1,ω2)の対を示す。2次元空間では、従来、単一の2次元指数、ここではpの代わりに、1対の1次元指数、ここではaおよびbが使用される。このリー群の基本領域Fは、ω1とω2との間に囲まれた正三角形である。要素pのW軌道は、一般的な場合、基本ウェイトを基底にして次のように書くことのできる6個のベクトル点から構成される。
W(p)={(a,b),(b,−a−b),(−a−b,a),(−a,a+b),(a+b,−b),(−b,−a)}
図25に示すデカルト座標(x,y)では、軌道関数は明示的に次のように表わすことができる。

Figure 2008541282
ここでaおよびbは負でない整数である。
所与のNに対し、離散関数{fk}が与えられる主要離散グリッドF(N)は従来、Zk=(sω1+mω2)/N≡z(s,m)として、基本ウェイトに双対の基底に定義することができる(SU(3)群の場合、これらの基底は一致する)。ここでsおよびmは、条件s,m≧0、およびs+m≦Nを満足する整数である。グリッド内の点の総数は、K=(N+1)(N+2)/2である。図1aおよび1bに示したグリッドは、N=11の場合に対応する。すなわちNは、基底ベクトルに沿った均等な部分区間の個数に対応する。2次元波数を定義する周波数空間の主要グリッドS(N)は群のウェイト格子Pに属し、非常によく似た三角形構造を有する。それは、条件{a,b≧0およびa+b≦N}を満足する整数aおよびbで、要素p=aω1+bω2≡(a,b)から構成される。変換で使用される三角調和関数の周波数の基底集合を変更する可能性が知られているが、これは最小可能な調波周波数、または所与の数字N、および方法の最善の性能をもたらすものである。
SU(3)の場合のDOFTは次の通りである。

Figure 2008541282
ここで(xs,m,ys,m)はグリッドF(N)上を動く点Z(s,m)のデカルト座標であり、da,bおよびds,mは、指数aおよびb、またはsおよびmに応じて、6、3、または1に等しい多重度である(文献10を参照されたい)。DOFTの連続拡張は、N=2次元(この事例では)変数z∈R2の三角多項式の形の連続関数を表わす。

Figure 2008541282
この関数はグリッドF(N)の全ての点で離散関数{fk=f(zk)}と一致するが、グリッド点の間では一般的に連続関数f(z)と一致し、グリッドにおけるそのサンプリングが{fk}をもたらしたことに我々は注目した。したがって、CEDOFTを表わすg(z)はf(z)とは区別すべきである。しかし、重要な注目点は、g(z)が平滑な原関数f(z)とよく近似し、原グリッドの点間の任意の点(または点の集合)で離散画像の補間に効果的に使用することができることである。
〔実施例:SU(2)およびその多次元一般化の事例〕
ランクn=1の群SU(2)の場合、基本領域は1D線分F=[0,1/2]に通約さされる。この群の要素z∈FのW軌道は、一般的な形では2つの要素W(p)={p,−p}のみで構成される。軌道関数(1)は次いで2つの指数関数の和に通約され、Φp(θ)=2cos(2πpz)が得られる。グリッドFNは、基本領域の細分に等しいNに対応する点の等距離集合に対応する。すなわち{zk=k/2N|k=0,1,...,N}。このグリッド上で、軌道関数はcos(πpk/N)に通約される。これは公知の離散コサイン変換(DCT)、またはより正確にはDCT‐1の変換基底と一致する([6]参照)。線分[0,X]上に定義される(すなわちグリッドがxk=kX/Nに対応する)関数f(x)のサンプリングから得られる画像データセット{fk|k=0,1,...,N}の順変換は、次の通りである。

Figure 2008541282
ここで、m=0またはm=Nの場合CN,m=1であり、それ以外の場合CN,m=2である。
便宜上、我々がCEDCTと呼ぶDOFTの連続拡張は次いで、次の形の単純な三角多項式によって与えられる。

Figure 2008541282
ここでxは連続変数である。
{xk=kX/N|k=0,1,...,N}、{yj=jY/M|j=0,1,...,M}である場合に、点(xk,yj)の矩形グリッド上で{0≦x≦X,0≦y≦Y}の連続関数f(x,y)のサンプリングから生じる2次元離散画像データセット{fkj}を考慮する。

三角多項式、

Figure 2008541282
はリー群SU(2)×SU(2)のCEDOFT関数を表わし、ここで係数は離散変換

Figure 2008541282
により計算される。これは2DDCT‐1の連続拡張を表わす。
離散関数{fijs}の3DCEDCTは、同様の明示的形式

Figure 2008541282
を有し、ここで係数は離散順3D変換

Figure 2008541282
を通して計算される。
n>3のn次元矩形グリッドのCEDCTの一般化は、この構成から明らかである。
標準JPEGでは、別のバージョンのDCT、すなわちDCT‐2が使用されることに注目されたい。この変換の基底次元、すなわち1次元バージョンは、次式によって与えられる(文献12参照)。

Figure 2008541282
ここで係数cN,mはcN,mとはわずかに異なる。すなわちm=0の場合、cN,m=1であり、それ以外の場合、CN,m=2である。ここで我々は間隔の個数に対してNを使用しており、したがって(N+1)は画素の個数である。この級数で離散引数kは、DCT-1と比較して1/2だけシフトされることに注目されたい。逆DCT−2もそうであり、それは次のように書くことができる。

Figure 2008541282
引数xk=kX/NをDCT-1の場合と同様に維持して、このDCT‐2の連続拡張は次のように表わすことができる。

Figure 2008541282
ここでΔ=1/(2N)である。事実上、これは画像空間でグリッドF(N)をグリッド間隔の2分の1だけシフトし、DCT‐1のCEの引数を倍率a=(1−1/(N+1))だけリスケーリングすることを表わす。
重要な注目点は、CEDOFT関数を形成する三角多項式級数の波動関数の(すなわち指数関数の)調波次数が一般的に、標準離散フーリエ変換の場合とは異なり、整数で表わされないことである。DOFT変換の基底関数の調波次数を定義するグリッドS(N)は、同じ空間次元のDFTの場合より高密度の間隔を有する。実際的には、これにより結果的に、ナイキストサンプリングレートを満たす最大周波数の連続帯域制限三角関数g(z)が構成される(詳細な説明については、文献7を参照されたい)。ここでDOFTとして統一された離散三角変換の連続拡張の族の優れた特性は、基底関数のまさにこの特性によって説明される。
図1aないし1dは、DFT(細い実線曲線)と略される従来の離散フーリエ変換の連続拡張、およびDCTとして(またはより正確にはDCT‐1で)知られる公知の離散コサイン変換と一致する、リー群SU(2)のDOFT(鎖線曲線)の連続拡張によって提供される、1次元実変数t∈[0,1]の2つの解析関数f(t)の近似(太い実線によって示す)を実証する。太いドットは、ここで便宜的に線分[0,1]に正規化された1次元グリッドの(N+1)個の等距離点{tk=k/N}におけるf(t)のサンプリングの結果得られた離散関数{fk}の値を示す。CEDCT関数gN(t)は、Nが増大するにつれて急速にf(t)に収束する一方、CEDFTの振動は減衰しない。理由は、標準DFTの形式的連続拡張に常に存在する、ナイキストレートを超える高周波調波に関係するエイリアシングにある。後者は次にように表現される。

Figure 2008541282
ここで{up}は従来のN点DFT係数である。

Figure 2008541282
文献6に説明されているように、強い振動の理由は、DFTの変換基底がp=(N−1)までの周波数の三角関数から構成されることである。DFTの高周波項の振幅は、関係

Figure 2008541282
のため、全てのNで顕著であり、ここでオーバラインは複素共役を表わす。したがってCEDFTは、形式的に帯域制限連続関数を表わし、エイリアシングを回避するために、そのナイキストサンプリングレートは少なくとも2(N−1)個の点が必要であるが、N個の点しか利用できない。
DFT係数間の上述の関係を使用して次数p≦N/2の調波のみから構成された「実DFT」を構成し、その後にようやく「実DFT」と呼ばれるその変換の連続拡張を構成して、周波数(N/2)を超えるDFTの調波を処理すると、エイリアシングは回避される。
連続コサイン変換関数が軌道関数変換であり、したがって画像データセットの離散値間の良好な補間をもたらすことは理解されるであろう。他方、連続拡張コサイン変換と同様にデータセットの各離散値と忠実に交差する連続拡張フーリエ級数は離散値の間で振動し、したがって補間目的には効率的でない。さらに、軌道関数変換の連続拡張が、画像データセットの勾配または1次導関数の公正な近似でもある勾配または1次導関数を有することを示すことができる。図1aないし1dの単純な1次元図から、より高次元の連続拡張軌道関数変換が同様に補間目的に効率的であることを理解することができる。
また、連続拡張軌道関数を使用して、原画像とは異なる空間分解能(および同数のグリッド点)を有する画像データセットのグリッド点を計算することは、逆離散変換値を計算する場合と基本的に同じ努力であることも、上記式から理解することができる。そのような逆離散コサイン変換(DCT)計算は、DCTを用いて圧縮された画像を復元するときに行なわれる。DCTは標準JPEG圧縮で使用され、逆DCTは標準JPEG復元で使用される。
図2aないし2dは、CEDCT(鎖線曲線)、「実DFT」のCE(細い実線曲線)、および正弦関数に基づく有限離散数列のためのシャノン補間公式(3点鎖線曲線)によって達成された、原解析関数f(t)およびその導関数df/dt(両方とも太い実線曲線で示される)に対する近似の質を比較する。N=8からN=50までグリッド点の密度が増加するにつれて、これらの3つの補間は全てf(t)に収束する。しかしCEDCT関数gN(t)の導関数だけはdf/dtに収束する。CEDOFTの可微分性は文献6で証明されている。
図3aないし3dは、正規化サイズx,y∈[0,1]の矩形グリッド上の2D関数f(x,y)のサンプリングの結果得られた解析テスト画像の再生の品質を示す。左下のパネルにその等高線図が示された関数は、グリッドセルの長さ1/Nに等しい分散σによって定義される各々の有効幅を持つ2つのガウス2D分布の和から成る。左上のパネルに示すグレースケール離散画像から明らかなように、グリッドはそのような画像にはやや粗いが、図3bおよび3dに示す2DCEDCT関数g(x,y)のグレースケール図および等高線図表現は両方とも、原関数f(x,y)のg(x,y)による再生の良好な品質を実証する。これら2つの間の相違は、f(x,y)が零強度レベルに降下する領域の(画像振幅の5%未満の)最下等高線レベルでのみ目立つようになる。
図4aないし4dは、非矩形グリッド、この事例では正三角形、あるいは六角形のグリッドに形成された同様の解析画像の補間品質の例を示す。リー群SU(3)の場合、補間はCEDOFTによって実行される。
リアルな画像の補間に対するCEDOFT関数の適用の高い潜在性が、図5aおよび5bで実証される。ここで、リー群SU(2)×SU(2)のCEDOFT、すなわち2次元CEDCTが、テスト画像「レナ」の補間に適用されている。図5bは、左に示された原256×256分解能画像「レナ」の強くズームされた81×81画素フラグメントの補間の効果を実証する。そのような補間によってもたらされる良好な品質は明らかである。
図5bで使用される点の実際の表面密度すなわち分解能は、原データセットより5×5=25倍高い。一方で、これらの2つの画像を周波数空間で表わすデータセットの実際のサイズは厳密に等しい。これは、CEDCT関数が厳密に原画像{Gnm}と同数のDCT変換係数{Anm|n=0,1,...,N−1;m=0,1,...,M−1}(N×M画素サイズの矩形画像を前提として)を使用するからである。これらの画像の周波数成分は厳密に同じである。
したがって、原則的に、CEDCTによって、または他のリー群一般の多次元CEDOFTによって原画像よりずっと高い空間分解能に補間された画像は次いで、周波数空間でJPEGのような圧縮アルゴリズムによって、補間に使用されたのと同じリー群のDOFTを使用して原画像サイズに圧縮することができることが重要である。そのような圧縮は無損失であることが重要である。それは、画像の品質の劣化無しに、必要に応じて何度でも繰り返すことができる。図5bのズーム画像の無損失圧縮の圧縮率は、エントロピ符号化のような標準無損失圧縮技術を使用しない場合でも25と高い。こうして画像を圧縮、格納、または伝送し、いつでも必要な場合に再び任意の空間サイズに「連続的に」ズームすることができる。
図6Aおよび6Bは、CEDCTによってもたらされる良好な品質のリアルな画像の補間の別の例を提示する。ここで、256×256分解能テスト画像「鳥」が図6Bに使用されている。また、DCT高速計算のために、FFT型のアルゴリズム(「高速フーリエ変換」)が開発され、変換係数およびより高い分解能への補間の両方の計算に適用することができることも重要である。補間計算は、分解能が整数の像倍率だけ増大する場合、FFTの方法によって行なうことができる。
〔2D画像のズームおよびノイズ除去の実施例〕
図7aないし7cは、CEDOFT補間が雑音画像の処理にも効果を発揮できることを実証する。ここで2DCEDCT関数は、FLIR(「前方監視赤外」)検出器によって取り込まれた画像をノイズ除去するために使用される。ここで、切捨てCEDCT関数では、単純に周波数k>N/4に対応する高周波モードが切り捨てられている一方、各々の周波数軸に沿ったDCTの最大周波数はN/2である。この手順は結果的に、FLIR検出器に固有の「水平」ノイズの抑制をもたらし(文献8参照)、それはCEDCT補間画像の品質を明瞭に改善した。CEDOFTを用いて処理画像の細部にさらにズームすると、さらなる細部を顕現させることができる。DCTおよびCEDCTの計算にFFT型アルゴリズムを使用すれば、ノイズ除去は単純かつ高速であることが重要である。それはまた、実際画像サイズの図7Cにおける4分の1のような顕著な圧縮によっても達成される。
CEDOFT関数の高周波項の単純な切捨てによってノイズ画像の品質が改善される理由は、図7Bに示されたシーンからの2つの17×17サイズブロックの周波数成分が示された、図7Dおよび7Eから理解することができる。画像の最も有意義な部分は周波数空間の画像の低周波コーナに集中している一方、ガウスランダムノイズは高周波の画像に強く出ている(さらなる詳細は文献7、8を参照されたい)。
図8B、8C、および8Dは、図8Aに示された原医用画像(CTスキャン)の小さいフラグメントの2DCEDCTを使用した補間およびズーミングを示す。図8Cおよび8Dの画像は、図8Bのフラグメントの4×4倍高い分解能グリッドへの非切捨ておよび切捨て(4分の1に圧縮した)CEDCT補間に対応する補間を表わす。ズームプロセスが圧縮画像データセットから行なわれる場合、DCT係数を計算する初期ステップは圧縮中にすでに行なわれており、画素値の追加計算が、ズーム画像を得るための唯一の余分な努力である。これは、画像空間の画素を解析して画素を補間する目的のためだけに使用される正確な補間関数を定義しようとする高次画素補間スキームより、望ましいことがあり得、多くの補間スキームでは、補間される画素毎に補間関数が再定義されることは理解されるであろう。
図7Cおよび7Dに示されたノイズ画像のノイズ除去の高速かつ効果的な手順は、非矩形対称性のn次元グリッドに一般的に対応する他のリー群のCEDOFT関数にも適用される。これは、正三角形グリッドで解析2Dガウス関数をサンプリングし、2つの個々の画素の位置で2つの「ホット画素」、または離散デルタ関数を重複することによって形成された画像のノイズ除去の例を使用して、図9および図10で実証される。切捨てCEDOFT関数による画像の表現は基本的に、ホット画素および波を図9A、9B、9C、および9Dのシーンから除去し、原解析画像の有意義な部分を回復する。さらなる詳細は献[9、10に見られる。
図9Aおよび9Bに示された原画像のDOFT画像は、図10によって証明されるように、ノイズの寄与によって、すなわち周波数の第2半分(k+m)>N/2に対応する主に2つのホット画素のDOFTによって支配される。
〔実施例:他の補間アルゴリズムとの比較〕
CEDCT/DOFTアルゴリズムによる変換の計算時間のみならず補間計算も、非常に競争力がある。画像空間では、画素補間は通常、双1次または双3次のような様々なアルゴリズムを用いて実行される。後者は、より良好な補間品質をもたらす高次多項式補間の型に属するが、一般的に16回以上の乗算演算を必要とする。この演算は加算演算よりずっと多くの時間がかかり、補間計算時間の大部分を定義する。2D画像の双1次補間は、4個の最近隣画素値のみを使用し、相応して、補間される点毎に4回の乗算演算しか使用しない。それは高次多項式補間より著しく劣るが、後者よりずっと高速である。したがって、補間速度のために補間の品質を犠牲にする多くの実用的分野で、双1次補間は好適である。
CEDOFTによって、特に2DCEDCTによってもたらされる補間の品質は、双3次、双3次スプライン、または他の高次多項式補間アルゴリズムの品質に匹敵する。これは、2DCEDCT(図11C)によってもたらされる補間、および最良の高次多項式型補間アルゴリズムと考えられるランツォシュ補間(図11D)によってもたらされる補間を比較する、図11Cおよび11Dによって実証される。同時に、100×100程度の大きいサイズのブロックを使用する場合でさえ、補間の速度は多項式アルゴリズムの場合よりかなり高く、双1次補間の速度に匹敵する。
DCTおよび逆DCTは、FFT族(高速フーリエ変換)アルゴリズム(例えば文献14、15参照)として知られる高速計算アルゴリズム、およびその様々な変形を使用して計算することができる。ラディックス2アルゴリズム(これは整数pでN=2pを暗示する)によるN×N×..×Nのブロックデータセットのk次元FFTの計算に要する乗算の回数Mは、おおよそ次の通りである。

Figure 2008541282
これは、2Dデータセットの場合、1点当たりの乗算の回数mがわずかpであることを意味し、それはブロックのサイズNの増加により、mが対数的に増加するだけであることを意味する。16×16のブロックサイズの場合、式(17)はm=4と予測し、128×128サイズのブロックの場合、それはm=7に増加するだけである。実際には、これらの数字を2分の1ないし3分の1にさらに低減することのできる、より洗練されたアルゴリズムを適用することができる。かくして文献14の表7.1は、いわゆる多項式変換(多項式補間と混同してはならない)アルゴリズムによる1点当たりの乗算の回数が、N=16の場合にはm=1.69、N=128の場合にはm=4.67にすぎないことを示している。後者は双1次補間に必要な4回の乗算にかなり匹敵し、高次の双3次等の補間に必要な1点あたりの16回以上の乗算よりずっと少ない。k‐DCEDCTによる補間は、いわゆる零詰め法を使用して、FFTによって実現することができることに注目されたい。それは、指数s>Nの係数Asに対して0値を取りながら、変換係数の個数を形式的に増加し、したがってより高い分解能のグリッドの計算のために非自明な乗算の回数は増加しない。
多次元CEDCT補間の利点は、高次元データセットの場合にさらに増加する。かくして、3Dデータセットの場合の補間点当たりの乗算の回数は、双1次型補間(初期グリッドの8個の最近隣点の計算を含む)の場合には8に、3Dデータ空間での双3次類似物の場合には16×4=64に増大する。一方、式(17)から得られるように、3DCEDCTの1点あたりの乗算の回数は、同じ1次サイズNの3Dブロックの1次サイズが同じである場合、1.5倍に増加するだけである。
〔実施例:より大きいブロックサイズの効果〕
図12Aないし12Dに、2DCEDCTによって448×448画素分解能画像(図12B)に補間された、512×512分解能の原テスト画像「橋」(図12A)の224×224画素サイズのフラグメントが示される。図12Cは、量子化を閾値処理し、原画像データセットをサイズ33×33のブロックに細分し、隣接境界で1画素重複し、次いで切捨てCEDCTを使用して図12Bと同じ448×448分解能の圧縮画像を提示する方法によって、圧縮率C=35に圧縮された画像を示す。隣接ブロックの少なくとも1画素の重複は、一般的にブロック間の画像の分解能をも高めるために、CEDOFTによる補間方法で必要とされることに注目されたい。さもなければ、ブロック効果が非圧縮画像ですでに明瞭になる。図12Dは、図12Cと同じ圧縮率C=35に圧縮され、かつ切捨てCEDCTによって全く同じ448×448分解能グリッドに補間された同じフラグメントを示すが、閾値処理がサイズ9×9の重複ブロックで行なわれる場合である。このサイズは8×8の間隔のブロックに対応し、DCT-1の場合、それに対して効率的なFFT型アルゴリズムが利用可能である。
より大きいブロックサイズが同じ高圧縮率でより良好な品質の画像を可能にする理由は、変換領域で画像操作に利用することのできるずっと多数の変換係数に質的に関係する。したがって、8×8ブロックの場合、係数は64個しか無く、したがって30分の1に圧縮しても平均して、CEDCT関数で1ブロック当たり約2項しか残らない。サイズ32×32のブロックの場合、圧縮されたCEDCT(またはCEDOFT一般)に残される変換係数および三角関数の項の数は16倍であり、画像圧縮にずっと幅広い選択度がもたらされる。
単にブロックサイズを増大するだけで圧縮画像の品質を高めるこの傾向は、図13aないし13d、14aないし14d、および15aないし15dで、3つの既知のテスト画像「鳥」、「レナ」、および「胡椒」の例をそれぞれ使用して実証される。これらの画像は、変換領域で「閾値処理圧縮」を使用する(すなわち各ブロックに対して個々に決定されたある値より小さい変換係数を切り捨てる)ことによって、しかし量子化および符号化圧縮を実現することなく、中程度の圧縮率に圧縮される。画像の補間も無いので、画像再生には離散逆DCTだけが使用される。これらの例の各々で想定された圧縮率に対し、ブロックサイズを増大することにより、ブロックサイズを32×32および64×64に増大した場合、目に見えるブロックアーチファクトが事実上消失する。この特徴のさらなる詳細については、文献7を参照されたい。
〔ブロックサイズの増大による画像再生の品質向上〕
これらの3つの画像の画像圧縮品質の定量的測度がプロットされた図16aないし16b、17aないし17b、および18aないし18bで、標準JPEGと同様にブロックを重複することなく、しかし異なるブロックサイズに対して圧縮が行なわれた場合について、N×Nが実証されている。様々な圧縮率の画層の品質は、PSNRと略されるピーク信号対雑音比によって測定される。bビットデータセットの場合、それは次のように定義される。

Figure 2008541282
ここでMSEは、圧縮画像の画素値の原値からの平均2乗誤差偏差(mean square error deviation)である(例えば文献14参照)。ここで論じる全ての画像で、b=8である。この場合、PSNRが30以上であれば、画像再生品質は一般的に良好とみなされることに注目されたい。
図24Aおよび24Bは、(図22A、22B、および22Cで用いられたように)ブロック間でS=3画素の重複を使用して、様々なサイズのブロックで計算が行なわれるときに、それぞれ閾値処理およびゾーン圧縮技術を使用した様々な圧縮率のPSNRを示す。ブロックサイズが増加するにつれて、同じ圧縮比の画像の品質/PSNRが、ブロック間にかなりの重複がある場合にも、著しく改善されることが分かる。
図19aないし19cおよび20aないし20cは、ブロックが重複せず、かつ圧縮率が1である(すなわち圧縮無し)場合のCEDCT補間の例を提示する。補間は画像の品質を明らかに改善しているが、この事例では大きいブロックサイズに対してもブロックアーチファクトが見える。重複無しでは、中程度の圧縮率の場合でも、ブロックアーチファクトが急速に非常に目立つようになる。これは、図19と同じフラグメントがブロックの重複無しで補間され、圧縮率C=3.1に圧縮された、図21A、21B、および21Cで実証される。
q=1画素だけでも隣接ブロックと重複することにより、示された全てのブロックサイズ、すなわち8×8、16×16、および32×32に対して、図22aないし22cで証明される通り、同じ圧縮率の画像の品質が劇的に改善される(後者の場合、ブロック縁部は見分けることができない)。この効果の理由は、隣接ブロックの重複により重複する画素における画像強度の平均化が可能になることだけではなく、重複により隣接ブロック間の周波数成分の通過が事実上、より連続的になるためでもある。
図23aないし23dは、q=2〜4ブロックでブロックの重複が著しい場合、大きい圧縮率を実現する場合でも、大きいブロックサイズに対してブロックアーチファクトを消失させることが可能であることを実証する。図23で、圧縮率は全てのブロックサイズに対してC=9である。大きいブロックサイズは良好な品質の圧縮画像をもたらすだけでなく、重複するブロックの場合に必要な計算量の事実上の増加に対しても感受性が低下することに注目されたい。実際、計算量は(1−q/N)-2倍増加し、したがって重複サイズの所与の値に対してNが大きいことが好ましい。
画像編集または検査を実行するときに、圧縮画像データに対し異なる空間分解能を繰返し選択して、結果的に生じる画像を観察することが有利である。この場合、圧縮画像データは原画像としてさらに使用するために第1場所に維持することができる一方、異なる空間分解能の処理画像は第2場所に格納される。
〔実施例:ビデオ圧縮〕
標準MPEGビデオ圧縮アルゴリズムは、2D画像圧縮すなわちJPEGを、ビデオカメラが固定されている場合のように全く変化を受けない部分、およびビデオカメラが移動またはパンする場合のように固定された背景に関連する部分または2Dフレーム内で動くがそれ以外は変化しない部分、ならびに遠い固定背景に関連する部分を有する画像がビデオシーケンスに含まれることがあるという前提に基づく時間的補間技術と結合する。ビデオ圧縮符号化は、前景で話したり動く人間のようにフレーム毎に変化する画像の部分に対して提供される。基本的に、変換圧縮技術は2D画像内でのみ使用される一方、符号化および補間技術は時間的に変化する部分を圧縮および再生するために使用され、これは、ビデオシーケンス全体を再生するために、変化する部分に対して一般的に変換圧縮技術を使用して圧縮された新しいデータと結合される。
JPEGのような変換圧縮技術は、ほとんどの2D画像の性質のため、および損失の多い圧縮‐復元サイクル中に導入されるエラーを人間の目が知覚する方法のため、符号化のみに依存する技術より効率的な2D画像圧縮をもたらす。しかし、ビデオシーケンスにおける空間的歪みより時間的歪みに対する目の高い感受性のため、3D変換、すなわち2次元の空間データおよび1時間次元としてのビデオストリームの変換が効率的であるかは、明らかでない。例えば、いずれかの方法で平滑化されるか、あるいは時間的に歪められる1つのフレームから次のフレームへの2つのシーン間の突然の変化は、人間の観察者にぼやけとして不利に知覚される。同様にパン動作は、1つのフレームから次のフレームに変化を受けるフレーム内の画素に、突然の時間的変化を示す。時間的変化の人間の目の敏感な知覚を満足させるために、時間の急激な遷移または「エッジ」を表わす能力は、時間的変化の正確な表現を維持する必要がある。
ビデオは基本的に、X、Y、およびt次元の画素を有する3D画像である。ビデオは基本的に、X、Y、およびT次元の画素を有する3D画像である。非零ラインスキャン時間τのため、(ビデオカメラの)空間グリッド点の集合{(Xi,Vj)|I=0...N,j=0...M}で画像値を取り込む時間インスタンス{t´s}は異なる点(xi,yj)では事実上異なることができるという事実にもかかわらず、グリッドは形式的にT次元をも含む矩形3Dグリッドとみなすことができる。同じ画像フレーム内の位置(xi,yj)および(0,0)における画像強度測定のインスタンス間には、画像フレーム内の位置(i,j)に依存する次式

Figure 2008541282
に等しい差があるが、3D集合{xi,yj,t´s}はそれ自体、ブロックサイズ[(N+1),(M+1),(L+1)]の完全に等辺の3Dグリッドを作成する。これは記録された画像値Vijsのこれらのブロックに3DDCTを適用することを即座に可能にし、次のDCT係数が得られる。

Figure 2008541282
受信器/復号器側における式(12)の逆DCTでのこれらの係数を、そのままで、または(量子化後に)圧縮して使用することにより、記録されたときと同じ位置{xi,yj,t´s}に、{Vijs}のそれぞれ厳密な値または近似値がxi,yj,ts}でCEDCTを適用することにより、画像復号の単一ステップでの追加努力無しに、レコーダの有限ラインスキャン時間τ>0による歪みが事実上補正された画像が得られることは理解されるであろう。

Figure 2008541282
本発明に係る連続拡張を使用する技術により、変換されたソースからの補間画像の生成をビデオ保存の時間次元に首尾よく適用することが効率的になることが明らかになった。
ビデオ保存および再生に連続拡張を使用して、2つの基本的利点または用途が可能である。第1に、ソース圧縮ビデオデータから正確に補間して、異なるフレームレートを有する再生画像ストリームを生成する能力は、ソースおよび再生表示が異なるフレームまたはフィールドレートで動作する用途に有利である。フィルムが元々毎秒24画像でキャプチャされたが、テレビ画面での再生が通常毎秒30フレーム(インタレーステレビジョンの場合、より正確には毎秒60フィールド)であり、コンピュータモニタまたはHDTVでの再生がより高いレートである場合がこれに当たる。したがって本発明は、ビデオシーケンスをオリジナルソースビデオストリーム取得時間フレームレートで保存することを可能にし、次いで再生時にだけ装置によって定義することのできるレートで時間的変換を行なうことを可能にし、したがって同じ原画像ソースから将来の再生装置の多種多様なレートに適応することが容易にできるようになる。
第2に、再生時に空間的補間を実行し、こうしてビデオをオリジナルソースビデオフォーマットで記録し、必要に応じて再生ディスプレイの分解能に変換することを可能にすることができる。ソースおよび再生ディスプレイ装置の一方だけがインタレースされる場合、時間的および空間的補間の両方が必要になる。インタレースビデオストリームは、変換係数を計算するとき、および/または連続拡張関数を用いて画素値を計算するときに、空間的かつ時間的に適切に分離することができる。したがって、ソース画素だけを使用して、補間画素は使用せずに、係数を計算することが可能である。同様に、連続拡張関数からの画素値の計算は、再生ディスプレイに必要な正確な時間および空間座標に対してのみ実行される。CRTのフィールド内のスキャン遅延に関連する時間的遅延とともに、CRTに送られる出力画素値を計算することさえも可能である。
DVDのような従来のビデオストレージでは、復元されたビデオが予め定められた分解能およびフレームレートを有することは理解されるであろう。ソースがDVDストレージに望まれる分解能およびフレームレートを持たない場合には、圧縮および保存の前に変換が実行される。再生時の復元後に、ビデオコーデックは空間的または時間的に画素空間の所望の分解能変更を実行しなければならない。
この明細書では、「オリジナルソースビデオストリーム」とは、元々ストリームを生成するために使用された画像取得装置の空間および時間分解能の画像ストリームを意味する。フィルムの場合、オリジナルソースビデオストリームは、スタジオフィルムカメラの毎秒24フレームおよび電子フィルムスキャナの出力分解能を有する。ビデオカメラの場合、オリジナルソースビデオストリームはCCD(またはカメラ出力)の画素レイアウトおよび分解能ならびにカメラ出力フレームレートを有する。
2D画像の場合と同様に、ブロックは少なくとも1画素の重複を有する。時間次元では、正確な時間表現が重要であるので、単一画素のみの重複を有することが最良である。
図1aおよび1bは、解析関数が等間隔の数N=10のグリッドでサンプリングされるときに、細い実線によって描かれた従来DFTと略される標準離散フーリエ変換の連続拡張、および鎖線で描かれた離散コサイン変換(DCTと略される)と一致するリー群SU(2)に対するDOFTの連続拡張によって提供される、太い実線で描かれた2つの解析関数f(t)の近似を示す。太いドットはグリッド点tkにおける離散関数{fk}を示す。 図1cは、グリッドの分解能がN=30に増加したときの図1aに示した関数に対する同様の近似を示す。 図1dは、グリッドの分解能がN=24に増加したときの図1dに示した関数に対する同様の近似を示す。 図2aは、太い実線曲線は、N=8間隔の1Dグリッド上のそのサンプリングから離散関数{fk|k=0,1,...,N}が生成された連続関数f(t)を示す。鎖線曲線はその関数から構成されたCEDCTであり、細い実線曲線は「実DFT」の連続拡張であり、3点鎖線曲線は離散関数{fk}に基づいて構成されたシャノン補間関数に対応する。 図2bは、図2aと同様であるが、関数f(t)がN=50間隔のグリッドでサンプリングされる場合を示す。 図2cは、太い実線で描かれた図2aに示したのと同じ解析関数f(t)の導関数df/dtを示し、鎖線はCEDCTの導関数であり、細い実線は「実DFT」のCEの導関数であり、3点鎖線はシャノン補間関数の導関数である。選択されたグリッド分解能は、図2aの場合と同様に、N=8間隔に対応する。 図2dは、グリッド分解能がN=50に増加したときの図2cに示したのと同じ導関数を示す。 図3aは、2つの2Dガウス分布関数の和から成る解析関数をサンプリングすることによって矩形グリッドに形成される画像である。 図3cは、その関数の等高線図を示す。 図3bは、離散画像データセットから再生された2DCEDCT画像である。 図3dは、その2DCEDCT画像の等高線図である。 図4aは、2つのガウス分布の重ね合せの形の2D解析関数の等高線図を示す。 図4bは、示された三角形グリッドでの解析関数のサンプリングから得られた離散関数から構成される、リー群SU(3)に対するCEDOFTの等高線図を示す。 図4cは、図4aに描かれた解析関数の3D図を示す。 図4dは、図4bに描かれたCEDOFTの3D図である。 図5aは、画素サイズが明らかになるように強くズームした256×256画素テスト画像「レナ」のフラグメントを示す。 図5bは、2DCEDCT、すなわちリー群SU(2)×SU(2)に対するCEDOFTを使用した、5×5より高い分解能へのこの画像の補間を示す。 図6Bは、256×256画素テスト画像「鳥」からの160×256画素フラグメントを示す。 図6Aは、2DCEDCTを使用した4×4より高い分解能への補間を示す。 図7Aは、FLIR(「前方監視赤外」検出器)によって検出された画像を示す(カリフォルニア州チャイナレイク、NAWCWPNS;一般公開が許可された画像、http://www.cis.edu/data.sets/nawc_flir)。 図7Bは、図7Aのシーンからのズームされたフラグメント(戦車の画像)。 図7Cは、x軸およびy軸に沿って周波数項の第2(上位)半分に対応する2DCEDCT(三角多項式関数)の全ての成分を切り捨て、原グリッドより3×3=9倍高い点の空間分解能のグリッド上でこうして切り捨てられたCEDCTによって画像を補間することによってノイズを除去した、図7Bと同じフラグメントを示す。 図7Dは、図7Bに示した画像からの17×17ブロックフラグメントの2D周波数空間における2DDCT表現である。水平または垂直軸に沿った各間隔刻みは、それぞれの方向に沿った周波数の0.5に等しい∇kまたは∇jの増加に対応する。濃い部分は変換係数の大きい絶対値に対応し、左下隅のブロックは最下周波数項A0,0に対応する。 図7Eは、DCTによって周波数空間に変換された、図7Bからの別の17×17ブロック画像の例を示す。 図8Aは、ヒト肺のCT(コンピュータ断層撮影)画像である。 図8Bは、図8A(枠内)の画像のズームされたフラグメントを示す。 図8Cは、2DCEDCTによって実行された図8Bの原画像のより高い分解能グリッドへの補間の結果を示す。 図8Dは、切捨てCEDCTによって実行された図8Bに示したのと同じフラグメントの補間を示す。各N×N画像ブロックに対し0≦k,j≦(N−1)/2に対応する変換係数A,k,jの4分の1しか使用されないので、切捨ては4分の1の原画像の実効ノイズ除去および(ゾーン)圧縮に対応する。 図9Aは、2Dガウス楕円および背景に示された三角形グリッドのノードを中心とする2つの「ホット画素」から成る解析関数G(x,y)の等高線図である。 図9Bは、図9Bに描かれた解析画像の3D図。 図9Cは、三角形グリッド上の原解析関数G(x,y)のサンプリングに由来する離散関数{Gkn}から構成されたリー群SU(3)のCEDOFT関数の等高線図である。鎖線等高線は零レベルに対応する。 図9Dは、図9Cに提示されたSU(3)CEDOFT画像の3D図である。 図9Eは、係数の3/4(高周波数に対応する)が切り捨てられる切捨てSU(3)CEDOFT関数を使用して、図9Cの場合と同じ離散関数{Gkn}から構成された画像の等高線図である。 図9Fは、図9Eに示された画像の3D図である。 図10は、図9aないし図9fに示した画像データセットの異なる周波数モード(k+m)に対応するSU(3)DOFT係数Ak、mの平均値のプロットを示す。星印はこの画像だけの2つのホット画素の変換係数に対応する。 図11Aは、クロコダイルのテスト画像を示す。 図11Bは、図11Aの目の145×105画素のズーム画像を示す。 図11Cは、CEDCT関数によって7×7倍高い分解能グリッドに補間された、図11Bの画像を示す。 図11Dは、比較のため、最高次多項式型補間アルゴリズムの1つとして尊重されている「ランツォシュ」補間アルゴリズムによるクロコダイルの目の補間を示す。(http://www.americaswonderlands.com/image_resizing.htmより)。 図12Aは、512×512分解能の原テスト画像「橋」の224×224画素サイズのフラグメントを示す。 図12Bは、図12Aの画像の448×448画素分解能画像への2DCEDCT補間を示す。 図12Cは、量子化閾値処理法によって圧縮率C=35に圧縮され、かつこのように圧縮されたCEDCTによって448×448分解能グリッド上に再生された、図12Aに示された画像を示す。補間は原画像データセットを、隣接ブロックで1画素重複するサイズ33×33のブロックに細分することによって行なわれる。 図12Dは、計算が9×9画素サイズのブロックで行なわれる場合に、図12Cと同じ圧縮率C=35に圧縮され、CEDCTによって同じ448×448分解能グリッドに補間された図12Aの画像を示す。 図13Aは、計算がサイズ8×8の非重複ブロックで行なわれ、補間が適用されない場合に、周波数空間で(量子化無しで)2DDCT係数{Ak,j}を閾値処理することによって圧縮率C=4.1に圧縮されたテスト画像「鳥」の128×128画素フラグメントを示す。各ブロックで変換係数を切り捨てるための閾値は、そのブロックの最大変換係数からの特定の百分率フラクションとして定義される。 図13Bは、計算が16×16サイズの個々の非重複ブロックで行なわれる場合に、同じ圧縮率4.1に圧縮された図13Bと同じフラグメントを示す。 図13Cは、計算が32×32のブロックで行なわれる場合に、図13Bと同じ比4.1に圧縮された同じフラグメントを示す。 図13Dは、計算がサイズ64×64のブロックで行なわれる場合に、図13Cと同じ比4.1に圧縮された同じフラグメントを示す。 図14Aは、周波数空間で2DDCT係数{Ak,j}を閾値処理することによって圧縮率C=3.3に圧縮されたテスト画像「レナ」の192×192画素フラグメントを示す。計算は原データセットと同じ分解能グリッドに対してサイズ8×8の非重複ブロックで行なわれる(すなわち補間は使用されない)。圧縮は各ブロックで変換係数を閾値処理することによって行なわれ、閾値はブロックの最高変換係数からの固定フラクションとして選択されるが、残りの変換係数のその後の量子化は行なわれない。 図14Bは、サイズ16×16の非重複ブロックで同じ圧縮率3.3に圧縮された図14Aと同じフラグメントを示す。 図14Cは、サイズ32×32の非重複ブロックで圧縮率3.3に圧縮された図14Aと同じフラグメントを示す。 図14Dは、サイズ64×64の非重複ブロックで圧縮率3.3に圧縮された図14Aと同じフラグメントを示す。 図15Aは、閾値処理(量子化無し)によって圧縮率C=3.3に圧縮された512×512分解能テスト画像「胡椒」の128×128画素のフラグメントを示す。計算はサイズ8×8の非重複ブロックで、原データセットの分解能を変更するグリッド点間の補間無しに行なわれる。 図15Bは、サイズ16×16の非重複ブロックで圧縮率3.3に圧縮された同じフラグメントを示す。 図15Cは、サイズ32×32の非重複ブロックで圧縮率3.3に圧縮された図15Aと同じフラグメントを示す。 図15Dは、サイズ64×64の非重複ブロックで圧縮率3.3に圧縮された同じフラグメントを示す。 図16Aは、図13に示したテスト画像「鳥」のフラグメントの異なる圧縮率Cにおけるピーク信号対雑音比(PSNR)のプロットを示す。実線、鎖線、点鎖線、および3点鎖線はそれぞれ、計算がサイズ8×8、16×16、32×32、および64×64画素の非重複ブロックで行なわれた場合のPSNRを示す。圧縮は各ブロックで変換係数を閾値処理することによって行なわれ、閾値は各ブロックで最高の変換係数から固定フラクションとして選択されるが、残りの変換係数のその後の量子化は行なわれない。 図16Bは、周波数領域で三角形ゾーンを実現してゾーン圧縮を使用した場合の、図16Aと同じブロックサイズに対して計算された、同じフラグメントの異なる圧縮率におけるPSNRを示す(それは全てのブロックで所定の値を超える指数(k+j)の和を持つ変換係数Akjを切り捨てることに対応する)。 図17Aは、圧縮が閾値処理の方法によって行なわれるときの図14に示した画像「レナ」のフラグメントの異なる圧縮率CにおけるPSNRを示す。実線、鎖線、点鎖線、および3点鎖線で示す曲線はそれぞれ、ブロックサイズ8×8、16×16、32×32、および64×64画素を使用した計算に対応する。 図17Bは、ゾーン圧縮を使用した場合の図17Aと同じプロットを示す。 図18Aは、圧縮が閾値処理の方法によって行なわれるときの図15に示した画像「胡椒」のフラグメントの異なる圧縮率CにおけるPSNRを示す。実線、鎖線、点鎖線、および3点鎖線で示す曲線はそれぞれ、ブロックサイズ8×8、16×16、32×32、および64×64画素を使用した計算に対応する。 図18Bは、ゾーン圧縮を使用した場合の図17Aと同じプロットを示す。 図19Aは、重複しないブロックで、原画像より3×3倍高い密度の高分解能グリッドを使用した、図19Dに示す原テスト画像「レナ」のフラグメントのCEDCT補間の結果を示す。ブロックサイズはここでは8×8画素であり、圧縮率はC=1である(すなわちデータセットは圧縮されない)。 図19Bは、ブロックサイズ16×16の場合の図19Aと同じものを示す。 図19Cは、32×32画素のブロックのより高い分解能グリッドへの補間に対応する。 図19Dは、図19Aないし19Cに用いられた原テスト画像フラグメントを示す。 図20A,20B,20Cは、図19の場合と同様の補間の例、すなわちテスト画像「胡椒」のフラグメントに対して計算された、データセットの圧縮無しで、非重複ブロックの補間である。 図20Dは、テスト画像「胡椒」の原フラグメントを示す。 図21A,21Bおよび21Cは、3×3倍高い分解能グリッドへの補間が、非重複ブロックを用いて、中程度の圧縮を適用して行なわれた場合の図19A、19B、および19Cにそれぞれ示された画像の類似物である。これらの図の圧縮率は、全てのブロックサイズでC=3.1に対応する。 図22A,22B,22Cは、今は(わずか)1画素だけ隣接ブロックと重複する様々なサイズのブロックで、同様の率C=3.3への圧縮が行なわれた場合の、同じフラグメントの同じ3×3倍高い分解能グリッドへの補間の結果を示す。ブロックアーチファクトの低減は全てのブロックサイズで明らかである。 図22Dは、テスト画像の原フラグメントを示す。 図23A,23B,23Cおよび23Dは、C=9への圧縮(閾値処理による)を使用し、それぞれブロックサイズ8×8、16×16、32×32、および64×64で隣接ブロックとS=3画素だけ重複して行なわれた、鳥の画像の3×3倍高い分解能グリッドへの補間の結果を示す。 図24Aおよび24Bは、計算が(図22A、22B、および22Cで使用したように)ブロック間でS=3画素の重複を使用して様々なサイズのブロックで行なわれた場合の、閾値処理およびゾーン圧縮技術をそれぞれ使用した異なる圧縮率のPSNRのプロットを示す。 図25は、基本領域F、SU(3)の基本ウェイトω1およびω2、ならびにFにおける点z(s,m)有限随伴位数N=11のグリッドF(N)のグラフである。 図26Aおよび26Bは、非回転画像およびそれに対応する回転画像をそれぞれ示す。

Claims (32)

  1. 画像データセットを処理する方法であって、
    前記画像データセットの少なくとも1つのブロックを定義するステップと、
    前記少なくとも1つのブロックを表わす順離散軌道関数変換(DOFT)係数を計算するステップと、
    前記DOFT係数を保存するステップと、
    第1の異なる空間分解能を定義するステップと、
    前記保存されたDOFT係数および前記第1の異なる空間分解能を使用し、前記少なくとも1つのブロックを表わす離散軌道関数変換(CEDOFT)の少なくとも1つの連続拡張を使用して第1の処理済み画像データセットを計算するステップと、
    第2の異なる空間分解能を定義するステップと、
    前記保存されたDOFT係数および前記第2の異なる空間分解能を使用し、前記少なくとも1つのブロックを表わす離散軌道関数変換(CEDOFT)の少なくとも1つの連続拡張を使用して第2の処理済み画像データセットを計算するステップと、を含む方法。
  2. 前記画像データセットが非矩形グリッドを含む、請求項1に記載の方法。
  3. 前記異なる空間分解能の少なくとも1つが矩形グリッドを含む、請求項2に記載の方法。
  4. 前記DOFTが離散コサイン変換(DCT)である、請求項1に記載の方法。
  5. 前記保存された変換係数を量子化して圧縮をもたらすステップをさらに含み、異なる空間分解能を定義する前記ステップおよび処理済み画像データセットを計算する前記ステップが、前記画像データセットの復元の一環として実行される、請求項1に記載の方法。
  6. カラーフィルタアレイパターンの画素を有するCCDを使用して前記画像データセットを取得するステップをさらに含み、
    前記DOFT係数を計算する前記ステップが、前記各色に前記画素を使用して前記色の各々に対するDOFT係数を得るように、前記CCDの前記色の各々に対して別々に行なわれ、
    前記処理が前記カラーフィルタアレイからカラー画像データセットへの変換を実行するように、前記異なる空間分解能が前記色の各々に対して同じである、請求項5に記載の方法。
  7. カラーフィルタアレイパターンの画素を有するCCDを使用して前記画像データセットを取得するステップをさらに含み、
    前記DOFT係数を計算する前記ステップが、前記各色に前記画素を使用して前記色の各々に対するDOFT係数を得るように、前記CCDの前記色の各々に対して別々に行なわれ、
    前記処理が前記カラーフィルタアレイからカラー画像データセットへの変換を実行するように、前記異なる空間分解能が前記色の各々に対して同じである、請求項1に記載の方法。
  8. 前記変換係数を量子化して圧縮をもたらすステップをさらに含み、異なる空間分解能を定義する前記ステップおよび処理済み画像データセットを計算する前記ステップが、前記画像データセットの復元の一環として実行される、請求項7に記載の方法。
  9. 画像データセットを処理する方法であって、
    少なくとも1グリッド点で重複する、前記画像データセットの少なくとも2つのブロックを定義するステップと、
    前記ブロックを表わす順離散軌道関数変換(DOFT)係数を計算するステップと、
    前記DOFT係数を使用して前記ブロックの各々を表わす離散軌道関数変換(CEDOFT)の連続拡張を決定するステップと、
    異なる空間分解能を定義するステップと、
    前記少なくとも1つのCEDOFTおよび前記異なる空間分解能を使用して処理済画像データセットを計算するステップと、を含む方法。
  10. 前記画像データセットが非矩形グリッドを含む、請求項9に記載の方法。
  11. 前記異なる空間分解能が矩形グリッドを含む、請求項10に記載の方法。
  12. 前記DOFTが離散コサイン変換(DCT)である、請求項9に記載の方法。
  13. 前記変換係数を量子化して圧縮をもたらすステップをさらに含み、異なる空間分解能を定義する前記ステップおよび処理済み画像データセットを計算する前記ステップが、前記画像データセットの復元の一環として実行される、請求項9に記載の方法。
  14. 圧縮画像データが第1場所に保存され、異なる空間分解能を定義する前記ステップが所望のズームおよび回転値の少なくとも1つを繰返し指定するステップを含み、前記処理済み画像データセットが少なくとも1つの第2場所に保存される、請求項13に記載の方法。
  15. カラーフィルタアレイパターンの画素を有するCCDを使用して前記画像データセットを取得するステップをさらに含み、
    前記DOFT係数を計算する前記ステップが、前記各色に前記画素を使用して前記色の各々に対するDOFT係数を得るように、前記CCDの前記色の各々に対して別々に行なわれ、
    前記処理が前記カラーフィルタアレイからカラー画像データセットへの変換を実行するように、前記異なる空間分解能が前記色の各々に対して同じである、請求項9に記載の方法。
  16. 前記変換係数を量子化して圧縮をもたらすステップをさらに含み、異なる空間分解能を定義する前記ステップおよび処理済み画像データセットを計算する前記ステップが、前記画像データセットの復元の一環として実行される、請求項15に記載の方法。
  17. 圧縮画像データが第1場所に保存され、異なる空間分解能を定義する前記ステップが所望のズームおよび回転値の少なくとも1つを繰返し指定するステップを含み、前記処理済み画像データセットが少なくとも1つの第2場所に保存される、請求項16に記載の方法。
  18. 画像データセットを圧縮および復元するための方法であって、
    圧縮される画像データセットを提供し、圧縮率を定義するステップと、
    15画素より大きいブロックサイズおよび2以上のグリッド点のブロック重複を選択するステップと、
    前記ブロックサイズおよび前記定義された圧縮率を使用して前記画像データセットを圧縮して、圧縮画像データセットを得るステップと、
    前記圧縮画像データセットを復元し、前記ブロック重複部またはその付近でグリッド点補間を実行して復元画像データセットを得るステップと、を含む方法。
  19. 前記ブロックサイズが16画素より大きい、請求項18に記載の方法。
  20. 前記ブロックサイズが32画素より大きい、請求項18に記載の方法。
  21. 前記ブロックサイズが64画素より大きい、請求項18に記載の方法。
  22. 前記圧縮ステップが、
    前記ブロックサイズを有する前記画像データセットの各ブロックを表わす順離散軌道関数変換(DOFT)係数を計算するステップを含み、前記復元ステップが、
    前記DOFT係数を使用して前記画像データセットの前記ブロックを表わす離散軌道関数変換(CEDOFT)の少なくとも1つの連続拡張を決定するステップと、
    異なる空間分解能を定義するステップと、
    前記少なくとも1つのCEDOFTおよび前記異なる空間分解能を使用して復元画像データセットを計算するステップと、を含む請求項18に記載の方法。
  23. 画像データセットを圧縮および復元するための方法であって、
    画像データセットが離散コサイン変換および16のブロックサイズを使用して圧縮および復元されるときに目立つブロックアーチファクトを生じる、圧縮される画像データセットを提供し、圧縮率を定義するステップと、
    16より適切に大きいブロックサイズを選択するステップと、
    前記適切に大きいブロックサイズおよび前記定義された圧縮率を使用して前記画像データセットを圧縮して、圧縮画像データセットを得るステップと、
    前記圧縮画像データセットを復元して目立つブロックアーチファクトを持たない復元画像データセットを得るステップと、を含む方法。
  24. 前記適切に大きいブロックサイズが32画素より大きい、請求項23に記載の方法。
  25. 前記適切に大きいブロックサイズが64画素より大きい、請求項23に記載の方法。
  26. 前記適切に大きいブロックサイズが128画素より大きい、請求項23に記載の方法。
  27. 前記圧縮ステップが
    前記適切に大きいブロックサイズを有する前記画像データセットの各ブロックを表わす順離散軌道関数変換(DOFT)係数を計算するステップを含み、前記復元ステップが、
    前記DOFT係数を使用して前記画像データセットの前記ブロックを表わす離散軌道関数変換(CEDOFT)の少なくとも1つの連続拡張を決定するステップと、
    異なる空間分解能を定義するステップと、
    前記少なくとも1つのCEDOFTおよび前記異なる空間分解能を使用して復元画像データセットを計算するステップと、を含む請求項23に記載の方法。
  28. ビデオを生成および再生する方法であって、
    時間次元および少なくとも2つの空間次元を有する画像データセットを提供するステップと、
    時間次元に少なくとも1つのグリッド点の重複を持つ前記画像データセットの少なくとも2つのブロックを定義するステップと、
    前記ブロックを表わす順離散軌道関数変換(DOFT)係数を計算するステップと、
    前記DOFT係数を使用してビデオデータを生成するステップと、
    異なる時間フレームレートを有するビデオ再生のために異なる空間分解能を定義するステップと、
    前記ビデオデータの前記DOFT係数を使用して、前記ブロックの各々を表わす離散軌道関数変換(CEDOFT)の連続拡張を決定するステップと、
    前記少なくとも1つのCEDOFTおよび前記異なる空間分解能を使用して、再生ビデオ画像ストリームを生成するステップと、を含む方法。
  29. 前記画像データセットがオリジナルソースビデオストリームであり、前記ビデオデータが圧縮されて記録され、前記記録されたビデオデータを読み出すときに、前記CEDOFTを決定する前記ステップが実行される、請求項28に記載の方法。
  30. 前記異なる空間分解能が時間次元および空間次元の両方に対して異なる、請求項29に記載の方法。
  31. インタレース変換が実行される、請求項30に記載の方法。
  32. 画像データセットを処理する方法であって、
    非矩形グリッドを有するデータセットを提供するステップと、
    前記画像データセットの少なくとも1つのブロックを定義するステップと、
    前記少なくとも1つのブロックを表わす順離散軌道関数変換(DOFT)係数を計算するステップと、
    前記DOFT係数を使用して前記少なくとも1つのブロックを表わす離散軌道関数変換(CEDOFT)の少なくとも1つの連続拡張を決定するステップと、
    異なる空間分解能を定義するステップと、
    前記少なくとも1つのCEDOFTおよび前記異なる空間分解能を使用して、処理済画像データセットを計算するステップと、を含む方法。
JP2008511520A 2005-05-17 2006-05-17 データ処理のための離散変換の連続拡張 Pending JP2008541282A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13041905A 2005-05-17 2005-05-17
US11/293,165 US7787754B2 (en) 2005-05-17 2005-12-05 Continuous extension of discrete transform for data processing
PCT/CA2006/000804 WO2006122413A1 (en) 2005-05-17 2006-05-17 Continuous extension of discrete transform for data processing

Publications (1)

Publication Number Publication Date
JP2008541282A true JP2008541282A (ja) 2008-11-20

Family

ID=37430895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008511520A Pending JP2008541282A (ja) 2005-05-17 2006-05-17 データ処理のための離散変換の連続拡張

Country Status (4)

Country Link
US (2) US7787754B2 (ja)
JP (1) JP2008541282A (ja)
CA (1) CA2608455A1 (ja)
WO (1) WO2006122413A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7873220B2 (en) * 2007-01-03 2011-01-18 Collins Dennis G Algorithm to measure symmetry and positional entropy of a data set
US8660823B2 (en) * 2009-04-26 2014-02-25 Lester F. Ludwig Nonlinear and lie algebra structural analysis system for enzyme cascades, metabolic signal transduction, signaling pathways, catalytic chemical reaction networks, and immunology
WO2011009196A1 (en) * 2009-07-20 2011-01-27 Valorbec, Societe En Commandite Finite dataset interpolation method
US9763587B2 (en) * 2010-06-10 2017-09-19 Biosense Webster (Israel), Ltd. Operator-controlled map point density
US8520971B2 (en) 2010-09-30 2013-08-27 Apple Inc. Digital image resampling
JP5777398B2 (ja) * 2011-05-13 2015-09-09 キヤノン株式会社 画像処理装置、画像処理装置の画像処理方法及びプログラム
US8660374B1 (en) * 2011-12-23 2014-02-25 Massachusetts Institute Of Technology Selecting transform paths for compressing visual data
JP6003803B2 (ja) * 2013-05-22 2016-10-05 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
US20150244896A1 (en) * 2014-02-26 2015-08-27 Vor Data Systems, Inc. System and method for digital signal compression
US9183648B2 (en) * 2014-03-04 2015-11-10 Ivan Bajic Method and system for high-resolution transforms of frequency-space and image/audio/video-space data
CN105677240B (zh) * 2015-12-30 2019-04-23 上海联影医疗科技有限公司 数据删除方法及系统
US11259051B2 (en) * 2016-05-16 2022-02-22 Numeri Ltd. Pyramid algorithm for video compression and video analysis
CN107622481B (zh) * 2017-10-25 2022-09-30 东软医疗系统股份有限公司 降低ct图像噪声的方法、装置和计算机设备
US11403782B2 (en) * 2019-12-31 2022-08-02 Alibaba Group Holding Limited Static channel filtering in frequency domain

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPM661594A0 (en) * 1994-07-01 1994-07-28 Commonwealth Scientific And Industrial Research Organisation Fractal representation of data
GB0004427D0 (en) * 2000-02-24 2000-04-12 Xeikon Nv Cleaning device
US7110455B2 (en) 2001-08-14 2006-09-19 General Instrument Corporation Noise reduction pre-processor for digital video using previously generated motion vectors and adaptive spatial filtering
US7792190B2 (en) * 2004-09-09 2010-09-07 Media Tek Singapore Pte Ltd. Inserting a high resolution still image into a lower resolution video stream

Also Published As

Publication number Publication date
CA2608455A1 (en) 2006-11-23
US20060262994A1 (en) 2006-11-23
US7787754B2 (en) 2010-08-31
WO2006122413A1 (en) 2006-11-23
US20100329579A1 (en) 2010-12-30

Similar Documents

Publication Publication Date Title
US7787754B2 (en) Continuous extension of discrete transform for data processing
Starck et al. The undecimated wavelet decomposition and its reconstruction
US6937772B2 (en) Multiresolution based method for removing noise from digital images
Mueller et al. Image interpolation using multiscale geometric representations
US7194143B2 (en) Method of enhancement of the visual display of images and other visual data records
JP2007116728A (ja) 圧縮された画像の画質の向上
JP6170614B2 (ja) アップサンプリング及び信号強調
US8422767B2 (en) Method and apparatus for transforming signal data
Lakshman et al. Image interpolation using shearlet based iterative refinement
Vishnukumar et al. Single image super-resolution based on compressive sensing and improved TV minimization sparse recovery
Saito et al. Super-resolution interpolation with a quasi blur-hypothesis
Revathy et al. Image zooming by wavelets
Deka et al. Single image super-resolution using compressive sensing with learned overcomplete dictionary
Averbuch et al. Periodic spline-based frames for image restoration
Neetha et al. Image Interpolation Using Non-adaptive Scaling Algorithms for Multimedia Applications—A Survey
Mastriani Quantum spectral analysis: frequency in time, with applications to signal and image processing
Mukherjee et al. Resizing color images in the compressed domain
Deshmukh et al. Video enhancement using non subsampled contourlet transform and bilateral filtering techniques
Moses et al. A survey on adaptive image interpolation based on quantitative measures
Sushma et al. Wavelet-narm based sparse representation for bio medical images
Doma Comparison of different image interpolation algorithms
Jagdale et al. Video resolution enhancement and quality assessment strategy
Liu et al. Wavelet domain image super-resolution reconstruction based on image pyramid and cycle-spinning
Shaji et al. Super Resolution and Denoising of Images via Dictionary Learning
Acharya Development of Some Spatial-domain Preprocessing and Post-processing Algorithms for Better 2-D Up-scaling