JP3773260B2 - 画像又は音声信号を伝送するシステム及び方法 - Google Patents
画像又は音声信号を伝送するシステム及び方法 Download PDFInfo
- Publication number
- JP3773260B2 JP3773260B2 JP51586696A JP51586696A JP3773260B2 JP 3773260 B2 JP3773260 B2 JP 3773260B2 JP 51586696 A JP51586696 A JP 51586696A JP 51586696 A JP51586696 A JP 51586696A JP 3773260 B2 JP3773260 B2 JP 3773260B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- image
- basic function
- odd
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Description
本発明は、画像又は音声信号を伝送するシステムに関するものである。より詳細には、本発明はこれら信号を重複変換法(a lapped transform method)により伝送することに関するものである。
画像又は音声信号の重複変換では、途中で互いに重複する信号の2kサンプルの系列をK個の係数に変換する。これらの係数を伝送し、その後、画像又は音声信号を再構成するために逆変換する。この変換は変換マトリックスによって記述される。以後、送信端における変換マトリックスをAで示し、受信端における変換マトリックスをSで示す。マトリックスA及びSは、K*2K(垂直*水平方向)要素の大きさを有する。マトリックスSの2K要素のK行は変換の基本関数を構成する。各基本関数は周波数スペクトルを有する。基本関数は、各基本関数が全周波数スペクトルの一部を含むように選択される。その部分の中心周波数は高くなるので、基本関数の次数は高くなると云える。例えば画像変換において、次数が増大することは画像の詳細度が増大することを意味する。
信号変換は画像及び音声信号のデジタル圧縮にしばしば用いられる。次数が高い係数はしばしば粗に量子化され、又は省くことさえもできるので、圧縮は可能である。変換の基本関数を慎重に選択することは重要である。ビデオ画像を圧縮するのに非常に頻繁に用いられる変換方法は離散コサイン変換(DCT)である。これは非重複変換(a non-lapped transform)であり、そのマトリックスは次数が増大する偶基本関数と奇基本関数とが交互するものから成る。
既知の重複変換方法は、1990年6月に刊行されたASSPのIEEE Trans.のvol.38,no.6の969〜978頁の“Lapped Transforms for Efficient Transform/Sub-band Coding″に記載されている。変換マトリックスA及びSは、非重複DCTから導出される。これらマトリックスは、複数の偶数列の半分と複数の奇数列の半分とから成る。偶数行は、DCTマトリックスの偶数行とこれに続く奇数行との差を対で求め、且つその差をミラー態様で繰り返すことにより得られる。奇数行は前記差を負の向きで、しかもミラー態様で繰り返すことにより得られる。従って、これらマトリックスは数学的に次のように表すことができる。
この式において、Iは単位マトリックス、Oは零マトリックス、Jは反-恒等(Counter-identity)マトリックスである。Ce及びCoは、マトリックスCの偶数及び奇数行を収容する1/2K*Kマトリックスである。Tは、奇数行が大きな不連続を呈さないようにしてあるマトリックスである。マトリックスCの行はCjで示し、ここに、指数jは関連基本関数の次数を表す。偶指数jは基本関数が偶数であることも示す。奇指数jは基本関数が奇数であることを示す。
従来技術によれば、K*KマトリックスCをDCTマトリックスによって構成する。従って従来技術は、非重複DCTから重複変換を構成する方法を示している。DCTマトリックスは、あたかもA及びSの構成に対する“基本マトリックス”として機能する。得られる重複変換は直交変換である。従って、この変換はLOT(重複直交変換)とも称される。直交性は、エネルギー保存のため及び伝送システムを良好に調整するために信号変換において所望される特性である。これは、システムが数値的に安定に動作することを意味すると理解される。さらに、直交変換では、逆変換マトリックスSは送信端のマトリックスAと同一である。既知の重複変換は位相線形でもある。位相線形性とは、伝送システムの遅延時間が全ての画像又は音声周波数に対して同じであることを意味する。
しかしながら、既知のLOTは、圧縮(即ち、データ低減)のために係数を量子化する際に出力信号の各サンプル系列の縁部に不連続部が生じるという欠点がある。画像を2次元ブロックに分割する画像符号化では、これらの不連続部によるエラーが各ブロックの縁部に可視の輝度不連続部として現れる。従って、これらの不連続部はブロックアーティファクトとも称される。
本発明の目的は、前記アーティファクトがほとんど存在しない画像及び音声信号を伝送するシステムを提供することにある。
このために、本発明によるシステムは、基本マトリックスCを直交マトリックスとし、且つ少なくとも最低次数(i=0)に対する偶基本関数C2iの要素C2i,k及び奇基本関数C2i+1の要素C2i+1,kは、
に適合することを特徴とするものである。
本発明は、直交重複変換マトリックスを任意の直交K*K基本マトリックスCから構成することができるという認識に基づいて成したものである。それは、両縁部での重複変換の少なくとも最低次数の基本関数は0の値にするという課された要件に従う基本マトリックスによって達成される。出力信号は基本関数の加重和であり、且つ最低次数の基本関数が最上位となるから、この際不連続部はほとんど存在しなくなる。
なお、少なくともDCTマトリックスの最初の偶数行又は最初の奇数行を、これらの差が0の値に向かって収束するようにスケール化することは本来既知である。しかしながら、このようにして得られる変更重複変換(MLT)と称される重複変換はもはや直交変換ではない。
本発明によるシステムの他の例は、偶基本関数C2iの要素C2i,k及び奇基本関数C2i+1の要素C2i+1,kが、対になって
に適合することを特徴とするものである。これにより、縁部での重複変換の全ての基本関数が0に向かうようになる。ブロックアーティファクトは、この際全く存在しなくなる。さらに、重複変換の基本関数は増大する次数を有する。マトリックスCを適切に選択することにより、周波数弁別特性が良好になる。従って、重複変換は画像及び音声信号を十分に圧縮するのに非常に好適である。
システムの特に好適な例は、最低次数の偶基本関数C0の全要素C0,kは同一値を有することを特徴とするものである。この場合、値が等しいサンプルの系列、例えば均一輝度の画像ブロックは1つの係数だけで伝送することができる。
本発明のこれら及び他の要点を、以後説明する実施例を参照して明らかにする。
(実施例)
図1は、本発明による画像又は音声信号を伝送するシステムの第1実施例を示す。本装置は、入力信号の連続するサンプルxkを直−並列変換するシフトレジスタ1a,1bを具えている。シフトレジスタは2K個の要素を具え、このレジスタを、2K個のサンプルの各変換後における入力信号がKサンプルの長さに亘ってシフトされることを示すように、各々がK個の要素からなる2つのサブ-レジスタ1a及び1bの形態で示してある。2K個の利用可能なサンプルを、x1...x2Kによって示してある。これらのサンプルは、変換器2に供給され、この変換器2ではベクトル{x1...x2K}にK*2K変換マトリックスを乗算する。このマトリックスを分析マトリックスAとも称する。2K個の入力サンプルの各変換によってK個の係数y1...ykが得られる。これらの係数は量子化兼符号化回路3に供給され、その後、伝送媒体4を経て伝送される。伝送媒体は、無線又はケーブル接続としてもよく、磁気テープ又は光ディスクのような記憶媒体としてもよい。受信端では、量子化係数
が変換器5に供給される。この変換器は、K個の係数の各系列
に2K*KマトリックスSTを乗算する。マトリックスSTは、合成マトリックスSとも称するK*2Kマトリックスを転置したものである。K個の係数を変換することによって2K個の数z1...z2Kが生じる。これらを重複法にて加算する。これを図面では、K個の各数z1...zKに先行する列からのK個各数zK+1...z2Kをそれぞれ加える加算器7a...7kによって示してある。このために、先行する列の関連する部分はレジスタ6に記憶させる。再構成された画像又は音声信号のサンプルu1...uKは加算器7a...7kの出力端にて入手できる。
今日では、信号変換は本来マルチレートフィルタバンク符号化の特殊なケースとして見做すことができると理解されている。このようなマルチレートフィルタバンクを本発明によるシステムの第2実施例として図2に示してある。フィルタバンクは、フィルタ長が2Kで、伝達関数がHk(z)のK個のフィルタ10a...10kを具えている。フィルタ処理された信号は、ダウン-サンプラ11a...11kにて係数Kによってデシメートされる。これは一般に、クリティカルサンプリングと称される。このことは、フィルタ処理された信号の各K番目のサンプルのみが伝送され、中間のK-1個のサンプルは無視されることを意味する。各伝送されたサンプルは係数ykを表す。量子化及び伝送後に、K個の信号は、アップ-サンプラ12a...12kにおいて(K-1個の中間サンプルに値0を入れて)アップ-サンプリングされる。その後これらのサンプルは、フィルタ長が2Kで、伝達関数がFk(z)の補間フィルタ13a...13kに供給される。その後、補間された信号は加算器14において加算される。
変換(図1)と、マルチレートフィルタバンク符号化(図2)との間の類似は、本発明のいくつかの態様への洞察を得る可能性を提供する。例えば、フィルタ長が2Kで、伝達関数がFk(z)の補間フィルタのK個のパルス応答は、K*2K変換器SのK個の行に対応し、フィルタ長が2Kで、伝達関数がHk(z)のフィルタのK個のパルス応答は、順番に反転されるマトリックスAの行に対応する。
これらの実施例を理解するために、一般的な信号変換につき先ず説明する。原理上、伝送すべき画像又は音声信号は、無限数のサンプルxKから成る。回路の送信端での順方向変換により、多数のサンプルは一様に多数の係数ykに変換される。これらの係数は受信端では逆変換される。順方向変換及び逆変換は変換マトリックスにおいて規定される。送信端における変換マトリックスをTにて示し、受信端における変換マトリックスをPにて示すようにする。数学的な表記では、順方向変換はy=Txによって表される。逆変換はu=PTyによって表され、ここに、PTはPの転置バージョン(転置は行及び列の交換である)である。マトリックスPを、
の形態で表す場合には、逆変換、
は、次のように表すことができる。
このベクトル表記は、出力信号{u1,u2...}を、重み付け係数y1,y2...を有するベクトル{p11,p12...}、{p21,p22...}等の線形結合と見做すことができることを示している。前記ベクトルは、PTの列、即ちマトリックスPの行によって構成される。これらは変換器Pの基本関数と称される。重み付け係数は順方向変換から得られる係数である。
ここで、分離可能な変換について注目する。このことは、(例えば、ビデオ画像の)2次元変換は、水平方向における1次元変換と、その後の垂直方向における1次元変換とを行うことによって実行することができることを意味する。従って、以下の説明は1次元変換に限定することができる。
マトリックスT及びPは、方形であり、原理上は無限に大きいものである。実際の使用において、例えば、画像及び音声の符号化に当たっては、入力信号xを、限定数のサンプルを有する1次元の系列(音声)又は2次元のブロック(画像)に分割する。各系列又はブロックは同様に変換される。例えば画像符号化では、8*8、16*16、32*32画素のブロックに変換するのが普通である。この分割により、マトリックスT及びPは次のように数学的に表すことができるブロック-トエプリッツ(Toeplitz)構造を得る。
ここに、A(分析)及びS(合成)は、図1に示した有限次元のマトリックスである。Pの行は、両側に0を補充したSの行に対応する。従って、変換の基本関数は限定範囲でのみ0にならなくなる。式(2)におけるマトリックスA及びSは、互いに重複しても、重複しなくてもよい。(とりわけ、MPEG画像符合化において)頻繁に用いられるDCTは、非重複変換のクラスに属する。ここで、K個のサンプル{x1...xK}は毎回K*KマトリックスAによってN個の係数{y1...yK}に変換される。
ビデオ画像のデータ圧縮の場合に、基本関数は、これらの各々の所定の画像細部を表すように選択する。マルチレートフィルタバンクに関して、各フィルタHk(z)は周波数スペクトルから限られた帯域をフィルタ処理する。フィルタ周波数が高くなると、パルス応答も高くなる。人間の眼は高い空間周波数には敏感でないため、対応する係数は粗目に量子化することができる。均一輝度の画像平面は1つの係数によって記述することもできる。
係数の量子化は、入力信号が最早申し分なく伝送されることを意味する。これは、各係数yKには量子化エラーeKが付きまとうと仮定することによって数学的に定式化することができる。正確な係数yの代わりに、量子化した係数
を伝送する。この場合の伝送回路の出力信号uは次のようになる。
換言するに、再構成出力信号uは、正確な入力信号xだけでなく、エラー信号PTeも含んでいる。このエラー信号はPの基本関数の線形結合であり、この際これは重み係数としてe={e1,e2,...}を伴う。目立つアーティファクトは、高圧縮率、即ち、粗量子化によるeKの大きい値、又は高次基本関数の係数の省略によってさえも生じる。非重複変換では、これらのアーティファクトは、各サンプル系列の縁部に急速に現れる。例えば画像符号化では、輝度の不連続性が各画素ブロックの縁部において生じる。図3はこの例を示す。この例において、xは、16*16DCT処理される直線的に増大する画像輝度の形態の入力信号を表す。最低次数の係数(DC係数)を除くすべての係数を切り捨てると、不連続部が各画素系列の縁部と一致する段歩状に増大する出力信号uが得られことは容易に明らかになるであろう。
重複変換では、マトリックスAとSがトエプリッツ構造において互いに部分的に重複する。この重複は、トエプリッツ構造を、
として書くことによって表すことができ、ここに、
は長方形のK*N(垂直*水平)マトリックスである。A1,A2,...及びS1,S2,...はK*Kマトリックスである。
重複変換により、一連のN個のサンプル{x1...xN}は、一連のK個の係数{y1...yK}に変換される。各変換後に、入力信号はK個のサンプル分だけシフトする。非重複変換の場合と同様に、係数の総数はサンプルの総数に等しいままである。
逆変換u=PTyは次のように表すことができる。
この場合の出力信号も、重み付けした(さらに、ここでは重複している)基本関数の和となる。基本関数はマトリックスSの行{S11...S1N}...{SK1..SKN}によって構成され、係数yも重み付け係数を構成する。
そこで、例えば画像符号化用に実際的に使用できる重複信号変換について探求する。このめに、多数の賢明な制限及び必要条件を伝送回路に課し、これらを、変換器A及びSが応じるべき条件に合わせる。
以下の説明は、50%の重複に基づくものである。従って、N=2K個のサンプルxの連続系列は互いに途中で重複する。2K個のサンプルの各系列は伝送すべきK個の係数yを生じる。マトリックスA及びSはK*2K(垂直*水平)要素の大きさを有し、これらのマトリックスは下記のように2つのK*Kマトリックスの連続と見做すことができる。
図2における分析フィルタHk(z)及び合成フィルタFk(z)には、線形位相変動を持たせるようにすることができる。この場合、各K個のフィルタを通過する信号の遅延時間は等しくする。このために、フィルタのパルス応答の半分は偶数とし、残りの半分は奇数とすべきである。既に述べたように、パルス応答はマトリックスA及びSの行に対応する。偶数及び奇数行を一緒にグループ化する場合、マトリックスA及びSの構成は共に次のようになる。
この特性は数学的に次のように表すことができる。
ここに、A11,A21,S11及びS21は1/2K*Kマトリックスであり、Jは、非対角における要素が値1を有し、他の要素が値0を有する反-恒等マトリックスである。Jによるマトリックスの乗算によって行をミラーリングする。
重複変換に関しての重要な要件は入力信号xを完全に再構成することにある。このために、u=PTTx、従って、PTT=Iとする必要がある。P及びTは、方形マトリックスであることから、TPT=Iとする必要がある。PT及びTに与えられるトエプリッツ構造は次のように表すことができる。
従って、完全な再構成に対する十分且つ必要な条件は次の通りである。
式(3)におけるAとSは同じ構造を有していることから、これらの条件は次のように表すことができる。
マトリックスA11及びA21は同じランク(1/2K)を有しているから、A11及びA21のベクトルは、同じ空間に内在する。従って、A21の行はA11の行の線形結合として、又はその逆に表すことができる。数学的に、このことは、A21=Ta.A11となることを意味し、ここに、Taは任意の可逆1/2K*1/2Kマトリックスである。同様の考えを合成マトリックスSに適用する。この場合、式(3)は次のように表すことができる。
Ta及びTSによって、フィルタは“平滑性”、周波数弁別等について所望な特性を呈するように形成する。特に、Ta及びTSは、中央における奇数のパルス応答を“平滑に”ゼロ通過させる。マトリックスTa及びTSは、これらが可逆的であるとすれば、全く任意なものである。マトリックスTa及びTSは互いに無関係ではない。条件(5)からTaTS T=I、従って、TS=Ta -Tが得られる。
従って、K*2K変換マトリックスA及びSは、それぞれ1/2K*KマトリックスA11及びS11から構成することができる。各行をフーリエ展開によって偶数行と奇数行の和として表すことができるのと同様に、A11及びS11は、それぞれ偶数行の偶数マトリックスAe及びSeと、奇数行の奇数マトリックスAo及びSoとの和として表すことができる。この場合、式(6)は次のようになる。
この場合、完全に再構成するための条件(4)及び(5)は次のように変化する。
順方向変換Aと逆変換STは直交する必要がある。この場合、分析マトリックスA及び合成マトリックスSは互いに等しくする。これらの双方は次のように表される。
前記からの続きで、A及びSは、偶数行から成る1/2K*KマトリックスCeと、奇数行から成る1/2K*KマトリックスCoとから構成することができる。即ち、重複直交変換(LOT)は、半分が偶数行から成り、他の半分が奇数行から成る直交K*KマトリックスCから再構成することができる。この場合、Cの偶数行はCeに編入され、係数1/2で縮尺される。Cの奇数行は、Coに編入され、これも係数1/2で縮尺される。ここで、直交マトリックスCを“基本マトリックス”と称する。
従来は、重複変換に対する基本マトリックスとして、DCTの適応性について探求するだけであった。これについては、序文において記載された論文と、″The LOT:Transform Coding WiThouT BloCking EffeCTs″in IEEE Trans. on ASSP, vol. 37, no. 4,April 1989, pp. 553-559とを参照願いたい。DCTに基づく既知のLOTをさらに考察するのが賢明である。前記刊行物のものは次のような式を用いている。
ここに、De及びDoは、DCTマトリックスの偶基本関数及び奇基本関数から成る。式(10)は式(9)を転置したものに匹敵する。16:16DCTマトリックスの最低次数(画像符号化における最低空間画像周波数)の2つの基本関数d0及びd1を図4に示してある。ここで、d0はDCTの第1偶数行(Deの第1行)であり、d1はDCTの第2行(Doの第1行)である。これらから形成されるLOTの第1基本関数は、差d0−d1を求め、且つこれを、32個のサンプルの偶基本関数を得るようにミラー法で繰り返すことによって式(10)に従って得られる。この第1基本関数を図5にs0によって示してある。既知のLOTの第1奇基本関数は、差d0−d1を求め、マトリックスZ'の要素による乗算を行い、且つこの結果を非対称的に繰り返すことによって得ている。Z'による乗算がなければ、この奇基本関数には不連続部が生じることに留意すべきである。このような不連続基本関数は望ましくない。Z'による乗算の目的は、これらの不連続部をなくすことにある。このようにして得られる第1奇基本関数を図5にs1にて示してある。
対応する方法で、既知のLOTの第2偶基本関数s2及び第2奇基本関数s3は、DCTの第3(偶数)行d2と第4(奇数)行d3から得られる。既知のLOTのこれらの及び他の基本関数は図5に示していない。
既知のLOTは完全な再構成の特性を有している。さらに、それは、一連の一定入力サンプル(例えば、一定輝度の画像ブロック)を1つのDC係数(基本関数に対する重み付け係数)だけによって伝送することができる特性も有している。しかしながら、既知のLOTはブロックアーティファクトがままならない。図6は、第1基本関数の係数だけを伝送する場合の直線的に増加する入力信号xに対する出力信号を示す。縁部における第1基本関数s0の値は0に等しくないため、アーティファクトが発生する。これは、DCT基本マトリックスの第1基本関数d0の“周辺値”がd1の周辺値と√2の係数だけ異なることによって生じる。これを解決するために、少なくとも第1基本関数s0に対してs0=d0−d1の代わりにs0=d0√2−d1を選ぶことが試みられていた。これにより得られる変換は“変更重複変換”と称され、実際上、ブロックアーティファクトをかなり低減させるように見える。しかしながら、MLTは直交変換ではない。
そこで、適切な直交基本マトリックスCを得る方法につき説明する。DCTのフィルタ特性は良好なため、DCTマトリックスを出発点とする。フィルタ周波数に従って配列したDCTマトリックスの行をd0…dkと称し、ここで、偶数指数は偶数行を表し、奇数指数は奇数行を表す。それに応じて、基本マトリックスCの行はC0…Ckによって表される。
DCTの第1行d0は第1行C0、即ちC0=d0となる。実際上、行d0は同一値を有する全ての要素の所望な特性を満足する。この第1行を図7にC0によって示してある。それぞれの要素の値は、ここでは、行のノルム(平方の和のルート)が1となるように√(1/K)とする。
次いで、C1を決定する。この行は以下の条件を満たす必要がある。
− 左縁部の要素は、C0+C1の要素が“スムーズに”0まで進むように、“スムーズに”√(1/K)まで進める。
− C1は奇数とする。即ち、それは中央で零交差するようにする。
− 行のノルムは他の行のノルムに等しくする。
C1は直観的に大きくする。−C1の第1近似は、幾つかの予定点により高次の補間曲線を求めることにより得られる。これら点の1つ又は2つ(図7の70)は行の左に位置し、これらの点の値は√(1/K)である。これらにより、左縁部のC1を所望値√(1/K)に“スムーズに”収束させる。他の点は、零交差の両側に位置するd1の値72によって形成される。C1のフィルタ特性はこの際、DCTマトリックスの第1奇数行の好適な特性と本質的に相違しない。これまでに求めたそれぞれの点間の単調な補間曲線によって、ノルム<1の行が得られる。ノルムを復元するために、周辺値√(1/K)より大きな値を有する少なくとも1つの点(図7の71)を左縁部と零交差との間で決定する。
高次の補間曲線は、このようにして決定した点から算出する。このようにして得られた曲線を検索行C1の第1推定とする。この行のノルムを次に算出する。所望値からの偏差は、得られた値を適切な係数により補正することにより補正する。所要に応じ、正規化処理を複数の反復ステップで行なうことができる。このようにして、図7に−C1にて示した行を最終的に獲得する。比較のために、この図ではDCTマトリックスの第1奇数行をd1にて示してある。
基本マトリックスCの他の偶数行C2,C4…は、DCTマトリックスの対応する偶数行d2,d4…と全く同一とすることができる。(DCTの特性により)これらの行は既に互いに直交しており、且つ他の全ての行(これらは奇数行であるので)と直交する。
基本マトリックスCの他の奇数行C3,C5…もDCTマトリックスの対応する行から直接導出することができる。これらの形状は変える必要がなく、これらの形状は、これらが隣接する偶数行と左縁部で等しくなるようにするという要件に十分適合する。しかしながら、DCTマトリックスの行d3,d5…は、構成した行C1に対して垂直にはならない。従って、これらの行は連続的に回転させる必要がある。このベクトル回転のこの処理は、グラム−シュミット直交法(Gram-Schmidtorthogonalization)の名により数学上既知である。
図8は、式(9)によりC0及びC1から得られるような変換マトリックスSの第1偶基本関数s0及び第1奇基本関数s1を示している。図9は、第1基本関数の係数だけを伝送する場合における直線的に増加する入力信号xでの出力信号uを示す。この場合には縁部にブロックアーティファクトが全く存在しなくなる。
【図面の簡単な説明】
図1及び2は、本発明による画像又は音声信号を伝送するシステムの実施例を示すずである。
図3は、非重複変換において生じるようなブロックアーティファクトを示す図である。
図4は、非重複DCTの2つの第1基本関数を示す図である。
図5は、従来技術によるLOTの2つの第1基本関数を示す図である。
図6は、既知のLOTにおいて生じるようなブロックアーティファクトを示す図である。
図7は、本発明によるLOTを構成する基本マトリックスの2つの第1基本関数に対する実現化を説明するための図である。
図8は、本発明によるLOTの2つの第1基本関数を示す図である。
図9は、単一係数の伝送での直線的に増加する入力信号に対する本発明によるシステムの応答を示す図である。
Claims (16)
- 互いに途中で重複する画像又は音声信号のサンプルの系列を第1変換マトリックスAによって複数個の係数に変換する第1変換手段(2;10,11)と;
前記係数を伝送する手段(3,4)と;
伝送された係数を第2変換マトリックスSにより出力信号に重複逆変換する第2変換手段(5;12,13)とを具え、
前記マトリックスA及びSを、
として表すことができ、ここに、Iを単位マトリックスとし、Oを零マトリックスとし、Tを任意に反転可能なマトリックスとし、且つJを反-恒等マトリックスとし、マトリックスCe及びCoは、基本マトリックスCの偶基本関数及び奇基本関数からそれぞれ成り、各基本関数Cjは、当該基本関数の周波数スペクトルの中心周波数に従って配列される次数jを有するようにした、画像又は音声信号を伝送するシステムにおいて、
前記基本マトリックスCを直交マトリックスとし、且つ少なくとも最低次数(i=0)に対する偶基本関数C2iの要素C2i,k及び奇基本関数C2i+1の要素C2i+1,kは、
に適合することを特徴とする画像又は音声信号伝送システム。 - 前記最低次数の偶基本関数C0の全要素C0,kは同一値を有することを特徴とする請求の範囲1又は2記載の画像又は音声信号伝送システム。
- 互いに途中で重複する画像又は音声信号のサンプルの系列を、第1変換マトリックスAによって複数個の係数に変換する変換手段と、前記係数を符合化する手段とを具え、前記マトリックスAを、
として表すことができ、ここに、Iを単位マトリックスとし、Oを零マトリックスとし、Tを任意に反転可能なマトリックスとし、且つJを反-恒等マトリックスとし、マトリックスCe及びCoは、基本マトリックスCの偶基本関数及び奇基本関数からそれぞれ成り、各基本関数Cjは、前記基本関数の周波数スペクトルの中心周波数に従って配列される次数jを有するようにした、画像又は音声信号を符号化する符号化装置において、
前記基本マトリックスCは直交マトリックスとし、且つ少なくとも最低次数(i=0)に対する偶基本関数C2iの要素C2i,k及び奇基本関数C2i+1の要素C2i+1,kは、
に適合することを特徴とする画像又は音声信号符号化用の符号化装置。 - 前記最低次数の偶基本関数C0の全要素C0,kは同一値を有することを特徴とする請求の範囲5又は6記載の符号化装置。
- 重複信号変換の係数の形態で伝送される画像又は音声信号を復号化する復号化装置であって、伝送された係数を変換マトリックスSTにより出力信号に重複逆変換する変換手段を具え、前記マトリックスSを、
として表すことができ、ここに、Iを単位マトリックスとし、Oを零マトリックスとし、Tを任意に反転可能なマトリックスとし、且つJを反-恒等マトリックスとし、マトリックスCe及びCoは、基本マトリックスCの偶基本関数及び奇基本関数からそれぞれ成り、各基本関数Cjは、前記基本関数の周波数スペクトルの中心周波数に従って配列される次数jを有するようにした、画像又は音声信号を復号化する復号化装置において、
前記基本マトリックスCは直交マトリックスとし、且つ少なくとも最低次数(i=0)に対する偶基本関数C2iの要素C2i,k及び奇基本関数C2i+1の要素C2i+1,kは、
に適合することを特徴とする画像又は音声信号復号化用の復号化装置。 - 前記最低次数の偶基本関数C0の全要素C0,kは、同一値を有することを特徴とする請求の範囲9又は10記載の復号化装置。
- 画像又は音声信号を伝送する方法であって:
互いに途中で重複する画像又は音声信号サンプルの系列を、第1変換マトリックスAによって複数個の係数に変換するステップと;
前記係数を伝送するステップと;
伝送された係数を、第2変換マトリックスSTにより出力信号に重複逆変換するステップとを具え、
前記マトリックスA及びSを、
として表すことができ、ここに、Iを単位マトリックスとし、Oを零マトリックスとし、Tを任意に反転可能なマトリックスとし、且つJを反-恒等マトリックスとし、マトリックスCe及びCoは、基本マトリックスCの偶基本関数及び奇基本関数からそれぞれ成り、各基本関数Cjは、前記基本関数の周波数スペクトルの中心周波数に従って配列される次数jを有する、画像又は音声信号を伝送する方法において、
前記基本マトリックスCは直交マトリックスとし、且つ少なくとも最低次数(i=0)に対する偶基本関数C2iの要素C2i,k及び奇基本関数C2i+1の要素C2i+1,kは、
に適合することを特徴とする画像又は音声信号伝送方法。 - 前記最低次数の偶基本関数C0の全要素C0,kは同一値を有することを特徴とする請求の範囲13又は14記載の画像又は音声信号伝送方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP94203264 | 1994-11-09 | ||
AT94203264.0 | 1994-11-09 | ||
PCT/IB1995/000844 WO1996015627A2 (en) | 1994-11-09 | 1995-10-06 | System and method for transmitting picture or sound signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09508516A JPH09508516A (ja) | 1997-08-26 |
JP3773260B2 true JP3773260B2 (ja) | 2006-05-10 |
Family
ID=8217363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP51586696A Expired - Fee Related JP3773260B2 (ja) | 1994-11-09 | 1995-10-06 | 画像又は音声信号を伝送するシステム及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5812219A (ja) |
EP (1) | EP0739569B1 (ja) |
JP (1) | JP3773260B2 (ja) |
DE (1) | DE69511064T2 (ja) |
WO (1) | WO1996015627A2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6418242B1 (en) * | 1998-11-18 | 2002-07-09 | Tektronix, Inc. | Efficient detection of error blocks in a DCT-based compressed video sequence |
US6421464B1 (en) * | 1998-12-16 | 2002-07-16 | Fastvdo Llc | Fast lapped image transforms using lifting steps |
SE0101175D0 (sv) | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
JP2007507790A (ja) * | 2003-09-29 | 2007-03-29 | エージェンシー フォー サイエンス,テクノロジー アンド リサーチ | 時間ドメインから周波数ドメインへ及びそれとは逆にデジタル信号を変換する方法 |
US20060251421A1 (en) * | 2005-05-09 | 2006-11-09 | Ben Gurion University Of The Negev, Research And Development Authority | Improved free space optical bus |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5028995A (en) * | 1987-10-28 | 1991-07-02 | Hitachi, Ltd. | Picture signal processor, picture signal coder and picture signal interpolator |
AU1996292A (en) * | 1991-05-17 | 1992-12-30 | Analytic Sciences Corporation, The | Continuous-tone image compression |
JP2549479B2 (ja) * | 1991-12-06 | 1996-10-30 | 日本電信電話株式会社 | 動き補償フレーム間帯域分割符号化処理方法 |
KR0166717B1 (ko) * | 1992-06-18 | 1999-03-20 | 강진구 | 가변화면분할기법을 이용한 부호화/복호화방법 및 장치 |
US5291281A (en) * | 1992-06-18 | 1994-03-01 | General Instrument Corporation | Adaptive coding level control for video compression systems |
CA2094524A1 (en) * | 1992-07-30 | 1994-01-31 | Ephraim Feig | Digital image processor for color image compression |
-
1995
- 1995-10-06 JP JP51586696A patent/JP3773260B2/ja not_active Expired - Fee Related
- 1995-10-06 EP EP95932145A patent/EP0739569B1/en not_active Expired - Lifetime
- 1995-10-06 WO PCT/IB1995/000844 patent/WO1996015627A2/en active IP Right Grant
- 1995-10-06 DE DE69511064T patent/DE69511064T2/de not_active Expired - Fee Related
- 1995-11-01 US US08/551,592 patent/US5812219A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US5812219A (en) | 1998-09-22 |
WO1996015627A2 (en) | 1996-05-23 |
EP0739569A1 (en) | 1996-10-30 |
WO1996015627A3 (en) | 1996-07-25 |
DE69511064T2 (de) | 2000-02-24 |
JPH09508516A (ja) | 1997-08-26 |
EP0739569B1 (en) | 1999-07-28 |
DE69511064D1 (de) | 1999-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5838377A (en) | Video compressed circuit using recursive wavelet filtering | |
US5629778A (en) | Method and apparatus for reduction of image data compression noise | |
EP1359546B1 (en) | 2-D transforms for image and video coding | |
AU634237B2 (en) | Digital transmission system using subband coding of a digital signal | |
US20060029282A1 (en) | Image Blocking Artifact Reduction Via Transform Pair | |
EP0679032A2 (en) | Image encoding and decoding method and apparatus using edge systhesis and inverse wavelet transform | |
US5984514A (en) | Method and apparatus for using minimal and optimal amount of SRAM delay line storage in the calculation of an X Y separable mallat wavelet transform | |
Xia et al. | Optimal multifilter banks: design, related symmetric extension transform, and application to image compression | |
US8582869B2 (en) | Finite dataset interpolation method | |
US4261043A (en) | Coefficient extrapolator for the Haar, Walsh, and Hadamard domains | |
JP2000252831A (ja) | 信号処理方法及び装置、デジタル装置 | |
US6768817B1 (en) | Fast and efficient computation of cubic-spline interpolation for data compression | |
JP4688988B2 (ja) | ビデオデータの圧縮方法並びに装置、及び伸張方法並びに装置 | |
JP3773260B2 (ja) | 画像又は音声信号を伝送するシステム及び方法 | |
Karray et al. | Image coding with an L/sup/spl infin//norm and confidence interval criteria | |
JP3796431B2 (ja) | デジタル・フィルタリング方法および装置 | |
JP3747067B2 (ja) | 信号の符号化及び復号化方法及び装置 | |
Kwak et al. | C-matrix transform | |
JP3687101B2 (ja) | データ処理方法及びデータ処理装置 | |
Slusarczyk et al. | Piecewise-linear subband coding scheme for fast image decomposition | |
MXPA01010815A (es) | Metodo y aparato para crear e implementar filtros de tren de ondas en un sistema digital.. | |
Chan et al. | A class of M-channel linear-phase biorthogonal filter banks and their applications to subband coding | |
JP2005501277A (ja) | 不均一なフィルタバンクを用いたオーディオの符号化 | |
JP2001216290A (ja) | 逆離散ウェーブレット変換方法およびその装置 | |
JP4729505B2 (ja) | デジタルオーディオ信号の変換及び変換されたデジタルオーディオ信号の逆変換の方法並びに装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041221 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20050322 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20050509 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060214 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090224 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100224 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110224 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110224 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110224 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120224 Year of fee payment: 6 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130224 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130224 Year of fee payment: 7 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140224 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |