JPH0779312B2 - 信号の符号化方法 - Google Patents
信号の符号化方法Info
- Publication number
- JPH0779312B2 JPH0779312B2 JP4085086A JP8508692A JPH0779312B2 JP H0779312 B2 JPH0779312 B2 JP H0779312B2 JP 4085086 A JP4085086 A JP 4085086A JP 8508692 A JP8508692 A JP 8508692A JP H0779312 B2 JPH0779312 B2 JP H0779312B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- band
- encoding
- bands
- analog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000001228 spectrum Methods 0.000 claims description 23
- 230000008447 perception Effects 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000013139 quantization Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008825 perceptual sensitivity Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/12—Systems in which the television signal is transmitted via one channel or a plurality of parallel channels, the bandwidth of each channel being less than the bandwidth of the television signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Image Processing (AREA)
- Analogue/Digital Conversion (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
に、効率的な伝送および記憶のための信号の符号化に関
する。
力信号のサンプリング、サンプルの量子化、および、量
子化されたサンプルを表現する符号のセットの生成から
なる。興味のあるほとんどの信号(例えば、音声または
映像信号)は高度に相関している。これは、信号が予測
可能な成分および予測不可能な成分からなると考えられ
ることを意味する。符号化圧縮は、本質的に、予測不可
能成分のみを符号化することによって達成される。さら
に、これらの信号はしばしば人間によって受容され知覚
されるため、受容された情報の人間による知覚に関する
概念が、このような信号の符号化と、その結果、伝送さ
れる信号の速度とを圧縮するために使用される。
最も密接に関係する従来の符号化方法は、変換符号化お
よび線形予測符号化である。
信号はセグメントに分割される。セグメントはサンプリ
ングされ、セグメントのサンプルは周波数領域変換係数
のセットに変換される。係数信号は量子化され、伝送チ
ャネルに送られる。ノイズ知覚特性を考慮したシステム
では、係数に適用される量子化モードは、信号特性およ
び生じる量子化ノイズに対する受容者の感度に依存して
形成され、それによって符号化効率が高められる。それ
らの考慮には、使用可能な制限されたバンド幅が重ね合
わされる。
扱う方法の1つである。この方法では、ビットは、一定
のバンド幅を達成するようなやり方で変換係数の符号化
に割り当てられる。変換符号化の例は、とりわけ、米国
特許第4,949,383号、米国特許第4,184,
049号、などにある。
代半ばに始まった。その後、予測符号化は、ノイズを知
覚する無制限でない能力を考慮に入れることによって改
善されることが認識されている。
(LPC)では、信号セグメントは履歴情報から予測さ
れ、エラー信号が、予測された信号を実際の信号から減
算することによって導出される。エラー信号は一般に、
ノイズ知覚周波数感受性関数によって変換され重みづけ
られ、修正された変換結果を生じる。修正された変換結
果は符号化され受信機に伝送される。
例えば、サブバンド符号化が画像信号に適用されてい
る。この符号化方法では、画像を2次元の周波数バンド
に分割し、各バンドの信号がDPCMによって圧縮され
る。実際、2次元周波数バンドは、画像を形成する2つ
の次元における信号の変化性の尺度である。また、映像
のベクトル量子化が、例えば、米国特許第4,811,
112号(発明者:C.W.ラトレッジ(C. W. Rutledg
e)、1989年3月7日発行)に開示されている。
特性が実現されている。このシステムは、基本的に、ソ
ース情報に2次元コサイン変換を実行し、導出された係
数をHVS関数に従って重みづけする。重み付き係数は
量子化され、伝送媒体に送られる前にバッファに送られ
る。所望の大域的ビット速度を保証するため、量子化器
によって生成されるビット数を制御するようにバッファ
・フルネス指示が量子化器にフィードバックされる。
5号(発明者:J.D.ジョンストン(J. D. Johnsto
n)、R.J.サフラネク(R. J. Safranek)、出願日:1
989年5月4日)には、各ピクセルに対する量子化方
式が、生成される量子化ノイズ量が知覚可能限界付近で
その限界よりは低いように適応するような、サブバンド
解析方法が開示されている。量子化ノイズを知覚可能性
以下に保ちつつその増大を許容することにより、信号の
より高度な圧縮が達成される。
サンプリングされ量子化された信号で作用する。さらに
圧縮された符号を実現するために、従来技術の方法は一
般に信号を周波数領域に変換し、その後その領域で作用
する。固定バンド幅を与えられると、従来技術の方法
は、全周波数成分でまたは事前指定された数の周波数成
分で可能な限り良好な仕事をするために、異なる周波数
成分の間で使用可能なビットを割り当てる。換言すれ
ば、周波数係数をいかにうまく符号化するかが決定され
るのであって、最初に符号化するかどうかが決定される
のではない。その結果、符号化方式は、必要以上に複雑
となり、全ビット速度が制限されている場合には知覚的
に最適ではない。
ば、ある周波数バンドを符号化するかどうかの単純な決
定を通じて良好なパフォーマンスが達成される。この決
定は、すべてのまたは所定数の周波数バンドをいかにう
まく符号化するかについてのものではない。アナログ信
号はベースバンド周波数スペクトルを有し、信号の周波
数スペクトルに対応して「最小可知差異」(jnd)ノ
イズ・スペクトルが存在するということを認識すれば、
jndスペクトル以下に落ちる信号周波数バンドは結局
知覚不可能なので、それらの周波数バンドを伝送する必
要はないということは明らかである。さらに、使用可能
なバンド幅が制限されている場合、最もjndスペクト
ルを超過する信号の周波数バンドのみを伝送することに
集中することには意味がある。
が、符号化される信号のいくつかの周波数バンドを選択
する決定回路に送られる。選択された各バンドは符号化
され、受信機に伝送される。
が、変換回路を通じてバンドに分割される。この変換回
路は、実際は、帯域フィルタのバンクである。各バンド
内のjndレベルが評価され、バンド内の入力信号をバ
ンド内のjnd信号で除算したものに対応する商信号が
各バンドに対して生成される。選択回路が、最高の商を
有するn個のバンドを識別し、アナログ信号伝送が望ま
しい場合、逆変換によってn個のアナログ信号が生成さ
れ、隣接するスペクトルを有するベースバンドを形成す
るように変調される。ベースバンド信号は直接搬送波上
に変調される。ディジタル伝送のほうが望ましい場合、
選択回路の出力がフォーマットされ、伝送媒体に送られ
る。
周波数スペクトルによって表現可能である。情報を運ぶ
信号は一般に周波数の全スペクトルを含まないため、一
般的に、スペクトルはバンド内で非常にぎざぎざにな
る。信号のバンドを考える際には、ある型の平均化が起
こり、このような信号のスペクトルのぎざぎざは少なく
なるため、図1の曲線10(文字Sでも表される)に図
示されたような輪郭線を有する。曲線10は、例えば、
音声信号を表現する。ノイズ信号(音声信号の場合は雑
音のように聞こえ、映像信号の場合は霜降りのように見
えるもの)は一般にすべての可能な周波数成分を含み、
周波数とともに非常にゆっくりと変化する周波数スペク
トルを有する。平坦なスペクトル輪郭線は一般に「ホワ
イト・ノイズ」と呼ばれる。
がほとんどの人によって知覚不可能なしきい値が存在す
ることが確立されている。このしきい値は周波数ととも
に変化する。マスキング性のため、このしきい値は、ノ
イズ信号があるときに存在する情報信号のスペクトルに
よっても変化する。このマスキング現象は一般人にも周
知である。窓のない壁の像内のノイズ様産物は容易に検
出されるが、ジャングルの像内の同一の産物は検出され
ない。
関係は本発明の原理にとっては重要でないため、図1に
は例示的な関係のみ図示してある。図1の曲線20は、
jndとも書かれているが、図1の曲線10によって表
現された音声信号に対するノイズしきい値の変化を周波
数の関数として図示したもの(jndスペクトル)であ
る。図1のDは音声信号と知覚されるノイズしきい値の
エネルギー差を表す。実際には、図1のグラフの縦軸は
対数目盛りであり、図示された差信号Dは実際は商S/
jndの対数である。
技術では、修正スペクトルの符号化の前に、単にSの周
波数係数の修正すなわち重みづけの手段として使用され
ている。ビット割当や量子化モード制御(信号を量子化
するために使用されるビット数の制御)を通じて、技術
者は、修正された周波数係数の符号化において可能な最
大の仕事をしようと試みてきた。
スペクトルは、周波数バンドをいかに符号化するかでは
なく、それを符号化するかどうかの決定にかかわる。さ
らに、本発明の符号化は、一定の知覚品質の符号化プロ
セスを実現するのに適合する。
のスペクトルがN個の周波数バンドに分割され、jnd
スペクトルが計算され、Nバンドのうちからn個を選択
する決定手段に送られる。Nおよびnは設計者の制御下
にあるパラメータである。結果の圧縮率はN/nであ
り、このことは、与えられたNに対し、小さいnの値は
高レベルの圧縮を実現することを意味する。もちろん、
高レベルの圧縮の結果、伝送媒体に接続された受信機で
は忠実度が低くなる。与えられた比n/Nに対し、Nの
値が大きくなると、保持されるエネルギーの比率が高く
なる(精細な、従って良好な選択は信号のスペクトルの
ピークからなされる)。他方、Nの値は、設計者が指定
しようとするハードウェアの量によって制限される。
くともアナログ回路および何らかのスイッチング、また
はサンプリング)で実現可能であるが、ディジタルによ
る実現が今日の設計において優勢であるという事実に鑑
み、以下の説明はディジタルの実現についてなされる。
と仮定されている。この入力信号は、直並列レジスタ1
05を通して解析フィルタ・バンク100に送られる。
フィルタ・バンク100は、レジスタ105へのN個ご
とのサンプルの到着によって入力信号サンプルのセット
を受信し、それからN個の周波数係数を生成する。フィ
ルタ・バンク100は、例えばコサイン変換回路、また
は一般化直交ミラー・フィルタ(GQMF)のようない
くつかの方法で実現される。
ル・ブロック110に送られる。ブロック110の機能
は、図1のjndバンド信号の生成である。それらの信
号が生成される方法は、厳密に、選択された知覚モデル
の機能であり、実際は、図2にはブロック110がフィ
ルタ・バンク100の出力に応答するように示されてい
るが、知覚モデルにはバンクへ100への入力とブロッ
ク110への入力の間の接続を必要とするものもあり、
さらに、またはその代わりに、バンク100の出力の、
ブロック110への接続を要するものもある。
研究者によって研究されているが、その情報に基づい
て、「音声信号の知覚符号化」と題された米国同時出願
の第07/423,088号(1989年10月18日
出願)には、しきい値を生成する手段(すなわち、知覚
モデル110)を含む実際の符号器の設計が開示されて
いる。しかし、完全を期すために、前記出願によって示
されるように知覚符号器110の出力を生成するFOR
TRANプログラムが包含され、以下で要約される。
ために有用な参考文献は、「FX/FORTRANプロ
グラマーズ・ハンドブック(FX/FORTRAN Programmer's H
andbook)」(アリアント・コンピュータ・システムズ社
(Alliant Computer SystemsCorp.)刊、1988年7
月)である。表1および表2は、使用される絶対しきい
値およびバンド定義のような、図7〜15のプログラム
例とともに使用される定数の表である。
ンおよび「calcthri」ルーチンからなる。「s
trt」ルーチンは、さまざまなパラメータを計算する
ために最初に呼ばれる。その後、「calcthri」
ルーチンが、サンプリングされたデータの新しいすべて
のブロックとともに呼ばれ、このルーチンは「rati
o」とラベルされた出力セットを生成する。実際には、
この出力セットは、定義された異なる周波数バンドに対
する比S/jndを表し、図2に示された独立の除算器
の必要性を除去する。「ratio」を生成するリスト
の最終ステップは(予想されるように)除算であり、除
算には時間がかかることに注意すれば、よりよい実現は
図2に示されたハードウェア除算器を使用することであ
る。
RANプログラムは、ノイズの知覚に対する感度の測度
S/jndを計算する。(S−jnd)2/jnd,|
S−jnd|/jnd,または上記のものの対数のよう
な他の測度もまた使用可能である。
ードウェア除算器で実現された実施例である。すなわ
ち、図2では、商信号qiを生成するために、フィルタ
・バンク100の出力における係数i(ただしi=1,
2,...,N)の信号(すなわち、信号Si)が、回
路111−iで、ブロック110の係数iに対応するj
nd出力(すなわち、信号jndi)によって除算され
る。
の読みだし専用参照テーブルである。8ビットのSiお
よび8ビットのjndiでは、各参照テーブルは単なる
216メモリである。(時間さえ許せば、単一のメモリを
共有することも可能である。)各除算器回路の出力およ
び対応するSi信号は選択器回路120に送られる。各
信号の識別子iもまた回路120に送られる。こうし
て、回路120はN個の3つ組信号を受信し、この回路
の機能は、n個の最大商信号qiに対応するn個の信号
Si(およびそれらの識別子)を選択することである。
識別子情報は一般に「サイド情報」と呼ばれる。以下で
明らかになるように、この情報は受信機に送られなけれ
ばならない。
て選択された信号およびそれらの識別子はフォーマッタ
125でフォーマットされ(そしておそらくさらに符号
化され)遠隔受信機に伝送される。これは、図2で「デ
ィジタル」と記された線によって示されている。フォー
マット化はいくつかの方法が可能である。1つの方法
は、情報をパケットの形式で送ることである。すなわ
ち、各信号識別子はヘッダ・フィールドに置かれ、対応
する係数信号はその直後のデータ・フィールドに置かれ
る。
望ましい状況もある。このような場合、選択器120に
よって選択された係数を、システムによって達成された
圧縮を反映するバンド幅をもつ狭バンド・アナログ信号
に変換するのが有用である。
並直列レジスタのペア140および141、低域フィル
タ150、およびフォーマッタ126で実現される。た
いへん都合の良いことには、逆変換回路130は、N個
の入力のセットではなくn個の入力のセットのみに応答
すればよいことを除いては、バンク100の変換回路を
実現するのに使用される型のものである。
するn個の信号を生成する。これらの時間サンプルはレ
ジスタ140を通して直列にシフトアウトされ、高周波
成分を切断するために低域フィルタ150でフィルタリ
ングされる。もちろん、レジスタ140のクロックはレ
ジスタ105のクロックよりN/n倍遅い。生成された
ベースバンド・アナログ信号はフォーマッタ126に送
られ、そこで伝送のために搬送波上に変調される。
る第2のアナログ信号を生成するために、サイド情報が
レジスタ141を通ってフォーマッタ126にシフトア
ウトされる。レジスタ141では、サイド情報は、例え
ばパルス振幅変調によって符号化される。アナログ伝送
は図2では「アナログ」と記された線によって示されて
いる。もちろん、2つのモード(アナログまたはディジ
タル伝送)のうちの一方を使用することも予想される。
図2では、単に例示のため、両方が図示されている。
ある。これは、バッチャ・ネットワークに基づく。例え
ば、米国特許第3,428,946号(1969年2月
18日発行)参照。この特許で、バッチャは、4個の入
力および8個の入力の任意に配列されたセットをソート
する方法を明らかに示している。バッチャはまた、2つ
の双単調シーケンスを1つの整列シーケンスにマージす
る方法をも示した。
の4入力ソート・ネットワーク127および2個の双単
調マージ・ネットワーク128からなる。これらは、初
めの8個の入力がソート・キーに関して降順であり後の
8個の入力がソート・キーに関して昇順であるような長
さ16の双単調シーケンスを形成するように配置され
る。これらのネットワークは、以下に説明するように、
スイッチ125を使用して、バッチャの方法によって構
成される。
単調シーケンスは、修正双単調マージ・ネットワーク1
29に送られる。log2M(Mはネットワークの入力
の数)個の段階からなる双単調マージ・ネットワーク1
28とは異なり、マージ・ネットワーク129内の段階
の数はlog2(M/n)である。図3では、nは4で
あり、M=N=16であり、この段階の数はlog
2(16/4)すなわち2である。また、多くの出力は
利用されないため、マージ・ネットワーク129内の各
スイッチ125は、ネットワーク127および128内
のスイッチ125の標準的な設計と比較して単純化する
ことが可能である。
る。各スイッチング・ブロック125は、2個の入力係
数信号SmおよびSn、対応する2個の商信号qmおよび
qnならびに信号識別子の値mおよびnを受信する。各
スイッチング・ブロック125の機能は、どちらの商信
号が大きいかを確認し、その商信号、それに対応する係
数信号、および識別子の値を、3個のスイッチ要素のそ
れぞれの2個の出力のうちの選択された1つへ転送する
ことである。
よび減算器121の出力に応答する3個の「2極2投」
スイッチ要素122、123および124によって実現
される。スイッチ122は商信号を転送し、スイッチ1
23は係数信号を転送し、スイッチ124は識別子の値
を転送する。選択器120の最終段階では、さらに決定
がなされる必要がないため、商信号は転送される必要は
ない。また、ネットワーク129内でlog2N/n個
の段階が使用される場合、ネットワークのn個の出力は
順序づけられない。それらは、最大商信号をもつ信号に
対応するものであることが保証されるだけである。
スのタイミングは制御されなければならない。例えば、
回路120が、異なる選択をあまりに頻繁に実行するの
は有用でない。各選択は、受信機に送られなければなら
ないサイド情報の新たなセットを形成し、そのオーバヘ
ッドは最小に保持されるべきである。従って、選択回路
120は、ネットワーク129の出力のところに、各選
択を捕捉し格納するために使用されるレジスタ126を
含む。
ような方式を適用するかである。最も簡単な方法は、固
定クロックを使用することである。これは、サイド情報
に固定バンド幅を与える。クロックは、入力信号のサン
プリング・クロックのN倍でもよいし、またはおそら
く、入力信号のサンプリング・クロックのKN倍(Kは
整数)でもよい。
能)を使用し、クロックの各出現時に、選択の変更から
十分な利益が生じるかどうかについて決定することであ
る。これは、選択されない商信号に対する選択された商
信号の比を測定する従来の回路(図3には図示せず)に
よって可能である。選択器120の出力における選択の
比を、選択器120の入力における選択の比と比較する
ことによって、選択における変化を許すかどうかが、こ
れらの比の観測された差に基づいて決定される。
法に従った受信機である。これは必ずしも周波数によっ
てソートされていないn個のパケットのセットを受信す
るため、入力信号は並列変換器200に直列に加えら
れ、並列変換器200は、各パケットを直列形式に保持
しながら、n個のパケットを並列にソータ210に送
る。ソータ210は、周波数係数を識別するヘッダ・フ
ィールドに基づいて入力信号をソートする。
ワーク220に送られる。エクスパンダ・ネットワーク
210は、信号を、エクスパンダ・ネットワークの適当
な出力へ転送する。ソータ210は、ソートが商信号q
iによってではなく識別子iをキーとして行われる点を
除いては、上記のバッチャ・ネットワークでもよい。エ
クスパンダ・ネットワーク220は、例えば、米国特許
第4,516,238号(発明者:A.ファン(A. Huan
g)、S.C.クナウア(S. C. Knauer)、1985年5月
7日発行)に開示されたシャフル交換ネットワークでも
よい。
される選択プロセスは、周波数バンドの選択および選択
された周波数バンドのベースバンドへのダウンシフトと
同等である。ソータ210の作用は、選択されたバンド
のソートであり、エクスパンダ220の作用は、ソート
された周波数バンドの適当な位置へのアップシフトと同
等である。
回路230に送られる。回路230は、n個の入力では
なくN個の入力(そのうちの0でないのはn個のみであ
るが)に応答する点を除いては回路130と同様であ
る。逆変換回路230のN個の出力は並直列レジスタ2
40を通して直列にシフトアウトされ、低域フィルタ2
50によってフィルタリングされて、最終再構成信号を
生成する。
「1次元」信号に集中している。しかし、本発明の原理
は、高次元の信号にも同様に適用される。例えば、映像
信号(2次元と考えられる)では、変更が必要なのは、
フィルタ・バンク100、逆変換回路130および23
0、ならびに知覚モデル回路110のみである。映像信
号の2次元的側面に関する変更は前記の第07/350
435号出願に説明されている。知覚モデルおよび2次
元変換のプロセスが説明されている。
における知覚モデル100の一実施例を要約的に説明す
る。図6で、N個の入力がフィルタ・バンク100から
受信される。それらの入力のうちの1つは、フレームの
2次元「dc値」が発見されるバンドを表現する。dc
値バンド以外の全バンドは参照テーブル301に送られ
る。各参照テーブルはバンド内のパワーの重みつき測度
を生成する。すなわち、各参照テーブルはkiSi 2の値
を生成する。ただし、kiは異なるiの値に対して異な
っていてよい。
波数バンドでの像の視覚的「テクスチュア」の評価を表
す。加算器302は、全テクスチュア評価値を生成する
ためにN−1個のテーブル301の「テクスチュア」出
力を加算する。この評価値は、加算器302のパワー領
域出力を振幅領域マスキングしきい値に変換する参照テ
ーブル303に送られる。テーブル303内の写像関数
は対数型関数であり、テーブル303の出力におけるダ
イナミック・レンジを縮小する。
る。参照テーブル304は、テーブル303からの入力
に「dc値」バンドを乗算する。最後に、参照テーブル
305は、テーブル304によって生成されたマスキン
グしきい値に、定数のあるセットを乗算する。ここで、
各定数は各周波数バンドにおける人間視覚系のノイズ感
度に関連する。こうして生成されたN個の出力は、知覚
モデル100によって図2の除算器111に送られる出
力のセットを形成する。
形図のような3次元の場合への拡張もまた、その拡張が
1次元から2次元へなされた場合の周知の原理に従って
直接行われる。
る周波数バンドを符号化するかどうかの単純な決定を通
じて良好なパフォーマンスが達成される。また、従来の
必要以上に複雑な符号化が回避され、知覚的に良好な速
度での符号化が可能となる。
じて知覚されるノイズのスペクトルの図である。
クチャの図である。
る。
ある。
に適応した復号器/受信機の構造を示す図である。
を示す図である。
ANプログラムのリストである。
ANプログラムのリストである。
ANプログラムのリストである。
RANプログラムのリストである。
RANプログラムのリストである。
RANプログラムのリストである。
RANプログラムのリストである。
RANプログラムのリストである。
RANプログラムのリストである。
Claims (10)
- 【請求項1】 信号を符号化する方法において、 前記信号をスペクトル・バンドに分割するステップと、 そのバンドごとに与えられるノイズ測度に関するエネル
ギーの高いほうからN個のバンドを選択するステップ
と、 選択されたエネルギー・バンドを符号化するステップか
らなることを特徴とする信号の符号化方法。 - 【請求項2】 バンドの前記与えられたノイズ測度が、
そのバンドのノイズの知覚に関係することを特徴とする
請求項1の方法。 - 【請求項3】 バンドの前記与えられたノイズ測度が、
そのバンドの最小可知ノイズのエネルギー・レベルに関
係することを特徴とする請求項1の方法。 - 【請求項4】 前記信号がアナログ信号であり、前記分
割ステップがアナログ信号を生じ、前記符号化がディジ
タル符号化であることを特徴とする請求項1の方法。 - 【請求項5】 前記ディジタル符号化が、ディジタル符
号のストリームを形成するために各アナログ・バンド信
号のディジタル符号を連結することを特徴とする請求項
4の方法。 - 【請求項6】 前記信号がアナログ信号であり、前記符
号化ステップが、ベースバンド信号を形成するために、
選択されたN個のバンドのダウンシフトをすることを含
むことを特徴とする請求項1の方法。 - 【請求項7】 前記分割ステップが、ほぼ等しいバンド
幅Wのアナログ・バンド信号を生じ、前記符号化ステッ
プが、バンド幅NWのベースバンド信号を形成するため
に、選択されたN個のバンドのダウンシフトをすること
を含むことを特徴とする請求項6の方法。 - 【請求項8】 前記符号化ステップが前記ベースバンド
信号を符号化することを特徴とする請求項6の方法。 - 【請求項9】 前記符号化ステップが前記ベースバンド
信号をディジタル形式に符号化することを特徴とする請
求項6の方法。 - 【請求項10】 アナログ信号を符号化する方法におい
て、 バンド信号を形成するために信号を異なる周波数バンド
の信号に分割するステップと、バンドごとに与えられたしきい値に対する選択されない
バンド信号の 信号エネルギー・レベル以上の、当該しき
い値に対する信号エネルギー・レベルによって特徴づけ
られる前記バンド信号を、選択されるバンド信号のバン
ド幅の総和が所定のバンド幅を超過しないような数をN
として、N個選択するステップと、 前記所定のバンド幅を有するベースバンド内のただ1つ
のバンドを占有するために、前記N個のバンド信号をダ
ウンシフトするステップからなることを特徴とする信号
の符号化方法。 【請求項11】 各バンド信号に対するしきい値が前記
バンド信号に対する与えられた最小可知ノイズエネルギ
ーしきい値であることを特徴とする請求項10の方法。 【請求項12】 前記選択ステップが、バンド信号の選
択を考慮する際に、バンド信号の信号エネルギー・レベ
ルからバンド信号の与えられた最小可知ノイズエネルギ
ーを減算することを特徴とする請求項11の方法。 【請求項13】 前記信号が像を表現するアナログ信号
であり、前記分割ステップが前記信号を2次元スペクト
ル・バンドに分割することを特徴とする請求項1の方
法。 【請求項14】 前記信号が3次元像を表現するアナロ
グ信号であり、前記分割ステップが前記信号を3次元ス
ペクトル・バンドに分割することを特徴とする請求項1
の方法。 【請求項15】 前記信号が、一連の像を表現しそれに
よって3次元表面を定義するアナログ信号であり、前記
分割ステップが前記信号を3次元スペクトル・バンドに
分割することを特徴とする請求項1の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/667,851 US5559900A (en) | 1991-03-12 | 1991-03-12 | Compression of signals for perceptual quality by selecting frequency bands having relatively high energy |
US667851 | 1991-03-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05122166A JPH05122166A (ja) | 1993-05-18 |
JPH0779312B2 true JPH0779312B2 (ja) | 1995-08-23 |
Family
ID=24679920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4085086A Expired - Lifetime JPH0779312B2 (ja) | 1991-03-12 | 1992-03-09 | 信号の符号化方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5559900A (ja) |
EP (1) | EP0508581B1 (ja) |
JP (1) | JPH0779312B2 (ja) |
KR (1) | KR100273071B1 (ja) |
CA (1) | CA2061366C (ja) |
DE (1) | DE69219943T2 (ja) |
TW (1) | TW240354B (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0708959B1 (en) * | 1993-07-07 | 1999-09-22 | Picturetel Corporation | A fixed bit rate speech encoder/decoder |
EP0692880B1 (en) * | 1993-11-04 | 2001-09-26 | Sony Corporation | Signal encoder, signal decoder, recording medium and signal encoding method |
KR100352351B1 (ko) * | 1994-02-05 | 2003-01-06 | 소니 가부시끼 가이샤 | 정보부호화방법및장치와정보복호화방법및장치 |
US5734677A (en) * | 1995-03-15 | 1998-03-31 | The Chinese University Of Hong Kong | Method for compression of loss-tolerant video image data from multiple sources |
EP0735772A3 (en) * | 1995-03-27 | 1998-04-01 | Hewlett-Packard Company | Method for selecting JPEG quantization tables for low bandwidth applications |
US6011864A (en) * | 1996-07-03 | 2000-01-04 | Apple Computer, Inc. | Digital image coding system having self-adjusting selection criteria for selecting a transform function |
JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
US6252994B1 (en) | 1998-01-26 | 2001-06-26 | Xerox Corporation | Adaptive quantization compatible with the JPEG baseline sequential mode |
US6175650B1 (en) | 1998-01-26 | 2001-01-16 | Xerox Corporation | Adaptive quantization compatible with the JPEG baseline sequential mode |
JPH11215006A (ja) * | 1998-01-29 | 1999-08-06 | Olympus Optical Co Ltd | ディジタル音声信号の送信装置及び受信装置 |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
AU2003294685A1 (en) * | 2002-12-13 | 2004-07-09 | Gigasphere Technology Group, Inc. | Method and apparatus for signal transcoding |
ATE391987T1 (de) * | 2003-02-07 | 2008-04-15 | Koninkl Philips Electronics Nv | Wasserzeichen von signalen |
KR100547113B1 (ko) * | 2003-02-15 | 2006-01-26 | 삼성전자주식회사 | 오디오 데이터 인코딩 장치 및 방법 |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7672531B2 (en) * | 2007-04-26 | 2010-03-02 | Geostudio Consultants Limited | System and method for determining edges of objects in an image |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8521540B2 (en) * | 2007-08-17 | 2013-08-27 | Qualcomm Incorporated | Encoding and/or decoding digital signals using a permutation value |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US8559511B2 (en) | 2010-03-30 | 2013-10-15 | Hong Kong Applied Science and Technology Research Institute Company Limited | Method and apparatus for video coding by ABT-based just noticeable difference model |
US8872504B2 (en) * | 2011-04-29 | 2014-10-28 | Tektronix, Inc. | Method for automatically setting frequency span in a spectrum analyzer |
EP2857860A4 (en) * | 2012-06-05 | 2015-06-17 | Panasonic Ip Man Co Ltd | SIGNAL PROCESSING DEVICE |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3875341A (en) * | 1972-02-24 | 1975-04-01 | Int Standard Electric Corp | System for transferring wideband sound signals |
US3894190A (en) * | 1973-02-28 | 1975-07-08 | Int Standard Electric Corp | System for transferring wide-band sound signals |
US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
US4817812A (en) * | 1984-04-25 | 1989-04-04 | Ensar Corporation | Holding frame for an oven pan |
GB8421498D0 (en) * | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
DE3506912A1 (de) * | 1985-02-27 | 1986-08-28 | Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover | Verfahren zur uebertragung eines audiosignals |
US4751742A (en) * | 1985-05-07 | 1988-06-14 | Avelex | Priority coding of transform coefficients |
US4797741A (en) * | 1985-08-28 | 1989-01-10 | Canon Kabushiki Kaisha | Information signal transmission system |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US4811112A (en) * | 1987-07-24 | 1989-03-07 | American Telephone And Telegraph Company, At&T Bell Laboratories | Vector DPCM image coding method and apparatus |
IL89672A (en) * | 1988-04-29 | 1994-04-12 | Motorola Inc | Spectral efficient method of transmitting information signal |
US5063608A (en) * | 1989-11-03 | 1991-11-05 | Datacube Inc. | Adaptive zonal coder |
US5113256A (en) * | 1991-02-08 | 1992-05-12 | Zenith Electronics Corporation | Method of perceptually modeling a video image signal |
-
1991
- 1991-03-12 US US07/667,851 patent/US5559900A/en not_active Expired - Lifetime
-
1992
- 1992-02-17 CA CA002061366A patent/CA2061366C/en not_active Expired - Lifetime
- 1992-02-20 TW TW081101251A patent/TW240354B/zh active
- 1992-03-02 EP EP92301778A patent/EP0508581B1/en not_active Expired - Lifetime
- 1992-03-02 DE DE69219943T patent/DE69219943T2/de not_active Expired - Lifetime
- 1992-03-09 JP JP4085086A patent/JPH0779312B2/ja not_active Expired - Lifetime
- 1992-03-09 KR KR1019920003858A patent/KR100273071B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR100273071B1 (ko) | 2000-12-01 |
US5559900A (en) | 1996-09-24 |
CA2061366C (en) | 1997-06-17 |
JPH05122166A (ja) | 1993-05-18 |
EP0508581A3 (en) | 1993-04-28 |
DE69219943D1 (de) | 1997-07-03 |
TW240354B (ja) | 1995-02-11 |
KR920019190A (ko) | 1992-10-22 |
DE69219943T2 (de) | 1998-01-02 |
EP0508581A2 (en) | 1992-10-14 |
CA2061366A1 (en) | 1992-09-13 |
EP0508581B1 (en) | 1997-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0779312B2 (ja) | 信号の符号化方法 | |
JP2915238B2 (ja) | 信号符号化方法および信号符号化装置 | |
US4672441A (en) | Method and apparatus for picture data reduction for digital video signals | |
US5845243A (en) | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of audio information | |
JP3017380B2 (ja) | データ圧縮方法及び装置並びにデータ伸長方法及び装置 | |
EP0473367B1 (en) | Digital signal encoders | |
US5317672A (en) | Variable bit rate speech encoder | |
JP2891253B1 (ja) | 画像圧縮処理装置 | |
JP4390208B2 (ja) | 音声を可変レートで符号化および復号する方法 | |
JPH0591061A (ja) | オーデイオ信号処理方法 | |
JP2841765B2 (ja) | 適応ビット割当て方法及び装置 | |
JPH01165283A (ja) | ディジタルビデオ信号符号化装置とそれに対応する復号装置 | |
JP2914549B2 (ja) | 画像符号化方法 | |
KR100617407B1 (ko) | 품질 우선 순위 이미지 저장 및 통신 | |
JP2000151413A (ja) | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 | |
CA1324654C (en) | Method and system for compressing color video data | |
Ho et al. | A pyramidal image coder with contour-based interpolative vector quantization | |
JP3092124B2 (ja) | 適応変換符号化の方法及び装置 | |
JP2872149B2 (ja) | 画像符号化装置 | |
EP0574523A1 (en) | Variable bit rate speech encoder | |
JPH09230894A (ja) | 音声圧縮伸張装置及び音声圧縮伸張方法 | |
JPH09503630A (ja) | 固定ビットレートのスピーチエンコーダ/デコーダ | |
JP3011447B2 (ja) | 帯域分割符号化装置 | |
JPH04199200A (ja) | 帯域分割符号化のビット割当方法 | |
JP3152114B2 (ja) | オーディオ信号の符号化装置及び復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080823 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080823 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090823 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090823 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100823 Year of fee payment: 15 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110823 Year of fee payment: 16 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120823 Year of fee payment: 17 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120823 Year of fee payment: 17 |