JPH0779312B2 - 信号の符号化方法 - Google Patents

信号の符号化方法

Info

Publication number
JPH0779312B2
JPH0779312B2 JP4085086A JP8508692A JPH0779312B2 JP H0779312 B2 JPH0779312 B2 JP H0779312B2 JP 4085086 A JP4085086 A JP 4085086A JP 8508692 A JP8508692 A JP 8508692A JP H0779312 B2 JPH0779312 B2 JP H0779312B2
Authority
JP
Japan
Prior art keywords
signal
band
encoding
bands
analog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4085086A
Other languages
English (en)
Other versions
JPH05122166A (ja
Inventor
サンペス ジェイアント ナッジホーリー
ジェームス サフラニク ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH05122166A publication Critical patent/JPH05122166A/ja
Publication of JPH0779312B2 publication Critical patent/JPH0779312B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/12Systems in which the television signal is transmitted via one channel or a plurality of parallel channels, the bandwidth of each channel being less than the bandwidth of the television signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Image Processing (AREA)
  • Analogue/Digital Conversion (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、信号処理に関し、特
に、効率的な伝送および記憶のための信号の符号化に関
する。
【0002】
【従来の技術】伝送のための信号の処理は、一般に、入
力信号のサンプリング、サンプルの量子化、および、量
子化されたサンプルを表現する符号のセットの生成から
なる。興味のあるほとんどの信号(例えば、音声または
映像信号)は高度に相関している。これは、信号が予測
可能な成分および予測不可能な成分からなると考えられ
ることを意味する。符号化圧縮は、本質的に、予測不可
能成分のみを符号化することによって達成される。さら
に、これらの信号はしばしば人間によって受容され知覚
されるため、受容された情報の人間による知覚に関する
概念が、このような信号の符号化と、その結果、伝送さ
れる信号の速度とを圧縮するために使用される。
【0003】音声および映像信号に関しては、本発明に
最も密接に関係する従来の符号化方法は、変換符号化お
よび線形予測符号化である。
【0004】変換符号化を利用する通信システムでは、
信号はセグメントに分割される。セグメントはサンプリ
ングされ、セグメントのサンプルは周波数領域変換係数
のセットに変換される。係数信号は量子化され、伝送チ
ャネルに送られる。ノイズ知覚特性を考慮したシステム
では、係数に適用される量子化モードは、信号特性およ
び生じる量子化ノイズに対する受容者の感度に依存して
形成され、それによって符号化効率が高められる。それ
らの考慮には、使用可能な制限されたバンド幅が重ね合
わされる。
【0005】ビット割当は、使用可能なバンド幅を取り
扱う方法の1つである。この方法では、ビットは、一定
のバンド幅を達成するようなやり方で変換係数の符号化
に割り当てられる。変換符号化の例は、とりわけ、米国
特許第4,949,383号、米国特許第4,184,
049号、などにある。
【0006】音声環境での線形予測符号化は1960年
代半ばに始まった。その後、予測符号化は、ノイズを知
覚する無制限でない能力を考慮に入れることによって改
善されることが認識されている。
【0007】ノイズの知覚を考慮した線形予測符号化
(LPC)では、信号セグメントは履歴情報から予測さ
れ、エラー信号が、予測された信号を実際の信号から減
算することによって導出される。エラー信号は一般に、
ノイズ知覚周波数感受性関数によって変換され重みづけ
られ、修正された変換結果を生じる。修正された変換結
果は符号化され受信機に伝送される。
【0008】映像信号の領域でも、状況は同様である。
例えば、サブバンド符号化が画像信号に適用されてい
る。この符号化方法では、画像を2次元の周波数バンド
に分割し、各バンドの信号がDPCMによって圧縮され
る。実際、2次元周波数バンドは、画像を形成する2つ
の次元における信号の変化性の尺度である。また、映像
のベクトル量子化が、例えば、米国特許第4,811,
112号(発明者:C.W.ラトレッジ(C. W. Rutledg
e)、1989年3月7日発行)に開示されている。
【0009】また、「人間視覚システム」(HVS)の
特性が実現されている。このシステムは、基本的に、ソ
ース情報に2次元コサイン変換を実行し、導出された係
数をHVS関数に従って重みづけする。重み付き係数は
量子化され、伝送媒体に送られる前にバッファに送られ
る。所望の大域的ビット速度を保証するため、量子化器
によって生成されるビット数を制御するようにバッファ
・フルネス指示が量子化器にフィードバックされる。
【0010】最近、米国同時出願の第07/35043
5号(発明者:J.D.ジョンストン(J. D. Johnsto
n)、R.J.サフラネク(R. J. Safranek)、出願日:1
989年5月4日)には、各ピクセルに対する量子化方
式が、生成される量子化ノイズ量が知覚可能限界付近で
その限界よりは低いように適応するような、サブバンド
解析方法が開示されている。量子化ノイズを知覚可能性
以下に保ちつつその増大を許容することにより、信号の
より高度な圧縮が達成される。
【0011】
【発明が解決しようとする課題】上記の符号化方法は、
サンプリングされ量子化された信号で作用する。さらに
圧縮された符号を実現するために、従来技術の方法は一
般に信号を周波数領域に変換し、その後その領域で作用
する。固定バンド幅を与えられると、従来技術の方法
は、全周波数成分でまたは事前指定された数の周波数成
分で可能な限り良好な仕事をするために、異なる周波数
成分の間で使用可能なビットを割り当てる。換言すれ
ば、周波数係数をいかにうまく符号化するかが決定され
るのであって、最初に符号化するかどうかが決定される
のではない。その結果、符号化方式は、必要以上に複雑
となり、全ビット速度が制限されている場合には知覚的
に最適ではない。
【0012】
【課題を解決するための手段】本発明の基本原理によれ
ば、ある周波数バンドを符号化するかどうかの単純な決
定を通じて良好なパフォーマンスが達成される。この決
定は、すべてのまたは所定数の周波数バンドをいかにう
まく符号化するかについてのものではない。アナログ信
号はベースバンド周波数スペクトルを有し、信号の周波
数スペクトルに対応して「最小可知差異」(jnd)ノ
イズ・スペクトルが存在するということを認識すれば、
jndスペクトル以下に落ちる信号周波数バンドは結局
知覚不可能なので、それらの周波数バンドを伝送する必
要はないということは明らかである。さらに、使用可能
なバンド幅が制限されている場合、最もjndスペクト
ルを超過する信号の周波数バンドのみを伝送することに
集中することには意味がある。
【0013】本発明の原理によれば、jndスペクトル
が、符号化される信号のいくつかの周波数バンドを選択
する決定回路に送られる。選択された各バンドは符号化
され、受信機に伝送される。
【0014】例えば、一実施例では、アナログ入力信号
が、変換回路を通じてバンドに分割される。この変換回
路は、実際は、帯域フィルタのバンクである。各バンド
内のjndレベルが評価され、バンド内の入力信号をバ
ンド内のjnd信号で除算したものに対応する商信号が
各バンドに対して生成される。選択回路が、最高の商を
有するn個のバンドを識別し、アナログ信号伝送が望ま
しい場合、逆変換によってn個のアナログ信号が生成さ
れ、隣接するスペクトルを有するベースバンドを形成す
るように変調される。ベースバンド信号は直接搬送波上
に変調される。ディジタル伝送のほうが望ましい場合、
選択回路の出力がフォーマットされ、伝送媒体に送られ
る。
【0015】
【実施例】バンド制限された時間変化する信号は、有限
周波数スペクトルによって表現可能である。情報を運ぶ
信号は一般に周波数の全スペクトルを含まないため、一
般的に、スペクトルはバンド内で非常にぎざぎざにな
る。信号のバンドを考える際には、ある型の平均化が起
こり、このような信号のスペクトルのぎざぎざは少なく
なるため、図1の曲線10(文字Sでも表される)に図
示されたような輪郭線を有する。曲線10は、例えば、
音声信号を表現する。ノイズ信号(音声信号の場合は雑
音のように聞こえ、映像信号の場合は霜降りのように見
えるもの)は一般にすべての可能な周波数成分を含み、
周波数とともに非常にゆっくりと変化する周波数スペク
トルを有する。平坦なスペクトル輪郭線は一般に「ホワ
イト・ノイズ」と呼ばれる。
【0016】研究者によれば、それより低いノイズ信号
がほとんどの人によって知覚不可能なしきい値が存在す
ることが確立されている。このしきい値は周波数ととも
に変化する。マスキング性のため、このしきい値は、ノ
イズ信号があるときに存在する情報信号のスペクトルに
よっても変化する。このマスキング現象は一般人にも周
知である。窓のない壁の像内のノイズ様産物は容易に検
出されるが、ジャングルの像内の同一の産物は検出され
ない。
【0017】検知可能ノイズの情報信号に対する正確な
関係は本発明の原理にとっては重要でないため、図1に
は例示的な関係のみ図示してある。図1の曲線20は、
jndとも書かれているが、図1の曲線10によって表
現された音声信号に対するノイズしきい値の変化を周波
数の関数として図示したもの(jndスペクトル)であ
る。図1のDは音声信号と知覚されるノイズしきい値の
エネルギー差を表す。実際には、図1のグラフの縦軸は
対数目盛りであり、図示された差信号Dは実際は商S/
jndの対数である。
【0018】上記のように、jndスペクトルは、従来
技術では、修正スペクトルの符号化の前に、単にSの周
波数係数の修正すなわち重みづけの手段として使用され
ている。ビット割当や量子化モード制御(信号を量子化
するために使用されるビット数の制御)を通じて、技術
者は、修正された周波数係数の符号化において可能な最
大の仕事をしようと試みてきた。
【0019】本発明の原理によれば、対照的に、jnd
スペクトルは、周波数バンドをいかに符号化するかでは
なく、それを符号化するかどうかの決定にかかわる。さ
らに、本発明の符号化は、一定の知覚品質の符号化プロ
セスを実現するのに適合する。
【0020】本発明の原理によれば、符号化される信号
のスペクトルがN個の周波数バンドに分割され、jnd
スペクトルが計算され、Nバンドのうちからn個を選択
する決定手段に送られる。Nおよびnは設計者の制御下
にあるパラメータである。結果の圧縮率はN/nであ
り、このことは、与えられたNに対し、小さいnの値は
高レベルの圧縮を実現することを意味する。もちろん、
高レベルの圧縮の結果、伝送媒体に接続された受信機で
は忠実度が低くなる。与えられた比n/Nに対し、Nの
値が大きくなると、保持されるエネルギーの比率が高く
なる(精細な、従って良好な選択は信号のスペクトルの
ピークからなされる)。他方、Nの値は、設計者が指定
しようとするハードウェアの量によって制限される。
【0021】本発明の原理はアナログ回路(または少な
くともアナログ回路および何らかのスイッチング、また
はサンプリング)で実現可能であるが、ディジタルによ
る実現が今日の設計において優勢であるという事実に鑑
み、以下の説明はディジタルの実現についてなされる。
【0022】図2では、入力信号はサンプルの列である
と仮定されている。この入力信号は、直並列レジスタ1
05を通して解析フィルタ・バンク100に送られる。
フィルタ・バンク100は、レジスタ105へのN個ご
とのサンプルの到着によって入力信号サンプルのセット
を受信し、それからN個の周波数係数を生成する。フィ
ルタ・バンク100は、例えばコサイン変換回路、また
は一般化直交ミラー・フィルタ(GQMF)のようない
くつかの方法で実現される。
【0023】フィルタ・バンク100の出力は知覚モデ
ル・ブロック110に送られる。ブロック110の機能
は、図1のjndバンド信号の生成である。それらの信
号が生成される方法は、厳密に、選択された知覚モデル
の機能であり、実際は、図2にはブロック110がフィ
ルタ・バンク100の出力に応答するように示されてい
るが、知覚モデルにはバンクへ100への入力とブロッ
ク110への入力の間の接続を必要とするものもあり、
さらに、またはその代わりに、バンク100の出力の、
ブロック110への接続を要するものもある。
【0024】ノイズに対する知覚感度の概念は何人かの
研究者によって研究されているが、その情報に基づい
て、「音声信号の知覚符号化」と題された米国同時出願
の第07/423,088号(1989年10月18日
出願)には、しきい値を生成する手段(すなわち、知覚
モデル110)を含む実際の符号器の設計が開示されて
いる。しかし、完全を期すために、前記出願によって示
されるように知覚符号器110の出力を生成するFOR
TRANプログラムが包含され、以下で要約される。
【0025】このFORTRANプログラムを理解する
ために有用な参考文献は、「FX/FORTRANプロ
グラマーズ・ハンドブック(FX/FORTRAN Programmer's H
andbook)」(アリアント・コンピュータ・システムズ社
(Alliant Computer SystemsCorp.)刊、1988年7
月)である。表1および表2は、使用される絶対しきい
値およびバンド定義のような、図7〜15のプログラム
例とともに使用される定数の表である。
【0026】プログラムは基本的に「strt」ルーチ
ンおよび「calcthri」ルーチンからなる。「s
trt」ルーチンは、さまざまなパラメータを計算する
ために最初に呼ばれる。その後、「calcthri」
ルーチンが、サンプリングされたデータの新しいすべて
のブロックとともに呼ばれ、このルーチンは「rati
o」とラベルされた出力セットを生成する。実際には、
この出力セットは、定義された異なる周波数バンドに対
する比S/jndを表し、図2に示された独立の除算器
の必要性を除去する。「ratio」を生成するリスト
の最終ステップは(予想されるように)除算であり、除
算には時間がかかることに注意すれば、よりよい実現は
図2に示されたハードウェア除算器を使用することであ
る。
【0027】上記のように、ここに包含されたFORT
RANプログラムは、ノイズの知覚に対する感度の測度
S/jndを計算する。(S−jnd)2/jnd,|
S−jnd|/jnd,または上記のものの対数のよう
な他の測度もまた使用可能である。
【0028】図2は、上記のように、比S/jndがハ
ードウェア除算器で実現された実施例である。すなわ
ち、図2では、商信号qiを生成するために、フィルタ
・バンク100の出力における係数i(ただしi=1,
2,...,N)の信号(すなわち、信号Si)が、回
路111−iで、ブロック110の係数iに対応するj
nd出力(すなわち、信号jndi)によって除算され
る。
【0029】回路111−iは、商信号を生成する同一
の読みだし専用参照テーブルである。8ビットのSi
よび8ビットのjndiでは、各参照テーブルは単なる
16メモリである。(時間さえ許せば、単一のメモリを
共有することも可能である。)各除算器回路の出力およ
び対応するSi信号は選択器回路120に送られる。各
信号の識別子iもまた回路120に送られる。こうし
て、回路120はN個の3つ組信号を受信し、この回路
の機能は、n個の最大商信号qiに対応するn個の信号
i(およびそれらの識別子)を選択することである。
識別子情報は一般に「サイド情報」と呼ばれる。以下で
明らかになるように、この情報は受信機に送られなけれ
ばならない。
【0030】ディジタル環境では、選択器120によっ
て選択された信号およびそれらの識別子はフォーマッタ
125でフォーマットされ(そしておそらくさらに符号
化され)遠隔受信機に伝送される。これは、図2で「デ
ィジタル」と記された線によって示されている。フォー
マット化はいくつかの方法が可能である。1つの方法
は、情報をパケットの形式で送ることである。すなわ
ち、各信号識別子はヘッダ・フィールドに置かれ、対応
する係数信号はその直後のデータ・フィールドに置かれ
る。
【0031】しかし、アナログ伝送媒体を使用するのが
望ましい状況もある。このような場合、選択器120に
よって選択された係数を、システムによって達成された
圧縮を反映するバンド幅をもつ狭バンド・アナログ信号
に変換するのが有用である。
【0032】これは図2の回路では逆変換回路130、
並直列レジスタのペア140および141、低域フィル
タ150、およびフォーマッタ126で実現される。た
いへん都合の良いことには、逆変換回路130は、N個
の入力のセットではなくn個の入力のセットのみに応答
すればよいことを除いては、バンク100の変換回路を
実現するのに使用される型のものである。
【0033】逆変換回路130は、時間サンプルに対応
するn個の信号を生成する。これらの時間サンプルはレ
ジスタ140を通して直列にシフトアウトされ、高周波
成分を切断するために低域フィルタ150でフィルタリ
ングされる。もちろん、レジスタ140のクロックはレ
ジスタ105のクロックよりN/n倍遅い。生成された
ベースバンド・アナログ信号はフォーマッタ126に送
られ、そこで伝送のために搬送波上に変調される。
【0034】同時に、伝送のために搬送波上に変調され
る第2のアナログ信号を生成するために、サイド情報が
レジスタ141を通ってフォーマッタ126にシフトア
ウトされる。レジスタ141では、サイド情報は、例え
ばパルス振幅変調によって符号化される。アナログ伝送
は図2では「アナログ」と記された線によって示されて
いる。もちろん、2つのモード(アナログまたはディジ
タル伝送)のうちの一方を使用することも予想される。
図2では、単に例示のため、両方が図示されている。
【0035】図3は選択器回路120の一実施例の図で
ある。これは、バッチャ・ネットワークに基づく。例え
ば、米国特許第3,428,946号(1969年2月
18日発行)参照。この特許で、バッチャは、4個の入
力および8個の入力の任意に配列されたセットをソート
する方法を明らかに示している。バッチャはまた、2つ
の双単調シーケンスを1つの整列シーケンスにマージす
る方法をも示した。
【0036】これらの方法を直接適用して、図3は4個
の4入力ソート・ネットワーク127および2個の双単
調マージ・ネットワーク128からなる。これらは、初
めの8個の入力がソート・キーに関して降順であり後の
8個の入力がソート・キーに関して昇順であるような長
さ16の双単調シーケンスを形成するように配置され
る。これらのネットワークは、以下に説明するように、
スイッチ125を使用して、バッチャの方法によって構
成される。
【0037】ネットワーク128によって生成される双
単調シーケンスは、修正双単調マージ・ネットワーク1
29に送られる。log2M(Mはネットワークの入力
の数)個の段階からなる双単調マージ・ネットワーク1
28とは異なり、マージ・ネットワーク129内の段階
の数はlog2(M/n)である。図3では、nは4で
あり、M=N=16であり、この段階の数はlog
2(16/4)すなわち2である。また、多くの出力は
利用されないため、マージ・ネットワーク129内の各
スイッチ125は、ネットワーク127および128内
のスイッチ125の標準的な設計と比較して単純化する
ことが可能である。
【0038】スイッチ125の構造が図4に示されてい
る。各スイッチング・ブロック125は、2個の入力係
数信号SmおよびSn、対応する2個の商信号qmおよび
nならびに信号識別子の値mおよびnを受信する。各
スイッチング・ブロック125の機能は、どちらの商信
号が大きいかを確認し、その商信号、それに対応する係
数信号、および識別子の値を、3個のスイッチ要素のそ
れぞれの2個の出力のうちの選択された1つへ転送する
ことである。
【0039】これは、商信号に応答する減算器121お
よび減算器121の出力に応答する3個の「2極2投」
スイッチ要素122、123および124によって実現
される。スイッチ122は商信号を転送し、スイッチ1
23は係数信号を転送し、スイッチ124は識別子の値
を転送する。選択器120の最終段階では、さらに決定
がなされる必要がないため、商信号は転送される必要は
ない。また、ネットワーク129内でlog2N/n個
の段階が使用される場合、ネットワークのn個の出力は
順序づけられない。それらは、最大商信号をもつ信号に
対応するものであることが保証されるだけである。
【0040】言うまでもなく、回路120の選択プロセ
スのタイミングは制御されなければならない。例えば、
回路120が、異なる選択をあまりに頻繁に実行するの
は有用でない。各選択は、受信機に送られなければなら
ないサイド情報の新たなセットを形成し、そのオーバヘ
ッドは最小に保持されるべきである。従って、選択回路
120は、ネットワーク129の出力のところに、各選
択を捕捉し格納するために使用されるレジスタ126を
含む。
【0041】問題は、レジスタ126のクロックにどの
ような方式を適用するかである。最も簡単な方法は、固
定クロックを使用することである。これは、サイド情報
に固定バンド幅を与える。クロックは、入力信号のサン
プリング・クロックのN倍でもよいし、またはおそら
く、入力信号のサンプリング・クロックのKN倍(Kは
整数)でもよい。
【0042】第3の方法は、小さいKの値(K=1も可
能)を使用し、クロックの各出現時に、選択の変更から
十分な利益が生じるかどうかについて決定することであ
る。これは、選択されない商信号に対する選択された商
信号の比を測定する従来の回路(図3には図示せず)に
よって可能である。選択器120の出力における選択の
比を、選択器120の入力における選択の比と比較する
ことによって、選択における変化を許すかどうかが、こ
れらの比の観測された差に基づいて決定される。
【0043】図5は、図2の送信機のディジタル伝送方
法に従った受信機である。これは必ずしも周波数によっ
てソートされていないn個のパケットのセットを受信す
るため、入力信号は並列変換器200に直列に加えら
れ、並列変換器200は、各パケットを直列形式に保持
しながら、n個のパケットを並列にソータ210に送
る。ソータ210は、周波数係数を識別するヘッダ・フ
ィールドに基づいて入力信号をソートする。
【0044】ソートされた出力はエクスパンダ・ネット
ワーク220に送られる。エクスパンダ・ネットワーク
210は、信号を、エクスパンダ・ネットワークの適当
な出力へ転送する。ソータ210は、ソートが商信号q
iによってではなく識別子iをキーとして行われる点を
除いては、上記のバッチャ・ネットワークでもよい。エ
クスパンダ・ネットワーク220は、例えば、米国特許
第4,516,238号(発明者:A.ファン(A. Huan
g)、S.C.クナウア(S. C. Knauer)、1985年5月
7日発行)に開示されたシャフル交換ネットワークでも
よい。
【0045】ちなみに、選択器回路120によって実行
される選択プロセスは、周波数バンドの選択および選択
された周波数バンドのベースバンドへのダウンシフトと
同等である。ソータ210の作用は、選択されたバンド
のソートであり、エクスパンダ220の作用は、ソート
された周波数バンドの適当な位置へのアップシフトと同
等である。
【0046】エクスパンダ220の出力信号は、逆変換
回路230に送られる。回路230は、n個の入力では
なくN個の入力(そのうちの0でないのはn個のみであ
るが)に応答する点を除いては回路130と同様であ
る。逆変換回路230のN個の出力は並直列レジスタ2
40を通して直列にシフトアウトされ、低域フィルタ2
50によってフィルタリングされて、最終再構成信号を
生成する。
【0047】簡単のために、上の説明は音声のような
「1次元」信号に集中している。しかし、本発明の原理
は、高次元の信号にも同様に適用される。例えば、映像
信号(2次元と考えられる)では、変更が必要なのは、
フィルタ・バンク100、逆変換回路130および23
0、ならびに知覚モデル回路110のみである。映像信
号の2次元的側面に関する変更は前記の第07/350
435号出願に説明されている。知覚モデルおよび2次
元変換のプロセスが説明されている。
【0048】再び、完全を期すために、以下で映像環境
における知覚モデル100の一実施例を要約的に説明す
る。図6で、N個の入力がフィルタ・バンク100から
受信される。それらの入力のうちの1つは、フレームの
2次元「dc値」が発見されるバンドを表現する。dc
値バンド以外の全バンドは参照テーブル301に送られ
る。各参照テーブルはバンド内のパワーの重みつき測度
を生成する。すなわち、各参照テーブルはkii 2の値
を生成する。ただし、kiは異なるiの値に対して異な
っていてよい。
【0049】計算された重みつきパワー測度は、その周
波数バンドでの像の視覚的「テクスチュア」の評価を表
す。加算器302は、全テクスチュア評価値を生成する
ためにN−1個のテーブル301の「テクスチュア」出
力を加算する。この評価値は、加算器302のパワー領
域出力を振幅領域マスキングしきい値に変換する参照テ
ーブル303に送られる。テーブル303内の写像関数
は対数型関数であり、テーブル303の出力におけるダ
イナミック・レンジを縮小する。
【0050】明度補正が参照テーブル304で導入され
る。参照テーブル304は、テーブル303からの入力
に「dc値」バンドを乗算する。最後に、参照テーブル
305は、テーブル304によって生成されたマスキン
グしきい値に、定数のあるセットを乗算する。ここで、
各定数は各周波数バンドにおける人間視覚系のノイズ感
度に関連する。こうして生成されたN個の出力は、知覚
モデル100によって図2の除算器111に送られる出
力のセットを形成する。
【0051】映像信号フレームの時間的継起や3次元地
形図のような3次元の場合への拡張もまた、その拡張が
1次元から2次元へなされた場合の周知の原理に従って
直接行われる。
【0052】
【発明の効果】以上述べたごとく、本発明によれば、あ
る周波数バンドを符号化するかどうかの単純な決定を通
じて良好なパフォーマンスが達成される。また、従来の
必要以上に複雑な符号化が回避され、知覚的に良好な速
度での符号化が可能となる。
【図面の簡単な説明】
【図1】信号のスペクトルおよび信号の存在下でかろう
じて知覚されるノイズのスペクトルの図である。
【図2】本発明の原理による符号器/送信機のアーキテ
クチャの図である。
【図3】図2の選択器120の構造を詳細に示す図であ
る。
【図4】選択器120で使用されるスイッチの概略図で
ある。
【図5】図2の符号器/送信機によって生成された信号
に適応した復号器/受信機の構造を示す図である。
【図6】映像信号環境でjnd信号を生成する一実施例
を示す図である。
【図7】知覚符号器110の出力を生成するFORTR
ANプログラムのリストである。
【図8】知覚符号器110の出力を生成するFORTR
ANプログラムのリストである。
【図9】知覚符号器110の出力を生成するFORTR
ANプログラムのリストである。
【図10】知覚符号器110の出力を生成するFORT
RANプログラムのリストである。
【図11】知覚符号器110の出力を生成するFORT
RANプログラムのリストである。
【図12】知覚符号器110の出力を生成するFORT
RANプログラムのリストである。
【図13】知覚符号器110の出力を生成するFORT
RANプログラムのリストである。
【図14】知覚符号器110の出力を生成するFORT
RANプログラムのリストである。
【図15】知覚符号器110の出力を生成するFORT
RANプログラムのリストである。
【符号の説明】
100 解析フィルタ・バンク 105 直並列レジスタ 110 知覚モデル・ブロック 111 除算器 120 選択器 121 減算器 122 スイッチ 123 スイッチ 124 スイッチ 125 フォーマッタ 126 フォーマッタ 127 4入力ソート・ネットワーク 128 双単調マージ・ネットワーク 129 修正双単調マージ・ネットワーク 130 逆変換回路 140 並直列レジスタ 141 並直列レジスタ 150 低域フィルタ 200 並列変換器 210 ソータ 220 エクスパンダ・ネットワーク 230 逆変換回路 240 並直列レジスタ 250 低域フィルタ 301 参照テーブル 302 加算器 303 参照テーブル
【表1】
【表2】
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04N 7/24 (72)発明者 ロバート ジェームス サフラニク アメリカ合衆国 07974 ニュージャージ ー ニュー プロヴィデンス、フェアマウ ント ロード 20 (56)参考文献 特表 平3−500118(JP,A)

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 信号を符号化する方法において、 前記信号をスペクトル・バンドに分割するステップと、 そのバンドごとに与えられるノイズ測度に関するエネル
    ギーの高いほうからN個のバンドを選択するステップ
    と、 選択されたエネルギー・バンドを符号化するステップか
    らなることを特徴とする信号の符号化方法。
  2. 【請求項2】 バンドの前記与えられたノイズ測度が、
    そのバンドのノイズの知覚に関係することを特徴とする
    請求項1の方法。
  3. 【請求項3】 バンドの前記与えられたノイズ測度が、
    そのバンドの最小可知ノイズのエネルギー・レベルに関
    係することを特徴とする請求項1の方法。
  4. 【請求項4】 前記信号がアナログ信号であり、前記分
    割ステップがアナログ信号を生じ、前記符号化がディジ
    タル符号化であることを特徴とする請求項1の方法。
  5. 【請求項5】 前記ディジタル符号化が、ディジタル符
    号のストリームを形成するために各アナログ・バンド信
    号のディジタル符号を連結することを特徴とする請求項
    4の方法。
  6. 【請求項6】 前記信号がアナログ信号であり、前記符
    号化ステップが、ベースバンド信号を形成するために、
    選択されたN個のバンドのダウンシフトをすることを含
    むことを特徴とする請求項1の方法。
  7. 【請求項7】 前記分割ステップが、ほぼ等しいバンド
    幅Wのアナログ・バンド信号を生じ、前記符号化ステッ
    プが、バンド幅NWのベースバンド信号を形成するため
    に、選択されたN個のバンドのダウンシフトをすること
    を含むことを特徴とする請求項6の方法。
  8. 【請求項8】 前記符号化ステップが前記ベースバンド
    信号を符号化することを特徴とする請求項6の方法。
  9. 【請求項9】 前記符号化ステップが前記ベースバンド
    信号をディジタル形式に符号化することを特徴とする請
    求項6の方法。
  10. 【請求項10】 アナログ信号を符号化する方法におい
    て、 バンド信号を形成するために信号を異なる周波数バンド
    の信号に分割するステップと、バンドごとに与えられたしきい値に対する選択されない
    バンド信号の 信号エネルギー・レベル以上の、当該しき
    い値に対する信号エネルギー・レベルによって特徴づけ
    られる前記バンド信号を、選択されるバンド信号のバン
    ド幅の総和が所定のバンド幅を超過しないような数をN
    として、N個選択するステップと、 前記所定のバンド幅を有するベースバンド内のただ1つ
    のバンドを占有するために、前記N個のバンド信号をダ
    ウンシフトするステップからなることを特徴とする信号
    の符号化方法。 【請求項11】 各バンド信号に対するしきい値が前記
    バンド信号に対する与えられた最小可知ノイズエネルギ
    ーしきい値であることを特徴とする請求項10の方法。 【請求項12】 前記選択ステップが、バンド信号の選
    択を考慮する際に、バンド信号の信号エネルギー・レベ
    ルからバンド信号の与えられた最小可知ノイズエネルギ
    ーを減算することを特徴とする請求項11の方法。 【請求項13】 前記信号が像を表現するアナログ信号
    であり、前記分割ステップが前記信号を2次元スペクト
    ル・バンドに分割することを特徴とする請求項1の方
    法。 【請求項14】 前記信号が3次元像を表現するアナロ
    グ信号であり、前記分割ステップが前記信号を3次元ス
    ペクトル・バンドに分割することを特徴とする請求項1
    の方法。 【請求項15】 前記信号が、一連の像を表現しそれに
    よって3次元表面を定義するアナログ信号であり、前記
    分割ステップが前記信号を3次元スペクトル・バンドに
    分割することを特徴とする請求項1の方法。
JP4085086A 1991-03-12 1992-03-09 信号の符号化方法 Expired - Lifetime JPH0779312B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/667,851 US5559900A (en) 1991-03-12 1991-03-12 Compression of signals for perceptual quality by selecting frequency bands having relatively high energy
US667851 1991-03-12

Publications (2)

Publication Number Publication Date
JPH05122166A JPH05122166A (ja) 1993-05-18
JPH0779312B2 true JPH0779312B2 (ja) 1995-08-23

Family

ID=24679920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4085086A Expired - Lifetime JPH0779312B2 (ja) 1991-03-12 1992-03-09 信号の符号化方法

Country Status (7)

Country Link
US (1) US5559900A (ja)
EP (1) EP0508581B1 (ja)
JP (1) JPH0779312B2 (ja)
KR (1) KR100273071B1 (ja)
CA (1) CA2061366C (ja)
DE (1) DE69219943T2 (ja)
TW (1) TW240354B (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0708959B1 (en) * 1993-07-07 1999-09-22 Picturetel Corporation A fixed bit rate speech encoder/decoder
EP0692880B1 (en) * 1993-11-04 2001-09-26 Sony Corporation Signal encoder, signal decoder, recording medium and signal encoding method
KR100352351B1 (ko) * 1994-02-05 2003-01-06 소니 가부시끼 가이샤 정보부호화방법및장치와정보복호화방법및장치
US5734677A (en) * 1995-03-15 1998-03-31 The Chinese University Of Hong Kong Method for compression of loss-tolerant video image data from multiple sources
EP0735772A3 (en) * 1995-03-27 1998-04-01 Hewlett-Packard Company Method for selecting JPEG quantization tables for low bandwidth applications
US6011864A (en) * 1996-07-03 2000-01-04 Apple Computer, Inc. Digital image coding system having self-adjusting selection criteria for selecting a transform function
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
US6252994B1 (en) 1998-01-26 2001-06-26 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
US6175650B1 (en) 1998-01-26 2001-01-16 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
JPH11215006A (ja) * 1998-01-29 1999-08-06 Olympus Optical Co Ltd ディジタル音声信号の送信装置及び受信装置
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
AU2003294685A1 (en) * 2002-12-13 2004-07-09 Gigasphere Technology Group, Inc. Method and apparatus for signal transcoding
ATE391987T1 (de) * 2003-02-07 2008-04-15 Koninkl Philips Electronics Nv Wasserzeichen von signalen
KR100547113B1 (ko) * 2003-02-15 2006-01-26 삼성전자주식회사 오디오 데이터 인코딩 장치 및 방법
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7672531B2 (en) * 2007-04-26 2010-03-02 Geostudio Consultants Limited System and method for determining edges of objects in an image
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8559511B2 (en) 2010-03-30 2013-10-15 Hong Kong Applied Science and Technology Research Institute Company Limited Method and apparatus for video coding by ABT-based just noticeable difference model
US8872504B2 (en) * 2011-04-29 2014-10-28 Tektronix, Inc. Method for automatically setting frequency span in a spectrum analyzer
EP2857860A4 (en) * 2012-06-05 2015-06-17 Panasonic Ip Man Co Ltd SIGNAL PROCESSING DEVICE

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3875341A (en) * 1972-02-24 1975-04-01 Int Standard Electric Corp System for transferring wideband sound signals
US3894190A (en) * 1973-02-28 1975-07-08 Int Standard Electric Corp System for transferring wide-band sound signals
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
US4817812A (en) * 1984-04-25 1989-04-04 Ensar Corporation Holding frame for an oven pan
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
DE3506912A1 (de) * 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
US4751742A (en) * 1985-05-07 1988-06-14 Avelex Priority coding of transform coefficients
US4797741A (en) * 1985-08-28 1989-01-10 Canon Kabushiki Kaisha Information signal transmission system
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4811112A (en) * 1987-07-24 1989-03-07 American Telephone And Telegraph Company, At&T Bell Laboratories Vector DPCM image coding method and apparatus
IL89672A (en) * 1988-04-29 1994-04-12 Motorola Inc Spectral efficient method of transmitting information signal
US5063608A (en) * 1989-11-03 1991-11-05 Datacube Inc. Adaptive zonal coder
US5113256A (en) * 1991-02-08 1992-05-12 Zenith Electronics Corporation Method of perceptually modeling a video image signal

Also Published As

Publication number Publication date
KR100273071B1 (ko) 2000-12-01
US5559900A (en) 1996-09-24
CA2061366C (en) 1997-06-17
JPH05122166A (ja) 1993-05-18
EP0508581A3 (en) 1993-04-28
DE69219943D1 (de) 1997-07-03
TW240354B (ja) 1995-02-11
KR920019190A (ko) 1992-10-22
DE69219943T2 (de) 1998-01-02
EP0508581A2 (en) 1992-10-14
CA2061366A1 (en) 1992-09-13
EP0508581B1 (en) 1997-05-28

Similar Documents

Publication Publication Date Title
JPH0779312B2 (ja) 信号の符号化方法
JP2915238B2 (ja) 信号符号化方法および信号符号化装置
US4672441A (en) Method and apparatus for picture data reduction for digital video signals
US5845243A (en) Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of audio information
JP3017380B2 (ja) データ圧縮方法及び装置並びにデータ伸長方法及び装置
EP0473367B1 (en) Digital signal encoders
US5317672A (en) Variable bit rate speech encoder
JP2891253B1 (ja) 画像圧縮処理装置
JP4390208B2 (ja) 音声を可変レートで符号化および復号する方法
JPH0591061A (ja) オーデイオ信号処理方法
JP2841765B2 (ja) 適応ビット割当て方法及び装置
JPH01165283A (ja) ディジタルビデオ信号符号化装置とそれに対応する復号装置
JP2914549B2 (ja) 画像符号化方法
KR100617407B1 (ko) 품질 우선 순위 이미지 저장 및 통신
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
CA1324654C (en) Method and system for compressing color video data
Ho et al. A pyramidal image coder with contour-based interpolative vector quantization
JP3092124B2 (ja) 適応変換符号化の方法及び装置
JP2872149B2 (ja) 画像符号化装置
EP0574523A1 (en) Variable bit rate speech encoder
JPH09230894A (ja) 音声圧縮伸張装置及び音声圧縮伸張方法
JPH09503630A (ja) 固定ビットレートのスピーチエンコーダ/デコーダ
JP3011447B2 (ja) 帯域分割符号化装置
JPH04199200A (ja) 帯域分割符号化のビット割当方法
JP3152114B2 (ja) オーディオ信号の符号化装置及び復号化装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080823

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080823

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090823

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090823

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100823

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110823

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120823

Year of fee payment: 17

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120823

Year of fee payment: 17