JP4033898B2

JP4033898B2 - 知覚符号化システムのサブバンドに波形予測を適用する装置及び方法

Info

Publication number: JP4033898B2
Application number: JP52000596A
Authority: JP
Inventors: デイビス、マーク・フランクリン
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 1994-12-20
Filing date: 1995-12-20
Publication date: 2008-01-16
Anticipated expiration: 2015-12-20
Also published as: DK0799531T3; AU4687496A; CA2206129C; DE69515907D1; EP0799531B1; JPH10511243A; EP0799531A1; AU704693B2; CA2206129A1; ATE191107T1; DE69515907T2; US5699484A; ES2143673T3; WO1996019876A1

Description

技術分野
概して本発明は、音声信号のような信号の低ビットレート符号化及び復号に関する。特に、本発明は、高品質分割帯域知覚符号化システムに予測を適用することによって情報容量要件を下げることに関する。
背景
音声信号処理分野において信号品質上知覚できる損失なしに信号を表すために要する情報量を最小化することには多大な関心がある。情報要件を下げるによって、通信チャンネル及び記憶媒体に与える信号の情報容量要件が低下する。
圧縮又はダイナミックレンジ低減がなされてきたアナログ信号は、例えば、無圧縮信号のようなものより低い情報容量要件を与える。より少ない２進ビットで符号化されたデジタル信号は、信号を表すためにより多くのビット数を用いて符号化された信号より低い情報容量要件を与える。もちろん、知覚される信号品質を劣化させることなく実現できる低減量には限度がある。以下の論議は特にデジタル技術に向けられているが、対応する考察はアナログ技術にも適用できることを理解されたい。
情報容量要件は、いわゆる２つのデータ圧縮技術のいずれかを用いることによって下げることができる。時々「損失のある」圧縮技術と呼ばれる一種の技術では、源信号の完全回復に関して、それが保証されず概してそれが妨げられような方法で情報容量要件が下げられる。量子化は良く知られた損失のある圧縮技術の１つである。
量子化では、デジタル信号の各サンプルを表すのに用いられるビット数を減らすことで情報容量要件を下げることが可能で、それによってデジタル信号表現の精度は低下する。音声符号化の用途では、低下した精度又は量子化誤差が量子化雑音として現れる。もし誤差がかなりの大きさなら、量子化雑音は符号化された信号の本質的品質を劣化させるであろう。
各種の音声符号化技術では、知覚できないか若しくは知覚される符号化品質に無関係な情報成分を除くことによって、知覚可能な劣化を受けることなく入力信号に損失のある技術を適用することを試みている。相補的な復号技術で入力信号のレプリカ、すなわち、複製を回復することができる。除去される成分が真に無関係であるなら、同レプリカは知覚的に入力信号と区別できない。この様な符号化技術の例としては、心理知覚原則に基づく適応ビット配分を備えた分割帯域濾波がある。
例えば、音声用途において人の聴覚系は、高度に非対称な同調されたフィルタの周波数分析特性と類似の特性を示す。同フィルタは、可変中心周波数と中心周波数の関数として変わる帯域幅とを有する。異なった音を感知する人の聴覚系の能力は、音の間の周波数差が増大するにつれて増大する。しかし、人の聴覚系能力は、上記フィルタの帯域幅未満の周波数差についてほぼ一定に止まる。従って、人の聴覚系の周波数分解能は、全音声スペクトルに亘りこれらのフィルタの帯域幅に応じて変わる。この様な聴覚フィルタの有効帯域幅は「臨界帯域」と呼ばれる。臨界帯域内の優勢信号は、当該臨界帯域外の他の信号を隠蔽するよりも、当該臨界帯域内の他の信号の可聴性を隠蔽する可能性が高い。優勢信号は隠蔽信号と同時に発生する他の信号を隠蔽するのみならず、隠蔽信号の前後に発生する信号も隠蔽することができる。前隠蔽効果及び後隠蔽効果の持続時間は、隠蔽信号の大きさに依存するが、通常前隠蔽効果は後隠蔽効果より遥かに短い持続時間を有する。概要は「Audio Engineering Handbook」（K.Blair Benson ed.,McGraw-Hill,San Francisco,1988,pages 1.40-1.42&4.8-4.10）を参照のこと。
音声信号スペクトル成分の可聴性を確立するための簡単な心理音響モデルは存在しない。臨界帯域の帯域幅及び一時的隠蔽間隔は、隠蔽信号の周波数及び振幅と共に大幅に変化する。これは個々の聴取者間で変わりかつ論議の主題となっている。それにも拘らず、一定の数値が心理音響コーダデザインで一般的に用いられて有用な工学技術的近似値となっている。臨界帯域は概して幾分一定で、約５００Ｈｚ以下の周波数においては１００Ｈｚ未満と考えられている。臨界帯域は約５００Ｈｚ以上の周波数では中心周波数の分数として変化する。すなわち、５００Ｈｚにおいて約３分の１オクターブで始まり、１ｋＨｚ乃至４ｋＨｚの周波数に対して約５分の１オクターブに下がり、約１０ＫＨｚ以上の周波数に対しては約３分の１オクターブに増加する。前隠蔽間隔は１００ｍｓｅｃを越えて伸び得るが、概して５ｍｓｅｃ未満に制限されると考えられる。後隠蔽間隔は５００ｍｓｅｃを越えて伸びることができるが、概して約５０ｍｓｅｃに制限されると考えられる。
有用な帯域幅を周波数サブバンドに分割し、サブバンドが人の聴覚系の臨界帯域を近似する帯域幅を有するようにする音声分割帯域符号化技術は、広帯域技術より心理音響効果をより良く利用することができる。この様な分割帯域符号化技術は、概念として、入力信号をフィルタバンクを通して流し、劣化が丁度聴取不能になる程度まで各フィルタバンドを通る信号の情報容量要件を低下させ、逆処理で入力信号のレプリカを再構成することから成る。この様な２つの技術としてはサブバンド符号化及び変換符号化がある。音声サブバンドコーダ及び変換コーダは特定の周波数サブバンドにおいて情報要件を下げることが可能で、同サブバンドでは結果的に生じる人為的なものは１以上のスペクトル成分によって心理音響的に隠蔽され、従って符号化される信号の本質的品質が劣化することはない。
サブバンドコーダでは、アナログ又はデジタルフィルタを有するフィルタバンクを利用するあらゆる異なった技術を用いることができる。デジタルサブバンドコーダでは、信号サンプルを含む入力信号がデジタルフィルタバンクを通して送られる。フィルタバンクのそれぞれのフィルタによって送られる各サブバンド信号は、当該サブバンドのフィルタの帯域幅に従って下降サンプリングされる。コーダでは、量子化雑音を知覚不能にするために丁度十分なビットを用いて各サブバンド信号のサンプルを量子化することを試みる。各サブバンド信号は、入力信号スペクトルの一部を表すサンプルを含む。
変換コーダは、デジタルフィルタのバンクを利用するためにあらゆる種類の、いわゆる時間領域対周波数領域変換を用いることができる。変換から得られる個々の係数は「サブバンド」と見なされるか若しくは２以上の近接変換係数が共にグループ化されて個々の変換係数帯域幅の合計である有効帯域幅を有する「サブバンド」を定めるようにすることができる。一サブバンドの変換係数は、当該各サブバンド信号のサンプルを構成する。コーダでは、量子化雑音を知覚不能にするための丁度十分なビットを用いて各サブバンドの変換係数の量子化を試みる。
ブロック変換は時間領域情報のブロック又は間隔で作動し、それを周波数領域スペクトル情報を表す変換係数のブロックに変換する。時間領域ブロックの長さは、変換フィルタバンクの一時分解能及びスペクトル分解能の双方に影響を与える。ブロック長の増加でスペクトル分解能は高くなるが、計算要件も増大しかつフィルタバンクを通した処理の遅れも増大する。より高いスペクトル分解能は、より正確な知覚モデルの仕様を許容することによって心理知覚効果の利用を容易にする。不幸にして、ブロック長の増加は、同様にフィルタバンクの一時的分解能をも低下させる。過渡現象のようなブロック内の急激な現象に起因する量子化雑音の影響は、ブロックを横切って広がり、もしブロックが長すぎるなら、誤差は人の聴覚系の一時的隠蔽感覚を越えて伸びるであろう。さらに、荒い一時的分解能は、ちょうどよい正確な時間に符号化された信号成分の抽出を要する編集システムのようなある用途において極めて不利である。
以下の論議を通して、「分割帯域コーダ」の用語は、サブバンドコーダ、変換コーダ及び有用な信号帯域幅の部分に作用する他の符号化技術を指すものとする。「サブバンド」の用語は、真のサブバンドフィルタバンク、変換フィルタバンク又は他の濾波技術によって実施されようとされまいと、有用な信号帯域幅のこれらの部分を指すものとする。この論議を通して用いられる「サブバンド信号サンプル」及びその他の用語は、論議の前後関係ではっきり区別されない限り、通過帯域から得られるサンプル及び変換から得られる係数の双方を指すものとする。
時々「損失のない」圧縮技術と呼ばれる第２の種類の圧縮技術では、源信号を脱相関させることによって劣化なしに情報容量要件を低下させ、それによって冗長信号成分を低下もしくは排除している。相補的な圧縮解除技術では、圧縮中に除かれる冗長成分を与えることによって源信号を完全に回復できる。損失のない圧縮技術の例には、ランレングス符号化、線形予測コーデング（ＬＰＣ）及び変換コーデングが含まれる。
原則として、ＬＰＣを用いるエンコーダは、源信号のある面を予測し、予測と源信号間の差から「予測誤差」を設定し、予測誤差を対のデコーダに送る。デコーダは、対応する予測を行い、源信号を完全に回復させるためにエンコーダから受取る予測誤差に応じて予測を調節する。
広範な種類のＬＰＣ技術が良く知られている。例えば、Widrow and Stearsの「適応信号処理」（Prentice-Hall,1985,pp.99-116）及びHonig and Messershmittの「適応フィルタの構成、アルゴリズム、用例」（Klunes Academic Publishers,1984,pp.49-62,図3-5）参照。これらはすべて参照により本明細書に組み入れる。
線形予測は基本的に濾波と同一である。従って、予測精度のようなフィルタ特性に加えて、周波数応答及び安定性のようなフィルタ特性はＬＰＣにとって適切な要件である。デジタル実施態様において、再帰的、非再帰的フィルタはＬＰＣを実施するために用いることができる。より高級な予測フィルタは、複雑な信号をより正確に予測することができるが、より長い応答時間を有する。さらに、より高級なフィルタは、より大きな計算要件を課す。
本論議を通して、「予測精度」、「予測誤差」等の用語は、予測とそれぞれの源信号との間の差に関する。予測誤差の大きさは、補間公式、すなわち、予測器の精度に逆比例する。「応答時間」等の用語は、過渡現象のような高度な非定常的現象に続くほぼ定常値に対して予測器が予測誤差を最小にするために必要とする時間の長さに関する。
変換では、情報を一組の主成分に脱相関させることによって損失のない情報圧縮を与えることができる。例えば、音声信号は、一組の長波関係信号として表し得る。不幸にして、ブロック変換では各ブロックの範囲内の情報を脱相関させるが、ブロック間では脱相関は行われない。音声符号化用例では、ブロック間の相関は非常に強することができる。
変換、ＬＰＣ及び量子化を用いるハイブリット符号化システムが開発されている。冗長情報は、情報ブロックを脱相関させるブロック変換及びブロック間の相関を低減させる線形予測器によって低減される。また無関係な情報は、心理知覚原則により量子化することによって低減される。例えば、Lazzari他の「デジタル移動ラジオ用２スピーチコーダ」（CSELT Technical Reports vol.16,10-1988,pp.563-5729）（以下Lazzariと呼ぶ）、Mahieux他の「IEEE ICASSP議事録」（1989,pp.2021-2024）（以下Mahieuxと呼ぶ）及びLin他の「移動レシーバ用サブバンド・マルチパルスデジタル音声放送」（IEEE Trans.on Broadcasting,vol.39,no.4,12-1993,pp.373-382）（以下Linと呼ぶ）参照。これらは全て引用により本明細書に組入れる。これらの文献では、フィルタバンクから得られる１以上のサブバンド信号に適用される予測器の予測誤差がエンコーダで量子化される。
Lazzariにより開示される技術では、縦続接続された直角ミラーフィルタ（ＱＭＳ）から得られる４つのサブバンドの２つに短語線形予測器を適用する。Lazzariは、もしサブバンドが４に限定されるなら一時的冗長語の除去がより効果的であると結論づけている。サブバンドの帯域幅は、人の聴覚系の臨界帯域より遥かに広い。序列６の予測値は、サンプル間の相関が最高の最低周波数サブバンド信号に用いられ、序列４の予測器は、第２のサブバンド信号に用いられる。予測は約１５ｍｓｅｃの信号フレームに亘って行われる。長語の冗長語を除くための追加の予測器が考えられたが、複雑さの増加に対して殆ど得るところがないので排除された。第３サブバンド信号は、予測なしで適応パルスコード変調機構を用いて符号化される。
Linにより開示される技術では、修正された多重パルス励起線形予測コーダが２つの縦続接続されたＱＭＦから得られる４つのサブバンドに適用される。サブバンドの帯域幅は人の聴覚系の臨界帯域より遥かに広い。Linは、高予測精度を得るためにはより狭いサブバンド内の隣接サンプル間の相関が十分高くないのでより広いサブバンドが用いられると説明している。一実施態様においては、序列６、４、４、４の予測器が２０ｍｓｅｃの分析フレーム長に亘ってそれぞれ４つのサブバンド信号に用いられる。励起パルス密度が低い時追加の長語予測器が用いられるのは、それが本質的品質の改良を与えるからである。
サブバンド帯域幅が非常に広いので、Lazzari及びLinにより開示される技術では量子化雑音を聴取できないようにするために心理知覚効果を完全に用いることができない。
Mahieuxにより開示される技術では、振幅・位相予測器が離散フーリエ変換（ＤＦＴ）から得られる変換係数に適用される。開示された一実施態様では、５１２点ＤＦＴが変換係数を発生させ、第１序列の予測器が変換係数量を予測し、２つの第２序列予測器が変換係数位相変化を予測する。ピーク値変換係数に対する予測誤差は、当該量に対しては非均一量子化を用いかつ位相変化に対しては均一量子化装置を用いて量子化される。より重要でない他の変換係数の量は、非均一量子化で行われる。予測誤差に対する量子化装置は信号内の急激な過渡現象に遭遇するときは何時でも再初期化される。不幸にして、開示された予測器は、変換係数の帯域幅以内に多重スペクトル成分を含む複雑な波形に対してうまく働かない。開示された技術による符号化システムでは、雑音状信号に応答して音状信号が発生される。さらに、量子化装置が再初期化される時補助情報を伝える必要がある。
上記引用文献で開示される各技術では、臨界帯域濾波及び予測精度の十分な組合わせを達成することはできない。一方では、より広いサブバンド内の情報に対して優れた予測精度が得られるが、量子化誤差が聴取できないようにするのはより困難である。他方では、より狭いサブバンドでは量子化誤差が聴取できないようにするのは一層容易であるが、殆ど利益が得られない程度まで予測精度が劣化する。狭いサブバンド内でより序列の高い予測器を用いることではまだ著しい改良が得られていない。Mahieuxにより開示されたシステムでは、第４序列の予測器が第１序列のものより約２ｄＢ高い予測利得を与えるにすぎないことを示している。
発明の開示
本発明の目的は、上記問題を克服する予測符号化を組入れた高品質分割帯域符号化システムを提供することである。
本発明の別の目的は、知覚劣化を最小にするために必要に応じて予測符号化が適用される高品質分割帯域符号化システムを提供することである。
本発明の他の目的は、以下の論議を通して述べる。
一実施態様における本発明の教示によると、分割帯域オーディオエンコーダは人の聴覚系の各臨界帯域の帯域幅と同等の帯域幅を有するサブバンド信号を発生させ、それぞれのサブバンド信号の波形を予測するために各サブバンドにおいて普遍的波形予測器を適用し、予測誤差又はそれぞれのサブバンドの内より低い情報要件を持つものをを量子化し、伝送又は記憶に適した形で量子化された予測誤差をフォーマットにしたがって並べる。予測器の序列は２つの競合する利害を釣合わせるように選択される。すなわち、１）低予測誤差を与えるために序列を十分高くし、予測誤差の低ビットレート量子化から結果的に生じる量子化雑音が知覚できないようにし、２）序列を十分低くして人の聴覚系の一時的隠蔽間隔と同等の応答時間を与えるようにすることの利害を釣合わせる。
一実施態様における本発明の教示によると分割帯域デコーダは、符号化された信号から、各サブバンドに対してサブバンド情報が量子化された予測誤差又はサブバンド信号のレプリカを表す、複数のサブバンドに対するサブバンド情報を引き出し、それぞれのサブバンド信号のレプリカを回復させるために各サブバンドにつき普遍的波形予測器を量子化された予測誤差を表すサブバンド情報に適用し、サブバンド信号のレプリカに応答して広帯域出力信号を発生させる。
符号化システムは、選択的に予測を用いることによって、人の聴覚システムの一時的隠蔽間隔を越える応答時間を有するより正確な高序列予測器を用いることができる。疑似静止間隔間に高序列予測器を用いることは予測精度に貢献する。高序列予測器が長い応答時間を有するので、高度な非静止現象に続いて大きな予測誤差の影響が一時的隠蔽間隔を越えて延びるかもしれない。しかし、知覚できる劣化は、大きな予測誤差よりはむしろサブバンド信号サンプルを符号化することによって回避若しくは最小化される。
本発明は、多くの異なった実施態様で実施可能であり、広範な種類のエンコーダ及びデコーダに組入れることができる。特に変換に基づくフィルタバンクに言及しているが、本発明の実施上決定的な特殊なフィルタバンクの実施形態はない。特に、実施形態には、臨界的にサンプリングされる、直角ミラーフィルタ（ＱＭＳ）及び時間領域エイリアシング相殺（ＴＤＡＣ）変換のようなエイリアシング人工物を発生させる分析フィルタバンクを組込んでもよい。
「臨界帯域と同等の」帯域幅などの表現は、特に低周波数において、人の聴覚系の臨界帯域を僅かに越えかもしれない帯域幅を意味すると理解すべきであるが、より狭いものが望ましい。「一時的隠蔽間隔と同等の」時間間隔などの表現は、人の聴覚系の一時的隠蔽間隔を僅かに越えかもしれない時間間隔を意味すると理解すべきであるが、より短いものが望ましい。
本発明の各種の特徴及び望ましい実施態様は、以下の論議及び同一要素は同一参照番号で示した図面を参照することによってよりよく理解し得るであろう。以下の論議及び図面の内容は例としてのみ示すものであって、本発明の範囲を限定するものであると理解すべきではない。
【図面の簡単な説明】
図１は、サブバンド信号プロセッサを組込んだ分割帯域エンコーダの機能構成図である。
図２は、逆サブバンドプロセッサを組込んだ分割帯域エンコーダの機能構成図である。
図３−５は、線形予測器及び量子化装置を組込んだサブバンド信号及び逆サブバンドプロセッサの実施態様の機能構成図である。
図６−７は、予測フィルタ係数を更新するために用いる情報の流れを例示する、線形予測器の実施態様の機能構成図である。
図８は、予測指定変更に備えた予測器を組込んだサブバンド信号プロセッサの実施態様の機能構成図である。
図９は、サブバンド信号プロセッサ用の予測指定変更制御器の実施態様の機能構成図である。
図１０は、逆サブバンド信号プロセッサ用の予測指定変更制御器の実施態様の機能構成図である。
本発明の実施様式
基本構成
図１は、本発明の各面を組込んだ分割帯域エンコーダの一実施態様を例示する。フィルタバンク２００は、路１００から受け取る入力信号に応答して複数のサブバンド信号を発生させる。ここでは簡単のために２つのサブバンドのみについて論議する。サブバンド信号プロセッサ３３０ａは、路３０１ａから受け取るサブバンド信号１つを処理し、処理の結果を路３０２ａに沿ってフォーマッタ４００へ送る。サブバンド信号プロセッサ３３０ｂは、路３０１ｂから受け取るサブバンド信号の別の１つを処理し、処理の結果を路３０２ｂに沿ってフォーマッタ４００へ送る。フォーマッタ４００は、処理したサブバンド信号を伝送又は記憶に適した形にアセンブルし、フォーマットした定様式信号を路５００に沿って送る。多くの実施態様においてフォーマッタ４００は本質的にマルチプレクサ（多重装置）あるが、フォーマットの特徴は本発明の実施にとって決定的ではない。
図２は、本発明の各面を組込んだ分割帯域デコーダの一実施態様を例示する。デフォーマッタ７００は、路６００から受け取るフォーマットされた信号から複数のサブバンドにつきサブバンド情報を引き出す。逆サブバンドプロセッサ８００ａは、路８０１ａから受け取るサブバンドの１つに対する情報を処理し、その結果生じたサブバンド信号を路８０２ａに沿って逆フィルタバンク９００へ送る。逆サブバンドプロセッサ８００ｂは、路８０１ｂから受け取るサブバンドの別の１つに対する情報を処理し、その結果生じたサブバンド信号を路８０２ｂに沿って逆フィルタバンク９００へ送る。逆フィルタバンク９００は、路８０２ａ及び８０２ｂから受け取るサブバンド信号に応答して路１０００に沿って出力信号を発生させる。
図３は、順方向予測器を組み込んだサブバンド信号プロセッサの一実施態様の基本構成を例示する。路３０１から受け取るサブバンドｉ内の信号のデジタルサンプルｘ（ｍ，ｉ）は、路３０５に沿って予測された値ｐ（ｍ，ｉ）を発生させる線形予測器３０４へ送られる。結合器３１０は、路３０５から受け取る予測された値ｐ（ｍ，ｉ）を路３０１から受け取るサブバンド信号サンプルｘ（ｍ，ｉ）から減算することによって予測誤差ｅ（ｍ，ｉ）を設定する。サブバンド指数ｉは、各サブバンド信号プロセッサに対して推定し得る。従って、以下論議を簡単にするためにサブバンド指数は省略される。従って、サブバンド信号予測誤差は、次式で表し得る。
ｅ（ｍ）＝ｘ（ｍ）−ｐ（ｍ）（１）
誤差を路３０２に沿って送る。対のデコーダの逆サブバンドプロセッサ内の予測器へ必要な補助情報を送るための装置は図示していない。
図４は、逆方向予測器を組み込んだサブバンド信号プロセッサの一実施態様の基本構成を例示する。結合器３１０は、式１により予測誤差を設定し、路３０３に沿って誤差を量子化装置３２０へ送る。量子化装置３２０は、予測誤差を量子化し、量子化された誤差を路３０２に沿って送る。結合器３３０は、路３０５から受け取る予測された値を路３０２から受け取る量子化された誤差に加算し、次式により源サブバンド信号サンプルのレプリカを回復させるようにする。

線形予測器３４０は、次式により路３０７から受け取るサブバンド信号サンプルの回復されたレプリカに応答して路３０５に沿って予測された値を発生させる。

ここでＦ＝線形予測関数
Ｎ＝予測器の序列
サブバンド信号プロセッサの望ましい実施態様では逆方向予測器が用いられる。その理由は、追加の補助情報を対のデコーダの逆サブバンドプロセッサへ送る必要がないからである。しかし、本発明の実施にとって決定的な特別な予測器トポロジはない。順方向予測器、逆方向予測器又は２形式のハイブリッド形を用いてもよい。
図５は、逆方向予測器を組み込んだ逆サブバンドプロセッサの一実施態様の基本構成を例示する。結合器８１０は、路８０２に沿って回復されたサブバンド信号サンプルのレプリカを発生させる。サブバンド信号サンプルは、式２により路８０５から受け取る予測された値を路８０１から受け取る量子化された予測誤差に加算することによって得られる。線形予測器８４０は、上記式３により路８０２から受け取る源サブバンド信号サンプルの回復されたレプリカに応答して路８０５に沿って予測された値を発生させる。順方向予測器を組み込んだ逆サブバンドプロセッサの実施態様は図示していない。しかし、本発明を実施するために順方向予測器、逆方向予測器又は２形式のハイブリッド形を用いることができる。
サブバンド帯域幅及び予測器序列
フィルタバンク２００及び逆フィルタバンク９００は、アナログ又はデジタルフィルタ若しくは２者のハイブリッド形を用いて実施してもよい。フィルタを実施するためには広範な各種の構造体及び技術を用いることができる。論議を簡単にするために以下特に離散ブロック変換によって実施されるフィルタバンクにつき述べる。
本来フィルタバンクはあらゆる変換によって実施できる。特に興味のある変換は、「偶数積重ね時間領域相殺（Ｅ−ＴＤＡＣ）ＨＡ変換」及び「奇数積重ね時間領域相殺（Ｏ−ＴＤＡＣ）である。前者は、Princen,Bradleyによる『時間領域エイリアシング相殺に基づく分析・合成フィルタバンクデザイン』（IEEE Trans.on Acoust.,speech,Signal Proc.,vol.ASSP-34,1986,pp.1153-1161）に記載され、後者は、Princen,Johnson Bradleyによる『時間領域エイリアシング相殺に基づくフィルタバンクデザインを用いるサブバンド・変換符号化』（ICASSP 1987 Conf.Proc.,May 1987,pp.2161-64）に記載されている。本発明の実施にとって決定的な特別な変換はない。論議を簡単にするために以下の記載は概してＯ−ＴＤＡＣ変換により実施されるフィルタバンクを前提とする。
既に述べた通り、変換に基づくフィルタバンクを組み込んだ実施態様では、競合する利害を釣り合わせる変換長を用いなければならない。変換長は十分長くし、知覚に基づく符号化を支持するのに十分微細なスペクトル分解能を与えるようにしなければならない。さらに、変換長は十分短くし、人の聴覚系の一時的隠蔽間隔と同等の間隔に対する過渡現象のような突発的現象に起因する聴取可能な量子化雑音を制限するのに十分微細な一時的分解能を与えるようにしなければならない。また、より長い変換に対する計算上の付加的要件及び用途により指定される一時的分解能要件も同様に考慮しなければならない。対応する考慮は、直角ミラーフィルタ（ＱＭＦ）のような他の技術を用いて実施されるフィルタバンクにも同様に適用される。
変換のスペクトル分解能は係数帯域幅であり、それは変換によって発生される別個の係数の数によって除算される入力信号帯域幅の商として近似できる。多くの変換に対する別個の係数の数は、変換長の半分と等しい。ここで「変換長」は、入力サンプル数又は変換が適用されるブロック内の「点」と意味するものと理解される。例えば、離散フーリエ変換（ＤＦＴ）又は上記ＴＤＡＣの１つのような５１２・点変換は、５１２入力サンプルのブロックに適用され、２５６の別個の変換係数を発生させる。簡単のためにここではすべての変換係数の帯域幅が同一であると仮定する。しかし、ＤＦＴ及びＥ−ＴＤＡＣ変換のようなある変換では、他のすべての係数の半分の帯域幅と等しい帯域幅を有する第１係数、最後の係数を発生させる。帯域幅のこれらの変化は、望ましいものとして説明されるが、簡単のために本論議では無視される。本論議を通して長さ２Ｎの変換は別個の等帯域幅変換係数Ｎを発生させると仮定する。他の形の変換に対しては適切な変化を行ってもよい。
デジタル信号に対しては、入力信号帯域幅はサンプリングレートの半分と考えられる。毎秒４４．１ｋサンプルのレートでサンプリングされるデジタル音声信号を符号化するシステムでは、１２８・点変換の係数帯域幅は約３４５Ｈｚで、これは低周波数における臨界帯域幅より広い。２６５・点変換及び５１２・点変換の係数帯域幅は、それぞれ約１７２Ｈｚ及び８６Ｈｚであり、それらは低周波数における臨界帯域幅と同等である。
変換の一時的分解能は、分析窓（ウインド）、隣接時間領域サンプルブロック間の重複量及びブロック間隔の長さによって影響される。Ｏ−ＴＤＡＣフィルタバンクの有効な一時的分解能は、時間領域サンプルブロックに対してブロック間隔の約半分であり、これはサンプリングレートによって除算されたブロック内のサンプル数の半分と等しい。毎秒４４．１ｋサンプルのレートでサンプリングされるデジタル音声信号を符号化するシステムでは、１２８・サンプルブロックに対するブロック間隔は約１．５ｍｓｅｃである。２５６・サンプル及び５１２・ブロックに対するブロック間隔は、それぞれ約３ｍｓｅｃ及び６ｍｓｅｃで、これらは前隠蔽間隔より幾分長い。２５６・点変換に対する一時的分解能及び、従って、平均の聴取者にとって聴取可能になる人工物の危険性は、信号・発生符号化用途に対して限界的に受け入れられるが、多重・発生符号化用途に対しては受け入れられない。
一般的波形予測を組み込んだ実施態様は、競合する利害を釣り合わせる序列を有する予測器を用いなければならない。序列は十分高くし、源信号よりはむしろ予測誤差を符号化することによって情報容量要件を低減させるのに十分な大きさの予測精度を与えるようにしなければならない。さらに、序列は十分低くし、一時的隠蔽間隔と同等の応答時間を与えるようにしなければならない。また、より長い変換に対する計算上の付加的要件及び用途により指定される一時的分解能要件も同様に考慮しなければならない。
一時的隠蔽に関して予測器に対する応答時間は、概して約５０ｍｓｅｃと考えられる後隠蔽間隔を考慮することを要するのみである。予測器の最大序列は、許容可能な最大予測器応答時間を隣接サブバンド信号サンプル又は係数間の間隔により除算することによって近似することができる。この間隔は、本質的に変換の一時的分解能と同一である。毎秒４４．１ｋサンプルの信号を有するＯ−ＴＤＡＣフィルタバンクを用いる望ましい実施態様では、５１２・点、２５６・点及び１２８・点変換に対する係数を予測するために用いられる予測器に対する最大序列はそれぞれ約８、１７及び３３である。
単一周波数正弦波形を正確に予測するためには３の最小序列を要する。しかし、各変換係数が概して幾つかの周波数に対するスペクトルエネルギを含む帯域幅を表すのでより大きな序列が通常必要とされる。経験的な証拠により、８６Ｈｚ（５１２・点変換）、１７２Ｈｚ（２５６・変換）及び３４５Ｈｚ（１２８・点変換）の係数帯域幅に対する実施上の最小序列がそれぞれ約４、６及び８であることが示されており、それらは低周波数における臨界帯域幅と同等である。
毎秒４４．１ｋサンプルでサンプリングされる音声信号を符号化する分割帯域エンコーダの望ましい実施態様では、Ｏ−ＴＤＡＣフィルタバンクは１２８・点の修正されたＤＣＴにより実施され、各変換係数は序列１０の線形予測器により処理される。フィルタバンクの一時的分解能は、たとえ符号化された多重・発生信号の量子化誤差でも一時隠蔽間隔と同等の間隔に閉じ込めるのに十分である。線形予測器の応答時間も同様に一時隠蔽間隔と同等である。フィルタバンクのスペクトル分解能は、最低・周波数変換係数を除くすべてに対して心理音響隠蔽効果を完全に利用するのに十分である。しかし、予測精度は十分で、情報容量要件上の総体的低減を達成するようにする。量子化雑音が隠蔽されるのを確保するために最低・周波数係数の符号化が必要になるかもしれないが、必要な追加ビット数は、ブロック対ブロック冗長ビットを低減させる線形予測によって節約されるビット数より少ない。
代わりの実施態様では、スペクトルのすべて若しくは大部分に亘って予測器の序列がサブバンドの帯域幅と共に変わることが可能になるかもしれない。例えば、帯域幅が臨界帯域幅で表されている所では序列は各サブバンドの帯域幅の３倍と等しく設定してもよい。この配列は、約１００Ｈｚを越えるサブバンドに対しオクターブで表される帯域幅の何倍かと等しい序列を設定することによって近似できる。例えば、中央周波数が５００Ｈｚ乃至１ｋＨのサブバンドに対し約９倍、１ｋＨｚ乃至４ｋＨｚに対し１５倍とし、約１０ｋＨｚを越えるサブバンドに対し約９倍に下がるように設定される。
適応予測
図６は、逆方向予測器を組み込んだサブバンド信号プロセッサの別な実施態様の基本構成を例示する。この実施態様の構成及び作用は上記図４に例示したものと実質的に同一である。この第２実施態様では、線形予測器３４０は路３０２から量子化された予測誤差を受取り、予測フィルタ係数を適応するようにさせる。
図７は、逆方向予測器を組み込んだ逆サブバンドプロセッサの別な実施態様の基本構成を例示する。この実施態様の構成及び作用は上記図５に例示したものと実質的に同一である。この第２実施態様では、線形予測器８４０は路８０１から量子化された予測誤差を受取り、予測フィルタ係数を適応するようにさせる。
予測フィルタの一実施態様では式３の予測関数Ｆは次式で表し得る。

ここでＣ_j（m）＝サンプルx（m）を予測するのに用いる予測フィルタ係数j
一定のフィルタ係数を有するこの様な予測フィルタは、図３乃至５に例示した実施態様で用いることができる。それは、図示していない路から受け取る情報からのフィルタ係数を適応させることによって、図３に例示した順方向予測器として用いることが可能である。
望ましい実施態様では、予測フィルタ係数は次式により更新される。

ここでｋ（ｍ）＝予測収束係数
予測収束係数の値は、安定性を維持しつつ予測器収束の速度を最大にすることによって予測器の応答時間を最小化するように適応される。時々起こる予測器の不安定は許容できるが、予測器『指定変更』を用いることが前提となる。予測器指定変更は以下に論議される。
予測器収束は、信号振幅、予測フィルタ序列及び予測誤差を量子化するのに用いる量子化装置によって影響される。収束係数の値は、これらの同一要因により設定されるのが望ましい。特に、もし収束係数が信号振幅と逆に変化するなら、予測器収束は信号振幅の変化に対して比較的影響されないようにすることができる。一実施態様において収束係数は、信号振幅の平方に逆比例ると共に予測器序列の平方に逆比例する。概して奇数・対称量子化関数が望ましい。その理由は、偶数・対称量子化関数とは異なり、奇数・対称量子化関数は不偏することができると共に低・レベル信号に帯域幅に対して零・レベル量子化レベルを与えることができる。原則として任意の大きさの信号を用いて収束係数を得ることができる。しかし、処与の間隔以内の信号のピーク値又は二乗平均平方根（ＲＭＳ）のいずれかを選ぶのが好都合である。一実施態様ではｋ（ｍ）は次式で設定される。

ここでｗ＝加重要因
max［a,b,...c］＝組｛a,b,...c｝内の値の最大値
Ｎ＝予測フィルタの序列
信号サンプルｘ（ｍ）が−１乃至１の範囲にある実施態様において加重要因は約０．１と等しい。
非常な小・振幅信号の場合、特に信号が雑音で覆われるほど振幅が小さい場合には、通常予測フィルタ係数の適応を禁止するのが望ましい。これは各種の方法で達成できる。１つの簡単な方法は、式６の最大信号振幅がある閾値未満の場合、例えばピーク値より１８０ｄＢ以上低い場合、ｋ（ｍ）を小さな値に設定することである。同様に適応化は、式５の右側の第２項を零又はほぼ零に設定することによって禁止してもよい。
単一組の予測フィルタ係数がＥ−ＴＤＡＣ技法によりフィルタバンクと共に用いることができることは注目すべきである。これはたとえそのフィルタバンクが修正離散余弦変換（ＤＣＴ）及び修正離散正弦変換（ＤＳＴ）の適用を交番する場合であっても可能である。修正ＤＣＴ及び修正ＤＳＴのスペクトルが互いに直角位相なので、各変換で発生されるサンプルは予測器によって別個に処理されなければならないが、同一予測フィルタ係数を用いることができるからである。望ましい実施態様において予測フィルタ係数は上記のものと類似の方法で適応化できる。
代替適用予測
予測器適応の閉じた形は、上記したものすべてのような適応の基本形式に対する代わりのものとして用いることができる。代替形式は、サブバンド内の信号が本質的に正弦波である期間に亘ってそれぞれのサブバンドにおいて用いること可能で、それによって予測器がより迅速に収束することが可能になり、逆方向予測器が実際の信号から逸れて変動するのを妨げ、順方向予測器に対する適応情報を伝えるのに要する補助情報量を低減させる。この代替形式は、正弦波が３つのサンプルのみで正確に表せることに基づく。従って、特定のサブバンド内の一番遅い４以上のサンプルを調べることによってそのサブバンド内の信号が本質的に正弦波かどうかを決定することができる。この決定は各サブバンドにつき可能で、サブバンド内の最近のサンプル又は変換係数から正弦波を周期的に推定（外挿）し、推定された正弦波及び現サンプル又は係数間の差を見出だし、この差を上記のような基本的方法により適応化された予測器から得られる予測誤差と比較することによって決定される。もし差が予測誤差未満なら、サブバンド信号は本質的に正弦波と見なされ、適切な正弦波を発生させるよう予測器が直ちに設定される。もし差が予測誤差を越えるなら、予測器適応化の基本的形式が続行される。適切なフラッグ又は他の制御情報が符号化された信号内に送り込まれ、その予測器が適切に適応化されるようにする。
もしフィルタバンク２００がブロック変換と共に実施されるなら、決定は各ブロックにつき行われ、現ブロック内の変換係数を３以上前のブロック内の対応する変換係数と共に調べることによって決定される。もしフィルタバンク２００がブロック変換以外のフィルタと共に実施されるなら、決定はサブバンド内の各サンプルにつき行われ、現サンプルを３以上前のサンプルと比較することによって決定される。前のサンプル数及び決定の頻度は、符号化用途の必要性により設定することができる。
予測指定変更
予測器のデザインでは、予測に要する精度、収束に要する速度及び高度に非静的現象及び予測誤差の量子化に鑑みた予測器の安定性を考慮しなければならない。既に述べた通り、これらの特性はデザイン上の妥協を要する競合要因である。「指定変更」と称する本発明の別な面は、ある用途において予測器デザイン上の妥協を軽減させることに資するように用いてもよい。予測指定変更は、符号化されたサブバンド信号の情報容量要件が予測を用いて低減されるかどうかを決定する。もし下がるなら、サブバンド信号サンプルの予測誤差が符号化される。もし下がらないなら、サブバンド信号サンプルのある表現が符号化される。この表現は、サブバンド信号サンプル値それ自体又は、例えば、微分値のある形のような誘導値でもよい。以下の論議はサブバンド信号サンプル値それ自体が符号化されることを前提としている。
図８は、予測指定変更を有する逆方向予測器を組み込んだサブバンド信号プロセッサの実施態様の基本構成を例示する。容量プロセッサ３１２は、路３０１から受け取るサブバンド信号サンプルに応答して、路３０８に沿ってサブバンド信号サンプル及びサブバンド信号情報容量要件の計量、すなわち、測度の双方を伝える。結合器３１０は、上記の式１により予測誤差を設定し、路３０３に沿って誤差を容量プロセッサ３１４へ送る。容量プロセッサ３１４は、路３０９に沿って予測誤差及び予測誤差の情報容量要件の測度の双方を伝える。指定変更３７０では路３０８及び３０９から受け取る容量要件測度を分析し、サブバンド信号サンプル又は予測誤差がより大きい情報容量要件を課すかどうかを確定し、より低い要件を課す信号を量子化し、それぞれ路３０７及び３０８に沿って量子化された誤差及び源サブバンド信号サンプルの回復されたレプリカを線形予測器３４０へ伝える。線形予測器３４０は、路３０６から受け取る量子化された予測誤差に応答して予測フィルタ係数を適応させ、路３０７から受け取る回復されたレプリカに応答して路３０５に沿って予測値を発生させる。
一実施例において容量プロセッサは、信号サンプルに対するブロック浮動小数点指数を設定することによって情報容量要件の測度を発生させる。容量要件は指数の値と逆に変化する。単一変換係数を含むサブバンドに対し、指数は１つの信号値だけに適用される。２以上の変換係数を含むサブバンドでは、指数は２以上の信号値に適用される。他の実施例において測度は、信号サンプルのピーク、ＲＭＳ、平均又はスケール係数のような他の信号レベルの関数である。さらに他の実施例において容量プロセッサは、大きさ以外の信号特性空情報容量要件を推定することができる。測度を発生させるのに用いる関数の選択は符号化システム性能に著しい影響を与え得るが、発明的概念にとって決定的な特別な関数はない。
図９は、予測指定変更の一実施態様の基本構成を例示する。この実施態様において比較器３７２は、路３０８及び３０９から受け取る容量要件測度を比較する。もし路３０８から受け取るサブバンド信号サンプルに対する情報容量要件が高いなら、図示の通り比較器３７２がスイッチ３７１ａ乃至３７１ｄを下方の位置に切り替えるようにさせ、路３０４ａに沿って「偽」指定変更信号を発生させ、予測誤差を量子化しかつ符号化すべきことを示す。しかし、もし路３０９から受け取る予測誤差に対する容量要件が高いなら、比較器３７２がスイッチ３７１ａ乃至３７１ｄを上方の位置に切り替えるようにさせ、路３０４ａに沿って「真」指定変更信号を発生させ、サブバンド信号サンプルを量子化しかつ符号化すべきことを示す。
比較器３７２の制御の下にスイッチ３７１ａは、路３０８から受け取るサブバンド信号又は路３０９から受け取る予測誤差のいずれかを量子化装置３２０へ送る。量子化装置３２０は情報を量子化し、量子化した情報を路３０２に沿って伝える。路３０２上の量子化された情報および路３９４上の指令変更信号の双方がその後フォーマッタ４００によって伝送又は記憶のために符号化された信号にアセンブルされる。
比較器３７２の制御の下にスイッチ３７１ｂ−３７１ｄは、量子化された予測誤差が路３０６に沿って送られかつ源サブバンド信号サンプルが路３０７に沿って送られることを確保する。もし予測誤差が量子化されかつ符号化されるなら、スイッチの各々が図示の通り下方の位置に切り替えられる。結合器３７６が式２により源サブバンド信号サンプルの回復されたレプリカを発生させる。これはスイッチ３７１ｂを通して炉３０５から受け取る予測された値を、３０２から浮けと在る量子化された予測誤差に加算することによって行われる。スイッチ３７１ｃは路３０７に沿って回復されたレプリカを伝え、スイッチ３７１ｄは路３０６に沿って量子化された予測誤差を伝える。
もしサブバンド信号サンプルが量子化されかつ符号化されるなら、各スイッチは上方の位置に切り替えられる。スイッチ３７１ｂはインバータ３７４から予測値の逆にされた形を受取ってそれらを結合器３７６へ伝える。結合器３７６は、路３０２から受け取る量子化されたサブバンド信号サンプルから予測された値を減算することによって量子化された予測誤差を発生させる。スイッチ３７１ｃは、路３０６に沿って量子化された予測誤差を伝え、スイッチ３７１ｄは路３０７に沿って回復されたレプリカを伝える。
図１０は、逆サブバンドプロセッサで用いる予測指令変更制御の一実施態様の基本構成を例示する。この実施態様において路８０１を経てデフォーマッタ７００から受け取る量子化された信号は、量子化されたサブバンド信号サンプル又は量子化された予測誤差のいずれであってもよい。制御器８７２は路８０４を介してデフォーマッタ７００から予測指定変更信号を受け取る。もし予測指定変更信号が偽なら、制御器８７２が図示の通りスイッチ８７１ａ−８７１ｄを上方位置に切り替える。もし予測指定変更信号が真なら、制御器８７２がスイッチ８７１ａ−８７１ｄを下方位置に切り替える。
制御器８７２に応答して、スイッチ８７１ａは路８０２に沿って源サブバンド信号サンプルの回復されたレプリカを伝える。もし予測指定変更信号が偽でありかつスイッチが上方位置にあるなら、結合器８１０が源サブバンド信号サンプルのレプリカを回復させる。これは、路８０５を介して線形予測器８４０から受け取る予測された値と、路８１０から受け取る量子化された予測誤差とを結合することによって行われる。もし予測指定変更信号が真でありかつスイッチが下方位置にあるなら、源サブバンド信号サンプルのレプリカは路８０１から直接受け取られる。
制御器８７２に応答してスイッチ３７１ｂ−３７１ｄは、量子化された予測誤差が路８０６に沿って送られかつ源サブバンド信号サンプルの回復されたレプリカが路８０７に沿って線形予測器８４０へ送られることを確保する。もし量子化された予測誤差が路８０１から受け取られるなら、各スイッチは図示の通り上方位置に切り替えられる。結合器８７６は、式２により源サブバンド信号サンプルの回復されたレプリカを発生させる。これは、スイッチ８７１ｂを通して路８０５から受け取る量子化された予測誤差と、路８０１から受け取る量子化された予測誤差とを加算することによって行われる。スイッチ８７１ｃは路８０７に沿って回復されたレプリカを伝え、スイッチ８７１ｄは路８０６に沿って量子化された予測誤差を伝える。
もし量子化されたサブバンド信号サンプルが路８０１から受け取られるなら、各スイッチは下方位置に切り替えられる。スイッチ８７１ｂはインバータ８７４から予測値の逆にされた形を受取ってそれらを結合器８７６へ伝える。結合器８７６は、路８０１から受け取る量子化されたサブバンド信号サンプルから予測値を減算することによって行われる。スイッチ８７１ｃは路８０６に沿って量子化された予測誤差を伝え、スイッチ８７１ｄは路８０７に沿って回復されたレプリカを伝える。
線形予測器８４０は、路８０６から受け取る量子化された予測誤差に応答して予測フィルタ係数を適応させかつ路８０７から受け取る回復されたレプリカに応答して路８０５に沿って予測された値を発生させる。

Claims

音声情報を表す入力信号を受け取るレシーバ装置と、
複数のサブバンド信号を発生するサブバンド装置であって、前記入力信号のそれぞれの周波数のサブバンドに対応する各サブバンド信号は、対応する人の知覚臨界帯域以下の帯域幅を有することを特徴とするサブバンド装置と、
それぞれのサブバンド信号に応答して量子化されたサブバンド情報を発生させるプロセッサ装置であって、
前記それぞれのサブバンド信号の情報容量要件を表す第１測度信号を発生させる装置と、
前記それぞれのサブバンド信号と、序列３以上の波形予測器を用いて該それぞれのサブバンド信号を予測することによって発生される予測された信号との間の差から予測誤差信号を発生させる装置と、
前記予測誤差信号の情報容量要件を表す第２測度信号を発生させる装置と、
前記第１測度信号及び前記第２測度信号を分析し、それに応答して予測指定変更信号を発生させ、そして、前記それぞれのサブバンド信号の情報要件が前記予測誤差信号より高い場合は、該予測誤差信号を量子化し、そうでない場合は、該各サブバンド信号を量子化することによって前記量子化されたサブバンド情報を発生させる装置と、
を含むことを特徴とするプロセッサ装置と、
量子化されたサブバンド情報及び前記周波数サブバンドに対する予測指定変更信号を伝送又は記憶に適した形にアセンブルすることによって符号化された信号を書式化するフォーマッタ装置と、
から成るエンコーダ。
前記入力信号は、入力信号サンプルを含み、前記サブバンド信号の各々は、１つまたはそれ以上の変換係数を含み、前記変換係数は、前記入力信号に変換を適用することによって発生されることを特徴とする、請求項１のエンコーダ。
前記変換係数は、偶数積重ね時間領域エイリアシング相殺変換又は奇数積重ね時間領域エイリアシング相殺変換のいずれかを適用することによって生成される係数と実質的に対応することを特徴とする、請求項２のエンコーダ。
前記変換は、前記入力信号サンプルの間隔に応答して変換係数のブロックを発生させ、前記波形予測器は、それぞれのブロック以内の変換係数のグループに適用され、該波形予測器は、２５６、１２８及び６４の変換係数を含むブロックに対してそれぞれ８、１７及び３３の最低序列を有することを特徴とする、請求項２又は３のエンコーダ。
それぞれのサブバンド信号に対する前記波形予測器は、臨界帯域幅で表される前記それぞれのサブバンド信号の帯域幅の３倍と実質的に等しい序列を有することを特徴とする、請求項１乃至４のいずれか１項に記載のエンコーダ。
前記波形予測器は、人の聴覚系の後隠蔽間隔を隣接する前記入力信号サンプル間の時間間隔で除算した、時間間隔の商以下の序列を有することを特徴とする、請求項１乃至５のいずれか１項に記載のエンコーダ。
音声情報を表す符号化された信号を受け取り、該符号化信号から、予測指定変更信号及び人の知覚の対応する臨界帯域以下の帯域幅を有する前記音声情報のそれぞれの周波数サブバンドに対する量子化されたサブバンド情報を得るデフォーマッタ装置であって、それぞれの周波数サブバンドの予測指定変更信号は、その周波数サブバンドに対する量子化されたサブバンド情報が量子化された予測誤差か又は量子化されたサブバンド信号のいずれであるかを示すことを特徴とするデフォーマッタ装置と、
それぞれの周波数サブバンドに対するレプリカサブバンド信号を発生させるプロセッサ装置であって、前記プロセッサ装置は、
前記それぞれの周波数サブバンドに対する量子化されたサブバンド情報に序列３またはそれ以上の波形予測器を適用することによって予測信号を発生させる装置と、
前記それぞれの予測指定変更信号が偽りである場合は、前記予測信号に応答して前記プロセッサ装置が前記レプリカサブバンド信号を発生させ、そうでない場合は、前記量子化されたサブバンド信号に応答して該レプリカサブバンド信号を発生させるように前記波形予測器を制御する装置と、
前記周波数サブバンドに対する前記レプリカサブバンド信号に応答して前記音声情報のレプリカを発生させる出力装置と、
を含むことを特徴とするプロセッサ装置と、
から成るデコーダ。
前記サブバンド信号は、変換係数を含み、前記音声情報の前記レプリカは、前記複数の周波数サブバンドに対する前記サブバンド信号に逆変換を適用することによって発生されることを特徴とする、請求項７のデコーダ。
前記逆変換は、偶数積重ね時間領域エイリアシング相殺変換又は奇数積重ね時間領域エイリアシング相殺変換のいずれかに実質的に対応することを特徴とする、請求項８のデコーダ。
前記複数のサブバンドに対するサブバンド信号は、変換係数のブロックを構成し、前記波形予測器は、２５６、１２８及び６４の変換係数から成るブロックに対し８、１７及び３３の最低序列を有することを特徴とする、請求項８又は９のデコーダ。
それぞれのサブバンド信号に対する前記波形予測器は、臨界帯域幅で表される前記それぞれのサブバンド信号の帯域幅の３倍に実質的に等しい序列を有することを特徴とする、請求項７乃至１０のいずれか１項に記載のデコーダ。
音声情報の前記レプリカは、音声サンプルを含み、前記波形予測器は、人の聴覚系の後隠蔽間隔を隣接する前記音声サンプル間の時間間隔で除算した、時間間隔の商以下の序列を有することを特徴とする、請求項７乃至１１のずれか１項に記載のデコーダ。
入力端子と、
それぞれが前記入力端子に結合される入力と、出力とを有する複数の帯域通過フィルタであって、それぞれの中心周波数を有し、それぞれの通過帯域幅が人の聴覚系と臨界帯域に等しいか又はそれより狭い帯通過波フィルタと、
それぞれの帯域通過フィルタの出力と結合される回路であって、前記回路は、
前記それぞれの帯域通過フィルタの出力と結合される入力と、出力とを有する序列３以上の線形予測フィルタと、
第１比較器入力、第２比較器入力及び比較器出力を有する比較器であって、前記第１比較器入力は、前記それぞれの帯域通過フィルタの出力と結合され、かつ前記第２比較器入力は、前記線形予測フィルタの出力と結合される比較器とを具備し、前記比較器出力は、前記線形予測フィルタの出力の情報要件が前記それぞれの帯域通過フィルタの出力の情報要件より大きいかどうかを示す予測指定変更信号を伝達することを特徴とする、比較器と、
前記比較器出力と結合される入力と、前記予測指定変更信号に応答する出力とを有するスイッチ制御器と、
第１スイッチ入力、第２スイッチ入力及びスイッチ出力を有するスイッチであって、前記第１スイッチ入力は前記それぞれの帯域通過フィルタの出力と結合されかつ前記第２スイッチ入力は前記線形予測フィルタの出力と結合され、前記スイッチ出力は前記スイッチ制御器の出力に応答して前記第１スイッチ入力又は前記第２スイッチ入力のいずれかに切り替え可能に接続されることを特徴とするスイッチと、
前記スイッチ出力と結合される入力と、出力とを有する量子化装置と、
を含むことを特徴とする回路と、
前記比較器出力と前記量子化装置出力とに結合されるマルチプレクサと、
から成るエンコーダ。
前記予測フィルタが加重回路を有するフィルタタップを含み、前記加重回路は、前記量子化装置出力と結合されることを特徴とする、請求項１３のエンコーダ。
入力端子と、
前記入力端子と結合される入力、及び複数のデマルチプレクサ出力を有するデマルチプレクサであって、前記デマルチプレクサは、前記入力端子で受け取った信号から予測指定変更信号とサブバンド情報とを得ることを特徴とする、デマルチプレクサと、
第１のそれぞれのデマルチプレクサ出力と結合される回路であって、前記回路は、
サブバンド情報を受け取るために前記第１のそれぞれのデマルチプレクサ出力と結合される入力を有し、かつ出力を有する序列３以上の線形予測フィルタと、
前記予測指定変更信号に応答させるように、第２のぞれぞれのデマルチプレクサ出力と結合されるスイッチ制御器と、
第１スイッチ入力、第２スイッチ入力及びスイッチ出力を有するスイッチであって、前記第１スイッチ入力が前記第１のそれぞれのデマルチプレクサ出力と結合されかつ前記第２のスイッチ入力が前記線形予測フィルタの出力と結合され、前記スイッチ出力が前記スイッチ制御器に応答して前記第１スイッチ入力又は前記第２スイッチ入力のいずれかに切り替え可能に接続されるスイッチと、
を含むことを特徴とする回路と、
それぞれの中心周波数を有し、人の聴覚系と臨界帯域に等しいか又はそれより狭いそれぞれの通過帯域を有する複数の逆帯域通過フィルタであって、前記複数の逆帯域通過フィルタのそれぞれが前記スイッチの出力と結合されることを特徴とする逆帯域通過フィルタと、
から成るデコーダ。
前記予測フィルタが加重回路を有するフィルタタップを含み、前記加重回路は、前記デマルチプレクサの前記複数の出力の各１つと結合されることを特徴とする、請求項１５のデコーダ。