JPH0716437U - 音声高能率符号化装置 - Google Patents
音声高能率符号化装置Info
- Publication number
- JPH0716437U JPH0716437U JP051660U JP5166093U JPH0716437U JP H0716437 U JPH0716437 U JP H0716437U JP 051660 U JP051660 U JP 051660U JP 5166093 U JP5166093 U JP 5166093U JP H0716437 U JPH0716437 U JP H0716437U
- Authority
- JP
- Japan
- Prior art keywords
- fft
- coefficient
- odd
- unit
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【目的】 音声高能率符号化装置においてFFT処理を
追加した場合に演算量を増加することなくスペクトル情
報を算出する。 【構成】 前処理部102により入力信号ADSから複
素数列xが求められ、次いでFFT部103により複素
数列xから複素数列xにおけるFFT係数Xが求められ
る。中間処理部104ではFFT係数Xと、係数テーブ
ル101には予め記憶されたデジタルフィルタのインパ
ルス応答における偶数項のFFT係数Gと奇数項のFF
T係数Hに基づいて複素数列Yと、FFT係数Xにおけ
る偶数項EVENおよび奇数項ODDが求められる。F
FT係数出力部105では偶数項EVENと奇数項OD
Dから入力信号ADSのFFT係数ADSfが求めら
れ、また、逆FFT部106では複素数列Yに基づいて
畳み込み結果yが算出され、後処理部107により畳み
込み結果yから高域側信号ADHと低域側信号ADLが
求められる。
追加した場合に演算量を増加することなくスペクトル情
報を算出する。 【構成】 前処理部102により入力信号ADSから複
素数列xが求められ、次いでFFT部103により複素
数列xから複素数列xにおけるFFT係数Xが求められ
る。中間処理部104ではFFT係数Xと、係数テーブ
ル101には予め記憶されたデジタルフィルタのインパ
ルス応答における偶数項のFFT係数Gと奇数項のFF
T係数Hに基づいて複素数列Yと、FFT係数Xにおけ
る偶数項EVENおよび奇数項ODDが求められる。F
FT係数出力部105では偶数項EVENと奇数項OD
Dから入力信号ADSのFFT係数ADSfが求めら
れ、また、逆FFT部106では複素数列Yに基づいて
畳み込み結果yが算出され、後処理部107により畳み
込み結果yから高域側信号ADHと低域側信号ADLが
求められる。
Description
【0001】
本考案は、オーディオ信号をデジタルフィルタにより複数の帯域(サブバンド )に分割してサブバンド毎に量子化および符号化する音声高能率符号化装置に関 する。
【0002】
ミニディスク(MD)、デジタルコンパクトカセット(DCC)、カラオケC D等における音声高能率符号化は、オーディオ信号のデータ量を圧縮するので音 楽圧縮とも呼ばれている。このような符号化方式では、オーディオ信号がデジタ ルフィルタまたは直交変換により複数のサブバンドに分割され、周波数領域にお ける聴覚心理分析に基づいてサブバンド毎の量子化ビット数が決定される。なお 、以下の説明では「エンコード」という用語を符号化の他に圧縮の意味で用いる 場合もある。
【0003】 図6(a)〜(d)は周波数帯域を直交変換により分割する例を示す。図6( a)はエンコードの対象となる16ビットPCMオーディオ信号を512サンプ ル分切り出したことを示し、ここでは図の長方形で囲まれる全情報量が16ビッ ト*512=8192ビットとして説明する。もちろん、切り出されるサンプル 数やPCMのビット数はこの値に限定されない。
【0004】 図6(b)は図6(a)に示す信号をDCT(離散コサイン変換)やFFT( 高速フーリエ変換)等の直交変換により周波数変換した信号を示し、図の曲線が 周波数スペクトルのエンベロープを示している。ここで、直交変換により情報量 が保存されると仮定すると、この全情報量も図の長方形領域で表現することがで きる。一方、聴覚心理モデルによれば、図6(b)に示す信号が存在したときに その信号によりマスキングされて聞こえなくなる信号レベルをカーブとして規定 することができ、これは一般にマスキング効果と言われる。
【0005】 図6(b)からマスキングカーブを描くと図6(c)に示すように表すことが でき、ここで、図6(b)に示す信号を再量子化することを考慮すると、再量子 化により発生する量子化ノイズレベルがマスキングカーブで規定されるレベル以 下であれば、そのノイズは人間の耳には聞こえないということができる。そこで 、図6(d)に示すようにスペクトルを複数データ毎にサブバンドに分割し、各 サブバンド毎の最大信号レベルをSとし、また、図6(c)から許容されるノイ ズレベルをNとしてこのS/Nを満足するビット数で再量子化すれば、そのとき の量子化ノイズはマスキングされて聞こえない。
【0006】 図6(d)の矩形は圧縮時および伸長時に必要な情報量を示し、特に図の中央 の変形矩形は主情報を、図の下側の細長い矩形は補助情報を示している。なお、 補助情報とはデコード時に必要な各サブバンドの最大値(スケール値)と量子化 ビット数を示す情報等である。したがって、図6(d)において示される全情報 量は主情報量と補助情報量の和であり、図6(a)や図6(b)における全情報 量の数分の1になることが分かる。したがて、図7に示すように以上の処理(ス テップS1〜S6)を区間(この例では512サンプル区間)毎に繰り返すこと により音質を殆ど劣化することなくエンコードすることができる。
【0007】 次に、帯域分割の方法について説明すると、デジタルフィルタと直交変換の組 み合わせにより以下の3通りが考えられる。 (1)デジタルフィルタのみにより帯域分割を行う。 (2)直交変換のみにより帯域分割を行う。 (3)デジタルフィルタと直交変換の組み合わせにより帯域分割を行う。この 場合には、先にデジタルフィルタにより大まかに帯域分割し、次に直交変換によ り細かく帯域分割することが一般的である。
【0008】 この分類によれば、DCCとカラオケCDは上記(1)に属し、また、MDは 上記(3)に属する。図8は従来のMDエンコーダを示し、図9は図8のデジタ ルフィルタ1を詳細に示し、図10は図9のデジタルフィルタ1におけるインパ ルス応答の概略を示している。MDシステムでは先ず、PCMオーディオ信号が デジタルフィルタとしてQMF(Quadrature Mirror Filter)1により低域およ び中域のバンドADL〔q〕と高域のバンドADH〔q〕の2つのバンドに分割 される。なお、QMF1の構成の詳細は後述する。
【0009】 QMF1により分割された2つのバンドは、デジタルフィルタ(QMF)2お よびディレイ部3により低域、中域、高域の3つのバンドに分割され、次にMD CT部4L、4M、4Hによりそれぞれ各バンドに対してMDCTが施されて周 波数スペクトルが得られる。量子化・符号化部5はこの周波数スペクトルを52 バンドに見立てたサブバンド毎に量子化および符号化を行う。
【0010】 また、QMF2およびディレイ部3により分割された低域、中域、高域の3つ のバンドに基づいて変換長決定部6によりMDCT部4L、4M、4Hの変換フ レーム長が決定される。例えば低域と中域については1に対して1/4が決定さ れてMDCT部4L、4Mにより変換が1回または4回行われ、高域については 1に対して1/8が決定されてMDCT部4Hにより変換が1回または8回行わ れ、したがって、分析の時間分解能と周波数分解能が適切に選択可能に構成され ている。
【0011】 また、MDCT部4L、4M、4Hにより得られた周波数スペクトルに基づい て聴覚心理分析部7により量子化・符号化部5の量子化ビット数が決定され、こ の量子化ビット数と、量子化・符号化部5により量子化および符号化されたデー タとMDCTの変換フレーム長は、マルチプレックス部8により多重化されてM Dに記憶される。
【0012】 ここで、高能率符号化に限らず、一般に音声信号の性質を分析する場合には何 らかの手段で周波数スペクトルを観察することが行われる。この理由は、そもそ も人間の聴覚が周波数スペクトルを分析して音色等を認識しており、聴覚に沿っ て評価できることを始め、時間領域の信号から得られない様々な情報を入手する ことができるからである。また、周波数スペクトルを求める場合には一般にFF Tがよく用いられるが、この理由は、FFTが広く普及したアルゴリズムである と同時に、スペクトルが振幅と位相というベクトルの形式で得られるからとも思 われる。
【0013】
しかしながら、上記(1)および(3)の帯域分割方法では次のような問題点 がある。 (1)については、デジタルフィルタのみによる帯域分割では、システムの規 模の都合上多数のバンドに分割することができないので、聴覚心理上必要な周波 数分解能が不足する場合が多いという問題点がある。したがって、この場合には 図11に示すように、デジタルフィルタ部1〜4、6と平行してFFT部9によ り周波数スペクトルを求め、この周波数スペクトルを用いて聴覚心理を分析する 場合がある。
【0014】 (3)については、直交変換としてMDCTやDCT等を用いた場合、得られ るスペクトルが振幅と符号であり、この場合には図12に示すようにベクトルの 変化量を予測等することが困難であるので、やはりFFTにより振幅と位相を分 析する処理が別途必要になる場合がある。また、MDの場合のように直交変換の 変換長を決定しなければならない場合、図8に示すMDエンコーダは時間領域の 信号から決定しているが、FFT等のスペクトル情報から決定すればより的確に 制御することができる。
【0015】 したがって、上記(1)および(3)のデジタルフィルタを用いた帯域分割方 法では、FFTを併用して処理能力を向上させることが必要であるが、図11に 示すようにFFT処理を単に追加すると、その分演算量が増加するという問題点 がある。
【0016】 本考案は上記従来の問題点に鑑み、FFT処理を追加した場合に演算量を増加 することなくスペクトル情報を得ることができる音声高能率符号化装置を提供す ることを目的とする。
【0017】
本考案は上記目的を達成するために、FFT処理されたデータを逆FFT処理 することによりオーディオ信号をサブバンドに分割するとともに、FFT処理に より得られたFFT係数をスペクトル情報として後段の処理で利用するようにし ている。 すなわち本考案によれば、オーディオ信号をサブバンドに分割し、サブバンド 毎に量子化および符号化する音声高能率符号化装置において、 デジタルフィルタによるサブバンド分割の少なくとも一部を実現する高速フー リエ変換手段と逆高速フーリエ変換手段との組み合わせと、 前記高速フーリエ変換手段により処理されたデータからオーディオ信号のFF T係数を算出するFFT係数算出手段とを有することを特徴とする音声高能率符 号化装置が提供される。
【0018】
本考案では、FFT処理されたデータを逆FFT処理することによりオーディ オ信号がサブバンドに分割されるとともに、FFT処理により得られたFFT係 数をスペクトル情報として後段の処理で利用する。したがって、オーディオ信号 をサブバンドに分割する処理の一部がオーディオ信号の周波数スペクトルを求め るFFT処理を兼用しているので、FFT処理を追加した場合に演算量を増加す ることなくスペクトル情報を得ることができる。
【0019】
以下、図面を参照して本考案の実施例について説明する。図1は本考案に係る 音声高能率符号化装置の一実施例の要部であるデジタルフィルタ兼FFT係数算 出部を示すブロック図、図2は図1のデジタルフィルタ兼FFT係数算出部によ り分割される周波数帯域を示す説明図、図3は図1のデジタルフィルタ兼FFT 係数算出部の畳み込み処理を示す説明図、図4は図1のデジタルフィルタ兼FF T係数算出部が256長の信号を3つに分割する処理を示す説明図、図5は図1 のデジタルフィルタ兼FFT係数算出部のFFT係数算出処理と帯域分割処理を 説明するためのフローチャートである。
【0020】 本実施例では、サブバンド分割に用いられるデジタルフィルタ処理の一部とし てFFT処理が用いられている。図1に示すデジタルフィルタ兼FFT係数算出 部は、一例として図8に示すMDエンコーダの第1段のQMF1に対応し、図2 に示すようにある周波数fsを有する時間信号を低域H1と高域H2の2つの帯 域に等分割するとともに、聴覚心理分析等の各種処理に利用可能なスペクトルと してFFT係数ADSfを得るようにしている。、
【0021】 ここで、図9に詳しく示すQMF1は、単にある周波数fsを有する時間信号 を低域H1と高域H2の2つの帯域に等分割するだけであり、また、
【0022】
【数1】
【0023】 という鏡面対称の関係が成り立つのでミラーフィルタと呼ばれる。なお、低域H 1と高域H2がQMFとなるためには幾つかの条件が必要であるが、ここでは説 明を省略する。また、図9に示すフィルタ1はFIR(有限長インパルス応答) フィルタであり、時間信号にQMF処理を施すということは信号と低域H1およ び高域H2との畳み込み演算を行うことに他ならない。図9に示す例では、低域 H1のインパルス応答をa
〔0〕〜a〔47〕の48ポイントで定義しており、 QMFの性格上a〔i〕=a〔47−i〕(i=24〜47)が成立するので、 インパルス応答aと振幅は図10に示すように表現することができる。 図9に示すQMF1では、512個のサンプルADS〔p〕が入力すると、
【0024】
【数2】
【0025】 により、出力として256サンプルの高域側信号ADH〔q〕と同じく256サ ンプルの低域側信号ADL〔q〕が得られる。また、帯域幅が共に1/2になる のでサンプリングレートを1/2にするダウンサンプリングを行っている。 このように、QMF処理は入力信号ADSの偶数項とインパルス応答aの偶数 項の畳み込み演算と、入力信号ADSの奇数項とインパルス応答aの奇数項の畳 み込み演算を行い、畳み込み後の2つの信号の差から高域側信号ADHが、また 、和から低域側信号ADLが求められる。
【0026】 本実施例ではこの畳み込み演算を図1に示す回路でFFTにより行っている。 この回路を概略的に説明すると、先ず前処理部102により入力信号ADSから 複素数列xが求められ、次いでFFT部103により複素数列xから複素数列x におけるFFT係数Xが求められる。係数テーブル101には予め、インパルス 応答aにおける偶数項のFFT係数G(=F{g})と奇数項のFFT係数H( =F{h})が記憶され、中間処理部104ではこれらのFFT係数X、G、H に基づいて複素数列Yと、複素数列Xにおける偶数項EVENおよび奇数項OD Dが求められる。
【0027】 FFT係数出力部105では偶数項EVENと奇数項ODDから入力信号AD SのFFT係数ADSfが求められ、また、逆FFT部106では複素数列Yに 基づいて畳み込み結果yが算出され、次いで後処理部107により畳み込み結果 yから高域側信号ADHと低域側信号ADLが求められる。
【0028】 次に図3〜図5を参照してこのFFT処理について詳細に説明すると、先ず、 FFTの性質から時間領域における畳み込み演算はFFT係数上では積演算とな る。ここで、一般に長さNの入力信号x〔i〕と長さMのインパルス応答h〔i 〕との畳み込み結果をy〔i〕とし、また、それぞれのFFT係数をそれぞれX 〔k〕、H〔k〕、Y〔k〕とすると、畳み込み結果y〔i〕=x〔i〕*h〔 i〕(但し、「*」は畳み込み演算を示す。)は、Y〔k〕=X〔k〕・H〔k 〕(但し、k=0〜R−1)に対応する。
【0029】 具体的には図3に示すように、信号x〔i〕の長さNを長さR(R≧N+M, R=2n)に拡張し、また、長さMのインパルス応答h〔i〕も同様に長さRに 拡張し、それぞれ長さRのFFT処理を実行することにより拡張時における信号 x〔i〕のFFT係数X〔k〕およびインパルス応答h〔i〕のFFT係数H〔 k〕を求める。
【0030】
【数3】 X〔k〕=F{x〔i〕} H〔k〕=F{h〔i〕} 但し、「{}」はフーリエ変換を示す。
【0031】 次に、拡張時におけるX〔k〕とH〔k〕の積Y〔k〕を求め、以下のように Y〔k〕をI(逆)FFT処理することにより、信号とインパルス応答の畳み込 み結果y〔i〕を得る。なお、このようにして得られるy〔i〕は、x〔i〕と h〔i〕の直線畳み込みと呼ばれる。
【0032】
【数4】 y〔i〕=F-1{Y〔k〕} 但し、「F-1{}」は逆フーリエ変換を示す。
【0033】 次に、256サンプルの入力信号ADSと24サンプルのインパルス応答aの 畳み込みについて説明する。図4においてN=256、M=24であるので、最 小のRは512となり、したがって、上記方法では512ポイントのFFTを用 いれば上記畳み込み演算を行うことができる。
【0034】 ここで、本実施例では、音声高能率符号化においてFFT処理により得られる スペクトルを後続の処理に用いるので、図4に示すように256長の信号を3つ に分割し、これを共に128ポイントに拡張してFFTを3回行うことにより畳 み込み演算を行う。なお、このとき128≧86+24が成り立っている。そし て、図5に示すようにFFTを3回行うことにより得られる畳み込み結果を合成 すると256長全体の畳み込み結果が得られ、予測計算やプリエコー対策のため の波形の立ち上がり等に利用することができる。
【0035】 次に、図5を参照して実際にFFTにより畳み込み演算を行う手順の一例を説 明すると、先ず、係数テーブル101に予め設定されているインパルス応答aに おける偶数項のFFT係数G(=F{g})と奇数項のFFT係数H(=F{h })が中間処理部104に設定される(ステップS11)。
【0036】 数2によれば、入力信号の偶数項(以下、evenという。)とインパルス応 答aの偶数項(以下、gという。)の畳み込み演算(even*g)と、入力信 号の奇数項(以下、oddという。)とインパルス応答aの奇数項(以下、hと いう。)の畳み込み演算(even*h)が行われるが、上記even、odd 、g、hはいずれも実系列であり、even*gとeven*hも同様に実系列 となるので、FFTと逆FFTを行うために、先ず実系列の偶数項evenと奇 数項oddを128長に拡張した後、複素数列x(=even+jodd)に展 開し、FFTの処理回数を低減するようにしている(ステップS12)。 そして、ステップS13ではFFT部103により複素数列xのFFT係数X を求める。
【0037】
【数5】 X=F{x} =F{even}+jF{odd} =EVEN+jODD
【0038】 続くステップS14では中間処理部104によりこのFFT係数Xから偶数項 EVENと奇数項ODDを分離し、ステップS15ではFFT係数出力部105 によりこの偶数項EVENと奇数項ODDから入力信号ADSのFFT係数AD Sfを求める。ステップS14に示す偶数項EVENと奇数項ODDを分離する 方法を詳細に説明すると、2つの実系列even(n)とodd(n)から複素 系列x(n)をx(n)=even(n)+jodd(n)と定義し、複素系列 x(n)のFFT係数X(k)から実系列even(n)のFFT係数EVEN (k)と、実系列odd(n)のFFT係数ODD(k)を算出する(系列長は Nとする)。 FFTの線形性から、
【0039】
【数6】 X(k)=EVEN(k)+jODD(k) …(a)
【0040】 が成立し、また、even(n)およびodd(n)が実系列であるので、FF Tの性質から、
【0041】
【数7】 EVEN(k)=EVEN* (N−k) ODD(k)=ODD* (N−k) 但し、「* 」は複素共役を示す。Nは系列長を示す。
【0042】 が成立する。したがって、
【0043】
【数8】 X(N−k)=EVEN(N−k)+jODD(N−k) =EVEN* (k)+jODD* (k) ∴X* (N−k)=EVEN(k)−jODD(k) …(b)
【0044】 式(a)および(b)からEVEN(k)とODD(k)を求めると、
【0045】
【数9】 EVEN(k)=(1/2)〔X(k)+X* (N−k)〕 ODD(k)=(1/2j)〔X(k)−X* (N−k)〕 …(c)
【0046】 となり、したがって、式(c)によりX(k)からEVEN(k)とODD(k )を求めることができる。 次に、図5に戻ってFFTにより周波数スペクトルを算出する方法を説明する 。本実施例では、音声高能率符号化において入力信号ADSを3分割した区間毎 のFFT係数を求めて後続の処理に用い、また、入力信号ADSの偶数項と奇数 項ともに128の長さでFFT処理を行うので、得られる入力信号ADSのFF T係数は256長3回分である。
【0047】 ステップS15に示すADSf算出処理を詳しく説明すると、長さがNの系列 に対するFFT係数は、長さを半分(N/2)に短縮した2つの系列のFFT係 数から計算することができる。今、長さがNの系列ADS(n)(n=0,1, …,N−1)を偶数項
【0048】
【数10】 even(n)=ADS(2n) (n=0,1,…,N/2−1)
【0049】 と奇数項
【0050】
【数11】 odd(n)=ADS(2n+1) (n=0,1,…,N/2−1)
【0051】 に分けて考える。このとき、偶数項even(n)と奇数項odd(n)の各F FT係数をそれぞれEVEN(k)、ODD(k)(k=0,1,…,N/2− 1)とすると、系列ADS(n)のFFT係数ADSf(k)は、時間間引き形 のFFTアルゴリズムの考え方(詳細は省略)から以下のように計算することが できる。
【0052】
【数12】
【0053】 中間処理部104ではまた、図5に示すステップS16において偶数項におけ るEVENとGの積と、奇数項におけるODDとHの積が求められ、続くステッ プS17において複素数列Y(=EVEN・G+jODD・H)が求められ、次 いで、逆FFT部106により複素数列Yから畳み込み結果yが算出される(ス テップS18)。
【0054】
【数13】 y=F-1{Y} =F-1{EVEN・G}+jF-1{ODD・H} =even*g+jodd*h
【0055】 後処理部107ではyの実数部からeven*gが、また、虚数部からodd *hが取り出され(ステップS19)、ステップS12〜S19の処理を3回行 った後、3回分のeven*gとodd*hが合成され(ステップS20)、そ の和と差を求めることにより高域側信号ADHと低域側信号ADLが求められる (ステップS21)。 次に、従来例と本実施例の演算量について説明する。この演算量は積、および 積和演算の回数で評価すると、
【0056】
【数14】 従来:256*24*2=12288回 実施例:約{1500(FFT)+256*2(畳み込み) +1500(逆FFT)+8*128(ADFf算出) =13608回
【0057】 であり、ADFf算出を加えても従来例と本実施例の演算量はほぼ同等であり、 したがって、FFT処理を追加しても演算量を増加することなくスペクトル情報 を得ることができる。
【0058】 このようにデジタルフィルタをFFT処理により実現することにより入力信号 ADSのFFT係数ADSf(周波数スペクトル)を求めることができ、また、 特にFFT処理を複数回実行してフレームの複数区間に分割したのときのFFT 係数を求めることにより、音声高能率符号化装置では次のような処理に応用する ことができる。
【0059】 (a)入力信号のパワーの急峻な立ち上がり(トランジェント)や定常性を検 出するために用いられ、図8に示すMDエンコーダではフレームの変換長決定部 6により用いられる。例えば入力信号の3つの区間の周波数スペクトル振幅がR 1 〔n〕、R2 〔n〕、R3 〔n〕(n=0〜N−1)が得られる場合、区間パ ワーPi
【0060】
【数15】
【0061】 を求め、P1 、P2 、P3 を比較することにより入力信号のパワーの急峻な立ち 上がりを検出することができる。また、P1 、P2 、P3 の間の相互相関関係係 数等を算出することにより区間による入力信号の相関の関係から波形の定常性等 を評価することができる。
【0062】 (b)入力信号のトーナリティの検出に用いられる。トーナリティとは信号が 正弦波に近いかノイズに近いかの度合いを示す量であり、この量を聴覚心理(図 8参照)を分析する場合に用いることにより、より実際に近い分析を行うことが できる。例えば入力信号の3つの区間の周波数スペクトル振幅がR1 〔n〕、R 2 〔n〕、R3 〔n〕(n=0〜N−1)が得られる場合、各位相をそれぞれΦ 1 〔n〕、Φ2 〔n〕、Φ3 〔n〕とすると、R1 、R2 、Φ1 、Φ2 から予測 される3番目の区間のスペクトルRx 〔n〕、Φx 〔n〕を
【0063】
【数16】 Rx 〔n〕=2・R2 〔n〕−R1 〔n〕 Φx 〔n〕=2・Φ2 〔n〕−Φ1 〔n〕
【0064】 により求め、(R,Φ)平面上の(Rx ,Φx )と(R3 ,Φ3 )との距離を評 価することにより次式により各nにおけるトーナリティt〔n〕を算出すること ができ、このトーナリティt〔n〕を適切に評価することにより聴覚心理分析を 適切に行うことができる。
【0065】
【数17】
【0066】 (c)聴覚心理を分析する場合のマスキング計算等に用いられる。デジタルフ ィルタのみによりサブバンド分割を行い、直交変換を行わないシステムでは、周 波数スペクトルを聴覚心理を分析する場合のマスキング計算等に用いることによ り、より高い精度で聴覚心理を分析することができる。
【0067】
以上説明したように本考案によれば、FFT処理されたデータを逆FFT処理 することによりオーディオ信号をサブバンドに分割するとともに、FFT処理に より得られたFFT係数をスペクトル情報として後段で利用するのでオーディオ 信号をサブバンドに分割する処理の一部がオーディオ信号の周波数スペクトルを 求めるFFT処理を兼用し、したがって、FFT処理を追加した場合に演算量を 増加することなくスペクトル情報を得ることができる。
【図1】本考案に係る音声高能率符号化装置の一実施例
の要部であるデジタルフィルタ兼FFT係数算出部を示
すブロック図である。
の要部であるデジタルフィルタ兼FFT係数算出部を示
すブロック図である。
【図2】図1のデジタルフィルタ兼FFT係数算出部に
より分割される周波数帯域を示す説明図である。
より分割される周波数帯域を示す説明図である。
【図3】図1のデジタルフィルタ兼FFT係数算出部の
畳み込み処理を示す説明図である。
畳み込み処理を示す説明図である。
【図4】図1のデジタルフィルタ兼FFT係数算出部が
256長の信号を3つに分割する処理を示す説明図であ
る。
256長の信号を3つに分割する処理を示す説明図であ
る。
【図5】図1のデジタルフィルタ兼FFT係数算出部の
FFT係数算出処理と帯域分割処理を説明するためのフ
ローチャートである。
FFT係数算出処理と帯域分割処理を説明するためのフ
ローチャートである。
【図6】音声高能率符号化方法を模式的に示す説明図で
ある。
ある。
【図7】図6の音声高能率符号化処理を説明するための
フローチャートである。
フローチャートである。
【図8】従来のMDエンコーダを示すブロック図であ
る。
る。
【図9】図8のデジタルフィルタを詳細に示すブロック
図である。
図である。
【図10】図9のデジタルフィルタにおけるインパルス
応答の概略を示す説明図である。
応答の概略を示す説明図である。
【図11】従来の音声高能率符号化装置を示すブロック
図である。
図である。
【図12】ベクトルの変化量を予測する処理を示す説明
図である。
図である。
101 係数テーブル 102 前処理部 103 FFT部(高速フーリエ変換手段) 104 中間処理部 105 FFT係数出力部(FET係数算出手段) 106 逆FFT部(逆高速フーリエ変換手段) 107 後処理部
Claims (1)
- 【請求項1】 オーディオ信号をサブバンドに分割し、
サブバンド毎に量子化および符号化する音声高能率符号
化装置において、 デジタルフィルタによるサブバンド分割の少なくとも一
部を実現する高速フーリエ変換手段と逆高速フーリエ変
換手段との組み合わせと、 前記高速フーリエ変換手段により処理されたデータから
オーディオ信号のFFT係数を算出するFFT係数算出
手段とを有することを特徴とする音声高能率符号化装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP051660U JPH0716437U (ja) | 1993-08-30 | 1993-08-30 | 音声高能率符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP051660U JPH0716437U (ja) | 1993-08-30 | 1993-08-30 | 音声高能率符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0716437U true JPH0716437U (ja) | 1995-03-17 |
Family
ID=12893039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP051660U Withdrawn JPH0716437U (ja) | 1993-08-30 | 1993-08-30 | 音声高能率符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0716437U (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003228399A (ja) * | 2001-11-30 | 2003-08-15 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置および音響データ配信システム |
-
1993
- 1993-08-30 JP JP051660U patent/JPH0716437U/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003228399A (ja) * | 2001-11-30 | 2003-08-15 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置および音響データ配信システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100958144B1 (ko) | 오디오 압축 | |
KR100283547B1 (ko) | 오디오 신호 부호화 방법 및 복호화 방법, 오디오 신호 부호화장치 및 복호화 장치 | |
CN103765509B (zh) | 编码装置及方法、解码装置及方法 | |
CA2249792C (en) | Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus | |
EP1852851A1 (en) | An enhanced audio encoding/decoding device and method | |
JP2001521648A (ja) | スペクトル帯域複製を用いた原始コーディングの強化 | |
JP3277682B2 (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 | |
US8149927B2 (en) | Method of and apparatus for encoding/decoding digital signal using linear quantization by sections | |
JP3186007B2 (ja) | 変換符号化方法、復号化方法 | |
KR100309727B1 (ko) | 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법 | |
Purat et al. | Audio coding with a dynamic wavelet packet decomposition based on frequency-varying modulated lapped transforms | |
KR100750115B1 (ko) | 오디오 신호 부호화 및 복호화 방법 및 그 장치 | |
JP3087814B2 (ja) | 音響信号変換符号化装置および復号化装置 | |
JP4274614B2 (ja) | オーディオ信号復号方法 | |
JPH0716437U (ja) | 音声高能率符号化装置 | |
RU2409874C9 (ru) | Сжатие звуковых сигналов | |
JP3384523B2 (ja) | 音響信号処理方法 | |
Gunjal et al. | Traditional Psychoacoustic Model and Daubechies Wavelets for Enhanced Speech Coder Performance | |
JP3297750B2 (ja) | 符号化方法 | |
JP2000122676A (ja) | 音楽信号の波形符号化方式 | |
Daudet et al. | Audio representations on overcomplete sets | |
JPH07261799A (ja) | 直交変換符号化装置及び方法 | |
JPH07273656A (ja) | 信号処理方法及び装置 | |
AU2006235812A1 (en) | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks | |
MXPA98010783A (en) | Audio signal encoder, audio signal decoder, and method for encoding and decoding audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19971106 |