JP4281131B2 - 信号符号化装置及び方法、並びに信号復号装置及び方法 - Google Patents

信号符号化装置及び方法、並びに信号復号装置及び方法 Download PDF

Info

Publication number
JP4281131B2
JP4281131B2 JP31978998A JP31978998A JP4281131B2 JP 4281131 B2 JP4281131 B2 JP 4281131B2 JP 31978998 A JP31978998 A JP 31978998A JP 31978998 A JP31978998 A JP 31978998A JP 4281131 B2 JP4281131 B2 JP 4281131B2
Authority
JP
Japan
Prior art keywords
signal
envelope
frame
circuit
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31978998A
Other languages
English (en)
Other versions
JP2000132193A (ja
Inventor
淳 松本
堅一 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP31978998A priority Critical patent/JP4281131B2/ja
Priority to US09/422,250 priority patent/US6353808B1/en
Publication of JP2000132193A publication Critical patent/JP2000132193A/ja
Priority to US09/935,931 priority patent/US6681204B2/en
Priority to US09/935,881 priority patent/US6484140B2/en
Application granted granted Critical
Publication of JP4281131B2 publication Critical patent/JP4281131B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、入力信号を時間軸/周波数軸変換して量子化を行う信号符号化装置及び方法、並びに信号復号装置及び方法に関し、特に、オーディオ信号を高能率符号化する場合に好適な信号符号化装置及び方法、並びに信号復号装置及び方法に関する。
【0002】
【従来の技術】
従来において、オーディオ信号(音声信号や音楽信号を含む)の時間領域や周波数領域における統計的性質と人間の聴感上の特性を利用して信号圧縮を行うような符号化方法が種々知られている。この符号化方法としては、大別して時間領域での符号化、周波数領域での符号化、分析合成符号化等が挙げられる。
【0003】
【発明が解決しようとする課題】
ところで、時間軸の入力信号を周波数軸の信号に直交変換して符号化を行う変換符号化においては、MDCT係数等の周波数軸上の係数についてビット割当を決定した後に量子化を行っているため、時間軸上では量子化誤差が直交変換ブロック長に跨って広がり、いわゆるプリエコー、ポストエコー等の耳障りな雑音となる。この傾向は、特に鋭いアタックを有する楽音や、ピッチピークの間で比較的早い減衰をするような音声に関して顕著なため、従来においては、変換窓長の切換え(いわゆるウィンドウスイッチング)等により対処することが多かった。しかしながら、このような変換窓長の切換えは、どの長さの窓を使用するかの検出等が面倒であり、処理の煩雑化を招くことにもなる。
【0004】
本発明は、このような実情に鑑みてなされたものであり、変換窓幅を変更しなくとも、プリエコー、ポストエコー等の耳障りな雑音を低減できるような信号符号化装置及び方法、並びに信号復号装置及び方法の提供を目的とする。
【0005】
【課題を解決するための手段】
本発明は、上述した課題を解決するために、時間軸上の入力信号に対して符号化の単位となるフレーム毎に直交変換を施して符号化を行う際に、入力信号の上記フレーム内のエンベロープを抽出し、抽出されたエンベロープに基づいて上記入力信号に対してゲイン平滑化を施して上記直交変換に供給するようにし、上記ゲイン平滑化の際には、エンベロープがフレーム内で最大のものと最小のものの比が一定以上である場合のみ、ゲイン平滑化を行う。
【0006】
ここで、上記直交変換は、改良離散コサイン変換(MDCT)により入力された時間軸信号を周波数軸の係数データに変換することが好ましい。また、上記エンベロープ情報を量子化して出力することが好ましい。また、上記フレームを複数のサブフレームに分割した各サブフレーム毎の二乗平均の平方根(rms)値を上記エンベロープとして算出することが好ましく、このサブフレーム毎のrms値を量子化して出力することが好ましい。
【0007】
【発明の実施の形態】
以下、本発明に係る実施の形態について、図面を参照しながら説明する。
図1は、本発明に係る実施の形態となる信号符号化装置の概略構成を示すブロック図である。
【0008】
この図1において、入力端子9には時間軸上の波形信号、例えばディジタルオーディオ信号が入力される。具体的には、例えばサンプリング周波数Fs が16kHzで0〜8kHz程度のいわゆる広帯域音声信号が挙げられるが、これに限定されるものではない。この時間軸入力信号としては、例えば正規化回路(白色化回路)等により、時間波形信号の特徴を抽出して得られた予測残差を入力するようにしてもよい。
【0009】
入力端子9からの信号は、エンベロープ抽出回路17及び窓掛け回路26に送られる。エンベロープ抽出回路17では、後述する直交変換回路であるMDCT(改良離散コサイン変換)回路27における符号化の単位となるフレーム毎に、フレーム内のエンベロープを抽出する。具体的には、例えば、1フレームを複数のサブフレームに分割して、各サブフレーム毎の二乗平均の平方根(rms)値を上記エンベロープとして算出する。このエンベロープ情報は、量子化器20で量子化され、そのインデクス(エンベロープインデクス)が出力端子21より取り出されてデコーダ側に送られる。
【0010】
窓掛け回路26では、1/2フレームオーバーラップによるMDCTのエリアシングキャンセレーションが利用できるような窓関数による窓掛けが施される。窓掛け回路26からの出力は、ゲイン平滑化手段としての割り算器14により、量子化器20で量子化されたエンベロープの値で割り算されて、MDCT回路27に送られる。MDCT回路27で周波数軸上の係数データ(MDCT係数)に変換され、このMDCT係数が量子化回路部40で量子化され、そのインデクスが出力端子51より取り出されてデコーダ側に送られる。なお、直交変換はMDCTに限定されない。
【0011】
このような構成により、時間軸方向のノイズシェイピングが行われ、変換窓長を切り換えなくとも、プリエコー等の耳につきやすい量子化雑音を低減することができる。
【0012】
この図1の信号符号化装置は、ハードウェア構成として示しているが、いわゆるDSP(ディジタル信号プロセッサ)等を用いてソフトウェア的に実現することも可能である。
【0013】
次に、図2を参照しながら、上述した本発明の実施の形態のより具体的な構成例としてのオーディオ信号符号化装置について説明する。
【0014】
この図2に示すオーディオ信号符号化装置は、供給された時間軸信号を、直交変換部25で例えばMDCT(改良離散コサイン変換)により時間軸/周波数軸変換(T/F変換)を施して周波数軸上のデータ(MDCT係数)とし、これを係数量子化部40で量子化することで符号化を行うものであるが、この実施の形態においては、直交変換の前の時間軸信号に対して、LPC分析、ピッチ分析、エンベロープ抽出等により入力信号波形の特徴を抽出し、これらの特徴を表すパラメータは別途量子化して取り出すようにし、正規化(白色化)回路部11においてこれらの特徴を除去、あるいは信号の相関性を除去することで、白色雑音に近い、いわゆるノイズライクな信号とすることで、符号化効率を高めている。
【0015】
また、直交変換後の係数データの量子化の際のビット割当(ビットアロケーション)の決定には、上記LPC分析で求められたLPC係数、ピッチ分析で求められたピッチパラメータを用いている。この他、周波数軸上で臨界帯域(クリティカルバンド)毎のピーク値やrms値等を取り出して正規化ファクタとするバークスケールファクタを用いてもよい。これらのLPC係数、ピッチパラメータ、バークスケールファクタにより、MDCT係数のような直交変換係数データに対する量子化時の重みを算出し、これにより全帯域のビット割当を決定して係数量子化を行う。量子化時の重み決定が、予め規定されたパラメータによってなされる場合、例えば上記LPC係数、ピッチパラメータ、バークスケールファクタのみによってなされる場合には、これらのパラメータのみをデコーダ側に伝送するだけで、エンコーダ側と全く同じビット割当(ビットアロケーション)が再現されるため、ビット割当そのものに関する付加情報(サイドインフォメーション)を送る必要がなくなる。
【0016】
さらに、係数量子化の際には、上記量子化時の重みあるいは割当ビット数に従った順序で係数データを並べ替え(ソート)し、順に精度の高い量子化を行うようにしている。この量子化は、ソートされた係数を先頭から順にサブベクトルに区切り、それぞれベクトル量子化を行うことが好ましい。ソートについては、全帯域の係数データに対して行ってもよいが、いくつかの帯域に区切って、それぞれの帯域の範囲内毎にソートするようにしてもよい。この場合も、ビット割当に用いられるパラメータが予め規定されていれば、そのパラメータを送るだけで、ビット割当情報やソートされた係数の位置情報等を直接送らなくても、ビット割当やソート順序等をデコーダ側で再現できる。
【0017】
図2において、入力端子10には、例えば、0〜8kHz程度のいわゆる広帯域音声信号をサンプリング周波数Fs =16kHzでA/D変換したディジタルオーディオ信号が供給されている。この入力信号は、正規化(白色化)回路部11のLPC逆フィルタ12に送られると共に、例えば1024サンプルずつ切り出され、LPC分析・量子化部30に送られている。このLPC分析・量子化部30では、ハミング窓かけをした上で、20次程度のLPC係数、すなわちαパラメータを算出し、LPC逆フィルタ11によりLPC残差を求めている。このLPC分析の際には、分析の単位となる1フレーム1024サンプルの内の一部サンプル、例えば1/2の512サンプルを次のブロックとオーバーラップさせており、フレームインターバルは512サンプルとなっている。これは、後段の直交変換として採用されているMDCT(改良離散コサイン変換)のエリアシングキャンセレーションを利用するためである。このLPC分析・量子化部30では、LPC係数であるαパラメータをLSP(線スペクトル対)パラメータに変換して量子化したものを伝送するようにしている。
【0018】
LPC分析回路32からのαパラメータは、α→LSP変換回路33に送られて、線スペクトル対(LSP)パラメータに変換される。これは、直接型のフィルタ係数として求まったαパラメータを、例えば20個、すなわち10対のLSPパラメータに変換する。変換は例えばニュートン−ラプソン法等を用いて行う。このLSPパラメータに変換するのは、αパラメータよりも補間特性に優れているからである。
【0019】
α→LSP変換回路33からのLSPパラメータは、LSP量子化器34によりベクトル量子化あるいはマトリクス量子化される。このとき、フレーム間差分をとってからベクトル量子化、あるいは、複数フレーム分をまとめてマトリクス量子化してもよい。
【0020】
このLSP量子化器34からの量子化出力、すなわちLSPベクトル量子化のインデクスは、端子31を介して取り出され、また量子化済みのLSPベクトルあるいは逆量子化出力は、LSP補間回路36及びLSP→α変換回路38に送られる。
【0021】
LSP補間回路36は、LSP量子化器34で上記フレーム毎にベクトル量子化されたLSPのベクトルの前フレームと現フレームとの組を補間し、後の処理で必要となるレートにするためのものであり、この例では、8倍のレートに補間している。
【0022】
このような補間が行われたLSPベクトルを用いて入力音声の逆フィルタリングを実行するために、LSP→α変換回路37により、LSPパラメータを例えば20次程度の直接型フィルタの係数であるαパラメータに変換する。このLSP→α変換回路37からの出力は、上記LPC残差を求めるためのLPC逆フィルタ回路12に送られ、このLPC逆フィルタ12では、8倍のレートで更新されるαパラメータにより逆フィルタリング処理を行って、滑らかな出力を得るようにしている。
【0023】
また、LSP量子化回路34からの1倍レートのLSP係数は、LSP→α変換回路38に送られてαパラメータに変換され、上述したようなビット割当を行わせるためのビット割当算出回路(ビットアロケーション決定回路)41に送られる。ビット割当算出回路41では、割当ビットの他に、後述するMDCT係数の量子化に使用する重みw(ω) の計算も行っている。
【0024】
正規化(白色化)回路部11のLPC逆フィルタ12からの出力は、長期予測であるピッチ予測のためのピッチ逆フィルタ13及びピッチ分析回路15に送られる。
【0025】
次に、長期予測について説明する。長期予測は、ピッチ分析により求められたピッチ周期あるいはピッチラグ分だけ時間軸上でずらした波形を元の波形から減算してピッチ予測残差を求めることにより行っており、この例では3点ピッチ予測によって行っている。なお、ピッチラグとは、サンプリングされた時間軸データのピッチ周期に対応するサンプル数のことである。
【0026】
すなわち、ピッチ分析回路15では1フレームに1回の割合、すなわち分析長が1フレームでピッチ分析が行われ、ピッチ分析結果の内のピッチラグはピッチ逆フィルタ13及びビット割当算出回路41に送られ、ピッチゲインはピッチゲイン量子化器16に送られる。また、ピッチ分析回路15からのピッチラグインデクスは端子52から取り出されてデコーダ側に送られる。
【0027】
ピッチゲイン量子化器16では、上記3点予測に対応する3点でのピッチゲインがベクトル量子化され、コードブックインデクス(ピッチゲインインデクス)が出力端子53より取り出され、代表値ベクトルあるいは逆量子化出力がピッチ逆フィルタ13に送られる。ピッチ逆フィルタ13は、上記ピッチ分析結果に基づいて3点ピッチ予測されたピッチ予測残差を出力する。このピッチ予測残差は、割り算回路14及びエンベロープ抽出回路17にそれぞれ送られている。
【0028】
上記ピッチ分析についてさらに説明すると、このピッチ分析においては、上記LPC残差を用いピッチパラメータを抽出する。ピッチパラメータは、ピッチラグ、ピッチゲインにより構成される。
【0029】
まず、ピッチラグを決定する。上記LPC残差の中央部を例えば512サンプル切り出し、x(n) (n=0〜511)とし、と表記する。からkサンプル過去の512サンプルを k とすると、ピッチkは、
−g k2
を最小にするものとして与えられる。すなわち、
g=( k)/‖ k2
として、
k2/‖ k2
を最大にするkをサーチすることで、最適ラグKを決定できる。本実施の形態では、Kは、12≦K≦240である。このKをそのまま使用するか、あるいは過去のフレームのピッチラグを用いたトラッキングの結果を用いてもよい。このようにして決定したKについて、次に3点(K,K−1,K+1)での最適ピッチゲインを求める。すなわち、
−(g-1 L+1+g0 L+g1 L-1)‖2
を最小にする g-1,g0,g1 を求め、最適ラグKに対する3点ピッチゲインとする。この3点ピッチゲインはピッチゲイン量子化器16に送られて、まとめてベクトル量子化され、また、量子化されたピッチゲイン及び最適ラグKを用いてピッチ逆フィルタ13を構成し、これによりピッチ残差を求める。求まったピッチ残差は既に求められている過去のピッチ残差と連結され、後述するようにMDCT変換される。このとき、MDCT変換前に時間軸ゲインコントロールを行ってもよい。
【0030】
ここで、図3は、入力信号に対する上記LPC分析処理及びピッチ分析処理の関係を示しており、1フレームFRが例えば1024サンプルの分析長は、後述するMDCT変換ブロックに対応した長さとなっている。時刻t1 が現在の新しいLPC分析中心(LSP1) を示し、時刻t0 が1フレーム前のLPC分析中心(LSP0) を示している。現在フレームの後半は新しいデータ(new data)ND、前半は前データ(previous data)PD であり、図中のaはLSP0 とLSP1 の補間により得られるLPC残差を、bは1フレーム前のLPC残差を、cはこの部分(bの後半+aの前半)をターゲットとするピッチ分析より得られる新しいピッチ残差を、dは過去のピッチ残差をそれぞれ示している。この図3における新しいデータNDが全て入力された時点で、データaを求めることができ、このaと、既に求められているbとを用いて新しいピッチ残差cを算出でき、これと既に求められているピッチ残差dとをつなぎ合わせることで、直交変換すべき1フレームのデータFRが作成できる。この1フレームFRのデータをMDCT等の直交変換処理することができる。
【0031】
次に、図4は、LPC分析に基づくLPC逆フィルタ及びピッチ分析に基づくピッチ逆フィルタを介すことによる時間軸信号の変化を、また図5は、LPC逆フィルタ及びピッチ逆フィルタを介すことによる信号の周波数軸上での変化をそれぞれ示している。すなわち、図4の(A)は入力信号波形を、図5の(A)はその周波数スペクトルを示し、これにLPC分析に基づくLPC逆フィルタを介すことにより、波形の特徴が抽出され除去されて、図4の(B)に示すようなほぼ周期的なパルス状の時間軸波形(LPC残差波形)となる。このLPC残差波形に対応する周波数上のスペクトルは、図5の(B)のようになる。このLPC残差に対して上述したようなピッチ分析に基づくピッチ逆フィルタを介すことにより、ピッチ成分が抽出されて除去され、図4の(C)に示すような白色雑音に近い(ノイズライクな)時間軸信号になり、その周波数軸上のスペクトルは図5の(C)のようになる。
【0032】
さらに、本発明の実施の形態においては、正規化(白色化)回路部11において、フレーム内データのゲインの平滑化を行っている。これは、フレーム内の時間軸波形(本実施の形態ではピッチ逆フィルタ13からの残差)から、エンベロープ抽出回路17によりエンベロープを抽出し、抽出されたエンベロープを、スイッチ19を介してエンベロープ量子化器20に送り、量子化されたエンベロープの値により上記時間軸波形(ピッチ逆フィルタ13からの残差)を割り算器14で割り込むことにより、時間軸で平滑化された信号を得ている。この割り算器14からの信号が、正規化(白色化)回路部11の出力として、次段の直交変換回路部25に送られる。
【0033】
この平滑化により、量子化後の直交変換係数を時間信号に逆変換したときの量子化誤差の大きさをオリジナル信号のエンベロープに追従させる、いわゆるノイズシェイピングが実現できる。
【0034】
上記エンベロープ抽出回路17におけるエンベロープ抽出について説明する。このエンベロープ抽出回路17に供給される信号、すなわち上記LPC逆フィルタ12及びピッチ逆フィルタ13により正規化処理された残差信号を、x(n),n=0〜N−1(Nは上記1フレームFRのサンプル数、直交変換窓長、例えばN=1024)とするとき、この変換窓長Nより短い長さM、例えばM=N/8の窓で切り出された各サブブロックあるいはサブフレーム毎のrms(二乗平均の平方根)値をエンベロープとしている。すなわち、正規化された各サブブロック(サブフレーム)のrmsとして、i番目のサブブロック(i=0〜M−1)のrmsi は、次の式(1)により定義される。
【0035】
【数1】
Figure 0004281131
【0036】
上記式(1)により求められるrmsi の各iについて、スカラ量子化を施し、あるいはrmsi 全体を1つのベクトルとしてベクトル量子化を行うことができる。本実施の形態では、エンベロープ量子化器20においてベクトル量子化を行っており、そのインデクスは時間軸ゲインコントロールのためのパラメータ、すなわちエンベロープインデクスとして端子21より取り出され、デコーダ側に伝送される。
【0037】
このようにして量子化された各サブブロック(サブフレーム)毎のrmsi をqrmsi とし、この値により上記入力残差信号x(n)を割り算器14にて割り込むことにより、時間軸で平滑化された信号xs(n) を得る。ただし、このようにして求めたrmsi の内、フレーム内で最大のものと最小のものとの比が、ある一定の値(例えば4)以上のとき、上述したゲインコントロールを行い、パラメータ(上記エンベロープインデクス)の量子化のために所定のビット数(例えば7ビット)を割り当てているが、フレーム内の各サブブロック(サブフレーム)毎のrmsi の比が上記一定の値よりも小さいときにはゲインコントロールを行わない通常の処理を行い、ゲインコントロールのためのビットは、他のパラメータ、例えば周波数軸パラメータ(直交変換係数データ)の量子化に割り当てられる。このゲインコントロールを行うか否かの判別は、ゲインコントロールオン/オフ決定回路18により行われ、その判別出力(ゲインコントロールSW)は、エンベロープ量子化器20の入力側のスイッチ19のスイッチング制御信号として送られるとともに、後述する係数量子化部40内の係数量子化回路45に送られて、ゲインコントロールがオンのときとオフのときの係数の割当ビット数の切り換えに使用される。また、このゲインコントロールオン/オフ判別出力(ゲインコントロールSW)は、端子22を介して取り出され、デコーダ側に送られる。
【0038】
割り算器41でゲインコントロール(あるいはゲイン圧縮)されて時間軸で平滑化された信号xs(n) は、正規化回路部11の出力として、直交変換回路部25に送られ、例えばMDCTにより周波数軸パラメータ(係数データ)に変換される。この直交変換回路部25は、窓掛け回路26とMDCT回路27とから成る。窓掛け回路26では、1/2フレームオーバーラップによるMDCTのエリアシングキャンセレーションが利用できるような窓関数による窓掛けが施される。
【0039】
デコーダ側での復号の際には、伝送された周波数軸パラメータ(例えばMDCT係数)の量子化インデクスから逆量子化を行い、その後、周波数軸/時間軸変換である逆直交変換により時間軸信号に戻され、その後、逆量子化された上記時間軸ゲインコントロールパラメータを用いて、オーバーラップ加算、及びエンコード時のゲイン平滑化の逆の処理(ゲイン伸長、あるいはゲイン復元処理)を行うわけであるが、ゲイン平滑化を用いた場合には、通常の対称かつ重畳位置の窓の値の二乗和が一定値になるような窓を仮定したオーバーラップ加算は使用できないため、次のよう処理が必要とされる。
【0040】
すなわち、図6は、デコーダ側でのオーバーラップ加算及びゲインコントロールの様子を示す図であり、この図6において、w(n),n=0〜N−1、は分析・合成窓を示し、g(n)は時間軸ゲインコントロールパラメータ、すなわち、
g(n) = qrmsj (jは、jM≦n≦(j+1)M を満足)
であり、g1(n) は現フレームFR1 のg(n)、g0(n) は1フレーム過去(前フレームFR0) のg(n)とする。また、この図6では、1フレームを8分割してサブブロック(サブフレーム)SBとしている(M=8)。
【0041】
前フレームFR0 の後半のデータに対し、エンコーダ側ではゲインコントロールのためのg0(n+(N/2))による除算後、MDCTのための分析窓w((N/2)-1-n) がかかっているため、デコーダ側で逆MDCT後、再び分析窓w((N/2)-1-n) をかけて得られる信号、すなわち、主成分とエリアシング(aliasing)成分との和P(n)は、次の式(2)のようになる。
【0042】
【数2】
Figure 0004281131
【0043】
また、現フレームFR1 の前半のデータに対し、エンコーダ側では、ゲインコントロールのためのg0(n)による除算後、MDCTのための分析窓w(n)がかかっているため、デコーダ側で逆MDCT後、再び分析窓w(n)をかけて得られる信号、すなわち、主成分とエリアシング成分との和Q(n)は、次の式(3)のようになる。
【0044】
【数3】
Figure 0004281131
【0045】
従って、再生すべきx(n)は、次の式(4)として求められる。
【0046】
【数4】
Figure 0004281131
【0047】
このような窓掛けを行い、上記サブブロック(サブフレーム)毎のrmsをエンベロープとしてゲインコントロールを行うことにより、時間変化の激しい音、例えば鋭いアタックを有する楽音や、ピッチピークの間で比較的早い減衰をするような音声に対して、プリエコーのような耳につきやすい量子化雑音を低減することができる。
【0048】
次に、直交変換回路部25のMDCT回路27でMDCT処理されて得られたMDCT係数データは、係数量子化部40のフレームゲイン正規化回路43及びフレームゲイン算出・量子化回路47に送られる。本実施の形態の係数量子化部40では、先ず上記MDCT変換ブロックである1フレームの係数全体のフレームゲイン(ブロックゲイン)を算出してゲイン正規化を行った後、さらに聴覚に合わせて高域ほどバンド幅を広くしたサブバンドである臨界帯域(クリティカルバンド)に分割して、それぞれのバンド毎のスケールファクタ、いわゆるバークスケールファクタを算出し、これによって再び正規化を行っている。上記バークスケールファクタとしては、各帯域毎にその帯域内の係数のピーク値や、あるいは二乗平均の平方根(rms)等を用いることができ、各バンドのバークスケールファクタはまとめてベクトル量子化される。
【0049】
すなわち、係数量子化部40のフレームゲイン算出・量子化回路47では、上記MDCT変換ブロックであるフレーム毎のゲインが算出されて量子化され、そのコードブックインデクス(フレームゲインインデクス)が端子55を介して取り出されてデコーダ側に送られると共に、量子化された値のフレームゲインがフレームゲイン正規化回路43に送られて、入力をフレームゲインで割ることによる正規化が行われる。このフレームゲインで正規化された出力は、バークスケールファクタ算出・量子化回路42及びバークスケールファクタ正規化回路44に送られる。
【0050】
バークスケールファクタ算出・量子化回路42では、上記各臨界帯域毎のバークスケールファクタが算出されて量子化され、コードブックインデクス(バークスケールファクタインデクス)が端子54を介して取り出されてデコーダ側に送られると共に、量子化された値のバークスケールファクタがビット割当算出回路41及びバークスケールファクタ正規化回路44に送られる。バークスケールファクタ正規化回路44では、上記臨界帯域毎に帯域内の係数の正規化が行われ、バークスケールファクタで正規化された係数が係数量子化回路45に送られる。
【0051】
係数量子化回路45では、ビット割当算出回路41からのビット割当情報に従って各係数に量子化ビット数が割り当てられて量子化が行われ、このとき、上述したゲインコントロールオン/オフ決定回路18からのゲインコントロールSW情報に応じて全体の割当ビット数の切換が行われる。これは、例えばベクトル量子化を行う場合には、上記ゲインコントロールオン時用と、オフ時用との2組のコードブックを用意しておき、上記ゲインコントロールSW情報に応じてこれらのコードブックを切り換えるようにすればよい。
【0052】
ここで、ビット割当算出回路41におけるビット割当(ビットアロケーション)について説明すると、上述のようにして求められたLPC係数、ピッチパラメータ、バークスケールファクタ等により、各MDCT係数に対する量子化時の重みを算出し、これにより全帯域のMDCT係数のビット割当を決定して量子化を行う。この重みは、ノイズシェイピングファクタと考えることができ、また、各パラメータを変更することで所望のノイズシェイピング特性を持たせることが可能である。一例として、本実施の形態においては、次の式に示すように、LPC係数、ピッチパラメータ、及びバークスケールファクタのみを用いて、重みW(ω)を算出している。
【0053】
【数5】
Figure 0004281131
【0054】
このように量子化時の重み決定は、LPC、ピッチ、バークスケールファクタのみによってなされるため、この3種類のパラメータのみをデコーダに伝送すれば、エンコーダと全く同じビットアロケーションが再現され、アロケーションの一情報等は一切送る必要はなくなり、サイドインフォメーション(補助情報)のレートを下げることができる。
【0055】
次に、係数量子化回路45での量子化の具体例について、図7〜図9を参照しながら説明する。
【0056】
図7は、図2の係数量子化回路45の具体的な構成の一例を示すものであり、入力端子1には、図2のバークスケールファクタ正規化回路44からの正規化された係数データ(例えばMDCT係数)yが供給されている。重み計算回路2は、図2のビット割当算出回路41にほぼ相当するが、量子化ビットを割り当てるための各係数の重みを計算する部分のみを取り出したものである。この重み計算回路2では、上述したLPC係数、ピッチパラメータ、バークスケールファクタ等のパラメータに基づいて重みwが計算される。ここで、1フレーム分の係数をベクトル、1フレーム分の重みをベクトルで表すものとする。
【0057】
これらの係数ベクトル、重みベクトルを、必要に応じてバンド分割回路3に送ることにより、L個(L≧1)のバンドに分割する。バンド数としては、例えば低域、中域、高域の3バンド程度(L=3)が挙げられるが、これに限定されず、またバンド分割しなくてもよい。この各バンド毎の係数、例えば第k番目のバンドの係数を k、 重みを k (0≦k≦L−1)とするとき、
=( 0, 1,..., L-1
=( 0, 1,..., L-1
となる。このバンド分割のバンド数や各バンド毎の係数の個数は、予め設定された数値に固定されている。
【0058】
次に、各バンドの係数ベクトル 0, 1,..., L-1 をそれぞれソート回路40,41,...,4L-1 に送って、各バンド毎に、それぞれのバンド内の係数に対して、重みの順に従って順位をつける。これは、各バンド内の係数自体を、重みの順に従って並び替え(ソート)すればよいが、各係数の周波数軸上での位置あるいは順番を表す指標(インデクス)のみを重みの順にソートして、ソートされた指標(インデクス)に対応して各係数の量子化時の精度(割当ビット数等)を決定するようにしてもよい。係数自体をソートする場合には、任意の第k番目のバンドについて、係数ベクトル k の各係数を重みの順にソートし、重み順にソートされた係数ベクトル'kを得る。
【0059】
図8は、このソートの様子を示したものであり、図8の(A)は第kバンドの重みベクトル k を、図8の(B)は第kバンドの係数ベクトル k をそれぞれ示している。この図8の例においては、第k番目のバンド内の要素数を例えば8としており、重みベクトル k の各要素となる8個の重みをw1,w2,...,w8 、係数ベクトル k の各要素となる8個の係数をy1,y2,...,y8 にてそれぞれ表している。図8の(A)、(B)の例においては、係数y3 に対応する重みw3 が最も大きく、以下重みの順に、w2,w6,...,w4 となっている。図8の(C)は、この重みの順に係数y1,y2,...,y8 を並べ替え(ソート)して、順にy3,y2,y6,...,y4 とした係数ベクトル'kを示している。
【0060】
次に、上述のように各バンド毎に重みの順に従ってソートされた各バンドの係数ベクトル'0,'1,...,'L-1 をそれぞれベクトル量子化器50,51,...,5L-1 に送って、それぞれベクトル量子化を行う。ここで、各バンド毎の割当ビット数を予め固定しておき、バンド毎のエネルギが変化しても各バンドへの量子化ビット数の割当が変動することを防止することが好ましい。
【0061】
このバンド毎のベクトル量子化について、1つのバンド内の要素数が多い場合には、いくつかのサブベクトルに区切って、各サブベクトル毎にベクトル量子化すればよい。すなわち、任意の第kバンドのソート後の係数ベクトル'kを、図9に示すように、予め定めた要素数に従っていくつかのサブベクトルに区切り、例えば3つのサブベクトル'k1,'k2,'k3 とし、これらをそれぞれベクトル量子化して、コードブックインデクスck1,ck2,ck3を得るようにすればよい。この第kバンドのインデクスck1,ck2,ck3をまとめて係数インデクスのベクトル k とする。ここで、サブベクトルの量子化においては、先頭側のベクトルほど量子化ビット数を多く割り当てることで、重みに従った量子化となる。これは、例えば図9において、ベクトル'k1 を8ビット、ベクトル'k2 を6ビット、ベクトル'k3 を8ビット、のように割り当てることにより、係数1個当たりの割り当てビット数が多いものから順に少なくなり、重みに従ったビット割当が実現できることになる。
【0062】
次に、図7の各ベクトル量子化器50,51,...,5L-1 からの各バンド毎の係数インデクスのベクトル 0, 1,..., L-1 をまとめて、全バンドの係数インデクスのベクトルとし、端子6から取り出している。この端子6は、図2の端子51に相当する。
【0063】
なお、上記図7〜図9の具体例では、直交変換された周波数軸上の係数(例えばMDCT係数)自体を、上記重みに従ってソートし、ソートされた係数の順序に従って割当ビット数を多いものから少なくするようにして(ソート後の順位の上位側の係数ほど多くのビットを割り当てて)いるが、直交変換されて得られた各係数の周波数軸上での位置あるいは順番を表す指標(インデクス)のみを上記重みの順にソートして、ソートされた指標(インデクス)に対応して各係数の量子化時の精度(割当ビット数等)を決定するようにしてもよい。また、上述した具体例では、係数の量子化としてベクトル量子化を用いているが、スカラ量子化、あるいはスカラ量子化とベクトル量子化とを併用するような量子化に本発明を適用することも容易である。
【0064】
次に、上述した図2に示すようなオーディオ信号符号化装置(エンコーダ側)に対応するオーディオ信号復号装置(デコーダ側)の構成の一例について、図10を参照しながら説明する。
【0065】
この図10において、各入力端子60〜67には上記図2の各出力端子からのデータが供給されており、図10の入力端子60には、上記図2の出力端子51からの直交変換係数(例えばMDCT係数)のインデクスが供給されている。入力端子61には、図2の出力端子31からのLSPインデクスが供給され、入力端子62〜65には、図2の各出力端子52〜55からのデータ、すなわち、ピッチラグインデクス、ピッチゲインインデクス、バークスケールファクタインデクス、フレームゲインインデクスがそれぞれ供給され、入力端子66、67には、図2の各出力端子21、22からのエンベロープインデクス、ゲインコントロールSWがそれぞれ供給されている。
【0066】
入力端子60からの係数インデクスは、係数逆量子化回路71で逆量子化され、掛け算器73を介して、例えばIMDCT(逆MDCT)等の逆直交変換回路74に送られる。
【0067】
入力端子61からのLSPインデクスは、LPCパラメータ再生部80の逆量子化器81に送られてLSPデータに逆量子化され、LSP→α変換回路82及びLSP補間回路83に送られる。LSP→α変換回路82からのαパラメータ(LPC係数)は、ビット割当回路72に送られる。LSP補間回路83からのLSPデータは、LSP→α変換回路84でαパラメータ(LPC係数)に変換され、後述するLPC合成回路77に送られる。
【0068】
ビット割当回路72には、LSP→α変換回路82からの上記LPC係数の他に、入力端子62からのピッチラグと、入力端子63から逆量子化器91を介して得られたピッチゲインと、入力端子64から逆量子化器92を介して得られたバークスケールファクタとが供給されており、これらのパラメータのみに基づいて、エンコーダ側と同一のビット割当を再現することができる。ビット割当回路72からのビット割当情報は、係数逆量子化器71に送られて、各係数の量子化割当ビットの決定に使用される。
【0069】
入力端子65からのフレームゲインインデクスは、フレームゲイン逆量子化器86に送られて逆量子化され、得られたフレームゲインが掛け算器73に送られる。
【0070】
入力端子66からのエンベロープインデクスは、スイッチ87を介してエンベロープ逆量子化器88に送られて逆量子化され、得られたエンベロープデータがオーバーラップ加算回路75に送られる。また、入力端子67からのゲインコントロールSW情報は、上記係数逆量子化器71及びオーバーラップ加算回路75に送られると共に、スイッチ87の制御信号として用いられる。記係数逆量子化器71は、上述したようなゲインコントロールのオン/オフに応じて、全体の割当ビット数を切り換えており、逆ベクトル量子化の場合には、ゲインコントロールのオン時のコードブックとオフ時のコードブックとを切り換えるようにしてもよい。
【0071】
オーバラップ加算回路75は、IMDCT等の逆直交変換回路74からの上記フレーム毎に時間軸に戻された信号を、1/2フレームずつオーバーラップさせながら加算するものであり、ゲインコントロールのオン時には、上記エンベロープ逆量子化器88からのエンベロープデータによるゲインコントロール(上述したゲイン伸長あるいはゲイン復元)処理しながらオーバーラップ加算する。
【0072】
オーバラップ加算回路75からの時間軸信号は、ピッチ合成回路76に送られて、ピッチ成分が復元される。これは、図2のピッチ逆フィルタ13での処理の逆処理に相当するものであり、端子62からのピッチラグ及び逆量子化器91からのピッチゲインが用いられる。
【0073】
ピッチ合成回路76からの出力は、LPC合成回路77に送られて、図2のLPC逆フィルタ12での処理の逆の処理に対応するLPC合成処理が施され、出力端子78より取り出される。
【0074】
ここで、上記エンコーダ側の係数量子化部40の係数量子化回路45として、上記図7に示すような重みに従って各バンド毎にソートされた係数をベクトル量子化するものを用いる場合には、係数逆量子化回路71として、図11に示すような構成を用いることができる。
【0075】
この図11において、入力端子60は上記図10の入力端子60に相当し、上記係数インデクス(MDCT係数等の直交変換係数が量子化されることで得られたコードブックインデクス)が供給され、重み計算回路79には、図10のLSP→α変換回路82からのαパラメータ(LPC係数)、入力端子62からのピッチラグ、逆量子化器91からのピッチゲイン、逆量子化器92からのバークスケールファクタ等が供給されている。重み計算回路79は、図10のビット割当回路72中の、量子化ビット割当の計算途中に求められる各係数の重みを算出するまでの構成部分を取り出したものである。この重み計算回路79では、上述したように、上記式(5)の計算により、上記LPC係数、ピッチパラメータ(ピッチラグ及びピッチゲイン)、及びバークスケールファクタのみを用いて、重みW(ω)を計算している。入力端子93には、周波数軸上の係数の位置あるいは順番を示す指標(インデクス)、すなわち全帯域でN個の係数データがある場合には、0〜N−1の数値(これをベクトルとする)が供給されている。なお、重み計算回路79からの上記N個の各係数に対するN個の重みをベクトルで表す。
【0076】
重み計算回路79からの重み及び入力端子93からの指標は、バンド分割回路94に送られて、エンコーダ側と同様にL個のバンドに分割される。エンコーダ側で例えば低域、中域、高域の3バンド(L=3)に分割されていれば、デコーダ側でも同じく3バンドに分割する。これらのバンド分割された各バンド毎の指標及び重みは、それぞれソート回路950,951,...,95L-1 に送られる。例えば第k番目のバンド内の指標 k 及び重み k は、第k番目のソート回路95k に送られる。ソート回路95k では、第k番目のバンド内の指標 k が、各係数の重み k の順序に従って並べ替え(ソート)され、ソートされた指標'k が出力される。各ソート回路950,951,...,95L-1 からのそれぞれのバンド毎にソートされた指標 0, 1,..., L-1 は、係数再構成回路97に送られる。
【0077】
また、図10の入力端子60からの直交変換係数のインデクスは、エンコーダ側で量子化される際に、上記図7〜図9と共に説明したように、Lバンドにバンド分割され、各バンド毎に重み順にソートされた係数が、1つのバンド内で予め定められた規則に基づく個数毎に区切られたサブベクトル毎にベクトル量子化されて得られたものである。具体的には、L個のバンドについて、それぞれのバンド毎の係数インデクスの集合をそれぞれベクトル 0, 1,..., L-1 としたものであり、これらの各バンドの係数インデクスのベクトル 0, 1,..., L-1 が、それぞれ逆量子化器960,951,...,95L-1 に送られている。これらの逆量子化器960,951,...,95L-1 で逆量子化されて得られた係数データは、各バンド内で上記重みの順にソートされているもの、すなわち上記図7の各ソート回路40,41,...,4L-1 からの係数ベクトル'0,'1,...,'L-1 に相当するものであり、配列順序は周波数軸上の位置とは異なっている。そこで、係数の時間軸上での位置を表す指標を上記重みに従って先にソートしておき、このソートされた指標と、上記逆量子化されて得られた係数データとを対応させて、元の時間軸上の順序に戻すのが係数再構成回路97の機能である。すなわち、係数再構成回路97では、各逆量子化器960,951,...,95L-1 からの、各バンド内で重み順にソートされた係数データに対して、各ソート回路950,951,...,95L-1 からのそれぞれのバンド毎にソートされた指標を対応させ、このソートされた指標に従って逆量子化された係数データを並べ替える(逆ソートする)ことにより、元の時間軸上の順序に並んだ係数データを得て、出力端子98より取り出している。この出力端子98からの係数データは、図10の掛け算器73に送られる。
【0078】
次に、図12は、上記図1のエンコーダ側構成に対応するデコーダ側の基本構成を示す図である。
【0079】
この図12において、入力端子60には上記係数インデクスが、入力端子66には上記エンベロープインデクスが、それぞれ供給されている。入力端子60からの係数インデクスは、逆量子化回路71で逆量子化され、IMDCT回路で逆MDCT処理(逆直交変換処理)されて、オーバーラップ加算回路75に送られる。入力端子66からのエンベロープインデクスは、逆量子化器88で逆量子化され、エンベロープ情報がオーバーラップ加算回路75に送られる。オーバーラップ加算回路75では、上記図1でのゲイン平滑化(割り算器14でのエンベロープ情報による入力信号の割り込み)の逆の処理を施しながらオーバーラップ加算して、端子89より連続的な時間軸信号を出力する。この端子89からの信号は、上記図10のピッチ合成回路76に送られる。
【0080】
このような処理によって、時間軸方向のノイズシェイピングが行われ、変換窓長を切り換えなくとも、プリエコー等の耳につきやすい量子化雑音を低減することができる。
【0081】
すなわち、図13及び図14は、実際の例として、カスタネットの音を符号化したときの再生信号波形を示し、図13が上記ゲインコントロール無しを、図14が上記ゲインコントロール有りをそれぞれ示している。これらの図13及び図14から明らかなように、上記ゲインコントロールを適用することにより、アタック前のノイズ(いわゆるプリエコー)が大幅に低減していることが確認できる。
【0082】
また、図15及び図16は、音声信号の一部として、スピーチバーストの開始部分を示しており、図15が時間軸信号波形を、図16が周波数軸のスペクトラムをそれぞれ示している。これらの図15、図16において、曲線aが上記ゲインコントロール有りの場合を、曲線(図中の破線)bが上記ゲインコントロール無しの場合にそれぞれ対応する。これらの曲線a,bを比較すると、特に図16の周波数スペクトラムから明らかなように、ゲインコントロール有りの曲線aの方がピッチ構造がより明確に現れており、良好な再生が行えていることが確認できる。
【0083】
なお、本発明は上記実施の形態のみに限定されるものではなく、例えば、入力時間軸信号は音声や音楽を含むオーディオ信号以外に、電話帯域の音声信号や、ビデオ信号等でもよい。また、正規化回路部11の構成や、LPC分析及びピッチ分析は、これらに限定されず、線形予測あるいは非線形予測等により時間軸入力波形の特徴あるいは相関性を抽出して除去する種々の構成がとり得る。また、各量子化器には、ベクトル量子化以外にも、スカラ量子化や、スカラ量子化とベクトル量子化とを併用するようにしてもよい。
【0084】
【発明の効果】
以上の説明から明らかなように、本発明によれば、時間軸上の入力信号に対して符号化の単位となるフレーム毎に直交変換を施して符号化を行う際に、入力信号の上記フレーム内のエンベロープを抽出し、抽出されたエンベロープに基づいて上記入力信号に対してゲイン平滑化を施して上記直交変換に供給しているため、従来のように変換窓長を切り換えなくとも、プリエコーやポストエコー等の耳につきやすい量子化雑音を低減することができる。
【0085】
また、エンベロープ情報を量子化してデコーダ側に送ると共に、量子化されたエンベロープ値でゲイン平滑化を施すことにより、デコーダ側でのゲイン復元がより正確に行える。
【0086】
また、上記直交変換として、改良離散コサイン変換(MDCT)を用いることにより、良好な音質でのオーディオ信号の高能率符号化が行える。
【図面の簡単な説明】
【図1】本発明の実施の形態の概略構成を示すブロック図である。
【図2】本発明の実施の形態のより具体的な構成例であるオーディオ信号符号化装置を示すブロック図である。
【図3】入力信号に対するLPC分析処理及びピッチ分析処理の関係を示す図である。
【図4】時間軸入力信号のLPC分析及びピッチ分析による相関性の除去を説明するための時間軸信号波形図である。
【図5】時間軸入力信号のLPC分析及びピッチ分析による相関性の除去を説明するための周波数特性を示す図である。
【図6】デコーダ側でのオーバーラップ加算を説明するための時間軸信号波形図である。
【図7】係数量子化回路の具体的構成の一例を示すブロック図である。
【図8】バンド分割された1つのバンド内の係数の重みに応じたソートを説明するための図である。
【図9】バンド分割された1つのバンド内で重みに応じてソートされた係数をサブベクトルに区切ってベクトル量子化する処理を説明するための図である。
【図10】図2のオーディオ信号符号化装置に対応する復号側構成としてのオーディオ信号復号装置の一例を示すブロック図である。
【図11】図10のオーディオ信号復号装置の逆量子化回路の一具体例を示すブロック図である。
【図12】図1のエンコーダ側構成に対応するデコーダ側の基本構成を示す図である。
【図13】ゲインコントロール無しのときのカスタネットの音を符号化したときの再生信号波形を示す波形図である。
【図14】ゲインコントロール有りのときのカスタネットの音を符号化したときの再生信号波形を示す波形図である。
【図15】音声信号の一部としてのスピーチバーストの開始部分の時間軸信号波形を示す波形図である。
【図16】音声信号の一部としてのスピーチバーストの開始部分の周波数スペクトラムを示す図である。
【符号の説明】
11 正規化回路部、 12 LPC逆フィルタ、 13 ピッチ逆フィルタ、 15 ピッチ分析回路、 16 ピッチゲイン量子化回路、 17 エンベロープ抽出回路、 18 ゲインコントロールオン/オフ決定回路、 20 エンベロープ量子化回路、 25 直交変換回路部、 26窓掛け回路、 27 MDCT回路、 30 LPC分析・量子化部、 32 LPC分析回路、 33 α→LSP変換回路、 34 LSP量子化回路、 36 LSP補間回路、 37,38 LSP→α変換回路、 40 係数量子化回路部、 41 ビット割当算出回路、 42 バークスケールファクタ算出・量子化回路、 43フレームゲイン正規化回路、 44 バークスケールファクタ正規化回路、 45 係数量子化回路、 47 フレームゲイン算出・量子化回路

Claims (12)

  1. 時間軸上の入力信号に対して符号化の単位となるフレーム毎に直交変換手段により直交変換を施して符号化を行う信号符号化装置において、
    上記入力信号の上記フレーム内のエンベロープを抽出するエンベロープ抽出手段と、
    このエンベロープ抽出手段により抽出されたエンベロープに基づいて上記入力信号に対してゲイン平滑化を施して上記直交変換手段に供給するゲイン平滑化手段とを有し、
    上記ゲイン平滑化手段は、エンベロープがフレーム内で最大のものと最小のものの比が一定以上である場合のみ、ゲイン平滑化を行う
    信号符号化装置。
  2. 上記エンベロープ抽出手段からのエンベロープ情報を量子化して出力し、この量子化されたエンベロープにより上記ゲイン平滑化を施請求項1記載の信号符号化装置。
  3. 上記エンベロープ抽出手段は、上記フレームを複数のサブフレームに分割した各サブフレーム毎の二乗平均の平方根(rms)値を上記エンベロープとして算出す請求項1記載の信号符号化装置。
  4. 上記各サブフレーム毎のrms値を量子化して出力し、この量子化されたサブフレーム毎のrms値により上記ゲイン平滑化を施請求項3記載の信号符号化装置。
  5. 上記直交変換手段は、改良離散コサイン変換(MDCT)により入力された時間軸信号を周波数軸の係数データに変換す請求項1記載の信号符号化装置。
  6. 上記直交変換手段の前に正規化手段を挿入接続し、
    この正規化手段は、上記入力信号をLPC分析して得られたLPC係数に基づき上記入力信号のLPC予測残差を出力するLPC逆フィルタと、上記LPC予測残差をピッチ分析して得られたピッチパラメータに基づき上記LPC予測残差のピッチの相関性を除去するピッチ逆フィルタとを有す請求項1記載の信号符号化装置。
  7. 上記量子化手段は、上記LPC分析結果及び上記ピッチ分析結果に基づいて決定される割当ビット数に従って量子化を行請求項6記載の信号符号化装置。
  8. 時間軸上の入力信号に対して符号化の単位となるフレーム毎に直交変換を施して符号化を行う信号符号化方法において、
    上記入力信号の上記フレーム内のエンベロープを抽出するエンベロープ抽出工程と、
    このエンベロープ抽出工程により抽出されたエンベロープに基づいて上記入力信号に対してゲイン平滑化を施して上記直交変換に供給するゲイン平滑化工程とを有し、
    上記ゲイン平滑化工程では、エンベロープがフレーム内で最大のものと最小のものの比が一定以上である場合のみ、ゲイン平滑化を行う
    信号符号化方法。
  9. 上記エンベロープ抽出工程は、上記フレームを複数のサブフレームに分割した各サブフレーム毎の二乗平均の平方根(rms)を上記エンベロープとして算出す請求項8記載の信号符号化方法。
  10. 上記直交変換は、改良離散コサイン変換(MDCT)により入力された時間軸信号を周波数軸の係数データに変換す請求項8記載の信号符号化方法。
  11. 時間軸上の入力信号に対して符号化の単位となるフレーム毎にエンベロープを抽出し、抽出されたエンベロープに基づいて上記入力信号に対してゲイン平滑化を施し、ゲイン平滑化された信号に対して直交変換を施して符号化された符号化データが供給され、この符号化データを復号する信号復号装置において、
    上記ゲイン平滑化では、エンベロープがフレーム内で最大のものと最小のものの比が一定以上である場合のみ、ゲイン平滑化が行われ、
    上記符号化データを逆直交変換する逆直交変換手段と、
    この逆直交変換された信号に対して上記ゲイン平滑化の逆の処理を施しながらオーバーラップ加算して連続的な時間軸信号を出力するオーバーラップ加算手段とを有し、
    上記オーバーラップ加算手段は、上記逆直交変換された信号が上記ゲイン平滑化が行われた信号である場合にのみ上記ゲイン平滑化の逆の処理を施す
    信号復号装置。
  12. 時間軸上の入力信号に対して符号化の単位となるフレーム毎にエンベロープを抽出し、抽出されたエンベロープに基づいて上記入力信号に対してゲイン平滑化を施し、ゲイン平滑化された信号に対して直交変換を施して符号化された符号化データが供給され、この符号化データを復号する信号復号方法において、
    上記ゲイン平滑化では、エンベロープがフレーム内で最大のものと最小のものの比が一定以上である場合のみ、ゲイン平滑化が行われ、
    上記符号化データを逆直交変換する逆直交変換工程と、
    この逆直交変換された信号に対して上記ゲイン平滑化の逆の処理を施しながらオーバーラップ加算して連続的な時間軸信号を出力するオーバーラップ加算工程とを有し、
    上記オーバーラップ加算工程では、上記逆直交変換された信号が上記ゲイン平滑化が行われた信号である場合にのみ上記ゲイン平滑化の逆の処理を施す
    信号復号方法。
JP31978998A 1998-10-22 1998-10-22 信号符号化装置及び方法、並びに信号復号装置及び方法 Expired - Fee Related JP4281131B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP31978998A JP4281131B2 (ja) 1998-10-22 1998-10-22 信号符号化装置及び方法、並びに信号復号装置及び方法
US09/422,250 US6353808B1 (en) 1998-10-22 1999-10-21 Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
US09/935,931 US6681204B2 (en) 1998-10-22 2001-08-23 Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
US09/935,881 US6484140B2 (en) 1998-10-22 2001-08-23 Apparatus and method for encoding a signal as well as apparatus and method for decoding signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31978998A JP4281131B2 (ja) 1998-10-22 1998-10-22 信号符号化装置及び方法、並びに信号復号装置及び方法

Publications (2)

Publication Number Publication Date
JP2000132193A JP2000132193A (ja) 2000-05-12
JP4281131B2 true JP4281131B2 (ja) 2009-06-17

Family

ID=18114209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31978998A Expired - Fee Related JP4281131B2 (ja) 1998-10-22 1998-10-22 信号符号化装置及び方法、並びに信号復号装置及び方法

Country Status (1)

Country Link
JP (1) JP4281131B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4008244B2 (ja) * 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
JP4816115B2 (ja) * 2006-02-08 2011-11-16 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP5403949B2 (ja) * 2007-03-02 2014-01-29 パナソニック株式会社 符号化装置および符号化方法
DE602008005250D1 (de) * 2008-01-04 2011-04-14 Dolby Sweden Ab Audiokodierer und -dekodierer
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
KR101820028B1 (ko) * 2013-08-23 2018-02-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오버랩 범위 내의 결합을 사용하여 오디오 신호를 처리하기 위한 장치 및 방법
MX371223B (es) * 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing

Also Published As

Publication number Publication date
JP2000132193A (ja) 2000-05-12

Similar Documents

Publication Publication Date Title
US6353808B1 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
JP5688852B2 (ja) オーディオコーデックポストフィルタ
US6708145B1 (en) Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting
US5749065A (en) Speech encoding method, speech decoding method and speech encoding/decoding method
EP0858067B1 (en) Multichannel acoustic signal coding and decoding methods and coding and decoding devices using the same
JP3234609B2 (ja) 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化
US20090204397A1 (en) Linear predictive coding of an audio signal
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR20060131782A (ko) 최적의 다중 부호화 방법
JP3765171B2 (ja) 音声符号化復号方式
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPH07261800A (ja) 変換符号化方法、復号化方法
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3248668B2 (ja) ディジタルフィルタおよび音響符号化/復号化装置
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
EP0852375B1 (en) Speech coder methods and systems
JP3684751B2 (ja) 信号符号化方法及び装置
JP3353267B2 (ja) 音響信号変換符号化方法及び復号化方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
JPH0736484A (ja) 音響信号符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090309

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120327

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130327

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140327

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees