JPH09127994A - 信号符号化方法及び装置 - Google Patents

信号符号化方法及び装置

Info

Publication number
JPH09127994A
JPH09127994A JP7302198A JP30219895A JPH09127994A JP H09127994 A JPH09127994 A JP H09127994A JP 7302198 A JP7302198 A JP 7302198A JP 30219895 A JP30219895 A JP 30219895A JP H09127994 A JPH09127994 A JP H09127994A
Authority
JP
Japan
Prior art keywords
signal
frequency
band
pitch
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7302198A
Other languages
English (en)
Inventor
Shiro Omori
士郎 大森
Masayuki Nishiguchi
正之 西口
Atsushi Matsumoto
淳 松本
Kazuyuki Iijima
和幸 飯島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7302198A priority Critical patent/JPH09127994A/ja
Publication of JPH09127994A publication Critical patent/JPH09127994A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 任意の周波数から任意の周波数幅のサブバン
ドを作り、サンプリング周波数を低下させて、アプリケ
ーションに柔軟に対応できるようにする。 【解決手段】 端子101からの入力信号から、LPF
(ローパスフィルタ)102及び減算器106により高
域側信号を取り出し、この信号をFFT(高速フーリエ
変換)回路161によりFFT処理して周波数軸上の信
号に変換し、周波数シフト回路162により周波数軸上
で他の位置又は他の帯域にシフトさせ、逆FFT回路1
63により逆直交変換して時間軸上の信号に変換し、逆
直交変換された時間軸上の信号に対して符号化を施すこ
とにより、低いサンプリング周波数で符号化処理を施す
ことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、広帯域音声信号の
ような入力信号を符号化する信号符号化方法及び装置に
関し、特に、入力音声信号を帯域分割して得られた各帯
域の信号のサンプリング周波数を下げて符号化処理する
ような信号符号化方法及び装置に関する。
【0002】
【従来の技術】オーディオ信号(音声信号や音響信号を
含む)の時間領域や周波数領域における統計的性質と人
間の聴感上の特性を利用して信号圧縮を行うような符号
化方法が種々知られている。この符号化方法としては、
大別して時間領域での符号化、周波数領域での符号化、
分析合成符号化等が挙げられる。
【0003】音声信号等の高能率符号化の例として、ハ
ーモニック(Harmonic)符号化、MBE(Multiband Ex
citation: マルチバンド励起)符号化等のサイン波分析
符号化や、SBC(Sub-band Coding:帯域分割符号
化)、LPC(Linear Predictive Coding: 線形予測符
号化)、あるいはDCT(離散コサイン変換)、MDC
T(モデファイドDCT)、FFT(高速フーリエ変
換)等が知られている。
【0004】
【発明が解決しようとする課題】ところで、処理する対
象となる信号を、狭帯域に帯域制限した信号と、広帯域
のままの信号との両者を多重化して符号化処理する場合
等には、帯域分割が不可欠である。
【0005】これには、いわゆるサブバンドコーディン
グ法が一般的に知られているが、従来においては、フィ
ルタバンクを通した各帯域の時間領域信号をそのまま処
理するか、あるいは該時間領域信号に対して直交変換を
施し周波数軸上で各帯域に分割して周波数領域で処理す
るか、あるいはいわゆるQMFフィルタを用いて全帯域
を例えば1/2のべき乗に幅の帯域に分割しサブサンプ
リングを行い低域に変換した時間領域信号を処理してい
た。
【0006】しかし、上記帯域分割は、任意の周波数
で、任意の周波数幅の帯域を取り出し、これを低域側に
変換して、かつ時間領域で処理を行うためになされる処
理であるが、この目的で行われる帯域分割処理として
は、上述した3種類のサブバンドコーディング法の何れ
も適さない。
【0007】すなわち、QMFフィルタを用いた方法で
は帯域分割できる場所と幅とに制限がある上に、量子化
誤差が大きい低ビットレートの信号では復号化時に折り
返しノイズをキャンセルすることができない。さらに、
この方法では、処理を軽減してビットレートを抑えるた
めに可能な限りサンプリング周波数を下げたいため、時
間領域信号をそのまま処理するのには、好ましくない方
法である。また、音声の生成モデルを利用するために、
時間領域での処理を行うことが望まれる。
【0008】ここで、例えば元の信号(広帯域信号)を
サンプリング周波数が16kfsで、帯域幅が0〜7.5
kHzであるものとし、この信号を帯域制限した狭帯域信
号をサンプリング周波数が8kfsで帯域幅が0〜3.8
kHzであるものとして、上記広帯域信号を符号化し、復
号化時にはビットストリームの一部を取り出せば、狭帯
域信号としても再生できる場合を考える。
【0009】この場合、高域側は3.8〜7.5kHzが
割り当てられることになり、さらにこれを時間領域で処
理すること自体が、従来の手法において困難であった。
【0010】本発明は、このような実情に鑑みてなされ
たものであり、任意の周波数から任意の周波数幅のサブ
バンドを作成し帯域分割することが可能であり、かつ時
間領域での処理が可能である信号符号化方法及び信号符
号化装置を提供することを目的とする。
【0011】
【課題を解決するための手段】本発明に係る信号符号化
方法は、上述した課題を解決するために、入力信号の内
の少なくとも1つの帯域を取り出し、取り出された少な
くとも1つの帯域の信号を周波数軸上の信号に直交変換
し、直交変換された信号を周波数軸上で他の位置又は他
の帯域にシフトさせ、周波数軸上でシフトされた信号を
逆直交変換して時間軸上の信号に変換し、逆直交変換さ
れた時間軸上の信号に対して符号化を施すことを特徴と
している。
【0012】また、本発明に係る信号符号化装置は、上
述した課題を解決するために、入力信号の内の少なくと
も1つの帯域を取り出す帯域抽出手段と、抽出された少
なくとも1つの帯域の信号を周波数軸上の信号に変換す
る直交変換手段と、直交変換された信号を周波数軸上で
(他の位置に、他の帯域に)シフトさせるシフト手段
と、周波数軸上でシフトされた信号を逆直交変換して時
間軸上の信号に変換する逆直交変換手段と、逆直交変換
された時間軸上の信号に対して符号化を施す手段とを有
することを特徴としている。
【0013】
【発明の実施の形態】以下、本発明に係る好ましい実施
の形態について説明する。先ず、図1は、本発明に係る
信号符号化方法の実施の形態が適用された広帯域音声信
号の符号化装置を示している。
【0014】ここで、図1の符号化装置の基本的な考え
方は、入力信号を複数の帯域に分割して、分割された帯
域毎の信号に対してそれぞれの帯域の信号特性に応じた
互いに異なる符号化を施すものである。具体的には、広
帯域の入力音声信号を複数の帯域、例えば音声として充
分な明瞭度を得られる電話帯域と、この電話帯域よりも
高域側の帯域とに分割している。低域側の電話帯域の信
号については、LPC(線形予測符号化)分析等の短期
予測の後にピッチ予測等の長期予測を行った上で直交変
換を施し、この変換後の係数を聴覚重み付けベクトル量
子化しており、また、LPC係数等の短期予測係数を表
現するパラメータ、ピッチやピッチゲイン等の長期予測
に関連した情報についても量子化している。電話帯域よ
りも高域の信号については、短期予測したものをそのま
ま時間軸上でベクトル量子化している。
【0015】また、高域側の信号については、周波数軸
上でシフトして低域に移動させ、狭帯域の信号として取
り扱うようにしている。
【0016】さらに、上記直交変換としてMDCT(モ
ディファイド離散コサイン変換)を用い、このときの変
換長を短くすることでベクトル量子化の重み付けを容易
に行い、さらにこの変換長を2N 、すなわち2のべき乗
の大きさにすることでFFT(高速フーリエ変換)を用
いた高速化を可能としている。また、上記短期予測の残
差を算出し、直交変換係数をベクトル量子化する際の重
み算出するためのLPC係数は(ポストフィルタについ
ても)、現フレーム内で求められたものと過去のフレー
ムで求められたものとを滑らかに補間したものを用い、
各分析サブフレームで最適なLPC係数を用いている。
また、上記長期予測を行う場合、1フレームに複数回の
予測又は補間を行い、それらのピッチラグ、ピッチゲイ
ンをそのまま、あるいは差分をとった上で量子化し、あ
るいは補間方法を示すフラグを伝送している。さらに、
予測回数(頻度)の増加に対して、分散の小さくなる予
測残差について、それらの直交変換係数の差を量子化す
るマルチステージ(多段)ベクトル量子化を行うか、あ
るいは分割された帯域の内、ある1つの帯域に対するパ
ラメータのみを用い、1つのエンコードビットストリー
ムの全体あるいは一部分により、レートの異なる複数の
デコード動作を可能としている。
【0017】以下、図1を参照しながら説明する。図1
の入力端子101には、例えばサンプリング周波数Fs
が16kHzで0〜8KHz程度の広帯域音声信号が供給さ
れている。この入力端子101からの広帯域音声信号
は、ローパスフィルタ102及び減算器106により低
域側、例えば0〜3.8kHz程度のいわゆる電話帯域の
信号と、高域側、例えば3.8kHz〜8kHzの信号とに
帯域分割される。低域側は、サンプリング周波数変換器
103により、サンプリング定理を満たす範囲で間引く
ことにより、例えば8kHzサンプリングの信号にしてお
く。
【0018】低域側での処理としては、先ず、LPC分
析・量子化部130により、例えば1ブロック256サ
ンプル程度の分析長によりハミング窓かけをした上で、
10次程度のLPC係数、すなわちαパラメータを算出
し、LPC逆フィルタ111によりLPC残差を求めて
いる。このLPC分析の際には、分析の単位となる1ブ
ロック256サンプルの内の96サンプルを次のブロッ
クとオーバーラップさせることにより、フレーム間隔す
なわちフレームインターバルは160サンプルとなる。
このフレーム間隔は、8kHzサンプリングで20msec
になる。また、このLPC分析・量子化部130では、
LPC係数であるαパラメータをLSP(線スペクトル
対)パラメータに変換して量子化したものを伝送するよ
うにしている。
【0019】すなわち、LPC分析・量子化部130に
おいて、サンプリング周波数変換器103からの低域側
信号が入力されるLPC分析回路132は、入力信号波
形の256サンプル程度の長さを1ブロックとしてハミ
ング窓をかけて、自己相関法により線形予測係数、いわ
ゆるαパラメータを求めている。データ出力の単位とな
るフレーミングの間隔は、例えば160サンプルで20
msec である。
【0020】LPC分析回路132からのαパラメータ
は、α→LSP変換回路133に送られて、線スペクト
ル対(LSP)パラメータに変換される。これは、直接
型のフィルタ係数として求まったαパラメータを、例え
ば10個、すなわち5対のLSPパラメータに変換す
る。変換は例えばニュートン−ラプソン法等を用いて行
う。このLSPパラメータに変換するのは、αパラメー
タよりも補間特性に優れているからである。
【0021】α→LSP変換回路133からのLSPパ
ラメータは、LSP量子化器134によりベクトル量子
化あるいはマトリクス量子化される。このとき、フレー
ム間差分をとってからベクトル量子化、あるいは、複数
フレーム分をまとめてマトリクス量子化してもよい。こ
こでは、20msec を1フレームとし、20msec 毎に
算出されるLSPパラメータを2フレーム分まとめてマ
トリクス量子化している。
【0022】このLSP量子化器134からの量子化出
力、すなわちLSPベクトル量子化のインデクスは、端
子131を介して取り出され、また量子化済みのLSP
ベクトルあるいは逆量子化出力は、LSP補間回路13
6に送られる。
【0023】LSP補間回路136は、LSP量子化器
134で上記20msec 毎にベクトル量子化されたLS
Pのベクトルの前フレームと現フレームとの組を補間
し、後の処理で必要となるレートにするためのものであ
り、この例では、8倍のレートと5倍のレートにしてい
る。8倍レートでは、2.5msec 毎にLSPベクトル
が更新されるようにする。これは、残差波形を分析合成
処理すると、その合成波形のエンベロープは非常になだ
らかでスムーズな波形になるため、LPC係数が20m
sec 毎に急激に変化すると異音を発生することがあるか
らである。すなわち、2.5msec 毎にLPC係数が徐
々に変化してゆくようにすれば、このような異音の発生
を防ぐことができる。
【0024】このような補間が行われた2.5msec 毎
のLSPベクトルを用いて入力音声の逆フィルタリング
を実行するために、LSP→α変換回路137により、
LSPパラメータを例えば10次程度の直接型フィルタ
の係数であるαパラメータに変換する。このLSP→α
変換回路137からの出力は、上記LPC残差を求める
ためのLPC逆フィルタ回路111に送られ、このLP
C逆フィルタ111では、2.5msec 毎に更新される
αパラメータにより逆フィルタリング処理を行って、滑
らかな出力を得るようにしている。
【0025】また、LSP補間回路136で5倍レート
で補間された4msec 毎のLSP係数は、LSP→α変
換回路138に送られてαパラメータに変換され、MD
CT係数の量子化に使用する重み計算のためのVQ(ベ
クトル量子化)重み計算回路139に送られる。
【0026】LPC逆フィルタ111からの出力は、長
期予測であるピッチ予測のためのピッチ逆フィルタ11
2及び122に送られる。
【0027】次に、長期予測について説明する。長期予
測は、ピッチ分析により求められたピッチ周期あるいは
ピッチラグ分だけ時間軸上でずらした波形を元の波形か
ら減算してピッチ予測残差を求めることにより行ってお
り、この例では3点ピッチ予測によって行っている。な
お、ピッチラグとは、サンプリングされた時間軸データ
のピッチ周期に対応するサンプル数のことである。
【0028】すなわち、ピッチ分析回路115では1フ
レームに1回の割合、すなわち分析長が1フレームでピ
ッチ分析が行われ、ピッチ分析結果の内のピッチラグL
1 はピッチ逆フィルタ112及び出力端子142に送ら
れ、ピッチゲインはピッチゲインVQ(ベクトル量子
化)回路116に送られる。ピッチゲインVQ回路11
6では、上記3点予測に対応する3点でのピッチゲイン
がベクトル量子化され、コードブックインデクスg1
出力端子143より取り出され、代表値ベクトルあるい
は逆量子化出力がピッチ逆フィルタ115、減算器11
7、加算器127にそれぞれ送られる。ピッチ逆フィル
タ112は、上記ピッチ分析結果に基づいて3点ピッチ
予測されたピッチ予測残差を出力する。このピッチ予測
残差は、直交変換手段である例えばMDCT回路113
に送られ、MDCT処理された後、VQ(ベクトル量子
化)回路114により聴覚重み付けベクトル量子化され
る。このVQ回路114では、VQ重み計算回路139
からの出力により聴覚重み付けされたベクトル量子化が
施され、その出力であるインデクスIdxVq1は、出力端子
141より取り出される。
【0029】またこの例においては、予測精度を高める
ために、さらに別系統のピッチ予測系となるピッチ逆フ
ィルタ122、ピッチ分析回路124及びピッチゲイン
VQ回路126を設けている。すなわち、上記各ピッチ
分析中心の中間位置にも分析中心を置くようにして、ピ
ッチ分析回路125により1/2フレーム周期で分析を
行うようにしている。ピッチ分析回路125からのピッ
チラグL2 はピッチ逆フィルタ122及び出力端子14
5に、ピッチゲインはピッチゲインVQ(ベクトル量子
化)回路126にそれぞれ送られる。ピッチゲインVQ
回路126では、3点のピッチゲインベクトルをベクト
ル量子化して量子化出力であるピッチゲインのインデク
スg2 を出力端子144に送り、その代表ベクトルある
いは逆量子化出力を減算器117に送っている。ここ
で、元のフレーム周期の分析中心の位置でのピッチゲイ
ンは、ピッチゲインVQ回路116からのピッチゲイン
に近い値と考えられるから、この位置でのピッチゲイン
については、ピッチゲインVQ回路116、126から
の各逆量子化出力の差を減算器117でとって、これを
ピッチゲインVQ回路118でベクトル量子化して得ら
れるピッチゲイン差分のインデクスg1dを出力端子14
6に送っている。このピッチゲイン差分の代表ベクトル
あるいは逆量子化出力を、加算器127に送り、ピッチ
ゲインVQ回路126からの代表ベクトルあるいは逆量
子化出力と加算したものをピッチゲインとしてピッチ逆
フィルタ122に送っている。なお、出力端子143か
ら得られるピッチゲインのインデクスg2 は、上記中間
位置でのピッチゲインのインデクスである。ピッチ逆フ
ィルタ122からのピッチ予測残差は、MDCT回路1
23でMDCT処理され、これが減算器128に送られ
て、VQ(ベクトル量子化)回路114からの代表ベク
トルあるいは逆量子化出力が減算され、その差分がVQ
回路124に送られてベクトル量子化され、インデクス
IdxVq2が出力端子147に送られる。このVQ回路は、
VQ重み計算回路139からの出力により聴覚重み付き
のベクトル量子化を施す。
【0030】次に、高域側の信号処理について説明す
る。
【0031】この高域側の信号処理は、基本的に、入力
信号を帯域分割し、分割された少なくとも1つの高域側
の信号を低域側に周波数変換し、低域側に変換された信
号のサンプリングレートを低下させて、サンプリングレ
ートが低下させられた信号を予測符号化するようにして
いる。
【0032】図1の入力端子101に供給された広帯域
信号が減算器106に入力され、この広帯域信号から、
LPF(ローパスフィルタ)102により取り出された
低域側の信号、例えば0〜3.8kHz程度のいわゆる電
話帯域の信号、が差し引かれる。これによって、減算器
106からは、高域側の信号、例えば3.8kHz〜8k
Hzの信号が出力される。ただし、現実のLPF102の
特性等により、減算器106からの出力には、3.8k
Hz以下の成分もわずかながら残っており、高域側の信号
処理は、3.5kHz以上、あるいは3.4kHz以上の成
分に対して行うようにしている。
【0033】この高域側の信号は、減算器106からの
例えば3.5kHz〜8kHzの4.5kHzの周波数幅を持
つが、ダウンサンプリング等により周波数を低域側にシ
フトあるいは変換して信号処理を行うため、例えば4k
Hz幅まで狭めることが必要とされる。ここで、後の低域
側との合成を考慮し、3.5kHz〜4kHz付近は聴感上
敏感であるので、ここをカットせずに、音声信号の性質
として成分あるいはパワーも少なく聴感上影響の少ない
7.5kHz〜8kHzの0.5kHz分をLPFあるいはB
PF(バンドパスフィルタ)107によりカットする。
【0034】次に、低域側への周波数変換を行うが、こ
の例では、直交変換手段、例えばFFT(高速フーリエ
変換)回路161を用いて周波数軸上のデータに変換
し、この周波数軸上のデータを周波数シフト回路162
によりシフトした後、逆直交変換手段である逆FFT回
路164により逆FFT処理することにより実現してい
る。
【0035】逆FFT回路164からは、入力信号の高
域側の例えば3.5kHz〜7.5kHzの信号が、0〜4
kHzの低域側に変換された信号が取り出される。この信
号はサンプリング周波数が8kHzで表現できるので、ダ
ウンサンプリング回路164によりダウンサンプリング
してサンプリング周波数8kHzの3.5kHz〜7.5k
Hzの帯域の信号とする。このダウンサンプリング回路1
64からの出力は、LPC逆フィルタ171及びLPC
分析・量子化部180のLPC分析回路182にそれぞ
れ送られる。
【0036】LPC分析・量子化部180は、上記低域
側のLPC分析・量子化部130とほぼ同様な構成を有
しているため、簡単に説明する。
【0037】すなわち、LPC分析・量子化部180に
おいて、ダウンサンプリング回路164からの低域変換
された信号が入力されるLPC分析回路182は、入力
信号波形の256サンプル程度の長さを1ブロックとし
てハミング窓をかけて、例えば自己相関法により線形予
測係数、いわゆるαパラメータを求めている。LPC分
析回路182からのαパラメータは、α→LSP変換回
路183に送られて、線スペクトル対(LSP)パラメ
ータに変換される。α→LSP変換回路183からのL
SPパラメータは、LSP量子化器184によりベクト
ル量子化あるいはマトリクス量子化される。このとき、
フレーム間差分をとってからベクトル量子化してもよ
い。あるいは、複数フレーム分をまとめてマトリクス量
子化してもよい。ここでは、20msec を1フレームと
し、20msec 毎に算出されるLSPパラメータをベク
トル量子化している。
【0038】このLSP量子化器184からの量子化出
力、すなわち高域側信号のLSPベクトル量子化のイン
デクスLSPidxH は、端子181を介して取り出され、ま
た量子化済みのLSPベクトルあるいは逆量子化出力
は、LSP補間回路186に送られる。
【0039】LSP補間回路186は、LSP量子化器
184で上記20msec 毎にベクトル量子化されたLS
Pのベクトルの前フレームと現フレームとの組を補間
し、後の処理で必要となるレートにするためのものであ
り、この例では、4倍のレートにしている。
【0040】このような補間が行われた5msec 毎のL
SPベクトルを用いて入力音声の逆フィルタリングを実
行するために、LSP→α変換回路187により、LS
PパラメータをLPC合成フィルタの係数であるαパラ
メータに変換する。このLSP→α変換回路187から
の出力は、上記LPC残差を求めるためのLPC逆フィ
ルタ回路171に送られ、このLPC逆フィルタ171
では、5msec 毎に更新されるαパラメータにより逆フ
ィルタリング処理を行って、滑らかな出力を得るように
している。
【0041】LPC逆フィルタ171からのLPC予測
残差出力は、LPC残差VQ(ベクトル量子化)回路1
72に送られてベクトル量子化され、その出力であるL
PC残差のインデクスLPCidxが出力端子173より取り
出される。
【0042】以上のような構成の信号符号化装置におい
て、低域側の一部構成を独立したコーデックの符号化装
置としたり、あるいは出力されるビットストリームの全
体と一部とを切り換えることにより、ビットレートの異
なる信号伝送やデコードを可能としている。
【0043】すなわち、図1の構成の各出力端子からの
全てのデータを伝送するとき、伝送ビットレートは16
kbps (kビット/秒)となり、一部端子からのデータ
を伝送することにより6kbps の伝送ビットレートとな
る。
【0044】あるいは、図1の全ての端子からの16k
bps の全データを伝送、すなわち送信あるいは記録し、
受信あるいは再生側で16kbps の全データをデコード
することにより、16kbps の高品質の音声信号が得ら
れ、6kbps のデータをデコードすることにより、簡単
なデコーダで6kbps に応じた品質の音声信号が得られ
る。
【0045】ここで、図1の構成においては、出力端子
131、141〜143からの出力データが6kbps の
データに相当し、さらに出力端子144〜147、17
3、181からの出力データを加えることで、16kbp
s の全データが得られる。
【0046】次に、上記図1の信号符号化装置に対応す
る信号復号化装置について、図2を参照しながら説明す
る。
【0047】この図2において、入力端子200には、
上記図1の出力端子131からの出力に相当するLSP
のベクトル量子化出力、いわゆるコードブックのインデ
クスLSPidxが供給されている。
【0048】このLSPのインデクスLSPidxは、LPC
パラメータ再生部240のLSPの逆VQ(逆ベクトル
量子化)回路241に送られてLSP(線スペクトル
対)データに逆ベクトル量子化あるいは逆マトリクス量
子化され、LSP補間回路242に送られてLSPの補
間処理が施された後、LSP→α変換回路243でLP
C(線形予測符号)係数であるαパラメータに変換さ
れ、このαパラメータがLPC合成フィルタ215、2
25及びピッチスペクトラルポストフィルタ216、2
26に送られる。
【0049】また、図4の入力端子201、202、2
03には、上記図1の各出力端子141、142、14
3からのMDCT係数のベクトル量子化のインデクスIs
xVq1、ピッチラグL1 、ピッチゲインg1 がそれぞれ供
給されている。
【0050】入力端子201からのMDCT係数のベク
トル量子化のインデクスIsxVq1は、逆VQ(逆ベクトル
量子化)回路211に供給されて逆ベクトル量子化さ
れ、逆MDCT回路212により逆MDCT処理された
後、重畳加算(オーバーラップアッド)回路213で重
畳加算され、ピッチ合成フィルタ214に送られる。ピ
ッチ合成回路214には、各入力端子202、203か
らのピッチラグL1 、ピッチゲインg1 が供給されてい
る。このピッチ合成回路214で、上記図1のピッチ逆
フィルタ112でのピッチ予測符号化の逆処理が施され
た後、LPC合成フィルタ215に送られ、LPC合成
処理が施される。このLPC合成された出力は、ピッチ
スペクトラルポストフィルタ216に送られて、ポスト
フィルタ処理が施され、出力端子219より6kbps の
ビットレートに対応する音声信号として取り出される。
【0051】図4の入力端子204、205、206及
び207には、上記図1の各出力端子144、145、
146及び147からのMDCT係数のベクトル量子化
のピッチゲインg2 、ピッチラグL2 、インデクスIsxV
q2及びピッチゲインg1dがそれぞれ供給されている。
【0052】入力端子207からのMDCT係数のベク
トル量子化のインデクスIsxVq2は、逆VQ回路220に
供給されて逆ベクトル量子化され、加算器221に送ら
れて逆VQ回路211からの逆ベクトル量子化されたM
DCT係数と加算され、逆MDCT回路222により逆
MDCT処理された後、重畳加算(オーバーラップアッ
ド)回路223で重畳加算され、ピッチ合成フィルタ2
14に送られる。このピッチ合成フィルタ224には、
各入力端子202、204、205からのピッチラグL
1 、ピッチゲインg2 、ピッチラグL2 が供給されると
共に、入力端子203からのピッチゲインg1 と入力端
子206からのピッチゲインg1dとが加算器217で加
算されたものが供給されている。このピッチ合成フィル
タ224でピッチ残差の合成処理が施された後、LPC
合成フィルタ225に送られ、LPC合成処理が施され
る。このLPC合成された出力は、ピッチスペクトラル
ポストフィルタ226に送られて、ポストフィルタ処理
が施され、アップサンプリング回路227に送られてサ
ンプリング周波数が例えば8kHzから16kHzにアップ
サンプリングされた後、加算器228に送られる。
【0053】さらに、入力端子207には、図1の出力
端子181からの高域側のLSPインデクスLSPidxH
供給されており、このLSPのインデクスLSPidxH は、
LPCパラメータ再生部245のLSPの逆VQ(逆ベ
クトル量子化)回路246に送られてLSPデータに逆
ベクトル量子化され、LSP補間回路247に送られて
LSPの補間処理が施された後、LSP→α変換回路2
48でLPC係数のαパラメータに変換され、このαパ
ラメータが高域側LPC合成フィルタ232に送られ
る。
【0054】入力端子209には、図1の出力端子17
3からの高域側のLPC残差のベクトル量子化出力であ
るインデクスLPCidxが供給されて、高域逆VQ回路23
1で逆ベクトル量子化され、高域側LPC合成フィルタ
232に送られる。高域側LPC合成フィルタ232で
LPC合成処理された出力は、アップサンプリング回路
233でサンプリング周波数が例えば8kHzから16k
Hzにアップサンプリングされた後、直交変換手段である
FFT回路234で高速フーリエ変換されて周波数軸上
の信号に変換され、周波数シフト回路235で高域側に
周波数シフト処理され、逆FFT回路236で逆高速フ
ーリエ変換されることにより、高域側の時間軸信号とさ
れ、重畳加算回路237を介して加算器228に送られ
る。
【0055】加算器228では、上記アップサンプリン
グ回路227からの信号と加算され、出力端子229よ
り16kbps のビットレートの一部に対応する音声信号
として取り出される。全体としての16kbps のビット
レートの信号は、上記出力端子219からの信号も合成
されることにより取り出される。
【0056】ここで、スケーラビリティについて説明す
る。上記図1、図2の構成においては、6kbps と16
kbps との2通りの伝送ビットレートをほぼ同様な符号
化復号化方式で実現しており、16kbps のビットスト
リーム内に6kbps のビットストリームを完全に包含す
るスケーラビリティを実現しているが、さらに2kbps
のような極端にビットレートの異なる符号化復号化を行
う場合には、このような完全な包含関係を得るのは難し
い。
【0057】ここで、同一の符号化復号化方式を適用で
きない場合であっても、最大限に共有関係を持ちながら
スケーラビリティを持たせることが好ましい。
【0058】このため、図3に示すような構成の符号化
装置によって2kbps の符号化を行い、図1の構成との
間に最大限の共有部分あるいは共有データを持たせ、全
体として16kbps のビットストリームで、この内16
kbps 全てを使用する場合と、6kbps を使用する場合
と、2kbps を移用する場合とを、それぞれ用途に応じ
て使い分けるようにしている。
【0059】なお、厳密には、後述するように、2kbp
s では2kbps の情報を全て使用するが、6kbps のモ
ードでは、符号化単位となるフレームが有声音(V)の
とき6kbps 、無声音(UV)のとき5.65kbps で
あり、また16kbps のモードでは、フレームが有声音
(V)のとき15.2kbps 、無声音(UV)のとき1
4.85kbps である。
【0060】ここで、図3の2kbps の符号化装置の構
成及び動作を説明する。
【0061】図3に示す符号化装置の基本的な考え方
は、入力音声信号の短期予測残差例えばLPC(線形予
測符号化)残差を求めてサイン波分析(sinusoidal ana
lysis)符号化、例えばハーモニックコーディング(har
monic coding )を行う第1の符号化部310と、入力
音声信号に対して位相伝送を行う波形符号化により符号
化する第2の符号化部320とを有し、入力信号の有声
音(V:Voiced)の部分の符号化に第1の符号化部31
0を用い、入力信号の無声音(UV:Unvoiced)の部分
の符号化には第2の符号化部320を用いるようにする
ことである。
【0062】上記第1の符号化部310には、例えばL
PC残差をハーモニック符号化やマルチバンド励起(M
BE)符号化のようなサイン波分析符号化を行う構成が
用いられる。上記第2の符号化部320には、例えば合
成による分析法を用いて最適ベクトルのクローズドルー
プサーチによるベクトル量子化を用いた符号励起線形予
測(CELP)符号化の構成が用いられる。
【0063】図3の例では、入力端子301に供給され
た音声信号が、第1の符号化部310のLPC逆フィル
タ311及びLPC分析・量子化部313に送られてい
る。LPC分析・量子化部313から得られたLPC係
数あるいはいわゆるαパラメータは、LPC逆フィルタ
311に送られて、このLPC逆フィルタ311により
入力音声信号の線形予測残差(LPC残差)が取り出さ
れる。また、LPC分析・量子化部313からは、後述
するようにLSP(線スペクトル対)の量子化出力が取
り出され、これが出力端子302に送られる。LPC逆
フィルタ311からのLPC残差は、サイン波分析符号
化部314に送られる。サイン波分析符号化部314で
は、ピッチ検出やスペクトルエンベロープ振幅計算が行
われると共に、V(有声音)/UV(無声音)判定部3
15によりV/UVの判定が行われる。サイン波分析符
号化部314からのスペクトルエンベロープ振幅データ
がベクトル量子化部316に送られる。スペクトルエン
ベロープのベクトル量子化出力としてのベクトル量子化
部316からのコードブックインデクスは、スイッチ3
17を介して出力端子303に送られ、サイン波分析符
号化部314からの出力は、スイッチ318を介して出
力端子304に送られる。また、V/UV判定部315
からのV/UV判定出力は、出力端子305に送られる
と共に、スイッチ317、318の制御信号として送ら
れており、上述した有声音(V)のとき上記インデクス
及びピッチが選択されて各出力端子303及び304か
らそれぞれ取り出される。
【0064】図3の第2の符号化部320は、この例で
はCELP(符号励起線形予測)符号化構成を有してお
り、雑音符号帳321からの出力を、重み付きの合成フ
ィルタ322により合成処理し、得られた重み付き音声
を減算器323に送り、入力端子301に供給された音
声信号を聴覚重み付けフィルタ325を介して得られた
音声との誤差を取り出し、この誤差を距離計算回路32
4に送って距離計算を行い、誤差が最小となるようなベ
クトルを雑音符号帳321でサーチするような、合成に
よる分析(Analysis by Synthesis )法を用いたクロー
ズドループサーチを用いた時間軸波形のベクトル量子化
を行っている。このCELP符号化は、上述したように
無声音部分の符号化に用いられており、雑音符号帳32
1からのUVデータとしてのコードブックインデクス
は、上記V/UV判定部315からのV/UV判定結果
が無声音(UV)のときオンとなるスイッチ327を介
して、出力端子307より取り出される。
【0065】このような符号化装置のLPC分析・量子
化部313が図1のLPC分析・量子化部130の一部
として共用でき、端子302からの出力がそのまま図1
の出力端子131からの出力として使用できる。また、
サイン波分析符号化部314により得られるピッチデー
タの一部が図1のピッチ分析回路115からの出力とし
て使用でき、このピッチ分析回路115をサイン波分析
符号化部314内のピッチ出力部分と共用することも可
能である。
【0066】このように、図3の符号化方式と図1の符
号化方式とは異なっているが、両者とも共通する情報を
持っており、図4に示すようなスケーラビリティを有し
ている。
【0067】この図4において、2kbps のビットスト
リームS2は、分析合成フレームがV(有声音)のとき
とUV(無声音)のときとで内部構造が異なっており、
Vのときの2kbps のビットストリームS2v は、2つ
の部分S2ve、S2vaから、UVのときの2kbps のビ
ットストリームS2u は、2つの部分S2ue、S2uaか
らそれぞれ成っている。部分S2veは、ピッチラグが1
フレーム160サンプル当たり1ビット(以下、1ヒ゛ット/
160サンフ゜ルのように示す)で、振幅Am が15ヒ゛ット/160サンフ゜
ル であり、計16ヒ゛ット/160サンフ゜ル となる。これは、8kHz
サンプリングで0.8kbps のビットレートのデータに
相当する。部分S2ueは、LPC残差が11ヒ゛ット/80サンフ゜ル
と、予備の1ヒ゛ット/160サンフ゜ルとで、計23ヒ゛ット/160サンフ゜ル と
なり、1.15kbps のビットレートのデータに相当す
る。2kbps のビットストリームS2の残りの部分S2
va、S2uaは、上述した6kbps 、16kbps との共有
部分あるいは共通部分であり、部分S2vaは、LSPデ
ータ32ヒ゛ット/320サンフ゜ル と、V/UV判定データ1ヒ゛ット/16
0サンフ゜ルと、ピッチラグ7ヒ゛ット/160サンフ゜ルとで、計24ヒ゛ット/1
60サンフ゜ル となり、1.2kbps のビットレートのデータ
に相当する。部分S2uaは、LSPデータ32ヒ゛ット/320サン
フ゜ル と、V/UV判定データ1ヒ゛ット/160サンフ゜ルとで、計17
ヒ゛ット/160サンフ゜ル となり、0.85kbps のビットレート
のデータに相当する。
【0068】また、6kbps のビットストリームS6
は、上記ビットストリームS2と同様に、分析フレーム
がVのときとUVのときとで内部構造が一部だけ異な
る。Vのときの6kbps のビットストリームS6v は、
2つの部分S6va、S6vbから、UVのときの6kbps
のビットストリームS6u は、2つの部分S6ua、S6
ubからそれぞれ成っている。部分S6vaは、上述したよ
うに、部分S2vaと共通のデータ内容であり、部分S6
vbは、ピッチゲイン6ヒ゛ット/160サンフ゜ルと、ピッチ残差18ヒ゛
ット/32サンフ゜ルとで、計96ヒ゛ット/160サンフ゜ル となり、4.8k
bps のビットレートのデータに相当する。また、部分S
6uaは、上記部分S2uaと共通のデータ内容であり、部
分S6ubは、上記部分S6vbと共通のデータ内容であ
る。
【0069】また、16kbps のビットストリームS1
6は、上記ビットストリームS2及びS6と同様に分析
フレームがVのときとUVのときとで内部構造が一部だ
け異なる。Vのときの16kbps のビットストリームS
16v は、4つの部分S16va、S16vb、S16vc、
S16vdから、UVのときの16kbps のビットストリ
ームS16u は、4つの部分S16ua、S16ub、S1
6uc、S16udからそれぞれ成っている。部分S16va
は、上記部分S2va、S6vaと共通のデータ内容であ
り、S16vbは、上記部分S6vb、S6ubと共通のデー
タ内容である。部分S16vcは、ピッチラグ2ヒ゛ット/160サ
ンフ゜ルと、ピッチゲイン11ヒ゛ット/160サンフ゜ル と、ピッチ残差
18ヒ゛ット/32サンフ゜ルと、S/Mモードデータ1ヒ゛ット/160サンフ゜ル
とで、計104ヒ゛ット/160サンフ゜ルとなり、5.2kbps のビッ
トレートに相当する。なお、上記S/Mモードデータ
は、VQ回路124で、音声(Speech)用と楽音(Musi
c) 用とで異なる2種類のコードブック(符号帳)を切
り換えるためのものである。部分S16vdは、高域LP
Cデータ5ヒ゛ット/160サンフ゜ルと、高域LPC残差15ヒ゛ット/32サ
ンフ゜ルとで、計80ヒ゛ット/160サンフ゜ル となり、4kbps のビッ
トレートに相当する。また、部分S16uaは、上記部分
S2ua、S6uaと共通のデータ内容であり、部分S16
ubは、上記部分S16vbすなわち上記部分S6vb、S6
ubと共通のデータ内容である。さらに、部分S16uc
は、上記部分S16vcと共通のデータ内容であり、部分
S16udは、上記部分S16vdと共通のデータ内容であ
る。
【0070】以上のようなビットストリームを得るため
の図1、図3の構成をまとめると、図5のようになる。
【0071】この図5において、入力端子11は図1、
図3の入力端子101に対応し、これが図1のLPF1
02、サンプリング周波数変換器103、減算器10
6、BPF107等に相当する帯域分割回路12に送ら
れて、低域側と高域側とに分割される。帯域分割回路1
2からの低域側信号は、図3の構成に対応する2k符号
化部21と共通部分符号化部22とに送られる。共通部
分符号化部22は、図1のLPC分析・量子化部13
0、あるいは図3のLPC分析・量子化部310にほぼ
相当し、さらに図3のサイン波分析符号化部内のピッチ
抽出部分や図1のピッチ分析回路115も共通部分符号
化部22に含ませることもできる。
【0072】また、帯域分割回路12からの低域側信号
は、6k符号化部23及び12k符号化部24にも送ら
れる。6k符号化部23は、図1の回路111〜116
にほぼ相当し、12k符号化部は、図1の回路117、
118、122〜128にほぼ相当する。
【0073】帯域分割回路12からの高域側信号は、高
域4k符号化部25に送られる。高域4k符号化部25
は、図1の回路161〜164、171、172にほぼ
相当する。
【0074】この図5の各出力端子31〜35から出力
されるビットストリームと図4の各部分との関係を説明
する。2k符号化部21から出力端子31を介して、図
4の部分S2ve又はS2ueのデータが出力され、共通部
分符号化部22から出力端子32を介して、図4の部分
S2va(=S6va=S16va)又はS2ua(=S6ua=
S16ua)のデータが出力される。また、6k符号化部
23から出力端子33を介して、図4の部分S6vb(=
S16vb)又はS6ub(=S16ub)のデータが出力さ
れる。さらに、12k符号化部24から出力端子34を
介して、図4の部分S16vc又はS16ucのデータが出
力され、高域4k符号化部25から出力端子35を介し
て、図4の部分S16vd又はS16udのデータが出力さ
れる。
【0075】以上説明したスケーラビリティの実現の技
術を一般化すると、入力信号に対して第1の符号化を施
して得られた第1の符号化信号と、上記入力信号に対し
て上記第1の符号化の一部とのみ共通する部分と共通し
ない部分とを有し上記第1の符号化とは独立の第2の符
号化を施して得られた第2の符号化信号とを多重化する
際に、上記第1の符号化信号と、上記第2の符号化信号
の内の上記第1の符号化信号と共通する部分を除く信号
とを多重化することである。
【0076】これによって、本質的に異なる符号化方式
であっても、共有できるものを最大限に共有させて、ス
ケーラビリティを持たせることができる。
【0077】次に、上記図1、図2の各部のより具体的
な動作について説明する。
【0078】先ず、図6の(A)に示すように、フレー
ム間隔、いわゆるフレームインターバルをNサンプル、
例えば160サンプルとし、1フレームに1回の分析を
行う場合について説明する。
【0079】ピッチ分析中心をt=kN(ただしk=0,
1,2,3,…)とするとき、LPC逆フィルタ111からの
LPC予測残差について、t= kN-N/2 〜 kN+N/2 に存
在する成分から成る次元数Nのベクトルをとし、これ
をLサンプルだけ時間軸の前方にずらしたt= kN-N/2-
L 〜 kN+N/2-L の成分から成るN次元ベクトルをL
して、 ‖−gL 2 が最小となるようL=Lopt をサーチし、このLopt
この区間での最適ピッチラグL1 とする。あるいは、ピ
ッチの急激な変化を避けるため、ピッチトラッキングを
行った後の値を最適ピッチラグL1 としてもよい。
【0080】次に、この最適ピッチラグL1 に対して、
【0081】
【数1】
【0082】が最小となるgi の組を
【0083】
【数2】
【0084】について解き、ピッチゲインベクトル1
を求める。このピッチゲインベクトル1 をベクトル量
子化したもののコードブックインデクスをg1 とする。
【0085】次に、さらに予測精度を上げるため、t=
(k-1/2)Nにも分析中心をおくことを考える。このとき、
予めt=kN及び(k-1)Nでのピッチラグ、ピッチゲインが
それぞれ求められているものとする。
【0086】音声信号の場合、その基本周波数はゆるや
かに変化すると考えられるため、t=kNのときのピッチ
ラグL(kN)と、t=(k-1)NのときのピッチラグL((k-1)
N)ととの間に大きな変化はないと考えられ、またその変
化も線形であると考えられるため、t=(k-1/2)Nのとき
のピッチラグL((k-1/2)N)のとり得る値に制限を加える
ことは可能である。本例では、次のようにしている。
【0087】 L((k-1/2)N) = L(kN) = (L(kN)+L((k-1)N))/2 = L((k-1)N) これらの内のどの値を採用するかは、それぞれのラグに
対応したピッチ残差のパワーを計算することによってな
される。
【0088】すなわち、t=(k-1/2)Nを中心としたt=
(k-1/2)N-N/4〜(k-1/2)N+N/4の次元数N/2のベクトル
とし、L(kN)、(L(kN)+L((k-1)N))/2、L((k-1)N)
だけそれぞれ遅れた次元数N/2のベクトルを0 (0)
1 (0) 2 (0) とし、これらの各ベクトル0 (0) 1
(0) 及び2 (0) のそれぞれの近傍のベクトルを0 (-1)
0 (1) 1 (-1) 1 (1) 及び2 (-1) 2 (1) とす
る。また、これらの各ベクトル0 (i) 1 (i) 2 (i)
(ただしi=−1、0、1)に対応する核ピッチゲイン
0 (i)、g1 (i)、g2 (i)について、
【0089】
【数3】
【0090】の3つうちの最小のものDj に対するラグ
を、t=(k-1/2)Nでの最適ラグL2 とし、そのときのピ
ッチゲインgj (i)(ただしi=−1、0、1)をベクト
ル量子化した上でピッチゲインを求める。なお、L2
とり得る値は3通りであり、これは現在及び過去のL1
から求められるため、ストレートな値ではなく補間スキ
ームを表すフラグを補間インデクスとして伝送すればよ
い。また、L(kN)、L((k-1)N)のいずれかが0、すなわ
ちピッチが無い、ピッチ予測利得がとれない、と判断さ
れるときには、L((k-1/2)N)の候補として上記(L(kN)+L
((k-1)N))/2 は除外される。
【0091】このように、ピッチラグ算出に用いるベク
トルの次元数を半分のN/2 にした場合、t=kNが分析
中心のときのLk はそのまま用いることができるが、
の次元数がNで分析したときのピッチゲインが得られて
いるにも拘わらず、再度ゲイン計算を行い、そのデータ
を伝送しなければならない。ここでは、そのビット数削
減のため、
【0092】
【数4】
【0093】ベクトルの要素(g0,g1,g2) の内、
1 がもっとも大きくg0,g2 は0に近いか、あるいは
その逆であり、ベクトルは3点の間で強い相関がある
ので、上記ベクトル1d は元のベクトルに比べて分散
が小さくなることが予想され、より少ないビット数で量
子化できる。
【0094】従って、1フレームで伝送すべきピッチパ
ラメータは、L1,g1,L2,g2,g1dの5つになる。
【0095】次に、図5の(B)は、フレーム周波数の
8倍のレートで補間されたLPC係数の位相を示してお
り、このLPC係数は、図1のLPC逆フィルタ111
による予測残差算出に用いられ、また図2のLPC合成
フィルタ215、225、ピッチスペクトラルポストフ
ィルタ216、226にそれぞれ用いられる。
【0096】次に、上記ピッチラグ及びピッチゲインか
ら求められたピッチ残差のベクトル量子化について説明
する。
【0097】ベクトル量子化の聴覚重み付けを容易にま
た精度よく行うため、ピッチ残差は50%オーバーラッ
プの窓かけをした上、MDCT変換を行い、この領域で
重み付けベクトル量子化を行う。このときの変換長は任
意であるが、以下の点を考慮して上で、この例ではかな
り小次元なものを用いている。
【0098】(1) 大次元のベクトル量子化は演算量が膨
大になり、MDCT領域でスプリットあるいは並べ替え
を行わざるを得ない。 (2) スプリットした場合、スプリットされたバンド間の
ビットアロケーションを精密に行うことは大変困難であ
る。 (3) 次元数が2のべき乗ではないとき、FFTを用いた
MDCTの高速算法が使用できない。
【0099】今回はフレーム長を20msec (=160
サンプル/8kHz)にとっているため、160/5=3
2=25 となることから、50%オーバーラップを考慮
してMDCT変換サイズを64にとり、上記(1)〜(3)の
各点の解決を図った。
【0100】フレーミングの状態は図6の(C)のよう
になる。
【0101】すなわち、この図6の(C)において、2
0msec =160サンプルのフレーム内のピッチ残差r
p(n) (ただしn=0,1,…,191、ここでn=160,…,191は、
次のフレームの0,…,31の意味)を5つのサブフレーム
に分け、5つのサブフレームのi番目(i=0,1,…,4)の
サブフレームのピッチ残差rpi(n) (ただし、n=0,1,
…,31) を、 rpi(n) = rp(32i+n) とする。このサブフレームのピッチ残差rpi(n) に、M
DCTのエリアシング相殺ができるような窓関数w(n)
をかけて得られるw(n)・rpi(n)に対してMDCT変換
を施す。この窓関数w(n) としては、例えば w(n) = √(1−(cos2π(n+0.5))/64) を用いればよい。
【0102】なお、MDCTの変換処理の演算は、変換
長が64(=26) のため、FFTを用いて次のように
計算できる。
【0103】(1) x(n) = w(n)・rpi(n)・exp((-2π
j/64)(n/2)) とする。 (2) x(n) を64ポイントFFT処理し、これをy(k)
とする。 (3) y(k)・exp((-2πj/64)(k+1/2)(1/2+64/4)) の実部
をとり、これをMDCT係数ci(k)(ただし、k=0,1,
…,31) とする。
【0104】次に、各サブフレームのMDCT係数c
i(k)をベクトル量子化するが、このときの重み付けにつ
いて説明する。
【0105】ピッチ残差rpi(n) をベクトルi とおく
と、合成後の距離Dは、
【0106】
【数5】
【0107】ここで、Mは、その性質からHtH (ただ
しHt はHの転置行列)を対角化すると考えられるの
で、
【0108】
【数6】
【0109】とし、ここではhi を合成フィルタの周波
数応答にとった。従って、
【0110】
【数7】
【0111】このように、hk をそのままci(k)の量子
化の重み付けに使用した場合、合成後のノイズがフラッ
トになる、いわゆる100%ノイズシェイピングになる
ため、さらに聴覚重み付けWによりフォルマントを相似
形のノイズになるようにコントロールする。
【0112】
【数8】
【0113】なお、hi 2、wi 2は、合成フィルタH(z)
及び聴覚重み付けフィルタW(z)
【0114】
【数9】
【0115】のインパルス応答のFFTパワースペクト
ルとして求められる。
【0116】ここで、αijは、第iサブフレームに対応
するLPC係数であり、補間されたLSP係数から求め
られる。すなわち、前フレームの分析で得られたLSP
0(j)と現フレームのLSP1(j)とを内分し、本例の場
合、第iサブフレームのLSPは、
【0117】
【数10】
【0118】としてLSP(i)(j)を求める。その後、L
SP→α変換によりαijを求める。
【0119】このようにして求められたH、Wに対し
て、新たにW’=WHと置き、ベクトル量子化の際の距
離尺度として用いる。
【0120】ベクトル量子化は、シェイプ、ゲインベク
トル量子化によって行うが、その学習時の最適エンコー
ド、デコード条件について説明する。
【0121】学習のある時点でのシェイプコードブック
、ゲインコードブックをgとし、トレーニング時の
入力すなわち各サブフレームでのMDCT係数を、そ
のサブフレームでの重みをW´とすると、このときの歪
のパワー2 は、以下の式で定義される。
【0122】2 =‖W´(−g)‖2 この2 を最小にするような(g、)を選択すること
が最適エンコード条件である。
【0123】
【数11】
【0124】したがって、まず第1のステップとして、
シェイプコードブックについて、
【0125】
【数12】
【0126】を最大にするopt をサーチし、ゲインコ
ードブックについては、このopt に対し、
【0127】
【数13】
【0128】に最も近いgopt をサーチすればよい。
【0129】次に、最適デコード条件を求める。
【0130】第2のステップとしてシェイプコードブッ
クについて、学習中のある時点でシェイプコードブック
にエンコードされたの集合k (k=0,…,N−
1)に対して、このときの歪の総和Es は、
【0131】
【数14】
【0132】であるから、これを最小にするは、
【0133】
【数15】
【0134】より
【0135】
【数16】
【0136】と求められる。
【0137】ゲインコードブックについては、ゲインコ
ードブックgにエンコードされたの集合k (重みW
´k 、シェイプk )について、歪の総和Eg は、
【0138】
【数17】
【0139】である。
【0140】上記第1、第2のステップを繰り返し求め
ながら、GLA(一般化ロイドアルゴリズム)によっ
て、シェイプ、ゲインコードブックを得ることができ
る。
【0141】なお、本例では、信号レベルの小さいとき
のノイズを重視するため、W´そのものでなく、レベル
(の逆数)の重みをつけたW´/‖‖を用いて学習を
行っている。
【0142】このようにして、作成した符号帳を用いて
ピッチ残差をMDCTしたものに対するベクトル量子化
を行い、そのインデクスをLPC(実際にはLSP)、
ピッチ、ピッチゲインととともに伝送し、デコード側で
は逆ベクトル量子化、ピッチ、LPC合成を行うこと
で、再生音を得ることができるが、本例では、さらにレ
ートの高い動作を可能とするため、前述のピッチラグ、
ピッチゲイン算出の頻度向上とともに、ピッチ残差MD
CTベクトル量子化を多段にすることで、これに対応し
ている。
【0143】一例を図7の(A)に示す。ここでの段数
は2段であり、シーケンシャルな多段ベクトル量子化で
あるが、2段目の入力は1段目のデコード結果をL2
2、g1dから作られた精度の高いピッチ残差から引い
たものとして用いる。すなわち、1段目のMDCT回路
113からの出力をVQ回路114でベクトル量子化し
た後の代表ベクトルあるいは逆量子化出力を、逆MDC
T回路113aで逆MDCT処理した結果を、減算器1
28’に送り、2段目の残差(図1のピッチ逆フィルタ
122からの出力)から減算している。この減算器12
8’からの出力をMDCT回路123’によりMDCT
処理してVQ回路124で量子化する。これは、1段目
の逆MDCTを行わない等価な図7の(B)のような構
成とすることができ、図1ではこの(B)の構成を用い
ている。
【0144】図2のデコーダ側でMDCT係数のインデ
クスIdxq1、Idxq2をともに用いたデコードをする
際は、Idxq1、Idxq2の逆ベクトル量子化の結果の
和を逆MDCT、オーバーラップ加算をした上で、ピッ
チ合成、LPC合成を行い再生音を得る。当然ピッチ合
成時のピッチラグ、ピッチゲイン更新頻度は、1段のみ
の場合の倍になり、本願では、80サンプル毎に切り換
わるピッチ合成フィルタを駆動することになる。
【0145】次に、図2のデコーダ側のポストフィルタ
216、226について説明する。
【0146】ポストフィルタ216、226は、ピッチ
強調、高域強調、スペクトル強調フィルタの縦続接続で
ポストフィルタ特性p(Z) を実現する。
【0147】
【数18】
【0148】この式において、gi 、Lはピッチ予測で
求められたピッチゲイン、ピッチラグであり、νはピッ
チ強調の度合いを表すパラメータである(例えばν=
0.5)。また、νb は高域強調(例えばνb =0.
4)を、νn 、νd はスペクトルの強調度(例えばνn
=0.5、νd =0.8)を表すパラメータである。
【0149】次に、LPC合成フィルタの出力s(n) 、
ポストフィルタの出力sp(n)についてのゲイン補正を行
う。このときの係数kadj は、
【0150】
【数19】
【0151】であるが、kadj はフレーム内で固定では
なく、LPFを通した上でサンプル毎に変化させる。な
お、pとして例えば0.1が用いられる。
【0152】kadj(n) =(1-p)kadj(n-1) +pkadj 次に、フレームのつなぎを滑らかにするため、以下のよ
うにピッチ強調フィルタを2つ用意し、その結果をクロ
スフェイドしたものを最終出力とする。
【0153】
【数20】
【0154】
【数21】
【0155】これにより構成されたポストフィルタの出
力sp0(n) 、sp(n)に対して最終出力sout(n)を、 sout(n)=(1-f(n)) sp0(n)+f(n) sp(n) とする。ここで、f(n) は、例えば図8に示すような窓
である。この図8の(A)は低レート時、(B)は高レ
ート時をそれぞれ示しており、(B)の80サンプル幅
の窓は、160サンプル、20msec の合成時には2回
繰り返して用いられる。
【0156】次に、図1のエンコーダ側のVQ(ベクト
ル量子化)回路124について説明する。
【0157】このVQ回路124は、音声(Speech)用
と楽音(Music) 用とで互いに異なる2種類の符号帳
(コードブック)を有しており、これらの2種類の符号
帳を入力信号に応じて切り換え選択するようにしてい
る。
【0158】すなわち、音声、楽音信号の量子化におい
て、量子化器の構成が決まっている場合、この量子化器
の持つ符号帳は、学習時に使用した音声、楽音の性質に
おいて最適なものとなるため、両者を一緒にして学習し
た場合、両者の性質が大きく異なると、学習後の符号帳
は両者の平均的な性質を持つことになる。従って、一つ
の符号帳で量子化器を構成した場合、そのパフォーマン
ス、あるいは平均S/Nは、あまり高くならないことが
予想される。
【0159】そこで、本例においては、このように性質
の異なる複数の信号について、それぞれの学習データを
用いて作成した符号量を切り換えて、量子化器の性能を
向上させている。
【0160】図9は、このような2種類の符号帳C
A、CBBを有するベクトル量子化器の概略的な構成を
示している。
【0161】この図9において、入力端子501に供給
された入力信号は、ベクトル量子化器511、512に
送られる。これらのベクトル量子化器511、512
は、それぞれ符号長(コードブック)CBA、CBBを有
している。これらのベクトル量子化器511、512か
らの代表ベクトルあるいは逆量子化出力は、それぞれ減
算器513、514に送られ、元の入力信号との差がと
られて、これらの各誤差分が比較器515に送られる。
比較器515では、各誤差分を比較して、誤差が小さい
方のベクトル量子化器511、512からの量子化出力
であるインデクスを切換スイッチ516で切換選択して
出力端子502に送る。
【0162】この場合、各ベクトル量子化器511、5
12の量子化単位時間あるいは周期よりも、切換スイッ
チ516の切換周期を長くしている。例えば、量子化単
位がフレームを8分割したサブフレームであるとき、切
換スイッチ516をフレーム単位で切り換えている。
【0163】ここで、例として、それぞれ音声のみ、楽
音のみで学習した同じサイズNで、同じ次元Mの符号帳
CBA、CBBがあるとして、あるフレームのL個のデー
タから成るL次元のデータをサブフレーム長M(=L
/n)でベクトル量子化したとき、量子化後の歪みにつ
いて、符号帳CBA を用いたときをEA(k)、符号帳CB
B を用いたときをEB(k)とする。これらの歪みEA(k)、
B(k)は、それぞれインデクスi,jが選ばれたとし
て、 EA(k)=‖WkAi )‖ EB(k)=‖WkBj )‖ である。この式で、Wk はサブフレームkでの重み付け
行列を表し、Ai Bj は符号帳CBA、CBBのそれぞ
れインデクスi,jに対応する代表ベクトルを表す。
【0164】このようにして得られた2つの歪みに対し
て、1フレーム内での歪みの総和により、そのフレーム
に最適な符号帳を採用することを考える。このときの選
び方について、次の2つの方法が考えられる。
【0165】第1の方法として、全てのサブフレームに
おいて、符号帳CBA 及びCBB のみを用いて量子化を
行い、歪みのフレーム内総和ΣkA(k) 、ΣkB(k) を
求め、小さい方の歪みの総和を与える符号帳CBA、C
Bのいずれかを1フレームに亘って使用する。
【0166】この第1の方法を実現する構成例を図10
に示す。この図10では、上記図9と対応する部分に同
じ参照番号を付しており、参照番号に添付したa、b、
・・・等の添字は、サブフレームkに対応している。符
号帳CBA については、サブフレーム毎の歪みが得られ
る各減算器513a、513b、・・・、513nから
の出力のフレーム内総和を加算器517でとり、符号帳
CBB については各サブフレーム毎の歪みのフレーム内
総和を加算器518でとって、これらを比較器515で
比較することにより、コードブック切換のための制御信
号あるいは選択フラグを端子503より得ている。
【0167】次に、第2の方法は、各サブフレーム毎
に、歪みEA(k)、EB(k)を比較し、これらの比較結果を
フレーム内の全サブフレームに亘って判断処理すること
により符号帳を切換選択するものである。
【0168】この第2の方法の実現例を図11に示す。
この図11では、各サブフレーム毎に比較を行う比較器
516からの出力を判断ロジック519に送って、例え
ば多数決などにより判断処理し、1ビットの符号帳切換
選択フラグを端子503より得るようにしている。
【0169】なお、この選択フラグが、前述したS/M
(音声/楽音)モードデータとして伝送されるものであ
る。
【0170】このようにして、複数の性質の異なる信号
を、1つの量子化装置により効率よく量子化できる。
【0171】次に、図1のFFT回路161、周波数シ
フト回路162、逆FFT回路163による周波数変換
処理について説明する。
【0172】この周波数変換処理は、入力信号の内の少
なくとも1つの帯域を取り出す帯域抽出工程と、抽出さ
れた少なくとも1つの帯域の信号を周波数軸上の信号に
変換する直交変換工程と、直交変換された信号を周波数
軸上で(他の位置に、他の帯域に)シフトさせるシフト
工程と、周波数軸上でシフトされた信号を逆直交変換し
て時間軸上の信号に変換する逆直交変換工程とを有して
いる。
【0173】図12は、上記周波数変換のための構成を
より詳しく示した図であり、図1と対応する部分には同
じ番号を付している。この図12において、入力端子1
01には、例えば16kHzサンプリングで0〜8KHzの
成分を持つ広帯域音声信号が供給されている。この入力
端子101からの広帯域音声信号の内、例えば0〜3.
8kHzを低域側信号としてLPF(ローパスフィルタ)
102により分離し、また元の広帯域信号からこの低域
側信号を減算器151で差し引いた成分を高域側信号と
して分離する。これらの低域側信号と高域側信号とを独
立に処理するようにしている。
【0174】ここで得た高域側信号は、LPF102を
介してもわずかに残っている3.5kHzから8kHzまで
の4.5kHzの周波数幅を持つが、ダウンサンプリング
して信号処理を行うため、4kHz幅まで狭めなくてはな
らない。この例では、7.5kHz〜8kHzの0.5kHz
分をBPF(バンドパスフィルタ)107あるいはLP
Fによりカットしている。
【0175】次に、低域側への周波数変換として例えば
FFT(高速フーリエ変換)を行うが、これに先立っ
て、フレーム分割回路108により、サンプル数を2の
べき乗、例えば図13の(A)に示すように512サン
プル毎に区切っている。ただし、後での信号処理を行い
易くするため、80サンプル毎に前進させている。
【0176】次に、ハミング窓かけ回路109により、
長さ320サンプルのハミング窓をかける。このサンプ
ル数の320は、上記フレーム分割の際に80サンプル
ずつ前進させており、後の重畳加算によるフレーム合成
時に、図13の(B)に示すように4つの波形を重ねて
加算できるようにするため、80の4倍としているもの
である。
【0177】次に、この長さ512サンプルのデータに
対して、FFT回路161によりFFT処理を行い、周
波数軸上のデータに変換する。
【0178】次に、周波数シフト回路162により、周
波数軸上でデータを他の位置あるいは他の帯域にシフト
あるいは移動させる。この周波数軸上でのシフトによっ
てサンプリング周波数を低下させる原理は、図14に示
すように、(A)の斜線部の高域側信号を(B)のよう
に低域側に移動し、これを(C)に示すようにダウンサ
ンプリングするものである。図14の(A)から(B)
への周波数軸上での移動の際に、fs/2 を中心に折り
返される成分については、互いに逆の移動方向となって
いる。これによって、サブバンドの帯域がfs/2n 以
内であれば、サンプリング周波数をfs/n に下げるこ
とができる。
【0179】この周波数シフト回路162では、図15
に示すように、周波数軸上のデータの高域側に相当する
斜線部のデータを、低域側に相当する周波数軸上の位置
あるいは帯域にシフトあるいは移動させる処理を行えば
よい。具体的に、512サンプルの時間軸上のデータを
FFT処理して得られる周波数軸上の512個のデータ
に対して、113番目から239番目までの127個の
データを、1〜127番目の位置あるいは帯域に移動さ
せ、また273番目から399番目までの127個のデ
ータを、395〜511番目の位置あるいは帯域に移動
させる。このとき、周波数軸上の112番目のデータを
0番目の位置に移動させないことが重要である。これ
は、周波数領域の信号では、0番目は直流成分であり、
位相成分が無いため、この位置のデータは実数でなくて
はならず、一般に複素数である周波数成分は、ここには
入れられないからである。また、fs/2 を表す256
番目のデータ(一般にはN/2番目のデータ)も無効で
あり、ここは利用しない、すなわち、この場合の0〜4
kHzの範囲は、厳密には0<f<4kHzと表される範囲
のことである。
【0180】次に、逆FFT回路163により逆FFT
処理して、周波数軸上のデータを時間軸上の信号に戻
す。この場合512サンプル毎に時間軸上の信号が得ら
れる。この512サンプル毎の時間軸信号を、重畳加算
回路166により図jの(B)に示すように80サンプ
ルずつオーバーラップさせ、重なっている部分を足し合
わせる。
【0181】この重畳加算回路166から得られた信号
は、16kHzサンプリングで0〜4kHzに制限されてい
るので、ダウンサンプリング回路164によりダウンサ
ンプリング処理する。これにより周波数シフトされた8
kHzサンプリングで0〜4kHzの信号を得ることがで
き、この信号が出力端子169を介して取り出されて、
図1のLPC分析・量子化部130やLPC逆フィルタ
171に送られる。
【0182】次に、デコード側での復元処理は、図16
に示す構成により実現できる。
【0183】この図16の構成は、上記図2のアップサ
ンプリング回路233以降の構成に相当しており、対応
する部分に同じ指示符号を付している。ただし、図2に
おいては、FFT処理の前にアップサンプリング処理を
行っているが、図16の例では、FFT処理の後にアッ
プサンプリング処理を行っている。
【0184】この図16において、端子241には、図
2の高域側LPC合成フィルタ232からの出力信号の
ような、8kHzサンプリングで0〜4kHzにシフトされ
ている高域側の信号が入力される。
【0185】この信号は、フレーム分割回路242によ
り、フレーム長が256サンプルで前進分が80サンプ
ルの信号に区切られる。これは、エンコード側のフレー
ム分割と同様な理由からであるが、サンプリング周波数
が1/2となっているので、サンプル数も1/2となっ
ている。また、ハミング窓かけ回路243により、フレ
ーム分割回路242からの信号に長さ160サンプルの
ハミング窓がかけられることも、エンコード側と同様
(ただしサンプル数は1/2)である。
【0186】次に、FFT回路234により長さ256
サンプルでFFT処理が施され、時間軸上の信号が周波
数軸上の信号に変換される。次のアップサンプリング回
路244においては、図15の(B)に示すようなゼロ
埋め処理を施すことにより、実質的にフレーム長が21
6サンプルから512サンプルになる。これは、図14
の(C)から(B)への変換に相当する。
【0187】次に、周波数シフト回路235により、周
波数軸上でデータを他の位置あるいは他の帯域にシフト
あるいは移動させることにより、+3.5kHzの周波数
シフトを行う。これは、図14の(B)から(A)への
変換に相当する。
【0188】このようにして得られた周波数軸上の信号
を、逆FFT回路236により逆FFT処理することに
より、時間軸上の信号に戻す。この逆FFT回路236
からの信号は、16kHzサンプリングで3.5kHz〜
7.5kHzとなっている。
【0189】次の重畳加算回路237では、長さ512
サンプルのフレーム毎に、80サンプルずつオーバーラ
ップさせて足し合わせ、連続する時間軸信号に戻す。こ
のようにして得られた高域側信号は、加算器228で低
域側信号と加算され、出力端子229より取り出され
る。
【0190】なお、このような周波数変換においては、
具体的な数値は上記の例に限定されず、シフトを行うバ
ンド数も1つに限定されない。
【0191】例えば、図17に示すように、16kHzサ
ンプリングで狭帯域信号を300Hz〜3.4kHz、広帯
域信号を0〜7kHzとする場合に、狭帯域に含まれない
低域0〜300Hzと、高域側の3.4kHz〜7kHzとの
内、高域側を300Hz〜3.9kHzに移動して低域側と
接触するように集めれば、0〜3.9kHzの信号とな
り、これも上述と同様にサンプリング周波数fs を1/
2の8kHzとすることができる。
【0192】これを一般化すれば、広帯域信号と、広帯
域信号の内部に収まる狭帯域信号とを多重化する場合、
広帯域信号から狭帯域信号を減算した残りの内の高域側
成分を低域側にシフトして、サンプリングレートを下げ
るわけである。
【0193】このように、任意の周波数から任意の周波
数のサブバンドを作ることができ、その周波数幅の総和
の2倍のサンプリング周波数で処理可能であり、アプリ
ケーションに柔軟に対応できる。
【0194】また、低ビットレートで量子化誤差が大き
い場合、一般にQMFを利用すると分割周波数付近に発
生したはずの折り返しノイズも、上記周波数変換方法に
よれば回避できる、という利点もある。
【0195】なお、本発明は上記実施の形態のみに限定
されるものではなく、例えば上記図1の音声符号化側
(エンコード側)の構成や、図2の音声復号化側(デコ
ード側)の構成については、各部をハードウェア的に記
載しているが、いわゆるDSP(ディジタル信号プロセ
ッサ)等を用いてソフトウェアプログラムにより実現す
ることも可能である。また、上記ベクトル量子化の代わ
りに、複数フレームのデータをまとめてマトリクス量子
化を施してもよい。さらに、本発明が適用される音声符
号化方法や復号化方法は、上記符号化復号化方法に限定
されるものではなく、種々の音声符号化復号化方法に適
用でき、用途としても、伝送や記録再生に限定されず、
ピッチ変換やスピード変換、規則音声合成、あるいは雑
音抑圧のような種々の用途に応用できることは勿論であ
る。
【0196】
【発明の効果】以上の説明から明らかなように、本発明
によれば、入力信号の内の少なくとも1つの帯域を取り
出し、取り出された少なくとも1つの帯域の信号を周波
数軸上の信号に直交変換し、直交変換された信号を周波
数軸上で他の位置又は他の帯域にシフトさせ、周波数軸
上でシフトされた信号を逆直交変換して時間軸上の信号
に変換し、逆直交変換された時間軸上の信号に対して符
号化を施すことにより、任意の周波数幅の信号を取り出
して、これを低域側に変換して、低いサンプリング周波
数で符号化処理を施すことができる。
【0197】また、任意の周波数から任意の周波数幅の
サブバンドを作ることができ、その周波数幅の2倍のサ
ンプリング周波数で処理可能であり、アプリケーション
に柔軟に対応できる。
【0198】また、低ビットレートで量子化誤差が大き
い場合でも、折り返しノイズが発生しないという利点も
ある。
【図面の簡単な説明】
【図1】本発明に係る音声符号化方法の実施の形態が適
用される音声信号符号化装置の基本構成を示すブロック
図である。
【図2】音声信号復号化装置の基本構成を示すブロック
図である。
【図3】他の音声信号符号化装置の構成を示すブロック
図である。
【図4】伝送される符号化データのビットストリームの
スケーラビリティを説明するための図である。
【図5】本発明が適用可能な符号化側のシステム全体を
概略的に示すブロック図である。
【図6】符号化、復号化の主要動作の周期及び位相関係
を説明するための図である。
【図7】MDCT(モディファイド離散コサイン変換)
係数のベクトル量子化の構成例を示す図である。
【図8】ポストフィルタ出力にかけられる窓関数の例を
示す図である。
【図9】2種類のコードブックを有するベクトル量子化
装置の例を示す図である。
【図10】2種類のコードブックを有するベクトル量子
化装置の具体例を示す図である。
【図11】2種類のコードブックを有するベクトル量子
化装置の他の具体例を示す図である。
【図12】周波数変換のエンコーダ側の構成を示すブロ
ック図である。
【図13】フレーム分割及び重畳加算処理を説明するた
めの図である。
【図14】周波数軸上での周波数シフトの例を示す図で
ある。
【図15】周波数軸上のデータのシフト処理を示す図で
ある。
【図16】周波数変換のデコーダ側の構成を示すブロッ
ク図である。
【図17】周波数軸上での周波数シフトの他の例を示す
図である。
【符号の説明】
111、171 LPC逆フィルタ 112、122 ピッチ逆フィルタ 113、123 MDCT(モディファイド離散コサイ
ン変換)回路 114、124 VQ(ベクトル量子化)回路 115、125 ピッチ分析回路 116、118、126 ピッチゲインVQ回路 130、180 LPC分析・量子化部 161、234 FFT(高速フーリエ変換)回路 162、235 周波数シフト回路 163、236 逆FFT回路
───────────────────────────────────────────────────── フロントページの続き (72)発明者 飯島 和幸 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力信号の内の少なくとも1つの帯域を
    取り出す帯域抽出工程と、 抽出された少なくとも1つの帯域の信号を周波数軸上の
    信号に変換する直交変換工程と、 直交変換された信号を周波数軸上で他の位置にシフトさ
    せるシフト工程と、 周波数軸上でシフトされた信号を逆直交変換して時間軸
    上の信号に変換する逆直交変換工程と、 逆直交変換された時間軸上の信号に対して符号化を施す
    工程とを有することを特徴とする信号符号化方法。
  2. 【請求項2】 上記入力信号は、広帯域音声信号であ
    り、この広帯域音声信号を電話帯域とこの電話帯域より
    も高域側とに分割することを特徴とする請求項1記載の
    信号符号化方法。
  3. 【請求項3】 上記シフト工程は、高域側の信号を低域
    側にシフトするとともに、サンプリングレートを下げる
    ことを特徴とする請求項1記載の信号符号化方法。
  4. 【請求項4】 上記直交変換工程は、上記入力信号を離
    散フーリエ変換処理することを特徴とする請求項1記載
    の信号符号化方法。
  5. 【請求項5】 上記シフト工程は、上記広帯域信号と、
    該広帯域信号の内部に収まる狭帯域信号とを多重化する
    場合、広帯域信号から狭帯域信号を減算した残りの内の
    高域側成分を低域側にシフトするとともに、サンプリン
    グレートを下げることを特徴とする請求項1記載の信号
    符号化方法。
  6. 【請求項6】 上記符号化を施す工程は、上記シフト工
    程にてシフト処理後に直流成分を含むときは、この直流
    成分を除いてから符号化する工程であることを特徴とす
    る請求項1記載の信号符号化方法。
  7. 【請求項7】 入力信号の内の少なくとも1つの帯域を
    取り出す帯域抽出手段と、 抽出された少なくとも1つの帯域の信号を周波数軸上の
    信号に変換する直交変換手段と、 直交変換された信号を周波数軸上で他の位置にシフトさ
    せるシフト手段と、 周波数軸上でシフトされた信号を逆直交変換して時間軸
    上の信号に変換する逆直交変換手段と、 逆直交変換された時間軸上の信号に対して符号化を施す
    手段とを有することを特徴とする信号符号化装置。
JP7302198A 1995-10-26 1995-10-26 信号符号化方法及び装置 Withdrawn JPH09127994A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7302198A JPH09127994A (ja) 1995-10-26 1995-10-26 信号符号化方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7302198A JPH09127994A (ja) 1995-10-26 1995-10-26 信号符号化方法及び装置

Publications (1)

Publication Number Publication Date
JPH09127994A true JPH09127994A (ja) 1997-05-16

Family

ID=17906124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7302198A Withdrawn JPH09127994A (ja) 1995-10-26 1995-10-26 信号符号化方法及び装置

Country Status (1)

Country Link
JP (1) JPH09127994A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999066497A1 (fr) * 1998-06-15 1999-12-23 Nec Corporation Codeur et decodeur de signaux musicaux/vocaux
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
JP2005275068A (ja) * 2004-03-25 2005-10-06 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999066497A1 (fr) * 1998-06-15 1999-12-23 Nec Corporation Codeur et decodeur de signaux musicaux/vocaux
US6865534B1 (en) 1998-06-15 2005-03-08 Nec Corporation Speech and music signal coder/decoder
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7788105B2 (en) 2003-04-04 2010-08-31 Kabushiki Kaisha Toshiba Method and apparatus for coding or decoding wideband speech
US8160871B2 (en) 2003-04-04 2012-04-17 Kabushiki Kaisha Toshiba Speech coding method and apparatus which codes spectrum parameters and an excitation signal
US8249866B2 (en) 2003-04-04 2012-08-21 Kabushiki Kaisha Toshiba Speech decoding method and apparatus which generates an excitation signal and a synthesis filter
US8260621B2 (en) 2003-04-04 2012-09-04 Kabushiki Kaisha Toshiba Speech coding method and apparatus for coding an input speech signal based on whether the input speech signal is wideband or narrowband
US8315861B2 (en) 2003-04-04 2012-11-20 Kabushiki Kaisha Toshiba Wideband speech decoding apparatus for producing excitation signal, synthesis filter, lower-band speech signal, and higher-band speech signal, and for decoding coded narrowband speech
JP2005275068A (ja) * 2004-03-25 2005-10-06 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
JP4649859B2 (ja) * 2004-03-25 2011-03-16 ソニー株式会社 信号処理装置および方法、記録媒体、並びにプログラム

Similar Documents

Publication Publication Date Title
EP1262956B1 (en) Signal encoding method and apparatus
TWI469136B (zh) 在一頻譜域中用以處理已解碼音訊信號之裝置及方法
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
KR100421226B1 (ko) 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
US7805314B2 (en) Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data
JPH06118995A (ja) 広帯域音声信号復元方法
CN113223540B (zh) 在声音信号编码器和解码器中使用的方法、设备和存储器
EP1111589B1 (en) Wideband speech coding with parametric coding of high frequency component
WO2006049179A1 (ja) ベクトル変換装置及びベクトル変換方法
JPH10124092A (ja) 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
JPWO2006120931A1 (ja) 符号化装置、復号化装置及びこれらの方法
TW463143B (en) Low-bit rate speech encoding method
WO2008053970A1 (fr) Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés
JP2645465B2 (ja) 低遅延低ビツトレート音声コーダ
JPH09127985A (ja) 信号符号化方法及び装置
JPH09127987A (ja) 信号符号化方法及び装置
JP3297749B2 (ja) 符号化方法
JPH09127998A (ja) 信号量子化方法及び信号符号化装置
JPH09127994A (ja) 信号符号化方法及び装置
JPH09127986A (ja) 符号化信号の多重化方法及び信号符号化装置
JP3472974B2 (ja) 音響信号符号化方法および音響信号復号化方法
KR100682966B1 (ko) 주파수 크기데이터 양자화/역양자화 방법 및 장치와 이를이용한 오디오 부호화/복호화 방법 및 장치
JP3092436B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030107