JP3353267B2 - 音響信号変換符号化方法及び復号化方法 - Google Patents

音響信号変換符号化方法及び復号化方法

Info

Publication number
JP3353267B2
JP3353267B2 JP03520696A JP3520696A JP3353267B2 JP 3353267 B2 JP3353267 B2 JP 3353267B2 JP 03520696 A JP03520696 A JP 03520696A JP 3520696 A JP3520696 A JP 3520696A JP 3353267 B2 JP3353267 B2 JP 3353267B2
Authority
JP
Japan
Prior art keywords
vector
code vector
audio signal
frequency domain
frequency characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03520696A
Other languages
English (en)
Other versions
JPH09230898A (ja
Inventor
直樹 岩上
健弘 守谷
和永 池田
聡 三樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03520696A priority Critical patent/JP3353267B2/ja
Publication of JPH09230898A publication Critical patent/JPH09230898A/ja
Application granted granted Critical
Publication of JP3353267B2 publication Critical patent/JP3353267B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明はオーディオ信号、
特に音楽信号などの音響信号を、周波数領域に変換して
できるだけ少ない情報量でディジタル符号化する符号化
方法、及びその符号化信号を音響信号に復号化する復号
化方法に関する。
【0002】
【従来の技術】現在、オーディオ信号を高能率に符号化
する方法として、原音をフレームと呼ばれる5〜50m
s程度の一定間隔の区間に分割し、その1フレームの信
号に時間−周波数変換を行って得た周波数領域係数を、
周波数特性の包絡形状(周波数特性概形)と、その周波
数領域係数を前記周波数特性概形で平坦化して得られる
残差係数という2つの情報とに分離し、それぞれを量子
化することが提案されている。この従来の符号化方法及
び復号化方法の処理手順を、図5を参照しながら説明す
る。
【0003】符号化10においては手順1は、入力端
子11よりの入力音響信号を、時間−周波数変換部12
によって周波数領域係数に変換する。この変換の方法と
しては、MDCT(Modified Discret
e Cosine Transformation,変
形離散コサイン変換)や、DCT(DiscreteC
osine Transformation,離散コサ
イン変換)、DFT(Discrete Fourie
r Transformation,離散フーリエ変
換)などを用いることができる。なお、時間−周波数変
換部12では、前処理として、入力信号サンプル列のフ
レーム分割と窓掛けが必要である。フレーム分割は、M
DCTの場合入力サンプルがN点入力されるごとにこれ
を含む過去2N点のサンプルを1フレームとして分割す
る。DCTとDFTの場合入力サンプルがN点ごとにこ
れを含む過去N+α点のサンプルを1フレームとして分
割する。窓掛けは従来行われている手法により行い、い
ずれの変換方法でも、N点の周波数領域係数が得られ
る。
【0004】手順2は、概形計算部13で周波数領域係
数の概形抽出する。この概形抽出方法としては、前処理
された音響信号を入力として線形予測分析をする方法、
周波数領域係数を入力としてスケールファクタを計算す
る方法、周波数領域係数をリフタリングする方法などを
用いることができる。線形予測分析をする方法では、入
力信号を線形予測分析し、線形予測係数を求め、この係
数のスペクトル振幅の逆数を周波数特性概形とする。線
形予測の次数は、20次程度にするのが効果的である。
【0005】スケールファクタを計算する方法では、周
波数領域係数を複数の小帯域に分割し、小帯域ごとにス
ケールファクタを計算し、これを周波数特性概形とす
る。小帯域に分割する方法は、周波数スケールで等間隔
としてもよいし、バークスケールで等間隔(つまり聴覚
的に等間隔)としてもよい。小帯域の数は30程度に設
定するのが効果的である。スケールファクタは小帯域内
のサンプルの振幅の平均値でもよいし、振幅の最大値で
もよい。
【0006】周波数領域係数をリフタリングする方法で
は、周波数領域係数をケプストラム分析し、ケプストラ
ム係数の低次部分のみのスペクトル振幅を周波数特性概
形とする。また、周波数領域係数の概形は、上記の方法
の併用により求めてもよい。たとえば、線形予測分析と
スケールファクタを併用する場合、線形予測分析による
線形予測スペクトルを決定した後、これに掛け合わせた
際に実際の周波数特性にもっとも近い形状になるように
スケールファクタを決定するなどの方法をとる。
【0007】手順3では、手順2で求めた周波数特性概
形を概形量子化部14で量子化して、そのインデックス
In1を得る。周波数特性概形を線形予測分析により求め
た場合、線形予測係数を線スペクトル対(LSP)に変
換し、これを量子化する方法が能率がよい。スケールフ
ァクタを量子化する場合、各々のスケールファクタをス
カラー量子化してもよいし、いくつかのスケールファク
タをまとめてベクトル量子化してもよい。ベクトル量子
化をする際、インタリーブベクトル量子化の技術を使う
と、能率良く量子化が可能である。ケプストラム係数を
量子化する場合、ケプストラム係数をスカラー量子化し
てもよいし、ベクトル量子化してもよい。
【0008】いずれの方法も、予測量子化を行うとさら
に高い能率が得られる。予測の方法としては、AR予
測、MA予測などを用いることができる。手順2で複数
方法で周波数特性概形を求めた場合、用いたすべての方
法について量子化を行う。手順4では、手順3で量子化
した周波数特性概形を概形再生部15で復号化し、周波
数特性概形を再生する。線スペクトル対を量子化した場
合、復号化して得られた再生線スペクトル対を再生線形
予測係数に変換し、再生線形予測係数のスペクトル振幅
の逆数を再生周波数特性概形とする。スケールファクタ
を量子化した場合、復号化した再生スケールファクタを
再生周波数特性概形とする。ケプストラム係数を量子化
した場合、復号化された再生ケプストラム係数のスペク
トル振幅を再生周波数特性概形とする。
【0009】手順5では、平坦化部16において手順1
で得られた周波数領域係数を手順4で得られた再生周波
数特性概形で平坦化する。ここでは、各々の周波数領域
係数をこれに対応する周波数特性概形で割ることによっ
て平坦化周波数領域係数(残差周波数係数)が得られ
る。手順6では手順5で得られた平坦化周波数係数を残
差量子化部17でベクトル量子化してインデックスIn2
を得る。この量子化方法として、重み付きベクトル量子
化による変換符号化法(TC−WVQ,Transfo
rm Codingwith Weighted Ve
ctor Quantization)、周波数領域重
み付けインタリーブベクトル量子化法(TWINVQ,
Transform−domain Weighted
Interleave Vector Quanti
zation)などがある。それぞれの技術について
は、T.Moriya,H.Suda:“An 8kb
it/s transformcoder for n
oisy channels,”Proc.ICASS
P '89 pp196−199および岩上、守谷、三
樹、“周波数領域重みづけインタリーブベクトル量子化
(TwinVQ)によるオーディオ符号化、”日本音響
学会講演論文集 平成6年10月〜11月pp.339
−340に述べられている。
【0010】復号化側20において、手順7では、手順
6で量子化された平坦化された周波数領域係数のインデ
ックスIn2を再生部21で復号再生する。手順8では、
手順3で量子化した周波数特性概形のインデックスIn1
を再生部22で復号化し、再生周波数特性概形を再生す
る。手順3で線スペクトル対を量子化した場合、復号化
して得られた再生線スペクトル対を再生線形予測係数に
変換し、再生線形予測係数のスペクトル振幅の逆数を再
生周波数特性概形とする。スケールファクタを量子化し
た場合、復号化した再生スケールファクタを再生周波数
特性概形とする。ケプストラム係数を量子化した場合、
復号化された再生ケプストラム係数のスペクトル振幅を
再生周波数特性概形とする。
【0011】なお、手順3で予測量子化を行った場合、
同じ予測合成を用いて再生を行う。手順3で複数方法の
量子化を行った場合、すべての方法について再生を行
い、たとえば各々で再生した概形を互いに掛け合わせる
などの方法により再生周波数特性概形を得る。手順9で
は、手順7で得られた、再生された平坦化周波数領域係
数を、手順8で得られた、再生周波数特性概形を用いて
逆平坦化部23で逆平坦化する。ここでは、各々の再生
された平坦化周波数領域係数と、これに対応する再生周
波数特性概形を掛け合わせることによって逆平坦化が行
われ、再生周波数領域係数が得られる。
【0012】手順10では、周波数−時間変換部24に
よって再生周波数領域係数を出力音響信号に変換出力す
る。変換の方法としては、IMDCT(Inverse
Modified Discrete Cosine
Transformation,逆変形離散コサイン
変換)や、IDCT(Inverse Discret
e Cosine Transformation,逆
離散コサイン変換)、IDFT(Inverse Di
screte Fourier Transforma
tion,逆離散フーリエ変換)などを用いることがで
きる。なお、周波数−時間変換部では、後処理として、
出力信号サンプル列の窓掛けとフレーム結合が必要であ
る。窓掛けは従来の手法と同様に行う。
【0013】
【発明が解決しようとする課題】従来の残差量子化部1
7における量子化法では、残差係数を重み付きベクトル
量子化方法によって量子化する。この方法によると多く
の音源に対して良好な性能で量子化を行うことができる
が、ピッチ成分を多く含むなど、微細構造の振幅が極端
に大きい入力があった場合、残差係数の形状が特殊な形
となるため、この形に近いコードベクトルがない場合が
ある。例えば残差係数の形状が図6Aに示すように大き
な振幅(変動)の場合は、この残差係数に対する最適コ
ードベクトルの波形が図6Bに示すように可成り異なっ
たものとなってしまうことがある。このようなときには
量子化を精度良く行うことができない。
【0014】この問題の対策として、ベクトル量子化に
用いるコードブックを特殊な形のベクトルを含むものと
入れ替える方法が従来からあるが、コードブックを複数
持つと、符号化及び復号化装置が必要とするメモリが大
きくなり望ましくない。この発明の目的は、ピッチ成分
など、スペクトルの微細構造が極端に大きな振幅を持つ
場合にもメモリを増やすことなく能率良くベクトル量子
化する変換符号化方法、及びその符号化信号を音響信号
に復号化する復号化方法を提供することにある。
【0015】
【課題を解決するための手段】この符号化方法では、入
力音響信号のスペクトルの微細構造が極端に大きな振幅
を持つ場合には、残差係数のベクトル量子化の際、コー
ドブック中のコードベクトルの要素の絶対値をその変動
が大きくなるように伸張する。この発明の復号化方法で
は、変形を必要とする情報に応じて逆量子化の際にコー
ドベクトルをその要素の絶対値の変動が大きくなるよう
に伸張して用いる。
【0016】この構成によれば入力音響信号のスペクト
ルの微細構造の振幅が極端に大きい入力があり、その残
差係数の形状が特殊な形となり、この形に近いコードベ
クトルがない場合があっても、コードベクトルの振幅に
伸張が加えられ、コードベクトルが残差係数の形状に近
づき、量子化能率の向上がはかれる。この方法を用いれ
ば、用意すべきコードブックは単一ですむので、符号化
及び復号化装置のメモリを増やす必要はない。
【0017】
【発明の実施の形態】図1を参照してこの発明による符
号化方法、復号化方法を説明する。図1中で図5と対応
する部分に同一符号を付けてある。従来と同様に手順1
で入力音響信号を周波数係数に変換し、手順2でその入
力信号の周波数特性概形を抽出し、これを手順3で量子
化し、それを手順4で逆量子化し、その再生周波数概形
により手順5で周波数係数を平坦化する。この実施例で
は残差周波数係数を更に平坦化した場合である。
【0018】手順2′では、周波数特性概形抽出部31
により手順5で得られた平坦化周波数領域係数(残差周
波数係数)の概形を求める。この概形抽出方法として
は、平坦化周波数領域係数を入力としてスケールファク
タを計算する方法、平坦化周波数領域係数をリフタリン
グする方法などを用いることができる。スケールファク
タを計算する方法では、平坦化周波数領域係数を複数の
小帯域に分割し、小帯域ごとにスケールファクタを計算
し、これを第2周波数特性概形とする。小帯域に分割す
る方法は、周波数スケールで等間隔としてもよいし、バ
ークスケールで等間隔(聴覚的に等間隔)としてもよ
い。小帯域の数は30程度に設定するのが効果的であ
る。スケールファクタは小帯域内のサンプルの振幅の平
均値でもよいし、振幅の最大値でもよい。
【0019】平坦化周波数領域係数をリフタリングする
方法では、平坦化周波数領域係数をケプストラム分析
し、ケプストラム係数の低次部分のみのスペクトル振幅
を第2周波数特性概形とする。手順3′では、手順2′
で求めた第2周波数特性概形を概形量子化部32で量子
化してインデックスIn3を得る。スケールファクタを量
子化する場合、各々のスケールファクタをスカラー量子
化してもよいし、いくつかのスケールファクタをまとめ
てベクトル量子化してもよい。ベクトル量子化をする
際、インタリーブベクトル量子化の技術を使うと、能率
良く量子化が可能である。ケプストラム係数を量子化す
る場合、ケプストラム係数をスカラー量子化してもよい
し、ベクトル量子化してもよい。
【0020】いずれの方法も、予測量子化を行うとさら
に高い能率が得られる。予測の方法としては、AR予
測、MA予測などを用いることができる。手順4′で
は、手順3′で量子化した第2周波数特性概形再生部3
3で復号化し、再生第2周波数特性概形を再生する。ス
ケールファクタを量子化した場合、復号化した再生スケ
ールファクタを第2再生周波数特性概形とする。ケプス
トラム係数を量子化した場合、復号化された再生ケプス
トラム係数のスペクトル振幅を再生第2周波数特性概形
とする。
【0021】手順5′では、手順5で得られた平坦化周
波数領域係数を手順4′で得られた再生第2周波数特性
概形で平坦化部34において平坦化する。ここでは、各
々の平坦化周波数領域係数をこれに対応する再生第2周
波数特性概形で割ることによって第2平坦化周波数領域
係数が得られる。手順11では、手順6の重み付きベク
トル量子化で用いる重みを重み計算部35で計算する。
入力として、手順4で得られた再生周波数特性概形と手
順4′で得られた再生第2周波数特性概形を用いる。こ
こでは、下記の式(1)の計算式に従って重みを計算す
る。ただしwは重み、e1は再生周波数特性概形の各要
素、e2は再生第2周波数特性概形の各要素であり、i
は0からN−1の数である。べき係数k1,k2の値は
定数でもよいし、入力信号の特性に応じて適応的に変化
させてもよい。
【0022】 wi=(e1i)k1(e2i)k2 (1) 手順6では、手順5′で平坦化された第2平坦化周波数
領域係数を重み付きベクトル量子化する。この手順の詳
細を図に示す。手順6−1では、入力された第2平坦
化周波数領域係数を長さ15程度の小ベクトルにベクト
ル分割部37で分割する。小ベクトルに分割する方法と
しては、インタリーブ分割してもよいし、サブバンド分
割してもよい。インタリーブ分割の技術についての詳細
は、岩上、守谷、“周波数領域重み付けインタリーブベ
クトル量子化(TwinVQ)によるオーディオ符号
化、“日本音響学会講演論文集、平成6年10月〜11
月、pp.339〜340に記述されている。
【0023】手順6−2では、入力された重み係数を、
手順6−1と同じ方法で小ベクトルにベクトル分割部3
8で分割する。手順6−3では、あらかじめ用意された
コードブック39中のコードベクトルを、最適コードベ
クトル探索部41の要求に応じて出力する。手順6−4
では、入力音響信号のスペクトルの微細構造の振幅の大
小をスペクトル微細構造性有無判断部42で判断する。
微細構造の振幅判断の方法として、たとえば、入力端子
11よりの入力音響信号をケプストラム分析し、この高
次部分のエネルギーが大きいときに微細構造の振幅が大
きい、つまり微細構造を多く含むと判断する。あるい
は、音声入力は、微細構造信号の振幅が大きい信号に該
当するので、音声検出器を用いて音声信号が検出される
と微細構造を多く含むと判断してもよい。この判断結果
は復号側でも必要なので、スイッチ情報In20 として復
号側に伝送する。
【0024】前記ケプストラム分析してその高次部分の
エネルギーにより判断する場合具体的には、そのケプス
トラムの高次のパワーと全体のパワーの比を例えば次式
で計算する。 λte=Σci/(Σci) 分母のΣはi=1からNce−1まで分子のΣはi=Ncu
からNce−1までただし、ci はケプストラム係数、N
ceはケプストラムの次数、Ncuはケプストラム高次のカ
ットオフ点である。Ncu=Nce/50程度に設定すると
良好な性能が得られる。ここで得られたλteをそのまま
スペクトル微細構造の尺度λとしてもよいし、現在フレ
ームと過去フレームで得られたλteの値を線形和して得
られた値をλとしてもよい。
【0025】このスペクトル微細構造尺度λから、スペ
クトルの微細構造の振幅が大(微細構造を多く含む)か
の判断する。λがしきい値を越えた場合スペクトルの微
細構造が多いと判断する。しきい値は0.3程度に設定
する。あるいは、図2に示すような判断アルゴリズムを
用いてもよい。即ちまず1フレーム前のスペクトルの微
細性を示すスイッチsw−pが0か(微細性なしか)を
調べ(S1 )、微細性がなければ、swを0とし
(S2 )、λがしきい値THR1より大かを調べ
(S 3 )、大であればswを1とし(S4 )、大でなけ
ればswはそのままとする。ステップS1 でsw−pが
0でなければ、swを1とし(S5 )、λがしきい値T
HR2より小さいかを調べ(S6 )、小さければswを
0とし(S7 )、小さくなければswをそのままとす
る。このようにして得られたswの値を現在フレームに
おける微細性有無の判断結果とした後、そのswをsw
−pとして微細性有無判断処理を終了する(S8 )。T
HR1,THR2の各値はそれぞれ0.2,0.4を用
いるとよい。
【0026】つまり全体のパワーに対して高次のパワー
の比率が大ということは、入力信号の高周波成分が多
く、振幅変動が大でスペクトルの微細性が有ることを示
す。一方音声信号の有無を検出してスペクトルの微細構
造の振幅が大(微細構造が多)と判断するには例えばス
ペクトル概形の急峻性尺度μを計算して求める。具体的
には、低次までのケプストラム係数のパワーと高次まで
のケプストラム係数のパワーの比を例えば次式により計
算する。
【0027】μte=Σci/(Σci) 分母のΣはi=NbaからNH −1まで、分子のΣi =N
baからNL −1までただし、NL ,NH はそれぞれケプ
ストラム係数のパワー計算の低次、高次の範囲Nbaはケ
プストラム係数のパワー計算の開始点(パワーの大きな
直流成分を除去する)、例式が5〜10程度あり、
L ,NH の値は、それぞれNce/18、Nce/5程度
に設定するとよい。ここで得られたμteをそのままスペ
クトル概形の急峻性尺度μとしてもよいし、現在フレー
ムと過去フレームで得られたμteの値を線形和して得ら
れた値をμとしてもよい。
【0028】このスペクトル概形急峻性尺度μから、ス
ペクトル概形の急峻性の有無、つまり音声信号の有無を
判断する。μがしきい値を越えた場合スペクトル概形の
急峻性(音声信号)があると判断する。しきい値は0.
7程度に設定する。あるいは、図2に示したような判断
アルゴリズムを用いてもよい。このアルゴリズム中のs
wは、スペクトル概形の急峻性(音声信号)の有無を示
すスイッチ、sw−pは、1フレーム前の急峻性(音声
信号)の有無を示すスイッチである。THR1,THR
2の値は、それぞれ0.45,0.8を用いるとよい。
つまり直流成分を除く低域成分のレベルが著しく大きい
ことは音声信号に特有しており、音声信号有りと判断す
る。
【0029】手順6−5は、手順6−4で判断した入力
信号スペクトルの微細構造の振幅の大小に基づいてコー
ドブック39よりのコードベクトルの変形をコードベク
トル変形部43で行う。まず、入力信号スペクトルの微
細構造の振幅が小さい(微細構造が少ない)場合には、
この手順6−5ではなにもせず入力されたコードベクト
ルをそのまま出力する。
【0030】入力信号スペクトルの微細構造の振幅が大
きい(微細構造が多い)場合、入力されたコードベクト
ルを変形する。コードベクトルの変形は、コードベクト
ルの要素の全体のうち、絶対値の大きいものから3分の
1程度を残してほかの要素は0にしてしまうことにより
行う。あるいは、コードベクトルを3つ程度に小帯域に
分割し、各々について大きいものから3分の1程度を残
してほかの要素は0にする方法でもよい。これらのよう
にベクトル要素の3分の2程度を0にしてしまうと、全
体としてそのベクトルの変動が大きく、つまり振幅が大
きくなる。あるいは、絶対値の平均値を中心としてこれ
より小さいものはさらに小さく、大きいものはさらに大
きくすることにより伸縮をかけてもよい。伸縮の具体的
な方法の一例を式(2)に示す。
【0031】 c′i =sign(ci )・max (α{|ci |−e}+e,0) (2) ただし、ci はコードブックから出力されたコードベク
トルの各要素、c′i は出力コードベクトルの各要素、
eはコードベクトルの絶対値の平均値、αは定数であ
る。αの値は、1.4程度とすると効果的である。要素
を0に落とす方法では、各々のコードベクトルに対して
マスクベクトルをあらかじめ用意しておけば、手順6−
5でその都度0に落とす要素を決定する必要がなく、演
算量を節約できる。小帯域に分割してある要素を0にす
る方法はコードベクトルの全体にわたって変形を行うこ
とになる。何れの手法でも入力信号の微細構造の振幅が
大きい、つまり変動が大きい場合はコードブックから出
力されたコードベクトルの要素間の変動が大きくされ
る。要素を0にする場合、前述のように所定数を残して
0にする場合に限らず、所定値、例えば最大値の1/2
以上を残して他を0とするようにしてもよい。この手法
はコードベクトルを分割する場合、しない場合の何れに
も適用できる。
【0032】手順6−6では、手順6−1で求めた各々
の小ベクトルごとに、対応重み係数ベクトルを用いてコ
ードベクトル変形部43から出力されるコードベクトル
のうち、最適なものを最適コードベクトル探索部41で
探索する。ベクトル量子化の際の距離尺度の計算は式
(3)に従って行う。ここで得られた距離尺度dが最小
となるコードベクトルを最適ベクトルとして選択する。
【0033】 d(n) =Σwi 2 {ri −c′i (n) }2 (3) Σはi=0からm−1まで ただし、nはコードブックのベクトル番号、wは重み係
数、rは周波数領域係数、iはベクトルインデックス、
mはベクトル長をあらわす 次に図1中の復号化側20での処理手順を述べる。
【0034】手順7では、手順6で量子化された平坦化
された第2平坦化周波数領域係数を残差再生部21で復
号再生する。この詳細を図4を参照して説明する。手順
7−1では、コードブック51中から、ベクトル励振部
52から要求のあったコードベクトルを出力する。手順
7−2では、符号化側10からインデックスIn2の中の
スペクトルの微細構造性の有無を表すスイッチ情報In
20 をスペクトル微細構造性有無判断部53で受け、ス
ペクトルの微細構造性の有無を表わすスイッチを入切す
る。
【0035】手順7−3では、手順7−1から得られた
コードブック51からのコードベクトルをコードベクト
ル変形部54でスイッチ情報In20 の状態に応じて変形
し、又は変形することなく生ずる。スイッチ情報In20
がNの場合は変形するが、その変形の手法は手順6−5
で行ったものと同じである。手順7−4では、符号化側
10よりのインデックスIn2に応じてコードブック51
からのコードベクトルを各々の小ベクトルに関して対応
ベクトル励振部52により順次それぞれ読み出し、つま
りベクトル励振を行う。
【0036】手順7−5では、手順7−4で得られた小
ベクトル群の要素の並び替えをベクトル結合部55で行
い、もとの第2平坦化周波数領域係数を再生する。並び
替えの手順は、手順6−1で行った分割の逆手順で行
う。手順8′では、図1に示すように手順3′で量子化
したインデックスIn 3 周波数特性概形再生部57に
入力して第2周波数特性概形を逆量子化し、再生第2周
波数特性概形を再生する。手順3′ではスケールファク
タを量子化した場合、復号化した再生スケールファクタ
を再生第2周波数特性概形とする。ケプストラム係数を
量子化した場合、復号化された再生ケプストラム係数の
スペクトル振幅を再生第2周波数特性概形とする。
【0037】なお、手順3′で予測量子化を行った場
合、同じ予測合成を用いて再生を行う。手順9′では、
手順7で得られた再生第2平坦化周波数領域係数を、手
順8′で得られた再生第2周波数特性概形を用いて、逆
平坦化部58において逆平坦化を行う。ここでは、再生
第2平坦化周波数領域係数と、再生第2周波数特性概形
の各要素を互いに掛け合わせることによって逆平坦化を
行い、再生平坦化周波数領域係数を得る。
【0038】手順8では、手順3で量子化した周波数特
性概形を従来と同様に復号化して再生周波数特性概形を
再生する。手順9では、手順9′で得られた再生平坦化
周波数領域係数を、手順8で得られた再生周波数特性概
形を用いて、逆平坦化部23において逆平坦化を行う。
ここでは、再生平坦化周波数領域係数と、再生周波数特
性概形の各要素を互いに掛け合わせることによって逆平
坦化を行い、再生周波数領域係数を得る。
【0039】手順10では、従来と同様に周波数−時間
変換部24によって再生周波数領域係数を出力音響信号
に変換して出力する。この実施例中の周波数特性概形抽
出部31、概形量子化部32、再生部33、平坦化部3
4、周波数特性概形再生部57、逆平坦化部58を省略
して、図4に示した従来の方法と同様に、残差周波数係
数を平坦化することなく、ベクトル量子化する場合に
も、この発明を適用できる。
【0040】また上述では符号化側10で入力音響信号
のスペクトルが微細構造を多く含むか否かの検出を行
い、その検出結果を示すインデックスIn20 を符号化出
力中に加えたが、このインデックスIn20 は必ずしも送
出する必要はない。即ち前述したようにケプストラムの
急峻性(音声信号)の有無に応じてコードベクトルを変
形するか否かをしてもよいから、図1中の再生部15か
らの入力音響信号の周波数特性概形、特に図1中の再生
部15又は/及び33′の再生周波数特性概形からその
低周波成分のパワーの全体のパワーに占める割合を求
め、これが所定値より大きければ、微細構造を多く含む
と判定し、復号側でも再生部22又は/及び57よりの
再生周波数特性概形を同様に用いればよい。また符号化
側でピッチ情報を出力する場合は、そのピッチが大きけ
れば微細構造を多く含むと判断し、復号化側でも再生ピ
ッチ情報から同様に判断すればよい。
【0041】この発明は以上の説明から理解されるよう
に、ベクトル量子化されるべき、平坦化周波数領域係数
とマッチするコードベクトルがない場合に、コードベク
トルを変形して近いコードベクトルを得るものである。
従って、マッチするコードベクトルが存在しないことの
検出は例えばコードベクトルとの距離が所定値以下にな
るものが検索できなかった場合に、コードベクトルの変
形を行うようにしてもよい。コードベクトルの変形も予
め決められた一手法の変形に限らず、例えば前述のよう
にコードベクトルの振幅を大に変形したり、高域レベル
を大に変形したり、低域レベルを強調したりなど各種の
変形を行うようにしてもよく、その何れを行うかを、コ
ードベクトルとの不適合の状態に応じて予め決めておく
か、何れの変形をしたかを示すインデックスを符号化出
力中に加えてもよい。更に上述ではこの発明を重み付き
ベクトル量子化に適用したが、重み付きでないベクトル
量子化にも適用できる。
【0042】
【発明の効果】以上述べたように、この発明によれば、
周波数領域係数のベクトル量子化において、入力信号の
スペクトル形状に微細構造を多く含み、振幅の変動が大
きい場合、コードブック中のコードベクトルを変形し
て、コードベクトル形状の微細構造を大きくして振幅変
動を大きくする。これにより、このようにしない場合よ
りも、入力平坦化周波数係数、又は第2平坦化周波数係
数に近い変形コードベクトルが得られ、コードブックの
ためのメモリを大幅に増やすことなくベクトル量子化の
能率を高めることが可能になった。なおコードベクトル
に対し変形を加えたか否かを示すスイッチ情報In20
1ビット付加する必要はある。
【図面の簡単な説明】
【図1】この発明の符号化方法及びこの発明の復号化方
法の各実施例を適用した符号化装置及び復号化装置の機
能構成を示すブロック図。
【図2】入力音響信号のスペクトル形状に微細構造が多
く含まれているか否かの判断処理手順の例を示す流れ
図。
【図3】図1中の重み付きベクトル量子化部17の処理
手順の詳細例を示す図。
【図4】図1中の残差再生部21の処理手順の詳細例を
示す図。
【図5】従来の符号化器及び復号化器の機能構成を示す
ブロック図。
【図6】Aは入力信号スペクトル形状に微細構造が多く
含まれている形状を示す図、Bは従来のコードブックを
用いた場合にAに示した波形に最適として選択されたコ
ードベクトルの波形例を示す図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 三樹 聡 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平6−274199(JP,A) 特開 平8−44399(JP,A) 特開 平5−61499(JP,A) 特開 平5−158497(JP,A) 特開 平6−259097(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音響信号をフレーム単位に、その周
    波数特性の概形が取り除かれた周波数領域の残差係数に
    変換し、その残差周波数領域係数に対応する符号を出力
    する符号化方法において、 上記入力音響信号が上記ベクトル量子化に用いるコード
    ブック中のコードベクトルに適合するかしないかを判断
    する第1の段階と、 上記第1の段階が適合しないと判断すると上記コードベ
    クトルを変形する第2の段階とを有し、 上記第1の段階は、上記入力音響信号にスペクトルの微
    細構造を多く含むかどうか判断することにより上記適合
    するかを判断する段階であり、 上記微細構造を多く含むと判断すると上記第2の段階で
    は上記コードベクトルの形状の微細構造が大きくなるよ
    うに変形を加えることを特徴とした音響信号変換符号化
    方法。
  2. 【請求項2】 上記第2の段階は、上記コードベクトル
    の各要素のうち絶対値の大きなものを残して他は0にす
    ることであることを特徴とした請求項記載の音響信号
    変換符号化方法。
  3. 【請求項3】 上記第2の段階は、上記コードベクトル
    を複数の小帯域に分割し、その分割された各小帯域につ
    いて、その要素中から絶対値の大きなものを残して他は
    0にする請求項記載の音響信号変換符号化方法。
  4. 【請求項4】 上記第2の段階は、コードベクトルの各
    要素のうち、絶対値の大きいものをさらに大きく、また
    絶対値の小さいものをさらに小さくすることにより変形
    を行うことであることを特徴とした請求項記載の音響
    信号変換符号化方法。
  5. 【請求項5】 上記第1の段階は上記入力音響信号をケ
    プストラム分析し、その分析結果中の高次部分のエネル
    ギーが大きいか小さいかを判断することであり、その判
    断結果の情報を符号化出力に含めることを特徴とする請
    求項1乃至の何れかに記載の音響信号変換符号化方
    法。
  6. 【請求項6】 上記第1の段階は入力音響信号中に音声
    信号が含まれているかを判断し、その判断結果の情報を
    符号化出力に含めることであることを特徴とする請求項
    1乃至の何れかに記載の音響信号変換符号化方法。
  7. 【請求項7】 上記第1の段階は上記入力音響信号の周
    波数特性概形の低次成分が大きいかを判断することであ
    ることを特徴とする請求項1乃至の何れかに記載の音
    響信号変換符号化方法。
  8. 【請求項8】 第1の段階でベクトル量子化された周波
    数領域係数を再生し、第2の段階で上記再生された周波
    数領域係数を音響信号に変換して出力する音響信号変換
    復号化方法において、 上記第1の段階で用いるコードブック中のコードベクト
    ルを、変形を必要とする情報に応じて変形する第3の段
    階を含み、 上記第3の段階は、上記コードベクトルの形の微細構造
    が大きくなるように変形を加えることである ことを特徴
    とした音響信号変換復号化方法。
  9. 【請求項9】 上記第3の段階は、上記コードベクトル
    の各要素のうち絶対値の大きなものを残して他は0にす
    ることであることを特徴とした請求項記載の音響信号
    変換復号化方法。
  10. 【請求項10】 上記第3の段階は、コードベクトルを
    複数の小帯域に分割し、その各小帯域ごとにその要素の
    うち絶対値の大きなものを残して他は0とすることであ
    ることを特徴とする請求項記載の音響信号変換復号化
    方法。
  11. 【請求項11】 上記第3の段階は、上記コードベクト
    ルの各要素のうち、絶対値の大きいものをさらに大き
    く、また絶対値の小さいものをさらに小さくすることで
    あることを特徴とした請求項記載の音響信号変換復号
    化方法。
  12. 【請求項12】 上記変形を必要とする情報は入力符号
    中に含まれていることを特徴とする請求項8または9
    記載の音響信号変換復号化方法。
  13. 【請求項13】 上記第1の段階はベクトル励振により
    平坦化周波数領域係数を再生する段階と、入力符号中の
    周波数特性概形情報から周波数特性概形を再生する段階
    と、上記再生された周波数特性概形により上記平坦化周
    波数領域係数を逆平坦化して上記周波数領域係数を得る
    段階とよりなり、上記周波数特性概形の低次成分が大き
    いか否かを判断し、大きいと判断されると上記変形を必
    要とする情報が得られる段階を含むことを特徴とする請
    求項8または9に記載の音響信号変換復号化方法。
JP03520696A 1996-02-22 1996-02-22 音響信号変換符号化方法及び復号化方法 Expired - Lifetime JP3353267B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03520696A JP3353267B2 (ja) 1996-02-22 1996-02-22 音響信号変換符号化方法及び復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03520696A JP3353267B2 (ja) 1996-02-22 1996-02-22 音響信号変換符号化方法及び復号化方法

Publications (2)

Publication Number Publication Date
JPH09230898A JPH09230898A (ja) 1997-09-05
JP3353267B2 true JP3353267B2 (ja) 2002-12-03

Family

ID=12435389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03520696A Expired - Lifetime JP3353267B2 (ja) 1996-02-22 1996-02-22 音響信号変換符号化方法及び復号化方法

Country Status (1)

Country Link
JP (1) JP3353267B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
JP4954080B2 (ja) * 2005-10-14 2012-06-13 パナソニック株式会社 変換符号化装置および変換符号化方法
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JPWO2007132750A1 (ja) * 2006-05-12 2009-09-24 パナソニック株式会社 Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2011086900A1 (ja) * 2010-01-13 2011-07-21 パナソニック株式会社 符号化装置および符号化方法

Also Published As

Publication number Publication date
JPH09230898A (ja) 1997-09-05

Similar Documents

Publication Publication Date Title
EP0942411B1 (en) Audio signal coding and decoding apparatus
EP0910067B1 (en) Audio signal coding and decoding methods and audio signal coder and decoder
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
US7599833B2 (en) Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
US20070016411A1 (en) Method and apparatus to encode/decode low bit-rate audio signal
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
JP2009515212A (ja) オーディオ圧縮
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
JPH07261800A (ja) 変換符号化方法、復号化方法
WO2009125588A1 (ja) 符号化装置および符号化方法
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
EP0919989A1 (en) Audio signal encoder, audio signal decoder, and method for encoding and decoding audio signal
JP3353267B2 (ja) 音響信号変換符号化方法及び復号化方法
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3353266B2 (ja) 音響信号変換符号化方法
JP3147807B2 (ja) 信号符号化装置
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
US5822722A (en) Wide-band signal encoder
JP4618823B2 (ja) 信号符号化装置及び方法
JP3803306B2 (ja) 音響信号符号化方法、符号化器及びそのプログラム
JP2000259190A (ja) オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070927

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110927

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120927

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130927

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term