JPH09230897A - 音響信号変換符号化方法 - Google Patents

音響信号変換符号化方法

Info

Publication number
JPH09230897A
JPH09230897A JP8035205A JP3520596A JPH09230897A JP H09230897 A JPH09230897 A JP H09230897A JP 8035205 A JP8035205 A JP 8035205A JP 3520596 A JP3520596 A JP 3520596A JP H09230897 A JPH09230897 A JP H09230897A
Authority
JP
Japan
Prior art keywords
acoustic signal
spectrum
coefficient
outline
frequency characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8035205A
Other languages
English (en)
Other versions
JP3353266B2 (ja
Inventor
Naoki Iwagami
直樹 岩上
Kazunaga Ikeda
和永 池田
Takehiro Moriya
健弘 守谷
Satoshi Miki
聡 三樹
Akio Jin
明夫 神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03520596A priority Critical patent/JP3353266B2/ja
Publication of JPH09230897A publication Critical patent/JPH09230897A/ja
Application granted granted Critical
Publication of JP3353266B2 publication Critical patent/JP3353266B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 重み付きベクトル量子化に適切な聴感制御を
施す。 【解決手段】 入力音響信号のケプストラムを計算し
(63)、その高次のパワーと全体のパワーとの比によ
りスペクトル微細性尺度λを計算し(64)、また低次
までのケプストラム係数のパワーと高次までのケプスト
ラム係数のパワーとの比によりスペクトル概形急峻性尺
度μを計算し(66)、λがしきい値以上で微細性有と
判断(65)、μがしきい値以上で急峻性有と判断し
(67)、微細性有で、ベクトル量子化の重みwi=e
k (eiは入力信号のスペクトル概形要素)中のkを
大とし、急峻性有でkを小とする(68)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明はオーディオ信号、
特に音楽信号などの音響信号を、周波数領域に変換して
できるだけ少ない情報量でディジタル符号化する符号化
方法に関する。
【0002】
【従来の技術】現在、オーディオ信号を高能率に符号化
する方法として、原音をフレームと呼ばれる5〜50m
s程度の一定間隔の区間に分割し、その1フレームの信
号に時間−周波数変換を行って得た周波数領域係数を、
周波数特性の包絡形状(周波数特性概形)と、その周波
数領域係数を前記周波数特性概形で平坦化して得られる
残差係数という2つの情報とに分離し、それぞれを量子
化することが提案されている。この従来の符号化方法及
び復号化方法の処理手順を、図5を参照しながら説明す
る。
【0003】符号化順10においては手順1は、入力端
子11よりの入力音響信号を、時間−周波数変換部12
によって周波数領域係数に変換する。この変換の方法と
しては、MDCT(Modified Discret
e Cosine Transformation,変
形離散コサイン変換)や、DCT(DiscreteC
osine Transformation,離散コサ
イン変換)、DFT(Discrete Fourie
r Transformation,離散フーリエ変
換)などを用いることができる。なお、時間−周波数変
換部12では、前処理として、入力信号サンプル列のフ
レーム分割と窓掛けが必要である。フレーム分割は、M
DCTの場合入力サンプルがN点入力されるごとにこれ
を含む過去2N点のサンプルを1フレームとして分割す
る。DCTとDFTの場合入力サンプルがN点ごとにこ
れを含む過去N+α点のサンプルを1フレームとして分
割する。窓掛けは従来行われている手法により行い、い
ずれの変換方法でも、N点の周波数領域係数が得られ
る。
【0004】手順2は、概形計算部13で周波数領域係
数の概形抽出する。この概形抽出方法としては、前処理
された音響信号を入力として線形予測分析をする方法、
周波数領域係数を入力としてスケールファクタを計算す
る方法、周波数領域係数をリフタリングする方法などを
用いることができる。線形予測分析をする方法では、入
力信号を線形予測分析し、線形予測係数を求め、この係
数のスペクトル振幅の逆数を周波数特性概形とする。線
形予測の次数は、20次程度にするのが効果的である。
【0005】スケールファクタを計算する方法では、周
波数領域係数を複数の小帯域に分割し、小帯域ごとにス
ケールファクタを計算し、これを周波数特性概形とす
る。小帯域に分割する方法は、周波数スケールで等間隔
としてもよいし、バークスケールで等間隔(つまり聴覚
的に等間隔)としてもよい。小帯域の数は30程度に設
定するのが効果的である。スケールファクタは小帯域内
のサンプルの振幅の平均値でもよいし、振幅の最大値で
もよい。
【0006】周波数領域係数をリフタリングする方法で
は、周波数領域係数をケプストラム分析し、ケプストラ
ム係数の低次部分のみのスペクトル振幅を周波数特性概
形とする。また、周波数領域係数の概形は、上記の方法
の併用により求めてもよい。たとえば、線形予測分析と
スケールファクタを併用する場合、線形予測分析による
線形予測スペクトルを決定した後、これに掛け合わせた
際に実際の周波数特性にもっとも近い形状になるように
スケールファクタを決定するなどの方法をとる。
【0007】手順3では、手順2で求めた周波数特性概
形を概形量子化部14で量子化して、そのインデックス
In1を得る。周波数特性概形を線形予測分析により求め
た場合、線形予測係数を線スペクトル対(LSP)に変
換し、これを量子化する方法が能率がよい。スケールフ
ァクタを量子化する場合、各々のスケールファクタをス
カラー量子化してもよいし、いくつかのスケールファク
タをまとめてベクトル量子化してもよい。ベクトル量子
化をする際、インタリーブベクトル量子化の技術を使う
と、能率良く量子化が可能である。ケプストラム係数を
量子化する場合、ケプストラム係数をスカラー量子化し
てもよいし、ベクトル量子化してもよい。
【0008】いずれの方法も、予測量子化を行うとさら
に高い能率が得られる。予測の方法としては、AR予
測、MA予測などを用いることができる。手順2で複数
方法で周波数特性概形を求めた場合、用いたすべての方
法について量子化を行う。手順4では、手順3で量子化
した周波数特性概形を概形再生部15で復号化し、周波
数特性概形を再生する。線スペクトル対を量子化した場
合、復号化して得られた再生線スペクトル対を再生線形
予測係数に変換し、再生線形予測係数のスペクトル振幅
の逆数を再生周波数特性概形とする。スケールファクタ
を量子化した場合、復号化した再生スケールファクタを
再生周波数特性概形とする。ケプストラム係数を量子化
した場合、復号化された再生ケプストラム係数のスペク
トル振幅を再生周波数特性概形とする。
【0009】手順5では、平坦化部16において手順1
で得られた周波数領域係数を手順4で得られた再生周波
数特性概形で平坦化する。ここでは、各々の周波数領域
係数をこれに対応する周波数特性概形で割ることによっ
て平坦化周波数領域係数(残差周波数係数)が得られ
る。手順6では手順5で得られた平坦化周波数係数を残
差量子化部17でベクトル量子化してインデックスIn2
を得る。この量子化方法として、重み付きベクトル量子
化による変換符号化法(TC−WVQ,Transfo
rm Codingwith Weighted Ve
ctor Quantization)、周波数領域重
み付けインタリーブベクトル量子化法(TWINVQ,
Transform−domain Weighted
Interleave Vector Quanti
zation)などがある。それぞれの技術について
は、T.Moriya,H.Suda:“An 8kb
it/s transformcoder for n
oisy channels,”Proc.ICASS
P '89 pp196−199および岩上、守谷、三
樹、“周波数領域重みづけインタリーブベクトル量子化
(TwinVQ)によるオーディオ符号化、”日本音響
学会講演論文集 平成6年10月〜11月pp.339
−340に述べられている。
【0010】復号化側20において、手順7では、手順
6で量子化された平坦化された周波数領域係数のインデ
ックスIn2を再生部21で復号再生する。手順8では、
手順3で量子化した周波数特性概形のインデックスIn1
を再生部22で復号化し、再生周波数特性概形を再生す
る。手順3で線スペクトル対を量子化した場合、復号化
して得られた再生線スペクトル対を再生線形予測係数に
変換し、再生線形予測係数のスペクトル振幅の逆数を再
生周波数特性概形とする。スケールファクタを量子化し
た場合、復号化した再生スケールファクタを再生周波数
特性概形とする。ケプストラム係数を量子化した場合、
復号化された再生ケプストラム係数のスペクトル振幅を
再生周波数特性概形とする。
【0011】なお、手順3で予測量子化を行った場合、
同じ予測合成を用いて再生を行う。手順3で複数方法の
量子化を行った場合、すべての方法について再生を行
い、たとえば各々で再生した概形を互いに掛け合わせる
などの方法により再生周波数特性概形を得る。手順9で
は、手順7で得られた、再生された平坦化周波数領域係
数を、手順8で得られた、再生周波数特性概形を用いて
逆平坦化部23で逆平坦化する。ここでは、各々の再生
された平坦化周波数領域係数と、これに対応する再生周
波数特性概形を掛け合わせることによって逆平坦化が行
われ、再生周波数領域係数が得られる。
【0012】手順10では、周波数−時間変換部24に
よって再生周波数領域係数を出力音響信号に変換出力す
る。変換の方法としては、IMDCT(Inverse
Modified Discrete Cosine
Transformation,逆変形離散コサイン
変換)や、IDCT(Inverse Discret
e Cosine Transformation,逆
離散コサイン変換)、IDFT(Inverse Di
screte Fourier Transforma
tion,逆離散フーリエ変換)などを用いることがで
きる。なお、周波数−時間変換部では、後処理として、
出力信号サンプル列の窓掛けとフレーム結合が必要であ
る。窓掛けは従来の手法と同様に行う。
【0013】
【発明が解決しようとする課題】従来の符号化法におい
て、通常は残差周波数係数を重み付きベクトル量子化し
ている。このベクトル量子化では、コードブック探索の
際、式(1)で表される重み付き距離尺度dを用い、こ
の距離尺度dが最小のコードベクトルC(n) を最適ベク
トルとする。
【0014】 d(n) =Σwi2 {ri −ci (n) }2 (1) Σはi=0からm−1までただし、nはコードブックの
ベクトル番号、wは重み係数、rは残差周波数係数、c
はコードベクトル、iはベクトルインデックス、mはベ
クトル長をあらわす。従来、重み係数wとして、平坦化
に用いた周波数特性概形を1.0以下の定数値でべき乗
した値を用いていた(式(2))。
【0015】 wi =eik (2) ここで、eは平坦化に用いた周波数特性概形、kは定数
である。k=1.0の時量子化歪みは最小になるが、量
子化歪みのスペクトルは図7Aに示すように平坦にな
り、信号のエネルギーの小さい高域部分で、量子化歪み
が聞こえやすくなってしまう。一方、k=1.0よりも
小さいときには図7Bに示すように量子化歪みは大きく
なるが、スペクトル形状は入力信号のスペクトル形状と
類似したものになり、エネルギーの小さい高域部分でも
量子化歪みは聞こえにくい。このように、式(2)にお
いて、kは1.0より小さく設定した方が良好な量子化
性能を得ることができる。
【0016】従来法では、kの値は、0.3から0.8
程度の定数である。しかし、式(2)で表される重み係
数の変形による聴感制御は簡易的なもので、聴覚特性に
完全に対応しているわけではなく、符号化する音響信号
のスペクトル形状によって最適なkの値は異なる。そこ
で、復号化された音響信号に対しより高い品質を求める
場合、手動でkの値を調整することが必要であるが、こ
ういった手動の再調整は、実用上大きな支障となる。
【0017】この発明の目的は、上記kの値を自動的に
調整し、重み付きベクトル量子化により適切な聴感制御
を行う符号化方法を提供することにある。
【0018】
【課題を解決するための手段】この発明では、入力音響
信号に対応してべき係数kを変化させる。具体的には入
力音響信号のスペクトルに含まれる微細構造の大小を表
す尺度を計算し、この尺度に従って、微細構造が多く含
まれるとき、つまり微細性があるときには、kの値を大
きく、微細構造が少なく含まれるとき、つまり微細性が
ないときには、kの値を小さくする。このkの変化と同
時に、又は、微細構造の有無と入力音響信号のスペクト
ルの概形の傾き具合を表す尺度を計算し、この尺度に従
って、スペクトル概形の傾きが大きいときには、kの値
を小さく、傾きが小さいときにはkの値を大きくする。
【0019】
【発明の実施の形態】この発明の実施例を図1を参照し
て説明する。図1において図1と対応する部分に同一符
号を付けてある。この実施例においても、従来法と同様
に入力音響信号を周波数領域に変換し、その周波数領域
係数を平坦化する。この実施例でベクトル量子化部17
で重み付きベクトル量子化する。これに必要とする重み
係数を手順11で求める。
【0020】手順11では、手順6の重み付きベクトル
量子化で用いる重みを重み計算部61で計算する。その
入力としては手順4で得られた再生周波数特性概形を用
いる。この実施例では、式(2)の計算式に従って重み
を計算するがこの発明ではべき係数kは手順12で生成
された値が用いられる。手順12では、手順11で使う
べき係数kを重み計算制御部62で生成する。その入力
としては入力音響信号を用いる。図2に重み計算制御部
62の詳細な機能構成を示す。
【0021】手順12−1では、入力端子11からの入
力音響信号に前処理を掛けてからケプストラム(ベクト
ル)をケプストラム計算部63で計算する。その前処理
では、手順1と同じ大きさでフレーム分割を行った後窓
掛けをする。窓はハミング窓やハニング窓などを用いる
ことができる。ケプストラムの分析次数NceはN/4
(Nは1フレームのサンプル数)程度にすると効果的で
ある。
【0022】手順12−2では、手順12−1で得られ
たケプストラムから、スペクトル微細性尺度λをスペク
トル微細性尺度計算部64で計算する。具体的には、ケ
プストラムの高次のパワーと全体のパワーの比を計算す
る。式(3)はそのパワーの比の計算方法の一例であ
る。 λte=Σci /(Σci) (3) 分母のΣはi=1からNce−1まで、分子のΣはi=N
cuからNce−1までただし、ciはケプストラムのケプ
ストラム係数、Nceはケプストラムの次数、Ncuはケプ
ストラム高次のカットオフ点である。Ncu=Nce/50
程度に設定すると良好な性能が得られる。ここで得られ
たλteをそのままスペクトル微細性尺度λとしてもよい
し、現在フレームと過去フレームで得られたλteの値を
線形和して得られた値をλとしてもよい。
【0023】手順12−3では、手順12−2で得られ
たスペクトル微細性尺度λから、スペクトルの微細性の
有無をスペクトル微細性判断部で判断する。この判断は
しきい値を設定し、λがそのしきい値を越えた場合スペ
クトルの微細性があると判断する。そのしきい値の値は
0.3程度に設定する。あるいは、図3Bに示すような
判断アルゴリズムを用いてもよい。即ちまず1フレーム
前のスペクトルの微細性を示すスイッチsw−pが0か
(微細性なしか)を調べ(S1 )、微細性がなければ、
swを0とし(S2 )、λがしきい値THR1より大か
を調べ(S3 )、大であればswを1とし(S4 )、大
でなければswはそのままとする。ステップS1 でsw
−pが0でなければ、swを1とし(S5 )、λがしき
い値THR2より小さいかを調べ(S6 )、小さければ
swを0とし(S7 )、小さくなければswをそのまま
とする。このようにして得られたswの値を現在フレー
ムにおける微細性有無の判断結果とした後、そのswを
sw−pとして微細性有無判断処理を終了する
(S8 )。THR1,THR2の各値はそれぞれ0.
2,0.4を用いるとよい。
【0024】つまり全体のパワーに対して高次のパワー
の比率が大ということは、入力信号の高周波成分が多
く、振幅変動が大でスペクトルの微細性が有ることを示
す。手順12−4では(図2)、スペクトル概形の急峻
性尺度μをスペクトル概形急峻性尺度計算部66で計算
する。具体的には、ケプストラム計算部63で求めたケ
プストラムの低次までのケプストラム係数のパワーと高
次までのケプストラム係数のパワーの比を計算する。式
(4)はそのパワーの比の計算方法の一例である。
【0025】 μte=Σci /(Σci) (4) 分母のΣはi=NbaからNH −1まで、分子のΣはi=
NbaからNL −1までただし、NL ,NH はそれぞれケ
プストラム係数のパワー計算の低次、高次の範囲、Nba
はケプストラム係数のパワー計算の開始点である。
L ,NH の値は、それぞれNce/18、Nce/5程度
に設定するとよい。ここで得られたμteをそのままスペ
クトル概形の急峻性尺度μとしてもよいし、現在フレー
ムと過去フレームで得られたμteの値を線形和して得ら
れた値をμとしてもよい。
【0026】直流レベルが大きいので、これを除くため
にNbaが設定されNbaは5〜10程度である。直流を除
いた全パワーに対する低域部のパワーの比率をμとして
求めている。手順12−5では、手順7−4で得られた
スペクトル概形急峻性尺度μから、スペクトル概形の急
峻性の有無をスペクトル概形急峻性判断部67で判断す
る。しきい値を設定し、μがしきい値を越えた場合スペ
クトル概形の急峻性があると判断する。そのしきい値の
値は0.7程度に設定する。あるいは、図3に示したよ
うな判断アルゴリズムを用いてもよい。この場合sw
は、スペクトル概形の急峻性の有無を示すスイッチ、s
w−pは1フレーム前の急峻性の有無を示すスイッチで
あり、THR1,THR2の値は、それぞれ0.45,
0.8を用いるとよい。つまり直流の除く低域にエネル
ギーが集中している場合スペクトル概形の急峻性が有る
と判断する。
【0027】手順12−6では、手順12−3と手順1
2−5で得られたスペクトルの微細性と急峻性の有無の
判断結果から、重み計算部61で用いる、べき係数kを
べき乗係数出力部68で決定する。下記にべき係数kの
一例を示す。 手順6では、手順5で平坦化された周波数領域係数を量
子化部17で重み付きベクトル量子化する。ここではま
ず、平坦化された周波数領域係数を長さ15程度の小ベ
クトルに分割し、各々の小ベクトルについて重み付きベ
クトル量子化する。小ベクトルに分割する方法として
は、インタリーブ分割してもよいし、サブバンド分割し
てもよい。インタリーブ分割の技術についての詳細は、
岩上、守谷、“周波数領域重み付けインタリーブベクト
ル量子化(TwinVQ)によるオーディオ符号化、”
日本音響学会講演論文集、平成6年10月〜11月、p
p.339〜340に記述されている。
【0028】ベクトル量子化の際の距離尺度の計算は式
(1)に従って行う。ここで得られた距離尺度dが最小
となるコードベクトルを最適ベクトルとして選択する。
図4Aに示すように入力信号のスペクトルに微細構造が
多く含まれる場合、マスキング効果により、スペクトル
の微細構造の谷の部分の量子化歪みは聞こえにくいが、
この場合この実施例でkは0.6又は0.8と微細構造
が少ない場合よりkの値が大とされ、量子化歪みのスペ
クトル形状を入力信号のスペクトル形状に類似させる度
合いが小さくされ、量子化歪み全体が小さくされ、良好
な量子化性能が得られる。
【0029】また図4Bに示すように入力信号のスペク
トルの低域が極端に大きく、その高域側の傾きが急峻で
高域のレベルが小さい場合は高域で量子化歪みがより聞
こえやすくなるが、この実施例ではこのような場合には
kが0.6又は0.4と急峻性がある場合より小さめに
設定され、量子化歪みのスペクトル形状の変形が強くか
かり、入力信号のスペクトル形状に類似して良好な量子
化性能が得られる。
【0030】このようにして、この発明では、入力音響
信号のスペクトル形状を判断してkの値を変化させるこ
とにより、式(1)で表される重み付きベクトル量子化
の距離尺度計算に、より聴覚特性に近い聴感制御を施す
ことができる。復号化の手法は従来の方法と同様に行え
ばよい。次にこの発明の他の実施例を図4に示し、図1
と対応する部分に同一符号を付けてある。
【0031】手順2′では、周波数特性概形抽出部31
により手順5で得られた平坦化周波数領域係数(残差周
波数係数)の概形を求める。この概形抽出方法として
は、平坦化周波数領域係数を入力としてスケールファク
タを計算する方法、平坦化周波数領域係数をリフタリン
グする方法などを用いることができる。スケールファク
タを計算する方法では、平坦化周波数領域係数を複数の
小帯域に分割し、小帯域ごとにスケールファクタを計算
し、これを第2周波数特性概形とする。小帯域に分割す
る方法は、周波数スケールで等間隔としてもよいし、バ
ークスケールで等間隔(聴覚的に等間隔)としてもよ
い。小帯域の数は30程度に設定するのが効果的であ
る。スケールファクタは小帯域内のサンプルの振幅の平
均値でもよいし、振幅の最大値でもよい。
【0032】平坦化周波数領域係数をリフタリングする
方法では、平坦化周波数領域係数をケプストラム分析
し、ケプストラム係数の低次部分のみのスペクトル振幅
を第2周波数特性概形とする。手順3′では、手順2′
で求めた第2周波数特性概形を概形量子化部32で量子
化してインデックスより3を得る。スケールファクタを
量子化する場合、各々のスケールファクタをスカラー量
子化してもよいし、いくつかのスケールファクタをまと
めてベクトル量子化してもよい。ベクトル量子化をする
際、インタリーブベクトル量子化の技術を使うと、能率
良く量子化が可能である。ケプストラム係数を量子化す
る場合、ケプストラム係数をスカラー量子化してもよい
し、ベクトル量子化してもよい。
【0033】いずれの方法も、予測量子化を行うとさら
に高い能率が得られる。予測の方法としては、AR予
測、MA予測などを用いることができる。手順4′で
は、手順3′で量子化した第2周波数特性概形再生部3
3で復号化し、再生第2周波数特性概形を再生する。ス
ケールファクタを量子化した場合、復号化した再生スケ
ールファクタを第2再生周波数特性概形とする。ケプス
トラム係数を量子化した場合、復号化された再生ケプス
トラム係数のスペクトル振幅を再生第2周波数特性概形
とする。
【0034】手順5′では、手順5で得られた平坦化周
波数領域係数を手順4′で得られた再生第2周波数特性
概形で平坦化部34において平坦化する。ここでは、各
々の平坦化周波数領域係数をこれに対応する再生第2周
波数特性概形で割ることによって第2平坦化周波数領域
係数が得られる。手順11′では、手順6の重み付きベ
クトル量子化で用いる重みを重み計算部35で計算す
る。入力として、再生部15,33でそれぞれ得られた
再生周波数特性概形及び再生第2周波数特性概形を用い
る。ここでは、式(5)の計算式に従って重みを計算す
る。ただしwは重み、e1は再生周波数特性概形の各要
素、e2は再生第2周波数特性概形の各要素であり、ま
たiは0からN−1の数である。べき係数k1,k2の
値は、手順12′で生成される。
【0035】 wi =(e1i)k1(e2i)k2 (5) 手順12′では、手順11′で使うべき係数k1,k2
を重み計算制御部62で生成する。入力として、入力音
響信号を用いる。ここでは、手順12と同じ方法でスペ
クトルの微細性とスペクトル概形急峻性の有無を判断す
る。次に、スペクトルの微細性と急峻性の有無の判断結
果から、手順11′の重み計算部35で用いる、べき係
数k1,k2を決定する。べき係数k1,k2の一例を
下記に示す。
【0036】 微細性あり 微細性なし 急峻性あり k1=0.5、k2=0.6 k1=0.4、k2=0.5 急峻性なし k1=0.7、k2=0.8 k1=0.5、k2=0.6 復号化側においては周波数特性概形再生部57でインデ
ックスIn3から第2周波数特性概形を再生する。手順
3′でスケールファクタを量子化した場合、復号化した
再生スケールファクタを再生第2周波数特性概形とす
る。ケプストラム係数を量子化した場合、復号化された
再生ケプストラム係数のスペクトル振幅を再生第2周波
数特性概形とする。
【0037】なお、手順3′で予測量子化を行った場
合、同じ予測合成を用いて再生を行う。インデックスI
n2を残差再生部21で逆ベクトル量子化して第2平坦化
周波数領域係数を得、この第2平坦化周波数係数を、再
生第2周波数特性概形で逆平坦化部58において、逆平
坦化して平坦化周波数領域係数を得、この平坦化周波数
領域係数を、再生部22よりのインデックスIn1を復号
化した再生周波数特性概形で逆平坦化部23において逆
平坦化して、周波数領域係数を再生して周波数、時間変
換部24へ供給する。
【0038】上述においては入力音響信号のスペクトル
形状に微細性があるか否かと、急峻性があるか否かを検
出し、その結果に応じて、重み計算部61で用いるk又
はk1及びk2を適応的に決定した。しかし微細性の有
無のみ又は急峻性の有無のみを検出して、k又はk1及
びk2を決定してもよい。つまり前記数値例によると、
微細性がある場合はkを0.8又はk1=0.7、k2
=0.8とし、ない場合はkを0.6又はk1=0.
5,k2=0.6とし、また急峻性がある場合はk=
0.4又はk1=0.4,k2=0.5とし、ない場合
はk=0.6又はk1=0.5,k2=0.6とする。
また上述では式(5)においてk1とk2の両者を入力
音響信号のスペクトル概形に応じて適応的に変更した
が、その一方のみを変更し、他方は固定値としてもよ
い。更に上述ではスペクトル概形の微細性の有無、急峻
性の有無をケプストラム領域で判定したが、例えばスペ
クトルの振幅の分散により微細性の有無を、またスペク
トル形状の全体の傾きにより急峻性の有無を判定しても
よい。更に入力音響信号のスペクトル概形に応じてkの
値を適応的に変化させる場合に限らず、例えば入力音響
信号の時間パターンにおいて時間的に急激な変化がある
かないかに応じてkの値を適応的に変化させてもよい。
要は入力音響信号に応じてkの値を適応的に変化させて
もよい。
【0039】
【発明の効果】以上述べたように、この発明によれば、
入力信号に応じ、特にそのスペクトルの形状に応じてス
ペクトルが微細構造を多く含むとき、スペクトルの微細
構造の谷部分にある量子化歪みは聴覚的に検知しにくい
から、量子化の際の聴感制御を弱める。
【0040】またスペクトル概形の傾きが大きいとき、
スペクトル振幅のエネルギーが小さい部分(高域部分)
での量子化歪みが聴覚的に検知しやすいから、量子化の
際の聴感制御を強める。このようにして、この発明は重
み付きベクトル量子化に適切な聴感制御を施すことを可
能にする。
【図面の簡単な説明】
【図1】この発明の第1の実施例を適用した符号化側及
び復号化側の機能構成図。
【図2】図1中の重み計算制御部62の具体的機能構成
例を示すブロック図。
【図3】微細性又は急峻性の有無の判定処理手順の例を
示す流れ図。
【図4】適応的聴感制御の必要性を表す入力音響信号及
び量子化誤差の各スペクトルの模式図。
【図5】この発明の第2の実施例を適用した符号化側及
び復号化側の機能構成を示すブロック図。
【図6】変換符号化復号化方法の従来技術の符号化側及
び復号化側の機能構成を示すブロック図。
【図7】量子化の聴感制御の効果を表す入力信号及び量
子化誤差の各スペクトルの模式図。
フロントページの続き (72)発明者 三樹 聡 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 神 明夫 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力音響信号を周波数領域係数に変換
    し、その周波数領域係数を、上記入力音響信号の周波数
    特性概形で平坦化し、その平坦化周波数領域係数を重み
    付けベクトル量子化し、 そのベクトル量子化に用いる重み係数を、上記周波数特
    性概形を1以下の非整数でべき乗することにより求める
    符号化方法において、 上記べき係数を、上記入力音響信号に対応して変化させ
    る第1の段階を有することを特徴とする音響信号変換符
    号化方法。
  2. 【請求項2】 上記第1の段階は上記入力音響信号のス
    ペクトル形状によって上記べき係数を変化させることで
    あることを特徴とする請求項1記載の音響信号変換符号
    化方法。
  3. 【請求項3】 上記第1の段階は上記入力音響信号のス
    ペクトルの微細性によって微細性が多いと上記べき係数
    を大きくさせることであることを特徴とする請求項2記
    載の音響信号変換符号化方法。
  4. 【請求項4】 第1の段階は上記微細性によるべき係数
    の変化と共に、上記入力音響信号のスペクトル概形の急
    峻性によって急峻性が大であると上記べき係数を小さく
    させることであることを特徴とする請求項3記載の音響
    信号変換符号化方法。
  5. 【請求項5】 上記第1の段階における上記微細性は上
    記入力音響信号のケプストラムの高次部分のエネルギー
    の大小で求めることを特徴とする請求項3又は4記載の
    音響信号変換符号化方法。
  6. 【請求項6】 上記第1の段階は上記入力音響信号のス
    ペクトル概形の急峻性によって急峻性が大であると上記
    べき係数を小さくさせることであることを特徴とする請
    求項2記載の音響信号変換符号化方法。
  7. 【請求項7】 上記第1の段階における上記急峻性は上
    記入力音響信号のケプストラムの低次部分のエネルギー
    の大小で求めることを特徴とする請求項4又は6記載の
    音響信号変換符号化方法。
  8. 【請求項8】 上記平坦化周波数領域係数は、上記周波
    数領域係数を入力音響信号の周波数特性概形で平坦化
    し、更にその平坦化された周波数領域係数を、その周波
    数特性概形で平坦化したものであり、上記重み係数は、
    上記1回目の平坦化に用いた周波数特性概形を1以下の
    非整数k1でべき乗したものと、上記2回目の平坦化に
    用いた周波数特性概形を1以下の非整数k2でべき乗し
    たものとの積であり、上記べき係数は上記k1及びk2
    の少なくとも一方であることを特徴とする請求項1乃至
    7の何れかに記載の音響信号符号化方法。
JP03520596A 1996-02-22 1996-02-22 音響信号変換符号化方法 Expired - Lifetime JP3353266B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03520596A JP3353266B2 (ja) 1996-02-22 1996-02-22 音響信号変換符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03520596A JP3353266B2 (ja) 1996-02-22 1996-02-22 音響信号変換符号化方法

Publications (2)

Publication Number Publication Date
JPH09230897A true JPH09230897A (ja) 1997-09-05
JP3353266B2 JP3353266B2 (ja) 2002-12-03

Family

ID=12435362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03520596A Expired - Lifetime JP3353266B2 (ja) 1996-02-22 1996-02-22 音響信号変換符号化方法

Country Status (1)

Country Link
JP (1) JP3353266B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11327600A (ja) * 1997-10-03 1999-11-26 Matsushita Electric Ind Co Ltd オーディオ信号圧縮方法、オーディオ信号圧縮装置、音声信号圧縮方法、音声信号圧縮装置,音声認識方法および音声認識装置
US6477490B2 (en) 1997-10-03 2002-11-05 Matsushita Electric Industrial Co., Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
JP2003505724A (ja) * 1999-07-19 2003-02-12 クゥアルコム・インコーポレイテッド 音声符号器用のスペクトル・マグニチュード量子化
JP2007506986A (ja) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置
JP2009545775A (ja) * 2006-07-31 2009-12-24 クゥアルコム・インコーポレイテッド ゲインファクタ制限のためのシステム、方法及び装置
JP4864201B2 (ja) * 1998-05-27 2012-02-01 マイクロソフト コーポレーション 音声信号の量子化ノイズをマスクするためのシステムと方法
US8438012B2 (en) 2008-12-22 2013-05-07 Electronics And Telecommunications Research Institute Method and apparatus for adaptive sub-band allocation of spectral coefficients

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11327600A (ja) * 1997-10-03 1999-11-26 Matsushita Electric Ind Co Ltd オーディオ信号圧縮方法、オーディオ信号圧縮装置、音声信号圧縮方法、音声信号圧縮装置,音声認識方法および音声認識装置
US6477490B2 (en) 1997-10-03 2002-11-05 Matsushita Electric Industrial Co., Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
JP4864201B2 (ja) * 1998-05-27 2012-02-01 マイクロソフト コーポレーション 音声信号の量子化ノイズをマスクするためのシステムと方法
JP2003505724A (ja) * 1999-07-19 2003-02-12 クゥアルコム・インコーポレイテッド 音声符号器用のスペクトル・マグニチュード量子化
JP2007506986A (ja) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置
JP2009545775A (ja) * 2006-07-31 2009-12-24 クゥアルコム・インコーポレイテッド ゲインファクタ制限のためのシステム、方法及び装置
US9454974B2 (en) 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8438012B2 (en) 2008-12-22 2013-05-07 Electronics And Telecommunications Research Institute Method and apparatus for adaptive sub-band allocation of spectral coefficients

Also Published As

Publication number Publication date
JP3353266B2 (ja) 2002-12-03

Similar Documents

Publication Publication Date Title
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
US9305558B2 (en) Multi-channel audio encoding/decoding with parametric compression/decompression and weight factors
EP0942411B1 (en) Audio signal coding and decoding apparatus
US8301439B2 (en) Method and apparatus to encode/decode low bit-rate audio signal by approximiating high frequency envelope with strongly correlated low frequency codevectors
JP3762579B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
JP2000276197A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6772111B2 (en) Digital audio coding apparatus, method and computer readable medium
JP3765171B2 (ja) 音声符号化復号方式
US8825494B2 (en) Computation apparatus and method, quantization apparatus and method, audio encoding apparatus and method, and program
EP2560163A1 (en) Apparatus and method of enhancing quality of speech codec
JPH07261800A (ja) 変換符号化方法、復号化方法
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
JP3353266B2 (ja) 音響信号変換符号化方法
JPH11184498A (ja) 音声符号化/復号化方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3353267B2 (ja) 音響信号変換符号化方法及び復号化方法
TWI793666B (zh) 對多頻道音頻信號的頻道使用比例參數的聯合編碼的音頻解碼器、音頻編碼器和相關方法以及電腦程式
JP4274614B2 (ja) オーディオ信号復号方法
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
JP3384523B2 (ja) 音響信号処理方法
JPH10340098A (ja) 信号符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070927

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110927

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120927

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130927

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term