JPH09179588A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPH09179588A
JPH09179588A JP7339390A JP33939095A JPH09179588A JP H09179588 A JPH09179588 A JP H09179588A JP 7339390 A JP7339390 A JP 7339390A JP 33939095 A JP33939095 A JP 33939095A JP H09179588 A JPH09179588 A JP H09179588A
Authority
JP
Japan
Prior art keywords
filter
signal
spectrum
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7339390A
Other languages
English (en)
Inventor
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7339390A priority Critical patent/JPH09179588A/ja
Publication of JPH09179588A publication Critical patent/JPH09179588A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】符号化雑音を効果的に抑圧できる音声符号化方
法を提供する。 【解決手段】符号化誤差を表す誤差信号107を各周波
数成分毎に異なる所定の重み付けを行う聴感重みフィル
タ108に通し、この聴感重みフィルタ108に通した
誤差信号がより小さくなるように音声信号の符号化を行
う音声符号化方法において、フィルタ制御部109によ
り音声信号のスペクトルの時間的変化を検出し、この時
間的変化が所定のしきい値以下のときは聴感重みフィル
タ108の特性を現フレームのスペクトルに基づいて制
御し、時間的変化がしきい値より大きいときは聴感重み
フィルタ108の特性を現フレームとこれに時間的に近
いフレームのスペクトルに基づいて制御する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電話帯域の音声信
号や、楽音信号などのオーディオ帯域の音声信号を高能
率に圧縮符号化する音声符号化方法に関する。
【0002】
【従来の技術】電話帯域の音声信号を高能率に圧縮符号
化する技術は、利用できる電波帯域が限られている移動
体通信や、メモリの有効利用が求められるボイスメール
などの蓄積媒体において今や不可欠の技術になってお
り、現在より低いビットレートへ向かっている。電話帯
域の音声信号を低ビットレートで符号化する方式とし
て、CELP(Code Excited Linear Prediction)方式
は有効な方式の一つである。この方式はフレーム単位に
分割された入力音声信号から声道をモデル化した音声合
成フィルタの特性を求める処理と、この音声合成フィル
タの入力信号に当たる駆動信号を求める処理に大別され
る。
【0003】これら処理のうち、後者の駆動信号を求め
る処理は、駆動ベクトル符号帳に格納された複数の駆動
ベクトルを一つずつ合成フィルタに通して生成される合
成音声信号の歪、すなわち入力音声信号に対する合成音
声信号の誤差信号を計算し、この誤差信号が最小となる
駆動ベクトルを探索する処理からなる。これは閉ループ
探索と呼ばれており、8kbps程度のビットレートで
良好な音質を再生するために非常に有効な方法である。
しかし、ビットレートが4kbps程度以下と低くなる
と、この方法では十分な品質の音声を再生できなくなる
問題がある。
【0004】CELP方式に関しては、M.R.Schroeder
and B.S.Atal,“Code Excited Linear Prediction (CE
LP) :High Quality Speech at Very Low Bit Rates”,
Proc.ICASSP,pp.937-940,1985 および W.S.Kleijin, D.
J.Krasinski et al.“Improved Speech Quality and Ef
ficient Vector Quantization in SELP ”,Proc.ICASS
P,pp.155-158,1988 で詳しく述べられている。
【0005】図4を用いてCELP方式の概略を説明す
る。入力端子400にフレーム単位で入力される音声信
号はLPC分析部(線形予測分析部)401で分析さ
れ、ここで重み付き合成フィルタ402のフィルタ係数
が求められる。また、入力音声信号は聴感重み付け部4
03にも入力され、重み付き入力音声信号が得られる。
この重み付き入力音声信号から重み付き合成フィルタ4
02の零状態応答が差し引かれ、目標ベクトル404が
生成される。
【0006】一方、適応符号帳411から駆動ベクトル
が一つずつ取り出され、ゲイン回路421を介して重み
付き合成フィルタ402に駆動信号として入力されるこ
とにより合成音声ベクトルが生成される。この合成音声
信号ベクトルの歪、すなわち目標ベクトル404に対す
る誤差信号が評価部410で評価され、この誤差信号が
より小さくなるように駆動ベクトルが適応符号帳411
から探索され、最適なものが第1の駆動ベクトルとされ
る。次に、この第1の駆動ベクトルの影響を考慮して、
雑音符号帳412から第2の駆動ベクトルが同様にして
探索される。最後に、第1および第2の駆動ベクトルに
それぞれゲイン回路413,414で最適なゲインが乗
じられた後、合成されて駆動信号が生成される。この駆
動信号によって適応符号帳411の内容の更新が行わ
れ、次フレームの音声信号の入力に備えられる。
【0007】ここで、重み付き合成フィルタ402およ
び聴感重み付け部403は、合成音声信号および入力音
声信号について、音声のスペクトルで符号化雑音のスペ
クトルをマスクすることにより聴感上の音質を改善する
目的で用いられる。この動作について詳細に説明する。
説明を簡単にするため、入力音声信号と合成音声信号に
対して共通化した聴感重みフィルタを用いた図5を参照
する。
【0008】図5の音声符号化装置においては、入力音
声信号に対する合成音声信号の誤差信号、すなわち符号
化誤差を表す誤差信号が求められ、聴感重みフィルタ5
01に入力される。聴感重みフィルタ501は、誤差信
号のスペクトルに対して各周波数成分毎に異なる重み付
けを行う。適応符号帳411および雑音符号帳412か
らの駆動ベクトルの探索は、評価部410によって聴感
重みフィルタ501で重み付けがなされた誤差信号が最
小となるように行われる。合成フィルタ502として
は、重み付けを行わないフィルタが用いられる。
【0009】一方、I.A.Gerson and M.A.Jasiuk:Techni
ques for improving the performance of CELP type sp
eech coders, IEEE Proc. ICASSP91, pp.205-208 に、
ピッチ重みフィルタを含む改良された聴感重みフィルタ
の構成が開示されている。図6はその一構成例であり、
ホルマント重みフィルタ601とピッチ重みフィルタ6
02からなる聴感重みフィルタである。
【0010】ホルマント重みフィルタ601は、入力音
声信号のLPC分析によって求められたLPCパラメー
タai に基づいてフィルタ係数が設定され、ホルマント
の山の部分に小さな重み、谷の部分に大きな重みをそれ
ぞれかけることにより、図7に示すように符号化雑音の
スペクトル(以下、雑音スペクトルという)を入力音声
信号のスペクトル包絡の形状に整形する働きをする。こ
のホルマント重みフィルタ601の伝達関数W(z)
は、次式で表される。
【0011】
【数1】
【0012】ここでαは雑音整形の度合いを制御する定
数であり、実験的に決められる。典型的な値として、α
=0.7〜0.9が使われる。Pはフィルタの次数であ
り、一般にはP=10に設定される。
【0013】ピッチ重みフィルタ602は、入力音声信
号の分析で求められたピッチパラメータに基づいてフィ
ルタ係数が設定され、ピッチ調和周波数成分に小さな重
み、調和周波数間の成分に大きな重みをそれぞれかける
ことにより、雑音スペクトルをピッチの調和構造に整形
する働きをする。この伝達関数C(z)は、次式で表さ
れる。
【0014】
【数2】
【0015】ここで、cはピッチゲイン、Dはピッチ周
期であり、εは雑音整形の度合いを制御する定数であ
る。典型的な値として、ε=0.4が用いられる。な
お、フィルタの次数は1次としている。
【0016】この聴感重みフィルタは、図7に示したよ
うに誤差信号について符号化に伴って生じる雑音のスペ
クトルを入力音声信号のスペクトル包絡形状に近くなる
ように整形することによって雑音をマスクし、音質を向
上させる効果を持つ。すなわち、レベルの大きい成分と
小さい成分がある周波数範囲内で混在している場合に
は、小さい方の成分は大きい方の成分にマスクされて検
知されなくなる、という人間の聴覚が持つマスキング効
果を利用して、符号化雑音が知覚されにくくしている。
【0017】しかし、上述した従来の聴感重みフィルタ
では、符号化ビットレートがより低くなって符号化雑音
が増加すると、マスキング効果による符号化雑音の抑圧
作用が十分でなくなるため、品質の良い復号音声を再生
することができない。同様の問題は、電話帯域の音声信
号の符号化のみならず、例えばMPEGオーディオなど
のオーディオ帯域の音声信号の符号化において、聴感重
みフィルタで符号化雑音を抑圧しようとする場合にも同
様に起こり得る。
【0018】
【発明が解決しようとする課題】上述したように、従来
のマスキング効果を利用して誤差信号中の符号化雑音を
抑圧するフィルタでは、符号化レートが低くなり符号化
雑音が増加すると、符号化雑音を十分に抑圧することが
できず、品質のよい復号音声の再生ができないという問
題があった。本発明は、このような従来の問題点を解消
すべくなされたもので、符号化雑音をより効果的に抑圧
できる音声符号化方法を提供することを目的とする。
【0019】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は符号化誤差を表す誤差信号をフィルタに通
し、このフィルタに通した誤差信号がより小さくなるよ
うに音声信号の符号化を行う音声符号化方法において、
音声信号のスペクトルの時間的変化を検出し、この変化
に基づいてフィルタの特性を制御することによって、符
号化雑音を効果的に抑圧し、復号音声の音質を向上させ
るようにしたものである。
【0020】従来の聴感重みフィルタは、人間の聴覚の
マスキング効果のうち静的な性質を利用していた。すな
わち、音声信号のスペクトルで音声信号より強度の小さ
い符号化雑音のスペクトルをマスクすることによって、
雑音が知覚されにくくしている。マスクするのに用いる
成分をマスカーと呼び、マスクされる成分をマスキーと
呼ぶが、この静的なマスキングではマスカーと同一時間
内に発生するマスキーを利用する。
【0021】これに対して、本発明ではこのような通常
の静的なマスキング効果のみではなく、マスカーとマス
キーが比較的短い時間ずれている場合に働く動的なマス
キング効果、いわゆるテンポラル・マスキング効果も利
用する。
【0022】人間の聴覚には記憶があり、例えば夏祭で
太鼓の大きな音が急に止んでも暫く太鼓が聞こえる様な
気がした経験は多くの人が持っている。そして、大きな
太鼓の音の後に続く小さな音は聞こえにくくなる。これ
がテンポラル・マスキングと呼ばれる効果である。ま
た、テンポラル・マスキング効果は大きな音の後の小さ
な音が聞こえにくくなる場合のみでなく、大きな音の前
の小さな音も聞こえにくくなる場合もあり、前者を前向
性マスキング、後者を後方性マスキングと呼ぶ。このよ
うな聴覚の性質を周波数スペクトルでさらに詳しく調べ
るため、ある周波数の単音を被験者に聞かせ、聞こえな
くなった瞬間をベルのスイッチを押すことで被検者に通
知する実験を行うと、(1)単音のレベルを急に零にし
ても暫くの間その音が聞こえる、(2)初めに呈示した
第1の単音のレベルを零にした瞬間に、第1の単音と近
接した周波数の別の第2の単音を呈示した場合、第2の
単音は知覚されず第1の単音のみ知覚される、という結
果が得られる。
【0023】これらのことから、ある周波数fの信号成
分が急に消滅しても、その成分に近接した周波数の雑音
成分は、聴覚の記憶作用により周波数fの信号成分でマ
スクされ、知覚され難くなることが分かる。
【0024】このような周波数スペクトルのテンポラル
・マスキング効果を通常の静的なマスキング効果と併せ
て利用するために、本発明では音声信号のスペクトルの
時間的変化を検出し、この変化に基づいて誤差信号用の
フィルタの特性を変化させる。より具体的には、符号化
誤差を表す誤差信号をフィルタに通して各周波数成分毎
に異なる所定の重み付けを行い、この重み付けされた誤
差信号がより小さくなるように、フレーム単位で入力さ
れる音声信号の符号化を行う音声符号化方法において、
音声信号のスペクトルの時間的変化を検出し、この時間
的変化が所定のしきい値以下のときは前記フィルタの特
性を現フレームのスペクトルに基づいて制御し、この時
間的変化がしきい値より大きいときは前記フィルタの特
性を現フレームとこれに時間的に近いフレームのスペク
トルに基づいて制御することにより、現フレームに時間
的に近いフレームのスペクトルの情報も利用して符号化
雑音の重み付けによる整形を行う。
【0025】このようにすると聴覚の静的なマスキング
だけでなく、スペクトルのテンポラル・マスキングも利
用することができるようになるため、符号化雑音がより
知覚されにくくなり、復号音声の品質が向上する。
【0026】また、本発明は電話帯域の音声信号のため
の符号化方法、すなわち、少なくとも一つの駆動ベクト
ル符号帳から得られる駆動ベクトルを用いて駆動信号を
生成し、この駆動信号を入力音声信号の分析結果に基づ
いてフィルタ係数が決定される第1のフィルタに供給し
て合成音声信号を生成し、この合成音声信号の入力音声
信号に対する誤差信号を第2のフィルタに通して各周波
数成分毎に異なる所定の重み付けを行い、この重み付け
された誤差信号がより小さくなる駆動ベクトルを駆動ベ
クトル符号帳から探索して、少なくとも該駆動ベクトル
およびフィルタ係数の情報を符号化パラメータとして出
力する音声符号化方法に適用でき、その場合は入力音声
信号のスペクトルの時間的変化を検出し、この時間的変
化に基づいて第2のフィルタの特性を制御する。
【0027】さらに、本発明はこのような音声帯域の音
声信号のための音声符号化方法において、入力音声信号
のスペクトルの時間的変化が所定のしきい値以下のとき
は第2のフィルタの特性を現フレームのスペクトルに基
づいて制御し、時間的変化がしきい値より大きいときは
第2のフィルタの特性を現フレームとこれに時間的に近
いフレームのスペクトルに基づいて制御することを特徴
とする。
【0028】
【発明の実施の形態】図1は、本発明の一実施形態に係
る音声符号化方法を適用した音声符号化装置の構成を示
すブロック図である。本実施形態の構成は、図5に示し
た従来の音声符号化装置を基本としており、聴感重みフ
ィルタの制御に関する構成が従来と異なっている。
【0029】図1において、入力端子100にはフレー
ム単位の音声信号が入力される。この入力音声信号はL
PC分析部(線形予測分析部)101で分析され、ここ
で合成フィルタ102のフィルタ係数が求められる。入
力音声信号は減算器103にも入力され、合成フィルタ
102の零状態応答が差し引かれることにより目標ベク
トル104が生成される。減算器106では、合成フィ
ルタ102から出力される合成音声信号105の目標ベ
クトル104に対する誤差信号107が求められ、聴感
重みフィルタ108に入力される。
【0030】聴感重みフィルタ108は、フィルタ制御
部109によってその特性、すなわち伝達関数が制御さ
れる。このフィルタ制御部109は、LPC分析部10
1からのLPCパラメータと予測残差信号をピッチ分析
部110で分析して求められたピッチパラメータを入力
し、これ基づいて聴感重みフィルタ108のフィルタ特
性、すなわち伝達関数を制御する。聴感重みフィルタ1
08とフィルタ制御部109については、後に詳しく説
明する。
【0031】一方、適応符号帳121から駆動ベクトル
が一つずつ取り出され、ゲイン回路123を介して合成
フィルタ102に駆動信号として入力されることにより
合成音声信号105が生成される。この合成音声信号1
05の歪、すなわち目標ベクトル104に対する誤差信
号が評価部120で評価され、この誤差信号がより小さ
くなるように駆動ベクトルが適応符号帳121から探索
され、最適なものが第1の駆動ベクトルとされる。次
に、この第1の駆動ベクトルの影響を考慮して、雑音符
号帳122から第2の駆動ベクトルが同様にして探索さ
れる。最後に、第1および第2の駆動ベクトルにそれぞ
れゲイン回路123および124で最適なゲインが乗じ
られた後、加算器125で合成されて駆動信号が生成さ
れる。また、この駆動信号によって適応符号帳121の
内容の更新が行われ、次フレームの音声信号の入力に備
えられる。
【0032】そして、本実施形態では少なくとも評価部
120によって探索された適応符号帳121および雑音
符号長122のインデックスと、LPC分析部101で
得られたLPCパラメータを量子化したパラメータが符
号化パラメータとしてマルチプレクサ131を介して出
力端子132に出力され、無線回線などの伝送路や蓄積
媒体へ出力される。
【0033】次に、図2を参照して聴感重みフィルタ1
08およびフィルタ制御部109の詳細な構成を説明す
る。聴感重みフィルタ108は図6と同様、ホルマント
重みフィルタ201とピッチ重みフィルタ202を縦続
接続して構成される。なお、ホルマント重みフィルタ2
01とピッチ重みフィルタ202を順序を逆に配置して
もよい。一方、フィルタ制御部109はホルマント重み
フィルタ201のためのスペクトル変化検出部211お
よび重み制御部212と、ピッチ重みフィルタ202の
ための重み制御部213からなる。
【0034】ホルマント重みフィルタ201は、LPC
分析部101において入力音声信号をLPC分析するこ
とで求められたLPCパラメータai に基づいて伝達関
数が制御され、入力される誤差信号107のホルマント
の山の部分に小さな重み、谷の部分に大きな重みをそれ
ぞれかけることにより、誤差信号107中の雑音スペク
トルを入力音声信号のスペクトル包絡の形状に整形する
働きをする。ここで、本実施形態ではホルマント重みフ
ィルタ201の特性を入力音声信号のスペクトルの変化
に基づいて変化させることを特徴とする。
【0035】スペクトル変化検出部211は、LPC分
析部101からのLPCパラメータとして前フレームと
現在フレームの入力音声信号のスペクトルパラメータを
入力し、スペクトルの時間的変化の大小を判定する。重
み制御部212は、この判定結果に基づいてホルマント
重みフィルタ201の伝達関数、すなわちフィルタ構成
とフィルタ係数を決める。具体的には、スペクトル変化
検出部211は検出したスペクトルの時間的変化の判定
結果Ichを次式に従って出力する。
【0036】
【数3】
【0037】ここで、Dは前フレームと現フレームのL
PCケプストラム距離であり、公知の方法(例えば、古
井著「ディジタル音声処理」、東海大学出版会)に記載
された方法により計算することができる。Dthは、判
定のためのしきい値である。但し、Dとしては他の公知
のスペクトル距離尺度を用いることもできる。重み制御
部212は、スペクトル変化検出部211の判定結果が
Ich=0のときは現在のフレームのスペクトルパラメ
ータに基づいて、また判定結果がIch=1のときは前
フレームと現在のフレームのスペクトルパラメータに基
づいて、ホルマント重みフィルタ201の伝達関数をそ
れぞれ制御する。ホルマント重みフィルタ201の伝達
関数W(z)は、次式で表される。
【0038】
【数4】
【0039】ここで、A(z)は現フレームのLPCパ
ラメータに基づくP次の予測フィルタの伝達関数を表
す。そして、Ap(z)は前フレームのLPCパラメー
タに基づくQ(P≧Q)次の予測フィルタの伝達関数を
表し、この予測フィルタの係数は前フレームのQ個の反
射係数から公知の方法により計算することができる。各
予測フィルタの次数は、例えばP=2、Q=10のよう
に選ばれる。従って、1/1−Ap(z)は前フレーム
のスペクトルの外形を近似する。α,β,λ,γは雑音
整形の度合いを制御する定数であり、実験的に決められ
る。
【0040】このように本実施形態では入力音声信号の
スペクトルの時間的変化を検出し、この変化がしきい値
以下のときは式(5)に示されるように、聴感重みフィ
ルタ108中のホルマント重みフィルタ201の特性を
現フレームのスペクトルに基づいて制御し、しきい値よ
り大きいときは式(6)に示されるように、ホルマント
重みフィルタ201の特性を現フレームと前フレームの
スペクトルに基づいて制御する。
【0041】このようにホルマント重みフィルタ201
の特性を制御すると、入力音声信号のスペクトルが例え
ば図3(a)から図3(b)へと大きく変化した場合、
図3(c)に示すように前フレームと現フレームのホル
マントを加え合わせた形に誤差信号107の雑音スペク
トルを整形することができるようになる。この結果、人
間の聴覚の静的なマスキングだけでなく、聴覚の記憶に
基づいたテンポラル・マスキングも利用することができ
るようになるため、符号化雑音がより知覚されにくくな
り、復号音声の音質が向上する。
【0042】一方、ピッチ重みフィルタ202は、ピッ
チ分析部110による分析で求められたピッチパラメー
タに基づいて重み制御部213で伝達関数が制御され、
ピッチ調和周波数成分に小さな重み、調和周波数間の成
分に大きな重みをそれぞれかけることにより、誤差信号
107中の雑音スペクトルをピッチの調和構造に整形す
る働きをする。このピッチ重みフィルタ202の伝達関
数C(z)は、次式で表される。
【0043】
【数5】
【0044】ここで、cとDは各々ピッチゲインとピッ
チ周期であり、εは雑音整形の度合いを制御する定数で
ある。典型的な値として、ε=0.4が用いられる。な
お、フィルタの次数は1次としている。
【0045】以上、本発明の実施形態を説明したが、本
発明は種々変形して実施することが可能である。例え
ば、上記実施形態では入力音声信号のスペクトルの前フ
レームから現フレームへの時間的変化を検出し、それに
基づいて聴感重みフィルタの特性を制御したが、入力音
声信号の前フレームよりさらに前の少なくとも一つのフ
レームを含めて入力音声信号のスペクトルの時間的変化
を検出して聴感重みフィルタの特性を制御してもよい。
【0046】また、上記実施形態ではテンポラル・マス
キング効果のうち前向性マスキングを利用して符号化雑
音を抑圧したが、後方性マスキングを利用してもよく、
前向性マスキングと後方性マスキングの両方を利用して
もよい。後方性マスキングを利用する場合には、現フレ
ームとこれより時間的に後のフレームとの間の入力音声
信号のスペクトルの時間的変化を検出して、聴感重みフ
ィルタの特性を制御することになる。
【0047】また、本発明は図3に示したように聴感重
みフィルタの機能を重みつき合成フィルタと聴感重み付
け部とに振り分けた構成の音声符号化装置にも適用が可
能であり、この場合には重みつき合成フィルタと聴感重
み付け部の特性を入力音声信号のスペクトルの時間的変
化に基づいて変化させればよい。
【0048】さらに、本発明は電話帯域の音声信号のた
めの音声符号化装置のみならず、例えばMPEGオーデ
ィオとして知られているように、オーディオ帯域の信号
のための符号化装置にも適用できる。MPEGオーディ
オでは、例えば入力信号をフィルタバンクまたは1次元
DCT(離散コサイン変換)と量子化によって圧縮符号
化を行う。この場合、符号化誤差の誤差信号をフィルタ
を介して量子化テーブルや量子化のためのコードブック
にフィードバックして誤差信号が小さくなるように符号
化する際に用いるフィルタの特性を入力信号のスペクト
ルの時間的変化に基づいて制御することによって、先の
実施形態と同様に符号化雑音を効果的に抑圧することが
できる。
【0049】
【発明の効果】以上説明したように、本発明の音声符号
化方法によれば、テンポラル・マスキング効果を利用し
て符号化雑音を効果的に抑圧することが可能であり、符
号化ビットレートが低い場合でも音質の良好な復号音声
を得ることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る音声符号化法を適用
した音声符号化装置の構成を示すブロック図
【図2】同実施形態における聴感重みフィルタおよびフ
ィルタ制御部の構成を示すブロック図
【図3】同実施形態における雑音スペクトルの整形の様
子を示す図
【図4】従来の音声符号化装置の構成を示すブロック図
【図5】従来の他の符号化装置の構成を示すブロック図
【図6】図5における聴感重みフィルタの構成を示すブ
ロック図
【図7】従来の雑音スペクトルの整形の様子を示す図
【符号の説明】
100…入力端子 101…LPC分析部 102…合成フィルタ 103…減算器 104…目標ベクトル 105…合成音声信号 106…加算器 107…誤差信号 108…聴感重みフィルタ 109…フィルタ制御部 110…ピッチ分析部 120…評価部 121…適応符号帳 122…雑音符号帳 123,124…ゲイン回路 125…加算器 131…マルチプレクサ 132…出力端子 201…ホルマント重みフィルタ 202…ピッチ重みフィルタ 211…スペクトル変化検出部 212…ホルマント重みフィルタ用重み制御部 213…ピッチ重みフィルタ用重み制御部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】符号化誤差を表す誤差信号をフィルタに通
    し、このフィルタに通した誤差信号がより小さくなるよ
    うに音声信号の符号化を行う音声符号化方法において、 前記音声信号のスペクトルの時間的変化を検出し、この
    変化に基づいて前記フィルタの特性を制御することを特
    徴とする音声符号化方法。
  2. 【請求項2】符号化誤差を表す誤差信号をフィルタに通
    して各周波数成分毎に異なる所定の重み付けを行い、こ
    の重み付けされた誤差信号がより小さくなるように、フ
    レーム単位で入力される音声信号の符号化を行う音声符
    号化方法において、 前記音声信号のスペクトルの時間的変化を検出し、この
    時間的変化が所定のしきい値以下のときは前記フィルタ
    の特性を現フレームのスペクトルに基づいて制御し、前
    記時間的変化が前記しきい値より大きいときは前記フィ
    ルタの特性を現フレームとこれに時間的に近いフレーム
    のスペクトルに基づいて制御することを特徴とする音声
    符号化方法。
  3. 【請求項3】少なくとも一つの駆動ベクトル符号帳から
    得られる駆動ベクトルを用いて駆動信号を生成し、この
    駆動信号を入力音声信号の分析結果に基づいてフィルタ
    係数が決定される第1のフィルタに供給して合成音声信
    号を生成し、この合成音声信号の前記入力音声信号に対
    する誤差信号を第2のフィルタに通して各周波数成分毎
    に異なる所定の重み付けを行い、この重み付けされた誤
    差信号がより小さくなる駆動ベクトルを前記駆動ベクト
    ル符号帳から探索して、少なくとも該駆動ベクトルおよ
    び前記フィルタ係数の情報を符号化パラメータとして出
    力する音声符号化方法において、 前記入力音声信号のスペクトルの時間的変化を検出し、
    この変化に基づいて前記第2のフィルタの特性を制御す
    ることを特徴とする音声符号化方法。
  4. 【請求項4】少なくとも一つの駆動ベクトル符号帳から
    得られる駆動ベクトルを用いて駆動信号を生成し、この
    駆動信号を入力音声信号の分析結果に基づいてフィルタ
    係数が決定される第1のフィルタに供給して合成音声信
    号を生成し、この合成音声信号の前記入力音声信号に対
    する誤差信号を第2のフィルタに通して各周波数成分毎
    に異なる所定の重み付けを行い、この重み付けされた誤
    差信号がより小さくなる駆動ベクトルを前記駆動ベクト
    ル符号帳から探索して、少なくとも該駆動ベクトルおよ
    び前記フィルタ係数の情報を符号化パラメータとして出
    力する音声符号化方法において、 前記入力音声信号のスペクトルの時間的変化を検出し、
    この時間的変化が所定のしきい値以下のときは前記第2
    のフィルタの特性を現フレームのスペクトルに基づいて
    制御し、前記時間的変化が前記しきい値より大きいとき
    は前記第2のフィルタの特性を現フレームとこれに時間
    的に近いフレームのスペクトルに基づいて制御すること
    を特徴とする音声符号化方法。
JP7339390A 1995-12-26 1995-12-26 音声符号化方法 Pending JPH09179588A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7339390A JPH09179588A (ja) 1995-12-26 1995-12-26 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7339390A JPH09179588A (ja) 1995-12-26 1995-12-26 音声符号化方法

Publications (1)

Publication Number Publication Date
JPH09179588A true JPH09179588A (ja) 1997-07-11

Family

ID=18327024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7339390A Pending JPH09179588A (ja) 1995-12-26 1995-12-26 音声符号化方法

Country Status (1)

Country Link
JP (1) JPH09179588A (ja)

Similar Documents

Publication Publication Date Title
US10181327B2 (en) Speech gain quantization strategy
JP3653826B2 (ja) 音声復号化方法及び装置
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP3490685B2 (ja) 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US6604070B1 (en) System of encoding and decoding speech signals
US6574593B1 (en) Codebook tables for encoding and decoding
JP3481390B2 (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
KR100421226B1 (ko) 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용
JP3234609B2 (ja) 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化
KR100488080B1 (ko) 멀티모드 음성 인코더
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
JPH09127991A (ja) 音声符号化方法及び装置、音声復号化方法及び装置
JPH09127990A (ja) 音声符号化方法及び装置
JP4040126B2 (ja) 音声復号化方法および装置
JP3357795B2 (ja) 音声符号化方法および装置
JPH03102921A (ja) 条件付き確率的励起符号化法
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
EP1619666B1 (en) Speech decoder, speech decoding method, program, recording medium
JPH1083200A (ja) 符号化,復号化方法及び符号化,復号化装置
JP3264679B2 (ja) コード励振線形予測符号化装置及び復号化装置
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JPH09179588A (ja) 音声符号化方法