JP3357795B2 - 音声符号化方法および装置 - Google Patents

音声符号化方法および装置

Info

Publication number
JP3357795B2
JP3357795B2 JP21631996A JP21631996A JP3357795B2 JP 3357795 B2 JP3357795 B2 JP 3357795B2 JP 21631996 A JP21631996 A JP 21631996A JP 21631996 A JP21631996 A JP 21631996A JP 3357795 B2 JP3357795 B2 JP 3357795B2
Authority
JP
Japan
Prior art keywords
vector
codebook
code
speech
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21631996A
Other languages
English (en)
Other versions
JPH1063297A (ja
Inventor
政巳 赤嶺
皇 天田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP21631996A priority Critical patent/JP3357795B2/ja
Priority to US08/911,719 priority patent/US5926785A/en
Publication of JPH1063297A publication Critical patent/JPH1063297A/ja
Application granted granted Critical
Publication of JP3357795B2 publication Critical patent/JP3357795B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声を高能率符号
化する音声符号化方法および音声符号化装置に関する。
【0002】
【従来の技術】電話帯域の音声信号を高能率に圧縮符号
化する音声符号化技術は、利用できる電波帯域が限られ
ている携帯電話などの移動体通信や、メモリの有効利用
が求められるボイスメールなどの蓄積媒体において今や
不可欠の技術になっている。そして現在、ビットレート
が低く、かつ符号化処理遅延が小さい方式が求められて
いる。電話帯域の音声信号を4kbps程度の低ビット
レートで符号化する方式として、CELP(Code Excit
ed Linear Prediction)方式は有効な方式の一つであ
る。この方式はフレーム単位に分割された入力音声信号
から声道をモデル化した音声合成フィルタの特性を求め
る処理と、この音声合成フィルタの入力信号に当たる駆
動信号を求める処理に大別される。
【0003】これら処理のうち、後者の駆動信号を求め
る処理は、駆動ベクトル符号帳に格納された複数の駆動
ベクトルを一つずつ合成フィルタに通して生成される合
成音声信号の歪、すなわち入力音声信号に対する合成音
声信号の誤差信号を計算し、この誤差信号が最小となる
駆動ベクトルを探索する処理からなる。これは閉ループ
探索と呼ばれており、8kbps程度のビットレートで
良好な音質を再生するために非常に有効な方法である。
【0004】CELP方式に関しては、M.R.Schroeder
and B.S.Atal,“Code Excited Linear Prediction (CE
LP) :High Quality Speech at Very Low Bit Rates”,
Proc.ICASSP,pp.937-940,1985 および W.S.Kleijin, D.
J.Krasinski et al.“Improved Speech Quality and Ef
ficient Vector Quantization in SELP ”,Proc.ICASS
P,pp.155-158,1988 で詳しく述べられている。
【0005】図11を用いてCELP方式の概略を説明
する。入力端子400にフレーム単位で入力される音声
信号はLPC分析部(線形予測分析部)401で分析さ
れ、ここで重み付き合成フィルタ402のフィルタ係数
が求められる。また、入力音声信号は聴感重み付け部4
03にも入力され、重み付き入力音声信号が生成され
る。この重み付き入力音声信号から重み付き合成フィル
タ402の零状態応答が差し引かれ、目標ベクトル40
4が生成される。
【0006】一方、適応符号帳411から駆動ベクトル
が一つずつ取り出され、ゲイン乗算器421を介して重
み付き合成フィルタ402に駆動信号として入力される
ことにより合成音声ベクトルが生成される。この合成音
声信号ベクトルの歪、すなわち合成音声ベクトルの目標
ベクトル404に対する誤差が評価部410で評価さ
れ、この誤差がより小さくなるように駆動ベクトルが適
応符号帳411から探索され、最適なものが第1の駆動
ベクトルとされる。次に、この第1の駆動ベクトルの影
響を考慮して、雑音符号帳412から第2の駆動ベクト
ルが同様にして探索される。最後に、第1および第2の
駆動ベクトルにそれぞれゲイン乗算器413,414で
図示しないゲイン符号帳から与えられる最適なゲインが
乗じられた後、合成されて駆動信号が生成される。この
駆動信号によって適応符号帳411の内容の更新が行わ
れ、次フレームの音声信号の入力に備えられる。
【0007】ここで、重み付き合成フィルタ402およ
び聴感重み付け部403は、合成音声信号および入力音
声信号について、音声のスペクトルで符号化雑音のスペ
クトルをマスクすることにより聴感上の音質を改善する
目的で用いられる。この動作について詳細に説明する。
説明を簡単にするため、入力音声信号と合成音声信号に
対して共通化した聴感重みフィルタを用いた図12を参
照する。
【0008】図12の音声符号化装置においては、入力
音声信号に対する合成音声信号の誤差信号、つまり符号
化誤差を表す誤差信号が求められ、聴感重みフィルタ5
01に入力される。聴感重みフィルタ501は、誤差信
号のスペクトルに対して各周波数成分毎に異なる重み付
けを行う。適応符号帳411および雑音符号帳412か
らの駆動ベクトルの探索は、評価部410によって聴感
重みフィルタ501で重み付けがなされた誤差信号が最
小となるように行われる。合成フィルタ502として
は、重み付けを行わないフィルタが用いられる。
【0009】一方、I.A.Gerson and M.A.Jasiuk:Techni
ques for improving the performance of CELP type sp
eech coders, IEEE Proc. ICASSP91, pp.205-208 に、
ピッチ重みフィルタを含む改良された聴感重みフィルタ
の構成が開示されている。図13はその一構成例であ
り、ホルマント重みフィルタ601とピッチ重みフィル
タ602からなる聴感重みフィルタである。
【0010】ホルマント重みフィルタ601は、入力音
声信号のLPC分析によって求められたLPC係数ai
に基づいてフィルタ係数が設定され、ホルマントの山の
部分に小さな重み、谷の部分に大きな重みをそれぞれか
けることによって、図14に示すように符号化雑音のス
ペクトル(以下、雑音スペクトルという)を入力音声信
号のスペクトル包絡の形状に整形する働きをする。この
ホルマント重みフィルタ601の伝達関数W(z)は、
次式で表される。
【0011】
【数1】
【0012】ここでαは雑音整形の度合いを制御する定
数であり、実験的に決められる。典型的な値として、α
=0.7〜0.9が使われる。Pはフィルタの次数であ
り、一般にはP=10に設定される。
【0013】ピッチ重みフィルタ602は、入力音声信
号の分析で求められたピッチパラメータに基づいてフィ
ルタ係数が設定され、ピッチ調和周波数成分に小さな重
み、調和周波数間の成分に大きな重みをそれぞれかける
ことにより、雑音スペクトルをピッチの調和構造に整形
する働きをする。この伝達関数C(z)は、次式で表さ
れる。
【0014】
【数2】
【0015】ここで、cはピッチゲイン、Dはピッチ周
期であり、εは雑音整形の度合いを制御する定数であ
る。典型的な値として、ε=0.4が用いられる。な
お、フィルタの次数は1次としている。
【0016】図12の音声符号化装置では、適応符号帳
411および雑音符号帳412から探索された駆動ベク
トルのインデックスと、図示しないゲイン符号帳から探
索されたゲインのインデックスおよびLPC分析部40
1で得られたLPC係数が符号化パラメータとして出力
され、伝送される。一方、これに対応する音声復号化装
置では、音声符号化装置と同様の合成フィルタ、適応符
号帳、雑音符号帳およびゲイン符号帳が用意されてお
り、符号化装置から伝送されてきた符号化パラメータの
うちのLPC係数に基づいて合成フィルタの伝達関数が
設定され、インデックスに基づいて各符号帳が探索され
る。
【0017】このようにCELP方式は、聴感重み付け
を行った歪みが最小となる駆動ベクトルを閉ループ的に
探索している。この方式によると、8kbps程度のビ
ットレートで良好な音質を再生することができる。しか
し、CELP方式は入力音声信号の符号化を行う際に必
要な音声信号のバッファリングサイズが大きく、符号化
に際しての処理遅延、つまり入力音声信号が実際に符号
化されて符号化パラメータが出力されるまでの処理に要
する時間が大きくなってしまうという問題がある。具体
的には、従来のCELP方式では入力音声信号を20m
s〜40msの長さのフレームに分割してバッファリン
グし、フレーム単位でLPC分析とそれにより得られた
LPC係数の伝送を行っている。このバッファリングと
符号化演算のため、最低でもフレーム長の2倍の処理遅
延、すなわち40ms〜80msもの遅延が生じる。
【0018】携帯電話などの通信システムにおいて送受
間の遅延が大きくなると、回線エコーや音響エコーなど
のため通話に障害が生じるため、処理遅延の小さい音声
符号化方式が望まれている。音声符号化での処理遅延を
小さくするためには、フレーム長を短くすればよいが、
フレーム長を短くするとLPC係数の伝送頻度が高くな
るため、LPC係数と駆動ベクトルの量子化ビット数を
削減せざるを得ず、復号化側で得られる再生音声信号の
音質が劣化するという問題がある。
【0019】上述のような従来のCELP方式の問題を
解決するために、LPC係数を伝送しない音声符号化方
式が考えられる。具体的には、例えば符号帳から取り出
した符号ベクトルを用いて合成フィルタを介さずに再生
音声ベクトルを生成し、入力音声信号を目標ベクトルと
して、この目標ベクトルに対する再生音声信号ベクトル
の誤差を表す誤差ベクトルを生成し、この誤差ベクトル
を聴感重みフィルタに通して得られたベクトルが最小化
となる符号ベクトルを符号帳から探索する。聴感重みフ
ィルタの伝達関数は、入力音声信号について求められた
LPC係数に従って設定される。
【0020】しかし、このように符号化側からLPC係
数を伝送しない場合には、復号化側に設けられるポスト
フィルタの伝達特性をいかに制御するかが問題となる。
すなわち、CELP方式では4kbps以下のビットレ
ートで符号化を行う場合、良好な音質が得られないた
め、復号化側に主として再生音声信号のスペクトル強調
(ホルマント強調ともいう)を行って主観品質を向上さ
せるためのポストフィルタを設ける必要がある。このポ
ストフィルタは、スペクトル強調に関しては、通常、符
号化側から供給されるLPC係数によって伝達関数が制
御される構成となっているが、上記のようにLPC係数
が符号化側から伝送されない場合には、このような伝達
関数の制御が不可能となってしまう。
【0021】また、従来のCELP方式では、LPC係
数の量子化を量子化誤差最小化の規範で、言い換えると
開ループ的に行っている。このため、LPC係数の量子
化誤差が最小となっても再生音声信号の歪みが最小とな
る保証はなく、ビットレートが低くなると再生音声信号
の品質が劣化してしまう。
【0022】
【発明が解決しようとする課題】上述したように、従来
のCELP方式による音声符号化装置では、低ビットレ
ートおよび低遅延を図ろうとすると、再生音声の音質が
劣化するという問題があった。また、低ビットレートと
低遅延の達成のために、合成フィルタを用いず、LPC
係数のような入力音声信号のスペクトル包絡を表すパラ
メータを伝送しない構成にすると、低ビットレート時に
復号化側で必要なポストフィルタの伝達関数を制御でき
ず、ポストフィルタによる音質向上を望むことができな
くなるという問題があった。
【0023】本発明は、上記の問題点を解決するために
なされたもので、低ビットレート、低遅延であって、か
つ再生音声の品質を高めることができる音声符号化方法
および装置を提供することを目的とする。
【0024】
【課題を解決するための手段】上記課題を解決するた
め、本発明は合成フィルタを用いずに再生音声信号ベク
トルを生成し、入力音声信号のスペクトル包絡を表すパ
ラメータを伝送しない音声符号化を行う際、本来は復号
化側で使用されるポストフィルタに含まれるスペクトル
強調フィルタの伝達関数の逆特性に基づいて聴感重みフ
ィルタの伝達関数を変化させるか、または入力音声信号
に対して符号化前にスペクトル強調フィルタ処理を行う
ことを骨子とするものである。
【0025】すなわち、本発明に係る第1の音声符号化
方法は、音声信号の符号化のための複数の符号ベクトル
を格納した符号帳を有し、この符号帳から取り出した符
号ベクトルを用いて再生音声ベクトルを生成するととも
に、符号化対象の入力音声信号を目標ベクトルとして、
この目標ベクトルに対する再生音声ベクトルの誤差を表
す誤差ベクトルを生成し、この誤差ベクトルを再生音声
信号のスペクトルを強調するフィルタの伝達関数の逆特
性を含ませた伝達関数を有する聴感重みフィルタに通し
て重み付き誤差ベクトルを生成し、この重み付き誤差ベ
クトルが最小となる符号ベクトルを符号帳から探索し
て、探索した符号ベクトルに対応するインデックスを符
号化パラメータとして出力することを特徴とする。
【0026】また、この音声符号化方法を実行するため
の第1の音声符号化装置は、音声信号の符号化のための
複数の符号ベクトルを格納した符号帳と、この符号帳か
ら取り出した符号ベクトルを用いて再生音声ベクトルを
生成する再生音声ベクトル生成手段と、符号化対象の入
力音声信号を目標ベクトルとして、この目標ベクトルに
対する再生音声ベクトルの誤差を表す誤差ベクトルを生
成する誤差ベクトル生成手段と、再生音声信号のスペク
トルを強調するフィルタの伝達関数の逆特性を含ませた
伝達関数を有し、誤差ベクトルを入力として重み付き誤
差ベクトルを出力する聴感重みフィルタと、この重み付
き誤差ベクトルが最小となる符号ベクトルを符号帳から
探索する探索手段と、この探索手段により探索された符
号ベクトルに対応するインデックスを符号化パラメータ
として出力する手段とを備えたことを特徴とする。
【0027】本発明に係る第2の音声符号化方法は、音
声信号の符号化のための複数の符号ベクトルを格納した
符号帳を有し、この符号帳から取り出した符号ベクトル
を用いて再生音声ベクトルを生成するとともに、符号化
対象の入力音声信号についてスペクトル強調を行って得
られた音声信号を目標ベクトルとして、この目標ベクト
ルに対する再生音声ベクトルの誤差を表す誤差ベクトル
を生成し、この誤差ベクトルを聴感重みフィルタに通し
て得られた重み付き誤差ベクトルが最小となる符号ベク
トルを符号帳から探索して、探索した符号ベクトルに対
応するインデックスを符号化パラメータとして出力する
ことを特徴とする。
【0028】また、この音声符号化方法を実行するため
の第2の音声符号化装置は、音声信号の符号化のための
複数の符号ベクトルを格納した符号帳と、この符号帳か
ら取り出した符号ベクトルを用いて再生音声ベクトルを
生成する再生音声ベクトル生成手段と、符号化対象の入
力音声信号についてスペクトル強調を行うプリフィルタ
と、このプリフィルタによってスペクトル強調された音
声信号を目標ベクトルとして、この目標ベクトルに対す
る再生音声ベクトルの誤差を表す誤差ベクトルを生成す
る誤差ベクトル生成手段と、この誤差ベクトルを入力と
して重み付き誤差ベクトルを出力する聴感重みフィルタ
と、この重み付き誤差ベクトルが最小となる符号ベクト
ルを符号帳から探索する探索手段と、この探索手段によ
り探索された符号ベクトルに対応するインデックスを符
号化パラメータとして出力する手段とを備えたことを特
徴とする。
【0029】このような構成により、本発明によると低
ビットレートおよび低遅延を達成しつつ、再生音声の品
質を向上させることができる。従来のCELP方式で
は、符号化パラメータの一部としてLPC係数を伝送す
る必要があり、そのために符号化の低ビットレート化、
低遅延化に伴って音質が劣化する問題があった。従来の
CELP方式の場合、LPC係数は音声信号の持つ短期
の相関を取り除くために用いられていたが、本発明では
音声信号の持つ相関をベクトル量子化の技術を用いて除
去し、LPC係数を伝送しない構成としている。このよ
うにLPC係数は復号化側へ伝送する必要がなく、聴感
重みフィルタさらにプリフィルタの伝達関数の設定にの
み用いられるため、符号化の際のフレーム長を短くで
き、それだけ処理遅延も短くなる。
【0030】そして、本発明においては、通常は復号化
側に設けられるポストフィルタの機能のうち、特にLP
C係数のようなスペクトル包絡を表すパラメータを必要
とするスペクトル強調については、聴感重みフィルタに
その機能を持たせるか、または符号化の前にプリフィル
タによってスペクトル強調を行っている。従って、ポス
トフィルタの処理に必要なパラメータを伝送しないにも
かかわらず、低ビットレートでも良好な音質が得られ
る。また、復号化側においてはポストフィルタが不要と
なるか、あるいはポストフィルタがスペクトル強調を含
まないか、または僅かなスペクトル強調を行う簡単なも
のでよく、フィルタリングに要する演算量が削減され
る。
【0031】さらに、本発明では入力音声信号を目標ベ
クトルとして再生音声信号ベクトルの誤差ベクトルに聴
感重みフィルタの処理を施し、重み付けされた誤差の最
小化の規範でベクトル量子化のための符号帳から符号ベ
クトルの探索を行うことにより、従来は開ループ的に符
号化されていたLPC係数を含んだ形で符号帳の探索を
閉ループ的に行うことができ、主観的なレベルで音質の
改善が期待できることになる。
【0032】
【発明の実施の形態】
(第1の実施形態)図1は本発明の第1の実施形態に係
る音声符号化装置の構成を示すブロック図である。この
音声符号化装置は、バッファ101、LPC分析部10
3、減算器105、聴感重みフィルタ107、符号帳探
索部109、第1〜第3の符号帳111,112,11
3、ゲイン乗算器114,115、加算器116および
マルチプレクサ117からなる。
【0033】入力端子100からの入力音声信号は、バ
ッファ101に一時蓄積される。LPC分析部103
は、バッファ101を介して入力音声信号のLPC分析
(線形予測分析)をフレーム単位で行い、入力音声信号
のスペクトル包絡を表すパラメータであるLPC係数を
出力する。減算器105は、バッファ101から出力さ
れる入力音声信号を目標ベクトル103として、この目
標ベクトル103から再生音声信号ベクトル104を差
し引き、聴感重みフィルタ107に誤差ベクトル106
を出力する。聴感重みフィルタ107は、誤差ベクトル
106に対して、LPC分析部103で得られたLPC
係数に従って再生音声信号の主観音質を聴感的に改善す
るために周波数毎に異なる重み付けを行い、重み付き誤
差ベクトル108を符号帳探索部109に出力する。符
号帳探索部109は、重み付き誤差ベクトル108を受
けて、再生音声信号の歪み(誤差)最小化の規範で、第
1〜第3の符号帳111,112,113について符号
ベクトルの探索を行う。マルチプレクサ117は、符号
帳111,112,113について探索された符号ベク
トルのインデックスを符号列に変換して多重化し、これ
を符号化パラメータとして出力端子118に出力する。
【0034】第1および第2の符号帳111,112は
ベクトル量子化の技術を利用して音声の長期相関および
短期相関をそれぞれ取り除くための符号帳であり、第3
の符号帳113は符号ベクトルに与えるゲインを量子化
するための符号帳である。
【0035】図1と図12を比較して分かるように、本
実施形態の音声符号化装置は合成フィルタを用いない点
が従来のCELP方式の音声符号化装置とは大きく異な
っている。
【0036】次に、図2に示すフローチャートを用いて
本実施形態の音声符号化装置における符号化手順を説明
する。まず、ディジタル化された入力音声信号を入力端
子100から入力し、フレームと呼ばれる一定間隔の区
間に分割して、バッファ101に蓄える(ステップS1
01)。次に、バッファ101を介して入力音声信号を
フレーム単位でLPC分析部102に入力して線形予測
分析(LPC分析)を行い、入力音声信号のスペクトル
包絡を表すパラメータとしてLPC係数ai(1=1,
…,p)を計算する(ステップS102)。このLPC
分析は、従来のCELP方式のようにLPC係数を伝送
するためのものではなく、聴感重みフィルタ107での
雑音スペクトルの整形と、聴感重みフィルタ107にス
ペクトル強調の逆特性を付与するために行われる。な
お、LPC分析を行う単位となるフレーム長は、符号化
を行う単位となるフレーム長とは独立に設定できる。
【0037】このようにLPC係数を音声符号化装置か
ら音声復号化に伝送する必要がないため、符号化を行う
単位であるフレーム長は、従来のCELP方式における
フレーム長(20〜40ms)より短くてよく、例えば
5〜10msで十分である。すなわち、LPC係数は伝
送しないのであるから、フレーム長を短くしても従来の
ように再生音声の品質を低下させる要因とならない。L
PC分析の方法については、自己相関法など周知の方法
を用いることができる。こうして求められたLPC係数
は聴感重みフィルタ107に与えられ、後述のように聴
感重みフィルタ107の伝達関数W(z)が設定される
(ステップS103)。
【0038】次に、フレーム単位で入力音声信号の符号
化の処理を行う。符号化処理は、符号帳探索部109に
よって第1〜第3の符号帳111,112,113を後
述する歪み最小の規範で順次探索し、各々のインデック
スを符号列に変換した上でマルチプレクサ117により
多重化することで行われる(ステップS104〜S10
5)。本実施形態の音声符号化装置は、音声信号の持つ
冗長性(相関)を音声の周期成分(ピッチ)に基づく長
期の相関と音声のスペクトル包絡に関係する短期の相関
に分けて除去し、冗長性を圧縮する。第1の符号帳11
1は長期の相関を除去するために、第2の符号帳112
は短期の相関を除去するためにそれぞれ用いられる。第
3の符号帳113は第1、第2の符号帳111,112
から出力される符号べクトルのゲインを符号化するため
のものである。第1の符号帳110の探索処理について
説明する。探索に先立ち、まず聴感重みフィルタ107
の伝達関数W(z)を次式に従って設定する。
【0039】
【数3】
【0040】ここで、P(z)は従来のポストフィルタ
の伝達関数であり、具体的には例えばスペクトル強調フ
ィルタ(ホルマント強調フィルタ)の伝達関数、あるい
はこれにピッチ強調フィルタや高域強調フィルタの伝達
関数を含ませたものであっても構わない。
【0041】このように、聴感重みフィルタ107の伝
達関数W(z)を式(1)に示した従来の聴感重みフィ
ルタの伝達特性(式(4)の右辺第1項)と、ポストフ
ィルタの伝達関数の逆特性(式(4)の右辺第2項)で
構成することにより、雑音スペクトルを入力音声信号の
スペクトル包絡の形状に整形すると共に、再生音声信号
のスペクトルを従来のポストフィルタと同様に強調する
ことができる。α,β,γ,δは雑音整形の度合いを制
御する定数であり、実験的に決められる。典型的な値は
αとγが0.7〜0.9、βとδが0.5である。
【0042】第1の符号帳111は、従来のCELP方
式における適応符号帳と同様に音声の周期成分(ピッ
チ)を表現するのに用いられ、この符号帳111に格納
される符号ベクトルe(n)は、次式で表されるように
過去の再生音声信号をフレーム長分切り出すことにより
作成される。
【0043】 e(n)=e(n−L),n=1,…,N (7) ここで、Lはラグ、Nはフレーム長である。符号帳探索
部109は、まず第1の符号帳111の探索を行う。第
1の符号帳111の探索は従来の適応符号帳の探索と同
様に、符号帳探索部109において目標ベクトル102
と符号ベクトルeを聴感重みフィルタ107に通すこと
によって得られる歪を最小とするラグを見出すことによ
って行われる。ラグは、整数サンプルまたは小数サンプ
ル単位とすることができる。
【0044】次に、符号帳探索部109は第2の符号帳
112の探索を行う。この場合、まず減算器105で目
標べクトル102から第1の符号帳111の符号ベクト
ルを減算して新たな目標ベクトルを得る。そして、第1
の符号帳111の探索と同様に目標ベクトル102に対
する第2の符号帳112の符号ベクトルの重み付き歪
(誤差)最小化の規範で第2の符号帳112の探索を行
う。すなわち、第2の符号帳112からゲイン乗算器1
14および加算器116を介して出力された符号ベクト
ル104の目標ベクトル102に対する誤差を減算器1
05で誤差信号ベクトル106として求め、この誤差信
号ベクトル106を聴感重みフィルタ107に通して得
られるベクトルが最小となる符号ベクトルを符号帳11
2から探索する。この第2の符号帳112の探索は、C
ELP方式における雑音符号帳の探索と同様である。こ
の場合、第2の符号帳112の探索のための演算量を削
減する目的で、ベクトルサムなどの構造化された符号
帳、バックワードフィルタリング、予備選択など周知の
技術を利用することもできる。
【0045】次に、符号帳探索部109は第3の符号帳
113の探索を行う。第3の符号帳113は、第1、第
2の符号帳111,112に格納された符号ベクトルに
乗じるゲインを要素に持つ符号ベクトルを格納してい
る。第3の符号帳113からの最適な符号ベクトルの探
索は、第1、第2の符号帳111,112から取り出さ
れた符号ベクトルにゲイン乗算器114,115でゲイ
ンを乗じた後、加算器116で加算して得られた再生音
声信号ベクトル104の目標ベクトル102に対する重
み付き歪(誤差)を最小化する規範で、周知の方法によ
り行われる。
【0046】符号帳探索部109は、第1〜第3の符号
帳111,112,113から探索した符号ベクトルに
対応するインデックスをマルチプレクサ117に出力す
る。マルチプレクサ117は、入力された3つのインデ
ックスを符号列に変換して多重化し、符号化パラメータ
として出力端子118に出力する。出力端子118に出
力された符号化パラメータは、図示しない伝送路または
蓄積媒体を介して後述する音声復号化装置に伝送され
る。
【0047】最後に、符号帳探索部109で求められた
第1、第2の符号帳111,112のインデックスに対
応する符号ベクトルに、同じく符号帳探索部109で求
められた第3の符号帳113のインデックスに対応する
ゲインがゲイン乗算器114,115により乗じられた
後、加算器116で加算されることにより再生音声信号
ベクトル104が求められ、これに基づいて第1の符号
帳111の内容が更新されることにより、入力端子10
0への次のフレームの音声信号入力に備える。
【0048】次に、図3を参照して図1の音声符号化装
置に対応する第1の実施形態に係る音声復号化装置につ
いて説明する。この音声復号化装置は、デマルチプレク
サ201、第1〜第3の符号帳211,212,21
3、ゲイン乗算器214,215および加算器216か
らなる。第1〜第3の符号帳211,212,213に
は、それぞれ図1の第1〜第3の符号帳111,11
2,113に格納されている符号ベクトルと同じ符号ベ
クトルが格納されている。
【0049】入力端子200には、図1に示した音声符
号化装置から出力される符号化パラメータが図示しない
伝送路または蓄積媒体を介して入力される。この符号化
パラメータはデマルチプレクサ201に入力され、図1
中の符号帳111,112,113について探索した符
号ベクトルに対応する3つのインデックスが分離された
後、符号帳211,212,213に供給される。これ
により符号帳211,212,213からは、符号帳1
11,112,113から探索された符号ベクトルと同
じ符号ベクトルが取り出される。
【0050】第1、第2の符号帳211,212から取
り出された符号ベクトルは、ゲイン乗算器214,21
5により第3の符号帳213からの符号ベクトルで示さ
れるゲインが乗じられた後、加算器216で加算される
ことによって、再生音声信号ベクトルが出力端子217
より出力される。また、再生音声信号ベクトルに基づい
て第1の符号帳211の内容が更新されることにより、
入力端子200への次のフレームの符号化パラメータの
入力に備える。
【0051】従来のCELP方式に基づく音声復号化装
置では、加算器216から出力される信号がLPC係数
によって伝達特性が決定される合成フィルタに駆動信号
として入力される構成となっている。また、特に符号化
のビットレートが4kbps以下のような低レートの場
合、合成フィルタから出力される再生音声信号がポスト
フィルタを介して出力される構成となっている。
【0052】これに対し、本実施形態では図1に示した
音声符号化装置側で合成フィルタが省略されていること
に対応して、音声復号化装置においても合成フィルタは
省略されている。さらに、図1の音声符号化装置内の聴
感重みフィルタ107においてポストフィルタの処理が
行われていることにより、図3の音声復号化装置にはポ
ストフィルタが不要となっている。
【0053】(第2の実施形態)図4は、本発明の第2
の実施形態に係る音声符号化装置の構成を示すブロック
図である。本実施形態が第1の実施形態と異なるところ
は、第2の符号帳112に格納された符号ベクトル間の
相関を取り除くために予測器121を設け、さらに予測
器121を制御するための第4の符号帳122を追加し
た点である。
【0054】図5は、予測器121の具体的な実現例と
してMA型予測器の構成を示すブロック図である。この
予測器は1べクトル分の遅延を行うベクトル遅延器30
1,302と、行列乗算器303,304,305およ
び加算器306により構成され、第1の行列乗算器30
3には予測器121の入力ベクトルが入力され、第2の
行列乗算器304には1段目のベクトル遅延器301の
出力ベクトルが入力され、第3の行列乗算器305には
2段目のベクトル遅延器302の出力ベクトルが入力さ
れる。そして、行列乗算器303,304,305の出
力ベクトルが加算器306で加算され、予測器121の
出力ベクトルが生成される。
【0055】従って、予測器121の入力ベクトルおよ
び出力べクトルをX,Yとし、行列乗算器303,30
4,305において各々の入力ベクトルに乗じる係数行
列をA0,A1,A2とおくと、予測器121の動作は
次式で表される。
【0056】 Yn=A0*Xn+A1*Xn−1+A2*Xn−2 (8) ここで、Xn−1はXnを1べクトル分遅延したベクト
ル、Xn−2はXn−1を1べクトル分遅延したベクト
ルある。係数行列A0,A1,A2は予め周知の学習法
により求められ、第4の符号帳122に符号化ベクトル
として格納されている。
【0057】以下、本実施形態の動作を第1の実施形態
との相違点を中心に説明する。まず、フレーム単位で入
力音声信号のLPC分析と、聴感重みフィルタ107の
伝達関数の設定を第1の実施形態と同様に行い、次いで
符号帳探索部119において第1の符号帳111の探索
を第1の実施形態と同様に行う。
【0058】次に、符号帳探索部119による第2の符
号帳112の探索は、符号帳112から取り出した符号
べクトルを予測器121に入力して予測ベクトルを生成
し、この予測ベクトルと目標ベクトル102との重み付
き歪が最小となる符号べクトルを第2の符号帳112か
ら探索することによって行われる。予測ベクトルは、第
4の符号帳122から符号ベクトルとして与えられる係
数行列A0,A1,A2を用いて、式(8)に従って計
算される。第2の符号帳112の探索は、第4の符号帳
122に格納された全ての符号ベクトルに対して行われ
る。従って、第2の符号帳112と第4の符号帳122
の探索は同時に行われる。
【0059】また、本実施形態では第1〜第3の符号帳
111,112,113に加えて第4の符号帳122が
設けられていることに伴い、マルチプレクサ127では
第1〜第4の符号帳111,112,113,122か
らの4つのインデックスを符号列に変換して多重化し、
これを符号化パラメータとして出力端子127より出力
する構成となっている。
【0060】図6は、図4の音声符号化装置に対応する
音声復号化装置の構成を示すブロック図である。この音
声復号化装置が図3に示した第1の実施形態の音声復号
化装置と異なるところは、図4の音声符号化装置と対応
して第2の符号帳212に格納された符号ベクトル間の
相関を取り除くために予測器221を設け、これに伴い
符号帳として第4の符号帳222を追加した点である。
予測器221は符号化装置内の予測器121と同様であ
り、例えば図5のように構成される。
【0061】入力端子200には、図4に示した音声符
号化装置から出力される符号化パラメータが図示しない
伝送路または蓄積媒体を介して入力される。この符号化
パラメータはデマルチプレクサ210に入力され、図4
中の符号帳111,112,113,121について探
索した符号ベクトルに対応する4つのインデックスが分
離された後、符号帳211,212,213,222に
供給される。これにより符号帳211,212,21
3,222からは、符号帳111,112,113,1
21から探索された符号ベクトルと同じ符号ベクトルが
取り出される。第1の符号帳211からの符号ベクトル
は、ゲイン乗算器214により第3の符号帳213から
の符号ベクトルで示されるゲインが乗じられた後、加算
器216に入力される。第2の符号帳212からの符号
化ベクトルは予測器221に入力され、予測ベクトルが
生成される。この予測ベクトルは加算器216に入力さ
れ、ゲイン乗算器214でゲインが乗じられた第1の符
号帳211からの符号ベクトルと加算されることによ
り、再生音声信号が出力端子217より出力される。
【0062】(第3の実施形態)第1および第2の実施
形態では、聴感重みフィルタ107の伝達関数をポスト
フィルタの伝達関数の逆特性に基づいて制御することに
より、再生音声信号のスペクトルを強調する構成となっ
ているが、符号化処理の前に入力音声信号にスペクトル
強調のフィルタリングを施すことにより、再生音声信号
のスペクトル強調を図ることも可能である。
【0063】図7は、この方法に基づく第3の実施形態
に係る音声符号化装置の構成を示すブロック図である。
第1の実施形態との相違点は、バッファ101の後段に
プリフィルタ130を設けたことと、聴感重みフィルタ
137の伝達関数をポストフィルタの特性を含まないよ
うに変えたことである。
【0064】次に、図8に示すフローチャートを用いて
本実施形態の音声符号化装置における符号化手順を説明
する。まず、ディジタル化された入力音声信号を入力端
子100から入力し、フレームと呼ばれる一定間隔の区
間に分割して、バッファ101に蓄える(ステップS2
01)。次に、バッファ201を介して入力音声信号を
フレーム単位でLPC分析部102に入力して線形予測
分析(LPC分析)を行い、入力音声信号のスペクトル
包絡を表すパラメータとしてLPC係数ai(1=1,
…,p)を計算する(ステップS202)。このLPC
分析は、従来のCELP方式のようにLPC係数を伝送
するためのものではなく、プリフィルタ130でのスペ
クトル強調と、聴感重みフィルタ137での雑音スペク
トルの整形のために行われる。LPC分析の方法につい
ては、自己相関法など周知の方法を用いることができ
る。LPC係数はプリフィルタ130と聴感重みフィル
タ137に与えられ、プリフィルタ130の伝達関数P
re(z)と聴感重みフィルタ137の伝達関数W(z)
が設定される(ステップS203,S204)。
【0065】次に、フレーム単位で入力音声信号の符号
化の処理を行う。符号化処理は、符号帳探索部109に
よって第1〜第3の符号帳111,112,113を後
述する歪み最小の規範で順次探索し、各々のインデック
スを符号列に変換した上でマルチプレクサ117により
多重化することで行われる(ステップS205〜S20
6)。
【0066】本実施形態の音声符号化装置は、音声信号
の持つ冗長性(相関)を音声の周期成分(ピッチ)に基
づく長期の相関と音声のスペクトル包絡に関係する短期
の相関に分けて除去し、冗長性を圧縮する。第1の符号
帳111は長期の相関を除去するために、第2の符号帳
112は短期の相関を除去するためにそれぞれ用いられ
る。第3の符号帳113は第1、第2の符号帳111,
112から出力される符号べクトルのゲインを符号化す
るためのものである。
【0067】第1の符号帳111の探索処理について説
明する。探索に先立ち、まずプリフィルタ130の伝達
関数Pre(z)と聴感重みフィルタ107の伝達関数W
(z)を次式に従って設定する。
【0068】
【数4】
【0069】ここで、γ,δはスペクトル強調の度合い
を制御する定数であり、α,βは雑音整形の度合いを制
御する定数であり、実験的に決められる。このように本
実施形態では、聴感重みフィルタ137の伝達関数W
(z)は式(1)に示した従来の聴感重みフィルタの伝
達特性と同様であり、プリフィルタ130としてスペク
トル強調を行うフィルタを設けることによって、聴感重
みフィルタ137により雑音スペクトルを入力音声信号
のスペクトル包絡の形状に整形すると共に、再生音声信
号のスペクトルを従来のポストフィルタと同様にプリフ
ィルタ130により強調することができる。
【0070】第1の符号帳111は、従来のCELP方
式における適応符号帳と同様に音声の周期成分(ピッ
チ)を表現するのに用いられ、この符号帳111に格納
される符号ベクトルe(n)は、式(7)に示したよう
に過去の再生音声信号をフレーム長分切り出すことによ
り作成される。
【0071】符号帳探索部109は、まず第1の符号帳
111の探索を行う。第1の符号帳111の探索は従来
の適応符号帳の探索と同様に、符号帳探索部109にお
いて目標ベクトル102と符号ベクトルeを聴感重みフ
ィルタ107に通すことによって得られる歪を最小とす
るラグを見出すことによって行われる。ラグは、整数サ
ンプルまたは小数サンプル単位とすることができる。
【0072】次に、符号帳探索部109は第2の符号帳
112の探索を行う。この場合、まず減算器105で目
標べクトル102から第1の符号帳111の符号ベクト
ルを減算して新たな目標ベクトルを得る。そして、第1
の符号帳111の探索と同様に目標ベクトル102に対
する第2の符号帳112の符号ベクトルの重み付き歪
(誤差)最小化の規範で第2の符号帳112の探索を行
う。すなわち、第2の符号帳112からゲイン乗算器1
14および加算器116を介して出力された符号ベクト
ル104の目標ベクトル102に対する誤差を減算器1
05で誤差信号ベクトル106として求め、この誤差信
号ベクトル106を聴感重みフィルタ107に通して得
られるベクトルが最小となる符号ベクトルを符号帳11
2から探索する。この第2の符号帳112の探索は、C
ELP方式における雑音符号帳の探索と同様である。こ
の場合、第2の符号帳112の探索のための演算量を削
減する目的で、ベクトルサムなどの構造化された符号
帳、バックワードフィルタリング、予備選択など周知の
技術を利用することもできる。
【0073】次に、符号帳探索部109は第3の符号帳
113の探索を行う。第3の符号帳113は、第1、第
2の符号帳111,112に格納された符号ベクトルに
乗じるゲインを要素に持つ符号ベクトルを格納してい
る。第3の符号帳113からの最適な符号ベクトルの探
索は、第1、第2の符号帳111,112から取り出さ
れた符号ベクトルにゲイン乗算器114,115でゲイ
ンを乗じた後、加算器116で加算して得られた再生音
声信号ベクトル104の目標ベクトル102に対する重
み付き歪(誤差)を最小化する規範で、周知の方法によ
り行われる。
【0074】符号帳探索部109は、第1〜第3の符号
帳111,112,113について探索した符号ベクト
ルに対応するインデックスをマルチプレクサ117に出
力する。マルチプレクサ117では、入力された3つの
インデックスを符号列に変換して多重化し、これを符号
化パラメータとして出力端子118に出力する。出力端
子118に出力された符号化パラメータは、図示しない
伝送路または蓄積媒体を介して後述する音声復号化装置
に伝送される。
【0075】最後に、符号帳探索部109で求められた
第1、第2の符号帳111,112のインデックスに対
応する符号ベクトルに、同じく符号帳探索部109で求
められた第3の符号帳113のインデックスに対応する
ゲインがゲイン乗算器114,115により乗じられた
後、加算器116で加算されることにより再生音声信号
ベクトルが求められ、これに基づいて第1の符号帳11
1の内容が更新されることにより、入力端子100への
次のフレームの音声信号入力に備える。
【0076】(第4の実施形態)図10は、本発明の第
3の実施形態に係る音声復号化装置の構成を示すブロッ
ク図である。本実施形態の音声復号化装置は、図3に示
した第1の実施形態の音声復号化装置における加算器2
16の出力側に、LPC分析部231およびポストフィ
ルタ232を追加した構成となっている。LPC分析部
231は、再生音声信号をLPC分析してLPC係数を
求める。ポストフィルタ232は、LPC係数に基づい
て伝達関数が設定されるスペクトル強調フィルタにより
スペクトル強調を行う。さらに、ポストフィルタ232
は必要に応じて、デマルチプレクサ201から第1の符
号帳211に入力されるインデックスに基づいてピッチ
情報を求め、このピッチ情報に基づいて伝達関数が設定
されるピッチ強調フィルタによりピッチ強調を行う。
【0077】ここで、図1に示した第1の実施形態の音
声符号化装置においては、聴感重みフィルタ107の伝
達関数にポストフィルタの伝達関数の逆特性が含まれて
いることにより、音声符号化装置においてポストフィル
タの処理のうちのスペクトル強調処理の一部が実質的に
行われている。従って、図10の音声復号化装置内のポ
ストフィルタ232においては、少なくともスペクトル
強調については非常に簡易な処理でよく、その処理に必
要な演算量は僅かで済む。
【0078】なお、図10においてLPC分析部231
を除去し、ポストフィルタ232でスペクトル強調を除
くピッチ強調などのフィルタリング処理のみを行うよう
にしてもよい。
【0079】
【発明の効果】以上説明したように、本発明によれば音
声信号の持つ相関をベクトル量子化の技術を用いて除去
し、LPC係数のような入力音声信号のスペクトル包絡
を表すパラメータを伝送しない構成としているため、パ
ラメータ抽出のための入力音声信号の分析の際のフレー
ム長を短くでき、それだけ分析のためのバッファリング
による遅延時間も短くなる。
【0080】また、ポストフィルタの機能のうちスペク
トル包絡を表すパラメータを必要とするスペクトル強調
については、聴感重みフィルタにその機能を持たせる
か、または符号化の前にプリフィルタによってスペクト
ル強調を行うことにより、低ビットレートでも良好な音
質が得られる。しかも、復号化側においてはポストフィ
ルタが不要となるか、あるいはポストフィルタがスペク
トル強調を含まないか、または僅かなスペクトル強調を
行う簡単なものでよいため、フィルタリングに要する演
算量が削減される。
【0081】さらに、入力音声信号を目標ベクトルとし
て再生音声信号ベクトルの誤差ベクトルに聴感重みフィ
ルタの処理を施し、重み付けされた誤差の最小化の規範
でベクトル量子化のための符号帳から符号ベクトルの探
索を行うことにより、スペクトル包絡を表すパラメータ
を含んだ形で符号帳の探索を閉ループ的に行うことがで
き、主観的なレベルでの音質改善を図ることができる。
【図面の簡単な説明】
【図1】第1の実施形態に係る音声符号化装置の構成を
示すブロック図
【図2】第1の実施形態に係る音声符号化装置の符号化
手順を示すフローチャート
【図3】第1の実施形態に係る音声復号化装置の構成を
示すブロック図
【図4】第2の実施形態に係る音声符号化装置の構成を
示すブロック図
【図5】図4中の予測器の構成を示すブロック図
【図6】第2の実施形態に係る音声復号化装置の構成を
示すブロック図
【図7】第3の実施形態に係る音声符号化装置の構成を
示すブロック図
【図8】第3の実施形態に係る音声符号化装置の符号化
手順を示すフローチャート
【図9】第3の実施形態に係る音声復号化装置の構成を
示すブロック図
【図10】第4の実施形態に係る音声復号化装置の構成
を示すブロック図
【図11】従来の音声符号化装置の構成を示すブロック
【図12】従来の他の音声符号化装置の構成を示すブロ
ック図
【図13】図12中の聴感重みフィルタの構成を示すブ
ロック図
【図14】従来の雑音スペクトル形成の様子を示す波形
【符号の説明】
100…入力端子 101…バッファ 103…LPC分析部 105…減算器 107…聴感重みフィルタ 109…符号帳探索部 111…第1の符号帳 112…第2の符号帳 113…第3の符号帳 114,115…ゲイン乗算器 116…加算器 117…マルチプレクサ 118…出力端子 119…符号帳探索部 121…予測器 122…第4の符号帳 127…マルチプレクサ 128…出力端子 130…プリフィルタ 137…聴感重みフィルタ 200…入力端子 201…デマルチプレクサ 211…第1の符号帳 212…第2の符号帳 213…第3の符号帳 214,215…ゲイン乗算器 216…加算器 217……出力端子 221…予測器 222…第4の符号帳 231…LPC分析部 232…ポストフィルタ 301,302…べクトル遅延器 303,304,305…行列乗算器 306…加算器
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−264833(JP,A) 特開 平5−232994(JP,A) 特開 平8−76793(JP,A) 特開 昭63−192100(JP,A) 特開 平6−332498(JP,A) 特開 平7−160295(JP,A) 特開 平8−160996(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号の符号化のための複数の符号ベク
    トルを格納した符号帳を有し、 この符号帳から取り出した符号ベクトルを用いて再生音
    声ベクトルを生成するとともに、符号化対象の入力音声
    信号を目標ベクトルとして、この目標ベクトルに対する
    再生音声ベクトルの誤差を表す誤差ベクトルを生成し、 この誤差ベクトルを再生音声信号のスペクトルを強調す
    るフィルタの伝達関数の逆特性を含ませた伝達関数を有
    する聴感重みフィルタに通して重み付き誤差ベクトルを
    生成し、 この重み付き誤差ベクトルが最小となる符号ベクトルを
    前記符号帳から探索して、該探索した符号ベクトルに対
    応するインデックスを符号化パラメータとして出力する
    ことを特徴とする音声符号化方法。
  2. 【請求項2】音声信号の符号化のための複数の符号ベク
    トルを格納した符号帳と、 前記符号帳から取り出した符号ベクトルを用いて再生音
    声ベクトルを生成する再生音声ベクトル生成手段と、 符号化対象の入力音声信号を目標ベクトルとして、この
    目標ベクトルに対する前記再生音声ベクトルの誤差を表
    す誤差ベクトルを生成する誤差ベクトル生成手段と、 再生音声信号のスペクトルを強調するフィルタの伝達関
    数の逆特性を含ませた伝達関数を有し、前記誤差ベクト
    ルを入力として重み付き誤差ベクトルを出力する聴感重
    みフィルタと、 前記重み付き誤差ベクトルが最小となる符号ベクトルを
    前記符号帳から探索する探索手段と、 前記探索手段により探索された符号ベクトルに対応する
    インデックスを符号化パラメータとして出力する手段と
    を備えたことを特徴とする音声符号化装置。
  3. 【請求項3】音声信号の符号化のための複数の符号ベク
    トルを格納した符号帳を有し、 この符号帳から取り出した符号ベクトルを用いて再生音
    声ベクトルを生成するとともに、 符号化対象の入力音声信号についてスペクトル強調を行
    った音声信号を目標ベクトルとして、この目標ベクトル
    に対する再生音声ベクトルの誤差を表す誤差ベクトルを
    生成し、 この誤差ベクトルを聴感重みフィルタに通して得られた
    重み付き誤差ベクトルが最小となる符号ベクトルを前記
    符号帳から探索して、該探索した符号ベクトルに対応す
    るインデックスを符号化パラメータとして出力すること
    を特徴とする音声符号化方法。
  4. 【請求項4】音声信号の符号化のための複数の符号ベク
    トルを格納した符号帳と、 前記符号帳から取り出した符号ベクトルを用いて再生音
    声ベクトルを生成する再生音声ベクトル生成手段と、 符号化対象の入力音声信号についてスペクトル強調を行
    うプリフィルタと、 前記プリフィルタによってスペクトル強調された音声信
    号を目標ベクトルとして、この目標ベクトルに対する前
    記再生音声ベクトルの誤差を表す誤差ベクトルを生成す
    る誤差ベクトル生成手段と、 前記誤差ベクトルを入力として重み付き誤差ベクトルを
    出力する聴感重みフィルタと、 前記重み付き誤差ベクトルが最小となる符号ベクトルを
    前記符号帳から探索する探索手段と、 前記探索手段により探索された符号ベクトルに対応する
    インデックスを符号化パラメータとして出力する手段と
    を備えたことを特徴とする音声符号化装置。
JP21631996A 1996-08-16 1996-08-16 音声符号化方法および装置 Expired - Fee Related JP3357795B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP21631996A JP3357795B2 (ja) 1996-08-16 1996-08-16 音声符号化方法および装置
US08/911,719 US5926785A (en) 1996-08-16 1997-08-15 Speech encoding method and apparatus including a codebook storing a plurality of code vectors for encoding a speech signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21631996A JP3357795B2 (ja) 1996-08-16 1996-08-16 音声符号化方法および装置

Publications (2)

Publication Number Publication Date
JPH1063297A JPH1063297A (ja) 1998-03-06
JP3357795B2 true JP3357795B2 (ja) 2002-12-16

Family

ID=16686673

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21631996A Expired - Fee Related JP3357795B2 (ja) 1996-08-16 1996-08-16 音声符号化方法および装置

Country Status (2)

Country Link
US (1) US5926785A (ja)
JP (1) JP3357795B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW439368B (en) * 1998-05-14 2001-06-07 Koninkl Philips Electronics Nv Transmission system using an improved signal encoder and decoder
JP3541680B2 (ja) 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
AU1445100A (en) * 1998-10-13 2000-05-01 Hadasit Medical Research Services & Development Company Ltd Method and system for determining a vector index to represent a plurality of speech parameters in signal processing for identifying an utterance
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
FR2839836B1 (fr) * 2002-05-16 2004-09-10 Cit Alcatel Terminal de telecommunication permettant de modifier la voix transmise lors d'une communication telephonique
EP1388846A3 (fr) * 2002-07-17 2008-08-20 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie capable de contrôler indépendamment les distorsions à court terme et à long terme
EP1383113A1 (fr) * 2002-07-17 2004-01-21 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie capable de contrôler indépendamment les distorsions à court terme et à long terme
EP1617411B1 (en) 2003-04-08 2008-07-09 NEC Corporation Code conversion method and device
JP4786183B2 (ja) * 2003-05-01 2011-10-05 富士通株式会社 音声復号化装置、音声復号化方法、プログラム、記録媒体
DE602004013031T2 (de) * 2003-10-10 2009-05-14 Agency For Science, Technology And Research Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
JPWO2008072732A1 (ja) * 2006-12-14 2010-04-02 パナソニック株式会社 音声符号化装置および音声符号化方法
CA2729665C (en) 2008-07-10 2016-11-22 Voiceage Corporation Variable bit rate lpc filter quantizing and inverse quantizing device and method
MY178306A (en) 2013-01-29 2020-10-07 Fraunhofer Ges Forschung Low-frequency emphasis for lpc-based coding in frequency domain
JP5817011B1 (ja) * 2014-12-11 2015-11-18 株式会社アクセル 音声信号符号化装置、音声信号復号装置、音声信号符号化方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
CA2027705C (en) * 1989-10-17 1994-02-15 Masami Akamine Speech coding system utilizing a recursive computation technique for improvement in processing speed
US5528723A (en) * 1990-12-28 1996-06-18 Motorola, Inc. Digital speech coder and method utilizing harmonic noise weighting
US5671327A (en) * 1991-10-21 1997-09-23 Kabushiki Kaisha Toshiba Speech encoding apparatus utilizing stored code data
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
JP2800618B2 (ja) * 1993-02-09 1998-09-21 日本電気株式会社 音声パラメータ符号化方式
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
JP3224955B2 (ja) * 1994-05-27 2001-11-05 株式会社東芝 ベクトル量子化装置およびベクトル量子化方法
DE69526017T2 (de) * 1994-09-30 2002-11-21 Toshiba Kawasaki Kk Vorrichtung zur Vektorquantisierung
JPH08272395A (ja) * 1995-03-31 1996-10-18 Nec Corp 音声符号化装置

Also Published As

Publication number Publication date
JPH1063297A (ja) 1998-03-06
US5926785A (en) 1999-07-20

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
US7171355B1 (en) Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
RU2257556C2 (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
JP3678519B2 (ja) オーディオ周波数信号の線形予測解析方法およびその応用を含むオーディオ周波数信号のコーディングならびにデコーディングの方法
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP3357795B2 (ja) 音声符号化方法および装置
JP3234609B2 (ja) 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化
JPH09127991A (ja) 音声符号化方法及び装置、音声復号化方法及び装置
JPWO2008072701A1 (ja) ポストフィルタおよびフィルタリング方法
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3266178B2 (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3232701B2 (ja) 音声符号化方法
CA2542137C (en) Harmonic noise weighting in digital speech coders
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3089967B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP2002221998A (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音声符号化、復号化方法、装置及びプログラム
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JPH0786952A (ja) 音声の予測符号化方法
JP3024467B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081004

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081004

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091004

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101004

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees