JPH06222795A - 符号励振線形予測符号化方式 - Google Patents
符号励振線形予測符号化方式Info
- Publication number
- JPH06222795A JPH06222795A JP5008078A JP807893A JPH06222795A JP H06222795 A JPH06222795 A JP H06222795A JP 5008078 A JP5008078 A JP 5008078A JP 807893 A JP807893 A JP 807893A JP H06222795 A JPH06222795 A JP H06222795A
- Authority
- JP
- Japan
- Prior art keywords
- code
- synthesis filter
- long
- voiced sound
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Abstract
(57)【要約】
【目的】 再生音声信号の振幅スペクトルのピッチ微細
構造を明確化して音声品質の改善を図る。 【構成】 有無声判定器15により該当フレームが有声
音フレームであると判定されたときに、予め用意された
雑音コードブック10の各コードベクトルの振幅スペク
トルと推定された長期合成フィルタ14の振幅スペクト
ルとの相互相関を取って相関の大きなコードベクトルを
特定の数だけ予備選択をする。これらの予備選択された
コードベクトルから合成による分析法により最適のコー
ドベクトルを選択する。
構造を明確化して音声品質の改善を図る。 【構成】 有無声判定器15により該当フレームが有声
音フレームであると判定されたときに、予め用意された
雑音コードブック10の各コードベクトルの振幅スペク
トルと推定された長期合成フィルタ14の振幅スペクト
ルとの相互相関を取って相関の大きなコードベクトルを
特定の数だけ予備選択をする。これらの予備選択された
コードベクトルから合成による分析法により最適のコー
ドベクトルを選択する。
Description
【0001】
【産業上の利用分野】本発明は、音声を符号化する符号
励振線形予測符号化方式に関する。
励振線形予測符号化方式に関する。
【0002】
【従来の技術】図2は、従来の符号励振線形予測符号化
方式(以下、「CELP」という)のブロック図を示し
ている。図2に示すように、フレームバッファ1は、入
力音声信号をバッファリングして線形予測分析器(LP
C分析器)2に与える。このLPC分析器2は、短時間
予測係数を計算して量子化して短期予測器3およびマル
チプレクサ4に与える。短期予測器3と、この短期予測
器3が閉ループを形成するための加算器5とは、短期合
成フィルタ6を構成している。減算器7は、前記短期合
成フィルタ6の出力とフレームバッファ1の音声信号と
の誤差を示す誤差信号を生成して聴覚的重み付けフィル
タ8に与える。この聴覚的重み付けフィルタ8は、誤差
信号に予め決められた聴覚的重み付けをして生成した信
号を誤差電力最小化回路9を介して各コードベクトルに
対する聴覚重み付けされた誤差電力を計算し、コードベ
クトルの探索のために雑音コードブック10にフィード
バックする。
方式(以下、「CELP」という)のブロック図を示し
ている。図2に示すように、フレームバッファ1は、入
力音声信号をバッファリングして線形予測分析器(LP
C分析器)2に与える。このLPC分析器2は、短時間
予測係数を計算して量子化して短期予測器3およびマル
チプレクサ4に与える。短期予測器3と、この短期予測
器3が閉ループを形成するための加算器5とは、短期合
成フィルタ6を構成している。減算器7は、前記短期合
成フィルタ6の出力とフレームバッファ1の音声信号と
の誤差を示す誤差信号を生成して聴覚的重み付けフィル
タ8に与える。この聴覚的重み付けフィルタ8は、誤差
信号に予め決められた聴覚的重み付けをして生成した信
号を誤差電力最小化回路9を介して各コードベクトルに
対する聴覚重み付けされた誤差電力を計算し、コードベ
クトルの探索のために雑音コードブック10にフィード
バックする。
【0003】この雑音コードブック10の出力は増幅器
11に与えられる。また、増幅器11の利得は、誤差電
力最小化回路9で計算される。前記増幅器11の出力は
加算器12に与えられる。この加算器12の出力は、前
記短期合成フィルタ6の加算器5と長期予測器13に与
えられる。この長期予測器13の出力は、前記加算器1
1およびマルチプレクサ4に与えられる。前記長期予測
器13と加算器12とは、長期合成フィルタ14を構成
している。前記誤差電力最小化回路9の出力は、長期予
測器13にも与えられる。前記雑音コードブック10の
最適コードベクトルのインデックスおよびこの最適コー
ドベクトルに対する最適利得(ゲイン)の量子化値はマ
ルチプレクサ4に送られ、また、逆量子化され増幅器1
1に与えられる。
11に与えられる。また、増幅器11の利得は、誤差電
力最小化回路9で計算される。前記増幅器11の出力は
加算器12に与えられる。この加算器12の出力は、前
記短期合成フィルタ6の加算器5と長期予測器13に与
えられる。この長期予測器13の出力は、前記加算器1
1およびマルチプレクサ4に与えられる。前記長期予測
器13と加算器12とは、長期合成フィルタ14を構成
している。前記誤差電力最小化回路9の出力は、長期予
測器13にも与えられる。前記雑音コードブック10の
最適コードベクトルのインデックスおよびこの最適コー
ドベクトルに対する最適利得(ゲイン)の量子化値はマ
ルチプレクサ4に送られ、また、逆量子化され増幅器1
1に与えられる。
【0004】前記雑音コードブック10は、A−b−S
(合成による分析)法によって、最適コードベクトルが
探索される。前記雑音コードブック10の最適コードベ
クトルのインデックスは、マルチプレクサ4に送られ
る。また、前記コードベクトルの利得が、計算され量子
化されてマルチプレクサ4に送られる。この量子化値は
逆量子化され増幅器11に設定される。前記長期合成フ
ィルタ14のラグおよび長時間予測係数は、LPC分析
器2で計算された短時間予測係数で構成される逆フィル
タ19にフレームバッファの音声信号を入力し、その出
力をピッチ抽出器20で相関分析を行い求める。この値
は、量子化されてマルチプレクサ4に送られ、また、逆
量子化されて長期予測器13に送られる。
(合成による分析)法によって、最適コードベクトルが
探索される。前記雑音コードブック10の最適コードベ
クトルのインデックスは、マルチプレクサ4に送られ
る。また、前記コードベクトルの利得が、計算され量子
化されてマルチプレクサ4に送られる。この量子化値は
逆量子化され増幅器11に設定される。前記長期合成フ
ィルタ14のラグおよび長時間予測係数は、LPC分析
器2で計算された短時間予測係数で構成される逆フィル
タ19にフレームバッファの音声信号を入力し、その出
力をピッチ抽出器20で相関分析を行い求める。この値
は、量子化されてマルチプレクサ4に送られ、また、逆
量子化されて長期予測器13に送られる。
【0005】前記長期合成フィルタ14の伝達関数P
(z)は、次の数1で表わされる。
(z)は、次の数1で表わされる。
【0006】
【数1】
【0007】前記短期合成フィルタ6の伝達関数H
(z)は、次の数2で表わされる。
(z)は、次の数2で表わされる。
【0008】
【数2】
【0009】次に前記雑音コードブック10について説
明する。前記雑音コードブック10は、CELPの伝送
ビットレートおよびハードウェアによって異なるが、こ
こでは40次元でコードサイズは1024(=210)と
する。40次元とは、コードベクトルの長さを指し40
サンプルのデータである。コードサイズは、コードベク
トルの総数で、ここでは1024個の異なるコードベク
トルが入っている。これを示すためには、10ビットの
情報が必要になる。コードベクトルとしては、異なる乱
数系列が入っているとする。雑音コードブック10の探
索方法を説明する。まず、1番目のコードベクトルを選
択し、これを長期合成フィルタ14に入力する。この長
期合成フィルタ14の出力を短期合成フィルタ6に入力
する。この短期合成フィルタ6の出力は再生音声信号と
等価である。減算器7は、短期合成フィルタ6の出力と
フレームバッファ1の音声信号との誤差信号を生成して
聴覚的重み付けフィルタ8に与える。この聴覚的重み付
けフィルタ8の伝達関数W(z)は、次の数3で表わさ
れる。
明する。前記雑音コードブック10は、CELPの伝送
ビットレートおよびハードウェアによって異なるが、こ
こでは40次元でコードサイズは1024(=210)と
する。40次元とは、コードベクトルの長さを指し40
サンプルのデータである。コードサイズは、コードベク
トルの総数で、ここでは1024個の異なるコードベク
トルが入っている。これを示すためには、10ビットの
情報が必要になる。コードベクトルとしては、異なる乱
数系列が入っているとする。雑音コードブック10の探
索方法を説明する。まず、1番目のコードベクトルを選
択し、これを長期合成フィルタ14に入力する。この長
期合成フィルタ14の出力を短期合成フィルタ6に入力
する。この短期合成フィルタ6の出力は再生音声信号と
等価である。減算器7は、短期合成フィルタ6の出力と
フレームバッファ1の音声信号との誤差信号を生成して
聴覚的重み付けフィルタ8に与える。この聴覚的重み付
けフィルタ8の伝達関数W(z)は、次の数3で表わさ
れる。
【0010】
【数3】
【0011】この式の意味は、誤差信号スペクトルのホ
ルマント領域を軽く見るように働くことである。結局、
量子化雑音スペクトルは、ホルマント領域に集まりそれ
以外の領域では、減少する。W(z)のスペクトルを図
3(b)に示す。
ルマント領域を軽く見るように働くことである。結局、
量子化雑音スペクトルは、ホルマント領域に集まりそれ
以外の領域では、減少する。W(z)のスペクトルを図
3(b)に示す。
【0012】ホルマント領域の雑音は、マスキング効果
で軽減され、W(z)を入れたことにより、聴覚的S/
Nは、改善される。1024回これを繰り返し、聴覚重
み付け誤差信号電力最小のコードベクトルを最適コード
ベクトルとし選択して、そのコードベクトルインデック
スをマルチプレクサに送る。
で軽減され、W(z)を入れたことにより、聴覚的S/
Nは、改善される。1024回これを繰り返し、聴覚重
み付け誤差信号電力最小のコードベクトルを最適コード
ベクトルとし選択して、そのコードベクトルインデック
スをマルチプレクサに送る。
【0013】
【発明が解決しようとする課題】しかし、従来のCEL
Pにおいては、ホルマント(スペクトル包絡)によるマ
スキング効果しか考慮されていないことになる。
Pにおいては、ホルマント(スペクトル包絡)によるマ
スキング効果しか考慮されていないことになる。
【0014】該当フレームの音声信号が無声音(音源信
号を雑音と見なして良い)の時はこれで良いと思われる
が、有声音(音源信号を周期性信号と見なして良い)の
ときは、ホルマントの山部に量子化雑音が集中し、その
領域のスペクトル微細構造が不明確化することになり、
有声音時の音声品質の劣化があると思われる。
号を雑音と見なして良い)の時はこれで良いと思われる
が、有声音(音源信号を周期性信号と見なして良い)の
ときは、ホルマントの山部に量子化雑音が集中し、その
領域のスペクトル微細構造が不明確化することになり、
有声音時の音声品質の劣化があると思われる。
【0015】図3(a)に有声音のスペクトルを示す。
【0016】本発明の課題は、再生音声信号(特に有声
音信号)の振幅スペクトルのピッチ微細構造を明確化し
て音声品質の改善を図ることができるCELPを提供す
ることにある。
音信号)の振幅スペクトルのピッチ微細構造を明確化し
て音声品質の改善を図ることができるCELPを提供す
ることにある。
【0017】
【課題を解決するための手段】本発明によれば、雑音コ
ードブックのコードベクトルを利得調整して長期合成フ
ィルタに入力し、この長期合成フィルタの出力を短期合
成フィルタに入力して該当フレームの音声信号を再生す
る手段を含む符号励振線形予測符号化方式において、該
当フレームが有声音フレームであるか否かを判定する有
声音判定手段と、この有声音判定手段により該当フレー
ムが有声音フレームであると判定されたときに予め用意
された雑音コードブックの各コードベクトルの振幅スペ
クトルと推定された長期合成フィルタの振幅スペクトル
との相互相関を取って相関の大きなコードベクトルを特
定の数だけ予備選択する予備選択手段と、この予備選択
手段により予備選択されたコードベクトルから合成によ
る分析法により最適のコードベクトルを選択する最適ベ
クトル選択手段とを有することを特徴とする符号励振線
形予測符号化方式が得られる。
ードブックのコードベクトルを利得調整して長期合成フ
ィルタに入力し、この長期合成フィルタの出力を短期合
成フィルタに入力して該当フレームの音声信号を再生す
る手段を含む符号励振線形予測符号化方式において、該
当フレームが有声音フレームであるか否かを判定する有
声音判定手段と、この有声音判定手段により該当フレー
ムが有声音フレームであると判定されたときに予め用意
された雑音コードブックの各コードベクトルの振幅スペ
クトルと推定された長期合成フィルタの振幅スペクトル
との相互相関を取って相関の大きなコードベクトルを特
定の数だけ予備選択する予備選択手段と、この予備選択
手段により予備選択されたコードベクトルから合成によ
る分析法により最適のコードベクトルを選択する最適ベ
クトル選択手段とを有することを特徴とする符号励振線
形予測符号化方式が得られる。
【0018】
【実施例】次に、本発明の実施例を図面に基いて説明す
る。図1は本発明の1実施例を示すブロック図である。
図1の実施例において図2の実施例と同一の構成要素
は、同一の符号が付されている。図1の実施例は、該当
フレームが有声音フレームである場合にピッチ構造をよ
り強調する雑音コードベクトルを選択するものである。
る。図1は本発明の1実施例を示すブロック図である。
図1の実施例において図2の実施例と同一の構成要素
は、同一の符号が付されている。図1の実施例は、該当
フレームが有声音フレームである場合にピッチ構造をよ
り強調する雑音コードベクトルを選択するものである。
【0019】図1において、前記長期予測器13の出力
は有無声判定器15に与えられる。この有無声判定器1
5は、長期予測係数の大きさにより有声信号であるか無
声信号であるかを判定して判定信号をスペクトル計算器
16に与える。このスペクトル計算器16は、有無声判
定器15により有声信号であると判定したときに長期合
成フィルタ14の伝達関数の振幅スペクトルを計算して
スペクトル相関器17に与える。このスペクトル相関器
17は、振幅スペクトルコードブック18からの出力も
受けて予備選択信号を前記雑音コードブック10に与え
る。前記長期合成フィルタ14の伝達関数P(z)は、
数2で表わされるが、その振幅スペクトルはZ=e
-jwTs とすることにより次の数4で表わされる。
は有無声判定器15に与えられる。この有無声判定器1
5は、長期予測係数の大きさにより有声信号であるか無
声信号であるかを判定して判定信号をスペクトル計算器
16に与える。このスペクトル計算器16は、有無声判
定器15により有声信号であると判定したときに長期合
成フィルタ14の伝達関数の振幅スペクトルを計算して
スペクトル相関器17に与える。このスペクトル相関器
17は、振幅スペクトルコードブック18からの出力も
受けて予備選択信号を前記雑音コードブック10に与え
る。前記長期合成フィルタ14の伝達関数P(z)は、
数2で表わされるが、その振幅スペクトルはZ=e
-jwTs とすることにより次の数4で表わされる。
【0020】
【数4】
【0021】雑音コードブック10内のコードベクトル
は乱数であるから、スペクトルは平坦に近いと考えられ
るが、ここの例のように、40次元つまり40サンプル
程度では、その振幅スペクトルの形は様々であると思わ
れる。そのスペクトルを予め計算して、振幅スペクトル
コードブック18にいれておく。(予め計算しておくの
で、この為の演算は、符号化処理には含まれない。)ス
ペクトル相関器17で、数4で計算された振幅スペクト
ルと振幅コードブック10内の各コードベクトルとの相
関(積和)をとる。
は乱数であるから、スペクトルは平坦に近いと考えられ
るが、ここの例のように、40次元つまり40サンプル
程度では、その振幅スペクトルの形は様々であると思わ
れる。そのスペクトルを予め計算して、振幅スペクトル
コードブック18にいれておく。(予め計算しておくの
で、この為の演算は、符号化処理には含まれない。)ス
ペクトル相関器17で、数4で計算された振幅スペクト
ルと振幅コードブック10内の各コードベクトルとの相
関(積和)をとる。
【0022】ベクトル相関器17の出力の大きなコード
ベクトル(ピッチ構造と類似している)を、特定の数
(この例では、例えば512個)を予備選択する。これ
により、ピッチ構造のスペクトルと良く整合したコード
ベクトルの集まりを選ぶことができ、これらの中からコ
ードベクトルを選ぶことで微細構造をより明確化でき
る。
ベクトル(ピッチ構造と類似している)を、特定の数
(この例では、例えば512個)を予備選択する。これ
により、ピッチ構造のスペクトルと良く整合したコード
ベクトルの集まりを選ぶことができ、これらの中からコ
ードベクトルを選ぶことで微細構造をより明確化でき
る。
【0023】選択した512個のコードベクトルの中か
ら、A−b−S法で最適コードベクトルを選択する、ま
た最適利得を計算する。この方法により、有声音フレー
ムの再生音声の明瞭度を上げることができる。また、無
声音に対しては、従来法と同じく雑音コードブックを全
探索する。
ら、A−b−S法で最適コードベクトルを選択する、ま
た最適利得を計算する。この方法により、有声音フレー
ムの再生音声の明瞭度を上げることができる。また、無
声音に対しては、従来法と同じく雑音コードブックを全
探索する。
【0024】
【発明の効果】本発明は、再生音声信号(特に有声音信
号)の振幅スペクトルのピッチ微細構造を明確化して音
声品質の改善を図ることがある。
号)の振幅スペクトルのピッチ微細構造を明確化して音
声品質の改善を図ることがある。
【図1】本発明の1実施例を示すブロック図である。
【図2】従来の符号励振線形予測符号化方式を示すブロ
ック図である。
ック図である。
【図3】従来の符号励振線形予測符号化方式における信
号の波形を示す波形図である。
号の波形を示す波形図である。
1 フレームバッファ 2 LPC分析器 3 短期予測器 6 短期合成フィルタ 7 減算器 8 聴覚的重み付けフィルタ 9 誤差電力最少化回路 10 雑音コードブック 13 長期予測器 14 長期合成フィルタ 15 有無声判定器 16 スペクトル計算器 17 スペクトル相関器 18 振幅スペクトルコードブック 19 逆フィルタ 20 ピッチ抽出器
Claims (1)
- 【請求項1】 雑音コードブックのコードベクトルを利
得調整して長期合成フィルタに入力し、この長期合成フ
ィルタの出力を短期合成フィルタに入力して該当フレー
ムの音声信号を再生する手段を含む符号励振線形予測符
号化方式において、該当フレームが有声音フレームであ
るか否かを判定する有声音判定手段と、この有声音判定
手段により該当フレームが有声音フレームであると判定
されたときに予め用意された雑音コードブックの各コー
ドベクトルの振幅スペクトルと推定された長期合成フィ
ルタの振幅スペクトルとの相互相関を取って相関の大き
なコードベクトルを特定の数だけ予備選択する予備選択
手段と、この予備選択手段により予備選択されたコード
ベクトルから合成による分析法により最適のコードベク
トルを選択する最適ベクトル選択手段とを有することを
特徴とする符号励振線形予測符号化方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5008078A JPH06222795A (ja) | 1993-01-21 | 1993-01-21 | 符号励振線形予測符号化方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5008078A JPH06222795A (ja) | 1993-01-21 | 1993-01-21 | 符号励振線形予測符号化方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06222795A true JPH06222795A (ja) | 1994-08-12 |
Family
ID=11683307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5008078A Withdrawn JPH06222795A (ja) | 1993-01-21 | 1993-01-21 | 符号励振線形予測符号化方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06222795A (ja) |
-
1993
- 1993-01-21 JP JP5008078A patent/JPH06222795A/ja not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2262748C2 (ru) | Многорежимное устройство кодирования | |
JPH04363000A (ja) | 音声パラメータ符号化方式および装置 | |
US20040023677A1 (en) | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound | |
JP3254687B2 (ja) | 音声符号化方式 | |
JPH09281998A (ja) | 音声符号化装置 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
JP3180786B2 (ja) | 音声符号化方法及び音声符号化装置 | |
JPH08272395A (ja) | 音声符号化装置 | |
JP2000112498A (ja) | 音声符号化方法 | |
JP3353852B2 (ja) | 音声の符号化方法 | |
JPH04344699A (ja) | 音声符号化・復号化方法 | |
JP3490324B2 (ja) | 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体 | |
JPH06282298A (ja) | 音声の符号化方法 | |
JPH0830299A (ja) | 音声符号化装置 | |
JPH08292797A (ja) | 音声符号化装置 | |
Zinser et al. | CELP coding at 4.0 kb/sec and below: Improvements to FS-1016 | |
JP2736157B2 (ja) | 符号化装置 | |
JPH06222795A (ja) | 符号励振線形予測符号化方式 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3552201B2 (ja) | 音声符号化方法および装置 | |
JP3024467B2 (ja) | 音声符号化装置 | |
JPH0519796A (ja) | 音声の励振信号符号化・復号化方法 | |
JP3468862B2 (ja) | 音声符号化装置 | |
JPH08320700A (ja) | 音声符号化装置 | |
JP3335650B2 (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20000404 |