JPH06149297A - 短期予測係数の計算方法 - Google Patents
短期予測係数の計算方法Info
- Publication number
- JPH06149297A JPH06149297A JP4316265A JP31626592A JPH06149297A JP H06149297 A JPH06149297 A JP H06149297A JP 4316265 A JP4316265 A JP 4316265A JP 31626592 A JP31626592 A JP 31626592A JP H06149297 A JPH06149297 A JP H06149297A
- Authority
- JP
- Japan
- Prior art keywords
- autocorrelation
- order
- reflection coefficient
- short
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
の自己相関より共分散行列を計算する。初期相関算出部
14は初期の前向き残差の自己相関F0 、後向き残差の
自己相関B0 及び両者の相互の相関C0 を算出する。所
定値算出部15は上記自己相関F0 、B0 より閾値とな
る所定値を算出する。予測誤差レベル判定部16は相関
計算部19で計算された自己相関Fj 、後向き残差の自
己相関Bj及び両者の相互の相関Cj に基づいた予測誤
差と上記所定値とを比較する。反射係数計算&量子化部
17は反射係数を求め、量子化する。反射係数固定部1
8は予測誤差レベル判定部16の結果に基づいてその次
数及び高次の次数の反射係数を零近傍に固定し、その次
数以降の反射係数を求めない。 【効果】 演算誤差が原因で起こる異音の発生を未然に
防ぎ、通話品質を上げる。
Description
器に適用して好ましい短期予測係数の計算方法に関す
る。
〜9.6 kbpsでの音声符号化方法には、ベクトル和励起リ
ニア予測(VSELP:Vector Sum Excited Linear Pr
ediction)等のコード励起リニア予測(CELP:Code
Excited Linear Prediction)が提唱されている。
トローラ・インコーポレーテッドによる特表平2−50
2135号公報の「改良されたベクトル励起源を有する
ディジタル音声コーダ」及び「VECTOR SUM EXCITED LIN
EAR PREDICTION(VSELP) : SPEECH CODING AT 8 KBPS :I
ra A.Gerson and Jasiuk :Paper presented at the In
t.Conf.on Acoustics,Speech and Signal Processing -
April 1990 」に記載されている。
適用した音声符号化装置としては、VSELPエンコー
ダがある。このVSELPエンコーダの処理は、大きく
分けて、短期予測係数の計算、量子化したベクトルの算
定から成り立っている。
ントに相当する部分を取り出す処理である。すなわち、
入力音声データから得られた自己相関値から複数次の反
射係数を求め、この複数次の反射係数を基に複数次の短
期予測係数を求めて音声のホルマントを予測する処理で
ある。
から複数次の反射係数を求めるには、演算によって求め
られた反射係数値に一番近い反射係数をVSELP自身
のテーブルからサーチする。上記演算は、DSP(ディ
ジタルシグナルプロセッサ)によって行われる。
測次数が10次の場合、10個の反射係数を求めるが、
上記DSPの演算形式が固定少数点であると高次の反射
係数計算時に予測誤差がだんだん小さくなっていくた
め、結果として演算誤差が生じ、これが原因で誤った反
射係数を求めることになり、最悪の場合異音を発するこ
とがあった。
を発生させない短期予測係数の計算方法の提供を目的と
する。
算方法は、入力音声データに基づいて共分散行列を求
め、上記共分散行列から複数次の反射係数を低次より順
次算出する工程と、上記工程より求められた複数次の反
射係数より複数次の短期予測係数を求める工程とを有す
る短期予測係数の計算方法において、上記複数次の反射
係数を低次より順次算出する工程中に、ある次数の前向
き残差の自己相関と後向き残差の自己相関の和が、予め
決められた所定値以下となるとき、その次数及び高次の
次数の反射係数を強制的に零近傍の値とすることを特徴
として上記課題を解決する。
き残差の自己相関の和が予め決められた所定値以下とな
った場合、その次数以降の反射係数の算出は行わなくて
もよい。
法は、入力音声データに基づいて共分散行列を求め、上
記共分散行列から複数次の反射係数を低次より順次算出
する工程と、上記工程より求められた複数次の反射係数
から複数次の短期予測係数を求める工程とを有する短期
予測係数の計算方法において、上記複数次の反射係数を
低次より順次算出する工程中に、ある次数の前向き残差
の自己相関と後向き残差の自己相関の平均値が、予め決
められた所定値以下となるとき、その次数及び高次の次
数の反射係数を強制的に零近傍の値とすることを特徴と
して上記課題を解決する。
き残差の自己相関の平均値が予め決められた所定値以下
となった場合、その次数以降の反射係数の算出は行わな
くてもよい。
算方法では、上記反射係数を固定少数点演算により算出
している。
次数の前向き残差の自己相関と後向き残差の自己相関の
和又は平均値が予め決められた所定値以下となるとき
に、入力音声データに基づいて得られた共分散行列から
の複数次の反射係数がその次数及び高次の次数で強制的
に零近傍の値となるように、低次より順次算出されるの
で、誤った反射係数を算出せず、異音を発生させない。
が適用できる線形予測符号化器であるベクトル和励起リ
ニア予測(VSELP:Vector Sum Excited Linear Pr
ediction)エンコーダを一実施例として図面を参照しな
がら説明する。
エンコーダの要部(短期予測係数計算部)の概略構成を
示す。
ータの170サンプルを1フレームとして短期予測係数
の計算を行うものである。先ず、図1において、入力端
子11には、例えば8kHz程度の所定のサンプリングレ
ートでディジタル変換された音声信号(音声サンプルデ
ータ)が供給されており、この音声サンプルデータは、
共分散行列計算部12に送られる。
ルデータの自己相関より共分散行列を計算する。上記共
分散行列は、帯域幅の拡張のために窓かけ処理部13に
より、窓かけ処理される。この窓かけ処理された共分散
行列は、初期相関算出部14に供給される。
残差の自己相関F0 を計算するF0計算部14aと、初
期の後向き残差の自己相関B0 を計算するB0 計算部1
4bと、自己相関F0 と自己相関B0 の相互の相関C0
を計算するC0 計算部14cとにより構成されている。
この初期相関算出部14で求められた自己相関F0 、自
己相関B0 及び相互の相関C0 は、所定値算出部15に
供給される。
0 とB0 とから一定の閾値である所定値を算出する。こ
の所定値算出部15で求められた所定値は、予測誤差レ
ベル判定部16に供給される。
する相関算出部19で求められた予測次数jの前向き残
差の自己相関Fj 及び予測次数jの後向き残差の自己相
関Bj から求められた予測誤差レベルも供給され、上記
所定値と値の大きさを比較する。そして、上記予測誤差
が上記所定値以下となるときに、例えばフラグ“0”を
反射係数固定部18に供給する一方、上記予測誤差が上
記所定値以下にならないときには、例えばフラグ“1”
を反射係数計算&量子化部17に供給する。
次数j(1≦j≦10)での反射係数rj を計算によっ
て求め、ベクトル量子化して、図示しないメモリ部に記
録しておく。この反射係数計算&量子化部17で求めら
れた反射係数rj は、相関算出部19に供給される。
き残差の自己相関Fj を計算するFj 計算部19aと、
予測次数jの後向き残差の自己相関Bj を計算するBj
計算部19bと、上記自己相関Fj と上記自己相関Bj
の相互の相関Cj を計算するCj 計算部19cにより構
成され、上記反射係数rj 及び前段の前向き残差の自己
相関Fj-1 、前段の後向き残差の自己相関Bj-1 、前段
の相互の相関Cj-1 より、予測次数jの前向き残差の自
己相関Fj 、予測次数jの後向き残差の自己相関Bj 及
び予測次数jの相互の相関Cj を算出する。
レベル判定部16からのフラグ“0”を受けて、その次
数及び高次の次数の反射係数rj を強制的に零近傍の値
に固定し、その次数以降の反射係数の算出を行わない。
この反射係数rj は、j=10まで繰り返されながら短
期予測係数算出部20に供給される。この短期予測係数
算出部20は、上記反射係数rj を基に短期予測係数を
算出し、出力端子21から出力する。
声サンプルデータの自己相関より共分散行列を算出し、
この共分散行列から反射係数を求める際に、ある次数の
前向き残差の自己相関と後向き残差の自己相関の和が予
め決められた所定値以下となるときに、その次数及び高
次の次数での上記反射係数を強制的に零近傍の値とし、
その次数以降の反射係数の算出を行わない。
相関より反射係数を求め、この反射係数から短期予測係
数αk を求めることになるが、先ず、自己相関係数算出
の意味を説明する。
式に示すように利得パラメータG、フィルタ係数ak 及
び励振u(n) により推定できる。
次の(2)式に示すような予測出力S’(n) を出力す
る。
e(n) =G・u(n) なら、上記音声サンプルデータS
(n) を厳密に予測できる。ここで、短期予測係数αk が
優れていれば、音声信号S(n) のスペクトル的性質がよ
く表される予測出力S’(n) が得られる。そのために
は、予測誤差e(n) の平均2乗誤差En を、
要がある。ここで、S(m) は、音声区間nに対するサン
プルデータ数mの音声信号である。また、ここで得たい
のは短期間の音声信号に対する短期予測係数αk なの
で、音声信号は有限区間である。
する短期予測係数αk の値は、 ΔEn /Δdi (i=0、1、・・・、p) ・・・・・(5) となるので、次の(6)式が得られる。
ある。(以下αk * の“*”を省略してαk とする。)
を定義する。
ようになる。
φn (i,k) (k=0…p)が与えられれば短期予測係数
αk が求められる。すなわち、自己相関係数算出が意味
を持つことなる。
したように上記共分散計算部12が音声サンプルデータ
の自己相関より共分散行列を算出している。以下に、上
記共分散行列計算部12の原理を説明する。
り、φn (i,k) を計算する区間と音声サンプルデータS
n (m) の定義により2つの線形予測分析の方法が発生す
る。このうちの一つが共分散法である。この共分散法
は、平均2乗誤差を計算する区間を固定し、φn (i,k)
の計算の効果を考える方法である。
(i,k) は、
の範囲のSn (m) を必要とすることになり、足りないp
個は外側から補うことになる。
k) =φn (k,i) なので、これはp×pの対称行列であ
る。φn (i,k) をこの式のように計算する方法に基づく
解析方法が共分散法であり、上記共分散行列計算部12
の原理となっている。
先ず、時系列の線形予測分析に対する格子型フィルタ
は、通常、図2のようにp個の格子を持つカスケードに
より表されている。また、線形予測分析では、信号のス
ペクトルH(Z) は、次の(13)式に示すように全極の伝達
関数A(Z) によりモデル化される。
法により、予測係数ak と次の(14)式のような関係にあ
る。
向き残差fm (n) 、後向き残差bm(n) 、或いは両方を
最小にするように見積もられる。
が成り立つ。 f0(n) =b0(n) =S(n) f m+1(n)=f m (n) +km+1 bm (n−1) b m+1(n)=km+1 f m (n) +bm (n−1) ・・・・(15)
p (n) は予測誤差である。通常、格子形はkm を2乗の
関数として計算するので、次の(16)式が成立する。 Fm (n) =E(f m 2(n)) Bm (n) =E(b m 2(n −1)) Cm (n) =E(f m (n)b m (n−1)) ・・・・ (16) ここで、E(・)は期待値である。
i))とすると、次の(17)式が成立する。
(n−1)、C00 m =Cm (n) であり、上記(14)式より、上
記(17)式は、次の(18)式のように変換される。
き残差の自己相関F、後向き残差の自己相関B、相互の
相関Cを計算し、反射係数を求めることができる。
部12は、音声サンプルデータから共分散行列φ(i,k)
を、
ば、170サンプル)であり、Np は予測次数の総数
(例えば10次)である。
前向き残差の自己相関F0 、後向き残差の自己相関
B0 、両者の相互相関C0 を次の(20)式のように計算す
る。 F0 (i,k) =φ(i,k) 0≦i、k≦Np B0 (i,k) =φ(i+1,k +1) 0≦i、k≦Np C0 (i,k) =φ(i,k) 0≦i、k≦Np ・・・(20)
の自己相関と後向き残差の自己相関との和から閾値とな
る所定値を算出する。この所定値は、上記予測誤差レベ
ル判定部16に供給される。
予測次数j=1とする。すると、次の(21) 式より、反
射係数計算&量子化部17が反射係数rj を計算する。
の予測誤差は、前向き残差の自己相関と後向き残差の自
己相関との和より求めている。
上記反射係数計算&量子化部17によって、ベクトル量
子化される。
ら、終了となる。ここで、上記相関算出部19は、次の
(22)式より次段階の反射係数に対する予測次数jの前向
き残差の自己相関Fj 、予測次数jの後向き残差の自己
相関Bj及び予測次数jの相互の相関Cj を算出する。
1)され、上記反射係数計算&量子化部17に戻る。
高次に進むにつれて、Fj 、Bj 及びCj の値は、小さ
くなっていく。場合によっては、演算誤差がかなり影響
する程までに小さくなってしまい、以降の予測次数での
反射係数の算出を大きく誤らせることになる。
め設定した所定の値よりも小さくなったか否かを上記予
測誤差レベル判定部16が判定し、小さくなったという
判定結果が得られたときに、上記反射係数固定部18が
その次数及び高次の次数の反射係数を強制的に零近傍に
固定し、その次数以降の反射係数の計算を止める。上記
予め設定された所定の値は、元のF0 (0,0) の値の約1
/1000未満の値であり、十分小さい値である。
定値を、上記前向き残差の自己相関と上記後向き残差の
自己相関の和から求めているが、上記前向き残差の自己
相関と上記後向き残差の自己相関の平均値から求めても
よい。
の反射係数算出までの動作の流れを示したフローチャー
トである。
計算部12で音声サンプルデータの自己相関より共分散
行列を計算する。
4で初期の次数の前向き残差の自己相関F0 と、初期の
次数の後向き残差の自己相関B0 と、自己相関F0 と自
己相関B0 の相互の相関C0 とを算出する。
する。ステップS4では、自己相関F0 と自己相関B0
とから閾値となる所定値を算出する。
められた所定値よりも、和又は平均値によって求められ
た予測誤差が小さいか否かを判別する。ここで、YES
を判別するとステップS11に進み、NOを判別すると
ステップS6に進む。
子化部17で反射係数rj を計算する。
子化部17で反射係数rj を量子化する。
ったか否かを判別する。ここで、YESを判別するとこ
のフローチャートは終了となり、NOを判別するとステ
ップS9に進む。
き残差の自己相関Fj と、後向き残差の自己相関B
j と、自己相関Fj と自己相関Bj の相互の相関Cj と
を算出する。
メントし、ステップS5に戻る。
の判別結果を受けて、j次から10次までの反射係数に
対し、0近傍の量子化された反射係数を代入する。ここ
で、いう0近傍の量子化とは、量子化した反射係数のテ
ーブルの内、最も0に近い値を指すものである。
ダは、音声サンプルデータの自己相関より共分散行列を
算出し、この共分散行列から反射係数を求める際に、あ
る次数の前向き残差の自己相関と後向き残差の自己相関
の和又は平均値が予め決められた所定値以下となるとき
に、その次数及び高次の次数での上記反射係数を強制的
に零近傍の値とし、その次数以降の反射係数を算出しな
いので、誤った反射係数を用いることなく、異音を発生
させない。
法は、上記実施例にのみ限定されるものではなく、例え
ば、適用する音声符号化方法としては、上記VSELP
を用いたものに限定されるものではない。
は、ある次数の前向き残差の自己相関と後向き残差の自
己相関の和又は平均値が予め決められた所定値以下とな
るときに、入力音声データに基づいて得られた共分散行
列からの複数次の反射係数がその次数及び高次の次数で
強制的に零近傍の値とし、その次数以降の反射係数を算
出しないように、低次より順次算出されるので、誤った
反射係数を用いなくともよい。そのため、演算誤差が原
因で起こる異音の発生を未然に除去し、通話品質を上げ
ることができる。
能な実施例のVSELPエンコーダの要部の概略構成を
示すブロック図である。
タを示す図である。
流れを示すフローチャートである。
Claims (5)
- 【請求項1】 入力音声データに基づいて共分散行列を
求め、上記共分散行列から複数次の反射係数を低次より
順次算出する工程と、 上記工程より求められた複数次の反射係数より複数次の
短期予測係数を求める工程とを有する短期予測係数の計
算方法において、 上記複数次の反射係数を低次より順次算出する工程中
に、ある次数の前向き残差の自己相関と後向き残差の自
己相関の和が、予め決められた所定値以下となるとき、
その次数及び高次の次数の反射係数を強制的に零近傍の
値とすることを特徴とする短期予測係数の計算方法。 - 【請求項2】 上記前向き残差の自己相関と後向き残差
の自己相関の和が、予め決められた所定値以下となった
次数以降の反射係数の算出は行わないことを特徴とする
請求項1記載の短期予測係数の計算方法。 - 【請求項3】 入力音声データに基づいて共分散行列を
求め、上記共分散行列から複数次の反射係数を低次より
順次算出する工程と、 上記工程より求められた複数次の反射係数から複数次の
短期予測係数を求める工程とを有する短期予測係数の計
算方法において、 上記複数次の反射係数を低次より順次算出する工程中
に、ある次数の前向き残差の自己相関と後向き残差の自
己相関の平均値が、予め決められた所定値以下となると
き、その次数及び高次の次数の反射係数を強制的に零近
傍の値とすることを特徴とする短期予測係数の計算方
法。 - 【請求項4】 上記前向き残差の自己相関と後向き残差
の自己相関の平均値、予め決められた所定値以下となっ
た次数以降の反射係数の算出は行わないことを特徴とす
る請求項3記載の短期予測係数の計算方法。 - 【請求項5】 上記反射係数を固定少数点演算により算
出することを特徴とする請求項1又は請求項3の短期予
測係数の計算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31626592A JP3237244B2 (ja) | 1992-10-31 | 1992-10-31 | 短期予測係数の計算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31626592A JP3237244B2 (ja) | 1992-10-31 | 1992-10-31 | 短期予測係数の計算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06149297A true JPH06149297A (ja) | 1994-05-27 |
JP3237244B2 JP3237244B2 (ja) | 2001-12-10 |
Family
ID=18075174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP31626592A Expired - Lifetime JP3237244B2 (ja) | 1992-10-31 | 1992-10-31 | 短期予測係数の計算方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3237244B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2237132B (en) * | 1989-01-20 | 1993-01-06 | Hochiki Co | Fire alarm |
AU734148B2 (en) * | 1989-01-20 | 2001-06-07 | Hochiki Corporation | Fire alarm |
WO2012053149A1 (ja) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法 |
CN115131943A (zh) * | 2022-07-07 | 2022-09-30 | 杭州申昊科技股份有限公司 | 一种基于深度学习的声光联动预警方法 |
-
1992
- 1992-10-31 JP JP31626592A patent/JP3237244B2/ja not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2237132B (en) * | 1989-01-20 | 1993-01-06 | Hochiki Co | Fire alarm |
AU734148B2 (en) * | 1989-01-20 | 2001-06-07 | Hochiki Corporation | Fire alarm |
WO2012053149A1 (ja) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法 |
CN115131943A (zh) * | 2022-07-07 | 2022-09-30 | 杭州申昊科技股份有限公司 | 一种基于深度学习的声光联动预警方法 |
CN115131943B (zh) * | 2022-07-07 | 2023-10-31 | 杭州申昊科技股份有限公司 | 一种基于深度学习的声光联动预警方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3237244B2 (ja) | 2001-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6199035B1 (en) | Pitch-lag estimation in speech coding | |
US6202046B1 (en) | Background noise/speech classification method | |
JP3392412B2 (ja) | 音声コーディング装置及び音声エンコーディング方法 | |
EP2030199B1 (en) | Linear predictive coding of an audio signal | |
Barnwell | Recursive windowing for generating autocorrelation coefficients for LPC analysis | |
JP3254687B2 (ja) | 音声符号化方式 | |
US20060074643A1 (en) | Apparatus and method of encoding/decoding voice for selecting quantization/dequantization using characteristics of synthesized voice | |
US6593872B2 (en) | Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method | |
EP1688920B1 (en) | Speech signal decoding | |
JP2000163096A (ja) | 音声符号化方法及び音声符号化装置 | |
JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPH06149297A (ja) | 短期予測係数の計算方法 | |
JP2891193B2 (ja) | 広帯域音声スペクトル係数量子化装置 | |
US6208962B1 (en) | Signal coding system | |
WO1996004647A1 (en) | Sensitivity weighted vector quantization of line spectral pair frequencies | |
JPH0830299A (ja) | 音声符号化装置 | |
JP3089967B2 (ja) | 音声符号化装置 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3290443B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3249144B2 (ja) | 音声符号化装置 | |
JPH08185199A (ja) | 音声符号化装置 | |
Nagarajan et al. | Efficient implementation of linear predictive coding algorithms | |
JP3144213B2 (ja) | 音声パラメータ分析装置および音声符号化装置 | |
JP3230380B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010904 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091005 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091005 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101005 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111005 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121005 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131005 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131005 Year of fee payment: 12 |