JP2870608B2 - 音声ピッチ予測装置 - Google Patents

音声ピッチ予測装置

Info

Publication number
JP2870608B2
JP2870608B2 JP3282691A JP3282691A JP2870608B2 JP 2870608 B2 JP2870608 B2 JP 2870608B2 JP 3282691 A JP3282691 A JP 3282691A JP 3282691 A JP3282691 A JP 3282691A JP 2870608 B2 JP2870608 B2 JP 2870608B2
Authority
JP
Japan
Prior art keywords
pitch
prediction
memory
length
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3282691A
Other languages
English (en)
Other versions
JPH04271399A (ja
Inventor
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP3282691A priority Critical patent/JP2870608B2/ja
Publication of JPH04271399A publication Critical patent/JPH04271399A/ja
Application granted granted Critical
Publication of JP2870608B2 publication Critical patent/JP2870608B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号または音声信
号を線形予測した残差信号に対してピッチ予測を行う音
声ピッチ予測装置に関する。
【0002】
【従来の技術】一般に音声信号は、近接サンプルの相関
が高く、近接サンプルの信号系列による線形予測に基づ
いて音声信号を効率よく情報圧縮することができる。ま
た、音声信号にはピッチによる繰り返し的な冗長性もあ
り、ピッチ予測により情報圧縮の効率をさらに高めるこ
ともできる。
【0003】これら2つの線形予測を用いた低ビットレ
イトの音声符号化方法として、コ−ド・エキサイテッド
・リニア・プレディクション(Code-Excited Linear Pr
ediction(CELP))が盛んに研究開発されている
(参考文献:"Stochastic Coding of Speech Signals a
t Very Low Bit Rates : The Importance of Speech Pe
rception", M.R.Schroeder and B.S. Atal, Speech Com
munication 4, 1985, page 155-162, North-Holand)。
【0004】CELPでは、予測残差信号を40サンプ
ルの長さのベクトルとして扱い、ベクトル量子化の技術
を用いて予測残差信号を非常に低ビットレイトで圧縮符
号化している。
【0005】図4にCELPに基づく従来の符号化器の
一構成例を示す。
【0006】図4に示すコードブック401には、一定
のサンプル長(例えば40サンプル)の、残差信号波形
(コードワードと称する)を複数種類(例えば1024
種類)記憶させ、最小エラー選択器408の指示によ
り、全てのコードワードを順番に出力させる。
【0007】このコードワードは掛算器402で増幅し
た後、ピッチ予測器403でピッチ構造を持たせ、次に
スペクトル予測器404でスペクトル的な構造を持たせ
て合成出力波形を得る。
【0008】入力端子405から入力された音声信号波
形は、上記一定のサンプル長のベクトルとして加算器4
06に入力され、加算器406はこの音声信号波形と予
測器404からの合成信号波形との差、即ちエラー波形
を出力する。
【0009】このエラー波形は、聴覚的重み付けフィル
タ407でスペクトル的に整形され、最小エラー選択器
408に入力される。
【0010】最小エラー選択器408は、この整形後の
エラー波形のエネルギーを最小にするようなコードワー
ドをコードブック401から選択する。
【0011】ここで、符号化されたパラメータは、コー
ドワードのエネルギーgain、スペクトルパラメータ
α、ピッチパラメータtau,a、及び残差コードワー
ドの指標値indexである。
【0012】伝送情報量の具体例として、スペクトルパ
ラメータαは20msecごとに40bits(2Kb
ps)、その他のパラメータは5msecごとに、ピッ
チパラメータとしてピッチ長tauに7bitsと予測
係数aに3bits(2Kbps)、コードワードの指
標値indexに10bits(2Kbps)、コード
ワードのエネルギーgainに5bits(1Kbp
s)とすると、全体の伝送情報量は7Kbpsとなる。
【0013】ピッチ予測器403としては、最も一般的
に使用されている1タップのものを想定し、ピッチ長
(例えば40〜167サンプル)は7bitsで符号化
し、予測係数は非線形量子化により3bitsに量子化
して伝送する。
【0014】
【発明が解決しようとする課題】しかしながら、上述の
CELP符号化器では、伝送情報量のうちピッチパラメ
ータ(ピッチ長と予測係数)の情報量が全体の3割程度
を占めている。従って、全体の伝送情報量を例えば4K
bps程度に低減するためには、ピッチパラメータの情
報量をさらに圧縮する必要がある。
【0015】そのために従来のCELP符号化器は、例
えば分析区間の長さを5msecから10msecに長
くしてピッチパラメータの伝送レイトを低減させて情報
量を圧縮していた。しかし、音声のピッチ構造の時間的
変化が速いので、比較的長い分析期間(10msec)
に亘ってピッチ長や予測係数が定常であると仮定して処
理することは無理であり、従来のCELP符号化器で
は、圧縮音声の品質が劣化するという問題点があった。
【0016】本発明は、上述した従来のCELP符号化
器における問題点に鑑み、分析区間の長さを長くするこ
となくピッチパラメータであるピッチ長と予測係数の伝
送情報量を低減することが可能な音声ピッチ予測装置を
提供する。
【0017】
【課題を解決すための手段】本発明の音声ピッチ予測装
置は、第1メモリ、第1ピッチ予測手段、ピッチ強度判
定手段、第2メモリ、第2ピッチ予測手段、符号化手段
を備える音声ピッチ予測装置であって、第1メモリは、
第2メモリが記憶するより前のフレームの分析信号を記
憶し、第1ピッチ予測手段は、第1メモリの分析信号に
対しピッチ予測を行い、第1ピッチ長、自己相関係数を
出力し、ピッチ強度判定手段は、第1ピッチ予測手段の
自己相関係数が所定の判定閾値より大きいか小さいかを
比較して比較結果を出力し、第2メモリは、現在のフレ
ームの分析信号を記憶し、第2ピッチ予測手段は、比較
結果が小さい場合には、第2メモリの分析信号に対しピ
ッチ予測を行い、第2ピッチ長、予測係数を出力し、比
較結果が大きい場合には、第1ピッチ長に基づいてピッ
チ長の探索範囲を所定の範囲に制限した上で、第2メモ
リの分析信号に対しピッチ予測を行い、第1ピッチ長に
対する差分、予測係数を出力し、符号化手段は、比較結
果が小さい場合には、第2ピッチ長と予測係数を第1の
ビット割合で符号化し、比較結果が大きい場合には、第
1ピッチ長に対する差分と予測係数を第2のビット割合
で符号化するように構成されている。
【0018】本発明の音声ピッチ予測装置は、第1メモ
リ、第1ピッチ予測手段、第3ピッチ予測手段、ピッチ
強度判定手段、第2メモリ、第2ピッチ予測手段、符号
化手段を備える音声ピッチ予測装置であって、第1メモ
リは、第2メモリが記憶するより前のフレームの分析信
号を記憶し、第1ピッチ予測手段は、第1メモリの分析
信号に対しピッチ予測を行い、第1ピッチ長、自己相関
係数を出力し、第3ピッチ予測手段は、第1ピッチ長に
基づいて推定平均ピッチ長を求め、ピッチ強度判定手段
は、第1ピッチ予測手段の自己相関係数が所定の判定閾
値より大きいか小さいかを比較して比較結果を出力し、
第2メモリは、現在のフレームの分析信号を記憶し、第
2ピッチ予測手段は、比較結果が小さい場合には、推定
平均ピッチ長を用いて、差分形式から第2メモリの分析
信号に対しピッチ予測を行い、第2ピッチ長、予測係数
を出力し、比較結果が大きい場合には、第1ピッチ長に
基づいてピッチ長の探索範囲を所定の範囲に制限した上
で、第2メモリの分析信号に対しピッチ予測を行い、第
1ピッチ長に対する差分、予測係数を出力し、符号化手
段は、比較結果が小さい場合には、第2ピッチ長と予測
係数を第1のビット割合で符号化し、比較結果が大きい
場合には、第1ピッチ長に対する差分と予測係数を第2
のビット割合で符号化するように構成されてもよい。
【0019】本発明の音声ピッチ予測装置は第1メモ
リ、第1ピッチ予測手段、ピッチ強度判定手段、第2メ
モリ、第1ピッチ予測部、第2ピッチ予測部、符号化手
段を備える音声ピッチ予測装置であって、第1メモリ
は、第2メモリが記憶するより前のフレームの分析信号
を記憶し、第1ピッチ予測手段は、第1メモリの分析信
号に対しピッチ予測を行い、第1ピッチ長、自己相関係
数を出力し、ピッチ強度判定手段は、第1ピッチ予測手
段の自己相関係数が所定の判定閾値より大きいか小さい
かを比較して比較結果を出力し、第2メモリは、現在の
フレームの分析信号を記憶し、第1ピッチ予測部は、比
較結果が小さい場合に、第2メモリの分析信号に対しピ
ッチ予測を行い、第2ピッチ長、予測係数を出力し、第
2ピッチ予測部は、第1ピッチ予測部よりタップ数が多
く、比較結果が大きい場合に、第1ピッチ長に基づいて
ピッチ長の探索範囲を所定の範囲に制限した上で、第2
メモリの分析信号に対しピッチ予測を行い、第1ピッチ
長に対する差分、予測係数を出力し、符号化手段は、比
較結果が小さい場合には、第2ピッチ長と予測係数を第
1のビット割合で符号化し、比較結果が大きい場合に
は、第1ピッチ長に対する差分と予測係数を第2のビッ
ト割合で符号化するように構成されてもよい。
【0020】
【作用】本発明の音声ピッチ予測装置によれば、第1メ
モリは、第2メモリが記憶するより前のフレームの分析
信号を記憶し、第1ピッチ予測手段は、第1メモリの
析信号に対しピッチ予測を行い、第1ピッチ長及び自己
相関係数を出力し、ピッチ強度判定手段は、第1ピッチ
予測手段の自己相関係数が所定の判定閾値より大きいか
小さいかを比較して比較結果を出力し、第2メモリは、
現在のフレームの分析信号を記憶し、第2ピッチ予測手
段は、比較結果が小さい場合には、第2メモリの分析信
号に対しピッチ予測を行い、第2ピッチ長及び予測係数
を出力し、比較結果が大きい場合には、第1ピッチ長
基づいてピッチ長の探索範囲を所定の範囲に制限した上
で、第2メモリの分析信号に対しピッチ予測を行い、第
1ピッチ長に対する差分及び予測係数を出力し、符号化
手段は、比較結果が小さい場合には、第2ピッチ長と予
測係数を第1のビット割合で符号化し、比較結果が大き
場合には、第1ピッチ長に対する差分と予測係数を第
2のビット割合で符号化する。
【0021】
【実施例】以下、図面を参照して本発明の音声ピッチ予
測装置における実施例について説明する。
【0022】図1は、本発明の音声ピッチ予測装置にお
ける第1実施例の構成を示すブロック図である。
【0023】図1に示すように、本実施例の音声ピッチ
予測装置は、入力端子101に接続された第1メモリ1
02、第1メモリ102に接続された第1ピッチ予測手
段としてのピッチ予測器103、ピッチ予測器103に
接続されたピッチ強度判定手段としてのピッチ強度判定
器104、ピッチ予測器103に接続されたスイッチ1
05、入力端子106及び第1メモリ102に接続され
た第2メモリ107、第2メモリ107に接続された第
2ピッチ予測手段としてのピッチ予測器108、ピッチ
強度判定器104及びピッチ予測器108及び出力端子
110に接続された符号化手段としての適応ビット配分
符号化器109により構成されている。
【0024】次に、本実施例の音声ピッチ予測器の動作
を説明する。
【0025】まず、過去の分析区間(以下、分析フレー
ムと称する)の被分析信号としての音声信号または音声
信号を線形予測器により予測した残差信号(以下、音声
信号と称する)が、入力端子101に入力されると、第
1メモリ102は過去の分析フレームの音声信号を入力
して記憶する。
【0026】ピッチ予測器103は、第1メモリ102
が保持する過去の分析フレームの音声信号に対してピッ
チ予測を行って過去の分析フレームに対する音声信号の
第1ピッチ長及びピッチ構造の強弱(以下、自己相関係
と称する)を出力する。
【0027】ピッチ強度判定器104は、ピッチ予測器
103から出力される自己相関係数が所定の値より高い
(大きい)ときに所定の判定信号を出力する。
【0028】第2メモリ107は、入力端子106を通
じて現在の分析フレームの音声信号を入力して記憶す
る。
【0029】ピッチ予測器108は、第2メモリ107
が記憶している現在の分析フレームの音声信号に対して
ピッチ予測を行い、現在の分析フレームの音声信号に対
する第2ピッチ長及び予測係数を出力する。その際に、
ピッチ強度判定器104が所定の判定信号を出力したと
きには、ピッチ予測器103が出力する第1ピッチ長に
基づいて第2ピッチ長の探索範囲を所定の範囲に制限す
る。
【0030】適応ビット配分符号化器109は、ピッチ
予測器108が出力する第2ピッチ長及び予測係数を所
定のビット数で符号化し、出力端子110に出力する。
また、適応ビット配分符号化器109は、ピッチ強度判
定器104が所定の判定信号を出力したときには、第2
ピッチ長のビット数を小さくすると共に予測係数のビッ
ト数を大きくし、かつ第2ピッチ長を差分形式で符号化
する。
【0031】入力端子101から過去の分析フレ−ムの
音声信号がフレームごとに入力されると、入力された過
去の分析フレームの音声信号は、第1メモリ102に記
憶される。式1に過去の分析フレームの音声信号を表
す。
【0032】
【数1】
【0033】ここで、n=1は現在の分析フレームの音
声信号に対する直前のサンプルを示す指標値である。
【0034】ピッチ予測器103は、過去の分析フレー
ムの音声信号を第1メモリ102から受け取って、以下
に述べる方法によりピッチ長tauを推定すると共に
己相関係数oを求める。即ち、ピッチ予測器103
は、式2を用いて式3により表される自己相関係数値C
o2[τ]を最大にするτを、第1ピッチの所定の推定
範囲(40〜167サンプル)で探索し、得られたτを
ピッチ長tauとして出力し、更にこのピッチ長tau
(=τ)における自己相関係数o(=Co2[ta
u]=Co2[τ])を計算して出力する。
【0035】
【数1】
【0036】
【数2】
【0037】上記式2の自己相関係数の計算式は、従来
用いられていた計算式(式4)と比較すると自己相関係
の計算範囲が推定ピッチ長になっていることが分か
る。式4に基づいてピッチ長tauを推定した場合に
は、その値は真のピッチ長の倍数になって変動が非常に
激しい値となる。式4を用いる場合、計算範囲(つまり
ピッチの分析窓長)が短いときは、ピッチとは無関係な
長さを誤って出力してしまうことが多い。しかし式2で
は、推定ピッチが低い場合には計算範囲が広がり、ピッ
チ構造を持つ大局的な波形から自己相関係数が計算され
ることになるから、局所的な波形の相似状態をピッチと
誤って判断する確率が低下する。
【0038】
【数3】
【0039】式3は既存の3タップのピッチ予測器で用
いられている計算式である。一般に、ピッチ周波数が高
い場合には、サンプルごとに計算される自己相関係数
離散的になり、真のピッチ長での自己相関係数を得るこ
とは困難でありピッチ長を誤って計算してしまうことが
あるが、式3を用いることによりそれを防止できる(参
考文献:USP4,133,976; "Predictive Speech Signal Co
ding with Reduced Noise Effects", B. S. Atal. M.
R. Schroeder )。
【0040】ピッチ強度判定器104は、ピッチ予測器
103が出力する自己相関係数oを受け取り、予め設
定された特定の範囲における自己相関係数の値(以下、
判定値と称する)、例えば0.5、と比較する。
【0041】ここで、自己相関係数oが判定値より
高い(大きい)場合には、過去の分析フレームの音声信
号に強いピッチ構造があるとして所定の判定信号を出力
する。
【0042】他方、自己相関係数oが判定値より低
い(小さい)場合には、ピッチ強度判定器104は過去
の分析フレームの音声信号には弱いピッチ構造しかない
としてこの判定信号を出力せず、このときスイッチ10
5がオフになり、ピッチ予測器108が従来のピッチ予
測を行う。
【0043】入力端子106から入力される現在の分析
フレームの音声信号は、フレームごとにメモリ10
記憶される。この現在の分析フレームの音声信号を式5
で表す。
【0044】
【数5】
【0045】ピッチ予測器10はこのように表される
現在の分析フレームの音声信号を第2メモリ107から
受け取り、次のようにしてピッチ長tauを推定し、予
測係数Coefを算出する。なお、簡単のため、ピッチ
予測器108は1タップのピッチ予測器であるとする。
この1タップのピッチ予測器の処理内容は式6によって
表される。
【0046】
【数6】
【0047】ここで、Err[n]は、ピッチ予測残差
信号を表す。
【0048】ピッチ予測器108は、まず、ピッチ予測
器103と同様に式7で表される自己相関係数を最大に
するτをピッチ探索範囲から検出し、その検出されたτ
をピッチ長Tau(=τ)として出力する。また、ピッ
チ予測器108はそのピッチ長Tauを用いて式8によ
り予測係数Coefを計算して出力する。
【0049】
【数4】
【0050】
【数8】
【0051】適応ビット配分符号化器109は、ピッチ
予測器108から出力されるピッチ長Tau及び予測係
数Coefを受け取る。ピッチ強度判定器104が、過
去の分析フレームの音声信号には弱いピッチ構造しかな
いと判定した場合を説明する。所定の判定信号を出力し
ていないので、適応ビット配分符号化器109は現在の
分析フレームの音声信号にも弱いピッチ構造しかないと
予測する。
【0052】そして、ピッチ長及び予測係数へのビット
配分として、ピッチ長には多くのビット数を、予測係数
には少ないビット数をそれぞれ割り当てる(例えばピッ
チ長に7ビット、予測係数に1ビット)。
【0053】上記のようなビット配分が有効なのは、ピ
ッチ構造が弱いフレームではピッチ予測のピッチ長は非
常に変化が激しく、予測係数に関しては音声信号の自己
相関値が低いので、予測係数のビット数を小さくしても
そのための性能の劣化が許容できるためである。なお、
予測係数の量子化誤差による性能劣化は、自己相関値a
と、量子化による誤差dの関数として式9により表され
る。
【0054】
【数9】
【0055】適応ビット配分符号化器109は、上述し
たようなビット配分でピッチ長及び予測係数を符号化
し、符号化されたピッチ長及び予測係数をピッチパラメ
ータとして出力端子110に出力する。
【0056】次に、ピッチ予測器103から出力される
自己相関係数oが判定値より高く(大きく)、過去
の分析フレームの音声信号に強いピッチ構造があるとし
て所定の判定信号をピッチ強度判定器104が出力した
場合の動作を説明する。
【0057】上記の場合には、所定の判定信号によって
スイッチ105はオンし、ピッチ予測器103が推定し
たピッチ長tauがピッチ予測器108に与えられる。
ピッチ予測器108はこの推定したピッチ長tauから
差分形式で表現できる範囲でピッチ長を探索する。
【0058】例えば、後述するように、適応ビット配分
符号化器109がピッチ長に2ビットを割り当てる場合
には、ピッチの探索範囲は、ピッチ長tauの近傍4
点、すなわちtau−2,tau−1,tau,tau
+1のみとなる。ピッチ予測器108はこの範囲で、上
述のようにしてピッチ長を求め、かつ予測係数を算出す
る。
【0059】適応ビット配分符号化器109は、算出さ
れたピッチ長及び予測係数をピッチ予測器108から受
け取って符号化するが、ピッチ強度判定器104が所定
の判定信号を出力しているのでピッチ長は差分形式で符
号化され、ピッチ長には少ないビット数、そして予測係
数には多くのビット数が割り当てられる、例えば、ピッ
チ長に2ビット、予測係数に6ビットのビット配分にな
る。
【0060】ピッチ長を差分形式で、少ないビット数で
符号化するのは、現在の分析フレームの音声信号に対す
るピッチ構造が強いと予想できるからである。予測係数
に多くのビット数を割り当てるのは、予測係数に関して
は音声信号の自己相関値が高い(大きい)ので、予測ゲ
インを大きく取るためには、予測係数の量子化誤差をで
きるだけ小さく抑える必要があるからである。適応ビッ
ト配分符号化器109は、このようにして符号化したピ
ッチ長及び予測係数を出力端子110に出力する。
【0061】上述したように本実施例による音声ピッチ
予測装置では、ピッチパラメータであるピッチ長及び予
測係数を符号化するときに、自己相関係数(ピッチ構造
の強弱)に基づいてピッチ長及び予測係数のビット数を
適応的に変化させて、ピッチ長を差分形式で符号化する
ので、ピッチパラメータを効率よく情報圧縮することが
できる。
【0062】次に本発明の音声ピッチ予測装置における
第2実施例について説明する。
【0063】図2は本発明による音声ピッチ予測器の第
2実施例の構成を示すブロック図である。図1の音声ピ
ッチ予測器と同一の構成要素には同一の符号を付して説
明を省略する。
【0064】図2に示す音声ピッチ予測装置は、上述し
た図1に示すピッチ予測器108の代わりにピッチ予測
器208及びピッチ予測器211を備えている。また、
スイッチ105の代わりにスイッチ205を備えてい
る。
【0065】ピッチ強度判定器104が所定の判定信号
を出力したときは、スイッチ205が第2メモリ107
の出力とピッチ予測器208の入力とを接続し、ピッチ
強度判定器104が所定の信号を出力しないときは、第
2メモリ107の出力とピッチ予測器211の入力とを
接続する。
【0066】ピッチ予測器211は、図1のピッチ予測
器108と同様に1タップのピッチ予測器である。他
方、ピッチ予測器208は、3タップのピッチ予測器で
あり、ピッチ予測器103からのピッチ長に基づいてピ
ッチ長の探索範囲を制限する。
【0067】適応ビット配分符号化器209は、適応ビ
ット配分符号化器109と基本的に同じであるが、ピッ
チ強度判定器104が所定の判定信号を出力した場合に
は、ピッチ予測器208からのピッチパラメータを符号
化し、ピッチ強度判定器104が所定の判定信号を出力
しない場合には、ピッチ予測器211からのピッチパラ
メータを符号化する。
【0068】メモリ102、ピッチ予測器103及びピ
ッチ強度判定器104の動作は、図1の場合と同じであ
るので説明を省略する。
【0069】まず、ピッチ強度判定器104が、過去の
分析フレームの音声信号のピッチ構造が弱いと判定し
て、所定の判定信号を出力しない場合の動作を説明す
る。
【0070】この場合には、ピッチ予測器211は、ス
イッチ205を通じてメモリ107から現在の分析フレ
ームの音声信号を受け取ってピッチ長及び予測係数を求
める。
【0071】ピッチ予測器211は、図1のスイッチ1
05がオフの場合のピッチ予測器108と同様の動作に
よってピッチ長及び予測係数を求めて、ピッチ長及び予
測係数を適応ビット配分符号化器209に出力する。
【0072】適応ビット配分符号化器209は、得られ
たピッチ長及び予測係数にそれぞれビット数を配分(例
えば、7ビットと1ビット)し、そのビット配分により
符号化してから端子110に出力する。
【0073】ピッチ強度判定器104が、過去の分析フ
レームの音声信号のピッチ構造が強いと判定し、所定の
判定信号を出力した場合には、ピッチ予測器208は、
メモリ107から現在の分析フレームの音声信号を受け
取ってピッチ長及び予測係数を求める。このピッチ予測
器208の処理内容は式10により表される。
【0074】
【数10】
【0075】ピッチ予測器208には、ピッチ予測器1
03が推定したピッチ長tauが与えられており、ピッ
チ予測器208は推定されたピッチ長tauに基づいて
ピッチの探索範囲を制限する。例えば適応ビット配分符
号化器209がピッチ長に2ビットを割り当てる場合に
は、ピッチの探索範囲は、ピッチ長tauの近傍4点、
すなわちtau−2,tau−1,tau,tau+1
のみとなる。ピッチ予測器208はこの範囲で、ピッチ
長を求め、かつ3つの予測係数を算出する。
【0076】適応ビット配分符号化器209は、上記の
ピッチ長及び予測係数をピッチ予測器208から受け取
って符号化するが、ピッチ強度判定器104が所定の判
定信号を出力しているのでピッチ長が差分形式で符号化
され、ピッチ長には少ないビット数を、予測係数には多
くのビット数をそれぞれ配分する(例えばピッチ長に2
ビット、予測係数に6ビット)。
【0077】図1に示した第1実施例における音声ピッ
チ予測装置では、ピッチ強度判定器104が所定の判定
信号を出力した場合には、適応ビット配分符号化器10
9は、予測係数を符号化する場合のビット数を増加させ
ていた。しかしピッチ予測器108は1タップのピッチ
予測器であるため、予測係数に3ビット以上のビット数
を割り当てても改善効果は飽和傾向となる。
【0078】本実施例の音声ピッチ予測装置では、上述
のようにピッチ強度判定器104が所定の判定信号を出
力した場合には、3タップのピッチ予測器208により
ピッチ長および予測係数が求められる。そして3タップ
の場合には、1タップの場合に比べ予測係数に多くの情
報量が必要となるが、予測ゲインが高く、性能が優れて
いるので、適応ビット配分符号化器209で予測係数に
大きいビット数を割り当てることが一層効果的となる。
【0079】次に本発明の音声ピッチ予測装置における
第3実施例について説明する。
【0080】図3は、本実施例における音声ピッチ予測
装置の構成を示すブロック図である。
【0081】図1の音声ピッチ予測器と同一の構成要素
には同一の符号を付して説明を省略する。
【0082】図3に示す音声ピッチ予測装置は、新たに
ピッチ予測器305を備えている。
【0083】ピッチ予測器305は、ピッチ強度判定器
104が過去の分析フレームの音声信号のピッチ構造が
強いと判定して、所定の判定信号を出力したときに、ピ
ッチ予測器103が出力するピッチ長tauに基づい
て、推定平均ピッチを求めてピッチ予測器308に出力
する。
【0084】ピッチ予測器305は、式11、式12に
基づいて推定平均ピッチを求める。
【0085】
【数11】
【0086】
【数12】
【0087】ここで、AvePtchは推定平均ピッ
チ、tauはピッチ予測器103が出力するピッチ長、
aは定数であり例えば0.1に設定される。
【0088】Limit[x](但し、x=AvePi
tch)は、xを一定の範囲に抑える関数であり、本実
施例の場合にはxを72から136に制限する。式12
で表されるOutAPは、ピッチ予測器305が出力す
る推定平均ピッチである。
【0089】ピッチ予測器308は、ピッチ強度判定器
104が所定の判定信号を出力しない場合には、ピッチ
予測器305が出力する推定平均ピッチから、差分形式
で表現できる範囲でピッチ長を探索する。それ以外はピ
ッチ予測器108と同じである。
【0090】適応ビット配分符号化器309は、ピッチ
強度判定器104から所定の判定信号が入力されるか否
かに応じてビット配分を設定してピッチ予測器308か
ら受け取ったピッチ長及び予測係数を符号化するが、適
応ビット配分符号化器109と異なり、所定の判定信号
が入力されない場合でもピッチ長を差分形式で符号化す
る。
【0091】メモリ102、ピッチ予測器103及びピ
ッチ強度判定器104の動作は、図1の場合と同じな
で説明を省略する。
【0092】ピッチ予測器305は、ピッチ強度判定器
104が過去の分析フレームの音声信号に強いピッチ構
造があると判定して所定の判定信号を出力した場合に、
式11、式12に基づいて推定平均ピッチを求めてピッ
チ予測器308に出力する。
【0093】ピッチ予測器308は、ピッチ強度判定器
104が所定の判定信号を出力した場合には、ピッチ予
測器103が出力するピッチ長から差分形式で表現でき
る範囲でピッチ長を探索し、予測係数を求めて適応ビッ
ト配分符号化器309に出力する。
【0094】適応ビット配分符号化器309は、上記の
ピッチ長及び予測係数を受け取り、ピッチ長を予測係数
よりも少ないビットでビット配分(例えばピッチ長を差
分形式で2ビットに、予測係数を5ビットにビット
)し、ビット配分されたピッチ長及び予測係数を符号
化して出力端子110に出力する。ピッチ強度判定器1
04が、過去の分析フレームの音声信号には強いピッチ
構造がないと判定し、所定の判定信号を出力しない場合
には、ピッチ予測器308は、ピッチ予測器305が出
力した上記推定平均ピッチから差分形式で表現できる範
囲でピッチ長を探索する。そして、得られたピッチ長を
予測係数と共に適応ビット配分符号化器309に出力す
る。
【0095】適応ビット配分符号化器309は、上記の
ピッチ長及び予測係数を受け取り、それぞれをビット配
分(例えば、ピッチ長を差分形式で6ビット、予測係数
を1ビット)し、ビット配分されたピッチ長及び予測係
数を符号化して出力端子110に出力する。
【0096】適応ビット配分符号化器309が上述のよ
うにピッチ長を差分形式で6ビットに符号化する場合に
は、ピッチ長の値は、平均ピッチ(−32)から平均ピ
ッチ(+31)の範囲に入る。従って、ピッチ予測器3
05が推定平均ピッチを求める際、推定ピッチ長の範囲
が40〜167の範囲であれば、推定平均ピッチは72
〜136の範囲に抑えればよいことになる。これが、式
12のLimit[AvePitch]で推定平均ピッ
チを72〜136の範囲に制限した理由である。
【0097】通常、個人の音声に注目すると、ピッチ周
波数の範囲はあまり広くはないのでピッチ長のビット数
を低減することが可能であり、上述したように、過去の
分析フレームの音声信号に弱いピッチ構造しかない場合
にもピッチ長が差分形式で符号化される音声ピッチ予測
装置では、ピッチ長に対するビット数の配分を少なくす
ることができるので、効率よく情報を圧縮することがで
きる。
【0098】
【発明の効果】本発明の音声ピッチ予測装置によれば、
第1メモリ、第1ピッチ予測手段、ピッチ強度判定手
段、第2メモリ、第2ピッチ予測手段、符号化手段を備
える音声ピッチ予測装置であって、第1メモリは、第2
メモリが記憶するより前のフレームの分析信号を記憶
し、第1ピッチ予測手段は、第1メモリの分析信号に対
しピッチ予測を行い、第1ピッチ長、自己相関係数を出
力し、ピッチ強度判定手段は、第1ピッチ予測手段の自
己相関係数が所定の判定閾値より大きいか小さいかを比
較して比較結果を出力し、第2メモリは、現在のフレー
ムの分析信号を記憶し、第2ピッチ予測手段は、比較結
果が小さい場合には、第2メモリの分析信号に対しピッ
チ予測を行い、第2ピッチ長、予測係数を出力し、比較
結果が大きい場合には、第1ピッチ長に基づいてピッチ
長の探索範囲を所定の範囲に制限した上で、第2メモリ
の分析信号に対しピッチ予測を行い、第1ピッチ長に対
する差分、予測係数を出力し、符号化手段は、比較結果
が小さい場合には、第2ピッチ長と予測係数を第1のビ
ット割合で符号化し、比較結果が大きい場合には、第1
ピッチ長に対する差分と予測係数を第2のビット割合で
符号化するように構成されているので、ピッチパラメー
タを効率よく情報圧縮して伝達情報量を低減でき、分析
区間の長さを長くすることがないので、音声を高品質で
圧縮できる。
【図面の簡単な説明】
【図1】本発明による音声ピッチ予測装置の第1実施例
の構成を示すブロック図である。
【図2】本発明による音声ピッチ予測装置の第2実施例
の構成を示すブロック図である。
【図3】本発明による音声ピッチ予測装置の第3実施例
の構成を示すブロック図である。
【図4】従来のCELP符号化器の一例を示すブロック
図である。
【符号の説明】
101、106 入力端子 102、107 メモリ 103、108、208、211、305、308 ピ
ッチ予測器 104 ピッチ強度判定器 105、205 スイッチ 109、209、309 適応ビット配分符号化器 110 出力端子
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 9/14 G10L 9/08 G10L 9/00

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1メモリ(102)、第1ピッチ予測
    手段(103)、ピッチ強度判定手段(104)、第2
    メモリ(107)、第2ピッチ予測手段(108)、符
    号化手段(109)を備える音声ピッチ予測装置であっ
    て、 第1メモリ(102)は、第2メモリ(107)が記憶
    するより前のフレームの分析信号を記憶し、 第1ピッチ予測手段(103)は、第1メモリ(10
    2)の分析信号に対しピッチ予測を行い、第1ピッチ
    長、自己相関係数を出力し、 ピッチ強度判定手段(104)は、第1ピッチ予測手段
    (103)の自己相関係数が所定の判定閾値より大きい
    か小さいかを比較して比較結果を出力し、 第2メモリ(107)は、現在のフレームの分析信号を
    記憶し、 第2ピッチ予測手段(108)は、比較結果が小さい場
    合には、第2メモリ(107)の分析信号に対しピッチ
    予測を行い、第2ピッチ長、予測係数を出力し、比較結
    果が大きい場合には、第1ピッチ長に基づいてピッチ長
    の探索範囲を所定の範囲に制限した上で、第2メモリの
    分析信号に対しピッチ予測を行い、第1ピッチ長に対す
    る差分、予測係数を出力し、 符号化手段(109)は、比較結果が小さい場合には、
    第2ピッチ長と予測係数を第1のビット割合で符号化
    し、比較結果が大きい場合には、第1ピッチ長に対する
    差分と予測係数を第2のビット割合で符号化する 音声ピ
    ッチ予測装置。
  2. 【請求項2】 第1メモリ(102)、第1ピッチ予測
    手段(103)、第3ピッチ予測手段(305)、ピッ
    チ強度判定手段(104)、第2メモリ(107)、第
    2ピッチ予測手段(308)、符号化手段(309)を
    備える音声ピッチ予測装置であって、 第1メモリ(102)は、第2メモリ(107)が記憶
    するより前のフレームの分析信号を記憶し、 第1ピッチ予測手段(103)は、第1メモリ(10
    2)の分析信号に対しピッチ予測を行い、第1ピッチ
    長、自己相関係数を出力し、 第3ピッチ予測手段(305)は、第1ピッチ長に基づ
    いて推定平均ピッチ長 を求め、 ピッチ強度判定手段(104)は、第1ピッチ予測手段
    (103)の自己相関係数が所定の判定閾値より大きい
    か小さいかを比較して比較結果を出力し、 第2メモリ(107)は、現在のフレームの分析信号を
    記憶し、 第2ピッチ予測手段(308)は、比較結果が小さい場
    合には、推定平均ピッチ長を用いて、差分形式から第2
    メモリの分析信号に対しピッチ予測を行い、第2ピッチ
    長、予測係数を出力し、比較結果が大きい場合には、第
    1ピッチ長に基づいてピッチ長の探索範囲を所定の範囲
    に制限した上で、第2メモリの分析信号に対しピッチ予
    測を行い、第1ピッチ長に対する差分、予測係数を出力
    し、 符号化手段(309)は、比較結果が小さい場合には、
    第2ピッチ長と予測係数を第1のビット割合で符号化
    し、比較結果が大きい場合には、第1ピッチ長に対する
    差分と予測係数を第2のビット割合で符号化する 音声ピ
    ッチ予測装置。
  3. 【請求項3】 第1メモリ(102)、第1ピッチ予測
    手段(103)、ピッチ強度判定手段(104)、第2
    メモリ(107)、第1ピッチ予測部(211)、第2
    ピッチ予測部(208)、符号化手段(109)を備え
    る音声ピッチ予測装置であって、 第1メモリ(102)は、第2メモリ(107)が記憶
    するより前のフレームの分析信号を記憶し、 第1ピッチ予測手段(103)は、第1メモリ(10
    2)の分析信号に対しピッチ予測を行い、第1ピッチ
    長、自己相関係数を出力し、 ピッチ強度判定手段(104)は、第1ピッチ予測手段
    (103)の自己相関係数が所定の判定閾値より大きい
    か小さいかを比較して比較結果を出力し、 第2メモリ(107)は、現在のフレームの分析信号を
    記憶し、 第1ピッチ予測部(211)は、比較結果が小さい場合
    に、第2メモリ(107)の分析信号に対しピッチ予測
    を行い、第2ピッチ長、予測係数を出力し、 第2ピッチ予測部(208)は、第1ピッチ予測部(2
    11)よりタップ数が多く、比較結果が大きい場合に、
    第1ピッチ長に基づいてピッチ長の探索範囲を所定の範
    囲に制限した上で、第2メモリの分析信号に対しピッチ
    予測を行い、第 1ピッチ長に対する差分、予測係数を出
    力し、 符号化手段(109)は、比較結果が小さい場合には、
    第2ピッチ長と予測係数を第1のビット割合で符号化
    し、比較結果が大きい場合には、第1ピッチ長に対する
    差分と予測係数を第2のビット割合で符号化する 音声ピ
    ッチ予測装置。
JP3282691A 1991-02-27 1991-02-27 音声ピッチ予測装置 Expired - Fee Related JP2870608B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3282691A JP2870608B2 (ja) 1991-02-27 1991-02-27 音声ピッチ予測装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3282691A JP2870608B2 (ja) 1991-02-27 1991-02-27 音声ピッチ予測装置

Publications (2)

Publication Number Publication Date
JPH04271399A JPH04271399A (ja) 1992-09-28
JP2870608B2 true JP2870608B2 (ja) 1999-03-17

Family

ID=12369635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3282691A Expired - Fee Related JP2870608B2 (ja) 1991-02-27 1991-02-27 音声ピッチ予測装置

Country Status (1)

Country Link
JP (1) JP2870608B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2800599B2 (ja) * 1992-10-15 1998-09-21 日本電気株式会社 基本周期符号化装置
US20100185442A1 (en) * 2007-06-21 2010-07-22 Panasonic Corporation Adaptive sound source vector quantizing device and adaptive sound source vector quantizing method

Also Published As

Publication number Publication date
JPH04271399A (ja) 1992-09-28

Similar Documents

Publication Publication Date Title
US6704702B2 (en) Speech encoding method, apparatus and program
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
US8364473B2 (en) Method and apparatus for receiving an encoded speech signal based on codebooks
EP0788091A2 (en) Speech encoding and decoding method and apparatus therefor
EP1093115A2 (en) Predictive coding of pitch lag in a speech coder
JPH11143499A (ja) 切替え型予測量子化の改良された方法
JPH08263099A (ja) 符号化装置
US20060074643A1 (en) Apparatus and method of encoding/decoding voice for selecting quantization/dequantization using characteristics of synthesized voice
KR20010022187A (ko) 개선된 음성 인코더를 구비한 전송 시스템
US5659659A (en) Speech compressor using trellis encoding and linear prediction
EP2187390B1 (en) Speech signal decoding
EP0922278B1 (en) Variable bitrate speech transmission system
EP1073039B1 (en) Speech signal decoding
JP3557255B2 (ja) Lspパラメータ復号化装置及び復号化方法
EP1837997A1 (en) Long-term prediction encoding method, long-term prediction decoding method, devices thereof, program thereof, and recording medium
US6470310B1 (en) Method and system for speech encoding involving analyzing search range for current period according to length of preceding pitch period
JP2870608B2 (ja) 音声ピッチ予測装置
JPH11143498A (ja) Lpc係数のベクトル量子化方法
JP3067676B2 (ja) Lspの予測符号化装置及び方法
EP0694907A2 (en) Speech coder
US7031913B1 (en) Method and apparatus for decoding speech signal
EP0723257B1 (en) Voice signal transmission system using spectral parameter and voice parameter encoding apparatus and decoding apparatus used for the voice signal transmission system
JPH08237136A (ja) 広帯域信号符号化装置
KR20000016318A (ko) 가변 비트레이트 음성 전송 시스템
JPH07239699A (ja) 音声符号化方法およびこの方法を用いた音声符号化装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees