JPH02139600A - 音声符号化復号化方式及びその装置 - Google Patents

音声符号化復号化方式及びその装置

Info

Publication number
JPH02139600A
JPH02139600A JP63264441A JP26444188A JPH02139600A JP H02139600 A JPH02139600 A JP H02139600A JP 63264441 A JP63264441 A JP 63264441A JP 26444188 A JP26444188 A JP 26444188A JP H02139600 A JPH02139600 A JP H02139600A
Authority
JP
Japan
Prior art keywords
pitch
signal
sound source
codebook
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63264441A
Other languages
English (en)
Other versions
JP3006790B2 (ja
Inventor
Eisuke Hanada
英輔 花田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63264441A priority Critical patent/JP3006790B2/ja
Publication of JPH02139600A publication Critical patent/JPH02139600A/ja
Application granted granted Critical
Publication of JP3006790B2 publication Critical patent/JP3006790B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号を低いビットレートで効率的に符号化
、復号化するための音声符号化復号化方式及びその装置
に関する。
(従来の技術) 音声信号を低いビットレート、例えば16Kb/S程度
以下で伝送する方式としては、マルチパルス符号化法な
どが知られている。これらは音源信号を複数個のパルス
の組合せ(マルチパルス)で表し、声道の特徴をデジタ
ルフィルタで表し、音源パルスの情報とフィルタの係数
を、一定時間区間(フレーム)毎に求めて伝送している
。この方法の詳細については、例えばアラセキ、オザワ
、オン、オチアイ氏による“マルチパルス・エクサイテ
ッドφスピーチコーダー・ベイスト・オン・マキシマム
・クロスコリレイシーン・サーチ・アルゴリズム′ (
アイ・イー・イー〇イー グローバル・テレコミユニケ
イジョン“83 講演番号23.3、文献1)  (A
rasekl、 0zava、 Ono andOch
iai、  ’Multi−pulse Excite
d 5peech CoderBased  on  
Maximum  Cross−correlatlo
n  SearchAlgorithll、(GLOB
ECOM 8L IEEE GlobalTeleco
amunleat4on、 23.3.1983))に
記載されている。この方法では、声道情報と音源信号を
分離してそれぞれ表現すること、および音源信号を表現
する手段として複数のパルス列の組合せ(マルチパルス
)を用いることにより、復号後に良好な音声信号を出力
する。ピッチの微細構造を表すピッチパラメータを用い
てピッチ予測を行なうことにより文献1の方式の音質を
改善するピッチ予測マルチパルス法については、特願昭
58−139022 (文献2)において説明されてい
るので、ここでは第3図を用いて簡単に説明する。
図中の入力端子800からはフレーム毎に分割された区
間の音声信号が入力される。スペクトルパラメータ計算
部810では前記音声信号のスペクトルパラメータを衆
知の方法で求める。ピッチパラメータ計算部820では
自己相関法等の衆知の方法でピッチの微細構造を表すピ
ッチパラメータを求める。これらの出力はそのまま伝送
される以外にピッチ予測音源パルス計算部に入力される
ピッチ予測音源パルス計算部830ではピッチを予測し
て音源信号を表すマルチパルス列を求め出力するが、こ
の方法については前記文献2に述べられているのでここ
では説明を省略する。
(発明が解決しようとする課題) しかしながら、前記文献1の従来法ではビットレートが
充分に高く音源パルスの数が充分なときは音質が良好で
あったが、ビットレートを下げて行くと音質が低下して
いた。特に、従来の方式においては、ピッチ周波数の高
い入力信号の場合、例えば女性の声を入力した場合には
、再生音声が劣化するという欠点があった。これはピッ
チ周波数が高い場合には、パルス計算のフレーム内に多
くのピッチ波形が含まれることになり、このピッチ波形
を良好に再生するためには、ピッチ周波数が低い話者の
場合と比べて、より多くの個数のマルチパルスを必要と
するという理由による。従ってこの理由から、音質を低
下させることなく伝送ビットレートを大幅に下げる、す
なわち1フレーム内のパルス数を大幅に減少させること
が困難であった。
一方、前記文献2の従来法では、ピッチ毎の相関に基づ
きピッチパラメータを用いてピッチ予測を行なっている
ものの、大振幅音源信号、小振幅音源信号を問わず、マ
ルチパルスとピッチ予測とを用いて音源信号を表してい
た。しかるに大振幅音源信号はピッチ毎の相関が高いと
考えられるが、小振幅音源信号では相関はそれほど高く
ないと考えられる。従って音質をさらに改善するために
は、音源信号を表すマルチパルス列の内、小振幅ノマル
チパルス列あるいは小振幅の音源信号の役割が重要であ
る。このことは特に子音性の音声信号に対して重要であ
る。従来の方法では音源信号を表現するマルチパルス列
として、振幅が大きいものから順に、設定した個数のみ
を求めて伝送していた。従って従来法では予め設定した
情報量の上限により、充分な個数の小振幅のパルスを求
めることができず、音源信号の近似度が充分でなく、再
生音声の品質の点で限界があった。また、このことはビ
ットレートが低いときに特に顕著であった。
本発明の目的は、比較的少ない演算量で、ビットレート
が高いところでも、下げていっても従来よりも良好な音
声を再生することが可能である音声符号化復号化方式お
よびその装置を提供することにある。
(課題を解決するための手段) 本発明の音声符号化復号化方式は、離散的な音声信号を
人力し、前記音声信号のピッチの微細構造を表すピッチ
パラメータと前記音声信号のスペクトルを表すスペクト
ルパラメータを求め、前記音声信号を予め定められた種
類に分類し、前記音声信号の音源信号を前記種類に応じ
てピッチ予測して求めたマルチパルス列とコードブック
があるいはピッチ予測して求めたマルチパルス列を用イ
て表し、コードブックを用いる場合には一旦信号を再生
して前記入力信号と比較することにより不必要な部分で
は前記水められたコードブックを用いないようにしてマ
ルチパルスの本数を増やし、これらを伝送し、前記音声
信号の種類に応じて前記コードブックと前記マルチパル
ス列と前記ピッチパラメータまたは前記マルチパルス列
と前記ピッチパラメータとを用いて前記音源信号を復元
し前記スペクトルパラメータを用いて前記音声信号を良
好に表す合成音声信号を出力する。
本発明の音声符号化装置は、入力した離散的な音声信号
系列からピッチの微細構造を表すピッチパラメータを求
めて符号化するピッチパラメータ計算回路と、短時間ス
ペクトル特性を表すスペクトルパラメータを求めて符号
化するスペクトルパラメータ計算回路と、前記音声信号
を予め定められた種類に分類し判別符号を出力する判別
回路と、前記ピッチパラメータと前記スペクトルパラメ
ータを用いて前記音声信号の音源信号を区間に応じてピ
ッチ予測して求めたマルチパルス列と複数個のコードブ
ックから一種類を選択したコードブックで表す音源信号
計算回路と、前記コードブックを用いた場合に一旦信号
を再生して前記入力信号と比較し不必要な部分での前記
コードブックを用いることをやめマルチパルスの本数を
増やしコードブックを用いるかどうかの符号及びコード
ブックを用いる場合には選択されたコードブックのイン
デクスとゲインを出力する音源判別回路と、前記ピッチ
パラメータと前記スペクトルパラメータと前記判別符号
と前記マルチパルス列と前記音源判別回路の出力符号を
組み合わせて出力するマルチプレクサ回路とを有する。
本発明の音声復号化装置は、上記音声符号化装置の出力
信号を伝送路を介して受け、前記音声信号を復元する音
声復号化装置であって、音源信号を表す音源マルチパル
ス列を表す符号と音声信号のピッチの微細構造を表すピ
ッチパラメータを表す符号と前記音声信号の短時間スペ
クトル特性を表すスペクトルパラメータを表す符号と音
源信号を表す符号と判別符号と音源判別回路の出力符号
を入力して分離し復号化するデマルチプレクサ回路と、
前記復号化された音源信号のうち音源判別回路の出力符
号に応じてマルチパルス列を復元し前記復号化されたピ
ッチパラメータを用いてピッチを再生した音源信号を求
めるピッチ再生回路と、判別符号と音源判別回路の出力
符号に応じて複数種類のコードブックから一種類を選択
するかまたはマルチパルスを用いて前記ピッチ再生回路
の出力を用いて駆動音源信号を復元する音源信号復元回
路と、前記復元された駆動音源信号または前記再生され
た音源信号と前記復号されたスペクトルパラメータを用
いて音声信号を合成するスペクトル包絡フィルタ回路と
を有する。
(作用) 本発明は、前記文献2のピッチ予測マルチパルス符号化
法において、少ない伝送情報量で、音源信号を従来方法
よりも効率的に表現するために、フレーム毎の音声信号
を予め定められた種類、例えば母音部分、子音部分ある
いは有声部分、無声部分に分類し、前記音声信号を表す
ための音源信号を、母音あるいは有声部分ではピッチ予
測マルチパルス法で、子音あるいは無声部分ではピッチ
予測マルチパルス法とコードブックとで表し、さらにコ
ードブックを用いる場合には、フレームより短いサブフ
レーム毎にコードブックにより一旦信号を再生して入力
信号と比較することにより、コードブックの使用による
特性の効果を判別し、特性の改善度が高い場合には、そ
のサブフレームでコードブックの使用を行なう。一方、
改善度が低い場合はそのサブフレームでのコードブック
の使用をやめてピッチ予測マルチパルスのみを用いピッ
チ予測マルチパルスの本数を増やすようにすることを特
徴としている。
ここで母音、子音部分の判別には、衆知の方法、例えば
フレームのパワー、現フレームと前フレームとのパワー
の差、現フレームと前フレームとのスペクトルの変化、
ピッチ性などのパラメータを用いることができる。一方
、有声、無声部分の判別には、ピッチ性等のパラメータ
を用いることができる。
また、選択したコードブックによる特性の効果の判別に
は、例えば、コードブックを用いて合成フィルタを駆動
して再生した再生信号のパワーあるいはRMSと入力信
号のパワーあるいはRMSとの比や、後述の方法により
コードブックのゲインの大きさを判別するなどの方法を
用いることができる。
本発明の作用を第2図を用いて説明する。図中の入力端
子300からはフレーム毎に分割された区間の音声信号
x (n)が入力される。スペクトルパラメータ計算部
310は現フレームの音声信号からスペクトルパラメー
タを計算する。ピッチパラメータ計算部320はピッチ
の微細構造を表すピッチパラメータを計算する。有声/
無声判別部305はピッチゲインを用いて現フレームが
有声であるか無声であるかを判別し、有声/無声判別符
号を出力する。ピッチ予測音源パルス計算部330では
前記判別符号に応じてピッチ予測を用いて予め定められ
た本数だけ音源パルスを求める。
ピッチ予測を用いてマルチパルスを求める方法は前記文
献2を参照できる。スイッチ340は現フレームが有声
区間(または母音区間)である場合は共に下側に接続さ
れ、マルチパルスを出力する。
現フレームが無声区間(あるいは子音区間)である場合
には、スイッチ340はまず共に上側に接続され、求め
られたマルチパルスは信号再生部350へ入力される。
信号再生部350では入力された音源パルス列、ピッチ
パラメータ、スペクトルパラメータを用いてピッチ再生
フィルタ、合成フィルタを駆動して合成音声信号x (
n)を再生する。減算器360では前記入力信号x (
n)から合成音声波形x (n)を減する。そしてこの
残差信号e (n)はコードブック選択部370へ入力
される。コードブック選択部370では、フレーム区間
をいくつかに分割した小区間(例えば5■sec、程度
)の各々について、音源信号の小振幅成分の特徴を表す
小振幅の音源信号を計算する。
ここで、この小振幅音源信号はほぼランダムな位相特性
を有し、はとんど雑音信号に近いと考えられる。このよ
うな信号を非常に効率よく符号化するためには、予め複
数個作成した小振幅音源信号のコードブック(符号帳)
を用意して符号化するベクトル量子化の手法を用いるこ
とができる。ベクトル量子化については、例えばアール
・エム・グレイ氏による“ベクトル・クオンタイゼイシ
ョン・フォー・スピーチψコーディング・アンド・リコ
グニション” (アメリカ音響学会誌 80゜Ql、1
986.文献3)  (R,M、 Gray。
“Vector quantization f’or
 5peech codIngand recognt
tton   (J、 Aeoust、 Soc、 A
merica。
vol、 80.5upl)1. t、 Ql、 19
86))に詳しいのでここでは説明を略す。
以下で、コードブック選択部370の動作を説明する。
減算器360で再生信号x (n)を元の音声波形x 
(n)から減じた結果生じる残差信号e (n)を、フ
レームよりも短い小区間に時間的に一様に分割し、コー
ドブック(符号帳)の中から1種類を入力として、ゲイ
ン回路を通してゲインを合わせた後、合成残差信号e 
(n)を合成する。
その後入力残差信号e (n)から合成残差信号e (
n)を減じ、この結果に重み付けを施して重み付は誤差
電力を得る。そして重み付は誤差電力を最小とするよう
にコードブックの中から最適なコードを選び、そのイン
デクスとゲインを出力する。
次に、小振幅音源信号をコードブックを用いて表現し、
コードブックを選択するための実際の方法について、以
下で式を用いて説明する。コードブックの選択方法とし
ては次式で定義される誤差電力Eを最小化するように計
算する。
E−Σ[le(n)−g−e(n)L*w(n)]2 
  (1)ここで、e (n)は第2図のコードブック
選択部370の入力残差信号であり、gはゲイン、e 
(n)は選択された一種類のコードと合成フィルタによ
って再生した残差信号である。w(n)は聴感を考えた
重み付はフィルタのインパルス応答を示す。(1)式を
gについて最小化すると(2)式の形となる。
ここで、 e、  (n)−e(n)本w(n)−n(n)本h(
n)ネv(n)      (3a)e 、 (n)−
e(n)*w(n)           、  (3
b )記号*は畳み込みを表す。(2)式の分母はew
  (n)の自己相関(厳密には共分散)、分子はe、
(n)とe、(n)の相互相関である。また(3a)式
のn (n)はレコードブック中の、選択された1種類
のコードが表す信号である。また、h (n)は合成フ
ィルタのインパルス応答を示す。
このとき誤差電力Eは次式のように書けるので、E−Σ
e、(n)2−g・Σe、(n)e、(n)n    
    n          (4)Eを最小化する
コードブックは、(4)式第2項を最大化、即ちIgl
を最大化するように選択すればよい。
コードブックを選択するための計算量をさらに大幅に削
減するための方法としては、次のような構成も考えられ
る。音源信号を表すマルチパルス列は相互相関を用いて
探索する。この求め方は前記文献1,2等に詳しいので
ここでは説明は省略するが、ピッチ予n1音源パルス計
算部330において、ピッチ予測マルチパルス列を求め
た後の修正相互相関関数Φ□°を用いることにより、前
述の方法より大幅に演算量を削減した上で、コードブッ
クを選択することが可能となる。以下に示す方法ではコ
ードブック選択の際に信号ev  (n)を再生しなく
てよいので、特性を前述の方法とほぼ同じに保ちながら
演算量を大幅に低減できる。以下に導出方法を説明する
。まず、Φ8゜ew  (n)は次のように書(ことが
できる。
Φ8.−Σew  (n)h、(n)     (5)
ev  (n)wrn (n)*hv  (n)   
 (6)(6)式を(2)式に代入し、(5)式を用い
ると、次の様に変形が可能である。
ここでΦxh’ はピッチ予測によりマルチパルス列を
求めた後の相互相関関数、R,、(0)は、スペクトル
包絡フィルタと重み付は回路の従属接続からなるフィル
タのインパルス応答の電力である。
R,、(0)はコードブックのうちある1種類のコード
を選択した場合の、前記コードにより表される信号n 
(n)の電力である。(7)式の分子はΦ□° と選択
されたコードにより表される信号n (n)との相互相
関関数である。前述の(2)式と同じように、コードブ
ックは(7)式のgを最大化するものを選べばよい。
なお、コードブックは、大振幅のピッチ予測マルチパル
ス列を予め定められた個数だけ求めた後の音源の残差信
号を用いて、予めトレーニングすることによって作成し
てもよいし、例えばガウス性の統計的性質を持つような
雑音信号を位相特性を種々に変化させて複数個作成しコ
ードブックに格納しておいてもよい。後者の方法につい
てはエム・アール・シュレーダー、ビー・ニス・アター
ル両氏による“コードエフサイテッド・リニア・プレデ
イクシ゛ヨン(CELP):ハイークオリティ・スピー
チ・アット・べりm−ロー・ビット・レイツゝ (アイ
番シーeニー・ニス・ニス・ピー講演論文集、第1巻、
講演番号25.1.l、 1985年文献4)  (M
、R,5hroeder and B、S、Atal 
:  Code−Exc1ted 1inear pr
edlction(CBLP)  : high−qu
allty 5peech at very  low
 bltrates。
Proc、  1.c、A、s、s、P、 vol、1
. paper No、25.1.1゜March、 
1985)を参照することができる。
次にスイッチ385は、コードブックを選択する際には
上側に接続されており、コードブック及びゲインを小振
幅音源再生器372へ出力する。
小振幅音源再生器372ではコードブック選択部370
において選択されたコード及びゲインを用いて小振幅音
源を再生する。
以下、判別部380について説明する。
前記コードブックを用いて再生した信号e (n)と減
算器360の出力信号e (n)が時間分割回路によっ
て小区間再生信号と同じ長さに時間的に分割され、分割
された単位でこれら2つの信号を比較し、現サブフレー
ムの音源信号を、コードブックを用いて表すことによる
特性の改善効果があるか判別する。判別の方法としては
、前述したように、例えばe (n)とe (n)との
パワーの比やRMSの比などを用いることができる。
判別の結果、現サブフレームにコードブックが必要と判
別されればその判別符号を出力し、コードブック選択部
370とピッチ予測音源パルス計算部330、スイッチ
340へ信号を出力する。
この信号により、スイッチ340は共に下側に接続され
、ピッチ予測音源パルス計算部330は求められた音源
パルス列を出力し、コードブック選択部370ではイン
デクスとゲインを出力する。
また現サブフレームにコードブックが不必要であると判
定された場合はその判別符号を出力し、コードブック選
択部370とピッチ予n1音源パルス計算部330、ス
イッチ340ヘフードブツクを用いない形に音源信号を
修正するよう信号を出力する。この信号により、スイッ
チ340は共に下側に接続され、ピッチ予測音源パルス
計算部330は定められた本数だけ音源パルス列を増や
して求めてそれまでに求められたマルチパルス列に加え
て出力し、コードブック選択部370では現サブフレー
ムに対するコードブックのインデクスとゲインは出力し
ない。
送信側の伝送情報は、有声/無声判別符号、ピッチパラ
メータ、スペクトルパラメータ、ピッチ予4P1シたマ
ルチパルスの振幅、位置、前記判別部の出力である判別
符号と、用いるコードブックのインデクス、ゲインであ
る。
(実施例) 次に実施例を挙げ本発明を一層詳しく説明する。
第1図は本発明の音声符号化装置および音声復号化装置
の一実例を示すブロック図であり、以下に本図を参照し
てこれら装置および本発明の音声符号化復号化方式の一
実施例を説明する。
第1図の装置において、入力端子500から離散的な音
声信号x (n)を入力する。時間分割回路510は入
力された音声信号を時間的に−様なフレーム毎(例えば
20m5ec、毎)に分割する。
ピッチパラメータ計算回路515はピッチ構造を表すピ
ッチパラメータを計算する。計算方法は前記文献2に示
されているような方法を用いる。量子化器516は前記
求められたピッチパラメータを量子化する。逆量子化器
518は、量子化した結果を用いて逆量子化して出力す
る。スペクトルパラメータ計算回路520では前記分割
した区間の音声信号のスペクトルを表すスペクトルパラ
メータを、衆知のLPG分析法によって求める。
求められたスペクトルパラメータに対しては、スペクト
ルパラメータ量子化器525において量子化を行う。量
子化の方法は、特願昭59−272435号(文献5)
に示されているようなスカラー量子化や、あるいは前記
文献4に示されたベクトル量子化を行ってもよい。逆量
子化器530は、量子化した結果を用いて逆量子化して
出力する。重み付は回路540は、逆量子化されたスペ
クトルパラメータを用いて前記分割された音声信号に重
み付けを行う。重み付けの方法は、前記文献5の重み付
は回路200を参照することができる。インパルス応答
計算回路550は、逆量子化されたピッチパラメータと
逆量子化されたスペクトルパラメータを用いてインパル
ス応答を計算する。具体的な方法は前記文献2を参照で
きる。自己相関関数計算回路560は前記インパルス応
答の自己相関関数を計算し音源パルス計算回路580へ
出力する。自己相関関数の計算法は前記文献2の自己相
関関数計算回路180を参照することができる。相互相
関関数計算回路570は前記重み付けられた信号と前記
インパルス応答との相互相関関数を計算して音源パルス
計算回路580へ出力する。具体的な方法は前記文献2
を参照できる。
判別回路575では、現フレームが例えば母音区間であ
るか子音区間であるかを判別し、その結果を示す判別符
号を音源パルス計算回路580へ出力する。判別には前
記作用の項で示した通り例えばスペクトルの変化、パワ
ー、パワーの変化といった衆知のパラメータを用いるこ
とができる。
音源パルス計算回路580では、判別回路575の出力
が母音を示す符号である場合には、マルチパルスをピッ
チ予測により、予め定められた個数(Ll個)だけ求め
る。マルチパルス列の計算方法については、前記文献2
の音源パルス計算回路210を参照することができる。
判別回路575の出力が母音を示す符号である場合には
小振幅音源信号を計算することはせず、ここで音源信号
に関する計算を終了する。従って、この場合には量子化
器585、パルス発生器600、ピッチ再生フィルタ6
05、合成フィルタ610、減算器615、小振幅音源
計算回路620は作動しない。
量子化器585は音源マルチパルス列を量子化して符号
を出力する。この出力は逆量子化器590によって逆量
子化され、パルス発生器600によってマルチパルスを
発生する。ピッチ再生フィルタ605では前記再生され
たマルチパルスと前記逆量子化器518によって逆量子
化されたピッチパラメータを入力としピッチを再生した
音源信号を出力する。前記音源信号と前記逆量子化器5
30から出力されたスペクトルパラメータを合成フィル
タ610に通すことによって、前記音源パルスによる合
成音声信号x (n)が求まる。
判別回路575の出力が子音を示す場合には、前述の構
成によりL2個(L2<Ll)のピッチ予測したマルチ
パルス列を求め合成信号x (n)を求める。
さらに減算器615は、前記音声信号x (n)から合
成音声信号x (n)を減することによって、残差信号
e (n)に対して小振幅音源信号を計算する。
小振幅音源計算回路620では、前記作用の項で動作を
説明したように、フレームよりも短い区間に分割された
小区間(例えば5a+sec、)の小振幅音源信号を複
数個のコードブックを用いて表し、さらに小区間の合成
信号e’  (n)を再生して前記残差信号e (n)
と比較することによってコードブックが不必要であると
判定された場合にはコードブックを用いない形に小振幅
音源計算回路の出力を修正し、音源パルス計算回路58
0を用いてマルチパルスを予め定めた本数だけ増やす。
現フレームが母音区間であるか子音区間であるかを示す
符号、小振幅音源信号を表す判定符号とコードブックの
インデクスとゲイン、量子化器585の出力であるマル
チパルス列を量子化した符号、量子化器516の出力で
あるピッチパラメータを量子化した符号、さらに量子化
器525の出力であるスペクトルパラメータを量子化し
た符号は、それぞれマルチプレクサ630の入力となる
。ただし、現フレームが母音区間である場合には小振幅
音源信号を表すコードブックのインデクスとゲインまた
は小区間のマルチパルスの振幅と位置は入力とはならな
い。マルチプレクサ630は以上の各符号を組み合わせ
て出力する。
一方、受信側では、デマルチプレクサ710は、マルチ
パルス列の符号、ピッチパラメータの符号、スペクトル
パラメータの符号、現フレームが母音区間であるか子音
区間であるかを示す判別符号、現フレームが子音区間で
ある場合には判定符号と小振幅音源信号を表すインデク
ス及びゲインの符号を分離して出力する。音源パルス復
号器720はマルチパルスの振幅、位置を復号する。ス
ペクトルパラメータ復号器750は、送信側の逆量子化
器530と同じ働きをする。小振幅音源復号器730は
、送信側の小振幅音源計算回路620と同一のコードブ
ックを有しており、現フレームが子音区間であることを
示す符号を受信した場合には、判定符号に応じて、コー
ドブックを用いる部分では受信したインデクスを用いて
小振幅音源信号を表すコードを選択して出力する。ゲイ
ン回路735は、現フレームが子音区間であることを示
す符号を受信した場合に、判定符号に応じて受信したゲ
インの符号を用いて小振幅音源信号の振幅を決定する。
ピッチパラメータ復号器745は送信側の逆量子化器5
18と同じ働きをする。パルス発生器725は判別符号
と判定符号に応じて前記マルチパルス列による音源信号
を発生させる。
ピッチ再生フィルタ755は前記水められた音源信号と
前記復号されたピッチパラメータを人力としてピッチを
再生した合成音源信号を再生する。
加算器740は前記ピッチを再生した音源信号と、現フ
レームが子音区間であることを示す符号を受信した場合
にはゲイン回路735の出力信号を加算して、駆動音源
信号を求め、スペクトル包絡フィルタ回路760を駆動
する。合成フィルタ回路760では前記駆動音源信号及
び前記復号されたスペクトルパラメータを用いて合成音
声波形を求めて出力する。
以上述べた構成は本発明の一構成に過ぎず、種々の変形
も可能である。
あるサブフレーム区間で小振幅音源信号が不要であると
判断された場合、音源パルス計算回路580でパルスを
予め定められた本数だけ増やして求めるが、パルスを求
めた後に、小振幅音源信号が必要なサブフレーム区間で
小振幅音源信号を求め直すようにすることもできる。
小振幅音源信号を求めるための計算量をさらに大幅に削
減するためには、作用の項の(5)式から(7)式で説
明したように、ピッチ予測による大振幅マルチパルスを
求めた後の相互相関関数Φxh” を用いてコードブッ
クを選択するような構成とすることが可能である。この
ようにすると、前記作用の項でも述べた通り、コードブ
ック選択の際に信号e、(n)を再生しなくてよいので
、第1図に示した構成と比べて演算量を大幅に低減でき
る。
また、子音部分に対しては、子音の性質(例えば破裂性
、摩擦性等)に応じて異なるコードブックを予め作成し
ておき、これらを切り替えて使用してもよい。
また、マルチパルスの計算方法としては、前記文献1に
示した方法の他に、種々の衆知な方法を用いることがで
きる。
また、スペクトルパラメータとしては、他の衆知なパラ
メータ(線スペクトル対、ケプストラム、メルケブスト
ラム、対数断面積比等)を用いることもできる。さらに
、スペクトルパラメータの量子化法としてはスカラー量
子化以外にもベクトル量子化等を用いることができる。
ベクトル量子化については、前記文献3を参照できる。
また、フレーム長は一定としたが、音声信号の性質に応
じて可変としてもよい。
(発明の効果) 本発明によれば、従来例に比べ、音源信号を予め定めら
れた種類(例えば母音部分、子音部分あるいは有声部分
、無声部分)に分類し、前記分類に応じて母音あるいは
を声部分では音源を比較的少ない個数のピッチ予Δ―1
マルチパルス列、子音あるいは無声部分においてはピッ
チ予測したマルチパルス列のみならず音質改善にさらに
効果のある小振幅の音源信号をコードブックとして用い
ることによって少ない伝送情報量で表すことができる。
さらにまた、コードブックによる特性の改善効果が低い
場合にはコードブックを用いずマルチパルスの本数を増
やすことによってさらに音質を改善できるという効果が
ある。従って、従来法とビットレートを同一としても、
母音部分のみならず子音区間においても従来法よりもよ
り良好な再生音声信号を得ることができるという大きな
効果がある。さらに、この効果はビットレートを下げて
いった場合により顕著となる。
【図面の簡単な説明】
第1図は本発明による音声符号化装置および音声復号化
装置の一実施例の構成を示すブロック図、第2図は本発
明の作用を示すブロック図、第3図はマルチパルス符号
化法の従来例を表すブロック図である。 500.300,800・・・入力端子、510・・・
時間分割回路、515・・・ピッチパラメータ計算回路
、320,820・・・ピッチパラメータ計算部、52
0・・・スペクトルパラメータ計算回路、310゜81
0・・・スペクトルパラメータ計算部、305・・・有
声/無声判別部、516,525,585・・・量子化
器、518,530,590・・・逆量子化器、540
・・・重み付は回路、550・・・インパルス応答計算
回路、560・・・自己相関関数計算回路、570・・
・相互相関関数計算回路、575・・・判別回路、58
0・・・音源パルス計算回路、600゜725・・・パ
ルス発生器、755,605・・・ピッチ再生フィルタ
、610,760・・・スペクトル包絡フィルタ、62
0・・・小振幅音源計算回路、630・・・マルチプレ
クサ、710・・・デマルチプレクサ、720・・・音
源パルス復号器、730・・・小振幅音源復号器、74
0,375・・・加算器、745・・・ピッチパラメー
タ復号器、750・・・スペクトルパラメータ復号器、
770・・・出力端子、810・・・音源計算部、61
5,360・・・減算器、370・・・コードブック選
択部、735・・・ゲイン回路、340゜385・・・
スイッチ、380・・・比較判別部、330゜830・
・・ピッチ予測音源パルス計算部、350・・・信号再
生部。

Claims (3)

    【特許請求の範囲】
  1. (1)離散的な音声信号を入力し、前記音声信号のピッ
    チ構造を表すピッチパラメータと前記音声信号のスペク
    トルを表すスペクトルパラメータとを求め、前記音声信
    号を予め定められた種類に分類し、前記種類に応じて前
    記音声信号の音源信号をピッチ予測により求めたマルチ
    パルス列か又はコードブックの使用により特性が改善さ
    れる場合はコードブックと前記マルチパルス列との両者
    を用いて表して伝送し、前記種類に応じて前記コードブ
    ックと前記マルチパルス列と前記ピッチパラメータとを
    用いて前記音源信号を復元し前記スペクトルパラメータ
    を用いて前記音声信号を表す合成音声信号を出力するこ
    とを特徴とする音声符号化復号化方式。
  2. (2)入力した離散的な音声信号系列からピッチ構造を
    表すピッチパラメータを求めて符号化するピッチパラメ
    ータ計算回路と、前記音声信号系列の短時間スペクトル
    特性を表すスペクトルパラメータを求めて符号化するス
    ペクトルパラメータ計算回路と、前記音声信号を予め定
    められた種類に分類する判別回路と、前記判別回路の出
    力に応じて前記ピッチパラメータと前記スペクトルパラ
    メータを用いて前記音声信号の音源信号をこの音源信号
    のピッチ予測により求めたマルチパルス列とコードブッ
    クとの両者か又は前記マルチパルス列を用いて表して符
    号化する音源信号計算回路と、前記コードブックによる
    特性改善効果を判別して前記コードブックを使用するか
    否かを決定する判定回路と、前記ピッチパラメータを表
    す符号と前記スペクトルパラメータを表す符号と前記マ
    ルチパルス列を表す符号と前記コードブックのインデク
    ス及びゲインと前記判定回路の出力と前記判別回路の出
    力とを組み合わせて出力するマルチプレクサ回路とを有
    することを特徴とする音声符号化装置。
  3. (3)請求項2記載の音声符号化装置の出力信号を伝送
    路を介して受け、前記音声信号を復元する音声復号化装
    置において、音源信号を表す符号と前記音声信号のピッ
    チ構造を表すピッチパラメータを表す符号と前記音声信
    号の短時間スペクトル特性を表すスペクトルパラメータ
    を表す符号と前記判別回路の出力符号と前記判定回路の
    出力符号とを入力して分離し復号化するデマルチプレク
    サ回路と、前記判別符号と前記判定符号とに応じて前記
    復号化された音源信号のうちマルチパルス列を復元し前
    記復号化されたピッチパラメータを用いてピッチを再生
    した音源信号を求めるピッチ再生回路と、前記判別符号
    及び前記判定符号を用いてコードブックの使用を決定し
    前記コードブックから一種類を選択し前記ピッチ再生回
    路の出力を用いて駆動音源信号を復元する音源信号復元
    回路と、前記復元された駆動音源信号と前記復号された
    スペクトルパラメータとを用いて前記音声信号を合成す
    る合成フィルタ回路とを有することを特徴とする音声復
    号化装置。
JP63264441A 1988-10-20 1988-10-20 音声符号化復号化方法及びその装置 Expired - Fee Related JP3006790B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63264441A JP3006790B2 (ja) 1988-10-20 1988-10-20 音声符号化復号化方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63264441A JP3006790B2 (ja) 1988-10-20 1988-10-20 音声符号化復号化方法及びその装置

Publications (2)

Publication Number Publication Date
JPH02139600A true JPH02139600A (ja) 1990-05-29
JP3006790B2 JP3006790B2 (ja) 2000-02-07

Family

ID=17403238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63264441A Expired - Fee Related JP3006790B2 (ja) 1988-10-20 1988-10-20 音声符号化復号化方法及びその装置

Country Status (1)

Country Link
JP (1) JP3006790B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194499A (ja) * 1995-01-17 1996-07-30 Nec Corp 音声符号化装置
JP2008170505A (ja) * 2007-01-09 2008-07-24 Yamaha Corp 音声処理装置およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6238500A (ja) * 1985-08-13 1987-02-19 日本電気株式会社 高能率音声符号化方式とその装置
JPS6337724A (ja) * 1986-07-31 1988-02-18 Fujitsu Ltd 符号化伝送装置
JPS63127299A (ja) * 1986-11-17 1988-05-31 日本電気株式会社 音声信号符号化・復号化方式およびその装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6238500A (ja) * 1985-08-13 1987-02-19 日本電気株式会社 高能率音声符号化方式とその装置
JPS6337724A (ja) * 1986-07-31 1988-02-18 Fujitsu Ltd 符号化伝送装置
JPS63127299A (ja) * 1986-11-17 1988-05-31 日本電気株式会社 音声信号符号化・復号化方式およびその装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194499A (ja) * 1995-01-17 1996-07-30 Nec Corp 音声符号化装置
JP2008170505A (ja) * 2007-01-09 2008-07-24 Yamaha Corp 音声処理装置およびプログラム

Also Published As

Publication number Publication date
JP3006790B2 (ja) 2000-02-07

Similar Documents

Publication Publication Date Title
JP4843124B2 (ja) 音声信号を符号化及び復号化するためのコーデック及び方法
JP3094908B2 (ja) 音声符号化装置
KR100566713B1 (ko) 음향 파라미터 부호화, 복호화 방법, 장치 및 프로그램, 음성 부호화, 복호화 방법, 장치 및 프로그램
JPH02249000A (ja) 音声符号化方式
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
EP1597721A2 (en) 600 bps mixed excitation linear prediction transcoding
JP3353852B2 (ja) 音声の符号化方法
JP3490324B2 (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2797348B2 (ja) 音声符号化・復号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3299099B2 (ja) 音声符号化装置
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JP3153075B2 (ja) 音声符号化装置
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3192051B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3092654B2 (ja) 信号符号化装置
JPH0284700A (ja) 音声符号化復号化装置
JPH02160300A (ja) 音声符号化方式
JPH01293400A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees