JPS58220199A - 帯域分割型ボコ−ダ - Google Patents

帯域分割型ボコ−ダ

Info

Publication number
JPS58220199A
JPS58220199A JP57104475A JP10447582A JPS58220199A JP S58220199 A JPS58220199 A JP S58220199A JP 57104475 A JP57104475 A JP 57104475A JP 10447582 A JP10447582 A JP 10447582A JP S58220199 A JPS58220199 A JP S58220199A
Authority
JP
Japan
Prior art keywords
band
linear prediction
analysis
synthesis
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57104475A
Other languages
English (en)
Other versions
JPH0229237B2 (ja
Inventor
哲 田口
小林 雅徳
孝行 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP57104475A priority Critical patent/JPS58220199A/ja
Publication of JPS58220199A publication Critical patent/JPS58220199A/ja
Publication of JPH0229237B2 publication Critical patent/JPH0229237B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は線形予測分析手法を用いる帯域分割型ボコーダ
に関し、特に合成側において分割された各周波数帯域毎
の線形予測パラメータから全周波数帯域に互る線形予測
パラメータを抽出して音声を合成する帯域分割型ボコー
ダに関する。
従来の帯域分割型ボコーダの一例のブロック図を第1図
に示す。図にシいて音声分析側には低域フィルタ/A−
Dコンバータ (LPF/A−D)l1低域フイルター
1  (LPF−1)2、帯域フィルター2〜−3  
(BPF−2〜3)3−2〜3、周波数変換手段2〜3
 (FC−2〜3)4−2〜3、低域フィルター2〜3
  (LPI−2〜3)5−2〜3、デシメーション手
段−1〜3(DM−1〜3)6−1〜3、線形予測符号
化手段−l〜3 (LE−1〜3)7−1〜3、ピッチ
抽出手段(PITCH)8、有声・無声判別手段(V/
UV)9、符号化手段(CODER)10とを備え、音
声合成側において祉復号化手段(DECODER)1 
1、Kパラメータ/αパラメータ変換手段−1〜3(K
/α−1〜3)121〜3、音声励振信号乗算手段−1
〜3 (VM−1〜3)13−1〜3、音声合成フィル
ター1〜3(LPCF−1〜3)14−1〜3、インタ
ボーレーシ目ン手段−1〜3(IP−1〜3)15−1
〜3、周波数変換手段2〜3 (FC−2〜3)l6−
2〜3、低域フィルター1  (LPF−1)17、帯
域フィルター2〜3  (BPF−2〜3)18−2〜
3、ピッチパルス信号発生器(PG)19、雑音発生器
(NG)20、有声・無声切替スイッチ(V/UV−S
)21,波形信号加算手段(Σ)22、D−A変換器/
低域フィルタ(LPF/D−A)2 3とを備えている
この従来例は帯域分割数が3帯域の場合で、図に示され
るように1個の低域フィルター1(LPF−1)2と2
個の帯域フィルタ(B P F − 2〜3)3−2〜
3が用意されている。端子10lから入力された音声信
号は、低域フィルタ/A−Dコンバータ(LPF/A−
D)1を経由して標本抽出され量子化されて、低域フィ
ルター1 (LPF−1)2および帯域フィルター2〜
3  (BPF−2〜3)3−2〜3により3帯域に分
割される。この帯域分割の概念を第2図(a)について
説明する。図において横軸は音声の周波数、縦軸は音声
のスペクトル包絡を表示している。図に示されるスペク
トル包絡は一つ例の表示であるが、本従来例の3帯域分
割の場合には、境界周波数F2およびF3を設定して周
波数帯域をI,Iおよび■の3帯域に分割し、各帯域毎
に線形予測分析を行う。これらの帯域1,IIおよび■
の中、帯域■と帯域Iとに含まれる信号は帯域フィルタ
ー2〜3(BPF−2〜3)3−2〜3を通過、した後
、周波数変換手段2〜3 (FC−2〜3)4−2〜3
において前記境界周波数F2およびF3に対応する所定
の周波数f2およびf3とそれぞれ混合されて低周波領
域に周波数シフトされる。低域フィルター1  (LP
F−1)2を通過した帯域Iの信号と、周波数シフトさ
れて低域フィルター2〜3(LPF−2〜3)5−2〜
3を通過した帯域『およびIの信“号は、それぞれ対応
するデシメーション手段−1〜3 (DM−1〜3)6
−1〜3において、現標本抽出レートよシも低いレート
で再標本抽出され線形予測符号化手段−1〜3(LE−
1〜3)7−1〜3に出力される。デシメーション手段
の作用は、既に標本抽出されている入力信号に対して、
その標本抽出レートよりも低いレートでその入力信号を
再標本抽出する作用として定義づけすることができる。
このようにより低いレートで再標本抽出された3帯域の
信号は、それぞれ線形予測符号化手段=1〜3(LE−
1〜3)7−1〜3においてウィンドー処理された後通
常行われている線形予測分析によシ線形予測パラメータ
を抽出するとともに、本従来例においては残差電力をも
抽出する。
これらの各帯域毎に得られる線形予測パラメータ(本例
においてはにパラメータ)と残差電力は符号化手段(C
ODER)10により符号化され合成側に送出される。
一方音源情報については、前記標本抽出され量子化され
た入力音声信号よりピッチ抽出手段(PITCH)8に
より抽出されるピッチ信号と、有声・無声判別手段(V
/UV)9によシ識別される有声・無声判別信号とが符
号化手段10により符号化されて合成側に送られる。
合成側においては、各帯域毎に分析側よシ送られてくる
I(パラメータと残差電力とは復合化手段11により復
号されて、それぞれ各帯域のにパラメータ/αパラメー
タ変換手段−1〜3(K/α−1〜3)手(2)−寸コ
4寺12−1〜3と音声励振信号乗算手段−1〜3(V
M−1〜3)13−1〜3に入力される。各にパラメー
タ/αパラメータ変換手段において変換されたαパラメ
ータは、それぞれ対応する音声合成フィルター1〜3(
LPCF−1〜3)14−1〜3に出力される。二方音
源情報として分析側より送られてくるピッチ信号はパル
ス信号発生器(PG)19に入力され、ピッチ周期と同
一周期のパルス列信号を発生し、同じく音源情報として
送られてくる有声・無声判別信号により制御される有声
・無声切替スイッチ(V/UV−8)21を経由して、
有声音に対応する音源信号として各帯域毎の音声励振信
号乗算手段−1〜3(VM−1〜3)13−1〜3に入
力される。また、雑音発生器(NG)20の雑音出力は
有声・無声切替スイッチ(V/UV−8)21を経由し
て、−声音に対応する音源信号として各帯域毎の音声励
振信号乗算手段−1〜3(VM−1〜3)13−1〜3
に入力される。これらの有声音および無声音に対応する
1混信号は、音声励振信号乗算手段−1〜3(VM−1
〜3)13−1〜3において前記各帯域毎の残差電力と
それぞれ乗算され、各帯域に対応する音声合成フィルタ
ー1〜3  (LPCF−1〜3)14−1〜3に出力
される。各音声合成フィルター1〜3(LPCF−1〜
3)14−1〜3はにパラメータ/αパラメータ変換手
段−1〜3(K/α−1〜3)12−1〜3よりへカさ
れる各帯域毎のαパラメータによりその係数を制御され
、前記音声励振信号を入力して、それぞれ対応する各帯
域のディジタル合成波形信号を出力する。これらの波形
信号はインタポーレージロン手段−1〜3(IP−1〜
3)15−1〜3において、現標本抽出レートよりも高
いレートで再標本抽出される。
インタボーレージロン手段の作用は、既に標本抽出され
ている入力信号に対して、その標本抽出レートよりも高
いレートでその入力信号を再標本抽出する1作用として
定義づけされる。このようによシ高いレートで再標本抽
出された各帯域の信号は、帯域■の信号は直接低域フィ
ルター1(LPF−1)17’−1に送出されるが、帯
域■および厘の“信号は周波数章換手段−2〜3 (F
C−2〜3)16−2〜3において、前記境界周波数F
2およびF3に対応する所定の周波数f2′およびf3
′とそれぞれ混合されて原周波数領域に周波数シフトさ
れて、それぞれ帯域フィルター2〜3 (BPF−2〜
3)18−2〜3に送出される。低域フィルター1  
(LPF−1)17、帯域フィルター2〜3(BPF−
2〜3)18−2〜3より出力される各帯域の波形信号
は、波形信号加算手段(Σ)22によシ重畳加算されD
−A変換器/低域フィルタ(LPF/D−A)23を経
由して合成音声信号として端子102よシ出力される。
以上の作用軽過における元の入力音声信号のスペクトル
包絡と、合成側よシ出力される合成音声信号のスペクト
ル包絡との対応関係を2本従来例の3帯域分割の場合の
一例について図示すると第2図のように示される。即ち
、第2図(b)において帯域■と■との境界周波数F2
および帯域■と■との境界周波数F3において、合成音
声信号のスペクトル包絡に関して歴然とした不連続性を
生じる。
本来帯域分割型ボコーダの目的は、線形予測分析手法の
欠点である7オルマント帯域幅の過少推定と、高次7オ
ルマントにおける近似性の悪さの2点を改善して分析精
度を向上するところにあるが、その改善のために、派生
的に前述の境界周波数における不連続性が合成音声のス
ペクトル包絡の上に現われるということは、分析精度の
向上という意味においてはマイナス要因であり要対策事
項として評価される。即ち従来の帯域分割型ボコーダに
おいては、合成音声のスペクトル包絡に関し、帯域分割
の境界周波数においで不連続性を生じ、分析精度の向上
に対しマイナス要因として作用するという欠点がある。
本発明の目的は上記の欠点を除去し、合成側において全
周波数帯域に互る線形予測分析手段を備え、前記境界周
波数におけるスペクトル包絡の不連続性を除去して分析
精度を改善する帯域分割型ボコーダを提供することにあ
る。
本発明の帯域分割型ボコーダは、線形予測分析手法を用
いる帯域分割型ボコーダにおいて、分析側から合成側に
伝送される分割された各周波数帯域毎の線形予測パラメ
ータより全周波数帯域に互る線形予測パラメータを抽出
して全周波数帯域に対応する音声合成フィルタを制御す
る第1の線形予測分析手段を合成側に備えて構成される
以下本発明について図面を参照して詳細に説明する。
第3図は本発明の帯域分割型ボコーダの合成側を示す概
念的ブロック図である。伝送線路601を経由して合成
側に伝送されてきた各帯域毎の線形予測パラメータと関
連電力情報信号は、復号化手段501により復号されて
それぞれ線路602−1〜Nおよび線路603−1〜N
を介して第1の線形予測分析手段502に入力される。
図に示される帯域分割型ボコーダにおいては一般的に取
扱い帯域分割数がN (Nは1より大きい正の整数)の
場合について図示している。第1の線形予測分析手段5
02は、N組の各帯域に対応する線形子側パラメータか
ら全帯域に対応する線形予測パラメータを抽出して線路
604を介して全帯域音声合成フィルタ504の係数を
制御するとともに、所定の全帯域に対応する関連電力情
報を抽出して線路605を介して音声励振信号発生手段
503に出力する。一方復号化手段501において復号
される音源情報信号は音声励振信号発生手段503に入
力され、第1の線形予測分析手段502よ少入力される
前記電力情報との乗算作用により音声励振信号を発生し
て全帯域音声合成フィルタ504に供給する。全帯域音
声合成フィルタ504は前記全帯域に対応する線形予測
パラメータと前記音声励振信号を入力して音声を合成し
て出力する。
第1図に示される従来例においては、各帯域毎にそれぞ
れ個別に分析合成した信号を波形信号の形で加算してい
るため帯域分割の境界周波数においてスペクトル包絡に
おける不連続性を生じるが、第3図に示される本発明に
おいては、合成側において全帯域に互る線形予測分析手
段を備え全帯域に対応する線形予測パラメータを用いて
音声を合成するため、前記従来例の欠点は十分に除去さ
れる。
第4図は本発明の帯域分割型ボコーダの第1の実施例を
示すブロック図である。本実施例においては、その分析
側は、第1図に示される前記従来例の分析側と、その構
成と作用と共に同等であり、また合成側は、前記従来例
の合成側に線形予測符号化手段(LE)46と、全帯域
に対応する音声合成フィルタ(LPCF)48を付加す
る形で構成されている。即ち本発明の主要要件である合
成側における第1の線形予測分析手段201は、第  
  lの実施例においては各帯域毎のにパラメータ/α
パラメータ変換手段−1〜3(K/α−1〜3)35−
1〜3、音声励振信号乗算手段−1〜3(VM−1〜3
)36−1〜3、音声合成フィルター1〜3 (LPC
F−1〜3)37−1〜3、インタポーレージ冒ン手段
−1〜3(IP−1〜3)38−1〜3、周波数変換手
段−2〜3(、FC−2〜3)39−2〜3、低域フィ
ルター1  (LPF−1)40、帯域フィルター2〜
3(BPF−2〜3)41〜2〜3と、波形加譜手段(
Σ)45と、線形予測符号化手段(L E)46とを備
えて構成されている。
各帯域毎に分栢側より送られてくるにパラメータよりα
パラメータを求め、各帯域毎の音声合成フィルタによっ
て合成信号を出力して波形信号加算手段45において時
間軸次元においで重畳加算される迄の作用経過について
は前記従来例の場合と同等である。波形信号加算手段(
Σ)45において加算された波形信号は、線形予測符号
化手段(I、E)46においてウィンドー処理された後
通常行われている線形予測分析によシ全帯域に互る線形
予測パラメータが抽出され、また電力情報として残差電
力が出力される。即ち第1の線形予測分析手段201の
作用は、各帯域毎の線形予測パラメータよシ全帯域に対
応する線形予測パラメータと関連電力情報を抽出するこ
とにある。線形予測符号化手段(LE)46より出力さ
れた全帯域に対応する線形予測パラメータは全帯域に対
応する音声合成フィルタ48に入力されてその係数を制
御する。一方音源情報として分析側より送られ′てくる
ピッチ信号および有声・無声判別信号により音声励振信
号が音声励振信号乗算手段(VM)42において生成さ
れる作用過程については、前記従来例における各帯域で
の作用過程と同等で、パルス信号発生器(PG)42よ
り出力される有声音に対応する音源信号と、雑音発生器
(NG)44よ多出力される無声音に対応する音源信号
とは、有声・無声切替スイッチ(V/UV−8)43に
おいて前記有声・無声判別信号によシ切替制御されて音
声励振信号乗算手段(VM)47に入力される。線形予
測符号化手段(LE)46からは、本実施例においては
前記線形予測パラメータとともに電力情報として残差電
力を抽出し音声励振信前記残差電力との乗算作用により
音声励振信号を生成し全帯域に対応する音声合成フィル
タ(LPCF)、48に供給する。即ち音声合成フィル
タ(LPCF)48は線形予測符号化手段・ (LE)
46により抽出される全帯域に対応する線形予測パラメ
ータによシ係数を制御され、前記音声励振信号により励
振されて全帯域に対応するディジタル合成音声を発生し
、低域フィルタ/D−A変換器(LPF/1)−A)4
9を介して合成音声として端子104より出力する。
第5図は本発明の帯域分割型ボコーダの第2の実施例を
示すブロック図である。本実施例においては、その分析
側は、第1図に示される前記従来例と第4図に示される
本発明の第1の実施例の分析側と、その構成と作用と共
に大略同等であるが、第5図における線形予測符号化手
段−1〜3 (LE−1〜3)57−1〜3の出力の中
の電力情報が残差電力ではなくて平均電力である点のみ
が異なっている。また合成側は、本発明の第1の実施例
の第1の線形予測分析手段201において、各帯域毎に
正規化予測残差電力算出手段を付加する形で構成される
。即ち本発明の主要要件である合成側における第1の線
形予測分析手段202は、第2の実施例においては各帯
域毎のにパラメータ/αパラメータ変換手段−1〜3(
K/α−1〜3)    ′62−1〜3、正規化予測
残差電力算出手段−1〜3 (N1(、P−1〜3)6
3−1〜3、予測残差電力算出手段−1〜3 (RP−
1′〜3)64−1〜3、音声合成フィルター1〜3(
LPCF−1〜3)65−1〜3、音声励振信号乗算手
段−1〜3(VM−1〜3)66−1〜3、インタポー
レーン1フ手段−1〜3(IP−1〜3)67−1〜3
、低域フィルター1  (LPF−1)69、帯域フィ
ルター2〜3  (BPF−2〜3)70−2〜3と、
周波数変換手段−2〜3 (FC−2〜3)68−2〜
3と、波形信号加算手段(Σ)74と、線形予測符号化
手段(LE)75とを備えて構成されている。
各帯域毎に分析側よシ送られてくるにパラメータと短時
間平均tカは復号化手段61により復号されて、各帯域
のにパラメータ/αパラメータ変換手段=1〜3(K/
α−1〜3)62−1〜3と予測残差電力算出手段−1
〜3(RP−1〜3)64−1〜3に入力される。各に
パラメータ/αパラメータ変換手段において、一方にお
いて変換されたαパラメータは、それぞれ対応する音声
合成フィルター1〜3  (LPCF−1〜3)65−
1〜3に出力され、他方各帯域のにパラメータは、それ
ぞれ対応する正規化予測残差電力算出手段−1〜3 (
NRP−1〜3)63−1〜3に出力される。各正規化
予測残差電力算出手段−1〜3(NRP−1〜3)63
−1〜3においては、前記にパラメータより各帯域毎に
正規化予測残差電力U(LJ−π(1−に2月を算出し
、対応する予(イ 測残差電力算出手段−1〜3(RP−1〜3)64−1
〜3に送出する。予測残差電力算出手段−1〜3 (R
P−1〜3)64−1〜3においては、分析側より送ら
れてくる前記平均電力と前記正規化予測残差電力との乗
算作用によシ予測残差電力を算出し、各帯域毎にそれぞ
れの音声励振信号乗算手段−1〜3(VM−1〜3)6
6−1〜3に出力する。一方音源情報とし゛C分析側よ
り送られてくるピッチ信号はパルス信号発生器()’G
)71に入力され、ピッチ周期と同一周期のパルス例信
号を発生し、同じく音源情報として送られてくる有声・
無声・判別信号により制御される有声・無声切替スイッ
チ(V/UV−8)73を経由して、有声音に対応する
音源信号として各帯域毎の音声励振信号乗算手段−1〜
3 (VM−1〜3)6fj−1〜3に入力される。ま
た雑音発生器(NG)72の雑音出力は有声・無声切替
スイッチ(V/UV−8)73を経由して、無声音に対
応する音源信号として各帯域毎の音声励振信号乗算手段
−1〜3 (VM−1〜3)66−1〜3に入力される
。これらの有声音および無声音に対応する音源信号は、
音声励振信号乗算手段−1〜3 (VM−1〜3)66
−1〜3において前記各帯域毎に算出された予測残差電
力とそれぞれ乗算され、各帯域に対応する音声励振信号
としてそれぞれ音声合成フィルター1〜3  (LPC
F−1〜3)65−1〜3に出力される。各音声合成フ
ィルターl〜3 (LPCF−1〜3)65−1〜3は
にパラメータ/αパラメータ変換手段−1〜3(K/α
−1〜3)62−1〜3よ多入力される各帯域毎のαパ
ラメータによりその係数を制御され、前記を励振信号を
入力して、それぞれ対応する各帯域のディジタル合成波
形信号を出力する。これらの波形信号はインタボーレー
ション手段−1〜3(IP−1〜3)67−1〜3にお
いて、現標本抽出し  ・−トよりも高いレートで再標
本抽出される。これらの信号の中帯域lの信号は直接低
域フィルター1 (LPF−1)69に送出されるが、
帯域■および虱の(1号は周波数変換手段−2〜3 (
FC−2〜3)6B−2〜3において、前記境界周波数
F2およびF3に対応する所定の周波数で2′およびf
、/とそれぞれ混合されて原周波数領域に周波数シフト
されて、それぞれ帯域フィルター2〜3(B P F 
−2〜3)70−2〜3に送出される。
低域フィルター1  (LPF−1)69、帯域フィル
ター2〜3 (BPF−2〜3)70−2〜3より出力
される各帯域の波形信号は、波形信号加算手段(Σ)7
4により重畳加算され、線形予測符号化手段(LE)7
5においてウィンドー処理さされる。即ち、合成側にお
ける第1の線形予測分析手段202の作用は、各帯域毎
の線形予測パラメータより全周波数帯域に対応する線形
予測パラメータと関連電力情報を抽出することにある。
線形予測符号化手段(LE)75は全周波数帯域に対応
する線形予測パラメータを抽出して、全帯域に対応する
音声合成フィルタに出力してその係数を制御するととも
に、予測残差電力を抽出して音声励振信号乗算手段(V
M)76に出力する。一方音源情報信号より有声音およ
び無声音に対応する音源信号を生成する作用過程につい
ては、前記従来例および第2の実施例における場合と同
等で、音声励振信号乗算手段(VM)76には有声・無
声切替スイッチ(V/UV−8)73を介して前記音源
信号が入力され、前記予測残差電力との乗算作用により
音声励振信号を生成して音声合成フィルタ(LPCF)
77に供給される。音声合成フィルタ(LPCF)77
は、線形予測符号化手段(LE)75より入力される前
記線形予測パラメータによりその係数を制御され、音声
励振信号乗算手段(VM)76より供給される音声励振
信号によシ励振されてデジタル合成音声信号を発生し、
低域フィルタ/I)−A変換器CL P F/D −A
)78を介して合成音として端子106より出力する。
この第2の実施例の第1の実施例と異なる主要点は、第
1の実施例においては、分析側において線形予測符号化
手段により予測残差電力を抽出して合成側に伝送してい
るのに対し、第2の実施例においては、分析側からは短
時間における平均電力を合成側に伝送し、合成側におい
て線形予測パラメータから正規化予測残差電力を抽出し
て予測残差電力を算出している点である。一般に、帯域
分割型ボコーダにおいて、分析側より合成側に音声の振
幅を伝送する方法としては、第1の方法として全帯域に
対応する短時間平均電力を伝送する方法、第2の方法と
して各帯域毎の短時間平均電力を伝送する方法、第3の
方法として各帯域毎の予測残差電力を伝送する方法およ
び第4の方法として各帯域毎の正規化予測残差電力を伝
送する方法等が考えられるが、分析精度の点よシ見ると
、各帯域毎に振幅伝送を考慮することが望ましく、従っ
て前記冒頭の第1の方法は対象外である。
問題は、分析側と合成側との間の伝送線路におりる、限
定された伝送容量の中で如何に分析精度を保持するかと
いう点にかかる。前記伝送線路を経由して分析側から合
成側に伝送される分析データは各帯域毎の線形予測パラ
メータ、電力情報およびピッチ信号と有声・無声判別信
号を含む音源情報の3種類に類別される。この中の音源
情報は対象外として、線形予測パラメータと電力情報と
について見ると、前者の線形予測パラメータは音声の周
波数スペクトル包絡の合成側における再生に深く関与し
、同時に電力情報との関連においては正規化予測残差電
力と”密接な対応関係におり、また後者の電力情報は、
合成側において、音声合成フィルタを励振する音声励振
信号の生成上、予測残差電力という形で振幅伝送上の不
可欠の要素となっている。従って、前記第2、第3およ
び第4のそれぞれの振幅伝送形態について、前記線形予
測パラメータの伝送との関連において、分析精度の観点
から伝送効率を最大と為し得る方法として何れを選択す
るかに問題が集約される。前記第2の方法は、分析側に
おいて各帯域毎に数十及至百数十m、sec、 (ミリ
秒)程度の短時間における平均電力を求めて合成側に伝
送し、合成側において線形予測パラメータより正規化予
測残差電力を抽出して、前記短時間平均電力との乗算に
より予測残差電力を算出する方法である。第3の方法は
分析側において線形予測パラメータよシ正規化予測残差
電力を抽出し、前記短時間平均電力との乗算によシ予め
分析側において予測残差電力を算出した後合成側に伝送
する方法である。第4の方法は、分析側において正規化
予測残差電力を抽出し、短時間平均電力とともに合成側
に伝送して合成側において予測残差電力を求める方法で
ある。以上三つの方法の中、明らかに第4の方法は、単
純に伝送効率の点からだけ見ても失格であり対象外であ
る。前記第2の方法と第3の方法とを比較検討する際、
分析側と合成側とを連結する伝送線路の有限の伝送帯域
の中で、分析精度を保持し或は改善するために如何にし
て各伝送データにビット数を配分するかという点よシ見
ると、総体的に見て帯域圧縮という強い要求条件の下に
おいては、ビット数は極力線形予測パラメータに対して
よシ多く割当て、平均電力または予測残差電力に対して
は成るべく割当てビット数を抑制したいというのが実体
である。このような制約条件下において、合成側におい
て得られる予測残差電力の分析精度を考えると、第一に
量子化哄差の要因によシ前記第2の方法の方が前記第3
の方法よりも精度が期待できる。また、平均電力の時間
的変動は数巨m。
see、程度のゆるやかな変動であるが、予測残差電力
の場合は20m、sec、程度の相対的に速い時間的変
動であり、ビットの割当ての点においても有利である。
従って、本発明の前記第2の実施例は、前記第1の実施
例に対して合成側に正規化予測残差電力算出手段を付与
することにより、振幅伝送上の分析精度を向上し、ひい
ては線形予測パラメータの伝送をも含めて量子化誤差を
低減して総体的な分析精度を改善することができるとい
う効果がある。
第6図は本発明の帯域分割型ボコーダの第3の実施例を
示すブロック図である。本実施例は帯域を2分割した場
合の実施例で、分析側における作用については前記従来
例、第1の実施例および第2の実施例の場合と大略同等
である。即ち音声入力信号は2帯域の信号に分割され、
各帯域毎に線形予測分析手法によシ抽出された線形予測
パラメータと関連電力情報信号は、音源情報信号と共に
符号化されて合成側に送られる。合成側においては、本
発明の主要要件である第1の線形予測分析手段203は
、各帯域毎の電力スペiトル算出手段−1〜2(PSC
−1〜2)89−1〜2、全帯域に対応する自己相関計
測手段(ACM)90、線形予測分析手段(LPC)9
1および予測残差電力算出手段(RP)92を備えて構
成されている。
各帯域毎に分析側より送られてくる前記線形予測パラメ
ータと関連電力情報としての予測残差電力は、復号化器
88において復号され、それぞれ電カスベクトル算出手
段−1〜2(PSC−1〜2)89−1〜2に入力され
る。電カスベクトル算出手段=1〜2(PSC−1〜2
)89−1〜2においては、前記線形予測パラメータと
予測残差電力とよシ各帯域に対応する電カスベクトルを
算出する。線形予測パラメータを(α5、)とし、予測
残差電力をPRとすると電カスベクトルは次式で求めら
れる。
上式においてA。=Σ(α、) % A、=2’nα、
・4′2 j=Q                  %α4+
、である。またωは角周波数、fは線形予測パラメータ
の次数である。
上式を通じて算出される各帯域の電カスベクトルは、自
己相関計測手段(ACM)90において逆フーリエ変換
演算により全周波帯域に互る自己相関係数列として抽出
される。第7図は本実施例における電カスベクトルと自
己相関係数列との対応を説明するための図である。図に
おいて横軸は角周波数または周波数標本抽出番号を示し
、縦軸は電カスベクトルを示している。PL(ω)およ
びPH(ω)は、それぞれ帯域分割された2帯域の中の
低周波領域および高周波領域の電カスベクトルを示して
いる。これらの電カスベクトルより所要の自己相関係数
列は次式によって求められる(Nは標本抽出数、Δωは
標本抽出の角周波数間隔)。
上式において、第7図を参照して理解されるように、n
は2分割された帯域の低周波領域における標本抽出数で
あり、(N−1) −(n−1)=N−nは前記2分割
された帯域の高周波領域における標本抽出数である。勿
論、全帯域に互る標本抽出数はNとなる。自己相関計測
手段(ACM)90より抽出される全周波数帯域に亙る
自己相関係数列(pρj=L2・・・やは、線形予測分
析手段(LPC)91に送られて、次式に対応する連立
−次方程式を解くことにより線形予測パラメータ(α1
)を抽出する。
このαパラメータ伏音声合成フィルタ(L P CF)
97に送られて、その係数を制御する。他方、自己相関
計測器(ACM)90により抽出される自己相関係数列
(p )は予測残差電力算出手段(RP)92にも出力
され、予測残差電力算出手段(RP)92においては前
記自己相関係数列よシ平均電力を算出し、また線形予測
分析手段(LPC)91から送られてくるにパラメータ
よシ正規化予測残差電力を算出して、前記平均電力との
乗算作用により予測残差電力を求めて音声励振信号乗算
手段(VM)96に出力する。分析側より送られてくる
音源情報信号による。パルス信号発生器(P、G)93
、雑音発生器(NG)94、有声・無声切替スイッチ(
V/UV−8)95の有機的連棉作用によシ生成される
有声音および無声音に対応する音源信号は音声励振信号
乗算手段(VM)96に入力され、前記予測残差電力と
の乗算作用により音声励振信号を発生し音声合成フィル
タ(LPCF)97に供給される。音声合成フィルタ(
L P CF)97においては前記αパラメータにより
係数を制御され、前記音声励振信号によって励振されて
ディジタル合成音声信号を発生し、低域フィルタ/D−
A変換器(LPF/D−A)98を経由して端子108
より合成音声信号を出力する。なお音声合成フィルタ(
LPCF)97の係数を制御する線形予測パラメータと
して本実施例においてはαパラメータを用いて説明し′
たが他のパラメータを用いても同様の作用効果が得られ
ることは言うまでもない。
この第3の実施例においては、第6図より明らかなよう
に、合成側における第1の線形予測分析手段として、前
述のとおり各帯域毎の電カスベクトル算出手段と全帯域
に対応する自己相関計測手段とを備え、これに線形予測
分析手段を組合せることによシ、前記第1および第2の
実施例の合成側における所要の処理時間に比較して、格
段の差で、その処理時間を短縮できるという効果かある
勿論、前記従来例において見られるようなスペクトル包
絡における不連続性の問題は十分解決される。
以上詳細に説明したように、本発明の帯域分割型ボコー
ダは、合成側において各帯域毎の線形予測パラメータよ
り全帯域に互る線形予測パラメータを抽出して音声合成
フィルタを制御する線形予測分析手段を備えることによ
り、従来の帯域分割形ボコーダに見られるスペクトル包
絡における境界周波数での不連続性を除去し、線形予測
分析精度を改善することができるという効果がある。
【図面の簡単な説明】
第1図は従来の帯域分割型ボコーダの一例のブロック図
、第2図は入力音声信号と合成音声信号とのスペクトル
包絡の比較説明図、第3図は本発明の概念的ブロック図
、第4図、第5図および第6図はそれぞれ本発明の第1
、第2および第3の実施例のブロック図、第7図は電カ
スベクトルと自己相関係数列との対応関係説明図である
。図において、l、24.51,78・・・・・・低域
フィルタ、/A−D変換器(hPF/A−I))、2.
17.25.40.52.69,79・・・・・・低域
フィルター1  (LPF−1)、3−2.18−2.
26−2.41−2.53−2.70−2.80・・・
・・・帯域フィルター2 (BPF−2)、3−3.1
8−3.26−3.41−3.53−3.70−3・・
・・・・帯−域フイルター3  (BPF−3)、4−
2.16−2.27−2.39−2.54−2.68−
2.81・・・・・・周波数変換手段−2(FC−2)
、 4−3.16−3.27−3.39−3.54−3
.68−3・・・・・・周波数変換手段−3(FC−3
)、5−2.28−2.55−2.82・・・・・・低
域フィルター2(LPF−2八5−3.28−3.55
−3・・・・・・低域フィルター3  (LPF−3)
、6−1,29−1.56−1.83−1・・・・・・
デシメーション手段−1(DM−1)、6−2,29−
2.56−2.83−2・・・・・・デシ)1−シ、7
手段−2(DM−2)、6−3.29−3.56−3・
・・・・・デシメーション手段−3(DM−3)、7−
1.30−1.57−1.84−1・・・・・・線形予
測符号化手段−1(LE−1)、7−2.30−2.5
7−2.84−2・・・・・・線形予測符号化手段−2
(LE−2)、7−3.30−3.57−3・・・・・
・線形予測符号化手段−3(LE−3)、8.31.5
8.85・・・・・・ピッチ抽出手段(PITCH)、
9.32.59.86・・・・・・有声・無声判別手段
(V/UV)、1O133,60,87・・・・・・符
号化手段(CODER)、11.34.61.88・・
・・・・復号化手段(DECODER)、12−1.3
5−1.62−1・・・・・・Kパラメータ/αパラメ
ータ変換手段−1(K/α−1)、12−2.35−2
.62−2・・・・・・Kパラメータ/αパラメータ変
換手段−2(K/α−2)、12−3、。 35−3.62−3・・・・・・Kパラメータ/αパラ
メータ変換手段−3(K/α−3)、13−1.36−
1.66−1・・・・・・音声励振信号乗算手段−1(
VM−1)、13−2.36−2.66−2・・・・・
・音声励振信号乗算手段−2(VM−2)、13−3.
36−3.66−3・・・・・・音声励振信号乗算手段
−3(VM−3)、14〜1.37−1,65−1・・
・・・・音声合声フィルター1  (LPCF−1)、
14−2.37〜2.65−2・・・・・・音声合成フ
ィルター2 (LPCF−2)、14−3.37−3.
65−3・・・・・・音声合成フィルター3 (LPC
F−3)、15−1.38−1,67−1・・・・・・
インタポーレーション手段−1(I P =”r)、1
5−2.38−2.67−2・・・・・・インタボーレ
ーション手段−2(IP−2)、15−3.38−3.
67−3・・・・・・インタボーレーション手段−3(
IP−3)、22.45.74・・・・・・波形信号加
算手段(Σ)、19.42.71.93・・・・・・パ
ルス信号発生器、20.44.72,9.4・・・・・
・雑音発生器、21,43.73.95・・・・・・有
声・無声切替スイッチ(V/TJV−8)、23.49
.78.98・・・・・・低域フィルタ/D−A変換器
(LPF/D−A)、46.75・・・・・・線形予測
符号化手段(LE)、47. 76.96・・・・・・
音声励振信号乗算手段(VM)、48.77.97・・
・・・・音声合成フィルタ(L P CF)、63−1
・・・・・・正規化予測残差電力算出手段−1(NRP
−1)、63=2・・・・・・正規化予測残差電力算出
手段−2(NRP−2)、63−3・・・・・・正規化
予測残差電力算出手段−3(NRP−3)、64−1・
・・・・・予測残差電力算出手段−1(RP−1)、6
4−2・・・・・・予測残差電力算出手段−2(几P−
2)、64−3・・・・・・予測残差電力算出手段−3
(RP−3)、89−1・・・・・・電カスベクトル算
出手段−1(PSC−1)、89−2・・・・・・電カ
スベクトル(1)山手段−2(PSC−2)、90・・
・・・・自己相関計測手段、91・・・・・・線形予測
分析手段(L P C)、92・・・・・・予測残差電
力算出手段(RP)、zox〜203.502・・・・
・・第1の線形予測分析手段、101〜108・・・・
・・端子、301〜304,601・・・・・・伝送線
路、602−1〜Nn603〜606・・・・・・伝送
路、501・・・・・・復号化手段、503・・・・・
・音声励損信号発生手段、504・・・・・・全帯域音
声合成フィルタ。 iヤしZIシう(α) +z m<レノ 半づ拐

Claims (1)

  1. 【特許請求の範囲】 (11線形予測分析手法を用いる帯域分割型ボコーダに
    おいて、分析側から合成側に伝送される分割された各周
    波数帯域毎の線形予測パラメータより全周波数帯域に亙
    る線形予測パラメータを抽出して全周波数帯域に対応す
    る音声合成フィルタを制御する第1の線形予測分析手段
    を合成側において備えることを特徴とする帯域分割型ボ
    コーダ。 (2)前記第1の線形予測分析手段として、分析側から
    合成側に伝送される前記各周波数帯域毎の線形予測パラ
    メータと関連電力情報信号とKよ多制御されて各帯域毎
    に合成音声を出力する合成フィルタを含む各帯域毎の音
    声合成手段と、これらの各帯域毎の合成信号をその周波
    数領域を調整した後時間軸次元において重畳し、全周波
    数帯域に互る音声波形信号として出力する音声波形加算
    手段と、この音声波形加算手段の出力信号を入力して線
    形予測分析を行い前記全周波数帯域に互る線形予測パラ
    メータを抽出する第2の線形予測分析手段とを備えるこ
    とを特徴とする特許 割型ボコーダ。 (3ン  前記第1の線形予測分析手段として、分析側
    から合成側に伝送される前記各周波数帯域毎の線形予測
    パラメータより各帯域毎の正規化予測残差電力を抽出す
    る正規化予測残差電力算出手段と、分析側から合成側に
    伝送される前記各周波数帯域毎の線形予測パラメータお
    よび関連電力情報信号と前記正規化予測残差電力とによ
    多制御されて各帯域毎に合成音声を出力する合成フィル
    タを含む各帯域毎の音声合成手段と、これらの各帯域毎
    の合成信号をその周波数領域を、 調整した後時間軸次
    元において重畳して全周波数帯域に互る音声波形信号と
    して出力する□音声波形加算手段と、この音声波形加算
    手段の出力信号を入力して線形予測分析を行い前記全周
    波数帯域に互る線形予測パラメータを抽出する第3の線
    形予測分析手段とを備えることを特徴とする特許 型ボコーダ。 (4)前記第1の線形予測分析手段として、分析側から
    合成側に伝送される前記各周波数帯域毎の線形予測パラ
    メータと関連電力情報とよシ各帯域毎に電力スペクトル
    を算出する電力スペクトル算出手段と、これらの各帯域
    毎の電カスベクトルより全周波数帯域に互る音声信号に
    対応する自己相関係数列を抽出する自己相関計測手段と
    、この自己相関係数列より全周波数帯域に互る線形予測
    パラメータを抽出する第4の線形予測分析手段とを備え
    ることを特徴とする前記特許請求の範囲第(1)項記載
    の箒域分割型ボコーダ。
JP57104475A 1982-06-17 1982-06-17 帯域分割型ボコ−ダ Granted JPS58220199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57104475A JPS58220199A (ja) 1982-06-17 1982-06-17 帯域分割型ボコ−ダ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57104475A JPS58220199A (ja) 1982-06-17 1982-06-17 帯域分割型ボコ−ダ

Publications (2)

Publication Number Publication Date
JPS58220199A true JPS58220199A (ja) 1983-12-21
JPH0229237B2 JPH0229237B2 (ja) 1990-06-28

Family

ID=14381594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57104475A Granted JPS58220199A (ja) 1982-06-17 1982-06-17 帯域分割型ボコ−ダ

Country Status (1)

Country Link
JP (1) JPS58220199A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018045244A (ja) * 2011-11-03 2018-03-22 ヴォイスエイジ・コーポレーション 低レートcelpデコーダに関する非音声コンテンツの向上

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018045244A (ja) * 2011-11-03 2018-03-22 ヴォイスエイジ・コーポレーション 低レートcelpデコーダに関する非音声コンテンツの向上

Also Published As

Publication number Publication date
JPH0229237B2 (ja) 1990-06-28

Similar Documents

Publication Publication Date Title
EP0477960B1 (en) Linear prediction speech coding with high-frequency preemphasis
JPH096397A (ja) 音声信号の再生方法、再生装置及び伝送方法
JPH01233500A (ja) 複数レート音声エンコーデイング方法
JPH0575296B2 (ja)
JP4180677B2 (ja) 音声符号化並びに復号化方法及びその装置
US4991215A (en) Multi-pulse coding apparatus with a reduced bit rate
US4975955A (en) Pattern matching vocoder using LSP parameters
US4716591A (en) Speech synthesis method and device
JPS58220199A (ja) 帯域分割型ボコ−ダ
JP2844589B2 (ja) 音声信号符号化方法とその装置
Esteban et al. 9.6/7.2 kbps voice excited predictive coder (VEPC)
JP3282595B2 (ja) 音声符号化・復号化装置及び通信装置
JPH0449960B2 (ja)
JPH0229239B2 (ja)
JPH0449959B2 (ja)
JPH0235998B2 (ja)
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JPH1020892A (ja) 音声通信装置
JPH053600B2 (ja)
JPH0235991B2 (ja)
Atal Influence of pitch on formant frequencies and bandwidths obtained by linear prediction analysis
JP2973966B2 (ja) 音声通信装置
JPH0448240B2 (ja)
JPS60260100A (ja) 音声合成器
JPS60138600A (ja) ボコ−ダ