JPH0229237B2 - - Google Patents

Info

Publication number
JPH0229237B2
JPH0229237B2 JP57104475A JP10447582A JPH0229237B2 JP H0229237 B2 JPH0229237 B2 JP H0229237B2 JP 57104475 A JP57104475 A JP 57104475A JP 10447582 A JP10447582 A JP 10447582A JP H0229237 B2 JPH0229237 B2 JP H0229237B2
Authority
JP
Japan
Prior art keywords
band
linear prediction
analysis
signal
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57104475A
Other languages
English (en)
Other versions
JPS58220199A (ja
Inventor
Satoru Taguchi
Masanori Kobayashi
Takayuki Ishikawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP57104475A priority Critical patent/JPS58220199A/ja
Publication of JPS58220199A publication Critical patent/JPS58220199A/ja
Publication of JPH0229237B2 publication Critical patent/JPH0229237B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)

Description

【発明の詳細な説明】 本発明は線形予測分析手法を用いる帯域分割型
ボコーダに関し、特に合成側において分割された
各周波数帯域毎の線形予測パラメータから全周波
数帯域に互る線形予測パラメータを抽出して音声
を合成する帯域分割型ボコーダに関する。
従来の帯域分割型ボコーダの一例のブロツク図
を第1図に示す。図において音声分析側には低域
フイルタ/A−Dコンバータ(LPF/A−D)
1、低域フイルタ−1(LPF−1)2、帯域フイ
ルタ−2〜−3(BPF−2〜3)3−2〜3、周
波数変換手段2〜3(FC−2〜3)4−2〜3、
低域フイルタ−2〜3(LPF−2〜3)5−2〜
3、デシメーシヨン手段−1〜3(DM−1〜3)
6−1〜3、線形予測符号化手段−1〜3(LE−
1〜3)7−1〜3、ピツチ抽出手段(PITCH)
8、有声・無声判別手段(V/UV)9、符号化
手段(CODER)10とを備え、音声合成側にお
いては復号化手段(DE CODER)11、Kパラ
メータ/αパラメータ変換手段−1〜3(K/α
−1〜3)12−1〜3、音声励振信号乗算手段
−1〜3(VM−1〜3)13−1〜3、音声合
成フイルタ−1〜3(LPCF−1〜3)14−1
〜3、インタポーレーシヨン手段−1〜3(IP−
1〜3)15−1〜3、周波数変換手段2〜3
(FC−2〜3)16−2〜3、低域フイルタ−1
(LPF−1)17、帯域フイルタ−2〜3(BPF
−2〜3)18−2〜3、ピツチパルス信号発生
器(PG)19、雑音発生器(NG)20、有
声・無声切替スイツチ(V/UV−S)21、波
形信号加算手段(Σ)22、D−A変換器/低域
フイルタ(LPF/D−A)23とを備えている。
この従来例は帯域分割数が3帯域の場合で、図
に示されるように1個の低域フイルタ−1(LPF
−1)2と2個の帯域フイルタ(BPF−2〜3)
3−2〜3が用意されている。端子101から入
力された音声信号は、低域フイルタ/A−Dコン
バータ(LPF/A−D)1を経由して標本抽出
され量子化されて、低域フイルタ−1(LPF−
1)2および帯域フイルタ−2〜3(BPF−2〜
3)3−2〜3により3帯域に分割される。この
帯域分割の概念を第2図aについて説明する。図
において横軸は音声の周波数、縦軸は音声のスペ
クトル包絡を表示している。図に示されるスペク
トル包絡は一つ例の表示であるが、本従来例の3
帯域分割の場合には、境界周波数F2およびF3
設定して周波数帯域をI、およびの3帯域に
分割し、各帯域毎に線形予測分析を行う。これら
の帯域I、およびの中、帯域と帯域とに
含まれる信号は帯域フイルタ−2〜3(BPF−2
〜3)3−2〜3を通過した後、周波数変換手段
2〜3(FC−2〜3)4−2〜3において前記境
界周波数F2およびF3に対応する所定の周波数f2
よびf3とそれぞれ混合されて低周波領域に周波数
シフトされる。低域フイルタ−1(LPF−1)2
を通過した帯域Iの信号と、周波数シフトされて
低域フイルタ−2〜3(LPF−2〜3)5−2〜
3を通過した帯域およびの信号は、それぞれ
対応するデシメーシヨン手段−1〜3(DM−1
〜3)6−1〜3において、現標本抽出レートよ
りも低いレートで再標本抽出され線形予測符号化
手段−1〜3(LE−1〜3)7−1〜3に出力さ
れる。デシメーシヨン手段の作用は、既に標本抽
出されている入力信号に対して、その標本抽出レ
ートよりも低いレートでその入力信号を再標本抽
出する作用として定義づけすることができる。こ
のようにより低いレートで再標本抽出された3帯
域の信号は、それぞれ線形予測符号化手段−1〜
3(LE−1〜3)7−1〜3においてウインドー
処理された後通常行われている線形予測分析によ
り線形予測パラメータを抽出するとともに、本従
来例においては残差電力をも抽出する。これらの
各帯域毎に得られる線形予測パラメータ(本例に
おいてはKパラメータ)と残差電力は符号化手段
(CODER)10により符号化され合成側に送出
される。一方音源情報については、前記標本抽出
され量子化された入力音声信号よりピツチ抽出手
段(PITCH)8により抽出されるピツチ信号と、
有声・無声判別手段(V/UV)9により識別さ
れる有声・無声判別信号とが符号化手段10によ
り符号化されて合成側に送られる。
合成側においては、各帯域毎に分析側より送ら
れてくるKパラメータと残差電力とは復号化手段
11により復号されて、それぞれ各帯域のKパラ
メータ/αパラメータ変換手段−1〜3(K/α
−1〜3)12−1〜3と音声励振信号乗算手段
−1〜3(VM−1〜3)13−1〜3に入力さ
れる。各Kパラメータ/αパラメータ変換手段に
おいては変換されたαパラメータは、それぞれ対
応する音声合成フイルタ−1〜3(LPCF−1〜
3)14−1〜3に出力される。一方音源情報と
して分析側より送られてくるピツチ信号はパルス
信号発生器(PG)19に入力され、ピツチ周期
と同一周期のパルス列信号を発生し、同じく音源
情報として送られてくる有声・無声判別信号によ
り制御される有声・無声切替スイツチ(V/UV
−S)21を経由して、有声音に対応する音源信
号として各帯域毎の音声励振信号乗算手段−1〜
3(VM−1〜3)13−1〜3に入力される。
また、雑音発生器(NG)20の雑音出力は有
声・無声切替スイツチ(V/UV−S)21を経
由して、無声音に対応する音源信号として各帯域
毎の音声励振信号乗算手段−1〜3(VM−1〜
3)13−1〜3に入力される。これらの有声音
および無声音に対応する音源信号は、音声励振信
号乗算手段−1〜3(VM−1〜3)13−1〜
3において前記各帯域毎の残差電力とそれぞれ乗
算され、各帯域に対応する音声合成フイルタ−1
〜3(LPCF−1〜3)14−1〜3に出力され
る。各音声合成フイルタ−1〜3(LPCF−1〜
3)14−1〜3はKパラメータ/αパラメータ
変換手段−1〜3(K/α−1〜3)12−1〜
3より入力される各帯域毎のαパラメータにより
その係数を制御され、前記音声励振信号を入力し
て、それぞれ対応する各帯域のデイジタル合成波
形信号を出力する。これらの波形信号はインタポ
ーレーシヨン手段−1〜3(IP−1〜3)15−
1〜3において、現標本抽出レートよりも高いレ
ートで再標本抽出される。インタポーレーシヨン
手段の作用は、既に標本抽出されている入力信号
に対して、その標本抽出レートよりも高いレート
でその入力信号を再標本抽出する作用として定義
づけされる。このようにより高いレートで再標本
抽出された各帯域の信号は、帯域Iの信号は直接
低域フイルタ−1(LPF−1)17−1に送出さ
れるが、帯域およびの信号は周波数変換手段
2〜3(FC−2〜3)16−2〜3において、前
記境界周波数F2およびF3に対応する所定の周波
数f2′およびf3′とそれぞれ混合されて原周波数領
域に周波数シフトされて、それぞれ帯域フイルタ
2〜3(BPF−2〜3)18−2〜3に送出され
る。低域フイルタ−1(LPF−1)17、帯域フ
イルタ−2〜3(BPF−2〜3)18−2〜3よ
り出力される各帯域の波形信号は、波形信号加算
手段(Σ)22により重畳加算されD−A変換
器/低域フイルタ(LPF/D−A)23を経由
して合成音声信号として端子102より出力され
る。
以上の作用経過における元の入力音声信号のス
ペクトル包絡と、合成側より出力される合成音声
信号のスペクトル包絡との対応関係を、本従来例
の3帯域分割の場合の一例について図示すると第
2図のように示される。即ち、第2図bにおいて
帯域Iととの境界周波数F2および帯域と
との境界周波数F3において、合成音声信号のス
ペクトル包絡に関して歴然とした不連続性を生じ
る。本来帯域分割型ボコーダの目的は、線形予測
分析手法の欠点であるフオルマント帯域幅の過少
推定と、高次フオルマントにおける近似性の悪さ
の2点を改善して分析精度を向上するところにあ
るが、その改善のために、派生的に前述の境界周
波数における不連続性が合成音声のスペクトル包
絡の上に現われるということは、分析精度の向上
という意味においてはマイナス要因であり要対策
事項として評価される。即ち従来の帯域分割型ボ
コーダにおいては、合成音声のスペクトル包絡に
関し、帯域分割の境界周波数において不連続性を
生じ、分析精度の向上に対しマイナス要因として
作用するという欠点がある。
本発明の目的は上記の欠点を除去し、合成側に
おいて全周波数帯域に亙る線形予測分析手段を備
え、前記境界周波数におけるスペクトル包絡の不
連続性を除去して分析精度を改善する帯域分割型
ボコーダを提供することにある。
本発明の帯域分割型ボコーダは、帯域分割型ボ
コーダにおいて、分析側から合成側に伝送される
分割された各周波数帯域毎の線形予測パラメータ
より全周波数帯域に互る線形予測パラメータを抽
出して全周波数帯域に対応する音声合成フイルタ
を制御する第1の線形予測分析手段を合成側に備
えて構成される。
以下本発明について図面を参照して詳細に説明
する。
第3図は本発明の帯域分割型ボコーダの合成側
を示す概念的ブロツク図である。伝送線路601
を経由して合成側に伝送されてきた各帯域毎の線
形予測パラメータと関連電力情報信号は、復号化
手段501により復号されてそれぞれ線路602
−1〜Nおよび線路603−1〜Nを介して第1
の線形予測分析手段502に入力される。図に示
される帯域分割型ボコーダにおいては一般的に取
扱い帯域分割数がN(Nは1より大きい正の整数)
の場合について図示している。第1の線形予測分
析手段502は、N組の各帯域に対応する線形予
側パラメータから全帯域に対応する線形予測パラ
メータを抽出して線路604を介して全帯域音声
合成フイルタ504の係数を制御するとともに、
所定の全帯域に対応する関連電力情報を抽出して
線路605を介して音声励振信号発生手段503
に出力する。一方復号化手段501において復号
される音源情報信号は音声励振信号発生手段50
3に入力され、第1の線形予測分析手段502よ
り入力される前記電力情報との乗算作用により音
声励振信号を発生して全帯域音声合成フイルタ5
04に供給する。全帯域音声合成フイルタ504
は前記全帯域に対応する線形予測パラメータと前
記音声励振信号を入力して音声を合成して出力す
る。第1図に示される従来例においては、各帯域
毎にそれぞれ個別に分析合成した信号を波形信号
の形で加算しているため帯域分割の境界周波数に
おいてスペクトル包絡における不連続性を生じる
が、第3図に示される本発明においては、合成側
において全帯域に互る線形予測分析手段を備え全
帯域に対応する線形予測パラメータを用いて音声
を合成するため、前記従来例の欠点は十分に除去
される。
第4図は本発明の帯域分割型ボコーダの第1の
実施例を示すブロツク図である。本実施例におい
ては、その分析側は、第1図に示される前記従来
例の分析側と、その構成と作用と共に同等であ
り、また合成側は、前記従来例の合成側に線形予
測符号化手段(LE)46と、全帯域に対応する
音声合成フイルタ(LPCF)48を付加する形で
構成されている。即ち本発明の主要要件である合
成側における第1の線形予測分析手段201は、
第1の実施例においては各帯域毎のKパラメー
タ/αパラメータ変換手段−1〜3(K/α−1
〜3)35−1〜3、音声励振信号乗算手段−1
〜3(VM−1〜3)36−1〜3、音声合成フ
イルタ−1〜3(LPCF−1〜3)37−1〜3、
インタポーレーシヨン手段−1〜3(IP−1〜
3)38−1〜3、周波数変換手段2〜3(FC−
2〜3)39−2〜3、低域フイルタ−1(LPF
−1)40、帯域フイルター2〜3(BPF−2〜
3)41−2〜3と、波形加算手段(Σ)45
と、線形予測符号化手段(LE)46とを備えて
構成されている。
各帯域毎に分析側より送られてくるKパラメー
タよりαパラメータを求め、各帯域毎の音声合成
フイルタによつて合成信号を出力して波形信号加
算手段45において時間軸次元において重畳加算
される迄の作用経過については前記従来例の場合
と同等である。波形信号加算手段(Σ)45にお
いて加算された波形信号は、線形予測符号化手段
(LE)46においてウインドー処理された後通常
行われている線形予測分析により全帯域に亙る線
形予測パラメータが抽出され、また電力情報とし
て残差電力が出力される。即ち第1の線形予測分
析手段201の作用は、各帯域毎の線形予測パラ
メータより全帯域に対応する線形予測パラメータ
と関連電力情報を抽出することにある。線形予測
符号化手段(LE)46より出力された全帯域に
対応する線形予測パラメータは全帯域に対応する
音声合成フイルタ48に入力されてその係数を制
御する。一方音源情報として分析側より送られて
くるピツチ信号および有声・無声判別信号により
音声励振信号が音声励振信号乗算手段(VM)4
2において生成される作用過程については、前記
従来例における各帯域での作用過程と同等で、パ
ルス信号発生器(PG)42より出力される有声
音に対応する音源信号と、雑音発生器(NG)4
4より出力される無声音に対応する音源信号と
は、有声・無声切替スイツチ(V/UV−S)4
3において前記有声・無声判別信号により切替制
御されて音声励振信号乗算手段(VM)47に入
力される。線形予測符号化手段(LE)46から
は、本実施例においては前記線形予測パラメータ
とともに電力情報として残差電力を抽出し音声励
振信号乗算手段(VM)47に出力する。音声励
振信号乗算手段(VM)47においては前記音源
信号と前記残差電力との乗算作用により音声励振
信号を生成し全帯域に対応する音声合成フイルタ
(LPCF)48に供給する。即ち音声合成フイル
タ(LPCF)48は線形予測符号化手段(LE)
46により抽出される全帯域に対応する線形予測
パラメータにより係数を制御され、前記音声励振
信号により励振されて全帯域に対応するデイジタ
ル合成音声を発生し、低域フイルタ/D−A変換
器(LPF/D−A)49を介して合成音声とし
て端子104より出力する。
第5図は本発明の帯域分割型ボコーダの第2の
実施例を示すブロツク図である。本実施例におい
ては、その分析側は、第1図に示される前記従来
例と第4図に示される本発明の第1の実施例の分
析側と、その構成と作用と共に大略同等である
が、第5図における線形予測符号化手段−1〜3
(LE−1〜3)57−1〜3の出力の中の電力情
報が残差電力ではなくて平均電力である点のみが
異なつている。また合成側は、本発明の第1の実
施例の第1の線形予測分析手段201において、
各帯域毎に正規化予測残差電力算出手段を付加す
る形で構成される。即ち本発明の主要要件である
合成側における第1の線形予測分析手段202
は、第2の実施例においては各帯域毎のKパラメ
ータ/αパラメータ変換手段−1〜3(K/α−
1〜3)62−1〜3、正規化予測残差電力算出
手段−1〜3(NRP−1〜3)63−1〜3、予
測残差電力算出手段−1〜3(RP−1〜3)64
−1〜3、音声合成フイルタ−1〜3(LPCF−
1〜3)65−1〜3、音声励振信号乗算手段−
1〜3(VM−1〜3)66−1〜3、インタポ
ーレーシヨン手段−1〜3(IP−1〜3)67−
1〜3、低域フイルタ−1(LPF−1)69、帯
域フイルタ−2〜3(BPF−2〜3)70−2〜
3と、周波数変換手段−2〜3(FC−2〜3)6
8−2〜3、波形信号加算手段(Σ)74と、線
形予測符号化手段(LE)75とを備えて構成さ
れている。
各帯域毎に分析側より送られてくるKパラメー
タと短時間平均電力は復号化手段61により復号
されて、各帯域のKパラメータ/αパラメータ変
換手段−1〜3(K/α−1〜3)62−1〜3
と予測残差電力算出手段−1〜3(RP−1〜3)
64−1〜3に入力される。各Kパラメータ/α
パラメータ変換手段において、一方において変換
されたαパラメータは、それぞれ対応する音声合
成フイルタ−1〜3(LPCF−1〜3)65−1
〜3に出力され、他方各帯域のKパラメータは、
それぞれ対応する正規化予測残差電力算出手段−
1〜3(NRP−1〜3)63−1〜3に出力され
る。各正規化予測残差電力算出手段−1〜3
(NRP−1〜3)63−1〜3においては、前記
Kパラメータより各帯域毎に正規化予測残差電力
U{U= πi (1−K2 i)}を算出し、対応する予測
残差電力算出手段−1〜3(RP−1〜3)64−
1〜3に送出する。予測残差電力算出手段−1〜
3(RP−1〜3)64−1〜3においては、分析
側より送られてくる前記平均電力と前記正規化予
測残差電力との乗算作用により予測残差電力を算
出し、各帯域毎にそれぞれの音声励振信号乗算手
段−1〜3(VM−1〜3)66−1〜3に出力
する。一方音源情報として分析側より送られてく
るピツチ信号はパルス信号発生器(PG)71に
入力され、ピツチ周期と同一周期のパルス例信号
を発生し、同じく音源情報として送られてくる有
声・無声判別信号により制御される有声・無声切
替スイツチ(V/UV−S)73を経由して、有
声音に対応する音源信号として各帯域毎の音声励
振信号乗算手段−1〜3(VM−1〜3)66−
1〜3に入力される。また雑音発生器(NG)7
2の雑音出力は有声・無声切替スイツチ(V/
UV−S)73を経由して、無声音に対応する音
源信号として各帯域毎の音声励振信号乗算手段−
1〜3(VM−1〜3)66−1〜3に入力され
る。これらの有声音および無声音に対応する音源
信号は、音声励振信号乗算手段−1〜3(VM−
1〜3)66−1〜3において前記各帯域毎に算
出された予測残差電力とそれぞれ乗算され、各帯
域に対応する音声励振信号としてそれぞれ音声合
成フイルタ−1〜3(LPCF−1〜3)65−1
〜3に出力される。各音声合成フイルタ−1〜3
(LPCF−1〜3)65−1〜3はKパラメー
タ/αパラメータ変換手段−1〜3(K/α−1
〜3)62−1〜3より入力される各帯域毎のα
パラメータによりその係数を制御され、前記音声
励振信号を入力して、それぞれ対応する各帯域の
デイジタル合成波形信号を出力する。これらの波
形信号はインタポーレーシヨン手段−1〜3(IP
−1〜3)67−1〜3において、現標本抽出レ
ートよりも高いレートで再標本抽出される。これ
らの信号の中帯域Iの信号は直接低域フイルタ−
1(LPF−1)69に送出されるが、帯域およ
びの信号は周波数変換手段−2〜3(FC−2〜
3)68−2〜3において、前記境界周波数F2
およびF3に対応する所定の周波数f2′およびf3′と
それぞれ混合されて原周波数領域に周波数シフト
されて、それぞれ帯域フイルタ−2〜3(BPF−
2〜3)70−2〜3に送出される。低域フイル
タ−1(LPF−1)69、帯域フイルタ−2〜3
(BPF−2〜3)70−2〜3より出力される各
帯域の波形信号は、波形信号加算手段(Σ)74
により重畳加算され、線形予測符号化手段(LE)
75においてウインドー処理された後通常行われ
ている線形予測分析により全帯域に互る線形予測
パラメータと予測残差電力とが抽出される。即
ち、合成側における第1の線形予測分析手段20
2の作用は、各帯域毎の線形予測パラメータより
全周波数帯域に対応する線形予測パラメータと関
連電力情報を抽出することにある。線形予測符号
化手段(LE)75は全周波数帯域に対応する線
形予測パラメータを抽出して、全帯域に対応する
音声合成フイルタに出力してその係数を制御する
とともに、予測残差電力を抽出して音声励振信号
乗算手段(VM)76に出力する。一方音源情報
信号より有声音および無声音に対応する音源信号
を生成する作用過程については、前記従来例およ
び第1の実施例における場合と同等で、音声励振
信号乗算手段(VM)76には有声・無声切替ス
イツチ(V/UV−S)73を介して前記音源信
号が入力され、前記予測残差電力との乗算作用に
より音声励振信号を生成して音声合成フイルタ
(LPCF)77に供給される。音声合成フイルタ
(LPCF)77は、線形予測符号化手段(LE)7
5より入力される前記線形予測パラメータにより
その係数を制御され、音声励振信号乗算手段
(VM)76より供給される音声励振信号により
励振されてデジタル合成音声信号を発生し、低域
フイルタ/D−A変換器(LPF/D−A)78
を介して合成音として端子106より出力する。
この第2の実施例の第1の実施例と異なる主要点
は、第1の実施例においては、分析側において線
形予測符号化手段により予測残差電力を抽出して
合成側に伝送しているのに対し、第2の実施例に
おいては、分析側からは短時間における平均電力
を合成側に伝送し、合成側において線形予測パラ
メータから正規化予測残差電力を抽出して予測残
差電力を算出している点である。一般に、帯域分
割型ボコーダにおいて、分析側より合成側に音声
の振幅を伝送する方法としては、第1の方法とし
て全帯域に対応する短時間平均電力を伝送する方
法、第2の方法として各帯域毎の短時間平均電力
を伝送する方法、第3の方法として各帯域毎の予
測残差電力を伝送する方法および第4の方法とし
て各帯域毎の正規化予測残差電力を伝送する方法
等が考えられるが、分析精度の点より見ると、各
帯域毎に振幅伝送を考慮することが望ましく、従
つて前記冒頭の第1の方法は対象外である。問題
は、分析側と合成側との間の伝送線路における、
限定された伝送容量の中で如何に分析精鳥を保持
するかという点にかかる。前記伝送線路を経由し
て分析側から合成側に伝送される分析データは各
帯域毎の線形予測パラメータ、電力情報およびピ
ツチ信号と有声・無声判別信号を含む音源情報の
3種類に類別される。この中の音源情報は対象外
として、線形予測パラメータと電力情報とについ
て見ると、前者の線形予測パラメータは音声の周
波数スペクトル包絡の合成側における再生に深く
関与し、同時に電力情報との関連においては正規
化予測残差電力と密接な対応関係にあり、また後
者の電力情報は、合成側において、音声合成フイ
ルタを励振する音声励振信号の生成上、予測残差
電力という形で振幅伝送上の不可欠の要素となつ
ている。従つて、前記第2、第3および第4のそ
れぞれの振幅伝送形態について、前記線形予測パ
ラメータの伝送との関連において、分析精度の観
点から伝送効率を最大と為し得る方法として何れ
を選択するかに問題が集約される。前記第2の方
法は、分析側において各帯域毎に数十及至百数十
m・sec・(ミリ秒)程度の短時間における平均電
力を求めて合成側に伝送し、合成側において線形
予測パラメータより正規化予測残差電力を抽出し
て、前記短時間平均電力との乗算により予測残差
電力を算出する方法である。第3の方法は、分析
側において線形予測パラメータより正規化予測残
差電力を抽出し、前記短時間平均電力との乗算に
より予め分析側において予測残差電力を算出した
後合成側に伝送する方法である。第4の方法は、
分析側において正規化予測残差電力を抽出し、短
時間平均電力とともに合成側に伝送して合成側に
おいて予測残差電力を求める方法である。以上三
つの方法の中、明らかに第4の方法は、単純に伝
送効率の点からだけ見ても失格であり対象外であ
る。前記第2の方法と第3の方法とを比較検討す
る際、分析側と合成側とを連結する伝送線路の有
限の伝送帯域の中で、分析精度を保持し或は改善
するために如何にして各伝送データにビツト数を
配分するかという点より見ると、総体的に見て帯
域圧縮という強い要求条件の下においては、ビツ
ト数は極力線形予測パラメータに対してより多く
割当て、平均電力または予測残差電力に対しては
成るべく割当てビツト数を抑制したいというのが
実体である。このような制約条件下において、合
成側において得られる予測残差電力の分析精度を
考えると、第一に量子化誤差の要因により前記第
2の方法の方が前記第3の方法よりも精度が期待
できる。また、平均電力の時間的変動は数百m.
sec.程度のゆるやかな変動であるが、予測残差電
力の場合は20m.sec.程度の相対的に速い時間的変
動であり、ビツトの割当ての点においても有利で
ある。従つて、本発明の前記第2の実施例は、前
記第1の実施例に対して合成側に正規化予測残差
電力算出手段を付与することにより、振幅伝送上
の分析精度を向上し、ひいては線形予測パラメー
タの伝送をも含めて量子化誤差を低減して総体的
な分析精度を改善することができるという効果が
ある。
第6図は本発明の帯域分割型ボコーダの第3の
実施例を示すブロツク図である。本実施例は帯域
を2分割した場合の実施例で、分析側における作
用については前記従来例、第1の実施例および第
2の実施例の場合と大略同等である。即ち音声入
力信号は2帯域の信号に分割され、各帯域毎に線
形予測分析手法により抽出された線形予測パラメ
ータと関連電力情報信号は、音源情報信号と共に
符号化されて合成側に送られる。合成側において
は、本発明の主要要件である第1の線形予測分析
手段203は、各帯域毎の電力スペクトル算出手
段−1〜2(PSC−1〜2)89−1〜2、全帯
域に対応する自己相関計測手段(ACM)90、
線形予測分析手段(LPC)91および予測残差
電力算出手段(RP)92を備えて構成されてい
る。
各帯域毎に分析側より送られてくる前記線形予
測パラメータと関連電力情報としての予測残差電
力は、復号化器88において復号され、それぞれ
電力スペクトル算出手段−1〜2(PSC−1〜2)
89−1〜2に入力される。電力スペクトル算出
手段−1〜2(PSC−1〜2)89−1〜2にお
いては、前記線形予測パラメータと予測残差電力
とより各帯域に対応する電力スペクトルを算出す
る。線形予測パラメータを{αj}とし、予測残差
電力をPRとすると電力スペクトルは次式で求め
られる。
上式においてA0Pj=0 {αj2、Ai=2P-ij=0 αj・αi+j
である。またωは角周波数、ρは線形予測パラメ
ータの次数である。
上式を通じて算出される各帯域の電力スペクト
ルは、自己相関計測手段(ACM)90において
逆フーリエ変換演算により全周波帯域に互る自己
相関係数列として抽出される。第7図は本実施例
における電力スペクトルと自己相関係数列との対
応を説明するための図である。図において横軸は
角周波数または周波数標本抽出番号を示し、縦軸
は電力スペクトルを示している。PL(ω)および
PH(ω)は、それぞれ帯域分割された2帯域の中
の低周波領域および高周波領域の電力スペクトル
を示している。これらの電力スペクトルより所要
の自己相関係数列は次式によつて求められる(N
は標本抽出数、Δωは標本抽出の角周波数間隔)。
上式において、第7図を参照して理解されるよ
うに、nは2分割された帯域の低周波領域におけ
る標本抽出数であり、(N−1)−(n−1)=N−
nは前記2分割された帯域の高周波領域における
標本抽出数である。勿論、全帯域に亙る標本抽出
数はNとなる。自己相関計測手段(ACM)90
より抽出される全周波数帯域に亙る自己相関係数
列{ρj}j=1、2……pは、線形予測分析手段
(LPC)91に送られて、次式に対応する連立一
次方程式を解くことにより線形予測パラメータ
{αi}を抽出する。
このαパラメータは音声合成フイルタ
(LPCF)97に送られて、その係数を制御する。
他方、自己相関計測器(ACM)90により抽出
される自己相関係数列{ρj}は予測残差電力算出
手段(RP)92にも出力され、予測残差電力算
出手段(RP)92においては前記自己相関係数
列より平均電力を算出し、また線形予測分析手段
(LPC)91から送られてくるKパラメータより
正規化予測残差電力を算出して、前記平均電力と
の乗算作用により予測残差電力を求めて音声励振
信号乗算手段(VM)96に出力する。分析側よ
り送られてくる音源情報信号による、パルス信号
発生器(PG)93、雑音発生器(NG)94、
有声・無声切替スイツチ(V/UV−S)95の
有機的連携作用により生成される有声音および無
声音に対応する音源信号は音声励振信号乗算手段
(VM)96に入力され、前記予測残差電力との
乗算作用により音声励振信号を発生し音声合成フ
イルタ(LPCF)97に供給される。音声合成フ
イルタ(LPCF)97においては前記αパラメー
タにより係数を制御され、前記音声励振信号によ
つて励振されてデイジタル合成音声信号を発生
し、低域フイルタ/D−A変換器(LPF/D−
A)98を経由して端子108より合成音声信号
を出力する。なお音声合成フイルタ(LPCF)9
7の係数を制御する線形予測パラメータとして本
実施例においてはαパラメータを用いて説明した
が他のパラメータを用いても同様の作用効果が得
られることは言うまでもない。
この第3の実施例においては、第6図より明ら
かなように、合成側における第1の線形予測分析
手段として、前述のとおり各帯域毎の電力スペク
トル算出手段と全帯域に対応する自己相関計測手
段とを備え、これに線形予測分析手段を組合せる
ことにより、前記第1および第2の実施例の合成
側における所要の処理時間に比較して、格段の差
で、その処理時間を短縮できるという効果があ
る。勿論、前記従来例において見られるようなス
ペクトル包絡における不連続性の問題は十分解決
される。
以上詳細に説明したように、本発明の帯域分割
型ボコーダは、合成側において各帯域毎の線形予
測パラメータより全帯域に互る線形予測パラメー
タを抽出して音声合成フイルタを制御する線形予
測分析手段を備えることにより、従来の帯域分割
形ボコーダに見られるスペクトル包絡における境
界周波数での不連続性を除去し、線形予測分析精
度を改善することができるという効果がある。
【図面の簡単な説明】
第1図は従来の帯域分割型ボコーダの一例のブ
ロツク図、第2図は入力音声信号と合成音声信号
とのスペクトル包絡の比較説明図、第3図は本発
明の概念的ブロツク図、第4図、第5図および第
6図はそれぞれ本発明の第1、第2および第3の
実施例のブロツク図、第7図は電力スペクトルと
自己相関係数列との対応関係説明図である。図に
おいて、1,24,51,78……低域フイル
タ/A−D変換器(LPF/A−D)、2,17,
25,40,52,69,79……低域フイルタ
−1(LPF−1)、3−2,18−2,26−2,
41−2,53−2,70−2,80……帯域フ
イルタ−2(BPF−2)、3−3,18−3,2
6−3,41−3,53−3,70−3……帯域
フイルタ−3(BPF−3)、4−2,16−2,
27−2,39−2,54−2,68−2,81
……周波数変換手段−2(FC−2)、4−3,1
6−3,27−3,39−3,54−3,68−
3……周波数変換手段−3(FC−3)、5−2,
28−2,55−2,82……低域フイルタ−2
(LPF−2)、5−3,28−3,55−3……
低域フイルタ−3(LPF−3)、6−1,29−
1,56−1,83−1……デシメーシヨン手段
−1(DM−1)、6−2,29−2,56−2,
83−2……デシメーシヨン手段−2(DM−
2)、6−3,29−3,56−3……デシメー
シヨン手段−3(DM−3)、7−1,30−1,
57−1,84−1……線形予測符号化手段−1
(LE−1)、7−2,30−2,57−2,84
−2……線形予測符号化手段−2(LE−2)、7
−3,30−3,57−3……線形予測符号化手
段−3(LE−3)、8,31,58,85……ピ
ツチ抽出手段(PITCH)、9,32,59,86
……有声・無声判別手段(V/UV)、10,3
3,60,87……符号化手段(CODER)、1
1,34,61,88……復号化手段
(DECODER)、12−1,35−1,62−1
……Kパラメータ/αパラメータ変換手段−1
(K/α−1)、12−2,35−2,62−2…
…Kパラメータ/αパラメータ変換手段−2
(K/α−2)、12−3,35−3,62−3…
…Kパラメータ/αパラメータ変換手段−3
(K/α−3)、13−1,36−1,66−1…
…音声励振信号乗算手段−1(VM−1)、13−
2,36−2,66−2……音声励振信号乗算手
段−2(VM−2)、13−3,36−3,66−
3……音声励振信号乗算手段−3(VM−3)、1
4−1,37−1,65−1……音声合声フイル
タ−1(LPCF−1)、14−2,37−2,65
−2……音声合成フイルタ−2(LPCF−2)、1
4−3,37−3,65−3……音声合成フイル
タ−3(LPCF−3)、15−1,38−1,67
−1……インタポーレーシヨン手段−1(IP−
1)、15−2,38−2,67−2……インタ
ポーレーシヨン手段−2(IP−2)、15−3,
38−3,67−3……インタポーレーシヨン手
段−3(IP−3)、22,45,74……波形信
号加算手段(Σ)、19,42,71,93……
パルス信号発生器、20,44,72,94……
雑音発生器、21,43,73,95……有声・
無声切替スイツチ(V/UV−S)、23,49,
78,98……低域フイルタ/D−A変換器
(LPF/D−A)、46,75……線形予測符号
化手段(LE)、47,76,96……音声励振信
号乗算手段(VM)、48,77,97……音声
合成フイルタ(LPCF)、63−1……正規化予
測残差電力算出手段−1(NRP−1)、63−2
……正規化予測残差電力算出手段−2(NRP−
2)、63−3……正規化予測残差電力算出手段
−3(NRP−3)、64−1……予測残差電力算
出手段−1(RP−1)、64−2……予測残差電
力算出手段−2(RP−2)、64−3……予測残
差電力算出手段−3(RP−3)、89−1……電
力スペクトル算出手段−1(PSC−1)、89−2
……電力スペクトル算出手段−2(PSC−2)、9
0……自己相関計測手段、91……線形予測分析
手段(LPC)、92……予測残差電力算出手段
(RP)、201〜203,502……第1の線形
予測分析手段、101〜108……端子、301
〜304,601……伝送線路、602−1〜
N,603〜606……伝送路、501……復号
化手段、503……音声励振信号発生手段、50
4……全帯域音声合成フイルタ。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声信号を複数の音声伝送帯域に分割し
    それぞれの帯域について線形予測分析を行う帯域
    分割型ボコーダにおいて、分析側から合成側に伝
    送される分割された各周波数帯域毎の線形予測パ
    ラメータより全周波数帯域に亙る線形予測パラメ
    ータを抽出して全周波数帯域に対応する音声合成
    フイルタを制御する第1の線形予測分析手段を合
    成側において備えることを特徴とする帯域分割型
    ボコーダ。 2 前記第1の線形予測分析手段として、分析側
    から合成側に伝送される前記各周波数帯域毎の線
    形予測パラメータと関連電力情報信号とにより制
    御されて各帯域毎に合成音声を出力する合成フイ
    ルタを含む各帯域毎の音声合成手段と、これらの
    各帯域毎の合成信号をその周波数領域を調整した
    後時間軸次元において重畳し、全周波数帯域に亙
    る音声波形信号として出力する音声波形加算手段
    と、この音声波形加算手段の出力信号を入力して
    線形予測分析を行い前記全周波数帯域に亙る線形
    予測パラメータを抽出する第2の線形予測分析手
    段とを備えることを特徴とする前記特許請求の範
    囲第1項記載の帯域分割型ボコーダ。 3 前記第1の線形予測分析手段として、分析側
    から合成側に伝送される前記各周波数帯域毎の線
    形予測パラメータより各帯域毎の正規化予測残差
    電力を抽出する正規化予測残差電力算出手段と、
    分析側から合成側に伝送される前記各周波数帯域
    毎の線形予測パラメータおよび関連電力情報信号
    と前記正規化予測残差電力とにより制御されて各
    帯域毎に合成音声を出力する合成フイルタを含む
    各帯域毎の音声合成手段と、これらの各帯域毎の
    合成信号をその周波数領域を調整した後時間軸次
    元において重畳して全周波数帯域に亙る音声波形
    信号として出力する音声波形加算手段と、この音
    声波形加算手段の出力信号を入力して線形予測分
    析を行い前記全周波数帯域に亙る線形予測パラメ
    ータを抽出する第3の線形予測分析手段とを備え
    ることを特徴とする前記特許請求の範囲第1項記
    載の帯域分割型ボコーダ。 4 前記第1の線形予測分析手段として、分析側
    から合成側に伝送される前記各周波数帯域毎の線
    形予測パラメータと関連電力情報とより各帯域毎
    に電力スペクトルを算出する電力スペクトル算出
    手段と、これらの各帯域毎の電力スペクトルより
    全周波数帯域に亙る音声信号に対応する自己相関
    係数列を抽出する自己相関計測手段と、この自己
    相関係数列より全周波数帯域に亙る線形予測パラ
    メータを抽出する第4の線形予測分析手段とを備
    えることを特徴とする前記特許請求の範囲第1項
    記載の帯域分割型ボコーダ。
JP57104475A 1982-06-17 1982-06-17 帯域分割型ボコ−ダ Granted JPS58220199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57104475A JPS58220199A (ja) 1982-06-17 1982-06-17 帯域分割型ボコ−ダ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57104475A JPS58220199A (ja) 1982-06-17 1982-06-17 帯域分割型ボコ−ダ

Publications (2)

Publication Number Publication Date
JPS58220199A JPS58220199A (ja) 1983-12-21
JPH0229237B2 true JPH0229237B2 (ja) 1990-06-28

Family

ID=14381594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57104475A Granted JPS58220199A (ja) 1982-06-17 1982-06-17 帯域分割型ボコ−ダ

Country Status (1)

Country Link
JP (1) JPS58220199A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2851370C (en) * 2011-11-03 2019-12-03 Voiceage Corporation Improving non-speech content for low rate celp decoder

Also Published As

Publication number Publication date
JPS58220199A (ja) 1983-12-21

Similar Documents

Publication Publication Date Title
Viswanathan et al. Quantization properties of transmission parameters in linear predictive systems
CA1292805C (en) Method of and device for speech signal coding and decoding by parameter extraction and vector quantization techniques
Makhoul et al. LPCW: An LPC vocoder with linear predictive spectral warping
JPH0575296B2 (ja)
US5295224A (en) Linear prediction speech coding with high-frequency preemphasis
KR100389895B1 (ko) 음성 부호화 및 복호화방법 및 그 장치
US4991215A (en) Multi-pulse coding apparatus with a reduced bit rate
JPS6070500A (ja) マルチパルス励振線形予測音声符号化装置
JPH04502675A (ja) 改良されたロングターム予測器を有するデジタル音声コーダ
JPH0439679B2 (ja)
JPH0229237B2 (ja)
US5717819A (en) Methods and apparatus for encoding/decoding speech signals at low bit rates
Esteban et al. 9.6/7.2 kbps voice excited predictive coder (VEPC)
JP3282595B2 (ja) 音声符号化・復号化装置及び通信装置
JP3201268B2 (ja) 音声通信装置
JPH0229239B2 (ja)
JP2560486B2 (ja) マルチパルス符号化装置
Li et al. Analysis-by-synthesis multimode harmonic speech coding at 4 kb/s
JPH0449960B2 (ja)
Hernandez-Gomez et al. On the behaviour of reduced complexity code-excited linear prediction (CELP)
Ni et al. Waveform interpolation at bit rates above 2.4 kb/s
JPS58211795A (ja) 線形予測型音声分析合成装置
JP2973966B2 (ja) 音声通信装置
JPH0235998B2 (ja)
JP2535809B2 (ja) 線形予測型音声分析合成装置