JPS58211796A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPS58211796A JPS58211796A JP57095927A JP9592782A JPS58211796A JP S58211796 A JPS58211796 A JP S58211796A JP 57095927 A JP57095927 A JP 57095927A JP 9592782 A JP9592782 A JP 9592782A JP S58211796 A JPS58211796 A JP S58211796A
- Authority
- JP
- Japan
- Prior art keywords
- filter
- spectrum
- sound source
- speech synthesis
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は音声合成装置に関する複数のチャンネルフィル
タで構成されるチャンネルフィルタバンクを用い、音声
の各チャンネルフィルタに対応する周波数成分の大きさ
を検出し、これによシ音声の゛スペクトル包絡の情報を
得て、これを音声の情報量圧縮に利用するチャンネルボ
コーダあるいは音声分析合成装置が従来よシ用いられて
いる。
タで構成されるチャンネルフィルタバンクを用い、音声
の各チャンネルフィルタに対応する周波数成分の大きさ
を検出し、これによシ音声の゛スペクトル包絡の情報を
得て、これを音声の情報量圧縮に利用するチャンネルボ
コーダあるいは音声分析合成装置が従来よシ用いられて
いる。
しかしながら、このようなチャンネルボコーダは音声の
各周波数成分を態別のチャンネルフィルタで抽出するた
め、これを合成して生ずる出力側における再生音声は、
そのスペクトルが各フィルタの境界周波数ごとに不連続
になり、これが再生音声の品質を劣化1〜、チャンネル
ボコーダの最大の欠点となっている。
各周波数成分を態別のチャンネルフィルタで抽出するた
め、これを合成して生ずる出力側における再生音声は、
そのスペクトルが各フィルタの境界周波数ごとに不連続
になり、これが再生音声の品質を劣化1〜、チャンネル
ボコーダの最大の欠点となっている。
本発明の目的は従来装置のもつ上述の欠点を除去するに
ある。
ある。
本発明の装置は、チャンネルフィルタバンクを用いて抽
出された各周波数スペクトラム成分に関する情報を入力
しこれを用いて音声合成を行なう音声合成装置であって
、前記各周波数漬ペクトラム成分に関するパワースペク
トラムを求める手段と、前記パワースペクトラムをフー
リエ逆変換しさらに線形予測分析合成を行うことによシ
位相連続な音声合成フィ/lz夕を構成する手段とを有
する。
出された各周波数スペクトラム成分に関する情報を入力
しこれを用いて音声合成を行なう音声合成装置であって
、前記各周波数漬ペクトラム成分に関するパワースペク
トラムを求める手段と、前記パワースペクトラムをフー
リエ逆変換しさらに線形予測分析合成を行うことによシ
位相連続な音声合成フィ/lz夕を構成する手段とを有
する。
次に、図面を参照して本発明の詳細な説明する。
図は本発明の音声合成装置の一実施例を含む音声分析合
成装置の一例を示すブロック図でおる。
成装置の一例を示すブロック図でおる。
図の音声分析合成装置は、音声分析側1.音声合成側2
.および伝送路3からなシ、この中の音声合成側2.が
本発明の音声合成装置の一実施例を示す。
.および伝送路3からなシ、この中の音声合成側2.が
本発明の音声合成装置の一実施例を示す。
さて、音成分性側1は、Nこの帯域フィルタHPF’−
1〜HPF−Nから構成されるチャンネルフィルタバン
ク101、前記チャンネルフィルタバンク101の各帯
域フィルタ対応に設けられたN個の検波器を含む検波器
群102、前記検波器群102の各検波器対応に設けら
れたN個の低域フィルタを含む低域フィルタ群’103
、スペクトラム情報符号化器104、音源パラメータ分
析器105および音源情報符号化器106を含み、また
、音声合成側2U、スペクトラム情報復号化201、N
このスペクトラム電力計算器よりなるスペクトラム電力
計算器群202、自己相関係数演算器203、線形予測
分析器204、LPC音声合成フィルタ205、音源情
報復号化器206、音源励振信号発生器207を含み、
また伝送路3はスペクトラム情報伝送路301および音
源情報伝送路302を含んでいる。
1〜HPF−Nから構成されるチャンネルフィルタバン
ク101、前記チャンネルフィルタバンク101の各帯
域フィルタ対応に設けられたN個の検波器を含む検波器
群102、前記検波器群102の各検波器対応に設けら
れたN個の低域フィルタを含む低域フィルタ群’103
、スペクトラム情報符号化器104、音源パラメータ分
析器105および音源情報符号化器106を含み、また
、音声合成側2U、スペクトラム情報復号化201、N
このスペクトラム電力計算器よりなるスペクトラム電力
計算器群202、自己相関係数演算器203、線形予測
分析器204、LPC音声合成フィルタ205、音源情
報復号化器206、音源励振信号発生器207を含み、
また伝送路3はスペクトラム情報伝送路301および音
源情報伝送路302を含んでいる。
音声分析側1の入力端子1000から入力する音声信号
は、チャンネルフィルタバンク101ON個の帯域フィ
ルタHPF−1〜BPF−Nおよび音源パラメータ分析
器105に供給きれる。
は、チャンネルフィルタバンク101ON個の帯域フィ
ルタHPF−1〜BPF−Nおよび音源パラメータ分析
器105に供給きれる。
チャンネルフィルタバンク101i1:、 音7’ 帯
域の例えば3.4 K 1−1zを、はぼ等間隔のN個
の帯域に分割し、かくして分割されたそれぞれの帯域の
スペクトラム成分(周波数成分)だけの通過を許すより
なNこの帯域フィルタから構成されている。
域の例えば3.4 K 1−1zを、はぼ等間隔のN個
の帯域に分割し、かくして分割されたそれぞれの帯域の
スペクトラム成分(周波数成分)だけの通過を許すより
なNこの帯域フィルタから構成されている。
従って、チ・、ンネルフィルタバンク101の各帯域フ
ィルタの出力には、入力音声1h号のその周波数帯域成
分に相当する振巾と周波数をもつ振動波形が現われる。
ィルタの出力には、入力音声1h号のその周波数帯域成
分に相当する振巾と周波数をもつ振動波形が現われる。
これらの各波形は検波器群102の各検波器に供給され
、ここでそれぞれ包絡線検除かれ、その結果、低域フィ
ルタ群103の各低域フィルタの出力には、入力背戸信
号周波数スペクト2ムの各周波数における成分に比例す
る出力が得られる。
、ここでそれぞれ包絡線検除かれ、その結果、低域フィ
ルタ群103の各低域フィルタの出力には、入力背戸信
号周波数スペクト2ムの各周波数における成分に比例す
る出力が得られる。
この各出力は、スペクトラム情報符号化器104におい
て量子化され、さらに符号化されて、スペクトラム情報
伝送路301をブrシフ、音成合成側2に伝送される。
て量子化され、さらに符号化されて、スペクトラム情報
伝送路301をブrシフ、音成合成側2に伝送される。
一方、音源パラメータ分析器105は、供給された音声
信号よりピッチ周波数、有声/無声判別信号および短時
間平均電力から構成される音源情報を計測し、音源情報
符号化器106に供給する。
信号よりピッチ周波数、有声/無声判別信号および短時
間平均電力から構成される音源情報を計測し、音源情報
符号化器106に供給する。
符号化器106はこの音源情報を量子化し符号化して、
音源情報伝送路302を介し音声合成側2に伝送する。
音源情報伝送路302を介し音声合成側2に伝送する。
音声合成側2においては、スペクトラム情報伝送路30
1を介して伝送された、符号化されたスペクトラム情報
は、スペクトラム情報復号化器201で復号化され、そ
のN個の出力端子に、伝送された音声信号の周波数スペ
クトラムの各周波数における成分に比例するデータが現
われ、これらのデータはスペクトラム電力計測器群20
2の対応するスペクトラム亀力計測器に供給される。こ
れらの各電力計測器は、入力するデータを2乗すること
により各周波数における箪カスペクトラム成分データに
変換し、これを自己相関係数演算器203に供給する。
1を介して伝送された、符号化されたスペクトラム情報
は、スペクトラム情報復号化器201で復号化され、そ
のN個の出力端子に、伝送された音声信号の周波数スペ
クトラムの各周波数における成分に比例するデータが現
われ、これらのデータはスペクトラム電力計測器群20
2の対応するスペクトラム亀力計測器に供給される。こ
れらの各電力計測器は、入力するデータを2乗すること
により各周波数における箪カスペクトラム成分データに
変換し、これを自己相関係数演算器203に供給する。
自己相関係数演算器203は、こうして供給された各周
波数における電カスペクトラム成分データを用いて、適
当な内挿を行なうことにより必要な周波数範囲の電力周
波数スペクトラムを近似し、これを逆7−リエ変換する
ことによシ、必要な遅れ時間の範囲で所定の遅れ時間ご
との自己相関係数を演算し、これを線形予測分析器20
4に供給する。
波数における電カスペクトラム成分データを用いて、適
当な内挿を行なうことにより必要な周波数範囲の電力周
波数スペクトラムを近似し、これを逆7−リエ変換する
ことによシ、必要な遅れ時間の範囲で所定の遅れ時間ご
との自己相関係数を演算し、これを線形予測分析器20
4に供給する。
線形予測分析器204は、供給された自己相関係数より
、例えはDurbin (ダービン)法を用いて線形予
測パラメータであるαパラメータを演算によシ求め、こ
れを出力ライン2040を介して、LPC音声合成フィ
ルタ205のフィルタ係数として供給する。
、例えはDurbin (ダービン)法を用いて線形予
測パラメータであるαパラメータを演算によシ求め、こ
れを出力ライン2040を介して、LPC音声合成フィ
ルタ205のフィルタ係数として供給する。
一方、音源情報復号化器206は、音源情報伝送路30
2を介して伝送されたl音源情報を信号し、これを音源
励振信号発生器に207に供給する。
2を介して伝送されたl音源情報を信号し、これを音源
励振信号発生器に207に供給する。
音源励振信号発生器207は、供給された音源情報テー
ク(ピッチ周波数テーク、有声/無声判別データ、およ
び短時間平均電力データ)を用いて公知の方法によシフ
ィルタ励振信号データを発生し、これを出力ライン20
70を介しLPC音声合成フィルタ205のフィルタ励
振信号として供給する。
ク(ピッチ周波数テーク、有声/無声判別データ、およ
び短時間平均電力データ)を用いて公知の方法によシフ
ィルタ励振信号データを発生し、これを出力ライン20
70を介しLPC音声合成フィルタ205のフィルタ励
振信号として供給する。
・LPG音声合成フィルタ205は、ライン2゜40を
介して供給された前記αパラメータによるフィルタ係数
と、ライン2070を介して供給された前記フィルタ励
振信号とを用いて音声を合成し、波形出力端子2000
に出力する。なお、フィルタ205は巡回型フィルタと
して容易に構成できる。
介して供給された前記αパラメータによるフィルタ係数
と、ライン2070を介して供給された前記フィルタ励
振信号とを用いて音声を合成し、波形出力端子2000
に出力する。なお、フィルタ205は巡回型フィルタと
して容易に構成できる。
さて、よく知られtいるように、αパラメーータを用い
たLPC音声合成フィルタの伝達特性をH(Z)とする
と、H(Z)は (但し、PはLPCフィル、メの次数、Gは利得を表す
定数、また侑はαパラメータの各成分をそれぞれ表わす
。)という形の全極型モデルによって表わされる。これ
よυ周波数fにおけるこのフィルタの伝達特性は、τを
標本化周期とすると、1庫1 となる。
たLPC音声合成フィルタの伝達特性をH(Z)とする
と、H(Z)は (但し、PはLPCフィル、メの次数、Gは利得を表す
定数、また侑はαパラメータの各成分をそれぞれ表わす
。)という形の全極型モデルによって表わされる。これ
よυ周波数fにおけるこのフィルタの伝達特性は、τを
標本化周期とすると、1庫1 となる。
(2)式よシ明らかなように、H()の分母は、一般に
は無限大まだは零の値をとらず、従って伝達特性はfに
関して連続な関数となる。
は無限大まだは零の値をとらず、従って伝達特性はfに
関して連続な関数となる。
合成側におけるこのような伝達特性をもつLPCフィル
タの使用と、上述の電力周波数スペクト2ムの近似とに
よシ、本実施例の出力合成音声は従来のチャンネルボコ
ーダの最大の欠点であるスペクトルの不連続性が除かれ
、これにもとすく品質劣化が緩和される。
タの使用と、上述の電力周波数スペクト2ムの近似とに
よシ、本実施例の出力合成音声は従来のチャンネルボコ
ーダの最大の欠点であるスペクトルの不連続性が除かれ
、これにもとすく品質劣化が緩和される。
なお、上述の実施例においては、スペクトラム情報と音
源情報との祠号化、伝送およびゆ号化を判別に取υ扱っ
たが、勿論、共通の符号化器、伝送路および彷号化器を
用いて共通に処理することもできる。
源情報との祠号化、伝送およびゆ号化を判別に取υ扱っ
たが、勿論、共通の符号化器、伝送路および彷号化器を
用いて共通に処理することもできる。
以上述べたように、本発明を用いるとチャンイルボコー
ダの品質向上を達成できる。
ダの品質向上を達成できる。
図は本発明の音声合成装置の一実施例を含む音声分析合
成装置の一例を示すブロック図である。 図において、1・・・・・・音声分析側、2・・・・・
・音声合声側、3・・・・・・伝送路、101・・・・
・・チャンネルフィルタバンク、102・・・・・・検
波器群、103・・・・・・低域フィルタp、104・
・・・・・スペクトラム情報符号化器、105・・・・
・・音源パラメータ分析器、106・・・・・・音源情
報符号化器、201・・・・・・スペクトラム情報イ支
号化器、202・・・・・・スペクトラム電力計測器群
、203・・・・・・自己相関係数演算器、2o4・・
・・・・線形予測分析器、2o5・・・・・・LPC音
声合成フィルタ、206・・・・・・音源情報復号化器
、2o7・・・・・・励振信号発生器、301・・・・
・・スペクトラム情報伝送路、302・・・・・・音源
情報伝送路。
成装置の一例を示すブロック図である。 図において、1・・・・・・音声分析側、2・・・・・
・音声合声側、3・・・・・・伝送路、101・・・・
・・チャンネルフィルタバンク、102・・・・・・検
波器群、103・・・・・・低域フィルタp、104・
・・・・・スペクトラム情報符号化器、105・・・・
・・音源パラメータ分析器、106・・・・・・音源情
報符号化器、201・・・・・・スペクトラム情報イ支
号化器、202・・・・・・スペクトラム電力計測器群
、203・・・・・・自己相関係数演算器、2o4・・
・・・・線形予測分析器、2o5・・・・・・LPC音
声合成フィルタ、206・・・・・・音源情報復号化器
、2o7・・・・・・励振信号発生器、301・・・・
・・スペクトラム情報伝送路、302・・・・・・音源
情報伝送路。
Claims (1)
- チャーンネルフィルタバンクを用いて抽出された各周波
数スペクトラム成分に関する情報を入力しこれを用いて
音声合成を行なう音声合成装置において、前記各周波数
スペクトラム成分に関するパワースペクトラムを求める
手段と、前記パワースペクトラムを7−リエ逆変換しさ
らに線形予測分析合成を行うことによシ位相連続な音声
合成フィルタを構成する手段とを有することを特徴とす
る音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57095927A JPS58211796A (ja) | 1982-06-04 | 1982-06-04 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57095927A JPS58211796A (ja) | 1982-06-04 | 1982-06-04 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS58211796A true JPS58211796A (ja) | 1983-12-09 |
JPH0229233B2 JPH0229233B2 (ja) | 1990-06-28 |
Family
ID=14150902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57095927A Granted JPS58211796A (ja) | 1982-06-04 | 1982-06-04 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58211796A (ja) |
-
1982
- 1982-06-04 JP JP57095927A patent/JPS58211796A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPH0229233B2 (ja) | 1990-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5305421A (en) | Low bit rate speech coding system and compression | |
CA2140329C (en) | Decomposition in noise and periodic signal waveforms in waveform interpolation | |
EP0566131B1 (en) | Method and device for discriminating voiced and unvoiced sounds | |
JPH079600B2 (ja) | 音声信号の符号化及び復号化のための方法及び装置 | |
US6678655B2 (en) | Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope | |
US4791670A (en) | Method of and device for speech signal coding and decoding by vector quantization techniques | |
US3681530A (en) | Method and apparatus for signal bandwidth compression utilizing the fourier transform of the logarithm of the frequency spectrum magnitude | |
JPS6070500A (ja) | マルチパルス励振線形予測音声符号化装置 | |
US4991215A (en) | Multi-pulse coding apparatus with a reduced bit rate | |
JPH10149199A (ja) | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 | |
KR0155315B1 (ko) | Lsp를 이용한 celp보코더의 피치 검색방법 | |
JPS58211796A (ja) | 音声合成装置 | |
US4914702A (en) | Formant pattern matching vocoder | |
JP2605256B2 (ja) | Lspパタンマツチングボコーダ | |
JPS6162100A (ja) | マルチパルス型符号化復号化装置 | |
JP3398968B2 (ja) | 音声分析合成方法 | |
JPH0235994B2 (ja) | ||
JPH0650440B2 (ja) | Lsp型パタンマツチングボコ−ダ | |
KR0138878B1 (ko) | 보코더용 피치검색 처리시간 단축법 | |
JPS62278598A (ja) | 帯域分割型ボコ−ダ | |
JPS5941597B2 (ja) | 音声分析合成装置 | |
JPH05281995A (ja) | 音声符号化方法 | |
JPH08160993A (ja) | 音声分析合成器 | |
McAulay et al. | Sinewave amplitude coding using line spectral frequencies | |
Chang et al. | Perceptual quantisation of LPC excitation parameters |