JPS595916B2 - 音声分折合成装置 - Google Patents

音声分折合成装置

Info

Publication number
JPS595916B2
JPS595916B2 JP50018497A JP1849775A JPS595916B2 JP S595916 B2 JPS595916 B2 JP S595916B2 JP 50018497 A JP50018497 A JP 50018497A JP 1849775 A JP1849775 A JP 1849775A JP S595916 B2 JPS595916 B2 JP S595916B2
Authority
JP
Japan
Prior art keywords
feature vector
spectral shape
shape parameter
speech
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP50018497A
Other languages
English (en)
Other versions
JPS5193105A (ja
Inventor
勝信 伏木田
和雄 落合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP50018497A priority Critical patent/JPS595916B2/ja
Publication of JPS5193105A publication Critical patent/JPS5193105A/ja
Publication of JPS595916B2 publication Critical patent/JPS595916B2/ja
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 この発明は音声分析合成装置に関するものである。
音声波形が、かなりの冗長性を特つことを利用して、分
析側で音声波形より、線形予測係数等の特徴的なパラメ
ータを抽出し、合成側において、分析側で得られた特徴
パラメータを用いて音声波形を再生することにより帯域
圧縮を可能とする音声分析合成装置が知られている。ま
たピッチ区間程度の種々の素片波形をあらかじめ用意し
ておき、分析側で抽出された素片名等のパラメータに従
つて、合成側で素片波形を編集合成する型の音声分析合
成装置が知られている。しカルながら、前者は情報量の
圧縮比はせいぜい一程度であり、さらに圧縮率を高める
ためにパラメータの量子化を粗くすると不安定になる欠
点がある。後者においては、パラメータとしては線形予
測係数等の替りに素片名となるので圧縮率は大きくなる
が、合成部において、種々の素片波形を記憶するための
膨大な記憶回路を必要とする欠点がある。以上のものの
他に、あらかじめ、通し番号をつけられた有限個のスペ
クトル形状パラメータ値を分析側、合成側の双方に用意
しておき、分析側で自然音声波形を分析し、各分析区間
において抽出されたスペクトル形状パラメータ値に最も
近いスペクトル形状パラメータ値を分析側に用意されて
いるスペクトル形状パラメータ値のなかから選択し、そ
の番号を合成側に送り、合成側では分析側で得られたス
ペクトル形状パラメータ値の番号に従い、合成側に用意
されているスペクトル形状パラメータ値を参照して合成
波形を生成する型の音声分析合成装置(いわゆるパター
ンマツチングボコーダ)が知られている。し力走ながら
、上記のパターンマツチングボコーダは圧縮率も高く合
成部も比較的小規模であるが、スペクトル形状パラメー
タ値の比較のみで最適なスペクトル形状パラメータ値を
選択することは非常に困難であり、異質な音韻に含まれ
るスペクトル形状パラメータ値を選択する誤りを生じ、
音質が劣下する欠点がある。本発明の目的は、情報量の
圧縮比が大きく、かつ、小規模な合成回路により比較的
高品質な合成音声を生成することを可能とする音声分析
合成装置を提供することにある。
本発明によれば、分析側において、自然音声と自然音声
を表現する文字系列とから、時間正規化マツチングの手
法を用いて、最適なスペクトル形状パラメータ値の番号
系列を生成し、合成側において、あらかじめ用意されて
いる通し番号をつけられたスペクトル形状パラメータ値
を分析側で生成されたスペクトル形状パラメータ値の番
号系列に従つて用いて合成波形を生成することにより、
圧縮比が大きく、小規模な合成回路で、比較的、高品質
な合成音声を生成する音声分析合成装置が得られる。
単語音声波形、文章音声波形のスペクトル形状変化は単
独で発音された単音節程度の音声波形のスペクトル形状
変化を結合して近似してもピツチ変化、持続時間変化等
の韻律的特性力相然音声のままであれば品質の劣下をほ
とんど併なわずに近似できることが知られている。
本発明になる音声分析合成装置は、あらかじめ単音節程
度の自然音声(母音声)より必要とする特徴ベクトル値
とスペクトル形状パラメータ値を抽出し番号付を行なう
前処理部と、自然音声および自然音声を表現する文字系
列とから最極なスベクトル形状パラメータ値の番号系列
およびピツチ、振巾等の合成データを生成する分析部と
、分析部において得られる合成データおよび前処理部に
おいて得られたスペクトル形状パラメータ値より合成波
形を生成する合成部とからなる。
ここでは、説明の簡単のために、スペクトル形状パラメ
ータとしては線形予測係数を用い、母音声としては単音
節を用いて説明する。前処理部においては、単音節波形
をピツチ周期程度毎に分析し、特徴ベクトル(例えば自
己相関係数)と線形予測係数(Ak)を抽出する。
線形予測係数は周知のごとく次の(1),(2)式によ
り求められる。ここで 但し、Sn自然音声波形を表わし、Nは分析区間長を表
わす。
なお、前処理部の処理はあらかじめ一回だけ行なつてお
けばよく、その後は本装置より切り離すことができる。
分析部においては、まず、入力として与えられる自然音
声波形のピツチ周期検出を行ない、検出されたピツチ周
期毎に、振巾および特徴ベクトル値を算出し、特徴ベク
トル値系列(特徴ベクトル値系列−A)を生成する。
一方、自然音声を表わす文字系列(音韻系列)を単音節
系列に分解し、前処理部によりあらかじめ用意されてい
る談単音線の特徴ベクトル値系列を順次結合し、特徴ベ
クトル値系列(特徴ベクトル値系列−B)を生成する。
特徴ベクトル値系列−Bに対応したスペクトル形状パラ
メータ値系列は前述のごとく、入力として与えられた自
然音声のスペクトル形状変化を近似するために充分なも
のを含んでいるが時間的な対応関係がついていないもの
である。
特徴ベクトル値系列−Bを特徴ベクトル値系列−Aに適
合するように時間正規化マツチングさせるためには、動
的計画法を用いて効率よく行なうことができる。特徴ベ
クトル値系列−AをAi(1=1,2・・・,I)特徴
ベクトル値系列−Bを旧j(j=1,2・・・,J)と
表わすと、各特徴ベクトル間の距離の和が最小となるよ
うに最適にマツチングさせるためには、次の漸化式(3
)を解くことにより与えられる。但し、R(1,J)は
A1と旧,の距離を表わす。また、nは整数でマツチン
グの際の制約条件を与える。
始端、終端はそれぞれ(1,1),(1,J)とする。
最適スペクトル形状パラメータ値系列を指定する番号系
列は(3)式を満足する経路(1,j)により与えられ
る。
以上のごとぐして得られた番号系列はパターンマツチン
グボコーダ方式により与えられるスペクトル形状パラメ
ータ値を指定する番号に比較して、選択される範囲が談
単音節のスベクトル形状パラメータ値に限定されるため
に、他の音韻に対応するスペクトル形状パラメータ値が
選ばれる恐れはなく音質がよいことは明らかである。合
成部においては、上述のごとく、分析部において得られ
るピツチ周期データ、振巾データ、スベクトル形状パラ
メータ値の番号系列に従い合成波形を生成する。
合成波形の生成は、前処理部により、あらかじめ用意さ
れている線形予測係数のなかから、スペクトル形状パラ
メータ値の番号系列に従い、ピツチ周期毎に談当する線
形予測係数を引き出し、次の(4)式のごとく算出され
る。ここで、Sn′は合成波形を表わし、右辺の第2項
は振巾データ(dおよびピツチ周期データ(βにより決
定される音源波形を表わす。この方式によれば、ピツチ
区間程度の素片波形をそのまま合成部に記憶しておく方
式に比べて記憶容量が小さくなり合成部の規模が縮少さ
れることは明らかである。
次に図を用いて説明する。
図は本発明の一実施例を示すプロツク図である。まず、
前処理として、単音節波形と単音節名がそれぞれ単音節
波形入力端子1および単音節名人力端子2より特徴パラ
メータ抽出装置3に入力され、単音節波形より特徴ベク
トル値系列と線形予測係数値系列を算出し、特徴ベクト
ル値系列を単音節名および各特徴ベクトル値の番号と共
に特徴ベクトル入力端子6より分析部4内の特徴ベクト
ル記憶回路10に記憶させ、線形予測係数値系列を各線
形予測係数値の番号と共に線形予測係数値入力端子7よ
り合成部5内の線形予測係数値記憶回路16に記憶させ
る。
分析部6においては文字系列が文字系列入力端子8より
予備合成回路11に入力され、自然音声波形は自然音声
波形入力端子9よりピツチ同期分析回路12に入力され
る。
予備合成回路11では文字系列を単音節系列に変換し、
該単音節の特徴ベタトル値系列を順次特徴ベクトル記憶
回路10より引き出し、結合合成された特徴ベクトル値
系列を時間正規化マツチング回路13に入力する。ピツ
チ同期分析回路12は自然音声波形よりピツチ周期の検
出を行ない、ピツチ周期毎に振巾および特徴ベクトル値
を算出し、特徴ベクトル値系列を時間正規化マツチング
回路13に入力し、ピツチ、振巾データをピツチ振巾デ
ータ出力端子15より出力する。時間正規化マツチング
回路13は予備合成回路11より入力される特徴ベクト
ル値系列とピツチ同期分析回路12より入力される特徴
ベクトル値系列に対して(3)式で示される漸化式を算
出し、最適なスペクトル形状パラメータ値の番号系列を
スペクトル形状パラメータ番号系列出力端子14より出
力する。合成部5においては、まずピツチ振巾データ出
力端子15より出力されるピツチデータおよびスベクト
ル形状パラメータ番号系列出力端子14より出力される
スペクトル形状パラメータ値の番号系列が線形予測係数
記憶回路16に入力され、ピツチ周期毎に該線形予測係
数値を出力する。
合成波形生成回路17はピツチ振巾データ出力端子15
より出力されるピツチデータおよび服巾データにより制
御され、線形予測係数記憶回路16より入力される線形
予測係数値により(4)式で示される合成波形を算出し
、合成波形出力端子18より合成波形を出力する。以上
の説明においては、前処理部において特徴ベクトルおよ
びスペクトル形状パラメータを抽出するための自然音声
(母音声)として単音節波形を用いたが、母音声として
言われるVCV型(は母音、Cは子音を表わす)の音声
波形あるいは単語音声波形を用いても同様の手段により
同様の効果を持つ音声分析合成装置が実現できることは
明らかである。
【図面の簡単な説明】
図は本発明の音声分析合成装置の一実施例を示すプロツ
ク図である。 図において、1は単音節波形入力端子、2は単音節名人
力端子、3は特徴パラメータ抽出装置、4は分析部、5
は合成部、6は特徴ベクトル入力端子、7は線形予測係
数入力端子、8は文字系列入力端子、9は自然音声波形
入力端子、10は特徴ベクトル記憶回路、11は予備合
成回路、12はピツチ同期分析回路、13は時間正規化
マツチング回路、14はスペクトル形状パラメータ番号
系列出力端子、15はピツチ振巾データ出力端子、16
は線形予測係数記憶回路、17は合成波形生成回路、1
8は合成波形出力端子である。

Claims (1)

    【特許請求の範囲】
  1. 1 文字系列に従つて単音節のスペクトル形状パラメー
    タ値系列を時系列的に配列して得られるスペクトル形状
    パラメータ値系列を用いて合成波形を生成する型の音声
    分析合成装置において、合成部に用意されているスペク
    トル形状パラメータ値に対応する特徴ベクトル値を記憶
    する特徴ベクトル記憶回路と、自然音声より生成された
    特徴ベクトル値系列と自然音声を表現する文字系列によ
    り特徴ベクトル記憶回路を制御し生成された特徴ベクト
    ル値系列とを時間正規化マッチングさせることにより最
    適スペクトル形状パラメータ値系列を指定する番号系列
    を生成する手段とを有することを特徴とする音声分析合
    成装置。
JP50018497A 1975-02-13 1975-02-13 音声分折合成装置 Expired JPS595916B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP50018497A JPS595916B2 (ja) 1975-02-13 1975-02-13 音声分折合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP50018497A JPS595916B2 (ja) 1975-02-13 1975-02-13 音声分折合成装置

Publications (2)

Publication Number Publication Date
JPS5193105A JPS5193105A (ja) 1976-08-16
JPS595916B2 true JPS595916B2 (ja) 1984-02-07

Family

ID=11973246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50018497A Expired JPS595916B2 (ja) 1975-02-13 1975-02-13 音声分折合成装置

Country Status (1)

Country Link
JP (1) JPS595916B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63156089U (ja) * 1987-03-31 1988-10-13
JPS6340989Y2 (ja) * 1984-09-20 1988-10-26
JPH0316650Y2 (ja) * 1987-12-23 1991-04-10
JPH0418533U (ja) * 1990-06-07 1992-02-17

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5592061A (en) * 1979-01-06 1980-07-12 Yasuo Matsuyama Coder using digital reverse filter group and decoder for it
WO1984004194A1 (en) * 1983-04-12 1984-10-25 American Telephone & Telegraph Speech pattern processing utilizing speech pattern compression
IT1180126B (it) * 1984-11-13 1987-09-23 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante tecniche di quantizzazione vettoriale
IT1184023B (it) * 1985-12-17 1987-10-22 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica
JP3507686B2 (ja) 1998-01-16 2004-03-15 日本電気株式会社 音声認識機能を有する通信装置及び通信方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6340989Y2 (ja) * 1984-09-20 1988-10-26
JPS63156089U (ja) * 1987-03-31 1988-10-13
JPH0316650Y2 (ja) * 1987-12-23 1991-04-10
JPH0418533U (ja) * 1990-06-07 1992-02-17

Also Published As

Publication number Publication date
JPS5193105A (ja) 1976-08-16

Similar Documents

Publication Publication Date Title
US10535336B1 (en) Voice conversion using deep neural network with intermediate voice training
US4220819A (en) Residual excited predictive speech coding system
US5682502A (en) Syllable-beat-point synchronized rule-based speech synthesis from coded utterance-speed-independent phoneme combination parameters
JP2787179B2 (ja) 音声合成システムの音声合成方法
JP2782147B2 (ja) 波形編集型音声合成装置
EP2109096B1 (en) Speech synthesis with dynamic constraints
JPH0833744B2 (ja) 音声合成装置
Rabiner et al. Computer synthesis of speech by concatenation of formant-coded words
JPS595916B2 (ja) 音声分折合成装置
JP2001117582A (ja) 音声処理装置およびカラオケ装置
JP3109778B2 (ja) 音声規則合成装置
JPH05224689A (ja) 音声合成装置
JP3394281B2 (ja) 音声合成方式および規則合成装置
Anil et al. Expressive speech synthesis using prosodic modification for Marathi language
JP7280605B2 (ja) 音声処理装置、および音声処理方法
JP6552146B1 (ja) 音声処理装置、および音声処理方法
JP2709198B2 (ja) 音声合成方法
JPH0358100A (ja) 規則型音声合成装置
JP2001154683A (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
KR0133467B1 (ko) 한국어 음성 합성기의 벡터 양자화 방법
JPH0258640B2 (ja)
JP2907828B2 (ja) 音声対話型文書作成装置
JP2942260B2 (ja) 音声合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPH09258796A (ja) 音声合成方法