JP2866086B2 - 残差駆動型音声合成方式 - Google Patents

残差駆動型音声合成方式

Info

Publication number
JP2866086B2
JP2866086B2 JP60236930A JP23693085A JP2866086B2 JP 2866086 B2 JP2866086 B2 JP 2866086B2 JP 60236930 A JP60236930 A JP 60236930A JP 23693085 A JP23693085 A JP 23693085A JP 2866086 B2 JP2866086 B2 JP 2866086B2
Authority
JP
Japan
Prior art keywords
waveform
residual
sound source
time length
synthesis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP60236930A
Other languages
English (en)
Other versions
JPS6295600A (ja
Inventor
博雄 北川
昭一 佐々部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60236930A priority Critical patent/JP2866086B2/ja
Publication of JPS6295600A publication Critical patent/JPS6295600A/ja
Application granted granted Critical
Publication of JP2866086B2 publication Critical patent/JP2866086B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、残差駆動による音声合成方式、より詳細に
は、高品質の合成音声を得るための駆動波形生成方式に
関する。 従来技術 音声の分析合成方式においては、その生成モデルに基
づき、スペクトルパラメータ(LPC,PARCOR,LSPなど)と
音源信号を音声合成フィルタに与えて合成音声を得てい
る。スペクトルパラメータは、声道特性を全極モデルで
近似することによつて得られるものであり、このモデル
に立脚すれば、残差波形のスペクトルは白色化される。
従つて、有声音部の音源信号にはインパルス列、無声音
部の音源信号には白色雑音が多く用いられてきた。しか
しながら、実際の音声生成過程は、全極モデルとは一致
しないため、残差波形のスペクトルは、完全に白色化さ
れることはなく、無声音部の音源として白色雑音を用い
た場合、十分な音質が得られないという欠点がある。 目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、無声音部の音源に残差波形を用いることによ
って、高品質な合成音声を得ることを目的としてなされ
たものである。 構成 本発明は、上記目的を達成するために、(1)、音声
の生成モデルに基づき、スペクトル情報と音源情報とか
ら、ピッチ周期を持たない無声音を合成する音声分析合
成方法において、合成器の逆フィルタから抽出される残
差波形を入力する残差波形入力手段と、無声音部の定常
部の残差波形から一定時間長の波形を切り出す区間切出
し手段と、前記無声音部の残差波形から切り出された一
定時間長の波形をフーリエ変換,ランダム位相化,逆フ
ーリエ変換することによって得られる時間波形を伸縮処
理して音源波形を出力する音源波形出力手段とから成る
こと、又は、(2)、音声の生成モデルに基づき、スペ
クトル情報と音源情報とから、ピッチ周期を持たない無
声音を合成する音声分析合成方法において、合成器の逆
フィルタから抽出される残差波形を入力する残差波形入
力手段と、無声音部の定常部の残差波形から一定時間長
の波形を切り出す区間切出し手段と、該区間切出し手段
により切り出された残差波形を正規化する正規化手段
と、該正規化手段により正規化された波形を伸縮処理し
て音源波形を出力する音源波形出力手段とから成り、前
記一定時間長の残差波形をランダムな位置,長さで切り
出して接続することによって前記伸縮処理を行うこと、
又は、(3)、音声の生成モデルに基づき、スペクトル
情報と音源情報とから、ピッチ周期を持たない無声音を
合成する音声分析合成方法において、合成器の逆フィル
タから抽出される残差波形を入力する残差波形入力手段
と、無音声部の定常部の残差波形から一定時間長の波形
を切り出す区間切出し手段と、該区間切出し手段により
切り出された残差波形を正規化する正規化手段と、該正
規化手段により正規化された波形を伸縮処理して音源波
形を出力する音源波形出力手段とから成り、前記一定時
間長の残差波形を任意の位置で折り返して接続すること
によって伸縮処理を行うこと、又は、(4)、音声の生
成モデルに基づき、スペクトル情報と音源情報とから、
ピッチ周期を持たない無声音を合成する音声分析合成方
法において、合成器の逆フィルタから抽出される残差波
形を入力する残差波形入力手段と、無声音部の定常部の
残差波形から一定時間長の波形を切り出す区間切出し手
段と、該区間切出し手段により切り出された残差波形を
正規化する正規化手段と、該正規化手段により正規化さ
れた波形を伸縮処理して音源波形を出力する音源波形出
力手段とから成り、前記無声音部の残差波形から切り出
された一定時間長の波形のスペクトルをランダム位相化
した波形を数パターン作成し、該パターンを接続して十
分長い波形を生成し、該波形の任意の位置から必要とさ
れる長さを切り出して駆動音源とすることを特徴とした
ものである。以下、本発明の実施例に基いて説明する。 第1図は、駆動音源作成用の一定時間長の音源波形を
生成するための一実施例を説明するための図で、図中、
1は残差波形入力部、2は区間切出し部、3は振幅正規
化部、4は音源波形出力部で、無声音部の定常部から一
定時間長の残差波形を切出し(波形A)、その振幅を正
規化して音源波形(波形B)とするものである。ただ
し、振幅正規化は、合成音声のパワー制御を容易にする
ために行うものであり、必ずしも必要ではない。 第2図は、他の実施例を示す図で、図中、5はFFT、
6はランダム位相化部、7は逆FFT、その他第1図と同
様の作用をする部分には、第1図の場合と同一の参照番
号が付してある。而して、この実施例は、区間切出しさ
れた残差波形にフーリエ変換,ランダム位相化,逆フー
リエ変換の処理を施して音源波形を生成するもので、ス
ペクトルのランダム位相化によって、振幅の正規化も同
時に行われる。 第3図は、一定時間長の音源波形に伸縮処理を施して
駆動音源を生成するための実施例を説明するための図
で、この実施例は、音源波形(A),(B),(C)の
任意の位置から任意の長さの波形をいくつか切出し、こ
れらを接続して目的とする時間長に一致する駆動音源
(D)を生成するものである。この際、切出す波形の位
置と長さのいずれか一方は、固定でもよいが、音源波形
の同じ部分が長時間繰返されないようにすることが重要
である。同一部分の繰返しは、波形のランダム性を損
い、繰返し周期が合成音声中に含まれてしまうことにな
る。なお、音源波形の接続部は、荷重平均等滑らかに波
形をつなぐための処理を施してもよい。また、駆動音源
のパワーは、合成音声のパワーに合わせて自由に制御し
てよい。 第4図は、他の実施例を説明するための図で、この実
施例は、音源波形(A)〜(C)の任意の位置で波形を
折返して接続する操作を数回繰返し、目的とする時間長
に一致する駆動音源(D)を生成するものである。この
操作により、接続部における連続性が確保されることに
なる。なお、波形の折返しとは、時間軸の向きを反転さ
せることに相当する。 第5図は、本発明の他の実施例を説明するための図
で、図中、11は切出し残差部、121〜123はランダム位相
化部、131〜133は音源波形部で、この実施例は、切出さ
れた残差波形に複数のランダム位相化処理を施し、これ
らの波形をあらかじめ接続しておくことによつて、十分
に長い音源波形(A)を作成しておき、この波形の任意
の部分を切り出して駆動音源(B)を生成するものであ
る。以上によつて、無声音部における残差スペクトルを
保存した音声合成が達成できる。 効果 以上の説明から明らかなように、本発明によると、残
差波形に含まれるスペクトル情報が駆動音源に保存され
るため、白色雑音による駆動に比較して、より明瞭性,
自然性に優れた高品質の合成音声が得られる。
【図面の簡単な説明】 第1図乃至第5図は、それぞれ本発明の実施例を説明す
るための図である。 1……残差波形部、2……区間切出し部、3……振幅正
規化部、4……音源波形部、5……FFT、6……ランダ
ム位相化部、7……逆FFT、11……切出し残差部、121
123……ランダム位相化部、131〜133……音源波形部。
フロントページの続き (56)参考文献 特開 昭58−154000(JP,A) 特開 昭59−172690(JP,A) 特開 昭59−61891(JP,A) 特開 昭58−88798(JP,A) 特開 昭57−104198(JP,A) 特公 昭55−36155(JP,B2) 特公 昭59−5917(JP,B2) 特公 昭59−14752(JP,B2) (58)調査した分野(Int.Cl.6,DB名) G10L 7/00 - 7/06,9/14

Claims (1)

  1. (57)【特許請求の範囲】 1.音声の生成モデルに基づき、スペクトル情報と音源
    情報とから、ピッチ周期を持たない無声音を合成する音
    声分析合成方法において、合成器の逆フィルタから抽出
    される残差波形を入力する残差波形入力手段と、無声音
    部の定常部の残差波形から一定時間長の波形を切り出す
    区間切出し手段と、前記無声音部の残差波形から切り出
    された一定時間長の波形をフーリエ変換,ランダム位相
    化,逆フーリエ変換することによって得られる時間波形
    を伸縮処理して音源波形を出力する音源波形出力手段と
    から成ることを特徴とする残差駆動型音声合成方法。 2.音声の生成モデルに基づき、スペクトル情報と音源
    情報とから、ピッチ周期を持たない無声音を合成する音
    声分析合成方法において、合成器の逆フィルタから抽出
    される残差波形を入力する残差波形入力手段と、無声音
    部の定常部の残差波形から一定時間長の波形を切り出す
    区間切出し手段と、該区間切出し手段により切り出され
    た残差波形を正規化する正規化手段と、該正規化手段に
    より正規化された波形を伸縮処理して音源波形を出力す
    る音源波形出力手段とから成り、前記一定時間長の残差
    波形をランダムな位置,長さで切り出して接続すること
    によって前記伸縮処理を行うことを特徴とする残差駆動
    型音声合成方法。 3.音声の生成モデルに基づき、スペクトル情報と音源
    情報とから、ピッチ周期を持たない無声音を合成する音
    声分析合成方法において、合成器の逆フィルタから抽出
    される残差波形を入力する残差波形入力手段と、無声音
    部の定常部の残差波形から一定時間長の波形を切り出す
    区間切出し手段と、該区間切出し手段により切り出され
    た残差波形を正規化する正規化手段と、該正規化手段に
    より正規化された波形を伸縮処理して音源波形を出力す
    る音源波形出力手段とから成り、前記一定時間長の残差
    波形を任意の位置で折り返して接続することによって伸
    縮処理を行うことを特徴とする残差駆動型音声合成方
    法。 4.音声の生成モデルに基づき、スペクトル情報と音源
    情報とから、ピッチ周期を持たない無声音を合成する音
    声分析合成方法において、合成器の逆フィルタから抽出
    される残差波形を入力する残差波形入力手段と、無声音
    部の定常部の残差波形から一定時間長の波形を切り出す
    区間切出し手段と、該区間切出し手段により切り出され
    た残差波形を正規化する正規化手段と、該正規化手段に
    より正規化された波形を伸縮処理して音源波形を出力す
    る音源波形出力手段とから成り、前記無声音部の残差波
    形から切り出された一定時間長の波形のスペクトルをラ
    ンダム位相化した波形を数パターン作成し、該パターン
    を接続して十分長い波形を生成し、該波形の任意の位置
    から必要とされる長さを切り出して駆動音源とすること
    を特徴とする残差駆動型音声合成方法。
JP60236930A 1985-10-23 1985-10-23 残差駆動型音声合成方式 Expired - Fee Related JP2866086B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60236930A JP2866086B2 (ja) 1985-10-23 1985-10-23 残差駆動型音声合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60236930A JP2866086B2 (ja) 1985-10-23 1985-10-23 残差駆動型音声合成方式

Publications (2)

Publication Number Publication Date
JPS6295600A JPS6295600A (ja) 1987-05-02
JP2866086B2 true JP2866086B2 (ja) 1999-03-08

Family

ID=17007858

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60236930A Expired - Fee Related JP2866086B2 (ja) 1985-10-23 1985-10-23 残差駆動型音声合成方式

Country Status (1)

Country Link
JP (1) JP2866086B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7228117B2 (en) 2003-03-12 2007-06-05 Nec Corporation Frequency correction method and apparatus for correcting secular change

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5157922B2 (ja) * 2009-01-09 2013-03-06 ヤマハ株式会社 音声合成装置、およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58154000A (ja) * 1982-03-10 1983-09-13 株式会社日立製作所 音声合成方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7228117B2 (en) 2003-03-12 2007-06-05 Nec Corporation Frequency correction method and apparatus for correcting secular change

Also Published As

Publication number Publication date
JPS6295600A (ja) 1987-05-02

Similar Documents

Publication Publication Date Title
Bonada et al. Synthesis of the singing voice by performance sampling and spectral models
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
JP2782147B2 (ja) 波形編集型音声合成装置
Bonada et al. Expressive singing synthesis based on unit selection for the singing synthesis challenge 2016
JPS6063599A (ja) 言語信号処理方式
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
EP0391545A1 (en) Speech synthesizer
JPH05307399A (ja) 音声分析方式
JP2866086B2 (ja) 残差駆動型音声合成方式
JP2904279B2 (ja) 音声合成方法および装置
JPH11259066A (ja) 音楽音響信号分離方法、その装置およびそのプログラム記録媒体
JP3756864B2 (ja) 音声合成方法と装置及び音声合成プログラム
JP2001125599A (ja) 音声データ同期装置及び音声データ作成装置
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP2586040B2 (ja) 音声編集合成装置
Bonada et al. Improvements to a sample-concatenation based singing voice synthesizer
JP2956069B2 (ja) 音声合成装置のデータ処理方式
JPH1031496A (ja) 楽音発生装置
JPH0258640B2 (ja)
JP2580123B2 (ja) 音声合成装置
JP3317458B2 (ja) 音声合成方法
JPS6295599A (ja) 残差駆動型音声合成方式
JPH05108095A (ja) 音声合成装置
JP2548107B2 (ja) 音声合成方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees