JPH0772898A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH0772898A
JPH0772898A JP5221063A JP22106393A JPH0772898A JP H0772898 A JPH0772898 A JP H0772898A JP 5221063 A JP5221063 A JP 5221063A JP 22106393 A JP22106393 A JP 22106393A JP H0772898 A JPH0772898 A JP H0772898A
Authority
JP
Japan
Prior art keywords
waveform
unit
synthesis
speech
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5221063A
Other languages
English (en)
Inventor
Nobuyuki Katae
伸之 片江
Tatsuro Matsumoto
達郎 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5221063A priority Critical patent/JPH0772898A/ja
Publication of JPH0772898A publication Critical patent/JPH0772898A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】本発明は音声合成装置において、合成単位記号
列から合成波形を生成する波形生成部に関し、少ないデ
ータで高品質の音声が得られる音声合成装置を提供する
ことを目的とする。 【構成】音声合成装置において、一つの合成装置内に、
それぞれ異なる合成方式によって波形を生成する波形生
成部21〜2nと、入力された合成単位の種別により、
波形生成部21〜2nのいずれを用いるかを選択する合
成単位種別判断部1と、波形生成部21〜2nのから出
力された合成単位に相当する波形を接続する波形接続部
3で構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声合成装置におい
て、合成単位記号列から合成波形を生成する波形生成部
に関する。
【0002】
【従来の技術】音声合成装置に従来用いられている方式
として、波形編集方式とホルマント方式を挙げる。波形
編集方式が音声波形を直接的に編集し合成音声を得る方
式であるのに対して、ホルマント方式はモデルを用いる
合成方式の一例であり、音声の周波数スペクトルを特微
量として、パラメータ化し、そのパラメータから音声を
合成する方式である。
【0003】波形編集方式の音声合成装置の従来例を図
6に示す。本図中、211は波形選択部、212は波形
変形部、213は素片波形データ記憶部、3は波形接続
部を示すまた、波形編集方式の流れを図7、図8に示
す。波形選択部211に合成単位記号列が入力される。
合成単位には音節、音素などの種類があり、任意文の合
成を目的とする規則合成装置では、単語よりも細かい単
位が用いられているのが通常である。図11に示すよう
に、合成単位記号は一般のテキストに形態素解析、構文
解析などの言語処理を施すことによって得られる。
【0004】波形選択部211では合成単位記号列にし
たがって素片波形データ記憶部213から適切な素片波
形を選択し、波形変形部212に出力する。素片波形デ
ータ記憶部213に蓄積されている波形データは、合成
単位記号を構成する更に短い時間長の波形であり、それ
らを総称してここでは素片波形と呼ぶ。蓄積されている
波形データは自然音声から抽出されたものであるが、1
〜数ピッチ周期程度の長さの音声波形から、合成単位と
同等の長さの波形まで、装置の処理に応じて、様々な場
合がありうる。
【0005】蓄積されていた素片波形データ(図7(1
a))をそのままの形で接続すると接続箇所で不連続が
起こるなど滑らかな音声が生成されないため、波形変形
部212で、図7(1b)に示すように、接続に適する
ように窓かけなどの変形を行い、その後、図7(1c)
に示すようにそれぞれの素片波形データを重ね合わせて
接続することにより合成単位波形を生成する。ひとつの
合成単位に相当する長さの合成波形を合成単位波形と呼
び、素片波形と区別する。ただし図7の(2a)に示す
ように合成単位の自然波形をそのまま素片波形データと
して蓄積している場合には、図7(2b)のように波形
変形を施すだけで、そのまま合成単位波形になりうる。
【0006】波形接続部3では、このように生成された
各合成単位波形(図8(a)、(b)、(c))を順に
重ね合わせ接続することにより、図8(d)に示すよう
な合成波形を得る、ホルマント方式の音声合成装置の従
来例を図9に示す。本図中、221はホルマントパラメ
ータ生成部、222はホルマント合成部、223はホル
マントデータ記憶部、224はホルマント変形ルール記
憶部を示す。また、ホルマント合成部の構成の一例を図
10に示す。
【0007】ホルマント方式は、音声をそのスペクトル
中に見られる数個の声道の共振周波数(ホルマント周波
数)とその帯域幅で表現し、ホルマントによる共振回路
を複数個接続することで声道を模擬し音声波形を合成す
るものである。ホルマント合成に関する詳細は、Den
nis H.Klatt ”Software for
a cascade/parallel forma
nt synthesizer”Journal of
Acoustic Society of Amer
ica67(3),Mar,1980,pp975−9
95に記載されている。
【0008】ホルマントパラメータ生成部221では、
合成単位記号列の入力に従って、ホルマントデータ22
3とホルマント変形ルール224をもとにホルマントパ
ラメータの時系列を生成する。このホルマントパラメー
タは、第1〜第5ホルマント程度までのホルマント周波
数とその帯域幅、および振幅制御のパラメータから成
る。ホルマント合成部222では、図10に示すよう
に、有声音源を模擬するパルス発生器と無声音源を模擬
する白色雑音発生器の出力をこれらのホルマントパラメ
ータの特性を持つ共振回路に通し、口唇の放射特性を付
加することによって、合成音声の出力を得る。図10は
声道の共振のみを模擬したカスケード型の合成器である
が、伝達特性に零点をもつ鼻音を模擬するために反共振
回路を挿入した合成器もある。
【0009】
【発明が解決しようとする課題】波形編集方式による音
声合成では比較的簡単な処理で高品質の合成音声が得ら
れるが、波形データを音素環境に合わせて変形すること
が難しいため任意の文章を滑らかに読み上げるために
は、様々な環境の波形データを蓄積しておく必要があ
る。また、サンプリング周期毎に量子化した値をすべて
蓄積しておくのであるから、大容量のメモリが必要にな
るという問題がある。
【0010】一方、ホルマント方式は音声の一特微量で
あるホルマントデータのみを蓄積しておけばいいので格
段にメモリ量が少なくて済むが、合成モデルには限界が
あり合成音声の品質が十分でないことがある。例えば、
音源を単純なパルスと白色雑音で模擬している点や、ホ
ルマントパラメータ以外の要素が無視されるため、特に
子音の合成音声には自然性に欠けるところがある。ま
た、音声からホルマントを自動抽出することが難しいの
も問題である。
【0011】本発明は少ないデータ容量で高品質の音声
が得られる音声合成装置を提供することを目的とする。
【0012】
【課題を解決するための手段】図1、図2に本発明の原
理図を示す。図1は請求項1に相当する原理図である。
図1において、1は合成単位種別判断部、21〜2nは
それぞれ異なる合成方式を用いた波形生成部、3は波形
接続部である。
【0013】合成単位種別判断部1は入力された合成単
位記号に対して、いずれの方式を用いて波形を生成する
か判断し、適切な波形生成部21〜2nに合成単位を出
力する。また、波形接続部3に合成単位記号列、または
それを波形接続情報に変換したものを出力する。波形生
成部21〜2nでは、それぞれ異なる合成方式を用いて
合成単位波形を生成し波形接続部3に出力する。
【0014】波形接続部3では、合成単位種別判断部1
から入力された合成単位記号列、または波形接続情報を
もとに合成単位波形を接続して合成波形として出力す
る。図2は請求項4に相当する原理図である。図2にお
いて、211’は波形選択部、212は波形変形部、2
13は素片波形データ記憶部、3は波形接続部、41〜
4nはそれぞれ異なる合成方式を採用した素片波形作成
部、51〜5nはそれぞれ素片波形作成部41〜4nの
合成方式に対応した形式でパラメータ化された音声デー
タの記憶部である。
【0015】合成単位記号列が入力されると、波形選択
部211’は素片波形データ記憶部213にアクセスし
て合成に必要な素片波形を読み込むが、素片波形データ
記憶部213にデータが蓄積されていない合成単位に関
しては、合成単位に応じて、素片波形成生部41〜4n
に合成単位記号を出力する。素片波形作成部41〜4n
は、入力された各合成単位記号のデータを素片波形作成
用データ蓄積部51〜5nから取込み、素片波形を作成
し、波形選択部211’に送る。素片波形作成用データ
51〜5nはそれぞれ素片波形作成部41〜4nの合成
方式に対応した形式でデータが蓄積されている。
【0016】波形選択部211’から出力される素片波
形は、波形変形部212で接続に適した変形を施され合
成単位波形に合成される。各合成単位波形は波形接続部
3で接続され、合成波形として出力される。
【0017】
【作用】合成音声の品質を音素ごとに調べてみると、ホ
ルマント方式などのモデルを用いる合成方式が波形編集
方式に対して決定的に劣っているのは、子音(特に破裂
音、摩擦音など)や音素と音素の遷移部であることがわ
かる。また、母音の定常部では、いずれの方式を用いて
も合成音声の品質に大差はない。
【0018】そこで本発明では、合成単位の種別に応じ
た合成方式を用いることにより、例えば子音の合成には
波形編集方式を用いて高い品質を維持し、母音のように
波形編集方式とモデルを用いる合成方式のどちらを利用
しても品質の変わらない合成単位に関しては、モデルを
用いる合成方式を採りメモリの容量を小さくすることに
より、合成音声の品質をあまり低下させずに、波形デー
タの容量を小さくすることができる。
【0019】
【実施例】図3は本発明の第1の実施例であり、図1に
おける波形生成部1を波形編集方式、波形生成部2をホ
ルマント方式、また合成単位を音素とした場合である。
本図中、11は音素種別判断部、12は音素種別テーブ
ル記憶部211は波形選択部、212は波形変形部、2
13は素片波形データ記憶部、221はホルマントパラ
メータ生成部、222はホルマント合成部、223はホ
ルマントデータ記憶部、224はホルマント変形ルール
記憶部、3は波形接続部である。
【0020】本図において、音素種別テーブル記憶部1
2には音素から波形を合成するために、いずれの波形生
成部を用いるかという情報が音素毎のテーブルとして格
納されている。音素種別判断部11では、音素種別テー
ブルをもとに入力音素記号の種別を判断し、適切な波形
生成部に音素記号を送る。例えば、非周期性子音などは
波形編集方式用いるのが適切であると判断し波形生成部
1へ、母音などの定常的な音素はホルマント方式が適切
であると判断して波形生成部2へ出力するという具合で
ある。それ以外にも、鼻音も波形編集方式のカテゴリに
含める。つまり、母音、弾音/r/、半母音/w/,/
y/をひとつの音素種別、それ以外の音素をもうひとつ
の音素種別とし、前者をホルマント合成方式、後者を波
形編集方式とすることもできる。
【0021】また、それぞれの波形生成部で合成された
波形を接続する際に、音素記号列情報が必要であるから
波形接続部3にも出力される。もちろん、波形生成部3
がいずれの波形生成部からどういう順に音素波形を受取
り接続していくかという波形接続情報の形に変換したも
のを出力するという方法もある。ここでは波形生成部1
に波形編集方式を用いているので、その処理は従来例に
記した内容と同様である。入力された音素記号に対し、
波形選択部211では素片波形データ記憶部213から
波形を読み込み、波形変形部212に出力する。波形変
形部212では素片波形データを接続するように窓掛け
などの変形を行い、それぞれの素片波形データを接続
し、音素波形(合成単位波形)を出力する。
【0022】波形生成部2はホルマント合成方式を用い
ている。その処理は従来例と同様である。ホルマントパ
ラメータ生成部221では、音素記号の入力に従って、
音素についてのホルマントデータ223と音素環境によ
るホルマント変形ルール224をもとに、ホルマントパ
ラメータを生成する。ホルマント合成部222ではホル
マントパラメータデータをもとに共振回路を駆動し音素
波形を生成する。
【0023】波形接続部3では図3に示すように各波形
生成部で合成された音素(合成単位)波形を、音素種別
判断部11から出力された音素記号列情報、または波形
接続情報に基づいて、重ね合わせて接続し、合成波形と
して出力する。図4は本発明の第2の実施例であり、図
1における波形生成部1を波形編集方式、波形生成部2
をPARCOR方式、合成単位を音素とした場合であ
る。
【0024】本図中、11は音素種別判断部、12は音
素種別テーブル記憶部、211は波形選択部、212は
波形変形部、213は素片波形データ記憶部、231は
PARCORパラメータ生成部、232はPARCOR
合成部、233はPARCORパラメータ記憶部、3は
波形接続部である。図4の実施例2は実施例1の波形生
成部2をPARCOR方式に置き換えたものであるの
で、その箇所のみを説明する。
【0025】音素種別判断部11でPARCOR方式が
適切であると判断された音素がPARCORパラメータ
生成部231に入力される。PARCOR方式は線形予
測法を用いて分析し、自然音声をパラメータ化したもの
(PARCORパラメータと呼ぶ)を蓄積しておき、分
析に用いたフィルタと逆特性のフィルタを用いて合成す
る手法である。PARCORパラメータ記憶部233に
は、PARCORパラメータが格納されており、PAR
CORパラメータ生成部231でこれらのパラメータを
接続し、音素波形を生成するためのパラメータ列を生成
する。PARCOR合成部232では、このパラメータ
列の特性でフィルタを駆動し音素波形を得て、波形接続
部3に出力する。
【0026】ホルマント方式やPARCOR方式以外に
もLSP(線スペクトル対)合成法式や、ケプストラム
方式など、あらゆる合成方式との組み合わせが可能であ
る。図5は本発明の第3の実施例であり、図2における
素片波形作成部をホルマント方式とした場合である。本
図中、211’は波形選択部、212は波形編集部、2
13は素片波形データ記憶部、3は波形接続部、411
はホルマントパラメータ生成部、412はホルマント合
成部、511はホルマントデータ記憶部、512はホル
マント変形ルール記憶部である。
【0027】本図において、波形選択部211’は従来
例(図6の211)とほぼ同様なものであるが、入力さ
れた音素記号列に従って、素片波形データ記憶部(21
3)から素片波形を読み込む際、素片波形データ記憶部
213に蓄積されていない音素に関しては、その音素記
号をホルマントパラメータ生成部411に出力する点で
異なる。
【0028】ホルマントパラメータ生成部411では入
力音素記号および音素環境からホルマントデータ511
とホルマント変形ルール512をもとにホルマント合成
に用いるパラメータの時系列を生成し、ホルマント合成
部412に出力する。ホルマント合成部421ではパラ
メータにしたがって、図10に示すような共振回路を駆
動して音声波形を合成し、波形変形部211’に出力す
る。この音素波形は図7(2a)に示したものと同様、
一素片波形が一合成単位波形に相当するものとして対処
する。こうして、あたかも全ての素片波形が蓄積されて
いたようにして、素片波形選択部211’から波形変形
部212に出力される。波形編集部212では図7(1
b)、(1c)のように、変形、接続され音素波形とな
る。波形接続部3はこれらの音素波形を重ね合わせ接続
し合成波形として出力する。
【0029】ホルマント方式以外にもPARCOR方式
など、他の方式を素片波形作成部に用いることも可能で
ある。
【0030】
【発明の効果】本発明によれば、少ない蓄積データ容量
で高品質の合成音声を得る音声規則合成装置を実現する
ことが可能である。
【図面の簡単な説明】
【図1】本発明の請求項1に対する原理図である。
【図2】本発明の請求項4に対する原理図である。
【図3】本発明の第1の実施例を示す図である。
【図4】本発明の第2の実施例を示す図である。
【図5】本発明の第3の実施例を示す図である。
【図6】第1の従来例の原理図である。
【図7】波形変形部における処理を示す図である。
【図8】波形接続部における処理を示す図である。
【図9】第2の従来例の原理図である。
【図10】ホルマント合成部の構成図である。
【図11】合成単位記号列の一例である。
【符号の説明】
1・・・合成単位種別判断部 21〜2n・・・波形生成部 3・・・波形接続部 41〜4n・・・素片波形作成部 51〜5n・・・素片波形作成用データ蓄積部 211、211’・・・波形選択部 212・・・波形変形部 213・・・素片波形データ蓄積部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】音声合成装置において、 一つの合成装置内に、それぞれ異なる合成方式によって
    合成単位から波形を生成する波形生成部(21)〜(2
    n)と、 入力された合成単位の種別より、波形生成部(21)〜
    (2n)のいずれを用いるかを選択する合成単位種別判
    断部(1)と、 波形生成部(21)〜(2n)から出力された合成単位
    に相当する波形を接続する波形接続部(3)を有するこ
    とを特徴とする音声合成装置。
  2. 【請求項2】請求項1において、波形データの直接的な
    編集によって音声を合成する波形編集方式を用いる波形
    生成部と、 モデルを用いて音声をパラメータ化し、そのパラメータ
    から音声を合成する方式を用いる波形生成部を有するこ
    とを特徴とする音声合成装置。
  3. 【請求項3】請求項1または請求項2において、合成単
    位のうち、母音については音声パラメータから音声を合
    成する方式の波形生成部を、子音については波形編集方
    式による波形生成部を用いて音声合成を行うことを特徴
    とする音声合成装置。
  4. 【請求項4】音声合成装置において、 特定の合成単位のデータとして音声波形を蓄積する素片
    波形データ蓄積部(213)と、 その他の合成単位のデータとしてモデルを用いて、合成
    単位に応じた形式の音声パラメータを蓄積した素片波形
    作成用データ蓄積部(51〜5n)と、 素片波形作成用データ蓄積部(51〜5n)に蓄積され
    ている音声パラメータから合成単位に相当する音声波形
    を合成する素片波形生成部(41〜4n)と、 合成に必要な素片波形を素片波形データ蓄積部(21
    3)、および素片波形生成部(41〜4n)から読み込
    む波形選択部(211’)と波形選択部(211’)か
    ら出力される素片波形を接続に適するように変形を施
    し、合成単位に相当する波形を生成する波形変形部(2
    12)と、 波形変形部(212)から出力される合成単位に相当す
    る波形を接続する波形接続部(3)を具備することを特
    徴とする音声合成装置。
  5. 【請求項5】請求項4において、合成単位のうち、子音
    のデータを素片波形データ蓄積部(213)に蓄積して
    おき、母音のデータを素片波形作成用データ蓄積部(5
    1〜5n)に蓄積しておくことを特徴とする音声合成装
    置。
  6. 【請求項6】合成単位を音素とすることを特徴とする、
    請求項1ないし請求項5記載の音声合成装置。
  7. 【請求項7】合成単位を音節とすることを特徴とする、
    請求項1ないし請求項5記載の音声合成装置。
JP5221063A 1993-09-06 1993-09-06 音声合成装置 Withdrawn JPH0772898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5221063A JPH0772898A (ja) 1993-09-06 1993-09-06 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5221063A JPH0772898A (ja) 1993-09-06 1993-09-06 音声合成装置

Publications (1)

Publication Number Publication Date
JPH0772898A true JPH0772898A (ja) 1995-03-17

Family

ID=16760914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5221063A Withdrawn JPH0772898A (ja) 1993-09-06 1993-09-06 音声合成装置

Country Status (1)

Country Link
JP (1) JPH0772898A (ja)

Similar Documents

Publication Publication Date Title
Peterson et al. Segmentation techniques in speech synthesis
JP3078205B2 (ja) 波形の連結及び部分的重複化による音声合成方法
US6804649B2 (en) Expressivity of voice synthesis by emphasizing source signal features
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
Huang et al. Recent improvements on Microsoft's trainable text-to-speech system-Whistler
US8195464B2 (en) Speech processing apparatus and program
US20050119890A1 (en) Speech synthesis apparatus and speech synthesis method
US20070282608A1 (en) Synthesis-based pre-selection of suitable units for concatenative speech
JPH031200A (ja) 規則型音声合成装置
EP0239394B1 (en) Speech synthesis system
JP2761552B2 (ja) 音声合成方法
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
Chettri et al. Nepali text to speech synthesis system using ESNOLA method of concatenation
Rama et al. Thirukkural: a text-to-speech synthesis system
JPH08335096A (ja) テキスト音声合成装置
US20060178873A1 (en) Method of synthesis for a steady sound signal
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JP3394281B2 (ja) 音声合成方式および規則合成装置
JPH0772898A (ja) 音声合成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
Hinterleitner et al. Speech synthesis
Datta et al. Epoch Synchronous Overlap Add (ESOLA)
JPS5914752B2 (ja) 音声合成方式
JP2001100777A (ja) 音声合成方法及び装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20001107