JP2551041B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2551041B2
JP2551041B2 JP62269094A JP26909487A JP2551041B2 JP 2551041 B2 JP2551041 B2 JP 2551041B2 JP 62269094 A JP62269094 A JP 62269094A JP 26909487 A JP26909487 A JP 26909487A JP 2551041 B2 JP2551041 B2 JP 2551041B2
Authority
JP
Japan
Prior art keywords
pitch
speech
voice
utterance
utterance speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62269094A
Other languages
English (en)
Other versions
JPH01112296A (ja
Inventor
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP62269094A priority Critical patent/JP2551041B2/ja
Publication of JPH01112296A publication Critical patent/JPH01112296A/ja
Application granted granted Critical
Publication of JP2551041B2 publication Critical patent/JP2551041B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声合成装置に関する。
(従来の技術) 従来の規則音声合成装置では、発声速度を変えて音声
を合成する場合には、母音定常部において合成パラメー
ラの間引きや挿入を行うなどして、音韻の継続時間長に
関するパラメータを制御し、発声速度の異なる音声を生
成していた。このような従来技術については、日本音響
学会音声研究会資料S85−31(1985−07)「ホルマン
ト、CV−VC型規則合成」等で詳述されている。
(発明が解決しようとする問題点) 従来の音声合成装置では、発声速度を変化させるにあ
たり、音韻継続時間長だけを変えていた。しかしなが
ら、実際の人間の発声の場合、発声速度が変わるとピッ
チ周波数の変化幅も変化する。そこで、発声速度を標準
より大きく変えて合成する場合、すなわち、大変遅い速
度やあるいは大変速い発声速度で合成する場合には、従
来の音声合成装置は、ピッチ周波数の変化が実際の人間
の発声と異なり、聞きにくい音声を合成していた。
これに対して本発明は、発声速度を変化させた場合で
も、より自然なピッチ変化を持った合成音声を生成する
ことが可能な音声合成装置を提供することを目的として
いる。
(問題点を解決するための手段) 本発明は、指定された指定された発声速度の音声を合
成する音声合成装置であって、指定しようとする発声速
度を入力する手段と、この入力手段から入力された前記
発声速度に応じてピッチ周波数変化幅を決定する手段
と、前記ピッチ周波数変化幅に適応するピッチパタンを
生成する手段と、前記ピッチパタンに適合するピッチ周
波数の音声を合成する手段とを有することを特徴とす
る。
(作用) 音声合成において、ピッチパタンを規則によって生成
する場合には、話調成分と呼ばれる単調に下降するかま
たは「へ」の字形に変化する成分に、アクセント成分と
呼ばれる単語または文節毎のアクセント型に基づく成分
を重量することによって生成する方法が採られる。第2
図は生成されたピッチパタンの例を示すための図であ
る。話調成分21は、ピッチ周波数の下限を表す成分であ
るが、ピッチパタンの上限を表す成分22も制御されるこ
とが多い。下限成分21と上限成分22は、アクセント成分
23によるピッチの上昇下降の変化の範囲を制限するもの
である。このときの下限成分21と上限成分22との間隔を
ピッチ変化幅と呼ぶことにする。ピッチ変化幅には男女
差や個人差があり、また一般に発話の開始時点の方が終
了時点より変化幅が大きい。
このピッチ変化幅は、発声速度を変えることによって
も変化する。したがって、発声速度を変化させる必要の
ある音声合成装置では、自然な音声を出力するために
は、発声速度に応じてピッチ変化幅を制御することが必
要である。
100文を、同一話者が3段階の発声速度(速く発声:10
0文の平均で11.13モーラ/秒、普通に発声:同6.80モー
ラ/秒、ゆっくりと発声:同5.62モーラ/秒)で読み上
げた音声を分析した結果を以下に示す。最高値とは、各
文の発声の中で観測された最も高いピッチ周波数の、10
0文の平均値(Hz)である。一方、最低値とは、各文の
発声の中で観測された最も低いピッチ周波数の、100文
の平均値(Hz)である。
速く発声 普通に発声 ゆっくりと発声 最高値 248.8 208.4 202.8 最低値 80.3 72.4 72.2 この結果を見ると、発声速度が速いほど最高値と最低
値の差が広がっていることがわかる。音声合成装置にお
いても、このような、発声速度とピッチ周波数の変化の
幅との関係を再現することによって、より自然で、聞き
易い合成音声が実現できるものと考えられる。
そこで、以上の分析結果に基づいて、次のようなピッ
チ変化幅の制御を行う。
まず、予め、第2図に示す話調成分の下限成分21と上
限成分22の変化パタンを用意しておく。具体的には、例
えば、下限成分21と上限成分22のそれぞれについて、発
声の始端と終端におけるピッチ周波数の差を定めてお
く。
次に発声速度に応じて、下限成分21と上限成分22の実
際のピッチ周波数の値を決定する。発声速度の入力方法
としては、予め決められた何段階かの発声速度の中から
選択しても良いし、単位時間当たりのモーラ数などの速
度の単位を用いて指定しても良いが、装置が予め何段階
かの基準となる発声速度を定めてある場合は、その中か
ら入力された発声速度に最も近い発声速度を選ぶ。例え
ば、制御の基準となる発声速度として上記の3つの発声
速度が用意されている場合に、入力された発声速度が8
モーラ/秒であったならば、「普通に発声」した場合に
最も近いことになる。そこで、その入力発声速度におけ
るピッチ周波数の最高値を208.4Hz、最低値を72.4Hzと
する。このとき、制御の基準となる発声速度とそれに対
応するピッチ周波数の値が細かく定められていれば、よ
りきめ細かな制御が可能となることは言うまでもない。
そのための方法として、例えば、上記の3つの発話速度
とピッチ周波数との関係を何らかの関数(2次関数、ス
プライン関数など)によって近似して内挿及び外挿する
方法が考えられる。そして、下限成分21については、そ
の中でも最も低いピッチ周波数の値が72.4Hzとなるよう
に、下限成分21全体の周波数パタンを決める。一方、上
限成分22については、その中でも最も高いピッチ周波数
の値が208.4Hzとなるように、上限成分22全体の周波数
パタンを決める。
以上のような方法によって、本発明の音声合成装置で
は、実際の人間の発声と同じように、発声速度が速くな
るにつれてピッチ周波数の変化の幅が広くなるようなピ
ッチパタンを合成音声に付与することが可能となる。
(実施例) 第1図は本発明の一実施例の構成を示すブロック図で
ある。
まず、文字入力端子11から合成すべき文章を表す音素
記号列等が入力され、音響パラメータ生成部12に送られ
る。発声速度は、発声速度入力端子13から入力され、ピ
ッチ変化幅決定部14に送られる。入力する発声速度は、
予め決められた何段階かの発声速度の中から選択しても
良いし、単位時間当りのモーラ数等、速度の単位を用い
て指定しても良い。ピッチ変化幅決定部14は、前記指定
された発声速度に適したピッチ変化幅を決定し、韻律パ
ラメータ生成部15に送る。
韻律パラメータ生成部15は、前記発声速度に適したピ
ッチ変化幅に基づいて合成音声のピッチパタンを生成す
る。また、発声速度を変化させるために前記指定された
発声速度に応じて音韻継続時間長を決定する。
音響パラメータ生成部12は、前記入力音素記号列、及
び韻律パラメータ生成部15で生成された音韻継続時間長
とピッチパタンにしたがって音声合成に必要な合成パラ
メータを生成し、音声合成部16に送る。音声合成部16
は、前記合成パラメータから音声波形を合成する。前記
合成された音声波形は、音声出力端子17から出力され
る。
(発明の効果) 以上に述べてきたように、本発明によれば、発声速度
を変化させた場合でも自然なピッチ変化を持った合成音
声を生成する音声合成装置が提供できる。この本発明の
音声合成装置は、様々な発声速度の合成音声を出力する
必要がある音声応答装置を実現するのに有効である。
【図面の簡単な説明】
第1図は本発明による音声合成装置の一実施例を示すブ
ロック図、第2図は生成されたピッチパタンの例を示す
図である。 図において、11は文字列入力端子、12は音響パラメータ
生成部、13は発声速度入力端子、14はピッチ変化幅決定
部、15は韻律パラメータ生成部、16は音声合成部、17は
音声出力端子である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】指定された発声速度の音声を合成する音声
    合成装置において、指定しようとする発声速度を入力す
    る手段と、この入力手段から入力された前記発声速度に
    応じてピッチ周波数変化幅を決定する手段と、前記ピッ
    チ周波数変化幅に適応するピッチパタンを生成する手段
    と、前記ピッチパタンに適合するピッチ周波数の音声を
    合成する手段とを有することを特徴とする音声合成装
    置。
JP62269094A 1987-10-23 1987-10-23 音声合成装置 Expired - Lifetime JP2551041B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62269094A JP2551041B2 (ja) 1987-10-23 1987-10-23 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62269094A JP2551041B2 (ja) 1987-10-23 1987-10-23 音声合成装置

Publications (2)

Publication Number Publication Date
JPH01112296A JPH01112296A (ja) 1989-04-28
JP2551041B2 true JP2551041B2 (ja) 1996-11-06

Family

ID=17467591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62269094A Expired - Lifetime JP2551041B2 (ja) 1987-10-23 1987-10-23 音声合成装置

Country Status (1)

Country Link
JP (1) JP2551041B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309173A (ja) * 2004-04-23 2005-11-04 Nippon Hoso Kyokai <Nhk> 音声合成制御装置、その方法、そのプログラムおよび音声合成用データ生成装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6364098A (ja) * 1986-09-05 1988-03-22 株式会社日立製作所 音声合成方式

Also Published As

Publication number Publication date
JPH01112296A (ja) 1989-04-28

Similar Documents

Publication Publication Date Title
JPH09198091A (ja) フォルマント変換装置およびカラオケ装置
US20020049594A1 (en) Speech synthesis
JP2551041B2 (ja) 音声合成装置
JP3437064B2 (ja) 音声合成装置
JP2001242882A (ja) 音声合成方法及び音声合成装置
JPH1115489A (ja) 歌唱音合成装置
JP3233036B2 (ja) 歌唱音合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JPH09179576A (ja) 音声合成方法
JP2573586B2 (ja) 規則型音声合成装置
KR20040015605A (ko) 가상노래 합성장치 및 방법
JP3113101B2 (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JP2581130B2 (ja) 音韻継続時間長決定装置
JP3515268B2 (ja) 音声合成装置
JP3284634B2 (ja) 規則音声合成装置
JP3368948B2 (ja) 音声規則合成装置
JP2513266B2 (ja) 音韻継続時間長決定装置
JP2910587B2 (ja) 音声合成装置
Uchida A practical method for generating whispers from singing voices: Application of improved phantom silhouette method
JPH0679231B2 (ja) 音声合成装置
JPH09230892A (ja) テキスト・音声変換装置
JP2878280B2 (ja) 音声合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPH1011083A (ja) テキスト音声変換装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070822

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 12