JPH032797A - 音声合成装置の抑揚制御方式 - Google Patents

音声合成装置の抑揚制御方式

Info

Publication number
JPH032797A
JPH032797A JP13636289A JP13636289A JPH032797A JP H032797 A JPH032797 A JP H032797A JP 13636289 A JP13636289 A JP 13636289A JP 13636289 A JP13636289 A JP 13636289A JP H032797 A JPH032797 A JP H032797A
Authority
JP
Japan
Prior art keywords
intonation
sentence
data
pitch
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP13636289A
Other languages
English (en)
Inventor
Yoshimasa Sawada
沢田 喜正
Kazuya Hasegawa
和也 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP13636289A priority Critical patent/JPH032797A/ja
Publication of JPH032797A publication Critical patent/JPH032797A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は、規則合成方式による音声合成装置に係り、特
にイントネーションによる抑揚制御方式B1発明の概要 本発明は、イントネーションとアクセント型によって合
成音声の抑揚制御を行う音声合成装置において、 文頭及び文末のイントネーション変化を大きくすること
により、 自然性を高めた合成音声の抑揚を得るものである。
C9従来の技術 規則合成方式による音声合成装置は、人力文字列を構文
解析によって単語、文節に区切り、夫々にはイントネー
ション、アクセントを決定し、単語、文節を音節さらに
は音素にまで分解し、音節又は音素単位の音源波及び調
音フィルタのパラメータを求め、音源波に対する調音フ
ィルタの応答出力として合成音声を得るようにしている
この種の音声合成装置は、例えば第3図に示す構成にさ
れる。日本語処理部lは入力された日本語文章に対して
文節の区切りや辞書を参照して読みがな変換等を行う。
文章処理部2は文章にイントネーションを付与し、アク
セント処理部3では文、文節を構成する音節にアクセン
トを付ける。
例えば、第4図に示すように、文章入力「学校の桜がき
れいに咲いた」に対して文イントネーションはその音節
数によって立上り点から対数特性等で低下していき、文
節アクセントは単語、文節によってアクセント型が決め
られ、これらイントネーショとアクセント型を合成しさ
らには呼気イントネーションやフィルタ処理による丸め
、ポーズ等を付加して合成イントネーションが求められ
る。
音素処理部4は人力されたrsAJ・・・等の各音節デ
ータに対して母音及び子音の単位である音素との対応関
係を規定した音節パラメータ格納部4内のデータを参照
して音素に分解する処理、例えば音節rsAJに対して
音素「S」、rAJに分解処理する。
補間処理部5は、音素処理部4からの音素列データに対
して、音素毎に音素パラメータ格納部5、の音素パラメ
ータを抽出し、また音源パラメータ格納部5.の音源パ
ターンを抽出してこれらデータから補間処理によって音
源波形及び調音データを得る。音素パラメータは、例え
ば第5図に示すように、子音には各音素を3つの発声時
間帯O1〜03に区分し、各時間帯毎に継続時間1+〜
t3、音源波の繰り返し周波数であるピッチP1〜P3
、この音源波のエネルギーE、−E3、音源波パターン
G l”−G s及びピッチとエネルギーの時定数DP
、−DP3、DE、〜DE3を有して音源波の離散的デ
ータを得る。・また、母音には1つの区分OAにして夫
々ピッチ時定数DP^、エネルギーEA%エネルギー時
定数D E A 、音源波パターンGAを有して音源波
の離散的データとする。このうち、音源波パターンは例
えば第6図に示すような音源波パターンG I’= G
 s、 G Aが対応づけられ、各パターンに対して音
源パラメータ格納部5.には数十個のサンプルデータ列
か用意されて音源波のサンプルデータが取出される。ま
た、エネルギE+〜E3、EAは音源波のレベルの大き
さ即ち音の大きさを規定し、ピッチP l””’ P 
s、PAは周波数の高さ即ち音の高さを規定する。そし
て、これら音源波データの規定は各時間帯0.〜03、
OAでの1つの値になり、各時間帯及び音素間のわたり
には時定数DP、〜D P s、DPASDEl〜D 
E3、DE^が与えられて補間処理部5による補間処理
によって連続した音源波データ列が取出される。
例えば、子音のピッチP、〜P3は第7図に示すように
区間0.〜03毎の目標値として与えられ、各区間内の
ピッチPは時定数DP、〜DP3の太きさによって実線
や破線で示すような変化になるn回の補間処理を行う。
この補間演算は次の漸化式%式%) PnhHK回目のピッチ制御値 DP  、ピッチ時定数 Po :今回のピッチ目標値 Pn−+;前回のピッチ目標値 によってn回演算を行ってP lk+ P Ikel・
・・のように夫々ピッチPnkを求める。
次に、音素パラメータ格納部5Iには第5図に示すよう
に音響管モデル断面積のパラメータと時定数D A +
 ’= D A 3、DAAも格納される。このパラメ
ータは声道調音等価フィルタのパラメータを与えるもの
で、人間の声道(男性の場合は約17cx)を長さLc
xの音響管17個連接した調音モデルとして各時間帯毎
に各音響管の断面積A 、 −H〜/’i+v−+s 
Al−t〜A+v−t、Al−3〜A17−3として与
えられる。これらパラメータは音響管時定数と共に調音
演算部6に与えられて音源波に対する開音演算がなされ
る。
調音演算部6は、断面積パラメータを持つ音響管に対し
て音源波を与えたときの放射音声波形データ列を求め、
この波形デーをD/A変換器7によってアナログ信号に
変換して音声出力装置8から合成音声を得る。
ここで、合成音声の抑揚は文イントネーションとアクセ
ント型が音素のピッチ(第5図)P、〜P3、PAに夫
々加算又は乗算され、この演算結果でピッチ目標値が決
定され、さらに補間処理部5においてml述の補間処理
がなされてピッチ周波数として算定される。
D0発明が解決しようとする課題 従来の抑揚制御は、主にイントネーションとアクセント
型によって合成イントネーションを求め−このイントネ
ーションによって主に音素又は音節のピッチ周波数を時
間と共に変化させる。ここで、イントネーションはピッ
チ周波数を時間と共に低下させる特性にされ、この特性
は対数カーブや直線近似にされる。
前者の対数カーブによる抑揚制御では文末部が平坦、即
ち文末部での抑揚変化が小さくなって自然性に劣る。一
方、後者の直線近似による抑揚制御では文頭近くの変化
量が少なくなって文頭部での自然性に劣る問題があった
本発明の目的は、イントネーションによる抑揚制御に自
然性を高めた抑揚制御方式を提供することにある。
98課題を解決するための手段と作用 本発明は、上記目的を達成するため、入力文章にイント
ネーションとアクセント型を与えて合成音声の抑揚制御
を行う音声合成装置において、入力文章の文頭から文末
まで対数カーブ又は直線近似のイントネーションデータ
を得る第1の手段と、前記イントネーションデータの文
末近くの下げ率を高く調節する第2の手段とを備え、入
力文章に対して前記第1の手段によって対数カーブ又は
直線近似のイントネーションデータを得、該データに対
して前記第2の手段によって文末近くの下げ率を高くし
て該入力文章のイントネーションとし、文頭及び文末部
でのイントネーションの変化を高く、即ちピッチ周波数
の変化を大きくした抑揚を得る。
F、実施例 第1図は本発明の一実施例を示す処理フローチャートで
ある。ステップS1による呼気段落の決定は、入力文章
の句読点や文節数の範囲から人が一息で発生する音声区
間を求める。ステップS2による対数カーブのイントネ
ーション決定は上述の音声区間の長さ(音節数やモーラ
数)に応じたイントネーションデータを演算又はテーブ
ルデータから求め、このイントネーションデータは対数
カーブのものにされる。ステップS3によるイントネー
ションの文末下げ率を高く調節は、ステップS2により
求めた対数カーブのイントネーションデータの文末に相
当する部分の下げ率を高くした補正を行う。ステップS
4による合成イントネーションの作成は、補正したイン
トネーションに単語又は文節のアクセント型を重畳させ
、さらにボース等を付加した合成イントネーションを求
める。ステップS5による補間処理等は従来と同様に合
成イントネーションによって音素又は音節のピッチ周波
数を調節すると共に補間処理を行って音源波形を得る。
上述までの処理によるイントネーション調節は、第2図
に示すように文頭では対数カーブによってピッチ周波数
の変化が大きくなり、また文末では下げ率を対数カーブ
による下げ率に較べて高くすることでピッチ周波数の変
化が大きくなる。なお、文末の最終ピッチ周波数P8は
実際の人間が発声した音声波形を統計的に分析し、その
平均的な値になるよう規定する。
上述のことから、本実施例による音声合成波の抑揚は、
文頭から文中間までの抑揚が対数カーブによるピッチ周
波数の高い変化を得ると共に、文末近くから文末にかけ
ては対数力7ブの低いピッチ周波数に較べて高いピッチ
周波数変化を得ることができ、文頭および文末共にピッ
チ周波数変化を高くして合成音声に自然性を得るし、言
わゆるはぎれの良い合成音声を得ることができる。
なお、実施例において、イントネーションは対数カーブ
から補正するに限らず、直線近似のイントネーションに
対してその文末部の下げ率を直線近似の傾斜より大きく
することでも自然性向上に効果がある。
G1発明の効果 以上のとおり、本発明によれば、入力文章の文頭及び文
末部の変化を大きくしたイントネーションによって合成
音声を得るため、人の自然発声の抑揚に近づけたイント
ネーションになってはぎれの良い合成音声を得るなど自
然性を高めた合成音声を得ることができる。
【図面の簡単な説明】
第1図は、本発明の一実施例を示すフローチャート、第
2図は実施例のイントネーション特性図、第3図は音声
合成装置の構成図、第4図はイントネーション波形図、
第5図は音素パラメータのデータ図、第6図は音源波パ
ターンの波形図、第7図は補間処理によるピッチ特性図
である。 l・・・日本語処理部、2・・・文章処理部、3・・・
アクセント処理部、 −タ格納部、 −タ格納部、 調音演算部、 置。 4・・・音素処理部、4.・・・音節バラン5・・・補
間処理部、5I・・・音素バラン5t・・・音源パラメ
ータ格納部、6・・・7・・・D/A変換器、8・・・
音声出力袋外2名 第2図 実施例のイントネーション特性図 □時間 第1図 実施例のフローチャート 第3図 音声合成装置の構成図 8−・−音声出力装置 第4図 イントネーション波形図 第5図 音素パラメータのデータ図

Claims (1)

    【特許請求の範囲】
  1. (1)入力文章にイントネーションとアクセント型を与
    えて合成音声の抑揚制御を行う音声合成装置において、
    入力文章の文頭から文末まで対数カーブ又は直線近似の
    イントネーションデータを得る第1の手段と、前記イン
    トネーションデータの文末近くの下げ率を高く調節する
    第2の手段とを備え、入力文章に対して前記第1の手段
    によって対数カーブ又は直線近似のイントネーションデ
    ータを得、該データに対して前記第2の手段によって文
    末近くの下げ率を高くして該入力文章のイントネーショ
    ンとすることを特徴とする音声合成装置の抑揚制御方式
JP13636289A 1989-05-30 1989-05-30 音声合成装置の抑揚制御方式 Pending JPH032797A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13636289A JPH032797A (ja) 1989-05-30 1989-05-30 音声合成装置の抑揚制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13636289A JPH032797A (ja) 1989-05-30 1989-05-30 音声合成装置の抑揚制御方式

Publications (1)

Publication Number Publication Date
JPH032797A true JPH032797A (ja) 1991-01-09

Family

ID=15173399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13636289A Pending JPH032797A (ja) 1989-05-30 1989-05-30 音声合成装置の抑揚制御方式

Country Status (1)

Country Link
JP (1) JPH032797A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7598242B2 (en) 2001-12-20 2009-10-06 Schering Corporation Compounds for the treatment of inflammatory disorders

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62138898A (ja) * 1985-12-13 1987-06-22 株式会社日立製作所 音声規則合成方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62138898A (ja) * 1985-12-13 1987-06-22 株式会社日立製作所 音声規則合成方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7598242B2 (en) 2001-12-20 2009-10-06 Schering Corporation Compounds for the treatment of inflammatory disorders

Similar Documents

Publication Publication Date Title
Jovičić Formant feature differences between whispered and voiced sustained vowels
US5708759A (en) Speech recognition using phoneme waveform parameters
US20010021906A1 (en) Intonation control method for text-to-speech conversion
JP2000305582A (ja) 音声合成装置
JPH08512150A (ja) ニューラル・ネットワークを利用してテキストを可聴信号に変換する方法および装置
Cruz-Ferreira European Portuguese
US5212731A (en) Apparatus for providing sentence-final accents in synthesized american english speech
Venditti et al. Modeling Japanese boundary pitch movements for speech synthesis
Arvaniti A (brief) overview of the phonetics and phonology of Cypriot Greek
JP2904279B2 (ja) 音声合成方法および装置
JPH032797A (ja) 音声合成装置の抑揚制御方式
JPH0580791A (ja) 音声規則合成装置および方法
Javkin et al. A multilingual text-to-speech system
Raychoudhury et al. The Three Way Tonal System of Sylheti
JPS62138898A (ja) 音声規則合成方式
JPH032800A (ja) 音声合成装置の抑揚制御方式
JPH032798A (ja) 音声合成装置の抑揚制御方式
JP2848604B2 (ja) 音声合成装置
JPH032796A (ja) 音声合成装置の抑揚制御方式
JP3267659B2 (ja) 日本語音声合成方法
JP3078073B2 (ja) 基本周波数パタン生成方法
JPH032799A (ja) 音声合成装置のピッチパターン結合方式
JP3186263B2 (ja) 音声合成装置のアクセント処理方式
JPH056191A (ja) 音声合成装置
JPH1011083A (ja) テキスト音声変換装置