JPH05333892A - ピッチパタン生成装置 - Google Patents

ピッチパタン生成装置

Info

Publication number
JPH05333892A
JPH05333892A JP4355726A JP35572692A JPH05333892A JP H05333892 A JPH05333892 A JP H05333892A JP 4355726 A JP4355726 A JP 4355726A JP 35572692 A JP35572692 A JP 35572692A JP H05333892 A JPH05333892 A JP H05333892A
Authority
JP
Japan
Prior art keywords
accent
pitch pattern
speech
stress level
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4355726A
Other languages
English (en)
Other versions
JP2785628B2 (ja
Inventor
Kazuhiko Iwata
田 和 彦 岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4355726A priority Critical patent/JP2785628B2/ja
Publication of JPH05333892A publication Critical patent/JPH05333892A/ja
Application granted granted Critical
Publication of JP2785628B2 publication Critical patent/JP2785628B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】文章の係り受け構造を用いることなしに、自然
なピッチパタンを生成すること。 【構成】文章の係り受け構造よりも正確に求めることが
可能な単語の品詞に基づいてピッチパタンを生成するこ
とにより、従来方式に比べより自然なピッチパタンを生
成することを可能とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字で書かれた文章を
音声出力する音声合成装置等におけるピッチパタン生成
装置に関する。
【0002】
【従来の技術】任意の文章を音声出力する音声合成装置
等において、自然なピッチパタンを生成することは、合
成音声の品質を向上させる上で極めて重要である。
【0003】従来、ピッチパタンの生成には、話調成分
と呼ばれる発話全体を通して徐々に下降する成分に、ア
クセント成分呼ばれる単語あるいは通して文節ごとの成
分アクセント型に基づく成分重畳する方式が多く用いら
れてきた。例えば、話調成分を単調に減少する直線また
は「へ」の字形のパタンで近似し、アクセント成分を折
れ線で近似する方法が知られている。このような従来技
術については例えば、日本音響学会音声研究会資料S7
8−07(1978−4) 「文音声の音調規則の検
討」(文献1)などに詳述されている。
【0004】図5は、従来技術によるピッチパタンの生
成方法を説明するための図である。これは、「彼は白い
花を買いました。」ののピッチパタンの生成方法を示し
た例であるこの文相は、「彼は」、「白い」、「花
を」、「買いました」という4つのアクセント核を有す
る単位)からなっている。そこで、アクセント成分21
は、4っつの山を持った折れ線で近似されている。各山
の形状は、それぞれののアクセント句のアクセント型、
モーラ数などに基づいて決定される。これを、右下がり
の直線で表されている話調成分22に重畳する事で、文
章のピッチパタン23が生成される。図5のL1−L4
はストレスベルと呼ばれている。隣接するアクセント句
のストレスレベルの相対的な大きさの関係は、文章の構
造を反映しており、ぴっちの自然性に重要である。すな
わち、前後のアクセントの結びつきが弱いと、先行アク
セント句のストレスレベルに後続アクセント句のストレ
スレベルは大きくなる。逆に、意味の上で結びつきが強
いと、後続アクセント句、のストレスレベルの大きさは
小さくなる。
【0005】文献1などの従来のピッチパタン生成方式
では、隣接するアクセント句の結びつきの強さを表す尺
度として、先行アクセント句から受けのアクセント句に
いたるまでのアクセント句数をもちいており、これを分
離度と呼んでいる。分離度は、文章の係り受け構造から
求められる。図6は分離度を説明するための図である。
あるアクセント句境界における分離度が大きいと言うこ
とは、その境界を挟んで先行するアクセント句がより遠
くにあるアクセント句と意味の上で結びついていてお
り、直後のアクセント句との結びつきは弱いということ
を表している。図6の「彼は」は、「買いました」に係
わっており、直後の「白い」との結びつきは弱い。ま
た、先行アクセント句が後続するアクセント句に直接係
わっているとき、分離度は、最小値1となる。図6の例
では、「白い」と「花を」の関係、及び「花を」と「買
いました」の関係がそれである。そして、分離度の大き
いアクセント句境界においては、後続アクセント句のス
トレスレベルを、先行アクセント句のストレスレベルよ
りも大きくし、分離度の小さいアクセント句境界におい
ては、後続アクセント句のストレスレベルよりも小さく
なるようにする。
【0006】以上のように、従来のピッチパタン生成方
式では、文章の係り受け構造を用いて隣接するアクセン
ト句の結びつきの強さを調べ強弱に応じて各アクセント
句のストレスレベルを決定していた。このようにして生
成されたアクセント成分を、話調成分に重畳することに
よって、文章の全体のピッチパタンを生成していた。
【0007】
【発明が解決しようとする課題】従来のピッチパタン生
成方式では、文章を構成するアクセント句の係り受け構
造が用いられており、これが正しく求められていること
が前提となっている。しかしながら、一般に、文章の係
り受け構造を常に正確に解析することは困難である。こ
のため、係り受け構造の解析誤りが原因で、生成される
ピッチパタンが不自然になるという問題点があった。
【0008】そこで、本発明の目的は、文章の係り受け
構造を用いることなしに、自然なピッチパタンを生成す
ることが可能なピッチパタン生成装置を提供することに
ある。
【0009】
【課題を解決するための手段】前述の課題を解決するた
め、本発明によるピッチパタン生成装置は、任意の文章
を音声で読み上げる音声合成装置におけるピッチパタン
生成装置であって隣接するアクセント句の大きさの比を
品詞の組み合わせごとに記憶するストレスベル比記憶部
と、入力された文章をそれを構成する単語に分割して各
単語の品詞及びアクセント句境界を決定する形態素解析
部と、各アクセント句境界の前後にある単語の品詞の組
み合わせに応じて前記ストレスレベル比記憶部からアク
セント句の大きさの比を読み出すアクセント成分生成部
と、前記読み出されたアクセント句の大きさの比に基づ
いてピッチパタンを生成するピッチパタン生成部を備え
て構成される。
【0010】
【作用】本発明では、文章の係り受け構造よりも正確に
求めることが可能な単語の品詞に基づいてピッチパタン
を生成することにより、従来方式に比べより自然なピッ
チパタンを生成することを可能とする。
【0011】
【実施例】次に、本発明の実施例について図面を参照し
ながら説明する。先に述べたように、従来方式では、正
確な係り受け構造の解析が困難であることに起因して、
不自然なピッチパタンが生成されてしまうことがある。
これに対して、本発明では係り受け構造を用いずにピッ
チパタンを生成する。本発明では、文章の係り受け構造
よりも正確に求めることが可能な単語の品詞に基づいて
ピッチパタンを生成する。各アクセント句境界の前後に
ある単語の品詞の組み合わせは、前後のアクセント句の
意味の上での結びつきの強さを反映していると考えられ
る。図3は、本発明によるピッチパタンの生成方法を説
明するための図である。この文章は、「彼は」、「白
い」、「花を」、「買いました」という4つのアクセン
ト句からなっている。例えば、「白い」と「花を」の境
界における品詞の組み合わせは、「形容詞・連体詞+名
詞」である。この組み合わせから、先行する形容詞が直
後の名詞を直接修飾していることを推察することは容易
である。
【0012】そこで、アクセント句境界の前後にある単
語の品詞の組み合わせごとに、境界前後のアクセント句
のストレスレベルの比(先行アクセント句のストレスレ
ベルに対する後続アクセント句のストレスレベルの比、
あるいはその逆数)を予め定めて置く。図4は、品詞の
組み合わせごとのストレスレベル比の一例を示すための
図である。これらの値は、例えば、人間が発声した文章
音声に基づいて決定しておくことが考えられる。
【0013】ピッチパタンを生成する際には、先ず、読
み上げるべき文章を形態素解析によって単語に分割し、
品詞を定める。次に、各アクセント句境界において、境
界前後の単語の品詞に基づいて、境界の前後にあるアク
セント句のストレスレベル比を求める。図3では、例え
ば、「花を」のストレスレベルは、先行する「白い」の
ストレスレベルの0.7倍となる。これは、この2つの
アクセント句が「形容詞・連体形+名詞」の連鎖である
ことから定まる値である。このように、各アクセント句
境界においてストレスレベル比を求めた後、文頭のアク
セント句のストレスレベルに対する全てのアクセント句
のストレスレベルの比を求める。例えば「花を」の「彼
は」に対する比は1.2×0.7=0.84として求め
られる。これにより、文頭のアクセント句のストレスレ
ベルの値(例えば80Hzなど)を与えれば、文章中の
全てのアクセント句のストレスレベルの値を算出するこ
とができる。このようにして得られたアクセント成分を
話調成分に重畳することによって、文章のピッチパタン
を生成する。
【0014】以上、話調成分にアクセント成分を重畳す
る方式に基づいて説明を行ったが、本発明は、話調成分
を用いない方式にも容易に適用できる。例えば、アクセ
ント成分と話調成分を別々のモデルで生成して重畳する
代わりに、各アクセント句について少なくとも一点(例
えば、ピッチ周波数がピークになる時点)のピッチ周波
数を与え、その値に基づいて各アクセント句の形状を決
定し、直接文章全体のピッチパタンを生成する装置が考
えられる。この装置においては、例えば、各アクセント
句のピッチ周波数のピーク値を与えるのであれば、スト
レスレベル比の代わりに、隣接するアクセント句のピッ
チ周波数のピーク値の比を、品詞の組み合わせごとに用
意しておけば良い。
【0015】一般に、形態素解析による品詞の特定は、
係り受け解析による係り受け構造の推定よりも正確に行
うことができる。本発明は、この品詞の情報を用いてピ
ッチパタンを生成するので、従来のピッチパタン生成方
式に比べ誤りを生じることが少なく、自然なピッチパタ
ンを生成することが可能である。
【0016】図1は、本発明によるピッチパタン生成装
置を実現するための一実施例を示すブロック図である。
先ず、音声で読み上げるべき文章を表す文字列が、文字
列入力端子11から入力される。入力された前記文字列
は形態素解析部12に送られる。形態素解析部12は、
入力文字列で表される文章を単語に分解し、各単語の品
詞やアクセント句境界を決定する。この結果を、アクセ
ント成分生成部13及び話調成分生成部15に送る。
【0017】ストレスレベル比記憶部14には、アクセ
ント句境界の前後にある単語の品詞の組み合わせごと
に、境界前後のアクセント句のストレスレベルの比が蓄
えらている。アクセント成分生成部13は、各アクセン
ト句境界の前後にある単語の品詞の組み合わせに基づい
て、ストレスレベル比記憶部14からストレスレベル比
を読み出す。読み出したストレスレベル比を用いて、作
用の項で説明したような手法により、文章中の全てのア
クセント句のストレスレベルの値を決定し、アクセント
成分を生成する。話調成分生成部15は、形態素解析部
12の解析結果に基づいて、必要によっては入力文章を
複数の話調成分に分割した後、時間の経過とともにピッ
チ周波数が低くなっていく直後などで近似された話調成
分を生成する。ピッチパタン生成部16は、アクセント
成分生成部13と話調成分生成部15とでそれぞれ生成
されたアクセント成分と話調成分とを加え合わせること
により文章全体のピッチパタンを生成し、ピッチパタン
出力端子17から出力する。
【0018】図2は、図1に示す装置のより詳細なブロ
ック図である。図中、図1と同一符号が付されている要
素は同様な機能をもつ要素である。先ず、音声で読み上
げるべき文を表す文字列が、文字列入力端子11から入
力される。入力された前記文字列は形態素解析部121
に送られる。形態素解析部121は、単語辞書122を
用いて入力文字列で表される文を単語に分割し、各単語
の読みや品詞、アクセント型、アクセント句境界位置を
決定する。このような形態素解析部については、米国出
願中特許出願番号第07/487044号に詳しいので
説明を省略する。
【0019】形態素解析部121で生成された単語の読
みや品詞、アクセント型、アクセント句境界位置は、ア
クセント成分モデル読み出し部131、ストレスレベル
比読み出し部133、及び音素継続時間長記憶部152
にそれぞれ送られる。アクセント成分モデル記憶部13
2には、単語のアクセント型ごとのピッチパタンの概形
が記憶されている。アクセント成分モデル読み出し部1
31は、形態素解析部121から送られてくる各単語の
アクセント型にしたがって、アクセント成分モデル記憶
部132に蓄えられているアクセント句のピッチパタン
の概形を読み出し、アクセント成分モデル編集部134
に送る。
【0020】ストレスレベル比記憶部14は、図4に示
した例にように、アクセント句境界の前後にある単語の
品詞の組み合わせごとに、境界前後のアクセント句のス
トレスレベルの比の値を蓄えている。ストレスレベル比
読み出し部133は、各アクセント句境界の前後にある
単語の品詞の組み合わせに対応するストレスレベル比
を、ストレスレベル比記憶部14から読み出す。アクセ
ント成分モデル編集部134は、ストレスレベル比読み
出し部133によって読み出されたストレスレベル比を
用いて、作用の項で説明したような手法によって、文中
の全てのアクセント句のストレスレベルの値を決定し、
アクセント成分モデル読み出し部131で読み出された
アクセント句ごとのピッチパタンのストレスレベルを変
更し、文全体のアクセント成分を生成する。
【0021】次に、音素継続時間長算出部151は、形
態素解析部121で得られた単語の読み、すなわち音素
の系列を用いて、発声されるべき各音素の継続時間長を
算出する。これは、例えば、予め各音素の平均的な継続
時間長を音素継続時間長記憶部152に蓄えておき、こ
れを読み出すことにより実現することができる。呼気段
落長算出部153は、文を構成する呼気段落の継続時間
長を算出する。ここで、呼気段落とは、ポーズによって
区切られる発話の単位であり、1つの呼気段落は1つの
話調成分を形作るものである。もし、文中にポーズが1
つも現れなければその文は1つの呼気段落になる。ま
た、文中にポーズが1つ現れるならばその文は2つの呼
気段落から構成されることになる。ポーズを文のどの位
置に挿入するかの判定については、本願の発明には直接
関係しないので説明は省略する。呼気段落長算出部15
3は、文を構成する呼気段落ごとに、その呼気段落に含
まれる全ての音素の継続時間長を加算することにより、
呼気段落の継続時間長を算出する。
【0022】話調成分算出部154は、話調成分の概形
を決定するために必要な話調の始端と終端のピッチ周波
数を始端周波数記憶部155、終端周波数記憶部156
からそれぞれ読み出す。さらに、呼気段落長算出部15
3で計算された呼気段落の継続時間長を用いて、話調成
分の傾きを計算する。すなわち、 話調成分の傾き[Hz/sec]=(話調終端周波数
[Hz]−話調始端周波数[Hz]/呼気段落継続時間
長[sec])である。これにより、話調成分の概形が
決定される。最後に、加算器160は、アクセント成分
モデル編集部134で計算されたアクセント成分と、話
調成分算出部154で計算された話調成分とを加算する
ことによって、入力文のピッチパタンを計算し、ピッチ
パタン出力端子17から出力する。
【0023】
【発明の効果】以上説明したように、本発明では、正し
く解析することが困難な係り受け解析の結果を用いるこ
となしにピッチパタンを決定するので、従来方式に比べ
より自然なピッチパタンを生成することが可能である。
したがって、本発明は、文字列で与えられた任意の文章
を音声で読み上げる音声合成装置等におけるピッチパタ
ン生成装置として極めて有効である。
【図面の簡単な説明】
【図1】本発明によるピッチパタン生成装置を実現する
ための一実施例を示すブロック図である。
【図2】図1に示す実施例の詳細構成ブロック図であ
る。
【図3】本発明によるピッチパタンの生成方法を説明す
るための図である。
【図4】品詞の組み合わせごとのストレスレベル比の一
例を示すための図である。
【図5】従来技術によるピッチパタンの生成方法を説明
するための図である。
【図6】分離度を説明するための図である。
【符号の説明】
11 文字列入力端子 12 形態素解析部 13 アクセント成分生成部 14 ストレスレベル比記憶部 15 話調成分生成部 16 ピッチパタン生成部 17 ピッチパタン出力端子 21 アクセント成分 22 話調成分 23 ピッチパタン

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】任意の文章を音声で読み上げる音声合成装
    置におけるピッチパタン生成装置であって隣接するアク
    セント句の大きさの比を品詞の組み合わせごとに記憶す
    るストレスベル比記憶部と、入力された文章をそれを構
    成する単語に分割して各単語の品詞及びアクセント句境
    界を決定する形態素解析部と、各アクセント句境界の前
    後にある単語の品詞の組み合わせに応じて前記ストレス
    レベル比記憶部からアクセント句の大きさの比を読み出
    すアクセント成分生成部と、前記読み出されたアクセン
    ト句の大きさの比に基づいてピッチパタンを生成するピ
    ッチパタン生成部とを備えることを特徴とするピッチパ
    タン生成装置。
  2. 【請求項2】前記ピッチパタン生成部は、前記アクセン
    ト成分生成部から読み出されたアクセント成分を前記文
    章の話調成分に重畳して前記ピッチパタンを生成する請
    求項1記載のピッチパタン生成装置。
  3. 【請求項3】前記ピッチパタン生成部は、各単語につい
    て少なくとも一点のピッチ周波数を与え、その値に基づ
    いて各単語の形状を決定し、前記文章全体のピッチパタ
    ンを生成する請求項1記載のピッチパタン生成装置。
JP4355726A 1991-12-20 1992-12-19 ピッチパタン生成装置 Expired - Lifetime JP2785628B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4355726A JP2785628B2 (ja) 1991-12-20 1992-12-19 ピッチパタン生成装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP33865491 1991-12-20
JP3-338654 1991-12-20
JP4355726A JP2785628B2 (ja) 1991-12-20 1992-12-19 ピッチパタン生成装置

Publications (2)

Publication Number Publication Date
JPH05333892A true JPH05333892A (ja) 1993-12-17
JP2785628B2 JP2785628B2 (ja) 1998-08-13

Family

ID=26576156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4355726A Expired - Lifetime JP2785628B2 (ja) 1991-12-20 1992-12-19 ピッチパタン生成装置

Country Status (1)

Country Link
JP (1) JP2785628B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007163667A (ja) * 2005-12-12 2007-06-28 Nippon Hoso Kyokai <Nhk> 音声合成装置および音声合成プログラム
JP2015172625A (ja) * 2014-03-11 2015-10-01 富士通株式会社 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60195596A (ja) * 1984-03-19 1985-10-04 三洋電機株式会社 音声合成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60195596A (ja) * 1984-03-19 1985-10-04 三洋電機株式会社 音声合成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007163667A (ja) * 2005-12-12 2007-06-28 Nippon Hoso Kyokai <Nhk> 音声合成装置および音声合成プログラム
JP2015172625A (ja) * 2014-03-11 2015-10-01 富士通株式会社 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム

Also Published As

Publication number Publication date
JP2785628B2 (ja) 1998-08-13

Similar Documents

Publication Publication Date Title
US5475796A (en) Pitch pattern generation apparatus
Klatt Review of text‐to‐speech conversion for English
JPH0833744B2 (ja) 音声合成装置
JPH10153998A (ja) 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
JP2000206982A (ja) 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体
JP2785628B2 (ja) ピッチパタン生成装置
CA2343071A1 (en) Device and method for digital voice processing
JP3006240B2 (ja) 音声合成方法および装置
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JP2001100777A (ja) 音声合成方法及び装置
JPH05224688A (ja) テキスト音声合成装置
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP2703253B2 (ja) 音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
JP3357796B2 (ja) 音声合成装置及び同装置における韻律情報生成方法
JP3088211B2 (ja) 基本周波数パタン生成装置
JP2573587B2 (ja) ピッチパタン生成装置
JP3060422B2 (ja) 音声規則合成装置
JP2577372B2 (ja) 音声合成装置および方法
JP3152915B2 (ja) 韻律情報生成方式
JPH08328578A (ja) テキスト音声合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPH056191A (ja) 音声合成装置
JPH04270394A (ja) ポーズ長決定方式
JPH0553595A (ja) 音声合成装置