JP2748445B2 - ポーズ挿入位置決定方式 - Google Patents

ポーズ挿入位置決定方式

Info

Publication number
JP2748445B2
JP2748445B2 JP63269759A JP26975988A JP2748445B2 JP 2748445 B2 JP2748445 B2 JP 2748445B2 JP 63269759 A JP63269759 A JP 63269759A JP 26975988 A JP26975988 A JP 26975988A JP 2748445 B2 JP2748445 B2 JP 2748445B2
Authority
JP
Japan
Prior art keywords
pause
insertion position
phrase
utterance
phrases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63269759A
Other languages
English (en)
Other versions
JPH02115898A (ja
Inventor
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63269759A priority Critical patent/JP2748445B2/ja
Publication of JPH02115898A publication Critical patent/JPH02115898A/ja
Application granted granted Critical
Publication of JP2748445B2 publication Critical patent/JP2748445B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、規制音声合成等において、文節間に挿入す
るポーズの挿入位置を決定するポーズ挿入位置決定方式
に関する。
(従来の技術) 任意の文章を音声に変換する規制音声合成において
は、文中の適切な位置に適切な長さのポーズを挿入する
ことが必要であり、合成される文章音声の自然性を向上
させる上で重要である。すなわち、人間には一息で発声
できる長さに限界があり、発声者は、意味の上で結び付
きの弱い適当な文節の境界において、息継ぎのためや聞
き手に意味の切れ目を伝えるためにポーズを置く。した
がって、合成音声を生成する際においても、適度にポー
ズが挿入されていないと聞き手は不自然さを感じる。
従来、ポーズの挿入位置の決定には、隣接する文節と
文節の結びつきの強さと、前後の文節のモーラ数とが用
いられていた。すなわち、前後の文節の結びつきが弱い
ほどポーズは挿入され易く、また、モーラ数が多くなる
と息継ぎを行うために挿入が起こり易くなる、という性
質を利用する。
まず、文節と文節の境界における結びつきの強さを、
先行文節から受けの文節に至るまでの文節数で表現し、
この尺度を分離度と呼ぶ。分離度の値が大きいというこ
とは、ある文節がより遠くにある文節と結びついてお
り、隣接する文節との結びつきが弱いということを表し
ている。したがって、分離度の大きい文節境界では、ポ
ーズが挿入される可能性が高いと考える。一方、人間に
は一息で発声できる長さに限界があり、発声者は適当な
位置で息継ぎのためにポーズを置く。したがって、文節
境界の前後の文節の総モーラ数が多い場合にポーズが挿
入され易いと考える。以上のことから、分離度と総モー
ラ数との積の値を、ポーズを挿入するかどうかの判断の
尺度として用い、これがある閾値を越える場合にポーズ
が挿入されるとする。
このようなポーズ挿入位置の決定方法については、箱
田らによる日本音響学会音声研究会資料S78−07(1978
−4)「文音声の音調規則の検討」に詳述されている。
(発明が解決しようとする問題点) 規則音声合成方式においては、発声速度を様々に変化
させた合成音声を出力させたいという要求がある。人間
が異なる発声速度で発声する場合は、挿入されるポーズ
の長さだけでなく、ポーズの挿入される位置や挿入が起
こる場所の数が大きく変わる。しかしながら、文節間の
分離度と文節のモーラ数によってポーズ挿入位置を決定
していた従来方法では、発声速度を変化させた場合のポ
ーズ挿入位置の穴鉄に対応することは難しく、これを用
いて生成された合成音声は自然性に欠けるという問題点
があった。
これに対して本発明は、様々な発声速度において、自
然音声に近いポーズの挿入位置を決定することが可能な
ポーズ挿入位置決定方式を提供することを目的としてい
る。
(問題点を解決するための手段) 本発明は、隣接する文節の結合の強さから文節間にポ
ーズを挿入するかどうかを決定するポーズ挿入位置決定
方式であって、文節を示す文字列及び発声速度が入力さ
れ前記発声速度に応じて文節ごとの発声時間を算出する
手段と、前記文節ごとの発声時間と前記文節の結合の強
さを示すパラメータが入力され隣接する文節間にポーズ
を挿入するかどうかを決定することを特徴とする。
(作用) 本発明では、様々な発声速度において自然音声に近い
ポーズの挿入位置を決定することを可能にするために、
文節境界において、その文節境界にポーズを挿入しない
で一息で発声した場合の発声時間が、一息で発声できる
限度内に入っているかどうかを調べることによって、そ
の位置にポーズを挿入するかどうかを決定する。以下で
は、図を用いてこの方法の詳しい説明を行う。
第2図は、本発明のポーズ挿入位置決定方法を説明す
るための図である。
まず、合成音声の発声速度を指定し、この発声速度に
応じて、文章を構成する文節P1、P2、P3、P4の発声時間
長L1、L2、L3、L4を算出する。文節の発声時間長は、例
えば、文節内の各音素の、前記指定された発声速度にお
ける継続時間長の総和をとることによって求めることが
できる。次に、文節間の結びつきの強さを表す情報を入
力する。これには、例えば、(従来の技術)の項で述べ
たような分離度等を用いることができる。この分離度が
大きい文節境界から順に、ポーズ挿入位置の候補とす
る。第2図に示す例の場合、ポーズ挿入位置の候補順位
は、文節境界B1、B2、B3の順となる。
そこでまず、文節境界B1にポーズを挿入するかどうか
を調べる。これには、文節境界B1の直前・直後の呼気段
落長の和LB1を用いる。ここで、呼気段落とは息継ぎな
しに一息で発声する単位、また、呼気段落長とはその一
呼気段落の発声時間長をいうものとする。文節境界B1
直前にあるのは文節境界P1のみであり、呼気段落長はL1
である。一方、文節境界B1の後ろには文節P2、P3、P4
あるが、これらの境界にはまだポーズが挿入されていな
い。したがって、文節P2、P3、P4は一息で発声されるこ
とになり、文節境界B1の直後の呼気段落長は、L2+L3
L4となる。これより、文節境界B1の直前・直後の呼気段
落長の和LB1はL1+L2+L3+L4となる。ところが、人間
は、一息で発声できる長さに限界があるため、この限界
と文章の意味の上での切れ目とから、適切な位置に息継
ぎを入れて発声する。そこで、一息で発声できる呼気段
落長の上限値Lmaxを予め求めておき、これと文節境界B1
の直前・直後の呼気段落長の和LB1とを比較する。呼気
段落長の上限値Lmaxは、ある特定の人が発声した文章音
声から求めることもできるし、あるいは、複数の人の発
声した文章音声から平均的に求めることも可能である。
そして、前記LB1がLmaxよりも短い場合は、一息で発声
することができることになるので、ポーズは挿入されな
いと判断する。第2図に示した例では、LB1はLmaxより
も長くなっているので文節境界B1にポーズが挿入され
る。
次に、二番目に分離度の大きい文節境界B2の直前・直
後の呼気段落長の和LB2を調べる。文節境界B2の直前の
呼気段落長は、文節境界B1に既にポーズが挿入されてい
るので、L2となる。一方、直後の呼気段落長はL3+L4
あるので、LB2はL2+L3+L4となる。このLB2とLmaxを比
較すると、第2図に示した例では、このLB2はLmaxより
も短くなっているので文節境界B2にはポーズは挿入され
ない。このようにして、全ての文節境界においてその文
節境界にポーズを挿入しないで一息で発声した場合、呼
気段落長が一息で発声できる限度内に入っているかどう
かを調べることによって、ポーズを挿入するかどうかを
決定していく。
以上のようなポーズ挿入位置の決定方法を用いること
によって、様々な発声速度においても、同一の方法で対
応することが可能となる。第3図は、第2図に示した例
よりも速い発声速度て発声する場合の例を示すための図
である。発声速度が速くなった場合では、文節境界B1
直前・直後の呼気段落長の和LB1=L1+L2+L3+L4は、
既に呼気段落長の上限値Lmaxよりも短くなっている。し
たがって、文節境界B1にはポーズは挿入されない。
また、第4図は、第2図に示した例よりも遅い発声速
度で発声する場合の例を示すための図である。発声速度
が遅くなった場合、まず、文節境界B1にポーズが挿入さ
れるが、その誤の文節境界B2の直前・直後の呼気段落長
の和LB2=L2+L3+L4も呼気段落長の上限値Lmaxよりも
長くなっているため、文節境界B2にもポーズが挿入され
る。
以上で説明したようなポーズ挿入位置の決定方法を用
いることによって、様々な発声速度においても、自然発
声に近いポーズの挿入位置を決定することが可能とな
る。
(実施例) 第1図は、本発明によるポーズ挿入位置決定方式を実
現するための一実施例を示すブロック図である。
まず、音声に変換される文字列を、文字列入力端子11
から入力する。また、前記文字列を音声に変換する際の
文章全体の発声速度を、発声速度入力端子12から入力す
る。発声速度の入力は、単位時間当りモーラ数等の速度
の単位で指定する、予め決めておいた何段階かの発声速
度の中から選択する等の方法によって行うことかでき
る。入力された前記文字列と前記発声速度とは、文節発
声時間算出部14に送られる。文節発声時間算出部14で
は、文章を構成している各文節の前記発声速度に応じた
発声時間を算出し、ポーズ挿入位置決定部15に送る。
また、文章を構成する隣接する文節間の結びつきの強
さを、文節結合度入力端子13から入力し、ポーズ挿入位
置決定部15に送る。ポーズ挿入位置決定部15は、前記各
文節の発声時間と前記文節間の結びつきの強さとから、
(作用)の項で説明したような手法を用いてポーズを挿
入する位置を決定する。この結果を、ポーズ挿入位置出
力端子16から出力する。
(発明の効果) 以上述べてきたように、本発明によれば、同一の方法
で、様々な発声速度において自然音声に近いポーズの挿
入位置を決定することが可能であり、これにより合成さ
れる音声の自然性を向上させることができる。したがっ
て、本発明は、特に発声速度を種々に変えた合成音声を
生成する必要がある規則音声合成装置等におけるポーズ
挿入位置決定方式として有効である。
【図面の簡単な説明】
第1図は本発明によるポーズ挿入位置決定方式を実現す
るための一実施例を示すブロック図、第2図、第3図、
第4図は本発明のポーズ挿入位置決定方式を説明するた
めの図である。 図において、11は文字列入力端子、12は発声速度入力端
子、13は文節結合度入力端子、14は文節発声時間算出
部、15はポーズ挿入位置決定部、16はポーズ挿入位置出
力端子である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】隣接する文節の結合の強さから文節間にポ
    ーズを挿入するかどうかを決定するポーズ挿入位置決定
    方式であって、文節を示す文字列及び発声速度が入力さ
    れ、前記発声速度に応じて文節ごとの発声時間を算出す
    る手段と、前記文節ごとの発声時間と前記文節の結合の
    強さを示すパラメータが入力され隣接する文節間にポー
    ズを挿入するかどうかを決定する手段とから構成される
    ことを特徴とするポーズ挿入位置決定方式。
JP63269759A 1988-10-25 1988-10-25 ポーズ挿入位置決定方式 Expired - Lifetime JP2748445B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63269759A JP2748445B2 (ja) 1988-10-25 1988-10-25 ポーズ挿入位置決定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63269759A JP2748445B2 (ja) 1988-10-25 1988-10-25 ポーズ挿入位置決定方式

Publications (2)

Publication Number Publication Date
JPH02115898A JPH02115898A (ja) 1990-04-27
JP2748445B2 true JP2748445B2 (ja) 1998-05-06

Family

ID=17476756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63269759A Expired - Lifetime JP2748445B2 (ja) 1988-10-25 1988-10-25 ポーズ挿入位置決定方式

Country Status (1)

Country Link
JP (1) JP2748445B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3124791B2 (ja) 1991-06-27 2001-01-15 松下電器産業株式会社 音声合成装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6009403B2 (ja) * 2013-05-10 2016-10-19 日本電信電話株式会社 ポーズ付与装置とその方法とプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3124791B2 (ja) 1991-06-27 2001-01-15 松下電器産業株式会社 音声合成装置

Also Published As

Publication number Publication date
JPH02115898A (ja) 1990-04-27

Similar Documents

Publication Publication Date Title
Liss et al. The effects of familiarization on intelligibility and lexical segmentation in hypokinetic and ataxic dysarthria
US4852170A (en) Real time computer speech recognition system
Strange et al. Dynamic specification of coarticulated German vowels: Perceptual and acoustical studies
Duez On spontaneous French speech: aspects of the reduction and contextual assimilation of voiced stops
JPH08263097A (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
Pereira et al. Some acoustic characteristics of emotion.
Garro et al. Some suprasegmental characteristics of relative clauses in English
JP2748445B2 (ja) ポーズ挿入位置決定方式
Traunmüller Some aspects of the sound of speech sounds
Hamzah et al. Non-durational acoustic correlates of word-initial consonant gemination in Kelantan Malay: The potential roles of amplitude and f0
Atterer et al. Integrating linguistic and performance-based constraints for assigning phrase breaks
JP3142160B2 (ja) 発音記号生成装置
JP3006240B2 (ja) 音声合成方法および装置
JPH04270394A (ja) ポーズ長決定方式
Pickett Sound patterns of speech: An introductory sketch
JP3519852B2 (ja) 文音声変換方法ならびに文音声変換装置における息継ぎ位置決定方法
JP2000066696A (ja) 音声合成装置
Gryllia et al. The many shapes of H
Munoz-Luna et al. Spectral study with automatic formant extraction to improve non-native pronunciation of English vowels
JPS6073595A (ja) 音声入力装置
JP3076047B2 (ja) ポーズ挿入位置決定装置
JP3109807B2 (ja) 音声合成方式及び装置
JP3001210B2 (ja) ポーズ挿入位置決定装置
CN112992183A (zh) 歌唱气息评分方法及装置
JPH03249800A (ja) テキスト音声合成装置