JPH04270394A - ポーズ長決定方式 - Google Patents

ポーズ長決定方式

Info

Publication number
JPH04270394A
JPH04270394A JP3103257A JP10325791A JPH04270394A JP H04270394 A JPH04270394 A JP H04270394A JP 3103257 A JP3103257 A JP 3103257A JP 10325791 A JP10325791 A JP 10325791A JP H04270394 A JPH04270394 A JP H04270394A
Authority
JP
Japan
Prior art keywords
pause
length
utterance
time length
exhalation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3103257A
Other languages
English (en)
Inventor
Kazuhiko Iwata
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3103257A priority Critical patent/JPH04270394A/ja
Publication of JPH04270394A publication Critical patent/JPH04270394A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、規則音声合成等におい
て、文節間に挿入するポーズの長さを決定するポーズ長
決定方式に関する。
【0002】
【従来の技術】任意の文章を音声に変換する規則音声合
成においては、文中の適切な位置に適切な長さのポーズ
を挿入することが必要であり、合成される文章音声の自
然性を向上させる上で重要である。人間には一息で発声
できる長さに限界があり、発声者は、意味の上で結びつ
きの弱い適当な文節境界において、息継ぎのためや聞き
手に意味の切れ目を伝えるために適切な長さのポーズを
置く。これにより、1つの文章は挿入されるポーズによ
って、2つ以上のまとまりに分けられる。このような、
2つのポーズに挟まれた1つ以上の文節からなるまとま
り、すなわち一息で発声される単位を呼気段落と呼ぶ。 2つの呼気段落間に挿入されるポーズは、息継ぎとして
の役割と、意味や意思を伝えるための役割とを持つ。し
たがって、合成音声を生成する際においても、文章中に
適度な長さのポーズが挿入されていないと聞き手は不自
然さを感じる。
【0003】従来、挿入されるポーズの長さの決定には
、隣接する呼気段落間の意味の上での結びつきの強さと
、前後の呼気段落のモーラ数とが用いられていた。これ
は、前後の呼気段落の結びつきが弱いほど、また、モー
ラ数が多くなるなど長いポーズが挿入され易い、という
性質に基づいている。まず、文節同士の結びつきの強さ
を、先行文節から受けの文節に至るまでの文節数で表現
し、この尺度を分離度と呼ぶ。分離度の値が大きいとい
うことは、ある文節がより遠くにある文節と結びついて
おり、隣接する文節との結びつきは弱いということを表
している。したがって、分離度の大きい文節境界に挿入
されるポーズ長は長くなる。一方、人間には一息で発声
できる長さに限界があり、発声者は適当な位置で息継ぎ
のためにポーズを置く。したがって、呼気段落境界の前
後の呼気段落内の総モーラ数が多くなるほど、長いポー
ズが挿入され易くなる。以上のことから、分離度と総モ
ーラ数との積の値に応じて挿入するポーズ長を決定する
【0004】このようなポーズ長の決定方法については
、箱田らによる日本音響学会音声研究会資料S78−0
7(1978−4)「文音声の音調規則の検討」(文献
1)に詳述されている。
【0005】
【発明が解決しようとする課題】規則音声合成方式にお
いては、発声速度を様々に変化させた合成音声を出力さ
せたいという要求がある。人間が異なる発声速度で発声
する場合は、挿入されるポーズの長さは大きく変化する
。しかしながら、文節間の分離度と文節のモーラ数によ
ってポーズ調を決定していた従来方法では、発声速度を
変化させた場合のポーズ長の決定に対応することは難し
く、これを用いて生成された合成音声は自然性に欠ける
という問題点があった。
【0006】本発明の目的は、様々な発声速度において
も自然音声に近いポーズ長を決定することが可能なポー
ズ長決定方式を提供することにある。
【0007】
【課題を解決するための手段】本発明は、隣接する文節
の結合の強さに基づき文節間に挿入するポーズの長さを
決定するポーズ長決定方式であって、発声速度及び隣接
する文節の結合の強さを入力し、前記発声速度に応じて
文節ごとの発声時間長を算出し、前記文節ごとの発声時
間長と前記文節の結合の強さとに基づいて隣接する文節
間に挿入するポーズの長さを決定することを特徴とする
【0008】
【作用】本発明は、ポーズを挿入すべき位置が予め求め
られている場合に、そこに挿入されるポーズの長さを決
定するものである。ポーズ挿入位置において、意味の上
での切れ目の深さと、挿入位置の前後の呼気段落の、発
声速度に応じた発声時間長とを用いて決定する。これに
より、様々な発声速度においても自然音声に近いポーズ
の長さを決定することが可能である。
【0009】まず、合成音声の発声速度が外部から指定
される。隣接する2つの呼気段落P1,P2の間に挿入
するポーズの長さを決定する場合、まず、この指定され
た発声速度に応じて呼気段落P1,P2の発声時間長L
1,L2を算出する。呼気段落の発声時間長は、例えば
、呼気段落内の各音素の、前記指定された発声速度にお
ける継続時間長の総和をとることによって求めることが
できる。また、呼気段落P1,P2の意味の上での結び
つきの強さを表す情報が入力される。これには、例えば
、(従来の技術)の項で述べたような分離度等を用いる
ことができる。すなわち、呼気段落間の結びつきの強さ
を、呼気段落境界の直前と直後の文節の分離度で表す。
【0010】算出された呼気段落の発声時間長と入力さ
れた分離度とを用いて、ポーズ長を決定する。これには
、例えば、ポーズ挿入位置前後の呼気段落の発声時間長
の和(L1+L2)と分離度との積の値を用いて決定す
る方法を用いることができる。この積の値にいくつかの
閾値を設け、それぞれの閾値を越えた場合に対応するポ
ーズ長を予め定めておく。そして、算出された呼気段落
の発声時間長の和と分離度との積がどの閾値を越えてい
るかで、挿入するポーズ長を決定する。本発明方式と文
献1に記載の方式との違いは、文献1では総モーラ数を
用いるが、本発明では発声時間長を用いる点にある。 発声速度を変える場合には、呼気段落の発声時間長が変
わる。発声時間長が短くなれば挿入されるポーズも短く
なり、発声時間長が長くなればポーズも長くなる。総モ
ーラ数を用いる方法では、このように発声時間長が変化
する場合には対応することができない。これに対して本
発明では、総モーラ数の代わりに発声時間長を用いるの
で、発声時間長が変わった場合にも容易に対応すること
が可能である。
【0011】
【実施例】図1は、本発明によるポーズ長決定方式を実
現するための一実施例を示すブロック図である。
【0012】まず、音声に変換される文字列を、文字列
入力端子11から入力する。文字列を音声に変換する際
の文章全体の発声速度を、発声速度入力端子12から入
力する。発声速度の入力は、単位時間当たりのモーラ数
等の速度の単位で指定したり、予め決めておいた何段階
かの発声速度の中から選択したりする等の方法によって
行うことができる。また、入力文字列を音声に変換する
際にポーズが挿入されるべき文節境界をポーズ挿入位置
入力端子13から入力する。入力された文字列、発声速
度、及びポーズ挿入位置は呼気段落発声時間長算出部1
5に送られる。呼気段落発声時間長算出部15では、ま
ず、ポーズ挿入位置の情報から入力文字列を呼気段落に
分割する。次に、各呼気段落の発声速度に応じた発声時
間長を算出し、ポーズ長決定部16に送る。
【0013】また、文章を構成する各文節の隣接文節と
の結びつきの強さ、すなわち文節結合度を文節結合度入
力端子14から入力し、ポーズ長決定部16に送る。ポ
ーズ長決定部16は、各呼気段落の発声時間長と、呼気
段落境界における文節結合度とから、(作用)の項で示
したような手法を用いて挿入すべきポーズの長さを決定
する。この結果を、ポーズ長出力端子17から出力する
【0014】
【発明の効果】以上述べてきたように、本発明によれば
、様々な発声速度において自然音声に近いポーズの長さ
を決定することが可能であり、これにより合成される音
声の自然性を向上させることができる。したがって、本
発明は、特に発声速度を種々に変えた合成音声を生成す
る必要がある規則音声合成装置等におけるポーズ長決定
方式として有効である。
【図面の簡単な説明】
【図1】本発明によるポーズ長決定方式を実現するため
の一実施例を示すブロック図である。
【符号の説明】 11  文字列入力端子 12  発声速度入力端子 13  ポーズ挿入位置入力端子 14  文節結合度入力端子 15  呼気段落発声時間長算出部 16  ポーズ長決定部 17  ポーズ長出力端子

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】隣接する文節の結合の強さに基づき文節間
    に挿入するポーズの長さを決定するポーズ長決定方式で
    あって、発声速度及び隣接する文節の結合の強さを入力
    し、前記発声速度に応じて文節ごとの発声時間長を算出
    し、前記文節ごとの発声時間長と前記文節の結合の強さ
    とに基づいて隣接する文節間に挿入するポーズの長さを
    決定することを特徴とするポーズ長決定方式。
JP3103257A 1991-02-26 1991-02-26 ポーズ長決定方式 Pending JPH04270394A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3103257A JPH04270394A (ja) 1991-02-26 1991-02-26 ポーズ長決定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3103257A JPH04270394A (ja) 1991-02-26 1991-02-26 ポーズ長決定方式

Publications (1)

Publication Number Publication Date
JPH04270394A true JPH04270394A (ja) 1992-09-25

Family

ID=14349391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3103257A Pending JPH04270394A (ja) 1991-02-26 1991-02-26 ポーズ長決定方式

Country Status (1)

Country Link
JP (1) JPH04270394A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008116826A (ja) * 2006-11-07 2008-05-22 Nippon Hoso Kyokai <Nhk> 休止時間長算出装置及びそのプログラム、並びに音声合成装置
JP2009008910A (ja) * 2007-06-28 2009-01-15 Fujitsu Ltd 音声読み上げのための装置、プログラム及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008116826A (ja) * 2006-11-07 2008-05-22 Nippon Hoso Kyokai <Nhk> 休止時間長算出装置及びそのプログラム、並びに音声合成装置
JP2009008910A (ja) * 2007-06-28 2009-01-15 Fujitsu Ltd 音声読み上げのための装置、プログラム及び方法

Similar Documents

Publication Publication Date Title
US5668926A (en) Method and apparatus for converting text into audible signals using a neural network
Doi et al. Esophageal speech enhancement based on statistical voice conversion with Gaussian mixture models
US6990451B2 (en) Method and apparatus for recording prosody for fully concatenated speech
US6871178B2 (en) System and method for converting text-to-voice
KR100720175B1 (ko) 음성합성을 위한 끊어읽기 장치 및 방법
JPH04270394A (ja) ポーズ長決定方式
JPH03273280A (ja) 発声練習用音声合成方式
JP2748445B2 (ja) ポーズ挿入位置決定方式
JPH0580791A (ja) 音声規則合成装置および方法
JPH05134691A (ja) 音声合成方法および装置
JPH02293900A (ja) 音声合成装置
JPH0683381A (ja) 音声合成装置
JP2536896B2 (ja) 音声合成装置
JP3142160B2 (ja) 発音記号生成装置
JP2785628B2 (ja) ピッチパタン生成装置
Nakamura et al. Enhancement of esophageal speech using statistical voice conversion
JP2513266B2 (ja) 音韻継続時間長決定装置
JP2581130B2 (ja) 音韻継続時間長決定装置
Munoz-Luna et al. Spectral study with automatic formant extraction to improve non-native pronunciation of English vowels
KR100269215B1 (ko) 음성 합성을 위한 발화구의 기본 주파수 궤적 생성 방법
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH03249800A (ja) テキスト音声合成装置
TW476060B (en) Smoothening apparatus and method for quick synthesized voice
JPH06138894A (ja) 音声合成装置及び音声合成方法
JPH03225400A (ja) ポーズ長決定方式