JPH02115898A - ポーズ挿入位置決定方式 - Google Patents

ポーズ挿入位置決定方式

Info

Publication number
JPH02115898A
JPH02115898A JP63269759A JP26975988A JPH02115898A JP H02115898 A JPH02115898 A JP H02115898A JP 63269759 A JP63269759 A JP 63269759A JP 26975988 A JP26975988 A JP 26975988A JP H02115898 A JPH02115898 A JP H02115898A
Authority
JP
Japan
Prior art keywords
pause
voicing
insertion position
phrase
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63269759A
Other languages
English (en)
Other versions
JP2748445B2 (ja
Inventor
Kazuhiko Iwata
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63269759A priority Critical patent/JP2748445B2/ja
Publication of JPH02115898A publication Critical patent/JPH02115898A/ja
Application granted granted Critical
Publication of JP2748445B2 publication Critical patent/JP2748445B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、規則音声合成等において、文節間に挿入する
ポーズの挿入位置を決定するポーズ挿入位置決定方式に
関する。
(従来の技術) 任意の文章を音声に変換する規則音声合成においては、
文中の適切な位置に適切な長さのポーズを挿入すること
が必要であり、合成される文章音声の自然性を向上させ
る上で重要である。すなわち、人間には一息で発声でき
る長さに限界があり、発声者は、意味の上で結び付きの
弱い適当な文節の境界において、息継ぎのためや聞き手
に意味の切れ目を伝えるためにポーズを置く。したがっ
て、合成音声を生成する際においても、適度にポーズが
挿入されていないと聞き手は不自然さを感じる。
従来、ポーズの挿入位置の決定には、隣接する文節と文
節の結びつきの強さと、前後の文節のモーラ数とが用い
られていた。すなわち、前後の文節の結びつきが弱いほ
どポーズは挿入され易く、また、モーラ数が多くなると
息継ぎを行うために挿入が起こり易くなる、という性質
を利用する。
まず、文節と文節の境界における結びつきの強さを、先
行文節から受けの文節に至るまでの文節数で表現し、こ
の尺度を分離度と呼ぶ。分離度の値が大きいということ
は、ある文節がより遠くにある文節と結びついており、
隣接する文節との結びつきが弱いということを表してい
る。したがって、分離度の大きい文節境界では、ポーズ
が挿入される可能性が高いと考える。一方、人間には一
息で発声できる長さに限界があり、発声者は適当な位置
で息継ぎのためにポーズを置く。したがって、文節境界
の前後の文節の総モーラ数が多い場合にポーズが挿入さ
れ易いと考える。以上のことから、分離度と総モーラ数
との積の値を、ポーズを挿入するかどうかの判断の尺度
として用い、これがある閾値を越える場合にポーズが挿
入されるとする。
このようなポーズ挿入位置の決定方法については、楕円
らによる日本音響学会音声研究会資料578−07(1
978−4) f文音声の音調規則の検討」に詳述され
ている。
(発明が解決しようとする問題点) 規則音声合成方式においては、発声速度を様々に変化さ
せた合成音声を出力させたいという要求がある。人間が
異なる発声速度で発声する場合は、挿入されるポーズの
長さだけでなく、ポーズの挿入される位置や挿入が起こ
る場所の数が大きく変わる。しかしながら、文節間の分
離度と文節のモーラ数によってポーズ挿入位置を決定し
ていた従来方法では、発声速度を変化させた場合のポー
ズ挿入位置の決定に対応することは難しく、これを用い
て生成された合成音声は自然性に欠けるという問題点が
あった。
これに対して本発明は、様々な発声速度において、自然
音声に近いポーズの挿入位置を決定することが可能なポ
ーズ挿入位置決定方式を提供することを目的としている
(問題点を解決するための手段) 本発明は、隣接する文節の結合の強さから文節間にポー
ズ挿入するかどうかを決定するポーズ挿入位置決定方式
であって、文節を示す文字列及び発声速度が入力され前
記発声速度に応じて文節ごとの発声時間を算出する手段
と、前記文節ごとの発声時間と前記文節の結合の強さを
示すパラメータが入力され隣接する文節間にポーズを挿
入するかどうかを決定することを特徴とする。
(作用) 本発明では、様々な発声速度において自然音声に近いポ
ーズの挿入位置を決定することを可能にするために、文
節境界において、その文節境界にポーズを挿入しないで
一息で発声した場合の発声時間が、−息で発声できる限
度内に入っているかどうかを調べることによって、その
位置にポーズを挿入するかどうかを決定する。以下では
、図を用いてこの方法の詳しい説明を行う。
第2図は、本発明のポーズ挿入位置決定方法を説明する
ための図である。
まず、合成音声の発声速度を指定し、この発声速度に応
じて、文章を構成する文節P1、B2、B3、B4の発
声時間長L1、B2、B3、B4を算出する。文節の発
声時間長は、例えば、文節内の各音素の、前記指定され
た発声速度における継続時間長の総和をとることによっ
て求めることができる。次に、文節間の結びつきの強さ
を表す情報を入力する。
これには、例えば、(従来の技術)の項で述べたような
分離度等を用いることができる。この分離度が大きい文
節境界から順に、ポーズ挿入位置の候補とする。第2図
に示す例の場合、ポーズ挿入位置の候補順位は、文節境
界B1、B2、B3の順となる。
そこでまず、文節境界B1にポーズを挿入するかどうか
を調べる。これには、文節境界B1の直前・直後の呼気
段落長の和LBIを用いる。ここで、呼気段落とは息継
ぎなしに一息で発声する単位、また、呼気段落長とはそ
の一呼気段落の発声時間長をいうものとする。文節境界
B1の直前にあるのは文節境界P1のみであり、呼気段
落長はLlである。
方、文節境界B1の後ろには文節P2、B3、B4があ
るが、これらの境界にはまだポーズが挿入されていない
。したがって、文節P2; B3、B4は一息で発声さ
れることになり、文節境界B1の直後の呼気段落長は、
B2 + B3 + B4となる。これより、文節境界
B1の直前・直後の呼気段落長の和LBIはLl + 
L2 + L3 + L4となる。ところが、人間は、
−息で発声できる長さに限界があるため、この限界と文
章の意味の上での切れ目とから、適切な位置に息継ぎを
入れて発声する。そこで、−息で発声できる呼気段落長
の上限値LmaXを予め求めておき、これと文節境界B
1の直前・直後の呼気段落長の和LBIとを比較する。
呼気段落長の上限値Lma3cは、ある特定の人が発声
した文章音声から求めることもできるし、あるいは、複
数の人の発声した文章音声から平均的に求めることも可
能である。そして、前記LBIがLmaxよりも短い場
合は、−息で発声することができることになるので、ポ
ーズは挿入されないと判断する。第2図に示した例では
、LBIはLmaxよりも長くなっているので文節境界
B1にポーズが挿入される。
次に、二番目に分離度の大きい文節境界B2の直前・直
後の呼気段落長の和LB2を調べる。文節境界B2の直
前の呼気段落長は、文節境界B1に既にポーズが挿入さ
れているので、L2となる。一方、直後の呼気段落長は
L3 + L4であるので、LB2はL2 + L3 
+ L4となる。このLB2と”maxを比較すると、
第2図に示した例では、このLB2は”maxよりも短
くなっているので文節境界B2にはポーズは挿入されな
い。このようにして、全ての文節境界においてその文節
境界にポーズを挿入しないで一息で発声した場合、呼気
段落長が一息で発声できる限度内に入っているかどうか
を調べることによって、ポーズを挿入するかどうかを決
定していく。
以上のようなポーズ挿入位置の決定方法を用いることに
よって、様々な発声速度においても、同一の方法で対応
することが可能となる。第3図は、第2図に示した例よ
りも速い発声速度で発声する場合の例を示すための図で
ある。発声速度が速くなった場合では、文節境界B工の
直前、直後の呼気段落長の和LB1=L1+L2+L3
+L4は、既に呼気段落長の上限値Lmaxよりも短く
なっている。したがって、文節境界B1にはポーズは挿
入されない。
また、第4図は、第2図に示した例よりも遅い発声速度
で発声する場合の例を示すための図である。発声速度が
遅くなった場合、まず、文節境界B1にポーズが挿入さ
れるが、その後の文節境界B2の直前・直後の呼気段落
長の和LB2 = L2 + L3 + L4も呼気段
落長の上限値Lma!よりも長くなっているため、文節
境界B2にもポーズが挿入される。
以上で説明したようなポーズ挿入位置の決定方法を用い
ることによって、様々な発声速度においても、自然音声
に近いポーズの挿入位置を決定することが可能となる。
(実施例) 第1図は、本発明によるポーズ挿入位置決定方式を実現
するための一実施例を示すブロック図である。
まず、音声に変換される文字列を、文字列入力端子11
から入力する。また、前記文字列を音声に変換する際の
文章全体の発声速度を、発声速度入力端子12から入力
する。発声速度の入力は、単位時間当りモーラ数等の速
度の単位で指定する、予め決めておいた何段階かの発声
速度の中から選択する等の方法によって行うことかでき
る。入力された前記文字列と前記発声速度とは、文節発
声時間算出部14に送られる。文節発声時間算出部14
では、文章を構成している各文節の前記発声速度に応じ
た発声時間を算出し、ポーズ挿入位置決定部15に送る
また、文章を構成する隣接する文節間の結びつきの強さ
を、文節結合度入力端子13から入力し、ポーズ挿入位
置決定部15に送る。ポーズ挿入位置決定部15は、前
記各文節の発声時間と前記文節間の結びつきの強さとか
ら、(作用)の項で説明したような手法を用いてポーズ
を挿入する位置を決定する。この結果を、ポーズ挿入位
置出力端子16から出力する。
(発明の効果) 以上述べてきたように、本発明によれば、同一の方法で
、様々な発声速度において自然音声に近いポーズの挿入
位置を決定することが可能であり、これにより合成され
る音声の自然性を向上させることができる。したがって
、本発明は、特に発声速度を種々に変えた合成音声を生
成する必要がある規則音声合成装置等におけるポーズ挿
入位置決定方式として有効である。
【図面の簡単な説明】
第1図は本発明によるポーズ挿入位置決定方式を実現す
るための一実施例を示すブロック図、第2図、第3図、
第4図は本発明のポーズ挿入位置決定方式を説明するた
めの図である。 図において、11は文字列入力端子、12は発声速度入
力端子、13は文節結合度入力端子、14は文節発声時
間算出部、15はポーズ挿入位置決定部、16はポーズ
挿入位置出力端子である。

Claims (1)

    【特許請求の範囲】
  1. 隣接する文節の結合の強さから文節間にポーズを挿入す
    るかどうかを決定するポーズ挿入位置決定方式であって
    、文節を示す文字例及び発声速度が入力され、前記発声
    速度に応じて文節ごとの発声時間を算出する手段と、前
    記文節ごとの発声時間と前記文節の結合の強さを示すパ
    ラメータが入力され隣接する文節間にポーズを挿入する
    かどうかを決定する手段とから構成されることを特徴と
    するポーズ挿入位置決定方式。
JP63269759A 1988-10-25 1988-10-25 ポーズ挿入位置決定方式 Expired - Lifetime JP2748445B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63269759A JP2748445B2 (ja) 1988-10-25 1988-10-25 ポーズ挿入位置決定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63269759A JP2748445B2 (ja) 1988-10-25 1988-10-25 ポーズ挿入位置決定方式

Publications (2)

Publication Number Publication Date
JPH02115898A true JPH02115898A (ja) 1990-04-27
JP2748445B2 JP2748445B2 (ja) 1998-05-06

Family

ID=17476756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63269759A Expired - Lifetime JP2748445B2 (ja) 1988-10-25 1988-10-25 ポーズ挿入位置決定方式

Country Status (1)

Country Link
JP (1) JP2748445B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014219635A (ja) * 2013-05-10 2014-11-20 日本電信電話株式会社 ポーズ付与装置とその方法とプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3124791B2 (ja) 1991-06-27 2001-01-15 松下電器産業株式会社 音声合成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014219635A (ja) * 2013-05-10 2014-11-20 日本電信電話株式会社 ポーズ付与装置とその方法とプログラム

Also Published As

Publication number Publication date
JP2748445B2 (ja) 1998-05-06

Similar Documents

Publication Publication Date Title
Klatt Review of text‐to‐speech conversion for English
US6990451B2 (en) Method and apparatus for recording prosody for fully concatenated speech
JPH08512150A (ja) ニューラル・ネットワークを利用してテキストを可聴信号に変換する方法および装置
KR100720175B1 (ko) 음성합성을 위한 끊어읽기 장치 및 방법
JPH02115898A (ja) ポーズ挿入位置決定方式
JPH0580791A (ja) 音声規則合成装置および方法
JPH04270394A (ja) ポーズ長決定方式
JPH05134691A (ja) 音声合成方法および装置
JP3142160B2 (ja) 発音記号生成装置
JP2536896B2 (ja) 音声合成装置
JPH0683381A (ja) 音声合成装置
KR100387232B1 (ko) 한국어운율생성장치및방법
JPH02293900A (ja) 音声合成装置
JP2513266B2 (ja) 音韻継続時間長決定装置
JP2578876B2 (ja) 文章読み上げ装置
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
Rizk et al. Arabic Text to Speech Synthesizer: Arabic Letter to Sound Rules
JP3109807B2 (ja) 音声合成方式及び装置
JPH01321496A (ja) 音声合成装置
JPH09146576A (ja) 原文対音声の人工的神経回路網にもとづく韻律の合成装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JP2000075882A (ja) 音声合成方法及び装置
JPH05333892A (ja) ピッチパタン生成装置
JPH08328578A (ja) テキスト音声合成装置
JPH0519780A (ja) 音声規則合成装置および方法