JPH08248993A - 音韻時間長制御方法 - Google Patents

音韻時間長制御方法

Info

Publication number
JPH08248993A
JPH08248993A JP7052557A JP5255795A JPH08248993A JP H08248993 A JPH08248993 A JP H08248993A JP 7052557 A JP7052557 A JP 7052557A JP 5255795 A JP5255795 A JP 5255795A JP H08248993 A JPH08248993 A JP H08248993A
Authority
JP
Japan
Prior art keywords
consonant
time length
syllable
phoneme
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7052557A
Other languages
English (en)
Inventor
Takahiro Kamai
孝浩 釜井
Kiyo Hara
紀代 原
Kenji Matsui
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7052557A priority Critical patent/JPH08248993A/ja
Publication of JPH08248993A publication Critical patent/JPH08248993A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 リズミカルで自然な音韻時間長制御を簡易に
実現すること。 【構成】 CV音声素片の子音時間長を記憶しておき、
等間隔に生成したリズムから該当するCV音声素片の子
音時間長分さかのぼった位置に、各CV音声素片の発音
開始タイミングを設定する。その結果、CV音声素片の
子音から母音への境界部が等間隔に並ぶ。その結果、リ
ズミカルで自然な音声が合成できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自動読書器、電子メー
ル読み上げ装置、電話応答システムなどに応用可能なテ
キスト/音声変換技術、すなわち音声規則合成技術に関
するものである。
【0002】
【従来の技術】音声規則合成技術は任意のテキストを入
力とし、音声に変換して出力するもので、表示部を持た
ない機器や、カーナビゲーションシステムのように人間
が視覚を使えない状況で使用される機器などで、機器か
ら人間への情報手段に広く用いることのできる技術であ
る。また、マルチメディア技術としてもテキスト化され
た情報を人間にわかりやすい形式で伝達する手段として
有効である。
【0003】このようないわばインタフェース技術とし
ての音声規則合成技術には、合成音声の明瞭度が高いこ
とも重要であるが、音声合成にともなう処理が単純であ
ることが重要であることも多い。なぜなら、例えばパソ
コンなどのマルチメディアの枠組みで動作させる場合に
はCPU資源を音声出力以外の処理に多く占有されてい
ることが多く、結果的に限られた処理能力で音声出力を
可能としなければならないからである。
【0004】また、電子ブックなどの携帯型の装置に組
み込むことは、音声出力を可能にすると同時に液晶表示
部を簡素化するなどのメリットがあるが、そのような小
型で安価な装置には高性能なCPUが使用できないこと
が多い。
【0005】以上のような観点から、音声規則合成技術
には処理量が少ないことが重要であると言える。
【0006】そのような目的で音声素片編集型の規則合
成方法が発明されている(特願平6−302471)。
そのシステムでは音節単位の音声波形素片を編集するこ
とにより任意の文章を合成する。音声波形素片を用いる
ことで、例えばフォルマント合成などのパラメトリック
合成系におけるフィルタ演算が不要になり、処理量が低
減できる。
【0007】しかし、なめらかな音声を合成するには用
意された音声素片を目的に応じて変形する操作が必要で
ある。特に重要な変形はピッチと時間長である。
【0008】ピッチの変形は図5のように行われる。す
なわち、あらかじめピッチ周期に対応したピークを中心
として窓関数によりピッチ波形を切り出しておき、合成
時に目的のピッチ周期の間隔で重ね合わせることにより
ピッチを変更する。
【0009】時間長の変更は音声素片の定常母音部分で
行う。時間長を短くするときは母音部の途中で波形再生
を打ち切り、長くするときは同じピッチ波形を繰り返
す。子音の時間長変更については、発話速度の変化に対
して子音時間長の変化が小さいことと、子音の種類によ
り異なる時間長変更操作が必要なことから、実施しな
い。
【0010】さて、そのような枠組みのもとで自然な発
話に聞こえるように時間長制御を行うには、従来子音時
間長と母音時間長を統計から決定し、音節の時間長を子
音時間長と母音時間長の和として決めていた。例えば、
音節「か」の時間長Dは、統計から求められた子音/k
/の時間長Dkと母音/a/の時間長Daの和として(数
1)により決定する。
【0011】 D = Dk + Da ・・・・ (数1) しかし、こうして統計から求められた時間長は、必ずし
も音声素片固有の時間長とマッチしない。そのため、音
節内の子音と母音の時間長のバランスが悪くなる。
【0012】このような問題は、時間長の決定を音声素
片の持つ時間長と関わりなく行うことによって起こる。
例えば音節時間長がほぼ均一になるように時間長を決定
しても、等間隔のリズムで聞こえないということが起こ
る。
【0013】
【発明が解決しようとする課題】以上説明したように従
来の音韻時間長決定方法は、音声素片を用いた合成方法
において音声素片固有の音韻時間長との不整合を起こ
し、聞こえに対して最適な音韻時間長の制御が行えない
という問題があった。
【0014】
【課題を解決するための手段】上記の問題を解決するた
めに、本発明の音韻時間長制御方法は、あらかじめ音声
素片の子音と母音の境界にマークを付与しておき、その
子音の時間長を変更せずにそのまま合成時の子音時間長
として用いる。その動作は、まず等間隔のリズムを生成
し、その各タイミングから子音時間長だけさかのぼった
タイミングを音声素片発音タイミングとする。各音声素
片の長さの制御は母音部分の時間長を変更することで行
い、子音の時間長は変更しない。
【0015】
【作用】上記の手段により、音声素片の子音と母音の境
界が等間隔に並ぶようになる。すなわち、合成音声の母
音開始部から子音終了部までを一つの単位(VC単位)
とすると、VC単位が一定の時間長になるように作用す
る。
【0016】
【実施例】次に、本発明の音韻時間長制御方法につい
て、図面を参照しながら説明する。
【0017】図1に本発明の音韻時間長制御方法の構成
を示す。その構成では、入力部1が設けられ、その出力
は音声素片選択部2に接続されている。また、リズム生
成部3が設けられ、その出力は音声素片発音タイミング
生成部4に接続されている。また、音声素片記憶部8と
音声素片読みだし部5が設けられ、それらは互いに接続
されている。音声素片発音タイミング生成部4の出力は
音声素片読みだし部5に接続されている。そして、子音
時間長記憶部7が設けられ、音声素片発音タイミング生
成部4に接続されている。また、音声素片選択部2の出
力は音声素片よみだし部5と音声素片発音タイミング生
成部4に接続されている。音声素片読みだし部5の出力
は出力部6に接続されている。
【0018】続いて、本構成による音韻時間長制御方法
の手順をフローチャートを参照しながら説明する。図2
は本発明の全体の処理の流れを表したフローチャートで
ある。
【0019】まず、音声素片記憶部8には音声合成に必
要な全ての音声波形が一つの子音とそれに続く母音の対
である音節を単位として記憶されている。また、子音時
間長記憶部7には音声素片記憶部8に記憶された全ての
音声素片の子音時間長が記憶されている。
【0020】入力部1は1行分の発音記号列を読み込
み、音声素片選択部2に出力する(ステップS1)。音
声素片選択部2は発音記号に対応する音声素片を表す音
声素片番号を出力する(ステップS2)。また、リズム
生成部3はあらかじめ決められた1音節の平均時間長に
従って、等間隔のリズムを出力する(ステップS3)。
【0021】続いて音声素片選択部2によって設定され
た音声素片番号それぞれについて、音声素片発音タイミ
ング生成部4が動作する。
【0022】音声素片番号が通常のCV音節を表すとき
(ステップS4)、音声素片発音タイミング生成部4は
音声素片番号に従って子音時間長記憶部7から、対応す
る音声素片の子音時間長を読みだす(ステップS5)。
ここで、通常のCV音節とは子音と母音の一つづつの組
み合わせからなる音節を指し、母音、撥音(「ン」)、
促音(「ッ」)、無声化音節以外の物を言う。
【0023】音声素片番号が通常のCV音節以外の場合
には例外処理を行う(ステップS6)。例外処理につい
ては後述する。
【0024】音声素片発音タイミング生成部4はリズム
生成部3から受け取った等間隔のリズムから子音時間長
分さかのぼり(ステップS7)、その時刻に音声素片発
音タイミングを設定する(ステップS8)。このように
することで、図3に示すように各音節の子音と母音の境
界が等間隔に並ぶようになる。このことで、合成音が規
則的なリズムで聞こえる効果がある。
【0025】音声素片読みだし部5は音声素片記憶部8
から音声素片番号に対応する音声素片を、音声素片発音
タイミング生成部4から受け取った音声素片発音タイミ
ングに従って読み出し、出力部6に対して出力する(ス
テップS9)。出力部6は音声素片読みだし部5から受
け取った音声素片波形を音声に変換して出力する。
【0026】次に例外処理についてフローチャートを参
照しながら説明する。図4は例外処理の流れを表すフロ
ーチャートである。
【0027】まず、母音と撥音の場合(ステップS10
1)、子音時間長は0とし(ステップS102)、通常
と同様の処理を行う。すなわち、等間隔のリズムをその
まま音声素片発音タイミングとみなす。
【0028】音声素片番号が促音の場合(ステップS1
03)、その音節は仮想的に子音と母音に分かれている
とみなし、あらかじめ決めておいた仮想子音時間長(例
えば40ms)を子音時間長として用い(ステップS1
04)、以下、通常の場合と同様の処理を行う。
【0029】音声素片番号が無声化音節の場合(ステッ
プS105)、本来存在した母音がなくなった物と考
え、音声素片全体の長さを子音時間長とみなし(ステッ
プS106)、通常と同様に等間隔のリズムからさかの
ぼって音声素片発音タイミングを生成する。しかし、次
に来るべき母音が存在しないため、次の音節までの間に
無音区間が生まれる。そこで、次の音節の種類により無
音区間の処理を行う。
【0030】無声化音節の次に来る音節は通常の場合無
声子音のみである。まず、その無声子音が「カ」行、
「タ」行、「パ」行の場合、無音区間はそのまま無音と
する。これらの子音は閉鎖子音であり、先頭部分にはも
ともと特有の無音区間が存在するので、上の処理は元々
存在した無音区間を長くするよう作用する。無音区間が
長くなっても音韻性(その音韻らしく聞こえる度合い)
が損なわれることはないし、等間隔のリズムが保証され
ているので、促音に異聴することもない。
【0031】無声化音節の次に来る無声子音が「ハ」行
の場合も同様にする。「ハ」行は閉鎖子音ではないが、
先頭に無音区間が付加されても異聴などは起こらない。
【0032】無声化音節の次の無声子音が「サ」行の場
合は別の処理を行う(ステップS107)。もし上と同
様の処理を行うと音韻性の低下を引き起こす。すなわ
ち、無音区間が付加されることにより「ツァ」行への異
聴が発生する。そこで、無音区間がなくなるように
「サ」行の子音部分を長くする(ステップS108)。
このことは、子音母音境界が等間隔のリズムになること
を保証した上で、無声化により無音になった区間を
「サ」行の子音の波形で埋めるように作用する。
【0033】「サ」行の子音時間長を長くする方法は例
えば次のようにする。音声素片を録音するとき、子音部
分が長めになるようにする。通常、単独発声で「サ」行
の単音節を発声すると、必要な子音時間長よりも十分長
い子音時間長となる。そこで、普段は子音部分の読みだ
しを途中から行うことで子音時間長を短くしておき、長
くする操作が必要なときは読みだし開始位置を早める。
この方法は処理が単純であり、効果的である。
【0034】その他の無声子音としては「キャ」行、
「チャ」行、「ピャ」行、「ヒャ」行、「シャ」行があ
るが、それぞれ「カ」行、「タ」行、「パ」行、「ハ」
行、「サ」行と同じ処理を行う。
【0035】このような時間長制御を行うことにより、
音声素片の子音から母音への境界が等間隔になり、規則
正しいリズムの合成音が生成できる。日本語の音声は等
間隔のリズムが特徴とされているが、音節中のどのよう
なタイミングが等間隔になっているかは明らかになって
いない。本方法では子音から母音への変化点が等間隔に
なるが、実際そのように制御することで等間隔のリズム
で発話しているように聞こえる。
【0036】本方法によれば、複雑な時間長の計算も不
要である。さらに、音声素片の時間長変更処理は処理が
単純な母音定常部で行うことが基本であり、子音の時間
長変更は一部の子音を除いて不要である。「サ」行、
「シャ」行などのように時間長変更が必要な子音も、そ
の読みだし開始位置を変更するだけでよいので、複雑な
処理は不要である。
【0037】また、歌唱の合成の際には音楽のリズムに
合わせて正確な発音タイミングを生成しなくてはならな
い。このような場合、子音から母音への境界がリズムに
合うように制御することで、自然な歌唱が合成できる。
【0038】なお、本方法では音声素片発音タイミング
生成のための基本リズムとして、等間隔のリズムを用い
たが、これは等間隔でなくても構わない。例えば、文頭
から文末にかけて徐々に長くなるようなリズムを用いる
ことも考えられるし、統計データを用いて音韻の種類ご
とに時間長を設定してももちろん構わない。本方法を用
いれば、子音から母音への変化タイミングが尊重される
ので、そのような統計データがあれば直ちに利用でき
る。すなわち、自然発話のデータを用いて母音開始部か
ら子音終了部までの時間の統計を音韻の組み合わせごと
に調べておき、合成時に利用することができる。
【0039】また、ここでは音声素片を用いた合成を例
にとり説明したが、子音から母音への境界を等間隔にす
るなどの制御をフォルマント合成などのパラメトリック
な合成方式に用いても、もちろん構わない。
【0040】
【発明の効果】以上説明したように、本発明による音韻
時間長制御方法を用いれば、子音から母音への境界が、
等間隔のリズムなどの意図したタイミングに一致するよ
うに制御できるため、リズミカルで自然な合成が行え
る。また、処理の難しい子音部分の時間長変更をほとん
ど行う必要がなく、音声素片の持つ特徴を損なわずに高
品質な合成が可能になる。
【図面の簡単な説明】
【図1】本発明の音韻時間長制御方法の構成図
【図2】本発明の音韻時間長制御方法の全体の処理の流
れを表すフローチャート
【図3】本発明の音韻時間長制御方法の各段階における
時間長データの変化の様子の説明図
【図4】本発明の音韻時間長制御方法の例外処理の流れ
を表すフローチャート
【図5】音声素片のピッチを変更する様子を表す説明図
【符号の説明】
1 入力部 2 音声素片選択部 3 リズム生成部 4 音声素片発音タイミング生成部 5 音声素片読みだし部 6 出力部 7 子音時間長記憶部 8 音声素片記憶部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】母音とその直後の子音を合わせた時間長が
    所定の時間長になるように制御することを特徴とする音
    韻時間長制御方法。
  2. 【請求項2】所定の時間長は等間隔のリズムであること
    を特徴とする請求項1記載の音韻時間長制御方法。
  3. 【請求項3】子音とその直後の母音の対であるCV音節
    を単位とし、その単位で作成されたCV音声素片を複数
    接続して音声を合成する、CV単位素片接続型音声合成
    方法において、あらかじめ生成したリズムからCV音声
    素片上の子音部分の時間長である子音時間長をさかのぼ
    った位置に、CV音声素片発音開始タイミングを設定す
    ることを特徴とする音韻時間長制御方法。
  4. 【請求項4】音節が母音または撥音であるとき、子音時
    間長を0と見なすことを特徴とする請求項3記載の音韻
    時間長制御方法。
  5. 【請求項5】音節が促音であるとき、あらかじめ決めて
    おいた仮想子音時間長を子音時間長と見なすことを特徴
    とする請求項3または請求項4記載の音韻時間長制御方
    法。
  6. 【請求項6】音節が無声化音であるとき、子音時間長は
    無声化音節の音声素片の子音時間長であり、無声化でな
    かった場合に本来存在すべき母音部分の時間長を、その
    音節の次の音節の種類に応じて処理することを特徴とす
    る請求項3から請求項5のいずれかに記載の音韻時間長
    制御方法。
  7. 【請求項7】次の音節が「サ」行または「シャ」行また
    はそれに類する音節の場合、本来存在すべき母音部分の
    時間長は0とし、代わりに次の音節の先頭の子音部分の
    時間長を長くすることによって時間長を補償することを
    特徴とする請求項6記載の音韻時間長制御方法。
  8. 【請求項8】次の音節が「サ」行ではなく、かつ「シ
    ャ」行ではなく、かつ「サ」行に類する音節ではなく、
    かつ「シャ」行に類する音節ではない場合、本来存在す
    べき母音部分の時間長は0とし、代わりに次の音節の先
    頭部分に無音部分を追加することによって時間長を補償
    することを特徴とする請求項6又は請求項7記載の音韻
    時間長制御方法。
  9. 【請求項9】あらかじめ生成したリズムは等間隔のリズ
    ムであることを特徴とする請求項3から請求項8のいず
    れかに記載の音韻時間長制御方法。
JP7052557A 1995-03-13 1995-03-13 音韻時間長制御方法 Pending JPH08248993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7052557A JPH08248993A (ja) 1995-03-13 1995-03-13 音韻時間長制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7052557A JPH08248993A (ja) 1995-03-13 1995-03-13 音韻時間長制御方法

Publications (1)

Publication Number Publication Date
JPH08248993A true JPH08248993A (ja) 1996-09-27

Family

ID=12918127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7052557A Pending JPH08248993A (ja) 1995-03-13 1995-03-13 音韻時間長制御方法

Country Status (1)

Country Link
JP (1) JPH08248993A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002351483A (ja) * 2001-05-24 2002-12-06 Nec Corp 音声合成装置および音声合成方法
JP2006119674A (ja) * 2006-01-30 2006-05-11 Yamaha Corp 歌唱合成方法と装置及び記録媒体
US7124084B2 (en) 2000-12-28 2006-10-17 Yamaha Corporation Singing voice-synthesizing method and apparatus and storage medium
JP2014098801A (ja) * 2012-11-14 2014-05-29 Yamaha Corp 音声合成装置
CN104021783A (zh) * 2013-02-22 2014-09-03 雅马哈株式会社 语音合成方法、语音合成设备和计算机可读记录介质
JP2016184158A (ja) * 2015-03-25 2016-10-20 ヤマハ株式会社 歌唱音発音装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7124084B2 (en) 2000-12-28 2006-10-17 Yamaha Corporation Singing voice-synthesizing method and apparatus and storage medium
JP2002351483A (ja) * 2001-05-24 2002-12-06 Nec Corp 音声合成装置および音声合成方法
JP4639527B2 (ja) * 2001-05-24 2011-02-23 日本電気株式会社 音声合成装置および音声合成方法
JP2006119674A (ja) * 2006-01-30 2006-05-11 Yamaha Corp 歌唱合成方法と装置及び記録媒体
JP4631726B2 (ja) * 2006-01-30 2011-02-16 ヤマハ株式会社 歌唱合成装置及び記録媒体
JP2014098801A (ja) * 2012-11-14 2014-05-29 Yamaha Corp 音声合成装置
CN104021783A (zh) * 2013-02-22 2014-09-03 雅马哈株式会社 语音合成方法、语音合成设备和计算机可读记录介质
JP2014186307A (ja) * 2013-02-22 2014-10-02 Yamaha Corp 音声合成装置
US9424831B2 (en) 2013-02-22 2016-08-23 Yamaha Corporation Voice synthesizing having vocalization according to user manipulation
JP2016184158A (ja) * 2015-03-25 2016-10-20 ヤマハ株式会社 歌唱音発音装置

Similar Documents

Publication Publication Date Title
US6470316B1 (en) Speech synthesis apparatus having prosody generator with user-set speech-rate- or adjusted phoneme-duration-dependent selective vowel devoicing
JP3361066B2 (ja) 音声合成方法および装置
US20030093277A1 (en) Method and apparatus for improved duration modeling of phonemes
JPS62160495A (ja) 音声合成装置
US20080319755A1 (en) Text-to-speech apparatus
O'Malley Text-to-speech conversion technology
HU176776B (en) Method and apparatus for synthetizing speech
JP3576840B2 (ja) 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
JPH08248993A (ja) 音韻時間長制御方法
KR101029493B1 (ko) 음성 신호 합성 방법, 컴퓨터 판독가능 저장 매체 및 컴퓨터 시스템
JPS5972494A (ja) 規則合成方式
JP3081300B2 (ja) 残差駆動型音声合成装置
JP3771565B2 (ja) 基本周波数パタン生成装置、基本周波数パタン生成方法、及びプログラム記録媒体
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JPH11161297A (ja) 音声合成方法及び装置
JP4305022B2 (ja) データ作成装置、プログラム及び楽音合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP2573586B2 (ja) 規則型音声合成装置
Khudoyberdiev The Algorithms of Tajik Speech Synthesis by Syllable
JPH06149283A (ja) 音声合成装置
Tatham et al. Speech synthesis in dialogue systems
JP2012163721A (ja) 読み記号列編集装置および読み記号列編集方法
JP2000250573A (ja) 音声素片データベース作成方法及びその装置並びにこの音声素片データベースを用いた音声合成方法及びその装置
JPH04243299A (ja) 音声出力装置