JP2002202788A

JP2002202788A - 歌唱合成方法と装置及び記録媒体

Info

Publication number: JP2002202788A
Application number: JP2000402880A
Authority: JP
Inventors: Hiroshi Kayama; 啓嘉山; Oscar Celma; セルマンオスカル; Jaume Ortola; オルトラジャウメ
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2000-12-28
Filing date: 2000-12-28
Publication date: 2002-07-19
Anticipated expiration: 2020-12-28
Also published as: US7124084B2; EP1675101A2; EP1220194A3; US20030009344A1; DE60135039D1; EP1220194A2; EP1675101B1; US20060085196A1; EP1675101A3; US20060085197A1; US7249022B2; JP3879402B2; US20060085198A1

Abstract

(57)【要約】【課題】リアルタイムに入力される演奏データに基づ
いて人歌唱（Ａ）に近似した自然な歌唱合成（Ｂ）を可
能にする。【解決手段】演奏データとしては、歌詞を構成する
「ｓａ」等の音韻毎に音韻情報、歌唱時刻情報、歌唱長
情報、歌唱音高情報、アタック等の状態遷移制御情報、
ビブラート等の効果制御情報等を入力する。歌唱時刻情
報は、Ｔ１等の実歌唱開始時刻を表わすもので、各演奏
データは、実歌唱開始時刻より早く入力する。演奏デー
タ毎に音韻情報に基づいてデータベースから音韻遷移時
間長を獲得し、この音韻遷移時間長と歌唱開始時刻情報
と歌唱長情報とに基づいて「ｓ」等の音素毎に歌唱開始
時刻と歌唱継続時間とを決定する。「ｓ」の歌唱開始時
刻は、Ｔ１より早くできる。歌唱合成では、音素毎に歌
唱音声を歌唱開始時刻に発生開始し、歌唱継続時間中発
生する。遷移状態特性や効果特性を入力に係る制御情報
に応じて制御してもよい。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、リアルタイムに
入力される演奏データに基づいて歌唱音声を合成する歌
唱合成方法と装置及び記録媒体に関するものである。

【０００２】

【従来の技術】従来、この種の歌唱合成装置としては、
演奏データのノートオン信号に伴って発生される先頭音
素の立上り時間を、この先頭音素がノートオン期間中に
他の音素に引き続いて発音される場合の立上り時間より
短くする（速く立上らせる）ようにしたものが知られて
いる（例えば、特開平１０−４９１６９号公報参照）。

【０００３】図４０（Ａ）は、人歌唱における子音歌唱
開始時刻及び母音歌唱開始時刻を示すもので、この例で
は、音高「Ｃ_３（ド）」、「Ｄ_３（レ）」、「Ｅ
_３（ミ）」にそれぞれ対応して歌詞「さ（ｓａ）」、
「い（ｉ）」、「た（ｔａ）」と歌った場合を示してい
る。図４０（Ａ）によれば、「ｓａ」、「ｔａ」のよう
に子音と母音との組合せからなる音韻は、子音が母音に
先行して発音開始されているのがわかる。

【０００４】一方、図４０（Ｂ）は、上記した従来の歌
唱合成における歌唱開始時刻を示すもので、歌唱内容
は、図４０（Ａ）の場合と同様である。実歌唱開始時刻
Ｔ１〜Ｔ３は、いずれもノートオン信号による歌唱音声
の発生開始時刻に相当する。上記した従来の歌唱合成で
は、例えば「ｓａ」の歌唱音声を発生する場合、子音
「ｓ」の歌唱開始時刻を時刻Ｔ１に合わせ、時刻Ｔ１か
ら子音「ｓ」の振幅レベルを急速に上昇させることによ
り楽器音（伴奏音）に対して歌唱音声が遅れた感じとな
る事態を回避するようにしている。

【０００５】

【発明が解決しようとする課題】上記した従来の歌唱合
成技術によると、次のよな問題点がある。

【０００６】（１）図４０（Ａ）の人歌唱において母音
歌唱開始時刻は、図４０（Ｂ）の歌唱合成における実歌
唱開始時刻（ノートオン時刻）にほぼ対応する。図４０
（Ｂ）の場合は、子音歌唱開始時刻をノートオン時刻に
一致させると共に子音（先頭音素）の立上り時間を短縮
しているので、図４０（Ａ）の場合に比べて歌唱開始時
刻や歌唱継続時間が不自然となる。

【０００７】（２）ノートオン時刻の直前に音韻情報を
送信し、ノートオン時刻に音韻情報対応の歌唱音声の発
生を開始するようにしているので、ノートオン時刻より
早く歌唱音声を発生開始することができない。（３）歌唱音声についてアタック（立上り）部、リリー
ス（立下り）部等の状態遷移を制御するようになってい
ないので、より自然な歌唱合成を行なうことができな
い。

【０００８】（４）歌唱音声についてビブラート等の効
果を制御するようになっていないので、より自然な歌唱
合成を行なうことができない。

【０００９】この発明の目的は、上記のような問題点を
解決した新規な歌唱合成方法と装置を提供することにあ
る。

【００１０】

【課題を解決するための手段】この発明に係る第１の歌
唱合成方法は、順次の第１及び第２の音素を含む歌唱音
韻について音韻を表わす音韻情報と歌唱開始時刻を表わ
す時刻情報と歌唱長を表わす歌唱長情報とを前記歌唱開
始時刻より早く入力するステップと、入力された音韻情
報に基づいて前記第１の音素の発生時間長と前記第２の
音素の発生時間長とからなる音韻遷移時間長を生成する
ステップと、生成された音韻遷移時間長と入力された時
刻情報及び歌唱長情報とに基づいて前記第１及び第２の
音素の歌唱開始時刻と歌唱継続時間とを決定するステッ
プと、決定された前記第１及び第２の音素の歌唱開始時
刻にそれぞれ前記第１及び第２の音素からなる第１及び
第２の歌唱音声を発生開始し、該第１及び第２の歌唱音
声を決定された前記第１及び第２の音素の歌唱継続時間
中それぞれ発生するステップとを含むものである。

【００１１】第１の歌唱合成方法によれば、時刻情報で
表わされる歌唱開始時刻より早く音韻情報、時刻情報及
び歌唱長情報を入力すると共に、音韻情報に基づいて音
韻遷移時間長を生成し、音韻遷移時間長と時刻情報と歌
唱長情報とに基づいて第１及び第２の音素の歌唱開始時
刻と歌唱継続時間とを決定するようにしたので、第１及
び第２の音素については、時刻情報で表わされる歌唱開
始時刻の前後で所望の歌唱開始時刻を決定したり、歌唱
長情報で表わされる歌唱長とは異なる歌唱継続時間を決
定したりすることができ、第１及び第２の歌唱音声とし
て自然な歌唱音声を発生することができる。例えば、第
１の音素の歌唱開始時刻として、時刻情報で表わされる
歌唱開始時刻より早い時刻を決定すると、子音の立上り
を母音の立上りより十分に早くして人歌唱に近似した歌
唱合成を行なうことができる。

【００１２】この発明に係る第２の歌唱合成方法は、歌
唱音韻について音韻を表わす音韻情報と歌唱開始時刻を
表わす時刻情報と歌唱長を表わす歌唱長情報とを入力す
るステップと、入力された音韻情報に基づいて前記歌唱
音韻の立上り部、ノート遷移部又は立下り部のいずれか
に対応した状態遷移時間長を生成するステップと、入力
された音韻情報、時刻情報及び歌唱長情報に基づいて前
記音韻からなる歌唱音声を発生するステップであって、
生成された状態遷移時間長に対応する期間中前記歌唱音
声に対して音高及び振幅のうち少なくとも一方の変化を
付加するものとを含むものである。

【００１３】第２の歌唱合成方法によれば、入力された
音韻情報に基づいて状態遷移時間長を生成すると共に、
この状態遷移時間長に対応する期間中歌唱音声に対して
音高及び振幅のうち少なくとも一方の変化を付加するよ
うにしたので、アタック感、ノート遷移感又はリリース
感のある自然な歌唱合成が可能となる。

【００１４】この発明に係る第１の歌唱合成装置は、順
次の第１及び第２の音素を含む歌唱音韻について音韻を
表わす音韻情報と歌唱開始時刻を表わす時刻情報と歌唱
長を表わす歌唱長情報とを前記歌唱開始時刻より早く入
力する入力手段と、前記第１の音素の発生時間長と前記
第２の音素の発生時間長とからなる音韻遷移時間長を記
憶する記憶手段と、前記入力手段で入力された音韻情報
に基づいて前記記憶手段から音韻遷移時間長を読出す読
出手段と、この読出手段で読出された音韻遷移時間長と
前記入力手段で入力された時刻情報及び歌唱長情報とに
基づいて前記第１及び第２の音素の歌唱開始時刻と歌唱
継続時間とを算出する計算手段と、この計算手段で算出
された前記第１及び第２の音素の歌唱開始時刻にそれぞ
れ前記第1及び第２の音素からなる第１及び第２の歌唱
音声を発生開始し、該第１及び第２の歌唱音声を前記計
算手段で算出された前記第１及び第２の音素の歌唱継続
時間中それぞれ発生する歌唱音声合成手段とを備えたも
のである。

【００１５】第１の歌唱合成装置は、この発明の第１の
歌唱合成方法を実施するものであり、第１の歌唱合成方
法に関して前述したと同様の作用効果が得られる。ま
た、音韻遷移時間長を記憶手段から読出して利用するよ
うにしたので、歌唱音韻数が増大しても、構成乃至処理
が簡単である。

【００１６】第１の歌唱合成装置において、前記入力手
段では、前記第１の音素の発生時間長を修正するための
修正情報を入力し、前記計算手段では、前記読出手段で
読出された音韻遷移時間長中の第１の音素の発生時間長
を前記入力手段で入力された修正情報に応じて修正した
後該音韻遷移時間長に基づいて前記第１及び第２の音素
の歌唱開始時刻と歌唱継続時間とを算出するようにして
もよい。このようにすると、第１及び第２の音素の歌唱
開始時刻及び歌唱継続時間に入力側の意志を反映させる
ことができ、一層自然な歌唱合成が可能となる。

【００１７】この発明に係る第２の歌唱合成装置は、歌
唱音韻について音韻を表わす音韻情報と歌唱開始時刻を
表わす時刻情報と歌唱長を表わす歌唱長情報とを入力す
る入力手段と、前記歌唱音韻の立上り部、ノート遷移部
又は立下り部のいずれかに対応した状態遷移時間長を記
憶した記憶手段と、前記入力手段で入力された音韻情報
に基づいて前記記憶手段から状態遷移時間長を読出す読
出手段と、前記入力手段で入力された音韻情報、時刻情
報及び歌唱長情報に基づいて前記音韻からなる歌唱音声
を発生する歌唱音声合成手段であって、前記読出手段で
読出された状態遷移時間長に対応する期間中前記歌唱音
声に対して音高及び振幅のうち少なくとも一方の変化を
付加するものとを備えたものである。

【００１８】第２の歌唱合成装置は、この発明の第２の
歌唱合成方法を実施するものであり、第２の歌唱合成方
法に関して前述したと同様の作用効果が得られる。ま
た、状態遷移時間長を記憶手段から読出して利用するよ
うにしたので、歌唱音韻数が増大しても、構成乃至処理
が簡単である。

【００１９】第２の歌唱合成装置において、前記入力手
段では、前記状態遷移時間長を修正するための修正情報
を入力し、前記読出手段で読出された状態遷移時間長を
前記入力手段で入力された修正情報に応じて修正する修
正手段を更に設け、前記歌唱音声合成手段では、前記修
正手段で修正された状態遷移時間長に対応する期間中前
記歌唱音声に対して音高及び振幅のうち少なくとも一方
の変化を付加するようにしてもよい。このようにする
と、状態遷移時間長に入力側の意志を反映させることが
でき、一層自然な歌唱合成が可能となる。

【００２０】この発明に係る第３の歌唱合成装置は、歌
唱音韻について音韻を表わす音韻情報と歌唱開始時刻を
表わす時刻情報と歌唱長を表わす歌唱長情報と効果の付
加を表わす効果付加情報とを入力する入力手段と、この
入力手段で入力された音韻情報、時刻情報及び歌唱長情
報に基づいて前記音韻からなる歌唱音声を発生する歌唱
音声合成手段であって、前記入力手段で入力された効果
付加情報に基づいて前記歌唱音声に対して効果を付加す
るものとを備えたものである。

【００２１】第３の歌唱合成装置によれば、歌唱音声に
対して効果として例えばビブラート効果のような音高、
振幅等の微小変化を付加することができ、自然な歌唱合
成が可能となる。

【００２２】第３の歌唱合成装置において、前記入力手
段で入力される効果付加情報を効果の付加期間を表わす
ものとし、入力された効果付加情報で表わされる効果の
付加期間が前記歌唱音韻に先行する歌唱音韻の効果の付
加期間に連続するときに連続する２つの付加期間に対応
する新たな効果の付加期間を設定する設定手段を更に設
け、前記歌唱音声合成手段では、前記設定手段で設定さ
れた効果の付加期間中前記歌唱音声に対して効果を付加
するようにしてもよい。このようにすると、連続する効
果の付加期間に対応する新たな効果の付加期間を設定し
て効果付加を行なうので、効果が途切れたりすることが
なく、効果の連続性が良好となる。

【００２３】この発明に係る第４の歌唱合成装置は、歌
唱音韻について音韻を表わす音韻情報と歌唱開始時刻を
表わす時刻情報と歌唱長を表わす歌唱長情報とを前記歌
唱開始時刻より早く入力する入力手段と、この入力手段
で入力された時刻情報に基づいて前記歌唱開始時刻の前
後に及ぶ所定の時間範囲内でランダムに新たな歌唱開始
時刻を設定する設定手段と、前記入力手段で入力された
音韻情報及び歌唱長情報と前記設定手段で設定された歌
唱開始時刻とに基づいて前記音韻からなる歌唱音声を発
生する歌唱音声合成手段であって、前記設定手段で設定
された歌唱開始時刻に前記歌唱音声を発生開始するもの
とを備えたものである。

【００２４】第４の歌唱合成装置によれば、時刻情報で
表わされる歌唱開始時刻の前後に及ぶ所定時間範囲内で
ランダムに新たな歌唱開始時刻を設定し、設定された歌
唱開始時刻に歌唱音声を発生するようにしたので、歌唱
開始タイミングに変化がある自然な歌唱合成が可能とな
る。

【００２５】

【発明の実施の形態】図１を参照してこの発明の歌唱合
成の概要を説明する。図１（Ａ）は、図４０（Ａ）と同
様に人歌唱における子音歌唱開始時刻及び母音歌唱開始
時刻を示すものであり、図１（Ｂ）は、この発明の歌唱
合成における歌唱開始時刻を示すものである。

【００２６】この発明では、演奏データは、歌詞を構成
する「ｓａ」等の音韻毎に音韻情報、歌唱開始時刻情
報、歌唱長情報等を入力する。歌唱開始時刻情報は、Ｔ
１等の実歌唱開始時刻（例えば拍頭タイミング）を表わ
す。各演奏データは、実歌唱開始時刻より早く入力し、
各演奏データ毎に音韻情報を音韻遷移時間長に変換す
る。音韻遷移時間長は、例えば第１の音素「ｓ」及び第
２の音素「ａ」からなる音韻「ｓａ」については第１の
音素の発生時間長と第２の音素の発生時間長とからなる
もので、この音韻遷移時間長と歌唱開始時刻情報と歌唱
長情報とを用いて第１及び第２の音素の歌唱開始時刻と
歌唱継続時間とを決定する。このとき、子音「ｓ」の歌
唱開始時刻は、実歌唱開始時刻Ｔ１より前とし、母音
「ａ」の歌唱開始時刻は、実歌唱開始時刻Ｔ１と同一あ
るいはその前又は後とすることができる。このことは、
「ｉ」及び「ｔａ」についても同様である。図１（Ｂ）
の例では、「ｓａ」について「ｓ」の歌唱開始時刻を
（Ａ）の人歌唱に合わせてＴ１より前とし、「ａ」の歌
唱開始時刻をＴ１とし、「ｉ」の歌唱開始時刻をＴ２と
し、「ｔａ」について「ｔ」の歌唱開始時刻を（Ａ）の
人歌唱に合わせてＴ３より前とし、「ａ」の歌唱開始時
刻をＴ３としている。

【００２７】歌唱合成では、例えば「ｓ」を決定に係る
歌唱開始時刻で発生開始し、決定に係る歌唱継続期間中
発生する。また、「ａ」を決定に係る歌唱開始時刻で発
生開始し、決定に係る歌唱継続期間中発生する。このこ
とは、「ｉ」及び「ｔａ」についても同様である。この
結果、図１（Ａ）の人歌唱の場合と歌唱開始時刻や歌唱
継続時間が近似した自然性豊かな歌唱合成が可能とな
る。

【００２８】図２は、この発明の一実施形態に係る歌唱
合成装置の回路構成を示すものである。この歌唱合成装
置は、小型コンピュータによって動作が制御されるもの
である。

【００２９】バス１０には、ＣＰＵ（中央処理装置）１
２、ＲＯＭ（リード・オンリィ・メモリ）１４、ＲＡＭ
（ランダム・アクセス・メモリ）１６、検出回路２０、
表示回路２２、外部記憶装置２４、タイマ２６、音源回
路２８、ＭＩＤＩ（MusicalInstrument Digital Inte
rface）インターフェース３０等が接続されている。

【００３０】ＣＰＵ１２は、ＲＯＭ１４にストアされた
プログラムに従って楽音発生、歌唱合成等に関する各種
処理を実行するもので、歌唱合成に関する処理について
は図１７等を参照して後述する。

【００３１】ＲＡＭ１６は、ＣＰＵ１２の各種処理に際
してワーキングエリアとして使用される種々の記憶部を
含むもので、この発明の実施に関係する記憶部として
は、受信した演奏データを書込むための受信バッファ等
が設けられている。

【００３２】検出回路２０は、パネルの操作子群３４か
ら各種操作子の操作情報を検出するものである。

【００３３】表示回路２２は、表示器３６の表示動作を
制御することにより各種の表示を可能にするものであ
る。

【００３４】外部記憶装置２４は、ＨＤ（ハードディス
ク）、ＦＤ（フロッピー（登録商標）ディスク）、ＣＤ
（コンパクトディスク）、ＤＶＤ（ディジタル多目的デ
ィスク）、ＭＯ（光磁気ディスク）等のうち１又は複数
種類の記録媒体を着脱可能なものである。外部記憶装置
２４に所望の記録媒体を装着した状態では、記録媒体か
らＲAM１６へデータを転送可能である。また、装着した
記録媒体がＨＤやＦＤのように書込み可能なものであれ
ば、ＲＡＭ１６のデータを記録媒体に転送可能である。

【００３５】プログラム記録手段としては、ＲＯＭ１４
の代わりに外部記憶装置２４の記録媒体を用いることが
できる。この場合、記録媒体に記録したプログラムは、
外部記憶装置２４からＲＡＭ１６へ転送する。そして、
ＲＡＭ１６に記憶したプログラムに従ってＣＰＵ１２を
動作させる。このようにすると、プログラムの追加やバ
ージョンアップ等を容易に行なうことができる。

【００３６】タイマ２６は、テンポデータＴＭの指示す
るテンポに対応した周期でテンポクロック信号ＴＣＬを
発生するもので、テンポクロック信号ＴＣＬは、ＣＰＵ
１２に割り込み命令信号として供給される。ＣＰＵ１２
は、テンポクロック信号ＴＣＬに基づく割り込み処理に
より歌唱合成を行なう。テンポデータＴＭの指示するテ
ンポは、操作子群３４中のテンポ設定操作子の操作に応
じて可変設定することができる。テンポクロック信号Ｔ
ＣＬの発生周期は、一例として５［ｍｓ］とすることが
できる。

【００３７】音源回路２８は、多数の楽音発生チャンネ
ル及び多数の歌唱合成チャンネルを含むもので、歌唱合
成チャンネルは、フォルマント合成方式により歌唱音声
を合成するようになっている。後述する歌唱合成処理で
は、歌唱合成チャンネルから歌唱音声信号が発生され
る。発生に係る楽音信号及び／または歌唱音声信号は、
サウンドシステム３８により音響に変換される。

【００３８】ＭＩＤＩインターフェース３０は、この歌
唱合成装置とは別体のＭＩＤＩ機器３９との間でＭＩＤ
Ｉ通信を行なうために設けられたもので、この発明で
は、ＭＩＤＩ機器３９から歌唱合成用の演奏データを受
信するために用いられる。ＭＩＤＩ機器３９からは、歌
唱合成用の演奏データと共に歌唱伴奏用の演奏データを
受信し、歌唱伴奏用の演奏データに基づいて音源回路２
８で伴奏用の楽音信号を発生し、サウンドシステム３８
から伴奏音を発生させるようにしてもよい。

【００３９】次に、図３を参照して実施形態に係る歌唱
合成処理を概略的に説明する。ステップ４０では、演奏
データを入力する。すなわち、ＭＩＤＩ機器３９からＭ
ＩＤＩインターフェース３０を介して演奏データを受信
する。演奏データの詳細については、図４を参照して後
述する。

【００４０】ステップ４２では、受信した演奏データ毎
に該演奏データに基づいて歌唱合成ＤＢ（データベー
ス）１４Ａ内の音韻遷移ＤＢ１４ｂ及び状態遷移ＤＢ１
４ｃからそれぞれ音韻遷移時間長及び状態遷移時間長を
獲得し、これらの音韻遷移時間長及び状態遷移時間長と
演奏データとに基づいて歌唱合成スコアを形成する。歌
唱合成スコアは、音韻トラックと、遷移トラックと、ビ
ブラートトラックとの３トラックを有するもので、音韻
トラックは、歌唱開始時刻及び歌唱継続時間等の情報を
含み、遷移トラックは、アタック等の遷移状態の開始時
刻及び継続時間等の情報を含み、ビブラートトラック
は、ビブラート付加状態の開始時刻及び継続時間等の情
報を含む。

【００４１】ステップ４４では、歌唱合成エンジンによ
る歌唱合成を行なう。すなわち、ステップ４０で入力し
た演奏データとステップ４２で形成した歌唱合成スコア
と歌唱合成ＤＢ１４Ａ内の音韻ＤＢ１４ａ、音韻遷移Ｄ
Ｂ１４ｂ、状態遷移ＤＢ１４ｃ及びビブラートＤＢ１４
ｄから獲得した音源制御情報とに基づいて歌唱合成を行
ない、歌唱順に歌唱音声信号を発生する。歌唱合成処理
では、音韻トラックの指示する単一音韻（例えば
「ａ」）又は遷移する音韻（例えば「ｓ」から「ａ」に
遷移する「ｓａ」）からなり且つ演奏データの指示する
音高を有する歌唱音声を音韻トラックの指示する歌唱開
始時刻に発生開始し、音韻トラックの指示する歌唱継続
時間中発生する。

【００４２】このようにして発生される歌唱音声には、
遷移トラックの指示するアタック等の遷移状態の開始時
刻から音高、振幅等の微小変化を付加し、この付加状態
を遷移トラックの指示するアタック等の遷移状態の継続
時間中継続させることができる。また、歌唱音声には、
ビブラートトラックの指示する開始時刻からビブラート
を付加し、この付加状態をビブラートトラックの指示す
る継続時間中継続させることができる。

【００４３】ステップ４６，４８は、音源回路２８内の
処理を示したもので、ステップ４６では、歌唱音声信号
をＤ／Ａ（ディジタル／アナログ）変換し、ステップ４
８では、Ｄ／Ａ変換された歌唱音声信号をサウンドシス
テム３８に出力し、歌唱音として発音させる。

【００４４】図４は、演奏データ内の情報を示すもので
ある。演奏データは、１音節を歌唱するために必要な演
奏情報を含んでおり、演奏情報は、ノート情報と、音韻
トラック情報と、遷移トラック情報と、ビブラートトラ
ック情報とを含んでいる。

【００４５】ノート情報には、実歌唱開始時刻を表わす
ノートオン（Note On）情報、実歌唱長を表わすデュレ
ーション（Duration）情報、歌唱音高を表わすピッチ
（Pitch）情報等が含まれる。音韻トラック情報には、
歌唱音韻を表わす音韻（PhＵと表記する）情報、歌唱子
音伸縮率を表わす子音修正（Consonant Modificatio
n）情報等が含まれる。この実施形態では、日本語の歌
唱合成を行なうことを前提としているので、出現する音
素は、子音と母音であり、音韻状態（PhＵ State）と
しては、子音と母音との組合せ、母音のみ又は有声子音
（鼻音、半母音）のみのいずれかとなる。ここで、有声
子音のみの場合は、有声子音の歌唱開始タイミングが母
音のみの場合と類似しているので、母音のみの場合とし
て扱うこととする。

【００４６】遷移トラック情報には、歌唱アタックタイ
プを表わすアタックタイプ（AttackType）情報、歌唱ア
タック伸縮率を表わすアタックレート（Attack Rate）
情報、歌唱リリースタイプを表わすリリースタイプ（Re
lease Type）情報、歌唱リリース伸縮率を表わすリリ
ースレート（Release Rate）情報、歌唱ノート遷移タ
イプを表わすノート遷移タイプ（Note Transition Ty
pe）情報等が含まれる。アタックタイプ情報により指定
されるアタックタイプとしては、「ノーマル（Norma
l）」、「セクシー（Sexy）」、「シャープ（Shar
p）」、「ソフト（Soft）」等がある。リリースタイプ
情報及びノート遷移タイプ情報も、アタックタイプと同
様の複数のタイプのうちのいずれかを指定可能である。
ノート遷移（Note Transition）は、本演奏データ（演
奏イベント）から次の演奏データ（演奏イベント）への
遷移を意味する。歌唱アタック伸縮率、歌唱リリース伸
縮率及びノート遷移伸縮率は、状態遷移時間長を伸長し
たい場合は１より大きな値とし、状態遷移時間長を短縮
したい場合は１より小さな値とする。歌唱アタック伸縮
率、歌唱リリース伸縮率及びノート遷移伸縮率は、０と
することもでき、この場合はそれぞれアタック、リリー
ス及びノート遷移に伴う音高、振幅等の微小変化の付加
は行なわれない。

【００４７】ビブラートトラック情報には，本演奏デー
タ中のビブラートイベント数を表わすビブラートナンバ
（Vibrato Number）情報、１番目のビブラートの遅延
時間を表わすビブラート遅延１（Vibrato Delay １）
の情報、１番目のビブラートの継続時間を表わすビブラ
ートデュレーション１（Vibrato Duration １）の情
報、１番目のビブラートのタイプを表わすビブラートタ
イプ１（Vibrato Type １）の情報…Ｋ（２以上の整
数）番目のビブラートの遅延時間を表わすビブラート遅
延Ｋ（Vibrato Delay Ｋ）の情報、Ｋ番目のビブラー
トの継続時間を表わすビブラートデュレーションＫ（Vi
brato Duration Ｋ）の情報、Ｋ番目のビブラートの
タイプを表わすビブラートタイプＫ（Vibrato Type
Ｋ）の情報等が含まれる。ビブラートイベント数が０の
場合は、ビブラート遅延１の情報以下の情報は含まれな
い。ビブラートタイプ１〜Ｋの情報によって指定される
ビブラートタイプとしては、「ノーマル（Normal）」、
「セクシー（Sexy）」、「エンカ（Enka）」等がある。

【００４８】図３に示した歌唱合成ＤＢ１４Ａは、ＲＯ
Ｍ１４内に含まれるものであるが、外部記憶装置２４に
設けたものをＲＡＭ１６に転送して利用するようにして
もよい。歌唱合成ＤＢ１４Ａ内には、音韻ＤＢ１４ａ、
音韻遷移ＤＢ１４ｂ、状態遷移ＤＢ１４ｃ、ビブラート
ＤＢ１４ｄ…その他のＤＢ１４ｎが設けられている。

【００４９】次に、図５〜８を参照して音韻ＤＢ１４
ａ、音韻遷移ＤＢ１４ｂ、状態遷移ＤＢ１４ｃ及びビブ
ラートＤＢ１４ｄ内の記憶情報について説明する。音韻
ＤＢ１４ａ及びビブラートＤＢ１４ｄには、それぞれ図
５及び図８に示すように音源制御情報が記憶される。音
韻遷移ＤＢ１４ｂには、図６（Ｂ）に示すように音韻遷
移時間長及び音源制御情報が記憶されると共に、状態遷
移ＤＢ１４ｃには、図７に示したように状態遷移時間長
及び音源制御情報が記憶される。これらの記憶情報を作
成する際には、歌唱者による歌唱音声を分析して音源制
御情報、音韻遷移時間長及び状態遷移時間長を決定し
た。また、「（Normal）」、「（Sexy）」、「Soft」、
「Enka」等のタイプについては、歌唱者に同意の教示
（例えば「セクシーなアタックを付けて歌って下さ
い」、「演歌調のビブラートを付けて歌って下さい」
等）を与えて歌唱してもらい、その歌唱音声を分析して
音源制御情報、音韻遷移時間長及び状態遷移時間長を決
定した。音源制御情報は、音源回路２８において所望の
歌唱音声を合成するために必要なフォルマント周波数及
びフォルマントレベルの制御パラメータからなるもので
ある。

【００５０】図５に示す音韻ＤＢ１４ａでは、「ａ」、
「ｉ」、「Ｍ」、「Sil」等の音韻毎に且つ１音韻内で
「Ｐ１」、「Ｐ２」…等の音高毎に音源制御情報が記憶
される。図５〜８及び以下の説明において、「Ｍ」は、
音韻「ｕ」を表わし、「Sil」は、無音（Silence）を表
わす。歌唱合成の際には、合成すべき歌唱音声の音韻と
音高とに適合した音源制御情報が音韻ＤＢ１４ａから選
択される。

【００５１】図６（Ａ）は、音韻遷移ＤＢ１４ｂに記憶
される音韻遷移時間長（ａ）〜（ｆ）を示すものであ
る。図６（Ａ）及び以下の説明において、「Ｖ−Sil」
等の記号の意味は次の通りである。

【００５２】（ａ）「Ｖ−Sil」は、母音（Vowel）から
無音（Silence）への音韻遷移を表わし、図６（Ｂ）で
は、例えば先行音韻「ａ」と後続音韻「Sil」との組合
せに対応する。

【００５３】（ｂ）「Sil−Ｃ」は、無音（Silence）か
ら子音（Consonant）への音韻遷移を表わし、図６
（Ｂ）では、例えば先行音韻「Sil」と後続音韻「ｓ」
（図示せず）との組合せに対応する。

【００５４】（ｃ）「Ｃ−Ｖ」は、子音（Consonant）
から母音（Vowel）への音韻遷移を表わし、図６（Ｂ）
では、例えば先行音韻「ｓ」（図示せず）と後続音韻
「ａ」（図示せず）との組合せに対応する。

【００５５】（ｄ）「Sil−Ｖ」は、無音（Silence）か
ら母音（Vowel）への音韻遷移を表わし、、図６（Ｂ）
では、例えば先行音韻「Sil」と後続音韻「ａ」との組
合せに対応する。

【００５６】（ｅ）「ｐＶ−Ｃ」は、先行母音（Vowe
l）から子音（Consonant）への音韻遷移を表わし、図６
（Ｂ）では、例えば先行音韻「ａ」と後続音韻「ｓ」
（図示せず）との組合せに対応する。

【００５７】（ｆ）「ｐＶ−Ｖ」は、先行母音（Vowe
l）から母音（Vowel）への音韻遷移を表わし、図６
（Ｂ）では、例えば先行音韻「ａ」と後続音韻「ｉ」と
の組合せに対応する。

【００５８】図６（Ｂ）に示す音韻遷移ＤＢ１４ｂで
は、「ａ」_「ｉ」等の音韻組合せ（遷移する音韻）毎
に且つ１つの音韻組合せ内で「Ｐ１」、「Ｐ２」…等の
音高毎に音韻遷移時間長及び音源制御情報が記憶され
る。図６（Ｂ）において、「Aspiration」は、呼気音を
示す。音韻遷移時間長は、先行音韻の時間長と後続音韻
の時間長との組合せからなるものであり、両時間長の境
界を時間区切り情報として保持している。歌唱合成スコ
アを形成する際には、音韻トラックを形成すべき音韻組
合せと音高とに適合した音韻遷移時間長が音韻遷移ＤＢ
１４ｂから選択される。また、歌唱合成の際には、合成
すべき歌唱音声の音韻組合わせと音高とに適合した音源
制御情報が音韻遷移ＤＢ１４ｂから選択される。

【００５９】図７に示す状態遷移ＤＢ１４ｃでは、アタ
ック（Attack）、ノート遷移（NoteTransition、「Nt
N」と表記する）及びリリース（Release）の各遷移状態
毎に且つ１つの遷移状態内で「Normal」、「Sexy」、
「Sharp」及び「Soft」の各状態タイプ毎に状態遷移時
間長及び音源制御情報が記憶され、しかも１つの状態タ
イプ内で「ａ」、「ｉ」等の音韻毎に且つ１音韻内で
「Ｐ１」、「Ｐ２」等の音高毎に状態遷移時間長及び音
源制御情報が記憶される。状態遷移時間長は、アタッ
ク、ノート遷移又はリリースの遷移状態の継続時間に相
当するものである。歌唱合成スコアを形成する際には、
遷移トラックを形成すべき遷移状態と状態タイプと音韻
と音高とに適合した状態遷移時間長が状態遷移ＤＢ１４
ｃから選択される。また、歌唱合成の際には、合成すべ
き歌唱音声の遷移状態と状態タイプと音韻と音高とに適
合した音源制御情報が状態遷移ＤＢ１４ｃから選択され
る。

【００６０】図８に示すビブラートＤＢ１４ｄでは、
「Normal」、「Sexy」…「Enka」等の各ビブラートタイ
プ毎に音源制御情報が記憶されると共に、１つのビブラ
ートタイプ内で「ａ」、「ｉ」等の音韻毎に且つ１音韻
内で「Ｐ１」、「Ｐ２」等の音高毎に音源制御情報が記
憶される。歌唱合成の際には、合成すべき歌唱音声のビ
ブラートタイプと音韻と音高とに適合した音源制御情報
がビブラートＤＢ１４ｄから選択される。

【００６１】図９は、演奏データに基づく歌唱合成を示
すものである。演奏データＳ_１、Ｓ _２、Ｓ_３が図１
（Ｂ）で示したと同様に「さ（ｓａ）：Ｃ_３：Ｔ１
…」、「い（ｉ）：Ｄ_３：Ｔ２…」、「た（ｔａ）：Ｅ
_３：Ｔ３…」をそれぞれ指示するものとすると、演奏デ
ータＳ_１、Ｓ_２、Ｓ_３は、実歌唱開始時刻Ｔ１、Ｔ２、
Ｔ３よりそれぞれ早い時刻ｔ_１、ｔ_２、ｔ_３に送信さ
れ、ＭＩＤＩインターフェース３０を介して受信され
る。演奏データの送受信処理は、ステップ４０の演奏デ
ータ入力処理に相当する。演奏データが受信されると、
ステップ４２で演奏データ毎に歌唱合成スコアが形成さ
れる。そして、ステップ４４では、形成された歌唱合成
スコアに従って歌声音声ＳＳ_１、ＳＳ_２、ＳＳ_３が合成
される。歌唱合成では、歌唱音声ＳＳ_１の子音「ｓ」を
Ｔ１より早い時刻Ｔ_１１に発生開始させると共に、ＳＳ
_１の母音「ａ」をＴ１に発生開始させることができる。
また、歌唱音声ＳＳ_２の母音「ｉ」をＴ２に発生開始さ
せることができる。さらに、歌唱音声ＳＳ_３の子音
「ｔ」をＴ３より早く時刻Ｔ_３１に発生開始させると共
にＳＳ_３の母音「ａ」をＴ３に発生開始させることがで
きる。所望により、「さ」の母音「ａ」又は「い」の母
音「ｉ」をＴ１又はＴ２よりそれぞれ早く発生開始させ
ることも可能である。

【００６２】図１０は、ステップ４２における参照スコ
ア及び歌唱合成スコアの形成状況を示すものである。こ
の実施形態では、歌唱合成スコア形成処理の前処理とし
て、参照スコア形成処理を行なう。すなわち、時刻
ｔ_１、ｔ_２、ｔ_３でそれぞれ送信された演奏データは、
順次に受信されてＲＡＭ１６内の受信バッファに書込ま
れる。ＲＡＭ１６内の参照スコアと称する記憶部には、
受信バッファから演奏データの指示する実歌唱開始時刻
順に演奏データが転送され、順次に書込まれる。例え
ば、演奏データＳ_１、Ｓ_２、Ｓ_３の順に書込まれる。そ
して、参照スコアの演奏データに基づいて実歌唱開始時
刻順に歌唱合成スコアが形成される。例えば、演奏デー
タＳ_１に基づいて歌唱合成スコアＳＣ_１が形成され、演
奏データＳ_２に基づいて歌唱合成スコアＳＣ_２が形成さ
れる。この後、図９で述べたように歌唱合成スコアＳＣ
_１、ＳＣ_２…に従って歌唱合成が行なわれる。

【００６３】上記したのは、演奏データの送受信が実歌
唱開始時刻順に行なわれた場合の参照スコア及び歌唱合
成スコアの形成処理であるが、演奏データの送受信が実
歌唱開始時刻順に行なわれなかった場合の参照スコア及
び歌唱合成スコアの形成処理は、図１１、１２に示すよ
うになる。すなわち、演奏データＳ_１、Ｓ_３、Ｓ_４が時
刻ｔ_１、ｔ_２、ｔ_３にそれぞれ送信され、順次に受信さ
れたものとすると、参照スコアには、図１１に示すよう
に演奏データＳ_１が書込まれた後、演奏データＳ_３、Ｓ
_４が順次に書込まれ、演奏データＳ_１、Ｓ_３にそれぞれ
基づいて歌唱合成スコアＳＣ_１、ＳＣ_３ａが形成され
る。参照スコアにおける２回目以降の演奏データの書込
みについて、図１０，１１に示したように単に追加的に
書込むのを「追加」と称し、図１２に示したように演奏
データ間に挿入するように書込むのを「挿入」と称す
る。この後、時刻ｔ_４に演奏データＳ_２が送信され、受
信されたものとすると、図１２に示すように参照スコア
において演奏データＳ_１及びＳ _３の間に演奏データＳ_２
が挿入される。このとき、演奏データの挿入が起きた実
歌唱開始時刻より後の歌唱合成スコアが破棄され、演奏
データの挿入が起きた実歌唱開始時刻以降の演奏データ
に基づいて歌唱合成スコアが形成される。例えば、歌唱
合成スコアＳＣ_３ａが破棄され、演奏データＳ_２、Ｓ_３
にそれぞれ基づいて歌唱合成スコアＳＣ_２、ＳＣ_３ｂが
形成される。

【００６４】図１３は、ステップ４２における演奏デー
タに基づく歌唱合成スコアの形成例及びステップ４４に
おける歌唱音声の合成例を示すものである。歌唱合成ス
コアＳＣは、ＲＡＭ１６内に形成されるもので、音韻ト
ラックＴ_Ｐと、遷移トラックＴ_Ｒと、ビブラートトラッ
クＴ_Ｂとからなっている。歌唱合成スコアＳＣについて
は、演奏データを受信するたびにデータの更新や追加が
行なわれる。

【００６５】一例として、演奏データＳ_１、Ｓ_２、Ｓ_３
が図１（Ｂ）で示したと同様に「さ（ｓａ）：Ｃ_３：Ｔ
１…」、「い（ｉ）：Ｄ_３：Ｔ２…」、「た（ｔａ）：
Ｅ_３：Ｔ３…」を示すものとすると、音韻トラックＴ_Ｐ
には、図１３，１４に示すような情報が記憶される。す
なわち、歌唱順に無音（Sil）、無音から子音「ｓ」へ
の遷移（Sil_ｓ）、子音「ｓ」から母音「ａ」への遷移
（ｓ_ａ）、母音（ａ）…等の情報が配置される。Silの
情報は、開始時刻（Bigin Time＝Ｔ１１）、継続時間
（Duration＝Ｄ１１）及び音韻（PhU＝Sil）を表わす情
報からなる。Sil_ｓの情報は、開始時刻（Bigin Time
＝Ｔ１２）、継続時間（Duration＝Ｄ1２）先行音韻（P
hU１＝Sil）及び後続音韻（PhU２＝ｓ）を表わす情報か
らなる。ｓ_ａの情報は、開始時刻（Bigin Time＝Ｔ１
３）、継続時間（Duration＝Ｄ１３）、先行音韻（PhU
１＝ｓ）及び後続音韻（PhU２＝ａ）を表わす情報から
なる。ａの情報は、開始時刻（Bigin Time＝Ｔ１
４）、継続時間（Duration＝Ｄ１４）及び音韻（PhU＝
ａ）を表わす情報からなる。

【００６６】Sil_ｓ，ｓ_ａ等の音韻遷移の継続時間を
表わす情報は、先行音韻の時間長と後続音韻の時間長と
の組合せからなり、両時間長の境界を時間区切り情報と
して保持している。従って、この時間区切り情報を利用
することにより音源回路２８に対して先行音韻の継続時
間と後続音韻の開始時刻及び継続時間とを指示可能であ
る。例えば、Sil_ｓの継続時間情報に基づいて無音の継
続時間と子音「ｓ」の歌唱開始時刻Ｔ_１１及び歌唱継続
時間とを指示可能であり、ｓ_ａ継続時間に基づいて子
音「ｓ」の継続時間と母音「ａ」の歌唱開始時刻Ｔ１及
び歌唱継続時間とを指示可能である。

【００６７】遷移トラックＴ_Ｒには，図１３，１５に示
すような情報が記憶される。すなわち、遷移状態の進行
順に遷移状態なし（NONEと表記する）、アタック遷移状
態（Attack）、NONE、ノート遷移状態（NtN）、NONE、
リリース遷移状態（Release）、NONE…等の状態情報が
配置される。遷移トラックＴ_Ｒの状態情報は、演奏デー
タ及び音韻トラックＴ_Ｐの情報に基づいて形成されるも
ので、Attackの状態情報は、音韻トラックＴ_Ｐの「ｓ」
から「ａ」への音韻遷移の情報に対応し、NtNの状態情
報は、音韻トラックＴ_Ｐの「ａ」から「ｉ」への音韻遷
移の情報に対応し、Releaseの状態情報は、音韻トラッ
クＴ_Ｐの「ａ」から「Sil」への音韻遷移の情報に対応
する。各状態情報は、対応する音韻遷移の情報に基づい
て合成される歌唱音声に対して音高、振幅等の微小変化
を付加するために用いられる。なお、図１３の例では、
音韻トラックＴ_Ｐの「ｔ」から「ａ」への音韻遷移に対
応するNtNの状態情報を配置しないようにした。

【００６８】図１５に示すように、１番目のNONEの状態
情報は、開始時刻（Bigin Time＝Ｔ２１）、継続時間
（Duration＝Ｄ２１）及び遷移インデックス（Index＝N
ONE）を表わす情報からなる。Attackの状態情報は、開
始時刻（Bigin Time＝Ｔ２２）、継続時間（Duration
＝Ｄ２２）、遷移インデックス（Index＝Attack）及び
遷移インデックスのタイプ（例えば「Normal」、Type＝
Type２２）を表わす情報からなる。２番目のNONEの状態
情報は、開始時刻及び継続時間がそれぞれＴ２３及びＤ
２３となる点を除き１番目のNONEの状態情報と同様であ
る。NtNの状態情報は、開始時刻（Bigin Time＝Ｔ２
４）、継続時間（Duration＝Ｄ２４）、遷移インデック
ス（Index＝NtN）及び遷移インデックスのタイプ（例え
ば「Normal」、Type＝Type２４）を表わす情報からな
る。３番目のNONEの状態情報は、開始時刻及び継続時時
間がそれぞれＴ２５及びＤ２５となる点を除き１番目の
NONEの状態情報と同様である。Releaseの状態情報は、
開始時刻（Bigin Time＝Ｔ２６）、継続時間（Duratio
n＝Ｄ２６）、遷移インデックス（Index＝Release）及
び遷移インデックスのタイプ（例えば「Normal」、Type
＝Type２６）を表わす情報からなる。

【００６９】ビブラートトラックＴ_Ｂには、図１３，１
６に示すような情報が記憶される。すなわち、ビブラー
トイベントの進行順にビブラートオフ（Vibrato OF
F）、ビブラートオン（Vibrato ON）、ビブラートオフ
（Vibrato OFF）…等の情報が配置される。１番目のビ
ブラートオフの情報は、開始時刻（Bigin Time＝Ｔ３
１）、継続時間（Duration＝Ｄ３１）及び遷移インデッ
クス（Index＝OFF）を表わす情報からなる。ビブラート
オンの情報は、開始時刻（Bigin Time＝Ｔ３２）、継
続時間（Duration＝Ｄ３２）、遷移インデックス（Inde
x＝ON）及びビブラートのタイプ（例えば「Normal」、T
ype＝Type３２）を表わす情報からなる。２番目のビブ
ラートオフの情報は、開始時刻及び継続時間がそれぞれ
Ｔ３３及びＤ３３となる点を除き１番目のビブラートオ
フ情報と同様である。

【００７０】ビブラートオンの情報は、音韻トラックＴ
_Ｐにおける「た」の母音「ａ」の情報に対応するもの
で、「ａ」の情報に基づいて合成される歌唱音声に音
高、振幅等のビブラート的変化を付加するために用いら
れる。ビブラートオンの情報において、開始時刻を歌唱
音声「ａ」の発生開始時刻Ｔ３から遅延時間ＤＬだけ遅
く設定することにより遅延ビブラートを実現することが
できる。なお、図１４〜１６に示したＴ１１〜１４，Ｔ
２１〜Ｔ２６，Ｔ３１〜Ｔ３３等の開始時刻やＤ１１〜
Ｄ１４，Ｄ２１〜Ｄ２６，Ｄ３１〜Ｄ３３等の継続時間
は、テンポクロック信号ＴＣＬのクロック数で適宜設定
することができる。

【００７１】上記したような歌唱合成スコアＳＣと演奏
データＳ_１〜Ｓ_３を用いると、ステップ４４の歌唱合成
処理において、図１３に示すような歌唱音声の合成が可
能となる。音韻トラックＴ_ＰのSilの情報に基づいて歌
唱開始前の無音時間を実現した後、Ｔ_ＰのSil_ｓの情報
と演奏データＳ_１中のＣ_３の音高情報とに対応する音源
制御情報を図６（Ｂ）の音韻遷移ＤＢ１４ｂから読出し
て音源回路２８を制御することにより時刻Ｔ_１１で子音
「ｓ」の発生を開始させる。このときの制御期間は、Ｔ
_ＰのSil_ｓの情報の指示する継続時間に対応する。次
に、Ｔ_Ｐのｓ_ａの情報とＳ_１中のＣ_３の音高情報とに
対応する音源制御情報をＤＢ１４ｂから読出して音源回
路２８を制御することにより時刻Ｔ１で母音「ａ」の発
生を開始させる。このときの制御期間は、Ｔ_Ｐのｓ_ａ
の情報の指示する継続時間に対応する。この結果、歌唱
音声ＳＳ_１として「さ（ｓａ）」が発生される。

【００７２】この後、Ｔ_Ｐの情報とＳ_１のＣ_３の音高情
報とに対応する音源制御情報を図５の音韻ＤＢ１４ａか
ら読出して音源回路２８を制御することにより母音
「ａ」の発生を継続する。このときの制御期間は、Ｔ_Ｐ
のａの情報の指示する継続時間に対応する。次に、Ｔ_Ｐ
のａ_ｉの情報とＳ_２中のＤ_３の音高情報とに対応する
音源制御情報をＤＢ１４ｂから読出して音源回路２８を
制御することにより時刻Ｔ２で母音「ａ」の発生を終了
させると共に母音「ｉ」の発生を開始させる。このとき
の制御期間は、Ｔ_Ｐのａ_ｉの情報の指示する継続時間
に対応する。

【００７３】この後、上記したと同様にしてＴ_Ｐのｉ及
びＤ_３に対応する音源制御情報とＴ _Ｐのｉ_ｔ及びＤ_３
に対応する音源制御情報とを順次に読出して音源回路２
８を制御することにより母音「ｉ」の発音を時刻Ｔ_３１
まで継続し、時刻Ｔ_３１から子音「ｔ」の発生を開始さ
せる。そして、Ｔ_Ｐのｔ_ａ及びＥ_３に対応する音源制
御情報に応じて音源回路２８を制御することにより時刻
Ｔ３から母音「ａ」の発生を開始させた後、Ｔ_Ｐのａ及
びＥ_３に対応する音源制御情報と、Ｔ_Ｐのａ_Sil及びＥ
_３に対応する音源制御情報とを順次に読出して音源回路
２８を制御することにより母音「ａ」の発生を時刻Ｔ４
まで継続し、時刻Ｔ４から無音状態とする。この結果、
歌唱音声ＳＳ_２，ＳＳ_３として、「い（ｉ）」、「た
（ｔａ）」が順次に発生されることになる。

【００７４】上記のような歌唱音声の発生に伴って演奏
データＳ_１〜Ｓ_３中の情報と遷移トラックＴ_Ｒの情報と
に基づいて歌唱音声制御が行なわれる。すなわち、時刻
Ｔ１の前後には、Ｔ_ＲのAttackの状態情報とＴ_Ｐのｓ_
ａの情報とＳ_１中のＣ_３の音高情報とに対応する音源制
御情報を図７の状態遷移ＤＢ１４ｃから読出して音源回
路２８を制御することにより歌唱音声「ｓ_ａ」に対し
て音高、振幅等の微小変化を付加する。このときの制御
期間は、Attackの状態情報の指示する継続時間に対応す
る。また、時刻Ｔ２の前後にはＴ_ＲのNtNの状態情報と
Ｔ_Ｐのａ_ｉの情報と、Ｓ_２中のＤ_３の音高情報とに対
応する音源制御情報をＤＢ１４ｃから読出して音源回路
２８を制御することにより歌唱音声「ａ_ｉ」に対して
音高、振幅等の微小変化を付加する。このときの制御期
間は、NtNの状態情報の指示する継続時間に対応する。
さらに、時刻Ｔ４の直前には、Ｔ_ＲのReleaseの状態情
報とＴ_Ｐのａの情報とＳ_３中のＥ_３の音高情報とに対応
する音源制御情報をＤＢ１４ｃから読出して音源回路２
８を制御することにより歌唱音声「ａ」に対して音高、
振幅等の微小変化を付加する。このときの制御期間は、
Releaseの状態情報の指示する継続時間に対応する。上
記のような歌唱音声制御によれば、アタック感、ノート
遷移感又はリリース感のある自然な歌唱合成が可能とな
る。

【００７５】また、上記のような歌唱音声の発生に伴っ
て演奏データＳ_１〜Ｓ_３中の情報及びビブラートトラッ
クＴ_Ｂの情報とに基づいて歌唱音声制御が行われる。す
なわち、時刻Ｔ３から遅延時間ＤＬだけ遅れた時刻にな
ると、Ｔ_Ｂのビブラートオンの情報とＴ_Ｐのａの情報と
Ｓ_３中のＥ_３の音高情報とに対応した音源制御情報を図
８のビブラートＤＢ１４ｄから読出して音源回路２８を
制御することにより歌唱音声「ａ」に対して音高、振幅
等のビブラート的変化を付加し、このような付加を時刻
Ｔ４まで続ける。このときの制御期間は、ビブラートオ
ンの情報の指示する継続期間に対応する。また、ビブラ
ートの深さや速さは、Ｓ_３中のビブラートタイプの情報
に応じて決定される。上記のような歌唱音声制御によれ
ば、所望の歌唱個所にビブラートを付加して自然な歌唱
合成を行なうことができる。

【００７６】次に、図１７を参照して演奏データ受信・
歌唱合成スコア形成処理を説明する。ステップ５０で
は、初期化処理を行ない、例えばＲＡＭ１６内の受信回
数カウンタｎに０をセットする。

【００７７】ステップ５２では、カウンタｎの値ｎを１
増加（ｎ＋１）する。そして、ステップ５４で変数ｍを
カウンタｎの値ｎとし、ｍ＝ｎ番目の演奏データを受信
してＲＡＭ１６内の受信バッファに書込む。

【００７８】ステップ５６では、ｍ＝ｎ番目の演奏デー
タがデータエンドか判定する。ステップ５４でｍ＝１番
目の演奏データを受信したときは、ステップ５６の判定
結果が否定的（Ｎ）となり、ステップ５８に移る。ステ
ップ５８では、ｍ＝ｎ番目の演奏データを受信バッファ
から読出してＲＡＭ１６内の参照スコアに書込む。参照
スコアにｍ＝１番目の演奏データを書込んだ後は、図１
０〜１２で前述したように参照スコアに演奏データを
「追加」又は「挿入」の形で書込むことになる。

【００７９】次に、ステップ６０では、ｎ＞１か判定す
る。ｍ＝１番目の演奏データを受信したときは、ステッ
プ６０の判定結果が否定的（Ｎ）となり、ステップ５２
に戻る。ステップ５２では、ｎ＝２とし、ステップ５４
では、ｍ＝２番目の演奏データを受信し、受信バッファ
に書込む。そして、ステップ５６を経てステップ５８に
来ると、ｍ＝２番目の演奏データを参照スコアに追加す
る。

【００８０】次に、ステップ６０でｎ＞１か判定する
と、ｎ＝２であるので、判定結果が肯定的（Ｙ）とな
り、ステップ６１の歌唱合成スコア形成処理を行なう。
ステップ６１の処理については、図１８を参照して後述
するが、概略的に説明すると、次のようになる。すなわ
ち、ステップ６２では、ｍ＝ｎ−１番目の演奏データを
参照スコアに挿入したか判定する。例えば、ｍ＝１番目
の演奏データについては、挿入ではないので、ステップ
６２の判定結果が否定的（Ｎ）となり、ステップ６４に
移る。ステップ６４では、ｍ＝ｎ−１番目の演奏データ
について歌唱合成スコアを形成する。例えば、ステップ
５４でｍ＝２番目の演奏データを受信したときは、ステ
ップ６４でｍ＝１番目の演奏データについて歌唱合成ス
コアが形成される。

【００８１】ステップ６４の処理が終わると、ステップ
５２に戻り、上記したと同様にして演奏データの受信及
び参照スコアへの演奏データの書込みを行なう。例え
ば、ステップ６４でｍ＝１番目の演奏データについて歌
唱合成スコアを形成した後は、ステップ５４でｍ＝３番
目の演奏データを受信し、ステップ５８でｍ＝３番目の
演奏データを参照スコアに追加又は挿入する。

【００８２】ステップ６２の判定結果が肯定的（Ｙ）で
あったときは、参照スコアにｍ＝ｎ−１番目の演奏デー
タを挿入した場合であり、ステップ６６に移る。ステッ
プ６６ではｍ＝ｎ−１番目の演奏データより実歌唱開始
時刻が後の歌唱合成スコアを破棄し、ｍ＝ｎ−１番目の
演奏データ以降の演奏データについて歌唱合成スコアを
形成する。例えば、図１１，１２に示すように演奏デー
タＳ_１，Ｓ_３，Ｓ_４を受信した後、演奏データＳ_２を受
信すると、ステップ５８では、ｍ＝４番目の演奏データ
Ｓ_２を参照スコアに挿入する。そして、ステップ６０を
経てステップ６２に来ると、ｍ＝４−１＝３番目の演奏
でデ―タＳ_４は、参照スコアに追加されたものであるの
で、ステップ６２の判定結果が否定的（Ｎ）となり、ス
テップ６４を経てステップ５２に戻る。そして、ステッ
プ５４でｍ＝５番目の演奏データを受信した後、ステッ
プ５６，５８，６０を経てステップ６２に来ると、ｍ＝
４番目の演奏データＳ_２は、参照スコアに挿入されたも
のであるので、ステップ６２の判定結果が肯定的（Ｙ）
となり、ステップ６６において、ｍ＝４番目の演奏デー
タＳ_２より実歌唱開始時刻が後の歌唱合成スコア（図１
２のＳＣ_３ａ等）を破棄し、ｍ＝４番目の演奏データＳ
_２以降の演奏データ（図１２のＳ_２，Ｓ_３，Ｓ_４）につ
いて歌唱合成スコアを形成する。

【００８３】ステップ６６の処理が終わると、ステップ
５２に戻り、上記したと同様の処理を繰返す。ｍ＝ｎ番
目の演奏データがデータエンドになると、ステップ５６
の判定結果が肯定的（Ｙ）となり、ステップ６８で終端
処理（例えばエンド情報の付加等）を行なう。ステップ
６８の後は、図３のステップ４４の歌唱合成処理を行な
う。

【００８４】図１８は、歌唱合成スコア形成処理を示す
ものである。ステップ７０では、参照スコアから図４に
示したような演奏情報を含む演奏データを取得する。ス
テップ７２では、取得した演奏データに含まれる演奏情
報を分析する。ステップ７４では、分析された演奏情報
及び保存された管理データ（先行演奏データの管理デー
タ）に基づいて歌唱合成スコア形成のための管理データ
を作成する。ステップ７４の処理については、図１９を
参照して後述する。

【００８５】次に，ステップ７６では、取得に係る演奏
データが参照ストアに書き込まれた際に挿入されたか判
定する。この判定の結果が肯定的（Ｙ）であれば、ステ
ップ７８において、取得に係る演奏データより実歌唱開
始時刻が後の歌唱合成スコアを破棄する。

【００８６】ステップ７８の処理が終わったとき又はス
テップ７６の判定結果が否定的（Ｎ）であったときは、
ステップ８０で音韻トラック形成処理を行なう。ステッ
プ８０の処理では、演奏情報と、ステップ７４で作成さ
れた管理データと、保存されたスコアデータと（先行演
奏データのスコアデータ）とに基づいて音韻トラックＴ
_Ｐを形成するが、このような処理の詳細については、図
２２を参照して後述する。

【００８７】ステップ８２では、演奏情報と、ステップ
７４で作成された管理データと、保存されたスコアデー
タと音韻トラックＴ_Ｐとに基づいて遷移トラックＴ_Ｒを
形成する。ステップ８２の処理の詳細については、図３
４を参照して後述する。

【００８８】ステップ８４では、演奏情報と、ステップ
７４で作成された管理データと、保存されたスコアデー
タと音韻トラックＴ_Ｐとに基づいてビブラートトラック
Ｔ_Ｂを形成する。ステップ８４の処理の詳細について
は、図３７を参照して後述する。

【００８９】ステップ８６では、演奏情報と、ステップ
７４で作成された管理データと、音韻トラックＴ_Ｐと、
遷移トラックＴ_Ｒと、ビブラートトラックＴ_Ｂとに基づ
いて次の演奏データのためのスコアデータを形成し、保
存する。スコアデータには、先行母音からのNtN遷移時
間長が含まれる。このNtN遷移時間長は、図３６に示す
ように先行ノート（先行母音）にかかる時間長Ｔ_１と後
続ノート（本演奏データ）にかかる時間長Ｔ_２との組合
せからなるもので、両時間長の境界を時間区切り情報と
して保持している。NtN遷移時間長を算出するには、演
奏情報中の歌唱音韻と歌唱音高と歌唱ノート遷移タイプ
（例えば「Normal」）とに対応するNtNの状態遷移時間
長を図７の状態遷移ＤＢ１４ｃから読出し、この状態遷
移時間長に対して演奏情報中の歌唱ノート遷移伸縮率を
乗算すればよい。この乗算の結果として得られるNtN遷
移時間長は、図１３，１５に示したNtNの状態情報中の
継続時間情報として用いられる。

【００９０】図１９は、管理データ作成処理を示すもの
である。管理データとしては、図２０，２１に示すよう
に音韻状態（PhU State）、音素（Phoneme）、音高（P
itch）、現ノートオン（Current Note On）、現ノー
トデュレーション（CurrentNote Duration）、現ノー
トオフ（Current Note Off）、フルデュレーション
（Full Duration）、イベント状態（Event State）
等の情報がある。

【００９１】ステップ９０で演奏データを取得した後、
ステップ９２では、演奏データ中の歌唱音韻を分析す
る。音韻状態情報は、子音と母音との組合せ、母音のみ
又は有声のみのいずれかを表わす。以下では、便宜上、
子音と母音との組合せの場合をPhU State ＝ Conson
ant Vowelとし、母音のみ又は有声子音のみの場合をPh
U State ＝ Vowelとする。音素情報は，音素名（子
音名及び／又は母音名）、子音のカテゴリ（鼻音、破裂
音、半母音、その他）、子音の有声又は無声等を表わ
す。

【００９２】ステップ９４では、演奏データ中の歌唱音
高を分析し、この歌唱音高を音高情報とする。ステップ
９６では、演奏データ中の実歌唱時刻を分析し、実歌唱
開始時刻を現ノートオン情報とする。また、実歌唱長を
現ノートデュレーション情報とし、実歌唱開始時刻から
実歌唱長だけ経過した時刻を現ノートオフ情報とする。

【００９３】現ノートオン情報としては、実歌唱開始時
刻を修正した時刻を採用してもよい。例えば、乱数発生
処理等により実歌唱開始時刻（実線で示す）の前後に及
ぶ所定の時間範囲（２本の破線で示す）内でΔｔだけラ
ンダムに変更した時刻（実歌唱開始時刻をｔ_０とする
と、ｔ_０±Δｔの時刻）を現ノートオン情報としてもよ
い。

【００９４】ステップ９８では、先行演奏データの管理
データを用いて先行歌唱イベントとの関係で本演奏デー
タの歌唱時刻を分析する。先行演奏データの管理データ
において、先行イベントナンバ（Event Number）情報
は、先行演奏データの並べ替えを済ませた受信ナンバを
表わし、先行スコアデータ（Score Data）は、先行演
奏データについて歌唱合成スコアを形成した際にステッ
プ８６で形成し、保存されたスコアデータであり、先行
ノートオフ（Note Off）情報は、先行実歌唱終了時刻
を表わす。イベントステート情報は、先行ノートオフ情
報及び現ノートオン情報に基づいて決定された先行歌唱
イベントと現歌唱イベントの接続状況（無音の有無）を
表わす。以下では、便宜上、図２０に示すように先行歌
唱イベントと現歌唱イベントとが連続する場合（無音な
しの場合）をEvent State ＝Transitionとし、図２１
に示すように先行歌唱イベントと現歌唱イベントとの間
に無音が入る場合をEvent State ＝ Attackとする。
フルデュレーション情報は、先行ノートオフ情報の指示
する先行実歌唱終了時刻から現ノートオフ情報の指示す
る実歌唱終了時刻までの時間長を表わす。

【００９５】次に、図２２を参照して音韻トラック形成
処理を説明する。ステップ１００では、演奏情報（演奏
データの内容）、管理データ及びスコアデータを取得す
る。ステップ１０２では、取得データに基づいて図６
（Ｂ）の音韻遷移ＤＢ１４ｂから音韻遷移時間長を獲得
する（読出す）。ステップ１０２の処理については、図
２３を参照して後述する。

【００９６】ステップ１０４では、管理データに基づい
てEvent State ＝ Attackか判定する。この判定の結
果が肯定的（Ｙ）であれば、前に無音（Silence）が存
在することになり、ステップ１０６でSilence歌唱長を
算出する。ステップ１０６の処理については、図２４を
参照して後述する。

【００９７】ステップ１０４の判定結果が否定的（Ｎ）
であったときは、Event State ＝Transitionで前に母
音が存在することになり、ステップ１０８で先行Vowel
（母音）歌唱長を算出する。ステップ１０８の処理につ
いては、図２８を参照して後述する。

【００９８】ステップ１０６又は１０８の処理が終わっ
たときは、ステップ１１０でVowel歌唱長を算出する。
ステップ１１０の処理については、図３２を参照して後
述する。

【００９９】図２３は、ステップ１０２の音韻遷移時間
長獲得処理を示すもので、ステップ１１２では，管理デ
ータ及びスコアデータを取得する。そして、ステップ１
１４では、すべての音韻遷移時間長（後述のステップ１
１６，１２２，１２４，１２６，１３０，１３２，１３
４で獲得される音韻遷移時間長）を初期化する。

【０１００】ステップ１１６では、管理データに基づい
てV_Sil（母音から無音へ）の音韻遷移時間長をＤＢ１
４ｂから獲得する。一例として、母音が「ａ」であり、
その音高が「Ｐ１」であるとすると、ＤＢ１４ｂから
は、「ａ_Sil 」と「Ｐ１」とに対応した音韻遷移時間
長が獲得される。ステップ１１６の処理は、日本語が母
音で終わることと関連している。

【０１０１】ステップ１１８では、管理データに基づい
てEvent State ＝ Attackか判定する。この判定の結
果が肯定的（Ｙ）であれば、ステップ１２０で管理デー
タに基づいてPhU State ＝ Consonant Vowel か判
定する。この判定の結果が肯定的（Ｙ）であれば、ステ
ップ１２２で管理データに基づいてＤＢ１４ｂからSil_
Ｃ（無音から子音へ）の音韻遷移時間長を獲得する。こ
の後、ステップ１２４では、管理データに基づいてＤＢ
１４ｂからＣ_Ｖ（子音から母音へ）の音韻遷移時間長
を獲得する。

【０１０２】ステップ１２０の判定結果が否定的（Ｎ）
であったときは、PhU State ＝Vowelであったことに
なり、ステップ１２６で管理データに基づいてＤＢ１４
ｂからSil_Ｖ（無音から母音へ）の音韻遷移時間長を獲
得する。なお、ステップ１２２〜１２６における音韻遷
移時間長の具体的な獲得法は、ステップ１１６で述べた
と同様である。

【０１０３】ステップ１１８の判定結果が否定的（Ｎ）
であったときは、ステップ１２０と同様にしてステップ
１２８でPhU State ＝ Consonant Vowel か判定す
る。この判定の結果が肯定的（Ｙ）であれば、ステップ
１３０で管理データ及びスコアデータに基づいてｐＶ_
Ｃ（先行母音から子音へ）の音韻遷移時間長をＤＢ１４
ｂから獲得する。一例として、スコアデータにより先行
母音が「ａ」であり、管理データにより子音が「ｓ」
で、その音高が「Ｐ２」であるとすると、ＤＢ１４ｂか
らは、「ａ_ｓ」及び「Ｐ２」に対応した音韻遷移時間
長が獲得される。この後、ステップ１３２では、ステッ
プ１１６で述べたと同様にして管理データに基づいてＤ
Ｂ１４ｂからＣ_Ｖ（子音から母音へ）の音韻遷移時間
長を獲得する。

【０１０４】ステップ１２８の判定結果が否定的（Ｎ）
であったときは、ステップ１３４に移る。ステップ１３
４では、ステップ１３０で述べたと同様にして管理デー
タ及びスコアデータに基づいてＤＢ１４ｂからｐＶ_Ｖ
（先行母音から母音へ）の音韻遷移時間長を獲得する。

【０１０５】図２４は、ステップ１０６のSilence歌唱
長算出処理を示すもので、ステップ１３６では、演奏情
報、管理データ及びスコアデータを獲得する。

【０１０６】ステップ１３８では、PhU State ＝ Co
nsonant Vowel か判定する。この判定の結果が肯定的
（Ｙ）であれば、ステップ１４０でConsonant歌唱長を
算出する。この場合、図２５に示すように、子音歌唱時
間は、無音から子音への音韻遷移時間長内の子音部と、
Consonant歌唱長と、子音から母音への音韻遷移時間長
内の子音部の加算によって決まる。従って、Consonant
歌唱長は、子音歌唱時間の一部となる。

【０１０７】図２５には、演奏情報に含まれる歌唱子音
伸縮率が１より大きい場合においてConsonant歌唱長を
決定する例を示す。この場合、Sil_Cの子音長とC_Vの子
音長とを加算したものを基本単位とし、これに歌唱子音
伸縮率を乗算したものをConsonant歌唱長Ｃとする。そ
して、Sil_C とC_Vとの間にConsonant歌唱長Ｃを介在さ
せることによって子音歌唱時間を伸長する。

【０１０８】図２６には、歌唱子音伸縮率が１より小さ
い場合においてConsonant歌唱長を決定する例を示す。
この場合、Sil_Cの子音長とC_Vの子音長とにそれぞれ歌
唱子音伸縮率を乗算して各々子音長を短縮する。この結
果、Sil_Cの子音長とC_Vの子音長とからなる子音歌唱時
間が短縮される。

【０１０９】次に、ステップ１４２では、Silence歌唱
長を算出する。図２７に示すように、無音時間は、先行
母音から無音への音韻遷移時間長の無音部と、Silence
歌唱長と、無音から子音への音韻遷移時間長の無音部
と、子音歌唱時間との加算、あるいは先行母音から無音
への音韻遷移時間長の無音部と、Silence歌唱長と、無
音から母音への音韻遷移時間長の無音部との加算によっ
て決まる。従って、Silence歌唱長は、無音時間の一部
となる。ステップ１４２では、歌唱の順に従い、Ｃ_V内
の子音部と母音部との境界又はSil_V内の無音部と母音
部との境界が実歌唱開始時刻（Current Note On）と
なるようにSilence歌唱長を算出する。すなわち、本演
奏データの母音の歌唱開始時刻が実歌唱開始時刻と一致
するようにSilence歌唱長を算出する。

【０１１０】図２７（Ａ）〜（Ｃ）には、互いに異なる
音韻接続パターンを示す。（Ａ）のパターンは、例えば
先行母音「あ」−無音−「さ（ｓａ）」に対応し、子音
「ｓ」を伸長するためにConsonant歌唱長Ｃが挿入され
ている。（Ｂ）のパターンは、例えば先行母音「あ」−
無音−「ぱ（ｐａ）」に対応する。（Ｃ）のパターン
は、例えば先行母音「あ」−無音−「い（ｉ）」に対応
する。

【０１１１】図２８は、ステップ１０８の先行Vowel歌
唱長算出処理を示すもので、ステップ１４６では、演奏
情報、管理データ及びスコアデータを取得する。

【０１１２】ステップ１４８では、PhU State ＝ Co
nsonant Vowel か判定する。この判定の結果が肯定的
（Ｙ）であれば、ステップ１５０でConsonant歌唱長を
算出する。この場合、図２９に示すように、子音歌唱時
間は、先行母音から子音への音韻遷移時間長内の子音部
と、Consonant歌唱長と、子音から母音への音韻遷移時
間長内の子音部の加算によって決まる。従って、Conson
ant歌唱長は、子音歌唱時間の一部となる。

【０１１３】図２９には、演奏情報に含まれる歌唱子音
伸縮率が１より大きい場合においてConsonant歌唱長を
決定する例を示す。この場合、ｐV_Cの子音長とC_Vの子
音長とを加算したものを基本単位とし、これに歌唱子音
伸縮率を乗算したものとの間にConsonant歌唱長Ｃを介
在させることによって子音歌唱時間を伸長する。

【０１１４】図３０には、歌唱伸縮率が１より小さい場
合においてConsonant歌唱長を決定する例を示す。この
場合、ｐV_Cの子音長とC_Vの子音長とにそれぞれ歌唱伸
縮率を乗算して各々の子音長を短縮する。この結果、ｐ
V_Cの子音長とC_Vの子音長とからなる子音歌唱時間が短
縮される。

【０１１５】次に、ステップ１５２では、先行Vowel歌
唱長を算出する。図３１に示すように、先行母音歌唱時
間は、Ｘ（Sil、子音又は母音）から先行母音への音韻
遷移時間長の母音部と、先行Vowel歌唱長と、先行母音
から子音又は母音への音韻遷移時間長の母音部との加算
によって決まる。従って、先行Vowel歌唱長は、先行母
音歌唱時間の一部となる。また、本演奏データを受信し
たことにより先行演奏データと本演奏データとの接続が
明確になったので、先行演奏データに基づいて形成され
たVowel歌唱長及びV_Silは破棄する。すなわち、後述す
る図３２のVowel歌唱長算出処理で用いられる「次の演
奏データとの間に無音が挿入される」という仮定は破棄
される。ステップ１５２では、歌唱の順に従い、C_V内
の子音部と母音部との境界又はｐV_V内の先行母音部と
母音部との境界が実歌唱開始時刻（Current Note O
n）となるように先行Vowel歌唱長を算出する。すなわ
ち、本演奏データの母音の歌唱開始時刻が実歌唱開始時
刻と一致するように先行Vowel歌唱長を算出する。

【０１１６】図３１（Ａ）〜（Ｃ）には、互いに異なる
音韻接続パターンを示す、（Ａ）のパターンは、例えば
先行母音「あ」−「さ（ｓａ）」に対応し、子音「ｓ」
を伸長するためにConsonant歌唱長Ｃが挿入されてい
る。（Ｂ）のパターンは、例えば、先行母音「あ」−
「ぱ（ｐａ）」に対応する。（Ｃ）のパターンは、例え
ば、先行母音「あ」−「い（ｉ）」に対応する。

【０１１７】図３２は、ステップ１１０のVowel歌唱長
算出処理を示すもので、ステップ１５４では、演奏情
報、管理データ及びスコアデータを取得する。

【０１１８】ステップ１５６では、Vowel歌唱長を算出
する。この場合、次の演奏データを受信しないと、母音
の接続部が明確にならないため、「次の演奏データとの
間に無音が挿入される」と仮定し、図３３に示すように
母音部にV_Silを接続してVowel歌唱長を算出する。この
時点において、母音歌唱時間は、Ｘから母音への音韻遷
移時間長の母音部と、Vowel歌唱長と、母音から無音へ
の音韻遷移時間長の母音部との加算によって一時的に決
まる。従って、Vowel歌唱長は、母音歌唱時間の一部と
なる。ステップ１５６では、歌唱の順に従い、V_Sil内
の母音部と無音部との境界が実歌唱終了時刻（Current
Note Off）となるようにVowel歌唱長を決定する。

【０１１９】次の演奏データを受信したときは、本演奏
データとの接続状態（Event State）が明確になり、次
の演奏データのEvent State ＝ Attackの場合には本
演奏データのVowel歌唱長が更新されず、次の演奏デー
タのEvent State ＝ Transitionの場合には前述のス
テップ１５２の処理によって本演奏データのVowel歌唱
長が更新される。

【０１２０】図３４は、遷移トラック形成処理を示すも
ので、ステップ１６０では、演奏情報、管理データ、ス
コアデータ及び音韻トラックのデータを取得する。

【０１２１】ステップ１６２では、Attack遷移時間長を
算出する。このためには、演奏情報及び管理データに基
づいて歌唱アタックタイプと音韻と音高とに対応したAt
tack状態の状態遷移時間長を図７の状態遷移ＤＢ１４ｃ
から獲得する。そして、獲得した状態遷移時間長に対し
て演奏情報中の歌唱アタック伸縮率を乗算したものをAt
tack遷移時間長（アタック部の継続時間）とする。

【０１２２】ステップ１６４では、Release遷移時間長
を算出する。このためには、演奏情報及び管理データに
基づいて歌唱リリースタイプと音韻と音高とに対応した
Release状態の状態遷移時間長をＤＢ１４ｃから獲得す
る。そして、獲得した状態遷移時間長に対して演奏情報
中の歌唱リリース伸縮率を乗算したものをRelease遷移
時間長（リリース部の継続時間）とする。

【０１２３】ステップ１６６では、NtN遷移時間長を獲
得する。すなわち、図１８のステップ８６で保存された
スコアデータ中から、先行母音からのNtN遷移時間長
（ノート遷移部の継続時間）を獲得する。

【０１２４】ステップ１６８では、Event State ＝
Attackか判定する。この判定の結果が肯定的（Y）であ
れば、ステップ１７０で無音部に対応するNONE遷移時間
長（「NONEn遷移時間長」と称する）を算出する。すな
わち、PhU State ＝ Consonant Vowel の場合は、
図３５（Ａ）、（Ｂ）に示すように子音の歌唱開始時刻
とAttack遷移開始時刻（Attack遷移時間長の先端位置）
とが一致するようにNONEn遷移時間長を算出する。図３
５において、（Ａ）の例が（Ｂ）の例と異なるのは、子
音歌唱時間にConsonant歌唱長Ｃを挿入した点である。P
hU State ＝Vowelの場合は、図３５（Ｃ）に示すよう
に母音の歌唱開始時刻とAttack遷移開始時刻とが一致す
るようにNONEn遷移時間長を算出する。

【０１２５】ステップ１７０では、定常部に対応するNO
NE遷移時間長（「NONEs遷移時間長」と称する）を算出
する。この場合、次の演奏データを受信しないと、NONE
s遷移時間長に続く接続状態が明確にならないため、
「次の演奏データとの間に無音が挿入される」と仮定
し、図３５に示すようにRelease遷移を接続した状態でN
ONEs遷移時間長を算出する。すなわち、Release遷移終
了時刻（Release遷移時間長の終端位置）がV_Silの終了
時刻と一致するように先行演奏データの終了時刻とV_Si
lの終了時刻とAttack遷移時間長とRelease時間長とNONE
n遷移時間長とに基づいてNONEs遷移時間長を算出する。

【０１２６】ステップ１６８の判定結果が否定的（Ｎ）
であったときは、ステップ１７４で先行演奏データの定
常部に対応するNONE遷移時間長（「pNONEs遷移時間長」
と称する）を算出する。本演奏データを受信したことに
より先行演奏データとの接続状態が明確になったので、
先行演奏データに基づいて形成されたNONEs遷移時間長
及び先行Release遷移時間長は破棄する。すなわち、後
述するステップ１７６の処理で用いられる「次の演奏デ
ータのと間に無音が挿入される」という仮定は破棄され
る。ステップ１７４では、図３６（Ａ）〜（Ｃ）に示す
ようにPhU State ＝ Consonant Vowel又はPhU Sta
te ＝ Vowelのいずれの場合にも、先行母音からのNtN
遷移時間長のＴ_１及びＴ_２の境界と本演奏データの実歌
唱開始（Current Note On）とが一致するように本演
奏データの実歌唱開始時刻及び実歌唱終了時刻とNtN遷
移時間長とに基づいてpNONEs遷移時間長を算出する。図
３６において、（Ａ）の例が（Ｂ）の例と異なるのは、
子音歌唱時間にConsonant歌唱長Ｃを挿入した点であ
る。

【０１２７】ステップ１７６では、定常部に対応するNO
NE遷移時間長（NONEs遷移時間長）を算出する。この場
合、次の演奏データを受信しないと、NONEs遷移時間長
に続く接続状態が明確にならないため、「次の演奏デー
タとの間に無音が挿入される」と仮定し、図３６に示す
ようにRelease遷移を接続した状態でNONEs遷移時間長を
算出する。すなわち、先行母音からのNtN遷移時間長Ｔ
_１及びＴ_２の境界と本演奏データの実歌唱開始時刻（Cu
rrent Note On）とが一致し且つRelease遷移終了時刻
（Release遷移時間長の終端位置）とV_Silの終了時刻と
が一致するように本演奏データの実歌唱開始時刻とV_Si
lの終了時刻と先行母音からのNtN遷移時間長とRelease
遷移時間長とに基づいてNONEs遷移時間長を算出する。

【０１２８】図３７は、ビブラートトラック形成処理を
示すもので、ステップ１８０では、演奏情報、管理デー
タ、スコアデータ及び音韻トラックのデータを取得す
る。

【０１２９】ステップ１８２では、取得データに基づい
てビブラートイベント継続か判定する。本演奏データの
実歌唱開始時刻からビブラートが開始され、先行演奏デ
ータからビブラート付加状態が継続する場合は、ステッ
プ１８２の判定結果が肯定的（Ｙ）となり、ステップ１
８４に移る。また、本演奏データの実歌唱開始時刻から
ビブラートが開始されるが、先行演奏データからビブラ
ート付加状態が継続しない場合、あるいは本演奏データ
からビブラートが開始されない場合は、ステップ１８２
の判定結果が否定的（Ｎ）となり、ステップ１８８に移
る。

【０１３０】ビブラートは、複数の演奏データ（ノー
ト）にまたがって歌唱されることが多い。本演奏データ
の実歌唱開始時刻からビブラートが開始されていても、
図３８（Ａ）に示すように先行ノートからビブラート付
加状態が継続する場合と、図３８（Ｄ）、（Ｅ）に示す
ように現ノートの実歌唱開始時刻からビブラートが追加
的に開始される場合とがありうる。同様に、無ビブラー
ト（ビブラート非付加状態）についても、本演奏データ
の実歌唱開始時刻から無ビブラートが開始されていて
も、図３８（Ｂ）に示すように先行ノートから無ビブラ
ートが継続する場合と、図３８（Ｃ）に示すように現ノ
ートの実歌唱開始時刻から無ビブラートが開始される場
合とがありうる。

【０１３１】ステップ１８８では、取得データに基づい
て無ビブラートイベント継続か判定する。先行ノートか
ら無ビブラート状態が継続する図３８（Ｂ）のような場
合は、ステップ１８８の判定結果が肯定的（Ｙ）とな
り、ステップ１９０に移る。また、現ノートの実歌唱開
始時刻から無ビブラートが開始されているが、先行ノー
トから無ビブラート状態が継続しない図３８（Ｃ）のよ
うな場合、あるいは現ノートの実歌唱開始時刻から無ビ
ブラートが開始されない場合は、ステップ１８８の判定
結果が否定的（Ｎ）となり、ステップ１９４に移る。

【０１３２】ビブラートイベント継続の場合、ステップ
１８４では、先行ビブラート時間長を破棄する。そし
て、ステップ１８６で先行ビブラート時間長と現ノート
の実歌唱開始時刻から開始されるビブラートのビブラー
ト時間長とを接続（加算）して新たなビブラート時間長
を算出する。そして、ステップ１９４に移る。

【０１３３】無ビブラートイベント継続の場合、ステッ
プ１９０では、先行無ビブラート時間長を破棄する。そ
して、ステップ１９２で先行無ビブラート時間長と現ノ
ートの実歌唱開始時刻から開始される無ビブラートの無
ビブラート時間長とを接続（加算）して新たな無ビブラ
ート時間長を算出する。そして、ステップ１９４に移
る。

【０１３４】ステップ１９４では、ビブラート時間長の
追加ありか判定する。この判定の結果が肯定的（Ｙ）で
あれば、ステップ１９６で追加無ビブラート時間長を算
出する。すなわち、ステップ１８６で算出されたビブラ
ート時間長の終端から追加するビブラート時間長までの
無ビブラート時間長を追加無ビブラート時間長として算
出する。

【０１３５】ステップ１９８では、追加ビブラート時間
長を算出する。そして、ステップ１９４に戻り、それ以
降の処理を上記したと同様に繰返す。この結果、複数の
追加ビブラート時間長を算出可能となる。

【０１３６】ステップ１９４の判定結果が否定的（Ｎ）
であったときは、ステップ２００で無ビブラート時間長
を算出する。すなわち、実歌唱時間長（Current Note
OnからCurrent Note Offまでの時間長）内で最終の
ビブラートイベントの最終時刻からV_Silの終了時刻ま
でを無ビブラート時間長として算出する。

【０１３７】上記したステップ１４２又は１５２では、
本演奏データの母音の歌唱開始時刻が実歌唱開始時刻と
一致するようにSilence歌唱長又は先行Vowel歌唱長を算
出したが、より自然な歌唱合成を行なうことを目的とし
て、次の（１）〜（１１）で述べるようにしてSilence
歌唱長、先行Vowel歌唱長及びVowel歌唱長を算出しても
よい。

【０１３８】（１）子音のカテゴリ（無声／有声破裂
音、無声／有声摩擦音、鼻音、半母音等）毎にSilence
歌唱長、先行Vowel歌唱長及びVowel歌唱長を算出する。
図３９には、子音のカテゴリが鼻音又は半母音である場
合に他の場合とはSilence歌唱長の決定の仕方を変えた
例を示す。

【０１３９】図３９において、（Ａ）の例は、音韻接続
パターンとしては、先行母音「あ」−無音−「さ（ｓ
ａ）」に対応したもので、子音及び母音からなる音韻に
ついて子音（この例では「ｓ」）を伸ばすためにConson
ant歌唱長を挿入した状態でSilence歌唱長を算出した例
である。（Ｂ）の例は、音韻接続パターンとしては、先
行音韻「あ」−無音−「ぱ（ｐａ）」に対応したもの
で、子音及び母音からなる音韻についてConsonant歌唱
長を挿入せずにSilence歌唱長を算出した例である。
（Ｃ）の例は、音韻接続パターンとしては、先行母音
「あ」−無音−「な（ｎａ）」に対応したもので、子音
（鼻音又は半母音）及び母音からなる音韻について子音
（この例では「ｎ」）を伸ばすためにConsonant歌唱長
Ｃを挿入した状態でSilence歌唱長を算出した例であ
る。（Ｄ）の例は、Consonant歌唱長を挿入しない点を
除き（Ｃ）と同様の例である。（Ｅ）の例は、音韻接続
パターンとしては、先行音韻「あ」−無音−「い
（ｉ）」に対応したもので、母音のみからなる音韻につ
いてSilence歌唱長を算出した（子音（鼻音）のみから
なる音韻についても同様とする）例である。

【０１４０】（Ａ）、（Ｂ）及び（Ｅ）の例は、本演奏
データの母音の歌唱開始時刻が実歌唱開始時刻と一致す
るようにSilence歌唱長を算出した例である。（Ｃ）及
び（Ｄ）の例は、本演奏データの子音の歌唱開始時刻が
実歌唱開始時刻と一致するようにSilence歌唱長を算出
した例である。

【０１４１】（２）子音（「ｐ」、「ｂ」、「ｓ」、
「ｚ」、「ｎ」、「ｗ」等）毎にSilence歌唱長、先行V
owel歌唱長及びVowel歌唱長を算出する。

【０１４２】（３）母音（「ａ」、「ｉ」、「ｕ」、
「ｅ」、「ｏ」等）毎にSilence歌唱長、先行Vowel歌唱
長及びVowel歌唱長を算出する。

【０１４３】（４）子音のカテゴリ（無声／有声破裂
音、無声／有声摩擦音、鼻音、半母音等）毎に且つ子音
に続く母音（「ａ」、「ｉ」、「ｕ」、「ｅ」、「ｏ」
等）毎にSilence歌唱長、先行Vowel歌唱長及びVowel歌
唱長を算出する。すなわち、子音のカテゴリと母音との
組合せ毎にSilence歌唱長、先行Vowel歌唱長及びVowel
歌唱長を算出する。

【０１４４】（５）子音（「ｐ」、「ｂ」、「ｓ」、
「ｚ」、「ｎ」、「ｗ」等）毎に且つ子音に続く母音毎
にSilence歌唱長、先行Vowel歌唱長及びVowel歌唱長を
算出する。すなわち、子音と母音との組合せ毎にSilenc
e歌唱長、先行Vowel歌唱長及びVowel歌唱長を算出す
る。

【０１４５】（６）先行母音（「ａ」、「ｉ」、
「ｕ」、「ｅ」、「ｏ」等）毎にSilence歌唱長、先行V
owel歌唱長及びVowel歌唱長を算出する。

【０１４６】（７）先行母音（「ａ」、「ｉ」、
「ｕ」、「ｅ」、「ｏ」等）毎に且つ先行母音に続く子
音のカテゴリ（無声／有声破裂音、無声／有声摩擦音、
鼻音、半母音等）毎にSilence歌唱長、先行Vowel歌唱長
及びVowel歌唱長を算出する。すなわち、先行母音と子
音のカテゴリとの組合せ毎にSilence歌唱長、先行Vowel
歌唱長及びVowel歌唱長を算出する。

【０１４７】（８）先行母音（「ａ」、「ｉ」、
「ｕ」、「ｅ」、「ｏ」等）毎に且つ先行母音に続く子
音（「ｐ」、「ｂ」、「ｓ」、「ｚ」、「ｎ」、「ｗ」
等）毎にSilence歌唱長、先行Vowel歌唱長及びVowel歌
唱長を算出する。すなわち、先行母音と子音との組合せ
毎にSilence歌唱長、先行Vowel歌唱長及びVowel歌唱長
を算出する。

【０１４８】（９）先行母音（「ａ」、「ｉ」、
「ｕ」、「ｅ」、「ｏ」等）毎に且つ先行母音に続く母
音（「ａ」、「ｉ」、「ｕ」、「ｅ」、「ｏ」等）毎に
Silence歌唱長、先行Vowel歌唱長及びVowel歌唱長を算
出する。すなわち、先行母音と母音との組合せ毎にSile
nce歌唱長、先行Vowel歌唱長及びVowel歌唱長を算出す
る。

【０１４９】（１０）先行母音（「ａ」、「ｉ」、
「ｕ」、「ｅ」、「ｏ」等）毎、先行母音に続く子音の
カテゴリ（無声／有声破裂音、無声／有声摩擦音、鼻
音、半母音等）毎及び子音に続く母音（「ａ」、
「ｉ」、「ｕ」、「ｅ」、「ｏ」等）毎にSilence歌唱
長、先行Vowel歌唱長及びVowel歌唱長を算出する。すな
わち、先行母音と子音のカテゴリと母音との組合せ毎に
Silence歌唱長、先行Vowel歌唱長及びVowel歌唱長を算
出する。

【０１５０】（１１）先行母音（「ａ」、「ｉ」、
「ｕ」、「ｅ」、「ｏ」等）毎、先行母音に続く子音
（「ｐ」、「ｂ」、「ｓ」、「ｚ」、「ｎ」、「ｗ」
等）毎及び子音に続く母音（「ａ」、「ｉ」、「ｕ」、
「ｅ」、「ｏ」等）毎にSilence歌唱長、先行Vowel歌唱
長及びVowel歌唱長を算出する。すなわち、先行母音と
子音と母音との組合せ毎にSilence歌唱長、先行Vowel歌
唱長及びVowel歌唱長を算出する。

【０１５１】この発明は、上記した実施形態に限定され
るものではなく、種々の改変形態で実施可能なものであ
る。例えば、次のような変更が可能である。

【０１５２】（１）上記した実施形態では、歌唱合成ス
コアの形成が完了した後、歌唱合成スコアに従って歌唱
音声を合成するようにしたが、歌唱合成スコアを形成し
つつ形成済みの歌唱合成スコアに従って歌唱音声を合成
するようにしてもよい。このためには、例えば、演奏デ
ータの受信を割り込み処理により優先的に行ないつつ受
信済みの演奏データに基づいて歌唱合成スコアを形成す
ればよい。

【０１５３】（２）上記した実施形態では、音源方式と
してフォルマント合成方式を用いたが、波形処理方式等
の他の方式を用いてもよい。

【０１５４】（３）上記した実施形態では、歌唱合成ス
コアを音韻トラック、遷移トラック及びビブラートトラ
ックの３トラックで構成したが、１トラック構成として
もよい。このためには、例えば、音韻トラックに遷移ト
ラック及びビブラートトラックの情報を適宜挿入すれば
よい。

【０１５５】

【発明の効果】以上のように、この発明によれば、子音
から母音に遷移する音韻について子音の立上りを母音の
立上りより十分に早くすることができるので、人歌唱に
近似した自然な歌唱合成が可能となる効果が得られる。

【０１５６】また、音韻遷移時間長を用いて歌唱開始時
刻や歌唱継続時間を決定するようにしたので、遷移する
音韻について自然な歌唱合成が可能となる効果も得られ
る。

【０１５７】さらに、状態遷移時間長を用いて歌唱音声
の立上り部、立下り部、ノート遷移部に音高、振幅等の
微小変化を付加したり、歌唱音声にビブラート効果等の
効果を付加したり、歌唱開始時刻をランダムに決定した
りしたので、一層自然な歌唱合成が可能となる効果も得
られる。

【図面の簡単な説明】

【図１】人歌唱と、この発明の歌唱合成とで歌唱開始
時刻を対比して示す図である。

【図２】この発明の一実施形態に係る歌唱合成装置の
回路構成を示すブロック図である。

【図３】実施形態に係る歌唱合成処理を概略的に説明
するためのフローチャートである。

【図４】演奏データ内の情報を示す図である。

【図５】音韻ＤＢ内の情報を示す図である。

【図６】音韻遷移ＤＢ内の情報を示す図である。

【図７】状態遷移ＤＢ内の情報を示す図である。

【図８】ビブラートＤＢ内の情報を示す図である。

【図９】演奏データに基づく歌唱合成を説明するため
の図である。

【図１０】参照スコア及び歌唱合成スコアの形成状況
を示す図である。

【図１１】参照スコアに演奏データを追加した場合の
歌唱合成スコアの形成状況を示す図である。

【図１２】参照スコアに演奏データを挿入した場合の
歌唱合成スコアの形成状況を示す図である。

【図１３】演奏データに基づく歌唱合成スコアの形成
状況及び歌唱音声の合成状況を示す図である。

【図１４】図１３の音韻トラックにおける種々のアイ
テムを説明するための図である。

【図１５】図１３の遷移トラックにおける種々のアイ
テムを説明するための図である。

【図１６】図１３のビブラートトラックにおける種々
のアイテムを説明するための図である。

【図１７】演奏データ受信・歌唱合成スコア形成処理
を示すフローチャートである。

【図１８】歌唱合成スコア形成処理を示すフローチャ
ートである。

【図１９】管理データ作成処理を示すフローチャート
である。

【図２０】 Event State＝Transitionの場合の管理デ
ータ作成処理を説明するための図である。

【図２１】 Event State＝Attackの場合の管理データ
作成処理を説明するための図である。

【図２２】音韻トラック形成処理を示すフローチャー
トである。

【図２３】音韻遷移時間長獲得処理を示すフローチャ
ートである。

【図２４】 Silence歌唱長算出処理を示すフローチャ
ートである。

【図２５】図２４の処理においてConsonant伸縮率が
１より大きい場合のConsonant歌唱長算出処理を説明す
るための図である。

【図２６】図２４の処理においてConsonant伸縮率が
１より小さい場合のConsonant歌唱長算出処理を説明す
るための図である。

【図２７】 Silence歌唱長の算出例を示す図である。

【図２８】先行Vowel歌唱長算出処理を示すフローチ
ャートである。

【図２９】図２８の処理においてConsonant伸縮率が
１より大きい場合のConsonant歌唱長算出処理を説明す
るための図である。

【図３０】図２８の処理においてConsonant伸縮率が
１より小さい場合のConsonant歌唱長算出処理を説明す
るための図である。

【図３１】先行Vowel歌唱長算出例を示す図である。

【図３２】 Vowel歌唱長算出処理を示すフローチャー
トである。

【図３３】 Vowel歌唱長算出例を示す図である。

【図３４】遷移トラック形成処理を示すフローチャー
トである。

【図３５】 NONEn，NONEs遷移時間長の算出例を示す図
である。

【図３６】 pNONEs，NONEs遷移時間長の算出例を示す
図である。

【図３７】ビブラートトラック形成処理を示すフロー
チャートである。

【図３８】ビブラートトラックの形成例を示す図であ
る。

【図３９】 Silence歌唱長算出の変形例を示す図であ
る。

【図４０】人歌唱と、従来の歌唱合成とで歌唱開始時
刻を対比して示す図である。

【符号の説明】

１０：バス、１２：ＣＰＵ、１４：ＲＯＭ、１６：ＲＡ
Ｍ、２０：検出回路、２２：表示回路、２４：外部記憶
装置、２６：タイマ、２８：音源回路、３０：ＭＩＤＩ
インターフェース、３４：操作子群、３６：表示器、３
８：サウンドシステム、３９：ＭＩＤＩ機器。

───────────────────────────────────────────────────── フロントページの続き (72)発明者ジャウメオルトラスペインバルセロナ 08002 メルセ 12 Ｆターム(参考） 5D045 AA20 5D378 MM05 MM38 MM94

Claims

【特許請求の範囲】

【請求項１】順次の第１及び第２の音素を含む歌唱音韻
について音韻を表わす音韻情報と歌唱開始時刻を表わす
時刻情報と歌唱長を表わす歌唱長情報とを前記歌唱開始
時刻より早く入力するステップと、入力された音韻情報に基づいて前記第１の音素の発生時
間長と前記第２の音素の発生時間長とからなる音韻遷移
時間長を生成するステップと、生成された音韻遷移時間長と入力された時刻情報及び歌
唱長情報とに基づいて前記第１及び第２の音素の歌唱開
始時刻と歌唱継続時間とを決定するステップと、決定された前記第１及び第２の音素の歌唱開始時刻にそ
れぞれ前記第１及び第２の音素からなる第１及び第２の
歌唱音声を発生開始し、該第１及び第２の歌唱音声を決
定された前記第１及び第２の音素の歌唱継続時間中それ
ぞれ発生するステップとを含む歌唱合成方法。
【請求項２】前記決定するステップでは、前記第１の
音素の歌唱開始時刻として、前記時刻情報で表わされる
歌唱開始時刻より早い時刻を決定する請求項１記載の歌
唱合成方法。
【請求項３】順次の第１及び第２の音素を含む歌唱音韻
について音韻を表わす音韻情報と歌唱開始時刻を表わす
時刻情報と歌唱長を表わす歌唱長情報とを前記歌唱開始
時刻より早く入力する入力手段と、前記第１の音素の発生時間長と前記第２の音素の発生時
間長とからなる音韻遷移時間長を記憶する記憶手段と、前記入力手段で入力された音韻情報に基づいて前記記憶
手段から音韻遷移時間長を読出す読出手段と、この読出手段で読出された音韻遷移時間長と前記入力手
段で入力された時刻情報及び歌唱長情報とに基づいて前
記第１及び第２の音素の歌唱開始時刻と歌唱継続時間と
を算出する計算手段と、この計算手段で算出された前記第１及び第２の音素の歌
唱開始時刻にそれぞれ前記第１及び第２の音素からなる
第１及び第２の歌唱音声を発生開始し、該第１及び第２
の歌唱音声を前記計算手段で算出された前記第１及び第
２の音素の歌唱継続時間中それぞれ発生する歌唱音声合
成手段とを備えた歌唱合成装置。
【請求項４】前記入力手段では、前記第１の音素の発
生時間長を修正するための修正情報を入力し、前記計算
手段では、前記読出手段で読出された音韻遷移時間長中
の第１の音素の発生時間長を前記入力手段で入力された
修正情報に応じて修正した後該音韻遷移時間長に基づい
て前記第１及び第２の音素の歌唱開始時刻と歌唱継続時
間とを算出する請求項３記載の歌唱合成装置。
【請求項５】歌唱音韻について音韻を表わす音韻情報と
歌唱開始時刻を表わす時刻情報と歌唱長を表わす歌唱長
情報とを入力するステップと、入力された音韻情報に基づいて前記歌唱音韻の立上り
部、ノート遷移部又は立下り部のいずれかに対応した状
態遷移時間長を生成するステップと、入力された音韻情報、時刻情報及び歌唱長情報に基づい
て前記音韻からなる歌唱音声を発生するステップであっ
て、生成された状態遷移時間長に対応する期間中前記歌
唱音声に対して音高及び振幅のうち少なくとも一方の変
化を付加するものとを含む歌唱合成方法。
【請求項６】歌唱音韻について音韻を表わす音韻情報と
歌唱開始時刻を表わす時刻情報と歌唱長を表わす歌唱長
情報とを入力する入力手段と、前記歌唱音韻の立上り部、ノート遷移部又は立下り部の
いずれかに対応した状態遷移時間長を記憶した記憶手段
と、前記入力手段で入力された音韻情報に基づいて前記記憶
手段から状態遷移時間長を読出す読出手段と、前記入力手段で入力された音韻情報、時刻情報及び歌唱
長情報に基づいて前記音韻からなる歌唱音声を発生する
歌唱音声合成手段であって、前記読出手段で読出された
状態遷移時間長に対応する期間中前記歌唱音声に対して
音高及び振幅のうち少なくとも一方の変化を付加するも
のとを備えた歌唱合成装置。
【請求項７】前記入力手段では、前記状態遷移時間長
を修正するための修正情報を入力し、前記読出手段で読
出された状態遷移時間長を前記入力手段で入力された修
正情報に応じて修正する修正手段を更に設け、前記歌唱
音声合成手段では、前記修正手段で修正された状態遷移
時間長に対応する期間中前記歌唱音声に対して音高及び
振幅のうち少なくとも一方の変化を付加する請求項６記
載の歌唱合成装置。
【請求項８】歌唱音韻について音韻を表わす音韻情報と
歌唱開始時刻を表わす時刻情報と歌唱長を表わす歌唱長
情報と効果の付加を表わす効果付加情報とを入力する入
力手段と、この入力手段で入力された音韻情報、時刻情報及び歌唱
長情報に基づいて前記音韻からなる歌唱音声を発生する
歌唱音声合成手段であって、前記入力手段で入力された
効果付加情報に基づいて前記歌唱音声に対して効果を付
加するものとを備えた歌唱合成装置。
【請求項９】前記入力手段で入力される効果付加情報
を効果の付加期間を表わすものとし、入力された効果付
加情報で表わされる効果の付加期間が前記歌唱音韻に先
行する歌唱音韻の効果の付加期間に連続するときに連続
する２つの付加期間に対応する新たな効果の付加期間を
設定する設定手段を更に設け、前記歌唱音声合成手段で
は、前記設定手段で設定された効果の付加期間中前記歌
唱音声に対して効果を付加する請求項８記載の歌唱合成
装置。
【請求項１０】歌唱音韻について音韻を表わす音韻情報
と歌唱開始時刻を表わす時刻情報と歌唱長を表わす歌唱
長情報とを前記歌唱開始時刻より早く入力する入力手段
と、この入力手段で入力された時刻情報に基づいて前記歌唱
開始時刻の前後に及ぶ所定の時間範囲内でランダムに新
たな歌唱開始時刻を設定する設定手段と、前記入力手段で入力された音韻情報及び歌唱長情報と前
記設定手段で設定された歌唱開始時刻とに基づいて前記
音韻からなる歌唱音声を発生する歌唱音声合成手段であ
って、前記設定手段で設定された歌唱開始時刻に前記歌
唱音声を発生開始するものとを備えた歌唱合成装置。
【請求項１１】順次の第１及び第２の音素を含む歌唱音
韻について音韻を表わす音韻情報と歌唱開始時刻を表わ
す時刻情報と歌唱長を表わす歌唱長情報とを前記歌唱開
始時刻より早く入力するステップと、入力された音韻情報に基づいて前記第１の音素の発生時
間長と前記第２の音素の発生時間長とからなる音韻遷移
時間長を生成するステップと、生成された音韻遷移時間長と入力された時刻情報及び歌
唱長情報とに基づいて前記第１及び第２の音素の歌唱開
始時刻と歌唱継続時間とを決定するステップと、決定された前記第１及び第２の音素の歌唱開始時刻にそ
れぞれ前記第１及び第２の音素からなる第１及び第２の
歌唱音声を発生開始し、該第１及び第２の歌唱音声を決
定された前記第１及び第２の音素の歌唱継続時間中それ
ぞれ発生するステップとを含むプログラムを記録した記
録媒体。
【請求項１２】歌唱音韻について音韻を表わす音韻情報
と歌唱開始時刻を表わす時刻情報と歌唱長を表わす歌唱
長情報とを入力するステップと、入力された音韻情報に基づいて前記歌唱音韻の立上り
部、ノート遷移部又は立下り部のいずれかに対応した状
態遷移時間長を生成するステップと、入力された音韻情報、時刻情報及び歌唱長情報に基づい
て前記音韻からなる歌唱音声を発生するステップであっ
て、生成された状態遷移時間長に対応する期間中前記歌
唱音声に対して音高及び振幅のうち少なくとも一方の変
化を付加するものとを含むプログラムを記録した記録媒
体。