JP3132721B2

JP3132721B2 - 楽音合成装置

Info

Publication number: JP3132721B2
Application number: JP08217965A
Authority: JP
Inventors: 慎一大田
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 1996-07-31
Filing date: 1996-07-31
Publication date: 2001-02-05
Anticipated expiration: 2016-07-31
Also published as: JPH1049171A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、所望のフォルマ
ントにしたがう楽音を合成する楽音合成装置に関する。

【０００２】

【従来の技術】従来より、人が発する音声には所定のフ
ォルマントが存在し、これにより音声が特徴づけられて
いることが知られている。一方、楽音合成装置で音声を
合成して所望の音高で出力することにより歌を唄わせる
試みがなされている。

【０００３】図１３は、そのような歌を唄わせる楽音合
成装置の構成の一例を示す。演奏情報１３１１や歌詞情
報１３１２は、例えばＭＩＤＩ（ＭｕｓｉｃａｌＩｎ
ｓｔｒｕｍｅｎｔＤｉｇｉｔａｌＩｎｔｅｒｆａｃ
ｅ）方式のメッセージとしてＣＰＵ１３０１に入力させ
る。演奏情報１３１１は、音高情報を含むノートオンと
ノートオフである。歌詞情報１３１２は、演奏情報１３
１１で指定した音符で発音すべき歌詞（音素データ）で
ある。歌詞情報１３１２は、ＭＩＤＩのシステムエクス
クルーシブなどの形式で作成する。例えば、「さいた」
という歌詞（音素で表わすと「ｓａｉｔａ」）を順次Ｃ
３，Ｅ３，Ｇ３の音高で唄わせる場合、演奏情報１３１
１と歌詞情報１３１２は、例えば以下のようなシーケン
ス（１）でＣＰＵ１３０１に入力させる。

【０００４】・ｓ＜２０＞ａ＜０＞・Ｃ３のノートオン・Ｃ３のノートオフ・ｉ＜０＞・Ｅ３のノートオン ………（１）・Ｅ３のノートオフ・ｔ＜０２＞ａ＜００＞・Ｇ３のノートオン・Ｇ３のノートオフ

【０００５】なお、ここではノートオンメッセージの前
にその音符で発音すべき歌詞データを送るようにしてい
る。ｓ，ａ，ｉ，ｔは音素を示し、音素に続く＜＞内の
数値はその音素のデュレーションタイム（持続時間）を
示す。ただし、＜０＞は次の音素のノートオンが来るま
でその音素を持続させて発音することを示す。

【０００６】このようなシーケンス（１）を受信したＣ
ＰＵ１３０１は、以下のように動作する。まず始めに、
発音すべき歌詞データ「ｓ＜２０＞ａ＜０＞」を受信す
ると、その歌詞データを歌詞情報バッファ１３０５に記
憶しておく。次に、「Ｃ３のノートオン」を受信する
と、ＣＰＵ１３０１は、歌詞情報バッファ１３０５を参
照して発音させる歌詞「ｓ＜２０＞ａ＜０＞」を知り、
その歌詞を指定音高「Ｃ３」で発生するようにフォルマ
ントパラメータを算出してフォルマント合成音源１３０
２に送出する。次に「Ｃ３のノートオフ」を受信する
が、ここでは「ａ＜０＞」が指定されているので、次の
ノートオンまで「ａ」を持続させるため、ＣＰＵ１３０
１は受信した「Ｃ３のノートオフ」を無視する。なお、
「ｓａ」と「ｉ」とを区切って発音する場合、ＣＰＵ１
３０１は、「Ｃ３のノートオフ」をフォルマント合成音
源１３０２に送出して、「ｓａ」のＣ３での発音を停止
させる。次に発音すべき歌詞データ「ｉ＜０＞」を受信
するとその歌詞データを歌詞情報バッファ１３０５に記
憶し、「Ｅ３のノートオン」を受信すると、ＣＰＵ１３
０１は、歌詞情報バッファ１３０５を参照して発音させ
る歌詞「ｉ＜０＞」を知り、その歌詞を指定音高「Ｅ
３」で発生するようにフォルマントパラメータを算出し
てフォルマント合成音源１３０２に送出する。以下、
「ｔａ」の発音も同様の処理により行なう。

【０００７】フォルマントパラメータは、時系列データ
であり、ＣＰＵ１３０１から所定の時間間隔でフォルマ
ント合成音源１３０２に転送する。所定の時間間隔と
は、通常、人の音声の特徴を出して発音するには、例え
ば数ｍｓｅｃ間隔程度の低レートでよい。この時間間隔
で逐次フォルマントを時間的変化させることにより、人
の音声の特徴を出して歌を唄わせる。フォルマントパラ
メータとしては、例えば、有声音／無声音の別、フォル
マント中心周波数、フォルマントレベル、およびフォル
マントバンド幅などがある。プログラムメモリ１３０３
はＣＰＵ１３０１が実行する制御プログラムなどを格納
したメモリ、ワーキングメモリ１３０４は各種のワーキ
ングデータを一次記憶するためのメモリである。

【０００８】

【発明が解決しようとする課題】ところで、このような
楽音合成装置で人の音声などを発音する場合、音素と音
素の切れ目（特に有声音から無声音へ移行する場合）が
うまくつながらず、発生した音声が不自然になることが
あるという問題があった。

【０００９】この発明は、音素と音素の切れ目をうまく
つなげて、発生する音声が自然に聞こえるようにした楽
音合成装置を提供することを目的とする。

【００１０】

【課題を解決するための手段】この目的を達成するた
め、請求項１に係る発明は、サンプリング周期と比較す
ると遅い時間間隔で外部から与えられるフォルマントパ
ラメータを入力し、該フォルマントパラメータにしたが
うフォルマントを有する有声音波形および無声音波形を
サンプリング周期で生成出力する有声音波形発生用およ
び無声音波形発生用の複数の音源チャンネルを備えた楽
音合成装置において、発音する音素の切り替えが有声音
同士あるいは無声音同士で行なわれる場合は、同一の音
源チャンネルを用いて、前記時間間隔で与えられたフォ
ルマントパラメータにしたがって楽音を生成出力し、発
音する音素の切り替えが有声音から無声音への切り替え
である場合は、前後の音素の関係によって短時間でフォ
ルマントレベルを落としたい場合を認識し、内部に備え
られているエンベロープ生成手段からサンプリング周期
ごとに出力されるエンベロープ波形を用いて先行音素の
フォルマントレベルを落とし、音源チャンネルを切り替
えて後続音素を発音することを特徴とする。

【００１１】請求項２に係る発明は、サンプリング周期
と比較すると遅い時間間隔で外部から与えられるフォル
マントパラメータを入力し、該フォルマントパラメータ
にしたがうフォルマントを有する有声音波形および無声
音波形をサンプリング周期で生成出力する有声音波形発
生用および無声音波形発生用の複数の音源チャンネルを
備えた楽音合成装置において、発音する音素の切り替え
が有声音同士あるいは無声音同士で行なわれるか、有声
音から無声音への切り替えかを検出する検出手段と、前
記音源チャンネルで発生した波形のフォルマントレベル
を落とすために用いるエンベロープ波形をサンプリング
周期ごとに発生するエンベロープ生成手段と、前記検出
手段で有声音同士あるいは無声音同士の切り替えを検出
した場合は、先行音素の発音で用いていた音源チャンネ
ルをそのまま用いて、先行音素のフォルマントパラメー
タから後続音素のフォルマントパラメータへと補間処理
することにより求めたフォルマントパラメータを前記時
間間隔で入力して、発音する音素を移行し、前記検出手
段で有声音から無声音への切り替えを検出した場合は、
前後の音素の関係によって短時間でフォルマントレベル
を落としたい場合を認識し、前記エンベロープ生成手段
からサンプリング周期ごとに出力されるエンベロープ波
形を用いて先行音素のフォルマントレベルを落とし、別
の音源チャンネルを用いて後続音素の発音を開始するよ
うに制御する手段とを備えたことを特徴とする。

【００１２】請求項３に係る楽音合成装置は、サンプリ
ング周期と比較すると遅い時間間隔でフォルマントパラ
メータを送出するフォルマントパラメータ送出手段であ
って、音素間でフォルマントパラメータを補間処理して
送出する機能を備えたものと、前記フォルマントパラメ
ータ送出手段から送出されたフォルマントパラメータに
したがうフォルマントを有する有声音波形および無声音
波形をサンプリング周期で生成出力する有声音波形発生
用および無声音波形発生用の複数の音源チャンネルと、
発音する音素の切り替えが有声音同士あるいは無声音同
士で行なわれるか、有声音から無声音への切り替えかを
検出する検出手段と、前記音源チャンネルで発生した波
形のフォルマントレベルを落とすために用いるエンベロ
ープ波形をサンプリング周期ごとに発生するエンベロー
プ生成手段と、前記検出手段で有声音同士あるいは無声
音同士の切り替えを検出した場合は、先行音素の発音で
用いていた音源チャンネルをそのまま用いて、前記フォ
ルマントパラメータ送出手段が先行音素のフォルマント
パラメータから後続音素のフォルマントパラメータへと
補間処理して求めたフォルマントパラメータを前記時間
間隔で送出するように制御し、前記検出手段で有声音か
ら無声音への切り替えを検出した場合は、前後の音素の
関係によって短時間でフォルマントレベルを落としたい
場合を認識し、前記エンベロープ生成手段からサンプリ
ング周期ごとに出力されるエンベロープ波形を用いて先
行音素のフォルマントレベルを落とすとともに、先行音
素の発音に用いた音源チャンネルとは別の音源チャンネ
ルを用いて後続音素の発音を開始するように制御する手
段とを備えたことを特徴とする。

【００１３】請求項４に係る楽音合成装置は、サンプリ
ング周期と比較すると遅い時間間隔でフォルマントパラ
メータを送出するフォルマントパラメータ送出手段であ
って、音素間でフォルマントパラメータを補間処理して
送出する機能を備えたものと、前記フォルマントパラメ
ータ送出手段から送出されたフォルマントパラメータに
したがうフォルマントを有する有声音波形をサンプリン
グ周期で生成出力する有声音波形発生用の複数の音源チ
ャンネルと、キーオンで０から１に立ち上がり、キーオ
ン中は１を保持し、キーオフで所定のリリースレートで
立ち下がるエンベロープ波形をサンプリング周期ごとに
出力するエンベロープ生成手段と、前記有声音波形発生
用の音源チャンネルから出力される有声音波形のフォル
マントレベルを、前記エンベロープ生成手段から出力さ
れるエンベロープ波形および前記フォルマントパラメー
タ送出手段から送出されたフォルマントパラメータのう
ちのフォルマントレベルに基づいて制御するフォルマン
トレベル制御手段とと、前記フォルマントパラメータ送
出手段から送出されたフォルマントパラメータにしたが
うフォルマントを有する無声音波形をサンプリング周期
で生成出力する無声音波形発生用の複数の音源チャンネ
ルと、前記フォルマントレベル制御手段によりフォルマ
ントレベルが制御された有声音波形と前記無声音波形発
生用の音源チャンネルから出力された無声音波形とをミ
キシングして出力するミキシング手段と、発音する音素
を有声音同士あるいは無声音同士で切り替えるか、また
は有声音から無声音へと切り替えるかを検出する検出手
段と、(i)前記検出手段で有声音同士あるいは無声音同
士の切り替えが検出された場合は、先行音素の発音で用
いた音源チャンネルを引き続き用いるとともに、前記フ
ォルマントパラメータ送出手段が先行音素のフォルマン
トパラメータから後続音素のフォルマントパラメータへ
と補間処理して求めたフォルマントパラメータを前記時
間間隔ごとに送出するように制御し、(ii)前記検出手段
で有声音から無声音への切り替えが検出された場合は、
前記エンベロープ生成手段に先行音素のキーオフを発行
して、先行音素の発音で用いた音源チャンネルから出力
される有声音波形のフォルマントレベルを前記エンベロ
ープ生成手段からサンプリング周期ごとに出力されるエ
ンベロープ波形を用いて落とすとともに、先行音素の発
音に用いた音源チャンネルとは別の音源チャンネルを用
いて後続音素の発音を開始するように制御する手段とを
備えたことを特徴とする。

【００１４】請求項５に係る楽音合成装置は、サンプリ
ング周期と比較すると遅い第１の時間間隔でフォルマン
トパラメータを送出するフォルマントパラメータ送出手
段であって、音素間でフォルマントパラメータを補間処
理して送出する機能を備えたものと、前記第１の時間間
隔よりも速い第２の時間間隔でフォルマントパラメータ
のうちのフォルマントレベルのみを送出するフォルマン
トレベル送出手段と、前記フォルマントパラメータ送出
手段から前記第１の時間間隔で送出されたフォルマント
パラメータにしたがうフォルマントを有する有声音波形
および無声音波形をサンプリング周期で生成出力する有
声音波形発生用および無声音波形発生用の複数の音源チ
ャンネルであって、必要に応じて前記フォルマントレベ
ル送出手段から前記第２の時間間隔で送出されたフォル
マントレベルにしたがってフォルマントレベルが制御さ
れた波形を生成出力するものと、発音する音素の切り替
えが有声音同士あるいは無声音同士で行なわれるか、そ
れ以外かを検出する検出手段と、(i)前記検出手段で有
声音同士あるいは無声音同士の切り替えを検出した場合
は、先行音素の発音で用いていた音源チャンネルをその
まま用いて、前記フォルマントパラメータ送出手段が先
行音素のフォルマントパラメータから後続音素のフォル
マントパラメータへと補間処理して求めたフォルマント
パラメータを前記第１の時間間隔で送出するように制御
し、(ii)前記検出手段で有声音同士あるいは無声音同士
以外の切り替えを検出した場合は、前後の音素の関係に
よって短時間でフォルマントレベルを落としたい場合を
認識し、前記フォルマントレベル送出手段が急速かつ滑
らかに立ち下がるフォルマントレベルを前記第２の時間
間隔で送出するように制御し、これにより先行音素のフ
ォルマントレベルを落とし、別の音源チャンネルを用い
て後続音素の発音を開始するように制御する手段とを備
えたことを特徴とする。

【００１５】

【発明の実施の形態】以下、図面を用いてこの発明の実
施の形態を説明する。

【００１６】図１は、この発明に係る楽音合成装置を適
用した電子楽器のシステム構成を示す。この電子楽器
は、中央処理装置（ＣＰＵ）１０１、タイマ１０２、リ
ードオンリメモリ（ＲＯＭ）１０３、ランダムアクセス
メモリ（ＲＡＭ）１０４、データメモリ１０５、表示部
１０６、通信インタフェース（Ｉ／Ｆ）１０７、演奏操
作子１０８、設定操作子１０９、フォルマント合成音源
（ＦＯＲＭＡＮＴＴＧ）１１０、ディジタル／アナロ
グ変換器（ＤＡＣ）１１１、およびバスライン１１２を
備えている。各部１０１〜１１０は、双方向バスライン
１１２により相互に接続されている。

【００１７】ＣＰＵ１０１は、この電子楽器全体の動作
を制御する。特に、ＣＰＵ１０１は、外部装置との間で
ＭＩＤＩ方式メッセージを送受信する機能を有する。タ
イマ１０２は、ＣＰＵ１０１から指定された時間間隔ご
とにタイマ割り込み信号を発生するタイマである。ＲＯ
Ｍ１０３は、ＣＰＵ１０１が実行する制御プログラム
（その詳細は図５〜図８で後述）や各種定数データなど
を格納する。ＲＡＭ１０４は、ＲＯＭ１０３から読み出
した制御プログラムを格納してＣＰＵ１０１により実行
するためのプログラムロードエリア、ＣＰＵ１０１のワ
ーキングエリア、ＭＩＤＩバッファエリアなどに用いら
れる。

【００１８】データメモリ１０５は、演奏情報や歌詞情
報を含むソングデータを格納する記憶装置であり、半導
体メモリ、フロッピーディスク装置（ＦＤＤ）、ハード
ディスク装置（ＨＤＤ）、光磁気（ＭＯ）ディスク装
置、およびＩＣメモリカード装置などを使用する。表示
部１０６は、この電子楽器のパネル上に設けられた表示
装置およびその駆動回路などであり各種の情報を表示す
るために使用する。通信Ｉ／Ｆ１０７は、電話回線など
の公衆回線やイーサネット（Ｅｔｈｅｒｎｅｔ）などの
ローカルエリアネットワーク（ＬＡＮ）に接続するため
のインターフェースである。

【００１９】演奏操作子１０８は、ユーザが演奏操作す
るための複数の鍵を備えた鍵盤であるが、他の操作子を
用いてもよい。設定操作子１０９は、この電子楽器のパ
ネル上に設けられた各種スイッチなどの操作子である。
フォルマント合成音源１１０は、ＣＰＵ１０１からの指
示（フォルマントパラメータなど）に応じて、指定され
たフォルマントの音声を指定された音高で生成出力す
る。フォルマント合成音源１１０については図２で詳し
く説明する。フォルマント合成音源１１０から出力され
た音声信号はＤＡＣ１１１でアナログ信号に変換され、
不図示のサウンドシステムにより放音される。

【００２０】この電子楽器では、データメモリ１０５か
らＲＡＭ１０３にロードしたソングデータや、ＭＩＤＩ
で受信した歌詞データおよび演奏データにしたがって歌
唱発音を行なうことができる。また、演奏操作子１０８
や設定操作子１０９でＲＡＭ１０４上またはデータメモ
リ１０５上に歌詞データや演奏データを作成し、それら
に応じて歌唱発音を行なうことができる。また、歌詞デ
ータはあらかじめ設定操作子１０９で入力したりＭＩＤ
Ｉで受信したり、あるいはデータメモリ１０５から読み
出すことによりＲＡＭ１０４上に用意しておき、この歌
詞データを、演奏操作子１０８で入力した演奏データで
指定される音高で発音するようにして歌唱発音させるこ
ともできる。歌詞データや演奏データは、通信Ｉ／Ｆ１
０７を介して受信したものを用いるようにしてもよい。

【００２１】このように歌詞データと演奏データはどの
ような方式で用意してもよいが、以下では、説明を簡略
化するため、ＭＩＤＩ方式により歌詞データと演奏デー
タ（例えば、従来の技術の欄で説明した「ｓａｉｔａ」
をＣ３，Ｅ３，Ｇ３で発音する場合の入力データ（１）
のようなソングデータ）を受信し、これにしたがってＣ
ＰＵ１０１からフォルマント合成音源１１０に指示（フ
ォルマントパラメータの送出など）を出して歌唱発音す
る場合を例として説明する。

【００２２】図２（ａ）は、フォルマント合成音源１１
０の構成を示す。フォルマント合成音源１１０は、ＶＴ
Ｇグループ２０１、ＵＴＧグループ２０２、およびミキ
サ２０３を備えている。ＶＴＧグループ２０１は、ピッ
チを持つ母音フォルマント成分を生成する複数（ｎ個）
の有声音生成用の音源ユニットＶＴＧ１，ＶＴＧ２，
…，ＶＴＧｎからなる。ＵＴＧグループ２０２は、母音
に含まれるノイズ的成分や子音フォルマント成分を生成
する複数（ｎ個）の無声音生成用の音源ユニットＵＴＧ
１，ＵＴＧ２，…，ＵＴＧｎからなる。音声を合成する
際には、有声音と無声音のそれぞれに対しフォルマント
数分の音源ユニットＶＴＧ，ＵＴＧを組み合わせて各成
分を生成する（例えば、特開平３−２００３００号参
照）。音源ユニットＶＴＧ１〜ｎのそれぞれの有声音出
力（ＶＯＩＣＥＤＯＵＴ１〜ｎ）と音源ユニットＵＴ
Ｇ１〜ｎのそれぞれの無声音出力（ＵＮＶＯＩＣＥＤ
ＯＵＴ１〜ｎ）は、ミキサ２０３でミキシングされ、出
力される。これにより、指定したフォルマントを有する
楽音信号が生成出力される。

【００２３】図２（ｂ）は、有声音波形生成用の１つの
音源ユニットＶＴＧｊ（ｊは１〜ｎの整数）２１１の概
略構成を示す。音源ユニットＶＴＧ１〜ｎはすべて同じ
構成である。音源ユニットＶＴＧｊ２１１は、有声音波
形発生部２１２、乗算器２１３、およびエンベロープジ
ェネレータ（ＥＧ）２１４を備えている。ＥＧ２１４
は、ハードウエアＥＧを用いている。

【００２４】ＣＰＵ１０１から送出されるキーオン信号
ＫＯＮｊおよびキーオフ信号ＫＯＦＦｊ（ＶＴＧｊに対
するキーオンおよびキーオフをＫＯＮｊおよびＫＯＦＦ
ｊで表わす）は、有声音波形発生部２１２およびＥＧ２
１４に入力する。ＣＰＵ１０１から５ｍｓｅｃごとに送
出されるフォルマントパラメータ（ＶＯＩＣＥＤＦＯ
ＲＭＡＮＴＤＡＴＡｊ）は、有声音波形発生部２１２
に入力する。このフォルマントパラメータは、有声音発
生用のパラメータであり、発生すべき有声音のフォルマ
ント中心周波数、フォルマント形状、およびフォルマン
トレベルなどを規定するパラメータである。フォルマン
トパラメータのうちフォルマントレベルは、乗算器２１
３に入力する。このフォルマントレベルのほか、乗算器
２１３には、有声音波形発生部２１２から出力される波
形データ、およびＥＧ２１４から出力されるエンベロー
プ波形が入力する。

【００２５】この音源ユニットＶＴＧｊ２１１の動作を
説明する。この音源ユニットの全体は、所定のサンプリ
ング周波数（例えば４４ＫＨｚ）のサンプリングクロッ
クに基づいて動作している。ＣＰＵ１０１からのキーオ
ン信号ＫＯＮｊを受けると、有声音波形発生部２１２
は、ＣＰＵ１０１から５ｍｓｅｃごとに送出されるフォ
ルマントパラメータ（ＶＯＩＣＥＤＦＯＲＭＡＮＴ
ＤＡＴＡｊ）にしたがって、サンプリング周期ごとに有
声音波形データを発生する。有声音波形発生部２１２
は、フォルマントパラメータで与えられるフォルマント
中心周波数およびフォルマント形状のフォルマントを有
する有声音の波形を発生する。また、ＥＧ２１４は、キ
ーオン信号ＫＯＮｊを受けると、図３に示す形状のエン
ベロープ波形データをサンプリング周期ごとに発生す
る。図３から分かるように、このエンベロープ波形は、
キーオンで「０」から「１」に立ち上がり、キーオン中
（すなわち、基本的には歌唱発音中）は「１」を保持
し、キーオフで所定のリリースレートで立下がり、
「０」に至るものである。乗算器２１３は、有声音波形
発生部２１２から出力される波形データに、フォルマン
トパラメータのフォルマントレベルとＥＧ２１４からの
エンベロープ波形とを乗算し、その乗算結果を、有声音
波形データ（ＶＯＩＣＥＤＯＵＴｊ）としてサンプリ
ング周期ごとに出力する。

【００２６】図３に示すように、キーオン中（歌唱発音
中）はＥＧ２１４から「１」が出力されるので、実質的
には、（波形発生部２１２からの波形データ）×（フォ
ルマントパラメータのフォルマントレベル）の値が有声
音波形データ（ＶＯＩＣＥＤＯＵＴｊ）として出力され
ることになる。これは、ＣＰＵ１０１から与えられたフ
ォルマントパラメータ（のうちのフォルマントレベルの
値）に基いて、キーオン中のフォルマントレベルの制御
を行なっているということである。ＣＰＵ１０１からは
５ｍｓｅｃごとにフォルマントレベルが出力されるので
５ｍｓｅｃごとにレベル制御されることになる。サンプ
リング周期に比較すると５ｍｓｅｃはかなり長い時間間
隔であるが、通常、音声の特徴を出すには５ｍｓｅｃ程
度の間隔でフォルマントパラメータを与えれば十分であ
る。

【００２７】一方、ＣＰＵ１０１からのキーオフ信号Ｋ
ＯＦＦｊを受けると、ＥＧ２１４は、図３に示すように
所定のリリースレートで立下がるエンベロープ波形をサ
ンプリング周期ごとに順次出力する。また、キーオフ以
後、ＣＰＵ１０１は、キーオフ以後の発音を行なうため
のフォルマントパラメータを５ｍｓｅｃごとに順次出力
するが、そのうちフォルマントレベルはキーオフ時点の
フォルマントレベルを保持した固定値を出力する。フォ
ルマントパラメータとして与えられるフォルマントレベ
ルが固定値であるので、（波形発生部２１２からの波形
データ）×（キーオフ時点のフォルマントレベル固定
値）×（ＥＧ２１４からのエンベロープ波形）の値が有
声音波形データ（ＶＯＩＣＥＤＯＵＴｊ）として出力
されることになる。これは、ＥＧ２１４から出力された
エンベロープ波形に基づいて、キーオフ後のフォルマン
トレベルの制御を行なっているということである。ＥＧ
２１４からは、サンプリング周期ごとにエンベロープ波
形（図３のキーオフ以後の立ち下がり部分）が出力され
るので、サンプリング周期ごとの短い時間間隔（フォル
マントパラメータの出力間隔に比較すると速いレート）
でレベル制御されることになる。

【００２８】図２（ｃ）は、無声音波形発生用の１つの
音源ユニットＵＴＧｋ（ｋは１〜ｎの整数）２２１の概
略構成を示す。音源ユニットＵＴＧ１〜ｎはすべて同じ
構成である。音源ユニットＵＴＧｋ２２１は、無声音波
形発生部２２２、乗算器２２３、およびＥＧ２２４を備
えている。無声音波形発生部２２２は、ＣＰＵ１０１か
ら与えられる無声音発生用のフォルマントパラメータ
（ＵＮＶＯＩＣＥＤＦＯＲＭＡＮＴＤＡＴＡｋ）に
したがって無声音波形データを生成出力する。ＥＧ２２
４は、ＥＧ２１４と同様のものであり、図３に示したエ
ンベロープ波形を発生する。

【００２９】上記で図２（ｂ）および図３を参照して有
声音波形発生用の音源ユニットＶＴＧｊについて説明し
たが、無声音波形発生用の音源ユニットＵＴＧｋについ
ても同様の説明があてはまる。特に上記の有声音波形発
生用の音源ユニットＶＴＧｊの説明中、「有声音」を
「無声音」に、「ＶＴＧｊ」を「ＵＴＧｋ」に、「ＶＴ
Ｇ」を「ＵＴＧ」に、「有声音波形発生部２１２」を
「無声音波形発生部２２２」に、「乗算器２１３」を
「乗算器２２３」に、「ＥＧ２１４」を「ＥＧ２２４」
に、「ＫＯＮｊ」を「ＫＯＮｋ」に、「ＫＯＦＦｊ」を
「ＫＯＦＦｋ」に、「フォルマントパラメータ（ＶＯＩ
ＣＥＤＦＯＲＭＡＮＴＤＡＴＡｊ）」を「フォルマ
ントパラメータ（ＵＮＶＯＩＣＥＤＦＯＲＭＡＮＴ
ＤＡＴＡｋ）」に、「ＶＯＩＣＥＤＯＵＴｊ」を「Ｕ
ＮＶＯＩＣＥＤＯＵＴｋ」に、それぞれ読み替えれば
よい。特に、キーオン（ＫＯＮｋ）を受けるとＣＰＵ１
０１から５ｍｓｅｃごとに与えられるフォルマントパラ
メータのフォルマントレベルでレベル制御されて無声音
波形データ（ＵＮＶＯＩＣＥＤＯＵＴｋ）が出力さ
れ、またキーオフ（ＫＯＦＦｋ）を受けるとサンプリン
グ周期ごとにＥＧ２２４から出力されるエンベロープ波
形によってレベル制御される点も同じである。

【００３０】なお、歌唱発音を行なう際には、有声音の
場合は有声音波形発生用の音源ユニットＶＴＧｊを幾つ
か（基本的には４フォルマントで発音するので４つの音
源ユニットになる）用い、無声音の場合は無声音波形発
生用の音源ユニットＵＴＧｋを幾つか（基本的には４フ
ォルマントで発音するので４つの音源ユニットになる）
用いることになるが、これらの個々の音源ユニットをフ
ォルマント発音チャンネル（あるいは単にチャンネル）
と呼ぶこととする。有声音波形発生用の音源ユニットＶ
ＴＧｊの具体的な構成は、例えば特開平２−２５４４９
７号に開示されたものがある。無声音波形発生用の音源
ユニットＵＴＧｋの具体的な構成は、例えば特開平４−
３４６５０２号に開示されたものがある。システムとし
ては、特開平４−２５１２９７号に開示されたものがあ
る。

【００３１】図４に、ＲＯＭ１０３またはＲＡＭ１０４
上の各種データおよび各種データ領域を示す。まず図４
（ａ）は、ＲＡＭ１０４の全体のメモリマップである。
図４（ａ）において、３０１はＲＯＭ１０３に格納され
ている制御プログラムをロードするためのプログラムロ
ードエリアである。３０２は、ＣＰＵ１０１がこのプロ
グラムロードエリア３０１にロードしたプログラム（図
５〜図８で詳述する）を実行する際に使用するワーキン
グエリアであり、各種フラグ類などもこのワーキングエ
リア３０２に確保する。３０３は、ＣＰＵ１０１が受信
したＭＩＤＩメッセージを一時記憶するためのＭＩＤＩ
バッファである。ＭＩＤＩバッファ３０３は、従来技術
の欄で説明したシーケンス（１）のようなソングデータ
を受信したとき、ノートオンの前に先行して送られてく
る歌詞データを一時記憶するバッファとして使用する
（図１３の歌詞情報バッファ１３０５と同じ）。

【００３２】図４（ｂ）は、ＲＯＭ１０３上に用意され
ている音素データベース３１０を示す。音素データベー
ス３１０は、音素ごとのフォルマントパラメータデータ
３１１を集めたものである。ＰＨＰＡＲ［＊］で音素
「＊」のフォルマントパラメータを示す。音素データベ
ース３１０はＲＯＭ１０３上に固定記憶しておいてもよ
いし、ＲＯＭ１０３からＲＡＭ１０４に読み出して用い
たり、あるいは別途各種記憶媒体に用意されている音素
データベースをＲＡＭ１０４上に読み出して用いるよう
にしてもよい。これらのフォルマントパラメータは、発
音声質（個人差、男声、女声など）を決めるデータであ
るので、声質ごとに各種用意した音素データベースを選
択して用いるようにしてもよい。

【００３３】図４（ｃ）は、図４（ｂ）の音素データベ
ース３１０のうちの１つの音素のフォルマントパラメー
タＰＨＰＡＲ［＊］の内容を示す。ＶＯＩＣＥＤ／ＵＮ
ＶＯＩＣＥＤ３２１は、当該音素「＊」が有声音か無声
音かを示す情報である。３２２，３２３，３２４，３２
５は、それぞれ、当該音素に関する有声音成分のフォル
マント中心周波数（ＶＦＦＲＥＱ１〜４）、無声音成
分のフォルマント周波数（ＵＦＦＲＥＱ１〜４）、有
声音成分のフォルマントレベル（ＶＦＬＥＶＥＬ１〜
４）、無声音成分のフォルマントレベル（ＵＦＬＥＶ
ＥＬ１〜４）を示す情報である。当該音素が無声音の場
合は、有声音成分フォルマントレベル（ＶＦＬＥＶＥ
Ｌ１〜４）３２４はすべて０に設定しておく（あるいは
処理上で無視することとしてもよい）。ＦＭＩＳＣ３２
６は、その他のフォルマント関連データである。

【００３４】ここではフォルマント数が４の場合を示し
たが、フォルマント数はシステムの仕様に応じて適宜決
定すればよい。フォルマント数が４であるから、３２２
〜３２５の各パラメータデータは４つのフォルマントに
対応して４系列に分かれている。例えば、有声音成分フ
ォルマント周波数３２２は、第１フォルマントの中心周
波数データＶＦＦＲＥＱ１、第２フォルマントの中心
周波数データＶＦＦＲＥＱ２、第３フォルマントの中
心周波数データＶＦＦＲＥＱ３、第４フォルマントの
中心周波数データＶＦＦＲＥＱ４の４つの系列に分か
れている。他のパラメータ３２３〜３２５も同様であ
る。

【００３５】また、各フォルマント周波数およびフォル
マントレベルのデータは、各々、５ｍｓｅｃごとにパラ
メータ出力ができるように時系列データになっており、
発音時間に応じた値が記憶されているものとする。例え
ば、第１フォルマントの有声音成分中心周波数データＶ
ＦＦＲＥＱ１は、５ｍｓｅｃごとのデータの集まりで
ある。ただし、この時系列データはループ部分を含み、
発音時間が長くなった場合にはループ部分のデータが繰
り返し用いられるようになっている。

【００３６】図４（ｄ）は、フォルマント中心周波数と
フォルマントレベルに関して、先行音韻から後続音韻へ
とフォルマントパラメータを補間する様子を示す。有声
音から有声音に移行する場合、無声音から無声音に移行
する場合、および無声音から有声音に移行する場合は、
図４（ｄ）に示すように先行音韻のフォルマント中心周
波数とフォルマントレベルの値から後続音韻のフォルマ
ント中心周波数とフォルマントレベルの値へと補間処理
を行なって、５ｍｓｅｃごとのパラメータ値を生成し
て、ＣＰＵ１０１からフォルマント合成音源１１０に送
るようにする。これにより、滑らかな音韻の移行が実現
できる。補間はどのような方法で行なってもよいが、こ
こでは不図示の調音結合データベースを参照して補間を
行なうようにしている。

【００３７】一方、有声音から無声音に移行する場合
は、本実施の形態の特徴とするところであり、上記図４
（ｄ）の補間処理によらない方法で音韻を移行させる。
有声音は有声音生成用の音源ユニットで生成し無声音は
無声音生成用の音源ユニットで生成するため、有声音か
ら無声音に移行する場合は、有声音生成用の音源ユニッ
トにおいて先行音韻の有声音成分を急速にダンプさせ、
無声音生成用の音源ユニットにおいて後続音韻の無声音
成分を立上げる必要がある。この場合、フォルマント合
成音源では有声音生成用音源ユニットと無声音生成用音
源ユニットとは別ユニットであるので、有声音から無声
音に連続変化させることができない。特に、有声音を急
速にダンプさせる際、５ｍｓｅｃごとにフォルマント合
成音源にフォルマントレベルを与えるのではフォルマン
トレベルの更新レートが遅すぎてしまうため、波形瞬断
のノイズが発生してしまう。一方、ノイズが発生しない
ように滑らかにフォルマントレベルが立下がるようにす
ると、時間がかかりすぎて急速なダンプが実現できな
い。

【００３８】そこで、この実施の形態では有声音から無
声音に移行する場合、先行音韻の有声音成分のレベルの
立下がりをフォルマント合成音源内のＥＧ（サンプリン
グ周波数に基づいて動作しておりエンベロープ波形はサ
ンプリング周期ごと、すなわちフォルマントパラメータ
の更新レートより速い時間間隔で出力される）で実現す
る。これにより、滑らかにかつ急速に有声音のダンプを
行なうことができ、不連続ノイズの発生も回避できる。
なお、無声音から有声音に移行する場合は、５ｍｓｅｃ
程度の時間間隔でフォルマント合成音源にフォルマント
パラメータを与えても不連続ノイズ音は聴感上目立たな
い。したがって、この実施の形態では、無声音から有声
音に移行する場合も、図４（ｄ）のような補間で生成し
たパラメータを５ｍｓｅｃごとに音源に送ることで実現
している。

【００３９】図５は、この電子楽器の電源がオンされた
ときにＣＰＵ１０１が実行するメインプログラムの手順
を示す。まずステップ５０１で各種の初期設定を行な
う。特に、後述するノートオンフラグＮＯＴＥＯＮＦＬ
ＧおよびダンプフラグＤＵＭＰＦＬＧは「０」に初期設
定する。次にステップ５０２でタスク管理を行なう。こ
れは、システムの状況などに応じてタスクを切り替えて
実行させる処理である。特に、ノートオンイベントやノ
ートオフイベントが発生したときは、ステップ５０３の
発音処理を行なう。その他システムの状況に応じて各種
のタスク５０４，５０５を実行する。これらのタスクの
実行後は、再びタスク管理５０２に戻る。

【００４０】図７は、ノートオンイベントやノートオフ
イベントが発生したときに実行するステップ５０３の発
音処理ルーチンの手順を示す。図６は、図７のステップ
７０１から分岐する場合の処理である。図７および図６
を参照して発音処理ルーチンの手順を説明する。

【００４１】まずステップ７０１で、音素ノートオンイ
ベントがあるか否か判別する。この音素ノートオンイベ
ントは、具体的には、従来技術の欄で説明したシーケン
ス（１）のように、先行して送られてきた歌詞データが
ＭＩＤＩバッファ３０３（図４（ａ））に格納された後
に発生するノートオンである。なお、ノートオンの単位
は音素１つに限る訳ではなく、「ｓａ」や「ｔａ」など
の日本語の５０音を単位としてもノートオンが発生する
ものとする。ステップ７０１で音素ノートオンイベント
があった場合は、ステップ７０２で当該音素ノートオン
イベントから発生すべき音素およびピッチを決定する。
これはＭＩＤＩバッファ３０３中に格納されている歌詞
データから発生すべき音素を特定し、ノートオンに含ま
れるピッチデータからピッチを決定する処理である。次
にステップ７０３で、音素データベース３１０（図４
（ｂ））を参照し、発生すべき音素のフォルマントパラ
メータを取得する。

【００４２】次にステップ７０４で、今回のノートオン
の前の音素が有声音か否か判別する。有声音であるとき
は、ステップ７０５で今回のノートオンの音素が無声音
か否か判別する。無声音であるときはステップ７０７
に、そうでないときはステップ７０６に進む。ステップ
７０４で今回のノートオンの前の音素が有声音でないと
きは、ステップ７０６に進む。すなわち、ステップ７０
４，７０５により、ノートオン前の音素が有声音で今回
の音素が無声音のときのみステップ７０７に分岐し、そ
れ以外の組み合せのときはステップ７０６に分岐する。
なお、今回のノートオン前に発生している音素が無いと
きは、ステップ７０４から７０６に進むものとする。

【００４３】ステップ７０６では、今回のノートオン前
に発生していた音素で使用していたフォルマント発音チ
ャンネルと同一チャンネルをＴＧＣＨとする（すなわ
ち、ＴＧＣＨの変更無しということ）。ＴＧＣＨは現在
発音に使用している発音チャンネル（具体的には、図２
（ａ）のＶＴＧグループ２０１のうち発音に使用してい
る幾つかの音源ユニットＶＴＧ２１１、およびＵＴＧグ
ループ２０２のうち発音に使用している幾つかの音源ニ
ットＵＴＧ２２１）を特定する情報を格納するレジスタ
である。なお、今回のノートオンの前に発音中の音素が
無かったときは新たにチャンネルを割り当ててＴＧＣＨ
とする。ステップ７０６の後、ステップ７０９に進む。

【００４４】今回のノートオンの前に発音中の音素が有
声音で今回の音素が無声音であるときは、ステップ７０
７で、現在発音中のフォルマント発音チャンネルＴＧＣ
Ｈに対しキーオフ（ＫＯＦＦ）を送出する。これによ
り、今発音中の有声音の発音に使用している音源ユニッ
トで、図２（ｂ）で説明したように、ＥＧ２１４でエン
ベロープ波形を立下げる処理が行なわれ、発音中の有声
音のダンプが開始する。さらにステップ７０７では、レ
ジスタＤＵＭＰＣＨにＴＧＣＨの値を一時記憶し、ダン
プフラグＤＵＭＰＦＬＧに「１」をセットする。レジス
タＤＵＭＰＣＨはＥＧによるダンプ処理が開始したチャ
ンネルを格納するレジスタである。ダンプフラグＤＵＭ
ＰＦＬＧは、「１」のときダンプ中のチャンネルがある
ことを示し、「０」のときダンプ中のチャンネルがない
ことを示す。ステップ７０７の後、ステップ７０８で、
現在使用中の音源チャンネル（ダンプしつつあるチャン
ネル）と異なるチャンネルを新たに割り当ててＴＧＣＨ
とする。ステップ７０８の後ステップ７０９に進む。

【００４５】ステップ７０９では、ステップ７０３で参
照したデータから具体的にフォルマントパラメータやピ
ッチデータを算出する前処理を行なっておく。次にステ
ップ７１０で、フォルマント合成音源１１０に今回の音
素のフォルマントパラメータを転送する処理を開始す
る。これにより、タイマ１０２が起動し、５ｍｓｅｃご
とにＣＰＵ１０１にタイマ割り込みがかかるようにな
る。このタイマ割り込みごとに実行されるタイマ割込処
理（図８で後述）により、実際にフォルマントパラメー
タがフォルマント音源の各チャンネルに転送される。ス
テップ７１０により、各発音チャンネルはＴＧＣＨにし
たがってそれぞれキーオンし、当該音素の発音が開始さ
れる。さらにステップ７１０では、ノートオンフラグＮ
ＯＴＥＯＮＦＬＧに１をセットして、リターンする。ノ
ートオンフラグＮＯＴＥＯＮＦＬＧは現在ノートオン中
であることを示すフラグ（「１」でノートオン中、
「０」でそうでないことを示す）である。

【００４６】ステップ７０１で音素ノートオンイベント
でないときは、図６のステップ６０１に進む。ステップ
６０１では音素ノートオフイベントであるか否か判別す
る。音素ノートオフイベントであるときは、ステップ６
０２で現在発音中の音素のリリース処理を開始させる。
これは、現在発音中のＴＧＣＨのチャンネルに対し、キ
ーオフ（ＫＯＦＦ）を送出して、図２で説明したような
ＥＧによるリリースを開始するということである。この
リリースのレートは、キーオフの送出に付随して任意に
指定できる。次にステップ６０３で、ノートオンフラグ
ＮＯＴＥＯＮＦＬＧを０にリセットしてリターンする。
ステップ６０１で音素ノートオフイベントでないときは
そのままリターンする。

【００４７】図８は、５ｍｓｅｃごとに実行されるタイ
マ割込処理１の手順を示す。まずステップ８０１で、ノ
ートオンフラグＮＯＴＥＯＮＦＬＧが「１」であるか否
か判別する。「１」でないときは、現在発音中でないと
いうことだから、そのままリターンする。

【００４８】ノートオンフラグＮＯＴＥＯＮＦＬＧが
「１」であるときは、ステップ８０２で、現在発音中の
音素に関する現時点のフォルマントパラメータを算出し
て各フォルマント音源チャンネル（ＴＧＣＨで示される
チャンネル）に転送する。これにより、５ｍｓｅｃごと
のフォルマントパラメータの変更が実現される。なお、
日本語の５０音の子音＋母音の形で発音が指示されてい
た場合、子音から母音への移行は調音結合データベース
を用いた補間処理（図４（ｄ））によって行なうが、こ
の補間処理でフォルマントパラメータを算出して各チャ
ンネルに転送する処理はステップ８０２の中で行なうよ
うにしている。同様に、有声音から有声音に移行する場
合、無声音から無声音に移行する場合、および無声音か
ら有声音に移行する場合は、図７のステップ７０６で先
行音韻と後続音韻の発音に同じチャンネルＴＧＣＨが割
り当てられるが、このチャンネルＴＧＣＨにおけるフォ
ルマントパラメータの補間処理（図４（ｄ））およびそ
の補間で算出したフォルマントパラメータのＴＧＣＨへ
の送出は、ステップ８０２の中で行なうようにしてい
る。なお、音素をチャンネルを変えて連続発音する場合
は、先行音素および後続音素のチャンネルにおいて、先
行音素の第ｎフォルマントに関するフォルマントパラメ
ータから後続音素の第ｎフォルマントに関するフォルマ
ントパラメータへと移行させながら発音するため図４
（ｄ）で説明した補間処理が必要であるが、この補間処
理は、ステップ８０２でなく図７のステップ７０９で行
なってもよい。この場合、ステップ８０２では、ステッ
プ７０９で算出されているパラメータを送出する処理を
行なうだけでよい。

【００４９】次にステップ８０３で、ダンプフラグＤＵ
ＭＰＦＬＧが「１」か否か判別する。「１」であるとき
は、現在発音中の音素がダンプ中であるということだか
ら、ステップ８０４で、そのダンプ中の音素が充分減衰
したか否か判別する。これはダンプ中のチャンネルのＥ
Ｇレベルや出力レベルを参照して判別してもよいし、ダ
ンプ開始からの時間が充分に経過したか否かによって判
別してもよい。ステップ８０３でダンプフラグＤＵＭＰ
ＦＬＧが「１」でないときは、現在ダンプ中のチャンネ
ルは無いということだから、そのままリターンする。ス
テップ８０４で現在ダンプ中の音素のレベルが未だ十分
に減衰していないときは、減衰するまで待つためそのま
まリターンする。ステップ８０４で現在ダンプ中の音素
のレベルが十分に減衰していたら、ステップ８０５で、
現在ダンプ中のチャンネルＤＵＭＰＣＨの出力レベルを
「０」にするようにフォルマントパラメータを転送す
る。これは、ダンプ中のチャンネルについては、ステッ
プ８０２で各フォルマント音源のチャンネルに転送する
フォルマントパラメータのうちのフォルマントレベルは
ダンプ開始時点の値を固定して転送していたため、ステ
ップ８０５でこのフォルマントレベルの値を「０」にリ
セットするものである。次にステップ８０６で、ダンプ
フラグＤＵＭＰＦＬＧを「０」にリセットしてリターン
する。

【００５０】次に、上述の図５〜図８の処理がどのよう
に実行されるかの概要を、具体的な例を挙げて説明す
る。この電子楽器では各種操作子の操作やＭＩＤＩメッ
セージの受信などによりノートオンやノートオフが発生
するが、ここでは説明の簡略化のため、従来技術の説明
で挙げた以下のシーケンス（１）でイベントが発生した
とする。

【００５１】・ｓ＜２０＞ａ＜０＞・Ｃ３のノートオン・Ｃ３のノートオフ・ｉ＜０＞・Ｅ３のノートオン ………（１）・Ｅ３のノートオフ・ｔ＜０２＞ａ＜００＞・Ｇ３のノートオン・Ｇ３のノートオフ

【００５２】図５のメインルーチンでは、ステップ５０
２のタスク管理で歌詞データ「ｓ＜２０＞ａ＜０＞」の
受信を検出すると、ステップ５０４の各種タスクのうち
の１つを起動し、受信した歌詞データをＭＩＤＩバッフ
ァ３０３（図４（ａ））に記憶して、ステップ５０２に
戻る。次に、ステップ５０２で「Ｃ３のノートオン」を
検出すると、ステップ５０３の発音処理が実行される。
図７の発音処理では、「ｓ＜２０＞ａ＜０＞」を発音す
るためにステップ７０６でチャンネルを割り当ててＴＧ
ＣＨに格納する。そして、ステップ７１０でパラメータ
転送の開始を指示する。これ以降は、５ｍｓｅｃごとに
図８のタイマ割り込み処理が実行され、ステップ８０２
で、Ｃ３で「ｓ＜２０＞ａ＜０＞」を発音するためのフ
ォルマントパラメータが算出されてチャンネルＴＧＣＨ
に転送され、「ｓａ」がＣ３で発音される。次の「Ｃ３
のノートオフ」は、「ａ＜０＞」が指定されているた
め、ステップ５０２のタスク管理では無視する。

【００５３】次にステップ５０２のタスク管理で歌詞デ
ータ「ｉ＜０＞」の受信を検出すると、ＭＩＤＩバッフ
ァ３０３（図４（ａ））に記憶して、ステップ５０２に
戻る。次に、ステップ５０２で「Ｅ３のノートオン」を
検出すると、ステップ５０３の発音処理が実行される。
図７の発音処理では、前に発音している音素が「ａ」で
あり今回発音する音素が「ｉ」であるので、ステップ７
０５から７０６に進み、「ｓ＜２０＞ａ＜０＞」を発音
するために割り当てたチャンネルＴＧＣＨをそのまま
「ｉ＜０＞」の発音にも用いることとする。そして、ス
テップ７１０でパラメータ転送の開始を指示する。これ
以降は、５ｍｓｅｃごとに図８のタイマ割り込み処理が
実行され、ステップ８０２で、「ｓ＜２０＞ａ＜０＞」
から「ｉ＜０＞」に移行するように補間処理を行ないつ
つ（有声音から有声音に移行する場合である）、算出し
たフォルマントパラメータをチャンネルＴＧＣＨに転送
する。これにより、「ｓ＜２０＞ａ＜０＞」から「ｉ＜
０＞」への連続した移行が実現される。十分に時間が経
過すると、ステップ８０２で送出されるフォルマントパ
ラメータは完全に「ｉ＜０＞」のパラメータに移行し、
「ｉ＜０＞」の発音が持続する。次の「Ｅ３のノートオ
フ」は、「ｉ＜０＞」が指定されているため、ステップ
５０２のタスク管理では無視する。

【００５４】次にステップ５０２のタスク管理で歌詞デ
ータ「ｔ＜０２＞ａ＜００＞」の受信を検出すると、Ｍ
ＩＤＩバッファ３０３（図４（ａ））に記憶して、ステ
ップ５０２に戻る。次に、ステップ５０２で「Ｇ３のノ
ートオン」を検出すると、ステップ５０３の発音処理が
実行される。図７の発音処理では、前に発音している音
素が「ｉ」であり今回発音する音素が「ｔａ」であるの
で、ステップ７０５から７０７に進み、現在発音中のＴ
ＧＣＨにキーオフを送り、ステップ７０８で現在のＴＧ
ＣＨとは異なるチャンネルを「ｔ＜０２＞ａ＜００＞」
発音用に新たに割り当ててＴＧＣＨとする。そして、ス
テップ７１０でパラメータ転送の開始を指示する。これ
以降は、５ｍｓｅｃごとに図８のタイマ割り込み処理が
実行され、ステップ８０２で、先行音韻「ｉ」のフォル
マントパラメータを送出する処理は継続されるが、この
フォルマントパラメータのうちフォルマントレベルはキ
ーオフ時点の値を固定して送出する。また、先行音韻
「ｉ」のダンプが開始されているので、ステップ８０３
から８０４に進み、ダンプ中の音素「ｉ」のレベルが十
分に減衰したか否か判別する。この間、図２（ｂ）で説
明したように、ＥＧ２１４を用いたダンプが実行されて
いる。音素「ｉ」のレベルが十分に減衰すると、ステッ
プ８０５に進み、「ｉ」の発音に用いたチャンネルＤＵ
ＭＰＣＨに対するフォルマントパラメータであるフォル
マントレベルを「０」とし、ステップ８０６でダンプフ
ラグを「０」にリセットする。「ｉ」のダンプが行なわ
れている間も、ステップ８０２のパラメータ転送の処理
は継続して５ｍｓｅｃごとに実行されており、ダンプが
ある程度進んだら「ｔ＜０２＞ａ＜００＞」の発音のた
めのフォルマントパラメータをＴＧＣＨに送出する処理
が実行される。以上により、「ｉ」のＥＧによる滑らか
で急速なダンプと、引き続く「ｔａ」の発音が実現され
る。

【００５５】図１０は、上述の例で、「ｓａｉ」と発声
させるときの音源ユニットのフォルマントレベルの変化
を示す。１００１の時点で「ｓａ」のキーオンが発行さ
れると、「ｓａ」を発音するためのチャンネルＴＧＣＨ
が割り当てられる。図１０のＶＴＧおよびＵＴＧは、割
り当てられたＴＧＣＨのうち有声音発生用のチャンネル
および無声音発生用のチャンネルのフォルマントレベル
を例示したものである（有声音用と無声音用とでそれぞ
れ１つのチャンネルを例示）。「ｓａ」のキーオンによ
り、５ｍｓｅｃごとに、１０１１および１０１２に示す
ようなフォルマントレベルをＣＰＵ１０１からＴＧＣＨ
に送出して、「ｓａ」を発音させる。次に、「ｉ」のキ
ーオンが発行されると、「ａ」から「ｉ」への移行、す
なわち有声音から有声音への移行であるので、同じＴＧ
ＣＨで１０１３のように補間処理によってフォルマント
レベルも連続的に移行している。

【００５６】図１１は、上述したこの発明の実施の形態
でなく従来の方式により「ｉ」から「ｔａ」へと連続し
て発音する例を示す。１１０１の時点で「ｉ」のキーオ
ンが発行され、チャンネルＴＧＣＨに対し、１１１１の
ようにフォルマントレベルを送出して「ｉ」の発音を行
なう。次に、１１０２の時点で次の「ｔａ」のキーオン
が来たとする。従来の方式では、ＶＴＧの立下がり部分
１１１２は、右側の１１１３に示すように５ｍｓｅｃご
とにフォルマントレベル１１１４，１１１５のように急
激に値を立下げたり、１１１６に示すように少し多めの
サンプル１１１７〜１１１９を送出するようにしてい
た。いずれにしても、５ｍｓｅｃごとにフォルマントレ
ベルが送出されるので、有声音の立下げ部分１１１２に
より、不連続なノイズが発生したり急速な立下げが行な
われないという不都合があった。この立下げの後「ｔ
ａ」の無声音部分の出力が１１２０，１１２１のように
開始される。

【００５７】図１２は、上述の例で、「ｉ」から「ｔ
ａ」へ連続的に移行する場合のフォルマントレベルの変
化の様子を示す。１２０１の時点で「ｉ」のキーオンが
発行され、チャンネルＴＧＣＨに対し、１２１１のよう
にフォルマントレベルを送出して「ｉ」の発音を行な
う。次に、１２０２の時点で次の「ｔａ」のキーオンが
来たとする。このとき有声音のチャンネルＶＴＧのフォ
ルマントレベルの立下がりは、ＥＧ２１４によって制御
され、右側の１２２０に示すようにサンプリング周期ご
とに送出されるエンベロープ波形でフォルマントレベル
の立下げが実現される。この立下げの後「ｔａ」の無声
音部分の出力が１２１３，１２１４のように開始され
る。なお、フォルマント周波数については１２１４のよ
うに連続的に移行する。

【００５８】上述の発明の実施の形態によれば、ＣＰＵ
の処理能力が低くても、フォルマントレベルの立ち下げ
をＥＧにより実現しているので、有声音から無声音に移
行する場合でも、低レートのシステムのままノイズが発
生することなく滑らかに移行することができる。

【００５９】図９は、上述の発明の実施の形態の図５か
ら図８に示した手順の変形例である。この変形例では、
上述の発明の実施の形態の図８のタイマ割り込み処理を
図９（ａ）のタイマ割り込み処理１と図９（ｂ）のタイ
マ割り込み処理２に分けて実行する。その他は同じ手順
を用いるものとする。この変形例では、ＥＧを用いてダ
ンプを行なうのでなく、ＣＰＵ１０１から速いレートで
フォルマントレベルを音源に送出することによりダンプ
を行なう。したがって、この変形例では、図２で説明し
たＥＧによるダンプの機能は不要である。

【００６０】図９（ａ）のタイマ割り込み処理１は５ｍ
ｓｅｃごとに実行する処理である。ステップ９０１で
は、ノートオンフラグＮＯＴＥＯＮＦＬＧが「１」であ
るか否か判別する。「１」でないときは、現在発音中で
ないということだから、そのままリターンする。ノート
オンフラグＮＯＴＥＯＮＦＬＧが「１」であるときは、
ステップ９０２で、現在発音中の音素に関する現時点の
フォルマントパラメータを算出して各フォルマント音源
チャンネル（ＴＧＣＨで示されるチャンネル）に転送す
る。これは、ステップ８０２と同じ処理である。

【００６１】図９（ｂ）のタイマ割り込み処理２は、５
ｍｓｅｃに比較して十分に短い時間間隔ごとに実行され
る割り込み処理である。ステップ９１１で、ダンプフラ
グＤＵＭＰＦＬＧが「１」か否か判別する。「１」でな
いときは、そのままリターンする。ダンプフラグＤＵＭ
ＰＦＬＧが「１」であるときは、現在発音中の音素がダ
ンプ中であるということだから、ステップ９１２で、そ
のダンプ中の音素の消音が未完了か否か判別する。消音
が未完了であるときは、ステップ９１３で、現在ダンプ
中のチャンネルＤＵＭＰＣＨの各フォルマントレベルを
徐々に下げて各チャンネルＤＵＭＰＣＨに送出する。こ
れにより、上述の実施の形態でＥＧにより実現していた
フォルマントレベルの滑らかで急速な立ち下げを実現す
る。ステップ９１２で消音が完了していたら、ステップ
９１４でダンプフラグＤＵＭＰＦＬＧを「０」にリセッ
トしてリターンする。

【００６２】上述の変形例によれば、ＣＰＵの処理能力
が必要になるが、ＥＧの制御によらずにフォルマントレ
ベルの立ち下げを実現しているので、有声音から無声音
に移行する場合でも、ノイズが発生することなく滑らか
に移行することができる。

【００６３】なお、無声音から有声音に移行する場合は
不連続ノイズ音が聴感上目立たないので有声音同士ある
いは無声音同士と同じ取り扱いをしているが、無声音か
ら有声音に移行する場合も、有声音から無声音に移行す
る場合と同様に取り扱うようにしてもよい。

【００６４】なお、上記発明の実施の形態において、フ
ォルマント合成音源１１０は、全体または部分的にかか
わらず、ハードウェアまたはソフトウェアのどちらによ
って実現しても、また組み合わせて実現してもよい。

【００６５】

【発明の効果】以上説明したように、この発明によれ
ば、低レートで（すなわちサンプリング周期に比較して
遅い時間間隔で）フォルマントパラメータを更新して歌
唱発音する楽音合成装置において、有声音同士および無
声音同士の場合は同一チャンネルを使用してフォルマン
トの連続性を保持し、それ以外の場合は前後の音素関係
によって短時間でフォルマントレベルを落としたい場合
を認識してＥＧによってレベルを落としてチャンネルを
切り替えるようにしているので、短時間にレベルを落と
したい場合に発生するノイズを低減し、音素と音素の切
れ目をうまくつなげて滑らかに自然に聞こえるように歌
唱発音させることができる。特に、有声音から無声音に
移行する場合の効果が高い。また、ＥＧを用いる代わり
に、フォルマントレベルのみ高速レートで音源に与える
ようにすれば、ＥＧによるダンプ機能を用意することな
く、音素と音素の切れ目をうまくつなげて滑らかに自然
に聞こえるように歌唱発音させることができる。

【図面の簡単な説明】

【図１】この発明に係る楽音合成装置を適用した電子楽
器のシステム構成図

【図２】フォルマント合成音源の構成図

【図３】エンベロープ波形データを示す図

【図４】ＲＯＭまたはＲＡＭ上の各種データおよび各種
データ領域を示す図

【図５】ＣＰＵが実行するメインプログラムの手順を示
すフローチャート図

【図６】発音処理ルーチンの手順（一部）を示すフロー
チャート図

【図７】発音処理ルーチンの手順を示すフローチャート
図

【図８】タイマ割込処理１の手順を示すフローチャート
図

【図９】変形例のタイマ割込処理１，２の手順を示すフ
ローチャート図

【図１０】「ｓａｉ」と発声させるときの音源ユニット
のフォルマントレベルの変化を示す図

【図１１】従来の方式により「ｉ」から「ｔａ」へと連
続して発音する例を示す図

【図１２】「ｉ」から「ｔａ」へ連続的に移行する場合
のフォルマントレベルの変化の様子を示す図

【図１３】従来例を示す図

【符号の説明】

１０１…中央処理装置（ＣＰＵ）、１０２…タイマ、１
０３…リードオンリメモリ（ＲＯＭ）、１０４…ランダ
ムアクセスメモリ（ＲＡＭ）、１０５…データメモリ、
１０６…表示部、１０７…通信インタフェース（Ｉ／
Ｆ）、１０８…演奏操作子、１０９…設定操作子、１１
０…フォルマント合成音源（ＦＯＲＭＡＮＴＴＧ）、
１１１…ディジタル／アナログ変換器（ＤＡＣ）、１１
２…バスライン、２０１…ＶＴＧグループ、２０２…Ｕ
ＴＧグループ、２０３…ミキサ、ＶＴＧ１，ＶＴＧ２，
ＶＴＧｎ…有声音生成用の音源ユニット、ＵＴＧ１，Ｕ
ＴＧ２，ＵＴＧｎ…無声音生成用の音源ユニット、２１
２…有声音波形発生部、２１３…乗算器、２１４…エン
ベロープジェネレータ（ＥＧ）、２２２…無声音波形発
生部、２２３…乗算器、２２４…ＥＧ。

Claims

(57)【特許請求の範囲】

【請求項１】サンプリング周期と比較すると遅い時間間
隔で外部から与えられるフォルマントパラメータを入力
し、該フォルマントパラメータにしたがうフォルマント
を有する有声音波形および無声音波形をサンプリング周
期で生成出力する有声音波形発生用および無声音波形発
生用の複数の音源チャンネルを備えた楽音合成装置にお
いて、発音する音素の切り替えが有声音同士あるいは無声音同
士で行なわれる場合は、同一の音源チャンネルを用い
て、前記時間間隔で与えられたフォルマントパラメータ
にしたがって楽音を生成出力し、発音する音素の切り替えが有声音から無声音への切り替
えである場合は、前後の音素の関係によって短時間でフ
ォルマントレベルを落としたい場合を認識し、内部に備
えられているエンベロープ生成手段からサンプリング周
期ごとに出力されるエンベロープ波形を用いて先行音素
のフォルマントレベルを落とし、音源チャンネルを切り
替えて後続音素を発音することを特徴とする楽音合成装
置。
【請求項２】サンプリング周期と比較すると遅い時間間
隔で外部から与えられるフォルマントパラメータを入力
し、該フォルマントパラメータにしたがうフォルマント
を有する有声音波形および無声音波形をサンプリング周
期で生成出力する有声音波形発生用および無声音波形発
生用の複数の音源チャンネルを備えた楽音合成装置にお
いて、発音する音素の切り替えが有声音同士あるいは無声音同
士で行なわれるか、有声音から無声音への切り替えかを
検出する検出手段と、前記音源チャンネルで発生した波形のフォルマントレベ
ルを落とすために用いるエンベロープ波形をサンプリン
グ周期ごとに発生するエンベロープ生成手段と、前記検出手段で有声音同士あるいは無声音同士の切り替
えを検出した場合は、先行音素の発音で用いていた音源
チャンネルをそのまま用いて、先行音素のフォルマント
パラメータから後続音素のフォルマントパラメータへと
補間処理することにより求めたフォルマントパラメータ
を前記時間間隔で入力して、発音する音素を移行し、前
記検出手段で有声音から無声音への切り替えを検出した
場合は、前後の音素の関係によって短時間でフォルマン
トレベルを落としたい場合を認識し、前記エンベロープ
生成手段からサンプリング周期ごとに出力されるエンベ
ロープ波形を用いて先行音素のフォルマントレベルを落
とし、別の音源チャンネルを用いて後続音素の発音を開
始するように制御する手段とを備えたことを特徴とする
楽音合成装置。
【請求項３】サンプリング周期と比較すると遅い時間間
隔でフォルマントパラメータを送出するフォルマントパ
ラメータ送出手段であって、音素間でフォルマントパラ
メータを補間処理して送出する機能を備えたものと、前記フォルマントパラメータ送出手段から送出されたフ
ォルマントパラメータにしたがうフォルマントを有する
有声音波形および無声音波形をサンプリング周期で生成
出力する有声音波形発生用および無声音波形発生用の複
数の音源チャンネルと、発音する音素の切り替えが有声音同士あるいは無声音同
士で行なわれるか、有声音から無声音への切り替えかを
検出する検出手段と、前記音源チャンネルで発生した波形のフォルマントレベ
ルを落とすために用いるエンベロープ波形をサンプリン
グ周期ごとに発生するエンベロープ生成手段と、前記検出手段で有声音同士あるいは無声音同士の切り替
えを検出した場合は、先行音素の発音で用いていた音源
チャンネルをそのまま用いて、前記フォルマントパラメ
ータ送出手段が先行音素のフォルマントパラメータから
後続音素のフォルマントパラメータへと補間処理して求
めたフォルマントパラメータを前記時間間隔で送出する
ように制御し、前記検出手段で有声音から無声音への切
り替えを検出した場合は、前後の音素の関係によって短
時間でフォルマントレベルを落としたい場合を認識し、
前記エンベロープ生成手段からサンプリング周期ごとに
出力されるエンベロープ波形を用いて先行音素のフォル
マントレベルを落とすとともに、先行音素の発音に用い
た音源チャンネルとは別の音源チャンネルを用いて後続
音素の発音を開始するように制御する手段とを備えたこ
とを特徴とする楽音合成装置。
【請求項４】サンプリング周期と比較すると遅い時間間
隔でフォルマントパラメータを送出するフォルマントパ
ラメータ送出手段であって、音素間でフォルマントパラ
メータを補間処理して送出する機能を備えたものと、前記フォルマントパラメータ送出手段から送出されたフ
ォルマントパラメータにしたがうフォルマントを有する
有声音波形をサンプリング周期で生成出力する有声音波
形発生用の複数の音源チャンネルと、キーオンで０から１に立ち上がり、キーオン中は１を保
持し、キーオフで所定のリリースレートで立ち下がるエ
ンベロープ波形をサンプリング周期ごとに出力するエン
ベロープ生成手段と、前記有声音波形発生用の音源チャンネルから出力される
有声音波形のフォルマントレベルを、前記エンベロープ
生成手段から出力されるエンベロープ波形および前記フ
ォルマントパラメータ送出手段から送出されたフォルマ
ントパラメータのうちのフォルマントレベルに基づいて
制御するフォルマントレベル制御手段とと、前記フォルマントパラメータ送出手段から送出されたフ
ォルマントパラメータにしたがうフォルマントを有する
無声音波形をサンプリング周期で生成出力する無声音波
形発生用の複数の音源チャンネルと、前記フォルマントレベル制御手段によりフォルマントレ
ベルが制御された有声音波形と前記無声音波形発生用の
音源チャンネルから出力された無声音波形とをミキシン
グして出力するミキシング手段と、発音する音素を有声音同士あるいは無声音同士で切り替
えるか、または有声音から無声音へと切り替えるかを検
出する検出手段と、 (i)前記検出手段で有声音同士あるいは無声音同士の切
り替えが検出された場合は、先行音素の発音で用いた音
源チャンネルを引き続き用いるとともに、前記フォルマ
ントパラメータ送出手段が先行音素のフォルマントパラ
メータから後続音素のフォルマントパラメータへと補間
処理して求めたフォルマントパラメータを前記時間間隔
ごとに送出するように制御し、 (ii)前記検出手段で有声音から無声音への切り替えが検
出された場合は、前記エンベロープ生成手段に先行音素
のキーオフを発行して、先行音素の発音で用いた音源チ
ャンネルから出力される有声音波形のフォルマントレベ
ルを前記エンベロープ生成手段からサンプリング周期ご
とに出力されるエンベロープ波形を用いて落とすととも
に、先行音素の発音に用いた音源チャンネルとは別の音
源チャンネルを用いて後続音素の発音を開始するように
制御する手段とを備えたことを特徴とする楽音合成装
置。
【請求項５】サンプリング周期と比較すると遅い第１の
時間間隔でフォルマントパラメータを送出するフォルマ
ントパラメータ送出手段であって、音素間でフォルマン
トパラメータを補間処理して送出する機能を備えたもの
と、前記第１の時間間隔よりも速い第２の時間間隔でフォル
マントパラメータのうちのフォルマントレベルのみを送
出するフォルマントレベル送出手段と、前記フォルマントパラメータ送出手段から前記第１の時
間間隔で送出されたフォルマントパラメータにしたがう
フォルマントを有する有声音波形および無声音波形をサ
ンプリング周期で生成出力する有声音波形発生用および
無声音波形発生用の複数の音源チャンネルであって、必
要に応じて前記フォルマントレベル送出手段から前記第
２の時間間隔で送出されたフォルマントレベルにしたが
ってフォルマントレベルが制御された波形を生成出力す
るものと、発音する音素の切り替えが有声音同士あるいは無声音同
士で行なわれるか、それ以外かを検出する検出手段と、 (i)前記検出手段で有声音同士あるいは無声音同士の切
り替えを検出した場合は、先行音素の発音で用いていた
音源チャンネルをそのまま用いて、前記フォルマントパ
ラメータ送出手段が先行音素のフォルマントパラメータ
から後続音素のフォルマントパラメータへと補間処理し
て求めたフォルマントパラメータを前記第１の時間間隔
で送出するように制御し、 (ii)前記検出手段で有声音同士あるいは無声音同士以外
の切り替えを検出した場合は、前後の音素の関係によっ
て短時間でフォルマントレベルを落としたい場合を認識
し、前記フォルマントレベル送出手段が急速かつ滑らか
に立ち下がるフォルマントレベルを前記第２の時間間隔
で送出するように制御し、これにより先行音素のフォル
マントレベルを落とし、別の音源チャンネルを用いて後
続音素の発音を開始するように制御する手段とを備えた
ことを特徴とする楽音合成装置。