JP3132721B2 - 楽音合成装置 - Google Patents

楽音合成装置

Info

Publication number
JP3132721B2
JP3132721B2 JP08217965A JP21796596A JP3132721B2 JP 3132721 B2 JP3132721 B2 JP 3132721B2 JP 08217965 A JP08217965 A JP 08217965A JP 21796596 A JP21796596 A JP 21796596A JP 3132721 B2 JP3132721 B2 JP 3132721B2
Authority
JP
Japan
Prior art keywords
formant
sound
voiced
unvoiced
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08217965A
Other languages
English (en)
Other versions
JPH1049171A (ja
Inventor
慎一 大田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP08217965A priority Critical patent/JP3132721B2/ja
Priority to US08/902,424 priority patent/US5998725A/en
Publication of JPH1049171A publication Critical patent/JPH1049171A/ja
Application granted granted Critical
Publication of JP3132721B2 publication Critical patent/JP3132721B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/471General musical sound synthesis principles, i.e. sound category-independent synthesis methods
    • G10H2250/481Formant synthesis, i.e. simulating the human speech production mechanism by exciting formant resonators, e.g. mimicking vocal tract filtering as in LPC synthesis vocoders, wherein musical instruments may be used as excitation signal to the time-varying filter estimated from a singer's speech
    • G10H2250/491Formant interpolation therefor

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、所望のフォルマ
ントにしたがう楽音を合成する楽音合成装置に関する。
【0002】
【従来の技術】従来より、人が発する音声には所定のフ
ォルマントが存在し、これにより音声が特徴づけられて
いることが知られている。一方、楽音合成装置で音声を
合成して所望の音高で出力することにより歌を唄わせる
試みがなされている。
【0003】図13は、そのような歌を唄わせる楽音合
成装置の構成の一例を示す。演奏情報1311や歌詞情
報1312は、例えばMIDI(Musical In
strument Digital Interfac
e)方式のメッセージとしてCPU1301に入力させ
る。演奏情報1311は、音高情報を含むノートオンと
ノートオフである。歌詞情報1312は、演奏情報13
11で指定した音符で発音すべき歌詞(音素データ)で
ある。歌詞情報1312は、MIDIのシステムエクス
クルーシブなどの形式で作成する。例えば、「さいた」
という歌詞(音素で表わすと「saita」)を順次C
3,E3,G3の音高で唄わせる場合、演奏情報131
1と歌詞情報1312は、例えば以下のようなシーケン
ス(1)でCPU1301に入力させる。
【0004】 ・s<20>a<0> ・C3のノートオン ・C3のノートオフ ・i<0> ・E3のノートオン ………(1) ・E3のノートオフ ・t<02>a<00> ・G3のノートオン ・G3のノートオフ
【0005】なお、ここではノートオンメッセージの前
にその音符で発音すべき歌詞データを送るようにしてい
る。s,a,i,tは音素を示し、音素に続く<>内の
数値はその音素のデュレーションタイム(持続時間)を
示す。ただし、<0>は次の音素のノートオンが来るま
でその音素を持続させて発音することを示す。
【0006】このようなシーケンス(1)を受信したC
PU1301は、以下のように動作する。まず始めに、
発音すべき歌詞データ「s<20>a<0>」を受信す
ると、その歌詞データを歌詞情報バッファ1305に記
憶しておく。次に、「C3のノートオン」を受信する
と、CPU1301は、歌詞情報バッファ1305を参
照して発音させる歌詞「s<20>a<0>」を知り、
その歌詞を指定音高「C3」で発生するようにフォルマ
ントパラメータを算出してフォルマント合成音源130
2に送出する。次に「C3のノートオフ」を受信する
が、ここでは「a<0>」が指定されているので、次の
ノートオンまで「a」を持続させるため、CPU130
1は受信した「C3のノートオフ」を無視する。なお、
「sa」と「i」とを区切って発音する場合、CPU1
301は、「C3のノートオフ」をフォルマント合成音
源1302に送出して、「sa」のC3での発音を停止
させる。次に発音すべき歌詞データ「i<0>」を受信
するとその歌詞データを歌詞情報バッファ1305に記
憶し、「E3のノートオン」を受信すると、CPU13
01は、歌詞情報バッファ1305を参照して発音させ
る歌詞「i<0>」を知り、その歌詞を指定音高「E
3」で発生するようにフォルマントパラメータを算出し
てフォルマント合成音源1302に送出する。以下、
「ta」の発音も同様の処理により行なう。
【0007】フォルマントパラメータは、時系列データ
であり、CPU1301から所定の時間間隔でフォルマ
ント合成音源1302に転送する。所定の時間間隔と
は、通常、人の音声の特徴を出して発音するには、例え
ば数msec間隔程度の低レートでよい。この時間間隔
で逐次フォルマントを時間的変化させることにより、人
の音声の特徴を出して歌を唄わせる。フォルマントパラ
メータとしては、例えば、有声音/無声音の別、フォル
マント中心周波数、フォルマントレベル、およびフォル
マントバンド幅などがある。プログラムメモリ1303
はCPU1301が実行する制御プログラムなどを格納
したメモリ、ワーキングメモリ1304は各種のワーキ
ングデータを一次記憶するためのメモリである。
【0008】
【発明が解決しようとする課題】ところで、このような
楽音合成装置で人の音声などを発音する場合、音素と音
素の切れ目(特に有声音から無声音へ移行する場合)が
うまくつながらず、発生した音声が不自然になることが
あるという問題があった。
【0009】この発明は、音素と音素の切れ目をうまく
つなげて、発生する音声が自然に聞こえるようにした楽
音合成装置を提供することを目的とする。
【0010】
【課題を解決するための手段】この目的を達成するた
め、請求項1に係る発明は、サンプリング周期と比較す
ると遅い時間間隔で外部から与えられるフォルマントパ
ラメータを入力し、該フォルマントパラメータにしたが
うフォルマントを有する有声音波形および無声音波形を
サンプリング周期で生成出力する有声音波形発生用およ
び無声音波形発生用の複数の音源チャンネルを備えた楽
音合成装置において、発音する音素の切り替えが有声音
同士あるいは無声音同士で行なわれる場合は、同一の音
源チャンネルを用いて、前記時間間隔で与えられたフォ
ルマントパラメータにしたがって楽音を生成出力し、発
音する音素の切り替えが有声音から無声音への切り替え
である場合は、前後の音素の関係によって短時間でフォ
ルマントレベルを落としたい場合を認識し、内部に備え
られているエンベロープ生成手段からサンプリング周期
ごとに出力されるエンベロープ波形を用いて先行音素の
フォルマントレベルを落とし、音源チャンネルを切り替
えて後続音素を発音することを特徴とする。
【0011】請求項2に係る発明は、サンプリング周期
と比較すると遅い時間間隔で外部から与えられるフォル
マントパラメータを入力し、該フォルマントパラメータ
にしたがうフォルマントを有する有声音波形および無声
音波形をサンプリング周期で生成出力する有声音波形発
生用および無声音波形発生用の複数の音源チャンネルを
備えた楽音合成装置において、発音する音素の切り替え
が有声音同士あるいは無声音同士で行なわれるか、有声
音から無声音への切り替えかを検出する検出手段と、前
記音源チャンネルで発生した波形のフォルマントレベル
を落とすために用いるエンベロープ波形をサンプリング
周期ごとに発生するエンベロープ生成手段と、前記検出
手段で有声音同士あるいは無声音同士の切り替えを検出
した場合は、先行音素の発音で用いていた音源チャンネ
ルをそのまま用いて、先行音素のフォルマントパラメー
タから後続音素のフォルマントパラメータへと補間処理
することにより求めたフォルマントパラメータを前記時
間間隔で入力して、発音する音素を移行し、前記検出手
段で有声音から無声音への切り替えを検出した場合は、
前後の音素の関係によって短時間でフォルマントレベル
を落としたい場合を認識し、前記エンベロープ生成手段
からサンプリング周期ごとに出力されるエンベロープ波
形を用いて先行音素のフォルマントレベルを落とし、別
の音源チャンネルを用いて後続音素の発音を開始するよ
うに制御する手段とを備えたことを特徴とする。
【0012】請求項3に係る楽音合成装置は、サンプリ
ング周期と比較すると遅い時間間隔でフォルマントパラ
メータを送出するフォルマントパラメータ送出手段であ
って、音素間でフォルマントパラメータを補間処理して
送出する機能を備えたものと、前記フォルマントパラメ
ータ送出手段から送出されたフォルマントパラメータに
したがうフォルマントを有する有声音波形および無声音
波形をサンプリング周期で生成出力する有声音波形発生
用および無声音波形発生用の複数の音源チャンネルと、
発音する音素の切り替えが有声音同士あるいは無声音同
士で行なわれるか、有声音から無声音への切り替えか
検出する検出手段と、前記音源チャンネルで発生した波
形のフォルマントレベルを落とすために用いるエンベロ
ープ波形をサンプリング周期ごとに発生するエンベロー
プ生成手段と、前記検出手段で有声音同士あるいは無声
音同士の切り替えを検出した場合は、先行音素の発音で
用いていた音源チャンネルをそのまま用いて、前記フォ
ルマントパラメータ送出手段が先行音素のフォルマント
パラメータから後続音素のフォルマントパラメータへと
補間処理して求めたフォルマントパラメータを前記時間
間隔で送出するように制御し、前記検出手段で有声音
ら無声音への切り替えを検出した場合は、前後の音素の
関係によって短時間でフォルマントレベルを落としたい
場合を認識し、前記エンベロープ生成手段からサンプリ
ング周期ごとに出力されるエンベロープ波形を用いて先
行音素のフォルマントレベルを落とすとともに、先行音
素の発音に用いた音源チャンネルとは別の音源チャンネ
ルを用いて後続音素の発音を開始するように制御する手
段とを備えたことを特徴とする。
【0013】請求項4に係る楽音合成装置は、サンプリ
ング周期と比較すると遅い時間間隔でフォルマントパラ
メータを送出するフォルマントパラメータ送出手段であ
って、音素間でフォルマントパラメータを補間処理して
送出する機能を備えたものと、前記フォルマントパラメ
ータ送出手段から送出されたフォルマントパラメータに
したがうフォルマントを有する有声音波形をサンプリン
グ周期で生成出力する有声音波形発生用の複数の音源チ
ャンネルと、キーオンで0から1に立ち上がり、キーオ
ン中は1を保持し、キーオフで所定のリリースレートで
立ち下がるエンベロープ波形をサンプリング周期ごとに
出力するエンベロープ生成手段と、前記有声音波形発生
用の音源チャンネルから出力される有声音波形のフォル
マントレベルを、前記エンベロープ生成手段から出力さ
れるエンベロープ波形および前記フォルマントパラメー
タ送出手段から送出されたフォルマントパラメータのう
ちのフォルマントレベルに基づいて制御するフォルマン
トレベル制御手段とと、前記フォルマントパラメータ送
出手段から送出されたフォルマントパラメータにしたが
うフォルマントを有する無声音波形をサンプリング周期
で生成出力する無声音波形発生用の複数の音源チャンネ
ルと、前記フォルマントレベル制御手段によりフォルマ
ントレベルが制御された有声音波形と前記無声音波形発
生用の音源チャンネルから出力された無声音波形とをミ
キシングして出力するミキシング手段と、発音する音素
を有声音同士あるいは無声音同士で切り替えるか、また
は有声音から無声音へと切り替えるかを検出する検出手
段と、(i)前記検出手段で有声音同士あるいは無声音同
士の切り替えが検出された場合は、先行音素の発音で用
いた音源チャンネルを引き続き用いるとともに、前記フ
ォルマントパラメータ送出手段が先行音素のフォルマン
トパラメータから後続音素のフォルマントパラメータへ
と補間処理して求めたフォルマントパラメータを前記時
間間隔ごとに送出するように制御し、(ii)前記検出手段
で有声音から無声音への切り替えが検出された場合は、
前記エンベロープ生成手段に先行音素のキーオフを発行
して、先行音素の発音で用いた音源チャンネルから出力
される有声音波形のフォルマントレベルを前記エンベロ
ープ生成手段からサンプリング周期ごとに出力されるエ
ンベロープ波形を用いて落とすとともに、先行音素の発
音に用いた音源チャンネルとは別の音源チャンネルを用
いて後続音素の発音を開始するように制御する手段とを
備えたことを特徴とする。
【0014】請求項5に係る楽音合成装置は、サンプリ
ング周期と比較すると遅い第1の時間間隔でフォルマン
トパラメータを送出するフォルマントパラメータ送出手
段であって、音素間でフォルマントパラメータを補間処
理して送出する機能を備えたものと、前記第1の時間間
隔よりも速い第2の時間間隔でフォルマントパラメータ
のうちのフォルマントレベルのみを送出するフォルマン
トレベル送出手段と、前記フォルマントパラメータ送出
手段から前記第1の時間間隔で送出されたフォルマント
パラメータにしたがうフォルマントを有する有声音波形
および無声音波形をサンプリング周期で生成出力する有
声音波形発生用および無声音波形発生用の複数の音源チ
ャンネルであって、必要に応じて前記フォルマントレベ
ル送出手段から前記第2の時間間隔で送出されたフォル
マントレベルにしたがってフォルマントレベルが制御さ
れた波形を生成出力するものと、発音する音素の切り替
えが有声音同士あるいは無声音同士で行なわれるか、そ
れ以外かを検出する検出手段と、(i)前記検出手段で有
声音同士あるいは無声音同士の切り替えを検出した場合
は、先行音素の発音で用いていた音源チャンネルをその
まま用いて、前記フォルマントパラメータ送出手段が先
行音素のフォルマントパラメータから後続音素のフォル
マントパラメータへと補間処理して求めたフォルマント
パラメータを前記第1の時間間隔で送出するように制御
し、(ii)前記検出手段で有声音同士あるいは無声音同士
以外の切り替えを検出した場合は、前後の音素の関係に
よって短時間でフォルマントレベルを落としたい場合を
認識し、前記フォルマントレベル送出手段が急速かつ滑
らかに立ち下がるフォルマントレベルを前記第2の時間
間隔で送出するように制御し、これにより先行音素のフ
ォルマントレベルを落とし、別の音源チャンネルを用い
て後続音素の発音を開始するように制御する手段とを備
えたことを特徴とする。
【0015】
【発明の実施の形態】以下、図面を用いてこの発明の実
施の形態を説明する。
【0016】図1は、この発明に係る楽音合成装置を適
用した電子楽器のシステム構成を示す。この電子楽器
は、中央処理装置(CPU)101、タイマ102、リ
ードオンリメモリ(ROM)103、ランダムアクセス
メモリ(RAM)104、データメモリ105、表示部
106、通信インタフェース(I/F)107、演奏操
作子108、設定操作子109、フォルマント合成音源
(FORMANT TG)110、ディジタル/アナロ
グ変換器(DAC)111、およびバスライン112を
備えている。各部101〜110は、双方向バスライン
112により相互に接続されている。
【0017】CPU101は、この電子楽器全体の動作
を制御する。特に、CPU101は、外部装置との間で
MIDI方式メッセージを送受信する機能を有する。タ
イマ102は、CPU101から指定された時間間隔ご
とにタイマ割り込み信号を発生するタイマである。RO
M103は、CPU101が実行する制御プログラム
(その詳細は図5〜図8で後述)や各種定数データなど
を格納する。RAM104は、ROM103から読み出
した制御プログラムを格納してCPU101により実行
するためのプログラムロードエリア、CPU101のワ
ーキングエリア、MIDIバッファエリアなどに用いら
れる。
【0018】データメモリ105は、演奏情報や歌詞情
報を含むソングデータを格納する記憶装置であり、半導
体メモリ、フロッピーディスク装置(FDD)、ハード
ディスク装置(HDD)、光磁気(MO)ディスク装
置、およびICメモリカード装置などを使用する。表示
部106は、この電子楽器のパネル上に設けられた表示
装置およびその駆動回路などであり各種の情報を表示す
るために使用する。通信I/F107は、電話回線など
の公衆回線やイーサネット(Ethernet)などの
ローカルエリアネットワーク(LAN)に接続するため
のインターフェースである。
【0019】演奏操作子108は、ユーザが演奏操作す
るための複数の鍵を備えた鍵盤であるが、他の操作子を
用いてもよい。設定操作子109は、この電子楽器のパ
ネル上に設けられた各種スイッチなどの操作子である。
フォルマント合成音源110は、CPU101からの指
示(フォルマントパラメータなど)に応じて、指定され
たフォルマントの音声を指定された音高で生成出力す
る。フォルマント合成音源110については図2で詳し
く説明する。フォルマント合成音源110から出力され
た音声信号はDAC111でアナログ信号に変換され、
不図示のサウンドシステムにより放音される。
【0020】この電子楽器では、データメモリ105か
らRAM103にロードしたソングデータや、MIDI
で受信した歌詞データおよび演奏データにしたがって歌
唱発音を行なうことができる。また、演奏操作子108
や設定操作子109でRAM104上またはデータメモ
リ105上に歌詞データや演奏データを作成し、それら
に応じて歌唱発音を行なうことができる。また、歌詞デ
ータはあらかじめ設定操作子109で入力したりMID
Iで受信したり、あるいはデータメモリ105から読み
出すことによりRAM104上に用意しておき、この歌
詞データを、演奏操作子108で入力した演奏データで
指定される音高で発音するようにして歌唱発音させるこ
ともできる。歌詞データや演奏データは、通信I/F1
07を介して受信したものを用いるようにしてもよい。
【0021】このように歌詞データと演奏データはどの
ような方式で用意してもよいが、以下では、説明を簡略
化するため、MIDI方式により歌詞データと演奏デー
タ(例えば、従来の技術の欄で説明した「saita」
をC3,E3,G3で発音する場合の入力データ(1)
のようなソングデータ)を受信し、これにしたがってC
PU101からフォルマント合成音源110に指示(フ
ォルマントパラメータの送出など)を出して歌唱発音す
る場合を例として説明する。
【0022】図2(a)は、フォルマント合成音源11
0の構成を示す。フォルマント合成音源110は、VT
Gグループ201、UTGグループ202、およびミキ
サ203を備えている。VTGグループ201は、ピッ
チを持つ母音フォルマント成分を生成する複数(n個)
の有声音生成用の音源ユニットVTG1,VTG2,
…,VTGnからなる。UTGグループ202は、母音
に含まれるノイズ的成分や子音フォルマント成分を生成
する複数(n個)の無声音生成用の音源ユニットUTG
1,UTG2,…,UTGnからなる。音声を合成する
際には、有声音と無声音のそれぞれに対しフォルマント
数分の音源ユニットVTG,UTGを組み合わせて各成
分を生成する(例えば、特開平3−200300号参
照)。音源ユニットVTG1〜nのそれぞれの有声音出
力(VOICED OUT1〜n)と音源ユニットUT
G1〜nのそれぞれの無声音出力(UNVOICED
OUT1〜n)は、ミキサ203でミキシングされ、出
力される。これにより、指定したフォルマントを有する
楽音信号が生成出力される。
【0023】図2(b)は、有声音波形生成用の1つの
音源ユニットVTGj(jは1〜nの整数)211の概
略構成を示す。音源ユニットVTG1〜nはすべて同じ
構成である。音源ユニットVTGj211は、有声音波
形発生部212、乗算器213、およびエンベロープジ
ェネレータ(EG)214を備えている。EG214
は、ハードウエアEGを用いている。
【0024】CPU101から送出されるキーオン信号
KONjおよびキーオフ信号KOFFj(VTGjに対
するキーオンおよびキーオフをKONjおよびKOFF
jで表わす)は、有声音波形発生部212およびEG2
14に入力する。CPU101から5msecごとに送
出されるフォルマントパラメータ(VOICED FO
RMANT DATAj)は、有声音波形発生部212
に入力する。このフォルマントパラメータは、有声音発
生用のパラメータであり、発生すべき有声音のフォルマ
ント中心周波数、フォルマント形状、およびフォルマン
トレベルなどを規定するパラメータである。フォルマン
トパラメータのうちフォルマントレベルは、乗算器21
3に入力する。このフォルマントレベルのほか、乗算器
213には、有声音波形発生部212から出力される波
形データ、およびEG214から出力されるエンベロー
プ波形が入力する。
【0025】この音源ユニットVTGj211の動作を
説明する。この音源ユニットの全体は、所定のサンプリ
ング周波数(例えば44KHz)のサンプリングクロッ
クに基づいて動作している。CPU101からのキーオ
ン信号KONjを受けると、有声音波形発生部212
は、CPU101から5msecごとに送出されるフォ
ルマントパラメータ(VOICED FORMANT
DATAj)にしたがって、サンプリング周期ごとに有
声音波形データを発生する。有声音波形発生部212
は、フォルマントパラメータで与えられるフォルマント
中心周波数およびフォルマント形状のフォルマントを有
する有声音の波形を発生する。また、EG214は、キ
ーオン信号KONjを受けると、図3に示す形状のエン
ベロープ波形データをサンプリング周期ごとに発生す
る。図3から分かるように、このエンベロープ波形は、
キーオンで「0」から「1」に立ち上がり、キーオン中
(すなわち、基本的には歌唱発音中)は「1」を保持
し、キーオフで所定のリリースレートで立下がり、
「0」に至るものである。乗算器213は、有声音波形
発生部212から出力される波形データに、フォルマン
トパラメータのフォルマントレベルとEG214からの
エンベロープ波形とを乗算し、その乗算結果を、有声音
波形データ(VOICED OUTj)としてサンプリ
ング周期ごとに出力する。
【0026】図3に示すように、キーオン中(歌唱発音
中)はEG214から「1」が出力されるので、実質的
には、(波形発生部212からの波形データ)×(フォ
ルマントパラメータのフォルマントレベル)の値が有声
音波形データ(VOICEDOUTj)として出力され
ることになる。これは、CPU101から与えられたフ
ォルマントパラメータ(のうちのフォルマントレベルの
値)に基いて、キーオン中のフォルマントレベルの制御
を行なっているということである。CPU101からは
5msecごとにフォルマントレベルが出力されるので
5msecごとにレベル制御されることになる。サンプ
リング周期に比較すると5msecはかなり長い時間間
隔であるが、通常、音声の特徴を出すには5msec程
度の間隔でフォルマントパラメータを与えれば十分であ
る。
【0027】一方、CPU101からのキーオフ信号K
OFFjを受けると、EG214は、図3に示すように
所定のリリースレートで立下がるエンベロープ波形をサ
ンプリング周期ごとに順次出力する。また、キーオフ以
後、CPU101は、キーオフ以後の発音を行なうため
のフォルマントパラメータを5msecごとに順次出力
するが、そのうちフォルマントレベルはキーオフ時点の
フォルマントレベルを保持した固定値を出力する。フォ
ルマントパラメータとして与えられるフォルマントレベ
ルが固定値であるので、(波形発生部212からの波形
データ)×(キーオフ時点のフォルマントレベル固定
値)×(EG214からのエンベロープ波形)の値が有
声音波形データ(VOICED OUTj)として出力
されることになる。これは、EG214から出力された
エンベロープ波形に基づいて、キーオフ後のフォルマン
トレベルの制御を行なっているということである。EG
214からは、サンプリング周期ごとにエンベロープ波
形(図3のキーオフ以後の立ち下がり部分)が出力され
るので、サンプリング周期ごとの短い時間間隔(フォル
マントパラメータの出力間隔に比較すると速いレート)
でレベル制御されることになる。
【0028】図2(c)は、無声音波形発生用の1つの
音源ユニットUTGk(kは1〜nの整数)221の概
略構成を示す。音源ユニットUTG1〜nはすべて同じ
構成である。音源ユニットUTGk221は、無声音波
形発生部222、乗算器223、およびEG224を備
えている。無声音波形発生部222は、CPU101か
ら与えられる無声音発生用のフォルマントパラメータ
(UNVOICED FORMANT DATAk)に
したがって無声音波形データを生成出力する。EG22
4は、EG214と同様のものであり、図3に示したエ
ンベロープ波形を発生する。
【0029】上記で図2(b)および図3を参照して有
声音波形発生用の音源ユニットVTGjについて説明し
たが、無声音波形発生用の音源ユニットUTGkについ
ても同様の説明があてはまる。特に上記の有声音波形発
生用の音源ユニットVTGjの説明中、「有声音」を
「無声音」に、「VTGj」を「UTGk」に、「VT
G」を「UTG」に、「有声音波形発生部212」を
「無声音波形発生部222」に、「乗算器213」を
「乗算器223」に、「EG214」を「EG224」
に、「KONj」を「KONk」に、「KOFFj」を
「KOFFk」に、「フォルマントパラメータ(VOI
CED FORMANT DATAj)」を「フォルマ
ントパラメータ(UNVOICED FORMANT
DATAk)」に、「VOICED OUTj」を「U
NVOICED OUTk」に、それぞれ読み替えれば
よい。特に、キーオン(KONk)を受けるとCPU1
01から5msecごとに与えられるフォルマントパラ
メータのフォルマントレベルでレベル制御されて無声音
波形データ(UNVOICED OUTk)が出力さ
れ、またキーオフ(KOFFk)を受けるとサンプリン
グ周期ごとにEG224から出力されるエンベロープ波
形によってレベル制御される点も同じである。
【0030】なお、歌唱発音を行なう際には、有声音の
場合は有声音波形発生用の音源ユニットVTGjを幾つ
か(基本的には4フォルマントで発音するので4つの音
源ユニットになる)用い、無声音の場合は無声音波形発
生用の音源ユニットUTGkを幾つか(基本的には4フ
ォルマントで発音するので4つの音源ユニットになる)
用いることになるが、これらの個々の音源ユニットをフ
ォルマント発音チャンネル(あるいは単にチャンネル)
と呼ぶこととする。有声音波形発生用の音源ユニットV
TGjの具体的な構成は、例えば特開平2−25449
7号に開示されたものがある。無声音波形発生用の音源
ユニットUTGkの具体的な構成は、例えば特開平4−
346502号に開示されたものがある。システムとし
ては、特開平4−251297号に開示されたものがあ
る。
【0031】図4に、ROM103またはRAM104
上の各種データおよび各種データ領域を示す。まず図4
(a)は、RAM104の全体のメモリマップである。
図4(a)において、301はROM103に格納され
ている制御プログラムをロードするためのプログラムロ
ードエリアである。302は、CPU101がこのプロ
グラムロードエリア301にロードしたプログラム(図
5〜図8で詳述する)を実行する際に使用するワーキン
グエリアであり、各種フラグ類などもこのワーキングエ
リア302に確保する。303は、CPU101が受信
したMIDIメッセージを一時記憶するためのMIDI
バッファである。MIDIバッファ303は、従来技術
の欄で説明したシーケンス(1)のようなソングデータ
を受信したとき、ノートオンの前に先行して送られてく
る歌詞データを一時記憶するバッファとして使用する
(図13の歌詞情報バッファ1305と同じ)。
【0032】図4(b)は、ROM103上に用意され
ている音素データベース310を示す。音素データベー
ス310は、音素ごとのフォルマントパラメータデータ
311を集めたものである。PHPAR[*]で音素
「*」のフォルマントパラメータを示す。音素データベ
ース310はROM103上に固定記憶しておいてもよ
いし、ROM103からRAM104に読み出して用い
たり、あるいは別途各種記憶媒体に用意されている音素
データベースをRAM104上に読み出して用いるよう
にしてもよい。これらのフォルマントパラメータは、発
音声質(個人差、男声、女声など)を決めるデータであ
るので、声質ごとに各種用意した音素データベースを選
択して用いるようにしてもよい。
【0033】図4(c)は、図4(b)の音素データベ
ース310のうちの1つの音素のフォルマントパラメー
タPHPAR[*]の内容を示す。VOICED/UN
VOICED321は、当該音素「*」が有声音か無声
音かを示す情報である。322,323,324,32
5は、それぞれ、当該音素に関する有声音成分のフォル
マント中心周波数(VF FREQ1〜4)、無声音成
分のフォルマント周波数(UF FREQ1〜4)、有
声音成分のフォルマントレベル(VF LEVEL1〜
4)、無声音成分のフォルマントレベル(UF LEV
EL1〜4)を示す情報である。当該音素が無声音の場
合は、有声音成分フォルマントレベル(VF LEVE
L1〜4)324はすべて0に設定しておく(あるいは
処理上で無視することとしてもよい)。FMISC32
6は、その他のフォルマント関連データである。
【0034】ここではフォルマント数が4の場合を示し
たが、フォルマント数はシステムの仕様に応じて適宜決
定すればよい。フォルマント数が4であるから、322
〜325の各パラメータデータは4つのフォルマントに
対応して4系列に分かれている。例えば、有声音成分フ
ォルマント周波数322は、第1フォルマントの中心周
波数データVF FREQ1、第2フォルマントの中心
周波数データVF FREQ2、第3フォルマントの中
心周波数データVF FREQ3、第4フォルマントの
中心周波数データVF FREQ4の4つの系列に分か
れている。他のパラメータ323〜325も同様であ
る。
【0035】また、各フォルマント周波数およびフォル
マントレベルのデータは、各々、5msecごとにパラ
メータ出力ができるように時系列データになっており、
発音時間に応じた値が記憶されているものとする。例え
ば、第1フォルマントの有声音成分中心周波数データV
F FREQ1は、5msecごとのデータの集まりで
ある。ただし、この時系列データはループ部分を含み、
発音時間が長くなった場合にはループ部分のデータが繰
り返し用いられるようになっている。
【0036】図4(d)は、フォルマント中心周波数と
フォルマントレベルに関して、先行音韻から後続音韻へ
とフォルマントパラメータを補間する様子を示す。有声
音から有声音に移行する場合、無声音から無声音に移行
する場合、および無声音から有声音に移行する場合は、
図4(d)に示すように先行音韻のフォルマント中心周
波数とフォルマントレベルの値から後続音韻のフォルマ
ント中心周波数とフォルマントレベルの値へと補間処理
を行なって、5msecごとのパラメータ値を生成し
て、CPU101からフォルマント合成音源110に送
るようにする。これにより、滑らかな音韻の移行が実現
できる。補間はどのような方法で行なってもよいが、こ
こでは不図示の調音結合データベースを参照して補間を
行なうようにしている。
【0037】一方、有声音から無声音に移行する場合
は、本実施の形態の特徴とするところであり、上記図4
(d)の補間処理によらない方法で音韻を移行させる。
有声音は有声音生成用の音源ユニットで生成し無声音は
無声音生成用の音源ユニットで生成するため、有声音か
ら無声音に移行する場合は、有声音生成用の音源ユニッ
トにおいて先行音韻の有声音成分を急速にダンプさせ、
無声音生成用の音源ユニットにおいて後続音韻の無声音
成分を立上げる必要がある。この場合、フォルマント合
成音源では有声音生成用音源ユニットと無声音生成用音
源ユニットとは別ユニットであるので、有声音から無声
音に連続変化させることができない。特に、有声音を急
速にダンプさせる際、5msecごとにフォルマント合
成音源にフォルマントレベルを与えるのではフォルマン
トレベルの更新レートが遅すぎてしまうため、波形瞬断
のノイズが発生してしまう。一方、ノイズが発生しない
ように滑らかにフォルマントレベルが立下がるようにす
ると、時間がかかりすぎて急速なダンプが実現できな
い。
【0038】そこで、この実施の形態では有声音から無
声音に移行する場合、先行音韻の有声音成分のレベルの
立下がりをフォルマント合成音源内のEG(サンプリン
グ周波数に基づいて動作しておりエンベロープ波形はサ
ンプリング周期ごと、すなわちフォルマントパラメータ
の更新レートより速い時間間隔で出力される)で実現す
る。これにより、滑らかにかつ急速に有声音のダンプを
行なうことができ、不連続ノイズの発生も回避できる。
なお、無声音から有声音に移行する場合は、5msec
程度の時間間隔でフォルマント合成音源にフォルマント
パラメータを与えても不連続ノイズ音は聴感上目立たな
い。したがって、この実施の形態では、無声音から有声
音に移行する場合も、図4(d)のような補間で生成し
たパラメータを5msecごとに音源に送ることで実現
している。
【0039】図5は、この電子楽器の電源がオンされた
ときにCPU101が実行するメインプログラムの手順
を示す。まずステップ501で各種の初期設定を行な
う。特に、後述するノートオンフラグNOTEONFL
GおよびダンプフラグDUMPFLGは「0」に初期設
定する。次にステップ502でタスク管理を行なう。こ
れは、システムの状況などに応じてタスクを切り替えて
実行させる処理である。特に、ノートオンイベントやノ
ートオフイベントが発生したときは、ステップ503の
発音処理を行なう。その他システムの状況に応じて各種
のタスク504,505を実行する。これらのタスクの
実行後は、再びタスク管理502に戻る。
【0040】図7は、ノートオンイベントやノートオフ
イベントが発生したときに実行するステップ503の発
音処理ルーチンの手順を示す。図6は、図7のステップ
701から分岐する場合の処理である。図7および図6
を参照して発音処理ルーチンの手順を説明する。
【0041】まずステップ701で、音素ノートオンイ
ベントがあるか否か判別する。この音素ノートオンイベ
ントは、具体的には、従来技術の欄で説明したシーケン
ス(1)のように、先行して送られてきた歌詞データが
MIDIバッファ303(図4(a))に格納された後
に発生するノートオンである。なお、ノートオンの単位
は音素1つに限る訳ではなく、「sa」や「ta」など
の日本語の50音を単位としてもノートオンが発生する
ものとする。ステップ701で音素ノートオンイベント
があった場合は、ステップ702で当該音素ノートオン
イベントから発生すべき音素およびピッチを決定する。
これはMIDIバッファ303中に格納されている歌詞
データから発生すべき音素を特定し、ノートオンに含ま
れるピッチデータからピッチを決定する処理である。次
にステップ703で、音素データベース310(図4
(b))を参照し、発生すべき音素のフォルマントパラ
メータを取得する。
【0042】次にステップ704で、今回のノートオン
の前の音素が有声音か否か判別する。有声音であるとき
は、ステップ705で今回のノートオンの音素が無声音
か否か判別する。無声音であるときはステップ707
に、そうでないときはステップ706に進む。ステップ
704で今回のノートオンの前の音素が有声音でないと
きは、ステップ706に進む。すなわち、ステップ70
4,705により、ノートオン前の音素が有声音で今回
の音素が無声音のときのみステップ707に分岐し、そ
れ以外の組み合せのときはステップ706に分岐する。
なお、今回のノートオン前に発生している音素が無いと
きは、ステップ704から706に進むものとする。
【0043】ステップ706では、今回のノートオン前
に発生していた音素で使用していたフォルマント発音チ
ャンネルと同一チャンネルをTGCHとする(すなわ
ち、TGCHの変更無しということ)。TGCHは現在
発音に使用している発音チャンネル(具体的には、図2
(a)のVTGグループ201のうち発音に使用してい
る幾つかの音源ユニットVTG211、およびUTGグ
ループ202のうち発音に使用している幾つかの音源ニ
ットUTG221)を特定する情報を格納するレジスタ
である。なお、今回のノートオンの前に発音中の音素が
無かったときは新たにチャンネルを割り当ててTGCH
とする。ステップ706の後、ステップ709に進む。
【0044】今回のノートオンの前に発音中の音素が有
声音で今回の音素が無声音であるときは、ステップ70
7で、現在発音中のフォルマント発音チャンネルTGC
Hに対しキーオフ(KOFF)を送出する。これによ
り、今発音中の有声音の発音に使用している音源ユニッ
トで、図2(b)で説明したように、EG214でエン
ベロープ波形を立下げる処理が行なわれ、発音中の有声
音のダンプが開始する。さらにステップ707では、レ
ジスタDUMPCHにTGCHの値を一時記憶し、ダン
プフラグDUMPFLGに「1」をセットする。レジス
タDUMPCHはEGによるダンプ処理が開始したチャ
ンネルを格納するレジスタである。ダンプフラグDUM
PFLGは、「1」のときダンプ中のチャンネルがある
ことを示し、「0」のときダンプ中のチャンネルがない
ことを示す。ステップ707の後、ステップ708で、
現在使用中の音源チャンネル(ダンプしつつあるチャン
ネル)と異なるチャンネルを新たに割り当ててTGCH
とする。ステップ708の後ステップ709に進む。
【0045】ステップ709では、ステップ703で参
照したデータから具体的にフォルマントパラメータやピ
ッチデータを算出する前処理を行なっておく。次にステ
ップ710で、フォルマント合成音源110に今回の音
素のフォルマントパラメータを転送する処理を開始す
る。これにより、タイマ102が起動し、5msecご
とにCPU101にタイマ割り込みがかかるようにな
る。このタイマ割り込みごとに実行されるタイマ割込処
理(図8で後述)により、実際にフォルマントパラメー
タがフォルマント音源の各チャンネルに転送される。ス
テップ710により、各発音チャンネルはTGCHにし
たがってそれぞれキーオンし、当該音素の発音が開始さ
れる。さらにステップ710では、ノートオンフラグN
OTEONFLGに1をセットして、リターンする。ノ
ートオンフラグNOTEONFLGは現在ノートオン中
であることを示すフラグ(「1」でノートオン中、
「0」でそうでないことを示す)である。
【0046】ステップ701で音素ノートオンイベント
でないときは、図6のステップ601に進む。ステップ
601では音素ノートオフイベントであるか否か判別す
る。音素ノートオフイベントであるときは、ステップ6
02で現在発音中の音素のリリース処理を開始させる。
これは、現在発音中のTGCHのチャンネルに対し、キ
ーオフ(KOFF)を送出して、図2で説明したような
EGによるリリースを開始するということである。この
リリースのレートは、キーオフの送出に付随して任意に
指定できる。次にステップ603で、ノートオンフラグ
NOTEONFLGを0にリセットしてリターンする。
ステップ601で音素ノートオフイベントでないときは
そのままリターンする。
【0047】図8は、5msecごとに実行されるタイ
マ割込処理1の手順を示す。まずステップ801で、ノ
ートオンフラグNOTEONFLGが「1」であるか否
か判別する。「1」でないときは、現在発音中でないと
いうことだから、そのままリターンする。
【0048】ノートオンフラグNOTEONFLGが
「1」であるときは、ステップ802で、現在発音中の
音素に関する現時点のフォルマントパラメータを算出し
て各フォルマント音源チャンネル(TGCHで示される
チャンネル)に転送する。これにより、5msecごと
のフォルマントパラメータの変更が実現される。なお、
日本語の50音の子音+母音の形で発音が指示されてい
た場合、子音から母音への移行は調音結合データベース
を用いた補間処理(図4(d))によって行なうが、こ
の補間処理でフォルマントパラメータを算出して各チャ
ンネルに転送する処理はステップ802の中で行なうよ
うにしている。同様に、有声音から有声音に移行する場
合、無声音から無声音に移行する場合、および無声音か
ら有声音に移行する場合は、図7のステップ706で先
行音韻と後続音韻の発音に同じチャンネルTGCHが割
り当てられるが、このチャンネルTGCHにおけるフォ
ルマントパラメータの補間処理(図4(d))およびそ
の補間で算出したフォルマントパラメータのTGCHへ
の送出は、ステップ802の中で行なうようにしてい
る。なお、音素をチャンネルを変えて連続発音する場合
は、先行音素および後続音素のチャンネルにおいて、先
行音素の第nフォルマントに関するフォルマントパラメ
ータから後続音素の第nフォルマントに関するフォルマ
ントパラメータへと移行させながら発音するため図4
(d)で説明した補間処理が必要であるが、この補間処
理は、ステップ802でなく図7のステップ709で行
なってもよい。この場合、ステップ802では、ステッ
プ709で算出されているパラメータを送出する処理を
行なうだけでよい。
【0049】次にステップ803で、ダンプフラグDU
MPFLGが「1」か否か判別する。「1」であるとき
は、現在発音中の音素がダンプ中であるということだか
ら、ステップ804で、そのダンプ中の音素が充分減衰
したか否か判別する。これはダンプ中のチャンネルのE
Gレベルや出力レベルを参照して判別してもよいし、ダ
ンプ開始からの時間が充分に経過したか否かによって判
別してもよい。ステップ803でダンプフラグDUMP
FLGが「1」でないときは、現在ダンプ中のチャンネ
ルは無いということだから、そのままリターンする。ス
テップ804で現在ダンプ中の音素のレベルが未だ十分
に減衰していないときは、減衰するまで待つためそのま
まリターンする。ステップ804で現在ダンプ中の音素
のレベルが十分に減衰していたら、ステップ805で、
現在ダンプ中のチャンネルDUMPCHの出力レベルを
「0」にするようにフォルマントパラメータを転送す
る。これは、ダンプ中のチャンネルについては、ステッ
プ802で各フォルマント音源のチャンネルに転送する
フォルマントパラメータのうちのフォルマントレベルは
ダンプ開始時点の値を固定して転送していたため、ステ
ップ805でこのフォルマントレベルの値を「0」にリ
セットするものである。次にステップ806で、ダンプ
フラグDUMPFLGを「0」にリセットしてリターン
する。
【0050】次に、上述の図5〜図8の処理がどのよう
に実行されるかの概要を、具体的な例を挙げて説明す
る。この電子楽器では各種操作子の操作やMIDIメッ
セージの受信などによりノートオンやノートオフが発生
するが、ここでは説明の簡略化のため、従来技術の説明
で挙げた以下のシーケンス(1)でイベントが発生した
とする。
【0051】 ・s<20>a<0> ・C3のノートオン ・C3のノートオフ ・i<0> ・E3のノートオン ………(1) ・E3のノートオフ ・t<02>a<00> ・G3のノートオン ・G3のノートオフ
【0052】図5のメインルーチンでは、ステップ50
2のタスク管理で歌詞データ「s<20>a<0>」の
受信を検出すると、ステップ504の各種タスクのうち
の1つを起動し、受信した歌詞データをMIDIバッフ
ァ303(図4(a))に記憶して、ステップ502に
戻る。次に、ステップ502で「C3のノートオン」を
検出すると、ステップ503の発音処理が実行される。
図7の発音処理では、「s<20>a<0>」を発音す
るためにステップ706でチャンネルを割り当ててTG
CHに格納する。そして、ステップ710でパラメータ
転送の開始を指示する。これ以降は、5msecごとに
図8のタイマ割り込み処理が実行され、ステップ802
で、C3で「s<20>a<0>」を発音するためのフ
ォルマントパラメータが算出されてチャンネルTGCH
に転送され、「sa」がC3で発音される。次の「C3
のノートオフ」は、「a<0>」が指定されているた
め、ステップ502のタスク管理では無視する。
【0053】次にステップ502のタスク管理で歌詞デ
ータ「i<0>」の受信を検出すると、MIDIバッフ
ァ303(図4(a))に記憶して、ステップ502に
戻る。次に、ステップ502で「E3のノートオン」を
検出すると、ステップ503の発音処理が実行される。
図7の発音処理では、前に発音している音素が「a」で
あり今回発音する音素が「i」であるので、ステップ7
05から706に進み、「s<20>a<0>」を発音
するために割り当てたチャンネルTGCHをそのまま
「i<0>」の発音にも用いることとする。そして、ス
テップ710でパラメータ転送の開始を指示する。これ
以降は、5msecごとに図8のタイマ割り込み処理が
実行され、ステップ802で、「s<20>a<0>」
から「i<0>」に移行するように補間処理を行ないつ
つ(有声音から有声音に移行する場合である)、算出し
たフォルマントパラメータをチャンネルTGCHに転送
する。これにより、「s<20>a<0>」から「i<
0>」への連続した移行が実現される。十分に時間が経
過すると、ステップ802で送出されるフォルマントパ
ラメータは完全に「i<0>」のパラメータに移行し、
「i<0>」の発音が持続する。次の「E3のノートオ
フ」は、「i<0>」が指定されているため、ステップ
502のタスク管理では無視する。
【0054】次にステップ502のタスク管理で歌詞デ
ータ「t<02>a<00>」の受信を検出すると、M
IDIバッファ303(図4(a))に記憶して、ステ
ップ502に戻る。次に、ステップ502で「G3のノ
ートオン」を検出すると、ステップ503の発音処理が
実行される。図7の発音処理では、前に発音している音
素が「i」であり今回発音する音素が「ta」であるの
で、ステップ705から707に進み、現在発音中のT
GCHにキーオフを送り、ステップ708で現在のTG
CHとは異なるチャンネルを「t<02>a<00>」
発音用に新たに割り当ててTGCHとする。そして、ス
テップ710でパラメータ転送の開始を指示する。これ
以降は、5msecごとに図8のタイマ割り込み処理が
実行され、ステップ802で、先行音韻「i」のフォル
マントパラメータを送出する処理は継続されるが、この
フォルマントパラメータのうちフォルマントレベルはキ
ーオフ時点の値を固定して送出する。また、先行音韻
「i」のダンプが開始されているので、ステップ803
から804に進み、ダンプ中の音素「i」のレベルが十
分に減衰したか否か判別する。この間、図2(b)で説
明したように、EG214を用いたダンプが実行されて
いる。音素「i」のレベルが十分に減衰すると、ステッ
プ805に進み、「i」の発音に用いたチャンネルDU
MPCHに対するフォルマントパラメータであるフォル
マントレベルを「0」とし、ステップ806でダンプフ
ラグを「0」にリセットする。「i」のダンプが行なわ
れている間も、ステップ802のパラメータ転送の処理
は継続して5msecごとに実行されており、ダンプが
ある程度進んだら「t<02>a<00>」の発音のた
めのフォルマントパラメータをTGCHに送出する処理
が実行される。以上により、「i」のEGによる滑らか
で急速なダンプと、引き続く「ta」の発音が実現され
る。
【0055】図10は、上述の例で、「sai」と発声
させるときの音源ユニットのフォルマントレベルの変化
を示す。1001の時点で「sa」のキーオンが発行さ
れると、「sa」を発音するためのチャンネルTGCH
が割り当てられる。図10のVTGおよびUTGは、割
り当てられたTGCHのうち有声音発生用のチャンネル
および無声音発生用のチャンネルのフォルマントレベル
を例示したものである(有声音用と無声音用とでそれぞ
れ1つのチャンネルを例示)。「sa」のキーオンによ
り、5msecごとに、1011および1012に示す
ようなフォルマントレベルをCPU101からTGCH
に送出して、「sa」を発音させる。次に、「i」のキ
ーオンが発行されると、「a」から「i」への移行、す
なわち有声音から有声音への移行であるので、同じTG
CHで1013のように補間処理によってフォルマント
レベルも連続的に移行している。
【0056】図11は、上述したこの発明の実施の形態
でなく従来の方式により「i」から「ta」へと連続し
て発音する例を示す。1101の時点で「i」のキーオ
ンが発行され、チャンネルTGCHに対し、1111の
ようにフォルマントレベルを送出して「i」の発音を行
なう。次に、1102の時点で次の「ta」のキーオン
が来たとする。従来の方式では、VTGの立下がり部分
1112は、右側の1113に示すように5msecご
とにフォルマントレベル1114,1115のように急
激に値を立下げたり、1116に示すように少し多めの
サンプル1117〜1119を送出するようにしてい
た。いずれにしても、5msecごとにフォルマントレ
ベルが送出されるので、有声音の立下げ部分1112に
より、不連続なノイズが発生したり急速な立下げが行な
われないという不都合があった。この立下げの後「t
a」の無声音部分の出力が1120,1121のように
開始される。
【0057】図12は、上述の例で、「i」から「t
a」へ連続的に移行する場合のフォルマントレベルの変
化の様子を示す。1201の時点で「i」のキーオンが
発行され、チャンネルTGCHに対し、1211のよう
にフォルマントレベルを送出して「i」の発音を行な
う。次に、1202の時点で次の「ta」のキーオンが
来たとする。このとき有声音のチャンネルVTGのフォ
ルマントレベルの立下がりは、EG214によって制御
され、右側の1220に示すようにサンプリング周期ご
とに送出されるエンベロープ波形でフォルマントレベル
の立下げが実現される。この立下げの後「ta」の無声
音部分の出力が1213,1214のように開始され
る。なお、フォルマント周波数については1214のよ
うに連続的に移行する。
【0058】上述の発明の実施の形態によれば、CPU
の処理能力が低くても、フォルマントレベルの立ち下げ
をEGにより実現しているので、有声音から無声音に移
行する場合でも、低レートのシステムのままノイズが発
生することなく滑らかに移行することができる。
【0059】図9は、上述の発明の実施の形態の図5か
ら図8に示した手順の変形例である。この変形例では、
上述の発明の実施の形態の図8のタイマ割り込み処理を
図9(a)のタイマ割り込み処理1と図9(b)のタイ
マ割り込み処理2に分けて実行する。その他は同じ手順
を用いるものとする。この変形例では、EGを用いてダ
ンプを行なうのでなく、CPU101から速いレートで
フォルマントレベルを音源に送出することによりダンプ
を行なう。したがって、この変形例では、図2で説明し
たEGによるダンプの機能は不要である。
【0060】図9(a)のタイマ割り込み処理1は5m
secごとに実行する処理である。ステップ901で
は、ノートオンフラグNOTEONFLGが「1」であ
るか否か判別する。「1」でないときは、現在発音中で
ないということだから、そのままリターンする。ノート
オンフラグNOTEONFLGが「1」であるときは、
ステップ902で、現在発音中の音素に関する現時点の
フォルマントパラメータを算出して各フォルマント音源
チャンネル(TGCHで示されるチャンネル)に転送す
る。これは、ステップ802と同じ処理である。
【0061】図9(b)のタイマ割り込み処理2は、5
msecに比較して十分に短い時間間隔ごとに実行され
る割り込み処理である。ステップ911で、ダンプフラ
グDUMPFLGが「1」か否か判別する。「1」でな
いときは、そのままリターンする。ダンプフラグDUM
PFLGが「1」であるときは、現在発音中の音素がダ
ンプ中であるということだから、ステップ912で、そ
のダンプ中の音素の消音が未完了か否か判別する。消音
が未完了であるときは、ステップ913で、現在ダンプ
中のチャンネルDUMPCHの各フォルマントレベルを
徐々に下げて各チャンネルDUMPCHに送出する。こ
れにより、上述の実施の形態でEGにより実現していた
フォルマントレベルの滑らかで急速な立ち下げを実現す
る。ステップ912で消音が完了していたら、ステップ
914でダンプフラグDUMPFLGを「0」にリセッ
トしてリターンする。
【0062】上述の変形例によれば、CPUの処理能力
が必要になるが、EGの制御によらずにフォルマントレ
ベルの立ち下げを実現しているので、有声音から無声音
に移行する場合でも、ノイズが発生することなく滑らか
に移行することができる。
【0063】なお、無声音から有声音に移行する場合は
不連続ノイズ音が聴感上目立たないので有声音同士ある
いは無声音同士と同じ取り扱いをしているが、無声音か
ら有声音に移行する場合も、有声音から無声音に移行す
る場合と同様に取り扱うようにしてもよい。
【0064】なお、上記発明の実施の形態において、フ
ォルマント合成音源110は、全体または部分的にかか
わらず、ハードウェアまたはソフトウェアのどちらによ
って実現しても、また組み合わせて実現してもよい。
【0065】
【発明の効果】以上説明したように、この発明によれ
ば、低レートで(すなわちサンプリング周期に比較して
遅い時間間隔で)フォルマントパラメータを更新して歌
唱発音する楽音合成装置において、有声音同士および無
声音同士の場合は同一チャンネルを使用してフォルマン
トの連続性を保持し、それ以外の場合は前後の音素関係
によって短時間でフォルマントレベルを落としたい場合
を認識してEGによってレベルを落としてチャンネルを
切り替えるようにしているので、短時間にレベルを落と
したい場合に発生するノイズを低減し、音素と音素の切
れ目をうまくつなげて滑らかに自然に聞こえるように歌
唱発音させることができる。特に、有声音から無声音に
移行する場合の効果が高い。また、EGを用いる代わり
に、フォルマントレベルのみ高速レートで音源に与える
ようにすれば、EGによるダンプ機能を用意することな
く、音素と音素の切れ目をうまくつなげて滑らかに自然
に聞こえるように歌唱発音させることができる。
【図面の簡単な説明】
【図1】この発明に係る楽音合成装置を適用した電子楽
器のシステム構成図
【図2】フォルマント合成音源の構成図
【図3】エンベロープ波形データを示す図
【図4】ROMまたはRAM上の各種データおよび各種
データ領域を示す図
【図5】CPUが実行するメインプログラムの手順を示
すフローチャート図
【図6】発音処理ルーチンの手順(一部)を示すフロー
チャート図
【図7】発音処理ルーチンの手順を示すフローチャート
【図8】タイマ割込処理1の手順を示すフローチャート
【図9】変形例のタイマ割込処理1,2の手順を示すフ
ローチャート図
【図10】「sai」と発声させるときの音源ユニット
のフォルマントレベルの変化を示す図
【図11】従来の方式により「i」から「ta」へと連
続して発音する例を示す図
【図12】「i」から「ta」へ連続的に移行する場合
のフォルマントレベルの変化の様子を示す図
【図13】従来例を示す図
【符号の説明】
101…中央処理装置(CPU)、102…タイマ、1
03…リードオンリメモリ(ROM)、104…ランダ
ムアクセスメモリ(RAM)、105…データメモリ、
106…表示部、107…通信インタフェース(I/
F)、108…演奏操作子、109…設定操作子、11
0…フォルマント合成音源(FORMANT TG)、
111…ディジタル/アナログ変換器(DAC)、11
2…バスライン、201…VTGグループ、202…U
TGグループ、203…ミキサ、VTG1,VTG2,
VTGn…有声音生成用の音源ユニット、UTG1,U
TG2,UTGn…無声音生成用の音源ユニット、21
2…有声音波形発生部、213…乗算器、214…エン
ベロープジェネレータ(EG)、222…無声音波形発
生部、223…乗算器、224…EG。

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】サンプリング周期と比較すると遅い時間間
    隔で外部から与えられるフォルマントパラメータを入力
    し、該フォルマントパラメータにしたがうフォルマント
    を有する有声音波形および無声音波形をサンプリング周
    期で生成出力する有声音波形発生用および無声音波形発
    生用の複数の音源チャンネルを備えた楽音合成装置にお
    いて、 発音する音素の切り替えが有声音同士あるいは無声音同
    士で行なわれる場合は、同一の音源チャンネルを用い
    て、前記時間間隔で与えられたフォルマントパラメータ
    にしたがって楽音を生成出力し、 発音する音素の切り替えが有声音から無声音への切り替
    えである場合は、前後の音素の関係によって短時間でフ
    ォルマントレベルを落としたい場合を認識し、内部に備
    えられているエンベロープ生成手段からサンプリング周
    期ごとに出力されるエンベロープ波形を用いて先行音素
    のフォルマントレベルを落とし、音源チャンネルを切り
    替えて後続音素を発音することを特徴とする楽音合成装
    置。
  2. 【請求項2】サンプリング周期と比較すると遅い時間間
    隔で外部から与えられるフォルマントパラメータを入力
    し、該フォルマントパラメータにしたがうフォルマント
    を有する有声音波形および無声音波形をサンプリング周
    期で生成出力する有声音波形発生用および無声音波形発
    生用の複数の音源チャンネルを備えた楽音合成装置にお
    いて、 発音する音素の切り替えが有声音同士あるいは無声音同
    士で行なわれるか、有声音から無声音への切り替えか
    検出する検出手段と、 前記音源チャンネルで発生した波形のフォルマントレベ
    ルを落とすために用いるエンベロープ波形をサンプリン
    グ周期ごとに発生するエンベロープ生成手段と、 前記検出手段で有声音同士あるいは無声音同士の切り替
    えを検出した場合は、先行音素の発音で用いていた音源
    チャンネルをそのまま用いて、先行音素のフォルマント
    パラメータから後続音素のフォルマントパラメータへと
    補間処理することにより求めたフォルマントパラメータ
    を前記時間間隔で入力して、発音する音素を移行し、前
    記検出手段で有声音から無声音への切り替えを検出した
    場合は、前後の音素の関係によって短時間でフォルマン
    トレベルを落としたい場合を認識し、前記エンベロープ
    生成手段からサンプリング周期ごとに出力されるエンベ
    ロープ波形を用いて先行音素のフォルマントレベルを落
    とし、別の音源チャンネルを用いて後続音素の発音を開
    始するように制御する手段とを備えたことを特徴とする
    楽音合成装置。
  3. 【請求項3】サンプリング周期と比較すると遅い時間間
    隔でフォルマントパラメータを送出するフォルマントパ
    ラメータ送出手段であって、音素間でフォルマントパラ
    メータを補間処理して送出する機能を備えたものと、 前記フォルマントパラメータ送出手段から送出されたフ
    ォルマントパラメータにしたがうフォルマントを有する
    有声音波形および無声音波形をサンプリング周期で生成
    出力する有声音波形発生用および無声音波形発生用の複
    数の音源チャンネルと、 発音する音素の切り替えが有声音同士あるいは無声音同
    士で行なわれるか、有声音から無声音への切り替えか
    検出する検出手段と、 前記音源チャンネルで発生した波形のフォルマントレベ
    ルを落とすために用いるエンベロープ波形をサンプリン
    グ周期ごとに発生するエンベロープ生成手段と、 前記検出手段で有声音同士あるいは無声音同士の切り替
    えを検出した場合は、先行音素の発音で用いていた音源
    チャンネルをそのまま用いて、前記フォルマントパラメ
    ータ送出手段が先行音素のフォルマントパラメータから
    後続音素のフォルマントパラメータへと補間処理して求
    めたフォルマントパラメータを前記時間間隔で送出する
    ように制御し、前記検出手段で有声音から無声音への切
    り替えを検出した場合は、前後の音素の関係によって短
    時間でフォルマントレベルを落としたい場合を認識し、
    前記エンベロープ生成手段からサンプリング周期ごとに
    出力されるエンベロープ波形を用いて先行音素のフォル
    マントレベルを落とすとともに、先行音素の発音に用い
    た音源チャンネルとは別の音源チャンネルを用いて後続
    音素の発音を開始するように制御する手段とを備えたこ
    とを特徴とする楽音合成装置。
  4. 【請求項4】サンプリング周期と比較すると遅い時間間
    隔でフォルマントパラメータを送出するフォルマントパ
    ラメータ送出手段であって、音素間でフォルマントパラ
    メータを補間処理して送出する機能を備えたものと、 前記フォルマントパラメータ送出手段から送出されたフ
    ォルマントパラメータにしたがうフォルマントを有する
    有声音波形をサンプリング周期で生成出力する有声音波
    形発生用の複数の音源チャンネルと、 キーオンで0から1に立ち上がり、キーオン中は1を保
    持し、キーオフで所定のリリースレートで立ち下がるエ
    ンベロープ波形をサンプリング周期ごとに出力するエン
    ベロープ生成手段と、 前記有声音波形発生用の音源チャンネルから出力される
    有声音波形のフォルマントレベルを、前記エンベロープ
    生成手段から出力されるエンベロープ波形および前記フ
    ォルマントパラメータ送出手段から送出されたフォルマ
    ントパラメータのうちのフォルマントレベルに基づいて
    制御するフォルマントレベル制御手段とと、 前記フォルマントパラメータ送出手段から送出されたフ
    ォルマントパラメータにしたがうフォルマントを有する
    無声音波形をサンプリング周期で生成出力する無声音波
    形発生用の複数の音源チャンネルと、 前記フォルマントレベル制御手段によりフォルマントレ
    ベルが制御された有声音波形と前記無声音波形発生用の
    音源チャンネルから出力された無声音波形とをミキシン
    グして出力するミキシング手段と、 発音する音素を有声音同士あるいは無声音同士で切り替
    えるか、または有声音から無声音へと切り替えるかを検
    出する検出手段と、 (i)前記検出手段で有声音同士あるいは無声音同士の切
    り替えが検出された場合は、先行音素の発音で用いた音
    源チャンネルを引き続き用いるとともに、前記フォルマ
    ントパラメータ送出手段が先行音素のフォルマントパラ
    メータから後続音素のフォルマントパラメータへと補間
    処理して求めたフォルマントパラメータを前記時間間隔
    ごとに送出するように制御し、 (ii)前記検出手段で有声音から無声音への切り替えが検
    出された場合は、前記エンベロープ生成手段に先行音素
    のキーオフを発行して、先行音素の発音で用いた音源チ
    ャンネルから出力される有声音波形のフォルマントレベ
    ルを前記エンベロープ生成手段からサンプリング周期ご
    とに出力されるエンベロープ波形を用いて落とすととも
    に、先行音素の発音に用いた音源チャンネルとは別の音
    源チャンネルを用いて後続音素の発音を開始するように
    制御する手段とを備えたことを特徴とする楽音合成装
    置。
  5. 【請求項5】サンプリング周期と比較すると遅い第1の
    時間間隔でフォルマントパラメータを送出するフォルマ
    ントパラメータ送出手段であって、音素間でフォルマン
    トパラメータを補間処理して送出する機能を備えたもの
    と、 前記第1の時間間隔よりも速い第2の時間間隔でフォル
    マントパラメータのうちのフォルマントレベルのみを送
    出するフォルマントレベル送出手段と、 前記フォルマントパラメータ送出手段から前記第1の時
    間間隔で送出されたフォルマントパラメータにしたがう
    フォルマントを有する有声音波形および無声音波形をサ
    ンプリング周期で生成出力する有声音波形発生用および
    無声音波形発生用の複数の音源チャンネルであって、必
    要に応じて前記フォルマントレベル送出手段から前記第
    2の時間間隔で送出されたフォルマントレベルにしたが
    ってフォルマントレベルが制御された波形を生成出力す
    るものと、 発音する音素の切り替えが有声音同士あるいは無声音同
    士で行なわれるか、それ以外かを検出する検出手段と、 (i)前記検出手段で有声音同士あるいは無声音同士の切
    り替えを検出した場合は、先行音素の発音で用いていた
    音源チャンネルをそのまま用いて、前記フォルマントパ
    ラメータ送出手段が先行音素のフォルマントパラメータ
    から後続音素のフォルマントパラメータへと補間処理し
    て求めたフォルマントパラメータを前記第1の時間間隔
    で送出するように制御し、 (ii)前記検出手段で有声音同士あるいは無声音同士以外
    の切り替えを検出した場合は、前後の音素の関係によっ
    て短時間でフォルマントレベルを落としたい場合を認識
    し、前記フォルマントレベル送出手段が急速かつ滑らか
    に立ち下がるフォルマントレベルを前記第2の時間間隔
    で送出するように制御し、これにより先行音素のフォル
    マントレベルを落とし、別の音源チャンネルを用いて後
    続音素の発音を開始するように制御する手段とを備えた
    ことを特徴とする楽音合成装置。
JP08217965A 1996-07-23 1996-07-31 楽音合成装置 Expired - Fee Related JP3132721B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP08217965A JP3132721B2 (ja) 1996-07-31 1996-07-31 楽音合成装置
US08/902,424 US5998725A (en) 1996-07-23 1997-07-29 Musical sound synthesizer and storage medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08217965A JP3132721B2 (ja) 1996-07-31 1996-07-31 楽音合成装置

Publications (2)

Publication Number Publication Date
JPH1049171A JPH1049171A (ja) 1998-02-20
JP3132721B2 true JP3132721B2 (ja) 2001-02-05

Family

ID=16712512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08217965A Expired - Fee Related JP3132721B2 (ja) 1996-07-23 1996-07-31 楽音合成装置

Country Status (1)

Country Link
JP (1) JP3132721B2 (ja)

Also Published As

Publication number Publication date
JPH1049171A (ja) 1998-02-20

Similar Documents

Publication Publication Date Title
US10789922B2 (en) Electronic musical instrument, electronic musical instrument control method, and storage medium
JP3144273B2 (ja) 自動歌唱装置
US5890115A (en) Speech synthesizer utilizing wavetable synthesis
EP3273441B1 (en) Sound control device, sound control method, and sound control program
JPH0944171A (ja) カラオケ装置
US20080072745A1 (en) Apparatus and computer program for playing arpeggio with regular pattern and accentuated pattern
JPH10319947A (ja) 音域制御装置
JP3132721B2 (ja) 楽音合成装置
JP3834804B2 (ja) 楽音合成装置および方法
JP3307283B2 (ja) 歌唱音合成装置
JP3427409B2 (ja) 電子楽器
JP2010169889A (ja) 音声合成装置、およびプログラム
WO2023140151A1 (ja) 情報処理装置、電子楽器、電子楽器システム、方法及びプログラム
JP3414150B2 (ja) コーラス効果付与装置
WO2023120289A1 (ja) 情報処理装置、電子楽器システム、電子楽器、音節進行制御方法及びプログラム
WO2023120288A1 (ja) 情報処理装置、電子楽器システム、電子楽器、音節進行制御方法及びプログラム
JPH1031496A (ja) 楽音発生装置
JP3022270B2 (ja) フォルマント音源のパラメータ生成装置
JPH1049192A (ja) 歌唱音合成装置
JPH0364880B2 (ja)
JP3296248B2 (ja) 楽音演奏装置
JP4207237B2 (ja) 音声合成装置およびその合成方法
JPH0869285A (ja) 電子楽器自動伴奏時のコード変化処理方法
JP2005077763A (ja) 自動伴奏生成装置及びプログラム
JPH08194484A (ja) 音声及び楽音合成装置

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071124

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081124

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081124

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091124

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101124

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101124

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111124

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees