WO2023058173A1

WO2023058173A1 - 音制御装置およびその制御方法、電子楽器、プログラム

Info

Publication number: WO2023058173A1
Application number: PCT/JP2021/037038
Authority: WO
Inventors: 達也入山
Original assignee: ヤマハ株式会社
Priority date: 2021-10-06
Filing date: 2021-10-06
Publication date: 2023-04-13

Abstract

音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得し、演奏情報に基づき、ノート開始およびノート終了を判定し、ノート開始と判定したタイミングに対応する音節を歌詞データから特定し、特定された音節の発音開始発音終了を指示する音制御装置を提供する。制御部１１は、第１のノート開始と判定された後、第１の所定時間の経過前に音高が変化したことで第１のノート終了および第２のノート開始と判定されたことに応じて、第１のノート開始と判定されたことに応じて特定された音節と同じ音節を、第２のノート開始に対応する音高で発音開始するよう指示する。

Description

音制御装置およびその制御方法、電子楽器、プログラム

　本発明は、音制御装置およびその制御方法、電子楽器、プログラムに関する。

　楽器等の音制御装置においては、楽器音などを想定した電子音を生成する以外に、歌唱音を合成した合成歌唱音（実際の歌唱音との区別を明確にするときは合成歌唱音という）を生成することが行われている。例えば、音節における音節（文字）に応じた音声素片を組み合わせつつ、指定された音高になるように波形を合成することによって、その音節を発音する合成歌唱音が生成される。特許文献１、２に示されるように、演奏操作に応じてリアルタイムに合成歌唱音を生成する技術も開発されている。

特開２０１６－２０６４９６号公報特開２０１４－９８８０１号公報

　しかし、電子楽器の演奏操作によって生成された演奏情報に基づき音節を発音させる場合、演奏操作のタイミングによっては、不適切なノートが生成されるおそれがある。従って、演奏者の意図に沿って音節を発音することに関して改善の余地があった。

　本発明の目的は、演奏者の意図に沿った音節の発音を可能にすることができる音制御装置を提供することである。

　上記目的を達成するために本発明によれば、音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得する取得部と、前記演奏情報に基づき、ノート開始およびノート終了を判定する判定部と、前記判定部が前記ノート開始と判定したタイミングに対応する音節を、発音する複数の音節が時系列に配置され基準時刻からの経過時間に対応する音節が一意に規定されている歌詞データから特定する特定部と、前記判定部により第１のノート開始と判定されたことに応じて特定された音節を、前記第１のノート開始に対応する音高およびタイミングで発音開始させるよう指示し、且つ、第１のノート終了に対応するタイミングで、前記特定された音節の発音を終了させるよう指示する指示部と、を有し、前記指示部は、前記第１のノート開始と判定された後、第１の所定時間の経過前に前記演奏情報における音高が変化したことで前記第１のノート終了および第２のノート開始と判定されたことに応じて、前記特定された音節と同じ音節を、前記第２のノート開始に対応する音高で発音開始するよう指示する、音制御装置が提供される。

　本発明によれば、演奏者の意図に沿った音節の発音を可能にすることができる。

音制御装置を含む音制御システムのブロック図である。歌詞データを示す図である。音制御装置の機能ブロック図である。音節の特定手法を説明する図である。音節の特定手法を説明する図である。音節の特定手法を説明する図である。音生成処理を示すフローチャートである。楽譜と、音節が割り当てられたノートとの関係を示す図である。音節ノートの生成例と対策例を示す図である。指示処理を示すフローチャートである。

　以下、図面を参照して本発明の実施の形態を説明する。

　図１は、本発明の一実施の形態に係る音制御装置を含む音制御システムのブロック図である。音制御システムは、音制御装置１００と、外部装置２０とを含む。音制御装置１００は、一例として電子楽器であり、例えばサクソフォン等の形態をした電子管楽器であってもよい。

　音制御装置１００は、制御部１１、操作部１２、表示部１３、記憶部１４、演奏操作部１５、発音部１８、および通信Ｉ／Ｆ（インターフェイス）１９を含む。これらの各要素は、通信バス１０を介して互いに接続されている。

　制御部１１は、ＣＰＵ１１ａ、ＲＯＭ１１ｂ、ＲＡＭ１１ｃおよびタイマ（図示せず）を含む。ＲＯＭ１１ｂには、ＣＰＵ１１ａにより実行される制御プログラムが格納されている。ＣＰＵ１１ａは、ＲＯＭ１１ｂに格納された制御プログラムをＲＡＭ１１ｃに展開して実行することにより音制御装置１００における各種機能を実現する。ここでいう各種機能は、例えば、音生成処理を実行する機能を含む。音生成機能については後述する。

　制御部１１は、音生成機能によってオーディオ信号を生成するためのＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）を含む。記憶部１４は不揮発性メモリである。記憶部１４は、合成歌唱音を示すオーディオ信号を生成する際に用いる設定情報のほか、合成歌唱音を生成するための音声素片等を記憶する。設定情報は、例えば音色や、取得した歌詞データなどを含む。なお、これらの情報やデータの一部または全部は記憶部１４に記憶されてもよい。

　操作部１２は、各種情報を入力するための複数の操作子を含み、ユーザからの指示を受け付ける。表示部１３は各種情報を表示する。発音部１８は、音源回路、効果回路およびサウンドシステムを含む。

　演奏操作部１５は、演奏信号（演奏情報）を入力する要素として、複数の操作キー１６およびブレスセンサ１７を含む。入力された演奏信号は、音高を示す音高情報と、連続量として検出される音量を示す音量情報とを含み、制御部１１に供給される。音制御装置１００の本体には複数の音孔（不図示）が設けられる。複数の操作キー１６をユーザ（演奏者）が演奏することによって、音孔の開閉状態が変化し、所望する音高が指定される。

　音制御装置１００の本体にはマウスピースが取り付けられており、ブレスセンサ１７はマウスピースの近傍に設けられている。ブレスセンサ１７は、マウスピースを介してユーザが吹き込む息の吹圧を検出する吹圧センサである。ブレスセンサ１７は、息の吹込みの有無を検出し、演奏時においては、吹圧の強さや速さ（勢い）を検出する。ブレスセンサ１７により検出された圧力の変化に応じて音量が指定される。ブレスセンサ１７により検出された時間的に変化する圧力の大きさが、連続量として検出される音量情報として扱われる。

　通信Ｉ／Ｆ１９は、無線または有線により通信ネットワークに接続する。音制御装置１００は例えば、通信Ｉ／Ｆ１９によって、通信ネットワークを介して外部装置２０と通信可能に接続される。通信ネットワークは例えばインターネットであり、外部装置２０はサーバ装置であってもよい。なお、通信ネットワークはＢｌｕｅｔｏｏｔｈ（登録商標）、赤外線通信、ＬＡＮ等を用いた短距離無線通信ネットワークであってもよい。なお、接続される外部装置の数や種類は問わない。通信Ｉ／Ｆ１９は、ＭＩＤＩ（Musical Instrument Digital Interface）信号を送受信するＭＩＤＩＩ／Ｆを含んでもよい。

　外部装置２０は、カラオケを提供するために必要な楽曲データを、曲ＩＤに対応付けて記憶している。この楽曲データには、カラオケの歌唱曲に関連するデータ、例えば、リードボーカルデータ、コーラスデータ、伴奏データ、およびカラオケ用字幕データなどが含まれている。伴奏データは、歌唱曲の伴奏音を示すデータである。これらのリードボーカルデータ、コーラスデータ、および伴奏データは、ＭＩＤＩ形式で表現されたデータであってもよい。カラオケ用字幕データは、表示部１３に歌詞を表示するためのデータである。

　また、外部装置２０は、設定データを、曲ＩＤに対応付けて記憶している。この設定データは、歌唱音の合成を実現するために歌唱曲に応じて音制御装置１００に対して設定されるデータである。設定データには、曲ＩＤに対応する歌唱曲の各パートに対応する歌詞データが含まれている。この歌詞データは、例えば、リードボーカルパートに対応する歌詞データである。楽曲データと設定データとは時間的に対応付けられている。

　この歌詞データは、カラオケ用字幕データと同じであってもよいし、異なっていてもよい。すなわち、歌詞データは、発声すべき歌詞（文字）を規定するデータである点においては同じであるが、音制御装置１００において利用しやすい形式に調整されている。

　例えば、カラオケ用字幕データは、「こ（ｋｏ）」「ん（ｎ）」「に（ｎｉ）」「ち（ｃｈｉ）」「は（ｈａ）」という文字列である。これに対し、歌詞データは、音制御装置１００において利用しやすいように「こ（ｋｏ）」「ん（ｎ）」「に（ｎｉ）」「ち（ｃｈｉ）」「わ（ｗａ）」という実際の発音に合わせた文字列であってもよい。また、この形式としては、例えば、１音で２文字分の歌唱をする場合を識別する情報、フレーズの区切りを識別する情報などを含む場合がある。

　音生成処理にあたって、制御部１１は、ユーザにより指定された楽曲データおよび設定データを、外部装置２０から通信Ｉ／Ｆ１９を介して取得し、記憶部１４に記憶させる。上述のように、楽曲データには伴奏データが含まれ、設定データには歌詞データが含まれる。しかも、伴奏データと歌詞データとは時間的に対応付けられている。

　図２は、記憶部１４に記憶される歌詞データを示す図である。以降、発声すべき歌詞（文字）の各々、つまり音声上の一単位（一まとまりの音のくぎり）を、以下「音節」と表現することもある。図２で説明するように、本実施の形態で用いる歌詞データにおいて、発音する複数の音節が時系列に配置されている。また、音節の各々には、発音の開始時刻および停止時刻からなる設定期間（設定区間）が対応付けられている。

　歌詞データは、発声すべき音節を規定するデータである。歌詞データは、発声すべき複数の音節が時系列に並べられたテキストデータを有する。歌詞データは、所定の時間軸により音節ごとに発声の開始時刻および停止時刻が規定されるタイミングデータを含む。開始時刻および停止時刻は、例えば、楽曲の最初を基準とした時刻として定義される。このタイミングデータは、歌唱曲の進行位置と、その進行位置において発声すべき歌詞とを対応付けている。従って、歌詞データは、発音する複数の音節が時系列に配置され基準時刻からの経過時間に対応する音節が一意に規定されているデータである。

　図２に示すように、歌詞データは、「こ（ｋｏ）」「ん（ｎ）」「に（ｎｉ）」「ち（ｃｈｉ）」「わ（ｗａ）」「ｄｒａ」「ｇｏｎ」「ｎｉｇｈｔ」「ｄｒａ」「ｇｏｎ」・・を示すテキストデータを含む。「こ」「ん」「に」「ち」「わ」「ｄｒａ」「ｇｏｎ」「ｎｉｇｈｔ」「ｄｒａ」「ｇｏｎ」を示す音節には、Ｍ（ｉ）が対応付けられ、「ｉ」（ｉ＝１～ｎ）により歌詞における音節の順序が定められている。例えば、Ｍ（５）は、歌詞のうち５番目の音節に対応する。

　歌詞データは、各音節Ｍ（ｉ）に発声の開始時刻ｔｓ（ｉ）および停止時刻ｔｅ（ｉ）が設定されたタイミングデータを含む。例えば、Ｍ（１）「こ」の場合、発声の開始時刻は時刻ｔｓ（１）であり、停止時刻は時刻ｔｅ（１）である。同様に、Ｍ（ｎ）「る」の場合、発声の開始時刻は時刻ｔｓ（ｎ）であり、停止時刻は時刻ｔｅ（ｎ）である。各音節Ｍ（ｉ）に対応する時刻ｔｓ（ｉ）～時刻ｔｅ（ｉ）の期間を、音節Ｍ（ｉ）の発声の設定期間という。この発声の設定期間は、例えば理想的に歌唱した場合における期間を示している。以下に説明するように、合成歌唱音に含まれる各音節の発声期間は、演奏信号による発声の開始指示および発声の停止指示に基づいて制御される。

　図３は、音生成処理を実現するための音制御装置１００の機能ブロック図である。音制御装置１００は、機能部として、取得部３１、判定部３２、生成部３３、特定部３４、歌唱音合成部３５、および指示部３６を含む。これらの各機能部の機能は、ＣＰＵ１１ａ、ＲＯＭ１１ｂ、ＲＡＭ１１ｃ、タイマおよび通信Ｉ／Ｆ１９等の協働により実現される。なお、生成部３３および歌唱音合成部３５を含むことは必須でない。

　取得部３１は、演奏信号を取得する。判定部３２は、演奏信号における音量と閾値との比較結果と、演奏信号における音高の変化とに基づいて、ノート開始およびノート終了を判定する。生成部３３は、ノート開始およびノート終了の判定に基づいてノートを生成する。特定部３４は、歌詞データから、ノート開始と判定したタイミングに対応する音節を特定する。音節の特定手法については図４～図６で説明する。

　歌唱音合成部３５は、設定データに基づいて、特定された音節を合成して歌唱音を生成する。指示部３６は、特定された音節の歌唱音を、ノート開始に対応する音高およびタイミングで発音開始させるよう指示し、且つ、ノート終了に対応するタイミングで発音終了させるよう指示する。指示部３６による指示に基づいて、音節を合成した歌唱音が、発音部１８（図１）により発音される。

　次に、音生成処理の態様を概説する。ユーザが指定した楽曲に対応する歌詞データおよび伴奏データが記憶部１４に記憶される。ユーザが、操作部１２で演奏開始を指示すると、伴奏データの再生が開始される。その際、歌詞データ（またはカラオケ用字幕データ）における歌詞が、伴奏データの進行に従って表示部１３に表示される。また、リードボーカルデータに応じた主旋律の楽譜も、伴奏データの進行に従って表示部１３に表示される。ユーザは、伴奏データを聞きながら演奏操作部１５で演奏する。演奏の進行に従って取得部３１により演奏信号が取得される。

　判定部３２は、演奏信号における音量が第１の閾値ＴＨ１（図１０のＳ２０２参照）を超えた場合、ノート開始と判定し、ノート開始と判定した後に音量が第２の閾値ＴＨ２（図１０のＳ２０１参照）を下回った場合、ノート終了と判定する。ここでいうノート開始は発声の開始指示に該当し、ノート終了は発声の終了指示に該当する。なお、第１の閾値ＴＨ１は第２の閾値ＴＨ２より高いか、または第２の閾値ＴＨ２と同じである。

　また、判定部３２は、音量が第１の閾値ＴＨ１を超えた状態で、音高が変化した場合、ノート終了と判定し且つノート開始と判定する。つまり、吹圧の一定以上の強さを保った状態で、操作キー１６の指操作によって音高が切り替わった場合、切り替え前の音高のノート終了と、切り替え後の音高のノート開始とが同時刻に判定される。

　そして、ノート開始と判定されたタイミングで、特定された音節が合成され歌唱音として発音され、ノート終了と判定されたタイミングで消音される。従って、ユーザは、伴奏音に合わせて演奏することで、楽曲に合った歌詞を発音させることができる。

　図４～図６は、音節の特定手法を説明する図である。図４～図６には、時間とノートとの関係が示されている。

　制御部１１（特定部３４）は、ノート開始と判定されたタイミングが属する設定期間に対応する音節を、上記ノート開始と判定されたタイミングに対応する音節として特定する。また、制御部１１（特定部３４）は、ノート開始と判定されたタイミングがいずれの設定期間に属さない場合は、上記タイミングに最も近い設定期間に対応する音節を、上記ノート開始と判定されたタイミングに対応する音節として特定する。

　まず、発声の開始指示（ノート開始）を取得したカウント値ｔｃが、発声の設定期間ｔｓ（１）～ｔｅ（１）内である場合について、図４を参照して具体例を説明する。カウント値ｔｃは、後述する音生成処理（図７）で伴奏位置を進行させるためのカウント値である。

　音生成処理における待機状態において、音高「Ｇ４」が対応付けられた発声の開始指示を含む演奏信号を受信したことを想定する。この場合、制御部１１は、音高「Ｇ４」を設定し、且つ、歌詞データを参照して、開始指示を取得したカウント値ｔｃが発声の設定期間に含まれるか否かを判定する。発声の開始指示を取得した時刻が設定期間ｔｓ（１）～ｔｅ（１）内であるため、制御部１１は、開始指示を取得した時刻が文字Ｍ（１）に対応する発声の設定期間内に含まれると判定し、文字Ｍ（１）に該当する文字「こ」を、発声する音節として特定・設定する。

　次に、制御部１１は、設定した音高「Ｇ４」および文字「こ」の発声に基づくオーディオ信号を生成する指示をＤＳＰに出力する。図４において、設定した音高「Ｇ４」および文字「こ」の発声に基づいてオーディオ信号を生成した指示をＤＳＰに出力した時刻を、時刻ｔｏｎ（１）と表記する。制御部１１のＤＳＰは、当該指示に基づいて、オーディオ信号の生成を開始する。

　続いて、音生成処理における待機状態において、音高「Ｇ４」が対応付けられた発声の停止指示（ノート終了）を含む演奏信号を受信したことを想定する。この場合、制御部１１は、音高「Ｇ４」を設定し、且つ、演奏信号が発声の停止指示であると判定する。制御部１１のＤＳＰは、設定した音高「Ｇ４」による発声（文字「こ」）に基づくオーディオ信号の生成を停止する指示を出力する。図４において、設定した音高「Ｇ４」および文字「こ」の発声に基づくオーディオ信号の生成を停止する指示を出力した時刻を、時刻ｔｏｆｆ（１）と表記する。制御部１１のＤＳＰは、当該指示に基づいて、オーディオ信号の生成を停止する。図４において、発声期間ｔｏｎ（１）～ｔｏｆｆ（１）が、音高「Ｇ４」および文字「こ」の発声に基づくオーディオ信号が生成されている期間である。

　次に、発声の開始指示を取得したカウント値ｔｃが、発声の設定期間ｔｓ（１）～ｔｅ（１）と、設定期間ｔｓ（２）～ｔｅ（２）との間の期間であって、設定期間ｔｓ（１）～ｔｅ（１）に近い場合について、図５を参照して説明する。音生成処理における待機状態において、音高「Ｇ４」が対応付けられた発声の開始指示を含む演奏信号を受信したことを想定する。この場合、制御部１１は、音高「Ｇ４」を設定し、且つ、開始指示を取得したときのカウント値ｔｃが発声の設定期間に含まれるか否かを判定する。開始指示を取得した時刻が各文字Ｍ（ｉ）に対応する発声の設定期間のいずれにも含まれないため、制御部１１は、カウント値ｔｃの直前および直後に設定された設定期間から中心時刻ｔｍ（ｉ）を計算する。

　開始指示を取得した時のカウント値ｔｃが設定期間ｔｓ（１）～ｔｅ（１）と設定期間ｔｓ（２）～ｔｅ（２）との間である場合、制御部１１は、停止時刻ｔｅ（１）と、開始時刻ｔｓ（２）との間の中心時刻ｔｍ（１）を計算する。ここでは、ｔｍ（１）＝（ｔｅ（１）＋ｔｓ（２））／２が得られる。次に、制御部１１は、開始指示を取得した時のカウント値ｔｃが中心時刻ｔｍ（１）よりも前であるので、中心時刻ｔｍ（１）よりも前の設定期間の文字「こ」（文字Ｍ（１））を、発音する音節として特定・設定する。発声期間ｔｏｎ（１）～ｔｏｆｆ（１）が、音高「Ｇ４」および文字「こ」の発声に基づくオーディオ信号が生成されている期間である。

　次に、発声の開始指示を取得したカウント値ｔｃが、発声の設定期間ｔｓ（１）～ｔｅ（１）と、設定期間ｔｓ（２）～ｔｅ（２）との間の期間であって、設定期間ｔｓ（２）～ｔｅ（２）に近い場合について、図６を参照して説明する。制御部１１は、開始指示を取得した時刻が中心時刻ｔｍ（１）よりも前ではない場合は、中心時刻ｔｍ（１）よりも後の設定期間の文字「ん」（文字Ｍ（２））を、発音する音節として特定・設定する。期間ｔｏｎ（１）～ｔｏｆｆ（１）が、音高「Ｇ４」および文字「ん」に基づくオーディオ信号が生成されている期間である。

　このように、ノート開始と判定されたタイミングが属する設定期間または上記タイミングに最も近い設定期間に対応する音節が、上記ノート開始と判定されたタイミングに対応する音節として特定される。

　次に、音生成処理について説明する。音生成処理では、演奏操作部１５への演奏操作に基づいて、各音節に対応するオーディオ信号を生成する指示または停止する指示が出力される。

　図７は、音生成処理を示すフローチャートである。この処理は、ＣＰＵ１１ａが、ＲＯＭ１１ｂに格納された制御プログラムをＲＡＭ１１ｃに展開して実行することにより実現される。この処理は、ユーザが楽曲の再生を指示すると開始される。

　制御部１１は、記憶部１４から歌詞データを取得する（ステップＳ１０１）。次に、制御部１１は、初期化処理を実行する（ステップＳ１０２）。この初期化では、カウント値ｔｃ＝０が設定され、且つ、各種レジスタ値やフラグが初期値に設定される。

　次に、制御部１１は、カウント値ｔｃ＝ｔｃ＋１に設定し、カウント値ｔｃをインクリメントする（ステップＳ１０３）。次に、制御部１１は、伴奏データのうち、カウント値ｔｃに対応する部分のデータを読み出す（ステップＳ１０４）。

　制御部１１は、伴奏データの読み出しの終了、ユーザによる楽曲演奏の停止指示の入力、または演奏信号の受信、のいずれかを検出するまでの間（ステップＳ１０５；Ｎｏ，ステップＳ１０６；Ｎｏ，ステップＳ１０７；Ｎｏ）、ステップＳ１０３、Ｓ１０４の処理を繰り返す。この繰り返し状態が待機状態である。上述したように、カウント値ｔｃの初期値は０であり、楽曲の再生開始タイミングに対応する。制御部１１は、カウント値ｔｃをインクリメントすることで、楽曲の再生開始タイミングを基準とした時刻を計測する。

　待機状態において伴奏データを最後まで読み出したことにより伴奏データの読み出しを終了した場合（ステップＳ１０５；Ｙｅｓ）、制御部１１は音生成処理を終了する。待機状態においてユーザによる楽曲演奏の停止指示が入力された場合（ステップＳ１０６；Ｙｅｓ）、制御部１１は音生成処理を終了する。

　待機状態において演奏操作部１５から演奏信号を受信した場合（ステップＳ１０７；Ｙｅｓ）、制御部１１は、ＤＳＰによりオーディオ信号を生成するための指示処理を実行する（ステップＳ１０８）。オーディオ信号を生成するための指示処理の詳細については図１０で後述する。オーディオ信号を生成するための指示処理が終了すると、制御部１１は、ステップＳ１０３に戻り、ステップＳ１０３、Ｓ１０４を繰り返す待機状態となる。

　図８、図９で、演奏により生成されたノートと、各ノートへ割り当てられた音節の例を説明する。図８は、ユーザが指定した楽曲の主旋律の楽譜の一部と、演奏により生成され音節が割り当てられたノートとの関係を示す図である。ここでは、音節が割り当てられたノートを音節ノートＶＮ１～ＶＮ７と呼称する。音符ＳＮ１～ＳＮ９には、歌詞データにおける音節が対応している。図８では、音符ＳＮ１～ＳＮ９に合わせてユーザが忠実に演奏した場合の、理想の音節ノートＶＮ１～ＶＮ７を示している。適切なタイミングで忠実に演奏することは、対応すべき設定期間に対応するタイミングでノート開始となるように演奏することである。

　例えば、音符ＳＮ１、ＳＮ２、ＳＮ３には「ｄｒａ」「ｇｏｎ」「ｎｉｇｈｔ」という音節が対応している。ユーザが、音符ＳＮ１、ＳＮ２、ＳＮ３を、伴奏に合わせて適切なタイミングで演奏したとすると、音節ノートＶＮ１、ＶＮ２、ＶＮ３が発音され、ノートとして生成される。音節ノートＶＮ１、ＶＮ２、ＶＮ３には、それぞれ、音節「ｄｒａ」「ｇｏｎ」「ｎｉｇｈｔ」が割り当てられる。ここで、音符ＳＮ３と音符ＳＮ４とはタイで結ばれているので、これらは１つの音節ノートＶＮ３「ｎｉｇｈｔ」に対応している。

　同様に、ユーザが、音符ＳＮ５～ＳＮ９を、伴奏に合わせて適切なタイミングで演奏したとすると、音節ノートＶＮ４～ＶＮ７が発音され、ノートとして生成される。ここで、音符ＳＮ７と音符ＳＮ８とはタイで結ばれているので、これらは１つの音節ノートＶＮ６「ｎｉｇｈｔ」に対応している。

　なお、音節ノートはリアルタイムで発音される。しかしそれに限らず、生成された音節ノートは音節の情報を含んだ歌唱合成用データとして保存することができる。あるいは、生成された音節ノートは音節データを含まないＭＩＤＩデータに変換して保存することもできる。

　図９は、音節ノートの生成例と対策例を示す図である。事例Ａは、好ましくない例を示し、事例Ｂは事例Ａに対して対策を施した例を示している。事例Ｂは、後述する指示処理（図１０）により実現される。

　事例Ａは、ユーザが音符ＳＮ８の直後に音符ＳＮ９を楽譜通りに演奏したつもりでも、音節ノートＶＮ７１と音節ノートＶＮ７２が発音・生成されてしまった例を示している。なお、設定期間ＴＸには音節「ｎｉｇｈｔ」が対応付けられている。音節ノートＶＮ７１の開始タイミングと音節ノートＶＮ７２の開始タイミングはいずれも、同じ設定期間ＴＸに属している。そのため、音節ノートＶＮ７１には音節「ｎｉｇｈｔ」が割り当てられ、音節ノートＶＮ７２には長音「ー」が割り当てられる。

　本来であれば、音節ノートＶＮ６の後に音節ノートＶＮ７（図８）が発音・生成されるべきである。ところが、事例Ａ（図９）では、音量変化と音高切り替えとのタイミングの関係により、音節ノートＶＮ７１、ＶＮ７２が発音・生成されてしまったのである。

　これは次のような原因による。まず、上述のように、ブレスセンサ１７により、息による圧力変化が音量として検出される。ユーザは、音高を切り替える際に、音の出はじめを明瞭にするためタンギングを行うことがある。ユーザが操作キー１６により音高を切り替える指操作をする際にタンギングが行われたことにより、検出される音量が一時的に低下する場合がある。ここで、タンギング後に音量が再上昇する際に指の切り替えが完了していないと、元の音高のまま新たなノート開始が検出される場合がある。そして新たなノート開始が検出された直後にユーザが音高を切り替えることで、不要な短いノート（音節ノートＶＮ７１）が生成されてしまうことがある。

　このようなケースでは、短い音節ノートＶＮ７１の次の新たなノート（音節ノートＶＮ７２）が、ユーザが本来意図したノートである可能性が高い。このように、従来は、意図した通りのノートが発音されないおそれがあった。すなわち、音節ノートＶＮ７１は本来不要であった（ユーザが意図していない）音節ノートである。そこで、本実施の形態では、制御部１１は、後述する補正条件（Ｓ２０３）が成立したことを条件に、事例Ｂのように対処する。

　なお、音節ノートはリアルタイムで再生されるので、音節ノートＶＮ７（あるいは音節ノートＶＮ７１）の発音・生成が開始された時点では、当該音節ノートの終了タイミングが定まっていない。従って、当該音節ノートが音節ノートＶＮ７となるか音節ノートＶＮ７１となるかは確定していない。そのため、音節「ｎｉｇｈｔ」が全部発音されるか途中まで発音されるかも確定していない。

　事例Ａの場合、結果として音節ノートＶＮ７１は非常に短いため、音節「ｎｉｇｈｔ」の最初の子音「ｎ」が発音されるか、または可聴音に至らない。そのため、実質的には、例えば音節ノートＶＮ７２の長音「ー」だけが聞こえる。

　音節ノートＶＮ７１、ＶＮ７２が補正条件を満たした場合は、制御部１１は、事例Ｂとなるように制御する。ここで、「補正条件」は、今回判定されたノート開始が下記の条件（ａ）（ｂ）を満たすことである。なお、さらに条件（ｃ）を満たすことを補正条件に含めてもよい。
・条件（ａ）：直前のノート開始タイミングから今回のノート開始タイミングまでに、第１の所定時間（例えば、１００ｍｓ）が経過していない
・条件（ｂ）：今回のノート開始に対応する音高が、直前のノート開始に対応する音高とは異なる音高である
・条件（ｃ）：今回のノート開始が、直前のノート開始に対応する設定期間と同じ設定期間に対応している
　これらを図９に示す例に当てはめると次のようになる。直前のノート開始には、音節ノートＶＮ７１の開始（第１のノート開始）が対応する。今回のノート開始には、音節ノートＶＮ７２の開始（第２のノート開始）が対応する。

　制御部１１は、音節ノートＶＮ７１の開始と判定された後、第１の所定時間の経過前に音高が変化したことで音節ノートＶＮ７１の終了（第１のノート終了）および音節ノートＶＮ７２の開始と判定されたことに応じて、次のように処理する。制御部１１は、音節ノートＶＮ７１と同じ音節を、音節ノートＶＮ７２の開始に対応する音高で発音開始するよう指示する。この処理により、事例Ｂにおいては、音節ノートＶＮ７２には、音節ノートＶＮ７１に割り当てられたものと同じ音節「ｎｉｇｈｔ」が割り当てられる。そして、この音節が、音節ノートＶＮ７２の開始に対応する音高で発音開始される。

　ここで、短い（不要な）音節ノートの次の音節ノート（音節ノートＶＮ７２）の再生態様には、第１の再生態様と第２の再生態様の２種類が考えられる。第１の再生態様は、音節ノートＶＮ７２に割り当てられた音節の歌唱音を先頭から発音させる態様である。第２の再生態様は、音節ノートＶＮ７２に割り当てられた音節の歌唱音を途中から発音させる態様である。

　第１の再生態様によれば、「ｎｉｇｈｔ」の発音波形の先頭位置がノート開始タイミングに位置するよう発音開始される。第２の再生態様によれば、「ｎｉｇｈｔ」の発音波形の先頭から少し後の位置が、ノート開始タイミングに位置するよう発音開始される。

　これらいずれの再生態様を採用してもよい。なお、同じ音節の繰り返し発音における不自然さを抑制する観点で、音節ノートＶＮ７1、ＶＮ７２に割り当てられた音節の子音の種類に応じて再生態様を決定してもよい。例えば、子音が「ｎ」等の鼻音の場合は、第１の再生態様を採用し、子音が「ｋ」等の破裂音の場合は第２の再生態様を採用してもよい。

　図９に示す例では、直前の音節ノートＶＮ７１でも同じ音節「ｎｉｇｈｔ」の発音が開始されている。音節ノートＶＮ７１での子音「ｎ」の発音がほとんど聞こえない場合は、第１の再生態様により、音節ノートＶＮ７２を発音波形の先頭から再生することで、自然に聞こえることが期待される。一方、音節の子音が「ｋ」等の破裂音であった場合は、第２の再生態様により、音節ノートＶＮ７２を発音波形の途中から再生することで、自然に聞こえることが期待される。

　図１０は、図７のステップＳ１０８で実行される指示処理を示すフローチャートである。

　まず、ステップＳ２０１では、制御部１１は、取得された演奏信号が示す音量と第２の閾値ＴＨ２とを比較し、ノート終了（発声の終了指示）か否かを判別する。ここでは、音量が第２の閾値ＴＨ２を下回った場合にノート終了と判別される。ノート終了でないと判別された場合は、ステップＳ２０２で、制御部１１は、ノート開始（発声の開始指示）か否かを判別する。ここでは、音量が第１の閾値ＴＨ１を上回った場合にノート開始と判別される。

　ステップＳ２０１で、ノート終了であると判別された場合は、ステップＳ２１０で、制御部１１は、発音中の音節を、今回のノート終了に対応するタイミングで発音終了させるよう指示し、図１０に示す処理を終了する。すなわち制御部１１は、後述するステップＳ２０７またはステップＳ２１４で開始されたオーディオ信号の生成を停止する指示をＤＳＰに出力する。従って、発音されている音は消音される。

　ステップＳ２０２で、ノート開始でないと判別された場合は、制御部１１は、ステップＳ２１１で、その他の処理を実行してから、図１０に示す処理を終了する。ここでのその他の処理では、制御部１１は、例えば、発音中において取得された音量が第２の閾値ＴＨ２を下回らないまま変化した場合に、その変化に対応して発音音量を変更する指示を出力する。

　ステップＳ２０２で、ノート開始であると判別された場合は、制御部１１は、ステップＳ２０３で、補正条件が成立したか否かを判別する。ここでは、上述した条件（ａ）（ｂ）（ｃ）を満たすことで補正条件が成立するとする。そして、補正条件が成立しない場合は、制御部１１は、ステップＳ２０４で、取得された演奏信号が示す音高を設定する。

　ステップＳ２０５では、制御部１１は、直前のノート開始と同一の設定期間における音高切り替えにより今回のノート開始と判定されたか否かを判別する。つまり制御部１１は、今回のノート開始の判定に対応する設定期間が、直前のノート開始の判定に対応する設定期間と同一であるか否かを判別する。そして制御部１１は、両設定期間が同一である場合はステップＳ２０９に進み、両設定期間が同一でない場合はステップＳ２０６に進む。

　ステップＳ２０６では、制御部１１は、図４～図６で説明した手法により、今回のノート開始と判定したタイミングに対応する音節を特定する。ステップＳ２０７では、制御部１１は、特定された音節を、今回のノート開始に対応する音高およびタイミングで発音開始させるよう指示する。すなわち、制御部１１は、設定した音高および特定した音節の発声に基づくオーディオ信号の生成を開始する指示をＤＳＰに出力する。ステップＳ２０７の後、制御部１１は、図１０に示す処理を終了する。

　ステップＳ２０９では、制御部１１は、直前のノート開始の判定に応じて特定された音節の発音を終了することなく変化後の音高で発音を継続するよう指示する。つまり制御部１１は、同じ設定期間内で音高切り替えがあった場合に、発音中の音節の発音を終了することなく変化後の音高で発音を継続させる。例えば、同じ設定期間内で、直前のノート開始に対応して音節「ｎｉｇｈｔ」が特定された場合、音節「ｎｉｇｈｔ」の発音が、切り替え後の音高で継続される。切り替え後の音高に対応する音節ノートには、長音である「－」が割り当てられる。この処理により、同じ設定期間の音節の発音を、音高を切り替えて継続することができる。ステップＳ２０９の後、制御部１１は、図１０に示す処理を終了する。

　ステップＳ２０３で、補正条件が成立した場合は、制御部１１は、ステップＳ２０８で、今回判定されたノート開始で特定された音節に対応する設定期間の長さが第２の所定時間（例えば、２００ｍｓ）を超えているか否かを判別する。そして、制御部１１は、今回判定されたノート開始で特定された音節に対応する設定期間の長さが第２の所定時間超えていない場合は、ステップＳ２１２に進む。

　ステップＳ２１２では、今回判定されたノート開始（第２のノート開始）に対応する音高を設定する。ステップＳ２１３では、制御部１１は、直前のノート開始（第１のノート開始）に対応して特定された音節と同じ音節を、今回判定されたノート開始に対応する音節として特定する。図９に示す例でいえば、制御部１１は、直前の音節ノートＶＮ７１に割り当てられた音節「ｎｉｇｈｔ」と同じ音節を、今回の音節ノートＶＮ７２に割り当てる。ステップＳ２１４では、制御部１１は、今回のノート開始に対して特定された音節を、今回のノート開始に対応する音高で発音開始させるよう指示する。なお、その際、制御部１１は、適用する再生態様（上述した第１、第２の再生態様）も指示する。ステップＳ２１４の後、制御部１１は、図１０に示す処理を終了する。

　ステップＳ２０８での判別の結果、今回判定されたノート開始で特定された音節に対応する設定期間の長さが第２の所定時間超えている場合は、制御部１１は、ステップＳ２０４に進む。従って、ステップＳ２１２～Ｓ２１４は実行されない。これは、ユーザが意図的に短くしたノートを不要ノートと誤判定することを回避するためである。

　つまり、補正条件（Ｓ２０３）が成立する場合であっても、今回判定されたノート開始で特定された音節に対応する設定期間が第２の所定時間を超えていないときは、制御部１１は、今回判定されたノート開始に対応する音高で発音開始するよう指示しない。

　なお、ステップＳ２０８を設けることは必須でなく、ステップＳ２０３でＹｅｓと判別された場合にステップＳ２１２に移行してもよい。また、第１、第２の所定時間の値は例示した値に限定されない。また、これらの値を、再生テンポに応じて変化させてもよい。

　本実施の形態によれば、第２のノート開始が判定されたとき、補正条件が成立したことに応じて、第１のノート開始に対応する音節と同じ音節が、第２のノート開始に対応する音高で発音開始される。すなわち制御部１１は、第１のノート開始と判定された後、第１の所定時間の経過前に音高が変化したことで第１のノート終了および第２のノート開始と判定されたことに応じて、第１のノート開始に対応する音節と同じ音節を、第２のノート開始に対応する音高で発音開始するよう指示する。従って、ユーザ（演奏者）の意図に沿った音節の発音を可能にすることができる。

　また、補正条件が成立した場合であっても、今回の設定期間が第２の所定時間を超えていないときは、第１のノート開始に対応する音節と同じ音節が、第２のノート開始に対応する音高で発音開始されない。従って、意図的に短くしたノートを不要ノートと誤判定することを回避することができる。

　また、短い音節ノートの次の音節ノートの再生に際し、音節の歌唱音を先頭または途中から発音させるので、同じ音節の繰り返し発音における不自然さを抑制することができる。

　また、制御部１１は、音節を合成した歌唱音を発音するに際し、特定された音節を、ノート開始に対応する音高およびタイミングで発音開始させ、ノート終了に対応するタイミングで発音終了させる。従って、リアルタイム歌唱発音を実現できる。しかも、ノート開始と判定されたタイミングが属する設定期間または上記タイミングに最も近い設定期間に対応する音節が、上記ノート開始と判定されたタイミングに対応する音節として特定される。従って、ユーザの意図に沿った音節の発音を可能にすることができる。

　なお、本実施の形態において、音制御装置１００は、連続量として音量を取得できるものであればよく、ブレスセンサ付きの他の管楽器でもよい。あるいは、音制御装置１００は、管楽器型に限らず、鍵盤楽器等の他の形態であってもよい。例えば、本発明を鍵盤楽器に適用する場合は、各鍵にアフタセンサ等の機能を設け、鍵操作に応じて音量が連続的に変化するように構成してもよい。あるいは、ボリュームペダルを接続した電子楽器を用い、ボリュームペダルの操作により音量情報が入力されるようにしてもよい。

　なお、演奏信号（演奏情報）は、外部から通信を介して取得されてもよい。従って、演奏操作部１５を設けることは必須でなく、音制御装置１００は、楽器としての機能および形態を有することは必須でない。

　なお、発音部１８を設けることは必須でない。合成した歌唱音や、発音すべき音の情報を、通信を介して外部へ送信し、発音部１８と同様の機能を備える外部装置で発音させてもよい。また、生成部３３および／または歌唱音合成部３５の機能を、通信Ｉ／Ｆ１９を介して接続された外部装置に持たせてもよい。

　以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。

　なお、本発明を達成するためのソフトウェアによって表される制御プログラムを記憶した記憶媒体を、本装置に読み出すことによって、本発明と同様の効果を奏するようにしてもよく、その場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した、非一過性のコンピュータ読み取り可能な記録媒体は本発明を構成することになる。また、プログラムコードを伝送媒体等を介して供給してもよく、その場合は、プログラムコード自体が本発明を構成することになる。なお、これらの場合の記憶媒体としては、ＲＯＭのほか、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード等を用いることができる。非一過性のコンピュータ読み取り可能な記録媒体としては、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（例えばＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））のように、一定時間プログラムを保持しているものも含む。

１１　制御部
３１　取得部
３２　判定部
３３　生成部
３４　特定部
３５　歌唱音合成部
３６　指示部
１００　音制御装置

Claims

　音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得する取得部と、
　前記演奏情報に基づき、ノート開始およびノート終了を判定する判定部と、
　前記判定部が前記ノート開始と判定したタイミングに対応する音節を、発音する複数の音節が時系列に配置され基準時刻からの経過時間に対応する音節が一意に規定されている歌詞データから特定する特定部と、
　前記判定部により第１のノート開始と判定されたことに応じて特定された音節を、前記第１のノート開始に対応する音高およびタイミングで発音開始させるよう指示し、且つ、第１のノート終了に対応するタイミングで、前記特定された音節の発音を終了させるよう指示する指示部と、を有し、
　前記指示部は、前記第１のノート開始と判定された後、第１の所定時間の経過前に前記演奏情報における音高が変化したことで前記第１のノート終了および第２のノート開始と判定されたことに応じて、前記特定された音節と同じ音節を、前記第２のノート開始に対応する音高で発音開始するよう指示する、音制御装置。
　前記歌詞データにおいて、前記音節の各々には、発音の開始時刻および停止時刻からなる設定区間が対応付けられており、
　前記特定部は、前記ノート開始と判定されたタイミングが属する設定区間または当該タイミングに最も近い設定区間に対応する音節を、当該タイミングに対応する音節として特定し、
　前記指示部は、前記第１のノート開始と判定された後、前記第１の所定時間の経過前に、前記第１のノート終了および前記第２のノート開始と判定された場合であっても、前記特定された音節に対応する前記設定区間が第２の所定時間を超えていないときは、前記特定された音節と同じ音節を、前記第２のノート開始に対応する音高で発音開始するよう指示しない、請求項１に記載の音制御装置。
　前記指示部は、前記特定された音節と同じ音節を、前記第２のノート開始に対応する音高で発音開始するよう指示する際、前記特定された音節と同じ音節の歌唱音を先頭から発音させるよう指示する、請求項１または２に記載の音制御装置。
　前記指示部は、前記特定された音節と同じ音節を、前記第２のノート開始に対応する音高で発音開始するよう指示する際、前記特定された音節と同じ音節の歌唱音を途中から発音させるよう指示する、請求項１または２に記載の音制御装置。
　前記判定部は、前記演奏情報における音量が第１の閾値を超えた場合、前記ノート開始と判定する、請求項１乃至４のいずれか１項に記載の音制御装置。
　前記判定部は、前記ノート開始と判定した後に前記音量が第２の閾値を下回った場合、前記ノート終了と判定する、請求項５に記載の音制御装置。
　前記判定部は、前記音量が前記第１の閾値を超えた状態で、前記音高が変化した場合、前記ノート終了と判定し且つ前記ノート開始と判定する、請求項５または６に記載の音制御装置。
　前記判定部は、前記演奏情報における音量が閾値を超えた状態で前記音高が変化した場合、前記ノート終了と判定し且つ前記ノート開始と判定し、
　前記指示部は、前記ノート終了と判定し且つ前記ノート開始と判定した場合において、今回の前記ノート開始の判定に対応する設定区間が、直前の前記ノート開始の判定に対応する設定区間と同一であるときは、直前の前記ノート開始の判定に応じて特定された音節の発音を終了することなく変化後の音高で発音を継続するよう指示する、請求項２に記載の音制御装置。
　前記指示部による指示に基づいて、音節を合成した歌唱音を発音する発音部をさらに有する、請求項１乃至８のいずれか１項に記載の音制御装置。
　請求項１乃至９のいずれか１項に記載の音制御装置と、
　前記演奏情報をユーザが入力するための演奏操作部と、を有する、電子楽器。
　前記演奏操作部は、圧力変化を検出するブレスセンサを含み、
　前記ブレスセンサにより検出された圧力変化に基づいて前記音量情報が取得される、請求項１０に記載の電子楽器。
　音制御装置の制御方法をコンピュータに実行させるプログラムであって、
　前記音制御装置の制御方法は、
　音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得し、
　前記演奏情報に基づき、ノート開始およびノート終了を判定し、
　前記ノート開始と判定したタイミングに対応する音節を、発音する複数の音節が時系列に配置され基準時刻からの経過時間に対応する音節が一意に規定されている歌詞データから特定し、
　第１のノート開始と判定されたことに応じて特定された音節を、前記ノート開始に対応する音高およびタイミングで発音開始させるよう指示し、且つ、第１のノート終了に対応するタイミングで、前記特定された音節の発音を終了させるよう指示し、
　前記第１のノート開始と判定された後、第１の所定時間の経過前に前記演奏情報における音高が変化したことで前記第１のノート終了および第２のノート開始と判定されたことに応じて、前記特定された音節と同じ音節を、前記第２のノート開始に対応する音高で発音開始するよう指示する、プログラム。
　コンピュータにより実現される音制御装置の制御方法であって、
　音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得し、
　前記演奏情報に基づき、ノート開始およびノート終了を判定し、
　前記ノート開始と判定したタイミングに対応する音節を、発音する複数の音節が時系列に配置され基準時刻からの経過時間に対応する音節が一意に規定されている歌詞データから特定し、
　第１のノート開始と判定されたことに応じて特定された音節を、前記ノート開始に対応する音高およびタイミングで発音開始させるよう指示し、且つ、第１のノート終了に対応するタイミングで、前記特定された音節の発音を終了させるよう指示し、
　前記第１のノート開始と判定された後、第１の所定時間の経過前に前記演奏情報における音高が変化したことで前記第１のノート終了および第２のノート開始と判定されたことに応じて、前記特定された音節と同じ音節を、前記第２のノート開始に対応する音高で発音開始するよう指示する、音制御装置の制御方法。