WO2023058172A1

WO2023058172A1 - 音制御装置およびその制御方法、電子楽器、プログラム

Info

Publication number: WO2023058172A1
Application number: PCT/JP2021/037035
Authority: WO
Inventors: 達也入山
Original assignee: ヤマハ株式会社
Priority date: 2021-10-06
Filing date: 2021-10-06
Publication date: 2023-04-13

Abstract

音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得し、演奏情報における音量と閾値との比較結果と、演奏情報における音高の変化とに基づいて、ノート開始およびノート終了を判定し、音量が所定の態様で変化したと判定した場合は、音量と閾値との比較結果にかかわらず、音量が所定の態様で変化したタイミングで、ノート終了と判定し且つノート開始と判定する、音制御装置を提供する。

Description

音制御装置およびその制御方法、電子楽器、プログラム

　本発明は、音制御装置およびその制御方法、電子楽器、プログラムに関する。

　楽器等の音制御装置においては、演奏操作に応じてノート開始およびノート終了をリアルタイムに判定するものが知られている。例えば、特許文献１、２では、演奏操作に応じてノートを判定し、リアルタイムに合成歌唱音を生成する技術が開示されている。

特開２０１６－２０６４９６号公報特開２０１４－９８８０１号公報

　しかし、電子楽器の種類によっては、演奏操作によって生成された演奏情報に基づきノートを判定する場合、ノート開始やノート終了の判定が必ずしも容易でない。従って、ユーザの意図に沿ってノートの開始および終了を判定することに関して改善の余地があった。

　本発明の目的は、演奏者の意図に沿ったノートの開始および終了を判定することができる音制御装置を提供することである。

　上記目的を達成するために本発明によれば、音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得する取得部と、前記演奏情報における音量と閾値との比較結果と、前記演奏情報における音高の変化とに基づいて、ノート開始およびノート終了を判定する判定部と、を有し、前記判定部は、前記音量が所定の態様で変化したと判定した場合は、前記音量と前記閾値との比較結果にかかわらず、前記音量が前記所定の態様で変化したタイミングで、前記ノート終了と判定し且つ前記ノート開始と判定する、音制御装置が提供される。

　本発明によれば、演奏者の意図に沿ったノートの開始および終了を判定することができる。

音制御装置を含む音制御システムのブロック図である。歌詞データを示す図である。音制御装置の機能ブロック図である。音節の特定手法を説明する図である。音節の特定手法を説明する図である。音節の特定手法を説明する図である。音生成処理を示すフローチャートである。楽譜と、音節が割り当てられたノートとの関係を示す図である。音節ノートの生成例と対策例を示す図である。取得された音量の変化態様の一例を示す図である。指示処理を示すフローチャートである。指示処理を示すフローチャートである。指示処理を示すフローチャートである。

　以下、図面を参照して本発明の実施の形態を説明する。

　（第１の実施の形態）
　図１は、本発明の第１の実施の形態に係る音制御装置を含む音制御システムのブロック図である。音制御システムは、音制御装置１００と、外部装置２０とを含む。音制御装置１００は、一例として電子楽器であり、例えばサクソフォン等の形態をした電子管楽器であってもよい。

　音制御装置１００は、制御部１１、操作部１２、表示部１３、記憶部１４、演奏操作部１５、発音部１８、および通信Ｉ／Ｆ（インターフェイス）１９を含む。これらの各要素は、通信バス１０を介して互いに接続されている。

　制御部１１は、ＣＰＵ１１ａ、ＲＯＭ１１ｂ、ＲＡＭ１１ｃおよびタイマ（図示せず）を含む。ＲＯＭ１１ｂには、ＣＰＵ１１ａにより実行される制御プログラムが格納されている。ＣＰＵ１１ａは、ＲＯＭ１１ｂに格納された制御プログラムをＲＡＭ１１ｃに展開して実行することにより音制御装置１００における各種機能を実現する。ここでいう各種機能は、例えば、音生成処理を実行する機能を含む。音生成機能については後述する。

　制御部１１は、音生成機能によってオーディオ信号を生成するためのＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）を含む。記憶部１４は不揮発性メモリである。記憶部１４は、合成歌唱音を示すオーディオ信号を生成する際に用いる設定情報のほか、合成歌唱音を生成するための音声素片等を記憶する。設定情報は、例えば音色や、取得した歌詞データなどを含む。なお、これらの情報やデータの一部または全部は記憶部１４に記憶されてもよい。

　操作部１２は、各種情報を入力するための複数の操作子を含み、ユーザからの指示を受け付ける。表示部１３は各種情報を表示する。発音部１８は、音源回路、効果回路およびサウンドシステムを含む。

　演奏操作部１５は、演奏信号（演奏情報）を入力する要素として、複数の操作キー１６およびブレスセンサ１７を含む。入力された演奏信号は、音高を示す音高情報と、連続量として検出される音量を示す音量情報とを含み、制御部１１に供給される。音制御装置１００の本体には複数の音孔（不図示）が設けられる。複数の操作キー１６をユーザ（演奏者）が演奏することによって、音孔の開閉状態が変化し、所望する音高が指定される。

　音制御装置１００の本体にはマウスピースが取り付けられており、ブレスセンサ１７はマウスピースの近傍に設けられている。ブレスセンサ１７は、マウスピースを介してユーザが吹き込む息の吹圧を検出する吹圧センサである。ブレスセンサ１７は、息の吹込みの有無を検出し、演奏時においては、吹圧の強さや速さ（勢い）を検出する。ブレスセンサ１７により検出された圧力の変化に応じて音量が指定される。ブレスセンサ１７により検出された時間的に変化する圧力の大きさが、連続量として検出される音量情報として扱われる。

　通信Ｉ／Ｆ１９は、無線または有線により通信ネットワークに接続する。音制御装置１００は例えば、通信Ｉ／Ｆ１９によって、通信ネットワークを介して外部装置２０と通信可能に接続される。通信ネットワークは例えばインターネットであり、外部装置２０はサーバ装置であってもよい。なお、通信ネットワークはＢｌｕｅｔｏｏｔｈ（登録商標）、赤外線通信、ＬＡＮ等を用いた短距離無線通信ネットワークであってもよい。なお、接続される外部装置の数や種類は問わない。通信Ｉ／Ｆ１９は、ＭＩＤＩ（Musical Instrument Digital Interface）信号を送受信するＭＩＤＩＩ／Ｆを含んでもよい。

　外部装置２０は、カラオケを提供するために必要な楽曲データを、曲ＩＤに対応付けて記憶している。この楽曲データには、カラオケの歌唱曲に関連するデータ、例えば、リードボーカルデータ、コーラスデータ、伴奏データ、およびカラオケ用字幕データなどが含まれている。伴奏データは、歌唱曲の伴奏音を示すデータである。これらのリードボーカルデータ、コーラスデータ、および伴奏データは、ＭＩＤＩ形式で表現されたデータであってもよい。カラオケ用字幕データは、表示部１３に歌詞を表示するためのデータである。

　また、外部装置２０は、設定データを、曲ＩＤに対応付けて記憶している。この設定データは、歌唱音の合成を実現するために歌唱曲に応じて音制御装置１００に対して設定されるデータである。設定データには、曲ＩＤに対応する歌唱曲の各パートに対応する歌詞データが含まれている。この歌詞データは、例えば、リードボーカルパートに対応する歌詞データである。楽曲データと設定データとは時間的に対応付けられている。

　この歌詞データは、カラオケ用字幕データと同じであってもよいし、異なっていてもよい。すなわち、歌詞データは、発声すべき歌詞（文字）を規定するデータである点においては同じであるが、音制御装置１００において利用しやすい形式に調整されている。

　例えば、カラオケ用字幕データは、「こ（ｋｏ）」「ん（ｎ）」「に（ｎｉ）」「ち（ｃｈｉ）」「は（ｈａ）」という文字列である。これに対し、歌詞データは、音制御装置１００において利用しやすいように「こ（ｋｏ）」「ん（ｎ）」「に（ｎｉ）」「ち（ｃｈｉ）」「わ（ｗａ）」という実際の発音に合わせた文字列であってもよい。また、この形式としては、例えば、１音で２文字分の歌唱をする場合を識別する情報、フレーズの区切りを識別する情報などを含む場合がある。

　音生成処理にあたって、制御部１１は、ユーザにより指定された楽曲データおよび設定データを、外部装置２０から通信Ｉ／Ｆ１９を介して取得し、記憶部１４に記憶させる。上述のように、楽曲データには伴奏データが含まれ、設定データには歌詞データが含まれる。しかも、伴奏データと歌詞データとは時間的に対応付けられている。

　図２は、記憶部１４に記憶される歌詞データを示す図である。以降、発声すべき歌詞（文字）の各々、つまり音声上の一単位（一まとまりの音のくぎり）を、以下「音節」と表現することもある。図２で説明するように、本実施の形態で用いる歌詞データにおいて、発音する複数の音節が時系列に配置されている。また、音節の各々には、発音の開始時刻および停止時刻からなる設定期間（設定区間）が対応付けられている。

　歌詞データは、発声すべき音節を規定するデータである。歌詞データは、発声すべき複数の音節が時系列に並べられたテキストデータを有する。歌詞データは、所定の時間軸により音節ごとに発声の開始時刻および停止時刻が規定されるタイミングデータを含む。開始時刻および停止時刻は、例えば、楽曲の最初を基準とした時刻として定義される。このタイミングデータは、歌唱曲の進行位置と、その進行位置において発声すべき歌詞とを対応付けている。従って、歌詞データは、発音する複数の音節が時系列に配置され基準時刻からの経過時間に対応する音節が一意に規定されているデータである。

　図２に示すように、歌詞データは、「こ（ｋｏ）」「ん（ｎ）」「に（ｎｉ）」「ち（ｃｈｉ）」「わ（ｗａ）」「ｄｒａ」「ｇｏｎ」「ｎｉｇｈｔ」「ｄｒａ」「ｇｏｎ」・・を示すテキストデータを含む。「こ」「ん」「に」「ち」「わ」「ｄｒａ」「ｇｏｎ」「ｎｉｇｈｔ」「ｄｒａ」「ｇｏｎ」を示す音節には、Ｍ（ｉ）が対応付けられ、「ｉ」（ｉ＝１～ｎ）により歌詞における音節の順序が定められている。例えば、Ｍ（５）は、歌詞のうち５番目の音節に対応する。

　歌詞データは、各音節Ｍ（ｉ）に発声の開始時刻ｔｓ（ｉ）および停止時刻ｔｅ（ｉ）が設定されたタイミングデータを含む。例えば、Ｍ（１）「こ」の場合、発声の開始時刻は時刻ｔｓ（１）であり、停止時刻は時刻ｔｅ（１）である。同様に、Ｍ（ｎ）「る」の場合、発声の開始時刻は時刻ｔｓ（ｎ）であり、停止時刻は時刻ｔｅ（ｎ）である。各音節Ｍ（ｉ）に対応する時刻ｔｓ（ｉ）～時刻ｔｅ（ｉ）の期間を、音節Ｍ（ｉ）の発声の設定期間という。この発声の設定期間は、例えば理想的に歌唱した場合における期間を示している。以下に説明するように、合成歌唱音に含まれる各音節の発声期間は、演奏信号による発声の開始指示および発声の停止指示に基づいて制御される。

　図３は、音生成処理を実現するための音制御装置１００の機能ブロック図である。音制御装置１００は、機能部として、取得部３１、判定部３２、生成部３３、特定部３４、歌唱音合成部３５、および指示部３６を含む。これらの各機能部の機能は、ＣＰＵ１１ａ、ＲＯＭ１１ｂ、ＲＡＭ１１ｃ、タイマおよび通信Ｉ／Ｆ１９等の協働により実現される。なお、生成部３３、特定部３４、歌唱音合成部３５および指示部３６を含むことは必須でない。

　取得部３１は、演奏信号を取得する。判定部３２は、演奏信号における音量と閾値との比較結果と、演奏信号における音高の変化とに基づいて、ノート開始およびノート終了を判定する。生成部３３は、ノート開始およびノート終了の判定に基づいてノートを生成する。特定部３４は、歌詞データから、ノート開始と判定したタイミングに対応する音節を特定する。音節の特定手法については図４～図６で説明する。

　歌唱音合成部３５は、設定データに基づいて、特定された音節を合成して歌唱音を生成する。指示部３６は、特定された音節の歌唱音を、ノート開始に対応する音高およびタイミングで発音開始させるよう指示し、且つ、ノート終了に対応するタイミングで発音終了させるよう指示する。指示部３６による指示に基づいて、音節を合成した歌唱音が、発音部１８（図１）により発音される。

　次に、音生成処理の態様を概説する。ユーザが指定した楽曲に対応する歌詞データおよび伴奏データが記憶部１４に記憶される。ユーザが、操作部１２で演奏開始を指示すると、伴奏データの再生が開始される。その際、歌詞データ（またはカラオケ用字幕データ）における歌詞が、伴奏データの進行に従って表示部１３に表示される。また、リードボーカルデータに応じた主旋律の楽譜も、伴奏データの進行に従って表示部１３に表示される。ユーザは、伴奏データを聞きながら演奏操作部１５で演奏する。演奏の進行に従って取得部３１により演奏信号が取得される。

　判定部３２は、演奏信号における音量が第１の閾値ＴＨ１（図１０参照）を超えた場合、ノート開始と判定し、ノート開始と判定した後に音量が第２の閾値ＴＨ２（図１０参照）を下回った場合、ノート終了と判定する。ここでいうノート開始は発声の開始指示に該当し、ノート終了は発声の終了指示に該当する。なお、第１の閾値ＴＨ１は第２の閾値ＴＨ２より高いか、または第２の閾値ＴＨ２と同じである。

　また、判定部３２は、音量が第１の閾値ＴＨ１を超えた状態で、音高が変化した場合、ノート終了と判定し且つノート開始と判定する。つまり、吹圧の一定以上の強さを保った状態で、操作キー１６の指操作によって音高が切り替わった場合、切り替え前の音高のノート終了と、切り替え後の音高のノート開始とが同時刻に判定される。

　そして、ノート開始と判定されたタイミングで、特定された音節が合成され歌唱音として発音され、ノート終了と判定されたタイミングで消音される。従って、ユーザは、伴奏音に合わせて演奏することで、楽曲に合った歌詞を発音させることができる。

　図４～図６は、音節の特定手法を説明する図である。図４～図６には、時間とノートとの関係が示されている。

　制御部１１（特定部３４）は、ノート開始と判定されたタイミングが属する設定期間に対応する音節を、上記ノート開始と判定されたタイミングに対応する音節として特定する。また、制御部１１（特定部３４）は、ノート開始と判定されたタイミングがいずれの設定期間に属さない場合は、上記タイミングに最も近い設定期間に対応する音節を、上記ノート開始と判定されたタイミングに対応する音節として特定する。

　まず、発声の開始指示（ノート開始）を取得したカウント値ｔｃが、発声の設定期間ｔｓ（１）～ｔｅ（１）内である場合について、図４を参照して具体例を説明する。カウント値ｔｃは、後述する音生成処理（図７）で伴奏位置を進行させるためのカウント値である。

　音生成処理における待機状態において、音高「Ｇ４」が対応付けられた発声の開始指示を含む演奏信号を受信したことを想定する。この場合、制御部１１は、音高「Ｇ４」を設定し、且つ、歌詞データを参照して、開始指示を取得したカウント値ｔｃが発声の設定期間に含まれるか否かを判定する。発声の開始指示を取得した時刻が設定期間ｔｓ（１）～ｔｅ（１）内であるため、制御部１１は、開始指示を取得した時刻が文字Ｍ（１）に対応する発声の設定期間内に含まれると判定し、文字Ｍ（１）に該当する文字「こ」を、発声する音節として特定・設定する。

　次に、制御部１１は、設定した音高「Ｇ４」および文字「こ」の発声に基づくオーディオ信号を生成する指示をＤＳＰに出力する。図４において、設定した音高「Ｇ４」および文字「こ」の発声に基づいてオーディオ信号を生成した指示をＤＳＰに出力した時刻を、時刻ｔｏｎ（１）と表記する。制御部１１のＤＳＰは、当該指示に基づいて、オーディオ信号の生成を開始する。

　続いて、音生成処理における待機状態において、音高「Ｇ４」が対応付けられた発声の停止指示（ノート終了）を含む演奏信号を受信したことを想定する。この場合、制御部１１は、音高「Ｇ４」を設定し、且つ、演奏信号が発声の停止指示であると判定する。制御部１１のＤＳＰは、設定した音高「Ｇ４」による発声（文字「こ」）に基づくオーディオ信号の生成を停止する指示を出力する。図４において、設定した音高「Ｇ４」および文字「こ」の発声に基づくオーディオ信号の生成を停止する指示を出力した時刻を、時刻ｔｏｆｆ（１）と表記する。制御部１１のＤＳＰは、当該指示に基づいて、オーディオ信号の生成を停止する。図４において、発声期間ｔｏｎ（１）～ｔｏｆｆ（１）が、音高「Ｇ４」および文字「こ」の発声に基づくオーディオ信号が生成されている期間である。

　次に、発声の開始指示を取得したカウント値ｔｃが、発声の設定期間ｔｓ（１）～ｔｅ（１）と、設定期間ｔｓ（２）～ｔｅ（２）との間の期間であって、設定期間ｔｓ（１）～ｔｅ（１）に近い場合について、図５を参照して説明する。音生成処理における待機状態において、音高「Ｇ４」が対応付けられた発声の開始指示を含む演奏信号を受信したことを想定する。この場合、制御部１１は、音高「Ｇ４」を設定し、且つ、開始指示を取得したときのカウント値ｔｃが発声の設定期間に含まれるか否かを判定する。開始指示を取得した時刻が各文字Ｍ（ｉ）に対応する発声の設定期間のいずれにも含まれないため、制御部１１は、カウント値ｔｃの直前および直後に設定された設定期間から中心時刻ｔｍ（ｉ）を計算する。

　開始指示を取得した時のカウント値ｔｃが設定期間ｔｓ（１）～ｔｅ（１）と設定期間ｔｓ（２）～ｔｅ（２）との間である場合、制御部１１は、停止時刻ｔｅ（１）と、開始時刻ｔｓ（２）との間の中心時刻ｔｍ（１）を計算する。ここでは、ｔｍ（１）＝（ｔｅ（１）＋ｔｓ（２））／２が得られる。次に、制御部１１は、開始指示を取得した時のカウント値ｔｃが中心時刻ｔｍ（１）よりも前であるので、中心時刻ｔｍ（１）よりも前の設定期間の文字「こ」（文字Ｍ（１））を、発音する音節として特定・設定する。発声期間ｔｏｎ（１）～ｔｏｆｆ（１）が、音高「Ｇ４」および文字「こ」の発声に基づくオーディオ信号が生成されている期間である。

　次に、発声の開始指示を取得したカウント値ｔｃが、発声の設定期間ｔｓ（１）～ｔｅ（１）と、設定期間ｔｓ（２）～ｔｅ（２）との間の期間であって、設定期間ｔｓ（２）～ｔｅ（２）に近い場合について、図６を参照して説明する。制御部１１は、開始指示を取得した時刻が中心時刻ｔｍ（１）よりも前ではない場合は、中心時刻ｔｍ（１）よりも後の設定期間の文字「ん」（文字Ｍ（２））を、発音する音節として特定・設定する。期間ｔｏｎ（１）～ｔｏｆｆ（１）が、音高「Ｇ４」および文字「ん」に基づくオーディオ信号が生成されている期間である。

　このように、ノート開始と判定されたタイミングが属する設定期間または上記タイミングに最も近い設定期間に対応する音節が、上記ノート開始と判定されたタイミングに対応する音節として特定される。

　次に、音生成処理について説明する。音生成処理では、演奏操作部１５への演奏操作に基づいて、各音節に対応するオーディオ信号を生成する指示または停止する指示が出力される。

　図７は、音生成処理を示すフローチャートである。この処理は、ＣＰＵ１１ａが、ＲＯＭ１１ｂに格納された制御プログラムをＲＡＭ１１ｃに展開して実行することにより実現される。この処理は、ユーザが楽曲の再生を指示すると開始される。

　制御部１１は、記憶部１４から歌詞データを取得する（ステップＳ１０１）。次に、制御部１１は、初期化処理を実行する（ステップＳ１０２）。この初期化では、カウント値ｔｃ＝０が設定され、且つ、各種レジスタ値やフラグが初期値に設定される。

　次に、制御部１１は、カウント値ｔｃ＝ｔｃ＋１に設定し、カウント値ｔｃをインクリメントする（ステップＳ１０３）。次に、制御部１１は、伴奏データのうち、カウント値ｔｃに対応する部分のデータを読み出す（ステップＳ１０４）。

　制御部１１は、伴奏データの読み出しの終了、ユーザによる楽曲演奏の停止指示の入力、または演奏信号の受信、のいずれかを検出するまでの間（ステップＳ１０５；Ｎｏ，ステップＳ１０６；Ｎｏ，ステップＳ１０７；Ｎｏ）、ステップＳ１０３、Ｓ１０４の処理を繰り返す。この繰り返し状態が待機状態である。上述したように、カウント値ｔｃの初期値は０であり、楽曲の再生開始タイミングに対応する。制御部１１は、カウント値ｔｃをインクリメントすることで、楽曲の再生開始タイミングを基準とした時刻を計測する。

　待機状態において伴奏データを最後まで読み出したことにより伴奏データの読み出しを終了した場合（ステップＳ１０５；Ｙｅｓ）、制御部１１は音生成処理を終了する。待機状態においてユーザによる楽曲演奏の停止指示が入力された場合（ステップＳ１０６；Ｙｅｓ）、制御部１１は音生成処理を終了する。

　待機状態において演奏操作部１５から演奏信号を受信した場合（ステップＳ１０７；Ｙｅｓ）、制御部１１は、ＤＳＰによりオーディオ信号を生成するための指示処理を実行する（ステップＳ１０８）。オーディオ信号を生成するための指示処理の詳細については図１１で後述する。オーディオ信号を生成するための指示処理が終了すると、制御部１１は、ステップＳ１０３に戻り、ステップＳ１０３、Ｓ１０４を繰り返す待機状態となる。

　図８、図９で、演奏により生成されたノートと、各ノートへ割り当てられた音節の例を説明する。図８は、ユーザが指定した楽曲の主旋律の楽譜の一部と、演奏により生成され音節が割り当てられたノートとの関係を示す図である。ここでは、音節が割り当てられたノートを音節ノートＶＮ１～ＶＮ７と呼称する。音符ＳＮ１～ＳＮ９には、歌詞データにおける音節が対応している。図８では、音符ＳＮ１～ＳＮ９に合わせてユーザが忠実に演奏した場合の、理想の音節ノートＶＮ１～ＶＮ７を示している。適切なタイミングで忠実に演奏することは、対応すべき設定期間に対応するタイミングでノート開始となるように演奏することである。

　例えば、音符ＳＮ１、ＳＮ２、ＳＮ３には「ｄｒａ」「ｇｏｎ」「ｎｉｇｈｔ」という音節が対応している。ユーザが、音符ＳＮ１、ＳＮ２、ＳＮ３を、伴奏に合わせて適切なタイミングで演奏したとすると、音節ノートＶＮ１、ＶＮ２、ＶＮ３が発音され、ノートとして生成される。音節ノートＶＮ１、ＶＮ２、ＶＮ３には、それぞれ、音節「ｄｒａ」「ｇｏｎ」「ｎｉｇｈｔ」が割り当てられる。ここで、音符ＳＮ３と音符ＳＮ４とはタイで結ばれているので、これらは１つの音節ノートＶＮ３「ｎｉｇｈｔ」に対応している。

　同様に、ユーザが、音符ＳＮ５～ＳＮ９を、伴奏に合わせて適切なタイミングで演奏したとすると、音節ノートＶＮ４～ＶＮ７が発音され、ノートとして生成される。ここで、音符ＳＮ７と音符ＳＮ８とはタイで結ばれているので、これらは１つの音節ノートＶＮ６「ｎｉｇｈｔ」に対応している。

　なお、音節ノートはリアルタイムで発音される。しかしそれに限らず、生成された音節ノートは音節の情報を含んだ歌唱合成用データとして保存することができる。あるいは、生成された音節ノートは音節データを含まないＭＩＤＩデータに変換して保存することもできる。

　図９は、音節ノートの生成例と対策例を示す図である。事例Ａは、好ましくない例を示し、事例Ｂは事例Ａに対して対策を施した例を示している。事例Ｂは、後述する指示処理（図１１）により実現される。

　事例Ａは、ユーザが音符ＳＮ２、ＳＮ３を連続して演奏したつもりでも、１つの長い音節ノートＶＮ１０１が発音・生成された例を示している。本来であれば２つの音節ノートＶＮ２、ＶＮ３が発音・生成されるべきである。しかし、音符ＳＮ２、ＳＮ３間で検出された音量が十分に低下していないために、音節ノートが区切られなかったのである。

　このような事象は、１６分音符である音符ＳＮ２の次に同じ音高の音符ＳＮ３が続く場合のように、連続する同音音符における前側の音符の音価が短い場合に生じやすい。このような事象が発生する例を図１０で説明する。

　図１０は、取得された音量の変化態様の一例を示す図である。ＣＣ１１は、音量の変化（エクスプレッション）を示すコントロールチェンジである。

　音量が第１の閾値ＴＨ１を超えてノート開始と判定された後、音量が第２の閾値ＴＨ２を下回らないまま図１０に示すような所定の態様で変化すると、ノート終了と判定されない。例えば、ユーザが音符ＳＮ２を演奏して音節ノートＶＮ１０１の発音が開始された後、吹圧を一旦下げてから音符ＳＮ３を演奏したつもりでも、音量が第２の閾値ＴＨ２を下回らなかったとする。すると、事例Ａに示すように、音節ノートＶＮ１０１に「ｇｏｎ」が割り当てられ、次の音節である「ｎｉｇｈｔ」が割り当てられない。

　本実施の形態では、このような場合、事例Ｂに示すように、制御部１１は、音節ノートＶＮ１０１に仮想ノート区切りを挿入（配置）することで、音節ノートＶＮ１０２と音節ノートＶＮ１０３の２つの音節ノートに分離する。なお、図では表現されていないが、音節ノートＶＮ１０２の終了タイミングと音節ノートＶＮ１０３開始タイミングとは同時である。すなわち、制御部１１は、音量が上記所定の態様で変化したと判定した場合は、音量と閾値（閾値ＴＨ１、ＴＨ２）との比較結果にかかわらず、音量が所定の態様で変化したタイミングで、ノート終了と判定し且つノート開始と判定する。つまり、制御部１１は、ノート終了とノート開始とを同時に判定することで、実質的に、仮想ノート区切りを挿入する。

　ユーザによる意図的な連続と意図的な区切りとを区別するために、図１０に示す所定の態様は次のように定義され、その情報がＲＯＭ１１ｂに格納されている。所定の態様に該当すれば、ユーザが意図的にノートを区切ろうとしていると判断できる。

　上記所定の態様は、音量が、第１の所定時間ｄｕｒ２内で第１の所定速度より速い速度で降下した後、降下開始から第２の所定時間ｄｕｒ２３が経過する前に、第２の所定速度より速い速度で且つ第３の所定時間ｄｕｒ３を超えて継続して上昇を続けることである。

　ここで、第１の所定時間ｄｕｒ２は、降下開始時点Ｔ１から降下終了時点Ｔ２までの時間であり、例えば２０～１００ｍｓの範囲の値である。第２の所定時間ｄｕｒ２３は、降下開始時点Ｔ１から上昇終了時点Ｔ４までの時間であり、例えば２００ｍｓである。第３の所定時間ｄｕｒ３は、上昇開始時点Ｔ３から上昇終了時点Ｔ４までの時間であり、例えば１０ｍｓである。第１の所定速度および第２の所定速度は、例えば、０．５ＣＣ／ｍｓである。第１の所定速度と第２の所定速度とは同じ値でなくてもよい。なお、これらの値は例示したものに限定されない。また、これらの値を、再生テンポに応じて変化させてもよい。なお、上記所定の態様を満たす場合の最低音量ＣＣｘは、通常、第１の閾値ＴＨ１より高い。

　図１１は、図７のステップＳ１０８で実行される指示処理を示すフローチャートである。

　まず、ステップＳ２０１では、制御部１１は、取得された演奏信号が示す音量と第２の閾値ＴＨ２とを比較し、ノート終了（発声の終了指示）か否かを判別する。ここでは、音量が第２の閾値ＴＨ２を下回った場合にノート終了と判別される。ノート終了でないと判別された場合は、ステップＳ２０２で、制御部１１は、ノート開始（発声の開始指示）か否かを判別する。ここでは、音量が第１の閾値ＴＨ１を上回った場合にノート開始と判別される。

　ステップＳ２０１で、ノート終了であると判別された場合は、ステップＳ２１０で、制御部１１は、発音中の音節を、今回のノート終了に対応するタイミングで発音終了させるよう指示し、図１１に示す処理を終了する。すなわち制御部１１は、後述するステップＳ２０６またはステップＳ２０９で開始されたオーディオ信号の生成を停止する指示をＤＳＰに出力する。従って、発音されている音は消音される。

　ステップＳ２０２で、ノート開始でないと判別された場合は、制御部１１は、ステップＳ２１１で、その他の処理を実行してから、ステップＳ２０７に進む。ここでのその他の処理では、制御部１１は、例えば、発音中において取得された音量が第２の閾値ＴＨ２を下回らないまま変化した場合に、その変化に対応して発音音量を変更する指示を出力する。

　ステップＳ２０２で、ノート開始であると判別された場合は、制御部１１は、ステップＳ２０３で、取得された演奏信号が示す音高を設定する。ステップＳ２０４では、制御部１１は、その他の処理を実行する。ここでのその他の処理では、制御部１１は、例えば、同じ設定期間内で音高切り替えがあった場合に、発音中の音節の発音を終了することなく変化後の音高で発音を継続する処理等を実行する。例えば、音節「ｎｉｇｈｔ」の発音が、切り替え後の音高で継続される。切り替え後の音高に対応する音節ノートには、長音である「－」が割り当てられる。

　ステップＳ２０５では、制御部１１は、図４～図６で説明した手法により、今回のノート開始と判定したタイミングに対応する音節を特定する。ステップＳ２０６では、制御部１１は、特定された音節を、今回のノート開始に対応する音高およびタイミングで発音開始させるよう指示する。すなわち、制御部１１は、設定した音高および特定した音節の発声に基づくオーディオ信号の生成を開始する指示をＤＳＰに出力する。

　ステップＳ２０７では、制御部１１は、演奏信号が示す音量が上記所定の態様（図１０）で変化したか否かを判別する。そして、音量が上記所定の態様で変化したと判別した場合、さらに制御部１１は、今回のノート開始と判定されたタイミングが属する設定期間と、音量が上記所定の態様で変化したと判定したタイミングが属する設定期間とが異なるか否かを判別する。そして、制御部１１は、音量が上記所定の態様で変化し、且つ、上記２つの設定期間が互いに異なるという条件を満たした場合は、ステップＳ２０８に進み、これらの条件を満たさない場合は、図１１に示す処理を終了する。

　ステップＳ２０８では、制御部１１は、今回特定された音節を、今回のノート終了に対応するタイミングで発音終了させるよう指示する。ステップＳ２０９では、制御部１１は、次の音節を、直前に発音（直前のＳ２０６で発音開始）していた音高と同じ音高で発音開始するよう指示する。従って、ステップＳ２０８、Ｓ２０９により、音量と閾値との比較結果にかかわらず、音量が所定の態様で変化したタイミングで、ノート終了と判定し且つノート開始と判定され、仮想ノート区切りが挿入される（事例Ｂ）。

　従って、ノート開始と判定されたタイミングが属する設定期間と、音量が所定の態様で変化したと判定したタイミングが属する設定期間とが異なることを条件として、音量が所定の態様で変化したタイミングで、ノート終了と判定し且つノート開始と判定される。言い換えると、同じ設定期間内で音量が所定の態様で変化しても、仮想ノート区切りは挿入されない。従って、区切る必要のない箇所で区切られることを抑止することができる。ステップＳ２０９の後、制御部１１は、図１１に示す処理を終了する。

　本実施の形態によれば、制御部１１は、取得された演奏信号における音量と閾値との比較結果と、演奏信号における音高の変化とに基づいて、ノート開始およびノート終了を判定する（Ｓ２０１、Ｓ２０２）。制御部１１は、音量が所定の態様（図１０）で変化したと判定した場合は、音量と閾値との比較結果にかかわらず、音量が所定の態様で変化したタイミングで、ノート終了と判定し且つノート開始と判定する。従って、ユーザの意図に沿ったノートの開始および終了を判定することができる。

　特に、所定の態様を図１０に示すように設定したことで、ユーザによる意図的な連続と意図的な区切りとを区別し、ノートの開始および終了を適切に判定することができる。

　また、ノート開始およびノート終了の判定に基づいてノートが生成されるので、ユーザの意図に沿ったノートを生成することができる。

　また、制御部１１は、音節を合成した歌唱音を発音するに際し、特定された音節を、ノート開始に対応する音高およびタイミングで発音開始させ、ノート終了に対応するタイミングで発音終了させる。従って、リアルタイム歌唱発音を実現できる。しかも、ノート開始と判定されたタイミングが属する設定期間または上記タイミングに最も近い設定期間に対応する音節が、上記ノート開始と判定されたタイミングに対応する音節として特定される。従って、ユーザの意図に沿った音節の発音を可能にすることができる。

　（第２の実施の形態）
　本発明の第２の実施の形態では、歌詞データ（図２）において、文字Ｍ（ｉ）＝Ｍ（１）～Ｍ（ｎ）を順番に発声するものとする。従って、音生成処理（図７）において、歌詞データにおける発声の設定期間が規定されたタイミングデータは無視してもよい。あるいは歌詞データにおいて上記タイミングデータが廃止されてもよい。

　上記第１の実施の形態では、歌詞データにおいて、発音する複数の音節が時系列に配置され、音節の各々には、発音の開始時刻および停止時刻からなる設定期間が対応付けられていた。そして、図４～図６に示す音節の特定手法が採用された。従って、演奏のタイミングが本来の設定期間からずれても、演奏したタイミングが属する（またはそれに近い）設定期間に対応する音節が特定・発音された。これに対し、本実施の形態では、演奏進行に応じて音節が順番に特定される。

　本実施の形態では、図７のステップＳ１０８で実行される指示処理には、図１１に代えて図１２に示す処理が適用される。図１２は、図７のステップＳ１０８で実行される指示処理を示すフローチャートである。図１２において図１１と同じ処理ステップには同じステップ番号が付されている。ステップＳ２０４は廃止されている。

　本実施の形態では、図７のステップＳ１０２での初期化処理で、制御部１１は、第１の実施の形態での処理に加えて、Ｍ（ｉ）における文字カウント値ｉ＝１（文字Ｍ（ｉ）＝Ｍ（１））を設定し、ｔｓ＝０を設定する。「ｉ」は、上述したように、歌詞における音節の発声順序を示している。ｔｓは、直前の発声の開始指示を取得した時刻である。従って、制御部１１は、「ｉ」をインクリメントすることで、歌詞を構成する音節のうち、Ｍ（ｉ）が示す音節を１つずつ進めていく。図７におけるその他の処理ステップは第１の実施の形態で説明した通りである。

　図１２のステップＳ２０１～Ｓ２０３、Ｓ２１０、Ｓ２１１の処理は第１の実施の形態で説明した通りである。ステップＳ２０５では、制御部１１は、文字Ｍ（ｉ）が示す音節を今回の音節として特定する。従って、音節は、歌詞データにおいて配置された順番で特定される。ステップＳ２０６では、制御部１１は、特定された音節を、今回のノート開始に対応する音高およびタイミングで発音開始させるよう指示する。

　ステップＳ２０７では、制御部１１は、演奏信号が示す音量が上記所定の態様（図１０）で変化したか否かを判別する。ここで、設定期間を考慮しない点が第１の実施の形態と異なる。制御部１１は、音量が上記所定の態様で変化した場合は、ステップＳ２０８に進み、上記所定の態様で変化しない場合は、図１２に示す処理を終了する。

　ステップＳ２０８では、制御部１１は、今回特定された第１の音節（直前のＳ２０６で発音開始された音節）の発音終了を指示する。ステップＳ２０９では、制御部１１は、第１の音節の次の第２の音節を、第１の音節を発音（直前のＳ２０６で発音開始）した音高と同じ音高で発音開始するよう指示する。第２の音節は、歌詞データにおける順番でいうある音節（第１の音節）の次の音節である。この処理により、音高の変化態様からユーザの意図を判断して仮想ノート区切りが挿入される。従って、ユーザの意図に沿った音節の発音を可能にすることができる。ステップＳ２０９の後、制御部１１は、図１２に示す処理を終了する。

　本実施の形態によれば、音量が所定の態様で変化したタイミングで、ノート終了と判定し且つノート開始と判定される。従って、ユーザの意図に沿ったノートの開始および終了を判定することに関し、第１の実施の形態と同様の効果を奏することができる。

　また、演奏進行に応じて音節が順番に特定され、発音されるので、ユーザの意図に沿った音節の発音を可能にすることができる。

　（第３の実施の形態）
　本発明の第３の実施の形態では、音節の特定・発音をすることなく、演奏に進行に応じて演奏音（例えば、管楽器の音）を発音する。従って、歌詞データ（図２）は必須でない。また、伴奏データを含む楽曲データも必須でない。

　本実施の形態では、図７のステップＳ１０８で実行される指示処理には、図１１に代えて図１３に示す処理が適用される。図１３は、図７のステップＳ１０８で実行される指示処理を示すフローチャートである。図１３において図１１と同じ処理ステップには同じステップ番号が付されている。ステップＳ２０４、Ｓ２０５は廃止されている。

　図１２のステップＳ２０１～Ｓ２０３、Ｓ２１１の処理は第１の実施の形態で説明した通りである。ステップＳ２０６では、制御部１１は、今回のノート開始に対応する音高およびタイミングで発音開始させるよう指示する。なお、発音音色は予め定めたものでよい。また、ステップＳ２１１のその他の処理において、ユーザ操作に従って発音音色を切り替えてもよい。ステップＳ２１０では、制御部１１は、発音中の音を、今回のノート終了に対応するタイミングで発音終了させるよう指示し、図１３に示す処理を終了する。

　ステップＳ２０７では、制御部１１は、演奏信号が示す音量が上記所定の態様（図１０）で変化したか否かを判別する。ここで、設定期間を考慮しない点が第１の実施の形態と異なる。制御部１１は、音量が上記所定の態様で変化した場合は、ステップＳ２０８に進み、上記所定の態様で変化しない場合は、図１３に示す処理を終了する。

　ステップＳ２０８では、制御部１１は、発音中の音の発音終了を指示する。ステップＳ２０９では、制御部１１は、直前のステップＳ２０６で発音開始した音高と同じ音高で、再度、発音開始するよう指示する。この処理により、音高の変化態様からユーザの意図を判断して仮想ノート区切りが挿入される。ステップＳ２０９の後、制御部１１は、図１３に示す処理を終了する。

　本実施の形態によれば、音量が所定の態様で変化したタイミングで、ノート終了と判定し且つノート開始と判定される。従って、ユーザの意図に沿ったノートの開始および終了を判定することに関し、第１の実施の形態と同様の効果を奏することができる。また、ユーザの意図を反映させた、音節発音でないリアルタイム発音を実現できる。

　なお、上記各実施の形態において、音制御装置１００は、連続量として音量を取得できるものであればよく、ブレスセンサ付きの他の管楽器でもよい。あるいは、音制御装置１００は、管楽器型に限らず、鍵盤楽器等の他の形態であってもよい。例えば、本発明を鍵盤楽器に適用する場合は、各鍵にアフタセンサ等の機能を設け、鍵操作に応じて音量が連続的に変化するように構成してもよい。あるいは、ボリュームペダルを接続した電子楽器を用い、ボリュームペダルの操作により音量情報が入力されるようにしてもよい。

　なお、演奏信号（演奏情報）は、外部から通信を介して取得されてもよい。従って、演奏操作部１５を設けることは必須でなく、音制御装置１００は、楽器としての機能および形態を有することは必須でない。

　なお、発音部１８を設けることは必須でない。合成した歌唱音や、発音すべき音の情報を、通信を介して外部へ送信し、発音部１８と同様の機能を備える外部装置で発音させてもよい。また、生成部３３、特定部３４、歌唱音合成部３５および指示部３６の少なくとも1つの機能を、通信Ｉ／Ｆ１９を介して接続された外部装置に持たせてもよい。

　以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。

　なお、本発明を達成するためのソフトウェアによって表される制御プログラムを記憶した記憶媒体を、本装置に読み出すことによって、本発明と同様の効果を奏するようにしてもよく、その場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した、非一過性のコンピュータ読み取り可能な記録媒体は本発明を構成することになる。また、プログラムコードを伝送媒体等を介して供給してもよく、その場合は、プログラムコード自体が本発明を構成することになる。なお、これらの場合の記憶媒体としては、ＲＯＭのほか、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード等を用いることができる。非一過性のコンピュータ読み取り可能な記録媒体としては、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（例えばＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））のように、一定時間プログラムを保持しているものも含む。

１１　制御部
３１　取得部
３２　判定部
３３　生成部
３４　特定部
３５　歌唱音合成部
３６　指示部
１００　音制御装置

Claims

　音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得する取得部と、
　前記演奏情報における音量と閾値との比較結果と、前記演奏情報における音高の変化とに基づいて、ノート開始およびノート終了を判定する判定部と、を有し、
　前記判定部は、前記音量が所定の態様で変化したと判定した場合は、前記音量と前記閾値との比較結果にかかわらず、前記音量が前記所定の態様で変化したタイミングで、前記ノート終了と判定し且つ前記ノート開始と判定する、音制御装置。
　前記判定部による前記ノート開始および前記ノート終了の判定に基づいてノートを生成する生成部をさらに有する、請求項１に記載の音制御装置。
　前記所定の態様は、前記音量が、第１の所定時間内で第１の所定速度より速い速度で降下した後、降下開始から第２の所定時間が経過する前に、第２の所定速度より速い速度で且つ第３の所定時間を超えて継続して上昇を続けることである、請求項１または２に記載の音制御装置。
　前記判定部は、前記音量が第１の閾値を超えた場合、前記ノート開始と判定する、請求項１乃至３のいずれか１項に記載の音制御装置。
　前記判定部は、前記ノート開始と判定した後に前記音量が第２の閾値を下回った場合、前記ノート終了と判定する、請求項４に記載の音制御装置。
　前記判定部は、前記音量が前記第１の閾値を超えた状態で、前記音高が変化した場合、前記ノート終了と判定し且つ前記ノート開始と判定する、請求項４または５に記載の音制御装置。
　発音する複数の音節が時系列に配置されている歌詞データから、前記判定部が前記ノート開始と判定したタイミングに対応する音節を特定する特定部と、
　前記特定部により特定された音節を、前記ノート開始に対応する音高およびタイミングで発音開始させるよう指示し、且つ、前記ノート終了に対応するタイミングで発音終了させるよう指示する指示部と、をさらに有する、請求項１乃至６のいずれか１項に記載の音制御装置。
　前記指示部は、前記ノート開始に対応する第１の音節の発音開始を指示した後、前記音量が前記所定の態様で変化したことで前記ノート終了と判定され且つ前記ノート開始と判定された場合は、前記第１の音節の発音終了を指示し、且つ、前記第１の音節の次の第２の音節を、前記第１の音節を発音した音高と同じ音高で発音開始するよう指示する、請求項７に記載の音制御装置。
　前記歌詞データにおいて、前記音節の各々には、発音の開始時刻および停止時刻からなる設定区間が対応付けられており、
　前記特定部は、前記ノート開始と判定されたタイミングが属する設定区間または前記タイミングに最も近い設定区間に対応する音節を、前記ノート開始と判定されたタイミングに対応する音節として特定する、請求項７に記載の音制御装置。
　前記判定部は、前記ノート開始と判定されたタイミングが属する設定区間と、前記音量が前記所定の態様で変化したと判定したタイミングが属する設定区間とが異なることを条件として、前記音量が前記所定の態様で変化したタイミングで、前記ノート終了と判定し且つ前記ノート開始と判定する、請求項９に記載の音制御装置。
　前記指示部による指示に基づいて、音節を合成した歌唱音を発音する発音部をさらに有する、請求項７乃至１０のいずれか１項に記載の音制御装置。
　前記ノート開始に対応する音高およびタイミングで発音開始させるよう指示し、且つ、前記ノート終了に対応するタイミングで発音終了させるよう指示する指示部をさらに有する、請求項１乃至６のいずれか１項に記載の音制御装置。
　請求項１乃至１２のいずれか１項に記載の音制御装置と、
　前記演奏情報をユーザが入力するための演奏操作部と、を有する、電子楽器。
　前記演奏操作部は、圧力変化を検出するブレスセンサを含み、
　前記ブレスセンサにより検出された圧力変化に基づいて前記音量情報が取得される、請求項１３に記載の電子楽器。
　音制御装置の制御方法をコンピュータに実行させるプログラムであって、
　前記音制御装置の制御方法は、
　音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得し、
　前記演奏情報における音量と閾値との比較結果と、前記演奏情報における音高の変化とに基づいて、ノート開始およびノート終了を判定し、
　前記音量が所定の態様で変化したと判定した場合は、前記音量と前記閾値との比較結果にかかわらず、前記音量が前記所定の態様で変化したタイミングで、前記ノート終了と判定し且つ前記ノート開始と判定する、プログラム。
　コンピュータにより実現される音制御装置の制御方法であって、
　音高を示す音高情報と、連続量として検出される音量を示す音量情報と、を含む演奏情報を取得し、
　前記演奏情報における音量と閾値との比較結果と、前記演奏情報における音高の変化とに基づいて、ノート開始およびノート終了を判定し、
　前記音量が所定の態様で変化したと判定した場合は、前記音量と前記閾値との比較結果にかかわらず、前記音量が前記所定の態様で変化したタイミングで、前記ノート終了と判定し且つ前記ノート開始と判定する、音制御装置の制御方法。