図1は、本発明の好適な形態に係る自動演奏システム100の構成図である。自動演奏システム100は、複数の演奏者Pが楽器を演奏する音響ホール等の空間に設置され、複数の演奏者Pによる楽曲(以下「対象楽曲」という)の演奏に並行して対象楽曲の自動演奏を実行するコンピュータシステムである。なお、演奏者Pは、典型的には楽器の演奏者であるが、対象楽曲の歌唱者も演奏者Pであり得る。すなわち、本出願における「演奏」には、楽器の演奏だけでなく歌唱も包含される。また、実際には楽器の演奏を担当しない者(例えば、コンサート時の指揮者やレコーディング時の音響監督など)も、演奏者Pに含まれ得る。
図1に例示される通り、本実施形態の自動演奏システム100は、制御装置12と記憶装置14と収録装置22と自動演奏装置24と表示装置26とを具備する。制御装置12と記憶装置14とは、例えばパーソナルコンピュータ等の情報処理装置で実現される。
制御装置12は、例えばCPU(Central Processing Unit)等の処理回路であり、自動演奏システム100の各要素を統括的に制御する。記憶装置14は、例えば磁気記録媒体または半導体記録媒体等の公知の記録媒体、あるいは複数種の記録媒体の組合せで構成され、制御装置12が実行するプログラムと制御装置12が使用する各種のデータとを記憶する。なお、自動演奏システム100とは別体の記憶装置14(例えばクラウドストレージ)を用意し、移動体通信網またはインターネット等の通信網を介して制御装置12が記憶装置14に対する書込および読出を実行することも可能である。すなわち、記憶装置14は自動演奏システム100から省略され得る。
本実施形態の記憶装置14は、楽曲データMを記憶する。楽曲データMは、自動演奏による対象楽曲の演奏内容を指定する。例えばMIDI(Musical Instrument Digital Interface)規格に準拠した形式のファイル(SMF:Standard MIDI File)が楽曲データMとして好適である。具体的には、楽曲データMは、演奏内容を示す指示データと、当該指示データの発生時点を示す時間データとが配列された時系列データである。指示データは、音高(ノートナンバ)と強度(ベロシティ)とを指定して発音および消音等の各種のイベントを指示する。時間データは、例えば相前後する指示データの間隔(デルタタイム)を指定する。
図1の自動演奏装置24は、制御装置12による制御のもとで対象楽曲の自動演奏を実行する。具体的には、対象楽曲を構成する複数の演奏パートのうち、複数の演奏者Pの演奏パート(例えば弦楽器)とは別個の演奏パートが、自動演奏装置24により自動演奏される。本実施形態の自動演奏装置24は、駆動機構242と発音機構244とを具備する鍵盤楽器(すなわち自動演奏ピアノ)である。発音機構244は、自然楽器のピアノと同様に、鍵盤の各鍵の変位に連動して弦(すなわち発音体)を発音させる打弦機構である。具体的には、発音機構244は、弦を打撃可能なハンマと、鍵の変位をハンマに伝達する複数の伝達部材(例えばウィペン,ジャック,レペティションレバー)とで構成されるアクション機構を鍵毎に具備する。駆動機構242は、発音機構244を駆動することで対象楽曲の自動演奏を実行する。具体的には、駆動機構242は、各鍵を変位させる複数の駆動体(例えばソレノイド等のアクチュエータ)と、各駆動体を駆動する駆動回路とを含んで構成される。制御装置12からの指示に応じて駆動機構242が発音機構244を駆動することで、対象楽曲の自動演奏が実現される。なお、自動演奏装置24に制御装置12または記憶装置14を搭載することも可能である。
収録装置22は、複数の演奏者Pが対象楽曲を演奏する様子を収録する。図1に例示される通り、本実施形態の収録装置22は、複数の撮像装置222と複数の収音装置224とを具備する。撮像装置222は、演奏者P毎に設置され、演奏者Pの撮像により画像信号V0を生成する。画像信号V0は、演奏者Pの動画像を表す信号である。収音装置224は、演奏者P毎に設置され、演奏者Pによる楽器の演奏で発音された音(例えば楽音または歌唱音)を収音して音響信号A0を生成する。音響信号A0は、音の波形を表す信号である。以上の説明から理解される通り、相異なる演奏者Pを撮像した複数の画像信号V0と、相異なる演奏者Pが演奏した音を収音した複数の音響信号A0とが収録される。なお、電気弦楽器等の電気楽器から出力される音響信号A0を利用することも可能である。したがって、収音装置224は省略され得る。
制御装置12は、記憶装置14に記憶されたプログラムを実行することで、対象楽曲の自動演奏を実現するための複数の機能(合図検出部52,演奏解析部54,演奏制御部56,表示制御部58)を実現する。なお、制御装置12の機能を複数の装置の集合(すなわちシステム)で実現した構成、または、制御装置12の機能の一部または全部を専用の電子回路が実現した構成も採用され得る。また、収録装置22と自動演奏装置24と表示装置26とが設置された音響ホール等の空間から離間した位置にあるサーバ装置が、制御装置12の一部または全部の機能を実現することも可能である。
各演奏者Pは、対象楽曲の演奏の合図となる動作(以下「合図動作」という)を実行する。合図動作は、時間軸上の1個の時点を指示する動作(ジェスチャー)である。例えば、演奏者Pが自身の楽器を持上げる動作、または演奏者Pが自身の身体を動かす動作が、合図動作の好適例である。例えば対象楽曲の演奏を主導する特定の演奏者Pは、図2に例示される通り、対象楽曲の演奏を開始すべき始点に対して所定の期間(以下「準備期間」という)Bだけ手前の時点Qで合図動作を実行する。準備期間Bは、例えば対象楽曲の1拍分の時間長の期間である。したがって、準備期間Bの時間長は対象楽曲の演奏速度(テンポ)に応じて変動する。例えば演奏速度が速いほど準備期間Bは短い時間となる。演奏者Pは、対象楽曲に想定される演奏速度のもとで1拍分に相当する準備期間Bだけ対象楽曲の始点から手前の時点で合図動作を実行したうえで、当該始点の到来により対象楽曲の演奏を開始する。合図動作は、他の演奏者Pによる演奏の契機となるほか、自動演奏装置24による自動演奏の契機として利用される。なお、準備期間Bの時間長は任意であり、例えば複数拍分の時間長とすることも可能である。
図1の合図検出部52は、演奏者Pによる合図動作を検出する。具体的には、合図検出部52は、各撮像装置222が演奏者Pを撮像した画像を解析することで合図動作を検出する。図1に例示される通り、本実施形態の合図検出部52は、画像合成部522と検出処理部524とを具備する。画像合成部522は、複数の撮像装置222が生成した複数の画像信号V0を合成することで画像信号Vを生成する。画像信号Vは、図3に例示される通り、各画像信号V0が表す複数の動画像(#1,#2,#3,……)を配列した画像を表す信号である。すなわち、複数の演奏者Pの動画像を表す画像信号Vが画像合成部522から検出処理部524に供給される。
検出処理部524は、画像合成部522が生成した画像信号Vを解析することで複数の演奏者Pの何れかによる合図動作を検出する。検出処理部524による合図動作の検出には、演奏者Pが合図動作の実行時に移動させる要素(例えば身体や楽器)を画像から抽出する画像認識処理と、当該要素の移動を検出する動体検出処理とを含む公知の画像解析技術が使用され得る。また、ニューラルネットワークまたは多分木等の識別モデルを合図動作の検出に利用することも可能である。例えば、複数の演奏者Pによる演奏を撮像した画像信号から抽出された特徴量を所与の学習データとして利用して、識別モデルの機械学習(例えばディープラーニング)が事前に実行される。検出処理部524は、実際に自動演奏が実行される場面で画像信号Vから抽出した特徴量を機械学習後の識別モデルに適用することで合図動作を検出する。
図1の演奏解析部54は、対象楽曲のうち複数の演奏者Pが現に演奏している位置(以下「演奏位置」という)Tを各演奏者Pによる演奏に並行して順次に推定する。具体的には、演奏解析部54は、複数の収音装置224の各々が収音した音を解析することで演奏位置Tを推定する。図1に例示される通り、本実施形態の演奏解析部54は、音響混合部542と解析処理部544とを具備する。音響混合部542は、複数の収音装置224が生成した複数の音響信号A0を混合することで音響信号Aを生成する。すなわち、音響信号Aは、相異なる音響信号A0が表す複数種の音の混合音を表す信号である。
解析処理部544は、音響混合部542が生成した音響信号Aの解析により演奏位置Tを推定する。例えば、解析処理部544は、音響信号Aが表す音と楽曲データMが示す対象楽曲の演奏内容とを相互に照合することで演奏位置Tを特定する。また、本実施形態の解析処理部544は、対象楽曲の演奏速度(テンポ)Rを音響信号Aの解析により推定する。例えば、解析処理部544は、演奏位置Tの時間変化から演奏速度Rを特定する。なお、解析処理部544による演奏位置Tおよび演奏速度Rの推定には、公知の音響解析技術(スコアアライメント)が任意に採用され得る。例えば、特許文献1に開示された解析技術を演奏位置Tおよび演奏速度Rの推定に利用することが可能である。また、ニューラルネットワークまたは多分木等の識別モデルを演奏位置Tおよび演奏速度Rの推定に利用することも可能である。例えば、複数の演奏者Pによる演奏を収音した音響信号Aから抽出された特徴量を所与の学習データとして利用して、識別モデルの機械学習(例えばディープラーニング)が事前に実行される。解析処理部544は、実際に自動演奏が実行される場面で音響信号Aから抽出した特徴量を機械学習後の識別モデルに適用することで演奏位置Tおよび演奏速度Rを推定する。
合図検出部52による合図動作の検出と演奏解析部54による演奏位置Tおよび演奏速度Rの推定とは、複数の演奏者Pによる対象楽曲の演奏に並行して実時間的に実行される。例えば、合図動作の検出と演奏位置Tおよび演奏速度Rの推定とが所定の周期で反復される。ただし、合図動作の検出の周期と演奏位置Tおよび演奏速度Rの推定の周期との異同は不問である。
図1の演奏制御部56は、合図検出部52が検出する合図動作と演奏解析部54が推定する演奏位置Tの進行とに同期するように自動演奏装置24に対象楽曲の自動演奏を実行させる。具体的には、演奏制御部56は、合図検出部52による合図動作の検出を契機として自動演奏の開始を自動演奏装置24に対して指示するとともに、対象楽曲のうち演奏位置Tに対応する時点について楽曲データMが指定する演奏内容を自動演奏装置24に指示する。すなわち、演奏制御部56は、対象楽曲の楽曲データMに含まれる各指示データを自動演奏装置24に対して順次に供給するシーケンサである。自動演奏装置24は、演奏制御部56からの指示に応じて対象楽曲の自動演奏を実行する。複数の演奏者Pによる演奏の進行とともに演奏位置Tは対象楽曲内の後方に移動するから、自動演奏装置24による対象楽曲の自動演奏も演奏位置Tの移動とともに進行する。以上の説明から理解される通り、対象楽曲の各音の強度またはフレーズ表現等の音楽表現を楽曲データMで指定された内容に維持したまま、演奏のテンポと各音のタイミングとは複数の演奏者Pによる演奏に同期する(すなわち楽曲データMで指定された内容から変化する)ように、演奏制御部56は自動演奏装置24に自動演奏を指示する。したがって、例えば特定の演奏者(例えば現在では生存していない過去の演奏者)の演奏を表す楽曲データMを使用すれば、当該演奏者に特有の音楽表現を自動演奏で忠実に再現しながら、当該演奏者と実在の複数の演奏者Pとが恰も相互に呼吸を合わせて協調的に合奏しているかのような雰囲気を醸成することが可能である。
ところで、演奏制御部56が指示データの出力により自動演奏装置24に自動演奏を指示してから自動演奏装置24が実際に発音する(例えば発音機構244のハンマが打弦する)までには数百ミリ秒程度の時間が必要である。すなわち、演奏制御部56からの指示に対して自動演奏装置24による実際の発音は不可避的に遅延する。したがって、対象楽曲のうち演奏解析部54が推定した演奏位置T自体の演奏を演奏制御部56が自動演奏装置24に指示する構成では、複数の演奏者Pによる演奏に対して自動演奏装置24による発音が遅延する結果となる。
そこで、本実施形態の演奏制御部56は、図2に例示される通り、対象楽曲のうち演奏解析部54が推定した演奏位置Tに対して後方(未来)の時点TAの演奏を自動演奏装置24に指示する。すなわち、遅延後の発音が複数の演奏者Pによる演奏に同期する(例えば対象楽曲の特定の音符が自動演奏装置24と各演奏者Pとで略同時に演奏される)ように、演奏制御部56は対象楽曲の楽曲データM内の指示データを先読みする。
図4は、演奏位置Tの時間的な変化の説明図である。単位時間内の演奏位置Tの変動量(図4の直線の勾配)が演奏速度Rに相当する。図4では、演奏速度Rが一定に維持された場合が便宜的に例示されている。
図4に例示される通り、演奏制御部56は、対象楽曲のうち演奏位置Tに対して調整量αだけ後方の時点TAの演奏を自動演奏装置24に指示する。調整量αは、演奏制御部56による自動演奏の指示から自動演奏装置24が実際に発音するまでの遅延量Dと、演奏解析部54が推定した演奏速度Rとに応じて可変に設定される。具体的には、演奏速度Rのもとで遅延量Dの時間内に対象楽曲の演奏が進行する区間長を、演奏制御部56は調整量αとして設定する。したがって、演奏速度Rが速い(図4の直線の勾配が急峻である)ほど調整量αは大きい数値となる。なお、図4では対象楽曲の全区間にわたり演奏速度Rが一定に維持された場合を想定したが、実際には演奏速度Rは変動し得る。したがって、調整量αは、演奏速度Rに連動して経時的に変動する。
遅延量Dは、自動演奏装置24の測定結果に応じた所定値(例えば数十から数百ミリ秒程度)に事前に設定される。なお、実際の自動演奏装置24では、演奏される音高または強度に応じて遅延量Dが相違し得る。そこで、自動演奏の対象となる音符の音高または強度に応じて遅延量D(さらには遅延量Dに依存する調整量α)を可変に設定することも可能である。
また、演奏制御部56は、合図検出部52が検出する合図動作を契機として対象楽曲の自動演奏の開始を自動演奏装置24に指示する。図5は、合図動作と自動演奏との関係の説明図である。図5に例示される通り、演奏制御部56は、合図動作が検出された時点Qから時間長δが経過した時点QAで自動演奏装置24に対する自動演奏の指示を開始する。時間長δは、準備期間Bに相当する時間長τから自動演奏の遅延量Dを減算した時間長である。準備期間Bの時間長τは対象楽曲の演奏速度Rに応じて変動する。具体的には、演奏速度Rが速い(図5の直線の勾配が急峻である)ほど準備期間Bの時間長τは短くなる。ただし、合図動作の時点QAでは対象楽曲の演奏は開始されていないから、演奏速度Rは推定されていない。そこで、演奏制御部56は、対象楽曲に想定される標準的な演奏速度(標準テンポ)R0に応じて準備期間Bの時間長τを算定する。演奏速度R0は、例えば楽曲データMにて指定される。ただし、複数の演奏者Pが対象楽曲について共通に認識している速度(例えば演奏練習時に想定した速度)を演奏速度R0として設定することも可能である。
以上に説明した通り、演奏制御部56は、合図動作の時点QAから時間長δ(δ=τ−D)が経過した時点QAで自動演奏の指示を開始する。したがって、合図動作の時点Qから準備期間Bが経過した時点QB(すなわち、複数の演奏者Pが演奏を開始する時点)において、自動演奏装置24による発音が開始される。すなわち、複数の演奏者Pによる対象楽曲の演奏の開始と略同時に自動演奏装置24による自動演奏が開始される。本実施形態の演奏制御部56による自動演奏の制御は以上の例示の通りである。
図1の表示制御部58は、自動演奏装置24による自動演奏の進行を視覚的に表現した画像(以下「演奏画像」という)Gを表示装置26に表示させる。具体的には、表示制御部58は、演奏画像Gを表す画像データを生成して表示装置26に出力することで演奏画像Gを表示装置26に表示させる。表示装置26は、表示制御部58から指示された演奏画像Gを表示する。例えば液晶表示パネルまたはプロジェクタが表示装置26の好適例である。複数の演奏者Pは、表示装置26が表示する演奏画像Gを、対象楽曲の演奏に並行して随時に視認することが可能である。
本実施形態の表示制御部58は、自動演奏装置24による自動演奏に連動して動的に変化する動画像を演奏画像Gとして表示装置26に表示させる。図6および図7は、演奏画像Gの表示例である。図6および図7に例示される通り、演奏画像Gは、底面72が存在する仮想空間70に表示体(オブジェクト)74を配置した立体的な画像である。図6に例示される通り、表示体74は、仮想空間70内に浮遊するとともに所定の速度で降下する略球状の立体である。仮想空間70の底面72には表示体74の影75が表示され、表示体74の降下とともに底面72に沿って表示体74に接近する。図7に例示される通り、自動演奏装置24による発音が開始される時点で表示体74は仮想空間70内の所定の高度まで上昇するとともに、当該発音の継続中に表示体74の形状が不規則に変形する。そして、自動演奏による発音が停止(消音)すると、表示体74の不規則な変形が停止して図6の初期的な形状(球状)に復帰し、表示体74が所定の速度で降下する状態に遷移する。自動演奏による発音毎に表示体74の以上の動作(上昇および変形)が反復される。例えば、対象楽曲の演奏の開始前に表示体74は降下し、対象楽曲の始点の音符が自動演奏により発音される時点で表示体74の移動の方向が降下から上昇に転換する。したがって、表示装置26に表示された演奏画像Gを視認する演奏者Pは、表示体74の降下から上昇への転換により自動演奏装置24による発音のタイミングを把握することが可能である。
本実施形態の表示制御部58は、以上に例示した演奏画像Gが表示されるように表示装置26を制御する。なお、表示制御部58が表示装置26に画像の表示や変更を指示してから、表示装置26による表示画像に当該指示が反映されるまでの遅延は、自動演奏装置24による自動演奏の遅延量Dと比較して充分に小さい。そこで、表示制御部58は、対象楽曲のうち演奏解析部54が推定した演奏位置T自体の演奏内容に応じた演奏画像Gを表示装置26に表示させる。したがって、前述の通り、自動演奏装置24による実際の発音(演奏制御部56による指示から遅延量Dだけ遅延した時点)に同期して演奏画像Gが動的に変化する。すなわち、対象楽曲の各音符の発音を自動演奏装置24が実際に開始する時点で演奏画像Gの表示体74の移動は降下から上昇に転換する。したがって、各演奏者Pは、自動演奏装置24が対象楽曲の各音符を発音する時点を視覚的に確認することが可能である。
図8は、自動演奏システム100の制御装置12の動作を例示するフローチャートである。例えば、所定の周期で発生する割込信号を契機として、複数の演奏者Pによる対象楽曲の演奏に並行して図8の処理が開始される。図8の処理を開始すると、制御装置12(合図検出部52)は、複数の撮像装置222から供給される複数の画像信号V0を解析することで、任意の演奏者Pによる合図動作の有無を判定する(SA1)。また、制御装置12(演奏解析部54)は、複数の収音装置224から供給される複数の音響信号A0の解析により演奏位置Tと演奏速度Rとを推定する(SA2)。なお、合図動作の検出(SA1)と演奏位置Tおよび演奏速度Rの推定(SA2)との順序は逆転され得る。
制御装置12(演奏制御部56)は、演奏位置Tおよび演奏速度Rに応じた自動演奏を自動演奏装置24に対して指示する(SA3)。具体的には、合図検出部52が検出する合図動作と演奏解析部54が推定する演奏位置Tの進行とに同期するように自動演奏装置24に対象楽曲の自動演奏を実行させる。また、制御装置12(表示制御部58)は、自動演奏の進行を表現する演奏画像Gを表示装置26に表示させる(SA4)。
以上に例示した実施形態では、演奏者Pによる合図動作と演奏位置Tの進行とに同期するように自動演奏装置24による自動演奏が実行される一方、自動演奏装置24による自動演奏の進行を表す演奏画像Gが表示装置26に表示される。したがって、自動演奏装置24による自動演奏の進行を演奏者Pが視覚的に確認して自身の演奏に反映させることが可能である。すなわち、複数の演奏者Pによる演奏と自動演奏装置24による自動演奏とが相互に作用し合う自然な合奏が実現される。本実施形態では特に、自動演奏による演奏内容に応じて動的に変化する演奏画像Gが表示装置26に表示されるから、演奏者Pが自動演奏の進行を視覚的および直観的に把握できるという利点がある。
また、本実施形態では、演奏解析部54が推定した演奏位置Tに対して時間的に後方の時点TAの演奏内容が自動演奏装置24に指示される。したがって、演奏制御部56による演奏の指示に対して自動演奏装置24による実際の発音が遅延する場合でも、演奏者Pによる演奏と自動演奏とを高精度に同期させることが可能である。また、演奏解析部54が推定した演奏速度Rに応じた可変の調整量αだけ演奏位置Tに対して後方の時点TAの演奏が自動演奏装置24に指示される。したがって、例えば演奏速度Rが変動する場合でも、演奏者による演奏と自動演奏とを高精度に同期させることが可能である。
<変形例>
以上に例示した各態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
(1)前述の実施形態では、合図検出部52が検出した合図動作を契機として対象楽曲の自動演奏を開始したが、対象楽曲の途中の時点における自動演奏の制御に合図動作を使用することも可能である。例えば、対象楽曲内で長時間にわたる休符が終了して演奏が再開される時点で、前述の各形態と同様に、合図動作を契機として対象楽曲の自動演奏が再開される。例えば、図5を参照して説明した動作と同様に、対象楽曲内で休符後に演奏が再開される時点に対して準備期間Bだけ手前の時点Qで特定の演奏者Pが合図動作を実行する。そして、遅延量Dと演奏速度Rとに応じた時間長δが当該時点Qから経過した時点で、演奏制御部56は、自動演奏装置24に対する自動演奏の指示を再開する。なお、対象楽曲の途中の時点では既に演奏速度Rが推定されているから、時間長δの設定には、演奏解析部54が推定した演奏速度Rが適用される。
ところで、対象楽曲のうち合図動作が実行され得る期間は、対象楽曲の演奏内容から事前に把握され得る。そこで、対象楽曲のうち合図動作が実行される可能性がある特定の期間(以下「監視期間」という)を対象として合図検出部52が合図動作の有無を監視することも可能である。例えば、対象楽曲に想定される複数の監視期間の各々について始点と終点とを指定する区間指定データが記憶装置14に格納される。区間指定データを楽曲データMに内包させることも可能である。合図検出部52は、対象楽曲のうち区間指定データで指定される各監視期間内に演奏位置Tが存在する場合に合図動作の監視を実行し、演奏位置Tが監視期間の外側にある場合には合図動作の監視を停止する。以上の構成によれば、対象楽曲のうち監視期間に限定して合図動作が検出されるから、対象楽曲の全区間にわたり合図動作の有無を監視する構成と比較して合図検出部52の処理負荷が軽減されるという利点がある。また、対象楽曲のうち実際には合図動作が実行され得ない期間について合図動作が誤検出される可能性を低減することも可能である。
(2)前述の実施形態では、画像信号Vが表す画像の全体(図3)を解析することで合図動作を検出したが、画像信号Vが表す画像のうち特定の領域(以下「監視領域」という)を対象として、合図検出部52が合図動作の有無を監視することも可能である。例えば、合図検出部52は、画像信号Vが示す画像のうち合図動作が予定されている特定の演奏者Pを含む範囲を監視領域として選択し、当該監視領域を対象として合図動作を検出する。監視領域以外の範囲については合図検出部52による監視対象から除外される。以上の構成によれば、監視領域に限定して合図動作が検出されるから、画像信号Vが示す画像の全体にわたり合図動作の有無を監視する構成と比較して合図検出部52の処理負荷が軽減されるという利点がある。また、実際には合図動作を実行しない演奏者Pの動作が合図動作と誤判定される可能性を低減することも可能である。
なお、前述の変形例(1)で例示した通り、対象楽曲の演奏中に複数回にわたり合図動作が実行される場合を想定すると、合図動作を実行する演奏者Pが合図動作毎に変更される可能性もある。例えば、対象楽曲の開始前の合図動作は演奏者P1が実行する一方、対象楽曲の途中の合図動作は演奏者P2が実行する。したがって、画像信号Vが表す画像内で監視領域の位置(またはサイズ)を経時的に変更する構成も好適である。合図動作を実行する演奏者Pは事前に把握できるから、例えば監視領域の位置を時系列に指定する領域指定データを記憶装置14に事前に格納することが可能である。合図検出部52は、画像信号Vが表す画像のうち領域指定データで指定される各監視領域について合図動作を監視し、監視領域以外の領域については合図動作の監視対象から除外する。以上の構成によれば、合図動作を実行する演奏者Pが楽曲の進行とともに変更される場合でも、合図動作を適切に検出することが可能である。
(3)前述の実施形態では、複数の撮像装置222を利用して複数の演奏者Pを撮像したが、1個の撮像装置222により複数の演奏者P(例えば複数の演奏者Pが所在する舞台の全体)を撮像することも可能である。同様に、複数の演奏者Pが演奏した音を1個の収音装置224により収音することも可能である。また、複数の画像信号V0の各々について合図検出部52が合図動作の有無を監視する構成(したがって、画像合成部522は省略され得る)も採用され得る。
(4)前述の実施形態では、撮像装置222が撮像した画像信号Vの解析で合図動作を検出したが、合図検出部52が合図動作を検出する方法は以上の例示に限定されない。例えば、演奏者Pの身体に装着された検出器(例えば加速度センサ等の各種のセンサ)の検出信号を解析することで合図検出部52が演奏者Pの合図動作を検出することも可能である。ただし、撮像装置222が撮像した画像の解析により合図動作を検出する前述の実施形態の構成によれば、演奏者Pの身体に検出器を装着する場合と比較して、演奏者Pの演奏動作に対する影響を低減しながら合図動作を検出できるという利点がある。
(5)前述の実施形態では、相異なる楽器の音を表す複数の音響信号A0を混合した音響信号Aの解析により演奏位置Tおよび演奏速度Rを推定したが、各音響信号A0の解析により演奏位置Tおよび演奏速度Rを推定することも可能である。例えば、演奏解析部54は、複数の音響信号A0の各々について前述の実施形態と同様の方法で暫定的な演奏位置Tおよび演奏速度Rを推定し、各音響信号A0に関する推定結果から確定的な演奏位置Tおよび演奏速度Rを決定する。例えば各音響信号A0から推定された演奏位置Tおよび演奏速度Rの代表値(例えば平均値)が確定的な演奏位置Tおよび演奏速度Rとして算定される。以上の説明から理解される通り、演奏解析部54の音響混合部542は省略され得る。
(6)前述の実施形態で例示した通り、自動演奏システム100は、制御装置12とプログラムとの協働で実現される。本発明の好適な態様に係るプログラムは、対象楽曲を演奏する演奏者Pの合図動作を検出する合図検出部52、演奏された音を表す音響信号Aを当該演奏に並行して解析することで対象楽曲内の演奏位置Tを順次に推定する演奏解析部54、合図検出部52が検出する合図動作と演奏解析部54が推定する演奏位置Tの進行とに同期するように対象楽曲の自動演奏を自動演奏装置24に実行させる演奏制御部56、および、自動演奏の進行を表す演奏画像Gを表示装置26に表示させる表示制御部58、としてコンピュータを機能させる。以上に例示したプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、通信網を介した配信の形態でプログラムをコンピュータに配信することも可能である。
(7)本発明の好適な態様は、前述の実施形態に係る自動演奏システム100の動作方法(自動演奏方法)としても特定される。例えば、本発明の好適な態様に係る自動演奏方法は、コンピュータシステム(単体のコンピュータ、または複数のコンピュータで構成されるシステム)が、対象楽曲を演奏する演奏者Pの合図動作を検出し(SA1)、演奏された音を表す音響信号Aを当該演奏に並行して解析することで対象楽曲内の演奏位置Tを順次に推定し(SA2)、合図動作と演奏位置Tの進行とに同期するように対象楽曲の自動演奏を自動演奏装置24に実行させ(SA3)、自動演奏の進行を表す演奏画像Gを表示装置26に表示させる(SA4)。