WO2022190403A1

WO2022190403A1 - 信号処理システム、信号処理方法およびプログラム

Info

Publication number: WO2022190403A1
Application number: PCT/JP2021/023831
Authority: WO
Inventors: 陽前澤
Original assignee: ヤマハ株式会社
Priority date: 2021-03-09
Filing date: 2021-06-23
Publication date: 2022-09-15
Also published as: CN116940979A; JPWO2022190403A1; US20230419929A1

Abstract

信号処理システムは、楽曲の再生に追従して時系列信号を再生装置に再生させるシステムであり、前記楽曲の再生における利用者による指示位置を取得する取得部と、前記指示位置に応じて前記時系列信号の時間伸縮を実行する制御部とを具備する。

Description

信号処理システム、信号処理方法およびプログラム

　本開示は、例えば音響信号または映像信号等の時間領域の信号（以下「時系列信号」という）を処理する技術に関する。

　楽曲のうち利用者が演奏している時間軸上の位置（以下「演奏位置」という）を推定する各種の技術が、従来から提案されている。例えば特許文献１には、楽曲の演奏音を表す音響信号を解析することで演奏位置を推定する技術が開示されている。

特開２０１５－７９１８３号公報

　例えば音響信号が表す音響や映像信号が表す映像の再生を、利用者による演奏に追従（同期）させたいという要望がある。以上の事情を考慮して、本開示のひとつの態様は、例えば音響信号または映像信号等の時系列信号を利用者による動作に追従させることを目的とする。

　以上の課題を解決するために、本開示のひとつの態様に係る信号処理システムは、楽曲の再生に追従して時系列信号を再生装置に再生させる信号処理システムであって、前記楽曲の再生における利用者による指示位置を取得する取得部と、前記指示位置に応じて前記時系列信号の時間伸縮を実行する制御部とを具備する。

　本開示のひとつの態様に係る信号処理方法は、楽曲の再生に追従して時系列信号を再生装置に再生させる方法であって、前記楽曲の再生における利用者による指示位置を取得し、前記指示位置に応じて前記時系列信号の時間伸縮を実行する。

　本開示のひとつの態様に係るプログラムは、楽曲の再生に追従して時系列信号を再生装置に再生させるためのプログラムであって、前記楽曲の再生における利用者による指示位置を取得する取得部、および、前記指示位置に応じて前記時系列信号の時間伸縮を実行する制御部、としてコンピュータを機能させる。

第１実施形態に係る演奏システムの構成を例示するブロック図である。信号処理システムの機能的な構成を例示するブロック図である。取得部および特定部が実行する処理の説明図である。制御処理の具体的な手順を例示するフローチャートである。再生位置を特定する特定処理の説明図である。特定処理の具体的な手順を例示するフローチャートである。確率設定処理の一部の具体的な手順を例示するフローチャートである。確率設定処理の他の一部の具体的な手順を例示するフローチャートである。発音間期間の説明図である。再生処理の具体的な手順を例示するフローチャートである。操作強度の説明図である。

Ａ：第１実施形態
　図１は、第１実施形態に係る演奏システム１００の構成を例示するブロック図である。演奏システム１００は、利用者が楽曲（以下「目標楽曲」という）を演奏するためのコンピュータシステムであり、鍵盤楽器１０と信号処理システム２０とを具備する。鍵盤楽器１０と信号処理システム２０とは、例えば有線または無線により相互に接続される。

　鍵盤楽器１０は、相異なる音高に対応する複数の鍵を具備する電子楽器である。利用者は、鍵盤楽器１０の各鍵を順次に操作することで目標楽曲を演奏する。具体的には、利用者は、目標楽曲を構成する複数の演奏パートのうち特定の１以上の演奏パートを鍵盤楽器１０により演奏する。鍵盤楽器１０は、利用者が演奏した音高の音響（例えば楽器音）を放音する。また、鍵盤楽器１０は、利用者による演奏に応じた音響の放音に並行して、当該演奏を表す演奏データＤを信号処理システム２０に供給する。演奏データＤは、利用者が操作した鍵に対応する音高と押鍵の強度とを指定する指示データであり、利用者による鍵盤楽器１０の操作毎に生成される。すなわち、演奏データＤの時系列が鍵盤楽器１０から信号処理システム２０に供給される。演奏データＤは、例えばＭＩＤＩ（Musical Instrument Digital Interface）規格に準拠したイベントデータである。

　信号処理システム２０は、制御装置２１と記憶装置２２と放音装置２３とを具備する。信号処理システム２０は、例えばスマートフォンまたはタブレット端末等の可搬型の情報装置、またはパーソナルコンピュータ等の可搬型または据置型の情報装置により実現される。なお、信号処理システム２０は、単体の装置として実現されるほか、相互に別体で構成された複数の装置でも実現される。また、信号処理システム２０は、鍵盤楽器１０に搭載されてもよい。

　制御装置２１は、信号処理システム２０の各要素を制御する単数または複数のプロセッサで構成される。例えば、制御装置２１は、ＣＰＵ（Central Processing Unit）、ＳＰＵ（Sound Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＦＰＧＡ（Field Programmable Gate Array）、またはＡＳＩＣ（Application Specific Integrated Circuit）等の１種類以上のプロセッサにより構成される。

　記憶装置２２は、制御装置２１が実行するプログラムと、制御装置２１が使用する各種のデータとを記憶する単数または複数のメモリである。記憶装置２２は、例えば磁気記録媒体もしくは半導体記録媒体等の公知の記録媒体、または、複数種の記録媒体の組合せで構成される。なお、信号処理システム２０に対して着脱される可搬型の記録媒体、または例えばインターネット等の通信網を介して制御装置２１が書込または読出を実行可能な記録媒体（例えばクラウドストレージ）を、記憶装置２２として利用してもよい。

　記憶装置２２は、目標楽曲の演奏音を表す音響信号Ｘを記憶する。音響信号Ｘは、目標楽曲の演奏音の波形を表す時系列信号（すなわちサンプル系列）である。具体的には、音響信号Ｘは、目標楽曲の演奏により各種の楽器が発音する楽音、または、目標楽曲の歌唱により歌唱者が発音する歌唱音声を表す。例えば、音響信号Ｘは、目標楽曲を構成する複数の演奏パートのうち利用者が鍵盤楽器１０により演奏する演奏パート以外の１以上の演奏パートの演奏音を表す。

　放音装置２３は、制御装置２１により指示された音響を再生する。放音装置２３は、例えばスピーカまたはヘッドホンである。なお、信号処理システム２０とは別体の放音装置２３を信号処理システム２０に有線または無線により接続してもよい。

　第１実施形態の制御装置２１は、利用者による目標楽曲の演奏に追従して音響信号Ｘを放音装置２３に再生させる。具体的には、制御装置２１は、目標楽曲のうち利用者による演奏に対応する位置（演奏位置Ｐ[t]）を推定し、音響信号Ｘのうち当該位置に応じた時間軸上の位置（再生位置Ｒ[t]）に対応する部分Ｙを放音装置２３に再生させる。すなわち、利用者による目標楽曲の演奏に応じて音響信号Ｘが時間軸上で伸縮（タイムストレッチ）される。例えば、利用者による演奏の速度が所定の標準的な速度（以下「標準速度」という）Ｐ0を下回る場合、音響信号Ｘは時間軸上で伸長される。すなわち、演奏位置Ｐ[t]の移動の速度が小さいほど、再生位置Ｒ[t]が低速度で時間軸上を移動し、結果的に音響信号Ｘが時間軸上で伸長される。他方、利用者による演奏の速度が標準速度Ｐ0を上回る場合、音響信号Ｘは時間軸上で短縮される。すなわち、演奏位置Ｐ[t]の移動の速度が大きいほど、再生位置Ｒ[t]が高速度で時間軸上を移動し、結果的に音響信号Ｘが時間軸上で短縮される。以上の通り、放音装置２３による音響信号Ｘの再生が利用者による演奏に追従するから、信号処理システム２０と利用者とが恰も協調的に合奏しているかのような雰囲気が生成される。

　図２は、信号処理システム２０の機能的な構成を例示するブロック図である。制御装置２１は、記憶装置２２に記憶されたプログラムを実行することで、利用者による鍵盤楽器１０の演奏に追従して音響信号Ｘを再生するための複数の機能（解析部３１，取得部３２および制御部３３）を実現する。

　解析部３１は、音響信号Ｘの解析により指標Ｗ[n]（Ｗa[n]，Ｗb[n]，Ｗc[n]）を生成する。音響信号Ｘを時間軸上で区分したＮ個の期間（以下「単位期間」という）Ｕ[1]～Ｕ[N]の各々について指標Ｗ[n]（ｎ＝１～Ｎ）が生成される。各単位期間Ｕ[n]は所定長の期間である。記号ｎは、単位期間Ｕ[n]の番号（フレーム番号）を意味する。時間軸上で相前後する単位期間Ｕ[n-1]と単位期間Ｕ[n]とは、部分的に相互に重複する。ただし、単位期間Ｕ[n-1]と単位期間Ｕ[n]とが重複なく相互に連続してもよい。

　各指標Ｗ[n]は、単位期間Ｕ[n]内における音響信号Ｘの音響特性に関する変数（特徴量）である。解析部３１は、音響信号Ｘの再生前に各単位期間Ｕ[n]毎の指標Ｗ[n]（Ｗ[1]～Ｗ[N]）生成し、各指標Ｗ[n]を記憶装置２２に保存する。具体的には、解析部３１は、有音指標Ｗa[n]と変動指標Ｗb[n]と発音点指標Ｗc[n]とを、単位期間Ｕ[n]毎に指標Ｗ[n]として算定する。

　有音指標Ｗa[n]は、単位期間Ｕ[n]において音響信号Ｘが有音および無音の何れに該当するかを２値的に表す変数である。すなわち、有音指標Ｗa[n]は、単位期間Ｕ[n]が有音である場合に数値「１」に設定され、無音である場合に数値「０」に設定される。有音指標Ｗa[n]の算定には、公知の音声区間検出（ＶＡＤ：Voice Activity Detection）が利用される。なお、単位期間Ｕ[n]内において音響信号Ｘが有音である確度（例えば０以上かつ１以下の数値）が有音指標Ｗa[n]として利用されてもよい。

　変動指標Ｗb[n]は、音響信号Ｘにおける音響特性の変動の度合を表す変数である。例えば、相前後する単位期間Ｕ[n-1]および単位期間Ｕ[n]の間における音響特性の変動量が、単位期間Ｕ[n]の変動指標Ｗb[n]として算定される。したがって、音響信号Ｘの音響特性が変動し易いほど変動指標Ｗb[n]は大きい数値に設定される。音響特性は、例えば、音響信号Ｘの強度スペクトルまたはＭＦＣＣ（Mel-Frequency Cepstrum Coefficients）等の周波数特性である。なお、例えば音響信号Ｘの基本周波数等の音響特性の変動量が変動指標Ｗb[n]として利用されてもよい。変動指標Ｗb[n]の算定には、例えば離散フーリエ変換等の公知の解析技術が利用される。音響特性が変動し易いということは、音響信号Ｘの音響特性が不安定に変動し易いことを意味する。したがって、変動指標Ｗb[n]は、音響信号Ｘにおける音響特性の安定性または不安定性の指標とも換言される。

　発音点指標Ｗc[n]は、音響信号Ｘの単位期間Ｕ[n]が発音点に該当するか否かを２値的に表す変数である。発音点は、音響信号Ｘに含まれる音響成分の発音が開始される時点（オンセット）であり、音響成分の立上り時点（アタック）とも換言される。発音点指標Ｗc[n]の算定には、公知の解析技術が任意に利用される。例えば、音響信号Ｘの音量が急峻に増加する時点が発音点として検出される。なお、音響信号Ｘの単位期間Ｕ[n]が発音点である確度（例えば０以上かつ１以下の数値）が発音点指標Ｗc[n]として利用されてもよい。

　図３は、図２の取得部３２および制御部３３の処理の概要に関する説明図である。取得部３２は、時間経過に従い演奏位置Ｐ[t]を取得する。具体的には、取得部３２は、鍵盤楽器１０から順次に供給される演奏データＤの時系列を解析することで目標楽曲における演奏位置Ｐ[t]を特定する。記号ｔは、時間軸上の等間隔に設定された複数の時点の何れかを意味する。すなわち、取得部３２は、時間軸上の複数の時点ｔの各々について演奏位置Ｐ[t]を特定する。時点ｔは、時間軸上に設定された各時点の番号で表現される。演奏位置Ｐ[t]は、音響信号Ｘの始点を基準とした経過時間（例えば秒）を意味する。取得部３２による演奏位置Ｐ[t]の特定は、利用者による目標楽曲の演奏と音響信号Ｘの再生とに並行して反復される。演奏位置Ｐ[t]が時間軸上で移動する速度は、利用者による演奏に応じた可変値である。

　第１実施形態の取得部３２は、時間軸上の各時点ｔにおいて、当該時点ｔに対して所定長ｄだけ後方（forward）の時点(t+d)における演奏位置Ｐ[t+d]を推定（すなわち予測）する。所定長ｄは、時点ｔの整数個に相当する所定の正数である。取得部３２による演奏位置Ｐ[t]の推定には、公知の解析技術（スコアアライメント技術）が任意に採用される。例えば、特開２０１６－０９９５１２号公報に開示された解析技術が、演奏位置Ｐ[t]の推定に利用される。また、取得部３２は、深層ニューラルネットワーク（ＤＮＮ）または隠れマルコフモデル（ＨＭＭ）等の統計的推定モデルを利用して演奏位置Ｐ[t]を推定してもよい。

　図２の制御部３３は、演奏位置Ｐ[t]に応じて音響信号Ｘの時間伸縮を実行する。第１実施形態の制御部３３は、特定部３３１と再生部３３２とを具備する。

　図２の特定部３３１は、演奏位置Ｐ[t]に応じた再生位置Ｒ[t]を特定する。特定部３３１は、時間軸上の複数の時点ｔの各々について再生位置Ｒ[t]を特定する。再生位置Ｒ[t]は、音響信号Ｘの始点を基準とした経過時間（例えば秒）である。すなわち、再生位置Ｒ[t]は、時間軸上の１個の時点ｔにおいて、音響信号Ｘのうち始点から時間Ｒ[t]が経過する時点を再生すべきことを意味する。特定部３３１は、概略的には再生位置Ｒ[t]が演奏位置Ｐ[t]に近似し、かつ、音響信号Ｘの再生音について聴感的な自然性が維持されるように、演奏位置Ｐ[t]から再生位置Ｒ[t]を特定する。

　図３には、処理期間Ｑおよび解析期間ｑが図示されている。処理期間Ｑは、時間軸上における時点ｔ1と時点ｔ2との間の期間である。時点ｔ1は、音響信号Ｘの再生中における現在の時点に相当する。時点ｔ2は、時点ｔ1の後方に位置する。具体的には、時点ｔ2は、時点ｔ1に対して所定長ｄだけ後方の時点ｔである。すなわち、処理期間Ｑは所定長ｄの期間である。前述の通り、時点ｔ1においては、時点(t1+d)までの演奏位置Ｐ[t]が取得部３２により推定されている。すなわち、時点ｔ1においては、当該時点ｔ1を始点とする処理期間Ｑ内の各時点ｔについて演奏位置Ｐ[t]が推定されている。他方、時点ｔ1が到来した時点では、処理期間Ｑ内の各時点ｔについて再生位置Ｒ[t]は特定されていない。なお、時点ｔ1は「第１時点」の一例であり、時点ｔ2は「第２時点」の一例である。

　解析期間ｑは、時点ｔ1から時点ｔ3までの期間である。時点ｔ3は、時点ｔ1と時点ｔ2との間に位置する。具体的には、時点ｔ3は、所定長ｄを下回る個数の時点ｔだけ時点ｔ1から後方の時点ｔである。すなわち、解析期間ｑは、処理期間Ｑのうち始点（ｔ1）側の一部の期間である。なお、図３においては、時点ｔ3が時点ｔ1よりも時点ｔ2に近い場合が例示されているが、処理期間Ｑ内における時点ｔ3の位置は任意である。例えば時点ｔ1の直後の時点ｔを時点ｔ3としてもよい。時点ｔ3は、「第３時点」の一例である。

　特定部３３１は、演奏位置Ｐ[t]が推定された処理期間Ｑのうち、解析期間ｑ内における各時点ｔの再生位置Ｒ[t]の時系列を、当該処理期間Ｑ内における演奏位置Ｐ[t]の時系列に応じて推定する。すなわち、時間軸上の解析期間ｑ毎に、当該解析期間ｑ内の各時点ｔに対応する再生位置Ｒ[t]の時系列が特定される。なお、時点ｔ3が時点ｔ1の直後の時点ｔである形態では、時間軸上の時点ｔ毎に再生位置Ｒ[t]が特定される。

　ところで、取得部３２が演奏位置Ｐ[t]を推定する精度は、現在の時点ｔ1から時間軸上で離間した時点ｔほど低下する。以上の事情を考慮して、第１実施形態においては、時点ｔ1から時点ｔ3までの解析期間ｑ内における再生位置Ｒ[t]の時系列が、時点ｔ1から時点ｔ2までの処理期間Ｑ内における演奏位置Ｐ[t]の時系列に応じて推定される。したがって、処理期間Ｑのうち終点の近傍の期間における演奏位置Ｐ[t]の推定誤差の影響（ノイズ）が低減される。すなわち、処理期間Ｑ内の演奏位置Ｐ[t]の時系列を利用して当該処理期間Ｑ内の全体にわたる再生位置Ｒ[t]の時系列を特定する構成と比較して、再生位置Ｒ[t]を適切に特定できる。

　図２の再生部３３２は、音響信号Ｘのうち再生位置Ｒ[t]に対応する部分Ｙを放音装置２３に再生させる。具体的には、再生部３３２は、時間軸上の複数の時点ｔの各々において、音響信号Ｘのうち当該時点ｔの再生位置Ｒ[t]を含む部分Ｙを、放音装置２３に再生させる。部分Ｙは音響信号Ｘのうち再生位置Ｒ[t]に対応する期間内のサンプルの時系列で構成される。なお、音響信号Ｘの部分Ｙをデジタルからアナログに変換するＤ/Ａ変換器、および変換後の信号を増幅する増幅器については、便宜的に図示が省略されている。以下の説明においては、所定の時間長（ホップ長）Ｈtを単位として音響信号Ｘが再生される場合を想定する。

　図４は、制御装置２１が音響信号Ｘの再生のために実行する処理（以下「制御処理」という）Ｓの具体的な手順を例示するフローチャートである。例えば利用者からの指示を契機として制御処理Ｓが開始される。制御処理Ｓが開始されると、解析部３１は、記憶装置２２に記憶された音響信号Ｘの解析により、Ｎ個の単位期間Ｕ[1]～Ｕ[N]の各々について指標Ｗ[n]（Ｗa[n]，Ｗb[n]，Ｗc[n]）を生成する（Ｓa）。

　特定部３３１は、音響信号Ｘの解析により遷移確率τ[n1,n2]を設定する（Ｓb）。遷移確率τ[n1,n2]は、時間軸上の１個の時点(t-1)において音響信号Ｘの単位期間Ｕ[n1]が再生されていた場合に、直後の時点ｔにおいて音響信号Ｘの単位期間Ｕ[n2]が再生される確率である（ｎ1，ｎ2＝１～Ｎ）。すなわち、遷移確率τ[n1,n2]は、再生位置Ｒ[t]が音響信号Ｘの単位期間Ｕ[n1]から単位期間Ｕ[n2]に遷移する確度を意味する。特定部３３１は、音響信号ＸのＮ個の単位期間Ｕ[1]～Ｕ[N]から２個の単位期間Ｕ[n]（Ｕ[n1]およびＵ[n2]）を選択する全通りの組合せについて遷移確率τ[n1,n2]を算定する。なお、単位期間Ｕ[n2]は、単位期間Ｕ[n1]の後方に位置する単位期間Ｕ[n]（ｎ2＞ｎ1）、または、単位期間Ｕ[n1]に一致する単位期間Ｕ[n]（ｎ2＝ｎ1）である。遷移確率τ[n1,n2]に係る単位期間Ｕ[n1]と単位期間Ｕ[n2]とが時間軸上で近いほど、音響信号Ｘの伸長の度合が大きいことを意味する。また、番号ｎ1と番号ｎ2とが共通する遷移確率τ[n,n]（ｎ1＝ｎ2）は、再生位置Ｒ[t]が当該単位期間Ｕ[n]に停留する確度を意味する。以上の説明から理解される通り、再生位置Ｒ[t]は時間軸上の後方に移動する。ただし、時間軸を遡及する方向（過去）における再生位置Ｒ[t]の移動が許容されてもよい。

　なお、指標Ｗ[n]の算定（Ｓa）と遷移確率τ[n1,n2]の設定（Ｓb）とは、制御処理Ｓの開始前に実行されてもよい。また、指標Ｗ[n]の算定（Ｓa）と遷移確率τ[n1,n2]の設定（Ｓb）との先後は反転されてもよい。指標Ｗ[n]および遷移確率τ[n1,n2]は、記憶装置２２に記憶される。以上に説明した準備的な処理（Ｓa，Ｓb）を実行すると、取得部３２は、時間軸上の時点ｔ毎に演奏位置Ｐ[t+d]を推定する（Ｓc）。

　特定部３３１は、特定処理Ｓdを実行する。特定処理Ｓdは、解析期間ｑ内の再生位置Ｒ[t]の時系列を、音響信号Ｘの各指標Ｗ[n]と処理期間Ｑ内の演奏位置Ｐ[t]の時系列とに応じて特定する処理である。時間軸上の解析期間ｑ毎に特定処理Ｓdが実行される。再生部３３２は、音響信号Ｘのうち特定処理Ｓdにより特定された各再生位置Ｒ[t]に対応する部分Ｙを放音装置２３に再生させる（Ｓe）。

　制御装置２１は、所定の終了条件が成立したか否かを判定する（Ｓf）。終了条件は、例えば、利用者からの終了の指示を受付けたこと、または、音響信号Ｘの全部の再生が終了したことである。終了条件が成立しない場合（Ｓf：NO）、制御装置２１は、処理をステップＳCに移行する。すなわち、演奏位置Ｐ[t+d]の推定（Ｓc）と、解析期間ｑ内の再生位置Ｒ[t]の特定（Ｓd）と、音響信号Ｘの部分Ｙの再生（Ｓe）と反復される。他方、終了条件が成立した場合（Ｓf：YES）、制御装置２１は制御処理Ｓを終了する。

　制御装置２１は、処理をステップＳCに移行するたびに（Ｓf：NO）、現時点における解析期間ｑ（すなわち再生位置Ｒ[t]の時系列が特定された期間）の終点を始点として直後の処理期間Ｑを設定し、さらに当該処理期間Ｑ内の解析期間ｑを設定する。すなわち、特定部３３１は、時間軸上の複数の処理期間Ｑの各々について、当該処理期間Ｑのうち解析期間ｑ内の再生位置Ｒ[t]の時系列を特定する。

　以上に説明した通り、第１実施形態においては、音響信号Ｘのうち利用者の演奏位置Ｐ[t]に応じた再生位置Ｒ[t]に対応する部分Ｙが、放音装置２３により再生される。すなわち、利用者による目標楽曲の演奏に応じて音響信号Ｘが時間軸上で伸縮される。したがって、放音装置２３による音響信号Ｘの再生を利用者による目標楽曲の演奏に追従させることが可能である。

　再生位置Ｒ[t]の特定について以下に詳述する。なお、以下の説明においては、関数Ｆ(P[t])と関数Ｅ(n)とを利用する。関数Ｆ(P[t])は、演奏位置Ｐ[t]（秒）を音響信号Ｘにおける単位期間Ｕ[n]の番号ｎに変換するための関数であり、例えば以下の数式(1)で表現される。

　数式(1)の記号round｛｝は四捨五入を意味する。記号ｆsは、音響信号Ｘのサンプリング周波数である。また、記号Ｈnは、音響信号Ｘの解析の単位となる時間長（ホップ長）である。音響信号Ｘの再生に関するホップ長Ｈtは、音響信号Ｘの解析に関するホップ長Ｈbを上回る（Ｈt＞Ｈn）。

　他方、関数Ｅ(n)は、単位期間Ｕ[n]の番号ｎを、音響信号Ｘの始点を基準とした経過時間（例えば秒）に変換するための関数であり、例えば以下の数式(2)で表現される。

　図５は、前述の特定処理Ｓdの説明図である。図５には、時間軸上の各時点ｔ（…，t-2，t-1，ｔ，t+1，t+2，…）と、音響信号Ｘの各単位期間Ｕ[n]（…，Ｕ[n-2]，Ｕ[n-1]，Ｕ[n]，Ｕ[n+1]，Ｕ[n+2]，…）とが図示されている。第１実施形態の特定処理Ｓdは、各単位期間Ｕ[n]と各時点ｔとの相異なる組合せで構成される最尤の経路（以下「最尤経路」という）Ｃを探索する処理（以下「経路探索」という）Ｓd2を含む。最尤経路Ｃは、時間軸上の相異なる時点ｔに対応する複数の位置変数ｃ[t]の時系列で表現される。位置変数ｃ[t]は、音響信号ＸのＮ個の単位期間Ｕ[1]～Ｕ[N]の何れかを指定する（ｃ[t]＝１～Ｎ）。経路探索Ｓd2には、例えばビタビアルゴリズムまたはビーム探索等の動的計画法が利用される。

　図６は、特定処理Ｓdの具体的な手順を例示するフローチャートである。特定処理Ｓdが開始されると、特定部３３１は、処理期間Ｑ内の各時点ｔについて観測尤度Ｌ[t,n]を算定する（Ｓd1）。観測尤度Ｌ[t,n]は、音響信号ＸのＮ個の単位期間Ｕ[1]～Ｕ[N]のうち第ｎ番目の単位期間Ｕ[n]が時点ｔにおいて再生されるべき尤度である。すなわち、観測尤度Ｌ[t,n]は、音響信号Ｘの各単位期間Ｕ[n]が時点ｔの再生位置Ｒ[t]に該当する確度を意味する。

　特定部３３１は、経路探索Ｓd2により最尤経路Ｃを推定する。経路探索Ｓd2には、処理期間Ｑ内の各時点ｔにおける観測尤度Ｌ[t,n]と、音響信号Ｘの遷移確率τ[n1,n2]とが適用される。以上の説明の通り、第１実施形態においては、音響信号Ｘの２個の単位期間Ｕ[n]（Ｕ[n1]，Ｕ[n2]）の組合せ毎の遷移確率τ[n1,n2]を適用した経路探索Ｓd2により、再生位置Ｒ[t]の時系列を適切に特定できる。

　経路探索Ｓd2において、特定部３３１は、処理期間Ｑの始点（時点ｔ1）における位置変数ｃ[t1]と処理期間Ｑの終点（時点ｔ2）における位置変数ｃ[t2]とを固定した拘束条件のもとで最尤経路Ｃを探索する。具体的には、時点ｔ1の位置変数ｃ[t1]は、当該時点ｔ1について推定された演奏位置Ｐ[t1]を数式(1)の関数Ｆ(Ｐ[t])により変換した数値Ｆ(Ｐ[t1])に固定される。また、時点ｔ2の位置変数ｃ[t2]は、当該時点ｔ2について推定された演奏位置Ｐ[t2]を数式(1)の関数Ｆ(Ｐ[t])により変換した数値Ｆ(Ｐ[t2])に固定される。

　最尤経路Ｃは、前述の通り、解析期間ｑ内の相異なる時点ｔに対応する位置変数ｃ[t]の時系列で表現される。特定部３３１は、各位置変数ｃ[t]が指定する単位期間Ｕ[n]の番号ｎを関数Ｅ(n)により変換することで、解析期間ｑ内の各時点ｔについて再生位置Ｒ[t]を算定する（Ｓd3）。すなわち、第１実施形態の特定部３３１は、図３に例示される通り、解析期間ｑの時点ｔ1の再生位置Ｒ[t1]を、当該時点ｔ1の演奏位置Ｐ[t1]に固定し、解析期間ｑの時点ｔ2の再生位置Ｒ[t2]を、当該時点ｔ2の演奏位置Ｐ[t2]に固定した拘束条件のもとで、解析期間ｑ内における再生位置Ｒ[t]の時系列を特定する。以上の構成によれば、解析期間ｑ内において再生位置Ｒ[t]が演奏位置Ｐ[t]から過度に乖離する可能性が低減される。

　以上の説明の通り、第１実施形態においては、再生位置Ｒ[t]の時系列を特定する経路探索Ｓd2が、時間軸上の処理期間Ｑ毎に実行される。したがって、演奏位置Ｐ[t]の移動の速度が不規則に変動した場合でも、利用者による演奏に高精度に追従した再生位置Ｒ[t]を特定できる。

　観測尤度Ｌ[t,n]および遷移確率τ[n1,n2]について以下に詳述する。

（１）観測尤度Ｌ[t,n]の算定（Ｓd1）
　観測尤度Ｌ[t,n]は、前述の通り、時間軸上の各時点ｔにおいて音響信号Ｘの単位期間Ｕ[n]が再生されるべき尤度である。特定部３３１は、時間軸上の複数の時点ｔの各々について、以下の数式(3)の演算により観測尤度Ｌ[t,n]を算定する。

　数式(1)は、観測尤度Ｌ[t,n]が、単位期間Ｕ[n]の番号ｎを確率変数とする正規分布（Normal）に従うことを意味する。観測尤度Ｌ[t,n]の確率分布の平均は、取得部３２が推定した演奏位置Ｐ[t]を単位期間Ｕ[n]の番号ｎに変換した数値Ｆ(P[t])に設定される。すなわち、観測尤度Ｌ[t,n]の確率分布の平均は、演奏位置Ｐ[t]に応じて設定される。以上の構成によれば、解析期間ｑ内において再生位置Ｒ[t]が演奏位置Ｐ[t]から過度に乖離する可能性が低減される。

　また、観測尤度Ｌ[t,n]の確率分布の分散σ(Ｗb[n]，Ｏ)は、前述の変動指標Ｗb[n]と発音点群Ｏとを変数とする関数で表現される。発音点群Ｏは、音響信号Ｘの発音点に該当する演奏位置Ｐ[t]に対応する時点ｔの集合である。すなわち、発音点群Ｏを構成する各時点ｔは、以下の数式(4a)および数式(4b)を充足する。

　数式(4a)は、時点(t-1)の演奏位置Ｐ[t-1]と直後の時点ｔの演奏位置Ｐ[t]とが相違することを意味する。数式(4b)は、演奏位置Ｐ[t]に対応する単位期間Ｕ[n]における発音点指標Ｗc[F(P[t])]が、発音点に該当することを意味する数値「１」であることを意味する。

　観測尤度Ｌ[t,n]に関する確率分布の分散σ(Ｗb[n]，Ｏ)は、例えば以下の数式(5)で表現される。

　数式(5)の記号εは、充分に小さい正数である（ε≪１）。また、数式(5)の関数Ｉ[c]は、条件ｃが成立する場合に数値「１」に設定され、条件ｃが成立しない場合に数値「０」に設定される指示関数（インジケータ関数）である。

　数式(5)から理解される通り、時点ｔが発音点に該当する場合（ｔ∈Ｏ）、数式(5)の右辺における第２項が消去されるから、分散σ(Ｗb[n]，Ｏ)は、充分に小さい数値εに設定される。他方、時点ｔが発音点に該当しない場合、数式(5)の右辺における第１項が消去されるから、分散σ(Ｗb[n]，Ｏ)は、変動指標Ｗb[n]に応じた数値１/Ｗb[n]に設定される。時点ｔが発音点に該当する場合の分散σ(Ｗb[n]，Ｏ)の数値εは、時点ｔが発音点に該当しない場合の分散σ(Ｗb[n]，Ｏ)の数値１/Ｗb[n]を下回る。時点ｔが発音点に該当する場合における確率分布の分散εは「第１分散」の一例であり、時点ｔが発音点に該当しない場合における確率分布の分散１/Ｗb[n]は「第２分散」の一例である。

　したがって、発音点に該当する時点ｔ（ｔ∈Ｏ）においては、観測尤度Ｌ[t,n]は、確率変数ｎの平均Ｆ(P[t])の近傍にて局所的に高い数値となる。すなわち、発音点に該当する時点ｔにおいては、再生位置Ｒ[t]が演奏位置Ｐ[t]に近似または一致する可能性が、再生位置Ｒ[t]が演奏位置Ｐ[t]から乖離する可能性と比較して充分に高い。したがって、音響信号Ｘの再生を利用者による目標楽曲の演奏に追従させ易いという利点がある。

　ところで、音響信号Ｘのうち音響特性の変動が顕著な期間を時間軸上で伸縮すると、再生音が聴感的に不自然な印象となる可能性がある。他方、音響信号Ｘのうち音響特性が安定的に維持される期間は、時間軸上で伸縮しても再生音の聴感的な不自然性は顕在化し難い。

　以上の傾向を考慮して、第１実施形態の特定部３３１は、前掲の数式(5)から理解される通り、時点ｔが発音点に該当しない場合における観測尤度Ｌ[t,n]の確率分布の分散σ(Ｗb[n]，Ｏ)を、変動指標Ｗb[n]に応じた数値に設定する。具体的には、変動指標Ｗb[n]が小さいほど分散σ(Ｗb[n]，Ｏ)は大きい数値に設定される。すなわち、時点ｔが発音点に該当する場合と比較して、演奏位置Ｐ[t]から乖離した再生位置Ｒ[t]が特定される可能性が増加する。前述の通り、音響信号Ｘの音響特性が安定的に維持されるほど、変動指標Ｗb[n]は小さい数値に設定される。したがって、音響信号Ｘの音響特性が安定的に維持される期間（すなわち変動指標Ｗb[n]が小さい期間）ほど、再生位置Ｒ[t]が演奏位置Ｐ[t]から乖離する可能性が増加する。以上の構成によれば、音響信号Ｘの音響特性が安定的に維持される期間は時間軸上で伸縮され易く、音響特性が不安定に変動する期間は伸縮され難い、という傾向が実現される。したがって、聴感的に自然な印象の再生音を再生できる。

（２）遷移確率τ[n1,n2]の算定（Ｓb）
　遷移確率τ[n1,n2]は、前述の通り、再生位置Ｒ[t]が音響信号Ｘの単位期間Ｕ[n1]から後方の単位期間Ｕ[n2]に遷移する確度を意味する。特定部３３１は、音響信号ＸのＮ個の単位期間Ｕ[1]～Ｕ[N]から２個の単位期間Ｕ[n]（Ｕ[n1]，Ｕ[n2]）を選択する全通りの組合せについて遷移確率τ[n1,n2]を算定する。

　図７および図８は、特定部３３１が遷移確率τ[n1,n2]を算定する処理（以下「確率設定処理」という）Ｓbの具体的な手順を例示する。確率設定処理Ｓbが開始されると、特定部３３１は、音響信号ＸのＮ個の単位期間Ｕ[1]～Ｕ[N]から２個の単位期間Ｕ[n]（Ｕ[n1]，Ｕ[n2]）の組合せを選択する（Ｓb1）。

　特定部３３１は、遷移前の単位期間Ｕ[n1]が発音間期間Ｖの最後の単位期間Ｕ[n]に該当するか否かを判定する（Ｓb2）。発音間期間Ｖは、各発音点を境界として音響信号Ｘを時間軸上で区分した期間である。図９には、時間軸上で相前後する２個の発音間期間Ｖ（Ｖ1，Ｖ2）が図示され、単位期間Ｕ[n1]が発音間期間Ｖ1の末尾に位置する場合（Ｓb2：YES）が想定されている。

　遷移前の単位期間Ｕ[n1]が発音間期間Ｖ1の末尾に位置する場合（Ｓb2：YES）、特定部３３１は、所定の条件が成立するか否かを判定する（Ｓb3）。具体的には、特定部３３１は、単位期間Ｕ[n1]と単位期間Ｕ[n2]とが一致するという第１条件（ｎ1＝ｎ2）、または、遷移後の単位期間Ｕ[n2]が遷移前の単位期間Ｕ[n1]の直後の単位期間Ｕ[n1+1]であるという第２条件が成立するか否かを判定する。第１条件は、再生位置Ｒ[t]が発音間期間Ｖ1の最後の単位期間Ｕ[n]に滞留することを意味する。第２条件は、再生位置Ｒ[t]が発音間期間Ｖ1の最後の単位期間Ｕ[n]から直後の発音間期間Ｖ2内の単位期間Ｕ[n+1]に遷移することを意味する。

　第１条件または第２条件が成立する場合（Ｓb3：YES）、特定部３３１は、以下の規則で遷移確率τ[n1,n2]を設定する（Ｓb4）。具体的には、第１条件が成立する場合、特定部３３１は、遷移確率τ[n1,n2]（ｎ1＝ｎ2）を所定値αHに設定する。他方、第２条件が成立する場合、特定部３３１は、遷移確率τ[n1,n2]（n2=n1+1）を所定値αLに設定する。所定値αHおよび所定値αLは、所定の正数である。所定値αHは所定値αLよりも充分に大きい数値に設定される（αH≫αL）。例えば、所定値αHは「１」以下で「１」に充分に近い正数に設定され、所定値αLは「１」から所定値αHを減算した数値（αL＝１－αH）に設定される。

　以上の説明から理解される通り、発音間期間Ｖ1の最後の単位期間Ｕ[n1]に再生位置Ｒ[t]が停留する遷移確率τ[n1,n2]（＝αH）は、発音間期間Ｖ1の最後の単位期間Ｕ[n1]から直後の発音間期間Ｖ1の最初の単位期間Ｕ[n2]に再生位置Ｒ[t]が遷移する遷移確率τ[n1,n2]（＝αL）を充分に上回る。以上の構成によれば、音響信号Ｘの発音点を跨ぐ再生位置Ｒ[t]の遷移が抑制されるから、１個の発音点に対応する音響成分が複数回にわたり反復的に再生される可能性が低減される。例えば、音響信号Ｘの再生音である歌唱音声が、どもり（Stutter）のように受聴者に知覚される可能性が低減される。すなわち、聴感的に自然な印象の再生音を再生できる。なお、再生位置Ｒ[t]が１個の単位期間Ｕ[n]に継続的に滞留する場合に、音響信号Ｘの再生音の音量を経時的に減少させてもよい。

　他方、単位期間Ｕ[n1]が発音間期間Ｖの最後の単位期間Ｕ[n]に該当しない場合（Ｓb2：NO）、または、所定の条件が成立しない場合（Ｓb3：NO）、特定部３３１は、図８に例示される通り、遷移後の単位期間Ｕ[n2]が遷移前の単位期間Ｕ[n1]に対して時間軸上において所定の範囲内にあるか否かを判定する（Ｓb5）。具体的には、特定部３３１は、単位期間Ｕ[n1]を始端とする所定長Δnの範囲内に単位期間Ｕ[n2]が位置するか否かを判定する。遷移後の単位期間Ｕ[n2]の番号ｎ2が番号ｎ1以上かつ(n1+Δn)以下である場合（ｎ1≦ｎ2≦ｎ1＋Δn）に、当該判定の結果は肯定となる。単位期間Ｕ[n2]の番号ｎ2が所定値(n1+Δn)を上回る場合、再生位置Ｒ[t]が単位期間Ｕ[n1]から過度に大きく後方に移動することを意味する。

　単位期間Ｕ[n2]が所定の範囲内にある場合（Ｓb5：YES）、特定部３３１は、遷移前の単位期間Ｕ[n1]および遷移後の単位期間Ｕ[n2]の双方において音響信号Ｘが無音であるか否かを判定する（Ｓb6）。すなわち、有音指標Ｗa[n1]および有音指標Ｗa[n2]の双方が、無音を意味する数値「０」であるか否かが判定される。単位期間Ｕ[n1]および単位期間Ｕ[n2]の双方が無音である場合（Ｓb6：YES）、特定部３３１は、以下の数式(6)により遷移確率τ[n1,n2]を設定する（Ｓb7）。

　数式(6)の記号βは所定の正数を意味し、記号τ0は所定の閾値を意味する。数式(6)から理解される通り、番号ｎ1と番号ｎ2との差分の絶対値|n1-n2|が閾値τ0を下回る場合、遷移確率τ[n1,n2]は所定値βに設定される。他方、絶対値|n1-n2|が閾値τ0以上である場合、遷移確率τ[n1,n2]は「０」に設定される。以上の説明から理解される通り、時間軸上の遷移量|n1-n2|が閾値τ0を下回る範囲内においては、所定値βを遷移確率τ[n1,n2]として、再生位置Ｒ[t]の遷移が許容される。他方、時間軸上の遷移量|n1-n2|が閾値τ0を上回るような再生位置Ｒ[t]の遷移は禁止される（τ[n1,n2]＝０）。

　他方、単位期間Ｕ[n1]および単位期間Ｕ[n2]の一方または双方において音響信号Ｘが有音である場合（Ｓb6：NO）、特定部３３１は、以下の数式(7)により遷移確率τ[n1,n2]を設定する（Ｓb8）。

　数式(7)は、遷移確率τ[n1,n2]が、番号ｎ1と番号ｎ2との差分（n1-n2）を確率変数とする正規分布（Normal）に従うことを意味する。差分(n1-n2)は、時点(t-1)と時点ｔとの間における再生位置Ｒ[t]の移動量、すなわち再生位置Ｒ[t]の移動速度に相当する。

　遷移確率τ[n1,n2]の確率分布の平均は、前述の標準速度Ｐ0に設定される。標準速度Ｐ0は、音響信号Ｘの標準的な再生速度に相当し、所定の正数に設定される。具体的には、標準速度Ｐ0は、音響信号Ｘの再生位置Ｒ[t]が標準的な速度で時間軸上を移動する場合において、時点(t-1)と時点ｔとの間における番号ｎの変化量を意味する。例えば、標準速度Ｐ0は、ホップ長Ｈtに対するホップ長Ｈnの比に設定される（Ｐ0＝Ｈn/Ｈt）。

　遷移確率τ[n1,n2]の確率分布の分散は、変動指標Ｗb[n]に応じた数値Ｐ0/Ｗb[n1]に設定される。具体的には、変動指標Ｗb[n1]が小さいほど、確率分布の分散Ｐ0/Ｗb[n1]は大きい数値に設定される。すなわち、変動指標Ｗb[n1]が小さいほど、再生位置Ｒ[t]の移動速度が標準速度Ｐ0から乖離する可能性が増加する。前述の通り、音響信号Ｘの音響特性が安定的に維持されるほど、変動指標Ｗb[n]は小さい数値に設定される。したがって、例えば、音響信号Ｘのうち音響特性が安定的に維持される期間（すなわち変動指標Ｗb[n]が小さい期間）においては、遷移確率τ[n1,n2]の確率分布における分散Ｐ0/Ｗb[n1]が大きい数値に設定され、結果的に再生位置Ｒ[t]の移動速度が標準速度Ｐ0から乖離することが許容される。他方、音響信号Ｘのうち音響特性が不安定に変動する期間（すなわち変動指標Ｗb[n]が大きい期間）においては、遷移確率τ[n1.n2]の確率分布における分散Ｐ0/Ｗb[n1]が小さい数値に設定され、結果的に再生位置Ｒ[t]の移動速度が標準速度Ｐ0に近い速度に維持される。すなわち、音響信号Ｘの音響特性が安定的に維持される期間は時間軸上で伸縮され易く、音響特性が不安定に変動する期間は伸縮され難い。したがって、聴感的に自然な印象の再生音を再生できる。

　なお、単位期間Ｕ[n1]および単位期間Ｕ[n2]の双方において音響信号Ｘが無音である場合（Ｗa[n1]＝Ｗa[n2]＝０）における遷移確率τ[n1,n2]（＝β）は、単位期間Ｕ[n1]および単位期間Ｕ[n2]の一方または双方において音響信号Ｘが有音である場合における遷移確率τ[n1,n2]を上回る。以上の条件のもとでは、音響信号Ｘのうち無音期間内における再生位置Ｒ[t]の遷移が、有音期間と無音期間との間における再生位置Ｒ[t]の遷移、または、有音期間内における再生位置Ｒ[t]の遷移と比較して発生し易い。したがって、有音期間内における再生位置Ｒ[t]の遷移が頻発する形態と比較して、聴感的に自然な印象の再生音を再生できる。

　単位期間Ｕ[n2]が単位期間Ｕ[n1]に対して所定の範囲内にない場合（Ｓb5：NO）、特定部３３１は、遷移確率τ[n1,n2]を所定値γに設定する（Ｓb9）。所定値γは、数式(6)における所定値βと比較して充分に小さい正数に設定される。すなわち、単位期間Ｕ[n1]から所定の範囲の外側の単位期間Ｕ[n2]に再生位置Ｒ[t]が遷移することも、当該範囲内における再生位置Ｒ[t]の遷移と比較して低確率（所定値γ）ではあるが許容される。

　以上の処理により現在の組合せ（Ｕ[n1]，Ｕ[n2]）に係る遷移確率τ[n1,n2]を算定すると（Ｓb4，Ｓb7，Ｓb8，Ｓb9）、特定部３３１は、図７に例示される通り、音響信号ＸのＮ個の単位期間Ｕ[1]～Ｕ[N]から２個を選択する全通りの組合せについて遷移確率τ[n1,n2]を設定したか否かを判定する（Ｓb10）。未設定の遷移確率τ[n1,n2]がある場合（Ｓb10：NO）、特定部３３１は処理をステップＳb1に移行する。すなわち、遷移確率τ[n1,n2]が設定されていない２個の単位期間Ｕ[n]（Ｕ[n1]，Ｕ[n2]）を新規に選択し（Ｓb1）、当該組合せに係る遷移確率τ[n1,n2]を設定する（Ｓb2～Ｓb9）。他方、全部の遷移確率τ[n1,n2]を設定した場合（Ｓb10：YES）、特定部３３１は確率設定処理Ｓbを終了する。

Ｂ：第２実施形態
　放音装置２３が再生する音響信号Ｘの音響と鍵盤楽器１０が放音する音響との間で音量が乖離する形態では、両者間の音楽的な統一感を生成できない可能性がある。以上の事情を考慮して、第２実施形態においては、音響信号Ｘの再生音の音量（以下「再生音量」という）を、利用者による鍵盤楽器１０の操作の強度（以下「操作強度」という）に連動させる。具体的には、再生部３３２は、利用者による操作強度に応じて音響信号Ｘの再生音量を制御する。再生部３３２以外の各要素の構成および動作は第１実施形態と同様である。したがって、第２実施形態においても第１実施形態と同様の効果が実現される。

　図１０は、第２実施形態における再生部３３２が実行する処理（以下「再生処理」という）Ｓeの具体的な手順を例示するフローチャートである。再生処理Ｓeが開始されると、再生部３３２は、以下の数式(8a)および数式(8b)により、操作強度Λ[k]を算定する（Ｓe1）。操作強度Λ[k]は、演奏データＤにより指定される数値（ベロシティ）である。

　図１１は、操作強度Λ[k]の説明図である。数式(8)の記号ｋは、鍵盤楽器１０に対する各回の操作（具体的には押鍵）を識別するための番号である。記号ｔ[k]は、操作kが発生した時点を意味する。図１１に例示される通り、時点ｔ[k-1]において操作強度λ[k-1]の操作(k-1)が発生し、時点ｔ[k-1]の後方の時点ｔ[k]において操作強度λ[k]の操作ｋが発生した場合を想定する。操作ｋは、例えば操作(k-1)の直後の押鍵である。時点ｔ[k-1]は「第１時点」の一例であり、操作(k-1)は「第１操作」の一例である。また、時点ｔ[k]は「第２時点」の一例であり、操作ｋは「第２操作」の一例である。

　数式(8a)から理解される通り、再生部３３２は、操作強度ｚ[k]と操作強度λ[k]とのうち何れか大きい方（max）を、時点ｔ[k]における操作強度Λ[k]として選択する。操作強度ｚ[k]は、数式(8b)から理解される通り、操作(k-1)の操作強度λ[k-1]を、時点ｔ[k-1]から時点ｔ[k]まで経時的に減少させた強度である。数式(8b)の記号λは、操作強度λ[k-1]が経時的に減衰する度合を示す所定の正数である。操作強度ｚ[k]は「第１強度」の一例であり、操作強度λ[k]は「第２強度」の一例である。

　以上の演算により操作強度Λ[k]を算定すると、再生部３３２は、当該操作強度Λ[k]に応じて調整値Ｇを算定する（Ｓe2）。調整値Ｇは、音響信号Ｘのうち再生対象の部分Ｙに乗算される係数（ゲイン）である。具体的には、再生部３３２は、以下の数式(9)により調整値Ｇを算定する。

　数式(9)から理解される通り、調整値Ｇは、最小値０.３と最大値１との間の範囲内において操作強度Λ[k]に応じて変化する。具体的には、操作強度Λ[k]が大きいほど調整値Ｇは大きい数値に設定される。再生部３３２は、調整値Ｇを利用して音響信号Ｘの再生音量を調整する（Ｓe3）。具体的には、再生部３３２は、音響信号Ｘのうち再生位置Ｒ[t]に対応する部分Ｙに対して調整値Ｇを乗算する。以上の説明から理解される通り、再生部３３２は、操作強度Λ[k]に応じて音響信号Ｘの再生音量を制御する。第２実施形態における再生処理Ｓeの具体例は以上の通りである。

　第２実施形態においては、操作(k-1)の操作強度λ[k-1]を時点ｔ[k]まで経時的に減少させた操作強度ｚ[k]と、当該時点ｔ[k]における操作ｋの操作強度λ[k]とのうち何れか大きい方（すなわち操作強度Λ[k]）に応じて音響信号Ｘの再生音量が制御される。したがって、例えば操作強度λ[k]が操作強度λ[k-1]と比較して充分に小さい場合でも、操作強度λ[k-1]を時点ｔ[k]まで経時的に減少させた操作強度Λ[k]が充分に大きい場合には、音響信号Ｘの再生音量は充分に維持される。したがって、操作毎の操作強度λ[k]に応じて再生音量を制御する構成と比較して、利用者の演奏に対して適切に再生音量を制御できる。

Ｃ：変形例
　以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された２以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。

（１）前述の各形態においては、鍵盤楽器１０を例示したが、利用者が目標楽曲を演奏する楽器の種類は鍵盤楽器１０に限定されない。例えば、弦楽器，管楽器または打楽器等、任意の種類の楽器が、利用者による目標楽曲の演奏に利用される。例えば、取得部３２は、任意の楽器から供給される演奏データＤの解析により演奏位置Ｐ[t]を推定する。また、演奏データＤを生成する装置は、楽器以外の形態の装置でもよい。例えばスマートフォンまたはタブレット端末等の情報装置，あるいは例えばキーボード等の操作装置等、利用者による演奏の指示を受付ける任意の形態の装置が、前述の鍵盤楽器１０に代えて利用される。

　なお、前述の各形態においては、利用者による演奏の指示を表す指示データを演奏データＤとして例示したが、演奏の解析（演奏位置Ｐ[t]の推定）に利用される演奏データＤの種類は、指示データに限定されない。例えば、利用者による演奏で発音される音響の波形を表す音響データが、演奏データＤとして演奏の解析に利用されてもよい。

（２）前述の各形態においては、処理期間Ｑの一部を解析期間ｑとして再生位置Ｒ[t]を特定したが、処理期間Ｑの全部を解析期間ｑとして特定部３３１が再生位置Ｒ[t]を特定してもよい。すなわち、時点ｔ2と時点ｔ3とは時間軸上で一致してもよく、処理期間Ｑと解析期間ｑとの区別は省略される。

（３）前述の各形態においては、観測尤度Ｌ[t,n]の確率分布における分散σ(Ｗb[n]，Ｏ)を変動指標Ｗb[n]に応じて変化させたが、観測尤度Ｌ[t,n]の確率分布の分散を、変動指標Ｗb[n]に依存しない所定値に設定してもよい。同様に、前述の各形態においては、遷移確率τ[n1.n2]の確率分布における分散Ｐ0/Ｗb[n1]を変動指標Ｗb[n]に応じて変化させたが、遷移確率τ[n1,n2]の確率分布の分散を、変動指標Ｗb[n]に依存しない所定値に設定してもよい。

（４）再生位置Ｒ[t]の移動速度を所定の範囲内に制限してもよい。例えば、時点(t-1)と時点ｔとの間における再生位置Ｒ[t]の移動量が所定の上限値を上回る場合、特定部３３１は、当該上限値に対応する数値に再生位置Ｒ[t]を設定する。他方、時点(t-1)と時点ｔとの間における再生位置Ｒ[t]の移動量が所定の下限値を下回る場合、特定部３３１は、当該下限値に対応する数値に再生位置Ｒ[t]を設定する。以上の構成によれば、演奏位置Ｐ[t]と再生位置Ｒ[t]との過度な乖離を抑制できる。

（５）演奏位置Ｐ[t]と再生位置Ｒ[t]との差分が所定の閾値を上回る場合に、特定部３３１が再生位置Ｒ[t]を演奏位置Ｐ[t]に初期化（Ｒ[t]＝Ｐ[t]）してもよい。以上の構成によれば、再生位置Ｒ[t]と演奏位置Ｐ[t]との過度な乖離が抑制される。また、再生位置Ｒ[t]を演奏位置Ｐ[t]に初期化した時点から所定の期間内においては、再生位置Ｒ[t]を標準速度Ｐ0で変化させてもよい。すなわち、当該期間内においては再生位置Ｒ[t]に演奏位置Ｐ[t]を反映させなくてもよい。

（６）前述の各形態においては、記憶装置２２に記憶された音響信号Ｘの解析により解析部３１が指標Ｗ[n]を生成したが、音響信号Ｘに関する指標Ｗ[n]が事前に記憶装置２２に記憶された形態では、解析部３１は省略されてもよい。例えば、音響信号Ｘに関する指標Ｗ[n]が外部装置から信号処理システム２０に提供される形態では、解析部３１は省略される。

（７）前述の各形態における経路探索Ｓd2には、前述の各形態における例示の通り、種々の条件（以下「探索条件」という）が適用される。探索条件は、音響信号Ｘの特性に応じて設定される条件である。探索条件は、再生位置Ｒ[t]に関する拘束条件のほか、経路探索Ｓd2に適用される変数の数値を含む。拘束条件は、前述の例示の通り、例えば、解析期間ｑの時点ｔ1の再生位置Ｒ[t1]を当該時点ｔ1の演奏位置Ｐ[t1]に固定し、解析期間ｑの時点ｔ2の再生位置Ｒ[t2]を当該時点ｔ2の演奏位置Ｐ[t2]に固定する、という条件である。また、経路探索Ｓd2に適用される変数に関する探索条件としては、観測尤度Ｌ[t,n]，遷移確率τ[n1,n2]および変動指標Ｗb[t]等の指標が例示される。すなわち、経路探索Ｓd2に適用される任意の変数が探索条件の概念に包含される。

（８）前述の各形態においては、取得部３２が、利用者による目標楽曲の演奏位置Ｐ[t]を特定する形態を例示したが、再生位置Ｒ[t]の特定に利用される情報は演奏位置Ｐ[t]に限定されない。例えばマウスまたはタッチパネル等の操作装置に対する操作に応じて目標楽曲内で変化する位置を、演奏位置Ｐ[t]に代替してもよい。例えば、利用者が目標楽曲について指示および変更する位置が、演奏位置Ｐ[t]に置換される。以上の例示から理解される通り、再生位置Ｒ[t]の特定に利用される位置は、利用者の動作に応じて目標楽曲内において時間軸上で変化する位置（以下「指示位置」という）として包括的に表現される。前述の各形態における演奏位置Ｐ[t]と、操作装置に対する操作で利用者が指示する位置とは、指示位置の具体例である。なお、指示位置の指示のために利用者が使用する操作装置として、例えば、利用者による操作に応じて円盤状のターンテーブルが回転するＤＪコントローラが利用されてもよい。取得部３２は、ターンテーブルの回転の角度に応じて指示位置を特定する。

（９）前述の各形態においては、目標楽曲の演奏音を表す音響信号Ｘを利用者による鍵盤楽器１０の演奏に応じて伸縮したが、伸縮対象となる時系列信号は音響信号Ｘに限定されない。例えば、目標楽曲に関連する映像を表す映像信号を、利用者による演奏に応じて時間軸上で伸縮してもよい。映像信号は、例えば、目標楽曲の演奏に並行して表示されるべき動画等の映像を表す。

　映像信号を処理する形態において、取得部３２による演奏位置Ｐ[t]の推定および特定部３３１による再生位置Ｒ[t]の特定は、前述の各形態と同様である。再生部３３２は、映像信号のうち再生位置Ｒ[t]に対応する部分を表示装置に表示させる。映像信号の解析により解析部３１が算定する変動指標Ｗb[n]は、例えば、映像信号における映像特性の変動の度合を表す変数である。映像特性は、例えば画像の明度である。また、時間軸上で相前後する画像の変化を表す指標（動きベクトル）を、変動指標Ｗb[n]として解析部３１が算定してもよい。

　以上の説明から理解される通り、信号処理システム２０による処理対象となる信号は、目標楽曲に関する音響または映像を表す時系列信号（例えば音響信号Ｘまたは映像信号）として包括的に表現される。また、再生部３３２は、時系列信号のうち再生位置Ｒ[t]に対応する部分を再生装置に再生させる要素である。再生装置は、音響信号Ｘが表す音響を再生する放音装置２３、または、映像信号が表す映像を表示する表示装置を包含する。

（１０）例えばスマートフォンまたはタブレット端末等の情報装置と通信するサーバ装置により信号処理システム２０が実現されてもよい。例えば、情報装置に接続された鍵盤楽器１０が生成する演奏データＤが、当該情報装置から信号処理システム２０に送信される。信号処理システム２０においては、前述の各形態と同様に、取得部３２による演奏位置Ｐ[t]の推定と、特定部３３１による再生位置Ｒ[t]の特定とが実行される。再生部３３２は、音響信号Ｘのうち再生位置Ｒ[t]に対応する部分Ｙを情報装置に送信する。情報装置は、信号処理システム２０から受信した部分Ｙを再生する放音装置２３を具備する。以上の構成においても、前述の各形態と同様の効果が実現される。音響信号Ｘの部分Ｙを再生部３３２が情報装置に送信する動作は、当該部分を情報装置に再生させる動作として表現される。

（１１）前述の各形態に係る信号処理システム２０の機能は、前述の通り、制御装置２１を構成する単数または複数のプロセッサと、記憶装置２２に記憶されたプログラムとの協働により実現される。本開示に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性（non-transitory）の記録媒体であり、ＣＤ-ＲＯＭ等の光学式記録媒体（光ディスク）が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号（transitory, propagating signal）を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、配信装置が通信網を介してプログラムを配信する構成では、当該配信装置においてプログラムを記憶する記録媒体が、前述の非一過性の記録媒体に相当する。

Ｄ：付記
　以上に例示した形態から、例えば以下の構成が把握される。

　本開示のひとつの態様（態様１）に係る信号処理システムは、楽曲の再生に追従して時系列信号を再生装置に再生させる信号処理システムであって、前記楽曲の再生における利用者による指示位置を取得する取得部と、前記指示位置に応じて前記時系列信号の時間伸縮を実行する制御部とを具備する。以上の形態によれば、楽曲の再生における利用者による指示位置に応じて時系列信号が時間伸縮（タイムストレッチ）される。したがって、時系列信号の再生を利用者による指示に追従させることが可能である。

　「指示位置」は、楽曲内において利用者により指示された位置である。具体的には、利用者による動作に応じて楽曲内で変化する位置が「指示位置」として例示される。「指示位置」の典型例は、例えば楽曲内において利用者が演奏する時間軸上の位置（演奏位置）である。ただし、指示位置に反映される利用者の動作は「演奏」に限定されない。例えばマウスまたはタッチパネル等の操作装置に対する操作（「動作」の他例）に応じて「指示位置」が変化する形態も想定される。また、「指示位置」には、利用者が現時点で指示する位置のほか、利用者が今後に指示すると予測される位置も包含される。

　「時系列信号」は、再生対象となる時間領域の信号である。具体的には、「時系列信号」は、例えば音響または映像を表す時間領域の信号である。具体的には、楽曲の演奏音を表す音響信号、または楽曲の演奏に並行して表示されるべき映像を表す映像信号が、「時系列信号」の典型例である。したがって、「再生装置」は、例えば、音響信号が表す音響を放音する放音装置、または、映像信号が表す映像を表示する表示装置である。

　「音響信号」が表す演奏音は、演奏により楽器が発音する楽音のほか、歌唱者が発音する音声（歌唱音声）も包含する。音響信号が表す演奏音と利用者による演奏により発音される演奏音とは、共通の楽曲に対応するという関係にあるが、両者間の具体的な関係は任意である。例えば、音響信号が表す演奏音の演奏パートと利用者が演奏する演奏パートとの異同は不問である。すなわち、楽曲の複数の演奏パートのうち１以上の演奏パートを利用者が演奏する場合を想定すると、音響信号は、当該１以上の演奏パートの演奏音、または、当該１以上の演奏パート以外の１以上の演奏パートの演奏音を表す。

　態様１の具体例（態様２）において、前記時系列信号は、音響または映像を表す信号であり、前記取得部は、時間経過に従い複数の指示位置を取得し、前記制御部は、前記複数の指示位置のうち相異なる２以上の指示位置と、前記時系列信号の特性に応じた探索条件と、を適用した経路探索により前記時間伸縮を実行する。「探索条件」は、時系列信号の特性に応じて設定され、経路探索に適用される条件である。「探索条件」は、再生位置に関する拘束条件（例えば態様７）のほか、経路探索に適用される変数の数値（例えば態様８，１０，１１）を含む。

　態様１または態様２の具体例（態様３）において、前記楽曲の再生は、前記利用者による前記楽曲の演奏である。以上の態様によれば、時系列信号の再生を、利用者による楽曲の演奏に追従させることが可能である。

　「演奏」は、利用者が音楽を進行させる動作を意味し、楽器等の機器の操作により当該楽器を発音させる動作（狭義の演奏）のほか、利用者が楽曲を歌唱する動作も含む広義の概念である。利用者による演奏を解析することで指示位置（演奏位置）が特定される。「演奏の解析」は、例えば、利用者による演奏を表す演奏データを解析することで実現される。演奏データは、利用者による演奏の指示を表す指示データ（例えばＭＩＤＩデータ）、または、利用者による演奏で発音される音響の波形を表す音響データ（例えばサンプル系列）である。

　態様１の具体例（態様４）において、前記制御部は、前記時系列信号のうち前記指示位置に応じた再生位置を特定する特定部と、前記時系列信号のうち前記再生位置に対応する部分を再生装置に再生させることで前記時間伸縮を実行する再生部とを含む。以上の態様によれば、時系列信号のうち再生位置に対応する部分を再生装置に再生させることで、指示位置の変化に追従した時系列信号の時間伸縮が実現される。「再生位置」は、時系列信号における時間軸上の位置である。

　態様４の具体例（態様５）において、前記取得部は、時間軸上の複数の時点の各々について前記指示位置を順次に特定し、前記特定部は、時間軸上の複数の処理期間の各々において、前記複数の時点のうち当該処理期間内の２以上の時点についてそれぞれ特定された２以上の指示位置と、前記時系列信号の特性に応じた探索条件と、を適用した経路探索を実行することで、当該処理期間のうち少なくとも一部の期間内の相異なる時点に対応する２以上の再生位置の時系列を特定し、前記再生部は、前記時系列信号のうち前記２以上の再生位置の各々に対応する部分を、前記再生装置に再生させる。以上の態様によれば、２以上の再生位置の時系列を特定する経路探索が、時間軸上の処理期間毎に実行されるから、例えば指示位置の移動の速度が不規則に変動した場合でも、利用者からの指示に高精度に追従した再生位置を特定できる。

　態様５の具体例（態様６）において、前記処理期間は、前記複数の時点のうち第１時点と前記第１時点の後方に位置する第２時点との間の期間であり、前記処理期間のうち前記少なくとも一部の期間は、前記第１時点から、前記第１時点と前記第２時点との間の第３時点までの解析期間である。以上の態様によれば、第１時点から第３時点までの解析期間内における２以上の再生位置の時系列が、第１時点から第２時点までの処理期間内における指示位置の時系列に応じて推定される。したがって、処理期間内のうち終点の近傍の期間（例えば第３時点から第２時点までの期間）における指示位置の推定誤差の影響（ノイズ）を低減できる。すなわち、処理期間内の指示位置の時系列を利用して当該処理期間内の全体にわたる再生位置の時系列を特定する構成と比較して、再生位置を適切に特定できる。

　態様６の具体例（態様７）において、前記探索条件は、前記第１時点における前記再生位置を、当該第１時点における前記指示位置に固定し、前記第２時点における前記再生位置を、当該第２時点における前記指示位置に固定する条件を含む。以上の態様によれば、第１時点における再生位置が当該第１時点における指示位置に固定され、第２時点における再生位置が当該第２時点における指示位置に固定される。したがって、解析期間内において再生位置が指示位置から過度に乖離する可能性が低減される。

　態様５の具体例（態様８）において、前記探索条件は、前記複数の時点の各々における観測尤度を含み、前記観測尤度は、前記時系列信号を時間軸上で区分した複数の単位期間の各々が、当該時点における前記再生位置に該当する確度であり、前記観測尤度の確率分布は、前記指示位置に応じた平均により規定される。以上の態様においては、経路探索に適用される観測尤度の確率分布の平均が、指示位置に応じて設定される。したがって、解析期間内において再生位置が指示位置から過度に乖離する可能性が低減される。

　態様８の具体例（態様９）において、前記時系列信号は、前記楽曲の演奏音を表す音響信号であり、前記複数の時点のうち、前記指示位置が前記音響信号の発音点に対応する時点における前記観測尤度の確率分布は、第１分散により規定され、前記複数の時点のうち、前記指示位置が前記音響信号の発音点に対応しない時点における前記観測尤度の確率分布は、前記第１分散を上回る第２分散により規定される。以上の態様によれば、音響信号の発音点に対応する時点について再生位置の特定に利用される確率分布の分散（第１分散）が、発音点に対応しない時点について再生位置の特定に利用される確率分布の分散（第２分散）を下回る。したがって、発音点に該当する時点において、観測尤度は、指示位置に応じた数値の近傍にて局所的に高い数値となる。すなわち、発音点に該当する時点においては、再生位置が指示位置に近似または一致する可能性が、再生位置が指示位置から乖離する可能性と比較して高い。したがって、音響信号の再生を利用者による演奏に追従させ易いという利点がある。

　態様８または態様９の具体例（態様１０）において、前記探索条件は、前記時系列信号における特性の変動の度合を表す変動指標を含み、前記観測尤度の確率分布の分散は、前記変動指標に応じて設定される。以上の態様によれば、観測尤度の確率分布に関する分散が、時系列信号の変動指標に応じて設定される。例えば、時系列信号のうち特性が不安定に変動する時点では分散が小さい数値に設定され、結果的に再生位置が指示位置に近似する。他方、時系列信号のうち特性の変動が小さい時点では分散が大きい数値に設定され、結果的に指示位置から乖離した再生位置の特定が許容される。すなわち、聴感的に自然な印象の再生音を再生できる。

　「変動指標」は、時系列信号における特性の変動の度合に応じた任意の指標である。特性の変動の度合とは、例えば、特性が変動する頻度または特性の変動量である。したがって、変動指標は、時系列信号における特性の安定性または不安定性の指標とも換言される。音響信号に関する変動指標は、例えば基本周波数または周波数特性（例えば振幅スペクトルまたはＭＦＣＣ）等の音響特性の変動の度合を表す。映像信号に関する変動指標は、例えば明度等の映像特性の変動の度合を表す。

　特性の変動の度合が大きいほど（すなわち時間軸上で特性が不安定に変動するほど）、変動指標が大きい数値に設定される形態において、変動指標は、特性の変動し易さを表す指標と表現される。他方、特性の変動の度合が小さいほど（すなわち時間軸上で特性が安定的に維持されるほど）、変動指標が大きい数値に設定される形態において、変動指標は、特性の変動し難さを表す指標と表現される。

　態様４から態様１０の何れかの具体例（態様１１）において、前記探索条件は、前記時系列信号を時間軸上で区分した複数の単位期間のうち２個の単位期間の組合せ毎に設定され、前記再生位置が前記２個の単位期間の間で遷移する確度を表す遷移確率を含む。以上の態様によれば、時系列信号２おける２個の単位期間の組合せ毎の遷移確率を適用した経路探索により、再生位置の時系列を適切に特定できる。

　「２個の単位期間」は、時間軸上の相異なる２個の単位期間のほか、時間軸上の共通の単位期間も含む。２個の単位期間が相違する場合、遷移確率は、再生位置が時間軸上で移動する確率を意味する。他方、２個の単位期間が共通する場合、遷移確率は、再生位置が時間軸上の１個の単位期間に停留する確率を意味する。

　態様１１の具体例（態様１２）において、前記時系列信号は、前記楽曲の演奏音を表す音響信号であり、前記２個の単位期間の双方において前記音響信号が無音である場合における遷移確率（第１遷移確率）は、前記２個の単位期間の一方または双方において前記音響信号が有音である場合における遷移確率（第２遷移確率）を上回る。以上の態様によれば、音響信号のうち無音期間内における再生位置の遷移が、有音期間と無音期間との間における再生位置の遷移、または、有音期間内における再生位置の遷移と比較して発生し易い。したがって、有音期間内における再生位置の遷移が頻発する形態と比較して、聴感的に自然な印象の再生音を再生できる。

　態様１２の具体例（態様１３）において、前記２個の単位期間の一方または双方において前記音響信号が有音である場合における前記遷移確率の確率分布は、所定値に設定された平均と、前記音響信号における音響特性の変動の度合を表す変動指標に応じた分散とにより規定される。以上の態様においては、遷移確率の確率分布における分散が音響信号の変動指標に応じて設定される。例えば、音響信号のうち音響特性が安定的に維持される期間においては、遷移確率の確率分布における分散が大きい数値に設定され、結果的に再生位置の移動速度が所定値から乖離することが許容される。他方、音響信号のうち音響特性が不安定に変動する期間内においては、遷移確率の確率分布における分散が小さい数値に設定され、結果的に再生位置の移動速度が所定値に近付く。すなわち、音響信号の音響特性が安定的に維持される期間は時間軸上で伸縮され易く、音響特性が不安定に変動する期間は伸縮され難い。したがって、聴感的に自然な印象の再生音を再生できる。

　態様１１から態様１３の何れかの具体例（態様１４）において、前記音響信号を複数の発音点により時間軸上で区分した複数の発音間期間のうち第１発音間期間の最後の時点に前記再生位置が停留する遷移確率は、当該最後の時点から、前記第１発音間期間の直後の第２発音間期間内の時点に、前記再生位置が遷移する遷移確率を上回る。以上の態様においては、発音点を跨ぐ再生位置の遷移が抑制されるから、１個の発音点に対応する音響成分が反復的に再生される可能性が低減される。すなわち、聴感的に自然な印象の再生音を生成できる。

　態様４から態様１４の何れかの具体例（態様１５）において、前記指示位置は、前記利用者による前記楽曲の演奏を前記取得部が解析することで推定される演奏位置である。以上の態様によれば、利用者による楽曲の演奏位置が指示位置として特定される。したがって、再生装置による時系列信号の再生を、利用者による楽曲の演奏に追従させることが可能である。

　態様１５の具体例（態様１６）において、前記再生部は、前記演奏における第１時点において第１操作が発生し、前記第１時点の経過後の第２時点において第２操作が発生した場合に、前記第１操作の強度を前記第１時点から前記第２時点まで経時的に減少させた第１強度と、前記第２操作の第２強度とのうち何れか大きい方（すなわち最大値）を、前記第２時点における操作強度として選択し、前記操作強度に応じて前記時系列信号の再生音の音量を制御する。以上の態様においては、第１操作の強度を第２時点まで経時的に減少させた第１強度と、第２時点における第２操作の第２強度とを含む複数の強度の最大値（制御値）に応じて音響信号の再生音の音量が制御される。したがって、例えば第２強度が第１強度と比較して充分に小さい場合でも、第１強度を第２時点まで経時的に減少させた第１強度が充分に大きい場合には、再生音の音量は充分に維持される。したがって、操作毎の強度に応じて再生音の音量を制御する構成と比較して、利用者の演奏に対して適切に再生音の音量を制御できる。

　本開示のひとつの態様（態様１７）に係る信号処理方法は、楽曲の再生に追従して時系列信号を再生装置に再生させる方法であって、前記楽曲の再生における利用者による指示位置を取得し、前記指示位置に応じて前記時系列信号の時間伸縮を実行する。

　態様１７の具体例（態様１８）において、前記時系列信号は、音響または映像を表す信号であり、前記指示位置の取得においては、時間経過に従い複数の指示位置を取得し、前記時間伸縮においては、前記複数の指示位置のうち相異なる２以上の指示位置と、前記時系列信号の特性に応じた探索条件と、を適用した経路探索により、前記時間伸縮を実行する。楽曲の再生は、例えば利用者による前記楽曲の演奏である。

　本開示のひとつの態様（態様２０）に係るプログラムは、楽曲の再生に追従して時系列信号を再生装置に再生させるためのプログラムであって、前記楽曲の再生における利用者による指示位置を取得する取得部、および、前記指示位置に応じて前記時系列信号の時間伸縮を実行する制御部、としてコンピュータを機能させる。

１００…演奏システム、１０…鍵盤楽器、２０…信号処理システム、２１…制御装置、２２…記憶装置、２３…放音装置、３１…解析部、３２…取得部、３３…制御部、３３１…特定部、３３２…再生部。

Claims

　楽曲の再生に追従して時系列信号を再生装置に再生させる信号処理システムであって、
　前記楽曲の再生における利用者による指示位置を取得する取得部と、
　前記指示位置に応じて前記時系列信号の時間伸縮を実行する制御部と
　を具備する信号処理システム。
　前記時系列信号は、音響または映像を表す信号であり、
　前記取得部は、時間経過に従い複数の指示位置を取得し、
　前記制御部は、前記複数の指示位置のうち相異なる２以上の指示位置と、前記時系列信号の特性に応じた探索条件と、を適用した経路探索により前記時間伸縮を実行する
　請求項１の信号処理システム。
　前記楽曲の再生は、前記利用者による前記楽曲の演奏である
　請求項１または請求項２の信号処理システム。
　前記制御部は、
　前記時系列信号のうち前記指示位置に応じた再生位置を特定する特定部と、
　前記時系列信号のうち前記再生位置に対応する部分を再生装置に再生させることで前記時間伸縮を実行する再生部とを含む
　請求項１の信号処理システム。
　前記取得部は、時間軸上の複数の時点の各々について前記指示位置を順次に特定し、
　前記特定部は、時間軸上の複数の処理期間の各々において、前記複数の時点のうち当該処理期間内の２以上の時点についてそれぞれ特定された２以上の指示位置と、前記時系列信号の特性に応じた探索条件と、を適用した経路探索を実行することで、当該処理期間のうち少なくとも一部の期間内の相異なる時点に対応する２以上の再生位置の時系列を特定し、
　前記再生部は、前記時系列信号のうち前記２以上の再生位置の各々に対応する部分を、前記再生装置に再生させる
　請求項４の信号処理システム。
　前記処理期間は、前記複数の時点のうち第１時点と前記第１時点の後方に位置する第２時点との間の期間であり、
　前記処理期間のうち前記少なくとも一部の期間は、前記第１時点から、前記第１時点と前記第２時点との間の第３時点までの解析期間である
　請求項５の信号処理システム。
　前記探索条件は、前記第１時点における前記再生位置を、当該第１時点における前記指示位置に固定し、前記第２時点における前記再生位置を、当該第２時点における前記指示位置に固定する条件を含む
　請求項６の信号処理システム。
　前記探索条件は、前記複数の時点の各々における観測尤度を含み、
　前記観測尤度は、前記時系列信号を時間軸上で区分した複数の単位期間の各々が、当該時点における前記再生位置に該当する確度であり、
　前記観測尤度の確率分布は、前記指示位置に応じた平均により規定される
　請求項５の信号処理システム。
　前記時系列信号は、前記楽曲の演奏音を表す音響信号であり、
　前記複数の時点のうち、前記指示位置が前記音響信号の発音点に対応する時点における前記観測尤度の確率分布は、第１分散により規定され、
　前記複数の時点のうち、前記指示位置が前記音響信号の発音点に対応しない時点における前記観測尤度の確率分布は、前記第１分散を上回る第２分散により規定される
　請求項８の信号処理システム。
　前記探索条件は、前記時系列信号における特性の変動の度合を表す変動指標を含み、
　前記観測尤度の確率分布の分散は、前記変動指標に応じて設定される
　請求項８または請求項９の信号処理システム。
　前記探索条件は、前記時系列信号を時間軸上で区分した複数の単位期間のうち２個の単位期間の組合せ毎に設定され、前記再生位置が前記２個の単位期間の間で遷移する確度を表す遷移確率を含む
　請求項５から請求項１０の何れかの信号処理システム。
　前記時系列信号は、前記楽曲の演奏音を表す音響信号であり、
　前記２個の単位期間の双方において前記音響信号が無音である場合における遷移確率は、前記２個の単位期間の一方または双方において前記音響信号が有音である場合における遷移確率を上回る
　請求項１１の信号処理システム。
　前記２個の単位期間の一方または双方において前記音響信号が有音である場合における前記遷移確率の確率分布は、所定値に設定された平均と、前記音響信号における音響特性の変動の度合を表す変動指標に応じた分散とにより規定される
　請求項１２の信号処理システム。
　前記音響信号を複数の発音点により時間軸上で区分した複数の発音間期間のうち第１発音間期間の最後の時点に前記再生位置が停留する遷移確率は、当該最後の時点から、前記第１発音間期間の直後の第２発音間期間内の時点に、前記再生位置が遷移する遷移確率を上回る
　請求項１１から請求項１３の何れかの信号処理システム。
　前記指示位置は、前記利用者による前記楽曲の演奏を前記取得部が解析することで推定される演奏位置である
　請求項４から請求項１４の何れかの信号処理システム。
　前記再生部は、
　前記演奏における第１時点において第１操作が発生し、前記第１時点の経過後の第２時点において第２操作が発生した場合に、前記第１操作の強度を前記第１時点から前記第２時点まで経時的に減少させた第１強度と、前記第２操作の第２強度とのうち何れか大きい方を、前記第２時点における操作強度として選択し、
　前記操作強度に応じて前記時系列信号の再生音の音量を制御する
　請求項１５の信号処理システム。
　楽曲の再生に追従して時系列信号を再生装置に再生させる方法であって、
　前記楽曲の再生における利用者による指示位置を取得し、
　前記指示位置に応じて前記時系列信号の時間伸縮を実行する
　コンピュータにより実現される信号処理方法。
　前記時系列信号は、音響または映像を表す信号であり、
　前記指示位置の取得においては、時間経過に従い複数の指示位置を取得し、
　前記時間伸縮においては、前記複数の指示位置のうち相異なる２以上の指示位置と、前記時系列信号の特性に応じた探索条件と、を適用した経路探索により、前記時間伸縮を実行する
　請求項１７の信号処理方法。
　前記楽曲の再生は、前記利用者による前記楽曲の演奏である
　請求項１７または請求項１８の信号処理方法。
　楽曲の再生に追従して時系列信号を再生装置に再生させるためのプログラムであって、
　前記楽曲の再生における利用者による指示位置を取得する取得部、および、
　前記指示位置に応じて前記時系列信号の時間伸縮を実行する制御部、
　としてコンピュータを機能させるプログラム。