JP5672960B2 - 音響処理装置 - Google Patents

音響処理装置 Download PDF

Info

Publication number
JP5672960B2
JP5672960B2 JP2010242320A JP2010242320A JP5672960B2 JP 5672960 B2 JP5672960 B2 JP 5672960B2 JP 2010242320 A JP2010242320 A JP 2010242320A JP 2010242320 A JP2010242320 A JP 2010242320A JP 5672960 B2 JP5672960 B2 JP 5672960B2
Authority
JP
Japan
Prior art keywords
acoustic signal
information
unit
analysis
unit section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010242320A
Other languages
English (en)
Other versions
JP2012093632A (ja
JP2012093632A5 (ja
Inventor
美希 荒井
美希 荒井
誠一 橋本
誠一 橋本
梅山 康之
康之 梅山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010242320A priority Critical patent/JP5672960B2/ja
Publication of JP2012093632A publication Critical patent/JP2012093632A/ja
Publication of JP2012093632A5 publication Critical patent/JP2012093632A5/ja
Application granted granted Critical
Publication of JP5672960B2 publication Critical patent/JP5672960B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、楽曲の楽音を示す複数の音響信号の相互間の対応(同期)を解析する技術に関する。
楽曲の制御情報(例えばMIDI(Musical Instrument Digital Interface)データ)が時系列に指定する歌詞や楽譜の表示と、例えばCDから取得した当該楽曲の音響信号(以下「再生音響信号」という)の再生とを並列に実行すれば、再生音響信号の高音質な伴奏音のもとで歌詞や楽譜を確認しながら歌唱や演奏を練習することが可能である。しかし、時間軸上で相互に同期するようにMIDIデータと再生音響信号とを作成するという煩雑な作業が必要となる。
そこで、例えば特許文献1には、制御情報に応じた歌詞の表示が再生音響信号の再生に同期するように制御情報を変換する技術が開示されている。具体的には、再生音響信号の再生の総時間と制御情報の再生の総時間との長短に応じて制御情報の処理速度を調整する構成や、再生音響信号における歌唱音の開始点と制御情報の歌詞の開始点とが合致するように制御情報の処理速度を調整する構成が提案されている。
特開2004−212473号公報
しかし、特許文献1の技術のもとでは、楽曲の特定の区間(全区間や歌唱区間)の始点や終点にて再生音響信号の再生と歌詞の表示とが同期するに過ぎないから、当該区間の途中の時点では両者の同期が担保されないという問題がある。なお、以上の説明では歌詞の表示を例示したが、歌詞の表示以外の様々な動作を指示する制御情報の処理を再生音響信号の再生に同期させる場合にも同様の問題が発生し得る。以上の事情を考慮して、本発明は、音響信号の再生と制御情報の処理とを高精度に同期させることを目的とする。
以上の課題を解決するために本発明が採用する手段を説明する。なお、本発明の理解を容易にするために、以下の説明では、本発明の要素と後述の実施形態の要素との対応を括弧書で付記するが、本発明の範囲を実施形態の例示に限定する趣旨ではない。
本発明の音響処理装置は楽曲の楽音を示す第1音響信号(例えば音響信号SA)の特徴量を第1単位区間(例えば単位区間FA[m])毎に順次に生成する第1特徴抽出手段(例えば第1特徴抽出部62)と、楽曲に関連する情報を時系列に指定する制御情報で指定される当該情報の時系列に同期する楽音を示す第2音響信号(例えば音響信号SB)の特徴量を第2単位区間(例えば単位区間FB[n])毎に順次に生成する第2特徴抽出手段(例えば第2特徴抽出部64)と、第1音響信号を再生する再生制御手段(例えば再生制御部44)と、第1単位区間と第2単位区間との組合せ毎に算定されて特徴量の類否を示す類否指標値(例えば類否指標値C[m,n])に応じて、第1単位区間と第2単位区間との対応を示す同期解析情報を、第1音響信号の再生の進行とともに順次に生成する同期解析手段(例えば同期解析部66)と、第1音響信号の再生と制御情報の処理とが相互に同期するように同期解析情報に応じて制御情報を順次に処理する情報処理手段(例えば情報処理部58)とを具備する。
以上の構成においては、第1音響信号と第2音響信号とにおいて相対応する時間軸上の位置が第1音響信号の第1単位区間毎の特徴量と第2音響信号の第2単位区間毎の特徴量との類否に応じて解析され、第1音響信号の再生と制御情報の処理とが相互に同期するように解析の結果に応じて制御情報が順次に処理される。したがって、例えば楽曲の全区間や歌唱区間の始点または終点のみで音響信号の再生と歌詞の表示とを同期させる特許文献1の構成と比較すると、第1音響信号の再生と制御情報の処理(例えば歌詞の表示)とを高精度に同期させることが可能である。
本発明の好適な態様の同期解析手段は、第1音響信号を示す第1軸(例えば第1軸XA)と第1軸に交差して第2音響信号を示す第2軸(例えば第2軸XB)とで規定される探索平面において第1単位区間と第2単位区間との各組合せに対応する解析点(例えば解析点La)毎に類否指標値を算定する指標算定手段(例えば指標算定部72)と、類否指標値に応じて各解析点を相互に連結することで探索平面に複数の候補経路(例えば候補経路PC)を特定する候補特定手段(例えば候補特定部74)と、複数の候補経路から確定経路(例えば確定経路PF)を選択するとともに当該確定経路に応じた同期解析情報を生成する経路確定手段(例えば経路確定部76)とを含んで構成される。以上の態様においては、類否指標値に応じて生成された複数の候補経路の何れかが確定経路として選択されるから、複数の候補経路に対して種々の条件を適用して順次に候補を絞込むことで、第1音響信号と第2音響信号との対応を高精度に示す確定経路を特定することが可能である。
本発明の好適な態様の候補特定手段は、探索平面内の基準位置から各解析点までの類否指標値の累積値(例えば累積値D[m,n])に応じて複数の候補経路を特定し、経路確定手段は、基準位置から第1軸の方向に第1時間(例えば時間T1)が経過した時点(例えば時点LREF)を通過する基準線(例えば基準線REF)を探索平面に設定し、複数の候補経路のうち基準線との交点に対応する解析点(例えば交点px)までの累積値が最大の類似を示す候補経路において、基準位置から第1軸の方向に第1時間よりも短い第2時間(例えば時間T2)の区間を確定経路として確定する。以上の態様においては、基準位置から第1時間が経過した時点を通過する基準線と各候補経路との交点での累積値が最大の類似を示す候補経路のうち基準位置から第2時間にわたる区間が確定経路として確定される。したがって、基準位置から第1時間の時点に対応する累積値のみに応じて候補経路を選択する構成や基準位置から第2時間の時点に対応する累積値のみに応じて候補経路を選択する構成と比較して、第1音響信号と第2音響信号との対応を高精度に示す候補経路を選択することが可能である。
本発明の好適な態様の経路確定手段は、確定経路上の各解析点(例えば検出点PR[k])について適否を判定し、適当と判定した各解析点に対応する第1単位区間と第2単位区間とを示す同期解析情報を生成する。以上の態様においては、確定経路の各解析点について適否が判定され、適当と判定された解析点から同期解析情報が生成されるから、確定経路上の全部の解析点が制御情報の処理の進行速度に反映される構成と比較して、第1音響信号の再生と制御情報の処理とを高精度に同期させることが可能である。なお、以上の態様の具体例は例えば第2実施形態として後述される。
本発明の好適な態様の情報処理手段は、第1音響信号の再生位置(例えば位置pA1)から所定時間(例えば時間TA)が経過した時点(例えば位置pA2)に対応する制御情報の目標処理位置(例えば目標処理位置pB2)を同期解析情報に応じて特定し、制御情報の処理位置(例えば位置pB1)から目標処理位置までの時間と所定時間との比率に応じて第1音響信号の再生速度(例えば再生速度VA)に対する制御情報の処理の進行速度(例えば進行速度VB)を決定する。以上の態様においては、第1音響信号の再生位置から所定時間が経過した時点に対応する制御情報の目標処理位置が同期解析情報に応じて特定され、目標処理位置に応じて制御情報の処理の進行速度が決定されるから、同期解析情報が示す解析点以外の時点について第1単位区間と第2単位区間との対応を特定することが可能である。したがって、例えば確定経路から不適正な解析点を除外する前述の態様でも、第1音響信号の再生と制御情報の処理とを適切に同期させることが可能である。なお、以上の態様の具体例は例えば第3実施形態として後述される。
以上の各態様における特徴量は、例えばクロマベクトルである。すなわち、第1特徴抽出手段は、第1音響信号のクロマベクトルを順次に生成し、第2特徴抽出手段は、第2音響信号のクロマベクトルを順次に生成する。以上の構成においては、音響信号の和声感の指標となるクロマベクトルが特徴量として生成されるから、例えば第1音響信号の拍点と第2音響信号の拍点とを同期させる構成と比較して、第1音響信号と第2音響信号とで相対応する位置を高精度に特定できるという利点がある。クロマベクトルは、相異なる音名(クロマ)に対応する複数の要素の各々が、音響信号のうち当該要素に対応する音名の成分の強度を複数のオクターブにわたって加算した数値(例えば加算値や平均値)に応じて設定されたベクトル(ピッチクラスプロファイル)を意味する。
以上の各態様に係る音響処理装置は、音響の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムはコンピュータに、楽曲の楽音を示す第1音響信号の特徴量を第1単位区間毎に順次に生成する第1特徴抽出処理と、楽曲に関連する情報を時系列に指定する制御情報で指定される当該情報の時系列に同期する楽音を示す第2音響信号の特徴量を第2単位区間毎に順次に生成する第2特徴抽出処理と、第1音響信号を再生する再生制御処理と、第1単位区間と第2単位区間との組合せ毎に算定されて特徴量の類否を示す類否指標値に応じて、第1単位区間と第2単位区間との対応を示す同期解析情報を、第1音響信号の再生の進行とともに順次に生成する同期解析処理と、第1音響信号の再生と制御情報の処理とが相互に同期するように同期解析情報に応じて制御情報を順次に処理する情報処理とを実行させる。以上のプログラムによれば、本発明に係る音響処理装置と同様の作用および効果が奏される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
なお、以上の説明では、音響信号の再生と制御情報の処理とを同期させる場合を例示したが、前述の特許文献1の問題は、相共通する楽曲の楽音を示す第1音響信号と第2音響信号とを同期させる場合(すなわち、第1音響信号と第2音響信号とで音楽的に対応する地点を探索する場合)にも同様に発生し得る。そこで、本発明の別態様に係る音響処理装置は、楽曲の楽音を示す第1音響信号の特徴量を第1単位区間毎に順次に生成する第1特徴抽出手段(例えば第1特徴抽出部62)と、楽曲の楽音を示す第2音響信号の特徴量を第2単位区間毎に順次に生成する第2特徴抽出手段(例えば第2特徴抽出部64)と、第1単位区間と第2単位区間との組合せ毎に算定されて特徴量の類否を示す類否指標値に応じて、第1単位区間と第2単位区間との対応を示す同期解析情報を生成する同期解析手段(例えば同期解析部66)とを具備する。以上の態様においては、第1音響信号と第2音響信号とを高精度に同期させることが可能である。
第1実施形態に係る音響処理装置のブロック図である。 指標値行列および探索平面の説明図である。 同期解析処理の概略的な説明図である。 候補特定部が各解析点について類否指標値の累積値を算定する処理の説明図である。 候補特定部が特定する複数の候補経路の説明図である。 経路確定部が実行する処理(除去処理,確定処理)の説明図である。 経路確定部が実行する除去処理のうち第1処理の説明図である。 経路確定部が実行する除去処理のうち第2処理の説明図である。 経路確定部が実行する除去処理のうち第3処理の説明図である。 確定経路を選択する確定処理のうち基準線を設定する処理の説明図である。 確定経路を選択する確定処理のうち候補経路を選択する処理の説明図である。 確定経路を選択する確定処理うち確定経路を確定する処理の説明図である。 第2実施形態の経路確定部が実行する処理の説明図である。 経路確定部が確定経路の検出点を除去する処理の説明図である。 第3実施形態の情報処理部が実行する処理の説明図である。 音響信号の再生位置が変更された場合の動作の説明図である。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。音響処理装置100は、楽曲の楽音の再生と楽曲の歌詞の表示とを並列に実行するカラオケ装置として好適に利用される。図1に示すように、音響処理装置100には、表示装置12と収音装置14と放音装置16と入力装置18と信号供給装置20とが接続される。
表示装置12(例えば液晶表示装置)は、音響処理装置100からの指示に応じて楽曲の歌詞を表示する。収音装置14(マイクロホン)は、周囲の音響(歌唱音や楽器の演奏音等)に応じた音響信号SVを生成する。なお、音響信号SVをデジタルに変換するA/D変換器の図示は省略されている。放音装置16(例えばスピーカやヘッドホン)は、音響処理装置100から供給される音響信号SOUTに応じた音響を再生する。入力装置18は、利用者からの指示を受付ける操作子で構成される。
信号供給装置20は、楽曲の楽音(歌唱音や伴奏音)の波形を示すデジタルの音響信号SAを音響処理装置100に供給する。例えば、半導体記録媒体や光ディスクなどの記録媒体から音響信号SAを取得して音響処理装置100に供給する再生装置(例えば、携帯型の音楽再生装置)や、通信網から音響信号SAを受信して音響処理装置100に出力する通信装置が、信号供給装置20として好適に採用される。
音響処理装置100は、演算処理装置32と記憶装置34とを具備するコンピュータシステムで実現される。記憶装置34は、演算処理装置32が実行するプログラムや演算処理装置32が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体が記憶装置34として任意に採用される。なお、音響信号SAを記憶装置34に格納した構成(したがって信号供給装置20は省略され得る)も採用される。
図1に示すように、記憶装置34は、相異なる楽曲に対応する複数の楽曲情報D0を記憶する。例えば通信網(典型的にはインターネット)を介して受信された楽曲情報D0が記憶装置34に格納される。楽曲情報D0は、楽曲を構成する各楽音を時系列に指定する楽音情報DNと、楽曲の歌詞(発音文字)を時系列に指定する歌詞情報DLとを含んで構成される。例えば、楽音の音高や強度や歌詞を指定するイベントデータと各イベントデータの処理の時点を指定するタイミングデータとを時系列に配列したMIDI形式の時系列データが楽曲情報D0(DN,DL)として好適に採用される。
楽音情報DNが指定する各楽音の時系列と歌詞情報DLが指定する歌詞の時系列とが時間軸上で相互に対応(同期)するように楽音情報DNと歌詞情報DLとは作成される。他方、楽曲情報D0の楽曲と音響信号SAの楽曲とは共通し得るが、楽曲情報D0と音響信号SAとは別個に作成されるから、楽音情報DNが示す楽音の時系列や歌詞情報DLが示す歌詞の時系列は、音響信号SAが示す楽音の波形とは完全には同期しない。すなわち、楽曲中の各楽音の発生の時点は楽曲情報D0と音響信号SAとで相違し得る。
演算処理装置32は、記憶装置34に記憶されたプログラムを実行することで、音響信号SAの再生(楽曲のストリーミング再生)と歌詞情報DLが指定する歌詞の表示とを同期させるための複数の機能(第1保持部42,再生制御部44,出力処理部46,信号生成部52,第2保持部54,解析処理部56,情報処理部58)を実現する。したがって、音響処理装置100の利用者は、音響信号SAの再生音(楽音情報DNから再生される楽音と比較して一般的には高音質な楽音)のもとで歌詞を確認しながら歌唱することが可能である。なお、演算処理装置32の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。
入力装置18の操作で利用者が指定した楽曲の音響信号SAが信号供給装置20から第1保持部42に供給される。第1保持部42は、信号供給装置20から供給される音響信号SAを順次に取得および保持するバッファ回路である。図2に示すように、音響信号SAを時間軸上で区分した複数の単位区間(フレーム)FAがM個毎(FA[1]〜FA[M])に第1保持部42に順次に格納および更新される(Mは自然数)。
再生制御部44は、第1保持部42に保持された音響信号SAを出力処理部46に順次に供給する。出力処理部46は、再生制御部44から供給される音響信号SAと収音装置14から供給される音響信号SVとを混合したうえでアナログの音響信号SOUTに変換して放音装置16に供給する。すなわち、音響信号SAに応じた音響が、収音装置14で収音された利用者の歌唱音や楽器の演奏音とともに再生(ストリーミング再生)される。再生制御部44は、音響信号SAのうち現在の再生の時点(以下「再生位置」という)を所定の周期(例えば200ms)で解析処理部56に通知する。再生位置は楽曲の再生とともに刻々と進行する。なお、音響信号SAのうち特定の成分(例えば歌唱音)を再生制御部44が抑制する構成も好適である。特定の成分の抑制には公知の技術(マイナスワン処理)が任意に採用される。
信号生成部52は、利用者が指定した楽曲の楽曲情報D0のうち楽音情報DNが時系列に指定する楽音の波形を表す音響信号SBを生成する。具体的には、楽音情報DNのイベントデータが指定する楽音の波形を順次に生成する公知の音源(MIDI音源)が信号生成部52として好適に採用される。音響信号SBが表す楽音の波形は歌詞情報DLが指定する歌詞の時系列に同期する。すなわち、音響信号SBを再生したときに各楽音が発声する時点と、当該楽音の発声の時点で歌唱すべき歌詞を歌詞情報DLが指定する時点とは時間軸上で対応(理想的には合致)する。
第2保持部54は、信号生成部52が生成する音響信号SBを順次に取得および保持するバッファ回路である。図2に示すように、音響信号SBを時間軸上で区分した複数の単位区間(フレーム)FBがN個毎(FB[1]〜FB[N])に第2保持部54に順次に格納および更新される(Nは自然数)。なお、各単位区間FA[m](m=1〜M)と各単位区間FB[n](n=1〜N)との時間長や個数の異同は不問である。
図1の解析処理部56は、第1保持部42に保持された音響信号SAと第2保持部54に保持された音響信号SBとの時間的な対応を解析するとともに各単位区間FA[m]と各単位区間FB[n]との時間的な対応を示す同期解析情報Rを生成する。すなわち、同期解析情報Rは、音響信号SAと音響信号SBとの間で音楽的に相互に対応する時点(例えば楽曲内の共通の楽音)の各単位区間FA[m]と各単位区間FB[n]とを対応させる情報である。
情報処理部58は、楽曲情報D0の歌詞情報DLが指定する歌詞を表示装置12に順次に表示させる。情報処理部58は、再生制御部44による音響信号SAの再生に同期するように歌詞情報DLの処理(表示装置12に対する表示の指示)の進行速度を可変に設定する。具体的には、同期解析情報Rにて各単位区間FA[m]に対応付けられた単位区間FB[n]の歌詞が、音響信号SAのうち当該単位区間FA[m]が再生される時点で表示装置12に表示されるように、情報処理部58は各歌詞情報DLの処理の進行速度を制御する。
解析処理部56の具体的な構成および動作を以下に詳述する。図1に示すように、解析処理部56は、第1特徴抽出部62と第2特徴抽出部64と同期解析部66とを含んで構成される。第1特徴抽出部62は、第1保持部42が保持する音響信号SAの特徴量ΨAを単位区間FA[m]毎に順次に算定する。第2特徴抽出部64は、第2保持部54が保持する音響信号SBの単位区間FB[n]毎に特徴量ΨAと同種の特徴量ΨBを順次に算定する。
第1実施形態の特徴量ΨAおよび特徴量ΨBはクロマベクトル(ピッチクラスプロファイル(PCP:pitch class profile))である。クロマベクトルは、音響の和声感(ハーモニー感)の指標となる特徴量であり、相異なる音名(C,C#,D,D#,E,F,F#,G,G#,A,A#,B)に対応する12次元のベクトルで表現される。クロマベクトルを構成する12個の要素の各々は、音響信号(SA,SB)のうち当該要素に対応する音名(クロマ)の周波数成分(1オクターブに相当する周波数帯域を音名毎に区分した12個の周波数帯域のうち当該音名に対応する周波数帯域の成分)の強度を複数のオクターブについて加算または平均した数値に相当する。すなわち、第1特徴抽出部62は、短時間フーリエ変換等の公知の周波数分析で音響信号SAの単位区間FA[m]毎に周波数スペクトルを生成し、周波数スペクトルのうち1オクターブに相当する周波数帯域を複数のオクターブについて加算したクロマベクトルを特徴量ΨAとして算定する。第2特徴抽出部64が音響信号SBの単位区間FB[n]毎に特徴量ΨBを算定する手順も同様である。
図1の同期解析部66は、再生制御部44による音響信号SAの再生に並行して同期解析処理を順次に実行する。同期解析処理は、音響信号SAのM個の単位区間FAの特徴量ΨAと音響信号SBのN個の単位区間FBの特徴量ΨBとの類否(相関)を解析することで、音響信号SAの各単位区間FA[m]と音響信号SBの各単位区間FB[n]との時間的な対応を特定する処理である。図1に示すように、同期解析部66は、指標算定部72と候補特定部74と経路確定部76とを含んで構成される。
指標算定部72は、音響信号SAのM個の単位区間FA[1]〜FA[M]と音響信号SBのN個の単位区間FB[1]〜FB[N]との各々から単位区間FA[m]および単位区間FB[n]を選択する全通りの組合せについて、単位区間FA[m]の特徴量ΨAと単位区間FB[n]の特徴量ΨBとの類否(相関)の指標となる類否指標値(コスト関数)C[m,n]を算定する。第1実施形態の類否指標値C[m,n]は、特徴量ΨAと特徴量ΨBとの内積である。したがって、単位区間FA[m]の特徴量ΨAと単位区間FB[n]の特徴量ΨBとの類似度(相関)が高いほど類否指標値C[m,n]は小さい数値となる。ただし、例えば特徴量ΨAと特徴量ΨBとの幾何距離(ユークリッド距離)を類否指標値C[m,n]として算定する構成も採用され得る。
図2に示すように、音響信号SAの時間軸(各単位区間FA[m]の時系列)に相当する第1軸(縦軸)XAと音響信号SBの時間軸(各単位区間FB[n]の時系列)に相当する第2軸(横軸)XBとで規定される平面(以下「探索平面」という)を想定すると、探索平面のうち単位区間FA[m]と単位区間FB[n]との各組合せに対応する格子点(以下「解析点」という)La毎に類否指標値C[m,n](C[1,1]〜C[M,N])を配置したM行×N列の指標値行列(コストマトリクス)σが生成される。楽曲情報D0の楽音情報DNと歌詞情報DLとは相互に同期するから、楽音情報DNから生成された音響信号SBの時間軸に相当する第2軸XBは、歌詞情報DLの処理の進行を示す時間軸としても把握される。
図1の候補特定部74と経路確定部76とは、指標算定部72が算定した類否指標値C[m,n](指標値行列σ)を利用して音響信号SAの各単位区間FA[m]と音響信号SBの各単位区間FB[n]との時間的な対応を解析し、解析の結果(単位区間FA[m]と単位区間FB[n]との対応)を示す同期解析情報Rを生成する。
各単位区間FA[m]と各単位区間FB[n]との時間的な対応は、探索平面(DP平面)上で相隣接する各解析点La(相対応する単位区間FA[m]と単位区間FB[n]とに対応する解析点La)を連結した経路として表現される。したがって、候補特定部74および経路確定部76は、探索平面上の1個の経路(以下「確定経路」という)PFを探索する要素として機能し、候補特定部74および経路確定部76が生成する同期解析情報Rは、探索平面上の確定経路PFを表現する情報として把握される。単位区間FA[m]と単位区間FB[n]との対応(確定経路PF)の解析には動的計画法(DP:Dynamic programming)マッチング(DTW:Dynamic Time Warping)を応用した以下の方法が好適に採用される。
図3は、同期解析部66が実行する同期解析処理の概略的な説明図である。図3の同期解析処理は所定の周期で順次に反復される。例えば、再生制御部44から音響信号SAの再生位置が通知されるたびに同期解析処理が実行される。
同期解析処理を開始すると、指標算定部72は、探索平面内の基準位置L0を基点(第1行第1列の解析点La[1,1])とする指標値行列σを生成する(S11)。すなわち、音響信号SAのうち基準位置L0に後続するM個の単位区間FA[1]〜FA[M]と音響信号SBのうち基準位置L0に後続するN個の単位区間FB[1]〜FB[N]とからM行×N列の指標値行列σ(C[1,1]〜C[M,N])が算定される。基準位置L0は、同期解析処理の開始時における音響信号SAの再生位置と当該再生位置に対応する音響信号SBの位置(歌詞情報DLの処理位置)とに対応する探索平面内の地点である。具体的には、第1回目の同期解析処理では音響信号SAの始点と音響信号SBの始点とに対応する地点が基準位置L0に設定され、第2回目以降の同期解析処理では、直前の同期解析処理で特定された確定経路PFのうち現段階での音響信号SAの再生位置に対応する地点が基準位置L0に設定される。
候補特定部74および経路確定部76は、処理S11で生成された指標値行列σの解析で確定経路PFを特定する(S12,S13)。具体的には、候補特定部74は、基準位置L0を基点とする複数の候補経路PCを指標値行列σの各類否指標値C[m,n]に応じて生成し(S12)、経路確定部76は、候補特定部74が特定した複数の候補経路PCの何れかを確定経路PFとして確定するとともに当該確定経路PFに応じた同期解析情報Rを生成する(S13)。
以上に概説した同期解析処理が音響信号SAの再生に並行して順次に実行されることで単位区間FA[m]と単位区間FB[n]との対応が楽曲の全体について順次に特定される。候補特定部74が複数の候補経路PCを特定する処理S12と経路確定部76が確定経路PFを確定する処理S13とについて以下に詳述する。
<候補特定部74の処理>
候補特定部74は、基準位置L0から探索平面内の各解析点La(M行×N列)までの類否指標値C[m,n]の累積値D[m,n]に応じて、基準位置L0を始点とする複数の候補経路PCを特定する。具体的には、第1軸XAおよび第2軸XBの何れの方向にも時間的に遡及しないという条件(単調性)と解析点Laを飛越えないという条件(連続性)とのもとで類否指標値C[m,n]の累積値D[m,n]が最小となるように候補特定部74は複数の候補経路PCを特定する。
前述の単調性および連続性の条件から、第m行第n列に位置する解析点(以下「着目解析点」という)La[m,n]の直前に位置し得るのは、図4に示すように、第1軸XAの方向に隣接する解析点La[m-1,n]と、第2軸XBの方向に隣接する解析点La[m,n-1]と、第1軸XAおよび第2軸XBに傾斜する方向に隣接する解析点La[m-1,n-1]との3個である。候補特定部74は、着目解析点La[m,n]に隣接する3個の解析点La(La[m-1,n],La[m,n-1],La[m-1,n-1])の各々について以下の数式(1a)〜(1c)の累積値d(d[m-1,n],d[m,n-1],d[m-1,n-1])を算定する。
d[m-1,n]=D[m-1,n]+ωv・C[m,n] ……(1a)
d[m,n-1]=D[m,n-1]+ωh・C[m,n] ……(1b)
d[m-1,n-1]=D[m-1,n-1]+ωd・C[m,n] ……(1c)
数式(1a)〜(1c)から理解されるように、各解析点Laに対応する累積値dは、着目解析点La[m,n]の類否指標値C[m,n]に加重値(ωv,ωh,ωd)を乗算して自身の累積値D(D[m-1,n],D[m,n-1],D[m-1,n-1])に加算した数値である。解析点La[m-1,n-1]の加重値ωdは、解析点La[m-1,n]の加重値ωvおよび解析点La[m,n-1]の加重値ωhと比較して大きい数値に設定される(例えばωv=ωh=1,ωd=2)。
候補特定部74は、以下の数式(2)で表現されるように、着目解析点La[m,n]に隣接する各解析点Laの3個の累積値d(d[m-1,n],d[m,n-1],d[m-1,n-1])なかの最小値を着目解析点La[m,n]の累積値D[m,n]として選択し、累積値dが最小となる1個の解析点Laに着目解析点La[m,n]を連結する。探索平面内の各解析点La(La[1,1]〜La[M,N])について以上の処理が実行されることで、図5に例示するように、累積値D[m,n]が小さい複数の候補経路PC(すなわち、特徴量ΨAと特徴量ΨBとが類似する単位区間FA[m]と単位区間FB[n]との対応を示す複数の経路)が探索平面内に特定される。
D[m,n]=min{d[m-1,n],d[m,n-1]d[m-1,n-1]} ……(2)
<経路確定部76の処理>
図6は、経路確定部76が実行する処理S13の説明図である。図6に示すように、処理S13は、除外処理S20と確定処理S30とを含んで構成される。除外処理S20(S21〜S23)は、候補特定部74が特定した複数の候補経路PCのうち確定経路PFとして選択される可能性が低い候補経路PCを確定経路PFの候補から除外する処理である。確定処理S30は、除外処理S20の実行後に残存する複数の候補経路PCから1個の確定経路PFを確定する処理(S31〜S34)である。除外処理S20は、第1処理S21と第2処理S22と第3処理S23とを含んで構成される。
確定経路PFは、基準位置L0(解析点La[1,1])から途中で途切れずに連続する必要がある。そこで、経路確定部76は、図7に示すように、前述の数式(2)で表現される演算で何れの着目解析点La[m,n]からも選択されない解析点La(図7の黒丸で図示された解析点La)を通過する候補経路PC(すなわち、途中で終端する候補経路PC)を除外する(S21)。
また、音響信号SAおよび音響信号SBが示す楽曲は共通するから、第1軸XAの方向に連続する多数の単位区間FA[m]が音響信号SBの1個の単位区間FB[n]に対応する可能性や、第2軸XBの方向に連続する多数の単位区間FB[n]が音響信号SAの1個の単位区間FA[m]に対応する可能性は低い。そこで、経路確定部76は、第1軸XAまたは第2軸XBの方向に過度に長く連続して延在する区間を含む候補経路PCを除外する(S22)。具体的には、図8に示すように、音響信号SAのうち所定値を上回る個数にわたって連続する単位区間FA[m]を1個の単位区間FB[n]に対応させる候補経路PC(すなわち、第1軸XAの方向に過度に長く延在する区間を含む候補経路PC)が除外される。同様に、音響信号SBのうち所定値を上回る個数にわたって連続する単位区間FB[n]を1個の単位区間FA[m]に対応させる候補経路PC(すなわち、第2軸XBの方向に過度に長く延在する区間を含む候補経路PC)が除外される。
音響信号SAおよび音響信号SBが示す楽曲は共通するから、単位区間FA[m]と単位区間FB[n]との対応が過去の確定経路PFから過度に逸脱する可能性は低い。そこで、経路確定部76は、図9に示すように、過去の確定経路PFに応じて探索平面に設定された範囲ALの外側を通過する候補経路PCを除外する(S23)。範囲ALは、例えば過去の確定経路PFに近似する直線(例えば過去の確定経路PFの平均的な傾斜と同等の傾斜で基準位置L0を通過する直線)に沿う帯状の領域である。
以上に説明した除外処理S20の実行後に確定処理S30(S31〜S34)が開始される。確定処理S30を開始すると、経路確定部76は、図10に示すように、基準位置L0から第1軸XAの方向に時間T1だけ経過した時点LREFを通過する基準線REFを探索平面内に設定する(S31)。基準線REFは、探索平面内に規定される基準傾斜SL0の方向に交差(典型的には直交)する直線である。基準傾斜SL0は、例えば第1軸XAまたは第2軸XBに対する過去の確定経路PF(例えば直前の同期解析処理で特定された確定経路PF)の平均的な勾配(傾き)に相当し、例えば、過去の確定経路PF上で相前後する2個の解析点La間の傾斜(第1軸XAまたは第2軸XBとの角度)を当該確定経路PFの全体にわたって平均することで算定される。なお、基準傾斜SL0を所定値(例えば45°)に固定した構成も採用され得る。
経路確定部76は、除外処理S20の実行後の複数の候補経路PCの各々と処理S31で設定した基準線REFとの交点px(解析点La)を特定し、図11に示すように、複数の候補経路PCのうち累積値D[m,n]が最小となる交点pxを通過する候補経路PCを選択経路PF0として選択する(S32)。すなわち、探索平面内の基準線REFの時点で単位区間FA[m]と単位区間FB[n]との相関が最大となる1個の候補経路PCが選択経路PF0として選択される。
経路確定部76は、図12に示すように、処理S32で選択した選択経路PF0のうち基準位置L0から第1軸XAの方向に時間T2にわたる区間を確定経路PFとして確定する(S33)。時間T2は、基準線REFを規定する前述の時間T1よりも短い時間に設定される。すなわち、選択経路PF0のうち基準位置L0側に位置する一部分が確定経路PFとして特定される。以下の説明では、探索平面内の複数の解析点Laのうち確定経路PFの線上のK個の解析点Laを「検出点PR[1]〜PR[K]」と表記する。確定経路PF上の検出点PR[k](k=1〜K)の個数Kは、音響信号SAと音響信号SBとの時間的な対応に応じて変化する。
経路確定部76は、処理S33で確定した確定経路PFを示す同期解析情報Rを生成する(S34)。同期解析情報Rは、確定経路PF上の相異なる検出点PR[k]に対応するK個の単位情報r[1]〜r[K]の系列である。各単位情報r[k]は、確定経路PF上の第k番目の検出点PR[k]に対応する単位区間FA[m]と単位区間FB[n]との各々の識別子(例えば番号)を含んで構成される。以上が図3の処理S13の内容である。情報処理部58は、音響信号SAのうち各単位情報r[k]が示す単位区間FA[m]が再生される時点で、楽曲情報D0のうち当該単位情報r[k]が示す単位区間FB[n]に対応する歌詞情報DLを表示装置12に供給する。したがって、音響信号SAの再生に同期するように歌詞情報DLの歌詞が表示装置12に表示される。
以上に説明した第1実施形態では、音響信号SAの各単位区間FA[m]と音響信号SBの各単位区間FB[n]との音楽的な類否に応じて単位区間FA[m]と単位区間FB[n]との対応が解析され、音響信号SAの再生に対する歌詞情報DLの処理の進行速度が解析の結果に応じて制御される。したがって、例えば楽曲の全区間や歌唱区間の始点または終点のみで音響信号SAの再生と歌詞の表示とを同期させる構成(例えば特許文献1)と比較すると、例えば楽曲の途中で音響信号SAと楽曲情報D0との同期が外れる場合でも、音響信号SAの再生と歌詞の表示とを高精度に同期させることが可能である。
ところで、音響信号SAの再生と歌詞の表示とを同期させる方法としては、例えば、音響信号SAの拍点と音響信号SBの拍点とを時間軸上で相互に対応させる方法も想定され得る。しかし、拍点を利用する構成では、例えば音響信号SAまたは音響信号SBの拍点の検出漏れに起因して音響信号SAの再生と歌詞の表示とがずれた場合(例えば音響信号SAの再生に対して1拍分だけ歌詞の表示が遅延する場合)に、両者間の同期を回復することが困難であるという問題がある。第1実施形態では、和声感の指標となるクロマベクトル(ΨA,ΨB)の比較の結果に応じて音響信号SAの再生と歌詞の表示との同期が確保されるから、両者間の同期が外れる可能性が低く、仮に何らかの事情で同期が外れた場合でも速やかに同期を回復することが可能である。
また、第1実施形態では、音響信号SAの現在の再生位置に相当する基準位置L0から時間T1だけ将来の時点LREFにおける各候補経路PCの累積値D[m,n]に応じて選択経路PF0(確定経路PF)が特定されるから、基準位置L0から時間T2だけ経過した時点に着目して確定経路PFを選定する構成と比較すると、長期的にみて妥当性が高い確定経路PFを特定できるという利点がある。もっとも、基準線REFの時点で累積値D[m,n]が小さい候補経路PCが必ず適正であるとは断定できない。第1実施形態では、選択経路PF0のうち時間T1よりも短い時間T2の区間が確定経路PFとして確定されるから、基準位置L0から時間T1が経過した時点での累積値D[m,n]のみから確定経路PFを確定する構成(処理S33を省略した構成)と比較して、適正な確定経路PFを特定できる可能性が高いという利点がある。
<B:第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図13は、第2実施形態における経路確定部76の動作の説明図である。図13に示すように、第2実施形態の経路確定部76は、確定経路PFを確定する前述の処理S33の実行後(同期解析情報Rを生成する処理S34の実行前)に、確定経路PF上のK個の検出点PR[1]〜PR[K]から不適正な検出点PR[k]を除外する処理S40を実行する。具体的には、経路確定部76は、直前の処理S33で確定した確定経路PF上のK個の検出点PR[1]〜PR[K]のうち過去の確定経路PF(以下「基準経路PF_REF」という)から過度に逸脱する検出点PR[k]を除外する。基準経路PF_REFは、例えば前回の同期解析処理(図3)で確定済の確定経路PFである。
処理S40を開始すると、経路確定部76は、図14に示すように基準経路PF_REFの傾斜SL_REFを算定する(S41)。傾斜SL_REFは、探索平面における基準経路PF_REFの平均的な勾配(傾き)を意味し、例えば、基準経路PF_REFにおいて相前後する2個の検出点PR間の傾斜を、基準経路PF_REFのうち現段階の基準位置L0を終点とするHa個の検出点PR[1]〜PR[Ha]について平均した数値である。
経路確定部76は、直前の処理S33で確定した確定経路PFのK個の検出点PR[1]〜PR[K]のうち1個の検出点PR[k](以下では特に「選択検出点PR_SEL」という)を選択し(S42)、確定経路PFのうち選択検出点PR_SELの近傍での傾斜SLxを算定する(S43)。傾斜SLxは、確定経路PF上の各検出点PR[k]と当該検出点PR[k]からγ個(γは自然数)だけ手前の検出点PR[k-γ]とを通過する直線の傾斜を、図14に示すように、選択検出点PR_SELを含むHb個の検出点PR[k](例えば選択検出点PR_SELの前方および後方に位置する検出点PR[k])について平均した数値である。
傾斜SLxに反映される検出点PR[k]の個数Hbは、基準経路PF_REFの傾斜SL_REFに反映される検出点PR[1]〜PR[Ha]の個数Haを充分に下回る(Hb<Ha)。したがって、傾斜SL_REFは過去の大局的(長期的)な確定経路PFの傾斜に相当し、傾斜SLxは選択検出点PR_SELの近傍の局所的(短期的)な確定経路PFの傾斜に相当する。
経路確定部76は、処理S41で算定した傾斜SL_REFと処理S43で算定した傾斜SLxとに応じて選択検出点PR[k]の適否(すなわち、今回の確定経路PFのうち選択検出点PR_SELの近傍での傾斜SLxが過去の確定経路PFの平均的な傾斜SL_REFから乖離するか否か)を判定する(S44)。具体的には、経路確定部76は、傾斜SL_REFに対する傾斜SLxの相対比(SLx/SL_REF)が所定の範囲(例えば0.8以上1.2以下)内の数値に該当するか否かに応じて選択検出点PR[k]の適否を判定する。
処理S44の判定の結果が否定である場合(すなわち選択検出点PR[k]の近傍での傾斜SLxが過去の平均的な傾斜SL_REFから乖離する場合)、経路確定部76は、現在の選択検出点PR_SELを不適正と判定して確定経路PFから除外する(S45)。他方、処理S44の判定の結果が肯定である場合(相対比(SLx/SL_REF)が所定の範囲内にある場合)には処理S45が実行されない。すなわち、選択検出点PR_SELは適正な検出点PR[k]として維持される。なお、選択検出点PR[k]の適否を判定する方法は以上の例示に限定されない。例えば、傾斜SL_REFと傾斜SLxとの差分の絶対値|SL_REF−SLx|が所定の閾値SL_THを上回るか否かを判定し、閾値SL_THを上回る場合(傾斜SLxが傾斜SL_REFから乖離する場合)に選択検出点PR_SELを不適正と判定する構成も採用され得る。
経路確定部76は、直前の処理S33で確定した確定経路PFのK個の検出点PR[1]〜PR[K]の各々を順次に選択検出点PR_SELとして選択(S42)して処理S43〜S45を実行する(S46:NO)。そして、確定経路PF上のK個の検出点PR[1]〜PR[K]について以上の処理が完了すると(S46:YES)、経路確定部76は、確定経路PFのK個の検出点PR[1]〜PR[K]のうち処理S45で適切と判定したG個(G≦K)の各検出点PR[1]〜PR[G](すなわち処理S45で除外されなかった検出点PR[k])の各々について単位情報r[1]〜r[G]を含む同期解析情報Rを生成する(S34)。以後の動作は第1実施形態と同様である。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、確定経路PFのK個の検出点PR[1]〜PR[K]のうち不適正な検出点PR[k](具体的には過去の確定経路PFの傾向から過度に逸脱する検出点PR[k])が除外されるから、確定経路PFの全部の検出点PR[1]〜PR[K]が歌詞情報DLの処理の進行速度に反映される第1実施形態と比較して、音響信号SAの再生と歌詞の表示とを高精度に同期させることが可能である。
なお、以上の例示では、過去の確定経路PFを基準経路PF_REFとして傾斜SL_REFを算定したが、傾斜SL_REFの算定の方法は任意である。例えば、選択検出点PR_SELから計数して過去のHa個にわたる検出点PRについて平均的な傾斜SL_REFを算定する構成や、傾斜SL_REFを所定値に固定した構成も採用され得る。
<C:第3実施形態>
第2実施形態では確定経路PFのうち不適正な検出点PR[k]が除外される。したがって、確定経路PF上のK個の検出点PR[1]〜PR[K]のうち適正と判定された検出点PR[k]についてのみ単位区間FA[m]と単位区間FB[n]との対応が情報処理部58に通知される。すなわち、単位区間FA[m]と単位区間FB[n]との対応が時間的に飛び飛びに通知される。以上の事情を考慮して、第3実施形態の情報処理部58は、同期解析情報Rの各単位情報r[g](g=1〜G)を補間して歌詞情報DLの処理の進行速度を可変に設定する。
図15は、第3実施形態の情報処理部58の動作の説明図である。図15の基準位置L0は、音響信号SAの現時点の再生位置pA1と当該再生位置pA1に対応する音響信号SBの位置(すなわち歌詞情報DLの処理位置)pB1とで規定される探索平面内の地点である。情報処理部58は、音響信号SAの現段階の再生位置pA1から所定の時間TAが経過した位置pA2を設定する。図15には、図13の処理S40の実行後(不適正な検出点PR[k]の除去後)のG個の検出点PR[1]〜PR[G]のうち、第1軸XAの方向に位置pA2を挟んで相前後する検出点PR[g]および検出点PR[g+1]が図示されている。すなわち、検出点PR[g]は、音響信号SAのうち位置pA2の直前の単位区間FA[m]に対応し、検出点PR[g+1]は、音響信号SAのうち位置pA2の直後の単位区間FA[m]に対応する。
情報処理部58は、図15に示すように、音響信号SBのうち音響信号SAの位置pA2に対応する位置(以下「目標処理位置」という)pB2を同期解析情報R(検出点PR[g]の単位情報r[g]および検出点PR[g+1]の単位情報r[g+1])に応じて特定する。具体的には、情報処理部58は、検出点PR[g]と検出点PR[g+1]とを通過する直線Lのうち第1軸XA上の位置pA2に対応する位置pABを特定し、直線L上の位置pABに対応する第2軸XBの位置を目標処理位置pB2として決定する。
情報処理部58は、音響信号SAの位置pA2が再生される時点で音響信号SBの位置pB2に対応する歌詞情報DLの歌詞が表示装置12に表示されるように、楽曲情報D0の各歌詞情報DLを順次に表示装置12に供給する。具体的には、再生制御部44による音響信号SAの再生速度VAに対する歌詞情報DLの進行速度(テンポ)VBの比率が以下の数式(3)で表現される速度比率RVとなるように、情報処理部58は、音響信号SBの時点pB1から時点pB2までの区間に対応する歌詞情報DLを順次に処理(表示装置12に供給)する。
RV=VB/VA=(pB2−pB1)/(pA2−pA1) ……(3)
数式(3)の速度比率RVは、図15の基準位置L0と位置pABとを通過する直線の傾斜に相当する。数式(3)から理解されるように、音響信号SBの位置pB1と位置pB2との間隔が時間TA(TA=pA2−pA1)と比較して大きい(比率VRが1よりも大きい)ほど、歌詞情報DLの進行速度VBが音響信号SAの再生速度VAに対して高い速度に設定される。歌詞情報DLの進行速度VBは時間TA毎に順次に更新される。
第3実施形態においても第1実施形態や第2実施形態と同様の効果が実現される。また、第3実施形態では、同期解析情報Rが指定する検出点PR[g]と検出点PR[g+1]との間の区間について音響信号SAと音響信号SBとの時間的な対応が特定されるから、確定経路PFのうち不適正な検出点PR[k]を除外する構成にも関わらず、音響信号SAの再生と歌詞情報DLの処理とを精緻に同期させることが可能である。なお、以上の説明では、確定経路PFのうち不適正な検出点PR[k]を除外する第2実施形態を基礎とした構成を例示したが、音響信号SAと音響信号SBとで対応する時点を各単位情報rの補間で算定する第3実施形態の構成は、検出点PR[k]の除外を省略した第1実施形態にも同様に適用され得る。
なお、以上に例示した構成では、速度比率RVが時間TA毎に不連続に変化するから、歌詞情報DLに応じた歌詞表示の進行が不自然な印象となる可能性がある。そこで、以下の数式(4)で表現されるように、情報処理部58が時間TA毎に算定する速度比率RV[t]に過去の速度比率RV[t-1]を反映させて変化を抑制する構成も採用され得る。
RV[t]=β・RV[t-1]+(1−β)・RV0 ……(4)
数式(4)の記号RV0は、数式(3)で算定される直近の速度比率RVに相当する。数式(4)の記号βは所定の定数(収束係数)を意味する(0≦β≦1)。数式(4)の係数βが小さいほど、音響信号SAの再生と歌詞情報DLの処理との時間的な関係が確定経路PFに高精度に追従するように速度比率RV[t]が変化する。数式(3)を採用した前述の例示は、数式(4)の係数βをゼロに固定した構成に相当する。他方、係数βが大きいほど速度比率RV[t]の時間的な変化(直近の速度比率RV0が反映される度合)が抑制される。したがって、歌詞情報DLに応じた歌詞表示が自然に進行するという利点がある。なお、係数βは、例えば入力装置18に対する利用者からの指示に応じて可変に設定される。
<D:変形例>
以上の形態には様々な変形が加えられる。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は併合され得る。
(1)変形例1
音響信号SAの再生位置は入力装置18に対する利用者からの指示に応じて変更され得る。図16に示すように音響信号SAの全区間(時間長λA)のうち始点から比率α(%)の時点tAに音響信号SAの再生位置が変更された場合、同期解析部66は、音響信号SBの全区間(時間長λB)のうち始点から比率αの時間(α・λB)が経過した時点tBを特定し、音響信号SAの時点tAと音響信号SBの時点tBとに対応する探索平面内の位置を基準位置L0として図3の同期解析処理(指標値行列σの算定,複数の候補経路PCの特定,確定経路PFの選択)を開始する。音響信号SAの再生位置の変更前の既存の指標値行列σや確定経路PFは消去される。
(2)変形例2
第2実施形態において確定経路PF上の各検出点PRについて適否を判定する方法は前述の例示に限定されない。例えば、確定経路PFにおける近傍の検出点PR[k]の系列から極端に乖離した選択検出点PR_SEL(例えば直前の検出点PR[k-1]と直後の検出点PR[k+1]との平均の地点から過度に離間した選択検出点PR_SEL)を不適正な検出点PR[k]として除外する構成や、確定経路PFを平滑化した曲線(例えば移動平均の軌跡)から過度に離間した選択検出点PR_SELを不適正な検出点PR[k]として除外する構成も採用され得る。
(3)変形例3
音響信号SAの再生に同期して表示装置12に表示させる情報は歌詞に限定されない。例えば、楽曲の楽譜(例えばコード譜やタブ譜)を時系列に指定する楽譜情報を、音響信号SAの再生に同期して情報処理部58が処理することで表示装置12に楽譜を表示させる構成が採用され得る。楽曲に関連する画像(例えばカラオケの背景画像)を時系列に指定する画像情報を、音響信号SAの再生に同期して情報処理部58が処理することで表示装置12に画像を表示させる構成も好適である。
また、音響信号SAの再生と同期させるべき動作は画像(歌詞,楽譜,背景画像等)の表示に限定されない。具体的には、楽曲の再生に関連する要素の動作を時系列に指示する指示情報の処理(当該要素の制御)を音響信号SAの再生と同期させる構成が採用され得る。指示情報は、歌詞情報DLと同様に、楽音情報DNが指定する楽音の時系列と指示情報による指示の時系列とが時間軸上で相互に対応(同期)するように作成される。例えば、楽曲の再生時における照明機器の動作(明滅や照度)を時系列に指示する指示情報や、効果付与部(エフェクタ)が音響信号SOUTに付加する音響効果の態様(効果の種類や程度)を時系列に指示する指示情報を、前述の各態様における歌詞情報DLの代わりに(または歌詞情報DLとともに)、音響信号SAの再生と同期させる構成が採用され得る。
以上の例示から理解されるように、音響信号SAの再生に並行して処理される情報(例えば以上に例示した歌詞情報DL,楽譜情報,画像情報,指示情報)は、楽曲に関連する情報を時系列に指定する制御情報として包括される。また、制御情報を処理する要素(例えば前述の各形態における情報処理部58)は、音響信号SAの再生と制御情報の処理とが同期するように同期解析部66による解析の結果(同期解析情報R)に応じて制御情報を処理する要素として包括される。
(4)変形例4
以上の各形態では信号生成部52が楽音情報DNから音響信号SBを生成したが、同期解析用の音響信号SBを楽音情報DNの代わりに(または楽音情報DNとともに)記憶装置34に格納した構成も採用される。音響信号SBを記憶装置34に格納した構成では信号生成部52が省略され、記憶装置34内の音響信号SBから第2特徴抽出部64が単位区間FB[n]毎に特徴量ΨBを算定する。ただし、信号生成部52を具備する構成によれば、カラオケ用に作成された既存の楽曲情報D0の楽音情報DNを同期解析処理に流用できるという利点や、音響信号SBを記憶装置34に格納する構成と比較して記憶装置34に必要な容量が削減されるという利点がある。
(5)変形例5
以上の各形態では楽音情報DNを音響信号SAとの同期の解析のみに利用する構成を例示したが、楽音情報DNに応じた音響信号SBを音響信号SAとともに再生する構成も採用され得る。例えば、ガイドメロディを示す楽音情報DNから音響信号SBを生成して音響信号SAとともに再生すれば、利用者による歌唱や演奏の練習を支援することが可能である。
(6)変形例6
第1特徴抽出部62が抽出する特徴量ΨAや第2特徴抽出部64が抽出する特徴量ΨBはクロマベクトルに限定されない。例えば、音響信号SAや音響信号SBのピッチを特徴量(ΨA,ΨB)として抽出する構成も採用され得る。以上の例示から理解されるように、特徴量(ΨA,ΨB)は、音響信号SAと音響信号SBとの音楽的な類否の判定に適用され得る数値として包括される。
(7)変形例7
以上の形態では、音響信号SAと音響信号SBとの対応を解析した結果を利用して歌詞情報DLの処理の進行速度を制御したが、同期解析処理の結果(同期解析情報R)を利用して音響信号SAと音響信号SBとを同期させる構成も採用され得る。具体的には、音響信号SAの単位区間FA[m]と音響信号SBの単位区間FB[n]との対応を示す同期解析情報Rを前述の各形態と同様の方法で生成し、情報処理部の代わりに設置された同期処理部(図示略)が、音響信号SAと音響信号SBとにおいて音楽的に対応する時点が時間軸上で合致するように、同期解析情報Rに応じて音響信号SBの各区間を音響信号SAに対して時間軸上で伸縮する。以上に説明したように、同期解析処理の結果を制御情報(歌詞情報DL)の処理に適用する構成は本発明において省略され得る。
以上の構成によれば、音響信号SAと音響信号SBとで音楽的に対応する時点が時間軸上で整合されるから、音響信号SAと音響信号SBとが同期しない構成と比較して、音響信号SAと音響信号SBとの音楽的な類否を容易に判定できる。したがって、例えば複数の音響信号SAのなかから特定の音響信号SBに類似する音響信号SAを検索する装置(楽曲検索装置)を実現することが可能である。
100……音響処理装置、12……表示装置、14……収音装置、16……放音装置、18……入力装置、20……信号供給装置、32……演算処理装置、34……記憶装置、42……第1保持部、44……再生制御部、46……出力処理部、52……信号生成部、54……第2保持部、56……解析処理部、58……情報処理部、62……第1特徴抽出部、64……第2特徴抽出部、66……同期解析部、72……指標算定部、74……候補特定部、76……経路確定部。

Claims (3)

  1. 楽曲の楽音を示す第1音響信号の特徴量を第1単位区間毎に順次に生成する第1特徴抽出手段と、
    楽曲に関連する情報を時系列に指定する制御情報で指定される当該情報の時系列に同期する楽音を示す第2音響信号の特徴量を第2単位区間毎に順次に生成する第2特徴抽出手段と、
    前記第1音響信号を再生する再生制御手段と、
    前記第1単位区間と前記第2単位区間との組合せ毎に算定されて前記特徴量の類否を示す類否指標値に応じて、前記第1単位区間と前記第2単位区間との対応を示す同期解析情報を、前記第1音響信号の再生の進行とともに順次に生成する同期解析手段と、
    前記第1音響信号の再生と前記制御情報の処理とが相互に同期するように前記同期解析情報に応じて前記制御情報を順次に処理する情報処理手段と
    を具備し、
    前記同期解析手段は、
    前記第1音響信号を示す第1軸と前記第1軸に交差して前記第2音響信号を示す第2軸とで規定される探索平面において前記第1単位区間と前記第2単位区間との各組合せに対応する解析点毎に前記類否指標値を算定する指標算定手段と、
    前記類否指標値に応じて前記各解析点を相互に連結することで前記探索平面に複数の候補経路を特定する候補特定手段と、
    前記複数の候補経路から確定経路を選択するとともに当該確定経路に応じた前記同期解析情報を生成する経路確定手段とを含み、
    前記候補特定手段は、前記探索平面内の基準位置から前記各解析点までの前記類否指標値の累積値に応じて前記複数の候補経路を特定し、
    前記経路確定手段は、前記基準位置から前記第1軸の方向に第1時間が経過した時点を通過する基準線を前記探索平面に設定し、前記複数の候補経路のうち前記基準線との交点に対応する解析点までの前記累積値が最大の類似を示す候補経路において、前記基準位置から前記第1軸の方向に前記第1時間よりも短い第2時間の区間を前記確定経路として確定する
    音響処理装置。
  2. 楽曲の楽音を示す第1音響信号の特徴量を第1単位区間毎に順次に生成する第1特徴抽出手段と、
    楽曲に関連する情報を時系列に指定する制御情報で指定される当該情報の時系列に同期する楽音を示す第2音響信号の特徴量を第2単位区間毎に順次に生成する第2特徴抽出手段と、
    前記第1音響信号を再生する再生制御手段と、
    前記第1単位区間と前記第2単位区間との組合せ毎に算定されて前記特徴量の類否を示す類否指標値に応じて、前記第1単位区間と前記第2単位区間との対応を示す同期解析情報を、前記第1音響信号の再生の進行とともに順次に生成する同期解析手段と、
    前記第1音響信号の再生と前記制御情報の処理とが相互に同期するように前記同期解析情報に応じて前記制御情報を順次に処理する情報処理手段と
    を具備し、
    前記同期解析手段は、
    前記第1音響信号を示す第1軸と前記第1軸に交差して前記第2音響信号を示す第2軸とで規定される探索平面において前記第1単位区間と前記第2単位区間との各組合せに対応する解析点毎に前記類否指標値を算定する指標算定手段と、
    前記類否指標値に応じて前記各解析点を相互に連結することで前記探索平面に複数の候補経路を特定する候補特定手段と、
    前記複数の候補経路から確定経路を選択するとともに、前記確定経路上の各解析点について適否を判定し、適当と判定した前記各解析点に対応する前記第1単位区間と前記第2単位区間とを示す前記同期解析情報を生成する経路確定手段とを含む
    音響処理装置。
  3. 前記情報処理手段は、前記第1音響信号の再生位置から所定時間が経過した時点に対応する前記制御情報の目標処理位置を前記同期解析情報に応じて特定し、前記制御情報の処理位置から前記目標処理位置までの時間と前記所定時間との比率に応じて前記第1音響信号の再生速度に対する前記制御情報の処理の進行速度を決定する
    請求項1または請求項2の音響処理装置。
JP2010242320A 2010-10-28 2010-10-28 音響処理装置 Expired - Fee Related JP5672960B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010242320A JP5672960B2 (ja) 2010-10-28 2010-10-28 音響処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010242320A JP5672960B2 (ja) 2010-10-28 2010-10-28 音響処理装置

Publications (3)

Publication Number Publication Date
JP2012093632A JP2012093632A (ja) 2012-05-17
JP2012093632A5 JP2012093632A5 (ja) 2014-01-16
JP5672960B2 true JP5672960B2 (ja) 2015-02-18

Family

ID=46387011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010242320A Expired - Fee Related JP5672960B2 (ja) 2010-10-28 2010-10-28 音響処理装置

Country Status (1)

Country Link
JP (1) JP5672960B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6801225B2 (ja) * 2016-05-18 2020-12-16 ヤマハ株式会社 自動演奏システムおよび自動演奏方法
WO2020217324A1 (ja) * 2019-04-23 2020-10-29 AlphaTheta株式会社 電子楽器および楽曲フレーズ生成プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1124674A (ja) * 1997-06-27 1999-01-29 Ricoh Co Ltd 情報処理装置
JP4243682B2 (ja) * 2002-10-24 2009-03-25 独立行政法人産業技術総合研究所 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム
JP2006195385A (ja) * 2005-01-17 2006-07-27 Matsushita Electric Ind Co Ltd 音楽再生装置および音楽再生プログラム
JP4458096B2 (ja) * 2007-02-09 2010-04-28 ヤマハ株式会社 データ再生装置、データ再生方法およびプログラム
JP4595948B2 (ja) * 2007-02-09 2010-12-08 ヤマハ株式会社 データ再生装置、データ再生方法およびプログラム
JP4595947B2 (ja) * 2007-02-09 2010-12-08 ヤマハ株式会社 データ再生装置、データ再生方法およびプログラム

Also Published As

Publication number Publication date
JP2012093632A (ja) 2012-05-17

Similar Documents

Publication Publication Date Title
JP4767691B2 (ja) テンポ検出装置、コード名検出装置及びプログラム
JP4124247B2 (ja) 楽曲練習支援装置、制御方法及びプログラム
CN109979483B (zh) 音频信号的旋律检测方法、装置以及电子设备
JPH1074093A (ja) カラオケ装置
JP2012037722A (ja) 音合成用データ生成装置およびピッチ軌跡生成装置
JP5151245B2 (ja) データ再生装置、データ再生方法およびプログラム
JP3996565B2 (ja) カラオケ装置
JP4204941B2 (ja) カラオケ装置
JP5790496B2 (ja) 音響処理装置
JP5672960B2 (ja) 音響処理装置
JP4458096B2 (ja) データ再生装置、データ再生方法およびプログラム
JP5297662B2 (ja) 楽曲データ加工装置、カラオケ装置、及びプログラム
JP2014174205A (ja) 楽音情報処理装置及びプログラム
JP5287617B2 (ja) 音響処理装置およびプログラム
JP5012263B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP5092589B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP2009169103A (ja) 練習支援装置
WO2022070639A1 (ja) 情報処理装置、情報処理方法およびプログラム
JP5391939B2 (ja) 音響処理装置およびプログラム
JP5287616B2 (ja) 音響処理装置およびプログラム
JP7232654B2 (ja) カラオケ装置
JP5728918B2 (ja) 情報処理装置
JP4470947B2 (ja) データ再生装置、データ再生方法およびプログラム
JP5618743B2 (ja) 歌唱音声評価装置
JP2005107332A (ja) カラオケ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141215

R151 Written notification of patent or utility model registration

Ref document number: 5672960

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees