JP5728918B2 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP5728918B2
JP5728918B2 JP2010274408A JP2010274408A JP5728918B2 JP 5728918 B2 JP5728918 B2 JP 5728918B2 JP 2010274408 A JP2010274408 A JP 2010274408A JP 2010274408 A JP2010274408 A JP 2010274408A JP 5728918 B2 JP5728918 B2 JP 5728918B2
Authority
JP
Japan
Prior art keywords
information
unit
acoustic signal
music
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010274408A
Other languages
English (en)
Other versions
JP2012123230A (ja
Inventor
美希 荒井
美希 荒井
藤島 琢哉
琢哉 藤島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010274408A priority Critical patent/JP5728918B2/ja
Publication of JP2012123230A publication Critical patent/JP2012123230A/ja
Application granted granted Critical
Publication of JP5728918B2 publication Critical patent/JP5728918B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数の情報系列の間で時間的な対応を解析した結果を評価する技術に関する。
複数の情報系列の間で時間的な対応を解析(以下「同期解析」という)する技術が従来から提案されている。例えば特許文献1には、光ディスク等の記録媒体から再生される音響信号とMIDIに準拠した制御情報の時系列との間で時間軸上の対応を解析する技術が開示されている。
特開2004−212473号公報
ところで、複数の情報系列の間で時間的な対応を正確に解析することは困難であり、解析結果に誤差が発生する場合がある。したがって、同期解析結果の妥当性(信頼性)を定量的に評価できれば有用である。以上の事情を考慮して、本発明は、同期解析結果の定量的な評価指標の提供を目的とする。
以上の課題を解決するために本発明が採用する手段を説明する。なお、本発明の理解を容易にするために、以下の説明では、本発明の要素と後述の実施形態の要素との対応を括弧書で付記するが、本発明の範囲を実施形態の例示に限定する趣旨ではない。
本発明の情報処理装置は、複数の第1単位情報(例えば単位情報UA)を時系列に配列した第1情報系列(例えば情報系列τA)と複数の第2単位情報(例えば単位情報UB)を時系列に配列した第2情報系列(例えば情報系列τB)との間で各第1単位情報と各第2単位情報との時間的な対応を解析する同期解析について結果の評価指標(例えば評価指標E)を算定する情報処理装置であって、第1情報系列に対応する第1軸(例えばX軸)と第2情報系列に対応する第2軸(例えばY軸)とで規定される解析平面において、同期解析で相互に対応すると判断された第1単位情報と第2単位情報との組合せ毎の対応点(例えば対応点C[k])の分布を近似する基準線(例えば基準線LREF)を特定する分布近似手段(例えば分布近似部42)と、基準線と対応点との隔たりに応じて評価指標を算定する指標算定手段(例えば指標算定部44)とを具備する。以上の構成によれば、基準線と各対応点との隔たりに応じて算定される評価指標を同期解析結果の定量的な指標として利用することが可能である。
本発明の好適な態様において、分布近似手段は、複数の対応点の回帰直線を基準線として特定する。以上の態様によれば、複数の対応点の分布を高精度に近似する基準線を簡易な方法(例えば最小二乗法)で特定することが可能である。指標算定手段は、例えば、第1軸および第2軸の一方の方向における各対応点と基準線との間隔の自乗和の平方根と、間隔の絶対値の最大値(正数の範囲内の各間隔の最大値または負数の範囲内の各間隔の最小値)と、複数の対応点の各々に対応する間隔の散らばりの度合等の数値に応じて評価指標を算定する。
本発明の好適な態様に係る情報処理装置は、楽曲の楽音を示す第1音響信号(例えば音響信号SA)の特徴量を第1単位情報として時系列に配列した第1情報系列と、楽曲の楽音を示す第2音響信号(例えば音響信号SB)の特徴量を第2単位情報として時系列に配列した第2情報系列とについて同期解析を実行する同期解析手段(例えば同期解析部32)を具備し、分布近似手段は、同期解析手段による同期解析結果(例えば探索経路P)から基準線を特定する。以上の態様においては、第1音響信号が示す楽曲と第2音響信号が示す楽曲との同期解析結果の定量的な評価が実現されるから、第1音響信号と第2音響信号とを同期させる場合に有用である。
第1音響信号と第2音響信号との同期解析を実行する情報処理装置の第1態様は、楽曲に関連する情報を第2音響信号に同期するように時系列に指定する制御情報(例えば歌詞情報DL)を記憶する記憶手段(例えば記憶装置14)と、第1音響信号の再生と制御情報の処理とが相互に同期するように同期解析手段による同期解析結果に応じて制御情報を順次に処理する情報処理手段(例えば情報処理部64)とを具備する。以上の態様によれば、第1音響信号の再生と制御情報の処理とを相互に同期させることが可能である。更に好適な態様において、情報処理手段は、同期解析手段による同期解析結果の妥当性が高いことを評価指標が示す場合には、第1音響信号の再生と制御情報の処理とが相互に同期するように同期解析手段による同期解析結果に応じて制御情報を順次に処理し、同期解析結果の妥当性が低いことを評価指標が示す場合には同期解析の失敗を利用者に報知する。以上の態様の具体例は例えば第3実施形態として後述される。
第1音響信号と第2音響信号との同期解析を実行する情報処理装置の第2態様において、同期解析手段は、複数の候補楽曲の各々について、対象楽曲の第1情報系列と当該候補楽曲の第2情報系列との間で同期解析を実行し、分布近似手段は、対象楽曲と各候補楽曲との組合せ毎に基準線を特定し、指標算定手段は、対象楽曲と各候補楽曲との組合せ毎に評価指標を算定し、複数の候補楽曲のうち対象楽曲に類似する楽曲を、各候補楽曲の評価指標に応じて選択する楽曲検索手段(例えば楽曲検索部72)を具備する。以上の態様では、対象楽曲に類似する候補楽曲を評価指標に応じて高精度に検索できるという利点がある。以上の態様の具体例は例えば第4実施形態として後述される。
本発明の好適な態様において、第1情報系列から選択された特定区間内の第1単位情報に対応する各対応点を対象として、分布近似手段が基準線を特定するとともに指標算定手段が評価指標を算定する。以上の態様においては、第1情報系列の特定区間内の各対応点を対象として評価指標が算定されるから、例えば各対応点と基準線とが本来的に乖離し易い区間(例えば第1情報系列のうち先頭区間と末尾区間との少なくとも一方の区間)以外の区間を特定区間に設定することで、同期解析結果の妥当性を適切に評価可能な評価指標を算定することが可能である。
本発明の好適な態様に係る情報処理装置は、第1情報系列と第2情報系列との楽曲構成の相違の有無を判定する判定手段(例えば判定部36)を具備し、曲構成が相違しないと判定手段が判定した場合に分布近似手段による基準線の特定と指標算定手段による評価指標の算定とが実行され、曲構成が相違すると判定手段が判定した場合には、分布近似手段による基準線の特定と指標算定手段による評価指標の算定とが停止される。以上の態様によれば、第1情報系列と第2情報系列との楽曲構成の相違の有無が判定されるから、同期解析結果の妥当性を正確に評価できる評価指標を算定することが可能である。なお、以上の態様の具体例は例えば第2実施形態として後述される。
以上の各態様に係る情報処理装置は、評価指標の算定に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、複数の第1単位情報を時系列に配列した第1情報系列と複数の第2単位情報を時系列に配列した第2情報系列との間で各第1単位情報と各第2単位情報との時間的な対応を解析する同期解析について結果の評価指標を算定するために、第1情報系列に対応する第1軸と第2情報系列に対応する第2軸とで規定される解析平面において、同期解析で相互に対応すると判断された第1単位情報と第2単位情報との組合せ毎の対応点の分布を近似する基準線を特定する分布近似処理と、基準線と対応点との隔たりに応じて評価指標を算定する指標算定処理とをコンピュータに実行させる。以上のプログラムによれば、本発明に係る情報処理装置と同様の作用および効果が奏される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
第1実施形態に係る音響処理装置のブロック図である。 同期解析の説明図である。 同期解析が失敗した場合の探索経路と基準線との傾向を示す模式図である。 同期解析が成功した場合の探索経路と基準線との傾向を示す模式図である。 第2実施形態に係る音響処理装置のブロック図である。 第3実施形態に係る音響処理装置のブロック図である。 第4実施形態に係る音響処理装置のブロック図である。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100Aのブロック図である。音響処理装置100Aには音響信号SAと音響信号SBとが供給される。音響信号SAおよび音響信号SBは、楽曲の楽音(演奏音や歌唱音)の時間波形を表す信号である。音響信号SAの楽曲と音響信号SBの楽曲とは著作物としては相互に共通するが、例えば音響信号SAと音響信号SBとは別個に収録または作成されるから、楽曲内の各楽音の時間軸上の位置は音響信号SAと音響信号SBとで完全には合致(同期)しない。音響処理装置100Aは、音響信号SAと音響信号SBとの間で各楽音の時間的な対応を解析(同期解析)する情報処理装置である。
音響処理装置100Aは、演算処理装置12と記憶装置14とを具備するコンピュータシステムで実現される。記憶装置14は、演算処理装置12が実行するプログラムや演算処理装置12が使用する各種の情報を記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置14として任意に採用される。演算処理装置12は、記憶装置14に記憶されたプログラムを実行することで複数の機能(第1特徴抽出部22,第2特徴抽出部24,解析処理部26,指標出力部28)を実現する。なお、演算処理装置12の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。
第1特徴抽出部22は、図2に示すように、音響信号SAを区分したM個の単位区間TA[1]〜TA[M]の各々について音響信号SAの音楽的な特徴量を示す単位情報UAを算定する。同様に、第2特徴抽出部24は、音響信号SBのN個の単位区間TB[1]〜TB[N]の各々について音響信号SBの音楽的な特徴量を示す単位情報UBを算定する。すなわち、M個の単位情報UAを時系列に配列した情報系列τAとN個の単位情報UBを時系列に配列した情報系列τBとが生成される。単位区間TA[m](m=1〜M)と単位区間TB[n](n=1〜N)とは基本的には同等の時間長に設定されるが、相異なる時間長にも設定され得る。
単位情報UAおよび単位情報UBの各々が示す特徴量は、例えばクロマベクトル(ピッチクラスプロファイル(PCP:Pitch Class Profile))である。クロマベクトルは、音響の和声感の指標となる特徴量であり、相異なる音名(C,C#,D,D#,E,F,F#,G,G#,A,A#,B)に対応する12次元のベクトルで表現される。クロマベクトルを構成する12個の要素の各々は、音響信号(SA,SB)のうち当該要素に対応する音名(クロマ)の周波数成分(1オクターブに相当する周波数帯域を音名毎に区分した12個の周波数帯域のうち当該音名に対応する周波数帯域の成分)の強度を複数のオクターブについて加算または平均した数値に相当する。すなわち、第1特徴抽出部22は、短時間フーリエ変換等の公知の周波数分析で音響信号SAの単位区間TA[m]毎に周波数スペクトルを生成し、周波数スペクトルのうち1オクターブに相当する周波数帯域を複数のオクターブについて加算したクロマベクトルを単位情報UAとして算定する。第2特徴抽出部24が単位区間TB[n]毎に単位情報UBを算定する手順も同様である。もっとも、単位情報UAや単位情報UBが示す特徴量はクロマベクトルに限定されない。例えば、音響信号SAや音響信号SBのピッチや音量等の特徴量を単位情報UAや単位情報UBとして抽出する構成も採用され得る。
図1の解析処理部26は、第1特徴抽出部22が生成する情報系列τAと第2特徴抽出部24が生成する情報系列τBとの対比で音響信号SAと音響信号SBとの時間的な対応を解析する手段であり、同期解析部32と結果解析部34とを含んで構成される。
同期解析部32は、音響信号SAと音響信号SBとで相互に対応する時間軸上の位置(楽曲内の同じ楽音に対応する位置)を情報系列τAと情報系列τBとの対比の結果に応じて特定する同期解析を実行する。具体的には、同期解析部32は、音響信号SAのM個の単位区間TA[1]〜TA[M]の各々の単位情報UAと音響信号SBのN個の単位区間TB[1]〜TB[N]の各々の単位情報UBとの類否(相関)を解析することで各単位区間TA[m]と各単位区間TB[n]との時間的な対応を特定する。同期解析部32による同期解析には、以下に例示する動的時間伸縮(DTW:Dynamic Time Warping)が好適に採用される。
同期解析部32は、音響信号SAのM個の単位区間TA[1]〜TA[M]と音響信号SBのN個の単位区間TB[1]〜TB[N]とから単位区間TA[m]および単位区間TB[n]を選択する全通りの組合せについて、単位区間TA[m]の単位情報UAと単位区間TB[n]の単位情報UBとの類否(相関)の指標となる類否指標値R[m,n]を算定する。例えば単位情報UAと単位情報UBとの内積が類否指標値R[m,n]として算定される。したがって、単位情報UAと単位情報UBとの類似度が高いほど類否指標値R[m,n]は大きい数値となる。なお、例えば単位情報UAと単位情報UBとの幾何距離を類否指標値R[m,n]として算定する構成(単位情報UAと単位情報UBとの類似度が高いほど類否指標値R[m,n]が小さい数値となる構成)も採用され得る。
図2に示すように、音響信号SAの情報系列τA(単位区間TA[1]〜TA[M])に対応するX軸と音響信号SBの情報系列τB(単位区間TB[1]〜TB[N])に対応するY軸とで規定される平面(以下「解析平面」という)を想定すると、解析平面のうち単位区間TA[m]と単位区間TB[n]との各組合せに対応する格子点(以下「解析点」という)A[m,n]毎に類否指標値R[m,n]が算定される。同期解析部32は、音響信号SAの先頭の単位区間TA[1]と音響信号SBの先頭の単位区間TB[1]とに対応する解析点A[1,1]から、音響信号SAの末尾の単位区間TA[M]と音響信号SBの末尾の単位区間TB[N]とに対応する解析点A[M,N]に到達するように各解析点A[m,n]を連結した複数の経路のうち類否指標値R[m,n]の累積値が最大となる1個の探索経路(matching path)Pを選択する。探索経路P上のK個の解析点A[m,n](以下では特に「対応点C[1]〜C[K]」と表記する)の各々が、楽曲内で相互に対応する単位区間TA[m]と単位区間TB[n]との組合せに相当する。以上が同期解析部32による同期解析の具体的な手順である。
図1の結果解析部34は、同期解析部32による同期解析結果(探索経路P)の妥当性を評価するための定量的な指標(以下「評価指標」という)Eを算定する。図1に示すように、結果解析部34は、分布近似部42と指標算定部44とを含んで構成される。
分布近似部42は、図3に示すように、同期解析部32が特定した探索経路P上のK個の対応点C[1]〜C[K]の解析平面での分布を近似する基準線LREFを特定する。基準線LREFは、例えば各対応点C[k](k=1〜K)のX方向の座標値x[k]とY方向の座標値y[k]とを利用した最小二乗法で算定される回帰直線であり、以下の数式(1)の一次関数で表現される。数式(1)の記号aは基準線LREFの勾配を意味し、記号bはY軸上の切片を意味する。
Y=a・X+b ……(1)
指標算定部44は、分布近似部42が特定した基準線LREFとK個の対応点C[1]〜C[K]との各々との隔たり(誤差,残差)に応じて評価指標Eを算定する。具体的には、指標算定部44は、Y軸の方向における各対応点C[k]と基準線LREFとの間隔D[k]に応じて評価指標Eを算定する。図3に示すように、基準線LREFのうちX軸の方向の位置が対応点C[k]と一致する地点のY軸の座標値は、「a・x[k]+b」と表現される。したがって、Y軸の方向における対応点C[k]と基準線LREFとの間隔D[k]は以下の数式(2)で表現される。
D[k]=y[k]−(a・x[k]+b) ……(2)
指標算定部44は、各対応点C[k]に対応するK個の間隔D[1]〜D[K]の自乗和の平方根S(S=(D[1]2+D[2]2+……+D[K]21/2)に応じて評価指標Eを算定する。具体的には、評価指標Eは以下の数式(3)で定義される。
E=S/Z
=(D[1]2+D[2]2+……+D[K]21/2/Z ……(3)
数式(3)の記号Zは、音響信号SAまたは音響信号SBの時間長(あるいは音響信号SAおよび音響信号SBの平均時間長)を意味する。数式(3)の時間長Zによる除算は、評価指標Eに対する時間長Z(対応点C[k]の個数)の影響が低減されるように評価指標Eを正規化する演算を意味する。ただし、時間長Zによる評価指標Eの正規化は省略され得る。
音響信号SAと音響信号SBとで楽曲構成が充分に類似する状況を仮定すると、同期解析部32による同期解析が成功した場合(誤差が小さい場合)には、図4に示すように、同期解析部32が特定した探索経路Pは基準線LREFに充分に近似する。すなわち、K個の対応点C[1]〜C[K]が基準線LREFの近傍に偏在して直線状に配列し、各間隔D[k]はゼロに近い数値となる。したがって、指標算定部44が算定する評価指標Eは小さい数値となる。
他方、同期解析部32による同期解析が失敗した場合(誤差が大きい場合)、音響信号SAと音響信号SBとで楽曲構成が類似するにも関わらず、探索経路Pは基準線LREFから乖離した折線となる。すなわち、図3に示すように、K個の対応点C[1]〜C[K]が基準線LREFから離間した位置に散在し、同期解析が成功した場合と比較して各間隔D[k]は大きい数値となる。したがって、指標算定部44が算定する評価指標Eは、同期解析が成功した場合と比較して大きい数値となる。
以上の説明から理解されるように、同期解析部32による同期解析結果の妥当性が高いほど評価指標Eは小さい数値になるという傾向がある。したがって、同期解析結果の妥当性を評価するための定量的な指標として評価指標Eを利用することが可能である。
図1の指標出力部28は、結果解析部34(指標算定部44)が算定した評価指標Eに応じて同期解析部32による同期解析結果の妥当性の評価を利用者に報知する。例えば、指標出力部28は、評価指標Eを所定の閾値Ethと比較し、評価指標Eが閾値Ethを下回る場合には同期解析結果の妥当性が高いことを利用者に報知し、評価指標Eが閾値Ethを上回る場合には同期解析結果の妥当性が低いことを利用者に報知する。指標出力部28による報知の方法は任意であるが、例えば評価結果を示す画像の出力(表示または印刷)や評価結果を示す音声の再生が好適である。なお、指標出力部28が評価指標Eの数値を利用者に報知する構成も採用され得る。以上に説明したように、本実施形態によれば、基準線LREFと各対応点C[k]との隔たりに応じて算定される評価指標Eを同期解析結果の定量的な指標として利用することが可能である。
<B:第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
第1実施形態では、音響信号SAと音響信号SBとで楽曲構成が類似する場合を前提として同期解析結果と評価指標Eとの相関を説明した。しかし、音響信号SAと音響信号SBとで楽曲構成が大幅に相違する場合には、同期解析部32による同期解析が成功した場合でも評価指標Eは大きい数値となる。第2実施形態では、音響信号SAと音響信号SBとで楽曲構成が相違する場合を、同期解析部32による同期解析が失敗した場合と区別する。
図5は、第2実施形態の音響処理装置100Bのブロック図である。図5に示すように、音響処理装置100Bの解析処理部26は、第1実施形態と同様の要素(同期解析部32,結果解析部34)に判定部36を追加した構成である。判定部36は、音響信号SAと音響信号SBとで楽曲構成が相違するか否かを判定する。具体的には、音響信号SAおよび音響信号SBの一方に存在しない区間(例えば休符区間)が他方に含まれる場合に、音響信号SAと音響信号SBとで楽曲構成が相違すると判定部36は判定する。楽曲構成の異同(類否)の判定には公知の技術が任意に採用され得るが、同期解析部32による同期解析結果(探索経路P)を利用する以下の方法が好適である。
音響信号SAと音響信号SBとで楽曲構成が類似する場合、音響信号SAの1個の単位区間TA[m]に音響信号SBの多数の単位区間TB[n]が対応する可能性や、音響信号SBの1個の単位区間TB[n]に音響信号SAの多数の単位区間TA[m]が対応する可能性は低い。以上の傾向から、音響信号SBのうち所定値を上回る個数の単位区間TB[n]が音響信号SAの1個の単位区間TA[m]に対応すると同期解析部32が判定した場合(すなわち探索経路PのうちY軸の方向に連続して延在する区間長が所定値を上回る場合)や、音響信号SAのうち所定値を上回る個数の単位区間TA[m]が音響信号SBの1個の単位区間TB[n]に対応すると同期解析部32が判定した場合(すなわち探索経路PのうちX軸の方向に連続して延在する区間長が所定値を上回る場合)に、判定部36は、音響信号SAと音響信号SBとで楽曲構成が相違すると判定する。
音響信号SAと音響信号SBとで楽曲構成が相違すると判定部36が判定した場合、指標出力部28は、楽曲構成の相違を利用者に報知する。楽曲構成が相違すると判定された場合、結果解析部34の動作(分布近似部42による基準線LREFの特定および指標算定部44による評価指標Eの算定)は実行されない。他方、音響信号SAと音響信号SBとで楽曲構成が合致(類似)すると判定部36が判定した場合には、第1実施形態と同様に、分布近似部42による基準線LREFの特定と指標算定部44による評価指標Eの算定とが実行され、指標出力部28は評価指標Eに応じた同期解析結果の妥当性の評価を利用者に報知する。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、音響信号SAと音響信号SBとの楽曲構成の異同(類否)が判定されるから、音響信号SAと音響信号SBとの楽曲構成の相違に起因して同期解析部32による同期解析の失敗と評価される可能性は低減される。なお、第2実施形態では同期解析が失敗した場合と楽曲構成が相違する場合とを区別したが、第1実施形態において、楽曲構成が相違する結果として評価指標Eが大きい数値となる場合も含めて同期解析の失敗と評価する構成も採用され得る。
<C:第3実施形態>
図6は、第3実施形態の音響処理装置100Cのブロック図である。図6に示すように、音響処理装置100Cには表示装置52と信号供給装置54と放音装置56とが接続される。表示装置52は、音響処理装置100Cからの指示に応じて楽曲の歌詞を表示する。信号供給装置54は、音響信号SAを音響処理装置100Cに供給する。例えば、半導体記録媒体や光ディスク等の記録媒体から音響信号SAを取得して音響処理装置100Cに供給する再生装置や、通信網から音響信号SAを受信して音響処理装置100Cに出力する通信装置が、信号供給装置54として好適に採用される。放音装置56(例えばスピーカやヘッドホン)は、信号供給装置54が出力する音響信号SAに応じた音響を再生する。すなわち、第3実施形態では、楽曲の音響の再生と歌詞の表示とが並列に実行される。
記憶装置14は、楽曲毎に楽曲情報D0を記憶する。楽曲情報D0は、楽曲内の各楽音を時系列に指定する楽音情報DNと、楽曲の歌詞を時系列に指定する歌詞情報DLとを含んで構成される。例えば、楽音の音高および強度や歌詞を指定するイベントデータと各イベントデータの処理の時点を指定するタイミングデータとを時系列に配列したMIDI(Musical Instrument Digital Interface)形式のカラオケデータが楽曲情報D0として好適に採用される。
第3実施形態の演算処理装置12は、第1実施形態と同様の第1特徴抽出部22および第2特徴抽出部24と解析処理部26とに加えて信号生成部62および情報処理部64として機能する。信号生成部62は、楽曲情報D0の楽音情報DNから音響信号SBを生成する。具体的には、楽音情報DNのイベントデータが指定する楽音の波形を順次に生成する公知の音源(MIDI音源)が信号生成部62として好適に採用される。音響信号SBが示す楽音の時系列と歌詞情報DLが指定する歌詞の時系列とが時間軸上で相互に対応(同期)するように楽音情報DNと歌詞情報DLとは作成される。すなわち、音響信号SBを再生した場合に各楽音が発生する時点と、その楽音の発生の時点で歌唱すべき歌詞を歌詞情報DLが指定する時点とは時間軸上で対応(理想的には合致)する。
第1特徴抽出部22は、信号供給装置54から供給される音響信号SAの特徴量を示す単位情報UAを第1実施形態と同様に単位区間TA[m]毎に生成する。第2特徴抽出部24は、信号生成部62が生成する音響信号SBの特徴量を示す単位情報UBを第1実施形態と同様に単位区間TB[n]毎に生成する。解析処理部26の動作(同期解析部32による同期解析や結果解析部34による評価指標Eの算定)は第1実施形態と同様である。
情報処理部64は、結果解析部34が算定した評価指標Eに応じて同期解析結果の妥当性が高いと評価できる場合(例えば評価指標Eが閾値Ethを下回る場合)に、楽曲情報D0の歌詞情報DLが指定する歌詞を表示装置52に順次に表示させる。歌詞情報DLの処理(表示装置52に対する表示の指示)の進行速度は、音響信号SAの再生に同期するように、同期解析部32による解析結果(探索経路P)に応じて可変に設定される。具体的には、同期解析部32による同期解析で各単位区間TA[m]に対応付けられた単位区間TB[n]の歌詞が、音響信号SAのうち当該単位区間TA[m]が再生される時点で表示装置52に表示されるように、情報処理部64は各歌詞情報DLの処理の進行速度を制御する。したがって、音響処理装置100Cの利用者は、音響信号SAの再生音(楽音情報DNから再生される楽音と比較して一般的には高音質な楽音)のもとで歌詞を確認しながら歌唱することが可能である。
他方、同期解析結果の妥当性が低いと評価指標Eから評価できる場合(例えば評価指標Eが閾値Ethを上回る場合)、情報処理部64は、同期解析結果の妥当性が低いこと(同期解析の失敗)を例えば表示装置52から利用者に報知する。同期解析が失敗した場合、音響信号SAの再生や情報処理部64による歌詞情報DLの処理(歌詞表示)は停止される。もっとも、同期解析結果の妥当性が低いと評価できる場合に、同期解析の失敗を利用者に報知しながら音響信号SAの再生や歌詞の表示を実行する構成も採用される。
なお、音響信号SAと音響信号SBとの楽曲構成の異同(類否)を判定する第2実施形態の判定部36を第3実施形態に追加することも可能である。例えば、音響信号SAと音響信号SBとで楽曲構成が相違すると判定部36が判定した場合、情報処理部64による歌詞情報DLの処理と結果解析部34による評価指標Eの算定が停止され、情報処理部64は楽曲構成の相違を利用者に報知する。他方、音響信号SAと音響信号SBとで楽曲構成が合致(類似)すると判定部36が判定した場合、第2実施形態の例示の通り、情報処理部64は、同期解析結果の妥当性が高いと評価指標Eから評価できるならば歌詞情報DLを順次に処理し、同期解析結果の妥当性が低いと評価指標Eから評価できるならばその旨を利用者に報知する。
また、以上の例示では楽音情報DNを音響信号SAとの同期の解析のみに利用したが、楽音情報DNに応じた音響信号SBを音響信号SAとともに再生する構成も採用され得る。例えば、ガイドメロディを示す楽音情報DNから音響信号SBを生成して音響信号SAとともに再生すれば、利用者による歌唱や演奏の練習を支援することが可能である。
<D:第4実施形態>
音響信号SAと音響信号SBとで楽曲が相違するほど基準線LREFと各対応点C[k]との隔たりが増加する(評価指標Eが増加する)という傾向がある。以上の傾向を考慮して、第4実施形態は、特定の楽曲(以下「対象楽曲」という)に類似する楽曲の検索に評価指標Eを利用する。
図7は、第4実施形態の音響処理装置100Dのブロック図である。図7に示すように、音響処理装置100Dには第3実施形態と同様の信号供給装置54が接続される。信号供給装置54は、対象楽曲の音響信号SAを音響処理装置100Dに供給する。対象楽曲は例えば利用者からの指示に応じて選択される。他方、記憶装置14は、検索候補となるH個の楽曲(以下「候補楽曲」という)について音響信号SB[1]〜SB[H]を記憶する。なお、対象楽曲の音響信号SAを記憶装置14に記憶した構成(したがって信号供給装置54は省略される)も採用され得る。
図7に示すように、音響処理装置100Dの演算処理装置12は、第1実施形態と同様の第1特徴抽出部22および第2特徴抽出部24と解析処理部26とに加えて楽曲検索部72として機能する。第1特徴抽出部22は、第1実施形態と同様に、音響信号SAの単位情報UAを単位区間TA[m]毎に生成する。第2特徴抽出部24は、H個の候補楽曲の各々について音響信号SB[h](h=1〜H)の単位情報UBを単位区間TB[n]毎に生成する。
解析処理部26の同期解析部32は、H個の候補楽曲の各々について、その候補楽曲の音響信号SB[h]と対象楽曲の音響信号SAとの間の同期解析を実行する。すなわち、対象楽曲と各候補楽曲との各組合せに対応するH個の探索経路P[1]〜P[H]が特定される。結果解析部34は、探索経路P[1]〜P[H]の各々について評価指標E[h]を算定する。具体的には、H個の探索経路P[1]〜P[H]の各々について(すなわち対象楽曲と各候補楽曲との組合せ毎に)、分布近似部42による基準線LREFの特定と指標算定部44による評価指標E[h]の算定とが実行される。したがって、相異なる候補楽曲に対応するH個の評価指標E[1]〜E[H]が算定される。
楽曲検索部72は、H個の候補楽曲のうち対象楽曲に類似する候補楽曲を、各候補楽曲の評価指標E[h](E[1]〜E[K])に応じて選択する。具体的には、楽曲検索部72は、H個の候補楽曲のうち評価指標E[h]が最小となる候補楽曲(すなわち対象楽曲に類似する楽曲)を選択し、その候補楽曲を利用者に報知する。したがって、利用者は、H個の候補楽曲のうち楽曲構成等が対象楽曲に類似する楽曲を把握することが可能である。なお、H個の候補楽曲のうち評価指標E[h]の昇順(小→大)で上位に位置する所定個の候補楽曲を楽曲検索部72が選択する構成や、H個の候補楽曲のうち評価指標E[h]が閾値Ethを下回る1個以上の候補楽曲を楽曲検索部72が選択する構成も採用され得る。
なお、音響信号SAと音響信号SBとの楽曲構成の異同(類否)を判定する第2実施形態の判定部36を第4実施形態に追加することも可能である。判定部36は、H個の候補楽曲の各々について対象楽曲との楽曲構成の異同(類否)を判定する。そして、楽曲検索部72は、判定部36による候補楽曲毎の判定の結果と結果解析部34が候補楽曲毎に算定した評価指標E[h]とに応じて、対象楽曲に類似する候補楽曲を選択する。例えば、楽曲検索部72は、H個の候補楽曲のうち楽曲構成が対象楽曲に合致または類似すると判定部36が判定した1個以上の候補楽曲のなかから評価指標E[h]が最小となる候補楽曲を選択する。したがって、楽曲構成が相違すると判定部36が判定した候補楽曲は、対象楽曲に類似すると評価できる程度に評価指標E[h]が小さい場合(すなわち評価指標E[h]のみで判定した場合には対象楽曲に類似すると評価できる場合)でも対象楽曲とは非類似の楽曲と判定される。なお、楽曲構成が相違すると判定部36が判定した候補楽曲については結果解析部34による評価指標E[h]の算定を省略する(したがって、その候補楽曲は楽曲検索部72による検索対象から除外される)構成も好適である。
<E:変形例>
以上に例示した各形態には様々な変形が加えられる。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は併合され得る。
(1)変形例1
以上の各形態では、各対応点C[k]と基準線LREFとの間隔D[k]の自乗和の平方根Sに応じて評価指標Eを算定したが、評価指標Eの算定の方法は適宜に変更される。例えば、K個の間隔D[1]〜D[K]の絶対値の最大値(基準線LREFからY方向の正側または負側に最も離間した対応点C[k]に対応する間隔D[k]の絶対値)に応じて評価指標Eを算定することも可能である。例えば、K個の間隔D[1]〜D[K]のうち正数となる各間隔D[k]の最大値に応じて結果解析部34(指標算定部44)が評価指標Eを算定する構成が採用され得る。間隔D[k]が正数である場合(すなわち、対応点C[k]が基準線LREFに対してY方向の正側に位置する場合)、音響信号SBが音響信号SAに先行する(音響信号SAが音響信号SBに対して遅延する)ことを意味する。したがって、正数の間隔D[k]が最大値となる地点を、音響信号SBが音響信号SAに対して最も先行する地点として特定することも可能である。他方、K個の間隔D[1]〜D[K]のうち負数となる各間隔D[k]の絶対値の最大値(すなわち負数の範囲内での間隔D[k]の最小値)に応じて結果解析部34(指標算定部44)が評価指標Eを算定する構成も採用され得る。間隔D[k]が負数である場合(すなわち、図3の例示のように対応点C[k]が基準線LREFに対してY方向の負側に位置する場合)、音響信号SAが音響信号SBに先行する(音響信号SBが音響信号SAに対して遅延する)ことを意味する。したがって、負数の間隔D[k]が最小(絶対値が最大)となる地点を、音響信号SAが音響信号SBに対して最も先行する地点として特定することも可能である。
また、K個の対応点C[1]〜C[K]が基準線LREFから離間した位置に散在するほど探索経路Pと基準線LREFとの乖離が大きい(同期解析結果の妥当性は低い)という傾向を考慮すると、K個の間隔D[1]〜D[K]の散らばりの度合を示す統計量に応じて評価指標Eを算定する構成も採用され得る。間隔D[1]〜D[K]の散らばりの度合を示す統計量としては、範囲(最小値と最大値との差分)や分散,標準偏差,標準誤差等が例示される。また、以上に例示した数値(間隔D[k]の自乗和の平方根S,K個の間隔D[1]〜D[K]の絶対値の最大値,K個の間隔D[1]〜D[K]の散らばりの度合を示す統計量)を適宜に組合わせて評価指標Eを算定する構成も採用され得る。
以上の各形態では各対応点C[k]と基準線LREFとのY軸の方向の間隔を間隔D[k]としたが、X方向における各対応点C[k]と基準線LREFとの間隔を間隔D[k]として評価指標Eを算定することも可能である。また、以上の説明では、各対応点C[k](探索経路P)と基準線LREFとの隔たりが大きいほど評価指標Eが大きい数値となる場合を例示したが、同期解析結果の妥当性の高低と評価指標Eの大小との関係は任意である。例えば、各対応点C[k](探索経路P)と基準線LREFとの隔たりが大きい(同期解析結果の妥当性が低い)ほど評価指標Eが小さい数値となるように評価指標Eを算定する構成も採用される。
以上の例示から理解されるように、前述の各形態の指標算定部44は、各対応点C[k](探索経路P)と基準線LREFとの隔たり(間隔D[k])に応じて評価指標Eを算定する要素として包括され、間隔D[k]と評価指標Eとの関係や評価指標Eの算定の方法の如何は本発明において不問である。
(2)変形例2
以上の各形態では、音響信号SAおよび音響信号SBの全区間にわたる対応点C[k]を対象として評価指標Eを算定したが、音響信号SA(または音響信号SB)の特定区間に対応する複数の対応点C[k]を対象として分布近似部42による基準線LREFの特定や指標算定部44による評価指標Eの算定を実行する構成も採用される。楽曲の先頭区間(前奏部分)や末尾区間(後奏部分)では音響信号SAと音響信号SBとが相違する場合が多いという傾向を考慮して、音響信号SA(または音響信号SB)のうち先頭区間と末尾区間との少なくとも一方を除外した区間を特定区間として、特定区間内の複数の対応点C[k]から評価指標Eを算定する構成が好適である。また、例えば音響信号SAおよび音響信号SBについて楽曲内のサビ区間を特定区間として選択することも可能である。
(3)変形例3
以上の各形態では、解析平面におけるK個の対応点C[1]〜C[K]の回帰直線を基準線LREFとして特定したが、基準線LREFの特定の方法は任意である。例えば、K個の対応点C[1]〜C[K]から選択された2個(例えば対応点C[1]と対応点C[K])を連結する直線を基準線LREFとして特定する構成も採用され得る。また、K個の対応点C[1]〜C[K]の分布を近似する曲線(例えば回帰曲線)を基準線LREFとして特定することも可能である。以上の説明から理解されるように、基準線LREFは、K個の対応点C[1]〜C[K]の分布を近似する線であれば足り、具体的な特定の方法や形状(直線/曲線)は不問である。
(4)変形例4
第3実施形態において音響信号SAの再生に同期して表示装置52に表示させる情報は歌詞に限定されない。例えば、楽曲の楽譜(例えばコード譜やタブ譜)を時系列に指定する楽譜情報を、音響信号SAの再生に同期して情報処理部64が処理することで表示装置52に楽譜を表示させる構成が採用され得る。楽曲に関連する画像(例えばカラオケの背景画像)を時系列に指定する画像情報を、音響信号SAの再生に同期して情報処理部64が処理することで表示装置52に画像を表示させる構成も好適である。
また、音響信号SAの再生と同期させるべき動作は画像(歌詞,楽譜,背景画像等)の表示に限定されない。具体的には、楽曲の再生に関連する要素の動作を時系列に指示する指示情報の処理(当該要素の制御)を音響信号SAの再生と同期させる構成が採用され得る。指示情報は、歌詞情報DLと同様に、楽音情報DNが指定する楽音の時系列と指示情報による指示の時系列とが時間軸上で相互に対応(同期)するように作成される。例えば、楽曲の再生時における照明機器の動作(明滅や照度)を時系列に指示する指示情報や、効果付与部(エフェクタ)が音響信号SAに付加する音響効果の態様(効果の種類や程度)を時系列に指示する指示情報を、前述の各態様における歌詞情報DLの代わりに(または歌詞情報DLとともに)、音響信号SAの再生と同期させる構成が採用され得る。
以上の例示から理解されるように、音響信号SAの再生に並行して処理される情報(例えば以上に例示した歌詞情報DL,楽譜情報,画像情報,指示情報)は、楽曲に関連する情報を時系列に指定する制御情報として包括される。また、制御情報を処理する要素(例えば前述の各形態における情報処理部64)は、音響信号SAの再生と制御情報の処理とが同期するように同期解析部32による解析の結果に応じて制御情報を処理する要素として包括される。
(5)変形例5
前述の各形態では、楽曲の楽音を表す音響信号SAと音響信号SBとの時間的な対応を解析したが、同期解析の対象となる情報系列τA(単位情報UA)および情報系列τB(単位情報UB)は、音楽的な情報に限定されずに任意に変更される。すなわち、以上の各形態の同期解析は、単位情報UAを時系列に配列した情報系列τAと単位情報UBを時系列に配列した情報系列τBとの間で各単位情報UAと各単位情報UBとの時間的な対応(各単位区間TA[m]と各単位区間TB[n]との対応)を解析する処理として包括され、単位情報UAや単位情報UBの内容は不問である。
(6)変形例6
以上の各形態では、同期解析部32と結果解析部34とを具備する音響処理装置100(100A,100B,100C,100D)を例示したが、外部装置の同期解析部32による同期解析結果(探索経路P)を評価する情報処理装置(同期解析評価装置)としても本発明は実現される。すなわち、同期解析結果を評価する(評価指標Eを算定する)という趣旨からすると、結果解析部34以外の各要素(第1特徴抽出部22,第2特徴抽出部24,同期解析部32,指標出力部28,情報処理部64,信号生成部62,楽曲検索部72)は本発明において適宜に省略され得る。
100A,100B,100C,100D……音響処理装置、12……演算処理装置、14……記憶装置、22……第1特徴抽出部、24……第2特徴抽出部、26……解析処理部、28……指標出力部、32……同期解析部、34……結果解析部、36……判定部、42……分布近似部、44……指標算定部、52……表示装置、54……信号供給装置、56……放音装置、62……信号生成部、64……情報処理部、72……楽曲検索部。

Claims (5)

  1. 楽曲の楽音を示す第1音響信号の特徴量を示す複数の第1単位情報を時系列に配列した第1情報系列と、楽曲の楽音を示す第2音響信号の特徴量を示す複数の第2単位情報を時系列に配列した第2情報系列との間で前記各第1単位情報と前記各第2単位情報との時間的な対応を解析する同期解析について結果の評価指標を算定する情報処理装置であって、
    前記第1情報系列に対応する第1軸と前記第2情報系列に対応する第2軸とで規定される解析平面において、前記同期解析で相互に対応すると判断された前記第1単位情報と前記第2単位情報との組合せ毎の対応点の分布を近似する基準線を特定する分布近似手段と、
    前記基準線と前記対応点との隔たりに応じて前記評価指標を算定する指標算定手段と
    を具備する情報処理装置。
  2. 前記分布近似手段は、複数の前記対応点の回帰直線を前記基準線として特定する
    請求項1の情報処理装置。
  3. 前記指標算定手段は、前記第1軸および前記第2軸の一方の方向における前記各対応点と前記基準線との間隔の自乗和の平方根と、前記間隔の絶対値の最大値と、複数の対応点の各々に対応する前記間隔の散らばりの度合とのうちの少なくともひとつに応じて前記評価指標を算定する
    請求項1または請求項2の情報処理装置。
  4. 前記第1情報系列と前記第2情報系列とについて前記同期解析を実行する同期解析手段を具備し、
    前記分布近似手段は、前記同期解析手段による同期解析結果から前記基準線を特定する
    請求項1から請求項3の何れかの情報処理装置。
  5. 楽曲に関連する情報を前記第2音響信号に同期するように時系列に指定する制御情報を記憶する記憶手段と、
    前記同期解析手段による同期解析結果の妥当性が高いことを前記評価指標が示す場合には、前記第1音響信号の再生と前記制御情報の処理とが相互に同期するように前記同期解析手段による同期解析結果に応じて前記制御情報を順次に処理し、前記同期解析結果の妥当性が低いことを前記評価指標が示す場合には同期解析の失敗を利用者に報知する情報処理手段と
    を具備する請求項4の情報処理装置。
JP2010274408A 2010-12-09 2010-12-09 情報処理装置 Expired - Fee Related JP5728918B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010274408A JP5728918B2 (ja) 2010-12-09 2010-12-09 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010274408A JP5728918B2 (ja) 2010-12-09 2010-12-09 情報処理装置

Publications (2)

Publication Number Publication Date
JP2012123230A JP2012123230A (ja) 2012-06-28
JP5728918B2 true JP5728918B2 (ja) 2015-06-03

Family

ID=46504727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010274408A Expired - Fee Related JP5728918B2 (ja) 2010-12-09 2010-12-09 情報処理装置

Country Status (1)

Country Link
JP (1) JP5728918B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5976029B2 (ja) * 2014-04-10 2016-08-23 日本電信電話株式会社 系列信号特定方法、装置、及びプログラム
CN111986698B (zh) 2019-05-24 2023-06-30 腾讯科技(深圳)有限公司 音频片段的匹配方法、装置、计算机可读介质及电子设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2668877B2 (ja) * 1987-04-17 1997-10-27 ソニー株式会社 音源正規化方法
JP3263546B2 (ja) * 1994-10-14 2002-03-04 三洋電機株式会社 音響再生装置
JPH08202380A (ja) * 1995-01-30 1996-08-09 Sumitomo Electric Ind Ltd 音声緩急分析方法および装置
IL113204A (en) * 1995-03-30 1999-03-12 Advanced Recognition Tech Pattern recognition system
JPH11214289A (ja) * 1998-01-29 1999-08-06 Nikon Corp 位置計測方法、及び該方法を用いる露光方法
JP2001013976A (ja) * 1999-07-02 2001-01-19 Kenwood Corp カラオケ装置
JP4951752B2 (ja) * 2005-11-17 2012-06-13 国立大学法人高知大学 易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造
JP2007233077A (ja) * 2006-03-01 2007-09-13 Yamaha Corp 評価装置、制御方法及びプログラム
JP4470947B2 (ja) * 2007-02-09 2010-06-02 ヤマハ株式会社 データ再生装置、データ再生方法およびプログラム
EP1962278A1 (en) * 2007-02-16 2008-08-27 Vrije Universiteit Brussel Method and device for timing synchronisation

Also Published As

Publication number Publication date
JP2012123230A (ja) 2012-06-28

Similar Documents

Publication Publication Date Title
JP4767691B2 (ja) テンポ検出装置、コード名検出装置及びプログラム
US10733900B2 (en) Tuning estimating apparatus, evaluating apparatus, and data processing apparatus
US8592670B2 (en) Polyphonic note detection
EP3843083A1 (en) Method, system, and computer-readable medium for creating song mashups
CN109979483B (zh) 音频信号的旋律检测方法、装置以及电子设备
Collins Using a Pitch Detector for Onset Detection.
US10643638B2 (en) Technique determination device and recording medium
WO2017068990A1 (ja) 楽音評価装置、評価基準生成装置及び記録媒体
CN108028051A (zh) 评估装置和记录介质
JP2017111268A (ja) 技法判定装置
US10298192B2 (en) Sound processing device and sound processing method
JP5728918B2 (ja) 情報処理装置
JP6263383B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法、プログラム
JP2015045731A (ja) 音響信号のアライメント装置
JP2020122948A (ja) カラオケ装置
JP6263382B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法、プログラム
JP5287617B2 (ja) 音響処理装置およびプログラム
JP2016184112A (ja) アンサンブル評価装置
JP5618743B2 (ja) 歌唱音声評価装置
JP5672960B2 (ja) 音響処理装置
JP5287616B2 (ja) 音響処理装置およびプログラム
JP5585320B2 (ja) 歌唱音声評価装置
JP5830840B2 (ja) 音声評価装置
JP5391939B2 (ja) 音響処理装置およびプログラム
JP2005107332A (ja) カラオケ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140722

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150323

R151 Written notification of patent or utility model registration

Ref document number: 5728918

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees