JP5088030B2 - 演奏音の類似度を評価する方法、装置およびプログラム - Google Patents

演奏音の類似度を評価する方法、装置およびプログラム Download PDF

Info

Publication number
JP5088030B2
JP5088030B2 JP2007194485A JP2007194485A JP5088030B2 JP 5088030 B2 JP5088030 B2 JP 5088030B2 JP 2007194485 A JP2007194485 A JP 2007194485A JP 2007194485 A JP2007194485 A JP 2007194485A JP 5088030 B2 JP5088030 B2 JP 5088030B2
Authority
JP
Japan
Prior art keywords
sound
probability density
density function
performance sound
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007194485A
Other languages
English (en)
Other versions
JP2009031486A (ja
Inventor
慶太 有元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007194485A priority Critical patent/JP5088030B2/ja
Priority to EP08160389.6A priority patent/EP2019384B1/en
Priority to US12/177,398 priority patent/US7659472B2/en
Publication of JP2009031486A publication Critical patent/JP2009031486A/ja
Application granted granted Critical
Publication of JP5088030B2 publication Critical patent/JP5088030B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B15/00Teaching music
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/056Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction or identification of individual instrumental parts, e.g. melody, chords, bass; Identification or separation of instrumental parts by their characteristic voices or timbres
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/325Synchronizing two or more audio tracks or files according to musical features or musical timings

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

この発明は、模範演奏に対してどの程度近い演奏が行われているかの評価を行う方法、装置およびプログラムに関する。
従来から演奏の独習機能を備えた楽器が各種提供されている。鍵盤楽器を例に挙げると、この種の独習機能を備えた楽器は、表示装置への表示等により、押鍵すべき鍵をユーザに指示し、ユーザによって押鍵された鍵を検知して、正しい押鍵がなされているかをユーザに知らせ、ユーザに鍵盤演奏の独習を行わせる。このような独習機能を実現するためには、ユーザによって押鍵された鍵を検知する必要がある。従って、キースキャン機構を備えていない鍵盤楽器には、このような独習機能を持たせることができないという問題があった。そこで、鍵盤操作等を検知するのではなく、演奏音を収音して、その周波数解析を行い、楽譜通りの正しい音高の演奏音が発生しているか否かを判定する技術が提案されるに至った。例えば特許文献1に開示された技術では、各種の音高のピアノ音を収音して、それらの周波数解析を行い、各音高のピアノ音のパワースペクトルを求めて予め記憶しておく。そして、ピアノ演奏が行われる際には、演奏音を収音し、その周波数解析を行ってパワースペクトルを求め、この演奏音のパワースペクトルと予め記憶した各種の音高のピアノ音の各パワースペクトルとの類似度を求め、類似度の高さにより楽譜通りの演奏がなされているか否かを判定する。
特開2004−341026号公報 特許第3413634号
しかしながら、一般に楽音のパワースペクトルは多くの周波数位置に倍音成分を持っており、各成分の割合も多様であるため、対比される2つの楽音がある場合に、それらの基本周波数は異なっているがパワースペクトルの形状は類似している、ということが起こりうる。このため、上述した特許文献1の技術では、ある基本周波数の演奏音が収音された場合に、この演奏音とは基本周波数が異なるがパワースペクトルの形状が類似したピアノ音が選択され、演奏音の音高が誤って判定される可能性がある、という問題があった。
この発明は、以上説明した事情に鑑みてなされたものであり、演奏音と模範演奏音との基本周波数の類似度を正確に評価することができる技術的手段を提供することを目的としている。
この発明では、対比される2つの演奏音の各々を一定時間長のフレームに分割し、フレーム単位で各演奏音の基本周波数の確率密度関数を発生する。その際、楽器が発生する音の高調波構造を模した音モデルを用い、演奏音の周波数成分が各種の基本周波数に対応した音モデルを重み付け加算した混合分布となるように各音モデルに対する重み値を逐次更新して最適化し、最適化した各種の基本周波数に対応した各音モデルの重み値を演奏音の基本周波数の確率密度関数として発生する。そして、フレーム単位で、対比される2つの演奏音の基本周波数の確率密度関数の類似度を評価する。
かかる発明によれば、対比される演奏音の基本周波数の類似度を精度良く評価することができる。
以下、図面を参照し、この発明の実施の形態を説明する。
<全体構成>
図1は、この発明による演奏音の類似度評価装置の一実施形態である教習伴奏システムの構成を示すブロック図である。この教習伴奏システムは、例えば鍵盤楽器等の楽器において稼動するシステムであり、ユーザに当該楽器の演奏の独習を行わせるシステムである。図1において、制御部101は、各種のプログラムを実行するCPUと、このCPUにワークエリアとして用いられるRAM等により構成されている。図1において、制御部101を表すボックス内には、制御部101のCPUによって実行されるプログラムのうち、本実施形態による教習伴奏システムとしての機能を実現するためのプログラムの処理内容が図示されている。操作部102は、各種のコマンドや情報をユーザから受け取るための装置であり、楽器の本体に配備されたパネルスイッチ等の操作子群によって構成されている。HDD(ハードディスク装置)103は、各種のプログラムやデータベースを記憶した記憶装置である。本実施形態による教習伴奏システムとしての機能を実現するためのプログラムもこのHDD103に記憶されている。制御部101のCPUは、操作部102の操作により、教習伴奏システムとしての機能を起動すべき旨のコマンドが与えられたとき、この教習伴奏システムとしての機能を実現するためのプログラムをRAMにロードして実行する。
収音部104は、外界の音を収音してアナログ音響信号を出力するマイクロフォンと、このアナログ音響信号をデジタル音響信号に変換するA/D変換器等により構成されている。本実施形態において、この収音部104は、演奏音を収音し、演奏音データを出力する収音手段として用いられる。
楽曲記憶部105は、楽曲の模範演奏を示す楽曲データを記憶するための記憶装置であり、例えばRAMにより構成されている。この楽曲データは、同期再生される波形データと楽譜データとにより構成されている。ここで、波形データは、楽曲の模範演奏音の波形の時系列サンプルデータであり、楽曲の小節線や拍のタイミングを示すラベル(時間情報)が随所に挿入されている。また、楽譜データは、これらのラベルに対応付けられた楽譜の画像データの集合体である。本実施形態では、楽曲記憶部105からの波形データの読み出し時に、楽譜のある区間の始まりを示すラベルが読み出されると、その区間に対応した楽譜の画像データが楽譜データ中から選択されて読み出されるようになっている。楽曲データには、波形データおよび楽譜データとして、メロディパートに対応したものとベースパートに対応したものが含まれている。データ入力部106は、各種の楽曲の楽曲データを外部から取り込むための手段である。例えばFDやICメモリ等の記憶媒体から楽曲データを読み出す装置やネットワークを介してサーバから楽曲データをダウンロードする通信装置等がこのデータ入力部106として用いられる。
サウンドシステム107は、デジタル音響信号をアナログ音響信号に変換するD/A変換器と、アナログ音響信号を音として出力するスピーカ等により構成されている。表示部108は、例えば液晶パネルディスプレイであり、本実施形態では、楽譜の画像の表示、ユーザにより行われた演奏が適切なものであったか否かの判定結果の表示等を行うための手段として用いられる。なお、判定結果は、表示に限らず、報知音や振動による提示などによりユーザに示してもよい。
次に、本実施形態における教習伴奏システムとしての機能を実現するためのプログラムの処理内容について説明する。まず、楽曲入力処理111は、操作部102を介して与えられるコマンドに従って、データ入力部106により楽曲データ105aを取得し、楽曲記憶部105に格納する処理である。楽曲読出処理112は、ユーザが演奏すべき位置(以下、演奏位置という)を制御するとともに、その演奏位置に対応した楽曲データを楽曲記憶部105内の楽曲データ105aから読み出す処理である。楽曲読出処理112における演奏位置の制御の態様には2通りある。第1の態様は、ユーザがメロディパートまたはベースパートの楽器演奏をしている場合において、この楽器演奏が模範演奏に近い合格基準内のものである場合に、演奏位置を進める態様である。第2の態様は、模範演奏の通常のテンポで演奏位置を進める態様である。楽曲読出処理112にいずれの態様による演奏位置の制御を行わせるかは、操作部102を介して与えられるコマンドにより決定される。また、ユーザの演奏パートも操作部102を介して与えられるコマンドにより決定される。
楽曲再生処理113は、楽曲読出処理112により読み出された演奏位置における楽曲データの中からユーザの演奏パート以外のパートの波形データを選択し、その波形データをサウンドシステム107に供給する処理である。楽曲表示処理114は、楽曲読出処理112により出力された演奏位置における楽曲データの中からユーザが選択した演奏パートの楽譜データを選択し、その楽譜データが示す楽譜を表示部108に表示させる処理である。
確率密度関数発生処理115aは、収音部104から出力される演奏音データを一定時間長のフレームに分割し、フレーム単位で演奏音データが示す演奏音の基本周波数の確率密度関数を発生する処理である。さらに詳述すると、確率密度関数発生処理115aでは、楽器が発生する音の高調波構造を模した音モデルを用い、演奏音の周波数成分が各種の基本周波数に対応した音モデルを重み付け加算した混合分布となるように各音モデルに対する重み値を逐次更新して最適化し、最適化した各種の基本周波数に対応した各音モデルの重み値を第1の確率密度関数として出力する。
確率密度関数発生処理115bは、楽曲記憶部105から読み出される楽曲データ中の波形データを上記フレームと同じ時間長のフレームに分割し、フレーム単位で確率密度関数発生処理115aと同じ演算方法により波形データが示す模範演奏音の基本周波数に関する第2の確率密度関数を発生して出力する処理である。
類似度評価処理116は、確率密度関数発生処理115aおよび115bにより発生された第1および第2の確率密度関数の類似度をフレーム単位で評価する処理である。判定処理117は、類似度評価処理116により評価された類似度に基づき、ユーザの演奏が模範演奏にどの程度近いかについての判定を行う処理である。この判定処理117の判定結果は、判定結果表示処理118に引き渡される他、上述した楽曲読出処理112に引き渡される。楽曲読出処理112では、上述した第1の態様が操作部102の操作により選択されている場合、判定処理117により得られたユーザの演奏の巧拙のレベルがある合格基準を越えている場合に限り、演奏位置を次の演奏音の位置に進める制御が行われる。判定結果表示処理118は、判定処理117の判定結果、すなわち、ユーザの演奏が模範演奏にどの程度近いかを表示部108に表示させる処理である。
<確率密度関数発生処理>
本実施形態では、確率密度関数発生処理115aおよび115bのアルゴリズムとして、基本的には特許文献2に開示されたものを採用している。以下、その内容について説明する。
<<1.瞬時周波数の算出>>
確率密度関数発生処理115aおよび115bでは、まず、入力音響信号(演奏音データまたは楽曲データ中の波形データ)を複数のBPFからなるフィルタバンクに与え、フィルタバンクの各BPFの出力信号について、位相の時間微分である瞬時周波数(Flanagan, J.L. and Golden, R.M.: Phase Vocoder, The BellSystem
Technical J., Vol.45, pp.1493-1509 (1966)参照)を計算する。ここでは、上記Flanaganの手法を用い、短時間フーリエ変換(STFT)の出力をフィルタバンク出力と解釈して、効率良く瞬時周波数を計算する。入力音響信号x(t)に対する窓関数h(t)を用いたSTFTが式(1)により与えられるとき、瞬時周波数λ(ω,t)は式(2)により求めることができる。
Figure 0005088030

Figure 0005088030
ここで、h(t)は時間周波数の局所化を与える窓関数である(例えば、最適な時間周波数の局所化を与えるガウス関数に2階のカーディナルB−スプライン関数を畳み込んで作成した時間窓など)。
この瞬時周波数を計算するのに、ウェーブレット変換を用いても良い。ここでは、計算量を減らすためにSTFTを用いるが、単一のSTFTのみを用いたのでは、ある周波数帯域における時間分解能や周波数分解能が悪くなってしまう。そこで、マルチレートフィルタバンク(Vetterli, M.: A Theory of Multirate Filter Banks, IEEE Trans. on
ASSP, Vol.ASSP-35, No.3, pp. 356-372 (1987)、参照)を構成し、リアルタイムに実行可能という制約のもとで、ある程度妥当な時間周波数分解能を得る。
<<2.周波数成分の候補の抽出>>
次に、フィルタの中心周波数からその瞬時周波数への写像に基づいて、周波数成分の候補を抽出する(Charpentier, F.J.: Pitch detection using the short-termphase
spectrum, Proc. of ICASSP 86, pp.113-116 (1986)参照)。あるSTFTフィルタの中心周波数ωからその出力の瞬時周波数λ(ω,t)への写像を考える。すると、もし周波数ψの周波数成分があるときには、ψがこの写像の不動点に位置し、その周辺の瞬時周波数の値はほぼ一定となる。つまり、全周波数成分の瞬時周波数Ψf (t)は、次式によって抽出することができる。
Figure 0005088030

これらの周波数成分のパワーは、Ψf (t)の各周波数におけるSTFTパワースペクトルの値として得られるため、周波数成分のパワー分布関数Ψp (t)(ω)を次のように定義することができる。
Figure 0005088030
<<3.周波数帯域の制限>>
この処理では、抽出した周波数成分に重み付けすることで、周波数帯域を制限する。ここでは、メロディパートとベースパート用に、2種類のBPFを用意する。メロディパート用BPFは、典型的なメロディパートの主要な基本波成分および高調波成分の多くを通過させることができ、かつ、基本周波数付近の重複が頻繁に起きる周波数帯域をある程度遮断する。一方、ベースパート用BPFは、典型的なベースラインの主要な基本周波数成分および高調波成分の多くを通過させることができ、かつ、他の演奏パートがベースパートよりも優勢になるような周波数帯域をある程度遮断する。
本実施形態では、以下、対数スケールの周波数をcentの単位(本来は音高差(音程)を表す尺度)で表し、Hzで表された周波数fHzを、次のようにcentで表された周波数fcentに変換する。
Figure 0005088030

Figure 0005088030

平均律の半音は100centに、1オクターブは1200centに相当する。
周波数x centでのBPFの周波数応答をBPF(x)とし、周波数成分のパワー分布関数をΨ’ (t)(x)とすると、BPFを通過した周波数成分はBPF(x)Ψ’ (t)(x)と表すことができる。ただし、Ψ’ (t)(x)は、周波数軸がcentで表されていることを除けばΨ (t)(ω)と同じ関数である。ここで、次の段階の準備として、BPFを通過した周波数成分の確率密度関数pΨ (t)(x)を定義する。
Figure 0005088030
ここで、Pow(t)は次式に示すようにBPFを通過した周波数成分のパワーの合計である。
Figure 0005088030
<<4.基本周波数の確率密度関数の推定>>
この処理では、BPFを通過した周波数成分の候補に対し、各高調波構造が相対的にどれくらい優勢かを表す基本周波数の確率密度関数を求める。そのために、本実施形態では、周波数成分の確率密度関数pΨ (t)(x)が、高調波構造を持つ音をモデル化した確率分布(音モデル)の混合分布モデル(重み付き和のモデル)から生成されたと考える。基本周波数がFの音モデルの確率密度関数をp(x|F)とすると、その混合分布モデルp(x;θ(t))は、次式により定義することができる。
Figure 0005088030

Figure 0005088030
ここで、FhとFlは、許容される基本周波数の上限と下限であり、BPFの通過帯域により決定される。また、w(t)(F)は、次式を満たすような、音モデルp(x|F)の重みである。
Figure 0005088030
CD等による実世界の音響信号に対して事前に音源数を仮定することは不可能なため、このように、あらゆる基本周波数の可能性を同時に考慮してモデル化することが重要となる。もし、観測した周波数成分pΨ (t)(x)がモデルp(x;θ(t))から生成されたかのようにモデルパラメータθ(t)を推定できれば、pΨ (t)(x)は個々の音モデルへと分解されたとみなすことができ、次式に示すように、各基本周波数Fの音モデルに対する重みw(t)(F)を、基本周波数Fの確率密度関数pFO (t)(F)と解釈することができる。
Figure 0005088030
つまり、混合分布中において、ある音モデルp(x|F)が優勢になればなるほど(すなわち、w(t)(F)が大きくなるほど)、pFO (t)(F)において、そのモデルの基本周波数Fの確率が高くなる。
以上から、確率密度関数pΨ (t)(x)を観測したときに、そのモデルp(x;θ(t))のパラメータθ(t)を推定する問題を解けばよいことがわかる。θ(t)の最尤推定量は、次式で定義される平均対数尤度を最大化することで得られる。
Figure 0005088030
この最大化問題は解析的に解くことが困難なため、EM(Expectation−Maximization)アルゴリズムを用いてθ(t)を推定する。EMアルゴリズムは、Eステップ(expectation step)とMステップ(maximization step)を交互に繰返し適用することで、不完全な観測データ(この場合、pΨ (t)(x))から最尤推定をおこなうための反復アルゴリズムである。本実施形態では、EMアルゴリズムを繰り返すことにより、BPFを通過した周波数成分の確率密度関数pΨ (t)(x)を、各種の基本周波数Fに対応した複数の音モデルp(x|F)を重み付け加算した混合分布と考える場合において、最も尤もらしい重みのパラメータθ(t)(={w(t)(F)|Fl≦F≦Fh}を求める。ここで、EMアルゴリズムの各繰り返しでは、パラメータθ(t)(={w(t)(F)|Fl≦F≦Fh})に関して、古いパラメータ推定値θold (t)(={wold (t)(F)|Fl≦F≦Fh})を更新して新しい(より尤もらしい)パラメータ推定値θnew (t)(={wnew (t)(F)|Fl≦F≦Fh})を求めていく。θold (t)の初期値には、1つ前の時刻t−1における最終的な推定値を用いる。この古いパラメータ推定値θold (t)から新しいパラメータ推定値θnew (t)を求める漸化式は、次のようになる。なお、この漸化式の導出過程は特許文献2に詳細に説明されているので、そちらを参照されたい。
Figure 0005088030
確率密度関数発生処理115aおよび115bでは、以上のような漸化式の繰り返しによりパラメータθ(t)(={w(t)(F)|Fl≦F≦Fh}が収束したとき、そのときのパラメータθ(t)(={w(t)(F)|Fl≦F≦Fh}を入力音(演奏音データまたは楽曲データ中の波形データが示す演奏音)の基本周波数の確率密度関数として出力する。以上が本実施形態における確率密度関数発生処理115aおよび115bの詳細である。
<類似度評価処理>
類似度評価処理116では、このようにして確率密度関数発生処理115aおよび115bにより得られる第1および第2の確率密度関数間の類似度をフレーム単位で評価する。類似度評価の方法に関しては、各種の態様があるが、説明の重複を避けるため、本実施形態の動作説明において、その詳細を明らかにする。
<本実施形態の動作>
次に本実施形態の動作を説明する。本実施形態において楽曲読出処理112では、楽曲上において演奏位置を常時監視し、その演奏位置に対応した楽曲データを楽曲記憶部105から読み出し、楽曲再生処理113および楽曲表示処理114に引き渡す。また、楽曲読出処理112では、演奏位置に対応した楽曲データ中のユーザの演奏パートの波形データを確率密度関数発生処理115bに引き渡す。
楽曲再生処理113では、楽曲読出処理112から引き渡された楽曲データのうちユーザの演奏パート以外のパートの波形データをサウンドシステム107に送り、その再生を行わせる。また、楽曲表示処理114では、楽曲読出処理112から引き渡された楽曲データのうち、ユーザの演奏パートの楽譜データが示す楽譜の画像を表示部108に表示させる。
ユーザが楽器演奏を行って、その演奏音が収音部104により収音されると、その演奏音を示す演奏音データが確率密度関数発生処理115aに引き渡される。確率密度関数発生処理115aでは、演奏音データを一定時間長のフレームに分割し、フレーム毎に演奏音データが示す演奏音の基本周波数の確率密度関数を発生する。さらに詳述すると、確率密度関数発生処理115aは、楽器が発生する音の高調波構造を模した音モデルを用い、フレーム毎に、演奏音データが示す演奏音の周波数成分が各種の基本周波数に対応した音モデルを重み付け加算した混合分布となるように各音モデルに対する重み値を最適化し、最適化された各音モデルに対する重み値を、演奏音の基本周波数に関する第1の確率密度関数として出力する。
一方、確率密度関数発生処理115bでは、楽曲読出処理112から引き渡された波形データを上記フレームと同じ時間長のフレームに分割し、フレーム毎に、波形データが示す模範演奏音の基本周波数に関する第2の確率密度関数を発生する。この確率密度関数を発生するためのアルゴリズムは、上記確率密度関数発生処理115aが確率密度関数を発生させるアルゴリズムと同じものである。
そして、類似度評価処理116では、このようにして確率密度関数発生処理115aおよび115bにより発生された第1および第2の確率密度関数間の類似度がフレーム単位で評価される。この類似度の評価に関しては各種の態様が考えられる。
図2は、類似度評価の第1の態様を示すものである。この第1の態様では、評価位置を演奏位置に追従させて変化させつつ、図示のように、評価位置のフレームに属する演奏音の基本周波数に関する第1の確率密度関数と評価位置のフレームに属する模範演奏音の基本周波数に関する第2の確率密度との類似度を算出し、この類似度を評価位置における演奏音と模範演奏音の基本周波数の類似度とするものである。この第1の態様は、演奏音と模範演奏音の基本周波数の類似度をフレーム単位で詳細に評価し、評価結果をユーザに提供することができるという利点がある。また、この第1の態様は、処理が簡単であるという利点がある。
図3は、類似度評価の第2の態様を示すものである。この第2の態様では、評価位置のフレームを途中(例えば中央)に含む所定数フレーム分の演奏音の確率密度関数の各々と、評価位置に対応したフレームの模範演奏音の確率密度関数との各類似度を各々算出する。そして、最大の類似度を評価位置における演奏音および模範演奏音の類似度とするのである。
この第2の態様において、演奏が模範演奏を正確に再現するものであり、演奏の模範演奏に対する位相の遅れや進みもない場合、算出される所定フレーム数分の類似度のうち評価位置における演奏音の基本周波数の確率密度関数と評価位置における模範演奏音の基本周波数の確率密度関数との類似度が最大になる。しかし、模範演奏に対して演奏が早い場合、最大になるのは、評価位置よりも時間的に前のフレーム(古いフレーム)における演奏音の基本周波数の確率密度関数と評価位置のフレームにおける模範演奏音の基本周波数の確率密度関数との間の類似度である。一方、模範演奏に対して演奏が遅い場合、最大になるのは、評価位置よりも時間的に後のフレーム(新しいフレーム)における演奏音の基本周波数の確率密度関数と評価位置のフレームにおける模範演奏音の基本周波数の確率密度関数との間の類似度である。このように、演奏の模範演奏に対する進みや遅れの程度は、類似度が最大になるフレームと評価位置のフレームとの間の時間的隔たり(フレーム数)となって現れる。そこで、この第2の態様では、この類似度が最大になるフレームと評価位置のフレームとの間のフレーム数を演奏の模範演奏に対する進みや遅れの程度を表わす情報として出力する。この第2の態様は、演奏の模範演奏に対する微妙な位相ずれがあった場合に、それを緩和して妥当な類似度の評価を行うことができるという利点がある。また、この第2の態様による類似度評価の結果に関する情報をユーザに提供すれば、ユーザは、曲の各所において、どの方向にどの程度の位相ずれがあるかを知ることができ、演奏を上達させることができる。
類似度として何を用いるかについても各種の態様が考えられる。第1の態様では、演奏音の基本周波数の確率密度関数と模範演奏音の基本周波数の確率密度関数とを用いて、K−L情報量を算出し、このK−L情報量を類似度として用いることができる。
第2の態様は、2つの確率密度関数に現れるピークを比較し、ピークの接近の程度が高い程、両確率密度関数の類似度を高くするものである。図4は、この第2の態様による類似度評価を示すものである。まず、演奏音の基本周波数の確率密度関数および模範演奏音の基本周波数の確率密度関数の各々において、確率密度関数の最大値に対して1より小さい正の値である係数thres_coefを乗算し、閾値thを各々求める。次に、各確率密度関数において、閾値thを越えている部分を確率密度のピークとみなす。次に、演奏音における確率密度のピークのうち模範演奏音における確率密度のピークとの周波数差が許容範囲内であるものの数N1を求める。そして、数N1を演奏音における確率密度のピークの数N2により割り算した結果N1/N2を演奏音の基本周波数の確率密度関数および模範演奏音の基本周波数の確率密度関数の類似度とするのである。あるいは次の方法により類似度を算出してもよい。まず、演奏音における確率密度のピークのうち模範演奏音における確率密度のピークとの周波数差が許容範囲内であるもののピークの高さの合計値H1を求める。次に、演奏音における確率密度のピークの高さの合計値H2を求める。そして、H1/H2を演奏音の基本周波数の確率密度関数および模範演奏音の基本周波数の確率密度関数の類似度とするのである。
判定処理117では、この類似度評価処理116の処理結果に基づき、演奏音の音高が模範演奏音の音高にどの程度近いかに関する判定を行う。判定結果表示処理118では、判定処理117の判定結果を表示部108に表示させる。
本実施形態では、演奏位置を進めつつ、以上の処理が繰り返される。
以上説明したように、本実施形態では、対比される演奏音および模範演奏音の各々についてフレーム毎に基本周波数の確率密度関数を各々求め、両確率密度関数間の類似度を評価するようにしたので、演奏音と模範演奏音の基本周波数の類似度を精度良く評価することができる。また、本実施形態では、演奏音と模範演奏音とで基本周波数の確率密度関数同士の類似度を評価するので、特許文献1に開示の技術と異なり、複数音を同時に発音するような演奏が行われる状況でも、適切に演奏の類似度の評価を行うことができる。
<他の実施形態>
以上、この発明の一実施形態について説明したが、この発明には他にも実施形態があり得る。例えば次の通りである。
(1)演奏音の基本周波数の確率密度関数と模範演奏音の基本周波数の確率密度関数の類似度として次のものを採用してもよい。
(1−1)2つの確率密度関数の平均2乗誤差RMS、すなわち、図5に示すように、演奏音の基本周波数の確率密度関数における確率密度と模範演奏音の基本周波数の確率密度関数における確率密度との差分を2乗したものを全周波数帯域に亙って積分し、所定の定数Cにより除算したものの平方根の逆数を類似度とする。なお、この平方根の逆数の代わりに、所定の最大値からこの平方根を減算したものを類似度としてもよい。
(1−2)図6に示すように、周波数帯域を模範演奏音の基本周波数の確率密度が高い有ピッチ領域と模範演奏音の基本周波数の確率密度がほぼ0である無ピッチ領域とに分け、確率密度関数発生処理115aにより得られた演奏音の基本周波数の確率密度関数において、有ピッチ領域に属する部分の確率密度の総和と、無ピッチ領域に属する部分の確率密度の総和とを求め、前者から後者を差し引いたものを類似度としてもよい。
(1−3)その他、演奏音の基本周波数の確率密度関数と模範演奏音の基本周波数の確率密度関数から何らかの特徴量を抽出し、特徴量同士の積・べき乗・各種の数学関数などを用いた量を類似度とし、演奏音の基本周波数の確率密度関数と目標基本周波数の確率密度関数との差別化を容易にするようにしてもよい。
(1−4)上記のうちの例えば2種類の方法により2種類の類似度(第1および第2の類似度とする)を求め、第1および第2の類似度を線形結合した第3の類似度を演奏音が正しい音高であるか否かの判断のための類似度として採用してもよい。
(2)模範演奏音については、予めフレーム毎に確率密度関数発生処理115aと同様なアルゴリズムにより基本周波数の確率密度関数を求めて、例えば楽曲記憶部105に記憶させておき、確率密度関数発生処理115aがフレーム毎に演奏音の基本周波数の確率密度関数を出力するのに同期して、模範演奏音の基本周波数の確率密度関数を楽曲記憶部105から読み出して類似度評価処理116に供給するようにしてもよい。この態様は、フレーム毎に確率密度関数発生処理115bを実行する必要がないため、フレーム当たりの演算量を減らすことができるという利点がある。
(3)上記実施形態および上記(2)の態様において、模範演奏音と演奏音とでフレームの長さは異なってもよい。例えば上記(2)の態様において、教習伴奏システムの処理能力が低い等の理由により、演奏音を模範演奏音と同じ長さのフレームに分割して処理することができない場合もある。そのような場合、演奏音については、例えば模範演奏音のm倍の長さのフレームに分割し、1フレーム分の演奏音の基本周波数の確率密度関数と、同一時間帯を占めるmフレーム分の模範演奏音の基本周波数の確率密度関数の中の例えば代表的なものとの類似度を評価するようにしてもよい。
(4)上記実施形態では、メロディパートとベースパートを分離して取り扱ったが、必ずしも分離する必要はない。すなわち、メロディパートとベースパートとが混在した演奏音と模範演奏音の各々について基本周波数の確率密度関数を各々求め、この確率密度関数間の類似度を評価すればよい。
この発明による演奏音の類似度評価装置の一実施形態である教習伴奏システムの構成を示すブロック図である。 同実施形態における類似度評価処理116の第1の態様を示す図である。 同実施形態における類似度評価処理116の第2の態様を示す図である。 同実施形態における類似度算出方法の第2の態様を示す図である。 類似度算出方法の他の態様を示す図である。 類似度算出方法の他の態様を示す図である。
符号の説明
101……制御部、102……操作部、103……HDD、104……収音部、105……楽曲記憶部、106……データ入力部、111……楽曲入力処理、112……楽曲読出処理、113……楽曲再生処理、114……楽曲表示処理、115a,115b……確率密度関数発生処理、116……類似度評価処理、117……判定処理、118……判定結果表示処理。

Claims (6)

  1. 対比される第1および第2の演奏音の各々を一定時間長のフレームに分割し、フレーム単位で各演奏音の基本周波数の確率密度関数を発生する過程であって、楽器が発生する音の高調波構造を模した音モデルを用い、演奏音の周波数成分が各種の基本周波数に対応した音モデルを重み付け加算した混合分布となるように各音モデルに対する重み値を逐次更新して最適化し、最適化した各種の基本周波数に対応した各音モデルの重み値を演奏音の基本周波数の確率密度関数として発生する確率密度関数発生過程と、
    フレーム単位で、前記第1の演奏音の基本周波数の確率密度関数と前記第2の演奏音の基本周波数の確率密度関数との類似度を評価する類似度評価過程と
    を具備することを特徴とする演奏音の類似度評価方法。
  2. 演奏音を収音し、演奏音データを出力する収音手段と、
    模範演奏音を示す楽曲データを記憶する記憶手段と、
    前記記憶手段から楽曲データを読み出す読出手段と、
    前記収音手段から出力される演奏音データを一定時間長のフレームに分割し、フレーム単位で演奏音データが示す演奏音の基本周波数の確率密度関数を発生する手段であって、楽器が発生する音の高調波構造を模した音モデルを用い、演奏音の周波数成分が各種の基本周波数に対応した音モデルを重み付け加算した混合分布となるように各音モデルに対する重み値を逐次更新して最適化し、最適化した各種の基本周波数に対応した各音モデルの重み値を演奏音の基本周波数の確率密度関数として出力する第1の確率密度関数発生手段と、
    前記記憶手段から読み出される楽曲データを一定時間長のフレームに分割し、フレーム単位で前記第1の確率密度関数発生手段と同じ演算方法により前記楽曲データが示す模範演奏音の基本周波数の確率密度関数を発生して出力する第2の確率密度関数発生手段と、
    フレーム単位で前記演奏音の基本周波数の確率密度関数と前記模範演奏音の基本周波数の確率密度関数の類似度を評価する類似度評価手段と
    を具備することを特徴とする演奏音の類似度評価装置。
  3. 演奏音を収音し、演奏音データを出力する収音手段と、
    前記収音手段から出力される演奏音データの各々を一定時間長のフレームに分割し、フレーム単位で演奏音データが示す演奏音の基本周波数の確率密度関数を発生する手段であって、楽器が発生する音の高調波構造を模した音モデルを用い、演奏音の周波数成分が各種の基本周波数に対応した音モデルを重み付け加算した混合分布となるように各音モデルに対する重み値を逐次更新して最適化し、最適化した各種の基本周波数に対応した各音モデルの重み値を演奏音の基本周波数の確率密度関数として出力する確率密度関数発生手段と、
    模範演奏音を示す楽曲データを一定時間長のフレームに分割し、フレーム単位で、前記確率密度関数発生手段と同じ演算方法により前記楽曲データから発生させた模範演奏音の基本周波数の確率密度関数を記憶する記憶手段と、
    前記確率密度関数発生手段がフレーム単位で前記演奏音の基本周波数の確率密度関数を出力するのと並行し、前記記憶手段からフレーム単位で前記模範演奏音の基本周波数の確率密度関数を読み出す読出手段と、
    フレーム単位で前記演奏音の基本周波数の確率密度関数と前記模範演奏音の基本周波数の確率密度関数の類似度を評価する類似度評価手段と
    を具備することを特徴とする演奏音の類似度評価装置。
  4. 前記類似度評価手段は、前記模範演奏音の基本周波数の確率密度関数が得られたフレームを途中に含む所定数のフレームの各々において得られた前記演奏音の基本周波数の各確率密度関数と前記模範演奏音の基本周波数の確率密度関数との各類似度を各々算出し、最大の類似度を演奏音および模範演奏音の類似度として出力することを特徴とする請求項2または3に記載の演奏音の類似度評価装置。
  5. 前記類似度評価手段は、前記模範演奏音の基本周波数の確率密度関数が得られたフレームを途中に含む所定数のフレームの各々において得られた前記演奏音の基本周波数の各確率密度関数と前記模範演奏音の基本周波数の確率密度関数との各類似度を各々算出し、最大の類似度が得られたフレームと前記模範演奏音の基本周波数の確率密度関数が得られたフレームとの時間差を出力することを特徴とする請求項2〜4のいずれか1の請求項に記載の演奏音の類似度評価装置。
  6. コンピュータに、
    対比される第1および第2の演奏音の各々を一定時間長のフレームに分割し、フレーム単位で各演奏音の基本周波数の確率密度関数を発生する過程であって、楽器が発生する音の高調波構造を模した音モデルを用い、演奏音の周波数成分が各種の基本周波数に対応した音モデルを重み付け加算した混合分布となるように各音モデルに対する重み値を逐次更新して最適化し、最適化した各種の基本周波数に対応した各音モデルの重み値を演奏音の基本周波数の確率密度関数として発生する確率密度関数発生過程と、
    フレーム単位で、前記第1の演奏音の基本周波数の確率密度関数と前記第2の演奏音の基本周波数の確率密度関数との類似度を評価する類似度算出過程と
    を実行させることを特徴とするコンピュータプログラム。
JP2007194485A 2007-07-26 2007-07-26 演奏音の類似度を評価する方法、装置およびプログラム Expired - Fee Related JP5088030B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007194485A JP5088030B2 (ja) 2007-07-26 2007-07-26 演奏音の類似度を評価する方法、装置およびプログラム
EP08160389.6A EP2019384B1 (en) 2007-07-26 2008-07-15 Method, apparatus, and program for assessing similarity of performance sound
US12/177,398 US7659472B2 (en) 2007-07-26 2008-07-22 Method, apparatus, and program for assessing similarity of performance sound

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007194485A JP5088030B2 (ja) 2007-07-26 2007-07-26 演奏音の類似度を評価する方法、装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2009031486A JP2009031486A (ja) 2009-02-12
JP5088030B2 true JP5088030B2 (ja) 2012-12-05

Family

ID=39735540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007194485A Expired - Fee Related JP5088030B2 (ja) 2007-07-26 2007-07-26 演奏音の類似度を評価する方法、装置およびプログラム

Country Status (3)

Country Link
US (1) US7659472B2 (ja)
EP (1) EP2019384B1 (ja)
JP (1) JP5088030B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5088030B2 (ja) * 2007-07-26 2012-12-05 ヤマハ株式会社 演奏音の類似度を評価する方法、装置およびプログラム
EP2246729A1 (en) 2009-04-30 2010-11-03 Essilor International (Compagnie Générale D'Optique) A method for assessing an optical feature of an ophthalmic lens design
US8017854B2 (en) * 2009-05-29 2011-09-13 Harmonix Music Systems, Inc. Dynamic musical part determination
US8629342B2 (en) * 2009-07-02 2014-01-14 The Way Of H, Inc. Music instruction system
WO2011125204A1 (ja) * 2010-04-08 2011-10-13 パイオニア株式会社 情報処理装置及び方法、並びにコンピュータプログラム
US8942540B2 (en) * 2011-01-05 2015-01-27 Panasonic Intellectual Property Corporation Of America Interesting section extracting device, interesting section extracting method
JP5834727B2 (ja) * 2011-09-30 2015-12-24 カシオ計算機株式会社 演奏評価装置、プログラム及び演奏評価方法
JP5799977B2 (ja) * 2012-07-18 2015-10-28 ヤマハ株式会社 音符列解析装置
JP6123995B2 (ja) * 2013-03-14 2017-05-10 ヤマハ株式会社 音響信号分析装置及び音響信号分析プログラム
JP6179140B2 (ja) 2013-03-14 2017-08-16 ヤマハ株式会社 音響信号分析装置及び音響信号分析プログラム
JP6281211B2 (ja) * 2013-08-28 2018-02-21 ヤマハ株式会社 音響信号のアライメント装置、アライメント方法及びコンピュータプログラム
JP6729052B2 (ja) * 2016-06-23 2020-07-22 ヤマハ株式会社 演奏指示装置、演奏指示プログラム、および演奏指示方法
JP6724828B2 (ja) * 2017-03-15 2020-07-15 カシオ計算機株式会社 フィルタ演算処理装置、フィルタ演算方法、及び効果付与装置
JP6489261B2 (ja) * 2018-04-10 2019-03-27 ヤマハ株式会社 音響解析方法および音響解析装置
CN112035776A (zh) * 2020-08-21 2020-12-04 陈根方 一种面向毕达哥拉斯律的反对称律列产生方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5832431A (en) * 1990-09-26 1998-11-03 Severson; Frederick E. Non-looped continuous sound by random sequencing of digital sound records
US5267318A (en) * 1990-09-26 1993-11-30 Severson Frederick E Model railroad cattle car sound effects
JP2924555B2 (ja) * 1992-10-02 1999-07-26 三菱電機株式会社 音声認識の境界推定方法及び音声認識装置
JP3114468B2 (ja) * 1993-11-25 2000-12-04 松下電器産業株式会社 音声認識方法
JP3487950B2 (ja) * 1995-04-13 2004-01-19 パイオニア株式会社 音程評価装置及びカラオケ採点装置
JP3948747B2 (ja) * 1995-08-28 2007-07-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ツリー構成確率密度に基づくパターン認識の方法及びシステム
US5913259A (en) * 1997-09-23 1999-06-15 Carnegie Mellon University System and method for stochastic score following
US6111183A (en) * 1999-09-07 2000-08-29 Lindemann; Eric Audio signal synthesis system based on probabilistic estimation of time-varying spectra
JP3413634B2 (ja) * 1999-10-27 2003-06-03 独立行政法人産業技術総合研究所 音高推定方法及び装置
JP4232299B2 (ja) * 1999-11-08 2009-03-04 ヤマハ株式会社 演奏カロリー消費量測定装置
US20020002899A1 (en) * 2000-03-22 2002-01-10 Gjerdingen Robert O. System for content based music searching
US6954745B2 (en) * 2000-06-02 2005-10-11 Canon Kabushiki Kaisha Signal processing system
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
JP2003256552A (ja) * 2002-03-05 2003-09-12 Yamaha Corp 演奏者情報提供方法、サーバ、プログラムおよび記録媒体
WO2004075093A2 (en) * 2003-02-14 2004-09-02 University Of Rochester Music feature extraction using wavelet coefficient histograms
ITMC20030032A1 (it) * 2003-03-28 2004-09-29 Viscount Internat Spa Metodo e dispositivo elettronico per riprodurre il suono delle canne ad anima dell'organo liturgico, sfruttando la tecnica della modellazione fisica degli strumenti acustici
JP4070120B2 (ja) * 2003-05-13 2008-04-02 株式会社河合楽器製作所 自然楽器の楽音判定装置
JP3823945B2 (ja) * 2003-06-02 2006-09-20 ヤマハ株式会社 音声入力機能付き演奏ガイド装置および演奏ガイド方法
TWI241557B (en) * 2003-07-21 2005-10-11 Ali Corp Method for estimating a pitch estimation of the speech signals
US7245767B2 (en) * 2003-08-21 2007-07-17 Hewlett-Packard Development Company, L.P. Method and apparatus for object identification, classification or verification
GB0320973D0 (en) * 2003-09-08 2003-10-08 Isis Innovation Improvements in or relating to similarity measures
WO2005066927A1 (ja) * 2004-01-09 2005-07-21 Toudai Tlo, Ltd. 多重音信号解析方法
JP4530199B2 (ja) * 2004-02-24 2010-08-25 株式会社河合楽器製作所 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム
JP2005234304A (ja) * 2004-02-20 2005-09-02 Kawai Musical Instr Mfg Co Ltd 演奏音判定装置および演奏音判定プログラム
FR2868586A1 (fr) * 2004-03-31 2005-10-07 France Telecom Procede et systeme ameliores de conversion d'un signal vocal
JP4353018B2 (ja) * 2004-07-16 2009-10-28 ヤマハ株式会社 楽器演奏教習装置及びそのプログラム
KR100590561B1 (ko) * 2004-10-12 2006-06-19 삼성전자주식회사 신호의 피치를 평가하는 방법 및 장치
JP4660739B2 (ja) * 2006-09-01 2011-03-30 独立行政法人産業技術総合研究所 音分析装置およびプログラム
JP4630980B2 (ja) * 2006-09-04 2011-02-09 独立行政法人産業技術総合研究所 音高推定装置、音高推定方法およびプログラム
JP4322283B2 (ja) * 2007-02-26 2009-08-26 独立行政法人産業技術総合研究所 演奏判定装置およびプログラム
JP5088030B2 (ja) * 2007-07-26 2012-12-05 ヤマハ株式会社 演奏音の類似度を評価する方法、装置およびプログラム

Also Published As

Publication number Publication date
US7659472B2 (en) 2010-02-09
EP2019384B1 (en) 2015-11-11
EP2019384A3 (en) 2015-03-18
EP2019384A2 (en) 2009-01-28
US20090025538A1 (en) 2009-01-29
JP2009031486A (ja) 2009-02-12

Similar Documents

Publication Publication Date Title
JP5088030B2 (ja) 演奏音の類似度を評価する方法、装置およびプログラム
JP4322283B2 (ja) 演奏判定装置およびプログラム
JP4660739B2 (ja) 音分析装置およびプログラム
Klapuri Automatic music transcription as we know it today
Benetos et al. A shift-invariant latent variable model for automatic music transcription
Kim et al. Neural music synthesis for flexible timbre control
US20170243571A1 (en) Context-dependent piano music transcription with convolutional sparse coding
Benetos et al. Automatic transcription of pitched and unpitched sounds from polyphonic music
JP2012506061A (ja) デジタル音楽音響信号の分析方法
JP2005202354A (ja) 信号解析方法
JP4625933B2 (ja) 音分析装置およびプログラム
Huang et al. Spectral features and pitch histogram for automatic singing quality evaluation with crnn
Ventura et al. Accurate analysis and visual feedback of vibrato in singing
JP2009204808A (ja) 音響特徴抽出方法及び、その装置、そのプログラム、そのプログラムを記録した記録媒体
JP2012027196A (ja) 信号分析装置、方法、及びプログラム
Hjerrild et al. Physical models for fast estimation of guitar string, fret and plucking position
Hu et al. Instrument identification and pitch estimation in multi-timbre polyphonic musical signals based on probabilistic mixture model decomposition
JP4625934B2 (ja) 音分析装置およびプログラム
JP2007240552A (ja) 楽器音認識方法、楽器アノテーション方法、及び楽曲検索方法
JP4625935B2 (ja) 音分析装置およびプログラム
Lionello et al. A machine learning approach to violin vibrato modelling in audio performances and a didactic application for mobile devices
Szeto et al. Source separation and analysis of piano music signals using instrument-specific sinusoidal model
JP7176114B2 (ja) 楽曲解析装置、プログラムおよび楽曲解析方法
Lu Automatic music transcription using genetic algorithms and electronic synthesis
Lin Singing voice analysis in popular music using machine learning approaches

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120501

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120814

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120827

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5088030

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees