JPWO2008001779A1 - 基本周波数推定法および音響信号推定システム - Google Patents

基本周波数推定法および音響信号推定システム Download PDF

Info

Publication number
JPWO2008001779A1
JPWO2008001779A1 JP2008522593A JP2008522593A JPWO2008001779A1 JP WO2008001779 A1 JPWO2008001779 A1 JP WO2008001779A1 JP 2008522593 A JP2008522593 A JP 2008522593A JP 2008522593 A JP2008522593 A JP 2008522593A JP WO2008001779 A1 JPWO2008001779 A1 JP WO2008001779A1
Authority
JP
Japan
Prior art keywords
signal
fundamental frequency
autocorrelation function
frequency
comb filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008522593A
Other languages
English (en)
Inventor
嘉昭 田所
嘉昭 田所
雅典 夏井
雅典 夏井
正宏 伊藤
正宏 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyohashi University of Technology NUC
Original Assignee
Toyohashi University of Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyohashi University of Technology NUC filed Critical Toyohashi University of Technology NUC
Publication of JPWO2008001779A1 publication Critical patent/JPWO2008001779A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本開示の基本周波数推定法では、不可分な基本周波数成分からなる合成信号を対象とし、従来、誤差として取り扱われてきたくし形フィルタの微小な出力から信号周期を測定できることに着目し、調波成分の各基本周波数を推定することができる。まず、合成信号の最低基本周波数に対応するくし形フィルタを利用して対象合成信号を処理し、その出力の自己相関関数から信号の周期を測定することで合成信号の各基本周波数を求める。さらに、時間分解能を確保するために、くし形フィルタと自己相関関数を利用することで短時間サンプルに対しても適用でき、サンプル数の不足がない、高精度の周波数分解能で処理が可能である。

Description

本発明は、基本周波数とその倍数周波数から構成されている信号において、ある信号の基本周波数成分が他の信号の周波数成分と重なる場合の、各信号の基本周波数を推定する方法と、最小出力値と自己相関関数から最低基本周波数を求めることができる基本周波数推定法、およびそれに基づいた音響信号推定システムに関するものである。
図1に、ある楽音の振幅スペクトルを示す。一般に、楽音は基本周波数成分(fp)とその倍音成分(kfp,k=2,3,・・・)からなっている。この基本周波数を推定することで、音の高さ(以下、音高)を推定することができ、おもに楽音から楽譜を作成する採譜システムの基本技術として利用できる。
しかし、楽音の和音を対象とした場合、音高推定が困難な和音が存在する。それは、図2に示すように和音のある信号成分の基本周波数が、他の信号成分の周波数に一致するような場合である。
従来の採譜システムに関する特許関係の技術では、上記のような音高推定が困難な和音には対応できていない(例えば、特許文献1乃至特許文献3を参照)。一方、本発明で対象にしている音高推定が困難な和音に関しては、次に示すような研究報告がなされている。遺伝的アルゴリズム(以下、GA)による方法(例えば、非特許文献1を参照)、振幅スペクトルの和が成立することを仮定した方法(例えば、非特許文献2を参照)、音楽規則等に従った推定法(例えば、非特許文献3を参照)等が提案されている。しかし、GAによる方法では前もって各楽器の時間波形を記憶しておく必要があり、技術の使用範囲が限定される。また、振幅スペクトルの和を仮定した方法は、各楽音の位相の関係から必ずしも成立しない場合がある。最後に、音楽規則等に従った推定法では、従来の音楽規則に従わない現代音楽など任意の楽音の処理には対応できないという問題点や課題がある。
以上から、本発明で対象としている合成信号の具体例である、音高推定が困難な和音に対する有効な音高推定法は従来存在していなかった。特に、この問題を含む従来の採譜システムは、和音を扱うことに関して必ずしも実用的であるとはいえなかった。さらに、従来技術では採譜システムでの利用に留まっており、楽音を含めた本発明の対象となる合成信号への利用、具体的には音声認識への利用を可能とする技術は存在していない。
特開2002−278544号公報 特開平5−100660号公報 特開平5−173557号公報 小野、斎藤、小沢、「自動採譜のためのGAを用いた混合音推定法」、計測自動制御学会論文集、Vol.33、No.5、pp.417−423、1997 植田、橋本、「音源分離のためのブラインドデコンポジションアルゴリズム」、情報処理学会論文集、Vol.38、No.1、pp.146−157、1997 柏野、木下、中臺、田中、「音楽情景分析の処理モデルOPTIMAにおける和音の分析」、信学論、Vol.J79−D−II、No.11、pp.1762−1770、1996
本開示は、基本周波数が推定困難な合成信号、例えば、基本周波数の等しい複数信号によって形成される合成信号や、基本周波数が一定の比率の関係にある複数信号によって形成される合成信号(以下、協和音)を対象として、各信号成分の基本周波数を推定し、分離される信号の品質を損なうことがないように、周波数成分の重複を精度良く分離する方法やシステムを提供することを目的とする。
なお、本開示の対象とする合成信号の具体例は、楽器が発生する音(以下、楽音)が同時に響くことによって生成される音(以下、和音)である。以下、本発明に関して楽音の和音について記述するが、楽音に限らず、基本周波数とその倍数周波数から構成されている音響信号に対する本発明の効果は変わらない。
本開示によれば、たとえ同じ楽器の種類でも製造が異なれば、楽音に関しては異なる信号源として楽器をみなせることから、発生された楽音の基本周波数を完全に一致させることは不可能であるということに着目している。つまり、音高推定が困難な和音の重なった周波数成分から、僅かな周波数差を出力として検出することで信号源や発生時刻の違いを判定して、協和音の音高推定を可能にしている。
さらに、本開示によれば、くし形フィルタと自己相関関数を利用することにより、瞬時的な音響信号の変化に対しても十分な時間分解能を実現できる。したがって、推定に用いるサンプル数が不足することがなく、周波数分解能の高い高精度の処理が可能となっている。
また、本開示によれば、周波数成分が重複しているかいないかの判断は、入力信号の離散フーリエ変換(以下、DFTと記す)より求まる各周波数成分の位相に着目し、その位相の時間変化から明確に両者を区別することも可能である。すなわち、一般の単音の楽音では基本周波数の位相とその倍音周波数の位相との位相差はほぼ一定になる。しかし、和音においては、周波数成分が重なっている成分では、その位相差が時間と共に変化する。これは重なった周波数成分間にわずかな周波数差があるために生ずる。これにより重なっている周波数成分を区別できる。この特性は、特に楽音が単音か和音かを区別するときに有効である。
楽音の振幅スペクトルを表す図である。 推定が困難な和音の周波数成分の重なりを示す模式図である。 くし形フィルタ Hp(z)=1−z−Npの振幅特性を表す図である。 音高推定のための並列構成くし形フィルタシステムの概念図である。(Hq,p(z)は、音名p、オクターブqのくし形フィルタを表す。) 音響信号推定システムのブロック図である。 音響信号推定システムの基本動作を示すフローチャートである。 対象楽音(clarinet C4)の時間波形図である。 対象楽音(clarinet C4+alt−sax C4)の時間波形図である。 対象楽音(clarinet C4+alt−sax C5)の時間波形図である。 対象楽音(clarinet C4+alt−sax G5)の時間波形図である。 図6の楽音のくし形フィルタシステム(Hp(z)=1−z−Np、Np=169)の出力波形図である。 図7の楽音のくし形フィルタシステム(Hp(z)=1−z−Np、Np=169)の出力波形図である。 図8の楽音のくし形フィルタシステム(Hp(z)=1−z−Np、Np=169)の出力波形図である。 図9の楽音のくし形フィルタシステム(Hp(z)=1−z−Np、Np=169)の出力波形図である。 図10のくし形フィルタシステム出力の自己相関関数値を示した図である。 図11のくし形フィルタシステム出力の自己相関関数値を示した図である。 図12のくし形フィルタシステム出力の自己相関関数値を示した図である。 図13のくし形フィルタシステム出力の自己相関関数値を示した図である。 (clarinet C4)の楽音を入力した場合のくし形フィルタシステム出力(Np=168)の自己相関関数値を示した図である。 (clarinet C4+alt−sax C4)の楽音を入力した場合のくし形フィルタシステム出力(Np=168)の自己相関関数値を示した図である。 DFTの位相情報を利用した音響信号推定システムのブロック図である。 DFTの位相情報を利用した音響信号推定システムの基本動作を示すフローチャートである。 対象楽音(Horn A3)の位相の時間変化を表す波形図である。 対象楽音(Horn A3+Horn A3)の位相の時間変化を表す波形図である。 対象楽音(Horn A3+Horn A4)の位相の時間変化を表す波形図である。 対象楽音(Horn A3+Horn E5)の位相の時間変化を表す波形図である。
以下、本開示の実施の形態である音響信号推定システムについて、図面を参照して説明する。図5に示すように、音響信号推定システムは、音響信号を入力する入力部1、図3の振幅特性を持つくし形フィルタを有するくし形フィルタシステム部2、自己相関関数を計算する自己相関関数処理部3、自己相関関数から和音の種類等の判別を行う音響信号判別部4、音響信号の推定結果を出力する出力部5からなる。
次に、くし形フィルタを利用した基本周波数推定法について説明する。基本周波数推定法は、図4に示す基本周波数推定システムによってなされる。この基本周波数推定システムは、図3に示す振幅特性を持つくし形フィルタを、12個並列に接続したものである(非特許文献4を参照)。そして、12個のくし形フィルタの遅延数Np(p=1,2,・・・,12)は、対象とする音域の最低オクターブの12音の基本周波数fpとサンプリング周波数fsにより、Np=[fs/fp]で決定される。ここで、記号“[ ]”は、小数点以下の四捨五入により整数化することを表している(以下、同様に表記する)。そして、このシステムに和音を入力し、その最小出力値を検出することで和音の基本周波数(音高)、音名を推定することができる。この検出されたくし形フィルタの遅延数を、1/2(n=1,2,・・・)と変化させ、その出力変化からその音名のオクターブが決定でき、和音の音高が推定されることを確認している。
さらに、この基本周波数推定法では、上記の手段から音高推定困難和音の最低音高、つまり基本周波数が推定されると、それに対応したくし形フィルタに対象和音を入力する。その出力は原理的に零となるはずだが、和音の重なった周波数成分に僅かな周波数差があることや、楽音が完全な定常信号でないため僅かな出力信号が生ずる。この出力信号の周期を測定するために、その出力信号の自己相関関数を求める。そして、その自己相関関数の周期より、和音がユニゾンであるか、オクターブの和音であるか、またはk倍音の和音であるかを判断できる。ここで、ユニゾンとは、和音に含まれる信号の基本周波数が等しいことを意味する。さらに、オクターブの和音とは、和音に含まれる信号の基本周波数比が1:(2)、(nは正の整数)の関係を有する和音を意味する。また、k倍音とは、和音に含まれる信号の基本周波数比が1:k、(kは2を除く正の整数)の関係を有する和音を意味する。
ここで、ユニゾンと判断された場合は、さらに、その楽音が単音か、和音か、を区別する必要がある。そのため、くし形フィルタの遅延数を変化させ、その出力の自己相関関数を求める。もし、自己相関波形があまり変化しなければ単音、変化が見られれば和音と判断する。なお、くし形フィルタの出力波形の自己相関関数を求めて周期を測定するとき、周期が明確でない場合は、同様にくし形フィルタの遅延数を変化させて、その出力の自己相関関数を求める。
次に、音響信号推定システムの基本動作について、図6のフローチャートを参照して説明する。まず、基本周波数の推定が困難な音響信号が、入力部1に入力される(S1)。そして、入力された音響信号が、くし形フィルタシステム部2に受け渡され、くし形フィルタによるフィルタリングが実行される(S2)。くし形フィルタ回路は、信号周波数成分に対して適切に設計される。例えば、楽音に対しては、対象とする音高の最低基本周波数に対応させる。そして、このくし形フィルタは、対象とする周波数成分を消去するとともに、周波数成分の基本周波数の僅かな差から生じる信号成分を出力する。次いで、自己相関関数処理部3では、くし形フィルタシステム部2の出力の自己相関関数(R1)が計算され、出力信号の周期が求められる(S3)。
そして、音響信号判別部4では、自己相関関数処理部3で求められた自己相関関数の周期から、音響信号の和音の種類が判別される(S4)。さらに、その自己相関関数の周期と、くし形フィルタの対象とする周期とが一致しているか否かが判断される(S5)。一致していると判断された場合(S5:YES)、その楽音が単音か和音かをさらに区別する必要がある。そこで、くし形フィルタの遅延数を変化させながら、フィルタリングが実行され(S6)、そのフィルタリングの出力の自己相関関数(R2)が求められる(S7)。そして、自己相関関数R1の波形と、自己相関関数R2の波形とがあまり変化しなければ単音と判別され、変化が見られれば和音と判別される(S8)。そして、その判別結果が、出力部5によりシステム出力として処理される(S9)。
一方、自己相関関数の周期と、くし形フィルタの対象とする周期とが一致していないと判断された場合(S5:NO)、その和音は、オクターブの和音であるか、またはk倍音の和音であるので、その判別結果を、出力部5によりシステム出力として処理する(S9)。なお、くし形フィルタの出力波形の自己相関関数を求めて周期を測定する際に、周期が明確でない場合は、同様にくし形フィルタの遅延数を変化させて、その出力の自己相関関数を求めればよい。
次に、本発明の実施例として、2和音からなる音高推定困難和音のユニゾン(clarinet C4+alt−sax C4)、オクターブ(clarinet C4+alt−sax C5)、3倍音(clarinet C4+alt−sax G5)を取り上げて説明する。これらに使用した楽音データは、実音をサンプリング周波数fs=44.1kHzでサンプリングして得られたRWC(Real World Computing partnership in Japan)ミュージックデータベース(「M. Goto,“Development of the RWC music database,”Proc. of ICA2004,pp.I−553−556,2004」を参照)から得たものである。
図7から図10は、対象とした4つの楽音の時間波形をそれぞれ示す。4つの図ではともに、横軸は時間を、縦軸は振幅を示している。なお、C4(オクターブ4のC音)の基本周波数は、fp=261.62Hzである。使用したデータは楽音の開始点から45ms付近(サンプル数n=2000)のデータである。また、テンポ240での16分音符の継続時間は62msである。
これらの楽音の最低音高(つまりC4)は、図4に示した並列構成くし形フィルタの最小出力として検出される。そのくし形フィルタの遅延数Npは、Np=[fs/fp]=[44100/261.62]=[168.56・・・]=169としている。一般に近似値は、推定処理に関してその精度に影響を与えるが、本発明では、ここでの近似値は、推定精度に影響しない。
図11から図14は、図7から図10の楽音をくし形フィルタ(Np=169)に通したときの出力の時間波形をそれぞれ示している。4つの図では、横軸と縦軸はそれぞれ、時間と振幅である。
図15から図20には、図11から図14のサンプル数2000(約45ms)からのデータを使用して、下記の数式(数1)の自己相関関数を求めた結果をそれぞれ示す。5つの図ともに、遅延数(横軸)に対する自己相関関数値(縦軸)として表している。x(n)は楽音のサンプルデータを表す。Npは、ほぼ音高C4の基本周期に対応するサンプル数であるが、kの最大値をNp+αとすることで、より正確な周期を求めることができる。
Figure 2008001779
図15と図16からは、サンプル数でそれぞれ周期168、169が測定される。そのため、図7と図8は単音(C4)かユニゾン(C4+C4)であることがわかる。一方、図17と図18からは、それぞれ周期85(169/2を小数点以下四捨五入した値)、56(169/3を小数点以下四捨五入した値)が検出され、図9の入力はオクターブ(C4+C5)、図10の入力は3倍音(C4+G5)であることがわかる。
次に、図7と図8が単音かユニゾンかを区別するため、図15と図16で測定された周期に対応するくし形フィルタに各楽音を通して、再度そのくし形フィルタの出力の自己相関関数を求める。その結果が図19と図20である。図19は、ほぼ図15の自己相関関数と同じであり、図7は単音と判断される。一方、図20の自己相関関数は、図16のものとは異なり、図8はユニゾンであると判断される。もし、図15と図16での周期が最初に設定したくし形フィルタの遅延数(Np=169)と同じ場合は、そこから−1サンプルまたは+1サンプルずらした遅延数Np=168、170のくし形フィルタを通す。
以上、本開示の手段は、基本周波数成分が分離できない合成信号を対象として、くし形フィルタでは除去されない調波成分と自己相関関数を利用することに、「並列構成くし形フィルタの出力値に注目した採譜のための音高推定法」(森田健夫、山口満、田所嘉昭 信学論、Vol.J87−D−II、No.12、pp.2271−2279、2004)に記載された手段に対する進歩性がある。
そして、本発明により、従来、困難とされてきた協和音の各音高を推定できるようになる。とくに、基本周波数がほぼ等しい複数の楽音からなる和音や、一定の比率の関係にある基本周波数成分を有する楽音から形成される和音を処理できるようになる。また、少ないサンプル数でも周波数分解能を高くできるので、高品質の音響信号処理を行うことができる。さらに、本発明は、楽音だけでなく、声音などを含めた音響信号への適用も可能である。
したがって、複数楽器や歌唱による和音の実用的な採譜システムが初めて構築できるようになる。また、楽音について実時間での認識ができるため、自動演奏楽器などの演奏応答システムが相手の演奏の理解に基づいて同時演奏を行うことや、音響信号コンテンツを複数の利用者間でお互いに適宜、利用できるようになる。
さらに、個人認証システムのために、音響信号を自由に組み合わせて利用することができるようになる。
次に、単音か和音かを区別する有効な方法として、楽音の位相情報に基づく方法について説明する。この方法は、[0017]、[0018]に記述された単音か和音かを区別する方法の結果の正しさを裏付けることが出来る。つまり、音響信号判別部4における処理の正しさを再確認することができる。この方法では、入力楽音のDFTを計算し、各周波数成分の位相を求める。このDFTは、最低基本周波数の1周期を基本にして計算される。そして、このDFTの計算を時間をシフトさせながら行い、各周波数成分の位相と基本周波数の位相との位相差を時間に対してプロットする。その位相差が時間に対してほぼ一定なら単音と判断でき、変化するなら和音と判断できる。この位相差の時間変化は、重なる周波数成分間にわずかな周波数差があるために生ずる。
なお、打弦楽器(ピアノ、ギターなど)では、単音でもその位相差が変化する。しかし、その位相変化は高い周波数成分ほど大きくなるという規則性がある。このため、これらの楽器では位相変化の規則性が保持されているか否かを判断することで、単音か和音かを区別できる。
次に、DFTの位相情報を利用した音響信号推定システムについて、図面を参照して説明する。図21に示すように、この音響信号判別システムは、音響信号を入力する入力部11、音響信号のDFTを計算するDFT計算部12、DFTの計算結果から位相を計算する位相計算部13、基本周波数とその倍音周波数成分の位相差を計算し、時間に対してプロットする時間・位相計算部14、位相差の時間変化から重畳周波数成分を判断し、音響信号の種類を判別する音響信号判別部15、音響信号の判別結果を出力する出力部16からなる。
次に、DFTの位相情報を利用した音響信号推定システムの基本動作について、図22のフローチャートを参照して説明する。まず、基本周波数の推定が困難な音響信号が、入力部11に入力される(S11)。そして、入力された音響信号が、DFT計算部12に受け渡される。このDFT計算部12では、入力された音響信号の最低基本周波数を基本成分としたDFTが計算される(S12)。
次いで、位相計算部13では、DFT係数の実数部と虚数部との比から各周波数成分の位相が計算される(S13)。そして、時間・位相計算部14では、DFTの基本周波数の位相と、その倍音周波数成分の位相との位相差が求められる(S14)。さらに、時間に対する位相変化がプロットされる(S15)。次いで、音響信号判別部15では、時間に対する位相差の変化から重畳している周波数成分の判別が可能か否かが判断される(S16)。ここで、判別ができない場合(S16:NO)、DFT計算の範囲がシフトされ(S17)、S12に戻って、音響信号のDFTが再度計算される。
一方、重畳している周波数成分の判別が可能である場合(S16:YES)、音響信号の種類が判別される(S18)。この判別結果は、出力部16によりシステム出力として処理される(S19)。
図23から図26は、対象とした4つの楽音の基本周波数成分とその倍音周波数成分の位相間の位相差を時間に対してプロットしたものである。図23では、各周波数成分の位相はほぼ一定であり、この楽音は単音であると判別される。一方、図24から図26では、いずれかの周波数成分の位相が時間に対して変化しており、これらの楽音は和音であると判別される。これらの位相変化は、重畳している周波数成分間に周波数差があるために生じる。図24では、すべての周波数成分が変化しており、この和音はユニゾンであることがわかる。図25では、偶数番目の周波数成分の位相が変化しており、この楽音はオクターブ音であることがわかる。さらに、図26では、3倍音の周波数成分の位相が変化しており、この楽音は3倍音であることがわかる。
以上より、従来未解決であった音高推定が困難な和音の音高を推定することができる。なお、前述した実施例は、楽音に対するものであるが、分離できない基本周波数から合成される音響信号について同様に基本周波数を推定し、それを分離することが可能であることは自明である。
なお、本発明は上記実施形態に限定されず、種々の変更が可能である。例えば、上記実施形態では、音響信号推定システムを各処理部からなる装置として説明したが、くし形フィルタシステム部2、自己相関関数処理部3、音響信号判別部4で実行される処理を、コンピュータのCPUを利用してソフト的に実行するようにしてもよい。なお、DFTの位相情報を利用した音響信号推定システムについても同様に、DFT計算部12、位相計算部13、時間・位相計算部14、音響信号判別部15で実行される処理を、コンピュータのCPUを利用してソフト的に実行するようにしてもよい。
音楽配信ビジネス、例えば通信カラオケ、携帯電話やPHSの着信メロディ等では、楽曲を検索するために新曲を少しでも早く楽譜にすることが必要である。よって、これを人手ではなく、計算機による自動採譜システムで行うことが熱望されている。本発明により自動採譜システムとしてこれまで推定困難とされてきた和音の音高推定が可能になり、本格的な採譜システムを実現できる。
したがって、本発明は、民族音楽や即興演奏の記録、作曲作業および音楽教育などの広範囲な用途で、効率性や能率性を高めるために利用できる。
また、特開2001−318894号公報に示されているような携帯電話の音源を利用した個人認証システムでは、音高推定の精度により秘話性に関する性能が決定されるが、本発明による本格的な音響信号推定システムは、技術的仕様の制約が大きい機器に対しても、高精度な推定技術として適用可能である。

Claims (6)

  1. 基本周波数成分とその整数倍の周波数成分から成るような信号において、ある信号の基本周波数成分が他の信号の周波数成分と重なることにより、基本周波数の推定が困難であるような合成信号を対象とし、重なる周波数成分の間に存在する信号源や発生時刻の違いから生じる僅かな周波数差に着目して、対象とする合成信号の基本周波数を推定することを特徴とする基本周波数推定法。
  2. 重なる周波数成分の僅かな周波数差をくし形フィルタによって検出し、自己相関関数により出力信号の周期を求め、自己相関関数の周期が明確でない場合でも、くし形フィルタの遅延数を変化させて、基本周波数を推定することを特徴とする請求項1に記載の基本周波数推定法。
  3. 自己相関関数で検出された周期に対応するくし形フィルタに入力信号を通し、自己相関関数で検出された周期が最初の最低基本周波数の周期と一致し出力信号が得られない場合でも、くし形フィルタの遅延数を変化させて出力信号の自己相関関数を求め、出力信号の自己相関関数の波形の変化から、対象とする信号が単独信号であるか、または同一の基本周波数からなる合成信号か、または基本周波数が異なる合成信号かを判別することを特徴とする請求項1に記載の基本周波数推定法。
  4. 対象とする信号が単独信号か合成信号かの区別をするために、入力信号の離散フーリエ変換を、測定時間をシフトさせながら計算し、基本周波数成分の位相とその倍音周波数成分の位相との位相差を求め、その位相差の時間変化から位相差がほぼ一定なら単独信号と、位相差が変化するなら合成信号と判別することを特徴とする請求項1に記載の基本周波数推定法。
  5. 打弦楽器からの信号に対して、周波数成分に見られる位相差の時間変化の割合において規則性が保持されているかどうかで、単独信号か合成信号かを判別することを特徴とする請求項1に記載の基本周波数推定法。
  6. 請求項1乃至5の何れかに記載の基本周波数推定法を用いる、基本周波数が推定困難な合成信号の1周期間の差分を計算するくし形フィルタを、存在し得る基本周波数に対応させて並列接続し、合成信号の最低基本周波数を、出力の最小値と自己相関関数から求めることができる音響信号推定システム。
JP2008522593A 2006-06-27 2007-06-26 基本周波数推定法および音響信号推定システム Pending JPWO2008001779A1 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2006176615 2006-06-27
JP2006176615 2006-06-27
JP2006356148 2006-12-28
JP2006356148 2006-12-28
PCT/JP2007/062819 WO2008001779A1 (fr) 2006-06-27 2007-06-26 procédé d'estimation de fréquence de référence et système d'estimation de signal acoustique

Publications (1)

Publication Number Publication Date
JPWO2008001779A1 true JPWO2008001779A1 (ja) 2009-11-26

Family

ID=38845543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008522593A Pending JPWO2008001779A1 (ja) 2006-06-27 2007-06-26 基本周波数推定法および音響信号推定システム

Country Status (2)

Country Link
JP (1) JPWO2008001779A1 (ja)
WO (1) WO2008001779A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5843074B2 (ja) * 2013-06-14 2016-01-13 ブラザー工業株式会社 弦楽器演奏評価装置及び弦楽器演奏評価プログラム
JP5807754B2 (ja) * 2013-06-14 2015-11-10 ブラザー工業株式会社 弦楽器演奏評価装置及び弦楽器演奏評価プログラム
CN114088973B (zh) * 2021-11-20 2024-04-02 吉林大学 一种基于双psd数字锁相放大器的超声波测风系统及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62203199A (ja) * 1986-03-03 1987-09-07 富士通株式会社 ピツチ周期抽出方式
JP4121578B2 (ja) * 1996-10-18 2008-07-23 ソニー株式会社 音声分析方法、音声符号化方法および装置
JP3916834B2 (ja) * 2000-03-06 2007-05-23 独立行政法人科学技術振興機構 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法
JP3955967B2 (ja) * 2001-09-27 2007-08-08 株式会社ケンウッド 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP3960834B2 (ja) * 2002-03-19 2007-08-15 松下電器産業株式会社 音声強調装置及び音声強調方法
JP4362072B2 (ja) * 2004-01-08 2009-11-11 日本電信電話株式会社 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体

Also Published As

Publication number Publication date
WO2008001779A1 (fr) 2008-01-03

Similar Documents

Publication Publication Date Title
Bittner et al. Deep Salience Representations for F0 Estimation in Polyphonic Music.
Marolt A connectionist approach to automatic transcription of polyphonic piano music
US6930236B2 (en) Apparatus for analyzing music using sounds of instruments
Beauchamp Analysis, synthesis, and perception of musical sounds
Klapuri et al. Robust multipitch estimation for the analysis and manipulation of polyphonic musical signals
Wu et al. Polyphonic music transcription with semantic segmentation
WO2007010637A1 (ja) テンポ検出装置、コード名検出装置及びプログラム
JP2004526203A (ja) 音楽信号を音符基準表記に変換する方法及び装置、並びに、音楽信号をデータバンクに照会する方法及び装置
Argenti et al. Automatic transcription of polyphonic music based on the constant-Q bispectral analysis
Lenssen et al. An introduction to fourier analysis with applications to music
JPWO2008001779A1 (ja) 基本周波数推定法および音響信号推定システム
Elie et al. Acoustic signature of violins based on bridge transfer mobility measurements
Wu et al. Multipitch estimation by joint modeling of harmonic and transient sounds
US20230335090A1 (en) Information processing device, information processing method, and program
Heydarian et al. Dastgàh recognition in Iranian music: Different features and optimized parameters
Dobre et al. Automatic music transcription software based on constant Q transform
Stöter et al. Unison Source Separation.
Beauchamp Comparison of vocal and violin vibrato with relationship to the source/filter model
Gong et al. Monaural musical octave sound separation using relaxed extended common amplitude modulation
Scherrer Physically-informed indirect acquisition of instrumental gestures on the classical guitar: Extracting the angle of release
Joo et al. Melody Extraction based on Harmonic Coded Structure.
Gainza et al. Harmonic sound source separation using FIR comb filters
Molina et al. Dissonance reduction in polyphonic audio using harmonic reorganization
JP2013041128A (ja) 複数音源の識別装置および複数音源に連動する情報処理装置
Yamaguchi et al. Pitch Estimation for Mixed Tones With Overlapped Harmonic Components Using Comb Filters and Auto-correlation Functions