JP4630982B2 - 音高推定装置、音高推定方法およびプログラム - Google Patents

音高推定装置、音高推定方法およびプログラム Download PDF

Info

Publication number
JP4630982B2
JP4630982B2 JP2007045013A JP2007045013A JP4630982B2 JP 4630982 B2 JP4630982 B2 JP 4630982B2 JP 2007045013 A JP2007045013 A JP 2007045013A JP 2007045013 A JP2007045013 A JP 2007045013A JP 4630982 B2 JP4630982 B2 JP 4630982B2
Authority
JP
Japan
Prior art keywords
peak
weight value
peaks
fundamental frequency
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007045013A
Other languages
English (en)
Other versions
JP2008209547A (ja
Inventor
真孝 後藤
琢哉 藤島
慶太 有元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Yamaha Corp
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp, National Institute of Advanced Industrial Science and Technology AIST filed Critical Yamaha Corp
Priority to JP2007045013A priority Critical patent/JP4630982B2/ja
Publication of JP2008209547A publication Critical patent/JP2008209547A/ja
Application granted granted Critical
Publication of JP4630982B2 publication Critical patent/JP4630982B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Description

本発明は、音高(基本周波数)を推定する技術に関する。
特許文献1には、複数の音の混合音など様々な音(以下「対象音」という)を構成するひとつの音の基本周波数を推定する技術が開示されている。この技術においては、対象音の振幅スペクトルを複数の音モデル(高調波構造をモデル化した確率密度関数)の混合分布でモデル化したときの各音モデルの重み値を基本周波数の確率密度関数として算定し、確率密度関数において優勢なピークを所望の音の基本周波数として推定する。
特許第3413634号公報
しかし、基本周波数の確率密度関数には、対象音に含まれる音の基本周波数だけでなく、対象音に実際には含まれない音の基本周波数にもピークが現れる。例えば、基本周波数100Hzの音の振幅スペクトルには、基本周波数200Hzの音の振幅スペクトルと同様の周波数(200Hz,400Hz,600Hz,800Hz,……)にピークが現れる。したがって、基本周波数200Hzの音が対象音に含まれる場合には、基本周波数100Hzの音が実際には対象音に含まれない場合であっても、基本周波数の確率密度関数には200Hzに加えて100Hzにもピークが現れる。以上のように多数のピークが存在する確率密度関数から所望の音の基本周波数のみを高精度に選択することは困難である。このような事情に鑑みて、本発明は、対象音(特に複数の音の混合音)の基本周波数を高精度に推定するという課題の解決を目的としている。
以上の課題を解決するために、本発明に係る音高推定装置は、相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって入力音響信号の基本周波数の確率密度関数を推定する関数推定手段と、確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、複数のピークのうち第1ピーク以外の第2ピークを抑制し評価用重み値生成する関数加工手段と、関数加工手段が生成した各評価用重み値を更新対象の重み値として単位処理を反復した結果に基づいて、関数推定手段が推定した確率密度関数に現れる複数のピークのうち入力音響信号の基本周波数に対応したピークを特定する音高特定手段とを具備する。
以上の構成においては、各々の生成時に抑制されたピークの組合せが相違する複数の評価用重み値について所定の回数の単位処理を実行した結果に基づいて入力音響信号の基本周波数が特定されるから、例えば単純に確率密度関数のピーク値の大小に応じて基本周波数が特定される構成と比較して対象音の基本周波数を高精度に推定することが可能となる。また、確率密度関数を推定するための重み値の更新と評価用重み値の更新とに共通の単位処理が利用されるから、確率密度関数の推定とは別個の方法や構成で入力音響信号の基本周波数が特定される構成と比較して、音高推定装置による処理の負荷や装置の規模が低減されるという利点がある。
本発明の第1の態様において、関数推定手段が実行する単位処理は、各基本周波数の音モデルが入力音響信号の高調波構造を支持する程度を示す優勢度分布に基づいて当該基本周波数の新たな重み値を算定する処理を含み、音高特定手段は、各評価用重み値に単位処理を実行したときの優勢度分布を各基本周波数について加算した優勢度積算値と入力音響信号の振幅スペクトルとの類否を示す類否指標値を各評価用重み値について算定する類否解析手段と、類否解析手段の算定した各類否指標値が類似を示す評価用重み値の生成時に維持されたひとつまたは複数のピーク(例えば図4における評価用重み値E[2]の周波数F2〜F4の各々に現れるピーク)、または、類否解析手段の算定した各類否指標値が非類似を示す評価用重み値の生成時に抑制されたひとつまたは複数のピークを、入力音響信号の基本周波数に対応したピークとして特定するピーク特定手段とを含む。評価用重み値の生成時に維持されたピークが実際の入力音響信号の基本周波数に対応した優勢なピークであるほど、当該評価用重み値から生成される優勢度積算値と入力音響信号の振幅スペクトルとは類似する。換言すると、評価用重み値の生成時に抑制されたピークが実際の入力音響信号の基本周波数に対応した優勢なピークであるほど、当該評価用重み値から生成される優勢度積算値と入力音響信号の振幅スペクトルとの相違は増大する。したがって、以上の態様によれば、入力音響信号の基本周波数を高精度に特定することが可能である。なお、第1の態様の具体例は第1実施形態として後述される。
本発明の第2の態様において、音高特定手段は、関数推定手段による所定の回数の単位処理を経た各評価用重み値と記憶手段が記憶する確率密度関数との類否を示す類否指標値を各評価用重み値について算定する類否解析手段と、類否解析手段の算定した各類否指標値が非類似を示す評価用重み値の生成時に抑制されたひとつまたは複数のピーク(例えば図6における評価用重み値E[1]の生成時に削除された周波数F1のピークや評価用重み値E[2]の生成時に削除された周波数F2のピーク)、または、類否解析手段の算定した各類否指標値が類似を示す評価用重み値の生成時に維持されたひとつまたは複数のピークを、入力音響信号の基本周波数に対応したピークとして特定するピーク特定手段とを含む。評価用重み値の生成時に抑制されたピークが実際の入力音響信号の基本周波数に対応した優勢なピークであるほど、所定の回数の単位処理を経た評価用重み値と基本周波数の確率密度関数との相違は拡大する。換言すると、評価用重み値の生成時に維持されたピークが実際の入力音響信号の基本周波数に対応した優勢なピークであるほど、所定の回数の単位処理を経た評価用重み値と基本周波数の確率密度関数とは類似する。したがって、以上の態様によれば、入力音響信号の基本周波数を高精度に特定することが可能である。なお、第2の態様の具体例は第2実施形態として後述される。
第2の態様に係る音高推定装置において、ピーク特定手段は、類否解析手段が算定した複数の類否指標値のうち非類似を示す最大値と所定の係数との乗算によって閾値を算定し、類否指標値が閾値を上回る1以上の評価用重み値の生成時に抑制されたひとつまたは複数のピークを特定する。以上の態様によれば、対象音に含まれる音数に応じて閾値が制御されるから、対象音に現実に含まれる音の基本周波数を、対象音の音数の多少に関わらず高精度に特定することが可能となる。
本発明の好適な態様において、関数加工手段は、確率密度関数における第2ピークの数値をゼロに変更することで評価用重み値を生成する。この態様によれば、確率密度関数の所定のピーク値がゼロに変更されるから、所定の回数の単位処理を経た評価用重み値に基づいて、確率密度関数の各ピークが入力音響信号の基本周波数に該当するか否かを明確に区別することが可能となる。
本発明は、入力音響信号の基本周波数を推定する方法としても特定される。本発明の音高推定方法は、相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって入力音響信号の基本周波数の確率密度関数を推定する一方、確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、複数のピークのうち第1ピーク以外の第2ピークを抑制し評価用重み値生成し、各評価用重み値を更新対象の重み値として単位処理を反復した結果に基づいて、推定した確率密度関数に現れる複数のピークのうち入力音響信号の基本周波数に対応したピークを特定する。以上の方法によれば、本発明の音高推定装置と同様の作用および効果が奏される。
本発明に係る音高推定装置は、各処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって入力音響信号の基本周波数の確率密度関数を推定する最尤推定処理と、確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、複数のピークのうち第1ピーク以外の第2ピークを抑制し評価用重み値生成する関数加工処理と、関数加工処理で生成した各評価用重み値を更新対象の重み値として単位処理を反復した結果に基づいて、最尤推定処理で推定した確率密度関数に現れる複数のピークのうち入力音響信号の基本周波数に対応したピークを特定する音高特定処理とをコンピュータに実行させる内容である。以上のプログラムによっても、本発明に係る音高推定装置と同様の作用および効果が奏される。なお、本発明のプログラムは、CD−ROMなど可搬型の記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、ネットワークを介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
<A−1:第1実施形態の構成>
図1は、本発明の第1実施形態に係る音高推定装置の機能的な構成を示すブロック図である。音高推定装置Dは、対象音を構成する各音の基本周波数(音高)を推定する装置であり、図1に示すように、周波数分析部12とBPF(Band Pass Filter)14と関数推定部20と記憶部30と音高特定部40とを含む。図1に図示された各部は、例えばCPUなどの演算処理装置がプログラムを実行することで実現されてもよいし、基本周波数の推定に専用されるDSPなどのハードウェアによって実現されてもよい。
周波数分析部12には、対象音の時間波形を示す音響信号Vが入力される。本実施形態の音響信号Vが示す対象音は、各々の音高や音源が相違する複数の音の混合音である。周波数分析部12は、所定の窓関数を利用して音響信号Vを多数のフレームに分割したうえで、FFT(Fast Fourier Transform)処理を含む周波数分析を各フレームの音響信号Vについて実行することで対象音の振幅スペクトルを特定する。各フレームは時間軸上で相互に重なり合うように設定される。
BPF14は、周波数分析部12がフレームごとに特定した振幅スペクトルのうち特定の周波数帯域に属する成分を選択的に通過させる。BPF14の通過帯域は、対象音を構成する複数の音のうち音高を推定すべき各音の基本周波数成分や高調波成分の多くが通過し、かつ、他の音の基本周波数成分や高調波成分が所望の音よりも優勢となる周波数帯域が遮断されるように、統計的または実験的に予め選定される。BPF14を通過した振幅スペクトルSは関数推定部20に出力される。
図2は、関数推定部20による処理の概要を説明するための概念図である。同図の部分(a)に破線で示すように、振幅スペクトルSは実際には周波数xに沿って連続的に分布する。しかし、同図においては説明の便宜のために、ピークの各周波数xに対応して配列された複数の直線(ピークの強度Aに対応する長さの線分)として振幅スペクトルSが図示されている。図2の部分(b)から部分(f)の表記(部分(b)の音モデルM[F]・部分(c)の期待値Q[F]・部分(d)の優勢度分布C[F]・部分(e)の重み値ω[F]・部分(f)の優勢度積算値Csum[i])についても同様である。また、図2の部分(a)においては、基本周波数F0が200Hzである対象音(すなわち倍音の周波数が400Hz,600Hz,800Hzである対象音)の振幅スペクトルSが便宜的に図示されているが、実際には複数の音を混合したものが対象音とされる。
図1の記憶部30は、関数推定部20や音高特定部40による処理に使用される各種の情報を記憶する手段(磁気記憶装置や半導体記憶装置)である。記憶部30は、例えば、関数推定部20で使用される多数の音モデルM[F]をテンプレートとして記憶する。図2の部分(b)に示すように、音モデルM[F]は、対象音を構成する各音の基本周波数F0の候補となる基本周波数Fごとに用意される。ただし、図2の部分(b)には、100Hzの基本周波数Fに対応する音モデルM[100]と200Hzの基本周波数Fに対応する音モデルM[200]とが便宜的に図示されている。音モデルM[F]は、基本周波数Fに対応した高調波構造(基音成分および倍音成分の周波数軸上における分布・配置やスペクトル形状)を周波数xに沿ってモデル化する関数(確率密度関数)である。例えば、図2の部分(b)に例示するように、音モデルM[100]においては、基本周波数Fに対応した周波数x(x=100Hz)とその倍音に相当する周波数x(x=200Hz,300Hz,400Hz)とにピークが現れる。
図1の関数推定部20は、振幅スペクトルSについて基本周波数の確率密度関数Pを推定する。確率密度関数Pは、振幅スペクトルSを多数の音モデルM[F]の混合分布(複数の音モデルM[F]の重み付き和)としてモデル化したときの各音モデルM[F]の重み値ω[F]の分布を表現する関数である。
本実施形態の関数推定部20は、最尤推定アルゴリズムのひとつであるEM(Expectation-Maximization)アルゴリズムに基づいて所定の処理(以下「単位処理」という)を反復することで確率密度関数Pを推定する。各単位処理は、前回の単位処理で算定された重み値ω[F](第1回目の単位処理においては重み値ω[F]の初期値)に基づいて新たな重み値ω[F]を算定する処理である。重み値ω[F]は、単位処理のたびに、複数の音モデルM[F]の混合分布によって振幅スペクトルSがモデル化されるときの重み値ω[F](尤度が高い数値)に近づいていく。所定の回数の単位処理が実行された時点の重み値ω[F]が確率密度関数Pとして記憶部30に記憶される。
図2に示すように、単位処理は、各音モデルM[F](各基本周波数F)について図2の部分(d)の優勢度分布C[F]を生成する優勢度特定処理PA(PA1・PA2)と、優勢度分布C[F]に基づいて重み値ω[F]を算定する重み値算定処理PBとを含む。優勢度特定処理PAは、図2の部分(c)の期待値Q[F]を生成する処理PA1と、優勢度分布C[F]を生成する処理PA2とから構成される。
処理PA1は、記憶部30から読み出された音モデルM[F]と重み値算定処理PBで算定された重み値ω[F]とを各基本周波数Fについて乗算し、さらに乗算後の各音モデルM[F]について同じ周波数xの数値の総和が1となるように正規化することで期待値Q[F]を生成する処理である。処理PA2は、各基本周波数Fの期待値Q[F]と振幅スペクトルSとの乗算によって当該基本周波数Fの優勢度分布C[F]を生成する処理である。以上の手順から理解されるように、優勢度分布C[F]は、音響信号Vの高調波構造が音モデルM[F]によって支持される程度(優勢度)の分布を周波数xに沿って示す。したがって、振幅スペクトルSの形状(基本周波数成分や各高調波成分)を優勢に支持する音モデルM[F](すなわち振幅スペクトルSの高調波構造に近い分布(ピーク)を持つ音モデルM[F])から生成された優勢度分布C[F]ほど多数かつ高強度のピークを含む。
重み値算定処理PBは、優勢度特定処理PAで算定された各優勢度分布C[F]から各基本周波数Fの重み値ω[F]を算定する手段である。すなわち、図2に示すように、重み値算定処理PBにおいては、第1に、基本周波数Fごとの優勢度分布C[F]の優勢度を各周波数xについて積算した数値k[F](周波数xに関する優勢度分布C[F]の積分値)が算定され、第2に、基本周波数Fの全範囲にわたる重み値ω[F]の積分値が「1」となるように数値k[F]を正規化することで各基本周波数Fの重み値ω[F]が生成される。すなわち、基本周波数Fの全範囲にわたる数値k[F]の総和をKとすれば、重み値ω[F]は「k[F]/K」と表記される。
以上の説明から理解されるように、特定の基本周波数Fに対応する重み値ω[F]は、基本周波数Fに対応する音モデルM[F]が振幅スペクトルSの高調波構造をどのくらい優勢に支持するかを示す。したがって、確率密度関数Pのうち優勢なピークが現れる基本周波数Fは、対象音に含まれる各音の基本周波数F0(音高)である可能性が高い。音高特定部40は、関数推定部20が指定した確率密度関数Pにおいてピークが現れるひとつまたは複数の基本周波数Fを対象音の各音の基本周波数(音高)F0として特定する。
以上の手順で算定される確率密度関数P(重み値ω[F])には、対象音に含まれる音の基本周波数Fだけでなく、実際には対象音に含まれない音の基本周波数Fにもピークが現れ得る。例えば、基本周波数100Hzの音の振幅スペクトルには、基本周波数200Hzの音の振幅スペクトルと同様の周波数(200Hz,400Hz,600Hz,800Hz,……)にピークが現れるから、図2の部分(a)のように基本周波数200Hzの音が対象音に含まれる場合には、基本周波数100Hzの音が実際には対象音に含まれない場合であっても、図2の部分(e)に示すように、基本周波数の確率密度関数Pには200Hzに加えて100Hzにもピーク(ω[100])が現れる。重み値ω[F]に現れる多数のピークのうち実際には対象音に含まれない音に対応したピークを以下では「偽ピーク」と表記し、対象音に現実に含まれる音に対応したピーク(以下「真ピーク」という)と区別する場合がある。
以上のように真ピークと偽ピークとが混在する確率密度関数Pから真ピークのみを高精度に抽出するために、本実施形態においては、確率密度関数Pに現れる複数のピークから選択されたひとつまたは複数のピークを真ピークと仮定したn種類の仮説を設定し(nは2以上の自然数)、n種類の仮説のうち尤度が最大となる仮説(以下「最尤仮説」という)で真ピークと仮定した各ピークの基本周波数Fを対象音の各音の基本周波数F0として特定する。
図1に示すように関数推定部20はピーク選択部22と関数加工部24とを含む。ピーク選択部22は、確率密度関数Pに現れる多数のピークのなかからひとつまたは複数のピークを仮定的な真ピークとして選択するn種類の組合せ(仮説)を特定する手段である。関数加工部24は、n種類の仮説の各々を評価するための数値(以下「評価用重み値」という)E[1]〜E[n]を確率密度関数Pの加工によって生成する。評価用重み値E[i](iは1≦i≦nを満たす整数)は、確率密度関数Pに現れる複数のピークのうち第i番目の仮説にて選定されたピーク以外のピーク(すなわち仮定的な偽ピーク)の数値を強制的にゼロに変更(すなわちピークを削除)した関数である。
また、音高特定部40は類否解析部42とピーク特定部44とを含む。類否解析部42は、各仮説の尤度の指標となる数値(以下「類否指標値」という)Ra[1]〜Ra[n]を評価用重み値E[1]〜E[n]の各々から生成する。ピーク特定部44は、類否解析部42が生成した類否指標値Ra[1]〜Ra[n]に基づいて最尤仮説を推定し、最尤仮説にて選択されていたひとつまたは複数のピーク(すなわち評価用重み値E[i]の生成時に維持されたピーク)の周波数を対象音の各音の基本周波数F0として特定する。関数推定部20(ピーク選択部22・関数加工部24)や音高特定部40(類否解析部42・ピーク特定部44)による具体的な処理は以下の通りである。
<A−2:第1実施形態の動作>
図3は、関数推定部20および音高特定部40による処理を示すフローチャートであり、図4は、図3の処理を具体的に説明するための概念図である。図3に示すように、関数推定部20は、重み値ω[F]を更新する単位処理をM1回(M1は1以上の整数)にわたって反復する(ステップS10・ステップS11)。図2を参照して説明したように、各回の単位処理において、関数推定部20は、前回の単位処理で算定した重み値ω[F]を変数とした所定の演算によって、当該重み値ω[F]よりも尤度が高い新たな重み値ω[F]を算定する。
関数推定部20は、単位処理をM1回にわたって実行した時点(ステップS11:YES)における最新の重み値ω[F]を基本周波数の確率密度関数Pとして記憶部30に格納する(ステップS12)。図4の部分(a)には、ステップS12で記憶部30に格納される確率密度関数Pが図示されている。同図の確率密度関数Pには、複数の基本周波数F(F1,F2,F3,F4,F5,……)にピークが現れる。
ピーク選択部22は、確率密度関数Pに現れる複数のピークを検出し、ここで検出した複数のピークのなかから任意の個数のピークを選択する総て(n種類)の組合せを特定する(ステップS13)。確率密度関数Pにm個(mは2以上の自然数)のピークが現れるとすれば、ステップS13で特定される組合せの総数nは、各ピークの選択/非選択の組合せの総数(2m)から総てのピークが非選択とされる場合を除外して「2m−1」通りとなる。
関数推定部20は、ピーク選択部22が決定したn種類の組合せ(仮説)の何れかを指定する変数iを「1」に設定する(ステップS14)。次いで、関数加工部24は、確率密度関数Pに現れる複数のピークのうちピーク選択部22が特定した第i番目の組合せに属するピーク以外のひとつまたは複数のピーク(偽ピークと仮定されたピーク)を削除することで評価用重み値E[i]を生成する(ステップS15)。そして、関数推定部20は、重み値ω[F]を対象としたステップS10と同様の単位処理を評価用重み値E[i]について実行することで評価用重み値E[i]を順次に更新する(ステップS16)。ステップS16の単位処理がM2回(M2は1以上の整数)にわたって反復されると(ステップS17:YES)、関数推定部20は、ステップS18に処理を移行する。
ステップS18において、関数推定部20は、変数iが組合せの総数nに到達したか否かに基づいて、総ての組合せについて評価用重み値E[i]の生成(ステップS15)と単位処理の反復による評価用重み値E[i]の更新(ステップS16・ステップS17)とを実行したか否かを判定する。変数iが総数nを下回る場合、関数推定部20は、変数iに「1」を加算することで次の組合せを選定したうえで(ステップS19)、ステップS15からステップS18までの処理を繰り返す。
図4の部分(b)には、ステップS15で生成された評価用重み値E[1]〜E[n]が例示されている。同図においては、図4の部分(a)における確率密度関数Pから削除されたピークが破線で図示されている。同図の部分(b)に示すように、ステップS15にて削除されるピーク(仮定的な偽ピーク)の組合せは評価用重み値E[i]ごとに相違する。例えば、評価用重み値E[1]は、確率密度関数Pにおける基本周波数F2・F4のピークの削除によって生成され、評価用重み値E[2]は、基本周波数F1・F5のピークの削除によって生成され、評価用重み値E[n]は、基本周波数F1以外のピークの削除によって生成される。
ここで、図2の部分(f)に示すように、同図の部分(d)の優勢度分布C[F]を基本周波数Fの全範囲にわたって周波数xごとに積算した関数(以下「優勢度積算値」という)Csumを検討する。図2から理解されるように、ステップS16の単位処理においては、評価用重み値E[i]と音モデルM[F]との乗算値を正規化して期待値Q[F]を算定する処理PA1と、期待値Q[F]と振幅スペクトルSとの乗算によって優勢度分布C[F]を算定する処理PA2とが実行される。したがって、ステップS15で生成された評価用重み値E[i]において確率密度関数Pの多くの真ピークが維持されるほど(すなわち第i番目の仮説の尤度が高いほど)、ステップS16における優勢度分布C[F]から算定される優勢度積算値Csum[i]と振幅スペクトルSとは類似する。逆に、ステップS15で生成された評価用重み値E[i]において多くの偽ピークが維持されるほど(すなわち第i番目の仮説の尤度が低いほど)、優勢度積算値Csum[i]と振幅スペクトルSとの相違は増大する。そこで、本実施形態の音高特定部40は、優勢度積算値Csum[i]と振幅スペクトルSとの類似度が最大となる評価用重み値E[i]の仮説を最尤仮説(すなわち確率密度関数Pの真ピークを最も多く含む組合せ)と評価する。さらに詳述すると以下の通りである。
n種類の組合せ(仮説)についてステップS15からステップS17までの処理が完了すると(ステップS18:YES)、音高特定部40の類否解析部42は、評価用重み値E[i]についての第M2回目の単位処理(ステップS16)で生成された優勢度分布C[F]から優勢度積算値Csum[i]を算定し、この優勢度分布Csum[i]と振幅スペクトルSとの類否の程度を示す類否指標値Ra[i]を算定する(ステップS20)。本実施形態の類否指標値Ra[i]はKL(Kullback-Leibler)情報量である。したがって、優勢度積算値Csum[i]と振幅スペクトルSとが類似するほど類否指標値Ra[i]はゼロに近づいていく(両者の相違が大きいほど類否指標値Ra[i]は増加する)。なお、図3においては総ての評価用重み値E[1]〜E[n]について単位処理を反復してから優勢度積算値Csum[1]〜Csum[n]を算定する場合を便宜的に例示するが、優勢度積算値Csum[i]や類否指標値Ra[i]を算定する処理は、ひとつの評価用重み値E[i]について単位処理の反復が完了するたびに(すなわち図3のステップS17とステップS18との間に)実行されてもよい。
ピーク特定部44は、類否解析部42の算定した類否指標値Ra[1]〜Ra[n]が最小(優勢度積算値Csum[i]と振幅スペクトルSとの類似を示す)となる評価用重み値E[i](すなわち確率密度関数Pからの生成時に維持されたピークの組合せが最尤仮説に該当する評価用重み値E[i])を探索する(ステップS21)。そして、ピーク特定部44は、確率密度関数Pに現れる複数のピークのうち当該評価用重み値E[i]の生成時に維持されたひとつまたは複数のピークを特定し、ここで特定したピークの各周波数を対象音の各音の基本周波数F0として出力する(ステップS22)。
例えば図4においては、類否指標値Ra[2]が最小となる場合(すなわち第2番目の仮説が最尤仮説である場合)を想定している。したがって、確率密度関数Pから評価用重み値E[2]を生成するときに維持された(すなわち真ピークと仮定された)各ピークの基本周波数F(F2,F3,F4)が基本周波数F0として出力される。
以上に説明したように、本実施形態においては、確率密度関数Pに現れる多数のピークを選択的に真ピークと仮定したn種類の仮説から最尤仮説が推定され、最尤仮説にて真ピークと仮定されていたピーク(真ピーク)の周波数が基本周波数F0として特定される。したがって、例えば確率密度関数Pにおいてピーク値が所定の閾値を上回るピークの周波数を単純に基本周波数F0として抽出する構成と比較して、基本周波数F0を高精度に推定することが可能となる。特に本実施形態においては、確率密度関数Pから任意の個数のピークを選択する総ての組合せについてステップS15からステップS17の処理が実行される。すなわち、確率密度関数Pのひとつピークを真ピークとする仮説だけでなく、確率密度関数Pの複数のピークを真ピークとする仮説も設定される。したがって、対象音に含まれる複数の音の基本周波数を一括的に推定することが可能となる。
ところで、確率密度関数Pから基本周波数F0を抽出する方法としては、例えば特許文献1に開示されているようにマルチエージェントモデルを採用することも考えられる。すなわち、複数の自律的なエージェントの各々に確率密度関数Pの各ピークを割り当てたうえで各ピークの経時的な変動を追跡させ、信頼度が高いエージェントのピークを基本周波数F0として出力する。しかし、マルチエージェントモデルは確率密度関数Pの推定とは全く別個の仕組みである。したがって、演算処理装置がプログラムを実行することで音高推定装置Dが実現される場合にはプログラムの容量や演算処理装置による処理の負荷が増大するという問題がある。また、DSPなどのハードウェアによって音高推定装置Dが実現される場合には回路の規模が肥大化するという問題がある。本実施形態においては、確率密度関数P(重み値ω[F])を推定するための単位処理が評価用重み値E[i]の更新にも流用されるから、これらの問題が解消されるという利点がある。
<B:第2実施形態>
次に、本発明の第2実施形態について説明する。なお、本実施形態のうち第1実施形態と作用や機能が共通する要素については、以上と同じ符号を付して、各々の詳細な説明を適宜に省略する。
図5は、関数推定部20および音高特定部40による処理を示すフローチャートであり、図6は、図5の処理を具体的に説明するための概念図である。ステップS10の反復によって確率密度関数Pが確定すると(ステップS10からステップS12)、関数推定部20のピーク選択部22は、確率密度関数Pに現れるピークを検出する(ステップS131)。図6の部分(a)には、ピーク選択部22が確率密度関数Pからn個のピーク(基本周波数F1〜Fn)を検出した場合が例示されている。
関数加工部24は、図6の部分(b)に示すように、確率密度関数Pのn個のピークのうち第i番目のひとつのピークの重み値ω[F]を強制的にゼロに変更することで評価用重み値E[i]を生成する(ステップS15)。評価用重み値E[i]については、第1実施形態と同様に、ステップS10と同様の単位処理が反復される(ステップS16・ステップS17)。ステップS15で削除された第i番目のピークが真ピークである場合、M2回にわたる単位処理を経た評価用重み値E[i]は確率密度関数Pから乖離した態様となる。これに対し、第i番目のピークが偽ピークである場合、単位処理を経た評価用重み値E[i]は、第i番目のピークが真ピークである場合と比較して確率密度関数Pに類似する。
そこで、ステップS15からステップS17までの処理を確率密度関数Pの総てのピークについて実行(すなわちn回にわたって実行)すると、類否解析部42は、評価用重み値E[1]〜E[n]の各々と記憶部30に記憶された確率密度関数Pとの類否の程度を示す類否指標値Rb[1]〜Rb[n]を算定する(ステップS20)。本実施形態の類否指標値Rb[i]はKL情報量である。したがって、評価用重み値E[i]と確率密度関数Pとの相違が大きいほど類否指標値Rb[i]は増大する。すなわち、類否指標値Rb[i]が大きいほど、これに対応した評価用重み値E[i]の生成時に削除されたピークは真ピークである可能性が高い。なお、図5においては総ての評価用重み値E[1]〜E[n]について単位処理を反復してから類否指標値Rb[1]〜Rb[n]を算定する場合を例示したが、ひとつの評価用重み値E[i]についてM2回の単位処理を実行するたびに(すなわち図5のステップS17とステップS18との間)に類否指標値Rb[i]を算定してもよい。
ピーク特定部44は、類否解析部42が算定した類否指標値Rb[1]〜Rb[n]に基づいて閾値THを算定する(ステップS201)。さらに詳述すると、ピーク特定部44は、類否指標値Rb[1]〜Rb[n]の最大値Rmaxを特定し、最大値Rmaxと所定の係数C(0<C<1)との乗算値を閾値THとして算定する。次いで、ピーク特定部44は、類否指標値Rb[1]〜Rb[n]のなかから閾値THを上回る(すなわち評価用重み値E[i]と確率密度関数Pとの非類似を示す)ひとつまたは複数の類否指標値Rb[i]を探索する(ステップS21)。そして、ピーク特定部44は、ステップS21で抽出した各類否指標値Rb[i]に対応する評価用重み値E[i]の生成時に確率密度関数Pから削除したピーク(真ピーク)を特定し、ここで特定したひとつまたは複数のピークの各基本周波数Fを対象音の各音の基本周波数F0として出力する(ステップS22)。例えば、図6のように類否指標値Rb[1]およびRb[2]が閾値THを上回る場合には、評価用重み値E[1]の生成時に削除されたピークの基本周波数F1と、評価用重み値E[2]の生成時に削除されたピークの基本周波数F2とが、対象音を構成する各音の基本周波数F0として出力される。
以上に説明したように、本実施形態においても確率密度関数Pのひとつのピークを削除した評価用重み値E[i]について単位処理を反復した結果に基づいて基本周波数F0が特定される。したがって、第1実施形態と同様に、例えばマルチエージェントモデルを採用した構成と比較して回路の規模の肥大化や処理の負荷の増大を抑制しながら、基本周波数F0を高精度に推定することが可能となる。
また、本実施形態においては、確率密度関数Pのひとつのピークの削除によって評価用重み値E[i]が生成されるから、ステップS15からステップS17までの処理は確率密度関数Pにおけるピークの総数に相当する回数(n回)だけ反復されれば足りる。したがって、真ピークとして選択されるピークの総ての組合せについて図3のステップS15からステップS17までの処理が実行される第1実施形態と比較して、関数推定部20による処理の負荷が軽減され得る。
次に、図7は、図5のステップS20で算定された類否指標値Rb[1]〜Rb[n]と閾値THとの関係を示す概念図である。同図の部分(a)は対象音を構成する音数が多い場合を示し、部分(b)は音数が少ない場合を示す。対象音を構成する音数が少ない場合、確率密度関数Pの真ピークの削除で生成された評価用重み値E[i]は単位処理の反復を経ることで確率密度関数Pから大きく変化する。したがって、図7の部分(b)に示すように、真ピークに対応する類否指標値Rb[i](ここではRb[3])は、偽ピークに対応する類否指標値Rb[i]よりも充分に大きい数値Rmaxとなる。一方、対象音を構成する音数が多い場合、各々のピーク値が比較的に小さい多数の真ピークが確率密度関数Pに現れるから、確率密度関数Pのひとつの真ピークを削除することで生成されて単位処理を経た評価用重み値E[i]は、対象音の音数が少ない場合と比較すると確率密度関数Pとの相違が小さい。したがって、図7の部分(a)に示すように、真ピークに対応する多数の類否指標値Rb[i]は図7の部分(b)の場合と比較して小さい数値となる傾向がある。対象音の音数に関わらず係数Cは共通であるから、音数が多い場合にステップS201で算定される閾値TH1は、音数が少ない場合の閾値TH2よりも小さい。
いま、対象音に含まれる音数に拘わらず、図7の部分(b)の閾値TH2がステップS21にて固定的に適用されるとすれば、図7の部分(a)のように対象音の音数が多い場合に、閾値TH2を上回る類否指標値Rb[i]の個数が少なくなる。したがって、対象音に含まれる多数の音を高精度に検出できないという問題がある。一方、図7の部分(a)の閾値TH1がステップS21にて固定的に適用されるとすれば、図7の部分(b)のように対象音の音数が少ない場合に、偽ピークの類否指標値Rb[i]が閾値TH1を上回る可能性が高まるから、対象音に実際に含まれる音の基本周波数F0のみを検出する精度は低下する。以上のように、閾値THを固定値とした場合には、基本周波数F0の高精度な推定が制約される場合がある。
これに対し、本実施形態における閾値THは対象音の音数に応じて変化する。すなわち、対象音の音数が多い場合には閾値THを低下させることで多数の音の基本周波数F0が検出され、対象音の音数が少ない場合には閾値THを上昇させることで偽ピークの検出の可能性が低減される。つまり、閾値THを固定値とした場合と比較して基本周波数F0の推定の精度が向上する。もっとも、閾値THの固定による精度の低下が問題とならないのであれば、類否指標値Rb[i]に依存しない固定値を閾値THとした構成も採用される。
<C:変形例>
以上の各形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を適宜に組み合わせてもよい。
(1)変形例1
第1実施形態においては、確率密度関数Pに現れる複数のピークのなかから任意の個数のピークを選択する総ての組合せ(仮説)について評価用重み値E[i]が生成される構成を例示したが、総ての組合せについて評価用重み値E[i]を生成する必要は必ずしもない。さらに、図3のステップS13においては確率密度関数Pの総てのピークが選択の対象とされる必要はない。例えば、確率密度関数Pの総てのピークのなかから所定の閾値を上回る複数のピークを予め抽出し、ここで抽出した複数のピークを評価用重み値E[i]の生成時の選択(削除)の対象としてもよい。また、第2実施形態においては、確率密度関数Pに現れる総てのピークについて評価用重み値E[i]が生成される構成を例示したが、確率密度関数Pに現れる総てのピークのなかから選択された複数のピークの各々について評価用重み値E[i]が生成される構成としてもよい。
(2)変形例2
第1実施形態と第2実施形態とを適宜に組み合わせてもよい。例えば、第1実施形態の手順で生成された評価用重み値E[1]〜E[n](図4の部分(b))から第2実施形態の類否指標値Rb[1]〜Rb[n](評価用重み値E[1]〜E[n]の各々と確率密度関数Pとの類否を示す数値)を算定し、類否指標値Rb[i]が最大となる評価用重み値E[i]の生成時に削除された各ピークの周波数を基本周波数F0として特定する構成が採用される。また、第2実施形態の手順で生成された評価用重み値E[1]〜E[n](図6の部分(b))から第1実施形態の類否指標値Ra[1]〜Ra[n](優勢度積算値Csum[i]と振幅スペクトルSとの類否を示す数値)を算定し、類否指標値Ra[i]が閾値THを下回る各評価用重み値E[i]の生成時に維持された各ピークの周波数を基本周波数F0として特定する構成も採用される。
(3)変形例3
以上の各形態においては確率密度関数Pに現れるひとつまたは複数のピークを削除する構成を例示したが、評価用重み値E[i]の生成時に確率密度関数Pのピーク値をゼロに変更する必要は必ずしもない。すなわち、確率密度関数Pにおけるひとつまたは複数のピークの抑制(削除を含む)によって評価用重み値E[i]が生成される構成であれば足りる。
(4)変形例4
第1実施形態においては、類否指標値Ra[i]が最小(優勢度積算値Csum[i]と振幅スペクトルSとが類似)となる評価用重み値E[i]の生成時に維持されたピークが真ピークとして特定される構成を例示した。評価用重み値E[i]の生成時に真ピークが維持されると優勢度積算値Csum[i]と振幅スペクトルSとが類似するということは、評価用重み値E[i]の生成時に真ピークが抑制された場合(偽ピークが維持された場合)に優勢度積算値Csum[i]と振幅スペクトルSとが非類似になることを意味している。したがって、類否指標値Ra[i]が最大(優勢度積算値Csum[i]と振幅スペクトルSとが非類似)となる評価用重み値E[i]の生成時に抑制されたひとつまたは複数のピークが真ピークとして特定される構成を採用しても、第1実施形態と同様の作用および効果が奏される。
第2実施形態についても同様である。すなわち、第2実施形態においては、類否指標値Rb[i]が非類似を示す評価用重み値E[i]の生成時に抑制されたピークが真ピークとして特定される構成を例示したが、図5のステップS15において確率密度関数Pの第i番目のピーク以外のピークを抑制することで評価用重み値E[i]を生成し、類否指標値Rb[i]が閾値THを下回る(評価用重み値E[i]と確率密度関数Pとが類似)評価用重み値E[i]の生成時に維持されたピークが真ピークとして特定される構成を採用してもよい。
(5)変形例5
また、KL情報量は類否指標値Ra[i]やRb[i]の例示に過ぎない。例えば、第1実施形態においては優勢度積算値Csum[i]と優勢度分布C[F]とのRMS(Root Mean Square)誤差(平均自乗誤差)を類否指標値Ra[i]として算定してもよい。同様に、第2実施形態においてはM2回の単位処理を経た評価用重み値E[i]と確率密度関数PとのRMS誤差を類否指標値Rb[i]として算定してもよい。また、以上においては優勢度積算値Csum[i]と優勢度分布C[F]との類似度が高いほど類否指標値Ra[i]がゼロに近づく場合を例示したが、両者の類似度が低いほどゼロに近づくような数値を類否指標値Ra[i]として算定してもよい。類否指標値Rb[i]についても同様である。
(6)変形例6
第2実施形態においては閾値THを上回る類否指標値Rb[i]に対応したピークの基本周波数が対象音の基本周波数F0として特定される構成を例示したが、類否指標値Rb[i]から基本周波数F0を特定する方法は適宜に変更される。例えば、数値が大きい順番に所定数の類否指標値Rb[i]を特定し、ここで特定した各類否指標値Rb[i]に対応したピークの基本周波数を対象音の基本周波数F0として特定してもよい。
第1実施形態に係る音高推定装置の機能的な構成を示すブロック図である。 単位処理の内容を説明するための概念図である。 関数推定部および音高特定部による処理の内容を示すフローチャートである。 音響信号の基本周波数を特定する処理の内容を説明するための概念図である。 第2実施形態に係る音高特定部による処理の内容を示すフローチャートである。 音響信号の基本周波数を特定する処理の内容を説明するための概念図である。 音高特定部による処理の内容を説明するための概念図である。
符号の説明
D……音高推定装置、12……周波数分析部、14……BPF、20……関数推定部、22……ピーク選択部、24……関数加工部、30……記憶部、40……音高特定部、42……類否解析部、44……ピーク特定部、V……音響信号、S……振幅スペクトル、P……基本周波数の確率密度関数、M[F]……音モデル、C[F]……優勢度分布、ω[F]……重み値、Csum[i]……優勢度積算値、TH……閾値、F0……対象音を構成する音の基本周波数、E[i](E[1]〜E[n])……評価用重み値、Ra[i](Ra[1]〜Ra[n])……優勢度積算値Csum[i]と振幅スペクトルSとの類否を示す類否指標値、Rb[i](Rb[1]〜Rb[n])……評価用重み値E[i]と確率密度関数Pとの類否を示す類否指標値。

Claims (7)

  1. 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する関数推定手段と
    前記確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、前記複数のピークのうち前記第1ピーク以外の第2ピークを抑制し評価用重み値生成する関数加工手段と、
    前記関数加工手段が生成した前記各評価用重み値を更新対象の重み値として前記単位処理を反復した結果に基づいて、前記関数推定手段が推定した前記確率密度関数に現れる複数のピークのうち前記入力音響信号の基本周波数に対応したピークを特定する音高特定手段と
    を具備する音高推定装置。
  2. 前記関数推定手段が実行する単位処理は、各基本周波数の音モデルが前記入力音響信号の高調波構造を支持する程度を示す優勢度分布に基づいて当該基本周波数の新たな重み値を算定する処理を含み、
    前記音高特定手段は、
    前記各評価用重み値に単位処理を実行したときの優勢度分布を各基本周波数について加算した優勢度積算値と前記入力音響信号の振幅スペクトルとの類否を示す類否指標値を各評価用重み値について算定する類否解析手段と、
    前記類否解析手段の算定した各類否指標値が類似を示す評価用重み値の生成時に維持されたひとつまたは複数のピーク、または、前記類否解析手段の算定した各類否指標値が非類似を示す評価用重み値の生成時に抑制されたひとつまたは複数のピークを、前記入力音響信号の基本周波数に対応したピークとして特定するピーク特定手段と
    を含む請求項1に記載の音高推定装置。
  3. 前記音高特定手段は、
    前記関数推定手段による所定の回数の単位処理を経た各評価用重み値と前記記憶手段が記憶する前記確率密度関数との類否を示す類否指標値を各評価用重み値について算定する類否解析手段と、
    前記類否解析手段の算定した各類否指標値が非類似を示す評価用重み値の生成時に抑制されたひとつまたは複数のピーク、または、前記類否解析手段の算定した各類否指標値が類似を示す評価用重み値の生成時に維持されたひとつまたは複数のピークを、前記入力音響信号の基本周波数に対応したピークとして特定するピーク特定手段と
    を含む請求項1に記載の音高推定装置。
  4. 前記ピーク特定手段は、前記類否解析手段が算定した複数の類否指標値のうち非類似を示す最大値と所定の係数との乗算によって閾値を算定し、類否指標値が前記閾値を上回る1以上の評価用重み値の生成時に抑制されたひとつまたは複数のピークを特定する
    請求項3に記載の音高推定装置。
  5. 前記関数加工手段は、前記確率密度関数における前記第2ピークの数値をゼロに変更することで評価用重み値を生成する
    請求項1から請求項4の何れかに記載の音高推定装置。
  6. 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する一方、
    前記確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、前記複数のピークのうち前記第1ピーク以外の第2ピークを抑制し評価用重み値生成し、
    前記各評価用重み値を更新対象の重み値として前記単位処理を反復した結果に基づいて、前記推定した前記確率密度関数に現れる複数のピークのうち前記入力音響信号の基本周波数に対応したピークを特定する
    音高推定方法。
  7. 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する最尤推定処理と
    前記確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、前記複数のピークのうち前記第1ピーク以外の第2ピークを抑制し評価用重み値生成する関数加工処理と、
    前記関数加工処理で生成した前記各評価用重み値を更新対象の重み値として前記単位処理を反復した結果に基づいて、前記最尤推定処理で推定した前記確率密度関数に現れる複数のピークのうち前記入力音響信号の基本周波数に対応したピークを特定する音高特定処理と
    をコンピュータに実行させるプログラム。
JP2007045013A 2007-02-26 2007-02-26 音高推定装置、音高推定方法およびプログラム Expired - Fee Related JP4630982B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007045013A JP4630982B2 (ja) 2007-02-26 2007-02-26 音高推定装置、音高推定方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007045013A JP4630982B2 (ja) 2007-02-26 2007-02-26 音高推定装置、音高推定方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008209547A JP2008209547A (ja) 2008-09-11
JP4630982B2 true JP4630982B2 (ja) 2011-02-09

Family

ID=39785924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007045013A Expired - Fee Related JP4630982B2 (ja) 2007-02-26 2007-02-26 音高推定装置、音高推定方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4630982B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737645A (zh) * 2012-06-15 2012-10-17 武汉天喻信息产业股份有限公司 一种语音信号的基音周期估计算法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3413634B2 (ja) * 1999-10-27 2003-06-03 独立行政法人産業技術総合研究所 音高推定方法及び装置
WO2005066927A1 (ja) * 2004-01-09 2005-07-21 Toudai Tlo, Ltd. 多重音信号解析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3413634B2 (ja) * 1999-10-27 2003-06-03 独立行政法人産業技術総合研究所 音高推定方法及び装置
WO2005066927A1 (ja) * 2004-01-09 2005-07-21 Toudai Tlo, Ltd. 多重音信号解析方法

Also Published As

Publication number Publication date
JP2008209547A (ja) 2008-09-11

Similar Documents

Publication Publication Date Title
JP4630980B2 (ja) 音高推定装置、音高推定方法およびプログラム
US11715446B2 (en) Music classification method and beat point detection method, storage device and computer device
JP4660739B2 (ja) 音分析装置およびプログラム
EP2854128A1 (en) Audio analysis apparatus
US8865993B2 (en) Musical composition processing system for processing musical composition for energy level and related methods
CN103999076A (zh) 包括将声音信号变换成频率调频域的处理声音信号的系统和方法
US9646592B2 (en) Audio signal analysis
JP4953068B2 (ja) 和音判別装置、和音判別方法およびプログラム
JP4630982B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP2010020012A (ja) 雑音抑圧装置およびプログラム
JP4630979B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP4630983B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP4630981B2 (ja) 音高推定装置、音高推定方法およびプログラム
CN111785237A (zh) 音频节奏确定方法、装置、存储介质和电子设备
JP4710037B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP4625934B2 (ja) 音分析装置およびプログラム
JP6447357B2 (ja) オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
JP5131172B2 (ja) 周期特定装置およびプログラム
JP7176114B2 (ja) 楽曲解析装置、プログラムおよび楽曲解析方法
Zhou et al. Music onset detection
JP2013250356A (ja) 係数設定装置および雑音抑圧装置
JP4625935B2 (ja) 音分析装置およびプログラム
Reyes et al. New algorithm based on spectral distance maximization to deal with the overlapping partial problem in note–event detection
Tryfou et al. Tempo Estimation Based on Linear Prediction and Perceptual Modelling.
JP2014134687A (ja) 音響解析装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101012

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees