JP4630979B2 - 音高推定装置、音高推定方法およびプログラム - Google Patents
音高推定装置、音高推定方法およびプログラム Download PDFInfo
- Publication number
- JP4630979B2 JP4630979B2 JP2006238777A JP2006238777A JP4630979B2 JP 4630979 B2 JP4630979 B2 JP 4630979B2 JP 2006238777 A JP2006238777 A JP 2006238777A JP 2006238777 A JP2006238777 A JP 2006238777A JP 4630979 B2 JP4630979 B2 JP 4630979B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- weight value
- fundamental frequency
- value
- peak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
図1は、本発明のひとつの形態に係る音高推定装置の機能的な構成を示すブロック図である。音高推定装置Dは、対象音を構成する各音の基本周波数(音高)を推定する装置であり、図1に示すように、周波数分析部12とBPF(Band Pass Filter)14と関数推定部20と記憶部30と音高特定部40とを含む。図1に図示された各部は、例えばCPUなどの演算処理装置がプログラムを実行することで実現されてもよいし、基本周波数の推定に専用されるDSPなどのハードウェアによって実現されてもよい。
図2は、関数推定部20および音高特定部40による具体的な処理を示すフローチャートであり、図3は、図2の各処理を説明するための概念図である。重み値ω[F]を更新する単位処理は、図2のステップS10とステップS14とステップS16とで実行される。
ωa[F]=α・ω[F]+β・N[F]
係数αと係数βとは所定の相対比(例えばα:β=5:1)となるように選定される。なお、ステップS12で選択されなかったピークについて正規分布N[F]は加算されない。
以上の各形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を適宜に組み合わせてもよい。
ステップS13の開始前には少なくとも1回の単位処理で重み値ω[F](ステップS13にて修正の対象となる重み値ω[F])が算定されていれば足り(M1=1)、ステップS10が複数回にわたって反復される必要は必ずしもない。また、以上の形態においては、重み値ω[F]の修正を伴なう単位処理(ステップS14)の反復後に重み値ω[F]の修正を経ない単位処理(ステップS16)が反復される構成を例示したが、ステップS16の単位処理は適宜に省略される(M3=0)。さらに、重み値ω[F]の修正を伴なう単位処理(ステップS14)が複数回にわたって反復される必要はなく、ステップS13とステップS14とが1回だけ実行される構成(M2=1)としてもよい。
以上の形態においては基本周波数の確率密度関数Pのうち閾値THを上回る各ピークの基本周波数Fが対象音の基本周波数F0として抽出される構成を例示したが、確率密度関数Pから基本周波数F0を推定する方法は適宜に変更される。例えば、基本周波数の確率密度関数Pのうち重み値ω[F]が高い順番に計数して所定数のピークの基本周波数Fを対象音の基本周波数F0として特定してもよい。このように確率密度関数Pと閾値THとの比較が不要である構成においては、閾値算定部42による閾値THの算定が省略される。また、以上の形態においては複数の基本周波数F0が推定される構成を例示したが、ひとつの基本周波数F0(例えば確率密度関数Pにおいて最大のピークが現れる基本周波数F)を推定する構成としてもよい。
以上の形態においてはひとつのフレームの振幅スペクトルSから推定された確率密度関数Pから対象音の基本周波数F0が逐次に推定される構成を例示したが、複数のフレームにわたる基本周波数の確率密度関数Pの時間的な変動を監視することで基本周波数F0を推定する構成としてもよい。確率密度関数Pの監視にはマルチエージェントモデルが好適に利用される。すなわち、音高特定部40は、複数の自律的なエージェントの各々に確率密度関数Pの別個のピークを割り当てたうえで各ピークの経時的な変動を追跡させ、複数のエージェントのうち信頼度が高いエージェントの各ピークを基本周波数F0として出力する。各エージェントの具体的な挙動については特許文献1に詳述されている。もっとも、以上の形態においては、重み値ω[F]の修正(ステップS12)によって真ピークと偽ピークとの相違が拡大するから、マルチエージェントモデルを敢えて採用しなくても対象音の基本周波数F0を高精度に推定することが可能である。すなわち、以上の形態によれば、マルチエージェントモデルを省略することが可能であり、この場合には処理の負荷が軽減されるという利点がある。
以上の形態においてはステップS13で正規分布N[F]が重み値ω[F]に加算される構成を例示したが、重み値ω[F]の修正の方法は任意である。例えば、重み値ω[F]の各ピークとひとつの数値(所定値)との加算や乗算によって修正値ωa[F]が生成される構成としてもよい。もっとも、重み値ω[F]の修正後の単位処理で真ピークと偽ピークとのピーク値の相違を有効に拡大させるためには、重み値ω[F]のピーク値を増加させることで修正値ωa[F]を生成する処理が好適に採用される。
Claims (8)
- 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する関数推定手段と、
前記単位処理で算定された重み値に現れる複数のピークのピーク値を増加させた修正値を、次回の単位処理で使用される更新前の重み値として生成する重み値修正手段と、
前記関数推定手段が推定した前記基本周波数の確率密度関数のピークに対応した基本周波数を特定する音高特定手段と
を具備する音高推定装置。 - 前記関数推定手段は、前記重み値修正手段による修正値の生成前に、当該重み値修正手段による重み値の修正を経ずに複数回の単位処理を実行する
請求項1に記載の音高推定装置。 - 前記関数推定手段は、前記重み値修正手段が生成した修正値を使用した単位処理の実行後に、当該重み値修正手段による重み値の修正を経ずに複数回の単位処理を実行する
請求項1または請求項2に記載の音高推定装置。 - 前記重み値修正手段が修正値を生成する処理と、当該修正値を更新前の重み値として前記関数推定手段が実行する単位処理とは、複数回にわたって反復される
請求項1から請求項3の何れかに記載の音高推定装置。 - 前記単位処理で算定された重み値の総てのピークのうち所定の範囲内の基本周波数に対応する複数のピークを選択する選択手段を具備し、
前記重み値修正手段は、前記選択手段が選択した複数のピークのみについてピーク値を増加させて修正値を生成し、
前記音高特定手段は、前記選択手段が選択した複数のピークに対応した基本周波数のなかから前記入力音響信号の基本周波数を特定する
請求項1から請求項4の何れかに記載の音高推定装置。 - 前記音高特定手段は、
前記基本周波数の確率密度関数におけるピーク値と所定の係数との乗算によって閾値を算定する閾値算定手段と、
前記基本周波数の確率密度関数の複数のピークのうち前記閾値算定手段が算定した閾値との比較に応じて選択したひとつまたは複数のピークに対応する基本周波数を特定するピーク抽出手段と
を含む請求項1から請求項5の何れかに記載の音高推定装置。 - 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する一方、
前記単位処理で算定された重み値に現れる複数のピークのピーク値を増加させた修正値を、次回の単位処理で使用される更新前の重み値として生成し、
前記推定した前記基本周波数の確率密度関数のピークに対応した基本周波数を特定する
音高推定方法。 - 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する関数推定処理と、
前記単位処理で算定された重み値に現れる複数のピークのピーク値を増加させた修正値を、次回の単位処理で使用される更新前の重み値として生成する重み値修正処理と、
前記関数推定処理で推定した前記基本周波数の確率密度関数のピークに対応した基本周波数を特定する音高特定処理と
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006238777A JP4630979B2 (ja) | 2006-09-04 | 2006-09-04 | 音高推定装置、音高推定方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006238777A JP4630979B2 (ja) | 2006-09-04 | 2006-09-04 | 音高推定装置、音高推定方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008058885A JP2008058885A (ja) | 2008-03-13 |
JP4630979B2 true JP4630979B2 (ja) | 2011-02-09 |
Family
ID=39241638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006238777A Expired - Fee Related JP4630979B2 (ja) | 2006-09-04 | 2006-09-04 | 音高推定装置、音高推定方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4630979B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4630980B2 (ja) * | 2006-09-04 | 2011-02-09 | 独立行政法人産業技術総合研究所 | 音高推定装置、音高推定方法およびプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3413634B2 (ja) * | 1999-10-27 | 2003-06-03 | 独立行政法人産業技術総合研究所 | 音高推定方法及び装置 |
JP2006285052A (ja) * | 2005-04-01 | 2006-10-19 | National Institute Of Advanced Industrial & Technology | 音高推定方法及び装置並びに音高推定用プラグラム |
JP2007041234A (ja) * | 2005-08-02 | 2007-02-15 | Univ Of Tokyo | 音楽音響信号の調推定方法および調推定装置 |
JP2008058886A (ja) * | 2006-09-04 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音高推定装置、音高推定方法およびプログラム |
JP2008058753A (ja) * | 2006-09-01 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音分析装置およびプログラム |
JP2008058755A (ja) * | 2006-09-01 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音分析装置およびプログラム |
-
2006
- 2006-09-04 JP JP2006238777A patent/JP4630979B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3413634B2 (ja) * | 1999-10-27 | 2003-06-03 | 独立行政法人産業技術総合研究所 | 音高推定方法及び装置 |
JP2006285052A (ja) * | 2005-04-01 | 2006-10-19 | National Institute Of Advanced Industrial & Technology | 音高推定方法及び装置並びに音高推定用プラグラム |
JP2007041234A (ja) * | 2005-08-02 | 2007-02-15 | Univ Of Tokyo | 音楽音響信号の調推定方法および調推定装置 |
JP2008058753A (ja) * | 2006-09-01 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音分析装置およびプログラム |
JP2008058755A (ja) * | 2006-09-01 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音分析装置およびプログラム |
JP2008058886A (ja) * | 2006-09-04 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音高推定装置、音高推定方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2008058885A (ja) | 2008-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4630980B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
US11715446B2 (en) | Music classification method and beat point detection method, storage device and computer device | |
JP4660739B2 (ja) | 音分析装置およびプログラム | |
JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
JP5152799B2 (ja) | 雑音抑圧装置およびプログラム | |
JP4953068B2 (ja) | 和音判別装置、和音判別方法およびプログラム | |
JP4630979B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP5728903B2 (ja) | 音響処理装置およびプログラム | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP5152800B2 (ja) | 雑音抑圧評価装置およびプログラム | |
JP4630982B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP4630983B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP2013250356A (ja) | 係数設定装置および雑音抑圧装置 | |
JP2008209546A (ja) | 音高推定装置、音高推定方法およびプログラム | |
JPH10319985A (ja) | ノイズレベル検出方法、システム及び記録媒体 | |
JP2011215357A (ja) | 信号処理装置、信号処理方法及びプログラム | |
JP4710037B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP5513074B2 (ja) | グリッド検出装置及びプログラム | |
JP6716933B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP5131172B2 (ja) | 周期特定装置およびプログラム | |
JP2009150920A (ja) | エコーキャンセル装置、カラオケ装置、エコーキャンセル方法およびプログラム | |
JP4625935B2 (ja) | 音分析装置およびプログラム | |
JP2010039215A (ja) | 信号処理装置、信号処理方法、信号処理プログラムおよび記録媒体 | |
JPH0667654A (ja) | 自動採譜装置 | |
JP2008209549A (ja) | 音モデル生成装置、音モデル生成方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20100816 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101005 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101012 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131126 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |