JP4630982B2 - 音高推定装置、音高推定方法およびプログラム - Google Patents
音高推定装置、音高推定方法およびプログラム Download PDFInfo
- Publication number
- JP4630982B2 JP4630982B2 JP2007045013A JP2007045013A JP4630982B2 JP 4630982 B2 JP4630982 B2 JP 4630982B2 JP 2007045013 A JP2007045013 A JP 2007045013A JP 2007045013 A JP2007045013 A JP 2007045013A JP 4630982 B2 JP4630982 B2 JP 4630982B2
- Authority
- JP
- Japan
- Prior art keywords
- peak
- weight value
- peaks
- fundamental frequency
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
Description
図1は、本発明の第1実施形態に係る音高推定装置の機能的な構成を示すブロック図である。音高推定装置Dは、対象音を構成する各音の基本周波数(音高)を推定する装置であり、図1に示すように、周波数分析部12とBPF(Band Pass Filter)14と関数推定部20と記憶部30と音高特定部40とを含む。図1に図示された各部は、例えばCPUなどの演算処理装置がプログラムを実行することで実現されてもよいし、基本周波数の推定に専用されるDSPなどのハードウェアによって実現されてもよい。
図3は、関数推定部20および音高特定部40による処理を示すフローチャートであり、図4は、図3の処理を具体的に説明するための概念図である。図3に示すように、関数推定部20は、重み値ω[F]を更新する単位処理をM1回(M1は1以上の整数)にわたって反復する(ステップS10・ステップS11)。図2を参照して説明したように、各回の単位処理において、関数推定部20は、前回の単位処理で算定した重み値ω[F]を変数とした所定の演算によって、当該重み値ω[F]よりも尤度が高い新たな重み値ω[F]を算定する。
次に、本発明の第2実施形態について説明する。なお、本実施形態のうち第1実施形態と作用や機能が共通する要素については、以上と同じ符号を付して、各々の詳細な説明を適宜に省略する。
以上の各形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を適宜に組み合わせてもよい。
第1実施形態においては、確率密度関数Pに現れる複数のピークのなかから任意の個数のピークを選択する総ての組合せ(仮説)について評価用重み値E[i]が生成される構成を例示したが、総ての組合せについて評価用重み値E[i]を生成する必要は必ずしもない。さらに、図3のステップS13においては確率密度関数Pの総てのピークが選択の対象とされる必要はない。例えば、確率密度関数Pの総てのピークのなかから所定の閾値を上回る複数のピークを予め抽出し、ここで抽出した複数のピークを評価用重み値E[i]の生成時の選択(削除)の対象としてもよい。また、第2実施形態においては、確率密度関数Pに現れる総てのピークについて評価用重み値E[i]が生成される構成を例示したが、確率密度関数Pに現れる総てのピークのなかから選択された複数のピークの各々について評価用重み値E[i]が生成される構成としてもよい。
第1実施形態と第2実施形態とを適宜に組み合わせてもよい。例えば、第1実施形態の手順で生成された評価用重み値E[1]〜E[n](図4の部分(b))から第2実施形態の類否指標値Rb[1]〜Rb[n](評価用重み値E[1]〜E[n]の各々と確率密度関数Pとの類否を示す数値)を算定し、類否指標値Rb[i]が最大となる評価用重み値E[i]の生成時に削除された各ピークの周波数を基本周波数F0として特定する構成が採用される。また、第2実施形態の手順で生成された評価用重み値E[1]〜E[n](図6の部分(b))から第1実施形態の類否指標値Ra[1]〜Ra[n](優勢度積算値Csum[i]と振幅スペクトルSとの類否を示す数値)を算定し、類否指標値Ra[i]が閾値THを下回る各評価用重み値E[i]の生成時に維持された各ピークの周波数を基本周波数F0として特定する構成も採用される。
以上の各形態においては確率密度関数Pに現れるひとつまたは複数のピークを削除する構成を例示したが、評価用重み値E[i]の生成時に確率密度関数Pのピーク値をゼロに変更する必要は必ずしもない。すなわち、確率密度関数Pにおけるひとつまたは複数のピークの抑制(削除を含む)によって評価用重み値E[i]が生成される構成であれば足りる。
第1実施形態においては、類否指標値Ra[i]が最小(優勢度積算値Csum[i]と振幅スペクトルSとが類似)となる評価用重み値E[i]の生成時に維持されたピークが真ピークとして特定される構成を例示した。評価用重み値E[i]の生成時に真ピークが維持されると優勢度積算値Csum[i]と振幅スペクトルSとが類似するということは、評価用重み値E[i]の生成時に真ピークが抑制された場合(偽ピークが維持された場合)に優勢度積算値Csum[i]と振幅スペクトルSとが非類似になることを意味している。したがって、類否指標値Ra[i]が最大(優勢度積算値Csum[i]と振幅スペクトルSとが非類似)となる評価用重み値E[i]の生成時に抑制されたひとつまたは複数のピークが真ピークとして特定される構成を採用しても、第1実施形態と同様の作用および効果が奏される。
また、KL情報量は類否指標値Ra[i]やRb[i]の例示に過ぎない。例えば、第1実施形態においては優勢度積算値Csum[i]と優勢度分布C[F]とのRMS(Root Mean Square)誤差(平均自乗誤差)を類否指標値Ra[i]として算定してもよい。同様に、第2実施形態においてはM2回の単位処理を経た評価用重み値E[i]と確率密度関数PとのRMS誤差を類否指標値Rb[i]として算定してもよい。また、以上においては優勢度積算値Csum[i]と優勢度分布C[F]との類似度が高いほど類否指標値Ra[i]がゼロに近づく場合を例示したが、両者の類似度が低いほどゼロに近づくような数値を類否指標値Ra[i]として算定してもよい。類否指標値Rb[i]についても同様である。
第2実施形態においては閾値THを上回る類否指標値Rb[i]に対応したピークの基本周波数が対象音の基本周波数F0として特定される構成を例示したが、類否指標値Rb[i]から基本周波数F0を特定する方法は適宜に変更される。例えば、数値が大きい順番に所定数の類否指標値Rb[i]を特定し、ここで特定した各類否指標値Rb[i]に対応したピークの基本周波数を対象音の基本周波数F0として特定してもよい。
Claims (7)
- 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する関数推定手段と、
前記確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、前記複数のピークのうち前記第1ピーク以外の第2ピークを抑制した評価用重み値を生成する関数加工手段と、
前記関数加工手段が生成した前記各評価用重み値を更新対象の重み値として前記単位処理を反復した結果に基づいて、前記関数推定手段が推定した前記確率密度関数に現れる複数のピークのうち前記入力音響信号の基本周波数に対応したピークを特定する音高特定手段と
を具備する音高推定装置。 - 前記関数推定手段が実行する単位処理は、各基本周波数の音モデルが前記入力音響信号の高調波構造を支持する程度を示す優勢度分布に基づいて当該基本周波数の新たな重み値を算定する処理を含み、
前記音高特定手段は、
前記各評価用重み値に単位処理を実行したときの優勢度分布を各基本周波数について加算した優勢度積算値と前記入力音響信号の振幅スペクトルとの類否を示す類否指標値を各評価用重み値について算定する類否解析手段と、
前記類否解析手段の算定した各類否指標値が類似を示す評価用重み値の生成時に維持されたひとつまたは複数のピーク、または、前記類否解析手段の算定した各類否指標値が非類似を示す評価用重み値の生成時に抑制されたひとつまたは複数のピークを、前記入力音響信号の基本周波数に対応したピークとして特定するピーク特定手段と
を含む請求項1に記載の音高推定装置。 - 前記音高特定手段は、
前記関数推定手段による所定の回数の単位処理を経た各評価用重み値と前記記憶手段が記憶する前記確率密度関数との類否を示す類否指標値を各評価用重み値について算定する類否解析手段と、
前記類否解析手段の算定した各類否指標値が非類似を示す評価用重み値の生成時に抑制されたひとつまたは複数のピーク、または、前記類否解析手段の算定した各類否指標値が類似を示す評価用重み値の生成時に維持されたひとつまたは複数のピークを、前記入力音響信号の基本周波数に対応したピークとして特定するピーク特定手段と
を含む請求項1に記載の音高推定装置。 - 前記ピーク特定手段は、前記類否解析手段が算定した複数の類否指標値のうち非類似を示す最大値と所定の係数との乗算によって閾値を算定し、類否指標値が前記閾値を上回る1以上の評価用重み値の生成時に抑制されたひとつまたは複数のピークを特定する
請求項3に記載の音高推定装置。 - 前記関数加工手段は、前記確率密度関数における前記第2ピークの数値をゼロに変更することで評価用重み値を生成する
請求項1から請求項4の何れかに記載の音高推定装置。 - 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する一方、
前記確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、前記複数のピークのうち前記第1ピーク以外の第2ピークを抑制した評価用重み値を生成し、
前記各評価用重み値を更新対象の重み値として前記単位処理を反復した結果に基づいて、前記推定した前記確率密度関数に現れる複数のピークのうち前記入力音響信号の基本周波数に対応したピークを特定する
音高推定方法。 - 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号をモデル化したときの各音モデルの重み値を更新する単位処理を反復する最尤推定アルゴリズムによって前記入力音響信号の基本周波数の確率密度関数を推定する最尤推定処理と、
前記確率密度関数に現れる複数のピークから1個以上の第1ピークを選択する複数の組合せの各々について、前記複数のピークのうち前記第1ピーク以外の第2ピークを抑制した評価用重み値を生成する関数加工処理と、
前記関数加工処理で生成した前記各評価用重み値を更新対象の重み値として前記単位処理を反復した結果に基づいて、前記最尤推定処理で推定した前記確率密度関数に現れる複数のピークのうち前記入力音響信号の基本周波数に対応したピークを特定する音高特定処理と
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007045013A JP4630982B2 (ja) | 2007-02-26 | 2007-02-26 | 音高推定装置、音高推定方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007045013A JP4630982B2 (ja) | 2007-02-26 | 2007-02-26 | 音高推定装置、音高推定方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008209547A JP2008209547A (ja) | 2008-09-11 |
JP4630982B2 true JP4630982B2 (ja) | 2011-02-09 |
Family
ID=39785924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007045013A Expired - Fee Related JP4630982B2 (ja) | 2007-02-26 | 2007-02-26 | 音高推定装置、音高推定方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4630982B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737645A (zh) * | 2012-06-15 | 2012-10-17 | 武汉天喻信息产业股份有限公司 | 一种语音信号的基音周期估计算法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3413634B2 (ja) * | 1999-10-27 | 2003-06-03 | 独立行政法人産業技術総合研究所 | 音高推定方法及び装置 |
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
-
2007
- 2007-02-26 JP JP2007045013A patent/JP4630982B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3413634B2 (ja) * | 1999-10-27 | 2003-06-03 | 独立行政法人産業技術総合研究所 | 音高推定方法及び装置 |
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2008209547A (ja) | 2008-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4630980B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
US11715446B2 (en) | Music classification method and beat point detection method, storage device and computer device | |
JP4660739B2 (ja) | 音分析装置およびプログラム | |
EP2854128A1 (en) | Audio analysis apparatus | |
US8865993B2 (en) | Musical composition processing system for processing musical composition for energy level and related methods | |
CN103999076A (zh) | 包括将声音信号变换成频率调频域的处理声音信号的系统和方法 | |
US9646592B2 (en) | Audio signal analysis | |
JP4953068B2 (ja) | 和音判別装置、和音判別方法およびプログラム | |
JP4630982B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP2010020012A (ja) | 雑音抑圧装置およびプログラム | |
JP4630979B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP4630983B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP4630981B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
CN111785237A (zh) | 音频节奏确定方法、装置、存储介质和电子设备 | |
JP4710037B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP4625934B2 (ja) | 音分析装置およびプログラム | |
JP6447357B2 (ja) | オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム | |
JP5131172B2 (ja) | 周期特定装置およびプログラム | |
JP7176114B2 (ja) | 楽曲解析装置、プログラムおよび楽曲解析方法 | |
Zhou et al. | Music onset detection | |
JP2013250356A (ja) | 係数設定装置および雑音抑圧装置 | |
JP4625935B2 (ja) | 音分析装置およびプログラム | |
Reyes et al. | New algorithm based on spectral distance maximization to deal with the overlapping partial problem in note–event detection | |
Tryfou et al. | Tempo Estimation Based on Linear Prediction and Perceptual Modelling. | |
JP2014134687A (ja) | 音響解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20080930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101005 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101012 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131126 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |